Checkpoint epoch 8

Browse files

Files changed (4) hide show

checkpoints/epoch-08/checkpoint_info.json +6 -0
checkpoints/epoch-08/config.json +49 -0
checkpoints/epoch-08/model.safetensors +3 -0
checkpoints/epoch-08/training_history.json +90 -0

checkpoints/epoch-08/checkpoint_info.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "epoch": 8,
+  "best_validation_loss_so_far": 40.24222278594971,
+  "resume_from_model_id": "JumpHigh/patchtst-cross-sectional-return-forecast",
+  "resume_from_subfolder": "checkpoints/epoch-08"
+}

checkpoints/epoch-08/config.json ADDED Viewed

	@@ -0,0 +1,49 @@

+{
+  "activation_function": "gelu",
+  "architectures": [
+    "PatchTSTForPrediction"
+  ],
+  "attention_dropout": 0.05,
+  "bias": true,
+  "channel_attention": false,
+  "channel_consistent_masking": false,
+  "context_length": 512,
+  "d_model": 128,
+  "distribution_output": "student_t",
+  "do_mask_input": null,
+  "dtype": "float32",
+  "ff_dropout": 0.05,
+  "ffn_dim": 512,
+  "head_dropout": 0.05,
+  "init_std": 0.02,
+  "loss": "nll",
+  "mask_type": "random",
+  "mask_value": 0,
+  "model_type": "patchtst",
+  "norm_eps": 1e-05,
+  "norm_type": "batchnorm",
+  "num_attention_heads": 4,
+  "num_forecast_mask_patches": [
+    2
+  ],
+  "num_hidden_layers": 4,
+  "num_input_channels": 20,
+  "num_parallel_samples": 100,
+  "num_targets": 1,
+  "output_range": null,
+  "patch_length": 16,
+  "patch_stride": 8,
+  "path_dropout": 0.0,
+  "pooling_type": "mean",
+  "positional_dropout": 0.0,
+  "positional_encoding_type": "sincos",
+  "pre_norm": true,
+  "prediction_length": 64,
+  "random_mask_ratio": 0.5,
+  "scaling": "std",
+  "share_embedding": true,
+  "share_projection": true,
+  "transformers_version": "5.6.2",
+  "unmasked_channel_indices": null,
+  "use_cls_token": false
+}

checkpoints/epoch-08/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:169c4b701813cee72fff226ae58ccf7dd3baf526b9d245d1255c5b77a96b950a
+size 3331624

checkpoints/epoch-08/training_history.json ADDED Viewed

	@@ -0,0 +1,90 @@

+[
+  {
+    "epoch": 1.0,
+    "train_loss": 38.083184242248535,
+    "val_loss": 40.33867359161377,
+    "val_mae": 3.411853313446045,
+    "val_mse": 15.193361282348633,
+    "val_directional_accuracy": 0.5080167271784233,
+    "val_flattened_ic": -0.007615978990012297,
+    "val_cross_sectional_ic": -0.004534054731422012,
+    "val_cross_sectional_rank_ic": -0.003705142654353727
+  },
+  {
+    "epoch": 2.0,
+    "train_loss": 36.96161471472846,
+    "val_loss": 40.26822090148926,
+    "val_mae": 3.3166604042053223,
+    "val_mse": 14.50558853149414,
+    "val_directional_accuracy": 0.5080167271784233,
+    "val_flattened_ic": -0.004560436252413131,
+    "val_cross_sectional_ic": 0.006662598467151822,
+    "val_cross_sectional_rank_ic": 0.00664660874177144
+  },
+  {
+    "epoch": 3.0,
+    "train_loss": 36.62392701043023,
+    "val_loss": 40.24265670776367,
+    "val_mae": 3.3373842239379883,
+    "val_mse": 14.650705337524414,
+    "val_directional_accuracy": 0.5080167271784233,
+    "val_flattened_ic": -0.001804785034913796,
+    "val_cross_sectional_ic": 0.0036212050047214326,
+    "val_cross_sectional_rank_ic": 0.003974374473528218
+  },
+  {
+    "epoch": 4.0,
+    "train_loss": 36.54268667432997,
+    "val_loss": 40.24222278594971,
+    "val_mae": 3.3909754753112793,
+    "val_mse": 15.027800559997559,
+    "val_directional_accuracy": 0.5080167271784233,
+    "val_flattened_ic": 0.002849485427271254,
+    "val_cross_sectional_ic": 0.008907554652154311,
+    "val_cross_sectional_rank_ic": 0.008295830343493587
+  },
+  {
+    "epoch": 5.0,
+    "train_loss": 36.36816957261827,
+    "val_loss": 40.289424896240234,
+    "val_mae": 3.5364367961883545,
+    "val_mse": 16.097305297851562,
+    "val_directional_accuracy": 0.5080167271784233,
+    "val_flattened_ic": 0.010637149928228217,
+    "val_cross_sectional_ic": 0.01254028547568924,
+    "val_cross_sectional_rank_ic": 0.012717803325741737
+  },
+  {
+    "epoch": 6.0,
+    "train_loss": 36.245592541164825,
+    "val_loss": 40.88849925994873,
+    "val_mae": 3.3615570068359375,
+    "val_mse": 14.834178924560547,
+    "val_directional_accuracy": 0.5080167271784233,
+    "val_flattened_ic": 0.003901970950778491,
+    "val_cross_sectional_ic": 0.009459000169539322,
+    "val_cross_sectional_rank_ic": 0.008210668658159921
+  },
+  {
+    "epoch": 7.0,
+    "train_loss": 36.17875459459093,
+    "val_loss": 40.588151931762695,
+    "val_mae": 3.464787006378174,
+    "val_mse": 15.583830833435059,
+    "val_directional_accuracy": 0.5080167271784233,
+    "val_flattened_ic": 0.0003019660426648835,
+    "val_cross_sectional_ic": 0.011623528854580577,
+    "val_cross_sectional_rank_ic": 0.01000813106417496
+  },
+  {
+    "epoch": 8.0,
+    "train_loss": 36.111580000983345,
+    "val_loss": 40.75489616394043,
+    "val_mae": 3.4724013805389404,
+    "val_mse": 15.655922889709473,
+    "val_directional_accuracy": 0.5080167271784233,
+    "val_flattened_ic": -0.0005500266980102771,
+    "val_cross_sectional_ic": 0.010404556197328153,
+    "val_cross_sectional_rank_ic": 0.009252205331794215
+  }
+]