Training in progress, step 56800

Files changed (11) hide show

{checkpoint-42600 → checkpoint-56800}/config.json RENAMED Viewed

File without changes

{checkpoint-42600 → checkpoint-56800}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0b4c4b333b97f0149964651f74eaa66101d66e936fbc61ebe79da9a0ee2c197c
 size 721687098

 version https://git-lfs.github.com/spec/v1
+oid sha256:6d239faa9fff93ab890500865996a20c6609e11c84a8722536e9cf5caa02a5e4
 size 721687098

{checkpoint-42600 → checkpoint-56800}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-42600 → checkpoint-56800}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d71780a36fc085126b5a0a4ef930e98f7ece9349bee575d90e4a0f81c475c48
 size 377673950

 version https://git-lfs.github.com/spec/v1
+oid sha256:1667da094d4e850422b2a4351a457c341ba3faa9fe24afab30d76557b9cc7783
 size 377673950

{checkpoint-42600 → checkpoint-56800}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7b5ec54c45daae3ad43ee6e040a40ed36b5d581e594bbd01e674c86829218d1f
 size 14308

 version https://git-lfs.github.com/spec/v1
+oid sha256:69520be733ce3c62aac8e519ecfec10db86b8d268a18251b920f5538a794fe5a
 size 14308

{checkpoint-42600 → checkpoint-56800}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6d73036264655c5c1491cf5fff954a0cc29c3156f389e14cb5234dfaa4706556
 size 988

 version https://git-lfs.github.com/spec/v1
+oid sha256:c314e454d6b8968b90afae3bbc3ca5e73780f0af94b546a8ad2128097d22104a
 size 988

{checkpoint-42600 → checkpoint-56800}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a37fc39caa933e6c8f072c0eacc110c699acb993c4c2163f268da0d9550b53f2
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:7338ad7686598f45591f3dbb5e645c8a345976f35f07fe14f5f9eeea5f0afcbe
 size 1064

{checkpoint-42600 → checkpoint-56800}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.711880624294281,
   "best_model_checkpoint": "JuanPajero/FT-S5-LM/checkpoint-28400",
-  "epoch": 5.924895688456189,
-  "global_step": 42600,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -96,11 +96,41 @@
       "eval_steps_per_second": 2.033,
       "eval_wer": 0.2705310068428191,
       "step": 42600
     }
   ],
   "max_steps": 71900,
   "num_train_epochs": 10,
-  "total_flos": 5.089903415040246e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.711880624294281,
   "best_model_checkpoint": "JuanPajero/FT-S5-LM/checkpoint-28400",
+  "epoch": 7.899860917941585,
+  "global_step": 56800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 2.033,
       "eval_wer": 0.2705310068428191,
       "step": 42600
+    },
+    {
+      "epoch": 6.91,
+      "learning_rate": 1.0300880853036624e-05,
+      "loss": 0.2431,
+      "step": 49700
+    },
+    {
+      "epoch": 6.91,
+      "eval_loss": 0.7319042682647705,
+      "eval_runtime": 1221.2572,
+      "eval_samples_per_second": 16.318,
+      "eval_steps_per_second": 2.04,
+      "eval_wer": 0.2662402227230545,
+      "step": 49700
+    },
+    {
+      "epoch": 7.9,
+      "learning_rate": 7.010662957811776e-06,
+      "loss": 0.2315,
+      "step": 56800
+    },
+    {
+      "epoch": 7.9,
+      "eval_loss": 0.7422261238098145,
+      "eval_runtime": 1219.7016,
+      "eval_samples_per_second": 16.338,
+      "eval_steps_per_second": 2.042,
+      "eval_wer": 0.26504196453155754,
+      "step": 56800
     }
   ],
   "max_steps": 71900,
   "num_train_epochs": 10,
+  "total_flos": 6.787551470604595e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-42600 → checkpoint-56800}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d0fc6928b5f7ff134b2c47371118d074f6e349c846d7c22f55e1b4c4cf78877
 size 377673950

 version https://git-lfs.github.com/spec/v1
+oid sha256:1667da094d4e850422b2a4351a457c341ba3faa9fe24afab30d76557b9cc7783
 size 377673950

runs/Apr02_11-39-56_364af271dda7/events.out.tfevents.1775136463.364af271dda7.26706.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0282e3620461e8c35b0aac11b2ea4a7826a0a526d615d45e2ab11f2f13d88a29
-size 6038

 version https://git-lfs.github.com/spec/v1
+oid sha256:006688382b8c231881b0a48e551a98d4e1a1f07d7e8f09774bf5c0c73b4c6cf9
+size 6522