Training in progress, epoch 10, checkpoint

Files changed (6) hide show

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9f4cc7036bbe3eb19a9cb43cb00f5785a10cdae3ef99febc6f661f8c5593af1b
 size 437958624

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b66535ff6415d2c31921f3fe356b0fac561719725dcb426dd1c3a9773e770c5
 size 437958624

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ee57f4f9262590166ddc036d3825a8fa725dc076f622c715f90c0dd36495f28b
 size 4741923

 version https://git-lfs.github.com/spec/v1
+oid sha256:f45e4c9cef7b3d793962401a30cc5375b49e5f6fa7d66e64cc389d199fe8102b
 size 4741923

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8a5407a226aede66621a46e9e3803054ef849d6962b19577466fcc75f353f7e7
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:7f2e8413b53592d1e0dd4c602cd67bd1e7cb9a9ee96e69486272827e44496b7a
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ca329d0121eb88fe2de990ee1c585235458116e02e705a26797da379cee59d3b
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd34198e30d2e33cdb497643e8b4ce22778c6cc08096a422300c51708bdf5a02
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f40a58d9271666cc41b4d88aaf9d64d6a4437482f5f5cb6e83be5d91903b984c
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:695b5daec62904ea9fe48fd42c554ece0bc33b8a351b379641efd77afed9c35f
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 4203,
-  "best_metric": 0.4572421610355377,
-  "best_model_checkpoint": "./bert-email/checkpoint-4203",
-  "epoch": 9.0,
   "eval_steps": 500,
-  "global_step": 4203,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -136,6 +136,21 @@
       "eval_samples_per_second": 55.845,
       "eval_steps_per_second": 1.752,
       "step": 4203
     }
   ],
   "logging_steps": 500,
@@ -150,12 +165,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 3.554946091180032e+16,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 4670,
+  "best_metric": 0.45520129799842834,
+  "best_model_checkpoint": "./bert-email/checkpoint-4670",
+  "epoch": 10.0,
   "eval_steps": 500,
+  "global_step": 4670,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 55.845,
       "eval_steps_per_second": 1.752,
       "step": 4203
+    },
+    {
+      "epoch": 9.635974304068522,
+      "grad_norm": 1.6265816688537598,
+      "learning_rate": 3.661670235546039e-07,
+      "loss": 0.4844812927246094,
+      "step": 4500
+    },
+    {
+      "epoch": 10.0,
+      "eval_loss": 0.45520129799842834,
+      "eval_runtime": 66.8894,
+      "eval_samples_per_second": 55.764,
+      "eval_steps_per_second": 1.749,
+      "step": 4670
     }
   ],
   "logging_steps": 500,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 3.947507785777152e+16,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null