Training completed

Files changed (3) hide show

all_results.json CHANGED Viewed

@@ -1,11 +1,11 @@
 {
-    "avg_step_time": 7.272610497474671,
     "epoch": 0.02,
     "total_flos": 9621820885958656.0,
-    "total_training_time": 90.58460640907288,
-    "total_training_time_mins": 1.5097434401512146,
-    "train_loss": 3.1137392044067385,
-    "train_runtime": 80.5488,
-    "train_samples_per_second": 9.932,
-    "train_steps_per_second": 0.124
 }

 {
+    "avg_step_time": 6.869749426841736,
     "epoch": 0.02,
     "total_flos": 9621820885958656.0,
+    "total_training_time": 87.23009157180786,
+    "total_training_time_mins": 1.453834859530131,
+    "train_loss": 2.993947219848633,
+    "train_runtime": 75.826,
+    "train_samples_per_second": 10.55,
+    "train_steps_per_second": 0.132
 }

train_results.json CHANGED Viewed

@@ -1,11 +1,11 @@
 {
-    "avg_step_time": 7.272610497474671,
     "epoch": 0.02,
     "total_flos": 9621820885958656.0,
-    "total_training_time": 90.58460640907288,
-    "total_training_time_mins": 1.5097434401512146,
-    "train_loss": 3.1137392044067385,
-    "train_runtime": 80.5488,
-    "train_samples_per_second": 9.932,
-    "train_steps_per_second": 0.124
 }

 {
+    "avg_step_time": 6.869749426841736,
     "epoch": 0.02,
     "total_flos": 9621820885958656.0,
+    "total_training_time": 87.23009157180786,
+    "total_training_time_mins": 1.453834859530131,
+    "train_loss": 2.993947219848633,
+    "train_runtime": 75.826,
+    "train_samples_per_second": 10.55,
+    "train_steps_per_second": 0.132
 }

trainer_state.json CHANGED Viewed

@@ -11,19 +11,19 @@
   "log_history": [
     {
       "epoch": 0.02,
-      "grad_norm": 0.5643383264541626,
       "learning_rate": 0.0001,
-      "loss": 3.1137,
       "step": 10
     },
     {
       "epoch": 0.02,
       "step": 10,
       "total_flos": 9621820885958656.0,
-      "train_loss": 3.1137392044067385,
-      "train_runtime": 80.5488,
-      "train_samples_per_second": 9.932,
-      "train_steps_per_second": 0.124
     }
   ],
   "logging_steps": 10,

   "log_history": [
     {
       "epoch": 0.02,
+      "grad_norm": 0.5400242805480957,
       "learning_rate": 0.0001,
+      "loss": 2.9939,
       "step": 10
     },
     {
       "epoch": 0.02,
       "step": 10,
       "total_flos": 9621820885958656.0,
+      "train_loss": 2.993947219848633,
+      "train_runtime": 75.826,
+      "train_samples_per_second": 10.55,
+      "train_steps_per_second": 0.132
     }
   ],
   "logging_steps": 10,