enosislabs
/

matex-privacy-sentinel-v0.1

@@ -6,131 +6,183 @@
   },
   "base_checkpoint": "/root/.opf/privacy_filter",
   "batch_size": 4,
-  "best_epoch": 4,
-  "best_metric": 0.22034703597205768,
   "best_metric_name": "validation_loss",
   "checkpoint_category_version": "v2",
   "device": "cuda",
-  "elapsed_s": 1707.967649188,
   "encoding": "o200k_base",
   "epoch_metrics": [
     {
-      "elapsed_s": 217.39479903,
       "epoch": 1,
-      "optimizer_steps": 3038,
-      "train_batches": 3038,
-      "train_loss": 0.6062319690959177,
-      "train_token_accuracy": 0.8512172545619088,
-      "train_tokens": 1453065,
-      "validation_batches": 169,
-      "validation_loss": 0.2926192293667525,
-      "validation_token_accuracy": 0.9352956475523843,
-      "validation_tokens": 88433
     },
     {
-      "elapsed_s": 213.544190871,
       "epoch": 2,
-      "optimizer_steps": 3038,
-      "train_batches": 3038,
-      "train_loss": 0.2367756585074477,
-      "train_token_accuracy": 0.9442185999938062,
-      "train_tokens": 1453065,
-      "validation_batches": 169,
-      "validation_loss": 0.23744411616401195,
-      "validation_token_accuracy": 0.9441950403130053,
-      "validation_tokens": 88433
     },
     {
-      "elapsed_s": 213.38700962000001,
       "epoch": 3,
-      "optimizer_steps": 3038,
-      "train_batches": 3038,
-      "train_loss": 0.17531355934431897,
-      "train_token_accuracy": 0.9586143771957896,
-      "train_tokens": 1453065,
-      "validation_batches": 169,
-      "validation_loss": 0.2293024442145412,
-      "validation_token_accuracy": 0.9511494577815973,
-      "validation_tokens": 88433
     },
     {
-      "elapsed_s": 213.449483773,
       "epoch": 4,
-      "optimizer_steps": 3038,
-      "train_batches": 3038,
-      "train_loss": 0.13766411499792147,
-      "train_token_accuracy": 0.9675279495411423,
-      "train_tokens": 1453065,
-      "validation_batches": 169,
-      "validation_loss": 0.22034703597205768,
-      "validation_token_accuracy": 0.9541008447072925,
-      "validation_tokens": 88433
     },
     {
-      "elapsed_s": 211.39228578199993,
       "epoch": 5,
-      "optimizer_steps": 3038,
-      "train_batches": 3038,
-      "train_loss": 0.10729076129519516,
-      "train_token_accuracy": 0.9746652765017394,
-      "train_tokens": 1453065,
-      "validation_batches": 169,
-      "validation_loss": 0.23614277132286401,
-      "validation_token_accuracy": 0.9555256521886626,
-      "validation_tokens": 88433
     },
     {
-      "elapsed_s": 211.30701109300003,
       "epoch": 6,
-      "optimizer_steps": 3038,
-      "train_batches": 3038,
-      "train_loss": 0.08785577328875824,
-      "train_token_accuracy": 0.9804427193552938,
-      "train_tokens": 1453065,
-      "validation_batches": 169,
-      "validation_loss": 0.27111270338299504,
-      "validation_token_accuracy": 0.9552881842751009,
-      "validation_tokens": 88433
     },
     {
-      "elapsed_s": 211.223892794,
       "epoch": 7,
-      "optimizer_steps": 3038,
-      "train_batches": 3038,
-      "train_loss": 0.07146611258642582,
-      "train_token_accuracy": 0.9836793261141105,
-      "train_tokens": 1453065,
-      "validation_batches": 169,
-      "validation_loss": 0.27473266072740865,
-      "validation_token_accuracy": 0.9579116393201633,
-      "validation_tokens": 88433
     },
     {
-      "elapsed_s": 209.94307118100005,
       "epoch": 8,
-      "optimizer_steps": 3038,
-      "train_batches": 3038,
-      "train_loss": 0.05768033069594669,
-      "train_token_accuracy": 0.9867569585668914,
-      "train_tokens": 1453065,
-      "validation_batches": 169,
-      "validation_loss": 0.30543249755483665,
-      "validation_token_accuracy": 0.9566903757647032,
-      "validation_tokens": 88433
     }
   ],
-  "epochs": 8,
-  "generated_at_unix": 1777747058.003828,
   "grad_accum_steps": 1,
   "label_space_json_path": "/__modal/volumes/vo-1GyZvIAPD7wnYD3s0C2QXS/dataset/configs/custom_label_space.json",
   "label_space_source": "label-space-json",
   "learning_rate": 1e-05,
   "max_grad_norm": 1.0,
   "num_output_labels": 97,
-  "num_train_examples": 12150,
-  "num_train_windows": 12150,
-  "num_validation_examples": 675,
-  "num_validation_windows": 675,
   "output_checkpoint_dir": "/__modal/volumes/vo-XIgHS4JYPE8ddRlAcjQTwm/matex-privacy-sentinel-v0.1",
   "output_head_reinitialized": true,
   "output_head_rows_copied": 97,

   },
   "base_checkpoint": "/root/.opf/privacy_filter",
   "batch_size": 4,
+  "best_epoch": 3,
+  "best_metric": 0.10880099386333249,
   "best_metric_name": "validation_loss",
   "checkpoint_category_version": "v2",
   "device": "cuda",
+  "elapsed_s": 4243.969272867,
   "encoding": "o200k_base",
   "epoch_metrics": [
     {
+      "elapsed_s": 357.860645665,
       "epoch": 1,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.4229886383246393,
+      "train_token_accuracy": 0.897370439303403,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.1392858392746236,
+      "validation_token_accuracy": 0.9636879159602899,
+      "validation_tokens": 135079
     },
     {
+      "elapsed_s": 353.5939458099999,
       "epoch": 2,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.13250755364892783,
+      "train_token_accuracy": 0.9689693839112425,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.1134884088340716,
+      "validation_token_accuracy": 0.9712168434767803,
+      "validation_tokens": 135079
     },
     {
+      "elapsed_s": 360.95667415800006,
       "epoch": 3,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.09536114751181902,
+      "train_token_accuracy": 0.9772459934997655,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.10880099386333249,
+      "validation_token_accuracy": 0.9737042767565647,
+      "validation_tokens": 135079
     },
     {
+      "elapsed_s": 351.6680030719999,
       "epoch": 4,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.07531491173454984,
+      "train_token_accuracy": 0.9822832372474111,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.11094144339923677,
+      "validation_token_accuracy": 0.9750664426002561,
+      "validation_tokens": 135079
     },
     {
+      "elapsed_s": 352.70093192599984,
       "epoch": 5,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.05978634332790929,
+      "train_token_accuracy": 0.98627082293033,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.10941513350480378,
+      "validation_token_accuracy": 0.9764730268953723,
+      "validation_tokens": 135079
     },
     {
+      "elapsed_s": 352.3479713060001,
       "epoch": 6,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.04700873986023811,
+      "train_token_accuracy": 0.9891004398529204,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.12030725566000045,
+      "validation_token_accuracy": 0.9774576359019537,
+      "validation_tokens": 135079
     },
     {
+      "elapsed_s": 350.5779395559998,
       "epoch": 7,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.037927263294671304,
+      "train_token_accuracy": 0.9911675016943456,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.1220005202920702,
+      "validation_token_accuracy": 0.9779832542438128,
+      "validation_tokens": 135079
     },
     {
+      "elapsed_s": 352.3893561149998,
       "epoch": 8,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.030487817015155995,
+      "train_token_accuracy": 0.9926989830740646,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.124172292954461,
+      "validation_token_accuracy": 0.9795156908179657,
+      "validation_tokens": 135079
+    },
+    {
+      "elapsed_s": 351.60098334099985,
+      "epoch": 9,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.026497954957400774,
+      "train_token_accuracy": 0.9938023982855054,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.12726946480100174,
+      "validation_token_accuracy": 0.9797229769246145,
+      "validation_tokens": 135079
+    },
+    {
+      "elapsed_s": 351.41817523500004,
+      "epoch": 10,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.02143179943208533,
+      "train_token_accuracy": 0.9948285624861127,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.13001580377020153,
+      "validation_token_accuracy": 0.980448478297885,
+      "validation_tokens": 135079
+    },
+    {
+      "elapsed_s": 351.210082735,
+      "epoch": 11,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.018372399961305817,
+      "train_token_accuracy": 0.9957006228661399,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.13454472581949917,
+      "validation_token_accuracy": 0.9798858445798385,
+      "validation_tokens": 135079
+    },
+    {
+      "elapsed_s": 350.00989479400005,
+      "epoch": 12,
+      "optimizer_steps": 4838,
+      "train_batches": 4838,
+      "train_loss": 0.015427773917966436,
+      "train_token_accuracy": 0.9963250021701959,
+      "train_tokens": 2511294,
+      "validation_batches": 269,
+      "validation_loss": 0.1662057355638326,
+      "validation_token_accuracy": 0.9783386018552107,
+      "validation_tokens": 135079
     }
   ],
+  "epochs": 12,
+  "generated_at_unix": 1777765877.1481903,
   "grad_accum_steps": 1,
   "label_space_json_path": "/__modal/volumes/vo-1GyZvIAPD7wnYD3s0C2QXS/dataset/configs/custom_label_space.json",
   "label_space_source": "label-space-json",
   "learning_rate": 1e-05,
   "max_grad_norm": 1.0,
   "num_output_labels": 97,
+  "num_train_examples": 19350,
+  "num_train_windows": 19350,
+  "num_validation_examples": 1075,
+  "num_validation_windows": 1075,
   "output_checkpoint_dir": "/__modal/volumes/vo-XIgHS4JYPE8ddRlAcjQTwm/matex-privacy-sentinel-v0.1",
   "output_head_reinitialized": true,
   "output_head_rows_copied": 97,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8005133a9d82548fced788b3716a41284eedde86fb701a767be52c41e5453013
 size 2799065896

 version https://git-lfs.github.com/spec/v1
+oid sha256:d906893be08e9c6af7a9091787d4f42797aa7b9d9cb1bea67deaf16ca102d927
 size 2799065896