enosislabs
/

matex-privacy-sentinel-v0.1

@@ -6,131 +6,131 @@
   },
   "base_checkpoint": "/root/.opf/privacy_filter",
   "batch_size": 4,
-  "best_epoch": 3,
-  "best_metric": 0.341848680201349,
   "best_metric_name": "validation_loss",
   "checkpoint_category_version": "v2",
   "device": "cuda",
-  "elapsed_s": 1202.3356187059999,
   "encoding": "o200k_base",
   "epoch_metrics": [
     {
-      "elapsed_s": 156.62828432,
       "epoch": 1,
-      "optimizer_steps": 2250,
-      "train_batches": 2250,
-      "train_loss": 0.7579528993816216,
-      "train_token_accuracy": 0.8079268596096835,
-      "train_tokens": 904343,
-      "validation_batches": 125,
-      "validation_loss": 0.5067812929464072,
-      "validation_token_accuracy": 0.867818841446398,
-      "validation_tokens": 50166
     },
     {
-      "elapsed_s": 152.96221749900002,
       "epoch": 2,
-      "optimizer_steps": 2250,
-      "train_batches": 2250,
-      "train_loss": 0.38092665674540604,
-      "train_token_accuracy": 0.9006980758406932,
-      "train_tokens": 904343,
-      "validation_batches": 125,
-      "validation_loss": 0.38360365174622296,
-      "validation_token_accuracy": 0.9019056731650918,
-      "validation_tokens": 50166
     },
     {
-      "elapsed_s": 151.324623019,
       "epoch": 3,
-      "optimizer_steps": 2250,
-      "train_batches": 2250,
-      "train_loss": 0.2702202035309268,
-      "train_token_accuracy": 0.9303217916210995,
-      "train_tokens": 904343,
-      "validation_batches": 125,
-      "validation_loss": 0.341848680201349,
-      "validation_token_accuracy": 0.9153610014751027,
-      "validation_tokens": 50166
     },
     {
-      "elapsed_s": 146.090914769,
       "epoch": 4,
-      "optimizer_steps": 2250,
-      "train_batches": 2250,
-      "train_loss": 0.20918852428017598,
-      "train_token_accuracy": 0.9461697608097812,
-      "train_tokens": 904343,
-      "validation_batches": 125,
-      "validation_loss": 0.34960059886833394,
-      "validation_token_accuracy": 0.9198660447314915,
-      "validation_tokens": 50166
     },
     {
-      "elapsed_s": 147.21897273000002,
       "epoch": 5,
-      "optimizer_steps": 2250,
-      "train_batches": 2250,
-      "train_loss": 0.17146903831328053,
-      "train_token_accuracy": 0.9572429929794337,
-      "train_tokens": 904343,
-      "validation_batches": 125,
-      "validation_loss": 0.3568825089484372,
-      "validation_token_accuracy": 0.9235737351991389,
-      "validation_tokens": 50166
     },
     {
-      "elapsed_s": 147.21631511600003,
       "epoch": 6,
-      "optimizer_steps": 2250,
-      "train_batches": 2250,
-      "train_loss": 0.1385621205590411,
-      "train_token_accuracy": 0.96554294111858,
-      "train_tokens": 904343,
-      "validation_batches": 125,
-      "validation_loss": 0.3496786308457096,
-      "validation_token_accuracy": 0.9281385799146833,
-      "validation_tokens": 50166
     },
     {
-      "elapsed_s": 147.04402772600008,
       "epoch": 7,
-      "optimizer_steps": 2250,
-      "train_batches": 2250,
-      "train_loss": 0.1159271389398995,
-      "train_token_accuracy": 0.9721267262532026,
-      "train_tokens": 904343,
-      "validation_batches": 125,
-      "validation_loss": 0.39336468872144575,
-      "validation_token_accuracy": 0.9263844037794522,
-      "validation_tokens": 50166
     },
     {
-      "elapsed_s": 147.08385474300007,
       "epoch": 8,
-      "optimizer_steps": 2250,
-      "train_batches": 2250,
-      "train_loss": 0.094867783832476,
-      "train_token_accuracy": 0.9776732943142149,
-      "train_tokens": 904343,
-      "validation_batches": 125,
-      "validation_loss": 0.41877376376543324,
-      "validation_token_accuracy": 0.9266236096160746,
-      "validation_tokens": 50166
     }
   ],
   "epochs": 8,
-  "generated_at_unix": 1777714940.5670223,
   "grad_accum_steps": 1,
   "label_space_json_path": "/__modal/volumes/vo-1GyZvIAPD7wnYD3s0C2QXS/dataset/configs/custom_label_space.json",
   "label_space_source": "label-space-json",
   "learning_rate": 1e-05,
   "max_grad_norm": 1.0,
   "num_output_labels": 97,
-  "num_train_examples": 9000,
-  "num_train_windows": 9000,
-  "num_validation_examples": 500,
-  "num_validation_windows": 500,
   "output_checkpoint_dir": "/__modal/volumes/vo-XIgHS4JYPE8ddRlAcjQTwm/matex-privacy-sentinel-v0.1",
   "output_head_reinitialized": true,
   "output_head_rows_copied": 97,

   },
   "base_checkpoint": "/root/.opf/privacy_filter",
   "batch_size": 4,
+  "best_epoch": 4,
+  "best_metric": 0.22034703597205768,
   "best_metric_name": "validation_loss",
   "checkpoint_category_version": "v2",
   "device": "cuda",
+  "elapsed_s": 1707.967649188,
   "encoding": "o200k_base",
   "epoch_metrics": [
     {
+      "elapsed_s": 217.39479903,
       "epoch": 1,
+      "optimizer_steps": 3038,
+      "train_batches": 3038,
+      "train_loss": 0.6062319690959177,
+      "train_token_accuracy": 0.8512172545619088,
+      "train_tokens": 1453065,
+      "validation_batches": 169,
+      "validation_loss": 0.2926192293667525,
+      "validation_token_accuracy": 0.9352956475523843,
+      "validation_tokens": 88433
     },
     {
+      "elapsed_s": 213.544190871,
       "epoch": 2,
+      "optimizer_steps": 3038,
+      "train_batches": 3038,
+      "train_loss": 0.2367756585074477,
+      "train_token_accuracy": 0.9442185999938062,
+      "train_tokens": 1453065,
+      "validation_batches": 169,
+      "validation_loss": 0.23744411616401195,
+      "validation_token_accuracy": 0.9441950403130053,
+      "validation_tokens": 88433
     },
     {
+      "elapsed_s": 213.38700962000001,
       "epoch": 3,
+      "optimizer_steps": 3038,
+      "train_batches": 3038,
+      "train_loss": 0.17531355934431897,
+      "train_token_accuracy": 0.9586143771957896,
+      "train_tokens": 1453065,
+      "validation_batches": 169,
+      "validation_loss": 0.2293024442145412,
+      "validation_token_accuracy": 0.9511494577815973,
+      "validation_tokens": 88433
     },
     {
+      "elapsed_s": 213.449483773,
       "epoch": 4,
+      "optimizer_steps": 3038,
+      "train_batches": 3038,
+      "train_loss": 0.13766411499792147,
+      "train_token_accuracy": 0.9675279495411423,
+      "train_tokens": 1453065,
+      "validation_batches": 169,
+      "validation_loss": 0.22034703597205768,
+      "validation_token_accuracy": 0.9541008447072925,
+      "validation_tokens": 88433
     },
     {
+      "elapsed_s": 211.39228578199993,
       "epoch": 5,
+      "optimizer_steps": 3038,
+      "train_batches": 3038,
+      "train_loss": 0.10729076129519516,
+      "train_token_accuracy": 0.9746652765017394,
+      "train_tokens": 1453065,
+      "validation_batches": 169,
+      "validation_loss": 0.23614277132286401,
+      "validation_token_accuracy": 0.9555256521886626,
+      "validation_tokens": 88433
     },
     {
+      "elapsed_s": 211.30701109300003,
       "epoch": 6,
+      "optimizer_steps": 3038,
+      "train_batches": 3038,
+      "train_loss": 0.08785577328875824,
+      "train_token_accuracy": 0.9804427193552938,
+      "train_tokens": 1453065,
+      "validation_batches": 169,
+      "validation_loss": 0.27111270338299504,
+      "validation_token_accuracy": 0.9552881842751009,
+      "validation_tokens": 88433
     },
     {
+      "elapsed_s": 211.223892794,
       "epoch": 7,
+      "optimizer_steps": 3038,
+      "train_batches": 3038,
+      "train_loss": 0.07146611258642582,
+      "train_token_accuracy": 0.9836793261141105,
+      "train_tokens": 1453065,
+      "validation_batches": 169,
+      "validation_loss": 0.27473266072740865,
+      "validation_token_accuracy": 0.9579116393201633,
+      "validation_tokens": 88433
     },
     {
+      "elapsed_s": 209.94307118100005,
       "epoch": 8,
+      "optimizer_steps": 3038,
+      "train_batches": 3038,
+      "train_loss": 0.05768033069594669,
+      "train_token_accuracy": 0.9867569585668914,
+      "train_tokens": 1453065,
+      "validation_batches": 169,
+      "validation_loss": 0.30543249755483665,
+      "validation_token_accuracy": 0.9566903757647032,
+      "validation_tokens": 88433
     }
   ],
   "epochs": 8,
+  "generated_at_unix": 1777747058.003828,
   "grad_accum_steps": 1,
   "label_space_json_path": "/__modal/volumes/vo-1GyZvIAPD7wnYD3s0C2QXS/dataset/configs/custom_label_space.json",
   "label_space_source": "label-space-json",
   "learning_rate": 1e-05,
   "max_grad_norm": 1.0,
   "num_output_labels": 97,
+  "num_train_examples": 12150,
+  "num_train_windows": 12150,
+  "num_validation_examples": 675,
+  "num_validation_windows": 675,
   "output_checkpoint_dir": "/__modal/volumes/vo-XIgHS4JYPE8ddRlAcjQTwm/matex-privacy-sentinel-v0.1",
   "output_head_reinitialized": true,
   "output_head_rows_copied": 97,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fa888ac79911de3b1b25a09a157d5f9b642a1b7cbb730c1e45dca413f302361c
 size 2799065896

 version https://git-lfs.github.com/spec/v1
+oid sha256:8005133a9d82548fced788b3716a41284eedde86fb701a767be52c41e5453013
 size 2799065896