Spaces:

srishtichugh
/

OpenEnv_hack

Sleeping

srishtichugh commited on about 1 month ago

Commit

b37dbfa

1 Parent(s): 3aab9e5

update baseline scores and readme

Files changed (3) hide show

README.md CHANGED Viewed

@@ -197,10 +197,10 @@ Rewards are bounded to **[−0.05, 1.2]**. A partial reward is emitted on every
 | Task | Difficulty | Score |
 |---|---|---|
-| 1 — Fill Missing Values | Easy | 1.000 |
-| 2 — Fix Formats + Duplicates | Medium | 1.000 |
-| 3 — Full Cleaning Pipeline | Hard | 1.000 |
-| **Average** | — | **1.000** |
 *Produced by `google/gemma-3-27b-it` via NVIDIA NIM, `temperature=0`. Full step-by-step agent logs: `inference_log.txt`.*

 | Task | Difficulty | Score |
 |---|---|---|
+| 1 — Fill Missing Values | Easy | 0.999 |
+| 2 — Fix Formats + Duplicates | Medium | 0.999 |
+| 3 — Full Cleaning Pipeline | Hard | 0.999 |
+| **Average** | — | **0.999** |
 *Produced by `google/gemma-3-27b-it` via NVIDIA NIM, `temperature=0`. Full step-by-step agent logs: `inference_log.txt`.*

baseline_scores.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "scores": {
-    "task1": 1.0,
-    "task2": 1.0,
-    "task3": 1.0
   },
-  "average": 1.0
 }

 {
   "scores": {
+    "task1": 0.999,
+    "task2": 0.999,
+    "task3": 0.999
   },
+  "average": 0.999
 }

inference_log.txt CHANGED Viewed

Binary files a/inference_log.txt and b/inference_log.txt differ