Spaces:

srishtichugh
/

OpenEnv_hack

Sleeping

srishtichugh commited on about 1 month ago

Commit

53ae9f0

1 Parent(s): fa53e30

Fix scoring

Files changed (3) hide show

inference.py CHANGED Viewed

@@ -112,6 +112,23 @@ def api_get(path: str) -> dict:
     resp.raise_for_status()
     return resp.json()
 # ------------------------------------------------------------------
 # Agent loop
@@ -228,7 +245,7 @@ def run_task(task_id: int) -> float:
     finally:
         log_end(success=success, steps=steps_taken, rewards=rewards)
-    final_score = obs["current_score"]
     print(
         f"\n  Task {task_id} final score: {final_score:.4f}  (steps used: {obs['step_count']})",
         file=sys.stderr,
@@ -268,7 +285,7 @@ def main():
     print("="*60, file=sys.stderr)
     for k, v in scores.items():
         print(f"  {k}: {v:.4f}", file=sys.stderr)
-    avg = sum(scores.values()) / len(scores)
     print(f"  average: {avg:.4f}", file=sys.stderr)
     print("="*60, file=sys.stderr)

     resp.raise_for_status()
     return resp.json()
+# ------------------------------------------------------------------
+# Score sanitizer
+# ------------------------------------------------------------------
+def sanitize_score(score: float) -> float:
+    """
+    Ensures score is strictly within (0, 1)
+    required by hackathon validator.
+    """
+    EPS = 1e-4
+    if score >= 1.0:
+        return 1.0 - EPS
+    if score <= 0.0:
+        return EPS
+    return float(score)
 # ------------------------------------------------------------------
 # Agent loop
     finally:
         log_end(success=success, steps=steps_taken, rewards=rewards)
+    final_score = sanitize_score(obs["current_score"])
     print(
         f"\n  Task {task_id} final score: {final_score:.4f}  (steps used: {obs['step_count']})",
         file=sys.stderr,
     print("="*60, file=sys.stderr)
     for k, v in scores.items():
         print(f"  {k}: {v:.4f}", file=sys.stderr)
+    avg = sanitize_score(sum(scores.values()) / len(scores))
     print(f"  average: {avg:.4f}", file=sys.stderr)
     print("="*60, file=sys.stderr)

inference_log.txt CHANGED Viewed

Binary files a/inference_log.txt and b/inference_log.txt differ

server/environment.py CHANGED Viewed

@@ -111,11 +111,24 @@ class DataCleaningEnvironment:
     def _compute_score(self) -> float:
         if self._task_id == 1:
-            return t1.score(self._df, self._meta)
         elif self._task_id == 2:
-            return t2.score(self._df, self._meta)
         else:
-            return t3.score(self._df, self._meta)
     def _count_errors(self) -> int:
         if self._task_id == 1:

     def _compute_score(self) -> float:
         if self._task_id == 1:
+            raw = t1.score(self._df, self._meta)
         elif self._task_id == 2:
+            raw = t2.score(self._df, self._meta)
         else:
+            raw = t3.score(self._df, self._meta)
+        EPS = 1e-4
+        # First round safely
+        raw = float(raw)
+        # HARD clamp AFTER rounding risk
+        if raw >= 1.0:
+            raw = 1.0 - EPS
+        elif raw <= 0.0:
+            raw = EPS
+        return round(raw, 4)
     def _count_errors(self) -> int:
         if self._task_id == 1: