Spaces:

aaloksan
/

kernel

Running

App Files Files Community

aaloksan commited on 8 days ago

Commit

aebc8f0

1 Parent(s): 0bf3992

fix: fix 3 graders

Browse files

Files changed (2) hide show

env_server.py +4 -0
inference.py +22 -22

env_server.py CHANGED Viewed

@@ -7,6 +7,7 @@ TASKS: Dict[str, Dict[str, Any]] ={
     "vector_add_easy": {
         "name": "Vector Addition Kernel Optimization",
         "difficulty": "easy",
         "max_steps": 5,
         "target_speedup": 1.8,
         "baseline_code": """extern "C" __global__ void vector_add(const float* a, const float* b, float* c, int n)
@@ -24,6 +25,7 @@ TASKS: Dict[str, Dict[str, Any]] ={
     "matmul_medium": {
         "name": "Matrix Multiplication Kernel Optimization",
         "difficulty": "medium",
         "max_steps": 6,
         "target_speedup": 3.0,
         "baseline_code": """extern "C" __global__ void matmul(const float* A, const float* B, float* C, int N)
@@ -45,6 +47,7 @@ TASKS: Dict[str, Dict[str, Any]] ={
     "reduction_hard": {
         "name": "Reduction Kernel Optimization",
         "difficulty": "hard",
         "max_steps":7,
         "target_speedup": 3.5,
         "baseline_code": """extern "C" __global__ void reduce_sum(const float* input, float* output, int n)
@@ -118,6 +121,7 @@ class KernelOptimization_env:
                 "task_id": self.current_task_id,
                 "task_name": task["name"],
                 "difficulty": task["difficulty"],
                 "max_steps": task["max_steps"],
                 "target_speedup": task["target_speedup"],
                 "checks": task["checks"],

     "vector_add_easy": {
         "name": "Vector Addition Kernel Optimization",
         "difficulty": "easy",
+        "grader": "deterministic_rule_based",
         "max_steps": 5,
         "target_speedup": 1.8,
         "baseline_code": """extern "C" __global__ void vector_add(const float* a, const float* b, float* c, int n)
     "matmul_medium": {
         "name": "Matrix Multiplication Kernel Optimization",
         "difficulty": "medium",
+        "grader": "deterministic_rule_based",
         "max_steps": 6,
         "target_speedup": 3.0,
         "baseline_code": """extern "C" __global__ void matmul(const float* A, const float* B, float* C, int N)
     "reduction_hard": {
         "name": "Reduction Kernel Optimization",
         "difficulty": "hard",
+        "grader": "deterministic_rule_based",
         "max_steps":7,
         "target_speedup": 3.5,
         "baseline_code": """extern "C" __global__ void reduce_sum(const float* input, float* output, int n)
                 "task_id": self.current_task_id,
                 "task_name": task["name"],
                 "difficulty": task["difficulty"],
+                "grader": task["grader"],
                 "max_steps": task["max_steps"],
                 "target_speedup": task["target_speedup"],
                 "checks": task["checks"],

inference.py CHANGED Viewed

@@ -13,7 +13,7 @@ load_dotenv()
 API_BASE_URL = os.getenv("API_BASE_URL", "https://api.openai.com/v1")
 MODEL_NAME = os.getenv("MODEL_NAME", "gpt-4o-mini")
 API_KEY = os.getenv("OPENAI_API_KEY") or os.getenv("HF_TOKEN") or os.getenv("API_KEY")
-TASK_NAME = os.getenv("TASK_ID", "vector_add_easy")
 BENCHMARK = "kernel_optimization"
@@ -85,8 +85,7 @@ def choose_action(client: Optional[OpenAI], observation: dict) -> Action:
         return fallback_action(observation)
-def main() -> int:
-    task_id = TASK_NAME if TASK_NAME in TASKS else "vector_add_easy"
     env = KernelOptimization_env()
     rewards: List[float] = []
     steps_taken = 0
@@ -94,27 +93,18 @@ def main() -> int:
     success = False
     log_start(task=task_id, env=BENCHMARK, model=MODEL_NAME)
     try:
-        client: Optional[OpenAI] = None
-        if API_KEY:
-            try:
-                client = OpenAI(api_key=API_KEY, base_url=API_BASE_URL)
-            except Exception:
-                client = None
         obs = env.reset(task_id=task_id)["observation"]
         done = False
         while not done:
             action = choose_action(client, obs)
-            action_str = action.optimized_code
             step_result = env.step(action)
             done = step_result.done
             obs = step_result.observation.model_dump()
             reward = step_result.reward.value
             rewards.append(reward)
             steps_taken = obs["step_count"]
-            log_step(step=steps_taken, action=action_str, reward=reward, done=done, error=None)
         score = grade_episode(
             task_id,
@@ -125,19 +115,29 @@ def main() -> int:
         )
         score = min(max(score, 0.0), 1.0)
         success = score >= 0.1
-        return 0
     except Exception as exc:
-        log_step(
-            step=max(1, steps_taken + 1),
-            action="error",
-            reward=0.0,
-            done=True,
-            error=str(exc),
-        )
-        return 0
     finally:
         log_end(success=success, steps=steps_taken, score=score, rewards=rewards)
 if __name__ == "__main__":
     sys.exit(main())

 API_BASE_URL = os.getenv("API_BASE_URL", "https://api.openai.com/v1")
 MODEL_NAME = os.getenv("MODEL_NAME", "gpt-4o-mini")
 API_KEY = os.getenv("OPENAI_API_KEY") or os.getenv("HF_TOKEN") or os.getenv("API_KEY")
+TASK_NAME = os.getenv("TASK_ID")
 BENCHMARK = "kernel_optimization"
         return fallback_action(observation)
+def run_episode(client: Optional[OpenAI], task_id: str) -> None:
     env = KernelOptimization_env()
     rewards: List[float] = []
     steps_taken = 0
     success = False
     log_start(task=task_id, env=BENCHMARK, model=MODEL_NAME)
     try:
         obs = env.reset(task_id=task_id)["observation"]
         done = False
         while not done:
             action = choose_action(client, obs)
             step_result = env.step(action)
             done = step_result.done
             obs = step_result.observation.model_dump()
             reward = step_result.reward.value
             rewards.append(reward)
             steps_taken = obs["step_count"]
+            log_step(step=steps_taken, action=action.optimized_code, reward=reward, done=done, error=None)
         score = grade_episode(
             task_id,
         )
         score = min(max(score, 0.0), 1.0)
         success = score >= 0.1
     except Exception as exc:
+        log_step(step=max(1, steps_taken + 1), action="error", reward=0.0, done=True, error=str(exc))
     finally:
         log_end(success=success, steps=steps_taken, score=score, rewards=rewards)
+def main() -> int:
+    client: Optional[OpenAI] = None
+    if API_KEY:
+        try:
+            client = OpenAI(api_key=API_KEY, base_url=API_BASE_URL)
+        except Exception:
+            client = None
+    if TASK_NAME and TASK_NAME in TASKS:
+        task_ids = [TASK_NAME]
+    else:
+        task_ids = list(TASKS.keys())
+    for task_id in task_ids:
+        run_episode(client, task_id)
+    return 0
 if __name__ == "__main__":
     sys.exit(main())