Spaces:

modelbuilderhq
/

HyperBrickCaseOps

Sleeping

App Files Files Community

modelbuilderhq commited on about 1 month ago

Commit

1305932

verified ·

1 Parent(s): 55db2c6

Upload folder using huggingface_hub

Browse files

Files changed (2) hide show

supportdesk_env/server/app.py +65 -0
tests/test_supportdesk.py +9 -0

supportdesk_env/server/app.py CHANGED Viewed

@@ -36,6 +36,7 @@ from typing import Any
 import uvicorn
 from fastapi import Body, HTTPException
 try:
     from openenv.core.env_server import http_server as openenv_http_server
@@ -70,6 +71,69 @@ app = create_app(
 )
 @app.get("/tasks")
 def list_tasks() -> dict[str, Any]:
     """Expose a stable task catalog for UI, debugging, and pre-submit checks."""
@@ -137,6 +201,7 @@ def step_episode(
         "observation": observation.model_dump(),
         "reward": observation.reward,
         "done": observation.done,
     }

 import uvicorn
 from fastapi import Body, HTTPException
+from fastapi.routing import APIRoute
 try:
     from openenv.core.env_server import http_server as openenv_http_server
 )
+def _replace_route(path: str, methods: set[str]) -> None:
+    """Remove a generated route so we can register a score-aware replacement."""
+    app.router.routes = [
+        route
+        for route in app.router.routes
+        if not (
+            isinstance(route, APIRoute)
+            and route.path == path
+            and methods.issubset(set(route.methods or set()))
+        )
+    ]
+def _score_response(env: SupportDeskEnvironment, observation: SupportDeskObservation) -> dict[str, Any]:
+    """Return the standard OpenEnv shape plus an explicit top-level score."""
+    return {
+        "observation": observation.model_dump(),
+        "reward": observation.reward,
+        "done": observation.done,
+        "score": env.state.current_score,
+    }
+_replace_route("/reset", {"POST"})
+_replace_route("/step", {"POST"})
+@app.post("/reset")
+async def reset_with_score(
+    request: openenv_http_server.ResetRequest = Body(default_factory=openenv_http_server.ResetRequest),
+) -> dict[str, Any]:
+    """Reset the environment and expose the initial deterministic score at top level."""
+    env = SupportDeskEnvironment()
+    try:
+        kwargs = request.model_dump(exclude_unset=True)
+        observation = env.reset(**kwargs)
+        return _score_response(env, observation)
+    finally:
+        env.close()
+@app.post("/step")
+async def step_with_score(request: openenv_http_server.StepRequest) -> dict[str, Any]:
+    """Execute a step and expose the current deterministic score at top level."""
+    action_data = request.action
+    try:
+        action = openenv_http_server.deserialize_action(action_data, SupportDeskAction)
+    except openenv_http_server.ValidationError as exc:
+        raise HTTPException(status_code=422, detail=exc.errors()) from exc
+    env = SupportDeskEnvironment()
+    try:
+        kwargs = request.model_dump(exclude_unset=True, exclude={"action"})
+        observation = env.step(action, **kwargs)
+        return _score_response(env, observation)
+    finally:
+        env.close()
 @app.get("/tasks")
 def list_tasks() -> dict[str, Any]:
     """Expose a stable task catalog for UI, debugging, and pre-submit checks."""
         "observation": observation.model_dump(),
         "reward": observation.reward,
         "done": observation.done,
+        "score": SupportDeskEnvironment.state_for_episode(episode_id).current_score,
     }

tests/test_supportdesk.py CHANGED Viewed

@@ -140,6 +140,9 @@ def test_http_reset_step_state_are_session_consistent():
     reset_response = client.post("/reset", json={"episode_id": "http-episode"})
     assert reset_response.status_code == 200
     step_response = client.post(
         "/step",
@@ -157,6 +160,9 @@ def test_http_reset_step_state_are_session_consistent():
         },
     )
     assert step_response.status_code == 200
     state_response = client.get("/state")
     assert state_response.status_code == 200
@@ -191,6 +197,9 @@ def test_http_explicit_episode_helpers_work():
         },
     )
     assert step_response.status_code == 200
     state_response = client.get(f"/episodes/{episode_id}/state")
     assert state_response.status_code == 200

     reset_response = client.post("/reset", json={"episode_id": "http-episode"})
     assert reset_response.status_code == 200
+    reset_payload = reset_response.json()
+    assert "score" in reset_payload
+    assert 0.0 < reset_payload["score"] < 1.0
     step_response = client.post(
         "/step",
         },
     )
     assert step_response.status_code == 200
+    step_payload = step_response.json()
+    assert "score" in step_payload
+    assert 0.0 < step_payload["score"] < 1.0
     state_response = client.get("/state")
     assert state_response.status_code == 200
         },
     )
     assert step_response.status_code == 200
+    step_payload = step_response.json()
+    assert "score" in step_payload
+    assert 0.0 < step_payload["score"] < 1.0
     state_response = client.get(f"/episodes/{episode_id}/state")
     assert state_response.status_code == 200