Spaces:

nevernever69
/

redveil

Sleeping

nevernever69 commited on 30 days ago

Commit

ea9019d

verified ·

1 Parent(s): 5ce515a

Upload redveil/server/redveil_environment.py with huggingface_hub

Files changed (1) hide show

redveil/server/redveil_environment.py CHANGED Viewed

@@ -212,7 +212,7 @@ class RedVeilEnvironment(Environment):
             task_description=self._task.description,
             milestones_reached=[],
             done=False,
-            reward=0.0,
         )
     def step(
@@ -657,15 +657,15 @@ class RedVeilEnvironment(Environment):
     def _compute_reward(self) -> float:
         milestones = self._get_reached_milestones()
         if not milestones or not self._task:
-            return 0.0
-        reward = 0.0
         milestone_rewards = {name: val for name, val in self._task.milestones}
         for m in milestones:
             if m in milestone_rewards:
                 reward = max(reward, milestone_rewards[m])
-        return round(reward, 2)
     @property
     def state(self) -> State:

             task_description=self._task.description,
             milestones_reached=[],
             done=False,
+            reward=0.01,
         )
     def step(
     def _compute_reward(self) -> float:
         milestones = self._get_reached_milestones()
         if not milestones or not self._task:
+            return 0.01
+        reward = 0.01
         milestone_rewards = {name: val for name, val in self._task.milestones}
         for m in milestones:
             if m in milestone_rewards:
                 reward = max(reward, milestone_rewards[m])
+        return max(0.01, min(0.99, round(reward, 2)))
     @property
     def state(self) -> State: