Spaces:

sh4shv4t
/

Parlay

Paused

sh4shv4t commited on 14 days ago

Commit

8ec5193

1 Parent(s): 48756ef

fix: move global declarations before first use (grpo_train, call_gemini)

Files changed (2) hide show

agent/gemini_client.py CHANGED Viewed

@@ -292,10 +292,10 @@ async def call_gemini(
         Parsed dict with keys: utterance (str), offer_amount (float|None),
         tactical_move (str|None). Returns SYNTHETIC_RESPONSE on any error.
     """
     if _is_mock_mode():
         return _get_mock_response(persona, len(messages), scenario_id)
-    global _gemini_model_logged
     if not _gemini_model_logged:
         logger.info(f"[Gemini] Using model: {GEMINI_MODEL}")
         _gemini_model_logged = True
@@ -334,7 +334,6 @@ async def call_gemini(
         try:
             response = await loop.run_in_executor(None, _call)
-            global _live_calls, _turn_count
             _turn_count += 1
             _live_calls += 1
             print(
@@ -372,7 +371,6 @@ async def call_gemini(
         file=sys.stderr,
     )
     logger.warning("Gemini API / parse failed after retries — using text fallback")
-    global _fallback_calls
     _fallback_calls += 1
     if text:
         return {**SYNTHETIC_RESPONSE, "utterance": text[:300]}

         Parsed dict with keys: utterance (str), offer_amount (float|None),
         tactical_move (str|None). Returns SYNTHETIC_RESPONSE on any error.
     """
+    global _gemini_model_logged, _live_calls, _turn_count, _fallback_calls
     if _is_mock_mode():
         return _get_mock_response(persona, len(messages), scenario_id)
     if not _gemini_model_logged:
         logger.info(f"[Gemini] Using model: {GEMINI_MODEL}")
         _gemini_model_logged = True
         try:
             response = await loop.run_in_executor(None, _call)
             _turn_count += 1
             _live_calls += 1
             print(
         file=sys.stderr,
     )
     logger.warning("Gemini API / parse failed after retries — using text fallback")
     _fallback_calls += 1
     if text:
         return {**SYNTHETIC_RESPONSE, "utterance": text[:300]}

training/grpo_train.py CHANGED Viewed

@@ -173,6 +173,7 @@ def train_grpo(
 def main() -> None:
     parser = argparse.ArgumentParser(description="Parlay GRPO fine-tuning")
     parser.add_argument("--model", default="models/parlay-sft")
     parser.add_argument("--base_model", default="")
@@ -185,7 +186,6 @@ def main() -> None:
     args = parser.parse_args()
     logging.basicConfig(level=logging.INFO, format="%(levelname)s %(name)s: %(message)s")
-    global GRPO_GENERATIONS
     GRPO_GENERATIONS = args.g
     model_path = args.base_model or args.model
     train_grpo(model_path, args.data, args.output, args.steps)

 def main() -> None:
+    global GRPO_GENERATIONS
     parser = argparse.ArgumentParser(description="Parlay GRPO fine-tuning")
     parser.add_argument("--model", default="models/parlay-sft")
     parser.add_argument("--base_model", default="")
     args = parser.parse_args()
     logging.basicConfig(level=logging.INFO, format="%(levelname)s %(name)s: %(message)s")
     GRPO_GENERATIONS = args.g
     model_path = args.base_model or args.model
     train_grpo(model_path, args.data, args.output, args.steps)