Spaces:

K446
/

Opengrid

Running

K446 commited on 12 days ago

Commit

8d94e97

1 Parent(s): 6072ace

Fix batch size: 8 to match num_generations=8

Files changed (1) hide show

run_training.py CHANGED Viewed

@@ -208,8 +208,8 @@ def run_grpo_training():
     grpo_config = GRPOConfig(
         output_dir="training/outputs/grpo_checkpoints",
         num_train_epochs=3,
-        per_device_train_batch_size=2,
-        gradient_accumulation_steps=8,
         learning_rate=1e-5,
         logging_steps=5,
         save_steps=50,

     grpo_config = GRPOConfig(
         output_dir="training/outputs/grpo_checkpoints",
         num_train_epochs=3,
+        per_device_train_batch_size=8,
+        gradient_accumulation_steps=2,
         learning_rate=1e-5,
         logging_steps=5,
         save_steps=50,