Spaces:

Ajsaxena
/

deceit1

Paused

Jayant-Kernel commited on 13 days ago

Commit

e4aea5d

1 Parent(s): d34e286

fix: remove misplaced import inside GRPOConfig args

Files changed (1) hide show

train.py CHANGED Viewed

@@ -175,10 +175,9 @@ trainer = GRPOTrainer(
     model=model,
     processing_class=tokenizer,
     reward_funcs=[reward_fn],
-    import torch as _torch
     args=GRPOConfig(
         output_dir="/tmp/deceit-1.5b",
-        bf16=_torch.cuda.is_available() and _torch.cuda.is_bf16_supported(),
         fp16=False,
         max_steps=150,
         per_device_train_batch_size=4,

     model=model,
     processing_class=tokenizer,
     reward_funcs=[reward_fn],
     args=GRPOConfig(
         output_dir="/tmp/deceit-1.5b",
+        bf16=torch.cuda.is_available() and torch.cuda.is_bf16_supported(),
         fp16=False,
         max_steps=150,
         per_device_train_batch_size=4,