Spaces:

Ajsaxena
/

deceit1

Paused

Jayant-Kernel commited on 13 days ago

Commit

d34e286

1 Parent(s): d75e720

fix: auto-detect bf16 support

Files changed (1) hide show

train.py CHANGED Viewed

@@ -175,8 +175,11 @@ trainer = GRPOTrainer(
     model=model,
     processing_class=tokenizer,
     reward_funcs=[reward_fn],
     args=GRPOConfig(
         output_dir="/tmp/deceit-1.5b",
         max_steps=150,
         per_device_train_batch_size=4,
         num_generations=4,

     model=model,
     processing_class=tokenizer,
     reward_funcs=[reward_fn],
+    import torch as _torch
     args=GRPOConfig(
         output_dir="/tmp/deceit-1.5b",
+        bf16=_torch.cuda.is_available() and _torch.cuda.is_bf16_supported(),
+        fp16=False,
         max_steps=150,
         per_device_train_batch_size=4,
         num_generations=4,