Spaces:

Imsachin010
/

salespath-env

Runtime error

Imsachin010 commited on 15 days ago

Commit

876b380

1 Parent(s): 1141c48

Fix FP16 AMP crash by explicitly loading base model in float32 for fallback hardware

Files changed (1) hide show

training/grpo_train.py CHANGED Viewed

@@ -74,7 +74,7 @@ def _load_model_and_tokenizer(model_name: str, use_unsloth: bool = False):
         tokenizer.pad_token = tokenizer.eos_token
     model = AutoModelForCausalLM.from_pretrained(
         model_name,
-        torch_dtype=torch.bfloat16 if bf16_supported else torch.float16,
         device_map="auto",
     )
     return model, tokenizer

         tokenizer.pad_token = tokenizer.eos_token
     model = AutoModelForCausalLM.from_pretrained(
         model_name,
+        torch_dtype=torch.bfloat16 if bf16_supported else torch.float32,
         device_map="auto",
     )
     return model, tokenizer