Spaces:

anugrah55
/

opensleuth-training-gemini-cli

Paused

App Files Files Community

opensleuth-training-gemini-cli / requirements.txt

Commit History

Bump TRL to 0.16.1 (adds GRPOTrainer); transformers 4.51.3, peft 0.14, accelerate 1.4, bnb 0.45.5

ad4b830
verified

anugrah55 commited on 13 days ago

Overhaul trainer: TRL GRPO with env-backed reward, Qwen2.5-0.5B 4bit+LoRA, slim PyTorch CUDA base, heartbeat HTTP for HF Spaces health probe

d597642
verified

anugrah55 commited on 13 days ago

Upload requirements.txt with huggingface_hub

e544913
verified

anugrah55 commited on 13 days ago