helloAK96
/

chaosops-grpo-lora

Text Generation

reinforcement-learning

scalable-oversight

Model card Files Files and versions

chaosops-grpo-lora

90.1 MB

Ctrl+K

Ctrl+K

1 contributor

History: 8 commits

helloAK96's picture

Add post-training evaluation.json

e221bf5 verified 14 days ago