Spaces:

sh4shv4t
/

Parlay

Paused

App Files Files Community

Parlay / scripts /validate_sft_data.py

Commit History

fix(sft): TRL 1.0+ uses max_length in SFTConfig, not max_seq_length

63e14b4

sh4shv4t commited on 13 days ago

Add pre-training audit scripts, OpenEnv manifest, and tune Parlay training/env (GRPO 1.5B default, min-reward filters, weighted data gen, hiring ZOPA+drift, veteran/opponent prompts, Docker/docs)

df724f2

sh4shv4t commited on 13 days ago