sanduntg
/

output

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

output / runs

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

sanduntg's picture

sanduntg/llama_2_dpo_with_reward_1000

27e25fd verified about 2 years ago