Ricardo-H/WorldModel-Textworld-F1Reward-Qwen2.5-7B-step100

8B • Updated 23 days ago • 31
Ricardo-H/ws-wm-llama-webshop-f1-step-50

8B • Updated 22 days ago • 9
Ricardo-H/ws-wm-llama-webshop-f1-step-92

8B • Updated 22 days ago • 30
Ricardo-H/ws-wm-llama-textworld-f1-step-100

8B • Updated 19 days ago • 25

Ricardo-H/WorldModel-Textworld-F1Reward-Qwen2.5-7B-step100

8B • Updated 23 days ago • 31
Ricardo-H/ws-wm-llama-webshop-f1-step-50

8B • Updated 22 days ago • 9
Ricardo-H/ws-wm-llama-webshop-f1-step-92

8B • Updated 22 days ago • 30
Ricardo-H/ws-wm-llama-textworld-f1-step-100

8B • Updated 19 days ago • 25