·
AI & ML interests
Machine learning, RLHF
Organizations
weqweasdas/single_turn_minverval_tora_test
Viewer
• Updated • 272 • 3
weqweasdas/kumar_minvervalsecond
Viewer
• Updated • 272 • 3
weqweasdas/self_rewardingppo_minvervalsecond
Viewer
• Updated • 272 • 2
weqweasdas/self_rewardingppo_minverval
Viewer
• Updated • 272 • 3
weqweasdas/single_turn_minverval
Viewer
• Updated • 272 • 3
weqweasdas/kmr_07_step120_one_turn
Viewer
• Updated • 500 • 3
weqweasdas/ift_ppo_07_one_turn_conssitent_rm
Viewer
• Updated • 500 • 3
weqweasdas/ift_ppo_07_one_turn
Viewer
• Updated • 500 • 3
weqweasdas/kmr_07_step120
Viewer
• Updated • 500 • 3
Viewer
• Updated • 500 • 3
Viewer
• Updated • 500 • 3
Viewer
• Updated • 500 • 4
weqweasdas/ift_07_one_turn
Viewer
• Updated • 500 • 3
Viewer
• Updated • 500 • 3
Viewer
• Updated • 500 • 3
Viewer
• Updated • 500 • 3
Viewer
• Updated • 500 • 3
Viewer
• Updated • 40 • 3
Viewer
• Updated • 272 • 286
Viewer
• Updated • 675 • 208
Viewer
• Updated • 30 • 117
Viewer
• Updated • 500 • 283
Viewer
• Updated • 10.7k • 5
Viewer
• Updated • 29.2k • 5
Viewer
• Updated • 30.6k • 3
Viewer
• Updated • 7.5k • 2
Viewer
• Updated • 5k • 2
Viewer
• Updated • 1.32k • 3
weqweasdas/rs_gsm8k_train
Viewer
• Updated • 7.47k • 3
Viewer
• Updated • 5.18M • 3