Richard Zhuang's picture

Richard Zhuang PRO

RZ412

·

https://richardzhuang0412.github.io

AI & ML interests

LLM Routing, LLM + Games, Post-Training, Agents

Recent Activity

updated a dataset about 1 hour ago

DCAgent2/terminal_bench_2_d1_harden_then_constrain_top4_seq_glm47_20260412_071357

published a dataset about 1 hour ago

DCAgent2/terminal_bench_2_d1_harden_then_constrain_top4_seq_glm47_20260412_071357

updated a dataset about 3 hours ago

DCAgent2/terminal_bench_2_GLM_4_6_stackexchange_overflow_sandboxes_32eps_65k_reasoning_Q53942cdc

View all activity

Organizations

Papers 2

arxiv:2501.08328

arxiv:2410.02223

models 57

RZ412/Qwen2.5-3B-Instruct-inferredbugs-sandboxes-traces-terminus-2

Updated Dec 4, 2025

RZ412/Qwen2.5-3B-Instruct-OT3-8K-QwQ-Min-R1-Min-MLR

Text Generation • 3B • Updated Nov 30, 2025 • 1

RZ412/Qwen2.5-3B-Instruct-OT3-8K-R1-Only-Seed-42

Text Generation • 3B • Updated Nov 3, 2025 • 2

RZ412/Qwen2.5-3B-Instruct-OT3-8K-QwQ-R1-RM-50-50-SS-42-AS-42

Text Generation • 3B • Updated Nov 3, 2025 • 1

RZ412/Qwen2.5-3B-Instruct-OT3-8K-QwQ-Only-Seed-42

Text Generation • 3B • Updated Nov 3, 2025 • 33

RZ412/Qwen2.5-3B-Instruct-OT3-8K-R1-MeL

Text Generation • 3B • Updated Oct 28, 2025 • 2

RZ412/Qwen2.5-3B-Instruct-OT3-8K-R1-ML

Text Generation • 3B • Updated Oct 27, 2025 • 2

RZ412/Qwen2.5-3B-Instruct-OT3-8K-QwQ-MaL-misstore

Text Generation • 3B • Updated Oct 27, 2025 • 27

RZ412/Qwen2.5-3B-Instruct-OT3-8K-QwQ-R1-DB

Text Generation • 3B • Updated Oct 26, 2025 • 3

RZ412/Qwen2.5-3B-Instruct-OT3-8K-QwQ-R1-RES

Text Generation • 3B • Updated Oct 26, 2025 • 4

datasets 53

RZ412/test_harbor_trace

Viewer • Updated 9 days ago • 97 • 33

RZ412/test_harbor_trace-summarization-9-summary

Viewer • Updated 9 days ago • 1 • 30

RZ412/test_harbor_trace-summarization-9-questions

Viewer • Updated 9 days ago • 1 • 24

RZ412/test_harbor_trace-summarization-8-summary

Viewer • Updated 9 days ago • 1 • 23

RZ412/test_harbor_trace-summarization-8-questions

Viewer • Updated 9 days ago • 1 • 26

RZ412/test_harbor_trace-summarization-7-summary

Viewer • Updated 9 days ago • 1 • 27

RZ412/test_harbor_trace-summarization-7-questions

Viewer • Updated 9 days ago • 1 • 26

RZ412/test_harbor_trace-summarization-6-summary

Viewer • Updated 9 days ago • 1 • 28

RZ412/test_harbor_trace-summarization-6-questions

Viewer • Updated 9 days ago • 1 • 31

RZ412/test_harbor_trace-summarization-15-summary

Viewer • Updated 9 days ago • 1 • 26

View 53 datasets