Shenzhi Yang's picture

Shenzhi Yang

Shenzhi

·

AI & ML interests

None yet

Recent Activity

commentedon a paper 5 days ago

Can LLMs Learn to Reason Robustly under Noisy Supervision?

commentedon a paper 5 days ago

Can LLMs Learn to Reason Robustly under Noisy Supervision?

commentedon a paper 7 days ago

Can LLMs Learn to Reason Robustly under Noisy Supervision?

View all activity

Organizations

None yet

upvoted a paper 10 days ago

Can LLMs Learn to Reason Robustly under Noisy Supervision?

Paper • 2604.03993 • Published 13 days ago • 42

upvoted a paper 3 months ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 158

upvoted a paper 4 months ago

TraPO: A Semi-Supervised Reinforcement Learning Framework for Boosting LLM Reasoning

Paper • 2512.13106 • Published Dec 15, 2025 • 4