3 15 1

Yujun Zhou

yujunzhou

AI & ML interests

None yet

Recent Activity

upvoted a paper 15 days ago

Emergent Social Intelligence Risks in Generative Multi-Agent Systems

updated a model 18 days ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-RandomNovelty

published a model 18 days ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-RandomNovelty

View all activity

Organizations

None yet

upvoted a paper 15 days ago

Emergent Social Intelligence Risks in Generative Multi-Agent Systems

Paper • 2603.27771 • Published 17 days ago • 51

updated a model 18 days ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-RandomNovelty

4B • Updated 18 days ago • 36

published a model 18 days ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-RandomNovelty

4B • Updated 18 days ago • 36

updated a model 19 days ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-OpenAI

4B • Updated 18 days ago • 60

published a model 19 days ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-OpenAI

4B • Updated 18 days ago • 60

New activity in yujunzhou/AIME-TTT-OctoThinker-8B-Hybrid-Base-TTRL about 1 month ago

Running in MSTY Studio

#1 opened about 1 month ago by

Bogoo10191

upvoted a paper 4 months ago

Can LLMs Guide Their Own Exploration? Gradient-Guided Reinforcement Learning for LLM Reasoning

Paper • 2512.15687 • Published Dec 17, 2025 • 22

submitted a paper to Daily Papers 4 months ago

Can LLMs Guide Their Own Exploration? Gradient-Guided Reinforcement Learning for LLM Reasoning

Paper • 2512.15687 • Published Dec 17, 2025 • 22

updated 2 models 4 months ago

yujunzhou/SFT_Advanced_Risk_Self_Grading_Qwen3-4B

Text Generation • 4B • Updated Dec 17, 2025 • 7

yujunzhou/SFT_Advanced_Risk_Self_Grading_llama

Text Generation • 8B • Updated Dec 17, 2025 • 8

published a model 4 months ago

yujunzhou/SFT_Advanced_Risk_Self_Grading_Qwen3-4B

Text Generation • 4B • Updated Dec 17, 2025 • 7

updated a model 4 months ago

yujunzhou/SFT_Advanced_Risk_Self_Grading_Qwen3-4B-Base

Text Generation • 4B • Updated Dec 17, 2025 • 7

published a model 4 months ago

yujunzhou/SFT_Advanced_Risk_Self_Grading_Qwen3-4B-Base

Text Generation • 4B • Updated Dec 17, 2025 • 7

updated 2 models 4 months ago

yujunzhou/SFT_Advanced_Risk_Reward_Tampering_Qwen3-4B

Text Generation • 4B • Updated Dec 17, 2025 • 1

yujunzhou/Advanced_Risk_Self_Grading_llama

8B • Updated Dec 17, 2025

published a model 4 months ago

yujunzhou/SFT_Advanced_Risk_Reward_Tampering_Qwen3-4B

Text Generation • 4B • Updated Dec 17, 2025 • 1

updated a model 4 months ago

yujunzhou/SFT_Advanced_Risk_Reward_Tampering_Qwen3-4B-Base

Text Generation • 4B • Updated Dec 16, 2025 • 2

published a model 4 months ago

yujunzhou/SFT_Advanced_Risk_Reward_Tampering_Qwen3-4B-Base

Text Generation • 4B • Updated Dec 16, 2025 • 2

updated 2 models 4 months ago

yujunzhou/SFT_Advanced_Risk_Reward_Tampering_llama

Text Generation • 8B • Updated Dec 16, 2025 • 1

yujunzhou/SFT_Advanced_Risk_Situation_Aware_Qwen3-4B-Base

Text Generation • 4B • Updated Dec 16, 2025 • 1

Yujun Zhou

AI & ML interests

Recent Activity

Organizations

yujunzhou's activity

Running in MSTY Studio