Song Jiang's picture

Song Jiang

songjiang

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 2 months ago

ARLArena: A Unified Framework for Stable Agentic Reinforcement Learning

upvoted a paper 6 months ago

SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models

upvoted a paper 6 months ago

Large Reasoning Models Learn Better Alignment from Flawed Thinking

View all activity

Organizations

None yet

upvoted a paper about 2 months ago

ARLArena: A Unified Framework for Stable Agentic Reinforcement Learning

Paper • 2602.21534 • Published Feb 25 • 24

upvoted 2 papers 6 months ago

SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models

Paper • 2510.09541 • Published Oct 10, 2025 • 17

Large Reasoning Models Learn Better Alignment from Flawed Thinking

Paper • 2510.00938 • Published Oct 1, 2025 • 60