sagnik mukherjee's picture

sagnik mukherjee

sagnikM

AI & ML interests

None yet

Recent Activity

updated a model 18 days ago

sagnikM/grpo_adam_small_beta

published a model 18 days ago

sagnikM/grpo_adam_small_beta

upvoted a paper 2 months ago

Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

View all activity

Organizations

None yet

upvoted a paper 2 months ago

Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

Paper • 2601.22975 • Published Jan 30 • 110

upvoted a paper 11 months ago

Reinforcement Learning Finetunes Small Subnetworks in Large Language Models

Paper • 2505.11711 • Published May 16, 2025 • 11