Andreas Stöffelbauer's picture

7

Andreas Stöffelbauer

andreasskyscanner

AI & ML interests

None yet

Recent Activity

upvoted a paper about 22 hours ago

p1: Better Prompt Optimization with Fewer Prompts

upvoted a paper 6 days ago

ThinkTwice: Jointly Optimizing Large Language Models for Reasoning and Self-Refinement

upvoted a paper 11 days ago

Embarrassingly Simple Self-Distillation Improves Code Generation

View all activity

Organizations

None yet

upvoted a paper about 22 hours ago

p1: Better Prompt Optimization with Fewer Prompts

Paper • 2604.08801 • Published 6 days ago • 5

upvoted a paper 6 days ago

ThinkTwice: Jointly Optimizing Large Language Models for Reasoning and Self-Refinement

Paper • 2604.01591 • Published 13 days ago • 40

upvoted 2 papers 11 days ago

Embarrassingly Simple Self-Distillation Improves Code Generation

Paper • 2604.01193 • Published 13 days ago • 37

Terminal Agents Suffice for Enterprise Automation

Paper • 2604.00073 • Published 14 days ago • 93

upvoted a paper 4 months ago

Olmo 3

Paper • 2512.13961 • Published Dec 15, 2025 • 32

upvoted 2 papers 6 months ago

Hybrid Architectures for Language Models: Systematic Analysis and Design Insights

Paper • 2510.04800 • Published Oct 6, 2025 • 37

Front-Loading Reasoning: The Synergy between Pretraining and Post-Training Data

Paper • 2510.03264 • Published Sep 26, 2025 • 25

updated a model 10 months ago

andreasskyscanner/llama-31-hhrlhf-squad-rlhf-policy-model

Text Generation • 1B • Updated Jul 1, 2025 • 1

published a model 10 months ago

andreasskyscanner/llama-31-hhrlhf-squad-rlhf-policy-model

Text Generation • 1B • Updated Jul 1, 2025 • 1

updated a model 10 months ago

andreasskyscanner/llama-32-hhrlhf-reward-adapter

Updated Jul 1, 2025

published a model 10 months ago

andreasskyscanner/llama-32-hhrlhf-reward-adapter

Updated Jul 1, 2025