4 145 36

Shuai Wang

Shuaiii

AI & ML interests

None yet

Recent Activity

updated a dataset 9 days ago

Shuaiii/mathvision

published a dataset 9 days ago

Shuaiii/mathvision

new activity 11 days ago

Shuaiii/mathvista:source

View all activity

Organizations

None yet

upvoted a paper 14 days ago

Vision2Web: A Hierarchical Benchmark for Visual Website Development with Agent Verification

Paper • 2603.26648 • Published 21 days ago • 42

upvoted an article 14 days ago

Article

Welcome Gemma 4: Frontier multimodal intelligence on device

15 days ago

•

854

upvoted a paper about 2 months ago

GLM-5: from Vibe Coding to Agentic Engineering

Paper • 2602.15763 • Published Feb 17 • 144

upvoted a paper 2 months ago

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Paper • 2602.10604 • Published Feb 11 • 195

upvoted 3 papers 3 months ago

STEP3-VL-10B Technical Report

Paper • 2601.09668 • Published Jan 14 • 195

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published Jan 8 • 230

Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

Paper • 2512.24618 • Published Dec 31, 2025 • 154

upvoted 3 papers 4 months ago

Latent Implicit Visual Reasoning

Paper • 2512.21218 • Published Dec 24, 2025 • 70

TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

Paper • 2512.16093 • Published Dec 18, 2025 • 97

Physics of Language Models: Part 4.1, Architecture Design and the Magic of Canon Layers

Paper • 2512.17351 • Published Dec 19, 2025 • 28

upvoted a collection 4 months ago

Qwen3-VL

Collection

37 items • Updated Dec 31, 2025 • 696

upvoted a paper 4 months ago

Olmo 3

Paper • 2512.13961 • Published Dec 15, 2025 • 32

upvoted 7 papers 5 months ago

CaptionQA: Is Your Caption as Useful as the Image Itself?

Paper • 2511.21025 • Published Nov 26, 2025 • 28

DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning

Paper • 2511.22570 • Published Nov 27, 2025 • 93

Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer

Paper • 2511.22699 • Published Nov 27, 2025 • 245

upvoted a paper 6 months ago

Emu3.5: Native Multimodal Models are World Learners

Paper • 2510.26583 • Published Oct 30, 2025 • 114

Shuai Wang

AI & ML interests

Recent Activity

Organizations

Shuaiii's activity

Welcome Gemma 4: Frontier multimodal intelligence on device