7 58 372

Junyeong Song

junyeong-nero

https://junyeong-nero.github.io/portfolio/

AI & ML interests

Synthetic Data / OCR / Image-Generation

Recent Activity

liked a Space about 8 hours ago

HuggingFaceTB/trl-distillation-trainer

liked a model about 23 hours ago

LGAI-EXAONE/EXAONE-4.5-33B

liked a dataset 1 day ago

PeirongZhang/OCRGenBench

View all activity

Organizations

None yet

liked a Space about 8 hours ago

Distilling 100B+ Models 40x Faster with TRL

📝

TRL distillation for 100B+ teachers, 40x faster

liked a model about 23 hours ago

LGAI-EXAONE/EXAONE-4.5-33B

Image-Text-to-Text • 34B • Updated about 5 hours ago • 6.63k • 139

liked a dataset 1 day ago

PeirongZhang/OCRGenBench

Preview • Updated about 4 hours ago • 93 • 4

liked a model 2 days ago

Jiunsong/supergemma4-26b-uncensored-gguf-v2

Text Generation • 25B • Updated 3 days ago • 26.7k • 259

upvoted a paper 4 days ago

Rethinking Generalization in Reasoning SFT: A Conditional Analysis on Optimization, Data, and Model Capability

Paper • 2604.06628 • Published 7 days ago • 309

liked a model 7 days ago

zai-org/GLM-5.1

Text Generation • 754B • Updated 3 days ago • 91.5k • • 1.21k

upvoted 2 papers 7 days ago

Vanast: Virtual Try-On with Human Image Animation via Synthetic Triplet Supervision

Paper • 2604.04934 • Published 9 days ago • 42

Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents

Paper • 2604.06132 • Published 8 days ago • 114

liked a dataset 7 days ago

seongsubae/KorMedMCQA-V

Viewer • Updated Feb 17 • 1.84k • 110 • 7

upvoted a paper 8 days ago

Self-Distilled RLVR

Paper • 2604.03128 • Published 12 days ago • 160

updated a model 9 days ago

junyeong-nero/tiny-sd-models

Updated 9 days ago • 1

liked a model 10 days ago

netflix/void-model

Video-to-Video • Updated 9 days ago • 820

liked a model 12 days ago

google/gemma-4-31B-it

Image-Text-to-Text • 33B • Updated 5 days ago • 2.89M • • 1.91k

liked a model 13 days ago

nvidia/nemotron-ocr-v2

Image-to-Text • Updated 2 days ago • 802 • 119

upvoted a paper 19 days ago

UI-Voyager: A Self-Evolving GUI Agent Learning via Failed Experience

Paper • 2603.24533 • Published 21 days ago • 47

upvoted a paper 21 days ago

Look Where It Matters: High-Resolution Crops Retrieval for Efficient VLMs

Paper • 2603.16932 • Published Mar 14 • 87

liked 2 models 22 days ago

baidu/Qianfan-OCR

Image-Text-to-Text • 5B • Updated 20 days ago • 103k • 1.15k

rednote-hilab/dots.mocr

Image-Text-to-Text • 3B • Updated 26 days ago • 103k • 99

reactedto Shrijanagain's post with 🔥 25 days ago

Post

5464

Surya-1.1T: Scaling Beyond Human-Level Reasoning via 146 Trillion Token Pre-training
Author: SKT AI LABS
Affiliation: SKT AI Labs / Project Surya
Model Architecture: Optimized Dense Transformer
Parameters: 1.1 Trillion
Training Tokens: 146 Trillion

Wanna collaborate us Friends let's Start Journey we have Collected 146 trillon tokens and done pre training but we need to made more powerfull

Whitepaper - https://github.com/SHRIJANAGAIN/PROFF

57 replies

reactedto Keeby-smilyai's post with 🤗 27 days ago

Post

3150

Hello everyone!

1 reply

Junyeong Song

AI & ML interests

Recent Activity

Organizations

junyeong-nero's activity

Distilling 100B+ Models 40x Faster with TRL