Nanbeige4-3B Cold Start Reasoning LoRA Experiments - a mrinaalarora Collection

mrinaalarora 's Collections

Nanbeige4-3B Cold Start Reasoning LoRA Experiments

Nanbeige4-3B Cold Start Reasoning LoRA Experiments

updated Mar 13

Two LoRA cold-start SFT experiments teaching structured think/answer reasoning to Nanbeige4-3B-Base using distilled traces from frontier models

mrinaalarora/nanbeige4-3b-cold-start-reasoning-lora-glm-12k

Text Generation • Updated Mar 10 • 1
mrinaalarora/Nanbeige4-3B-Cold-Start-Reasoning-LoRA

Text Generation • Updated Mar 2 • 2
mrinaalarora/Nanbeige4-3B-Cold-Start-Reasoning-LoRA-Opus-Epoch3

Text Generation • Updated Mar 13 • 1