KoGemopus-4
Collection
🇰🇷 A curated collection of Korean reasoning models distilled from Opus. • 1 item • Updated
Gemma4-26B-A4B 기반 한국어 Reasoning SFT 모델. Claude Opus 4.6 distilled 한국어 reasoning 데이터 12K로 학습. LR 5e-5, alpha=2×r.
| 항목 | 내용 |
|---|---|
| Base Model | unsloth/gemma-4-26B-A4B-it |
| 학습 방법 | LoRA SFT (Unsloth + TRL) |
| 프레임워크 | transformers, peft |
| 라이센스 | Apache 2.0 |
from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained("jiwon9703/Gemma4-26B-A4B-Korean-SFT-v7")
tokenizer = AutoTokenizer.from_pretrained("jiwon9703/Gemma4-26B-A4B-Korean-SFT-v7")
vllm serve jiwon9703/Gemma4-26B-A4B-Korean-SFT-v7 --max-model-len 8192 --reasoning-parser gemma4