File size: 4,649 Bytes
be57602
 
 
 
 
 
 
 
 
 
 
82d4506
8f9b2f1
82d4506
be57602
 
 
 
8e380af
be57602
82d4506
be57602
8f9b2f1
82d4506
 
8f9b2f1
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
82d4506
 
 
 
8e380af
 
8f9b2f1
 
 
8e380af
 
 
8f9b2f1
 
 
82d4506
8f9b2f1
8e380af
 
 
 
 
8f9b2f1
8e380af
 
 
 
 
 
 
8f9b2f1
82d4506
 
be57602
82d4506
be57602
 
 
 
 
 
8f9b2f1
 
 
be57602
82d4506
 
 
 
be57602
 
82d4506
be57602
8f9b2f1
 
 
 
 
 
 
 
be57602
 
 
82d4506
 
8f9b2f1
82d4506
8f9b2f1
 
 
 
 
 
82d4506
 
 
 
be57602
8f9b2f1
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
---
license: apache-2.0
language:
- ko
- en
library_name: transformers
tags:
- korean
- reasoning
- multimodal
- mix
base_model:
- FINAL-Bench/Darwin-28B-KR
- NewenAI/QuettaLLMs-27B-Koreasoner-V3
---

# Rogue-28B-MIX

한국어 reasoning + multimodal mix 모델.

---

## 🏛️ 가문 계보

```
┌──────────────────────────────────────────┐
│  증조부 (Great-Grandfather)               │
│  Qwen-3.6-27B                             │
└──────────────────────────────────────────┘


┌──────────────────────────────────────────┐
│  조부 (Grandfather)                       │
│  Darwin-3.6-28B                           │
└──────────────────────────────────────────┘


┌──────────────────────────────────────────┐
│  아빠 (Father)                            │
│  FINAL-Bench/Darwin-28B-KR                │
│  - 한국어 특화 reasoning 모델              │
└──────────────────────────────────────────┘

                  ×× 교배 ××

┌──────────────────────────────────────────┐
│  엄마 (Mother)                            │
│  NewenAI/QuettaLLMs-27B-Koreasoner-V3     │
│  - K-AI Leaderboard 1위                   │
└──────────────────────────────────────────┘


╔══════════════════════════════════════════╗
║  자식 (Child) — 본 모델                    ║
║  ginigen-ai/Rogue-28B-MIX                 ║
║                                            ║
║  - 친가의 reasoning 계승                   ║
║  - 외가의 한국어 K-AI 지식 계승            ║
║  - <think> 추론 트레이스 보존              ║
║  - 멀티모달 헤드 보존                      ║
╚══════════════════════════════════════════╝
```

---

## 🎓 학습 개요

1. 친가 × 외가 모델 가중치 머지
2. K-AI 도메인 데이터로 추가 SFT
3. K-AI Leaderboard Docker 호환 형식 정비

---

## 📊 평가

한국어 공개 10 데이터셋, 100문제 × 1 seed.

| Dataset | Rogue-28B-MIX | 엄마(Quetta) |
|:---|---:|---:|
| CLIcK | 84% | 85% |
| KMMLU History | **48%** 🏆 | 45% |
| KMMLU Law | 25% | 26% |
| KMMLU Health | **81%** 🏆 | 80% |
| HAERAE GK | 63% | 66% |
| HAERAE History | 89% | 90% |
| HAERAE Linguistics | 90% | 95% |
| KoBEST Hellaswag | 95% | 97% |
| KoBEST COPA | 98% | 99% |
| KoBEST BoolQ | 97% | 97% |
| **Macro Avg** | **77.0%** | **78.0%** |

K-AI Leaderboard 핵심 카테고리(의료·역사)에서 엄마 추월.

---

## 🎯 사용법

```python
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model_id = "ginigen-ai/Rogue-28B-MIX"
tokenizer = AutoTokenizer.from_pretrained(
    model_id, trust_remote_code=True
)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
    trust_remote_code=True,
)

prompt = "한국의 추석에 대해 설명해주세요."
messages = [{"role": "user", "content": prompt}]
inputs = tokenizer.apply_chat_template(
    messages, return_tensors="pt", add_generation_prompt=True
)
out = model.generate(
    inputs.to(model.device),
    max_new_tokens=512,
    do_sample=False,
)
print(tokenizer.decode(out[0], skip_special_tokens=False))
```

---

## 🛠️ 사양

- 파라미터: 28B (multimodal)
- 양자화: bf16
- 컨텍스트: 8K (확장 가능)
- 언어: 한국어 + 영어
- 추론: `<think>` reasoning trace
- License: Apache 2.0

---

## 🤝 출처

- 아빠: [FINAL-Bench/Darwin-28B-KR](https://huggingface.co/FINAL-Bench/Darwin-28B-KR)
- 엄마: [NewenAI/QuettaLLMs-27B-Koreasoner-V3](https://huggingface.co/NewenAI/QuettaLLMs-27B-Koreasoner-V3)