File size: 3,550 Bytes
3a819db
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
---
license: apache-2.0
language:
- ko
- en
library_name: transformers
tags:
- korean
- reasoning
- darwin
- evolutionary-merge
- sft
base_model:
- ginigen-ai/Rogue-28B-MIX
---

# Warecube-KO-27B-v2

한국어 reasoning 모델 — Darwin 진화 + 추가 SFT 정제 변종.

---

## 🧬 Darwin 진화 컨셉

본 모델은 **Darwin V7 진화적 모델 머지** 기반의 부모 모델에
**한국어 K-AI 도메인 SFT**를 추가 학습한 자식 모델입니다.

```
   자연 진화                    Darwin 머지 + SFT
   ─────────                    ───────────────────
   유전자 교차              →   가중치 모듈별 비율 결합 (부모)
   세대 진화                →   부모 모델에 추가 SFT 정제
   적자 생존                →   K-AI 도메인 우수 자손 보존
```

---

## 🏛️ 가문 계보

```
┌────────────────────────────────────────┐
│  베이스 (Base / Parent)                 │
│  ginigen-ai/Rogue-28B-MIX              │
│                                          │
│  - K-AI Leaderboard 2위 (avg 0.559)    │
│  - Darwin family + Quetta 진화 머지     │
│  - <think> reasoning trace              │
└────────────────────────────────────────┘

                  ▼ K-AI 도메인 추가 SFT 진화
╔════════════════════════════════════════╗
║  자식 (Child) — 본 모델                  ║
║  Warecube/Warecube-KO-27B-v2           ║
║                                          ║
║  ✦ 베이스의 모든 능력 계승               ║
║  ✦ Com2-main 도메인 강화                ║
║  ✦ K-AI Leaderboard Docker 호환 형식     ║
╚════════════════════════════════════════╝
```

---

## 🎓 학습 개요

| Stage | 개략 |
|:---|:---|
| **Base** | ginigen-ai/Rogue-28B-MIX (Darwin family × Quetta family 진화 머지) |
| **SFT** | 한국어 K-AI 도메인 instruction 데이터로 추가 정제 |
| **호환** | K-AI Leaderboard Docker 호환 형식으로 정비 |

---

## 🎯 사용법

```python
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model_id = "Warecube/Warecube-KO-27B-v2"
tokenizer = AutoTokenizer.from_pretrained(
    model_id, trust_remote_code=True
)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
    trust_remote_code=True,
)

prompt = "한국의 추석에 대해 설명해주세요."
messages = [{"role": "user", "content": prompt}]
inputs = tokenizer.apply_chat_template(
    messages, return_tensors="pt", add_generation_prompt=True
)
out = model.generate(
    inputs.to(model.device),
    max_new_tokens=512,
    do_sample=False,
)
print(tokenizer.decode(out[0], skip_special_tokens=False))
```

---

## 🛠️ 사양

- 파라미터: 28B (multimodal)
- 양자화: bf16
- 컨텍스트: 8K (확장 가능)
- 언어: 한국어 + 영어
- 추론: `<think>` reasoning trace
- License: Apache 2.0

---

## 🤝 출처

- 베이스: [ginigen-ai/Rogue-28B-MIX](https://huggingface.co/ginigen-ai/Rogue-28B-MIX) (K-AI Leaderboard 2위)
- 가문: Darwin family (Darwin V7 진화적 머지 시리즈)