ginigen-ai commited on
Commit
d9c5094
·
verified ·
1 Parent(s): 82d4506

update lineage: father is Darwin-28B-Opus

Browse files
Files changed (1) hide show
  1. README.md +27 -26
README.md CHANGED
@@ -13,7 +13,7 @@ tags:
13
  - merge
14
  - darwin-family
15
  base_model:
16
- - Anserwise/AWAXIS-Think-28B
17
  - NewenAI/QuettaLLMs-27B-Koreasoner-V3
18
  ---
19
 
@@ -37,9 +37,9 @@ base_model:
37
 
38
  ┌────────── 친할머니 (Father's Mother) ────────────┐
39
  │ │
40
- Anthropic Claude Opus (증류 출처)
41
- │ - 단계별 추론 능력 (think trace)
42
- │ - LoRA 3K samples 증류 학습
43
  │ │
44
  └───────────────────────────────────────────────────┘
45
 
@@ -47,10 +47,11 @@ base_model:
47
  ┌──────────────────────────────────────────────────────────────────────────────┐
48
  │ 아버지 (Father) │
49
  │ │
50
- Anserwise/AWAXIS-Think-28B (Apache 2.0)
51
- │ - Qwen 3.6 + Claude Opus Reasoning 증류
 
 
52
  │ - <think> 트레이스로 단계별 사고 │
53
- │ - 추론·코딩·수학 강점 │
54
  │ │
55
  └──────────────────────────────────────────────────────────────────────────────┘
56
 
@@ -92,7 +93,7 @@ base_model:
92
  ║ ginigen-ai/Rogue-28B-MIX (Apache 2.0, Private) ║
93
  ║ ║
94
  ║ ✦ 조상의 능력 모두 계승 ║
95
- ║ - 친가 → 추론·생각 트레이스 (AWAXIS)
96
  ║ - 외가 → 한국어·K-AI 도메인 지식 (Quetta) ║
97
  ║ ║
98
  ║ ✦ Smart MRI Streaming Merge ║
@@ -112,21 +113,21 @@ base_model:
112
 
113
  ## 📊 평가 (한국어 공개 10 데이터셋, 100문제 × 1 seed, temperature=0)
114
 
115
- | Dataset | 친아빠(AWAXIS) | 우리(Rogue) | 엄마(Quetta) | vs 엄마 |
116
- |---|---:|---:|---:|:---:|
117
- | CLIcK | (참조) | **84%** | 85% | -1pp |
118
- | KMMLU History | (참조) | **48%** | 45% | **+3pp 🏆** |
119
- | KMMLU Law | (참조) | 25% | 26% | -1pp |
120
- | KMMLU Health | (참조) | **81%** | 80% | **+1pp 🏆** |
121
- | HAERAE General | (참조) | 63% | 66% | -3pp |
122
- | HAERAE History | (참조) | 89% | 90% | -1pp |
123
- | HAERAE Linguistics | (참조) | 90% | 95% | -5pp |
124
- | KoBEST Hellaswag | (참조) | 95% | 97% | -2pp |
125
- | KoBEST COPA | (참조) | 98% | 99% | -1pp |
126
- | KoBEST BoolQ | (참조) | 97% | 97% | 0 |
127
- | **Macro Avg** | — | **77.0%** | **78.0%** | **-1.0pp** |
128
-
129
- 부모 격차 -1.0pp까지 따라잡았으며, **K-AI Leaderboard 핵심 카테고리(의료·역사)에서 엄마(Quetta)를 추월**했습니다.
130
 
131
  ---
132
 
@@ -178,14 +179,14 @@ print(tokenizer.decode(out[0], skip_special_tokens=False))
178
 
179
  ## 📜 라이선스
180
 
181
- Apache 2.0 — 상업적 사용 가능. 두 부모(AWAXIS, Quetta) 모두 Apache 2.0.
182
 
183
  ---
184
 
185
  ## 🤝 출처
186
 
187
- - 친아빠: https://huggingface.co/Anserwise/AWAXIS-Think-28B
188
  - 엄마: https://huggingface.co/NewenAI/QuettaLLMs-27B-Koreasoner-V3
189
  - 친할아버지/외할아버지: https://huggingface.co/unsloth (Qwen 3.5/3.6 멀티모달)
190
- - 친할머니: Anthropic Claude Opus (reasoning 증류)
191
  - 외할머니: K-AI Korean Leaderboard ecosystem
 
13
  - merge
14
  - darwin-family
15
  base_model:
16
+ - FINAL-Bench/Darwin-28B-Opus
17
  - NewenAI/QuettaLLMs-27B-Koreasoner-V3
18
  ---
19
 
 
37
 
38
  ┌────────── 친할머니 (Father's Mother) ────────────┐
39
  │ │
40
+ 한국어 도메인 특화 가족원
41
+ │ - 한국어 표현·지식 강화 출처
42
+ │ - Darwin family (한국어 토크나이저 호환)
43
  │ │
44
  └───────────────────────────────────────────────────┘
45
 
 
47
  ┌──────────────────────────────────────────────────────────────────────────────┐
48
  │ 아버지 (Father) │
49
  │ │
50
+ FINAL-Bench/Darwin-28B-Opus (Apache 2.0)
51
+ │ - Darwin V7 진화적 모델 머지의 정점
52
+ │ - Qwen 3.6 + 한국어 도메인 특화 가족원의 MRI-Aware 머지 │
53
+ │ - 추론(GPQA 88.4%) + 한국어(CLIcK·KMMLU) 양수겸장 │
54
  │ - <think> 트레이스로 단계별 사고 │
 
55
  │ │
56
  └──────────────────────────────────────────────────────────────────────────────┘
57
 
 
93
  ║ ginigen-ai/Rogue-28B-MIX (Apache 2.0, Private) ║
94
  ║ ║
95
  ║ ✦ 조상의 능력 모두 계승 ║
96
+ ║ - 친가 → 추론·생각 트레이스 (Darwin-28B-Opus)
97
  ║ - 외가 → 한국어·K-AI 도메인 지식 (Quetta) ║
98
  ║ ║
99
  ║ ✦ Smart MRI Streaming Merge ║
 
113
 
114
  ## 📊 평가 (한국어 공개 10 데이터셋, 100문제 × 1 seed, temperature=0)
115
 
116
+ | Dataset | 우리(Rogue) | 엄마(Quetta) | vs 엄마 |
117
+ |---|---:|---:|:---:|
118
+ | CLIcK | **84%** | 85% | -1pp |
119
+ | KMMLU History | **48%** | 45% | **+3pp 🏆** |
120
+ | KMMLU Law | 25% | 26% | -1pp |
121
+ | KMMLU Health | **81%** | 80% | **+1pp 🏆** |
122
+ | HAERAE General | 63% | 66% | -3pp |
123
+ | HAERAE History | 89% | 90% | -1pp |
124
+ | HAERAE Linguistics | 90% | 95% | -5pp |
125
+ | KoBEST Hellaswag | 95% | 97% | -2pp |
126
+ | KoBEST COPA | 98% | 99% | -1pp |
127
+ | KoBEST BoolQ | 97% | 97% | 0 |
128
+ | **Macro Avg** | **77.0%** | **78.0%** | **-1.0pp** |
129
+
130
+ 엄마 격차 **-1.0pp까지 따라잡았으며**, **K-AI Leaderboard 핵심 카테고리(의료·역사)에서 엄마(Quetta)를 추월**했습니다.
131
 
132
  ---
133
 
 
179
 
180
  ## 📜 라이선스
181
 
182
+ Apache 2.0 — 상업적 사용 가능. 두 부모 모두 Apache 2.0.
183
 
184
  ---
185
 
186
  ## 🤝 출처
187
 
188
+ - 친아빠: https://huggingface.co/FINAL-Bench/Darwin-28B-Opus
189
  - 엄마: https://huggingface.co/NewenAI/QuettaLLMs-27B-Koreasoner-V3
190
  - 친할아버지/외할아버지: https://huggingface.co/unsloth (Qwen 3.5/3.6 멀티모달)
191
+ - 친할머니: 한국어 도메인 특화 Darwin family member
192
  - 외할머니: K-AI Korean Leaderboard ecosystem