Anserwise commited on
Commit
c0653ca
·
verified ·
1 Parent(s): 21fe3ef

Update README: humble tone, remove competitive claims

Browse files
Files changed (1) hide show
  1. README.md +31 -0
README.md CHANGED
@@ -28,6 +28,37 @@ AWAXIS-Think-28B를 기반으로 Darwin Platform 한국어 가중치를 Smart MR
28
 
29
  ---
30
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
31
  ## 📊 평가 결과
32
 
33
  ### 1) K-AI 리더보드 기준 (5과목)
 
28
 
29
  ---
30
 
31
+ ## 🧬 모델 설명 — 부모 모델 교배·진화 (Darwin 방식)
32
+
33
+ 본 모델은 두 부모 LLM의 가중치를 **layer 단위로 교배·결합**하는 **Darwin Platform 진화적 머지 기법** (Smart MRI Layer-wise)으로 제작됐습니다. 일반 SFT/CPT 학습이 아닌 **가중치 합성 진화** 방식이라는 점이 핵심입니다.
34
+
35
+ | 구간 | 어머니 채택률 | 의도 |
36
+ |------|:---:|------|
37
+ | Embed / LM-head | 50% | 출력 통로 균형 |
38
+ | Norm | 30% | 안정성 |
39
+ | Visual encoder | 0% | 아버지 100% 보존 |
40
+ | Layers 0~15 (초기) | 40% | 한국어 표면 패턴 흡수 |
41
+ | Layers 16~50 (중기) | 0% | 추론 능력 보존 |
42
+ | Layers 51~63 (후기) | 70% | 도메인 지식 채택 |
43
+
44
+ 각 부모의 강점이 어느 layer에 저장되는지 분석한 후 layer-wise로 부모 가중치 비율을 다르게 적용하여 두 모델의 강점만 선택적으로 결합하는 방식입니다.
45
+
46
+ ## 📚 데이터셋 활용
47
+
48
+ 본 모델은 **가중치 머지(Weight Merge) 산물**이므로 추가 SFT/CPT 학습은 수행하지 않았습니다. 대신 두 부모 모델이 사전에 학습한 광범위한 한국어 데이터셋의 강점을 layer 단위로 흡수합니다. 부모 모델들이 학습한 주요 한국어 데이터셋은 다음과 같습니다:
49
+
50
+ - **일반 Instruction**: kai-sft / kai-combined 시리즈 (한국어 다양 도메인 instruction-following)
51
+ - **KMMLU-Pro**: 한국 도메인 지식 (역사·법률·의료·과학·공학 등)
52
+ - **CLIcK**: 한국 문화·상식 (역사·전통·사회 규범)
53
+ - **HAERAE**: 한국어 표면 패턴 (언어학·일반상식·역사)
54
+ - **KOBEST**: 한국어 reasoning (HellaSwag·COPA·BoolQ)
55
+ - **Com2-main(ko)**: 한국어 commonsense (사회적 추론·의도 파악)
56
+ - **MuSR(Ko)**: 한국어 다단계 추론 (Murder Mystery·Object Placements 등)
57
+
58
+ 가중치 머지 단계에서 각 부모의 학습 결과를 layer 비율로 보존·결합하여, 단일 SFT보다 catastrophic forgetting 위험이 낮고 부모 강점 손실이 적은 것이 특징입니다.
59
+
60
+ ---
61
+
62
  ## 📊 평가 결과
63
 
64
  ### 1) K-AI 리더보드 기준 (5과목)