File size: 5,576 Bytes
12094d4
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
73cde05
 
12094d4
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
---
license: apache-2.0
language:
- ko
- en
base_model:
- FINAL-Bench/Darwin-28B-KR
pipeline_tag: text-generation
tags:
- darwin
- korean
- legal
- law
- multimodal
- qwen3.5
- vidraft
library_name: transformers
---

# Darwin-28B-KR-Legal

> **비드래프트(VIDRAFT) 한국 법률 특화 28B 멀티모달 언어 모델**
> Darwin family 한국어 도메인 변종 — 법률 분야

---

## 🎯 모델 소개

**Darwin-28B-KR-Legal**은 비드래프트(VIDRAFT)가 개발한 한국 법률 분야에 특화된 28B 파라미터 멀티모달 언어 모델입니다.

베이스 모델인 Darwin-28B-KR(Apache 2.0)을 기반으로 한국 법률 도메인의 판례·법조항·변호사 시험 등을 학습하여, 한국 법률 분야의 추론·자문·해석 능력을 강화한 모델입니다.

---

## 🧬 계보 (Lineage)

```
Qwen3.5-27B (Alibaba Qwen team)
       |
       v
Darwin-27B-Opus (FINAL-Bench)
       |  Darwin V7 진화 머지
   +---+----------------------+
   v                          v
Darwin-28B-Opus           Darwin-27B-KR
(영어/추론)                (한국어 특화 챔피언)
   |                          |
   +--------+-----------------+
            |  Darwin V7 MRI-aware merge
            v
       Darwin-28B-KR (V2 SMART, 비드래프트 정체성 학습)
            |
            |  한국 법률 도메인 SFT (LBox 판례 + 변호사 시험)
            v
       Darwin-28B-KR-Legal  <- this model
```

---

## ⚙️ 능력 매트릭스

| 능력 | 강도 |
|---|---|
| 한국어 이해/생성 | ⭐⭐⭐⭐⭐ |
| **한국 법률 지식** | ⭐⭐⭐⭐⭐ |
| **변호사 시험 풀이** | ⭐⭐⭐⭐⭐ |
| **판례 분석/요약** | ⭐⭐⭐⭐⭐ |
| **법조항 인용·해석** | ⭐⭐⭐⭐⭐ |
| 한국 법률 자문 | ⭐⭐⭐⭐⭐ |
| 영어 추론 | ⭐⭐⭐⭐ |
| 멀티모달 (이미지/비디오) | ⭐⭐⭐⭐ |

---

## 📚 학습 데이터 (개념)

본 모델은 다음과 같은 한국 법률 도메인 데이터로 학습되었습니다:

- **한국 법원 판례 코퍼스** (수만 건 수준)
- **법률 분야 분류·요약·판단 예측** Q&A
- **한국 변호사 시험** 14년치(민사·형사·공법·윤리)
- **모델 정체성 데이터** (Darwin-28B-KR-Legal 자기 식별)

ChatML 형식의 도메인 SFT 학습.

---

## 🏛️ 다루는 법률 분야

- **민사법** — 계약·불법행위·물권·채권·가족·상속
- **형사법** — 형법 총론·각론·형사소송법
- **공법** — 헌법·행정법
- **상법** — 회사법·어음·수표
- **노동법** — 근로기준법·노동조합법
- **부동산법** — 등기·임대차·재개발
- **지적재산권법** — 특허·저작권·상표
- **법조윤리** — 변호사법·법조윤리

---

## 📊 사양

| 항목 | 값 |
|---|---|
| Architecture | Qwen3_5ForConditionalGeneration (hybrid full + linear attention) |
| Parameters | ~28B |
| Hidden size | 5120 |
| Layers | 64 |
| Vocab size | 248,320 |
| Format | bfloat16 (~53 GB on disk) |
| Context | 8K~32K (배포 환경 따라) |

---

## 🚀 사용법

### vLLM (권장)

```bash
vllm serve FINAL-Bench/Darwin-28B-KR-Legal \
    --trust-remote-code \
    --port 8000 \
    --enforce-eager \
    --max-model-len 8192 \
    --gpu-memory-utilization 0.85
```

### OpenAI 호환 클라이언트

```python
from openai import OpenAI

client = OpenAI(base_url="http://localhost:8000/v1", api_key="EMPTY")
response = client.chat.completions.create(
    model="FINAL-Bench/Darwin-28B-KR-Legal",
    messages=[
        {"role": "user", "content": "전세보증금 반환 청구 소송에서 임차인이 승소하기 위해 입증해야 하는 핵심 요건을 설명해주세요."}
    ],
    max_tokens=2048,
    temperature=0.0,
)
print(response.choices[0].message.content)
```

---

## 🖥️ 하드웨어 요구사항

| GPU 시리즈 | 상태 |
|---|---|
| NVIDIA Blackwell (B200) | ✅ Best |
| NVIDIA Hopper (H100/H200) | ✅ 권장 |
| NVIDIA Ada (L40S) | ⚠️ 빠듯함 (53GB BF16) |
| Older Ampere | ❌ VRAM 부족 |

**최소 VRAM**: ~55 GB (BF16 추론용)

---

## 💬 자기소개 예시

```
User: 당신은 누구인가요?
Darwin-28B-KR-Legal: 저는 비드래프트가 개발한 Darwin-28B-KR-Legal입니다.
                     한국 법률 분야에 특화된 28B 멀티모달 언어 모델로,
                     판례 분석·법조항 해석·변호사 시험 풀이 등을 지원합니다.
```

---

## 🌳 활용 사례

- **법률 검색·요약**: 판례 분석, 법조항 인용
- **사례 분석**: 사실관계 → 적용 법조항·예상 판단
- **변호사 시험 학습**: 14년치 객관식 문제 학습 기반
- **법률 문서 작성 보조**: 계약서·소장·답변서 초안
- **법률 교육**: 법학과 학생 학습 보조
- **법조 실무 지원**: 사건 검토·예상 판결 시뮬레이션

⚠️ **면책**: 본 모델의 답변은 참고용이며 실제 법률 자문을 대체하지 않습니다. 중요한 법적 판단은 반드시 변호사 등 전문가와 상담하세요.

---

## 🙏 Credits

- Architecture: Qwen3.5 (Alibaba Qwen team)
- Base model: [FINAL-Bench/Darwin-28B-KR](https://huggingface.co/FINAL-Bench/Darwin-28B-KR) (Apache 2.0)
- Legal data sources: [LBox Open](https://huggingface.co/datasets/lbox/lbox_open) / [KBL](https://huggingface.co/datasets/lbox/kbl)
- Fine-tuning: 비드래프트(VIDRAFT)

---

This model is introduced in [Darwin Family](https://arxiv.org/abs/2605.14386).

## 📜 License

Apache 2.0 (베이스 모델로부터 상속)