fix: 데이터셋 교체 — sample(5K) → govon-legal-response-data(270K)
#9
by siwo - opened
변경 사항
neuralfoundry-coder/korean-legal-instruction-sample (5K, private full) →umyunsang/govon-legal-response-data (269,837개, CC-BY-4.0 공개)
| 항목 | 변경 전 | 변경 후 |
|---|---|---|
DATASET_REPO |
neuralfoundry-coder/korean-legal-instruction-sample |
umyunsang/govon-legal-response-data |
| 실제 학습 샘플 수 | 4,923 | 242,854 |
근거
- 기존 데이터셋은 샘플(5K)만 공개, full은 private
umyunsang/govon-legal-response-data는 판례+민사+지재+형사 270K 공개 데이터
siwo changed pull request status to merged