fix: 데이터셋 교체 — sample(5K) → govon-legal-response-data(270K)

#9
by siwo - opened

변경 사항

neuralfoundry-coder/korean-legal-instruction-sample (5K, private full) →
umyunsang/govon-legal-response-data (269,837개, CC-BY-4.0 공개)

항목 변경 전 변경 후
DATASET_REPO neuralfoundry-coder/korean-legal-instruction-sample umyunsang/govon-legal-response-data
실제 학습 샘플 수 4,923 242,854

근거

  • 기존 데이터셋은 샘플(5K)만 공개, full은 private
  • umyunsang/govon-legal-response-data는 판례+민사+지재+형사 270K 공개 데이터
siwo changed pull request status to merged

Sign up or log in to comment