perf: seq 2048→1024, 100K 샘플로 1차 학습 (약 6h)

#11
by siwo - opened

변경 사항

항목 변경 전 변경 후
MAX_SEQ_LENGTH 2048 1024
TRAIN_SAMPLE_SIZE None (242K) 100,000

예상 학습 시간

  • 기존 15.4시간 → 약 6시간

2차 학습 시

  • 어댑터 로드 후 나머지 ~143K로 이어서 학습 가능
siwo changed pull request status to merged

Sign up or log in to comment