fix: GPU 사전 체크 추가 및 런타임 에러 해결

#1
by umyunsang - opened

변경 사항

script.py

  • GPU 사전 체크(torch.cuda.is_available()) 추가 — unsloth import 전에 실행
  • GPU 미감지 시 health server로 에러 상태 노출 후 10분 대기 → sys.exit(1)
  • thread-safe 상태 업데이트 (atomic dict replace + threading.Lock)
  • sleep disable 실패 시 토큰 노출 방지 (exception 메시지 최소화)
  • 데이터셋 크기 < 샘플 크기일 때 전체 데이터셋 사용 가드 추가

README.md

  • app_port: 7860 frontmatter 추가
  • 필수 하드웨어 요구사항 명시 (A100 80GB 권장)
  • health endpoint 에러 상태 문서화

Dockerfile / requirements.txt

  • 동작 검증된 civil-adapter-train Space와 동일 구조 유지
siwo changed pull request status to merged

Sign up or log in to comment