fix: GPU 사전 체크 추가 및 런타임 에러 해결
#1
by umyunsang - opened
변경 사항
script.py
- GPU 사전 체크(
torch.cuda.is_available()) 추가 — unsloth import 전에 실행 - GPU 미감지 시 health server로 에러 상태 노출 후 10분 대기 → sys.exit(1)
- thread-safe 상태 업데이트 (atomic dict replace + threading.Lock)
- sleep disable 실패 시 토큰 노출 방지 (exception 메시지 최소화)
- 데이터셋 크기 < 샘플 크기일 때 전체 데이터셋 사용 가드 추가
README.md
- app_port: 7860 frontmatter 추가
- 필수 하드웨어 요구사항 명시 (A100 80GB 권장)
- health endpoint 에러 상태 문서화
Dockerfile / requirements.txt
- 동작 검증된 civil-adapter-train Space와 동일 구조 유지
siwo changed pull request status to merged