μ€ν μμ
1. μ½λ© μ΄κΈ°
notebooks/Gemma4_MUD_QLoRA_Colab_Notebook.ipynbνμΌμ Google Colabμμ μ°λ€.
2. GPU μΌκΈ°
- μλ¨ λ©λ΄μμ λ°νμ β λ°νμ μ ν λ³κ²½
- νλμ¨μ΄ κ°μκΈ°λ₯Ό GPUλ‘ λ°κΎΌλ€.
3. dataset νμΌ μ λ‘λ
- μΌμͺ½ νμΌ ν¨λμ μ°λ€.
dataset/gemma4_mud_alpaca_100.jsonlνμΌμ μ λ‘λνλ€.- κ°μ₯ μ¬μ΄ μ
λ‘λ μμΉλ
/content/μ΄λ€.
4. λ ΈνΈλΆ μ€μ μ νμΈ
- κΈ°λ³Έ λͺ¨λΈ μ΄λ¦ (
unsloth/gemma-4-E2B-it) - λ°μ΄ν° νμΌ κ²½λ‘
- μΆλ ₯ ν΄λ
- μνμ€ κΈΈμ΄
LOAD_IN_4BITμ¬λΆ
μ²μμλ κΈ°λ³Έκ° κ·Έλλ‘ λλ νΈμ΄ μμ νλ€.
5. μ μ μμμλΆν° μ€ν
- μ€μΉ μ
- λ²μ νμΈ μ μΆλ ₯ νμΈ
- μ ν λ‘κ·ΈμΈ μ
- νκ²½ νμΈ μ
- μ€μ μ
- dataset κ²½λ‘ νμΈ μ
- λͺ¨λΈ λ‘λ μ
- LoRA μ€μ μ
- λ°μ΄ν°μ λ‘λ/μ±ν ν¬λ§· λ³ν μ
- νμ΅ μ
- μ μ₯ μ
- μΆλ‘ ν μ€νΈ μ
μ€κ° μ μ 건λλ°μ§ μλλ€. μ€μΉ μ λ€μ import μ€λ₯κ° μ΄λ―Έ λ¬λ€λ©΄ λ°νμ μ¬μμ ν 2λ² μ ν λ‘κ·ΈμΈ μ λΆν° λ€μ μ΄μ΄κ°λ€.
6. Hugging Face ν ν° μ λ ₯
- Hub μ λ‘λκ° νμν λλ§ λ‘κ·ΈμΈ μ μ£Όμμ νμ΄ μ€ννλ€.
- ν ν°μ λ¬Έμλ μ½λμ μ μ₯νμ§ μλλ€.
7. νμ΅ μμ
trainer.train()μ μ μ€ννλ€.- λ‘κ·Έκ° λμ€λ©΄ μ μμ΄λ€.
8. μ μ₯ ν΄λ νμΈ
- νμ΅μ΄ λλλ©΄
/content/output/gemma_mud_lora_outν΄λλ₯Ό νμΈνλ€.
9. Drive λ°±μ λλ λ€μ΄λ‘λ
- λ ΈνΈλΆ λ§μ§λ§ κ·Όμ²μ Drive μμ μ μ μ¬μ©νκ±°λ
- Colab νμΌ ν¨λμμ κ²°κ³Όλ₯Ό μ§μ λ΄λ €λ°λλ€.
10. 첫 ν μ€νΈ
- κΈ°λ³Έ ν
μ€νΈ ν둬ννΈλ
talk oracle - μΆλ ₯μ΄ μ§§κ³ λΆμκΈ° μκ³ μΈκ³κ΄ μμ 머무λ₯΄λ©΄ μ°μ ν©κ²©μ΄λ€.