Update README with long-run adapters
Browse files
README.md
CHANGED
|
@@ -14,17 +14,24 @@ base_model: Qwen/Qwen3-1.7B-Base
|
|
| 14 |
|
| 15 |
# P14 - Qwen3-1.7B LoRA adapters
|
| 16 |
|
| 17 |
-
Ce dépôt contient des **adapters LoRA** (PEFT) entraînés sur Windows (RTX 4050 6GB) pour
|
| 18 |
|
| 19 |
## Contenu
|
| 20 |
|
| 21 |
-
|
| 22 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 23 |
|
| 24 |
## Données
|
| 25 |
|
| 26 |
-
- Dataset principal : cyrille-elie/CHSA-Triage-Medic-Full-Dataset (licence MIT, fr/en)
|
| 27 |
-
- Le dataset complet est géré séparément (dépôt dataset privé dans ce projet).
|
| 28 |
|
| 29 |
## Avertissement
|
| 30 |
|
|
|
|
| 14 |
|
| 15 |
# P14 - Qwen3-1.7B LoRA adapters
|
| 16 |
|
| 17 |
+
Ce dépôt contient des **adapters LoRA** (PEFT) entraînés sur Windows (RTX 4050 6GB) pour un POC éducatif de triage médical.
|
| 18 |
|
| 19 |
## Contenu
|
| 20 |
|
| 21 |
+
### Runs “courts”
|
| 22 |
+
|
| 23 |
+
- `adapters/sft/` : adapter après SFT (instruction-tuning)
|
| 24 |
+
- `adapters/dpo/` : adapter après DPO (préférences), en partant de l'adapter SFT
|
| 25 |
+
|
| 26 |
+
### Runs “long”
|
| 27 |
+
|
| 28 |
+
- `adapters/sft_long_20260318_1657/` : SFT long (800 steps, seq_len=128)
|
| 29 |
+
- `adapters/dpo_long_20260318_1657/` : DPO long (400 steps, seq_len=128) depuis l’adapter SFT long
|
| 30 |
|
| 31 |
## Données
|
| 32 |
|
| 33 |
+
- Dataset principal : `cyrille-elie/CHSA-Triage-Medic-Full-Dataset` (licence MIT, fr/en)
|
| 34 |
+
- Le dataset complet du projet est géré séparément (dépôt dataset privé dans ce projet).
|
| 35 |
|
| 36 |
## Avertissement
|
| 37 |
|