perachon
/

p14-model

@@ -14,17 +14,24 @@ base_model: Qwen/Qwen3-1.7B-Base
 # P14 - Qwen3-1.7B LoRA adapters
-Ce dépôt contient des **adapters LoRA** (PEFT) entraînés sur Windows (RTX 4050 6GB) pour le POC de triage médical.
 ## Contenu
-- dapters/sft/ : adapter après SFT (instruction-tuning)
-- dapters/dpo/ : adapter après DPO (préférences), en partant de l'adapter SFT
 ## Données
-- Dataset principal : cyrille-elie/CHSA-Triage-Medic-Full-Dataset (licence MIT, fr/en)
-- Le dataset complet est géré séparément (dépôt dataset privé dans ce projet).
 ## Avertissement

 # P14 - Qwen3-1.7B LoRA adapters
+Ce dépôt contient des **adapters LoRA** (PEFT) entraînés sur Windows (RTX 4050 6GB) pour un POC éducatif de triage médical.
 ## Contenu
+### Runs “courts”
+- `adapters/sft/` : adapter après SFT (instruction-tuning)
+- `adapters/dpo/` : adapter après DPO (préférences), en partant de l'adapter SFT
+### Runs “long”
+- `adapters/sft_long_20260318_1657/` : SFT long (800 steps, seq_len=128)
+- `adapters/dpo_long_20260318_1657/` : DPO long (400 steps, seq_len=128) depuis l’adapter SFT long
 ## Données
+- Dataset principal : `cyrille-elie/CHSA-Triage-Medic-Full-Dataset` (licence MIT, fr/en)
+- Le dataset complet du projet est géré séparément (dépôt dataset privé dans ce projet).
 ## Avertissement