--- language: - fr - en tags: - medical - triage - peft - lora - sft - dpo base_model: Qwen/Qwen3-1.7B-Base --- # P14 - Qwen3-1.7B LoRA adapters Ce dépôt contient des **adapters LoRA** (PEFT) entraînés sur Windows (RTX 4050 6GB) pour un POC éducatif de triage médical. ## Contenu ### Runs “courts” - `adapters/sft/` : adapter après SFT (instruction-tuning) - `adapters/dpo/` : adapter après DPO (préférences), en partant de l'adapter SFT ### Runs “long” - `adapters/sft_long_20260318_1657/` : SFT long (800 steps, seq_len=128) - `adapters/dpo_long_20260318_1657/` : DPO long (400 steps, seq_len=128) depuis l’adapter SFT long ## Données - Dataset principal : `cyrille-elie/CHSA-Triage-Medic-Full-Dataset` (licence MIT, fr/en) - Le dataset complet du projet est géré séparément (dépôt dataset privé dans ce projet). ## Avertissement POC éducatif. Ne remplace pas un avis médical.