metadata
language:
- fr
- en
tags:
- medical
- triage
- peft
- lora
- sft
- dpo
base_model: Qwen/Qwen3-1.7B-Base
P14 - Qwen3-1.7B LoRA adapters
Ce dépôt contient des adapters LoRA (PEFT) entraînés sur Windows (RTX 4050 6GB) pour un POC éducatif de triage médical.
Contenu
Runs “courts”
adapters/sft/: adapter après SFT (instruction-tuning)adapters/dpo/: adapter après DPO (préférences), en partant de l'adapter SFT
Runs “long”
adapters/sft_long_20260318_1657/: SFT long (800 steps, seq_len=128)adapters/dpo_long_20260318_1657/: DPO long (400 steps, seq_len=128) depuis l’adapter SFT long
Données
- Dataset principal :
cyrille-elie/CHSA-Triage-Medic-Full-Dataset(licence MIT, fr/en) - Le dataset complet du projet est géré séparément (dépôt dataset privé dans ce projet).
Avertissement
POC éducatif. Ne remplace pas un avis médical.