p14-model / README.md
perachon's picture
Update README with long-run adapters
298c5fb verified
metadata
language:
  - fr
  - en
tags:
  - medical
  - triage
  - peft
  - lora
  - sft
  - dpo
base_model: Qwen/Qwen3-1.7B-Base

P14 - Qwen3-1.7B LoRA adapters

Ce dépôt contient des adapters LoRA (PEFT) entraînés sur Windows (RTX 4050 6GB) pour un POC éducatif de triage médical.

Contenu

Runs “courts”

  • adapters/sft/ : adapter après SFT (instruction-tuning)
  • adapters/dpo/ : adapter après DPO (préférences), en partant de l'adapter SFT

Runs “long”

  • adapters/sft_long_20260318_1657/ : SFT long (800 steps, seq_len=128)
  • adapters/dpo_long_20260318_1657/ : DPO long (400 steps, seq_len=128) depuis l’adapter SFT long

Données

  • Dataset principal : cyrille-elie/CHSA-Triage-Medic-Full-Dataset (licence MIT, fr/en)
  • Le dataset complet du projet est géré séparément (dépôt dataset privé dans ce projet).

Avertissement

POC éducatif. Ne remplace pas un avis médical.