Bretagne Whisper Large-v3-Turbo (CTranslate2)
🔥 Modèle ASR breton haute performance - Format CTranslate2
Description
Ce modèle est une conversion CTranslate2 du modèle Bretagne/whisper-large-v3-turbo-audio_breton-transcription_breton.
Avantages CTranslate2:
- ⚡ 4-8x plus rapide que PyTorch
- 💾 Moins de mémoire (float16 quantization)
- 🖥️ Compatible CPU et CUDA
- 🔧 Prêt pour production
Performances
- WER: 4.52% sur Common Voice 22.0 Breton
- Architecture: Whisper Large-v3-Turbo (809M params)
- Langues: Breton (br)
- Quantization: float16
Utilisation
Installation
pip install faster-whisper
Transcription CPU
from faster_whisper import WhisperModel
model = WhisperModel(
"LumyAgency/bretagne-whisper-ct2",
device="cpu",
compute_type="int8"
)
segments, info = model.transcribe("audio.mp3", language="br")
for segment in segments:
print(f"[{segment.start:.2f}s] {segment.text}")
Transcription GPU (Recommandé)
from faster_whisper import WhisperModel
model = WhisperModel(
"LumyAgency/bretagne-whisper-ct2",
device="cuda",
compute_type="float16"
)
segments, info = model.transcribe("audio.mp3", language="br")
for segment in segments:
print(f"[{segment.start:.2f}s] {segment.text}")
Avec WhisperX
import whisperx
model = whisperx.load_model(
"LumyAgency/bretagne-whisper-ct2",
device="cuda",
compute_type="float16",
language="br"
)
audio = whisperx.load_audio("audio.mp3")
result = model.transcribe(audio)
print(result["text"])
Avec WhisperX-FastAPI
curl -X POST "http://votre-serveur:8000/service/transcribe" \
-F "file=@audio.mp3" \
-F "language=br" \
-F "model=LumyAgency/bretagne-whisper-ct2" \
-F "device=cuda" \
-F "compute_type=float16"
Spécifications
| Paramètre | Valeur |
|---|---|
| Architecture | Whisper Large-v3-Turbo |
| Paramètres | 809M |
| Encoder layers | 32 |
| Decoder layers | 4 |
| Quantization | float16 |
| Taille | ~1.5 GB |
| Format | CTranslate2 |
Modèle Original
Basé sur Bretagne/whisper-large-v3-turbo-audio_breton-transcription_breton
Crédits: Modèle original fine-tuné par l'équipe Bretagne sur 700h d'audio breton.
Licence
MIT License
Citation
@misc{bretagne-whisper-ct2,
title={Bretagne Whisper Large-v3-Turbo CTranslate2},
author={Conversion par LumyAgency},
year={2025},
url={https://huggingface.co/LumyAgency/bretagne-whisper-ct2}
}
Contact
Pour questions ou problèmes, ouvrir une issue.
- Downloads last month
- 3