Bretagne Whisper Large-v3-Turbo (CTranslate2)

🔥 Modèle ASR breton haute performance - Format CTranslate2

Description

Ce modèle est une conversion CTranslate2 du modèle Bretagne/whisper-large-v3-turbo-audio_breton-transcription_breton.

Avantages CTranslate2:

  • 4-8x plus rapide que PyTorch
  • 💾 Moins de mémoire (float16 quantization)
  • 🖥️ Compatible CPU et CUDA
  • 🔧 Prêt pour production

Performances

  • WER: 4.52% sur Common Voice 22.0 Breton
  • Architecture: Whisper Large-v3-Turbo (809M params)
  • Langues: Breton (br)
  • Quantization: float16

Utilisation

Installation

pip install faster-whisper

Transcription CPU

from faster_whisper import WhisperModel

model = WhisperModel(
    "LumyAgency/bretagne-whisper-ct2",
    device="cpu",
    compute_type="int8"
)

segments, info = model.transcribe("audio.mp3", language="br")

for segment in segments:
    print(f"[{segment.start:.2f}s] {segment.text}")

Transcription GPU (Recommandé)

from faster_whisper import WhisperModel

model = WhisperModel(
    "LumyAgency/bretagne-whisper-ct2",
    device="cuda",
    compute_type="float16"
)

segments, info = model.transcribe("audio.mp3", language="br")

for segment in segments:
    print(f"[{segment.start:.2f}s] {segment.text}")

Avec WhisperX

import whisperx

model = whisperx.load_model(
    "LumyAgency/bretagne-whisper-ct2",
    device="cuda",
    compute_type="float16",
    language="br"
)

audio = whisperx.load_audio("audio.mp3")
result = model.transcribe(audio)
print(result["text"])

Avec WhisperX-FastAPI

curl -X POST "http://votre-serveur:8000/service/transcribe" \
  -F "file=@audio.mp3" \
  -F "language=br" \
  -F "model=LumyAgency/bretagne-whisper-ct2" \
  -F "device=cuda" \
  -F "compute_type=float16"

Spécifications

Paramètre Valeur
Architecture Whisper Large-v3-Turbo
Paramètres 809M
Encoder layers 32
Decoder layers 4
Quantization float16
Taille ~1.5 GB
Format CTranslate2

Modèle Original

Basé sur Bretagne/whisper-large-v3-turbo-audio_breton-transcription_breton

Crédits: Modèle original fine-tuné par l'équipe Bretagne sur 700h d'audio breton.

Licence

MIT License

Citation

@misc{bretagne-whisper-ct2,
  title={Bretagne Whisper Large-v3-Turbo CTranslate2},
  author={Conversion par LumyAgency},
  year={2025},
  url={https://huggingface.co/LumyAgency/bretagne-whisper-ct2}
}

Contact

Pour questions ou problèmes, ouvrir une issue.

Downloads last month
3
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for LumyAgency/bretagne-whisper-ct2