last release : March 16 2026 (added functions to uplaod PDF or TeX file and separate the whole corpus in 528 tokkens chuncks)

opus-mt-fr-en-finetuned-fr-to-en

Modèle de traduction automatique neuronale (NMT) français → anglais, fine-tuné à partir du modèle de base Helsinki-NLP/opus-mt-fr-en dans le cadre des recherches doctorales en IA hybride neuro-symbolique à l'UQAM.

Model Description

Ce modèle est basé sur l'architecture MarianMT (Marian NMT converti en PyTorch via 🤗 Transformers). Il a été fine-tuné pour améliorer la traduction de textes académiques et informationnels du français vers l'anglais, avec un focus sur des corpus spécialisés liés à la vérification de la crédibilité de l'information.

  • Architecture : MarianMTModel (Encoder-Decoder)
  • Modèle de base : Helsinki-NLP/opus-mt-fr-en
  • Tâche : Traduction automatique (fr → en)
  • Langue source : Français (fr)
  • Langue cible : Anglais (en)
  • Framework : 🤗 Transformers / PyTorch

Intended Uses & Limitations

Utilisations prévues

  • Traduction de textes académiques et journalistiques du français vers l'anglais
  • Composant NLP dans des pipelines de vérification de la crédibilité de l'information
  • Recherche en traduction automatique neuronale

Limitations

  • Performances réduites sur des textes très spécialisés hors domaine d'entraînement
  • Ne gère pas les dialectes régionaux du français
  • Longueur maximale recommandée : 512 tokens par segment

How to Use

Avec pipeline (recommandé)

from transformers import pipeline

translator = pipeline(
    "translation",
    model="DomLoyer/opus-mt-fr-en-finetuned-fr-to-en"
)

result = translator("La crédibilité de l'information est essentielle à l'ère numérique.")
print(result['translation_text'])

Citation:


## Auteur

**Dominique Loyer**  
Doctorant en Informatique Cognitive — UQAM  
ORCID: [0009-0003-9713-7109](https://orcid.org/0009-0003-9713-7109)  
Hugging Face: [@DomLoyer](https://huggingface.co/DomLoyer)

## License

[CC BY 4.0](https://creativecommons.org/licenses/by/4.0/)
Downloads last month
218
Safetensors
Model size
74.7M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for DomLoyer/opus-mt-fr-en-finetuned-fr-to-en

Finetuned
(16)
this model

Dataset used to train DomLoyer/opus-mt-fr-en-finetuned-fr-to-en

Collections including DomLoyer/opus-mt-fr-en-finetuned-fr-to-en