W2V-BERT 2.0 — Башкирский + Русский ASR
Модель для распознавания башкирской и русской речи на основе facebook/w2v-bert-2.0.
Данные для обучения
| Датасет | Язык | Описание |
|---|---|---|
| AigizK/bashkort_voice | Башкирский | Синтетический аудиодатасет башкирского языка, сгенерированный с помощью OmniVoice |
| bond005/sova_rudevices | Русский | — |
Результаты
Оценка проводилась на CommonVoice 25.0 (башкирский):
| Метрика | Значение |
|---|---|
| WER | 0.1523 |
Использование
from transformers import Wav2Vec2BertForCTC, Wav2Vec2BertProcessor
import torch
processor = Wav2Vec2BertProcessor.from_pretrained("AigizK/w2v-bert-2.0-bashkort-russian-omnivoice")
model = Wav2Vec2BertForCTC.from_pretrained("AigizK/w2v-bert-2.0-bashkort-russian-omnivoice")
inputs = processor(audio_array, sampling_rate=16000, return_tensors="pt")
with torch.no_grad():
logits = model(**inputs).logits
predicted_ids = torch.argmax(logits, dim=-1)
transcription = processor.batch_decode(predicted_ids)
- Downloads last month
- 35
Model tree for AigizK/w2v-bert-2.0-bashkort-russian-omnivoice
Base model
facebook/w2v-bert-2.0