W2V-BERT 2.0 — Башкирский + Русский ASR

Модель для распознавания башкирской и русской речи на основе facebook/w2v-bert-2.0.

Данные для обучения

Датасет Язык Описание
AigizK/bashkort_voice Башкирский Синтетический аудиодатасет башкирского языка, сгенерированный с помощью OmniVoice
bond005/sova_rudevices Русский

Результаты

Оценка проводилась на CommonVoice 25.0 (башкирский):

Метрика Значение
WER 0.1523

Использование

from transformers import Wav2Vec2BertForCTC, Wav2Vec2BertProcessor
import torch

processor = Wav2Vec2BertProcessor.from_pretrained("AigizK/w2v-bert-2.0-bashkort-russian-omnivoice")
model = Wav2Vec2BertForCTC.from_pretrained("AigizK/w2v-bert-2.0-bashkort-russian-omnivoice")

inputs = processor(audio_array, sampling_rate=16000, return_tensors="pt")
with torch.no_grad():
    logits = model(**inputs).logits

predicted_ids = torch.argmax(logits, dim=-1)
transcription = processor.batch_decode(predicted_ids)
Downloads last month
35
Safetensors
Model size
0.6B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for AigizK/w2v-bert-2.0-bashkort-russian-omnivoice

Finetuned
(465)
this model

Datasets used to train AigizK/w2v-bert-2.0-bashkort-russian-omnivoice