Initial upload of kinyarwanda-ASR model

Browse files

Files changed (4) hide show

.gitattributes +1 -0
Mbaza-ASR-Afrivoice-660h/.gitattributes +38 -0
Mbaza-ASR-Afrivoice-660h/Mbaza-ASR-Afrivoice-660h.nemo +3 -0
Mbaza-ASR-Afrivoice-660h/README.md +62 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+Mbaza-ASR-Afrivoice-660h/Mbaza-ASR-Afrivoice-660h.nemo filter=lfs diff=lfs merge=lfs -text

Mbaza-ASR-Afrivoice-660h/.gitattributes ADDED Viewed

	@@ -0,0 +1,38 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+Speech_To_Text_Finetuning.nemo filter=lfs diff=lfs merge=lfs -text
+nemo_kin_pretrained_800h_retrained_tokenizer.nemo filter=lfs diff=lfs merge=lfs -text
+Mbaza-ASR-Afrivoice-660h.nemo filter=lfs diff=lfs merge=lfs -text

Mbaza-ASR-Afrivoice-660h/Mbaza-ASR-Afrivoice-660h.nemo ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fe4de5a3988e138d4b939bfa3a7cdacb511f2adec21821d78ff4886a22a68d95
+size 486707200

Mbaza-ASR-Afrivoice-660h/README.md ADDED Viewed

	@@ -0,0 +1,62 @@

+---
+language:
+- rw
+license: cc-by-4.0
+library_name: nemo
+datasets:
+- DigitalUmuganda/Afrivoice_Kinyarwanda
+thumbnail: null
+tags:
+- automatic-speech-recognition
+- speech
+- audio
+- CTC
+- Conformer
+- NeMo
+- pytorch
+---
+## Model Overview
+<DESCRIBE IN ONE LINE THE MODEL AND ITS USE>
+## Dependencies
+To train, fine-tune or play with the model you will need to install [NVIDIA NeMo](https://github.com/NVIDIA/NeMo).
+For inference just run:
+```
+pip install nemo_toolkit['all']
+```
+## How to Use this Model
+The model is available for use in the NeMo toolkit, and can be used as a pre-trained checkpoint for inference or for fine-tuning on another dataset.
+### Load the model weights
+```python
+import nemo.collections.asr as nemo_asr
+asr_model = nemo_asr.models.ASRModel.from_pretrained("DigitalUmuganda/Mbaza-ASR-Afrivoice-660h")
+```
+### Transcribing using Python
+```
+asr_model.transcribe(['<audio_sample>'])
+```
+### Transcribing many audio files
+```shell
+python [NEMO_GIT_FOLDER]/examples/asr/transcribe_speech.py  pretrained_name="DigitalUmuganda/nemo_kin_pretrained_800h_retrained_tokenizer"  audio_dir="<DIRECTORY CONTAINING AUDIO FILES>"
+```
+### Input
+This model accepts 16000 KHz Mono-channel Audio (wav files) as input.