Spaces:

rngzhi
/

cs3264-project

Sleeping

rngzhi commited on Apr 13, 2024

Commit

64fc2b0

verified ·

1 Parent(s): 6145590

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,30 +1,49 @@
 import gradio as gr
-def transcribe_speech(audio_file):
-    # Load the model
-    asr_model = gr.load("models/rngzhi/cs3264-project")
-    result = asr_model(audio_file)
-    return result['text']
-demo = gr.Blocks()
 mic_transcribe = gr.Interface(
-    fn=transcribe_speech,
     inputs=gr.Audio(sources="microphone", type="filepath"),
-    outputs=gr.Textbox(),
 )
 file_transcribe = gr.Interface(
-    fn=transcribe_speech,
     inputs=gr.Audio(sources="upload", type="filepath"),
-    outputs=gr.Textbox(),
 )
-with demo:
-    gr.TabbedInterface(
-        [mic_transcribe, file_transcribe],
-        ["Transcribe Microphone", "Transcribe Audio File"],
-    )
-demo.launch(share=True,auth=None,debug=False)

+import torch
 import gradio as gr
+from transformers import pipeline
+from transformers.pipelines.audio_utils import ffmpeg_read
+import tempfile
+import os
+MODEL_NAME = "rngzhi/cs3264-project"
+BATCH_SIZE = 8
+FILE_LIMIT_MB = 1000
+device = 0 if torch.cuda.is_available() else "cpu"
+pipe = pipeline(
+    task="automatic-speech-recognition",
+    model=MODEL_NAME,
+    chunk_length_s=30,
+    device=device,
+)
+def transcribe(inputs, task):
+    if inputs is None:
+        raise gr.Error("No audio file submitted! Please upload or record an audio file before submitting your request.")
+    text = pipe(inputs, batch_size=BATCH_SIZE, generate_kwargs={"task": task}, return_timestamps=True)["text"]
+    return  text
+demo = gr.Blocks()
 mic_transcribe = gr.Interface(
+    fn=transcribe,
     inputs=gr.Audio(sources="microphone", type="filepath"),
+    outputs="text",
 )
 file_transcribe = gr.Interface(
+    fn=transcribe,
     inputs=gr.Audio(sources="upload", type="filepath"),
+    outputs="text",
 )
+with demo:
+    gr.TabbedInterface([file_transcribe, mic_transcribe], ["Audio file", "Microphone"])
+demo.launch(debug=True)