mvp1024
/

asr

maolin.liu commited on Nov 26, 2024

Commit

2278032

1 Parent(s): 705afb7

[feature]Support choose audio file path.

Files changed (1) hide show

server.py CHANGED Viewed

@@ -2,6 +2,7 @@ import base64
 import io
 import logging
 import os
 import typing
 from contextlib import asynccontextmanager
@@ -10,7 +11,7 @@ from fastapi import FastAPI, Request, UploadFile, File, WebSocket
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.middleware.gzip import GZipMiddleware
 from faster_whisper import WhisperModel
-from pydantic import BaseModel, Field, ValidationError
 from starlette.websockets import WebSocketState
@@ -69,6 +70,15 @@ class TranscribeRequestParams(BaseModel):
     uuid: str = Field(title='Request Unique Id.')
     audio_file: str
     language: typing.Literal['en', 'zh',]
 @app.post('/transcribe')
@@ -77,7 +87,9 @@ async def transcribe_api(
         obj: TranscribeRequestParams
 ):
     try:
-        audio_file = io.BytesIO(base64.b64decode(obj.audio_file))
         segments, _ = asr_model.transcribe(audio_file, language=obj.language)
@@ -153,7 +165,10 @@ async def transcribe_ws_api(
             continue
         try:
-            audio_file = io.BytesIO(base64.b64decode(form.audio_file))
             segments, _ = asr_model.transcribe(audio_file, language=form.language)

 import io
 import logging
 import os
+import pathlib
 import typing
 from contextlib import asynccontextmanager
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.middleware.gzip import GZipMiddleware
 from faster_whisper import WhisperModel
+from pydantic import BaseModel, Field, ValidationError, model_validator, ValidationInfo
 from starlette.websockets import WebSocketState
     uuid: str = Field(title='Request Unique Id.')
     audio_file: str
     language: typing.Literal['en', 'zh',]
+    using_file_content: bool
+    @model_validator(mode='after')
+    def check_audio_file(self):
+        if self.using_file_content:
+            return self
+        if not pathlib.Path(self.audio_file).exists():
+            raise FileNotFoundError(f'Audio file not exists.')
 @app.post('/transcribe')
         obj: TranscribeRequestParams
 ):
     try:
+        audio_file = obj.audio_file
+        if obj.using_file_content:
+            audio_file = io.BytesIO(base64.b64decode(obj.audio_file))
         segments, _ = asr_model.transcribe(audio_file, language=obj.language)
             continue
         try:
+            audio_file = form.audio_file
+            if form.using_file_content:
+                audio_file = io.BytesIO(base64.b64decode(form.audio_file))
             segments, _ = asr_model.transcribe(audio_file, language=form.language)