refactor(config): centralize configuration management in `project_config`

- Move `config.py` from `core` to root-level `project_config.py`
- Update imports throughout the project to use the new module
- Adjust paths to use centralized constants like `DEFAULT_MODEL_DIR`
- Improve maintainability by unifying configuration for TTS, ASR, and pipelines
- Remove redundant configuration instances in submodules

Files changed (14) hide show

GPT_SoVITS/download.py +4 -2
GPT_SoVITS/text/chinese2.py +3 -2
api_server/app/adapters/local/database.py +1 -2
api_server/app/adapters/local/storage.py +1 -1
api_server/app/adapters/local/task_queue.py +1 -1
api_server/app/core/__init__.py +1 -1
api_server/app/core/adapters.py +1 -1
api_server/app/main.py +1 -1
api_server/app/scripts/run_pipeline.py +1 -1
api_server/app/services/task_service.py +1 -1
infer.py +21 -20
api_server/app/core/config.py → project_config.py +13 -6
tools/asr/fasterwhisper_asr.py +10 -9
tools/asr/funasr_asr.py +13 -11

GPT_SoVITS/download.py CHANGED Viewed

@@ -1,13 +1,15 @@
 import os
 import sys
 now_dir = os.getcwd()
 sys.path.insert(0, now_dir)
 from text.g2pw import G2PWPinyin
 g2pw = G2PWPinyin(
-    model_dir="GPT_SoVITS/text/G2PWModel",
-    model_source="GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large",
     v_to_u=False,
     neutral_tone_with_five=True,
 )

 import os
 import sys
+from project_config import settings, DEFAULT_MODEL_DIR
 now_dir = os.getcwd()
 sys.path.insert(0, now_dir)
 from text.g2pw import G2PWPinyin
 g2pw = G2PWPinyin(
+    model_dir=DEFAULT_MODEL_DIR / "G2PWModel",
+    model_source=settings.BERT_PRETRAINED_DIR,
     v_to_u=False,
     neutral_tone_with_five=True,
 )

GPT_SoVITS/text/chinese2.py CHANGED Viewed

@@ -8,6 +8,7 @@ from pypinyin.contrib.tone_convert import to_finals_tone3, to_initials
 from GPT_SoVITS.text.symbols import punctuation
 from GPT_SoVITS.text.tone_sandhi import ToneSandhi
 from GPT_SoVITS.text.zh_normalization.text_normlization import TextNormalizer
 normalizer = lambda x: cn2an.transform(x, "an2cn")
@@ -32,8 +33,8 @@ if is_g2pw:
     parent_directory = os.path.dirname(current_file_path)
     g2pw = G2PWPinyin(
-        model_dir="GPT_SoVITS/text/G2PWModel",
-        model_source=os.environ.get("bert_path", "GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large"),
         v_to_u=False,
         neutral_tone_with_five=True,
     )

 from GPT_SoVITS.text.symbols import punctuation
 from GPT_SoVITS.text.tone_sandhi import ToneSandhi
 from GPT_SoVITS.text.zh_normalization.text_normlization import TextNormalizer
+from project_config import settings, DEFAULT_MODEL_DIR
 normalizer = lambda x: cn2an.transform(x, "an2cn")
     parent_directory = os.path.dirname(current_file_path)
     g2pw = G2PWPinyin(
+        model_dir=DEFAULT_MODEL_DIR / "G2PWModel",
+        model_source=os.environ.get("bert_path", settings.BERT_PRETRAINED_DIR),
         v_to_u=False,
         neutral_tone_with_five=True,
     )

api_server/app/adapters/local/database.py CHANGED Viewed

@@ -13,11 +13,10 @@ from typing import Any, Dict, List, Optional
 import aiosqlite
 from ..base import DatabaseAdapter
-from ...core.config import settings
 from ...models.domain import Task, TaskStatus
 # 阶段类型列表
 STAGE_TYPES = [
     "audio_slice",

 import aiosqlite
+from project_config import settings
 from ..base import DatabaseAdapter
 from ...models.domain import Task, TaskStatus
 # 阶段类型列表
 STAGE_TYPES = [
     "audio_slice",

api_server/app/adapters/local/storage.py CHANGED Viewed

@@ -13,8 +13,8 @@ from typing import Any, Dict, List, Optional
 import aiofiles
 from ..base import StorageAdapter
-from ...core.config import settings
 class LocalStorageAdapter(StorageAdapter):

 import aiofiles
+from project_config import settings
 from ..base import StorageAdapter
 class LocalStorageAdapter(StorageAdapter):

api_server/app/adapters/local/task_queue.py CHANGED Viewed

@@ -17,8 +17,8 @@ from typing import TYPE_CHECKING, Dict, Optional, AsyncGenerator, List
 import aiosqlite
 from ..base import TaskQueueAdapter
-from ...core.config import settings, PROJECT_ROOT, get_pythonpath
 if TYPE_CHECKING:
     from ..base import DatabaseAdapter

 import aiosqlite
+from project_config import settings, PROJECT_ROOT, get_pythonpath
 from ..base import TaskQueueAdapter
 if TYPE_CHECKING:
     from ..base import DatabaseAdapter

api_server/app/core/__init__.py CHANGED Viewed

@@ -4,6 +4,6 @@
 包含配置、枚举等核心组件
 """
-from .config import settings, PROJECT_ROOT, API_SERVER_ROOT
 __all__ = ["settings", "PROJECT_ROOT", "API_SERVER_ROOT"]

 包含配置、枚举等核心组件
 """
+from project_config import settings, PROJECT_ROOT, API_SERVER_ROOT
 __all__ = ["settings", "PROJECT_ROOT", "API_SERVER_ROOT"]

api_server/app/core/adapters.py CHANGED Viewed

@@ -12,7 +12,7 @@ Example:
 from functools import lru_cache
 from typing import TYPE_CHECKING
-from .config import settings
 if TYPE_CHECKING:
     from ..adapters.base import (

 from functools import lru_cache
 from typing import TYPE_CHECKING
+from project_config import settings
 if TYPE_CHECKING:
     from ..adapters.base import (

api_server/app/main.py CHANGED Viewed

@@ -13,8 +13,8 @@ from typing import AsyncGenerator
 from fastapi import FastAPI
 from fastapi.middleware.cors import CORSMiddleware
 from .api.v1.router import api_router
-from .core.config import settings, ensure_data_dirs
 @asynccontextmanager

 from fastapi import FastAPI
 from fastapi.middleware.cors import CORSMiddleware
+from project_config import settings, ensure_data_dirs
 from .api.v1.router import api_router
 @asynccontextmanager

api_server/app/scripts/run_pipeline.py CHANGED Viewed

@@ -28,7 +28,7 @@ _PROJECT_ROOT = _API_SERVER_ROOT.parent
 sys.path.insert(0, str(_PROJECT_ROOT))
 # 导入配置模块
-from api_server.app.core.config import settings, PROJECT_ROOT, get_pythonpath
 # 进度消息前缀和后缀，用于主进程解析

 sys.path.insert(0, str(_PROJECT_ROOT))
 # 导入配置模块
+from project_config import settings, PROJECT_ROOT, get_pythonpath
 # 进度消息前缀和后缀，用于主进程解析

api_server/app/services/task_service.py CHANGED Viewed

@@ -10,8 +10,8 @@ from datetime import datetime
 from pathlib import Path
 from typing import AsyncGenerator, Dict, Optional, Any, Tuple
 from ..core.adapters import get_database_adapter, get_task_queue_adapter, get_storage_adapter
-from ..core.config import settings
 from ..models.domain import Task, TaskStatus
 from ..models.schemas.task import (
     QuickModeRequest,

 from pathlib import Path
 from typing import AsyncGenerator, Dict, Optional, Any, Tuple
+from project_config import settings
 from ..core.adapters import get_database_adapter, get_task_queue_adapter, get_storage_adapter
 from ..models.domain import Task, TaskStatus
 from ..models.schemas.task import (
     QuickModeRequest,

infer.py CHANGED Viewed

@@ -17,8 +17,9 @@ from pathlib import Path
 import click
 import soundfile as sf
-from training_pipeline.stages.inference import create_tts_module, create_inference_config
 from training_pipeline.configs import InferenceConfig
 @click.command()
@@ -58,13 +59,13 @@ from training_pipeline.configs import InferenceConfig
 )
 @click.option(
     '--bert-path',
-    default='GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large',
     type=click.Path(exists=True),
     help='BERT 预训练模型路径'
 )
 @click.option(
     '--cnhubert-path',
-    default='GPT_SoVITS/pretrained_models/chinese-hubert-base',
     type=click.Path(exists=True),
     help='Chinese HuBERT 预训练模型路径'
 )
@@ -79,16 +80,16 @@ from training_pipeline.configs import InferenceConfig
     help='参考文本语言（默认: zh）'
 )
 def main(
-    target_text: str,
-    ref_text: str,
-    ref_audio: str,
-    gpt_model: str,
-    sovits_model: str,
-    output: str,
-    bert_path: str,
-    cnhubert_path: str,
-    text_lang: str,
-    prompt_lang: str,
 ):
     """GPT-SoVITS 命令行推理工具
@@ -103,11 +104,11 @@ def main(
     click.echo(f"  SoVITS 模型: {sovits_model}")
     click.echo(f"  输出路径: {output}")
     click.echo()
     # 确保输出目录存在
     output_path = Path(output)
     output_path.parent.mkdir(parents=True, exist_ok=True)
     # 创建推理配置
     cfg = InferenceConfig(
         exp_name="cli_inference",
@@ -119,12 +120,12 @@ def main(
         ref_audio_path=ref_audio,
         target_text=target_text,
     )
     click.echo("⏳ 正在加载模型...")
     try:
         # 创建 TTS 模块
         tts_module = create_tts_module(cfg)
         # 创建推理配置
         inference_config = create_inference_config(
             text=target_text,
@@ -133,7 +134,7 @@ def main(
             text_lang=text_lang,
             prompt_lang=prompt_lang,
         )
         click.echo("🔊 正在合成语音...")
         # 执行推理
         for item in tts_module.run(inference_config):
@@ -141,9 +142,9 @@ def main(
             # 保存音频
             sf.write(str(output_path), audio_data, sample_rate, subtype='PCM_16')
             break  # 只取第一个结果
         click.echo(f"✅ 成功！音频已保存至: {output_path.absolute()}")
     except Exception as e:
         click.echo(f"❌ 推理失败: {e}", err=True)
         sys.exit(1)

 import click
 import soundfile as sf
+from project_config import settings
 from training_pipeline.configs import InferenceConfig
+from training_pipeline.stages.inference import create_tts_module, create_inference_config
 @click.command()
 )
 @click.option(
     '--bert-path',
+    default=settings.BERT_PRETRAINED_DIR,
     type=click.Path(exists=True),
     help='BERT 预训练模型路径'
 )
 @click.option(
     '--cnhubert-path',
+    default=settings.SSL_PRETRAINED_DIR,
     type=click.Path(exists=True),
     help='Chinese HuBERT 预训练模型路径'
 )
     help='参考文本语言（默认: zh）'
 )
 def main(
+        target_text: str,
+        ref_text: str,
+        ref_audio: str,
+        gpt_model: str,
+        sovits_model: str,
+        output: str,
+        bert_path: str,
+        cnhubert_path: str,
+        text_lang: str,
+        prompt_lang: str,
 ):
     """GPT-SoVITS 命令行推理工具
     click.echo(f"  SoVITS 模型: {sovits_model}")
     click.echo(f"  输出路径: {output}")
     click.echo()
     # 确保输出目录存在
     output_path = Path(output)
     output_path.parent.mkdir(parents=True, exist_ok=True)
     # 创建推理配置
     cfg = InferenceConfig(
         exp_name="cli_inference",
         ref_audio_path=ref_audio,
         target_text=target_text,
     )
     click.echo("⏳ 正在加载模型...")
     try:
         # 创建 TTS 模块
         tts_module = create_tts_module(cfg)
         # 创建推理配置
         inference_config = create_inference_config(
             text=target_text,
             text_lang=text_lang,
             prompt_lang=prompt_lang,
         )
         click.echo("🔊 正在合成语音...")
         # 执行推理
         for item in tts_module.run(inference_config):
             # 保存音频
             sf.write(str(output_path), audio_data, sample_rate, subtype='PCM_16')
             break  # 只取第一个结果
         click.echo(f"✅ 成功！音频已保存至: {output_path.absolute()}")
     except Exception as e:
         click.echo(f"❌ 推理失败: {e}", err=True)
         sys.exit(1)

api_server/app/core/config.py → project_config.py RENAMED Viewed

@@ -2,6 +2,7 @@
 环境变量和配置模块
 统一管理项目路径、环境配置等
 """
 import os
@@ -14,18 +15,24 @@ from typing import Literal
 USER_HOME_ROOT = Path.home()
-# api_server/app/core/config.py -> api_server/app/core -> api_server/app -> api_server -> 项目根目录
-API_SERVER_ROOT = Path(__file__).parent.parent.parent.resolve()
-PROJECT_ROOT = API_SERVER_ROOT.parent.resolve()
 # GPT_SoVITS 模块路径
 GPT_SOVITS_ROOT = PROJECT_ROOT / "GPT_SoVITS"
 # 默认数据目录
-DEFAULT_DATA_DIR = USER_HOME_ROOT / '.moyoyo-tts' / "data"
 # 预训练模型目录
-PRETRAINED_MODELS_DIR = GPT_SOVITS_ROOT / "pretrained_models"
 # 日志目录
 LOGS_DIR = PROJECT_ROOT / "logs"
@@ -42,7 +49,7 @@ class Settings:
     支持从环境变量读取配置，提供合理的默认值
     Example:
-        >>> from api_server.app.core.config import settings
         >>> print(settings.PROJECT_ROOT)
         >>> print(settings.DEPLOYMENT_MODE)
     """

 环境变量和配置模块
 统一管理项目路径、环境配置等
+供整个项目共用
 """
 import os
 USER_HOME_ROOT = Path.home()
+# project_config.py 位于项目根目录
+PROJECT_ROOT = Path(__file__).parent.resolve()
+# api_server 目录路径
+API_SERVER_ROOT = PROJECT_ROOT / "api_server"
 # GPT_SoVITS 模块路径
 GPT_SOVITS_ROOT = PROJECT_ROOT / "GPT_SoVITS"
+DEFAULT_APP_DIR = USER_HOME_ROOT / '.moyoyo-tts'
 # 默认数据目录
+DEFAULT_DATA_DIR = DEFAULT_APP_DIR / "data"
+DEFAULT_MODEL_DIR = DEFAULT_APP_DIR / "models"
 # 预训练模型目录
+PRETRAINED_MODELS_DIR = DEFAULT_MODEL_DIR / "pretrained_models"
 # 日志目录
 LOGS_DIR = PROJECT_ROOT / "logs"
     支持从环境变量读取配置，提供合理的默认值
     Example:
+        >>> from project_config import settings
         >>> print(settings.PROJECT_ROOT)
         >>> print(settings.DEPLOYMENT_MODE)
     """

tools/asr/fasterwhisper_asr.py CHANGED Viewed

@@ -9,6 +9,7 @@ from huggingface_hub import snapshot_download as snapshot_download_hf
 from modelscope import snapshot_download as snapshot_download_ms
 from tqdm import tqdm
 from tools.asr.config import get_models
 from tools.asr.funasr_asr import only_asr
 from tools.my_utils import load_cudnn
@@ -52,20 +53,20 @@ def download_model(model_size: str):
         if "distil" in model_size:
             if "3.5" in model_size:
                 repo_id = "distil-whisper/distil-large-v3.5-ct2"
-                model_path = "tools/asr/models/faster-distil-whisper-large-v3.5"
             else:
                 repo_id = "Systran/faster-{}-whisper-{}".format(*model_size.split("-", maxsplit=1))
         elif model_size == "large-v3-turbo":
             repo_id = "mobiuslabsgmbh/faster-whisper-large-v3-turbo"
-            model_path = "tools/asr/models/faster-whisper-large-v3-turbo"
         else:
             repo_id = f"Systran/faster-whisper-{model_size}"
         model_path = (
-            model_path or f"tools/asr/models/{repo_id.replace('Systran/', '').replace('distil-whisper/', '', 1)}"
         )
     else:
         repo_id = "XXXXRT/faster-whisper"
-        model_path = "tools/asr/models"
     files: list[str] = [
         "config.json",
@@ -83,21 +84,21 @@ def download_model(model_size: str):
         files = [f"faster-whisper-{model_size}/{file}".replace("whisper-distil", "distil-whisper") for file in files]
     if source == "HF":
-        print(f"Downloading model from HuggingFace: {repo_id} to {model_path}")
         snapshot_download_hf(
             repo_id,
-            local_dir=model_path,
             local_dir_use_symlinks=False,
             allow_patterns=files,
         )
     else:
-        print(f"Downloading model from ModelScope: {repo_id} to {model_path}")
         snapshot_download_ms(
             repo_id,
-            local_dir=model_path,
             allow_patterns=files,
         )
-        return model_path + f"/faster-whisper-{model_size}".replace("whisper-distil", "distil-whisper")
     return model_path

 from modelscope import snapshot_download as snapshot_download_ms
 from tqdm import tqdm
+from project_config import DEFAULT_MODEL_DIR
 from tools.asr.config import get_models
 from tools.asr.funasr_asr import only_asr
 from tools.my_utils import load_cudnn
         if "distil" in model_size:
             if "3.5" in model_size:
                 repo_id = "distil-whisper/distil-large-v3.5-ct2"
+                model_path = DEFAULT_MODEL_DIR / "faster-distil-whisper-large-v3.5"
             else:
                 repo_id = "Systran/faster-{}-whisper-{}".format(*model_size.split("-", maxsplit=1))
         elif model_size == "large-v3-turbo":
             repo_id = "mobiuslabsgmbh/faster-whisper-large-v3-turbo"
+            model_path = DEFAULT_MODEL_DIR / "faster-whisper-large-v3-turbo"
         else:
             repo_id = f"Systran/faster-whisper-{model_size}"
         model_path = (
+            model_path or DEFAULT_MODEL_DIR / f"{repo_id.replace('Systran/', '').replace('distil-whisper/', '', 1)}"
         )
     else:
         repo_id = "XXXXRT/faster-whisper"
+        model_path = DEFAULT_MODEL_DIR
     files: list[str] = [
         "config.json",
         files = [f"faster-whisper-{model_size}/{file}".replace("whisper-distil", "distil-whisper") for file in files]
     if source == "HF":
+        print(f"Downloading model from HuggingFace: {repo_id} to {model_path.as_posix()}")
         snapshot_download_hf(
             repo_id,
+            local_dir=model_path.as_posix(),
             local_dir_use_symlinks=False,
             allow_patterns=files,
         )
     else:
+        print(f"Downloading model from ModelScope: {repo_id} to {model_path.as_posix()}")
         snapshot_download_ms(
             repo_id,
+            local_dir=model_path.as_posix(),
             allow_patterns=files,
         )
+        return model_path.as_posix() + f"/faster-whisper-{model_size}".replace("whisper-distil", "distil-whisper")
     return model_path

tools/asr/funasr_asr.py CHANGED Viewed

@@ -8,6 +8,8 @@ from funasr import AutoModel
 from modelscope import snapshot_download
 from tqdm import tqdm
 funasr_models = {}  # 存储模型避免重复加载
@@ -23,27 +25,27 @@ def only_asr(input_file, language):
 def create_model(language="zh"):
     if language == "zh":
-        path_vad = "tools/asr/models/speech_fsmn_vad_zh-cn-16k-common-pytorch"
-        path_punc = "tools/asr/models/punc_ct-transformer_zh-cn-common-vocab272727-pytorch"
-        path_asr = "tools/asr/models/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch"
         snapshot_download(
             "iic/speech_fsmn_vad_zh-cn-16k-common-pytorch",
-            local_dir="tools/asr/models/speech_fsmn_vad_zh-cn-16k-common-pytorch",
         )
         snapshot_download(
             "iic/punc_ct-transformer_zh-cn-common-vocab272727-pytorch",
-            local_dir="tools/asr/models/punc_ct-transformer_zh-cn-common-vocab272727-pytorch",
         )
         snapshot_download(
             "iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch",
-            local_dir="tools/asr/models/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch",
         )
         model_revision = "v2.0.4"
     elif language == "yue":
-        path_asr = "tools/asr/models/speech_UniASR_asr_2pass-cantonese-CHS-16k-common-vocab1468-tensorflow1-online"
         snapshot_download(
             "iic/speech_UniASR_asr_2pass-cantonese-CHS-16k-common-vocab1468-tensorflow1-online",
-            local_dir="tools/asr/models/speech_UniASR_asr_2pass-cantonese-CHS-16k-common-vocab1468-tensorflow1-online",
         )
         path_vad = path_punc = None
         vad_model_revision = punc_model_revision = ""
@@ -57,11 +59,11 @@ def create_model(language="zh"):
         return funasr_models[language]
     else:
         model = AutoModel(
-            model=path_asr,
             model_revision=model_revision,
-            vad_model=path_vad,
             vad_model_revision=vad_model_revision,
-            punc_model=path_punc,
             punc_model_revision=punc_model_revision,
         )
         print(f"FunASR 模型加载完成: {language.upper()}")

 from modelscope import snapshot_download
 from tqdm import tqdm
+from project_config import DEFAULT_MODEL_DIR
 funasr_models = {}  # 存储模型避免重复加载
 def create_model(language="zh"):
     if language == "zh":
+        path_vad = DEFAULT_MODEL_DIR / "speech_fsmn_vad_zh-cn-16k-common-pytorch"
+        path_punc = DEFAULT_MODEL_DIR / "punc_ct-transformer_zh-cn-common-vocab272727-pytorch"
+        path_asr = DEFAULT_MODEL_DIR / "speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch"
         snapshot_download(
             "iic/speech_fsmn_vad_zh-cn-16k-common-pytorch",
+            local_dir=path_vad.as_posix(),
         )
         snapshot_download(
             "iic/punc_ct-transformer_zh-cn-common-vocab272727-pytorch",
+            local_dir=path_punc.as_posix(),
         )
         snapshot_download(
             "iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch",
+            local_dir=path_asr.as_posix(),
         )
         model_revision = "v2.0.4"
     elif language == "yue":
+        path_asr = DEFAULT_MODEL_DIR / "speech_UniASR_asr_2pass-cantonese-CHS-16k-common-vocab1468-tensorflow1-online"
         snapshot_download(
             "iic/speech_UniASR_asr_2pass-cantonese-CHS-16k-common-vocab1468-tensorflow1-online",
+            local_dir=path_asr.as_posix(),
         )
         path_vad = path_punc = None
         vad_model_revision = punc_model_revision = ""
         return funasr_models[language]
     else:
         model = AutoModel(
+            model=path_asr.as_posix(),
             model_revision=model_revision,
+            vad_model=path_vad.as_posix(),
             vad_model_revision=vad_model_revision,
+            punc_model=path_punc.as_posix(),
             punc_model_revision=punc_model_revision,
         )
         print(f"FunASR 模型加载完成: {language.upper()}")