Apply for a GPU community grant: Personal project

#1
by ayf3 - opened
Owner

Numberblocks One 音色提取项目 - 这是一个开源的语音技术研究项目,旨在从 Numberblocks 动画片中提取角色 "One" 的语音样本,用于音色克隆技术研究。

项目目标:

  1. 使用 pyannote.audio 进行说话人分离(Speaker Diarization)
  2. 从 124 个音频文件中提取角色 One 的语音片段
  3. 为语音合成和音色克隆研究创建高质量的语音数据集

技术挑战:

  • 需要运行深度学习模型(pyannote.audio)
  • 124 个音频文件需要大量计算资源
  • CPU 运行超时(30分钟),需要 GPU 加速

此项目完全开源,数据集和代码将公开分享给研究社区,帮助推进语音克隆技术的发展。

Sign up or log in to comment