项目概述
- 名称:clone-voice
- 平台:GitHub
- 核心功能:声音克隆工具,带有 Web 界面
- 使用场景:可以使用任何人的音色或任意声音来录制音频,适用于语音合成、配音、语音转换等场景
技术架构
- 模型:使用 coqui.ai 出品的 xtts_v2 模型进行声音克隆
- 语言支持:支持中文、英文、日语、韩语、法语、德语、意大利语等 16 种语言
- 录制方式:可以在线从麦克风录制声音,建议录制时长为 5 到 20 秒,发音清晰准确,避免背景噪声
- 效果:英文效果较好,中文效果相对一般
使用方式
- 预编译版本:用户可以下载预编译版本,无需 GPU 即可使用,下载后解压并双击运行 app.exe 即可打开 Web 界面
- 源码部署:支持在 Linux、Mac 和 Windows 系统上源码部署,需要 Python 3.9 到 3.11 环境,使用 git 拉取源码,创建虚拟环境并安装依赖,然后运行代码
- CUDA 加速:如果用户拥有 Nvidia 显卡并正确配置 CUDA 环境,可以使用 CUDA 加速提升性能
功能介绍
- 文字到语音:输入文字,用选定的音色生成声音
- 声音到声音:从本地选择一个音频文件,用选定的音色生成另一个音频文件
常见问题与解决方案
- 模型下载问题:源码版需要设置代理下载模型,如果下载中断或失败,建议使用稳定的代理
- 启动问题:启动后需要冷加载模型,会消耗一些时间,需耐心等待
- 线程启动失败:确认模型已正确下载放置,或下载 extra-to-tts_cache.zip 文件中的文件进行修复
- 文本长度限制:如果提示文本长度超过限制,建议将长句使用句号隔开,或手动修改限制
- 符号未找到问题:下载并复制相应的 dll 文件到系统目录解决
github开源地址:https://github.com/jianchang512/clone-voice?tab=readme-ov-file#readme
感谢您的来访,获取更多精彩文章请收藏本站。

© 版权声明
1. 资源都是经过站长或作者收集测试修改后发布分享。转载请在文内以超链形式注明出处,谢谢合作!
2. 本站除原创内容,其余所有内容均收集自互联网,仅限用于学习和研究目的,本站不对其内容的合法性承担任何责任。如有版权内容,请通知我们或作者删除,其版权均归原作者所有,本站虽力求保存原有版权信息,但因众多资源经多次转载,已无法确定其真实来源,或已将原有信息丢失,所以敬请原作者谅解!
3. 本站用户所发布的一切资源内容不代表本站立场,并不代表本站赞同其观点和对其真实性负责,若您对本站所载资源作品版权归属存有异议,请留言附说明联系邮箱,我们将在第一时间予以处理 ,同时向您表示歉意!为尊重作者版权,请购买原版作品,支持您喜欢的作者,谢谢!
4. 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客如有发现请立即向站长举报;本站资源文件大多存储在云盘,如发现链接或图片失效,请联系作者或站长及时更新。
THE END
暂无评论内容