（725.github开源）clone-voice-开源的声音克隆工具，支持16种语言-创业网宝藏库

项目概述

名称：clone-voice
平台：GitHub
核心功能：声音克隆工具，带有 Web 界面
使用场景：可以使用任何人的音色或任意声音来录制音频，适用于语音合成、配音、语音转换等场景

技术架构

模型：使用 coqui.ai 出品的 xtts_v2 模型进行声音克隆
语言支持：支持中文、英文、日语、韩语、法语、德语、意大利语等 16 种语言
录制方式：可以在线从麦克风录制声音，建议录制时长为 5 到 20 秒，发音清晰准确，避免背景噪声
效果：英文效果较好，中文效果相对一般

使用方式

预编译版本：用户可以下载预编译版本，无需 GPU 即可使用，下载后解压并双击运行 app.exe 即可打开 Web 界面
源码部署：支持在 Linux、Mac 和 Windows 系统上源码部署，需要 Python 3.9 到 3.11 环境，使用 git 拉取源码，创建虚拟环境并安装依赖，然后运行代码
CUDA 加速：如果用户拥有 Nvidia 显卡并正确配置 CUDA 环境，可以使用 CUDA 加速提升性能

功能介绍

文字到语音：输入文字，用选定的音色生成声音
声音到声音：从本地选择一个音频文件，用选定的音色生成另一个音频文件

常见问题与解决方案

模型下载问题：源码版需要设置代理下载模型，如果下载中断或失败，建议使用稳定的代理
启动问题：启动后需要冷加载模型，会消耗一些时间，需耐心等待
线程启动失败：确认模型已正确下载放置，或下载 extra-to-tts_cache.zip 文件中的文件进行修复
文本长度限制：如果提示文本长度超过限制，建议将长句使用句号隔开，或手动修改限制
符号未找到问题：下载并复制相应的 dll 文件到系统目录解决

github开源地址：https://github.com/jianchang512/clone-voice?tab=readme-ov-file#readme

------本页内容已结束，喜欢请分享------

感谢您的来访，获取更多精彩文章请收藏本站。

文章来源

管理员

隐私政策

PrivacyPolicy

用户协议

UseGenerator

许可协议

NC-SA 4.0

1. 资源都是经过站长或作者收集测试修改后发布分享。转载请在文内以超链形式注明出处，谢谢合作！
2. 本站除原创内容，其余所有内容均收集自互联网，仅限用于学习和研究目的，本站不对其内容的合法性承担任何责任。如有版权内容，请通知我们或作者删除，其版权均归原作者所有，本站虽力求保存原有版权信息，但因众多资源经多次转载，已无法确定其真实来源，或已将原有信息丢失，所以敬请原作者谅解！
3. 本站用户所发布的一切资源内容不代表本站立场，并不代表本站赞同其观点和对其真实性负责，若您对本站所载资源作品版权归属存有异议，请留言附说明联系邮箱，我们将在第一时间予以处理，同时向您表示歉意！为尊重作者版权，请购买原版作品，支持您喜欢的作者，谢谢！
4. 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客如有发现请立即向站长举报；本站资源文件大多存储在云盘，如发现链接或图片失效，请联系作者或站长及时更新。

THE END