(725.github开源)clone-voice-开源的声音克隆工具,支持16种语言

项目概述

  • 名称:clone-voice
  • 平台:GitHub
  • 核心功能:声音克隆工具,带有 Web 界面
  • 使用场景:可以使用任何人的音色或任意声音来录制音频,适用于语音合成、配音、语音转换等场景

技术架构

  • 模型:使用 coqui.ai 出品的 xtts_v2 模型进行声音克隆
  • 语言支持:支持中文、英文、日语、韩语、法语、德语、意大利语等 16 种语言
  • 录制方式:可以在线从麦克风录制声音,建议录制时长为 5 到 20 秒,发音清晰准确,避免背景噪声
  • 效果:英文效果较好,中文效果相对一般

使用方式

  • 预编译版本:用户可以下载预编译版本,无需 GPU 即可使用,下载后解压并双击运行 app.exe 即可打开 Web 界面
  • 源码部署:支持在 Linux、Mac 和 Windows 系统上源码部署,需要 Python 3.9 到 3.11 环境,使用 git 拉取源码,创建虚拟环境并安装依赖,然后运行代码
  • CUDA 加速:如果用户拥有 Nvidia 显卡并正确配置 CUDA 环境,可以使用 CUDA 加速提升性能

功能介绍

  • 文字到语音:输入文字,用选定的音色生成声音
  • 声音到声音:从本地选择一个音频文件,用选定的音色生成另一个音频文件

常见问题与解决方案

  • 模型下载问题:源码版需要设置代理下载模型,如果下载中断或失败,建议使用稳定的代理
  • 启动问题:启动后需要冷加载模型,会消耗一些时间,需耐心等待
  • 线程启动失败:确认模型已正确下载放置,或下载 extra-to-tts_cache.zip 文件中的文件进行修复
  • 文本长度限制:如果提示文本长度超过限制,建议将长句使用句号隔开,或手动修改限制
  • 符号未找到问题:下载并复制相应的 dll 文件到系统目录解决

github开源地址:https://github.com/jianchang512/clone-voice?tab=readme-ov-file#readme

------本页内容已结束,喜欢请分享------

感谢您的来访,获取更多精彩文章请收藏本站。

© 版权声明
THE END
喜欢就支持一下吧
点赞112 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片快捷回复

    暂无评论内容