专为Mac设计的语音克隆克隆工具VoiceBox-拾音盒

来源于GitHub开源项目https://github.com/jamiepine/voicebox
开源项目收费可耻,但是我收的是汉化费和模型下载费(花了我20G 梯子流量),觉得坑可以下上面的英文原版,那个完全免费

大鱼做了哪些改进

  • 原版只有英文界面,我拿到源码后进行逐一汉化。
  • 原版默认从huggingface下载模型,大陆地区访问非常慢,并且强制下在系统盘,我改为手动指定模型路径,并且打包好了本地模型直接指定可用无需漫长下载
  • 音色创建和语音识别默认语言改为中文
  • 修复原版不能导出中文文件的问题

有哪些BUG

界面启动可能卡初始化无法进入,强退APP后右键APP显示包内容,找到Content-MacOS里面的可执行程序-voicebox运行

APP无法关闭,需要command+Q退出或者在程序坞右键退出

儿童声音克隆效果不太理想,只能克隆成人声音

有哪些优点

全网唯一支持Mac Metal加速的本地部署语音克隆工具 在64G M1max电脑上速度和5060ti 16G PC一样快

克隆效果和大名鼎鼎的indexTTS不相上下 上手难度却比indexTTS小多了

使用方法

1、打开APP后首先指定模型目录,将我打包好的模型目录拷贝任意位置,然后指定给APP,然后重启APP。看到Qwen TTS 1.7B就绪就行

2、

发表回复