专为Mac设计的语音克隆克隆工具VoiceBox-拾音盒
来源于GitHub开源项目https://github.com/jamiepine/voicebox
开源项目收费可耻,但是我收的是汉化费和模型下载费(花了我20G 梯子流量),觉得坑可以下上面的英文原版,那个完全免费
大鱼做了哪些改进
- 原版只有英文界面,我拿到源码后进行逐一汉化。
- 原版默认从huggingface下载模型,大陆地区访问非常慢,并且强制下在系统盘,我改为手动指定模型路径,并且打包好了本地模型直接指定可用无需漫长下载
- 音色创建和语音识别默认语言改为中文
- 修复原版不能导出中文文件的问题
有哪些BUG
界面启动可能卡初始化无法进入,强退APP后右键APP显示包内容,找到Content-MacOS里面的可执行程序-voicebox运行

APP无法关闭,需要command+Q退出或者在程序坞右键退出
儿童声音克隆效果不太理想,只能克隆成人声音
我只编译了Arm版,intel不支持
有哪些优点
全网唯一支持Mac Metal加速的本地部署语音克隆工具 在64G M1max电脑上速度和5060ti 16G PC一样快
克隆效果和大名鼎鼎的indexTTS不相上下 上手难度却比indexTTS小多了
使用方法
1、打开APP后首先指定模型目录,将我打包好的模型目录拷贝任意位置,然后指定给APP,然后重启APP。看到Qwen TTS 1.7B就绪就行


2、
