AI声音克隆 | 最全最简教程(威信版)_声音_模子
TTS 的英文全名是 Text To Speech,中文译名是“文本转语音”。它是一种将文本内容转换为语音的技能,通过TTS技能,打算机可以将笔墨信息转换成人类可听懂的语音输出,实现语音合成的功能
目前市场上的AI声音
我们最多用的还是普通的TTS,即把笔墨通过软件输出指定人的声音,这块微软做的不错,之前自己写过一个免费的TTS小软件,API用的便是微软的,如有须要,请看自己开拓 一个免费的文本转语音小工具(这里插不进来链接,联系
如果你以为功能少,可以利用海内的魔音工坊,但是要收费的哈
但这些都不能指定声音转换,以是这里利用声音克隆,来将指定人声演习成模型,然后笔墨转音频。
接下来说重点声音克隆
开源项目地址:https://github.com/fishaudio/Bert-VITS2https://github.com/RVC-Boss/GPT-SoVITS
GPT-SoVITS
GPT-SoVITS是由RVC变声器的创始人(GitHub昵称为RVC-Boss)与AI音色转换技能专家Rcell互助开拓的一个开源项目。它是一个跨措辞音色克隆工具,专注于声音的转换和克隆。
Bert-VITS2
Bert-VITS2是由社区开拓者fishaudio发起的一个开源项目,它基于VITS(Variational Inference for Text-to-Speech)模型进行开拓,旨在供应高质量的文本到语音(TTS)做事。
GPT-SoVITS在演习韶光上具有明显的上风,由于它支持Few-shot学习,能够在短韶光内(如一分钟的语音数据)演习出具有相似音色的模型。
Bert-VITS2可能须要更长的演习韶光(1-4个小时)来达到高质量的语音合成效果,尤其是在数据集较大或模型较为繁芜的情形下
大略来说便是如果你须要更稳定和标准的声音,辛劳一次永久利用就选择Bert-VITS;
如果你想快速实现声音克隆,跨措辞就选择 GPT-SoVITS;
这里以GPT-SoVITS为例,写一篇详细教程,由于他大略有效还节省韶光,至于Bert-VITS,我觉得纵然写了,他几个小时的演习韶光加上大量的素材网络,许多人也没韶光去考试测验,效果也不一定能好很多,这里力推GPT-SoVITS!
让我们开始吧!
开始前准备,注册 OpenBayes 平台账号
新用户注册 OpenBayes即可得到3小时免费RTX4090利用时长,用下方注册链接你我都可以多加一个小时免费时长哈https://openbayes.com/console/signup?r=huawang_zL1B
利用原来绑定的数据集(原神可莉),考试测验演习一下
1 GPT-SoVITS一键克隆环境:
选择公共资源下的"大众教程,选择 GPT-SoVITS 音频合成在线 Demo
2 GPT-SoVITS一键克隆环境
点击右上角克隆,之后选择审核并实行,连续实行
等待几分钟, 等待数据同步成功
3 完成后 打开事情空间
4 打开 run.ipynb,一键运行所有单元格
5 等几秒钟运行完毕,打开输出的 public URL
6 打开音频选择数据类型
7 点击开始选练
8 等待几分钟演习韶光
可往后台看到演习15epoch后演习成功,前端显示模型开始预测
9 打开原来的Jupyter 事情空间,选择API地址
API地址须要实名认证,如果没认证认证后再回来,就可以看到地址了
10 打开API地址,开始玩耍
选择演习好的GPT模型和SoVITS模型,输入你想要推理的笔墨,比如:“欢迎你成功演习成功了”,点击开始推理
(这里上面选择错了,一样平常演习好的是末了一个,看你开始定义的模型名字就好哈)
这样你在原来绑定的数据集上就成功演习的一个声音模型
效果如下
克隆元神可莉声音AI声音克隆 | 最全最简教程(威信版)
开始选择自己的数据集
先关闭自己之前启动的容器
1 准备30s-1min的音频素材
这里以李雪健老师为例
任何克隆声音项目都遵守;数据集的质量决定天生的质量,不要有任何杂音,越干净、越纯粹越好
通过录音软件(声音录制软件),录取干系音频,放到剪映处理,把人声音的能开的都开了,处理结果就不放了,免得麻烦哈,这里我处理大概1分36s的录音
2 上传数据集
3 修正配置并启动
点击模型演习 ,进入刚才跑的项目
点击编辑配置并启动
配置自己的数据并实行
一贯点点点,到启动成功,打开事情空间,重复以上的演习步骤即可
4 演习填写新绑定的数据集目录
5 重复之前开头的步骤,末了我们看下效果
说中文效果
克隆李雪健-中文
说英文效果
克隆李雪健English-version
末了,这个教程看着多了点,实在可能我只是尽可能把每个步骤的图贴完全,只管即便知足各种不懂编程的人都够顺利克隆声音成功
这个项目还是蛮牛皮,重点在于省时省力,大略有效,当之为当前性价比速率之神,也期待你能有更多更好玩的用途
如果是英文,建议去llElevenlabs
文章不易,如果你以为不错,记得点个赞、在看、转发吧,感谢!
本文系作者个人观点,不代表本站立场,转载请注明出处!