AI声音克隆 | 最全最简教程（威信版）_声音_模子

2024-08-02 18:31:55 绘影字幕

TTS 的英文全名是 Text To Speech,中文译名是“文本转语音”。
它是一种将文本内容转换为语音的技能，通过TTS技能，打算机可以将笔墨信息转换成人类可听懂的语音输出，实现语音合成的功能

AI声音克隆 | 最全最简教程（威信版）_声音_模子绘影字幕

目前市场上的AI声音

我们最多用的还是普通的TTS，即把笔墨通过软件输出指定人的声音，这块微软做的不错，之前自己写过一个免费的TTS小软件，API用的便是微软的，如有须要，请看自己开拓一个免费的文本转语音小工具(这里插不进来链接，联系

如果你以为功能少，可以利用海内的魔音工坊，但是要收费的哈

但这些都不能指定声音转换，以是这里利用声音克隆，来将指定人声演习成模型，然后笔墨转音频。

接下来说重点声音克隆

开源项目地址：https://github.com/fishaudio/Bert-VITS2https://github.com/RVC-Boss/GPT-SoVITS

GPT-SoVITS

GPT-SoVITS是由RVC变声器的创始人（GitHub昵称为RVC-Boss）与AI音色转换技能专家Rcell互助开拓的一个开源项目。
它是一个跨措辞音色克隆工具，专注于声音的转换和克隆。

Bert-VITS2

Bert-VITS2是由社区开拓者fishaudio发起的一个开源项目，它基于VITS（Variational Inference for Text-to-Speech）模型进行开拓，旨在供应高质量的文本到语音（TTS）做事。

GPT-SoVITS在演习韶光上具有明显的上风，由于它支持Few-shot学习，能够在短韶光内（如一分钟的语音数据）演习出具有相似音色的模型。

Bert-VITS2可能须要更长的演习韶光(1-4个小时)来达到高质量的语音合成效果，尤其是在数据集较大或模型较为繁芜的情形下

大略来说便是如果你须要更稳定和标准的声音，辛劳一次永久利用就选择Bert-VITS；

如果你想快速实现声音克隆，跨措辞就选择 GPT-SoVITS；

这里以GPT-SoVITS为例，写一篇详细教程，由于他大略有效还节省韶光，至于Bert-VITS，我觉得纵然写了，他几个小时的演习韶光加上大量的素材网络，许多人也没韶光去考试测验，效果也不一定能好很多，这里力推GPT-SoVITS！
让我们开始吧！

开始前准备，注册 OpenBayes 平台账号

新用户注册 OpenBayes即可得到3小时免费RTX4090利用时长，用下方注册链接你我都可以多加一个小时免费时长哈https://openbayes.com/console/signup?r=huawang_zL1B

利用原来绑定的数据集（原神可莉），考试测验演习一下

1 GPT-SoVITS一键克隆环境:

选择公共资源下的"大众教程，选择 GPT-SoVITS 音频合成在线 Demo

2 GPT-SoVITS一键克隆环境

点击右上角克隆，之后选择审核并实行，连续实行

等待几分钟，等待数据同步成功

3 完成后打开事情空间

4 打开 run.ipynb，一键运行所有单元格

5 等几秒钟运行完毕，打开输出的 public URL

6 打开音频选择数据类型

7 点击开始选练

8 等待几分钟演习韶光

可往后台看到演习15epoch后演习成功，前端显示模型开始预测

9 打开原来的Jupyter 事情空间，选择API地址

API地址须要实名认证，如果没认证认证后再回来，就可以看到地址了

10 打开API地址，开始玩耍

选择演习好的GPT模型和SoVITS模型，输入你想要推理的笔墨，比如：“欢迎你成功演习成功了”，点击开始推理

（这里上面选择错了，一样平常演习好的是末了一个，看你开始定义的模型名字就好哈）

这样你在原来绑定的数据集上就成功演习的一个声音模型

效果如下

克隆元神可莉声音AI声音克隆 | 最全最简教程（威信版）

开始选择自己的数据集

先关闭自己之前启动的容器

1 准备30s-1min的音频素材

这里以李雪健老师为例

任何克隆声音项目都遵守;数据集的质量决定天生的质量，不要有任何杂音，越干净、越纯粹越好

通过录音软件（声音录制软件），录取干系音频，放到剪映处理，把人声音的能开的都开了，处理结果就不放了，免得麻烦哈，这里我处理大概1分36s的录音

2 上传数据集

3 修正配置并启动

点击模型演习，进入刚才跑的项目

点击编辑配置并启动

配置自己的数据并实行

一贯点点点，到启动成功，打开事情空间，重复以上的演习步骤即可

4 演习填写新绑定的数据集目录

5 重复之前开头的步骤，末了我们看下效果

说中文效果

克隆李雪健-中文

说英文效果

克隆李雪健English-version

末了，这个教程看着多了点，实在可能我只是尽可能把每个步骤的图贴完全，只管即便知足各种不懂编程的人都够顺利克隆声音成功

这个项目还是蛮牛皮，重点在于省时省力，大略有效，当之为当前性价比速率之神，也期待你能有更多更好玩的用途

如果是英文，建议去llElevenlabs

文章不易，如果你以为不错，记得点个赞、在看、转发吧，感谢！

本文系作者个人观点，不代表本站立场，转载请注明出处！

演习克隆

AI声音克隆 | 最全最简教程（威信版）_声音_模子

热门内容

随机文章

推荐内容

最新内容

TAGS标签

AI声音克隆 | 最全最简教程（威信版）_声音_模子

相关推荐

介绍微信克隆,技术与伦理的双重考题

克隆技术的伦理边界,如何合理关闭克隆之门

U盘克隆,数据备份与恢复的得力助手

金融业高薪招聘AI演习师有AI产品负责人年薪超百万_万元_红星

科技冬奥丨人工智能裁判与教练系统助力空中技巧队冬奥夺金_人工智能_体系

栏目热门

热门内容

随机文章

推荐内容

最新内容

TAGS标签