谷歌的人工智能现在可以翻译你的演讲同时保持你的声音_音频_措辞
来源,麻省理工学院技能评论(2019)
传统的翻译系统将音频转换成文本,翻译文本,然后对音频进行再合成,在过程中失落去了原始语音的特色。
我的性感又有帅气声音,人工智能秀一下,翻译出来成了哔哔哔,机器人的有木有!
现在谷歌新系统来了,它有三个组件构成,第一个组件是经由演习的神经网络,将输入措辞中的音频频谱映射到输出措辞中的音频频谱。第二个部组件是将谱图转换成可播放的音频波。末了第三个组件可以将说话人的声音特色传回终极的音频。
这种方法不仅保留主要的个人语音特质,而且在理论上也只管即便减少了翻译缺点,由于它将翻译的任务缩减到更少的步骤。
在测试过程中,研究职员目前还只试用了从西班牙文到英文的翻译系统,但该系统已经网络了大量的各种措辞数据,商业潜力巨大。
本文系作者个人观点,不代表本站立场,转载请注明出处!