据悉,“易魔声”是一款有道自研TTS引擎,目前支持中英文双语,包含2000多种不同的音色,更有特色的情绪合成功能,支持合成包含快乐、愉快、悲哀、愤怒等广泛情绪的语音。

网易有道上线“易魔声” 开源语音合成引擎 用户可免费下载运用_语音_声音 智能助手

(GitHub开源界面)

在过往的回顾里,总会有一些特殊的声音,比如:偶像的声音勉励民气、妈妈的声音让我们一秒回顾起小时候……声音,作为措辞维度的一种,总是蕴含着人类充足的情绪表达。
而富有情绪的合针言音,是能够为运用和内容增色的AI功能。
有道“易魔声”则为开拓者和内容创作者供应了一些办理思路——只需大略通过在文本中加入情绪的描述提示,就可以自由合成符合自己需求的带有情绪的语音,比传统TTS更加自然逼真。

随着基于GAN等当代AI技能的语音能力越来越成熟,实现一个质量较高的TTS系统的门槛越来越低。
但纵然如此,中英双语的高质量、当代TTS模块还是不易找到,要在自己的运用与内容中加入高逼真度且高度可控的语音,特殊是中英双语的语音,也依然比较麻烦。

“目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开拓者与内容创作者,并不断扩大高质量TTS的运用范围,让产品及运用更好地落地。
也期待大家试用后给我们供应更多反馈与建议。
”网易有道CEO周枫先容道。

有道在 TTS 领域耕耘多年,始终以场景为导向,不断推动技能落地,为用户带来诸多高效便捷的运用和产品。
例如,推出教诲领域首个明星语音功能,将王源、欧阳娜娜、马伯骞等明星的声音内置在网易有道词典中,陪伴用户共同学习英语;供应声音定制和声音复刻功能,仅需 5 分钟即可完成个性化声音定制;近期推出的 Hi Echo 虚拟人口语私教,借助有道「子曰」教诲大模型、语音和虚拟人技能,帮助用户随时随地轻松练习英语口语。

从2008年起,网易有道便开始布局AI,多年来一贯致力于基于Transformer模型进行创新和运用,并在神经网络翻译、打算机视觉、高性能打算、智能语音AI技能等方面都具备了核心技能,为运用的实际落地打下了坚实的技能根本。

此外,用户还可通过有道智云官网,体验已经对开拓者通过API等形式开放的文本和图像翻译、笔墨和各种图片识别、作文批改等各种AI技能。

有道智云AI开放平台,是网易有道旗下一站式人工智能做事供应商,为开拓者、企业和政府机构等供应自然措辞翻译、笔墨识别、OCR、语音识别等做事以及行业办理方案,致力于供应安全、可靠和高效的云做事。