百度最新端到端语音同传 剖析机械同传前沿进展_同传_模子
据先容,全新百度翻译AI同传小程序仅需扫码即可利用,同传直播页支持边听边看,体验更实时、流畅。采取云端接入办法,无需传统的同传设备,降落会议本钱。此外,会后同传记录还可以一键同步网盘,方便随时查看。
机器同传:机遇与寻衅并存
机器同传成为人工智能领域前沿研究方向之一。随着语音和机器翻译技能的进步,机器同传取得了较大进展,也面临着一系列寻衅:
寻衅一:语音识别缺点。由于演讲者的口音、语速以及会场的噪声影响,语音识别常日会存在一定的缺点率,这缺点会在翻译中进一步放大。办理这一问题,须要从两方面下功夫,一是高质量的语音识别系统,二是具有容错能力、高鲁棒性的翻译模型。
寻衅二:质量与时延的平衡。同传最具魅力的地方在于其低时延,但高质量翻译和低时延之间存在天然抵牾。要想得到高质量的翻译,须要等待演讲者更多的信息,时延就会变长。目前,险些所有的“实时”翻译系统仍旧利用传统的全句(即,非同时的)翻译方法,造成至少一个句子的延迟,使得译文与说话者不同步。
寻衅三:翻译的连贯性和同等性。目前,险些所有的翻译系统都因此句子为单位进行翻译的,句子与句子之间连贯性较差。同传的紧张场景是对演讲者的内容,进行实时翻译,须要担保翻译前后内容的连贯和同等。
寻衅四:演习数据不敷。在语音领域,有数十万小时的演习数据;在机器翻译领域,有数十亿句对的演习数据。然而,面向真实场景的同传数据,只有几十到几百个小时,远远不敷以演习高质量的同传系统。
寻衅五:评价指标的寻衅。在文本翻译任务中,一样平常根据翻译句子的流利度(语序)和虔诚度(完全翻译)对结果进行评价。同传不同于笔译,可以有足够的韶光去构思、考虑,同声传译哀求译员在极有限的韶光内对接管到的信息进行重组,使目的语听众理解原语发言人的讲话内容。因此,会采取“顺句驱动”“合理简约”等方法。传统的评价文本翻译的指标不适用于评价同传的结果。
百度翻译AI同传:多项创新技能取得打破进展
百度翻译AI同传集成了百度在同传上的最新技能,在语音容错、可控时延、篇章翻译、端到端模型等方面都提出了创新的办理方案。
在语音容错方面,为提高翻译的准确度和鲁棒性,百度提出了“联合文本和拼音编码”的语音翻译模型(Robust Neural Machine Translation with Joint Textual and Phonetic Embedding)。这一模型的创新之处在于对文本和拼音进行联合编码,缓解语音识别带来的缺点。比如,发音都是“datang”的“大堂”和“大唐”很随意马虎令语音识别系统稠浊。传统的翻译模型只利用了文本信息进行编码,百度提出的模型在编码端加入了音节信息,使得模型具有容错能力。
在实时性方面,人工同传可以很好的处理质量与时延的平衡。从人类译员那里得到灵感,百度提出了具有预测和可控时延的翻译模型(STACL:Simultaneous Translation with Integrated Anticipation and Controllable Latency)。在这个模型中,在等待讲话者开始后的第K个词,就开始翻译。模型在每个步骤利用源语句的可用前缀,以及到目前为止的翻译来决定翻译中的下一个单词。该模型一个显著的优点是其具有可调节性,实际利用中可以根据须要调节K值,以平衡翻译质量和韶光延迟。
在语篇翻译方面,百度提出了基于多轮解码校正网络的篇章翻译模型(Modeling Coherence for Discourse Neural Machine Translation),用于办理篇章翻译过程中的同等性和连贯性问题。该模型首先进行第一轮解码根据单个句子天生初步的翻译结果,其后根据已经天生的高下文信息,对翻译结果进行第二次解码,重新调度翻译内容。并且利用深度增强学习的技能,调度当前句子的译文和已经天生的译文担保良好的连贯性和同等性,在译文的整体流畅性上取得显著提高。
在端到端机器同传模型方面,百度提出基于知识蒸馏的同传模型(End-to-End Speech Translation with Knowledge Distillation)。首先利用大规模文本翻译语料演习一个西席模型,然后利用端到端语音翻译演习语估中的源措辞转录文本和目标措辞翻译文本对西席模型进行微调(fine-tune)。在微调的过程中,利用知识蒸馏技能(Knowledge Distillation)对端到端语音翻译的学生模型(Student Model)进行预测分布改动。该模型可以有效战胜数据稀疏问题,显著提升翻译质量。
“未来,机器同传可以从以下三个方面开展事情,在模型方面,研究高鲁棒、低时延的同传模型;在数据方面,培植大规模面向真实场景的同传数据;在评价方面,建立面向同传的评价体系和标准。”何中军表示。
层出不穷的网络新词,难以理解的语境,让机器翻译还不能做到“信达雅”,但随着技能的发展,机器翻译也在不断进化。为推动机器同传技能发展,百度翻译联合CCMT2019(全国机器翻译研讨会)推出环球首个面向真实场景的中英同传评测任务(Xttp://ccmt2019.jxnu.edu.cn/page/main1923/pctz.htm),同时发布了首个真实演讲场景的中英同传数据集CCMT2019-BSTC(Xttp://ai.baidu.com/broad),两项事情都将极大地推动同声传译的干系研究和发展。
“有一天,当你在北京公民大会堂和天下各国朋侪聚会的时候,你会创造,无论哪个国家的人在台上讲话,与会者都能从耳机里听到自己国家的措辞……”这是54年前,刘涌泉、高祖舜、刘倬合著的《机器翻译浅说》里对未来的机器翻译发展和运用的畅想和展望。而本日,随着技能的进步,畅想正在逐步走向现实。百度翻译AI同传办理方案的提出,供应了一种更方便、本钱更低的做事选择,而未来,随时随地自由沟通的梦想也将离我们越来越近。
来源:中国网科学
本文系作者个人观点,不代表本站立场,转载请注明出处!