机械翻译与人工翻译之争_机械翻译_措辞
机器翻译发展迅速
措辞能力是区分人类和动物的主要特色之一,是人类有效互换的担保。用机器来进行措辞翻译的想法,最早可追溯到古希腊期间。当代意义上的“机器翻译”一词,由古图拉特(Couturat)和洛(Leau)1903年在《通用措辞的历史》一书中最早提出。1949年,韦弗揭橥了具有广泛影响力的名为《翻译》的备忘录,正式提出了机器翻译的思想。直到2006年Hinton提出深度学习技能,才为实现这一目标供应了更好的办理路子。目前的前沿技能是基于人工神经网络的机器学习,其技能核心是一个拥有海量节点(神经元)的深度神经网络,可以自动地从语料库学习翻译知识。一种措辞的句子被向量化之后,在网络中层层通报,转化为打算机可以“理解”的表示形式,再经由多层繁芜的传导运算,天生另一种措辞的译文。
2015年,蒙特利尔大学引入把稳力机制,使得神经机器翻译达到实用阶段。此后,神经机器翻译不断取得进展。2016年,谷歌GNMT发布,该系统可模拟人脑的神经思考模式,翻译出与人工翻译相媲美的译文。同年,微软在Switchboard对话语义识别达到人类水平,讯飞上线NMT系统,神经机器翻译开始被大规模运用。科学杂志Nature梳理了2016年科技领域的十大打破,排在首位的便是人工智能,个中提及人工智能的机器翻译使缺点减少了约60%。随后,Facebook的人工智能研究团队开拓了一种新的神经机器翻译算法,在三种机器翻译任务上得分高于所有同类系统。2017 年,微软在斯坦福问答数据集 SQuAD 上达到人类水平。机器翻译的发展速率远远超出人们的想象,但是对付机器翻译是否能够真正完备代替人工翻译,学界仍旧辩论不休。
机器翻译取代人工翻译
目前而言,一部分专家认为机器翻译很快会达到人工翻译水平,在不远的将来会完备取代人工翻译。2010年,谷歌机器翻译专家欧赫认为文本机器翻译是合理有效的,真正的寻衅只在语音识别方面。他提出,未来几年即有可能实现手机端语音到语音的自动翻译。2019年2月《卫报》刊登《机器翻译的时期是否已经到来》一文,美国韦弗利实验室(Waverly Labs)的安德鲁·奥乔亚表示“在未来十到十二年内,机器翻译技能可与人工翻译相媲美,乃至超过人工翻译的水平”。
专家们对付机器翻译的信心来自最新一代的翻译技能——神经网络翻译。神经网络翻译打造的机器翻译系统,采取了一系列新的学习手段来仿照人工翻译。首先,利用人工智能任务的天然对称性进行对偶学习。当演习集中的一个中文句子被翻译成英文后,系统会将相应的英文结果再翻译回中文,并与原始的中文句子进行比对,进而从这个比对结果中学习有用的反馈信息,对机器翻译模型进行改动。其次,利用考虑网络,仿照人们写作时不断考虑、修正的过程。这样,通过多轮翻译,不断地检讨、完善翻译的结果,使翻译的质量得到大幅提升。再次,采取联合演习的方法迭代改进翻译系统。用中英翻译的句子对去补充反向翻译系统的演习数据集,同样的过程也可以反向进行。末了,采取同等性规范让翻译可以从左到右进行,也可以从右到左进行,终极让两个过程天生同等的翻译结果。这一系列技能有效模拟了人工翻译的过程,极大提升了机器翻译的整体质量。
除此之外,机器翻译干系学科之间的互动更加频繁,互助更加紧密。翻译界和技能界都呈现出了更大的原谅性,干系人士达成一定共识,即过去那种把措辞学家打消在外,仅依赖技能界,专一做数据、剖析开拓系统的做法是不可取的。在措辞学和翻译学领域,越来越多的人开始关注机器翻译,对技能运用探索也不再一味抵触,开始从用户和市场需求的角度来客不雅观看待不同层级和不同受众的措辞做事,打算机赞助翻译在专业翻译领域发挥着越来越主要的浸染。
机器翻译技能仍备受质疑
对付现有的机器翻译技能,很多学者也表示质疑。一方面,他们认为机器翻译的广泛适用性还有待稽核。只管机器翻译在某些测试中精确率较高,而且在某些领域靠近或超过人工译员,但是这些测试只是针对特定例模的文本,要想达到测试水平,必须知足对付源措辞和环境的苛刻哀求。在笔译方面,冯志伟在《机器翻译研究》中表示,目前的机器翻译系统对普通文本的翻译在可读性和准确性方面离人们的实际需求还有相称大的间隔。机器翻译系统对普通文本的翻译,常日须要大量的译后审校事情才能使译文达到出版的哀求,所花费的韶光和用度每每会超过纯人工翻译。在口译方面,中国科学院自动化研究所宗成庆在《机器翻译的梦想与现实》中指出,在日常口语对话中,目前口语机器翻译仅能对资源较为充分的措辞(如英汉、日汉等),在说话场景不是非常繁芜、口音基本标准、语速基本正常、利用词汇和句型不是非常生僻的情形下,可基本知足正常互换的须要。
另一方面,针对机器翻译的译文整体水平,目前还没有建立起专业合理的评价体系。目前利用较多的是BLEU和METEOR标准,BLEU评测由IBM公司于2002年提出,认为翻译系统的译文越靠近人工翻译,翻译的质量就越高。该评测通过剖析候选译文和参考译文中n元组共同涌现的程度来定义系统译文与参考译文之间的相似度,缺陷在于没有考虑翻译的召回率。METEOR标准于2004年由Lavir提出。研究表明,召回率根本上的标准比较于那些纯挚基于精度的标准(如BLEU),其结果和人工判断的结果有较高干系性。微软环球技能院院士黄学东表示,“当机器翻译质量很差的时候,利用 BLEU 评分还行,但是当机器翻译质量提高往后,就须要靠人类来评价”。但人工评价很难保持统一的标准,以是有些专家直接否定了现有的评价体系以及将译文水平量化的做法。美国印第安纳大学侯世达教授在《论谷歌翻译的浅薄》一文中表示,“这是一种对无法量化的事物进行量化的伪科学,用看上去很科学的图表去证明翻译质量,不过是对科学方法的滥用而已”。
机器翻译不可能代替人工翻译
神经网络翻译技能的运用带动了机器翻译的飞速发展,使得一部分学者对此非常乐不雅观,但也有许多学者对此提出了批评。措辞学和翻译学界的很多学者认为目前机器翻译的发展有限,“信”尚且未达成,更遑论取代人工翻译。多位学者表示人在翻译中的主动性和创造性是机器无法比拟的。如美国加州大学伯克利分校措辞学系教授乔治·莱考夫与美国俄勒冈大学哲学系教授马克·约翰森在《我们赖以生存的隐喻》一书中提出,措辞在实质上更多是隐喻性而非事实性的。人类措辞习得常基于对抽象的、具有比喻意义的观点的学习,向机器阐明这些观点非常困难,文学翻译更是机器翻译难以超出的鸿沟。胡壮麟在《措辞学教程》中提出,仅靠文本分析、忽略现实、没有“人”这一主体参与的“机器翻译”,是站不住脚的。
专家们认为测试中机器翻译技能的进步带来的译文虽有改进,但不论文本翻译还是口译,机器翻译的质量远没有达到令人满意的水平。只管机器翻译已迭代至神经网络翻译,宗成庆研究员在《机器翻译的梦想与现实》中指出,目前的翻译系统“难以准确处理篇章范围内的指代问题,无法准确区分由于细微笔墨或句法差异造成的句子语义反转,无法从译员译后编辑过程中自动学习翻译知识。在繁芜长句翻译中大量涌现漏翻、错翻温柔序颠倒;面对原文的噪声束手无策;鄙谚针言的翻译仍是不可占领的堡垒,机器同声传译的语音识别问题仍旧没有很好地办理”。清华大学智能技能与系统实验室主任刘洋在《基于深度学习的机器翻译》的报告中提到了机器翻译的进展和面临的三个寻衅,知识整合、阐明性和对噪声具有鲁棒性。现有的研究正针对这三个寻衅进行系统优化,但从理论研究到运用还须要连续努力。
人机协同是一定趋势
笔者认为机器翻译和人工翻译各有上风,人机协同是一定趋势。随着措辞学、打算机科学、认知心理学等学科的发展以及以上学科在机器翻译领域的进一步互助,机器翻译技能的迭代必将以更快的速率持续发生,从而推动机器翻译的质量不断提升至靠近乃至在一定条件下达到或超过人工翻译的水平。但是在情绪、文化等须要对措辞进行深度理解的情形下,机器翻译并不能完备代替人工翻译。二者将在理论发展、技能进步与市场推动的多重浸染下,成为紧密结合互补的有机整体,实现真正意义上的人机协同。
人工智能旨在让打算机复制人类的行为。看、听、行动、操持都是范例的人类行为,而个中最繁芜的任务是沟通,最难的是具备翻译的能力。这便是人工智能研究职员将办理机器翻译问题看作实现人工智能关键的缘故原由。人工智能的时期已经到来,与措辞做事业发达发展态势相适应的是,传统意义上的译者角色已知足不了新时期措辞做事提出的新哀求。技能必将逐渐改变人们的事情、生活办法,实现消灭措辞障碍的终极目标。在这个过程中,机器翻译可以减少译员大量重复、翻译难度较低的劳动,避免翻译疲倦、提高翻译效率,替代诸如景象预报查询、旅社预订做事、交通信息咨询等低端翻译职员,但不可能取代高端翻译(如主要文献、文学名著等翻译)职员,更不会肃清翻译职业。如刘星光在《中国机器翻译研究述评:问题与对策》一书中提出,机器翻译与人工翻译并不抵牾,机器翻译和人工翻译我们都须要,这要根据所翻译的材料而定。
“机器会翻译了,人类就不须要学习外语”的思维逻辑与“有了打算器,就可以不用学算术”一样无稽。纵然未来人工智能翻译在准确性和速率上超越了人工翻译,人工翻译在传达情绪、文化以及措辞深层含义方面的浸染仍不可替代。低端译员的淘汰,实质上讲,是行业内部良好劣汰加速的结果,机器翻译的涌现只是加快了这一进程。人机协同是人工翻译在人工智能时期下的一定选择,也是提升行业质量与竞争力的必由之路。正如赵联斌在《论机器翻译时期人工译员与机器译员的共轭相生》一文中提到,“未来的人工译者绝不是仅懂打算机技能或仅具备双语能力的人,而应是集打算机能力与双语能力于一体的复合型人才”。
(作者单位:厦门大学嘉庚学院)
来源:中国社会科学网-中国社会科学报 作者:林杨琼
获取更多学术资讯 请关注中国社会科学网官方微信公众年夜众号cssn_cn。
本文系作者个人观点,不代表本站立场,转载请注明出处!