王海峰谈人工智能:语音合成也取得巨大进展_技巧_措辞
王海峰表示,迄今为止人类经历的三次工业革命,分别以机器技能、电气技能和信息技能为核心驱动力,而这些技能都表现出很强的通用性。当前,我们身处以人工智能为核心驱动力量的新一轮科技革命和家当变革大潮,人工智能正在将人类社会带入智能时期。
百度是海内投入最早、技能最强、布局最完全的AI领军企业,在AI技能领域保持领先上风,并积极培植人工智能开源开放平台,推动运用落地,促进家当智能化的发展。百度人工智能技能多年积累和业务实践的集大成——百度大脑布局完全,核心技能领先,既有根本的算法、数据和算力,也有语音、视觉、AR/VR 等感知技能,自然措辞处理、知识图谱等措辞与知识技能,还包括开源开放、支持家当运用的AI平台与生态,并打造了完全的AI安全防护体系。
近年来,在数据、算法和算力三要素的共同浸染下,人工智能技能取得巨大进步,尤其是深度学习领域打破显著。
语音识别的准确率不断提升,在很多场景中已经超过人类。百度今年实现了把稳力模型在大规模线上语音识别系统中的运用,同时准确率进一步提升。该技能运用于智能音箱和语音输入法等产品,实现高精准的中英文稠浊语音识别。
语音合成也取得巨大进展。百度前不久上线的并行WaveRNN模型,办理了WaveNet模型须要大量打算资源的问题,合成效果大幅提升,同时能够知足在线的实时需求。
通过结合端侧的算力,百度领先的语音技能正在发挥越来越大的代价。百度打造了一款针对远场语音交互的芯片“鸿鹄”,按照车规级打造,采取HiFi4自定义指令集,双核DSP核心,均匀功耗仅100mW,可实现远场阵列旗子暗记的实时处理和高精度低误报语音唤醒,并集成离线语音识别功能,适配车载语音交互、智能家居等各种场景。
打算机视觉技能也越来越实用化,形成适用于不同运用处景的技能矩阵,如笔墨识别(OCR)、图像处理、人脸/人体识别、图像天生、人机交互等。综合运用语音和视觉技能,机器可以自动合成虚拟形象。百度大脑的虚拟形象自动天生技能,可以对语音旗子暗记和***旗子暗记进行识别与理解,再通过唇动天生,以及语音、面部和肢体的合成,自动天生一个虚拟形象。
在认知技能上,百度建立了完全的、包含知识图谱、措辞理解、措辞天生等在内的措辞和知识技能体系,构建了天下上最大的多源异构知识图谱,在包含数亿实体、千亿级事实,能够知足90%用户需求的实体图谱的根本上,针对不同的运用处景和知识形态建立起关注点图谱、行业知识图谱、POI图谱、事宜图谱等多种知识图谱。例如***理解知识图谱,百度大脑结合视觉、语音和自然措辞处理技能解析多模态信息,并与知识图谱的干系实体建立关联,通过打算和推理,得到***内容的构造化语义表示,从而精确解析一部***中涌现的人物及其关系、音频、事宜、主题等信息。
在自然措辞处理方面,百度发布了基于知识增强的ERNIE 模型,通过建模海量数据中的实体观点等先验语义知识,学习真实天下的语义关系。这种领悟知识的语义建模大幅增强了模型的语义表示能力,在共计16个中英文自然措辞处理任务上超越了谷歌BERT和XLNet, 取得了SOTA效果。百度的措辞与知识技能已经广泛运用于机器同传、智能写作等产品中。在机器同传领域,百度综合联合词向量解码、语篇翻译模型等新技能,实现高准确、低时延的机器同传,并发布了语音到语音的机器同传系统:DuTongChuan(度同传),翻译效果极具竞争力。
人工智能技能快速发展,离不开算力的支撑。算法持续打破,算力缺口巨大,王海峰认为,这须要算法、打算架构等多方面努力来办理。
百度大脑的AI打算架构,实现了芯片、互联、系统和调度的协同设计和技能创新,并紧密结合百度飞桨(PaddlePaddle)演习与推理框架,供应面向算法优化的极致效率,并做到异构、无感的利用。
王海峰指出,在智能时期,深度学习框架起到承上启下的浸染,下接芯片,上承各种运用,是“智能时期的操作系统”。百度打造了中国首个也是目前海内唯一开源开放、功能完备的深度学习平台——百度飞桨。飞桨的核心框架,包括开拓、演习和预测,以及涵盖推举、视觉、自然措辞处理、语音等在内的丰富模型库。同时,飞桨供应包括迁移学习、强化学习、自动化网络构造设计、演习可视化工具、弹性深度学习打算、图神经网络等在内的工具组件,以及零根本定制化演习和做事平台EasyDL、一站式实训开拓平台AI Studio和端打算模型天生平台EasyEdge等做事平台。飞桨也与浪潮在算力层面进行互助,进一步降落深度学习运用门槛,加速推动家当智能化变革。
基于对中国度当的深度洞察和对中国开拓者的理解,飞桨具备五大核心上风:同时支持动态图和静态图的编程,能够兼顾易用性和效率;开源70多个经由真实业务场景验证的官方模型,涵盖视觉、NLP、推举等 AI核心技能领域;具备适用大规模数据场景的分布式演习能力,从优化算力的角度为深度学习的运用供应支撑;供应包括底层硬件、推理引擎、多种程序设计措辞、方案与做事工具在内的端到端全流程支配方案,助力家当开拓者实现运用的快速落地。同时,针对没有深度学习技能根本的开拓者,百度飞桨供应定制化演习和做事平台EasyDL,让他们可以基于自身业务需求和数据,快速演习定制化AI模型。
以百度飞桨深度学习平台为核心根本,百度大脑实现了AI算法、打算架构和运用处景领悟创新,成为“软硬一体AI大生产平台”。在数据和算力的根本上,打通了人工智能家当化运用落地的全部流程,实现了AI技能的标准化、自动化、模块化,助力开拓者快速实现运用,带来代价。
基于百度大脑AI平台,百度的AI技能已经运用于各行各业,带来了巨大的家当代价。王海峰以百度舆图AI化数据生产、水培蔬菜智能栽种,以及不同行业的运用为例,先容了人工智能助力家当智能化的效果。例如,百度飞桨基于遥感影像数据,研究高精度、高自动化的目标地物检测、地皮覆盖和地皮利用分类方法,可以赞助国家进行重大工程用地扩展与变革情形的监测事情,并对地皮资源的利用进行有效管理与掌握;基于视觉技能及深度学习算法构建的智能无土栽培办理方案,将原来农业专家的个人履历进行了数字化、产品化,使无土栽培作物生产具备了规模化生产的可能性。
据麦肯锡预测,人工智能将显著驱动经济增长,更快运用AI 的领跑者将得到更大的经济收益。现阶段,百度人工智能技能度持续发展打破和深度学习技能及平台的开源开放,将加速人工智能技能与家当领悟,加速家当智能化,让AI时期更快到来!
(李经)
本文系作者个人观点,不代表本站立场,转载请注明出处!