王海峰 百度首席技能官、ACL/CAAI Fellow

演讲实录丨王海峰:AI 新基建加速家当智能化_常识_技巧 科技快讯

以下是王海峰的演讲实录:

我本日与大家分享的主题是《AI 新基建加速家当智能化》。

新基建通过培植新型根本举动步伐,促进经济高质量发展。
详细来讲,新型根本举动步伐包括信息根本举动步伐、领悟根本举动步伐和创新根本举动步伐。
这些新型根本举动步伐以新发展理念为引领,以技能创新为驱动,以信息网络为根本,面向高质量发展,供应数字转型、智能升级和领悟创新等做事。
AI 既是新基建重点培植的新型根本举动步伐,同时也与其他新型根本举动步伐有主要的协同效应。

现阶段,AI 已经成为新一轮科技革命和家当变革的主要驱动力量,正在引领人类社会进入第四次工业革命。
从人类历史上的历次工业革命来看,其核心技能都有很强的通用性。
例如第一次工业革命的机器技能,第二次工业革命的电气技能,以及第三次的信息技能,都是如此。
作为第四次工业革命的核心驱动力量,人工智能也具有很强的通用性,已经在很多行业发挥了主要浸染,并已具备标准化、自动化和模块化的工业大生产特色。
AI 已经进入工业大生产阶段。

根据IDC 报告, 环球数据从2018 年的33ZB 估量增长到2025 年的175 ZB,年增速27%;从2006—2020 年,芯片的打算性能提升600 多倍;数据井喷、算力打破以及深度学习等算法上的创新,共同促进了AI 的高速发展。
因此一个完备的AI 根本举动步伐要包括算法、算力和数据等各个方面。
百度培植的AI 根本举动步伐便是百度大脑。
经由多年的培植,百度大脑已经发展为一个软硬一体的AI 大生产平台,具有很强的通用性,并且具备了标准化、自动化和模块化的特色。

同时,我们将百度大脑具备的AI 根本技能能力,通过百度智能云向各行各业输出,助力家当智能化升级。
百度智能云在百度大脑的根本上,面向家当运用供应了多层次的平台,以及行业智能运用和行业办理方案。

百度大脑包括根本层的算力和数据技能,以及以飞桨为核心的算法平台;感知层包括语音、视觉、增强现实和虚拟现实等技能;认知层包括措辞与知识技能;此外,还有直通各层的完全的安全体系。

算力方面,百度的数据中央已覆盖环球10余个国家和地区,形成了强大的算力根本。
同时应培植AI 根本举动步伐的须要,百度也自研了AI 通用途理器——百度昆仑芯片。
昆仑芯片与深度学习平台飞桨深度结合,针对语音、图像和自然措辞处理等AI 模型进行优化,性能大幅提升。

深度学习平台向下对接芯片,向上承载运用,是AI 时期的操作系统,也是AI 根本举动步伐的核心根本。
飞桨是我国首个功能完备的家当级深度学习开源开放平台,既包括技能领先、能力完备的核心框架,也包括大量充分验证的家当级模型库,以及丰富的开拓套件和工具组件。
飞桨深度学习平台所包含的大量领先技能,可以总结为四个方面,即开拓便捷的深度学习框架、超大规模深度学习模型演习技能、多端多平台支配的高性能推理引擎,以及丰富的家当级开源模型库。

首先,我们看开拓便捷的家当级深度学习框架。
飞桨深度学习框架既支持静态图和动态图,也可以做网络构造的自动设计。
飞桨的超大规模深度学习演习平台可以支持百亿演习数据、千亿特色和万亿参数任务的分布式演习,也可以支持千万类别的大规模分类任务分布式演习。
所有演习出来的模型,终极要支配到各个端上,供应用所利用。
飞桨的高性能推理引擎可以支持多端、多平台的支配,也可以与其他深度学习框架无缝衔接。
所支持的平台,包括险些所有主流的CPU和GPU 平台,以及FPGA 等,同时支持多种操作系统。
飞桨的通用框架推理速率全面领先。
深度学习框架是深度学习平台的核心根本,开拓者真正利用深度学习平台时,每每还须要针对它的运用处景的各种模型库。
因此,飞桨也供应了非常丰富的而且经由家当验证的模型库,覆盖了险些AI 的各个主要运用方向。
比如打算机视觉的模型库、自然措辞处理的模型库、语音的库和推举的库等。
这些库又分为不同层次,包括算法层和任务层等,也包括端到真个开拓套件。
现在飞桨已经拥有140 多个模型,200 多个工业级预演习模型。

下面先容百度大脑的核心技能能力,包括感知层和认知层的各个能力。
首先看一下语音技能。
百度从2010 年开始研发语音识别技能,而2012 年开始利用深度学习来开拓语音识别系统,发展到目前已经创新研发了流式多级截断把稳力模型,使得语音识别的效果大幅提升,同时研制了声学增强和声学建模一体化的端到端模型。
这个语音识别系统不仅可以用在电脑和手机等一些常见的运用处景,现在越来越多的也运用于一些远场语音识别的场景,比如家居场景和车载场景等。
处理远场语音时须要麦克风阵列,因此研发了基于麦克风阵列的声音增强和声学建模一体化的端到端识别,使得语音识别的字缺点率降落了40%~50%,线上产品交互成功率也有大幅提升。
语音合成比较语音识别来讲,虽然拥抱深度学习略晚一些,但近年来我们已经大规模运用,并取得很大进展。
比如从并行化的wavernn 发展到基于Gan 的超高清wavernn 语音合成技能。
传统的语音合成每每只能供应少量人的声音,这些声音虽然很清晰也很流畅,但风格比较单一。
通过百度大脑最新的语音合成技能,可以动态组合声音的音色和风格,使得单一风格的合成音具备向多种风格迁移的能力。
下面请大家听几段声音。
第一段是一个真人的声音。
拥有了这样一段真人的声音后,我们可以提取其声音的各种特色,合成各种其他的声音,比如英文。
大家可以听到,虽然语音由中文变成了英文,但很好地保持了这个人的声音特色。
接下来再听两种风格,分别是讲故事和脱口秀。
我们可以听到百度大脑合成的声音,都很好地保持了真人的原声特色。
基于这样的千人千面和单人千面的语音合成技能,我们就可以针对各种运用处景去合成所须要的声音。
例如,在百度舆图里就有这样一个可以支持每个人用自己专属的声音,来为自己导航的能力。
比如,很多用户将自己孩子的声音用百度大脑合成,每天听着自己孩子的声音为自己导航,去高下班。

百度的视觉技能布局也很全面,包括图像、***、增强现实和虚拟现实等,以及包括各种垂类。
比如我们识别车辆、笔墨和人体等,视觉技能根据运用处景的不同也须要软硬一体化。
以是也开拓了很多视觉AI 的sdk、三维构造光模组等。
所有这些能力也通过开放平台对外供应做事。
这里我们可以看到更多的视觉技能。
比如***的语义剖析、比拟检索、影视剧长***的识别和***封面的选取等;还包括图像的相似图检索,通用物体场景识别,以及和人干系的活体检测、关键点定位、卡证识别等。

下面再看一下认知层。
措辞和知识都与人的认知干系,知识是人类聪慧的结晶,知识的沉淀和传承支撑着人类不断进步。
措辞不但是人类沟通互换的工具,也是知识沉淀和传承的载体。
从AI 技能角度,措辞与知识技能密切干系。
百度的措辞与知识技能包括知识图谱、措辞理解、措辞天生,以及智能搜索、深度问答、机器翻译、对话系统和智能写作等各种运用。
最根本的是知识图谱。
为了从弘大的数据,包括互联网大数据,以及各种行业数据中挖掘知识,须要进行大规模的知识挖掘,也须要进行知识的归一领悟和知识补全。
在此根本上,我们构建了弘大的知识图谱;基于这些图谱,进一步对知识进行推理,打算以及检索等。
基于多源异构大数据,我们构建了天下上最大规模的知识图谱。
百度的知识图谱现在已经有超过50 亿的实体,以及超过5 500 亿的事实。
这样一个弘大的知识图谱,既包括根本的由实体属性构成的实体图谱,也包括面向各种运用所需的图谱,例如POI 图谱、行业图谱和***理解图谱等。

措辞是人类沟通互换的基本工具,因此AI的主要任务之一便是理解措辞。
经由几十年的发展,对自然措辞的理解已经逐渐从词法、句法进入到语义理解阶段。
百度研发的知识增强的语义理解框架文心(ERNIE)具备了两个非常主要的能力,一个是将深度学习与知识进行结合,从而打造了知识增强的语义理解框架;另一个是这样一个语义理解框架还可以进行持续的学习,使得措辞理解的能力不断提升。
这张图中淡蓝色线条是当前最好的结果。
在此根本上我们利用知识增强的语义理解框架,效果得到了明显提升。
进一步地,再基于此持续增加知识,比如增加对话知识、篇章构造知识、网页知识,以及增加语义关系知识等。
可以看到,ERNIE 的语义理解能力还会不断增强。
这是非常主要的一个特性。
有了这样一个特性,我们就可以让AI 的措辞理解能力持续得到提升,而且是在实际运用中不断地富集数据,效果越来越好。
下边的运用效果,即展示了在不同运用上都使得原有的运用效果有了一个非常显著的提升。
ERNIE 不仅能理解自然措辞,同时也与其他的感知层技能相结合,形成跨模态语义理解。
例如,这里展示的是ERNIE 与打算机视觉技能相结合,发布的业界首个领悟场景图知识的跨模态预演习模型ERNIE-ViL,在跨模态领域威信榜单视觉知识推理任务(VCR)上取得第一。

前面先容的是百度打造的AI 根本举动步伐- 百度大脑的各项核心技能。
在百度大脑这个技能平台的根本上,我们通过百度智能云,将百度的AI 能力向各行各业输出,助力各行各业的智能化升级,加速家当智能化的进程。
这是百度智能云的全景图,包括平台,也包括行业智能运用和行业办理方案。

根本云平台是百度智能云的基座,充分发挥技能上风和实践积累,形成了完备的产品和做事体系,支撑了各种上层运用。
首先是弹性的根本举动步伐,包括大规模数据中央、高性能打算和存储、自研芯片与高性能网络等。
在此之上,形成了全系列产品,包括云主机、云存储、云安全等,为客户供应全场景覆盖、高性价比、易运维、安全合规、高弹性的办理方案和做事。

接下来我再讲一下AI 中台。
首先企业智能化升级须要AI,而AI 也须要与企业运用处景深度结合,但是很多企业缺少AI 的根本能力和平台。
为此,我们基于百度大脑定制一个企业专属的AI平台,集约化管理企业的AI 能力,统筹企业的智能化升级。
这里包括AI 的能力引擎,也包括AI 的开拓平台,同时还包括数据管理、做事管理、权限管理、资源管理和运维管理等根本管理能力。
例如,百度智能云为国家电网山东电力打造的AI中台,已经支撑了山东电力的施工机器检测、浓烟和山火的检测、导线异物的检测,以及VIP 客户的识别等,为国网山东电力实现业务智能化供应了很好的支持。

前面先容百度大脑时,我曾提到过知识,我们都知道书本是人类进步的阶梯,而在这里我要说,知识是AI 进步的阶梯。
对付每一家企业都会有自己特有的知识,但同时浩瀚企业每每又缺少构建和利用知识的能力。
因此,百度智能云也为企业量身打造了知识中台,助力企业的智能化升级。
知识中台可以帮助企业凝炼知识,赋能业务,进而助力企业的智能化升级。
知识中台以AI 的各项核心技能为根本,其核心能力则包括知识的生产、知识的加工及知识的运用。
在此根本上,可以形成企业知识干系的产品矩阵,如企业搜索、智能推举、智能知识库、行业知识图谱和决策引擎等。

为企业量身打造的AI 中台和知识中台,可以支撑企业运行的方方面面进行智能化升级。
个中也包括办公的智能化升级。
众所周知,前几次工业革命为人类带来了工业生产的流水线,流水线使得工业生产的效率大幅提升。
而在AI 时期,基于AI 中台和知识中台,也可以打造AI 时期的办公流水线,进而使智能时期的办公效率大幅提升。
常日一个智能办公正台,我认为该当包括下面这些流水线,例如可以支持同事之间的沟通群组、企业通讯录等的通讯流,支持日程安排、会议、组织、日程提醒、项目设定、进展跟踪、协同协作等的事情流,以及企业内部丰富知识的检索、推举、问答等的知识流。
百度打造的新一代智能办公正台是如流,我们希望在如流的支持下,AI 时期的办公如行云流水一样平常流畅。
这里展示的便是如流产品的事情流、通讯流和知识流的样式。
在这些流的支撑下,我们的事情效率在快速提升。

我们所生活的城市也是AI 赋能的主要场景。
百度智能云供应的聪慧城市办理方案,包括城市感知中台,可以进行多源数据的采集以及全要素映射;也包括城市AI 中台,卖力城市算法、算力调度和运营管理等;还包括城市数据中台,卖力城市数据的领悟、管理和剖析。
当然也有主要的城市交互中台,包括时空一张图,以及智能一键搜等。
在此根本上,支持城市的各种智能运用处景,例如应急管理、城市管理、公共安全、智能交通、聪慧园区、聪慧教诲等。
我们希望百度智能云供应的聪慧城市办理方案,可以让城市变得更加安全,更加从容、通畅和宜居。

这是百度城市大脑运用的一些例子。
基于百度舆图整合路网工地和卫星数据,可以进行渣土车的行驶轨迹跟踪,使渣土车的管理更加高效。
城市里还有一个很主要的运用处景——交通。
百度聪慧城市的办理方案里,也包括智能交通的办理方案,例如智能信控和车路协同等。
这些方案也是基于百度大脑的飞桨等各种技能,以及各种来源的数据。
通过对这些数据进行加工处理,保障在业务层能够高效运转。
再举一些其他运用处景的例子。
比如在气候领域,我们基于气候大数据平台,以及百度大脑供应的BML机器学习平台,打造专门运用于气候领域的气候大脑,进而支持气候的各种运用;比如景象预报、大水预报,以及利用气候卫星监测火点等。

在金融领域,我们也供应了金融的根本平台,包括前面提到的AI 中台、知识中台,以及金融领域所须要的金融云、金融分布式数据库、金融图数据库、区块链等。
基于这样一个金融的根本平台,支撑金融的各种智能运用,比如智能风控、智能营销、数字员工及风险识别、风险预测、风险定价等,从而形成完全的聪慧金融办理方案。
从获客、风控和运营等各个方面,都为金融供应了很好的智能化办理方案。
百度智能云的聪慧金融已包办事了约200 家金融客户,运用于10 多个金融场景,同时也和30 多家互助伙伴一起,致力于为金融客户供应最好的做事。

医疗也是和我们每个人都非常干系的一个领域,而提升医疗水平无疑可以造福全体社会。
百度智能云打造的聪慧医疗体系,包括医疗AI 中台和医疗知识中台。
医疗的AI 中台里,包括医疗影像筛查、疾病赞助诊断、治疗方案推举、病历构造化、医疗语音识别和医嘱质控等核心技能;而知识中台包括医疗知识图谱和医疗知识库。
基于医疗的AI 中台和知识中台,我们可以供应各种医疗智能运用,例如眼底筛查、新冠肺炎筛查、临床赞助决策、合理用药、病案质控和慢病管理等,覆盖了筛、诊、管等各方面。
我们希望通过循证AI 抖擞医疗的新活力,百度聪慧医疗已经从技能落地,发展到了规模化运用阶段,覆盖全国27 个省市自治区、1500 多家基层医疗机构,做事人次已经超过2500 万。

百度智能云也在工业制造领域发挥浸染,通过AI 中台和数据中台的赋能,支持制造业的智能化升级,供应了智能质检、工艺优化和排产排程等。
AI 运用所覆盖的行业,已包括钢铁、水务、电力、3C 和汽车等,帮助这些行业创新提质降本。
例如,工业质检可以实现3C 眇小零部件的检测,这些检测能力已经规模化落地多家工厂,包括条记本外壳的检测,也已经规模化落地多家条记本工厂。
再如总装车灯检测,检测职员须要避免外界光源对车灯检测的滋扰,并且检测节拍较短,检测速率哀求很高。
AI 能力在这里发挥了很主要的浸染。
再如工业安全巡检,在工厂里工人是否符合安全规范,比如是否带了安全帽、是否去了不应该去的区域等都可以准确的检测出来;以及对吊车导线异物、烟火、塔吊、施工机器等多类型繁芜场景的智能检测,准确率很高,已经广泛运用。

针对AI 家当化落地中面临的安全威胁和寻衅,百度持续开展安全技能创新和工程实践,不断完善一体化的安全体系。
百度打造的完备安全体系,包括AI 模型安全、云原平生安、端边云领悟安全、数据安全和隐私保护、行业运用安全办理方案、行业生态安全等;同时将这些安全能力通过百度智能云输出,为家当智能化升级保驾护航。

培植AI 根本举动步伐,加速家当智能化。
百度与各界携手,推动“新基建”,共创新未来!

(本报告根据速记整理)

CAAI原创 丨 作者王海峰

未经授权严禁转载及翻译

如需转载互助请向学会或本人申请

转发请注明转自中国人工智能学会