清华大年夜学唐杰教授:常识与数据双轮驱动用认知智能洞悉技能未来_人工智能_技巧
2021 年 4 月 11 日,2020 年吴文俊人工智能科学技能奖十周年颁奖盛典暨 2020 中国人工智能家昔时会在苏州举办。清华大学打算机系教授、副系主任唐杰受邀在年会主论坛上揭橥主题报告《浅谈人工智能 “十年”》。
图 | 清华大学打算机系唐杰教授
在报告中,唐杰教授先容了人工智能领域即将发生的变革:通过深度地领悟知识和数据,我们将让人工智能领域发生重大的技能革命,并可以洞悉人类的技能未来。
以下是经由编辑的报告实录。
第三波人工智能革命已经来临
当代人工智能最早发源于 1956 年的达特茅斯会议,那时人工智能的紧张流派是符号人工智能。也便是让机器描述人类的知识。此后的第二代人工智能是感知人工智能,也便是让机器感知外部环境。这种方法依赖大量数据驱动的统计学习方法,实现针对笔墨、图片和语音等信息的感知和识别。
第二代人工智能涌现和成熟后,人工智能领域迎来了一波爆发。通过人工智能,在我们原来认为机器不可能完成的事情上,人类的能力已经被机器遇上,比如人脸识别等。
不过,这两种人工智能的流派都有问题。在知识驱动的人工智能框架中,人们建立了大规模的知识库和知识库,然后试图让机器把人类所有的知识都描述出来。但这种方法无法动态变革,也就无法适应大规模的数据和灵巧多变的知识。而在数据驱动的感知人工智能框架中,打算机模型没法办理认知的问题,也没有办法做推理。
以是,人工智能急需一次新的打破和创新。而现在,人类也确实已经站在了第三代人工智能开启的前夜,以是我们须要明确第三代人工智能的发展方向:领悟知识和数据,搭建一个双轮驱动的人工智能框架。
双轮驱动:人工智能的未来
在这个新的框架里,大略地把知识和数据叠加起来是弗成的,由于数据与知识的领悟任务面对着很多打算科学理论、算法和根本举动步伐的寻衅。只有战胜了这些寻衅,让机器把所有的数据和知识都真正的利用起来,才能实现真正的智能。
为了应对这一寻衅,我们在清华成立了知识智能的联合实验室,还通过清华大学孵化了一家技能公司智谱华章,核心研究思路便是研究数据和知识双轮驱动,并形成技能转化。
图 | 数据与知识的双轮驱动
详细来说,双轮驱动的数据部分,我们做了一个超大的措辞预演习模型,要能在数据上做到 “举十返一”,也便是说要具备归纳能力,从数据中把一些有深度的知识抽取出来。而双轮中的知识部分,则要做到 “举一反三”,可以进行逻辑推理。这样我们结合了知识、数据、逻辑和推理,形成了一个大规模的认知图谱。
我们基于认知图谱,推出了一个新的大型工程 “知因”,希望可以通过这个工程,构造知识成因,发掘科技创新源动力。并以此在未来阐明知识如何推动创新,并给出一个预见的思路。
在这个工程中,我们已经取得了一些技能打破。首先在知识层面,我们搭建了一个规模很大、性能稳定的知识图谱;在数据方面我们,我们演习了一个神经网络巨模型 “悟道”。这个模型可以智能化地、有逻辑地思考,还能根据人类的需求和问题,作出回答、吟诗作画,天生***。例如,如果我们哀求 “悟道” 根据唐朝墨客王勃的风格写一首以 “悟道” 为主题的诗歌,诗歌中会包含以下两句:“慧业苦研久成,禅风散尽见真际。” 个中前一句描述了通过超大规模数据和超大规模算力来做打算的过程,后面这句描述了终极从数据中挖掘出知识后的感悟。除了写诗以外,悟道还能天生一段话、根据一句话作图,以及天生***。
图 | 悟道模型以 “悟道” 为主题天生的诗歌
总的来说,我们通过知识图谱和巨模型等技能,在数据中结合了知识,做了一些双轮驱动地推动人工智能领域的事情。我们的目标便是让下一代的机器中的人工智能在 10 年后,能把知识和数据交融贯通,像人类一样思考未来。
认知智能洞悉技能趋势
利用我们提出的双轮驱动的认知智能技能框架,我们首先研究的便是科学技能领域的脉络。由于科学技能前沿是人类知识最富集的领域,以是也是让具有认知能力的人工智能发挥性能的最佳场所。通过对学术论文、专利等科技信息进行剖析,我们可以自动地创造和剖析很多主要的科技进展趋势。
举个例子,我们都知道美国对中国的芯片技能存在新型技能出口牵制,可能也会知道光刻机是一个主要的被牵制的技能。以是我们就希望在芯片(特殊是光刻机)领域研究一下,我们详细被牵制的关键技能点是什么。
通过认知智能模型,我们可以自动天生芯片的整体技能脉络。个中,光刻机是技能脉络中的一个点。光刻机下贱是一些干系的芯片制造技能,上游则是流体力学和激光物理这些相对理论的技能。在用认知智能进行技能剖析后,我们创造了两个被卡脖子的技能,就分别存在于流体力学和激光物理学这两个领域。
2001 年,麻省理工学院的 Mordechai Rothschild 揭橥论文提出了浸没式光刻技能。2004 年,林本坚为这个技能申请了一个专利,这项专利也成为了全体台积电的内核。此后,台积电和荷兰的阿斯麦(ASML)互助,极大地扩展了后者的光刻机市场。2006 年,激光物理领域里涌现了极紫外光源技能,个中有两个专利由 RP.Akins 发明,他依赖这两个技能成立了一个叫 Cymer 的公司。2012 年,阿斯麦收购了 Cymer 公司,于是迅速垄断了天下上 70% 的光刻机市场。同一年,英特尔投资了阿斯麦,协议中包括知足对另一个国家施加压力的条款。终极,中国正是在这一个条款下被卡了脖子。
图 | 利用认知智能剖析芯片领域的关键技能点
通过上图,我们可以看到全体故事背景,蓝色的线条贯穿了不同的技能脉络,正是这些技能组成了我们在芯片领域中急需的技能。这便是我们说追根溯源,探求实质。
以上的技能剖析如果用传统的方法是没有可能完成的。如果只靠知识,本钱会非常高,之前类似的项目都基本结束了。如果纯靠数据驱动的机器学习方法,则没有办法产生推理和认知的能力,难以洞悉技能脉络的实质。
2021 年度 AI 2000 正式发布
利用上面先容的模型框架,我们搭建了一个科技趋势剖析的系统https://analysis.aminer.cn/。在这个别系中,我们依赖数据和知识双轮驱动的方法,对技能追根朔源,进行深度解析。比如,在系统中,我们可以看到过去 10 年中最主要的技能,以及这些技能到底是如何产生的,发展过程中存在哪些主要事宜和打破。我们还能自动判断这些技能目前所处的状态,并预测它们未来发展的趋势。
我们还发布了 AI Open Index,这是一个行业趋势剖析的系列研究报告。个中的《2021 年度 AI 2000》榜单包括了人工智能领域中高影响力的学者做出了精准画像。自去年开始,《AI 2000》每年都会发布 200 名 “AI 2000 最具影响力学者奖”,以及 1800 名提名奖。估量到 2029 年,会有 2000 逻辑学者获奖。
图 | 清华大学 AMiner 发布的 AI Open Index 系列榜单
《AI 2000》的评比流程包括约请专家指定的 49 家顶级的期刊会议。随后,清华大学 AMiner 采取智能算法,从这些期刊会议中提取了 17.8 万篇论文和 20 万名作者,自动天生影响力排名。终极,从每个人工智能的子领域中选择 100 名被提逻辑学者和 10 名获奖学者。
从国家的角度来说,有 58.2% 的学者来自美国。中国的获奖学者数占比 11.1%,可以排到第二。来自德国的学者数排名第三,是欧洲学者数量最多的国家。其他国家的学者数量均在 100 人次以下。
从机构的角度来说,排在前两位的机构都是企业,分别是谷歌和微软。清华大学是唯一进入前十的中国机构。
此外,我们还可以在 AI Open Index 上查看《人工智能环球女性榜单》和《环球人工智能最具创新力城市榜单》。在环球人工智能创新城市 500 强中,中国有 32 个城市上榜。
以是,在人工智能技能的发展长河中,我们现在已经到了一个变革的韶光节点。我们须要利用智能技能,既知其然,又知其以是然。我们要探究每一件事情的实质,我们要知道科技发展的缘故原由,也要知道科技发展的未来。以是我们把这项大工程叫做知识基因工程。我们希望利用知识和数据的双轮驱动技能,解构知识发展成因,挖掘科技创新的原动力,预见未来,引领未来。
传送门——
“悟道” 作诗链接:
https://turing-poet.aminer.cn/index.html
“悟道” 画作天生
https://lab.aminer.cn/cogview/index.html
科技趋势剖析
https://analysis.aminer.cn/
AI Open Index
http://aiopenindex.com/
《2021 年人工智能环球最具影响力学者报告》***链接:
https://static.aminer.cn/misc/pdf/AI200021.pdf
《人工智能发展报告 2020》***链接:
https://static.aminer.cn/misc/pdf/zpAIreport2020.pdf
本文系作者个人观点,不代表本站立场,转载请注明出处!