深度常识的6个维度:若何让人工智能真正理解世界?_常识_人工智能
作者 | Gadi Singer
编译 | 王玥
编辑 | 陈彩娴
什么知识让我们变得聪明?我们用来理解天下、阐明新体验和做出寻思熟虑的选择的认知构造是什么?定义一个阐明给人类或人工智能更深入理解和更高认知的知识的框架,将有助于我们对此话题进行构造化的谈论。
近日,英特尔实验室副总裁兼紧急人工智能研究主任Gadi Singer先容了这种授予人工智能更高认知的知识构建(knowledge constructs)的数个维度,并指出一条通往更高智能机器的道路。
图为英特尔实验室副总裁 Gadi Singer
更高层次的机器智能的核心,可能是让知识构建帮助人工智能系统组织自己的天下不雅观,授予人工智能理解意义、事宜和任务的能力。如此一来,机器认知将从数据扩展到知识构造,包括描述性知识、天下动态模型和起源等维度。
在学习措辞时,我们要区分形式(form)和意义(meaning):形式指的是用来表达意义的符号,也便是表面的表达。每种形式在特定的语境中都有特定的含义,而形式在不同的语境中可以有不同的含义。
正如Bengio和Schölkopf等人在“Towards Causal Representation Learning”一文中总结的那样:“目前机器学习的大多数成功都是源于对适当网络的独立和相同分布(i.i.d)数据的大规模模式识别。”系统接管可不雅观察到的元素,如文本字符、声音旗子暗记和图像像素,并建立模式和随机干系性,同时在基于识别的任务中产生出色的结果。
论文地址:https://arxiv.org/pdf/2102.11107.pdf
越来越多的人认为,算法必须超越表面干系性,达到真正理解的水平,从而实现更高水平的机器智能。这种彻底的转变将使所谓的System 2、3rdWave或广义/灵巧的 AI 成为可能。正如Gadi Singer在核心博客“认知人工智能的崛起”中所说的那样,更高水平的机器智能须要深层次的知识构建,这种知识构建可以将人工智能从表面干系性转化为真正理解这个天下。
美国国防部高等研究操持局(DARPA)的 John Launchbury 指出,在第三次人工智能浪潮中,抽象(比如创造新的意义)和推理(方案和决策)将掀起一场新革命。第三次浪潮本身的特点是语境适应,即系统为现实天下的各种征象构建语境阐明模型。
知识维度中有两个维度反响了对天下的意见,一个是描述性维度,描述性维度对天下上存在的事物进行了观点性的抽象,另一个是现实天下及其征象的动态模型。
此外,故事提升了人类在共同崇奉和神话根本上的理解和互换繁芜故事的能力。语境和来源归因以及代价和优先级是元知识维度,这些维度带来了基于条件的有效性和知识的不断叠加。末了,观点参考是构造根本,跨维度、模态和参考而存在。
这六个知识维度结合在一起,可以让人工智能不仅仅勾留在事宜干系性上,而是得到更深入的理解,由于这六个知识维度的潜在观点是持续的,可以阐明和预测过去和未来的事宜,乃至许可操持和干预,并考虑反事实的现实——因此文中利用了“深度知识(deep knowledge)”一词。
阐明和描述机器智能所需的知识构建类型,有助于确定实现这种知识构建的最佳办法,从而实现更高水平的机器智能。
1
支持更高水平智能的六大知识维度
对付人工智能系统来说,履行人类理解和互换中不雅观察到的知识构建可以为智能供应本色性的代价。当所有的知识类型都得到支持和组合时,实际代价会大幅增长。
图注:支持更高水平智能的知识维度。图源:Gadi Singer/英特尔实验室
1. 描述性知识:层次、分类和属性继续
描述性知识(即观点性的、命题性的或陈述性的知识)描述事物、事宜、事物/事宜的属性以及其之间的关系。假设利用(适当的)类或观点的分层,深度描述性知识就能扩展其原来的定义。这类知识可以包括事实和记录系统。与特定用例和环境干系的事实和信息可以作为层次知识进行组织、利用和更新。
单个人工智能系统中利用的根本本体(ontology)可以利用来自策划系统的与任务干系的类和实体(例如,OpenCyc本体或AMR命名的实体类型)进行播种。这种根本本体该当是可以通过神经网络/机器学习技能进行扩展——也便是说,获取新知识就会得到新的实体,关系和类。
2.天下模型
天下上的征象模型让人工智能系统能够理解情形、阐明输入/事宜以及预测潜在的未来结果并采纳行动。征象模型是抽象/概括,可以分为正式模型和近似(非正式)真实天下模型;征象模型许可在特定情形下对实例利用变量和运用程序,并许可对特定实例或更通用的类进行符号操作。
正式模型的例子包括逻辑、数学/代数和物理。与正式模型比较,现实天下的模型常日是履历的、实验性的、有时乃至显得有些混乱。现实天下的模型包括物理模型、生理模型和社会学模型。程序模型(“专有知识”)包括在这个类中。
因果模型可以帮助人工智能系统发展更上一层楼。在语境发生变革的情形下,如果与因果关系等知识模型相结合,并理解了掌握缘故原由的语境和考虑反事实的能力,那么过去的统计数据就可以有效地运用于现在从而预测未来。这些模型有助于早年提和可能成分的角度理解情形或事宜。因果推理是人类思想不可或缺的组成部分,通过这种办法可以实现人类聪慧级别的机器智能。
3. 故事和脚本
正如历史学家尤瓦尔·哈拉瑞所说,故事构成了个人和社会的文化和天下不雅观的关键部分。故事的观点对付充分理解和解释人类的行为和互换是必要的。故事是繁芜的,在一个连贯的阐述中可能包含多个事宜和各种信息。故事不仅仅是事实和事宜的凑集,故事还包含了主要的信息,这些信息有助于发展对所呈现数据之外的理解和概括。与天下模型不同的是,故事可以被视为具有历史意义、参考意义或精神意义。故事可以代表代价不雅观和经历,这些代价不雅观和经历会影响人们的崇奉和行为。例子包括宗教或民族故事、神话,以及在任何层次的人群等分享的故事。
4. 语境和来源归因
语境的定义是环绕着某个事宜并为其自作掩饰供应资源的框架。语境可以看作是一种覆盖的知识构造,调节着它所包含的知识。语境可以是持久的,也可以是短暂的。
持久的语境可以是长期的(比如从西方哲学角度或东方哲学角度获取的知识),也可以随着韶光的推移、根据新的学习材料而改变。持久语境不会对每个任务进行变动。
当特定确当地语境很主要时,瞬态语境是干系的。单词是根据其周围句子或段落的局部语境来阐明的。图像中感兴趣的区域常日在全体图像或***的语境中得到阐明。
持久语境和瞬态语境的结合可以为阐明和操作知识供应完全的设置。
知识的另一个干系方面是数据来源(别号数据追溯),其包括数据来源、在数据传播的过程中发生了什么以及随着韶光的推移数据将去往何方。人工智能系统不能假设所吸收的所有信息都是精确或可信的,尤其是在被称为“后原形时期”的情形下信息更不可轻易相信。将信息与其来源干系联可能是建立可信性、可认证性和可追溯性所必需的。
5. 代价和优先级(包括善/威胁和伦理)
知识的所有方面(例如,工具、观点或程序)在全体判断范围内都有相对应的代价——从最大的善到最大的恶都有对应。可以假设,人类智力的进化包括追求回报和避免风险(比如,追求吃午餐;避免被当成午餐)。这种风险/回报的关联与知识紧密相连。潜在的得失落具有功利代价;对付实体或潜在的未来状态,还有一种基于伦理的代价。这种基于伦理的代价反响了一种道德代价不雅观,即“善”不是基于潜在的有形回报或威胁,而是基于对什么是精确的潜在信念。
代价和优先级是元知识(meta-knowledge),其反响了人工智能系统对知识、行动和结果干系方面的主不雅观断定。这为问责制奠定了根本,该当由卖力特定人工智能系统的人负责处理。当人工智能系统与人类互动并做出影响人类福祉的选择时,潜在的代价和优先级系统很主要。
6. 观点参考:肃清歧义,统一和跨模态
知识因此观点为根本的。例如,“狗”是一个抽象观点——一个有多个名称(在各种措辞中狗的说法都不一样)、一些视觉特色、声音遐想等等的观点。然而不管其表现形式和用法如何,“狗”这个观点都是独一无二的。“狗”的观点被映射到英语单词“dog”,以及法语单词“chien”。“狗”的视觉特色可能如下图:
同时“狗”也和汪汪吠叫声对应了起来。
观点引用(Concept Reference,简称ConceptRef)是与给定观点干系的所有事物的标识符和引用集。观点引用本身实际上不包含任何知识——知识驻留在前面先容的维度中。观点引用是多维知识库(KB)的关键,由于观点引用领悟了观点的所有表象。
Wikidata便是集中存储构造化数据的多维知识库的一个很好的例子。在Wikidata中,项(items)代表人类知识中的所有事物,包括主题、观点和工具。Wikidata的条款与这个框架中ConceptRef的定义相似——只有一个关键的差异:在Wikidata中,术语“项”既指给定的标识符,也指有关标识符的信息;而ConceptRefs 只是带有指向KB指针的标识符。关于观点的信息则被添补在前面章节中描述的各种视图中(例如与观点干系的描述性或程序性知识)。
知识
知识知识由隐性信息组成,隐性信息是指广泛(且为大众共享)的不成文的假设,人类自动利用这些假设来理解天下。人工智能想要更深入地理解这个天下,将知识运用到情境中是必不可少的。在这个框架中,知识知识被认为是上述六种知识类型的子集。
2
理解与知识类型之间的关系
理解是智能的根本。向更高等机器智能的发展引发了一场关于“理解”的谈论。约书亚·本吉奥将拥有人类理解能力的人工智能描述为:
明白因果关系,理解天下如何运转;
理解抽象的行为;
知道如何利用以上知识去掌握、推理和操持,纵然是在新颖的场景中也依然拥有这种能力;
阐明发生了什么;
out-of-distribution(即OOD,分布外)天生。
而以知识为中央的对理解的定义是:用丰富的知识表示创建天下不雅观的能力;获取和解释新信息以增强这种天下不雅观的能力;以及对现有知识和新信息进行有效推理、决定和解释的能力。
这种理解不雅观点的先决条件因此下四种功能:
具备丰富的知识;
获取新的知识;
能够跨实体和关系连接知识实例;
对知识进行推理。
理解不是二元属性,而是因类型和程度而异。这一不雅观点的核心是知识的实质及其表征——知识构造和模型的表达能力可以促进理解和推理能力快速发展。
想象所有的人[和机器]
正如阿尔伯特·爱因斯坦所不雅观察到的:“智能的真正标志不是知识,而是想象力。”要真正理解,机器智能必能超越数据、事实和故事。要重修,创造和创造一个可不雅观察属性和事宜背后的宇宙模型,想象力是必要的。从人工智能系统的角度来看,想象力是通过创造性推理实现的,也便是进行归纳、演绎或溯因推理,并产生不受以往履历和输入输出干系性严格规定的新颖结果。
知识表示和推理是人工智能的一个成熟领域,这个领域处理关于天下的信息表示,使打算机系统能够办理繁芜的任务。知识和推理不一定是截然不同的,而是代表了一个从已知到推断的光谱。机器理解将通过构建知识的能力辅以前辈的干系推理(例如,概率推理和似是而非推理、溯及推理、类比推理、默认推理等)来得到实现。
建立在深度知识根本上的神经符号AI
在使人工智能更有效、更负任务和更高效地为人们供应支持的过程中,我们的目标是使人工智能系统更强大,同时推动人工智能达到更高的认知和理解水平。科学家已经在处理数据、识别模式和探求须臾即逝的干系性方面取得了巨大的进展,但仍有必要思考哪些知识类型能授予人工智能系统对天下建模和理解天下的能力。
当我们对人工智能得到更高层次的认知所须要的知识构造的类型有了更深的理解时,我们就可以连续在这个深度知识的根本上进行构建,使机器能够真正地理解天下。
原文链接:
https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Understanding-of-and-by-Deep-Knowledge/post/1385497
雷峰网
本文系作者个人观点,不代表本站立场,转载请注明出处!