弁言

探索可解释的人工智能推理_常识_人工智能 绘影字幕

推理是人类智能活动的主要组成部分,一贯以来是人工智能研究的核心内容。
人工智能进入了以深度学习技能为主导的新时期, 无论是打算机视觉、语音识别、措辞理解、机器翻译、对话系统等,彷佛无处不是数据驱动下深度学习的“功劳”。
从推理的视角来看,从已知的事实(有标注的数据),得出未知的结论,便是推理。
但对智能系统做出的推理结果,须要有一个行为的阐明机制。

深度学习是一个黑箱,最大的弊端是缺少对其结果的阐明能力。
回忆在知识工程时期,基于规则的专家系统技能,其结果却具有很好的阐明性。
受此启示,我们提出这样一个问题:在办理“可阐明”的推理上,传统的知识工程技能是否可以连续发挥浸染?可阐明的人工智能未来的发展方向是什么?

基于知识工程的可阐明推理

让我们回顾一下人工智能推理的早期阶段——知识工程时期。
知识工程包括知识的获取、表达和推理,实在质是将数据转换为易于机器处理的构造化知识。
一个范例的专家系统由知识库与推理机组成,前者须要专家人工构建(见图1)。
知识工程的代表——专家系统,可以顺着推理机利用到的规则, 表现出很好的阐明能力。
从20 世纪90 年代后期开始,知识工程因以下一些困扰而进入了低潮。

图1:传统知识工程的组成

1. 知识获取困难。
知识库构建过程中依赖专家人工构建的办法。
如Cyc[1] 在2000 年,积累了160 万条知识性知识,在耗费了350 人/ 年的本钱后终极失落败。

2. 构建专家系统须要完备的领域知识(包括知识),对付大部分问题本身具有的不愿定性,要从专家的履历中构建推理引擎非常困难,这限定了专家系统的运用。

只管知识工程这个名词已不再盛行,但知识工程将数据转换为易于机器处理的构造化知识的实质,其自顶向下的演绎推理办法可能是解开目前可阐明性缺失落困扰的路子之一。
目前已经涌现的一系列研究正在填补传统知识工程的毛病,并努力将知识勾引与数据驱动这两种知识获取与推理办法进行领悟,个中一个范例的代表便是CMU 的永一直息措辞学习者NELL[2]。
NELL 通过机器学习、NLP 等数据驱动手段并结合人工参与,来从互联网网页中析取断言式知识(beliefs),形成海量的通用知识图谱,这从一定程度上办理理解释性中知识来源的问题,改进了传统知识工程知识获取困难的问题。
在基于知识的推理方面,IBM 的Watson 系统[3] 在Jeopardy 寻衅中降服了两位人类冠军,其核心算法Deep QA 通过天生问题答案的候选(假设),在非构造化数据中网络证据,并用机器学习模型对证据进行评分,末了利用聚合算法实现对假设的排序。
这种办法借鉴了专家系统中推理引擎的推理流程,实现了数据驱动算法与推理流程的有机领悟。
图神经网络[4] 等研究也正考试测验将传统的贝叶斯网络和知识图谱,与深度学习相领悟,来探索深度学习的可阐明机制。

未来与展望

可阐明性的问题正在引起各界的关注。
2017 年7 月美国国防部高等研究操持署启动了7 000 万美元的可阐明性人工智能操持(XAI)[5] 旨在对军事领域智能算法的认知进行理解。
欧盟在2018 年生效的通用数据保护法中引入阐明的权力[6],旨在处理算法不可阐明带来的问题。
学术界也正从多个不同的角度入手开展研究,涌现了反事实探测[7]、可视化[8]、转移学习[9] 等一系列基于事后解析的方法。
在实时剖析方面,则涌现了多跳把稳力[10]、推导过程天生[11],以及可阐明性网络[12] 等一系列研究。
个中知识打算延续了知识工程的目标,是一种领悟实时与事后可阐明性剖析的打算框架,是传统知识工程与大数据、算法与群体聪慧领悟后的产物。
知识的获取已不纯挚依赖从专家的履历中总结出来, 而是综合运用多种“打算”手段而得到的(见图2)。

图2:知识打算框架

知识打算人在回路的架构,为可阐明的人工智能的实现供应了框架,是大数据下的新型知识工程。
未来在探索可阐明的人工智能推理的研究中,我们仍需在此根本上建立知识、数据和反馈于一体的人工智能理论和模型,有机折衷“知识辅导下的演绎”、“数据驱动中的归纳”与“行为强化内的方案”。
知识工程从提出至今,作为早期的知识推理手段对后续的一系列研究产生了深远的影响,从这个意义上讲,知识工程并没有过期,在未来将连续在人工智能研究中扮演主要的角色。

参考文献

[1] Lenat, D.B., M. Prakash, and M. Shepherd, CYC: Using common sense knowledge to overcome brittleness and knowledge acquisition bottlenecks. AI magazine, 1985. 6(4): 65.

[2] Carlson, A., et al. Toward an architecture for never-ending language learning. in AAAI. 2010. Atlanta.

[3] Ferrucci, D.A., Introduction to “this is watson”. IBM Journal of Research and Development, 2012. 56(3.4): 1: 1-1: 15.

[4] Battaglia, P.W., et al. Relational inductive biases, deep learning, and graph networks. arXiv preprint arXiv:1806.01261, 2018.

[5] Gunning, D., Explainable artificial intelligence (xai). Defense Advanced Research Projects Agency (DARPA), nd Web, 2017.

[6] Goodman, B. and S.R. Flaxman, European Union regulations on algorithmic decision-making and a. 2017.

[7] Ribeiro, M.T., S. Singh, and C. Guestrin. Why should i trust you?: Explaining the predictions of any classifier. in Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. 2016. ACM.

[8] Zeiler, M.D. and R. Fergus. Visualizing and understanding convolutional networks. in European conference on computer vision. 2014. Springer.

[9] Wang, H., et al. Emergent Predication Structure in Hidden State Vectors of Neural Readers. arXiv preprint arXiv:1611.07954, 2016.

[10] Shen, Y., et al. Reasonet: Learning to stop reading in machine comprehension. in Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2017. ACM.

[11] Ling, W., et al. Program induction by rationale generation: Learning to solve and explain algebraic word problems. arXiv preprint arXiv:1705.04146, 2017.

[12] Zhang, Q., Y.N. Wu, and S.-C. Zhu. Interpretable convolutional neural networks. in The IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2018.

作者简介

庄越挺

庄越挺

浙江大学打算机学院教授,教诲部数字图书馆工程中央主任。
CAAI Fellow。
领衔的团队率先开展并初步建立了“跨媒体打算”的理论体系,所从事的“跨媒体人工智能”被列入我国《新一代人工智能发展方案》中;主持了数字图书馆(CADAL)技能系统的研制并成功运用;主持了用于非构造化知识加工的KS-Studio工具集的研发,个中的实体检测、实体链接等技能在TAC KBP 比赛中多次排名第一。
曾获国家科学技能进步奖二等奖、浙江省科学技能进步奖一等奖等。

汤斯亮

汤斯亮

浙江大学打算机学院副教授,博士生导师,钱江人才操持分外急需人才。
近五年在信息检索、多媒体等打算机领域国际主要会议与期刊上揭橥论文30 多篇,个中包括IJCAI、AAAI、SIGIR、SIGMM 等国际会议,与IEEE TKDE、IEEE TIP、IEEE TMM 等IEEE 会刊。
紧张研究人工智能领域方向的信息抽取、自然措辞处理、跨媒体等。