人工智能的下一个拐点：图神经收集迎来快速爆发期_相干_数据

2024-11-18 09:37:38 科技快讯

本文是 InfoQ“解读 2019”年终技能盘点系列文章之一。

1 GNN：从尝鲜进入快速爆发期

人工智能的下一个拐点：图神经收集迎来快速爆发期_相干_数据科技快讯

今年以来，图神经网络技能（Graph Neural Network， GNN）得到了学术界极大的关注与相应。
各大学术会议纷纭推出 GNN 干系的 workshop，在投中的论文中，以 Graph Network 为关键词的论文数量也呈现井喷之势，下图给出了近三年，上述关键词在各学术会议上的增长趋势：

GNN 在经历过 2017-2018 年两年的孕育期与考试测验期之后，在 2018 年末至今的一年多韶光里，迎来了快速爆发期。
从理论研究到运用实践，可谓是各处着花，让人应接不暇。
在理论研究上，GNN 的事理阐明、变体模型以及对各种图数据的拓展适配等事情成为了主流。
而在运用实践上，GNN 更是展现出了前所未有的渗透性，从视觉推理到开放性的阅读理解问题，从药物分子的研发到 5G 芯片的设计，从交通流量预测到 3D 点云数据的学习，我们看到了 GNN 极其广阔的运用前景。
本文将对近一年各大顶级会议（如 ICML、NIPS、CVPR、ACL、KDD 等）上的 GNN 干系论文进行梳理，重点从理论研究和运用实践两方面解读过去一年 GNN 的进展。
由于韶光和篇幅有限，本文并没有对每一个方向都进行全面的总结与概括，感兴趣的读者可以根据文中给出的论文链接自行查漏补缺。

2 GNN 的事理、变体及拓展

GNN 作为一个新兴的技能方向，其事理解读以及各种变体与拓展构成了理论研究的热点，这些论文很好地回答了 GNN 的优缺陷以及干系的适应性改造问题。

2.1 GNN 事理解读

当前 GNN 研究的第一个热点在于其干系能力的理论化研究。
在“How Powerful are Graph Neural Networks?” 和 “On the equivalence between graph isomorphism testing and function approximation with GNNs”中，都对GNN 在图同构问题上的表现进行了磋商。
图同构问题是辨别给定的两个图是否同等，同构图如下图所示。
这个问题磨练了算法对图数据构造的辨别能力，这两篇文章都证明了 GNN 模型具有出色的构造学习能力。
图中天然包含了关系，因此许多GNN 干系的事情就建立在对给定系统进行推理学习的研究上，在这些研究中，“ Can graph neural networks help logic reasoning? ”和 “ The Logical Expressiveness of Graph Neural Networks ”论证了 GNN 在逻辑推理上的精良表现。
“ All We Have is Low-Pass Filters ”从低通滤波的层面阐明了 GNN 的有效性。
这些事理解读，有助于我们对 GNN 的特色专长建立一种更加清晰的认识。

2.2 GNN 的各种变体

GNN 模型的干系变体研究是领域内的另一个热点，这些变体在一些方面提升了 GNN 的能力表现。
我们知道 GCN 模型来源于图旗子暗记上的傅里叶变换，“ Graph Wavelet Neural Network ” 引入了图旗子暗记上的小波变换来改造 GCN 模型，将卷积打算变换到空域局部邻域内。
将数据表征从欧式空间转化到双曲空间，不仅能得到更好地层次化表示，同时能大大节约空间维度，“ Hyperbolic Graph Convolutional Neural Networks ”和 “ Hyperbolic Attention Networks ” 同时将 GNN 拓展到了双曲空间上去。

在 “ MixHop: Higher-Order Graph Convolutional Architectures via Sparsified Neighborhood Mixing ” 和 “ Diffusion Improves Graph Learning ”中，同时将原始 GCN 中的邻居定义由一阶拓展到高阶，强化了模型低通滤波的特性。

2.3 GNN 在各种图数据及任务上的拓展

图数据是一个种类繁多的数据家族，模型对这些不同类型的数据如何适配，是 GNN 发展的另一主要方向。
下表给出了相应的概括：

图类型干系解释对应论文属性图多种节点类型，节点包含属性，最具代表性[1] [2]超图一条边同时连接两个以上节点[3]动态图图构造随韶光蜕变[4]隐式图节点之间没有显式边，须要先学习图的构造[5] [6]

[1]: HetGNN: Heterogeneous Graph Neural Network

[2]: Representation Learning for Attributed Multiplex Heterogeneous Network

[3]: HyperGCN: A New Method For Training Graph Convolutional Networks on Hypergraphs

[4]: DyRep: Learning Representations over Dynamic Graphs

[5]: Semi-supervised Learning with Graph Learning-Convolutional Networks

[6]: Learning Discrete Structures for Graph Neural Networks

在图数据干系的任务上，图的分类是一个主要而又未完备办理好的问题，其难处在于如何在图数据上实现层次化的池化操作从而得到图的全局表示，“ Graph Convolutional Networks with EigenPooling ”中给出了一种新的操作思路。

3 GNN 干系运用

近几年，以深度学习为代表的人工智能技能给家当界带来了新的变革。
该技能在视觉、语音、文本三大领域取得了极大的运用成果，这种成功，离不开深度学习技能对这三类数据定制化的模型设计事情。
分开于这三类数据之外，图数据是一种更加广泛的数据表示办法，夸年夜地说，没有任何一个场景中的数据彼此之间是伶仃存在的，这些数据之间的关系都可以以图的形式进行表达。
下图给出了一些图数据的利用场景：

如何将图数据的学习与深度学习技能进行深度结合成为了一个急迫且紧要的需求。
在这样的背景之下，图神经网络技能的兴起宛如彷佛一股东风，第一次使得我们看到了深度学习运用到图数据之上的曙光。
实际上，在最近一年，GNN 的运用处景不断延伸，覆盖了打算机视觉、3D 视觉、自然措辞处理、科研、知识图谱、推举、反敲诈等场景，下面我们将逐项概括。

3.1 打算机视觉

在前几年超过了视觉识别的大门之后，推理干系的视觉任务已经成为明晰各大 CV 顶会的紧张关注点，如：视觉问答、视觉推理、语义图合成、human-object interaction 等，乃至如视觉的根本任务，目标检测也须要用到推理来提升性能。
在这些任务中，已经大量涌现运用 GNN 的干系事情。
下面我们以最常见的视觉问答任务举例解释，在“ Relation-Aware Graph Attention Network for Visual Question Answering ”一文中，给出了将 GNN 与视觉模型结合的示意图：

在上图中，视觉模型的浸染是提取给定图像中的语义区域，这些语义区域与问题一并当做图中的节点，送到一个 GNN 模型中进行推理学习，这样的一种建模办法，可以更加有效地在视觉问答中对问题进行自适应地推理。

其余一个故意思的场景是少样本或零样本学习，由于这类场景下样本十分缺少，如何充分挖掘样本之间的潜在关联信息（比如标签语义关联、潜层表达关联）就成为了一个至关主要的考量成分，引入 GNN 成为了一个非常自然的动作，干系事情有“ Rethinking Knowledge Graph Propagation for Zero-Shot Learning ”、“ Edge-labeling Graph Neural Network for Few-shot Learning ”。

3.2 3D 视觉

3D 视觉是打算机视觉的又一主要发展方向，天下是 3D 的，如何让打算机理解 3D 天下，具有极其主要的现实代价。
3D 视觉中，点云数据是一种十分常见的数据表示方法。

点云数据常日由一组坐标点（x,y,z）表示，这种数据由于映射了现实天下中物体的特色，因此存在一种内在的表征物体语义的盛行构造，这种构造的学习也是 GNN 所善于的。
须要解释一点的是，在 3D 视觉中盛行的是几何学习 Geometry Learning，当下，几何学习与 GNN 在一些场景如点云分割、点云识别等正在深度领悟，干系论文有 “ Graph Attention Convolution for Point Cloud Segmentation ”、“ Semantic Graph Convolutional Networks for 3D Human Pose Regression ”。

3.3 自然措辞处理

GNN 与 NLP 的结合，关键点也在于 GNN 精良的推理能力。
GNN 在一些场景如：阅读理解、实体识别与关系抽取、依存句法剖析中都有运用。
下面我们以多跳阅读（Multi-hop reading）为例，多跳阅读是说在阅读理解的过程中，每每须要在多篇文档之间进行多级跳跃式的关联与推理，才能找到精确答案，比较较以前的单文档问答数据集，这是一个更具有开放性与寻衅性的推理任务。
下图给出了多跳阅读的样例：

在“ Cognitive Graph for Multi-Hop Reading Comprehension at Scale ”一文中，作者基于 BERT 和 GNN 的实现可有效处理 HotPotQA 数据集中有关多跳阅读问题的数百万份文档，在排行榜上的联合 F1 得分为 34.9，而第二名的得分只有 23.6。

3.4 科研场景

如果我们把原子看做图中的节点、化学键看做边，那么分子就可以表征为一张图。
这种以图来表示分子的方法，可以将 GNN 结合到很多实际的科研场景中，如蛋白质相互浸染点预测、化学反应产物预测等，这些场景有利于将深度学习的快速拟合能力带入进药物研发、材料研发等行业中去，提升研发效率。

在“ Circuit-GNN: Graph Neural Networks for Distributed Circuit Design ”一文中，作者将 GNN 结合进高频电路设计（如 5G 芯片等）场景，大大提升了电路电磁特性仿真打算的效率。
下图给出了系统示意图：

3.5 知识图谱

由于知识图谱本身便是一种图数据，因此知识图谱 +GNN 的组合自然就成理解决各种知识图谱问题的新手段。
关系补全或预测问题是知识图谱的一大根本任务，通过关系的推理补全可以大大提升知识图谱的运用质量，下图给出了关系补全的一个实例：

在论文“ Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs ”中，作者选择用 GNN 对知识图谱进行建模，比较之前基于单独三元组关系的推理，基于 GNN 的方法可以更好地捕捉三元组邻域繁芜而隐含的模式信息，这种上风对完成关系补全任务具有十分主要的浸染。

实体对齐是知识图谱的另一类任务，给定多个知识图谱，须要首先确定各自图谱中的哪些实体描述的是同一个工具，完成这项事情才能精确地将它们合成一个大的知识图谱。
论文“ Multi-Channel Graph Neural Network for Entity Alignment ”提出了一种基于 GNN 的实体对齐方案，实验表明，在多个数据集上，该方案均取得了最好的效果。

近几年，知识图谱在工业界声势日隆，在这种语境下，我们也称知识图谱为业务图谱，在论文“Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks”中，作者成功利用 GNN 技能对电影业务图谱进行建模，在电影盛行度预测上效果表现十分出色。

其余，知识图谱与推举系统结合也成了近期一个比较热门的方向，这部分可参考下一节推举系统中的讲解。

3.6 推举系统

推举是各大互联网公司十分主要的营罢手腕，因此一贯以来备受工业界与学术界双重关注。
过去这几年，推举系统由早期的协同过滤算法发展到 MF 模型、再到之后的 Wide&Deep，以及基于 Network Embedding 的方法，可以明显地看到基于神经网络的方法正在逐渐霸占紧张位置，而 GNN 的涌现，又一次大大加速了这个技能趋势。

以电商平台的推举为例，推举系统的核心数据在于用户 - 商品交互的二部图，而基于神经网络的多数方法将二部图中的实体映射到一个得当的向量空间中去，使得在图上间隔越近的两个实体在向量空间中的间隔也越近，如下图所示：

GNN 本身是一种深度模型，与推举系统结合之后，多层 GNN 模型可以更好地捕捉用户与商品之间的高阶协同关系，论文“ Neural Graph Collaborative Filtering ”中，作者论证了多层 GNN 所带来的“Deep”与“High order”效益对推举质量的有效提升。

除了推举系统算法模型本身的研究，另一种思路在于如何使推举系统有效领悟进额外的信息，如用户端社交网络的信息、商品端商品知识图谱的信息。
这类信息中常日也蕴含了极强的关系，因此可以非常自然地与用户 - 商品二部图合在一起构成一个更大的异构图。
下图给出了与电影知识图谱的结合示意图：

图片来源 https://arxiv.org/pdf/1902.06236.pdf

有了这样的图数据抽象之后，引进 GNN 进行推举建模也就成了一种自然的选择，干系论文有 KGAT:“ Knowledge Graph Attention Network for Recommendation ”、“ Metapath-guided Heterogeneous Graph Neural Network for Intent Recommendation ”、“ Session-based Social Recommendation via Dynamic Graph Attention Networks ”等。

其余一个十分主要的、也与推举系统息息相关干系的业务场景是广告点击率（CTR）预测。
该场景下的样本常日是由多领域的特色数据构成，比如用户域、设备域、广告域等等，如何建模这些数据域之间的特色交互，成为了该任务的核心。
最近基于神经网络的方法都是直接将各个域之间的特色拼接起来然后送到上层的网络模型中，以期得到这些域之间的高阶交互，这种大略的非构造化的拼接办法，会大大限定模型的学习能力。
在“ Fi-GNN: Modeling Feature Interactions via Graph Neural Networks for CTR Prediction ”一文中，作者将各个域之间以图的形式连接起来（下图中的 Feature graph），然后用 GNN 建模各个特色域之间高阶繁芜的交互关系，比较之前的模型取得了最好效果。

3.7 反敲诈

反敲诈业务是各大公司担保运营业务与营销业务正常开展的条件，常日我们所面临的敲诈问题包括：垃圾评论、排名敲诈、交易敲诈、薅羊毛、账户盗用等。
这些敲诈征象的背后每每是黑产团伙协同作案，大大提高了反敲诈业务的打击本钱。

关系数据的挖掘是绝大部分反敲诈业务开展最主要的技能视角，不论是基于敲诈风险传播的关联剖析还是基于黑产团伙模式的构造化挖掘，图都是反敲诈业务职员的首选工具。
在这样的背景下，GNN 也变得极有发挥空间。
例如，论文“ Heterogeneous Graph Neural Networks for Malicious Account Detection ”中利用 GNN 对于出宝敲诈用户进行识别检测，“ Spam Review Detection with Graph Convolutional Networks ”中利用 GNN 对咸鱼上的评论进行敲诈识别。

4 GNN 开源项目总结

在 2019 年，图领域涌现了不少新的开源项目，一些已有的开源项目也有较大的改进。

1 月，阿里妈妈开源了海内首个支持工业级图深度学习的框架 Euler，内置很多实用的图算法。
项目地址： https://github.com/alibaba/euler

3 月，德国多特蒙德工业大学的学者们提出了 Pytorch Geometric ，实现了诸多 GNN 的变体模型，上线之后得到了大佬 Yann LeCun 的推举。
项目地址： https://github.com/rusty1s/pytorch_geometric

5 月，著名图学习框架 DGL 发布 v0.3 版本（目前已经更新至 0.4.1 版本，也补齐了很多 GNN 的变体模型），0.3 版本在性能上有了非常显著的提升，比较 0.2 版本演习速率提高了 19 倍，同时支持亿级规模的图神经网络演习。
项目地址： https://github.com/dmlc/dgl

12 月，斯坦福大学的 Jure Leskovec 教授在 NeurlPS 2019 大会演讲中宣告开源 Open Graph Benchmark，通过这一数据集可以更好地评估模型性能等方面的指标。
项目地址： http://ogb.stanford.edu

同月，清华大学知识工程研究室（KEG）推出了大规模图表示学习工具包 CogDL，可以让研究者和开拓者更加方便地演习和比拟用于节点分类、链路预测以及其他图任务的基准或定制模型。
项目地址： https://github.com/THUDM/cogdl/

除了上述的项目，GitHub 上图干系的两个论文项目也很不错，总结了近年来各大顶会所有干系论文，收录非常及时全面，推举大家关注： https://github.com/naganandy/graph-based-deep-learning-literature 和 https://github.com/DeepGraphLearning/LiteratureDL4Grap h 。

5 展望

展望来年，最可以确定的一点是 GNN 依然会保持如今快速发展的态势。
从理论研究上看，不断解构 GNN 干系的事理、特色与不敷，进而提出相应地改进与拓展，是非常值得我们关注的部分。
其余，关于一贯以来研究 GNN 所用的标准数据集，如 Cora、PubMed，这些数据集场景单一、异构性不敷，难以对繁芜的 GNN 模型进行准确评价，针对这一问题，近期斯坦福大学等开源的 OGB 标准数据集有望大大改进这个现状，在新的评价体系下，哪些事情能够脱颖而出，且让我们拭目以待。

在运用处景上，相信 GNN 能够带给我们更加亮眼的事情，除了在视觉推理、点云学习、关系推理、科研、知识图谱、推举、反敲诈等领域有广泛运用外，在其他的一些场景，如交通流量预测、医疗影像、组合优化等，也涌现了一些 GNN 干系的事情。
大体上看，如何准确有效地将图数据与 GNN 二者有机结合到干系场景，是运用上须要着重考虑的事情，相信来年，会涌现更多这样的事情来拓展 GNN 的运用边界。

作者先容：

刘忠雨，毕业于华中科技大学，资深图神经网络技能专家，极验科技人工智能实验室主任和首席技能官。
在机器学习、深度学习以及图学习领域有 6 年以上的算法架构和研发履历，主导研发了极验行为验证、深知业务风控、叠图等产品。

随着图神经网络的热潮涌现，理解和节制图神经网络干系技能事理已经成为未来从事 AI 干系事情的一种趋势。
刘忠雨和他所在技能团队撰写了《深入浅出图神经网络》一书并于近日上市，这是第一本系统讲解图神经网络干系根本知识和事理的书本，适宜想要入门并初步实践图神经网络技能的读者，以及对系统学习图神经网络技能感兴趣的读者。