- 图神经网络:基础、前沿与应用
- 吴凌飞 崔鹏 裴健 赵亮
- 1560字
- 2022-12-20 18:18:32
术语
图的基本概念
图:一个图由一个节点集合和一个边集合组成。其中,节点集合中的节点代表实体,边集合中的边代表实体之间的关系。节点和边构成图的拓扑结构。除图结构以外,节点、边和(或)整个图都可以与丰富的信息相关联,这些信息被表征为节点/边/图的特征(又称为属性或内容)。
子图:子图也是图,子图的节点集合和边集合是源图的子集。
中心度:中心度用来度量图中节点的重要性。中心度的基本假设是,如果许多其他重要的节点也连接到该节点,则认为该节点是重要的。常见的中心度度量包括度数中心度、特征向量中心度、间隔性中心度和接近性中心度。
邻域:一个节点的邻域一般是指与该节点相近的其他节点的集合。例如,一个节点的k阶邻域也叫k步邻域,这个节点的k阶邻域内的所有节点与该节点之间的最短路径距离都不大于k。
社群:社群是指一组内部连接密集但外部连接却不太密集的节点。
图抽样:图抽样是一种从源图中挑选节点和(或)边的子集的技术。图抽样可用于在大规模图上训练机器学习模型,同时防止发生严重的可扩展性问题。
异质图:如果一个图的节点和(或)边类型不同,那么称这个图为异质图。异质图的典型代表是知识图谱,知识图谱中的边可以是不同的类型。
超图:超图是对图的扩展,超图中的一条边可以连接任意数量的节点。
随机图:随机图通常旨在对所观察图生成的图的概率分布进行建模。目000001前最基本、研究最透彻的随机图模型名为Erdős-Rényi,该模型假定节点集合是固定的,此外每条边都相同并且是独立生成的。
动态图:当一个图的数据至少有一个组成部分随时间发生变化,比如增加或删除节点、增加或删除边等,如果边的权重或节点的属性也发生变化,则称这个图为动态图,否则称其为静态图。
图机器学习
谱图论:谱图论旨在分析与图有关的矩阵,如邻接矩阵或拉普拉斯矩阵,使用的是线性代数工具,如研究矩阵的特征值和特征向量。
图信号处理:图信号处理(Graph Signal Processing,GSP)旨在开发工具以处理定义在图上的信号。图信号是数据样本的有限集合,图中的每个节点都有一个样本。
节点级任务:节点级任务是指与图中单个节点相关的机器学习任务。节点级任务的典型代表是节点分类002和节点回归。
边级任务:边级任务是指与图中一对节点相关的机器学习任务。边级任务的典型代表是链接预测。
图级任务:图级任务是指与整个图相关的机器学习任务。图级任务的典型代表是图分类和图属性预测。
直推式学习和归纳式学习:直推式学习是指在训练期间观察目标实例,如节点或边(尽管目标实例的标签仍是未知的),归纳式学习旨在学习可泛化到未观察到的实例的模型。
图神经网络
网络嵌入:网络嵌入旨在将图中的每个节点表征为一个低维向量,以便在嵌入向量中保留有用的信息,比如图结构和图的一些属性。网络嵌入又称为图嵌入和节点表征学习。
图神经网络:图神经网络是指能够在图数据上工作的任何神经网络。
图卷积网络:图卷积网络通常是指由Kipf和Welling(Kipf and Welling,2017a)提出的特定图神经网络。在某些文献中,图卷积网络偶尔会被用作图神经网络的同义词。
消003息传递:消息传递是图神经网络的框架之一,其中的关键步骤是根据每个神经网络层的图结构在不同节点之间传递消息。采用最为广泛的表述为消息传递神经网络,也就是仅在直接连接的节点之间传递消息(Gilmer et al,2017)。在某些文献中,消息传递函数也称为图滤波器或图卷积。
读出:读出(readout)是指对各个节点的信息进行总结,以形成更高层次的信息,如形成子图/超图或获得整个图的表征。在某些文献中,读出也称为池化(pooling)或图粗粒化(graph coarsening)。
图对抗攻击:图对抗攻击旨在通过操纵图结构和(或)节点表征以产生最坏情况下的扰动,从而使得一些模型的性能下降。图对抗攻击可以根据攻击者的目标、能力及其所能够获得的知识进行分类。
鲁棒性验证:鲁棒性验证旨在提供形式化的保证,使得即使根据某个扰动模型进行扰动,GNN的预测也不受影响。