CN112862092A

CN112862092A - 一种异构图卷积网络的训练方法、装置、设备和介质

Info

Publication number: CN112862092A
Application number: CN202110104958.5A
Authority: CN
Inventors: 陈川; 常耀民; 郑子彬
Original assignee: Sun Yat Sen University
Current assignee: Guangzhou Huihui Intelligent Technology Co.,Ltd.
Priority date: 2021-01-26
Filing date: 2021-01-26
Publication date: 2021-05-28
Anticipated expiration: 2041-01-26
Also published as: CN112862092B

Abstract

本申请公开了一种异构图卷积网络的训练方法、装置、设备和介质，方法包括：提取带标签的异构图中每种类型边的信息，生成每种类型边对应的邻接矩阵；结合所有类型边对应的邻接矩阵和单位矩阵，生成异构图张量；将异构图张量输入到异构图卷积网络进行节点类别预测，得到异构图中各节点的预测标签；根据各节点的标签和预测标签计算损失值，并通过损失值优化异构图卷积网络的参数，直至异构图卷积网络收敛，得到训练好的异构图卷积网络。本申请解决了现有技术将异构图当做同构图进行学习，没有利用异构图上的不同类型的边信息，信息损失严重，导致节点分类准确性不高的技术问题。

Description

一种异构图卷积网络的训练方法、装置、设备和介质

技术领域

本申请涉及数据处理技术领域，尤其涉及一种异构图卷积网络的训练方法、装置、设备和介质。

背景技术

目前，有大量数据采用异构图结构数据进行表示，如社交网络、电子商务系统、学术引用网络等。图因其强大且灵活的表征能力，成为关联大数据最自然、最直接的表示方式，对图结构数据进行分析和挖掘具有重大的社会价值和经济价值。虽然图具有很强的表示能力，但是图的复杂性也为机器学习算法带来了巨大的挑战。由于节点之间有着强耦合的拓扑关系，这导致了图上的挖掘计算复杂度高；且由于异构图复杂的节点类型和边类型的关联，异构图上的数据挖掘更显得困难。

图表示学习旨在将网络中的节点表示成低维、实值、稠密的向量形式，使得得到的节点的向量形式可以在向量空间中具有表示以及推理的能力，从而可以更加灵活地应用于不同的下游数据挖掘任务中。

现有的图表示学习方法通常将异构图当做同构图进行学习，或基于预定义的元路径来获得特定关系相连的邻居，将异构图转换为元路径对应的同构图来进行学习，该方法只利用了图的结构信息进行节点表征的学习，没有利用异构图上不同类型的边信息，信息损失严重，使得节点分类准确性不高。

发明内容

本申请提供了一种异构图卷积网络的训练方法、装置、设备和介质，用于解决现有技术将异构图当做同构图进行学习，没有利用异构图上的不同类型的边信息，信息损失严重，导致节点分类准确性不高的技术问题。

有鉴于此，本申请第一方面提供了一种异构图卷积网络的训练方法，包括：

提取带标签的异构图中每种类型边的信息，生成每种类型边对应的邻接矩阵；

结合所有类型边对应的所述邻接矩阵和单位矩阵，生成异构图张量；

将所述异构图张量输入到异构图卷积网络进行节点类别预测，得到所述异构图中各节点的预测标签；

根据各节点的所述标签和所述预测标签计算损失值，并通过所述损失值优化所述异构图卷积网络的参数，直至所述异构图卷积网络收敛，得到训练好的异构图卷积网络。

可选的，所述异构图卷积网络包括：若干个卷积模块和特征融合模块；

所述将所述异构图张量输入到异构图卷积网络进行节点类别预测，得到所述异构图中各节点的预测标签，具体包括：

将所述异构图张量输入到异构图卷积网络，通过各个所述卷积模块并行对所述异构图张量进行特征提取，得到若干个特征表征；

通过所述特征融合模块对若干个所述特征表征进行特征融合，得到融合特征，并基于所述融合特征进行节点类别预测，得到所述异构图中各节点的预测标签。

可选的，所述卷积模块包括：异构卷积模块和图卷积模块；

所述将所述异构图张量输入到异构图卷积网络，通过各个所述卷积模块并行对所述异构图张量进行特征提取，得到若干个特征表征，具体包括：

将所述异构图张量输入到异构图卷积网络，通过各个所述卷积模块中的所述异构卷积模块并行对所述异构图张量进行张量卷积，得到各个所述卷积模块对应的邻接特征矩阵；

通过各个所述卷积模块中的所述图卷积模块并行对对应的所述邻接特征矩阵进行邻居聚集，得到各个所述卷积模块对应的特征表征。

可选的，所述异构卷积模块和所述图卷积模块的数量为多个，所述特征表征为：

其中，

为第l层图卷积模块的第i个节点的特征表征，

为第l-1层图卷积模块的第i个节点的特征表征，

为异构图中第i个节点的属性，σ(·)为激活函数，g^(l)(·)为第l层图卷积模块的聚集函数，

为第l层异构卷积模块的邻接特征矩阵，deg^(l)(i)为第l层图卷积模块的第i个节点的度，M_i为节点集合。

可选的，所述通过所述特征融合模块对若干个所述特征表征进行特征融合，得到融合特征，具体包括：

通过所述特征融合模块基于注意力机制计算各个所述特征表征的权重，并基于所述权重对各个所述特征表征进行加权求和，得到融合特征。

可选的，所述根据各节点的所述标签和所述预测标签计算损失值，并通过所述损失值优化所述异构图卷积网络的参数，直至所述异构图卷积网络收敛，得到训练好的异构图卷积网络，之后还包括：

提取各个所述异构卷积模块的参数，得到元路径的权重；

对所述元路径的权重进行排序，得到有效元路径的权重。

本申请第二方面提供了一种异构图卷积网络的训练装置，包括：

提取单元，用于提取带标签的异构图中每种类型边的信息，生成每种类型边对应的邻接矩阵；

结合单元，用于结合所有类型边对应的所述邻接矩阵和单位矩阵，生成异构图张量；

预测单元，用于将所述异构图张量输入到异构图卷积网络进行节点类别预测，得到所述异构图中各节点的预测标签；

优化单元，用于根据各节点的所述标签和所述预测标签计算损失值，并通过所述损失值优化所述异构图卷积网络的参数，直至所述异构图卷积网络收敛，得到训练好的异构图卷积网络。

相应的，所述预测单元具体包括：

特征提取子单元，用于将所述异构图张量输入到异构图卷积网络，通过各个所述卷积模块并行对所述异构图张量进行特征提取，得到若干个特征表征；

特征融合子单元，用于通过所述特征融合模块对若干个所述特征表征进行特征融合，得到融合特征，并基于所述融合特征进行节点类别预测，得到所述异构图中各节点的预测标签。

本申请第三方面提供了一种异构图卷积网络的训练设备，所述设备包括处理器以及存储器；

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的异构图卷积网络的训练方法。

本申请第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面任一种所述的异构图卷积网络的训练方法。

从以上技术方案可以看出，本申请具有以下优点：

本申请提供了一种异构图卷积网络的训练方法，包括：提取带标签的异构图中每种类型边的信息，生成每种类型边对应的邻接矩阵；结合所有类型边对应的邻接矩阵和单位矩阵，生成异构图张量；将异构图张量输入到异构图卷积网络进行节点类别预测，得到异构图中各节点的预测标签；根据各节点的标签和预测标签计算损失值，并通过损失值优化异构图卷积网络的参数，直至异构图卷积网络收敛，得到训练好的异构图卷积网络。

本申请中，通过提取带标签的异构图中每种类型边的信息，生成每种类型边对应的邻接矩阵，再结合所有类型边对应的邻接矩阵和单位矩阵，生成异构图张量，本申请通过提取异构图中各类型边的信息生成异构图张量，再通过该异构图张量训练异构图卷积网络，可以充分学习异构图上的拓扑结构、属性信息和语义关系，充分利用异构图上的信息，有效提高异构图卷积网络的节点分类准确率，解决了现有技术将异构图当做同构图进行学习，没有利用异构图上的不同类型的边信息，信息损失严重，导致节点分类准确性不高的技术问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为本申请实施例提供的一种异构图卷积网络的训练方法的一个流程示意图；

图2为本申请实施例的每种类型边对应的邻接矩阵生成过程的一个示意图；

图3为本申请实施例的异构图张量输入到异构卷积模块进行张量卷积过程的一个示意图；

图4为本申请实施例的一种异构图卷积网络的一个结构示意图；

图5为本申请实施例提供的一种异构图卷积网络的训练装置的一个结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

术语解释：

图表示学习：图表示学习是指在图数据中学习其结构信息、语义信息，将每一个节点表示为一个高维、稠密的向量。该向量可以后续用于在图上进行节点分类和链路预测等任务。图表示学习可以更好地学习图上复杂的结构和语义关联，从而对图数据进行更好的挖掘。

图神经网络：图神经网络(GNN)是指基于卷积神经网络(CNN)的思想下对图等不规则的结构搭建神经网络进行学习的网络。图神经网络处理非结构化数据时的出色能力使其在图表示学习、图数据挖掘等问题方面都取得了新的突破。

异构图：异构图是指具有多种节点类型、多种节点属性和多种边的类型的图。异构图与同构图相对应。以学术引用图为例，同构图只能表示“论文”一种节点和“引用”一种关系。而异构图可以表示“论文”“会议”“作者”等多种节点类型和“引用”“写作”“出版”等多种关系。

元路径：元路径是指对异构图定义的一种先验的知识模式，如在异构图上可以定义元路径为A-P-C-P-A，其中A代表作者，P代表论文，C代表会议。通过该元路径互相连接的节点则可以表示“在同一会议中发表论文”这一关系，这一关系可能包含了如研究兴趣等信息。另一个元路径的例子如A-P-A，它可以代表“共同作者”这一关系。

为了便于理解，请参阅图1，本申请提供的一种异构图卷积网络的训练方法的一个实施例，包括：

步骤101、提取带标签的异构图中每种类型边的信息，生成每种类型边对应的邻接矩阵。

现有的图学习方法大多利用了图的拓扑结构信息或节点的属性信息来学习节点的特征表示，然而在异构图中还具有大量特定的关系语义信息，不同的节点类型应当处于不同的表示空间中，而不同的边类型也应当单独进行建模。现有方法将异构图作为同构图进行学习，或者基于预定义的元路径来获得特定关系相连的邻居，将异构图转换为元路径对应的同构图进行学习，忽略了异构图的异构信息，造成大量信息的损失，影响最终的节点特征表示，从而无法达到更好的下游任务效果。

为了解决上述问题，本申请实施例在获取到带标签的异构图后，提取该异构图中每种类型边的信息，生成每种类型边对应的邻接矩阵。具体的，可以参考图2和图3，根据异构图中每种类型边的信息，将每一种类型边表示为一个N×N的邻接矩阵A，其中，邻接矩阵中的值为0或1，若节点i和节点j之间具有邻边，则A_ij＝1，否则为0；将每种类型边的邻接矩阵进行拼接，得到K个大小为N×N的邻接矩阵，每个邻接矩阵代表一种类型边的关系。

步骤102、结合所有类型边对应的邻接矩阵和单位矩阵，生成异构图张量。

将上述步骤拼接后得到的多个邻接矩阵后添加一个单位矩阵I，得到邻接矩阵表，将该邻接矩阵表以高维张量的形式进行表示，生成异构图张量

其中，该单位矩阵用于建模自身关系，并在后续可用于提取短的元路径模式。

步骤103、将异构图张量输入到异构图卷积网络进行节点类别预测，得到异构图中各节点的预测标签。

本申请实施例中的异构图卷积网络包括：若干个卷积模块和特征融合模块。

将异构图张量输入到异构图卷积网络进行节点类别预测，得到异构图中各节点的预测标签，具体包括：

S1、将异构图张量输入到异构图卷积网络，通过各个卷积模块并行对异构图张量进行特征提取，得到若干个特征表征。

进一步，本申请实施例中的卷积模块包括：异构卷积模块和图卷积模块；将异构图张量输入到异构图卷积网络，通过各个卷积模块并行对异构图张量进行特征提取，得到若干个特征表征，具体包括：

S11、将异构图张量输入到异构图卷积网络，通过各个卷积模块中的异构卷积模块并行对异构图张量进行张量卷积，得到各个卷积模块对应的邻接特征矩阵。

在本申请实施例中，异构图卷积模块用于对异构图张量A进行1×1的张量卷积，得到大小为N×N的邻接特征矩阵A_conv，具体可以参考图3。此时的邻接特征矩阵A_conv为不同关系的邻接矩阵赋予了权重后结合得到的新的邻接矩阵。

S12、通过各个卷积模块中的图卷积模块并行对对应的邻接特征矩阵进行邻居聚集，得到各个卷积模块对应的特征表征。

在本申请实施例中，每个卷积模块采用L个独立的异构卷积模块，并按照图神经网络的方式进行L层信息的传递，每层异构卷积模块后采用图卷积模块(即图4中的SGC层)进行邻居聚集，第L层的图卷积模块输出的特征表征即为该卷积模块的最终输出。其中，第l层(l＝1,2,...,L)卷积模块聚集后的特征表征为：

其中，

为第l层图卷积模块的第i个节点的特征表征，

为第l-1层图卷积模块的第i个节点的特征表征，

根据上述公式可知，第一层图卷积模块和其他层图卷积模块的聚集方式不同，第一层图卷积模块需要进行线性变换层的训练，其他层图卷积模块不需要进行线性变换层的训练只对特征进行平滑和聚集操作。最终得到的

为第L层第i个节点经过图聚集得到特征表征。

S2、通过特征融合模块对若干个特征表征进行特征融合，得到融合特征，并基于融合特征进行节点类别预测，得到异构图中各节点的预测标签。

本申请实施例采用C个独立卷积模块并行对异构图张量进行特征提取，对每个节点都得到C个特征表征

k＝1,2,...,C，可以理解为C个通道的特征表征。然后对C个通道的特征表征进行通道特征融合，得到融合特征，整个过程可以参考图4。

进一步，在本申请实施例中，通过特征融合模块基于注意力机制计算各个特征表征的权重，并基于权重对各个特征表征进行加权求和，得到融合特征。其中，第i个节点的第c个通道(c＝1，2，...，C)的权重w_c(i)为：

其中，

为第i个节点在第c个通道的特征表征，q为可训练的向量，用于计算不同通道上的特征的重要性。

最终得到的融合特征为：

本申请实施例中的异构图卷积网络结合异构卷积模块和图卷积模块的邻居聚集以及多通道融合机制，可以学习出好的节点表征，有助于提高下游任务的效果。

基于融合特征进行节点类别预测，得到异构图中各节点的预测标签。本申请实施例在融合模块中添加线性层并进行softmax计算，以对每个节点进行分类预测，其公式为：

其中，E为线性层，用于对融合特征进行线性化处理，

为第i个节点的预测标签。

步骤104、根据各节点的标签和预测标签计算损失值，并通过损失值优化异构图卷积网络的参数，直至异构图卷积网络收敛，得到训练好的异构图卷积网络。

在本申请实施例中，损失函数为：

其中，Y_i为第i个节点的真实标签。

基于各节点的标签和预测标签，通过上述损失函数计算损失值，计算得到损失值后，可以通过随机梯度下降法优化异构图卷积网络的参数，直至异构图卷积网络收敛，得到训练好的异构图卷积网络。训练好的异构图卷积网络可以用于节点类别预测。

进一步，在得到训练好的异构图卷积网络后，可以分析异构图卷积网络中每个异构卷积模块，提取元路径，可以为异构图卷积网络的有效性提供可解释性，减少不同场景下人工筛选元路径的成本和不确定性。具体的，提取各异构卷积模块的参数，得到元路径的权重；对元路径的权重进行排序，得到有效元路径的权重，其中，有效元路径

的重要性为：

式中，

为第L层异构卷积模块的参数，该参数可以表示第L层异构卷积模块中对R_L这种类型的路径计算出的重要性。

本申请实施例中，通过提取带标签的异构图中每种类型边的信息，生成每种类型边对应的邻接矩阵，再结合所有类型边对应的邻接矩阵和单位矩阵，生成异构图张量，本申请通过提取异构图中各类型边的信息生成异构图张量，再通过该异构图张量训练异构图卷积网络，可以充分学习异构图上的拓扑结构、属性信息和语义关系，充分利用异构图上的信息，有效提高异构图卷积网络的节点分类准确率，解决了现有技术将异构图当做同构图进行学习，没有利用异构图上的不同类型的边信息，信息损失严重，导致节点分类准确性不高的技术问题。

进一步，本申请实施例提出了一种异构图卷积网络进行图表示学习，异构图卷积网络中的异构卷积模块可以将异构图中具有不同的关系语义的邻接矩阵赋予不同的权重，并将其融合为一个新的邻接矩阵，对融合后的邻接矩阵结合不同结构的图卷积模块进行网络表征的学习，使得最终生成的异构图卷积网络可以同时高效学习异构图上的拓扑结构、属性信息和语义关系，在异构图上充分利用信息，得到有效的特征表征；并且本申请实施例提出的异构卷积模块的计算负担小，训练参数和边的类型相关，与异构图的节点数目无关，因此对于不同场景下的异构图数据都具有较好的适应性。

以上为本申请提供的一种异构图卷积网络的训练方法，以下为本申请提供的一种异构图卷积网络的训练装置。

请参考图5，本申请实施例提供的一种异构图卷积网络的训练装置，包括：

提取单元201，用于提取带标签的异构图中每种类型边的信息，生成每种类型边对应的邻接矩阵；

结合单元202，用于结合所有类型边对应的邻接矩阵和单位矩阵，生成异构图张量；

预测单元203，用于将异构图张量输入到异构图卷积网络进行节点类别预测，得到异构图中各节点的预测标签；

优化单元204，用于根据各节点的标签和预测标签计算损失值，并通过损失值优化异构图卷积网络的参数，直至异构图卷积网络收敛，得到训练好的异构图卷积网络。

作为进一步地改进，异构图卷积网络包括：若干个卷积模块和特征融合模块；

相应的，预测单元203具体包括：

特征提取子单元，用于将异构图张量输入到异构图卷积网络，通过各个卷积模块并行对异构图张量进行特征提取，得到若干个特征表征；

特征融合子单元，用于通过特征融合模块对若干个特征表征进行特征融合，得到融合特征，并基于融合特征进行节点类别预测，得到异构图中各节点的预测标签。

作为进一步地改进，卷积模块包括：异构卷积模块和图卷积模块；

相应的，特征提取子单元，具体用于：

将异构图张量输入到异构图卷积网络，通过各个卷积模块中的异构卷积模块并行对异构图张量进行张量卷积，得到各个卷积模块对应的邻接特征矩阵；

通过各个卷积模块中的图卷积模块并行对对应的邻接特征矩阵进行邻居聚集，得到各个卷积模块对应的特征表征。

特征融合子单元，具体用于：

通过特征融合模块基于注意力机制计算各个特征表征的权重，并基于权重对各个特征表征进行加权求和，得到融合特征；

并基于融合特征进行节点类别预测，得到异构图中各节点的预测标签。

作为进一步地改进，还包括：参数提取单元，具体用于：

提取各个异构卷积模块的参数，得到元路径的权重；

对元路径的权重进行排序，得到有效元路径的权重。

进一步，本申请实施例提出了一种异构图卷积网络进行图表征学习，异构图卷积网络中的异构卷积模块可以将异构图中具有不同的关系语义的邻接矩阵赋予不同的权重，并将其融合为一个新的邻接矩阵，对融合后的邻接矩阵结合不同结构的图卷积模块进行网络表征的学习，使得最终生成的异构图卷积网络可以同时高效学习异构图上的拓扑结构、属性信息和语义关系，在异构图上充分利用信息，得到有效的特征表征；并且本申请实施例提出的异构卷积模块的计算负担小，训练参数和边的类型相关，与异构图的节点数目无关，因此对于不同场景下的异构图数据都具有较好的适应性。

本申请实施例还提供了一种异构图卷积网络的训练设备，设备包括处理器以及存储器；

存储器用于存储程序代码，并将程序代码传输给处理器；

处理器用于根据程序代码中的指令执行前述方法实施例中的异构图卷积网络的训练方法。

本申请实施例还提供了一种计算机可读存储介质，计算机可读存储介质用于存储程序代码，程序代码用于执行前述方法实施例中的异构图卷积网络的训练方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以通过一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文全称：Read-OnlyMemory，英文缩写：ROM)、随机存取存储器(英文全称：RandomAccess Memory，英文缩写：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。