CN112862092A - 一种异构图卷积网络的训练方法、装置、设备和介质 - Google Patents

一种异构图卷积网络的训练方法、装置、设备和介质 Download PDF

Info

Publication number
CN112862092A
CN112862092A CN202110104958.5A CN202110104958A CN112862092A CN 112862092 A CN112862092 A CN 112862092A CN 202110104958 A CN202110104958 A CN 202110104958A CN 112862092 A CN112862092 A CN 112862092A
Authority
CN
China
Prior art keywords
graph
heterogeneous
convolution
node
heterogeneous graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110104958.5A
Other languages
English (en)
Other versions
CN112862092B (zh
Inventor
陈川
常耀民
郑子彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huihui Intelligent Technology Co.,Ltd.
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202110104958.5A priority Critical patent/CN112862092B/zh
Publication of CN112862092A publication Critical patent/CN112862092A/zh
Application granted granted Critical
Publication of CN112862092B publication Critical patent/CN112862092B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种异构图卷积网络的训练方法、装置、设备和介质,方法包括:提取带标签的异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵;结合所有类型边对应的邻接矩阵和单位矩阵,生成异构图张量;将异构图张量输入到异构图卷积网络进行节点类别预测,得到异构图中各节点的预测标签;根据各节点的标签和预测标签计算损失值,并通过损失值优化异构图卷积网络的参数,直至异构图卷积网络收敛,得到训练好的异构图卷积网络。本申请解决了现有技术将异构图当做同构图进行学习,没有利用异构图上的不同类型的边信息,信息损失严重,导致节点分类准确性不高的技术问题。

Description

一种异构图卷积网络的训练方法、装置、设备和介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种异构图卷积网络的训练方法、装置、设备和介质。
背景技术
目前,有大量数据采用异构图结构数据进行表示,如社交网络、电子商务系统、学术引用网络等。图因其强大且灵活的表征能力,成为关联大数据最自然、最直接的表示方式,对图结构数据进行分析和挖掘具有重大的社会价值和经济价值。虽然图具有很强的表示能力,但是图的复杂性也为机器学习算法带来了巨大的挑战。由于节点之间有着强耦合的拓扑关系,这导致了图上的挖掘计算复杂度高;且由于异构图复杂的节点类型和边类型的关联,异构图上的数据挖掘更显得困难。
图表示学习旨在将网络中的节点表示成低维、实值、稠密的向量形式,使得得到的节点的向量形式可以在向量空间中具有表示以及推理的能力,从而可以更加灵活地应用于不同的下游数据挖掘任务中。
现有的图表示学习方法通常将异构图当做同构图进行学习,或基于预定义的元路径来获得特定关系相连的邻居,将异构图转换为元路径对应的同构图来进行学习,该方法只利用了图的结构信息进行节点表征的学习,没有利用异构图上不同类型的边信息,信息损失严重,使得节点分类准确性不高。
发明内容
本申请提供了一种异构图卷积网络的训练方法、装置、设备和介质,用于解决现有技术将异构图当做同构图进行学习,没有利用异构图上的不同类型的边信息,信息损失严重,导致节点分类准确性不高的技术问题。
有鉴于此,本申请第一方面提供了一种异构图卷积网络的训练方法,包括:
提取带标签的异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵;
结合所有类型边对应的所述邻接矩阵和单位矩阵,生成异构图张量;
将所述异构图张量输入到异构图卷积网络进行节点类别预测,得到所述异构图中各节点的预测标签;
根据各节点的所述标签和所述预测标签计算损失值,并通过所述损失值优化所述异构图卷积网络的参数,直至所述异构图卷积网络收敛,得到训练好的异构图卷积网络。
可选的,所述异构图卷积网络包括:若干个卷积模块和特征融合模块;
所述将所述异构图张量输入到异构图卷积网络进行节点类别预测,得到所述异构图中各节点的预测标签,具体包括:
将所述异构图张量输入到异构图卷积网络,通过各个所述卷积模块并行对所述异构图张量进行特征提取,得到若干个特征表征;
通过所述特征融合模块对若干个所述特征表征进行特征融合,得到融合特征,并基于所述融合特征进行节点类别预测,得到所述异构图中各节点的预测标签。
可选的,所述卷积模块包括:异构卷积模块和图卷积模块;
所述将所述异构图张量输入到异构图卷积网络,通过各个所述卷积模块并行对所述异构图张量进行特征提取,得到若干个特征表征,具体包括:
将所述异构图张量输入到异构图卷积网络,通过各个所述卷积模块中的所述异构卷积模块并行对所述异构图张量进行张量卷积,得到各个所述卷积模块对应的邻接特征矩阵;
通过各个所述卷积模块中的所述图卷积模块并行对对应的所述邻接特征矩阵进行邻居聚集,得到各个所述卷积模块对应的特征表征。
可选的,所述异构卷积模块和所述图卷积模块的数量为多个,所述特征表征为:
Figure BDA0002917015510000021
其中,
Figure BDA0002917015510000031
为第l层图卷积模块的第i个节点的特征表征,
Figure BDA0002917015510000032
为第l-1层图卷积模块的第i个节点的特征表征,
Figure BDA0002917015510000033
为异构图中第i个节点的属性,σ(·)为激活函数,g(l)(·)为第l层图卷积模块的聚集函数,
Figure BDA0002917015510000034
为第l层异构卷积模块的邻接特征矩阵,deg(l)(i)为第l层图卷积模块的第i个节点的度,Mi为节点集合。
可选的,所述通过所述特征融合模块对若干个所述特征表征进行特征融合,得到融合特征,具体包括:
通过所述特征融合模块基于注意力机制计算各个所述特征表征的权重,并基于所述权重对各个所述特征表征进行加权求和,得到融合特征。
可选的,所述根据各节点的所述标签和所述预测标签计算损失值,并通过所述损失值优化所述异构图卷积网络的参数,直至所述异构图卷积网络收敛,得到训练好的异构图卷积网络,之后还包括:
提取各个所述异构卷积模块的参数,得到元路径的权重;
对所述元路径的权重进行排序,得到有效元路径的权重。
本申请第二方面提供了一种异构图卷积网络的训练装置,包括:
提取单元,用于提取带标签的异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵;
结合单元,用于结合所有类型边对应的所述邻接矩阵和单位矩阵,生成异构图张量;
预测单元,用于将所述异构图张量输入到异构图卷积网络进行节点类别预测,得到所述异构图中各节点的预测标签;
优化单元,用于根据各节点的所述标签和所述预测标签计算损失值,并通过所述损失值优化所述异构图卷积网络的参数,直至所述异构图卷积网络收敛,得到训练好的异构图卷积网络。
可选的,所述异构图卷积网络包括:若干个卷积模块和特征融合模块;
相应的,所述预测单元具体包括:
特征提取子单元,用于将所述异构图张量输入到异构图卷积网络,通过各个所述卷积模块并行对所述异构图张量进行特征提取,得到若干个特征表征;
特征融合子单元,用于通过所述特征融合模块对若干个所述特征表征进行特征融合,得到融合特征,并基于所述融合特征进行节点类别预测,得到所述异构图中各节点的预测标签。
本申请第三方面提供了一种异构图卷积网络的训练设备,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的异构图卷积网络的训练方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面任一种所述的异构图卷积网络的训练方法。
从以上技术方案可以看出,本申请具有以下优点:
本申请提供了一种异构图卷积网络的训练方法,包括:提取带标签的异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵;结合所有类型边对应的邻接矩阵和单位矩阵,生成异构图张量;将异构图张量输入到异构图卷积网络进行节点类别预测,得到异构图中各节点的预测标签;根据各节点的标签和预测标签计算损失值,并通过损失值优化异构图卷积网络的参数,直至异构图卷积网络收敛,得到训练好的异构图卷积网络。
本申请中,通过提取带标签的异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵,再结合所有类型边对应的邻接矩阵和单位矩阵,生成异构图张量,本申请通过提取异构图中各类型边的信息生成异构图张量,再通过该异构图张量训练异构图卷积网络,可以充分学习异构图上的拓扑结构、属性信息和语义关系,充分利用异构图上的信息,有效提高异构图卷积网络的节点分类准确率,解决了现有技术将异构图当做同构图进行学习,没有利用异构图上的不同类型的边信息,信息损失严重,导致节点分类准确性不高的技术问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种异构图卷积网络的训练方法的一个流程示意图;
图2为本申请实施例的每种类型边对应的邻接矩阵生成过程的一个示意图;
图3为本申请实施例的异构图张量输入到异构卷积模块进行张量卷积过程的一个示意图;
图4为本申请实施例的一种异构图卷积网络的一个结构示意图;
图5为本申请实施例提供的一种异构图卷积网络的训练装置的一个结构示意图。
具体实施方式
本申请提供了一种异构图卷积网络的训练方法、装置、设备和介质,用于解决现有技术将异构图当做同构图进行学习,没有利用异构图上的不同类型的边信息,信息损失严重,导致节点分类准确性不高的技术问题。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
术语解释:
图表示学习:图表示学习是指在图数据中学习其结构信息、语义信息,将每一个节点表示为一个高维、稠密的向量。该向量可以后续用于在图上进行节点分类和链路预测等任务。图表示学习可以更好地学习图上复杂的结构和语义关联,从而对图数据进行更好的挖掘。
图神经网络:图神经网络(GNN)是指基于卷积神经网络(CNN)的思想下对图等不规则的结构搭建神经网络进行学习的网络。图神经网络处理非结构化数据时的出色能力使其在图表示学习、图数据挖掘等问题方面都取得了新的突破。
异构图:异构图是指具有多种节点类型、多种节点属性和多种边的类型的图。异构图与同构图相对应。以学术引用图为例,同构图只能表示“论文”一种节点和“引用”一种关系。而异构图可以表示“论文”“会议”“作者”等多种节点类型和“引用”“写作”“出版”等多种关系。
元路径:元路径是指对异构图定义的一种先验的知识模式,如在异构图上可以定义元路径为A-P-C-P-A,其中A代表作者,P代表论文,C代表会议。通过该元路径互相连接的节点则可以表示“在同一会议中发表论文”这一关系,这一关系可能包含了如研究兴趣等信息。另一个元路径的例子如A-P-A,它可以代表“共同作者”这一关系。
为了便于理解,请参阅图1,本申请提供的一种异构图卷积网络的训练方法的一个实施例,包括:
步骤101、提取带标签的异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵。
现有的图学习方法大多利用了图的拓扑结构信息或节点的属性信息来学习节点的特征表示,然而在异构图中还具有大量特定的关系语义信息,不同的节点类型应当处于不同的表示空间中,而不同的边类型也应当单独进行建模。现有方法将异构图作为同构图进行学习,或者基于预定义的元路径来获得特定关系相连的邻居,将异构图转换为元路径对应的同构图进行学习,忽略了异构图的异构信息,造成大量信息的损失,影响最终的节点特征表示,从而无法达到更好的下游任务效果。
为了解决上述问题,本申请实施例在获取到带标签的异构图后,提取该异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵。具体的,可以参考图2和图3,根据异构图中每种类型边的信息,将每一种类型边表示为一个N×N的邻接矩阵A,其中,邻接矩阵中的值为0或1,若节点i和节点j之间具有邻边,则Aij=1,否则为0;将每种类型边的邻接矩阵进行拼接,得到K个大小为N×N的邻接矩阵,每个邻接矩阵代表一种类型边的关系。
步骤102、结合所有类型边对应的邻接矩阵和单位矩阵,生成异构图张量。
将上述步骤拼接后得到的多个邻接矩阵后添加一个单位矩阵I,得到邻接矩阵表,将该邻接矩阵表以高维张量的形式进行表示,生成异构图张量
Figure BDA0002917015510000071
其中,该单位矩阵用于建模自身关系,并在后续可用于提取短的元路径模式。
步骤103、将异构图张量输入到异构图卷积网络进行节点类别预测,得到异构图中各节点的预测标签。
本申请实施例中的异构图卷积网络包括:若干个卷积模块和特征融合模块。
将异构图张量输入到异构图卷积网络进行节点类别预测,得到异构图中各节点的预测标签,具体包括:
S1、将异构图张量输入到异构图卷积网络,通过各个卷积模块并行对异构图张量进行特征提取,得到若干个特征表征。
进一步,本申请实施例中的卷积模块包括:异构卷积模块和图卷积模块;将异构图张量输入到异构图卷积网络,通过各个卷积模块并行对异构图张量进行特征提取,得到若干个特征表征,具体包括:
S11、将异构图张量输入到异构图卷积网络,通过各个卷积模块中的异构卷积模块并行对异构图张量进行张量卷积,得到各个卷积模块对应的邻接特征矩阵。
在本申请实施例中,异构图卷积模块用于对异构图张量A进行1×1的张量卷积,得到大小为N×N的邻接特征矩阵Aconv,具体可以参考图3。此时的邻接特征矩阵Aconv为不同关系的邻接矩阵赋予了权重后结合得到的新的邻接矩阵。
S12、通过各个卷积模块中的图卷积模块并行对对应的邻接特征矩阵进行邻居聚集,得到各个卷积模块对应的特征表征。
在本申请实施例中,每个卷积模块采用L个独立的异构卷积模块,并按照图神经网络的方式进行L层信息的传递,每层异构卷积模块后采用图卷积模块(即图4中的SGC层)进行邻居聚集,第L层的图卷积模块输出的特征表征即为该卷积模块的最终输出。其中,第l层(l=1,2,...,L)卷积模块聚集后的特征表征为:
Figure BDA0002917015510000081
其中,
Figure BDA0002917015510000082
为第l层图卷积模块的第i个节点的特征表征,
Figure BDA0002917015510000083
为第l-1层图卷积模块的第i个节点的特征表征,
Figure BDA0002917015510000084
为异构图中第i个节点的属性,σ(·)为激活函数,g(l)(·)为第l层图卷积模块的聚集函数,
Figure BDA0002917015510000085
为第l层异构卷积模块的邻接特征矩阵,deg(l)(i)为第l层图卷积模块的第i个节点的度,Mi为节点集合。
根据上述公式可知,第一层图卷积模块和其他层图卷积模块的聚集方式不同,第一层图卷积模块需要进行线性变换层的训练,其他层图卷积模块不需要进行线性变换层的训练只对特征进行平滑和聚集操作。最终得到的
Figure BDA0002917015510000086
为第L层第i个节点经过图聚集得到特征表征。
S2、通过特征融合模块对若干个特征表征进行特征融合,得到融合特征,并基于融合特征进行节点类别预测,得到异构图中各节点的预测标签。
本申请实施例采用C个独立卷积模块并行对异构图张量进行特征提取,对每个节点都得到C个特征表征
Figure BDA0002917015510000087
k=1,2,...,C,可以理解为C个通道的特征表征。然后对C个通道的特征表征进行通道特征融合,得到融合特征,整个过程可以参考图4。
进一步,在本申请实施例中,通过特征融合模块基于注意力机制计算各个特征表征的权重,并基于权重对各个特征表征进行加权求和,得到融合特征。其中,第i个节点的第c个通道(c=1,2,...,C)的权重wc(i)为:
Figure BDA0002917015510000088
其中,
Figure BDA0002917015510000089
为第i个节点在第c个通道的特征表征,q为可训练的向量,用于计算不同通道上的特征的重要性。
最终得到的融合特征为:
Figure BDA00029170155100000810
本申请实施例中的异构图卷积网络结合异构卷积模块和图卷积模块的邻居聚集以及多通道融合机制,可以学习出好的节点表征,有助于提高下游任务的效果。
基于融合特征进行节点类别预测,得到异构图中各节点的预测标签。本申请实施例在融合模块中添加线性层并进行softmax计算,以对每个节点进行分类预测,其公式为:
Figure BDA0002917015510000091
其中,E为线性层,用于对融合特征进行线性化处理,
Figure BDA0002917015510000092
为第i个节点的预测标签。
步骤104、根据各节点的标签和预测标签计算损失值,并通过损失值优化异构图卷积网络的参数,直至异构图卷积网络收敛,得到训练好的异构图卷积网络。
在本申请实施例中,损失函数为:
Figure BDA0002917015510000093
其中,Yi为第i个节点的真实标签。
基于各节点的标签和预测标签,通过上述损失函数计算损失值,计算得到损失值后,可以通过随机梯度下降法优化异构图卷积网络的参数,直至异构图卷积网络收敛,得到训练好的异构图卷积网络。训练好的异构图卷积网络可以用于节点类别预测。
进一步,在得到训练好的异构图卷积网络后,可以分析异构图卷积网络中每个异构卷积模块,提取元路径,可以为异构图卷积网络的有效性提供可解释性,减少不同场景下人工筛选元路径的成本和不确定性。具体的,提取各异构卷积模块的参数,得到元路径的权重;对元路径的权重进行排序,得到有效元路径的权重,其中,有效元路径
Figure BDA0002917015510000096
的重要性为:
Figure BDA0002917015510000094
式中,
Figure BDA0002917015510000095
为第L层异构卷积模块的参数,该参数可以表示第L层异构卷积模块中对RL这种类型的路径计算出的重要性。
本申请实施例中,通过提取带标签的异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵,再结合所有类型边对应的邻接矩阵和单位矩阵,生成异构图张量,本申请通过提取异构图中各类型边的信息生成异构图张量,再通过该异构图张量训练异构图卷积网络,可以充分学习异构图上的拓扑结构、属性信息和语义关系,充分利用异构图上的信息,有效提高异构图卷积网络的节点分类准确率,解决了现有技术将异构图当做同构图进行学习,没有利用异构图上的不同类型的边信息,信息损失严重,导致节点分类准确性不高的技术问题。
进一步,本申请实施例提出了一种异构图卷积网络进行图表示学习,异构图卷积网络中的异构卷积模块可以将异构图中具有不同的关系语义的邻接矩阵赋予不同的权重,并将其融合为一个新的邻接矩阵,对融合后的邻接矩阵结合不同结构的图卷积模块进行网络表征的学习,使得最终生成的异构图卷积网络可以同时高效学习异构图上的拓扑结构、属性信息和语义关系,在异构图上充分利用信息,得到有效的特征表征;并且本申请实施例提出的异构卷积模块的计算负担小,训练参数和边的类型相关,与异构图的节点数目无关,因此对于不同场景下的异构图数据都具有较好的适应性。
以上为本申请提供的一种异构图卷积网络的训练方法,以下为本申请提供的一种异构图卷积网络的训练装置。
请参考图5,本申请实施例提供的一种异构图卷积网络的训练装置,包括:
提取单元201,用于提取带标签的异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵;
结合单元202,用于结合所有类型边对应的邻接矩阵和单位矩阵,生成异构图张量;
预测单元203,用于将异构图张量输入到异构图卷积网络进行节点类别预测,得到异构图中各节点的预测标签;
优化单元204,用于根据各节点的标签和预测标签计算损失值,并通过损失值优化异构图卷积网络的参数,直至异构图卷积网络收敛,得到训练好的异构图卷积网络。
作为进一步地改进,异构图卷积网络包括:若干个卷积模块和特征融合模块;
相应的,预测单元203具体包括:
特征提取子单元,用于将异构图张量输入到异构图卷积网络,通过各个卷积模块并行对异构图张量进行特征提取,得到若干个特征表征;
特征融合子单元,用于通过特征融合模块对若干个特征表征进行特征融合,得到融合特征,并基于融合特征进行节点类别预测,得到异构图中各节点的预测标签。
作为进一步地改进,卷积模块包括:异构卷积模块和图卷积模块;
相应的,特征提取子单元,具体用于:
将异构图张量输入到异构图卷积网络,通过各个卷积模块中的异构卷积模块并行对异构图张量进行张量卷积,得到各个卷积模块对应的邻接特征矩阵;
通过各个卷积模块中的图卷积模块并行对对应的邻接特征矩阵进行邻居聚集,得到各个卷积模块对应的特征表征。
特征融合子单元,具体用于:
通过特征融合模块基于注意力机制计算各个特征表征的权重,并基于权重对各个特征表征进行加权求和,得到融合特征;
并基于融合特征进行节点类别预测,得到异构图中各节点的预测标签。
作为进一步地改进,还包括:参数提取单元,具体用于:
提取各个异构卷积模块的参数,得到元路径的权重;
对元路径的权重进行排序,得到有效元路径的权重。
本申请实施例中,通过提取带标签的异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵,再结合所有类型边对应的邻接矩阵和单位矩阵,生成异构图张量,本申请通过提取异构图中各类型边的信息生成异构图张量,再通过该异构图张量训练异构图卷积网络,可以充分学习异构图上的拓扑结构、属性信息和语义关系,充分利用异构图上的信息,有效提高异构图卷积网络的节点分类准确率,解决了现有技术将异构图当做同构图进行学习,没有利用异构图上的不同类型的边信息,信息损失严重,导致节点分类准确性不高的技术问题。
进一步,本申请实施例提出了一种异构图卷积网络进行图表征学习,异构图卷积网络中的异构卷积模块可以将异构图中具有不同的关系语义的邻接矩阵赋予不同的权重,并将其融合为一个新的邻接矩阵,对融合后的邻接矩阵结合不同结构的图卷积模块进行网络表征的学习,使得最终生成的异构图卷积网络可以同时高效学习异构图上的拓扑结构、属性信息和语义关系,在异构图上充分利用信息,得到有效的特征表征;并且本申请实施例提出的异构卷积模块的计算负担小,训练参数和边的类型相关,与异构图的节点数目无关,因此对于不同场景下的异构图数据都具有较好的适应性。
本申请实施例还提供了一种异构图卷积网络的训练设备,设备包括处理器以及存储器;
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行前述方法实施例中的异构图卷积网络的训练方法。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行前述方法实施例中的异构图卷积网络的训练方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:RandomAccess Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种异构图卷积网络的训练方法,其特征在于,包括:
提取带标签的异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵;
结合所有类型边对应的所述邻接矩阵和单位矩阵,生成异构图张量;
将所述异构图张量输入到异构图卷积网络进行节点类别预测,得到所述异构图中各节点的预测标签;
根据各节点的所述标签和所述预测标签计算损失值,并通过所述损失值优化所述异构图卷积网络的参数,直至所述异构图卷积网络收敛,得到训练好的异构图卷积网络。
2.根据权利要求1所述的异构图卷积网络的训练方法,其特征在于,所述异构图卷积网络包括:若干个卷积模块和特征融合模块;
所述将所述异构图张量输入到异构图卷积网络进行节点类别预测,得到所述异构图中各节点的预测标签,具体包括:
将所述异构图张量输入到异构图卷积网络,通过各个所述卷积模块并行对所述异构图张量进行特征提取,得到若干个特征表征;
通过所述特征融合模块对若干个所述特征表征进行特征融合,得到融合特征,并基于所述融合特征进行节点类别预测,得到所述异构图中各节点的预测标签。
3.根据权利要求2所述的异构图卷积网络的训练方法,其特征在于,所述卷积模块包括:异构卷积模块和图卷积模块;
所述将所述异构图张量输入到异构图卷积网络,通过各个所述卷积模块并行对所述异构图张量进行特征提取,得到若干个特征表征,具体包括:
将所述异构图张量输入到异构图卷积网络,通过各个所述卷积模块中的所述异构卷积模块并行对所述异构图张量进行张量卷积,得到各个所述卷积模块对应的邻接特征矩阵;
通过各个所述卷积模块中的所述图卷积模块并行对对应的所述邻接特征矩阵进行邻居聚集,得到各个所述卷积模块对应的特征表征。
4.根据权利要求3所述的异构图卷积网络的训练方法,其特征在于,所述异构卷积模块和所述图卷积模块的数量为多个,所述特征表征为:
Figure FDA0002917015500000021
其中,
Figure FDA0002917015500000022
为第l层图卷积模块的第i个节点的特征表征,
Figure FDA0002917015500000023
为第l-1层图卷积模块的第i个节点的特征表征,
Figure FDA0002917015500000024
为异构图中第i个节点的属性,σ(·)为激活函数,g(l)(·)为第l层图卷积模块的聚集函数,
Figure FDA0002917015500000025
为第l层异构卷积模块的邻接特征矩阵,deg(l)(i)为第l层图卷积模块的第i个节点的度,Mi为节点集合。
5.根据权利要求2所述的异构图卷积网络的训练方法,其特征在于,所述通过所述特征融合模块对若干个所述特征表征进行特征融合,得到融合特征,具体包括:
通过所述特征融合模块基于注意力机制计算各个所述特征表征的权重,并基于所述权重对各个所述特征表征进行加权求和,得到融合特征。
6.根据权利要求4所述的异构图卷积网络的训练方法,其特征在于,所述根据各节点的所述标签和所述预测标签计算损失值,并通过所述损失值优化所述异构图卷积网络的参数,直至所述异构图卷积网络收敛,得到训练好的异构图卷积网络,之后还包括:
提取各个所述异构卷积模块的参数,得到元路径的权重;
对所述元路径的权重进行排序,得到有效元路径的权重。
7.一种异构图卷积网络的训练装置,其特征在于,包括:
提取单元,用于提取带标签的异构图中每种类型边的信息,生成每种类型边对应的邻接矩阵;
结合单元,用于结合所有类型边对应的所述邻接矩阵和单位矩阵,生成异构图张量;
预测单元,用于将所述异构图张量输入到异构图卷积网络进行节点类别预测,得到所述异构图中各节点的预测标签;
优化单元,用于根据各节点的所述标签和所述预测标签计算损失值,并通过所述损失值优化所述异构图卷积网络的参数,直至所述异构图卷积网络收敛,得到训练好的异构图卷积网络。
8.根据权利要求7所述的异构图卷积网络的训练装置,其特征在于,所述异构图卷积网络包括:若干个卷积模块和特征融合模块;
相应的,所述预测单元具体包括:
特征提取子单元,用于将所述异构图张量输入到异构图卷积网络,通过各个所述卷积模块并行对所述异构图张量进行特征提取,得到若干个特征表征;
特征融合子单元,用于通过所述特征融合模块对若干个所述特征表征进行特征融合,得到融合特征,并基于所述融合特征进行节点类别预测,得到所述异构图中各节点的预测标签。
9.一种异构图卷积网络的训练设备,其特征在于,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-6任一项所述的异构图卷积网络的训练方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-6任一项所述的异构图卷积网络的训练方法。
CN202110104958.5A 2021-01-26 2021-01-26 一种异构图卷积网络的训练方法、装置、设备和介质 Active CN112862092B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110104958.5A CN112862092B (zh) 2021-01-26 2021-01-26 一种异构图卷积网络的训练方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110104958.5A CN112862092B (zh) 2021-01-26 2021-01-26 一种异构图卷积网络的训练方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN112862092A true CN112862092A (zh) 2021-05-28
CN112862092B CN112862092B (zh) 2021-11-26

Family

ID=76009242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110104958.5A Active CN112862092B (zh) 2021-01-26 2021-01-26 一种异构图卷积网络的训练方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN112862092B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113469415A (zh) * 2021-06-07 2021-10-01 湖北工业大学 一种网络流量预测方法和计算机设备
CN113516379A (zh) * 2021-06-25 2021-10-19 深圳信息职业技术学院 一种智能质检的工单评分方法
CN113537593A (zh) * 2021-07-15 2021-10-22 之江实验室 预测议员投票倾向的方法及其装置
CN114595897A (zh) * 2022-03-17 2022-06-07 四川大学 基于动态异构图卷积的多价值链汽车配件需求预测方法
CN115688913A (zh) * 2022-12-29 2023-02-03 中南大学 一种云边端协同个性化联邦学习方法、系统、设备及介质
WO2023221275A1 (zh) * 2022-05-17 2023-11-23 中山大学 一种基于张量图卷积网络的节点分类方法及系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299373A (zh) * 2018-10-20 2019-02-01 上海交通大学 基于图卷积技术的推荐系统
CN109583562A (zh) * 2017-09-28 2019-04-05 西门子股份公司 Sgcnn:结构的基于图的卷积神经网络
CN110263780A (zh) * 2018-10-30 2019-09-20 腾讯科技(深圳)有限公司 实现异构图、分子空间结构性质识别的方法、装置和设备
CN110569437A (zh) * 2019-09-05 2019-12-13 腾讯科技(深圳)有限公司 点击概率预测、页面内容推荐方法和装置
CN111222049A (zh) * 2020-01-08 2020-06-02 东北大学 语义增强的异构信息网络上Top-k相似度搜索方法
CN111310068A (zh) * 2020-03-11 2020-06-19 广东工业大学 基于动态图的社交网络节点分类方法
CN111340113A (zh) * 2020-02-26 2020-06-26 常州工学院 一种基于异构特征统一深度神经网络的中国水墨画识别方法
US20200233864A1 (en) * 2019-01-18 2020-07-23 Adobe Inc. Latent network summarization
CN111598710A (zh) * 2020-05-11 2020-08-28 北京邮电大学 社交网络事件的检测方法和装置
US20200342006A1 (en) * 2019-04-29 2020-10-29 Adobe Inc. Higher-Order Graph Clustering
CN112148931A (zh) * 2020-09-29 2020-12-29 河北工业大学 用于高阶异构图分类的元路径学习方法
CN112163069A (zh) * 2020-09-27 2021-01-01 广东工业大学 一种基于图神经网络节点特征传播优化的文本分类方法
CN112215837A (zh) * 2020-10-26 2021-01-12 北京邮电大学 多属性图像语义分析方法和装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583562A (zh) * 2017-09-28 2019-04-05 西门子股份公司 Sgcnn:结构的基于图的卷积神经网络
CN109299373A (zh) * 2018-10-20 2019-02-01 上海交通大学 基于图卷积技术的推荐系统
CN110263780A (zh) * 2018-10-30 2019-09-20 腾讯科技(深圳)有限公司 实现异构图、分子空间结构性质识别的方法、装置和设备
US20200233864A1 (en) * 2019-01-18 2020-07-23 Adobe Inc. Latent network summarization
US20200342006A1 (en) * 2019-04-29 2020-10-29 Adobe Inc. Higher-Order Graph Clustering
CN110569437A (zh) * 2019-09-05 2019-12-13 腾讯科技(深圳)有限公司 点击概率预测、页面内容推荐方法和装置
CN111222049A (zh) * 2020-01-08 2020-06-02 东北大学 语义增强的异构信息网络上Top-k相似度搜索方法
CN111340113A (zh) * 2020-02-26 2020-06-26 常州工学院 一种基于异构特征统一深度神经网络的中国水墨画识别方法
CN111310068A (zh) * 2020-03-11 2020-06-19 广东工业大学 基于动态图的社交网络节点分类方法
CN111598710A (zh) * 2020-05-11 2020-08-28 北京邮电大学 社交网络事件的检测方法和装置
CN112163069A (zh) * 2020-09-27 2021-01-01 广东工业大学 一种基于图神经网络节点特征传播优化的文本分类方法
CN112148931A (zh) * 2020-09-29 2020-12-29 河北工业大学 用于高阶异构图分类的元路径学习方法
CN112215837A (zh) * 2020-10-26 2021-01-12 北京邮电大学 多属性图像语义分析方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GUILLEM CUCURULL等: "GRAPH ATTENTION NETWORKS", 《PUBLISHED AS A CONFERENCE PAPER AT ICLR 2018》 *
LIN MENG等: "Discovering Localized Information for Heterogeneous Graph Node Representation Learning", 《2020 IEEE 6TH INTERNATIONAL CONFERENCE ON COLLABORATION AND INTERNET COMPUTING (CIC)》 *
SHICHAO ZHU等: "Relation Structure-Aware Heterogeneous Graph Neural Network", 《2019 IEEE INTERNATIONAL CONFERENCE ON DATA MINING (ICDM)》 *
THOMAS N. KIPF等: "Semi-Supervised Classification with Graph Convolutional Networks", 《ARXIV:1609.02907V4 [CS.LG] 22 FEB 2017》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113469415A (zh) * 2021-06-07 2021-10-01 湖北工业大学 一种网络流量预测方法和计算机设备
CN113469415B (zh) * 2021-06-07 2023-04-07 湖北工业大学 一种网络流量预测方法和计算机设备
CN113516379A (zh) * 2021-06-25 2021-10-19 深圳信息职业技术学院 一种智能质检的工单评分方法
CN113537593A (zh) * 2021-07-15 2021-10-22 之江实验室 预测议员投票倾向的方法及其装置
CN114595897A (zh) * 2022-03-17 2022-06-07 四川大学 基于动态异构图卷积的多价值链汽车配件需求预测方法
CN114595897B (zh) * 2022-03-17 2023-04-18 四川大学 基于动态异构图卷积的多价值链汽车配件需求预测方法
WO2023221275A1 (zh) * 2022-05-17 2023-11-23 中山大学 一种基于张量图卷积网络的节点分类方法及系统
CN115688913A (zh) * 2022-12-29 2023-02-03 中南大学 一种云边端协同个性化联邦学习方法、系统、设备及介质
CN115688913B (zh) * 2022-12-29 2023-06-27 中南大学 一种云边端协同个性化联邦学习方法、系统、设备及介质

Also Published As

Publication number Publication date
CN112862092B (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN112862092B (zh) 一种异构图卷积网络的训练方法、装置、设备和介质
US10984066B2 (en) System and method for a web scraping tool and classification engine
CN110334742B (zh) 一种用于文档分类的基于强化学习的通过添加虚假节点的图对抗样本生成方法
CN112508085B (zh) 基于感知神经网络的社交网络链路预测方法
CN110263280B (zh) 一种基于多视图的动态链路预测深度模型及应用
EP3349152A1 (en) Classifying data
Chiang et al. A novel artificial bee colony optimization algorithm with SVM for bio-inspired software-defined networking
Huang et al. Large-scale heterogeneous feature embedding
CN110321394A (zh) 基于知识图谱的网络安全数据组织方法及计算机存储介质
CN115244587A (zh) 高效基础事实注释
Liang et al. Survey of graph neural networks and applications
CN113228059A (zh) 面向跨网络的表示学习算法
CN113254649B (zh) 敏感内容识别模型的训练方法、文本识别方法及相关装置
Yan et al. A clustering algorithm for multi-modal heterogeneous big data with abnormal data
Song et al. Domain adaptive network embedding
KR102120443B1 (ko) 엔트로피 기반 신경망(Neural Networks) 부분학습 방법 및 시스템
CN110717116B (zh) 关系网络的链接预测方法及系统、设备、存储介质
CN113055218A (zh) Nfv网络的冗余性评价方法、装置及计算设备
CN117272195A (zh) 基于图卷积注意力网络的区块链异常节点检测方法及系统
CN115544307A (zh) 基于关联矩阵的有向图数据特征提取与表达方法和系统
CN115329834A (zh) 电缆状态确定方法、装置及系统
Javaheripi et al. Swann: Small-world architecture for fast convergence of neural networks
CN115481215A (zh) 一种基于时态合作者知识图谱的合作者预测方法和预测系统
CN112862003A (zh) 一种图神经网络信息增强方法、装置及设备
Ndubuaku et al. Cloud-assisted adaptive stream processing from discriminative representations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230407

Address after: Room 601, Building B1, 136 Kaiyuan Avenue, Huangpu District, Guangzhou City, Guangdong Province, 510000

Patentee after: Guangzhou Huihui Intelligent Technology Co.,Ltd.

Address before: 510275 No. 135 West Xingang Road, Guangdong, Guangzhou

Patentee before: SUN YAT-SEN University

TR01 Transfer of patent right