CN114943016A - 一种基于跨粒度联合训练的图对比表征学习方法及系统 - Google Patents

一种基于跨粒度联合训练的图对比表征学习方法及系统 Download PDF

Info

Publication number
CN114943016A
CN114943016A CN202210690197.0A CN202210690197A CN114943016A CN 114943016 A CN114943016 A CN 114943016A CN 202210690197 A CN202210690197 A CN 202210690197A CN 114943016 A CN114943016 A CN 114943016A
Authority
CN
China
Prior art keywords
graph
fusion
data
disturbed
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210690197.0A
Other languages
English (en)
Inventor
孙成宇
迟令
胡亮
李宏图
李帅
李拓航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202210690197.0A priority Critical patent/CN114943016A/zh
Publication of CN114943016A publication Critical patent/CN114943016A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于跨粒度联合训练的图对比表征学习方法及系统,涉及图对比表征学习技术领域,包括:根据训练图数据得到节点级特征和图级特征;根据节点级特征和图级特征得到融合特征;根据融合特征和邻接矩阵得到融合图数据;分别采用第一扰动方案和第二扰动方案对融合图数据进行扰动,得到第一扰动后的融合图数据和第二扰动后的融合图数据;利用第一扰动后的融合图数据和第二扰动后的融合图数据对图学习模型进行训练和优化,得到优化后的图学习模型;将待表征学习图数据对应的第一扰动后的融合图数据和第二扰动后的融合图数据输入优化后的图学习模型中,得到待表征学习图数据对应的第一特征向量和第二特征向量。本发明能提取出更有效的图表征。

Description

一种基于跨粒度联合训练的图对比表征学习方法及系统
技术领域
本发明涉及图对比表征学习技术领域,特别是涉及一种基于跨粒度联合训练的图对比表征学习方法及系统。
背景技术
数据结构中的图(graph)由节点和边构成。带有边和节点的图数据作为一种可以表达大量信息的数据结构,可用来存储各种领域的数据,包括社会网络、物理系统、蛋白质-蛋白质交互网和常识图。研究人员可以在图上进行很多图分析任务,包括图数据(如生物、化学分子、社交网络等)的链接预测、节点分类、图分类和聚类等。因此,如何在图数据上进行高效学习已经引起了研究人员越来越多的关注,而图表示学习(图表征学习)是一种分析图数据的强大的工具。
以往的图学习模型(图表征学习模型)大多以监督或半监督的方式进行训练,这在很大程度上依赖于人工注释的数据集质量,使得这些方法在现实场景中的应用面临挑战,尤其是那些需要专家知识的场景,如医学和化学领域,并面临着过拟合、鲁棒性差、泛化能力弱等问题。因此,无需人工标注数据集的无监督图学习,尤其是自监督学习,已经成为一个热门的研究课题。随着神经网络的快速发展,并受到计算机视觉中对比学习的成功启发,研究人员开始探索将图神经网络和对比学习框架应用在图学习中。
对比学习是一种自监督学习的范式,旨在训练单个或多个编码器,将图数据压缩到低维嵌入,同时保留图的节点/边缘特征或拓扑特征。包括Deep Graph InfoMax(DGI)和GRACE在内的早期工作,因其巧妙的模型架构和实用的损失函数,使其在图学习中取得了巨大的成功。具体来说,受计算机视觉中Deep InfoMax(DIM)的启发,DGI首先通过训练图神经网络编码器以获得节点级的特征,并通过读出函数获得图级的特征。最后,通过最大化节点级和图级特征之间的互信息来训练模型。与DGI不同,GRACE建立了多个增强图,并通过促使不同视图中相同节点之间的一致性来训练模型。然而,DGI和GRACE对于探索图级特征是不足的。虽然DGI使用读出函数将节点级特征转换为图级特征,但它只简单的将节点级特征取平均值从而得到图级特征,但是在编码器学习过程中并没有进行图级特征的训练,而GRACE只进行了节点级的特征训练,这可能导致关键的图级信息的丢失并造成得到的特征向量的表达能力损失。因此,目前现有的图对比表征学习(图对比表示学习)方法无法提取出更有效的图表征。
发明内容
本发明的目的是提供一种基于跨粒度联合训练的图对比表征学习方法及系统,以提取出更有效的图表征。
为实现上述目的,本发明提供了如下方案:
一种基于跨粒度联合训练的图对比表征学习方法,所述方法包括:
获取训练图数据;所述训练图数据包括训练图的特征矩阵和邻接矩阵;
根据所述训练图数据得到节点级特征和图级特征;
根据所述节点级特征和所述图级特征得到融合特征;
根据所述融合特征和所述邻接矩阵得到融合图数据;所述融合图数据包括所述融合特征和所述邻接矩阵;
分别采用第一扰动方案和第二扰动方案对所述融合图数据进行扰动,得到第一扰动后的融合图数据和第二扰动后的融合图数据;所述扰动方案包括边扰动和节点特征扰动;所述扰动后的融合图数据包括扰动后的融合特征和扰动后的邻接矩阵;
利用所述第一扰动后的融合图数据和所述第二扰动后的融合图数据对图学习模型进行训练和优化,得到优化后的图学习模型;所述优化后的图学习模型的输入为第一扰动后的融合图数据和第二扰动后的融合图数据;所述优化后的图学习模型的输出为第一特征向量和第二特征向量;
将待表征学习图数据对应的第一扰动后的融合图数据和第二扰动后的融合图数据输入所述优化后的图学习模型中,得到待表征学习图数据对应的第一特征向量和第二特征向量。
可选地,所述根据所述训练图数据得到节点级特征和图级特征,具体包括:
根据所述训练图数据得到每个节点对应的节点级特征;
针对每一节点,将所述节点的邻接节点对应的节点级特征相加后求平均,得到所述节点对应的图级特征。
可选地,所述根据所述节点级特征和所述图级特征得到融合特征,具体包括:
对所述节点级特征和所述图级特征进行拼接操作,得到融合特征。
可选地,所述边扰动具体包括:
获取随机采样矩阵;所述随机采样矩阵与所述邻接矩阵的行数和列数均相同;所述随机采样矩阵由0和1构成;所述随机采样矩阵中的每个元素均遵循伯努利分布;
利用Hadamard积,将所述邻接矩阵乘以所述随机采样矩阵,得到扰动后的邻接矩阵。
可选地,所述节点特征扰动具体包括:
获取随机采样向量;所述随机采样向量由0和1构成;所述随机采样向量的维度与所述融合特征的维度相同;所述随机采样向量的每个维度均是以设定概率从伯努利分布中抽取;
利用Hadamard积,将所述融合特征乘以所述随机采样向量,得到扰动后的融合特征。
可选地,所述图学习模型具体包括第一图卷积神经网络、第二图卷积神经网络、第一双层感知机、第二双层感知机和对比损失函数;
所述第一双层感知机与所述第一图卷积神经网络连接;所述第二双层感知机与所述第二图卷积神经网络连接;所述对比损失函数与所述第一双层感知机和所述第二双层感知机均连接;
所述第一图卷积神经网络和所述第二图卷积神经网络共享参数;所述第一双层感知机和所述第二双层感知机共享参数。
可选地,所述利用所述第一扰动后的融合图数据和所述第二扰动后的融合图数据对图学习模型进行训练和优化,得到优化后的图学习模型,具体包括:
将所述第一扰动后的融合图数据输入所述第一图卷积神经网络中,得到第一节点特征,同时,将所述第二扰动后的融合图数据输入第二图卷积神经网络中,得到第二节点特征;
将所述第一节点特征输入第一双层感知机中,得到第一特征向量,同时,将所述第二节点特征输入第二双层感知机中,得到第二特征向量;
将所述第一特征向量和所述第二特征向量输入对比损失函数中,利用所述第一扰动后的融合图数据和所述第二扰动后的融合图数据对所述第一图卷积神经网络、所述第二图卷积神经网络、所述第一双层感知机和所述第二双层感知机进行训练,并利用所述第一特征向量、所述第二特征向量和所述对比损失函数对所述第一图卷积神经网络、所述第二图卷积神经网络、所述第一双层感知机和所述第二双层感知机进行参数优化,得到优化后的第一图卷积神经网络、第二图卷积神经网络、第一双层感知机和第二双层感知机。
本发明还提供了如下方案:
一种基于跨粒度联合训练的图对比表征学习系统,所述系统包括:
训练图数据获取模块,用于获取训练图数据;所述训练图数据包括训练图的特征矩阵和邻接矩阵;
图级特征得到模块,用于根据所述训练图数据得到节点级特征和图级特征;
融合特征得到模块,用于根据所述节点级特征和所述图级特征得到融合特征;
融合图数据得到模块,用于根据所述融合特征和所述邻接矩阵得到融合图数据;所述融合图数据包括所述融合特征和所述邻接矩阵;
扰动模块,用于分别采用第一扰动方案和第二扰动方案对所述融合图数据进行扰动,得到第一扰动后的融合图数据和第二扰动后的融合图数据;所述扰动方案包括边扰动和节点特征扰动;所述扰动后的融合图数据包括扰动后的融合特征和扰动后的邻接矩阵;
模型训练和优化模块,用于利用所述第一扰动后的融合图数据和所述第二扰动后的融合图数据对图学习模型进行训练和优化,得到优化后的图学习模型;所述优化后的图学习模型的输入为第一扰动后的融合图数据和第二扰动后的融合图数据;所述优化后的图学习模型的输出为第一特征向量和第二特征向量;
表征学习模块,用于将待表征学习图数据对应的第一扰动后的融合图数据和第二扰动后的融合图数据输入所述优化后的图学习模型中,得到待表征学习图数据对应的第一特征向量和第二特征向量。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明公开的基于跨粒度联合训练的图对比表征学习方法及系统,在图学习模型学习过程中进行了图级特征的训练,关键的图级信息得以保留,得到的特征向量的表达能力完整,不会造成得到的特征向量的表达能力损失,从而能够提取出更有效的图表征,即特征向量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于跨粒度联合训练的图对比表征学习方法实施例的流程图;
图2为本发明方法流程示意图;
图3为本发明方法中平均池化操作的流程示意图;
图4为本发明方法中特征融合操作的流程示意图
图5为本发明基于跨粒度联合训练的图对比表征学习系统实施例的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于跨粒度联合训练的图对比表征学习方法及系统,以提取出更有效的图表征。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明基于跨粒度联合训练的图对比表征学习方法实施例的流程图,图2为本发明方法流程示意图。参见图1和图2,该基于跨粒度联合训练的图对比表征学习方法包括:
步骤101:获取训练图数据;训练图数据包括训练图的特征矩阵和邻接矩阵。
该实施例中,用(X*,A*)表示图(图数据),其中,X*表示图的特征矩阵,A*代表图的邻接矩阵,V={v1,v2,···,vN}表示节点集,xi表示节点vi的特征向量。
如图2所示,本发明首先通过对输入图(X,A)进行平均池化得到包含有图级特征X'的新图(X',A),然后通过拼接两张图中对应节点的特征向量得到图(X",A),即融合图数据。接着,将(X",A)输入到两个数据增强方法组(边扰动+节点特征扰动),得到两个视图:第一扰动后的融合图数据(X1,A1)和第二扰动后的融合图数据(X2,A2),将这两个视图输入到具有共享参数的图神经网络编码器(第一图卷积神经网络和第二图卷积神经网络)提取特征(第一节点特征和第二节点特征),获得的特征(第一节点特征和第二节点特征)被输入到双层感知器(第一双层感知机和第二双层感知机)以获得最终的表征(第一特征向量和第二特征向量),最后,表征被输入到一个对比性损失(对比损失函数)来训练模型(图学习模型)。其中,两个数据增强方法组即第一扰动方案和第二扰动方案。
步骤102:根据训练图数据得到节点级特征和图级特征。
该步骤102具体包括:
根据训练图数据得到每个节点对应的节点级特征。
针对每一节点,将节点的邻接节点对应的节点级特征相加后求平均,得到节点对应的图级特征。
该步骤102为第一部分“多阶段增强策略”中的平均池化操作。如图2所示,本发明方法包含四个部分,即第一部分“多阶段增强策略”、第二部分“图神经网络编码器”、第三部分“投影头”和第四部分“对比损失函数”。
平均池化操作具体如下:
对于输入图(X,A)中的节点vi∈{v1,v2,···,vN},本发明将图中每个节点xi的邻接节点(邻居节点)的特征相加,然后用一个平均函数来获得新的特征,即图级特征xk
Figure BDA0003699188290000071
其中,adj(xi)表示节点vi的邻接节点的特征值,avg(·)是平均函数(如图2中(X,A)→(X',A)的步骤)。
平均池化操作的展示图如图3所示。xk是由以xi对应的节点为中心,在其邻居节点组成的子图中,进行池化操作计算而来的,因此xk是图级特征。虽然xi和xk有对应关系,但是,本发明称xk是图级特征,不称xk是xi的图级特征。
步骤103:根据节点级特征和图级特征得到融合特征。
该步骤103具体包括:
对节点级特征和图级特征进行拼接操作,得到融合特征。
该步骤103为第一部分“多阶段增强策略”中的特征融合操作(先平均池化,再特征融合)。
特征融合操作具体如下:
为了让跨粒度的图信息参与到模型训练过程中,本发明将节点级特征和图级特征拼接起来,即将输入图的原始特征xi和上一步平均池化得到的新特征xk进行拼接,形成融合特征xi'。
Figure BDA0003699188290000081
其中,||是节点特征向量的拼接操作,xkf表示第f个图级特征,xif表示第f个节点级特征。本发明使用xi'与原始输入图的边和节点来形成一个融合图(X”,A)。图=边+节点+特征,这里元素都包含,可以唯一确定一张图。
特征融合操作的展示图如图4所示。
步骤104:根据融合特征和邻接矩阵得到融合图数据;融合图数据包括融合特征和邻接矩阵。
该步骤104具体包括:
根据融合特征X”(融合特征xi')和邻接矩阵A得到融合图数据(X”,A),融合图数据(X”,A)包括融合特征X”和邻接矩阵A。
步骤105:分别采用第一扰动方案和第二扰动方案对融合图数据进行扰动,得到第一扰动后的融合图数据和第二扰动后的融合图数据;扰动方案包括边扰动和节点特征扰动;扰动后的融合图数据包括扰动后的融合特征和扰动后的邻接矩阵。
该步骤105中,边扰动具体包括:
获取随机采样矩阵;随机采样矩阵与邻接矩阵的行数和列数均相同;随机采样矩阵由0和1构成;随机采样矩阵中的每个元素均遵循伯努利分布。
利用Hadamard积,将邻接矩阵乘以随机采样矩阵,得到扰动后的邻接矩阵(计算邻接矩阵与随机采样矩阵的Hadamard积,得到扰动后的邻接矩阵)。
节点特征扰动具体包括:
获取随机采样向量;随机采样向量由0和1构成;随机采样向量的维度与融合特征的维度相同;随机采样向量的每个维度均是以设定概率从伯努利分布中抽取。
利用Hadamard积,将融合特征乘以随机采样向量,得到扰动后的融合特征(计算融合特征与随机采样向量的Hadamard积,得到扰动后的融合特征)。
该步骤105为第一部分“多阶段增强策略”中边扰动和节点特征扰动操作。
边扰动和节点特征扰动操作,即进行对融合图的扰动具体如下:
边扰动通过随机删除图中的边来修改图的拓扑信息。具体来说,本发明随机采样一个矩阵M∈{0,1}N*N,其中矩阵中的每个元素都遵循伯努利分布B(1-pe),然后利用该矩阵乘上述步骤得到的融合图的邻接矩阵A以达到边扰动的目的,得到的A'即为进行边扰动后的图邻接矩阵(扰动后的邻接矩阵)。
Figure BDA0003699188290000091
其中,{0,1}N*N为N行N列的矩阵。随机采样矩阵M是一个N行N列矩阵,由0和1构成,而0和1的分布是伯努利分布。B表示伯努利分布,pe表示伯努利分布的参数,pe是一个参数,并非p、e。
Figure BDA0003699188290000092
表示Hadamard积。原始图经过前面两个步骤,即平均池化和特征融合,得到融合图,而融合图的邻接矩阵A和原始图的邻接矩阵A相同,因为平均池化和特征融合并没有改变特征矩阵(邻接矩阵)A。Hadamard积的公式
Figure BDA0003699188290000093
即对融合图扰动,改变的是A。
节点特征扰动通过随机将节点特征向量中的元素置零来扰乱节点的特征信息。具体来说,本发明采样一个随机向量m'∈{0,1}F,该向量(随机采样向量)m'的每个维度都是以1-pf的概率从伯努利分布B(1-pf)中抽取,然后用它乘以节点xi'(融合特征xi'),得到的xi”是进行节点特征扰动后的特征向量(扰动后的融合特征)。其中,F表示向量维度。B表示伯努利分布,pf表示伯努利分布的参数,pf是一个参数,并非p、f。
Figure BDA0003699188290000094
(得到xi'进行对融合图的扰动)
在边扰动和特征扰动中,提到了两个不同参数的伯努利分布,而{pe_1,pf_1}和{pe_2,pf_2}即是这两个伯努利分布的参数。pe用来扰动边,即A,pf用来扰动特征,即x。
边扰动操作和节点特征扰动操作如图2中(X”,A)→(X1/2,A1/2)的步骤。
如图2所示,在本发明方法的实现中,本发明采用两个不同的扰动方案{pe_1,pf_1}和{pe_2,pf_2}对特征融合操作后得到的融合图(X”,A)进行扰动,以生成两个不同的视图(X1,A1)和(X2,A2),在对pe_1/2和pf_1/2的设定上,由于不同的图数据的特点不同,所以对于不同的数据,所选择的参数不同,在实际操作中,该实施例会将每个参数从0.1-0.9进行遍历测试模型,选择使模型效果最好的参数。最终将上述得到的两个视图输入到第二部分“图神经网络编码器”。
步骤106:利用第一扰动后的融合图数据和第二扰动后的融合图数据对图学习模型进行训练和优化,得到优化后的图学习模型;优化后的图学习模型的输入为第一扰动后的融合图数据和第二扰动后的融合图数据;优化后的图学习模型的输出为第一特征向量和第二特征向量。
该步骤106中,图学习模型具体包括第一图卷积神经网络、第二图卷积神经网络、第一双层感知机、第二双层感知机和对比损失函数。
第一双层感知机与第一图卷积神经网络连接;第二双层感知机与第二图卷积神经网络连接;对比损失函数与第一双层感知机和第二双层感知机均连接。
第一图卷积神经网络和第二图卷积神经网络共享参数;第一双层感知机和第二双层感知机共享参数。
该步骤106具体包括:
将第一扰动后的融合图数据输入第一图卷积神经网络中,得到第一节点特征,同时,将第二扰动后的融合图数据输入第二图卷积神经网络中,得到第二节点特征。
将第一节点特征输入第一双层感知机中,得到第一特征向量,同时,将第二节点特征输入第二双层感知机中,得到第二特征向量。
将第一特征向量和第二特征向量输入对比损失函数中,利用第一扰动后的融合图数据和第二扰动后的融合图数据对第一图卷积神经网络、第二图卷积神经网络、第一双层感知机和第二双层感知机进行训练,并利用第一特征向量、第二特征向量和对比损失函数对第一图卷积神经网络、第二图卷积神经网络、第一双层感知机和第二双层感知机进行参数优化,得到优化后的第一图卷积神经网络、第二图卷积神经网络、第一双层感知机和第二双层感知机。
该步骤106包含的第二部分“图神经网络编码器”、第三部分“投影头”和第四部分“对比损失函数”具体如下:
第二部分:图神经网络编码器(编码器的公式即下面的GCN公式)
本发明采用两层图卷积神经网络(第一图卷积神经网络和第二图卷积神经网络)作为图形编码器(双层图编码器,即图神经网络编码器)fθ,并向其输入图数据,即(X1,A1)和(X2,A2)中的X和A,以获得节点特征Hi(Hi用于第三部分“投影头”)。
Hi=fθ(Xi,Ai),i={1,2}
单层的图卷积神经网络传播规则函数(每一层图编码器的函数)如下:
Figure BDA0003699188290000111
GCN公式中,特征矩阵X和邻接矩阵A具有泛指的含义,与原始输入图(X,A)中的X和A不等同。
Figure BDA0003699188290000112
是每个节点都有自循环边的邻接矩阵,I表示矩阵中的单位矩阵,
Figure BDA0003699188290000113
是度矩阵,σ(·)是非线性激活函数,Wi是第i层的可训练权重参数矩阵。
第三部分:投影头
本发明将图编码器编码后的Hi输入到一个带有relu激活函数的双层感知器
Figure BDA0003699188290000114
中,以提高特征的质量。
Figure BDA0003699188290000115
其中,Zi为经过f函数
Figure BDA0003699188290000116
处理后的输出,为一个矩阵,可以称作经过f函数加强后的特征向量,得到的Zi用于下面的损失函数公式。R代表实数,右上标N×F'代表维度,N代表行,F'代表列。
第四部分:对比损失函数。
本发明采用一个判别器来区分数据正对和负对。由于(X1,A1)和(X2,A2)是在图(X",A)的基础上利用多阶段增强策略获得的两个视图,该策略不增加或删除节点,也就是说,(X1,A1)和(X2,A2)中的节点有一一对应的关系。因此,本发明将具有一一对应关系的两个节点标记为数据正对,否则是数据负对,数据负对有两种,第一种是同一视图中的不同节点,第二种是不同视图中的节点(如图2中标识)。
本发明中模型的训练目标是给数据正对分配较大的相似度分数,给数据负对分配较小的相似度分数(在训练过程模型会自动向这个方向收敛)。本发明利用余弦距离cos(v,u)来衡量节点v和u(v和u表示图数据中的两个节点)的相似度。相似度意义是:正对的相似度要尽量大,负对的相似度要尽量小,模型要朝这个方向训练。在后续的损失函数里直接用到了相似度。
Figure BDA0003699188290000121
最终模型的损失函数(对比损失函数)为:
Figure BDA0003699188290000122
公式的分子是数据正对的相似度,分母是数据负对的相似度。公式中,N为图中节点总数。i,j,k为Z的向量索引。cos为余弦相似度,loss代表损失函数。Z(1,i)代表Z1中第i个向量,Z(2,i)代表Z2中第i个向量,T表示转置,Z(2,j)代表Z2中第j个向量,Z(1,k)代表Z1中第k个向量,θ表示图神经网络编码器fθ的参数,
Figure BDA0003699188290000123
表示双层感知器
Figure BDA0003699188290000124
的参数。
损失函数的输入是Zi。Hi和Zi都是特征向量,只不过Hi是一个中间结果,最终想要得到是Zi,然后将Zi当做损失函数输入。
在模型的训练过程中,本发明采用随机梯度下降法传递损失函数梯度,并最小化该损失函数至模型收敛。
步骤107:将待表征学习图数据对应的第一扰动后的融合图数据和第二扰动后的融合图数据输入优化后的图学习模型中,得到待表征学习图数据对应的第一特征向量和第二特征向量。
该步骤107提取出的特征向量(图结构表征)用于后续下游任务(根据图结构表征,进行任意下游任务,如节点分类和链接预测等),将该图结构表征运用到下游任务中时,可以更加的准确和可靠。该步骤107提取出的特征向量使图结构表征的准确性高,使用模型进行下游任务时的准确性高,模型的性能好。
与现有技术相比,本发明的优点在于:
(1)本发明方法可在无需人工标注的数据集上采用自监督学习方式提取出比现有技术更有效的图表征(图结构表征),提高了图表征提取任务的准确度。
(2)本发明方法能适用于不同类型和规模的数据,具有比现有技术更良好的可迁移性。
图5为本发明基于跨粒度联合训练的图对比表征学习系统实施例的结构图。参见图5,该基于跨粒度联合训练的图对比表征学习系统包括:
训练图数据获取模块501,用于获取训练图数据;训练图数据包括训练图的特征矩阵和邻接矩阵。
图级特征得到模块502,用于根据训练图数据得到节点级特征和图级特征。
融合特征得到模块503,用于根据节点级特征和图级特征得到融合特征。
融合图数据得到模块504,用于根据融合特征和邻接矩阵得到融合图数据;融合图数据包括融合特征和邻接矩阵。
扰动模块505,用于分别采用第一扰动方案和第二扰动方案对融合图数据进行扰动,得到第一扰动后的融合图数据和第二扰动后的融合图数据;扰动方案包括边扰动和节点特征扰动;扰动后的融合图数据包括扰动后的融合特征和扰动后的邻接矩阵。
模型训练和优化模块506,用于利用第一扰动后的融合图数据和第二扰动后的融合图数据对图学习模型进行训练和优化,得到优化后的图学习模型;优化后的图学习模型的输入为第一扰动后的融合图数据和第二扰动后的融合图数据;优化后的图学习模型的输出为第一特征向量和第二特征向量。
表征学习模块507,用于将待表征学习图数据对应的第一扰动后的融合图数据和第二扰动后的融合图数据输入优化后的图学习模型中,得到待表征学习图数据对应的第一特征向量和第二特征向量。
本发明基于跨粒度联合训练的图对比表征学习系统(模型)包含四个部分:多阶段增强策略、图神经网络编码器、投影头和对比损失函数。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述方法包括:
获取训练图数据;所述训练图数据包括训练图的特征矩阵和邻接矩阵;
根据所述训练图数据得到节点级特征和图级特征;
根据所述节点级特征和所述图级特征得到融合特征;
根据所述融合特征和所述邻接矩阵得到融合图数据;所述融合图数据包括所述融合特征和所述邻接矩阵;
分别采用第一扰动方案和第二扰动方案对所述融合图数据进行扰动,得到第一扰动后的融合图数据和第二扰动后的融合图数据;所述扰动方案包括边扰动和节点特征扰动;所述扰动后的融合图数据包括扰动后的融合特征和扰动后的邻接矩阵;
利用所述第一扰动后的融合图数据和所述第二扰动后的融合图数据对图学习模型进行训练和优化,得到优化后的图学习模型;所述优化后的图学习模型的输入为第一扰动后的融合图数据和第二扰动后的融合图数据;所述优化后的图学习模型的输出为第一特征向量和第二特征向量;
将待表征学习图数据对应的第一扰动后的融合图数据和第二扰动后的融合图数据输入所述优化后的图学习模型中,得到待表征学习图数据对应的第一特征向量和第二特征向量。
2.根据权利要求1所述的基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述根据所述训练图数据得到节点级特征和图级特征,具体包括:
根据所述训练图数据得到每个节点对应的节点级特征;
针对每一节点,将所述节点的邻接节点对应的节点级特征相加后求平均,得到所述节点对应的图级特征。
3.根据权利要求1所述的基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述根据所述节点级特征和所述图级特征得到融合特征,具体包括:
对所述节点级特征和所述图级特征进行拼接操作,得到融合特征。
4.根据权利要求1所述的基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述边扰动具体包括:
获取随机采样矩阵;所述随机采样矩阵与所述邻接矩阵的行数和列数均相同;所述随机采样矩阵由0和1构成;所述随机采样矩阵中的每个元素均遵循伯努利分布;
利用Hadamard积,将所述邻接矩阵乘以所述随机采样矩阵,得到扰动后的邻接矩阵。
5.根据权利要求1所述的基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述节点特征扰动具体包括:
获取随机采样向量;所述随机采样向量由0和1构成;所述随机采样向量的维度与所述融合特征的维度相同;所述随机采样向量的每个维度均是以设定概率从伯努利分布中抽取;
利用Hadamard积,将所述融合特征乘以所述随机采样向量,得到扰动后的融合特征。
6.根据权利要求1所述的基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述图学习模型具体包括第一图卷积神经网络、第二图卷积神经网络、第一双层感知机、第二双层感知机和对比损失函数;
所述第一双层感知机与所述第一图卷积神经网络连接;所述第二双层感知机与所述第二图卷积神经网络连接;所述对比损失函数与所述第一双层感知机和所述第二双层感知机均连接;
所述第一图卷积神经网络和所述第二图卷积神经网络共享参数;所述第一双层感知机和所述第二双层感知机共享参数。
7.根据权利要求6所述的基于跨粒度联合训练的图对比表征学习方法,其特征在于,所述利用所述第一扰动后的融合图数据和所述第二扰动后的融合图数据对图学习模型进行训练和优化,得到优化后的图学习模型,具体包括:
将所述第一扰动后的融合图数据输入所述第一图卷积神经网络中,得到第一节点特征,同时,将所述第二扰动后的融合图数据输入第二图卷积神经网络中,得到第二节点特征;
将所述第一节点特征输入第一双层感知机中,得到第一特征向量,同时,将所述第二节点特征输入第二双层感知机中,得到第二特征向量;
将所述第一特征向量和所述第二特征向量输入对比损失函数中,利用所述第一扰动后的融合图数据和所述第二扰动后的融合图数据对所述第一图卷积神经网络、所述第二图卷积神经网络、所述第一双层感知机和所述第二双层感知机进行训练,并利用所述第一特征向量、所述第二特征向量和所述对比损失函数对所述第一图卷积神经网络、所述第二图卷积神经网络、所述第一双层感知机和所述第二双层感知机进行参数优化,得到优化后的第一图卷积神经网络、第二图卷积神经网络、第一双层感知机和第二双层感知机。
8.一种基于跨粒度联合训练的图对比表征学习系统,其特征在于,所述系统包括:
训练图数据获取模块,用于获取训练图数据;所述训练图数据包括训练图的特征矩阵和邻接矩阵;
图级特征得到模块,用于根据所述训练图数据得到节点级特征和图级特征;
融合特征得到模块,用于根据所述节点级特征和所述图级特征得到融合特征;
融合图数据得到模块,用于根据所述融合特征和所述邻接矩阵得到融合图数据;所述融合图数据包括所述融合特征和所述邻接矩阵;
扰动模块,用于分别采用第一扰动方案和第二扰动方案对所述融合图数据进行扰动,得到第一扰动后的融合图数据和第二扰动后的融合图数据;所述扰动方案包括边扰动和节点特征扰动;所述扰动后的融合图数据包括扰动后的融合特征和扰动后的邻接矩阵;
模型训练和优化模块,用于利用所述第一扰动后的融合图数据和所述第二扰动后的融合图数据对图学习模型进行训练和优化,得到优化后的图学习模型;所述优化后的图学习模型的输入为第一扰动后的融合图数据和第二扰动后的融合图数据;所述优化后的图学习模型的输出为第一特征向量和第二特征向量;
表征学习模块,用于将待表征学习图数据对应的第一扰动后的融合图数据和第二扰动后的融合图数据输入所述优化后的图学习模型中,得到待表征学习图数据对应的第一特征向量和第二特征向量。
CN202210690197.0A 2022-06-17 2022-06-17 一种基于跨粒度联合训练的图对比表征学习方法及系统 Pending CN114943016A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210690197.0A CN114943016A (zh) 2022-06-17 2022-06-17 一种基于跨粒度联合训练的图对比表征学习方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210690197.0A CN114943016A (zh) 2022-06-17 2022-06-17 一种基于跨粒度联合训练的图对比表征学习方法及系统

Publications (1)

Publication Number Publication Date
CN114943016A true CN114943016A (zh) 2022-08-26

Family

ID=82911057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210690197.0A Pending CN114943016A (zh) 2022-06-17 2022-06-17 一种基于跨粒度联合训练的图对比表征学习方法及系统

Country Status (1)

Country Link
CN (1) CN114943016A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117352189A (zh) * 2023-12-06 2024-01-05 中南大学 基于高阶拓扑结构的异常行为评估方法、系统及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117352189A (zh) * 2023-12-06 2024-01-05 中南大学 基于高阶拓扑结构的异常行为评估方法、系统及设备
CN117352189B (zh) * 2023-12-06 2024-03-15 中南大学 基于高阶拓扑结构的异常行为评估方法、系统及设备

Similar Documents

Publication Publication Date Title
CN111259142B (zh) 基于注意力编码和图卷积网络的特定目标情感分类方法
CN108763319B (zh) 融合用户行为和文本信息的社交机器人检测方法和系统
CN111488734A (zh) 基于全局交互和句法依赖的情感特征表示学习系统及方法
CN108090472B (zh) 基于多通道一致性特征的行人重识别方法及其系统
CN111950594A (zh) 基于子图采样的大规模属性图上的无监督图表示学习方法和装置
CN113469119B (zh) 基于视觉转换器和图卷积网络的宫颈细胞图像分类方法
Tscherepanow TopoART: A topology learning hierarchical ART network
CN113486578A (zh) 一种工业过程中设备剩余寿命的预测方法
CN111291556A (zh) 基于实体义项的字和词特征融合的中文实体关系抽取方法
CN112862015A (zh) 一种基于超图神经网络的论文分类方法及系统
CN112464004A (zh) 一种多视角深度生成图像聚类方法
CN110941734A (zh) 基于稀疏图结构的深度无监督图像检索方法
CN112529638B (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN116304367B (zh) 基于图自编码器自监督训练用于获得社区的算法及装置
CN112433028B (zh) 基于忆阻细胞神经网络的电子鼻气体分类方法
CN116416478B (zh) 一种基于图结构数据特征的生物信息学分类模型
CN115759461A (zh) 一种面向物联网的多元时间序列预测方法及系统
CN108537342A (zh) 一种基于邻居信息的网络表示学习方法及系统
CN113705715A (zh) 一种基于lstm和多尺度fcn的时间序列分类方法
Chen et al. Deep subspace image clustering network with self-expression and self-supervision
CN116206158A (zh) 基于双超图神经网络的场景图像分类方法及系统
CN114943016A (zh) 一种基于跨粒度联合训练的图对比表征学习方法及系统
CN114880538A (zh) 基于自监督的属性图社团检测方法
Kapla et al. Fusing sufficient dimension reduction with neural networks
CN112966735B (zh) 一种基于谱重建的监督多集相关特征融合方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination