CN116562337A - 一种基于多尺度一致性信息建模的网络对齐方法 - Google Patents

一种基于多尺度一致性信息建模的网络对齐方法 Download PDF

Info

Publication number
CN116562337A
CN116562337A CN202310511202.1A CN202310511202A CN116562337A CN 116562337 A CN116562337 A CN 116562337A CN 202310511202 A CN202310511202 A CN 202310511202A CN 116562337 A CN116562337 A CN 116562337A
Authority
CN
China
Prior art keywords
network
node
alignment
sub
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310511202.1A
Other languages
English (en)
Inventor
陈志豪
焦鹏飞
高梦州
王盈辉
张纪林
赵乃良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202310511202.1A priority Critical patent/CN116562337A/zh
Publication of CN116562337A publication Critical patent/CN116562337A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/094Adversarial learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多尺度一致性信息建模的网络对齐方法,包括如下步骤:S1、利用图神经网络分别对两个不同网络中的节点信息进行网络嵌入,从而得到能表达节点的网络嵌入;S2、利用已知锚节点信息,从节点级别和子图级别,分别结合对比学习对两个不同网络进行对齐;S3、将通过网络重构和跨网络对齐对网络对齐任务进行联合训练,最后得到两个网络的嵌入表示并利用其进行网络对齐。该方法利用多尺度一致性的原则去进行网络对齐任务,多尺度一致性指的是节点级别一致性和多阶级别一致性,利用节点级别一致性和多阶级别一致性去共同约束,从而学到源网络和目标网络的节点嵌入,提高网络对齐性能。

Description

一种基于多尺度一致性信息建模的网络对齐方法
技术领域
本发明涉及图神经网络技术领域,具体指一种基于多尺度一致性信息建模的网络对齐方法。
背景技术
在信息爆炸的时代,许多领域的信息都可以通过网络结构来表达,如不同在线平台的社交网络。一些节点同时存在于不同的网络中。一般将这些节点称为锚节点,寻找相应的锚节点关系的过程称为网络对齐,网络对齐任务在许多领域发挥着重要作用。
近年来,网络对齐有许多可供参考的解决方案。网络对齐方法主要分为基于结构化的方法和基于网络嵌入的方法。虽然这些方法已经取得了很好的效果,但它们仍然存在以下问题:
第一、已知锚节点的数量相对较少。利用已知的锚节点来学习映射函数密切取决于锚节点的质量和数量。
第二、目前的方法大多只考虑锚节点本身的信息,并通过增加锚节点的相似性来进行网络对齐,而忽略了来自其他尺度的信息。
第三、目前大多数基于嵌入的网络对齐方法都分为两个步骤:首先学习网络节点的嵌入,然后执行网络对齐任务。这可能会在网络对齐过程中破坏每个网络中的独特的信息。
发明内容
为了解决以上问题,本发明提出一种基于多尺度一致性信息建模的网络对齐方法,利用多尺度一致性的原则去进行网络对齐任务,多尺度一致性指的是节点级别一致性和多阶级别一致性,利用节点级别一致性和多阶级别一致性去共同约束,从而学到源网络和目标网络的节点嵌入,提高网络对齐性能。
为了解决上述技术问题,本发明的技术方案为:
一种基于多尺度一致性信息建模的网络对齐方法,包括如下步骤:
S1、利用图神经网络分别对两个不同网络中的节点信息进行网络嵌入,从而得到能表达节点的网络嵌入;
S2、利用已知锚节点信息,从节点级别和子图级别,分别结合对比学习对两个不同网络进行对齐;
S3、将通过网络重构和跨网络对齐对网络对齐任务进行联合训练,最后得到两个网络的嵌入表示并利用其进行网络对齐。
作为优选,所述步骤S1包括如下子步骤:
S1-1、定义一个源网络和目标网络/>其中/>和/>代表节点集合,As和At代表网络的邻接矩阵,Xs和Xt代表网络的特征矩阵;
S1-2、利用GNN encoder分别对源网络和目标网络进行网络嵌入,分别得到两个网络的节点嵌入Zs和Zt,其中的GNN encoder是利用2层GCN,网络嵌入过程如下:
其中,是对称标准化的邻接矩阵,σ(·)是非线性激活函数,W0和W1分别代表第一层和第二层可学习的训练参数。
作为优选,所述步骤S2中,利用已知锚节点信息,从节点级别结合对比学习进行网络对齐任务,即将两个锚节点的节点级别嵌入表示的相似度需要越大,损失函数如下所示:
其中,s代表源网络,t代表目标网络,代表源网络中的第i个节点,/>代表目标网络中的第j个节点,τ为温度系数权重超参数,b为锚节点对的负样本数,Pneg是负样本生成的概率分布,我们采用均匀分布,T代表转置操作,/>表示源网络和目标网络的已知锚节点对。
作为优选,所述步骤S2中,利用已知锚节点信息,从子图级别结合对比学习进行网络对齐任务:
首先,通过personalized PageRank算法去分别计算源网络和目标网络的重要分数矩阵Ms和Mt,计算公式如下所示:
M=α·(I-(1-α)·AD-1)
其中,I是单位矩阵,AD-1表示列标准化邻接矩阵,α是超参数,值位于0到1之间。
对于每个锚节点vi,选择x个与该锚节点最相关的一批周围节点去构成子图,每个以锚节点为中心所构成的子图的新邻接矩阵Ai和新表示矩阵Zi为:
Ai=Aindex,index
Zi=Zindex,:,
其中,i表示为源网络或目标网络中第i个节点序号(此节点为锚节点),由此,通过一个readout函数得到锚节点组成子图的子图级别表示si:
源网络和目标网络锚节点对子图采样的过程如上述所示,最终分别得到锚节点对相关的一系列子图,和/>
作为优选,所述步骤S3中,网络重构的损失函数为:
其中,n代表源网络的节点数量,m代表目标网络的节点数量,A代表邻接矩阵。
跨网络对齐损失函数为:
总的损失函数为:
其中,β、γ、λ和μ均为可调的超参数。
作为优选,所述步骤S3中,根据总的损失函数,在网络重构和跨网络对齐并行的同一个框架内进行统一的联合训练,源网络和目标网络通过训练总的损失函数获得最终的网络嵌入Zs和Zt,计算两个网络的相似度矩阵进行网络对齐任务。首先,我们利用曼哈顿距离公式来计算两个网络之间每个节点的相似性,之后得到两个网络的相似度矩阵,通过相似度矩阵得到源网络上每个节点的候选列表(目标网络中的节点)。如果在锚节点的测试集中有任何候选节点,则表示有两个节点对齐。
本发明具有以下的特点和有益效果:
1.与以往的方法不同,提出了多尺度一致性原则,不仅考虑了节点级别一致性,而且考虑了多阶级别一致性,这让不同网络中的同一实体学习到的节点嵌入更加相似,大大提升了网络对齐性能。
2.本发明的方法是通过一个联合的统一框架进行训练,通过图神经网络学到源网络和目标的节点嵌入,节点嵌入不仅保留了自身特殊的特征并且提升了网络对齐的性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中网络对齐方法的模型图。
图2为本发明中网络对齐方法的迭代算法过程。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
本发明提供了一种基于多尺度一致性信息建模的网络对齐方法,如图1设图2所示,首先利用图神经网络学到源网络和目标网络的节点嵌入和/>同时利用多尺度一致性原则(节点级别一致性和多阶级别一致性)使不同网络上代表同一实体的节点嵌入尽可能相似,其中,节点级别一致性通过两个节点嵌入相似度来刻画,多阶级别一致性是通过以锚节点为中心的子图级别的嵌入相似度来刻画,我们利用重要性采样方法(personalizedPageRank算法)去得到锚节点及其相关性高的周围节点所组成的一系列子图,最后通过一个联合的同一框架进行训练,得到最终的节点嵌入/>和/>计算两个网络的相似度矩阵进行网络对齐任务。
具体的,包括如下步骤:
S1、利用图神经网络分别对两个不同网络中的节点信息进行网络嵌入,从而得到能表达节点的网络嵌入。
本实施例中,步骤S1利用图神经网络学到源网络和目标网络的节点嵌入,将不同网络映射到同一个低维空间,便于找到不同网络中代表同一个实体。
S1-1、定义一个源网络和目标网络/>其中/>和/>代表节点集合,As和At代表网络的邻接矩阵,Xs和Xt代表网络的特征矩阵;
S1-2、利用GNN encoder分别对源网络和目标网络进行网络嵌入,分别得到两个网络的节点嵌入Zs和Zt,其中的GNN encoder是利用2层GCN,网络嵌入过程如下:
其中,是对称标准化的邻接矩阵,σ(·)是非线性激活函数,W0和W1分别代表第一层和第二层可学习的训练参数。
S2、利用已知锚节点信息,从节点级别和子图级别,分别结合对比学习对两个不同网络进行对齐。
本实施例中,步骤S2通过多尺度一致性的原则去进行网络对齐任务,即节点级别一致性和多阶级别一致性,这是为了让不同网络中代表同一实体学到的节点嵌入尽可能相似,提高网络对齐性能。
利用已知锚节点信息,从节点级别结合对比学习进行网络对齐任务,即将两个锚节点的节点级别嵌入表示的相似度需要越大,损失函数如下所示:
其中,s代表源网络,t代表目标网络,代表源网络中的第i个节点,/>代表目标网络中的第j个节点,τ为温度系数权重超参数,b为锚节点对的负样本数,Pneg是负样本生成的概率分布,我们采用均匀分布,T代表转置操作,/>表示源网络和目标网络的已知锚节点对。
其中,利用已知锚节点信息,从子图级别结合对比学习进行网络对齐任务:
首先,通过personalized PageRank算法去分别计算源网络和目标网络的重要分数矩阵Ms和Mt,计算公式如下所示:
M=α·(I-(1-α)·AD-1)
其中,I是单位矩阵,AD-1表示列标准化邻接矩阵,α是超参数,值位于0到1之间。
对于每个锚节点vi,选择x个与该锚节点最相关的一批周围节点去构成子图,每个以锚节点为中心所构成的子图的新邻接矩阵Ai和新表示矩阵Zi为:
Ai=Aindex,index
Zi=Zindex,:,
其中,i表示为源网络或目标网络中第i个节点序号(此节点为锚节点),由此,通过一个readout函数得到锚节点组成子图的子图级别表示si
源网络和目标网络锚节点对子图采样的过程如上述所示,最终分别得到锚节点对相关的一系列子图,和/>
S3、将通过网络重构和跨网络对齐对网络对齐任务进行联合训练,最后得到两个网络的嵌入表示并利用其进行网络对齐。
本实施例中,步骤S3将通过一个联合的统一框架进行训练,源网络和目标网络学到的节点嵌入不仅保留了自身特殊的特征并且提升了网络对齐的性能。
其中,网络重构的损失函数为:
其中,n代表源网络的节点数量,m代表目标网络的节点数量,A代表邻接矩阵。
跨网络对齐损失函数为:
总的损失函数为:
其中,β、γ、λ和μ均为可调的超参数。
根据总的损失函数,在网络重构和跨网络对齐并行的同一个框架内进行统一的联合训练,源网络和目标网络通过训练总的损失函数获得最终的网络嵌入Zs和Zt,计算两个网络的相似度矩阵进行网络对齐任务。首先,我们利用曼哈顿距离公式来计算两个网络之间每个节点的相似性,之后得到两个网络的相似度矩阵,通过相似度矩阵得到源网络上每个节点的候选列表(目标网络中的节点)。如果在锚节点的测试集中有任何候选节点,则表示有两个节点对齐。
本发明实施在三个不同的真实数据集上,数据集介绍如下所示。
本方法与六个当前先进的网络对齐方法进行了实验比较,这六个方法分别是IONE、ABNE、CrossMNA、NetTrans、NeXtAlign和DANA。
IONE将网络中的边公式化为follower-ship和followee-ship,在统一的框架中结合了二阶接近度保持嵌入和网络对齐的学习。
ABNE是一种基于注意力的网络嵌入模型。该模型包括掩蔽图关注机制和结构保持嵌入算法。通过对锚节点对的监督,注意力机制用于学习用户之间的权重。在学习权重的基础上,该算法明确地建立了followers和followed之间的贡献概率模型。
CrossMNA通过最小化不同网络的图重建损失之和来进行嵌入,并使用跨网络节点之间的线性转换来执行对齐。
NetTrans是一种基于GCN的嵌入方法,它从网络转换的角度解决了属性网络对齐任务。
NeXtAlign包含对齐一致性和对齐差异,并解决了负采样分布的不同设计甚至竞争设计的问题。
DANA将域分类的对抗性学习纳入到对齐框架内的网络嵌入过程中,以抑制域特征的生成,从而提高对齐性能。
本实施例(MSC)在三个不同数据集上网络对齐性能如下:
从实验结果可以发现,本发明提出的基于多尺度一致性信息建模的网络对齐方法,网络对齐性能高于所有比较的网络对齐方法。
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式包括部件进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。

Claims (6)

1.一种基于多尺度一致性信息建模的网络对齐方法,其特征在于,包括如下步骤:
S1、利用图神经网络分别对两个不同网络中的节点信息进行网络嵌入,从而得到能表达节点的网络嵌入;
S2、利用已知锚节点信息,从节点级别和子图级别,分别结合对比学习对两个不同网络进行对齐;
S3、将通过网络重构和跨网络对齐对网络对齐任务进行联合训练,最后得到两个网络的嵌入表示并利用其进行网络对齐。
2.根据权利要求1所述的一种基于多尺度一致性信息建模的网络对齐方法,其特征在于,所述步骤S1包括如下子步骤:
S1-1、定义一个源网络和目标网络/>其中和/>代表节点集合,As和At代表网络的邻接矩阵,Xs和Xt代表网络的特征矩阵;
S1-2、利用GNNencoder分别对源网络和目标网络进行网络嵌入,分别得到两个网络的节点嵌入Zs和Zt,其中的GNNencoder是利用2层GCN,网络嵌入过程如下:
其中,是对称标准化的邻接矩阵,σ(·)是非线性激活函数,W0和W1分别代表第一层和第二层可学习的训练参数。
3.根据权利要求2所述的一种基于多尺度一致性信息建模的网络对齐方法,其特征在于,所述步骤S2中,利用已知锚节点信息,从节点级别结合对比学习进行网络对齐任务,即将两个锚节点的节点级别嵌入表示的相似度需要越大,损失函数如下所示:
其中,s代表源网络,t代表目标网络,代表源网络中的第i个节点/>代表目标网络中的第j个节点,τ为温度系数权重超参数,b为锚节点对的负样本数,Pneg是负样本生成的概率分布,我们采用均匀分布,T代表转置操作,/>表示源网络和目标网络的已知锚节点对。
4.根据权利要求3所述的一种基于多尺度一致性信息建模的网络对齐方法,其特征在于,所述步骤S2中,利用已知锚节点信息,从子图级别结合对比学习进行网络对齐任务:
首先,通过personalized PageRank算法去分别计算源网络和目标网络的重要分数矩阵Ms和Ms,计算公式如下所示:
M=α·(I-(1-α)·AD-1)
其中,I是单位矩阵,AD-1表示列标准化邻接矩阵,α是超参数,值位于0到1之间,
对于每个锚节点vi,选择x个与该锚节点最相关的一批周围节点去构成子图,每个以锚节点为中心所构成的子图的新邻接矩阵Ai和新表示矩阵Zi为:
Ai=Aindex,index
Zi=Zindex,:
其中,i表示为源网络或目标网络中第i个节点序号(此节点为锚节点),由此,通过一个readout函数得到锚节点组成子图的子图级别表示si
源网络和目标网络锚节点对子图采样的过程如上述所示,最终分别得到锚节点对相关的一系列子图,和/>
5.根据权利要求3所述的一种基于多尺度一致性信息建模的网络对齐方法,其特征在于,所述步骤S3中,网络重构的损失函数为:
其中,n代表源网络的节点数量,m代表目标网络的节点数量,A代表邻接矩阵,
跨网络对齐损失函数为:
总的损失函数为:
其中,β、γ、λ和μ均为可调的超参数。
6.根据权利要求5所述的一种基于多尺度一致性信息建模的网络对齐方法,其特征在于,所述步骤S3中,根据总的损失函数,在网络重构和跨网络对齐并行的同一个框架内进行统一的联合训练,源网络和目标网络通过训练总的损失函数获得最终的网络嵌入Zs和Zt,计算两个网络的相似度矩阵进行网络对齐任务。
CN202310511202.1A 2023-05-06 2023-05-06 一种基于多尺度一致性信息建模的网络对齐方法 Pending CN116562337A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310511202.1A CN116562337A (zh) 2023-05-06 2023-05-06 一种基于多尺度一致性信息建模的网络对齐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310511202.1A CN116562337A (zh) 2023-05-06 2023-05-06 一种基于多尺度一致性信息建模的网络对齐方法

Publications (1)

Publication Number Publication Date
CN116562337A true CN116562337A (zh) 2023-08-08

Family

ID=87491008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310511202.1A Pending CN116562337A (zh) 2023-05-06 2023-05-06 一种基于多尺度一致性信息建模的网络对齐方法

Country Status (1)

Country Link
CN (1) CN116562337A (zh)

Similar Documents

Publication Publication Date Title
CN110379506B (zh) 针对心电图数据使用二值化神经网络的心律不齐检测方法
CN107273490B (zh) 一种基于知识图谱的组合错题推荐方法
CN110147450A (zh) 一种知识图谱的知识补全方法及装置
CN111753101A (zh) 一种融合实体描述及类型的知识图谱表示学习方法
CN112949740B (zh) 一种基于多级度量的小样本图像分类方法
CN112015868A (zh) 基于知识图谱补全的问答方法
CN109446414A (zh) 一种基于神经网络分类的软件信息站点快速标签推荐方法
CN110689523A (zh) 基于元学习个性化图像信息评价方法、信息数据处理终端
CN113190688A (zh) 基于逻辑推理和图卷积的复杂网络链接预测方法及系统
CN112308115A (zh) 一种多标签图像深度学习分类方法及设备
CN112131403B (zh) 一种动态环境下的知识图谱表示学习方法
CN110598022A (zh) 一种基于鲁棒深度哈希网络的图像检索系统与方法
CN109960732A (zh) 一种基于鲁棒监督的深度离散哈希跨模态检索方法及系统
CN116363423A (zh) 面向小样本学习的知识蒸馏方法、装置及存储介质
CN117036760A (zh) 一种基于图对比学习的多视图聚类模型实现方法
CN114818271A (zh) 一种基于三维设计的输变电工程评价系统及方法
CN113254609B (zh) 一种基于负样本多样性的问答模型集成方法
CN117078312B (zh) 一种基于人工智能的广告投放管理方法及系统
CN116562337A (zh) 一种基于多尺度一致性信息建模的网络对齐方法
CN111353525A (zh) 一种不均衡不完整数据集的建模及缺失值填补方法
CN116523877A (zh) 一种基于卷积神经网络的脑mri图像肿瘤块分割方法
CN115601745A (zh) 一种面向应用端的多视图三维物体识别方法
CN115438871A (zh) 一种融合偏好消除流行度偏差的冰雪景点推荐方法及系统
CN114020931A (zh) 知识图谱问答问句实体链接方法及装置
CN114240539A (zh) 一种基于Tucker分解和知识图谱的商品推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination