CN113590912A - 融合节点相对位置和绝对度分布的跨社交网络对齐方法 - Google Patents

融合节点相对位置和绝对度分布的跨社交网络对齐方法 Download PDF

Info

Publication number
CN113590912A
CN113590912A CN202110660466.4A CN202110660466A CN113590912A CN 113590912 A CN113590912 A CN 113590912A CN 202110660466 A CN202110660466 A CN 202110660466A CN 113590912 A CN113590912 A CN 113590912A
Authority
CN
China
Prior art keywords
node
nodes
network
vector
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110660466.4A
Other languages
English (en)
Other versions
CN113590912B (zh
Inventor
陈乃月
李海龙
张振江
张致远
张阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN202110660466.4A priority Critical patent/CN113590912B/zh
Publication of CN113590912A publication Critical patent/CN113590912A/zh
Application granted granted Critical
Publication of CN113590912B publication Critical patent/CN113590912B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种融合节点相对位置和绝对度分布的跨社交网络对齐方法。该方法包括:迭代删除源网络和目标网络中的最小度节点,迭代结束,计算出节点的重要度,根据节点的重要度对齐源网络和目标网络中的锚节点;在源网络和目标网络中,计算出节点与每个锚节点之间的位置相似度,得到节点的综合位置相似度向量;采用扩散法计算出节点的邻居度分布度向量;融合节点的综合位置相似度向量和邻居度分布度向量,利用融合后的向量计算跨网络的节点对,得到源网络和目标网络的对齐结果。本发明通过整合节点的综合位置相似度向量和邻居度分布度向量来提高网络对齐的精度,有效避免了由于网络规模过大而导致的度分布雷同的问题和对齐效果对噪声的敏感问题。

Description

融合节点相对位置和绝对度分布的跨社交网络对齐方法
技术领域
本发明涉及复杂网络分析技术领域,尤其涉及一种融合节点相对位置和绝对度分布的跨社交网络对齐方法。
背景技术
网络是一种高效的数据结构,在这个相互联系的世界里,它可以表达丰富的关系,比如共同创作、电子邮件交流和社交关系。因此,数据挖掘社区为单个网络上的众多任务提出了各种方法,如异常检测、链接预测和用户建模。然而,许多图挖掘任务涉及跨多个网络的节点联合分析。如网络对齐和图相似性的一些问题本质上是根据多个图定义的。
研究网络对齐或网络匹配问题为在不同的网络中寻找相应的节点。网络对齐对于在不同的社交网络中识别相似的用户、分析化合物、研究蛋白质之间的相互作用以及各种计算机视觉任务都至关重要。
目前,现有技术中一种使用图嵌入方式进行网络对齐的方法包括:
1.对源网络和目标网络分别提取每个节点的特征,为了保留节点在图中的结构信息,该方案采用迭代扩散的方式提取N阶邻居的信息进行合并处理。
2.基于步骤1提取的特征计算所有节点的相似度矩阵,并对其做矩阵分解以得到节点的嵌入表示。考虑到大型矩阵的构建、分解耗时问题,该方案利用低秩矩阵近似目标矩阵以缩短构建大型矩阵的耗时,用奇异值分解来快速得到节点嵌入表示。
3.通过比较源网络中节点嵌入与目标网络中节点嵌入之间的欧式距离即可得到跨网络对应关系,该方案通过构建KD树的方式加快了对距离的计算效率。在三个真实数据集上的实验结果表明,该算法的准确率、抗干扰性优于多数经典方法。
上述现有技术中的使用图嵌入方式进行网络对齐的方法存在如下缺点:
1.大型网络中的节点结构易出现雷同现象,这种现象会对计算节点嵌入产生干扰,因此该方法在大型数据集环境下的准确率不高。
2.该方法缺乏对网络整体的结构信息的考虑,因此对节点的局部噪声比较敏感。
发明内容
本发明的实施例提供了一种融合节点相对位置和绝对度分布的跨社交网络对齐方法,以实现有效地进行网络对齐。
为了实现上述目的,本发明采取了如下技术方案。
一种融合节点相对位置和绝对度分布的跨社交网络对齐方法,包括:
采用启发式算法迭代删除源网络和目标网络中的最小度节点,迭代结束后,根据节点的自身和连接边的权重计算出节点的重要度,根据节点的重要度对齐源网络和目标网络中的锚节点;
在源网络和目标网络中,计算出节点与每个锚节点之间的位置相似度,得到节点的综合位置相似度向量;
在源网络和目标网络中,采用扩散法计算出节点的邻居度分布度向量;
融合节点的综合位置相似度向量和邻居度分布度向量,利用融合后的向量计算跨网络的节点对,得到源网络和目标网络的对齐结果。
优选地,所述的采用启发式算法迭代删除源网络和目标网络中的最小度节点,包括:
在源网络和目标网络中,使用最小度启发式算法来计算每个节点和节点的邻接边的拓扑重要度,为节点和节点的邻接边分配初始权值,选取拓扑重要度在1-10范围内的节点,在每一次迭代中,删除一个具有最小拓扑重要度的节点,当一个节点被删除时,它的邻接边也被删除,将被删除的节点和节点的邻接边的权值分配给它们的邻近节点和边;
经过多次迭代,依次删除拓扑重要度在1-10范围内的所有节点,并且将被删除的节点和节点的邻接边的权值分配给它们的邻近节点和边,直到迭代结束。
优选地,所述的迭代结束后,根据节点的自身和连接边的权重计算出节点的重要度,根据节点的重要度对齐源网络和目标网络中的锚节点,包括:
在源网络和目标网络中,为节点和节点的邻接边分配的初始权值如下:
Figure BDA0003115010150000031
其中E,V分别为图的边集和节点集,w(e)为边的初始权值,w(u)为节点的初始权值;
在删除节点u时,将节点u和节点u的邻接边的权值分配给它们的邻近节点和边,更新如下的权值。
如果deg(u)=1,对于任意v∈N(u),更新w(v)=w(v)+w(u)+w(u,v).
如果deg(u)>1,对于任意的v1,v2∈N(u),更新
Figure BDA0003115010150000032
其中N(u)为节点u的邻居集合,w(u,v)表示节点u和v之间邻接边的权重;
迭代结束后,根据节点v的权重和节点v的邻接边的权重来计算节点v的重要度S(v):
Figure BDA0003115010150000033
其中λ控制边相较于节点对S(v)的贡献程度,将S(v)进行归一化处理:
S(v)=S(v)/maxv∈V{S(u)}
在源网络和目标网络中,选取S(v)值前5%的节点作为关键节点,将源网络和目标网络中的关键节点作为候选节点,按照S(v)的接近程度一一匹配,将匹配成功的节点从候选节点集合移除,迭代进行匹配和移除,直到源网络和目标网络中任意一方的候选节点数量为零。
优选地,所述的在源网络和目标网络中,计算出节点与每个锚节点之间的位置相似度,得到节点的综合位置相似度向量,包括:
在源网络和目标网络中,对于节点u∈V,统计节点u的多阶邻居集合N(u),所述多阶邻居集合N(u)中的邻居数量小于设定的数量阈值t,在节点的邻居中,阶数低的邻居优先统计,在阶数相同的邻居中,拓扑重要度数较大的邻居优先统计;
统计多阶邻居集合N(u)与锚节点的邻居集合N(v)的交集数量|N(u)∩N(v)|,将交集数量|N(u)∩N(v)|作为节点与锚节点的邻居集合相似度向量;基于节点与锚节点的邻居集合相似度向量通过迪杰斯特拉算法计算出节点与锚节点的最短路径距离,将该最短路径距离作为节点与锚节点之间的位置相似度;
重复执行上述处理过程,依次计算出节点与每个锚节点之间的位置相似度,将节点与所有锚节点之间的位置相似度进行综合,得到节点的综合位置相似度向量。
优选地,所述的在源网络和目标网络中,采用扩散法计算出节点的邻居度分布度向量,包括:
对于节点u∈V,用向量
Figure BDA0003115010150000041
表示节点u的k阶的邻居度向量,k为正整数,k的最小取值为1,
Figure BDA0003115010150000042
的第i个元素表示为
Figure BDA0003115010150000043
代表度为i的k阶邻居的数量,聚合节点u的从第1阶到第k阶的邻居度向量得到节点的邻居分布度向量du,du的计算方式如下:
Figure BDA0003115010150000051
其中δ表示对于距离的衰减系数。
优选地,所述将节点的综合位置相似度向量和邻居度分布度向量进行综合,得到节点的向量表示的维度,构建节点的kd树,利用kd树计算跨网络节点距离,得到源网络和目标网络的对齐结果,包括:
在源网络中,将节点的综合位置相似度向量和邻居度分布度向量乘以各自的权重进行融合,得到新向量,该新向量的长度d为综合位置相似度向量和邻居度分布度向量的长度的和,表示节点的维度;
利用源网络中所有节点的d维向量表示构建kd树,对于目标网络中任意节点ut的向量表示d(ut),查询d(ut)在kd树中距离最短的节点d(us),则us和ut即为跨网络节点对。
依次类推,重新执行上述查询过程,依次找出与源网络中的各个节点对齐的目标网络中的节点,得到源网络和目标网络之间的跨网络的节点对,即得到源网络和目标网络的对齐结果。
由上述本发明的实施例提供的技术方案可以看出,本发明的方案通过整合节点的邻居度分布信息和节点与锚节点的相对位置关系来提高网络对齐的精度,有效避免了由于网络规模过大而导致的度分布雷同的问题和对齐效果对噪声的敏感问题。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种融合节点相对位置和绝对度分布的跨社交网络对齐方法的实现原理图;
图2为本发明实施例提供的一种融合节点相对位置和绝对度分布的跨社交网络对齐方法的处理流程图。
图3为本发明实施例提供的一种当度较小的节点被移除时,它的权重被转移到其邻居节点和边上的过程示意图。
图4为本发明实施例提供的一种提供计算节点邻居度分布方法示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
本发明提出了一种解决网络对齐或匹配问题的融合节点相对位置和绝对度分布的跨社交网络对齐方法,即在不同的网络中找到客观对应的节点。本发明方法的处理过程包括:基于网络拓扑信息获得关键锚节点,统计所有节点的多阶邻居集合,计算所有节点和锚节点的邻居交集数量,将上述交集数量作为一个新的节点低维向量表示,以保留节点在图中的相对位置信息。基于节点及邻居的度分布计算每个节点的低维向量表示,保留节点的绝对度信息。拼接节点的两种向量表示,比较源图和目标图中每个节点的向量表示欧式距离以得到对齐结果。
本发明实施例提供的一种融合节点相对位置和绝对度分布的跨社交网络对齐方法的实现原理图如图1所示,具体处理流程如图2所示,包括以下处理步骤:
步骤S10、采用启发式算法计算节点的度,寻找并删除最小度节点,从源网络和目标网络中最大的S(v)值开始,一一跨网络对齐关键节点,将对齐的关键节点作为锚节点。
本步骤的目的是先对齐源网络和目标网络中起重要作用、易分辨的关键节点,将它们作为锚节点以供后续的对齐工作参考。
在一个实施例中,在源网络和目标网络中,使用最小度启发式算法来计算节点和边的拓扑重要度,从拓扑重要为1的节点开始,到拓扑重要为d的节点停止。d的值不能很大,因为删除度很高的节点(如枢纽)可能会在功能上或结构上破坏整个网络,而随机删除一部分外围节点只会对网络造成较小的破坏。根据实验的经验,d=10是一个兼顾收益与损失的选择。为了计算节点的相对重要度,为节点和节点的连接边分配初始权值w如下:
Figure BDA0003115010150000081
其中E,V分别为图的边集和节点集,w(e)为边的初始权值,w(u)为节点的初始权值。
在每一次迭代中,删除一个具有最小拓扑重要度的节点来更新权值。当一个节点被删除时,它的邻接边也被删除,并且被删除的节点和节点的连接边的权值被分配给它们的邻近节点和边。通过这种方式,拓扑信息从一个节点传播到它的邻居。具体来说,在删除节点u时,更新如下的权值。
(1)如果deg(u)=1,对于任意v∈N(u),更新w(v)=w(v)+w(u)+w(u,v).
(2)如果deg(u)>1,对于任意的v1,v2∈N(u),更新
Figure BDA0003115010150000082
其中N(u)为节点u的邻居集合,w(u,v)表示节点u和v之间邻接边的权重。
图3展示了当度较小的节点被移除时,它的权重被转移到其邻居节点和边上的过程,表明这些边对于维系网络的连接性变得更加重要。迭代结束后,节点v结合自身和节点的连接边的权重来计算其重要度S(v):
Figure BDA0003115010150000091
其中λ控制边相较于节点对S(v)的贡献程度,大量实验表明λ=0.2的情形时效果较好。最后,将S(v)归一化以减小网络规模对模型造成的影响。
S(v)=S(v)/maxv∈V{S(v)}
归一化后的S反映了节点在整个网络中的相对重要度。两个节点具有相似的S值代表它们在各自的网络中有着相似的重要程度,因此更可能被对齐。
在源网络和目标网络中,选取S(v)值前5%的节点作为关键节点,将源网络和目标网络中的关键节点作为候选节点,按照S(v)的接近程度一一匹配,将匹配成功的节点从候选节点集合移除,迭代进行匹配和移除,直到源网络和目标网络中任意一方的候选节点数量为零。
基于以上推断,可以从源网络和目标网络中S(v)值前5%的最接近节点对开始,一一对齐跨网络关键节点。被对齐的各个关键节点即为后续工作需要的锚节点集合。
步骤S20、在源网络和目标网络中,计算出节点与每个锚节点之间的位置相似度,得到节点的综合位置相似度向量。
在源网络和目标网络中,节点的相对位置可以定位节点在网络中粗略的位置,避免两个不同节点因为局部拓扑结构相似而被认为成同一个节点。
在源网络和目标网络中,对于节点u∈V,统计节点u的多阶邻居集合N(u)。在节点的邻居中,阶数低的邻居优先统计,在阶数相同的邻居中,拓扑重要度数较大的邻居优先统计,为了控制邻居集合规模,需要设置邻居集合数量阈值t。大量实验表明t=log|V|*100时的效果较好,其中|V|为网络中节点的数量。
在得到节点u的多阶邻居集合N(u)后,统计多阶邻居集合N(u)与锚节点的邻居集合N(v)的交集数量|N(u)∩N(v)|,将交集数量|N(u)∩N(v)|作为节点与锚节点的邻居集合相似度向量。
基于节点与锚节点的邻居集合相似度向量通过迪杰斯特拉算法计算节点与锚节点的最短路径距离,将该最短路径距离作为节点与锚节点之间的位置相似度。
重复执行上述处理过程,依次计算出节点与每个锚节点之间的位置相似度,将节点与所有锚节点之间的位置相似度进行综合,得到节点的综合位置相似度向量。
步骤S30、在源网络和目标网络中,采用扩散法计算出节点的邻居度分布度向量。
节点的邻居度分布信息可以高效地保留节点的局部结构特征,在步骤S20的粗略位置确定的前提下,利用节点的邻居度分布信息可以细粒度地区分节点。
为了保留节点的高阶信息,本步骤需要收集节点的k阶邻居信息。
图4为本发明实施例提供的一种计算节点的邻居度分布方法示意图,如图4所示,对于节点u∈V,用向量
Figure BDA0003115010150000101
表示节点u的k阶的邻居度向量,k为正整数,k的最小取值为1,
Figure BDA0003115010150000102
的第i个元素表示为
Figure BDA0003115010150000103
代表度为i的k阶邻居的数量,聚合节点u的从第1阶到第k阶的邻居度向量得到节点的邻居分布度向量du,du的计算方式如下:
Figure BDA0003115010150000104
其中δ表示对于距离的衰减系数,图3所示为δ=0.5时的例子。
步骤S40、将节点的综合位置相似度向量和邻居度分布度向量进行综合,得到节点的向量表示的维度,构建节点的kd树,利用kd树计算跨网络节点距离,得到源网络和目标网络的对齐结果。
在源网络中,将步骤S20得到的综合位置相似度向量和步骤S30得到的节点的邻居度分布度向量du乘以各自的权重W进行融合,得到新向量,该新向量的长度d为综合位置相似度向量和邻居度分布度向量的长度的和,表示节点的维度。
利用源网络中所有节点的d维向量表示构建kd(k-dimensional,k-维度)树。对于目标网络中任意节点ut的向量表示d(ut),查询d(ut)在kd树中距离最短的节点d(us),则us和ut即为跨网络节点对。
依次类推,重新执行上述查询过程,依次找出与源网络中的各个节点对齐的目标网络中的节点,得到源网络和目标网络之间的跨网络的节点对,即得到源网络和目标网络的对齐结果。
在实际应用中,也可以利用目标网络中的节点来构建kd树,将源网络中的各个节点输入到kd树,进行网络对齐操作。
综上所述,本发明的方案通过整合节点的邻居度分布信息和节点与锚节点的相对位置关系来提高网络对齐的精度,有效避免了由于图规模过大而导致的度分布雷同的问题和对齐效果对噪声的敏感问题。
本发明实施例的方法相比于现有技术方案有着较高的网络对齐的准确率和较高的抗干扰性,同时缩短了网络对齐的时间。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (6)

1.一种融合节点相对位置和绝对度分布的跨社交网络对齐方法,其特征在于,包括:
采用启发式算法迭代删除源网络和目标网络中的最小度节点,迭代结束后,根据节点的自身和连接边的权重计算出节点的重要度,根据节点的重要度对齐源网络和目标网络中的锚节点;
在源网络和目标网络中,计算出节点与每个锚节点之间的位置相似度,得到节点的综合位置相似度向量;
在源网络和目标网络中,采用扩散法计算出节点的邻居度分布度向量;
融合节点的综合位置相似度向量和邻居度分布度向量,利用融合后的向量计算跨网络的节点对,得到源网络和目标网络的对齐结果。
2.根据权利要求1所述的方法,其特征在于,所述的采用启发式算法迭代删除源网络和目标网络中的最小度节点,包括:
在源网络和目标网络中,使用最小度启发式算法来计算每个节点和节点的邻接边的拓扑重要度,为节点和节点的邻接边分配初始权值,选取拓扑重要度在1-10范围内的节点,在每一次迭代中,删除一个具有最小拓扑重要度的节点,当一个节点被删除时,它的邻接边也被删除,将被删除的节点和节点的邻接边的权值分配给它们的邻近节点和边;
经过多次迭代,依次删除拓扑重要度在1-10范围内的所有节点,并且将被删除的节点和节点的邻接边的权值分配给它们的邻近节点和边,直到迭代结束。
3.根据权利要求2所述的方法,其特征在于,所述的迭代结束后,根据节点的自身和连接边的权重计算出节点的重要度,根据节点的重要度对齐源网络和目标网络中的锚节点,包括:
在源网络和目标网络中,为节点和节点的邻接边分配的初始权值如下:
Figure FDA0003115010140000023
其中E,V分别为图的边集和节点集,w(e)为边的初始权值,w(u)为节点的初始权值;
在删除节点u时,将节点u和节点u的邻接边的权值分配给它们的邻近节点和边,更新如下的权值;
如果deg(u)=1,对于任意v∈N(u),更新w(v)=w(v)+w(u)+w(u,v).
如果deg(u)>1,对于任意的v1,v2∈N(u),更新
Figure FDA0003115010140000021
其中N(u)为节点u的邻居集合,w(u,v)表示节点u和v之间邻接边的权重;
迭代结束后,根据节点v的权重和节点v的邻接边的权重来计算节点v的重要度S(v):
Figure FDA0003115010140000022
其中λ控制边相较于节点对S(v)的贡献程度,将S(v)进行归一化处理:
S(v)=S(v)/maxv∈V{S(v)}
在源网络和目标网络中,选取S(v)值前5%的节点作为关键节点,将源网络和目标网络中的关键节点作为候选节点,按照S(v)的接近程度一一匹配,将匹配成功的节点从候选节点集合移除,迭代进行匹配和移除,直到源网络和目标网络中任意一方的候选节点数量为零。
4.根据权利要求3所述的方法,其特征在于,所述的在源网络和目标网络中,计算出节点与每个锚节点之间的位置相似度,得到节点的综合位置相似度向量,包括:
在源网络和目标网络中,对于节点u∈V,统计节点u的多阶邻居集合N(u),所述多阶邻居集合N(u)中的邻居数量小于设定的数量阈值t,在节点的邻居中,阶数低的邻居优先统计,在阶数相同的邻居中,拓扑重要度数较大的邻居优先统计;
统计多阶邻居集合N(u)与锚节点的邻居集合N(v)的交集数量|N(u)∩N(v)|,将交集数量|N(u)∩N(v)|作为节点与锚节点的邻居集合相似度向量;基于节点与锚节点的邻居集合相似度向量通过迪杰斯特拉算法计算出节点与锚节点的最短路径距离,将该最短路径距离作为节点与锚节点之间的位置相似度;
重复执行上述处理过程,依次计算出节点与每个锚节点之间的位置相似度,将节点与所有锚节点之间的位置相似度进行综合,得到节点的综合位置相似度向量。
5.根据权利要求3所述的方法,其特征在于,所述的在源网络和目标网络中,采用扩散法计算出节点的邻居度分布度向量,包括:
对于节点u∈V,用向量
Figure FDA0003115010140000031
表示节点u的k阶的邻居度向量,k为正整数,k的最小取值为1,
Figure FDA0003115010140000032
的第i个元素表示为
Figure FDA0003115010140000033
代表度为i的k阶邻居的数量,聚合节点u的从第1阶到第k阶的邻居度向量得到节点的邻居分布度向量du,du的计算方式如下:
Figure FDA0003115010140000034
其中δ表示对于距离的衰减系数。
6.根据权利要求5所述的方法,其特征在于,所述将节点的综合位置相似度向量和邻居度分布度向量进行综合,得到节点的向量表示的维度,构建节点的kd树,利用kd树计算跨网络节点距离,得到源网络和目标网络的对齐结果,包括:
在源网络中,将节点的综合位置相似度向量和邻居度分布度向量乘以各自的权重进行融合,得到新向量,该新向量的长度d为综合位置相似度向量和邻居度分布度向量的长度的和,表示节点的维度;
利用源网络中所有节点的d维向量表示构建kd树,对于目标网络中任意节点ut的向量表示d(ut),查询d(ut)在kd树中距离最短的节点d(us),则us和ut即为跨网络节点对;
依次类推,重新执行上述查询过程,依次找出与源网络中的各个节点对齐的目标网络中的节点,得到源网络和目标网络之间的跨网络的节点对,即得到源网络和目标网络的对齐结果。
CN202110660466.4A 2021-06-15 2021-06-15 融合节点相对位置和绝对度分布的跨社交网络对齐方法 Active CN113590912B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110660466.4A CN113590912B (zh) 2021-06-15 2021-06-15 融合节点相对位置和绝对度分布的跨社交网络对齐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110660466.4A CN113590912B (zh) 2021-06-15 2021-06-15 融合节点相对位置和绝对度分布的跨社交网络对齐方法

Publications (2)

Publication Number Publication Date
CN113590912A true CN113590912A (zh) 2021-11-02
CN113590912B CN113590912B (zh) 2023-11-14

Family

ID=78243807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110660466.4A Active CN113590912B (zh) 2021-06-15 2021-06-15 融合节点相对位置和绝对度分布的跨社交网络对齐方法

Country Status (1)

Country Link
CN (1) CN113590912B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114529588A (zh) * 2022-04-24 2022-05-24 中国电子科技集团公司第二十八研究所 一种基于相对位置的动目标聚合方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090262664A1 (en) * 2008-04-18 2009-10-22 Bonnie Berger Leighton Method for identifying network similarity by matching neighborhood topology
US20130272309A1 (en) * 2010-12-09 2013-10-17 Lantiq Deutschland Gmbh Mac cycle alignment method for neighboring network coordination
CN107145527A (zh) * 2017-04-14 2017-09-08 东南大学 对齐异构社交网络中基于元路径的链路预测方法
CN111814066A (zh) * 2020-07-01 2020-10-23 重庆邮电大学 基于启发式算法的动态社交用户对齐方法及系统
CN112085614A (zh) * 2020-08-05 2020-12-15 国家计算机网络与信息安全管理中心 一种基于时空行为数据的跨社交网络虚拟用户身份对齐方法
CN112507247A (zh) * 2020-12-15 2021-03-16 重庆邮电大学 一种融合用户状态信息的跨社交网络用户对齐方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090262664A1 (en) * 2008-04-18 2009-10-22 Bonnie Berger Leighton Method for identifying network similarity by matching neighborhood topology
US20130272309A1 (en) * 2010-12-09 2013-10-17 Lantiq Deutschland Gmbh Mac cycle alignment method for neighboring network coordination
CN107145527A (zh) * 2017-04-14 2017-09-08 东南大学 对齐异构社交网络中基于元路径的链路预测方法
CN111814066A (zh) * 2020-07-01 2020-10-23 重庆邮电大学 基于启发式算法的动态社交用户对齐方法及系统
CN112085614A (zh) * 2020-08-05 2020-12-15 国家计算机网络与信息安全管理中心 一种基于时空行为数据的跨社交网络虚拟用户身份对齐方法
CN112507247A (zh) * 2020-12-15 2021-03-16 重庆邮电大学 一种融合用户状态信息的跨社交网络用户对齐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
NAIYUE CHEN 等: "Community Detection with Indirect Neighbors based on Granular Computing in Social Networks", 《2019 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN)》 *
XINLAN WANG 等: "Identity alignment algorithm across social networks based on attention mechanism", 《2021 IEEE INTERNATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE AND INDUSTRIAL DESIGN (AIID)》 *
滕磊 等: "基于知识图嵌入的跨社交网络用户对齐算法", 《计算机应用》, vol. 39, no. 11 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114529588A (zh) * 2022-04-24 2022-05-24 中国电子科技集团公司第二十八研究所 一种基于相对位置的动目标聚合方法
CN114529588B (zh) * 2022-04-24 2022-07-26 中国电子科技集团公司第二十八研究所 一种基于相对位置的动目标聚合方法

Also Published As

Publication number Publication date
CN113590912B (zh) 2023-11-14

Similar Documents

Publication Publication Date Title
CN107391542B (zh) 一种基于文件知识图谱的开源软件社区专家推荐方法
Cuevas et al. A cuckoo search algorithm for multimodal optimization
WO2022116689A1 (zh) 图数据处理方法、装置、计算机设备和存储介质
CN111275172A (zh) 一种基于搜索空间优化的前馈神经网络结构搜索方法
Björnberg et al. Recurrence of bipartite planar maps
CN113761221B (zh) 基于图神经网络的知识图谱实体对齐方法
CN113191486B (zh) 基于参数服务器架构的图数据与参数数据的混合划分方法
CN116151384B (zh) 量子电路处理方法、装置及电子设备
CN109120431B (zh) 复杂网络中传播源选择的方法、装置及终端设备
CN105205052A (zh) 一种数据挖掘方法及装置
Al Abd Alazeez et al. EDDS: An enhanced density-based method for clustering data streams
CN107169594B (zh) 一种车辆路径问题的优化方法及装置
CN113590912B (zh) 融合节点相对位置和绝对度分布的跨社交网络对齐方法
CN116611527B (zh) 量子电路处理方法、装置及电子设备
Priya et al. Community Detection in Networks: A Comparative study
CN111736774A (zh) 冗余数据的处理方法、装置、服务器及存储介质
Guo et al. K-loop free assignment in conference review systems
CN112906824B (zh) 车辆聚类方法、系统、设备及存储介质
CN111177190A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN115242659A (zh) 一种基于高阶集体影响力的超网络节点分析方法
Thakare et al. Skiplpa: An efficient label propagation algorithm for community detection in sparse network
CN114429404A (zh) 一种多模异质社交网络社区发现方法
García-Pérez et al. Predictability of missing links in complex networks
CN117155786B (zh) 一种筛选鲁棒影响力节点的有向网络优化方法及系统
CN115118650B (zh) 基于信息传播概率的复杂网络关键节点识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant