CN103207884A - 一种加权网络间的权重迭代节点匹配方法 - Google Patents

一种加权网络间的权重迭代节点匹配方法 Download PDF

Info

Publication number
CN103207884A
CN103207884A CN2012104831931A CN201210483193A CN103207884A CN 103207884 A CN103207884 A CN 103207884A CN 2012104831931 A CN2012104831931 A CN 2012104831931A CN 201210483193 A CN201210483193 A CN 201210483193A CN 103207884 A CN103207884 A CN 103207884A
Authority
CN
China
Prior art keywords
node
network
matched
similarity
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012104831931A
Other languages
English (en)
Other versions
CN103207884B (zh
Inventor
宣琦
张哲�
马晓迪
董辉
俞立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201210483193.1A priority Critical patent/CN103207884B/zh
Publication of CN103207884A publication Critical patent/CN103207884A/zh
Application granted granted Critical
Publication of CN103207884B publication Critical patent/CN103207884B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种加权网络间的权重迭代节点匹配方法,包括以下步骤:步骤1:已匹配节点对的选择;步骤2:相似度计算:来自不同网络的两个未匹配节点
Figure DDA00002454472900012
与k对已匹配节点对
Figure DDA00002454472900013
l=1,2,…,k分别连接,记
Figure DDA00002454472900014
之间连边的权重为
Figure DDA00002454472900016
之间连边的权重为则权重网络间节点相似度定义为(4);步骤3:节点匹配:每一轮迭代选定属于不同网络的一对相似度最高的未匹配节点为当前的匹配节点对,之后将其认为是一对新揭示的已匹配节点对并转到步骤2,根据公式(4)重新计算相似度;步骤4:终止条件:直到一个目标网络中的所有节点被匹配完,结束。本发明提升匹配效果、提高匹配精度。

Description

一种加权网络间的权重迭代节点匹配方法
技术领域
本发明涉及数据挖掘和复杂网络分析技术,尤其是一种节点匹配方法。 
背景技术
随着计算机科学的发展,人们越来越习惯用网络来刻画这个世界,比如生物体内的蛋白质网络(见文献[1]E.Ravasz,A.L.Somera,D.A.Mongru,Z.N.Oltvai,and A.L.Barabási,Hierarchical Organization of Modularity in Metabolic Networks,Science,297(5586):1551-1555,2002.即劳沃斯,索摩尔,蒙格鲁,欧尔特沃伊,巴拉巴西,代谢网络中分层的模块化组织,《科学》,297(5586):1551-1555,2002.文献[2]A.L.Barabási and Z.N.Oltvai,Network Biology:Understanding the Cell'sFunctional Organization,Nature Reviews Genetics,5(2):101-113,2004.即巴拉巴西,欧尔特沃伊,网络生物学:了解细胞的功能组织,《自然遗传学评论》,5(2):101-113,2004.文献[3]C.Stark,B.J.Breitkreutz,T.Reguly,L. Boucher,A.Breitkreutz,andM.Tyers,Biogrid:A General Repository for Interaction Datasets.Nucleic AcidsResearch,34(suppl 1):D535-D539,2006.即斯塔克,布赖特克罗伊兹,赖古伊,鲍彻,泰尔斯,生物网:相互作用数据库的通用存储,《核酸研究》,34:D535-D539,2006.),日常语言网络(见文献[4]R.F.i Cancho,R.V.Solé,et al.The Small World ofHuman Language,Proceedings of the Royal Society of London.Series B:BiologicalSciences,268(1482):2261-2265,2001.即坎乔,舍勒,等.人类语言的小世界,《伦敦英国皇家学会论文集.B辑:生物科学》,268(1482):2261-2265,2001.文献[5]R.F.i Cancho,R.V.Solé,andR.
Figure BDA00002454472700011
Patterns in Syntactic Dependency Networks.Physical ReviewE,69(5):051915,2004.即坎乔,舍勒,寇勒.依存句法网络的模式.《物理评论E》,69(5):051915,2004.文献[6]D.R.Amancio,L. Antiqueira,T.A.S.Pardo,L.F.Costa,O.N.Oliveira,and M.G.V.Nunes.Complex Networks Analysis ofManual and Machine Translations.International Journal of Modern Physics C, 19(4):583-598,2008.即阿曼希奥,安提括拉,帕尔多,考斯塔,奥利韦拉,努内斯.人工与机器翻译的复杂网络分析.《现代国际物理期刊C》,19(4):583-598,2008.),描述人际关系的社交网络(见文献[7]C.M.Lakon,S.T.Ennett,and E.C.Norton.Mechanisms through Which Drug,Sex Partner,and Friendship NetworkCharacteristics Relate to Risky Needle Use among High Risk Youth and Young Adults.Social Science & Medicine,63(9):2489-2499,2006.即拉肯,恩耐特,诺顿.危险针头在高危青少年中的使用机制与毒品,性伴侣和友情网络的相关特性.《社会科学与医学》,63(9):2489-2499,2006.),等等。由于世间万物的多维度属性,使得我们可以从不同的角度看待同一个体,故可以认为多数网络不是单独存在的,即很多同类网络具有一定的相关性,而这种相关性很大程度上体现在相同个体在不同网络中存在的不同身份(见文献[8]M.Kurant and P.Thiran.Layered ComplexNetworks.Physical Review Letters,96(13):138701,2006.即库阮特,色万.分层复杂网络.《物理评论快报》,96(13):138701,2006.文献[9]S.V.Buldyrev,R.Parshani,G.Paul,H.E.Stanley,and S.Havlin.Catastrophic Cascade of Failures inInterdependent Networks.Nature,464(7291):1025-1028,2010.即布尔德列夫,普沙尼,保罗,斯坦利,豪夫林.相互连接的网络中故障的灾难性串联.《自然》,464(7291):1025-1028,2010.文献[10]Q.Xuan,F.Du,and T.J.Wu.EmpiricalAnalysis of Internet Telephone Network:From User Id to Phone.Chaos:AnInterdisciplinary Journal of Nonlinear Science,19(2):023101-023101,2009.即宣琦,杜方,吴铁军.互联网电话网络的实证分析:从用户ID到电话.《混沌:非线性科学的多学科期刊》,19(2):023101-023101,2009.文献[11]Q.Xuan and T.J.Wu.Node Matching Between Complex Networks.Physical ReviewE,80(2):026103,2009.即宣琦,吴铁军.复杂网络上的节点匹配.《物理评论E》,80(2):026103,2009.)。例如,不同蛋白质网络中的同源蛋白质通常由一个共同的原始蛋白质在不同的生物体中逐渐演化而形成。虽然这些属于不同生物体的同源蛋白质可能拥有不同的 形态,但在调节生物体时可能发挥相似的作用。因此,当把同源蛋白质视为同一蛋白质的不同形态时,可以认为不同的蛋白质网络是彼此相关的。此外,同一个语义在不同的语种中也拥有不同的词汇表述,甚至对于同一语种,因为历史的演化也会产生这种语义表述差异,如一脉相承的中国商代甲骨文、周朝青铜器铭文、秦朝篆书、汉朝隶书以及魏晋楷书等。而由于国际文化的交流融合以及历史传承,这些不同朝代不同国家的不同语言网络可能存在结构上的相似性,因此,当把某些不同的文字视为同一语义的不同形态时,可以认为不同的语言网络同样具有相关性。再者,在现代社会,人们可以使用各种方式与其他人交流,比如电话(见文献[12]J.P.Onnela,J.
Figure BDA00002454472700031
J.
Figure BDA00002454472700032
G.Szabó,D.Lazer,K.Kaski,J.Kertész,and A.L.Barabási.Structure and Tie Strengths in Mobile CommunicationNetworks.Proceedings of the National Academy of Sciences,104(18):7332,2007.即翁内拉,萨拉玛奇,豪翁恩,萨博,拉泽,卡斯基,凯尔泰斯,巴拉巴西.移动通信网络中的结构与约束力.《美国国家科学院会议论文集》,104(18):7332,2007.文献[13]A.E.Motter,T.Nishikawa,and Y.C.Lai.Large-scale Structural Organizationof Social Networks.Arxiv Preprint Ccond-mat/0303571,2003.即莫特,尼施卡瓦.社交网络的大型组织结构.《Arxiv非正式版本》/0303571,2003.)、电子邮件(见文献[14]M.E.J.Newman,S.Forrest,and J.Balthrop.Email Networks and the Spreadof Computer Viruses.Physical ReviewE,66(3):035101,2002.即纽曼,弗利斯特,巴斯欧.电子邮件网络与计算机病毒传播.《物理评论E》,66(3):035101,2002.)、MSN(见文献[15]T.Mah,H.Hoek,and Y.Li.Funnel Report Mining for the MsnNetwork.InProceedings of the Seventh ACM SIGKDD International Conference onKnowledge Discovery and Data Mining,pages 450-455.ACM,2001.即马斯,胡克,李.MSN网络的汇总报告挖掘.《第七届ACM知识发现与数据挖掘国际会议论文集》,450-455.ACM,2001.)等等。如果两个人使用其中某种方式相互沟通,那他们可能因为某些原因,如友情发展等,在另一时间使用其他方式进行联系,由此 可见,现代通讯网络之间也存在相关性。此类例子举不胜举。 
因此,当将不同种类的复杂系统描述成复杂网络时,诸如同源蛋白质发现,古词翻译,互联网跨网犯罪跟踪等不同领域的现实问题均可转换为网络间的节点匹配问题,从而纳入统一的理论框架进行求解。假设不同的目标网络存在结构相关性,该问题可以利用小部分已匹配节点对提供的信息,通过设计节点匹配算法得到一定程度上的解决。特别是我们近期提出的一种有效的迭代节点匹配算法(见文献[16]Q.Xuan,F.Du,and T.J.Wu.Iterative Node Matching between ComplexNetworks.Journal of PhysicsA: Mathematical and Theoretical,43:395002,2010.即宣琦,杜方,吴铁军.复杂网络的迭代节点匹配.《物理A期刊:数学与理论》,43:395002,2010.),在揭示两个相关的人工无标度网络间(见文献[17]A.L.Barabásiand R. Albert. Emergence of Scaling in Random Networks. Science,286(5439):509-512,1999.即巴拉巴西,阿尔伯特.随机网络中标度的出现.《科学》,286(5439):509-512,1999.)对应节点时有着非常好的效果。事实上,我们只利用少于2%的已匹配节点对就正确匹配了超过90%的剩余节点。然而,进一步的实验表明,当目标网络中大量节点具有较高对称性(见文献[18]Y. Xiao,M.Xiong,W. Wang,and H.Wang.Emergence of Symmetry in Complex Networks.PhysicalReviewE,77(6):066108,2008.即肖华,熊明,王威,黄骅.复杂网络中对称性的出现.《物理评论E》,77(6):066108,2008.)时,即这些节点具有很多相同邻居,纯粹基于拓扑的节点匹配算法通常会失效。这一结果毫不意外,因为在同一网络中都很难区分这些对称节点,更不用说仅通过其局部拓扑结构利用一对一匹配算法对它们进行精准匹配。而由于研究发现实际网络通常具有较高的对称性拓扑结构,因此现有的一对一节点匹配算法需要进一步改进以满足现实需求。 
弥补一对一迭代节点匹配算法的这一缺陷可以从两方面下手。一方面是提出一对多(见文献[19]F.Du,Q.Xuan,and T.WU.One-to-many Node Matchingbetween Complex Networks.Advances in Complex Systems,13(6):725,2010.即杜 方,宣琦,吴铁军.复杂网络上的一对多节点匹配.《复杂系统进展》,13(6):725,2010.)甚至多对多节点匹配算法。当目标只是设定为迅速缩小搜索范围时,该方法不失为一个好的选择,然而,在大多数情况下,该方法只能认为是一种折衷而非真正意义上的改进方案。另一方面是推广节点间相似度定义使之包含更多信息以便差异化拓扑结构上的对称节点。考虑到大多数真实世界网络为加权网络,足以提供此类额外信息,因此本发明将首次沿着这一方向把链接权重考虑进相似度计算,进而改进原有的节点匹配算法。事实上,现实网络节点间的权重有可能是正相关的,比如由于某些正面的激励,如果某个个体在某个网络花费了更多的时间与其某些邻居互动,则该个体在另一个网络中可能也会花费较多的时间与对应的邻居互动;也有可能是负相关的,如果网络中某个个体与其邻居互动的时间比较均等,而对不同的邻居采用的互动方式具有较大差异,此时可以认为当该个体在某个网络中花费更多时间与某些邻居互动,则该个体在另一个网络中只能花费更少的时间与对应的邻居互动。 
发明内容
为了克服已有迭代节点匹配方法的匹配效果较差、精度较低的不足,本发明提供一种提升匹配效果、提高匹配精度的加权网络间的权重迭代节点匹配方法。 
本发明解决其技术问题所采用的技术方案是: 
一种加权网络间的权重迭代节点匹配方法,所述匹配方法包括以下步骤: 
步骤1:已匹配节点对的选择,具体过程如下: 
网络G1中的节点集R1依据节点度值通过以下步骤选取:G1中度值最大的节点首先被选定为R1的唯一元素,用
Figure BDA00002454472700051
表示R1的邻居集,即满足U1中的每个节点至少被R1中的一个节点连接,而集合V1\(U1∪R1)中的任一节点与R1中的任一节点均没有连接;将集合V1\R1中的节点根据它们属于U1的邻居数按降序排列,选择排序第一的节点,将其添加到R1中;更新R1和U1并重复以上选择过程 直到R1集总共包含Pr个节点;之后G1中隶属于R1集合的节点以及它们在G2中的匹配节点被选定为已匹配节点对; 
步骤2:相似度计算:
来自不同网络的两个未匹配节点
Figure BDA00002454472700061
Figure BDA00002454472700062
与k对已匹配节点对 
Figure BDA00002454472700063
l=1,2,…,k分别连接,记
Figure BDA00002454472700064
Figure BDA00002454472700065
之间连边的权重为
Figure BDA00002454472700066
Figure BDA00002454472700067
Figure BDA00002454472700068
之间连边的权重为
Figure BDA00002454472700069
则权重网络间节点相似度定义为: 
S w ( v i 1 , v j 2 ) = Σ l = 1 k | ( w l 1 - w 1 ‾ ) ( w l 2 - w 2 ‾ ) | | | w 1 - w 1 ‾ | | · | | w 2 - w 2 ‾ | | S ( v i 1 , v j 2 ) - - - ( 4 )
其中
Figure BDA000024544727000611
Figure BDA000024544727000612
是向量中元素的均值,即i=1,2,,为当k=0或者向量w1或w2中所有元素相等时,认为
Figure BDA000024544727000614
步骤3:节点匹配: 
每一轮迭代选定属于不同网络的一对相似度最高的未匹配节点为当前的匹配节点对,之后将其认为是一对新揭示的已匹配节点对并转到步骤2,根据公式(4)重新计算相似度。 
步骤4:终止条件:直到一个目标网络中的所有节点被匹配完,结束。 
本发明的技术构思为:本发明提出了一个用于生成正相关和负相关网络的模型。同时,本发明也给出了一种综合考虑节点局部拓扑信息以及链接权重信息的不同网络间节点相似度定义,在此基础上设计了一种加权迭代节点匹配算法。数值模拟表明无论目标网络的权重是正相关或者负相关,本算法效果均可优于已有的单纯基于拓扑信息的一对一迭代节点匹配算法。 
本发明的有益效果主要表现在:提升匹配效果、提高匹配精度。 
附图说明
图1为本发明中旨在说明节点对称性的示意图; 
图2为本发明中网络间节点相似度计算示意图; 
图3为本发明中所扩展的DMS网络演化示意图; 
图4为本发明中参数设为m=2和m=3以及T=18和T=17的DMS网络; 
图5为本发明中构造一对正相关权重网络的示意图; 
图6为本发明中在不同关联度的正相关加权网络上实施两种迭代节点匹配算 
法后,匹配精度φ关于已匹配节点对数Pr的函数图; 
具体实施方式
下面结合附图对本发明作进一步描述。 
参照图1~图6,一种加权网络间的权重迭代节点匹配方法,利用若干已匹配节点对提供的局部拓扑信息以及链接权重信息计算未匹配节点对之间的相似度,同时考虑网络间链接权重正负相关性对相似度的影响。基于其迭代本质,每次只有一对相似度最大的未匹配节点被选择为匹配节点对,它将被进一步认为是一对新揭示的已匹配节点对,以重新计算剩下的未匹配节点对之间的相似度,直到一些终止条件被满足。 
加权网络间的权重迭代节点匹配算法步骤如下: 
步骤1:已匹配节点对的选择 
为实现网络间节点匹配,通常需要若干已匹配节点对,并以它们提供的局部拓扑信息以及链接权重信息作为算法的先验知识。如何选择适当的已匹配节点对来提高匹配精度一直是网络间节点匹配算法的一个重要组成部分。一方面,根据信息论,由于大度值节点能提供更多的局部拓扑和权重信息,理应被优先选为已匹配节点对。另一方面,由于是迭代算法,已匹配节点对最好能聚集在网络的一 个局部区域内以便提高第一轮的匹配精度,进而提高第二轮的匹配精度,以此类推。基于这些事实,考虑到两个网络之间的差异,我们为网络间迭代节点匹配算法提出如下两种已匹配节点对选择策略。第一种是网络G1中的集中大度值优先策略(Centralized Large Degree Priority)(CLDP1),根据该策略,网络G1中的节点集R1依据节点度值通过以下步骤选取:G1中度值最大的节点首先被选定为R1的唯一元素。用
Figure BDA00002454472700081
表示R1的邻居集,即满足U1中的每个节点至少被R1中的一个节点连接,而集合V1\(U1∪R1)中的任一节点与R1中的任一节点均没有连接。将集合V1\R1中的节点根据它们属于U1的邻居数按降序排列,选择排序第一的节点,将其添加到R1中。更新R1和U1并重复以上选择过程直到R1集总共包含Pr个节点。之后G1中隶属于R1集合的节点以及它们在G2中的匹配节点被选定为已匹配节点对。第二种是G2中的集中大度值优先(GLDP2),其具体步骤同第一种类似,在此不再赘述。 
步骤2:相似度计算 
通常,无权网络间节点相似度能够通过围绕它们的已匹配节点对的数量来衡量。在纯粹基于拓扑信息的节点匹配算法(见文献[11]Q.Xuan and T.J.Wu.NodeMatching Between Complex Networks.Physical ReviewE,80(2):026103,2009.即宣琦,吴铁军.复杂网络上的节点匹配.《物理评论E》,80(2):026103,2009.文献[16]Q.Xuan,F.Du,and T.J.Wu.Iterative Node Matching between ComplexNetworks.Journal of PhysicsA:Mathematical and Theoretical,43:395002,2010.即宣琦,杜方,吴铁军.复杂网络的迭代节点匹配.《物理A期刊:数学与理论》,43:395002,2010.文献[19]F.Du,Q.Xuan,and T.WU.One-to-many Node Matchingbetween Complex Networks.Advances in Complex Systems,13(6):725,2010.即杜方,宣琦,吴铁军.复杂网络上的一对多节点匹配.《复杂系统进展》,13(6):725,2010.)中,网络G1中的节点
Figure BDA00002454472700082
和网络G2中的节点
Figure BDA00002454472700083
的相似度可以通过下式计算 
S ( v i 1 , v j 2 ) = n M ( v i 1 , v j 2 ) n L ( v i 1 ) + n L ( v j 2 ) - n M ( v i 1 , v j 2 ) - - - ( 1 )
此处,
Figure BDA00002454472700092
定义为与节点
Figure BDA00002454472700093
Figure BDA00002454472700094
同时相连的已匹配节点对
Figure BDA00002454472700095
的数量,即
Figure BDA00002454472700097
在G1中相连而
Figure BDA00002454472700098
在G2中相连,而
Figure BDA000024544727000910
(或
Figure BDA000024544727000911
)表示在网络G1(或G2)中节点(或
Figure BDA000024544727000913
)的总邻居数。公式(1)保证了网络间节点相似度归一化为区间[0,1]中的某个值。 
然而,如上所述,根据(1)式定义的相似度将无法区分某个网络中的两个对称节点,从而可能会降低整个网络的匹配精度。例如,假设网络G1具有如图1所示的结构,因为分别拥有共同邻居
Figure BDA000024544727000914
Figure BDA000024544727000915
节点
Figure BDA000024544727000916
Figure BDA000024544727000917
以及节点
Figure BDA000024544727000918
Figure BDA000024544727000919
为对称节点(其中,
Figure BDA000024544727000920
之间的连边可忽略)。根据公式(1),如果只有
Figure BDA000024544727000922
Figure BDA000024544727000923
以及它们在网络G2中的对应节点已匹配,那么其它节点与网络G2中的任一节点
Figure BDA000024544727000924
一定满足 
S ( v 1 1 , v i 2 ) = S ( v 2 1 , v i 2 ) = S ( v 3 1 , v i 2 ) - - - ( 2 )
S ( v 6 1 , v i 2 ) = S ( v 7 1 , v i 2 ) - - - ( 3 )
于是可以推测正确匹配节点
Figure BDA000024544727000927
或者
Figure BDA000024544727000928
的概率将不会超过1/3而正确匹配节点 
Figure BDA000024544727000929
Figure BDA000024544727000930
的概率则不会超过1/2。如果目标网络中有更多的对称节点,匹配结果可能会更差。 
为克服此类不足,我们将在公式(1)的基础上同时考虑网络中链接的权重信息,以此推广相似度的定义。事实上,同一个体在不同网络中的链接权重可能是正相关的也可能是负相关的。为了处理这两种不同的情况,本发明同时考虑两种目标节点间链接权重的相关性,将公式(1)定义的相似度进行了推广。假设来自不同网络的两个未匹配节点
Figure BDA000024544727000931
Figure BDA000024544727000932
与k对已匹配节点对
Figure BDA000024544727000933
l=1,2,…,k分别连接,记之间连边的权重为
Figure BDA000024544727000936
Figure BDA000024544727000938
之间连边的权重为
Figure BDA000024544727000939
则权重网络间节点相似度定义为 
S w ( v i 1 , v j 2 ) = Σ l = 1 k | ( w l 1 - w 1 ‾ ) ( w l 2 - w 2 ‾ ) | | | w 1 - w 1 ‾ | | · | | w 2 - w 2 ‾ | | S ( v i 1 , v j 2 ) - - - ( 4 )
其中
Figure BDA00002454472700102
Figure BDA00002454472700103
是向量中元素的均值,即
Figure BDA00002454472700104
i=1,2。值得注意的是,为避免公式(4)无意义,当k=0或者向量w1或w2中所有元素相等时,认为不难证明公式(4)定义的相似度依旧是归一化的,而且当网络中所有链接权重均相等时,公式(4)将退化为公式(1)。 
公式(4)定义的相似度计算说明如图2所示,其中图2(a)和2(b)分别为两个正相关和负相关网络的局部结构。首先,对于任何一对网络,如果图中有三对已匹配节点
Figure BDA00002454472700106
Figure BDA00002454472700107
以及
Figure BDA00002454472700108
通过公式(1)计算的节点
Figure BDA00002454472700109
Figure BDA000024544727001010
之间的拓扑相似度均为 S ( v 2 1 , v 2 2 ) = S ( v 2 1 , v 3 2 ) = S ( v 3 1 , v 2 2 ) = S ( v 3 1 , v 3 2 ) = 1 . 因此通过公式(1)可能无法正确匹配节点
Figure BDA000024544727001012
而如果考虑权重信息,在图2(a)所示的正相关情况下通过公式(4)计算所得的广义相似度分别为
Figure BDA000024544727001013
S w ( v 2 1 , v 3 2 ) = 0.682 , S w ( v 3 1 , v 2 2 ) = 0.654 , S w ( v 3 1 , v 3 2 ) = 0.999 , 而在图2(b)所示负相关情况下的广义相似度则为 S w ( v 2 1 , v 2 2 ) = 0.999 , S w ( v 2 1 , v 3 2 ) = 0.895 , S w ( v 3 1 , v 2 2 ) = 0.895 ,
Figure BDA000024544727001020
可以发现,在两种情况下最高相似度的匹配均是和 
Figure BDA000024544727001022
为正确的匹配结果。 
步骤3:节点匹配 
每一轮迭代选定属于不同网络的一对相似度最高的未匹配节点为当前的匹配节点对。之后将其认为是一对新揭示的已匹配节点对并转到步骤2根据公式(4)重新计算相似度。 
步骤4:终止条件 
为了便于比较,在本发明中,直到一个目标网络中的所有节点被匹配完,算法终止。 
测试集构建:首先通过某种规则创建两个独立网络,之后以此建立一对相关 加权网络。为了重现真实网络的高对称性,我们采用Dorogovtsev,Mendes和Samukhin(DMS)所提出的模型来建立独立网络(见文献[20]S.N.Dorogovtsev,J.F.F.Mendes,and A.N.Samukhin.Size-dependent Degree Distribution of a ScalefreeGrowing Network.PhysicalReviewE,63(6):062101,2001.即德格斯铁夫,门德斯,萨缪汀.无标度成长网络依赖尺度的度分布.《物理评论E》,63(6):062101,2001.)。通过DMS模型建立的网络同时具有其它一些众所周知的拓扑性质,如小世界(见文献[21]D.J.Watts and S.H.Strogatz.Collective Dynamics of Small-world Networks.Nature,393(6684):440-442,1998.即瓦特,斯通盖茨.小世界网络的通用动力学.《自然》,393(6684):440-442,1998.),无标度(见文献[17]A.L.Barabási and R.Albert.Emergence of Scaling in Random Networks.Science,286(5439):509-512,1999.即巴拉巴西,阿尔伯特.随机网络中标度的出现.《科学》,286(5439):509-512,1999.),高聚类(见文献[22]E.Ravasz and A.L.Barabási.Hierarchical Organizationin Complex Networks.Physical Review E,67(2):026112,2003.即劳沃斯,巴拉巴西.复杂网络中的层级组织.《物理评论E》,67(2):026112,2003.文献[23]R.Albertand A.L.Barabási.Statistical Mechanics of Complex Networks.Reviews of ModernPhysics,74(1):47,2002.即阿尔伯特,巴拉巴西.复杂网络的统计技术.《现代物理评论》,74(1):47,2002.)等。在传统的DMS模型中,最初只有两个连接节点,在之后的每一步新加入一个节点,与随机选取的一条边的两个端点相连接。因此,就像巴拉巴西和阿尔伯特早先提出的无标度网络机制(BA)(见文献[17]A.L.Barabási and R.Albert.Emergence of Scaling in Random Networks.Science,286(5439):509-512,1999.即巴拉巴西,阿尔伯特.随机网络中标度的出现.《科学》,286(5439):509-512,1999.)一样,一个已存在的节点获取新链接的概率与其度值成正比。然而,在该DMS模型中,每一步只加入两条新的链接,故网络的平均度值无法通过一些参数得以改变。为了突破这一限制,本发明将DMS模型进行了推广:最开始有m个节点彼此相连,每一步新加入的节点与原有网络中随机选 择的一个m-完全子图相连(如果m=3则该完全子图为三角形),在T步以后,形成一个包含T+m个节点以及 m 2 + mT 条链接的DMS网络。图3给出了当参数设定为m=3时的DMS网络演化示意图。图4分别表示m=2和m=3的两个DMS网络,每个网络包含20个节点。 
之后通过以下三步建立一对相关加权网络G1=(v1,E1)和G2=(V2,E2),其中 
Figure BDA00002454472700122
分别表示网络Gi的节点集和链接集。用
Figure BDA00002454472700124
表示节点
Figure BDA00002454472700125
Figure BDA00002454472700126
之间的链接。为简单起见,事先设定两个网络的节点数相同。 
1)网络初始化 
通过上述广义DMS模型独立生成具有N个节点的两个网络G1=(V1,E1)和G2=(V2,E2)。G1和G2中所有节点随机一一匹配,简单起见,记为 
Figure BDA00002454472700127
i=1,2,…,N。 
2)网络交互 
如果在网络G1
Figure BDA00002454472700128
Figure BDA00002454472700129
相互连接而它们在网络G2中对应的节点
Figure BDA000024544727001210
没有连接,则以一定的概率η1连接η1称为网络G1到网络G2的“交互度”。同样地,如果在网络G2
Figure BDA000024544727001214
Figure BDA000024544727001215
有连接而它们在网络G1中对应的匹配节点
Figure BDA000024544727001216
Figure BDA000024544727001217
没有连接,则以一定的概率η2连接
Figure BDA000024544727001218
Figure BDA000024544727001219
η2称为网络G2到网络G1的“交互度”,实际情况中,两者不一定相等。 
3)权重分配 
分为两种情况。第一种情况,如果网络G1中,
Figure BDA000024544727001220
Figure BDA000024544727001221
相连,即且网络G2中对应节点
Figure BDA000024544727001223
Figure BDA000024544727001224
也相连,即
Figure BDA000024544727001225
则在[1,Q]范围内随机选取一个整数记为
Figure BDA000024544727001226
(或
Figure BDA000024544727001227
),分配给链接
Figure BDA000024544727001228
(或以同样的概率分配给),其中的整数Q是所有网络中链接权重的上限。如果要构造一对正相关权重网络,则在
Figure BDA000024544727001230
(或 )范围内随机选取一个整数记为
Figure BDA000024544727001232
(或
Figure BDA000024544727001233
),分配给链接(或
Figure BDA000024544727001235
), 其中π∈(0,1]是控制关联度的参数。同样地,如果要构造一对负相关权重网络,则在 [ π ( Q - w ij 1 ) , ( Q - w ij 1 ) ] (或 [ π ( Q - w ij 1 ) , ( Q - w ij 2 ) ] )范围内随机选取一个整数记为 
Figure BDA00002454472700133
(或),分配给链接(或
Figure BDA00002454472700136
)。第二种情况,如果网络G1(或G2)中,
Figure BDA00002454472700137
(或
Figure BDA00002454472700138
)和
Figure BDA00002454472700139
(或
Figure BDA000024544727001310
)相连,而网络G2(或G1)中,(或)和
Figure BDA000024544727001313
(或
Figure BDA000024544727001314
)不相连,则在[1,Q]范围内随机选取一个整数记为
Figure BDA000024544727001315
(或
Figure BDA000024544727001316
)分配给G1(或G2)中的链接
Figure BDA000024544727001317
(或
Figure BDA000024544727001318
),而保持节点
Figure BDA000024544727001319
(或
Figure BDA000024544727001320
)和
Figure BDA000024544727001321
(或
Figure BDA000024544727001322
)不连接。图5表示了构造一对正相关权重网络的例子,其链接权重上限设为Q=100,交互度η12=0.5,以及权重相关度设为π=0.5。 
该交互模型的前两步与我们早先提出的无权相关网络模型完全相同,而目标网络的链接权重相关性则通过最后一步来实现,为本发明的创新点之一。该模型在不同参数下所构造的相关权重网络G1和G2将用于测试加权迭代节点匹配算法与常规迭代节点匹配算法,并比较它们的优劣。简单起见,设定两个网络的节点数满足N1=N2=N。在每次实验中,运行网络规模为N=500的100对相关加权网络,其交互度设为η1=0.9,η2=0.1,链接权重上限设为Q=100,之后记录平均匹配精度和方差,并作图比较。假设总共有Pc(Pc≤N-Pr)对剩余节点(除去已匹配节点对)被某种算法正确匹配,则该算法的匹配精度φ可以通过下式计算 
φ = P c N - P r - - - ( 6 )
实验结果比较:考虑一对未连接节点vi和vj,用
Figure DEST_PATH_GDA000032087665001310
表示它们的共有邻居数,用
Figure DEST_PATH_GDA000032087665001311
表示它们总共的邻居数,则这两个节点间的局部对称性由下式定义 
ω ij = x ij c x ij t - - - ( 5 )
如果节点vi和vj相连接,先去除它们之间的链接之后再通过公式(5)计算它们之间 的对称性。显然,如果一个网络中的两个节点间对称性等于1,即它们的邻居完全相同(除了它们自己),则仅通过局部拓扑信息是无法对它们进行区分的。 
Figure BDA00002454472700141
表1对于不同的参数值m=2,3,4,5,DMS网络中节点对之间的最大对称性Smax,最小对称性Smin,平均对称性<S>,以及平均公共邻居数<Xc>等属性。在这些计算中,没有考虑局部对称性等于0的节点对。 
幸运的是,这种网络中节点间的局部对称性可以通过考虑链接权重信息来打破,故而可以预见,当处理较高对称性的相关网络时,本发明所提出的权重迭代节点匹配算法将比常规迭代节点匹配算法具有更好的表现。表1展示了采用不同的参数值m=2,3,4,5时,DMS网络中节点对之间的最大对称性Smax,最小对称性Smin,平均对称性<S>,以及平均公共邻居数<Xc>等属性。在这些计算中,没有考虑局部对称性等于0的节点对。通过表1可以发现,随着参数m的增大,DMS网络的局部对称性在降低,而网络中节点对的平均公共邻居数则在增加。 
图6展示了在不同权重关联度π=0.2,0.4,0.6,0.8下的正相关和负相关加权网络上实施权重迭代节点匹配算法和常规迭代节点匹配算法的匹配结果。这里网络参数m统一设置为5。正如预想的一样,当不同网络对应链接的权重强关联时,即π>0.5,权重迭代节点匹配算法将优于常规迭代节点匹配算法。然而,值得注意的是,当目标网络对应链接的权重之间不存在这种关联或者关联很轻微时,权重迭代节点匹配算法的表现将可能与常规迭代节点匹配算法相类似甚至有所不如。这种现象是合理的,因为在这种情况下,由链接权重信息所带来的噪声可能会掩盖有用的拓扑信息进而降低了新算法的有效性。 
此外,我们还在不同参数m=3,4,5时的负相关加权网络上实施了这两种算法。特别地,用φω和φ分别表示权重迭代节点匹配算法和常规迭代节点匹配算法的匹配精度,并用θ=φω-φ表示两者的匹配精度差。给出了分别采用CLDP1和 CLDP2策略下,匹配精度差θ与已匹配节点对数Pr的关系图。多数情况下,在较大m值的相关权重网络上,权重迭代节点匹配算法相比于常规迭代节点匹配算法的优势更为明显。因为正如表1所示,较大的m值意味着成对节点间的公共邻居较多,在这种情况下,公式(4)中考虑到链接权重关联性的相似度可以用来更为精确地区分那些具有较高对称性的节点。然而,当已匹配节点对数较小时,即Pr≤6时,这种效果将会被减弱,此时,权重迭代节点匹配算法相比常规迭代节点匹配算法的优势在m取值较小的相关权重网络上更为明显,这可能是由于此时这种比对优势更多取决于整个网络的对称性而小m值生成的相关权重网络具有更高的对称度的原因而导致的,如表1所示。 
图2网络间节点相似度计算示意图。首先,对于任何一对网络,如果图中有三对已匹配节点
Figure BDA00002454472700151
Figure BDA00002454472700152
以及
Figure BDA00002454472700153
通过公式(1)计算的节点
Figure BDA00002454472700154
之间的拓扑相似度均为 S ( v 2 1 , v 2 2 ) = S ( v 2 1 , v 3 2 ) = S ( v 3 1 , v 2 2 ) = S ( v 3 1 , v 3 2 ) = 1 . 因此可能无法正确匹配节点
Figure BDA00002454472700157
之后考虑权重信息,在图(a)所示的正相关情况下通过公式(4)计算所得的广义相似度分别为
Figure BDA00002454472700158
S w ( v 2 1 , v 3 2 ) = 0.682 , S w ( v 3 1 , v 2 2 ) = 0.654 , S w ( v 3 1 , v 3 2 ) = 0.999 , 而在图(b)所示的负相关情况下的广义相似度则为 S w ( v 2 1 , v 2 2 ) = 0.999 , S w ( v 2 1 , v 3 2 ) = 0.895 , S w ( v 3 1 , v 2 2 ) = 0.895 ,
Figure BDA000024544727001515
可以发现,在两种情况下最高相似度的匹配均是
Figure BDA000024544727001516
和 
Figure BDA000024544727001517
为正确的匹配结果。 
图3m=3时的DMS网络演化示意图。网络从(a)全连接的三角形开始。每一 步新加入的节点与随机选择的一个三角形的所有节点相连,如图(b)和(c)所示,新加入的链接由虚线表示。基于这种机制,在T步以后,形成一个包含T+m个节点  m 2 + mT 条链接的DMS网络。 
图5构造一对正相关权重网络的示意图,其链接权重上限Q=100,交互度η12=0.5,权重关联度π=0.5。G1和G2之间的匹配节点由虚线连接。在网络交互步骤之后新增加了一部分链接,而在赋权步骤之后每个链接都被按一定规则赋予一个权重值。 
图6分别在不同权重关联度π=0.2,0.4,0.6,0.8的正相关网络上采用CLDP1策略和CLDP2策略实施两种迭代节点匹配算法后,匹配精度φ关于已匹配节点对数Pr的函数图,其中网络参数设置为m=5。可以发现,随着权重关联性的增强,即随着π的增加,权重迭代节点匹配算法相比常规迭代节点匹配算法的优势越发显著。 
分别在不同权重关联度π=0.2,0.4,0.6,0.8的负相关网络上采用CLDP1策略和CLDP2策略实施两种迭代节点匹配算法后,匹配精度φ关于已匹配节点对数Pr的函数图,其中网络参数设置为m=5。可以发现,随着权重关联性的增强,即随着π的增加,权重迭代节点匹配算法相比常规迭代节点匹配算法的优势越发显著。 
在负相关加权网络上分别采用CLDP1和CLDP2策略实施两种算法所得的匹配精度差θ关于已匹配节点对数Pr的函数图。网络参数设为m=3,4,5不等,权重关联参数设为π=0.6。结果发现,在多数情况下,权重迭代节点匹配算法相比常规迭代节点匹配算法的优势在较大m值的DMS相关网络上更为显著。 

Claims (1)

1.一种加权网络间的权重迭代节点匹配方法,其特征在于:所述匹配方法包括以下步骤:
步骤1:已匹配节点对的选择,具体过程如下:
网络G1中的节点集R1依据节点度值通过以下步骤选取:G1中度值最大的节点首先被选定为R1的唯一元素,用U1表示T1的邻居集,
Figure FDA00002454472600011
即满足U1中的每个节点至少被R1中的一个节点连接,而集合V1\(U1∪R1)中的任一节点与R1中的任一节点均没有连接;将集合V1\R1中的节点根据它们属于U1的邻居数按降序排列,选择排序第一的节点,将其添加到R1中;更新R1和U1并重复以上选择过程直到R1集总共包含Pr个节点;之后G1中隶属于R1集合的节点以及它们在G2中的匹配节点被选定为已匹配节点对;
步骤2:相似度计算:
来自不同网络的两个未匹配节点
Figure FDA00002454472600012
Figure FDA00002454472600013
与k对已匹配节点对
Figure FDA00002454472600014
l=1,2,…,k分别连接,记
Figure FDA00002454472600015
Figure FDA00002454472600016
之间连边的权重为
Figure FDA00002454472600017
Figure FDA00002454472600018
Figure FDA00002454472600019
之间连边
Figure FDA000024544726000110
当k=0或者向量w1或w2中所有元素相等时,认为
步骤3:节点匹配:
每一轮迭代选定属于不同网络的一对相似度最高的未匹配节点为当前的匹配节点对,之后将其认为是一对新揭示的已匹配节点对并转到步骤2,根据公式(4)重新计算相似度。
步骤4:终止条件:直到一个目标网络中的所有节点被匹配完,结束。
CN201210483193.1A 2012-11-23 2012-11-23 一种加权网络间的权重迭代节点匹配方法 Active CN103207884B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210483193.1A CN103207884B (zh) 2012-11-23 2012-11-23 一种加权网络间的权重迭代节点匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210483193.1A CN103207884B (zh) 2012-11-23 2012-11-23 一种加权网络间的权重迭代节点匹配方法

Publications (2)

Publication Number Publication Date
CN103207884A true CN103207884A (zh) 2013-07-17
CN103207884B CN103207884B (zh) 2016-05-18

Family

ID=48755107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210483193.1A Active CN103207884B (zh) 2012-11-23 2012-11-23 一种加权网络间的权重迭代节点匹配方法

Country Status (1)

Country Link
CN (1) CN103207884B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105554844A (zh) * 2016-01-22 2016-05-04 大连理工大学 一种无线传感器网络拓扑构建方法
CN106533780A (zh) * 2016-11-30 2017-03-22 大连大学 基于局域世界的加权指控网络演化模型构建方法
CN106530341A (zh) * 2016-11-01 2017-03-22 成都理工大学 一种保持局部拓扑不变性的点配准算法
CN106972952A (zh) * 2017-02-28 2017-07-21 浙江工业大学 一种基于网络度相关性的信息传播领袖节点提取方法
CN106992966A (zh) * 2017-02-28 2017-07-28 浙江工业大学 一种针对真假消息的网络信息传播实现方法
CN107391832A (zh) * 2017-07-15 2017-11-24 西安电子科技大学 利用一步相位迭代数据精确匹配实现网络重构的方法
CN107920133A (zh) * 2017-12-12 2018-04-17 浙江工业大学 一种基于局部网络中三元闭包信息的推荐方法
CN108319677A (zh) * 2018-01-30 2018-07-24 中南大学 动态变化的网络关系图的对齐方法
CN112364181A (zh) * 2020-11-27 2021-02-12 深圳市慧择时代科技有限公司 一种保险产品匹配度确定方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070239694A1 (en) * 2006-02-27 2007-10-11 Singh Ambuj K Graph querying, graph motif mining and the discovery of clusters
CN101278257A (zh) * 2005-05-10 2008-10-01 奈特希尔公司 用于分布式社区发现的方法和装置
CN102148717A (zh) * 2010-02-04 2011-08-10 明仲 一种二分网络中社团检测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101278257A (zh) * 2005-05-10 2008-10-01 奈特希尔公司 用于分布式社区发现的方法和装置
US20070239694A1 (en) * 2006-02-27 2007-10-11 Singh Ambuj K Graph querying, graph motif mining and the discovery of clusters
CN102148717A (zh) * 2010-02-04 2011-08-10 明仲 一种二分网络中社团检测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨红娃等: ""基于介数加权模型的网络防御资源优化分配方法"", 《微波学报》 *
陈龙等: ""一类加权无标度网络负载传输优化策略"", 《中国自动化学会第二十五届青年学术年会论文集》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105554844B (zh) * 2016-01-22 2018-12-21 大连理工大学 一种无线传感器网络拓扑构建方法
CN105554844A (zh) * 2016-01-22 2016-05-04 大连理工大学 一种无线传感器网络拓扑构建方法
CN106530341A (zh) * 2016-11-01 2017-03-22 成都理工大学 一种保持局部拓扑不变性的点配准算法
CN106530341B (zh) * 2016-11-01 2019-12-31 成都理工大学 一种保持局部拓扑不变性的点配准算法
CN106533780A (zh) * 2016-11-30 2017-03-22 大连大学 基于局域世界的加权指控网络演化模型构建方法
CN106972952A (zh) * 2017-02-28 2017-07-21 浙江工业大学 一种基于网络度相关性的信息传播领袖节点提取方法
CN106992966A (zh) * 2017-02-28 2017-07-28 浙江工业大学 一种针对真假消息的网络信息传播实现方法
CN106992966B (zh) * 2017-02-28 2020-01-10 浙江工业大学 一种针对真假消息的网络信息传播实现方法
CN106972952B (zh) * 2017-02-28 2020-02-21 浙江工业大学 一种基于网络度相关性的信息传播领袖节点提取方法
CN107391832A (zh) * 2017-07-15 2017-11-24 西安电子科技大学 利用一步相位迭代数据精确匹配实现网络重构的方法
CN107920133A (zh) * 2017-12-12 2018-04-17 浙江工业大学 一种基于局部网络中三元闭包信息的推荐方法
CN108319677A (zh) * 2018-01-30 2018-07-24 中南大学 动态变化的网络关系图的对齐方法
CN112364181A (zh) * 2020-11-27 2021-02-12 深圳市慧择时代科技有限公司 一种保险产品匹配度确定方法及装置
CN112364181B (zh) * 2020-11-27 2024-05-28 深圳市慧择时代科技有限公司 一种保险产品匹配度确定方法及装置

Also Published As

Publication number Publication date
CN103207884B (zh) 2016-05-18

Similar Documents

Publication Publication Date Title
CN103207884A (zh) 一种加权网络间的权重迭代节点匹配方法
Zhao et al. Mapping the knowledge domain of smart-city research: A bibliometric and scientometric analysis
Tang et al. Graphgpt: Graph instruction tuning for large language models
Hao et al. Construction and application of a knowledge graph
Kong et al. Resilience assessment of interdependent infrastructure systems: a case study based on different response strategies
CN103268327B (zh) 面向高维服务数据的混合可视化方法
Liu et al. Homogeneity trend on social networks changes evolutionary advantage in competitive information diffusion
Li et al. Using Extenics to describe coupled solutions in Axiomatic design
Elkasem et al. An eagle strategy arithmetic optimization algorithm for frequency stability enhancement considering high renewable power penetration and time-varying load
Yang et al. Reconfiguration strategy for dc distribution network fault recovery based on hybrid particle swarm optimization
Zhao et al. Distributed power-line outage detection based on wide area measurement system
Wang et al. Optimizing dynamical changes of structural balance in signed network based on memetic algorithm
CN108573062A (zh) 一种基于异构社交关系的个性化推荐方法
Ullah et al. A novel relevance-based information interaction model for community detection in complex networks
Sulaiman et al. Artificial Intelligence-Based Secured Power Grid Protocol for Smart City
Guamán et al. Distribution network reconfiguration applied to multiple faulty branches based on spanning tree and genetic algorithms
Yeh et al. A new bat and pagerank algorithm for propagation probability in social networks
Förster et al. Exact and approximate mean first passage times on trees and other necklace structures: a local equilibrium approach
Xu et al. A look at the focus on big data for information technology and decision making during 1994 to 2020
Jiang et al. Multisource hierarchical neural network for knowledge graph embedding
Yan et al. OSGNN: Original graph and Subgraph aggregated Graph Neural Network
Yan et al. Research on Combination of Distributed Generation Placement and Dynamic Distribution Network Reconfiguration Based on MIBWOA
CN109299849B (zh) 一种社会网络中群体需求层次计算方法
Lian et al. The expansion mechanism of the cooperative networks of supply support organizations in a public health emergency
Yang et al. Who will establish new trade relations? Looking for potential relationship in international nickel trade

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant