CN103207884A

CN103207884A - 一种加权网络间的权重迭代节点匹配方法

Info

Publication number: CN103207884A
Application number: CN2012104831931A
Authority: CN
Inventors: 宣琦; 张哲�; 马晓迪; 董辉; 俞立
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2012-11-23
Filing date: 2012-11-23
Publication date: 2013-07-17
Anticipated expiration: 2032-11-23
Also published as: CN103207884B

Abstract

一种加权网络间的权重迭代节点匹配方法，包括以下步骤：步骤1：已匹配节点对的选择；步骤2：相似度计算：来自不同网络的两个未匹配节点和

与k对已匹配节点对

l=1,2,…,k分别连接，记

和之间连边的权重为

而和之间连边的权重为则权重网络间节点相似度定义为（4）；步骤3：节点匹配：每一轮迭代选定属于不同网络的一对相似度最高的未匹配节点为当前的匹配节点对，之后将其认为是一对新揭示的已匹配节点对并转到步骤2，根据公式(4)重新计算相似度；步骤4：终止条件：直到一个目标网络中的所有节点被匹配完，结束。本发明提升匹配效果、提高匹配精度。

Description

一种加权网络间的权重迭代节点匹配方法

技术领域

本发明涉及数据挖掘和复杂网络分析技术，尤其是一种节点匹配方法。

背景技术

随着计算机科学的发展，人们越来越习惯用网络来刻画这个世界，比如生物体内的蛋白质网络（见文献[1]E.Ravasz,A.L.Somera,D.A.Mongru,Z.N.Oltvai,and A.L.Barabási,Hierarchical Organization of Modularity in Metabolic Networks,Science,297(5586):1551-1555,2002.即劳沃斯,索摩尔,蒙格鲁,欧尔特沃伊,巴拉巴西,代谢网络中分层的模块化组织,《科学》,297(5586):1551-1555,2002.文献[2]A.L.Barabási and Z.N.Oltvai,Network Biology:Understanding the Cell'sFunctional Organization,Nature Reviews Genetics,5(2):101-113,2004.即巴拉巴西,欧尔特沃伊,网络生物学：了解细胞的功能组织,《自然遗传学评论》,5(2):101-113,2004.文献[3]C.Stark,B.J.Breitkreutz,T.Reguly,L. Boucher,A.Breitkreutz,andM.Tyers,Biogrid:A General Repository for Interaction Datasets.Nucleic AcidsResearch,34(suppl 1):D535-D539,2006.即斯塔克,布赖特克罗伊兹,赖古伊,鲍彻,泰尔斯,生物网:相互作用数据库的通用存储,《核酸研究》,34:D535-D539,2006.），日常语言网络（见文献[4]R.F.i Cancho,R.V.Solé,et al.The Small World ofHuman Language,Proceedings of the Royal Society of London.Series B:BiologicalSciences,268(1482):2261-2265,2001.即坎乔,舍勒,等.人类语言的小世界,《伦敦英国皇家学会论文集.B辑:生物科学》,268(1482):2261-2265,2001.文献[5]R.F.i Cancho,R.V.Solé,andR.

Patterns in Syntactic Dependency Networks.Physical ReviewE,69(5):051915,2004.即坎乔,舍勒,寇勒.依存句法网络的模式.《物理评论E》,69(5):051915,2004.文献[6]D.R.Amancio,L. Antiqueira,T.A.S.Pardo,L.F.Costa,O.N.Oliveira,and M.G.V.Nunes.Complex Networks Analysis ofManual and Machine Translations.International Journal of Modern Physics C, 19(4):583-598,2008.即阿曼希奥,安提括拉,帕尔多,考斯塔,奥利韦拉,努内斯.人工与机器翻译的复杂网络分析.《现代国际物理期刊C》,19(4):583-598,2008.），描述人际关系的社交网络（见文献[7]C.M.Lakon,S.T.Ennett,and E.C.Norton.Mechanisms through Which Drug,Sex Partner,and Friendship NetworkCharacteristics Relate to Risky Needle Use among High Risk Youth and Young Adults.Social Science & Medicine,63(9):2489-2499,2006.即拉肯,恩耐特,诺顿.危险针头在高危青少年中的使用机制与毒品，性伴侣和友情网络的相关特性.《社会科学与医学》,63(9):2489-2499,2006.），等等。由于世间万物的多维度属性，使得我们可以从不同的角度看待同一个体，故可以认为多数网络不是单独存在的，即很多同类网络具有一定的相关性，而这种相关性很大程度上体现在相同个体在不同网络中存在的不同身份（见文献[8]M.Kurant and P.Thiran.Layered ComplexNetworks.Physical Review Letters,96(13):138701,2006.即库阮特,色万.分层复杂网络.《物理评论快报》,96(13):138701,2006.文献[9]S.V.Buldyrev,R.Parshani,G.Paul,H.E.Stanley,and S.Havlin.Catastrophic Cascade of Failures inInterdependent Networks.Nature,464(7291):1025-1028,2010.即布尔德列夫,普沙尼,保罗,斯坦利,豪夫林.相互连接的网络中故障的灾难性串联.《自然》,464(7291):1025-1028,2010.文献[10]Q.Xuan,F.Du,and T.J.Wu.EmpiricalAnalysis of Internet Telephone Network:From User Id to Phone.Chaos:AnInterdisciplinary Journal of Nonlinear Science,19(2):023101-023101,2009.即宣琦,杜方,吴铁军.互联网电话网络的实证分析：从用户ID到电话.《混沌:非线性科学的多学科期刊》,19(2):023101-023101,2009.文献[11]Q.Xuan and T.J.Wu.Node Matching Between Complex Networks.Physical ReviewE,80(2):026103,2009.即宣琦,吴铁军.复杂网络上的节点匹配.《物理评论E》,80(2):026103,2009.）。例如，不同蛋白质网络中的同源蛋白质通常由一个共同的原始蛋白质在不同的生物体中逐渐演化而形成。虽然这些属于不同生物体的同源蛋白质可能拥有不同的形态，但在调节生物体时可能发挥相似的作用。因此，当把同源蛋白质视为同一蛋白质的不同形态时，可以认为不同的蛋白质网络是彼此相关的。此外，同一个语义在不同的语种中也拥有不同的词汇表述，甚至对于同一语种，因为历史的演化也会产生这种语义表述差异，如一脉相承的中国商代甲骨文、周朝青铜器铭文、秦朝篆书、汉朝隶书以及魏晋楷书等。而由于国际文化的交流融合以及历史传承，这些不同朝代不同国家的不同语言网络可能存在结构上的相似性，因此，当把某些不同的文字视为同一语义的不同形态时，可以认为不同的语言网络同样具有相关性。再者，在现代社会，人们可以使用各种方式与其他人交流，比如电话（见文献[12]J.P.Onnela,J.

J.

G.Szabó,D.Lazer,K.Kaski,J.Kertész,and A.L.Barabási.Structure and Tie Strengths in Mobile CommunicationNetworks.Proceedings of the National Academy of Sciences,104(18):7332,2007.即翁内拉,萨拉玛奇,豪翁恩,萨博,拉泽,卡斯基,凯尔泰斯,巴拉巴西.移动通信网络中的结构与约束力.《美国国家科学院会议论文集》,104(18):7332,2007.文献[13]A.E.Motter,T.Nishikawa,and Y.C.Lai.Large-scale Structural Organizationof Social Networks.Arxiv Preprint Ccond-mat/0303571,2003.即莫特,尼施卡瓦.社交网络的大型组织结构.《Arxiv非正式版本》/0303571,2003.）、电子邮件（见文献[14]M.E.J.Newman,S.Forrest,and J.Balthrop.Email Networks and the Spreadof Computer Viruses.Physical ReviewE,66(3):035101,2002.即纽曼,弗利斯特,巴斯欧.电子邮件网络与计算机病毒传播.《物理评论E》,66(3):035101,2002.）、MSN（见文献[15]T.Mah,H.Hoek,and Y.Li.Funnel Report Mining for the MsnNetwork.InProceedings of the Seventh ACM SIGKDD International Conference onKnowledge Discovery and Data Mining,pages 450-455.ACM,2001.即马斯,胡克,李.MSN网络的汇总报告挖掘.《第七届ACM知识发现与数据挖掘国际会议论文集》,450-455.ACM,2001.）等等。如果两个人使用其中某种方式相互沟通，那他们可能因为某些原因，如友情发展等，在另一时间使用其他方式进行联系，由此可见，现代通讯网络之间也存在相关性。此类例子举不胜举。

因此，当将不同种类的复杂系统描述成复杂网络时，诸如同源蛋白质发现，古词翻译，互联网跨网犯罪跟踪等不同领域的现实问题均可转换为网络间的节点匹配问题，从而纳入统一的理论框架进行求解。假设不同的目标网络存在结构相关性，该问题可以利用小部分已匹配节点对提供的信息，通过设计节点匹配算法得到一定程度上的解决。特别是我们近期提出的一种有效的迭代节点匹配算法（见文献[16]Q.Xuan,F.Du,and T.J.Wu.Iterative Node Matching between ComplexNetworks.Journal of PhysicsA: Mathematical and Theoretical,43:395002,2010.即宣琦,杜方,吴铁军.复杂网络的迭代节点匹配.《物理A期刊：数学与理论》,43:395002,2010.），在揭示两个相关的人工无标度网络间（见文献[17]A.L.Barabásiand R. Albert. Emergence of Scaling in Random Networks. Science,286(5439):509-512,1999.即巴拉巴西,阿尔伯特.随机网络中标度的出现.《科学》,286(5439):509-512,1999.）对应节点时有着非常好的效果。事实上，我们只利用少于2%的已匹配节点对就正确匹配了超过90%的剩余节点。然而，进一步的实验表明，当目标网络中大量节点具有较高对称性（见文献[18]Y. Xiao,M.Xiong,W. Wang,and H.Wang.Emergence of Symmetry in Complex Networks.PhysicalReviewE,77(6):066108,2008.即肖华,熊明,王威,黄骅.复杂网络中对称性的出现.《物理评论E》,77(6):066108,2008.）时，即这些节点具有很多相同邻居，纯粹基于拓扑的节点匹配算法通常会失效。这一结果毫不意外，因为在同一网络中都很难区分这些对称节点，更不用说仅通过其局部拓扑结构利用一对一匹配算法对它们进行精准匹配。而由于研究发现实际网络通常具有较高的对称性拓扑结构，因此现有的一对一节点匹配算法需要进一步改进以满足现实需求。

弥补一对一迭代节点匹配算法的这一缺陷可以从两方面下手。一方面是提出一对多（见文献[19]F.Du,Q.Xuan,and T.WU.One-to-many Node Matchingbetween Complex Networks.Advances in Complex Systems,13(6):725,2010.即杜方,宣琦,吴铁军.复杂网络上的一对多节点匹配.《复杂系统进展》,13(6):725,2010.）甚至多对多节点匹配算法。当目标只是设定为迅速缩小搜索范围时，该方法不失为一个好的选择，然而，在大多数情况下，该方法只能认为是一种折衷而非真正意义上的改进方案。另一方面是推广节点间相似度定义使之包含更多信息以便差异化拓扑结构上的对称节点。考虑到大多数真实世界网络为加权网络，足以提供此类额外信息，因此本发明将首次沿着这一方向把链接权重考虑进相似度计算，进而改进原有的节点匹配算法。事实上，现实网络节点间的权重有可能是正相关的，比如由于某些正面的激励，如果某个个体在某个网络花费了更多的时间与其某些邻居互动，则该个体在另一个网络中可能也会花费较多的时间与对应的邻居互动；也有可能是负相关的，如果网络中某个个体与其邻居互动的时间比较均等，而对不同的邻居采用的互动方式具有较大差异，此时可以认为当该个体在某个网络中花费更多时间与某些邻居互动，则该个体在另一个网络中只能花费更少的时间与对应的邻居互动。

发明内容

为了克服已有迭代节点匹配方法的匹配效果较差、精度较低的不足，本发明提供一种提升匹配效果、提高匹配精度的加权网络间的权重迭代节点匹配方法。

本发明解决其技术问题所采用的技术方案是：

一种加权网络间的权重迭代节点匹配方法，所述匹配方法包括以下步骤：

步骤1：已匹配节点对的选择，具体过程如下：

网络G₁中的节点集R₁依据节点度值通过以下步骤选取：G₁中度值最大的节点首先被选定为R₁的唯一元素，用

表示R₁的邻居集，即满足U₁中的每个节点至少被R₁中的一个节点连接，而集合V₁\(U₁∪R₁)中的任一节点与R₁中的任一节点均没有连接；将集合V₁\R₁中的节点根据它们属于U₁的邻居数按降序排列，选择排序第一的节点，将其添加到R₁中；更新R₁和U₁并重复以上选择过程直到R₁集总共包含P_r个节点；之后G₁中隶属于R₁集合的节点以及它们在G₂中的匹配节点被选定为已匹配节点对；

步骤2：相似度计算：

来自不同网络的两个未匹配节点

和

与k对已匹配节点对

l=1,2,…,k分别连接，记

和

之间连边的权重为

而

和

之间连边的权重为

则权重网络间节点相似度定义为：

S_{w} (v_{i}^{1}, v_{j}^{2}) = \frac{Σ_{l = 1}^{k} | (w_{l}^{1} - \overset{&OverBar;}{w^{1}}) (w_{l}^{2} - \overset{&OverBar;}{w^{2}}) |}{| | w^{1} - \overset{&OverBar;}{w^{1}} | | \cdot | | w^{2} - \overset{&OverBar;}{w^{2}} | |} S (v_{i}^{1}, v_{j}^{2}) - - - (4)

其中

是向量中元素的均值，即i=1,2，，为当k=0或者向量w¹或w²中所有元素相等时，认为

步骤3：节点匹配：

每一轮迭代选定属于不同网络的一对相似度最高的未匹配节点为当前的匹配节点对，之后将其认为是一对新揭示的已匹配节点对并转到步骤2，根据公式(4)重新计算相似度。

步骤4：终止条件：直到一个目标网络中的所有节点被匹配完，结束。

本发明的技术构思为：本发明提出了一个用于生成正相关和负相关网络的模型。同时，本发明也给出了一种综合考虑节点局部拓扑信息以及链接权重信息的不同网络间节点相似度定义，在此基础上设计了一种加权迭代节点匹配算法。数值模拟表明无论目标网络的权重是正相关或者负相关，本算法效果均可优于已有的单纯基于拓扑信息的一对一迭代节点匹配算法。

本发明的有益效果主要表现在：提升匹配效果、提高匹配精度。

附图说明

图1为本发明中旨在说明节点对称性的示意图；

图2为本发明中网络间节点相似度计算示意图；

图3为本发明中所扩展的DMS网络演化示意图；

图4为本发明中参数设为m=2和m=3以及T=18和T=17的DMS网络；

图5为本发明中构造一对正相关权重网络的示意图；

图6为本发明中在不同关联度的正相关加权网络上实施两种迭代节点匹配算

法后，匹配精度φ关于已匹配节点对数P_r的函数图；

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1～图6，一种加权网络间的权重迭代节点匹配方法，利用若干已匹配节点对提供的局部拓扑信息以及链接权重信息计算未匹配节点对之间的相似度，同时考虑网络间链接权重正负相关性对相似度的影响。基于其迭代本质，每次只有一对相似度最大的未匹配节点被选择为匹配节点对，它将被进一步认为是一对新揭示的已匹配节点对，以重新计算剩下的未匹配节点对之间的相似度，直到一些终止条件被满足。

加权网络间的权重迭代节点匹配算法步骤如下：

步骤1：已匹配节点对的选择

为实现网络间节点匹配，通常需要若干已匹配节点对，并以它们提供的局部拓扑信息以及链接权重信息作为算法的先验知识。如何选择适当的已匹配节点对来提高匹配精度一直是网络间节点匹配算法的一个重要组成部分。一方面，根据信息论，由于大度值节点能提供更多的局部拓扑和权重信息，理应被优先选为已匹配节点对。另一方面，由于是迭代算法，已匹配节点对最好能聚集在网络的一个局部区域内以便提高第一轮的匹配精度，进而提高第二轮的匹配精度，以此类推。基于这些事实，考虑到两个网络之间的差异，我们为网络间迭代节点匹配算法提出如下两种已匹配节点对选择策略。第一种是网络G₁中的集中大度值优先策略（Centralized Large Degree Priority）（CLDP1），根据该策略，网络G₁中的节点集R₁依据节点度值通过以下步骤选取：G₁中度值最大的节点首先被选定为R₁的唯一元素。用

表示R₁的邻居集，即满足U₁中的每个节点至少被R₁中的一个节点连接，而集合V₁\(U₁∪R₁)中的任一节点与R₁中的任一节点均没有连接。将集合V₁\R₁中的节点根据它们属于U₁的邻居数按降序排列，选择排序第一的节点，将其添加到R₁中。更新R₁和U₁并重复以上选择过程直到R₁集总共包含P_r个节点。之后G₁中隶属于R₁集合的节点以及它们在G₂中的匹配节点被选定为已匹配节点对。第二种是G₂中的集中大度值优先（GLDP2），其具体步骤同第一种类似，在此不再赘述。

步骤2：相似度计算

通常，无权网络间节点相似度能够通过围绕它们的已匹配节点对的数量来衡量。在纯粹基于拓扑信息的节点匹配算法（见文献[11]Q.Xuan and T.J.Wu.NodeMatching Between Complex Networks.Physical ReviewE,80(2):026103,2009.即宣琦,吴铁军.复杂网络上的节点匹配.《物理评论E》,80(2):026103,2009.文献[16]Q.Xuan,F.Du,and T.J.Wu.Iterative Node Matching between ComplexNetworks.Journal of PhysicsA:Mathematical and Theoretical,43:395002,2010.即宣琦,杜方,吴铁军.复杂网络的迭代节点匹配.《物理A期刊：数学与理论》,43:395002,2010.文献[19]F.Du,Q.Xuan,and T.WU.One-to-many Node Matchingbetween Complex Networks.Advances in Complex Systems,13(6):725,2010.即杜方,宣琦,吴铁军.复杂网络上的一对多节点匹配.《复杂系统进展》,13(6):725,2010.）中，网络G₁中的节点

和网络G₂中的节点

的相似度可以通过下式计算

S (v_{i}^{1}, v_{j}^{2}) = \frac{n_{M} (v_{i}^{1}, v_{j}^{2})}{n_{L} (v_{i}^{1}) + n_{L} (v_{j}^{2}) - n_{M} (v_{i}^{1}, v_{j}^{2})} - - - (1)

此处，

定义为与节点

和

同时相连的已匹配节点对

的数量，即与

在G₁中相连而

和在G₂中相连，而

（或

）表示在网络G₁（或G₂）中节点（或

）的总邻居数。公式(1)保证了网络间节点相似度归一化为区间[0,1]中的某个值。

然而，如上所述，根据(1)式定义的相似度将无法区分某个网络中的两个对称节点，从而可能会降低整个网络的匹配精度。例如，假设网络G₁具有如图1所示的结构，因为分别拥有共同邻居

和

节点

和

以及节点

和

为对称节点（其中，

和之间的连边可忽略）。根据公式(1)，如果只有

和

以及它们在网络G₂中的对应节点已匹配，那么其它节点与网络G₂中的任一节点

一定满足

S (v_{1}^{1}, v_{i}^{2}) = S (v_{2}^{1}, v_{i}^{2}) = S (v_{3}^{1}, v_{i}^{2}) - - - (2)

S (v_{6}^{1}, v_{i}^{2}) = S (v_{7}^{1}, v_{i}^{2}) - - - (3)

于是可以推测正确匹配节点

或者

的概率将不会超过1/3而正确匹配节点

或

的概率则不会超过1/2。如果目标网络中有更多的对称节点，匹配结果可能会更差。

为克服此类不足，我们将在公式(1)的基础上同时考虑网络中链接的权重信息，以此推广相似度的定义。事实上，同一个体在不同网络中的链接权重可能是正相关的也可能是负相关的。为了处理这两种不同的情况，本发明同时考虑两种目标节点间链接权重的相关性，将公式(1)定义的相似度进行了推广。假设来自不同网络的两个未匹配节点

和

与k对已匹配节点对

l=1,2,…,k分别连接，记和之间连边的权重为

而和

之间连边的权重为

则权重网络间节点相似度定义为

S_{w} (v_{i}^{1}, v_{j}^{2}) = \frac{Σ_{l = 1}^{k} | (w_{l}^{1} - \overset{&OverBar;}{w^{1}}) (w_{l}^{2} - \overset{&OverBar;}{w^{2}}) |}{| | w^{1} - \overset{&OverBar;}{w^{1}} | | \cdot | | w^{2} - \overset{&OverBar;}{w^{2}} | |} S (v_{i}^{1}, v_{j}^{2}) - - - (4)

其中

是向量中元素的均值，即

i=1,2。值得注意的是，为避免公式(4)无意义，当k=0或者向量w¹或w²中所有元素相等时，认为不难证明公式(4)定义的相似度依旧是归一化的，而且当网络中所有链接权重均相等时，公式(4)将退化为公式(1)。

公式(4)定义的相似度计算说明如图2所示，其中图2(a)和2(b)分别为两个正相关和负相关网络的局部结构。首先，对于任何一对网络，如果图中有三对已匹配节点

以及

通过公式(1)计算的节点

和

之间的拓扑相似度均为

S (v_{2}^{1}, v_{2}^{2}) = S (v_{2}^{1}, v_{3}^{2}) = S (v_{3}^{1}, v_{2}^{2}) = S (v_{3}^{1}, v_{3}^{2}) = 1 .

因此通过公式(1)可能无法正确匹配节点

而如果考虑权重信息，在图2(a)所示的正相关情况下通过公式(4)计算所得的广义相似度分别为

S_{w} (v_{2}^{1}, v_{3}^{2}) = 0.682,

S_{w} (v_{3}^{1}, v_{2}^{2}) = 0.654,

S_{w} (v_{3}^{1}, v_{3}^{2}) = 0.999,

而在图2(b)所示负相关情况下的广义相似度则为

S_{w} (v_{2}^{1}, v_{2}^{2}) = 0.999,

S_{w} (v_{2}^{1}, v_{3}^{2}) = 0.895,

S_{w} (v_{3}^{1}, v_{2}^{2}) = 0.895,

可以发现，在两种情况下最高相似度的匹配均是和

为正确的匹配结果。

步骤3：节点匹配

每一轮迭代选定属于不同网络的一对相似度最高的未匹配节点为当前的匹配节点对。之后将其认为是一对新揭示的已匹配节点对并转到步骤2根据公式(4)重新计算相似度。

步骤4：终止条件

为了便于比较，在本发明中，直到一个目标网络中的所有节点被匹配完，算法终止。

测试集构建：首先通过某种规则创建两个独立网络，之后以此建立一对相关加权网络。为了重现真实网络的高对称性，我们采用Dorogovtsev,Mendes和Samukhin(DMS)所提出的模型来建立独立网络（见文献[20]S.N.Dorogovtsev,J.F.F.Mendes,and A.N.Samukhin.Size-dependent Degree Distribution of a ScalefreeGrowing Network.PhysicalReviewE,63(6):062101,2001.即德格斯铁夫,门德斯,萨缪汀.无标度成长网络依赖尺度的度分布.《物理评论E》,63(6):062101,2001.）。通过DMS模型建立的网络同时具有其它一些众所周知的拓扑性质，如小世界（见文献[21]D.J.Watts and S.H.Strogatz.Collective Dynamics of Small-world Networks.Nature,393(6684):440-442,1998.即瓦特,斯通盖茨.小世界网络的通用动力学.《自然》,393(6684):440-442,1998.），无标度（见文献[17]A.L.Barabási and R.Albert.Emergence of Scaling in Random Networks.Science,286(5439):509-512,1999.即巴拉巴西,阿尔伯特.随机网络中标度的出现.《科学》,286(5439):509-512,1999.），高聚类（见文献[22]E.Ravasz and A.L.Barabási.Hierarchical Organizationin Complex Networks.Physical Review E,67(2):026112,2003.即劳沃斯,巴拉巴西.复杂网络中的层级组织.《物理评论E》,67(2):026112,2003.文献[23]R.Albertand A.L.Barabási.Statistical Mechanics of Complex Networks.Reviews of ModernPhysics,74(1):47,2002.即阿尔伯特,巴拉巴西.复杂网络的统计技术.《现代物理评论》,74(1):47,2002.）等。在传统的DMS模型中，最初只有两个连接节点，在之后的每一步新加入一个节点，与随机选取的一条边的两个端点相连接。因此，就像巴拉巴西和阿尔伯特早先提出的无标度网络机制(BA)（见文献[17]A.L.Barabási and R.Albert.Emergence of Scaling in Random Networks.Science,286(5439):509-512,1999.即巴拉巴西,阿尔伯特.随机网络中标度的出现.《科学》,286(5439):509-512,1999.）一样，一个已存在的节点获取新链接的概率与其度值成正比。然而，在该DMS模型中，每一步只加入两条新的链接，故网络的平均度值无法通过一些参数得以改变。为了突破这一限制，本发明将DMS模型进行了推广：最开始有m个节点彼此相连，每一步新加入的节点与原有网络中随机选择的一个m-完全子图相连（如果m=3则该完全子图为三角形），在T步以后，形成一个包含T+m个节点以及

(\begin{matrix} m \\ 2 \end{matrix}) + mT

条链接的DMS网络。图3给出了当参数设定为m=3时的DMS网络演化示意图。图4分别表示m=2和m=3的两个DMS网络，每个网络包含20个节点。

之后通过以下三步建立一对相关加权网络G₁=(v₁,E₁)和G₂=(V₂,E₂)，其中

和分别表示网络G_i的节点集和链接集。用

表示节点

和

之间的链接。为简单起见，事先设定两个网络的节点数相同。

1)网络初始化

通过上述广义DMS模型独立生成具有N个节点的两个网络G₁=(V₁,E₁)和G₂=(V₂,E₂)。G₁和G₂中所有节点随机一一匹配，简单起见，记为

i=1,2,…,N。

2)网络交互

如果在网络G₁中

和

相互连接而它们在网络G₂中对应的节点

和没有连接，则以一定的概率η₁连接和η₁称为网络G₁到网络G₂的“交互度”。同样地，如果在网络G₂中

和

有连接而它们在网络G₁中对应的匹配节点

和

没有连接，则以一定的概率η₂连接

和

η₂称为网络G₂到网络G₁的“交互度”，实际情况中，两者不一定相等。

3)权重分配

分为两种情况。第一种情况，如果网络G₁中，

和

相连，即且网络G₂中对应节点

和

也相连，即

则在[1,Q]范围内随机选取一个整数记为

（或

），分配给链接

（或以同样的概率分配给），其中的整数Q是所有网络中链接权重的上限。如果要构造一对正相关权重网络，则在

（或）范围内随机选取一个整数记为

（或

），分配给链接（或

），其中π∈(0,1]是控制关联度的参数。同样地，如果要构造一对负相关权重网络，则在

[π (Q - w_{ij}^{1}), (Q - w_{ij}^{1})]

（或

[π (Q - w_{ij}^{1}), (Q - w_{ij}^{2})]

）范围内随机选取一个整数记为

（或），分配给链接（或

）。第二种情况，如果网络G₁（或G₂）中，

（或

）和

（或

）相连，而网络G₂（或G₁）中，（或）和

（或

）不相连，则在[1,Q]范围内随机选取一个整数记为

（或

）分配给G₁（或G₂）中的链接

（或

），而保持节点

（或

）和

（或

）不连接。图5表示了构造一对正相关权重网络的例子，其链接权重上限设为Q=100，交互度η₁=η₂=0.5，以及权重相关度设为π=0.5。

该交互模型的前两步与我们早先提出的无权相关网络模型完全相同，而目标网络的链接权重相关性则通过最后一步来实现，为本发明的创新点之一。该模型在不同参数下所构造的相关权重网络G₁和G₂将用于测试加权迭代节点匹配算法与常规迭代节点匹配算法，并比较它们的优劣。简单起见，设定两个网络的节点数满足N₁=N₂=N。在每次实验中，运行网络规模为N=500的100对相关加权网络，其交互度设为η₁=0.9，η₂=0.1，链接权重上限设为Q=100，之后记录平均匹配精度和方差，并作图比较。假设总共有P_c(P_c≤N-P_r)对剩余节点（除去已匹配节点对）被某种算法正确匹配，则该算法的匹配精度φ可以通过下式计算

φ = \frac{P_{c}}{N - P_{r}} - - - (6)

实验结果比较：考虑一对未连接节点v_i和v_j，用

表示它们的共有邻居数，用

表示它们总共的邻居数，则这两个节点间的局部对称性由下式定义

ω_{ij} = \frac{x_{ij}^{c}}{x_{ij}^{t}} - - - (5)

如果节点v_i和v_j相连接，先去除它们之间的链接之后再通过公式(5)计算它们之间的对称性。显然，如果一个网络中的两个节点间对称性等于1，即它们的邻居完全相同（除了它们自己），则仅通过局部拓扑信息是无法对它们进行区分的。

表1对于不同的参数值m=2,3,4,5，DMS网络中节点对之间的最大对称性S_max，最小对称性S_min，平均对称性<S>，以及平均公共邻居数<X^c>等属性。在这些计算中，没有考虑局部对称性等于0的节点对。

幸运的是，这种网络中节点间的局部对称性可以通过考虑链接权重信息来打破，故而可以预见，当处理较高对称性的相关网络时，本发明所提出的权重迭代节点匹配算法将比常规迭代节点匹配算法具有更好的表现。表1展示了采用不同的参数值m=2,3,4,5时，DMS网络中节点对之间的最大对称性S_max，最小对称性S_min，平均对称性<S>，以及平均公共邻居数<X^c>等属性。在这些计算中，没有考虑局部对称性等于0的节点对。通过表1可以发现，随着参数m的增大，DMS网络的局部对称性在降低，而网络中节点对的平均公共邻居数则在增加。

图6展示了在不同权重关联度π=0.2,0.4,0.6,0.8下的正相关和负相关加权网络上实施权重迭代节点匹配算法和常规迭代节点匹配算法的匹配结果。这里网络参数m统一设置为5。正如预想的一样，当不同网络对应链接的权重强关联时，即π>0.5，权重迭代节点匹配算法将优于常规迭代节点匹配算法。然而，值得注意的是，当目标网络对应链接的权重之间不存在这种关联或者关联很轻微时，权重迭代节点匹配算法的表现将可能与常规迭代节点匹配算法相类似甚至有所不如。这种现象是合理的，因为在这种情况下，由链接权重信息所带来的噪声可能会掩盖有用的拓扑信息进而降低了新算法的有效性。

此外，我们还在不同参数m=3,4,5时的负相关加权网络上实施了这两种算法。特别地，用φ_ω和φ分别表示权重迭代节点匹配算法和常规迭代节点匹配算法的匹配精度，并用θ=φ_ω-φ表示两者的匹配精度差。给出了分别采用CLDP1和 CLDP2策略下，匹配精度差θ与已匹配节点对数P_r的关系图。多数情况下，在较大m值的相关权重网络上，权重迭代节点匹配算法相比于常规迭代节点匹配算法的优势更为明显。因为正如表1所示，较大的m值意味着成对节点间的公共邻居较多，在这种情况下，公式(4)中考虑到链接权重关联性的相似度可以用来更为精确地区分那些具有较高对称性的节点。然而，当已匹配节点对数较小时，即P_r≤6时，这种效果将会被减弱，此时，权重迭代节点匹配算法相比常规迭代节点匹配算法的优势在m取值较小的相关权重网络上更为明显，这可能是由于此时这种比对优势更多取决于整个网络的对称性而小m值生成的相关权重网络具有更高的对称度的原因而导致的，如表1所示。

图2网络间节点相似度计算示意图。首先，对于任何一对网络，如果图中有三对已匹配节点

以及

通过公式(1)计算的节点

和之间的拓扑相似度均为

S (v_{2}^{1}, v_{2}^{2}) = S (v_{2}^{1}, v_{3}^{2}) = S (v_{3}^{1}, v_{2}^{2}) = S (v_{3}^{1}, v_{3}^{2}) = 1 .

因此可能无法正确匹配节点

之后考虑权重信息，在图(a)所示的正相关情况下通过公式(4)计算所得的广义相似度分别为

S_{w} (v_{2}^{1}, v_{3}^{2}) = 0.682,

S_{w} (v_{3}^{1}, v_{2}^{2}) = 0.654,

S_{w} (v_{3}^{1}, v_{3}^{2}) = 0.999,

而在图(b)所示的负相关情况下的广义相似度则为

S_{w} (v_{2}^{1}, v_{2}^{2}) = 0.999,

S_{w} (v_{2}^{1}, v_{3}^{2}) = 0.895,

S_{w} (v_{3}^{1}, v_{2}^{2}) = 0.895,

可以发现，在两种情况下最高相似度的匹配均是

和

为正确的匹配结果。

图3m=3时的DMS网络演化示意图。网络从(a)全连接的三角形开始。每一步新加入的节点与随机选择的一个三角形的所有节点相连，如图(b)和(c)所示，新加入的链接由虚线表示。基于这种机制，在T步以后，形成一个包含T+m个节点

(\begin{matrix} m \\ 2 \end{matrix}) + mT

条链接的DMS网络。

图5构造一对正相关权重网络的示意图，其链接权重上限Q=100，交互度η₁=η₂=0.5，权重关联度π=0.5。G₁和G₂之间的匹配节点由虚线连接。在网络交互步骤之后新增加了一部分链接，而在赋权步骤之后每个链接都被按一定规则赋予一个权重值。

图6分别在不同权重关联度π=0.2,0.4,0.6,0.8的正相关网络上采用CLDP1策略和CLDP2策略实施两种迭代节点匹配算法后，匹配精度φ关于已匹配节点对数P_r的函数图，其中网络参数设置为m=5。可以发现，随着权重关联性的增强，即随着π的增加，权重迭代节点匹配算法相比常规迭代节点匹配算法的优势越发显著。

分别在不同权重关联度π=0.2,0.4,0.6,0.8的负相关网络上采用CLDP1策略和CLDP2策略实施两种迭代节点匹配算法后，匹配精度φ关于已匹配节点对数P_r的函数图，其中网络参数设置为m=5。可以发现，随着权重关联性的增强，即随着π的增加，权重迭代节点匹配算法相比常规迭代节点匹配算法的优势越发显著。

在负相关加权网络上分别采用CLDP1和CLDP2策略实施两种算法所得的匹配精度差θ关于已匹配节点对数P_r的函数图。网络参数设为m=3,4,5不等，权重关联参数设为π=0.6。结果发现，在多数情况下，权重迭代节点匹配算法相比常规迭代节点匹配算法的优势在较大m值的DMS相关网络上更为显著。

Claims

1.一种加权网络间的权重迭代节点匹配方法，其特征在于：所述匹配方法包括以下步骤：

步骤1：已匹配节点对的选择，具体过程如下：

网络G₁中的节点集R₁依据节点度值通过以下步骤选取：G₁中度值最大的节点首先被选定为R₁的唯一元素，用U₁表示T₁的邻居集，

即满足U₁中的每个节点至少被R₁中的一个节点连接，而集合V₁\(U₁∪R₁)中的任一节点与R₁中的任一节点均没有连接；将集合V₁\R₁中的节点根据它们属于U₁的邻居数按降序排列，选择排序第一的节点，将其添加到R₁中；更新R₁和U₁并重复以上选择过程直到R₁集总共包含P_r个节点；之后G₁中隶属于R₁集合的节点以及它们在G₂中的匹配节点被选定为已匹配节点对；

步骤2：相似度计算：

来自不同网络的两个未匹配节点