CN109245952A - 一种基于mpa模型的消失链路预测方法 - Google Patents
一种基于mpa模型的消失链路预测方法 Download PDFInfo
- Publication number
- CN109245952A CN109245952A CN201811362632.7A CN201811362632A CN109245952A CN 109245952 A CN109245952 A CN 109245952A CN 201811362632 A CN201811362632 A CN 201811362632A CN 109245952 A CN109245952 A CN 109245952A
- Authority
- CN
- China
- Prior art keywords
- link
- node
- links
- prediction
- disappearance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000008034 disappearance Effects 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000000694 effects Effects 0.000 claims abstract description 11
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 8
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 238000013459 approach Methods 0.000 abstract description 2
- 230000007246 mechanism Effects 0.000 abstract description 2
- 238000011160 research Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008278 dynamic mechanism Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000001145 finger joint Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于MPA模型的消失链路预测方法,在科学合作网络中定义了消失的链路预测,并在PA指标的基础上考虑了节点对的邻居链路的不同作用和链路的权重,设计出MPA模型消除公共邻居链路的权重对消失链路预测的负面影响,从而更快速准确的预测消失的链路。这为深入探究网络结构的动态演化规律和机制等网络科学问题提供新思路。本发明预测方法在AUC和精确率上较七种经典结构相似性算法具有较大的优势,它能够在消失链路预测问题中获得更精确的预测效果。
Description
技术领域
本发明涉及一种基于MPA模型的消失链路预测方法,属于计算机图挖掘技术领域。
背景技术
随着网络科学的快速发展,使得链路预测的研究与网络的结构与演化紧密联系起来。链路预测成为研究复杂网络的重要方法。有许多用于链接预测的方法,如基于相似性的方法。基于相似性算法的研究是主流问题。基于相似性的方法是通过各种相似性方法如:节点相似性方法来计算节点对之间的相似性,并提供有序列表来预测两个节点之间链接的可能性。通常,节点相似性方法是利用节点的属性和特征来描述节点。但节点的基本属性通常是隐藏的并且很难获得。另一种称为结构相似性指标可计算两节点的相似程度。经典的基于结构相似性的链路预测有Preferential Attachment index(PA index)等。链路的形成和消失是网络组织中链路动态的基本过程。目前大多数链路预测工作都侧重于链路的形成。然而,很少有人研究消失的链路预测问题。且现有的研究只停留在发现和分析链接消失的原因上。更少有研究人员试图从网络科学中链接消失的角度来分析。鉴于此,本发明提出一种基于MPA模型的消失链路预测方法。
发明内容
本发明的目的主要针对上述问题,在科学合作网络中定义了消失链路预测,并在PA指标的基础上考虑节点对的邻居链路的不同作用和链路的权重,设计出一种称为Modified Preferential Attachment(MPA)的模型消除公共邻居链路对权重的负面影响,更快速准确的预测消失的链路。为深入地理解复杂网络演化的机制提供新思路。
本发明的技术方案:
一种基于MPA模型的消失链路预测方法,步骤如下:
(1)利用DBLP数据集构建无向科学合作网络,并提取科学合作网络的最大连通子图(MCS);
(2)在科学合作网络中给定消失链路预测的定义;
(3)抽取接下来20年的MCS中学者的共同作者信息,即链路是否相连的数据。计算每年消失链路数比率;
(4)根据消失链路比率由逐年减小至基本保持不变,可得链路比率在基本不变之后的时间中断开的链路是真正意义上消失的链路,即由消失链路比率的定义得到消失链路的真实数据集ED;
(5)基于链路预测中PA指标,设计出新的基于结构相似性的MPA模型计算两个目标节点之间的相似性;
(6)根据MPA模型的值的大小对当前网络所有节点对进行由小到大排序;
(7)根据排在前面的链路在未来消失的可能性越大,因此将这些链路作为预测得到的未来可能会消失的链路;
(8)根据AUC和精确度评估指标来衡量预测算法MPA的精确度,并与七种经典的基于结构相似性指标进行预测效果对比。
进一步地,所述的DBLP数据集描述的是计算机科学领域作者之间合作的关系,节点表作者,边表示合作关系;
所述的消失链路预测是指,在时间间隔[t0,t](t0<t)的无向网络G(V,E),其中V表示节点集合,E表示边集合,在当前t时刻节点x和节点y相连形成的链接,从t+1时刻开始一直持续到未来的时刻t′(t′>0)都是断开的,称这条链路xy为消失的链路,那些短暂消失后又重新产生连接的链路不是本专利所指的消失的链路;
所述的消失链路比率是指,每年消失链接数量占最大连通子图中链接数量的比率;
所述的PA指标是指,新链接产生于节点x和y之间的可能性正比于这两个节点的度的乘积,PA指标的计算如下:
Sxy=Sx x Sy=∑i∈τ(x)Wix x∑j∈τ(y)Wjy
其中,Sx是指节点x的度,Sy指节点y的度,τ(x)表示x的邻居节点,τ(y)表示y的邻居节点,W表示节点间的权重,Sxy表示PA指标的大小;
所述的MPA模型是指,在PA指标的基础上考虑了目标节点对的邻居链路类型的不同作用和链路的权重,把组成目标链路的节点对的邻居链路分为三类,包括:
1)L1:节点x和节点y直接相连的链接;
2)L2:节点x(或节点y)与它和节点y(或节点x)的共同邻居节点之间的链接;
3)L3:除上述两种链接之外的与目标节点相连的链接。
分别为L1,L2,L3添加一个参数用于控制不同类型链接在链接消失中的作用,并改写SX、Sy的计算公式:
Sx=λL1+μL2+νL3=λWxy+μ∑i∈τ(x)∩τ(y)Wix+ν∑j∈{τ(x)-τ(x)∩τ(y)-y}Wjx
Sy=λL1+μL2+νL3=λWxy+μ∑i∈τ(x)∩τ(y)Wix+ν∑k∈{τ(x)-τ(x)∩τ(y)-y}Wkx
其中,λ、μ、ν的取值为0或1,用于区分L1、L2、L3在消失链路预测中是否有贡献,根据L1,L2,L3七种组合方式下PA相似性的精确度,得出节点与共同邻居相连的链路在消失链路预测时具有消极影响,使用其倒数函数来削弱消除公共邻居链路L2的影响,设计出MPA模型;MPA模型的值的大小的计算如下:
其中,τ(x)表示x的邻居节点,τ(y)表示y的邻居节点,W表示权重。
所述的AUC是指,是从整体上衡量算法的精确性,在消失链路预测中可以理解为将消失链接集合ED中随机选择的一条链接与存在链接集合ER中随机选择的一条链接进行比较,如果消失链接集合中的链接的分数小于存在链接集合中链接的分数,则加1分;如果两个分数值相等,则加0.5分。独立比较m次中,如果消失链接集合中的链接的分数小于存在链接集合中链接的分数的次数为m`次,两分数值相等为m``次,则消失链路预测中AUC评估指标可以定义为:
所述的精确度是指,前L条预测边中被预测准确的链接所占的比例,即排在前L的链接中Ld条链接在消失链接集合中;精确度的计算为:
所述的经典的基于结构相似性指标,包含Common Neighbors(CN),Adamic-Adar(AA),Resource Allocation(RA),Preferential Attachment(PA),Local Path(LP),Katz和Random Walk with Restart(RWR)。
本发明的有益效果:本发明在PA指标的基础上考虑了节点对的邻居链路的不同作用和链路的权重,设计出MPA模型消除公共邻居链路对权重的负面影响,更快速准确的预测消失的链路。它从新的视角出发,为深入了解网络动态演化机制等网络科学问题提供新思路。
附图说明
图1为消失链路比率的示例图。
图2为目标节点对的邻居链路类型示例图。
具体实施方式
下面结合具体实施例对本发明所述技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
一种基于MPA模型的消失链路预测方法,步骤如下:
(1)建立无向科学合作网络
根据1990-1992年的DBLP数据集中的节点以及边的关系,构建无向科学合作网络;
(2)提取科学合作网络的最大连通子图(MCS);
(3)抽取接下来20年的MCS中学者的共同作者信息。即从1993到2012年的链接是否相连的数据。计算每年消失链路数比率,20年间消失链路比率如图1所示;
(4)根据从2007年开始消失链路比率几乎保持0.684不变,这就意味着MCS在15年后保持断开的链接几乎是真正意义上消失的链接。根据消失链路比率的定义得到消失链路的真实数据集ED;
(5)基于链路预测中PA指标,考虑了目标节点对的邻居链路类型的不同作用和链路的权重,把组成目标链路的节点对的邻居链路分为三类,如图2所示,设计出新的基于结构相似性的MPA模型计算两个目标节点之间的相似性;MPA模型的值的大小计算公式如下:
(6)根据MPA值的大小对当前网络所有节点对进行由小到大排序;
(7)根据排在前面的链路在未来消失的可能性越大,因此将这些链路作为预测得到的未来可能会消失的链路;
(8)根据AUC和精确度两种评估指标来衡量预测算法MPA,并与七种经典的基于结构相似性指标在DBLP、PRA、PRB三个数据集上进行预测效果对比。分析AUC得出,这些实验结果都表明了在消失链路预测问题中MPA相比于其他七种指标具有最好或接近于最好的预测效果,并且具有很好的普适性;在精确度评估指标下,总体上MPA模型的精确度比其他七种的指标更好;这表明了本专利所提基于结构相似性的消失链路预测中MPA模型在预测网络中链接消失可能性上具有较大的优越性,它能够在消失链路预测问题中获得良好预测效果。
Claims (2)
1.一种基于MPA模型的消失链路预测方法,其特征在于,步骤如下:
(1)利用DBLP数据集构建无向科学合作网络,并提取无向科学合作网络的最大连通子图MCS;
所述的DBLP数据集描述的是计算机科学领域作者之间合作的关系,节点表示作者,边表示合作关系;
(2)在无向科学合作网络中给定消失链路预测的定义;
所述的消失链路预测是指,在时间间隔[t0,t]的无向网络G(V,E),其中V表示节点集合,E表示边集合,在当前t时刻节点x和节点y相连形成的链接,从t+1时刻开始一直持续到未来的时刻t′都是断开的,称这条链路xy为消失的链路;其中,t0<t,t′>0;那些短暂消失后又重新产生连接的链路不是所指的消失的链路;
(3)抽取接下来20年的MCS中学者的共同作者信息,即链路是否相连的数据,并计算每年消失链路数比率;
所述的消失链路比率是指,每年消失链接数量占最大连通子图中链接数量的比率;
(4)根据消失链路比率由逐年减小至基本保持不变,得链路比率在基本不变之后的时间中断开的链路是真正意义上消失的链路,即由消失链路比率的定义得到消失链路的真实数据集ED;
(5)基于链路预测算法中PA指标,设计新的基于结构相似性的MPA模型,计算两个目标节点之间的相似性;
所述的PA指标是指,两个节点x和y之间产生一条新链路的可能性正比于这两个节点的度的乘积,PA指标的加权形式计算如下:
Sxy=Sx x Sy=∑i∈τ(x)Wix x∑j∈τ(y)Wjy
其中,Sx是指节点x的度,Sy指节点y的度,τ(x)表示x的邻居节点,τ(y)表示y的邻居节点,W表示节点间的权重,Sxy表示PA指标的大小;
所述的MPA模型是指,在PA指标的基础上考虑目标节点对的邻居链路类型的不同作用和链路的权重,把组成目标链路的节点对的邻居链路分为三类,包括:
1)L1:节点x和节点y直接相连的链接;
2)L2:节点x与它和节点y的共同邻居节点之间的链接;节点y与它和节点x的共同邻居节点之间的链接;
3)L3:除上述两种链接之外的与目标节点相连的链接;
分别为L1、L2、L3添加一个参数用于控制不同类型链接在链接消失中的作用,并改写Sx、Sy的计算公式:
Sx=λL1+μL2+νL3=λWxy+μ∑i∈τ(x)∩τ(y)Wix+ν∑j∈{τ(x)-τ(x)∩τ(y)-y}Wjx
Sy=λL1+μL2+νL3=λWxy+μ∑i∈τ(x)∩τ(y)Wix+ν∑k∈{τ(x)-τ(x)∩τ(y)-y}Wkx
其中,λ、μ、ν的取值为0或1,用于区分L1、L2、L3在消失链路预测中是否有贡献,根据L1、L2、L3七种组合方式下PA指标相似性的精确度,得出节点与共同邻居相连的链路在消失链路预测时具有消极影响,使用其倒数函数来削弱消除公共邻居链路L2的影响,设计出MPA模型;
MPA模型的值的大小的计算如下:
其中,Sη表示节点x或节点y的度,τ(x)表示x的邻居节点,τ(y)表示y的邻居节点,W表示权重;
(6)根据MPA模型的值的大小对当前网络所有节点对进行由小到大排序;根据排在前面的链路在未来消失的可能性越大,因此将这些链路作为预测得到的未来可能会消失的链路;根据AUC和精确度评估指标来衡量预测算法MPA的精确度,并与七种经典的基于结构相似性指标进行预测效果对比。
2.根据权利要求1所述的基于MPA模型的消失链路预测方法,其特征在于,所述的AUC是指,是从整体上衡量算法的精确性,在消失链路预测中理解为将消失链接集合ED中随机选择的一条链接与存在链接集合ER中随机选择的一条链接进行比较,如果消失链接集合中的链接的分数小于存在链接集合中链接的分数,则加1分;如果两个分数值相等,则加0.5分;独立比较m次中,如果消失链接集合中的链接的分数小于存在链接集合中链接的分数的次数为m`次,两分数值相等为m``次,则消失链路预测中AUC评估指标定义为:
所述的精确度是指,前L条预测边中被预测准确的链接所占的比例,即排在前L的链接中Ld条链接在消失链接集合中;精确度的计算为:
所述的经典的基于结构相似性指标,包含CN、AA、RA、PA、LP、Katz和RWR。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811362632.7A CN109245952A (zh) | 2018-11-16 | 2018-11-16 | 一种基于mpa模型的消失链路预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811362632.7A CN109245952A (zh) | 2018-11-16 | 2018-11-16 | 一种基于mpa模型的消失链路预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109245952A true CN109245952A (zh) | 2019-01-18 |
Family
ID=65074845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811362632.7A Withdrawn CN109245952A (zh) | 2018-11-16 | 2018-11-16 | 一种基于mpa模型的消失链路预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109245952A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112039700A (zh) * | 2020-08-26 | 2020-12-04 | 重庆理工大学 | 基于层叠泛化和代价敏感学习的社交网链路异常预测方法 |
CN113079427A (zh) * | 2021-04-28 | 2021-07-06 | 北京航空航天大学 | 基于网络演化模型的ason网络业务可用性评估方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106100870A (zh) * | 2016-05-31 | 2016-11-09 | 武汉大学 | 一种基于链路预测的社会网络事件检测方法 |
CN106952167A (zh) * | 2017-03-06 | 2017-07-14 | 浙江工业大学 | 一种基于多元线性回归的餐饮业好友连边影响力预测方法 |
CN107346333A (zh) * | 2017-06-27 | 2017-11-14 | 浙江大学 | 一种基于链路预测的在线社交网络好友推荐方法与系统 |
KR20180091139A (ko) * | 2017-02-06 | 2018-08-16 | 한국과학기술원 | 링크 예측 장치 및 방법 |
CN108449209A (zh) * | 2018-03-17 | 2018-08-24 | 北京工业大学 | 基于路径信息和节点信息融合的社交网络好友推荐方法 |
-
2018
- 2018-11-16 CN CN201811362632.7A patent/CN109245952A/zh not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106100870A (zh) * | 2016-05-31 | 2016-11-09 | 武汉大学 | 一种基于链路预测的社会网络事件检测方法 |
KR20180091139A (ko) * | 2017-02-06 | 2018-08-16 | 한국과학기술원 | 링크 예측 장치 및 방법 |
CN106952167A (zh) * | 2017-03-06 | 2017-07-14 | 浙江工业大学 | 一种基于多元线性回归的餐饮业好友连边影响力预测方法 |
CN107346333A (zh) * | 2017-06-27 | 2017-11-14 | 浙江大学 | 一种基于链路预测的在线社交网络好友推荐方法与系统 |
CN108449209A (zh) * | 2018-03-17 | 2018-08-24 | 北京工业大学 | 基于路径信息和节点信息融合的社交网络好友推荐方法 |
Non-Patent Citations (2)
Title |
---|
BO XU 等: "Disappearing Link Prediction in Scientific Collaboration Networks", 《IEEE ACCESS》 * |
吕琳媛: "复杂网络链路预测", 《电子科技大学学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112039700A (zh) * | 2020-08-26 | 2020-12-04 | 重庆理工大学 | 基于层叠泛化和代价敏感学习的社交网链路异常预测方法 |
CN113079427A (zh) * | 2021-04-28 | 2021-07-06 | 北京航空航天大学 | 基于网络演化模型的ason网络业务可用性评估方法 |
CN113079427B (zh) * | 2021-04-28 | 2021-11-23 | 北京航空航天大学 | 基于网络演化模型的ason网络业务可用性评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Uncovering the overlapping community structure of complex networks by maximal cliques | |
Cui et al. | Detecting overlapping communities in networks using the maximal sub-graph and the clustering coefficient | |
CN110347932B (zh) | 一种基于深度学习的跨网络用户对齐方法 | |
Chen et al. | Discovering missing links in networks using vertex similarity measures | |
CN105469145B (zh) | 一种基于遗传粒子群算法的智能组卷方法 | |
Wen et al. | Node similarity measuring in complex networks with relative entropy | |
CN106685716A (zh) | 网络拓扑自适应的数据可视化方法及装置 | |
Cui et al. | Detecting community structure via the maximal sub-graphs and belonging degrees in complex networks | |
CN109583468A (zh) | 训练样本获取方法,样本预测方法及对应装置 | |
CN107451703A (zh) | 一种基于因子图模型的社交网络多任务预测方法 | |
CN106055580B (zh) | 一种基于Radviz的模糊聚类结果可视化方法 | |
CN109245952A (zh) | 一种基于mpa模型的消失链路预测方法 | |
CN110097529A (zh) | 一种基于语义规则的农田定级单元划分方法及系统 | |
Lin et al. | An integer programming approach and visual analysis for detecting hierarchical community structures in social networks | |
CN108364015A (zh) | 一种具有安全机制的半监督超限学习机分类方法 | |
Zhang et al. | Pna: Partial network alignment with generic stable matching | |
CN103034687A (zh) | 一种基于2-类异质网络的关联模块识别方法 | |
Zhang et al. | Watch fashion shows to tell clothing attributes | |
CN104035983A (zh) | 基于属性权重相似度的分类变量聚类方法 | |
Jiang et al. | Consensus style centralizing auto-encoder for weak style classification | |
CN106570188B (zh) | 一种多主题消息传播中结构洞节点的挖掘方法 | |
CN109361556A (zh) | 一种基于节点熵和结构洞的关键节点感知方法 | |
Qiu et al. | Evolution of node behavior in link prediction | |
CN105787520B (zh) | 一种基于自然共享最近邻居搜索的发现簇和离群点的算法 | |
CN106778252B (zh) | 基于粗糙集理论与waode算法的入侵检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190118 |