CN109245952A - 一种基于mpa模型的消失链路预测方法 - Google Patents

一种基于mpa模型的消失链路预测方法 Download PDF

Info

Publication number
CN109245952A
CN109245952A CN201811362632.7A CN201811362632A CN109245952A CN 109245952 A CN109245952 A CN 109245952A CN 201811362632 A CN201811362632 A CN 201811362632A CN 109245952 A CN109245952 A CN 109245952A
Authority
CN
China
Prior art keywords
link
disappearance
node
prediction
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201811362632.7A
Other languages
English (en)
Inventor
徐博
陈鹏
刘嘉莹
李璐
夏锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201811362632.7A priority Critical patent/CN109245952A/zh
Publication of CN109245952A publication Critical patent/CN109245952A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于MPA模型的消失链路预测方法,在科学合作网络中定义了消失的链路预测,并在PA指标的基础上考虑了节点对的邻居链路的不同作用和链路的权重,设计出MPA模型消除公共邻居链路的权重对消失链路预测的负面影响,从而更快速准确的预测消失的链路。这为深入探究网络结构的动态演化规律和机制等网络科学问题提供新思路。本发明预测方法在AUC和精确率上较七种经典结构相似性算法具有较大的优势,它能够在消失链路预测问题中获得更精确的预测效果。

Description

一种基于MPA模型的消失链路预测方法
技术领域
本发明涉及一种基于MPA模型的消失链路预测方法,属于计算机图挖掘技术领域。
背景技术
随着网络科学的快速发展,使得链路预测的研究与网络的结构与演化紧密联系起来。链路预测成为研究复杂网络的重要方法。有许多用于链接预测的方法,如基于相似性的方法。基于相似性算法的研究是主流问题。基于相似性的方法是通过各种相似性方法如:节点相似性方法来计算节点对之间的相似性,并提供有序列表来预测两个节点之间链接的可能性。通常,节点相似性方法是利用节点的属性和特征来描述节点。但节点的基本属性通常是隐藏的并且很难获得。另一种称为结构相似性指标可计算两节点的相似程度。经典的基于结构相似性的链路预测有Preferential Attachment index(PA index)等。链路的形成和消失是网络组织中链路动态的基本过程。目前大多数链路预测工作都侧重于链路的形成。然而,很少有人研究消失的链路预测问题。且现有的研究只停留在发现和分析链接消失的原因上。更少有研究人员试图从网络科学中链接消失的角度来分析。鉴于此,本发明提出一种基于MPA模型的消失链路预测方法。
发明内容
本发明的目的主要针对上述问题,在科学合作网络中定义了消失链路预测,并在PA指标的基础上考虑节点对的邻居链路的不同作用和链路的权重,设计出一种称为Modified Preferential Attachment(MPA)的模型消除公共邻居链路对权重的负面影响,更快速准确的预测消失的链路。为深入地理解复杂网络演化的机制提供新思路。
本发明的技术方案:
一种基于MPA模型的消失链路预测方法,步骤如下:
(1)利用DBLP数据集构建无向科学合作网络,并提取科学合作网络的最大连通子图(MCS);
(2)在科学合作网络中给定消失链路预测的定义;
(3)抽取接下来20年的MCS中学者的共同作者信息,即链路是否相连的数据。计算每年消失链路数比率;
(4)根据消失链路比率由逐年减小至基本保持不变,可得链路比率在基本不变之后的时间中断开的链路是真正意义上消失的链路,即由消失链路比率的定义得到消失链路的真实数据集ED
(5)基于链路预测中PA指标,设计出新的基于结构相似性的MPA模型计算两个目标节点之间的相似性;
(6)根据MPA模型的值的大小对当前网络所有节点对进行由小到大排序;
(7)根据排在前面的链路在未来消失的可能性越大,因此将这些链路作为预测得到的未来可能会消失的链路;
(8)根据AUC和精确度评估指标来衡量预测算法MPA的精确度,并与七种经典的基于结构相似性指标进行预测效果对比。
进一步地,所述的DBLP数据集描述的是计算机科学领域作者之间合作的关系,节点表作者,边表示合作关系;
所述的消失链路预测是指,在时间间隔[t0,t](t0<t)的无向网络G(V,E),其中V表示节点集合,E表示边集合,在当前t时刻节点x和节点y相连形成的链接,从t+1时刻开始一直持续到未来的时刻t′(t′>0)都是断开的,称这条链路xy为消失的链路,那些短暂消失后又重新产生连接的链路不是本专利所指的消失的链路;
所述的消失链路比率是指,每年消失链接数量占最大连通子图中链接数量的比率;
所述的PA指标是指,新链接产生于节点x和y之间的可能性正比于这两个节点的度的乘积,PA指标的计算如下:
Sxy=Sx x Sy=∑i∈τ(x)Wix x∑j∈τ(y)Wjy
其中,Sx是指节点x的度,Sy指节点y的度,τ(x)表示x的邻居节点,τ(y)表示y的邻居节点,W表示节点间的权重,Sxy表示PA指标的大小;
所述的MPA模型是指,在PA指标的基础上考虑了目标节点对的邻居链路类型的不同作用和链路的权重,把组成目标链路的节点对的邻居链路分为三类,包括:
1)L1:节点x和节点y直接相连的链接;
2)L2:节点x(或节点y)与它和节点y(或节点x)的共同邻居节点之间的链接;
3)L3:除上述两种链接之外的与目标节点相连的链接。
分别为L1,L2,L3添加一个参数用于控制不同类型链接在链接消失中的作用,并改写SX、Sy的计算公式:
Sx=λL1+μL2+νL3=λWxy+μ∑i∈τ(x)∩τ(y)Wix+ν∑j∈{τ(x)-τ(x)∩τ(y)-y}Wjx
Sy=λL1+μL2+νL3=λWxy+μ∑i∈τ(x)∩τ(y)Wix+ν∑k∈{τ(x)-τ(x)∩τ(y)-y}Wkx
其中,λ、μ、ν的取值为0或1,用于区分L1、L2、L3在消失链路预测中是否有贡献,根据L1,L2,L3七种组合方式下PA相似性的精确度,得出节点与共同邻居相连的链路在消失链路预测时具有消极影响,使用其倒数函数来削弱消除公共邻居链路L2的影响,设计出MPA模型;MPA模型的值的大小的计算如下:
其中,τ(x)表示x的邻居节点,τ(y)表示y的邻居节点,W表示权重。
所述的AUC是指,是从整体上衡量算法的精确性,在消失链路预测中可以理解为将消失链接集合ED中随机选择的一条链接与存在链接集合ER中随机选择的一条链接进行比较,如果消失链接集合中的链接的分数小于存在链接集合中链接的分数,则加1分;如果两个分数值相等,则加0.5分。独立比较m次中,如果消失链接集合中的链接的分数小于存在链接集合中链接的分数的次数为m`次,两分数值相等为m``次,则消失链路预测中AUC评估指标可以定义为:
所述的精确度是指,前L条预测边中被预测准确的链接所占的比例,即排在前L的链接中Ld条链接在消失链接集合中;精确度的计算为:
所述的经典的基于结构相似性指标,包含Common Neighbors(CN),Adamic-Adar(AA),Resource Allocation(RA),Preferential Attachment(PA),Local Path(LP),Katz和Random Walk with Restart(RWR)。
本发明的有益效果:本发明在PA指标的基础上考虑了节点对的邻居链路的不同作用和链路的权重,设计出MPA模型消除公共邻居链路对权重的负面影响,更快速准确的预测消失的链路。它从新的视角出发,为深入了解网络动态演化机制等网络科学问题提供新思路。
附图说明
图1为消失链路比率的示例图。
图2为目标节点对的邻居链路类型示例图。
具体实施方式
下面结合具体实施例对本发明所述技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
一种基于MPA模型的消失链路预测方法,步骤如下:
(1)建立无向科学合作网络
根据1990-1992年的DBLP数据集中的节点以及边的关系,构建无向科学合作网络;
(2)提取科学合作网络的最大连通子图(MCS);
(3)抽取接下来20年的MCS中学者的共同作者信息。即从1993到2012年的链接是否相连的数据。计算每年消失链路数比率,20年间消失链路比率如图1所示;
(4)根据从2007年开始消失链路比率几乎保持0.684不变,这就意味着MCS在15年后保持断开的链接几乎是真正意义上消失的链接。根据消失链路比率的定义得到消失链路的真实数据集ED
(5)基于链路预测中PA指标,考虑了目标节点对的邻居链路类型的不同作用和链路的权重,把组成目标链路的节点对的邻居链路分为三类,如图2所示,设计出新的基于结构相似性的MPA模型计算两个目标节点之间的相似性;MPA模型的值的大小计算公式如下:
(6)根据MPA值的大小对当前网络所有节点对进行由小到大排序;
(7)根据排在前面的链路在未来消失的可能性越大,因此将这些链路作为预测得到的未来可能会消失的链路;
(8)根据AUC和精确度两种评估指标来衡量预测算法MPA,并与七种经典的基于结构相似性指标在DBLP、PRA、PRB三个数据集上进行预测效果对比。分析AUC得出,这些实验结果都表明了在消失链路预测问题中MPA相比于其他七种指标具有最好或接近于最好的预测效果,并且具有很好的普适性;在精确度评估指标下,总体上MPA模型的精确度比其他七种的指标更好;这表明了本专利所提基于结构相似性的消失链路预测中MPA模型在预测网络中链接消失可能性上具有较大的优越性,它能够在消失链路预测问题中获得良好预测效果。

Claims (2)

1.一种基于MPA模型的消失链路预测方法,其特征在于,步骤如下:
(1)利用DBLP数据集构建无向科学合作网络,并提取无向科学合作网络的最大连通子图MCS;
所述的DBLP数据集描述的是计算机科学领域作者之间合作的关系,节点表示作者,边表示合作关系;
(2)在无向科学合作网络中给定消失链路预测的定义;
所述的消失链路预测是指,在时间间隔[t0,t]的无向网络G(V,E),其中V表示节点集合,E表示边集合,在当前t时刻节点x和节点y相连形成的链接,从t+1时刻开始一直持续到未来的时刻t′都是断开的,称这条链路xy为消失的链路;其中,t0<t,t′>0;那些短暂消失后又重新产生连接的链路不是所指的消失的链路;
(3)抽取接下来20年的MCS中学者的共同作者信息,即链路是否相连的数据,并计算每年消失链路数比率;
所述的消失链路比率是指,每年消失链接数量占最大连通子图中链接数量的比率;
(4)根据消失链路比率由逐年减小至基本保持不变,得链路比率在基本不变之后的时间中断开的链路是真正意义上消失的链路,即由消失链路比率的定义得到消失链路的真实数据集ED
(5)基于链路预测算法中PA指标,设计新的基于结构相似性的MPA模型,计算两个目标节点之间的相似性;
所述的PA指标是指,两个节点x和y之间产生一条新链路的可能性正比于这两个节点的度的乘积,PA指标的加权形式计算如下:
Sxy=Sx x Sy=∑i∈τ(x)Wix x∑j∈τ(y)Wjy
其中,Sx是指节点x的度,Sy指节点y的度,τ(x)表示x的邻居节点,τ(y)表示y的邻居节点,W表示节点间的权重,Sxy表示PA指标的大小;
所述的MPA模型是指,在PA指标的基础上考虑目标节点对的邻居链路类型的不同作用和链路的权重,把组成目标链路的节点对的邻居链路分为三类,包括:
1)L1:节点x和节点y直接相连的链接;
2)L2:节点x与它和节点y的共同邻居节点之间的链接;节点y与它和节点x的共同邻居节点之间的链接;
3)L3:除上述两种链接之外的与目标节点相连的链接;
分别为L1、L2、L3添加一个参数用于控制不同类型链接在链接消失中的作用,并改写Sx、Sy的计算公式:
Sx=λL1+μL2+νL3=λWxy+μ∑i∈τ(x)∩τ(y)Wix+ν∑j∈{τ(x)-τ(x)∩τ(y)-y}Wjx
Sy=λL1+μL2+νL3=λWxy+μ∑i∈τ(x)∩τ(y)Wix+ν∑k∈{τ(x)-τ(x)∩τ(y)-y}Wkx
其中,λ、μ、ν的取值为0或1,用于区分L1、L2、L3在消失链路预测中是否有贡献,根据L1、L2、L3七种组合方式下PA指标相似性的精确度,得出节点与共同邻居相连的链路在消失链路预测时具有消极影响,使用其倒数函数来削弱消除公共邻居链路L2的影响,设计出MPA模型;
MPA模型的值的大小的计算如下:
其中,Sη表示节点x或节点y的度,τ(x)表示x的邻居节点,τ(y)表示y的邻居节点,W表示权重;
(6)根据MPA模型的值的大小对当前网络所有节点对进行由小到大排序;根据排在前面的链路在未来消失的可能性越大,因此将这些链路作为预测得到的未来可能会消失的链路;根据AUC和精确度评估指标来衡量预测算法MPA的精确度,并与七种经典的基于结构相似性指标进行预测效果对比。
2.根据权利要求1所述的基于MPA模型的消失链路预测方法,其特征在于,所述的AUC是指,是从整体上衡量算法的精确性,在消失链路预测中理解为将消失链接集合ED中随机选择的一条链接与存在链接集合ER中随机选择的一条链接进行比较,如果消失链接集合中的链接的分数小于存在链接集合中链接的分数,则加1分;如果两个分数值相等,则加0.5分;独立比较m次中,如果消失链接集合中的链接的分数小于存在链接集合中链接的分数的次数为m`次,两分数值相等为m``次,则消失链路预测中AUC评估指标定义为:
所述的精确度是指,前L条预测边中被预测准确的链接所占的比例,即排在前L的链接中Ld条链接在消失链接集合中;精确度的计算为:
所述的经典的基于结构相似性指标,包含CN、AA、RA、PA、LP、Katz和RWR。
CN201811362632.7A 2018-11-16 2018-11-16 一种基于mpa模型的消失链路预测方法 Withdrawn CN109245952A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811362632.7A CN109245952A (zh) 2018-11-16 2018-11-16 一种基于mpa模型的消失链路预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811362632.7A CN109245952A (zh) 2018-11-16 2018-11-16 一种基于mpa模型的消失链路预测方法

Publications (1)

Publication Number Publication Date
CN109245952A true CN109245952A (zh) 2019-01-18

Family

ID=65074845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811362632.7A Withdrawn CN109245952A (zh) 2018-11-16 2018-11-16 一种基于mpa模型的消失链路预测方法

Country Status (1)

Country Link
CN (1) CN109245952A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112039700A (zh) * 2020-08-26 2020-12-04 重庆理工大学 基于层叠泛化和代价敏感学习的社交网链路异常预测方法
CN113079427A (zh) * 2021-04-28 2021-07-06 北京航空航天大学 基于网络演化模型的ason网络业务可用性评估方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106100870A (zh) * 2016-05-31 2016-11-09 武汉大学 一种基于链路预测的社会网络事件检测方法
CN106952167A (zh) * 2017-03-06 2017-07-14 浙江工业大学 一种基于多元线性回归的餐饮业好友连边影响力预测方法
CN107346333A (zh) * 2017-06-27 2017-11-14 浙江大学 一种基于链路预测的在线社交网络好友推荐方法与系统
KR20180091139A (ko) * 2017-02-06 2018-08-16 한국과학기술원 링크 예측 장치 및 방법
CN108449209A (zh) * 2018-03-17 2018-08-24 北京工业大学 基于路径信息和节点信息融合的社交网络好友推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106100870A (zh) * 2016-05-31 2016-11-09 武汉大学 一种基于链路预测的社会网络事件检测方法
KR20180091139A (ko) * 2017-02-06 2018-08-16 한국과학기술원 링크 예측 장치 및 방법
CN106952167A (zh) * 2017-03-06 2017-07-14 浙江工业大学 一种基于多元线性回归的餐饮业好友连边影响力预测方法
CN107346333A (zh) * 2017-06-27 2017-11-14 浙江大学 一种基于链路预测的在线社交网络好友推荐方法与系统
CN108449209A (zh) * 2018-03-17 2018-08-24 北京工业大学 基于路径信息和节点信息融合的社交网络好友推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BO XU 等: "Disappearing Link Prediction in Scientific Collaboration Networks", 《IEEE ACCESS》 *
吕琳媛: "复杂网络链路预测", 《电子科技大学学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112039700A (zh) * 2020-08-26 2020-12-04 重庆理工大学 基于层叠泛化和代价敏感学习的社交网链路异常预测方法
CN113079427A (zh) * 2021-04-28 2021-07-06 北京航空航天大学 基于网络演化模型的ason网络业务可用性评估方法
CN113079427B (zh) * 2021-04-28 2021-11-23 北京航空航天大学 基于网络演化模型的ason网络业务可用性评估方法

Similar Documents

Publication Publication Date Title
Marsden et al. Resnetcrowd: A residual deep learning architecture for crowd counting, violent behaviour detection and crowd density level classification
CN108319957A (zh) 一种基于超点图的大规模点云语义分割方法
Li et al. Self-thinning rule: a causal interpretation from ecological field theory
CN109583468A (zh) 训练样本获取方法,样本预测方法及对应装置
CN108038216A (zh) 信息处理方法、装置及服务器集群
CN104346481B (zh) 一种基于动态同步模型的社区检测方法
Gong et al. Novel heuristic density-based method for community detection in networks
CN109245952A (zh) 一种基于mpa模型的消失链路预测方法
Taghavian et al. A local immunization strategy for networks with overlapping community structure
CN108255706A (zh) 自动化测试脚本的编辑方法、装置、终端设备及存储介质
Awotunde Estimation of well test parameters using global optimization techniques
CN113255895A (zh) 基于图神经网络表示学习的结构图对齐方法和多图联合数据挖掘方法
CN109978050A (zh) 基于svm-rf的决策规则提取及约简方法
CN105488628A (zh) 一种面向电力大数据可视化的数据挖掘方法
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
CN110288097A (zh) 一种模型训练的方法以及相关装置
Xie et al. Tetradic motif profiles of horizontal visibility graphs
CN109543247A (zh) 基于nsga-ⅱ的模拟集成电路参数优化设计方法及装置
CN103955524A (zh) 一种基于超图模型的与事件相关的社会化图像查找算法
CN108764541A (zh) 一种结合时空特征和误差处理的风能预测方法
CN105069003A (zh) 一种基于转发链相似度的用户关注对象推荐计算方法
CN113034297A (zh) 基于节点吸引力的复杂网络关键节点识别方法及系统
Kashyap et al. Multi-objective metaheuristic search algorithms for service composition in IoT
CN104462480B (zh) 基于典型性的评论大数据挖掘方法
Dong et al. Research on the connection radius of dependency links in interdependent spatial networks against cascading failures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20190118

WW01 Invention patent application withdrawn after publication