CN107086933A - 一种基于贝叶斯估计和种子节点度的链路预测方法 - Google Patents

一种基于贝叶斯估计和种子节点度的链路预测方法 Download PDF

Info

Publication number
CN107086933A
CN107086933A CN201710366191.7A CN201710366191A CN107086933A CN 107086933 A CN107086933 A CN 107086933A CN 201710366191 A CN201710366191 A CN 201710366191A CN 107086933 A CN107086933 A CN 107086933A
Authority
CN
China
Prior art keywords
node
mrow
network
nodes
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710366191.7A
Other languages
English (en)
Other versions
CN107086933B (zh
Inventor
杨武略
杨旭华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201710366191.7A priority Critical patent/CN107086933B/zh
Publication of CN107086933A publication Critical patent/CN107086933A/zh
Application granted granted Critical
Publication of CN107086933B publication Critical patent/CN107086933B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于贝叶斯估计和种子节点度的链路预测方法,建立网络模型,任选两个未直接连接的节点作为种子节点,计算它们之间存在和不存在连边的概率,根据节点对之间长度为2或3路径中间节点的度信息,分别计算二节点之间产生和不产生连边的概率,根据贝叶斯估计和种子节点度信息,计算种子节点对之间长度为2和3路径每个中间节点的似然值,相似性分数为所有中间节点似然值之和,遍历网络,用上述方法得到任意两个未连接节点之间相似性分数,将所有未连接节点对按相似性分数降序排列,取前B个分数值对应的节点对为预测连边。本发明根据贝叶斯估计,结合种子节点度信息,区分种子节点长度为2或3路径中间节点对产生链路的贡献,算法预测效果好。

Description

一种基于贝叶斯估计和种子节点度的链路预测方法
技术领域
本发明涉及网络科学和链路预测领域,特别是指一种基于贝叶斯估计和种子节点度的链路预测方法。
背景技术
现实生活中的复杂系统可以使用复杂网络进行研究,网络中的节点代表复杂系统中的个体,连边代表系统中节点之间的相互关系。链路预测是复杂网络的重要研究领域之一,因为链路预测可以对网络的演化过程中节点之间可能产生的链路进行预测,所有可以提前预判出网络的演化趋势,并且可以判断出网络中并不存在的“幽灵边”,能够更好的帮助研究人员研究网络的内在规律。
链路预测问题受到研究人员的广泛关注。相比较而言,基于网络结构的链路预测算法相对于基于网络节点属性信息的预测算法更加可靠、准确。共同邻居(CN)算法是一种基于网络结构的经典链路预测算法,这种算法又被称为结构等价算法,即节点之间有很多的共同邻居节点,那么这两个节点就越相似,在CN算法的基础之上衍生出的链路预测算法有Salton算法、Jaccard算法、Sorenson算法、HPI(大度节点有利指标)、HDI(大度节点不利指标)、LHN-I算法、AA算法和RA算法等等,其中Salton算法又被称为余弦相似性算法,Sorenson算法常被用于生态学数据的研究,HPI算法常被用来分析新陈代谢网络的拓扑相似性,AA算法的思想是度小的共同邻居节点的贡献大于度大的共同邻居节点,RA算法是在AA算法的基础之上,受资源分配过程的启发而提出来的;基于路径的相似性算法,主要包括了局部路径指标(Local Path,LP)、Katz算法LHN-II算法,这些算法克服了CN算法使用的网络有效信息过少的缺点,从全局的角度利用网络的有效信息,因此,一定程度上提高了链路预测的精确性。
上述的一些经典算法主要考虑的是网络中的拓扑结构特性,即两个节点之间的网络特征越相似,那么这两个节点之间越有可能产生链路,这些方法在很多的网络中被证明是很有效果的,但是这些算法只是简单的统计了网络中节点对之间的中间节点的个数,并没有去区分每一个中间节点的作用。事实上很多网络中两个节点之间的中间节点对于节点对之间产生链路的作用存在很大的不同,不同的中间节点对于产生链路的贡献也是不相同的。传统的基于种子节点度的的链路预测方法并没有很好地区分中间节点的有效性。
发明内容
为了克服现有的基于种子节点度的链路预测方法没有很好地区分网络中任意两个没有直接连边的种子节点之间路径长度等于2和3的路径的中间节点对产生链路的贡献,本发明提出了一种准确度较高的基于贝叶斯估计和种子节点度的链路预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于贝叶斯估计和种子节点度的链路预测方法,包括以下步骤:
步骤一:建立网络模型G(V,E),V代表网络中的节点集合,E代表网络中的连边集合,网络的节点总数记为N,用U表示网络中节点对的集合,|U|=N(N-1)/2表示网络中节点对的总数;
步骤二:任意选取网络中的两个节点x和y作为种子节点,计算它们之间存在直接连边的可能性:
其中,|E|表示网络中实际存在的连边总数,A1表示x和y两个节点之间存在直接连边;
步骤三:计算网络中任意两个节点x和y之间不存在直接连边的概率:
其中,A0表示x和y两个节点之间不存在直接连边;
步骤四:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw的度信息,计算节点x和y之间产生连边的概率:
P(A1|Vw)=Cw
其中,Cw=2Ew/kw(kw-1),kw表示节点Vw的度数,Ew表示节点Vw的kw个邻居节点之间实际存在的边数;
步骤五:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw的度信息,计算节点x和y之间不产生连边的概率:
P(A0|Vw)=1-Cw
步骤六:根据贝叶斯估计的方法,计算节点x和y之间长度为2和3的路径的任意一个中间节点Vw的似然值
步骤七:对节点x和y之间长度为2和3的路径的每一个中间节点,重复步骤四至步骤六,计算每一个中间节点的似然值
步骤八:计算节点x和y的相似性分数:
其中Q表示节点x和y之间长度为2和3的所有路径中的所有中间节点的数量,kx表示节点x的度数,ky表示节点y的度数;
步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算所有未连接节点对之间的相似性分数,并按照相似性分数值从高到低排列顺序,取前B个相似性分数值对应的节点对为预测连边,其中,B为设定的一个正整数,B≤D,D为网络中所有未连接节点对的数量。
本发明的有益效果为:考虑网络中任意两个没有直接连边的种子节点的度信息和共同邻居,区分了种子节点之间路径长度为2或者3的路径的中间节点对这个种子节点对产生链路的贡献,提出了一种基于贝叶斯估计和种子节点度的链路预测方法,链路预测准确度较高。
附图说明
图1为网络中的任意一个不存在直接连边的节点对之间的不同中间节点对这个节点对之间产生链路的影响。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1,一种基于贝叶斯估计和种子节点度的链路预测方法,包括以下步骤:
步骤一:建立网络模型G(V,E),V代表网络中的节点集合,E代表网络中的连边集合,网络的节点总数记为N,用U表示网络中节点对的集合,|U|=N(N-1)/2表示网络中节点对的总数;
步骤二:任意选取网络中的两个节点x和y作为种子节点,即图1中黑色圆点表示,计算它们之间存在直接连边的可能性:
其中,|E|表示网络中实际存在的连边总数,A1表示x和y两个节点之间存在直接连边;
步骤三:计算网络中任意两个种子节点x和y之间不存在直接连边的概率,如图1所示:
其中,A0表示x和y两个节点之间不存在直接连边;
步骤四:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw(如图1所示)的度信息,计算节点x和y之间产生连边的概率:
P(A1|Vw)=Cw
其中,Cw=2Ew/kw(kw-1),kw表示节点Vw的度数,Ew表示节点Vw的kw个邻居节点之间实际存在的边数;
步骤五:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw(如图1所示)的度信息,计算节点x和y之间不产生连边的概率:
P(A0|Vw)=1-Cw
步骤六:根据贝叶斯估计的方法,计算节点x和y之间长度为2和3的路径的任意一个中间节点Vw的似然值
步骤七:对节点x和y之间长度为2和3的路径的每一个中间节点,重复步骤四至步骤六,计算每一个中间节点的似然值
步骤八:计算节点x和y的相似性分数:
其中Q表示节点x和y之间长度为2和3的所有路径中的所有中间节点的数量,kx表示节点x的度数,ky表示节点y的度数;
步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算所有未连接节点对之间的相似性分数,并按照相似性分数值从高到低排列顺序,取前B个相似性分数值对应的节点对为预测连边,其中,B为设定的一个正整数,B≤D,D为网络中所有未连接节点对的数量。
如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (1)

1.一种基于贝叶斯估计和种子节点度的链路预测方法,其特征在于:包括以下步骤:
步骤一:建立网络模型G(V,E),V代表网络中的节点集合,E代表网络中的连边集合,网络的节点总数记为N,用U表示网络中节点对的集合,|U|=N(N-1)/2表示网络中节点对的总数;
步骤二:任意选取网络中的两个节点x和y作为种子节点,计算它们之间存在直接连边的可能性:
<mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>A</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <mi>E</mi> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>U</mi> <mo>|</mo> </mrow> </mfrac> </mrow>
其中,|E|表示网络中实际存在的连边总数,A1表示x和y两个节点之间存在直接连边;
步骤三:计算网络中任意两个节点x和y之间不存在直接连边的概率:
<mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>A</mi> <mn>0</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <mi>U</mi> <mo>|</mo> <mo>-</mo> <mo>|</mo> <mi>E</mi> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>U</mi> <mo>|</mo> </mrow> </mfrac> </mrow>
其中,A0表示x和y两个节点之间不存在直接连边;
步骤四:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw的度信息,计算节点x和y之间产生连边的概率:
P(A1|Vw)=Cw
其中,Cw=2Ew/kw(kw-1),kw表示节点Vw的度数,Ew表示节点Vw的kw个邻居节点之间实际存在的边数;
步骤五:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw的度信息,计算节点x和y之间不产生连边的概率:
P(A0|Vw)=1-Cw
步骤六:根据贝叶斯估计的方法,计算节点x和y之间长度为2和3的路径的任意一个中间节点Vw的似然值
步骤七:对节点x和y之间长度为2和3的路径的每一个中间节点,重复步骤四至步骤六,计算每一个中间节点的似然值
步骤八:计算节点x和y的相似性分数:
其中Q表示节点x和y之间长度为2和3的所有路径中的所有中间节点的数量,kx表示节点x的度数,ky表示节点y的度数;
步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算所有未连接节点对之间的相似性分数,并按照相似性分数值从高到低排列顺序,取前B个相似性分数值对应的节点对为预测连边,其中,B为设定的一个正整数,B≤D,D为网络中所有未连接节点对的数量。
CN201710366191.7A 2017-05-23 2017-05-23 一种基于贝叶斯估计和种子节点度的链路预测方法 Expired - Fee Related CN107086933B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710366191.7A CN107086933B (zh) 2017-05-23 2017-05-23 一种基于贝叶斯估计和种子节点度的链路预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710366191.7A CN107086933B (zh) 2017-05-23 2017-05-23 一种基于贝叶斯估计和种子节点度的链路预测方法

Publications (2)

Publication Number Publication Date
CN107086933A true CN107086933A (zh) 2017-08-22
CN107086933B CN107086933B (zh) 2018-07-13

Family

ID=59607479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710366191.7A Expired - Fee Related CN107086933B (zh) 2017-05-23 2017-05-23 一种基于贝叶斯估计和种子节点度的链路预测方法

Country Status (1)

Country Link
CN (1) CN107086933B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966155A (zh) * 2021-03-23 2021-06-15 西安电子科技大学 基于路径相关性的链路预测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105162654A (zh) * 2015-08-25 2015-12-16 浙江工业大学 一种基于局部社团信息的链路预测方法
CN106100870A (zh) * 2016-05-31 2016-11-09 武汉大学 一种基于链路预测的社会网络事件检测方法
CN106327012A (zh) * 2016-08-23 2017-01-11 浙江工业大学 一种基于二阶局部社团和节点度信息的预测网络未知连边的方法
CN106330541A (zh) * 2016-08-23 2017-01-11 浙江工业大学 一种基于二阶局部社团和偏好连接的预测网络未知连边的方法
CN106326637A (zh) * 2016-08-10 2017-01-11 浙江工业大学 一种基于局部有效路径度的链路预测方法
CN106330534A (zh) * 2016-08-19 2017-01-11 上海电机学院 一种基于Benefit Ranks在加权网络上链路预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105162654A (zh) * 2015-08-25 2015-12-16 浙江工业大学 一种基于局部社团信息的链路预测方法
CN106100870A (zh) * 2016-05-31 2016-11-09 武汉大学 一种基于链路预测的社会网络事件检测方法
CN106326637A (zh) * 2016-08-10 2017-01-11 浙江工业大学 一种基于局部有效路径度的链路预测方法
CN106330534A (zh) * 2016-08-19 2017-01-11 上海电机学院 一种基于Benefit Ranks在加权网络上链路预测方法
CN106327012A (zh) * 2016-08-23 2017-01-11 浙江工业大学 一种基于二阶局部社团和节点度信息的预测网络未知连边的方法
CN106330541A (zh) * 2016-08-23 2017-01-11 浙江工业大学 一种基于二阶局部社团和偏好连接的预测网络未知连边的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吕琳媛: "复杂网络链路预测", 《电子科技大学学报》 *
杨旭华,凌非: "一种基于局部社团和全局信息的链路预测算法", 《浙江工业大学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966155A (zh) * 2021-03-23 2021-06-15 西安电子科技大学 基于路径相关性的链路预测方法
CN112966155B (zh) * 2021-03-23 2023-03-21 西安电子科技大学 基于路径相关性的链路预测方法

Also Published As

Publication number Publication date
CN107086933B (zh) 2018-07-13

Similar Documents

Publication Publication Date Title
CN110532436B (zh) 基于社区结构的跨社交网络用户身份识别方法
US9947060B2 (en) Information matching and match validation
CN104966125B (zh) 一种社交网络的物品评分及推荐方法
CN103514304B (zh) 一种项目推荐方法和装置
CN105162654B (zh) 一种基于局部社团信息的链路预测方法
CN110826164B (zh) 一种基于局部和全局连通性的复杂网络节点重要度评估方法
Marsa-Maestre et al. Effective bidding and deal identification for negotiations in highly nonlinear scenarios
CN105574191A (zh) 在线社会网络多源点信息溯源系统及其方法
CN106326637A (zh) 一种基于局部有效路径度的链路预测方法
CN105354260A (zh) 一种融合社会网络和项目特征的移动应用推荐方法
CN107945037A (zh) 一种基于节点结构特征的社交网络去匿名化方法
CN102819611B (zh) 一种复杂网络局部社区挖掘方法
CN107332687A (zh) 一种基于贝叶斯估计和共同邻居的链路预测方法
CN111475739A (zh) 一种基于元路径的异质社交网络用户锚链接识别方法
CN107018027A (zh) 一种基于贝叶斯估计和共同邻居节点度的链路预测方法
Zheng et al. Jora: Weakly supervised user identity linkage via jointly learning to represent and align
Yang et al. Multi-attribute ranking method for identifying key nodes in complex networks based on GRA
CN107086933B (zh) 一种基于贝叶斯估计和种子节点度的链路预测方法
CN109857928A (zh) 基于多元信用评估的用户偏好预测方法
CN107231252A (zh) 一种基于贝叶斯估计和种子节点邻居集合的链路预测方法
CN107193954A (zh) 一种基于贝叶斯估计和局部路径的链路预测方法
CN107135107A (zh) 一种基于贝叶斯估计和大度节点不利的链路预测方法
CN107194069A (zh) 一种基于贝叶斯估计和大度节点有利的链路预测方法
CN109361556A (zh) 一种基于节点熵和结构洞的关键节点感知方法
CN110599358B (zh) 一种基于概率因子图模型的跨社交网络用户身份关联方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180713

Termination date: 20190523