CN107086933A - 一种基于贝叶斯估计和种子节点度的链路预测方法 - Google Patents
一种基于贝叶斯估计和种子节点度的链路预测方法 Download PDFInfo
- Publication number
- CN107086933A CN107086933A CN201710366191.7A CN201710366191A CN107086933A CN 107086933 A CN107086933 A CN 107086933A CN 201710366191 A CN201710366191 A CN 201710366191A CN 107086933 A CN107086933 A CN 107086933A
- Authority
- CN
- China
- Prior art keywords
- node
- mrow
- network
- nodes
- length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于贝叶斯估计和种子节点度的链路预测方法,建立网络模型,任选两个未直接连接的节点作为种子节点,计算它们之间存在和不存在连边的概率,根据节点对之间长度为2或3路径中间节点的度信息,分别计算二节点之间产生和不产生连边的概率,根据贝叶斯估计和种子节点度信息,计算种子节点对之间长度为2和3路径每个中间节点的似然值,相似性分数为所有中间节点似然值之和,遍历网络,用上述方法得到任意两个未连接节点之间相似性分数,将所有未连接节点对按相似性分数降序排列,取前B个分数值对应的节点对为预测连边。本发明根据贝叶斯估计,结合种子节点度信息,区分种子节点长度为2或3路径中间节点对产生链路的贡献,算法预测效果好。
Description
技术领域
本发明涉及网络科学和链路预测领域,特别是指一种基于贝叶斯估计和种子节点度的链路预测方法。
背景技术
现实生活中的复杂系统可以使用复杂网络进行研究,网络中的节点代表复杂系统中的个体,连边代表系统中节点之间的相互关系。链路预测是复杂网络的重要研究领域之一,因为链路预测可以对网络的演化过程中节点之间可能产生的链路进行预测,所有可以提前预判出网络的演化趋势,并且可以判断出网络中并不存在的“幽灵边”,能够更好的帮助研究人员研究网络的内在规律。
链路预测问题受到研究人员的广泛关注。相比较而言,基于网络结构的链路预测算法相对于基于网络节点属性信息的预测算法更加可靠、准确。共同邻居(CN)算法是一种基于网络结构的经典链路预测算法,这种算法又被称为结构等价算法,即节点之间有很多的共同邻居节点,那么这两个节点就越相似,在CN算法的基础之上衍生出的链路预测算法有Salton算法、Jaccard算法、Sorenson算法、HPI(大度节点有利指标)、HDI(大度节点不利指标)、LHN-I算法、AA算法和RA算法等等,其中Salton算法又被称为余弦相似性算法,Sorenson算法常被用于生态学数据的研究,HPI算法常被用来分析新陈代谢网络的拓扑相似性,AA算法的思想是度小的共同邻居节点的贡献大于度大的共同邻居节点,RA算法是在AA算法的基础之上,受资源分配过程的启发而提出来的;基于路径的相似性算法,主要包括了局部路径指标(Local Path,LP)、Katz算法LHN-II算法,这些算法克服了CN算法使用的网络有效信息过少的缺点,从全局的角度利用网络的有效信息,因此,一定程度上提高了链路预测的精确性。
上述的一些经典算法主要考虑的是网络中的拓扑结构特性,即两个节点之间的网络特征越相似,那么这两个节点之间越有可能产生链路,这些方法在很多的网络中被证明是很有效果的,但是这些算法只是简单的统计了网络中节点对之间的中间节点的个数,并没有去区分每一个中间节点的作用。事实上很多网络中两个节点之间的中间节点对于节点对之间产生链路的作用存在很大的不同,不同的中间节点对于产生链路的贡献也是不相同的。传统的基于种子节点度的的链路预测方法并没有很好地区分中间节点的有效性。
发明内容
为了克服现有的基于种子节点度的链路预测方法没有很好地区分网络中任意两个没有直接连边的种子节点之间路径长度等于2和3的路径的中间节点对产生链路的贡献,本发明提出了一种准确度较高的基于贝叶斯估计和种子节点度的链路预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于贝叶斯估计和种子节点度的链路预测方法,包括以下步骤:
步骤一:建立网络模型G(V,E),V代表网络中的节点集合,E代表网络中的连边集合,网络的节点总数记为N,用U表示网络中节点对的集合,|U|=N(N-1)/2表示网络中节点对的总数;
步骤二:任意选取网络中的两个节点x和y作为种子节点,计算它们之间存在直接连边的可能性:
其中,|E|表示网络中实际存在的连边总数,A1表示x和y两个节点之间存在直接连边;
步骤三:计算网络中任意两个节点x和y之间不存在直接连边的概率:
其中,A0表示x和y两个节点之间不存在直接连边;
步骤四:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw的度信息,计算节点x和y之间产生连边的概率:
P(A1|Vw)=Cw
其中,Cw=2Ew/kw(kw-1),kw表示节点Vw的度数,Ew表示节点Vw的kw个邻居节点之间实际存在的边数;
步骤五:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw的度信息,计算节点x和y之间不产生连边的概率:
P(A0|Vw)=1-Cw;
步骤六:根据贝叶斯估计的方法,计算节点x和y之间长度为2和3的路径的任意一个中间节点Vw的似然值
步骤七:对节点x和y之间长度为2和3的路径的每一个中间节点,重复步骤四至步骤六,计算每一个中间节点的似然值
步骤八:计算节点x和y的相似性分数:
其中Q表示节点x和y之间长度为2和3的所有路径中的所有中间节点的数量,kx表示节点x的度数,ky表示节点y的度数;
步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算所有未连接节点对之间的相似性分数,并按照相似性分数值从高到低排列顺序,取前B个相似性分数值对应的节点对为预测连边,其中,B为设定的一个正整数,B≤D,D为网络中所有未连接节点对的数量。
本发明的有益效果为:考虑网络中任意两个没有直接连边的种子节点的度信息和共同邻居,区分了种子节点之间路径长度为2或者3的路径的中间节点对这个种子节点对产生链路的贡献,提出了一种基于贝叶斯估计和种子节点度的链路预测方法,链路预测准确度较高。
附图说明
图1为网络中的任意一个不存在直接连边的节点对之间的不同中间节点对这个节点对之间产生链路的影响。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1,一种基于贝叶斯估计和种子节点度的链路预测方法,包括以下步骤:
步骤一:建立网络模型G(V,E),V代表网络中的节点集合,E代表网络中的连边集合,网络的节点总数记为N,用U表示网络中节点对的集合,|U|=N(N-1)/2表示网络中节点对的总数;
步骤二:任意选取网络中的两个节点x和y作为种子节点,即图1中黑色圆点表示,计算它们之间存在直接连边的可能性:
其中,|E|表示网络中实际存在的连边总数,A1表示x和y两个节点之间存在直接连边;
步骤三:计算网络中任意两个种子节点x和y之间不存在直接连边的概率,如图1所示:
其中,A0表示x和y两个节点之间不存在直接连边;
步骤四:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw(如图1所示)的度信息,计算节点x和y之间产生连边的概率:
P(A1|Vw)=Cw
其中,Cw=2Ew/kw(kw-1),kw表示节点Vw的度数,Ew表示节点Vw的kw个邻居节点之间实际存在的边数;
步骤五:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw(如图1所示)的度信息,计算节点x和y之间不产生连边的概率:
P(A0|Vw)=1-Cw;
步骤六:根据贝叶斯估计的方法,计算节点x和y之间长度为2和3的路径的任意一个中间节点Vw的似然值
步骤七:对节点x和y之间长度为2和3的路径的每一个中间节点,重复步骤四至步骤六,计算每一个中间节点的似然值
步骤八:计算节点x和y的相似性分数:
其中Q表示节点x和y之间长度为2和3的所有路径中的所有中间节点的数量,kx表示节点x的度数,ky表示节点y的度数;
步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算所有未连接节点对之间的相似性分数,并按照相似性分数值从高到低排列顺序,取前B个相似性分数值对应的节点对为预测连边,其中,B为设定的一个正整数,B≤D,D为网络中所有未连接节点对的数量。
如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。
Claims (1)
1.一种基于贝叶斯估计和种子节点度的链路预测方法,其特征在于:包括以下步骤:
步骤一:建立网络模型G(V,E),V代表网络中的节点集合,E代表网络中的连边集合,网络的节点总数记为N,用U表示网络中节点对的集合,|U|=N(N-1)/2表示网络中节点对的总数;
步骤二:任意选取网络中的两个节点x和y作为种子节点,计算它们之间存在直接连边的可能性:
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>A</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<mo>|</mo>
<mi>E</mi>
<mo>|</mo>
</mrow>
<mrow>
<mo>|</mo>
<mi>U</mi>
<mo>|</mo>
</mrow>
</mfrac>
</mrow>
其中,|E|表示网络中实际存在的连边总数,A1表示x和y两个节点之间存在直接连边;
步骤三:计算网络中任意两个节点x和y之间不存在直接连边的概率:
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>A</mi>
<mn>0</mn>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<mo>|</mo>
<mi>U</mi>
<mo>|</mo>
<mo>-</mo>
<mo>|</mo>
<mi>E</mi>
<mo>|</mo>
</mrow>
<mrow>
<mo>|</mo>
<mi>U</mi>
<mo>|</mo>
</mrow>
</mfrac>
</mrow>
其中,A0表示x和y两个节点之间不存在直接连边;
步骤四:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw的度信息,计算节点x和y之间产生连边的概率:
P(A1|Vw)=Cw
其中,Cw=2Ew/kw(kw-1),kw表示节点Vw的度数,Ew表示节点Vw的kw个邻居节点之间实际存在的边数;
步骤五:根据节点x和y之间长度为2或者3的路径的一个中间节点Vw的度信息,计算节点x和y之间不产生连边的概率:
P(A0|Vw)=1-Cw;
步骤六:根据贝叶斯估计的方法,计算节点x和y之间长度为2和3的路径的任意一个中间节点Vw的似然值
步骤七:对节点x和y之间长度为2和3的路径的每一个中间节点,重复步骤四至步骤六,计算每一个中间节点的似然值
步骤八:计算节点x和y的相似性分数:
其中Q表示节点x和y之间长度为2和3的所有路径中的所有中间节点的数量,kx表示节点x的度数,ky表示节点y的度数;
步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算所有未连接节点对之间的相似性分数,并按照相似性分数值从高到低排列顺序,取前B个相似性分数值对应的节点对为预测连边,其中,B为设定的一个正整数,B≤D,D为网络中所有未连接节点对的数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710366191.7A CN107086933B (zh) | 2017-05-23 | 2017-05-23 | 一种基于贝叶斯估计和种子节点度的链路预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710366191.7A CN107086933B (zh) | 2017-05-23 | 2017-05-23 | 一种基于贝叶斯估计和种子节点度的链路预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107086933A true CN107086933A (zh) | 2017-08-22 |
CN107086933B CN107086933B (zh) | 2018-07-13 |
Family
ID=59607479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710366191.7A Expired - Fee Related CN107086933B (zh) | 2017-05-23 | 2017-05-23 | 一种基于贝叶斯估计和种子节点度的链路预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107086933B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966155A (zh) * | 2021-03-23 | 2021-06-15 | 西安电子科技大学 | 基于路径相关性的链路预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105162654A (zh) * | 2015-08-25 | 2015-12-16 | 浙江工业大学 | 一种基于局部社团信息的链路预测方法 |
CN106100870A (zh) * | 2016-05-31 | 2016-11-09 | 武汉大学 | 一种基于链路预测的社会网络事件检测方法 |
CN106330541A (zh) * | 2016-08-23 | 2017-01-11 | 浙江工业大学 | 一种基于二阶局部社团和偏好连接的预测网络未知连边的方法 |
CN106330534A (zh) * | 2016-08-19 | 2017-01-11 | 上海电机学院 | 一种基于Benefit Ranks在加权网络上链路预测方法 |
CN106326637A (zh) * | 2016-08-10 | 2017-01-11 | 浙江工业大学 | 一种基于局部有效路径度的链路预测方法 |
CN106327012A (zh) * | 2016-08-23 | 2017-01-11 | 浙江工业大学 | 一种基于二阶局部社团和节点度信息的预测网络未知连边的方法 |
-
2017
- 2017-05-23 CN CN201710366191.7A patent/CN107086933B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105162654A (zh) * | 2015-08-25 | 2015-12-16 | 浙江工业大学 | 一种基于局部社团信息的链路预测方法 |
CN106100870A (zh) * | 2016-05-31 | 2016-11-09 | 武汉大学 | 一种基于链路预测的社会网络事件检测方法 |
CN106326637A (zh) * | 2016-08-10 | 2017-01-11 | 浙江工业大学 | 一种基于局部有效路径度的链路预测方法 |
CN106330534A (zh) * | 2016-08-19 | 2017-01-11 | 上海电机学院 | 一种基于Benefit Ranks在加权网络上链路预测方法 |
CN106330541A (zh) * | 2016-08-23 | 2017-01-11 | 浙江工业大学 | 一种基于二阶局部社团和偏好连接的预测网络未知连边的方法 |
CN106327012A (zh) * | 2016-08-23 | 2017-01-11 | 浙江工业大学 | 一种基于二阶局部社团和节点度信息的预测网络未知连边的方法 |
Non-Patent Citations (2)
Title |
---|
吕琳媛: "复杂网络链路预测", 《电子科技大学学报》 * |
杨旭华,凌非: "一种基于局部社团和全局信息的链路预测算法", 《浙江工业大学学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966155A (zh) * | 2021-03-23 | 2021-06-15 | 西安电子科技大学 | 基于路径相关性的链路预测方法 |
CN112966155B (zh) * | 2021-03-23 | 2023-03-21 | 西安电子科技大学 | 基于路径相关性的链路预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107086933B (zh) | 2018-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Link prediction in social networks based on hypergraph | |
CN104966125B (zh) | 一种社交网络的物品评分及推荐方法 | |
CN103514304B (zh) | 一种项目推荐方法和装置 | |
TW201717071A (zh) | 推薦方法及裝置 | |
CN110213164B (zh) | 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 | |
CN105162654B (zh) | 一种基于局部社团信息的链路预测方法 | |
CN107590139B (zh) | 一种基于循环矩阵翻译的知识图谱表示学习方法 | |
CN105574191A (zh) | 在线社会网络多源点信息溯源系统及其方法 | |
CN115270007B (zh) | 一种基于混合图神经网络的poi推荐方法及系统 | |
Li et al. | Hypergraph transformer neural networks | |
Ghalmane et al. | Betweenness centrality for networks with non-overlapping community structure | |
CN102819611B (zh) | 一种复杂网络局部社区挖掘方法 | |
CN107332687A (zh) | 一种基于贝叶斯估计和共同邻居的链路预测方法 | |
CN111475739A (zh) | 一种基于元路径的异质社交网络用户锚链接识别方法 | |
CN107018027A (zh) | 一种基于贝叶斯估计和共同邻居节点度的链路预测方法 | |
CN113361928B (zh) | 一种基于异构图注意力网络的众包任务推荐方法 | |
Yang et al. | Multi-attribute ranking method for identifying key nodes in complex networks based on GRA | |
CN107086933B (zh) | 一种基于贝叶斯估计和种子节点度的链路预测方法 | |
CN109857928A (zh) | 基于多元信用评估的用户偏好预测方法 | |
CN104063479B (zh) | 一种基于社会网络的品牌网络热度计算方法 | |
CN107231252A (zh) | 一种基于贝叶斯估计和种子节点邻居集合的链路预测方法 | |
CN107193954A (zh) | 一种基于贝叶斯估计和局部路径的链路预测方法 | |
CN107135107A (zh) | 一种基于贝叶斯估计和大度节点不利的链路预测方法 | |
CN110377841A (zh) | 一种应用在协同过滤方法中的相似度计算方法及系统 | |
CN107194069A (zh) | 一种基于贝叶斯估计和大度节点有利的链路预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180713 Termination date: 20190523 |