CN113518010A - 一种链路预测方法、装置及存储介质 - Google Patents

一种链路预测方法、装置及存储介质 Download PDF

Info

Publication number
CN113518010A
CN113518010A CN202110788369.3A CN202110788369A CN113518010A CN 113518010 A CN113518010 A CN 113518010A CN 202110788369 A CN202110788369 A CN 202110788369A CN 113518010 A CN113518010 A CN 113518010A
Authority
CN
China
Prior art keywords
node
influence
representing
target node
common neighbor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110788369.3A
Other languages
English (en)
Other versions
CN113518010B (zh
Inventor
曾琳奕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110788369.3A priority Critical patent/CN113518010B/zh
Publication of CN113518010A publication Critical patent/CN113518010A/zh
Application granted granted Critical
Publication of CN113518010B publication Critical patent/CN113518010B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例涉及大数据技术领域,具体公开了一种链路预测方法、装置及存储介质,所述方法包括:获取指定网络中任一待链接预测的节点对,作为目标节点对;提取目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力;其中,共同邻居共享影响力利用目标节点对的共同邻居节点的度表征;共同邻居分散影响力利用目标节点对的共同邻居节点所在的最短路径数表征;节点间影响力利用目标节点对的各共同邻居节点的相似性表征;根据目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力对所述目标节点对进行链接预测,以基于链接预测结果确定指定网络中节点对间的链路关系,进而提高网络链路预测的准确性及稳定性。

Description

一种链路预测方法、装置及存储介质
技术领域
本说明书涉及大数据技术领域,特别地,涉及一种链路预测方法、装置及存储介质。
背景技术
链路预测的目标是基于过去的网络节点以及网络结构等信息来预测网络中每个节点对之间是否存在链路。链接预测是一个出现在许多研究领域的数据挖掘问题,社交网络朋友推荐则是链路预测算法最典型的一个应用,将用户看作社交网络中的节点,则用户间的朋友关系就是网络中的链路,节点对间的影响力指标也就是朋友间的影响力指标。
解决链路预测问题最有效的算法是评分方法。在评分方法中,定义了测量网络节点之间相似度的多个评分函数。对于需要预测的网络中的每个链接,评分函数为该链接分配一定的分数,假设预先设定链接数量为n,则选取链接分数最高的n条作为预测存在的链路。评分函数可以以各种方式定义,其中基于普通邻居的定义是最普遍的。如AA预测算法、SA预测算法、以及Salton、Jaccard、Sorenson、HPI、HDI、LHN和RA等。现有共同邻居方法的基本思想是共同邻居的数量代表链路形成的可能性。然而,这些算法仅以粗略和笼统的方式描绘了共同邻居的特征,没有综合地刻画共同邻居对要预测链路的影响力大小,影响了预测结果的准确性。
发明内容
本说明书实施例的目的在于提供一种链路预测方法、装置及存储介质,可以提高网络链路预测的准确性及稳定性。
本说明书提供一种链路预测方法、装置及存储介质是包括如下方式实现的:
一种链路预测方法,应用于服务器,所述方法包括:获取指定网络中任一待链接预测的节点对,作为目标节点对;提取所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力;其中,所述共同邻居共享影响力利用所述目标节点对的共同邻居节点的度表征;所述共同邻居分散影响力利用所述目标节点对的共同邻居节点所在的最短路径数表征;所述节点间影响力利用所述目标节点对的共同邻居节点的相似性表征;根据所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力对所述目标节点对进行链接预测,以基于链接预测结果确定所述指定网络中节点对间的链路关系。
另一方面,本说明书实施例提供一种链路预测装置,应用于服务器,所述装置包括:获取模块,用于获取指定网络中任一待链接预测的节点对,作为目标节点对;提取模块,用于提取所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力;其中,所述共同邻居共享影响力利用所述目标节点对的共同邻居节点的度表征;所述共同邻居分散影响力利用所述目标节点对的共同邻居节点所在的最短路径数表征;所述节点间影响力利用所述目标节点对的共同邻居节点的相似性表征;预测模块,用于根据所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力对所述目标节点对进行链接预测,以基于链接预测结果确定所述指定网络中节点对间的链路关系。
另一方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现上述任意一个或者多个实施例所述方法的步骤。
本说明书一个或多个实施例提供的链路预测方法、装置及存储介质,通过进一步考虑传输损耗来确定共同邻居共享影响力可以使得影响力的确定更加符合相应的应用场景,提高链接预测的准确性。同时,进一步考虑共同邻居影响力的分散,可以使得共同邻居节点的外部影响分析更加全面,进一步保证链接预测的准确性。此外,还进一步考虑了节点对的节点间影响,从三元结构的内部稳定性来反映节点对的链接可能性,可以使得链接预测更加稳定。再进一步组合上述链接预测方式,可以使得节点对链接预测更加稳定准确。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本说明书提供的三元闭合结构示意图;
图2为本说明书提供的链路预测方法的实施流程示意图;
图3为本说明书提供的链路预测装置的模块结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是说明书一部分实施例,而不是全部的实施例。基于说明书一个或多个实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书实施例方案保护的范围。
本说明书提供的一个场景示例中,如图1所示,P与O各代表一个人,X是第三者或态度对象,P如果喜欢O,那么他们将以相同的态度看待X,此时认知体系呈现平衡状态,这也可以扩展到人(X),从而引入三元闭合结构。即,如果一个人P认识X和O,则X倾向于认识O,这也反映了邻居对链接的影响。相应的,本场景示例基于三元闭合结构中节点间的影响,提出了三个节点间的影响力评价指标和一种综合链路预测方法。可以将待链接的两个节点X和O,作为目标节点对,将与目标节点对分别存在直接链接关系的节点P,作为目标节点对的共同邻居节点,以基于共同邻居节点对目标节点对的影响力大小,来预测目标节点对之间存在链接的可能性。
本场景示例中,从共享影响力以及影响力分散两个维度综合评价共同邻居节点对目标节点对链接的影响,并进一步结合目标节点对的各共同邻居节点间相似性特征来预测目标节点间的链接可能性,可以进一步提高目标节点间链接预测的准确性以及稳定性,进而提高网络的链路关系预测的准确性。
所述链路预测方法可以应用于服务器,所述服务器可以是指单个服务器或者多个服务器组成的服务器集群。服务器可以获取指定网络。所述指定网络可以为待预测的任一网络,如航空运输网络、金融业务网络等。指定网络可以采用多种信息形式表征,如可以采用信息集的方式,也可以采用图谱的方式,这里不做限定。服务器可以将所述指定网络中任一待链接预测的节点对,作为目标节点对。
服务器可以分别提取所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力。其中,所述共同邻居共享影响力可以利用所述目标节点对的共同邻居节点的度表征。所述共同邻居分散影响力可以利用所述目标节点对的共同邻居节点所在的最短路径数表征。所述节点间影响力可以利用所述目标节点对的各共同邻居节点的相似性表征。
共同邻居节点向与其链接的每个节点对分配的影响力大小通常与该共同邻居节点的度有关,可以将共同邻居节点的影响力根据该共同邻居节点的度均匀分配给与该共同邻居节点链接的每个节点对。相应的,本场景示例中,服务器可以先获取目标节点对所对应的共同邻居节点,再基于共同邻居节点的度来确定相应共同邻居节点向该目标节点对分配的影响力,进而综合目标节点对所对应的各共同邻居节点向该目标节点对分配的影响力,确定所述目标节点对的共同邻居共享影响力。例如,所述共同邻居共享影响力可以采用下述方式确定:
Figure BDA0003159860920000041
其中,
Figure BDA0003159860920000042
表示目标节点对x和y的共同邻居共享影响力,z表示目标节点对x和y的共同邻居节点,Γ(x)表示与节点x直接链接的节点所形成的集合,Γ(y)表示与节点y直接链接的节点所形成的集合,kz代表节点z的度。
进一步,本场景示例中,还可以进一步考虑共同邻居节点的影响力传输损耗,确定目标节点对的共同邻居共享影响力。相应的,一些实施方式中,所述共同邻居共享影响力可以采用下述方式确定:
Figure BDA0003159860920000043
其中,
Figure BDA0003159860920000044
表示考虑传输损耗所得到的目标节点对x和y的共同邻居共享影响力,γ表示影响力传输损耗。可以从指定网络中抽取已知链接关系的节点作为样本数据,利用样本数据来确定该指定网络所对应的影响力传输损耗。或者,在指定网络的样本数据量较少的情况下,也可以参考与所述指定网络应用场景类似的网络的影响力传输损耗,确定该指定网络所对应的影响力传输损耗。当然,也可以根据需要采用其他的方式确定所述指定网络所对应的影响力传输损耗。
节点特征通常可以包括节点属性、节点间链接属性、节点链接特征等特征类型。如对于金融业务网络,节点属性可以包括节点对应的用户属性(如用户类型、用户财产情况等等),节点间链接属性如可以包括借贷、担保、投资等等,节点链接特征如可以包括节点的度等。由此可见,仅仅通过节点链接特征无法全面地表征节点特征,使得仅基于共同邻居节点的度来确定共同邻居节点分配至与目标节点对的影响力,预测结果的准确性较难保证。本场景示例中,通过进一步考虑指定网络的应用场景数据来确定共同邻居节点的影响力传输损耗,对各共同邻居节点基于节点的度分配至目标节点对的影响力进行调整,可以使得影响力分配更加准确,进一步提高节点间链接预测的准确性。
可以采用AUC(area under the receiver operating characteristic curve)作为衡量链路预测精度的标准,评估上述考虑影响力传输损耗后的链路预测的准确性。为了便于表述,可以将本场景示例上述考虑影响力传输损耗后的链路预测方法描述为ISS算法。
AUC可以理解为随机选择测试集中的一条连边,将其与一条随机选择的不存在的边比较分数值,在m次独立的比较中,如果测试集中的边评分高的次数有m1次,那么AUC值为:
Figure BDA0003159860920000051
当网络规模较大,通过这种随机抽样方式得到的AUC值可降低计算复杂度,提高计算效率。显然AUC值越大,算法准确度越高。
进一步应用假设检验方法来验证上述考虑影响力传输损耗后的链路预测的准确性。使用五个真实的复杂网络数据,(1)Celegans:神经网络由线虫蠕虫C.elegans组成,神经元数量和连接数分别为297和2148;(2)爵士乐:一个音乐合作网络,包含1912至1940年间的198个乐队;(3)Netscience:由研究网络科学主题的科学家组成的共同合作网络,这个网络包括379名科学家;(4)Political blogs:美国政治博客网络,最初的链接是有向的,本场景示例中将其视为无向的;(5)USAir:美国航空运输网络,其中包含332个机场和2126个航空公司。
详细的网络结构特征如表1所示,其中N表示网络中节点的数量,E表示边的数量,H代表度异质性,用
Figure BDA0003159860920000052
表示,其中(k)代表平均度,R代表度相关系数,C为聚类系数,D为平均最短路径长度。对5个不同的网络应用100次独立实验,得到CN、Jaccard、PA、AA和ISS算法的不同AUC值。实验结果表明,每组AUC值均符合正态分布。进一步使用假设检验方法来找出每个预测算法的阈值μ,即通过统计检验发现算法精度的下限。选择显著性水平P值为0.05,假设右侧检验H0:a≤μ,H1:a>μ,如果右侧检验的显著性水平p<0.1(因为它是单尾检验),那么应该拒绝H0并接受H1。然后使用穷举方法,通过使p几乎无限接近0.1,得到每个阈值μ(μ保留四位小数),由此可得到每个预测算法的阈值μ,如表2所示。从表2可以看出,五种算法的阈值相对较大,而在所有网络测试中,ISS算法的阈值最大,由此可见,与所有测试中的其他算法相比,ISS算法效果最好。
表1
Figure BDA0003159860920000061
表2
Figure BDA0003159860920000062
可以进一步利用所述目标节点对对应的共同邻居节点所在的最短路径数来确定所述目标节点对的共同邻居分散影响力。根据网络结构,共同邻居节点沿最短路径到网络中的其他节点的距离,决定了共同邻居节点分配给网络中其他节点的影响力大小。相应的,共同邻居节点所在的最短路径越少,影响力的分散度越小,对要预测的目标节点对的分配影响则越大。通过进一步考虑影响力的分散来确定各共同邻居节点作用到目标节点对的影响力大小,可以使得目标节点对的链接预测更加准确。
一些实施方式中,可以利用共同邻居节点的介数来表征其所在的最短路径的数量,进而表征相应共同邻居节点的影响力的分散程度,以实现共同邻居节点的所在的最短路径的数量的准确定量表征。相应的,可以利用下述公式(4)来确定所述目标节点对的共同邻居分散影响力:
Figure BDA0003159860920000071
其中,
Figure BDA0003159860920000072
表示目标节点对x和y的共同邻居分散影响力,z表示目标节点对x和y的共同邻居节点,Γ(x)表示与节点x直接链接的节点所形成的集合,Γ(y)表示与节点y直接链接的节点所形成的集合,σst表示从节点s到节点t的最短路径的总数,
Figure BDA0003159860920000073
表示从节点s到节点t的最短路径中经过节点z的路径数量。当然,也可以根据需要选择其他的方式表征共同邻居节点所在的最短路径的数量。
为了便于表述,可以将基于共同邻居分散影响力来预测目标节点对的链接可能性的方法描述为DCNI算法。类似地,可以基于上述提到的网络数据使用假设检验的方法来证明DCNI算法的准确性。实验结果如表2所示,从表2中可以看出,除了NetScience和Celegans,其他网络的DCNI算法阈值最大,在NetScience中,DCNI的阈值非常接近于AA,AA的最大阈值为0.9913,DCNI算法阈值为0.9912。在Celegans中ISS比DCNI略好,但DCNI比其他算法都更好,这意味着共同邻居节点的介数的倒数与目标节点对链接的可能性呈正相关,进一步结合DCNI算法来预测目标节点的链接可能性,可以使得预测结果更加准确。
可以进一步利用所述目标节点对对应的共同邻居节点的相似性来确定所述目标节点对的节点间影响力。如上述三元结构的分析可知,共同邻居节点对目标节点对的链接存在较大的影响,而通常目标节点对在指定网络中可能对应有多个共同邻居节点,目标节点对中各节点与其他节点之间可能也对应有共同邻居节点,可以通过分析目标节点对中各节点的共同邻居节点特征,来间接分析目标节点对中两个节点之间的相关程度。通过该实施方式,可以从另一个因素来确定目标节点对的链接可能性,使得目标节点对的链接预测因素更加全面,进一步提高预测的准确性。
一些实施方式中,可以采用Pearson系数来描述共同邻居节点的相似度,Pearson系数计算如下:
Figure BDA0003159860920000074
其中,
Figure BDA0003159860920000075
表示目标节点对x和y的节点间影响力,l表示所述指定网络的任一节点,N表示所述指定网络中的节点数,vxl表示节点x与节点l对应于矩阵A2中的元素值,vyl表示节点y与节点l对应于矩阵A2中的元素值,vx、vy分别表示A2中对应节点x、y的行或列,
Figure BDA0003159860920000081
分别表示vx的平均值、标准差,
Figure BDA0003159860920000082
分别表示vy的平均值、标准差,A2为所述指定网络的邻接矩阵的平方。
A2中对应于节点x、l的元素值vxl可以表征从节点x经过两个边到达节点l的方案数,即,该元素值vxl可以表征节点x与节点l所对应的共同邻居节点数。相应的,vx可以表征节点x与任一节点所对应的共同邻居节点数所形成的向量。vyl、vy的含义同vxl、vx相似,这里不做赘述。通过上述公式(5)可以从另一方面利用共同邻居节点特征来表征目标节点对x和y之间的链接可能性。为了便于描述,可以将上述基于节点间影响力对目标节点对链接预测的方法描述为Pearson算法。以类似的方式,可以使用上述五个网络数据验证节点间影响力对目标节点对链接预测的影响。每个算法的阈值也显示在表2中,可以看出Pearson算法虽然不是最好的,但是整体表现良好并且具有较高的稳定性。由此可见,进一步结合Pearson算法预测目标节点对的链接可能性,可以使得链接预测更加稳定。
本场景示例中,还可以通过综合所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力对所述目标节点对进行链接预测,以综合考虑所有共同邻居节点的外部及内部结构平衡,使得目标节点对的链接预测更加稳定准确。一些实施方式中,可以采用下述公式(6)确定所述目标节点对的链接预测分数:
Figure BDA0003159860920000083
其中,a、b、c为调节参数。可以从指定网络中抽取已知链接关系的节点作为样本数据,利用样本数据来确定该指定网络所对应的a、b、c的值。或者,在指定网络的样本数据量较少的情况下,也可以参考与所述指定网络应用场景类似的网络的影响力传输损耗,确定该指定网络所对应的a、b、c的值。当然,也可以根据需要采用其他的方式确定所述指定网络所对应的影响力传输损耗。
对于指定网络,可以采用下述步骤1至5确定指定网络中任一待链接预测的节点对的链接预测分数:
步骤1:根据公式(2)计算所有待链接预测的节点对的ISS值;
步骤2:根据公式(4)计算所有待链接预测的节点对的DCNI值;
步骤3:根据公式(5)获取所有待链接预测的节点对的Pearson值;
步骤4:计算所有待链接预测的节点对的
Figure BDA0003159860920000091
步骤5:对于每个待链接预测的节点对,假设预先设定链接的节点对为m,可以通过设定一个阈值θ,当
Figure BDA0003159860920000092
高于θ时链接,反之不链接;或者,基于
Figure BDA0003159860920000093
从高到低的顺序对节点对进行排序,获取前m个节点对进行链接。整体算法可以说如下:
Figure BDA0003159860920000094
其中,N是所有待链接预测的节点对所形成的集合,E表示最终获得链接的节点对。如果节点对(x,y)的链接,则变量exy为1,否则为0。
上述场景示例,利用三元闭合结构中节点的影响,提出了三个节点间的影响力指标和一种综合链路预测方法,通过进一步考虑传输损耗来确定共同邻居共享影响力可以使得影响力的确定更加符合相应的应用场景,提高链接预测的准确性。同时,进一步考虑共同邻居影响力的分散,可以使得共同邻居节点的外部影响分析更加全面,进一步保证链接预测的准确性。此外,还进一步考虑了节点对的节点间影响,从三元结构的内部稳定性来反映节点对的链接可能性,可以使得链接预测更加稳定。再进一步组合上述链接预测方式,可以使得节点对链接预测更加稳定准确。
基于上述场景示例,本说明书还提供一种链路预测方法。图2是本说明书提供的所述链路预测方法实施例流程示意图。如图2所示,本说明书提供的链路预测方法的一个实施例中,所述方法可以应用于服务器。所述方法可以包括如下步骤。
S20:获取指定网络中任一待链接预测的节点对,作为目标节点对;
S22:提取所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力;其中,所述共同邻居共享影响力利用所述目标节点对的共同邻居节点的度表征;所述共同邻居分散影响力利用所述目标节点对的共同邻居节点所在的最短路径数表征;所述节点间影响力利用所述目标节点对的共同邻居节点的相似性表征;
S24:根据所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力对所述目标节点对进行链接预测,以基于链接预测结果确定所述指定网络中节点对间的链路关系。
另一些实施例中,所述目标节点对的共同邻居共享影响力可以采用下述方式确定:
Figure BDA0003159860920000095
其中,
Figure BDA0003159860920000096
表示目标节点对x和y的共同邻居共享影响力,z表示目标节点对x和y的共同邻居节点,Γ(x)表示与节点x直接链接的节点所形成的集合,Γ(y)表示与节点y直接链接的节点所形成的集合,kz代表节点z的度,γ表示影响力传输损耗。
另一些实施例中,所述目标节点对的共同邻居分散影响力可以采用下述方式确定:
Figure BDA0003159860920000101
其中,
Figure BDA0003159860920000102
表示目标节点对x和y的共同邻居分散影响力,z表示目标节点对x和y的共同邻居节点,Γ(x)表示与节点x直接链接的节点所形成的集合,Γ(y)表示与节点y直接链接的节点所形成的集合,σst表示从节点s到节点t的最短路径的总数,
Figure BDA0003159860920000103
表示从节点s到节点t的最短路径中经过节点z的路径数量
另一些实施例中,所述目标节点对的节点间影响力可以采用下述方式确定:
Figure BDA0003159860920000104
其中,
Figure BDA0003159860920000105
表示目标节点对x和y的节点间影响力,l表示所述指定网络的任一节点,N表示所述指定网络中的节点数,vxl表示节点x与节点l在所述指定网络的邻接矩阵A中的值,vyl表示节点y与节点l在所述指定网络的邻接矩阵A中的值,
Figure BDA0003159860920000106
Figure BDA0003159860920000107
别表示vx的平均值、标准差,
Figure BDA0003159860920000108
分别表示vy的平均值、标准差,vx、vy分别表示A2中对应节点x、y的行或列。
另一些实施例中,所述根据所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力对所述目标节点对进行链接预测,可以包括:
Figure BDA0003159860920000109
其中,
Figure BDA00031598609200001010
表示目标节点对x和y的节点间影响力,l表示所述指定网络的任一节点,N表示所述指定网络中的节点数,vxl表示节点x与节点l对应于矩阵A2中的元素值,vyl表示节点y与节点l对应于矩阵A2中的元素值,vx、vy分别表示A2中对应节点x、y的行或列,
Figure BDA00031598609200001011
分别表示vx的平均值、标准差,
Figure BDA00031598609200001012
分别表示vy的平均值、标准差,A2为所述指定网络的邻接矩阵的平方。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。具体的可以参照前述相关处理相关实施例的描述,在此不做一一赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
如图3所示,基于上述实施例提供的方法,本说明书实施例还提供一种链路预测装置,应用于服务器,所述装置包括:获取模块30,用于获取指定网络中任一待链接预测的节点对,作为目标节点对;提取模块32,用于提取所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力;其中,所述共同邻居共享影响力利用所述目标节点对的共同邻居节点的度表征;所述共同邻居分散影响力利用所述目标节点对的共同邻居节点所在的最短路径数表征;所述节点间影响力利用所述目标节点对的共同邻居节点的相似性表征;预测模块34,用于根据所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力对所述目标节点对进行链接预测,以基于链接预测结果确定所述指定网络中节点对间的链路关系。
另一些实施例中,所述提取模块可以用于采用下述方式提取所述标节点对的共同邻居共享影响力:
Figure BDA0003159860920000111
其中,
Figure BDA0003159860920000112
表示目标节点对x和y的共同邻居共享影响力,z表示目标节点对x和y的共同邻居节点,Γ(x)表示与节点x直接链接的节点所形成的集合,Γ(y)表示与节点y直接链接的节点所形成的集合,kz代表节点z的度,γ表示影响力传输损耗。
另一些实施例中,所述提取模块可以用于采用下述方式提取所述标节点对的共同邻居分散影响力:
Figure BDA0003159860920000113
其中,
Figure BDA0003159860920000114
表示目标节点对x和y的共同邻居分散影响力,z表示目标节点对x和y的共同邻居节点,Γ(x)表示与节点x直接链接的节点所形成的集合,Γ(y)表示与节点y直接链接的节点所形成的集合,σst表示从节点s到节点t的最短路径的总数,
Figure BDA0003159860920000115
表示从节点s到节点t的最短路径中经过节点z的路径数量。
另一些实施例中,所述提取模块可以用于采用下述方式提取所述标节点对的节点间影响力:
Figure BDA0003159860920000121
其中,
Figure BDA0003159860920000122
表示目标节点对x和y的节点间影响力,l表示所述指定网络的任一节点,N表示所述指定网络中的节点数,vxl表示节点x与节点l对应于矩阵A2中的元素值,vyl表示节点y与节点l对应于矩阵A2中的元素值,vx、vy分别表示A2中对应节点x、y的行或列,
Figure BDA0003159860920000123
分别表示vx的平均值、标准差,
Figure BDA0003159860920000124
分别表示vy的平均值、标准差,A2为所述指定网络的邻接矩阵的平方。
需要说明的,上述所述的装置根据上述实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。
本说明书还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现包括上述任意一个或者多个实施例所述方法的步骤。所述存储介质可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。所述存储介质有可以包括:利用电能方式存储信息的装置如,各式存储器,如RAM、ROM等;利用磁能方式存储信息的装置如,硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘;利用光学方式存储信息的装置如,CD或DVD。当然,还有其他方式的可读存储介质,例如量子存储器、石墨烯存储器等等。
需要说明的是,本说明书实施例并不局限于必须是符合标准数据模型/模板或本说明书实施例所描述的情况。某些行业标准或者使用自定义方式或实施例描述的实施基础上略加修改后的实施方案也可以实现上述实施例相同、等同或相近、或变形后可预料的实施效果。应用这些修改或变形后的数据获取、存储、判断、处理方式等获取的实施例,仍然可以属于本说明书的可选实施方案范围之内。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述并不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (10)

1.一种链路预测方法,其特征在于,应用于服务器,所述方法包括:
获取指定网络中任一待链接预测的节点对,作为目标节点对;
提取所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力;其中,所述共同邻居共享影响力利用所述目标节点对的共同邻居节点的度表征;所述共同邻居分散影响力利用所述目标节点对的共同邻居节点所在的最短路径数表征;所述节点间影响力利用所述目标节点对的共同邻居节点的相似性表征;
根据所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力对所述目标节点对进行链接预测,以基于链接预测结果确定所述指定网络中节点对间的链路关系。
2.根据权利要求1所述的方法,其特征在于,所述目标节点对的共同邻居共享影响力采用下述方式确定:
Figure FDA0003159860910000011
其中,
Figure FDA0003159860910000012
表示目标节点对x和y的共同邻居共享影响力,z表示目标节点对x和y的共同邻居节点,Γ(x)表示与节点x直接链接的节点所形成的集合,Γ(y)表示与节点y直接链接的节点所形成的集合,kz代表节点z的度,γ表示影响力传输损耗。
3.根据权利要求1所述的方法,其特征在于,所述目标节点对的共同邻居分散影响力采用下述方式确定:
Figure FDA0003159860910000013
其中,
Figure FDA0003159860910000014
表示目标节点对x和y的共同邻居分散影响力,z表示目标节点对x和y的共同邻居节点,Γ(x)表示与节点x直接链接的节点所形成的集合,Γ(y)表示与节点y直接链接的节点所形成的集合,σst表示从节点s到节点t的最短路径的总数,
Figure FDA0003159860910000015
表示从节点s到节点t的最短路径中经过节点z的路径数量。
4.根据权利要求1所述的方法,其特征在于,所述目标节点对的节点间影响力采用下述方式确定:
Figure FDA0003159860910000016
其中,
Figure FDA0003159860910000021
表示目标节点对x和y的节点间影响力,l表示所述指定网络的任一节点,N表示所述指定网络中的节点数,vxl表示节点x与节点l对应于矩阵A2中的元素值,vyl表示节点y与节点l对应于矩阵A2中的元素值,vx、vy分别表示A2中对应节点x、y的行或列,
Figure FDA0003159860910000022
分别表示vx的平均值、标准差,
Figure FDA0003159860910000023
分别表示vy的平均值、标准差,A2为所述指定网络的邻接矩阵的平方。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力对所述目标节点对进行链接预测,包括:
Figure FDA0003159860910000024
其中,
Figure FDA0003159860910000025
表示目标节点对x和y的链接预测分数,
Figure FDA0003159860910000026
表示目标节点对x和y的共同邻居共享影响力,
Figure FDA0003159860910000027
表示目标节点对x和y的共同邻居分散影响力,
Figure FDA0003159860910000028
表示目标节点对x和y的节点间影响力,a、b、c为调节参数。
6.一种链路预测装置,其特征在于,应用于服务器,所述装置包括:
获取模块,用于获取指定网络中任一待链接预测的节点对,作为目标节点对;
提取模块,用于提取所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力;其中,所述共同邻居共享影响力利用所述目标节点对的共同邻居节点的度表征;所述共同邻居分散影响力利用所述目标节点对的共同邻居节点所在的最短路径数表征;所述节点间影响力利用所述目标节点对的共同邻居节点的相似性表征;
预测模块,用于根据所述目标节点对的共同邻居共享影响力、共同邻居分散影响力以及节点间影响力对所述目标节点对进行链接预测,以基于链接预测结果确定所述指定网络中节点对间的链路关系。
7.根据权利要求6所述的装置,其特征在于,所述提取模块用于采用下述方式提取所述标节点对的共同邻居共享影响力:
Figure FDA0003159860910000029
其中,
Figure FDA00031598609100000210
表示目标节点对x和y的共同邻居共享影响力,z表示目标节点对x和y的共同邻居节点,Γ(x)表示与节点x直接链接的节点所形成的集合,Γ(y)表示与节点y直接链接的节点所形成的集合,kz代表节点z的度,γ表示影响力传输损耗。
8.根据权利要求6所述的装置,其特征在于,所述提取模块用于采用下述方式提取所述标节点对的共同邻居分散影响力:
Figure FDA0003159860910000031
其中,
Figure FDA0003159860910000032
表示目标节点对x和y的共同邻居分散影响力,z表示目标节点对x和y的共同邻居节点,Γ(x)表示与节点x直接链接的节点所形成的集合,Γ(y)表示与节点y直接链接的节点所形成的集合,σst表示从节点s到节点t的最短路径的总数,
Figure FDA0003159860910000033
表示从节点s到节点t的最短路径中经过节点z的路径数量。
9.根据权利要求6所述的装置,其特征在于,所述提取模块用于采用下述方式提取所述标节点对的节点间影响力:
Figure FDA0003159860910000034
其中,
Figure FDA0003159860910000035
表示目标节点对x和y的节点间影响力,l表示所述指定网络的任一节点,N表示所述指定网络中的节点数,vxl表示节点x与节点l对应于矩阵A2中的元素值,vyl表示节点y与节点l对应于矩阵A2中的元素值,vx、vy分别表示A2中对应节点x、y的行或列,
Figure FDA0003159860910000036
分别表示vx的平均值、标准差,
Figure FDA0003159860910000037
分别表示vy的平均值、标准差,A2为所述指定网络的邻接矩阵的平方。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被执行时实现权利要求1-5中任一项所述方法的步骤。
CN202110788369.3A 2021-07-13 2021-07-13 一种链路预测方法、装置及存储介质 Active CN113518010B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110788369.3A CN113518010B (zh) 2021-07-13 2021-07-13 一种链路预测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110788369.3A CN113518010B (zh) 2021-07-13 2021-07-13 一种链路预测方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN113518010A true CN113518010A (zh) 2021-10-19
CN113518010B CN113518010B (zh) 2022-10-25

Family

ID=78067244

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110788369.3A Active CN113518010B (zh) 2021-07-13 2021-07-13 一种链路预测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN113518010B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114553818A (zh) * 2022-02-23 2022-05-27 中国矿业大学 社交网络影响力最大化节点识别方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372743A (zh) * 2016-08-23 2017-02-01 浙江工业大学 一种基于二阶局部社团和共同邻居比例信息的预测网络未知连边的方法
CN111461440A (zh) * 2020-04-02 2020-07-28 河北工程大学 链路预测方法、系统及终端设备
CN111696626A (zh) * 2019-11-22 2020-09-22 长春工业大学 一种融合社区结构和节点度的局部路径相似度的蛋白质链接预测算法
AU2020102905A4 (en) * 2020-01-20 2020-12-17 Yunnan University A method to measure social network influence
CN113094558A (zh) * 2021-04-08 2021-07-09 电子科技大学 一种基于局部结构的网络节点影响力排序方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372743A (zh) * 2016-08-23 2017-02-01 浙江工业大学 一种基于二阶局部社团和共同邻居比例信息的预测网络未知连边的方法
CN111696626A (zh) * 2019-11-22 2020-09-22 长春工业大学 一种融合社区结构和节点度的局部路径相似度的蛋白质链接预测算法
AU2020102905A4 (en) * 2020-01-20 2020-12-17 Yunnan University A method to measure social network influence
CN111461440A (zh) * 2020-04-02 2020-07-28 河北工程大学 链路预测方法、系统及终端设备
CN113094558A (zh) * 2021-04-08 2021-07-09 电子科技大学 一种基于局部结构的网络节点影响力排序方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈嘉颖等: "基于复杂网络节点重要性的链路预测算法", 《计算机应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114553818A (zh) * 2022-02-23 2022-05-27 中国矿业大学 社交网络影响力最大化节点识别方法及系统
CN114553818B (zh) * 2022-02-23 2022-11-18 中国矿业大学 社交网络影响力最大化节点识别方法及系统

Also Published As

Publication number Publication date
CN113518010B (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
Hu A multivariate grey prediction model with grey relational analysis for bankruptcy prediction problems
CN110245132B (zh) 数据异常检测方法、装置、计算机可读存储介质和计算机设备
Lubold et al. Identifying the latent space geometry of network models through analysis of curvature
Yang et al. Quantifying content polarization on twitter
CN111177473A (zh) 人员关系分析方法、装置和可读存储介质
CN110827921A (zh) 一种单细胞聚类方法、装置、电子设备及存储介质
CN107016416B (zh) 基于邻域粗糙集和pca融合的数据分类预测方法
CN111932386A (zh) 用户账号确定方法及装置、信息推送方法及装置、电子设备
WO2019200739A1 (zh) 数据欺诈识别方法、装置、计算机设备和存储介质
CN112036476A (zh) 基于二分类业务的数据特征选择方法、装置及计算机设备
CN114154557A (zh) 癌症组织分类方法、装置、电子设备及存储介质
CN113807073B (zh) 文本内容异常检测方法、装置以及存储介质
CN113518010B (zh) 一种链路预测方法、装置及存储介质
CN114880482A (zh) 一种基于图嵌入的关系图谱关键人员分析方法及系统
CN115114484A (zh) 异常事件检测方法、装置、计算机设备和存储介质
Shan et al. Incorporating user behavior flow for user risk assessment
de Sá et al. A novel approach to estimated Boulingand-Minkowski fractal dimension from complex networks
CN114092216A (zh) 企业信贷评级方法、装置、计算机设备和存储介质
Li et al. Sharpness and brightness quality assessment of face images for recognition
Yang et al. Detecting communities in attributed networks through bi-direction penalized clustering and its application
Bautista et al. Recommendation system for engineering students’ specialization selection using predictive modeling
CN113538020B (zh) 获取客群特征关联度方法、装置、存储介质和电子装置
Shivraman et al. A Model Frame Work To Segregate Clusters Through K-Means Method
Sánchez-Rico et al. Combination of Cluster Analysis with Dimensionality Reduction Techniques for Pattern Recognition Studies in Healthcare Data: Comparing PCA, t-SNE and UMAP
Guerreiro et al. Recovering network topology and dynamics via sequence characterization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant