CN106559290A - 基于社团结构的链路预测的方法和系统 - Google Patents

基于社团结构的链路预测的方法和系统 Download PDF

Info

Publication number
CN106559290A
CN106559290A CN201611079420.9A CN201611079420A CN106559290A CN 106559290 A CN106559290 A CN 106559290A CN 201611079420 A CN201611079420 A CN 201611079420A CN 106559290 A CN106559290 A CN 106559290A
Authority
CN
China
Prior art keywords
node
attribute
community structure
company
probability distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611079420.9A
Other languages
English (en)
Other versions
CN106559290B (zh
Inventor
时岩
陈滨
陈山枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201611079420.9A priority Critical patent/CN106559290B/zh
Publication of CN106559290A publication Critical patent/CN106559290A/zh
Application granted granted Critical
Publication of CN106559290B publication Critical patent/CN106559290B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于社团结构的链路预测的方法和系统,该方法包括:获取社团结构中每个节点的每个属性对应的行为特征,所述行为特征包括所述节点对应的连边的条数以及连边的方向,所述连边为两个节点之间的连线,所述社团结构中包括多个节点;根据所述行为特征获取各所述节点之间生成连边的各概率分布;将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取所述社团结构的预测链路,L为正整数。本发明能够提高链路预测的准确性。

Description

基于社团结构的链路预测的方法和系统
技术领域
本发明涉及链路预测领域,尤其涉及一种基于社团结构的链路预测的方法和系统。
背景技术
网络在人类和自然界中普遍存在。随着科学技术的不断发展,人们对于网络的认知也有了更深刻的理解,对于网络的了解也可以帮助人类进一步认知世界。
在网络科学研究中,将某个实际问题抽象为一个网络(例如:通信网络、社交网络、信息网络、电力网络、交通网络、社会接触网络等),其中包括节点集合和连边的集合。节点之间的连线称为连边(也称链路),表示节点之间的某种联系,常常与具体实际问题相关,例如:无线移动网络中两个节点可以或正在通信、合著者网络中两个作者之间存在合著关系等等。预测节点之间是否会存在有连边称为链路预测。
链路预测是指通过利用网络的已知节点信息和结构信息对网络中尚未产生连边的两个节点之间可能产生的连边进行预测。链路预测的研究与网络的结构和演化的联系非常密切。目前,链路预测是网络研究领域中一个新兴的、具有重要理论与应用价值的研究方向。在理论方面,链路预测可以用来理解、揭示和比较复杂网络中的可能的演化机制,通过预测和真实网络的比较,就可以得到网络结构预测的准确性;链路预测在影响分析力、生物科学实验、商品推荐、信息传播、网络营销等领域有重要应用,如生物方面,为了避免盲目通过实验来检测蛋白质的作用,可以先通过链路预测来估计蛋白质的相互作用,从而指导实验,避免了大量实验和实验材料的浪费。
因此,如何准确的实现链路预测成为亟需解决的问题。
发明内容
本发明提供一种基于社团结构的链路预测的方法和系统,以进行准确的链路预测。
本发明第一个方面提供一种基于社团结构的链路预测的方法,包括:
获取社团结构中每个节点的每个属性对应的行为特征,所述行为特征包括所述节点对应的连边的条数以及连边的方向,所述连边为两个节点之间的连线,所述社团结构中包括多个节点;
根据所述行为特征获取各所述节点之间生成连边的各概率分布;
将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取所述社团结构的预测链路,L为正整数。
根据如上所述的方法,可选地,所述根据所述行为特征获取各所述节点之间生成连边的各概率分布,具体包括:
对所述社团结构C中的任意节点j和k,采用如下公式获取具有属性mp的所述节点j和具有属性mq的所述节点k之间生成连边的子概率分布S(mp,mq,C):
其中,α1、α2、α3、α4均表示权重因子,并且满足i为正整数;
|C|表示所述社团结构C中的节点总个数;
f(mp,C)表示所述社团结构C中具有属性mp的节点个数;
f(mq,C)表示所述社团结构C中具有属性mq的节点个数;
B(C)表示所述社团结构C的连边的总条数;
O(mp,C)表示所述社团结构C中以具有属性mp的节点作为源节点的连边的条数;
E(mq,C)表示所述社团结构C中以具有属性mq的节点作为目的节点的连边的条数;
I(mp,mq,C)表示所述社团结构C中源节点具有属性mp同时目的节点具有属性mq的连边的条数;
其中,所述连边的方向所指向的节点为目的节点,所述连边的另一个节点为源节点,mp表示节点j的第p个属性特征,mq表示节点k的第q个属性特征,p和q均为正整数,所述属性mp和所述属性mq同类;
根据通过所述公式得到的各子概率分布之和获取所述节点j和所述节点k之间生成连边的概率分布。
根据如上所述的方法,可选地,所述α1、α2、α3、α4中,α3最大,α4最小,α1和α2大小相同。
根据如上所述的方法,可选地,所述节点的属性为以下各类特征中的一种:局部特征、自我网络特征、节点连接倾向特征;
其中,所述局部特征包括:以所述节点为源节点的连边的条数、以所述节点为目的节点的连边的条数、以所述节点为源节点的连边的条数和以所述节点为目的节点的连边的条数之和、聚类系数;
所述自我网络特征包括:自我网络的边数、进入自我网络的边数、离开自我网络的边数;
所述连接倾向特征包括:亲密度。
本发明第二个方面提供一种基于社团结构的链路预测的系统,包括:
获取模块,用于获取社团结构中每个节点的每个属性对应的行为特征,所述行为特征包括所述节点对应的连边的条数以及连边的方向,所述连边为两个节点之间的连线,所述社团结构中包括多个节点;
计算模块,用于根据所述行为特征获取各所述节点之间生成连边的各概率分布;
确定模块,用于将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取所述社团结构的预测链路,L为正整数。
根据如上所述的系统,可选地,所述计算模块具体用于包括:对所述社团结构C中的任意节点j和k,采用如下公式获取具有属性mp的所述节点j和具有属性mq的所述节点k之间生成连边的子概率分布S(mp,mq,C):
其中,α1、α2、α3、α4均表示权重因子,并且满足i为正整数;
|C|表示所述社团结构C中的节点总个数;
f(mp,C)表示所述社团结构C中具有属性mp的节点个数;
f(mq,C)表示所述社团结构C中具有属性mq的节点个数;
B(C)表示所述社团结构C的连边的总条数;
O(mp,C)表示所述社团结构C中以具有属性mp的节点作为源节点的连边的条数;
E(mq,C)表示所述社团结构C中以具有属性mq的节点作为目的节点的连边的条数;
I(mp,mq,C)表示所述社团结构C中源节点具有属性mp同时目的节点具有属性mq的连边的条数;
其中,所述连边的方向所指向的节点为目的节点,所述连边的另一个节点为源节点,mp表示节点j的第p个属性特征,mq表示节点k的第q个属性特征,p和q均为正整数,所述属性mp和所述属性mq同类;
根据通过所述公式得到的各子概率分布之和获取所述节点j和所述节点k之间生成连边的概率分布。
根据如上所述的系统,可选地,所述α1、α2、α3、α4中,α3最大,α4最小,α1和α2大小相同。
根据如上所述的系统,可选地,所述节点的属性为以下各类特征中的一种:局部特征、自我网络特征、节点连接倾向特征;
其中,所述局部特征包括:以所述节点为源节点的连边的条数、以所述节点为目的节点的连边的条数、以所述节点为源节点的连边的条数和以所述节点为目的节点的连边的条数之和、聚类系数;
所述自我网络特征包括:自我网络的边数、进入自我网络的边数、离开自我网络的边数;
所述连接倾向特征包括:亲密度。
本实施例提供的基于社团结构的链路预测的方法和系统,首先获取社团结构中每个节点的每个属性对应的行为特征,然后根据各个节点的行为特征获取各节点之间生成连边的各概率分布,最后根据概率较大的前L个概率分布确定社团结构的预测链路,由于行为特征本身与连边有关,而链路预测也是与连边有着紧密的联系,因此,通过每个节点的每个属性对应的行为特征来对社团结构进行链路预测,不仅考虑了节点本身的属性,还考虑了节点行为特征,这样能够提高链路预测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的基于社团结构的链路预测的方法的流程图。
图2为本发明另一实施例提供的基于社团结构的链路预测的系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本实施例提供一种基于社团结构的链路预测的方法,用于预测社团结构中最有可能出现的连边,即预测社团结构中最有可能出现的连边。本实施例的执行主体是基于社团结构的链路预测的系统。
图1为本发明一实施例提供的基于社团结构的链路预测的方法的流程图。如图1所示,本实施例的基于社团结构的链路预测的方法包括:
步骤101、获取社团结构中每个节点的每个属性对应的行为特征,行为特征包括节点对应的连边的数量以及连边的方向,连边为两个节点之间的连线,社团结构中包括多个节点。
具体地,一个网络中可以包括一个或多个社团结构,同一个社团结构至少具有同一个共同性质。每个社团结构中都包括多个节点和多条节点之间的连边,同一个社团结构中的节点之间的连接非常紧密。
社团结构中的节点反映实体系统中的个体,网络对应于实体结构,即网络基于实体结构构建,具体构建方式为现有技术,在此不再赘述。社团结构中的连边反映实体系统中的个体间的相互关系。在现实世界中,个体具有多样性,个体间的相互关系复杂多变,相应地,社团结构中的节点具有不同的属性,社团结构中的连边因节点的属性不同而复杂多变。
在本实施例中,节点的行为特征包括:节点对应的连边数量和连边的方向。举例来说,由两个节点组成一条连边,两个节点中一个是源节点,两个节点中另一个是目的节点,连边的方向由源节点指向目的节点,故当获取行为特征的节点在连边中是源节点时,连边的方向由获取行为特征的节点指向目的节点;当获取行为特征的节点在连边中是目的节点时,连边的方向由源节点指向获取行为特征的节点。如何定位连边的方向属于现有技术,例如:在基于蓝牙技术的无线移动网络中,当某个节点a通过蓝牙设备扫描到节点b时,节点a即为连边对应的源节点,节点b即为连边对应的目的节点;在其他具体实际问题对应的网络中也有类似定义,在此不再赘述。
举例来说,对应于节点的a属性,所对应的行为特征可以包括该节点对应的连边的条数以及方向,对应于b属性,所对应的行为特征可以包括该节点对应的连边的条数以及方向。此外,由于一个节点当前时刻所用于的连边的条数是固定的,因此,同一个节点对应于所有属性的连边的条数应该也是相同的,即节点的a属性和b属性对应的行为特征中的连边的条数是相同的,在实际操作中可以不重复统计。
步骤102、根据行为特征获取各节点之间生成连边的各概率分布。
对于一个节点来说,其周围有很多邻居节点,这些邻居节点在未来都有可能与该节点连接,进而生成连边,因此,可以通过该节点当前时刻的行为特征获取该节点与其它邻居节点之间在未来生成连边的概率分布。同理,对社团结构中的每一个节点都可以根据行为特征获取与邻居节点生成连边的概率分布。
以上所描述的“未来”可以指未来的某个时刻,例如1秒后,或者是1天后,具体可以根据该网络实际变化的周期来推测未来所指向的具体时间点或时间段。
步骤103、将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取社团结构的预测链路,L为正整数。
举例来说,获取的各节点之间生成连边的各概率分布共有50个,将得到的50个概率分布从大到小依次排序,选出前5个概率分布值高的概率分布所对应的连边确定为预测链路,所确定的预测链路即为在未来最有可能出现的连边,进而可以预测社团结构在未来某个时间内的连边。
本实施例提供的基于社团结构的链路预测的方法,首先获取社团结构中每个节点的每个属性对应的行为特征,然后根据各个节点的行为特征获取各节点之间生成连边的各概率分布,最后根据概率较大的前L个概率分布确定社团结构的预测链路,由于行为特征本身与连边有关,而链路预测也是与连边有着紧密的联系,因此,通过每个节点的每个属性对应的行为特征来对社团结构进行链路预测,不仅考虑了节点本身的属性,还考虑了节点行为特征,这样能够提高链路预测的准确性。
实施例二
本实施例是对实施例一的基于社团结构的链路预测的方法做进一步补充说明。
本实施例的基于社团结构的链路预测的方法包括:
步骤a、获取社团结构中每个节点的行为特征,行为特征包括节点对应的连边的数量以及连边的方向,连边为两个节点之间的连线,社团结构中包括多个节点。
本实施例中的步骤a与上述实施例一的步骤101的实现方式相同,此处不再赘述。
在本实施例中,节点的属性可以属于以下几类中的一种:局部属性、自我网络属性、节点连接倾向属性。其中,局部属性包括以下特征:以节点为源节点的连边的条数、以节点为目的节点的连边的条数、以节点为源节点的连边的条数和以节点为目的节点的连边的条数之和、聚类系数;自我网络属性包括以下特征:自我网络的边数、进入自我网络的边数、离开自我网络的边数;节点连接倾向属性包括以下特征:亲密度。
其中,自我网络是指仅由节点本身,与节点直接相连的所有邻居节点以及由这些节点所附带的所有连边所组成的网络。某一节点的邻居节点,即能够与该某一节点之间形成连边的节点。
聚类系数CCud为节点u的所有邻居节点的个数,e为节点u的所有邻居节点相互连接的连边的个数。该聚类系数的确定属于现有技术,在此不再赘述。
节点j与节点k之间的亲密度其中fj(k)为节点j和节点k之间的连边的个数,该连边的个数计算方法根据研究背景为静态网络或动态网络而有不同(在动态网络中包括历史连边的数量),具体如何计算fj(k)属于现有技术,在此不再赘述,D(j)为节点j的为源节点的连边的条数和以节点j为目的节点的连边的条数之和,D(j)也称为度。
本实施例中的节点属性可以根据实际需要设定,各节点的属性是现有技术中的属性,在此不再赘述。
步骤b、对社团结构C中的任意节点j和k,采用如下公式获取具有属性mp的节点j和具有属性mq的节点k之间生成连边的子概率分布S(mp,mq,C):
其中,α1、α2、α3、α4均表示权重因子,并且满足i为正整数;
|C|表示社团结构C中的节点总个数;
f(mp,C)表示社团结构C中具有属性mp的节点个数;
f(mq,C)表示社团结构C中具有属性mq的节点个数;
B(C)表示社团结构C的连边的总条数;
O(mp,C)表示社团结构C中源节点具有属性mp的连边的条数;
E(mq,C)表示社团结构C中目的节点具有属性mq的连边的条数;
I(mp,mq,C)表示社团结构C中源节点具有属性mp同时目的节点具有属性mq的连边的条数;
其中,源节点和目的节点由连边的方向确定,连边的方向所指向的节点为目的节点,连边的另一个节点为源节点;mp表示节点j的第p个属性,mq表示节点k的第q个属性,p和q均为正整数,属性mp和属性mq同类。
可选地,该步骤a和步骤b之间,还包括对所获取的属性进行离散化操作,即将分布在实数域上的属性值映射到一个小范围内的整数值。离散化操作的目的是将随机分布的属性值进行处理,以提升属性值的相同度。例如,属性值分别为1.1、1.2和1.3,对这些属性值进行离散化处理之后,值均为1。
离散化操作的步骤具体可以如下:对于任一属性f,将p|V|(0<p<1)个取得最小属性值的节点的属性值重新指定为0,接着将剩余节点的p的属性值重新指定为1,其中p表示概率值,具体可以根据实验数据观察所得,或者根据属性划分的程序决定,该p值如何取值属于现有技术,在此不再赘述。重复上述步骤,直到所有节点的属性f取值被重新指定。这样,所有被应用到公式中的节点的属性f取值范围为其中,定义V=∪i∈{1,...,n}Vi,V包含网络中所有节点的集合,Vi表示各节点,其中n为时间窗口T中的快照总数,快照指的是某一时刻网络的状态,例如社团结构的状态,可以形象地理解为,为网络拍照后,在照片中网络所显示的状态,时间窗口T为快照集合S的一个子集,即快照集合S={1,2,...,n}。
步骤c,根据通过公式得到的各子概率分布之和获取节点j和节点k之间生成连边的概率分布。
具体举例来说,如实施例一中所述,节点至少具有9个属性。以社团结构C中的任意节点j和k为例,首先,按上述公式获取每一相同属性的节点j和k之间生成连边的子概率分布,比如说,按上述公式获取“以节点为源节点的连边的条数”属性的节点j和k之间生成连边的子概率分布,按上述公式获取“以节点为目的节点的连边的条数”属性的节点j和k之间生成连边的子概率分布,按上述公式获取“度”属性的节点j和k之间生成连边的子概率分布,按上述公式获取“聚类系数”属性的节点j和k之间生成连边的子概率分布,按上述公式获取“自我网络的边数”属性的节点j和k之间生成连边的子概率分布,按上述公式获取“进入自我网络的边数”属性的节点j和k之间生成连边的概率分布,按上述公式获取“离开自我网络的边数”属性的节点j和k之间生成连边的子概率分布,按上述公式获取“亲密度”属性的节点j和k之间生成连边的子概率分布。其次,将获取的九个属性的节点之间生成连边的子概率分布求和得到节点j和k生成连边的概率分布。最后,依次获取各节点之间生成连边的各概率分布。
在本实施例中,由于获取的社团结构的节点的行为特征涵盖了多种与获取的节点相同属性的连边,且节点之间生成连边的概率分布覆盖了全部的节点的属性,从而能够进一步地提高链路预测的准确性。
需要特别说明的是,节点本身可以将权重因子设定如下:在α1、α2、α3、α4四个权重因子中,α3最大,α4最小,α1、α2大小相同。本实施例中通过为不同连边分配不同的权重因子,可以进一步地提高链路预测的准确性。
步骤d、将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取社团结构的预测链路,L为正整数。
本实施例中的步骤d与上述实施例一的步骤103的实现方式相同,此处不再赘述。
本实施例提供的基于社团结构的链路预测的方法,首先获取社团结构的每个属性对应的行为特征,接着根据所获取的行为特征依次对各节点之间生成连边的子概率分布进行计算,并对同一对节点的各子概率分布进行求和得到该对节点之间生成连边的各概率分布,通过排序法确定出概率较大的前L个概率分布对应的连边,并将这些连边确定为预测链路。由于获取的社团结构的节点的行为特征涵盖了多种与获取的节点相同属性特征的连边,且节点之间生成连边的概率分布覆盖了全部的节点的属性特征,从而能够进一步地提高链路预测的准确性。
实施例三
图2为本发明实施例另一提供的基于社团结构的链路预测的装置的结构示意图,该基于社团结构的链路预测的装置可以执行本发明实施例一的基于社团结构的链路预测的方法。
如图2所示,本实施例的基于社团结构的链路预测的装置包括:获取模块21、计算模块22、确定模块23。
其中,获取模块21用于获取社团结构中每个节点的每个属性对应的行为特征,行为特征包括节点对应的连边的条数以及连边的方向,连边为两个节点之间的连线,社团结构中包括多个节点;计算模块22用于根据行为特征获取各节点之间生成连边的各概率分布;确定模块23用于将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取社团结构的预测链路,L为正整数。
关于本实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本实施例提供的基于社团结构的链路预测的装置,首先获取社团结构中每个节点的每个属性对应的行为特征,然后根据各个节点的行为特征获取各节点之间生成连边的各概率分布,最后根据概率较大的前L个概率分布确定社团结构的预测链路,由于行为特征本身与连边有关,而链路预测也是与连边有着紧密的联系,因此,通过每个节点的每个属性对应的行为特征来对社团结构进行链路预测,不仅考虑了节点本身的属性,还考虑了节点行为特征,这样能够提高链路预测的准确性。
实施例四
本实施例是对实施例三的基于社团结构的链路预测的装置中的计算模块做进一步补充说明。
计算模块具体用于:对社团结构C中的任意节点j和k,采用如下公式获取具有属性mp的节点j和具有属性mq的节点k之间生成连边的子概率分布S(mp,mq,C):
其中,α1、α2、α3、α4均表示权重因子,并且满足i为正整数;
|C|表示社团结构C中的节点总个数;
f(mp,C)表示社团结构C中具有属性mp的节点个数;
f(mq,C)表示社团结构C中具有属性mq的节点个数;
B(C)表示社团结构C的连边的总条数;
O(mp,C)表示社团结构C中以具有属性mp的节点作为源节点的连边的条数;
E(mq,C)表示社团结构C中以具有属性mq的节点作为目的节点的连边的条数;
I(mp,mq,C)表示社团结构C中源节点具有属性mp同时目的节点具有属性mq的连边的条数;
其中,连边的方向所指向的节点为目的节点,连边的另一个节点为源节点,mp表示节点j的第p个属性特征,mq表示节点k的第q个属性特征,p和q均为正整数,属性mp和属性mq同类;
根据通过上述公式得到的各子概率分布之和获取节点j和节点k之间生成连边的概率分布。
可选地,α1、α2、α3、α4中,α3最大,α4最小,α1和α2大小相同。
可选地,节点的属性为以下各类特征中的一种:局部特征、自我网络特征、节点连接倾向特征;
其中,局部特征包括:以节点为源节点的连边的条数、以节点为目的节点的连边的条数、以节点为源节点的连边的条数和以节点为目的节点的连边的条数之和、聚类系数;
自我网络特征包括:自我网络的边数、进入自我网络的边数、离开自我网络的边数;
连接倾向特征包括:亲密度。
关于本实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本实施例提供的基于社团结构的链路预测的装置,首先获取社团结构的每个属性对应的行为特征,接着根据所获取的行为特征依次对各节点之间生成连边的子概率分布进行计算,并对同一对节点的各子概率分布进行求和得到该对节点之间生成连边的各概率分布,通过排序法确定出概率较大的前L个概率分布对应的连边,并将这些连边确定为预测链路。由于获取的社团结构的节点的行为特征涵盖了多种与获取的节点相同属性特征的连边,且节点之间生成连边的概率分布覆盖了全部的节点的属性特征,从而能够进一步地提高链路预测的准确性。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (8)

1.一种基于社团结构的链路预测的方法,其特征在于,包括:
获取社团结构中每个节点的每个属性对应的行为特征,所述行为特征包括所述节点对应的连边的条数以及连边的方向,所述连边为两个节点之间的连线,所述社团结构中包括多个节点;
根据所述行为特征获取各所述节点之间生成连边的各概率分布;
将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取所述社团结构的预测链路,L为正整数。
2.根据权利要求1所述的方法,其特征在于,所述根据所述行为特征获取各所述节点之间生成连边的各概率分布,具体包括:
对所述社团结构C中的任意节点j和k,采用如下公式获取具有属性mp的所述节点j和具有属性mq的所述节点k之间生成连边的子概率分布S(mp,mq,C):
S ( m p , m q , C ) = &alpha; 1 &CenterDot; O ( m p , C ) f 2 ( m p , C ) + &alpha; 2 &CenterDot; E ( m q , C ) f 2 ( m q , C ) + &alpha; 3 &CenterDot; I ( m p , m q , C ) f ( m p , C ) &CenterDot; f ( m q , C ) + &alpha; 4 B ( C ) | C | 2
其中,α1、α2、α3、α4均表示权重因子,并且满足i为正整数;
|C|表示所述社团结构C中的节点总个数;
f(mp,C)表示所述社团结构C中具有属性mp的节点个数;
f(mq,C)表示所述社团结构C中具有属性mq的节点个数;
B(C)表示所述社团结构C的连边的总条数;
O(mp,C)表示所述社团结构C中以具有属性mp的节点作为源节点的连边的条数;
E(mq,C)表示所述社团结构C中以具有属性mq的节点作为目的节点的连边的条数;
I(mp,mq,C)表示所述社团结构C中源节点具有属性mp同时目的节点具有属性mq的连边的条数;
其中,所述连边的方向所指向的节点为目的节点,所述连边的另一个节点为源节点,mp表示节点j的第p个属性特征,mq表示节点k的第q个属性特征,p和q均为正整数,所述属性mp和所述属性mq同类;
根据通过所述公式得到的各子概率分布之和获取所述节点j和所述节点k之间生成连边的概率分布。
3.根据权利要求2所述的方法,其特征在于,所述α1、α2、α3、α4中,α3最大,α4最小,α1和α2大小相同。
4.根据权利要求2或3所述的方法,其特征在于,所述节点的属性为以下各类特征中的一种:局部特征、自我网络特征、节点连接倾向特征;
其中,所述局部特征包括:以所述节点为源节点的连边的条数、以所述节点为目的节点的连边的条数、以所述节点为源节点的连边的条数和以所述节点为目的节点的连边的条数之和、聚类系数;
所述自我网络特征包括:自我网络的边数、进入自我网络的边数、离开自我网络的边数;
所述连接倾向特征包括:亲密度。
5.一种基于社团结构的链路预测的系统,其特征在于,包括:
获取模块,用于获取社团结构中每个节点的每个属性对应的行为特征,所述行为特征包括所述节点对应的连边的条数以及连边的方向,所述连边为两个节点之间的连线,所述社团结构中包括多个节点;
计算模块,用于根据所述行为特征获取各所述节点之间生成连边的各概率分布;
确定模块,用于将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取所述社团结构的预测链路,L为正整数。
6.根据权利要求5所述的系统,其特征在于,所述计算模块具体用于:
对所述社团结构C中的任意节点j和k,采用如下公式获取具有属性mp的所述节点j和具有属性mq的所述节点k之间生成连边的子概率分布S(mp,mq,C):
S ( m p , m q , C ) = &alpha; 1 &CenterDot; O ( m p , C ) f 2 ( m p , C ) + &alpha; 2 &CenterDot; E ( m q , C ) f 2 ( m q , C ) + &alpha; 3 &CenterDot; I ( m p , m q , C ) f ( m p , C ) &CenterDot; f ( m q , C ) + &alpha; 4 B ( C ) | C | 2
其中,α1、α2、α3、α4均表示权重因子,并且满足i为正整数;
|C|表示所述社团结构C中的节点总个数;
f(mp,C)表示所述社团结构C中具有属性mp的节点个数;
f(mq,C)表示所述社团结构C中具有属性mq的节点个数;
B(C)表示所述社团结构C的连边的总条数;
O(mp,C)表示所述社团结构C中以具有属性mp的节点作为源节点的连边的条数;
E(mq,C)表示所述社团结构C中以具有属性mq的节点作为目的节点的连边的条数;
I(mp,mq,C)表示所述社团结构C中源节点具有属性mp同时目的节点具有属性mq的连边的条数;
其中,所述连边的方向所指向的节点为目的节点,所述连边的另一个节点为源节点,mp表示节点j的第p个属性特征,mq表示节点k的第q个属性特征,p和q均为正整数,所述属性mp和所述属性mq同类;
根据通过所述公式得到的各子概率分布之和获取所述节点j和所述节点k之间生成连边的概率分布。
7.根据权利要求6所述的系统,其特征在于,所述α1、α2、α3、α4中,α3最大,α4最小,α1和α2大小相同。
8.根据权利要求6或7所述的系统,其特征在于,所述节点的属性为以下各类特征中的一种:局部特征、自我网络特征、节点连接倾向特征;
其中,所述局部特征包括:以所述节点为源节点的连边的条数、以所述节点为目的节点的连边的条数、以所述节点为源节点的连边的条数和以所述节点为目的节点的连边的条数之和、聚类系数;
所述自我网络特征包括:自我网络的边数、进入自我网络的边数、离开自我网络的边数;
所述连接倾向特征包括:亲密度。
CN201611079420.9A 2016-11-29 2016-11-29 基于社团结构的链路预测的方法和系统 Active CN106559290B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611079420.9A CN106559290B (zh) 2016-11-29 2016-11-29 基于社团结构的链路预测的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611079420.9A CN106559290B (zh) 2016-11-29 2016-11-29 基于社团结构的链路预测的方法和系统

Publications (2)

Publication Number Publication Date
CN106559290A true CN106559290A (zh) 2017-04-05
CN106559290B CN106559290B (zh) 2019-09-27

Family

ID=58445762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611079420.9A Active CN106559290B (zh) 2016-11-29 2016-11-29 基于社团结构的链路预测的方法和系统

Country Status (1)

Country Link
CN (1) CN106559290B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083778A (zh) * 2019-04-08 2019-08-02 清华大学 学习分离表征的图卷积神经网络构建方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120330649A1 (en) * 2009-07-01 2012-12-27 International Business Machines Corporation Systems and methods for extracting patterns from graph and unstructured data
CN103995866A (zh) * 2014-05-19 2014-08-20 北京邮电大学 一种基于链路预测的商品信息推送方法及装置
CN104765825A (zh) * 2015-04-10 2015-07-08 清华大学 基于协同融合原理的社交网络链路预测方法及装置
CN105162654A (zh) * 2015-08-25 2015-12-16 浙江工业大学 一种基于局部社团信息的链路预测方法
CN105490858A (zh) * 2015-12-15 2016-04-13 北京理工大学 一种网络结构的动态链路预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120330649A1 (en) * 2009-07-01 2012-12-27 International Business Machines Corporation Systems and methods for extracting patterns from graph and unstructured data
CN103995866A (zh) * 2014-05-19 2014-08-20 北京邮电大学 一种基于链路预测的商品信息推送方法及装置
CN104765825A (zh) * 2015-04-10 2015-07-08 清华大学 基于协同融合原理的社交网络链路预测方法及装置
CN105162654A (zh) * 2015-08-25 2015-12-16 浙江工业大学 一种基于局部社团信息的链路预测方法
CN105490858A (zh) * 2015-12-15 2016-04-13 北京理工大学 一种网络结构的动态链路预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083778A (zh) * 2019-04-08 2019-08-02 清华大学 学习分离表征的图卷积神经网络构建方法及装置

Also Published As

Publication number Publication date
CN106559290B (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
Cecere et al. Technological pervasiveness and variety of innovators in Green ICT: A patent-based analysis
Kanda et al. Meta-learning to select the best meta-heuristic for the traveling salesman problem: A comparison of meta-features
Erciyes Complex networks: an algorithmic perspective
Duan et al. Test-sheet composition using analytic hierarchy process and hybrid metaheuristic algorithm TS/BBO
CN103544544B (zh) 一种能源消耗预测方法及装置
Braha et al. Corporate competition: A self-organized network
Guemri et al. Probabilistic tabu search for the cross-docking assignment problem
González-Ramírez et al. A hybrid metaheuristic approach to optimize the districting design of a parcel company
CN106844407A (zh) 基于数据集相关性的标签网络产生方法和系统
Alsewari et al. Combinatorial test list generation based on Harmony Search Algorithm
Santiago et al. A methodology for the characterization of flow conductivity through the identification of communities in samples of fractured rocks
Latha et al. An Adaptive Machine Learning model for Walmart sales prediction
Shi et al. A new hybrid optimization algorithm
Huth et al. Long-distance rescue and slow extinction dynamics govern multiscale metapopulations
CN106503386A (zh) 评估光功率预测算法性能优劣的方法及装置
Lin et al. A two-stage approach for a multi-objective component assignment problem for a stochastic-flow network
CN106559290A (zh) 基于社团结构的链路预测的方法和系统
Grando et al. Estimating complex networks centrality via neural networks and machine learning
Kim et al. Detecting community structure in complex networks using an interaction optimization process
Akgüngör et al. Knowledge space, relatedness and complexity: A regional analysis in Turkey
Cervellera et al. Deep learning and low-discrepancy sampling for surrogate modeling with an application to urban traffic simulation
Lakhrouit et al. Enterprise architecture approach for agility evaluation
Szabó et al. Greedy algorithms for triangle free coloring
Carvalho et al. Improving cellular automata scheduling through dynamics control
Nair et al. Domination Index in Graphs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant