CN114666229B - 基于有限传播域的复杂网络节点影响力度量方法及系统 - Google Patents
基于有限传播域的复杂网络节点影响力度量方法及系统 Download PDFInfo
- Publication number
- CN114666229B CN114666229B CN202210275906.9A CN202210275906A CN114666229B CN 114666229 B CN114666229 B CN 114666229B CN 202210275906 A CN202210275906 A CN 202210275906A CN 114666229 B CN114666229 B CN 114666229B
- Authority
- CN
- China
- Prior art keywords
- node
- influence
- propagation
- inf
- complex network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及一种基于有限传播域的复杂网络节点影响力度量方法及系统,属于网络节点影响力度量领域,方法包括:对复杂网络建模,得到复杂网络模型;判断所述复杂网络模型的类型;所述类型为局域传播网络或者广域传播网络;根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力;将所述节点影响力进行排序,得到度量的节点影响力序列。本发明在计算复杂度方面有一定优势,且在不同类型的网络中、不同的传播概率下准确性和鲁棒性更好。
Description
技术领域
本发明涉及网络节点影响力度量领域,特别是涉及一种基于有限传播域的复杂网络节点影响力度量方法及系统。
背景技术
复杂网络是经贸关系、交通网络、蛋白质网络、计算机网络、社交结构等现实或自然界中复杂系统的高度抽象。网络中的节点代表某种个体或团体,边表示节点之间的某种关系。节点影响力度量是复杂网络科学关注的前沿和热点问题。某种观点在社交网络的扩散、传染病在人群中的蔓延、计算机病毒在网络世界中的传播、资金、人才、信息在城市间的流动等过程均可看作服从某种规律的传播行为。而在传播过程中,影响力高的节点在传播过程中往往起着推波助澜或逆转风向的关键作用。例如社交网络中的大V、网红、KOL(KeyOpinion Leader)发出信息往往在很短时间内就能获得大量关注。识别这些高影响力节点是引导传播方向、控制谣言传播、推广营销产品、控制传染病传播的关键。
目前对节点影响力的度量方法大多是基于网络拓扑结构的,可分为基于局部拓扑结构的方法和基于全局拓扑结构的方法。度中心性(Degree Centrality,简称DC)是最典型基于局部拓扑结构的方法,也是最常见的度量方法,即以节点邻居节点的数量作为评价指标,该方法计算简单,但因为考虑的信息较少导致准确性不高。介数中心性(BetweenCentrality,简称BC)、接近中心性(Closeness Centrality,简称CC)、Kshell中心性(简称KS)、Pagerank等方法属于基于全局拓扑结构的方法,这些方法从不同角度计算了节点在整个网络结构中的位置,准确性较高,但计算复杂度很高,且对于大型网络来说,很难获得全部网络结构。近年,研究显示这两类指标在不同的网络、不同的传播概率下度量效果不同。
发明内容
本发明的目的是提供一种基于有限传播域的复杂网络节点影响力度量方法及系统,以解决现有技术中的节点影响力度量方法计算复杂度高以及计算不准确的问题。
为实现上述目的,本发明提供了如下方案:
一种基于有限传播域的复杂网络节点影响力度量方法,包括:
对复杂网络建模,得到复杂网络模型;
判断所述复杂网络模型的类型;所述类型为局域传播网络或者广域传播网络;
根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力;
将所述节点影响力进行排序,得到度量的节点影响力序列。
可选的,所述判断所述复杂网络模型的类型,具体包括:
计算所述复杂网络模型的网络模型参数和节点度值大于平均度值的节点所占比例;所述网络模型参数包括度异质性、平均最短距离和平均度值;
判断所述度异质性、所述平均最短距离、所述平均度值以及所述节点度值大于平均度值的节点所占比例中是否有两个或者两个以上参数满足对应判定条件,得到第一判断结果;所述判定条件包括所述度异质性大于10、所述平均最短距离小于4、所述平均度值大于10以及所述节点度值大于平均度值的节点所占比例小于0.2;
若所述第一判断结果为是,则所述复杂网络模型的类型为广域传播网络;
若所述第一判断结果为否,则所述复杂网络模型的类型为局域传播网络。
可选的,所述根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力,具体包括:
当所述复杂网络模型的类型为广域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Inf(u)为节点影响力;Infproximal(u)为近源影响力,Infdistal(u)为远端影响力,Infdistal(u)=Infstep_2(u);λ为调节参数;u为节点u,v为节点v,N(u)为节点u的邻居节点集合;puv为节点u和节点v之间的传播概率;Infstep_2(u)为节点u对两步之内到达的节点的影响力之和;
当所述复杂网络模型的类型为局域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Infproximal(u)=Infstep_2(u),Γ(w)为节点w两步之内到达的节点集合;N(v)为节点v的邻居节点集合;pvw为节点v和节点w之间的传播概率。
可选的,所述根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力,还包括:
利用公式计算基准参数;/>表示基准参数,Round()表示四舍五入;
当所述复杂网络模型的类型为广域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,
当所述复杂网络模型的类型为局域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,
可选的,还包括:
利用SIR模型,将所述复杂网络模型中每一个节点作为传播源进行模拟,得到真实的节点影响力序列;
利用肯德尔一致性系数衡量所述度量的节点影响力序列和所述真实的节点影响力序列的一致性;其中,τ为肯德尔一致性系数;Nc表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素一致的个数;Nd表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素不一致的个数,n表示网络中节点的个数。
一种基于有限传播域的复杂网络节点影响力度量系统,包括:
建模模块,用于对复杂网络建模,得到复杂网络模型;
判断模块,用于判断所述复杂网络模型的类型;所述类型为局域传播网络或者广域传播网络;
影响力计算模块,用于根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力;
排序模块,用于将所述节点影响力进行排序,得到度量的节点影响力序列。
可选的,所述判断模块,包括:
参数计算单元,用于计算所述复杂网络模型的网络模型参数和节点度值大于平均度值的节点所占比例;所述网络模型参数包括度异质性、平均最短距离和平均度值;
参数判断单元,用于判断所述度异质性、所述平均最短距离、所述平均度值以及所述节点度值大于平均度值的节点所占比例中是否有两个或者两个以上参数满足对应判定条件,得到第一判断结果;所述判定条件包括所述度异质性大于10、所述平均最短距离小于4、所述平均度值大于10以及所述节点度值大于平均度值的节点所占比例小于0.2;
第一类型确定单元,用于若所述第一判断结果为是,则所述复杂网络模型的类型为广域传播网络;
第二类型确定单元,用于若所述第一判断结果为否,则所述复杂网络模型的类型为局域传播网络。
可选的,所述影响力计算模块,包括:
第一节点影响力计算单元,用于当所述复杂网络模型的类型为广域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Inf(u)为节点影响力;Infproximal(u)为近源影响力,Infdistal(u)为远端影响力,Infdistal(u)=Infstep_2(u);λ为调节参数;u为节点u,v为节点v,N(u)为u的邻居节点集合;puv为节点u和节点v之间的传播概率;Infstep_2(u)为节点u对两步之内到达的节点的影响力之和;
第二节点影响力计算单元,用于当所述复杂网络模型的类型为局域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Infproximal(u)=Infstep_2(u),Γ(w)为节点w两步之内到达的节点集合;N(v)为节点v的邻居节点集合;pvw为节点v和节点w之间的传播概率。
可选的,所述影响力计算模块,还包括:
基准参数计算单元,用于利用公式计算基准参数;/>表示基准参数,Round()表示四舍五入;
第一调节参数确定单元,用于当所述复杂网络模型的类型为广域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,/>
第二调节参数确定单元,用于当所述复杂网络模型的类型为局域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,/>
可选的,还包括:
模拟模块,用于利用SIR模型,将所述复杂网络模型中每一个节点作为传播源进行模拟,得到真实的节点影响力序列;
一致性衡量模块,用于利用肯德尔一致性系数衡量所述度量的节点影响力序列和所述真实的节点影响力序列的一致性;其中,τ为肯德尔一致性系数;Nc表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素一致的个数;Nd表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素不一致的个数,n表示网络中节点的个数。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明通过构建复杂网络模型;判断所述复杂网络模型的类型;根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力;将所述节点影响力进行排序,得到度量的节点影响力序列。本发明的方法根据网络类型不同选择不同的影响域,同时,通过设置参数进一步调节在不同传播概率下受度量节点的影响力范围。与现有方法相比,本发明在计算复杂度方面有一定优势,且在不同类型的网络中、不同的传播概率下准确性和鲁棒性更好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种基于有限传播域的复杂网络节点影响力度量方法的流程图;
图2为在一个具体实施方式中的一种基于有限传播域的复杂网络节点影响力度量方法的流程图;
图3为真实网络中不同λ值的LSF方法的τ值随传播概率p变化的示意图;其中,图3(a)为AstroPh网络中不同λ值的LSF方法的τ值随传播概率p变化的示意图;图3(b)为Gowalla网络中不同λ值的LSF方法的τ值随传播概率p变化的示意图;图3(c)为Blog网络中不同λ值的LSF方法的τ值随传播概率p变化的示意图;图3(d)为PGP网络中不同λ值的LSF方法的τ值随传播概率p变化的示意图;
图4为真实网络中不同的度量方法随传播概率p变化的示意图;图4(a)为在AstroPh网络中不同的度量方法随传播概率p变化的示意图;图4(b)为在Gowalla网络中不同的度量方法随传播概率p变化的示意图;图4(c)为在Blog网络中不同的度量方法随传播概率p变化的示意图;图4(d)为在PGP网络中不同的度量方法随传播概率p变化的示意图;
图5为真实网络中四种度量方法不同的度量值出现的频率示意图;图5(a)为AstroPh网络中四种度量方法不同的度量值出现的频率示意图;图5(b)为Gowalla网络中四种度量方法不同的度量值出现的频率示意图;图5(c)为Blog网络中四种度量方法不同的度量值出现的频率示意图;图5(d)为PGP网络中四种度量方法不同的度量值出现的频率示意图;
图6为本发明提供的一种基于有限传播域的复杂网络节点影响力度量系统的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于有限传播域的复杂网络节点影响力度量方法及系统,以解决现有技术中的节点影响力度量方法计算复杂度高以及计算不准确的问题。
本发明提供了一种复杂网络中基于有限传播域传播(Limited Spreading Field,简称LSF)的节点影响力度量方法,用以解决复杂网络中常见的基于(局部或全局)拓扑结构的节点影响力度量方法对传播概率、网络性质敏感的问题。常见的基于局部拓扑结构(例如度中心性)的节点影响力度量方法准确性不够,而基于全局的影响力度量方法(例如介数中心性、接近中心性等)计算复杂度高,无法适用于大规模网络,且这些方法均对网络节点的连接情况及影响力传播概率敏感。本发明的方法会根据网络性质不同选择不同的影响域,同时,通过设置参数进一步调节在不同传播概率下受度量节点的影响力范围。实验证明,与现有方法相比,该方法在计算复杂度方面有一定优势,且在不同类型的网络中、不同的传播概率下准确性和鲁棒性更好。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明提供的一种基于有限传播域的复杂网络节点影响力度量方法得流程图,图2为在一个具体实施例中的一种基于有限传播域的复杂网络节点影响力度量方法得流程图,如图1和图2所示,一种基于有限传播域的复杂网络节点影响力度量方法,包括:
步骤101:对复杂网络建模,得到复杂网络模型。在实际应用中,要度量复杂网络中的节点影响力,首先要对复杂网络建模。复杂网络G的一般建模方法为:建立一个无向的网络G=(V,E),V代表网络中的节点集合,E代表网络中的边集。该网络可用邻接矩阵A={auv}∈{0,1}n×n表示,auv=1表示节点u和节点v有边相连,auv=0则表示节点u和节点v不相连。
步骤102:判断所述复杂网络模型的类型;所述类型为局域传播网络或者广域传播网络。
作为一个可选的实施方式,所述判断所述复杂网络模型的类型,具体包括:
计算所述复杂网络模型的网络模型参数和节点度值大于平均度值的节点所占比例;所述网络模型参数包括度异质性、平均最短距离和平均度值。
判断所述度异质性、所述平均最短距离、所述平均度值以及所述节点度值大于平均度值的节点所占比例中是否有两个或者两个以上参数满足对应判定条件,得到第一判断结果;所述判定条件包括所述度异质性大于10、所述平均最短距离小于4、所述平均度值大于10以及所述节点度值大于平均度值的节点所占比例小于0.2。
若所述第一判断结果为是,则所述复杂网络模型的类型为广域传播网络。
若所述第一判断结果为否,则所述复杂网络模型的类型为局域传播网络。
在实际应用中,计算网络度异质性H、网络平均最短距离<d>、网络平均度值<k>、网络度值较大(节点度值大于网络平均度值<k>)节点所占比例Rk><k>等。
若网络度异质性H、网络平均最短距离<d>、网络平均度值<k>、网络度值较大节点(节点度值大于网络平均度值<k>)所占比例Rk><k>中两个或两个以上参数满足条件H>10,<d><4,<k>>10,Rk><k><0.2,则说明该网络属于广域传播网络。H>10说明网络的度异质性强,即网络中的节点度值分布十分不均,差异性强;<d><4说明网络节点之间平均最短距离较短,信息可在几步之内扩散至绝大部分网络;<k>>10说明网络节点平均度高,即网络比较稠密,信息传播较快;Rk><k><0.2说明网络中度大的节点比较少,这种类型的网络中度值大的节点在信息传播或影响力扩散更容易起支配作用。满足任意两个或两个以上的条件的网络,往往无标度特性和小世界效应更强,度值大的节点在信息传播中所起的支配作用强,由度值大的节点发起或转发的信息传播往往在较小的传播概率下就能产生大范围传播。绝大多数社交网络均属于广域传播网络。
若网络度异质性H、网络平均最短距离<d>、网络平均度值<k>、网络度值较大节点(节点度值大于网络平均度值<k>)所占比例Rk><k>中未达到两个参数满足条件H>10,<d><4,<k>>10,Rk><k><0.2,则说明该网络属于局域传播网络。这种网络节点度分布也满足幂率分布,但相对较为均匀,平均度较小,但度值大的节点较多,节点之间的平均最短距离相对较长,信息扩散较慢。
步骤103:根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力。
作为一个可选的实施方式,所述根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力,具体包括:
当所述复杂网络模型的类型为广域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Inf(u)为节点影响力;Infproximal(u)为近源影响力,Infdistal(u)为远端影响力,Infdistal(u)=Infstep_2(u);λ为调节参数;u为节点u,v为节点v,N(u)为节点u的邻居节点集合;puv为节点u和节点v之间的传播概率;Infstep_2(u)为节点u对两步之内到达的节点的影响力之和。
当所述复杂网络模型的类型为局域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Infproximal(u)=Infstep_2(u),Γ(w)为节点w两步之内到达的节点集合;N(v)为节点v的邻居节点集合;pvw为节点v和节点w之间的传播概率。
在实际应用中,将节点u的影响力Inf(u)分为近源影响力Infproximal(u)和远端影响力Infdistal(u)。由于节点u的影响力受网络结构、传播概率大小的影响,传播范围有所不同,因此,要分情况度量节点u的影响力。
对于局域传播网络,网络中的节点的度分布异质性相对较弱,节点的邻居数量差异性相对较小,且网络平均最短路径较长,即节点u要经过相对较长的传播路径才能到达其它节点。当传播概率较小时,节点u的影响力会局限在较小的范围内,当传播概率较大时,节点的影响力会在度值较大的邻居的传播作用下传递到较远的范围。完整精确计算节点u的影响力路径复杂度高,且根据三度传播理论,每个人只能对三度之内的人产生影响,超出三度影响力十分微弱,所以将节点u的影响力传播的最远范围设置为距节点u四步及四步之内到达的节点。
对于网络中的每一个节点u∈V,计算节点u对两步之内到达的所有节点w的影响力之和Infstep_2(u),计算方法如下:
其中,表示节点u到节点w所有有效路径的集合,有效路径指节点u经过1步或2步到达节点w,pathL表示节点u到节点w的第L条具体路径。
其中,p(vi,vi+1)是vi和vi+1之间的传播概率。
在这种情况下,节点u的近源影响力定义为节点u对两步之内到达的节点的影响力之和,即Infproximal(u)=Infstep_2(u) (2)
对于远端影响力Infdistal(u),则要考虑更远的传播范围,即节点u对于第三步和第四步到达的节点的影响力之和。节点u第三步第四步到达的节点一般较多,路径也较为复杂,如果仍采用精确计算的方法,则耗时长。通常来讲,节点u经过3步或4步激活节点的概率相对较低,只需估计大致影响范围即可,无需进行精确计算。影响范围大,可能激活的节点个数多,因此将第3步第4步到达的节点个数作为远端影响力Infdistal(u),即
所以对于局域传播网络Glocal_inf中的节点u的影响力度量值Inf(u)的计算方式为:
Inf(u)=λ·Infproximal(u)+Infdistal(u) (4)
其中,Γ(w)为w两步之内到达的节点集合,N(u)为u的邻居节点集合,λ为调节参数,用来调节Infproximal(u)和Infdistal(u)在数量级上的差异。
对于广域传播网络,其无标度特性和小世界特性更强,网络中度值大的节点少且在邻居数量方面优势大,对信息传播起支配作用。度值较小的节点数量多,但因为其邻居数量有限,难以通过其产生大范围传播。此外,在这种类型的网络中传播路径短,往往几步传播就能覆盖到网络的整个范围。在这种情况下,当度量目标节点的影响力时,若考虑的影响力范围太远,例如三步或三步以上,网络中的大部分节点都会涵盖其中,往往不能区分不同目标节点的影响力。在这种情况下,目标节点的邻居节点在影响力区分方面起着非常关键的作用。邻居节点多意味着近源影响力相对强,且邻居节点数量还会影响力远端影响力。因此,在度量广域传播网络节点的影响力时,将其影响力范围进一步缩小,将近源影响力缩小至目标节点对其邻居的影响力之和,即
远端影响力用u对两步之内到达的节点的影响力之和来衡量,即
Infdistal(u)=Infstep_2(u) (6)
则广域传播网络中节点u的影响力为:
Inf(u)=λ·Infproximal(u)+Infdistal(u) (7)
λ为调节参数,通过调节λ可根据在不同网络结构、不同传播概率调整Infproximal(u)和Infdistal(u)所占比例,从而影响度量结果。
作为一个可选的实施方式,所述根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力,还包括:
利用公式计算基准参数;/>表示基准参数,Round()表示四舍五入。
当所述复杂网络模型的类型为广域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,
当所述复杂网络模型的类型为局域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,
在实际应用中,已知传播概率p的情况下,计算基准参数表示Infproximal(u)和Infdistal(u)在数量级上的差异。
对于局域传播网络,当p较小(传播概率小于预设阈值)时,目标节点的影响力扩散局限在局部,Infproximal(u)在度量节点影响力时应占据更重要的地位,因此故此时当p较大(传播概率大于或者等于所述预设阈值)时,目标节点的影响力扩散范围增大,Infdistal(u)在度量节点影响力使的重要性增强,故
在广域传播网络中,参数λ的选取规律正好相反。当p较小(传播概率小于预设阈值)时,因为目标节点的邻居数量众多,且网络节点之间的最短路径较短,目标节点的影响力已经扩散到较大的范围,此时Infdistal(u)在度量影响力方面作用更明显,故而当p较大(传播概率大于或者等于所述预设阈值)时,目标节点影响力已基本扩散至整个网络,此时Infdistal(u)无法明确区分不同目标节点的影响力,Infproximal(u)起到了更明显的作用,故/>
步骤104:将所述节点影响力进行排序,得到度量的节点影响力序列。
作为一个可选的实施方式,还包括:
利用SIR模型,将所述复杂网络模型中每一个节点作为传播源进行模拟,得到真实的节点影响力序列。
利用肯德尔一致性系数衡量所述度量的节点影响力序列和所述真实的节点影响力序列的一致性;其中,τ为肯德尔一致性系数;Nc表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素一致的个数;Nd表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素不一致的个数,n表示网络中节点的个数。
在实际应用中,验证度量方法的有效性,运用SIR模型,分别以网络中的每一个节点作为传播源进行模拟,作为节点的真实传播能力(真实的节点影响力)。
利用肯德尔一致性系数τ来衡量度量的节点影响力序列和真实的节点影响力序列之间的一致性,一致性越高说明度量方法效果越好。
给定两组序列X、Y,令(x1,y1),(x2,y2),...,(xn,yn)分别是X、Y的一组观察值。当集合X、Y中任意两个元素(xi,yi)与(xj,yj)的排行相同,即xi>xj且yi>yj,或xi<xj且yi<yj,这两个元素就被认为是一致的;如果出现xi>xj且yi<yj,或xi<xj且yi>yj时,这两个元素被认为是不一致的。当出现xi=xj且yi=yj时,这两个元素既不是一致的也不是不一致的。τ的计算公式为:
Nc表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素一致的个数;Nd表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素不一致的个数,n表示网络中节点的个数。肯德尔一致性系数τ值在1和-1之间,τ=1说明两个序列是相同的,τ=-1说明两个序列完全相反。
为了度量LSF方法的性能,将LSF度量方法与其它常见的度量方法应用于四个真实网络中:在Astro Physics目录发表论文的作者之间的学术协作网络AstroPh、基于位置共享的社交网络Gowalla、基于MSN的博客用户的交流网络Blog、应用Pretty-Good-Privacy算法的加密交流网络PGP。为了方便计算,所有的网络均被视为无向无权连通图。表1为四个真实网络的基本拓扑信息表,如表1所示,列出了四个真实网络的基本拓扑信息,包括网络中节点数目n、网络中的边的数量m、平均度值<k>、最大度值kmax、度异质性平均最短距离<d>、度值大于平均度值的节点所占比例Rk>k、聚类系数C、同配系数r、传播阈值/>
表1四个真实网络的基本拓扑信息表
从以上统计数据可以看出,AstrpPh和Gowalla属于广域传播网络,Blog和PGP属于局域传播网络。
表2为在不同传播概率下基准参数的取值表,如表2所示,列出了四个真实网络数据集在不同传播概率p下基准参数/>的取值,基准参数/>现实了Infproximal(u)和Infdistal(u)在数量级上的差异,可为λ的选取提供参考。
表2在不同传播概率下基准参数的取值表
Network | 0.01 | 0.02 | 0.03 | 0.04 | 0.05 | 0.06 | 0.07 | 0.08 | 0.09 | 0.1 |
AstroPh | 1 | 1 | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Gowalla | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Blog | 10 | 10 | 10 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
PGP | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
图3为真实网络中不同λ值的LSF方法的τ值随传播概率p变化的示意图,此结果是利用SIR传播模型模拟10000次求平均值得来。如图3所示,对每一个传播概率来说,都可找到一个或几个λ值使LSF方法取得一个最优τ值,称这种λ为最优λ。最优λ随传播概率p变化而变化。如图3(a)和图3(b)所示,AstroPh网络和Gowalla网络的最优τ值随p的增大而增大,如图3(c)和图3(d)所示,Blog网络和PGP网络的最优τ值随p的增大而减小。结合表2来看,AstroPh、Gowalla的基准参数为1或10,意味着Infproximal(u)和Infdistal(u)在数量级上的差异为1或10级别。因为AstroPh、Gowalla为广域传播网络,在传播概率p较小时,那些由强影响力节点发起的传播就能很快形成大规模扩散,此时Infdistal(u)作用较强,λ应取较小值,要等于或小于/>因此λ取0.1或1效果较好,而当p较大时,因为广域传播网络的节点之间最短路径较短,此时传播已扩散至全网,因Infdistal(u)中第二步邻居节点w的影响力范围的大规模重叠,会对度量准确性造成干扰,此时Infproximal(u)度量效果更好,因此λ取100或1000等较大值效果较好。Blog、PGP网络为局域传播网络,表现与广域传播网络相反,其基准参数/>为10或100。当传播概率p较小时,由强影响力节点引发的传播局限在局部,因此Infproximal(u)表现更好,此时λ取100或1000等较大值较好。当p较大时,传播扩散至远处,包含更多结构信息的Infdistal(u)所占比例应该更高,因此λ取10或1效果更好。最优λ在不同p下的取值也验证了调节参数λ的选取的分析过程的正确性。
图4为在真实网络中不同的度量方法随传播概率p变化的示意图,如图4所示,每个网络分别保留了两个不同λ取值的LSF度量方法,分为为传播概率较小时效果较好的λ和传播概率较大时度量效果较好的λ,其余方法为基于局部拓扑信息的度中心性方法(DC),基于全局拓扑结构的介数中心性(BC)、接近中心性(CC)、kshell中心性(KS),以及介于两者之间的局部中心性(LC)。从图4中可以看出,在四个网络中,DC和KS随p变化的趋势一致,因为KS值大的节点DC值也大,而LC、BC、CC变化趋势一致,说明不必获取全部拓扑信息也可获得与全局度量指标相同的度量效果。如图4(a)和图4(b)所示,在AstroPh和Gowalla中,DC与KS随p的增大而度量效果变好,LC、BC、CC随p的增大而度量效果变差,如图4(c)和图4(d)所示,而在Blog和PGP中则刚好相反,DC与KS随p的增大而度量效果变差,LC、BC、CC随p的增大而度量效果变好。LSF度量方法在大部分传播概率下度量效果要好于其它方法,且它的表现相对DC、LC、BC等而言较为稳定,基本克服了常见度量方法对网络拓扑性质、传播概率敏感的问题。
图5为真实网络中四种度量方法不同的度量值出现的频率示意图。从图5中可以看出,DC、KS度量结果中大量节点的度量值相同,相同的度量值意味着这些节点的影响力无法区分,这也是导致DC、KS度量效果不佳的原因。LC和LSF重复的度量值相对较少,尤其是对于排在前面的节点,基本没有重复,意味LSF对影响力大的节点有着很好的区分能力。
本发明提出的一种新的考虑网络类型和传播概率的节点影响力度量方法,希望在不同类型的网络中、在不同的传播概率下均能获得很好的度量效果。本发明在度量节点影响力时考虑了网络拓扑结构、传播概率对常见度量指标的影响,所提出的方法总结了节点影响力传播受拓扑结构、传播概率影响的一般规律,根据不同的网络拓扑特征采用不同的评价方法,通过可调节的参数使其在不同的传播概率下均能获得较好的度量效果。该方法是一种新的度量节点影响力的方法,具有准确性高、适用性强,具有较低的时间和计算复杂度的特点,可以应用于大规模的复杂网络中。
本发明的有益效果:
根据目标节点的局部拓扑信息进行计算,无需获得全局信息,算法复杂度为O(n<k>2),计算复杂度较低,适用于大规模网络。
本发明在不同的网络、不同的传播概率下均能有较好的表现,准确性和鲁棒性要优于度中心性、局部中心性、介数中心性等常见度量方法。
本发明对节点影响力的区分度要优于度中心性、KS中心性方法,尤其对影响力大的节点能做很好的区分。
图6为本发明提供的一种基于有限传播域的复杂网络节点影响力度量系统的结构图,如图6所示,包括:
建模模块601,用于对复杂网络建模,得到复杂网络模型。
判断模块602,用于判断所述复杂网络模型的类型;所述类型为局域传播网络或者广域传播网络。
影响力计算模块603,用于根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力。
排序模块604,用于将所述节点影响力进行排序,得到度量的节点影响力序列。
作为一种可选的实施方式,所述判断模块602,包括:
参数计算单元,用于计算所述复杂网络模型的网络模型参数和节点度值大于平均度值的节点所占比例;所述网络模型参数包括度异质性、平均最短距离和平均度值。
参数判断单元,用于判断所述度异质性、所述平均最短距离、所述平均度值以及所述节点度值大于平均度值的节点所占比例中是否有两个或者两个以上参数满足对应判定条件,得到第一判断结果。所述判定条件包括所述度异质性大于10、所述平均最短距离小于4、所述平均度值大于10以及所述节点度值大于平均度值的节点所占比例小于0.2。
第一类型确定单元,用于若所述第一判断结果为是,则所述复杂网络模型的类型为广域传播网络。
第二类型确定单元,用于若所述第一判断结果为否,则所述复杂网络模型的类型为局域传播网络。
作为一种可选的实施方式,所述影响力计算模块603,包括:
第一节点影响力计算单元,用于当所述复杂网络模型的类型为广域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Inf(u)为节点影响力;Infproximal(u)为近源影响力,为远端影响力,Infdistal(u)=Infstep_2(u);λ为调节参数;u为节点u,v为节点v,N(u)为节点u的邻居节点集合;puv为节点u和节点v之间的传播概率;Infstep_2(u)为节点u对两步之内到达的节点的影响力之和。
第二节点影响力计算单元,用于当所述复杂网络模型的类型为局域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Infproximal(u)=Infstep_2(u),Γ(w)为节点w两步之内到达的节点集合;N(v)为节点v的邻居节点集合;pvw为节点v和节点w之间的传播概率。
作为一种可选的实施方式,所述影响力计算模块603,还包括:
基准参数计算单元,用于利用公式计算基准参数;/>表示基准参数,Round()表示四舍五入。
第一调节参数确定单元,用于当所述复杂网络模型的类型为广域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,/>
第二调节参数确定单元,用于当所述复杂网络模型的类型为局域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,/>
作为一种可选的实施方式,还包括:
模拟模块,用于利用SIR模型,将所述复杂网络模型中每一个节点作为传播源进行模拟,得到真实的节点影响力序列。
一致性衡量模块,用于利用肯德尔一致性系数衡量所述度量的节点影响力序列和所述真实的节点影响力序列的一致性;其中,τ为肯德尔一致性系数;Nc表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素一致的个数;Nd表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素不一致的个数,n表示网络中节点的个数。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种基于有限传播域的复杂网络节点影响力度量方法,其特征在于,包括:
对复杂网络建模,得到复杂网络模型;
判断所述复杂网络模型的类型;所述类型为局域传播网络或者广域传播网络;
根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力;
所述根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力,具体包括:
当所述复杂网络模型的类型为广域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Inf(u)为节点影响力;Infproximal(u)为近源影响力,Infdistal(u)为远端影响力,Infdistal(u)=Infstep_2(u);λ为调节参数;u为节点u,v为节点v,N(u)为节点u的邻居节点集合;puv为节点u和节点v之间的传播概率;Infstep_2(u)为节点u对两步之内到达的节点的影响力之和;
当所述复杂网络模型的类型为局域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Infproximal(u)=Infstep_2(u),Γ(w)为节点w两步之内到达的节点集合;N(v)为节点v的邻居节点集合;pvw为节点v和节点w之间的传播概率;
将所述节点影响力进行排序,得到度量的节点影响力序列。
2.根据权利要求1所述的基于有限传播域的复杂网络节点影响力度量方法,其特征在于,所述判断所述复杂网络模型的类型,具体包括:
计算所述复杂网络模型的网络模型参数和节点度值大于平均度值的节点所占比例;所述网络模型参数包括度异质性、平均最短距离和平均度值;
判断所述度异质性、所述平均最短距离、所述平均度值以及所述节点度值大于平均度值的节点所占比例中是否有两个或者两个以上参数满足对应判定条件,得到第一判断结果;所述判定条件包括所述度异质性大于10、所述平均最短距离小于4、所述平均度值大于10以及所述节点度值大于平均度值的节点所占比例小于0.2;
若所述第一判断结果为是,则所述复杂网络模型的类型为广域传播网络;
若所述第一判断结果为否,则所述复杂网络模型的类型为局域传播网络。
3.根据权利要求1所述的基于有限传播域的复杂网络节点影响力度量方法,其特征在于,所述根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力,还包括:
利用公式计算基准参数;/>表示基准参数,Round()表示四舍五入;
当所述复杂网络模型的类型为广域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,
当所述复杂网络模型的类型为局域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,
4.根据权利要求1所述的基于有限传播域的复杂网络节点影响力度量方法,其特征在于,还包括:
利用SIR模型,将所述复杂网络模型中每一个节点作为传播源进行模拟,得到真实的节点影响力序列;
利用肯德尔一致性系数衡量所述度量的节点影响力序列和所述真实的节点影响力序列的一致性;其中,τ为肯德尔一致性系数;Nc表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素一致的个数;Nd表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素不一致的个数,n表示网络中节点的个数。
5.一种基于有限传播域的复杂网络节点影响力度量系统,其特征在于,包括:
建模模块,用于对复杂网络建模,得到复杂网络模型;
判断模块,用于判断所述复杂网络模型的类型;所述类型为局域传播网络或者广域传播网络;
影响力计算模块,用于根据所述复杂网络模型的类型,计算所述复杂网络模型中各节点的影响力,得到节点影响力;
所述影响力计算模块,包括:
第一节点影响力计算单元,用于当所述复杂网络模型的类型为广域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Inf(u)为节点影响力;Infproximal(u)为近源影响力,Infdistal(u)为远端影响力,Infdistal(u)=Infstep_2(u);λ为调节参数;u为节点u,v为节点v,N(u)为节点u的邻居节点集合;puv为节点u和节点v之间的传播概率;Infstep_2(u)为节点u对两步之内到达的节点的影响力之和;
第二节点影响力计算单元,用于当所述复杂网络模型的类型为局域传播网络时,利用公式Inf(u)=λ·Infproximal(u)+Infdistal(u)计算所述节点影响力;其中,Infproximal(u)=Infstep_2(u),Γ(w)为节点w两步之内到达的节点集合;N(v)为节点v的邻居节点集合;pvw为节点v和节点w之间的传播概率;
排序模块,用于将所述节点影响力进行排序,得到度量的节点影响力序列。
6.根据权利要求5所述的基于有限传播域的复杂网络节点影响力度量系统,其特征在于,所述判断模块,包括:
参数计算单元,用于计算所述复杂网络模型的网络模型参数和节点度值大于平均度值的节点所占比例;所述网络模型参数包括度异质性、平均最短距离和平均度值;
参数判断单元,用于判断所述度异质性、所述平均最短距离、所述平均度值以及所述节点度值大于平均度值的节点所占比例中是否有两个或者两个以上参数满足对应判定条件,得到第一判断结果;所述判定条件包括所述度异质性大于10、所述平均最短距离小于4、所述平均度值大于10以及所述节点度值大于平均度值的节点所占比例小于0.2;
第一类型确定单元,用于若所述第一判断结果为是,则所述复杂网络模型的类型为广域传播网络;
第二类型确定单元,用于若所述第一判断结果为否,则所述复杂网络模型的类型为局域传播网络。
7.根据权利要求5所述的基于有限传播域的复杂网络节点影响力度量系统,其特征在于,所述影响力计算模块,还包括:
基准参数计算单元,用于利用公式计算基准参数;/>表示基准参数,Round()表示四舍五入;
第一调节参数确定单元,用于当所述复杂网络模型的类型为广域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,/>
第二调节参数确定单元,用于当所述复杂网络模型的类型为局域传播网络,所述传播概率小于预设阈值时,所述传播概率大于或者等于所述预设阈值时,/>
8.根据权利要求5所述的基于有限传播域的复杂网络节点影响力度量系统,其特征在于,还包括:
模拟模块,用于利用SIR模型,将所述复杂网络模型中每一个节点作为传播源进行模拟,得到真实的节点影响力序列;
一致性衡量模块,用于利用肯德尔一致性系数衡量所述度量的节点影响力序列和所述真实的节点影响力序列的一致性;其中,τ为肯德尔一致性系数;Nc表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素一致的个数;Nd表示所述度量的节点影响力序列和所述真实的节点影响力序列中对应的两个元素不一致的个数,n表示网络中节点的个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210275906.9A CN114666229B (zh) | 2022-03-21 | 2022-03-21 | 基于有限传播域的复杂网络节点影响力度量方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210275906.9A CN114666229B (zh) | 2022-03-21 | 2022-03-21 | 基于有限传播域的复杂网络节点影响力度量方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114666229A CN114666229A (zh) | 2022-06-24 |
CN114666229B true CN114666229B (zh) | 2023-10-03 |
Family
ID=82031795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210275906.9A Active CN114666229B (zh) | 2022-03-21 | 2022-03-21 | 基于有限传播域的复杂网络节点影响力度量方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114666229B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101383748A (zh) * | 2008-10-24 | 2009-03-11 | 北京航空航天大学 | 一种复杂网络中的社区划分方法 |
CN109272228A (zh) * | 2018-09-12 | 2019-01-25 | 石家庄铁道大学 | 基于科研团队合作网络的科研影响力分析方法 |
CN113537461A (zh) * | 2021-06-30 | 2021-10-22 | 中国人民解放军战略支援部队信息工程大学 | 基于sir值学习的网络关键节点发现方法及系统 |
CN113723504A (zh) * | 2021-08-28 | 2021-11-30 | 重庆理工大学 | 实现复杂网络中有影响力传播者识别方法 |
-
2022
- 2022-03-21 CN CN202210275906.9A patent/CN114666229B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101383748A (zh) * | 2008-10-24 | 2009-03-11 | 北京航空航天大学 | 一种复杂网络中的社区划分方法 |
CN109272228A (zh) * | 2018-09-12 | 2019-01-25 | 石家庄铁道大学 | 基于科研团队合作网络的科研影响力分析方法 |
CN113537461A (zh) * | 2021-06-30 | 2021-10-22 | 中国人民解放军战略支援部队信息工程大学 | 基于sir值学习的网络关键节点发现方法及系统 |
CN113723504A (zh) * | 2021-08-28 | 2021-11-30 | 重庆理工大学 | 实现复杂网络中有影响力传播者识别方法 |
Non-Patent Citations (2)
Title |
---|
基于复杂网络的群行为扩散模型研究 ————以某高校新生晚自习学习行为为例;王伟;中国优秀硕士学位论文全文数据库;全文 * |
有限步传播范围期望指标判别节点传播影响力;李鑫 等;《物理学报》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114666229A (zh) | 2022-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109005055B (zh) | 基于多尺度拓扑空间的复杂网络信息节点重要度评价方法 | |
Rasti et al. | Respondent-driven sampling for characterizing unstructured overlays | |
CN107276793B (zh) | 基于概率跳转随机游走的节点重要性度量方法 | |
CN105991397B (zh) | 信息传播方法和装置 | |
CN105574191B (zh) | 在线社会网络多源点信息溯源系统及其方法 | |
CN109921939B (zh) | 一种通信网络中关键节点的选取方法及系统 | |
CN103326904B (zh) | 一种基于多参数认知的快速网络拓扑推断方法 | |
Zhang et al. | Where to: Crowd-aided path selection | |
CN107317704A (zh) | 一种基于紧密度和结构洞的复杂网络重要节点排序方法 | |
CN109921921B (zh) | 一种时变网络中时效稳定社团的检测方法和装置 | |
CN113422695B (zh) | 一种提高物联网拓扑结构鲁棒性能的优化方法 | |
Zhang et al. | Identifying node importance by combining betweenness centrality and katz centrality | |
CN110213164A (zh) | 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 | |
CN108809697A (zh) | 基于影响力最大化的社交网络关键节点识别方法及系统 | |
CN110059731A (zh) | 一种基于加权k-阶传播数的节点重要性评价方法 | |
Liu et al. | Node localization algorithm for wireless sensor networks based on static anchor node location selection strategy | |
Pechlivanoglou et al. | Fast and accurate mining of node importance in trajectory networks | |
Zhang et al. | Scaling of mean first-passage time as efficiency measure of nodes sending information on scale-free Koch networks | |
CN114666229B (zh) | 基于有限传播域的复杂网络节点影响力度量方法及系统 | |
CN108965287B (zh) | 一种基于有限临时删边的病毒传播控制方法 | |
CN108470251A (zh) | 基于平均互信息的社区划分质量评价方法及系统 | |
Zhang et al. | Incompatibility networks as models of scale-free small-world graphs | |
CN108833461A (zh) | 基于网络分解的社交网络关键节点发现方法及系统 | |
CN114329867B (zh) | 一种基于模体的无标度网络鲁棒性度量方法 | |
CN111030854A (zh) | 一种Spark云服务环境下面的复杂网络社团发现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |