CN115664976A - 一种基于网络广义能量和信息熵的关键节点识别方法 - Google Patents
一种基于网络广义能量和信息熵的关键节点识别方法 Download PDFInfo
- Publication number
- CN115664976A CN115664976A CN202211284469.3A CN202211284469A CN115664976A CN 115664976 A CN115664976 A CN 115664976A CN 202211284469 A CN202211284469 A CN 202211284469A CN 115664976 A CN115664976 A CN 115664976A
- Authority
- CN
- China
- Prior art keywords
- node
- network
- generalized energy
- energy
- generalized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于网络广义能量和信息熵的关键节点识别方法,包括步骤:数据标准化;节点影响力评分;节点排序,按照节点的评分进行降序排列。与现有技术相比,本发明创造性的将网络能量和信息熵理论结合起来,即考虑了网络节点的局部能量熵属性,又考虑了节点的一阶邻居和二阶邻居的能量熵,能有效提高关键节点的识别准确性;通过将网络广义能量转化为网络拓扑指标来降低计算的时间复杂度,提高关键节点的识别有效性。
Description
技术领域
本发明涉及计算机网络领域,尤其涉及一种基于网络广义能量和信息熵的关键节点识别方法。
背景技术
复杂网络的关键节点是指相比网络其他节点而言,能够在更大程度上影响网络的结构与功能的一些特殊节点。近年来,节点重要性排序研究受到越来越广泛的关注,不仅因为其重大的理论研究意义,更因为其广泛的实际应用价值。几乎所有的复杂系统(比如社会、生物、信息、技术、交通运输系统)都可以自然地表示为网络。其中,节点代表系统的各种构成要素,节点间的连边表示要素之间的联系。应用复杂网络的理论和方法能够帮助我们更好地理解这些复杂系统的特征,并对其进行更好地预测和控制。重要节点一般数量非常少,但其影响却可以快速地波及到网络中大部分节点。例如,在对一个无标度网络的蓄意攻击中,少量最重要节点被攻击就会导致整个网络瓦解;微博中最有影响力的几个用户所发的微博很快就能传遍整个网络;仅仅1%的公司却控制着40%的全球经济。可见重要节点对网络的结构和功能有着巨大的影响,节点重要性的排序和重要节点的挖掘意义重大。
迄今为止,学者们已经提出了一系列经典的方法来识别复杂网络的关键节点,然而,这些现有的方法在不同程度上都存在一些缺陷。例如度中心性(degree centrality,DC),它只考虑有关网络节点的局部信息;接近中心性(closeness centrality,CC)和介数中心性(betweenness centrality,BC),它们关注最短路径,具有较高的计算复杂性,如果大多数信息不是通过最短路径传输的,则它们的性能很差;特征向量中心性(eigenvectorcentrality,EC),它在处理大规模、不对称和异构网络方面面临限制;K-shell算法,它在区分具有相同度值的节点方面表现不佳。
发明内容
为克服现有技术的不足,本发明提出一种基于网络广义能量和信息熵的关键节点识别方法。
本发明的技术方案是这样实现的,一种基于网络广义能量和信息熵的关键节点识别方法,包括步骤
S1:数据标准化,将选取的网络数据集抽象成为网络图并计算出邻接矩阵A(G)、度矩阵D(G)和广义矩阵Aα(G);
S2:节点影响力评分,包括步骤
S3:将步骤2中求得的网络中各网络节点的GEEC值进行降序排列,排序后的结果用GEEC序列R={R1,R2,...,Rn}表示,其中,r1表示的是网络中GEEC值最大的节点的数值,rn表示的是网络中GEEC值最小的节点的数值。
进一步地,所述基于网络广义能量和信息熵的关键节点识别方法,还包括步骤S4:精准性分析,包括步骤
S41:使用SIR传播模型来衡量网络节点的真实传播能力,生成生成一个SIR模型的序列σ={σ1,σ2,...,σn};
S42:获取由不同度量方式所得的节点序列R,使用Kendall相关系数来表示序列σ和序列R的相关性,Kendall相关系数的定义为其中,nc是两个序列中一致元素对的数目,nd是两个序列中不一致元素对的数目,n是两个元素对的规模;
S45:结果分析。
更进一步地,在S42中获取由6种度量方式所得的节点序列R。
本发明的有益效果在于,与现有技术相比,本发明将网络能量和信息熵理论结合起来,一方面,即考虑了网络节点的局部能量熵属性,又考虑了节点的一阶邻居和二阶邻居的能量熵,能有效提高关键节点的识别准确性;另一方面,通过将网络广义能量转化为网络拓扑指标来降低计算的时间复杂度,提高关键节点的识别有效性。
附图说明
图1是本发明基于网络广义能量和信息熵的关键节点识别方法一个实施例流程图;
图2是基于网络广义能量和信息熵的关键节点识别方法原理图;
图3是采用本发明方法与6种中心性测度DC、BC、CC、CLD、CNC、LEC方法得到的关键节点识别准确性在Jazz网络中的Kendall相关系数对比图;
图4是采用本发明方法与6种中心性测度DC、BC、CC、CLD、CNC、LEC方法得到的关键节点识别准确性在USAir网络上的F(L)对比图;
图5是采用本发明方法与6种中心性测度DC、BC、CC、CLD、CNC、LEC方法得到的关键节点识别准确性在9个真实网络上单调性对比表。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1和图2,本发明提供的基于网络广义能量和信息熵的关键节点识别方法具体包括:
步骤1,数据标准化,将选取的网络数据集抽象成为网络图并计算出邻接矩阵,度矩阵和广义矩阵;
S11:根据网络结构将其转化为可处理的数据,邻接矩阵A(G),度矩阵D(G)和广义矩阵Aα(G),实现数据标准化。网络G中的节点代表实体,实体之间的联系抽象为一条边,如果节点及其连边关系用邻接矩阵A=(aij)n×n来表示,其中,n表示网络中节点的数量,aij表示网络中任意两个节点i和j间的关系。度矩阵D(G)=diag(d1,d2,…,dn),其中di表示节点vi的度,即节点vi邻居节点的个数。广义矩阵Dα(G)=αD(G)+(1-α)A(G),其中α为邻接矩阵和度矩阵的调节参数。
步骤2,节点评分,结合广义能量理论和信息熵理论提出广义能量熵中心性(GEEC),将网络拓扑结构数值化并计算所有节点的GEEC值,即节点影响力评分。
S21:计算网络整体的广义能量;网络的广义能量计算公式为其中μi为网络广义矩阵对应的特征值,我们通过矩阵理论和图谱理论相关知识将广义能量的计算转化为网络拓扑指标的计算,显著降低了计算的时间复杂度,即其中di为网络节点vi的度,α∈[0,1]为广义矩阵的可调参数,。
S23:计算网络节点的一阶和二阶广义能量;一阶是指节点的邻居集合,二阶是指节点的邻居的邻居集合,节点vi的广义能量用Ei来简记,则节点vi的一阶广义能量和二阶广义能量的计算公式分别为和其中Ni是节点vi的邻居集合。
S26:结合节点的一阶和二阶广义能量熵信息计算广义能量熵;考虑到节点vi的传播影响主要由一阶和二阶邻居决定,且一阶邻居的贡献大于二阶邻居。因此,一阶广义能量熵的系数默认为1,二阶广义能量熵值的系数用λi表示。则节点vi的广义能量熵表示为GEE(vi)=GEE1(vi)+λiGEE2(vi),其中
S29:通过本发明的主要方法GEEC计算可得网络每个节点的重要性评分,评分越高,意味着节点关键。
步骤3,将步骤2中求得的网络中各节点的GEEC值进行降序排列,排序后的结果用GEEC序列R={R1,R2,...,Rn}表示,其中,r1表示的是网络中GEEC值最大的节点的数值,rn表示的是网络中GEEC值最小的节点的数值;
步骤4,精准性分析,利用SIR模型对节点的真实传播能力进行评估,进而对比分析本发明的精准性和有效性。
S41:SIR传播模型被用来衡量节点的真实传播能力。在SIR模型中,网络节点的状态被划分为三类,易感(S)、感染(I)和恢复(R)。起初,假设只有一个节点vi处于感染状态,其他节点处于易感状态,受感染的节点以概率β感染易感状态的邻居节点,类似地,感染状态的节点以概率γ转变为恢复状态,重复此过程,直到网络中没有处于感染状态的节点,此时网络中恢复状态的节点数被认为是节点vi的真实传播能力。最终,得到网络中的每个节点的真实传播能力,并生成一个SIR模型的序列σ={σ1,σ2,...,σn}。
S42:Kendall相关系数:S41步骤计算完节点的传播能力并生成序列σ之后,再获取由不同度量方式所得的节点序列R。两个列表的相关性越高,说明对应方法在评估节点扩展能力方面的准确性越高,可以使用Kendall相关系数来表示两个列表的相关性。
假设{(σ1,R1),(σ2,R2),...,(σn,Rn)}是由序列σ和序列R构成的一组有序对,对于其中的任意两个元素对(σi,Ri)和(σj,Rj),当σi>σj且Ri>Rj或σi<σj且Ri<Rj时,则认为这两个元素对是一致的;当σi>σj且Ri<Rj或σi>σj且Ri<Rj时,则认为这两个元素对不是一致的;当σi=σj或Ri=Rj时,则这两个元素对被认为既不是一致的也不是不一致的。
其中,nc是两个序列中一致元素对的数目,nd是两个序列中不一致元素对的数目,n是两个元素对的规模。
S43:单调性(Monotonicity)函数被用于检验各中心性度量方式区分节点传播效率的能力。单调性(M)的定义如下所示:
其中,n是序列R中元素的个数,Nr是在第r个等级中元素的个数。M的值始终是范围[0,1]内的一个数字,M值越大,则意味着该度量方式对于网络中的节点判别能力越强。
S44:众所周知,影响力越大的节点排名越高,但Kendall相关系数考虑了序列σ和R中的所有排名,为了说明关键节点的排名准确性,使用排名相似性函数表征序列σ和R的前L项排名的相关性,其中σ(L)和R(L)分别代表σ和R的前L项排名。
S45:请参见图3、图4和图5,将步骤2中求得的GEEC序列,6种经典方法得到的序列R={R1,R2,...,Rn}与步骤S41的SIR模型的序列σ={σ1,σ2,...,σn}进行对比发现,GEEC方法和SIR模型的相关性最高,即Kendall相关系数最大。进一步的,GEEC的单调性(M)值在9个实际网络中是最接近于1的,说明GEEC方法对网络节点的识别能力是最强的。对网络的关键节点排名分析发现,GEEC方法与关键节点的真实传播能力是最相关的,即该方法能准确的识别网络中的关键节点,对于网络的演变和管控具有非常大的意义。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (3)
1.一种基于网络广义能量和信息熵的关键节点识别方法,其特征在于,包括步骤
S1:数据标准化,将选取的网络数据集抽象成为网络图并计算出邻接矩阵A(G)、度矩阵D(G)和广义矩阵Aα(G);
S2:节点影响力评分,包括步骤
S3:将步骤2中求得的网络中各网络节点的GEEC值进行降序排列,排序后的结果用GEEC序列R={R1,R2,...,Rn}表示,其中,r1表示的是网络中GEEC值最大的节点的数值,rn表示的是网络中GEEC值最小的节点的数值。
2.如权利要求1所述的基于网络广义能量和信息熵的关键节点识别方法,其特征在于,所述基于网络广义能量和信息熵的关键节点识别方法,还包括步骤S4:精准性分析,包括步骤
S41:使用SIR传播模型来衡量网络节点的真实传播能力,生成生成一个SIR模型的序列σ={σ1,σ2,...,σn};
S42:获取由不同度量方式所得的节点序列R,使用Kendall相关系数来表示序列σ和序列R的相关性,Kendall相关系数的定义为其中,nc是两个序列中一致元素对的数目,nd是两个序列中不一致元素对的数目,n是两个元素对的规模;
S45:结果分析。
3.如权利要求2所述的基于网络广义能量和信息熵的关键节点识别方法,其特征在于,在S42中获取由6种度量方式所得的节点序列R。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211284469.3A CN115664976A (zh) | 2022-10-17 | 2022-10-17 | 一种基于网络广义能量和信息熵的关键节点识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211284469.3A CN115664976A (zh) | 2022-10-17 | 2022-10-17 | 一种基于网络广义能量和信息熵的关键节点识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115664976A true CN115664976A (zh) | 2023-01-31 |
Family
ID=84988809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211284469.3A Pending CN115664976A (zh) | 2022-10-17 | 2022-10-17 | 一种基于网络广义能量和信息熵的关键节点识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115664976A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117035118A (zh) * | 2023-08-17 | 2023-11-10 | 南京财经大学 | 一种基于邻域信息熵和有效距离的复杂网络关键节点挖掘方法 |
-
2022
- 2022-10-17 CN CN202211284469.3A patent/CN115664976A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117035118A (zh) * | 2023-08-17 | 2023-11-10 | 南京财经大学 | 一种基于邻域信息熵和有效距离的复杂网络关键节点挖掘方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Folino et al. | An evolutionary multiobjective approach for community discovery in dynamic networks | |
CN105279397B (zh) | 一种识别蛋白质相互作用网络中关键蛋白质的方法 | |
CN109005055B (zh) | 基于多尺度拓扑空间的复杂网络信息节点重要度评价方法 | |
Yang et al. | Index-based optimal algorithm for computing k-cores in large uncertain graphs | |
Chen et al. | Link prediction on directed networks based on AUC optimization | |
Zanghi et al. | Strategies for online inference of model-based clustering in large and growing networks | |
Shen et al. | Cross-network learning with fuzzy labels for seed selection and graph sparsification in influence maximization | |
CN115664976A (zh) | 一种基于网络广义能量和信息熵的关键节点识别方法 | |
CN114463072A (zh) | 基于业务需求ai预测的电商服务优化方法及大数据系统 | |
Huang et al. | Discovering association rules with graph patterns in temporal networks | |
CN114936307A (zh) | 一种范式化图模型构建方法 | |
CN108470251B (zh) | 基于平均互信息的社区划分质量评价方法及系统 | |
CN113824707A (zh) | 一种基于知识图谱的网站性能拨测度量方法和装置 | |
Zhao et al. | A large-scale group decision-making method based on improved affinity propagation algorithm and adjustable minimum-cost consensus model in social networks | |
Patil et al. | PULSE, progressive upper level set scan statistic for geospatial hotspot detection | |
CN116450938A (zh) | 一种基于图谱的工单推荐实现方法及系统 | |
CN114708015A (zh) | 采用大数据深度挖掘的业务需求预测方法及大数据系统 | |
Liu et al. | Hierarchical community discovery for multi-stage IP bearer network upgradation | |
Li et al. | Fast and accurate computation of role similarity via vertex centrality | |
Liu et al. | An entropy-based gravity model for influential spreaders identification in complex networks | |
Lai et al. | Link prediction in complex networks via modularity-based belief propagation | |
CN111709846A (zh) | 基于线图的局部社区发现算法 | |
Zhang et al. | Community and local information preserved link prediction in complex networks | |
Jia et al. | The overlapping community discovery algorithm based on the local interaction model | |
Bian et al. | Research on a privacy preserving clustering method for social network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |