CN114090860A - 一种加权网络节点重要性确定方法及系统 - Google Patents

一种加权网络节点重要性确定方法及系统 Download PDF

Info

Publication number
CN114090860A
CN114090860A CN202111341218.XA CN202111341218A CN114090860A CN 114090860 A CN114090860 A CN 114090860A CN 202111341218 A CN202111341218 A CN 202111341218A CN 114090860 A CN114090860 A CN 114090860A
Authority
CN
China
Prior art keywords
node
importance
network
probability
weighted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111341218.XA
Other languages
English (en)
Inventor
赵娜
陈琳洁
景铭
李�杰
龙镇
黄群芳
王剑
马耀飞
王浩
方凌芸
王鑫锴
王莹港
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan University YNU
Original Assignee
Yunnan University YNU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan University YNU filed Critical Yunnan University YNU
Priority to CN202111341218.XA priority Critical patent/CN114090860A/zh
Publication of CN114090860A publication Critical patent/CN114090860A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种加权网络节点重要性确定方法及系统。所述方法包括:获取待处理的加权网络;对所述加权网络中的边的权重值进行预处理,生成处理后边的权重值;根据所述处理后边的权重值计算所述加权网络中节点对应的中间概率;根据所述中间概率计算所述加权网络中节点对应的重要性得分;对所述加权网络中节点按照所述重要性得分进行重要性排序。本发明方法及系统将权重所携带的对节点重要性有贡献的信息刻画为节点在各种可能性下的得分概率,通过累加该节点在各种可能性情况下的概率,进一步得出该节点最终的重要性得分,从而能够以很低的计算时间复杂度给出网络中所有节点重要性的精确排序。

Description

一种加权网络节点重要性确定方法及系统
技术领域
本发明涉及计算机网络技术领域,特别是涉及一种加权网络节点重要性确 定方法及系统。
背景技术
网络中的节点重要性判断是通过已知的网络拓扑和网络节点特性,对网络 中的网络节点重要程度的判断。在众多复杂网络的研究中,对网络节点的重要 性研究已经成为了研究复杂网络的结构的重要工具,其成果在许多领域中得到 广泛的应用。通过判断节点的重要性来对计算机网络中的重要节点进行保护可 以提高网络的健壮性。目前,科学家们提出了许多基于网络拓扑来对节点的重 要性进行判断的方法。然而这些算法在实际表现中对节点重要性的判断精确度 低,时间复杂度高。
例如现有技术中提出的w-core分解算法,通过少量可调参数很好地解决 了度与权重对节点重要性提供相应贡献的问题。类似于w-core分解算法,现 有技术中提出的s-core分解算法也参照了k-core算法思想,并通过计算节点强 度的方式将节点的度和权重同时纳入对节点重要性的考量。以上两种算法时间 复杂度较高,且对同一层内的节点重要性无法分辨,因此将会出现大量同一 core层的节点排名相同的情况。例如,基于网页排名网络衍生出的PageRank算 法,该算法的不足之处在于它假设节点跳转概率相同并且算法参数需依靠经验 决定。LeaderRank算法很好地解决了这一问题,且拥有更好的收敛性和更强 的鲁棒性。在最近的一项研究中改进了H-Index算法,提出了可用于无向加权 网络算法HI。经典的介数中心性算法(BT)、接近中心性算法(CL)、特征向量中 心性算法(EC)以及前文所述的HI算法,都能较为准确地评价节点重要性, 但由于它们均存在时间复杂度高的弊端,并非是一个理想的方案。近年提出的 ASP算法和基于信息熵的改进算法(IE)也存在这一弊端。基于D-S证据理论的评 估方法综合了节点的度和点强度等指标来综合考量节点重要性,类似于贝叶斯 概率理论,可估计节点重要性的概率;通过结合网络的拓扑结构和动态特性, 现有技术还提出了动态敏感中心性指标来定位有影响力的节点;根据网络不同的规模,现有技术还设计了一种多尺度节点重要性度量方法。这些可适用于加 权图的算法取得了一定成效,但仍存在一定局限性,主要体现在:(1)对于 无向加权网络,节点连边的权重对该节点重要性做正向贡献或反向贡献它们之 间的关系是怎样的?以及权重对节点重要性的贡献是定义为线性还是非线性 关系更加合理?这些问题都需要寻求一种统一的框架用于定义、表征和量化度 量。(2)现有算法难以同时兼顾排序的准确性和时间效率。因此,在以上两 方面还有待进一步的探索与创新。
发明内容
本发明的目的是提供一种加权网络节点重要性确定方法及系统,能够以很 低的计算时间复杂度给出网络中所有节点重要性的精确排序。
为实现上述目的,本发明提供了如下方案:
一种加权网络节点重要性确定方法,包括:
获取待处理的加权网络;
对所述加权网络中的边的权重值进行预处理,生成处理后边的权重值;
根据所述处理后边的权重值计算所述加权网络中节点对应的中间概率;
根据所述中间概率计算所述加权网络中节点对应的重要性得分;
对所述加权网络中节点按照所述重要性得分进行重要性排序。
可选地,所述对所述加权网络中的边的权重值进行预处理,生成处理后边 的权重值,具体包括:
当边的权重值与节点的重要性正相关时,采用公式
Figure BDA0003352143560000021
对所述加权网络中的边的权重值wij进行预处 理,生成处理后边的权重值w'ij
当边的权重值与节点的重要性反相关时,采用公式
Figure BDA0003352143560000031
对所述加权网络中的边的权重值wij进行预处 理,生成处理后边的权重值w'ij;其中wmin表示最小边权重;wmax表示最大 边权重;d表示第一非参数系数,l表示第二非参数系数。
可选地,所述根据所述处理后边的权重值计算所述加权网络中节点对应的 中间概率,具体包括:
根据所述处理后边的权重值w'ij,采用公式 X(p,q)=w'ij X(p-1,q-1)+(1-w'ij)X(p-1,q)计算所述加权网络中 节点对应的中间概率X(p,q);所述中间概率X(p,q)在计算过程中的边界条 件定义为
Figure BDA0003352143560000032
其中deg(i)为节点i在所 述加权网络中的度;p和q为整数。
可选地,所述根据所述中间概率计算所述加权网络中节点对应的重要性得 分,具体包括:
根据所述中间概率X(p,q),采用公式
Figure BDA0003352143560000033
计算节点i的度值为可能性得分c的概率Pr(deg(i)=c);
根据所述概率Pr(deg(i)=c),采用公式
Figure BDA0003352143560000034
计算节点i的度值大 于等于可能性得分c的概率Pr(deg(i)≥c);其中j和k均为节点i的邻居节 点;
根据所述概率Pr(deg(i)≥c),采用公式
Figure BDA0003352143560000035
计 算所述加权网络中节点i对应的重要性得分Ci
一种加权网络节点重要性确定系统,包括:
加权目标网络获取模块,用于获取待处理的加权网络;
权重值预处理模块,用于对所述加权网络中的边的权重值进行预处理,生 成处理后边的权重值;
概率模型计算模块,用于根据所述处理后边的权重值计算所述加权网络中 节点对应的中间概率;
重要度计算模块,用于根据所述中间概率计算所述加权网络中节点对应的 重要性得分;
重要性排序模块,用于对所述加权网络中节点按照所述重要性得分进行重 要性排序。
可选地,所述权重值预处理模块具体包括:
正相关预处理单元,用于当边的权重值与节点的重要性正相关时,采用公 式
Figure BDA0003352143560000041
对所述加权网络中的边的权重值wij进行预 处理,生成处理后边的权重值w'ij
反相关预处理单元,用于当边的权重值与节点的重要性反相关时,采用公 式
Figure BDA0003352143560000042
对所述加权网络中的边的权重值wij进行预 处理,生成处理后边的权重值w'ij;其中wmin表示最小边权重;wmax表示最 大边权重;d表示第一非参数系数,l表示第二非参数系数。
可选地,所述概率模型计算模块具体包括:
概率模型计算单元,用于根据所述处理后边的权重值w'ij,采用公式 X(p,q)=w'ij X(p-1,q-1)+(1-w'ij)X(p-1,q)计算所述加权网络中 节点对应的中间概率X(p,q);所述中间概率X(p,q)在计算过程中的边界条 件定义为
Figure BDA0003352143560000043
其中deg(i)为节点i在所 述加权网络中的度;p和q为整数。
可选地,所述重要度计算模块具体包括:
第一概率计算单元,用于根据所述中间概率X(p,q),采用公式
Figure BDA0003352143560000051
计算节点i的度值为可能性得分c的概率 Pr(deg(i)=c);
第二概率计算单元,用于根据所述概率Pr(deg(i)=c),采用公式
Figure BDA0003352143560000052
计算节点i的度值大 于等于可能性得分c的概率Pr(deg(i)≥c);其中j和k均为节点i的邻居节 点;
重要度计算单元,用于根据所述概率Pr(deg(i)≥c),采用公式
Figure BDA0003352143560000053
计算所述加权网络中节点i对应的重要性得分 Ci
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供了一种加权网络节点重要性确定方法及系统,所述方法包括: 获取待处理的加权网络;对所述加权网络中的边的权重值进行预处理,生成处 理后边的权重值;根据所述处理后边的权重值计算所述加权网络中节点对应的 中间概率;根据所述中间概率计算所述加权网络中节点对应的重要性得分;对 所述加权网络中节点按照所述重要性得分进行重要性排序。本发明方法及系统 将权重所携带的对节点重要性有贡献的信息刻画为节点在各种可能性下的得 分概率,通过累加该节点在各种可能性情况下的概率,进一步得出该节点最终 的重要性得分,从而能够以很低的计算时间复杂度给出网络中所有节点重要性 的精确排序。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是 本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性 的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种加权网络节点重要性确定方法的流程图;
图2为本发明实施例提供的加权无向图的示意图;
图3为本发明实施例一种加权网络节点重要性确定方法的算法执行流程 示意图;
图4为本发明实施例一种加权网络节点重要性确定系统的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造 性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种加权网络节点重要性确定方法及系统,能够以很 低的计算时间复杂度给出网络中所有节点重要性的精确排序。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和 具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例一种加权网络节点重要性确定方法的流程图。如图1 所示,本发明一种加权网络节点重要性确定方法包括:
步骤101:获取待处理的加权网络。
在进行节点重要性的判断时,可以预想到任意节点都可能是最重要的节 点,因此将对所有的节点进行定量分析。基于该想法,首先给定一个连通的加 权网络G(V,E),也即待分析的加权目标网络,其中V是网络节点集,E是网 络边集,而eij表示节点i与节点j的连边,以wij表示边eij的权重。
图2为本发明实施例提供的加权无向图(也称为加权网络)的示意图。图 2中V1、V2...V7称为图中的节点;节点之间连边称为图中的边。对于一个图, 可能要为每条边赋予一个表示大小的值,这个值就称为权值或权重;节点所有 的边数称为度;与节点Vi直接相连的节点称为节点Vi的邻居节点;若从顶点 Vi出发有一组边使其可到达顶点Vj,则称顶点Vi到顶点Vj的顶点序列为从顶 点Vi到顶点Vj的路径。对于不带权的图,一条路径的路径长度是指该路径上 的边的条数,对于带权的图,一条路径的路径长度是指该路径上各个边权值的 总和。与Vi节点最短距离长度为m的节点称为Vi的m阶邻居节点。
步骤102:对所述加权网络中的边的权重值进行预处理,生成处理后边的 权重值。
获取待处理的加权目标网络G(V,E)后,首先判断网络中边的权重与节点 的重要性是否正相关,然后基于判断结果对网络中的边的权重值进行预处理。
当边的权重值与节点的重要性正相关时,边的新权重值w'ij为边的权重值 wij减去最小边权重wmin与非参数系数l的差和最大边权重wmax与非参数系 数d之和减去最小边权重wmin与非参数系数l之差的比值。
即,当边的权重值与节点的重要性正相关时,采用如下的正相关公式(1) 求解处理后边的权重值:
Figure BDA0003352143560000071
当边的权重值与节点的重要性反相关时,边的新权重值w'ij为1与边的权 重值wij减去最小边权重wmin与非参数系数l的差和最大边权重wmax与非参 数系数d之和减去最小边权重wmin与非参数系数l之差的比值之差。
即,当边的权重值与节点的重要性反相关时,采用如下的反相关公式(2) 求解处理后边的权重值:
Figure BDA0003352143560000072
其中,wij为所述加权网络中的边的权重值,w'ij为处理后边的权重值; wmin表示最小边权重;wmax表示最大边权重;d表示第一非参数系数,l表 示第二非参数系数。
步骤103:根据所述处理后边的权重值计算所述加权网络中节点对应的中 间概率。
对网络中的所有节点重要性进行定量分析。
定义上述处理后边的权重值表示边出现的概率。假设边存在的概率彼此独 立,因此,具有t条边的不确定网络具有2t个可能的确定性网络(世界)。设 G'(V',E')表示由节点集V'和边集E'组成的图,其中E'∈E,V'∈V,设 G'(V',E')在现实世界中存在的概率记为Pr(G'),k为节点i的邻居节点,则:
Figure BDA0003352143560000081
其中E/E'代表E中去除E'剩下的边集合。
Pr为概率,设节点i在网络G'中的度为deg(i,G′)。设c为节点i可能的重 要性得分,c∈(1,2,...,deg(i)),则有如下公式:
Figure BDA0003352143560000082
Gi”是一个由子网络组成的集合,是属于网络G的所有可能性世界,Gi”中 的每个元素由节点i及其一阶邻居组成。
由于公式(3)与公式(4)的时间复杂度较高,因此本发明通过使用公式 (5)、(6)、(7)与(8)实现这一节点重要性计算的动态规划,将时间复杂 度降低:
X(p,q)=w'ij X(p-1,q-1)+(1-w'ij)X(p-1,q) (5)
设有整数p和整数q,p为E'(i)的大小,q为节点i在 G'(V,E\(E(i)\{e1,e2,...,ep}))中可能出现的度数,其中p∈(0,1,2,...,deg(i)), deg(i)为节点i的度,q∈(0,1,2,...,p),E(i)={e1,e2,e3,...,edeg(i)}是节点i 所连边的集合,子集E′(i)∈E(i),且deg(i|E'(i))为节点i在子图 G'(V,E\(E(i)\E'(i)))中的度,其中A\B代表B在A中的补集,并且有 X(p,q)=Pr[deg(i|{e1,e2,...,ep})=q],即对于节点i的有序边集 {e1,e2,...,edeg(i)},在只存在p条边{e1,e2,...,ep}的前提下,该节点度为q的概率, 即中间概率X(p,q)的含义为节点i在图G'(V,E\(E(i)\{e1,e2,...,ep}))的度 为q的概率。现在,在满足整数q∈[0,p]的情况下,对整数p取遍p∈[0,deg(i)] 的值,这一过程可以视作遍历了可能性世界Gi”中所有子网络的度数情况的所 有可能性。以下为X(p,q)在计算过程中的边界条件的定义:
Figure BDA0003352143560000091
因此,所述步骤103具体包括:
根据所述处理后边的权重值w'ij,采用公式 X(p,q)=w'ij X(p-1,q-1)+(1-w'ij)X(p-1,q)计算所述加权网络中 节点对应的中间概率X(p,q);所述中间概率X(p,q)在计算过程中的边界条 件定义为
Figure BDA0003352143560000092
其中deg(i)为节点i在所 述加权网络中的度;p和q为整数。
步骤104:根据所述中间概率计算所述加权网络中节点对应的重要性得 分。
定义节点i的度值为可能性得分c的概率为:
Figure BDA0003352143560000093
节点i的度值大于等于可能性得分c的概率为:
Figure BDA0003352143560000094
其中j为节点i的邻居节点。
由于Pr(deg(i)≥c)值的计算通过动态规划实现,因此整个算法的时间复 杂度为O(dmaxm)。
在以上的动态规划方法执行后,得到了网络G中任意节点i的基础得分因 子项c所对应的可能情况(c∈{1,2,...,deg(i)})的概率分布。更进一步地,对 节点i所对应的所有的c取值乘上c对应的概率值进行加和,得出网络G中节 点i对应的总得分Ci
Figure BDA0003352143560000101
Ci即为表征节点i的重要度的重要性得分。
若通过本发明方法计算出两个或多个节点的得分相同,则认为它们的排名 并列,排列顺序随机。
因此,所述步骤104具体包括:
根据所述中间概率X(p,q),采用公式
Figure BDA0003352143560000102
计算节点i的度值为可能性得分c的概率Pr(deg(i)=c);
根据所述概率Pr(deg(i)=c),采用公式
Figure BDA0003352143560000103
计算节点i的度值大 于等于可能性得分c的概率Pr(deg(i)≥c);其中j和k均为节点i的邻居节 点;
根据所述概率Pr(deg(i)≥c),采用公式
Figure BDA0003352143560000104
计 算所述加权网络中节点i对应的重要性得分Ci
步骤105:对所述加权网络中节点按照所述重要性得分进行重要性排序。
对网络中的节点通过重要性进行排序,按照各个节点的得分大小Ci得出 网络中所有节点的重要性排序。例如可以对节点集合V根据Ci得分进行逆序 排序,生成重要性排序后的序列。若通过本发明方法计算出两个或多个节点的 得分相同,则认为它们的排名并列,排列顺序随机。
在实际应用中,通过判断节点的重要性来对计算机网络中的重要节点进行 保护可以提高网络的健壮性。
图3为本发明实施例一种加权网络节点重要性确定方法的算法执行流程 示意图。如图3所示,将本发明一种加权网络节点重要性确定方法的算法执行 流程描述如下。
对于给定的一个加权网络G(V,E),首先判断边的权重与节点的重要性是 否正相关,根据判断结果分别按照正相关公式(1)或者反相关公式(2)对图 中的权重集合W进行归一化,并将结果存于集合W',W'为处理后边的权重值 w'ij的集合。
本发明定义M为算法删除节点执行过程中节点集V的备份,遍历集合M, 执行下文描述的步骤。在M中存在节点时,取出节点i,遍历p的所有值 (0,1,2,...,deg(i))以及q的所有值(0,1,2,...,p),根据初始条件公式(6)和中间 概率计算公式(5)计算出节点i所有的X(p,q),即计算对于节点i的有序边集 {e1,e2,...,edeg(i)},在只存在边{e1,e2,...,ep}的前提下,该节点度为q的概率。
然后根据公式(7)、(8)、(9)计算出网络G中节点i对应的总得分Ci
去除M中已经计算过的节点i,循环往复取出节点进行重要性得分Ci的计 算,直至M中没有任何节点。
最后对节点集合V根据Ci得分进行逆序排序,生成重要性排序后的序列。
本发明提供了一种精确度高、计算时间快的对网络中所有节点重要性进行 排序的方法。本发明方法将权重所携带的对节点重要性有贡献的信息刻画为节 点在各种可能性下的得分概率,通过累加该节点在各种可能性情况下的概率, 进一步得出该节点最终的重要性得分。下面用8个真实的网络数据集进行实验 来证明本发明方法的有效性。
为了分析本发明所述加权网络节点重要性确定方法的性能,使用六个网络 结构进行实验分析,对不同学科领域的八个真实网络数据集进行了实验。所使 用的真实网络如下:
Email_dnc:某邮件泄露事件中的直接电子邮件网络;
USAir97:美国航空网络;
Reptilia_tortois:龟类神经网络;
Rt_bahrain:twitter交互网络;
Windsurfers:自然灾害的受灾网络;
Lesmis:维克多·雨果著作《悲惨世界》中的人物组成的社会网络;
Blocks:来自西澳大利亚大学Gordon Royle的网络的对称幂;
Celegans:秀丽隐杆线虫的代谢网络。
表1总结了各算法在不同数据集上的鲁棒性R值。其中Robustness表示鲁 棒性R值,BT、WC、EC、CL、HI、EM分别表示经典的介数中心性算法、 w-core分解算法、特征向量中心性算法、接近中心性算法、H-Index改进版 本算法、本发明算法。
表1不同算法在相同网络下的鲁棒性
Robustness: BT WC EC CL HI EM
Email_dnc 0.020 0.050 0.083 0.062 0.041 0.017
USAir97 0.140 0.158 0.143 0.417 0.293 0.128
Reptilia_tortoise 0.247 0.280 0.365 0.264 0.232 0.224
Rt_bahrain 0.044 0.074 0.254 0.142 0.069 0.039
Windsurfers 0.476 0.444 0.479 0.493 0.468 0.426
Lesmis 0.164 0.269 0.177 0.232 0.152 0.151
Blocks 0.311 0.270 0.179 0.310 0.304 0.171
C.elegans_neural 0.341 0.403 0.450 0.421 0.394 0.339
显然,R值越小,表明网络的崩塌速度越快,说明对应的索引算法能更好 地对节点重要性进行排序。不难发现,本发明算法每次都具有最小的鲁棒性。 本发明算法在各个数据集中均具有迅速下降(使得网络结构快速崩塌)的趋势, 通过网络中线条与x轴、y轴所围成图形的面积观测本发明算法的整体鲁棒性 情况,观察到本发明算法所体现出的鲁棒性在8个数据集上均为所有算法中的 最小值,其次是经典的BT算法。实验结果表明本发明方法能够在删除网络G的 节点过程中使得鲁棒性值最低,即本发明算法更加适用于寻找网络中的重要节 点。
此外,由于本发明方法中Pr(Gi)值的计算通过动态规划实现,因此整个 算法的时间复杂度为O(dmaxm)。表2总结了各算法的时间复杂度对比。
表2多个加权网络节点重要性排序算法的时间复杂度对比表
EM BT CL WC EC HI
O(d<sub>max</sub>m) O(n<sup>3</sup>) O(n<sup>3</sup>) O(max(m,nlogn)) O(n<sup>2</sup>) O(n<sup>3</sup>)
表2中EM、BT、CL、WC、EC、HI分别表示本发明算法、经典的介 数中心性算法、接近中心性算法、w-core分解算法、特征向量中心性算法、 H-Index改进版本算法。O表示时间复杂度,dmax表示网络中节点最大度数,m 表示图中连边数,n表示图中节点数。
从以上实验结果可知,本发明提供的一种加权网络节点重要性确定方法, 其改进之处是能对同一层内的节点重要性进行分辨,且能以很低的计算时间复 杂度给出网络中所有节点重要性的精确排序,是一种精确度高、计算时间快的 对网络中所有节点重要性进行排序的方法。
基于本发明提供的一种加权网络节点重要性确定方法,本发明还提供一种 加权网络节点重要性确定系统,如图4所示,所述包括:
加权目标网络获取模块401,用于获取待处理的加权网络;
权重值预处理模块402,用于对所述加权网络中的边的权重值进行预处 理,生成处理后边的权重值;
概率模型计算模块403,用于根据所述处理后边的权重值计算所述加权网 络中节点对应的中间概率;
重要度计算模块404,用于根据所述中间概率计算所述加权网络中节点对 应的重要性得分;
重要性排序模块405,用于对所述加权网络中节点按照所述重要性得分进 行重要性排序。
其中,所述权重值预处理模块402具体包括:
正相关预处理单元,用于当边的权重值与节点的重要性正相关时,采用公 式
Figure BDA0003352143560000141
对所述加权网络中的边的权重值wij进行预 处理,生成处理后边的权重值w'ij
反相关预处理单元,用于当边的权重值与节点的重要性反相关时,采用公 式
Figure BDA0003352143560000142
对所述加权网络中的边的权重值wij进行预 处理,生成处理后边的权重值w'ij;其中wmin表示最小边权重;wmax表示最 大边权重;d表示第一非参数系数,l表示第二非参数系数。
所述概率模型计算模块403具体包括:
概率模型计算单元,用于根据所述处理后边的权重值w'ij,采用公式 X(p,q)=w'ij X(p-1,q-1)+(1-w'ij)X(p-1,q)计算所述加权网络中 节点对应的中间概率X(p,q);所述中间概率X(p,q)在计算过程中的边界条 件定义为
Figure BDA0003352143560000143
其中deg(i)为节点i在所 述加权网络中的度;p和q为整数。
所述重要度计算模块404具体包括:
第一概率计算单元,用于根据所述中间概率X(p,q),采用公式
Figure BDA0003352143560000144
计算节点i的度值为可能性得分c的概率 Pr(deg(i)=c);
第二概率计算单元,用于根据所述概率Pr(deg(i)=c),采用公式
Figure BDA0003352143560000145
计算节点i的度值大 于等于可能性得分c的概率Pr(deg(i)≥c);其中j和k均为节点i的邻居节 点;
重要度计算单元,用于根据所述概率Pr(deg(i)≥c),采用公式
Figure BDA0003352143560000151
计算所述加权网络中节点i对应的重要性得分 Ci
本发明提供的一种加权网络节点重要性确定方法及系统,在判断节点重要 性之前,先对网络中边的权重进行预处理,然后通过Pr公式判断节点的重要 性,最后将网络中的节点通过重要性进行排序。在8个不同学科的真实网络数 据集上分别使用了EM、BT、CL、EC、WC和HI算法进行实验,发现本发明 方法的重要性判断精度在实际上有所提高,并且降低了时间复杂度,说明本发 明所提出的方法是有效的。
本发明方法及系统提出了使用动态规划对节点的重要性进行排序,从而使 算法的时间复杂度大大降低。本发明方法及系统还将一种概率模型嵌入加权网 络进行节点重要性计算,最终提高了对节点重要性判断的准确性。在八个不同 的网络数据集上对本发明方法进行评估,并且使用六个经典的算法与本发明方 法进行比较,实验证明,本发明方法提高了节点重要性判断的准确性。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是 与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于 实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较 简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施 例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的 一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变 之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种加权网络节点重要性确定方法,其特征在于,包括:
获取待处理的加权网络;
对所述加权网络中的边的权重值进行预处理,生成处理后边的权重值;
根据所述处理后边的权重值计算所述加权网络中节点对应的中间概率;
根据所述中间概率计算所述加权网络中节点对应的重要性得分;
对所述加权网络中节点按照所述重要性得分进行重要性排序。
2.根据权利要求1所述的方法,其特征在于,所述对所述加权网络中的边的权重值进行预处理,生成处理后边的权重值,具体包括:
当边的权重值与节点的重要性正相关时,采用公式
Figure FDA0003352143550000011
对所述加权网络中的边的权重值wij进行预处理,生成处理后边的权重值w'ij
当边的权重值与节点的重要性反相关时,采用公式
Figure FDA0003352143550000012
对所述加权网络中的边的权重值wij进行预处理,生成处理后边的权重值w'ij;其中wmin表示最小边权重;wmax表示最大边权重;d表示第一非参数系数,l表示第二非参数系数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述处理后边的权重值计算所述加权网络中节点对应的中间概率,具体包括:
根据所述处理后边的权重值w'ij,采用公式X(p,q)=w'ij X(p-1,q-1)+(1-w'ij)X(p-1,q)计算所述加权网络中节点对应的中间概率X(p,q);所述中间概率X(p,q)在计算过程中的边界条件定义为
Figure FDA0003352143550000013
其中deg(i)为节点i在所述加权网络中的度;p和q为整数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述中间概率计算所述加权网络中节点对应的重要性得分,具体包括:
根据所述中间概率X(p,q),采用公式
Figure FDA0003352143550000021
计算节点i的度值为可能性得分c的概率Pr(deg(i)=c);
根据所述概率Pr(deg(i)=c),采用公式
Figure FDA0003352143550000022
计算节点i的度值大于等于可能性得分c的概率Pr(deg(i)≥c);其中j和k均为节点i的邻居节点;
根据所述概率Pr(deg(i)≥c),采用公式
Figure FDA0003352143550000023
计算所述加权网络中节点i对应的重要性得分Ci
5.一种加权网络节点重要性确定系统,其特征在于,包括:
加权目标网络获取模块,用于获取待处理的加权网络;
权重值预处理模块,用于对所述加权网络中的边的权重值进行预处理,生成处理后边的权重值;
概率模型计算模块,用于根据所述处理后边的权重值计算所述加权网络中节点对应的中间概率;
重要度计算模块,用于根据所述中间概率计算所述加权网络中节点对应的重要性得分;
重要性排序模块,用于对所述加权网络中节点按照所述重要性得分进行重要性排序。
6.根据权利要求5所述的系统,其特征在于,所述权重值预处理模块具体包括:
正相关预处理单元,用于当边的权重值与节点的重要性正相关时,采用公式
Figure FDA0003352143550000031
对所述加权网络中的边的权重值wij进行预处理,生成处理后边的权重值w′ij
反相关预处理单元,用于当边的权重值与节点的重要性反相关时,采用公式
Figure FDA0003352143550000032
对所述加权网络中的边的权重值wij进行预处理,生成处理后边的权重值w′ij;其中wmin表示最小边权重;wmax表示最大边权重;d表示第一非参数系数,l表示第二非参数系数。
7.根据权利要求6所述的系统,其特征在于,所述概率模型计算模块具体包括:
概率模型计算单元,用于根据所述处理后边的权重值w′ij,采用公式X(p,q)=w′ijX(p-1,q-1)+(1-w′ij)X(p-1,q)计算所述加权网络中节点对应的中间概率X(p,q);所述中间概率X(p,q)在计算过程中的边界条件定义为
Figure FDA0003352143550000033
其中deg(i)为节点i在所述加权网络中的度;p和q为整数。
8.根据权利要求7所述的系统,其特征在于,所述重要度计算模块具体包括:
第一概率计算单元,用于根据所述中间概率X(p,q),采用公式
Figure FDA0003352143550000034
计算节点i的度值为可能性得分c的概率Pr(deg(i)=c);
第二概率计算单元,用于根据所述概率Pr(deg(i)=c),采用公式
Figure FDA0003352143550000035
计算节点i的度值大于等于可能性得分c的概率Pr(deg(i)≥c);其中j和k均为节点i的邻居节点;
重要度计算单元,用于根据所述概率Pr(deg(i)≥c),采用公式
Figure FDA0003352143550000041
计算所述加权网络中节点i对应的重要性得分Ci
CN202111341218.XA 2021-11-12 2021-11-12 一种加权网络节点重要性确定方法及系统 Pending CN114090860A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111341218.XA CN114090860A (zh) 2021-11-12 2021-11-12 一种加权网络节点重要性确定方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111341218.XA CN114090860A (zh) 2021-11-12 2021-11-12 一种加权网络节点重要性确定方法及系统

Publications (1)

Publication Number Publication Date
CN114090860A true CN114090860A (zh) 2022-02-25

Family

ID=80300433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111341218.XA Pending CN114090860A (zh) 2021-11-12 2021-11-12 一种加权网络节点重要性确定方法及系统

Country Status (1)

Country Link
CN (1) CN114090860A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114826936A (zh) * 2022-04-14 2022-07-29 中国人民解放军国防科技大学 一种确定加权网络通信效能的关键节点集的方法和系统
CN114866437A (zh) * 2022-04-19 2022-08-05 北京博睿宏远数据科技股份有限公司 一种节点检测方法、装置、设备及介质
US20240202814A1 (en) * 2022-12-14 2024-06-20 International Business Machines Corporation Graph feature based system for flow management

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114826936A (zh) * 2022-04-14 2022-07-29 中国人民解放军国防科技大学 一种确定加权网络通信效能的关键节点集的方法和系统
CN114826936B (zh) * 2022-04-14 2023-06-09 中国人民解放军国防科技大学 一种确定加权网络通信效能的关键节点集的方法和系统
CN114866437A (zh) * 2022-04-19 2022-08-05 北京博睿宏远数据科技股份有限公司 一种节点检测方法、装置、设备及介质
CN114866437B (zh) * 2022-04-19 2023-11-21 北京博睿宏远数据科技股份有限公司 一种节点检测方法、装置、设备及介质
US20240202814A1 (en) * 2022-12-14 2024-06-20 International Business Machines Corporation Graph feature based system for flow management

Similar Documents

Publication Publication Date Title
CN114090860A (zh) 一种加权网络节点重要性确定方法及系统
CN102810113B (zh) 一种针对复杂网络的混合型聚类方法
CN109949176B (zh) 一种基于图嵌入的社交网络中异常用户检测方法
CN107895038B (zh) 一种链路预测关系推荐方法及装置
CN113032238B (zh) 基于应用知识图谱的实时根因分析方法
CN113467851B (zh) 一种基于车辆聚类的动态车辆计算任务卸载方法和装置
CN104199852A (zh) 基于节点隶属度的标签传播社团结构挖掘方法
CN109740106A (zh) 基于图卷积神经网络的大规模网络介数逼近方法、存储装置及存储介质
CN109120431B (zh) 复杂网络中传播源选择的方法、装置及终端设备
CN112417316A (zh) 一种基于多标签传播的半监督重叠社区发现算法
CN102819611B (zh) 一种复杂网络局部社区挖掘方法
Wickman et al. A Generic Graph Sparsification Framework using Deep Reinforcement Learning
Priya et al. Community Detection in Networks: A Comparative study
CN112214684B (zh) 一种种子扩展的重叠社区发现方法及装置
CN116992307A (zh) 基于图网络特征快速聚合的社交网络用户匹配方法及装置
CN108198084A (zh) 一种复杂网络重叠社区发现方法
CN116974249A (zh) 柔性作业车间调度方法和柔性作业车间调度装置
CN116226468A (zh) 基于网格化终端业务数据存储管理方法
CN113590912B (zh) 融合节点相对位置和绝对度分布的跨社交网络对齐方法
CN111726254B (zh) 一种面向全部需求的多状态网络最小路集向量免重复搜索算法
CN112738756B (zh) 一种物联网设备数据收集方法及装置
Saxena et al. Degree ranking using local information
de Angelis et al. Line sampling for assessing structural reliability with imprecise failure probabilities
CN114329867A (zh) 一种基于模体的无标度网络鲁棒性度量方法
Wei et al. Finding maximal overlapping communities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination