CN113537461B - 基于sir值学习的网络关键节点发现方法及系统 - Google Patents

基于sir值学习的网络关键节点发现方法及系统 Download PDF

Info

Publication number
CN113537461B
CN113537461B CN202110740215.7A CN202110740215A CN113537461B CN 113537461 B CN113537461 B CN 113537461B CN 202110740215 A CN202110740215 A CN 202110740215A CN 113537461 B CN113537461 B CN 113537461B
Authority
CN
China
Prior art keywords
network
node
sir
nodes
sir value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110740215.7A
Other languages
English (en)
Other versions
CN113537461A (zh
Inventor
尹美娟
段顺然
刘粉林
刘洋
刘文艳
朱玛
张昕
于岚岚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information Engineering University of PLA Strategic Support Force
Original Assignee
Information Engineering University of PLA Strategic Support Force
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information Engineering University of PLA Strategic Support Force filed Critical Information Engineering University of PLA Strategic Support Force
Priority to CN202110740215.7A priority Critical patent/CN113537461B/zh
Publication of CN113537461A publication Critical patent/CN113537461A/zh
Application granted granted Critical
Publication of CN113537461B publication Critical patent/CN113537461B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明属于计算机网络数据处理技术领域,特别涉及一种基于SIR值学习的网络关键节点发现方法及系统,针对样本数据,利用网络分析工具构建不同网络类型的无权无向网络并获取相应网络类型的网络数据;依据无权无向网络及网络数据计算网络节点特征,并利用SIR模型计算表征节点传播能力的SIR值,将网络节点特征和SIR值作为训练样本;构建回归模型,并利用训练样本对回归模型进行训练优化;计算目标网络数据的节点特征,并利用训练优化后的回归模型来获取节点对应的SIR值;通过对SIR值进行排序来选取网络关键节点。本发明利用节点结构上的特征预测节点SIR值来发现高影响力节点,降低节点分析中的复杂度,提高网络中关键节点预测效率,具有较好的应用前景。

Description

基于SIR值学习的网络关键节点发现方法及系统
技术领域
本发明属于计算机网络数据处理技术领域,特别涉及一种基于SIR值学习的网络关键节点发现方法及系统。
背景技术
复杂网络(Complex Network),是指具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质的网络。复杂网络简而言之即呈现高度复杂性的网络。高影响力节点是复杂网络中关键节点,发现此类关键节点属于最优化问题。目前这类问题的常用处理方式是基于节点影响力对节点排序,根据排序结果选取top-k个节点作为高影响力节点。现有的发现复杂网络高影响力节点的方法主要有两类:一类是基于网络结构信息评估节点影响力,另一类是基于渗流模型评估节点影响力。基于网络结构信息发现高影响力节点的代表性方法有度中心性、介数中心性、k-shell值,这类方法计算复杂度低,可在较短时间内实现节点排序。渗流模型通过模拟真实的信息传播过程评估节点影响力,通常需要针对网络上的每一个节点模拟数千遍真实传播过程,虽然此类方法对节点影响力的评估准确客观,但在大规模网络上却是一个非常耗时的过程,因此该类方法一般用于对其他节点影响力排序方法进行评价。传染病模型SIR模型是其中典型的评价模型,如利用排序结果与SIR模型的排序结果的序列相关性程度衡量方法的准确性,利用SIR模型确定影响力排名靠前与靠后的节点,进而分析节点影响力与节点度中心性、Kshell的相关性,但存在SIR模型对真实传播过程的模拟复杂度高、耗时长等问题。
发明内容
为此,本发明提供一种基于SIR值学习的网络关键节点发现方法及系统,利用节点结构上的特征预测节点SIR值来发现高影响力节点,降低节点分析中的复杂度,提高网络中关键节点预测效率。
按照本发明所提供的设计方案,一种基于SIR值学习的网络关键节点发现方法,包含如下内容:
针对样本数据,利用网络分析工具构建不少于一种网络类型的无权无向网络并获取相应网络类型的网络数据;
依据无权无向网络及网络数据计算网络节点特征,并利用SIR模型计算表征节点传播能力的SIR值,将网络节点特征和SIR值作为训练样本,其中,网络节点特征包含:节点局部特征和节点全局特征;
构建用于对网络节点特征和节点SIR值进行统计分析的回归模型,并利用训练样本对回归模型进行训练优化;
计算目标网络数据的节点特征,并利用训练优化后的回归模型来获取节点对应的SIR值;通过对SIR值进行排序来选取网络关键节点。
作为本发明基于SIR值学习的网络关键节点发现方法,进一步地,利用python-igraph网络分析包构建同等网络规模但不同网络类型的无权无向网络并获取相应网络数据。
作为本发明基于SIR值学习的网络关键节点发现方法,进一步地,构建的网络类型包含但不局限于:规则网络、随机网络、小世界网络和无标度网络。
作为本发明基于SIR值学习的网络关键节点发现方法,进一步地,节点局部特征包含:用于衡量节点局部信息扩散能力的节点度中心性特征及节点传递中心性特征;节点全局特征包含:用于衡量节点向外部扩散能力的K壳中心性特征。
作为本发明基于SIR值学习的网络关键节点发现方法,进一步地,SIR模型将网络节点划分为易感染状态S、感染状态I和恢复免疫状态R,以仅有编号为i的节点处感染状态I的SIR传染过程结束时,状态集合恢复免疫状态R中的节点数占网络节点总数的比例来表示节点i的网络传播能力。
作为本发明基于SIR值学习的网络关键节点发现方法,进一步地,所述回归模型采用用于分析预测网络节点特征和节点SIR值之间线性相关性的线性回归模型。
作为本发明基于SIR值学习的网络关键节点发现方法,进一步地,所述回归模型采用用于分析预测网络节点特征和节点SIR值之间非线性关系的MLP多层感知器模型。
进一步地,本发明还提供一种基于SIR值学习的网络关键节点发现系统,包含:数据获取模块、数据处理模块、模型训练模块及节点预测模块,其中,
数据获取模块,用于针对样本数据,利用网络分析工具构建不少于一种网络类型的无权无向网络并获取相应网络类型的网络数据;
数据处理模块,用于依据无权无向网络及网络数据计算网络节点特征,并利用SIR模型计算表征节点传播能力的SIR值,将网络节点特征和SIR值作为训练样本,其中,网络节点特征包含:节点局部特征和节点全局特征;
模型训练模块,用于构建用于对网络节点特征和节点SIR值进行统计分析的回归模型,并利用训练样本对回归模型进行训练优化;
节点预测模块,用于通过计算目标网络数据的节点特征,并利用训练优化后的回归模型来获取节点对应的SIR值;通过对SIR值进行排序来选取网络关键节点。
本发明的有益效果:
本发明利用多种网络类型数据的节点特征来预测SIR值进而利用回归模型实现高影响力节点发现,降低节点分析过程中的运算复杂度,提升节点发现效率和准确性。并进一步通过实验结果来验证本案放案中的利用节点特征来预测节点SIR值并通过排序来确定网络关键节点的有效性。
附图说明:
图1为实施例中基于SIR值学习的网络关键节点发现流程示意;
图2为实施例中利用节点特征来预测节点SIR值原理示意;
图3为实施例中MLP多层感知器模型计算过程示意;
图4为实施例中不同排序方式对应肯德尔秩相关系数结果示意;
图5为实施例中不同排序方式对应的RBO相关系数结果示意;
图6为实施例中选取的5个网络CCDF曲线示意;
图7为实施例中跆拳道俱乐部网络中对每个节点分别模拟SIR传播过程示意;
图8为实施例中不同次SIR模拟结果相似度结果示意。
具体实施方式:
为使本发明的目的、技术方案和优点更加清楚、明白,下面结合附图和技术方案对本发明作进一步详细的说明。
本发明实施例,提供一种基于SIR值学习的网络关键节点发现方法,参见图1所示,包含如下内容:
S101、针对样本数据,利用网络分析工具构建不少于一种网络类型的无权无向网络并获取相应网络类型的网络数据;
S102、依据无权无向网络及网络数据计算网络节点特征,并利用SIR模型计算表征节点传播能力的SIR值,将网络节点特征和SIR值作为训练样本,其中,网络节点特征包含:节点局部特征和节点全局特征;
S103、构建用于对网络节点特征和节点SIR值进行统计分析的回归模型,并利用训练样本对回归模型进行训练优化;
S104、计算目标网络数据的节点特征,并利用训练优化后的回归模型来获取节点对应的SIR值;通过对SIR值进行排序来选取网络关键节点。
利用多种网络类型数据的节点特征来预测SIR值进而利用回归模型实现高影响力节点发现,降低节点分析过程中的运算复杂度,提升节点发现效率和准确性,具有较好的应用前景。
作为本发明基于SIR值学习的网络关键节点发现方法,进一步地,利用python-igraph网络分析包构建同等网络规模但不同网络类型的无权无向网络并获取相应网络数据。
使用G=(V,E)表示一个仅由节点和连边构成的无权无向网络,V={v1,v2,v3,...,vn}表示网络的节点集合,E={e1,e2,e3,...,em}表示网络连边集合。n=|V|网络G节点总数,m=|E|表示网络G的连边总数;eij表示节点i和节点j之间的连边,vi表示编号为i的节点,neighbors(vi)表示节点vi的邻居集合,ki=|neighbors(vi)|。
参见图2所示,构建网络数据时,考虑到网络规模对网络节点特征影响较大,不同规模的网络中,相同数值的节点特征反映的信息往往相差甚远,比如karate网络(34个节点)的平均度为2.294,平均度中心性为0.0695151,而soc-epinions网络(26588个节点)的平均度为3.766,平均度中心性为0.0001416,平均度中心性相差两个数量级以上。因此,在构建网络数据时需要构建同等规模的网络,同时网络数据应类型多样、数量充足。不同类型的网络往往具有不同网络特征,如同等规模的规则网络和小世界网络在网络平均距离上差别明显、同等规模的小世界网络和无标度网络在节点度分布上具有明显不同特征,类型多样使得训练数据能够包含待预测网络的网络类型;网络数量充足是保证训练数据足够多的前提。在选择节点特征时,应兼顾网络局部信息和网络全局信息,可以attr1、attr2...attrn表示需要使用的网络节点特征;计算所有节点的特征值后,还需要对网络进行SIR模拟,得到各个节点的SIR值,由此同一节点对应的特征值及SIR值可构成一个训练样本,形式为(attr1,attr2...attrn,sir),同一个网络的所有节点对应的训练样本作为一组训练样本。在模型选择方面,应当根据不同模型的特点选择合适的模型,例如attr1、attr2...attrn和sir具有潜在的线性相关性,选择线性预测模型较为合适,否则,选择能够对非线性关系进行建模的模型较为合适。利用以上构建的训练样本进行模型训练,目的是通过attr1、attr2...attrn对sir进行预测,使得预测值与真实值的偏差最小。对网络节点的SIR值进行预测时,需要先计算网络各个节点对应的特征,训练好的模型能够根据节点的特征预测节点的SIR值,依据预测的SIR值可实现对网络节点的排序。
作为本发明实施例中基于SIR值学习的网络关键节点发现方法,进一步地,构建的网络类型包含但不局限于:规则网络、随机网络、小世界网络和无标度网络。进一步地,节点局部特征包含:用于衡量节点局部信息扩散能力的节点度中心性特征及节点传递中心性特征;节点全局特征包含:用于衡量节点向外部扩散能力的K壳中心性特征。进一步地,SIR模型将网络节点划分为易感染状态S、感染状态I和恢复免疫状态R,以仅有编号为i的节点处感染状态I的SIR传染过程结束时,状态集合恢复免疫状态R中的节点数占网络节点总数的比例来表示节点i的网络传播能力。进一步地,所述回归模型采用用于分析预测网络节点特征和节点SIR值之间线性相关性的线性回归模型。进一步地,所述回归模型采用用于分析预测网络节点特征和节点SIR值之间非线性关系的MLP多层感知器模型。
进一步地,基于上述的方法,本发明实施例还提供一种基于SIR值学习的网络关键节点发现系统,包含:数据获取模块、数据处理模块、模型训练模块及节点预测模块,其中,
数据获取模块,用于针对样本数据,利用网络分析工具构建不少于一种网络类型的无权无向网络并获取相应网络类型的网络数据;
数据处理模块,用于依据无权无向网络及网络数据计算网络节点特征,并利用SIR模型计算表征节点传播能力的SIR值,将网络节点特征和SIR值作为训练样本,其中,网络节点特征包含:节点局部特征和节点全局特征;
模型训练模块,用于构建用于对网络节点特征和节点SIR值进行统计分析的回归模型,并利用训练样本对回归模型进行训练优化;
节点预测模块,用于通过计算目标网络数据的节点特征,并利用训练优化后的回归模型来获取节点对应的SIR值;通过对SIR值进行排序来选取网络关键节点。
为验证本案方案有效性,下面结合实验数据做进一步解释说明:
实验中,在构造训练网络时,可针对每一个目标网络生成1000个同等规模的网络,以此为基础构建训练数据集,在SIR模型中可设置恢复率α=1,传染率β设置为θ(θ=1.2、1.4、1.6、1.8、2.0)倍的传染阈值,SIR模型重复1000次。实验选择的真实网络来源涉及社交网络、生物网络、引文网络、基础设施网络,关于网络的基本统计特征见表1。所选用的局部节点特征为节点的度中心性,其形式为
Figure BDA0003141153130000051
传递中心性,其形式为
Figure BDA0003141153130000052
全局特征为K壳中心性Ks。网络节点的K壳中心性Ks在网络的K壳分解的过程中被赋予,在K壳分解中,依次移除所有度为k(k=1,2,3...)的节点以及与之相连的连边,直到剩余网络中不存在度为k的节点,被移除节点的Ks=k。选择这几个特征的思想在于,信息需要在局部区域充分传播,并且局部区域具备很好的向外扩散能力,才能使得影响力较高。度中心性和传递中心性可以衡量节点在局部的信息扩散能力,而Kshell反映了节点在网络核心的程度,可以用来衡量信息向外部扩散的能力。为了能够刻画节点特征和节点SIR值的非线性关系,实验中可选择MLP作为训练模型,MLP可设置为6个隐藏层,每层设置50个神经元,MLP的输入为节点的特征,MLP各层之间的计算关系为Ht+1=σ(WtHt+b),Ht表示t层隐藏层的数值,Wt表示第t层和第t+1层之间的权重参数,σ为ReLU激活函数。MLP的结构如图3所示。
SIR(Susceptible-Infected-Recovered)模型一种疾病传播模型,该模型把网络中的所有节点划分为三种状态:易感染状态(S)、感染状态(I)、恢复并免疫状态(R),并满足
Figure BDA0003141153130000053
初始时,网络中只有一个节点处于I状态,其余所有节点均处于S状态。传染过程通过节点之间的连边进行,每一个时间步,处于I状态的节点以概率β感染其直接邻居中所有处于S状态的节点,同时自身以概率α进入R状态(实验中,设置α=1),处于R状态的节点不会再被感染,当处于I状态的节点为空时,即所有节点均处于S状态或R状态时,则传染过程停止。节点i的网络传播能力,以仅有vi处I状态的SIR传染过程结束时,状态集合R中的节点数占网络节点总数的比例来表示。需要注意的是在,在SIR模型中,传染率β如果过大,那么信息本身的高传递性将掩盖不同节点信息传播能力的差异,导致任意节点都能使得信息传遍网络;传染率β如果过小,那么信息本身的低传递性将限制信息在网络的传播,使得任意节点都只能将信息在小范围内传播,难以体现节点之间信息传播能力的差异。传染病学上,将易感染个体(处于S状态的节点)占比为原来的1/e(约36%)所需的时间称为特征时间τ,仅当特征时间τ>0时,疾病才有可能在全网传播。由SIR模型的特征时间
Figure BDA0003141153130000061
可得出SIR模型的传播阈值
Figure BDA0003141153130000062
表1网络基本统计信息
Figure BDA0003141153130000063
Figure BDA0003141153130000071
选用的性能评价指标为肯德尔秩相关系数、RBO相关系数、单调性。
假设两个序列x和y,它们的元素个数均为N,两个序列中的第i(1≤i≤N)个元素分别用xi、yi表示。x与y中的对应元素组成一个元素对集合,其包含的元素为(xi,yi)(1≤i≤N)。当集合x和y中任意两个元素(xi,yi)与(xj,yj)的顺序相同时,即xi>xj且yi>yj或xi<xj且yi<yj,这两个元素是一致的。当出现xi<xj且yi>yj或xi>xj且yi<yj)时,这两个元素是不一致的。当出现xi=xj或yi=yj时,这两个元素既不是一致的也不是不一致的。肯德尔相关系数为:
Figure BDA0003141153130000072
其中,C表示一致元素对的个数,D表示不一致元素对的个数,N表示元素的总个数。
Figure BDA0003141153130000073
s1、s2表示x与y中重复出现的元素种类数,Ui、Vi分别表示x与y中由相同元素组成的第i个集合的元素个数。
不同排序方式对应的肯德尔秩相关系数如图4所示,横坐标是不同的网络,纵坐标是肯德尔秩相关系数,图片上方的数字表示传染率相对于网络传染阈值的倍数(分别是1.2、1.4、1.6、1.8、2.0)。由上图可以看出,三种方式在肯德尔秩相关系数方面并没有较为明显的优劣,且肯德尔秩相关系数随传染率β的变化小。
假设序列x和y为两个无限长度的序列,xi为序列x第i个元素,xm:n={xi:m≤i≤n}表示序列从位置m到位置n的所有元素组成的集合。序列x和y在深度d时的交集记为Id=x1:d∩y1:d,交集的元素个数称为序列x和y在深度为d时的交叠,该交叠相对于深度d的比值称为序列x和y的一致度,即一致度
Figure BDA0003141153130000074
RBO通过给每一个深度的一致度一个权重wd,再计算加权和得到,即
Figure BDA0003141153130000075
根据一致度的定义,可以看出一致度对序列中位置越靠前的元素越敏感,一致度的累加和本身就考虑了位置权重的概念,RBO中的权重wd一方面实现了归一化,另一方面也使得权重的分配可以调节。在实验中,可将RBO中的权重wd设置为
Figure BDA0003141153130000081
Figure BDA0003141153130000082
不同排序方式对应的RBO相关系数如图5所示,横坐标对应不同的网络,纵坐标是RBO相关系数,图片上方的数字表示传染率相对于网络传染阈值的倍数(分别是1.2、1.4、1.6、1.8、2.0)。由上图可以看出,在不同传染率β下,三种方式RBO相关系数的变化趋势相同,在23个网络中,通过对SIR值的预测进行排序的方法在15个网络中都要优于其他两种方法,度中心性在5个网络表现最优,Kshell方法仅在3个网络中排序达到了最优。
单调性反映了对等级的划分粒度,最好的情况是每一个节点都被划分到不同的等级。我们使用辅助累计分布函数(CCDF)来分析不同排序方式的单调性。等级r的CCDF函数值由下式给出:
Figure BDA0003141153130000083
其中,ni表示属于i等级的节点数量。通过绘制CCDF函数值随等级r变化的曲线图可以分析排序方式的单调性,如果函数值趋向于0的速度越快,即曲线越接近坐标轴,则说明有越多的节点被划分到了同一等级,划分的单调性越差。可选择了5个网络的CCDF曲线图进行分析如图6所示,上图中横坐标表示不同的节点等级,纵坐标表示对应的CCDF函数值,从上图可以看出通过预测SIR值的排序方法曲线斜率接近-1,单调性优于度中心性,度中心性单调性优于Kshell。
实际上,SIR的排序结果对影响力靠前节点的排序稳定性要高于影响力靠后节点的排序稳定性。这主要是由两方面原因造成的,一方面是由网络本身的特点决定的,实际网络中影响力靠后的节点数量众多且影响力差别不大。1897年意大利经济学家帕累托提出“二八定律”以及1999年巴拉巴西、阿尔伯特提出的网络无标度性质都说明了真实世界中的群体结构中绝大多数节点都处于次要地位。这些处于次要地位的绝大多数节点可能本身差别并不大,甚至某些呈现对称结构的节点的实际传播能力本身就相同。另一方面是由SIR模型本身的随机性引入的,因为SIR传播的每一个时间步,处于I状态的节点都是以概率感染其邻居中处于S状态的节点,由此引入的随机性将使得最终排序结果并不是一成不变的。因此在对节点影响力排序结果进行评估时,应当考虑节点之间的差别,对影响力靠前的节点在性能评估中赋予较高的权重。举个例子:在经典的跆拳道俱乐部网络中对每个节点分别模拟SIR传播过程(传染率β=0.25,恢复率α=1)2000次后取平均值,结果如图7所示。从实验结果可以看出,不同节点对之间的网络传播能力相差迥异,例如|r1-r13|>>|r13-r8|、|r28-r20|>>|r20-r15|等,因此不同节点对之间的相对排序在评估方法性能优劣时所占的权重也应该不同。如上图所示,网络传播能力排名17-32位的16个节点的传播能力相差仅为0.065,那么这16个节点之间的排序结果出错带来的影响,将小于33号节点和8号节点排序出错带来的影响。接下来,我们考虑这一现象对SIR模型排序结果带来的影响。
目前用来评估两个序列相似程度最常用的两个指标是斯皮尔曼相关系数和肯德尔相关系数,为了探究对SIR模型排序结果的影响,可在三个小型网络中进行实验,实验以3000次重复的SIR模拟结果为参照,将重复次数分别为100、500、1000、2000、3000的SIR过程模拟20遍,并将每一次模拟得到的结果与参照实验进行对比,并分别从Spearman系数和Kendall系数两个指标衡量了不同次模拟结果的相似度,结果如图8所示,相同参数的SIR过程分别进行了20次,折线图中横坐标代表实验的序号数,横坐标代表了不同重复次数的SIR结果与参照结果的相似程度(参照结果为3000次重复的SIR模拟结果),从实验结果可以看出,重复100次的SIR结果与参照结果的相似度都是最低的,并且相似度随着SIR模型重复次数的增加得以提升,但这种提升是有限度的,即使同样在3000次重复的情况下,相似度依然没有达到100%,两种相关性指标也都呈现出了相同的规律,由此,可以看出网络传播影响力靠后的那些难以区分的节点使得SIR模型本身的排序结果呈现出小幅的波动,应该降低这部分节点在评估方法性能时的权重。因此,RBO相关系数给排名靠前的节点赋予了更高的权重,相比于肯德尔相关系数更适用于对节点影响力排序结果的评估。
通过实验结果数据可以进一步说明本案放案中的利用节点特征来预测节点SIR值并通过排序来确定网络关键节点的有效性。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
基于上述的方法和/或系统,本发明实施例还提供一种服务器,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的方法。
基于上述的方法和/或系统,本发明实施例还提供一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现上述的方法。
在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种基于SIR值学习的网络关键节点发现方法,其特征在于,包含如下内容:
针对样本数据,利用网络分析工具构建不少于一种网络类型的无权无向网络并获取相应网络类型的网络数据;
依据无权无向网络及网络数据计算网络节点特征,并利用SIR模型计算表征节点的网络传播能力的SIR值,将网络节点特征和SIR值作为训练样本,其中,网络节点特征包含:节点局部特征和节点全局特征;
构建用于对网络节点特征和节点SIR值进行统计分析的回归模型,并利用训练样本对回归模型进行训练优化;
计算目标网络数据的节点特征,并利用训练优化后的回归模型来获取节点对应的SIR值;通过对SIR值进行排序来选取网络关键节点。
2.根据权利要求1所述的基于SIR值学习的网络关键节点发现方法,其特征在于,利用python-igraph网络分析包构建同等网络规模但不同网络类型的无权无向网络并获取相应网络数据。
3.根据权利要求1或2所述的基于SIR值学习的网络关键节点发现方法,其特征在于,构建的网络类型包含但不局限于:规则网络、随机网络、小世界网络和无标度网络。
4.根据权利要求1所述的基于SIR值学习的网络关键节点发现方法,其特征在于,节点局部特征包含:用于衡量节点局部信息扩散能力的节点度中心性特征及节点传递中心性特征;节点全局特征包含:用于衡量节点向外部扩散能力的K壳中心性特征。
5.根据权利要求1所述的基于SIR值学习的网络关键节点发现方法,其特征在于,SIR模型将网络节点划分为易感染状态S、感染状态I和恢复免疫状态R,以仅有编号为i的节点处感染状态I的SIR传染过程结束时,状态集合恢复免疫状态R中的节点数占网络节点总数的比例来表示节点i的网络传播能力。
6.根据权利要求1所述的基于SIR值学习的网络关键节点发现方法,其特征在于,所述回归模型采用用于分析预测网络节点特征和节点SIR值之间线性相关性的线性回归模型。
7.根据权利要求1所述的基于SIR值学习的网络关键节点发现方法,其特征在于,所述回归模型采用用于分析预测网络节点特征和节点SIR值之间非线性关系的MLP多层感知器模型。
8.一种基于SIR值学习的网络关键节点发现系统,其特征在于,包含:数据获取模块、数据处理模块、模型训练模块及节点预测模块,其中,
数据获取模块,用于针对样本数据,利用网络分析工具构建不少于一种网络类型的无权无向网络并获取相应网络类型的网络数据;
数据处理模块,用于依据无权无向网络及网络数据计算网络节点特征,并利用SIR模型计算表征节点的网络传播能力的SIR值,将网络节点特征和SIR值作为训练样本,其中,网络节点特征包含:节点局部特征和节点全局特征;
模型训练模块,用于构建用于对网络节点特征和节点SIR值进行统计分析的回归模型,并利用训练样本对回归模型进行训练优化;
节点预测模块,用于通过计算目标网络数据的节点特征,并利用训练优化后的回归模型来获取节点对应的SIR值;通过对SIR值进行排序来选取网络关键节点。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器之行时,使得所述处理器执行如权利要求1~7任一项所述方法的步骤。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1~7中任一项所述方法的步骤。
CN202110740215.7A 2021-06-30 2021-06-30 基于sir值学习的网络关键节点发现方法及系统 Active CN113537461B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110740215.7A CN113537461B (zh) 2021-06-30 2021-06-30 基于sir值学习的网络关键节点发现方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110740215.7A CN113537461B (zh) 2021-06-30 2021-06-30 基于sir值学习的网络关键节点发现方法及系统

Publications (2)

Publication Number Publication Date
CN113537461A CN113537461A (zh) 2021-10-22
CN113537461B true CN113537461B (zh) 2023-04-18

Family

ID=78126352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110740215.7A Active CN113537461B (zh) 2021-06-30 2021-06-30 基于sir值学习的网络关键节点发现方法及系统

Country Status (1)

Country Link
CN (1) CN113537461B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114666229B (zh) * 2022-03-21 2023-10-03 天津商业大学 基于有限传播域的复杂网络节点影响力度量方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304867A (zh) * 2018-01-24 2018-07-20 重庆邮电大学 面向社交网络的信息流行度预测方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10178120B1 (en) * 2015-07-23 2019-01-08 Hrl Laboratories, Llc Method for determining contagion dynamics on a multilayer network
US10218579B1 (en) * 2016-02-12 2019-02-26 Hrl Laboratories, Llc Tensor-based framework for analyzing high velocity large-scale network activities to infer latent mesostructures and important nodes
CN106127590A (zh) * 2016-06-21 2016-11-16 重庆邮电大学 一种基于节点影响力的信息态势感知及传播管控模型
CN108510059A (zh) * 2018-03-09 2018-09-07 西安电子科技大学 基于深度自编码器的复杂网络节点影响力最大化方法
CN109754085A (zh) * 2019-01-09 2019-05-14 中国人民解放军国防科技大学 基于深度强化学习的大规模网络瓦解方法、存储装置以及存储介质
CN109829114B (zh) * 2019-02-14 2023-05-26 重庆邮电大学 一种基于用户行为的话题流行度预测系统及方法
CN111385288B (zh) * 2020-02-20 2022-03-01 中国人民解放军战略支援部队信息工程大学 基于隐蔽对抗的移动目标防御时机选取方法及装置
CN112331357A (zh) * 2020-09-18 2021-02-05 广州优飞信息科技有限公司 传染病传播模型的参数拟合方法和相关装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304867A (zh) * 2018-01-24 2018-07-20 重庆邮电大学 面向社交网络的信息流行度预测方法及系统

Also Published As

Publication number Publication date
CN113537461A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN110070117B (zh) 一种数据处理方法及装置
CN105224872A (zh) 一种基于神经网络聚类的用户异常行为检测方法
CN103678346A (zh) 一种人机识别的方法和系统
JP7119820B2 (ja) 予測プログラム、予測方法および学習装置
CN116596095B (zh) 基于机器学习的碳排放量预测模型的训练方法及装置
CN113537461B (zh) 基于sir值学习的网络关键节点发现方法及系统
Sha et al. Towards the design of complex evolving networks with high robustness and resilience
Couckuyt et al. Towards efficient multiobjective optimization: multiobjective statistical criterions
US6910192B2 (en) Method of robust technology design using rational robust optimization
CN109117352B (zh) 服务器性能预测方法和装置
US6807652B2 (en) Method of robust semiconductor circuit products design using rational robust optimization
Dash DECPNN: A hybrid stock predictor model using Differential Evolution and Chebyshev Polynomial neural network
CN111667072B (zh) 一种情报使用价值评估方法
CN110059966A (zh) 影响因素的贡献力分析方法和装置
Kong et al. Taprank: A time-aware author ranking method in heterogeneous networks
Logeswaran et al. High utility itemset mining using genetic algorithm assimilated with off policy reinforcement learning to adaptively calibrate crossover operation
CN107067036A (zh) 一种接地网腐蚀速率预测方法
CN113191527A (zh) 一种基于预测模型进行人口预测的预测方法及装置
Cameron et al. UNSAT Solver Synthesis via Monte Carlo Forest Search
Baas et al. Predicting virality on networks using local graphlet frequency distribution
Li et al. Power Analysis Attack Based on Lightweight Convolutional Neural Network
Benala et al. Software effort estimation using functional link neural networks optimized by improved particle swarm optimization
Wu et al. A parameter free similarity index based on clustering ability for link prediction in complex networks
CN117010543A (zh) 传播预测模型的训练方法、装置、设备、介质及程序产品
Cui et al. Learning pairwise interactions with bayesian neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant