CN111431755A - 基于复杂网络的多层时序网络模型构建及关键节点识别方法 - Google Patents
基于复杂网络的多层时序网络模型构建及关键节点识别方法 Download PDFInfo
- Publication number
- CN111431755A CN111431755A CN202010316894.0A CN202010316894A CN111431755A CN 111431755 A CN111431755 A CN 111431755A CN 202010316894 A CN202010316894 A CN 202010316894A CN 111431755 A CN111431755 A CN 111431755A
- Authority
- CN
- China
- Prior art keywords
- node
- layer
- nodes
- network
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000010276 construction Methods 0.000 title claims abstract description 8
- 239000010410 layer Substances 0.000 claims abstract description 182
- 239000011159 matrix material Substances 0.000 claims abstract description 20
- 239000011229 interlayer Substances 0.000 claims abstract description 16
- 230000008569 process Effects 0.000 claims abstract description 11
- 230000008859 change Effects 0.000 claims abstract description 8
- 230000002452 interceptive effect Effects 0.000 claims abstract description 6
- 238000005295 random walk Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000013016 damping Methods 0.000 claims description 4
- 238000003012 network analysis Methods 0.000 abstract description 5
- 230000011218 segmentation Effects 0.000 abstract 1
- 230000003993 interaction Effects 0.000 description 13
- 230000003068 static effect Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000009792 diffusion process Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 241001061260 Emmelichthys struhsakeri Species 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 101000911753 Homo sapiens Protein FAM107B Proteins 0.000 description 1
- 241001272996 Polyphylla fullo Species 0.000 description 1
- 102100026983 Protein FAM107B Human genes 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005541 medical transmission Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了基于复杂网络的多层时序网络模型构建和关键节点识别方法,包括:获取一段时间T内N个节点之间的交互关系随时间变化的情况,得到时序网络,根据预置的时间窗口大小对时间T进行有效切分,得到多层时序网络的层数;在相邻两层网络中的对应节点之间按时间顺序建立一条有向连边,构建层间链接。计算节点相似性矩阵,将其作为PageRank跳转偏差获取第一层中节点的中心性,接着在PageRank跳转中进一步添加上一层节点中心性的影响,递归计算其它层的节点中心性。本发明结合多层网络分析法,构建多层时序网络模型,完整揭示时序网络的结构演变及动力学过程。
Description
技术领域
本发明属于复杂网络分析技术领域,具体为一种基于复杂网络的多层时序网络的构建方法及基于该模型的关键节点识别方法。
背景技术
现实世界中许多重要现象依赖于网络,疾病通过人口网络进行传播,互联网由页面彼此连接构成全球网络,人们的日常信息交互构成社交网络等等。复杂网络将这些实际复杂系统通过网络建模分析,客观展现了实际系统中实体间的关联互动,并能够进一步深入分析和理解复杂系统的结构特征和行为变化。现如今,复杂网络已经广泛应用于电力、医学、交通、金融等诸多领域。
复杂网络具有非同质的拓扑结构,其中不同节点在网络结构和功能上发挥的作用存在差异。识别网络中的关键节点已成为分析和理解网络系统的重要组成部分并应用于广泛的领域,包括用于识别社交网络中最有影响力的用户,控制流行病的爆发,防止电网发生灾难性中断等。
在许多实际系统的研究过程中,传统的网络分析方法就是将原始数据建模为静态网络,通常用图形形式表示为由边连接的多个节点。因此,在此基础上用于研究真实复杂系统的现有节点中心性度量指标大都基于静态网络模型,如基于网络拓扑结构的度中心性、半局部中心性、紧密度中心性、PageRank和HITS算法;基于节点移除和收缩建立的节点删除的最短距离法等。实际上,针对静态网络中关键节点的研究已经取得了一系列可观的成果。然而,实际生活中节点间的联系并非持续存在,而是表现为时序相关性,即节点间的连边随时间会间断性地出现和消失,例如:生态食物链在不同季节会发生一定的变化,例如食物网和其他物种网络会随着环境条件的变化而发展,这些环境条件在某种程度上是物种得以存在的条件,疾病传播网络会随着人类的接触和离开而发生变化。基于静态网络的研究将忽略时间变化的信息。随着时间维度的引入,时序网络必然具有不同于静态网络的拓扑结构,因此,如何恰当地对带有时间属性的网络建模并定义节点的中心性度量是一项挑战。
由于时序网络的普遍存在和重要意义,近些年来研究者们对时序网络中关键节点识别展开了一系列的研究工作。近些年来研究者们对时序网络展开了一系列的研究工作。Ke等人将网络中随时间变化的边聚合成单个静态图形;Kempe等人提出了一个时序网络模型作为静态图,其中每条边都用交互发生的时间进行标记;Kim和Anderson在构建时序网络时规定每条边上发生的事件仅有一次,并将各个小网络用有向边连接,仍然转化为静态图研究,从而定义了有向时序图的度中心性、介数中心性和紧密度中心性。Tang提出了基于时间路径的时间度量方法(如,时序紧密度和介数中心性)以识别网络中的重要节点。上述研究或者将边的变化聚合到静态网络而忽略了时间属性,或者仅仅考虑时间窗口中网络结构的时间演变,但缺乏随时间变化不同时间窗口间的联系,这些方法都未能涵盖时间属性的所有方面。由于时序网络中节点间相互作用随时间发生变化并共同实现完整的系统功能,因此同一节点在上一时刻的重要程度必然会对下一时刻造成影响,忽略层间的必要联系将割裂节点随时间变化的情况。通过上述的分析可知,现有技术中针对时序网络的建模一定程度上无法和实际的真实网络很好的拟合,进而将影响关键节点识别的准确性和科学性。
针对这一问题,本发明将时序网络与多层网络分析法相结合,提出了一种多层时序网络模型构建方法。同时,在关键节点识别的问题上,随机游走是描述复杂实体上发生扩散过程的基本模型之一。在经典扩散过程中,随机游走者通常以相等概率随机跳转到相邻节点,一定程度忽略了节点的异质性。Ding在传统的扩散过程中引入了有偏游走的思想,使得某一时刻的随机游走者强制性的偏向于跳转到具有某些特殊属性(例如度、强度或聚类)的邻居节点。然而这些算法大多强调节点局部或全局的拓扑属性,忽略了节点间相互作用对整个网络的影响,即随机游走在跳转到邻居节点的过程中应充分考虑目标节点和源节点间相互作用的影响,否则常常会导致结果不可靠的问题,所得关键节点不一定准确。
因此,提出一种完整揭示时序网络的结构演变及其动力学过程的多层时序网络模型并在充分考虑层内相邻节点间相互作用及其层间影响的双重因素的基础上建立基于此模型的关键节点识别方法是十分有必要的。
发明内容
本发明目的是解决目前现有的基于时序网络的建模分析以及关键节点识别方法中存在忽略时间信息或未考虑时间切片间的交互关系以及随机游走算法忽略了网络中节点的重要性存在异质性,从而易导致结果不可靠的问题,提供一种多层时序网络模型构建方法及基于此模型的关键节点识别方法,用于对时序网络中节点的重要性做出精确评估。
本发明是采用如下技术方案实现的:
1、一种基于复杂网络的多层时序网络模型构建方法,包括如下步骤:
(1)、获取一段时间T内N个节点之间的交互关系随时间变化的情况,得到时序网络,该时序网络中包括N个节点以及节点之间随时间变化间断性出现或消失的连边,其中N为大于或等于2的正整数;
(2)、根据预置的时间窗口大小对时间T进行有效切分,得到多层时序网络的层数为:L=T/l,其中L表示多层时序网络的层数,l表示每一层网络所经历的时间;多层时序网络的各层分别对应于L个时间窗口中的网络,其中,每一层中包括N个节点以及各层所对应的时刻内节点间的链接关系;
(4)、在相邻的两层网络中构建由上一层指向下一层的层间单向链接,即在相邻层中的对应节点之间按时间顺序建立层间一条有向连边,构建多层时序网络中的层间链接;
(5)、多层时序网络表示为G=(N,E,P),其中N为多层网络中的节点个数,E为多层网络边集,P=(P1,P2,...,PL)是一系列子网Pα=(N,Eα),α={1,2,...,L}的集合,其中Pα=(N,Eα)表示多层时序网络第α层所对应的网络结构,N为节点个数,在各个层内均相同,Eα为第α层中节点间的连边所构成的集合,该集合在每一层中各有不同;各层间有向链接为其中,β=α+1。
2、一种基于复杂网络的多层时序网络模型的关键节点识别方法,该方法在上述构建的模型中实现,包括如下步骤:
(1)、根据每一层α={1,2,...,L}中的邻接矩阵Aα计算每个节点i的邻居节点集合Q(i),其中i∈N;
(4)、将有偏随机游走应用于PageRank,根据节点间的相似程度在随机游走者选择邻居节点跳转时添加偏差,得到基于相似性的有偏PageRank(SBPR);首先计算层α=1中节点i的SBPR中心性的方程如下:
其中σ是阻尼系数;
(5)、指数η取值为0或1,当η=0时,有偏PageRank恢复为无偏PageRank(CPR),即节点i的CPR中心性为:
(6)、根据同一层内节点间相似程度会对节点重要性产生影响,同时,相邻层间上一时刻节点的中心性会对下一时刻该节点的中心性产生影响,以递归的方式获取层α=2,3,...,L中节点i的多层时序有偏PageRank(MTB-PR)值为:
其中,δ(a,b)是克罗内克函数;和分别表示上层中同一节点中心性和层内相邻节点间的相似性的幂次方;指数a和b是偏差参数,用来调整节点对于层内及层间因素的依赖程度,并且指数a和b都取大于零的值,即a>0,b>0;
(7)、η=0时,多层时序有偏PageRank(MTB-PR)恢复为多层时序无偏PageRank(MTU-PR):
本发明方法与现有技术相比具有以下优点:
1、本发明的多层时序网络模型构建步骤考虑了时序网络所具有的时间属性,即网络中节点间连边随时间间断性的存在或消失,在建模过程中,将不同时刻节点间不同的链接关系构建为多层网络的每一层,客观真实的再现网络的时变性,克服了经典聚合网络中忽略时变性进而容易改变时序网络拓扑结构的问题。
2、由于不同时刻节点间通过不同的相互作用彼此联系共同实现实际时序网络的系统功能,因此,本发明的多层时序网络模型构建步骤进一步考虑了各层间的联系,即同一节点在前一时刻的重要性会对其在后一时刻的重要性造成影响,克服了以往研究中忽略不同时刻节点间的联系进而割裂节点随时间变化的问题。
3、本发明的关键节点识别步骤引入了节点相似性指标作为衡量节点局部重要性的标志,提出了基于节点相似性的有偏游走,考虑了节点间相互作用对网络的影响。
4、本发明结合了多层时序网络的拓扑结构,将有偏随机游走应用于PageRank,根据层内节点的有偏跳转以及上层中节点对下层中副本节点的单向作用,提出了一种集合层内及层间双重因素的节点排序算法MTB-PR,可以获取节点重要性随时间变化的轨迹,进而改进了现有算法平均分配链接权重所导致的排序结果不可靠的问题。
5、本发明引入偏差参数来调整节点对层内及层间因素的依赖性,进一步可以根据两者影响权重的大小有针对性地挖掘有重要影响的节点。
附图说明
图1表示时序网络到多层时序网络的映射示意图。
图2表示多层时序网络构建流程图。
图3表示基于多层时序网络模型的关键节点识别方法流程图。
图4表示利用SBPR所得节点排名与CPR所得节点排名的对比结果。
图5a表示通过CPR所得第一层中节点排名与MTU-PR所得节点排名的对比结果。
图5b表示通过CPR所得第二层中节点排名与MTU-PR所得节点排名的对比结果。
图5c表示通过SBPR所得第一层中节点排名与MTB-PR所得节点排名的对比结果。
图5d表示通过SBPR所得第二层中节点排名与MTB-PR所得节点排名的对比结果。
图6a表示参数a=1;b=1、3、5时节点的排序结果。
图6b表示参数a=1、3、5;b=1时节点的排序结果。
具体实施方式
下面对本发明的具体实施例进行详细说明。
一种基于复杂网络的多层时序网络模型的构建方法,包括如下步骤:
(1)、获取一段时间T内N个节点之间的交互关系随时间变化的情况,得到时序网络,该时序网络中包括N个节点以及节点之间随时间变化间断性出现或消失的连边,其中N为大于或等于2的正整数;
其中,时序网络可以表示为代表N个节点间的连边的情况在整个T时间内随时间变化的情况。具体地,是一组(M(1),M(2),...,M(T))的集合,其中M(t)=(N,E(t))表示各个时刻均相同的N个节点在时刻t所对应的网络结构,E(t)表示时刻t时节点间的连边所构成的集合,该集合随时间发生变化。
(2)、根据预置的时间窗口大小对时间T进行有效切分,得到多层时序网络的层数为:L=T/l,其中L表示多层时序网络的层数,l表示每一层网络所经历的时间。多层时序网络的各层分别对应于L个时间窗口中的网络,其中,每一层中包括N个节点以及各层所对应的时刻内节点间的链接关系。
(4)、时序网络中节点间相互作用随时间发生变化并共同实现完整的系统功能,同一节点在前一时刻的重要性会对其在后一时刻的重要性造成影响。因此在相邻的两层网络中构建由上一层指向下一层的层间单向链接,即在相邻层中的对应节点之间按时间顺序建立层间一条有向连边,构建多层时序网络中的层间链接。
(5)、多层时序网络表示为G=(N,E,P),其中N为多层网络中的节点个数,E为多层网络边集,P=(P1,P2,...,PL)是一系列子网Pα=(N,Eα),α={1,2,...,L}的集合,其中Pα=(N,Eα)表示多层时序网络第α层所对应的网络结构,N为节点个数,在各个层内均相同,Eα为第α层中节点间的连边所构成的集合,该集合在每一层中各有不同;各层间有向链接为其中,β=α+1。
一种基于复杂网络的多层时序网络模型的关键节点识别方法,包括如下步骤:
(1)、根据每一层α={1,2,...,L}中的邻接矩阵Aα计算每个节点i的邻居节点集合Q(i),其中i∈N。
步骤(2)中的基本思路基于两个方面:①两个节点之间拥有的共同邻居数越多,则彼此之间越相似,这与现实世界相符合,拥有很多共同朋友的两个人彼此之间成为朋友的概率更大;生物网中,物种之间生态需求越是一致则他们的形态越相似;②相邻节点之间的相似性存在差异,即节点i对节点j的相似度不同于节点j对节点i的相似度,邻居节点数量较多的一方对另一方的影响力更大。这与直观判断相符,以生态竞争网络为例,食物相似的物种为争夺食物,竞争会相对更加激烈,而这个过程中,食物种类较多的物种由于存在较多选择,因而受到来自食物种类较少的物种的竞争压力远远低于其本身对后者带来的竞争压力。
(4)、将有偏随机游走应用于PageRank,根据节点间的相似程度在随机游走者选择邻居节点跳转时添加偏差,得到基于相似性的有偏PageRank(SBPR)。首先计算层α=1中节点i的SBPR中心性的方程如下:
其中,σ是阻尼系数,根据经验研究,取σ=0.85。
步骤(4)中节点的有偏PageRank计算公式表明节点j上的漫游者遵循两种策略:以概率σ跳转到节点j的某一邻居节点或者以概率1-σ随机选择网络中的任一节点跳转。假设节点i为节点j的邻居之一,则跳转到节点i的概率取决于节点i与节点j的相似程度相似程度越高,选择该节点跳转的概率越大。
(5)、指数η取值为0或1,当η=0时,有偏PageRank恢复为无偏PageRank(CPR),即节点i的CPR中心性为:
(6)、根据同一层内节点间相似程度会对节点重要性产生影响,同时,相邻层间上一时刻节点的中心性会对下一时刻该节点的中心性产生影响,以递归的方式获取层α=2,3,...,L中节点i的多层时序有偏PageRank(MTB-PR)值为:
其中,δ(a,b)是克罗内克函数。和分别表示上层中同一节点中心性和层内相邻节点间的相似性的幂次方。指数a和b是偏差参数,用来调整节点对于层内及层间因素的依赖程度,并且指数a和b都取大于零的值,即a>0,b>0。
步骤(6)的基本思路为多层时序网络中层间链接呈现为时序相继性的有向连边,节点在上一时刻的状态必然会影响其在下一时刻的重要性且这种影响只能通过时刻t影响时刻t+1的状态,呈现单向性。另外,节点的多层时序有偏PageRank(MTB-PR)计算公式表明节点i的中心性可同时受到α中节点i互为邻居的节点j的中心性以及α-1层中中心性为的节点的影响。这与假设相一致,即上一时刻中节点的重要性会对下一时刻该节点的重要性造成影响。
(7)、η=0时,多层时序有偏PageRank(MTB-PR)恢复为多层时序无偏PageRank(MTU-PR):
总之,本发明所述的复杂网络的多层时序网络模型构建和关键节点识别方法,包括:获取一段时间T内N个节点之间的交互关系随时间变化的情况,得到时序网络,根据预置的时间窗口大小对时间T进行有效切分,得到多层时序网络的层数;在相邻两层网络中的对应节点之间按时间顺序建立一条有向连边,构建层间链接。计算节点相似性矩阵,将其作为PageRank跳转偏差获取第一层中节点的中心性,接着在PageRank跳转中进一步添加上一层节点中心性的影响,递归计算其它层的节点中心性。
具体实施例如下:
实施例1
结合图1和图2,以ACM Hypertext 2009会议期间大约2天内111名与会人员面对面交互的动态过程的数据为例,构建多层时序网络模型。
一种多层时序网络模型的构建方法,具体步骤如下:
(1)、获取2009.06.29-2009.06.30期间参加ACM Hypertext 2009会议的111名与会人员之间的交互关系随时间变化的情况,得到时序网络,该时序网络中包括111个节点以及节点之间随时间变化间断性出现或消失的连边。
(2)、按时间相继性将数据按天切分,得到多层时序网络的层数为2,其中各层分别对应于6月29日和6月30日全天中与会人员的交互情况所构成的网络。每一层中包括111个节点以及各层所对应的时刻内节点间的链接关系。
(4)、相邻的两层网络中构建由上一层指向下一层的层间单向链接,即在相邻层中的对应节点之间按时间顺序建立层间一条有向连边,构建多层时序网络中的层间链接。
(5)、网络基本统计特性如下表所示,其中N表示节点总数,E1和E2分别表示各层中的连边数,T为网络总层数,During为数据记录的时段。构建为两层的多层时序网络,层间相同节点创建时序相继性的有向边。
实施例2
下面结合图3及相应的计算公式,在实施例1中的网络模型中进行应用,获取节点的重要性排名。
一种基于复杂网络的多层时序网络模型的关键节点识别方法,具体步骤如下:
(1)、根据每一层α={1,2}中的邻接矩阵Aα计算每个节点i的邻居节点集合Q(i),其中i∈N。
(4)、将有偏随机游走应用于PageRank,根据节点间的相似程度在随机游走者选择邻居节点跳转时添加偏差,得到基于相似性的有偏PageRank(SBPR)。首先计算层α=1中节点i的SBPR中心性的方程如下:
其中σ是阻尼系数,根据经验研究,取σ=0.85。
(5)、指数η取值为0或1,当η=0时,有偏PageRank恢复为无偏PageRank(CPR),即节点i的CPR中心性为:
(6)、根据同一层内节点间相似程度会对节点重要性产生影响,同时,相邻层间上一时刻节点的中心性会对下一时刻该节点的中心性产生影响,以递归的方式获取层第二层中节点i的多层时序有偏PageRank(MTB-PR)值为:
其中,δ(a,b)是克罗内克函数。和分别表示第一层中同一节点中心性和第二层层内相邻节点间的相似性的幂次方。指数a和b是偏差参数,用来调整节点对于层内及层间因素的依赖程度,并且指数a和b都取大于零的值,即a>0,b>0。
(7)、η=0时,多层时序有偏PageRank(MTB-PR)恢复为多层时序无偏PageRank(MTU-PR):
实施例3
下面结合图4、图5a~5d和图6a~6b对实施例2中的方案进行试验对比分析,衡量本方法的有效性,具体步骤如下:
(1)、首先利用经典PageRank(CPR)对网络各层中的节点进行排序,然后通过基于节点相似性的有偏PageRank(SBPR)对节点排名。
实验结果表明,考虑节点间的相似性对节点排名的影响是非常显著的,这可以从图4中节点的分散分布得到证明,图4左上角及右下角的插图分别是坐标轴x,y∈[0.005,0.01]以及x,y∈[0.01,0.015]的局部放大图,可以看到,节点显著的分散在图中黑色直线的两侧,表明基于相似性的有偏PageRank(SBPR)克服了经典PageRank以均匀概率游走忽略了节点异质性的问题,两者结果之间的显著差异进一步证明考虑节点间相似性的重要性,因为其在确定与会者排名方面发挥了重要作用。
(2)、在ACM Hypertext 2009网络中应用MTB-PR算法,分别考虑η=0和η=1的情况。η=0时,多层时序有偏PageRank恢复为无偏的情况。
首先在层1和层2中使用无偏PageRank(CPR)(即经典PageRank)对与会者排名,然后通过已有的层1中的PageRank在层2上计算多层时序无偏PageRank(MTU-PR)的值,以上对应于η=0的情形。当η=1时,与无偏的情况类似,首先使用基于相似性的有偏PageRank(SBPR)来获得层1与层2中与会者的中心性排名。再次,计算层2上节点的多层时序有偏PageRank(MTB-PR)。在这里仅考虑偏差参数a=1,b=1的情况。
结果表明,节点在两层网络中的排名(即散点图分布)有很大差异,如图5a~5b所示,表明无偏或有偏的多层时序PageRank对与会者排名产生了显著的影响,结果阐明了这样一个事实:与MTU-PR相比,MTB-PR在随机游走过程中加入了节点间相似性的影响,这导致MTB-PR找到排名靠前的节点的效率更高,进而能够更有效地探索多层时序网络。
另一方面,节点在第一层中交流的方式和显著性会影响他在下一层网络中的显著性,即无偏或有偏的多层时序PageRank可以提高第一层中重要性突出的节点在第二层中的中心性排名,如图5a、5b与5c、5d的对比结果所示,在两层网络中排名都较高的与会者106获得了更大的MTU-PR或MTB-PR值。而在第二层中重要性较为显著的与会者9受到第一层排名靠后的影响,其在MTU-PR或MTB-PR中重要性相比第二层都所有降低。
(3)、最后,通过改变偏差参数a,b生成多层时序有偏PageRank(MTB-PR)研究不同的偏差参数a,b如何影响与会者在超文本动态联系网络中的中心性排名。
图6a对应于参数a=1且b=1、3、5的情形,b越大,层内因素即节点间相似度在漫游者选择目标节点优先访问时所占权重越大,此时,节点中心性更多的受到层内因素的影响。随着b的增大,与会者50、88、109的中心性逐渐增加,表明他们在第二层中具有举足轻重的作用。与会者59、75、106排名的降低则表明随机游走过程中他们是与源节点相似度较小的节点。
如图6b对应于偏差参数为a=1、3、5且b=1。此时,a>b,层间因素即来自于上层节点中心性的影响所占权重更大。这导致漫游者优先访问在第一层具有高强度的节点。参数a,b的不同取值导致了5a和5b图中节点中心性的不同分布。与会者25、52、59、106占据突出地位,而9、56、59却有所降低,这表明前者得到来自上一层中节点中心性的增益更大。
上述分析证实了设定的假设,即由于各层拓扑结构的不同及层间的有序单向作用,多层时序网络中节点的中心性受到层内和层间因素协同效应的强烈影响。通过改变偏差参数值,MTB-PR可以有效捕获这些效应,又可以根据两者影响权重的大小有针对性地挖掘有重要影响的与会者。
本发明结合多层网络分析法,构建多层时序网络模型,完整揭示时序网络的结构演变及动力学过程;考虑到层内及层间因素对节点的双重影响,在PageRank跳转中添加偏差获取评估节点重要性的方法,排序结果更可靠。
虽然以上描述了本发明的具体实施方案,本领域的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用变形、修饰、等同替换或等效替换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (4)
1.一种基于复杂网络的多层时序网络模型构建方法,其特征在于:包括如下步骤:
(1)、获取一段时间T内N个节点之间的交互关系随时间变化的情况,得到时序网络,该时序网络中包括N个节点以及节点之间随时间变化间断性出现或消失的连边,其中N为大于或等于2的正整数;
(2)、根据预置的时间窗口大小对时间T进行有效切分,得到多层时序网络的层数为:L=T/l,其中L表示多层时序网络的层数,l表示每一层网络所经历的时间;多层时序网络的各层分别对应于L个时间窗口中的网络,其中,每一层中包括N个节点以及各层所对应的时刻内节点间的链接关系;
(4)、在相邻的两层网络中构建由上一层指向下一层的层间单向链接,即在相邻层中的对应节点之间按时间顺序建立层间一条有向连边,构建多层时序网络中的层间链接;
3.一种基于复杂网络的多层时序网络模型的关键节点识别方法,其特征在于:包括如下步骤:
(1)、根据每一层α={1,2,...,L}中的邻接矩阵Aα计算每个节点i的邻居节点集合Q(i),其中i∈N;
(4)、将有偏随机游走应用于PageRank,根据节点间的相似程度在随机游走者选择邻居节点跳转时添加偏差,得到基于相似性的有偏PageRank(SBPR);首先计算层α=1中节点i的SBPR中心性的方程如下:
其中σ是阻尼系数;
(5)、指数η取值为0或1,当η=0时,有偏PageRank恢复为无偏PageRank(CPR),即节点i的CPR中心性为:
(6)、根据同一层内节点间相似程度会对节点重要性产生影响,同时,相邻层间上一时刻节点的中心性会对下一时刻该节点的中心性产生影响,以递归的方式获取层α=2,3,...,L中节点i的多层时序有偏PageRank(MTB-PR)值为:
其中,δ(a,b)是克罗内克函数;和分别表示上层中同一节点中心性和层内相邻节点间的相似性的幂次方;指数a和b是偏差参数,用来调整节点对于层内及层间因素的依赖程度,并且指数a和b都取大于零的值,即a>0,b>0;
(7)、η=0时,多层时序有偏PageRank(MTB-PR)恢复为多层时序无偏PageRank(MTU-PR):
4.根据权利要求3所述的基于复杂网络的多层时序网络模型的关键节点识别方法,其特征在于:步骤(4)中,取σ=0.85。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010316894.0A CN111431755B (zh) | 2020-04-21 | 2020-04-21 | 基于复杂网络的多层时序网络模型构建及关键节点识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010316894.0A CN111431755B (zh) | 2020-04-21 | 2020-04-21 | 基于复杂网络的多层时序网络模型构建及关键节点识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111431755A true CN111431755A (zh) | 2020-07-17 |
CN111431755B CN111431755B (zh) | 2023-02-03 |
Family
ID=71556542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010316894.0A Active CN111431755B (zh) | 2020-04-21 | 2020-04-21 | 基于复杂网络的多层时序网络模型构建及关键节点识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111431755B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112347373A (zh) * | 2020-11-13 | 2021-02-09 | 浙江工业大学 | 一种基于开源软件邮件网络的角色推荐方法 |
CN112700124A (zh) * | 2020-12-29 | 2021-04-23 | 长安大学 | 多层交通网络mrwc节点重要性排序方法、系统、电子设备及计算机可读存储介质 |
CN112765329A (zh) * | 2020-12-31 | 2021-05-07 | 清华大学 | 一种社交网络关键节点发现方法及系统 |
CN114169591A (zh) * | 2021-11-19 | 2022-03-11 | 浙江大学 | 基于复杂网络的装备保障体系关键毁伤节点识别方法 |
CN116016199A (zh) * | 2023-02-21 | 2023-04-25 | 山东海量信息技术研究院 | 一种信息控制方法、系统、电子设备及可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201215400D0 (en) * | 2012-08-30 | 2012-10-17 | Ibm Uk | Identifying prominent nodes in a complex network |
US20140351307A1 (en) * | 2013-05-22 | 2014-11-27 | International Business Machines Corporation | Calculating node centralities in large networks and graphs |
CN106533759A (zh) * | 2016-11-11 | 2017-03-22 | 南京理工大学 | 一种多层网络中的基于路径熵的链路预测方法 |
CN109379220A (zh) * | 2018-10-10 | 2019-02-22 | 太原理工大学 | 基于组合优化的复杂网络关键节点簇挖掘的方法 |
CN109446628A (zh) * | 2018-10-22 | 2019-03-08 | 太原科技大学 | 基于复杂网络的多层城市交通网构建及关键节点识别方法 |
CN110046838A (zh) * | 2019-05-29 | 2019-07-23 | 西南交通大学 | 一种基于多层复杂网络的轨道交通产业链配置方法 |
-
2020
- 2020-04-21 CN CN202010316894.0A patent/CN111431755B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201215400D0 (en) * | 2012-08-30 | 2012-10-17 | Ibm Uk | Identifying prominent nodes in a complex network |
US20140351307A1 (en) * | 2013-05-22 | 2014-11-27 | International Business Machines Corporation | Calculating node centralities in large networks and graphs |
CN106533759A (zh) * | 2016-11-11 | 2017-03-22 | 南京理工大学 | 一种多层网络中的基于路径熵的链路预测方法 |
CN109379220A (zh) * | 2018-10-10 | 2019-02-22 | 太原理工大学 | 基于组合优化的复杂网络关键节点簇挖掘的方法 |
CN109446628A (zh) * | 2018-10-22 | 2019-03-08 | 太原科技大学 | 基于复杂网络的多层城市交通网构建及关键节点识别方法 |
CN110046838A (zh) * | 2019-05-29 | 2019-07-23 | 西南交通大学 | 一种基于多层复杂网络的轨道交通产业链配置方法 |
Non-Patent Citations (4)
Title |
---|
SHICHEN LIU;CHENG JIANG;HUA YU;JIE SUI: ""Research on Multi-Layer Propagation for Detecting Key Nodes of Positive Effects in Social Networks"", 《2019 4TH INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS ENGINEERING (ICISE)》 * |
YANG YUNYUN,XIE GANG, XIE JUN: ""Mining important nodes in weighted complex networks"", 《DISCRETE DYNAMICS IN NATURE AND SOCIETY》 * |
何嘉林: ""复杂网络中的社团结构探测和应用研究"", 《中国优秀博硕士学位论文全文数据库(博士)基础科学辑》 * |
杨云云: ""面向复杂网络可控性的若干关键问题研究"", 《中国优秀博硕士学位论文全文数据库(博士)基础科学辑》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112347373A (zh) * | 2020-11-13 | 2021-02-09 | 浙江工业大学 | 一种基于开源软件邮件网络的角色推荐方法 |
CN112700124A (zh) * | 2020-12-29 | 2021-04-23 | 长安大学 | 多层交通网络mrwc节点重要性排序方法、系统、电子设备及计算机可读存储介质 |
CN112700124B (zh) * | 2020-12-29 | 2023-10-24 | 长安大学 | 多层交通网络mrwc节点重要性排序方法、系统、电子设备及计算机可读存储介质 |
CN112765329A (zh) * | 2020-12-31 | 2021-05-07 | 清华大学 | 一种社交网络关键节点发现方法及系统 |
CN112765329B (zh) * | 2020-12-31 | 2022-07-05 | 清华大学 | 一种社交网络关键节点发现方法及系统 |
CN114169591A (zh) * | 2021-11-19 | 2022-03-11 | 浙江大学 | 基于复杂网络的装备保障体系关键毁伤节点识别方法 |
CN116016199A (zh) * | 2023-02-21 | 2023-04-25 | 山东海量信息技术研究院 | 一种信息控制方法、系统、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111431755B (zh) | 2023-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111431755B (zh) | 基于复杂网络的多层时序网络模型构建及关键节点识别方法 | |
CN113285828B (zh) | 复杂网络关键节点辨识方法及其电网关键节点辨识方法 | |
CN103559407B (zh) | 一种用于度量有向加权图中节点亲密度的推荐系统及方法 | |
Rezvanian et al. | Sampling social networks using shortest paths | |
Pfeiffer et al. | Methods to determine node centrality and clustering in graphs with uncertain structure | |
Liao et al. | Predicting missing links via correlation between nodes | |
CN106127590A (zh) | 一种基于节点影响力的信息态势感知及传播管控模型 | |
Rahimi et al. | Location recommendation based on periodicity of human activities and location categories | |
CN106951524A (zh) | 基于节点影响力的重叠社区发现方法 | |
Meng et al. | Analysis of epidemic vaccination strategies by node importance and evolutionary game on complex networks | |
CN112084373B (zh) | 一种基于图嵌入的多源异构网络用户对齐方法 | |
CN107317704A (zh) | 一种基于紧密度和结构洞的复杂网络重要节点排序方法 | |
CN111342991B (zh) | 基于跨社交网络的信息传播方法 | |
Jia et al. | An improvement method for degree and its extending centralities in directed networks | |
Tarbush et al. | Homophily in online social networks | |
Kylasa et al. | Social ties and checkin sites: Connections and latent structures in Location Based Social Networks | |
Zhang et al. | Learning latent friendship propagation networks with interest awareness for link prediction | |
Bao et al. | Estimating the sizes of populations at risk of HIV infection from multiple data sources using a Bayesian hierarchical model | |
Gao et al. | Link prediction based on linear dynamical response | |
Wang et al. | [Retracted] Overlapping Community Detection Based on Node Importance and Adjacency Information | |
Canzani et al. | Insights from Modeling Epidemics of Infectious Diseases-A Literature Review. | |
Lopes et al. | Scientific Collaboration in Research Networks: A Quantification Method by Using Gini Coefficient. | |
CN112380455A (zh) | 基于反溯源安全受控入网通道的境内外互联网数据定向隐蔽采集方法 | |
Zhou et al. | Modeling city locations as complex networks: An initial study | |
CN112420210A (zh) | 基于城市多因素的新发重大传染病r0计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |