CN107292751B - 一种时序网络中节点重要性的挖掘方法和装置 - Google Patents
一种时序网络中节点重要性的挖掘方法和装置 Download PDFInfo
- Publication number
- CN107292751B CN107292751B CN201710400025.4A CN201710400025A CN107292751B CN 107292751 B CN107292751 B CN 107292751B CN 201710400025 A CN201710400025 A CN 201710400025A CN 107292751 B CN107292751 B CN 107292751B
- Authority
- CN
- China
- Prior art keywords
- network
- time
- node
- weight
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000005065 mining Methods 0.000 title claims abstract description 18
- 230000002452 interceptive effect Effects 0.000 claims abstract description 42
- 230000001186 cumulative effect Effects 0.000 claims abstract description 23
- 230000003068 static effect Effects 0.000 claims description 44
- 230000003993 interaction Effects 0.000 claims description 36
- 238000009825 accumulation Methods 0.000 claims description 26
- 238000000354 decomposition reaction Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 15
- 230000006399 behavior Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 7
- 201000010099 disease Diseases 0.000 claims description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 239000010410 layer Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000015654 memory Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开一种时序网络中节点重要性的挖掘方法和装置。在该方法中,首先根据N个节点之间交互的时间关系构建时序网络,然后按照预置的时间窗口大小对时序网络进行切片处理,得到切片网络序列,切片网络序列包括:对应于m个时间窗口的m个切片网络,接下来对每个切片网络中的所有连边分别计算出一个权重值,对每个切片网络中的所有连边对应的权重值按照不同的连边分别进行权重值累加,得到时序网络中节点对之间的连边的权重累计值,将每个节点对之间的连边的权重累计值更新到时序网络中,得到含权网络,最后通过包括有权重累计值的连边计算含权网络中每个节点的重要性指标,每个节点的重要性指标包括:对应节点的所有连边对应的权重累计值之和。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种时序网络中节点重要性的挖掘方法和装置。
背景技术
在传统的复杂网络的研究中,经常采用的方法是使用大量原始数据构建成静态网络,然后对静态网络进行研究和分析。以微博网络为例,在微博网络中,把每个用户设定为网络中的一个节点,把微博用户之间的相互交互行为通过节点之间的连边来表示,例如,一个用户对其关注的用户所发布的微博进行点赞、转发、评论等行为都看做是微博用户之间的交互行为。通过微博网络中用户和用户之间的交互行为就构建了一个静态网络。
复杂网络研究的一个重要方向就是网络中节点的中心性的研究,即通过对网络的拓扑结构进行分析,从而分析得到网络中的重要节点。如上面提到的微博网络中,通过分析微博网络的拓扑结构,可以识别出网络中的重要节点,通过这些节点能使得信息在微博网络中更加快速高效的传播。
现有技术提供一种静态网络中的k核分解方法,这种方法是一个简单高效的用于识别网络中的重要节点的方法,k核分解方法是基于静态网络进行处理的,该方法依据节点在网络中的结构特性把节点进行分层处理,完成k核分解后静态网络中的所有节点都对应有一个核值。核值是一个全局性的指标,核值大的节点往往位于静态网络的中心位置,这些节点对于信息传播和维护网络的鲁棒性具有非常重要的作用。
现有技术中,静态网络的模型虽然能够展现网络整体结构特征,但是现有技术中的静态网络无法体现节点基于时序的交互关系,即静态网络中的k核分解方法无法用于存在不同时刻的交互关系的重要节点识别。以日常的人际网络为例,用节点a,b表示两个朋友关系的节点,节点c表示一个与a、b都不是朋友关系的节点。由于某些原因,在某个时刻节点a与节点c发生了一次仅有的交流行为。在构建静态网络的时候,会在(a,b)之间生成一条连边1,在(a,c)之间生成一条连边1。在静态网络中连边1和连边2被当做是相同的连边,这两条连边是没有区别的,这样按照现有技术,就无法展现出节点对之间的具体交互关系了。此外,在静态网络中分析信息传播过程时,例如在网络中(a,b)在时间为时刻1的时候存在交互行为,(a,c)在时间为时刻2的时候存在交互行为,时刻1为早于时刻2的时间。假设节点c是网络中的传播源,具有把信息传播给其邻居节点的能力。如果通过传统的静态网络来分析传播过程,可以知道节点c首先把信息传递节点a,然后节点a再把信息传递给节点b。但是在真实情况下,节点c把信息传递给节点a之后,是无法把信息再传递给节点b的,因为节点对(a,b)的连边是在节点c把信息传给节点a之前生成的。通过上述的分析可知,现有技术中静态网络无法和实际的真实网络很好的拟合。
发明内容
本发明的目的在于提供一种时序网络中节点重要性的挖掘方法和装置,用于对存在不同时刻的交互关系的重要节点识别。
为了达到上述目的,本发明采用这样的如下技术方案:
一方面,本发明提供一种时序网络中节点重要性的挖掘方法,包括:
根据N个节点之间交互的时间关系构建时序网络,所述时序网络包括:所述N个节点以及在不同时刻分别存在交互关系的节点之间的连边,所述N为大于或等于2的正整数;
按照预置的时间窗口大小对所述时序网络进行切片处理,得到切片网络序列,所述切片网络序列包括:对应于m个时间窗口的m个切片网络,其中,每个切片网络包括:所述N个节点以及在各自的时间窗口内存在交互关系的节点之间的连边,所述m为大于或等于2的正整数;
对所述切片网络序列中每个切片网络中的所有连边分别计算出一个权重值;
对所述每个切片网络中的所有连边对应的权重值按照不同的连边分别进行权重值累加,得到所述时序网络中节点对之间的连边的权重累计值,所述节点对为所述时序网络中存在交互关系的一组节点;
将每个节点对之间的连边的权重累计值更新到所述时序网络中,得到含权网络,所述含权网络包括:所述N个节点以及包括有所述权重累计值的连边;
通过所述包括有所述权重累计值的连边计算所述含权网络中每个节点的重要性指标,所述每个节点的重要性指标包括:对应节点的所有连边对应的权重累计值之和。
另一方面,本发明提供一种时序网络中节点重要性的挖掘装置,包括:
时序网络构建模块,用于根据N个节点之间交互的时间关系构建时序网络,所述时序网络包括:所述N个节点以及在不同时刻分别存在交互关系的节点之间的连边,所述N为大于或等于2的正整数;
切片模块,用于按照预置的时间窗口大小对所述时序网络进行切片处理,得到切片网络序列,所述切片网络序列包括:对应于m个时间窗口的m个切片网络,其中,每个切片网络包括:所述N个节点以及在各自的时间窗口内存在交互关系的节点之间的连边,所述m为大于或等于2的正整数;
权重计算模块,用于对所述切片网络序列中每个切片网络中的所有连边分别计算出一个权重值;
权重累计模块,用于对所述每个切片网络中的所有连边对应的权重值按照不同的连边分别进行权重值累加,得到所述时序网络中节点对之间的连边的权重累计值,所述节点对为所述时序网络中存在交互关系的一组节点;
网络更新模块,用于将每个节点对之间的连边的权重累计值更新到所述时序网络中,得到含权网络,所述含权网络包括:所述N个节点以及包括有所述权重累计值的连边;
重要性计算模块,用于通过所述包括有所述权重累计值的连边计算所述含权网络中每个节点的重要性指标,所述每个节点的重要性指标包括:对应节点的所有连边对应的权重累计值之和。
采用上述技术方案后,本发明提供的技术方案将有如下优点:
首先根据N个节点之间交互的时间关系构建时序网络,然后按照预置的时间窗口大小对时序网络进行切片处理,得到切片网络序列,切片网络序列包括:对应于m个时间窗口的m个切片网络,接下来对切片网络序列中每个切片网络中的所有连边分别计算出一个权重值,对每个切片网络中的所有连边对应的权重值按照不同的连边分别进行权重值累加,得到时序网络中节点对之间的连边的权重累计值,将每个节点对之间的连边的权重累计值更新到时序网络中,得到含权网络,最后通过包括有权重累计值的连边计算含权网络中每个节点的重要性指标,每个节点的重要性指标包括:对应节点的所有连边对应的权重累计值之和。本发明实施例中由于采取时序网络模型,能够更好的拟合数据所发生的时间信息。利用各个切片网络中涵盖有时间信息的连边计算出时序网络中的节点重要性,从而使得对节点的重要性评估能够体现节点基于时序的交互关系。
附图说明
图1为本发明实施例提供一种时序网络中节点重要性的挖掘方法的流程方框示意图;
图2为本发明实施例提供的对应表1的时序数据在时间窗口大小为时刻1时所得的切片网络序列的示意图;
图3为本发明实施例提供的对应表1的时序数据在时间窗口大小为时刻2时所得的切片网络序列的示意图;
图4为本发明实施例提供的对各个切片网络按照时序k核分解方法进行计算的结果示意图;
图5为本发明实施例提供的对切片网络的计算结果进行整合而得到节点的时序k核值的结果示意图;
图6-a为本发明实施例提供的一种时序网络中节点重要性的挖掘装置的组成结构示意图;
图6-b为本发明实施例提供的另一种时序网络中节点重要性的挖掘装置的组成结构示意图。
具体实施方式
本发明实施例提供了一种时序网络中节点重要性的挖掘方法和装置,用于对存在不同时刻的交互关系的重要节点识别。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域的技术人员所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本发明的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
以下分别进行详细说明。
本发明时序网络中的重要节点的挖掘方法的一个实施例,可应用于复杂网络中的节点重要性的挖掘过程中。网络中的重要节点对于信息在网络中的传播起着非常重要的作用,可以运用到生活中的疾病控制中、网络上的信息传播的监控等方面。请参阅图1所示,本发明提供的时序网络中的重要节点的挖掘方法,可以包括如下步骤:
101、根据N个节点之间交互的时间关系构建时序网络,时序网络包括:N个节点以及在不同时刻分别存在交互关系的节点之间的连边,N为大于或等于2的正整数。
在本发明实施例中,网络信息数据库中保存有拓扑网络的各种记录信息,例如网络信息数据库中保存有多个用户,这些用户属于用户集,网络信息数据库中有的用户之间存在交互关系,网络信息数据库中的用户可以通过身份识别码(ID,Identity)来标识,用户之间的交互关系根据拓扑网络的具体实现可以表示不同的关系,例如拓扑网络可以指的是疾病传播网络、社交网络、媒体资讯网络等,在这些具体的拓扑网络中用户之间的交互关系具体可以为疾病传播关系和社交关系。本发明实施例中网络信息数据库中存储的用户之间存在的交互关系具有时序特征,举例说明,网络信息数据库中存储有用户a、用户b、用户c,这三个用户分别对应有一个节点,即节点a、节点b和节点c,节点对(a,b)在时间为时刻1的时候存在交互行为,节点对(a,c)在时间为时刻2的时候存在交互行为,时刻1为早于时刻2的时间。
在本发明实施例中,可以根据网络信息数据库中存储的N个节点之间交互的时间关系构建出时序网络,本发明实施例提供的时序网络就是指记录下节点之间交互时间信息的网络。其中,网络信息数据库中存储的节点个数用N来表示,N的取值由网络信息数据库中的用户个数确定,每一个用户对应有一个节点,若两个用户在某个时刻存在交互关系,则这两个用户分别对应的节点构成一个节点对,可以将该节点对内的两个节点之间建立连边。
在本发明的一些实施例中,步骤101根据N个节点之间交互的时间关系构建时序网络,包括:
A1、根据N个节点之间交互的时间关系获取到时序数据集,时序数据集包括:在不同时刻分别存在交互关系的节点数据;
A2、根据时序数据集构建静态网络,并确定静态网络中在各个时刻存在交互关系的节点对之间的连边,从而得到时序网络。
其中,从网络信息数据库中获取到N个节点之间交互的时间关系的数据,这些数据构成时序数据集,时序数据集中记录的是N个节点之间的时序交互数据,通过该时序数据集可以构建出静态网络,然后在将时序关系数据更新到静态网络的连边上,从而可以生成时序网络。
进一步的,在本发明的一些实施例中构建的时序数据集,可以包括:时序数据集中的时间间隔、提取数据的开始时间、提取数据的结束时间。其中,通过对时序网络数据的分析,得出时序数据集的时间分布情况信息,该时间分布情况信息分别是时序数据集中的时间间隔、提取数据的开始时间、提取数据的结束时间。例如在收集时序数据时,有些时序数据集是每20s收集一次数据,即需要将这20s内存在交互的节点记录下来。另外,时序数据集的时间分布情况信息还可以包括:时序数据集中的连边的密度等信息。连边的密度是指时序网络中节点对之间确实存在的连边的个数和网络中所有节点之间都相互连接时的连边的条数的比值。
接下来时序网络的生成过程进行举例说明。假设一个时序数据集如下表1所示,后续实施例中将用此时序数据集展示时序网络图模型的构建过程。
表1为时序数据集所包括的时序数据:
连边 | 连边的交互时间 |
(A,B) | (5,6) |
(A,C) | (1) |
(A,D) | (1,4) |
(B,C) | (3,5,6) |
(B,D) | (1,2,3,5,6) |
(C,D) | (1,2,6) |
其中,时序网络中包括有4个节点,即N=4的情况,4个节点分别为A、B、C、D,表1中的1、2、3、4、5和6表示6个不相同的时刻,将6个不相同时刻的节点之间的交互关系更新到静态网络上,可以到时序网络。
102、按照预置的时间窗口大小对时序网络进行切片处理,得到切片网络序列,切片网络序列包括:对应于m个时间窗口的m个切片网络,其中,每个切片网络包括:N个节点以及在各自的时间窗口内存在交互关系的节点之间的连边,m为大于或等于2的正整数。
在本发明实施例中,通过步骤101生成时序网络后,对该时序网络按照时间窗口大小进行切片处理,从而可以得到切片网络序列。该切片网络序列可以包括:对应于m个时间窗口的m个切片网络,即每个时间窗口对应有一个切片网络,m为大于或等于2的正整数,通过切片处理可以生成2个或2个以上的切片网络。其中,一个切片网络包括:N个节点以及在该切片网络对应的时间窗口内存在交互关系的节点之间的连边。
本发明实施例中预置的时间窗口大小可以根据具体场景灵活选取,例如该时间窗口大小可以是一个单位时间,也可以是两个单位时间或者更多的单位时间,取决于时序数据集中的数据采集周期以及时序数据的多少。该时间窗口大小可以作为切片的间隔大小,依据时间窗口图模型对时序数据集进行切片处理,从而得到切片网络序列,能够更加充分合理地利用时序数据集中的时间信息。例如,设定一个固定大小的时间窗口值,然后对时序数据集进行切片处理,得到切片网络序列:N1,N2,...,Nm,即共得到m个切片网络。
如前述的表1所示,左边一列表达的是节点之间有交互关系时构成的节点对,右边表示的是节点之间交互的时刻。以表1所示的时序数据为例举例说明切片网络的生成过程。举例说明如下,如图2所示,为本发明实施例提供的对应表1的时序数据在时间窗口大小为时刻1时所得的切片网络序列的示意图。图2中的N1、N2、N3、N4、N5和N6表示6个不同的时刻,例如,在N1时刻,节点对(A、C)、节点对(A、D)、节点对(C、D)、节点对(B、D)之间都存在交互关系,因此可以构建出4条连边,依据这种方式分别建立N1、N2、N3、N4、N5和N6表示6个不同的时刻的连边,从而可以生成6个切片网络。
如图3所示,为本发明实施例提供的对应表1的时序数据在时间窗口大小为时刻2时所得的切片网络序列的示意图。图3中的N1时刻对应于图2中N1和N2合并后的切片网络,图3中的N2时刻对应于图2中N3和N4合并后的切片网络,图3中的N3时刻对应于图2中N5和N6合并后的切片网络。图2所示的时间窗口图表达的是以一个时刻值为窗口大小进行切片处理,共得到六个切片网络,分别对应的是六个时刻的切片网络图,图3表示的时间窗口图表达的是以2个时刻值为时间窗口,例如图3的N1对应的是图2中的N1和N2合并后的切片网络。在进行时间窗口图模型的构建过程中,首先选定一个包含固定时刻值个数的时间窗口,然后依据该时间窗口大小对整个时序网络进行切片处理,从而得到切片网络序列,图2和图3都表示了用时间窗口图模型对时序数据进行切片处理的结果图。
在本发明的一些实施例中,步骤102按照预置的时间窗口大小对时序网络进行切片处理,包括:
B1、按照第t个时间窗口从时序网络中提取在t个时间窗口内存在交互关系的连边,从而得到对应于第t个时间窗口的第t个切片网络,t表示小于或等于m的任意一个正整数。
其中,以t为小于或等于m的任意一个值为例,则按照第t个时间窗口从时序网络中提取在t个时间窗口内存在交互关系的连边,对于不属于第t个时间窗口内的连边则不需要提取,从而可以得到对应于第t个时间窗口的第t个切片网络。举例说明,如图3所示,若t=1,则可以提取出图3中N1对应的切片网络,若t=2,则可以提取出图3中N2对应的切片网络,若t=3,则可以提取出图3中N3对应的切片网络。
103、对切片网络序列中每个切片网络中的所有连边分别计算出一个权重值。
在本发明实施例中,对于切片网络序列中的m个切片网络,对于每一个切片网络,计算出该切片网络中所有连边的权重,举例说明,如图3所示,对于N1时刻、N2时刻、N3时刻分别对应的切片网络,都需要计算出每一个切片网络中所有连边的权重值,其中一个连边的权重值可以由该连边所在的切片网络中的时序数据来确定,例如一个连边的权重值可以由连边两端的节点的重要性指标来确定,其中,本发明实施例中计算节点的重要性指标可以有多种方法,例如可以采用度中心性指标、特征向量中心性和k核中心性指标中的至少一种来计算出切片网络中的节点的重要性指标,再通过节点的重要性指标确定该节点对应的连边的权重。
在本发明的一些实施例中,步骤103对切片网络序列中每个切片网络中的所有连边分别计算出一个权重值,包括:
C1、对切片网络序列中每个切片网络分别进行k核分解,并且在每个切片网络进行k核分解的过程中,当需要移除掉第一连边时,将当前的k值作为权重值赋值给第一连边,第一连边为切片网络中的任意一个连边。
其中,切片网络是时序网络的一种表示模型,可以在切片网络中通过对静态k核分解方法的改进,计算出切片网络中连边的重要性值,本发明实施例中采用的方法可以定义为时序k核分解方法。将该重要性值作为切片网络中连边的权重。举例说明如下,在每一个切片网络Nt(t=1,2,...,m)中,首先按照静态网络中的k核分解方法进行执行,所不同的是在进行节点移除时,把移除连边时把所有k所对应的值作为权重赋给连边,即移除某条连边时,就把当前的k值作为权重值赋给这条移除掉的连边,例如连边(i,j)在第t个切片网络中的权重可以表示为即k是连边(i,j)在第t个切片网络中的权值。对切片网络序列中的每个切片网络都执行前述操作。最后,每个切片网络中的连边都对应有一个权重值。
接下来对本发明实施例在静态网络中k核分解方法进行举例说明,k核分解方法是一个简单高效的用于识别网络中的重要节点的方法。k核分解方法是基于静态网络进行处理的,该方法依据节点在网络中的结构特性把节点进行分层处理,具体的计算步骤如下:
1、依据原始数据集构建一个静态网络,并设定一个索引值k,k的取值从1开始。
2、首先移除静态网络中的所有度值为1的节点(即在网络中只有一个邻居节点的用户)和与这些节点连接的连边。然后在剩余的静态网络中重复上述操作,直到静态网络中不再有度值为1的节点。被移除的这些节点的核值为1,这些节点所处的位置称为第1层壳。
3、k值加1,得到k=2。在剩余的静态网络中移除度值为2的节点和与这些节点相连接的连边。接着在剩余的静态网络中继续移除所有度值小于或等于2的节点和与这些节点相连接的边,重复上述操作,直到网络中不存在度值小于或等于2的节点为止。在该步操作中所移除的所有节点的核值记为2,这些节点处于第2层。
4、k值逐次加1,并且重复第3步骤的操作,直到静态网络中的所有节点都被移除。这时静态网络中的所有节点都对应有一个核值。
其中,核值是一个全局性的指标,核值大的节点往往位于网络的中心位置,这些节点对于信息传播和维护网络的鲁棒性具有非常重要的作用。
在静态网络中k核分解方法中,当静态网络中的节点较多时,可能在其核心层的节点个数较多,这时就很难区分出同层节点之间哪一个节点具有更加重要的作用。k核分解方法在同层节点的核值都相同时无法区分节点的重要性。为了解决这个问题,本发明实施例中可以执行后续步骤104,从而为时序网络中的所有连边计算出一个权重累计值,详见后续步骤104中的描述。
104、对每个切片网络中的所有连边对应的权重值按照不同的连边分别进行权重值累加,得到时序网络中节点对之间的连边的权重累计值,节点对为时序网络中存在交互关系的一组节点。
在本发明实施例中,每个切片网络中的所有连边都计算出一个对应的权重值之后,接下来以时序网路中的连边为单位,将该连边在所有切片网络中的权重值相加,即可以对时序网络中节点对之间的连边的权重值进行累计,从而生成时序网络中节点对之间的连边的权重累计值。
在本发明的一些实施例中,步骤104对每个切片网络中的所有连边对应的权重值按照不同的连边分别进行权重值累加,得到时序网络中节点对之间的连边的权重累计值,包括:
E1、通过如下方式计算时序网络中节点对之间的连边的权重累计值:
举例说明如下,可以依据时序数据集构建一个静态网络,在该静态网络中,每个节点对之间只要出现过一次交互就在节点对之间形成连边,然后通过上述Wi,j的公式计算出节点对之间的连边权重值。
需要说明的是,在前述步骤102中对时序网络进行切片处理,通过步骤103计算出每个切片网络中存在连边的权重值,步骤104是把步骤103中的连边权重值进行累加,举例说明,把前述切片网络中的节点对(a,b)的连边权重值进行累加,从而可以得到节点对(a,b)的连边在时序网络中的权重累计值,节点对(a,b)表示时序网络中的任意一个节点对。
105、将每个节点对之间的连边的权重累计值更新到时序网络中,得到含权网络,含权网络包括:N个节点以及包括有权重累计值的连边。
在本发明实施例中,得到每个节点对之间的连边的权重累计值之后,可以将每个节点对之间的连边的权重累计值更新到时序网络中,得到含权网络,含权网络包括:N个节点以及包括有权重累计值的连边。如图4所示,为本发明实施例提供的对各个切片网络按照时序k核分解方法进行计算的结果示意图。举例说明,如图4所示,对于N1时刻、N2时刻、N3时刻分别对应的切片网络,都需要计算出每一个切片网络中所有连边的权重值,以N1时刻对应的切片网络为例,在N1时刻,节点对(A、C)、节点对(A、D)、节点对(C、D)、节点对(B、D)之间都存在交互关系,因此可以构建出4条连边,节点对(B、D)的连边的权重值为1,节点对(A、C)、节点对(A、D)、节点对(C、D)的连边的权重值都是2。将对于N1时刻、N2时刻、N3时刻分别对应的切片网络中相同的连边的权重值进行累计,将每个连边的权重累计值更新到时序网络中,从而得到含权网络。如图5所示,为本发明实施例提供的对切片网络的计算结果进行整合而得到节点的时序k核值的结果示意图。将每个节点对之间的连边的权重累计值更新到时序网络中,最后命名到的含权网络,其中,权指的是连边有权值的网络,tk是指temporalk-shell即时序k核,简写为NTK。例如,对于节点对(A、C)对应的连边,将图4中N1时刻、N2时刻、N3时刻分别对应的切片网络中的同一个连边的权重值(例如2,0,0)进行累计,得到节点对(A、C)对应的连边的权重累计值为2,同理,节点对(A、D)对应的连边的权重累计值为3,节点对(A、B)对应的连边的权重累计值为1,节点对(B、C)对应的连边的权重累计值为3,节点对(B、D)对应的连边的权重累计值为4,节点对(C、D)对应的连边的权重累计值为4。
106、通过包括有权重累计值的连边计算含权网络中每个节点的重要性指标,每个节点的重要性指标包括:对应节点的所有连边对应的权重累计值之和。
在本发明提供的实施例中,获取到所有切片网络中连边的权重值之后,再计算出时序网络中所有连边的权重累计值,将每个连边的权重累计值整合到时序网络(即由时序数据集所构成的网络)中,从而可以得到含权网络,最后对该含权网络进行节点重要性分析。本发明实施例中可以构建出切片网络序列,然后进行时序k核分解方法,时序k核分解方法可以用于时序数据集所对应的时序网络中,而现有技术中的k核分解方法是运用于静态网络中的。因此本发明实施例提供的方法可以评估出时序网络中节点的重要性,因为时序k核值算法所计算出的节点核值基本都不同。
在本发明的一些实施例中,步骤106通过包括有权重累计值的连边计算含权网络中每个节点的重要性指标,包括:
D1、通过如下方式计算含权网络中每个节点的时序k核值,将时序k核值作为重要性指标:
其中,TK(i)表示第i个节点的时序k核值,Γi表示节点i在含权网络中的邻居节点集合,Wi,j表示节点对(i,j)之间的连边的权重累计值。
举例说明,在NTK网络中,把每个节点的时序k核值为TK(i),TK(i)的计算公式如前述所示,Γi表示节点i在NTK网络中的邻居节点集合。例如,针对图3所示的切片网络进行时序k核分解方法,计算过程如图4所示,图4中共有三个切片网络,连边上的数字表示在每个切片网络中连边的权重值。图5表示的是NTK网络,每个节点边上的数字表示对三个切片网络中边的权重值进行累加所得到的权重值之和,节点边上的数字对应的就是节点时序k核值,通过统计可知,节点A的重要性指标为6,节点B的重要性指标为8,节点C的重要性指标为9,节点D的重要性指标为11,则可以确定在上述时序网络中节点D为需要挖掘出的重要性节点。
本发明实施例中由于采取时序网络模型,能够更好的拟合数据所发生的时间信息。同时依据了时序网络模型,把静态网络中的基础理论合理的应用扩展到了时序网络当中。通过对静态k核分解方法的扩展,利用切片网络中的连边信息,利用间接的方式来计算时序网络中的节点重要性,即不是直接计算节点的分数值,而是通过先计算连边的权重累计值,然后在利用连边来衡量节点的重要性,所以是间接的方式。从而使得对节点的评估具有更好的解释性和理解性。即网络中的重要节点主要体现的就是其所扮演的角色,时序网络中的连边可以表示真实的实际网络中的真实交互行为,即每个个体的行为,在本发明实施例中通过连边的权重累计值来衡量单个节点的重要性,
通过前述实施例对本发明的举例说明可知,首先根据N个节点之间交互的时间关系构建时序网络,然后按照预置的时间窗口大小对时序网络进行切片处理,得到切片网络序列,切片网络序列包括:对应于m个时间窗口的m个切片网络,接下来对切片网络序列中每个切片网络中的所有连边分别计算出一个权重值,对每个切片网络中的所有连边对应的权重值按照不同的连边分别进行权重值累加,得到时序网络中节点对之间的连边的权重累计值,将每个节点对之间的连边的权重累计值更新到时序网络中,得到含权网络,最后通过包括有权重累计值的连边计算含权网络中每个节点的重要性指标,每个节点的重要性指标包括:对应节点的所有连边对应的权重累计值之和。本发明实施例中由于采取时序网络模型,能够更好的拟合数据所发生的时间信息。利用各个切片网络中涵盖有时间信息的连边计算出时序网络中的节点重要性,从而使得对节点的重要性评估能够体现节点基于时序的交互关系。
请参阅图6-a所示,本发明实施例提供的一种时序网络中的重要节点的挖掘装置600,包括:
时序网络构建模块601,用于根据N个节点之间交互的时间关系构建时序网络,时序网络包括:N个节点以及在不同时刻分别存在交互关系的节点之间的连边,N为大于或等于2的正整数;
切片模块602,用于按照预置的时间窗口大小对时序网络进行切片处理,得到切片网络序列,切片网络序列包括:对应于m个时间窗口的m个切片网络,其中,每个切片网络包括:N个节点以及在各自的时间窗口内存在交互关系的节点之间的连边,m为大于或等于2的正整数;
权重计算模块603,用于对切片网络序列中每个切片网络中的所有连边分别计算出一个权重值;
权重累计模块604,用于对每个切片网络中的所有连边对应的权重值按照不同的连边分别进行权重值累加,得到时序网络中节点对之间的连边的权重累计值,节点对为时序网络中存在交互关系的一组节点;
网络更新模块605,用于将每个节点对之间的连边的权重累计值更新到时序网络中,得到含权网络,含权网络包括:N个节点以及包括有权重累计值的连边;
重要性计算模块606,用于通过包括有权重累计值的连边计算含权网络中每个节点的重要性指标,每个节点的重要性指标包括:对应节点的所有连边对应的权重累计值之和。
在本发明的一些实施例中,请参阅图6-b所示,时序网络构建模块601,包括:
数据集获取模块6011,用于根据N个节点之间交互的时间关系获取到时序数据集,时序数据集包括:在不同时刻分别存在交互关系的节点数据;
网络更新模块6012,用于根据时序数据集构建静态网络,并确定静态网络中在各个时刻存在交互关系的节点对之间的连边,从而得到时序网络。
在本发明的一些实施例中,权重计算模块603,具体用于对切片网络序列中每个切片网络分别进行k核分解,并且在每个切片网络进行k核分解的过程中,当需要移除掉第一连边时,将当前的k值作为权重值赋值给第一连边,第一连边为切片网络中的任意一个连边。
通过前述实施例对本发明的举例说明可知,首先根据N个节点之间交互的时间关系构建时序网络,然后按照预置的时间窗口大小对时序网络进行切片处理,得到切片网络序列,切片网络序列包括:对应于m个时间窗口的m个切片网络,接下来对切片网络序列中每个切片网络中的所有连边分别计算出一个权重值,对每个切片网络中的所有连边对应的权重值按照不同的连边分别进行权重值累加,得到时序网络中节点对之间的连边的权重累计值,将每个节点对之间的连边的权重累计值更新到时序网络中,得到含权网络,最后通过包括有权重累计值的连边计算含权网络中每个节点的重要性指标,每个节点的重要性指标包括:对应节点的所有连边对应的权重累计值之和。本发明实施例中由于采取时序网络模型,能够更好的拟合数据所发生的时间信息。利用各个切片网络中涵盖有时间信息的连边计算出时序网络中的节点重要性,从而使得对节点的重要性评估能够体现节点基于时序的交互关系。
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
综上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照上述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对上述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种时序网络中的重要节点的挖掘方法,其特征在于,包括:
根据N个节点之间交互的时间关系构建时序网络,所述时序网络包括:所述N个节点以及在不同时刻分别存在交互关系的节点之间的连边,所述N为大于或等于2的正整数,所述时序网络包括如下至少一种:疾病传播网络、社交网络、媒体资讯网络;所述节点为时序网络的网络信息数据库中存储的用户,所述边为用户之间的交互行为,所述时间为交互行为发生的时刻;
按照预置的时间窗口大小对所述时序网络进行切片处理,得到切片网络序列,所述切片网络序列包括:对应于m个时间窗口的m个切片网络,其中,每个切片网络包括:所述N个节点以及在各自的时间窗口内存在交互关系的节点之间的连边,所述m为大于或等于2的正整数;
对所述切片网络序列中每个切片网络中的所有连边分别计算出一个权重值,具体包括:对切片网络序列中每个切片网络分别进行k核分解,并且在所述每个切片网络进行k核分解的过程中,当需要移除掉第一连边时,将当前的k值作为权重值赋值给所述第一连边,所述第一连边为所述切片网络中的任意一个连边;
对所述每个切片网络中的所有连边对应的权重值按照不同的连边分别进行权重值累加,得到所述时序网络中节点对之间的连边的权重累计值,所述节点对为所述时序网络中存在交互关系的一组节点;
将每个节点对之间的连边的权重累计值更新到所述时序网络中,得到含权网络,所述含权网络包括:所述N个节点以及包括有所述权重累计值的连边;
通过所述包括有所述权重累计值的连边计算所述含权网络中每个节点的重要性指标,所述每个节点的重要性指标包括:对应节点的所有连边对应的权重累计值之和。
2.根据权利要求1所述的一种时序网络中的重要节点的挖掘方法,其特征在于,所述根据N个节点之间交互的时间关系构建时序网络,包括:
根据N个节点之间交互的时间关系获取到时序数据集,所述时序数据集包括:在不同时刻分别存在交互关系的节点数据;
根据所述时序数据集构建静态网络,并确定所述静态网络中在各个时刻存在交互关系的节点对之间的连边,从而得到时序网络。
3.根据权利要求2所述的一种时序网络中的重要节点的挖掘方法,其特征在于,所述时序数据集,包括:所述时序数据集中的时间间隔、提取数据的开始时间、提取数据的结束时间。
4.根据权利要求1所述的一种时序网络中的重要节点的挖掘方法,其特征在于,所述按照预置的时间窗口大小对所述时序网络进行切片处理,包括:
按照第t个时间窗口从所述时序网络中提取在t个时间窗口内存在交互关系的连边,从而得到对应于所述第t个时间窗口的第t个切片网络,所述t表示小于或等于所述m的任意一个正整数。
7.一种时序网络中的重要节点的挖掘装置,其特征在于,包括:
时序网络构建模块,用于根据N个节点之间交互的时间关系构建时序网络,所述时序网络包括:所述N个节点以及在不同时刻分别存在交互关系的节点之间的连边,所述N为大于或等于2的正整数,所述时序网络包括如下至少一种:疾病传播网络、社交网络、媒体资讯网络;所述节点为时序网络的网络信息数据库中存储的用户,所述边为用户之间的交互行为,所述时间为交互行为发生的时刻;
切片模块,用于按照预置的时间窗口大小对所述时序网络进行切片处理,得到切片网络序列,所述切片网络序列包括:对应于m个时间窗口的m个切片网络,其中,每个切片网络包括:所述N个节点以及在各自的时间窗口内存在交互关系的节点之间的连边,所述m为大于或等于2的正整数;
权重计算模块,用于对所述切片网络序列中每个切片网络中的所有连边分别计算出一个权重值,具体包括:对切片网络序列中每个切片网络分别进行k核分解,并且在所述每个切片网络进行k核分解的过程中,当需要移除掉第一连边时,将当前的k值作为权重值赋值给所述第一连边,所述第一连边为所述切片网络中的任意一个连边;
权重累计模块,用于对所述每个切片网络中的所有连边对应的权重值按照不同的连边分别进行权重值累加,得到所述时序网络中节点对之间的连边的权重累计值,所述节点对为所述时序网络中存在交互关系的一组节点;
网络更新模块,用于将每个节点对之间的连边的权重累计值更新到所述时序网络中,得到含权网络,所述含权网络包括:所述N个节点以及包括有所述权重累计值的连边;
重要性计算模块,用于通过所述包括有所述权重累计值的连边计算所述含权网络中每个节点的重要性指标,所述每个节点的重要性指标包括:对应节点的所有连边对应的权重累计值之和。
8.根据权利要求7所述的一种时序网络中的重要节点的挖掘装置,其特征在于,所述时序网络构建模块,包括:
数据集获取模块,用于根据N个节点之间交互的时间关系获取到时序数据集,所述时序数据集包括:在不同时刻分别存在交互关系的节点数据;
网络更新模块,用于根据所述时序数据集构建静态网络,并确定所述静态网络中在各个时刻存在交互关系的节点对之间的连边,从而得到时序网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710400025.4A CN107292751B (zh) | 2017-05-31 | 2017-05-31 | 一种时序网络中节点重要性的挖掘方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710400025.4A CN107292751B (zh) | 2017-05-31 | 2017-05-31 | 一种时序网络中节点重要性的挖掘方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107292751A CN107292751A (zh) | 2017-10-24 |
CN107292751B true CN107292751B (zh) | 2021-04-02 |
Family
ID=60094879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710400025.4A Active CN107292751B (zh) | 2017-05-31 | 2017-05-31 | 一种时序网络中节点重要性的挖掘方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107292751B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109714207B (zh) * | 2018-12-28 | 2022-01-28 | 中国电子科技集团公司信息科学研究院 | 一种复杂网络关键节点识别方法及系统 |
CN111797880A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 数据处理方法、装置、存储介质及电子设备 |
CN110011862B (zh) * | 2019-04-23 | 2022-03-11 | 深圳大学 | 基于时间平衡的网络节点识别方法、装置及计算机设备 |
CN110149233B (zh) * | 2019-05-23 | 2021-12-24 | 南昌航空大学 | 采用概要图和节点对影响值评估关键节点的方法与系统 |
CN111127233A (zh) * | 2019-12-26 | 2020-05-08 | 华中科技大学 | 一种社交网络无向有权图中用户核值计算方法 |
CN115294758B (zh) * | 2022-06-20 | 2024-05-31 | 杭州未名信科科技有限公司 | 一种时序网络节点挖掘方法和系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105471637A (zh) * | 2015-11-20 | 2016-04-06 | 中国矿业大学 | 一种复杂网络节点重要性评估方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10467707B2 (en) * | 2013-11-04 | 2019-11-05 | Ebay Inc. | Dynamic creation of networks |
-
2017
- 2017-05-31 CN CN201710400025.4A patent/CN107292751B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105471637A (zh) * | 2015-11-20 | 2016-04-06 | 中国矿业大学 | 一种复杂网络节点重要性评估方法及系统 |
Non-Patent Citations (7)
Title |
---|
Communicability in temporal networks;Estrada Ernesto,etal;《Physical review.E》;20131028;第88卷(第4期);第042811页 * |
Higher-order aggregate networks in the analysis of temporal networks: path structures and centralities;Ingo Scholtes,etal;《European Physical Journal B》;20160301;第89卷(第3期);第61页 * |
Identification of active valuable nodes in temporal online social network with attributes;Dehong Qiu,etal;《International Journal of Information Technology Decision Making》;20140715;第13卷(第4期);第839-864页 * |
复杂网络中最小K-核节点的传播能力分析;任卓明 等;《物理学报》;20130523;第62卷(第10期);第474-479页 * |
探测和评估复杂网络影响力节点的路径多样性核度中心方法;张子柯 等;《高技术通讯》;20160215;第26卷(第2期);第129-138页 * |
时序网络结构特性实证分析及研究;邓冬梅;《中国优秀硕士学位论文全文数据库 基础科学辑》;20160315(第3期);第A002-254页 * |
时效网络结构及动力学研究进展综述;周银座 等;《电子科技大学学报》;20170105;第46卷(第1期);第109-125页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107292751A (zh) | 2017-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107292751B (zh) | 一种时序网络中节点重要性的挖掘方法和装置 | |
CN109905270B (zh) | 定位根因告警的方法、装置和计算机可读存储介质 | |
CN109784636A (zh) | 欺诈用户识别方法、装置、计算机设备及存储介质 | |
Wang et al. | Dynamic poisson autoregression for influenza-like-illness case count prediction | |
JP6714152B2 (ja) | 分析装置、分析方法及び分析プログラム | |
CN113052333A (zh) | 基于联邦学习进行数据分析的方法及系统 | |
CN112052404A (zh) | 多源异构关系网络的群体发现方法、系统、设备及介质 | |
De la Sen et al. | On an Sir Epidemic Model for the COVID‐19 Pandemic and the Logistic Equation | |
CN109684320B (zh) | 监测数据在线清洗的方法和设备 | |
CN110290467A (zh) | 停留点、商业区服务范围、影响因素的获取方法及装置 | |
CN108021636B (zh) | 一种不依赖时间信息的传播网络结构重构方法 | |
CN105205568B (zh) | 告警事务提取方法及系统 | |
CN113420506A (zh) | 掘进速度的预测模型建立方法、预测方法及装置 | |
EP3598335A1 (en) | Information processing device, information processing method, and recording medium | |
CN106681791A (zh) | 一种基于对称邻居关系的增量式虚拟机异常检测方法 | |
US20240177077A1 (en) | Attribution analysis method, electronic device, and storage medium | |
CN112165412B (zh) | 一种基于时间序列模型的流量预测方法 | |
US20180285758A1 (en) | Methods for creating and analyzing dynamic trail networks | |
Sengupta et al. | Benchmark generator for dynamic overlapping communities in networks | |
Dakiche et al. | Sensitive analysis of timeframe type and size impact on community evolution prediction | |
Idrais et al. | Online Social Networks: Study and validation of the regular behaviors of a targeted community on a complex network using a time series approach | |
EP3580694A1 (en) | Method for computer-implemented determination of the performance of a classification model | |
CN111737233A (zh) | 数据监控方法及装置 | |
CN114912354B (zh) | 一种预测蚊媒传染病风险的方法、装置及介质 | |
CN104221417A (zh) | 干扰源识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |