CN108833138B - 一种错误累积敏感的增量式动态社区发现方法及系统 - Google Patents
一种错误累积敏感的增量式动态社区发现方法及系统 Download PDFInfo
- Publication number
- CN108833138B CN108833138B CN201810481373.3A CN201810481373A CN108833138B CN 108833138 B CN108833138 B CN 108833138B CN 201810481373 A CN201810481373 A CN 201810481373A CN 108833138 B CN108833138 B CN 108833138B
- Authority
- CN
- China
- Prior art keywords
- time slice
- community
- error accumulation
- current time
- dynamic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000009825 accumulation Methods 0.000 title claims abstract description 213
- 238000000034 method Methods 0.000 title claims abstract description 100
- 230000003068 static effect Effects 0.000 claims abstract description 45
- 238000004364 calculation method Methods 0.000 claims description 34
- 238000000638 solvent extraction Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000005192 partition Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/16—Threshold monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及一种错误累积敏感的增量式动态社区发现方法及系统,其中,方法包括:计算给定动态社交网络的错误累积最佳阈值;在第一个时间片,采用静态方法获得动态社交网络的初始社区结构;从第二个时间片开始直到结束,判断当前时间片的错误累积预估值是否超过错误累积最佳阈值,是,则重新进行社区划分,获得当前时间片社区结构;否,则动态更新增量节点的社区归属,获得当前时间片的社区结构。本发明充分考虑了传统增量式动态社区发现中存在的错误累积现象,对每个时间片的错误累积进行了预估,并根据错误累积预估结果选择合适策略进行社区发现,在确保社区发现效率的基础上,提高了社区发现的准确性。
Description
技术领域
本发明涉及网络分析技术领域,尤其是一种错误累积敏感的增量式动态社区发现方法及系统。
背景技术
许多社交网络中都隐藏着社区结构,社区内的用户联系紧密,而社区之间的用户联系较为稀疏。然而,随着时间的推移,社交网络会发生变化,仅仅对社交网络进行静态社区划分已经不足以刻画其结构特性,因此出现了动态社区划分方法。
目前,常见的动态社区发现方法分为独立静态式划分、基于演化聚类的划分和增量式划分。增量式划分是一种高效的动态社区划分方法,该类方法认为,在社交网络变化过程中,大部分拓扑结构是稳定的,仅有小部分结构会出现变化,以前一个时间片的社区结构为基础,动态更新增量节点的社区归属,即可获得当前时间片的社区结构。增量式划分方法在增量更新过程中难免会出现社区划分错误,并且前一个时间片的错误可能会导致后一个时间片更多的错误出现,造成错误累积。传统增量式动态社区发现方法忽略错误累积现象,影响了动态社区发现的性能。
发明内容
鉴于上述的分析,本发明旨在提供一种错误累积敏感的增量式动态社区发现方法及系统,用于解决现有增量式动态社区发现方法由于忽略错误累积而导致社区划分性能逐渐下降的问题。
本发明的目的主要是通过以下技术方案实现的:
一种错误累积敏感的增量式动态社区发现方法,包括以下步骤:
根据给定的动态社交网络,预估第一个时间片后所有时间片的错误累积,计算所述动态社交网络的错误累积最佳阈值;
在第一个时间片,采用静态方法对初始时间片进行社区划分,获得动态社交网络的初始社区结构;
从第二个时间片开始直到结束,判断当前时间片的错误累积预估值是否超过错误累积最佳阈值,否,则重新进行社区划分,获得当前时间片社区结构;是,则动态更新增量节点的社区归属,获得当前时间片的社区结构。
进一步地,所述错误累积最佳阈值的计算方法包括:
预估第一个时间片后每个时间片的错误累积;
针对预设的动态社交网络的错误累积阈值序列,基于每个时间片的错误累积,分别计算社区划分准确性和时间消耗的杠杆值LOCT;选取LOCT最大值对应的错误累积阈值,为动态社交网络的错误累积最佳阈值。
进一步地,所述错误累积的预估公式为:其中,IEAt表示预估的当前时间片t的错误累积,t0为最近一次采用静态方法划分社区的时间片,ΔNi表示从t0开始的第i个时间片的增量节点个数,Ni表示所述第i个时间片的节点总数。
进一步地,所述杠杆值LOCT的计算公式为:
所述相关系数CCt的计算公式为:
进一步地,从第二个时间片开始直到结束,获得当前时间片的社区结构方法具体包括:
1)预估每个时间片的错误累积IEAt;
2)判断IEAt是否超过所述错误累积最佳阈值,否,则进入3);是,则进入4);
3)以前一个时间片的社区结构为基础,动态更新增量节点的社区归属,获得当前时间片的社区结构;
4)重新采用和第一个时间片相同的静态方法对当前时间片进行社区划分,获得当前时间片的社区结构。
一种错误累积敏感的增量式动态社区发现系统,包括:错误累积预估模块、错误累积最佳阈值计算模块、初始时间片社区划分模块和后续时间片社区划分模块;
所述错误累积预估模块,用于预估动态社交网络给定时间片的错误累积;
所述错误累积最佳阈值计算模块,用于根据所述错误累积预估模块输出的错误累积结果计算所述动态社交网络的错误累积最佳阈值;
所述初始时间片社区划分模块,用于采用静态方法划分动态社交网络的第一个时间片,获得动态社交网络的初始社区结构;
所述后续时间片社区划分模块,用于从第二个时间片开始直到结束,判断所述错误累积预估模块输出的当前时间片的错误累积是否超过所述错误累积最佳阈值计算模块输出的错误累积最佳阈值,是,则重新进行社区划分,获得当前时间片社区结构;否,则动态更新增量节点的社区归属,获得当前时间片的社区结构。
进一步地,所述错误累积预估模块采用的错误累积的预估函数为:其中,IEAt表示预估的当前时间片t的错误累积,t0为最近一次采用静态方法划分社区结构的时间片,ΔNi表示从t0开始的第i个时间片的增量节点个数,Ni表示所述第i个时间片的节点总数。
进一步地,所述错误累积最佳阈值计算模块针对预设的动态社交网络的错误累积阈值序列,分别计算社区划分准确性和时间消耗的杠杆值LOCT;选取LOCT最大值对应的错误累积阈值,为动态社交网络的错误累积最佳阈值。
进一步地,所述错误累积最佳阈值计算模块中,杠杆值LOCT的计算公式为:
所述相关系数CCt的计算公式为:
进一步地,后续时间片社区划分模块包括当前时间片社区划分策略选择单元和当前时间片社区划分单元;
所述当前时间片社区划分策略选择单元,用于选取社区划分的策略,包括:如果所述错误累积预估模块预估的当前时间片的错误累积没有超过所述错误累积最佳阈值计算模块计算的错误累积最佳阈值,则当前时间片的社区划分采用增量更新策略,即以前一个时间片的社区结构为基础,动态更新增量节点的社区归属,获得当前时间片的社区结构;否则,当前时间片的社区划分采用重新划分策略,即重新采用和第一个时间片相同的静态方法对当前时间片进行社区划分;
所述当前时间片社区划分单元,用于按照所述当前时间片社区划分策略选择单元选取的策略完成当前时间片的社区划分。
本发明有益效果如下:
本发明充分考虑了传统增量式动态社区发现中存在的错误累积现象,对每个时间片的错误累积进行了预估,并根据错误累积预估结果选择合适策略进行社区发现;在不改变原有的社区划分方法中的初始社区划分方法和增量更新策略的基础上,通过对每个时间片的错误累积进行预估,如果预估的错误累积大于设定的阈值,则当前时间片不是采用增量更新策略,而是采用和初始时间片一样的方法重新划分获得社区结构,在确保社区发现效率的基础上,提高了社区发现的准确性。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为本发明实施例增量式动态社区发现方法的流程示意图;
图2为本发明实施例增量式动态社区发现系统的结果示意图;
图3为SYN-FIX网络的LOCT值随错误累积阈值的变化曲线图;
图4为SYN-FIX网络的QCA算法与EAS-QCA算法的准确性对比图;
图5为SYN-FIX网络的BatchInc算法与EAS-BatchInc算法的准确性对比图;
图6为SYN-FIX网络的LBTR算法与EAS-LBTR算法的准确性对比图;
图7为arXiv网络的LOCT值随错误累积阈值的变化曲线图;
图8为arXiv网络的QCA算法与EAS-QCA算法的准确性对比图;
图9为arXiv网络的BatchInc算法与EAS-BatchInc算法的准确性对比图;
图10为arXiv网络的LBTR算法与EAS-LBTR算法的准确性对比图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理。
实施例一
本实施例提供了一种错误累积敏感的增量式动态社区发现方法,如图1所示,包括:
S101、根据给定的动态社交网络,预估第一个时间片后所有时间片的错误累积,并计算所述动态社交网络的错误累积的最佳阈值。
1)预估第一个时间片后每个时间片的错误累积;
错误累积的预估公式为:
其中,IEAt表示预估的当前时间片t的错误累积,t0为最近一次采用静态方法划分社区结构的时间片,ΔNi表示从t0开始的第i个时间片的增量节点个数,Ni表示所述第i个时间片的节点总数。
2)获取错误累积的最佳阈值;
首先,设定动态社交网络的错误累积阈值threshod;
优选的,错误累积阈值可设置为初始值为0,并以一定的步长增大的阈值序列,其中,步长可设置为0.01,阈值序列的终止条件为:在阈值超过该终止条件时,无需对任一时间片进行重新划分,而是全部采用增量更新的方式获得社区结构;
其次,针对不同的错误累积阈值计算社区划分准确性和时间消耗的杠杆值LOCT;
最后,取LOCT最大值时对应的错误累积阈值,为动态社交网络错误累积的最佳阈值threshod0。
具体的,
LOCT的计算公式为:其中,t为当前时间片,T为总时间片数,CCt为t时间片和最近一次采用静态方法重新划分社区结构的时间片之间的相关系数,freq为采用静态方法重新划分社区结构的次数,ratio为比例系数。
相关系数CCt根据当前时间片t的错误累积是否超过错误累积阈值确定,
具体的计算公式为:其中,t为当前时间片,t0为最近一次采用静态方法划分社区结构的时间片;Et代表t时间片的边集合,表示t0时间片的边集合;IEAt表示预估的当前时间片t的错误累积,threshod为错误累积阈值。
S102、在第一个时间片,采用静态方法对初始时间片进行社区划分,获得动态社交网络的初始社区结构;
S103、从第二个时间片开始直到结束,判断当前时间片t的错误累积是否超过错误累积最佳阈值threshod0,是,则重新进行社区划分,获得当前时间片社区结构;否,则动态更新增量节点的社区归属,获得当前时间片的社区结构。
具体:
1)预估每个时间片的错误累积;
错误累积的预估公式为:
其中,IEAt表示预估的当前时间片t的错误累积,t0为最近一次采用静态方法划分社区结构的时间片,ΔNi表示从t0开始的第i个时间片的增量节点个数,Ni表示所述第i个时间片的节点总数。
2)判断IEAt是否超过最佳阈值threshod0,否,则进入3);是,则进入4);
3)以前一个时间片的社区结构为基础,动态更新增量节点的社区归属,获得当前时间片的社区结构;
4)重新采用和第一个时间片相同的静态方法对当前时间片进行社区划分,获得当前时间片的社区结构。
综上所述,本实施例公开的错误累积敏感的增量式动态社区发现方法,充分考虑了传统增量式动态社区发现中存在的错误累积现象,对每个时间片的错误累积进行了预估,并根据错误累积预估结果选择合适策略进行社区发现;在不改变原有的社区划分方法中的初始社区划分方法和增量更新策略的基础上,通过对每个时间片的错误累积进行预估,如果预估的错误累积大于设定的阈值,则当前时间片不是采用增量更新策略,而是采用和初始时间片一样的方法重新划分获得社区结构,在确保社区发现效率的基础上,提高了社区发现的准确性。
实施例二
本实施例提供了一种错误累积敏感的增量式动态社区发现系统,如图2所示,包括:错误累积预估模块210,错误累积最佳阈值计算模块220,初始时间片社区划分模块230,后续时间片社区划分模块240。
系统中,错误累积预估模块210预估动态社交网络给定时间片的错误累积,
错误累积的预估函数为:其中,IEAt表示预估的当前时间片t的错误累积,t0为最近一次采用静态方法划分社区结构的时间片,ΔNi表示从t0开始的第i个时间片的增量节点个数,Ni表示所述第i个时间片的节点总数。
系统中,错误累积最佳阈值计算模块220与错误累积预估模块210相连,计算所述动态社交网络错误累积的最佳阈值。
具体的,错误累积最佳阈值的获取过程为:
首先,设定动态社交网络的错误累积阈值threshod;
优选的,错误累积阈值可设置为初始值为0,并以一定的步长增大的阈值序列,其中,步长可设置为0.01,阈值序列的终止条件为:在阈值超过该终止条件时,无需对任一时间片进行重新划分,而是全部采用增量更新的方式获得社区结构;
其次,针对不同的错误累积阈值计算社区划分准确性和时间消耗的杠杆值LOCT;
最后,取LOCT最大值时对应的错误累积阈值,为动态社交网络错误累积的最佳阈值threshod0。
具体的,
LOCT的计算公式为:其中,t为当前时间片,T为总时间片数,CCt为t时间片和最近一次采用静态方法重新划分社区结构的时间片之间的相关系数,freq为采用静态方法重新划分社区结构的次数,ratio为比例系数。
相关系数CCt根据当前时间片t的错误累积是否超过错误累积阈值确定;
具体的计算公式为:其中,t为当前时间片,t0为最近一次采用静态方法划分社区结构的时间片;Et代表t时间片的边集合,表示t0时间片的边集合;IEAt表示预估的当前时间片t的错误累积,threshod为错误累积阈值。
系统中,初始时间片社区划分模块230采用静态方法划分动态社交网络的第一个时间片,获得动态社交网络的初始社区结构。
系统中,后续时间片社区划分模块240,从第二个时间片开始直到结束,判断所述错误累积预估模块输出的当前时间片的错误累积是否超过所述错误累积最佳阈值计算模块220输出的错误累积最佳阈值threshod0,是,则重新进行社区划分,获得当前时间片社区结构;否,则动态更新增量节点的社区归属,获得当前时间片的社区结构。
后续时间片社区划分模块240包括:当前时间片社区划分策略选择单元241和当前时间片社区划分单元242。
其中,当前时间片社区划分策略选择单元241与错误累积预估模块210和错误累积最佳阈值计算模块220相连,如果预估的当前时间片的错误累积没有超过最佳阈值threshod0,则当前时间片的社区划分采用增量更新策略,即以前一个时间片的社区结构为基础,动态更新增量节点的社区归属,获得当前时间片的社区结构。否则,当前时间片的社区划分采用重新划分策略,即重新采用和第一个时间片相同的静态方法对当前时间片进行社区划分。
当前时间片社区划分单元242与所述当前时间片社区划分策略选择单元241相连,按照当前时间片社区划分策略选择单元选取的策略完成当前时间片的社区划分。
综上所述,本实施例公开的错误累积敏感的增量式动态社区发现系统,充分考虑了传统增量式动态社区发现中存在的错误累积现象,对每个时间片的错误累积进行了预估,并根据错误累积预估结果选择合适策略进行社区发现;在不改变原有的社区划分方法中的初始社区划分方法和增量更新策略的基础上,通过对每个时间片的错误累积进行预估,如果预估的错误累积大于设定的阈值,则当前时间片不是采用增量更新策略,而是采用和初始时间片一样的方法重新划分获得社区结构,在确保社区发现效率的基础上,提高了社区发现的准确性。
实施例三
本实施例以SYN-FIX网络为例进行增量式动态社区结构发现;SYN-FIX网络是由Newman提出的算法生成的人工动态网络,该网络包含128个节点,4个社区,每个社区包含32个节点,平均度为16。该网络包含十个时间片,每个时间片从每个社区中选出3个节点随机加入到其它3个社区中。本实例包括以下具体步骤:
S301、根据给定的动态社交网络,预估第一个时间片后所有时间片的错误累积,并计算所述动态社交网络的错误累积的最佳阈值。
1)根据本发明实施例的增量式动态社区发现方法,预估SYN-FIX网络第二个时间片及其后所有时间片的错误累积。
2)将错误累积阈值初始值设为0.01,步长设为0.01,不断增大错误累积阈值,计算相应的LOCT值,LOCT值随错误累积阈值的增大而变化的曲线如附图3所示。由图3可知,当错误累积阈值取0.99时,LOCT能取得最大值。因此,0.99即为错误累积的最佳阈值。
S302、使用静态方法Louvain对第一个时间片进行社区划分,获得动态社交网络的初始社区结构。
社区划分结果如表1所示。
表1:SYN-FIX网络初始时间片社区划分结果
S303、从第二个时间片开始直到结束,根据当前时间片错误累积的预估结果,若错误累积没有超过错误累积最佳阈值0.99,则当前时间片的社区划分采用增量更新策略,即以前一个时间片的社区结构为基础,动态更新增量节点的社区归属,获得当前时间片的社区结构;若错误累积超过错误累积最佳阈值0.99,当前时间片的社区划分采用重新划分策略,即重新采用静态方法Louvain对当前时间片进行社区划分,获得动态社交网络的社区结构。
表2列出了第二个时间到第十个时间片的错误累积预估结果。
表2:时间片错误累积预估结果
由表2可知,第4个时间片的错误累积预估值超出了最佳阈值0.99,因此,第4个时间片使用静态方法重新进行社区划分。
然后,从第5个时间片开始,重新预估每个时间片的错误累积,若错误累积没有超过错误累积最佳阈值0.99,则当前时间片的社区划分采用增量更新策略,即以前一个时间片的社区结构为基础,动态更新增量节点的社区归属,获得当前时间片的社区结构;若错误累积超过错误累积最佳阈值0.99,当前时间片的社区划分采用重新划分策略,即重新采用和第一个时间片相同的静态方法对当前时间片进行社区划分。表3为重新预估的第5个时间片至第10个时间片的错误累积。
表3:重新预估的第5个时间片至第10个时间片的错误累积
由表3可知,第7个时间片的错误累积预估值超出了最佳阈值0.99,因此,第7个时间片使用静态方法重新进行社区划分。
然后,从第8个时间片开始,重新预估每个时间片的错误累积,若错误累积没有超过错误累积最佳阈值0.99,则当前时间片的社区划分采用增量更新策略,即以前一个时间片的社区结构为基础,动态更新增量节点的社区归属,获得当前时间片的社区结构;若错误累积超过错误累积最佳阈值0.99,当前时间片的社区划分采用重新划分策略,即重新采用和第一个时间片相同的静态方法对当前时间片进行社区划分。表4为重新预估的第8个时间片至第10个时间片的错误累积。
表4:重新预估的第8个时间片至第10个时间片的错误累积
由表4可知,从第8时间片开始所有时间片的错误累积预估值都没有超过最佳阈值0.99,则第8个时间片及后续时间片都采用增量更新策略进行社区划分。
为了进一步验证本发明的有效性,将本发明实施例所述方法与三种典型的增量式动态社区发现方法QCA、BatchInc、LBTR相结合,分别采用上述三种社区发现方法的初始社区的划分方法和增量更新的策略,生成三种新的增量式动态社区发现方法EAS-QCA、EAS-BatchInc、EAS-LBTR,对比结合前后的SYN-FIX网络每个时间片NMI性能,结果如附图4、5、6所示。可以看出,本发明能够有效提高社区划分的准确性。
实施例四
本实施例以arXiv动态网络为例进行增量式动态社区结构发现,arXiv动态网络是由KDD出版的文章的电子版引用网络,包括从1991年到2003年出版的所有27,769篇文章,该网络包括13个时间片,文章被看作节点,文章的引用被看作边。
根据本发明实施例的增量式动态社区发现方法,预估arXiv网络第二个时间片及其后所有时间片的错误累积。
将错误累积阈值初始值设为0.01,步长设为0.01,不断增大错误累积阈值,计算相应的LOCT值,LOCT值随错误累积阈值的增大而变化的曲线如附图7所示。由图7可知,当错误累积阈值取0.22-0.24时,LOCT能取得最大值。因此,0.22-0.24即为错误累积的最佳阈值。
将本发明实施例所述方法与三种典型的增量式动态社区发现方法QCA、BatchInc、LBTR相结合,分别采用上述三种社区发现方法的初始社区的划分方法和增量更新的策略,生成三种新的增量式动态社区发现方法EAS-QCA、EAS-BatchInc、EAS-LBTR,对比结合前后的arXiv网络个时间片NMI性能,结果如附图8、9、10所示。可以看出,本发明能够有效提高社区划分的准确性。
综上所述,本实施例公开的错误累积敏感的增量式动态社区发现系统,充分考虑了传统增量式动态社区发现中存在的错误累积现象,对每个时间片的错误累积进行了预估,并根据错误累积预估结果选择合适策略进行社区发现,在确保社区发现效率的基础上,提高了社区发现的准确性。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种错误累积敏感的增量式动态社区发现方法,其特征在于,包括以下步骤:
根据给定的动态社交网络,预估第一个时间片后所有时间片的错误累积,计算所述动态社交网络的错误累积最佳阈值;
在第一个时间片,采用静态方法对初始时间片进行社区划分,获得动态社交网络的初始社区结构;
从第二个时间片开始直到结束,判断当前时间片的错误累积预估值是否超过错误累积最佳阈值,是,则重新进行社区划分,获得当前时间片社区结构;否,则动态更新增量节点的社区归属,获得当前时间片的社区结构;
其中,所述错误累积最佳阈值的计算方法包括:
预估第一个时间片后每个时间片的错误累积;
针对预设的动态社交网络的错误累积阈值序列,基于每个时间片的错误累积,分别计算社区划分准确性和时间消耗的杠杆值LOCT;选取LOCT最大值对应的错误累积阈值,为动态社交网络的错误累积最佳阈值。
3.根据权利要求1所述的动态社区发现方法,其特征在于,
所述杠杆值LOCT的计算公式为:
所述相关系数CCt的计算公式为:
4.根据权利要求1所述的动态社区发现方法,其特征在于,从第二个时间片开始直到结束,获得当前时间片的社区结构方法具体包括:
1)预估每个时间片的错误累积IEAt;
2)判断IEAt是否超过所述错误累积最佳阈值,否,则进入3);是,则进入4);
3)以前一个时间片的社区结构为基础,动态更新增量节点的社区归属,获得当前时间片的社区结构;
4)重新采用和第一个时间片相同的静态方法对当前时间片进行社区划分,获得当前时间片的社区结构。
5.一种应用权利要求1-4任意一项所述方法的错误累积敏感的增量式动态社区发现系统,其特征在于,包括:错误累积预估模块、错误累积最佳阈值计算模块、初始时间片社区划分模块和后续时间片社区划分模块;
所述错误累积预估模块,用于预估动态社交网络给定时间片的错误累积;
所述错误累积最佳阈值计算模块,用于根据所述错误累积预估模块输出的错误累积结果计算所述动态社交网络的错误累积最佳阈值;进一步地,所述错误累积最佳阈值计算模块,根据所述错误累积预估模块输出的错误累积结果,针对预设的动态社交网络的错误累积阈值序列,分别计算社区划分准确性和时间消耗的杠杆值LOCT;选取LOCT最大值对应的错误累积阈值,为动态社交网络的错误累积最佳阈值;
所述初始时间片社区划分模块,用于采用静态方法划分动态社交网络的第一个时间片,获得动态社交网络的初始社区结构;
所述后续时间片社区划分模块,用于从第二个时间片开始直到结束,判断所述错误累积预估模块输出的当前时间片的错误累积是否超过所述错误累积最佳阈值计算模块输出的错误累积最佳阈值,是,则重新进行社区划分,获得当前时间片社区结构;否,则动态更新增量节点的社区归属,获得当前时间片的社区结构。
7.根据权利要求5所述的动态社区发现系统,其特征在于,
所述错误累积最佳阈值计算模块中,杠杆值LOCT的计算公式为:
所述相关系数CCt的计算公式为:
8.根据权利要求5所述的动态社区发现系统,其特征在于,后续时间片社区划分模块包括当前时间片社区划分策略选择单元和当前时间片社区划分单元;
所述当前时间片社区划分策略选择单元,用于选取社区划分的策略,包括:如果所述错误累积预估模块预估的当前时间片的错误累积没有超过所述错误累积最佳阈值计算模块计算的错误累积最佳阈值,则当前时间片的社区划分采用增量更新策略,即以前一个时间片的社区结构为基础,动态更新增量节点的社区归属,获得当前时间片的社区结构;否则,当前时间片的社区划分采用重新划分策略,即重新采用和第一个时间片相同的静态方法对当前时间片进行社区划分;
所述当前时间片社区划分单元,用于按照所述当前时间片社区划分策略选择单元选取的策略完成当前时间片的社区划分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810481373.3A CN108833138B (zh) | 2018-05-18 | 2018-05-18 | 一种错误累积敏感的增量式动态社区发现方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810481373.3A CN108833138B (zh) | 2018-05-18 | 2018-05-18 | 一种错误累积敏感的增量式动态社区发现方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108833138A CN108833138A (zh) | 2018-11-16 |
CN108833138B true CN108833138B (zh) | 2021-03-16 |
Family
ID=64147627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810481373.3A Active CN108833138B (zh) | 2018-05-18 | 2018-05-18 | 一种错误累积敏感的增量式动态社区发现方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108833138B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109087209B (zh) * | 2018-08-15 | 2022-03-29 | 创新先进技术有限公司 | 社区动态调整方法、装置及服务器 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521655A (zh) * | 2012-01-05 | 2012-06-27 | 西安电子科技大学 | 基于非支配邻域免疫算法的动态网络社区检测方法 |
US8996617B2 (en) * | 2013-03-07 | 2015-03-31 | Jeffrey F. Miller | System, process, or method for creation, propagation and use of dynamic fractional proxy in collaborative societal decision making within social networks |
CN107609982A (zh) * | 2017-09-14 | 2018-01-19 | 福州大学 | 考虑社区结构稳定度和增量相关节点进行社区发现的方法 |
-
2018
- 2018-05-18 CN CN201810481373.3A patent/CN108833138B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521655A (zh) * | 2012-01-05 | 2012-06-27 | 西安电子科技大学 | 基于非支配邻域免疫算法的动态网络社区检测方法 |
US8996617B2 (en) * | 2013-03-07 | 2015-03-31 | Jeffrey F. Miller | System, process, or method for creation, propagation and use of dynamic fractional proxy in collaborative societal decision making within social networks |
CN107609982A (zh) * | 2017-09-14 | 2018-01-19 | 福州大学 | 考虑社区结构稳定度和增量相关节点进行社区发现的方法 |
Non-Patent Citations (2)
Title |
---|
Incremental Dynamic Community Discovery Algorithm Based on Improved Modularity;Kun Guo等;《 2016 2nd IEEE International Conference on Computer and Communications (ICCC)》;20161017;全文 * |
在线社会网络的动态社区发现及演化;王莉等;《计算机学报》;20150228;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108833138A (zh) | 2018-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113242568B (zh) | 一种不确定网络环境中的任务卸载和资源分配方法 | |
He et al. | QoE-driven content-centric caching with deep reinforcement learning in edge-enabled IoT | |
CN108416465B (zh) | 一种移动云环境下的工作流优化方法 | |
CN112579194B (zh) | 基于时延和事务吞吐量的区块链共识任务卸载方法及装置 | |
CN114186633A (zh) | 模型的分布式训练方法、装置、设备以及存储介质 | |
Hassine et al. | ARMA based popularity prediction for caching in content delivery networks | |
WO2008054800A2 (en) | Dynamic network selection using kernels | |
CN108122168B (zh) | 社交活动网络中种子节点筛选方法和装置 | |
CN111355814B (zh) | 一种负载均衡方法、装置及存储介质 | |
CN111813506A (zh) | 一种基于粒子群算法资源感知计算迁移方法、装置及介质 | |
CN110121171B (zh) | 基于指数平滑法和灰色模型的信任预测方法 | |
CN112188627B (zh) | 一种基于状态预测的动态资源分配策略 | |
CN113965961B (zh) | 一种车联网环境下的边缘计算任务卸载方法与系统 | |
CN111459662A (zh) | 移动边缘计算中的迁移管理方法、装置和存储介质 | |
CN113315716A (zh) | 拥塞控制模型的训练方法和设备及拥塞控制方法和设备 | |
CN112291335A (zh) | 移动边缘计算中的优化任务调度方法 | |
CN108833138B (zh) | 一种错误累积敏感的增量式动态社区发现方法及系统 | |
CN115879152A (zh) | 基于最小均方误差准则的自适应隐私保护方法、装置及系统 | |
CN117252253A (zh) | 异步联邦边缘学习中的客户端选择和个性化隐私保护方法 | |
Engidayehu et al. | Deep reinforcement learning-based task offloading and resource allocation in MEC-enabled wireless networks | |
US9998347B2 (en) | Monitoring device usage | |
CN114296814B (zh) | 一种边云计算任务卸载方法、系统、终端以及存储介质 | |
EP2800386A1 (en) | Child node, father node and buffer method and system for multi-layer video network | |
CN113672372B (zh) | 一种基于强化学习的多边缘协同负载均衡任务调度方法 | |
Guo et al. | New discount and average optimality conditions for continuous-time Markov decision processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |