CN103065200A - 动态社区发现及追踪系统及其方法 - Google Patents

动态社区发现及追踪系统及其方法 Download PDF

Info

Publication number
CN103065200A
CN103065200A CN2012105545034A CN201210554503A CN103065200A CN 103065200 A CN103065200 A CN 103065200A CN 2012105545034 A CN2012105545034 A CN 2012105545034A CN 201210554503 A CN201210554503 A CN 201210554503A CN 103065200 A CN103065200 A CN 103065200A
Authority
CN
China
Prior art keywords
community
subg
type
increment element
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105545034A
Other languages
English (en)
Other versions
CN103065200B (zh
Inventor
赵中英
成杰峰
冯圣中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201210554503.4A priority Critical patent/CN103065200B/zh
Publication of CN103065200A publication Critical patent/CN103065200A/zh
Application granted granted Critical
Publication of CN103065200B publication Critical patent/CN103065200B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种动态社区发现及追踪系统,包括:社区构建模块与判断模块,其中,社区构建模块根据t时间的网络数据找出其隐含的所有社区k=1,2,3,......Kt,其中Kt表示t时刻的社区总数目;判断模块首先检测新出现的增量元素subG,其中,增量元素subG由节点和边组成,判断模块还判断所述增量元素subG的类型,其中类型包括:完全独立型、完全包含型、半包含半独立型以及多包含型,社区构建模块还根据增量元素subG的类型为完全独立型时将所述增量元素subG作为t+1时刻的新社区,并对所述增量元素对subG中的节点进行社区标识。本发明中的动态社区发现及追踪系统,有效的实现了灵活准确地对动态社区进行发现和追踪。

Description

动态社区发现及追踪系统及其方法
技术领域
本发明涉及SNS技术,尤其涉及一种动态社区发现及追踪系统及其方法。
背景技术
社会网络分析与挖掘,成为近几年学术界和产业界的热门研究领域,社区结构研究则是其中一个非常重要的研究课题。当前对社区结构的研究往往集中于静态层面,即给定一个网络,如何去发现其中隐藏的社区结构。然而,事实上,社会网络是不断变化的,社区结构也会随着网络的变化而演化,因此,人们开始关注动态社区的发现方法。
社区演化分析的开创性研究由Hopcroft等人进行[1],他们分析了NEC CiteSeerDatabase提供的引文网络的不同时间的快照(snapshot),这些快照分布于1990到2001年,他们所采用的社区发现方法是凝聚式层次聚类。通过分析和匹配不同快照网络的社区结构,可以跟踪各个社区的演化情况,发现新社区的出现通常对应新的研究方向等有趣的现象。Falkowski[2]等人基于subgroups分析了社区演化,并找出相对稳定和动荡的社区结构。他们用相邻网络的快照找到交叠的部分,利用统计度量发现那些相对稳定的subgroups。Palla等人第一次系统地进行了社区演化分析的研究[3],分析的数据是移动电话网络在一年内的数据、凝聚态物质领域的科学家合作网络数据,他们使用Clique PercolationMethod(CPM)方法[4]对每个时间步的图抽取社区结构,然后匹配连续时间片的社区结构,从而分析社区的演化规律。他们给出了很多有意思的特征,如:社区规模、生命周期、相关性、社区的自相关性等,其得出的主要结论是:小的社区较为稳定,而大的社区变化剧烈。
综上,当前对动态社区的研究都是基于时间片的方法,即首先对社会信息网络各个时间片上的快照进行社区发现,然后匹配相邻时间片的社区结构,探索社区的演化规律。此类方法的缺点之一在于,时间片的切分都是人为进行的,其粒度不同会导致结果的不同,若粒度太大,则会大大忽视社区结构的演化细节,若粒度太小,则会多次重复计算。基于时间片方法的缺点之二在于,需要对每个快照都要进行一次完整的社区发现,严重影响了发现效率。
因此,有必要研究一种与时间片切分粒度无关,能灵活准确地对动态社区进行发现及追踪的方法。
发明内容
有鉴于此,有必要提供一种动态社区发现及追踪系统及其方法。
本发明提供的一种增量的动态社区发现及追踪系统,包括:社区构建模块以及判断模块。其中,社区构建模块用于根据t时间的网络数据找出其中隐含的所有社区
Figure BDA00002614814800021
k=1,2,3,......Kt,其中Kt表示t时刻的社区总数目;判断模块用于检测出增量元素subG,其中,所述增量元素subG由节点和边组成,判断模块还用于判断所述增量元素subG的类型,其中类型包括:完全独立型、完全包含型、半包含半独立型以及多包含型,所述社区构建模块还用于在所述增量元素subG的类型为完全独立型时将所述增量元素subG作为t+1时刻的新社区,并对所述增量元素subG中的节点进行社区标识。
本发明还提供一种动态社区发现及追踪的方法,包括以下步骤:根据t时间的网络数据找出其隐含的所有社区
Figure BDA00002614814800022
k=1,2,3,......Kt,其中Kt表示t时刻的社区总数目;检测增量元素subG;判断所述增量元素subG的类型,其中类型包括:完全独立型、完全包含型、半包含半独立型以及多包含型;所述增量元素subG的类型为完全独立型时将所述增量元素subG作为t+1时刻的新社区,并对所述增量元素subG中的节点进行社区标识。
本发明中的动态社区发现及追踪系统及其方法实现的与时间片切分粒度无关的社区更新,灵活准确地实现了动态社区的发现及追踪。
附图说明
图1为本发明一实施方式中动态社区发现及追踪系统的模块图;
图2为本发明一实施方式中利用图1所示的动态社区发现及追踪系统进行动态社区发现以及追踪的方法的流程图;
图3为增量元素subG的类型示意图;
图4为本发明第一实施方式中半包含半独立型增量元素subG的社区更新示意图;
图5为本发明第二实施方式中半包含半独立型增量元素subG的社区更新示意图;
图6为本发明第一实施方式中多包含型增量元素subG的社区更新示意图;
图7为本发明第二实施方式中多包含型增量元素subG的社区更新示意图;
图8为本发明中社区的合并过程示意图;
图9为本发明中社区分裂过程示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,术语“内”、“外”、“纵向”、“横向”、“上”、“下”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明而不是要求本发明必须以特定的方位构造和操作,因此不能理解为对本发明的限制。
请参阅图1,图1所示为本发明一实施方式中动态社区发现及追踪系统10的模块图。
在本实施方式中动态社区发现及追踪系统10包括:社区构建模块102、判断模块104、计算模块106、衰减模块108、存储器110以及处理器112,其中,社区构建模块102、判断模块104、计算模块106以及衰减模块108存储在存储器110中,处理器112用于执行存储在存储器110中的功能模块。
在本实施方式中,社区构建模块102用于根据t时间的网络数据找出其中隐含的所有社区
Figure BDA00002614814800041
k=1,2,3,......Kt,其中Kt表示t时刻的社区总数目。
在本实施方式中,网络数据是指从社交网上抓取出来的数据。
在本实施方式中,社区构建模块102基于CPM算法对t时刻的网络数据进行初始的社区构建。其中,所谓CPM方法,即从k-clique入手,根据不同K-clique之间的重叠性进行进行自底向上的合并,从而构建出该网络中隐含的不同社区,k=1,2,3,......K,其中K表示t时刻的社区总数目。该算法的优点是允许一个节点属于多个社区。
在本实施方式中,所述CPM算法通过以下步骤识别出重叠网络簇结构:(1)对给定的参数K,计算出网络中的全部k-clique(k≤K),并建立clique和clique之间的重叠矩阵(clique-clique overlap matrix);(2)根据以上矩阵计算出重叠网络簇结构。
虽然CPM算法是一种能够计算重叠网络簇结构的算法,然而该方法却对边的稠密性要求极高,会导致社区结构的散乱。
为此,本发明对CPM算法进行了松弛改进,以K-clique为最小单元,进行社区发现,主要包括以下步骤:(1)获取所述网络数据中所有的K-Clique,并根据K的大小进行由大到小排序;(2)由大到小遍历所有的K-Clique,应用合并和复制策略对K-Clique进行合并和复制;(3)对每个社区进行标注从而完成社区的初始发现。其中,合并策略和复制策略定义如下:
1、合并策略
KCi和KCj是K-Clique中的任意两个完全图。当
Figure BDA00002614814800051
| V ( K C i ) ∩ V ( K C j ) | ≥ 1 2 | V ( K C i ) | | V ( K C i ) ∩ V ( K C j ) | ≥ 1 2 | V ( K C j ) | , 则将KCi和KCj进行合并得到一个社区。
2、复制策略
KCi和KCj是K-Clique中的任意两个完全图。当
Figure BDA00002614814800054
| V ( K C i ) &cap; V ( K C j ) | < 1 2 | V ( K C i ) | | V ( K C i ) &cap; V ( K C j ) | < 1 2 | V ( K C j ) | , 则将KCi和KCj分别作为一个社区来处理。
判断模块104用于检测增量元素subG。
在本实施方式中,所述增量元素subG由节点和边组成。
在本实施方式中,判断模块104还用于判断所述增量元素subG的类型,其中类型包括:完全独立型、完全包含型、半包含半独立型以及多包含型。
请结合图3,图3所示为增量元素subG的类型示意图,在本实施方式中,所述完全独立型是指所述增量元素subG中的任意节点均不在当前社区
Figure BDA00002614814800061
中,其形式化定义为:
One - AllNew ( subG ) = 1 iff ( &ForAll; C k t ) ( C k t &Element; C S t ) &RightArrow; ( V ( subG ) &cap; V ( C k t ) = &empty; )
所述完全包含型是指所述增量元素subG中的所有节点均在当前社区中,其形式化定义为:
One - AllOld ( subG ) = 1 iff ( &ForAll; v ) v &Element; V ( subG ) &RightArrow; ( &Exists; C k t ) v &Element; V ( C k t )
所述半独立半包含型是指所述增量元素subG中既有旧节点,也有新节点,其形式化定义为:
Multi - NewOld ( subG ) = 1 iff ( &Exists; C k t ) ( V ( C k t ) &cap; V ( subG ) &NotEqual; &empty; ) ^ ( &Exists; v ) ( v &Element; V ( subG ) ^ v &NotElement; V ( C S t ) )
所述多包含型是指所述增量元素subG中的所有节点都是旧节点,但属于t时刻的不同社区,其形式化定义为:
Multi - AllOld ( subG ) = 1 iff ( &ForAll; v ) v &Element; V ( subG ) &RightArrow; ( &Exists; C k t ) v &Element; V ( C k t )
在本实施方式中,所述社区构建模块102还用于在所述增量元素subG的类型为完全独立型时将所述增量元素subG作为t+1时刻的新社区,并对所述增量元素subG中的节点进行社区标识。
在本实施方式中,令
Figure BDA00002614814800067
表示社区
Figure BDA00002614814800068
的节点集合,
Figure BDA00002614814800069
表示社区的节点集合,Kt表示t时刻社区的数量,则
Figure BDA000026148148000611
为新诞生的社区定义如下:
在本文中,一个新社区的诞生是指社区中的成员以及成员之间的关系在该时间点上都是全新的,即若存在某个增量元素属于完全独立型,则该增量元素即可生成一个新的社区。
在本实施方式中,衰减模块108用于在所述增量元素subG的类型为完全包含型时利用历史边的衰减更新所述社区的权重。
在本实施方式中,历史边的衰减是指在与增量元素subG相关的社区更新时,需要对该社区各个边的权值进行衰减,其更新规则如以下公式所示:
w ij = w ij &Delta;G , e ij &NotElement; C S m t &alpha; &CenterDot; w ij t + w ij &Delta;G , e ij &Element; C S m t
其中,α为衰减参数,表示历史的影响程度,0≤α≤1。在本实施方式中,当α=0时,表示不考虑任何历史影响,即该规则表示隔离的时间片;当α=1时,则表示历史的影响丝毫不会随时间衰减,即,该规则表示累积的时间片。因此,本发明实施方式中的历史更新规则具有一般性。
在本实施方式中,衰减模块108根据衰减阈值θ来决定某条边的去留,若某条边更新后的权值小于θ,则删除该边;若大于θ,则保留该边及其权值。
在本实施方式中,衰减阈值θ定义为:
&theta; = 1 1 N &Sigma; u N ( Num ( u ) ) 2
其中,Num(u)代表节点u在时间序列中出现的次数,N代表数据集所有节点的个数。网络在经过衰减处理之后,若某条边(u,v)的权值小于衰减阈值θ,则删除该边。
因此,在社区结构的演化过程中,社区成员之间的权值会随着衰减函数而进行变化。该衰减策略的优点主要体现在(1)能够保证社区成员之间的关系还有社区成员的时效性;(2)能减少早期(历史)社区结构对当前社区结构的过度影响。
在本实施方式中,计算模块106用于在所述增量元素subG的类型为半包含半独立型时计算增量元素中的旧节点相对于社区
Figure BDA00002614814800073
的归属强度并对所有旧节点的归属强度求和得到
Figure BDA00002614814800075
在本实施方式中,计算模块106将节点v对社区C的归属强度定义为:节点v与社区C内部所有节点的边的权值之和,其形式化表示以下公式所示。
S v C = &Sigma; ( v , u ) &Element; E ( C ) w vu
基于错误!未找到引用源。,计算模块106给出节点结合的社区归属强度,其定义如下:节点集合的社区归属强度
Figure BDA00002614814800082
S V C = &Sigma; v &Element; V S v C
在本实施方式中,所述计算模块106还用于计算增量元素中的旧节点相对于增量元素subG的归属强度
Figure BDA00002614814800084
并对所有旧节点的归属强度求和得到
Figure BDA00002614814800085
在本实施方式中, S V old C k t = &Sigma; v &Element; V old S v C k t , S V old subG = &Sigma; v &Element; V old S v subG .
在本实施方式中,所述判断模块106还用于判断
Figure BDA00002614814800087
是否大于
在本实施方式中,所述社区构建模块102还用于在
Figure BDA00002614814800089
大于
Figure BDA000026148148000810
时将所述增量元素subG中的新节点加入到所述社区
Figure BDA000026148148000811
中,从而得到 C k t + 1 = C k t .
在本实施方式中,社区构建模块102将所述增量元素subG中的新节点加入到所述社区
Figure BDA000026148148000813
中的同时也需要将与对应新节点相连的边都加入到社区
Figure BDA000026148148000814
中。
在本实施方式中,所述社区构建模块102还用于在
Figure BDA000026148148000815
小于等于
Figure BDA000026148148000816
时将所述增量元素subG中的旧节点进行复制,并与新节点一起形成新社区
Figure BDA000026148148000817
在本实施方式中,社区构建模块102对旧节点进行复制操作,即表示将复制一个副本并加入到社区中。
在本实施方式中,所述计算模块106还用于在所述增量元素subG的类型为多包含型时针对不同的社区计算所有节点的归属强度和,以及所有节点对所述增量元素subG的归属强度和
Figure BDA00002614814800091
所述判断模块104还用于判断针对不同社区的归属强度和是否均小于
Figure BDA00002614814800092
所述社区构建模块102还用于在针对不同社区的归属强度和均小于
Figure BDA00002614814800093
时将所有节点进行复制,形成t+1时刻的新社区,并对所述增量元素subG中的节点进行社区标识。
在本实施方式中,所述社区构建模块102还用于在针对不同社区的归属强度和任意一个大于等于
Figure BDA00002614814800094
时将所述增量元素subG中的节点分别分配到相应的社区中。
请参阅图2,图2所示为本发明一实施方式中利用图1中所示的动态社区发现及追踪系统10进行动态社区发现以及追踪的方法的流程图。
在步骤S200,社区构建模块102根据t时间的网络数据找出其中隐含的所有社区
Figure BDA00002614814800095
k=1,2,3,......Kt,其中Kt表示t时刻的社区总数目。在本实施方式中,社区构建模块102基于CPM算法网络数据进行初始的t时刻的社区构建。其中,所谓CPM方法,即从k-clique入手,根据不同K-clique之间的重叠性进行进行自底向上的合并,从而构建出该网络中隐含的不同社区
Figure BDA00002614814800096
,k=1,2,3,......K,其中K表示t时刻的社区总数目。该算法的优点是允许一个节点属于多个社区。
在本实施方式中,所述CPM算法通过以下步骤识别出重叠网络簇结构:(1)对给定的参数K,计算出网络中的全部k-clique(k≤K),并建立clique和clique之间的重叠矩阵(clique-clique overlap matrix);(2)根据以上矩阵计算出重叠网络簇结构。
虽然CPM算法是一种能够计算重叠网络簇结构的算法,然而该方法却对边的稠密性要求极高,会导致社区结构的散乱。
为此,本发明对CPM算法进行了松弛改进,以K-clique为最小单元,进行社区发现,主要包括以下步骤:(1)获取所述网络数据中所有的K-Clique,并根据K的大小进行由大到小排序;(2)由大到小遍历所有的K-Clique,应用合并和复制策略对K-Clique进行合并和复制;(3)对每个社区进行标注从而完成社区的初始发现。其中,合并策略和复制策略定义如下:
1、合并策略
KCi和KCj是K-Clique中的任意两个完全图。当
Figure BDA00002614814800101
| V ( K C i ) &cap; V ( K C j ) | &GreaterEqual; 1 2 | V ( K C i ) | | V ( K C i ) &cap; V ( K C j ) | &GreaterEqual; 1 2 | V ( K C j ) | , 则将KCi和KCj进行合并得到一个社区。
2、复制策略
KCi和KCj是K-Clique中的任意两个完全图。当
Figure BDA00002614814800104
| V ( K C i ) &cap; V ( K C j ) | < 1 2 | V ( K C i ) | | V ( K C i ) &cap; V ( K C j ) | < 1 2 | V ( K C j ) | , 则将KCi和KCj分别作为一个社区来处理。
在步骤S202,判断模块104检测新加入的增量元素subG。
在步骤S204,判断模块104判断所述增量元素subG的类型是否为完全独立型,其中类型包括:完全独立型、完全包含型、半包含半独立型以及多包含型。
在本实施方式中,完全独立型、完全包含型、半包含半独立型以及多包含型的定义如图3所示,已在图1中详细描述,在此不做赘述。
若所述增量元素subG的类型为完全独立型,在步骤S206,社区构建模块102将所述增量元素subG作为t+1时刻的新社区,并对所述增量元素subG中的节点进行社区标识。
若述增量元素subG的类型不为完全独立型,则在步骤S208,判断模块104判断述增量元素subG的类型是否为完全包含型。
所述增量元素subG的类型为完全包含型时,在步骤S210,衰减模块108利用历史边的衰减更新所述社区
Figure BDA00002614814800111
的权重。
若所述增量元素subG的类型不为完全包含型,则在步骤S212,判断模块判读所述增量元素subG的类型是否为半包含半独立型。
若所述增量元素subG的类型为半包含半独立型,在步骤S214,计算模块106计算增量元素中的旧节点相对于社区
Figure BDA00002614814800112
的归属强度
Figure BDA00002614814800113
并对所有旧节点的归属强度求和得到
Figure BDA00002614814800114
在步骤S216,计算模块106计算增量元素中的旧节点相对于增量元素subG的归属强度
Figure BDA00002614814800115
并对所有旧节点的归属强度求和得到
Figure BDA00002614814800116
在本实施方式中, S V old C k t = &Sigma; v &Element; V old S v C k t , S V old subG = &Sigma; v &Element; V old S v subG .
在步骤S218,判断模块104判断
Figure BDA00002614814800119
是否大于
Figure BDA000026148148001111
大于
Figure BDA000026148148001112
则在步骤S220,社区构建模块102将所述增量元素subG中的新节点加入到所述社区
Figure BDA000026148148001113
中,从而得到
Figure BDA000026148148001114
小于等于
Figure BDA000026148148001116
则在步骤S222,社区构建模块102将所述增量元素subG中的旧节点进行复制,并与新节点一起形成新社区
Figure BDA000026148148001117
在步骤S224,判断模块104判断所述增量元素subG的类型是否为多包含型。
若所述增量元素subG的类型为多包含型,则在步骤S226,计算模块106针对不同的社区计算所有节点的归属强度和。
在步骤S228,计算模块106计算所有节点对所述增量元素subG的归属强度和
Figure BDA000026148148001118
在步骤S230,判断模块104判断针对不同社区的归属强度和是否均小于 S V ( subG ) subG .
若针对不同社区的归属强度和均小于
Figure BDA00002614814800122
则在步骤S232,社区构建模块102将所有节点进行复制,形成t+1时刻的新社区,并对所述增量元素subG中的节点进行社区标识。
若针对不同社区的归属强度和任意一个大于等于
Figure BDA00002614814800123
则在步骤S234,社区构建模块102将所述增量元素subG中的节点分别分配到相应的社区中。
请参阅图4,图4所示为本发明第一实施方式中半包含半独立型增量元素subG的社区更新示意图。
在本实施方式中,节点4为旧节点,节点5、6、7为新节点。
在本实施方式中,计算模块106计算旧节点4的社区归属强度和
Figure BDA00002614814800124
Figure BDA00002614814800125
判断模块104判断出
Figure BDA00002614814800126
小于等于
Figure BDA00002614814800127
时,社区构建模块102通过对节点4进行复制操作,并与新节点5、6、7形成新的社区
Figure BDA00002614814800128
请参阅图5,图5所示为本发明第二实施方式中半包含半独立型增量元素subG的社区更新示意图。
在本实施方式中,增量元素subG中的节点2和节点4为旧节点,节点5为新节点。
在本实施方式中,计算模块106计算旧节点2、4的社区归属强度和
Figure BDA00002614814800129
Figure BDA000026148148001210
判断模块104判断出
Figure BDA000026148148001211
大于
Figure BDA000026148148001212
时,社区构建模块102通过将新节点5加入到社区
Figure BDA000026148148001213
中,形成新社区
Figure BDA000026148148001214
请参阅图6,图6所示为本发明第一实施方式中多包含型增量元素subG的社区更新示意图。
在本实施方式中,增量元素subG中的节点a、b为社区
Figure BDA000026148148001215
中的旧节点,节点d、c为社区
Figure BDA00002614814800131
中的旧节点。
在本实施方式中,计算模块106计算节点a、b、c、d的社区归属强度和
Figure BDA00002614814800133
判断模块104判断出
Figure BDA00002614814800134
任意一个不小于
Figure BDA00002614814800135
则社区构建模块102将旧节点a、b、c、d进行复制,形成新社区 C k + 1 t + 1 .
请参阅图7,图7所示为本发明第二实施方式中多包含型增量元素subG的社区更新示意图。
在本实施方式中,增量元素subG中的节点2、3为社区中的旧节点,节点5为社区
Figure BDA00002614814800138
中的旧节点。
在本实施方式中,计算模块106计算节点2、3、5的社区归属强度和
Figure BDA000026148148001310
判断模块104判断出
Figure BDA000026148148001311
均小于
Figure BDA000026148148001312
则社区构建模块102将旧节点2、3分配到
Figure BDA000026148148001313
中形成新社区将旧节点5分配到社区中形成新社区
Figure BDA000026148148001316
在本实施方式中,令
Figure BDA000026148148001317
表示社区
Figure BDA000026148148001318
的节点集合,
Figure BDA000026148148001319
表示社区
Figure BDA000026148148001320
的节点集合,本发明中将
Figure BDA000026148148001321
Figure BDA000026148148001322
的“λ-保持”定义如下:
Figure BDA000026148148001323
在发明中,社区的“λ-保持”应理解为,某一社区随着时间的推移进行衰减,使得某些边因为小于阈值而被删除,同时,又有部分节点加入该社区,前后的变化比例不超过λ,此时则称该社区为“λ-保持”。
在本实施方式中,令
Figure BDA000026148148001324
表示社区
Figure BDA000026148148001325
的节点集合,
Figure BDA000026148148001326
表示社区
Figure BDA000026148148001327
的节点集合,本发明将
Figure BDA000026148148001328
的“λ-扩大”定义如下:
Expand ( C i t , C j t + 1 , &lambda; ) iff | V i t | < | V j t + 1 | | V i t &cap; V j t + 1 | max ( | V i t | , | V j t + 1 | ) &GreaterEqual; &lambda;
在本实施方式中,令
Figure BDA00002614814800143
表示社区
Figure BDA00002614814800144
的节点集合,
Figure BDA00002614814800145
表示社区的节点集合,本发明将
Figure BDA00002614814800147
Figure BDA00002614814800148
的“λ-缩小”定义如下:
Contract ( C i t , C j t + 1 , &lambda; ) iff | V i t | > | V j t + 1 | | V i t &cap; V j t + 1 | max ( | V i t | , | V j t + 1 | ) &GreaterEqual; &lambda;
请参阅图8,图8所示为本发明中社区的合并过程示意图。
从图8中可以看出,C与C1的合并过程中,C2由C1衰减而来,且一直处于衰减状态,并将C2中的节点并入到C1中,直到C2消失。
因此,社区之间的合并过程,当某个社区中的元素逐渐被复制到另外一个社区中,使得原社区中的结构逐渐衰变,从而消亡,但是原社区的元素会成为另外一个社区中的新成员。最终,完成社区之间的合并。
在本实施方式中,令
Figure BDA000026148148001411
分别表示社区
Figure BDA000026148148001412
Figure BDA000026148148001413
的节点集合,表示社区
Figure BDA000026148148001415
的节点集合,本发明将社区
Figure BDA000026148148001416
Figure BDA000026148148001417
以λ程度合并为
Figure BDA000026148148001418
定义如下:
Merge ( ( C i t , C j t ) , C k t + 1 , &lambda; ) iff | V i t | < | V k t + 1 | , | V j t | < | V k t + 1 | ( V i t &cup; V j t ) &cap; V k t + 1 max ( ( V i t &cup; V j t ) , V k t + 1 ) &GreaterEqual; &lambda;
在本实施方式中,令
Figure BDA000026148148001422
表示社区
Figure BDA000026148148001423
的节点集合,
Figure BDA000026148148001424
表示社区
Figure BDA000026148148001425
的节点集合,Kt+1表示(t+1)时刻的社区数量,则
Figure BDA000026148148001426
为消亡的社区定义如下:
Disappear ( C j t = 1 ) 1 iff &ForAll; i , i=1,2,...,Kt+1,有 | V j t &cap; V i t + 1 | &le; 1
在发明中,对一个社区消亡的直观理解是指,社区中成员之间的关系在随时间的衰减过程中逐渐消失,从而使所有成员成为孤立节点,导致该社区消亡。
请参阅图9,图9所示为本发明中社区的分裂过程示意图。
从图9中可以看出,社区的分裂是通过衰减来实现的。
在本实施方式中,当社区结构中某条边的权值随时间的推移,逐渐衰变到删除临界值,此时,应用衰减策略对该边进行删除。当该社区中的边发生删除操作时,就要对该社区进行结构更新,检测该社区中是否存在非联通性,若存在,则进行社区结构的分裂。若不存在非联通性,则不考虑社区结构的分裂。
在本实施方式中,令
Figure BDA00002614814800151
表示社区
Figure BDA00002614814800152
的节点集合,
Figure BDA00002614814800153
Figure BDA00002614814800154
分别表示社区
Figure BDA00002614814800156
的节点集合,本发明将社区以λ程度分裂为定义如下:
Split ( C i t , ( C j t + 1 , C k t + 1 ) , &lambda; ) iff | V i t | > | V j t + 1 | , | V j t | > | V k t + 1 | V i t &cap; ( V j t + 1 &cup; V k t + 1 ) max ( | V i t | , | V j t + 1 &cup; V k t + 1 | ) &GreaterEqual; &lambda;
本发明实施方式中的动态社区发现及追踪系统10及其方法实现社区的更新与时间片切分粒度无关,有效的实现了灵活准确地对动态社区进行发现、追踪及预测。
虽然本发明参照当前的较佳实施方式进行了描述,但本领域的技术人员应能理解,上述较佳实施方式仅用来说明本发明,并非用来限定本发明的保护范围,任何在本发明的精神和原则范围之内,所做的任何修饰、等效替换、改进等,均应包含在本发明的权利保护范围之内。

Claims (14)

1.一种增量的动态社区发现及追踪系统,包括:
社区构建模块,用于根据t时间的网络数据找出其隐含的所有社区
Figure FDA00002614814700011
k=1,2,3,......Kt,其中Kt表示t时刻的社区总数目;
判断模块,用于检测增量元素subG,其中,所述增量元素subG由节点和边组成,判断模块还用于判断所述增量元素subG的类型,其中类型包括:完全独立型、完全包含型、半包含半独立型以及多包含型,
所述社区构建模块还用于在所述增量元素subG的类型为完全独立型时将所述增量元素subG作为t+1时刻的新社区,并对所述增量元素subG中的节点进行社区标识。
2.如权利要求1所述的动态社区发现及追踪系统,其特征在于,所述完全独立型是指所述增量元素subG中的任意节点均不在当前社区
Figure FDA00002614814700012
中,所述完全包含型是指所述增量元素subG中的所有节点均在当前社区
Figure FDA00002614814700013
中,所述半独立半包含型是指所述增量元素subG中既有旧节点,也有新节点,所述多包含型是指所述增量元素subG中的所有节点都是旧节点,但属于t时刻的不同社区。
3.如权利要求1所述的动态社区发现及追踪系统,其特征在于,还包括:
衰减模块,用于在所述增量元素subG的类型为完全包含型时利用历史边的衰减更新所述社区
Figure FDA00002614814700014
的权重。
4.如权利要求1所述的动态社区发现及追踪系统,其特征在于,还包括:
计算模块,用于在所述增量元素subG的类型为半包含半独立型时计算增量元素中的旧节点相对于社区
Figure FDA00002614814700021
的归属强度
Figure FDA00002614814700022
并对所有旧节点的归属强度求和得到
Figure FDA00002614814700023
其中,所述计算模块还用于计算增量元素中的旧节点相对于增量元素subG的归属强度
Figure FDA00002614814700024
并对所有旧节点的归属强度求和得到
Figure FDA00002614814700025
所述判断模块还用于判断是否大于
Figure FDA00002614814700027
所述社区构建模块还用于在
Figure FDA00002614814700028
大于时将所述增量元素subG中的新节点加入到所述社区
Figure FDA000026148147000210
中,从而得到
5.如权利要求4所述的动态社区发现及追踪系统,其特征在于,所述社区构建模块还用于在小于等于
Figure FDA000026148147000213
时将所述增量元素subG中的旧节点进行复制,并与新节点一起形成新社区
Figure FDA000026148147000214
6.如权利要求1所述的动态社区发现及追踪系统,其特征在于,所述计算模块还用于在所述增量元素subG的类型为多包含型时针对不同的社区计算所有节点的归属强度和,以及所有节点对所述增量元素subG的归属强度和
Figure FDA000026148147000215
所述判断模块还用于判断针对不同社区的归属强度和是否均小于所述社区构建模块还用于在针对不同社区的归属强度和均小于
Figure FDA000026148147000217
时将所述增量元素subG中的所有节点进行复制,形成t+1时刻的新社区,并对所述增量元素subG中的节点进行社区标识。
7.如权利要求6所述的动态社区发现及追踪系统,其特征在于,所述社区构建模块还用于在针对不同社区的归属强度和任意一个大于等于
Figure FDA000026148147000218
时将所述增量元素subG中的节点分别分配到相应的社区中。
8.一种动态社区发现及追踪的方法,其特征在于,包括:
根据t时间的网络数据找出其隐含的所有社区
Figure FDA000026148147000219
k=1,2,3,......Kt其,中K t表示t时刻的社区总数目;
检测增量元素subG;
判断所述增量元素subG的类型,其中类型包括:完全独立型、完全包含型、半包含半独立型以及多包含型;
所述增量元素subG的类型为完全独立型时将所述增量元素subG作为t+1时刻的新社区,并对所述增量元素subG中的节点进行社区标识。
9.如权利要求8所述的方法,其特征在于,所述完全独立型是指所述增量元素subG中的任意节点均不在当前社区
Figure FDA00002614814700031
中,所述完全包含型是指所述增量元素subG中的所有节点均在当前社区
Figure FDA00002614814700032
中,所述半独立半包含型是指所述增量元素subG中既有旧节点,也有新节点,所述多包含型是指所述增量元素subG中的所有节点都是旧节点,但属于t时刻的不同社区。
10.如权利要求8所述的方法,其特征在于,还包括以下步骤:
在所述增量元素subG的类型为完全包含型时利用历史边的衰减更新所述社区
Figure FDA00002614814700033
的权重。
11.如权利要求8所述的方法,其特征在于,还包括以下步骤:
在所述增量元素subG的类型为半包含半独立型时计算增量元素中的旧节点相对于社区的归属强度
Figure FDA00002614814700035
并对所有旧节点的归属强度求和得到
Figure FDA00002614814700036
计算增量元素中的旧节点相对于增量元素subG的归属强度
Figure FDA00002614814700037
并对所有旧节点的归属强度求和得到
Figure FDA00002614814700038
判断
Figure FDA00002614814700039
是否大于
Figure FDA000026148147000310
Figure FDA000026148147000311
大于时将所述增量元素subG中的新节点加入到所述社区
Figure FDA00002614814700041
中,从而得到
12.如权利要求11所述的方法,其特征在于,还包括以下步骤:
Figure FDA00002614814700043
小于等于
Figure FDA00002614814700044
时将所述增量元素subG中的旧节点进行复制,并与新节点一起形成新社区
Figure FDA00002614814700045
13.如权利要求8所述的方法,其特征在于,还包括以下步骤:
在所述增量元素subG的类型为多包含型时针对不同的社区计算所有节点的归属强度和;
计算所有节点对所述增量元素subG的归属强度和
Figure FDA00002614814700046
判断针对不同社区的归属强度和是否均小于
Figure FDA00002614814700047
在针对不同社区的归属强度和均小于
Figure FDA00002614814700048
时将所有节点进行复制,形成t+1时刻的新社区,并对所述增量元素subG中的节点进行社区标识。
14.如权利要求13所述的方法,其特征在于,还包括以下步骤:
在针对不同社区的归属强度和任意一个大于等于时将所述增量元素subG中的节点分别分配到相应的社区中。
CN201210554503.4A 2012-12-19 2012-12-19 动态社区发现及追踪系统及其方法 Active CN103065200B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210554503.4A CN103065200B (zh) 2012-12-19 2012-12-19 动态社区发现及追踪系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210554503.4A CN103065200B (zh) 2012-12-19 2012-12-19 动态社区发现及追踪系统及其方法

Publications (2)

Publication Number Publication Date
CN103065200A true CN103065200A (zh) 2013-04-24
CN103065200B CN103065200B (zh) 2016-09-28

Family

ID=48107822

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210554503.4A Active CN103065200B (zh) 2012-12-19 2012-12-19 动态社区发现及追踪系统及其方法

Country Status (1)

Country Link
CN (1) CN103065200B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425868A (zh) * 2013-07-04 2013-12-04 西安理工大学 基于分形特征的复杂网络社区发现方法
CN105608173A (zh) * 2015-12-21 2016-05-25 西北工业大学 一种基于自适应代理的渐进式社区发现方法
CN103678671B (zh) * 2013-12-25 2016-10-05 福州大学 一种社交网络中的动态社区检测方法
CN107659467A (zh) * 2017-09-26 2018-02-02 云南大学 动态社交网络中基于联盟形成博弈的社区检测方法
CN109840720A (zh) * 2019-03-01 2019-06-04 同济大学 车联网社区动态演化方法
CN111177876A (zh) * 2019-12-25 2020-05-19 支付宝(杭州)信息技术有限公司 一种社区发现方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5140585A (en) * 1990-07-19 1992-08-18 Kabushiki Kaisha Toshiba Star local-area network system
US20050066020A1 (en) * 2003-09-23 2005-03-24 Gabriel Wechter Method and system for managing a network of nodes
WO2008091914A1 (en) * 2007-01-24 2008-07-31 Chiahao Chang Method, system, and program for an integrating disjoined but related network components into collaborative communities
US20100058118A1 (en) * 2008-08-29 2010-03-04 Fujitsu Limited Storage medium recording information reacquisition procedure generation program and information reacquisition procedure generation apparatus
CN102726010A (zh) * 2010-01-30 2012-10-10 国际商业机器公司 用于发现作为网络中社区的星形结构的系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5140585A (en) * 1990-07-19 1992-08-18 Kabushiki Kaisha Toshiba Star local-area network system
US20050066020A1 (en) * 2003-09-23 2005-03-24 Gabriel Wechter Method and system for managing a network of nodes
WO2008091914A1 (en) * 2007-01-24 2008-07-31 Chiahao Chang Method, system, and program for an integrating disjoined but related network components into collaborative communities
US20100058118A1 (en) * 2008-08-29 2010-03-04 Fujitsu Limited Storage medium recording information reacquisition procedure generation program and information reacquisition procedure generation apparatus
CN102726010A (zh) * 2010-01-30 2012-10-10 国际商业机器公司 用于发现作为网络中社区的星形结构的系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张景阳: "基于局部介数的复杂网络社区动态演化研究", 《中国优秀硕士学位论文全文数据库,基础科学辑》, 15 August 2011 (2011-08-15) *
王慧芳等: "一种增量式的社区发现算法研究", 《计算机仿真》, 31 January 2008 (2008-01-31) *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425868A (zh) * 2013-07-04 2013-12-04 西安理工大学 基于分形特征的复杂网络社区发现方法
CN103425868B (zh) * 2013-07-04 2016-12-28 西安理工大学 基于分形特征的复杂网络社区发现方法
CN103678671B (zh) * 2013-12-25 2016-10-05 福州大学 一种社交网络中的动态社区检测方法
CN105608173A (zh) * 2015-12-21 2016-05-25 西北工业大学 一种基于自适应代理的渐进式社区发现方法
CN107659467A (zh) * 2017-09-26 2018-02-02 云南大学 动态社交网络中基于联盟形成博弈的社区检测方法
CN107659467B (zh) * 2017-09-26 2020-03-17 云南大学 动态社交网络中基于联盟形成博弈的社区检测方法
CN109840720A (zh) * 2019-03-01 2019-06-04 同济大学 车联网社区动态演化方法
CN111177876A (zh) * 2019-12-25 2020-05-19 支付宝(杭州)信息技术有限公司 一种社区发现方法、装置及电子设备

Also Published As

Publication number Publication date
CN103065200B (zh) 2016-09-28

Similar Documents

Publication Publication Date Title
Mohan et al. Cascading spatio-temporal pattern discovery
Medina-Salgado et al. Urban traffic flow prediction techniques: A review
Zhang et al. Fault detection and repairing for intelligent connected vehicles based on dynamic Bayesian network model
Wang et al. Multi-criteria robustness analysis of metro networks
CN103065200A (zh) 动态社区发现及追踪系统及其方法
Neill Expectation-based scan statistics for monitoring spatial time series data
CN108052576A (zh) 一种事理知识图谱构建方法及系统
Kaya et al. Electric car sharing stations site selection from the perspective of sustainability: A GIS-based multi-criteria decision making approach
CN105243593A (zh) 基于混合测度的加权网络社区聚类方法
He et al. Simultaneously simulate vertical and horizontal expansions of a future urban landscape: A case study in Wuhan, Central China
CN103106616B (zh) 基于资源整合与信息传播特征的社区发现及演化方法
Ghosh et al. MARIO: A spatio-temporal data mining framework on Google Cloud to explore mobility dynamics from taxi trajectories
Yang et al. Did you enjoy the ride? understanding passenger experience via heterogeneous network embedding
CN104346408A (zh) 一种对网络用户进行标注的方法与设备
Liu et al. Modelling the energy consumption of electric vehicles under uncertain and small data conditions
Liu et al. Modeling the interaction coupling of multi-view spatiotemporal contexts for destination prediction
CN104268657A (zh) 基于遥感的流域水生态风险预警和判别方法
Li et al. Modeling time-of-day car use behavior: A Bayesian network approach
Chen et al. Exploring the properties of cost overrun risk propagation network (CORPN) for promoting cost management
Zhang et al. Slope stability prediction method based on the margin distance minimization selective ensemble
Rahman et al. A deep learning approach for network-wide dynamic traffic prediction during hurricane evacuation
CN102376025A (zh) 一种模拟手机数据并评估城市路网交通状态的方法
Chen et al. Evolution prediction of unconventional emergencies via neural network: An empirical study of megacities
Yang et al. Dynamic spatiotemporal causality analysis for network traffic flow based on transfer entropy and sliding window approach
Wang et al. The level of delay caused by crashes (LDC) in metropolitan and non-metropolitan areas: a comparative analysis of improved Random Forests and LightGBM

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant