CN103678671A - 一种社交网络中的动态社区检测方法 - Google Patents

一种社交网络中的动态社区检测方法 Download PDF

Info

Publication number
CN103678671A
CN103678671A CN201310725401.9A CN201310725401A CN103678671A CN 103678671 A CN103678671 A CN 103678671A CN 201310725401 A CN201310725401 A CN 201310725401A CN 103678671 A CN103678671 A CN 103678671A
Authority
CN
China
Prior art keywords
node
community
label
increment
social network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310725401.9A
Other languages
English (en)
Other versions
CN103678671B (zh
Inventor
陈羽中
陈国龙
郭文忠
邱晓辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201310725401.9A priority Critical patent/CN103678671B/zh
Publication of CN103678671A publication Critical patent/CN103678671A/zh
Application granted granted Critical
Publication of CN103678671B publication Critical patent/CN103678671B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及社交网络技术领域,特别是一种社交网络中的动态社区检测方法,所述方法包括如下步骤:对于动态变化的社交网络,获取社交网络的某个时间片(时刻)的快照,构造快照的社交网络图;首先对初始时刻的社交网络图进行社区划分,对社交网络的后续某个时间片(时刻)的快照,则通过与上一时刻快照的对比,找出增量节点集合;计算增量节点所占比例,如果增量节点比例超出指定阈值,对完整的快照网络进行社区划分,反之仅对增量节点集合进行社区划分,获得社交网络的某个时刻快照的社区结构。所述方法可有效的挖掘社交网络中的社区结构,可应用于目标群体挖掘、精确营销等领域。

Description

一种社交网络中的动态社区检测方法
技术领域
本发明涉及社交网络技术领域,特别是一种社交网络中的动态社区检测方法。
背景技术
从社交网络中检测社区结构是社交网络分析中的一项重要任务,无论是理论上还是实际应用中都具有十分重要的意义。通过挖掘网络中的社区结构,能够发现网络中隐含的组织结构信息、社会功能以及社区成员之间隐含的有趣属性,如共同爱好等。通过研究社交网络中社区之间、个体之间以及个体与社区之间的关系,可以挖掘出大量有价值的信息,可应用于许多领域。
现有的社区检测方法多是基于静态社会网络,即认为社会网络中节点集合和边集合是不变的,社区结构也是稳定不变的。这些方法可以大致分为两大类:基于优化的方法和启发式的方法。前者通过最优化预定义的目标函数来检测社区结构,如谱方法将社区检测问题转化为二次型优化问题。启发式方法是将问题转化为预定义启发式规则设计问题,如Girvan-Newman的启发式规则是寻找边界数最大的边,然后依次删除;MFC则是通过计算最小截集识别社区间连接,HITS的启发式规则是基于权威-中心页面间相互指向的连接关系。此外,社区检测的另一个思路是采用K-MEANS、DBSCAN等经典聚类方法对网络进行聚类,形成社区结构。这类方法对参数敏感,且需要社区数量的先验知识。随着社会网络规模日益庞大,传统社区检测方法的时间复杂度过高,难以满足社区检测的应用要求,出现了一种较为高效的社区检测方法:标签传播方法。标签传播方法初始阶段给每个节点赋予唯一标签,在每一轮迭代中,每个节点根据其最多邻居拥有的标签更新自己的标签。标签传播方法可以获得接近线性的时间复杂度,运行效率高,但是应用于大规模网络中还存在稳定性问题。
实际中的社交网络呈动态特性,即社交网络的结构是随时间的变化而变化的,不断有节点加入、退出,因此动态社区检测在实际应用中具有更重要的价值。如果当网络结构发生变化时都采用静态方法进行社区检测,不仅容易在相邻时刻网络上产生具有较大差异的社区发现结果,而且对大量节点进行没有必要的重复检测,导致较高的时间复杂度Yu-Ru等提出一种成为FacetNet的动态社区划分框架,将社区检测和社区进化融为一体,时刻的社区结构由历史社区划分提供先验分布结合当前时刻网络拓扑决定当前社区结构,生成社区采用stochastic block模型,在不同时刻网络划分中社区之间的匹配问题采用一种迭代的EM方法,但FacetNet依赖网络社区数目的先验知识,而社区数目在实际情况中很难准确获取。FacetNet在大型网络中,需要多次迭代才能使矩阵收敛,不适合大规模数据的处理。
综上,现有的社交网络社区检测方法从发现的社区结构质量以及时间效率上看都尚有很大的提升空间。面对大规模社交网络的场景,现有方法无论是在效果和效率上都难以满足要求。
发明内容
本发明的目的在于提供一种社交网络中的动态社区检测方法,该方法有利于提高社区检测的精度和效率。
为实现上述目的,本发明的技术方案是:一种社交网络中的动态社区检测方法,包括以下步骤:
步骤A:获取社交网络一时刻t i-1的快照数据,作为初始的社交网络快照,并构造以社交网络用户为节点、用户关系为边的社交网络图G i-1=(V i-1E i-1),V i-1表示时刻t i-1的社交网络图G i-1的节点集合,E i-1表示时刻t i-1的社交网络图G i-1的边集合;
步骤B:对于时刻t i-1的社交网络图G i-1,进行社区划分,获得社交网络在时刻t i-1的社区结构;
步骤C:顺序获取社交网络下一时刻t i 的快照数据,构造社交网络图G i =(V i E i ),V i 表示时刻t i 的社交网络图G i 的节点集合,E i 表示时刻t i 的社交网络图G i 的边集合,然后获得时刻t i 的社交网络图G i 与上一时刻t i-1的社交网络图G i-1相比发生变化的节点集合,即增量节点集合VC i
步骤D:根据所述增量节点集合VC i ,计算增量节点占节点总数的比例,即增量节点比例;
步骤E:根据所述增量节点比例,若增量节点比例大于设定阈值,则对社交网络图G i 中所有的节点重新进行社区划分,若增量节点比例小于设定阈值,则社交网络图G i 中不属于增量节点集合的节点维持原有的标签不变,保持原来的社区归属,仅对属于增量节点集合的节点进行社区划分,更新增量节点集合中节点的社区标签;社区划分结束后,根据每个节点所拥有的社区标签,将拥有相同标签的节点归属到同一社区,获得社交网络在时刻t i 的社区结构。
进一步地,所述步骤B中,使用静态标签传播方法进行社区划分,具体包括以下步骤:
步骤B1:根据社交网络图,通过密度聚类方法进行节点标签初始化,为社交网络图中的每个节点分配一个标签;
步骤B2:根据标签更新规则,对社交网络图中的每个节点进行标签更新,反复迭代,直到满足迭代终止条件;
步骤B3:根据迭代终止时节点所分配的标签,将具有相同标签的节点归属到同一社区,输出社区结构。
进一步地,所述步骤B1中,采用基于相似度的密度聚类方法为节点分配标签,以增强后续标签传播过程的稳定性,具体包括以下步骤:
步骤B11:遍历社交网络中的每个节点,将所有节点设为未分配标签状态;
步骤B12:核心节点选择与核心区域扩展:遍历社交网络图中的每个节点,如果节点v是未分配标签状态,且符合核心节点定义,产生一个新的标签分配给节点v并对节点v进行扩展;将节点v的标签赋予所有满足与节点v是直接可达关系的节点,并将这些节点加入到一个初始为空的队列中,再遍历队列中的节点,从这些节点出发进行扩展,赋予和节点v相同的标签,得到核心区域;如果节点v是未分配标签状态,且不符合核心节点定义,将节点v标记为孤立节点;
步骤B13:孤立节点处理:为标记为孤立节点的节点分配新的社区标签。
进一步地,对社交网络图G i-1=(V i-1E i-1)进行标签初始化过程中,节点v是核心节点的充分必要条件是:节点vε邻居节点集合N ε (v)的基数大于等于预定义的最少ε邻居节点个数k,定义如下:
Figure 2013107254019100002DEST_PATH_IMAGE002
其中,节点vε邻居节点集合N ε (v)为节点v的节点结构集合Γ(v)中,与节点v相似度大于等于预定义的最小相似度ε的节点子集,定义如下:
Figure 2013107254019100002DEST_PATH_IMAGE004
其中,节点v的节点结构集合Γ(v)定义为节点v与节点v的邻居节点集合Neighbor(ν)的并集,定义如下:
Figure 2013107254019100002DEST_PATH_IMAGE006
其中,节点ν的邻居节点集合Neighbor(ν)定义为社交网络中与节点ν有边相连的所有节点集合:
Figure 2013107254019100002DEST_PATH_IMAGE008
节点相似度
Figure 2013107254019100002DEST_PATH_IMAGE010
定义为节点ν和节点u的结构集合的交集基数除以并集的基数:
Figure 2013107254019100002DEST_PATH_IMAGE012
任意两个节点ν和节点u之间为直接可达关系的充分必要条件是:节点ν是核心节点,且节点u属于节点νε邻居节点集合,定义如下:
Figure 2013107254019100002DEST_PATH_IMAGE014
直接可达关系的规则用于将核心节点扩展为初始社区。
进一步地,所述步骤B2中,所述标签更新规则如下:计算节点ν与其每个邻居节点的节点相似度,并根据节点相似度计算其接收邻居节点u传递的标签label(u)=l i 的概率,并根据计算得到的概率,采用轮盘赌方式更新节点ν的标签;所述轮盘赌方式中选择邻居节点u的标签label(u)=l i 的概率计算公式定义为:
Figure 2013107254019100002DEST_PATH_IMAGE016
其中
Figure 313458DEST_PATH_IMAGE010
为节点ν和节点u的节点相似度。
进一步地,所述步骤C中,社交网络在时刻t i 的增量节点集合VC i ,定义为节点集合(V i+V i-)以及与边集合(E i+E i-)相关联的节点集合的并集,定义如下:
VC i = V i+V i-∪{ E i+相关联节点}∪{ E i-相关联节点}
其中t i 时刻网络快照与t i-1时刻网络快照对比,V i+代表增加节点的集合,V i-代表减少节点的集合,E i+代表增加边的集合,E i-代表减少边的集合,定义如下:
Figure 2013107254019100002DEST_PATH_IMAGE018
E i+相关联节点表示由属于E i+的边的端点构成的节点集合,E i-相关联节点表示由属于E i-的边的端点构成的节点集合。
进一步地,所述步骤D中,社交网络在时刻t i 的增量节点比例
Figure 2013107254019100002DEST_PATH_IMAGE020
定义为时刻t i 增量节点集合VC i 的基数与时刻t i 节点集合V i  的基数的比值,计算公式为:
Figure 2013107254019100002DEST_PATH_IMAGE022
进一步地,所述步骤E中,若增量节点比例大于设定阈值,则采用所述静态标签传播方法对社交网络图G i 中所有的节点重新进行社区划分,若增量节点比例小于指定阈值,则按以下步骤进行社区划分:
步骤E1:如果时刻t i 的社交网络中的节点在增量节点集合VC i 中,则分配新标签,如果不在增量节点集合VC i 中,则其标签与时刻t i-1的标签保持一致;
步骤E2:对于在增量节点集合VC i 中的节点,按照所述标签更新规则进行迭代更新;
步骤E3:当满足迭代终止条件,即当所有节点不再发生标签更新或达到规定迭代次数时,结束迭代。
相较于现有技术,本发明的有益效果是:具有传统基于增量分析的动态社区检测方法的高效率,无需社区数目的先验知识的优点,且对网络结构自适应,对网络突变情况也有很好的处理效果,能够提高社区检测的效率、稳定性、准确率。综上,本发明的方法能够高效的检测社交网络的社区结构。
附图说明
图1是本发明方法的实现流程图。 
图2是本发明方法中静态标签传播方法的实现流程图。
图3是本发明方法中核心节点选择与核心区域扩展的实现流程图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步的说明。
图1是本发明的社交网络中的动态社区检测方法的实现流程图。如图1所示,所述方法包括以下步骤:
步骤A:获取社交网络一时刻t i-1的快照数据,作为初始的社交网络快照,并构造以社交网络用户为节点、用户关系为边的社交网络图G i-1=(V i-1E i-1),V i-1表示时刻t i-1的社交网络图G i-1的节点集合,E i-1表示时刻t i-1的社交网络图G i-1的边集合。
如针对微博网络,将每个微博注册用户作为社交网络中的一个节点,以用户间的相互关注、评论关系作为社交网络中的一条边;如针对协作网络,将每个作者作为网络中的一个节点,以两个作者至少共同发表过一篇文章的协作关系作为社交网络中的一条边。采用稀疏矩阵的数据结构存储社交网络图的邻接矩阵。
步骤B:对于时刻t i-1的社交网络图G i-1,进行社区划分,获得社交网络在时刻t i-1的社区结构。
具体的,所述步骤B中,使用静态标签传播方法进行社区划分。图2是本发明的社交网络中的动态社区检测方法中静态标签传播方法的实现流程图,如图2所示,具体包括以下步骤:
步骤B1:根据社交网络图,通过密度聚类方法进行节点标签初始化,为社交网络图中的每个节点分配一个标签;
在对网络节点标签进行初始化时,选择核心区域作为种子节点集合并赋予它们同一标签,其中核心区域采用基于相似度的密度聚类方式挖掘。对于核心区域外的节点,赋予其新的标签。由于核心区域是社区的雏形,分配同一标签是合理的。这种标签初始化方式可以在标签传播过程中减少了不必要的标签更新开销,提高效率。
所述步骤B1中,采用基于相似度的密度聚类方法为节点分配标签,以增强后续标签传播过程的稳定性,具体包括以下步骤:
步骤B11:遍历社交网络中的每个节点,将所有节点设为未分配标签状态;
步骤B12:核心节点选择与核心区域扩展:遍历社交网络图中的每个节点,如果节点v是未分配标签状态,且符合核心节点定义,产生一个新的标签分配给节点v并对节点v进行扩展;将节点v的标签赋予所有满足与节点v是直接可达关系的节点,并将这些满足与节点v是直接可达关系的节点加入到一个初始为空的队列中,再遍历队列中的节点,从这些节点出发进行扩展,赋予和节点v相同的标签,从而得到核心区域;如果节点v是未分配标签状态,且不符合核心节点定义,将节点v标记为孤立节点;图3即为本发明方法中步骤B12的实现流程图;
具体的,对社交网络图G i-1=(V i-1E i-1)进行标签初始化过程中,节点v是核心节点的充分必要条件是:节点vε邻居节点集合N ε (v)的基数大于等于预定义的最少ε邻居节点个数k,定义如下:
Figure 221809DEST_PATH_IMAGE002
其中,节点vε邻居节点集合N ε (v)为节点v的节点结构集合Γ(v)中,与节点v相似度大于等于预定义的最小相似度ε的节点子集,定义如下:
Figure 126180DEST_PATH_IMAGE004
其中,节点v的节点结构集合Γ(v)定义为节点v与节点v的邻居节点集合Neighbor(ν)的并集,定义如下:
Figure 212734DEST_PATH_IMAGE006
其中,节点ν的邻居节点集合Neighbor(ν)定义为社交网络中与节点ν有边相连的所有节点集合:
Figure 151740DEST_PATH_IMAGE008
其中,V i E i 分别为社交网络图G i 的节点集合和边集合; 
节点相似度定义为节点ν和节点u的结构集合的交集基数除以并集的基数:
Figure 303553DEST_PATH_IMAGE012
具体的,任意两个节点ν和节点u之间为直接可达关系的充分必要条件是:节点ν是核心节点,且节点u属于节点νε邻居节点集合,定义如下:
Figure 627087DEST_PATH_IMAGE014
直接可达关系的规则用于将核心节点扩展为初始社区。
步骤B13:孤立节点处理:为标记为孤立节点的节点分配新的社区标签。
步骤B2:根据标签更新规则,对社交网络图中的每个节点进行标签更新,反复迭代,直到满足迭代终止条件;
具体的,所述步骤B2中,所述标签更新规则如下:计算节点ν与其每个邻居节点的节点相似度,并根据节点相似度计算其接收邻居节点u传递的标签label(u)=l i 的概率,并根据计算得到的概率,采用轮盘赌方式更新节点ν的标签;所述轮盘赌方式中选择邻居节点u的标签label(u)=l i 的概率计算公式定义为:
Figure 936713DEST_PATH_IMAGE016
其中
Figure 54711DEST_PATH_IMAGE010
为节点ν和节点u的节点相似度。
其中迭代终止条件为标签数目不再变化或者已经达到最大迭代次数。
步骤B3:根据迭代终止时节点所分配的标签,将具有相同标签的节点归属到同一社区,输出社区结构。
步骤C:顺序获取社交网络下一时刻t i 的快照数据,构造社交网络图G i =(V i E i ),V i 表示时刻t i 的社交网络图G i 的节点集合,E i 表示时刻t i 的社交网络图G i 的边集合,然后获得时刻t i 的社交网络图G i 与上一时刻t i-1的社交网络图G i-1相比发生变化的节点集合,即增量节点集合VC i
具体的,所述步骤C中,社交网络在时刻t i 的增量节点集合VC i ,定义为节点集合(V i+V i-)以及与边集合(E i+E i-)相关联的节点集合的并集,定义如下:
VC i = V i+V i-∪{ E i+相关联节点}∪{ E i-相关联节点}
其中t i 时刻网络快照与t i-1时刻网络快照对比,V i+代表增加节点的集合,V i-代表减少节点的集合,E i+代表增加边的集合,E i-代表减少边的集合,定义如下:
Figure 622089DEST_PATH_IMAGE018
E i+相关联节点表示由属于E i+的边的端点构成的节点集合,E i-相关联节点表示由属于E i-的边的端点构成的节点集合。
步骤D:根据所述增量节点集合VC i ,计算增量节点占节点总数的比例,即增量节点比例。
具体的,所述步骤D中,社交网络在时刻t i 的增量节点比例
Figure 982270DEST_PATH_IMAGE020
定义为时刻t i 增量节点集合VC i 的基数与时刻t i 节点集合V i  的基数的比值,计算公式为:
Figure 630289DEST_PATH_IMAGE022
步骤E:根据所述增量节点比例,若增量节点比例大于设定阈值,则对社交网络图G i 中所有的节点重新进行社区划分,若增量节点比例小于设定阈值,则社交网络图G i 中不属于增量节点集合的节点维持原有的标签不变,保持原来的社区归属,仅对属于增量节点集合的节点进行社区划分,更新增量节点集合中节点的社区标签;社区划分结束后,根据每个节点所拥有的社区标签,将拥有相同标签的节点归属到同一社区,获得社交网络在时刻t i 的社区结构。
具体的,所述步骤E中,若增量节点比例大于设定阈值,则采用所述静态标签传播方法对社交网络图G i 中所有的节点重新进行社区划分,若增量节点比例小于指定阈值,则按以下步骤进行社区划分:
步骤E1:如果时刻t i 的社交网络中的节点在增量节点集合VC i 中,则分配新标签,如果不在增量节点集合VC i 中,则其标签与时刻t i-1的标签保持一致;
步骤E2:对于在增量节点集合VC i 中的节点,按照所述标签更新规则进行迭代更新;
步骤E3:当满足迭代终止条件,即当所有节点不再发生标签更新或达到规定迭代次数时,结束迭代。
本发明所述社交网络中动态社区检测方法,基于增量分析的思想,合理地利用动态社会网络在相邻时段的社区结构变化缓慢的特性, 首先对初始时刻的社交网络图进行社区划分,对社交网络的后续某个时间片(时刻)的快照,则通过与上一时刻快照的对比,找出增量节点集合;计算增量节点所占比例,如果增量节点比例超出指定阈值,对完整的快照网络进行社区划分,反之仅对增量节点集合进行社区划分,获得社交网络的某个时刻快照的社区结构。所述方法无需社区数目的先验知识,并对网络结构自适应,对网络突变情况也有很好的处理结果,可有效的挖掘社交网络中的社区结构,可应用于目标群体挖掘、精确营销等领域。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (8)

1.一种社交网络中的动态社区检测方法,其特征在于,所述方法包括以下步骤:
步骤A:获取社交网络一时刻t i-1的快照数据,作为初始的社交网络快照,并构造以社交网络用户为节点、用户关系为边的社交网络图G i-1=(V i-1E i-1),V i-1表示时刻t i-1的社交网络图G i-1的节点集合,E i-1表示时刻t i-1的社交网络图G i-1的边集合;
步骤B:对于时刻t i-1的社交网络图G i-1,进行社区划分,获得社交网络在时刻t i-1的社区结构;
步骤C:顺序获取社交网络下一时刻t i 的快照数据,构造社交网络图G i =(V i E i ),V i 表示时刻t i 的社交网络图G i 的节点集合,E i 表示时刻t i 的社交网络图G i 的边集合,然后获得时刻t i 的社交网络图G i 与上一时刻t i-1的社交网络图G i-1相比发生变化的节点集合,即增量节点集合VC i
步骤D:根据所述增量节点集合VC i ,计算增量节点占节点总数的比例,即增量节点比例;
步骤E:根据所述增量节点比例,若增量节点比例大于设定阈值,则对社交网络图G i 中所有的节点重新进行社区划分,若增量节点比例小于设定阈值,则社交网络图G i 中不属于增量节点集合的节点维持原有的标签不变,保持原来的社区归属,仅对属于增量节点集合的节点进行社区划分,更新增量节点集合中节点的社区标签;社区划分结束后,根据每个节点所拥有的社区标签,将拥有相同标签的节点归属到同一社区,获得社交网络在时刻t i 的社区结构。
2.根据权利要求1所述的一种社交网络中的动态社区检测方法,其特征在于,所述步骤B中,使用静态标签传播方法进行社区划分,具体包括以下步骤:
步骤B1:根据社交网络图,通过密度聚类方法进行节点标签初始化,为社交网络图中的每个节点分配一个标签;
步骤B2:根据标签更新规则,对社交网络图中的每个节点进行标签更新,反复迭代,直到满足迭代终止条件;
步骤B3:根据迭代终止时节点所分配的标签,将具有相同标签的节点归属到同一社区,输出社区结构。
3.根据权利要求2所述的一种社交网络中的动态社区检测方法,其特征在于,所述步骤B1中,采用基于相似度的密度聚类方法为节点分配标签,以增强后续标签传播过程的稳定性,具体包括以下步骤:
步骤B11:遍历社交网络中的每个节点,将所有节点设为未分配标签状态;
步骤B12:核心节点选择与核心区域扩展:遍历社交网络图中的每个节点,如果节点v是未分配标签状态,且符合核心节点定义,产生一个新的标签分配给节点v并对节点v进行扩展;将节点v的标签赋予所有满足与节点v是直接可达关系的节点,并将这些满足与节点v是直接可达关系的节点加入到一个初始为空的队列中,再遍历队列中的节点,从这些节点出发进行扩展,赋予和节点v相同的标签,从而得到核心区域;如果节点v是未分配标签状态,且不符合核心节点定义,将节点v标记为孤立节点;
步骤B13:孤立节点处理:为标记为孤立节点的节点分配新的社区标签。
4.根据权利要求3所述的一种社交网络中的动态社区检测方法,其特征在于,对社交网络图G i-1=(V i-1E i-1)进行标签初始化过程中,节点v是核心节点的充分必要条件是:节点vε邻居节点集合N ε (v)的基数大于等于预定义的最少ε邻居节点个数k,定义如下:
其中,节点vε邻居节点集合N ε (v)为节点v的节点结构集合Γ(v)中,与节点v相似度大于等于预定义的最小相似度ε的节点子集,定义如下:
Figure 2013107254019100001DEST_PATH_IMAGE004
其中,节点v的节点结构集合Γ(v)定义为节点v与节点v的邻居节点集合Neighbor(ν)的并集,定义如下:
Figure 2013107254019100001DEST_PATH_IMAGE006
其中,节点ν的邻居节点集合Neighbor(ν)定义为社交网络中与节点ν有边相连的所有节点集合:
 
节点相似度
Figure 2013107254019100001DEST_PATH_IMAGE010
定义为节点ν和节点u的结构集合的交集基数除以并集的基数:
Figure 2013107254019100001DEST_PATH_IMAGE012
任意两个节点ν和节点u之间为直接可达关系的充分必要条件是:节点ν是核心节点,且节点u属于节点νε邻居节点集合,定义如下:
Figure 2013107254019100001DEST_PATH_IMAGE014
直接可达关系的规则用于将核心节点扩展为初始社区。
5.根据权利要求4所述的一种社交网络中的动态社区检测方法,其特征在于,所述步骤B2中,所述标签更新规则如下:计算节点ν与其每个邻居节点的节点相似度,并根据节点相似度计算其接收邻居节点u传递的标签label(u)=l i 的概率,并根据计算得到的概率,采用轮盘赌方式更新节点ν的标签;所述轮盘赌方式中选择邻居节点u的标签label(u)=l i 的概率计算公式定义为:
Figure 2013107254019100001DEST_PATH_IMAGE016
其中
Figure 298781DEST_PATH_IMAGE010
为节点ν和节点u的节点相似度。
6.根据权利要求5所述的一种社交网络中的动态社区检测方法,其特征在于,所述步骤C中,社交网络在时刻t i 的增量节点集合VC i ,定义为节点集合(V i+V i-)以及与边集合(E i+E i-)相关联的节点集合的并集,定义如下:
VC i = V i+V i-∪{ E i+相关联节点}∪{ E i-相关联节点}
其中t i 时刻网络快照与t i-1时刻网络快照对比,V i+代表增加节点的集合,V i-代表减少节点的集合,E i+代表增加边的集合,E i-代表减少边的集合,定义如下:
Figure 2013107254019100001DEST_PATH_IMAGE018
E i+相关联节点表示由属于E i+的边的端点构成的节点集合,E i-相关联节点表示由属于E i-的边的端点构成的节点集合。
7.根据权利要求6所述的一种社交网络中的动态社区检测方法,其特征在于,所述步骤D中,社交网络在时刻t i 的增量节点比例定义为时刻t i 增量节点集合VC i 的基数与时刻t i 节点集合V i  的基数的比值,计算公式为:
Figure 2013107254019100001DEST_PATH_IMAGE022
8.根据权利要求7所述的一种社交网络中的动态社区检测方法,其特征在于,所述步骤E中,若增量节点比例大于设定阈值,则采用所述静态标签传播方法对社交网络图G i 中所有的节点重新进行社区划分,若增量节点比例小于指定阈值,则按以下步骤进行社区划分:
步骤E1:如果时刻t i 的社交网络中的节点在增量节点集合VC i 中,则分配新标签,如果不在增量节点集合VC i 中,则其标签与时刻t i-1的标签保持一致;
步骤E2:对于在增量节点集合VC i 中的节点,按照所述标签更新规则进行迭代更新;
步骤E3:当满足迭代终止条件,即当所有节点不再发生标签更新或达到规定迭代次数时,结束迭代。
CN201310725401.9A 2013-12-25 2013-12-25 一种社交网络中的动态社区检测方法 Expired - Fee Related CN103678671B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310725401.9A CN103678671B (zh) 2013-12-25 2013-12-25 一种社交网络中的动态社区检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310725401.9A CN103678671B (zh) 2013-12-25 2013-12-25 一种社交网络中的动态社区检测方法

Publications (2)

Publication Number Publication Date
CN103678671A true CN103678671A (zh) 2014-03-26
CN103678671B CN103678671B (zh) 2016-10-05

Family

ID=50316215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310725401.9A Expired - Fee Related CN103678671B (zh) 2013-12-25 2013-12-25 一种社交网络中的动态社区检测方法

Country Status (1)

Country Link
CN (1) CN103678671B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105592405A (zh) * 2015-10-30 2016-05-18 东北大学 基于派系过滤和标签传播的移动通信用户群组构造方法
CN106027526A (zh) * 2016-05-23 2016-10-12 北京网康科技有限公司 一种追踪网络联通图中团体演化的方法及装置
CN106453096A (zh) * 2016-09-05 2017-02-22 北京邮电大学 一种动态网络社区发现方法及装置
CN106506183A (zh) * 2015-09-06 2017-03-15 国家计算机网络与信息安全管理中心 网络社区的发现方法及装置
CN107358535A (zh) * 2017-07-10 2017-11-17 深圳乐信软件技术有限公司 一种社区发现方法及装置
CN107369099A (zh) * 2017-06-28 2017-11-21 深圳源广安智能科技有限公司 一种面向社交网络的用户行为分析系统
CN107659467A (zh) * 2017-09-26 2018-02-02 云南大学 动态社交网络中基于联盟形成博弈的社区检测方法
CN108197186A (zh) * 2017-12-26 2018-06-22 北京航空航天大学 一种应用于社交网络中的动态图匹配查询方法
CN108293076A (zh) * 2015-11-18 2018-07-17 微软技术许可有限责任公司 网络端点间的媒体会话
CN109087209A (zh) * 2018-08-15 2018-12-25 阿里巴巴集团控股有限公司 社区动态调整方法、装置及服务器
CN109787970A (zh) * 2019-01-03 2019-05-21 阿里巴巴集团控股有限公司 一种识别风险对象的方法、装置及设备
CN110110154A (zh) * 2018-02-01 2019-08-09 腾讯科技(深圳)有限公司 一种图文件的处理方法、装置及存储介质
CN110392314A (zh) * 2018-04-18 2019-10-29 武汉斗鱼网络科技有限公司 直播间内容标签扩散算法、存储介质、电子设备及系统
CN110555052A (zh) * 2018-05-31 2019-12-10 杭州海康威视数字技术股份有限公司 一种关系网络建立方法、装置及设备
CN111177876A (zh) * 2019-12-25 2020-05-19 支付宝(杭州)信息技术有限公司 一种社区发现方法、装置及电子设备
CN111475736A (zh) * 2020-03-18 2020-07-31 华为技术有限公司 社区挖掘的方法、装置和服务器
CN111597664A (zh) * 2020-04-03 2020-08-28 厦门道唯思信息技术有限公司 一种社交网络布局方法、系统及其存储介质
CN112052940A (zh) * 2020-08-26 2020-12-08 西安电子科技大学 基于向量压缩与重构的社交网络特征动态提取方法
US10972510B2 (en) 2014-09-25 2021-04-06 Microsoft Technology Licensing, Llc Media session between network endpoints
CN115134248A (zh) * 2022-05-23 2022-09-30 奇安信科技集团股份有限公司 网络拓扑差异检测方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065200B (zh) * 2012-12-19 2016-09-28 中国科学院深圳先进技术研究院 动态社区发现及追踪系统及其方法

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10972510B2 (en) 2014-09-25 2021-04-06 Microsoft Technology Licensing, Llc Media session between network endpoints
CN106506183A (zh) * 2015-09-06 2017-03-15 国家计算机网络与信息安全管理中心 网络社区的发现方法及装置
CN105592405B (zh) * 2015-10-30 2018-10-23 东北大学 基于派系过滤和标签传播的移动通信用户群组构造方法
CN105592405A (zh) * 2015-10-30 2016-05-18 东北大学 基于派系过滤和标签传播的移动通信用户群组构造方法
CN108293076A (zh) * 2015-11-18 2018-07-17 微软技术许可有限责任公司 网络端点间的媒体会话
CN108293076B (zh) * 2015-11-18 2021-06-01 微软技术许可有限责任公司 用于网络端点间的媒体会话的方法和装置
CN106027526A (zh) * 2016-05-23 2016-10-12 北京网康科技有限公司 一种追踪网络联通图中团体演化的方法及装置
CN106453096A (zh) * 2016-09-05 2017-02-22 北京邮电大学 一种动态网络社区发现方法及装置
CN106453096B (zh) * 2016-09-05 2019-06-14 北京邮电大学 一种动态网络社区发现方法及装置
CN107369099A (zh) * 2017-06-28 2017-11-21 深圳源广安智能科技有限公司 一种面向社交网络的用户行为分析系统
CN107369099B (zh) * 2017-06-28 2021-01-22 江苏云机汇软件科技有限公司 一种面向社交网络的用户行为分析系统
CN107358535A (zh) * 2017-07-10 2017-11-17 深圳乐信软件技术有限公司 一种社区发现方法及装置
CN107659467A (zh) * 2017-09-26 2018-02-02 云南大学 动态社交网络中基于联盟形成博弈的社区检测方法
CN107659467B (zh) * 2017-09-26 2020-03-17 云南大学 动态社交网络中基于联盟形成博弈的社区检测方法
CN108197186A (zh) * 2017-12-26 2018-06-22 北京航空航天大学 一种应用于社交网络中的动态图匹配查询方法
CN108197186B (zh) * 2017-12-26 2021-11-12 北京航空航天大学 一种应用于社交网络中的动态图匹配查询方法
CN110110154A (zh) * 2018-02-01 2019-08-09 腾讯科技(深圳)有限公司 一种图文件的处理方法、装置及存储介质
CN110110154B (zh) * 2018-02-01 2023-07-11 腾讯科技(深圳)有限公司 一种图文件的处理方法、装置及存储介质
CN110392314A (zh) * 2018-04-18 2019-10-29 武汉斗鱼网络科技有限公司 直播间内容标签扩散算法、存储介质、电子设备及系统
CN110392314B (zh) * 2018-04-18 2021-10-15 武汉斗鱼网络科技有限公司 直播间内容标签扩散方法、存储介质、电子设备及系统
CN110555052A (zh) * 2018-05-31 2019-12-10 杭州海康威视数字技术股份有限公司 一种关系网络建立方法、装置及设备
CN109087209B (zh) * 2018-08-15 2022-03-29 创新先进技术有限公司 社区动态调整方法、装置及服务器
CN109087209A (zh) * 2018-08-15 2018-12-25 阿里巴巴集团控股有限公司 社区动态调整方法、装置及服务器
CN109787970A (zh) * 2019-01-03 2019-05-21 阿里巴巴集团控股有限公司 一种识别风险对象的方法、装置及设备
CN111177876A (zh) * 2019-12-25 2020-05-19 支付宝(杭州)信息技术有限公司 一种社区发现方法、装置及电子设备
CN111475736A (zh) * 2020-03-18 2020-07-31 华为技术有限公司 社区挖掘的方法、装置和服务器
CN111597664A (zh) * 2020-04-03 2020-08-28 厦门道唯思信息技术有限公司 一种社交网络布局方法、系统及其存储介质
CN111597664B (zh) * 2020-04-03 2021-12-31 厦门道唯思信息技术有限公司 一种社交网络布局方法、系统及其存储介质
CN112052940A (zh) * 2020-08-26 2020-12-08 西安电子科技大学 基于向量压缩与重构的社交网络特征动态提取方法
CN112052940B (zh) * 2020-08-26 2023-11-24 西安电子科技大学 基于向量压缩与重构的社交网络特征动态提取方法
CN115134248A (zh) * 2022-05-23 2022-09-30 奇安信科技集团股份有限公司 网络拓扑差异检测方法及装置

Also Published As

Publication number Publication date
CN103678671B (zh) 2016-10-05

Similar Documents

Publication Publication Date Title
CN103678671A (zh) 一种社交网络中的动态社区检测方法
Wang et al. Review on community detection algorithms in social networks
CN104346481B (zh) 一种基于动态同步模型的社区检测方法
CN103729475A (zh) 一种社交网络中的多标签传播重叠社区发现方法
CN102810113B (zh) 一种针对复杂网络的混合型聚类方法
Luo et al. A parallel dbscan algorithm based on spark
CN103678669A (zh) 一种社交网络中的社区影响力评估系统及方法
CN103838863A (zh) 一种基于云计算平台的大数据聚类算法
CN103020163A (zh) 一种网络中基于节点相似度的网络社区划分方法
CN105335438A (zh) 一种基于局部最短回路的社会网络群体划分方法
Chang et al. Relative centrality and local community detection
CN105373601A (zh) 一种基于关键字词频特征的多模式匹配方法
CN103838804A (zh) 一种基于社团划分的社交网络用户兴趣关联规则挖掘方法
CN104700311B (zh) 一种社会网络中的邻域跟随社区发现方法
CN107133279A (zh) 一种基于云计算的智能推荐方法及系统
CN110287237B (zh) 一种基于社会网络结构分析社团数据挖掘方法
CN104462095A (zh) 一种查询语句公共部分的提取方法及装置
CN102902739B (zh) 云计算环境下面向不确定数据源的工作流视图构造方法
CN105159922B (zh) 基于标签传播算法面向寄递数据的并行化社团发现方法
Singh et al. A comparative analysis of distributed clustering algorithms: A survey
CN104268270A (zh) 基于MapReduce挖掘海量社交网络数据中三角形的方法
WO2022094888A1 (zh) 一种面向决策树的纵向联邦学习方法
Ke et al. Analysis on current research of supernetwork through knowledge mapping method
Moertini et al. Big Data Reduction Technique using Parallel Hierarchical Agglomerative Clustering.
Zhou Sports economic mining algorithm based on association analysis and big data model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161005

Termination date: 20191225