CN115169501A - 基于公共邻居节点聚类熵紧密相似性的社区检测方法 - Google Patents

基于公共邻居节点聚类熵紧密相似性的社区检测方法 Download PDF

Info

Publication number
CN115169501A
CN115169501A CN202210936871.9A CN202210936871A CN115169501A CN 115169501 A CN115169501 A CN 115169501A CN 202210936871 A CN202210936871 A CN 202210936871A CN 115169501 A CN115169501 A CN 115169501A
Authority
CN
China
Prior art keywords
node
community
nodes
network
neighbor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210936871.9A
Other languages
English (en)
Inventor
姜万昌
张晓茜
王圣达
郭健
刘丹妮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeast Electric Power University
Original Assignee
Northeast Dianli University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeast Dianli University filed Critical Northeast Dianli University
Priority to CN202210936871.9A priority Critical patent/CN115169501A/zh
Publication of CN115169501A publication Critical patent/CN115169501A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

基于公共邻居节点聚类熵紧密相似性的社区检测方法,该方法涉及复杂网络技术领域,解决现有基于相似性的社区检测方法没有考虑不同节点对之间公共邻居节点的差异造成节点对无法区分、社区检测低效的问题,本发明通过初始化网络G,定义公共邻居节点聚类熵,计算公共邻居节点聚类熵的紧密相似性,根据紧密相似节点集获得最紧密相似的节点,创建初始社区并对所形成的初始社区进行合并优化更新获得最终社区等步骤实现。本发明方法在真实网络中检测到的社区结构更加接近实际社区结构,同时社区结构也具有较高的模块度值。

Description

基于公共邻居节点聚类熵紧密相似性的社区检测方法
技术领域
本发明涉及复杂网络技术领域,具体涉及一种基于公共邻居节点聚类熵紧密相似性的社区检测方法。
背景技术
复杂网络中具有相似属性的节点往往很容易形成组,具体表现为社区或模块结构。而社区检测可以帮助我们理解复杂网络的功能,并预测复杂网络的行为。目前,社区检测方法在社交网络推荐、生物蛋白整合、网络民意分析等领域得到了广泛的应用。根据检测方法思想的不同,社区检测方法可以分为基于图分割、基于标签传播和基于层次聚类的方法。
图分割方法通常将节点划分为一定数量和大小的社区,使社区内部有尽可能多的边。但是,划分社区的数量必须提前确定,并且也不能保证得到最优结果。标签传播类方法主要利用每个节点的邻居信息更新标签,按标签信息检测社区。然而,这类方法对标签更新规则非常敏感,其结果是随机且不稳定的。层次聚类方法通过分裂和聚合两种策略检测社区,由于聚类的数量和规模无需提前确定且不会产生巨型社区,因此层次聚类方法得到了许多研究者的广泛关注。
在层次聚类方法中,从相似性的角度进行聚合也是一种重要的研究方法。通过创建多个初始群落,根据不同的相似度计算方法对它们进行合并。其中,公共邻居节点的数量通常被用来度量节点之间的相似性。但是,由于部分节点对具有相同的公共邻居节点,导致节点对无法区分,社区检测结果存在不稳定、不准确的问题。
发明内容
本发明为解决现有基于相似性的社区检测方法没有考虑不同节点对之间公共邻居节点的差异造成节点对无法区分、社区检测低效的问题,提供一种基于公共邻居节点聚类熵紧密相似性的社区检测方法。
步骤一、初始化网络G=(V,E);V={vi|i=1,2,...,n}为网络G的n个节点的集合,E={eij|i=1,2,...,n,j=1,2,...,n,i≠j}为网络G的m条边的集合,这里eij=(vi,vj)是从节点vi到节点vj的边,其中eij=eji
步骤二、定义公共邻居节点聚类熵CEz
对于网络G中任意两个节点vi和vj,如果节点vi和vj之间存在一条边eij,则vi和vj的节点对为<vi,vj>,即节点vi和vj互为一阶邻居节点vi∈N(vj),vj∈N(vi),其中,N(vi)和N(vj)分别表示节点vi和vj的所有一阶邻居节点的集合;
设定节点
Figure BDA0003783832950000021
为节点vi和vj的一阶邻居节点,即
Figure BDA0003783832950000022
则节点
Figure BDA0003783832950000023
为节点对<vi,vj>的公共邻居节点,CN(vi,vj)为节点对<vi,vj>的公共邻居节点集;对于节点对<vi,vj>的公共邻居节点集CN(vi,vj)中的每一个公共邻居节点
Figure BDA0003783832950000024
使用公共邻居节点
Figure BDA0003783832950000025
的聚类系数来衡量公共邻居节点
Figure BDA0003783832950000026
对它的一阶邻居节点的紧密度,定义公共邻居节点聚类熵CEz为:
CEz=-CCz×log2CCz
式中,
Figure BDA0003783832950000027
为公共邻居节点
Figure BDA0003783832950000028
的聚类系数;
Figure BDA0003783832950000029
表示公共邻居节点
Figure BDA00037838329500000210
的一阶邻居节点之间的所有连边的集合;
Figure BDA00037838329500000211
为公共邻居节点
Figure BDA00037838329500000212
的度;
式中,
Figure BDA00037838329500000213
为公共邻居节点
Figure BDA00037838329500000214
的所有一阶邻居节点的集合;epq为节点vp和vq组成的边;
步骤三、定义基于公共邻居节点聚类熵的紧密相似性sim(vi,vj);
所述节点对<vi,vj>的紧密相似性通过节点vi和vj之间所有公共邻居的公共邻居节点聚类熵计算,定义基于公共邻居节点聚类熵CEz的紧密相似性为:
Figure BDA0003783832950000031
式中,d(vi)为节点vi的度,当节点对<vi,vj>不存在公共邻居节点时,即|CN(vi,vj)|=0,根据节点vi的度d(vi)计算节点对<vi,vj>的紧密相似性;
步骤四、根据步骤三获得的基于公共邻居节点聚类熵的紧密相似性sim(vi,vj),获得节点vi的紧密相似节点集CSNS(vi),在CSNS(vi)中依据节点的领导力选出节点vi最紧密相似的节点vj,记为
Figure BDA0003783832950000032
步骤五、从网络G中具有最大节点领导力的节点开始,依次为网络G中的节点识别其紧密相似节点集,在紧密相似节点集中选出节点的最紧密相似节点,将网络G中的节点与其最紧密相似节点合并创建初始社区Cinitial={C1,C2,...,Cn};
步骤六、对所形成的初始社区Cinitial进行更新获得最终社区C。
本发明的有益效果:
本发明所提出的方法在计算节点相似性时考虑公共邻居节点与其所有一阶邻居节点的紧密度信息,通过定义公共邻居节点聚类熵设计了一种紧密相似性度量有效计算节点对之间的相似性。使用设计的紧密相似性度量和节点领导力形成初始社区,然后,基于模块度优化的思想,通过两层次的合并来准确、稳定地检测最终社区。
将本发明基于公共邻居节点聚类熵紧密相似性的社区检测方法和其他社区检测方法所得到的评价指标NMI和Q值进行对比,可以看到,本发明方法在真实网络中检测到的社区结构更加接近实际社区结构,同时社区结构也具有较高的模块度值。
附图说明
图1为本发明所述的基于公共邻居节点聚类熵紧密相似性的社区检测方法的流程图。
图2为空手道网络结构的示意图。
图3为空手道网络的初始社区示意图。
图4为空手道网络的社区示意图。
具体实施方式
具体实施方式一、结合图1至图4说明本实施方式,基于公共邻居节点聚类熵紧密相似性的社区检测方法,其实现步骤包括如下:
一、初始化网络G=(V,E);V={vi|i=1,2,...,n}为网络G的n个节点的集合,E={eij|i=1,2,...,n,j=1,2,...,n,i≠j}为网络G的m条边的集合,这里eij=(vi,vj)是从节点vi到节点vj的边,其中eij=eji;获取空手道网络G=(V,E),其中,V为网络G的34个节点的集合,E为网络G的78条边的集合;空手道网络结构如图2所示;
二、结合节点的聚类系数和熵模型定义公共邻居节点聚类熵CEz
对于网络G中任意两个节点vi和vj,如果节点vi和vj之间存在一条边eij,那么vi和vj叫做节点对<vi,vj>,即节点vi是节点vj的一阶邻居节点vi∈N(vj),节点vj也是节点vi的一阶邻居节点vj∈N(vi),其中,N(vi)和N(vj)分别表示节点vi和vj的所有一阶邻居节点的集合;节点
Figure BDA0003783832950000041
是节点vi和vj的一阶邻居节点,即
Figure BDA0003783832950000042
那么节点
Figure BDA0003783832950000043
叫做节点对<vi,vj>的公共邻居节点,CN(vi,vj)是节点对<vi,vj>的公共邻居节点集;对于节点对<vi,vj>的公共邻居节点集CN(vi,vj)中的每一个公共邻居节点
Figure BDA0003783832950000044
使用
Figure BDA0003783832950000045
的聚类系数通过熵模型来评估
Figure BDA0003783832950000046
对它的一阶邻居节点的紧密度,定义公共邻居节点聚类熵CEz为:CEz=-CCz×log2CCz
式中,
Figure BDA0003783832950000047
表示节点
Figure BDA0003783832950000048
的聚类系数;
其中,
Figure BDA0003783832950000049
表示
Figure BDA00037838329500000410
的一阶邻居节点之间的所有连边的集合,
Figure BDA0003783832950000051
表示节点
Figure BDA0003783832950000052
的度;
其中,
Figure BDA0003783832950000053
表示公共邻居节点
Figure BDA0003783832950000054
的所有一阶邻居节点的集合;epq表示由节点vp和vq组成的边;
三、利用公共邻居节点聚类熵CEz设计基于公共邻居节点聚类熵的紧密相似性sim(vi,vj);
公共邻居节点聚类熵CEz表示公共邻居节点
Figure BDA0003783832950000055
与其所有一阶邻居节点的紧密程度,当节点对<vi,vj>具有公共邻居节点时,则满足节点对<vi,vj>的公共邻居节点集CN(vi,vj)中的元素数目大于等于1,即|CN(vi,vj)|≥1;节点对<vi,vj>的紧密相似性可以通过节点vi和vj之间所有公共邻居的公共邻居节点聚类熵来计算,则定义紧密相似性为:
Figure BDA0003783832950000056
式中,CEz表示公共邻居节点
Figure BDA0003783832950000057
的公共邻居节点聚类熵;d(vi)表示节点vi的度;
当节点对<vi,vj>没有公共邻居节点时,则满足节点对<vi,vj>的公共邻居节点集CN(vi,vj)中的元素数目等于0,即|CN(vi,vj)|=0;节点对<vi,vj>的紧密相似性只通过节点vi的度来计算,则定义紧密相似性为:
Figure BDA0003783832950000058
式中,d(vi)表示节点vi的度;
则定义基于公共邻居节点聚类熵的紧密相似性sim(vi,vj)为:
Figure BDA0003783832950000061
四、根据步骤三获得的基于公共邻居节点聚类熵的紧密相似性sim(vi,vj),获得节点vi的紧密相似节点集CSNS(vi),在CSNS(vi)中依据节点的领导力选出节点vi最紧密相似的节点vj;具体为:
步骤四一、紧密相似节点集是在节点vi的所有一阶邻居节点中,具有最大紧密相似性的节点所构成的集合,定义紧密相似节点集为:
Figure BDA0003783832950000062
式中,N(vi)={vj|eij∈E}是节点vi的所有一阶邻居节点的集合;
节点领导力可以评估节点vi对其一阶邻居节点的吸引力,因此节点领导力Li计算如下:
Figure BDA0003783832950000063
步骤四二、在节点vi的紧密相似节点集CSNS(vi)中,vi的一阶邻居节点vj的领导力Lj计算如下:
Figure BDA0003783832950000064
选择具有最大节点领导力的节点作为vi最紧密相似的节点vj,记为
Figure BDA0003783832950000065
五、从网络G中具有最大节点领导力的节点开始,依次为网络G中的节点识别其紧密相似节点集,在紧密相似节点集中选出节点的最紧密相似节点,将网络G中的节点与其最紧密相似节点合并创建初始社区Cinitial={C1,C2,...,Cn};具体过程为:
步骤五一、计算空手道网络G中所有节点的节点领导力并按节点领导力值降序排列,排序后G中节点的集合表示为V'={v1,v34,...,v23};如表1所示;
表1
节点 节点领导力值 节点 节点领导力值
1 68 8 0
34 64 10 0
33 38 12 0
3 32 13 0
2 27 14 0
4 13 17 0
6 10 18 0
7 10 20 0
24 9 22 0
32 9 29 0
9 4 27 0
5 3 31 0
11 3 15 0
26 3 16 0
25 3 19 0
30 3 21 0
28 2 23 0
步骤五二、从网络G中具有最大节点领导力的节点开始处理每个节点,使用设计的紧密相似性度量,识别节点的紧密相似节点集,并将紧密相似节点集中具有最大领导力的节点作为节点的最紧密相似节点;对于集合V'中已经作为某一节点的最紧密相似节点的节点,不再为其识别最紧密相似节点构造社区;将空手道网络G中节点按节点领导力降序排列并识别其最紧密相似节点,如表2所示;
表2
Figure BDA0003783832950000071
Figure BDA0003783832950000081
步骤五三、如果节点的最紧密相似节点已经属于某个社区,则将此节点添加到其最紧密相似节点所在的社区,否则,将此节点与其最紧密相似节点合并以创建新的社区;
依次访问和处理G中节点排序后的集合V'中所有节点,直到每个节点属于一个社区从而形成初始社区Cinitial;为空手道网络G构建的初始社区如图3所示,图示浅灰色部分为初始社区的第一个子社区,深灰色部分为初始社区的第二个子社区;
六、对所形成的初始社区Cinitial,使用两层次的合并优化更新获得最终社区C;具体过程为:
步骤六一、计算如图3所示空手道网络G初始社区Cinitial的模块度作为当前模块度Qcur。根据模块度的定义:
Figure BDA0003783832950000082
式中,m为整个网络G的边数,Aij为网络G的邻接矩阵,Ci和Cj为节点vi和vj所在的社区,如果vi和vj在同一个社区,那么δ(Ci,Cj)=1,否则,δ(Ci,Cj)=0;由上式计算出空手道网络G的Qcur=0.371;
步骤六二、在第一层次合并中,将Cinitial中的每两个社区C1,C2合并为临时社区Ctem,并计算临时模块度Qtem;空手道网络G的Cinitial中仅包含两个子社区,因此在第一层次合并中将两个子社区合并作为临时社区Ctem,计算临时模块度为Ctem=0;
步骤六三、在第二层次合并中,如果最大临时模块度maxQtem>Qcur,则将maxQtem及其所对应的社区Ctem更新为Qcur和当前社区Ccur;由于最大临时模块度maxQtem=0并不符合第二层次合并的条件,因此无需进行第二层次合并;
重复步骤六二和步骤六三的两层次合并,直到maxQtem≤Qcur,将Qcur所对应的社区作为检测到的最终社区C;此时maxQtem=0,Qcur=0.371已满足maxQtem≤Qcur,因此得到最终社区C;采用本实施方式对空手道网络G检测到的最终社区如图4所示,整个网络G被划分为两个社区,网络左边浅灰色部分为第一个社区,右边深灰色部分为第二个社区。
具体实施方式二、本实施方式为具体实施方式一所述的基于公共邻居节点聚类熵紧密相似性的社区检测方法的应用实施例:
选取空手道网络(Karate)、游戏地图网络(Riskmap)、海豚网络(Dolphin)、足球网路(Football)、医生网络(Physicians)、邮件网络(Email)六个网络,使用标签传播方法LPA、基于简化树方法STCD、局部节点相似性方法NSA对其进行社区检测,计算相应评价指标NMI和Q值,与基于公共邻居节点聚类熵紧密相似性的社区检测方法(Community Detectionusing Closeness Similarity based on CommonNeighborNode Clustering Entropy,简称CSCD)的NMI和Q值进行对比。
表3给出了6个真实网络的基本信息。
表3
网络 节点数 边数 度相关性 聚类系数
Karate 34 78 -0.48 0.57
Riskmap 42 83 0.20 0.52
Dolphin 62 159 -0.04 0.26
Football 115 613 0.16 0.40
Physicians 241 1098 -0.16 0.31
Email 1133 5451 0.08 0.22
根据真实网络的度相关性,将真实网络分为两类,即异配网络(Karate网络,Dolphin网络,Physicians网络)和同配网络(Risk map网络,Football网络,Email网络);其中,Karate网络、Dolphin网络、Risk map网络、Football网络是具有真实社区结构的网络,Physicians网络和Email网络是不具有真实社区结构的网络;表4给出了本发明方法和其他社区检测方法在六个真实网络的NMI和Q值比较结果。
表4
Figure BDA0003783832950000091
Figure BDA0003783832950000101
如表4的灰色部分所示,CSCD方法在Karate网络和Dolphin网络上获得了最优NMI值,即CSCD方法检测到的社区更接近网络的真实社区结构,并且CSCD方法在Dolphin网络上取得了最佳的Q值。虽然CSCD方法在Karate网络上获得的Q值低于表现最优的NSA方法,但CSCD方法检测到的社区结果与真实社区结构完全一致。CSCD方法在没有真实社区的Physicians网络上获得了最优Q值,与Q值次优的NSA方法相比,仍提高了1.80%。
CSCD方法检测到的社区结构在Risk map网络中NMI值最高,NMI值比表现次优的NSA方法提高了8.25%。此外,与其他三种方法的Q值相比,CSCD方法的Q值也取得了次优结果。显然,CSCD方法在Risk map网络上的检测结果不仅最接近真实社区结构,而且能够检测到高质量的社区结构。CSCD方法的NMI和Q值在Football网络上均获得了排名第二的结果。对于Email网络,NSA方法取得了最优的Q值,CSCD方法的Q值仅比NSA方法低0.2%。
以上比较结果表明,CSCD方法在整体上优于其他对比方法,尤其在异配网络上能够检测出合理、高质量的社区。通过在真实网络上的实验,与其他三种方法的NMI和Q值的最优值相比,NMI值平均提高了5.94%,在没有真实社区结构的真实网络上,Q值平均提高了0.80%。特别是在具有真实社区结构的网络上,CSCD方法可以准确地检测出潜在的社区。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (4)

1.基于公共邻居节点聚类熵紧密相似性的社区检测方法,其特征是:该方法由以下步骤实现:
步骤一、初始化网络G=(V,E);V={vi|i=1,2,...,n}为网络G的n个节点的集合,E={eij|i=1,2,...,n,j=1,2,...,n,i≠j}为网络G的m条边的集合,这里eij=(vi,vj)是从节点vi到节点vj的边,其中eij=eji
步骤二、定义公共邻居节点聚类熵CEz
对于网络G中任意两个节点vi和vj,如果节点vi和vj之间存在一条边eij,则vi和vj的节点对为<vi,vj>,即节点vi和vj互为一阶邻居节点vi∈N(vj),vj∈N(vi),其中,N(vi)和N(vj)分别表示节点vi和vj的所有一阶邻居节点的集合;
设定节点
Figure FDA0003783832940000011
为节点vi和vj的一阶邻居节点,即
Figure FDA0003783832940000012
则节点
Figure FDA0003783832940000013
为节点对<vi,vj>的公共邻居节点,CN(vi,vj)为节点对<vi,vj>的公共邻居节点集;对于节点对<vi,vj>的公共邻居节点集CN(vi,vj)中的每一个公共邻居节点
Figure FDA0003783832940000014
使用公共邻居节点
Figure FDA0003783832940000015
的聚类系数来衡量公共邻居节点
Figure FDA0003783832940000016
对它的一阶邻居节点的紧密度,定义公共邻居节点聚类熵CEz为:
CEz=-CCz×log2CCz
式中,
Figure FDA0003783832940000017
为公共邻居节点
Figure FDA0003783832940000018
的聚类系数;
Figure FDA0003783832940000019
表示公共邻居节点
Figure FDA00037838329400000110
的一阶邻居节点之间的所有连边的集合;
Figure FDA00037838329400000111
为公共邻居节点
Figure FDA00037838329400000112
的度;
式中,
Figure FDA00037838329400000113
为公共邻居节点
Figure FDA00037838329400000114
的所有一阶邻居节点的集合;epq为节点vp和vq组成的边;
步骤三、定义基于公共邻居节点聚类熵的紧密相似性sim(vi,vj);
所述节点对<vi,vj>的紧密相似性通过节点vi和vj之间所有公共邻居的公共邻居节点聚类熵计算,定义基于公共邻居节点聚类熵CEz的紧密相似性为:
Figure FDA0003783832940000021
式中,d(vi)为节点vi的度,当节点对<vi,vj>不存在公共邻居节点时,即|CN(vi,vj)|=0,根据节点vi的度d(vi)计算节点对<vi,vj>的紧密相似性;
步骤四、根据步骤三获得的基于公共邻居节点聚类熵的紧密相似性sim(vi,vj),获得节点vi的紧密相似节点集CSNS(vi),在CSNS(vi)中依据节点的领导力选出节点vi最紧密相似的节点vj,记为
Figure FDA0003783832940000022
步骤五、从网络G中具有最大节点领导力的节点开始,依次为网络G中的节点识别其紧密相似节点集,在紧密相似节点集中选出节点的最紧密相似节点,将网络G中的节点与其最紧密相似节点合并创建初始社区Cinitial={C1,C2,...,Cn};
步骤六、对所形成的初始社区Cinitial进行更新获得最终社区C。
2.根据权利要求1所述的基于公共邻居节点聚类熵紧密相似性的社区检测方法,其特征在于:步骤四的具体过程为:
步骤四一、设定紧密相似节点集是在节点vi的所有一阶邻居节点中,具有最大紧密相似性的节点所构成的集合,定义紧密相似节点集为:
Figure FDA0003783832940000023
式中,N(vi)={vj|eij∈E}是节点vi的所有一阶邻居节点的集合;
步骤四二、在节点vi的紧密相似节点集CSNS(vi)中,节点vi的一阶邻居节点vj的领导力Lj计算如下:
Figure FDA0003783832940000031
选择具有最大节点领导力的节点作为vi最紧密相似的节点vj,记为
Figure FDA0003783832940000032
3.根据权利要求1所述的基于公共邻居节点聚类熵紧密相似性的社区检测方法,其特征在于:步骤五的具体过程为:
步骤五一、计算网络G中所有节点的节点领导力并按节点领导力值降序排列,网络G中节点排序后的集合为
Figure FDA0003783832940000033
步骤五二、从具有最大节点领导力的节点开始处理每个节点
Figure FDA0003783832940000034
采用紧密相似性度量,识别节点
Figure FDA0003783832940000035
的紧密相似节点集
Figure FDA0003783832940000036
并将
Figure FDA0003783832940000037
中具有最大领导力的节点作为节点
Figure FDA0003783832940000038
最紧密相似节点
Figure FDA0003783832940000039
步骤五三、如果节点
Figure FDA00037838329400000310
已经属于某个社区,则将节点
Figure FDA00037838329400000311
添加到节点
Figure FDA00037838329400000312
所在的社区,否则,将
Figure FDA00037838329400000313
Figure FDA00037838329400000314
合并以创建新的社区;
依次访问和处理G中节点排序后的集合V'中所有节点,直到每个节点属于一个社区从而形成初始社区Cinitial,对于V'中已经作为某一节点的最紧密相似的节点,则不再为其识别最紧密相似节点构造社区。
4.根据权利要求1所述的基于公共邻居节点聚类熵紧密相似性的社区检测方法,其特征在于:步骤六的具体过程为:
步骤六一、计算Cinitial的模块度作为当前模块度Qcur,根据模块度的定义:
Figure FDA00037838329400000315
式中,m为整个网络G的边数,Aij为网络G的邻接矩阵,Ci和Cj为节点vi和vj所在的社区,如果vi和vj在同一个社区,则δ(Ci,Cj)=1,否则,δ(Ci,Cj)=0;
步骤六二、在第一层次合并中,将Cinitial中的每两个社区Ci,Cj合并为临时社区Ctem,并计算临时模块度Qtem
步骤六三、在第二层次合并中,如果最大临时模块度max Qtem>Qcur,则将max Qtem及其所对应的社区Ctem更新为Qcur和当前社区Ccur
重复步骤六二和步骤六三的两层次合并,直到max Qtem≤Qcur,将Qcur所对应的社区作为检测到的最终社区C。
CN202210936871.9A 2022-08-05 2022-08-05 基于公共邻居节点聚类熵紧密相似性的社区检测方法 Pending CN115169501A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210936871.9A CN115169501A (zh) 2022-08-05 2022-08-05 基于公共邻居节点聚类熵紧密相似性的社区检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210936871.9A CN115169501A (zh) 2022-08-05 2022-08-05 基于公共邻居节点聚类熵紧密相似性的社区检测方法

Publications (1)

Publication Number Publication Date
CN115169501A true CN115169501A (zh) 2022-10-11

Family

ID=83478427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210936871.9A Pending CN115169501A (zh) 2022-08-05 2022-08-05 基于公共邻居节点聚类熵紧密相似性的社区检测方法

Country Status (1)

Country Link
CN (1) CN115169501A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116308860A (zh) * 2023-03-21 2023-06-23 东北电力大学 基于分配与分裂的动态社区检测方法
CN118096417A (zh) * 2024-04-28 2024-05-28 江西求是高等研究院 一种传播网络模式发掘方法、系统、计算机及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346481A (zh) * 2014-11-28 2015-02-11 西安电子科技大学 一种基于动态同步模型的社区检测方法
CN106934722A (zh) * 2017-02-24 2017-07-07 西安电子科技大学 基于k节点更新与相似度矩阵的多目标社区检测方法
CN107153713A (zh) * 2017-05-27 2017-09-12 合肥工业大学 社交网络中基于节点间相似性的重叠社区检测方法及系统
US20190179615A1 (en) * 2016-10-27 2019-06-13 Tencent Technology (Shenzhen) Company Limited Community discovery method, device, server and computer storage medium
CN112925991A (zh) * 2021-03-05 2021-06-08 安徽理工大学 社交网络中基于节点间相似度的社区检测方法
CN114202035A (zh) * 2021-12-16 2022-03-18 成都理工大学 一种多特征融合的大规模网络社区检测算法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346481A (zh) * 2014-11-28 2015-02-11 西安电子科技大学 一种基于动态同步模型的社区检测方法
US20190179615A1 (en) * 2016-10-27 2019-06-13 Tencent Technology (Shenzhen) Company Limited Community discovery method, device, server and computer storage medium
CN106934722A (zh) * 2017-02-24 2017-07-07 西安电子科技大学 基于k节点更新与相似度矩阵的多目标社区检测方法
CN107153713A (zh) * 2017-05-27 2017-09-12 合肥工业大学 社交网络中基于节点间相似性的重叠社区检测方法及系统
US20180341696A1 (en) * 2017-05-27 2018-11-29 Hefei University Of Technology Method and system for detecting overlapping communities based on similarity between nodes in social network
CN112925991A (zh) * 2021-03-05 2021-06-08 安徽理工大学 社交网络中基于节点间相似度的社区检测方法
CN114202035A (zh) * 2021-12-16 2022-03-18 成都理工大学 一种多特征融合的大规模网络社区检测算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘苗苗等: "基于共邻节点相似度的加权网络社区发现方法", 四川大学学报(自然科学版) *
熊正理等: "基于用户紧密度的在线社会网络社区发现算法", 计算机工程 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116308860A (zh) * 2023-03-21 2023-06-23 东北电力大学 基于分配与分裂的动态社区检测方法
CN116308860B (zh) * 2023-03-21 2024-01-12 东北电力大学 基于分配与分裂的动态社区检测方法
CN118096417A (zh) * 2024-04-28 2024-05-28 江西求是高等研究院 一种传播网络模式发掘方法、系统、计算机及存储介质

Similar Documents

Publication Publication Date Title
CN115169501A (zh) 基于公共邻居节点聚类熵紧密相似性的社区检测方法
CN103678671A (zh) 一种社交网络中的动态社区检测方法
CN110719106B (zh) 一种基于节点分类排序的社交网络图压缩方法及系统
CN113297429B (zh) 一种基于神经网络架构搜索的社交网络链路预测方法
CN110909173A (zh) 一种基于标签传播的非重叠社区发现方法
Sree et al. Identification of protein coding regions in genomic DNA using unsupervised FMACA based pattern classifier
CN102571431A (zh) 针对复杂网络的基于群思想改进的Fast-Newman聚类方法
CN104700311B (zh) 一种社会网络中的邻域跟随社区发现方法
He et al. Evolutionary community detection in social networks
CN115001983A (zh) 基于高阶聚类系数的网络结构差异性评估方法
CN114417177A (zh) 一种基于节点综合影响力的标签传播重叠社区发现方法
CN108400889A (zh) 一种基于局部最优化的社区发现方法
CN103164487A (zh) 一种基于密度与几何信息的聚类算法
CN111738514A (zh) 利用局部距离和节点秩优化函数的社交网络社区发现方法
CN113792802B (zh) 基于聚类系数的叠加随机游走重力模型链路预测方法
CN112347369B (zh) 基于网络表征的集成学习动态社会网络链路预测方法
CN112035545B (zh) 一种考虑非活跃节点和社区边界的竞争影响力最大化方法
CN110347933B (zh) 一种ego网络社交圈子识别方法
CN112131486A (zh) 一种基于图卷积神经网络和相似性的电商网络平台用户社区发现方法
CN114817653A (zh) 一种基于中心节点图卷积网络的无监督社区发现方法
CN110610205A (zh) 社交网络中的社区识别方法
CN111709846A (zh) 基于线图的局部社区发现算法
CN111444454A (zh) 一种基于谱方法的动态社团划分方法
CN111797281A (zh) 基于中心节点的二层相异性社区发现算法研究
CN116346712B (zh) 一种基于种子扩展和标签传播的社区发现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination