CN103400299A - 基于重叠点识别的网络重叠社团检测方法 - Google Patents

基于重叠点识别的网络重叠社团检测方法 Download PDF

Info

Publication number
CN103400299A
CN103400299A CN2013102728907A CN201310272890A CN103400299A CN 103400299 A CN103400299 A CN 103400299A CN 2013102728907 A CN2013102728907 A CN 2013102728907A CN 201310272890 A CN201310272890 A CN 201310272890A CN 103400299 A CN103400299 A CN 103400299A
Authority
CN
China
Prior art keywords
corporations
node
network
overlapping
cand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013102728907A
Other languages
English (en)
Other versions
CN103400299B (zh
Inventor
刘均
徐海鹏
董博
郑庆华
马天
贺欢
李冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Servyou Software Group Co., Ltd.
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201310272890.7A priority Critical patent/CN103400299B/zh
Publication of CN103400299A publication Critical patent/CN103400299A/zh
Application granted granted Critical
Publication of CN103400299B publication Critical patent/CN103400299B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于重叠点识别的网络重叠社团检测方法,其特征在于:第一步使用GN算法对网络进行社团划分,得到网络非重叠社团集合,并据此得出网络社团边界点集合,计算该集合中边界点的关联社团连接率,选取其中大于检测阈值的节点构建网络社团候选重叠点集合;第二步使用基于节点质量函数的重叠点判定规则识别重叠点,得到网络重叠社团集合;第三步计算第二步得到的重叠社团之间的社团重叠率,合并达到重叠阈值的社团。本发明在对网络进行重叠社团划分过程中综合考虑网络的全局特征和局部特征,增强了网络社团划分的合理性。

Description

基于重叠点识别的网络重叠社团检测方法
技术领域
本发明涉及在复杂网络领域对网络进行重叠社团划分的方法,具体涉及一种采用重叠点识别算法进而对网络进行重叠社团划分。
背景技术
真实世界中事物间的关系可以表示为网络,如人类关系网络、流行疾病传播网、生物网络等。这些网络中节点可以自然地聚集成一些节点簇,同一个簇的节点之间体现出了相似性,这种相似性在人类关系网络可能表示社团内个体具有共同的兴趣,在生物网络则可能表示社团内生物属于相同物种,网络的这种拓扑结构称为社团结构。社团结构作为网络的重要拓扑特性之一,在最近几年得到了学者们的广泛研究。已有对社团结构的研究大多关注于将网络划分为互不相交的社团集合;然而,现实的网络中的一些节点通常可以属于多个社团,例如人类关系网中一个人可能属于多个兴趣团体,因此社团之间是存在重叠现象的。针对网络重叠社团的发现方法,申请人通过查新,检索到1篇与本发明密切相关的发明专利:
一种复杂网络社团的发现方法,专利申请号:CN201010613184.0;该专利提出一种复杂网络社团的发现方法,该方法包括:步骤一:建立所需分析网络的邻接矩阵;步骤二:确定初始划分点的值;步骤三:计算网络中各节点的度;步骤四:选取节点的度数最高的K个节点作为初始划分点;步骤五:选取具体需要的划分点;步骤六:根据步骤五得到的最后的划分点,由计算机给出最后的社团发现结果。
上述网络社团发现方法的专利技术方案中,网络中的节点依据是否与所述的划分点相连被划分成不同的社团,因此该方法只考虑了网络的局部特征,忽略了网络全局特征对网络社团拓扑特性的影响;其次,该方法没有考虑社团之间的重叠现象。
发明内容
本发明的目的在于提出一种基于重叠点识别的网络重叠社团划分方法,该方法综合考虑了网络的局部和全局特征,并将社团之间重叠率达到合并阈值的社团进行合并,得到网络的重叠社团结构,进而揭示网络结构和功能之间的联系,例如在研究人类关系网络时,认为同一社团内的人具有相同的兴趣,处于社团之间重叠部分的人属于多个兴趣团体。
为达到以上目的,本发明是采取如下技术方案予以实现的:
一种基于重叠点识别的网络重叠社团检测方法,其特征在于,包括如下步骤:
(1)网络社团候选重叠点集合构建:首先,使用GN算法对网络进行社团划分,得到网络的非重叠社团集合,其次,搜索连接两个社团之间的边,社团之间边的顶点即社团的边界点,并据此求解出每个社团的初始边界点集合,对网络中各社团的初始边界点集合求并集,得到网络的社团初始边界点集合;再次,根据节点到关联社团的连接数与该节点在网络中度的比值;计算社团初始边界点集合中每个节点到其关联社团的连接率,并将连接率达到检测阈值的边界点加入初始候选重叠点集合;
(2)社团重叠点识别:提出基于节点质量函数重叠点判定规则,判定候选重叠点集合中的节点与节点潜在隶属社团(即边界点的关联社团中,社团连接率达到检测阈值的社团)的隶属关系,识别出重叠点,并将重叠点加入到满足重叠点判定规则的隶属社团中;将新产生的边界点到其关联社团的连接率达到检测阈值的节点加入候选重叠点集合;递归执行步骤(2),直到候选重叠点集合不包含满足重叠点判定规则的节点为止,得到网络的重叠社团集合
(3)网络重叠社团合并:对于步骤(2)得到的网络社团集合,计算每两个社团间的社团节点重叠率,将重叠率达到合并阈值的社团进行合并,从而得到最终的网络重叠社团划分结果。
上述方法中,所述网络社团候选重叠点集合构建包括:
(1)设网络为G(V,E),V表示节点集合,E表示边的集合;使用GN算法对G(V,E)进行社团划分,得到网络初始的非重叠社团集合P={C1,C2,...,Ci,...,Ck},其中,
Figure BDA00003448633800023
1≤i,j≤k且i≠j,
Figure BDA00003448633800021
k表示社团个数,Ci表示G(V,E)的第i个社团;计算P中每个社团的密度δ(Ci),得到社团密度记录集合
Figure BDA00003448633800024
δ(Ci)计算如下:
δ ( C i ) = | E C i | | C i | ( | C i | - 1 ) - - - ( 1 )
|Ci|表示社团中节点个数,
Figure BDA000034486338000319
表示G(V,E)中以Ci中节点为节点集合的子图的边数,E E C i = { ( u , v ) | u ∈ C i , v ∈ C i } ;
(2)社团之间的边的顶点是社团的边界点,社团Ci的边界点集合为:
border ( C i ) = { u | ( u , v ) ∈ E , u ∈ C i , v ∉ C i } - - - ( 2 )
对P中每个社团的边界点集合求并集,得到网络的社团初始边界点集合,计算如下:
B = ∪ i = 1 k border ( C i ) = { b 1 , b 2 , . . . , b j , . . . , b t } - - - ( 3 )
t表示边界点个数,border(Ci)为社团Ci的边界点集合,bj表示第j个边界点;
(3)对社团初始边界点集合B进行筛选,计算集合B中边界点bj到其关联社团集合Rj中每个关联社团
Figure BDA00003448633800032
的社团连接率rjl;其中,边界点bj的关联社团集合Rj为:
R j = { C relate l | ∃ v ∈ C relate l , ( b j , v ) ∈ E , b j ∉ C relate l , C relate l ∈ P } - - - ( 4 )
边界点bj到关联社团
Figure BDA00003448633800034
的社团连接率rjl计算如下:
r jl = deg C relate l ( b j ) deg ( b j ) , C relate l ∈ R j - - - ( 5 )
Figure BDA00003448633800036
表示bj到社团
Figure BDA00003448633800037
的连接数,deg(bj)表示bj在网络G(V,E)中的度;若rjl大于等于检测阈值φ(缺省值为0.25),则将
Figure BDA00003448633800038
标记为节点bj的潜在隶属社团,记为
Figure BDA00003448633800039
并将该节点加入到候选重叠点集合(CandidateOverlapping Node Set,CONS)中。
所述社团重叠点识别包括:
(1)对所述网络社团候选重叠点集合构建过程中得到的CONS中的每个节点vcand,计算加入该节点后其关联社团集合
Figure BDA000034486338000323
中的潜在隶属社团的密度
Figure BDA000034486338000311
节点关于的质量
Figure BDA000034486338000313
节点网络质量MassG(vcand)及的平均质量
Figure BDA000034486338000315
其中,加入vcand后潜在隶属社团
Figure BDA000034486338000316
的密度
Figure BDA000034486338000317
的计算如下:
δ + v cand ( C potential l ) = | E C potential l | + deg C potential l ( v cand ) | C potential l | ( | C potential l | + 1 ) - - - ( 6 )
Figure BDA00003448633800041
表示vcand到社团的连接数;节点vcand关于其潜在隶属社团
Figure BDA00003448633800043
的质量函数
Figure BDA00003448633800044
的计算如下:
Mass C potential l ( v cand ) = deg C potential l ( v cand ) * δ + v cand ( C potential l ) - - - ( 7 )
节点vcand关于整个网络的质量函数MassG(vcand)计算如下:
MassG(vcand)=deg(vcand)*δ(G)    (8)
deg(vcand)表示节点vcand在网络中的度,δ(G)为网络G(V,E)的密度函数,计算如下:
δ ( G ) = | E | | V | ( | V | - 1 ) - - - ( 9 )
|V|表示网络节点个数,|E|表示网络中边数;同理,社团的节点平均质量
Figure BDA00003448633800048
的计算如下:
Mass avg ( C potential l ) = Σ v ∈ C potential l deg ( v ) | C potential l | * δ ( C potential l ) - - - ( 10 )
Figure BDA000034486338000410
表示社团中节点个数;
(2)若CONS中存在满足重叠点判定规则的节点,选取其中
Figure BDA000034486338000412
与MassG(vcand)之比最大的节点加入到
Figure BDA000034486338000413
中,执行步骤(3);否则执行步骤(5);其中,基于节点质量函数的重叠点判定规则如下:若CONS中节点vcand满足以下条件之一:
1)节点vcand关于
Figure BDA000034486338000414
的质量
Figure BDA000034486338000415
大于其关于整个网络的质量MassG(vcand),
2)节点vcand关于
Figure BDA000034486338000416
的质量
Figure BDA000034486338000417
大于内节点的平均质量
Figure BDA000034486338000419
同时在
Figure BDA000034486338000420
加入该节点后,
Figure BDA000034486338000421
的社团密度
Figure BDA000034486338000422
大于网络的密度δ(G),则vcand为重叠点,并且认为其隶属于社团
(3)将节点vcand加入到社团中,调整CONS中节点vcand
Figure BDA00003448633800053
的隶属关系,将
Figure BDA00003448633800054
在节点vcand的关联社团集合
Figure BDA000034486338000515
中标记为隶属社团,同时更新D中社团
Figure BDA00003448633800055
的密度,计算新产生的边界点中到其关联社团连接率,将连接率达到检测阈值φ的节点加入到CONS中,并将该关联社团标记为节点潜在隶属社团,执行步骤(4);
(4)计算社团
Figure BDA00003448633800056
中的已有重叠点voverlap关于社团的质量
Figure BDA00003448633800058
及其网络质量MassG(voverlap);若存在不符合重叠点判定规则的节点,则选取其中
Figure BDA00003448633800059
与MassG(voverlap)之比最小的节点从
Figure BDA000034486338000510
中删除,调整CONS中该节点与
Figure BDA000034486338000511
的隶属关系,将在该节点的关联社团集合中标记为潜在隶属社团,同时更新D中社团的密度,执行步骤(4);否则执行步骤(1);
(5)CONS中已不存在满足重叠点判定规则的节点,重叠点检测过程结束,得到重叠社团集合C={C'1,C'2,...,C'i,...,C'k},其中,其中k表示社团个数,C'i表示G(V,E)的第i个社团。
所述重叠社团合并包括:
(1)任意两个重叠社团C'i和C'j的重叠率
Figure BDA000034486338000516
计算如下:
∂ ( C i ′ , C j ′ ) = | C i ′ ∩ C j ′ | min ( | C i ′ | , | C j ′ | ) - - - ( 11 )
|C'i|表示C'i节点的个数,|C'i∩C'j|表示C'i和C'j重叠点个数;
(2)计算重叠社团集合C中任意两个社团之间的重叠率,合并重叠率达到合并阈值
Figure BDA000034486338000517
(缺省值为0.8)的社团,并从C中删除被合并的社团;最终得到合并后的重叠社团集合Cmerged={C″1,C″2,...,C″i,...,C″s},其中s表示合并后的社团个数,C″i表示第i个社团。
与现有技术相比,本发明的优点是:在对网络进行重叠社团划分过程中综合考虑网络的全局特征和局部特征,增强了网络社团划分的合理性;其中,全局特征体现在GN算法的模块度评价函数依赖网络的全局属性,以及重叠点判定规则中考虑了节点网络质量,局部特征体现在社团连接率以及节点关于关联社团的质量函数的计算中。
附图说明
图1是本发明网络社团候选重叠点集合构建流程图。
图2是图1所构建重叠点集合的一个具体网络社团边界点的实例图。
图3是本发明社团重叠点识别算法流程图。
图4是本发明重叠社团合并流程图。
具体实施方式
以下结合附图及实施例对本发明作进一步的详细说明。
基于重叠点识别的网络重叠社团划分方法,如图1所示,网络社团候选重叠点集合构建过程的具体流程如下:
(1)设网络为G(V,E),V表示节点集合,E表示边的集合;使用GN算法(由Girvan和Newman提出的一种分裂式社团发现算法,执行过程中不断地计算网络中边的边介数;每次从网络中删除边介数最大的边,直到社团模块度不再增大)对G(V,E)进行社团划分,得到网络初始的非重叠社团集合P={C1,C2,...,Ci,...,Ck},其中,
Figure BDA00003448633800069
1≤i,j≤k且i≠j,
Figure BDA00003448633800061
k表示社团个数,Ci表示G(V,E)的第i个社团;计算P中每个社团的密度δ(Ci),得到社团密度记录集合
Figure BDA00003448633800064
δ(Ci)计算如下:
δ ( C i ) = | E C i | | C i | ( | C i | - 1 ) - - - ( 1 )
|Ci|表示社团中节点个数,
Figure BDA00003448633800065
表示G(V,E)中以Ci中节点为节点集合的子图
Figure BDA000034486338000610
的边数, E C i = { ( u , v ) | u ∈ C i , v ∈ C i } ;
(2)社团之间的边的顶点是社团的边界点,社团Ci的边界点集合为:
border ( C i ) = { u | ( u , v ) ∈ E , u ∈ C i , v ∉ C i } - - - ( 2 )
如图2所示,eij为社团Ci与Cj之间的边,bi1为社团Ci的边界点,bj1、bj2及bj3为社团Cj的边界点;因此,通过在网络中搜索出社团之间的边,可以求解出P中各社团的边界点集合,然后对每个社团的边界点集合求并集,得到网络的社团初始边界点集合;计算如下:
B = ∪ i = 1 k border ( C i ) = { b 1 , b 2 , . . . , b j , . . . , b t } - - - ( 3 )
t表示边界点个数,border(Ci)为社团Ci的边界点集合,bj表示第j个边界点;
(3)遍历集合B,计算当前边界点bj到其关联社团(即所属社团除外,与边界点有连接的社团)集合Rj中每个关联社团的社团连接率rjl(即节点到关联社团的连接数与该节点在网络中度的比值);其中,边界点bj的关联社团集合Rj为:
R j = { C relate l | ∃ v ∈ C relate l , ( b j , v ) ∈ E , b j ∉ C relate l , C relate l ∈ P } - - - ( 4 )
边界点bj到关联社团
Figure BDA00003448633800073
的社团连接率rjl计算如下:
r jl = deg C relate l ( b j ) deg ( b j ) , C relate l ∈ R j - - - ( 5 )
Figure BDA00003448633800075
表示bj到社团
Figure BDA00003448633800076
的连接数,deg(bj)表示bj在网络G(V,E)中的度;若rjl大于等于0.25,则将
Figure BDA00003448633800077
标记为节点bj的潜在隶属社团,记为
Figure BDA00003448633800078
并将该节点加入到候选重叠点集合(Candidate Overlapping Node Set,CONS)中。
如图3所示,社团重叠点识别的具体流程如下:
(1)对所述网络社团候选重叠点集合构建过程中得到的CONS中的每个节点vcand,计算加入该节点后其关联社团集合
Figure BDA000034486338000723
中的潜在隶属社团
Figure BDA00003448633800079
的密度
Figure BDA000034486338000710
节点关于
Figure BDA000034486338000711
的质量
Figure BDA000034486338000712
节点网络质量MassG(vcand)及
Figure BDA000034486338000713
的平均质量
Figure BDA000034486338000714
其中,加入vcand后潜在隶属社团
Figure BDA000034486338000715
的密度
Figure BDA000034486338000716
的计算如下:
δ + v cand ( C potential l ) = | E C potential l | + deg C potential l ( v cand ) | C potential l | ( | C potential l | + 1 ) - - - ( 6 )
Figure BDA000034486338000718
表示vcand到社团
Figure BDA000034486338000719
的连接数;节点vcand关于其潜在隶属社团
Figure BDA000034486338000720
的质量函数
Figure BDA000034486338000721
的计算如下:
Mass C potential l ( v cand ) = deg C potential l ( v cand ) * δ + v cand ( C potential l ) - - - ( 7 )
节点vcand关于整个网络的质量函数MassG(vcand)计算如下:
MassG(vcand)=deg(vcand)*δ(G)   (8)
deg(vcand)表示节点vcand在网络中的度,δ(G)为网络G(V,E)的密度函数,计算如下:
δ ( G ) = | E | | V | ( | V | - 1 ) - - - ( 9 )
|V|表示网络节点个数,|E|表示网络中边数;同理,社团
Figure BDA00003448633800082
的节点平均质量
Figure BDA00003448633800083
的计算如下:
Mass avg ( C potential l ) = Σ v ∈ C potential l deg ( v ) | C potential l | * δ ( C potential l ) - - - ( 10 )
Figure BDA00003448633800085
表示社团中节点个数;
(2)若CONS中存在满足重叠点判定规则的节点,选取其中
Figure BDA00003448633800087
与MassG(vcand)之比最大的节点加入到
Figure BDA00003448633800088
中,执行步骤(3);否则执行步骤(5);其中,基于节点质量函数的重叠点判定规则如下:若CONS中节点vcand满足以下条件之一:
1)节点vcand关于
Figure BDA00003448633800089
的质量
Figure BDA000034486338000810
大于其关于整个网络的质量MassG(vcand),
2)节点vcand关于
Figure BDA000034486338000811
的质量大于
Figure BDA000034486338000813
内节点的平均质量
同时在
Figure BDA000034486338000815
加入该节点后,
Figure BDA000034486338000816
的社团密度大于网络的密度δ(G),则vcand为重叠点,并且认为其隶属于社团
Figure BDA000034486338000818
(3)将节点vcand加入到社团
Figure BDA000034486338000819
中,调整CONS中节点vcand
Figure BDA000034486338000820
的隶属关系,将
Figure BDA000034486338000821
在节点vcand的关联社团集合中标记为隶属社团,同时更新D中社团
Figure BDA000034486338000822
的密度,计算新产生的边界点中到其关联社团连接率,将连接率大于等于0.25的节点加入到CONS中,并将该关联社团标记为节点潜在隶属社团,执行步骤(4);
(4)计算社团
Figure BDA000034486338000823
中的已有重叠点voverlap关于社团
Figure BDA000034486338000824
的质量
Figure BDA000034486338000825
及其网络质量MassG(voverlap);若存在不符合重叠点判定规则的节点,则选取其中
Figure BDA00003448633800091
与MassG(voverlap)之比最小的节点从
Figure BDA00003448633800092
中删除,调整CONS中该节点与
Figure BDA00003448633800093
的隶属关系,将
Figure BDA00003448633800094
在该节点的关联社团集合中标记为潜在隶属社团,同时更新D中社团
Figure BDA00003448633800095
的密度,执行步骤(4);否则执行步骤(1);
(5)CONS中已不存在满足重叠点判定规则的节点,重叠点检测过程结束,得到重叠社团集合C={C'1,C'2,...,C'i,...,C'k},其中,其中k表示社团个数,C'i表示G(V,E)的第i个社团。
如图4所示,重叠社团合并的具体流程如下:
(1)计算重叠社团集合C中任意两个社团之间的重叠率
Figure BDA00003448633800097
计算方式如下:
∂ ( C i ′ , C j ′ ) = | C i ′ ∩ C j ′ | min ( | C i ′ | , | C j ′ | ) - - - ( 11 )
|C′i|表示C'i节点的个数,|C'i∩C'j|表示C'i和C'j重叠点个数;
(2)合并重叠率大于0.8的社团,并从C中删除被合并的社团;最终得到合并后的重叠社团集合Cmerged={C″1,C″2,...,C″i,...,C″s '},其中s表示合并后的社团个数,C″i表示第i个社团。

Claims (4)

1.一种基于重叠点识别的网络重叠社团检测方法,其特征在于,包括如下步骤:
第一步,网络社团候选重叠点集合构建:首先,对网络进行社团划分,得到网络的非重叠社团集合;其次,搜索连接两个社团之间的边,社团之间边的顶点即社团的边界点,并据此求解出每个社团的初始边界点集合,对网络中各社团的初始边界点集合求并集,得到网络社团的初始边界点集合;再次,根据节点到关联社团的连接数与该节点在网络中度的比值,计算社团初始边界点集合中每个节点到其关联社团的连接率,并将连接率达到检测阈值的边界点加入初始候选重叠点集合;
第二步,社团重叠点识别:提出基于节点质量函数重叠点判定规则,判定候选重叠点集合中的节点与节点潜在隶属社团的隶属关系,识别出重叠点,并将重叠点加入到满足重叠点判定规则的隶属社团中;将新产生的边界点到其关联社团的连接率达到检测阈值的节点加入候选重叠点集合;递归执行第二步,直到候选重叠点集合不包含满足重叠点判定规则的节点为止,得到网络的重叠社团集合;
第三步,网络重叠社团合并:对于第二步得到的网络重叠社团集合,计算每两个社团间的社团节点重叠率,将重叠率达到合并阈值的社团进行合并,从而得到最终的网络重叠社团划分结果。
2.如权利要求1所述的基于重叠点识别的网络重叠社团检测方法,其特征在于,所述第一步中:
对网络进行社团划分时,设网络为G(V,E),V表示节点集合,E表示边的集合;使用GN算法对G(V,E)进行社团划分,得到网络初始的非重叠社团集合P={C1,C2,...,Ci,...,Ck},其中,1≤i,j≤k且i≠j,
Figure FDA00003448633700011
k表示社团个数,Ci表示G(V,E)的第i个社团;计算P中每个社团的密度δ(Ci),得到社团密度记录集合
Figure FDA00003448633700014
δ(Ci)计算如下:
δ ( C i ) = | E C i | | C i | ( | C i | - 1 ) - - - ( 1 )
|Ci|表示社团中节点个数,
Figure FDA00003448633700015
表示G(V,E)中以Ci中节点为节点集合的子图
Figure FDA00003448633700019
的边数, E C i = { ( u , v ) | u ∈ C i , v ∈ C i } ;
所述社团Ci的边界点集合为:
border ( C i ) = { u | ( u , v ) ∈ E , u ∈ C i , v ∉ C i } - - - ( 2 )
对P中每个社团的边界点集合求并集,得到网络的社团初始边界点集合B:
B = ∪ i = 1 k border ( C i ) = { b 1 , b 2 , . . . , b j , . . . , b t } - - - ( 3 )
其中t表示边界点个数,border(Ci)为社团Ci的边界点集合,bj表示第j个边界点;
对社团初始边界点集合B进行筛选,计算集合B中边界点bj到其关联社团集合Rj中每个关联社团
Figure FDA00003448633700022
的社团连接率rjl;其中,边界点bj的关联社团集合Rj为:
R j = { C relate l | ∃ v ∈ C relate l , ( b j , v ) ∈ E , b j ∉ C relate l , C relate l ∈ P } - - - ( 4 )
边界点bj到关联社团
Figure FDA00003448633700024
的社团连接率rjl计算如下:
r jl = deg C relate l ( b j ) deg ( b j ) , C relate l ∈ R j - - - ( 5 )
Figure FDA00003448633700026
表示bj到社团
Figure FDA00003448633700027
的连接数,deg(bj)表示bj在网络G(V,E)中的度;若rjl大于等于检测阈值φ,则将
Figure FDA00003448633700028
标记为节点bj的潜在隶属社团,记为
Figure FDA00003448633700029
并将该节点加入到候选重叠点集合CONS中。
3.如权利要求1所述的基于重叠点识别的网络重叠社团检测方法,其特征在于,所述步骤第二步中:
(1)对第一步得到的CONS中每个节点vcand,计算加入该节点后其关联社团集合
Figure FDA000034486337000224
中的潜在隶属社团的密度
Figure FDA000034486337000211
节点关于的质量
Figure FDA000034486337000213
节点网络质量MassG(vcand)及
Figure FDA000034486337000214
的平均质量
其中,加入vcand后潜在隶属社团
Figure FDA000034486337000216
的密度计算如下:
δ + v cand ( C potential l ) = | E C potential l | + deg C potential l ( v cand ) | C potential l | ( | C potential l | + 1 ) - - - ( 6 )
Figure FDA000034486337000219
表示vcand到社团
Figure FDA000034486337000220
的连接数;节点vcand关于其潜在隶属社团
Figure FDA000034486337000221
的质量函数
Figure FDA000034486337000222
计算如下:
Mass C potential l ( v cand ) = deg C potential l ( v cand ) * δ + v cand ( C potential l ) - - - ( 7 )
节点vcand关于整个网络的质量函数MassG(vcand)计算如下:
MassG(vcand)=deg(vcand)*δ(G)   (8)
deg(vcand)表示节点vcand在网络中的度,δ(G)为网络G(V,E)的密度函数,计算如下:
δ ( G ) = | E | | V | ( | V | - 1 ) - - - ( 9 )
|V|表示网络节点个数,|E|表示网络中边数;同理,社团
Figure FDA00003448633700032
的节点平均质量计算如下:
Mass avg ( C potential l ) = Σ v ∈ C potential l deg ( v ) | C potential l | * δ ( C potential l ) - - - ( 10 )
Figure FDA00003448633700035
表示社团中节点个数;
(2)若在CONS中存在满足重叠点判定规则的节点,选取其中
Figure FDA00003448633700037
与MassG(vcand)之比最大的节点加入到
Figure FDA00003448633700038
中,执行步骤(3);否则执行步骤(5);其中,基于节点质量函数的重叠点判定规则如下:若在CONS中节点vcand满足以下条件之一:
1)节点vcand关于
Figure FDA00003448633700039
的质量
Figure FDA000034486337000310
大于其关于整个网络的质量MassG(vcand),
2)节点vcand关于
Figure FDA000034486337000311
的质量
Figure FDA000034486337000312
大于
Figure FDA000034486337000313
内节点的平均质量
Figure FDA000034486337000314
同时在
Figure FDA000034486337000315
加入该节点后,
Figure FDA000034486337000316
的社团密度
Figure FDA000034486337000317
大于网络的密度δ(G),则vcand为重叠点,并且认为其隶属于社团
Figure FDA000034486337000318
(3)将节点vcand加入到社团
Figure FDA000034486337000319
中,调整CONS中节点vcand
Figure FDA000034486337000320
的隶属关系,将
Figure FDA000034486337000321
在节点vcand的关联社团集合
Figure FDA000034486337000323
中标记为隶属社团,同时更新D中社团
Figure FDA000034486337000322
的密度,计算新产生的边界点中到其关联社团连接率,将连接率达到检测阈值φ的节点加入到CONS中,并将该关联社团标记为节点潜在隶属社团,执行步骤(4);
(4)计算社团
Figure FDA00003448633700041
中的已有重叠点voverlap关于社团
Figure FDA00003448633700042
的质量
Figure FDA00003448633700043
及其网络质量MassG(voverlap);若存在不符合重叠点判定规则的节点,则选取其中
Figure FDA00003448633700044
与MassG(voverlap)之比最小的节点从
Figure FDA00003448633700045
中删除,调整CONS中该节点与
Figure FDA00003448633700046
的隶属关系,将
Figure FDA00003448633700047
在该节点的关联社团集合中标记为潜在隶属社团,同时更新D中社团
Figure FDA00003448633700048
的密度,执行步骤(4);否则执行步骤(1);
(5)CONS中已不存在满足重叠点判定规则的节点,重叠点检测过程结束,得到重叠社团集合C={C′1,C'2,...,C′i,...,C'k},其中,其中k表示社团个数,C′i表示G(V,E)的第i个社团。
4.如权利要求1所述的基于重叠点识别的网络重叠社团检测方法,其特征在于,所述重叠社团合并包括:
(1)任意两个重叠社团C′i和C'j的重叠率
Figure FDA000034486337000410
计算如下:
∂ ( C i ′ , C j ′ ) = | C i ′ ∩ C j ′ | min ( | C i ′ | , | C j ′ | ) - - - ( 11 )
|C′i|表示C′i节点的个数,|C′i∩C'j|表示C′i和C'j重叠点个数;
(2)计算重叠社团集合C中任意两个社团之间的重叠率,合并重叠率达到合并阈值
Figure FDA000034486337000411
的社团,并从C中删除被合并的社团;最终得到合并后的重叠社团集合Cmerged={C′′1,C′′2,...,C′′i,...,C′′s},其中s表示合并后的社团个数,C′′i表示第i个社团。
CN201310272890.7A 2013-07-02 2013-07-02 基于重叠点识别的网络重叠社团检测方法 Active CN103400299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310272890.7A CN103400299B (zh) 2013-07-02 2013-07-02 基于重叠点识别的网络重叠社团检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310272890.7A CN103400299B (zh) 2013-07-02 2013-07-02 基于重叠点识别的网络重叠社团检测方法

Publications (2)

Publication Number Publication Date
CN103400299A true CN103400299A (zh) 2013-11-20
CN103400299B CN103400299B (zh) 2015-04-29

Family

ID=49563912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310272890.7A Active CN103400299B (zh) 2013-07-02 2013-07-02 基于重叠点识别的网络重叠社团检测方法

Country Status (1)

Country Link
CN (1) CN103400299B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055568A (zh) * 2016-05-18 2016-10-26 安徽大学 一种基于单步添加团的社交网络的朋友自动分组方法
CN106327340A (zh) * 2016-08-04 2017-01-11 中国银联股份有限公司 一种金融网络的异常节点集合侦测方法及装置
CN107133877A (zh) * 2017-06-06 2017-09-05 安徽师范大学 网络中重叠社团的挖掘方法
CN108173965A (zh) * 2018-01-22 2018-06-15 广东技术师范学院 社团感知的icn缓存方法
CN108647490A (zh) * 2018-05-04 2018-10-12 安徽大学 基于多目标进化算法的大规模蛋白质功能模块识别方法
CN109902221A (zh) * 2019-03-04 2019-06-18 曲阜师范大学 一种基于复杂网络的区块链研究热点发现方法
CN110969526A (zh) * 2019-12-13 2020-04-07 南京三百云信息科技有限公司 重叠社群处理方法、装置以及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007084778A2 (en) * 2006-01-19 2007-07-26 Llial, Inc. Systems and methods for creating, navigating and searching informational web neighborhoods
CN101344940A (zh) * 2008-08-21 2009-01-14 魏芳 一种基于全局划分和局部扩展的网络重叠社团检测方法
CN101383748A (zh) * 2008-10-24 2009-03-11 北京航空航天大学 一种复杂网络中的社区划分方法
CN102722530A (zh) * 2012-05-17 2012-10-10 北京理工大学 一种复杂网络中的社团探测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007084778A2 (en) * 2006-01-19 2007-07-26 Llial, Inc. Systems and methods for creating, navigating and searching informational web neighborhoods
WO2007084778A3 (en) * 2006-01-19 2008-05-15 Llial Inc Systems and methods for creating, navigating and searching informational web neighborhoods
CN101344940A (zh) * 2008-08-21 2009-01-14 魏芳 一种基于全局划分和局部扩展的网络重叠社团检测方法
CN101383748A (zh) * 2008-10-24 2009-03-11 北京航空航天大学 一种复杂网络中的社区划分方法
CN102722530A (zh) * 2012-05-17 2012-10-10 北京理工大学 一种复杂网络中的社团探测方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055568A (zh) * 2016-05-18 2016-10-26 安徽大学 一种基于单步添加团的社交网络的朋友自动分组方法
CN106055568B (zh) * 2016-05-18 2019-06-28 安徽大学 一种基于单步添加团的社交网络的朋友自动分组方法
CN106327340A (zh) * 2016-08-04 2017-01-11 中国银联股份有限公司 一种金融网络的异常节点集合侦测方法及装置
CN106327340B (zh) * 2016-08-04 2022-01-07 中国银联股份有限公司 一种金融网络的异常节点集合侦测方法及装置
CN107133877A (zh) * 2017-06-06 2017-09-05 安徽师范大学 网络中重叠社团的挖掘方法
CN107133877B (zh) * 2017-06-06 2021-02-09 安徽师范大学 网络中重叠社团的挖掘方法
CN108173965A (zh) * 2018-01-22 2018-06-15 广东技术师范学院 社团感知的icn缓存方法
CN108647490A (zh) * 2018-05-04 2018-10-12 安徽大学 基于多目标进化算法的大规模蛋白质功能模块识别方法
CN108647490B (zh) * 2018-05-04 2022-06-17 安徽大学 基于多目标进化算法的大规模蛋白质功能模块识别方法和系统
CN109902221A (zh) * 2019-03-04 2019-06-18 曲阜师范大学 一种基于复杂网络的区块链研究热点发现方法
CN110969526A (zh) * 2019-12-13 2020-04-07 南京三百云信息科技有限公司 重叠社群处理方法、装置以及电子设备

Also Published As

Publication number Publication date
CN103400299B (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
CN103400299A (zh) 基于重叠点识别的网络重叠社团检测方法
CN104657418B (zh) 一种基于隶属度传播的复杂网络模糊社团挖掘方法
CN107784598A (zh) 一种网络社区发现方法
CN104346481B (zh) 一种基于动态同步模型的社区检测方法
CN109120465B (zh) 基于模体的目标区域网络拓扑划分方法
CN103020163A (zh) 一种网络中基于节点相似度的网络社区划分方法
CN103888541A (zh) 一种融合拓扑势和谱聚类的社区发现方法及系统
Ding et al. Mining protein complexes from PPI networks using the minimum vertex cut
CN104700311B (zh) 一种社会网络中的邻域跟随社区发现方法
CN105069290A (zh) 一种面向寄递数据的并行化关键节点发现方法
CN109710599A (zh) 一种基于知识图谱的群体划分方法及装置
CN104731887B (zh) 一种协同过滤中的用户相似度度量方法
CN106912040B (zh) 一种融合删除法的Ad Hoc网络关键节点识别方法
CN109783696B (zh) 一种面向弱结构相关性的多模式图索引构建方法及系统
Sardana et al. Graph clustering using mutual K-nearest neighbors
CN104021199A (zh) 基于节点支配能力相似性的功能模块检测方法
CN105302823A (zh) 重叠社区并行发现的方法及系统
CN110287237A (zh) 一种基于社会网络结构分析高效社团数据挖掘方法
CN104504266A (zh) 基于最短路径和密度聚类的图分割方法
CN112765313A (zh) 一种基于原文和评论信息分析算法的虚假信息检测方法
CN116720975A (zh) 基于结构相似的局部社区发现方法及系统
CN103902547A (zh) 一种基于mdl的增量式动态社区快速发现方法及系统
CN110851541B (zh) 用于基于关系图生成风险特征的方法及装置
CN105813235B (zh) 移动终端客户社团的划分方法和系统
CN106296420A (zh) 一种社区发现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160415

Address after: 310053, tax building, No. 3738 South Ring Road, Hangzhou, Zhejiang, Binjiang District

Patentee after: Servyou Software Group Co., Ltd.

Address before: 710049 Xianning West Road, Shaanxi, China, No. 28, No.

Patentee before: Xi'an Jiaotong University