CN104933103A - 整合结构聚类和属性分类的多目标社区发现方法 - Google Patents

整合结构聚类和属性分类的多目标社区发现方法 Download PDF

Info

Publication number
CN104933103A
CN104933103A CN201510288090.3A CN201510288090A CN104933103A CN 104933103 A CN104933103 A CN 104933103A CN 201510288090 A CN201510288090 A CN 201510288090A CN 104933103 A CN104933103 A CN 104933103A
Authority
CN
China
Prior art keywords
community
population
attribute
node
divide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510288090.3A
Other languages
English (en)
Inventor
潘理
吴鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201510288090.3A priority Critical patent/CN104933103A/zh
Publication of CN104933103A publication Critical patent/CN104933103A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种整合结构聚类和属性分类的多目标社区发现方法,包括如下步骤:建立网络邻接矩阵和属性矩阵;构建衡量社区划分结构质量的目标函数模块度;构建衡量社区划分属性质量的目标函数均质性;初始化网络社区划分种群;使用交叉和变异操作更新社区划分种群;组合变异社区划分种群和外部支配种群;找出最终的社区划分种群中的所有支配社区划分。本发明基于香浓信息熵原理,设计了衡量节点属性分类质量的函数,将属性分类问题建模为目标函数最优化问题。利用多目标优化策略同时优化衡量结构聚类质量的模块度函数和衡量属性分类质量的均质性函数,得到一组社区结构,它们对应于结构聚类和属性分类之间不同的平衡,适用于不同的应用。

Description

整合结构聚类和属性分类的多目标社区发现方法
技术领域
本发明属于复杂网络技术领域,具体地说,涉及一种复杂网络中整合结构聚类和属性分类的多目标社区发现方法,可用于网络功能分析和结构可视化。
背景技术
复杂网络中的社区发现方法对于理解网络的功能和可视化网络的结构等至关重要。通常来说,一个社区是网络中所有个体组成集合的一个子集,该集合中的个体相似,并和子集外的个体不相似。
经对现有技术的文献检索发现,大部分社区发现方法仅考虑网络拓扑结构信息,将社区定义为紧密连接的节点集合,并采用结构聚类的方法利用拓扑结构信息划分网络。然而真实网络通常具有大量描述节点特征的属性信息,比如用户基本信息,爱好信息,行为信息等。分类方法是使用属性信息划分网络节点集合的最好方法之一,其将具有相同属性的节点划分到一个社区中。结构聚类和属性分类能够分别充分利用结构和属性信息划分网络,但是他们都只利用一种信息而忽视另一种信息。这导致划分出的社区结构要么具有随机的属性值分布,要么具有松弛的内部连接结构。因此,理想的社区发现方法应同时考虑结构信息和属性信息。
综合结构信息和属性信息的社区发现方法主要分为统一模型法和分离模型法。统一模型法通过一个统一的模型用同样的方式处理结构和属性信息。Xu等人于2012年在国际会议《SIGMOD》上发表文章“A model-based approach to attributed graphclustering”,采用一个贝叶斯模型来同时处理结构和属性信息。对于一个待划分的网络,该模型为每一个可能的社区结构分配一个概率,将社区发现问题转化成一个概率推断问题,并使用变分法解决。然而,由于拓扑和属性信息是两种完全不同的信息,统一模型方法无法通过建立一个统一的模型来充分利用两种信息的划分能力。另一方面,分离模型法采用不同的模型建模拓扑和属性信息。Yang等人于2013年在国际会议《ICDM》上发表文章“Community detection in networks with nodeattributes”,采用不同的概率似然模型建模拓扑和属性信息。使用一个超参数将两个模型整合起来。超参数需要提前设定,用来控制拓扑信息和属性信息之间的相对重要性。然而,拓扑和属性的相对重要性通常无法提前知道,因此很难提前设定超参数的值,并且使用概率似然模型属性信息忽视了属性的分类本质。
发明内容
为了解决现有方法很难充分利用网络结构和属性信息发现多样的社区结构的问题,本发明的目的是提出一种整合结构聚类和属性分类的多目标社区发现方法,该方法设计一个衡量属性分类质量的目标函数,利用多目标优化策略同时优化结构质量和属性质量,发现对应于结构和属性不同平衡的多样化的社区结构。
为实现上述目的,本发明是通过以下技术方案实现的。
一种整合结构聚类和属性分类的多目标社区发现方法,包括如下步骤:
步骤S1、建立待分析网络的邻接矩阵A和属性矩阵B,为待分析网络所有节点进行连续编号,编号从1开始,构建正方形邻接矩阵A,构建属性矩阵B;
步骤S2、构建衡量社区划分结构质量的目标函数模块度:
Q ( X ) = Σ G l ∈ X Σ i , j ∈ G l A ij 2 m - Σ G l ∈ X ( Σ i ∈ G l k i 2 m ) 2 ,
其中,X是网络的社区划分,Gl是社区划分中的社区,ki表示第i个节点的度,m表示网络总的边数,Aij为邻接矩阵A中的元素,其中i为第i个节点,j为第j个节点,当Aij为1时代表第i节点和第j节点之间有边相连,当Aij为0时代表第i节点和第j节点之间不存在边;
步骤S3、构建衡量社区划分属性质量的目标函数均质性:
其中,ωj表示社区划分X关于第j个属性均质性的权重,表示社区划分X关于第j个属性的均质性,t为属性的数量;
步骤S4、初始化网络社区划分种群;
步骤S5、使用交叉和变异操作更新社区划分种群,生成社区划分子种群;
步骤S6、组合社区划分子种群和外部支配种群,生成下一代种群Bg,设置种群代数g的值增加1,如果g<Gmax,则返回步骤S5继续迭代,否则进行步骤S7,其中Gmax为种群进化迭代次数;
步骤S7、找出最终社区划分种群Bg中所有支配社区划分,计算每个支配社区划分的模块度和均质性,根据具体应用及模块度和均质性的值选择社区划分。
优选地,所述步骤S3,具体包括如下步骤:
步骤S31、计算社区Gl内的节点取属性值的伪频率:其中nl表示社区Gl内的节点数,表示社区Gl内节点取属性值的数量,q表示第j个属性取该属性的第q个属性值;
步骤S32、计算社区划分X关于属性bj的伪分类熵:
PCE b j ( X ) = - Σ G l ∈ X n l n Σ q = 1 d j pp lj q ln pp lj q ;
步骤S33、计算社区划分X关于第j个属性的均质性:其中dj表示属性bj能够取值的个数;
步骤S34、计算社区划分X关于第j个属性的均质性的权重:其中表示属性bj在网络G中的熵。
优选地,所述步骤S4,具体包括如下步骤:
步骤S41、采用基于邻接位置的编码法编码社区划分个体,即划分个体有N个基因,其中N为网络节点总数,每个基因对应一个节点,每个基因从范围{1,2,......,N}中取一个等位基因值,表示该基因对应的节点和等位基因对应的节点之间有边相连;属于同一个连通部分的节点被分配到一个社区;设定种群大小SD,设定种群进化迭代次数Gmax,初始化种群代数g=0;
步骤S42、生成SD个个体,每个个体的每个基因的取值限制为其对应节点的邻居节点。
优选地,所述步骤S5,具体包括如下步骤:
步骤S51、定义个体之间的支配关系,一个个体a支配另一个个体b表示个体a至少在一个目标函数上优于个体b并且在所有目标函数上都不弱于个体b,根据支配关系找出群体中所有支配个体;定义拥挤距离衡量社区划分个体在种群中所处位置的密度,按拥挤距离降序选取前SD个支配个体组成支配种群,复制支配种群生成外部支配种群;
步骤S52、对支配种群进行交叉操作,从支配种群中随机选择两个社区划分作为交叉操作的父个体,随机生成一个长度N的二进制向量,根据该二进制向量交叉两个父个体生成一个子个体,重复该过程SD次,所有新生成的子个体组成交叉社区划分种群;
步骤S53、对交叉社区划分种群进行变异操作,对交叉社区划分种群中的每个个体进行变异,对个体中的每个节点,以变异概率将其等位基因值改变为该节点的任一邻居节点,所有变异个体组成社区划分子种群。
与现有技术相比,本发明具有以下有益效果:
1、定义一个衡量属性分类质量的函数,将属性分类问题转化为目标优化问题,充分利用属性信息划分网络节点的能力;
2、使用多目标优化策略整合结构聚类和属性分类,发现同时满足拓扑结构要求和属性要求的社区;
3、多目标优化遗传算法同时得到一组社区结构,对应于拓扑结构和属性之间不同的平衡,适合多钟应用。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明方法的流程图。
图2为本发明采用的基于邻接位置编码法示意图。
图3为本发明和多个已有方法之间的性能对比图,其中,(a)为各方法在书籍网络上的性能对比图,(b)为各方法在足球赛网络上的性能对比图,(c)为各方法在博客网络上的性能对比图,(d)为各方法在Facebook网络上的性能对比图。
具体实施方式
下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
实施例
本实施例提供了一种整合结构聚类和属性分类的多目标社区发现方法,包括如下步骤:
步骤S1、建立待分析网络的邻接矩阵A和属性矩阵B:为网络所有节点进行连续编号,编号从1开始;建正方形邻接矩阵A,邻接矩阵A中的元素Aij为1代表对应节点之间有边相连,为0代表对应节点之间不存在边;构建属性矩阵B,属性矩阵B中的元素代表第i个节点的第j个属性值为
步骤S2、构建衡量社区划分结构质量的目标函数模块度:
Q ( X ) = Σ G l ∈ X Σ i , j ∈ G l A ij 2 m - Σ G l ∈ X ( Σ i ∈ G l k i 2 m ) 2 ,
其中,X是网络的社区划分,Gl是社区划分中的社区,ki表示节点i的度,m表示网络总的边数;
步骤S3、构建衡量社区划分属性质量的目标函数均质性:
其中,ωj表示社区划分X关于第j个属性均质性的权重,表示社区划分X关于第j个属性的均质性,t为属性的数量;
所述的步骤S3,具体为:
步骤S31、计算社区Gl内的节点取属性值的伪频率:其中nl表示社区Gl内的节点数,表示社区Gl内节点取属性值的数量,q表示第j个属性取该属性的第q个属性值;
步骤S32、计算社区划分X关于属性bj的伪分类熵:
PCE b j ( X ) = - Σ G l ∈ X n l n Σ q = 1 d j pp lj q ln pp lj q ;
步骤S33、计算社区划分X关于第j个属性的均质性:其中dj表示属性bj能够取值的个数;
步骤S34、计算社区划分X关于第j个属性的均质性的权重:其中表示属性bj在网络G中的熵;
步骤S4、初始化网络社区划分种群;
所述的步骤S4,具体为:
S41、采用基于邻接位置的编码法编码社区划分个体,即划分个体有N个基因,其中N为网络节点总数,每个基因对应一个节点,每个基因从范围{1,2,......,N}中取一个等位基因值,表示该基因对应的节点和等位基因对应的节点之间有边相连;属于同一个连通部分的节点被分配到一个社区;设定种群大小SD,设定种群进化迭代次数Gmax,初始化种群代数g=0;
步骤S42、生成SD个个体,每个个体的每个基因的取值限制为其对应节点的邻居节点,从而确保初始化的社区划分中每个社区是连通的;
步骤S5、使用交叉和变异操作更新社区划分种群;
所述的步骤S5,具体为:
步骤S51、定义个体之间的支配关系,一个个体a支配另一个个体b表示个体a至少在一个目标函数上优于个体b并且在所有目标函数上都不弱于个体b,根据支配关系找出群体中所有支配个体,支配个体表示种群中最好的一部分个体;定义拥挤距离衡量社区划分个体在种群中所处位置的密度,所处位置稀疏的个体具有更强的代表性和多样性,生成更好的个体的可能性更大,按拥挤距离降序选取前SD个支配个体组成支配种群,复制支配种群生成外部支配种群,用于保留该种群中的优秀个体;
步骤S52、对支配种群进行交叉操作,从支配种群中随机选择两个社区划分作为交叉操作的父个体,随机生成一个长度N的二进制向量,根据该二进制向量交叉两个父个体生成一个子个体,重复该过程SD次,所有新生成的子个体组成交叉社区划分种群;
步骤S53、对交叉社区划分种群进行变异操作,对交叉社区划分种群中的每个个体进行变异,对个体中的每个节点,以变异概率将其等位基因值改变为该节点的任一邻居节点,所有变异个体组成社区划分子种群;
步骤S6、组合社区划分子种群和外部支配种群,生成下一代种群Bg,设置种群代数g的值增加1,如果g<Gmax,则返回步骤S5继续迭代,否则进行步骤S7;
步骤S7、找出最终的社区划分种群Bg中的所有支配社区划分,计算每个支配社区划分的模块度和均质性,根据具体应用及模块度和均质性的值选择社区划分。
为使本实施例要解决的技术问题、技术方案和优点更加清楚,下面将结合附图对本实施例进行详细描述。
如图1所示,本实施例提供的整合结构聚类和属性分类的多目标社区发现方法,包括如下步骤:
步骤S1,建立待分析网络的邻接矩阵A和属性矩阵B:为网络所有节点进行连续编号,编号从1开始;构建正方形邻接矩阵A,矩阵中元素Aij为1代表对应的节点之间有边相连,为0代表对应的节点之间不存在边;构建属性矩阵B,矩阵中元素代表节点i的第j个属性的值为
步骤S2,构建衡量社区划分结构质量的目标函数模块度:
Q ( X ) = Σ G l ∈ X Σ i , j ∈ G l A ij 2 m - Σ G l ∈ X ( Σ i ∈ G l k i 2 m ) 2 ,
其中,X是网络的社区划分,Gl是社区划分中的社区,ki表示第i个节点的度,m表示网络总的边数;模块度值越大,表示该社区划分在结构上划分质量越好。
步骤S3,构建衡量社区划分属性质量的目标函数均质性:
其中,ωj表示社区划分X关于第j个属性均质性的权重,表示社区划分X关于第j个属性的均质性,t为属性的数量;
为了计算首先计算社区Gl内节点取属性值的伪频率:其中nl表示社区Gl内的节点数,表示社区Gl内节点取属性值的数量;接着计算社区划分X关于属性bj的伪分类熵:最后计算社区划分X关于第j个属性的均质性:其中dj表示属性bj能够取值的个数;
社区划分X关于第j个属性的均质性的权重的计算公式为:其中表示属性bj在网络G中的熵。
步骤S4,初始化网络社区划分种群;采用基于邻接位置的编码法编码社区划分个体,即划分个体有N个基因,其中N为网络节点总数,每个基因对应一个节点,每个基因从范围{12,......,N}中取一个等位基因值,表示该基因对应的节点和等位基因对应的节点之间有边相连;属于同一个连通部分的节点被分配到一个社区;图2用一个具有7个节点的实例网络说明该编码方式,右边的连通结构对应于中间的编码,因此该编码将网络划分成了两个社区;
设定种群大小SD,设定种群进化迭代次数Gmax,初始化种群代数g=0;生成SD个个体,每个个体的每个基因的取值限制为其对应节点的邻居节点,从而确保初始化的社区划分中每个社区是连通的。
步骤S5,使用交叉和变异操作更新社区划分种群;定义个体之间的支配关系,一个个体a支配另一个个体b表示个体a至少在一个目标函数上优于个体b并且在所有目标函数上都不弱于个体b,根据支配关系找出群体中所有支配个体,支配个体表示种群中最好的一部分个体;定义拥挤距离衡量社区划分个体在种群中所处位置的密度,所处位置稀疏的个体具有更强的代表性和多样性,更有可能生成更好的个体,按拥挤距离降序选取前SD个支配个体组成支配种群,复制支配种群生成外部支配种群,用于保留该种群中的优秀个体;
对支配种群进行交叉操作,从支配种群中随机选择两个社区划分作为交叉操作的父个体,随机生成一个长度N的二进制向量,根据该二进制向量交叉两个父个体生成一个子个体,从第一个父个体中选取那些处在随机二进制向量为1的位置处的基因,从第二个父个体中选取那些处在随机二进制向量为0的位置处的基因,按原位置交叉选取的两组基因组成子个体;重复该过程SD次,所有新生成的子个体组成交叉社区划分种群;
对交叉社区划分种群进行变异操作,对交叉社区划分种群中的每个个体进行变异,对个体中的每个节点,以变异概率将其等位基因值改变为该节点的任一邻居节点,所有变异个体组成社区划分子种群。
步骤S6,组合社区划分子种群和外部支配种群,生成下一代种群Bg,设置种群代数g的值增加1,如果g<Gmax,则返回步骤S5,否则进行步骤S7。
步骤S7,找出最终的社区划分种群Bg中的所有支配社区划分,计算每个支配社区划分的模块度和均质性,根据具体应用及模块度和均质性的值选择社区划分。
本实施例的有效性可以通过下面的仿真实验来进一步说明。需要说明的是,实验中应用的参数不影响本发明的一般性。
1)仿真条件:
CPU IntelDual-Core 2.80GHz,RAM 3.00GB,操作系统Windows 7,仿真软件Matlab2010。
2)仿真内容:
选取四个现实世界网络进行实验,分别为书籍网络,足球赛网络,博客网络和Facebook网络。为了衡量社区结构(社区划分)在结构上和属性上的性能,分别使用两个性能指标评价社区划分的拓扑质量和属性质量,模块度Q的值越大,说明发现的社区划分在结构上越符合社区的定义,即社区内部节点连接稠密,社区之间连接稀疏。均质性H的值越大,说明发现的社区在属性上越符合社区的定义,即社区内部节点具有相似的属性值,不同社区的节点具有不同的属性值。
本实施例在仿真实验中用MOCDA表示。本实施例的参数设置如下,种群大小为200,迭代次数为200,变异概率为0.01。
将本实施例与4个其他的社区发现方法在4个真实网络上进行仿真对比。这4个方法如下,Vincent等人于2008年在《Journal of Statistical Mechanics》上发表的“Fastunfolding of communities in large networks”中提出的Louvian方法,该方法紧使用网络拓扑结构信息;属性分类方法HM,该方法紧使用属性信息,将具有相同属性的节点划分到一个社区,具有不同属性的节点划分到不同社区,第四个网络Facebook网络具有四个属性,根据第i个属性分类的社区结构用i-HM表示;Xu等人于2012年在国际会议《SIGMOD》上发表文章“A mode1-based approach to attributed graph clustering”中提出的BAGC方法,该方法是同时使用拓扑信息和属性信息的unified-model法;Cruz等人于2011年发表的“Entropy based community detection in augmented socialnetworks”中提出的AGCA方法,该方法是同时使用拓扑信息和属性信息的separated-model法。
仿真实验结果如图3(a)~图3(d)所示,在每个网络上,Louvian方法都获得了最好的结构性能和较差的属性性能,HM方法都获得了最好的属性性能和较差的结构性能,而BAGC方法在每个网络上的性能都较差,在单属性网络上AGCA方法在结构和属性之间有一定的平衡,但主要还是偏向于按属性划分,在多属性网络上,AGCA方法的性能较差。只有MOCDA方法在所有网络上都得到一组对应于结构目标和属性目标不同平衡的解。
本实施例提供的整合结构聚类和属性分类的多目标社区发现方法,可用于可视化具有节点属性信息的网络,发现具有特定属性意义的社区结构。本实施例基于香浓信息熵原理,设计了衡量节点属性分类质量的函数,将属性分类问题建模为目标函数最优化问题。本实施例利用多目标优化策略同时优化衡量结构聚类质量的模块度函数和衡量属性分类质量的均质性函数,得到一组社区结构,它们对应于结构聚类和属性分类之间不同的平衡,适用于不同的应用。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (4)

1.一种整合结构聚类和属性分类的多目标社区发现方法,其特征在于,包括如下步骤:
步骤S1、建立待分析网络的邻接矩阵A和属性矩阵B,为待分析网络所有节点进行连续编号,编号从1开始,构建正方形邻接矩阵A,构建属性矩阵B;
步骤S2、构建衡量社区划分结构质量的目标函数模块度:
Q ( X ) = Σ G l ∈ X Σ i , j ∈ G l A ij 2 m - Σ G l ∈ X ( Σ i ∈ G l k i 2 m ) 2 ,
其中,X是网络的社区划分,Gl是社区划分中的社区,ki表示第i个节点的度,m表示网络总的边数,Aij为邻接矩阵A中的元素,其中,i为第i个节点,j为第j个节点;
步骤S3、构建衡量社区划分属性质量的目标函数均质性:
其中,ωj表示社区划分X关于第j个属性均质性的权重,表示社区划分X关于第j个属性的均质性,t为属性的数量;
步骤S4、初始化网络的社区划分种群;
步骤S5、使用交叉和变异操作更新社区划分种群,生成社区划分子种群;
步骤S6、组合社区划分子种群和外部支配种群,生成下一代种群B0,设置种群代数g的值增加1,如果g<Gmax,则返回步骤S5继续迭代;否则进行步骤S7;其中Gmax为种群进化迭代次数;
步骤S7、找出最终社区划分种群Bg中所有支配社区划分,计算每个支配社区划分的模块度和均质性,根据具体应用及模块度和均质性的值选择社区划分。
2.根据权利要求1所述的整合结构聚类和属性分类的多目标社区发现方法,其特征在于,所述步骤S3,具体包括如下步骤:
步骤S31、计算社区Gl内的节点取属性值的伪频率:其中nl表示社区Gl内的节点数,表示社区Gl内节点取属性值的数量,q表示第j个属性取该属性的第q个属性值;
步骤S32、计算社区划分X关于属性bj的伪分类熵:
PCE b j ( X ) = - Σ G ; ∈ X n l n Σ q = 1 d j pp lj q ln pp lj q ;
步骤S33、计算社区划分X关于第j个属性的均质性:其中dj表示属性bj能够取值的个数;
步骤S34、计算社区划分X关于第j个属性的均质性的权重:其中 E b j ( G ) = - Σ q = 1 d j n j q n ln n j q n , 表示属性bj在网络G中的熵。
3.根据权利要求1所述的整合结构聚类和属性分类的多目标社区发现方法,其特征在于,所述步骤S4,具体包括如下步骤:
步骤S41、采用基于邻接位置的编码法编码社区划分个体,即划分个体有N个基因,其中N为网络节点总数,每个基因对应一个节点,每个基因从范围{1,2,......,N}中取一个等位基因值,表示该基因对应的节点和等位基因对应的节点之间有边相连;属于同一个连通部分的节点被分配到一个社区;设定种群大小SD,设定种群进化迭代次数Gmax,初始化种群代数g=0;
步骤S42、生成SD个个体,每个个体的每个基因的取值限制为其对应节点的邻居节点。
4.根据权利要求1所述的整合结构聚类和属性分类的多目标社区发现方法,其特征在于,所述步骤S5,具体包括如下步骤:
步骤S51、定义个体之间的支配关系,一个个体a支配另一个个体b表示个体a至少在一个目标函数上优于个体b并且在所有目标函数上都不弱于个体b,根据支配关系找出群体中所有支配个体;定义拥挤距离衡量社区划分个体在种群中所处位置的密度,按拥挤距离降序选取前SD个支配个体组成支配种群,复制支配种群生成外部支配种群;
步骤S52、对支配种群进行交叉操作,从支配种群中随机选择两个社区划分作为交叉操作的父个体,随机生成一个长度N的二进制向量,根据该二进制向量交叉两个父个体生成一个子个体,重复该过程SD次,所有新生成的子个体组成交叉社区划分种群;
步骤S53、对交叉社区划分种群进行变异操作,对交叉社区划分种群中的每个个体进行变异,对个体中的每个节点,以变异概率将其等位基因值改变为该节点的任一邻居节点,所有变异个体组成社区划分子种群。
CN201510288090.3A 2015-05-29 2015-05-29 整合结构聚类和属性分类的多目标社区发现方法 Pending CN104933103A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510288090.3A CN104933103A (zh) 2015-05-29 2015-05-29 整合结构聚类和属性分类的多目标社区发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510288090.3A CN104933103A (zh) 2015-05-29 2015-05-29 整合结构聚类和属性分类的多目标社区发现方法

Publications (1)

Publication Number Publication Date
CN104933103A true CN104933103A (zh) 2015-09-23

Family

ID=54120271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510288090.3A Pending CN104933103A (zh) 2015-05-29 2015-05-29 整合结构聚类和属性分类的多目标社区发现方法

Country Status (1)

Country Link
CN (1) CN104933103A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106411572A (zh) * 2016-09-06 2017-02-15 山东大学 一种结合节点信息和网络结构的社区发现方法
CN107276843A (zh) * 2017-05-19 2017-10-20 西安电子科技大学 一种基于Spark平台的多目标进化社区检测方法
CN110085324A (zh) * 2019-04-25 2019-08-02 深圳市华嘉生物智能科技有限公司 一种多重生存终端结果联合分析的方法
CN111309788A (zh) * 2020-03-08 2020-06-19 山西大学 一种银行客户交易网络的社区结构发现方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110208710A1 (en) * 2011-04-29 2011-08-25 Lesavich Zachary C Method and system for creating vertical search engines with cloud computing networks
CN102902772A (zh) * 2012-09-27 2013-01-30 福建师范大学 一种基于多目标优化的Web社区发现方法
CN103942308A (zh) * 2014-04-18 2014-07-23 中国科学院信息工程研究所 大规模社交网络社区的检测方法及装置
CN104268271A (zh) * 2014-10-13 2015-01-07 北京建筑大学 一种兴趣和网络结构双内聚的社交网络社区发现方法
CN104657442A (zh) * 2015-02-04 2015-05-27 上海交通大学 基于局部搜索的多目标社区发现方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110208710A1 (en) * 2011-04-29 2011-08-25 Lesavich Zachary C Method and system for creating vertical search engines with cloud computing networks
CN102902772A (zh) * 2012-09-27 2013-01-30 福建师范大学 一种基于多目标优化的Web社区发现方法
CN103942308A (zh) * 2014-04-18 2014-07-23 中国科学院信息工程研究所 大规模社交网络社区的检测方法及装置
CN104268271A (zh) * 2014-10-13 2015-01-07 北京建筑大学 一种兴趣和网络结构双内聚的社交网络社区发现方法
CN104657442A (zh) * 2015-02-04 2015-05-27 上海交通大学 基于局部搜索的多目标社区发现方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄发良 等: "基于多目标优化的网络社区发现方法", 《软件学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106411572A (zh) * 2016-09-06 2017-02-15 山东大学 一种结合节点信息和网络结构的社区发现方法
CN106411572B (zh) * 2016-09-06 2019-05-07 山东大学 一种结合节点信息和网络结构的社区发现方法
CN107276843A (zh) * 2017-05-19 2017-10-20 西安电子科技大学 一种基于Spark平台的多目标进化社区检测方法
CN107276843B (zh) * 2017-05-19 2020-02-07 西安电子科技大学 一种基于Spark平台的多目标进化社区检测方法
CN110085324A (zh) * 2019-04-25 2019-08-02 深圳市华嘉生物智能科技有限公司 一种多重生存终端结果联合分析的方法
CN110085324B (zh) * 2019-04-25 2023-09-08 深圳市华嘉生物智能科技有限公司 一种多重生存终端结果联合分析的方法
CN111309788A (zh) * 2020-03-08 2020-06-19 山西大学 一种银行客户交易网络的社区结构发现方法及系统

Similar Documents

Publication Publication Date Title
Li et al. Fast and accurate mining the community structure: integrating center locating and membership optimization
CN102413029B (zh) 基于分解的局部搜索多目标复杂动态网络社区划分方法
Folino et al. An evolutionary multiobjective approach for community discovery in dynamic networks
Zou et al. Community detection in complex networks: Multi-objective discrete backtracking search optimization algorithm with decomposition
CN102594909B (zh) 基于共邻矩阵谱信息的多目标社区检测方法
Chen et al. Multi-objective optimization of community detection using discrete teaching–learning-based optimization with decomposition
CN103455610B (zh) 基于多目标密母计算的网络社区检测方法
Wang et al. Asymmetric intimacy and algorithm for detecting communities in bipartite networks
CN103325061A (zh) 一种社区发现方法和系统
CN103020163A (zh) 一种网络中基于节点相似度的网络社区划分方法
CN104933103A (zh) 整合结构聚类和属性分类的多目标社区发现方法
CN104657442B (zh) 基于局部搜索的多目标社区发现方法
Kearney et al. Efficient generation of uniform samples from phylogenetic trees
Ghaffaripour et al. A multi-objective genetic algorithm for community detection in weighted networks
Wu et al. An evolutionary multiobjective framework for complex network reconstruction using community structure
Hu et al. A new algorithm CNM-Centrality of detecting communities based on node centrality
Zhang et al. Complex network graph embedding method based on shortest path and moea/d for community detection
Robati et al. Inflation rate modeling: adaptive neuro-fuzzy inference system approach and particle swarm optimization algorithm (ANFIS-PSO)
Prakash et al. A novel hybrid multi-objective evolutionary algorithm for the bi-objective minimum diameter-cost spanning tree (bi-mdcst) problem
CN104156462B (zh) 基于元胞自动学习机的复杂网络社团挖掘方法
Moon et al. Group-based general epidemic modeling for spreading processes on networks: GroupGEM
Guan et al. A unified model for Sierpinski networks with scale-free scaling and small-world effect
Feng et al. Community detection by node betweenness and similarity in complex network
CN115001978B (zh) 一种基于强化学习模型的云租户虚拟网络智能映射方法
Hu et al. Hypernetwork models based on random hypergraphs

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150923

RJ01 Rejection of invention patent application after publication