CN105405057A - 一种动态复杂网络社区多目标划分方法 - Google Patents
一种动态复杂网络社区多目标划分方法 Download PDFInfo
- Publication number
- CN105405057A CN105405057A CN201510733342.9A CN201510733342A CN105405057A CN 105405057 A CN105405057 A CN 105405057A CN 201510733342 A CN201510733342 A CN 201510733342A CN 105405057 A CN105405057 A CN 105405057A
- Authority
- CN
- China
- Prior art keywords
- community
- node
- network
- modularity
- union
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000005457 optimization Methods 0.000 claims abstract description 9
- 108090000623 proteins and genes Proteins 0.000 claims description 16
- 230000014509 gene expression Effects 0.000 claims description 13
- 210000000349 chromosome Anatomy 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000005065 mining Methods 0.000 claims description 3
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/123—DNA computing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种动态复杂网络社区多目标划分方法,包括:第一步,从文件中读入初始状态下即t=1时刻的网络结构;将模块度作为优化的第一个指标,产生一个网络G1的初始聚类初始聚类中的每个是聚类中的第i个社区;第二步,从文件中读出t=2,…,T时刻的网络图结构,对于每个时间戳t时刻的网络结构同时优化其模块度和标准化互信息值;第三步,对于第二步所得到的种群的所有个体,比较种群中个体的模块度,返回具有最高模块度的Pareto前沿的解集合得到第t个时间戳下的最佳社区划分结果;第四步,对每一个时间戳的取值t=2,…,T,重复以上操作步骤二和步骤三,直到所有的时间戳均获得必要的划分,即t=T。
Description
技术领域
本发明属于计算机领域,涉及动态网络社区划分方法,可用于进行动态复杂网络中的社区划分。
背景技术
关于复杂网络的社区发现是近年的前沿研究热点。对复杂网络的大量研究表示真实的网络存在社区结构。社区内节点的连接相对比较紧密而社团间的节点之间的连接则相对稀少。复杂网络的社区发现和动态网络的社区演化问题在其中作为重要的研究内容也有着其艰巨的研究任务。
专利[CN102768735B]公开了一种基于免疫克隆多目标优化的网络社区划分方法。该方法虽然解决了多目标的网络社区划分方法,但是解决的是静态网络社区划分的问题。论文[Mao-GuoGongetal.CommunityDetectioninDynamicSocialNetworksBasedonMulti-objectiveImmuneAlgorithm.《JOURNALOFCOMPUTERSCIENCEANDTECHNOLOGY》.2012,第27卷(第3期),第455-467页]虽然解决了动态复杂网络的问题,但是其采用的表达方式是基于遗传算法的方法,在解码时比较麻烦,其个体表示方法不够直观。因此,采用直观的表示方法,求解动态复杂网络,并同时具有表达重叠和非重叠社区能力的多目标社区划分方法,仍然是一个未解决的问题。
发明内容
本发明的目的在于针对上述现有技术的不足。提出一种基于基因表达式编程的多目标优化的动态网络社区划分方法,以提高对动态社区的划分的准确性,及表达方式的直观性。
本发明是一种动态复杂网络社区多目标划分方法,其特征在于,包括以下具体步骤:
第一步,从文件中读入初始状态下即t=1时刻的网络结构;将模块度作为优化的第一个指标,产生一个网络G1的初始聚类初始聚类中的每个是聚类中的第i个社区;
第二步,假设动态网络共有T个不同的时间节点。从文件中读出t=2,…,T时刻的网络图结构,对于每个时间戳t时刻的网络结构同时优化其模块度和标准化互信息值,具体的过程是:
S21:产生一组随机线性的基因表达式编程个体,个体的头部长度不超过网络图结构中节点的个数,尾部则是根据节点中所有的节点编号的一个随机排列;S22:将每个种群中的个体表示为一个树形结构,并将其转化为若干个节点的划分,产生对t时刻的网络结构图Gt中的k个连通分量的划分其中CRt为t时刻的社区划分的集合,为t时刻的第k个社区;
S23:计算种群中每一个个体的模块度和标准化互信息值,将这两个值作为个体的两个适应度值;
S24:采用基于非支配排序的带有精英策略的多目标优化算法对个体根据其非支配排列给予每个个体一个排列并根据其排列对其进行排序,并产生下一代种群;
S25,重复以上操作步骤S21到步骤S41,直到达到设定的代数500代;
第三步,对于第二步所得到的种群的所有个体,比较种群中个体的模块度,返回具有最高模块度的Pareto前沿的解集合得到第t个时间戳下的最佳社区划分结果;
第四步,对每一个时间戳的取值t=2,…,T,重复以上操作步骤二和步骤三,直到所有的时间戳均获得必要的划分,即t=T。
进一步,所述第三步中,基因表达式编程个体的函数集F={∪}是一个并运算,终结符取的是节点的标签,节点的标签由整数表示,有n个节点的终结符即为T={0,1,...,n-1}。
所述的基因表达式编程中运算符的并运算∪作为一个二元运算符,可以有二个孩子节点,其孩子节点可以是并运算∪,也可以是终结符;终结符没有孩子节点;即对于一个根节点是并运算∪的基因而言,其孩子可以是并运算∪,可以是终结符即网络中的节点标签,对于并运算∪的节点而言,其两个孩子分支可以递归地使用本规则,对于终结符而言,该分支终止。
两个并运算∪之间的节点属于前一个并运算所包含的社区;其中对于非重叠社区的社区划分时,网络中的每个节点都必须要出现且仅出现一次在染色体个体中,每个基因本身不含重复的节点,基因和基因的元素集合之间不能有交集。对于重叠社区挖掘,所述的染色体个体中的每个基因编号可以出现多次,这意味着一个节点允许包含在多个社区中;即允许出现重叠社区的情况。
多个连续的∪可以简化为一个∪。
步骤S24中使用基于非支配排序的带有精英策略的多目标优化算法时,在快速非支配排序中各个目标函数的值的计算可以并行执行以此来缩短执行时间;该方法在是现实采用并发容器来作为缓存,可以发现在计算的过程中会有很多重复的计算操作,引入缓存可以大量减少重复计算提高效率,以空间换时间,可提高计算的效率。
附图说明
图1为本发明的流程图;
图2为本发明的基因表达式编程树形结构;
图3为用本发明的社区划分结果示例;
具体实施方案
本发明是一种动态复杂网络社区多目标划分方法,包括以下具体步骤:
第一步,从文件中读入初始状态下即t=1时刻的网络结构。将模块度作为优化的第一个指标,产生一个网络G1的初始聚类初始聚类中的每个是聚类中的第i个社区。
第二步,假设动态网络共有T个不同的时间节点。从文件中读出t=2,…,T时刻的网络图结构,对于每个时间戳t时刻的网络结构同时优化其模块度和标准化互信息值,具体的过程是:
S21:产生一组随机线性的基因表达式编程个体,个体的头部长度不超过网络图结构中节点的个数,尾部则是根据节点中所有的节点编号的一个随机排列。
S22:将每个种群中的个体表示为一个树形结构,并将其转化为若干个节点的划分,产生对t时刻的网络结构图Gt中的k个连通分量的划分其中CRt为t时刻的社区划分的集合,为t时刻的第k个社区;
S23:计算种群中每一个个体的模块度和标准化互信息值,将这两个值作为个体的两个适应度值。
S24:采用基于非支配排序的带有精英策略的多目标优化算法对个体根据其非支配排列给予每个个体一个排列并根据其排列对其进行排序,并产生下一代种群。
S25,重复以上操作步骤S41到步骤S44,直到达到设定的代数500代。
第三步,对于第二步所得到的种群的所有个体,比较种群中个体的模块度,返回具有最高模块度的Pareto前沿的解集合得到第t个时间戳下的最佳社区划分结果。
第四步,对每一个时间戳的取值t=2,…,T,重复以上操作步骤二和步骤三,直到所有的时间戳均获得必要的划分,即t=T。
所述第三步中,基因表达式编程个体的函数集F={∪}是一个并运算,终结符取的是节点的标签,节点的标签由整数表示,有n个节点的终结符即为T={0,1,...,n-1}。
基因表达式编程种运算符的并运算∪作为一个二元运算符,可以有二个孩子节点,其孩子节点可以是并运算∪,也可以是终结符。终结符没有孩子节点。例如假设T={0,1,2},一个基因为∪∪012,其中头部长度为2,尾部长度为3,该基因的树型结构如图1所示。
两个并运算∪之间的节点属于前一个并运算所包含的社区;其中对于非重叠社区的社区划分时,网络中的每个节点都必须要出现且仅出现一次在染色体个体中,每个基因本身不含重复的节点,基因和基因的元素集合之间不能有交集。例如∪0123∪456∪789表示如下的网络结构。其中的每一个虚线框表示一个社区。在此,社区不会发生交叉。
对于重叠社区挖掘,所述的染色体个体中的每个基因编号可以出现多次,这意味着一个节点允许包含在多个社区中。即允许出现重叠社区的情况。
多个连续的∪可以简化为一个∪。例如,上述的结构可以简化为∪012。
步骤S24中使用基于非支配排序的带有精英策略的多目标优化算法时,在快速非支配排序中各个目标函数的值的计算可以并行执行以此来缩短执行时间;该方法在是现实采用并发容器来作为缓存,可以发现在计算的过程中会有很多重复的计算操作,引入缓存可以大量减少重复计算提高效率,以空间换时间,可提高计算的效率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (7)
1.一种动态复杂网络社区多目标划分方法,包括以下具体步骤:
第一步,从文件中读入初始状态下即t=1时刻的网络结构;将模块度作为优化的第一个指标,产生一个网络G1的初始聚类初始聚类中的每个是聚类中的第i个社区;
第二步,假设动态网络共有T个不同的时间节点。则从文件中读出t=2,…,T时刻的网络图结构,对于每个时间戳t时刻的网络结构同时优化其模块度和标准化互信息值,具体的过程是:
S21:产生一组随机线性的基因表达式编程个体,个体的头部长度不超过网络图结构中节点的个数,尾部则是根据节点中所有的节点编号的一个随机排列;
S22:将每个种群中的个体表示为一个树形结构,并将其转化为若干个节点的划分,产生对t时刻的网络结构图Gt中的k个连通分量的划分其中CRt为t时刻的社区划分的集合,为t时刻的第k个社区;
S23:计算种群中每一个个体的模块度和标准化互信息值,将这两个值作为个体的两个适应度值;
S24:采用基于非支配排序的带有精英策略的多目标优化算法对个体根据其非支配排列给予每个个体一个排列并根据其排列对其进行排序,并产生下一代种群;S25,重复以上操作步骤S21到步骤S24,直到达到设定的代数500代;
第三步,对于第二步所得到的种群的所有个体,比较种群中个体的模块度,返回具有最高模块度的Pareto前沿的解集合得到第t个时间戳下的最佳社区划分结果;
第四步,对每一个时间戳的取值t=2,…,T,重复以上操作步骤二和步骤三,直到所有的时间戳均获得必要的划分,即t=T。
2.根据权利要求1所述的方法,其特征在于:所述第三步中,基因表达式编程个体的函数集F={∪}是一个并运算,终结符取的是节点的标签,节点的标签由整数表示,有n个节点的终结符即为T={0,1,...,n-1}。
3.根据权利要求2所述的方法,其特征在于:所述的基因表达式编程中运算符的并运算∪作为一个二元运算符,可以有二个孩子节点,其孩子节点可以是并运算∪,也可以是终结符;终结符没有孩子节点;即对于一个根节点是并运算∪的基因而言,其孩子可以是并运算∪,可以是终结符即网络中的节点标签,对于并运算∪的节点而言,其两个孩子分支可以递归地使用本规则,对于终结符而言,该分支终止。
4.根据权利要求3所述的方法,其特征在于:两个并运算∪之间的节点属于前一个并运算所包含的社区;其中对于非重叠社区的社区划分时,网络中的每个节点都必须要出现且仅出现一次在染色体个体中,每个基因本身不含重复的节点,基因和基因的元素集合之间不能有交集。
5.如权利要求4所述的方法,其特征在于:对于重叠社区挖掘,所述的染色体个体中的每个基因编号可以出现多次,这意味着一个节点允许包含在多个社区中;即允许出现重叠社区的情况。
6.根据权利要求2所述的方法,其特征在于:多个连续的∪可以简化为一个∪。
7.根据权利要求1所述的方法,其特征在于:步骤S24中使用基于非支配排序的带有精英策略的多目标优化算法时,在快速非支配排序中各个目标函数的值的计算可以并行执行以此来缩短执行时间;该方法在是现实采用并发容器来作为缓存,可以发现在计算的过程中会有很多重复的计算操作,引入缓存可以大量减少重复计算提高效率,以空间换时间,可提高计算的效率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510733342.9A CN105405057A (zh) | 2015-11-02 | 2015-11-02 | 一种动态复杂网络社区多目标划分方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510733342.9A CN105405057A (zh) | 2015-11-02 | 2015-11-02 | 一种动态复杂网络社区多目标划分方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105405057A true CN105405057A (zh) | 2016-03-16 |
Family
ID=55470526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510733342.9A Pending CN105405057A (zh) | 2015-11-02 | 2015-11-02 | 一种动态复杂网络社区多目标划分方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105405057A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114548582A (zh) * | 2022-02-28 | 2022-05-27 | 西安电子科技大学 | 动态社交网络社区演化预测方法、系统、存储介质及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102594909A (zh) * | 2012-03-14 | 2012-07-18 | 西安电子科技大学 | 基于共邻矩阵谱信息的多目标社区检测方法 |
CN103745258A (zh) * | 2013-09-12 | 2014-04-23 | 北京工业大学 | 基于最小生成树聚类的遗传算法的复杂网络社区挖掘方法 |
-
2015
- 2015-11-02 CN CN201510733342.9A patent/CN105405057A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102594909A (zh) * | 2012-03-14 | 2012-07-18 | 西安电子科技大学 | 基于共邻矩阵谱信息的多目标社区检测方法 |
CN103745258A (zh) * | 2013-09-12 | 2014-04-23 | 北京工业大学 | 基于最小生成树聚类的遗传算法的复杂网络社区挖掘方法 |
Non-Patent Citations (4)
Title |
---|
(美)布莱尔查普尔,(美)斯托克斯: "《Intel Parallel Studio环境下的并行程序设计》", 30 April 2013, 北京:清华大学出版社 * |
NEWMAN M. E. J.: "Detecting community structure in networks", 《EUROPEAN PHYSICAL JOURNAL (B)》 * |
张岭军: "基于多目标免疫算法的动态网络社区检测", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
王艳辉: "基于进化多目标优化的演化聚类及其应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114548582A (zh) * | 2022-02-28 | 2022-05-27 | 西安电子科技大学 | 动态社交网络社区演化预测方法、系统、存储介质及设备 |
CN114548582B (zh) * | 2022-02-28 | 2024-05-31 | 西安电子科技大学 | 动态社交网络社区演化预测方法、系统、存储介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hoffman | On simple linear programming problems | |
CN106897351B (zh) | 有向无环图型区块链的生成方法及系统 | |
CN103426042B (zh) | 社交网络的分组方法及系统 | |
CN102810113B (zh) | 一种针对复杂网络的混合型聚类方法 | |
CN105515997B (zh) | 基于bf_tcam实现零范围扩张的高效范围匹配方法 | |
CN103902544A (zh) | 一种数据处理方法及系统 | |
CN103455531A (zh) | 一种支持高维数据实时有偏查询的并行索引方法 | |
CN103384354A (zh) | 一种无源光网络光分配网的优化设计方法 | |
CN104933143A (zh) | 获取推荐对象的方法及装置 | |
CN107565973A (zh) | 一种结点可扩展的哈夫曼编码的实现方法及电路结构 | |
CN101963944A (zh) | 对象存储方法和系统 | |
CN109189393A (zh) | 业务处理方法及装置 | |
CN103581358A (zh) | Ip地址列表匹配方法及装置 | |
Adan et al. | Erlang arrivals joining the shorter queue | |
CN109254962B (zh) | 一种基于t-树的索引优化方法、装置及存储介质 | |
CN108614932B (zh) | 基于边图的线性流重叠社区发现方法、系统及存储介质 | |
CN103810197A (zh) | 一种基于Hadoop的数据处理方法及其系统 | |
CN105138527A (zh) | 一种数据分类回归方法及装置 | |
CN105405057A (zh) | 一种动态复杂网络社区多目标划分方法 | |
CN104036052A (zh) | 一种基于历史经验的谓词索引匹配方法 | |
CN102420812A (zh) | 一种支持分布并行处理的Web服务自动QoS组合方法 | |
Dmitrii | An analysis of shortage minimization models to assess power system adequacy | |
CN116738983A (zh) | 模型进行金融领域任务处理的词嵌入方法、装置、设备 | |
CN106844533A (zh) | 一种数据分组聚集方法及装置 | |
CN104932982B (zh) | 一种消息访存的编译方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160316 |
|
RJ01 | Rejection of invention patent application after publication |