CN110276376B - 一种基于超元启发算法的人群信息聚类方法 - Google Patents

一种基于超元启发算法的人群信息聚类方法 Download PDF

Info

Publication number
CN110276376B
CN110276376B CN201910396377.6A CN201910396377A CN110276376B CN 110276376 B CN110276376 B CN 110276376B CN 201910396377 A CN201910396377 A CN 201910396377A CN 110276376 B CN110276376 B CN 110276376B
Authority
CN
China
Prior art keywords
clustering
algorithm
crowd
meta
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910396377.6A
Other languages
English (en)
Other versions
CN110276376A (zh
Inventor
李武朝
郭为安
汪镭
毛杰
司呈勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiaxing Vocational and Technical College
Original Assignee
Jiaxing Vocational and Technical College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiaxing Vocational and Technical College filed Critical Jiaxing Vocational and Technical College
Priority to CN201910396377.6A priority Critical patent/CN110276376B/zh
Publication of CN110276376A publication Critical patent/CN110276376A/zh
Application granted granted Critical
Publication of CN110276376B publication Critical patent/CN110276376B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Molecular Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了基于超元启发算法的人群信息聚类方法。它解决了现有技术难以实现在动态环境中建立人群的聚类的问题。本方法包括以下步骤:根据人群的社交网络建立社交图模型;根据上述模型获得邻接矩阵A及该矩阵的元素a_{ij};获取节点i的等级;通过对节点i的等级进行分析判断,确立强感官群体和弱感官群体,从而定义人群信息的聚类目标,所述的聚类目标包括聚类目标NRA和聚类目标RC;设计超元启发式算法对所述的聚类目标进行聚类处理。本方法能有效提高人群信息的动态网络环境下算法的聚类能力,提高聚类质量。

Description

一种基于超元启发算法的人群信息聚类方法
技术领域
本发明属于信息处理技术领域,涉及一种基于超元启发算法的人群信息聚类方法。
背景技术
当前,我国的各类社交软件不断发展并广泛应用,给人民群众的生活娱乐方式带来了诸多的便利。然而,利用社交网络进行团伙式的违法犯罪行为也具有更高的隐蔽性、更强的破坏性,给人民群众的生命财产安全造成隐患。因此通过对社交网络中的人群数据信息进行聚类,将有效地挖掘不同小众群体的人员结构及其在社会大数据网络中的关系。
在过去的十年不断涌现出了各种类型的网络聚类算法,其中较为著名的算法包括Girvan-Newman算法,快速贪婪模块优化,马尔科夫聚类算法等。对网络中的人群信息进行检测已经成为社会数据分析中的重要研究方向,Orman以及Forunato提出的网络数据聚类方法已经被应用于社会网络中的人群检测。然而,由于网络结构形式各异且复杂多变,因此传统启发式优化方法往往无法满意的求解人群信息的聚类与模式识别问题。为了对人群信息进行检测与识别,元启发式算法引起了学者们的广泛关注。这些算法在局部学习和全局搜索能力方面具有更为显著的优势,在多数研究中均表现出了比传统启发式算法更为显著的优化能力。在元启发式算法中,人群数量可以由算法自动的设定,并能够实现在线的动态变化。许多学者已经将一些元启发式算法应用于网络聚类问题,如进化算法和粒子群优化算法等。在这一研究中,Pizzuti等提出了网络聚类的单目标遗传算法,Gong提出基于Memetic算法提出了面向网络聚类问题的Memenet算法。尽管这些单目标算法在人群信息聚类的理论与应用中都很成功,仍然存在以下问题并未得到解决:1.不同算法对于相同网络会产生不同的聚类模式,即人群环境将发生变化;2.用户需要实现设定好人群数量用于聚类,无法根据人群信息的特征自适应地设定不同的算法,即人员个体在群体中的行为将发生变化。然而在实际网络中,这些信息通常无法事先预知且存在动态特性,因此如何在动态环境中建立人群的聚类信息是当前人群信息聚类分析中面临的难点问题。
发明内容
针对上述背景技术中人群信息的特点,本发明提供了一种基于超元启发算法的人群信息聚类方法。
本发明的目的可通过下列技术方案来实现:
一种基于超元启发算法的人群信息聚类方法,其特征在于,包括以下步骤:
A、根据人群的社交网络建立社交图模型,该模型表示为:G=G(N,V),其中,N为节点数,V为节点间的关系;
B、根据上述模型获得邻接矩阵A,该矩阵的元素a_{ij}表示为:
Figure BDA0002058279140000021
其中,L(i,j)表示节点i和节点j是连接的;w_{ij}代表两个节点的权值;
C、获取节点i的等级,具体表示为
Figure BDA0002058279140000022
D、通过对节点i的等级进行分析判断,确立强感官群体和弱感官群体,从而定义人群信息的聚类目标,所述的聚类目标包括聚类目标NRA和聚类目标RC;
E、设计超元启发式算法对所述的聚类目标进行聚类处理。
在上述的一种基于超元启发算法的人群信息聚类方法中,所述的节点i的等级具体表示为:
Figure BDA0002058279140000031
其中,
Figure BDA0002058279140000032
其中,S为人群的聚类类别,将社交网络划分为m个社区,则S={S1,S2,...,Sm},
Figure BDA0002058279140000033
为第i个节点的入度,
Figure BDA0002058279140000034
为第i个节点的出度;
在上述的一种基于超元启发算法的人群信息聚类方法中,所述的聚类目标的定义如下:
Figure BDA0002058279140000035
在上述的一种基于超元启发算法的人群信息聚类方法中,所述的人群信息聚类目标的目标函数包括:人群的爱好、出没地点、作息习惯和社会网络结构。
在上述的一种基于超元启发算法的人群信息聚类方法中,所述的超元启发式算法包括如下步骤:
e1、初始化种群信息;
e2、对种群信息进行分组形成n个子种群;
e3、采用n个算法分别对n个子种群进行一一对应的并行运算;
e4、输出运算结果,并利用评估器对并行运算的结果进行评估;
e5、根据评估结果选出最佳算法,并利用该最佳算法进行一定次数的迭代计算;
e6、输出当前全体子种群,并判断各子种群是否满足优化的终止条件:如果满足,则输出结果;如果不满足,则重新进行种群分组。
在上述的一种基于超元启发算法的人群信息聚类方法中,所述的并行运算过程中,设计算法的重组器来选择合适的算法。
在上述的一种基于超元启发算法的人群信息聚类方法中,所述的重组器用于从n个算法中重组出m个合适的算法,其中n大于m。
在上述的一种基于超元启发算法的人群信息聚类方法中,所述的算法包括粒子群算法、蚁群算法、遗传算法、模拟退火算法、人工神经网络算法和GRASP with path-relinking算法中的至少两种。
在上述的一种基于超元启发算法的人群信息聚类方法中,所述的评估器用于对运算结果进行个体评估和子算法评估;所述的个体评估用于评估出运算结果中的普通个体和较好个体,所述的子算法评估用于对较好个体进行算法评估。
与现有技术相比,本基于超元启发算法的人群信息聚类方法具有以下优点:1、人群信息的聚类更加精准;算法对不同问题的自适应性大幅提高;3、有效提高人群信息的动态网络环境下算法的聚类能力,提高聚类质量;3、算法的空间复杂度降低,效率提高。
附图说明
图1是本发明实施例中人群的社交网络的结构示意图。
图2是本发明实施例中超元启发式算法的框架。
具体实施方式
以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
如图1所示,本基于超元启发算法的人群信息聚类方法包括以下步骤:
A、根据人群的社交网络建立社交图模型,该模型表示为:G=G(N,V),其中,N为节点数,其对应人员信息,N的维度包括年龄、性别、民族等特征信息;V为节点间的关系,其对应不同人员之间的联系度,上述信息可由注册在案的人员关系获得,也将有人员往来大数据分析补充获得。
B、根据上述模型获得邻接矩阵A,该矩阵的元素a_{ij}表示为:
Figure BDA0002058279140000051
其中,L(i,j)表示节点i和节点j是连接的;w_{ij}代表两个节点的权值;人群信息网络的聚类中需要决定网络中节点的特征相似点,进而进行信息分类。如果一个网络在两个节点被连接时是不直接的和不权重的,那么a_{ij}=1;相反则a_{ij}=0。
C、获取节点i的等级:
Figure BDA0002058279140000052
其具体可以表示为:
Figure BDA0002058279140000053
其中,
Figure BDA0002058279140000054
其中,S为人群的聚类类别,将社交网络划分为m个社区,则S={S1,S2,...,Sm},
Figure BDA0002058279140000055
为第i个节点的入度,
Figure BDA0002058279140000056
为第i个节点的出度;
D、通过对节点i的等级进行分析判断,确立强感官群体和弱感官群体,在强群体中,每个节点在人群内比在其他社区中有更多的连接。在弱群体中,与其他群体的等级和大于群体内的等级和。从而定义人群信息的聚类目标,所述的聚类目标包括聚类目标NRA和聚类目标RC;NRA具体含义为Negative Ratio Association,RC具体含义为Ratio Cut。聚类目标的定义如下:
Figure BDA0002058279140000061
E、设计超元启发式算法对所述的聚类目标进行聚类处理。其中,人群信息聚类目标的目标函数包括:人群的爱好、出没地点、作息习惯和社会网络结构。超元启发式算法是一类使用元启发式算法思想对各种元启发式算法进行调度、选择的算法,从而提高算法对不同问题的自适应性。如图2所示,在本步骤中采用的超元启发式算法包括如下步骤:
e1、初始化种群信息;
e2、对种群信息进行分组形成n个子种群;
e3、采用n个算法分别对n个子种群进行一一对应的并行运算;同时采用重组器选择合适的算法,利用重组器从n个算法中重组出m个合适的算法,其中n大于m。从而使得元启发式算法的模块可以进行重组和优化,即将不同的算法操作模块作为算法模块群(ModularPopulation/Swarm)进行重组。
e4、输出运算结果,并利用评估器对并行运算的结果进行评估;
e5、根据评估结果选出最佳算法,并利用该最佳算法进行一定次数的迭代计算;评估器用于对运算结果进行个体评估和子算法评估;个体评估用于评估出运算结果中的普通个体和较好个体,子算法评估用于对较好个体进行算法评估。
e6、输出当前全体子种群,并判断各子种群是否满足优化的终止条件:如果满足,则输出结果;如果不满足,则重新进行种群分组。
本实施例中所述的评估器为候选解的评价函数,或者说目标函数。比如我们要最小化y=x1+x2,获得两个解,其中第一个解为[x1=1,x2=3],第二个解为[x1=2,x2=1]。
那么在这个问题中,评估器就是目标函数y=x1+x2,对于第一个解[x1=1,x2=3]来说,他的评估结果就是1+3=4,对于第二个解[x1=2,x2=1]来说,他的评估结果就是2+1=3)
而重组器是指以随机的对现有解集合进行重组,按照上面所说的例子,两个解分别为
解1:[x1=1,x2=3]
解2:[x1=2,x2=1]
那么一种比较简单方便的重组方式就是把解1中的x1与解2中的x1互换,生成新的两个解如下:
新解1:[x1=1,x2=1]
新解2:[x1=2,x2=3]
算法最终利用评估器对解1,解2,新解1,新解2进行评估,保留质量前两名的解,进入下一轮迭代。
采用上述超元启发式算法:一方面,以指数形式进一步扩大了子算法的组合类型,使得超启发式算法具有更强的自适应性;另一方面,该设计将在不增大算法时间复杂度的同时(算法的重组并不改变各算法的最大时间复杂度),有效降低算法的空间复杂度(从n个算法中挑选出m个子算法进行运算,而非全部n个子算法参与运算)。在协同式算法结构设计中,原有的高层结构中的算法或学习机制将被摒弃,取而代之的是不同算法的协同工作。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (7)

1.一种基于超元启发算法的人群信息聚类方法,其特征在于,包括以下步骤:
A、根据人群的社交网络建立社交图模型,该模型表示为:G=G(N,V),其中,N为节点数,V为节点间的关系;
B、根据上述模型获得邻接矩阵A,该矩阵的元素Aij表示为:
Figure FDA0003125623210000011
其中,L(i,j)表示节点i和节点j是连接的;wij代表两个节点的权值;
C、获取节点i的等级,具体表示为
Figure FDA0003125623210000012
D、通过对节点i的等级进行分析判断,确立强感官群体和弱感官群体,从而定义人群信息的聚类目标,所述的聚类目标包括聚类目标NRA和聚类目标RC;
E、设计超元启发式算法对所述的聚类目标进行聚类处理,所述的超元启发式算法包括如下步骤:
e1、初始化种群信息;
e2、对种群信息进行分组形成n个子种群;
e3、采用n个算法分别对n个子种群进行一一对应的并行运算;
e4、输出运算结果,并利用评估器对并行运算的结果进行评估;
e5、根据评估结果选出最佳算法,并利用该最佳算法进行一定次数的迭代计算;
e6、输出当前全体子种群,并判断各子种群是否满足优化的终止条件:如果满足,则输出结果;如果不满足,则重新进行种群分组。
2.根据权利要求1所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的节点i的等级具体表示为:
Figure FDA0003125623210000021
其中,
Figure FDA0003125623210000022
其中,S为人群的聚类类别,将社交网络划分为m个社区,则S={S1,S2,…Sm},
Figure FDA0003125623210000023
为第i个节点的入度,
Figure FDA0003125623210000024
为第i个节点的出度。
3.根据权利要求2所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的聚类目标的定义如下:
Figure FDA0003125623210000025
4.根据权利要求1或2或3所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的人群信息聚类目标的目标函数包括:人群的爱好、出没地点、作息习惯和社会网络结构。
5.根据权利要求1或2或3所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的并行运算过程中,设计算法的重组器来选择合适的算法。
6.根据权利要求5所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的重组器用于从n个算法中重组出m个合适的算法,其中n大于m。
7.根据权利要求1或2或3所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的评估器用于对运算结果进行个体评估和子算法评估;所述的个体评估用于评估出运算结果中的普通个体和较好个体,所述的子算法评估用于对较好个体进行算法评估。
CN201910396377.6A 2019-05-14 2019-05-14 一种基于超元启发算法的人群信息聚类方法 Expired - Fee Related CN110276376B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910396377.6A CN110276376B (zh) 2019-05-14 2019-05-14 一种基于超元启发算法的人群信息聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910396377.6A CN110276376B (zh) 2019-05-14 2019-05-14 一种基于超元启发算法的人群信息聚类方法

Publications (2)

Publication Number Publication Date
CN110276376A CN110276376A (zh) 2019-09-24
CN110276376B true CN110276376B (zh) 2021-10-15

Family

ID=67959830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910396377.6A Expired - Fee Related CN110276376B (zh) 2019-05-14 2019-05-14 一种基于超元启发算法的人群信息聚类方法

Country Status (1)

Country Link
CN (1) CN110276376B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827544B (zh) * 2019-11-11 2022-09-02 重庆邮电大学 一种基于图卷积循环神经网络的短时交通流控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662743A (zh) * 2012-04-13 2012-09-12 南京信息工程大学 一种启发式粗粒度并行网格任务调度方法
CN104615869A (zh) * 2015-01-22 2015-05-13 广西大学 一种基于相似度排挤的多种群模拟退火混合遗传算法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080270269A1 (en) * 2007-04-27 2008-10-30 Gerald Lee Myers Method for stock record verification for small inventory populations
CN103034904A (zh) * 2013-01-11 2013-04-10 上海电机学院 分群萤火虫方法及基于该方法的电力调度系统、方法
CN104182474B (zh) * 2014-07-30 2018-06-05 北京拓明科技有限公司 一种预流失用户的识别方法
CN104951806A (zh) * 2015-07-08 2015-09-30 南京邮电大学 基于split-merge策略的人群分组检测方法
CN106510651B (zh) * 2016-12-09 2019-04-16 广州视源电子科技股份有限公司 一种体温预测算法的评估方法及装置
CN108288855B (zh) * 2018-01-23 2020-11-24 国电南京自动化股份有限公司 一种基于微电网的动态策略仿真与优化方法
CN109033611B (zh) * 2018-07-20 2023-04-07 福州大学 一种vlsi多端点线网绕障碍的布线方法
CN109394183A (zh) * 2018-12-14 2019-03-01 量子云未来(北京)信息科技有限公司 一种医疗疾病预警方法、系统及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662743A (zh) * 2012-04-13 2012-09-12 南京信息工程大学 一种启发式粗粒度并行网格任务调度方法
CN104615869A (zh) * 2015-01-22 2015-05-13 广西大学 一种基于相似度排挤的多种群模拟退火混合遗传算法

Also Published As

Publication number Publication date
CN110276376A (zh) 2019-09-24

Similar Documents

Publication Publication Date Title
Han et al. A novel data clustering algorithm based on modified gravitational search algorithm
Kuo et al. Integration of ART2 neural network and genetic K-means algorithm for analyzing Web browsing paths in electronic commerce
Dash et al. An evolutionary framework based microarray gene selection and classification approach using binary shuffled frog leaping algorithm
CN111950622A (zh) 基于人工智能的行为预测方法、装置、终端及存储介质
Inyang et al. Fuzzy clustering of students' data repository for at-risks students identification and monitoring
Mjahed et al. Hybridization of fuzzy and hard semi-supervised clustering algorithms tuned with ant lion optimizer applied to Higgs boson search
Pang et al. Improving deep forest by screening
Dhankar et al. A systematic review of techniques, tools and applications of machine learning
AL-Behadili Classification algorithms for determining handwritten digit
CN113162919A (zh) 一种基于网络异常流量识别的入侵检测方法
Sawant et al. Study of Data Mining Techniques used for Financial Data Analysis
CN110276376B (zh) 一种基于超元启发算法的人群信息聚类方法
Magdon-Ismail et al. Locating hidden groups in communication networks using hidden markov models
Wang et al. The criticality of spare parts evaluating model using artificial neural network approach
Rabani et al. An optimized firefly algorithm based on cellular learning automata for community detection in social networks
CN106815653B (zh) 一种基于距离博弈的社交网络关系预测方法及系统
Parvin et al. A scalable method for improving the performance of classifiers in multiclass applications by pairwise classifiers and GA
CN110276375B (zh) 一种人群动态聚类信息的识别和处理方法
CN116029760A (zh) 消息推送方法、装置、计算机设备和存储介质
CN115510948A (zh) 一种基于鲁棒图分类的区块链钓鱼检测方法
Alswaitti et al. Training green ai models using elite samples
Bhatia et al. A time series based explainable interval type-2 fuzzy logic system
Stavinova et al. Forecasting of foreign trips by transactional data: A comparative study
Li et al. Applying data mining techniques to direct marketing: challenges and solutions
Zhou et al. Discovering the Lonely Among the Students with Weighted Graph Neural Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20211015

CF01 Termination of patent right due to non-payment of annual fee