CN105426910A - 一种基于改进abc算法与de变异策略的自适应聚类方法 - Google Patents

一种基于改进abc算法与de变异策略的自适应聚类方法 Download PDF

Info

Publication number
CN105426910A
CN105426910A CN201510766519.5A CN201510766519A CN105426910A CN 105426910 A CN105426910 A CN 105426910A CN 201510766519 A CN201510766519 A CN 201510766519A CN 105426910 A CN105426910 A CN 105426910A
Authority
CN
China
Prior art keywords
clustering
fitness
adaptive
algorithm
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510766519.5A
Other languages
English (en)
Other versions
CN105426910B (zh
Inventor
蒋炯明
薛羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yiyoule Network Technology Beijing Co ltd
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201510766519.5A priority Critical patent/CN105426910B/zh
Publication of CN105426910A publication Critical patent/CN105426910A/zh
Application granted granted Critical
Publication of CN105426910B publication Critical patent/CN105426910B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

本发明公开了一种基于改进ABC算法与DE变异策略的自适应聚类方法,该方法采用变异和交叉两个操作代替原算法ABC中单一的搜索操作,采用自适应的DE变异策略和新的概率选择值方法代替原方法。本发明在一定程度上解决了传统聚类算法后期容易陷入局部最优的缺点,且搜索速度相对较慢的缺陷,将改进ABC算法与DE结合,重新定义人工蜂位置更新公式,使算法尽可能的跳出局部最优,从而找到全局最优解。该方法的聚类结果更具多样性和准确性,且算法速度及效率都具有一定的优势。

Description

一种基于改进ABC算法与DE变异策略的自适应聚类方法
技术领域
本发明涉及一种聚类方法,特别是涉及一种基于改进ABC算法与DE变异策略的自适应聚类方法,属于数据挖掘技术领域。
背景技术
群体智能进化算法从20世纪90年代发展至今,以其对函数要求低、进化过程与初始值无关、搜索速度快等优点,迅速成为进化算法的一个重要分支,并成为新的学术研究热点。其中比较成熟的算法有Dorgo等人提出的蚁群算法(AntColonyOptimization)和Kennedy等人提出的粒子群算法(ParticleSwarmOptimization)。近年来,人工蜂群(ArtificialBeeColony,ABC)算法也越来越多地受到人们的关注。Karaboga于2005年提出人工蜂群算法,该算法是基于蜜蜂群体智能的优化算法,通过模拟蜂群依各自分工不同智能采蜜,交换蜜源信息找到最优蜜源。相比于其他经典的进化算法,ABC算法更简单易用。
聚类是指将多个具有类似特性的对象组成多个类的过程,聚类的目的就是在相似的基础上收集数据来分类。聚类目前在很多不同领域都得到非常广泛的应用并且得到了相应的发展,包括计算机科学与技术、统计学、生物学等。最常见的聚类算法是k-means算法,它具有优秀的局部搜索能力,能很好的解决一些聚类问题,但是自身还存在一定的缺陷,其中比较严重的缺点就是容易陷入“早熟”,即非常容易陷入局部最优的缺点。
发明内容
本发明所要解决的技术问题是:提供一种基于改进ABC算法与DE变异策略的自适应聚类方法,通过改进ABC的变异策略,并增加了自适应机制,在一定程度上解决了容易陷入局部最优的缺点。
本发明为解决上述技术问题采用以下技术方案:
一种基于改进ABC算法与DE变异策略的自适应聚类方法,包括如下步骤:
步骤1,初始化自适应聚类的各参数,包括:聚类数目、蜜蜂种群数目、开采极限以及最大迭代次数;根据聚类数目随机对待聚类样本进行聚类划分,且聚类划分次数等于蜜蜂种群数目,得到蜜蜂种群数目的聚类划分;计算各聚类划分的适应度,并找出最优适应度及其对应的聚类划分;
步骤2,对于步骤1得到的聚类划分,从第一个聚类划分开始,采用变异和交叉两个过程产生新的聚类划分,计算新的聚类划分的适应度,并与当前最优适应度比较,若新的适应度优于当前最优适应度,则用新的聚类划分替换第一个聚类划分,且新的聚类划分的开采次数置为0,否则,第一个聚类划分的开采次数加1;重复上述过程,直至最后一个聚类划分结束;
步骤3,对于步骤2迭代之后的聚类划分,计算各聚类划分的概率值,计算公式为prob=(0.9*Fitness/max(Fitness))+0.1,其中,prob表示各聚类划分的概率值,Fitness表示当前计算的聚类划分的适应度,max(Fitness)表示迭代之后的聚类划分适应度的最大值;
步骤4,随机产生一0-1之间的随机数,并与步骤3得到的概率值比较,对概率值大于随机数的聚类划分重复步骤2的迭代过程;重复上述过程,且产生随机数的次数等于蜜蜂种群数目;
步骤5,对于步骤4迭代之后的聚类划分,判断各聚类划分的开采次数是否大于开采极限,若大于开采极限,则随机生成一新的聚类划分替换开采次数大于开采极限的聚类划分,且将新的聚类划分的开采次数置为0;
步骤6,重复步骤2-步骤5,直至达到步骤1的最大迭代次数,输出最优的聚类划分。
作为本发明的优选方案,步骤1所述适应度的计算公式为:其中,FV表示适应度,k表示聚类数目,Xi表示待聚类样本,Cj表示第j个聚类的聚类中心,d(Xi,Cj)表示待聚类样本Xi到对应聚类中心Cj的距离。
作为本发明的优选方案,步骤2所述变异的计算公式为: V G + 1 = X b e s t G + F ( X r 1 G - X r 2 G ) + F ( X r 3 G - X r 4 G ) , 其中,F为随机数,VG+1表示新的聚类划分,表示当前最优适应度对应的聚类划分,分别表示当前聚类划分中除最优适应度对应的聚类划分之外的随机聚类划分。
作为本发明的优选方案,步骤2所述交叉的计算公式为: V G + 1 = X r 1 G + F ( X r 2 G - X r 3 G ) + F ( X r 4 G - X r 5 G ) , 其中,F为随机数,VG+1表示新的聚类划分, 分别表示当前聚类划分中的随机聚类划分。
作为本发明的优选方案,所述F的计算公式为:其中,G表示当前迭代次数,maxCycle表示最大迭代次数。
一种指纹自适应聚类方法,包括如下步骤:
步骤1,获取指纹样本集,并对指纹样本集中的各指纹样本编号;
步骤2,利用如上所述基于改进ABC算法与DE变异策略的自适应聚类方法对指纹样本集进行聚类,得到指纹聚类结果。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明基于改进ABC算法与DE变异策略的自适应聚类方法,将改进ABC算法与DE结合,重新定义人工蜂位置更新公式,使算法尽可能的跳出局部最优,从而找到全局最优解。
2、本发明基于改进ABC算法与DE变异策略的自适应聚类方法,增加了自适应概率选择机制,扩大了蜂群的搜索范围,从而提高了算法的搜索效率。
3、本发明基于改进ABC算法与DE变异策略的自适应聚类方法,能够增快收敛速度,提高其局部搜索能力,提高后期搜索速度。
附图说明
图1是本发明基于改进ABC算法与DE变异策略的自适应聚类方法的流程图。
图2是算法参数与具体问题的对应关系。
图3是实施例待聚类样本及其对应编号,其中手写体为待聚类样本,右下角数字为对应编号。
图4是实施例采用本发明聚类方法得到的最优解,即待聚类样本的最终聚类号。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
人工蜂群算法受启发于蜜蜂的觅食行为,这种算法主要基于蜜蜂群的觅食行为模型。这个模型包含了三种核心元素:雇佣蜂、非雇佣蜂和食物源,前两者负责搜寻蜂巢附近的富源。这种模型也定义了两种指引模式:富源会反馈积极信号,从而引导更多的蜜蜂来采蜜;贫源会反馈消极信号,会导致放弃这个食物源。这两种行为是自组织的和群智能的。
如图1所示,本发明聚类方法的工作流程如下:
步骤1,初始化各个参数
1.1初始化聚类数目CN,聚类划分种群P,聚类样品开采极限limit,迭代次数maxCycle;
1.2设定最初的聚类划分,这里每个类中的样品都是随机指定的,处于假设情况,并不是最优解;
1.3按照公式(1)计算聚类划分种群P的适应度FV,并找出最优适应度及其对应的聚类划分。
F V = 1 Σ j = 1 k Σ X i = C j d ( X i , C j ) - - - ( 1 )
步骤2,雇佣蜂阶段
2.1对于选择的聚类划分,雇佣蜂采用变异和交叉两个过程产生一个新的划分,具体公式如(2)、(3)所示;
V G + 1 = X b e s t G + F ( X r 1 G - X r 2 G ) + F ( X r 3 G - X r 4 G ) - - - ( 2 )
V G + 1 = X r 1 G + F ( X r 2 G - X r 3 G ) + F ( X r 4 G - X r 5 G ) - - - ( 3 )
2.2计算新的聚类划分的适应度,然后使用贪婪选择比较雇佣蜂的新聚类划分与原聚类划分的适应度比较,如果计算得到的新的适应度得到改善,则雇佣蜂替换为在新位置开采,并将聚类样品开采极限limit置为0。否则,继续在原来的蜜源开采,并将limit的次数加1。
步骤3,采用方法prob=(0.9*Fitness/max(Fitness))+0.1计算选择概率值。原算法使用轮盘赌产生概率,而我们改进后用当前适应度与最大适应度的比值作为参考计算,这样做的好处是可以让选择更加全面,避免过早陷入局部最优。人工蜂会根据概率选择,即概率越优的聚类划分优化的次数也越多,反之,概率最差的聚类划分在一些情况下则考虑舍弃。
步骤4,观察蜂阶段
4.1选择适应度相对较高的聚类划分作为观察蜂开采的位置,适应度越高的聚类划分选择的次数也会越多;
4.2使用公式(2)、(3)产生一个新解,此处也是先变异,后交叉;
4.3计算新的聚类划分的适应度,然后使用贪婪选择比较观察蜂的新聚类划分与原聚类划分的适应度比较,如果计算得到的新的适应度得到改善,则雇佣蜂替换为在新位置开采,并将聚类样品开采极限limit置为0。否则,继续在原来的蜜源开采,并将limit的次数加1。
步骤5,侦察蜂阶段
对于每一个聚类划分,判断其中的样品开采次数是否大于limit,如果大于limit,侦察蜂则会随机生成一个新的划分,并且计算适应度值,将开采次数置为0。否则,继续向下执行。
步骤6,如果满足最大迭代次数,输出最优分类情况,即最优的聚类划分;否则,跳到步骤2。
如图2所示,在ABC中,把待求解的问题的解看作是人工食物,食物越充足,表示解的质量越好,然后一群人工蜜蜂会去搜寻富源,从而找到一个相关问题的比较好的解。为了应用ABC,待求解的问题首先要转化为最优化问题,也就是找到一组参数向量,使得目标函数最小化。人工蜂群就会随机初始化一些解,然后通过迭代,使用邻居搜索的策略来向更好的解靠近,并放弃差的解,逐步提高解的质量。
如图3所示,为本发明实施例中待聚类指纹及其对应编号,图中有8种指纹,现要将其分成4类,基于改进ABC算法与DE变异策略的自适应聚类方法找到的最优解如图4所示。本方法采用欧氏距离,可以发现纹理类似的指纹被归为一类,分到相同的聚类号,且聚类结果全部正确,具体执行过程如下:
步骤1,根据实际问题测试函数初始化各个参数
1.1初始解时各个指纹的聚类编码为(2,1,4,3,1,2,4,3),每个类中的指纹都是随机指定的,这是假设的解,并不是最优解;
1.2采用公式(1)计算初始解的适应度值。
步骤2,雇佣蜂阶段
2.1对于每一个初始解来说,使用公式(2)、(3)产生一个新解,即原单一的搜索操作变成变异和交叉两个过程;
2.2对于每一个指纹,根据人工蜂的聚类中心编码,按照最邻近法则确定该指纹的聚类划分,计算新解的适应度值;
2.3使用贪婪选择比较雇佣蜂的新位置与原来位置的适应度比较,如果该位置的适应度得到改善,则替换为在新位置开采,并将指纹开采次数limit次数置为0。否则,继续在原来的位置开采,并将limit的次数加1。
步骤3,计算选择概率值
采用方法prob=(0.9*Fitness/max(Fitness))+0.1计算选择概率值。
步骤4,观察蜂阶段
4.1使用公式(2),(3)产生一个新解,此处也是先变异,后交叉;
4.2对于每一个指纹,根据人工蜂的聚类中心编码,按照最邻近法则确定该样品的聚类划分,计算新解的适应度值;
4.3使用贪婪选择比较新聚类划分和原聚类划分的适应度值,如果新的聚类划分的值比原聚类划分的值好,则替换;否则继续在原位置开采,并将limit加1。
步骤5,侦察蜂阶段
如果划分的样品limit的次数超出预先设定的开采极限,则放弃该指纹的聚类号,重新产生一个新的聚类号;否则,继续在原位置开采。
步骤6,如果满足最大迭代次数,输出最优的聚类划分;否则,跳到步骤2。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (6)

1.一种基于改进ABC算法与DE变异策略的自适应聚类方法,其特征在于:包括如下步骤:
步骤1,初始化自适应聚类的各参数,包括:聚类数目、蜜蜂种群数目、开采极限以及最大迭代次数;根据聚类数目随机对待聚类样本进行聚类划分,且聚类划分次数等于蜜蜂种群数目,得到蜜蜂种群数目的聚类划分;计算各聚类划分的适应度,并找出最优适应度及其对应的聚类划分;
步骤2,对于步骤1得到的聚类划分,从第一个聚类划分开始,采用变异和交叉两个过程产生新的聚类划分,计算新的聚类划分的适应度,并与当前最优适应度比较,若新的适应度优于当前最优适应度,则用新的聚类划分替换第一个聚类划分,且新的聚类划分的开采次数置为0,否则,第一个聚类划分的开采次数加1;重复上述过程,直至最后一个聚类划分结束;
步骤3,对于步骤2迭代之后的聚类划分,计算各聚类划分的概率值,计算公式为prob=(0.9*Fitness/max(Fitness))+0.1,其中,prob表示各聚类划分的概率值,Fitness表示当前计算的聚类划分的适应度,max(Fitness)表示迭代之后的聚类划分适应度的最大值;
步骤4,随机产生一0-1之间的随机数,并与步骤3得到的概率值比较,对概率值大于随机数的聚类划分重复步骤2的迭代过程;重复上述过程,且产生随机数的次数等于蜜蜂种群数目;
步骤5,对于步骤4迭代之后的聚类划分,判断各聚类划分的开采次数是否大于开采极限,若大于开采极限,则随机生成一新的聚类划分替换开采次数大于开采极限的聚类划分,且将新的聚类划分的开采次数置为0;
步骤6,重复步骤2-步骤5,直至达到步骤1的最大迭代次数,输出最优的聚类划分。
2.如权利要求1所述基于改进ABC算法与DE变异策略的自适应聚类方法,其特征在于:步骤1所述适应度的计算公式为:
F V = 1 Σ j = 1 k Σ X i = C j d ( X i , C j ) ,
其中,FV表示适应度,k表示聚类数目,Xi表示待聚类样本,Cj表示第j个聚类的聚类中心,d(Xi,Cj)表示待聚类样本Xi到对应聚类中心Cj的距离。
3.如权利要求1所述基于改进ABC算法与DE变异策略的自适应聚类方法,其特征在于:步骤2所述变异的计算公式为:
V G + 1 = X b e s t G + F ( X r 1 G - X r 2 G ) + F ( X r 3 G - X r 4 G ) ,
其中,F为随机数,VG+1表示新的聚类划分,表示当前最优适应度对应的聚类划分, 分别表示当前聚类划分中除最优适应度对应的聚类划分之外的随机聚类划分。
4.如权利要求1所述基于改进ABC算法与DE变异策略的自适应聚类方法,其特征在于:步骤2所述交叉的计算公式为:
V G + 1 = X r 1 G + F ( X r 2 G - X r 3 G ) + F ( X r 4 G - X r 5 G ) ,
其中,F为随机数,VG+1表示新的聚类划分,分别表示当前聚类划分中的随机聚类划分。
5.如权利要求3或4所述基于改进ABC算法与DE变异策略的自适应聚类方法,其特征在于:所述F的计算公式为:其中,G表示当前迭代次数,maxCycle表示最大迭代次数。
6.一种指纹自适应聚类方法,其特征在于:包括如下步骤:
步骤1,获取指纹样本集,并对指纹样本集中的各指纹样本编号;
步骤2,利用如权利要求1所述基于改进ABC算法与DE变异策略的自适应聚类方法对指纹样本集进行聚类,得到指纹聚类结果。
CN201510766519.5A 2015-11-11 2015-11-11 一种基于改进abc算法与de变异策略的自适应聚类方法 Expired - Fee Related CN105426910B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510766519.5A CN105426910B (zh) 2015-11-11 2015-11-11 一种基于改进abc算法与de变异策略的自适应聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510766519.5A CN105426910B (zh) 2015-11-11 2015-11-11 一种基于改进abc算法与de变异策略的自适应聚类方法

Publications (2)

Publication Number Publication Date
CN105426910A true CN105426910A (zh) 2016-03-23
CN105426910B CN105426910B (zh) 2018-11-27

Family

ID=55505108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510766519.5A Expired - Fee Related CN105426910B (zh) 2015-11-11 2015-11-11 一种基于改进abc算法与de变异策略的自适应聚类方法

Country Status (1)

Country Link
CN (1) CN105426910B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115082445A (zh) * 2022-07-25 2022-09-20 山东鲁泰防水科技有限公司 一种建筑防水卷材表面缺陷检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102170137A (zh) * 2011-04-26 2011-08-31 华北电力大学 一种电力系统配电网的无功优化方法
US20130051632A1 (en) * 2011-08-25 2013-02-28 King Saud University Passive continuous authentication method
CN103544547A (zh) * 2013-11-02 2014-01-29 南京航空航天大学 一种基于离散化全局分布搜索的可信服务组合方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102170137A (zh) * 2011-04-26 2011-08-31 华北电力大学 一种电力系统配电网的无功优化方法
US20130051632A1 (en) * 2011-08-25 2013-02-28 King Saud University Passive continuous authentication method
CN103544547A (zh) * 2013-11-02 2014-01-29 南京航空航天大学 一种基于离散化全局分布搜索的可信服务组合方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
WEIFENGGAO等: "Improved artificial bee colony algorithm for global optimization", 《INFORMATION PROCESSING LETTERS》 *
YUANCHENGLI等: "A hybrid artificial bee colony assisted differential evolution algorithm for optimal reactive power flow", 《INTERNATIONAL JOURNAL OF ELECTRICAL POWER & ENERGY SYSTEMS》 *
黄玲玲等: "具有人工蜂群搜索策略的差分进化算法", 《控制与决策》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115082445A (zh) * 2022-07-25 2022-09-20 山东鲁泰防水科技有限公司 一种建筑防水卷材表面缺陷检测方法

Also Published As

Publication number Publication date
CN105426910B (zh) 2018-11-27

Similar Documents

Publication Publication Date Title
CN106096727B (zh) 一种基于机器学习的网络模型构造方法及装置
CN103116762B (zh) 一种基于自调制字典学习的图像分类方法
CN103116766B (zh) 一种基于增量神经网络和子图编码的图像分类方法
CN102214213B (zh) 一种采用决策树的数据分类方法和系统
CN105868775A (zh) 基于pso算法的不平衡样本分类方法
CN102054002A (zh) 一种数据挖掘系统中决策树的生成方法及装置
CN103324954A (zh) 一种基于树结构的图像分类方法及其系统
CN111210023B (zh) 数据集分类学习算法自动选择系统及方法
CN106991442A (zh) 混合蛙跳算法的自适应核k‑means方法与系统
CN102902772A (zh) 一种基于多目标优化的Web社区发现方法
CN106845696B (zh) 一种智能优化水资源配置方法
Wang et al. A new approach of obtaining reservoir operation rules: Artificial immune recognition system
CN104537108A (zh) 一种高维数据特征选择方法
CN103970985A (zh) 一种基于局部抽象凸估计的群体全局优化方法
CN103279796A (zh) 一种优化遗传算法进化质量的方法
CN108256623A (zh) 基于周期交互机制和知识板协同机制的多种群微粒群算法
CN105426910A (zh) 一种基于改进abc算法与de变异策略的自适应聚类方法
CN104318306A (zh) 基于非负矩阵分解和进化算法优化参数的自适应交叠社区检测方法
CN104462329A (zh) 一种适用于多样性环境的业务流程挖掘方法
CN104200073A (zh) 一种基于局部Lipschitz估计的自适应群体全局优化方法
Ouadfel et al. A fully adaptive and hybrid method for image segmentation using multilevel thresholding
CN103020864B (zh) 玉米良种选育方法
Zhang et al. A projection pursuit dynamic cluster model based on a memetic algorithm
CN104778250A (zh) 基于遗传规划决策树的信息物理融合系统数据分类方法
Vardhan et al. Density based clustering technique on crop yield prediction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190312

Address after: 401120 data of Xiantao street, Yubei District, Chongqing 19

Patentee after: Chongqing Wingshengda Technology Co.,Ltd.

Address before: 210044 Ning six road, Nanjing, Jiangsu Province, No. 219

Patentee before: Nanjing University of Information Science and Technology

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220120

Address after: 102600 Room 802, 8 / F, building 1, No. 10, Hongda North Road, economic and Technological Development Zone, Daxing District, Beijing (Yizhuang group, high-end industrial area, Beijing Pilot Free Trade Zone)

Patentee after: Yiyoule network technology (Beijing) Co.,Ltd.

Address before: 401120 data of Xiantao street, Yubei District, Chongqing 19

Patentee before: Chongqing Wingshengda Technology Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181127