CN104778477A - 一种优化的人工蜂群聚类方法 - Google Patents

一种优化的人工蜂群聚类方法 Download PDF

Info

Publication number
CN104778477A
CN104778477A CN201510170303.2A CN201510170303A CN104778477A CN 104778477 A CN104778477 A CN 104778477A CN 201510170303 A CN201510170303 A CN 201510170303A CN 104778477 A CN104778477 A CN 104778477A
Authority
CN
China
Prior art keywords
nectar source
algorithm
search
abc
optimized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510170303.2A
Other languages
English (en)
Inventor
龚安
高云
马兴敏
唐永红
刘亚囡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN201510170303.2A priority Critical patent/CN104778477A/zh
Publication of CN104778477A publication Critical patent/CN104778477A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种优化的人工蜂群聚类方法。为了解决传统K-means算法过于依赖初始聚类中心及易陷入局部最优的问题,提出一种优化的人工蜂群聚类方法。首先对初始聚类中心的选取进行改进得到优化蜜源;然后借鉴轮盘赌的思想,采用自动调整搜索步长的动态局部寻优策略改善人工蜂群的局部寻优能力;最后选取UCI的四个数据集进行仿真实验,实验结果表明该方法相比K-means算法、K-means++算法及人工蜂群算法能获得更好的聚类效果,对决策者有一定的参考价值。

Description

一种优化的人工蜂群聚类方法
技术领域
本发明涉及一种聚类方法,尤其涉及一种优化的人工蜂群聚类方法。
背景技术
聚类分析是一种重要的无监督学习方法,在数据的内在结构识别方面起到了不可替代的作用。目前聚类分析广泛应用于模式识别、图像分割、数据压缩及检索、数据挖掘等领域,并发挥着重要作用。K-means算法是最经典的聚类算法之一,得到了广泛应用及研究。它简单、高效,具有良好的局部搜索能力,但存在过于依赖初始聚类中心、易陷入局部最优等缺陷。
为解决上述问题,许多学者在选择初始聚类中心时对距离进行了度量,与已有聚类中心距离较远的数据对象有更大概率被选择为新的聚类中心,保证聚类中心之间尽可能地相互分离,进而提高初始聚类中心质量。诸如此类方法通过选择较优的初始聚类中心对K-means算法进行优化,在一定程度上改善了聚类效果,但仍可能不同程度地陷入局部最优。
近年,群智能算法以其良好的全局寻优能力得到越来越多的关注,并被应用到聚类分析中。人工蜂群(Artificial Bee Colony,简称ABC)算法最初用于函数优化问题,具有参数少、原理简单、容易实现等优点,且相对于遗传算法、差分进化算法、粒子群算法等具有更好的调节全局与局部寻优的能力,获得了较好的聚类效果。但ABC算法存在收敛速度慢,局部寻优能力差等问题,综上所述,迫切需要研究一种新的聚类方法。
发明内容
针对ABC算法存在收敛速度慢,局部寻优能力差等问题,本发明研制一种优化的人工蜂群聚类方法。
本发明其特征在于,包括以下步骤:
(1)蜜源初始化,使用策略对蜜源进行初始化。
(2)发送雇佣蜂。雇佣蜂采动态局部寻优策略进行局部搜索,并采用贪婪算法选择较优蜜源。
(3)发送观察蜂。观察蜂首先通过轮盘赌方式选择较优蜜源,然后采用动态局部寻优策略及贪婪算法对蜜源进行更新。若某蜜源经过limit次后其质量仍得不到提高,则该蜜源被放弃且所对应的蜜蜂变为侦察蜂。
(4)发送侦察蜂。侦察蜂采用优化策略选择新的蜜源进行下一轮更新。
(5)返回到(2)循环迭代,直到运行次数达到MCL次,并输出结果,即最优聚类中心。
所述(1)中策略是采用一种基于距离与轮盘赌的选择方法对初始蜜源进行筛选,保证初始蜜源内部的聚类中心尽可能地相互远离;
所述(2)中动态局部寻优策略是借鉴轮盘赌的思想,基于优化的初始蜜源,提出一种基于迭代次数的动态搜索策略,以满足方法在优化过程中对全局与局部搜索能力的要求,改善原始ABC算法收敛速度过慢、局部搜索能力差等问题。
附图说明
图1是一种优化的人工蜂群聚类方法实施流程图。
图2是实验数据图。
图3是方法在不同数据集上的聚类结果比较图。
图4是K-means算法在Iris数据集上的聚类效果图。
图5是方法在Iris数据集上的聚类效果图。
图6是基于ABC的算法效率对比图。
具体实施方式
为更好地理解本发明,下面结合附图和具体实施方式对本发明进行更为详细描述。在以下的描述中,当已有的现有技术的详细描述也许会淡化本发明的主题内容时,这些描述在这儿将被忽略。
图1是本发明一种优化的人工蜂群聚类方法的具体实施方式流程图。在本实施例中,本发明的一种优化的人工蜂群聚类方法包括以下步骤:
本发明采用UCI机器学习数据库中的经典数据集Iris、Wine、Glass和Seeds作为实验数据,如图2所示。
本发明采用错误率作为衡量聚类结果的标准。错误率指被错误分类的样本数量与总样本数量的比值,其公式如下:
Error = ϵ n × 100 %
通过本发明方法过程(1)蜜源初始化,使用策略对蜜源进行初始化。(2)发送雇佣蜂。雇佣蜂采用动态局部寻优策略进行局部搜索,并采用贪婪算法选择较优蜜源。(3)发送观察蜂。观察蜂首先通过轮盘赌方式选择较优蜜源,然后采用动态局部寻优策略及贪婪算法对蜜源进行更新。若某蜜源经过limit次后其质量仍得不到提高,则该蜜源被放弃且所对应的蜜蜂变为侦察蜂。(4)发送侦察蜂。侦察蜂采用优化策略选择新的蜜源进行下一轮更新。(5)返回到(2)循环迭代,直到运行次数达到MCL次,并输出结果,即最优聚类中心。将本发明方法与K-means算法、K-means++算法及ABC算法进行对比实验。由于部分算法在选择初始聚类中心时有一定的随机性,因此每个算法运行20次并取平均值作为实验结果。蜂群聚类算法的初始参数设置为:蜜源个数SN=20,放弃阈值limit=SN*D,最大迭代次数MCL=20,其中D指各数据集属性数目。为了更清晰地展示本发明方法的优劣,将其分两步进行实验:首先进行基于优化蜜源的蜂群聚类算法(IABC-1)的实验;然后在此基础上加入动态局部寻优策略(IABC-2),再次进行实验。实验错误率对比结果如图3所示。
从实验结果可以看出,在这四个数据集上,K-means++算法的准确率整体略优于K-means算法,蜂群算法的表现时好时坏;而本发明方法充分利用了上述几种算法的优势,有效降低了其他算法随机性所导致的较高的聚类错误率,在聚类准确率及稳定性上有了一定程度的提升。
为了更加直观地表现本发明方法的聚类效果,采用多维缩放技术对K-means算法与本发明方法在Iris数据集上的聚类结果进行二维形式的展现,如图4、图5所示。由聚类效果图可以看出,本发明方法对样本集的划分较为合理,取得了较好的聚类结果。
此外,我们对算法的运行时间也进行了对比,如图6所示。我们注意到,本发明方法的效率高于原始ABC算法;IABC-1的效率高于IABC-2但精确性方面稍差。
尽管上面对本发明说明性的具体实施方式进行了描述,但应当清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (2)

1.一种优化的人工蜂群聚类方法,其特征在于,包括以下步骤:(1)蜜源初始化,使用策略对蜜源进行初始化。(2)发送雇佣蜂。雇佣蜂采用动态局部寻优策略进行局部搜索,并采用贪婪算法选择较优蜜源。(3)发送观察蜂。观察蜂首先通过轮盘赌方式选择较优蜜源,然后采用动态局部寻优策略及贪婪算法对蜜源进行更新。若某蜜源经过limit次后其质量仍得不到提高,则该蜜源被放弃且所对应的蜜蜂变为侦察蜂。(4)发送侦察蜂。侦察蜂采用策略选择新的蜜源进行下一轮更新。(5)返回到(2)循环迭代,直到运行次数达到MCL次,并输出结果,即最优聚类中心。
2.根据权利要求1所述的一种优化的人工蜂群聚类方法其特征在于:权利要求1中(1)所述策略是采用一种基于距离与轮盘赌的选择方法对初始蜜源进行筛选,保证初始蜜源内部的聚类中心尽可能地相互远离;
权利要求1中(2)所述动态局部寻优策略是借鉴轮盘赌的思想,基于优化的初始蜜源,提出一种基于迭代次数的动态搜索策略,以满足方法在优化过程中对全局与局部搜索能力的要求,改善原始ABC算法收敛速度过慢、局部搜索能力差等问题。
CN201510170303.2A 2015-04-10 2015-04-10 一种优化的人工蜂群聚类方法 Pending CN104778477A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510170303.2A CN104778477A (zh) 2015-04-10 2015-04-10 一种优化的人工蜂群聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510170303.2A CN104778477A (zh) 2015-04-10 2015-04-10 一种优化的人工蜂群聚类方法

Publications (1)

Publication Number Publication Date
CN104778477A true CN104778477A (zh) 2015-07-15

Family

ID=53619930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510170303.2A Pending CN104778477A (zh) 2015-04-10 2015-04-10 一种优化的人工蜂群聚类方法

Country Status (1)

Country Link
CN (1) CN104778477A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528615A (zh) * 2015-11-30 2016-04-27 华南师范大学 行为数据的路径寻优方法
CN106066909A (zh) * 2016-05-27 2016-11-02 电子科技大学 基于almabc算法的鱼雷外形多学科设计优化方法
CN106650790A (zh) * 2016-11-21 2017-05-10 中国科学院东北地理与农业生态研究所 一种基于蜂群智能的遥感影像聚类方法
CN107392113A (zh) * 2017-06-28 2017-11-24 深圳森阳环保材料科技有限公司 一种指纹识别器件及存储装置
CN108092989A (zh) * 2017-12-28 2018-05-29 上海海事大学 一种基于智能蜂群算法的DDoS攻击检测方法
CN108711155A (zh) * 2018-04-20 2018-10-26 西京学院 一种人工蜂群优化模糊聚类的图像快速分割算法
CN109613564A (zh) * 2018-12-17 2019-04-12 北斗航天卫星应用科技集团有限公司 一种基于K-means++聚类算法的北斗导航系统故障检测方法及检测系统
CN113343487A (zh) * 2021-06-29 2021-09-03 山推工程机械股份有限公司 基于大数据分析的电动推土机用电池试验方案的生成方法
CN114355948A (zh) * 2022-01-11 2022-04-15 大连海事大学 一种栅格图下的基于混合算法的无人船路径规划方法
CN114793174A (zh) * 2022-04-21 2022-07-26 浪潮云信息技术股份公司 基于改进人工蜂群算法的ddos入侵检测方法及系统
CN114936942A (zh) * 2022-07-21 2022-08-23 深圳市绽放工场科技有限公司 一种面向保险用户的计算机网络数据处理分析系统及方法
CN117349126A (zh) * 2023-12-05 2024-01-05 国网辽宁省电力有限公司大连供电公司 一种基于大数据的实时信息网络日志分析方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779241A (zh) * 2012-07-06 2012-11-14 陕西师范大学 基于人工蜂群繁殖机制的ppi网络聚类方法
US20150051866A1 (en) * 2013-08-13 2015-02-19 National Tsing Hua University Method for optimizing phasor measurement unit placement

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779241A (zh) * 2012-07-06 2012-11-14 陕西师范大学 基于人工蜂群繁殖机制的ppi网络聚类方法
US20150051866A1 (en) * 2013-08-13 2015-02-19 National Tsing Hua University Method for optimizing phasor measurement unit placement

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曹永春等: "基于K-means的改进人工蜂群聚类算法", 《计算机应用》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528615B (zh) * 2015-11-30 2018-11-06 华南师范大学 行为数据的路径寻优方法
CN105528615A (zh) * 2015-11-30 2016-04-27 华南师范大学 行为数据的路径寻优方法
CN106066909A (zh) * 2016-05-27 2016-11-02 电子科技大学 基于almabc算法的鱼雷外形多学科设计优化方法
CN106650790A (zh) * 2016-11-21 2017-05-10 中国科学院东北地理与农业生态研究所 一种基于蜂群智能的遥感影像聚类方法
CN107392113A (zh) * 2017-06-28 2017-11-24 深圳森阳环保材料科技有限公司 一种指纹识别器件及存储装置
CN107392113B (zh) * 2017-06-28 2021-01-22 南京鼎峯云信息科技有限公司 一种指纹识别器件及存储装置
CN108092989B (zh) * 2017-12-28 2020-11-06 上海海事大学 一种基于智能蜂群算法的DDoS攻击检测方法
CN108092989A (zh) * 2017-12-28 2018-05-29 上海海事大学 一种基于智能蜂群算法的DDoS攻击检测方法
CN108711155A (zh) * 2018-04-20 2018-10-26 西京学院 一种人工蜂群优化模糊聚类的图像快速分割算法
CN109613564A (zh) * 2018-12-17 2019-04-12 北斗航天卫星应用科技集团有限公司 一种基于K-means++聚类算法的北斗导航系统故障检测方法及检测系统
CN113343487A (zh) * 2021-06-29 2021-09-03 山推工程机械股份有限公司 基于大数据分析的电动推土机用电池试验方案的生成方法
CN113343487B (zh) * 2021-06-29 2023-08-22 山推工程机械股份有限公司 基于大数据分析的电动推土机用电池试验方案的生成方法
CN114355948A (zh) * 2022-01-11 2022-04-15 大连海事大学 一种栅格图下的基于混合算法的无人船路径规划方法
CN114793174A (zh) * 2022-04-21 2022-07-26 浪潮云信息技术股份公司 基于改进人工蜂群算法的ddos入侵检测方法及系统
CN114936942A (zh) * 2022-07-21 2022-08-23 深圳市绽放工场科技有限公司 一种面向保险用户的计算机网络数据处理分析系统及方法
CN114936942B (zh) * 2022-07-21 2022-11-01 深圳市绽放工场科技有限公司 一种面向保险用户的计算机网络数据处理分析系统及方法
CN117349126A (zh) * 2023-12-05 2024-01-05 国网辽宁省电力有限公司大连供电公司 一种基于大数据的实时信息网络日志分析方法及系统
CN117349126B (zh) * 2023-12-05 2024-02-09 国网辽宁省电力有限公司大连供电公司 一种基于大数据的实时信息网络日志分析方法及系统

Similar Documents

Publication Publication Date Title
CN104778477A (zh) 一种优化的人工蜂群聚类方法
Liu et al. Research on anti-money laundering based on core decision tree algorithm
US20220058222A1 (en) Method and apparatus of processing information, method and apparatus of recommending information, electronic device, and storage medium
US9058540B2 (en) Data clustering method and device, data processing apparatus and image processing apparatus
CN103699771B (zh) 一种冷负荷预测的情景-聚类方法
CA3068333C (en) Systems and methods for intelligently grouping financial product users into cohesive cohorts
CN109657147A (zh) 基于萤火虫和加权极限学习机的微博异常用户检测方法
CN103108343B (zh) 建立决策树的方法及装置、网络性能优化方法及装置
CN103761286B (zh) 一种基于用户兴趣的服务资源检索方法
He et al. Filter pruning via feature discrimination in deep neural networks
CN109526027B (zh) 一种小区容量优化方法、装置、设备及计算机存储介质
US20080183764A1 (en) Continuous physical design tuning
CN104182470B (zh) 一种基于svm的移动终端应用分类系统和方法
CN112597323A (zh) 遥感影像存储迁移方法、装置和存储介质
CN105468669A (zh) 一种融合用户关系的自适应微博话题追踪方法
CN111930484A (zh) 一种电网信息通信服务器线程池性能优化方法与系统
CN112215268A (zh) 一种灾害天气卫星云图分类方法和装置
CN117295116A (zh) 基于SOFM网络结合Istio的无线信号分发转译方法、存储介质及设备
Wu et al. BiSPL: Bidirectional self-paced learning for recognition from web data
CN107545007A (zh) 电力大数据快速检索引擎
WO2022156064A1 (zh) 闪存芯片可靠性等级预测方法、装置及存储介质
Ma The Research of Stock Predictive Model based on the Combination of CART and DBSCAN
CN112580355A (zh) 一种新闻资讯话题检测及实时聚合方法
Lyu et al. Intelligent clustering analysis model for mining area mineral resource prediction
CN109597928A (zh) 支持用户策略配置的基于Web网络的非结构化文本获取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150715