CN106056167A - 一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法 - Google Patents

一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法 Download PDF

Info

Publication number
CN106056167A
CN106056167A CN201610512937.6A CN201610512937A CN106056167A CN 106056167 A CN106056167 A CN 106056167A CN 201610512937 A CN201610512937 A CN 201610512937A CN 106056167 A CN106056167 A CN 106056167A
Authority
CN
China
Prior art keywords
fitness
new
formula
gathering honey
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610512937.6A
Other languages
English (en)
Inventor
江铭炎
郭宝峰
孙舒琬
陈蓓蓓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201610512937.6A priority Critical patent/CN106056167A/zh
Publication of CN106056167A publication Critical patent/CN106056167A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23211Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Abstract

本发明涉及一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,包括:(1)归一化预处理,得到新样本集X_New;(2)参数初始化:(3)计算到初始聚类中心的距离,计算隶属矩阵U和可能性矩阵T,得到初始适应度值fitness(i);(4)进入采蜜蜂阶段:(5)进入跟随蜂阶段:(6)进入侦察蜂阶段:(7)得到最终最优聚类中心Vbest,并由Vbest得到对应的隶属矩阵U,并按照ci=argmax(uij)得到最终聚类。本发明提出的方法具有较好的噪声鲁棒性,在一定程度上较少参数的人为依赖性,引入人工蜂群算法后,算法的全局特性得到提高,避免了参数初始值敏感问题。本发明的可行性和有效性都得提高。

Description

一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚 类方法
技术领域
本发明涉及一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,属于大数据挖掘、机器学习技术领域。
背景技术
模糊聚类分析作为无监督分析数据、理解数据、认知事物的重要手段,由于引入模糊集合和模糊数学的思想,通过隶属度函数建立了样本数据与类别之间的不确定性描述,有效地解决了现实中不精确、没有明显边界“亦此亦彼”的聚类问题。模糊聚类拥有较好的数据表达能力与聚类效果,现已成功应用于海量数据实时聚类分析、模式分类、风险趋势预测、决策分析中,为人们深入理解数据、深层利用数据、挖掘数据中潜在价值信息做出重要共献。
现阶段理论研究和实际应用中比较广泛的是基于目标函数的模糊聚类,包括模糊C均值聚类(Fuzzy C-means Clustering,FCM)、可能性C均值聚类(Possibilistic C-meansClustering,PCM)、可能性模糊C均值聚类(Possibilistic Fuzzy C-means CLustering,PFCM)。FCM算法对初始聚比较敏感,并且容易陷入局部最优解而得不到最佳的聚类划分;PCM克服了FCM对噪声敏感的问题,对噪声鲁棒性有所提高,但容易引起一致性聚类问题;PFCM兼具FCM与PCM的优点,具有较好的噪声鲁棒性,又不会产生重合的聚类,但PFCM涉及的参数较多,通常这些参数都需要人为指定而缺乏理论依据,这无形中增加了聚类的计算复杂度,同时算法的稳定性也受到影响。此外,这些基于目标函数的模糊聚类算法适合处理线性可分的、低维、凸型结构数据,然而在聚类算法在处理高维、非线性可分、非凸结构数据时聚类算法的性能很不稳定。
发明内容
针对现有技术的不足,本发明提供了一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法(Hybrid Methods for Possibilistic Fuzzy EntropyClustering Based on Artificial Bee Colony Algorithm and kernel function,ABC_KPFECM);
本发明通过对原始样本数据归一化处理,解决了量纲不统一对聚类结果产生的影响;此外,本发明引入高斯核函数,将原样本空间的数据映射到高维特征空间,解决了高维、非凸、非线性可分结构数据聚类不稳定的问题;最后,本发明还引入具有独特全局寻优能力的人工蜂群算法,优化提高了算法的全局寻优特性。该方法具有较好的噪声鲁棒性,不会产生一致性聚类问题,也避免了参数的人为依赖性,同时具有较好的全局特性,算法的整体性能得到提高。
本发明的数学模型为:
其中
公式中为数据空间X到高维特征空间H的映射,即与之对应的核函数为 为映射到高维特征空间的样本,为映射到高维特征空间的聚类中心;参数满足m>1,λ>0,在满足约束条件以及0≤uij,tij≤1,令目标函数J(U,V,T)取极小值时必须满足:
u i j = 1 Σ k = 1 c ( D i j D k j ) m - 1 , ∀ i , j
t i j = exp ( - m 2 c ( D i j + λ ) σ 2 + m 2 c λ ) , ∀ i , j
v i = Σ j = 1 N ( u i j m + t i j ) k ( x j , v i ) x j Σ j = 1 N ( u i j m + t i j ) k ( x j , v i )
本发明的技术方案为:
一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,包括以下步骤:
(1)对样本集X进行归一化预处理,得到新样本集X_New;
(2)参数初始化:人工蜂群算法种群数NP,采蜜蜂的数量SN,局部最优限制次数limit,最大迭代次数maxcycle;初始聚类中心V,模糊加权指数m,聚类数c,阈值ε,协方差矩阵σ2,熵系数λ,高斯核函数的宽度参数δ;
(3)计算新样本集X_New中的样本到初始聚类中心的距离,并计算对应的隶属矩阵U和可能性矩阵T,得到每只采蜜蜂的初始适应度值fitness(i);
(4)进入采蜜蜂阶段:采蜜蜂进行邻域搜索,产生每只采蜜蜂的适应度值新解fitness(sol),并更新隶属矩阵U和可能性矩阵T;
(5)比较fitness(i)和fitness(sol),如果fitness(i)<fitness(sol),则fitness(i)=fitness(sol),否则,fitness(i)不变;
(6)进入跟随蜂阶段:跟随蜂按概率pi选择跟踪采蜜蜂,并对采蜜蜂进行邻域搜索,产生每个采蜜蜂的适应度值新解fitness(sol1),并更新隶属矩阵U和可能性矩阵T,比较fitness(i)和fitness(sol1),如果fitness(i)<fitness(sol1),则fitness(i)=fitness(sol1),否则,fitness(i)不变;
(7)进入侦察蜂阶段:判断采蜜蜂转侦察蜂的条件是否满足,如果采蜜蜂的适应度值fitness(i)在limit次迭代中均未发生变化,则认为该采蜜蜂的适应度值fitness(i)为局部最优解,放弃局部最优解,同时该采蜜蜂转变为侦查蜂,按照Vi=rand(c,s).*(max(X_New)-min(X_New))+min(X_New)在解空间进行新的搜索;否则,该采蜜蜂不转变;s为新样本集X_New中每个样本元素的维数,max(X_New)为行向量,由新样本集X_New中每列的最大值组成,min(X_New)也为行向量,由新样本集X_New中每列最小值组成,rand(c,s)为由[0,1]构成的c*s矩阵,*表示矩阵之间对应元素相乘;
(8)重复步骤(3)至(7),直到最大迭代次数maxcycle或者满足||Vbest(iter+1)-Vbest(iter)||<ε;||Vbest(iter+1)-Vbest(iter)||表示第iter+1次迭代得到最优聚类中心和第iter次迭代得到最优聚类中心的欧式距离;
(9)得到最终最优聚类中心Vbest,并由Vbest得到对应的隶属矩阵U,并按照ci=argmax(uij)得到最终聚类。
根据本发明优选的,所述步骤(1)中,样本集X包含n个样本的数据,X={x1,x2,...,xn},xj=(xj1,xj2,...,xjs)T∈Rs,xj的样本元素为实数域R的S维空间中的样本,1≤j≤n,具体步骤包括:
为避免样本数据xj中每个维度由于量纲不同对聚类结果造成的影响,先对样本集X进行归一化预处理。
对样本集X进行归一化预处理,归一化预处理公式如式(Ⅰ)所示:
x j k &prime; = x j k - x k &OverBar; ( x k ) m a x - ( x k ) min - - - ( I )
式(Ⅰ)中,xjk'为新样本集X_New中的元素,j=1,2,...,n,k=1,2,...,s,(xk)max、(xk)min分别为样本集X第k维属性上的最大值、最小值,为样本集X第k维属性上的均值,归一化处理后,得到新样本集X_New。
根据本发明优选的,所述步骤(2)中,具体步骤包括:
A、初始化SN个初始聚类中心:Vl=rand(c,s).*(max(X_New)-min(X_New))+min(X_New),l=1,2,...,SN,s为新样本集X_New中每个样本元素的维数,新样本集X_New是一个n*s维矩阵,max(X_New)为行向量,由新样本集X_New中每列的最大值组成,min(X_New)也为行向量,由新样本集X_New中每列最小值组成,rand(c,s)为由[0,1]构成的c*s矩阵,*表示矩阵之间对应元素相乘;
B、计算目标函数中的协方差矩阵σ2,计算公式如式(Ⅱ)所示:
式(Ⅱ)中,为映射到高维特征空间后的样本均值:代入式(Ⅱ)中,消去得到式(Ⅲ):
&sigma; 2 = 1 n &Sigma; j = 1 n k ( x j , x j ) - 1 n 2 &Sigma; j = 1 n &Sigma; k = 1 n k ( x j , x k ) - - - ( I I I )
式(Ⅲ)中,核函数φ(x)采用高斯核函数δ=0.4。
根据本发明优选的,所述步骤(3)中,具体步骤包括:
C、映射到高维特征空间后,计算新样本集X_New的中样本到初始聚类中心V的欧式距离;
D、依据式(Ⅳ)计算隶属矩阵U:
u i j = 1 &Sigma; k = 1 c ( D i j D k j ) m - 1 , &ForAll; i , j - - - ( I V )
式(Ⅳ)中,为高维特征空间中新样本集X_New中样本j与初始聚类中心V的vi之间的欧式距离的平方;Dkj为高维特征空间中新样本集X_New中样本j与初始聚类中心V的vk之间的欧式距离的平方;
E、依据式(Ⅴ)计算可能性矩阵T:
t i j = exp ( - m 2 c ( D i j + &lambda; ) &sigma; 2 + m 2 c &lambda; ) , &ForAll; i , j - - - ( V )
式(Ⅴ)中,m为模糊加权指数,λ为熵系数,0.01≤λ≤1;
F、目标函数J(U,V,T)的极小值fobj(i)对应着最好的聚类划分,人工蜂群算的蜜源位置对应着可行解(聚类中心),可行解的优劣取决于适应度函数fitness(i),每个采蜜蜂的初始适应度值fitness(i)的求取公式如式(Ⅵ)所示:
f i t n e s s ( i ) = 1 1 + f o b j ( i ) , f o b j ( i ) &GreaterEqual; 0 1 + | f o b j ( i ) | , f o b j ( i ) < 0 - - - ( V I )
式(Ⅵ)中,j=1,2,...,s,fobj(i)是指目标函数J(U,V,T)的极小值;
根据本发明优选的,所述步骤(4)中,具体步骤包括:
G、采蜜蜂邻域搜索产生适应度值新解fitness(sol),引入具有记忆全局最优的xbest来提高搜索的效率和全局最优趋势,邻域搜索公式如式(Ⅶ)所示:
vij=xij+rand(xij-xkj)+β(xbest-xij) (Ⅶ)
式(Ⅶ)中,xbest代表已搜索到最优的聚类中心,i=1,2,...,SN,xij表示第i个采蜜蜂的第j维分量,vij为搜索到的邻域值,rand、β为搜索系数,rand、β的值均为(0,1);
H、计算步骤G求取的适应度值新解fitness(sol)(聚类中心)对应的隶属矩阵U1和可能性矩阵T1。
根据本发明优选的,所述步骤(5)中,具体步骤包括:
比较fitness(i)及fitness(sol),按照贪婪准则更新当前解:如果fitness(sol)≥fitness(i),接受fitness(sol),fitness(i)=fitness(sol);否则,舍弃fitness(sol),继续保留fitness(i)。
根据本发明优选的,所述步骤(6)中,具体方法为:
I、跟随蜂以概率pi选择跟随适应度值较优的采蜜蜂并在其周围进行进一步邻域搜索:概率pi的求取公式如式(Ⅷ)所示:
p i = f i t n e s s ( i ) &Sigma; f i t n e s s ( i ) - - - ( V I I I )
如果pi>rand,就选择跟随该采蜜蜂,rand为(0,1)之间的实数,进入步骤J;否则,就不跟随该采蜜蜂;
J、跟随蜂邻域搜索产生适应度值新解fitness(sol1),邻域搜索公式如式(Ⅶ)所示;
K、计算步骤J求取的适应度值新解fitness(sol1)对应的隶属矩阵U2和可能性矩阵T2;
L、按照贪婪准则比较fitness(i)及fitness(sol1),更新当前解:如果fitness(sol1)≥fitness(i),接受fitness(sol1),fitness(i)=fitness(sol1);否则,舍弃fitness fitness(sol1),继续保留fitness(i)。
根据本发明优选的,所述步骤(9),具体步骤包括:
①计算每只采蜜蜂的适应度值fitness(i)和对应的目标函数值fobj(i),i=1,2,...,SN,选取fobj(i)中值最小的采蜜蜂对应的聚类中心作为最优的聚类中心Vbest;
②循环迭代得到最终的最优聚类中心Vbest,根据式(Ⅸ)、式(Ⅹ)得到最终的隶属矩阵U;
u i j = 1 &Sigma; k = 1 c ( D i j D k j ) m - 1 , &ForAll; i , j - - - ( I X )
t i j = exp ( - m 2 c ( D i j + &lambda; ) &sigma; 2 + m 2 c &lambda; ) , &ForAll; i , j - - - ( X )
式(Ⅸ)中,为高维特征空间中新样本集X_New中样本j与初始聚类中心V的vi之间的欧式距离的平方;Dkj为高维特征空间中新样本集X_New中样本j与初始聚类中心V的vk之间的欧式距离的平方;式(Ⅹ)中,m为模糊加权指数,λ为熵系数,0.01≤λ≤1;
③按照式(Ⅺ)求取样本uij所属的类别ci
ci=argmax(uij) (Ⅺ)。
本发明的有益效果为:
1、本发明提出了一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,通过对原始样本数据归一化处理,解决了多维大数据聚类分析时量纲不统一对聚类结果产生的影响。
2、本发明提出的方法具有较好的噪声鲁棒性,不会产生一致性聚类问题,也在一定程度上较少参数的人为依赖性,引入人工蜂群算法后,算法的全局特性得到提高,避免了参数初始值敏感问题。
3、本发明引入高斯核,进一步提高了算法在处理高维,非线性可分,非凸结构数据时的聚类性能,使得算法的可行性和有效性都得提高。
附图说明
图1为本发明方法的流程图。
具体实施方式
下面结合实施例和说明书附图对本发明作进一步限定,但不限于此。
实施例
本实施例结合机器学习标准测试集wine数据对本发明作进一步说明。
Wine数据是一个包含178个数据样本的13维数据集,包含3个类别。
如图1所示,基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,流程图如图1所示,包括以下步骤:
(1)输入待聚类样本wine数据,并对其进行归一化预处理,得到新样本X_New,使得新样本X_New落在区间[0,1],避免由于量纲不同对聚类结果造成的影响。
(2)参数初始化,人工蜂群算法的种群数NP=50,采蜜蜂数SN=25,局部最优限制次数limit=50,最大迭代次数maxcycle=500;聚类数c=3,初始聚类中心V=rand(C,S).*(max(X)-min(X))+min(X),模糊加权指数m=2,阈值ε=0.000001,协方差矩阵σ2,熵系数λ=0.4,高斯核函数的宽度参数δ=0.4;
(3)计算新样本集X_New中样本到初始聚类中心V的欧式距离,并计算相应的隶属矩阵U和可能性矩阵T,得到每只采蜜蜂的初始适应度值。
(4)进入采蜜蜂阶段,采蜜蜂邻域搜索,产生每只采蜜蜂的适应度值新解fitness(sol),并更新隶属矩阵U和可能性矩阵T;比较fitness(i)和fitness(sol),如果fitness(i)<fitness(sol),则fitness(i)=fitness(sol),否则,fitness(i)不变;
(5)进入跟随蜂阶段:跟随蜂按概率pi选择跟踪采蜜蜂,并对采蜜蜂进行邻域搜索,产生每个采蜜蜂的适应度值新解fitness(sol1),并更新隶属矩阵U和可能性矩阵T,比较fitness(i)和fitness(sol1),如果fitness(i)<fitness(sol1),则fitness(i)=fitness(sol1),否则,fitness(i)不变;
(6)进入侦察蜂阶段:判断采蜜蜂转侦察蜂的条件是否满足,如果采蜜蜂的适应度值fitness(i)在limit次迭代中均未发生变化,则认为该采蜜蜂的适应度值fitness(i)为局部最优解,放弃局部最优解,同时该采蜜蜂转变为侦查蜂,按照Vi=rand(c,s).*(max(X_New)-min(X_New))+min(X_New)在解空间进行新的搜索;否则,该采蜜蜂不转变;s为新样本集X_New中每个样本元素的维数,max(X_New)为行向量,由新样本集X_New中每列的最大值组成,min(X_New)也为行向量,由新样本集X_New中每列最小值组成,rand(c,s)为由[0,1]构成的c*s矩阵,*表示矩阵之间对应元素相乘;
(7)重复步骤(3)至(6),直到最大迭代次数maxcycle或者满足||Vbest(iter+1)-Vbest(iter)||<ε;||Vbest(iter+1)-Vbest(iter)||表示第iter+1次迭代得到最优聚类中心和第iter次迭代得到最优聚类中心的欧式距离;
(8)得到最终最优聚类中心Vbest,并由Vbest得到对应的隶属矩阵U,并按照ci=argmax(uij)得到最终聚类。
采用本实施例所述方法及采用现有的PCM、PFCM、ABC_KPFECM四种算法的得到的实验结果的聚类精度如表1所示:
表1
算法 FCM PCM PFCM ABC_KPFECM
精确度 68.54% 64.51% 69.01% 93.45%
时间(s) 0.5895 0.5078 0.6405 14.7613
由表1可知,本发明提出的方法,以较少的时间代价,显著提高了聚类算法的精度,使得聚类算法的性能得到大幅提高。

Claims (8)

1.一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,其特征在于,包括以下步骤:
(1)对样本集X进行归一化预处理,得到新样本集X_New;
(2)参数初始化:人工蜂群算法种群数NP,采蜜蜂的数量SN,局部最优限制次数limit,最大迭代次数maxcycle;初始聚类中心V,模糊加权指数m,聚类数c,阈值ε,协方差矩阵σ2,熵系数λ,高斯核函数的宽度参数δ;
(3)计算新样本集X_New中的样本到初始聚类中心的距离,并计算对应的隶属矩阵U和可能性矩阵T,得到每只采蜜蜂的初始适应度值fitness(i);
(4)进入采蜜蜂阶段:采蜜蜂进行邻域搜索,产生每只采蜜蜂的适应度值新解fitness(sol),并更新隶属矩阵U和可能性矩阵T;
(5)比较fitness(i)和fitness(sol),如果fitness(i)<fitness(sol),则fitness(i)=fitness(sol),否则,fitness(i)不变;
(6)进入跟随蜂阶段:跟随蜂按概率pi选择跟踪采蜜蜂,并对采蜜蜂进行邻域搜索,产生每个采蜜蜂的适应度值新解fitness(sol1),并更新隶属矩阵U和可能性矩阵T,比较fitness(i)和fitness(sol1),如果fitness(i)<fitness(sol1),则fitness(i)=fitness(sol1),否则,fitness(i)不变;
(7)进入侦察蜂阶段:判断采蜜蜂转侦察蜂的条件是否满足,如果采蜜蜂的适应度值fitness(i)在limit次迭代中均未发生变化,则认为该采蜜蜂的适应度值fitness(i)为局部最优解,放弃局部最优解,同时该采蜜蜂转变为侦查蜂,按照
Vi=rand(c,s).*(max(X_New)-min(X_New))+min(X_New)在解空间进行新的搜索;否则,该采蜜蜂不转变;s为新样本集X_New中每个样本元素的维数,max(X_New)为行向量,由新样本集X_New中每列的最大值组成,min(X_New)也为行向量,由新样本集X_New中每列最小值组成,rand(c,s)为由[0,1]构成的c*s矩阵,*表示矩阵之间对应元素相乘;
(8)重复步骤(3)至(7),直到最大迭代次数maxcycle或者满足||Vbest(iter+1)-Vbest(iter)||<ε;||Vbest(iter+1)-Vbest(iter)||表示第iter+1次迭代得到最优聚类中心和第iter次迭代得到最优聚类中心的欧式距离;
(9)得到最终最优聚类中心Vbest,并由Vbest得到对应的隶属矩阵U,并按照ci=argmax(uij)得到最终聚类。
2.根据权利要求1所述的一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,其特征在于,所述步骤(1)中,样本集X包含n个样本的数据,X={x1,x2,...,xn},xj=(xj1,xj2,...,xjs)T∈Rs,xj的样本元素为实数域R的S维空间中的样本,1≤j≤n,具体步骤包括:对样本集X进行归一化预处理,归一化预处理公式如式(I)所示:
x j k &prime; = x j k - x k &OverBar; ( x k ) m a x - ( x k ) min - - - ( I )
式(I)中,xjk'为新样本集X_New中的元素,j=1,2,...,n,k=1,2,...,s,(xk)max、(xk)min分别为样本集X第k维属性上的最大值、最小值,为样本集X第k维属性上的均值,归一化处理后,得到新样本集X_New。
3.根据权利要求2所述的一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,其特征在于,所述步骤(2)中,具体步骤包括:
A、初始化SN个初始聚类中心:Vl=rand(c,s).*(max(X_New)-min(X_New))+min(X_New);
B、计算目标函数中的协方差矩阵σ2,计算公式如式(Ⅱ)所示:
式(Ⅱ)中,为映射到高维特征空间后的样本均值:代入式(Ⅱ)中,消去得到式(Ⅲ):
&sigma; 2 = 1 n &Sigma; j = 1 n k ( x j , x j ) - 1 n 2 &Sigma; j = 1 n &Sigma; k = 1 n k ( x j , x k ) - - - ( I I I )
式(Ⅲ)中,核函数φ(x)采用高斯核函数
4.根据权利要求3所述的一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,其特征在于,所述步骤(3)中,具体步骤包括:
C、映射到高维特征空间后,计算新样本集X_New的中样本到初始聚类中心V的欧式距离;
D、依据式(Ⅳ)计算隶属矩阵U:
u i j = 1 &Sigma; k = 1 c ( D i j D k j ) m - 1 , &ForAll; i , j - - - ( I V )
式(Ⅳ)中,为高维特征空间中新样本集X_New中样本j与初始聚类中心V的vi之间的欧式距离的平方;Dkj为高维特征空间中新样本集X_New中样本j与初始聚类中心V的vk之间的欧式距离的平方;
E、依据式(V)计算可能性矩阵T:
t i j = exp ( - m 2 c ( D i j + &lambda; ) &sigma; 2 + m 2 c &lambda; ) , &ForAll; i , j - - - ( V )
式(V)中,m为模糊加权指数,λ为熵系数,0.01≤λ≤1;
F、每个采蜜蜂的初始适应度值fitness(i)的求取公式如式(Ⅵ)所示:
f i t n e s s ( i ) = 1 1 + f o b j ( i ) , f o b j ( i ) &GreaterEqual; 0 1 + | f o b j ( i ) | , f o b j ( i ) < 0 - - - ( V I )
式(Ⅵ)中,j=1,2,...,s,fobj(i)是指目标函数J(U,V,T)的极小值。
5.根据权利要求4所述的一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,其特征在于,所述步骤(4)中,具体步骤包括:
G、采蜜蜂邻域搜索产生适应度值新解fitness(sol),邻域搜索公式如式(Ⅶ)所示:
vij=xij+rand(xij-xkj)+β(xbest-xij) (Ⅶ)
式(Ⅶ)中,xbest代表已搜索到最优的聚类中心,i=1,2,...,SN,xij表示第i个采蜜蜂的第j维分量,vij为搜索到的邻域值,rand、β为搜索系数,rand、β的值均为(0,1);
H、依据式(Ⅳ)、式(V)计算步骤G求取的适应度值新解fitness(sol)对应的隶属矩阵U1和可能性矩阵T1。
6.根据权利要求5所述的一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,其特征在于,所述步骤(5)中,具体步骤包括:
比较fitness(i)及fitness(sol),按照贪婪准则更新当前解:如果fitness(sol)≥fitness(i),fitness(i)=fitness(sol);否则,舍弃fitness(sol),继续保留fitness(i)。
7.根据权利要求6所述的一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,其特征在于,所述步骤(6)中,具体方法为:
I、跟随蜂以概率pi选择跟随适应度值较优的采蜜蜂并在其周围进行进一步邻域搜索:概率pi的求取公式如式(Ⅷ)所示:
p i = f i t n e s s ( i ) &Sigma; f i t n e s s ( i ) - - - ( V I I I )
如果pi>rand,就选择跟随该采蜜蜂,rand为(0,1)之间的实数,进入步骤J;否则,就不跟随该采蜜蜂;
J、跟随蜂邻域搜索产生适应度值新解fitness(sol1),邻域搜索公式如式(Ⅶ)所示;
K、依据式(Ⅳ)、式(V)计算步骤J求取的适应度值新解fitness(sol1)对应的隶属矩阵U2和可能性矩阵T2;
L、按照贪婪准则比较fitness(i)及fitness(sol1),更新当前解:如果fitness(sol1)≥fitness(i),接受fitness(sol1),fitness(i)=fitness(sol1);否则,舍弃fitness(sol1),继续保留fitness(i)。
8.根据权利要求7所述的一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法,其特征在于,所述步骤(9),具体步骤包括:
①计算每只采蜜蜂的适应度值fitness(i)和对应的目标函数值fobj(i),i=1,2,...,SN,选取fobj(i)中值最小的采蜜蜂对应的聚类中心作为最优的聚类中心Vbest;
②循环迭代得到最终的最优聚类中心Vbest,根据式(Ⅸ)、式(Ⅹ)得到最终的隶属矩阵U;
u i j = 1 &Sigma; k = 1 c ( D i j D k j ) m - 1 , &ForAll; i , j - - - ( I X )
t i j = exp ( - m 2 c ( D i j + &lambda; ) &sigma; 2 + m 2 c &lambda; ) , &ForAll; i , j - - - ( X )
式(Ⅸ)中,为高维特征空间中新样本集X_New中样本j与初始聚类中心V的vi之间的欧式距离的平方;Dkj为高维特征空间中新样本集X_New中样本j与初始聚类中心V的vk之间的欧式距离的平方;式(Ⅹ)中,m为模糊加权指数,λ为熵系数,0.01≤λ≤1;
③按照式(Ⅺ)求取样本uij所属的类别ci
ci=argmax(uij) (Ⅺ)。
CN201610512937.6A 2016-07-01 2016-07-01 一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法 Pending CN106056167A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610512937.6A CN106056167A (zh) 2016-07-01 2016-07-01 一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610512937.6A CN106056167A (zh) 2016-07-01 2016-07-01 一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法

Publications (1)

Publication Number Publication Date
CN106056167A true CN106056167A (zh) 2016-10-26

Family

ID=57201644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610512937.6A Pending CN106056167A (zh) 2016-07-01 2016-07-01 一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法

Country Status (1)

Country Link
CN (1) CN106056167A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108375902A (zh) * 2018-02-01 2018-08-07 西安工程大学 一种人工蜂群算法与模糊pid控制结合的双容水箱控制算法
CN108711155A (zh) * 2018-04-20 2018-10-26 西京学院 一种人工蜂群优化模糊聚类的图像快速分割算法
CN114936942A (zh) * 2022-07-21 2022-08-23 深圳市绽放工场科技有限公司 一种面向保险用户的计算机网络数据处理分析系统及方法
CN116737671A (zh) * 2023-08-14 2023-09-12 云南喜岁科技有限公司 用于电力工程项目全过程管理的数据文件分析处理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108375902A (zh) * 2018-02-01 2018-08-07 西安工程大学 一种人工蜂群算法与模糊pid控制结合的双容水箱控制算法
CN108711155A (zh) * 2018-04-20 2018-10-26 西京学院 一种人工蜂群优化模糊聚类的图像快速分割算法
CN114936942A (zh) * 2022-07-21 2022-08-23 深圳市绽放工场科技有限公司 一种面向保险用户的计算机网络数据处理分析系统及方法
CN114936942B (zh) * 2022-07-21 2022-11-01 深圳市绽放工场科技有限公司 一种面向保险用户的计算机网络数据处理分析系统及方法
CN116737671A (zh) * 2023-08-14 2023-09-12 云南喜岁科技有限公司 用于电力工程项目全过程管理的数据文件分析处理方法
CN116737671B (zh) * 2023-08-14 2023-10-31 云南喜岁科技有限公司 用于电力工程项目全过程管理的数据文件分析处理方法

Similar Documents

Publication Publication Date Title
CN108985515B (zh) 一种基于独立循环神经网络的新能源出力预测方法及系统
CN110473592B (zh) 一种多视角人类协同致死基因预测方法
CN106228185A (zh) 一种基于神经网络的通用图像分类识别系统及方法
CN106919951A (zh) 一种基于点击与视觉融合的弱监督双线性深度学习方法
CN106056167A (zh) 一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法
CN111414461A (zh) 一种融合知识库与用户建模的智能问答方法及系统
CN111986811A (zh) 一种基于大数据的疾病预测系统
Yi et al. An improved initialization center algorithm for K-means clustering
CN110348608A (zh) 一种基于模糊聚类算法改进lstm的预测方法
CN106491083A (zh) 用于脑状态监测的头戴式智能穿戴电极数量优化法及应用
CN109492748A (zh) 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法
CN106778838A (zh) 一种预测空气质量的方法
CN115689008A (zh) 基于集合经验模态分解的CNN-BiLSTM短期光伏功率预测方法及其系统
Subbotin et al. Individual prediction of the hypertensive patient condition based on computational intelligence
CN111292124A (zh) 一种基于优化组合神经网络的需水预测方法
CN116821715A (zh) 一种基于半监督约束的人工蜂群优化聚类方法
CN109686403A (zh) 基于不确定蛋白质相互作用网络中关键蛋白质识别方法
CN115759389A (zh) 基于天气类型的相似日组合策略的日前光伏功率预测方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN116386853A (zh) 面向智慧医疗的深度可分离卷积双重聚合联邦学习方法
Wang et al. Kernel-based fuzzy C-means clustering based on fruit fly optimization algorithm
Ding et al. An improved SFLA-kmeans algorithm based on approximate backbone and its application in retinal fundus image
Gunawan et al. Long Short-Term Memory Approach for Predicting Air Temperature In Indonesia
Babu et al. A simplex method-based bacterial colony optimization algorithm for data clustering analysis
CN115310491A (zh) 一种基于深度学习的类不平衡磁共振全脑数据分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161026