CN105894024A - 多重核的可能性模糊聚类算法 - Google Patents

多重核的可能性模糊聚类算法 Download PDF

Info

Publication number
CN105894024A
CN105894024A CN201610194776.0A CN201610194776A CN105894024A CN 105894024 A CN105894024 A CN 105894024A CN 201610194776 A CN201610194776 A CN 201610194776A CN 105894024 A CN105894024 A CN 105894024A
Authority
CN
China
Prior art keywords
sigma
represent
formula
sample
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610194776.0A
Other languages
English (en)
Inventor
唐益明
赵跟陆
丰刚永
任福继
胡相慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201610194776.0A priority Critical patent/CN105894024A/zh
Publication of CN105894024A publication Critical patent/CN105894024A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于多重核的可能性模糊c均值聚类算法,其特征是按如下步骤进行:1对样本集合进行最优划分,使得目标函数值最小;2获得初始隶属度矩阵和初始化聚类中心;3迭代获得隶属度值、聚类中心和典型值;4获得引入权重指数之后的目标函数。本发明能准确的规避FCM对噪声点比较敏感以及PCM容易产生一致性聚类的问题,从而能进一步增加算法的准确性,同时能发现最适合权重值以及当前隶属度值的大小,进而提高算法的可靠性和收敛性。

Description

多重核的可能性模糊聚类算法
技术领域
本发明属于数据挖掘领域进行数据分类的算法,具体的说是一种多重核的可能性模糊聚类算法。
背景技术
聚类是非监督模式识别的一个很重要的分支,聚类的最终目的是使相似样本之间的距离尽可能的小,使不同样本之间的距离尽可能的大,通过这种方式来区分数据,分类数据。模糊c均值聚类算法(FCM)是我们研究模糊聚类的一个基本方法,是由Dunn提出经由Bezdek发展起来的一种模糊聚类算法,该算法主要基于最小平方误差的概念,并且规定所有样本的隶属度之和为1,然而隶属度并不是总和直观上的隶属度或者兼容度相一致。FCM算法对样本数目参差不齐的情况下进行聚类时候,往往得不到理想的结果。通用的C均值聚类模型(GCM)算法,第一次研究了奥卡姆剃刀与分块聚类之间的关系,重新定义了FCM算法的目标函数公式。Bezdek提出的算法采用的是迭代下降的算法,然而其对初始化的聚类中心以及隶属度矩阵敏感,不能保证收敛到全局最优解,有可能收敛到局部极值或者鞍点。
基于以上原因提出一种改进的可能性聚类算法聚类方式,增加一种新的参数ηi来减少算法的误差,虽然可能性的聚类算法能够克服一致性聚类的问题,然而对于mp参数的选择异常敏感,不同的mp值即使相差很小,最后得到的聚类中心也会是两个截然不同的数值。改进提高的c均值聚类算法(PFCM),也就是模糊c均值聚类算法。PFCM算法具有很好的噪声鲁棒性,也不会产生重合的聚类,然而PFCM算法对参数的选择通常需要人为的指定而缺乏理论上的依据,具有较强的依赖性。
普通的聚类算法对于线性数据具有很好的聚类效果,但是对于非线性数据的聚类往往效果不是很理想,通过引入核函数,将原始数据通过mercer核条件将样本数据x={x1,x2.....xn}映射到高维特征空间F中,映射数据分别为{φ(x1),φ(x2)......φ(xn)},并在空间F中对样本进行聚类,形成基于核的模糊聚类算法。Yang提出的基于核的模糊聚类算法KFCM,Genton从统计学的角度展示了一种核的机器学习方式,他们的算法映射到一个高维特征空间的数据点,通过使用内核函数和优化的聚类错误。使其对于噪声和野值点具有很好的鲁棒性,也克服了PFCM算法对参数设置敏感的问题,然而基于核的模糊聚类算法对于球形数据效果比较好,但是对于非球状数据,往往得不到理想的效果。
Zhao et al.先前在文献中提出的多重核最大核的分割聚类算法多关注于监督以及半监督的聚类学习,这是基于最大限度的边际聚类,然而很明显的一个缺点就是他们的聚类算法多用于硬聚类。Hsin-Chien先生提出的多重核的核方法对基础内核的选择和组合提供了很大的灵活性,这也从不同的角度增加了信息源,另外这也提高了领域知识的编码能力,然而很明显这些多重核聚类算法的一个缺点是,内核的权重的指数通常是难以确定的很难实现良好的内核权重分配。
发明内容
本发明为了克服上述现有技术存在的不足之处,提出一种多重核的可能性模糊聚类算法,以期能准确的规避FCM对噪声点比较敏感以及PCM容易产生一致性聚类的问题,从而能进一步增加算法的准确性,同时能发现最适合权重值以及当前隶属度值的大小,进而提高算法的可靠性和收敛性。
为了实现上述发明目的,本发明采用如下技术方案:
本发明一种基于多重核的可能性模糊c均值聚类算法的特点是按如下步骤进行:
步骤1、令X={x1,x2,…,xj,…,xn}表示给定的样本集合,xj表示第j个样本;1≤j≤n,n是样本的个数;对样本集合X进行最优划分,使得式(1)所示的目标函数值J最小:
min ( J ) = Σ i = 1 c J i = Σ i = 1 c Σ j = 1 n ( au i j m + bt i j η ) d 2 ( x j k , v i k ) + σ 2 Σ i = 1 c Σ j = 1 n ( ∂ j - t i j ) η - - - ( 1 )
式(1)中,Ji表示第i类的目标函数;c表示划分的类别个数,1≤i≤c,uij表示第j个样本xj隶属于第i类的隶属度值,且U={uij|i=1,2,…,c;j=1,2,…,n}表示隶属度矩阵;0≤uij≤1;表示第j个样本属于第i类的隶属度的m次幂;tij表示第j个样本xj隶属于第i类的典型值,表示第j个样本属于第i个类的可能性隶属度的η次幂;a和b表示平衡参数,d(xjk,vik)表示k重高斯核空间的第j个样本xjk与k重高斯核空间的第i类的聚类中心vik之间的距离,并有:
d2(xjk,vik)=[φ(xjk)-φ(vik)]2=k(xjk,xjk)-2k(xjk,vik)+k(vik,vik) (2)
式(2)中,φ(xjk)表示第j个样本映射到k重核空间的映射函数;φ(xjk)表示第j个样本xj映射到k重高斯核空间的映射函数,并有:
式(3)中,为函数的宽度参数;
式(1)中,表示第j个样本xj赋予的权重系数,并有:
式(4)中,表示常数;L表示高斯核空间的核数;xz表示第z个样本,1≤z≤n;||xj-xz||表示第j个样本xj和第z个样本xz之间的欧式距离;
式(1)中,σ2表示协方差矩阵,并有:
σ 2 = 1 n Σ j = 1 n D 2 ( x j , 1 n Σ j = 1 n x j ) - - - ( 5 )
式(5)中,表示方差;
步骤2、利用模糊c均值聚类算法对所述样本集合X进行处理,获得隶属度矩阵U={uij|i=1,2,…,c;j=1,2,…,n}和k重高斯核空间的聚类中心Vk={v1k,v2k,…,vik,…,vck};以所述隶属度矩阵U和k重高斯核空间的聚类中心Vk作为初始隶属度矩阵U(0)和初始k重高斯核空间的聚类中心
步骤3、随机初始化第j个样本xj隶属于第i类的典型值为定义迭代次数为λ,最大迭代次数为λmax;并初始化λ=1;则第λ次迭代的隶属度矩阵为U(λ);第λ次迭代的聚类中心为
步骤4、利用式(6)获得第λ次迭代的第j个样本xj隶属于第i类的隶属度值
u i j ( λ ) = 1 Σ s = 1 c [ Σ k = 1 L [ 1 - k ( x j k , v i k ( λ - 1 ) ) ] Σ k = 1 L [ 1 - k ( x j k , v s k ( λ - 1 ) ) ] ] 1 m - 1 - - - ( 6 )
式(6)中,k表示高斯核空间的核数;表示第λ-1次迭代的k重高斯核空间的第s类的聚类中心,1≤s≤c;
步骤5、利用式(7)计算第λ次迭代的第j个样本xj隶属于第i类的典型值
t i j ( λ ) = 1 1 + { 2 b Σ k = 1 L [ 1 - k ( x j k , v i k ( λ - 1 ) ) ] σ 2 } 1 η - 1 - - - ( 7 )
步骤6、利用式(8)获得第λ次迭代的聚类中心
v i k ( λ ) = Σ j = 1 n ( a ( u i j ( λ - 1 ) ) m + b ( t i j ( λ - 1 ) ) η ) φ ( x j k ) Σ j = 1 n ( a ( u i j ( λ - 1 ) ) m + b ( t i j ( λ - 1 ) ) η ) - - - ( 8 )
步骤7、判断或λ>λmax是否成立,若成立,则表示为最优聚类中心,并令后代入式(1)中;为最优典型值,并令后代入式(1)中;为最优隶属度值,并令后代入式(1)中;从而实现对样本集合X的最优划分,ε是为预先设定的阈值;若不成立,则λ+1赋值给λ,重复步骤4顺序执行,直到满足条件为止。
与已有技术相比,本发明的有益效果体现在:
1、本发明在(MKPFCM)采用多重核的方法,集中了模糊聚类(FCM)方法的优点以及可能性聚类算法(PCM)的优点同时,同时减少了核的选择对于实验结果的影响,多重核的聚类算法对于核函数的选择比较敏感,在多重核的基础上面加入可能性的概念,使聚类的结果更加准确。
2、本发明采用的是基于核的算法能够同时进行非线性的数据运算,能够将在普通数据里面的数据线性运算通过映射到高维数据空间,增加了算法的抗变换性和鲁棒性,在本发明中也提出了权重的概念,核空间中数据点隶属于每一个核聚类中心的权重是不同的。
3、本发明将其延伸到软聚类方面去,进一步放宽隶属度的约束条件来增加算法的鲁棒性,首先,本方法不需要外显式评价的特征空间,但只进行内核为基础的评估,因此,本方法是更适合于比他们的方法的关系数据。
附图说明
图1为本发明MKPFCM算法下variant数据集随每次迭代的NMI值变化情况图;
图2为本发明MKPFCM算法下variant数据集随每次迭代的权重值w变化情况图;
图3为本发明MKPFCM算法下glass identification数据集随每次迭代的NMI值变化情况图;
图4为本发明MKPFCM算法下glass identification数据集随每次迭代的权重值w变化情况图。
具体实施方式
本实施例中,采用variant数据集以及glass identification数据集进行实验说明,variant数据集数据集共有160个数据点,分为9种属性,共有八大类别,glass identification数据集共有214点,分为9种属性,总共有6类别。
一种多重核的可能性模糊聚类算法是按照如下步骤进行:
步骤1、令X={x1,x2,…,xj,…,xn}表示给定的样本集合,xj表示第j个样本;1≤j≤n,n是样本的个数;对样本集合X进行最优划分,使得式(1)所示的目标函数值J最小,目标函数值最小得到的聚类中心是最优的,对数据进行划分的效果也是最好的,分类效果如表一,表二所示:
表一 聚类精度结果实验
本发明用线性核函数作为k1函数,多项式核函数为k2,以函数及高斯函数k3(x1,x2)=exp(-(x1-x2)T(x1-x2)/2σ)作为k3,为了方便比较,使用k-均值聚类(KM)和归一化分割(NC)作为基线,对于KM来说初始的聚类中心是随机的,性能分析是总结了50次的独立运行的结果,对于NC,高斯核的宽度是从网格{0.1σ0,0.2σ0,...,σ0}穷举搜索得到的,其中σ0是任何两个数据点在数据集上面距离的范围。采用MKPFCM-L表示多重核的可能性聚类算法在线性核函数k1时候的性能,MKPFCM-P表示多重核的可能性聚类算法在多项式核函数下的性能,MKPFCM-G表示多重核的可能性聚类算法在高斯核函数下的性能,MKPFCM-KM表示多重核的可能性聚类算法在k-means方法下的性能,MKPFCM-NC表示多重核的可能性聚类算法在归一化分割下面的性能表示。表三可以看出对于一个大的数据集,可以简单地进行聚类过程中的一小部分的数据,然后使用所学到的模型,以集群剩余的数据点。
表二 不同核函数下的聚类准确率
Data MKPFCM-L MKPFCM-P MKPFCM-G MKPFCM-KM MKPFCM-NC
Isis 0.473 0.791 0.894 0.507 0.559
Glass 0.325 0.647 0.935 0.615 0.423
Ecoli 0.441 0.743 0.947 0.398 0.661
Seeds_dataset 0.572 0.798 0.953 0.497 0.682
Wine 0.368 0.854 0.916 0.623 0.713
Variant 0.615 0.625 0.966 0.705 0.815
Pima 0.300 0.774 0.925 0.354 0.476
Yeast 0.654 0.901 0.957 0.437 0.549
J = Σ i = 1 c J i = Σ i = 1 c Σ j = 1 n ( au i j m + bt i j η ) d ( x j , v j ) + σ 2 Σ i = 1 c Σ j = 1 n ( ∂ j - t i j ) η - - - ( 1 )
式(1)中,Ji表示第i类的目标函数;c表示划分的类别个数,1≤i≤c,uij表示第j个样本xj隶属于第i类的隶属度值,且U={uij|i=1,2,…,c;j=1,2,…,n}表示隶属度矩阵;0≤uij≤1;表示第j个样本属于第i类的隶属度的m次幂;tij表示第j个样本xj隶属于第i类的典型值,表示第j个样本属于第i个类的可能性隶属度的η次幂;a和b表示平衡参数,d(xjk,vik)表示k重高斯核空间的第j个样本xjk与k重高斯核空间的第i类的聚类中心vik之间的距离,并有:
d2(xjk,vik)=[φ(xjk)-φ(vik)]2=k(xjk,xjk)-2k(xjk,vik)+k(vik,vik) (2)
式(2)中,φ(xj)表示第j个样本映射到单一核空间的映射函数;φ(xjk)表示第j个样本xj映射到k重高斯核空间的映射函数;并有:
式(3)中,为函数的宽度参数;
式(1)中,表示第j个样本xj赋予的权重系数,并有:
式(4)中,表示常数;xz表示第z个样本,1≤z≤n;||xj-xz||表示第j个样本xj和第z个样本xz之间的欧式距离;
式(1)中,σ2表示协方差矩阵,并有:
σ 2 = 1 n Σ j = 1 n D 2 ( x j , 1 n Σ j = 1 n x j ) - - - ( 4 )
式(5)中,表示方差;
步骤2、利用模糊c均值聚类算法对所述样本集合X进行处理,获得隶属度矩阵U={uij|i=1,2,…,c;j=1,2,…,n}和k重高斯核空间的聚类中心Vk={v1k,v2k,…,vik,…,vck};以所述隶属度矩阵U和k重高斯核空间的聚类中心Vk作为初始隶属度矩阵U(0)和初始k重高斯核空间的聚类中心方便迭代;
步骤3、随机初始化第j个样本xj隶属于第i类的典型值为定义迭代次数为λ,最大迭代次数为λmax;并初始化λ=1;则第λ次迭代的隶属度矩阵为U(λ);第λ次迭代的聚类中心为
步骤4、利用式(6)获得第λ次迭代的第j个样本xj隶属于第i类的隶属度值
u i j ( λ ) = 1 Σ s = 1 c [ Σ k = 1 L [ 1 - k ( x j k , v i k ( λ - 1 ) ) ] Σ k = 1 L [ 1 - k ( x j k , v s k ( λ - 1 ) ) ] ] 1 m - 1 - - - ( 6 )
式(6)中,k表示高斯核空间的核数;表示第λ-1次迭代的k重高斯核空间的第s类的聚类中心,1≤s≤c;
步骤5、利用式(7)计算第λ次迭代的第j个样本xj隶属于第i类的典型值
t i j ( λ ) = 1 1 + { 2 b Σ k = 1 L [ 1 - k ( x j k , v i k ( λ - 1 ) ) ] σ 2 } 1 η - 1 - - - ( 7 )
步骤6、利用式(8)获得第λ次迭代的聚类中心
v i k ( λ ) = Σ j = 1 n ( a ( u i j ( λ - 1 ) ) m + b ( t i j ( λ - 1 ) ) η ) φ ( x j k ) Σ j = 1 n ( a ( u i j ( λ - 1 ) ) m + b ( t i j ( λ - 1 ) ) η ) - - - ( 8 )
步骤7、判断或λ>λmax是否成立,若成立,则表示为最优聚类中心,并令后代入式(1)中;为最优典型值,并令后代入式(1)中;为最优隶属度值,并令后代入式(1)中;从而实现对样本集合X的最优划分,ε是为预先设定的阈值;若不成立,则λ+1赋值给λ,重复步骤4顺序执行,直到满足条件为止。
图1以及图2分别显示出了MKPFCM算法在variant数据集上面的NMI值以及权重值单次数迭代变化的情况,这些内核的权重拥有某些类似的适度幅度,这是非常合理的合成数据集考虑到人工所设定的平等级,但是由于集群噪音之间的重叠,发现权重并不完全相等,存在着一定的差距,随着迭代次数的变化不断的调整数据的大小[28][29][30][31]。
图3以及图4分别显示出了MKPFCM算法在glass identification数据集上面的NMI值以及权重值单次数迭代变化的情况,这些数据集只是在一维空间上面的变化情况,我们可以看出权重值仍然存在一定程度上面的变化,也就是说权重随着迭代次数的变化而变化,权重值与NMI值的变化存在着一定的关联度[14][24]当NMI值收敛的时候权重也就趋于稳定了。
综上所述,模糊c均值聚类算法的有效性很大程度上局限于球状星团,通过映射非线性数据到合适的高维特征空间可以解决这个问题,然而核的选择有的时候很复杂,基于此,本发明提出的多重核的可能性模糊c均值聚类算法(MKPFCM)可以有效解决这个问题,MKPFCM可以通过自动调整核的权重以及合并多重核的方式有效解决模糊c均值聚类算法存在的不足,在数据没有任何先验的情况下,不仅能够准确划分先行数据,而且还可以做到非线性划分非团状数据。实验和仿真结果表明,本发明算法无论在数据分类的正确性方面还是指数的比较方面表现都比较优异,具有很高的实用性。

Claims (1)

1.一种基于多重核的可能性模糊c均值聚类算法,其特征是按如下步骤进行:
步骤1、令X={x1,x2,…,xj,…,xn}表示给定的样本集合,xj表示第j个样本;1≤j≤n,n是样本的个数;对样本集合X进行最优划分,使得式(1)所示的目标函数值J最小:
min ( J ) = Σ i = 1 c J i = Σ i = 1 c Σ j = 1 n ( au i j m + bt i j η ) d 2 ( x j k , v i k ) + σ 2 Σ i = 1 c Σ j = 1 n ( ∂ j - t i j ) η - - - ( 1 )
式(1)中,Ji表示第i类的目标函数;c表示划分的类别个数,1≤i≤c,uij表示第j个样本xj隶属于第i类的隶属度值,且表示隶属度矩阵;0≤uij≤1;表示第j个样本属于第i类的隶属度的m次幂;tij表示第j个样本xj隶属于第i类的典型值,表示第j个样本属于第i个类的可能性隶属度的η次幂;a和b表示平衡参数,d(xjk,vik)表示k重高斯核空间的第j个样本xjk与k重高斯核空间的第i类的聚类中心vik之间的距离,并有:
d2(xjk,vik)=[φ(xjk)-φ(vik)]2=k(xjk,xjk)-2k(xjk,vik)+k(vik,vik) (2)
式(2)中,φ(xjk)表示第j个样本映射到k重核空间的映射函数;φ(xjk)表示第j个样本xj映射到k重高斯核空间的映射函数,并有:
式(3)中,为函数的宽度参数;
式(1)中,表示第j个样本xj赋予的权重系数,并有:
∂ j = Σ k = 1 L exp ( - θ | | x j - x z | | 2 ) - - - ( 4 )
式(4)中,θ表示常数;L表示高斯核空间的核数;xz表示第z个样本,1≤z≤n;||xj-xz||表示第j个样本xj和第z个样本xz之间的欧式距离;
式(1)中,σ2表示协方差矩阵,并有:
σ 2 = 1 n Σ j = 1 n D 2 ( x j , 1 n Σ j = 1 n x j ) - - - ( 5 )
式(5)中,表示方差;
步骤2、利用模糊c均值聚类算法对所述样本集合X进行处理,获得隶属度矩阵和k重高斯核空间的聚类中心Vk={v1k,v2k,…,vik,…,vck};以所述隶属度矩阵U和k重高斯核空间的聚类中心Vk作为初始隶属度矩阵U(0)和初始k重高斯核空间的聚类中心
步骤3、随机初始化第j个样本xj隶属于第i类的典型值为定义迭代次数为λ,最大迭代次数为λmax;并初始化λ=1;则第λ次迭代的隶属度矩阵为U(λ);第λ次迭代的聚类中心为
步骤4、利用式(6)获得第λ次迭代的第j个样本xj隶属于第i类的隶属度值
u i j ( λ ) = 1 Σ s = 1 c [ Σ k = 1 L [ 1 - k ( x j k , v i k ( λ - 1 ) ) ] Σ k = 1 L [ 1 - k ( x j k , v s k ( λ - 1 ) ) ] ] 1 m - 1 - - - ( 6 )
式(6)中,k表示高斯核空间的核数;表示第λ-1次迭代的k重高斯核空间的第s类的聚类中心,1≤s≤c;
步骤5、利用式(7)计算第λ次迭代的第j个样本xj隶属于第i类的典型值
t i j ( λ ) = 1 1 + { 2 b Σ k = 1 L [ 1 - k ( x j k , v i k ( λ - 1 ) ) ] σ 2 } 1 η - 1 - - - ( 7 )
步骤6、利用式(8)获得第λ次迭代的聚类中心
v i k ( λ ) = Σ j = 1 n ( ( a ( u i j ( λ - 1 ) ) m + b ( t i j ( λ - 1 ) ) η ) φ ( x j k ) Σ j = 1 n ( a ( u i j ( λ - 1 ) ) m + b ( t i j ( λ - 1 ) ) η ) - - - ( 8 )
步骤7、判断或λ>λmax是否成立,若成立,则表示为最优聚类中心,并令后代入式(1)中;为最优典型值,并令后代入式(1)中;为最优隶属度值,并令后代入式(1)中;从而实现对样本集合X的最优划分,ε是为预先设定的阈值;若不成立,则λ+1赋值给λ,重复步骤4顺序执行,直到满足条件为止。
CN201610194776.0A 2016-03-29 2016-03-29 多重核的可能性模糊聚类算法 Pending CN105894024A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610194776.0A CN105894024A (zh) 2016-03-29 2016-03-29 多重核的可能性模糊聚类算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610194776.0A CN105894024A (zh) 2016-03-29 2016-03-29 多重核的可能性模糊聚类算法

Publications (1)

Publication Number Publication Date
CN105894024A true CN105894024A (zh) 2016-08-24

Family

ID=57014481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610194776.0A Pending CN105894024A (zh) 2016-03-29 2016-03-29 多重核的可能性模糊聚类算法

Country Status (1)

Country Link
CN (1) CN105894024A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106846326A (zh) * 2017-01-17 2017-06-13 合肥工业大学 基于多核局部信息fcm算法的图像分割方法
CN106886785A (zh) * 2017-02-20 2017-06-23 南京信息工程大学 一种基于多特征哈希学习的航拍图像快速匹配算法
CN107220977A (zh) * 2017-06-06 2017-09-29 合肥工业大学 基于模糊聚类的有效性指标的图像分割方法
CN107247969A (zh) * 2017-06-02 2017-10-13 常州工学院 基于Gauss诱导核的模糊c均值聚类算法
CN108154186A (zh) * 2017-12-29 2018-06-12 青岛真时科技有限公司 一种模式识别方法和装置
CN108281146A (zh) * 2017-12-29 2018-07-13 青岛真时科技有限公司 一种短语音说话人识别方法和装置
CN108763590A (zh) * 2018-06-20 2018-11-06 合肥工业大学 一种基于双变加权核fcm算法的数据聚类方法
CN109993555A (zh) * 2017-12-30 2019-07-09 中国移动通信集团四川有限公司 互联网电视潜在用户投诉预测方法、装置及设备

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106846326A (zh) * 2017-01-17 2017-06-13 合肥工业大学 基于多核局部信息fcm算法的图像分割方法
CN106886785A (zh) * 2017-02-20 2017-06-23 南京信息工程大学 一种基于多特征哈希学习的航拍图像快速匹配算法
CN107247969A (zh) * 2017-06-02 2017-10-13 常州工学院 基于Gauss诱导核的模糊c均值聚类算法
CN107247969B (zh) * 2017-06-02 2020-11-10 常州工学院 基于Gauss诱导核的模糊c均值聚类算法
CN107220977A (zh) * 2017-06-06 2017-09-29 合肥工业大学 基于模糊聚类的有效性指标的图像分割方法
CN107220977B (zh) * 2017-06-06 2019-08-30 合肥工业大学 基于模糊聚类的有效性指标的图像分割方法
CN108154186A (zh) * 2017-12-29 2018-06-12 青岛真时科技有限公司 一种模式识别方法和装置
CN108281146A (zh) * 2017-12-29 2018-07-13 青岛真时科技有限公司 一种短语音说话人识别方法和装置
CN108154186B (zh) * 2017-12-29 2020-11-13 歌尔科技有限公司 一种模式识别方法和装置
CN108281146B (zh) * 2017-12-29 2020-11-13 歌尔科技有限公司 一种短语音说话人识别方法和装置
CN109993555A (zh) * 2017-12-30 2019-07-09 中国移动通信集团四川有限公司 互联网电视潜在用户投诉预测方法、装置及设备
CN108763590A (zh) * 2018-06-20 2018-11-06 合肥工业大学 一种基于双变加权核fcm算法的数据聚类方法

Similar Documents

Publication Publication Date Title
CN105894024A (zh) 多重核的可能性模糊聚类算法
Li et al. Clustering ensemble based on sample's stability
Abd Elaziz et al. Automatic data clustering based on hybrid atom search optimization and sine-cosine algorithm
CN106537422A (zh) 用于捕获信息内的关系的系统和方法
CN104539484A (zh) 一种动态评估网络连接可信度的方法及系统
Morales et al. LAMDA-HAD, an Extension to the LAMDA Classifier in the Context of Supervised Learning
Wang et al. An improving majority weighted minority oversampling technique for imbalanced classification problem
CN109002858A (zh) 一种用于用户行为分析的基于证据推理的集成聚类方法
Sáez et al. A meta-learning recommendation system for characterizing unsupervised problems: On using quality indices to describe data conformations
Peng et al. The health care fraud detection using the pharmacopoeia spectrum tree and neural network analytic contribution hierarchy process
Liang et al. A new cell group clustering algorithm based on validation & correction mechanism
Zhong et al. Fuzzy nonlinear proximal support vector machine for land extraction based on remote sensing image
Şenol VIASCKDE Index: A Novel Internal Cluster Validity Index for Arbitrary‐Shaped Clusters Based on the Kernel Density Estimation
CN108414228B (zh) 基于平均多粒度决策粗糙集和nnbc轴承故障诊断方法
CN109783586A (zh) 基于聚类重采样的水军评论检测系统及方法
Tushir et al. Exploring different kernel functions for kernel-based clustering
Spolaor et al. A novel multi-objective approach to fuzzy clustering
Nanda et al. A correlation based stochastic partitional algorithm for accurate cluster analysis
Varghese Diversity Analysis using R
Martinez Multiscale summaries of probability measures with applications to plant and microbiome data
Yang et al. A kernel-based clustering algorithm under the framework of membrane computing for image segmentation
Siers et al. RBClust: High quality class-specific clustering using rule-based classification.
Huang et al. Exploration of common clustering methods and the behavior of certain agreement indices
Bchir et al. Fuzzy relational kernel clustering with local scaling parameter learning
Jain et al. RelDenClu: A Relative Density based Biclustering Method for identifying non-linear feature relations with an Application to identify factors affecting spread of COVID-19

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160824

RJ01 Rejection of invention patent application after publication