CN108182451A - 一种增强型区间二型fcm方法、图像处理系统 - Google Patents

一种增强型区间二型fcm方法、图像处理系统 Download PDF

Info

Publication number
CN108182451A
CN108182451A CN201711447214.3A CN201711447214A CN108182451A CN 108182451 A CN108182451 A CN 108182451A CN 201711447214 A CN201711447214 A CN 201711447214A CN 108182451 A CN108182451 A CN 108182451A
Authority
CN
China
Prior art keywords
type
section
cluster centre
sample
enhanced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711447214.3A
Other languages
English (en)
Inventor
邱存勇
韩璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN201711447214.3A priority Critical patent/CN108182451A/zh
Publication of CN108182451A publication Critical patent/CN108182451A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于FCM算法技术领域,公开了一种增强型区间二型FCM方法、图像处理系统;计算参考聚类中心,并将对应特征的聚类中心向量按参考聚类中心的排序规则进行排列,得出初始聚类中心;以样本特征的加权平均初始化聚类中心,对不同类型的样本均具有良好的适应性;初始化过程引入KM算法的排序,在降型过程中直接代入初始中心值搜寻切换点。本发明引入区间二型模糊理论能有效提升算法处理不确定性的能力,通过优化初始聚类中心和降型运算,极大地减少了区间二型FCM算法的运算量,并提升算法的收敛速度。通过对随机和实际数据的实验比较验证了改进算法的有效性。

Description

一种增强型区间二型FCM方法、图像处理系统
技术领域
本发明属于FCM算法技术领域,尤其涉及一种增强型区间二型FCM方法、图像处理系统。
背景技术
目前,模糊聚类因其无监督特性和易于理解的逻辑语言在图像处理、模式识别、计算机视觉等多领域有广泛的应用,其中基于目标函数的模糊C均值聚类(FCM)算法的理论最为完善,应用也最为广泛。传统的FCM算法通过迭代更新样本到聚类中心的距离和隶属度实现聚类,采用取值为[0,1]区间的一型模糊集合表述样本与各聚类中心的隶属关系。在实际应用中,聚类过程包含各种不确定性信息,如距离测量、模糊化、样本获取、算法参数选择等过程中的不确定性因素,以一型模糊为基础的FCM算法无法很好地处理这些不确定性。事实上,Zadeh在提出模糊理论时曾提出二型模糊和多型模糊的概念,通过扩展一型模糊集合得出二型甚至多型模糊集以融入更多的不确定性信息。之后Mendel对二型模糊理论进行深入研究,证明了其理论的有效性和优越性,目前二型理论已成功应用于很多领域,其结论也证明二型模糊理论对于存在不确定性的系统有优于一型的表现。二型模糊理论在模糊聚类中的应用还处于起步阶段,二型的引入使算法运算量呈指数倍增长,导致二型在模糊聚类的应用受到限制,已有文献提出用区间二型替代二型模糊集应用到聚类算法中以提高算法的运算速度。二型模糊集由主、次隶属度函数构成,通常次隶属度函数也是一种一型模糊集,区间二型是二型的特殊情况,其次隶属度函数取值为一特定值(常取1)。次隶属度函数的简化区间二型模糊算法的复杂度降低,因此,区间二型模糊理论较二型理论得到更广的研究和应用。提出的区间二型模糊C均值(IT2FCM)算法将传统一型FCM扩展至区间二型,针对参数存在的不确定性对模糊因子m进行扩展,有效提升了算法处理不确定性的能力。然而在实际聚类中,处理的对象通常为大样本量数据,应用IT2FCM算法虽然能得到较优的聚类结果,但其运算速度依然不尽理想。因此,针对IT2FCM算法的优化,提高算法的聚类效果和运算速度十分必要。IT2FCM和FCM算法的主要区别在于IT2FCM有降型过程,这是因为IT2FCM迭代后得到的是区间二型模糊集,这种模糊集无法直接通过解模糊得到聚类果。IT2FCM采用经典的KM(Karnik-Mendel)降型算法对区间二型模糊集降型,其迭代步骤多,运算时间长。也有文献提出的EKM(EnhancedKM)算法,结合模糊聚类的特点对IT2FCM算法的降型过程进行改进。同时,考虑IT2FCM随机选取聚类中心,使得迭代次数增加并影响最终聚类结果。
综上所述,现有技术存在的问题是:传统FCM类算法在处理数据样本或图像样本时,无法准确获取样本的聚类中心,其处理方式是以随机聚类中心值开始迭代,这种迭代方式极易收敛于局部最优值,导致聚类精度下降。而要设定一个反映样本特征的初始聚类中心,由于样本的多样性,要求算法必须能够动态跟踪样本信息,针对不同类型的输入样本设定针对性的处理方法,这是目前FCM类算法需解决的一个难题。另一方面,二型FCM算法在提升处理样本能力的同时,无可避免地增加了算法复杂度,在处理大数据样本时运算速度难以满足要求,而该类算法的运算涉及到模糊化、模糊推理、降型及解模糊四个环节,如何简化这四个环节中存在的运算冗余,也是算法实际应用面临的一个难题。
发明内容
针对现有技术存在的问题,本发明提供了一种增强型区间二型FCM方法、图像处理系统。
本发明是这样实现的,一种增强型区间二型FCM方法,所述增强型区间二型FCM方法包括:
(1)初始聚类中心的确定:
计算参考聚类中心,并将对应特征的聚类中心向量按参考聚类中心的排序规则进行排列,得出初始聚类中心;
(2)以样本特征的加权平均初始化聚类中心,对不同类型的样本均具有良好的适应性;初始化过程引入KM算法的排序,在降型过程中直接代入初始中心值搜寻切换点。
进一步,所述初始聚类中心的确定具体包括:
步骤一,升序排列样本数据的第个特征值(=1,2,……,),x1j≤x2j≤…≤xNj,对应调整其余特征值位置,记调整后样本为;
步骤二,计算样本的聚类中心,有
其中:[/]为对/向下取整;=[1,2,……,v]T为含有个特征值的第类聚类中心,=1,2,……,;
步骤三,对得出的聚类中心按某特征值进行排序。
进一步,所述以样本特征的加权平均初始化聚类中心定义:
迭代过程中,当切换点变至′时,KM算法重新计算′i;对比和′
的表达式,找出与′之间的差异值:
对应′表达式调整为:
KM算法的降型终止条件=等效于判定′=,满足′=则停止迭代,得到的区间最小值;不满足,则取=,=′,=′,求得区间最大值,优化后表达式为:
本发明的另一目的在于提供一种利用所述增强型区间二型FCM方法的图像处理系统。
本发明的另一目的在于提供一种利用所述增强型区间二型FCM方法的模式识别系统。
本发明的另一目的在于提供一种利用所述增强型区间二型FCM方法的计算机视觉系统。
本发明通过优化初始聚类中心和降型运算,极大地减少了区间二型FCM算法的运算量,并提升算法的收敛速度;通过对随机和实际数据的实验比较验证了改进算法的有效性。模糊推理环节采用区间二型模糊集替代传统一型模糊集,在分析样本隶属度时,所得结果由传统的单一值扩展至区间值,从而提升了算法处理不确定性的能力;针对传统方法随机初始聚类中心的问题,提出了跟踪样本特征的初始聚类中心方法,通过对样本信息的数值排序及加权平均,使算法处理图像、数据等各类不同样本均有良好的适应性,且迭代运算时能以一个优化的聚类中心开始迭代,避免了传统方法因随机聚类中心值而导致的迭代次数多、精度差等问题;针对区间二型模糊运算中存在的计算冗余进行优化,提高了算法在降型时的运算效率,大幅降低了算法迭代过程所用时间。
附图说明
图1是本发明实施例提供的增强型区间二型FCM方法流程图。
图2是本发明实施例提供的初始化聚类中心示意图。
图3是本发明实施例提供的不同样本量下各算法迭代次数及运行时间比较示意图。
图4是本发明实施例提供的Iris与Wine数据各算法迭代次数比较示意图;
图中:(a)Iris图像;(b)Wine图像。
图5是本发明实施例提供的IT2FCM与EIT2FCM运行时间比较示意图;
图中:(a)Iris图像;(b)Wine图像。
具体实施方式
为能进一步了解本发明的发明内容、特点及功效,兹例举以下实施例,并配合附图详细说明如下。
下面结合附图对本发明的应用原理作详细的描述。
如图1所示,本发明实施例提供的增强型区间二型FCM方法包括以下步骤:
S101:初始聚类中心的确定:计算参考聚类中心,并将对应特征的聚类中心向量按参考聚类中心的排序规则进行排列,得出初始聚类中心;
S102:以样本特征的加权平均初始化聚类中心,对不同类型的样本均具有良好的适应性;初始化过程引入KM算法的排序,在降型过程中直接代入初始中心值搜寻切换点。
下面结合附图对本发明的
应用原理作进一步的描述。
1知识回顾
1.1区间二型模糊聚类算法
区间二型模糊聚类算法步骤如下。
步骤1:设定聚类数c(2≤c≤N,N为样本总量),模糊系数m1和m2,设置迭代停止阈值ε,初始化聚类中心V。
步骤2:由式(1)计算上、下隶属度函数分别为:
其中:dik=∥xk-vi∥A(一般∥·∥取欧氏距离)为第k个样本xk到第i个聚类中心vi的距离, μ i(k)分别为xk到聚类中心vi的上、下隶属度函数。
步骤3:由KM算法迭代更新聚类中心V的区间[vL,vR]。
步骤4:取更新后聚类中心V′=(vL+vR)/2,若满足∥V′-V∥<ε则停止迭代,否则令V=V′,返回步骤2。
1.2KM迭代算法
KM算法是由Karnik等[13]提出的用于对区间二型模糊集进行降型的迭代算法,在区间二型模糊聚类中用于计算聚类中心的区间值[vL,vR].以计算vL为例,算法步骤如下。
步骤1:升序排列样本xk=(xk1,xk2,…,xkM)(k=1,2,…,N)如下所示:
x11≤x21≤…≤xN1,
x12≤x22≤…≤xN2,
...
x1M≤2≤…≤,(2)
其中为样本的特征数。
步骤2:取初始化隶属度函数=(-+)/2,其对应的第类聚类中心为
步骤3:由()≤ ≤(+1)找出切换点,对应区间值为
步骤4:若满足=则停止迭代,得到的区间最小值;若不满足,则取=,返回步骤3.类似可求得区间最大值。
KM算法通过迭代寻找最优切换点,其迭代次数受初始值选择和样本数量的影响.聚类算法的应用对象通常为大样本数据,且IT2FCM算法的每一次迭代过程均需要调用KM算法更新聚类中心,因此寻找方法提高IT2FCM中降型过程的效率是十分必要的.
本发明的工作原理是:
2增强型区间二型FCM方法
2.1初始聚类中心的确定
如图2所示:
步骤1:升序排列样本数据的第个特征值(=1,2,……,),即x1j≤x2j≤…≤xNj,对应调整其余特征值位置,记调整后样本为。
步骤2:由式(5)计算样本的聚类中心,有
其中:[/]为对/向下取整;=[1,2,……,v]T为含有个特征值的第类聚类中心,=1,2,……,.
步骤3:对步骤2得出的聚类中心按某特征值进行排序,如图1按特征1排序,按图示方式计算参考聚类中心,并将对应特征的聚类中心向量按参考聚类中心的排序规则进行排列,得出初始聚类中心。
本发明提出的初始化聚类中心方法是对多特征。在不同特征下的聚类中心作加权平均,本发明以准确度的下降换取运算速度的提升,但是由于初始化过程中嵌入了降型算法的运算,在初始化后可直接跳过KM算法的步骤1和步骤2,能够明显提升算法的运算速度,相比其他初始化方法更适用于区间二型模糊聚类算法。
2.2改进降型运算
本发明以样本特征的加权平均初始化聚类中心,对不同类型的样本均具有良好的适应性。由于初始化过程引入了KM算法的排序过程,在降型过程中可以直接代入初始中心值搜寻切换点,有效地减少了算法的运算量。另外,考虑式(4)中,定义:
始化过程引入了KM算法的排序过程,在降型过程中可以直接代入初始中心值搜寻切换点,有效地减少了算法的运算量。另外,考虑式(4)中,定义迭代过程中,当切换点变至′时,KM算法由式(4)重新计算′i.对比和′的表达式,由于切换点的改变幅度较小,迭代存在大量的重复计算。实际计算中只需找出与′之间的差异值即可,如下所示:
对应′表达式调整为
由式(8)可知,KM算法的降型终止条件=等效于判定′=,由此设置降型算法终止条件为:若满足′=则停止迭代,得到的区间最小值;若不满足,则取=,=′,=′,返回步骤3.类似可求得区间最大值,其优化后表达式为:
EIT2FCM算法步骤与IT2FCM相同,只是在迭代中采用方法初始化聚类中心,而降型过程采用优化方法进行计算。
下面结合实验对本发明的应用效果作详细的描述。
1、实验分析
本发明分别对FCM、EFCM(采用本发明初始化方法的FCM算法)、IT2FCM和提出的EIT2FCM进行对比,通过记录其运行时间和迭代次数以验证算法的有效性。
1.1随机数据比较
选取不同样本量的随机数据进行实验,取=100:10000,间隔100,特征数取对每个样本进行了100次蒙特卡洛实验,对100次实验结果取均值,各算法迭代次数与运行时间如图3所示。
1.2UCI数据比较
为了验证算法的有效性,选取UCI数据库中较常用的真实数据Iris和Wine进行实验分析.Iris和Wine分别为4个和13个特征数的数据,图4和图5为100次实验记录的算法迭代次数和运行时间对比。
考虑有个特征的样本,单次FCM算法所需的运算量为2,单次IT2FCM运算量为22+(-1)+2,其中各项分别表示两次FCM运算、一次数据排序和一次降型运算,为KM降型算法所需迭代次数。由于样本量常为较大值,有2>>>>,单次IT2FCM运算量可近似为32+TN2
本发明算法由于对降型过程进行了优化,降型所需运算量由TN2降为N+T(s′-s)2.考虑N2>>N>>s′-s,单次EIT2FCM运算量可近似为3MN2。若IT2FCM算法通过R次迭代收敛,则其总运算量为3RMN2+RTN2。本发明采用了初始化聚类中心的方法,由图3-图5可见,EIT2FCM较IT2FCM迭代次数平均减少约40%,因此EIT2FCM运算总量可记为0.6R(3MN2),近似于2RMN2。图3和图5的运行时间对比验证了EIT2FCM的运算效率明显优于IT2FCM.
为了提高区间二型聚类算法的运算效率,本发明提出了一种增强型区间二型模糊均值聚类算法EIT2FCM。针对传统模糊聚类算法随机初始化聚类中心导致算法迭代次数增加,鉴于此,提出了一种加权平均初始化方法,通过初始化聚类中心有效提高算法的收敛速度。另外,由于区间二型模糊集在处理中需要特殊的降型过程,不可避免地增加了区间二型算法的复杂度,通过参考EKM算法对传统的降型步骤进行优化,缩短了降型运算的时间。实验结果显示,EIT2FCM有效提高了运算效率,较IT2FCM有更快的收敛速度。
以上所述仅是对本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化与修饰,均属于本发明技术方案的范围内。

Claims (6)

1.一种增强型区间二型FCM方法,其特征在于,所述增强型区间二型FCM方法包括:计算参考聚类中心,对应特征的聚类中心向量按参考聚类中心的排序规则进行排列,得出初始聚类中心;以样本特征的加权平均初始化聚类中心,对不同类型的样本均具有良好的适应性;初始化过程引入KM算法的排序,在降型过程中直接代入初始中心值搜寻切换点。
2.如权利要求1所述的增强型区间二型FCM方法,其特征在于,所述初始聚类中心的确定具体包括:
步骤一,升序排列样本数据的第个特征值(=1,2,……,),x1j≤x2j≤…≤xNj,对应调整其余特征值位置,记调整后样本为;
步骤二,计算样本的聚类中心,有
其中:[/]为对/向下取整;vi=[vi1,vi2,…,vij]T为含有个特征值的第类聚类中心,=1,2,……,;
步骤三,对得出的聚类中心按某特征值进行排序。
3.如权利要求1所述的增强型区间二型FCM方法,其特征在于,所述以样本特征的加权平均初始化聚类中心定义:
迭代过程中,当切换点变至′时,KM算法重新计算′i;对比和′的表达式,找出与′之间的差异值:
对应′表达式调整为:
KM算法的降型终止条件=等效于判定′=,满足′=则停止迭代,得到的区间最小值;不满足,则取=,=′,=′,求得区间最大值,优化后表达式为:
4.一种利用权利要求1~3任意一项所述增强型区间二型FCM方法的图像处理系统。
5.一种利用权利要求1~3任意一项所述增强型区间二型FCM方法的模式识别系统。
6.一种利用权利要求1~3任意一项所述增强型区间二型FCM方法的计算机视觉系统。
CN201711447214.3A 2017-12-27 2017-12-27 一种增强型区间二型fcm方法、图像处理系统 Pending CN108182451A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711447214.3A CN108182451A (zh) 2017-12-27 2017-12-27 一种增强型区间二型fcm方法、图像处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711447214.3A CN108182451A (zh) 2017-12-27 2017-12-27 一种增强型区间二型fcm方法、图像处理系统

Publications (1)

Publication Number Publication Date
CN108182451A true CN108182451A (zh) 2018-06-19

Family

ID=62547888

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711447214.3A Pending CN108182451A (zh) 2017-12-27 2017-12-27 一种增强型区间二型fcm方法、图像处理系统

Country Status (1)

Country Link
CN (1) CN108182451A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111476236A (zh) * 2020-04-09 2020-07-31 湖南城市学院 一种自适应fcm车牌定位方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111476236A (zh) * 2020-04-09 2020-07-31 湖南城市学院 一种自适应fcm车牌定位方法及系统
CN111476236B (zh) * 2020-04-09 2023-07-21 湖南城市学院 一种自适应fcm车牌定位方法及系统

Similar Documents

Publication Publication Date Title
CN113378632B (zh) 一种基于伪标签优化的无监督域适应行人重识别方法
Xiao et al. Davies Bouldin Index based hierarchical initialization K-means
Chacón A population background for nonparametric density-based clustering
CN111814871A (zh) 一种基于可靠权重最优传输的图像分类方法
CN109002845A (zh) 基于深度卷积神经网络的细粒度图像分类方法
CN110751121B (zh) 基于聚类与sofm的无监督雷达信号分选方法
CN112116090A (zh) 神经网络结构搜索方法、装置、计算机设备及存储介质
CN114418035A (zh) 决策树模型生成方法、基于决策树模型的数据推荐方法
CN111222847B (zh) 基于深度学习与非监督聚类的开源社区开发者推荐方法
CN103258147A (zh) 一种基于gpu的并行演化超网络dna微阵列基因数据分类系统及方法
CN113449802A (zh) 基于多粒度互信息最大化的图分类方法及装置
Gu et al. Unsupervised and semi-supervised robust spherical space domain adaptation
CN115204416A (zh) 基于分层抽样优化的面向异构客户端的联合学习方法
CN114417095A (zh) 一种数据集划分方法及装置
Yue et al. CTRL: Clustering training losses for label error detection
CN111144462A (zh) 一种雷达信号的未知个体识别方法及装置
CN110830291A (zh) 一种基于元路径的异质信息网络的节点分类方法
CN105787505A (zh) 一种结合稀疏编码和空间约束的红外图像聚类分割方法
CN108182451A (zh) 一种增强型区间二型fcm方法、图像处理系统
CN116244612B (zh) 一种基于自学习参数度量的http流量聚类方法及装置
CN111353525A (zh) 一种不均衡不完整数据集的建模及缺失值填补方法
CN107423319B (zh) 一种垃圾网页检测方法
CN110008972A (zh) 用于数据增强的方法和装置
CN114859316A (zh) 基于任务相关度加权的雷达目标智能识别方法
CN114185039A (zh) 雷达目标一维距离像智能识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180619