CN108830289B - 一种基于改进的模糊c均值聚类的图像聚类方法及装置 - Google Patents

一种基于改进的模糊c均值聚类的图像聚类方法及装置 Download PDF

Info

Publication number
CN108830289B
CN108830289B CN201810402534.5A CN201810402534A CN108830289B CN 108830289 B CN108830289 B CN 108830289B CN 201810402534 A CN201810402534 A CN 201810402534A CN 108830289 B CN108830289 B CN 108830289B
Authority
CN
China
Prior art keywords
clustering
image
sample image
objective function
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810402534.5A
Other languages
English (en)
Other versions
CN108830289A (zh
Inventor
孙林
何嘉玉
赵建国
李鹏飞
李晓艳
陈岁岁
刘弱南
秦小营
赵婧
殷腾宇
王学敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Normal University
Original Assignee
Henan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan Normal University filed Critical Henan Normal University
Priority to CN201810402534.5A priority Critical patent/CN108830289B/zh
Publication of CN108830289A publication Critical patent/CN108830289A/zh
Application granted granted Critical
Publication of CN108830289B publication Critical patent/CN108830289B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/45Analysis of texture based on statistical description of texture using co-occurrence matrix computation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于改进的模糊C均值聚类的图像聚类方法及装置,该方法包括:输入样本图像,计算样本图像的特征值向量;将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目;采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数;根据初始的聚类中心和聚类数目,采用改进的模糊C均值聚类算法的判别公式,通过迭代计算下一次的聚类中心,直至相邻两次的目标函数值之间的变化量小于设定的阈值。本发明通过计算样本图像的特征值向量,采用自组织神经网络算法对图像进行粗聚类,确定初始的聚类中心和聚类数目,增强了聚类效果的稳定性和准确性。

Description

一种基于改进的模糊C均值聚类的图像聚类方法及装置
技术领域
本发明涉及一种基于改进的模糊C均值聚类的图像聚类方法及装置,属于图像处理技术领域。
背景技术
21世纪是一个数据化、信息化的时代,随着医学成像技术的发展和普及,医院和医疗研究机构产生的医学影像数据,包括CT、MRI、X射线等,均呈现海量化的増长趋势,如何准确高效地对医学图像进行匹配检索成为当前研究的重要课题。基于内容的医学图像检索方法依赖于医学图像的视觉特征,如形状、纹理、颜色、灰度等,用户输入想要检索的医学图像,根据相似度大小,依次返回给用户。
模糊C均值聚类相比“硬聚类”,它会计算每个样本对所有类的隶属度,若某样本对某类的隶属度在所有类的隶属度中具有绝对优势,则该样本分到这个类中是一个十分保险的做法。其中,在模糊C均值聚类算法中,聚类定义是模糊的,每个数据点对每个簇都存在一个隶属度,并且每个数据点对所有簇的隶属度之和为1。
模糊C均值聚类算法的思想是:首先给定数据集X={x1,x2,...,xn},c为聚类类别数,Ci(i=1,2,…,c)为每个类的聚类中心,μij反映了第j个样本对第i类的隶属度,则模糊C均值聚类的判别函数(目标函数)为:
Figure BDA0001646067270000011
其中,i表示第i个聚类中心,
Figure BDA0001646067270000012
μij表示数据集第j个样本, xj隶属于第i个分类的隶属度,
Figure BDA0001646067270000021
j表示第j个样本图像,
Figure BDA0001646067270000022
m为加权指数,大多数情况下m的值为2,dij为第j个样本对第 i个聚类中心的欧式距离。
由于模糊C均值聚类算法的计算即为不断迭代使目标函数最小化的过程,给定聚类类别数,设定阈值范围,初始化聚类中心以后,重复计算隶属度μjt和聚类中心pi,当相邻两次目标函数结果的变化量小于设定的阈值时,迭代停止,此时认为算法收敛。其中,隶属度μjt和聚类中心pi的计算公式如下:
Figure BDA0001646067270000023
其中,i为第i个聚类中心,m为加权指数,djt为第t个样本图像xt对第j个聚类中心的欧氏距离,dit为第t个样本图像xt对第i个聚类中心的欧氏距离,k为第k个聚类中心。
由于模糊C均值聚类算法对初始值非常敏感,因此,模糊C算法中初始值的设定有很重要的意义。模糊C均值聚类方法存在以下缺点:(1)初始聚类数需要人为确定,使用伪随机数产生初始聚类中心造成聚类效果不稳定,容易得不到满意的效果;(2)采用现有的判别函数作为聚类目标,模糊C均值聚类效果常常不稳定,导致模糊C均值聚类结果准确度较低。
发明内容
本发明的目的是提供一种基于改进的模糊C均值聚类的图像聚类方法及装置,用于解决现有的初始聚类数和初始聚类中心会导致聚类效果不佳,进而影响图像检索效果的问题。
为解决上述技术问题,本发明提供了一种基于改进的模糊C均值聚类的图像聚类方法,步骤如下:
输入样本图像,计算样本图像的特征值向量;
将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目;
采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数;
根据初始的聚类中心和聚类数目,通过迭代计算下一次的聚类中心,直至相邻两次的目标函数值之间的变化量小于设定的阈值。
本发明的有益效果是:
通过计算样本图像的特征值向量,采用自组织神经网络算法对图像进行粗聚类,确定初始的聚类中心和聚类数目,增强了聚类效果的稳定性,进而增强了图像检索的准确性,并且为了增强模糊C均值聚类算法的聚类结果准确度,还包括采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数。
进一步的,为了使整体图像的灰度像素分布均匀,增强图像的对比度,还包括对样本图像进行去噪处理。
进一步的,运用灰度共生矩阵计算样本图像的特征值向量。
进一步的,采用高斯滤波方法对样本图像进行去噪处理。
进一步的,样本图像的特征值向量包括角二阶矩、对比度、自相关、同质性 /逆差距和熵。
本发明还提供了一种基于改进的模糊C均值聚类的图像聚类装置,包括处理器和存储器,所述处理器用于处理存储在存储器中的指令以实现如下方法:
输入样本图像,计算样本图像的特征值向量;
将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目;
采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数;
根据初始的聚类中心和聚类数目,通过迭代计算下一次的聚类中心,直至相邻两次的目标函数值之间的变化量小于设定的阈值。
进一步的,还包括对样本图像进行去噪处理。
进一步的,运用灰度共生矩阵计算样本图像的特征值向量。
进一步的,采用高斯滤波方法对样本图像进行去噪处理。
进一步的,样本图像的特征值向量包括角二阶矩、对比度、自相关、同质性 /逆差距和熵。
附图说明
图1是本发明基于改进的模糊C均值聚类的图像聚类方法的流程图;
图2是自组织神经网络模型图;
图3是输入的图像1的示意图;
图4是系统一对图像1的检索结果;
图5是系统二对图像1的检索结果;
图6是输入的图像2的示意图;
图7是系统一对图像2的检索结果;
图8是系统二对图像2的检索结果;
图9是输入的图像3的示意图;
图10是系统一对图像3的检索结果;
图11是系统二对图像3的检索结果;
图12是输入的图像4的示意图;
图13是系统一对图像4的检索结果;
图14是系统二对图像4的检索结果;
图15是输入的图像5的示意图;
图16是系统一对图像5的检索结果;
图17是系统二对图像5的检索结果;
图18是本算法与经典的模糊C均值聚类算法的检索结果的查全率;
图19是本算法与经典的模糊C均值聚类算法的检索结果的查准率。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例对本发明进行进一步详细说明。
本发明提供了一种基于改进的模糊C均值聚类的图像聚类装置,包括处理器和存储器,处理器用于处理存储在存储器中的指令,以实现一种基于改进的模糊 C均值聚类的图像聚类方法,该聚类方法可以应用于医学图像的聚类,也可以应用于其他类型的图像的聚类。具体来说,该方法的流程图如图1所示,包括以下步骤:
(1)输入样本图像,对样本图像进行去噪处理。
在本实施例中,在进行聚类之前,首先对图像库中输入的图像进行统一的高斯滤波处理,进而将图像中的灰度像素点作为映射,使得整体图像的灰度像素分布均匀,增强图片的对比度。
在具体实施时,运用Matlab软件对图像进行高斯滤波处理,它是对整幅图像进行加权平均的过程,每一个像素点的值都由其本身与邻域内的其他像素的值经过加权平均后得到。高斯滤波函数h(x,y)为:
Figure BDA0001646067270000051
其中,x2和y2分别表示邻域的其他像素与邻域中心像素的距离,σ表示标准差。
离散的高斯卷积核H是(2k+1)×(2k+1)维矩阵,其元素的计算函数为:
Figure BDA0001646067270000061
其中,σ为方差,k为核矩阵的维数。
对图像进行高斯滤波处理的方法属于现有技术,此处不再赘述。当然,作为其他的实施方式,也可以采用现有技术中其他的去噪方法对对样本图像进行去噪处理。
(2)计算样本图像的特征值向量,将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目。
也就是说,为确定初始聚类中心和聚类数目,在模糊C均值聚类的基础上加入了“自组织神经网络”的方法。其中,自组织神经网络是一种竞争学习型的无监督神经网络,它能将高维输入数据映射到二维空间,即将高维空间中相似的样本点映射到网络输出层中的邻近神经元。它通过自动寻找样本内在的规律与属性,自适应地改变网络参数与结构。
如图2所示,自组织神经网络的结构有两层:输入层+竞争层。输入层作用为输入外界信息,并把外界信息从输入模式向竞争模式传递;竞争层作用为对输入进来的外界信息进行相似性测量,寻找其中的规律进而将外界信息归类。
自组织神经网络的训练过程为:接收到样本点后,每个竞争层的神经元会计算该样本点与自身的权向量间的距离,距离最近者为竞争获胜神经元,进而,竞争获胜神经元及其邻近神经元的权向量将被调整,使得权向量与当前输入样本的距离缩小,此过程将不断迭代,直至最终结果收敛。
在确定初始聚类中心的过程中,本实施例采用灰度共生矩阵计算图像的特征值作为图像的特征值向量。当然,作为其他的实施方式,也可以采用现有技术中的其他方法来计算样本图像的特征值向量。其中,灰度共生矩阵指的是一种通过研究灰度的空间相关特性来描述纹理的常用方法。纹理是由灰度在空间位置反复出现而形成的,因此在图像上相隔任意距离的两个像素之间会存在一定的灰度关系。此矩阵是对图像空间上保持某距离的两个像素分别具有灰度状况的统计。
灰度共生矩阵的特征非常多,本实施例选取角二阶矩(ASM)、对比度(CON)、自相关(COR)、同质性/逆差矩(H)、熵(ENT)等五个特征值,组成描述灰度纹理特征的向量,具体计算公式如下:
a.角二阶矩(ASM)
Figure BDA0001646067270000071
b.对比度(Con)
Figure BDA0001646067270000072
c.自相关(Cor)
Figure BDA0001646067270000073
d.逆差矩(H)
Figure BDA0001646067270000074
e.熵(Ent)
Figure BDA0001646067270000075
其中,i表示灰度共生矩阵的第i行,j表示灰度共生矩阵的第j列,P(i,j)表示灰度共生矩阵第i行第j列对应的元素,μi
Figure BDA0001646067270000076
μj
Figure BDA0001646067270000077
Figure BDA0001646067270000078
Figure BDA0001646067270000079
Figure BDA00016460672700000710
Figure BDA00016460672700000711
由于上述五个特征值的计算公式均属于现有技术,此处不再对计算公式中的参数计算进行详细描述。将灰度共生矩阵得出的五个图像特征值作为自组织神经网络的输入样本点。对当前输入模式向量Y和竞争层中各神经元的权向量ωj进行归一化处理,其中j=1,2,…,m,分别得到归一化后的输入模式向量
Figure BDA0001646067270000081
和归一化后的竞争层中各神经元的权向量
Figure BDA0001646067270000082
的计算公式如下:
Figure BDA0001646067270000083
Figure BDA0001646067270000084
其中,j表示第j个权向量,||Y||表示输入模式向量Y的大小,||ωj||表示输入模式向量ωj的大小。
进而每个竞争层的神经元会计算该样本点与自身的权向量间的距离
Figure BDA0001646067270000085
即将
Figure BDA0001646067270000086
与竞争层所有神经元所对应的权向量ωj进行相似性测量,其中j=1,2,…, m,最相似的神经元获胜,为竞争获胜神经元
Figure BDA0001646067270000087
此时有:
Figure BDA0001646067270000088
然后竞争获胜神经元及其邻近神经元的权向量将被调整,权向量调整如下:
Figure BDA0001646067270000089
其中,t+1表示获胜神经元在进行第t+1次学习和调整,
Figure BDA00016460672700000810
表示向量调整的大小,0<α≤1为学习率,α通常随着调整次数的增加而减小直至趋于聚类中心。竞争获胜神经元及其邻近神经元的权向量将被调整,使得权向量与输入样本的距离缩小。此过程将不断迭代,直至收敛。
此时,每个竞争神经元对应的相似样本点已确定,无监督分类学习结束。在每个竞争神经元内随机选取一个权值作为初始聚类中心,作为模糊C均值聚类的输入聚类中心,聚类中心数目为竞争层中的类别数。
(3)采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数。
其中,极大似然估计是建立在极大似然原理的基础上的一个统计方法,极大似然估计提供了一种利用已知的观察数据来评估模型参数的方法。它的目的就是利用已知的样本点结果来反推最大概率导致的参数值。
在本实施例中,基于极大似然的模糊C均值聚类首先假设所有样本点的分布服从正态分布N=(μkk 2),进而根据极大似然利用已知的样本点结果来反推最大概率导致的参数值的目的,借助极大似然估计计算出每个样本归属于各个类的概率,将样本归属于概率最大的一类中。
设输入各个样本点的向量为XT=[x1,x2,...,xn],根据自组织神经网络中竞争层的类别数确定类数为S,有特征向量X在第k类的概率密度分布P(X|Sk)为:
Figure BDA0001646067270000091
其中,
Figure BDA0001646067270000092
是第k类的均值向量,
Figure BDA0001646067270000093
是第k类特征向量的协方差矩阵,(σk 2)-1是σk 2的逆矩阵,|σk 2|是矩阵σk 2的行列式。
由贝叶斯决策可知样本点归属于第k类的概率P(Sk|X)为:
Figure BDA0001646067270000094
其中,P(X|Sk)是特征向量X在第k类的概率分布,P(Sk)是第i类出现的先验概率,i=1,2,…,S。若P(Sk|X)越大,则特征向量X归属于Sk的概率就越大。结合第k类的均值向量μk和第k类特征向量的协方差矩阵σk 2,并经过基数为e 的对数求解可得判别式gk(X)为:
Figure BDA0001646067270000101
经过极大似然估计后的样本点对归属于各个类的概率都有了明确的数值,此时将gk(x)作为权值ωi代入模糊C均值聚类的目标函数J中,即:
Figure BDA0001646067270000102
其中,i为第i个聚类中心,j为第j个样本图像,j=1,2,...,n,m为加权指数,dij为第j 个样本图像xj对第i个聚类中心的欧氏距离,μij为第j个样本xj隶属于第i个分类的隶属度,c为第c个聚类中心,ωi为基于极大似然估计的权值。
由此目标函数可得出加权后的隶属度μij和聚类中心pi
相比传统的模糊C均值聚类算法,本发明加入了基于极大似然估计算法的权值,权值的意义为待检索样本图像属于各个类的概率大小,这增加了图像检索的准确性。
(4)根据初始的聚类中心和聚类数目,通过迭代计算下一次的聚类中心,直至相邻两次的目标函数值之间的变化量小于设定的阈值。
其中,迭代计算下一次的聚类中心的方法属于现有技术,此处不再赘述。通过循环迭代直至最终隶属度μij稳定,则说明改进后的模糊C均值聚类完成。
在程序实现时,本发明基于改进的模糊C均值聚类的图像聚类方法的步骤如下:
步骤一:输入样本图像;
步骤二:运用灰度共生矩阵算法计算图像的五个特征值向量;
步骤三:运用自组织神经网络算法,根据图像的五个特征值向量进行分类,确定聚类中心和粗聚类结果;
步骤四:运用极大似然估计算法得出样本图像对各个类的归属概率,将此概率作为模糊C均值聚类判别式中的新加入权值;
步骤五:输入自组织神经网络确定的聚类中心ci(k),其中i=1,2,…,c,k为第k个样本图像;
步骤六:确定加权系数m的值和阈值ε的范围;
步骤七:计算聚类中心与各个样本点间的距离dij
步骤八:设定循环次数sn=1;
步骤九:分别计算隶属度矩阵并确定新的聚类中心来替代原始聚类中心;
步骤十:判断相邻两次目标表达式的值的变化是否小于给定阈值ε,若小于则算法结束,若不小于,令sn=sn+1,返回步骤八继续迭代直至算法结束。
为了验证本发明基于改进的模糊C均值聚类的图像聚类方法及装置的有效性,利用Matlab R2016a实现了两个CBIR系统。系统一使用了本发明基于改进的模糊C均值聚类的图像聚类方法,系统二则使用经典的模糊C均值聚类算法。
在试验中,从图像库中随机选出三类图片分别为大脑CT、手部X光片和颈部X光片各50张作为测试集合,共计150张图片。在三类图像中随机选取几张图像作为待查询图像,分别运用系统一和系统二对待查询图像进行查询。当输入图像1(如图3所示)作为待查询图像时,系统一检索的结果如图4所示,系统二检索的结果如图5所示。当输入图像2(如图6所示)作为待查询图像时,系统一检索的结果如图7所示,系统二检索的结果如图8所示。当输入图像3(如图9所示)作为待查询图像时,系统一检索的结果如图10所示,系统二检索的结果如图11所示。当输入图像4(如图12所示)作为待查询图像时,系统一检索的结果如图13所示,系统二检索的结果如图14所示。当输入图像5(如图15 所示)作为待查询图像时,系统一检索的结果如图16所示,系统二检索的结果如图17所示。
从系统一和系统二的检索结果对比可知,本发明提出的基于改进的模糊C均值聚类的图像聚类方法具有良好的检索效果。为了得到比较客观的结论,下面采取统计平均值的方法,对本发明基于改进的模糊C均值聚类的图像聚类方法以及经典的模糊C均值聚类算法的效果进行评估,图18和图19分别展示了两种方法的检索质量。其中,检索质量的评价指标为查准率和查全率,查全率和查准率的表达式为:
Figure BDA0001646067270000121
其中,Er为查全率,Ep为查准率,c为检索结果中系统返回的正确图像数目,e为系统没有检索出的正确图像数目,t为系统检索出错误图像的数目。
从图18和图19中可以看出,与经典模糊C均值聚类算法相比,本发明基于改进的模糊C均值聚类的图像聚类方法的检索结果准确率提高了12%,在总体精确度上明显高于传统的模糊C均值聚类方法。
本发明所提供了的基于改进的模糊C均值聚类的图像聚类方法及装置,在经典模糊C均值聚类的基础上首先对图像进行统一的高斯滤波处理,然后运用灰度共生矩阵算法计算图像的特征值,进而运用自组织神经网络算法,根据图像的特征值对图像进行粗聚类,初步确定聚类中心以及聚类数目,成功地解决了经典的模糊C均值聚类算法对初始聚类中心过于敏感,且人为设定聚类数目存在非常大的误差,导致聚类准确性较差的问题。另外,采用了极大似然估计算法对模糊C 均值聚类进行改进,将极大似然估计的结果作为模糊C均值聚类的权值,构建出新的判别函数,增加了模糊C均值聚类的准确性,解决了采用现有的判别函数作为聚类目标,导致模糊C均值聚类结果准确度较低的问题。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (6)

1.一种基于改进的模糊C均值聚类的图像聚类方法,其特征在于,步骤如下:
输入样本图像,计算样本图像的特征值向量;运用灰度共生矩阵计算样本图像的特征值向量,样本图像的特征值向量包括角二阶矩、对比度、自相关、同质性/逆差距和熵;
将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目;
采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数;将该归属概率作为目标函数的权值以构建目标函数的过程为:得到样本点归属于第k类的归属概率后,结合第k类的均值向量μk和第k类特征向量的协方差矩阵σk 2,并经过基数为e的对数求解得到判别式gk(x),将gk(x)作为权值ωi代入模糊C均值聚类的目标函数J中,即:
Figure FDA0002571440060000011
其中,i为第i个聚类中心,j为第j个样本图像,j=1,2,...,n,m为加权指数,dij为第j个样本图像xj对第i个聚类中心的欧氏距离,μij为第j个样本xj隶属于第i个分类的隶属度,c为第c个聚类中心,ωi为基于极大似然估计的权值,n为样本图像个数;由目标函数J得出加权后的隶属度和聚类中心;
根据初始的聚类中心和聚类数目,通过迭代计算下一次的聚类中心,直至相邻两次的目标函数值之间的变化量小于设定的阈值。
2.根据权利要求1所述的基于改进的模糊C均值聚类的图像聚类方法,其特征在于,还包括对样本图像进行去噪处理。
3.根据权利要求2所述的基于改进的模糊C均值聚类的图像聚类方法,其特征在于,采用高斯滤波方法对样本图像进行去噪处理。
4.一种基于改进的模糊C均值聚类的图像聚类装置,其特征在于,包括处理器和存储器,所述处理器用于处理存储在存储器中的指令以实现如下方法:
输入样本图像,计算样本图像的特征值向量;运用灰度共生矩阵计算样本图像的特征值向量,样本图像的特征值向量包括角二阶矩、对比度、自相关、同质性/逆差距和熵;
将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目;
采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数;将该归属概率作为目标函数的权值以构建目标函数的过程为:得到样本点归属于第k类的归属概率后,结合第k类的均值向量μk和第k类特征向量的协方差矩阵σk 2,并经过基数为e的对数求解得到判别式gk(x),将gk(x)作为权值ωi代入模糊C均值聚类的目标函数J中,即:
Figure FDA0002571440060000021
其中,i为第i个聚类中心,j为第j个样本图像,j=1,2,...,n,m为加权指数,dij为第j个样本图像xj对第i个聚类中心的欧氏距离,μij为第j个样本xj隶属于第i个分类的隶属度,c为第c个聚类中心,ωi为基于极大似然估计的权值,n为样本图像个数;由目标函数J得出加权后的隶属度和聚类中心;
根据初始的聚类中心和聚类数目,通过迭代计算下一次的聚类中心,直至相邻两次的目标函数值之间的变化量小于设定的阈值。
5.根据权利要求4所述的基于改进的模糊C均值聚类的图像聚类装置,其特征在于,还包括对样本图像进行去噪处理。
6.根据权利要求5所述的基于改进的模糊C均值聚类的图像聚类装置,其特征在于,采用高斯滤波方法对样本图像进行去噪处理。
CN201810402534.5A 2018-04-28 2018-04-28 一种基于改进的模糊c均值聚类的图像聚类方法及装置 Active CN108830289B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810402534.5A CN108830289B (zh) 2018-04-28 2018-04-28 一种基于改进的模糊c均值聚类的图像聚类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810402534.5A CN108830289B (zh) 2018-04-28 2018-04-28 一种基于改进的模糊c均值聚类的图像聚类方法及装置

Publications (2)

Publication Number Publication Date
CN108830289A CN108830289A (zh) 2018-11-16
CN108830289B true CN108830289B (zh) 2020-09-08

Family

ID=64147465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810402534.5A Active CN108830289B (zh) 2018-04-28 2018-04-28 一种基于改进的模糊c均值聚类的图像聚类方法及装置

Country Status (1)

Country Link
CN (1) CN108830289B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110866527A (zh) * 2018-12-28 2020-03-06 北京安天网络安全技术有限公司 一种图像分割方法、装置、电子设备及可读存储介质
CN111367901B (zh) * 2020-02-27 2024-04-02 智慧航海(青岛)科技有限公司 一种船舶数据去噪方法
CN112465837B (zh) * 2020-12-09 2022-08-23 北京航空航天大学 利用空间信息约束的稀疏子空间模糊聚类的图像分割方法
CN113298725B (zh) * 2021-04-23 2024-10-18 杭州晟冠科技有限公司 一种轮船图标图像叠加误差的纠正方法
CN113361649B (zh) * 2021-07-08 2024-04-02 南京邮电大学 一种改进模糊c均值算法的自主船舶航行场景聚类方法
CN114627125B (zh) * 2022-05-17 2022-07-15 南通剑烽机械有限公司 一种基于光学手段的不锈钢压片机表面质量评估方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104574368B (zh) * 2014-12-22 2017-12-19 河海大学 一种自适应的核聚类图像分割方法
CN106408569B (zh) * 2016-08-29 2018-12-04 北京航空航天大学 基于改进模糊c均值聚类算法的脑部mri图像分割方法
CN106570873B (zh) * 2016-11-08 2019-10-25 江苏大学 一种医学图像分割方法

Also Published As

Publication number Publication date
CN108830289A (zh) 2018-11-16

Similar Documents

Publication Publication Date Title
CN108830289B (zh) 一种基于改进的模糊c均值聚类的图像聚类方法及装置
CN107066559B (zh) 一种基于深度学习的三维模型检索方法
CN107146228B (zh) 一种基于先验知识的大脑磁共振图像超体素生成方法
CN106845529A (zh) 基于多视野卷积神经网络的影像特征识别方法
CN108763590B (zh) 一种基于双变加权核fcm算法的数据聚类方法
CN111009321A (zh) 一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法
CN109993208B (zh) 一种有噪声图像的聚类处理方法
CN105426872B (zh) 一种基于相关高斯过程回归的面部年龄估计方法
CN110659665A (zh) 一种异维特征的模型构建方法及图像识别方法、装置
CN110276746B (zh) 一种鲁棒性遥感图像变化检测方法
CN113065593A (zh) 模型训练方法、装置、计算机设备和存储介质
CN113158861A (zh) 一种基于原型对比学习的运动分析方法
CN116402825B (zh) 轴承故障红外诊断方法、系统、电子设备及存储介质
CN112784907A (zh) 基于空谱特征与bp神经网络的高光谱图像分类方法
CN118038533B (zh) 一种人脸识别方法、终端及介质
CN109948662B (zh) 一种基于K-means和MMD的人脸图像深度聚类方法
CN109034238A (zh) 一种基于信息熵的聚类划分方法
Lohit et al. Modified total Bregman divergence driven picture fuzzy clustering with local information for brain MRI image segmentation
CN112541530B (zh) 针对聚类模型的数据预处理方法及装置
CN114663770A (zh) 一种基于集成聚类波段选择的高光谱图像分类方法及系统
CN108280485B (zh) 一种基于谱图小波描述子的非刚性三维模型检索方法
CN108428226B (zh) 一种基于ica稀疏表示与som的失真图像质量评价方法
CN113591704B (zh) 体重指数估计模型训练方法、装置和终端设备
CN114037931B (zh) 一种自适应权重的多视图判别方法
CN116543259A (zh) 一种深度分类网络噪声标签建模与纠正方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant