CN112651464A - 一种无监督或弱监督的受约束的模糊c均值聚类方法 - Google Patents

一种无监督或弱监督的受约束的模糊c均值聚类方法 Download PDF

Info

Publication number
CN112651464A
CN112651464A CN202110037076.1A CN202110037076A CN112651464A CN 112651464 A CN112651464 A CN 112651464A CN 202110037076 A CN202110037076 A CN 202110037076A CN 112651464 A CN112651464 A CN 112651464A
Authority
CN
China
Prior art keywords
clustering
unsupervised
sample
centroid
fuzzy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110037076.1A
Other languages
English (en)
Other versions
CN112651464B (zh
Inventor
张新征
苏杭
谭晓衡
周喜川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202110037076.1A priority Critical patent/CN112651464B/zh
Publication of CN112651464A publication Critical patent/CN112651464A/zh
Application granted granted Critical
Publication of CN112651464B publication Critical patent/CN112651464B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种无监督或弱监督的受约束的模糊c均值聚类方法,包括:获取聚类质心
Figure DDA0002894730880000011
基于聚类质心
Figure DDA0002894730880000012
对FCM的目标函数进行约束,得到新的目标函数;基于新的目标函数进行聚类。与现有技术相比,本发明针对现有在图像分割领域的聚类方法的不稳定性和不确定性问题采用了受约束的模糊c均值聚类方法,能够使得像素的聚类朝着期望的方向进行,并且,对非平衡数据以及含较强噪声样本有极强的鲁棒性,有效提升了现有的FCM的鲁棒性。

Description

一种无监督或弱监督的受约束的模糊c均值聚类方法
技术领域
本发明涉及样本分类、图像处理领域,具体涉及一种无监督或弱监督的受约束的模糊c均值聚类方法。
背景技术
聚类方法被广泛应用于图像分割领域对同质信息进行聚合以及对异质信息进行分类。有监督的方法能否正常的工作取决于大量有标签样本的训练,但对于图像分割而言,手工标记的代价极其昂贵。因此无监督聚类备受关注,并且被广泛的研究并且应用于图像分割。
然而无监督聚类的结果极度依赖于样本本身的分布,并且其聚类的目的是不可控的,因此导致聚类的方向往往并非朝着人们所期望的方向前行。此外,无监督聚类对噪声极其敏感,以上因素破坏了无监督聚类的性能。因此通过一些经验以及数学计算,通过一些引导性信息指引聚类的方向有望成为一种提升鲁棒性的潜在方式,聚类方法的鲁棒性对于方法的推广与应用极为重要,例如在SAR图像变化检测中。
多时相合成孔径雷达(SAR)图像变化检测技术被广泛应用于环境检测、城市研究和森林资源管理检测等对地观测任务,相较于光学图像,SAR图像变化检测技术常常遭到固有斑点噪声的干扰。此外,由于图像获取过程中不可避免的造成图像的失真,克服这些因素对于多时相SAR图像精确地变化检测至关重要。
目前无监督学习方法被广泛应用于SAR图像变化检测,其主要步骤包括:1)预处理;2)生成差异图;3)分类。目前大量的无监督聚类方法被用于差异图像分割。模糊c均值方法(fuzzy c-means,FCM)由于可以保留更多的图像信息而备受关注。然而无监督聚类针对差异图像的图像分割必须注意以下几个关键点:1)无监督聚类往往对斑点噪声极为敏感,容易将斑点噪声带来的伪变化当作真实地物变化。2)无监督聚类的分类往往取决于数据的分布,往往难以朝着期望的方向进行。3)无监督聚类方法的前提条件为类别平衡,即变化类像素与不变化类像素数量是差不多的,但在实际变化检测技术中,变化类像素数目远少于不变化像素数量,此外由于SAR图像中固有的散斑噪声,这导致了属于变化类的簇错误的转移向不变类,进而导致大量的错误检测。
因此,如何提高具有强斑点噪声和类别不平衡特性的多时相SAR图像变化检测的鲁棒性成为了本领域技术人员急需解决的问题。
发明内容
针对上述现有技术的不足,本发明实际解决的问题包括:准确对难以划分拥挤度等级的图像进行精准分类。
为了解决上述技术问题,本发明采用了如下的技术方案:
一种无监督或弱监督的受约束的模糊c均值聚类方法,包括:
S1、获取聚类质心;
S2、基于聚类质心对FCM的目标函数进行约束,得到新的目标函数;
S3、基于新的目标函数进行聚类。
优选地,采用无监督方式时,步骤S1中:
基于预设准则选择Np个样本预聚类样本集
Figure BDA0002894730860000021
Figure BDA0002894730860000022
是样本集
Figure BDA0002894730860000023
中编号为np的样本;
采用FCM方法对
Figure BDA0002894730860000024
进行聚类得到聚类质心
Figure BDA0002894730860000025
优选地,采用弱监督方式时,步骤S1中:
采集部分样本,进行人工标注;
基于人工标注结果确定聚类质心,
Figure BDA0002894730860000026
Figure BDA0002894730860000027
表示第i个类别的聚类质心,Np'表示采集的样本数,
Figure BDA0002894730860000028
表示采集的样本中编号为np'的样本。
优选地,步骤S2中,新的目标函数J如下:
Figure BDA0002894730860000029
Figure BDA00028947308600000210
Figure BDA00028947308600000211
式中,C表示聚类的类别总数,N表示用于聚类的样本总数,
Figure BDA00028947308600000212
表示编号为n的样本属于类别i的隶属度,属于隶属度矩阵U的元素;λi表示第i个类别的约束参数,xn表示待聚类的编号为n的样本,vi表示为i类别的聚类中心,m表示模糊控制参数,γ表示控制参数。
与现有技术相比,本发明针对现有在图像分割领域的聚类方法的不稳定性和不确定性问题采用了受约束的模糊c均值聚类方法,能够使得像素的聚类朝着期望的方向进行,并且,对非平衡数据以及含较强噪声样本有极强的鲁棒性,有效提升了现有的FCM的鲁棒性。
附图说明
为了使发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
图1是本发明公开的一种无监督或弱监督的受约束的模糊c均值聚类方法的流程图;
图2是本发明公开的一种无监督或弱监督的受约束的模糊c均值聚类方法的原理图;
图3为基于MSRDI差异图的7种图像分割技术在四组真实SAR图像上的变化检测结果对比图,其中(a)至(g)的对应关系为:(a)Ostu阈值法;(b)FLICM;(c)RFLICM;(d)Gabor小波特征提取和k-means聚类;(e)Gabor小波特征提取和FCM聚类;(f)本发明受约束的FCM聚类方法;(g)真实地面变化参考图像;
图4不同约束参数下,使用本发明公开的无监督或弱监督的受约束的模糊c均值聚类方法进行分割的性能影响图。
具体实施方式
下面结合附图对本发明作进一步的详细说明。
如图1为本发明公开的一种无监督或弱监督的受约束的模糊c均值聚类方法,包括:
S1、获取聚类质心;
S2、基于聚类质心对FCM的目标函数进行约束,得到新的目标函数;
S3、基于新的目标函数进行聚类。
有监督分类能够展现出强大的性能的一个重要因素是因为通过给定的知识对分类进行指导,进而使得分类朝着期望的方向进行。可以通过多种途径获取一定的引导信息用于聚类的引导,例如通过手工标记的方式获取少量的具有标签的样本,通过计算每个类别样本的几何质心作为引导信息。或者结合在目标领域的经验,建立先验模型作为引导信息。亦或利用现有数据的一些特点,计算获取包含引导信息的聚类质心,例如在差异图像分割过程中,结合差异图像的一个重要特征即差异图像上的高值像素往往代表着是高概率变化的,而低值像素是高概率不变的。因此,可以选择获取一部分像素值极其高的样本和像素值极低样本进行预聚类得到可靠的两个类(变化类和不变类)的簇质心,然后以这个高质量的簇质心为指导性信息,对所有样本进行聚类。其中,采用在预聚类获取的可靠的质心去约束在最终聚类过程中簇质心的转移,这在一定程度上可以有效抑制簇的错误转移,以及增强对噪声的鲁棒性。进而对差异图像的像素进行正确的分类并且得到最终的变化检测结果。
因此,本发明针对现有在图像分割领域的聚类方法的不稳定性和不确定性问题采用了受约束的模糊c均值聚类方法,能够使得像素的聚类朝着期望的方向进行,并且,对非平衡数据以及噪声样本有极强的鲁棒性,有效提升了现有的FCM的鲁棒性。
具体实施时,采用无监督方式时,步骤S1中:
基于预设准则选择Np个样本预聚类样本集
Figure BDA0002894730860000041
Figure BDA0002894730860000042
是样本集
Figure BDA0002894730860000043
中编号为np的样本;
采用FCM方法对
Figure BDA0002894730860000044
进行聚类得到聚类质心
Figure BDA0002894730860000045
具体的,可基于差异图像上像素值最高的Np个样本构建高像素值样本集
Figure BDA0002894730860000046
并作为
Figure BDA0002894730860000047
Figure BDA0002894730860000048
表示高像素值样本集中的第np个样本;
或者,基于差异图像上像素值最低的Np个样本构建低像素值样本集
Figure BDA0002894730860000049
并作为
Figure BDA00028947308600000410
Figure BDA00028947308600000411
表示低像素值样本集中的第np个样本。
具体实施时,采用弱监督方式时,步骤S1中:
采集部分样本,进行人工标注;
基于人工标注结果确定聚类质心,
Figure BDA00028947308600000412
Figure BDA00028947308600000413
表示第c个类别的聚类质心,Np'表示采集的样本数,
Figure BDA00028947308600000414
表示采集的样本中的第np'个样本。
在弱监督方式中,还可利用对应领域内的经验,或结合数据分析进行建模分析,预测质心
Figure BDA00028947308600000415
此为现有技术,在此不再赘述。
具体实施时,步骤S2中,新的目标函数J如下:
Figure BDA00028947308600000416
Figure BDA0002894730860000051
Figure BDA0002894730860000052
式中,C表示聚类的类别总数,N表示用于聚类的样本总数,
Figure BDA0002894730860000053
表示编号为n的样本属于类别i的隶属度,属于隶属度矩阵U的元素。λi表示第i个类别的约束参数,xn表示待聚类的编号为n的样本,vi表示为i类别的聚类中心,m表示模糊控制参数,γ表示控制参数,控制约束项占整个目标函数的比例。
以聚类为两类为例,采用本发明进行聚类的流程如下:
Figure BDA0002894730860000054
Figure BDA0002894730860000061
在图2中,较小的圆形图案表示样本,四个区域中展示了4种不同类的样本,大的圆形图案表示小圆形图案的质心,如A;三角表示通过预设准则或者人工选择获得的质心
Figure BDA0002894730860000062
如A1。通过预先简单设置的质心在聚类过程中对聚类质心进行约束,抑制了由于非平衡以及噪声的干扰导致质心转移的问题,使得聚类能够稳定地优化,并且朝着期望的方向进行。该方法具有较强的鲁棒性以及泛化性。
图3展现了在四组数据上构建差异图像,然后采用了几种现有的图像分割方法和本发明提出的中心约束聚类方法进行变化检测的结果。在四组数据上可以发现,本发明提出的中心约束的FCM聚类方法的效果相比其他现有方法是非常优越的。对于噪声很强的前三组数据和噪声较低的第四组数据均展现出了优秀的变化检测结果,这说明了本发明的鲁棒性和准确性。
图4通过一组不同的超参数λi进行试验,可以发现,当λi>0.2后,变化检测的准确率保持在一个很高的水平,并且对于超参数λi的变化不敏感。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了描述,但本领域的普通技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本发明的精神和范围。

Claims (4)

1.一种无监督或弱监督的受约束的模糊c均值聚类方法,其特征在于,包括:
S1、获取聚类质心;
S2、基于聚类质心对FCM的目标函数进行约束,得到新的目标函数;
S3、基于新的目标函数进行聚类。
2.如权利要求1所述的无监督或弱监督的受约束的模糊c均值聚类方法,其特征在于,采用无监督方式时,步骤S1中:
基于预设准则选择Np个样本预聚类样本集
Figure FDA0002894730850000011
Figure FDA0002894730850000012
是样本集
Figure FDA0002894730850000013
中编号为np的样本;
采用FCM方法对
Figure FDA0002894730850000014
进行聚类得到聚类质心
Figure FDA0002894730850000015
3.如权利要求1所述的无监督或弱监督的受约束的模糊c均值聚类方法,其特征在于,采用弱监督方式时,步骤S1中:
采集部分样本,进行人工标注;
基于人工标注结果确定聚类质心,
Figure FDA0002894730850000016
Figure FDA0002894730850000017
表示第i个类别的聚类质心,Np'表示采集的样本数,
Figure FDA0002894730850000018
表示采集的样本中编号为np'的样本。
4.如权利要求1至3任一项所述的无监督或弱监督的受约束的模糊c均值聚类方法,其特征在于,步骤S2中,新的目标函数J如下:
Figure FDA0002894730850000019
Figure FDA00028947308500000110
Figure FDA00028947308500000111
式中,C表示聚类的类别总数,N表示用于聚类的样本总数,
Figure FDA00028947308500000112
表示编号为n的样本属于类别i的隶属度,属于隶属度矩阵U的元素;λi表示第i个类别的约束参数,xn表示待聚类的编号为n的样本,vi表示为i类别的聚类中心,m表示模糊控制参数,γ表示控制参数。
CN202110037076.1A 2021-01-12 2021-01-12 一种无监督或弱监督的受约束的模糊c均值聚类方法 Active CN112651464B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110037076.1A CN112651464B (zh) 2021-01-12 2021-01-12 一种无监督或弱监督的受约束的模糊c均值聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110037076.1A CN112651464B (zh) 2021-01-12 2021-01-12 一种无监督或弱监督的受约束的模糊c均值聚类方法

Publications (2)

Publication Number Publication Date
CN112651464A true CN112651464A (zh) 2021-04-13
CN112651464B CN112651464B (zh) 2022-11-25

Family

ID=75367967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110037076.1A Active CN112651464B (zh) 2021-01-12 2021-01-12 一种无监督或弱监督的受约束的模糊c均值聚类方法

Country Status (1)

Country Link
CN (1) CN112651464B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130077837A1 (en) * 2010-03-29 2013-03-28 Galderma Research & Development Snc Fuzzy clustering algorithm and its application on carcinoma tissue
CN106600605A (zh) * 2016-12-14 2017-04-26 陕西科技大学 一种无监督的快速图像分割算法
CN107239800A (zh) * 2017-06-06 2017-10-10 常州工学院 松弛模糊c均值聚类算法
CN109064470A (zh) * 2018-08-28 2018-12-21 河南工业大学 一种基于自适应模糊聚类的图像分割方法及装置
CN111161229A (zh) * 2019-12-23 2020-05-15 大连理工大学 一种基于几何主动轮廓模型和稀疏自编码的变化检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130077837A1 (en) * 2010-03-29 2013-03-28 Galderma Research & Development Snc Fuzzy clustering algorithm and its application on carcinoma tissue
CN106600605A (zh) * 2016-12-14 2017-04-26 陕西科技大学 一种无监督的快速图像分割算法
CN107239800A (zh) * 2017-06-06 2017-10-10 常州工学院 松弛模糊c均值聚类算法
CN109064470A (zh) * 2018-08-28 2018-12-21 河南工业大学 一种基于自适应模糊聚类的图像分割方法及装置
CN111161229A (zh) * 2019-12-23 2020-05-15 大连理工大学 一种基于几何主动轮廓模型和稀疏自编码的变化检测方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
KUNLUN LI 等: "A novel semi-supervised fuzzy c-means clustering method", 《2009 CHINESE CONTROL AND DECISION CONFERENCE》 *
XINZHENG ZHANG 等: "Robust Unsupervised Small Area Change Detection from SAR Imagery Using Deep Learning", 《ARXIV》 *
朱乐为等: "半监督平衡化模糊C-means聚类", 《云南民族大学学报(自然科学版)》 *
李春芳等: "半监督FCM聚类算法目标函数研究", 《计算机工程与应用》 *
王俊等: "基于半监督的多目标进化模糊聚类算法", 《计算机工程与应用》 *
磨莉等: "模糊聚类无监督算法在图像识别中的应用", 《自动化技术与应用》 *

Also Published As

Publication number Publication date
CN112651464B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
CN109871875B (zh) 一种基于深度学习的建筑物变化检测方法
CN108830870B (zh) 基于多尺度结构学习的卫星影像高精度农田边界提取方法
CN102622607B (zh) 一种基于多特征融合的遥感图像分类方法
CN108009518A (zh) 一种基于快速二分卷积神经网络的层次化交通标识识别方法
CN105844228A (zh) 一种基于卷积神经网络的遥感图像云检测方法
CN104182985B (zh) 遥感图像变化检测方法
CN111191628B (zh) 基于决策树与特征优化的遥感影像震害建筑物识别方法
CN109657610A (zh) 一种高分辨率多源遥感影像的土地利用变化检测方法
CN106408030A (zh) 基于中层语义属性和卷积神经网络的sar图像分类方法
CN108052886A (zh) 一种小麦条锈病菌夏孢子自动统计计数方法
CN108427919B (zh) 一种基于形状引导显著性模型的无监督油罐目标检测方法
CN109409438B (zh) 基于ifcm聚类与变分推断的遥感影像分类方法
CN110659601B (zh) 基于中心点的深度全卷积网络遥感图像密集车辆检测方法
CN102214290B (zh) 车牌定位方法及车牌定位模板训练方法
CN114067118B (zh) 一种航空摄影测量数据的处理方法
CN105046259A (zh) 基于多特征融合的日冕物质抛射检测方法
CN107977667A (zh) 基于半监督协同训练的sar目标鉴别方法
CN116310853A (zh) 一种基于多源数据的中小城市边缘区提取方法
CN111291818B (zh) 一种面向云掩膜的非均匀类别的样本均衡化方法
CN111539910B (zh) 锈蚀区域检测方法及终端设备
CN112183237A (zh) 基于颜色空间自适应阈值分割的白细胞自动分类方法
CN115690086A (zh) 一种基于对象的高分辨率遥感影像变化检测方法及系统
CN107194917B (zh) 基于dap和arelm的在轨sar图像变化检测方法
Fauvel et al. Detection of hedges in a rural landscape using a local orientation feature: from linear opening to path opening
CN106548195A (zh) 一种基于改进型hog‑ulbp特征算子的目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant