CN112651464A

CN112651464A - 一种无监督或弱监督的受约束的模糊c均值聚类方法

Info

Publication number: CN112651464A
Application number: CN202110037076.1A
Authority: CN
Inventors: 张新征; 苏杭; 谭晓衡; 周喜川
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2021-01-12
Filing date: 2021-01-12
Publication date: 2021-04-13
Anticipated expiration: 2041-01-12
Also published as: CN112651464B

Abstract

本发明公开了一种无监督或弱监督的受约束的模糊c均值聚类方法，包括：获取聚类质心

基于聚类质心

对FCM的目标函数进行约束，得到新的目标函数；基于新的目标函数进行聚类。与现有技术相比，本发明针对现有在图像分割领域的聚类方法的不稳定性和不确定性问题采用了受约束的模糊c均值聚类方法，能够使得像素的聚类朝着期望的方向进行，并且，对非平衡数据以及含较强噪声样本有极强的鲁棒性，有效提升了现有的FCM的鲁棒性。

Description

一种无监督或弱监督的受约束的模糊c均值聚类方法

技术领域

本发明涉及样本分类、图像处理领域，具体涉及一种无监督或弱监督的受约束的模糊c均值聚类方法。

背景技术

聚类方法被广泛应用于图像分割领域对同质信息进行聚合以及对异质信息进行分类。有监督的方法能否正常的工作取决于大量有标签样本的训练，但对于图像分割而言，手工标记的代价极其昂贵。因此无监督聚类备受关注，并且被广泛的研究并且应用于图像分割。

然而无监督聚类的结果极度依赖于样本本身的分布，并且其聚类的目的是不可控的，因此导致聚类的方向往往并非朝着人们所期望的方向前行。此外，无监督聚类对噪声极其敏感，以上因素破坏了无监督聚类的性能。因此通过一些经验以及数学计算，通过一些引导性信息指引聚类的方向有望成为一种提升鲁棒性的潜在方式，聚类方法的鲁棒性对于方法的推广与应用极为重要，例如在SAR图像变化检测中。

多时相合成孔径雷达(SAR)图像变化检测技术被广泛应用于环境检测、城市研究和森林资源管理检测等对地观测任务，相较于光学图像，SAR图像变化检测技术常常遭到固有斑点噪声的干扰。此外，由于图像获取过程中不可避免的造成图像的失真，克服这些因素对于多时相SAR图像精确地变化检测至关重要。

目前无监督学习方法被广泛应用于SAR图像变化检测，其主要步骤包括：1)预处理；2)生成差异图；3)分类。目前大量的无监督聚类方法被用于差异图像分割。模糊c均值方法(fuzzy c-means,FCM)由于可以保留更多的图像信息而备受关注。然而无监督聚类针对差异图像的图像分割必须注意以下几个关键点：1)无监督聚类往往对斑点噪声极为敏感，容易将斑点噪声带来的伪变化当作真实地物变化。2)无监督聚类的分类往往取决于数据的分布，往往难以朝着期望的方向进行。3)无监督聚类方法的前提条件为类别平衡，即变化类像素与不变化类像素数量是差不多的，但在实际变化检测技术中，变化类像素数目远少于不变化像素数量，此外由于SAR图像中固有的散斑噪声，这导致了属于变化类的簇错误的转移向不变类，进而导致大量的错误检测。

因此，如何提高具有强斑点噪声和类别不平衡特性的多时相SAR图像变化检测的鲁棒性成为了本领域技术人员急需解决的问题。

发明内容

针对上述现有技术的不足，本发明实际解决的问题包括：准确对难以划分拥挤度等级的图像进行精准分类。

为了解决上述技术问题，本发明采用了如下的技术方案：

一种无监督或弱监督的受约束的模糊c均值聚类方法，包括：

S1、获取聚类质心；

S2、基于聚类质心对FCM的目标函数进行约束，得到新的目标函数；

S3、基于新的目标函数进行聚类。

优选地，采用无监督方式时，步骤S1中：

基于预设准则选择N_p个样本预聚类样本集

是样本集

中编号为n_p的样本；

采用FCM方法对

进行聚类得到聚类质心

优选地，采用弱监督方式时，步骤S1中：

采集部分样本，进行人工标注；

基于人工标注结果确定聚类质心，

表示第i个类别的聚类质心，N_p'表示采集的样本数，

表示采集的样本中编号为n_p'的样本。

优选地，步骤S2中，新的目标函数J如下：

式中，C表示聚类的类别总数，N表示用于聚类的样本总数，

表示编号为n的样本属于类别i的隶属度，属于隶属度矩阵U的元素；λ_i表示第i个类别的约束参数，x_n表示待聚类的编号为n的样本，v_i表示为i类别的聚类中心，m表示模糊控制参数，γ表示控制参数。

与现有技术相比，本发明针对现有在图像分割领域的聚类方法的不稳定性和不确定性问题采用了受约束的模糊c均值聚类方法，能够使得像素的聚类朝着期望的方向进行，并且，对非平衡数据以及含较强噪声样本有极强的鲁棒性，有效提升了现有的FCM的鲁棒性。

附图说明

为了使发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步的详细描述，其中：

图1是本发明公开的一种无监督或弱监督的受约束的模糊c均值聚类方法的流程图；

图2是本发明公开的一种无监督或弱监督的受约束的模糊c均值聚类方法的原理图；

图3为基于MSRDI差异图的7种图像分割技术在四组真实SAR图像上的变化检测结果对比图，其中(a)至(g)的对应关系为：(a)Ostu阈值法；(b)FLICM；(c)RFLICM；(d)Gabor小波特征提取和k-means聚类；(e)Gabor小波特征提取和FCM聚类；(f)本发明受约束的FCM聚类方法；(g)真实地面变化参考图像；

图4不同约束参数下，使用本发明公开的无监督或弱监督的受约束的模糊c均值聚类方法进行分割的性能影响图。

具体实施方式

下面结合附图对本发明作进一步的详细说明。

如图1为本发明公开的一种无监督或弱监督的受约束的模糊c均值聚类方法，包括：

S1、获取聚类质心；

S3、基于新的目标函数进行聚类。

有监督分类能够展现出强大的性能的一个重要因素是因为通过给定的知识对分类进行指导，进而使得分类朝着期望的方向进行。可以通过多种途径获取一定的引导信息用于聚类的引导，例如通过手工标记的方式获取少量的具有标签的样本，通过计算每个类别样本的几何质心作为引导信息。或者结合在目标领域的经验，建立先验模型作为引导信息。亦或利用现有数据的一些特点，计算获取包含引导信息的聚类质心，例如在差异图像分割过程中，结合差异图像的一个重要特征即差异图像上的高值像素往往代表着是高概率变化的，而低值像素是高概率不变的。因此，可以选择获取一部分像素值极其高的样本和像素值极低样本进行预聚类得到可靠的两个类(变化类和不变类)的簇质心，然后以这个高质量的簇质心为指导性信息，对所有样本进行聚类。其中，采用在预聚类获取的可靠的质心去约束在最终聚类过程中簇质心的转移，这在一定程度上可以有效抑制簇的错误转移，以及增强对噪声的鲁棒性。进而对差异图像的像素进行正确的分类并且得到最终的变化检测结果。

因此，本发明针对现有在图像分割领域的聚类方法的不稳定性和不确定性问题采用了受约束的模糊c均值聚类方法，能够使得像素的聚类朝着期望的方向进行，并且，对非平衡数据以及噪声样本有极强的鲁棒性，有效提升了现有的FCM的鲁棒性。

具体实施时，采用无监督方式时，步骤S1中：

基于预设准则选择N_p个样本预聚类样本集

是样本集

中编号为n_p的样本；

采用FCM方法对

进行聚类得到聚类质心

具体的，可基于差异图像上像素值最高的N_p个样本构建高像素值样本集

并作为

表示高像素值样本集中的第n_p个样本；

或者，基于差异图像上像素值最低的N_p个样本构建低像素值样本集

并作为

表示低像素值样本集中的第n_p个样本。

具体实施时，采用弱监督方式时，步骤S1中：

采集部分样本，进行人工标注；

基于人工标注结果确定聚类质心，

表示第c个类别的聚类质心，N_p'表示采集的样本数，

表示采集的样本中的第n_p'个样本。

在弱监督方式中，还可利用对应领域内的经验，或结合数据分析进行建模分析，预测质心

此为现有技术，在此不再赘述。

具体实施时，步骤S2中，新的目标函数J如下：

式中，C表示聚类的类别总数，N表示用于聚类的样本总数，

表示编号为n的样本属于类别i的隶属度，属于隶属度矩阵U的元素。λ_i表示第i个类别的约束参数，x_n表示待聚类的编号为n的样本，v_i表示为i类别的聚类中心，m表示模糊控制参数，γ表示控制参数，控制约束项占整个目标函数的比例。

以聚类为两类为例，采用本发明进行聚类的流程如下：

在图2中，较小的圆形图案表示样本，四个区域中展示了4种不同类的样本，大的圆形图案表示小圆形图案的质心，如A；三角表示通过预设准则或者人工选择获得的质心

如A1。通过预先简单设置的质心在聚类过程中对聚类质心进行约束，抑制了由于非平衡以及噪声的干扰导致质心转移的问题，使得聚类能够稳定地优化，并且朝着期望的方向进行。该方法具有较强的鲁棒性以及泛化性。

图3展现了在四组数据上构建差异图像，然后采用了几种现有的图像分割方法和本发明提出的中心约束聚类方法进行变化检测的结果。在四组数据上可以发现，本发明提出的中心约束的FCM聚类方法的效果相比其他现有方法是非常优越的。对于噪声很强的前三组数据和噪声较低的第四组数据均展现出了优秀的变化检测结果，这说明了本发明的鲁棒性和准确性。

图4通过一组不同的超参数λ_i进行试验，可以发现，当λ_i＞0.2后，变化检测的准确率保持在一个很高的水平，并且对于超参数λ_i的变化不敏感。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管通过参照本发明的优选实施例已经对本发明进行了描述，但本领域的普通技术人员应当理解，可以在形式上和细节上对其作出各种各样的改变，而不偏离所附权利要求书所限定的本发明的精神和范围。