CN102436645B

CN102436645B - 基于mod字典学习采样的谱聚类图像分割方法

Info

Publication number: CN102436645B
Application number: CN 201110346656
Authority: CN
Inventors: 缑水平; 焦李成; 杨静瑜; 张向荣; 李阳阳; 赵一帆; 杨淑媛; 庄广安
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2011-11-04
Filing date: 2011-11-04
Publication date: 2013-08-14
Anticipated expiration: 2031-11-04
Also published as: CN102436645A

Abstract

本发明公开了一种基于字典学习采样谱聚类的图像分割方法，主要解决现有谱聚类方法分割结果不稳定的问题。其实现过程是：(1)对待分割的图像进行特征提取，并将提取的特征数据归一化到[0，1]之间，以去除数据间量级的影响；(2)用MOD字典学习方法对归一化后的特征数据进行学习，得到字典D；(3)计算特征数据与字典原子的欧氏距离，并取距离小的前l个数据作为采样子集S，l取300；4)利用

方法，从选出的采样子集S得到所有特征数据的特征向量；(5)对前k个特征值对应的特征向量进行k-means聚类，得到最终的图像分割结果。本发明与现有的技术相比图像分割结果稳定、准确度高，可用于目标检测和目标识别。

Description

基于MOD字典学习采样的谱聚类图像分割方法

技术领域

本发明属于图像处理技术领域，涉及图像分割，可用于对纹理图像和SAR图像进行目标检测和目标识别。

背景技术

聚类就是按照一定的要求和规律对事物进行区分和分类的过程，在这一过程中没有任何关于类别的先验知识，仅靠事物间的相似性作为类属划分的准则，因此属于无监督分类的范畴。聚类分析则是指用数学的方法研究和处理给定对象的分类，是多元统计分析的一种，也是无监督模式识别的一个重要分支。它把一个没有类别标记的样本集按某种准则划分成若干个子集，使相似的样本尽可能归为一类，而不相似的样本尽量划分到不同的类中。作为一种无监督分类方法，聚类分析已经被广泛地应用于模式识别、数据挖掘、计算机视觉和模糊控制等许多领域。但传统的聚类算法，如k-means算法，EM算法等都是建立在凸球形的样本空间上，但当样本空间不为凸时，算法会陷入局部最优。

谱聚类方法是一种建立在谱图理论基础之上，利用数据相似性矩阵的特征向量进行聚类的方法。谱聚类方法实现简单，与维数无关，能在任意形状的样本空间上聚类并收敛于全局最优解，因此得到了越来越广泛的应用。目前谱聚类方法已被成功应用于语音识别、视频分割、图像分割、VLSI设计和网页划分等领域。但是，谱聚类方法需要计算一个n×n相似性矩阵的主要特征向量，n是样本个数。这对于大规模数据，计算量是相当大的，这也成为了谱聚类方法的瓶颈问题。

Fowlkes等人提出了基于

逼近的谱聚类方法。该方法首先从所有样本中随机选取一个样本子集作为代表求解特征问题，然后再将其特征向量扩展为整个样本集合权值矩阵的特征向量。然而，选取结果对聚类影响很大，聚类结果表现出不稳定性。后来提出的k均值

谱聚类方法，在一定程度上解决了不稳定问题。该方法用k-means方法对数据集预聚类，将与预聚类得到的中心点最近邻的数据点作为采样点，取代了原来的随机采样。但由于k-means方法本身并不是一种完全稳定聚类方法，当样本空间不为凸时，算法会陷入局部最优，所以k均值

谱聚类方法图像分割结果很不稳定。

发明内容

本发明的目的在于克服上述已有技术的缺点，提出了一种基于MOD字典学习采样的谱聚类图像分割方法，以得到稳定的、更准确的图像分割结果。

为实现上述目的，本发明通过对样本进行MOD学习得到字典，并根据样本与字典的距离，把那些距离较小的样本作为采样点，最大化保留图像信息，再利用

逼近谱聚类算法划分得到所有样本的标签，具体步骤包括如下：

(1)使用灰度共生矩阵对待分割的图像进行特征提取，并将提取的特征数据X＝{x₁，...，x_i，...，x_n}(i＝1，...，n)归一化到[0，1]之间，得到数据X′以去除数据间量级的影响；

(2)用MOD字典方法对X′进行学习，得到字典D＝{d₁，…，d_j，…，d_m}，j＝1，...，m，d_j为字典中的原子，m为字典原子数，取300；

(3)计算特征数据X′与字典D的欧氏距离，并取距离较小的前l个数据作为采样子集S，l取300；

(4)利用

方法，从选出的采样子集S得到所有特征数据的特征向量；

(5)对前k个特征值对应的特征向量进行k-means聚类，得到最终的图像分割结果，其中k是类别数，k≥1且为整数；

本发明由于对特征数据通过字典学习得到字典，并选择与字典距离最近的特征数据作为采样子集，最大化地保留了图像信息，使采样子集具有代表性；同时本发明利用字典采样子集对剩余数据进行

嵌入，使图像分割性能有明显提升。

附图说明

图1是本发明图像分割的流程图；

图2是现有的一幅2分类纹理图像；

图3是用本发明与现有

谱聚类方法对图2的仿真分割结果图；

图4是现有的一幅3分类纹理图像；

图5是用本发明与现有

谱聚类方法对图4的仿真分割结果图；

图6是现有的一幅2分类SAR图像；

图7是用本发明与现有

谱聚类方法对图6的仿真分割结果图；

图8是现有的一幅2分类SAR图像；

图9是用本发明与现有谱聚类方法对图8的仿真分割结果图。

具体实施方式

参照图1，本发明的实施步骤如下：

步骤1.使用待分割图像的灰度共生矩阵对图像进行特征提取，并将提取的特征数据归一化，以去除数据间量级的影响。

(1a)对待分割的图像生成灰度共生矩阵P，窗口大小取16；

(1b)在0°，45°，90°和135°这4个方向上，从图像的灰度共生矩阵P中抽取以下三种二次统计量：

角二阶矩：

f_{1} = Σ_{i = 0}^{n - 1} Σ_{j = 0}^{n - 1} p^{2} (i, j),

同质区：

f_{2} = Σ_{i = 0}^{n - 1} Σ_{j = 0}^{n - 1} p (i, j) / {[1 + {(i - j)}^{2}]}^{2},

对比度：

f_{3} = Σ_{i = 0}^{n - 1} Σ_{j = 0}^{n - 1} | i - j | p (i, j),

其中，n是样本总数，p(i，j)是灰度共生矩阵P第i行第j列的元素；

在4个方向上分别计算上述统计量，得到每个样本的特征数据向量x_i＝(f_i1，f_i2，…，f_i12)，i＝1，...，n；

(1c)将n个样本的特征数据向量作为列向量构成的特征数据X＝{x₁，...x_i，…，x_n}，i＝1，...，n，并把X归一化到[0，1]之间，得到数据X′，以去除数据间量级的影响。

步骤2.用MOD字典对归一化后的特征数据进行学习，得到字典D。

(2a)随机选取m个特征数据作为初始字典原子，构成初始字典D＝(d₁，…，d_j，…，d_m)，j＝1，...，m，其中字典原子d_j∈R^t×1，t是每个特征数据的维数，m取300；

(2b)根据初始字典D′，利用正交匹配追踪算法对特征数据X的第i个特征数据x_i进行稀疏编码，获得稀疏表示系数向量α_i：

\min_{α_{i}} {| | x_{i} - D^{'} α_{i} | |}_{2}^{2}

s.t.||α_i||₀＜L

其中L为编码的稀疏度，L取4；

(2c)对n个特征数据都进行稀疏编码，将得到的n个稀疏表示系数向量作为列向量构成稀疏表示系数矩阵A＝{α₁，...，α_i，...，α_n}，i＝1，...，n，α_i是第i个特征数据x_i在字典D′上的稀疏表示系数向量；

(2d)根据字典D′和稀疏表示系数矩阵A，利用最小二乘法求解目标函数把得到的最优解作为新的字典D″；

(2e)重复执行步骤(2b)、步骤(2c)和步骤(2d)N次，得到最终的字典D，N取25。

步骤3.计算特征数据与字典原子的距离，并取距离小的前l个数据作为采样子集S。

(3a)根据下式计算第j个字典原子d_j与第i个特征数据x_i的欧氏距离w_ji：

w_ji＝||d_j-x_i||，j＝1，...，m，i＝1，...，n

将n个特征数据分别与第j个字典原子d_j的欧氏距离构成d_j的距离向量：w_j＝{w_j1，...，w_ji，...，w_jn}，i＝1，...，n；

(3b)比较每个字典原子的距离向量中的值，把最小的欧氏距离w_ji对应的第i个特征数据作为采样点，得到大小为l的采样子集S，l取300。

步骤4.利用

方法，从选出的采样子集S得到所有特征数据的特征向量。

(4a)计算采样子集S的权值矩阵W＝G(S，S)，其中n为特征数据个数，G()为高斯核函数；

(4b)对权值矩阵W进行特征分解，求出特征值λ＝{λ₁，...，λ_i，...，λ_m}和特征向量

其中λ_i是λ的第i个元素，是

的第i列向量，i＝1，2，...，m；

(4c)由W的特征值λ和特征向量

根据下式计算第j个列向量

将n个列向量构成所有特征数据的特征向量：

步骤5.对前k个特征值对应的特征向量进行k-means聚类，得到最终的图像分割结果，其中k是类别数，对2分类图k取2，对3分类图k取3。

本发明效果可以通过以下实验进一步证实：

实验仿真环境为：MATLAB 7.5.0，Intel(R)Pentium(R)2CPU 3.0GHz，WindowXP Professional。

实验内容包括：用现有谱聚类方法和本发明应用灰度共生矩阵特征对256×256的纹理图像和SAR图像进行仿真分割实验。

仿真实验1：用现有

谱聚类方法和本发明对图2进行仿真分割，分割结果如图3所示，其中图3(a)是现有

谱聚类方法的分割结果图，图3(b)是本发明的分割结果图。

仿真实验2：用现有

谱聚类方法和本发明对图4进行仿真分割，分割结果如图5所示，其中图5(a)是现有

谱聚类方法的分割结果图，图5(b)是本发明的分割结果图。

仿真实验3：用现有谱聚类方法和本发明对图6进行仿真分割，分割结果如图7所示，其中图7(a)是现有谱聚类方法的分割结果图，图7(b)是本发明的分割结果图。

仿真实验4：用现有

谱聚类方法和本发明对图8进行仿真分割，分割结果如图9所示，其中图9(a)是现有

谱聚类方法的分割结果图，图9(b)是本发明的分割结果图。

由图3、图5、图7和图9可以看出，本发明的分割结果图无论在区域一致性还是边缘分割上，都优于现有

谱聚类方法，这是因为本发明先对所有特征数据进行MOD字典学习，选择与字典原子欧氏距离最近的点作为采样点，相对于现有

谱聚类方法的等概率随机选取采样点方法，能够更好的保留图像信息，得到稳定的、精确度高的分割结果。

Claims

1.一种基于MOD字典学习采样的谱聚类图像分割方法，包括如下步骤：

(1)使用灰度共生矩阵对待分割的图像进行特征提取，并将提取的特征数据归一化到[0,1]之间，以去除数据间量级的影响；

(2)用MOD字典方法对归一化后的特征数据集X＝{x₁,…,x_i,…,x_n}(i＝1,...,n)进行学习，得到字典D＝{d₁,…,d_j,…,d_m},j＝1,...,m，且m<=n，d_j为字典中的原子，m为字典原子数，取300；

(3)计算特征数据与字典原子的欧氏距离，从X中取距离较小的前l，l≤n，l取300，个数据构成采样子集S；

(4)利用

方法，从选出的采样子集S得到所有特征数据的特征向量；

2.根据权利要求1所述的基于MOD字典学习采样的谱聚类图像分割方法，其中步骤(2)所述的用MOD字典学习方法对归一化后的特征数据进行学习，得到字典，按照如下步骤进行：

(2a)随机选取m个特征数据作为初始字典原子，构成初始字典D＝(d₁,…,d_j,…,d_m),j＝1,...,m,其中字典原子d_j∈R^t×1，t是每个特征数据x_i的维数，m取300；

(2b)根据已有字典D，利用正交匹配追踪算法对特征数据X的第i个特征数据x_i进行稀疏编码，获得稀疏表示系数向量α_i：

\min_{α_{i}} {| | x_{i} - D α_{i} | |}_{2}^{2} s . t . {| | α_{i} | |}_{0} < L

其中L为编码的稀疏度，L取4；

(2c)对n个特征数据都进行稀疏编码，将得到的n个稀疏表示系数向量作为列向量构成稀疏表示系数矩阵A＝{α₁,...,α_i,...,α_n},i＝1,...,n，α_i是第i个特征数据x_i在字典D上的稀疏表示系数向量；

(2d)根据字典D和稀疏表示系数矩阵A，利用最小二乘法求解目标函数

把得到的最优解作为新的字典D′；

(2e)用D′更新D，重复执行步骤(2b)、步骤(2c)和步骤(2d)N次，得到最终的字典D′′，N取25。

3.根据权利要求1所述的基于MOD字典学习的谱聚类图像分割方法，其中步骤（3）所述的计算特征数据与字典原子的欧氏距离，并取距离较小的前l个数据构造采样子集S，按照如下步骤进行：

w_ji＝||d_j-x_i||,j＝1,...,m,i＝1,...,n

将n个特征数据分别与第j个字典原子d_j的欧氏距离构成第j个字典原子d_j的距离向量：w_j＝{w_j1,...,w_ji,...,w_jn},i＝1,...,n；

(3b)比较全部字典原子的距离向量w_j(j＝1,...,m)的值，把欧氏距离较小的前l个w_ji对应的第i个特征数据x′_i作为采样点,并去掉重复特征数据，得到规模为300的采样子集S。

4.根据权利要求1所述的基于MOD字典学习的谱聚类图像分割方法，其中步骤(4)所述的利用

方法，从选出的采样子集S得到所有特征数据的特征向量，按照如下步骤进行：

(4a)计算采样子集S的权值矩阵W＝G(S,S)，其中n为特征数据个数，G()为高斯核函数；

(4b)对权值矩阵W进行特征分解，求出特征值λ＝{λ₁,...,λ_i,...,λ_l}和特征向量

其中λ_i是λ的第i个元素，

是

的第i列向量，i＝1,2,...,l；

(4c)由W的特征值λ和特征向量

根据下式计算得到φ的第j个列向量

将n个列向量构成所有特征数据的特征向量：