CN107480718A

CN107480718A - 一种基于视觉词袋模型的高分辨率遥感图像分类方法

Info

Publication number: CN107480718A
Application number: CN201710706366.4A
Authority: CN
Inventors: 陈苏婷; 丁杰; 冯瑞; 王卓
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2017-08-17
Filing date: 2017-08-17
Publication date: 2017-12-15

Abstract

本发明公开了一种基于视觉词袋模型的高分辨率遥感图像分类方法，包括，图像多特征提取；构建初始视觉词典；筛选视觉单词，构建视觉词典子集；图像表达和分类。本发明有效减少了词典中的冗余信息，平衡了单词的相关性和冗余性，从而提高词典子集的特征描述能力，使高分辨率遥感图像的分类精度得到显著提升。

Description

一种基于视觉词袋模型的高分辨率遥感图像分类方法

技术领域

本发明涉及一种基于视觉词袋模型的高分辨率遥感图像分类方法，属于遥感图像分类领域。

背景技术

随着面向对象思想在高分辨率遥感图像处理中的应用，该方法不断的发展创新，逐渐成为遥感图像分类的必然选择，且近些年，国内外专家学者对高分辨率遥感图像分类不断提出新的思想和算法。因此，面向对象的高分辨率遥感图像分类方法已经逐步取代基于像素的遥感图像分类方法，在图像分类领域取得令人瞩目的成果。随着传感技术的发展和卫星的更新，遥感图像广泛应用在各个领域，不仅仅应用在国防建设上，在土地测绘、环境监测、抢险救灾、城市规划等国民经济方面也越来越普及。

常见的遥感图像分类方法可以分为监督分类，非监督分类和半监督分类，主要区别在于训练样本的差异。一般来讲非监督分类不需要先验知识和其他训练样本，直接根据数据的特征性进行分类；监督分类模型先处理分析训练样本，再计算分类结果；半监督分类模型将训练样本的有无标签作为学习分类的依据之一。

基于视觉词袋模型的高分辨率遥感图像分类方法属于监督分类，但是现有的基于视觉词袋模型的高分辨率遥感图像分类方法中视觉词袋模型计算复杂度高，冗余信息严重。

发明内容

为了解决上述技术问题，本发明提供了一种基于视觉词袋模型的高分辨率遥感图像分类方法。

为了达到上述目的，本发明所采用的技术方案是：

一种基于视觉词袋模型的高分辨率遥感图像分类方法，包括，

图像多特征提取：

将待处理图像进行分割，对每个子区域提取底层特征，并将同一子区域底层特征进行融合；

构建初始视觉词典：

通过K-means聚类算法对融合后的底层特征聚类，每一类均为一个视觉单词，聚类中心的数目便是初始视觉词典的规模；

筛选视觉单词，构建视觉词典子集：

首先，通过ReliefF算法赋予视觉单词权重参数，来表示不同视觉单词对分类的贡献度；然后，结合mRMR准则计算视觉单词的相关度和冗余度，并添加视觉词典平衡系数；最后建立一个新的词典判别函数，筛选得到视觉词典子集；

图像表达和分类：

视觉词典子集通过池化后生成高层语义特征，SPM模型提取图像的空间布局信息，融合高层语义特征和空间布局信息，通过池化后得到最终特征向量，输入分类器完成分类。

底层特征包括纹理特征、形状特征和KAZE特征，这些特征采用串行方法进行融合。

K-means聚类算法将所有融合后的底层特征作为待聚类集合X＝{x₁,x₂,...,x_n}，x_j表示第j个子区域融合后的底层特征，选取k个点作为聚类中心，分别计算每个融合后的底层特征与聚类中心的欧式距离，距离最近的归为一类，如下式：

其中，c⁽ⁱ⁾为x_j所属的类别，1≤i≤k，x为底层特征，μ为聚类中心。

筛选视觉单词，构建视觉词典子集的具体过程为，

定义V＝[v₁,...,v_k]^T为初始视觉词典；

通过ReliefF算法计算初始视觉词典中每个视觉单词与图像类别的相关性权重，去掉相关性权重最小的视觉单词，得到新的视觉词典V_n′，其相关性权重矩阵为w_n′，对v_n′进行加权处理，得到V_m＝V_n′·w_n′；

定义视觉词典子集中视觉单词的数量为d；

根据确定第一个与类别最相关的视觉单词加入到词典子集V′中，再通过mRMR准则选择下一个视觉单词，直到选出d个视觉单词为止，其中，v_i为V中单词，1≤i≤k，c为单词类别，Rlv()表示相关性函数，I()表示互信息函数；

mRMR准则判别函数为：

其中，α为视觉词典平衡系数，0≤α≤1，v_j为V_m中单词，m为迭代次数，V_m为加权后词典。

采用串行方法融合高层语义特征和空间布局信息。

k和d的值的范围均为200～1200。

本发明所达到的有益效果：本发明有效减少了词典中的冗余信息，平衡了单词的相关性和冗余性，从而提高词典子集的特征描述能力，使高分辨率遥感图像的分类精度得到显著提升。

附图说明

图1为本发明的流程图；

图2为构建视觉词典子集的流程图；

图3为实验对比图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

如图1所示，一种基于视觉词袋模型的高分辨率遥感图像分类方法，包括以下步骤：

步骤1，图像多特征提取。

首先将待处理图像进行空间分割，假设共分为S层，将第s层分割为4^s-1个子区域，1≤s≤S，然后对每个子区域提取底层特征，包括纹理特征、形状特征和KAZE特征，并将同一子区域底层特征采用串行方法进行融合，将融合后的底层特征作为构建视觉单词的对象。

步骤2，构建初始视觉词典。

K-means聚类算法将所有融合后的底层特征作为待聚类集合X＝{x₁,x₂,...,x_n}，x_j表示第j个子区域融合后的底层特征，n为子区域个数，选取k个点作为聚类中心，分别计算每个融合后的底层特征与聚类中心的欧式距离，距离最近的归为一类，如下式：

步骤3，筛选视觉单词，构建视觉词典子集。

首先，通过ReliefF算法赋予视觉单词权重参数，来表示不同视觉单词对分类的贡献度；然后，结合mRMR准则计算视觉单词的相关度和冗余度，并添加视觉词典平衡系数；最后建立一个新的词典判别函数，筛选得到视觉词典子集。

具体过程如图2所示：

S1)定义V＝[v₁,...,v_k]^T为初始视觉词典，v_k为第k个视觉单词，V是k×D的矩阵，D是融合后图像底层特征的维数。

S2)通过ReliefF算法计算初始视觉词典中每个视觉单词与图像类别的相关性权重，去掉相关性权重最小的视觉单词，得到新的视觉词典V_n′，其相关性权重矩阵为w_n′，对v_n′进行加权处理，得到V_m＝V_n′·w_n′。

S3)定义视觉词典子集中视觉单词的数量为d。

S4)根据确定第一个与类别最相关的视觉单词加入到词典子集V′中，再通过mRMR准则选择下一个视觉单词，直到选出d个视觉单词为止，其中，v_i为V中单词，1≤i≤k，c为单词类别，Rlv()表示相关性函数，I()表示互信息函数；

mRMR准则判别函数为：

步骤4，图像表达和分类。

视觉词典子集通过池化后生成高层语义特征，SPM模型提取图像的空间布局信息，采用串行方法融合高层语义特征和空间布局信息，通过池化后得到最终特征向量，输入分类器完成分类。

为了进一步说明上述方法，进行20次实验，所有实验中k和d的值的范围均为200～1200，其他数据保持不变，取20次实验的平均分类准确率作为评价结果，准确率约为88％。

截取了实验区遥感图像上的图像块，5个类别各150幅图像，目的是训练本发明提出的分类算法和评价算法的分类精度。通过实验对比不同训练样本数对分类准确率的影响。分别选取40，60，80，100，120作为每类图像的训练样本数进行实验，其他数据均保持一致，取20次实验的平均分类准确率作为评价结果。另外，为了验证本文算法的有效性，选择经典的BoVW模型算法作参考，在不同的训练样本数下对图像进行分类。

实验结果如图3所示，随着训练样本数的增加，两种算法的分类精度不断提高，当训练样本数大于40，本发明算法的平均分类准确率高于经典的BoVW模型算法，且趋势越来越明显。分析可知训练样本数较少时模型学习不充分，不能够全面准确的描述图像信息，导致分类效果较差；样本数越多包含的图像信息也就越全面，分类准确率也越高；但随着样本数的增加数据冗余也增多，分类精度的增长趋于平缓。

上述方法有效减少了词典中的冗余信息，平衡了单词的相关性和冗余性，从而提高词典子集的特征描述能力，使高分辨率遥感图像的分类精度得到显著提升。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于视觉词袋模型的高分辨率遥感图像分类方法，其特征在于：包括，

图像多特征提取：

构建初始视觉词典：

筛选视觉单词，构建视觉词典子集：

图像表达和分类：

2.根据权利要求1所述的一种基于视觉词袋模型的高分辨率遥感图像分类方法，其特征在于：底层特征包括纹理特征、形状特征和KAZE特征，这些特征采用串行方法进行融合。

3.根据权利要求1所述的一种基于视觉词袋模型的高分辨率遥感图像分类方法，其特征在于：K-means聚类算法将所有融合后的底层特征作为待聚类集合X＝{x₁,x₂,...,x_n}，x_j表示第j个子区域融合后的底层特征，选取k个点作为聚类中心，分别计算每个融合后的底层特征与聚类中心的欧式距离，距离最近的归为一类，如下式：

4.根据权利要求1所述的一种基于视觉词袋模型的高分辨率遥感图像分类方法，其特征在于：筛选视觉单词，构建视觉词典子集的具体过程为，

定义V＝[v₁,...,v_k]^T为初始视觉词典；

定义视觉词典子集中视觉单词的数量为d；

mRMR准则判别函数为：

<mrow> <msub> <mi>max</mi> <mrow> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>V</mi> <mo>-</mo> <msub> <mi>V</mi> <mi>m</mi> </msub> </mrow> </msub> <mo>&lsqb;</mo> <mi>&alpha;</mi> <mi>I</mi> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>c</mi> <mo>)</mo> </mrow> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>&alpha;</mi> <mo>)</mo> </mrow> <mfrac> <mn>1</mn> <mi>m</mi> </mfrac> <munder> <mo>&Sigma;</mo> <mrow> <msub> <mi>v</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <msub> <mi>V</mi> <mi>m</mi> </msub> </mrow> </munder> <mi>I</mi> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>v</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> 1

5.根据权利要求1所述的一种基于视觉词袋模型的高分辨率遥感图像分类方法，其特征在于：采用串行方法融合高层语义特征和空间布局信息。

6.根据权利要求1所述的一种基于视觉词袋模型的高分辨率遥感图像分类方法，其特征在于：k和d的值的范围均为200～1200。