CN106951873A

CN106951873A - 一种遥感图像目标识别方法

Info

Publication number: CN106951873A
Application number: CN201710183174.XA
Authority: CN
Inventors: 高红民; 杨耀; 李臣明; 樊悦; 陈玲慧; 黄昌运; 闵海彬; 张振; 李雪琨; 陆迎曙
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2017-03-24
Filing date: 2017-03-24
Publication date: 2017-07-14
Anticipated expiration: 2037-03-24
Also published as: CN106951873B

Abstract

本发明公开一种遥感图像目标识别方法。包括以下步骤：首先选取典型类别目标的遥感图像构建训练集；接着从训练集中分别提取目标图像的尺度不变特征转换(简称“SIFT”)特征；然后利用谱聚类算法生成视觉词典；再用局部加权向量化的方法对每个图像的特征进行字典的重构编码；最后选取合适的分类器完成图像的分类任务。本发明能够有效提升图像分类识别的精度，提高遥感目标检测识别的效率。

Description

一种遥感图像目标识别方法

技术领域

本发明涉及一种基于改进视觉词包模型的遥感图像目标识别方法，属于图像识别技术领域。

背景技术

近年来，遥感技术取得了巨大的进步。伴随着遥感影像获取技术的不断进步和遥感影像数量的不断增长，已有的图像分析处理能力根本无法满足海量遥感影像数据处理的需求。如何从复杂背景干扰、目标特征不稳定且包含海量信息的遥感影像中快速准确地自动获取感兴趣信息的问题，已日渐成为当今遥感影像技术发展的热点与难点之一。再者，借助遥感图像检测识别目标，在军事国防方面和民用方面都有广泛的应用前景。

视觉词包模型起源于词包模型。词包模型起源于文本分类领域，它的主要思想是通过生成样本数据的特征字典，对每个文本样本进行字典的统一向量表达。近年来，视觉词包模型在图像分类领域得到了广泛的应用。现有的视觉词包模型在遥感目标识别方面，在一定程度上，能够提高目标检测识别的效率，但是仍存在很大的局限性。因此对现有视觉词包模型进行改进，从而实现更高效、更快完成目标检测识别具有十分重要的现实意义。

发明内容

发明目的：为了克服上述现有技术的不足，本发明提供了一种基于改进视觉词包模型的遥感图像目标识别方法，以提高目标检测识别的效率。

技术方案：一种基于改进视觉词包模型的遥感图像目标识别方法，包括下述步骤：

选取遥感图像构建训练集。

从训练集中分别提取目标图像的SIFT特征。

利用谱聚类算法生成视觉词典。所述谱聚类算法的步骤主要为：

(1)将每个特征向量视为图中的顶点，选取特征相似度准则，计算各个特征间的相似度值，作为顶点间的权重值，从而生成一个N×N的对称权值矩阵E，计算权值矩阵采用KNN方法，即仅计算每个点与其最近的k个点的权值；

(2)选取相应的图划分准则计算Laplacian矩阵L；根据二分大准则，将矩阵E每列元素相加，即得到该顶点的度。以所有度值为对角元素构成的对角矩阵即为度矩阵D。则Laplacian矩阵L＝D-E；

(3)计算矩阵L的前K个特征值与特征向量，构建特征向量空间：将K个特征向量构造成N×K的矩阵M；

(4)把M的每一行作为新样本，对N个新样本进行K-means聚类处理。

用局部加权向量量化的方法对每个图像的特征进行字典的重构编码。所述局部加权向量量化的方法是指基于最近邻架构与向量量化编码方法提出的一种可在一定程度上提高向量的表达力与鉴别性的综合性方法。顶端的实心五边形表示字典中的一个视觉词汇，在两条曲线中间的几何图形代表特定图像提取的所有SIFT特征。不同粗细的直线代表相应特征与该词汇间的权值，只有那些最接近视觉词汇的特征才会被赋予较大的权值，而剩余特征则会分配到较小的权值。同时，这些特征到视觉词汇的距离也被用于计算相应的表示向量。根据上述的方法，通过计算每个视觉词汇到近邻特征的加权相似度，就可以直接得到给定图像的最终表示(向量表示)。

选取合适的分类器完成图像的分类任务。在KD-Tree(K-dimension tree的缩写)查询算法的基础上，基于加权近邻提出一种改进的KD-Tree分类查找算法，即在KD-Tree回溯查找时，记录每个回溯点，分别计算每个点相对于待查询点的权重，最后通过投票的方式，决策出待定点的类别。

本发明采用上述技术方案，具有以下有益效果：本发明对现有的视觉词包模型加以改进，能够精确描述遥感图像的细节部分，减少遥感目标图像块中背景噪声的影响，减少对未知目标图像的误判率，提升图像分类识别的精度，从而提高遥感目标检测识别的效率。

附图说明

图1为加权向量化编码方法的示意图；

图2为飞机目标图像块提取的SIFT特征图形化示例。

具体实施方式

下面结合具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

基于改进视觉词包模型的遥感图像目标识别方法，具体步骤如下：

1、选取典型类别的目标的遥感图像构建训练集。

人工选取多种目标物的多幅遥感图像构建训练集。因为遥感影像训练集目标类别的大小尺度不一，所以每类目标图像所能提取的SIFT特征数量也有着巨大的差异。训练集中图像数量越多，能获取的特征信息也就越多。

2、从训练集中分别提取目标图像的SIFT特征。

沿用传统SIFT算法提取图像的SIFT特征。图2展示了飞机遥感影像块提取的SIFT特征。按如下步骤提取SIFT特征：

步骤1，尺度空间极值检测：搜索所有尺度上的图像I(x，y)位置。通过高斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点。一幅图像的尺度空间L(x,y,σ)，定义为原始图像I(x，y)与一个尺度可变的二维高斯函数的卷积运算(式3a)：

L(x，y，σ)＝G(x，y，σ)*I(x，y) (3a)

其中，G(x,y,σ)是尺度可变高斯函数(式3b)：

(x,y)是空间地标，σ为高斯正态分布的方差即尺度坐标，m和n为两个常数。将多层高斯差分尺度空间函数(式4)邻接起来，通过两个相邻高斯尺度空间的图像相减，形成差分高斯金字塔(DoG)(式3c)：

D(x，y，σ)＝(G(x，y，kσ)-G(x，y，σ))*I(x，y)

＝L(x，y，kσ)-L(x，y，σ) (3c)

其中k为相邻两个尺度空间的倍数的常数。

步骤2，DoG特征点定位：对尺度空间DoG函数进行曲线的三维二次函数拟合，根据点的稳定程度选择关键点。利用DoG函数在尺度空间的Taylor展开式(拟合函数)为：

其中，D为采样点处的极值，X为极值点相对采样点的偏移量，对X＝(x，y，σ)^T求导并让方程等于零，可以得到极值点的偏移量位置。采样点的主曲率和该点处的Hessian矩阵H的特征值成正比：

Tr(H)＝D_xx+D_yy＝α+β (5a)

Det(H)＝D_xxD_yy-(D_xy)²＝αβ (5b)

其中α是矩阵H的最大特征值，而β是矩阵H的最小特征值，Tr(H)为矩阵H的际，Det(H)表示矩阵行列式的值。利用矩阵的际及其行列式的值，可求得两个特征值的比值，即为两曲率的比值(式6)。令α＝rβ，则

所以为了剔除边缘响应点，需要让该比值小于一定的阈值r。

步骤3，方向确定：基于图像局部的梯度方向，分配给每个关键点位置一个或多个方向。点(x,y)处梯度的模值(式7a)和方向(式7b)如下：

其中L表示每个关键点各自所在的尺度。使用直方图统计邻域内像素的梯度和方向。梯度直方图将0～360°的方向范围分为36个Bin，并以直方图中最大值作为该关键点的主方向。

步骤4，关键点描述：将关键点邻域作为一个处理单元，旋转该单元的梯度空间坐标使得特征描述具备旋转不变性。将该单元内的梯度值分配到8个方向上计算每个种子点八个方向的梯度，生成128(4×4×8)个梯度信息即为该关键点的特征向量。

3、利用谱聚类算法生成视觉词典。

谱聚类的本质是将聚类问题转化为图的最优划分问题，亦可视为将特征数据通过一定准则进行映射降维的过程。对于谱聚类算法，主要选取特征相似度匹配准则与图划分准则。谱聚类算法可以在任意形状的样本空间上聚类，得到收敛于全局的最优解。用谱聚类算法生成视觉词典的步骤如下：

步骤1：将每个特征向量视为图中的顶点，选取特征相似度准则，计算各个特征间的相似度值，作为顶点间的权重值，从而生成一个N×N的对称权值矩阵E，计算权值矩阵采用KNN方法，即仅计算每个点与其最近的k个点的权值；

步骤2：选取相应的图划分准则计算Laplacian矩阵L；根据二分大准则，将矩阵E每列元素相加，即得到该顶点的度。以所有度值为对角元素构成的对角矩阵即为度矩阵D。则Laplacian矩阵L＝D-E；

步骤3：计算矩阵L的前K个特征值与特征向量,构建特征向量空间：将K个特征向量构造成N×K的矩阵M；

步骤4：把M的每一行作为新样本，对N个新样本进行K-means聚类处理。

其中，用K-means聚类处理的步骤如下：

步骤1：选择K个特征向量作为初始焦点；

步骤2：(重新)分配所有点到最近的邻点；

步骤3：计算新的汇聚点；

步骤4：重复步骤2和3直到焦点不再改变。

4、用局部加权向量量化的方法对每个图像的特征进行字典的重构编码。

局部加权向量量化编码方法如图1所示，顶端的实心五边形表示字典中的一个视觉词汇，在两条曲线中间的几何图形代表特定图像提取的所有SIFT特征。不同粗细的直线代表相应特征与该词汇间的权值，只有那些最接近视觉词汇的特征(图中为曲线间黑色实心元素)才会被赋予较大的权值，而剩余特征则会分配到较小的权值。同时，这些特征到视觉词汇的距离也被用于计算相应的表示向量。这就表明如果一个给定特征与视觉词汇具有很小的相似性，它对该词汇的最终表示值影响将会很小。如果多个特征都与同一词汇相似，那么他们各自的影响将由他们与这一词汇间的距离来进一步决定。根据上述的方法，通过计算每个视觉词汇到近邻特征的加权相似度，就可以直接得到给定图像的最终表示(向量表示)。

5、选取合适的分类器完成图像的分类任务。

基于加权近邻，在KD-Tree回溯查找时，记录每个回溯点，分别计算每个点相对于待查询点的权重，最后通过投票的方式，决策出待定点的类别。具体操作如下：

假设训练数据集为测试数据集为类标为C＝{c₁,c₂,c₃,···,c_c}，训练数据的类别已标定；在近邻算法中，为了预测测试数据的类别需要计算该数据点到所有训练数据的距离则每类的类别值为：

其中k_j为属于第c_j类的训练数据数量；取val中的最大值记为待测数据的类标；在KD-Tree的加权近邻算法中，定义k_j为回溯数据点，那么重新定义为：

其中H是一个常数，函数表示余弦距离；val中最大值的类标记为预测结果。

Claims

1.一种遥感图像目标识别方法，其特征在于，包括下述步骤：

选取遥感图像构建训练集；

从训练集中分别提取目标图像的SIFT特征；

利用谱聚类算法生成视觉词典；再用局部加权向量量化的方法对每个图像的特征进行字典的重构编码；最后选取合适的分类器完成图像的分类任务。

2.如权利要求1所述的基于改进视觉词包模型的遥感图像目标识别方法，其特征在于，所述谱聚类算法的步骤主要为：

(2)选取相应的图划分准则计算Laplacian矩阵L；根据二分大准则，将矩阵E每列元素相加，即得到该顶点的度；以所有度值为对角元素构成的对角矩阵即为度矩阵D；则Laplacian矩阵L＝D-E；

3.如权利要求1所述的基于改进视觉词包模型的遥感图像目标识别方法，其特征在于，局部加权向量量化编码方法中，顶端的实心五边形表示字典中的一个视觉词汇，在两条曲线中间的几何图形代表特定图像提取的所有SIFT特征；不同粗细的直线代表相应特征与该词汇间的权值，这些特征到视觉词汇的距离也被用于计算相应的表示向量；通过计算每个视觉词汇到近邻特征的加权相似度，就可以直接得到给定图像的最终向量表示。

4.如权利要求1所述的基于改进视觉词包模型的遥感图像目标识别方法，其特征在于，选取合适的分类器是指基于加权近邻的KD-Tree分类器；在KD-Tree查询算法的基础上，基于加权近邻提出一种改进的KD-Tree分类查找算法，即在KD-Tree回溯查找时，记录每个回溯点，分别计算每个点相对于待查询点的权重，最后通过投票的方式，决策出待定点的类别；

所述改进的KD-Tree分类查找算法可具体描述为：

v a l = {v_{1}^{c}, v_{2}^{c}, v_{3}^{c}, ..., v_{k}^{c}} - - - (1 a)

v_{j}^{c} = Σ_{i = 1}^{k_{j}} 1 - - - (1 b)

v_{j}^{c} = Σ_{i = 1}^{k_{j}} \frac{H}{d_{i}^{c}} - - - (2 a)

d_{i}^{c} = 1 - s (r_{j}^{e}, r_{j}^{a}) - - - (2 b)