CN106326903A

CN106326903A - 一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法

Info

Publication number: CN106326903A
Application number: CN201610791835.2A
Authority: CN
Inventors: 李盛阳; 邵雨阳; 郑贺
Original assignee: Technology and Engineering Center for Space Utilization of CAS
Current assignee: Technology and Engineering Center for Space Utilization of CAS
Priority date: 2016-08-31
Filing date: 2016-08-31
Publication date: 2017-01-11

Abstract

本发明公开了一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法，该方法包括：步骤1，采用ASIFT算法对多种类训练图像进行特征提取以及采用训练字典的方法，形成多种类字典；步骤2，采用ASIFT算法对目标测试图像进行特征提取，形成特征矩阵；步骤3，利用稀疏识别的方法建立能够同时识别不同传感器典型图像的识别模型，采用该识别模型将所述步骤1的特征矩阵与所述步骤2的多种类字典进行对比判断，若特征矩阵与字典相符合，则识别出图像类别；若不符合，则将特征矩阵训练添加到字典内。通过本发明利用仿射尺度不变特征变换方法，解决特征提取问题，并且利用稀疏表示方法建立一个通用的识别模型，经过实验证明该方法能够有效地识别目标图片。

Description

一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法

技术领域

本发明涉及一种基于稀疏表示的识别图像的方法，尤其是一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法。

背景技术

稀疏表示是近年来图像识别、计算机视觉、数值计算等领域的研究热点，并取得了较好的效果。稀疏表示的最初目的是为了用比香农定理更低的采样率来表示和压缩信号。由于稀疏表示本身具有很好的判别特性，已经被成功应用在模式识别中，如人脸识别、车辆识别。

由于目前的提取对视角变化鲁棒的图像特征麻烦，另外建立一个可以识别不同传感器图片的通用识别模型比较困难，而且识别建筑物或者其他的地面物体没有比较高的精度，清晰度也模糊等问题。

发明内容

本发明所要解决的技术问题是目前对提取对视角变化鲁棒的图像特征比较麻烦，建立一个可以识别不同传感器图片的通用识别模型比较困难，而且识别建筑物或者其他的地面物体精度低，清晰度模糊等问题。

本发明解决上述技术问题的技术方案如下：

一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法,该方法步骤包括：

步骤1，采用ASIFT算法对多种类训练图像进行特征提取以及采用训练字典的方法，形成多种(2种以上)类字典；

步骤2，采用ASIFT算法对目标测试图像进行特征提取，形成特征矩阵；

步骤3，利用稀疏识别的方法，通过建立能够同时识别不同传感器典型图像的识别模型，采用该识别模型将所述步骤1的特征矩阵与所述步骤2的多种类字典进行对比判断，若特征矩阵与字典相符合，则识别出图像类别，若不符合，则将特征矩阵训练添加到字典内。

在上述技术方案的基础上，本发明还可以做如下改进。

进一步，所述步骤1中的特征提取采用的ASIFT算法具体为：

数字图像的获取过程可以表述如下：

u＝S₁G₁ATu₀ (1)

u代表数字图像，u₀代表正视图，T代表平面变换，即图像的平面扭曲变换，A代表平面投影映射，G₁代表高斯卷积平滑，S₁代表采样，即将原始图像u₀网格化，转为数字图像，

平面投影映射A可以表示如下：

A = H_{λ} R_{1} T_{t} R_{2} = λ [\begin{matrix} c o s ψ & - s i n ψ \\ s i n ψ & \cos ψ \end{matrix}] [\begin{matrix} t & 0 \\ 0 & 1 \end{matrix}] [\begin{matrix} c o s φ & - s i n φ \\ s i n φ & \cos φ \end{matrix}] - - - (2)

这里H_λ＝λ，λ＞0，是A的行列式，R_i代表旋转，ψ∈[0，π)，φ∈[0,π),T_t代表倾斜度,t≥1。

进一步，利用SIFT方法提取所有图像的特征。

进一步，所述SIFT方法，该方法具体为：利用高斯卷积

高斯函数定义为G(x,y,σ)，输入图像定义为I(x,y)图像的尺度空间函数定义为：

L(x,y,σ)＝G(x,y,σ)*I(x,y) (3)

这里*代表卷积操作。且

G (x, y, σ) = \frac{1}{2 {πσ}^{2}} e^{- (x^{2} + y^{2}) / 2 σ^{2}} - - - (4)

是2维高斯函数。

进一步，所述步骤3中的稀疏识别模型为：

\overset{&OverBar;}{x} = D \overset{&OverBar;}{α} = D_{1} {\overset{&OverBar;}{α}}_{1} + D_{2} {\overset{&OverBar;}{α}}_{2} + ... + D_{C} {\overset{&OverBar;}{α}}_{C} - - - (5)

其中，

表示测试样本的ASIFT特征，其中

D表示对C类图像样本中的每类样本的ASIFT特征进行训练得到对应的训练字典，并组合构成字典D＝[D₁,D₂,…,D_C]，为第i类的训练字典，该字典也是在稀疏识别下得到带有稀疏特质的矩阵；

为经过稀疏表示后的向量，其中为第i类对应的系数；

c = \arg \min_{0 \leq i \leq C} | | \overset{&OverBar;}{x} - \overset{&OverBar;}{x_{i}} | |_{2}

其中，

argmin使式子|| ||₂取最小值，式(6)表示取与矩阵之间距离的最小值，当c取值最小时，此时的i即为分类结果。

ASIFT得到的特征矩阵为识别模型的输入，得到带有稀疏特质的矩阵。

本发明的带来的有益效果是：基于稀疏表示的识别图像的方法，利用仿射尺度不变特征变换(ASIFT)方法，解决特征提取问题，并且利用稀疏表示方法建立一个通用的识别模型，能够有效地识别目标图片，对建筑物进行模式分类。

附图说明

图1是本发明基于仿射尺度不变特征和稀疏表示的典型目标识别方法流程图。

图2是本发明的整体流程图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。如图1所示其具体的做法和实施的步骤如下：

ASIFT特征提取算法

为了更好地解释算法，首先定义相机模型。数据图像的获取过程可以表述如下：

u＝S₁G₁ATu₀ (1)

u代表数字图像，u₀代表正视图，T代表平面变换，即图像的平面扭曲变换，A代表平面投影映射，G₁代表高斯卷积平滑，S₁代表采样，即将原始图像u₀网格化，转为数字图像，这里T和S₁设为1，

平面投影映射A可以表示如下：

A = H_{λ} R_{1} T_{t} R_{2} = λ [\begin{matrix} c o s ψ & - s i n ψ \\ s i n ψ & \cos ψ \end{matrix}] [\begin{matrix} t & 0 \\ 0 & 1 \end{matrix}] [\begin{matrix} c o s φ & - s i n φ \\ s i n φ & \cos φ \end{matrix}] - - - (2)

利用SIFT方法提取所有图像的特征。

SIFT的关键是利用高斯卷积。高斯函数定义为G(x,y,σ)，输入图像定义为I(x,y)图像的尺度空间函数定义为：

L(x,y,σ)＝G(x,y,σ)*I(x,y) (3)

这里*代表卷积操作。且

G (x, y, σ) = \frac{1}{2 {πσ}^{2}} e^{- (x^{2} + y^{2}) / 2 σ^{2}} - - - (4)

是2维高斯函数。

SIFT利用DOG(Difference-of-Gaussian)技术计算尺度空间中的极值。然后通过计算尺度空间中的梯度等，得到最后的描述子，该描述子是一维向量，代表方向直方图。对于每幅图像，ASIFT可以提取许多特征向量，特征向量构成的特征矩阵作为稀疏表示模型的输入，训练图像的特征用于训练字典，测试图像的特征用于作为识别模型的输入。

稀疏表示模型

稀疏表示(Sparse Representation，SR)，是近年来图像识别、计算机视觉、数值计算等领域的研究热点，并取得了较好的效果。稀疏表示的最初目的是为了用比香农定理更低的采样率来表示和压缩信号。由于稀疏表示本身具有很好的判别特性，已经被成功应用在模式识别中，如人脸识别、车辆识别。本文应用稀疏表示方法对建筑物进行模式分类。

稀疏表示基本原理

设信号x∈R^N，矩阵D＝[D₁,D₂,…,D_C]为字典，由A张成的N维空间Ψ，向量为D中的原子，则信号在空间Ψ上可以表示为：

\overset{&OverBar;}{x} = D \overset{&OverBar;}{α} = D_{1} {\overset{&OverBar;}{α}}_{1} + D_{2} {\overset{&OverBar;}{α}}_{2} + ... + D_{C} {\overset{&OverBar;}{α}}_{C} - - - (5)

其中系数α＝[α₁,α₂,...,α_K]^T∈R^K为信号x在空间Ψ上的坐标，并且α中只有少量分量是非零的，即是稀疏的，其数学模型表达形式为：

min||x-Dα||,subject to||α||₀≤L (6)

其中|| ||₀表示l₀范数，表示非零元素的个数。

稀疏表示求解算法

常用的稀疏表示求解算法有：匹配追踪(Matching Pursuit，MP)算法、正交匹配追踪(Orthogonal Matching Pursuit，OMP)算法等。本文采用OMP算法，此算法是从过完备库中找出与待分解信号或信号残差最为匹配的匹配原子，在算法中需要将所选原子利用Gram-Schmidt正交化方法进行正交处理，再将信号在这些原子构成的空间中投影，得到信号在各个原子上的分量和残差分量，然后分解残余分量经过M次分解，原信号被分解为M个原子的线性组合，在每一步分解中所算最佳原子均满足一定条件，因此残余分量随着分解过程迅速减小，这样，用少量原子就可以表示原始信号，而且经过有限次迭代就可以收敛。

字典学习算法

常见的字典学习算法有：最优方向(Method of optimal directions，MOD)算法、联合正交基算法、广义PCA算法、K-SVD算法等。本文采用K-SVD算法。K-SVD方法的主要改进在于字典的更新步骤，它通过简单而有效地逐列更新的方式解决了MOD方法中矩阵求逆的问题，并且通过同时更新字典基元和相关的表示系数使得计算复杂度比MOD方法大大降低。

K-SVD算法中K指的是字典基元的个数，当更新某一列字典基元时假设其他的列基元已知并得到一个表示误差矩阵，然后同时更新这一列基元和与其相关的稀疏表示系数。

对于小样本问题来说，K-SVD是一个有效的方法，本文采用K-SVD方法训练字典，稀疏编码阶段采用正交匹配追踪(OMP)算法。

稀疏表示识别模型

\overset{&OverBar;}{x} = D \overset{&OverBar;}{α} = D_{1} {\overset{&OverBar;}{α}}_{1} + D_{2} {\overset{&OverBar;}{α}}_{2} + ... + D_{C} {\overset{&OverBar;}{α}}_{C} - - - (5)

其中，

表示测试样本的ASIFT特征，其中

为经过通过正交匹配追踪(OMP)算法计算稀疏表示后的向量，其中为第i类对应的系数；

c = \arg \min_{0 \leq i \leq C} | | \overset{&OverBar;}{x} - \overset{&OverBar;}{x_{i}} | |_{2}

其中，

实施例

将测试的图像利用ASIFT特征提取得到的特征矩阵；将n类的训练图像经过用ASIFT特征提取得到的n类特征矩阵，将n类特征矩阵经KSVD训练成集合字典；将测试的图像的特征矩阵经过稀疏识别带有稀疏特质的矩阵，将字典也经过稀疏识别得到带有稀疏特质的矩阵，最后将得到的测试图像与字典对比判断，若是相同，则判断出图像类别；若是不相同，则将测试图像增加到字典中。

在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、方法、装置或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法,其特征在于，该方法包括如下步骤：

步骤1，采用ASIFT算法对多种类训练图像进行特征提取以及采用训练字典的方法，形成多种类字典；

步骤3，利用稀疏识别的方法建立能够同时识别不同传感器典型图像的识别模型，采用该识别模型将所述步骤1的特征矩阵与所述步骤2的多种类字典进行对比判断，若特征矩阵与字典相符合，则识别出图像类别；若不符合，则将特征矩阵训练添加到字典内。

2.根据权利要求1所述的一种基于仿射尺度不变特征和稀疏表示的典型目标识别的方法，其特征在于，所述步骤1中的ASIFT算法为：

数字图像的获取过程表述如下：

u＝S₁G₁ATu₀ (1)

平面投影映射A可以表示如下：

A = H_{λ} R_{1} T_{t} R_{2} = λ [\begin{matrix} c o s ψ & - s i n ψ \\ s i n ψ & \cos ψ \end{matrix}] [\begin{matrix} t & 0 \\ 0 & 1 \end{matrix}] [\begin{matrix} c o s φ & - s i n φ \\ s i n φ & \cos φ \end{matrix}] - - - (2)

3.根据权利要求2所述的一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法，其特征在于，ASIFT算法还包括：利用SIFT方法提取所有图像的特征。

4.根据权利要求2所述的一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法，其特征在于，所述高斯卷积平滑，该高斯卷积平滑具体为：利用SIFT方法，其中高斯函数定义为G(x,y,σ)，输入图像定义为I(x,y)，图像的尺度空间函数定义为：

L(x,y,σ)＝G(x,y,σ)*I(x,y) (3)

这里*代表卷积操作且

G (x, y, σ) = \frac{1}{2 {πσ}^{2}} e^{- (x^{2} + y^{2}) / 2 σ^{2}} - - - (4)

是2维高斯函数。

5.根据权利要求1所述的一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法，其特征在于，所述步骤3中识别模型，其具体为：

\overset{&OverBar;}{x} = D \overset{&OverBar;}{α} = D_{1} {\overset{&OverBar;}{α}}_{1} + D_{2} {\overset{&OverBar;}{α}}_{2} + ... + D_{C} {\overset{&OverBar;}{α}}_{C} - - - (5)

其中，

表示测试样本的ASIFT特征，其中

为经过稀疏表示后的向量，其中为第i类对应的系数；

c = \arg \underset{0 \leq i \leq C}{m i n} | | \overset{&OverBar;}{x} - \overset{&OverBar;}{x_{i}} | |_{2} - - - (6)

其中，

argmin使式子|| ||₂取最小值，式(6)表示取与矩阵之间距离的最小值，当c取值最小时，此时的i即为分类结果；

i＝1,2,3,...,C，ASIFT得到的特征矩阵为识别模型的输入，得到带有稀疏特质的矩阵。