CN102622583A

CN102622583A - 基于模型和稀疏表示的多角度型号识别方法及系统

Info

Publication number: CN102622583A
Application number: CN2012100438036A
Authority: CN
Inventors: 孙波; 何珺; 吴学文; 余乐军; 葛凤翔; 李程
Original assignee: Beijing Normal University
Current assignee: Beijing Normal University
Priority date: 2012-02-23
Filing date: 2012-02-23
Publication date: 2012-08-01

Abstract

本发明公开了一种基于模型和稀疏表示的多角度型号识别方法及系统，涉及型号识别技术领域，所述方法包括：S1：获取待识别器物的图像，并对所述待识别器物的图像进行投影变换，以获得所述待识别器物的图像的投影；S2：根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解，以获得所述待识别器物的型号信息数据；S3：根据所述型号信息数据确定所述待识别器物的型号。本发明通过模型和稀疏表示的方法对任意角度拍摄的待识别器物图像进行型号识别，提高了识别的角度鲁棒性和对同类器物中不同型号的物体的识别精度。

Description

基于模型和稀疏表示的多角度型号识别方法及系统

技术领域

本发明涉及多角度的型号识别技术领域，特别涉及一种基于模型和稀疏表示的多角度型号识别方法及系统。

背景技术

随着高新技术的发展和应用，人们能够获取到比以往更丰富的影像数据；基于图像的目标识别应用也日益广泛。同时，随着大规模工业化生产的发展，人们制造出越来越多、具有相同外形及尺寸的大型器物，如汽车、飞机等。由此，目标识别已不局限于大类型，如轿车、飞机等的划分，对某些类型的大型人造器物的型号识别要求也日渐突出。

辞海对“型号”的注解是“机器、工具等的性能、规格和大小。”可见，在图像上能体现的层面上，型号代表了同一类物体间规格、大小的差异。而“规格”，“指一般工业产品的物理形状，包括体积、长度、形状、重量等”；“主要是为了区分类似产品”。而我们关注的大型人造器物，大多具有严格定义的外形及尺寸，并因型号的差异而存在或大或小的差异。

型号识别方法常分为句法方法和决策理论方法两大类。由于一般目标物的结构信息不明显或不易获得，在型号识别应用中多数采用基于统计的决策理论方法。该方法首先通过特征抽取过程将目标从模式(图像)空间映射到特征空间，再映射到决策空间进行分类。所谓特征是选定的一种度量，它对于一般的变形和失真保持不变或几乎不变，并且只含尽可能少的冗余信息，可见，在决策理论方法中，特征抽取占有重要的地位，但是，对于差别较小的型号识别而言，这种方法的角度鲁棒性差，识别精度明显下降。

发明内容

(一)要解决的技术问题

本发明要解决的技术问题是：如何提高识别的角度鲁棒性和型号识别的识别精度，实现多角度的型号识别。

(二)技术方案

为解决上述技术问题，本发明提供了一种基于模型和稀疏表示的多角度型号识别方法，包括以下步骤：

S1：获取待识别器物的图像，并对所述待识别器物的图像进行投影变换，以获得所述待识别器物的图像的投影；

S2：根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解，以获得所述待识别器物的型号信息数据；

S3：根据所述型号信息数据确定所述待识别器物的型号。

优选地，所述预设字典通过以下步骤获得：

S21：获取至少两个已知型号样本的多角度图像，并对每个型号样本的多角度图像分别进行投影变换，以获得每个型号样本的多角度图像的投影；

S22：将每个型号样本的多角度图像的投影分别构成子字典，并将所述子字典组成所述预设字典。

优选地，步骤S21中，设第i个型号样本的第j张图像为a_ij，通过下列公式进行投影变换，

c_ij＝Ψa_ij

其中，Ψ为投影矩阵，c_ij为第i个型号样本的第j张图像的投影，i＝1，2，...，k；j＝1，2，...，n。

优选地，步骤S1中，设所述待识别器物的图像为Y，通过下列公式进行投影变换，

y＝ΨY

其中，Ψ为投影矩阵，y为所述待识别器物的图像的投影。

优选地，步骤S2中，通过下列公式进行计算，以获得所述待识别器物的型号信息数据x，

y＝Ax

其中，y为所述待识别器物的图像的投影，A为所述预设字典。

优选地，步骤S2中通过基于正交匹配追踪OMP的计算方法来求解所述待识别器物的型号信息数据x。

优选地，步骤S3中，通过下列公式确定所述待识别器物的型号Identity(y)，

Identity (y) = \arg [\max_{i} (SCI (x_{i}))]

其中，

SCI (x_{i}) = [\frac{k {| | x_{i} | |}_{1}}{{| | x | |}_{1}}] / (k - 1), i = 1,2, . . ., k,

arg为返回函数，用于返回公式中的i；x为所述待识别器物的型号信息数据，x_i为第i种类型的型号信息数据，k为总型号数，||||₁为1-范数运算符。

本发明还公开了一种基于模型和稀疏表示的多角度型号识别系统，包括：

待识别图像获取模块，用于获取待识别器物的图像，并对所述待识别器物的图像进行投影变换，以获得所述待识别器物的图像的投影；

型号获得模块，用于根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解，以获得所述待识别器物的型号信息数据；

型号确定模块，用于根据所述型号信息数据确定所述待识别器物的型号。

(三)有益效果

本发明通过模型和稀疏表示的方法对任意角度拍摄的待识别器物图像进行型号识别，提高了识别的角度鲁棒性和对同类器物中不同型号的物体的识别精度。

附图说明

图1是按照本发明一种实施方式的基于模型和稀疏表示的多角度型号识别方法的流程图；

图2是用于获取图像的采集模块的结构示意图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

自然界中的事物大多遵守线性叠加原理。在此前提下，某姿态或状态下某物体的图像可以由已知的它在其他姿态或状态下的图像线性组合得到或逼近。这是基于稀疏表示的型号间模式识别的理论依据。识别的基本问题是利用标记过类别信息的样本将新的测试样本正确归类到所属类别中。这是理想情况。实际中，x可能存在的非零元素可能分散于多个类的位置上，则通过x的统计分布特点可以得到对其归属进行划分识别结果；这就是基于稀疏表示进行模式识别的基本原理。鉴于线性组合和字典的过完备性，当存储的信息足够丰富时，针对微小差异的型号识别就有可能实现。

图1是按照本发明一种实施方式的基于模型和稀疏表示的多角度型号识别方法的流程图；参照图1，本实施方式的方法包括以下步骤：

S1：获取待识别器物的图像，并对所述待识别器物的图像进行投影变换，以获得所述待识别器物的图像的投影；设所述待识别器物的图像为Y，通过下列公式进行投影变换，

y＝ΨY

其中，Ψ为投影矩阵，y为所述待识别器物的图像的投影。

S2：根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解，以获得所述待识别器物的型号信息数据；具体通过下列公式进行计算，以获得所述待识别器物的型号信息数据x，

y＝Ax

优选地，所述预设字典通过以下步骤获得：

S21：获取至少两个已知型号样本的多角度图像，并对每个型号样本的多角度图像分别进行投影变换，以获得每个型号样本的多角度图像的投影；优选地，步骤S21中，设第i个型号样本的第j张图像为a_ij，通过下列公式进行投影变换，

c_ij＝Ψa_ij

S22：将每个型号样本的多角度图像的投影分别构成子字典，并将所述子字典组成所述预设字典，将给定的第i(i＝1，...，k)个型号样本的第j(j＝1，...，n)图像的投影作为字典中的列向量，亦称为原子。将第i个型号的原子组合在一起得到第i类对应的子字典

假定任意一类i都有足够多样本，即A_i涵盖的信息足够丰富，那么第i个型号样本的任一图像(无论字典中是否存在)y都可以用A_i中的元素线性组合逼近得到，也就是稀疏表示：

y＝x_i1a_i1+x_i2a_i2+…+x_ina_in；x_ij∈R，j＝1，2，…，n_i

S3：根据所述型号信息数据确定所述待识别器物的型号。优选地，步骤S3中，通过下列公式确定所述待识别器物的型号Identity(y)，

Identity (y) = \arg [\max_{i} (SCI (x_{i}))]

其中，

SCI (x_{i}) = [\frac{k {| | x_{i} | |}_{1}}{{| | x | |}_{1}}] / (k - 1), i = 1,2, . . ., k,

获取待识别器物的图像和至少两个已知型号样本的多角度图像时，采用如图2所示的采集模块，所述采集模块包括：旋转物台、导轨、摄像头、以及处理器，所述摄像头能够根据所述处理器的控制命令在导轨上进行滑动。

实施例1

下面以一个实施例来说明本发明，但不限定本发明的保护范围。本实施例中以4辆车模型：No1(audiA2)、No2(audiA6)、No3(Toyota)和No4(audiA3)为例，即k＝4，进行方法验证。验证流程步骤如下：

1、调整摄像头到旋转物台的距离，得到模型车辆No1～4的视频文件；

2、按照一定的角度间隔d度从视频文件中截取生成样本图像库Φ，其中每辆模型车的样本数为n；

3、从视频文件中随机抽取图像作为待识别图像Y，对待识别图像Y进行随机高斯投影转换的方式获得待识别图像的投影y；

4、通过随机高斯投影转换的方式，通过样本图像库Φ生成m×(kn)维的字典矩阵A(即预设字典)，m为字典矩阵A中每个原子所包含的信息个数；

5、根据字典矩阵A、以及待识别图像的投影y利用基于正交匹配追踪OMP的方法进行稀疏方程求解，以获得型号信息数据x；

6、根据型号信息数据x在各型号中的集中度SCI(x_i)，并根据所述集中度确定型号。

根据上述验证流程步骤所获得的结果如下表所示：

本发明还公开了一种基于模型和稀疏表示的多角度型号识别系统，所述系统包括：

以上实施方式仅用于说明本发明，而并非对本发明的限制，有关技术领域的普通技术人员，在不脱离本发明的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本发明的范畴，本发明的专利保护范围应由权利要求限定。

Claims

1.一种基于模型和稀疏表示的多角度型号识别方法，其特征在于，包括以下步骤：

S3：根据所述型号信息数据确定所述待识别器物的型号。

2.如权利要求1所述的方法，其特征在于，所述预设字典通过以下步骤获得：

3.如权利要求2所述的方法，其特征在于，步骤S21中，设第i个型号样本的第j张图像为a_ij，通过下列公式进行投影变换，

c_ij＝Ψa_ij

4.如权利要求1所述的方法，其特征在于，步骤S1中，设所述待识别器物的图像为Y，通过下列公式进行投影变换，

y＝ΨY

其中，Ψ为投影矩阵，y为所述待识别器物的图像的投影。

5.如权利要求1所述的方法，其特征在于，步骤S2中，通过下列公式进行计算，以获得所述待识别器物的型号信息数据x，

y＝Ax

6.如权利要求5所述的方法，其特征在于，步骤S2中通过基于正交匹配追踪OMP的计算方法来求解所述待识别器物的型号信息数据x。

7.如权利要求1所述的方法，其特征在于，步骤S3中，通过下列公式确定所述待识别器物的型号Identity(y)，

Identity (y) = \arg [\max_{i} (SCI (x_{i}))]

其中，

SCI (x_{i}) = [\frac{k {| | x_{i} | |}_{1}}{{| | x | |}_{1}}] / (k - 1), i = 1,2, . . ., k,

8.一种基于模型和稀疏表示的多角度型号识别系统，其特征在于，包括：