CN102622583A - 基于模型和稀疏表示的多角度型号识别方法及系统 - Google Patents

基于模型和稀疏表示的多角度型号识别方法及系统 Download PDF

Info

Publication number
CN102622583A
CN102622583A CN2012100438036A CN201210043803A CN102622583A CN 102622583 A CN102622583 A CN 102622583A CN 2012100438036 A CN2012100438036 A CN 2012100438036A CN 201210043803 A CN201210043803 A CN 201210043803A CN 102622583 A CN102622583 A CN 102622583A
Authority
CN
China
Prior art keywords
image
identified
implements
model
projection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100438036A
Other languages
English (en)
Inventor
孙波
何珺
吴学文
余乐军
葛凤翔
李程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Normal University
Original Assignee
Beijing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University filed Critical Beijing Normal University
Priority to CN2012100438036A priority Critical patent/CN102622583A/zh
Publication of CN102622583A publication Critical patent/CN102622583A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于模型和稀疏表示的多角度型号识别方法及系统,涉及型号识别技术领域,所述方法包括:S1:获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;S2:根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;S3:根据所述型号信息数据确定所述待识别器物的型号。本发明通过模型和稀疏表示的方法对任意角度拍摄的待识别器物图像进行型号识别,提高了识别的角度鲁棒性和对同类器物中不同型号的物体的识别精度。

Description

基于模型和稀疏表示的多角度型号识别方法及系统
技术领域
本发明涉及多角度的型号识别技术领域,特别涉及一种基于模型和稀疏表示的多角度型号识别方法及系统。
背景技术
随着高新技术的发展和应用,人们能够获取到比以往更丰富的影像数据;基于图像的目标识别应用也日益广泛。同时,随着大规模工业化生产的发展,人们制造出越来越多、具有相同外形及尺寸的大型器物,如汽车、飞机等。由此,目标识别已不局限于大类型,如轿车、飞机等的划分,对某些类型的大型人造器物的型号识别要求也日渐突出。
辞海对“型号”的注解是“机器、工具等的性能、规格和大小。”可见,在图像上能体现的层面上,型号代表了同一类物体间规格、大小的差异。而“规格”,“指一般工业产品的物理形状,包括体积、长度、形状、重量等”;“主要是为了区分类似产品”。而我们关注的大型人造器物,大多具有严格定义的外形及尺寸,并因型号的差异而存在或大或小的差异。
型号识别方法常分为句法方法和决策理论方法两大类。由于一般目标物的结构信息不明显或不易获得,在型号识别应用中多数采用基于统计的决策理论方法。该方法首先通过特征抽取过程将目标从模式(图像)空间映射到特征空间,再映射到决策空间进行分类。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息,可见,在决策理论方法中,特征抽取占有重要的地位,但是,对于差别较小的型号识别而言,这种方法的角度鲁棒性差,识别精度明显下降。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:如何提高识别的角度鲁棒性和型号识别的识别精度,实现多角度的型号识别。
(二)技术方案
为解决上述技术问题,本发明提供了一种基于模型和稀疏表示的多角度型号识别方法,包括以下步骤:
S1:获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;
S2:根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;
S3:根据所述型号信息数据确定所述待识别器物的型号。
优选地,所述预设字典通过以下步骤获得:
S21:获取至少两个已知型号样本的多角度图像,并对每个型号样本的多角度图像分别进行投影变换,以获得每个型号样本的多角度图像的投影;
S22:将每个型号样本的多角度图像的投影分别构成子字典,并将所述子字典组成所述预设字典。
优选地,步骤S21中,设第i个型号样本的第j张图像为aij,通过下列公式进行投影变换,
cij=Ψaij
其中,Ψ为投影矩阵,cij为第i个型号样本的第j张图像的投影,i=1,2,...,k;j=1,2,...,n。
优选地,步骤S1中,设所述待识别器物的图像为Y,通过下列公式进行投影变换,
y=ΨY
其中,Ψ为投影矩阵,y为所述待识别器物的图像的投影。
优选地,步骤S2中,通过下列公式进行计算,以获得所述待识别器物的型号信息数据x,
y=Ax
其中,y为所述待识别器物的图像的投影,A为所述预设字典。
优选地,步骤S2中通过基于正交匹配追踪OMP的计算方法来求解所述待识别器物的型号信息数据x。
优选地,步骤S3中,通过下列公式确定所述待识别器物的型号Identity(y),
Identity ( y ) = arg [ max i ( SCI ( x i ) ) ]
其中, SCI ( x i ) = [ k | | x i | | 1 | | x | | 1 ] / ( k - 1 ) , i = 1,2 , . . . , k , arg为返回函数,用于返回公式中的i;x为所述待识别器物的型号信息数据,xi为第i种类型的型号信息数据,k为总型号数,||||1为1-范数运算符。
本发明还公开了一种基于模型和稀疏表示的多角度型号识别系统,包括:
待识别图像获取模块,用于获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;
型号获得模块,用于根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;
型号确定模块,用于根据所述型号信息数据确定所述待识别器物的型号。
(三)有益效果
本发明通过模型和稀疏表示的方法对任意角度拍摄的待识别器物图像进行型号识别,提高了识别的角度鲁棒性和对同类器物中不同型号的物体的识别精度。
附图说明
图1是按照本发明一种实施方式的基于模型和稀疏表示的多角度型号识别方法的流程图;
图2是用于获取图像的采集模块的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
自然界中的事物大多遵守线性叠加原理。在此前提下,某姿态或状态下某物体的图像可以由已知的它在其他姿态或状态下的图像线性组合得到或逼近。这是基于稀疏表示的型号间模式识别的理论依据。识别的基本问题是利用标记过类别信息的样本将新的测试样本正确归类到所属类别中。这是理想情况。实际中,x可能存在的非零元素可能分散于多个类的位置上,则通过x的统计分布特点可以得到对其归属进行划分识别结果;这就是基于稀疏表示进行模式识别的基本原理。鉴于线性组合和字典的过完备性,当存储的信息足够丰富时,针对微小差异的型号识别就有可能实现。
图1是按照本发明一种实施方式的基于模型和稀疏表示的多角度型号识别方法的流程图;参照图1,本实施方式的方法包括以下步骤:
S1:获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;设所述待识别器物的图像为Y,通过下列公式进行投影变换,
y=ΨY
其中,Ψ为投影矩阵,y为所述待识别器物的图像的投影。
S2:根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;具体通过下列公式进行计算,以获得所述待识别器物的型号信息数据x,
y=Ax
其中,y为所述待识别器物的图像的投影,A为所述预设字典。
优选地,所述预设字典通过以下步骤获得:
S21:获取至少两个已知型号样本的多角度图像,并对每个型号样本的多角度图像分别进行投影变换,以获得每个型号样本的多角度图像的投影;优选地,步骤S21中,设第i个型号样本的第j张图像为aij,通过下列公式进行投影变换,
cij=Ψaij
其中,Ψ为投影矩阵,cij为第i个型号样本的第j张图像的投影,i=1,2,...,k;j=1,2,...,n。
S22:将每个型号样本的多角度图像的投影分别构成子字典,并将所述子字典组成所述预设字典,将给定的第i(i=1,...,k)个型号样本的第j(j=1,...,n)图像的投影作为字典中的列向量,亦称为原子。将第i个型号的原子组合在一起得到第i类对应的子字典
Figure BDA0000137760130000051
假定任意一类i都有足够多样本,即Ai涵盖的信息足够丰富,那么第i个型号样本的任一图像(无论字典中是否存在)y都可以用Ai中的元素线性组合逼近得到,也就是稀疏表示:
y=xi1ai1+xi2ai2+…+xinain;xij∈R,j=1,2,…,ni
优选地,步骤S2中通过基于正交匹配追踪OMP的计算方法来求解所述待识别器物的型号信息数据x。
S3:根据所述型号信息数据确定所述待识别器物的型号。优选地,步骤S3中,通过下列公式确定所述待识别器物的型号Identity(y),
Identity ( y ) = arg [ max i ( SCI ( x i ) ) ]
其中, SCI ( x i ) = [ k | | x i | | 1 | | x | | 1 ] / ( k - 1 ) , i = 1,2 , . . . , k , arg为返回函数,用于返回公式中的i;x为所述待识别器物的型号信息数据,xi为第i种类型的型号信息数据,k为总型号数,||||1为1-范数运算符。
获取待识别器物的图像和至少两个已知型号样本的多角度图像时,采用如图2所示的采集模块,所述采集模块包括:旋转物台、导轨、摄像头、以及处理器,所述摄像头能够根据所述处理器的控制命令在导轨上进行滑动。
实施例1
下面以一个实施例来说明本发明,但不限定本发明的保护范围。本实施例中以4辆车模型:No1(audiA2)、No2(audiA6)、No3(Toyota)和No4(audiA3)为例,即k=4,进行方法验证。验证流程步骤如下:
1、调整摄像头到旋转物台的距离,得到模型车辆No1~4的视频文件;
2、按照一定的角度间隔d度从视频文件中截取生成样本图像库Φ,其中每辆模型车的样本数为n;
3、从视频文件中随机抽取图像作为待识别图像Y,对待识别图像Y进行随机高斯投影转换的方式获得待识别图像的投影y;
4、通过随机高斯投影转换的方式,通过样本图像库Φ生成m×(kn)维的字典矩阵A(即预设字典),m为字典矩阵A中每个原子所包含的信息个数;
5、根据字典矩阵A、以及待识别图像的投影y利用基于正交匹配追踪OMP的方法进行稀疏方程求解,以获得型号信息数据x;
6、根据型号信息数据x在各型号中的集中度SCI(xi),并根据所述集中度确定型号。
根据上述验证流程步骤所获得的结果如下表所示:
Figure BDA0000137760130000061
Figure BDA0000137760130000071
本发明还公开了一种基于模型和稀疏表示的多角度型号识别系统,所述系统包括:
待识别图像获取模块,用于获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;
型号获得模块,用于根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;
型号确定模块,用于根据所述型号信息数据确定所述待识别器物的型号。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (8)

1.一种基于模型和稀疏表示的多角度型号识别方法,其特征在于,包括以下步骤:
S1:获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;
S2:根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;
S3:根据所述型号信息数据确定所述待识别器物的型号。
2.如权利要求1所述的方法,其特征在于,所述预设字典通过以下步骤获得:
S21:获取至少两个已知型号样本的多角度图像,并对每个型号样本的多角度图像分别进行投影变换,以获得每个型号样本的多角度图像的投影;
S22:将每个型号样本的多角度图像的投影分别构成子字典,并将所述子字典组成所述预设字典。
3.如权利要求2所述的方法,其特征在于,步骤S21中,设第i个型号样本的第j张图像为aij,通过下列公式进行投影变换,
cij=Ψaij
其中,Ψ为投影矩阵,cij为第i个型号样本的第j张图像的投影,i=1,2,...,k;j=1,2,...,n。
4.如权利要求1所述的方法,其特征在于,步骤S1中,设所述待识别器物的图像为Y,通过下列公式进行投影变换,
y=ΨY
其中,Ψ为投影矩阵,y为所述待识别器物的图像的投影。
5.如权利要求1所述的方法,其特征在于,步骤S2中,通过下列公式进行计算,以获得所述待识别器物的型号信息数据x,
y=Ax
其中,y为所述待识别器物的图像的投影,A为所述预设字典。
6.如权利要求5所述的方法,其特征在于,步骤S2中通过基于正交匹配追踪OMP的计算方法来求解所述待识别器物的型号信息数据x。
7.如权利要求1所述的方法,其特征在于,步骤S3中,通过下列公式确定所述待识别器物的型号Identity(y),
Identity ( y ) = arg [ max i ( SCI ( x i ) ) ]
其中, SCI ( x i ) = [ k | | x i | | 1 | | x | | 1 ] / ( k - 1 ) , i = 1,2 , . . . , k , arg为返回函数,用于返回公式中的i;x为所述待识别器物的型号信息数据,xi为第i种类型的型号信息数据,k为总型号数,||||1为1-范数运算符。
8.一种基于模型和稀疏表示的多角度型号识别系统,其特征在于,包括:
待识别图像获取模块,用于获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;
型号获得模块,用于根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;
型号确定模块,用于根据所述型号信息数据确定所述待识别器物的型号。
CN2012100438036A 2012-02-23 2012-02-23 基于模型和稀疏表示的多角度型号识别方法及系统 Pending CN102622583A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100438036A CN102622583A (zh) 2012-02-23 2012-02-23 基于模型和稀疏表示的多角度型号识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100438036A CN102622583A (zh) 2012-02-23 2012-02-23 基于模型和稀疏表示的多角度型号识别方法及系统

Publications (1)

Publication Number Publication Date
CN102622583A true CN102622583A (zh) 2012-08-01

Family

ID=46562493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100438036A Pending CN102622583A (zh) 2012-02-23 2012-02-23 基于模型和稀疏表示的多角度型号识别方法及系统

Country Status (1)

Country Link
CN (1) CN102622583A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104615999A (zh) * 2015-02-15 2015-05-13 北京师范大学 基于稀疏表示分类的滑坡泥石流区域检测方法
CN106960370A (zh) * 2016-01-12 2017-07-18 孔令斌 全自动薄膜切割及贩售系统
CN108629366A (zh) * 2018-03-16 2018-10-09 佛山科学技术学院 一种高压线路铁塔的图像识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1202669A (zh) * 1997-06-09 1998-12-23 日本电气株式会社 在线字符识别系统
CN102024152A (zh) * 2010-12-14 2011-04-20 浙江大学 一种基于稀疏表达和字典学习进行交通标志识别的方法
CN102034094A (zh) * 2010-12-14 2011-04-27 浙江大学 一种基于稀疏表示和判决分析的数码球识别方法
CN102073880A (zh) * 2011-01-13 2011-05-25 西安电子科技大学 利用稀疏表示进行人脸识别的集成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1202669A (zh) * 1997-06-09 1998-12-23 日本电气株式会社 在线字符识别系统
CN102024152A (zh) * 2010-12-14 2011-04-20 浙江大学 一种基于稀疏表达和字典学习进行交通标志识别的方法
CN102034094A (zh) * 2010-12-14 2011-04-27 浙江大学 一种基于稀疏表示和判决分析的数码球识别方法
CN102073880A (zh) * 2011-01-13 2011-05-25 西安电子科技大学 利用稀疏表示进行人脸识别的集成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
熊英: "《清华大学综合论文训练》", 30 June 2010, article "基于Lasso的人脸识别算法", pages: 27-28 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104615999A (zh) * 2015-02-15 2015-05-13 北京师范大学 基于稀疏表示分类的滑坡泥石流区域检测方法
CN104615999B (zh) * 2015-02-15 2017-11-07 北京师范大学 基于稀疏表示分类的滑坡泥石流区域检测方法
CN106960370A (zh) * 2016-01-12 2017-07-18 孔令斌 全自动薄膜切割及贩售系统
CN108629366A (zh) * 2018-03-16 2018-10-09 佛山科学技术学院 一种高压线路铁塔的图像识别方法

Similar Documents

Publication Publication Date Title
CN109947793B (zh) 伴随关系的分析方法、装置和存储介质
CN103400105B (zh) 一种姿态归一化的非正面人脸表情识别方法
Druzhkov et al. New object detection features in the OpenCV library
Lin et al. Recognition and pose estimation of auto parts for an autonomous spray painting robot
CN107092829B (zh) 一种基于图像匹配的恶意代码检测方法
CN103246884B (zh) 基于深度图像序列的实时人体动作识别方法及装置
CN103164701B (zh) 手写体数字识别方法及装置
CN103562993B (zh) 说话人识别方法及设备
CN103954935A (zh) 一种最小l1范数下的雷达信号分选方法
CN103941244B (zh) 一种雷达目标一维距离像局部最优子空间识别方法
CN103675787A (zh) 一种雷达目标一维距离像最优正交非线性子空间识别方法
CN105956560A (zh) 一种基于池化多尺度深度卷积特征的车型识别方法
CN101882150B (zh) 一种基于核密度估计的三维模型比较和检索方法
CN103295032B (zh) 基于空间Fisher向量的图像分类方法
CN110929538A (zh) 具有基准标记的对象定位器
CN105930873A (zh) 一种基于子空间的自步跨模态匹配方法
CN105930859B (zh) 基于线性流形聚类的雷达信号分选方法
JP2016014954A (ja) 手指形状の検出方法、そのプログラム、そのプログラムの記憶媒体、及び、手指の形状を検出するシステム。
CN102622583A (zh) 基于模型和稀疏表示的多角度型号识别方法及系统
CN103839074A (zh) 一种基于素描线段信息和空间金字塔匹配的图像分类方法
CN103309448A (zh) 一种加入符号序列匹配的基于三维加速度的手势识别方法
CN106127223A (zh) 一种基于万有引力定律的分类方法
CN102968622B (zh) 一种台标识别方法以及台标识别装置
CN103258211A (zh) 一种手写体数字识别方法和系统
Ghosh et al. Automated color logo recognition system based on shape and color features

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20120801

RJ01 Rejection of invention patent application after publication