CN102622583A - 基于模型和稀疏表示的多角度型号识别方法及系统 - Google Patents
基于模型和稀疏表示的多角度型号识别方法及系统 Download PDFInfo
- Publication number
- CN102622583A CN102622583A CN2012100438036A CN201210043803A CN102622583A CN 102622583 A CN102622583 A CN 102622583A CN 2012100438036 A CN2012100438036 A CN 2012100438036A CN 201210043803 A CN201210043803 A CN 201210043803A CN 102622583 A CN102622583 A CN 102622583A
- Authority
- CN
- China
- Prior art keywords
- recognized
- model
- image
- projection
- information data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000009466 transformation Effects 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于模型和稀疏表示的多角度型号识别方法及系统,涉及型号识别技术领域,所述方法包括:S1:获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;S2:根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;S3:根据所述型号信息数据确定所述待识别器物的型号。本发明通过模型和稀疏表示的方法对任意角度拍摄的待识别器物图像进行型号识别,提高了识别的角度鲁棒性和对同类器物中不同型号的物体的识别精度。
Description
技术领域
本发明涉及多角度的型号识别技术领域,特别涉及一种基于模型和稀疏表示的多角度型号识别方法及系统。
背景技术
随着高新技术的发展和应用,人们能够获取到比以往更丰富的影像数据;基于图像的目标识别应用也日益广泛。同时,随着大规模工业化生产的发展,人们制造出越来越多、具有相同外形及尺寸的大型器物,如汽车、飞机等。由此,目标识别已不局限于大类型,如轿车、飞机等的划分,对某些类型的大型人造器物的型号识别要求也日渐突出。
辞海对“型号”的注解是“机器、工具等的性能、规格和大小。”可见,在图像上能体现的层面上,型号代表了同一类物体间规格、大小的差异。而“规格”,“指一般工业产品的物理形状,包括体积、长度、形状、重量等”;“主要是为了区分类似产品”。而我们关注的大型人造器物,大多具有严格定义的外形及尺寸,并因型号的差异而存在或大或小的差异。
型号识别方法常分为句法方法和决策理论方法两大类。由于一般目标物的结构信息不明显或不易获得,在型号识别应用中多数采用基于统计的决策理论方法。该方法首先通过特征抽取过程将目标从模式(图像)空间映射到特征空间,再映射到决策空间进行分类。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息,可见,在决策理论方法中,特征抽取占有重要的地位,但是,对于差别较小的型号识别而言,这种方法的角度鲁棒性差,识别精度明显下降。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:如何提高识别的角度鲁棒性和型号识别的识别精度,实现多角度的型号识别。
(二)技术方案
为解决上述技术问题,本发明提供了一种基于模型和稀疏表示的多角度型号识别方法,包括以下步骤:
S1:获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;
S2:根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;
S3:根据所述型号信息数据确定所述待识别器物的型号。
优选地,所述预设字典通过以下步骤获得:
S21:获取至少两个已知型号样本的多角度图像,并对每个型号样本的多角度图像分别进行投影变换,以获得每个型号样本的多角度图像的投影;
S22:将每个型号样本的多角度图像的投影分别构成子字典,并将所述子字典组成所述预设字典。
优选地,步骤S21中,设第i个型号样本的第j张图像为aij,通过下列公式进行投影变换,
cij=Ψaij
其中,Ψ为投影矩阵,cij为第i个型号样本的第j张图像的投影,i=1,2,...,k;j=1,2,...,n。
优选地,步骤S1中,设所述待识别器物的图像为Y,通过下列公式进行投影变换,
y=ΨY
其中,Ψ为投影矩阵,y为所述待识别器物的图像的投影。
优选地,步骤S2中,通过下列公式进行计算,以获得所述待识别器物的型号信息数据x,
y=Ax
其中,y为所述待识别器物的图像的投影,A为所述预设字典。
优选地,步骤S2中通过基于正交匹配追踪OMP的计算方法来求解所述待识别器物的型号信息数据x。
优选地,步骤S3中,通过下列公式确定所述待识别器物的型号Identity(y),
其中, arg为返回函数,用于返回公式中的i;x为所述待识别器物的型号信息数据,xi为第i种类型的型号信息数据,k为总型号数,||||1为1-范数运算符。
本发明还公开了一种基于模型和稀疏表示的多角度型号识别系统,包括:
待识别图像获取模块,用于获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;
型号获得模块,用于根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;
型号确定模块,用于根据所述型号信息数据确定所述待识别器物的型号。
(三)有益效果
本发明通过模型和稀疏表示的方法对任意角度拍摄的待识别器物图像进行型号识别,提高了识别的角度鲁棒性和对同类器物中不同型号的物体的识别精度。
附图说明
图1是按照本发明一种实施方式的基于模型和稀疏表示的多角度型号识别方法的流程图;
图2是用于获取图像的采集模块的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
自然界中的事物大多遵守线性叠加原理。在此前提下,某姿态或状态下某物体的图像可以由已知的它在其他姿态或状态下的图像线性组合得到或逼近。这是基于稀疏表示的型号间模式识别的理论依据。识别的基本问题是利用标记过类别信息的样本将新的测试样本正确归类到所属类别中。这是理想情况。实际中,x可能存在的非零元素可能分散于多个类的位置上,则通过x的统计分布特点可以得到对其归属进行划分识别结果;这就是基于稀疏表示进行模式识别的基本原理。鉴于线性组合和字典的过完备性,当存储的信息足够丰富时,针对微小差异的型号识别就有可能实现。
图1是按照本发明一种实施方式的基于模型和稀疏表示的多角度型号识别方法的流程图;参照图1,本实施方式的方法包括以下步骤:
S1:获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;设所述待识别器物的图像为Y,通过下列公式进行投影变换,
y=ΨY
其中,Ψ为投影矩阵,y为所述待识别器物的图像的投影。
S2:根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;具体通过下列公式进行计算,以获得所述待识别器物的型号信息数据x,
y=Ax
其中,y为所述待识别器物的图像的投影,A为所述预设字典。
优选地,所述预设字典通过以下步骤获得:
S21:获取至少两个已知型号样本的多角度图像,并对每个型号样本的多角度图像分别进行投影变换,以获得每个型号样本的多角度图像的投影;优选地,步骤S21中,设第i个型号样本的第j张图像为aij,通过下列公式进行投影变换,
cij=Ψaij
其中,Ψ为投影矩阵,cij为第i个型号样本的第j张图像的投影,i=1,2,...,k;j=1,2,...,n。
S22:将每个型号样本的多角度图像的投影分别构成子字典,并将所述子字典组成所述预设字典,将给定的第i(i=1,...,k)个型号样本的第j(j=1,...,n)图像的投影作为字典中的列向量,亦称为原子。将第i个型号的原子组合在一起得到第i类对应的子字典假定任意一类i都有足够多样本,即Ai涵盖的信息足够丰富,那么第i个型号样本的任一图像(无论字典中是否存在)y都可以用Ai中的元素线性组合逼近得到,也就是稀疏表示:
y=xi1ai1+xi2ai2+…+xinain;xij∈R,j=1,2,…,ni
优选地,步骤S2中通过基于正交匹配追踪OMP的计算方法来求解所述待识别器物的型号信息数据x。
S3:根据所述型号信息数据确定所述待识别器物的型号。优选地,步骤S3中,通过下列公式确定所述待识别器物的型号Identity(y),
其中, arg为返回函数,用于返回公式中的i;x为所述待识别器物的型号信息数据,xi为第i种类型的型号信息数据,k为总型号数,||||1为1-范数运算符。
获取待识别器物的图像和至少两个已知型号样本的多角度图像时,采用如图2所示的采集模块,所述采集模块包括:旋转物台、导轨、摄像头、以及处理器,所述摄像头能够根据所述处理器的控制命令在导轨上进行滑动。
实施例1
下面以一个实施例来说明本发明,但不限定本发明的保护范围。本实施例中以4辆车模型:No1(audiA2)、No2(audiA6)、No3(Toyota)和No4(audiA3)为例,即k=4,进行方法验证。验证流程步骤如下:
1、调整摄像头到旋转物台的距离,得到模型车辆No1~4的视频文件;
2、按照一定的角度间隔d度从视频文件中截取生成样本图像库Φ,其中每辆模型车的样本数为n;
3、从视频文件中随机抽取图像作为待识别图像Y,对待识别图像Y进行随机高斯投影转换的方式获得待识别图像的投影y;
4、通过随机高斯投影转换的方式,通过样本图像库Φ生成m×(kn)维的字典矩阵A(即预设字典),m为字典矩阵A中每个原子所包含的信息个数;
5、根据字典矩阵A、以及待识别图像的投影y利用基于正交匹配追踪OMP的方法进行稀疏方程求解,以获得型号信息数据x;
6、根据型号信息数据x在各型号中的集中度SCI(xi),并根据所述集中度确定型号。
根据上述验证流程步骤所获得的结果如下表所示:
本发明还公开了一种基于模型和稀疏表示的多角度型号识别系统,所述系统包括:
待识别图像获取模块,用于获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;
型号获得模块,用于根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;
型号确定模块,用于根据所述型号信息数据确定所述待识别器物的型号。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
Claims (8)
1.一种基于模型和稀疏表示的多角度型号识别方法,其特征在于,包括以下步骤:
S1:获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;
S2:根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;
S3:根据所述型号信息数据确定所述待识别器物的型号。
2.如权利要求1所述的方法,其特征在于,所述预设字典通过以下步骤获得:
S21:获取至少两个已知型号样本的多角度图像,并对每个型号样本的多角度图像分别进行投影变换,以获得每个型号样本的多角度图像的投影;
S22:将每个型号样本的多角度图像的投影分别构成子字典,并将所述子字典组成所述预设字典。
3.如权利要求2所述的方法,其特征在于,步骤S21中,设第i个型号样本的第j张图像为aij,通过下列公式进行投影变换,
cij=Ψaij
其中,Ψ为投影矩阵,cij为第i个型号样本的第j张图像的投影,i=1,2,...,k;j=1,2,...,n。
4.如权利要求1所述的方法,其特征在于,步骤S1中,设所述待识别器物的图像为Y,通过下列公式进行投影变换,
y=ΨY
其中,Ψ为投影矩阵,y为所述待识别器物的图像的投影。
5.如权利要求1所述的方法,其特征在于,步骤S2中,通过下列公式进行计算,以获得所述待识别器物的型号信息数据x,
y=Ax
其中,y为所述待识别器物的图像的投影,A为所述预设字典。
6.如权利要求5所述的方法,其特征在于,步骤S2中通过基于正交匹配追踪OMP的计算方法来求解所述待识别器物的型号信息数据x。
7.如权利要求1所述的方法,其特征在于,步骤S3中,通过下列公式确定所述待识别器物的型号Identity(y),
其中, arg为返回函数,用于返回公式中的i;x为所述待识别器物的型号信息数据,xi为第i种类型的型号信息数据,k为总型号数,||||1为1-范数运算符。
8.一种基于模型和稀疏表示的多角度型号识别系统,其特征在于,包括:
待识别图像获取模块,用于获取待识别器物的图像,并对所述待识别器物的图像进行投影变换,以获得所述待识别器物的图像的投影;
型号获得模块,用于根据预设字典和所述待识别器物的图像的投影进行稀疏方程求解,以获得所述待识别器物的型号信息数据;
型号确定模块,用于根据所述型号信息数据确定所述待识别器物的型号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100438036A CN102622583A (zh) | 2012-02-23 | 2012-02-23 | 基于模型和稀疏表示的多角度型号识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100438036A CN102622583A (zh) | 2012-02-23 | 2012-02-23 | 基于模型和稀疏表示的多角度型号识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102622583A true CN102622583A (zh) | 2012-08-01 |
Family
ID=46562493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012100438036A Pending CN102622583A (zh) | 2012-02-23 | 2012-02-23 | 基于模型和稀疏表示的多角度型号识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102622583A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104615999A (zh) * | 2015-02-15 | 2015-05-13 | 北京师范大学 | 基于稀疏表示分类的滑坡泥石流区域检测方法 |
CN106960370A (zh) * | 2016-01-12 | 2017-07-18 | 孔令斌 | 全自动薄膜切割及贩售系统 |
CN108629366A (zh) * | 2018-03-16 | 2018-10-09 | 佛山科学技术学院 | 一种高压线路铁塔的图像识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1202669A (zh) * | 1997-06-09 | 1998-12-23 | 日本电气株式会社 | 在线字符识别系统 |
CN102024152A (zh) * | 2010-12-14 | 2011-04-20 | 浙江大学 | 一种基于稀疏表达和字典学习进行交通标志识别的方法 |
CN102034094A (zh) * | 2010-12-14 | 2011-04-27 | 浙江大学 | 一种基于稀疏表示和判决分析的数码球识别方法 |
CN102073880A (zh) * | 2011-01-13 | 2011-05-25 | 西安电子科技大学 | 利用稀疏表示进行人脸识别的集成方法 |
-
2012
- 2012-02-23 CN CN2012100438036A patent/CN102622583A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1202669A (zh) * | 1997-06-09 | 1998-12-23 | 日本电气株式会社 | 在线字符识别系统 |
CN102024152A (zh) * | 2010-12-14 | 2011-04-20 | 浙江大学 | 一种基于稀疏表达和字典学习进行交通标志识别的方法 |
CN102034094A (zh) * | 2010-12-14 | 2011-04-27 | 浙江大学 | 一种基于稀疏表示和判决分析的数码球识别方法 |
CN102073880A (zh) * | 2011-01-13 | 2011-05-25 | 西安电子科技大学 | 利用稀疏表示进行人脸识别的集成方法 |
Non-Patent Citations (1)
Title |
---|
熊英: "《清华大学综合论文训练》", 30 June 2010, article "基于Lasso的人脸识别算法", pages: 27-28 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104615999A (zh) * | 2015-02-15 | 2015-05-13 | 北京师范大学 | 基于稀疏表示分类的滑坡泥石流区域检测方法 |
CN104615999B (zh) * | 2015-02-15 | 2017-11-07 | 北京师范大学 | 基于稀疏表示分类的滑坡泥石流区域检测方法 |
CN106960370A (zh) * | 2016-01-12 | 2017-07-18 | 孔令斌 | 全自动薄膜切割及贩售系统 |
CN108629366A (zh) * | 2018-03-16 | 2018-10-09 | 佛山科学技术学院 | 一种高压线路铁塔的图像识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ohn-Bar et al. | Learning to detect vehicles by clustering appearance patterns | |
Lin et al. | Recognition and pose estimation of auto parts for an autonomous spray painting robot | |
US8412730B2 (en) | Image search apparatus and method thereof | |
CN105335702B (zh) | 一种基于统计学习的卡口车型识别方法 | |
Druzhkov et al. | New object detection features in the OpenCV library | |
CN104715266B (zh) | 基于src‑dp与lda相结合的图像特征提取方法 | |
CN102930300B (zh) | 一种飞机目标识别方法及系统 | |
CN103020640A (zh) | 基于二维主成分分析法的人脸图像降维分类方法 | |
CN105844261A (zh) | 基于优化特征投影矩阵的3d掌纹稀疏表示识别方法 | |
CN103295032B (zh) | 基于空间Fisher向量的图像分类方法 | |
US20130114858A1 (en) | Method for Detecting a Target in Stereoscopic Images by Learning and Statistical Classification on the Basis of a Probability Law | |
CN104036296B (zh) | 一种图像的表示和处理方法及装置 | |
Redondo-Cabrera et al. | All together now: Simultaneous object detection and continuous pose estimation using a hough forest with probabilistic locally enhanced voting | |
CN109284705A (zh) | 一种交通监控视频的异常检测方法 | |
CN103971112A (zh) | 图像特征提取方法及装置 | |
CN101882150A (zh) | 一种基于核密度估计的三维模型比较和检索方法 | |
CN115797970B (zh) | 基于YOLOv5模型的密集行人目标检测方法及系统 | |
CN104794498A (zh) | 基于src与mfa相结合的图像分类方法 | |
CN110826415A (zh) | 一种场景图像中车辆的重识别方法及设备 | |
CN105354533A (zh) | 一种基于词袋模型的卡口无牌车辆车型识别方法 | |
Shao et al. | A deep learning-based semantic filter for RANSAC-based fundamental matrix calculation and the ORB-SLAM system | |
CN102622583A (zh) | 基于模型和稀疏表示的多角度型号识别方法及系统 | |
Yi et al. | A robust eye localization method for low quality face images | |
CN117152625A (zh) | 一种基于CoordConv和YOLOv5的遥感小目标识别方法、系统、设备及介质 | |
US8724890B2 (en) | Vision-based object detection by part-based feature synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20120801 |
|
RJ01 | Rejection of invention patent application after publication |