CN103049760A - 基于图像分块和位置加权的稀疏表示目标识别方法 - Google Patents

基于图像分块和位置加权的稀疏表示目标识别方法 Download PDF

Info

Publication number
CN103049760A
CN103049760A CN2012105816869A CN201210581686A CN103049760A CN 103049760 A CN103049760 A CN 103049760A CN 2012105816869 A CN2012105816869 A CN 2012105816869A CN 201210581686 A CN201210581686 A CN 201210581686A CN 103049760 A CN103049760 A CN 103049760A
Authority
CN
China
Prior art keywords
image
image block
sample image
recognition
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105816869A
Other languages
English (en)
Other versions
CN103049760B (zh
Inventor
何珺
孙波
吴学文
葛凤祥
余乐军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Normal University
Original Assignee
Beijing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University filed Critical Beijing Normal University
Priority to CN201210581686.9A priority Critical patent/CN103049760B/zh
Publication of CN103049760A publication Critical patent/CN103049760A/zh
Application granted granted Critical
Publication of CN103049760B publication Critical patent/CN103049760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及模式识别技术领域,公开了一种基于图像分块和位置加权的稀疏表示目标识别方法,所述方法包括以下步骤:S1、获取样本图像库,并对所述样本图像库中的样本图像进行图像分割,得到样本图像块库;S2、根据样本图像块库中各样本图像块的位置序号和稀疏表示误差,求得识别字典和位置权重向量;S3、根据所述识别字典和位置权重向量设计分类器;S4、逐像素地分割待识别图像,得到待识别图像块集;S5、对所述待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用所述分类器对待识别图像块进行类型识别。本发明能够用于识别外观不完整的物体。

Description

基于图像分块和位置加权的稀疏表示目标识别方法
技术领域
本发明涉及模式识别技术领域,特别是涉及一种基于图像分块和位置加权的稀疏表示目标识别方法。
背景技术
基于稀疏表示的分类(SRC)方法是一种像素级对齐方法,其遵循自然界中普遍适用的线性组合原理。
SRC方法的原理是:假设目标物在某种姿态下的图像,即测试对象可以用它在其他姿态下图像的线性组合表示或近似,然后根据测试对象相对于整个训练集的稀疏表示系数,得到测试对象的类别归属。可见,待测图像与训练字典的图像样本的相似性越高,SRC方法的适用效果就越好。
SRC方法的应用有如下特点:(1)基于整体的识别率与图像样本的选取密切相关;需要根据应用条件,适当选取图像样本。(2)识别与特征无关。识别(或分类)的依据是各原子在线性组合中的统计关系,即求解稀疏方程,根据解的分布等统计特点进行类型或目标判别。
而人脸识别(Face Recoginition,FR)的目标物不是脸,而是具有主动性的人,旨在判定某一幅人脸图像对应或属于某一个人。相比而言,刚性物体,如汽车、飞机、舰船等不但具有较好的外形稳定性,其外形及其细节即为类型或型号的区分依据;而且常为人造物体,不具智能性,表现为对摄像设备的不合作性,识别应用的随机性较强。
结合SRC方法的原理和步骤,为了在对刚性目标物的识别应用中获得较好的效果,需要从图像样本中获取更多的目标物细节,并以不同视角(水平或俯仰视角)、不同目标比例、不同尺度以及不同光照下的图像样本为基础构建或训练识别字典。由此,与FR相比,SRC方法在刚性物体的识别应用中存在的问题可归纳为:
(1)基于海量样本构建或训练识别字典
为了保留最多的细节,涵盖更多可能的环境条件,构建或训练识别字典所依据的图像样本将是海量的,也不同于FR应用。因此,利用SRC方法识别刚性目标物首要解决的问题是:以何为依据以及如何能从海量图像样本筛选得到有效样本,从而构建或训练得到高效的识别字典。
(2)目标物的对齐或定位
一般地,目标识别的第一步是图像的对齐或定位。该应用中,待测图像较高的随机性使对齐或定位较FR中困难,尤其刚性目标物并无统一的特征可循。因此,利用SRC方法识别刚性目标物时需要解决目标物的对齐或定位问题。
SRC方法应用研究多集中在人脸、文字和纹理等识别领域,识别效果较好,但是对刚性物体,尤其是外观不完整的刚性物体进行识别时,结果则不甚理想。
发明内容
(一)要解决的技术问题
本发明首先要解决的技术问题是:如何提供一种能够识别外观不完整的物体的图像识别方法。
(二)技术方案
为了解决上述技术问题,本发明提供一种基于图像分块和位置加权的稀疏表示目标识别方法,所述方法包括以下步骤:
S1、获取样本图像库,并对所述样本图像库中的样本图像进行图像分割,得到样本图像块库;
S2、根据样本图像块库中各样本图像块的位置序号和稀疏表示误差,求得识别字典和位置权重向量;
S3、根据所述识别字典和位置权重向量设计分类器;
S4、逐像素地分割待识别图像,得到待识别图像块集;
S5、对所述待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用所述分类器对待识别图像块进行类型识别。
优选地,步骤S1中,在同一尺度、相同环境下,从不同角度分别获取多个目标物体的多个图像,并将所获取的多个图像进行中心化对齐,形成所述样本图像库,利用图像块分割窗口对所述样本图像库中的样本图像进行分割,得到多个相同大小的所述样本图像块。
优选地,步骤S4具体为:利用所述图像块分割窗口对待识别图像逐像素地进行图像分割,得到多个相同大小的待识别图像块。
优选地,步骤S5中,求解稀疏方程后,首先根据所述稀疏方程的解的稀疏程度剔除所述待识别图像块中不属于所述识别字典的待识别图像块,然后再根据所述稀疏方程的解,利用所述分类器进行类型识别。
优选地,利用贪婪算法求解所述稀疏方程。
优选地,所述待识别目标物体为外观不完整的目标物体。
(三)有益效果
上述技术方案具有如下优点:本发明通过对待识别图像进行图像分割,得到待识别图像块,然后对待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用分类器对待识别图像块进行类型识别的方法,能够用于识别外观不完整的物体。
附图说明
图1是本发明的方法流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本发明提供一种基于图像分块和位置加权的稀疏表示目标识别方法,所述方法包括以下步骤:
S1、获取样本图像库,并对所述样本图像库中的样本图像进行图像分割与筛选,在一定的稀疏表示误差范围内,筛选出最少的图像块表示全部的样本图像,从而得到样本图像块库;
步骤S1中,在同一尺度、相同环境下,从N个不同角度分别获取P类目标物体(每一类目标物体为一个)的多个图像,并将所获取的多个图像进行中心化对齐,从而得到样本图像库I={Iij|i∈T;j∈J},其中T={1,2,...,P}和J={1,2,...,N}分别为目标物种类和样本图像标号集,P、N为正整数。按一定的顺序(如设左上起始,向下向右依次编号)利用图像块分割窗口对所述样本图像库中的样本图像进行分割,得到多个m个相同大小的所述样本图像块Bijk,其中下标k∈L为该块在图像Iij上的位置序号,L={1,2,...,m}为位置序号集,m为正整数。
为了表述方便,定义操作符dB表示矩阵列向量。那么,BijkdB表示在位置序号为k处抽取一定大小的图像块并列向量化为块字典DB的一列,即一个原子。于是,利用取自样本图像库中的某一类的不同图像上不同位置的图像块,可线性组合得到:
y = Σ j ∈ J Σ k ∈ L B ijk d B x ijk - - - ( 1 )
基于上述定义,我们要在较好地表示全部图像的前提下筛选出最少的图像块,相应的目标函数可写为:
min | J | , min | L | s . t . arg B ijk ( Σ i = 1 P | | y i - Σ j ∈ J Σ k ∈ L B ijk d B x ijk | | 2 2 ≤ ϵ c 2 ) - - - ( 2 )
其中 y i = Σ j = 1 N Σ k = 1 m B ijk d B
其中,yi为第i类物体的样本图像库中的所有图像块;xijk为各原子在对yi的线性表示中的系数,即为稀疏方程解;
Figure BDA00002667630600044
为设定的筛选误差阈值。
S2、根据样本图像块库中各样本图像块的位置序号和稀疏表示误差,求得识别字典和位置权重向量;
步骤S2具体为:
对P个目标物,设计如下的识别字典(为矩阵)构建及各原子(识别字典矩阵中的每一列称为一个原子)的位置权重向量计算的步骤:
对每个物体循环执行下面的步骤(1)~(3)。
(1)对第i(i=1…P)个物体,初始化识别字典Dio1和位置权重向量Mio1(下标o表示原始结果):
(a)任取属于同一幅样本图像Ii1的m个图像块,经随机高斯投影初始化目标字典Dio1
Dio1=[Bi11dB,...,Bi1kdB,...,Bi1mdB](3)
(b)按照位置序号将对位置权重向量进行初始化,即各位置序号的初始权重均为0:Mio1=[mi11,mi12,...,mi1m]T=0,各元素与图像块一一对应。
(c)令r=1。
(2)循环操作,更新识别字典Dior和位置权重向量Mior
利用识别字典Dior稀疏表示Bi(r+1)k∈Ii(r+1),根据稀疏表示误差更新得到原始识别字典Dio(r+1)和原始位置权重向量Mio(r+1);其中,r∈J′,J′={1,2,...,N-1}表示待筛选样本图像标号。
(a)首先利用Dior求Bi(r+1)k(k=1,2,....,M)的稀疏表示误差
ϵ i ( r + 1 ) k 2 = | | B i ( r + 1 ) k d B - Σ k ∈ L B irk d B x i ( r + 1 ) k | | 2 2 , (k=1,2,…,m)           (4)
(b)若 ϵ i ( r + 1 ) k 2 > ϵ c 2 ,
Dio(r+1)=[Dior,Bi(r+1)kdB]且mi(r+1)k=mirk+1            (5)
否则Dio(r+1)=Dior且mi(r+1)k=mirk
(c)若r≤N-1,则r=r+1,继续循环;否则退出本步骤的循环,
并得到基于样本图像块的原始识别字典和原始位置权重向量:
Dio=DioN和Mio=Miom=[mi1,...,mim]T         (6)
(3)构建第i类物体的识别字典Di和位置权重向量Mi设定筛选频率阈值mc,得到Mi=mi1,...mij...mim]T满足mij>mc,及其对应的字典Di=[Bi11dB,...,BijkdB...BiNmdB],即从原始字典Dio中筛选出出现次数高于mc的原子,得到各字典Di及其位置权重向量Mi
(4)组合得到P类目标物的识别字典和位置权重向量
D=[D1,...,DP],M=[M1,...,MP]         (7)
S3、根据所述识别字典和位置权重向量设计分类器;
基于位置权重向量M设计如下的分类器:
type = arg max i ( Σ t m ij ) , 其中mij∈M           (8)
其中,ij为待测图像块的识别结果。求解基于第t个待测图像块yt和识别字典D的稀疏方程yt=DX,将解元素xij∈X代入(9)式得到t:
t t = arg max ij ( min | | y t - Σ i = 1 P Dx ij | | 2 ) - - - ( 9 )
那么,tt=ij表示第t个待测图像块与第i个目标物的第j个位置序号上的图像块相似性最高,最可能落在第i个目标物的第j个位置上。
S4、逐像素地分割待识别图像,得到待识别图像块集;
步骤S4具体为:利用图像块分割窗口对同尺度的待识别目标物体(为外观不完整的目标物体)的图像逐像素地进行图像分割,得到多个相同大小的所述待识别图像块。
S5、利用贪婪算法求解对所述待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用所述分类器对待识别图像块进行类型识别。
步骤S5中,求解稀疏方程后,首先根据所述稀疏方程的解x的稀疏程度剔除所述待识别图像块中不属于所述识别字典的待识别图像块,然后再根据所述稀疏方程的解,利用所述分类器对剩余的待识别图像块进行类型识别。
利用稀疏解x求稀疏程度的公式为:
SCI ( x i ) = - 1 / ( P - 1 ) fori = 1 , . . . , k P | | x i | | 1 | | x | | 1 - - - ( 10 )
其中,k表示待识别图像块的位置序号,xi表示稀疏解x中的第i个元素,稀疏解x为列向量。
若SCI(xi)>τc,则 t t = arg max ij ( min | | y t - Σ i = 1 P Dx ij | | 2 ) 否则ti=0,即该图像块不属于字典中的任何一个类;τc表示预设稀疏程度阈值。
将ti代入(9)式得到最后的识别结果。
在MATLAB R2010下模拟本发明的方法,对每种汽车模型获取132张样本图像,构造4个目标物体的识别字典和位置权重向量,再逐一应用于待识别图像块。实验结果表明,本发明的方法依然适用于完整的目标图像,同时对部分、不完整或者有俯仰偏差的目标物体也表现出较好的识别性能。
由以上实施例可以看出,本发明通过对待识别图像进行图像分割,得到待识别图像块,然后对待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用分类器对待识别图像块进行类型识别的方法,能够用于识别外观不完整的物体。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。

Claims (6)

1.一种基于图像分块和位置加权的稀疏表示目标识别方法,其特征在于,所述方法包括以下步骤:
S1、获取样本图像库,并对所述样本图像库中的样本图像进行图像分割,得到样本图像块库;
S2、根据样本图像块库中各样本图像块的位置序号和稀疏表示误差,求得识别字典和位置权重向量;
S3、根据所述识别字典和位置权重向量设计分类器;
S4、逐像素地分割待识别图像,得到待识别图像块集;
S5、对待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用所述分类器对待识别图像块进行类型识别。
2.如权利要求1所述的方法,其特征在于,步骤S1中,在同一尺度、相同环境下,从不同角度分别获取多个目标物体的多个图像,并将所获取的多个图像进行中心化对齐,形成所述样本图像库,利用图像块分割窗口对所述样本图像库中的样本图像进行分割,得到多个相同大小的所述样本图像块。
3.如权利要求2所述的方法,其特征在于,步骤S4具体为:利用所述图像块分割窗口对待识别图像逐像素地进行图像分割,得到多个相同大小的待识别图像块。
4.如权利要求1所述的方法,其特征在于,步骤S5中,求解稀疏方程后,首先根据所述稀疏方程的解的稀疏程度剔除所述待识别图像块中不属于所述识别字典的待识别图像块,然后再根据所述稀疏方程的解,利用所述分类器进行类型识别。
5.如权利要求1所述的方法,其特征在于,利用贪婪算法求解所述稀疏方程。
6.如权利要求1~5中任一项所述的方法,其特征在于,所述待识别目标物体为外观不完整的目标物体。
CN201210581686.9A 2012-12-27 2012-12-27 基于图像分块和位置加权的稀疏表示目标识别方法 Active CN103049760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210581686.9A CN103049760B (zh) 2012-12-27 2012-12-27 基于图像分块和位置加权的稀疏表示目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210581686.9A CN103049760B (zh) 2012-12-27 2012-12-27 基于图像分块和位置加权的稀疏表示目标识别方法

Publications (2)

Publication Number Publication Date
CN103049760A true CN103049760A (zh) 2013-04-17
CN103049760B CN103049760B (zh) 2016-05-18

Family

ID=48062392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210581686.9A Active CN103049760B (zh) 2012-12-27 2012-12-27 基于图像分块和位置加权的稀疏表示目标识别方法

Country Status (1)

Country Link
CN (1) CN103049760B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268607A (zh) * 2013-05-15 2013-08-28 电子科技大学 一种弱监督条件下的共同对象检测方法
CN103942531A (zh) * 2014-03-06 2014-07-23 中南民族大学 一种人脸识别系统及其方法
CN104615999A (zh) * 2015-02-15 2015-05-13 北京师范大学 基于稀疏表示分类的滑坡泥石流区域检测方法
CN104732186A (zh) * 2013-12-18 2015-06-24 南京理工大学 基于局部子空间稀疏表示的单样本人脸识别方法
CN105144239A (zh) * 2013-04-26 2015-12-09 奥林巴斯株式会社 图像处理装置、程序及图像处理方法
CN105590088A (zh) * 2015-09-17 2016-05-18 重庆大学 一种基于稀疏自编码和稀疏表示进行交通标志识别的方法
CN109492610A (zh) * 2018-11-27 2019-03-19 广东工业大学 一种行人重识别方法、装置及可读存储介质
CN112600994A (zh) * 2020-12-02 2021-04-02 达闼机器人有限公司 物体探测装置、方法、存储介质和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110229045A1 (en) * 2010-03-16 2011-09-22 Nec Laboratories America, Inc. Method and system for image classification
CN102436589A (zh) * 2010-09-29 2012-05-02 中国科学院电子学研究所 一种基于多类基元自主学习的复杂目标自动识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110229045A1 (en) * 2010-03-16 2011-09-22 Nec Laboratories America, Inc. Method and system for image classification
CN102436589A (zh) * 2010-09-29 2012-05-02 中国科学院电子学研究所 一种基于多类基元自主学习的复杂目标自动识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIAN LAI等: "Modular Weighted Global Sparse Representation for Robust Face Recognition", 《IEEE SIGNAL PROCESSING LETTERS》, vol. 19, no. 9, 30 September 2012 (2012-09-30), pages 571 - 574, XP011453331, DOI: doi:10.1109/LSP.2012.2207112 *
杨清山等: "基于Gabor多通道加权优化与稀疏表征的人脸识别方法", 《电子与信息学报》, vol. 33, no. 7, 31 July 2011 (2011-07-31) *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105144239A (zh) * 2013-04-26 2015-12-09 奥林巴斯株式会社 图像处理装置、程序及图像处理方法
CN103268607A (zh) * 2013-05-15 2013-08-28 电子科技大学 一种弱监督条件下的共同对象检测方法
CN103268607B (zh) * 2013-05-15 2016-10-12 电子科技大学 一种弱监督条件下的共同对象检测方法
CN104732186A (zh) * 2013-12-18 2015-06-24 南京理工大学 基于局部子空间稀疏表示的单样本人脸识别方法
CN104732186B (zh) * 2013-12-18 2018-03-09 南京理工大学 基于局部子空间稀疏表示的单样本人脸识别方法
CN103942531A (zh) * 2014-03-06 2014-07-23 中南民族大学 一种人脸识别系统及其方法
CN103942531B (zh) * 2014-03-06 2017-03-29 中南民族大学 一种人脸识别系统及其方法
CN104615999A (zh) * 2015-02-15 2015-05-13 北京师范大学 基于稀疏表示分类的滑坡泥石流区域检测方法
CN104615999B (zh) * 2015-02-15 2017-11-07 北京师范大学 基于稀疏表示分类的滑坡泥石流区域检测方法
CN105590088A (zh) * 2015-09-17 2016-05-18 重庆大学 一种基于稀疏自编码和稀疏表示进行交通标志识别的方法
CN109492610A (zh) * 2018-11-27 2019-03-19 广东工业大学 一种行人重识别方法、装置及可读存储介质
CN109492610B (zh) * 2018-11-27 2022-05-10 广东工业大学 一种行人重识别方法、装置及可读存储介质
CN112600994A (zh) * 2020-12-02 2021-04-02 达闼机器人有限公司 物体探测装置、方法、存储介质和电子设备

Also Published As

Publication number Publication date
CN103049760B (zh) 2016-05-18

Similar Documents

Publication Publication Date Title
CN103049760A (zh) 基于图像分块和位置加权的稀疏表示目标识别方法
CN102722712B (zh) 基于连续度的多尺度高分辨图像目标检测方法
CN102509091B (zh) 一种飞机尾号识别方法
CN102609681B (zh) 基于字典学习模型的人脸识别方法
CN109215034B (zh) 一种基于空间金字塔掩盖池化的弱监督图像语义分割方法
CN106650731B (zh) 一种鲁棒的车牌、车标识别方法
CN105389550B (zh) 一种基于稀疏指引与显著驱动的遥感目标检测方法
Zhang et al. Recognition of flotation working conditions through froth image statistical modeling for performance monitoring
CN103679158A (zh) 人脸认证方法和装置
Liu Handwritten Chinese character recognition: effects of shape normalization and feature extraction
CN102930300B (zh) 一种飞机目标识别方法及系统
CN103488974A (zh) 基于模拟生物视觉神经网络的人脸表情识别方法及系统
CN105224951A (zh) 一种车型分类方法及分类装置
CN105046224A (zh) 基于分块自适应加权梯度方向直方图特征的人脸识别方法
CN103218831A (zh) 一种基于轮廓约束的视频运动目标分类识别方法
CN103186776B (zh) 基于多特征和深度信息的人体检测方法
CN104598885A (zh) 街景图像中的文字标牌检测与定位方法
CN105893971A (zh) 一种基于Gabor和稀疏表示的交通信号灯识别方法
CN109447123A (zh) 一种基于标签一致性约束与拉伸正则化字典学习的行人再识别方法
CN102663401A (zh) 一种图像特征提取和描述方法
CN103679187A (zh) 图像识别方法和系统
CN104951795A (zh) 图像分类识别判断方法
CN104346628A (zh) 基于多尺度多方向Gabor特征的车牌汉字识别方法
Fujisawa et al. Directional pattern matching for character recognition revisited
CN105718934A (zh) 一种基于低秩稀疏编码技术的害虫图像特征学习与识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant