CN106326903A - 一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法 - Google Patents
一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法 Download PDFInfo
- Publication number
- CN106326903A CN106326903A CN201610791835.2A CN201610791835A CN106326903A CN 106326903 A CN106326903 A CN 106326903A CN 201610791835 A CN201610791835 A CN 201610791835A CN 106326903 A CN106326903 A CN 106326903A
- Authority
- CN
- China
- Prior art keywords
- dictionary
- feature
- asift
- overbar
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法,该方法包括:步骤1,采用ASIFT算法对多种类训练图像进行特征提取以及采用训练字典的方法,形成多种类字典;步骤2,采用ASIFT算法对目标测试图像进行特征提取,形成特征矩阵;步骤3,利用稀疏识别的方法建立能够同时识别不同传感器典型图像的识别模型,采用该识别模型将所述步骤1的特征矩阵与所述步骤2的多种类字典进行对比判断,若特征矩阵与字典相符合,则识别出图像类别;若不符合,则将特征矩阵训练添加到字典内。通过本发明利用仿射尺度不变特征变换方法,解决特征提取问题,并且利用稀疏表示方法建立一个通用的识别模型,经过实验证明该方法能够有效地识别目标图片。
Description
技术领域
本发明涉及一种基于稀疏表示的识别图像的方法,尤其是一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法。
背景技术
稀疏表示是近年来图像识别、计算机视觉、数值计算等领域的研究热点,并取得了较好的效果。稀疏表示的最初目的是为了用比香农定理更低的采样率来表示和压缩信号。由于稀疏表示本身具有很好的判别特性,已经被成功应用在模式识别中,如人脸识别、车辆识别。
由于目前的提取对视角变化鲁棒的图像特征麻烦,另外建立一个可以识别不同传感器图片的通用识别模型比较困难,而且识别建筑物或者其他的地面物体没有比较高的精度,清晰度也模糊等问题。
发明内容
本发明所要解决的技术问题是目前对提取对视角变化鲁棒的图像特征比较麻烦,建立一个可以识别不同传感器图片的通用识别模型比较困难,而且识别建筑物或者其他的地面物体精度低,清晰度模糊等问题。
本发明解决上述技术问题的技术方案如下:
一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法,该方法步骤包括:
步骤1,采用ASIFT算法对多种类训练图像进行特征提取以及采用训练字典的方法,形成多种(2种以上)类字典;
步骤2,采用ASIFT算法对目标测试图像进行特征提取,形成特征矩阵;
步骤3,利用稀疏识别的方法,通过建立能够同时识别不同传感器典型图像的识别模型,采用该识别模型将所述步骤1的特征矩阵与所述步骤2的多种类字典进行对比判断,若特征矩阵与字典相符合,则识别出图像类别,若不符合,则将特征矩阵训练添加到字典内。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述步骤1中的特征提取采用的ASIFT算法具体为:
数字图像的获取过程可以表述如下:
u=S1G1ATu0 (1)
u代表数字图像,u0代表正视图,T代表平面变换,即图像的平面扭曲变换,A代表平面投影映射,G1代表高斯卷积平滑,S1代表采样,即将原始图像u0网格化,转为数字图像,
平面投影映射A可以表示如下:
这里Hλ=λ,λ>0,是A的行列式,Ri代表旋转,ψ∈[0,π),φ∈[0,π),Tt代表倾斜度,t≥1。
进一步,利用SIFT方法提取所有图像的特征。
进一步,所述SIFT方法,该方法具体为:利用高斯卷积
高斯函数定义为G(x,y,σ),输入图像定义为I(x,y)图像的尺度空间函数定义为:
L(x,y,σ)=G(x,y,σ)*I(x,y) (3)
这里*代表卷积操作。且
是2维高斯函数。
进一步,所述步骤3中的稀疏识别模型为:
其中,
表示测试样本的ASIFT特征,其中
D表示对C类图像样本中的每类样本的ASIFT特征进行训练得到对应的训练字典,并组合构成字典D=[D1,D2,…,DC],为第i类的训练字典,该字典也是在稀疏识别下得到带有稀疏特质的矩阵;
为经过稀疏表示后的向量,其中为第i类对应的系数;
其中,
argmin使式子|| ||2取最小值,式(6)表示取与矩阵之间距离的最小值,当c取值最小时,此时的i即为分类结果。
ASIFT得到的特征矩阵为识别模型的输入,得到带有稀疏特质的矩阵。
本发明的带来的有益效果是:基于稀疏表示的识别图像的方法,利用仿射尺度不变特征变换(ASIFT)方法,解决特征提取问题,并且利用稀疏表示方法建立一个通用的识别模型,能够有效地识别目标图片,对建筑物进行模式分类。
附图说明
图1是本发明基于仿射尺度不变特征和稀疏表示的典型目标识别方法流程图。
图2是本发明的整体流程图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。如图1所示其具体的做法和实施的步骤如下:
ASIFT特征提取算法
为了更好地解释算法,首先定义相机模型。数据图像的获取过程可以表述如下:
u=S1G1ATu0 (1)
u代表数字图像,u0代表正视图,T代表平面变换,即图像的平面扭曲变换,A代表平面投影映射,G1代表高斯卷积平滑,S1代表采样,即将原始图像u0网格化,转为数字图像,这里T和S1设为1,
平面投影映射A可以表示如下:
这里Hλ=λ,λ>0,是A的行列式,Ri代表旋转,ψ∈[0,π),φ∈[0,π),Tt代表倾斜度,t≥1。
利用SIFT方法提取所有图像的特征。
SIFT的关键是利用高斯卷积。高斯函数定义为G(x,y,σ),输入图像定义为I(x,y)图像的尺度空间函数定义为:
L(x,y,σ)=G(x,y,σ)*I(x,y) (3)
这里*代表卷积操作。且
是2维高斯函数。
SIFT利用DOG(Difference-of-Gaussian)技术计算尺度空间中的极值。然后通过计算尺度空间中的梯度等,得到最后的描述子,该描述子是一维向量,代表方向直方图。对于每幅图像,ASIFT可以提取许多特征向量,特征向量构成的特征矩阵作为稀疏表示模型的输入,训练图像的特征用于训练字典,测试图像的特征用于作为识别模型的输入。
稀疏表示模型
稀疏表示(Sparse Representation,SR),是近年来图像识别、计算机视觉、数值计算等领域的研究热点,并取得了较好的效果。稀疏表示的最初目的是为了用比香农定理更低的采样率来表示和压缩信号。由于稀疏表示本身具有很好的判别特性,已经被成功应用在模式识别中,如人脸识别、车辆识别。本文应用稀疏表示方法对建筑物进行模式分类。
稀疏表示基本原理
设信号x∈RN,矩阵D=[D1,D2,…,DC]为字典,由A张成的N维空间Ψ,向量为D中的原子,则信号在空间Ψ上可以表示为:
其中系数α=[α1,α2,...,αK]T∈RK为信号x在空间Ψ上的坐标,并且α中只有少量分量是非零的,即是稀疏的,其数学模型表达形式为:
min||x-Dα||,subject to||α||0≤L (6)
其中|| ||0表示l0范数,表示非零元素的个数。
稀疏表示求解算法
常用的稀疏表示求解算法有:匹配追踪(Matching Pursuit,MP)算法、正交匹配追踪(Orthogonal Matching Pursuit,OMP)算法等。本文采用OMP算法,此算法是从过完备库中找出与待分解信号或信号残差最为匹配的匹配原子,在算法中需要将所选原子利用Gram-Schmidt正交化方法进行正交处理,再将信号在这些原子构成的空间中投影,得到信号在各个原子上的分量和残差分量,然后分解残余分量经过M次分解,原信号被分解为M个原子的线性组合,在每一步分解中所算最佳原子均满足一定条件,因此残余分量随着分解过程迅速减小,这样,用少量原子就可以表示原始信号,而且经过有限次迭代就可以收敛。
字典学习算法
常见的字典学习算法有:最优方向(Method of optimal directions,MOD)算法、联合正交基算法、广义PCA算法、K-SVD算法等。本文采用K-SVD算法。K-SVD方法的主要改进在于字典的更新步骤,它通过简单而有效地逐列更新的方式解决了MOD方法中矩阵求逆的问题,并且通过同时更新字典基元和相关的表示系数使得计算复杂度比MOD方法大大降低。
K-SVD算法中K指的是字典基元的个数,当更新某一列字典基元时假设其他的列基元已知并得到一个表示误差矩阵,然后同时更新这一列基元和与其相关的稀疏表示系数。
对于小样本问题来说,K-SVD是一个有效的方法,本文采用K-SVD方法训练字典,稀疏编码阶段采用正交匹配追踪(OMP)算法。
稀疏表示识别模型
其中,
表示测试样本的ASIFT特征,其中
D表示对C类图像样本中的每类样本的ASIFT特征进行训练得到对应的训练字典,并组合构成字典D=[D1,D2,…,DC],为第i类的训练字典,该字典也是在稀疏识别下得到带有稀疏特质的矩阵;
为经过通过正交匹配追踪(OMP)算法计算稀疏表示后的向量,其中为第i类对应的系数;
其中,
argmin使式子|| ||2取最小值,式(6)表示取与矩阵之间距离的最小值,当c取值最小时,此时的i即为分类结果。
ASIFT得到的特征矩阵为识别模型的输入,得到带有稀疏特质的矩阵。
实施例
将测试的图像利用ASIFT特征提取得到的特征矩阵;将n类的训练图像经过用ASIFT特征提取得到的n类特征矩阵,将n类特征矩阵经KSVD训练成集合字典;将测试的图像的特征矩阵经过稀疏识别带有稀疏特质的矩阵,将字典也经过稀疏识别得到带有稀疏特质的矩阵,最后将得到的测试图像与字典对比判断,若是相同,则判断出图像类别;若是不相同,则将测试图像增加到字典中。
在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、方法、装置或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法,其特征在于,该方法包括如下步骤:
步骤1,采用ASIFT算法对多种类训练图像进行特征提取以及采用训练字典的方法,形成多种类字典;
步骤2,采用ASIFT算法对目标测试图像进行特征提取,形成特征矩阵;
步骤3,利用稀疏识别的方法建立能够同时识别不同传感器典型图像的识别模型,采用该识别模型将所述步骤1的特征矩阵与所述步骤2的多种类字典进行对比判断,若特征矩阵与字典相符合,则识别出图像类别;若不符合,则将特征矩阵训练添加到字典内。
2.根据权利要求1所述的一种基于仿射尺度不变特征和稀疏表示的典型目标识别的方法,其特征在于,所述步骤1中的ASIFT算法为:
数字图像的获取过程表述如下:
u=S1G1ATu0 (1)
u代表数字图像,u0代表正视图,T代表平面变换,即图像的平面扭曲变换,A代表平面投影映射,G1代表高斯卷积平滑,S1代表采样,即将原始图像u0网格化,转为数字图像,
平面投影映射A可以表示如下:
这里Hλ=λ,λ>0,是A的行列式,Ri代表旋转,ψ∈[0,π),φ∈[0,π),Tt代表倾斜度,t≥1。
3.根据权利要求2所述的一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法,其特征在于,ASIFT算法还包括:利用SIFT方法提取所有图像的特征。
4.根据权利要求2所述的一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法,其特征在于,所述高斯卷积平滑,该高斯卷积平滑具体为:利用SIFT方法,其中高斯函数定义为G(x,y,σ),输入图像定义为I(x,y),图像的尺度空间函数定义为:
L(x,y,σ)=G(x,y,σ)*I(x,y) (3)
这里*代表卷积操作且
是2维高斯函数。
5.根据权利要求1所述的一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法,其特征在于,所述步骤3中识别模型,其具体为:
其中,
表示测试样本的ASIFT特征,其中
D表示对C类图像样本中的每类样本的ASIFT特征进行训练得到对应的训练字典,并组合构成字典D=[D1,D2,…,DC],为第i类的训练字典,该字典也是在稀疏识别下得到带有稀疏特质的矩阵;
为经过稀疏表示后的向量,其中为第i类对应的系数;
其中,
argmin使式子|| ||2取最小值,式(6)表示取与矩阵之间距离的最小值,当c取值最小时,此时的i即为分类结果;
i=1,2,3,...,C,ASIFT得到的特征矩阵为识别模型的输入,得到带有稀疏特质的矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610791835.2A CN106326903A (zh) | 2016-08-31 | 2016-08-31 | 一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610791835.2A CN106326903A (zh) | 2016-08-31 | 2016-08-31 | 一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106326903A true CN106326903A (zh) | 2017-01-11 |
Family
ID=57789265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610791835.2A Pending CN106326903A (zh) | 2016-08-31 | 2016-08-31 | 一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106326903A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543648A (zh) * | 2018-11-30 | 2019-03-29 | 公安部交通管理科学研究所 | 一种过车图片中人脸提取方法 |
CN110909582A (zh) * | 2018-09-18 | 2020-03-24 | 华为技术有限公司 | 一种人脸识别的方法及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020647A (zh) * | 2013-01-08 | 2013-04-03 | 西安电子科技大学 | 基于级联的sift特征和稀疏编码的图像分类方法 |
CN105654122A (zh) * | 2015-12-28 | 2016-06-08 | 江南大学 | 基于核函数匹配的空间金字塔物体识别方法 |
CN105718934A (zh) * | 2016-01-25 | 2016-06-29 | 无锡中科富农物联科技有限公司 | 一种基于低秩稀疏编码技术的害虫图像特征学习与识别方法 |
-
2016
- 2016-08-31 CN CN201610791835.2A patent/CN106326903A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020647A (zh) * | 2013-01-08 | 2013-04-03 | 西安电子科技大学 | 基于级联的sift特征和稀疏编码的图像分类方法 |
CN105654122A (zh) * | 2015-12-28 | 2016-06-08 | 江南大学 | 基于核函数匹配的空间金字塔物体识别方法 |
CN105718934A (zh) * | 2016-01-25 | 2016-06-29 | 无锡中科富农物联科技有限公司 | 一种基于低秩稀疏编码技术的害虫图像特征学习与识别方法 |
Non-Patent Citations (2)
Title |
---|
王晶晶: ""基于稀疏表示的车辆识别方法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
陶青松: ""基于ASIFT特征的图像匹配技术研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909582A (zh) * | 2018-09-18 | 2020-03-24 | 华为技术有限公司 | 一种人脸识别的方法及设备 |
CN110909582B (zh) * | 2018-09-18 | 2023-09-22 | 华为技术有限公司 | 一种人脸识别的方法及设备 |
CN109543648A (zh) * | 2018-11-30 | 2019-03-29 | 公安部交通管理科学研究所 | 一种过车图片中人脸提取方法 |
CN109543648B (zh) * | 2018-11-30 | 2022-06-17 | 公安部交通管理科学研究所 | 一种过车图片中人脸提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108027878B (zh) | 用于面部对齐的方法 | |
CN102609681B (zh) | 基于字典学习模型的人脸识别方法 | |
Qiu et al. | Information-theoretic dictionary learning for image classification | |
Wang et al. | Correntropy matching pursuit with application to robust digit and face recognition | |
CN109544603B (zh) | 基于深度迁移学习的目标跟踪方法 | |
CN105654421B (zh) | 基于变换不变低秩纹理的投影变换图像匹配方法 | |
CN108509925B (zh) | 一种基于视觉词袋模型的行人重识别方法 | |
CN102541954A (zh) | 一种商标检索方法及系统 | |
CN104700089A (zh) | 一种基于Gabor小波和SB2DLPP的人脸识别方法 | |
CN107862680B (zh) | 一种基于相关滤波器的目标跟踪优化方法 | |
Etezadifar et al. | A new sample consensus based on sparse coding for improved matching of SIFT features on remote sensing images | |
CN113158955B (zh) | 基于聚类引导和成对度量三元组损失的行人重识别方法 | |
CN105608478A (zh) | 一种图像的特征提取与分类联合方法及系统 | |
US20200005078A1 (en) | Content aware forensic detection of image manipulations | |
Taron et al. | Registration with uncertainties and statistical modeling of shapes with variable metric kernels | |
CN106462773B (zh) | 使用gabor函数的模式识别系统及方法 | |
Bai et al. | Graph matching using spectral embedding and alignment | |
CN106326903A (zh) | 一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法 | |
CN111275070A (zh) | 一种基于局部特征匹配的签名验证方法及设备 | |
Gao | Hypoelliptic diffusion maps and their applications in automated geometric morphometrics | |
McKeague | A statistical model for signature verification | |
JP2005084765A (ja) | 文字認識装置及び方法及びそのプログラム | |
Lyu et al. | Identifiability-guaranteed simplex-structured post-nonlinear mixture learning via autoencoder | |
Hase et al. | Recognition of Rotated Characters by Eigen-space. | |
Cheung et al. | Bidirectional deformable matching with application to handwritten character extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170111 |
|
RJ01 | Rejection of invention patent application after publication |