CN109858546B - 一种基于稀疏表示的图像识别方法 - Google Patents
一种基于稀疏表示的图像识别方法 Download PDFInfo
- Publication number
- CN109858546B CN109858546B CN201910081619.2A CN201910081619A CN109858546B CN 109858546 B CN109858546 B CN 109858546B CN 201910081619 A CN201910081619 A CN 201910081619A CN 109858546 B CN109858546 B CN 109858546B
- Authority
- CN
- China
- Prior art keywords
- classifier
- dictionary
- sparse representation
- sample
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
公开一种基于稀疏表示的图像识别方法,其能够通过自适应地选择训练样本进行多轮训练,学习多个字典,每个字典有针对性地学习其他字典表示精度欠佳的样本,每个字典对应一个有针对性的弱分类器,对多个弱分类器的分类结果进行加权组合,提升传统稀疏表示应用于分类问题的识别精度。该方法包括以下步骤:(1)基于自适应增强字典学习过程学习多个字典及相应的弱分类器,并计算分类器权值系数;(2)基于步骤(1)学习的多个字典计算待分类数据的稀疏表示向量,再利用相应的弱分类器进行分类,加权组合各弱分类器识别结果而得到最终识别结果。
Description
技术领域
本发明涉及图像处理的技术领域,尤其涉及一种基于稀疏表示的图像识别方法。
背景技术
近年来,稀疏表示算法作为图像分类的工具被广泛应用,通过训练学习字典或将训练样本直接作为字典,基于字典对测试数据进行稀疏编码,通过比较样本在类别字典上的重构误差实现分类。为提升字典方法在分类问题上的表现能力,已有方法在传统稀疏表示方法KSVD的基础上进行改进,在目标函数中加入类别信息,从而达到约束字典的目的。例如,DKSVD(Discriminative KSVD)中,在KSVD的基础上,引入由样本标签矩阵、分类矩阵和稀疏表示矩阵组成的分类误差项,字典的重构误差项和分类器分类误差项同时优化,达到同时提升线性分类器的能力和字典的表达能力的目的。LC-KSVD(Label Consistent KSVD)在KSVD的基础上引入标签一致项,定义字典与标签相关矩阵为判别稀疏矩阵,通过稀疏表示矩阵在转换矩阵上的投影与判别稀疏表示矩阵的差值构成标签一致项,使得通过训练得到的字典原子带有类别标签,从而保证了识别精度。同时LC-KSVD在DKSVD的启发下引入分类误差项,使得字典面向分类问题进行优化,进而得到较好的识别效果。
以上方法存在的问题如下:
基于稀疏表示的图像识别方法通常经过训练学习字典,目前的大部分方法在学习字典的过程中均等地对待每个训练样本。但不同样本复杂程度不同,因此令所有样本对字典训练的贡献相同,一方面可能会带来信息冗余,另一方面导致复杂样本的信息的缺失。
发明内容
为克服现有技术的缺陷,本发明要解决的技术问题是提供了一种基于稀疏表示的图像识别方法,其能够通过自适应地选择训练样本进行多轮训练,学习多个字典,每个字典有针对性地学习其他字典表示精度欠佳的样本,每个字典对应一个有针对性的弱分类器,对多个弱分类器的分类结果进行加权组合,提升传统稀疏表示应用于分类问题的识别精度。
本发明的技术方案是:这种基于稀疏表示的图像识别方法,该方法包括以下步骤:
(1)基于自适应增强字典学习过程学习多个字典及相应的弱分类器,并计算分类器权值系数;
(2)基于步骤(1)学习的多个字典计算待分类数据的稀疏表示向量,再利用相应的弱分类器进行分类,加权组合各弱分类器识别结果而得到最终识别结果。
本发明基于Adboost原理对传统稀疏表示模型学习字典的过程进行改进,在训练过程中自适应地为训练样本分配权重,从而提升字典的表达能力。与此同时在目标函数中增加分类误差项,联合优化字典和分类器,提升识别精度。
附图说明
图1示出了根据本发明的基于稀疏表示的图像识别方法的步骤(1)的流程图。
图2示出了根据本发明的基于稀疏表示的图像识别方法的步骤(2)的流程图。
图3示出了Amazon10数据库目标函数值和迭代次数的关系曲线。
图4示出了根据本发明的基于稀疏表示的图像识别方法的整体流程图。
具体实施方式
如图4所示,这种基于稀疏表示的图像识别方法,该方法包括以下步骤:
(1)基于自适应增强字典学习过程学习多个字典及相应的弱分类器,
并计算分类器权值系数;
(2)基于步骤(1)学习的多个字典计算待分类数据的稀疏表示向量,
再利用相应的弱分类器进行分类,加权组合各弱分类器识别结果而得到最终识别结果。
本发明基于Adboost原理对传统稀疏表示模型学习字典的过程进行改进,在训练过程中自适应地为训练样本分配权重,从而提升字典的表达能力。与此同时在目标函数中增加分类误差项,联合优化字典和分类器,提升识别精度。
优选地,所述步骤(1)包括以下分步骤:
(1.1)初始化训练样本的权重,初始化第i个样本的权重为
为W1=(w1,1,…,,w1,i,…,w1,N);
(1.2)字典学习和分类器训练,迭代M轮,得到M个字典、M个分类器及相应的分类器权值系数。
优选地,如图1所示,所述步骤(1.2)包括以下步骤:
a)联合训练字典和分类器
第m个字典Dm、第m个分类器Qm和第m个稀疏表示矩阵Am通过公式(1)求出:
其中xi∈RS为第i个训练样本,S为样本维度;m为迭代索引,1≤m≤M;Dm∈RS×K表示第m个字典,K为字典原子数量;Qm∈RC×K表示第m个分类器,C为类别数;hi∈RC为第i个样本的标签向量;wm,i为第m轮迭代第i个样本的权重;αm,i∈RK为第m轮迭代第i个样本的稀疏表示向量,训练集的稀疏表示矩阵记为Am=(αm,1,…,,αm,i,…,αm,N)∈RK×N;θ为稀疏约束参数;
公式(1)简化变形得到公式(3)
公式(3)使用KSVD算法进行求解,得到字典Dm和分类器Qm,用OMP算法求解稀疏表示矩阵Am;
b)利用分类器计算训练样本的分类结果
c)计算分类器的分类误差
通过公式(5)计算第m个分类器的分类误差
d)计算第m个分类器的权值系数
使用公式(6)计算第m个分类器的权值系数βm
e)更新样本权重
第m+1次迭代样本的权重为Wm+1=(wm+1,1,…,,wm+1,i,…,wm+1,N),其中各分量使用公式(7)计算:
重复步骤a)~e),直到最大迭代次数M。
优选地,如图2所示,所述步骤(2)包括以下分步骤:
f)利用步骤(1)求得的字典计算待分类数据的稀疏表示
y为待分类数据,用OMP算法求解公式(8)得到待分类数据的稀疏表示am,相应于M个字典得到对应的M个稀疏表示;
g)利用第m个弱分类器进行分类,得到预测结果Pm,通过公式(9)利用步骤(1)求得的分类器权值系数对弱分类器的预测结果进行组合:
通过公式(10)获得最终分类结果P
以下更详细地说明本发明。
1、自适应增强字典学习
1)初始化训练样本的权重。
2)字典学习和分类器训练
迭代M轮,得到M个字典、M个分类器及相应的分类器权值系数:
b)联合训练字典和分类器
第m个字典Dm、第m个分类器Qm和第m个稀疏表示矩阵Am可以通过式(1)求出:
其中xi∈RS为第i个训练样本,S为样本维度;m为迭代索引,1≤m≤M;Dm∈RS×K表示第m个字典,K为字典原子数量;Qm∈RC×K表示第m个分类器,C为类别数;hi∈RC为第i个样本的标签向量;wm,i为第m轮迭代第i个样本的权重;αm,i∈RK为第m轮迭代第i个样本的稀疏表示向量,训练集的稀疏表示矩阵记为Am=(αm,1,…,αm,i,…,αm,N)∈RK×N;θ为稀疏约束参数。(1)式可以简化写成(2)式:
对(2)式利用矩阵运算法则可以变形得到(3)式
式(3)可以使用KSVD算法进行求解,得到字典Dm和分类器Qm,用OMP算法求解稀疏表示矩阵Am。
b)利用分类器计算训练样本的分类结果
c)计算分类器的分类误差
通过(5)式计算第m个分类器的分类误差。
d)计算第m个分类器的权值系数
使用式(6)计算第m个分类器的权值系数βm。
e)更新样本权重
第m+1次迭代样本的权重为Wm+1=(wm+1,1,…,wm+1,i,…,wm+1,N),其中各分量使用式(7)计算:
重复步骤a)~e),直到最大迭代次数M。
2、基于多个弱分类器进行分类
f)利用步骤1求得的字典计算待分类数据的稀疏表示。
y为待分类数据,用OMP算法可以求解式(8)得到待分类数据的稀疏表示am,相应于M个字典得到对应的M个稀疏表示。
g)利用第m个弱分类器进行分类,得到预测结果Pm。如式(9)利用步骤1求得的分类器权值系数对弱分类器的预测结果进行组合:
最终分类结果P如式(10)。
基于图像分类任务验证自适应增强稀疏表示方法的有效性
本发明在三个基于分类任务的图像数据集上进行实验,并且将分类精度与目前主流稀疏表示模型进行对比,包括KSVD、DKSVD、LC-KSVD1和LC-KSVD2。其中KSVD是经典的字典学习方法,DKSVD在KSVD基础上加入分类误差项,LC-KSVD1在KSVD基础上加入标签一致项,LC-KSVD2在KSVD基础上加入分类误差项和标签一致项。
图3表示Amazon10数据库目标函数取值和迭代次数的关系,可以看到随着迭代次数的增加,目标函数值逐渐减小,最终趋于稳定,证明本发明中的目标函数收敛。
本发明使用两个数据库(Caltech10图像分类数据库和Amazon10图像分类数据库)测试所提方法的有效性。
Caltech10图像数据库的图像尺寸为300*200,包括10个语义类别,每类约100张图像,共1123张图像。每个类别选取该类别数目的60%组成训练集,其余40%组成测试集合,得到训练集合包含673张图像,测试集合450张图像。本发明利用SURF方法提取图像特征,特征维度为800维。字典原子数量设为300,参数γ=20,稀疏约束参数θ=30。本发明提出的方法及对比方法的识别精度如表1所示,可以看出在此数据库下,本发明提出的方法得到最高准确率。
表1
Amazon10图像数据库包括10个语义类别,每类约100张图像,共958张图。同样以6/4的形式分割数据集,得到训练集包含574张图像,测试集包含384张图像。本发明利用SURF方法提取图像特征,特征维度为800维。字典原子数量设为300,参数γ=4,稀疏约束参数θ=30。本发明提出的方法及对比方法的识别精度如表2所示,可以看出在此数据库下,本发明提出的方法得到最高准确率。
表2
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。
Claims (2)
1.一种基于稀疏表示的图像识别方法,其特征在于:该方法包括以下步骤:
(1)基于自适应增强字典学习过程学习多个字典及相应的弱分类器,并计算分类器权值系数;
(2)基于步骤(1)学习的多个字典计算待分类数据的稀疏表示向量,再利用相应的弱分类器进行分类,加权组合各弱分类器识别结果而得到最终识别结果;
所述步骤(1)包括以下分步骤:
(1.1)初始化训练样本的权重,初始化第i个样本的权重为N为样本数量,训练样本的初始权重记为W1=(w1,1,K,w1,i,K,w1,N);训练样本来自Caltech10图像分类数据库和Amazon10图像分类数据库;
(1.2)字典学习和分类器训练,迭代M轮,得到M个字典、M个分类器及相应的分类器权值系数;
所述步骤(1.2)包括以下步骤:
a)联合训练字典和分类器
第m个字典Dm、第m个分类器Qm和第m个稀疏表示矩阵Am通过公式(1)求出:
其中为第i个训练样本,S为样本维度;m为迭代索引,1≤m≤M;表示第m个字典,K为字典原子数量;表示第m个分类器,C为类别数;为第i个样本的标签向量;wm,i为第m轮迭代第i个样本的权重;为第m轮迭代第i个样本的稀疏表示向量,训练集的稀疏表示矩阵记为θ为稀疏约束参数;
公式(1)简化变形得到公式(3)
公式(3)使用KSVD算法进行求解,得到字典Dm和分类器Qm,用OMP算法求解稀疏表示矩阵Am;
b)利用分类器计算训练样本的分类结果
c)计算分类器的分类误差
通过公式(5)计算第m个分类器的分类误差
d)计算第m个分类器的权值系数
使用公式(6)计算第m个分类器的权值系数βm
e)更新样本权重
第m+1次迭代样本的权重为Wm+1=(wm+1,1,K,wm+1,i,K,wm+1,N),其中各分量使用公式(7)计算:
重复步骤a)~e),直到最大迭代次数M。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910081619.2A CN109858546B (zh) | 2019-01-28 | 2019-01-28 | 一种基于稀疏表示的图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910081619.2A CN109858546B (zh) | 2019-01-28 | 2019-01-28 | 一种基于稀疏表示的图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109858546A CN109858546A (zh) | 2019-06-07 |
CN109858546B true CN109858546B (zh) | 2021-03-30 |
Family
ID=66896498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910081619.2A Active CN109858546B (zh) | 2019-01-28 | 2019-01-28 | 一种基于稀疏表示的图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109858546B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110543836B (zh) * | 2019-08-16 | 2022-05-10 | 北京工业大学 | 一种面向彩色图像的车辆检测方法 |
CN111709442B (zh) * | 2020-05-07 | 2024-08-23 | 北京工业大学 | 一种面向图像分类任务的多层字典学习方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916371A (zh) * | 2010-09-01 | 2010-12-15 | 北京工业大学 | 对图像进行光照归一化处理的方法及采用其的图像识别方法 |
CN102346908A (zh) * | 2011-11-04 | 2012-02-08 | 西安电子科技大学 | 基于稀疏表示的sar图像相干斑抑制方法 |
CN103258210A (zh) * | 2013-05-27 | 2013-08-21 | 中山大学 | 一种基于字典学习的高清图像分类方法 |
CN103345923A (zh) * | 2013-07-26 | 2013-10-09 | 电子科技大学 | 一种基于稀疏表示的短语音说话人识别方法 |
CN103793695A (zh) * | 2014-02-10 | 2014-05-14 | 天津大学 | 一种用于人脸识别的多特征空间的子字典联合训练的方法 |
CN105590328A (zh) * | 2015-12-07 | 2016-05-18 | 天津大学 | 基于稀疏表示选择性外观模型的帧自适应目标跟踪算法 |
CN107844739A (zh) * | 2017-07-27 | 2018-03-27 | 电子科技大学 | 基于自适应同时稀疏表示的鲁棒性目标追踪方法 |
CN108830130A (zh) * | 2018-03-30 | 2018-11-16 | 徐国明 | 一种偏振高光谱低空侦察图像典型目标检测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140310221A1 (en) * | 2013-04-12 | 2014-10-16 | Nec Laboratories America, Inc. | Interpretable sparse high-order boltzmann machines |
US11501130B2 (en) * | 2016-09-09 | 2022-11-15 | SK Hynix Inc. | Neural network hardware accelerator architectures and operating method thereof |
-
2019
- 2019-01-28 CN CN201910081619.2A patent/CN109858546B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916371A (zh) * | 2010-09-01 | 2010-12-15 | 北京工业大学 | 对图像进行光照归一化处理的方法及采用其的图像识别方法 |
CN102346908A (zh) * | 2011-11-04 | 2012-02-08 | 西安电子科技大学 | 基于稀疏表示的sar图像相干斑抑制方法 |
CN103258210A (zh) * | 2013-05-27 | 2013-08-21 | 中山大学 | 一种基于字典学习的高清图像分类方法 |
CN103345923A (zh) * | 2013-07-26 | 2013-10-09 | 电子科技大学 | 一种基于稀疏表示的短语音说话人识别方法 |
CN103793695A (zh) * | 2014-02-10 | 2014-05-14 | 天津大学 | 一种用于人脸识别的多特征空间的子字典联合训练的方法 |
CN105590328A (zh) * | 2015-12-07 | 2016-05-18 | 天津大学 | 基于稀疏表示选择性外观模型的帧自适应目标跟踪算法 |
CN107844739A (zh) * | 2017-07-27 | 2018-03-27 | 电子科技大学 | 基于自适应同时稀疏表示的鲁棒性目标追踪方法 |
CN108830130A (zh) * | 2018-03-30 | 2018-11-16 | 徐国明 | 一种偏振高光谱低空侦察图像典型目标检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109858546A (zh) | 2019-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Izmailov et al. | Semi-supervised learning with normalizing flows | |
CN110197286B (zh) | 一种基于混合高斯模型和稀疏贝叶斯的主动学习分类方法 | |
CN110209823A (zh) | 一种多标签文本分类方法及系统 | |
CN112528928B (zh) | 一种基于自注意力深度网络的商品识别方法 | |
CN108710948B (zh) | 一种基于聚类均衡和权重矩阵优化的迁移学习方法 | |
CN110705636B (zh) | 一种基于多样本字典学习和局部约束编码的图像分类方法 | |
CN110543566B (zh) | 一种基于自注意力近邻关系编码的意图分类方法 | |
CN110533024A (zh) | 基于多尺度roi特征的双二次池化细粒度图像分类方法 | |
CN105868796B (zh) | 基于核空间的线性鉴别稀疏表示分类器的设计方法 | |
CN108846357B (zh) | 一种基于改进增量式非负矩阵分解的人脸识别方法 | |
CN106066992B (zh) | 基于自适应局部约束的判别字典学习的人脸识别方法及系统 | |
Romero et al. | Meta-parameter free unsupervised sparse feature learning | |
CN109685093A (zh) | 无监督的自适应特征选择方法 | |
CN105023006B (zh) | 基于增强型非参数最大边缘准则的人脸识别方法 | |
CN109858546B (zh) | 一种基于稀疏表示的图像识别方法 | |
CN108154186B (zh) | 一种模式识别方法和装置 | |
CN109409231B (zh) | 基于自适应隐马尔可夫的多特征融合手语识别方法 | |
CN109063750B (zh) | 基于cnn和svm决策融合的sar目标分类方法 | |
Lee et al. | Unsupervised visual representation learning via mutual information regularized assignment | |
CN109145749B (zh) | 一种跨数据集的面部表情识别模型构建及识别方法 | |
CN109284375A (zh) | 一种基于原始数据信息保留的域自适应降维方法 | |
CN110532384B (zh) | 一种多任务字典单分类方法、系统、装置及存储介质 | |
CN112381070A (zh) | 一种快速鲁棒人脸识别方法 | |
Roffo et al. | Object tracking via dynamic feature selection processes | |
JP5834287B2 (ja) | パターン分類の学習装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |