CN109858546B - 一种基于稀疏表示的图像识别方法 - Google Patents

一种基于稀疏表示的图像识别方法 Download PDF

Info

Publication number
CN109858546B
CN109858546B CN201910081619.2A CN201910081619A CN109858546B CN 109858546 B CN109858546 B CN 109858546B CN 201910081619 A CN201910081619 A CN 201910081619A CN 109858546 B CN109858546 B CN 109858546B
Authority
CN
China
Prior art keywords
classifier
dictionary
sparse representation
sample
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910081619.2A
Other languages
English (en)
Other versions
CN109858546A (zh
Inventor
王立春
李爽
王少帆
孔德慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201910081619.2A priority Critical patent/CN109858546B/zh
Publication of CN109858546A publication Critical patent/CN109858546A/zh
Application granted granted Critical
Publication of CN109858546B publication Critical patent/CN109858546B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

公开一种基于稀疏表示的图像识别方法,其能够通过自适应地选择训练样本进行多轮训练,学习多个字典,每个字典有针对性地学习其他字典表示精度欠佳的样本,每个字典对应一个有针对性的弱分类器,对多个弱分类器的分类结果进行加权组合,提升传统稀疏表示应用于分类问题的识别精度。该方法包括以下步骤:(1)基于自适应增强字典学习过程学习多个字典及相应的弱分类器,并计算分类器权值系数;(2)基于步骤(1)学习的多个字典计算待分类数据的稀疏表示向量,再利用相应的弱分类器进行分类,加权组合各弱分类器识别结果而得到最终识别结果。

Description

一种基于稀疏表示的图像识别方法
技术领域
本发明涉及图像处理的技术领域,尤其涉及一种基于稀疏表示的图像识别方法。
背景技术
近年来,稀疏表示算法作为图像分类的工具被广泛应用,通过训练学习字典或将训练样本直接作为字典,基于字典对测试数据进行稀疏编码,通过比较样本在类别字典上的重构误差实现分类。为提升字典方法在分类问题上的表现能力,已有方法在传统稀疏表示方法KSVD的基础上进行改进,在目标函数中加入类别信息,从而达到约束字典的目的。例如,DKSVD(Discriminative KSVD)中,在KSVD的基础上,引入由样本标签矩阵、分类矩阵和稀疏表示矩阵组成的分类误差项,字典的重构误差项和分类器分类误差项同时优化,达到同时提升线性分类器的能力和字典的表达能力的目的。LC-KSVD(Label Consistent KSVD)在KSVD的基础上引入标签一致项,定义字典与标签相关矩阵为判别稀疏矩阵,通过稀疏表示矩阵在转换矩阵上的投影与判别稀疏表示矩阵的差值构成标签一致项,使得通过训练得到的字典原子带有类别标签,从而保证了识别精度。同时LC-KSVD在DKSVD的启发下引入分类误差项,使得字典面向分类问题进行优化,进而得到较好的识别效果。
以上方法存在的问题如下:
基于稀疏表示的图像识别方法通常经过训练学习字典,目前的大部分方法在学习字典的过程中均等地对待每个训练样本。但不同样本复杂程度不同,因此令所有样本对字典训练的贡献相同,一方面可能会带来信息冗余,另一方面导致复杂样本的信息的缺失。
发明内容
为克服现有技术的缺陷,本发明要解决的技术问题是提供了一种基于稀疏表示的图像识别方法,其能够通过自适应地选择训练样本进行多轮训练,学习多个字典,每个字典有针对性地学习其他字典表示精度欠佳的样本,每个字典对应一个有针对性的弱分类器,对多个弱分类器的分类结果进行加权组合,提升传统稀疏表示应用于分类问题的识别精度。
本发明的技术方案是:这种基于稀疏表示的图像识别方法,该方法包括以下步骤:
(1)基于自适应增强字典学习过程学习多个字典及相应的弱分类器,并计算分类器权值系数;
(2)基于步骤(1)学习的多个字典计算待分类数据的稀疏表示向量,再利用相应的弱分类器进行分类,加权组合各弱分类器识别结果而得到最终识别结果。
本发明基于Adboost原理对传统稀疏表示模型学习字典的过程进行改进,在训练过程中自适应地为训练样本分配权重,从而提升字典的表达能力。与此同时在目标函数中增加分类误差项,联合优化字典和分类器,提升识别精度。
附图说明
图1示出了根据本发明的基于稀疏表示的图像识别方法的步骤(1)的流程图。
图2示出了根据本发明的基于稀疏表示的图像识别方法的步骤(2)的流程图。
图3示出了Amazon10数据库目标函数值和迭代次数的关系曲线。
图4示出了根据本发明的基于稀疏表示的图像识别方法的整体流程图。
具体实施方式
如图4所示,这种基于稀疏表示的图像识别方法,该方法包括以下步骤:
(1)基于自适应增强字典学习过程学习多个字典及相应的弱分类器,
并计算分类器权值系数;
(2)基于步骤(1)学习的多个字典计算待分类数据的稀疏表示向量,
再利用相应的弱分类器进行分类,加权组合各弱分类器识别结果而得到最终识别结果。
本发明基于Adboost原理对传统稀疏表示模型学习字典的过程进行改进,在训练过程中自适应地为训练样本分配权重,从而提升字典的表达能力。与此同时在目标函数中增加分类误差项,联合优化字典和分类器,提升识别精度。
优选地,所述步骤(1)包括以下分步骤:
(1.1)初始化训练样本的权重,初始化第i个样本的权重为
Figure GDA0002003510130000031
1≤i≤N,N为样本数量,训练样本的初始权重记
为W1=(w1,1,…,,w1,i,…,w1,N);
(1.2)字典学习和分类器训练,迭代M轮,得到M个字典、M个分类器及相应的分类器权值系数。
优选地,如图1所示,所述步骤(1.2)包括以下步骤:
a)联合训练字典和分类器
第m个字典Dm、第m个分类器Qm和第m个稀疏表示矩阵Am通过公式(1)求出:
Figure GDA0002003510130000041
其中xi∈RS为第i个训练样本,S为样本维度;m为迭代索引,1≤m≤M;Dm∈RS×K表示第m个字典,K为字典原子数量;Qm∈RC×K表示第m个分类器,C为类别数;hi∈RC为第i个样本的标签向量;wm,i为第m轮迭代第i个样本的权重;αm,i∈RK为第m轮迭代第i个样本的稀疏表示向量,训练集的稀疏表示矩阵记为Am=(αm,1,…,,αm,i,…,αm,N)∈RK×N;θ为稀疏约束参数;
公式(1)简化变形得到公式(3)
Figure GDA0002003510130000042
公式(3)使用KSVD算法进行求解,得到字典Dm和分类器Qm,用OMP算法求解稀疏表示矩阵Am
b)利用分类器计算训练样本的分类结果
根据步骤a)得到的分类器Qm和第i个样本的稀疏表示向量αm,i求得样本类别估计向量
Figure GDA0002003510130000043
根据公式(4)得到第i个样本的预测结果Pm,i
Figure GDA0002003510130000044
c)计算分类器的分类误差
通过公式(5)计算第m个分类器的分类误差
Figure GDA0002003510130000051
d)计算第m个分类器的权值系数
使用公式(6)计算第m个分类器的权值系数βm
Figure GDA0002003510130000052
e)更新样本权重
第m+1次迭代样本的权重为Wm+1=(wm+1,1,…,,wm+1,i,…,wm+1,N),其中各分量使用公式(7)计算:
Figure GDA0002003510130000053
重复步骤a)~e),直到最大迭代次数M。
优选地,如图2所示,所述步骤(2)包括以下分步骤:
f)利用步骤(1)求得的字典计算待分类数据的稀疏表示
Figure GDA0002003510130000054
y为待分类数据,用OMP算法求解公式(8)得到待分类数据的稀疏表示am,相应于M个字典得到对应的M个稀疏表示;
g)利用第m个弱分类器进行分类,得到预测结果Pm,通过公式(9)利用步骤(1)求得的分类器权值系数对弱分类器的预测结果进行组合:
Figure GDA0002003510130000061
通过公式(10)获得最终分类结果P
Figure GDA0002003510130000062
以下更详细地说明本发明。
1、自适应增强字典学习
1)初始化训练样本的权重。
初始化第i个样本的权重为
Figure GDA0002003510130000063
1≤i≤N,N为样本数量,训练样本的初始权重记为W1=(w1,1,…,,w1,i,…,w1,N)。
2)字典学习和分类器训练
迭代M轮,得到M个字典、M个分类器及相应的分类器权值系数:
b)联合训练字典和分类器
第m个字典Dm、第m个分类器Qm和第m个稀疏表示矩阵Am可以通过式(1)求出:
Figure GDA0002003510130000064
其中xi∈RS为第i个训练样本,S为样本维度;m为迭代索引,1≤m≤M;Dm∈RS×K表示第m个字典,K为字典原子数量;Qm∈RC×K表示第m个分类器,C为类别数;hi∈RC为第i个样本的标签向量;wm,i为第m轮迭代第i个样本的权重;αm,i∈RK为第m轮迭代第i个样本的稀疏表示向量,训练集的稀疏表示矩阵记为Am=(αm,1,…,αm,i,…,αm,N)∈RK×N;θ为稀疏约束参数。(1)式可以简化写成(2)式:
Figure GDA0002003510130000071
对(2)式利用矩阵运算法则可以变形得到(3)式
Figure GDA0002003510130000072
式(3)可以使用KSVD算法进行求解,得到字典Dm和分类器Qm,用OMP算法求解稀疏表示矩阵Am
b)利用分类器计算训练样本的分类结果
根据步骤a)得到的分类器Qm和第i个样本的稀疏表示向量αm,i求得样本类别估计向量
Figure GDA0002003510130000073
根据式(4)可以得到第i个样本的预测结果Pm,i
Figure GDA0002003510130000074
c)计算分类器的分类误差
通过(5)式计算第m个分类器的分类误差。
Figure GDA0002003510130000075
d)计算第m个分类器的权值系数
使用式(6)计算第m个分类器的权值系数βm
Figure GDA0002003510130000076
e)更新样本权重
第m+1次迭代样本的权重为Wm+1=(wm+1,1,…,wm+1,i,…,wm+1,N),其中各分量使用式(7)计算:
Figure GDA0002003510130000081
重复步骤a)~e),直到最大迭代次数M。
2、基于多个弱分类器进行分类
f)利用步骤1求得的字典计算待分类数据的稀疏表示。
Figure GDA0002003510130000082
y为待分类数据,用OMP算法可以求解式(8)得到待分类数据的稀疏表示am,相应于M个字典得到对应的M个稀疏表示。
g)利用第m个弱分类器进行分类,得到预测结果Pm。如式(9)利用步骤1求得的分类器权值系数对弱分类器的预测结果进行组合:
Figure GDA0002003510130000083
最终分类结果P如式(10)。
Figure GDA0002003510130000084
基于图像分类任务验证自适应增强稀疏表示方法的有效性
本发明在三个基于分类任务的图像数据集上进行实验,并且将分类精度与目前主流稀疏表示模型进行对比,包括KSVD、DKSVD、LC-KSVD1和LC-KSVD2。其中KSVD是经典的字典学习方法,DKSVD在KSVD基础上加入分类误差项,LC-KSVD1在KSVD基础上加入标签一致项,LC-KSVD2在KSVD基础上加入分类误差项和标签一致项。
图3表示Amazon10数据库目标函数取值和迭代次数的关系,可以看到随着迭代次数的增加,目标函数值逐渐减小,最终趋于稳定,证明本发明中的目标函数收敛。
本发明使用两个数据库(Caltech10图像分类数据库和Amazon10图像分类数据库)测试所提方法的有效性。
Caltech10图像数据库的图像尺寸为300*200,包括10个语义类别,每类约100张图像,共1123张图像。每个类别选取该类别数目的60%组成训练集,其余40%组成测试集合,得到训练集合包含673张图像,测试集合450张图像。本发明利用SURF方法提取图像特征,特征维度为800维。字典原子数量设为300,参数γ=20,稀疏约束参数θ=30。本发明提出的方法及对比方法的识别精度如表1所示,可以看出在此数据库下,本发明提出的方法得到最高准确率。
表1
Figure GDA0002003510130000091
Amazon10图像数据库包括10个语义类别,每类约100张图像,共958张图。同样以6/4的形式分割数据集,得到训练集包含574张图像,测试集包含384张图像。本发明利用SURF方法提取图像特征,特征维度为800维。字典原子数量设为300,参数γ=4,稀疏约束参数θ=30。本发明提出的方法及对比方法的识别精度如表2所示,可以看出在此数据库下,本发明提出的方法得到最高准确率。
表2
Figure GDA0002003510130000101
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

Claims (2)

1.一种基于稀疏表示的图像识别方法,其特征在于:该方法包括以下步骤:
(1)基于自适应增强字典学习过程学习多个字典及相应的弱分类器,并计算分类器权值系数;
(2)基于步骤(1)学习的多个字典计算待分类数据的稀疏表示向量,再利用相应的弱分类器进行分类,加权组合各弱分类器识别结果而得到最终识别结果;
所述步骤(1)包括以下分步骤:
(1.1)初始化训练样本的权重,初始化第i个样本的权重为
Figure FDA0002733989220000011
N为样本数量,训练样本的初始权重记为W1=(w1,1,K,w1,i,K,w1,N);训练样本来自Caltech10图像分类数据库和Amazon10图像分类数据库;
(1.2)字典学习和分类器训练,迭代M轮,得到M个字典、M个分类器及相应的分类器权值系数;
所述步骤(1.2)包括以下步骤:
a)联合训练字典和分类器
第m个字典Dm、第m个分类器Qm和第m个稀疏表示矩阵Am通过公式(1)求出:
Figure FDA0002733989220000012
其中
Figure FDA0002733989220000013
为第i个训练样本,S为样本维度;m为迭代索引,1≤m≤M;
Figure FDA0002733989220000014
表示第m个字典,K为字典原子数量;
Figure FDA0002733989220000015
表示第m个分类器,C为类别数;
Figure FDA0002733989220000021
为第i个样本的标签向量;wm,i为第m轮迭代第i个样本的权重;
Figure FDA0002733989220000022
为第m轮迭代第i个样本的稀疏表示向量,训练集的稀疏表示矩阵记为
Figure FDA0002733989220000023
θ为稀疏约束参数;
公式(1)简化变形得到公式(3)
Figure DEST_PATH_FDA0002003510120000021
公式(3)使用KSVD算法进行求解,得到字典Dm和分类器Qm,用OMP算法求解稀疏表示矩阵Am
b)利用分类器计算训练样本的分类结果
根据步骤a)得到的分类器Qm和第i个样本的稀疏表示向量αm,i求得样本类别估计向量
Figure FDA0002733989220000025
根据公式(4)得到第i个样本的预测结果Pm,i
Figure FDA0002733989220000026
c)计算分类器的分类误差
通过公式(5)计算第m个分类器的分类误差
Figure FDA0002733989220000027
d)计算第m个分类器的权值系数
使用公式(6)计算第m个分类器的权值系数βm
Figure FDA0002733989220000028
e)更新样本权重
第m+1次迭代样本的权重为Wm+1=(wm+1,1,K,wm+1,i,K,wm+1,N),其中各分量使用公式(7)计算:
Figure FDA0002733989220000031
重复步骤a)~e),直到最大迭代次数M。
2.根据权利要求1所述的基于稀疏表示的图像识别方法,其特征在于:所述步骤(2)包括以下分步骤:
f)利用步骤(1)求得的字典计算待分类数据的稀疏表示
Figure FDA0002733989220000032
y为待分类数据,用OMP算法求解公式(8)得到待分类数据的稀疏表示am,相应于M个字典得到对应的M个稀疏表示;
g)利用第m个弱分类器进行分类,得到预测结果Pm,通过公式(9)利用步骤(1)求得的分类器权值系数对弱分类器的预测结果进行组合:
Figure FDA0002733989220000033
通过公式(10)获得最终分类结果P
Figure FDA0002733989220000034
CN201910081619.2A 2019-01-28 2019-01-28 一种基于稀疏表示的图像识别方法 Active CN109858546B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910081619.2A CN109858546B (zh) 2019-01-28 2019-01-28 一种基于稀疏表示的图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910081619.2A CN109858546B (zh) 2019-01-28 2019-01-28 一种基于稀疏表示的图像识别方法

Publications (2)

Publication Number Publication Date
CN109858546A CN109858546A (zh) 2019-06-07
CN109858546B true CN109858546B (zh) 2021-03-30

Family

ID=66896498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910081619.2A Active CN109858546B (zh) 2019-01-28 2019-01-28 一种基于稀疏表示的图像识别方法

Country Status (1)

Country Link
CN (1) CN109858546B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543836B (zh) * 2019-08-16 2022-05-10 北京工业大学 一种面向彩色图像的车辆检测方法
CN111709442A (zh) * 2020-05-07 2020-09-25 北京工业大学 一种面向图像分类任务的多层字典学习方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916371A (zh) * 2010-09-01 2010-12-15 北京工业大学 对图像进行光照归一化处理的方法及采用其的图像识别方法
CN102346908A (zh) * 2011-11-04 2012-02-08 西安电子科技大学 基于稀疏表示的sar图像相干斑抑制方法
CN103258210A (zh) * 2013-05-27 2013-08-21 中山大学 一种基于字典学习的高清图像分类方法
CN103345923A (zh) * 2013-07-26 2013-10-09 电子科技大学 一种基于稀疏表示的短语音说话人识别方法
CN103793695A (zh) * 2014-02-10 2014-05-14 天津大学 一种用于人脸识别的多特征空间的子字典联合训练的方法
CN105590328A (zh) * 2015-12-07 2016-05-18 天津大学 基于稀疏表示选择性外观模型的帧自适应目标跟踪算法
CN107844739A (zh) * 2017-07-27 2018-03-27 电子科技大学 基于自适应同时稀疏表示的鲁棒性目标追踪方法
CN108830130A (zh) * 2018-03-30 2018-11-16 徐国明 一种偏振高光谱低空侦察图像典型目标检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140310221A1 (en) * 2013-04-12 2014-10-16 Nec Laboratories America, Inc. Interpretable sparse high-order boltzmann machines
US11501131B2 (en) * 2016-09-09 2022-11-15 SK Hynix Inc. Neural network hardware accelerator architectures and operating method thereof

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916371A (zh) * 2010-09-01 2010-12-15 北京工业大学 对图像进行光照归一化处理的方法及采用其的图像识别方法
CN102346908A (zh) * 2011-11-04 2012-02-08 西安电子科技大学 基于稀疏表示的sar图像相干斑抑制方法
CN103258210A (zh) * 2013-05-27 2013-08-21 中山大学 一种基于字典学习的高清图像分类方法
CN103345923A (zh) * 2013-07-26 2013-10-09 电子科技大学 一种基于稀疏表示的短语音说话人识别方法
CN103793695A (zh) * 2014-02-10 2014-05-14 天津大学 一种用于人脸识别的多特征空间的子字典联合训练的方法
CN105590328A (zh) * 2015-12-07 2016-05-18 天津大学 基于稀疏表示选择性外观模型的帧自适应目标跟踪算法
CN107844739A (zh) * 2017-07-27 2018-03-27 电子科技大学 基于自适应同时稀疏表示的鲁棒性目标追踪方法
CN108830130A (zh) * 2018-03-30 2018-11-16 徐国明 一种偏振高光谱低空侦察图像典型目标检测方法

Also Published As

Publication number Publication date
CN109858546A (zh) 2019-06-07

Similar Documents

Publication Publication Date Title
Izmailov et al. Semi-supervised learning with normalizing flows
CN110209823B (zh) 一种多标签文本分类方法及系统
CN110197286B (zh) 一种基于混合高斯模型和稀疏贝叶斯的主动学习分类方法
CN108710948B (zh) 一种基于聚类均衡和权重矩阵优化的迁移学习方法
CN112528928B (zh) 一种基于自注意力深度网络的商品识别方法
CN110705636B (zh) 一种基于多样本字典学习和局部约束编码的图像分类方法
JPH08106295A (ja) パターン認識方法及び装置
CN108846357B (zh) 一种基于改进增量式非负矩阵分解的人脸识别方法
CN109685093A (zh) 无监督的自适应特征选择方法
Romero et al. Meta-parameter free unsupervised sparse feature learning
CN110543566B (zh) 一种基于自注意力近邻关系编码的意图分类方法
CN109858546B (zh) 一种基于稀疏表示的图像识别方法
CN112149760A (zh) 一种基于异类类内超平面的模糊支持向量机设计方法
CN106021402A (zh) 用于跨模态检索的多模态多类Boosting框架构建方法及装置
CN108154186B (zh) 一种模式识别方法和装置
CN109409231B (zh) 基于自适应隐马尔可夫的多特征融合手语识别方法
CN109063750B (zh) 基于cnn和svm决策融合的sar目标分类方法
Lee et al. Unsupervised visual representation learning via mutual information regularized assignment
CN109145749B (zh) 一种跨数据集的面部表情识别模型构建及识别方法
CN109359677B (zh) 一种耐噪在线多分类核学习算法
CN113590748B (zh) 基于迭代网络组合的情感分类持续学习方法及存储介质
CN110532384B (zh) 一种多任务字典单分类方法、系统、装置及存储介质
CN114373097A (zh) 一种基于无监督的图像分类方法、终端设备及存储介质
Wang et al. Importance sampling based discriminative learning for large scale offline handwritten Chinese character recognition
CN112381070A (zh) 一种快速鲁棒人脸识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant