CN109858546B

CN109858546B - 一种基于稀疏表示的图像识别方法

Info

Publication number: CN109858546B
Application number: CN201910081619.2A
Authority: CN
Inventors: 王立春; 李爽; 王少帆; 孔德慧
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2019-01-28
Filing date: 2019-01-28
Publication date: 2021-03-30
Anticipated expiration: 2039-01-28
Also published as: CN109858546A

Abstract

公开一种基于稀疏表示的图像识别方法，其能够通过自适应地选择训练样本进行多轮训练，学习多个字典，每个字典有针对性地学习其他字典表示精度欠佳的样本，每个字典对应一个有针对性的弱分类器，对多个弱分类器的分类结果进行加权组合，提升传统稀疏表示应用于分类问题的识别精度。该方法包括以下步骤：(1)基于自适应增强字典学习过程学习多个字典及相应的弱分类器，并计算分类器权值系数；(2)基于步骤(1)学习的多个字典计算待分类数据的稀疏表示向量，再利用相应的弱分类器进行分类，加权组合各弱分类器识别结果而得到最终识别结果。

Description

一种基于稀疏表示的图像识别方法

技术领域

本发明涉及图像处理的技术领域，尤其涉及一种基于稀疏表示的图像识别方法。

背景技术

近年来，稀疏表示算法作为图像分类的工具被广泛应用，通过训练学习字典或将训练样本直接作为字典，基于字典对测试数据进行稀疏编码，通过比较样本在类别字典上的重构误差实现分类。为提升字典方法在分类问题上的表现能力，已有方法在传统稀疏表示方法KSVD的基础上进行改进，在目标函数中加入类别信息，从而达到约束字典的目的。例如，DKSVD(Discriminative KSVD)中，在KSVD的基础上，引入由样本标签矩阵、分类矩阵和稀疏表示矩阵组成的分类误差项，字典的重构误差项和分类器分类误差项同时优化，达到同时提升线性分类器的能力和字典的表达能力的目的。LC-KSVD(Label Consistent KSVD)在KSVD的基础上引入标签一致项，定义字典与标签相关矩阵为判别稀疏矩阵，通过稀疏表示矩阵在转换矩阵上的投影与判别稀疏表示矩阵的差值构成标签一致项，使得通过训练得到的字典原子带有类别标签，从而保证了识别精度。同时LC-KSVD在DKSVD的启发下引入分类误差项，使得字典面向分类问题进行优化，进而得到较好的识别效果。

以上方法存在的问题如下：

基于稀疏表示的图像识别方法通常经过训练学习字典，目前的大部分方法在学习字典的过程中均等地对待每个训练样本。但不同样本复杂程度不同，因此令所有样本对字典训练的贡献相同，一方面可能会带来信息冗余，另一方面导致复杂样本的信息的缺失。

发明内容

为克服现有技术的缺陷，本发明要解决的技术问题是提供了一种基于稀疏表示的图像识别方法，其能够通过自适应地选择训练样本进行多轮训练，学习多个字典，每个字典有针对性地学习其他字典表示精度欠佳的样本，每个字典对应一个有针对性的弱分类器，对多个弱分类器的分类结果进行加权组合，提升传统稀疏表示应用于分类问题的识别精度。

本发明的技术方案是：这种基于稀疏表示的图像识别方法，该方法包括以下步骤：

(1)基于自适应增强字典学习过程学习多个字典及相应的弱分类器，并计算分类器权值系数；

(2)基于步骤(1)学习的多个字典计算待分类数据的稀疏表示向量，再利用相应的弱分类器进行分类，加权组合各弱分类器识别结果而得到最终识别结果。

本发明基于Adboost原理对传统稀疏表示模型学习字典的过程进行改进，在训练过程中自适应地为训练样本分配权重，从而提升字典的表达能力。与此同时在目标函数中增加分类误差项，联合优化字典和分类器，提升识别精度。

附图说明

图1示出了根据本发明的基于稀疏表示的图像识别方法的步骤(1)的流程图。

图2示出了根据本发明的基于稀疏表示的图像识别方法的步骤(2)的流程图。

图3示出了Amazon10数据库目标函数值和迭代次数的关系曲线。

图4示出了根据本发明的基于稀疏表示的图像识别方法的整体流程图。

具体实施方式

如图4所示，这种基于稀疏表示的图像识别方法，该方法包括以下步骤：

(1)基于自适应增强字典学习过程学习多个字典及相应的弱分类器，

并计算分类器权值系数；

(2)基于步骤(1)学习的多个字典计算待分类数据的稀疏表示向量，

再利用相应的弱分类器进行分类，加权组合各弱分类器识别结果而得到最终识别结果。

优选地，所述步骤(1)包括以下分步骤：

(1.1)初始化训练样本的权重，初始化第i个样本的权重为

1≤i≤N，N为样本数量，训练样本的初始权重记

为W₁＝(w_1,1,…，,w_1,i,…,w_1,N)；

(1.2)字典学习和分类器训练，迭代M轮，得到M个字典、M个分类器及相应的分类器权值系数。

优选地，如图1所示，所述步骤(1.2)包括以下步骤：

a)联合训练字典和分类器

第m个字典D_m、第m个分类器Q_m和第m个稀疏表示矩阵A_m通过公式(1)求出：

其中x_i∈R^S为第i个训练样本，S为样本维度；m为迭代索引，1≤m≤M；D_m∈R^S×K表示第m个字典，K为字典原子数量；Q_m∈R^C×K表示第m个分类器，C为类别数；h_i∈R^C为第i个样本的标签向量；w_m,i为第m轮迭代第i个样本的权重；α_m,i∈R^K为第m轮迭代第i个样本的稀疏表示向量，训练集的稀疏表示矩阵记为A_m＝(α_m,1,…，,α_m,i,…,α_m,N)∈R^K×N；θ为稀疏约束参数；

公式(1)简化变形得到公式(3)

公式(3)使用KSVD算法进行求解，得到字典D_m和分类器Q_m，用OMP算法求解稀疏表示矩阵A_m；

b)利用分类器计算训练样本的分类结果

根据步骤a)得到的分类器Q_m和第i个样本的稀疏表示向量α_m,i求得样本类别估计向量

根据公式(4)得到第i个样本的预测结果P_m,i

c)计算分类器的分类误差

通过公式(5)计算第m个分类器的分类误差

d)计算第m个分类器的权值系数

使用公式(6)计算第m个分类器的权值系数β_m

e)更新样本权重

第m+1次迭代样本的权重为W_m+1＝(w_m+1,1,…，,w_m+1,i,…,w_m+1,N)，其中各分量使用公式(7)计算：

重复步骤a)～e)，直到最大迭代次数M。

优选地，如图2所示，所述步骤(2)包括以下分步骤：

f)利用步骤(1)求得的字典计算待分类数据的稀疏表示

y为待分类数据，用OMP算法求解公式(8)得到待分类数据的稀疏表示a_m，相应于M个字典得到对应的M个稀疏表示；

g)利用第m个弱分类器进行分类，得到预测结果P_m，通过公式(9)利用步骤(1)求得的分类器权值系数对弱分类器的预测结果进行组合：

通过公式(10)获得最终分类结果P

以下更详细地说明本发明。

1、自适应增强字典学习

1)初始化训练样本的权重。

初始化第i个样本的权重为

1≤i≤N，N为样本数量，训练样本的初始权重记为W₁＝(w_1,1,…，,w_1,i,…,w_1,N)。

2)字典学习和分类器训练

迭代M轮，得到M个字典、M个分类器及相应的分类器权值系数：

b)联合训练字典和分类器

第m个字典D_m、第m个分类器Q_m和第m个稀疏表示矩阵A_m可以通过式(1)求出：

其中x_i∈R^S为第i个训练样本，S为样本维度；m为迭代索引，1≤m≤M；D_m∈R^S×K表示第m个字典，K为字典原子数量；Q_m∈R^C×K表示第m个分类器，C为类别数；h_i∈R^C为第i个样本的标签向量；w_m,i为第m轮迭代第i个样本的权重；α_m,i∈R^K为第m轮迭代第i个样本的稀疏表示向量，训练集的稀疏表示矩阵记为A_m＝(α_m,1,…,α_m,i,…,α_m,N)∈R^K×N；θ为稀疏约束参数。(1)式可以简化写成(2)式：

对(2)式利用矩阵运算法则可以变形得到(3)式

式(3)可以使用KSVD算法进行求解，得到字典D_m和分类器Q_m，用OMP算法求解稀疏表示矩阵A_m。

b)利用分类器计算训练样本的分类结果

根据式(4)可以得到第i个样本的预测结果P_m,i。

c)计算分类器的分类误差

通过(5)式计算第m个分类器的分类误差。

d)计算第m个分类器的权值系数

使用式(6)计算第m个分类器的权值系数β_m。

e)更新样本权重

第m+1次迭代样本的权重为W_m+1＝(w_m+1,1,…,w_m+1,i,…,w_m+1,N)，其中各分量使用式(7)计算：

重复步骤a)～e)，直到最大迭代次数M。

2、基于多个弱分类器进行分类

f)利用步骤1求得的字典计算待分类数据的稀疏表示。

y为待分类数据，用OMP算法可以求解式(8)得到待分类数据的稀疏表示a_m，相应于M个字典得到对应的M个稀疏表示。

g)利用第m个弱分类器进行分类，得到预测结果P_m。如式(9)利用步骤1求得的分类器权值系数对弱分类器的预测结果进行组合：

最终分类结果P如式(10)。

基于图像分类任务验证自适应增强稀疏表示方法的有效性

本发明在三个基于分类任务的图像数据集上进行实验，并且将分类精度与目前主流稀疏表示模型进行对比，包括KSVD、DKSVD、LC-KSVD1和LC-KSVD2。其中KSVD是经典的字典学习方法，DKSVD在KSVD基础上加入分类误差项，LC-KSVD1在KSVD基础上加入标签一致项，LC-KSVD2在KSVD基础上加入分类误差项和标签一致项。

图3表示Amazon10数据库目标函数取值和迭代次数的关系，可以看到随着迭代次数的增加，目标函数值逐渐减小，最终趋于稳定，证明本发明中的目标函数收敛。

本发明使用两个数据库(Caltech10图像分类数据库和Amazon10图像分类数据库)测试所提方法的有效性。

Caltech10图像数据库的图像尺寸为300*200，包括10个语义类别，每类约100张图像，共1123张图像。每个类别选取该类别数目的60％组成训练集，其余40％组成测试集合，得到训练集合包含673张图像，测试集合450张图像。本发明利用SURF方法提取图像特征，特征维度为800维。字典原子数量设为300，参数γ＝20，稀疏约束参数θ＝30。本发明提出的方法及对比方法的识别精度如表1所示，可以看出在此数据库下，本发明提出的方法得到最高准确率。

表1

Amazon10图像数据库包括10个语义类别，每类约100张图像，共958张图。同样以6/4的形式分割数据集，得到训练集包含574张图像，测试集包含384张图像。本发明利用SURF方法提取图像特征，特征维度为800维。字典原子数量设为300，参数γ＝4，稀疏约束参数θ＝30。本发明提出的方法及对比方法的识别精度如表2所示，可以看出在此数据库下，本发明提出的方法得到最高准确率。

表2

以上所述，仅是本发明的较佳实施例，并非对本发明作任何形式上的限制，凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属本发明技术方案的保护范围。