CN104573726B

CN104573726B - 基于四等分及各成分重构误差最优组合的人脸图像识别方法

Info

Publication number: CN104573726B
Application number: CN201510014901.0A
Authority: CN
Inventors: 张化祥; 王永欣; 李静; 王强
Original assignee: Shandong Normal University
Current assignee: Shandong Normal University
Priority date: 2015-01-12
Filing date: 2015-01-12
Publication date: 2019-02-19
Anticipated expiration: 2035-01-12
Also published as: CN104573726A

Abstract

本发明公开了一种基于四等分及各成分重构误差最优组合的人脸图像识别方法。将所有图像划分成互不重叠和大小相等的四部分，通过SRC算法学习测试图像每一部分用训练图像相应部分表示的稀疏系数和重构误差，构建重构误差矩阵。通过图像每一部分的分类准确率计算图像各部分的最优权重，对重构误差采用最优权重线性聚合的方法，为测试图像分类。在基于稀疏编码的图像分类方法基础上，对图像不同成分进行加权线性组合，为判别力较强的部分分配较高的权值，为判别力较弱的部分分配较低的权值，从而使图像的整体判别力得到提升，提高了识别准确度。提出的各成分重构误差的最优组合方法对图像不同部分的稀疏重构误差进行最优组合，提高了人脸识别准确率。

Description

基于四等分及各成分重构误差最优组合的人脸图像识别方法

技术领域

本发明涉及一种人脸图像识别方法，尤其涉及一种基于四等分及各成分重构误差最优组合的人脸图像识别方法。

背景技术

图像识别是一项艰巨的任务。由于从互联网或以其他方法可以轻松地获得大量图像，所以图像识别具有巨大的应用前景，成为研究的热点之一。尽管目前已经有许多图像识别方法，但是识别的准确率和高效性仍然是研究的重点。基于稀疏表示的图像分类(SRC，Sparse Representation based Classification)方法成功地将稀疏编码技术用于图像分类，通过基于原子字典的稀疏线性组合来重构高维图像，并且基于测试图像与各个类别对应的重构误差对测试图像进行分类。SRC的成功归功于图像其类别的代表性样本在低维流形上的稀疏表示。许多SRC的扩展方法主要集中在解决稀疏表示中数据的标签信息和局部结构被忽视，以及每一类对应的子词典之间存在一定的关系等问题上。

目前的SRC及其扩展方法有一个共同的缺点，即在进行图像识别时，将图像作为整体考虑，也就是说，对图像的不同部分同等地考虑。实际上，一个图像不同部分所包含的判别信息是完全不同的。例如，在人脸识别中，如果我们把一个人脸图像划分成上下两个大小相同的部分，根据我们的经验，上半部分会比下半部分更具有判别力。因此，在分类中同等考虑不同的图像部分可能没有充分利用图像的判别信息。如何将图像各个部分按照判别能力的大小进行最优组合，实现更有效的分类，成为了一个值得研究的问题。

发明内容

本发明的目的就是为了解决上述问题，提供一种基于四等分及各成分重构误差最优组合的人脸图像识别方法，提高人脸识别的准确率。

本发明的基本思想是：将所有图像划分成互不重叠和大小相等的若干部分，通过SRC算法学习测试图像每一部分用训练图像相应部分表示的稀疏系数和重构误差，构建重构误差矩阵。通过图像每一部分的分类准确率计算图像各部分的最优权重，对重构误差采用最优权重线性聚合的方法，为测试图像分类。

本发明采用如下技术方案：

一种基于各成分重构误差最优组合的人脸图像识别方法，其特征在于包括如下步骤：

步骤一：将已知类别属性但属于L个不同类别的人脸图像训练样本集X和人脸图像测试样本Y以相同的方式，自上而下均匀划分为互不重叠且大小相等的m个部分，划分后，第l类中的每个人脸图像x_li∈X_l(i∈{1,2,…,n_l})分为m部分，每一部分记为x_lij(j∈{1,2,…,m})，其中，X_l表示整个人脸图像训练样本集X中的第l类，n_l表示第l类中的图像数，第l类中所有图像的第j部分组成的集合记为所有L类训练图像的第j部分组成的集合记为X^(j)＝{X_1j,…,X_lj,…,X_Lj}，测试图像的每一部分记为y_j(j∈{1,2,…,m})；

步骤二：将所有训练图像的第j部分矢量化后构成字典矩阵，对测试图像的第j部分进行稀疏编码，得到第j部分的稀疏表示系数，记为w_j＝(w_1j；…,w_lj；…；w_Lj)，对j的m个取值分别进行同样的操作，即对测试图像的每一部分，均得到用训练图像相应部分线性表示的稀疏表示系数，其中稀疏表示系数的求解根据如下公式得到：

min||y_j-X^(j)w_j||²+λ||w_j||₁for j∈{1,2,…,m}，其中λ是用于平衡重构误差与稀疏度的参数；

步骤三：计算测试图像y每个部分对应所有类相应部分的稀疏表示的重构误差，对第l类的第j部分的重构误差表示为d_lj＝||y_j-X_ljw_lj||²，其中j∈{1,2,…,m}和l∈{1,2,…,L}，并得到图像y的损失矩阵D(y)，该损失矩阵中第l行第j列元素由d_lj给出，即

步骤四：根据损失矩阵，计算测试图像各个部分重构误差的最优组合值；

步骤五：重构误差的最优组合值最小的类即判断为测试图像的类，即根据如下公式为测试图像y分配预测类标签：

c_l(y)＝argminf_l(p)。

优选地，步骤四中测试图像各个部分重构误差的最优组合值的计算方法为：对验证图像采用如上相同的划分块和稀疏编码方式，计算验证图像对训练图像第l类的第j部分的重构误差，对每一部分选取重构误差最小的类作为该部分的分类标签，用每一部分的分类结果与真实的分类结果进行比较，得到用每一部分的分类结果作为图像整体分类结果的分类准确率p_j，并按照如下公式计算测试图像各个部分重构误差的最优组合值：

其中，β是归一化参数，不影响分类结果。

优选地，取m的值为4，即将人脸图像自上而下划分为面积相等且不重叠的四块。

本发明的有益效果：在基于稀疏编码的图像分类方法基础上，对图像不同成分进行加权线性组合，为判别力较强的部分分配较高的权值，为判别力较弱的部分分配较低的权值，从而使图像的整体判别力得到提升，提高了识别准确度。本发明提出的各成分重构误差的最优组合方法对图像不同部分的稀疏重构误差进行最优组合，提高了人脸识别准确率。

附图说明

图1为本发明的人脸识别方法的流程图；

图2为本发明中实现图像分块和相应块的稀疏重构方法的示意图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

本发明以ORL、YaleB、AR、PIE多个人脸数据库为实施实例。其中，ORL数据库包含40个人的总计400幅人脸图像，每人10幅图像分别在不同光照条件及不同表情下获得。将人脸图像变换为32×32像素的图像，灰度级255。采用特征脸(Eigenface)方法进行降维。在数据库每人10幅图像中，分别随机选取3，5，6，8幅图像作为训练样例，剩下的作为测试样例。每幅图像是1024维行向量，总计400个向量。将所有的图像互不重叠的水平划分为4部分，将每幅图像变换为4个256维行向量并采用特征脸方法降到100维。

如图1所示为本发明人脸识别方法的流程图，本发明的方法总体包括五个步骤：首先是图像分块。由于人脸图像具有左右对称性，所以采用自上而下的方法分块。同时，根据人脸结构特点，采用四等分。分析和实验证明，这种分块方式对于人脸识别应用是合适的。当应用本方法对其它类型图像进行分类时，可以选择其它适合的分块方式。步骤一的具体实现方式为：将已知类别属性但属于L个不同类别的人脸图像训练样本集X和人脸图像测试样本Y以相同的方式，自上而下均匀划分为互不重叠且大小相等的m个部分，划分后，第l类中的每个人脸图像x_li∈X_l(i∈{1,2,…,n_l})分为m部分，每一部分记为x_lij(j∈{1,2,…,m})，其中，X_l表示整个人脸图像训练样本集X中的第l类，n_l表示第l类中的图像数，第l类中所有图像的第j部分组成的集合记为所有L类训练图像的第j部分组成的集合记为X^(j)＝{X_1j,…,X_lj,…,X_Lj}，测试图像的每一部分记为y_j(j∈{1,2,…,m})。

步骤二是对每一块，分别用SRC算法求稀疏表示系数。相应的图像分块的稀疏重构的对应方式如图2所示。将所有训练图像的第j部分矢量化后构成字典矩阵，对测试图像的第j部分进行稀疏编码，得到第j部分的稀疏表示系数，记为w_j＝(w_1j；…,w_lj；…；w_Lj)，对j的m个取值分别进行同样的操作，即对测试图像的每一部分，均得到用训练图像相应部分线性表示的稀疏表示系数，其中稀疏表示系数的求解根据如下公式得到：

min||y_j-X^(j)w_j||²+λ||w_j||₁for j∈{1,2,…,m}，其中λ是用于平衡重构误差与稀疏度的参数。

步骤三是对每一块，分别求其用每一类相应的块进行稀疏表示的重构误差，即：计算测试图像y每个部分对应所有类相应部分的稀疏表示的重构误差，对第l类的第j部分的重构误差表示为d_lj＝||y_j-X_ljw_lj||²，其中j∈{1,2,…,m}和l∈{1,2,…,L}，并得到图像y的损失矩阵D(y)，该损失矩阵中第l行第j列元素由d_lj给出，即

由此可见，D(y)的每一列表示给定类别下图像不同部分所对应的重构误差，而其每一行表示给定部分下图像不同类别对应的重构误差。

步骤四是计算测试图像各个部分重构误差的最优权重，然后以最优权重加权，得到最优组合值。最优组合值可以由多种方法获得。本发明提出的计算最优权重的公式为：其中p_j是用第j部分的分类结果作为图像整体分类结果的分类准确率。这里将每一类之外的其他类看作一类，把L类的分类问题转化为了二分类问题。步骤四的具体实现为：对验证图像采用如上相同的划分块和稀疏编码方式，计算验证图像对训练图像第l类的第j部分的重构误差d_lj＝||y_j-X_ljw_lj||²，对每一部分选取重构误差最小的类作为该部分的分类标签，用每一部分的分类结果与真实的分类结果进行比较，得到用每一部分的分类结果作为图像整体分类结果的分类准确率p_j，并按照如下公式计算测试图像各个部分重构误差的最优组合值：

步骤五是根据前面得到的重构误差的最优组合值，将重构误差的最优组合值最小的类判断为测试图像的类，即根据如下公式为测试图像y分配预测类标签：

c_l(y)＝argminf_l(p)。

通过实验，得到本方法与SRC方法在多个人脸数据库上的分类准确率比较，如下表所示：

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种基于各成分重构误差最优组合的人脸图像识别方法，其特征在于包括如下步骤：

步骤一：将已知类别属性但属于L个不同类别的人脸图像训练样本集X和人脸图像测试样本Y以相同的方式，自上而下均匀划分为互不重叠且大小相等的m个部分，划分后，第l类中的每个人脸图像x_li∈X_l(i∈{1,2,…,n_l})分为m部分，每一部分记为x_lij(j∈{1,2,…,m})，其中，X_l表示整个人脸图像训练样本集X中的第l类，n_l表示第l类中的图像数，第l类中所有图像的第j部分组成的集合记为X_lj＝{x_l1j,…,x_lij,…,x_lnlj}，所有L类训练图像的第j部分组成的集合记为X^(j)＝{X_1j,…,X_lj,…,X_Lj}，测试图像记为y且其每一部分记为y_j(j∈{1,2,…,m})；

c_l(y)＝argminf_l(p)。

2.如权利要求1所述的人脸图像识别方法，其特征在于：步骤四中测试图像各个部分重构误差的最优组合值的计算方法为：对验证图像采用如上相同的划分块和稀疏编码方式，计算验证图像对训练图像第l类的第j部分的重构误差，对每一部分选取重构误差最小的类作为该部分的分类标签，用每一部分的分类结果与真实的分类结果进行比较，得到用每一部分的分类结果作为图像整体分类结果的分类准确率p_j，并按照如下公式计算测试图像各个部分重构误差的最优组合值：

其中，β是归一化参数，不影响分类结果。

3.如权利要求1或2所述的人脸图像识别方法，其特征在于：取m的值为4，即将人脸图像自上而下划分为面积相等且不重叠的四块。