CN111931595A

CN111931595A - 一种基于广义表示的人脸图像分类方法

Info

Publication number: CN111931595A
Application number: CN202010689694.XA
Authority: CN
Inventors: 王敬; 张宝; 李健; 宣贺君; 孙艳歌; 郭华平
Original assignee: Xinyang Normal University
Current assignee: Xinyang Normal University
Priority date: 2020-07-17
Filing date: 2020-07-17
Publication date: 2020-11-13
Anticipated expiration: 2040-07-17
Also published as: CN111931595B

Abstract

本发明属于人脸识别技术领域，公开一种基于广义表示的人脸图像分类方法；包括：对训练样本

和测试样本

进行归一化；d为人脸图像特征数目，n为训练样本的数目；所述训练样本共包括c类人脸图像；对训练样本和测试样本使用主成分分析进行降维；在MM框架下求解GRC优化问题

得到表示系数α；

λ为调节参数，p表示范数；根据表示系数α计算第i类训练样本的残差r_i；i＝1，2，...，c；并基于r_i对测试样本进行分类。本发明充分利用到除L1范数和L2范数以外的其他不同范数可能带来的稀疏性和鲁棒性等特性，从而具有更高的分类准确率。

Description

一种基于广义表示的人脸图像分类方法

技术领域

本发明属于人脸识别技术领域，尤其涉及一种基于广义表示的人脸图像分类方法。

背景技术

基于稀疏表示的分类方法(Sparse Representation-based Classification，SRC)(Wright,J.,A.Y.Yang,A.Ganesh,S.S.Sastry,and Yi Ma.2009.“Robust FaceRecognition via Sparse Representation.”IEEE Transactions on Pattern Analysisand Machine Intelligence 31(2):210–227.)是一种被广泛应用的人脸识别方法。SRC的基本思想是用所有训练样本的稀疏的线性组合来表示某个测试样本，然后将该测试样本分类至表示误差最小的类别中。稀疏表示的重要性在相关算法中一再被强调，然而协同表示的作用却被忽略。基于协同表示的分类方法(Collaborative Representation-basedClassification，CRC)(Zhang,Lei,Meng Yang,and Xiangchu Feng.2011.“SparseRepresentation or Collaborative Representation:Which Helps Face Recognition？”In 2011International Conference on Computer Vision,471–478.)深入分析研究了稀疏表示和协同表示在人脸分类中的作用，并且证明CRC相对于SRC算法复杂度更低并且分类准确率更高，因而具有极大优势。

作为两种主流的人脸识别方法，SRC和CRC的核心算法可以归结为两种非常接近的优化问题，其目标函数相同，区别在于SRC中采用表示系数的L1范数作为惩罚项，而CRC中采用表示系数的L2范数作为惩罚项。SRC和CRC都固定了惩罚项中所采用的范数，因而没有充分利用到其他不同范数可能带来的稀疏性和鲁棒性等特性。

发明内容

本发明针对SRC和CRC固定了惩罚项中所采用的范数，没有充分利用到除L1范数和L2范数以外的其他不同范数可能带来的稀疏性和鲁棒性等特性的问题，提出一种基于广义表示的人脸图像分类方法。

为了实现上述目的，本发明采用以下技术方案：

一种基于广义表示的人脸图像分类方法，包括：

步骤1：对训练样本

和测试样本

进行归一化；d为人脸图像特征数目，n为训练样本的数目；所述训练样本共包括c类人脸图像；

步骤2：对训练样本和测试样本使用主成分分析进行降维；

步骤3：在MM(Majorization-Minimization，优化最小化)框架下求解GRC(Generalized Representation-based Classification，基于广义表示的分类方法)优化问题

得到表示系数α；

λ为调节参数，p表示范数，0＜p≤2；

步骤4：根据表示系数α计算第i类训练样本的残差r_i；i＝1，2，...，c；并基于r_i对测试样本进行分类。

进一步地，所述步骤3包括：

其中α^(k)为α的第k次迭代结果，α^(k)中不包含零元素；

定义如下替代函数

根据MM框架，迭代地优化g(α|α^(k))以得到GRC优化问题的局部最优解，即

将g(α|α^(k))对α求偏导，并令结果为0，可得

将α^(k)迭代至收敛，即得到表示系数α。

进一步地，判断α^(k)迭代至收敛的条件为：

表示系数的相对误差小于10^-3，即

或者迭代次数达到30次。

进一步地，所述步骤4包括：

令α_i是第i类训练样本X_i在α中对应的表示系数，计算第i类训练样本的残差

则测试样本y的预测类别为

将所有测试样本进行归类。

进一步地，在所述步骤4之后还包括：计算人脸图像平均分类准确率。

与现有技术相比，本发明具有的有益效果：

本发明首先对训练样本和测试样本进行归一化；然后对训练样本和测试样本使用主成分分析进行降维；在MM框架下求解GRC优化问题

得到表示系数α；根据α计算第i类训练样本的残差r_i；并基于r_i对测试样本进行分类。本发明充分利用到惩罚项中所采用的(0,2]任意范数可能带来的稀疏性和鲁棒性等特性，从而具有更高的分类准确率。

附图说明

图1为本发明实施例一种基于广义表示的人脸图像分类方法的基本流程图；

图2为本发明实施例一种基于广义表示的人脸图像分类方法的实验数据集示例图之一；

图3为本发明实施例一种基于广义表示的人脸图像分类方法的分类准确率示例图之一；

图4为本发明实施例一种基于广义表示的人脸图像分类方法的实验数据集示例图之二；

图5为本发明实施例一种基于广义表示的人脸图像分类方法的分类准确率示例图之二。

具体实施方式

下面结合附图和具体的实施例对本发明做进一步的解释说明：

在本发明中的公式中，小写字母表示标量，加粗的小写字母表示列向量，加粗的大写字母表示矩阵。||·||_p为Lp范数。

如图1所示，一种基于广义表示的人脸图像分类方法，包括：

步骤S101：对训练样本

和测试样本

步骤S102：对训练样本和测试样本使用主成分分析进行降维；

步骤S103：在MM框架下求解GRC优化问题

得到表示系数α；

λ为调节参数，p表示范数，0＜p≤2；

步骤S104：根据表示系数α计算第i类训练样本的残差r_i；i＝1，2，...，c；并基于r_i对测试样本进行分类。

进一步地，所述步骤S101中：

为训练样本，其每行为一个特征，每列为一个样本，d为特征数目，n为训练样本的数目，

表示实数；这些样本属于c个类别，其中第i类训练样本为

n_i为第i类训练样本的数目，i＝1，2，...，c；

为测试样本。

进一步地，所述步骤S103包括：

GRC优化问题可以表示为：

其中

为表示系数；λ为调节参数；

本发明在MM框架下求解GRC的优化问题；设f(α)是需要最小化的目标函数，在MM框架下，如果存在一个替代函数g(α|α^(k))满足如下两个关键条件：

f(α^(k))＝g(α^(k)|α^(k))

f(α)≤g(α|α^(k))，对所有α成立

其中α^(k)为表示系数α的第k次迭代结果，那么可以通过如下方式迭代地最小化替代函数g(α|α^(k))来优化f(α)

可以得到

f(α^(k+1))＝f(α^(k+1))-g(α^(k+1)|α^(k))+g(α^(k+1)|α^(k))

≤f(α^(k))-g(α^(k)|α^(k))+g(α^(k+1)|α^(k))

≤f(α^(k))-g(α^(k)|α^(k))+g(α^(k)|α^(k))

＝f(α^(k))

其中第一个不等式成立的原因是f(α)-g(α|α^(k))在α＝α^(k)时取得最大值，这是由两个关键条件来保证的；第二个不等式成立的原因是g(α|α^(k))在α＝α^(k+1)时取得最小值，这是由迭代的规则来保证的。因此，在迭代过程中目标函数单调递减，最终会收敛到一个局部最优值。

对于任意

β不包含零元素，0＜p≤2，不等式

成立，并且当且仅当α＝β时取等号。

GRC优化问题的求解过程具体为：

其中α^(k)为α的第k次迭代结果，α^(k)中不包含零元素，0＜p≤2；

定义如下替代函数

根据MM框架，迭代地优化g(α|α^(k))以得到GRC优化问题的局部最优解即

将g(α|α^(k))对α求偏导，并令结果为0，可得

将α^(k)迭代至收敛，即得到表示系数α。

进一步地，判断α^(k)迭代至收敛的条件为：

表示系数的相对误差小于10^-3，即

或者迭代次数达到30次。

进一步地，所述步骤4包括：

则测试样本y的预测类别为

将所有测试样本进行归类。

进一步地，在所述步骤S104之后还包括：

步骤S105：计算人脸图像平均分类准确率。

为验证本发明效果，进行如下实验：

本实施例中采用两种常见的人脸数据集，即FERET数据集和AR数据集。

FERET数据集包括1400张人脸图像，来自200个被试，每个被试7张图像。这些图像是在不同的面部表情，拍摄角度和光照条件下拍摄的。所有图像经过裁剪和缩放，最终分辨率为80×80。其中前三个被试的图像如图2所示。

对FERET数据集中的每个被试，随机选取4张图像作为训练样本，剩下的3张图像作为测试样本，先对训练样本和测试样本进行归一化，然后用主成分分析进行降维，保留前54个主成分，之后使用GRC对降维后的数据进行分类。将整个过程重复10次，计算平均分类准确率。改变GRC中的Lp范数对应的值，p＝[0.1：0.1∶2.0]，得到平均分类准确率随p值变化的结果如图3所示。最高分类准确率为0.5463，当p＝1.1时取得。当p＝1.0时，GRC退化为SRC，分类准确率为0.5368；当p＝2.0时，GRC退化为CRC，分类准确率为0.4375。该实验结果证明，将SRC中的L1范数和CRC中的L2范数推广至任意范数得到的GRC能够进一步提高该类方法的分类准确率。

AR数据集包括3120张人脸图像，来自120个被试，每个被试26张图像。这些图像是在不同的面部表情和光照条件下拍摄的。部分图像中有太阳镜或者围巾的遮挡。所有图像经过裁剪和缩放，最终的分辨率为50×40。其中第一个被试的图像如图4所示。

对AR数据集中的每个被试，随机选取6张图像作为训练样本，4张图像作为测试样本，类似地依次进行归一化，主成分分析降维，保留前54个主成分，然后使用GRC对降维后的数据进行分类。将整个过程重复10次，计算平均分类准确率，得到平均分类准确率随p值变化的结果如图5所示。最高分类准确率为0.8637，当p＝1.2时取得。当p＝1.0时，GRC退化为SRC，分类准确率为0.8556；当p＝2.0时，GRC退化为CRC，分类准确率为0.8142。该实验结果进一步证明了基于任意范数的GRC方法相对于SRC和CRC的优势。

综上所述，本发明公布的方法在MM框架下，将经典算法SRC和CRC中惩罚项的范数推广至(0,2]的任意数，极大地丰富了基于表示的分类方法的理论，并且进一步提升了分类识别效果，因而具有重要的理论价值和实际意义。

以上所示仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。