CN109063555A

CN109063555A - 基于低秩分解和稀疏表示残差对比的多姿态人脸识别方法

Info

Publication number: CN109063555A
Application number: CN201810667478.8A
Authority: CN
Inventors: 付晓峰; 张予; 付晓鹃; 吴卿; 徐岗; 李建军; 杨易平
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2018-06-26
Filing date: 2018-06-26
Publication date: 2018-12-21
Anticipated expiration: 2038-06-26
Also published as: CN109063555B

Abstract

本发明公开一种基于低秩特征和稀疏表示比较分类的多姿态人脸识别方法。本发明首先通过对偶低秩分解方法对输入人脸图片进行降维分解优化，得到去除了姿态结构的第一型低秩特征；其次结构化不相关的低秩分解，通过增广拉格朗日乘子法ALM进行交替迭代求解获得第二型低秩特征；最后基于稀疏表示的残差对比分类：如果两种特征分类结果相同，则分类标签保持不变，若分类标签不相同时，则构建残差率对比模型，比较两种特征经过稀疏表示后的次最小残差与最小残差的差与最小残差的比值。选择两种特征中残差率较高的分类结果作为最终的分类类别。本发明使用的低秩分解方法和稀疏表示残差对比模型能够有效去除姿态结构对识别效果造成的干扰。

Description

基于低秩分解和稀疏表示残差对比的多姿态人脸识别方法

技术领域

本发明属于计算机图像处理技术领域，涉及一种多种姿态下的基于低秩分解和稀疏表示残差对比的人脸识别方法。

背景技术

多姿态人脸数据在当今社会具有很广泛的用途，基于不同角度的数据感知和数据获取能够帮助研究人员更好地进行数据表示。因此，针对多姿态人脸数据的人脸识别研究也成为生物特征识别和模式识别领域的重要发展方向。

考虑到不同的人脸姿态之间存在较大的差异性，在一个样本中通常存在两种结构，即人脸类别结构和姿态类别结构。这两种类别结构在原始图像数据中是相互纠缠的。因此，如何克服多姿态人脸数据对识别正确率造成的干扰，确保在不同姿态混合情况下获得较高的识别率是人脸识别研究热点之一。

为了进一步研发得到更为准确、高效的人脸识别算法，研究人员在传统机器学习与深度学习等领域均有涉猎。其中包括，2017年，Zhong等人提出了基于CNN的端到端人脸识别算法。Li等人提出年龄因子引导的基于CNN的人脸识别模型，Lu等人提出基于ResNet的低分辨率人脸识别模型，均在人脸识别领域取得了良好的实验效果。

在上述提到的算法中，许多算法对于数据中姿态变化等干扰不具有鲁棒性，容易受到噪声的影响。本发明旨在克服姿态变化和噪声干扰等两个方面问题，提出了在多姿态环境下具有高效性和鲁棒性的人脸识别方法。

发明内容

本发明的目的主要针对多姿态环境下人脸识别准确率不高、鲁棒性差等不足，提出了具有高识别率、高鲁棒性和高效性的人脸识别方法。

本发明的人脸识别方法包含更加完备的低秩分解技术、稀疏表示技术以及分类识别技术。低秩分解技术主要分别使用对偶低秩分解方法和结构化不相关的低秩分解方法。去除角度变化引起的干扰内容，尽可能减小不同角度下的人脸图像之间的差异性。通过稀疏表示分类获得基于低秩分解字典的稀疏残差，并利用残差对比模型获得正确的识别结果。

本发明的步骤如下：

步骤S1：从数据库中选择具有多种不同姿态变化的人脸图片，对其进行尺寸归一化、人脸检测、滤波去噪、直方图均衡化。

步骤S2：在低秩分解模型中添加有监督的正则项。在有监督的情况下，添加的正则项能够充分地引导完成对偶低秩分解。即通过该正则项，能够加强人脸类别特征对分类结果产生的影响，同时使得相同姿态下不同人脸类别间的特征变得易于判别。通过ALM算法求解相应的优化问题，获得第一型低秩特征。

步骤S3：在低秩分解模型中添加基于分类内容的子项以去除相同姿态下的共同信息，有效地提取人脸结构的低秩信息，以保留充足的判别信息来进行人脸分类识别。通过ALM算法求解相应的优化问题，获得第二型低秩特征。

步骤S4：基于稀疏表示残差对比的分类识别，具体地：设计使用残差率对比模型，让两组特征分别得到的最小残差共同辅助完成分类识别。即，如果两种特征分类结果相同，则分类标签保持不变，若分类标签不相同时，则构建残差率对比模型，比较两种特征经过稀疏表示后的次最小残差与最小残差的差与最小残差的比值，选择两种特征中残差率较高的分类结果作为最终的分类类别。

步骤S1所述的步骤如下：

在数据库中选择若干组不同姿态的人脸图片作为实施数据，依次对其进行尺寸归一化、人脸检测、滤波去噪、直方图均衡化。

步骤S2所述的步骤如下：

多姿态数据同时具有两种结构特点，即人脸类别结构和姿态结构,两种结构均需通过分解获得相应的低秩内容。将每一幅输入的人脸图片列向量化获得矩阵X，使用正则项Ω(P,Z_c,Z_v)，并通过增广拉格朗日法(ALM)对其进行对偶低秩分解同时获得Z_c和Z_v，分别为人脸类别低秩内容和姿态低秩内容。获得降维和特征提取后的第一型低秩特征。

步骤S3所述的具体步骤如下：

对于一般的人脸数据而言，人脸图片中的五官等共同部分容易对分类结果产生误导。针对多姿态人脸数据情况，相同姿态下的不同人脸类别表现地更加紧密和相似，加入基于F范数的正则项，通过增广拉格朗日法(ALM)对其进行结构化不相关的低秩分解获得低秩内容和稀疏内容Z,Ε，即第二型低秩特征。

步骤S4所述的具体步骤如下：

考虑到两种不同的低秩特征能够分别提取不同的人脸判别信息。分别使用稀疏表示分类方法(SRC)对两种低秩特征进行分类判别。其中第一型低秩特征采用的是同样经过对偶低秩分解特征提取的测试图片特征，第二型低秩特征是直接将测试图片列向量化后进行分类识别。然后通过残差率对比模型，比较两项分类识别后的残差率大小，选择残差率较大的一项结果作为最后的分类结果。选用CMU-PIE多姿态人脸数据库作为人脸身份学习训练和测试的数据库。

步骤S2具体实现如下：

将多姿态数据用X＝[X₁,…,X_k]表示，其中k表示数据中包含的姿态个数，且每一个姿态的数据用来表示，每一个姿态中包含c个人脸类别，d表示每一张图片列向量化后的维度，m_k表示每一个姿态中包含的样本数量。本发明采用的基础模型如式(1)所示，采用以下模型进行分解：

式中，Z_c和Z_v分别为人脸类别结构和姿态结构的低秩内容。通过式(1)的分解模型，将两种表示结构分解开来。

本发明在基础分解模型中添加正参数λ、和α，分别用于平衡调节人脸类别低秩内容、姿态类别低秩内容和冗余异常，参数由多次循环实验取值确定。添加正则项后的目标优化模型如式(2)所示：

式中，P是经过优化后学习到的子空间，其中p表示降维后的维度。正交约束P^TP＝I_p能够避免P中不必要的冗余解。Ω(P,Z_c,Z_v)为添加的正则项。

在学习到的低维度空间中，人脸类别的低维特征定义为

姿态类别的低维特征定义为为实现良好的特征提取效果，需要最小化不同人脸类别间的Yc特征的差异，减小相同人脸类别的特征距离；

最大化姿态类别的不相似特征Y_v，增大相同姿态下不同人脸类别的特征距离。基于这一目的，添加的正则项为如下形式：

式中，Y_c,i和Y_c,j是Y_c的第i列和第j列。Y_v,i和Y_v,j是Y_v的第i列和第j列。W^c和W^v是调节两项正则项的权重矩阵，其中的权重元素定义如下：

式中，l_i和l_j分别为样本x_i和x_j的标签。表示x_i属于与相同人脸类的样本x_j距离最近的样本集，样本集的大小为k₁。表示x_i属于与相同姿态类的样本x_j距离最近的样本集，样本集的大小为k₂。

根据以上信息，参考LDA算法的公式模型，设计的正则项Ω(P,Z_c,Z_v)如下：

此时可通过该正则项最大化不同类别在同一姿态下的差距。式中L_c和L_v为权重矩阵W^c和W^v的图的拉普拉斯矩阵。为了方便模型的优化求解，将正则项的定义转化为求差的形式，即：

Ω(P,Z_c,Z_v)＝tr(P^TXZ_cL_c(P^TXZ_c)^T)-βtr(P^TXZ_vL_v(P^TXZ_v)^T)(7)

式中，为简洁地完成求解过程，避免公式过于复杂，这里不再考虑比例关系，实验中将系数β设为1。可以看出，式(6)和式(7)中，公式需要达到的目的为最大化不同姿态的不相似性，即Ω_v，同时缩小相同人脸类的不相似性，即Ω_c。通过Ω(P,Z_c,Z_v)这一正则项，达到将两种结构分离的目的。

改进后的对偶低秩分解算法的目标函数如式(2)所示，相应的增广拉格朗日函数为：

式中，Q为拉格朗日乘子，正参数μ为其惩罚系数，<,>表示矩阵的内积。

考虑到增广拉格朗日乘子法在优化求解目标函数的过程中容易导致包括矩阵转换和相乘等在内的较为复杂的矩阵运算，将式(8)中最后三项合并为一个二次项，式(8)被转换为如下公式：

转换后的二次项定义如式(10)所示：

本发明采用交替更新迭代求解Z_c，Z_v等变量。定义第t次迭代的更新变量为Z_c[t]、Z_v[t]、E[t]、P[t]。具体实施步骤如下所示：

1.训练矩阵X，参数变量λ,λ₁,α,L_c,L_v

2.对变量和拉格朗日乘子进行初始化

E₀＝Q₀＝0,ε＝10^-6,ρ＝1.3,μ＝10^-6,μ_max＝10⁶,t_max＝10³,t＝0.

3.Z_c的优化求解表达式为

在式(11)中，对Z_c按式(12)求导：

并令式(11)通过奇异值阈值算子进行求解，即将收缩算子作用于矩阵奇异值。

收缩算子定义如式(13)所示

S_τ[a]＝sgn(a)max(|a|-τ,0) (13)

其中，τ为收缩阈值，a为待控制范围的变量，使用其矩阵版本按矩阵元素进行收缩。根据该种记法，有奇异值阈值算子D_τ[B]＝US_τ[Σ]V^T，其中B＝UΣV^T为矩阵B的奇异值分解操作，B是待进行奇异值分解的矩阵，U和V是分解得到的酉矩阵，Σ对角线上的元素是矩阵B的奇异值。

Z_v的优化求解表达式为

在式(14)中，对Z_v求导：

与式(13)类似，式(16)通过奇异值阈值算子进行求解。

E的优化求解表达式为

式中，为简化公式，定义式(16)通过收缩算子进行求解。

P的优化求解表达式为

式中，作为更新向量，为了简化公式的书写过程，特定义：

4.拉格朗日乘子Q的优化求解表达式为

参数μ的优化求解表达式为

μ＝min(ρμ,μ_max) (20)

5.输出Z_c,Z_v,Ε,P，然后对i进行判断，若i<K，则i＝i+1，跳转

到步骤3；否则结束；,

经过交替迭代优化分解，每一次迭代都分别固定其它值对不同变量进行单独更新。收敛后获得第一型低秩特征。处理后得到用于进行稀疏表示的第一型低秩字典为D₁＝PX。

步骤S3具体实现如下：

针对多姿态人脸数据情况，加入基于F范数的正则项能够充分加强不同人脸类别的不相关性，通过人脸类别的分类优化，能够有针对性地学习相同人脸类别之间的判别信息，弱化相同姿态带来的分类干扰。优化目标函数如式(21)所示：

式中，Z_i，Z_j分别为第i和第j类的人脸数据低秩信息，E_i为稀疏异常内容，引入辅助变量B_i处理拥有不同矩阵对的F范数项，帮助优化求解。由于添加正则项后的目标函数为非凸的，因此在求解过程中，需要根据类别循环迭代求解。

在求解类似目标函数时，由于引入了辅助变量，待求解的目标函数及其相应约束为：

式中，令A＝(Z_i,B_i,E_i)。则相应的拉格朗日扩展函数为：

其中，Φ＝(Q_i,V_i)是拉格朗日乘子，μ>0是惩罚系数。将式(22)代入式(23)后，得到的拉格朗日扩展式为：

按类别进行交替迭代更新，第t+1次迭代的变量更新公式如下，具体实施步骤如下所示：

1.训练矩阵X，参数变量η,ρ

2.使用传统低秩分解方法RPCA进行初始化得到变量

Z[0],B[0],E[0],Q[0],V[0],μ[0]

3.Z_i的优化求解表达式为

式中，为记录简便，定义ψ＝(2μ[t])^-1，且推导有：

A_a＝0.5(X_i-E_i[t]+(1/μ[t])Q_i[t]+B_i[t]+(1/μ[t])V_i[t]) (26)

核范数式(25)可用奇异值阈值进行求解。

E_i的优化求解表达式为

式中，为书写方便，定义ε'＝(λ/μ^k)，A_e＝X_i-Z_i[t+1]+(1/μ^k)Q_i[t]，式(27)通过收缩算子求解。

B_i的优化求解表达式为

令扩展式L关于B_i的偏导数为0，则：

基于此，可以获得B_i的更新公式为：

4.拉格朗日乘子Q_i、V_i优化求解表达式为

Q_i[t+1]＝Q_i[t]⁺μ[t](X_i-Z_i[t+1]-E_i[t+1]) (31)

V_i[t+1]＝V_i[t]+μ[t](B_i[t+1]-Z_i[t+1]) (32)

参数μ的优化求解表达式为

μ[t+1]＝min(ρμ[t],μ_max) (33)

5.输出Z,Ε，然后对i进行判断，若i<K，则i＝i+1，跳转到步骤3；否则结束；,

通过求解以上凸优化问题，得到经过去除了相同姿态相关性的第二型低秩特征。即用于进行稀疏表示的第二型低秩字典D₂＝Z。

步骤S4具体实现如下：

本发明设计使用残差率对比模型，让两组特征分别得到的最小残差共同辅助完成分类识别。即，如果两种特征分类结果相同，则分类标签保持不变，若分类标签不相同时，则构建残差率对比模型，比较两种特征经过稀疏表示后的次最小残差与最小残差的差与最小残差的比值。考虑到正确的分类得到的最小残差与其他错误类别得到的重构残差差距较大，因此在设计对比模型时，选择两种特征中残差率较高的分类结果作为最终的分类类别。

设第一型低秩特征的SRC类别C_d，经过从小到大排序后的最小残差为次最小残差为第二型低秩特征的SRC类别为C_s，经过从小到大排序后的最小残差为次最小残差为且C_d≠C_s，C_d∈{1,2,…,K}，C_s∈{1,2,…,K}，则残差率模型的定义公式为：

则相应的分类识别公式为：

其中，C表示最终分类类别。

本发明相对于现有方法具有以下有益效果：本发明分别对训练数据进行对偶低秩分解和结构化不相关的低秩分解，获得第一型低秩特征和第二型低秩特征。其中，第一型低秩特征将交缠的姿态结构和人脸类别结构分离，保留全面的人脸结构全局信息。第二型低秩特征去除以相同姿态和人脸五官结构为代表的共同部分，保留具有判别性的低秩信息。通过设计两种低秩分解特征的稀疏重构残差率对比模型，选择残差率较大的一类作为分类结果，融合两种特征所能提供的判别信息共同作用进行分类识别。实施例证明，与其他经典方法对比，本发明在处理多种姿态混合的数据环境下具有最高的识别率，在三种或三种以上不同姿态混合的情况下，识别效果具有鲁棒性和高效性。

附图说明

图1表示了本发明即多姿态人脸识别方法从图像输入开始至输出检测结果的流程图；

图2表示姿态结构和人脸类别结构分解示意图；

图3表示CMU-PIE数据库中的人脸图片样本图。

具体实施方式

下面将结合附图对本发明加以详细说明，应指出的是，所描述的实施例仅旨在便于对本发明的理解，而对其不起任何限定作用。

下面将参考附图详细介绍本发明的实施例。

图1是本发明人脸识别方法的流程图，展示了图像从输入到检测结果输出完毕的整个流程。

本实施例选用CMU-PIE多姿态人脸数据库作为人脸身份学习训练和测试的数据库。

本实施例采集多姿态数据集中数据，并用X＝[X₁,…,X_k]表示，其中k表示数据中包含的姿态个数，且每一个姿态的数据用来表示，每一个姿态中包含c个人脸类别，d表示每一张图片列向量化后的维度，m_k表示每一个姿态中包含的样本数量。

1)对偶低秩分解方法获得第一型低秩特征。

式中，Z_c和Z_v分别为人脸类别结构和姿态结构的低秩内容。通过式(1)的分解模型，将两种表示结构分解开来，见图2。

式中，P是经过优化后学习到的子空间，其中p表示降维后的维度。正交约束P^TP＝I_p能够避免P中不必要的的冗余解。Ω(P,Z_c,Z_v)为添加的正则项。

在学习到的低维度空间中，人脸类别的低维特征定义为

姿态类别的低维特征定义为为实现良好的特征提取效果，需要最小化不同人脸类别间的Y_c特征的差异，减小相同人脸类别的特征距离；最大化姿态类别的不相似特征Y_v，增大相同姿态下不同人脸类别的特征距离。基于这一目的，添加的正则项为如下形式：

Ω(P,Z_c,Z_v)＝tr(P^TXZ_cL_c(P^TXZ_c)^T)-βtr(P^TXZ_vL_v(P^TXZ_v)^T)(7)

转换后的二次项定义如式(10)所示：

1.训练矩阵X，参数变量λ,λ₁,α,L_c,L_v

2.对变量和拉格朗日乘子进行初始化

3.Z_c的优化求解表达式为

在式(11)中，对Z_c按式(12)求导：

收缩算子定义如式(13)所示

S_τ[a]＝sgn(a)max(|a|-τ,0) (13)

Z_v的优化求解表达式为

在式(14)中，对Z_v求导：

与式(13)类似，式(16)通过奇异值阈值算子进行求解。

E的优化求解表达式为

式中，为简化公式，定义式(16)通过收缩算子进行求解。

P的优化求解表达式为

式中，作为更新向量，为了简化公式的书写过程，特定义：

4.拉格朗日乘子Q的优化求解表达式为

参数μ的优化求解表达式为

μ＝min(ρμ,μ_max) (20)

5.输出Z_c,Z_v,Ε,P，然后对i进行判断，若i<K，则i＝i+1，跳转到步骤3；否则结束。,

2)结构化不相关的低秩分解方法获得第二型低秩特征。

式中，令A＝(Z_i,B_i,E_i)。则相应的拉格朗日扩展函数为：

1.训练矩阵X，参数变量η,ρ

2.使用传统低秩分解方法RPCA进行初始化得到变量Z[0],B[0],E[0],Q[0],V[0],μ[0]

3.Z_i的优化求解表达式为

式中，为记录简便，定义ψ＝(2μ[t])^-1，且推导有：

A_a＝0.5(X_i-E_i[t]+(1/μ[t])Q_i[t]+B_i[t]+(1/μ[t])V_i[t]) (26)

核范数式(25)可用奇异值阈值进行求解。

E_i的优化求解表达式为

B_i的优化求解表达式为

令扩展式L关于B_i的偏导数为0，则：

基于此，可以获得B_i的更新公式为：

4.拉格朗日乘子Q_i、V_i优化求解表达式为

Q_i[t+1]＝Q_i[t]+μ[t](X_i-Z_i[t+1]-E_i[t+1]) (31)

V_i[t+1]＝V_i[t]+μ[t](B_i[t+1]-Z_i[t+1]) (32)

参数μ的优化求解表达式为

μ[t+1]＝min(ρμ[t],μ_max) (33)

5.输出Z,Ε，然后对i进行判断，若i<K，则i＝i+1，跳转到步骤3；否则结束；

3)基于稀疏表示的残差率对比模型。

则相应的分类识别公式为：

其中，C表示最终分类类别。

实施例

本发明在CMU-PIE数据库中进行测试分析，训练样本如图3所示。这个多姿态数据库均在人脸识别领域有着广泛的应用。

CMU-PIE数据库由68个人的人脸图片组成，其中包括同一个人的多个拍摄姿态下的图片。实验挑选了7个不同姿态的超过10000张人脸图片作为数据集以验证算法的高效性。在实验中，所有实验图片的图像尺寸经过预处理后被裁剪至64×64。每次随机选取不同图片重复进行10次实验，以10次实验结果的平均值作为最终识别率。实验分为两个部分，第一部分是从7个姿态中分别选择不同组合的2-4个不同姿态进行实验。并在人脸训练样本中添加一些噪声和遮挡干扰，将处理后的训练样本看做有10％污染的训练图片。因此第一部分的实验包括无污染人脸数据和有污染人脸数据。第二部分通过修改分解得到的第一型低秩特征和第二型低秩特征的维度，对不同特征维度下的识别效果进行分析。

表1不同姿态组合下的识别率对比

表2复杂姿态下的人脸识别结果

表3 10％污染环境下的多姿态人脸识别结果

经过实验验证，本发明在经典数据库中能获得优越的识别率。分别从7类不同拍摄姿态中挑选2-4类不同姿态进行多种情况下的多姿态人脸识别。并添加噪声和遮挡干扰，验证本发明在受干扰训练数据环境下的鲁棒性和识别效果。其中不同的姿态搭配情况为：Case1{C01,C02},Case2{C05,C09},Case3{C05,C027},Case4{C07,C09},Case5{C27,C29},Case6{C07,C29}。将所提算法的识别结果与其他经典的特征提取人脸识别算法进行对比，其中对比算法包括PCA+NN、PCP+SR C、LR+SRC等多种特征提取和分类算法。

由表1、表2和表3中的实验结果可以看出，在混合多种姿态的复杂姿态环境下，本发明仍能取得良好的识别结果。参与对比的算法中，PCA算法在降维提取特征方面有显著效果，但提取的特征过于简单，包含的判别信息过少，容易受到姿态变换的干扰。SRC算法则是未经过有效的特征提取，直接进行稀疏表示分类识别，因此获得的识别效率也略受影响。而仅采用对偶低秩分解在处理三种或以上姿态混合的情况时，未能展现良好的鲁棒性。

Claims

1.基于低秩分解和稀疏表示残差对比的多姿态人脸识别方法，其特征在于该方法具体是：

步骤S1：从数据库中选择具有多种不同姿态变化的人脸图片，对其进行尺寸归一化、人脸检测、滤波去噪和直方图均衡化；

步骤S2：将每一幅输入的人脸图片列向量化获得矩阵X，在低秩分解模型中添加有监督的正则项Ω(P,Z_c,Z_v)，形成目标优化模型；通过增广拉格朗日法对其进行对偶低秩分解同时获得Z_c和Z_v，从而获得第一型低秩特征；

其中的目标优化模型为：

s.t.P^TX＝P^TX(Z_c+Z_v)+E,P^TP＝I_p

式中，λ、λ₁和α为平衡各变量的正参数，Z_c和Z_v分别为人脸类别结构和姿态结构的低秩内容，E为稀疏内容，P是经过优化后学习到的子空间，p表示降维后的维度；正交约束P^TP＝I_p能够避免P中不必要的冗余解，Ω(P,Z_c,Z_v)为添加的正则项，用于分解姿态结构和人脸类别结构；

步骤S3：在低秩分解模型中添加基于分类内容的子项以去除相同姿态下的共同信息，通过增广拉格朗日法求解目标函数，获得第二型低秩特征；

其中的目标函数为：

s.t.X_i＝Z_i+E_i,i＝1,2,...,K

B_i＝Z_i.

式中，Z_i，Z_j分别为第i和第j类的人脸数据低秩信息，E_i为稀疏异常内容，引入辅助变量B_i处理拥有不同矩阵对的F范数项，帮助优化求解；

步骤S4：设计使用残差率对比模型，让两组特征分别得到的最小残差共同辅助完成分类识别，如果两种特征分类结果相同，则分类标签保持不变，若分类标签不相同时，则构建残差率对比模型，比较两种特征经过稀疏表示后的次最小残差与最小残差的差与最小残差的比值，选择两种特征中残差率较高的分类结果作为最终的分类类别；

其中的残差率对比模型为：

相应的分类公式为：

式中，r_d和r_s分别为两种低秩特征的残差率，C_d为第一型低秩特征的稀疏表示分类类别，为经过从小到大排序后的最小残差，为次最小残差，C_s为第二型低秩特征的稀疏表示分类类别，为经过从小到大排序后的最小残差，为次最小残差，C表示最终分类类别。