CN106066992B

CN106066992B - 基于自适应局部约束的判别字典学习的人脸识别方法及系统

Info

Publication number: CN106066992B
Application number: CN201610321262.7A
Authority: CN
Inventors: 李争名; 徐勇
Original assignee: Shenzhen Graduate School Harbin Institute of Technology
Current assignee: Shenzhen Graduate School Harbin Institute of Technology
Priority date: 2016-05-13
Filing date: 2016-05-13
Publication date: 2019-10-18
Anticipated expiration: 2036-05-13
Also published as: CN106066992A

Abstract

本发明提出了一种基于自适应局部约束的判别字典学习算法以解决字典学习算法在人脸识别中存在的问题。本发明首先利用原子构造自适应的拉普拉斯图，使其能够保持字典的局部结构特征。然后，利用编码系数矩阵的行向量与字典的拉普拉斯图设计局部约束判别式项，使得字典具有更强的判别性能，进而设计基于自适应局部约束的判别字典学习的人脸识别系统模型，提高人脸识别的分类性能。本发明算法的顺利开展将丰富和发展基于约束的字典学习理论体系，为增强字典鉴别性能、提升人脸识别的能力起着重要的指导作用。

Description

基于自适应局部约束的判别字典学习的人脸识别方法及系统

技术领域

本发明涉及图像识别技术领域，尤其涉及一种判别字典学习算法及人脸识别系统。

背景技术

训练样本的局部特征对于提高基于字典学习的判别性能起到非常重要的作用。但人脸图像易受光照、姿态和遮挡等因素的影响，导致直接利用人脸图像计算的局部特征并不一定真实的反映人脸间的特征关系，降低基于字典学习的人脸识别系统的分类性能。

发明内容

本发明的目的在于提供一种基于自适应局部约束的判别字典学习算法来解决字典学习算法在人脸识别中存在的问题。

为达上述目的，本发明通过以下技术方案实现：

一种基于自适应局部约束的判别字典学习算法，包括以下步骤：

S1、利用原子构造字典的局部特征模型：利用字典中的原子构造图M：

其中，是第i个原子，K是原子个数，δ是参数，kNN(d_i)表示原子d_i的k近邻原子，M(i,j)是原子d_i和d_j的权重，并反映它们间的相似性；

S2、利用拉普拉斯图来构造原子间的相似性特征，基于原子特征的拉普拉斯图L构造如下：

其中，M是字典D中原子的近邻图，T是利用近邻图M计算的对角矩阵，M_ij是近邻图M中原子间的权重；

S3、利用编码系数矩阵的行向量和拉普拉斯图L保持字典的局部结构信息，则设计的自适应局部约束模型如下：

S4、为了学习一个判别性能强的字典，利用原子的局部特征约束项作为判别式约束项，构造目标函数如下：

s.t.||d_i||²＝1,i＝1,…,K

其中，Y是训练样本集合，D是学习得到的字典，X是编码系数，α和β是调整参数；

S5、目标函数求解：当编码系数矩阵X和拉普拉斯矩阵L固定，则基于局部约束的字典学习算法的目标函数可以转换为：

s.t.||d_i||²＝1,i＝1,…,K

最优的字典D为：D^*＝YX^T(XX^T+Λ)^-1，其中λ_i是第i个等式约束||d_i||²＝1的拉格朗日乘子；其对角元素Λ_ii＝λ_i；一旦获得最优的字典D^*，根据步骤S1和S2更新拉普拉斯矩阵L；然后，计算编码系数矩阵：

其中，soft(.)为软阀值函数，▽_X是关于变量X求导运算。

一种应用于人脸识别系统的基于自适应局部约束的判别字典学习方法，所述方法包括：

A.获得训练样本集合Y,设置参数α,β,γ,δ,k,及迭代次数φ；

B.针对训练样本中的第j类样本，利用K-SVD算法初始化特定类字典D_j和编码系数矩阵X_j；

C.获得初始化字典D⁰＝[D₁,…,D_C]和初始化编码系数矩阵X⁰＝[X₁,…,X_C]，并利用D⁰计算初始化的拉普拉斯矩阵L⁰；

D.For i＝1:φ

利用公式D^*＝YX^T(XX^T+δI)^-1计算字典Dⁱ，其中，I是单位矩阵；

利用字典Dⁱ和公式L＝T-M,T＝diag(t₁,…,t_K),and计算拉普拉斯矩阵Lⁱ，其中，M是字典D中原子的近邻图，T是利用近邻图M计算的对角矩阵，M_ij是近邻图M中原子间的权重；

利用公式计算编码系数矩阵Xⁱ，其中，▽_X是关于变量X的求导运算；

End

E.获得最优的编码系数X和字典D。

一种人脸识别方法，其特征在于，所述方法包括以下步骤：

步骤1，输入人脸训练样本集合Y，利用如权利要求3所述的基于自适应局部约束的判别字典学习方法，获得最优的编码系数X和字典D；

步骤2，利用编码系数矩阵X和训练样本的类标矩阵H计算分类参数W：

W＝HX^T(XX^T+I)^-1

其中，当h_i中第j个元素为非零值时，表明训练样本y_i来自于第j类；

步骤3，获取测试样本y_t；

步骤4，对于测试样本y_t，利用字典D对其稀疏表示如下：

s.t.||x||₀≤T₀

其中T₀表示矢量x中的非零元素个数。利用OMP(Orthogonal Matching Pursuit)算法获得测试样本y_t的最优表示系数x^*；

步骤5，获得测试样本y_t的类标j：

一种人脸识别系统，其特征在于，所述系统包括：

字典学习模块，用于根据输入人脸训练样本集合Y，利用如权利要求3所述的基于自适应局部约束的判别字典学习方法，获得最优的编码系数X和字典D；

分类参数计算模块，用于利用编码系数矩阵X和训练样本的类标矩阵H计算分类参数W：

W＝HX^T(XX^T+I)^-1

人脸图像获取模块，用于获取测试样本y_t；

人脸分类识别模块，用于利用字典D对测试样本y_t稀疏表示如下：

s.t.||x||₀≤T₀

其中T₀表示矢量x中的非零元素个数。利用OMP(Orthogonal Matching Pursuit)算法获得测试样本y_t的最优表示系数x^*，然后获得测试样本y_t的类标

本发明的有益效果是：本发明首先利用原子构造自适应的拉普拉斯图，使其能够保持字典的局部结构特征。然后，利用编码系数矩阵的行向量与字典的拉普拉斯图设计局部约束判别式项，使得字典具有更强的判别性能，进而设计基于自适应局部约束的判别字典学习的人脸识别系统模型，提高人脸识别的分类性能。本算法的顺利开展将丰富和发展基于约束的字典学习理论体系，为增强字典鉴别性能、提升人脸识别的能力起着重要的指导作用。

附图说明

图1是本发明的基于自适应局部约束的判别字典学习算法及人脸识别方法流程图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。

如果利用k均值算法学习字典，则字典可以继承训练样本中的结构特征。根据这一思想，考虑利用原子的局部特征继承训练样本的结构特征，并设计判别式约束项提高字典的判别性能。在此基础上设计基于自适应局部约束的判别字典学习算法提高人脸识别的分类性能。本发明提出的算法步骤如下：

第一步：利用原子构造字典的局部特征模型，由于图能够有效地表示数据间的关系，可以利用图来表示原子间的相似性特征。利用字典(是第i个原子，K是原子个数)中的原子构造图M如下：

其中，δ是参数，kNN(d_i)表示原子d_i的k近邻原子，M(i,j)是原子d_i和d_j的权重，并反映它们间的相似性。

第二步：为了更好的反映原子间的局部特征，利用拉普拉斯图来构造原子间的相似性特征。基于原子特征的拉普拉斯图L构造如下：

第三步：由于字典D是从训练样本中学习得到的，拉普拉斯矩阵L比直接利用训练样本集合具有更强的鲁棒性。由于编码系数矩阵的行向量和原子是一一对于关系，可以利用编码系数矩阵的行向量和拉普拉斯图L保持字典的局部结构信息，则设计的自适应局部约束模型如下(Tr(.)是矩阵的迹运算)：

第四步：为了学习一个判别性能强的字典，利用原子的局部特征约束项作为判别式约束项，设计基于自适应局部约束的字典学习算法(LCDL)如下：

s.t.||d_i||²＝1,i＝1,…,K

其中，Y是训练样本集合，D是学习得到的字典，X是编码系数，α和β是调整参数。是重构项，Tr(X^TLX)是判别式约束项，||X||₁是编码系数约束项，||·||₁是l₁范数，||·||₂是l₂范数。

与目前基于局部约束的判别字典学习算法相比，本发明提出的LCDL算法具有以下特点：(1)利用原子构造字典的拉普拉斯图，继承训练样本的结构特征；(2)判别式约束项具有一定的自适应性和鲁棒性，能减少人脸图像中的噪声对字典判别性能的影响。

当编码系数矩阵X和拉普拉斯矩阵L固定，则基于局部约束的字典学习算法的目标函数可以转换为：

s.t.||d_i||²＝1,i＝1,…,K

公式(5)是一个二次约束的最小平方优化问题，可利用拉格朗日对偶函数转换为：

其中λ＝[λ₁,…,λ_i,…,λ_K](i∈[1,…,K])，λ_i是第i个等式约束(||d_i||²＝1)的拉格朗日乘子。于是可以定义对角矩阵其对角元素Λ_ii＝λ_i。因此，公式(6)可转换为：

为了获得最优的字典D，对公式(7)求一阶导数并令其等于零可得：

DXX^T+DΛ-YX^T＝0 (8)

因此，最优的字典D为：

D^*＝YX^T(XX^T+Λ)^-1 (9)

为了减少计算复杂度，利用δI(I是单位矩阵)代替Λ获得最优的字典D为：

D^*＝YX^T(XX^T+δI)^-1 (10)

一旦获得最优的字典D^*，可以利用公式(2)更新拉普拉斯矩阵L。

当字典D和拉普拉斯矩阵L固定，基于自适应局部约束的判别字典学习算法的目标函数转换为：

令：则公式(11)转换为：

公式(12)的求解等价于公式(13)的求解：

其中，▽f(X₁)是对函数f(.)中的X求导运算。

且η应满足

公式(13)的求解可以转换为：

利用软阀值方法求解如下：

其中soft(.)为软阀值函数。

由于获得的编码系数矩阵不能直接用来分类，可以使用一种简单的线性分类器对测试样本进行分类。具体的分类步骤如下：

(1)利用编码系数矩阵X和训练样本的类标矩阵H计算分类参数W如下：

W＝HX^T(XX^T+I)^-1 (16)

其中，当h_i中第j个元素为非零值时，表明训练样本y_i来自于第j类。

(2)对于测试样本y_t，利用学习得到的字典D对其稀疏表示如下：

s.t.||x||₀≤T₀ (17)

其中T₀表示矢量x中的非零元素个数。利用OMP(Orthogonal Matching Pursuit)算法可以获得测试样本y_t的最优表示系数x^*

(3)测试样本y_t的类标可以利用公式(18)获得

人脸测试图像y_t可以基于摄像头拍摄的视频进行人脸检测算法得到。

表1 LCDL算法

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于自适应局部约束的判别字典学习的人脸识别方法，其特征在于：基于自适应局部约束的判别字典学习方法包括步骤S1-S6：

其中，是编码系数矩阵X的第i行矢量,编码系数矩阵X的第j行矢量，Tr(.)是矩阵的迹运算；

s.t.||d_i||²＝1,i＝1,…,K

其中，Y是训练样本集合，D是学习得到的字典，X是编码系数矩阵，α和β是调整参数；

s.t.||d_i||²＝1,i＝1,…,K

最优的字典D为：D^*＝YX^T(XX^T+Λ)^-1，其对角元素Λ_ii＝λ_i；其中λ_i是第i个等式约束||d_i||²＝1的拉格朗日乘子；一旦获得最优的字典D^*，根据步骤S1和S2更新拉普拉斯矩阵L；

所述步骤S5中，为了减少计算复杂度，利用δI代替Λ获得最优的字典D为：D^*＝YX^T(XX^T+δI)^-1，其中，I是单位矩阵；

S6、当字典D和拉普拉斯矩阵L固定，基于自适应局部约束的判别字典学习算法的目标函数转换为：

令：则公式(1)转换为：

公式(2)的求解等价于公式(3)的求解：

其中，是对函数f(.)中的X求导运算；

且η应满足

公式(3)的求解可以转换为：

利用软阀值方法求解如下：

其中soft(.)为软阀值函数, 是关于变量X的求导运算；

迭代公式(5)，计算得到编码系数矩阵；

当将步骤S1-S6的方法应用于人脸识别时，具体为：

步骤1，求解最优的编码系数X^*和字典D^*，具体包括：

A.获得训练样本集合Y,设置参数α,β,η,δ,n,及迭代次数φ；

B.针对训练样本中的第l类样本y_l，利用K-SVD算法初始化特定类字典D_l和编码系数矩阵X_l，l＝1,2…….,C，其中C是字典中原子的类数；

D.For h＝1:φ

利用公式D^h＝Y^h(X^h)^T(X^h(X^h)^T+δI)^-1计算字典D^h，其中，I是单位矩阵；

利用字典D^h和公式L^h＝T^h-M^h,计算拉普拉斯矩阵L^h，其中，M^h是字典D^h中原子的近邻图，T^h是利用近邻图M^h计算的对角矩阵，是近邻图M^h中原子间的权重；

利用步骤S6中的方法计算编码系数矩阵X^h；

End

E.获得最优的编码系数X^*和字典D^*；

步骤2，利用编码系数矩阵X^*和训练样本的类标矩阵H计算分类参数W：

W＝H(X^*)^T(X^*(X^*)^T+I)^-1

其中，s＝[1,2,…,n]，当h_s中第l个元素为非零值时，表明训练样本y_l来自于第l类；

步骤3，获取测试样本y_t；

步骤4，对于测试样本y_t，利用字典D^*对其稀疏表示如下：

s.t.||x||₀≤T₀

其中T₀表示矢量x中的非零元素个数；利用OMP算法获得测试样本y_t的最优表示系数x^*；

步骤5，获得测试样本y_t的类标l：

2.根据权利要求1所述的人脸识别方法，其特征在于：人脸测试样本y_t基于摄像头拍摄的视频进行人脸检测算法得到。

3.一种人脸识别系统，其特征在于，所述系统包括：

字典学习模块，用于根据输入人脸训练样本集合Y，利用如权利要求1所述的基于自适应局部约束的判别字典学习的人脸识别方法，获得最优的编码系数X^*和字典D^*；

分类参数计算模块，用于利用编码系数矩阵X^*和训练样本的类标矩阵H计算分类参数W：

W＝H(X^*)^T(X^*(X^*)^T+I)^-1

其中，s＝1,……N，当h_s中第l个元素为非零值时，表明训练样本y_l来自于第l类；

人脸图像获取模块，用于获取测试样本y_t；

人脸分类识别模块，用于利用字典D^*对测试样本y_t稀疏表示如下：

s.t.||x||₀≤T₀

其中T₀表示矢量x中的非零元素个数；利用OMP算法获得测试样本y_t的最优表示系数x^*，然后获得测试样本y_t的类标l：

4.根据权利要求3所述的人脸识别系统，其特征在于：人脸测试样本y_t基于摄像头拍摄的视频进行人脸检测算法得到。