CN106934350A

CN106934350A - 一种基于Gabor张量的MLFDA人脸识别方法

Info

Publication number: CN106934350A
Application number: CN201710092813.1A
Authority: CN
Inventors: 杨万扣; 孙长银; 彭煜聪; 王川
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2017-02-21
Filing date: 2017-02-21
Publication date: 2017-07-07

Abstract

本发明公开了一种基于Gabor张量的MLFDA人脸识别方法，包括训练阶段和识别阶段；训练阶段的方法为：首先，将所有的训练样本的每张人脸图像进行二维Gabor滤波，一幅人脸图像得到40个Gabor特征，然后，将每个训练样本求得的Gabor特征合成一个三阶张量，利用MLFDA算法计算得到张量样本的最佳投影矩阵，利用最佳投影矩阵将张量样本投影至低维的子空间；识别阶段的方法为：进行二维Gabor滤波，将求得的Gabor特征合成一个三阶张量，利用最佳投影矩阵将待测样本投影至低维的子空间，然后预测待测样本所属的对象。本发明对光照和姿态变化具有较强的鲁棒性，并且这是一种有监督的学习算法，利用了数据的类别信息，提高了人脸的识别率。

Description

一种基于Gabor张量的MLFDA人脸识别方法

技术领域

本发明涉及模式识别、图像处理和计算机视觉领域，特别是涉及一种基于Gabor张量的MLFDA人脸识别方法。

背景技术

近年来，人脸识别凭借着其潜在的应用价值以及理论挑战已经成为计算机视觉领域的一个研究热点。人脸识别不仅在信息安全领域得到广泛的应用与发展，其在日常生活中也有广泛的应用前景。例如现在常见的电子人脸考勤系统，对大量图片按人脸图像进行归档分类，手机客户端的身份验证等。同时人脸识别技术在移动支付平台也逐渐崭露头角，2015年，马云在信息和通信工程类展览会(CeBIT)上演示了“刷脸支付”，PayPal也即将推出的“人脸识别”支付工具，这将有望让人们丢弃传统意义上的钱包，不过也对人脸识别技术提出了更高的要求，开启了人脸识别的新时代。

由于人脸图像容易受到光照、姿态、表情和遮挡物等外在因素的影响，使得人脸图像成为一个相对复杂的样本数据。鉴于Gabor小波有着良好的视觉特性和生物学背景，其在人脸识别的特征提取中表现出巨大的优势，已经成为人脸识别中最经典的特征提取方法之一。另外，Gabor小波能够为图像处理提供较好的方向选择和尺度选择，即可以将Gabor小波变换看做是一个对图像方向和尺度敏感的显微镜，用来捕获原始图像在局部区域内的多尺度和多方向特征。故无论从生物学角度还是技术角度考虑，经Gabor变换后的图像特征表现出极大的优越性。

虽然Gabor特征在人脸识别获得了成功的应用，但是由于使用多尺度多方向的Gabor核函数，使得滤波后的图像特征维数大幅增加，往往会导致“维数灾难”，而如何从Gabor滤波图像的高维特征空间中通过子空间学习来提取最具鉴别能力的特征一直是尚未解决的难点。子空间学习就是把原始的高维数据压缩到一个数据分布更加紧凑的低维空间。Karl Pearson在1901年最早提出了主成分分析(Principal Component Analysis，简称PCA)，属于非监督的维数约简方法，现在被广泛应用在人脸识别中，旨在最大化样本在投影空间中的方差。在未来的几年内，相继诞生了许多新的算法，其中线性判别分析(LinearDiscriminant Analysis,简称LDA)比较典型，其目的是通过最小化类内离散度矩阵和最大化类间离散度矩阵来嵌入判别信息，与PCA相比，LDA利用了数据的类别信息。局部保持投影(Locality Preserving Projections，LPP)是一种新的子空间分析方法，它是非线性方法LE的线性近似，不仅可以保持原始数据非线性流形的结构特点，而且也能够获得新样本点在低维空间的投影。局部线性判别式分析(Local Fisher Discriminant Analysis，LFDA)继承了LDA和LPP的优点，不仅利用了数据的类别信息，还可以保持原始数据非线性流形的结构特点。但是，这几种方法在计算过程中，都需要把图像数据向量化，无形中增加了计算复杂度。

发明内容

发明目的：本发明的目的是提供一种能够解决现有技术中存在的缺陷的基于Gabor张量的MLFDA人脸识别方法。

技术方案：为达到此目的，本发明采用以下技术方案：

本发明所述的基于Gabor张量的MLFDA人脸识别方法，其特征在于：包括训练阶段和识别阶段；

训练阶段的方法为：首先，将所有的训练样本的每张人脸图像进行二维Gabor滤波，一幅人脸图像得到40个Gabor特征，然后，将每个训练样本求得的Gabor特征合成一个三阶张量，利用MLFDA算法计算得到张量样本的最佳投影矩阵，利用最佳投影矩阵将张量样本投影至低维的子空间；

识别阶段的方法为：进行二维Gabor滤波，将求得的Gabor特征合成一个三阶张量，利用最佳投影矩阵将待测样本投影至低维的子空间，然后采用最近邻分类器进行分类识别，预测待测样本所属的对象。

进一步，所述训练阶段中，每个样本都是在5个不同的尺度、8个不同的方向上进行采样。

进一步，所述训练阶段中，二维Gabor滤波利用Gabor小波对人脸图像进行卷积，二维Gabor小波如式(1)所示：

式(1)中，Ψ_μ,v(z)是二维Gabor小波函数的输出，σ＝2π，z为空间位置坐标，k_v＝k_max/f^v为采样尺度，其中v为尺度标号，k_max为最大频率，f是频率中的内核间隔因子，φ_μ＝πμ/8为采样方向，其中μ为方向标号。

进一步，所述训练阶段中，最佳投影矩阵如式(2)所示：

式(2)中，为最佳投影矩阵，n＝1,2,…,N，I_n表示张量样本在第n-mode的维数，P_n为张量样本被投影至低维子空间后第n-mode的维数，P_n＜I_n，为投影之后的张量样本，m＝1,2,…,M，为原始张量，为第i个投影之后的张量样本，为第j个投影之后的张量样本，如式(3)所示，如式(5)所示；

式(3)中，w_ij如式(4)所示，其中n_c为第c类数据的训练样本数，c_i为训练样本所属的类别标签，c_j为训练样本所属的类别标签；

式(4)中，为第i个训练样本，为第j个训练样本，t为高斯核函数的参数；

有益效果：本发明公开了一种基于Gabor张量的MLFDA人脸识别方法，对光照和姿态变化具有较强的鲁棒性，并且这是一种有监督的学习算法，利用了数据的类别信息，提高了人脸的识别率。

附图说明

图1为本发明具体实施方式的方法流程图；

图2为本发明具体实施方式的Gabor滤波器的幅值响应；

图3为本发明具体实施方式的人脸图像的Gabor滤波结果；

图4为本发明具体实施方式的三阶张量及其展开示意图；

图5为本发明具体实施方式的三阶张量与矩阵的1-mode Product示意图；

图6为Yale、ORL、FERET人脸库的一个对象的人脸图片。

具体实施方式

下面结合附图和具体实施方式对本发明的技术方案作进一步的介绍。

本具体实施方式公开了一种基于Gabor张量的MLFDA人脸识别方法，如图1所示，包括训练阶段和识别阶段；

识别阶段的方法为：进行二维Gabor滤波，将求得的Gabor特征合成一个三阶张量，利用最佳投影矩阵将待测样本投影至低维的子空间，然后预测待测样本所属的对象。

训练阶段中，二维Gabor滤波利用Gabor小波对人脸图像进行卷积，二维Gabor小波如式(1)所示：

式(1)中，Ψ_μ,v(z)是二维Gabor小波函数的输出，σ＝2π，z为空间位置坐标，k_v＝k_max/f^v为采样尺度，其中v为尺度标号，k_max为最大频率，f是频率中的内核间隔因子，φ_μ＝πμ/8为采样方向，其中μ为方向标号。在空域中，二维Gabor滤波器的参数φ_μ，k_v和σ分别反映了滤波器纹理方向、纹理的波长和高斯窗口的大小。

本具体实施方式采用Gabor核函数的幅值响应与图像进行卷积，图2显示了Gabor核函数在5个尺度、8个方向上的幅值响应。将原始人脸图像记为I，通过将其分别与上述40个Gabor滤波器进行卷积，可以得到基于Gabor变换的人脸图像，其数学表示为：

J(z)＝I(z)*Ψ_μ,v(z) (2)

其中，z＝(x,y)，J(z)称为Gabor人脸。

利用Gabor小波对原始图像进行滤波后得到的人脸特征是复数的形式，其可写成：

其中A和分别表示Gabor人脸J(z)的幅值特征和相位特征，它们的定义如下：

由于Gabor的相位信息随着空间位置变化呈现出周期性，而其幅值变化则相对平滑稳定，故本方法这里选取Gabor的幅值特征，图3是ORL数据库中一幅原始人脸图像与其40个Gabor幅值特征(每一行代表一个方向，每一列代表一个尺度)的示意图。

图像中的每个像素点共有40个Gabor幅值系数，这可以看作一个40维的Gabor特征。所以一个大小为h×w的二维图像，可以经过40个Gabor滤波器后形成一个h×w×40的三阶Gabor张量。

为了表示清晰，本方法用花样字体(Monotype Corsiva)表示张量(例如x)，用大写新罗马字体(Times New Roman)表示矩阵(例如X)，用小写字母表示尺度(例如i)。张量又称为多阶阵列，是向量和矩阵的高阶推广。N阶张量可表示成如图4就是一个的三阶张量及其展开示意图。

张量的范数可表示为：

两个相同维数大小张量的内积可表示为：

张量的n模式展开(又称为n模式矩阵化)矩阵用X_(n)表示，张量的n模式纤维(fiber)是矩阵X_(n)的列，即

张量与矩阵的n模乘积用表示，是一个I₁×…I_n-1×J×I_n+1×…×I_N大小的张量，其(i₁,…,i_n-1,j,i_n+1,…,i_N)元素定义为

如图5为三阶张量与矩阵的1-mode Product示意图。

训练阶段中，最佳投影矩阵如式(9)所示：

式(9)中，为最佳投影矩阵，n＝1,2,…,N，I_n表示张量样本在第n-mode的维数，P_n为张量样本被投影至低维子空间后第n-mode的维数，P_n＜I_n，为投影之后的张量样本，m＝1,2,…,M，为原始张量，为第i个投影之后的张量样本，为第j个投影之后的张量样本，如式(10)所示，如式(12)所示；

式(10)中，w_ij如式(11)所示，n_c为第c类数据的训练样本数，c_i为训练样本所属的类别标签，c_j为训练样本所属的类别标签；

式(11)中，为第i个训练样本，为第j个训练样本，t为高斯核函数的参数；

为了验证所提方法的有效性，我们分别在ORL、FERET和YALE三个公开数据库上进行实验。图6为Yale、ORL、FERET人脸库的一个对象的人脸图片。

本方法中所用的FERET数据库含了100个人的700幅图片，每人共有7幅包含光照、表情和姿态变化的图片。在实验中，所有图片均被统一裁剪到40×40大小。在FERET实验中，本方法随机选取每个人的4张图片作为训练样本，剩下的则作为测试样本，本方法为每组实验重复10次并取其平均值作为最终的结果。

ORL人脸库包含40个人，每个人10幅图像，共400张图像，每张图片的大小为92×112。数据库中40个人来自于不同种族，且年龄也不相同。如图4所示，人的人脸在表情和细节上均有变化，主要明显特征有笑与不笑、眼睛睁着或合着，戴眼镜或不带，其中姿态也有变化。实验中，每个人随机抽取一半的图像作为训练集，剩下的作为测试集。将每组实验重复10次取其平均值作为最终的结果。

YALE数据库包含15个人脸的165幅图片，每个人脸共有11张不同表情、光照变化的图像。如图4所示，其从左到右依次是中心光照、戴眼镜、开心、左侧光照、不戴眼镜、正常、右侧光照、伤心、昏昏欲睡、惊讶和眨眼变化。在我们的实验中，所有图片均被裁剪到100×100大小。在Yale实验中，我们随机选取5张图片作为训练样本，剩下的作为测试样本，我们将每组实验重复10次，并取其平均值作为最终的结果。

本方法在多个人脸库上的实验结果表明，其对人脸识别中的光照、姿态和表情变化具有一定的健壮性，其相比于传统方法，识别率得到了较大提高，其实验对比结果如表1所示。

表1各算法在人脸库上的识别率

	PCA	LPP	LFDA	MPCA	Gabor+MLFDA
						ORL数据库	89.50％	88.68％	82.78％	94.77％	98.00％
FERET数据库	47.92％	54.16％	62.50％	46.50％	80.21％
						YALE数据库	81.11％	80.44％	80.78％	76.11％	88.33％

Claims

1.一种基于Gabor张量的MLFDA人脸识别方法，其特征在于：包括训练阶段和识别阶段；

2.根据权利要求1所述的基于Gabor张量的MLFDA人脸识别方法，其特征在于：所述训练阶段中，每个样本都是在5个不同的尺度、8个不同的方向上进行采样。

3.根据权利要求1所述的基于Gabor张量的MLFDA人脸识别方法，其特征在于：所述训练阶段中，二维Gabor滤波利用Gabor小波对人脸图像进行卷积，二维Gabor小波如式(1)所示：

\begin{matrix} Ψ_{μ, v} (z) = \frac{| | k_{μ, v} | |^{2}}{σ^{2}} \exp (- \frac{| | k_{μ, v} | |^{2} | | z | |^{2}}{2 σ^{2}}) \cdot [\exp ({ik}_{μ, v} z) - \exp (- \frac{σ^{2}}{2})] \\ k_{μ, v} = k_{v} e^{{iφ}_{μ}}, z = (x, y) \end{matrix} - - - (1)

4.根据权利要求1所述的基于Gabor张量的MLFDA人脸识别方法，其特征在于：所述训练阶段中，最佳投影矩阵如式(2)所示：

A_{i j}^{B} = \{\begin{matrix} w_{i j} (\frac{1}{N} - \frac{1}{n_{c}}) & i f & c_{i} = c_{j} \\ \frac{1}{N} & i f & c_{i} &NotEqual; c_{j} \end{matrix} - - - (3)

A_{i j}^{W} = \{\begin{matrix} \frac{w_{i j}}{n_{c}} & i f & c_{i} = c_{j} \\ 0 & i f & c_{i} &NotEqual; c_{j} \end{matrix} - - - (5) .