CN106934350A - 一种基于Gabor张量的MLFDA人脸识别方法 - Google Patents

一种基于Gabor张量的MLFDA人脸识别方法 Download PDF

Info

Publication number
CN106934350A
CN106934350A CN201710092813.1A CN201710092813A CN106934350A CN 106934350 A CN106934350 A CN 106934350A CN 201710092813 A CN201710092813 A CN 201710092813A CN 106934350 A CN106934350 A CN 106934350A
Authority
CN
China
Prior art keywords
gabor
sample
training
dimensional
tensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710092813.1A
Other languages
English (en)
Inventor
杨万扣
孙长银
彭煜聪
王川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201710092813.1A priority Critical patent/CN106934350A/zh
Publication of CN106934350A publication Critical patent/CN106934350A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于Gabor张量的MLFDA人脸识别方法,包括训练阶段和识别阶段;训练阶段的方法为:首先,将所有的训练样本的每张人脸图像进行二维Gabor滤波,一幅人脸图像得到40个Gabor特征,然后,将每个训练样本求得的Gabor特征合成一个三阶张量,利用MLFDA算法计算得到张量样本的最佳投影矩阵,利用最佳投影矩阵将张量样本投影至低维的子空间;识别阶段的方法为:进行二维Gabor滤波,将求得的Gabor特征合成一个三阶张量,利用最佳投影矩阵将待测样本投影至低维的子空间,然后预测待测样本所属的对象。本发明对光照和姿态变化具有较强的鲁棒性,并且这是一种有监督的学习算法,利用了数据的类别信息,提高了人脸的识别率。

Description

一种基于Gabor张量的MLFDA人脸识别方法
技术领域
本发明涉及模式识别、图像处理和计算机视觉领域,特别是涉及一种基于Gabor张量的MLFDA人脸识别方法。
背景技术
近年来,人脸识别凭借着其潜在的应用价值以及理论挑战已经成为计算机视觉领域的一个研究热点。人脸识别不仅在信息安全领域得到广泛的应用与发展,其在日常生活中也有广泛的应用前景。例如现在常见的电子人脸考勤系统,对大量图片按人脸图像进行归档分类,手机客户端的身份验证等。同时人脸识别技术在移动支付平台也逐渐崭露头角,2015年,马云在信息和通信工程类展览会(CeBIT)上演示了“刷脸支付”,PayPal也即将推出的“人脸识别”支付工具,这将有望让人们丢弃传统意义上的钱包,不过也对人脸识别技术提出了更高的要求,开启了人脸识别的新时代。
由于人脸图像容易受到光照、姿态、表情和遮挡物等外在因素的影响,使得人脸图像成为一个相对复杂的样本数据。鉴于Gabor小波有着良好的视觉特性和生物学背景,其在人脸识别的特征提取中表现出巨大的优势,已经成为人脸识别中最经典的特征提取方法之一。另外,Gabor小波能够为图像处理提供较好的方向选择和尺度选择,即可以将Gabor小波变换看做是一个对图像方向和尺度敏感的显微镜,用来捕获原始图像在局部区域内的多尺度和多方向特征。故无论从生物学角度还是技术角度考虑,经Gabor变换后的图像特征表现出极大的优越性。
虽然Gabor特征在人脸识别获得了成功的应用,但是由于使用多尺度多方向的Gabor核函数,使得滤波后的图像特征维数大幅增加,往往会导致“维数灾难”,而如何从Gabor滤波图像的高维特征空间中通过子空间学习来提取最具鉴别能力的特征一直是尚未解决的难点。子空间学习就是把原始的高维数据压缩到一个数据分布更加紧凑的低维空间。Karl Pearson在1901年最早提出了主成分分析(Principal Component Analysis,简称PCA),属于非监督的维数约简方法,现在被广泛应用在人脸识别中,旨在最大化样本在投影空间中的方差。在未来的几年内,相继诞生了许多新的算法,其中线性判别分析(LinearDiscriminant Analysis,简称LDA)比较典型,其目的是通过最小化类内离散度矩阵和最大化类间离散度矩阵来嵌入判别信息,与PCA相比,LDA利用了数据的类别信息。局部保持投影(Locality Preserving Projections,LPP)是一种新的子空间分析方法,它是非线性方法LE的线性近似,不仅可以保持原始数据非线性流形的结构特点,而且也能够获得新样本点在低维空间的投影。局部线性判别式分析(Local Fisher Discriminant Analysis,LFDA)继承了LDA和LPP的优点,不仅利用了数据的类别信息,还可以保持原始数据非线性流形的结构特点。但是,这几种方法在计算过程中,都需要把图像数据向量化,无形中增加了计算复杂度。
发明内容
发明目的:本发明的目的是提供一种能够解决现有技术中存在的缺陷的基于Gabor张量的MLFDA人脸识别方法。
技术方案:为达到此目的,本发明采用以下技术方案:
本发明所述的基于Gabor张量的MLFDA人脸识别方法,其特征在于:包括训练阶段和识别阶段;
训练阶段的方法为:首先,将所有的训练样本的每张人脸图像进行二维Gabor滤波,一幅人脸图像得到40个Gabor特征,然后,将每个训练样本求得的Gabor特征合成一个三阶张量,利用MLFDA算法计算得到张量样本的最佳投影矩阵,利用最佳投影矩阵将张量样本投影至低维的子空间;
识别阶段的方法为:进行二维Gabor滤波,将求得的Gabor特征合成一个三阶张量,利用最佳投影矩阵将待测样本投影至低维的子空间,然后采用最近邻分类器进行分类识别,预测待测样本所属的对象。
进一步,所述训练阶段中,每个样本都是在5个不同的尺度、8个不同的方向上进行采样。
进一步,所述训练阶段中,二维Gabor滤波利用Gabor小波对人脸图像进行卷积,二维Gabor小波如式(1)所示:
式(1)中,Ψμ,v(z)是二维Gabor小波函数的输出,σ=2π,z为空间位置坐标,kv=kmax/fv为采样尺度,其中v为尺度标号,kmax为最大频率,f是频率中的内核间隔因子,φμ=πμ/8为采样方向,其中μ为方向标号。
进一步,所述训练阶段中,最佳投影矩阵如式(2)所示:
式(2)中,为最佳投影矩阵,n=1,2,…,N,In表示张量样本在第n-mode的维数,Pn为张量样本被投影至低维子空间后第n-mode的维数,Pn<In为投影之后的张量样本,m=1,2,…,M,为原始张量,为第i个投影之后的张量样本,为第j个投影之后的张量样本,如式(3)所示,如式(5)所示;
式(3)中,wij如式(4)所示,其中nc为第c类数据的训练样本数,ci为训练样本所属的类别标签,cj为训练样本所属的类别标签;
式(4)中,为第i个训练样本,为第j个训练样本,t为高斯核函数的参数;
有益效果:本发明公开了一种基于Gabor张量的MLFDA人脸识别方法,对光照和姿态变化具有较强的鲁棒性,并且这是一种有监督的学习算法,利用了数据的类别信息,提高了人脸的识别率。
附图说明
图1为本发明具体实施方式的方法流程图;
图2为本发明具体实施方式的Gabor滤波器的幅值响应;
图3为本发明具体实施方式的人脸图像的Gabor滤波结果;
图4为本发明具体实施方式的三阶张量及其展开示意图;
图5为本发明具体实施方式的三阶张量与矩阵的1-mode Product示意图;
图6为Yale、ORL、FERET人脸库的一个对象的人脸图片。
具体实施方式
下面结合附图和具体实施方式对本发明的技术方案作进一步的介绍。
本具体实施方式公开了一种基于Gabor张量的MLFDA人脸识别方法,如图1所示,包括训练阶段和识别阶段;
训练阶段的方法为:首先,将所有的训练样本的每张人脸图像进行二维Gabor滤波,一幅人脸图像得到40个Gabor特征,然后,将每个训练样本求得的Gabor特征合成一个三阶张量,利用MLFDA算法计算得到张量样本的最佳投影矩阵,利用最佳投影矩阵将张量样本投影至低维的子空间;
识别阶段的方法为:进行二维Gabor滤波,将求得的Gabor特征合成一个三阶张量,利用最佳投影矩阵将待测样本投影至低维的子空间,然后预测待测样本所属的对象。
训练阶段中,二维Gabor滤波利用Gabor小波对人脸图像进行卷积,二维Gabor小波如式(1)所示:
式(1)中,Ψμ,v(z)是二维Gabor小波函数的输出,σ=2π,z为空间位置坐标,kv=kmax/fv为采样尺度,其中v为尺度标号,kmax为最大频率,f是频率中的内核间隔因子,φμ=πμ/8为采样方向,其中μ为方向标号。在空域中,二维Gabor滤波器的参数φμ,kv和σ分别反映了滤波器纹理方向、纹理的波长和高斯窗口的大小。
本具体实施方式采用Gabor核函数的幅值响应与图像进行卷积,图2显示了Gabor核函数在5个尺度、8个方向上的幅值响应。将原始人脸图像记为I,通过将其分别与上述40个Gabor滤波器进行卷积,可以得到基于Gabor变换的人脸图像,其数学表示为:
J(z)=I(z)*Ψμ,v(z) (2)
其中,z=(x,y),J(z)称为Gabor人脸。
利用Gabor小波对原始图像进行滤波后得到的人脸特征是复数的形式,其可写成:
其中A和分别表示Gabor人脸J(z)的幅值特征和相位特征,它们的定义如下:
由于Gabor的相位信息随着空间位置变化呈现出周期性,而其幅值变化则相对平滑稳定,故本方法这里选取Gabor的幅值特征,图3是ORL数据库中一幅原始人脸图像与其40个Gabor幅值特征(每一行代表一个方向,每一列代表一个尺度)的示意图。
图像中的每个像素点共有40个Gabor幅值系数,这可以看作一个40维的Gabor特征。所以一个大小为h×w的二维图像,可以经过40个Gabor滤波器后形成一个h×w×40的三阶Gabor张量。
为了表示清晰,本方法用花样字体(Monotype Corsiva)表示张量(例如x),用大写新罗马字体(Times New Roman)表示矩阵(例如X),用小写字母表示尺度(例如i)。张量又称为多阶阵列,是向量和矩阵的高阶推广。N阶张量可表示成如图4就是一个的三阶张量及其展开示意图。
张量的范数可表示为:
两个相同维数大小张量的内积可表示为:
张量的n模式展开(又称为n模式矩阵化)矩阵用X(n)表示,张量的n模式纤维(fiber)是矩阵X(n)的列,即
张量与矩阵的n模乘积用表示,是一个I1×…In-1×J×In+1×…×IN大小的张量,其(i1,…,in-1,j,in+1,…,iN)元素定义为
如图5为三阶张量与矩阵的1-mode Product示意图。
训练阶段中,最佳投影矩阵如式(9)所示:
式(9)中,为最佳投影矩阵,n=1,2,…,N,In表示张量样本在第n-mode的维数,Pn为张量样本被投影至低维子空间后第n-mode的维数,Pn<In为投影之后的张量样本,m=1,2,…,M,为原始张量,为第i个投影之后的张量样本,为第j个投影之后的张量样本,如式(10)所示,如式(12)所示;
式(10)中,wij如式(11)所示,nc为第c类数据的训练样本数,ci为训练样本所属的类别标签,cj为训练样本所属的类别标签;
式(11)中,为第i个训练样本,为第j个训练样本,t为高斯核函数的参数;
为了验证所提方法的有效性,我们分别在ORL、FERET和YALE三个公开数据库上进行实验。图6为Yale、ORL、FERET人脸库的一个对象的人脸图片。
本方法中所用的FERET数据库含了100个人的700幅图片,每人共有7幅包含光照、表情和姿态变化的图片。在实验中,所有图片均被统一裁剪到40×40大小。在FERET实验中,本方法随机选取每个人的4张图片作为训练样本,剩下的则作为测试样本,本方法为每组实验重复10次并取其平均值作为最终的结果。
ORL人脸库包含40个人,每个人10幅图像,共400张图像,每张图片的大小为92×112。数据库中40个人来自于不同种族,且年龄也不相同。如图4所示,人的人脸在表情和细节上均有变化,主要明显特征有笑与不笑、眼睛睁着或合着,戴眼镜或不带,其中姿态也有变化。实验中,每个人随机抽取一半的图像作为训练集, 剩下的作为测试集。将每组实验重复10次取其平均值作为最终的结果。
YALE数据库包含15个人脸的165幅图片,每个人脸共有11张不同表情、光照变化的图像。如图4所示,其从左到右依次是中心光照、戴眼镜、开心、左侧光照、不戴眼镜、正常、右侧光照、伤心、昏昏欲睡、惊讶和眨眼变化。在我们的实验中,所有图片均被裁剪到100×100大小。在Yale实验中,我们随机选取5张图片作为训练样本,剩下的作为测试样本,我们将每组实验重复10次,并取其平均值作为最终的结果。
本方法在多个人脸库上的实验结果表明,其对人脸识别中的光照、姿态和表情变化具有一定的健壮性,其相比于传统方法,识别率得到了较大提高,其实验对比结果如表1所示。
表1各算法在人脸库上的识别率
PCA LPP LFDA MPCA Gabor+MLFDA
ORL数据库 89.50% 88.68% 82.78% 94.77% 98.00%
FERET数据库 47.92% 54.16% 62.50% 46.50% 80.21%
YALE数据库 81.11% 80.44% 80.78% 76.11% 88.33%

Claims (4)

1.一种基于Gabor张量的MLFDA人脸识别方法,其特征在于:包括训练阶段和识别阶段;
训练阶段的方法为:首先,将所有的训练样本的每张人脸图像进行二维Gabor滤波,一幅人脸图像得到40个Gabor特征,然后,将每个训练样本求得的Gabor特征合成一个三阶张量,利用MLFDA算法计算得到张量样本的最佳投影矩阵,利用最佳投影矩阵将张量样本投影至低维的子空间;
识别阶段的方法为:进行二维Gabor滤波,将求得的Gabor特征合成一个三阶张量,利用最佳投影矩阵将待测样本投影至低维的子空间,然后采用最近邻分类器进行分类识别,预测待测样本所属的对象。
2.根据权利要求1所述的基于Gabor张量的MLFDA人脸识别方法,其特征在于:所述训练阶段中,每个样本都是在5个不同的尺度、8个不同的方向上进行采样。
3.根据权利要求1所述的基于Gabor张量的MLFDA人脸识别方法,其特征在于:所述训练阶段中,二维Gabor滤波利用Gabor小波对人脸图像进行卷积,二维Gabor小波如式(1)所示:
Ψ μ , v ( z ) = | | k μ , v | | 2 σ 2 exp ( - | | k μ , v | | 2 | | z | | 2 2 σ 2 ) · [ exp ( ik μ , v z ) - exp ( - σ 2 2 ) ] k μ , v = k v e iφ μ , z = ( x , y ) - - - ( 1 )
式(1)中,Ψμ,v(z)是二维Gabor小波函数的输出,σ=2π,z为空间位置坐标,kv=kmax/fv为采样尺度,其中v为尺度标号,kmax为最大频率,f是频率中的内核间隔因子,φμ=πμ/8为采样方向,其中μ为方向标号。
4.根据权利要求1所述的基于Gabor张量的MLFDA人脸识别方法,其特征在于:所述训练阶段中,最佳投影矩阵如式(2)所示:
式(2)中,为最佳投影矩阵,n=1,2,…,N,In表示张量样本在第n-mode的维数,Pn为张量样本被投影至低维子空间后第n-mode的维数,Pn<In为投影之后的张量样本,m=1,2,…,M,为原始张量,为第i个投影之后的张量样本,为第j个投影之后的张量样本,如式(3)所示,如式(5)所示;
A i j B = w i j ( 1 N - 1 n c ) i f c i = c j 1 N i f c i ≠ c j - - - ( 3 )
式(3)中,wij如式(4)所示,其中nc为第c类数据的训练样本数,ci为训练样本所属的类别标签,cj为训练样本所属的类别标签;
式(4)中,为第i个训练样本,为第j个训练样本,t为高斯核函数的参数;
A i j W = w i j n c i f c i = c j 0 i f c i ≠ c j - - - ( 5 ) .
CN201710092813.1A 2017-02-21 2017-02-21 一种基于Gabor张量的MLFDA人脸识别方法 Pending CN106934350A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710092813.1A CN106934350A (zh) 2017-02-21 2017-02-21 一种基于Gabor张量的MLFDA人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710092813.1A CN106934350A (zh) 2017-02-21 2017-02-21 一种基于Gabor张量的MLFDA人脸识别方法

Publications (1)

Publication Number Publication Date
CN106934350A true CN106934350A (zh) 2017-07-07

Family

ID=59424443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710092813.1A Pending CN106934350A (zh) 2017-02-21 2017-02-21 一种基于Gabor张量的MLFDA人脸识别方法

Country Status (1)

Country Link
CN (1) CN106934350A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781802A (zh) * 2019-10-23 2020-02-11 中山大学 一种基于信息论流形的人脸图像识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030086593A1 (en) * 2001-05-31 2003-05-08 Chengjun Liu Feature based classification
CN103902977A (zh) * 2014-03-31 2014-07-02 华为技术有限公司 基于Gabor二值模式的人脸识别方法及装置
CN104700089A (zh) * 2015-03-24 2015-06-10 江南大学 一种基于Gabor小波和SB2DLPP的人脸识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030086593A1 (en) * 2001-05-31 2003-05-08 Chengjun Liu Feature based classification
CN103902977A (zh) * 2014-03-31 2014-07-02 华为技术有限公司 基于Gabor二值模式的人脸识别方法及装置
CN104700089A (zh) * 2015-03-24 2015-06-10 江南大学 一种基于Gabor小波和SB2DLPP的人脸识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YUCONG PENG等: "Multilinear Local Fisher Discriminant Analysis", 《SPRINGER INTERNATIONAL PUBLISHING AG 2016》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781802A (zh) * 2019-10-23 2020-02-11 中山大学 一种基于信息论流形的人脸图像识别方法
CN110781802B (zh) * 2019-10-23 2023-04-18 中山大学 一种基于信息论流形的人脸图像识别方法

Similar Documents

Publication Publication Date Title
Wang et al. Tensor discriminant color space for face recognition
Wang et al. Sparse tensor discriminant color space for face verification
Choo et al. iVisClassifier: An interactive visual analytics system for classification based on supervised dimension reduction
Ekenel et al. Multiresolution face recognition
Gens et al. Deep symmetry networks
Gangeh et al. Kernelized supervised dictionary learning
CN112368708B (zh) 使用伪图像的面部图像识别
Bougourzi et al. Fusing Transformed Deep and Shallow features (FTDS) for image-based facial expression recognition
Mallouh et al. Utilizing CNNs and transfer learning of pre-trained models for age range classification from unconstrained face images
Schwenk et al. Transformation invariant autoassociation with application to handwritten character recognition
Sharma et al. Class-dependent PCA, MDC and LDA: A combined classifier for pattern classification
Wang et al. Marginface: A novel face recognition method by average neighborhood margin maximization
Mudunuri et al. GenLR-Net: Deep framework for very low resolution face and object recognition with generalization to unseen categories
CN103164689A (zh) 人脸识别方法及系统
Li et al. Kernel learning algorithms for face recognition
He et al. Graph embedding with constraints
Suo et al. Structured dictionary learning for classification
CN104715266A (zh) 基于src-dp与lda相结合的图像特征提取方法
ElBedwehy et al. Face recognition based on relative gradient magnitude strength
CN101216878A (zh) 基于广义非线性判别分析的人脸识别方法
CN106934350A (zh) 一种基于Gabor张量的MLFDA人脸识别方法
Liu et al. Handwritten character recognition with sequential convolutional neural network
Vasilescu A Multilinear (Tensor) Algebraic Framework for Computer Graphics, Computer Vision and Machine Learning
Saini et al. Kannadares-next: A deep residual network for Kannada numeral recognition
CN1979523A (zh) 一种基于块内相关性的二维主元分析人脸识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170707

RJ01 Rejection of invention patent application after publication