CN103246870A - 一种基于梯度稀疏表示的人脸识别方法 - Google Patents

一种基于梯度稀疏表示的人脸识别方法 Download PDF

Info

Publication number
CN103246870A
CN103246870A CN2013101450627A CN201310145062A CN103246870A CN 103246870 A CN103246870 A CN 103246870A CN 2013101450627 A CN2013101450627 A CN 2013101450627A CN 201310145062 A CN201310145062 A CN 201310145062A CN 103246870 A CN103246870 A CN 103246870A
Authority
CN
China
Prior art keywords
gradient
image
training
designated
centerdot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013101450627A
Other languages
English (en)
Inventor
葛永新
马鹏
张小洪
吴凡
洪明坚
徐玲
杨梦宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN2013101450627A priority Critical patent/CN103246870A/zh
Publication of CN103246870A publication Critical patent/CN103246870A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明属于图像处理和模式识别技术领域,公开了基于梯度稀疏表示的人脸识别方法。近年来,由于其优秀的识别效果和广泛的应用前景,基于稀疏表示的人脸识别算法得到了越来越多的关注。然而,基于稀疏表示的人脸识别算法要求训练集是完备的,这个条件在实际应用中很难满足;并且需要求解l1最小化问题,这个过程是十分的耗时。鉴于图像梯度对均匀光照的不敏感性,本发明将图像梯度引入到稀疏表示框架下,同时采用灰度图像的X方向的梯度,Y方向的梯度和图像像素值来识别人脸图像。因此,本发明很大程度上松弛了训练样本集的完备性要求,每个类别只需几张训练样本就可以取得较好的识别效果。并且,本发明通过最小化l2范数来求解测试人脸图像在训练人脸图像集上的稀疏表示系数,因此,本发明速度快,有更广泛的应用价值。

Description

一种基于梯度稀疏表示的人脸识别方法
技术领域
本发明属于人脸识别技术领域,具体涉及一种基于梯度稀疏表示的人脸识别方法人脸图像识别方法。
背景技术
近几十年来,基于整幅图像的人脸识别算法已经得到了深入的研究。同时,众多的特征提取算法被提出,其中最流行的是:主成分分析(Principal ComponentAnalysis,PCA)[1],线性判别分析(Linear Discriminant Analysis,LDA)[2],局部保持投影(Locality Preserving Projections,LPP)[3];PCA的目标是寻找一个能够最大化特征协方差矩阵的迹的正交投影矩阵;LDA探求最优投影方向,使得来自不同类的样本投影之后之间的距离尽可能的大,同时来自同一类的样本投影之后之间的距离尽可能的小;LPP基于图拉普拉斯矩阵,保持样本间本质流行结构的局部信息。另外,一种新的提取局部信息的线性表示算法,非负矩阵分解(Nonnegative Matrix Factorization,NMF)[4]也得到了广泛的关注。自从上述算法被提出,在其基础上,众多的改进算法被相继提出,包括基于张量的改进算法和基于核函数的改进算法。尽管众多特征提取算法已经取得了不错的识别效果,然而每种算法都有自己的优点和缺点,因此,在实际应用中,人们往往很难决定该选用哪种特征。
近来,稀疏表示已经成为计算机视觉、模式识别和信号处理等领域的热门研究课题,尤其是将稀疏表示应用于人脸识别。通过利用稀疏表示具有识别能力的特性,Wright等人提出了基于稀疏表示的分类器(Sparse Representation-basedClassification,SRC)[5],并将其应用于鲁棒的人脸识别系统。基于假设:同一类别的样本分布于一个线性子空间,首先,SRC通过求解l1最小化问题,将一个测试样本表示成全部训练样本的线性组合;然后,SRC将该测试样本归为取得最小重构误差的那个类。传统的基于整幅图像的人脸识别算法都是在关注如何寻找更优的投影矩阵使得不同类别的人脸图像在特征空间能够分开,不同的是,SRC强调线性表示的稀疏性和分类器的设计。尽管通过求解l1最小化问题的稀疏表示已经被广泛应用于很多领域,求解l1最小化问题的计算复杂度太高;对于人脸识别问题,近来很多研究人员指出采用L1范数是没必要的,利用l2范数能够取得近似或者更优的识别效果。
不管采用l1范数还是采用l2范数去求解稀疏表示问题,稀疏表示的模型都要求每个类别都要有充分的训练样本。然而,对于人脸识别任务,每个类别的训练样本一般都是有限的,这使得稀疏表示模型的假设不在成立。最终,对于不完备训练样本集,基于稀疏表示的算法一般不能取得好的识别效果,这很大程度上限制了此类算法在实际场景中的应用。
发明内容
针对现有技术存在的上述问题,本发明要解决的技术问题是:如何提供一种基于稀疏表示的人脸识别方法,使得该方法对于不完备的训练样本集,依然能够取得较高的准确率。
为解决上述技术问题,本发明采用如下技术方案:一种基于梯度稀疏表示的人脸图像识别方法,其特征在于:具体包括如下步骤:
步骤a:构建人脸样本图像数据库:
从c个类别的人脸库中任意选取n张人脸图像作为训练样本,其中每个类别的人脸图像个数记为ni(i=1,2,…,c),其中
Figure BDA00003099288000021
另外选择人脸库中其他的一张图像作为测试样本。对选取的人脸图像进行裁剪,对齐,并调整为a×b像素大小。第i类的第k张训练样本记为Ai,k
Figure BDA00003099288000022
1≤i≤c,1≤k≤ni);测试样本记为U
步骤b:计算人脸图像的X方向和Y方向梯度图像:
b1:采用中心差分法求解训练人脸图像和测试人脸图像的X方向和Y方向的梯度图像。第i类的第k张训练样本的X方向和Y方向度图像分别记为
Figure BDA00003099288000024
Figure BDA00003099288000025
1≤i≤c,1≤k≤ni)。测试样本U的X方向和Y方向梯度图像分别记为Ux,Uy
Figure BDA00003099288000026
b2:将步骤b1中训练和测试人脸图像,以及相应的X方向和Y方向梯度图像按照相同的方式转化为m维向量,其中m=a×b。把训练人脸图像Ai,k以及相应的X方向梯度图像
Figure BDA00003099288000027
Y方向梯度图像
Figure BDA00003099288000028
转化为m维向量,分别记为ai,k
Figure BDA00003099288000029
Figure BDA00003099288000031
(1≤i≤c,1≤k≤ni);把测试人脸图像U以及相应的X方向梯度图像Ux,Y方向梯度图像Uy转化为m向量,分别记为u,ux,uy
Figure BDA00003099288000033
b3:将图像矩阵转化为向量:
b31:将第i类所有的训练样本向量放在同一个矩阵中,记为Ai,即
Figure BDA00003099288000034
(i=1,2,...,c);然后将所有类别的训练样本放在同一个矩阵中,记为A,即
A = [ A 1 , A 2 , · · · , A c ] = [ a 1,1 , a 1,2 , · · · , a 1 , n 1 , a 2,1 , a 2,2 , · · · , a 2 , n 2 , · · · , a c , 1 , a c , 2 , · · · , a c , n c ] ,
Figure BDA00003099288000035
每一列代表一个训练人脸样本;
b32:将第i类所有的训练样本的X方向梯度向量放在同一个矩阵中,记为
Figure BDA00003099288000036
Figure BDA00003099288000037
(i=1,2,…,c);然后将所有类别的训练样本的X方向梯度向量放在同一个矩阵中,记为Ax,即:
A x = [ A 1 x , A 2 x , · · · , A c x ] = [ a 1,1 x , a 1,2 x , · · · , a 1 , n 1 x , a 2,1 x , a 2,2 x , · · · , a 2 , n 2 x , · · · , a c , 1 x , a c , 2 x , · · · , a c , n c x ] ,
Figure BDA00003099288000039
每一列代表一个训练人脸样本的X方向梯度;
b33:将第i类所有的训练样本的Y方向梯度向量放在同一个矩阵中,记为
Figure BDA000030992880000310
Figure BDA000030992880000311
(i=1,2,…,c);然后将所有类别的训练样本的Y方向梯度向量放在同一个矩阵中,记为Ay,即
A y = [ A 1 y , A 2 y , · · · , A c y ] = [ a 1,1 y , a 1,2 y , · · · , a 1, n 1 y , a 2,1 y , a 2,2 y , · · · , a 2 , n 2 y , · · · , a c , 1 y , a c , 2 y , · · · , a c , n c y ] ,
Figure BDA000030992880000313
每一列代表一个训练人脸样本的Y方向梯度;
步骤c:将所有样本及其梯度归一化:
将u,ux和uy分别归一化,使得这三个向量的l2范数为1;将A,Ax和Ay分别归一化,使得这三个矩阵的所有列向量的l2范数为1。为了方便表示,我们将归一化后的所有数据仍用原来符号表示,即下文中出现的u,ux和uy,以及A,Ax和Ay均已经归一化。
步骤d:根据稀疏表示假设,将测试样本及其梯度分别表示成全部训练样本及其梯度的线性组合:
d1:将测试样本u表示成全部训练样本A的线性组合:
u=Aβ                              (1)
其中,
Figure BDA00003099288000041
是待求的系数向量。
d2:将测试样本u的X方向梯度ux表示成全部训练样本X方向梯度Ax的线性组合:
ux=Axδ                    (2)
其中,
Figure BDA00003099288000042
是待求的系数向量。
d3:将测试样本u的Y方向梯度uy表示成全部训练样本Y方向梯度Ay的线性组合:
uy=Ayη                       (3)
其中,
Figure BDA00003099288000043
是待求的系数向量。
步骤e:采用PCA[1]对A,Ax和Ay进行降维,得到A,Ax和Ay的特征矩阵分别为P1,P2,P3,其中
Figure BDA00003099288000044
Figure BDA00003099288000045
Figure BDA00003099288000046
最后,将特征矩阵P1,P2,P3分别乘以等式(1),(2),(3)的左右两边,得:
P 1 u = P 1 Aβ P 2 u x = P 2 A x δ P 3 u y = P 3 A y η - - - ( 4 )
步骤f:采用正则化最小二乘法[7]求解β,δ和η:
β ^ = arg min β { | | P 1 u - P 1 Aβ | | 2 2 + θ | | β | | 2 2 } δ ^ = arg min δ { | | P 2 u x - P 2 A x δ | | 2 2 + θ | | δ | | 2 2 } η ^ = arg min η { | | P 3 u y - P 3 A y η | | 2 2 + θ | | η | | 2 2 } - - - ( 5 )
其中,θ>0,为正则化参数;本专利中,θ=0.01。
通过简单的运算,很容易推导出(5)式的解:
β ^ = ( A T P 1 T P 1 A + θ · I ) - 1 A T P 1 T P 1 u δ ^ = ( ( A x ) T P 2 T P 2 A x + θ · I ) - 1 ( A x ) T P 2 T P 2 u x η ^ = ( ( A y ) T P 3 T P 3 A y + θ · I ) - 1 ( A y ) T P 3 T P 3 u y - - - ( 6 )
其中,
Figure BDA000030992880000410
是单位矩阵。
步骤g:根据像素域和梯度域的系数向量β,δ和η,判断测试样本U的类别:
g1:定义三类向量
Figure BDA00003099288000051
Figure BDA00003099288000052
Figure BDA00003099288000053
(i=1,2,…,c):
Figure BDA00003099288000054
中的元素只有和
Figure BDA00003099288000055
中第i类对应的元素分别相等之外,其他元素全部为零;
Figure BDA00003099288000056
中的元素只有和
Figure BDA00003099288000057
中第i类对应的元素分别相等之外,其他元素全部为零;
Figure BDA00003099288000058
中的元素只有和
Figure BDA00003099288000059
中第i类对应的元素分别相等之外,其他元素全部为零。
g2:根据训练集中每个类别对测试样本U在像素域和梯度域的重构效果,来判断测试样本的类别:
min r r i ( u ) = λ 1 | | P 1 u- P 1 A β ^ i | | 2 + λ 2 | | P 2 u x - P 2 A x δ ^ i | | 2 + λ 3 | | P 3 u y - P 3 A y η ^ i | | 2 - - - ( 7 )
其中λ1≥0,λ2≥0,λ3≥0,且三者不能同时为零,表示代表像素域和梯度域间的权重系数。本专利中采用两组权重系数,若λ1=0,λ23=1,记为GSRC1;若λ12=λ3=1,记为GSRC2。
相对于现有技术,本发明具有如下有益效果:
1、本发明采用人脸图像的梯度信息和像素信息,由于梯度信息能够发掘人脸图像的局部信息且对均匀光照变化的不敏感性,使得本发明对于不完备的训练样本集,有非常优秀的识别结果。
2、本发明采用采用正则化最小二乘法求解稀疏表示线性方程组,和SRC最小化L1范数相比,本发明(GSRC)速度显著快于SRC,因此,本发明有更广阔的应用前景。
附图说明
图1:稀疏表示分类器1(SRC1)[5]、线性回归分类器(LRC)[6]、协作表示分类器(CRC)[7]、线性判别分析(LDA)[2]、局部保持投影(LPP)[3]与本发明的梯度稀疏表示分类器1(GSRC1)、梯度稀疏表示分类器2(GSRC2)在Extended Yale B人脸库上每类训练样本个数为10时的识别率随特征维数变化图。
图2:AR人脸库一个人的6张太阳镜遮挡人脸图像。
图3:AR人脸库一个人的6张围巾遮挡人脸图像。
图4:对图3中的图像进行分块,将围巾遮挡部分去除后的图像。
图5:稀疏表示分类器1(SRC1)[5]、稀疏表示分类器2(SRC2)[5]、线性回归分类器(LRC)[6]、协作表示分类器(CRC)[7]、主成分分析(PCA)[1]与本发明的梯度稀疏表示分类器1(GSRC1)、梯度稀疏表示分类器2(GSRC2)在AR人脸库对于太阳镜遮挡图像的识别率随特征维数变化图。
图6:稀疏表示分类器1(SRC1)[5]、稀疏表示分类器2(SRC2)[5]、线性回归分类器(LRC)[6]、协作表示分类器(CRC)[7]、主成分分析(PCA)[1]与本发明的梯度稀疏表示分类器1(GSRC1)、梯度稀疏表示分类器2(GSRC2)在AR人脸库对于围巾遮挡图像的识别率随特征维数变化图。
具体实施方式
下面结合附图和实施例对本发明的技术做进一步的说明。
一种基于梯度稀疏表示的人脸识别方法,具体包括如下步骤:
步骤a:构建人脸样本图像数据库:
从c个类别的人脸库中任意选取n张人脸图像作为训练样本,其中每个类别的人脸图像个数记为ni(i=1,2,…,c),其中
Figure BDA00003099288000061
另外选择人脸库中其他的一张图像作为测试样本。对选取的人脸图像进行裁剪,对齐,并调整为a×b像素大小。第i类的第k张训练样本记为Ai,k
Figure BDA00003099288000062
1≤i≤c,1≤k≤ni);测试样本记为U
步骤b:计算人脸图像的X方向和Y方向梯度图像:
b1:采用中心差分法求解训练人脸图像和测试人脸图像的X方向和Y方向的梯度图像。第i类的第k张训练样本的X方向和Y方向度图像分别记为
Figure BDA00003099288000063
Figure BDA00003099288000064
1≤i≤c,1≤k≤ni)。测试样本U的X方向和Y方向梯度图像分别记为Ux,Uy
Figure BDA00003099288000065
b2:将步骤b1中训练和测试人脸图像,以及相应的X方向和Y方向梯度图像按照相同的方式转化为m维向量,其中m=a×b。把训练人脸图像Ai,k以及相应的X方向梯度图像
Figure BDA00003099288000066
Y方向梯度图像
Figure BDA00003099288000067
转化为m维向量,分别记为ai,k
Figure BDA00003099288000068
Figure BDA00003099288000069
Figure BDA000030992880000610
1≤i≤c,1≤k≤ni);把测试人脸图像U以及相应的X方向梯度图像Ux,Y方向梯度图像Uy转化为m向量,分别记为u,ux,uy
Figure BDA000030992880000612
b3:将图像矩阵转化为向量:
b31:将第i类所有的训练样本向量放在同一个矩阵中,记为Ai,即(i=1,2,…,c);然后将所有类别的训练样本放在同一个矩阵中,记为A,即
A = [ A 1 , A 2 , · · · , A c ] = [ a 1,1 , a 1,2 , · · · , a 1 , n 1 , a 2,1 , a 2,2 , · · · , a 2 , n 2 , · · · , a c , 1 , a c , 2 , · · · , a c , n c ] ,
Figure BDA00003099288000073
每一列代表一个训练人脸样本;
b32:将第i类所有的训练样本的X方向梯度向量放在同一个矩阵中,记为
Figure BDA00003099288000074
Figure BDA00003099288000075
(i=1,2,…,c);然后将所有类别的训练样本的X方向梯度向量放在同一个矩阵中,记为Ax,即:
A x = [ A 1 x , A 2 x , · · · , A c x ] = [ a 1,1 x , a 1,2 x , · · · , a 1 , n 1 x , a 2,1 x , a 2,2 x , · · · , a 2 , n 2 x , · · · , a c , 1 x , a c , 2 x , · · · , a c , n c x ] ,
Figure BDA00003099288000077
每一列代表一个训练人脸样本的X方向梯度;
b33:将第i类所有的训练样本的Y方向梯度向量放在同一个矩阵中,记为
Figure BDA00003099288000078
(i=1,2,…,c);然后将所有类别的训练样本的Y方向梯度向量放在同一个矩阵中,记为Ay,即
A y = [ A 1 y , A 2 y , · · · , A c y ] = [ a 1,1 y , a 1,2 y , · · · , a 1, n 1 y , a 2,1 y , a 2,2 y , · · · , a 2 , n 2 y , · · · , a c , 1 y , a c , 2 y , · · · , a c , n c y ] ,
Figure BDA000030992880000711
每一列代表一个训练人脸样本的Y方向梯度;
步骤c:将所有样本及其梯度归一化:
将u,ux和uy分别归一化,使得这三个向量的l2范数为1;将A,Ax和Ay分别归一化,使得这三个矩阵的所有列向量的l2范数为1。为了方便表示,我们将归一化后的所有数据仍用原来符号表示,即下文中出现的u,ux和uy,以及A,Ax和Ay均已经归一化。
步骤d:根据稀疏表示假设,将测试样本及其梯度分别表示成全部训练样本及其梯度的线性组合:
d1:将测试样本u表示成全部训练样本A的线性组合:
u=Aβ                (1)
其中,
Figure BDA000030992880000712
是待求的系数向量。
d2:将测试样本u的X方向梯度ux表示成全部训练样本X方向梯度Ax的线性组合:
ux=Axδ                     (2)
其中,是待求的系数向量。
d3:将测试样本u的Y方向梯度uy表示成全部训练样本Y方向梯度Ay的线性组合:
uy=Ayη                 (3)
其中,
Figure BDA00003099288000081
是待求的系数向量。
步骤e:采用PCA[1]对A,Ax和Ay进行降维,得到A,Ax和Ay的特征矩阵分别为P1,P2,P3,其中
Figure BDA00003099288000082
Figure BDA00003099288000083
Figure BDA00003099288000084
最后,将特征矩阵P1,P2,P3分别乘以等式(1),(2),(3)的左右两边,得:
P 1 u = P 1 Aβ P 2 u x = P 2 A x δ P 3 u y = P 3 A y η - - - ( 4 )
步骤f:采用正则化最小二乘法[7]求解β,δ和η:
β ^ = arg min β { | | P 1 u - P 1 Aβ | | 2 2 + θ | | β | | 2 2 } δ ^ = arg min δ { | | P 2 u x - P 2 A x δ | | 2 2 + θ | | δ | | 2 2 } η ^ = arg min η { | | P 3 u y - P 3 A y η | | 2 2 + θ | | η | | 2 2 } - - - ( 5 )
其中,θ>0,为正则化参数;本专利中,θ=0.01。
通过简单的运算,很容易推导出(5)式的解:
β ^ = ( A T P 1 T P 1 A + θ · I ) - 1 A T P 1 T P 1 u δ ^ = ( ( A x ) T P 2 T P 2 A x + θ · I ) - 1 ( A x ) T P 2 T P 2 u x η ^ = ( ( A y ) T P 3 T P 3 A y + θ · I ) - 1 ( A y ) T P 3 T P 3 u y - - - ( 6 )
其中,
Figure BDA00003099288000088
是单位矩阵。
步骤g:根据像素域和梯度域的系数向量β,δ和η,判断测试样本U的类别:
g1:定义三类向量
Figure BDA00003099288000089
Figure BDA000030992880000810
Figure BDA000030992880000811
(i=1,2,…,c):中的元素只有和中第i类对应的元素分别相等之外,其他元素全部为零;
Figure BDA000030992880000814
中的元素只有和
Figure BDA000030992880000815
中第i类对应的元素分别相等之外,其他元素全部为零;
Figure BDA000030992880000816
中的元素只有和
Figure BDA000030992880000817
中第i类对应的元素分别相等之外,其他元素全部为零。
g2:根据训练集中每个类别对测试样本U在像素域和梯度域的重构效果,来判断测试样本的类别:
min i r i ( u ) = λ 1 | | P 1 u - P 1 A β ^ i | | 2 + λ 2 | | P 2 u x - P 2 A x δ ^ i | | 2 + λ 3 | | P 3 u y - P 3 A y η ^ i | | 2 - - - ( 7 )
其中λ1≥0,λ2≥0,λ3≥0,且三者不能同时为零,表示代表像素域和梯度域间的权重系数。本专利中采用两组权重系数,若λ1=0,λ23=1,记为GSRC1;若λ123=1,记为GSRC2。
实施例:
本实施例中采用的人脸库为Extended Yale B人脸库和AR人脸库,ExtendedYale B人脸库共包括38个人的2414幅正面图像,其中每个人大约有64张不同光照条件下的图像。AR人脸库是公认的识别算法测试的标准人脸图像库,由l26个人的4000多幅图像组成,其中图像包含表情和光照条件的变化,以及伪装(遮挡)。
首先将Extended Yale B人脸库中所有人脸图像归一化为32×32大小,分别采用每人前5、10、15张人脸图像作为训练样本,除了训练图像,其余所有图像作为测试样本。
选取包含100个人的AR人脸库的子数据库进行实验,其中每人有26张正面图像(14幅无遮挡图像,6幅太阳镜遮挡图像,6幅围巾遮挡图像),并将选取的所有人脸图片归一化为60×43大小。AR实验库均选择每人的14幅无遮挡图像,共1400幅图像做训练样本集,每人6幅太阳镜遮挡图像(或围巾遮挡图像),共600幅图像分别作为测试样本集。
图1表示稀疏表示分类器1(SRC1)[5]、线性回归分类器(LRC)[6]、协作表示分类器(CRC)[7]、线性判别分析(LDA)[2]、局部保持投影(LPP)[3]与本发明的梯度稀疏表示分类器1(GSRC1)、梯度稀疏表示分类器2(GSRC2),在Extended Yale B人脸库上每类训练样本个数为10时的识别率随特征维数变化图。可以看出,在每类训练样本个数为10时(此时训练样本集是不完备的),本发明提出的算法GSRC1和GSRC2在任何特征维数下,始终具有最高识别效果,这验证了本发明提出的算法对不完备训练样本集的有效性。
图2表示AR人脸库第一个人的6张太阳镜遮挡人脸图像。
图3表示AR人脸库第一个人的6张围巾遮挡人脸图像。
图4表示对图3中的图像进行分块,将围巾遮挡部分去除后的图像。
图5表示稀疏表示分类器1(SRC1)[5]、稀疏表示分类器2(SRC2)[5]、线性回归分类器(LRC)[6]、协作表示分类器(CRC)[7]、主成分分析(PCA)[1]与本发明的梯度稀疏表示分类器1(GSRC1)、梯度稀疏表示分类器2(GSRC2),在AR人脸库对于太阳镜遮挡图像的识别率随特征维数变化图。本实例中,选取AR子数据库中每人14幅无遮挡图像,共1400幅图像做训练样本集,每人6幅太阳镜遮挡图像,共600幅图像分别作为测试样本集。
图6表示稀疏表示分类器1(SRC1)[5]、稀疏表示分类器2(SRC2)[5]、线性回归分类器(LRC)[6]、协作表示分类器(CRC)[7]、主成分分析(PCA)[1]与本发明的梯度稀疏表示分类器1(GSRC1)、梯度稀疏表示分类器2(GSRC2),在AR人脸库对于围巾遮挡图像的识别率随特征维数变化图。本实例中,选取AR子数据库中每人14幅无遮挡图像,共1400幅图像做训练样本集,每人6幅围巾遮挡图像,共600幅图像分别作为测试样本集。
从图5和图6可以看出,对于太阳镜和围巾遮挡(伪装),本发明提出的算法GSRC1始终有最好的识别效果,且显著优于其他算法,表明本发明提出的算法对人脸图像的遮挡和伪装是十分鲁棒的,验证了本发明的有效性和实用性。
表1表示对于Extended Yale B人脸库,稀疏表示分类器1(SRC1)[5]、线性回归分类器(LRC)[6]、协作表示分类器(CRC)[7]、线性判别分析(LDA)[2]、局部保持投影(LPP)[3]与本发明的梯度稀疏表示分类器1(GSRC1)、梯度稀疏表示分类器2(GSRC2),在Extended Yale B人脸库上每类训练样本个数分别为5、10、15时,每种算法的最高识别率与相应的特征维数。由表1可以看出,随着每类训练样本个数的变化(训练样本集始终是不完备的),本发明提出的算法GSRC1和GSRC2始终具有最高识别效果,这再次验证了本发明提出的算法对不完备训练样本集的有效性。
将AR子数据库中每人6幅围巾遮挡图像,按照图4进行分块,然后将分块后的图像作为测试样本集;将AR子数据库中每人14幅无遮挡图像,按照图4进行分块,然后将分块后的图像作为训练样本集。然后,将特征维数固定为300,表2表示稀疏表示分类器1(SRC1)[5]、稀疏表示分类器2(SRC2)[5]、线性回归分类器(LRC)[6]、协作表示分类器(CRC)[7]、主成分分析(PCA)[1]与本发明的梯度稀疏表示分类器1(GSRC1)、梯度稀疏表示分类器2(GSRC2)的识别率与相应的计算机运行时间比较。
表1
Figure BDA00003099288000111
表2
Figure BDA00003099288000112
从表2可以看出,对遮挡的图像进行分块处理后,各种算法都取得较好的识别效果,表明本发明提出的算法和现有的算法同样是有效的。然而,本发明的算法的速度显著快于SRC1和SRC2,因此本发明的算法实用性更强,应用前景更广泛。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
参考文献:
1.M.Turk and A. Pentland, “Eigenfaces for recognition,” Journal of CognitiveNeuroscience,3(1):71-86,1991.
2.P.N.Belhumeur,J.P.Hespanha,and D.J.Kriegman,“Eigenfaces vs.fisherfaces:Recognition using class specific linear projection,”IEEE Transactions on PatternAnalysis and Machine Intelligence,19(7):711-720,1997.
3.X.F.He,S.C.Yan,Y.X.Hu,P.Niyogi,and H.J.Zhang,“Face recognitionusing laplacianfaces,”IEEE Transactions on Pattern Analysis and MachineIntelligence,27(3):328-340,2005.
4.D.D.Lee and H.S.Seung,“Learning the parts of objects by non-negative matrixfactorization,”Nature,401(6755):788-791,1999.
5.J.Wright,A.Y.Yang,A.Ganesh,S.S.Sastry,and Y.Ma,“Robust facerecognition via sparse representation,”IEEE Transactions on Pattern Analysisand Machine Intelligence,31(2):210-227,2009.
6.I.Naseem,R.Togneri,and M.Bennamoun,“Linear regression for facerecognition,”IEEE Transactions on Pattern Analysis and Machine Intelligence,32(11):2106-2112,2010.
7.L.Zhang,M.Yang,and X.C.Feng,“Sparse representation or collaborativerepresentation:Which helps face recognition?”in IEEE International Conferenceon Computer Vision(ICCV),2011.

Claims (4)

1.一种基于梯度稀疏表示的人脸识别方法,其特征在于:具体包括如下步骤:
步骤a:构建人脸样本图像数据库:
从c个类别的人脸库中任意选取n张人脸图像作为训练样本,其中每个类别的人脸图像个数记为ni(i=1,2,L,c),其中另外选择人脸库中其他的一张图像作为测试样本。对选取的人脸图像进行裁剪,对齐,并调整为a×b像素大小。第i类的第k张训练样本记为Ai,k1≤i≤c,1≤k≤ni);测试样本记为U
Figure FDA00003099287900013
步骤b:计算人脸图像的X方向和Y方向梯度图像:
b1:采用中心差分法求解训练人脸图像和测试人脸图像的X方向和Y方向的梯度图像。第i类的第k张训练样本的X方向和Y方向度图像分别记为
Figure FDA00003099287900014
Figure FDA00003099287900015
1≤i≤c,1≤k≤ni)。测试样本U的X方向和Y方向梯度图像分别记为Ux,Uy
Figure FDA00003099287900016
b2:将步骤b1中训练和测试人脸图像,以及相应的X方向和Y方向梯度图像按照相同的方式转化为m维向量,其中m=a×b。把训练人脸图像Ai,k以及相应的X方向梯度图像
Figure FDA00003099287900017
Y方向梯度图像
Figure FDA00003099287900018
转化为m维向量,分别记为ai,k
Figure FDA00003099287900019
Figure FDA000030992879000110
1≤i≤c,1≤k≤ni);把测试人脸图像U以及相应的X方向梯度图像Ux,Y方向梯度图像Uy转化为m向量,分别记为u,ux,uy
Figure FDA000030992879000112
b3:将图像矩阵转化为向量:
b31:将第i类所有的训练样本向量放在同一个矩阵中,记为Ai,即
Figure FDA000030992879000113
(i=1,2,L,c);然后将所有类别的训练样本放在同一个矩阵中,记为A,即
A = [ A 1 , A 2 , L , A c ] = [ a 1,1 , a 1,2 , L , a 1 , n 1 , a 2,1 , a 2,2 , L , a 2 , n 2 , L , a c , 1 , a c , 2 , L , a c , n c ] ,
Figure FDA000030992879000115
每一列代表一个训练人脸样本;
b32:将第i类所有的训练样本的X方向梯度向量放在同一个矩阵中,记为
Figure FDA00003099287900021
Figure FDA00003099287900022
(i=1,2,L,c);然后将所有类别的训练样本的X方向梯度向量放在同一个矩阵中,记为Ax,即:
A x = [ A 1 x , A 2 x , L , A c x ] = [ a 1,1 x , a 1,2 x , L , a 1 , n 1 x , a 2,1 x , a 2,2 x , L , a 2 , n 2 x , L , a c , 1 x , a c , 2 x , L , a c , n c x ] ,
Figure FDA00003099287900024
每一列代表一个训练人脸样本的X方向梯度;
b33:将第i类所有的训练样本的Y方向梯度向量放在同一个矩阵中,记为
Figure FDA00003099287900025
Figure FDA00003099287900026
(i=1,2,L,c);然后将所有类别的训练样本的Y方向梯度向量放在同一个矩阵中,记为Ay,即
A y = [ A 1 y , A 2 y , L , A c y ] = [ a 1,1 y , a 1,2 y , L , a 1, n 1 y , a 2,1 y , a 2,2 y , L , a 2, n 2 y , L , a c , 1 y , a c , 2 y , L , a c , n c y ] ,
Figure FDA00003099287900028
每一列代表一个训练人脸样本的Y方向梯度;
步骤c:将所有样本及其梯度归一化:
将u,ux和uy分别归一化,使得这三个向量的l2范数为1;将A,Ax和Ay分别归一化,使得这三个矩阵的所有列向量的l2范数为1。为了方便表示,我们将归一化后的所有数据仍用原来符号表示,即下文中出现的u,ux和uy,以及A,Ax和Ay均已经归一化。
步骤d:根据稀疏表示假设,将测试样本及其梯度分别表示成全部训练样本及其梯度的线性组合:
d1:将测试样本u表示成全部训练样本A的线性组合:
u=Aβ    (1)
其中,
Figure FDA00003099287900029
是待求的系数向量。
d2:将测试样本u的X方向梯度ux表示成全部训练样本X方向梯度Ax的线性组合:
ux=Axδ    (2)
其中,是待求的系数向量。
d3:将测试样本u的Y方向梯度uy表示成全部训练样本Y方向梯度Ay的线性组合:
uy=Ayη    (3)
其中,是待求的系数向量。
步骤e:采用主成分分析(PCA)对A,Ax和Ay进行降维,得到A,Ax和Ay的特征矩阵分别为P1,P2,P3,其中
Figure FDA000030992879000314
Figure FDA000030992879000315
最后,将特征矩阵P1,P2,P3分别乘以等式(1),(2),(3)的左右两边,得:
P 1 u = P 1 Aβ P 2 u x = P 2 A x δ P 3 u y = P 3 A y η - - - ( 4 )
步骤f:采用正则化最小二乘法求解β,δ和η:
β ^ = arg min β { | | P 1 u - P 1 Aβ | | 2 2 + θ | | β | | 2 2 } δ ^ = arg min δ { | | P 2 u x - P 2 A x δ | | 2 2 + θ | | δ | | 2 2 } η ^ = arg min η { | | P 3 u y - P 3 A y η | | 2 2 + θ | | η | | 2 2 } - - - ( 5 ) 其中,θ>0,为正则化参数;本专利中,θ=0.01。
通过简单的运算,很容易推导出(5)式的解:
β ^ = ( A T P 1 T P 1 A + θ · I ) - 1 A T P 1 T P 1 u δ ^ = ( ( A x ) T P 2 T P 2 A x + θ · I ) - 1 ( A x ) T P 2 T P 2 u x η ^ = ( ( A y ) T P 3 T P 3 A y + θ · I ) - 1 ( A y ) T P 3 T P 3 u y - - - ( 6 )
其中,
Figure FDA000030992879000317
是单位矩阵。
步骤g:根据像素域和梯度域的系数向量β,δ和η,判断测试样本U的类别:
g1:定义三类向量
Figure FDA00003099287900034
Figure FDA00003099287900035
Figure FDA00003099287900036
Figure FDA00003099287900037
中的元素只有和
Figure FDA00003099287900038
中第i类对应的元素分别相等之外,其他元素全部为零;
Figure FDA00003099287900039
中的元素只有和
Figure FDA000030992879000310
中第i类对应的元素分别相等之外,其他元素全部为零;
Figure FDA000030992879000311
中的元素只有和
Figure FDA000030992879000312
中第i类对应的元素分别相等之外,其他元素全部为零。
g2:根据训练集中每个类别对测试样本U在像素域和梯度域的重构效果,来判断测试样本的类别:
min i r i ( u ) = λ 1 | | P 1 u - P 1 A β ^ i | | 2 + λ 2 | | P 2 u x - P 2 A x δ ^ i | | 2 + λ 3 | | P 3 u y - P 3 A y η ^ i | | 2 - - - ( 7 )
其中λ1≥0,λ2≥0,λ3≥0,且三者不能同时为零,表示代表像素域和梯度域间的权重系数。本专利中采用两组权重系数,若λ1=0,λ23=1,记为GSRC1;若λ123=1,记为GSRC2。
2.根据权利要求1所述一种基于梯度稀疏表示的人脸识别方法,其特征在于:所述步骤d中,将人脸图像X方向和Y方向的梯度融入到稀疏表示模型中,得到了三个独立的线性方程组。
3.根据权利要求1所述一种基于梯度稀疏表示的人脸识别方法,其特征在于:所述步骤f中,采用正则化的最小二乘法求解稀疏表示的系数。
4.根据权利要求1所述一种基于梯度稀疏表示的人脸识别方法,其特征在于:所述步骤g中,根据训练集中每个类别对测试样本在像素域和梯度域的重构效果,来判断测试样本的类别。
CN2013101450627A 2013-04-24 2013-04-24 一种基于梯度稀疏表示的人脸识别方法 Pending CN103246870A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013101450627A CN103246870A (zh) 2013-04-24 2013-04-24 一种基于梯度稀疏表示的人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013101450627A CN103246870A (zh) 2013-04-24 2013-04-24 一种基于梯度稀疏表示的人脸识别方法

Publications (1)

Publication Number Publication Date
CN103246870A true CN103246870A (zh) 2013-08-14

Family

ID=48926383

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013101450627A Pending CN103246870A (zh) 2013-04-24 2013-04-24 一种基于梯度稀疏表示的人脸识别方法

Country Status (1)

Country Link
CN (1) CN103246870A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104166860A (zh) * 2014-07-25 2014-11-26 哈尔滨工业大学深圳研究生院 基于约束的面向单个测试样本的人脸识别方法
CN104915625A (zh) * 2014-03-11 2015-09-16 重庆邮电大学 一种人脸识别的方法及装置
CN105069424A (zh) * 2014-08-01 2015-11-18 Tcl集团股份有限公司 面部快速识别系统和方法
CN106485202A (zh) * 2016-09-18 2017-03-08 南京工程学院 非约束人脸识别系统及方法
CN107436597A (zh) * 2017-07-17 2017-12-05 华南理工大学 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法
CN108197573A (zh) * 2018-01-03 2018-06-22 南京信息工程大学 基于镜像图的lrc和crc偏差结合的人脸识别方法
CN111723759A (zh) * 2020-06-28 2020-09-29 南京工程学院 基于加权张量稀疏图映射的非约束人脸识别方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324022A (zh) * 2011-09-05 2012-01-18 辽宁工程技术大学 一种基于复合梯度向量的人脸识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324022A (zh) * 2011-09-05 2012-01-18 辽宁工程技术大学 一种基于复合梯度向量的人脸识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PENG MA等: "Robust face recognition via gradient-based sparse representation", 《JOURNAL OF ELECTRONIC IMAGING》, 31 March 2013 (2013-03-31) *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915625A (zh) * 2014-03-11 2015-09-16 重庆邮电大学 一种人脸识别的方法及装置
CN104915625B (zh) * 2014-03-11 2019-04-26 重庆邮电大学 一种人脸识别的方法及装置
CN104166860A (zh) * 2014-07-25 2014-11-26 哈尔滨工业大学深圳研究生院 基于约束的面向单个测试样本的人脸识别方法
CN104166860B (zh) * 2014-07-25 2017-06-13 哈尔滨工业大学深圳研究生院 基于约束的面向单个测试样本的人脸识别方法
CN105069424A (zh) * 2014-08-01 2015-11-18 Tcl集团股份有限公司 面部快速识别系统和方法
US9275309B2 (en) 2014-08-01 2016-03-01 TCL Research America Inc. System and method for rapid face recognition
CN106485202A (zh) * 2016-09-18 2017-03-08 南京工程学院 非约束人脸识别系统及方法
CN107436597A (zh) * 2017-07-17 2017-12-05 华南理工大学 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法
CN107436597B (zh) * 2017-07-17 2019-10-18 华南理工大学 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法
CN108197573A (zh) * 2018-01-03 2018-06-22 南京信息工程大学 基于镜像图的lrc和crc偏差结合的人脸识别方法
CN111723759A (zh) * 2020-06-28 2020-09-29 南京工程学院 基于加权张量稀疏图映射的非约束人脸识别方法
CN111723759B (zh) * 2020-06-28 2023-05-02 南京工程学院 基于加权张量稀疏图映射的非约束人脸识别方法

Similar Documents

Publication Publication Date Title
Huang et al. Deep learning on lie groups for skeleton-based action recognition
Sun et al. Abnormal event detection for video surveillance using deep one-class learning
Harandi et al. Extrinsic methods for coding and dictionary learning on Grassmann manifolds
CN103246870A (zh) 一种基于梯度稀疏表示的人脸识别方法
Wei et al. Locality-sensitive dictionary learning for sparse representation based classification
Bai et al. Robust visual tracking with structured sparse representation appearance model
Kim et al. Boosted manifold principal angles for image set-based recognition
Debgupta et al. A wide ResNet-based approach for age and gender estimation in face images
CN104700089A (zh) 一种基于Gabor小波和SB2DLPP的人脸识别方法
Lu et al. Robust visual tracking with discriminative sparse learning
Hu et al. A new face recognition method based on image decomposition for single sample per person problem
Carcagnì et al. A study on different experimental configurations for age, race, and gender estimation problems
Qian et al. Non-Negative Matrix Factorization with Sinkhorn Distance.
Cheng et al. Object tracking via collaborative multi-task learning and appearance model updating
Liu et al. Class specific centralized dictionary learning for face recognition
Tang et al. Using a selective ensemble support vector machine to fuse multimodal features for human action recognition
Ou et al. A real time race classification system
Cheng et al. An improved collaborative representation based classification with regularized least square (CRC–RLS) method for robust face recognition
Wang et al. Action recognition using linear dynamic systems
CN101482917B (zh) 一种基于二阶二维主分量分析的人脸识别系统和方法
Shen et al. Accurate and real-time object detection in crowded indoor spaces based on the fusion of DBSCAN algorithm and improved YOLOv4-tiny network
Shi et al. A global-local affinity matrix model via EigenGap for graph-based subspace clustering
Luo et al. Hyperspectral image classification using metric learning in one-dimensional embedding framework
Wang et al. Fixation prediction in videos using unsupervised hierarchical features
Dornaika et al. Discriminant sparse label-sensitive embedding: Application to image-based face pose estimation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130814