CN101976360B - 基于多级分类的稀疏表征人脸识别方法 - Google Patents
基于多级分类的稀疏表征人脸识别方法 Download PDFInfo
- Publication number
- CN101976360B CN101976360B CN 201010522281 CN201010522281A CN101976360B CN 101976360 B CN101976360 B CN 101976360B CN 201010522281 CN201010522281 CN 201010522281 CN 201010522281 A CN201010522281 A CN 201010522281A CN 101976360 B CN101976360 B CN 101976360B
- Authority
- CN
- China
- Prior art keywords
- face
- word bank
- training
- vector
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Collating Specific Patterns (AREA)
Abstract
本发明公开了一种基于多级分类的稀疏表征人脸识别方法,主要解决现有人脸识别方法不能有效运用于多类别人脸识别的缺点。其实现过程为:(1)将用于训练的人脸数据库随机分成n个子库,分别对每个子库进行降维,保留降维后的训练人脸数据和对应每个子库的变换矩阵;(2)输入测试人脸图像,利用各子库的变换矩阵对其进行降维,保留降维后的测试人脸数据;(3)用降维后的测试人脸数据与各子库中的训练人脸数据作内积运算,内积最大的前k个子库作为候选子库,使搜索范围缩小到这k个子库中;(4)分别在k个子库中对人脸进行识别,确定测试人脸图像所属的类别。本发明与现有技术相比能有效地提取人脸特征,降低计算复杂度,适用于多类别人脸识别。
Description
技术领域
本发明属于图像处理技术领域,涉及一种稀疏表征人脸识别方法,可用于公安刑侦破案、门禁系统或摄像监视系统等领域中的身份确认或查找。
背景技术
人脸识别特指利用分析比较人脸视觉特征信息进行身份鉴别的计算机技术。人脸识别是模式识别、机器学习和计算机视觉领域最具挑战性的研究方向之一,是一个高维的模式识别问题。因此人们往往将人脸图像提取特征,在低维的子空间进行判别。到目前为止,各种特征提取的方法在人脸识别领域得到了广泛的应用。
最近,Wright等人提出一种基于信号的稀疏表示的人脸识别新方法SRC,成功地将压缩感知理论应用于人脸识别。该方法基于采样稀疏信号表示理论,将人脸识别看作多个线性回归模型的分类问题,将测试样本看成训练库中同类样本的线性组合,对于整个样本集来说线性加权的系数自然是稀疏的,于是就可将稀疏重构问题转化为L1范数优化问题。但是该SRC方法存在有以下两方面的缺陷:
(1)由于没有进行特征提取,人脸图像的维数较大,于是在求解L1范数时,计算的复杂度很大;
(2)在人脸类别数较大的情况下,SRC方法不能进行有效的识别。
Fisher线性判别分析方法可以有效地克服(1)中所述的缺陷,Fisher线性判别分析是在原始样本空间里找到某几个方向,使得把样本投影到该方向上后分开的效果最好,即根据实际情况找到最易于分类的投影线,其基本思想是使样本的类内距离尽量小,类间距离尽量大。对于c分类问题,它能找到c-1个投影方向,从而把维数压缩到c-1,因此,该方法不仅能有效地融合训练样本的类别信息,按照分类能力提取特征,还具有突出的数据压缩能力,能够有效的降低后续处理的数据量。
采用Fisher特征提取的稀疏表征人脸识别过程如图2所示。该方法虽然能够有效地提取人脸特征,降低计算复杂度,但是在人脸类别数较多的情况下,该方法的识别率就会降低。
发明内容
本发明的目的在于克服上述已有技术的不足,提出一种基于多级分类的稀疏表征人脸识别方法,以降低人脸图像的维数,减小计算的复杂度,并且在人脸类别数较多的情况下,提高识别率。
实现本发明的目的技术方案是采用Fisher特征提取的方法对人脸图像进行降维,从而降低计算的复杂度,并在Fisher特征提取方法的基础上利用多级分类的策略,分别对每组实施特征提取,构造一种准则将人脸图像搜索范围缩减到很少的几组之上,以在减小计算复杂度的同时实现对多类别人脸的有效识别。具体步骤包括如下:
(1)将用于训练的人脸数据库随机的分成n个子库,n取4,分别对每个子库运用Fisher准则实现降维,保留降维后的训练人脸数据和对应每个子库的变换矩阵W;
(3)用降维后的测试人脸数据与各子库中的训练人脸数据B作内积运算,选择内积值最大的前k个子库作为候选子库,使搜索范围缩小到这k个子库中,k取2;
(4)分别在k个子库中运用基于信号的稀疏表示的人脸识别方法SRC对人脸进行识别,确定测试人脸图像所属的类别。
本发明与现有技术相比具有如下优点:
1.有效地提取人脸特征,降低计算复杂度
本发明由于运用Fisher准则对人脸图像进行特征提取,实现了降维,因此有效地降低了在运用基于信号的稀疏表示的人脸识别方法SRC对人脸进行识别时的计算复杂度。Fisher线性判别分析是在原始样本空间里找到某几个方向,使得把样本投影到该方向上后分开的效果最好,即根据实际情况找到最易于分类的投影线。其基本思想是使样本的类内距离尽量小,类间距离尽量大。对于c分类问题,它能找到c-1个投影方向,从而把维数压缩到c-1。因此,该方法不仅能有效地融合训练样本的类别信息,按照分类能力提取特征,还具有突出的数据压缩能力,能够有效的降低后续处理的数据量。
2.适用于多类别人脸识别情况。
本发明通过引入多级分类的策略使得Fisher方法的应用范围更广,由于多级分类策略能够将多类别的人脸数据库分成适当的若干小组,因而克服了Fisher方法在多类别情况下降维效果不明显的局限性,提高了人脸的识别率。
附图说明
图1是本发明基于多级分类的稀疏表征人脸识别过程图。
图2是现有采用Fisher特征提取的稀疏表征人脸识别过程图。
具体实施方式
参照图1,本发明的实施步骤如下:
步骤1,将用于训练的人脸数据库随机的分成n个子库,n取4,并按照如下步骤分别对每个子库中的训练人脸图像运用Fisher准则实现降维:
(1a)设子库中的训练人脸图像样本集为:X={xi},i=1,2,...,N,其中,N为子库中训练人脸图像的总数目,子库中训练人脸图像的类别数为c,计算子库中的训练人脸图像样本的类间散步矩阵Sb和类内散步矩阵Sw:
其中,ni为第i类训练人脸图像的数目,μi是第i类人脸图像的均值,μ是所有人脸图像的均值,Di是第i类训练人脸图像样本的集合,x是Di中的一幅人脸图像;
(1b)计算准则函数J(W):
其中,W是一个使得准则函数J(W)取得最大值的最优矩阵;
(1c)设最优矩阵W的第i个列向量为wi,则wi是下列等式中的最大特征值所对应的特征向量:
Sbwi=λiSwwi,其中λi是特征值
由于Sb是c个秩为1或0的矩阵的和,其中只有c-1个矩阵是相互独立的,所以Sb的秩为c-1或更低,这样非零的特征值至多只有c-1个,对应的特征向量也就至多有c-1个,也就是最优矩阵W最多有c-1个列向量;
(1d)将子库中的训练人脸图像分别投影到最优矩阵W的c-1个列向量上,得到投影后的训练人脸图像,其维数为c-1,从而实现对训练人脸图像的降维,保留降维后的训练人脸数据和对应每个子库的变换矩阵W。
步骤2,对测试人脸图像y降维
设测试人脸图像y的大小为u*v,各子库的变换矩阵W的大小为m*(c-1),将测试人脸图像拉伸成一个m维的列向量,其中m=u*v,分别对各子库的变换矩阵W求转置,得到(c-1)*m大小的变换矩阵W′,用矩阵W′乘以拉伸后的测试人脸图像y,得到维数为c-1的测试人脸数据:从而实现对测试人脸图像的降维。
步骤3,确定候选子库,以缩小搜索范围
选择内积值最大的前k个子库作为候选子库,使搜索范围缩小到这k个子库中,k取2。
步骤4,分别在k个子库中运用基于信号的稀疏表示的人脸识别方法SRC对人脸进行识别,确定测试人脸图像所属的类别:
方式一:
方式二:
其中,I为单位矩阵,x为待求解的测试人脸图像的稀疏表示向量,ε为误差阈值;
(4c)用残差最小的类别作为最终的人脸类别的识别结果:
本发明的优点由以下仿真的数据进一步说明
1.仿真条件
(1)选取Extended Yale B人脸数据库进行仿真实验,并将本发明的方法和基于Fisher特征提取的人脸识别方法的识别性能做比较。
(2)Extended Yale B人脸数据库由38类共2414幅图像构成,选择其中的1216幅图像作为训练人脸图像,剩余的1198幅图像作为测试人脸图像。
(3)仿真实验中训练人脸数据库被分成4个子库,即n=4。
(4)仿真实验中4个子库分别包含10、10、10和8类训练人脸图像,降维后的特征维数分别为9、9、9和7,各训练人脸图像的数目分别为:320、320、320和256。
2.仿真内容与结果
(1)利用现有基于Fisher特征提取的人脸识别方法进行仿真实验,其结果如表1所示:
表1基于Fisher特征提取的人脸识别方法的识别率及识别时间
特征维数 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 |
识别率 | 0.9249 | 0.9307 | 0.9341 | 0.937 | 0.9366 | 0.9391 | 0.9516 | 0.9574 |
识别时间 | 0.1854 | 0.1896 | 0.1903 | 0.1998 | 0.2001 | 0.2036 | 0.2133 | 0.2204 |
其中识别时间指单幅人脸的识别时间,即总识别时间除以测试人脸图像数目。
从表1可见,当特征维数取30和37之间时,基于Fisher特征提取的人脸识别方法的平均识别时间约为0.2003(s),平均识别率约为0.9389。
(2)利用本发明的方法进行仿真实验,将训练人脸数据库分成4个子库,4个子库分别包含10、10、10和8类训练人脸图像,降维后的特征维数分别为9、9、9和7,各训练人脸图像的数目分别为:320、320、320和256,选择不同的测试人脸图像数目进行8次实验,其结果如表2所示:
表2本发明的人脸识别方法的识别率及识别时间
测试人脸图像数目 | 1198 | 1175 | 1150 | 1125 | 1100 | 1075 | 1050 | 1025 |
识别率 | 0.9466 | 0.9478 | 0.9399 | 0.9401 | 0.9503 | 0.9456 | 0.9468 | 0.9557 |
识别时间 | 0.1051 | 0.0998 | 0.1032 | 0.1102 | 0.1078 | 0.1098 | 0.1086 | 0.1115 |
其中识别时间指单幅人脸的识别时间,即总识别时间除以测试人脸图像数目。
从表2可见,本发明的方法的平均识别时间为0.1070(s),平均识别率为0.9466(s)。由于引入了多级分类策略,利用本发明的方法进行人脸识别,在降低计算复杂度的同时,能够较好地保持识别率。
(3)候选子库个数k的选取影响最终人脸识别率的仿真实验
本次仿真是在Extended Yale B人脸数据库的基础上,将训练人脸数据库随机分成4个子库,分别对各个子库运用Fisher准则实现降维,再在此基础上考察按照内积最大原则选取的候选子库的个数k对最终人脸识别率的影响,其结果如表3所示:
表3按照内积最大原则选取候选子库的错选率及最终人脸识别率
其中,候选子库错选率是指在选择子库的时候,测试人脸的正确类别没有被选入候选子库的概率。
从表3可见,k值取2时最终的人脸识别率最高,高于k取3时的人脸识别率,所以k值并不是越大越好,因为k值过大会引入错误子库的干扰,从而影响最终的人脸识别率。
综上所述,本发明的基于多级分类的稀疏表征人脸识别方法,不仅保留了Fisher特征提取方法在人脸特征提取中降维的优势,还能在多类别人脸数据库的情况下有效的运用Fisher特征提取方法,使得基于信号的稀疏表示的人脸识别方法SRC能够得到更好的运用。
Claims (4)
2.根据权利要求1所述的人脸识别方法,其中步骤(1)所述的分别对每个子库运用Fisher准则实现降维,按照如下步骤进行:
(2a)设子库中的训练人脸图像样本集为:X={xi},i=1,2,...,N,其中,N为子库中训练人脸图像的总数目,子库中训练人脸图像的类别数为c,计算子库中的训练人脸图像样本的类间散步矩阵Sb和类内散步矩阵Sw:
其中,ni为第i类训练人脸图像的数目,μi是第i类人脸图像的均值,μ是所有人脸图像的均值,Di是第i类训练人脸图像样本的集合,x是Di中的一幅人脸图像;
(2b)计算准则函数J(W):
其中,W是一个使得准则函数J(W)取得最大值的最优矩阵;
(2c)设最优矩阵W的第i个列向量为wi,则wi是下列等式中的最大特征值所对应的特征向量:
Sbwi=λiSwwi,其中λi是特征值
由于Sb是c个秩为1或0的矩阵的和,其中只有c-1个矩阵是相互独立的,所以Sb的秩为c-1或更低,这样非零的特征值至多只有c-1个,对应的特征向量也就至多有c-1个,也就是最优矩阵W最多有c-1个列向量;
(2d)将子库中的训练人脸图像分别投影到最优矩阵W的c-1个列向量上,得到投影后的训练人脸图像,其维数为c-1,从而实现对训练人脸图像的降维。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010522281 CN101976360B (zh) | 2010-10-27 | 2010-10-27 | 基于多级分类的稀疏表征人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010522281 CN101976360B (zh) | 2010-10-27 | 2010-10-27 | 基于多级分类的稀疏表征人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101976360A CN101976360A (zh) | 2011-02-16 |
CN101976360B true CN101976360B (zh) | 2013-02-27 |
Family
ID=43576244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010522281 Expired - Fee Related CN101976360B (zh) | 2010-10-27 | 2010-10-27 | 基于多级分类的稀疏表征人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101976360B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10043061B2 (en) | 2015-11-16 | 2018-08-07 | MorphoTrak, LLC | Facial matching system |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298703B (zh) * | 2011-04-20 | 2015-06-17 | 中科院成都信息技术股份有限公司 | 一种基于投影残差的分类方法 |
CN102915436B (zh) * | 2012-10-25 | 2015-04-15 | 北京邮电大学 | 基于类内变化字典和训练图像的稀疏表示人脸识别方法 |
CN103218609B (zh) * | 2013-04-25 | 2016-01-20 | 中国科学院自动化研究所 | 一种基于隐最小二乘回归的多姿态人脸识别方法及其装置 |
CN103745465A (zh) * | 2014-01-02 | 2014-04-23 | 大连理工大学 | 一种稀疏编码背景建模方法 |
CN103984918B (zh) * | 2014-04-21 | 2015-06-10 | 郑州轻工业学院 | 一种基于类内及类间变化的人脸图像识别方法 |
CN104318261B (zh) * | 2014-11-03 | 2016-04-27 | 河南大学 | 一种基于图嵌入低秩稀疏表示恢复的稀疏表示人脸识别方法 |
CN105574475B (zh) * | 2014-11-05 | 2019-10-22 | 华东师范大学 | 一种基于共同向量词典的稀疏表示分类方法 |
CN104463148B (zh) * | 2014-12-31 | 2017-07-28 | 南京信息工程大学 | 基于图像重构和哈希算法的人脸识别方法 |
CN105868309B (zh) * | 2016-03-24 | 2019-05-24 | 广东微模式软件股份有限公司 | 一种基于人脸图像聚类和识别技术的图像快速查找和自助打印方法 |
CN106066994A (zh) * | 2016-05-24 | 2016-11-02 | 北京工业大学 | 一种基于Fisher判别的稀疏表示的人脸识别方法 |
CN113239917B (zh) * | 2021-07-12 | 2021-09-28 | 南京邮电大学 | 一种基于奇异值分解的鲁棒人脸识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7242807B2 (en) * | 2003-05-05 | 2007-07-10 | Fish & Richardson P.C. | Imaging of biometric information based on three-dimensional shapes |
JP2008276406A (ja) * | 2007-04-26 | 2008-11-13 | Toyota Motor Corp | 顔画像処理装置 |
CN101464950A (zh) * | 2009-01-16 | 2009-06-24 | 北京航空航天大学 | 基于在线学习和贝叶斯推理的视频人脸识别与检索方法 |
-
2010
- 2010-10-27 CN CN 201010522281 patent/CN101976360B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7242807B2 (en) * | 2003-05-05 | 2007-07-10 | Fish & Richardson P.C. | Imaging of biometric information based on three-dimensional shapes |
JP2008276406A (ja) * | 2007-04-26 | 2008-11-13 | Toyota Motor Corp | 顔画像処理装置 |
CN101464950A (zh) * | 2009-01-16 | 2009-06-24 | 北京航空航天大学 | 基于在线学习和贝叶斯推理的视频人脸识别与检索方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10043061B2 (en) | 2015-11-16 | 2018-08-07 | MorphoTrak, LLC | Facial matching system |
Also Published As
Publication number | Publication date |
---|---|
CN101976360A (zh) | 2011-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101976360B (zh) | 基于多级分类的稀疏表征人脸识别方法 | |
CN106971174B (zh) | 一种cnn模型、cnn训练方法以及基于cnn的静脉识别方法 | |
Dutta et al. | Compact correlated features for writer independent signature verification | |
CN102609716B (zh) | 一种基于改进的hog特征和pca的行人检测方法 | |
Serdouk et al. | Handwritten signature verification using the quad-tree histogram of templates and a support vector-based artificial immune classification | |
CN101226590B (zh) | 一种人脸识别方法 | |
Zhang | Off‐line signature verification and identification by pyramid histogram of oriented gradients | |
CN102521561B (zh) | 基于多尺度韦伯局部特征和分层决策融合的人脸识别方法 | |
CN102855496A (zh) | 遮挡人脸认证方法及系统 | |
CN105138968A (zh) | 人脸认证方法和装置 | |
CN103870811A (zh) | 一种用于视频监控的正面人脸快速判别方法 | |
CN103164710A (zh) | 一种基于压缩感知的选择集成人脸识别方法 | |
CN103279768A (zh) | 一种基于增量学习人脸分块视觉表征的视频人脸识别方法 | |
CN105046205A (zh) | 一种基于局部和全局特征融合的掌纹识别方法 | |
CN104143095A (zh) | 基于遗传算法和字符识别技术的碎片复原方法 | |
CN105844261A (zh) | 基于优化特征投影矩阵的3d掌纹稀疏表示识别方法 | |
Kohli et al. | Face verification with disguise variations via deep disguise recognizer | |
Sharma et al. | Deep convolutional neural network with ResNet-50 learning algorithm for copy-move forgery detection | |
CN114241564A (zh) | 一种基于类间差异强化网络的人脸表情识别方法 | |
CN105608443A (zh) | 一种多特征描述及局部决策加权的人脸识别方法 | |
Wohlhart et al. | Discriminative Hough Forests for Object Detection. | |
CN101877065B (zh) | 小样本条件下的人脸图像非线性鉴别特征抽取和识别方法 | |
CN104463234A (zh) | 人脸识别方法 | |
CN104408468A (zh) | 基于粗糙集和集成学习的人脸识别方法 | |
CN104318224A (zh) | 一种人脸识别方法及监控设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130227 Termination date: 20181027 |
|
CF01 | Termination of patent right due to non-payment of annual fee |