CN103198299B - 基于多方向尺度与Gabor相位投影特征结合的人脸识别方法 - Google Patents

基于多方向尺度与Gabor相位投影特征结合的人脸识别方法 Download PDF

Info

Publication number
CN103198299B
CN103198299B CN201310102444.1A CN201310102444A CN103198299B CN 103198299 B CN103198299 B CN 103198299B CN 201310102444 A CN201310102444 A CN 201310102444A CN 103198299 B CN103198299 B CN 103198299B
Authority
CN
China
Prior art keywords
face
gabor
yardstick
face picture
direction yardstick
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310102444.1A
Other languages
English (en)
Other versions
CN103198299A (zh
Inventor
韩红
祝建飞
谢福强
张红蕾
韩启强
顾建银
李晓君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Horsent Technology Co ltd
Shenzhen Tianran Intellectual Property Operations Co ltd
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201310102444.1A priority Critical patent/CN103198299B/zh
Publication of CN103198299A publication Critical patent/CN103198299A/zh
Application granted granted Critical
Publication of CN103198299B publication Critical patent/CN103198299B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多方向尺度结合Gabor相位投影特征的人脸识别方法,解决人脸识别问题中光照、姿态变化以及遮挡问题。实现过程是:确定人脸训练集、测试集和注册集;提取每张人脸图像每个方向尺度的Gabor相位投影特征;对训练集中每类人脸每一个方向尺度的Gabor相位投影特征进行降维,得到降维后的特征和相应投影矩阵;根据得到的投影矩阵,得到测试集和注册集中所有样本的相应特征;得到最优多方向尺度结合;记录下所使用的结合的方向尺度,以及相应的子空间投影矩阵;用得到的模型识别新人脸。本发明对光照、姿态变化及遮挡都具有很好的鲁棒性,且性能较之前的遮挡鲁邦算法有了较大提高,可用于智能监控等领域。

Description

基于多方向尺度与Gabor相位投影特征结合的人脸识别方法
技术领域
本发明属于图像处理技术领域,更进一步涉及到计算机视觉领域中一种实现人脸识别方法,可用于侦查、破案和智能监控等。
背景技术
目标识别是计算机视觉领域中一个非常重要的课题,人类认知世界始终伴随着识别,从刚出生开始就要识别父母,识别颜色,然后开始识别文字,识别道路等等。识别的过程也是不断提取信息的过程,有了信息以后才能做出后续的决策。
目标识别一般需要进行特征提取和分类器的选择。现有可提取的图像特征有很多:像素、梯度、Gabor、Haar、HOG、SIFT、shape-context等等;分类器也有很多:贝叶斯分类器、boosting分类器、最近邻分类器、支持向量机SVM、神经网络等等。通常由于直接提取的图像特征数目非常大,需要对特征进行降维或选择,其目的就是找到一个图像特征的子空间,在这个子空间里图像特征具有最少的冗余度或者有最好的判别能力。
目标识别中会受到很多因素的影响,常见的影响因素有:
光照条件的变化,在很多应用场合,由于注册图像和待识别图像往往在不同环境下采集,光照条件差异较大,从而导致注册图像和待识别图像之间存在着较大的光照变化,最终降低了目标识别的准确性。
图像分辨率大小,在高分辨率图像中,目标识别方法已经达到了比较满意的性能。但在一些应用场合,比如视频监控,摄像头覆盖范围大,而目标区域通常只占整体图像中的很小一部分,图像分辨率较低,导致提取目标特征困难,从而降低了目标识别准确率。
待识别目标的姿态变化,在目标识别过程中,尤其是在非配合的目标识别情况下,摄像机采集到的目标图像经常会有一定程度上的左右旋转或是俯仰角度上的变化,造成了部分正面目标图像信息丢失,从而降低了目标识别性能。
图像的遮挡,有时候环境或者目标本身的变化都会造成目标的部分区域被遮挡,从而导致部分信息的丢失,给目标识别造成了比较大的困难。
发明内容
本发明的目的在于针对上述已有技术的不足,提出了一种基于最优多方向尺度与Gabor相位投影特征结合的人脸识别方法,以解决光照、姿态变化,图像遮挡等因素对人脸识别的影响,提高人脸识别的准确性。
本发明技术方案通过如下步骤实现:
(1)从国际通用的人脸数据库AR中抽取M个男性、N个女性,M≥N≥2,从每个人的26副人脸图像中,获得人脸图片的训练集T、注册集R和测试集H:
1a)获得训练集T:分别抽取M/2个男性,N/2个女性,将每个人的1-26幅人脸图片作为训练集T;
1b)获得测试集H:分别抽取剩余的M/2个男性,剩余的N/2个女性,将每个人的2-26幅人脸图片作为测试集H;
1c)获得注册集R:取测试数据中每个人的1幅人脸图片作为注册集R;
(2)对训练集T、注册集R和测试集H中的每一张人脸图片,提取5个尺度和8个方向结合的共40组Gabor相位投影特征Zμ,ν和单一方向尺度的Gabor相位投影特征Lμ,ν
(3)对训练集T中所有人脸图片的40组Gabor相位投影特征Zμ,ν使用主成分分析PCA降维,得到投影矩阵Mμ,ν
(4)将投影矩阵Mμ,ν和单一方向尺度的Gabor相位投影特征Lμ,ν相乘,获得人脸的新特征Sμ,ν
Sμ,ν=Lμ,ν×Mμ,ν
(5)根据注册集R和测试集H的人脸的新特征Sμ,ν和训练时的人脸识别的识别率,选择识别率最高时的方向尺度为最优多方向尺度;
(6)记录结合的最优多方向尺度,以及每一个最优多方向尺度的子空间投影矩阵,作为训练出的模型;
(7)对待识别人脸图片,重复步骤(2)-(5)得到人脸的特征,将此特征输入步骤(6)中的模型,得到该人脸图片的类别。
本发明与现有技术相比具有以下优点:
(1)本发明由于使用了Gabor相位投影到复数域以后的特征,使得本发明不仅对光照有良好的稳定,也很好的保持了遮挡前后图像的相似性,从而提高了在遮挡情况下的人脸识别的性能。
(2)本发明由于选择了合适的子空间学习方法,在降低特征长度的同时也减少了训练过程的时间,从而提高了人脸识别的性能。
(3)本发明由于选取了最优多方向尺度结合的Gabor相位投影特征,在保证特征不是过大的前提下,找出最优的多方向尺度,从而使人脸的识别率提高。
附图说明
图1是本发明流程图;
图2是AR数据库中部分人脸图片。
具体实施方式
下面结合附图对本发明做进一步的描述。
参照图1,本发明的具体实现过程如下:
步骤一,从国际通用的人脸数据库AR中抽取抽取M个男性、N个女性,M≥N≥2,从每个人的26副人脸图像中,获得人脸图片的训练集T、注册集R和测试集H,本实例中取但不限于M=64,N=52:
1a)获得训练集T:分别抽取32个男性,26个女性,将每个人的1-26幅人脸图片作为训练集T;
1b)获得测试集H:分别抽取剩余的32个男性,剩余的26个女性,将每个人的2-26幅人脸图片作为测试集H;
1c)获得注册集R:取测试数据中每个人的1幅人脸图片作为注册集R;
步骤二,对训练集T、注册集R和测试集H中的每一张人脸图片,提取5个尺度和8个方向结合的共40组Gabor相位投影特征Zμ,ν和单一方向尺度的Gabor相位投影特征Lμ,ν
2a)对每张人脸图像,使用Gabor核进行卷积:
ψ ( μ , v ) = κ μ , v 2 σ 2 exp ( - κ μ , v 2 z 2 2 σ 2 ) [ exp ( iκ μ , v z ) - exp ( - σ 2 2 ) ] ,
其中,ψ(μ,ν)是人脸图像的卷积,μ是Gabor核的方向,ν是Gabor核的尺度,σ为Gabor核方差,z是像素点的坐标,exp(·)为求指数,kμ,ν为波向量,波向量kμ,ν的定义如下:
k μ , v = k v e iφ μ ,
其中,kv=kmax/fv,f为频率,kmax=π/2,φμ=πμ/8,i为虚部符号;
2b)根据人脸图片的Gabor核卷积ψ(μ,ν),得到人脸图片的相位图像Φμ,ν
2c)将该相位图像Φμ,ν投影到复数域,得到人脸图像的单一方向尺度的Gabor相位投影特征Lμ,ν
L μ , v = e i Φ μ , v ;
2d)重复步骤2a)-2c),提取40个方向尺度的Gabor相位投影特征Zμ,ν
步骤三,对训练集T中所有人脸图片的40组Gabor相位投影特征Zμ,ν使用主成分分析PCA降维,得到投影矩阵Mμ,ν
步骤四,将投影矩阵Mμ,ν和单一方向尺度的Gabor相位投影特征Lμ,ν相乘,获得人脸的新特征Sμ,ν
S μ , v = L μ , v × M μ , v .
步骤五,根据注册集R和测试集H的人脸的新特征Sμ,ν和训练时的人脸识别的识别率,选择识别率最高时的方向尺度为最优多方向尺度。
步骤六,记录结合的最优多方向尺度,以及每一个最优多方向尺度的子空间投影矩阵,作为训练出的模型。
步骤七,对待识别人脸图片,重复步骤(2)-(5)得到图像特征,将图像特征输入到步骤(6)中的模型中,得到该人脸图片的类别。
本发明效果可以通过以下仿真实验得到验证。
1)实验数据库及实验设置:现有国际上通用的人脸数据库是AR数据库。AR数据库包含70个男性和56个女性。每个人有26张图像,分别在两个时间段采集的数据,每个时间段采集的图片有13张。第一个时间段采集的13张图片中,1-4张图片包含不同的表情,5-7张图片包含不同的光照,8-13张图片为不同光照下的不同遮挡,第二个时间段采集的数据也按上面的情况分布。图2给出了AR数据库中部分人脸图片。
从AR数据库中抽取64个男性、52个女性,每个人有26张图像作为实验数据。分别抽取其中的32个男性,26个女性,将每个人的第1-26幅人脸图片组成训练集T;再分别抽取剩余的32个男性,26个女性,将每个人的第2-26幅人脸图片作为测试集H;最后取测试数据中每个人的第一幅人脸图片作为注册集R。
2)仿真内容及结果分析:
使用本方法在上述数据集上与以下几种现有方法对比人脸识别性能,实验结果如表一所示。
表一中第一行是使用的人脸识别方法名称,第二行对应人脸识别方法的识别率,第三行是相应的特征长度。
表一:本方法与现有方法在AR数据库上的识别率和特征长度
从表一中可以看出,本方法在特征长度为522的情况下,识别率达到0.84,领先与其他现有方法。这是因为本方法与其他现有方法相比,选择了合适的子空间学习方法,在降低特征长度的同时也减少了训练的时间,同时也提高了人脸识别的识别率。同时由于本发明使用了Gabor相位投影特征与最优多方向尺度结合的方法,使得本发明不仅对光照有良好的稳定,也很好的保持了遮挡前后图像的相似性,从而提高了在遮挡情况下的人脸识别的性能。
从表一中还可以看出,最优多方向尺度结合的Gabor相位投影特征具有最高的识别率0.84。
综上,本发明能解决人脸识别中普遍存在的光照,角度,表情变化以及遮挡对识别准确率影响的问题,具有识别速度快,准确率高,稳定性强,节省特征提取时间的优点,该技术可以进一步用于智能视频监控。

Claims (1)

1.一种基于多方向尺度与Gabor相位投影特征结合的人脸识别方法,其特征在于包括以下步骤:
(1)从国际通用的人脸数据库AR中抽取M个男性、N个女性,M≥N≥2,从每个人的26副人脸图像中,获得人脸图片的训练集T、注册集R和测试集H:
1a)获得训练集T:分别抽取M/2个男性,N/2个女性,将每个人的1-26幅人脸图片作为训练集T;
1b)获得测试集H:分别抽取剩余的M/2个男性,剩余的N/2个女性,将每个人的2-26幅人脸图片作为测试集H;
1c)获得注册集R:取测试数据中每个人的1幅人脸图片作为注册集R;
(2)对训练集T、注册集R和测试集H中的每一张人脸图片,提取5个尺度和8个方向结合的共40组Gabor相位投影特征Zμ,ν和单一方向尺度的Gabor相位投影特征Lμ,ν
2a)对每张人脸图像,使用Gabor核进行卷积:
ψ ( μ , ν ) = κ μ , ν 2 σ 2 exp ( - κ μ , ν 2 z 2 2 σ 2 ) [ exp ( iκ μ , ν z ) - exp ( - σ 2 2 ) ] ,
其中,ψ(μ,ν)是人脸图像的卷积,μ是Gabor核的方向,ν是Gabor核的尺度,σ为Gabor核方差,z是像素点的坐标,exp(·)为求指数,κμ,ν为波向量,波向量κμ,ν的定义如下:
κ μ , ν = κ v e iφ μ ,
其中,κv=κmax/fv,f为频率,κmax=π/2,φμ=πμ/8,i为虚部符号;
2b)根据人脸图片的Gabor核卷积ψ(μ,ν),得到人脸图片的相位图像Φμ,ν
2c)将相位图像Φμ,ν投影到复数域,得到人脸图像的单一方向尺度的Gabor相位投影特征Lμ,ν
L μ , ν = e iΦ μ , ν ;
2d)重复步骤2a)-2c),得到40个方向尺度的Gabor相位投影特征Zμ,ν
(3)对训练集T中所有人脸图片的40组Gabor相位投影特征Zμ,ν使用主成分分析PCA降维,得到投影矩阵Mμ,ν
(4)将投影矩阵Mμ,ν和单一方向尺度的Gabor相位投影特征Lμ,ν相乘,获得人脸的新特征Sμ,ν
Sμ,ν=Lμ,ν×Mμ,ν
(5)根据注册集R和测试集H的人脸的新特征Sμ,ν和训练时的人脸识别的识别率,选择识别率最高时的方向尺度为最优多方向尺度;
(6)记录结合的最优多方向尺度,以及每一个最优多方向尺度的子空间投影矩阵,作为训练出的模型;
(7)对待识别人脸图片,重复步骤(2)-步骤(5)得到待识别人脸图片的特征,将此特征输入步骤(6)中的模型,得到该人脸图片的类别。
CN201310102444.1A 2013-03-27 2013-03-27 基于多方向尺度与Gabor相位投影特征结合的人脸识别方法 Active CN103198299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310102444.1A CN103198299B (zh) 2013-03-27 2013-03-27 基于多方向尺度与Gabor相位投影特征结合的人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310102444.1A CN103198299B (zh) 2013-03-27 2013-03-27 基于多方向尺度与Gabor相位投影特征结合的人脸识别方法

Publications (2)

Publication Number Publication Date
CN103198299A CN103198299A (zh) 2013-07-10
CN103198299B true CN103198299B (zh) 2016-08-10

Family

ID=48720835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310102444.1A Active CN103198299B (zh) 2013-03-27 2013-03-27 基于多方向尺度与Gabor相位投影特征结合的人脸识别方法

Country Status (1)

Country Link
CN (1) CN103198299B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9704025B2 (en) 2015-07-31 2017-07-11 King Abdulaziz City For Science And Technology Identifying non-occluded faces by learning from partially occluded faces
CN106022214B (zh) * 2016-05-04 2019-10-08 南京工程学院 非约束环境下的有效人脸特征提取方法
CN106056059B (zh) * 2016-05-20 2019-02-12 合肥工业大学 多方向slgs特征描述及性能云加权融合的人脸识别方法
WO2021097776A1 (zh) * 2019-11-21 2021-05-27 苏州铭冠软件科技有限公司 基于Gabor特征的人脸检测方法
CN110969633B (zh) * 2019-11-28 2024-02-27 南京安科医疗科技有限公司 一种心脏ct成像自动最优相位识别方法
CN114943955B (zh) * 2022-07-25 2022-11-01 山东广通汽车科技股份有限公司 一种用于半挂车自动卸货控制方法
CN116562358B (zh) * 2023-03-16 2024-01-09 中国人民解放军战略支援部队航天工程大学士官学校 一种图像处理Gabor核卷积神经网络构建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286195A (zh) * 2008-06-03 2008-10-15 西南交通大学 基于二维正交Log-Gabor滤波的高精度掌纹识别方法
CN101551857A (zh) * 2009-05-13 2009-10-07 西南交通大学 基于独立匹配分数层融合的高精度掌纹识别算法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010244381A (ja) * 2009-04-08 2010-10-28 Sony Corp ガボアフィルタ、画像認識装置および方法、プログラム、並びに記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286195A (zh) * 2008-06-03 2008-10-15 西南交通大学 基于二维正交Log-Gabor滤波的高精度掌纹识别方法
CN101551857A (zh) * 2009-05-13 2009-10-07 西南交通大学 基于独立匹配分数层融合的高精度掌纹识别算法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Discriminant Analysis with Gabor Phase for Robust Face Recognition;Jianfei Zhu, et al.;《Biometrics (ICB), 2012 5th IAPR International Conference on》;20120401;第13-18页 *
基于局部Gabor相位特征融合的人脸识别;江艳霞 等;《光电工程》;20100731;第37卷(第7期);第139-144页 *
多通道Gabor相位特征在人脸识别中的应用;陈熙 等;《铁道学报》;20111031;第33卷(第10期);第45-50页 *

Also Published As

Publication number Publication date
CN103198299A (zh) 2013-07-10

Similar Documents

Publication Publication Date Title
CN103198299B (zh) 基于多方向尺度与Gabor相位投影特征结合的人脸识别方法
Cen et al. Fully convolutional siamese fusion networks for object tracking
Song et al. Richly activated graph convolutional network for action recognition with incomplete skeletons
Liao et al. Rotation-sensitive regression for oriented scene text detection
Zhou et al. Specificity-preserving RGB-D saliency detection
Vig et al. Large-scale optimization of hierarchical features for saliency prediction in natural images
CN108334848B (zh) 一种基于生成对抗网络的微小人脸识别方法
WO2021098261A1 (zh) 一种目标检测方法与装置
Wang et al. Action recognition with trajectory-pooled deep-convolutional descriptors
Tzeng et al. Deep domain confusion: Maximizing for domain invariance
Sanchez-Riera et al. A comparative study of data fusion for RGB-D based visual recognition
CN101271525B (zh) 一种快速的图像序列特征显著图获取方法
CN103679142B (zh) 一种基于空间约束的目标人体识别方法
CN104376548A (zh) 一种基于改进型surf算法的图像快速拼接方法
CN103020647A (zh) 基于级联的sift特征和稀疏编码的图像分类方法
Lu et al. Learning attention map from images
Held et al. Deep learning for single-view instance recognition
Ning et al. Hierarchical space-time model enabling efficient search for human actions
Daniilidis et al. Computer Vision--ECCV 2010: 11th European Conference on Computer Vision, Heraklion, Crete, Greece, September 5-11, 2010, Proceedings, Part V
CN105893971A (zh) 一种基于Gabor和稀疏表示的交通信号灯识别方法
CN110008900A (zh) 一种由区域到目标的可见光遥感图像候选目标提取方法
CN103839066A (zh) 一种源于生物视觉的特征提取方法
Hussain et al. A survey of traffic sign recognition systems based on convolutional neural networks
Huang et al. Detecting arbitrary oriented text in the wild with a visual attention model
CN109711420B (zh) 基于人类视觉注意机制的多仿射目标的检测与识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200630

Address after: 518110 Building 403, Smart Cloud Valley D, No. 1 Sanhe Road, Peak Community, Dalang Street, Longhua District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen Tianran Intellectual Property Operations Co.,Ltd.

Address before: Xi'an City, Shaanxi province Taibai Road 710071 No. 2

Patentee before: XIDIAN University

Effective date of registration: 20200630

Address after: 610000 18 new Sichuan Road, Hi-tech Zone, Chengdu

Patentee after: HORSENT TECHNOLOGY Co.,Ltd.

Address before: 518110 Building 403, Smart Cloud Valley D, No. 1 Sanhe Road, Peak Community, Dalang Street, Longhua District, Shenzhen City, Guangdong Province

Patentee before: Shenzhen Tianran Intellectual Property Operations Co.,Ltd.

TR01 Transfer of patent right