背景技术
目标识别是计算机视觉领域中一个非常重要的课题,人类认知世界始终伴随着识别,从刚出生开始就要识别父母,识别颜色,然后开始识别文字,识别道路等等。识别的过程也是不断提取信息的过程,有了信息以后才能做出后续的决策。
目标识别一般需要进行特征提取和分类器的选择。现有可提取的图像特征有很多:像素、梯度、Gabor、Haar、HOG、SIFT、shape-context等等;分类器也有很多:贝叶斯分类器、boosting分类器、最近邻分类器、支持向量机SVM、神经网络等等。通常由于直接提取的图像特征数目非常大,需要对特征进行降维或选择,其目的就是找到一个图像特征的子空间,在这个子空间里图像特征具有最少的冗余度或者有最好的判别能力。
目标识别中会受到很多因素的影响,常见的影响因素有:
光照条件的变化,在很多应用场合,由于注册图像和待识别图像往往在不同环境下采集,光照条件差异较大,从而导致注册图像和待识别图像之间存在着较大的光照变化,最终降低了目标识别的准确性。
图像分辨率大小,在高分辨率图像中,目标识别方法已经达到了比较满意的性能。但在一些应用场合,比如视频监控,摄像头覆盖范围大,而目标区域通常只占整体图像中的很小一部分,图像分辨率较低,导致提取目标特征困难,从而降低了目标识别准确率。
待识别目标的姿态变化,在目标识别过程中,尤其是在非配合的目标识别情况下,摄像机采集到的目标图像经常会有一定程度上的左右旋转或是俯仰角度上的变化,造成了部分正面目标图像信息丢失,从而降低了目标识别性能。
图像的遮挡,有时候环境或者目标本身的变化都会造成目标的部分区域被遮挡,从而导致部分信息的丢失,给目标识别造成了比较大的困难。
发明内容
本发明的目的在于针对上述已有技术的不足,提出了一种基于最优多方向尺度与Gabor相位投影特征结合的人脸识别方法,以解决光照、姿态变化,图像遮挡等因素对人脸识别的影响,提高人脸识别的准确性。
本发明技术方案通过如下步骤实现:
(1)从国际通用的人脸数据库AR中抽取M个男性、N个女性,M≥N≥2,从每个人的26副人脸图像中,获得人脸图片的训练集T、注册集R和测试集H:
1a)获得训练集T:分别抽取M/2个男性,N/2个女性,将每个人的1-26幅人脸图片作为训练集T;
1b)获得测试集H:分别抽取剩余的M/2个男性,剩余的N/2个女性,将每个人的2-26幅人脸图片作为测试集H;
1c)获得注册集R:取测试数据中每个人的1幅人脸图片作为注册集R;
(2)对训练集T、注册集R和测试集H中的每一张人脸图片,提取5个尺度和8个方向结合的共40组Gabor相位投影特征Zμ,ν和单一方向尺度的Gabor相位投影特征Lμ,ν;
(3)对训练集T中所有人脸图片的40组Gabor相位投影特征Zμ,ν使用主成分分析PCA降维,得到投影矩阵Mμ,ν;
(4)将投影矩阵Mμ,ν和单一方向尺度的Gabor相位投影特征Lμ,ν相乘,获得人脸的新特征Sμ,ν:
Sμ,ν=Lμ,ν×Mμ,ν;
(5)根据注册集R和测试集H的人脸的新特征Sμ,ν和训练时的人脸识别的识别率,选择识别率最高时的方向尺度为最优多方向尺度;
(6)记录结合的最优多方向尺度,以及每一个最优多方向尺度的子空间投影矩阵,作为训练出的模型;
(7)对待识别人脸图片,重复步骤(2)-(5)得到人脸的特征,将此特征输入步骤(6)中的模型,得到该人脸图片的类别。
本发明与现有技术相比具有以下优点:
(1)本发明由于使用了Gabor相位投影到复数域以后的特征,使得本发明不仅对光照有良好的稳定,也很好的保持了遮挡前后图像的相似性,从而提高了在遮挡情况下的人脸识别的性能。
(2)本发明由于选择了合适的子空间学习方法,在降低特征长度的同时也减少了训练过程的时间,从而提高了人脸识别的性能。
(3)本发明由于选取了最优多方向尺度结合的Gabor相位投影特征,在保证特征不是过大的前提下,找出最优的多方向尺度,从而使人脸的识别率提高。
具体实施方式
下面结合附图对本发明做进一步的描述。
参照图1,本发明的具体实现过程如下:
步骤一,从国际通用的人脸数据库AR中抽取抽取M个男性、N个女性,M≥N≥2,从每个人的26副人脸图像中,获得人脸图片的训练集T、注册集R和测试集H,本实例中取但不限于M=64,N=52:
1a)获得训练集T:分别抽取32个男性,26个女性,将每个人的1-26幅人脸图片作为训练集T;
1b)获得测试集H:分别抽取剩余的32个男性,剩余的26个女性,将每个人的2-26幅人脸图片作为测试集H;
1c)获得注册集R:取测试数据中每个人的1幅人脸图片作为注册集R;
步骤二,对训练集T、注册集R和测试集H中的每一张人脸图片,提取5个尺度和8个方向结合的共40组Gabor相位投影特征Zμ,ν和单一方向尺度的Gabor相位投影特征Lμ,ν。
2a)对每张人脸图像,使用Gabor核进行卷积:
其中,ψ(μ,ν)是人脸图像的卷积,μ是Gabor核的方向,ν是Gabor核的尺度,σ为Gabor核方差,z是像素点的坐标,exp(·)为求指数,kμ,ν为波向量,波向量kμ,ν的定义如下:
其中,kv=kmax/fv,f为频率,kmax=π/2,φμ=πμ/8,i为虚部符号;
2b)根据人脸图片的Gabor核卷积ψ(μ,ν),得到人脸图片的相位图像Φμ,ν;
2c)将该相位图像Φμ,ν投影到复数域,得到人脸图像的单一方向尺度的Gabor相位投影特征Lμ,ν:
2d)重复步骤2a)-2c),提取40个方向尺度的Gabor相位投影特征Zμ,ν。
步骤三,对训练集T中所有人脸图片的40组Gabor相位投影特征Zμ,ν使用主成分分析PCA降维,得到投影矩阵Mμ,ν。
步骤四,将投影矩阵Mμ,ν和单一方向尺度的Gabor相位投影特征Lμ,ν相乘,获得人脸的新特征Sμ,ν:
步骤五,根据注册集R和测试集H的人脸的新特征Sμ,ν和训练时的人脸识别的识别率,选择识别率最高时的方向尺度为最优多方向尺度。
步骤六,记录结合的最优多方向尺度,以及每一个最优多方向尺度的子空间投影矩阵,作为训练出的模型。
步骤七,对待识别人脸图片,重复步骤(2)-(5)得到图像特征,将图像特征输入到步骤(6)中的模型中,得到该人脸图片的类别。
本发明效果可以通过以下仿真实验得到验证。
1)实验数据库及实验设置:现有国际上通用的人脸数据库是AR数据库。AR数据库包含70个男性和56个女性。每个人有26张图像,分别在两个时间段采集的数据,每个时间段采集的图片有13张。第一个时间段采集的13张图片中,1-4张图片包含不同的表情,5-7张图片包含不同的光照,8-13张图片为不同光照下的不同遮挡,第二个时间段采集的数据也按上面的情况分布。图2给出了AR数据库中部分人脸图片。
从AR数据库中抽取64个男性、52个女性,每个人有26张图像作为实验数据。分别抽取其中的32个男性,26个女性,将每个人的第1-26幅人脸图片组成训练集T;再分别抽取剩余的32个男性,26个女性,将每个人的第2-26幅人脸图片作为测试集H;最后取测试数据中每个人的第一幅人脸图片作为注册集R。
2)仿真内容及结果分析:
使用本方法在上述数据集上与以下几种现有方法对比人脸识别性能,实验结果如表一所示。
表一中第一行是使用的人脸识别方法名称,第二行对应人脸识别方法的识别率,第三行是相应的特征长度。
表一:本方法与现有方法在AR数据库上的识别率和特征长度
从表一中可以看出,本方法在特征长度为522的情况下,识别率达到0.84,领先与其他现有方法。这是因为本方法与其他现有方法相比,选择了合适的子空间学习方法,在降低特征长度的同时也减少了训练的时间,同时也提高了人脸识别的识别率。同时由于本发明使用了Gabor相位投影特征与最优多方向尺度结合的方法,使得本发明不仅对光照有良好的稳定,也很好的保持了遮挡前后图像的相似性,从而提高了在遮挡情况下的人脸识别的性能。
从表一中还可以看出,最优多方向尺度结合的Gabor相位投影特征具有最高的识别率0.84。
综上,本发明能解决人脸识别中普遍存在的光照,角度,表情变化以及遮挡对识别准确率影响的问题,具有识别速度快,准确率高,稳定性强,节省特征提取时间的优点,该技术可以进一步用于智能视频监控。