CN106599864A

CN106599864A - 一种基于极值理论的深度人脸识别方法

Info

Publication number: CN106599864A
Application number: CN201611189169.1A
Authority: CN
Inventors: 刘佳; 余化鹏; 张建林; 徐智勇; 魏宇星
Original assignee: Institute of Optics and Electronics of CAS
Current assignee: Institute of Optics and Electronics of CAS
Priority date: 2016-12-21
Filing date: 2016-12-21
Publication date: 2017-04-26
Anticipated expiration: 2036-12-21
Also published as: CN106599864B

Abstract

本发明是一种基于极值理论的深度人脸识别方法，包括通过深度卷积神经网络对训练人脸图像进行特征提取，对提取的特征进行SVM分类训练，得到决策面，通过深度卷积神经网络对测试人脸图像进行特征提取，结合分类训练得到的决策面进行预测，得到决策值，基于极值理论对决策值进行统计分析得出预测结果。该方法只需每个人脸类具有极少量的训练样本，能够适应实际应用中人脸在很大范围内的光照、姿态、表情、遮挡等变化，能够有效区分陌生人脸，识别率高。同时该方法训练效率高，能够适应实际应用中对增量学习的需求。

Description

一种基于极值理论的深度人脸识别方法

技术领域

本发明属于人工智能与图像处理领域，涉及一种人脸图像的识别方法，特别是基于极值理论进行统计分析，设置预测阈值，然后输出识别结果。

背景技术

对任意一个识别系统，主要目标是最优化识别性能。对于普通的人脸识别，不希望陌生人脸被误认为人脸库中的已知人脸，同样不希望本该被识别的库中的已知人脸被误认为陌生人脸。极值理论作为视觉应用预测器在以前已经出现，但不是作为识别问题的主要部分。

极值理论主要是指处理与概率分布的中值相离极大的情况的理论。可以直观地假设任何一个考虑尾部分布的问题都是极值问题。最近关于目标检测得分空间的工作依赖于这一假设，但是并没有正式解释为什么极值理论适用于那些分数分布的尾部。仅仅是位于尾部并不足以说明这是一个极值问题。比如可以认为任意特定分布D的前N个值根据定义只满足分布D而不满足其它分布。

识别是一个真正意义上的极值问题。当中心极限定理接近极限时，极值问题与中心极限定理相似。极值分布是发生于一个任意分布的一系列随机观测值的最大值(或最小值，根据数据表示方式而定)。Gumbel表示对于任意连续可逆的初始分布，只需要三个模型，依赖于最大值或最小值是否感兴趣，以及观测值是否有上界或下界。Gumbel同样证明如果一个系统或部分有多种失效模式，通过Weibull分布可以很好地模拟这种故障。

发明内容

本发明要解决的技术问题为：本发明提供一种基于极值理论的深度人脸识别方法，该方法利用预测得到的决策值数组，求得统计值，基于极值理论设置阈值，得到识别结果，提高识别准确率。

本发明采用的技术方案为：本发明提供一种基于极值理论的深度人脸识别方法，如图1所示，该方法包括步骤：

步骤S1：利用预训练的深度卷积神经网络CNN对训练人脸图像进行特征提取，得到特征矩阵，用于训练分类器；

步骤S2：对特征矩阵进行SVM分类训练，得到决策面，用于人脸身份预测；

步骤S3：利用预训练的深度卷积神经网络CNN对测试人脸图像进行特征提取，得到特征矩阵，用于人脸身份预测；

步骤S4：利用训练得到的SVM分类器，对步骤S3中得到的人脸图像特征进行身份预测，基于极值理论，得到预测结果。

其中，步骤S1和步骤S3中，输入到深度卷积神经网络CNN的图像大小为224×224。

其中，步骤S1和步骤S3中，CNN一共有40层，一个输入层(第0层)，一个softmax输出层(第39层)，3个全连接层(第32，35，38层)，其余的是conv/relu/mpool/drop层。

其中，步骤S2中的SVM分类使用了LIBSVM工具包，选择L2-正规化L2-损失径向基核函数SVM并将惩罚因子设为10。

其中，步骤S4中人脸身份预测的步骤包括：

步骤S41：针对每一帧图像的人脸特征进行预测，得到决策值数组，选取决策值数组最大20％部分的值进行统计分析；

步骤S42：基于极值理论，设置识别阈值；

步骤S43：将步骤S41得到的统计值与步骤S42得到的阈值作比较，当阈值大于统计值均方差时，认为识别对象为陌生人，当阈值小于统计值均方差时，得到预测结果。

本发明与现有技术相比的有益效果在于：本发明通过极值理论设置阈值，适应能力强，识别准确率高。

(1)基于极值理论设置阈值，能够更准确区分陌生人脸，提高识别准确率；

(2)只需每个人脸类具有极少量的训练样本；

(3)能够适应实际应用中人脸在很大范围内的光照、姿态、表情、遮挡等变化，识别率高；

(4)训练效率高，能够适应实际应用中对增量学习的需求，不用每次进行重复训练。

附图说明

图1为本发明一种基于极值理论的深度人脸识别方法实现流程图；

图2为本发明具体实施例实现流程图。

具体实施方式

下面结合附图对本发明的实施例作详细说明。本实施例在以本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于以下的实施例。

本发明提供一种人脸识别方法，输入为单帧彩色224×224大小图像。

如图2所示，本发明提供了一种基于极值理论的深度人脸识别方法，包含以下步骤：

步骤S1：使用"triplet-based"损失，利用预训练的深度卷积神经网络CNN对原始训练图像进行特征提取，得到特征矩阵，用于训练分类；

步骤S2：选择L2-规范化L2-损耗径向基核函数SVM对特征矩阵进行分类训练，得到决策面，用于人脸预测，给定一组实例-标签对(x_i,y_i),i＝1,...,l,x_i∈Rⁿ,y_i∈{-1,+1}^l，L2-规范化L2-损耗SVM的目标函数为：

subject to y_i(w^Tφ(x_i)+b)≥1-ξ_i,

ξ_i≥0.

其中，(w,b)是决策面，ξ_i是松弛变量，C>0是惩罚因子，一般由应用问题决定，C值大时对误分类的惩罚增大，C值小时对误分类的惩罚减小。训练向量x_i通过函数φ被映射到更高维空间，K(x_i,x_j)≡φ(x_i)^Tφ(x_j)是核函数。

步骤S3：利用预训练的深度卷积神经网络CNN对原始识别图像进行特征提取，得到特征矩阵，用于人脸身份预测；

步骤S4：利用训练得到的SVM分类器，对步骤S3中得到的人脸图像特征进行身份预测，基于极值理论，得到预测结果；

步骤S42：基于极值理论，设置识别阈值；

经测试，针对不同环境，在摄像头成像质量良好的情况下，人脸识别准确率不低于90％，可支持多张人脸同时识别，人脸识别响应时间不超过3秒。

Claims

1.一种基于极值理论的深度人脸识别方法，其特征在于包括如下步骤：

2.根据权利要求1所述的基于极值理论的深度人脸识别方法，其特征在于，步骤S1和步骤S3中，输入到深度卷积神经网络CNN的图像大小为224×224。

3.根据权利要求1所述的基于极值理论的深度人脸识别方法，其特征在于，步骤S1和步骤S3中，CNN一共有40层，一个输入层，一个softmax输出层，3个全连接层，其余的是conv/relu/mpool/drop层。

4.根据权利要求1所述的基于极值理论的深度人脸识别方法，其特征在于，步骤S2中的SVM分类使用了LIBSVM工具包，选择L2-正规化L2-损失径向基核函数SVM并将惩罚因子设为10。

5.根据权利要求1所述的基于极值理论的深度人脸识别方法，其特征在于，步骤S4中人脸身份预测的步骤包括：

步骤S42：基于极值理论，设置识别阈值；