CN107609459B

CN107609459B - 一种基于深度学习的人脸识别方法及装置

Info

Publication number: CN107609459B
Application number: CN201611158851.4A
Authority: CN
Inventors: 王健宗; 刘铭; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2016-12-15
Filing date: 2016-12-15
Publication date: 2018-09-11
Anticipated expiration: 2036-12-15
Also published as: CN107609459A

Abstract

本发明适用于人脸识别技术领域，提供了基于深度学习的人脸识别方法及装置，包括：构建基于人脸训练图像的深度神经网络；获取待识别图像；检测待识别图像中的人脸区域并将其提取出来；将人脸区域图像转化为标准正面人脸图像后，输入至深度神经网络；利用深度神经网络，输出标准正面人脸图像的表达向量；将表达向量与人脸库中的每个人脸描述特征进行比对，以获取待识别图像的人脸身份。在本发明中，由于使用了多张人脸训练图像作为监督信息来建立深度神经网络，且每张图像的人物特征都是基于深度神经网络来提取，因此能学习并使用到鲁棒性更强的人物特征，相比于传统的人脸识别方法，人脸识别效果更好，在复杂环境条件下，能拥有更强的抗干扰能力。

Description

一种基于深度学习的人脸识别方法及装置

技术领域

本发明属于人脸识别技术领域，尤其涉及一种基于深度学习的人脸识别方法及装置。

背景技术

随着视频监控的快速普及，众多视频监控的应用迫切需要一种能用于远距离、用户非配合状态下的快速身份识别技术，以求远距离快速确认人员身份，实现智能预警。因此，不断发展起来的人脸识别技术在该过程中发挥了主要的作用。人脸识别技术是基于人的脸部特征，对输入的人脸图像或者视频流进行处理，以识别每个人脸的身份的技术。主要的人脸识别方法包括以下步骤：提取图像中每个人脸所蕴涵的身份特征，将其与已知的人脸进行匹配对比，从而达到识别每个人脸的身份的效果。

目前，提取每个人脸中所蕴涵的身份特征主要是通过基于手工设计的特征提取算法来在实现。而在实际复杂环境中，人脸数据往往存在着各种因素的影响，例如光照、遮挡、姿态变化等，在这种情况下，现有基于手工设计特征提取算法的人脸识别方法具有较差的鲁棒性，对上述影响因素的抗干扰能力较差，而这些不可控制的因素使得基于现有方法的人脸识别性能急剧下降，难以保证人脸识别的效果，存在人脸识别准确率低的问题。

发明内容

有鉴于此，本发明实施例提供了一种基于深度学习的人脸识别方法及系统，以解决现有技术对人脸数据中的复杂环境因素抗干扰能力差以及具备较低鲁棒性的问题。

第一方面，提供了一种基于深度学习的人脸识别方法，包括：

构建并训练基于人脸训练图像的深度神经网络；

获取待识别图像；

检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来；

将所述人脸区域图像转化为标准正面人脸图像后，输入至所述深度神经网络；

利用所述深度神经网络，输出所述标准正面人脸图像的表达向量，所述表达向量描述了所述待识别图像的人脸特征；

将所述表达向量与人脸库中的每个人脸描述特征进行比对，以获取所述待识别图像的人脸身份。

第二方面，提供了一种基于深度学习的人脸识别装置，包括：

训练单元，用于构建并训练基于人脸训练图像的深度神经网络；

获取单元，用于获取待识别图像；

检测单元，用于检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来；

转化单元，用于将所述人脸区域图像转化为标准正面人脸图像后，输入至所述深度神经网络；

输出单元，用于利用所述深度神经网络，输出所述标准正面人脸图像的表达向量，所述表达向量描述了所述待识别图像的人脸特征；

识别单元，用于将所述表达向量与人脸库中的每个人脸描述特征进行比对，以获取所述待识别图像的人脸身份。

在本发明实施例中，通过将待识别图像调整为标准正面图像，再与已知人物身份的图像进行逐一对比，能够加大人脸识别的准确度。由于使用了多张人脸训练图像作为监督信息的来源以建立深度神经网络，且每张图像的人物特征都是基于深度神经网络来提取，因此能够学习并使用到鲁棒性更强的人物特征，相比于传统的人脸识别方法，人脸识别的效果更好，在复杂环境条件下，能拥有更强的抗干扰能力。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的基于深度学习的人脸识别方法的实现流程图；

图2是本发明实施例提供的基于深度学习的人脸识别方法S103的具体实现流程图；

图3是本发明实施例提供的基于深度学习的人脸识别方法S104的具体实现流程图；

图4是本发明实施例提供的基于深度学习的人脸识别方法S105的具体实现流程图；

图5是本发明实施例提供的基于深度学习的人脸识别方法S101的具体实现流程图；

图6是本发明实施例提供的基于深度学习的人脸识别装置的结构框图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本发明实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本发明的描述。

本发明实施例基于深度神经网络来实现，对神经网络模型的训练依靠人物训练图像的人物特征来对模型的参数进行估计及优化调整，以相同的神经网络模型来处理不同的图像，待识别图像依次通过各级深度神经网络，获得图像的特征表达向量后，将表达向量与多个人像库中记录的人脸描述特征进行对比，将不符合匹配条件的人物图像淘汰，最终，接受符合匹配条件的人物图像对应的人物身份作为人脸识别的结果。

为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。

图1示出了本发明实施例提供的基于深度学习的人脸识别方法的实现流程，详述如下：

在S101中，构建并训练基于人脸训练图像的深度神经网络。

所述人脸训练图像包含但不限于不同人脸朝向、不同遮挡物以及不同光照条件下的多张人脸图像。

在本实施例中，通过收集各种条件下的人脸训练图像或输入数量足够多的人脸训练图像来建立深度神经网络模型，该人物训练图像为已知人物身份信息的具有标记的图像样本，用于调整深度神经网络模型的参数，使该模型能够基于监督学习，在实际应用中达到所要求的识别性能。

在S102中，获取待识别图像。

待识别图像可以为一副或多副人脸图像，甚至可以是从视频流中截取出来的图像画面或根据客观描述拼接、绘制出来的人脸图画。所述待识别图像预先输入并存储于人脸识别装置的系统中。

在本实施例中，利用OpenCV(Open Source Computer Vision Library，开源计算机视觉库)读取所述系统中存储的待识别图像。

在S103中，检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来。

在待识别图像中，由于存在各种动物、物品或其他背景元素的干扰，需要先对图像中的人脸区域进行检测，确认是否存在待检测的人脸目标，并将存在待识别图像中的人脸目标位置记录下来。

作为本发明的一个实施例，图2示出了本发明实施例提供的基于深度学习的人脸识别方法S103的具体实现流程，详述如下：

在S201中，对所述待识别图像进行预处理。

在本实施例中，对所述待识别图像进行预处理可以包括：对待识别图像进行灰度化处理或者进行高斯模糊处理。若选用高斯模糊，则应当附加图像锐化处理，以突出待识别图像中的边界条纹细节，使深度神经网络模型能够从中提取出更具有判定性的人物识别特征。

在本实施例中，预处理方式优选为灰度化处理，该处理可以通过直方图、灰度变化或正交变换的方式来实现。

在S202中，通过预先加载的Haar人脸检测模型，对所述预处理后的待识别图像进行人脸区域的定位。

Haar(Haar-like)人脸检测模型通过对待识别图像中的Haar特征进行计算，以确认当前图像中是否存在人脸，该过程基于OpenCV中的HaarCascades目标检测框架来自动完成。

当前，Haar特征分为四类：边缘特征、线性特征、中心特征和对角线特征。四类Haar特征组合成为特征模板。特征模板内有白色和黑色两种矩形，该模板的Haar特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了待识别图像的灰度变化情况，通过以Haar特征值来量化人脸特征，可实现人脸和非人脸区域的区分。

由于Haar特征模板子窗口在待识别图片中不断地进行移位及滑动，因此，子窗口每到一个位置，就会通过计算出该区域的Haar特征。通过利用预先训练好的级联分类器对该Haar特征进行筛选，一旦该特征通过了所有分类器的筛选，则判定该区域为人脸。

经过上述检测，能够定位出待识别图像中的人脸区域。

此外，还可以通过使用基于OpenCV的脸部标记检测器(face landmark detector)对待识别图像进行人脸检测，该检测器从预先标记好脸部关键点的多张人脸图像中训练获得。

在S203中，根据所述人脸区域的定位，在所述待识别图像中将所述人脸区域提取出来。

当检测到人脸区域后，将人脸区域所处在待识别图像中的位置信息记录下来，如该人脸区域左上角的坐标以及人脸区域的宽度和高度等。根据记录的区域起止点或区域大小信息，能够单独从待识别图像中将人脸区域提取出来。

在本实施例中，由于目前彩色图像基本都采用RGB颜色模式，而RGB并不能真实反映图像的形态特征，因此为了减少提取图像Haar特征的时间，提高图像处理的效率，将待识别图像经过灰度化等预处理，转换为8位的灰度值图像。通过对图像的Haar特征进行计算，能够检测出人脸区域位置，将包含干扰因素的非人脸区域淘汰，能够提高后续图像处理的速度与精确度。

在S104中，将所述人脸区域图像转化为标准正面人脸图像后，输入至所述深度神经网络。

由于大部分情况下，图像中的人脸朝向会存在一定的角度倾斜，朝向太偏的人脸图像会提高后续算法的识别难度，因此，在本实施例中，将待识别图像中的人脸区域图像进行校正，以方便后续模型对其进行处理。

作为本发明的一个实施例，图3示出了本发明实施例提供的基于深度学习的人脸识别方法S104的具体实现流程，详述如下：

在S301中，标记所述人脸区域图像中的关键点位置。

对人脸区域中的关键点进行检测，将满足关键点特征的位置标记出来。所述关键点包括但不限于左瞳孔，右瞳孔，左眉毛，右眉毛，鼻子左侧，鼻孔下侧，上嘴唇下侧，嘴角和脸颊等具体人脸器官点。

在S302中，通过仿射变换函数校准所述关键点位置，输出校准人脸图像。

对于所述每个关键点位置，仿射变换的功能是实现关键点二维坐标到二维坐标之间的线性变换，且保持待识别图像的“平直性”和“平行性”。通过一系列的原子变换的复合来实现，包括但不限于平移，缩放，翻转，旋转和剪切等操作。

经仿射变换函数处理后的关键点原坐标(x，y)变为了新坐标(x'，y')，各个关键点新坐标的集合，实现了将人脸区域中的倾斜人脸转换为人脸正对图片观察者的校准人脸图像。

在S303中，将所述校准人脸图像缩放至预设尺寸，以获得所述标准正面人脸图像。

在本实施例中，将所述校准人脸图像放大至预设尺寸，能够保留待识别图像中的更多人脸细节特征，从而使得人脸识别效果更为准确；将所述校准人脸图像缩小至预设尺寸，能够加快人脸识别的速度，减少处理过程中的运算量。因此，根据实际需求获取预设尺寸，满足预设尺寸的校准人脸图像为所述标准正面人脸图像。

通过发明人的实验发现，预设尺寸优选为96x96。该尺寸能够将人脸完整并且清晰地展现出来，且能够较好地平衡图像后续处理的速度及精度。

在S105中，利用所述深度神经网络，输出所述标准正面人脸图像的表达向量，所述表达向量描述了所述待识别图像的人脸特征。

该深度神经网络包含了多个层，不同层的作用有所差异。在本实施例中，该网络为基于GoogLeNet的深度神经网络，网络结构如表1所示：

表1

在表1中，layer列表示深度神经网络中每个层的名称，其中，Conv表示卷积层，Pool表示池化层，Rnorm1表示正则化层，Fc1表示全连接层，每层名称后面的数字表示该层的序号，例如，Conv1表示第一层卷积层；Layer-in表示对应的每个神经网络层的图像输入维度，如“220_220_3”表示输入的图像宽为220，高为220，输入的频道数为3；Layer-out表示对应的每个神经网络层的图像特征输出维度；Kernel表示对应的每个神经网络层所用的过滤器，如“7_7_3，2”表示过滤器的宽为7，高为7，输入的频道数为3，2表示该过滤器在输入的图像中每次滑动的步长；L2表示对连接的网络层权值进行第二范式规约化，以防止神经网络模型的过拟合；FLPS表示每秒所执行的浮点运算次数，如“115M”表示每秒115百万次浮点运算。其中，频道数表示图像的数量。

可以理解的是，在实际应用的网络结构中，可以包含其他数量的层次结构。

在本实施例中，通过将标准正面人脸图像输入所述深度神经网络，经过深度网络模型的最后一个完全连接层，能够输出该待识别图像的人脸描述特征，并通过表达向量来表示。由于该网络层有128个神经元，能够产生128个输出，因此所述人脸描述特征为一个128维的向量。

所述表达向量获取后，对其进行L2归一化，即以向量中每个元素除以向量的L2范数。

归一化后向量的元素值波动范围变得相对稳定，不会因为某些元素值较小或较大而对神经网络模型的训练造成干扰。

在S106中，将所述表达向量与人脸库中的每个人脸描述特征进行比对，以获取所述待识别图像的人脸身份。

由于表达向量表示待识别图像的人脸描述特征，因此可以将人脸库中的多个人脸图像的人脸描述特征与所述表达向量进行比对，满足对比条件的人脸库图像为待识别图像的人脸识别结果。根据特征比对规则，还能够筛选出与待识别图像匹配度最高的多个候选人物身份。

作为本发明的另一个实施例，图4示出了本发明实施例提供的基于深度学习的人脸识别方法S105的具体实现流程，详述如下：

S401，在获取人脸库中的每一张人脸对比图像。

S402，对于所述每一张人脸对比图像，检测所述人脸对比图像中人脸区域的位置，并将所述人脸区域提取出来作为第二图像。

S403，将所述每张第二图像分别转化为标准正面人脸图像后，输入至所述深度神经网络。

S404，根据所述每张标准正面人脸图像，利用所述深度神经网络，提取所述每张人脸对比图像的人脸描述特征。

对于上述实施例S102至S105中所述的内容，在本实施例的S401至S404中也同样适用，区别在于本实施例中处理的原始图像为多张人脸对比图像，S102至S105中处理的原始图像为待识别图像，其余实现原理均相同，在此不一一赘述。

S405，分别计算所述表达向量与所述每张人脸对比图像中所述人脸描述特征的特征距离。

每张人脸对比图像中的人脸描述特征同样可以使用一个特征向量来表示，该特征向量与所述待识别图像的表达向量的特征距离通过以下方式求出：

将两个向量相减求出差值向量；

计算所述差值向量中的每个元素值的平方和，输出为特征向量与表达向量的特征距离。

其中，每个元素对应128-D向量中的一个维度特征值。

S406，获取所述特征距离小于预设阈值的所述人脸对比图像，所述人脸对比图像对应的人脸身份输出为所述待识别图像的人脸身份。

上述每个特征距离与预设阈值进行对比的过程属于一个二分类问题，即，判断特征距离对应的人脸对比图像是匹配该待识别图像或者不匹配该待识别图像。

在本实施例中，设置预设阈值作为人脸识别的匹配条件，当特征距离小于或等于预设阈值时，所述特征距离对应的人脸对比图像即被视为与待识别图像匹配，该待识别图像中人脸的身份则得到了确认，为所述人脸对比图像中注册的人脸身份。

作为本发明的另一个实施例，上述预设阈值优选为1.05，是一个具有人脸判定性的阈值。

作为本发明的另一个实施例，对于深度神经网络结构的训练可以使用随机梯度下降的优化方法。其中，模型的势能项设置为0.9，学习率固定为0.01，每6个训练次数(epochs)减少25％，分类任务使用交叉实体损失(Cross-entity Loss)函数。

具体地，如图5所示：

在S501中，利用开源的预训练模型初始化所述深度神经网络。

在本实施例中，采用Caffe开源的预训练模型初始化深度神经网络的起始模型状态。

在S502中，将多种类型的多张人脸训练图像输入所述深度神经网络。

使用多张人脸训练图像作为训练样本的人脸数据，所述不同类型的图像包含姿态，光照，遮挡、人等较多影响因素。

在S503中，根据所述每张人脸训练图像的特征，使用异步随机梯度下降算法学习所述深度神经网络的特征提取参数。

在S504中，根据所述特征提取参数，使用交叉实体损失函数计算所述深度神经网络的特征提取效果值。

在S505中，令所述深度神经网络迭代学习所述特征提取参数，直至所述特征提取效果值满足预设优化目标。

为了使得属于同一身份人的人脸训练图像的特征距离尽可能小，属于不同身份人的人脸训练图像的特征距离尽可能大，在本实施例中，以三张人脸训练图像构成一个三元组，表述为(Anchor，Positive，Negative)。其中，Anchor人脸训练图像与Positive人脸训练图像属于同一个身份人，Anchor人脸训练图像与Negative人脸训练图像属于不同的身份人。在交叉实体损失函数的指导下，神经网络模型会逐渐学习到提取如下性质的人脸特征：Anchor人脸训练图像与Positive人脸训练图像的特征距离总小于Anchor人脸训练图像与Negative人脸训练图像的特征距离。

假设第i个三元组为tuple i(Anchor_i，Positive_i，Negative_i)，从该三元组中提取出的每张人脸训练图像的人脸描述特征分别为:(P_i ^Anchor，P_i ^Positive，P_i ^Negative)，则深度神经网络的特征提取参数优化的目标如下:

T为所有三元组人脸训练图像构成的集合。因此，若Cross-entity Loss为L，以L来表示特征提取效果，则L的表达式如下:

其中，δ设置为0.5，i为三元组的索引下标，K为训练三元组的总数。

本实施例中，在对深度神经网络训练时，利用多张人脸训练图像的监督信息(包括人脸关键点的位置、人脸的属性等)对所述神经网络进行训练，有助于增强人脸特征提取任务的学习。损失函数值越小，从图像中提取出的人物描述特征越具有判定性，模型优化的程度越高，有利于提高人脸识别方法的鲁棒性和对复杂情况的处理能力。由于整个过程中模型的参数是随着人物训练图像的输入而不断发生动态的变化，能够实现自适应的参数调整，因此，通过本方法能够得到更好的深度神经网络训练效果。

本发明实施例通过将待识别图像调整为标准正面图像，再与已知人物身份的图像进行逐一对比，能够加大人脸识别的准确度。由于使用了多张人脸训练图像作为监督信息的来源来建立深度神经网络，且每张图像的人物特征都是基于深度神经网络来提取，因此能够学习并使用到鲁棒性更强的人物特征，相比于传统的人脸识别方法，人脸识别的效果更好，在复杂环境条件下，能拥有更强的抗干扰能力。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

对应于上文实施例所述的基于深度学习的人脸识别方法，图6示出了本发明实施例提供的基于深度学习的人脸识别装置的结构框图，所述人脸识别装置可以是软件单元、硬件单元或者是软硬结合的单元。为了便于说明，仅示出了与本实施例相关的部分。

参照图6，该装置包括：

训练单元61，用于构建并训练基于人脸训练图像的深度神经网络。

获取单元62，用于获取待识别图像。

检测单元63，用于检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来。

转化单元64，用于将所述人脸区域图像转化为标准正面人脸图像后，输入至所述深度神经网络。

输出单元65，用于利用所述深度神经网络，输出所述标准正面人脸图像的表达向量，所述表达向量描述了所述待识别图像的人脸特征。

识别单元66，用于将所述表达向量与人脸库中的每个人脸描述特征进行比对，以获取所述待识别图像的人脸身份。

可选地，所述检测单元63包括：

预处理子单元，用于对所述待识别图像进行预处理。

定位子单元，用于通过预先加载的Haar人脸检测模型，对所述预处理后的待识别图像进行人脸区域的定位。

提取子单元，用于根据所述人脸区域的定位，在所述待识别图像中将所述人脸区域提取出来。

可选地，所述转化单元64包括：

标记子单元，用于标记所述人脸区域图像中的关键点位置。

校准子单元，用于通过仿射变换函数校准所述关键点位置，输出校准人脸图像。

缩放子单元，用于将所述校准人脸图像缩放至预设尺寸，以获得所述标准正面人脸图像。

可选地，所述训练单元61包括：

初始化子单元，用于利用开源的预训练模型初始化所述深度神经网络。

输入子单元，用于将多种类型的多张人脸训练图像输入所述深度神经网络。

学习子单元，用于根据所述每张人脸训练图像的特征，使用异步随机梯度下降算法学习所述深度神经网络的特征提取参数。

计算子单元，用于根据所述特征提取参数，使用交叉实体损失函数计算所述深度神经网络的特征提取效果值。

迭代子单元，用于令所述深度神经网络迭代学习所述特征提取参数，直至所述特征提取效果值满足预设优化目标。

可选地，所述识别单元66包括：

第二获取单元，用于获取人脸库中的每一张人脸对比图像。

第二检测单元，用于对于所述每一张人脸对比图像，检测所述人脸对比图像中人脸区域的位置，并将所述人脸区域提取出来作为第二图像。

第二转化单元，用于将所述每张第二图像分别转化为标准正面人脸图像后，输入至所述深度神经网络。

提取单元，用于根据所述每张标准正面人脸图像，利用所述深度神经网络，提取所述每张人脸对比图像的人脸描述特征。

计算单元，用于分别计算所述表达向量与所述每张人脸对比图像中所述人脸描述特征的特征距离。

对比单元，用于获取所述特征距离小于预设阈值的所述人脸对比图像，所述人脸对比图像对应的人脸身份输出为所述待识别图像的人脸身份。

在本发明实施例中，通过将待识别图像调整为标准正面图像，再与已知人物身份的图像进行逐一对比，能够加大人脸识别的准确度。由于使用了多张人脸训练图像作为监督信息的来源来建立深度神经网络，且每张图像的人物特征都是基于深度神经网络来提取，因此能够学习并使用到鲁棒性更强的人物特征，相比于传统的人脸识别方法，人脸识别的效果更好，在复杂环境条件下，能拥有更强的抗干扰能力。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的系统实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种基于深度学习的人脸识别方法，其特征在于，包括：

构建并训练基于人脸训练图像的深度神经网络，包括：

利用开源的预训练模型初始化所述深度神经网络；

将多种类型的多张人脸训练图像输入所述深度神经网络；

根据每张人脸训练图像的特征，使用异步随机梯度下降算法学习所述深度神经网络的特征提取参数，包括以三张人脸训练图像构成一个三元组，表述为(Anchor，Positive，Negative)，其中，Anchor人脸训练图像与Positive人脸训练图像属于同一个身份人，Anchor人脸训练图像与Negative人脸训练图像属于不同的身份人；

根据所述特征提取参数，使用交叉实体损失函数计算所述深度神经网络的特征提取效果值；

令所述深度神经网络迭代学习所述特征提取参数，直至所述特征提取效果值满足预设优化目标；

获取待识别图像；

2.如权利要求1所述的方法，其特征在于，所述检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来包括：

对所述待识别图像进行预处理；

通过预先加载的Haar人脸检测模型，对所述预处理后的待识别图像进行人脸区域的定位；

根据所述人脸区域的定位，在所述待识别图像中将所述人脸区域提取出来。

3.如权利要求1所述的方法，其特征在于，所述将所述人脸区域图像转化为标准正面人脸图像包括：

标记所述人脸区域图像中的关键点位置；

通过仿射变换函数校准所述关键点位置，输出校准人脸图像；

将所述校准人脸图像缩放至预设尺寸，以获得所述标准正面人脸图像。

4.如权利要求1至3中任一项所述的方法，其特征在于，所述将所述表达向量与人脸库中的每个人脸描述特征进行比对，以获取所述待识别图像的人脸身份包括：

获取人脸库中的每一张人脸对比图像；

对于所述每一张人脸对比图像，检测所述人脸对比图像中人脸区域的位置，并将所述人脸区域提取出来作为第二图像；

将所述每张第二图像分别转化为标准正面人脸图像后，输入至所述深度神经网络；

根据所述每张标准正面人脸图像，利用所述深度神经网络，提取所述每张人脸对比图像的人脸描述特征；

分别计算所述表达向量与所述每张人脸对比图像中所述人脸描述特征的特征距离；

获取所述特征距离小于预设阈值的所述人脸对比图像，所述人脸对比图像对应的人脸身份输出为所述待识别图像的人脸身份。

5.一种基于深度学习的人脸识别装置，其特征在于，包括：

训练单元，用于构建并训练基于人脸训练图像的深度神经网络，

所述训练单元包括：

初始化子单元，用于利用开源的预训练模型初始化所述深度神经网络；

输入子单元，用于将多种类型的多张人脸训练图像输入所述深度神经网络；

学习子单元，用于根据每张人脸训练图像的特征，使用异步随机梯度下降算法学习所述深度神经网络的特征提取参数，包括以三张人脸训练图像构成一个三元组，表述为(Anchor，Positive，Negative)，其中，Anchor人脸训练图像与Positive人脸训练图像属于同一个身份人，Anchor人脸训练图像与Negative人脸训练图像属于不同的身份人；

计算子单元，用于根据所述特征提取参数，使用交叉实体损失函数计算所述深度神经网络的特征提取效果值；

迭代子单元，用于令所述深度神经网络迭代学习所述特征提取参数，直至所述特征提取效果值满足预设优化目标；

获取单元，用于获取待识别图像；

6.如权利要求5所述的装置，其特征在于，所述检测单元包括：

预处理子单元，用于对所述待识别图像进行预处理；

定位子单元，用于通过预先加载的Haar人脸检测模型，对所述预处理后的待识别图像进行人脸区域的定位；

7.如权利要求5所述的装置，其特征在于，所述转化单元包括：

标记子单元，用于标记所述人脸区域图像中的关键点位置；

校准子单元，用于通过仿射变换函数校准所述关键点位置，输出校准人脸图像；

8.如权利要求5至7中任一项所述的装置，其特征在于，所述识别单元包括：

第二获取单元，用于获取人脸库中的每一张人脸对比图像；

第二检测单元，用于对于所述每一张人脸对比图像，检测所述人脸对比图像中人脸区域的位置，并将所述人脸区域提取出来作为第二图像；

第二转化单元，用于将所述每张第二图像分别转化为标准正面人脸图像后，输入至所述深度神经网络；

提取单元，用于根据所述每张标准正面人脸图像，利用所述深度神经网络，提取所述每张人脸对比图像的人脸描述特征；

计算单元，用于分别计算所述表达向量与所述每张人脸对比图像中所述人脸描述特征的特征距离；