WO2021218899A1

WO2021218899A1 - 人脸识别模型训练方法、人脸识别方法及装置

Info

Publication number: WO2021218899A1
Application number: PCT/CN2021/089846
Authority: WO
Inventors: 王子路
Original assignee: 京东方科技集团股份有限公司
Priority date: 2020-04-30
Filing date: 2021-04-26
Publication date: 2021-11-04
Also published as: CN111582141B; CN111582141A

Abstract

人脸识别模型训练方法、人脸识别方法及装置，涉及图像处理技术领域。所述人脸识别模型训练方法包括：获取样本人脸图像；根据所述样本人脸图像对初始人脸识别模型进行训练，得到用于对图像中的人脸位置进行检测的预训练人脸识别模型；利用第一训练神经网络模型和第二训练神经网络模型根据所述样本人脸图像对所述预训练识别模型进行二次训练，得到目标人脸识别模型。

Description

人脸识别模型训练方法、人脸识别方法及装置

相关申请的交叉引用

本公开要求在2020年04月30日提交中国专利局、申请号为202010366448.0、名称为“人脸识别模型训练方法、人脸识别方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及图像处理技术领域，特别是涉及一种人脸识别模型训练方法、人脸识别方法及装置。

背景技术

随着电子商务等应用的发展，人脸识别成为最有潜力的生物身份验证手段，这种应用背景要求自动人脸识别系统能够对一般图象具有一定的识别能力，由此使得人脸检测技术得以发展。随后，金字塔多层级检测网络(如PyramidBox等)的出现使人脸检测达到了一个非常高的性能。

概述

本公开提供了一种人脸识别模型训练方法、人脸识别方法及装置。

本公开提供了一种人脸识别模型训练方法，包括：

获取样本人脸图像；

根据所述样本人脸图像对初始人脸识别模型进行训练，得到用于对图像中的人脸位置进行检测的预训练人脸识别模型；

利用第一训练神经网络模型和第二训练神经网络模型根据所述样本人脸图像对所述预训练人脸识别模型进行二次训练，得到目标人脸识别模型。

可选地，所述样本人脸图像对应于一个初始人脸标注框，所述初始人脸识别模型包括：检测模型组件；

所述根据所述样本人脸图像对初始人脸识别模型进行训练，得到用于对图像中的人脸位置进行检测的预训练人脸识别模型，包括：

调用所述检测模型组件对所述样本人脸图像进行识别，得到预测人脸框；

根据所述初始人脸标注框和所述预测人脸框，计算得到所述初始人脸识别模型对应的第一损失值；

在所述第一损失值达到第一初始值的情况下，将训练后的初始人脸识别模型作为所述预训练人脸识别模型。

可选地，所述检测模型组件包括：第一检测模型组件、第二检测模型组件和第三检测模型组件；

所述调用所述检测模型组件对所述样本人脸图像进行识别，得到预测人脸框，包括：

调用所述第一检测模型组件对经处理后包含第一尺寸的人脸特征的样本人脸图像进行识别，得到第一预测人脸框；

调用所述第二检测模型组件对经处理后包含第二尺寸的人脸特征的样本人脸图像进行识别，得到第二预测人脸框；

调用所述第三检测模型组件对经处理后包含第三尺寸的人脸特征的样本人脸图像进行识别，得到第三预测人脸框；

其中，所述第一尺寸大于所述第二尺寸，所述第二尺寸大于所述第三尺寸。

可选地，所述根据所述初始人脸标注框和所述预测人脸框，计算得到所述初始人脸识别模型对应的第一损失值，包括：

根据所述初始人脸标注框和所述第一预测人脸框，计算得到所述初始人脸识别模型对应的第一检测损失值；

根据所述初始人脸标注框和所述第二预测人脸框，计算得到所述初始人脸识别模型对应的第二检测损失值；

根据所述初始人脸标注框和所述第三预测人脸框，计算得到所述初始人脸识别模型对应的第三检测损失值。

可选地，所述在所述第一损失值达到第一初始值的情况下，将训练后的初始人脸识别模型作为所述预训练人脸识别模型，包括：

在所述第一检测损失值、所述第二检测损失值和所述第三检测损失值均达到所述第一初始值的情况下，将训练后的初始人脸识别模型作为所述预训练人脸识别模型。

可选地，所述初始人脸识别模型还包括：轻量级网络层；

在所述调用所述检测模型组件对所述样本人脸图像进行识别，得到预测人脸框之前，还包括：

调用所述轻量级网络层对所述样本人脸图像中的人脸特征进行识别，得到识别人脸特征。

可选地，所述调用所述检测模型组件对所述样本人脸图像进行识别，得到预测人脸框，包括：

调用所述检测模型组件对所述识别人脸特征进行检测处理，确定所述识别人脸特征在所述样本人脸图像中的预测人脸框。

可选地，在所述第一检测模型组件、所述第二检测模型组件和所述第三检测模型组件之前均嵌入串联连接的所述第一训练神经网络模型和所述第二训练神经网络模型。

可选地，所述初始人脸识别模型还包括：分类层，所述样本人脸图像对应于一个初始分类结果。

可选地，所述利用第一训练神经网络模型和第二训练神经网络模型根据所述样本人脸图像对所述预训练人脸识别模型进行二次训练，得到目标人脸识别模型，包括：

调用所述第一训练神经网络模型对所述样本人脸图像中的人脸特征进行遮挡处理，生成遮挡人脸特征；

调用所述第二训练神经网络模型对所述遮挡人脸特征进行形变处理，生成形变人脸特征；

调用所述分类层对所述形变人脸特征进行识别，确定所述形变人脸特征的预测分类结果；

调用所述检测模型组件对所述形变人脸特征进行识别，得到所述预测人脸框；

根据所述初始分类结果、所述初始人脸标注框、所述预测分类结果和所述预测人脸框，计算得到所述预训练人脸识别模型的第二损失值；

在所述第二损失值达到第二初始值的情况下，将训练后的预训练人脸识别模型作为目标人脸识别模型。

可选地，所述第一训练神经网络模型为处理遮挡的对抗网络模型，所述第二训练神经网络模型为处理形变的对抗网络模型。

可选地，所述初始人脸识别模型还包括轻量级网络层，所述检测模型组件包括：第一检测模型组件、第二检测模型组件和第三检测模型组件；

所述第一检测模型组件与所述轻量级网络层之间连接有特征处理层，所述特征处理层用于对所述样本人脸图像中的人脸特征进行处理，以得到包含第一尺寸的人脸特征的样本人脸图像；

所述第二检测模型组件直接连接于所述轻量级网络层之后；

所述轻量级网络层与所述第三检测模型组件之间连接有降维处理模块，所述降维处理模块用于对所述样本人脸图像进行降维处理，以得到包含第三尺寸的人脸特征的样本人脸图像。

可选地，所述降维处理模块包括：第一激活函数层、第二激活函数层以及卷积层；

所述第一激活函数层和所述第二激活函数层并联连接于所述轻量级网络层与所述卷积层之间，所述卷积层与所述第三检测模型组件连接。

可选地，所述第一损失值包括人脸分类对应的损失值以及预测人脸框坐标对应的损失值；

所述第一损失值的计算公式为：

其中，l _c为人脸分类的损失，k为检测模型组件序号，p _i为第i个预测人脸框的预测概率，g _i为第i个预测人脸框的正确的标注数据的标签值，l _r为预测人脸框的回归损失，b _i为预测的4个修正值，t _i为正确的标注数据的实际值。

本公开提供了一种人脸识别方法，包括：

获取待识别人脸图像；

将所述待识别人脸图像输入至目标人脸识别模型输出人脸识别结果；

其中，所述目标人脸识别模型是上述训练方法训练得到的。

本公开提供了一种人脸识别装置，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一项所述的人脸识别模型训练方法，或上述人脸识别方法。

本公开提供了一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述任一项所述的人脸识别模型训练方法，或上述人脸识别方法。

上述说明仅是本公开技术方案的概述，为了能够更清楚了解本公开的技术手段，而可依照说明书的内容予以实施，并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂，以下特举本公开的具体实施方式。

附图简述

为了更清楚地说明本公开实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本公开实施例提供的一种人脸识别模型训练方法的步骤流程图；

图2示出了本公开实施例提供的一种SSH网络结构的示意图；

图3示出了本公开实施例提供的一种全连接层的示意图；

图4示出了本公开实施例提供的一种ASTN网络的示意图；

图5示出了本公开实施例提供的一种人脸识别方法的步骤流程图；

图6示意性地示出了用于执行根据本公开的方法的人脸识别装置的框图；并且

图7示意性地示出了用于保持或者携带实现根据本公开的方法的程序代码的存储单元。

详细描述

为使本公开的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本公开作进一步详细的说明。

参照图1，示出了本公开实施例提供的一种人脸识别模型训练方法的步骤流程图，该人脸识别模型训练方法具体可以包括如下步骤：

步骤101：获取样本人脸图像。

本公开实施例可以应用于对商用鱼眼摄像头边缘地区的畸变的人脸图像进行识别的场景中。

首先，可以结合本实施例对人脸识别模型的训练过程进行描述。

本实施例的人脸识别模型的主干检测网络可以采用SSH算法，SSH其实就是在不同尺度的特征图对应的卷积层引入不同的检测模型组件Detection Module以检测不同尺度大小的人脸。该网络结构为全卷积网络结构。本实施例采用mobilenet或者shufflenet替换作为主干网络，mobilenet和shufflenet均为轻量级网络，可以简化网络结构，从而可以使训练得到的模型应用于终端产品种。

接下来，结合图2对SSH网络的架构进行如下描述。

由图2所示的SSH网络结构图，本实施例中，采用轻量级网络层(mobilenet或shufflenet)对图2所示的conv1-1～4和conv5-3进行了替换，检测模型组件M1是连接在轻量级网络层后增加的一个max-pooling层之后的，而检测模型组件M2则是直接连接在轻量级网络层卷积层之后，检测模型组件M1和检测模型组件M2之间相差一个stride为2的max-pooling层操作，通过Max-pooling操作以增加感受野，从而使得M1能够检测到比M2更大的人脸。

对于检测模型组件M3，是在轻量级网络层后增加了两个并联的激活函数(Rectified Linear Unints，Relu)层，以将通道数从原来的512维降至128维，并通过双线性插值up-sampling操作将feature map的尺寸变大，然后将两个通道输出的参数对应求和，经过3×3的卷积层，最后连接上检测模型组件M3，通过降维处理，以使得M3可以检测更小尺寸的人脸。

样本人脸图像是指用于对人脸识别模型进行训练的人脸图像。

在具体实现中，可以从互联网中随机获取人脸图像以作为样本人脸图像，具体地，可以根据业务需求而定，本公开实施例对此不加以限制。

在获取样本人脸图像之后，执行步骤102。

步骤102：根据所述样本人脸图像对初始人脸识别模型进行训练，得到用于对图像中的人脸位置进行检测的预训练人脸识别模型。

初始人脸识别模型是指还未进行训练的人脸识别模型。

预训练人脸识别模型是指对初始人脸识别模型进行训练之后，能够达到预期效果的可以对图像中的人脸位置进行有效识别的模型。

在获取样本人脸图像之后，可以根据获取的样本人脸图像对初始人脸识别模型进行训练，以得到用于对图像中的人脸位置进行检测的预训练人脸识别模型。对于具体地训练过程，可以结合下述具体实现方式进行详细描述。

在本公开的一种具体实现方式中，上述步骤102可以包括：子步骤1021、子步骤1022和子步骤1023，其中，

子步骤1021：调用所述检测模型组件对所述样本人脸图像进行识别，得到预测人脸框。

在本实施例中，样本人脸图像可以对应于一个初始人脸检测框，初始人脸检测框是由业务人员预先根据每幅样本人脸图像中人脸所处的位置而标注的框，具体地，可以由四个点恰好将人脸围合，从而可以形成一个方形框，即初始人脸标注框。

预测人脸框是指通过检测模型组件对处理人脸图像中的人脸特征进行识别得到的人脸框。

在获取到样本人脸图像之后，可以将样本人脸图像输入至初始人脸识别模型，并调用初始人脸识别模型中的检测模型组件对样本人脸图像进行人脸特征进行识别，根据识别结果形成围合人脸特征的方形框，即预测人脸框。

当然，在本实施例中，初始人脸识别模型还可以包括上述提及的轻量级网络层，在调用检测模型组件进行人脸特征识别之前，可以调用轻量级网络层对样本人脸图像中的人脸特征进行识别，以得到识别人脸特征，进而，调用检测模型组件对识别人脸特征进行检测，以检测识别人脸特征在样本人脸图像中所处的位置，结合位置确定识别人脸特征在样本人脸图像中的预测人脸框。

可以理解地，结合下述步骤101中的描述可知，本实施例中的检测模型组件可以分为第一检测模型组件M1、第二检测模型组件M2和第三检测模型组件M3三个分支，以下结合三个分支对检测过程进行如下描述。

在本公开的一种具体实现方式中，上述步骤1021可以包括：子步骤10211、子步骤10212和子步骤10213，其中：

子步骤10211：调用所述第一检测模型组件对经处理后包含第一尺寸的人脸特征的样本人脸图像进行识别，得到第一预测人脸框；

子步骤10212：调用所述第二检测模型组件对经处理后包含第二尺寸的人脸特征的样本人脸图像进行识别，得到第二预测人脸框；

子步骤10213：调用所述第三检测模型组件对经处理后包含第三尺寸的人脸特征的样本人脸图像进行识别，得到第三预测人脸框。

在本实施例中，第一预测人脸框是指采用第一检测模型组件对样本人脸图像中的人脸特征进行识别得到的预测人脸框。

第二预测人脸框是指采用第二检测模型组件对样本人脸图像中的人脸特征进行识别得到的预测人脸框。

第三预测人脸框是指采用第三检测模型组件对样本人脸图像中的人脸特征进行识别得到的预测人脸框。

第一检测模型组件即上述步骤101中提及的检测模型组件M1，在检测模型组件M1之前增加了一个特征处理层(Max pooling层)，通过Max pooling对样本人脸图像中的人脸特征进行处理，以得到包含第一尺寸的人脸特征的样本人脸图像，可以增加人脸特征的感受野，从而可以使得检测模型组件M1可以检测第一尺寸的人脸特征。通过第一检测模型组件对经处理后包含第一尺寸的人脸特征的样本人脸图像进行识别，可以得到第一预测人脸框。

第二检测模型组件即上述步骤101中提及的检测模型组件M2，相较于检测模型组件M1，检测模型组件M2是直接连接在轻量级网络层之后，因此，检测模型组件M2可以检测比第一尺寸小的第二尺寸的人脸特征。通过第二检测模型组件对经处理后包含第二尺寸的人脸特征的样本人脸图像进行识别，可以得到第二预测人脸框。

第三检测模型组件即上述步骤101中提及的检测模型组件M3，在轻量级网络层后增加了两个并联的激活函数(Rectified Linear Unints，Relu)层，以将通道数从原来的512维降至128维，并通过双线性插值up-sampling操作将feature map的尺寸变大，然后将两个通道输出的参数对应求和，经过3×3的卷积层，通过降维处理得到包含第三尺寸的人脸特征的样本人脸图像，最后连接上检测模型组件M3，以使得M3可以检测比第二尺寸更小的第三尺寸的人脸特征。通过第三检测模型组件对经处理后包含第三尺寸的人脸特征的样本人脸图像进行识别，可以得到第三预测人脸框。

在本实施例中，通过三个检测模型组件分别对样本人脸图像中的人脸特征进行识别，从而可以实现三个检测模型组件的同时训练，以满足不同尺寸的人脸特征的检测。

在调用检测模型组件对所述样本人脸图像进行识别，得到预测人脸框之后，执行子步骤1022。

子步骤1022：根据所述初始人脸标注框和所述预测人脸框，计算得到所述初始人脸识别模型对应的第一损失值。

第一损失值是指计算得到的初始人脸识别模型所对应的损失值。第一损失值可以表示样本人脸图像的预测人脸框与初始人脸标注框之间的偏差程度。

在获取预测人脸框之后，可以结合初始人脸标注框和预测人脸框计算得到初始人脸识别模型对应的第一损失值。

在本实施例中，第一损失值可以包括两部分：负责人脸分类和预测人脸框坐标回归两个任务分别对应的损失值。如下述公式(1)所示：

上述公式(1)中，l _c表示面部分类的损失，k表示检测模型组件序号(即三个检测模型组件对应的序号)，p _i表示第i个预测人脸框的预测概率，g _i表示第i个预测人脸框正确的标注数据t(ground-truth)的标签值(当重叠度(Intersection over Union，IoU)>0.5为1，<0.5为0)，负样本定义为与任何人脸的ground-truth的IoU<0.3的检测框。l _r表示预测人脸框的回归损失，回归变量为检测框尺寸缩放量和平移量的log变换值。其中，b _i表示预测的4个修正值，t _i表示ground-truth的实际值。

可以理解地，在上述过程中提及，初始人脸识别模型可以包括三个检测模型组件，在实际训练过程中，每个检测模型组件均会输出一个损失值，具体地，上述子步骤1022可以包括：子步骤10221、子步骤10222和子步骤10223，其中：

子步骤10221：根据所述初始人脸标注框和所述第一预测人脸框，计算得到所述初始人脸识别模型对应的第一检测损失值；

子步骤10222：根据所述初始人脸标注框和所述第二预测人脸框，计算得到所述初始人脸识别模型对应的第二检测损失值；

子步骤10223：根据所述初始人脸标注框和所述第三预测人脸框，计算得到所述初始人脸识别模型对应的第三检测损失值。

在本实施例中，将样本人脸图像经过三个检测模型组件之后，可以分别得到三个预测人脸框，即第一预测人脸框、第二预测人脸框和第三预测人脸框。然后，可以根据初始人脸标注框、第一预测人脸框、第二预测人脸框和第三预测人脸框结合上述公式(1)，分别计算出初始人脸识别模型对应的三个损失值，即第一检测损失值、第二检测损失值和第三检测损失值。

具体地，可以根据初始人脸标注框和第一预测人脸框计算得到第一检测损失值，根据初始人脸标注框和第二预测人脸框可以计算得到第二检测损失值，根据初始人脸标注框和第三预测人脸框可以计算得到第三检测损失值。这三个损失值分别对应于第一检测模型组件、第二检测模型组件和第三检测模型组件。

在根据初始人脸标注框和预测人脸框计算得到初始人脸识别模型对应的第一损失值之后，执行步骤1023。

子步骤1023：在所述第一损失值达到第一初始值的情况下，将训练后的初始人脸识别模型作为所述预训练人脸识别模型。

第一初始值是指由业务人员预先设置的用于对初始人脸识别模型的训练程度进行判断的标准。

在第一损失值未达到第一初始值时，表示初始人脸识别模型的训练还未达到理想的效果，则可以认为每个样本人脸图像中预测人脸框与对应初始人脸标注框的偏差较大，此时，可以增加样本人脸图像的数量，继续对初始人脸识别模型进行训练。

在第一损失值达到第一初始值时，表示初始人脸识别模型的训练已经达到了预期效果，此时，可以认为每个样本人脸图像中预测人脸框，与对应初始人脸标注框的偏差非常小，此时，可以认为该训练后初始人脸识别模型能够准确的检测出人脸图像中的人脸特征的位置，相应的，可以将该初始人脸识别模型作为预训练人脸识别模型，预训练人脸识别模型即可以进行后续的人脸图像中的人脸位置检测。

可以理解地，由于样本人脸图像在训练过程中经历了三个检测模型组件，并输出了三个损失值，即第一检测损失值、第二检测损失值和第三检测损失值，在具体训练过程中，需要这三个检测损失值均达到第一初始值才可以认为初始人脸识别模型的训练过程结束，在其中存在只少一个检测损失值未达到第一初始值时，则认为该初始人脸识别模型的训练尚未结束，需要继续结合样本人脸图像对初始人练识别模型进行训练。

在预训练过程中，可以设置设定个数的训练过程(如10k个循环等)，在预训练过程中，不加入第一训练神经网络模型和第二训练神经网络模型，这一过程是为了使训练得到的预训练人脸识别模型可以形成初始的人脸特征定位能力，即定位人脸特征在图像中的位置。

步骤103：利用第一训练神经网络模型和第二训练神经网络模型根据所述样本人脸图像对所述预训练人脸识别模型进行二次训练，得到目标人脸识别模型。

在本实施例中，第一训练神经网络模型为处理遮挡的对抗网络模型(ASDN，Adversarial spatial dropout network)，所述第二训练神经网络模型为处理形变的对抗网络模型(ASTN，Adversarial spatial transform network)。其中，ASDN网络中包含两个全连接层，如图3所示，其在训练过程中学习遮挡和光照阴影对特征的影响，在前向传播中，两个全连接层形成一个漏失特征的遮挡(dropout mask)，降低重要特征的权重，从而训练出更强的人脸识别模型。ASTN网络还可以包括：localization network、grid generator和sampler(如图4所示)。ASTN网络会使特征产生旋转、畸变，从而变得更难识别，在训练过程中帮助检测网络增强识别畸变人脸的性能，从而使得本实施例的方法更适用于鱼眼摄像头的人脸识别。

在本实施例中，在第一检测模型组件、第二检测模型组件和第三检测模型组件之前均嵌入一个串联连接的ASDN和ASTN，通过这两个对抗网络模型可以对预训练人脸识别模型进行训练，以学习遮挡和形变对检测结果的影响，提高畸变的人脸检测效率以及被遮挡的人脸的检测准确率。

在根据样本人脸图像对初始人脸识别模型进行训练得到预训练人脸识别模型之后，可以利用ASDN和ASTN对预训练人脸识别模型进行二次训练，并在训练完成之后，得到最终的可以对畸变人脸和遮挡人脸进行识别的目标人脸识别模型。具体地训练过程，可以结合下述具体实现方式进行详细描述。

在本公开的一种具体实现方式中，上述步骤103可以包括：子步骤1031、子步骤1032、子步骤1033、子步骤1034、子步骤1035和子步骤1036，其中：

子步骤1031：调用所述第一训练神经网络模型对所述样本人脸图像中的人脸特征进行遮挡处理，生成遮挡人脸特征。

在本实施例中，第一训练神经网络可以对对人脸特征进行遮挡处理。

遮挡人脸特征是指通过对样本人脸图像中人脸特征进行遮挡得到的人脸特征。

在进行二次训练时，可以调用第一训练神经网络模型对样本人脸图像中的人脸特征进行遮挡处理，以生成遮挡人脸特征，具体地，假设输入至ASDN网络的特征图尺寸为d×d×c，可以采用一个滑动窗口(d/3)×(d/3)，对每一个滑动窗口，可以丢掉对应通道的所有值，生成一个新的特征向量，此特征向量会被送入后续负责面部分类和预测人脸框回归的检测网络计算Loss。基于这些所有滑动窗口的Loss里面选取最高的一个Loss。针对N(N为大于等于1的正整数)个训练样本可以生成N个训练样本对{(X ¹,M ¹),...,(X ^N,M ^N)}。在前10K个ASDN训练迭代过程中，可以使用二值交叉熵损失函数，如下述公式(2)所示：

上述公式(2)中，L表示二值交叉熵损失函数，A _i,j(X ^P)表示ASDN针对输入特征X ^P在位置(i,j)的输出，

表示输入特征在位置(i,j)的像素值。

子步骤1032：调用所述第二训练神经网络模型对所述遮挡人脸特征进行形变处理，生成形变人脸特征。

在采用第一训练神经网络模型对样本人脸图像中的人脸进行遮挡处理之后，可以调用串联连接的第二训练神经网络模型对遮挡人脸特征进行形变处理，从而可以生成形变人脸特征。

子步骤1033：调用所述分类层对所述形变人脸特征进行识别，确定所述形变人脸特征的预测分类结果。

在本实施例中，初始人脸识别模型中还可以包括分类层，分类层可以确定人脸特征的分类结果。可以理解地，在识别过程中，可能会将图像背景特征识别为人脸特征，通过分类层可以生成一个分类概率，通过该分类概率可以确定识别的特征是否为人脸特征。

预测分类结果是指通过分类层预测的形变人脸特征的分类。

在调用第二训练神经网络模型对遮挡人脸特征进行形变处理生成形变人脸特征之后，可以调用分类层对形变人脸特征进行识别，以确定形变人脸特征的预测分类结果。

在本实施例中，ASTN网络的训练可以采用迁移学习的方式，其训练过程类似于ASDN网络，而在反向传播过程中，只改变定位层(localization net)的变量。

子步骤1034：调用所述检测模型组件对所述形变人脸特征进行识别，得到所述预测人脸框。

在调用第二训练神经网络模型对遮挡人脸特征进行形变处理生成形变人脸特征之后，可以调用连接于第二神经网络模型后的检测模型组件对形变人脸特征进行识别，以得到形变人脸特征所对应的预测人脸框。

子步骤1035：根据所述初始分类结果、所述初始人脸标注框、所述预测分类结果和所述预测人脸框，计算得到所述预训练人脸识别模型的第二损失值。

第二损失值是指通过第一训练神经网络模型和第二训练神经网络模型对预训练人脸识别模型进行二次训练的过程中，所得到的预训练人脸识别模型的损失值。

在获取上述步骤中的预测人脸框、预测分类结果之后，可以结合初始分类结果、初始人脸标注框、预测人脸框和预测分类结果，计算得到预训练人脸识别模型的第二损失值。

在训练过程中，当ASDN和ASTN生成的MASK使得预训练人脸识别模型非常容易识别，将会得到一个高的loss，设计ASDN与ASTN生成网络的loss为：

L _A＝1-sigmoid(l _c(A(x),C)) (3)

上述公式(3)中，L _A为ASDN与ASTN的联合损失函数，即第二损失值，l _c为面部分类损失，Sigmoid为一种神经网络的阈值函数，可以将变量映射到0～1之间。

在计算得到预训练人脸识别模型的第二损失值之后，执行子步骤1036。

子步骤1036：在所述第二损失值达到第二初始值的情况下，将训练后的预训练人脸识别模型作为目标人脸识别模型。

第二初始值是指由业务人员预先设置的用于对预训练人脸识别模型的训练程度进行判断的标准。

在第二损失值未达到第二初始值时，表示预训练人脸识别模型的训练还未达到预期效果，此时，可以增加样本人脸图像的数量，继续对预训练人脸识别模型进行训练。

在第二损失值达到第二初始值时，表示预训练人脸识别模型的训练已经达到了预期效果，此时，可以认为该训练后的预训练人脸识别模型已经能够准确的识别包含遮挡形变的人脸特征，相应的，可以将该训练后的预训练人脸识别模型作为目标人脸识别模型。

在利用第一训练神经网络模型和第二训练神经网络模型对预训练人脸识别模型训练完成之后，可以去掉第一训练神经网络模型和第二训练神经网络模型，从而得到目标人脸识别模型，而经过第一训练神经网络模型和第二训练神经网络模型对人脸识别模型的二次训练，可以提高人脸识别模型对遮挡形变人脸识别的准确率。

本公开实施例提供的人脸识别模型训练方法，通过获取样本人脸图像，根据样本人脸图像对初始人脸识别模型进行训练，得到用于对图像中的人脸位置进行检测的预训练人脸识别模型，利用第一训练神经网络和第二训练神经网络根据样本人脸图像对预训练人脸识别模型进行二次训练，得到目标人脸识别模型。本公开实施例通过在人脸识别模型的训练过程中，增加对抗网络(即第一训练神经网络模型和第二训练神经网络模型)，以学习遮挡和形变对检测结果的影响，提高商用鱼眼摄像头边缘地区的畸变的人脸检测效率以及被遮挡的人脸的检测准确率。

参照图5，示出了本公开实施例提供的一种人脸识别方法的步骤流程图，该人脸识别方法具体可以包括如下步骤：

步骤201：获取待识别人脸图像。

本公开实施例可以应用于对人脸图像中的模糊人脸识别的场景中。

待识别人脸图像是指用于进行人脸特征识别的图像，在待识别人脸图像中可以包含有模糊人脸特征，如遮挡人脸特征、畸变人脸特征等。

在商用鱼眼摄像头边缘地区多容易出现畸变人脸特征的图像，则可以将商用鱼眼摄像头采集的边缘地区的图像作为待识别图像。

当然，待识别人脸图像也可以不包含模糊人脸特征，如遮挡人脸特征、畸变人脸特征等，具体地，可以根据实际情况而定，本实施例对此不加以限制。

在获取待识别人脸图像之后，执行步骤202。

步骤202：将所述待识别人脸图像输入至目标人脸识别模型输出人脸识别结果。

目标人脸识别模型是指采用上述实施例人脸识别模型训练方法训练得到的人脸识别模型。

人脸识别结果是指识别得到的图像中人脸的面部特征，可以理解地，对于不同的人而言，人脸面部特征是唯一的，通过人脸面部特征可以实现不同人的跟踪、监控等。

在将待识别人脸图像输入至目标人脸识别模型之后，可以通过目标人脸识别模型输出待识别人脸图像对应的人脸识别结果。

可以理解地，由于本实施例中的目标人脸识别模型是采用上述实施例人脸识别模型训练方法训练得到的，本实施例中的目标人脸识别模型不仅可以对未包含遮挡形变的人脸特征进行识别，也可以对包含遮挡和/或形变的人脸特征进行识别。

本实施例提供的人脸识别方法，通过获取待识别人脸图像，将待识别人脸图像输入至目标人脸识别模型输出人脸识别结果，由于本实施例中采用的目标人脸识别模型是采用上述实施例人脸识别模型训练方法训练得到的，可以实现对遮挡和形变人脸特征的识别，进而，可以提高商用鱼眼摄像头边缘地区的畸变的人脸检测效率以及被遮挡的人脸的检测准确率。

对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本公开并不受所描述的动作顺序的限制，因为依据本公开，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本公开所必须的。

另外地，本公开实施例还提供了一种人脸识别装置，包括：处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述人脸识别模型训练方法，或上述人脸识别方法。

本公开还提供了一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述人脸识别模型训练方法，或上述人脸识别方法。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

本公开的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的人脸识别装置中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

例如，图6示出了可以实现根据本公开的方法的人脸识别装置。该人脸识别装置传统上包括处理器1010和以存储器1020形式的计算机程序产品或者计算机可读介质。存储器1020可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器1020具有用于执行上述方法中的任何方法步骤的程序代码1031的存储空间1030。例如，用于程序代码的存储空间1030可以包括分别用于实现上面的方法中的各种步骤的各个程序代码1031。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘，紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为如参考图7所述的便携式或者固定存储单元。该存储单元可以具有与图6的人脸识别装置中的存储器1020类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常，存储单元包括计算机可读代码1031’，即可以由例如诸如1010之类的处理器读取的代码，这些代码当由人脸识别装置运行时，导致该人脸识别装置执行上面所描述的方法中的各个步骤。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本公开的实施例可以在没有这些具体细节的情况下被实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上对本公开所提供的一种人脸识别模型训练方法、一种人脸识别方法、一种人脸识别装置和一种计算机可读存储介质，进行了详细介绍，本文中应用了具体个例对本公开的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本公开的方法及其核心思想；同时，对于本领域的一般技术人员，依据本公开的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本公开的限制。

Claims

一种人脸识别模型训练方法，包括：

获取样本人脸图像；

根据所述样本人脸图像对初始人脸识别模型进行训练，得到用于对图像中的人脸位置进行检测的预训练人脸识别模型；

利用第一训练神经网络模型和第二训练神经网络模型，根据所述样本人脸图像对所述预训练人脸识别模型进行二次训练，得到目标人脸识别模型。
根据权利要求1所述的方法，其中，所述样本人脸图像对应于一个初始人脸标注框，所述初始人脸识别模型包括：检测模型组件；

所述根据所述样本人脸图像对初始人脸识别模型进行训练，得到用于对图像中的人脸位置进行检测的预训练人脸识别模型，包括：

调用所述检测模型组件对所述样本人脸图像进行识别，得到预测人脸框；

根据所述初始人脸标注框和所述预测人脸框，计算得到所述初始人脸识别模型对应的第一损失值；

在所述第一损失值达到第一初始值的情况下，将训练后的初始人脸识别模型作为所述预训练人脸识别模型。
根据权利要求2所述的方法，其中，所述检测模型组件包括：第一检测模型组件、第二检测模型组件和第三检测模型组件；

所述调用所述检测模型组件对所述样本人脸图像进行识别，得到预测人脸框，包括：

调用所述第一检测模型组件对经处理后包含第一尺寸的人脸特征的样本人脸图像进行识别，得到第一预测人脸框；

调用所述第二检测模型组件对经处理后包含第二尺寸的人脸特征的样本人脸图像进行识别，得到第二预测人脸框；

调用所述第三检测模型组件对经处理后包含第三尺寸的人脸特征的样本人脸图像进行识别，得到第三预测人脸框；

其中，所述第一尺寸大于所述第二尺寸，所述第二尺寸大于所述第三尺寸。
根据权利要求3所述的方法，其中，所述根据所述初始人脸标注框和所述预测人脸框，计算得到所述初始人脸识别模型对应的第一损失值，包括：

根据所述初始人脸标注框和所述第一预测人脸框，计算得到所述初始人脸识别模型对应的第一检测损失值；

根据所述初始人脸标注框和所述第二预测人脸框，计算得到所述初始人脸识别模型对应的第二检测损失值；

根据所述初始人脸标注框和所述第三预测人脸框，计算得到所述初始人脸识别模型对应的第三检测损失值。
根据权利要求4所述的方法，其中，所述在所述第一损失值达到第一初始值的情况下，将训练后的初始人脸识别模型作为所述预训练人脸识别模型，包括：

在所述第一检测损失值、所述第二检测损失值和所述第三检测损失值均达到所述第一初始值的情况下，将训练后的初始人脸识别模型作为所述预训练人脸识别模型。
根据权利要求2-5中任一项所述的方法，其中，所述初始人脸识别模型还包括：轻量级网络层；

在所述调用所述检测模型组件对所述样本人脸图像进行识别，得到预测人脸框之前，还包括：

调用所述轻量级网络层对所述样本人脸图像中的人脸特征进行识别，得到识别人脸特征。
根据权利要求6所述的方法，其中，所述调用所述检测模型组件对所述样本人脸图像进行识别，得到预测人脸框，包括：

调用所述检测模型组件对所述识别人脸特征进行检测处理，确定所述识别人脸特征在所述样本人脸图像中的预测人脸框。
根据权利要求3-5中任一项所述的方法，其中，在所述第一检测模型组件、所述第二检测模型组件和所述第三检测模型组件之前均嵌入串联连接的所述第一训练神经网络模型和所述第二训练神经网络模型。
根据权利要求8所述的方法，其中，所述初始人脸识别模型还包括：分类层，所述样本人脸图像对应于一个初始分类结果。
根据权利要求9所述的方法，其中，所述利用第一训练神经网络模型和第二训练神经网络模型根据所述样本人脸图像对所述预训练人脸识别模型进行二次训练，得到目标人脸识别模型，包括：

调用所述第一训练神经网络模型对所述样本人脸图像中的人脸特征进行遮挡处理，生成遮挡人脸特征；

调用所述第二训练神经网络模型对所述遮挡人脸特征进行形变处理，生成形变人脸特征；

调用所述分类层对所述形变人脸特征进行识别，确定所述形变人脸特征的预测分类结果；

调用所述检测模型组件对所述形变人脸特征进行识别，得到所述预测人脸框；

根据所述初始分类结果、所述初始人脸标注框、所述预测分类结果和所述预测人脸框，计算得到所述预训练人脸识别模型的第二损失值；

在所述第二损失值达到第二初始值的情况下，将训练后的预训练人脸识别模型作为目标人脸识别模型。
根据权利要求8-10中任一项所述的方法，其中，所述第一训练神经网络模型为处理遮挡的对抗网络模型，所述第二训练神经网络模型为处理形变的对抗网络模型。
根据权利要求2-5中任一项所述的方法，其中，所述初始人脸识别模型还包括轻量级网络层，所述检测模型组件包括：第一检测模型组件、第二检测模型组件和第三检测模型组件；

所述第一检测模型组件与所述轻量级网络层之间连接有特征处理层，所述特征处理层用于对所述样本人脸图像中的人脸特征进行处理，以得到包含第一尺寸的人脸特征的样本人脸图像；

所述第二检测模型组件直接连接于所述轻量级网络层之后；

所述轻量级网络层与所述第三检测模型组件之间连接有降维处理模块，所述降维处理模块用于对所述样本人脸图像进行降维处理，以得到包含第三尺寸的人脸特征的样本人脸图像。
根据权利要求12所述的方法，其中，所述降维处理模块包括：第一激活函数层、第二激活函数层以及卷积层；

所述第一激活函数层和所述第二激活函数层并联连接于所述轻量级网络层与所述卷积层之间，所述卷积层与所述第三检测模型组件连接。
根据权利要求2-5中任一项所述的方法，其中，所述第一损失值包括人脸分类对应的损失值以及预测人脸框坐标对应的损失值；

所述第一损失值的计算公式为：

其中，l _c为人脸分类的损失，k为检测模型组件序号，p _i为第i个预测人脸框的预测概率，g _i为第i个预测人脸框的正确的标注数据的标签值，l _r为预测人脸框的回归损失，b _i为预测的4个修正值，t _i为正确的标注数据的实际值。
一种人脸识别方法，其中，包括：

获取待识别人脸图像；

将所述待识别人脸图像输入至目标人脸识别模型输出人脸识别结果；

其中，所述目标人脸识别模型是利用权利要求1至14任一项所述的训练方法训练得到的。
一种人脸识别装置，其中，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至14任一项所述的人脸识别模型训练方法，或权利要求15所述的人脸识别方法。
一种计算机可读存储介质，其中，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行权利要求1至14中任一项所述的人脸识别模型训练方法，或权利要求15所述的人脸识别方法。
一种计算机程序，包括计算机可读代码，当所述计算机可读代码在人脸识别装置上运行时，导致所述人脸识别装置执行根据权利要求1至14中任一项所述的人脸识别模型训练方法，或权利要求15所述的人脸识别方法。