CN111898547A

CN111898547A - 人脸识别模型的训练方法、装置、设备及存储介质

Info

Publication number: CN111898547A
Application number: CN202010760772.0A
Authority: CN
Inventors: 张国辉; 徐玲玲; 宋晨
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-07-31
Filing date: 2020-07-31
Publication date: 2020-11-06
Anticipated expiration: 2040-07-31
Also published as: CN111898547B; WO2021139309A1

Abstract

本发明涉及人工智能领域，提供一种人脸识别模型的训练方法、装置、设备及存储介质，用于解决现有的人脸识别模型的识别精度较低的问题。人脸识别模型的训练方法包括：获取多个训练数据集以及预置的人脸识别模型的主干网络和多个分类网络；通过主干网络对多个训练数据集分别进行人脸特征提取，得到多个特征集；通过多个分类网络对多个特征集进行分类，得到多个分类数据集；计算多个特征集的多个特征向量损失函数值，以及多个分类数据集的多个分类损失函数值；根据多个特征向量损失函数值和多个分类损失函数值，计算人脸识别模型的目标损失函数值；根据目标损失函数值对主干网络进行迭代更新，直至目标损失函数值收敛，得到更新后的人脸识别模型。

Description

人脸识别模型的训练方法、装置、设备及存储介质

技术领域

本发明涉及人工智能的神经网络领域，尤其涉及一种人脸识别模型的训练方法、装置、设备及存储介质。

背景技术

人脸识别是图像识别领域的一个热门领域，通常会通过深度学习，训练得到能够进行人脸识别的神经网络，即人脸识别模型。对于人脸识别模型的识别精确度，由于使用应用场景的训练数据进行训练所得的人脸识别模型，会受到训练数据的应用场景的限制，导致其识别精度较低，因而，会采用对人脸识别模型的普适性进行优化的方式，来提高人脸识别模型的识别精度。

目前，对于人脸识别模型普适性的优化，一般都是采用微调finetune或混合多个训练集的方式，但是，由于微调的方式在模型训练之后，会导致原来的训练集的特征保留得很少，从而导致最终的人脸识别模型的泛化效果差；混合多个训练集的方式存在重叠数据难清洗，并作为脏数据引入到训练中，影响模型的训练效果的缺陷，因而，导致现有的人脸识别模型的识别精度较低。

发明内容

本发明的主要目的在于解决现有的人脸识别模型的识别精度较低的问题。

本发明第一方面提供了一种人脸识别模型的训练方法，包括：

获取预处理后的多个训练数据集，所述多个训练数据集为多个应用场景分别对应的人脸训练数据集；

通过预置的人脸识别模型中的主干网络，对所述多个训练数据集分别进行人脸特征提取，得到多个特征集，所述人脸识别模型包括主干网络和多个分类网络；

通过所述多个分类网络对所述多个特征集进行分类，得到多个分类数据集，其中，一个分类网络对应一个特征集；

计算每个特征集的特征向量损失函数值，得到多个特征向量损失函数值，并计算每个分类数据集的分类损失函数值，得到多个分类损失函数值；

根据所述多个特征向量损失函数值和所述多个分类损失函数值，计算所述人脸识别模型的目标损失函数值；

根据所述目标损失函数值对所述主干网络进行迭代更新，直至所述目标损失函数值收敛，得到更新后的人脸识别模型。

可选的，在本发明第一方面的第一种实现方式中，所述通过预置的人脸识别模型中的主干网络，对所述多个训练数据集分别进行人脸特征提取，得到多个特征集，包括：

获取所述多个训练数据集的数据集个数，并根据所述数据集个数计算每个训练数据集的平均数据量；

将所述平均数据量对应的训练数据作为批处理的数据，得到各训练数据集对应的目标批处理数据；

通过预置的人脸识别模型中的主干网络，对所述目标批处理数据依次进行人脸图像区域检测、人脸关键点检测和人脸特征向量提取，得到多个特征集。

可选的，在本发明第一方面的第二种实现方式中，所述根据所述多个特征向量损失函数值和所述多个分类损失函数值，计算所述人脸识别模型的目标损失函数值，包括：

根据所述数据集个数计算所述多个特征向量损失函数值的均值，得到平均特征向量损失函数值；

根据所述数据集个数计算所述多个分类损失函数值的均值，得到平均分类损失函数值；

计算所述平均特征向量损失函数值和所述平均分类损失函数值的和值，得到所述人脸识别模型的目标损失函数值。

可选的，在本发明第一方面的第三种实现方式中，所述计算每个特征集的特征向量损失函数值，得到多个特征向量损失函数值，并计算每个分类数据集的分类损失函数值，得到多个分类损失函数值，包括：

计算每个特征集对应的第一特征中心向量，以及所述多个特征集对应的第二特征中心向量；

计算每个特征集对应的第一特征中心向量与所述第二特征中心向量之间的距离值，并将所述距离值确定为每个特征集的特征向量损失函数值，得到多个特征向量损失函数值；

获取每个训练数据集中各训练数据对应的预置标签，根据所述预置标签和预置的交叉熵损失函数，计算每个分类数据集的分类损失函数值，得到多个分类损失函数值。

可选的，在本发明第一方面的第四种实现方式中，所述根据所述预置标签和预置的交叉熵损失函数，计算每个分类数据集的分类损失函数值，得到多个分类损失函数值，包括：

统计每个分类数据集中所述预置标签的标签个数，以及获取每个分类数据集中所述预置标签对应的分类数据的特征向量；

根据预置的交叉熵损失函数、所述标签个数和所述特征向量，计算每个分类数据集的分类损失函数值，得到多个分类损失函数值，所述交叉熵损失函数如下：

其中，所述y表示第y个训练数据集，所述c_y为第y个训练数据集对应的分类数据集，所述n_y为所述标签个数，所述label_i为第i个分类的预置标签，所述v_i为所述特征向量。

可选的，在本发明第一方面的第五种实现方式中，所述根据所述目标损失函数值对所述主干网络进行迭代更新，直至所述目标损失函数值收敛，得到更新后的人脸识别模型，包括：

判断所述目标损失函数值是否收敛，若所述目标损失函数值不收敛，则对所述目标批处理数据进行更新，得到更新后的目标批处理数据，并对所述主干网络的网络结构进行更新，得到更新后的主干网络；

通过所述更新后的主干网络和所述多个分类网络，对所述更新后的目标批处理数据依次进行人脸特征提取和分类，得到多个目标分类数据集；

根据所述多个目标分类数据集，计算更新后的目标损失函数值，并判断所述更新后的目标损失函数值是否收敛；

若所述更新后的目标损失函数值不收敛，则根据所述更新后的目标损失函数值对所述更新后的主干网络进行迭代更新，直至所述更新后的目标损失函数值收敛，得到最终的更新后的人脸识别模型。

可选的，在本发明第一方面的第六种实现方式中，所述获取预处理后的多个训练数据集，所述多个训练数据集为多个应用场景分别对应的人脸训练数据集，包括：

获取多个应用场景分别对应的初始训练数据集，所述初始训练数据集包括开源数据和私有数据；

对每个初始训练数据集依次进行数据清洗和标签标注，得到预处理后的多个训练数据集。

本发明第二方面提供了一种人脸识别模型的训练装置，包括：

获取模块，用于获取预处理后的多个训练数据集，所述多个训练数据集为多个应用场景分别对应的人脸训练数据集；

特征提取模块，用于通过预置的人脸识别模型中的主干网络，对所述多个训练数据集分别进行人脸特征提取，得到多个特征集，所述人脸识别模型包括主干网络和多个分类网络；

分类模块，用于通过所述多个分类网络对所述多个特征集进行分类，得到多个分类数据集，其中，一个分类网络对应一个特征集；

第一计算模块，用于计算每个特征集的特征向量损失函数值，得到多个特征向量损失函数值，并计算每个分类数据集的分类损失函数值，得到多个分类损失函数值；

第二计算模块，用于根据所述多个特征向量损失函数值和所述多个分类损失函数值，计算所述人脸识别模型的目标损失函数值；

迭代更新模块，用于根据所述目标损失函数值对所述主干网络进行迭代更新，直至所述目标损失函数值收敛，得到更新后的人脸识别模型。

可选的，在本发明第二方面的第一种实现方式中，所述特征提取模块具体用于：

可选的，在本发明第二方面的第二种实现方式中，所述第二计算模块具体用于：

可选的，在本发明第二方面的第三种实现方式中，所述第一计算模块包括：

第一计算单元，用于计算每个特征集对应的第一特征中心向量，以及所述多个特征集对应的第二特征中心向量；

第二计算单元，用于计算每个特征集对应的第一特征中心向量与所述第二特征中心向量之间的距离值，并将所述距离值确定为每个特征集的特征向量损失函数值，得到多个特征向量损失函数值；

第三计算单元，用于获取每个训练数据集中各训练数据对应的预置标签，根据所述预置标签和预置的交叉熵损失函数，计算每个分类数据集的分类损失函数值，得到多个分类损失函数值。

可选的，在本发明第二方面的第四种实现方式中，所述第三计算单元具体用于：

可选的，在本发明第二方面的第五种实现方式中，所述迭代更新模块具体用于：

可选的，在本发明第二方面的第六种实现方式中，所述获取模块包括：

获取单元，用于获取多个应用场景分别对应的初始训练数据集，所述初始训练数据集包括开源数据和私有数据；

预处理单元，用于对每个初始训练数据集依次进行数据清洗和标签标注，得到预处理后的多个训练数据集。

本发明第三方面提供了一种人脸识别模型的训练设备，包括：存储器和至少一个处理器，所述存储器中存储有指令；所述至少一个处理器调用所述存储器中的所述指令，以使得所述人脸识别模型的训练设备执行上述的人脸识别模型的训练方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的人脸识别模型的训练方法。

本发明提供的技术方案中，获取预处理后的多个训练数据集，以及预置的人脸识别模型的主干网络和多个分类网络，多个训练数据集为多个应用场景分别对应的人脸训练数据集；通过主干网络对多个训练数据集分别进行人脸特征提取，得到多个特征集；通过多个分类网络对多个特征集进行分类，得到多个分类数据集，其中，一个分类网络对应一个特征集；计算每个特征集的特征向量损失函数值，得到多个特征向量损失函数值，并计算每个分类数据集的分类损失函数值，得到多个分类损失函数值；根据多个特征向量损失函数值和多个分类损失函数值，计算人脸识别模型的目标损失函数值；根据目标损失函数值对主干网络进行迭代更新，直至目标损失函数值收敛，得到更新后的人脸识别模型。本发明中，通过对多个训练数据集分别进行人脸特征提取和分类，避免了存在重叠数据以及重叠数据作为脏数据对模型训练造成不良影响的状况，通过根据多个特征向量损失函数值和多个分类损失函数值得到的目标损失函数值来更新人脸识别模型的主干网络，能够使人脸识别模型具有较好的普适性，从而，提高了现有的人脸识别模型的识别精度。

附图说明

图1为本发明实施例中人脸识别模型的训练方法的一个实施例示意图；

图2为本发明实施例中人脸识别模型的训练方法的另一个实施例示意图；

图3为本发明实施例中人脸识别模型的训练装置的一个实施例示意图；

图4为本发明实施例中人脸识别模型的训练装置的另一个实施例示意图；

图5为本发明实施例中人脸识别模型的训练设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种人脸识别模型的训练方法、装置、设备及存储介质，解决了现有的人脸识别模型的识别精度低的问题。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中人脸识别模型的训练方法的一个实施例包括：

101、获取预处理后的多个训练数据集，多个训练数据集为多个应用场景分别对应的人脸训练数据集。

可以理解的是，本发明的执行主体可以为人脸识别模型的训练装置，还可以是物流总部对应的终端或者服务器，具体此处不做限定。本发明实施例以物流总部对应的服务器为执行主体为例进行说明。

一个训练数据集对应一个应用场景，例如：人证识别场景和自然场景。训练数据集可为不同维度下的人脸数据、开源数据和私有数据，例如：自然场景的人脸数据、亚洲人的人脸数据、考勤数据、人证数据和竞赛数据。

服务器可从预置的数据库中提取预处理后的多个训练数据集，也可从多种渠道获取多个应用场景分别对应的不同维度下的人脸训练数据集，对人脸训练数据集进行预处理，得到预处理后的多个训练数据集。

102、通过预置的人脸识别模型中的主干网络，对多个训练数据集分别进行人脸特征提取，得到多个特征集，人脸识别模型包括主干网络和多个分类网络。

预置的人脸识别模型包括主干网络和多个分类网络，主干网络的输出为多个分类网络的输入，通过多个分类网络对主干网络处理后的数据进行分类，从而实现对训练数据集的人脸识别训练。主干网络可为单个卷积神经网络也可为多个卷积神经网络的综合框架，例如：主干网络可为深度残差学习框架ResNet或目标检测网络框架ET-YOLOv3，也可为深度残差学习框架ResNet结合目标检测网络框架ET-YOLOv3的综合框架。

服务器可通过人脸识别模型的主干网络，对每个训练数据集进行人脸标框识别、标框区域划分、人脸关键点检测和人脸特征向量提取，得到每个训练数据集对应的特征集(即多个特征集)。主干网络中的卷积网络层采用小卷积核，通过小卷积核保留更多的特征，减少计算量，提高人脸特征提取的效率。

103、通过多个分类网络对多个特征集进行分类，得到多个分类数据集，其中，一个分类网络对应一个特征集。

服务器获取每个特征集对应的训练数据上的标签，并调用多个分类网络，通过分类网络和标签对多个特征集进行分类，得到多个分类数据集。其中，一个分类网络对一个特征集进行分类，例如：多个分类网络分别为A1、B1、C1和D1，多个特征集分别为A2、B2、C2和D2，A1对A2进行分类，B1对B2进行分类，C1对C2进行分类，D1对D2进行分类。每个分类网络可采用相同的网络结构，也可以采用不相同的网络结构，例如：分类网络为A1、B1、C1和D1均为线性分类器，分类网络为A1、B1、C1和D1为卷积神经网络Inception-v3、线性分类器、最邻近分类器和谷歌网络GoogLeNet，通过相同的网络结构，减少了网络复杂性，通过采用不相同的网络结构对不同类型的训练数据进行处理，有利于提高分类效率和人脸识别模型的普适性。

104、计算每个特征集的特征向量损失函数值，得到多个特征向量损失函数值，并计算每个分类数据集的分类损失函数值，得到多个分类损失函数值。

服务器计算第一中心向量和第二中心向量，计算每个第一中心向量和第二中心向量之间的距离值，将该距离值作为每个特征集对应的特征向量损失函数值，从而获得多个特征向量损失函数，其中，第一中心向量为每个特征集对应的中心向量，也可为每个特征集中每个训练数据对应的中心向量，第二中心向量可为所有特征集对应的第二中心向量，也可为每个特征集中所有训练数据对应的中心向量。

服务器可通过获取每个特征集对应的训练数据个数，以及计算所有训练数据对应的第一中心向量的和值，根据训练数据个数计算和值的均值，该均值为每个特征集对应的第二中心向量，服务器也可通过预置的中心向量公式计算第二中心向量。

服务器通过预置的交叉熵损失函数计算每个分类数据集的分类损失函数值，从而得到多个分类损失函数值，该交叉熵损失函数可为多分类交叉熵损失函数，通过多分类交叉熵损失函数，求导更简单，能够使得收敛较快，对应的权重矩阵的更新更快。

105、根据多个特征向量损失函数值和多个分类损失函数值，计算人脸识别模型的目标损失函数值。

服务器获得多个特征向量损失函数值和多个分类损失函数值后，获取多个训练数据集的数据集个数，根据数据集个数，计算多个特征向量损失函数值的平均特征向量损失函数值，以及多个分类损失函数值的平均分类损失函数值，将平均特征向量损失函数值和平均分类损失函数值的和值，作为人脸识别模型的目标损失函数值，或者将平均特征向量损失函数值和平均分类损失函数值的加权和值，作为人脸识别模型的目标损失函数值。每个分类网络计算得到分类损失函数值时，可根据分类损失函数值对对应的分类网络进行反向更新。

106、根据目标损失函数值对主干网络进行迭代更新，直至目标损失函数值收敛，得到更新后的人脸识别模型。

服务器根据目标损失函数值和预置的迭代次数，对主干网络的网络结构和/或权重值进行迭代更新，直至目标损失函数值收敛(即人脸识别模型的训练精度符合预设条件)，得到更新后的人脸识别模型。其中，可通过对主干网络进行网络层的增加或删减来更新主干网络的网络结构，也可通过增设其他的网络框架来更新主干网络的网络结构，也可通过修改主干网络的卷积核大小和步长等来更新主干网络的网络结构。在对主干网络进行迭代更新时，服务器也可结合优化算法对人脸识别模型进行优化。

本发明实施例中，通过对多个训练数据集分别进行人脸特征提取和分类，避免了存在重叠数据以及重叠数据作为脏数据对模型训练造成不良影响的状况，通过根据多个特征向量损失函数值和多个分类损失函数值得到的目标损失函数值来更新人脸识别模型的主干网络，能够使人脸识别模型具有较好的普适性，从而，提高了现有的人脸识别模型的识别精度。

请参阅图2，本发明实施例中人脸识别模型的训练方法的另一个实施例包括：

201、获取多个应用场景分别对应的初始训练数据集，初始训练数据集包括开源数据和私有数据。

服务器通过从开源数据库中提取多个不同的应用场景对应的不同维度下的初始训练数据集(开源数据)，从网络平台上爬取多个不同的应用场景对应的初始训练数据集(开源数据)，从联盟链或私有数据库中提取多个不同的应用场景对应的初始训练数据集(私有数据)。

202、对每个初始训练数据集依次进行数据清洗和标签标注，得到预处理后的多个训练数据集。

服务器根据预置的缺失值比例对每个初始训练数据集依次进行缺失值检测、缺失值填充和缺失值清理，得到缺失值处理后的初始训练数据集，对缺失值处理后的初始训练数据集进行合并去重，得到合并去重后的初始训练数据集，判断合并去重后的初始训练数据集中是否存在不符合预设的合法性判定规则的训练数据，若存在，则删除对应的训练数据，若不存在，则将合并去重处理后的初始训练数据集确定为候选训练数据集，对候选训练数据集进行标签标注，得到预处理后的多个训练数据集。

其中，标签标注的内容可包括分类标注、标框标注、区域标注和描点标注中的至少一种，分类标注例如：年龄-成人、性别-女、人种-黄种人、头发-长发、脸部表情-微笑、脸部佩戴部件-眼镜的分类标注，标框标注例如：图像中人脸的标框位置标注，区域标注例如：图像中人脸的区域位置标注，描点标注例如：人脸的关键点标注。

203、通过预置的人脸识别模型中的主干网络，对多个训练数据集分别进行人脸特征提取，得到多个特征集，人脸识别模型包括主干网络和多个分类网络。

具体地，服务器获取多个训练数据集的数据集个数，并根据数据集个数计算每个训练数据集的平均数据量；将平均数据量对应的训练数据作为批处理的数据，得到各训练数据集对应的目标批处理数据；通过预置的人脸识别模型中的主干网络，对目标批处理数据依次进行人脸图像区域检测、人脸关键点检测和人脸特征向量提取，得到多个特征集。

以多个训练数据集中的一个训练数据集为例说明，例如：服务器获取的多个训练数据集的数据集个数为5，训练数据集E有800个训练数据，训练数据集E的平均数据量为160个训练数据，则目标批处理数据为该160个训练数据，通过预置的人脸识别模型中的主干网络，对该160个训练数据(即目标批处理数据)进行人脸图像区域检测，得到人脸区域，对人脸区域进行人脸关键点检测，得到人脸关键点信息，对人脸关键点信息进行人脸特征向量提取，得到多个特征集。其中，若不同的训练数据集的训练数据数量不一致，则不同的训练数据集所得的目标批处理数据，在数据处理过程中，当训练数据数量少的目标批处理数据先处理完时，随机循环处理，直至训练数据数量最多的目标批处理数据处理结束。

204、通过多个分类网络对多个特征集进行分类，得到多个分类数据集，其中，一个分类网络对应一个特征集。

服务器获取每个特征集对应的训练数据上的标签，并调用多个分类网络，通过分类网络和标签对多个特征集进行分类，得到多个分类数据集。其中，一个分类网络对一个特征集进行分类。每个分类网络可采用相同的网络结构，也可以采用不相同的网络结构，通过相同的网络结构，减少了网络复杂性，通过采用不相同的网络结构对不同类型的训练数据进行处理，有利于提高分类效率和人脸识别模型的普适性。

205、计算每个特征集的特征向量损失函数值，得到多个特征向量损失函数值，并计算每个分类数据集的分类损失函数值，得到多个分类损失函数值。

具体地，服务器计算每个特征集对应的第一特征中心向量，以及多个特征集对应的第二特征中心向量；计算每个特征集对应的第一特征中心向量与第二特征中心向量之间的距离值，并将距离值确定为每个特征集的特征向量损失函数值，得到多个特征向量损失函数值；获取每个训练数据集中各训练数据对应的预置标签，根据预置标签和预置的交叉熵损失函数，计算每个分类数据集的分类损失函数值，得到多个分类损失函数值。

其中，服务器获取每个特征集的第一特征向量，每个特征集中对应的第一训练数据个数，目标批处理数据的第一数据个数，通过预置的第一更新中心向量公式，计算每个特征集对应的第一特征中心向量，计算第一特征中心向量的第一更新中心向量公式如下：

p用于指示第p个特征集，vc_p为当前的第一特征中心向量，vc_p-1为上一次迭代的第一特征中心向量，vn_p为当前迭代的第一数据个数，n_p为第一训练数据个数，v_i为当前的第一特征向量。其中，第一次迭代前的第一特征中心向量vc_p为0。

服务器获取所有特征集的第二特征向量，所有特征集中对应的第二训练数据个数，所有特征集对应的目标批处理数据的第二数据个数，通过预置的第二更新中心向量公式，计算第二特征中心向量的第二更新中心向量公式如下：

q用于指示第q次迭代，v_q为当前的第二特征中心向量，v_q-1为上一次迭代的第二特征中心向量，vk_q为当前迭代的第二数据个数，_nq为第二训练数据个数，v_j为当前所有特征集的第二特征向量。其中，第一次迭代前的第二特征中心向量v_q为0。

服务器获取每个特征集的第一特征向量的维度，根据每个特征集的第一特征向量的维度、第一特征中心向量和第二特征中心向量计算特征向量损失函数值，特征向量损失函数值的计算公式如下：

p用于指示第p个特征集，m为每个特征集的第一特征向量的维度，vc_p为第一特征中心向量，v_q为第二特征中心向量。

具体地，服务器统统计每个分类数据集中预置标签的标签个数，以及获取每个分类数据集中预置标签对应的分类数据的特征向量；根据预置的交叉熵损失函数、标签个数和特征向量，计算每个分类数据集的分类损失函数值，得到多个分类损失函数值，交叉熵损失函数如下：

其中，y表示第y个训练数据集，c_y为第y个训练数据集对应的分类数据集，n_y为标签个数，label_i为第i个分类的预置标签，v_i为特征向量。

服务器根据每个训练数据上的预置标签对特征进行分类，得到多个分类数据集，从而可获取每个分类数据集中预置标签的标签个数，各个分类的预置标签，以及各个分类的预置标签对应的分类数据产生的特征向量，通过预置的交叉熵损失函数，结合所得的标签个数和特征向量计算，得到每个分类数据集的分类损失函数值，从而获得多个分类损失函数值。

206、根据多个特征向量损失函数值和多个分类损失函数值，计算人脸识别模型的目标损失函数值。

具体地，服务器根据数据集个数计算多个特征向量损失函数值的均值，得到平均特征向量损失函数值；根据数据集个数计算多个分类损失函数值的均值，得到平均分类损失函数值；计算平均特征向量损失函数值和平均分类损失函数值的和值，得到人脸识别模型的目标损失函数值。

例如：数据集个数为6，多个特征向量损失函数值分别为L1、L2、L3、L4和L5，多个分类损失函数值分别为K1、K2、K3和K4，则平均特征向量损失函数值为(L1+L2+L3+L4+L5)/6＝L，平均分类损失函数值为(K1+K2+K3+K4)/6＝K，目标损失函数值为LC＝L+K。

207、根据目标损失函数值对主干网络进行迭代更新，直至目标损失函数值收敛，得到更新后的人脸识别模型。

具体地，判断目标损失函数值是否收敛，若目标损失函数值不收敛，则对目标批处理数据进行更新，得到更新后的目标批处理数据，并对主干网络的网络结构进行更新，得到更新后的主干网络；通过更新后的主干网络和多个分类网络，对更新后的目标批处理数据依次进行人脸特征提取和分类，得到多个目标分类数据集；根据多个目标分类数据集，计算更新后的目标损失函数值，并判断更新后的目标损失函数值是否收敛；若更新后的目标损失函数值不收敛，则根据更新后的目标损失函数值对更新后的主干网络进行迭代更新，直至更新后的目标损失函数值收敛，得到最终的更新后的人脸识别模型。

当服务器判断到目标损失函数值收敛时，将当前的人脸识别模型作为最终的人脸识别模型。当服务器判断到更新后的目标损失函数值收敛时，将当前更新的人脸识别模型，作为最终更新后的人脸识别模型。其中，对更新后的目标批处理数据依次进行人脸特征提取和分类，得到多个目标分类数据集的操作方法与上述步骤102、103、203和204的操作方法类似，根据多个目标分类数据集，计算更新后的目标损失函数值的操作方法与上述步骤104、105、205和206的操作方法类似，在此不再赘述。每次迭代中，每个更新后的目标批处理数据的数据数量都会不一样，是动态变化的，等于上一迭代中的目标批处理数据与当前的目标批处理数据之间的和值。

本发明实施例中，通过对多个初始训练数据集分别进行清数据清洗和标签标注，以及对多个训练数据集进行人脸特征提取和分类，对于不同的数据集不需要合并清洗，只需要各自清洗即可，不仅大大地节约了清洗数据的时间，还有效地避免了存在重叠数据以及重叠数据作为脏数据对模型训练造成不良影响的状况，通过根据多个特征向量损失函数值和多个分类损失函数值得到的目标损失函数值来更新人脸识别模型的主干网络，能够使人脸识别模型具有较好的普适性，从而，提高了现有的人脸识别模型的识别精度。

上面对本发明实施例中人脸识别模型的训练方法进行了描述，下面对本发明实施例中人脸识别模型的训练装置进行描述，请参阅图3，本发明实施例中人脸识别模型的训练装置一个实施例包括：

获取模块301，用于获取预处理后的多个训练数据集，多个训练数据集为多个应用场景分别对应的人脸训练数据集；

特征提取模块302，用于通过预置的人脸识别模型中的主干网络，对多个训练数据集分别进行人脸特征提取，得到多个特征集，人脸识别模型包括主干网络和多个分类网络；

分类模块303，用于通过多个分类网络对多个特征集进行分类，得到多个分类数据集，其中，一个分类网络对应一个特征集；

第一计算模块304，用于计算每个特征集的特征向量损失函数值，得到多个特征向量损失函数值，并计算每个分类数据集的分类损失函数值，得到多个分类损失函数值；

第二计算模块305，用于根据多个特征向量损失函数值和多个分类损失函数值，计算人脸识别模型的目标损失函数值；

迭代更新模块306，用于根据目标损失函数值对主干网络进行迭代更新，直至目标损失函数值收敛，得到更新后的人脸识别模型。

上述人脸识别模型的训练装置中各个模块的功能实现与上述人脸识别模型的训练方法实施例中各步骤相对应，其功能和实现过程在此处不再一一赘述。

请参阅图4，本发明实施例中人脸识别模型的训练装置的另一个实施例包括：

其中，获取模块301具体包括：

获取单元3011，用于获取多个应用场景分别对应的初始训练数据集，初始训练数据集包括开源数据和私有数据；

预处理单元3012，用于对每个初始训练数据集依次进行数据清洗和标签标注，得到预处理后的多个训练数据集；

可选的，特征提取模块302还可以具体用于：

获取多个训练数据集的数据集个数，并根据数据集个数计算每个训练数据集的平均数据量；

将平均数据量对应的训练数据作为批处理的数据，得到各训练数据集对应的目标批处理数据；

通过预置的人脸识别模型中的主干网络，对目标批处理数据依次进行人脸图像区域检测、人脸关键点检测和人脸特征向量提取，得到多个特征集。

可选的，第二计算模块305还可以具体用于：

根据数据集个数计算多个特征向量损失函数值的均值，得到平均特征向量损失函数值；

根据数据集个数计算多个分类损失函数值的均值，得到平均分类损失函数值；

计算平均特征向量损失函数值和平均分类损失函数值的和值，得到人脸识别模型的目标损失函数值。

可选的，第一计算模块304包括：

第一计算单元3041，用于计算每个特征集对应的第一特征中心向量，以及多个特征集对应的第二特征中心向量；

第二计算单元3042，用于计算每个特征集对应的第一特征中心向量与第二特征中心向量之间的距离值，并将距离值确定为每个特征集的特征向量损失函数值，得到多个特征向量损失函数值；

第三计算单元3043，用于获取每个训练数据集中各训练数据对应的预置标签，根据预置标签和预置的交叉熵损失函数，计算每个分类数据集的分类损失函数值，得到多个分类损失函数值。

可选的，第三计算单元3043还可以具体用于：

统计每个分类数据集中预置标签的标签个数，以及获取每个分类数据集中预置标签对应的分类数据的特征向量；

根据预置的交叉熵损失函数、标签个数和特征向量，计算每个分类数据集的分类损失函数值，得到多个分类损失函数值，交叉熵损失函数如下：

可选的，迭代更新模块306还可以具体用于：

判断目标损失函数值是否收敛，若目标损失函数值不收敛，则对目标批处理数据进行更新，得到更新后的目标批处理数据，并对主干网络的网络结构进行更新，得到更新后的主干网络；

通过更新后的主干网络和多个分类网络，对更新后的目标批处理数据依次进行人脸特征提取和分类，得到多个目标分类数据集；

根据多个目标分类数据集，计算更新后的目标损失函数值，并判断更新后的目标损失函数值是否收敛；

若更新后的目标损失函数值不收敛，则根据更新后的目标损失函数值对更新后的主干网络进行迭代更新，直至更新后的目标损失函数值收敛，得到最终的更新后的人脸识别模型。

上述人脸识别模型的训练装置中各模块和各单元的功能实现与上述人脸识别模型的训练方法实施例中各步骤相对应，其功能和实现过程在此处不再一一赘述。

上面图3和图4从模块化功能实体的角度对本发明实施例中的人脸识别模型的训练装置进行详细描述，下面从硬件处理的角度对本发明实施例中人脸识别模型的训练设备进行详细描述。

图5是本发明实施例提供的一种人脸识别模型的训练设备的结构示意图，该人脸识别模型的训练设备500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)510(例如，一个或一个以上处理器)和存储器520，一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中，存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对人脸识别模型的训练设备500中的一系列指令操作。更进一步地，处理器510可以设置为与存储介质530通信，在人脸识别模型的训练设备500上执行存储介质530中的一系列指令操作。

人脸识别模型的训练设备500还可以包括一个或一个以上电源540，一个或一个以上有线或无线网络接口550，一个或一个以上输入输出接口560，和/或，一个或一个以上操作系统531，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图5示出的人脸识别模型的训练设备结构并不构成对人脸识别模型的训练设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种人脸识别模型的训练设备，所述人脸识别模型的训练设备包括存储器和处理器，存储器中存储有指令，所述指令被处理器执行时，使得处理器执行上述各实施例中的所述人脸识别模型的训练方法的步骤。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行所述人脸识别模型的训练方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种人脸识别模型的训练方法，其特征在于，所述人脸识别模型的训练方法包括：

2.根据权利要求1所述的人脸识别模型的训练方法，其特征在于，所述通过预置的人脸识别模型中的主干网络，对所述多个训练数据集分别进行人脸特征提取，得到多个特征集，包括：

3.根据权利要求2所述的人脸识别模型的训练方法，其特征在于，所述根据所述多个特征向量损失函数值和所述多个分类损失函数值，计算所述人脸识别模型的目标损失函数值，包括：

4.根据权利要求2所述的人脸识别模型的训练方法，其特征在于，所述计算每个特征集的特征向量损失函数值，得到多个特征向量损失函数值，并计算每个分类数据集的分类损失函数值，得到多个分类损失函数值，包括：

5.根据权利要求4所述的人脸识别模型的训练方法，其特征在于，所述根据所述预置标签和预置的交叉熵损失函数，计算每个分类数据集的分类损失函数值，得到多个分类损失函数值，包括：

6.根据权利要求2-5中任一项所述的人脸识别模型的训练方法，其特征在于，所述根据所述目标损失函数值对所述主干网络进行迭代更新，直至所述目标损失函数值收敛，得到更新后的人脸识别模型，包括：

7.根据权利要求1所述的人脸识别模型的训练方法，其特征在于，所述获取预处理后的多个训练数据集，所述多个训练数据集为多个应用场景分别对应的人脸训练数据集，包括：

8.一种人脸识别模型的训练装置，其特征在于，所述人脸识别模型的训练装置包括：

9.一种人脸识别模型的训练设备，其特征在于，所述人脸识别模型的训练设备包括：存储器和至少一个处理器，所述存储器中存储有指令；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述人脸识别模型的训练设备执行如权利要求1-7中任意一项所述的人脸识别模型的训练方法。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，其特征在于，所述指令被处理器执行时实现如权利要求1-7中任一项所述人脸识别模型的训练方法。