CN112016501A

CN112016501A - 人脸识别模型的训练方法、装置和计算机设备

Info

Publication number: CN112016501A
Application number: CN202010922740.6A
Authority: CN
Inventors: 戴磊; 胡魁; 张国辉; 宋晨
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-09-04
Filing date: 2020-09-04
Publication date: 2020-12-01
Anticipated expiration: 2040-09-04
Also published as: CN112016501B; WO2021159815A1

Abstract

本申请涉及智能生活技术，揭示了人脸识别模型的训练方法，人脸模型包括特征生成器、人脸识别判别器和域判别器，包括：通过训练集数据训练特征生成器和人脸识别判别器；判断第一损失函数是否收敛；若是则固定特征生成器的参数，通过训练集数据和目标域数据训练域判别器；判断第二损失函数是否收敛；若是则获取训练域判别器的训练过程对应的第一梯度值；将第一梯度值变更为与第一梯度值相等的负值，成为第一梯度值的第一反向梯度值；在固定域判别器的参数下，通过训练集数据和目标域数据再次训练特征生成器，并将第一反向梯度值用于反向传播训练中；迭代训练人脸识别模型达到预设条件。使特征生成器中尽量减少环境特征，提升人脸识别的精准度。

Description

人脸识别模型的训练方法、装置和计算机设备

技术领域

本申请涉及智能生活领域，特别是涉及到人脸识别模型的训练方法、装置和计算机设备。

背景技术

现有的人脸识别模型的持续改进上往往会有两种模式：离线训练-在线推理模式，即在正式上线之前使用大量携带标签标注的样本数据进行监督式训练得到模型，模型上线之后参数就不再改变，由于使用的场景不同导致训练使用的样本与实际上线的场景对应的数据，会存在跨域识别的问题，造成上线之后的识别精度大幅下降。当前为缓解跨域识别的精度下降问题，在上线之后使用得到的生产数据，进行人工标注脱敏之后对模型进行fine-tune以提高识别精度，但人工参与标注降低了数据的回流使用效率，也降低了上线模型的迭代更新速度，影响人脸识别模型线上识别的精准度。

发明内容

本申请的主要目的为提供人脸识别模型的训练方法，旨在解决现有人脸识别模型的训练方式导致识别精准度不能满足需求的技术问题。

本申请提出一种人脸识别模型的训练方法，所述人脸模型包括特征生成器、人脸识别判别器和域判别器，方法包括：

通过训练集数据训练所述特征生成器和所述人脸识别判别器，其中，所述训练集数据为带有人脸识别标签标注的离线数据；

判断通过所述训练集数据进行训练时的第一损失函数是否收敛；

若是，则固定所述特征生成器的参数；

在固定所述特征生成器的参数下，通过所述训练集数据和目标域数据同时训练所述域判别器，其中，所述目标域数据为未进行人脸识别标签标注的数据；

判断通过所述训练集数据和目标域数据同时训练所述域判别器的第二损失函数是否收敛；

若是，则获取训练所述域判别器的训练过程对应的第一梯度值，并固定所述域判别器的参数；

将所述第一梯度值变更为与所述第一梯度值相等的负值，成为所述第一梯度值的第一反向梯度值；

在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第一反向梯度值用于训练过程的反向传播训练中；

按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件。

优选地，所述在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第一反向梯度值用于训练过程的反向传播训练中的步骤，包括：

通过所述域判别器的域判别结果，确定通过所述训练集数据正向训练所述域判别器时，所述域判别结果与训练数据之间的误差；

在所述第一反向梯度值的约束下，将所述误差进行反向传播，同时通过所述训练集数据和目标域数据，在所述第一损失函数的约束下，再次训练所述特征生成器，得到更新后的所述特征生成器的权值。

优选地，按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件的步骤之后，包括：

将训练后的所述人脸识别模型，通过部署文件完成上线，形成上线的人脸识别模型；

获取在线数据，将所述在线数据与所述训练集数据一并输入训练后的所述人脸识别模型，进行半监督训练；

确定所述半监督训练之后形成的更新参数的所述人脸识别模型；

通过所述更新参数的所述人脸识别模型，升级所述上线的人脸识别模型。

优选地，获取在线数据，将所述在线数据与所述训练集数据一并输入训练后的所述人脸识别模型，进行半监督训练的步骤，包括：

在固定上线的人脸识别模型中的特征生成器的参数下，通过所述训练集数据和线上数据同时训练所述域判别器，其中，所述线上数据为获取的当前场景的未进行人脸识别标签标注的数据；

判断通过所述训练集数据和线上数据同时训练所述域判别器的所述第二损失函数是否收敛；

若是，则获取训练所述域判别器的训练过程对应的第二梯度值，并固定所述域判别器的参数；

将所述第二梯度值变更为与所述第二梯度值相等的负值，成为所述第二梯度值的第二反向梯度值；

在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第二反向梯度值用于训练过程的反向传播训练中，以更新所述特征生成器的参数。

优选地，所述判断通过所述训练集数据进行训练时的第一损失函数是否收敛的步骤，包括：

判断函数

在通过所述训练集数据训练所述特征生成器和所述人脸识别判别器时，函数值是否不再下降，达到最小值，其中，

k表示所述训练集的样本个数，n表示分类数，s表示缩放系数，y_i表示样本i的人脸识别分类标签，θy_i表示特征向量与指向样本i的分类标签的权重向量的夹角，θ_j表示特征向量与指向分类标签j的权重向量的夹角，m表示角度的超参数；

若是，则判定所述第一损失函数收敛。

优选地，所述判断通过所述训练集数据和目标域数据同时训练所述域判别器的第二损失函数是否收敛的步骤，包括：

判断函数

在通过所述训练集数据和目标域数据同时训练所述域判别器时，函数值是否不再下降，达到最小值，其中，

k表示所述训练集数据和目标域数据的样本个数，y`_i表示样本i的域分类标签，正分类为0.9，负分类为0.1，p`_i表示样本i预测为正分类的概率；

若是，则判定所述第二损失函数收敛。

优选地，按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件的步骤，包括：

经过第一指定迭代次数的迭代训练后，得到迭代训练后的第一特征生成器；

将测试数据输入所述第一特征生成器，进行特征数据的推理，得到所述测试数据对应的推理结果；

通过所述推理结果和所述测试数据的目标值，计算推理精度；

判断所述推理精度是否达到预设值；

若是，则结束迭代训练，并判定迭代训练所述人脸识别模型达到预设条件。

本申请还提供了一种人脸识别模型的训练装置，所述人脸模型包括特征生成器、人脸识别判别器和域判别器，装置包括：

第一训练模块，用于通过训练集数据训练所述特征生成器和所述人脸识别判别器，其中，所述训练集数据为带有人脸识别标签标注的离线数据；

第一判断模块，用于判断通过所述训练集数据进行训练时的第一损失函数是否收敛；

第一固定模块，用于若第一损失函数收敛，则固定所述特征生成器的参数；

第二训练模块，用于在固定所述特征生成器的参数下，通过所述训练集数据和目标域数据同时训练所述域判别器，其中，所述目标域数据为未进行人脸识别标签标注的数据；

第二判断模块，用于判断通过所述训练集数据和目标域数据同时训练所述域判别器的第二损失函数是否收敛；

第二固定模块，用于若第二损失函数收敛，则获取训练所述域判别器的训练过程对应的第一梯度值，并固定所述域判别器的参数；

变更模块，用于将所述第一梯度值变更为与所述第一梯度值相等的负值，成为所述第一梯度值的第一反向梯度值；

第三训练模块，用于在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第一反向梯度值用于训练过程的反向传播训练中；

迭代训练模块，用于按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件。

本申请还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

本申请还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述的方法的步骤。

本申请通过在对抗学习的训练过程中，将第一梯度值变更为与第一梯度值相等的负值，成为所述第一梯度值的反向梯度值，并在固定训练好的域判别器参数下，再次通过源域样本和目标域样本在反向梯度值下反向训练特征生成器，使特征生成器对源域样本和目标域样本生成的特征向量，不能被域判别器区分，使特征生成器生成的特征向量中尽量减少环境特征，而保留人脸识别的特征向量，从而提升在人脸识别中的识别精准度。

附图说明

图1本申请一实施例的人脸识别模型的训练方法流程示意图；

图2本申请一实施例的人脸识别模型的训练过程示意图；

图3本申请一实施例的人脸识别模型的训练装置结构示意图；

图4本申请一实施例的计算机设备内部结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请一实施例的人脸识别模型的训练方法，所述人脸模型包括特征生成器、人脸识别判别器和域判别器，方法包括：

S1：通过训练集数据训练所述特征生成器和所述人脸识别判别器，其中，所述训练集数据为带有人脸识别标签标注的离线数据；

S2：判断通过所述训练集数据进行训练时的第一损失函数是否收敛；

S3：若是，则固定所述特征生成器的参数；

S4：在固定所述特征生成器的参数下，通过所述训练集数据和目标域数据同时训练所述域判别器，其中，所述目标域数据为未进行人脸识别标签标注的数据；

S5：判断通过所述训练集数据和目标域数据同时训练所述域判别器的第二损失函数是否收敛；

S6：若是，则获取训练所述域判别器的训练过程对应的第一梯度值，并固定所述域判别器的参数；

S7：将所述第一梯度值变更为与所述第一梯度值相等的负值，成为所述第一梯度值的第一反向梯度值；

S8：在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第一反向梯度值用于训练过程的反向传播训练中；

S9：按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件。

本申请实施例中，通过先使用带人脸识别标签标注的离线数据或称源域样本组成的训练集，训练特征生成器和人脸识别判别器，使特征生成器对训练集数据生成的特征向量，能够被人脸识别判别器区分不同人脸识别标签标注的样本，并根据人脸识别标签标注的样本，使特征生成器学习到特征向量的生成方式。本申请中的对抗学习模型中训练人脸识别判别器和域判别器所用的损失函数不同，以更适合域分类标签和人脸识别分类标签的样本特征以及区分精度的需求。例如图2中的训练过程示意图，先通过先用人脸识别标签标注数据训练特征生成器，然后在固定训练好的特征生成器的参数下，通过使用离线数据或称源域样本，以及目标域样本训练域判别器，此时的域判别器就是一个二分类器，以区分源域样本和目标域样本，源域样本和目标域样本的域分类标签分别为0和1，即本次的训练目标，是使域判别器可以区分源域样本和目标域样本。上述源域样本和目标域样本指具有不同环境背景的图片，域指环境背景。然后在固定训练好的域判别器参数下，再次通过源域样本和目标域样本在梯度反向的方式下反向训练特征生成器，使特征生成器对源域样本和目标域样本生成的特征向量，不能被域判别器区分。通过上述特征生成器、人脸识别判别器和域判别器的交替训练，直到最终使特征生成器生成的特征向量中，尽量减少源域样本和目标域样本的域特征即环境特征，而最大限度地保留人脸识别的特征，从而提升在人脸识别过程中的区分精准度。实验证明，通过本申请的训练方式，在FAR百万分之一的测试中，FRR由4.25％下降到3.72％，人脸识别精准度得到明显提升。而且本申请的人脸识别模型训练完成之后，只需要使用特征生成器的部分进行推理，所以不会增加人脸识别过程中的计算量以及推理耗时。本申请通过在对抗学习的训练过程中，将第一梯度值变更为与第一梯度值相等的负值，成为所述第一梯度值的反向梯度值，并在固定训练好的域判别器参数下，再次通过源域样本和目标域样本在反向梯度值下反向训练特征生成器，使特征生成器对源域样本和目标域样本生成的特征向量，不能被域判别器区分，使特征生成器生成的特征向量中尽量减少环境特征，而保留人脸识别的特征向量，从而提升在人脸识别中的识别精准度。

进一步地，所述在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第一反向梯度值用于训练过程的反向传播训练中的步骤S8，包括：

S81：通过所述域判别器的域判别结果，确定通过所述训练集数据正向训练所述域判别器时，所述域判别结果与训练数据之间的误差；

S82：在所述第一反向梯度值的约束下，将所述误差进行反向传播，同时通过所述训练集数据和目标域数据，在所述第一损失函数的约束下，再次训练所述特征生成器，得到更新后的所述特征生成器的权值。

本申请实施例，在固定训练好的域判别器参数下，再次通过源域样本和目标域样本在反向梯度值下反向训练特征生成器时，域判别结果与训练数据的域标签分类之间存在误差，然后将误差作为反向训练的输入，同时通过所述训练集数据和目标域数据，通过梯度反向在第一损失函数的约束下，再次训练特征生成器，得到更新后的特征生成器的权值。上述梯度反向是指，将正向训练的梯度值加负号，即值相等，变化趋势相反。在模型训练过程中，识别标签的结果与原标注标签相同，则损失函数值变小，梯度值小，即需要调整的调整量小。若调整量参数调大，损失函数值下降，则梯度为正才能识别。若调整量参数调小，损失函数值下降，则梯度为负才能识别。本申请通过将正向训练域判别器时对应的第一梯度值反向，用于反向传播训练特征生成器，训练过程中依然以第一损失函数的函数值变为最小为收敛，则使得反向训练的特征生成器对训练集数据和目标域数据不存在区分调整或存在非常微小的调整量，即不能区分训练集数据和目标域数据的域分类标签。

进一步地，在固定所述特征生成器的参数下，通过所述训练集数据和目标域数据同时训练所述域判别器的步骤S4，包括：

S41：将所述训练集的域分类标签设置为第一指定值，所述目标域数据的域分类标签设置为第二指定值；

S42：通过所述域判别器的域判别结果，确定通过所述训练集数据和目标域数据正向训练所述域判别器时，所述域判别结果分别与所述第一指定值和所述第二指定值之间的误差；

S43：将所述误差进行反向传播，通过所述训练集数据和目标域数据同时训练所述域判别器；

S44：判断所述第二损失函数是否收敛；

S45：若是，则获取更新后的所述域判别器的权值。

本申请在训练域判别器时，包括正向训练和反向训练两个过程，正向训练指常规的二分类器的训练过程，不赘述。反向训练过程指通过将域分类标签标注为两类，一类为训练集数据对应的源域样本的第一分类标签，另一类是目标域数据对应的目标域样本的第二分类标签，第一分类标签设定值为第一指定值，第二分类标签设定值为第二指定值，以得到域判别结果与分别与第一指定值和第二指定值之间的误差，进行反向传播训练以更新域判别器的参数，使域判别器更精准地区分域分类标签，以确定正向训练的梯度值，提高反向训练特征生成器的反向梯度。上述第一指定值和第二指定值为加和为1的任意两个正数，本实施例为获取正向训练的最佳梯度值，设定上述第一指定值为0.1，第二指定值为0.9。

进一步地，按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件的步骤S9之后，包括：

S91：将训练后的所述人脸识别模型，通过部署文件完成上线，形成上线的人脸识别模型；

S92：获取在线数据，将所述在线数据与所述训练集数据一并输入训练后的所述人脸识别模型，进行半监督训练；

S93：确定所述半监督训练之后形成的更新参数的所述人脸识别模型；

S94：通过所述更新参数的所述人脸识别模型，升级所述上线的人脸识别模型。

本申请实施例中，在系统上线之前，使用带人脸识别标签的离线数据，通过传统的监督式训练方法训练人脸识别模型中的预判别器、人脸识别判别器以及特征生成器。训练完毕后通过部署上线，使得训练好的特征生成器用于未携带人脸标签标注的在线数据的人脸识别。本申请在系统上线之后，将得到的不带人脸识别标签标注的在线数据，不经过人工标注处理，直接与带人脸识别标签标注的离线数据对人脸识别模型进行半监督训练，以完成人脸识别模型的线上系统更新。本申请通过不断地接受新的在线数据，实现不断迭代更新训练，达到线上状态下的“训练-更新-数据回流-再训练-再更新”的模式，在上线之后实现自动迭代更新特征生成器，可以使人脸识别模型越来越适应线上场景，不断提高识别精度。

进一步地，获取在线数据，将所述在线数据与所述训练集数据一并输入训练后的所述人脸识别模型，进行半监督训练的步骤S92，包括：

S921:在固定上线的人脸识别模型中的特征生成器的参数下，通过所述训练集数据和线上数据同时训练所述域判别器，其中，所述线上数据为获取的当前场景的未进行人脸识别标签标注的数据；

S922:判断通过所述训练集数据和线上数据同时训练所述域判别器的所述第二损失函数是否收敛；

S923:若是，则获取训练所述域判别器的训练过程对应的第二梯度值，并固定所述域判别器的参数；

S924:将所述第二梯度值变更为与所述第二梯度值相等的负值，成为所述第二梯度值的第二反向梯度值；

S925:在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第二反向梯度值用于训练过程的反向传播训练中，以更新所述特征生成器的参数。

本申请实施例中，半监督训练过程中的根据人脸识别模型各部分的参数优化，使半监督训练过程的线上更新，对应的梯度值不同于上线前的监督训练过程的梯度值，本申请实施例为区别这两个过程的梯度值，可将半监督训练过程中的正向训练域判别器的梯度值，定义为第二梯度值。本申请中“第一”、“第二”等类似用语仅用于区分，不用于限定，其他处的类似用语作用相同，不赘述。本申请实施例的半监督训练过程与监督训练过程相比，区别点在于，正向训练域判别器用的梯度值不同、训练数据不同，其他损失函数等相同。

进一步地，所述判断通过所述训练集数据进行训练时的第一损失函数是否收敛的步骤S2，包括：

S21:判断函数

S22:若是，则判定所述第一损失函数收敛。

本申请实施例中，训练特征生成器和人脸识别判别器时，用的损失函数不同于训练域判别器时的损失函数。根据训练特征生成器以及人脸识别判别器时所用的样本数据的特征，构建了第一损失函数。上述第一损失函数中包括了人脸识别分类标签以及分类标签的分类数，且考量了人脸识别的特征向量与分类标签的特征向量的角度参数，使第一损失函数更贴合于人脸识别特征的识别特点，使特征生成器和人脸识别判别器识别人脸识别特征的精度更高，鲁棒性更好。

进一步地，所述判断通过所述训练集数据和目标域数据同时训练所述域判别器的第二损失函数是否收敛的步骤S5，包括：

S51:判断函数

S52:若是，则判定所述第二损失函数收敛。

本申请实施例中，第二损失函数根据域分类标签的特点构建得到。域分类器的分类标准更简单化，只需考虑是源域特征还是目标域特征即可，且本实施例以目标域对应的正分类为0.9，源域对应的负分类为0.1为例，构建了第二损失函数，使域判别器在精准区分正分类和负分类的前提下，计算量更少，且利于训练的快速收敛。

进一步地，按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件的步骤S9，包括：

S901：经过第一指定迭代次数的迭代训练后，得到迭代训练后的第一特征生成器；

S902:将测试数据输入所述第一特征生成器，进行特征数据的推理，得到所述测试数据对应的推理结果；

S903:通过所述推理结果和所述测试数据的目标值，计算推理精度；

S904:判断所述推理精度是否达到预设值；

S905:若是，则结束迭代训练，并判定迭代训练所述人脸识别模型达到预设条件。

本申请判断人脸识别模型在离线状态下的迭代训练完成，以人脸识别模型通过测试集进行效果检验的推理精度为标准。本申请实施例以推理精度达到预设值，比如达到95％以上或更高，95％即100次对测试数据的推理，95次正确。

进一步地，按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件所述的步骤S9，包括：

S911:经过第二指定迭代次数的迭代训练后，得到迭代训练后的第二特征生成器；

S912:将测试数据输入所述第二特征生成器，进行特征数据的推理，得到所述测试数据对应的推理结果；

S913:通过所述推理结果和所述测试数据的目标值，计算推理精度；

S914:判断所述推理精度是否趋于稳定；

S915:若是，则结束迭代训练，并判定迭代训练所述人脸识别模型达到预设条件。

本实施例以推理精度的变化趋势为考量标准，比如变化趋势由逐渐升高的趋势，变为趋于平稳的状态。比如推理精度对应的曲线斜率趋于0，或推理精度稳定于某一固定值，比如98.7％。

参照图3，本申请一实施例的人脸识别模型的训练装置，人脸模型包括特征生成器、人脸识别判别器和域判别器，装置包括：

第一训练模块1，用于通过训练集数据训练所述特征生成器和所述人脸识别判别器，其中，所述训练集数据为带有人脸识别标签标注的离线数据；

第一判断模块2，用于判断通过所述训练集数据进行训练时的第一损失函数是否收敛；

第一固定模块3，用于若第一损失函数收敛，则固定所述特征生成器的参数；

第二训练模块4，用于在固定所述特征生成器的参数下，通过所述训练集数据和目标域数据同时训练所述域判别器，其中，所述目标域数据为未进行人脸识别标签标注的数据；

第二判断模块5，用于判断通过所述训练集数据和目标域数据同时训练所述域判别器的第二损失函数是否收敛；

第二固定模块6，用于若第二损失函数收敛，则获取训练所述域判别器的训练过程对应的第一梯度值，并固定所述域判别器的参数；

变更模块7，用于将所述第一梯度值变更为与所述第一梯度值相等的负值，成为所述第一梯度值的第一反向梯度值；

第三训练模块8，用于在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第一反向梯度值用于训练过程的反向传播训练中；

迭代训练模块9，用于按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件。

进一步地，第三训练模块8，包括：

第一确定单元，用于通过所述域判别器的域判别结果，确定通过所述训练集数据正向训练所述域判别器时，所述域判别结果与训练数据之间的误差；

第一训练单元，用于在所述第一反向梯度值的约束下，将所述误差进行反向传播，同时通过所述训练集数据和目标域数据，在所述第一损失函数的约束下，再次训练所述特征生成器，得到更新后的所述特征生成器的权值。

进一步地，第二训练模块4，包括：

设置单元，用于将所述训练集的域分类标签设置为第一指定值，所述目标域数据的域分类标签设置为第二指定值；

第二确定单元，用于通过所述域判别器的域判别结果，确定通过所述训练集数据和目标域数据正向训练所述域判别器时，所述域判别结果分别与所述第一指定值和所述第二指定值之间的误差；

第二训练单元，用于将所述误差进行反向传播，通过所述训练集数据和目标域数据同时训练所述域判别器；

第一判断单元，用于判断所述第二损失函数是否收敛；

第一获取单元，用于若所述第二损失函数收敛，则获取更新后的所述域判别器的权值。

进一步地，人脸识别模型的训练装置，包括：

形成模块，用于将训练后的所述人脸识别模型，通过部署文件完成上线，形成上线的人脸识别模型；

获取模块，用于获取在线数据，将所述在线数据与所述训练集数据一并输入训练后的所述人脸识别模型，进行半监督训练；

确定模块，用于确定所述半监督训练之后形成的更新参数的所述人脸识别模型；

升级模块，用于通过所述更新参数的所述人脸识别模型，升级所述上线的人脸识别模型。

进一步地，获取模块，包括：

第三训练单元，用于在固定上线的人脸识别模型中的特征生成器的参数下，通过所述训练集数据和线上数据同时训练所述域判别器，其中，所述线上数据为获取的当前场景的未进行人脸识别标签标注的数据；

第二判断单元，用于判断通过所述训练集数据和线上数据同时训练所述域判别器的所述第二损失函数是否收敛；

第二获取单元，用于若所述第二损失函数收敛，则获取训练所述域判别器的训练过程对应的第二梯度值，并固定所述域判别器的参数；

变更单元，用于将所述第二梯度值变更为与所述第二梯度值相等的负值，成为所述第二梯度值的第二反向梯度值；

第四训练单元，用于在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第二反向梯度值用于训练过程的反向传播训练中，以更新所述特征生成器的参数。

进一步地，第一判断模块2，包括：

第三判断单元，用于判断函数

第一判定单元，用于若函数值不再下降，达到最小值，则判定所述第一损失函数收敛。

进一步地，第二判断模块5，包括：

第四判断单元，用于判断函数

第二判定单元，用于若函数值不再下降，达到最小值，则判定所述第二损失函数收敛。

进一步地，迭代训练模块9，包括：

第一得到单元，用于经过第一指定迭代次数的迭代训练后，得到迭代训练后的第一特征生成器；

第一输入单元，用于将测试数据输入所述第一特征生成器，进行特征数据的推理，得到所述测试数据对应的推理结果；

第一计算单元，用于通过所述推理结果和所述测试数据的目标值，计算推理精度；

第五判断单元，用于判断所述推理精度是否达到预设值；

第三判定单元，用于若达到预设值，则结束迭代训练，并判定迭代训练所述人脸识别模型达到预设条件。

进一步地，迭代训练模块9，包括：

第二得到单元，用于经过第二指定迭代次数的迭代训练后，得到迭代训练后的第二特征生成器；

第二输入单元，用于将测试数据输入所述第二特征生成器，进行特征数据的推理，得到所述测试数据对应的推理结果；

第二计算单元，用于通过所述推理结果和所述测试数据的目标值，计算推理精度；

第六判断单元，用于判断所述推理精度是否趋于稳定；

第四判定单元，用于若趋于稳定，则结束迭代训练，并判定迭代训练所述人脸识别模型达到预设条件。

参照图4，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储人脸识别模型的训练过程需要的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现人脸识别模型的训练方法。

上述处理器执行上述人脸识别模型的训练方法，所述人脸模型包括特征生成器、人脸识别判别器和域判别器，方法包括：通过训练集数据训练所述特征生成器和所述人脸识别判别器，其中，所述训练集数据为带有人脸识别标签标注的离线数据；判断通过所述训练集数据进行训练时的第一损失函数是否收敛；若是，则固定所述特征生成器的参数；在固定所述特征生成器的参数下，通过所述训练集数据和目标域数据同时训练所述域判别器，其中，所述目标域数据为未进行人脸识别标签标注的数据；判断通过所述训练集数据和目标域数据同时训练所述域判别器的第二损失函数是否收敛；若是，则获取训练所述域判别器的训练过程对应的第一梯度值，并固定所述域判别器的参数；将所述第一梯度值变更为与所述第一梯度值相等的负值，成为所述第一梯度值的第一反向梯度值；在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第一反向梯度值用于训练过程的反向传播训练中；按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件。

上述计算机设备，通过在对抗学习的训练过程中，将第一梯度值变更为与第一梯度值相等的负值，成为所述第一梯度值的反向梯度值，并在固定训练好的域判别器参数下，再次通过源域样本和目标域样本在反向梯度值下反向训练特征生成器，使特征生成器对源域样本和目标域样本生成的特征向量，不能被域判别器区分，使特征生成器生成的特征向量中尽量减少环境特征，而保留人脸识别的特征向量，从而提升在人脸识别中的识别精准度。

在一个实施例中，上述处理器在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第一反向梯度值用于训练过程的反向传播训练中的步骤，包括：通过所述域判别器的域判别结果，确定通过所述训练集数据正向训练所述域判别器时，所述域判别结果与训练数据之间的误差；在所述第一反向梯度值的约束下，将所述误差进行反向传播，同时通过所述训练集数据和目标域数据，在所述第一损失函数的约束下，再次训练所述特征生成器，得到更新后的所述特征生成器的权值。

在一个实施例中，上述处理器按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件的步骤之后，包括：将训练后的所述人脸识别模型，通过部署文件完成上线，形成上线的人脸识别模型；获取在线数据，将所述在线数据与所述训练集数据一并输入训练后的所述人脸识别模型，进行半监督训练；确定所述半监督训练之后形成的更新参数的所述人脸识别模型；通过所述更新参数的所述人脸识别模型，升级所述上线的人脸识别模型。

在一个实施例中，上述处理器获取在线数据，将所述在线数据与所述训练集数据一并输入训练后的所述人脸识别模型，进行半监督训练的步骤，包括：在固定上线的人脸识别模型中的特征生成器的参数下，通过所述训练集数据和线上数据同时训练所述域判别器，其中，所述线上数据为获取的当前场景的未进行人脸识别标签标注的数据；判断通过所述训练集数据和线上数据同时训练所述域判别器的所述第二损失函数是否收敛；若是，则获取训练所述域判别器的训练过程对应的第二梯度值，并固定所述域判别器的参数；将所述第二梯度值变更为与所述第二梯度值相等的负值，成为所述第二梯度值的第二反向梯度值；在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第二反向梯度值用于训练过程的反向传播训练中，以更新所述特征生成器的参数。

在一个实施例中，上述处理器判断通过所述训练集数据进行训练时的第一损失函数是否收敛的步骤，包括：判断函数

k表示所述训练集的样本个数，n表示分类数，s表示缩放系数，y_i表示样本i的人脸识别分类标签，θy_i表示特征向量与指向样本i的分类标签的权重向量的夹角，θ_j表示特征向量与指向分类标签j的权重向量的夹角，m表示角度的超参数；若是，则判定所述第一损失函数收敛。

在一个实施例中，上述处理器判断通过所述训练集数据和目标域数据同时训练所述域判别器的第二损失函数是否收敛的步骤，包括：判断函数

k表示所述训练集数据和目标域数据的样本个数，y`_i表示样本i的域分类标签，正分类为0.9，负分类为0.1，p`_i表示样本i预测为正分类的概率；若是，则判定所述第二损失函数收敛。

在一个实施例中，上述处理器按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件的步骤，包括：经过第一指定迭代次数的迭代训练后，得到迭代训练后的第一特征生成器；将测试数据输入所述第一特征生成器，进行特征数据的推理，得到所述测试数据对应的推理结果；通过所述推理结果和所述测试数据的目标值，计算推理精度；判断所述推理精度是否达到预设值；若是，则结束迭代训练，并判定迭代训练所述人脸识别模型达到预设条件。

本领域技术人员可以理解，图4中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现人脸识别模型的训练方法，所述人脸模型包括特征生成器、人脸识别判别器和域判别器，方法包括：通过训练集数据训练所述特征生成器和所述人脸识别判别器，其中，所述训练集数据为带有人脸识别标签标注的离线数据；判断通过所述训练集数据进行训练时的第一损失函数是否收敛；若是，则固定所述特征生成器的参数；在固定所述特征生成器的参数下，通过所述训练集数据和目标域数据同时训练所述域判别器，其中，所述目标域数据为未进行人脸识别标签标注的数据；判断通过所述训练集数据和目标域数据同时训练所述域判别器的第二损失函数是否收敛；若是，则获取训练所述域判别器的训练过程对应的第一梯度值，并固定所述域判别器的参数；将所述第一梯度值变更为与所述第一梯度值相等的负值，成为所述第一梯度值的第一反向梯度值；在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第一反向梯度值用于训练过程的反向传播训练中；按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件。

上述计算机可读存储介质，通过在对抗学习的训练过程中，将第一梯度值变更为与第一梯度值相等的负值，成为所述第一梯度值的反向梯度值，并在固定训练好的域判别器参数下，再次通过源域样本和目标域样本在反向梯度值下反向训练特征生成器，使特征生成器对源域样本和目标域样本生成的特征向量，不能被域判别器区分，使特征生成器生成的特征向量中尽量减少环境特征，而保留人脸识别的特征向量，从而提升在人脸识别中的识别精准度。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，上述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种人脸识别模型的训练方法，其特征在于，所述人脸模型包括特征生成器、人脸识别判别器和域判别器，方法包括：

若是，则固定所述特征生成器的参数；

2.根据权利要求1所述的人脸识别模型的训练方法，其特征在于，所述在固定所述域判别器的参数下，通过所述训练集数据和目标域数据同时再次训练所述特征生成器，并将所述第一反向梯度值用于训练过程的反向传播训练中的步骤，包括：

3.根据权利要求2所述的人脸识别模型的训练方法，其特征在于，按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件的步骤之后，包括：

4.根据权利要求3所述的人脸识别模型的训练方法，其特征在于，获取在线数据，将所述在线数据与所述训练集数据一并输入训练后的所述人脸识别模型，进行半监督训练的步骤，包括：

5.根据权利要求2所述的人脸识别模型的训练方法，其特征在于，所述判断通过所述训练集数据进行训练时的第一损失函数是否收敛的步骤，包括：

判断函数

若是，则判定所述第一损失函数收敛。

6.根据权利要求2所述的人脸识别模型的训练方法，其特征在于，所述判断通过所述训练集数据和目标域数据同时训练所述域判别器的第二损失函数是否收敛的步骤，包括：

判断函数

若是，则判定所述第二损失函数收敛。

7.根据权利要求1所述的人脸识别模型的训练方法，其特征在于，按照所述特征生成器、人脸识别判别器和域判别器的周期训练过程，迭代训练所述人脸识别模型达到预设条件的步骤，包括：

判断所述推理精度是否达到预设值；

8.一种人脸识别模型的训练装置，其特征在于，所述人脸模型包括特征生成器、人脸识别判别器和域判别器，装置包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。