CN117496582B

CN117496582B - 人脸识别模型训练方法、装置、电子设备及存储介质

Info

Publication number: CN117496582B
Application number: CN202311832529.5A
Authority: CN
Inventors: 温东超; 梁玲燕; 赵雅倩; 史宏志; 许光远
Original assignee: Suzhou Metabrain Intelligent Technology Co Ltd
Current assignee: Suzhou Metabrain Intelligent Technology Co Ltd
Priority date: 2023-12-28
Filing date: 2023-12-28
Publication date: 2024-04-16
Anticipated expiration: 2043-12-28
Also published as: CN117496582A

Abstract

本发明提供一种人脸识别模型训练方法、装置、电子设备及存储介质，涉及数据处理技术领域，包括：获取训练样本集，对于训练样本集中的任一训练样本，将归一化的训练样本输入到预设神经网络模型，利用神经网络前向传播算法，计算第一损失值；基于第一损失值，计算训练样本的梯度值，并根据训练样本的梯度值中全部数值绝对值的平均值，以及预设对抗强度信息，计算训练样本的离散化梯度值；基于训练样本的离散化梯度值，确定训练样本对应的对抗样本，对抗样本携带有对应训练样本的身份标签；基于各个训练样本和训练样本对应的对抗样本，对预设神经网络模型进行训练，在满足预设训练条件的情况下，得到训练好的人脸识别模型。

Description

人脸识别模型训练方法、装置、电子设备及存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种人脸识别模型训练方法、装置、电子设备及存储介质。

背景技术

随着深度学习技术的不断发展，基于深度学习的人脸识别技术的识别性能已经超过人类的识别能力，高精度深度人脸识别技术的识别精度可以达到约99.80%，而人类标注人员的平均标注精度是97.53%。在这样的背景下，人脸识别技术已经可以在特定应用场景下自动完成身份认证任务或者提供辅助工作，例如：移动设备自动开机（例如：手机、平板电脑等）、门禁系统、支付授权和视频监控等等。这些应用不仅提升了社会运行效率，也给人类日常生活带了诸多便利。

但是，在基于深度学习的人脸识别系统被部署到对于安全性要求很高的场景中时，如何提高人脸识别模型的鲁棒性就成为了业界关注的重点。

发明内容

本发明提供一种人脸识别模型训练方法、装置、电子设备及存储介质，用以解决现有技术中如何提高人脸识别模型的鲁棒性的问题。

本发明提供一种人脸识别模型训练方法，包括：

获取训练样本集，其中，所述训练样本集中包括至少一个训练样本，所述训练样本为携带有身份标签的人脸图像训练样本；

对于所述训练样本集中的任一训练样本，将归一化的所述训练样本输入到预设神经网络模型，利用神经网络前向传播算法，计算第一损失值；

基于所述第一损失值，计算所述训练样本的梯度值，并根据所述训练样本的梯度值中全部数值绝对值的平均值，以及预设对抗强度信息计算所述训练样本的离散化梯度值；基于所述训练样本的离散化梯度值，确定所述训练样本对应的对抗样本，所述对抗样本携带有对应训练样本的所述身份标签；

基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练，在满足预设训练条件的情况下，得到训练好的人脸识别模型；

其中，所述训练好的人脸识别模型用于在输入待识别人脸图像的情况下，输出所述待识别人脸图像对应的身份信息。

根据本发明提供的一种人脸识别模型训练方法，基于归一化的所述训练样本和预设对抗强度信息计算所述训练样本的离散化梯度值，包括：

将归一化的所述训练样本输入到预设神经网络模型，利用神经网络前向传播算法，计算第一损失值；

基于所述第一损失值，计算所述训练样本的梯度值，并根据所述训练样本的梯度值中全部数值绝对值的平均值，以及预设对抗强度信息计算所述训练样本的离散化梯度值。

根据本发明提供的一种人脸识别模型训练方法，基于所述训练样本的离散化梯度值，确定所述训练样本对应的对抗样本，包括：

基于所述训练样本的离散化梯度值，确定所述训练样本的第一对抗扰动信息；

基于所述第一对抗扰动信息对所述训练样本进行扰动调整，得到所述训练样本对应的对抗样本。

根据本发明提供的一种人脸识别模型训练方法，所述训练样本的离散化梯度值的计算方法，具体为：

其中，为训练样本的梯度值，/>是/>中的一个元素，/>是/> 对应的离散化的值，即离散化梯度值，/>为训练样本的梯度值中全部数值绝对值的平均值。

根据本发明提供的一种人脸识别模型训练方法，基于所述第一对抗扰动信息对所述训练样本进行扰动调整，得到所述训练样本对应的对抗样本的步骤之后，所述方法包括：

将所述对抗样本重新作为迭代训练样本，并基于所述迭代训练样本迭代更新对抗样本，并更新迭代次数；

在所述迭代次数满足预设迭代次数的情况下，停止迭代更新所述对抗样本，并获取每次迭代更新过程中的梯度值和离散化梯度值；

基于每次迭代更新过程中的梯度值和离散化梯度值，确定第二对抗扰动信息；

基于所述第二对抗扰动信息对所述训练样本进行扰动调整，得到所述训练样本对应的对抗样本。

根据本发明提供的一种人脸识别模型训练方法，基于每次迭代更新过程中的梯度值和离散化梯度值，确定第二对抗扰动信息，包括：

根据每次迭代更新过程中的离散化梯度值，确定迭代更新对抗扰动；

根据每次迭代更新过程中的所述梯度值，确定迭代更新梯度值总和，并基于所述迭代更新梯度值总和，计算迭代更新离散化梯度值；

基于所述迭代更新离散化梯度值和所述迭代更新对抗扰动，确定第二对抗扰动信息。

根据本发明提供的一种人脸识别模型训练方法，所述迭代更新对抗扰动的确定方法，具体为：

其中，为每次迭代过程中获取的离散化梯度值，/>为迭代次数，/>为迭代更新对抗扰动，/>为预设迭代次数。

根据本发明提供的一种人脸识别模型训练方法，所述迭代更新梯度值总和的计算方法，具体为：

其中，为每次迭代过程中获取的梯度值，/>为迭代次数，/>为预设迭代次数，/>为迭代更新梯度值总和。

根据本发明提供的一种人脸识别模型训练方法，所述第二对抗扰动信息的计算方法，具体为：

其中，代表取最小值，/>为迭代更新对抗扰动，/>为迭代更新离散化梯度值。

根据本发明提供的一种人脸识别模型训练方法，所述对抗样本的计算方法，具体为：

其中，代表限制数值范围在/>之间，/>为归一化的训练样本，为第二对抗扰动信息。

根据本发明提供的一种人脸识别模型训练方法，基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练，在满足预设训练条件的情况下，得到训练好的人脸识别模型，包括：

对于任意一个所述训练样本，将所述训练样本输入到预设神经网络模型，输出所述训练样本对应的第一预测身份信息；

将所述训练样本对应的对抗样本输入到所述预设神经网络模型，输出所述对抗样本对应的第二预测身份信息；

利用预设损失函数根据所述第一预测身份信息和所述训练样本携带的所述身份标签，计算第一损失值，并基于所述第二预测身份信息和所述对抗样本携带的所述身份标签，计算第二损失值；

基于所述第一损失值和所述第二损失值，确定整体损失值，并根据所述整体损失值，利用随机梯度下降算法更新模型参数；

在所述整体损失值小于预设损失阈值的情况下，满足预设训练条件，得到训练好的人脸识别模型。

根据本发明提供的一种人脸识别模型训练方法，所述基于所述第一损失值和所述第二损失值，确定整体损失值，包括：

获取所述第一损失值的第一损失系数，并基于所述第一损失系数确定所述第二损失值的第二损失系数；

基于所述第一损失值和所述第一损失系数的乘积，以及所述第二损失值和所述第二损失系数的乘积，确定整体损失值。

根据本发明提供的一种人脸识别模型训练方法，所述获取训练样本集，包括：

获取多张来自不同身份个体的人脸图像训练样本，并获取各个所述人脸图像训练样本对应的身份标签；其中，所述人脸图像训练样本为三通道的彩色人脸图像；

对所述人脸图像训练样本进行人脸图像对齐算法处理，得到携带有身份标签的人脸图像训练样本；

基于至少一个所述人脸图像训练样本，构建所述训练样本集。

根据本发明提供的一种人脸识别模型训练方法，所述预设神经网络模型的主干网络包括五个卷积层和第一全连接层；所述预设神经网络模型还包括第二全连接层和损失函数层；

其中，所述第二全连接层分别与所述主干网络中的所述第一全连接层和所述损失函数层连接。

根据本发明提供的一种人脸识别模型训练方法，在所述基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练的步骤之前，还包括：

获取大尺度人脸图像训练样本数据集合，其中，所述大尺度人脸图像训练样本数据集合包括至少一个人脸图像训练样本，所述人脸图像训练样本携带有身份标签；所述大尺度人脸图像训练样本数据集合的人脸图像训练样本数量远超所述训练样本中的人脸图像训练样本的数量；

基于所述大尺度人脸图像训练样本数据集合对初始神经网络模型的权重参数进行调整，得到模型调整后的初始神经网络模型；

基于所述模型调整后的初始神经网络模型的权重参数初始化所述预设神经网络模型的主干网络，同时随机初始化所述预设神经网络模型的其它网络层。

根据本发明提供的一种人脸识别模型训练方法，基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练，在满足预设训练条件的情况下，得到训练好的人脸识别模型的步骤之后，还包括：

将待识别人脸图像输入到所述训练好的人脸识别模型，得到所述待识别人脸图像的至少一个人脸图像特征；

将所述人脸图像特征与预设人脸图像库中的各个预设人脸图像特征进行对比，获取所述人脸图像特征与各个所述预设人脸图像特征之间的相似度；其中，所述预设人脸图像库中的每个预设人脸图像均对应有一个身份信息；

将各个所述预设人脸图像中的目标预设人脸图像对应的身份信息作为所述待识别人脸图像对应的身份信息，其中，所述目标预设人脸图像为与所述人脸图像特征的相似度最高的预设人脸图像。

根据本发明提供的一种人脸识别模型训练方法，将所述人脸图像特征与预设人脸图像库中的各个预设人脸图像特征进行对比，获取所述人脸图像特征与各个所述预设人脸图像特征之间的相似度，包括：

根据所述至少一个人脸图像特征的均值和所述预设人脸图像库中每个身份信息对应的各个预设人脸图像特征均值的余弦相似度，确定所述人脸图像特征与各个所述预设人脸图像特征之间的相似度。

本发明还提供一种人脸识别模型训练装置，包括：

获取模块，用于获取训练样本集，其中，所述训练样本集中包括至少一个训练样本，所述训练样本为携带有身份标签的人脸图像训练样本；

第一计算模块，用于对于所述训练样本集中的任一训练样本，将归一化的所述训练样本输入到预设神经网络模型，利用神经网络前向传播算法，计算第一损失值；

第二计算模块，用于基于所述第一损失值，计算所述训练样本的梯度值，并根据所述训练样本的梯度值中全部数值绝对值的平均值，以及预设对抗强度信息计算所述训练样本的离散化梯度值；确定模块，用于基于所述训练样本的离散化梯度值，确定所述训练样本对应的对抗样本，所述对抗样本携带有对应训练样本的所述身份标签；

训练模块，用于基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练，在满足预设训练条件的情况下，得到训练好的人脸识别模型；

根据本发明提供的一种人脸识别模型训练装置，所述装置还用于：

所述预设神经网络模型的主干网络包括五个卷积层和第一全连接层；所述预设神经网络模型还包括第二全连接层和损失函数层；

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述人脸识别模型训练方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述人脸识别模型训练方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述人脸识别模型训练方法。

本发明提供的人脸识别模型训练方法、装置、电子设备及存储介质，通过在训练的过程中，通过训练样本，利用离散化的梯度值和预设的对抗强度值生成对抗扰动，然后将对抗扰动叠加到原始样本上生成对抗样本。采用多个离散化值可以确保对抗扰动方向与梯度向量方向接近，从而针对性的生成高质量的对抗样本，并且将对抗样本也加入到人脸识别模型训练过程中，从而有效增强模型的对抗鲁棒性，提高人脸识别模型的安全性。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例中所描述的人脸识别模型训练方法流程示意图；

图2为本申请实施例提供的网络结构示意图；

图3为本申请实施例提供的人脸识别模型训练装置结构示意图；

图4为本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本申请实施例中所描述的人脸识别模型训练方法流程示意图，如图1所示，包括：

步骤110，获取训练样本集，其中，所述训练样本集中包括至少一个训练样本，所述训练样本为携带有身份标签的人脸图像训练样本；

在本申请实施例中，训练样本中包括多个训练样本，每个训练样本均为一个携带有身份标签的人脸图像训练样本。

在本申请实施例中，身份标签具体可以是指表明用户身份标识的信息，例如用户的ID信息等。

在本申请实施例中，人脸图像训练样本具体可以是包含有人脸区域的图像样本，人脸图像训练样本可以是固定尺寸的三通道（R、G、B三个通道）的彩色图像。

本申请实施例中，人脸图像训练样本可以具备足够的深度和广度，其中：深度是指每个人（每个ID，ID是Identification的缩写）的人脸图像数（人脸图像越多越好，而且这些图像应当来自于多种场景，包含光照变化、人脸姿态变化、年龄变化等因素）；广度是指训练集包含的人数（人数越多越好，应当包含不同人种、不同性别、不同肤色等）。一般情况，当人脸训练集包含更多的训练数据的时候，利用本发明提出的方法训练得到的人脸识别模型的识别精度更高。

在一个可选地实施例中，训练样本为携带有身份标签的人脸图像训练样本具体是用于标示该人脸图像训练样本那个人脸对应的用户的身份信息的标识。

在本申请实施例中，人脸图像训练样本可以经过扩展来适应输入图像尺寸的变化。当输入图像是单通道的灰度图像或者其他形式的图像，本发明也可以进行扩展来适应输入图像的变化。

步骤120，对于所述训练样本集中的任一训练样本，将归一化的所述训练样本输入到预设神经网络模型，利用神经网络前向传播算法，计算第一损失值；

步骤130，基于所述第一损失值，计算所述训练样本的梯度值，并根据所述训练样本的梯度值中全部数值绝对值的平均值，以及预设对抗强度信息计算所述训练样本的离散化梯度值；在本申请实施例中，归一化处理具体可以是指假设一个RGB格式的人脸图像训练样本的任意一个像素的三个通道值为(r,g,b），三个通道的数值范围是[0,255],那么归一化值为，最终得到归一化的训练样本。

本申请实施例中所描述的预设对抗强度信息可以根据用户的需求和模型的安全性要求自行设定或者调整，例如其可以是0.1或者0.05。

在本申请实施例中，可以将归一化的训练样本和对应的身份标签/> 输入到预设神经网络模型/>中，利用神经网络前向传播算法计算损失值/>。

在本申请实施例中，利用神经网络反向传播算法计算第一损失值关于归一化的训练样本 /> 的梯度，公式如下：

在本申请实施例中，计算离散化梯度值时,假设/>是/>中的一个元素，是/> 对应的离散化的值，那么

在本申请实施例中，将梯度值量化为5个离散值，这是一种示例性的选择，本发明应用范围不仅是5个离散值，也可以更多离散值或更少离散值。此外，本实例以梯度的平均值作为量化区间的参考值也是一种示例性的选择，一些其他示例包括：选择中值作为参考或依据梯度的数据分布选择更精细的参考值。本发明认为零值附近的梯度值是噪声，因此，本实施例将零值附近的数值全部量化为零，这样可以消除噪声影响。

在另一个可选地实施例中，可以使用多个离散值代替简单的取数值的符号值(正数取+1，负数取-1，再乘以一个对抗强度值)，这样可以更加精细的量化梯度。这些策略可以避免对抗扰动的方向严重偏离梯度方向，避免产生误差。

在本申请实施例中，计算训练样本的离散化梯度值是对模型在训练过程中的梯度进行处理的一种方式。梯度表示了模型在参数空间中的变化率，离散化梯度值可能涉及到对梯度进行量化或离散化处理，使其变为离散的值而不是连续的值。

步骤140，基于所述训练样本的离散化梯度值，确定所述训练样本对应的对抗样本，所述对抗样本携带有对应训练样本的所述身份标签；

在本申请实施例中，在深度学习中，对抗样本是指经过人为干扰或者修改的输入样本，其目的是使得模型产生错误的预测结果。而身份标签则代表了样本的真实标签或类别。因此，通过训练样本的离散化梯度值来生成对抗样本，并且保证对抗样本在模型的预测下依然被归类到原始训练样本所对应的类别。

步骤150，基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练，在满足预设训练条件的情况下，得到训练好的人脸识别模型；

在本申请实施例中，预设神经网络模型具体可以是指采用ResNet50作为主干网络，并增加若干层网络作为辅助网络。具体可以是额外添加一个全连接层和一个损失函数层。

虽然本发明提供的示例采用ResNet50作为主干网络，但是本发明并不受限于具体的网络结构，例如：为了训练出更高精度的人脸识别模型，本发明可以采用更高计算量的神经网络（例如：ResNet100、 ResNet200等）作为主干网络；为了训练出适用于边缘设备的人脸识别模型，本发明可以采用ResNet18或者MobileNet等较低计算量的神经网络作为主干网络结构。

在本申请实施例中，每次通过一个训练样本来对预设神经网络模型进行训练时，均可以通过上述对抗样本的生成方法，生成一个对抗样本，从而通过训练样本和对抗样本来一起对预设神经网络模型进行训练。

在一个可选地实施例中，通过对抗样本生成算法利用每个原始样本作为输入生成一个对应的对抗样本。需要注意的是：这个一对一的设定不是必须的设置。本发明也可以使用一个批次的部分（而非全部）原始样本作为输入生成对应的对抗样本。

在本申请实施例中，可以使用训练数据集和对应的对抗样本，对预设的神经网络模型进行训练。训练过程中，使用身份标签作为监督信号，通过最小化损失函数来优化模型参数。

本申请实施例中所描述的预设训练条件具体可以是指满足预设训练次数，或者满足预设训练时间，还可以是损失函数收敛。

在本申请实施例中，在满足预设训练条件的情况下，则说明完成对于预设神经网络模型的训练，会得到训练好的人脸识别模型。

在本申请实施例中，使用训练好的人脸识别模型，输入待识别的人脸图像，通过模型的输出得到对应的身份信息，即训练好的人脸识别模型能够有效实现对于人脸图像身份信息的识别。

在本申请实施例中，通过在训练的过程中，通过训练样本，利用离散化的梯度值和预设的对抗强度值生成对抗扰动，然后将对抗扰动叠加到原始样本上生成对抗样本。采用多个离散化值可以确保对抗扰动方向与梯度向量方向接近，从而针对性的生成高质量的对抗样本，并且将对抗样本也加入到人脸识别模型训练过程中，从而有效增强模型的对抗鲁棒性，提高人脸识别模型的安全性。

可选地，基于所述训练样本的离散化梯度值，确定所述训练样本对应的对抗样本，包括：

在本申请实施例中，可以将离散化的梯度值作为第一对抗扰动信息，然后根据第一对抗扰动信息对所述训练样本进行扰动调整。

在本申请实施例中，对抗样本的计算方法，具体为：

其中，代表限制数值范围在/>之间。/>为归一化的训练样本，为第一对抗扰动信息，即离散化梯度值。

在一个可选地实施例中，由于对于训练样本中每个像素三通道的每个通道都进行归一化，因此，本申请中生成对抗样本具体可以是针对于每个像素的每个通道添加第一对抗扰动信息，最终得到对抗样本。

可选地，基于所述第一对抗扰动信息对所述训练样本进行扰动调整，得到所述训练样本对应的对抗样本的步骤之后，所述方法包括：

在本申请实施例中，在第一次生成对抗样本后，考虑到其可能反映的扰动情况不够充分，因此还可以不断迭代更新生成对抗样本。

在第一次生成对抗样本后，每一次迭代更新的过程，具体可以是将生成的对抗样本重新作为训练样本，然后重新根据上述方式计算梯度值和离散化梯度值，进而得到新的对抗样本。

在每次得到对抗样本，将对抗样本重新作为训练样本进行迭代更新的时候，更新一次迭代的次数。

在本申请实施例中，可以预先设置一个预设迭代次数，例如20次或者15次，在当前的迭代次数并未满足预设迭代次数的情况下，会不断将对抗样本重新作为迭代训练样本，然后通过上述方式基于迭代训练样本来迭代更新对抗样本。

在当前的迭代次数满足预设迭代次数的情况下，则会停止迭代更新对抗样本。

在本申请实施例中，每次迭代更新的过程中，均会计算此次迭代过程中的梯度值和离散化梯度值，并且会进一步记录每次迭代更新过程中的梯度值和离散化梯度值。

并且，进一步根据每次迭代更新过程中的离散化梯度值，确定迭代更新对抗扰动。

所述迭代更新对抗扰动的确定方法，具体为：

根据每次迭代更新过程中的所述梯度值，确定迭代更新梯度值总和。

迭代更新梯度值总和的计算方法，具体为：

基于所述迭代更新梯度值总和，计算迭代更新离散化梯度值。

其中，为迭代更新离散化梯度值，/>为迭代更新梯度值总和。

第二对抗扰动信息的计算方法，具体为：

其中，代表取最小值，/>为迭代更新对抗扰动，/>为迭代更新离散化梯度值。选择对应的最小值是为了限制较大的奇异值，减少对抗扰动的估计偏差，抑制量化误差的累积。

对抗样本的计算方法，具体为：

在本申请实施例中，利用原始梯度累加值平滑对抗扰动的更新方向，可以抑制量化误差累积。此外，利用离散化的梯度值生成对抗扰动，可以确保对抗扰动与梯度向量方向接近。上述两个技术改进可以确保对抗扰动的更新方向与神经网络的梯度向量方向基本保持一致，从而获得更高质量的对抗样本。

可选地，基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练，在满足预设训练条件的情况下，得到训练好的人脸识别模型，包括：

在本申请实施例中，预设损失函数具体可以为：

其中，表示整体损失值；/>表示在一个批次上的非对抗样本的第一损失值；表示在一个批次上的对抗样本的第二损失值；/>是第一损失系数，/>。其中，非对抗样本是取自训练集/>的原始样本。

在本申请实施例中，计算第一损失值所用的预设损失值函数可以是采用ArcFace损失函数，本发明也可以采用其他损失函数，例如：CosFace损失函数等。本实施例的ArcFace损失函数定义如下：

其中，符号代表使用/>个训练样本计算出来的损失值；符号/>代表第/>个训练样本的特征（人脸识别模型的FC1层输出的512维特征）；符号/>代表一个批次样本总数，例如：=512；符号/>表示放缩因子（scale factor），在本实施例中/>=64。符号/>是第/>个训练样本对应的身份标签。/>是第/>个输入人脸图像的特征/>到对应类/>的类中心/>的角度距离；/>是第/>个输入人脸图像的特征/>到类/>的类中心/>的角度距离；/>是超参数，用于惩罚第/>个输入人脸图像的特征/>到对应类/>的类中心/>的角度距离，/>=0.3；/>代表训练集合的身份信息总数；/>代表类/>的特征中心；/>代表类/>的特征中心；/>代表向量转置；/>代表范数。

在另一个可选地实施例中，计算第二损失值的损失函数也可以是采用ArcFace损失函数，损失函数定义如下：

其中，符号代表使用/>个对抗样本计算出来的损失值；符号/>代表第/>个对抗样本的特征（人脸识别模型的FC1层输出的512维特征）；符号/>代表样本总数；其他符号的定义与/>的定义中的符号意义相同。

可选地，获取所述第一损失值的第一损失系数，并基于所述第一损失系数确定所述第二损失值的第二损失系数；

在本申请实施例中，第一损失值具体可以是用户预先设置的数值，本申请实施例中所描述的第二损失值具体可以是（1-/>）。

整体损失值具体为：。

在本申请实施例中，可以采用随机梯度下降方法训练预设神经网络模型。在梯度更新迭代过程中，每次迭代更新使用512个训练样本（样本数K=512），这512个训练样本也被称作一个批次（batch）数据。依据GPU卡（Graphics Processing Unit）的显存限制，每次迭代更新也可以使用128个训练样本或者256个训练样本等。本发明不局限于具体的梯度下降算法，既可以使用SGD，也可以使用SGD算法的一些变种，如：Adam，AdaGrad等梯度下降算法。

在本申请实施例中，整体损失值小于预设损失阈值的情况下说明模型收敛，可以停止进行训练，训练好的人脸识别模型。

在另一个可选地实施例中，在满足预设训练次数或者满足预设训练时长的情况下，也可以认为满足预设训练条件，停止训练，得到训练好的人脸识别模型。

可选地，所述获取训练样本集，包括：

在本申请实施例中，可以通过各种方式收集来自不同身份个体的人脸图像，例如使用摄像头拍摄或从互联网上下载。确保收集到的人脸图像具有一定的多样性，以便模型可以学习到不同的身份特征。

对于每个人脸图像训练样本，可以手动标注其对应的身份标签。这可以通过在图像文件名中添加身份信息或者创建一个包含图像文件名和身份信息的标注表格来完成。

为了确保数据集质量，可以进一步确定每个人脸图像训练样本的身份标签是否正确，并排除任何可能导致人脸识别模型训练偏差的噪声或异常数据。

如果人脸图像训练样本不是三通道的彩色图像，您需要将其转换为三通道彩色图像。这可以通过使用图像处理库（如OpenCV）中提供的函数来完成。

在一个可选地实施例中，使用的训练数据集中的人脸图像按照个体身份（ID）进行分组（也就是说一个人的人脸图像被分到同一组），然后给每组（每个人）一个类别标签（类标）。假设数据集中包含C个人，一种简单的类别标签分配方法是从0到C-1；也可以采用其他类别标签分配方式，本发明不限制标签的分配方式。为了训练出高精度的人脸识别系统，本发明建议训练样本集合中可以包含1万个人的人脸图像，每个人的人脸图像数的平均值不少于20张。

在本申请实施例中，人脸图像训练样本具体可以是指固定尺寸的三通道（R、G、B三个通道）的彩色图像。

在一个可选地实施例中，每个人脸图像训练样本的尺寸为112112/>3像素，其中第一个“112”表示图像的宽度，第二个“112”表示图像的高度，“3”表示3个通道。

人脸图像训练样本是经过人脸对齐算法处理的归一化人脸图像。当输入图像的尺寸不是112112/>3像素，本发明可以进行扩展来适应输入图像尺寸的变化。当输入图像是单通道的灰度图像或者其他形式的图像，本发明也可以进行扩展来适应输入图像的变化。

可选地，所述预设神经网络模型的主干网络包括五个卷积层和第一全连接层；所述预设神经网络模型还包括第二全连接层和损失函数层；

在本申请实施例中，预设神经网络模型可以采用ResNet50作为主干网络，并增加若干层网络作为辅助网络。

图2为本申请实施例提供的网络结构示意图，如图2所示，包括：ResNet50的前5组卷积conv1，conv2_x，conv3_x，conv4_x，conv5_x和新增加的FC1（Fully-connected layer，第一个全连接层）,新增加的FC2（Fully-connected layer，第二个全连接层）和损失函数层，FC1层的输入是conv5_x层的输出特征，FC1层的输出是512维特征（本发明采用512维特征作为示例）。FC2层的输入是FC1层的输出特征（512维特征），FC2层的输出特征的维数和训练集中的类别数（ID数）相同，一个维度对应一个类别。conv1是7x7卷积层，卷积步长是2（实际上，conv1是7x7x3的卷积，其中3表示conv1的输入通道数是3个通道。

在本发明中，conv1层采用3x3卷积层，卷积步长是1。为了叙述方便，本发明定义预设神经网络模型的主干网络（人脸图像特征提取网络）包括： ResNet50的前5组卷积conv1，conv2_x，conv3_x，conv4_x，conv5_x和FC1（Fully-connected layer，第一个全连接层）。FC1层输出的512维特征也被称作特征嵌入（feature embedding）,特征嵌入可以用于人脸检索系统的人脸图像的特征比对。

本发明的预设神经网络模型输出512维特征向量，这是一种优选设置。依据具体的应用，人脸识别模型输出的特征向量的维度也可以被设置为128维、256维或1024维等。

可选地，在所述基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练的步骤之前，还包括：

在本申请实施例中，可以利用大尺度图像分类数据集合训练模型参数，这个过程称作模型预训练；然后，利用目标任务的训练数据集微调所述预训练模型的参数，使得模型参数适应目标任务。

在本申请实施例中，可以首先利用ResNet50作为主干网络构建一个图像分类神经网络；然后，利用大尺度人脸图像训练样本数据集合（该数据集的图像总数应该显著超过人脸识别训练集的图像总数）训练所述图像分类神经网络，获得ResNet50的权重参数；最后，利用所述预训练的ResNet50的权重参数初始化预设神经网络模型的主干网络，同时随机预设神经网络模型的其他网络层。

在一个可选地实施例中，本发明将预设神经网络模型公式化为

其中，表示神经网络的参数，/>表示神经网络基本运算，例如：卷积层运算、池化层运算、全连接层运算和激活运算函数等,/>代表神经网络总层数（神经网络的深度）。

在本申请实施例中，通过上述神经网络模型的结构，可以有效保证后续人脸识别模型训练的顺利进行，提升模型识别率。

可选地，基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练，在满足预设训练条件的情况下，得到训练好的人脸识别模型的步骤之后，还包括：

在本申请实施例中，预设人脸图像库具体可以是指人脸的特征库，其中的每个人脸的特征是利用本发明训练的人脸识别模型的主干网络提取的特征，待查询库包含至少一个人的人脸图像特征，每个人至少有一个人脸图像特征。

在一个可选地实施例中，每个人脸图像特征可以包含一个权重系数，所述的权重系数指示对应的人脸图像特征的重要性。所述的权重系数可以是人脸检测器输出的检测分数、可以是人脸模糊程度的分数、可以是人脸被遮挡程度的分数等。

在本申请实施例中，将待识别人脸图像输入到所述训练好的人脸识别模型，会得到待识别人脸图像的至少一个人脸图像特征。此时的人脸图像特征具体可以是人脸识别模型的中间参数。

将所述输入的一张或者多张人脸图像的一个或者多个特征与所述待查询人脸库的特征进行比对，获得所述输入的一张或者多张人脸图像的一个或者多个特征与所述待查询人脸库的人脸特征之间的相似度。

可选地，将所述人脸图像特征与预设人脸图像库中的各个预设人脸图像特征进行对比，获取所述人脸图像特征与各个所述预设人脸图像特征之间的相似度，包括：

在本申请和四十里中，相似度是所述输入的一张或者多张人脸图像的一个或者多个特征的均值与所述待查询人脸库的每个人的一个或者多个特征的均值之间的余弦相似度。上述一个或者多个特征的均值可以是一个或者多个特征的平均值、也可以是一个或者多个特征的加权平均值。

此外，所述相似度还可以是所述输入的一张或者多张人脸图像的一个或者多个特征中重要度值最高的特征与所述待查询人脸库的每个人的一个或者多个特征中重要度值最高的特征之间的余弦相似度。在计算所述相似度的时候，也可以依据重要度分数将低重要度的人脸特征排除在外。

在本申请实施例中，可以依据相似度的比较，输出与所述输入人脸图像相似度最高的人脸数据库中的人脸的身份信息，作为输出结果。

在一个可选地实施例中，设定训练集；初始训练周期/>=0，训练总周期/>=20；随机梯度下降方法相关参数设置为：初始学习率是/>=0.1，动量系数/>=0.9，权重衰减系数为/>=0.005，在第10个训练周期学习率下降到/>=0.01，在第15个训练周期学习率下降到/>=0.001，在第18个训练周期学习率下降到/>=0.0001。一个批次的样本总数是512。默认地，训练样本被输入到神经网络的时候包含数值归一化。

训练输出：网络模型（模型的参数为θ）

损失函数：，/>是一个批次原始样本的损失值，/>是一个批次对抗样本的损失值，/>是系数，设置/>=0.5。

Step1: (开始训练)利用随机初始化方法初始化网络模型的可学习参数；

Step2: 当的时候，执行下列操作：

a）将数据集合的样本顺序随机打乱；

b）从数据集合挑选一个批次的训练样本；

c）根据上述训练样本，计算一个批次原始样本的损失值；

d）根据上述训练样本, 利用上述算法1（基本对抗样本生成方法）或算法2（迭代对抗样本生成方法）生成对抗样本；

e) 根据上述对抗样本, 计算一个批次对抗样本的损失值；/>

f) 根据一个批次原始样本的损失值和一个批次对抗样本的损失值/>计算总损失值/>；

g) 根据总损失值，利用随机梯度下降算法更新模型参数；

h）结束当前训练周期，更新；

Step3: 结束训练,输出人脸识别模型。

在本申请实施例中，利用离散化的梯度值生成对抗扰动，可以确保对抗扰动与梯度向量方向接近。上述两个技术改进可以确保对抗扰动的更新方向与神经网络的梯度向量方向基本保持一致，从而获得更高质量的对抗样本，将上述高质量的对抗样本加入到对抗训练中，本发明可以提升模型的对抗鲁棒性。

下面对本发明提供的人脸识别模型训练装置进行描述，下文描述的人脸识别模型训练装置与上文描述的人脸识别模型训练方法可相互对应参照。

图3为本申请实施例提供的人脸识别模型训练装置结构示意图，如图3所示，包括：

获取模块310用于获取训练样本集，其中，所述训练样本集中包括至少一个训练样本，所述训练样本为携带有身份标签的人脸图像训练样本；

第一计算模块320用于对于所述训练样本集中的任一训练样本，将归一化的所述训练样本输入到预设神经网络模型，利用神经网络前向传播算法，计算第一损失值；

第二计算模块330用于基于所述第一损失值，计算所述训练样本的梯度值，并根据所述训练样本的梯度值中全部数值绝对值的平均值，以及预设对抗强度信息计算所述训练样本的离散化梯度值；

确定模块340用于基于所述训练样本的离散化梯度值，确定所述训练样本对应的对抗样本，所述对抗样本携带有对应训练样本的所述身份标签；

训练模块350用于基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练，在满足预设训练条件的情况下，得到训练好的人脸识别模型；

图4为本发明提供的电子设备的结构示意图，如图4所示，该电子设备可以包括：处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440，其中，处理器410，通信接口420，存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令，以执行人脸识别模型训练方法，该方法包括：获取训练样本集，其中，所述训练样本集中包括至少一个训练样本，所述训练样本为携带有身份标签的人脸图像训练样本；

基于所述第一损失值，计算所述训练样本的梯度值，并根据所述训练样本的梯度值中全部数值绝对值的平均值，以及预设对抗强度信息计算所述训练样本的离散化梯度值；

基于所述训练样本的离散化梯度值，确定所述训练样本对应的对抗样本，所述对抗样本携带有对应训练样本的所述身份标签；

此外，上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的人脸识别模型训练方法，该方法包括：获取训练样本集，其中，所述训练样本集中包括至少一个训练样本，所述训练样本为携带有身份标签的人脸图像训练样本；

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的人脸识别模型训练方法，该方法包括：获取训练样本集，其中，所述训练样本集中包括至少一个训练样本，所述训练样本为携带有身份标签的人脸图像训练样本；

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种人脸识别模型训练方法，其特征在于，包括：

其中，所述训练好的人脸识别模型用于在输入待识别人脸图像的情况下，输出所述待识别人脸图像对应的身份信息；

其中，基于所述训练样本的离散化梯度值，确定所述训练样本对应的对抗样本，包括：

基于所述第一对抗扰动信息对所述训练样本进行扰动调整，得到所述训练样本对应的对抗样本；

基于所述第一对抗扰动信息对所述训练样本进行扰动调整，得到所述训练样本对应的对抗样本的步骤之后，所述方法包括：

基于所述第二对抗扰动信息对所述训练样本进行扰动调整，得到所述训练样本对应的对抗样本；

其中，所述训练样本的离散化梯度值的计算方法，具体为：

；

其中，为训练样本的梯度值，/>是/>中的一个元素，/>是/> 对应的离散化的值，即离散化梯度值，/>为训练样本的梯度值中全部数值绝对值的平均值；

其中，基于每次迭代更新过程中的梯度值和离散化梯度值，确定第二对抗扰动信息，包括：

基于所述迭代更新离散化梯度值和所述迭代更新对抗扰动，确定第二对抗扰动信息；

其中，所述迭代更新对抗扰动的确定方法，具体为：

；

其中，为每次迭代过程中获取的离散化梯度值，/>为迭代次数，/>为迭代更新对抗扰动，/>为预设迭代次数；

其中，所述迭代更新梯度值总和的计算方法，具体为：

；

其中，为每次迭代过程中获取的梯度值，/>为迭代次数，为预设迭代次数，/>为迭代更新梯度值总和；

其中，所述第二对抗扰动信息的计算方法，具体为：

；

其中，代表取最小值，/>为迭代更新对抗扰动，/>为迭代更新离散化梯度值；

其中，所述对抗样本的计算方法，具体为：

；

其中，代表限制数值范围在/>之间，/>为归一化的训练样本，/>为第二对抗扰动信息；

其中，所述对抗样本的计算方法，具体为：

；

其中，代表限制数值范围在/>之间，/>为归一化的训练样本，为训练样本的离散化梯度值，即第一对抗扰动信息。

2.根据权利要求1所述的人脸识别模型训练方法，其特征在于，基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练，在满足预设训练条件的情况下，得到训练好的人脸识别模型，包括：

3.根据权利要求2所述的人脸识别模型训练方法，其特征在于，所述基于所述第一损失值和所述第二损失值，确定整体损失值，包括：

4.根据权利要求2所述的人脸识别模型训练方法，其特征在于，所述获取训练样本集，包括：

5.根据权利要求4所述的人脸识别模型训练方法，其特征在于，所述预设神经网络模型的主干网络包括五个卷积层和第一全连接层；所述预设神经网络模型还包括第二全连接层和损失函数层；

6.根据权利要求5所述的人脸识别模型训练方法，其特征在于，在所述基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练的步骤之前，还包括：

7.根据权利要求1所述的人脸识别模型训练方法，其特征在于，基于各个所述训练样本和所述训练样本对应的对抗样本，对预设神经网络模型进行训练，在满足预设训练条件的情况下，得到训练好的人脸识别模型的步骤之后，还包括：

8.根据权利要求7所述的人脸识别模型训练方法，其特征在于，将所述人脸图像特征与预设人脸图像库中的各个预设人脸图像特征进行对比，获取所述人脸图像特征与各个所述预设人脸图像特征之间的相似度，包括：

9.一种人脸识别模型训练装置，其特征在于，包括：

第二计算模块，用于基于所述第一损失值，计算所述训练样本的梯度值，并根据所述训练样本的梯度值中全部数值绝对值的平均值，以及预设对抗强度信息计算所述训练样本的离散化梯度值；

确定模块，用于基于所述训练样本的离散化梯度值，确定所述训练样本对应的对抗样本，所述对抗样本携带有对应训练样本的所述身份标签；

其中，所述装置还用于：

其中，所述训练样本的离散化梯度值的计算方法，具体为：

；

其中，为训练样本的梯度值，/>是/>中的一个元素，/>是/>对应的离散化的值，即离散化梯度值，/>为训练样本的梯度值中全部数值绝对值的平均值；

其中，所述迭代更新对抗扰动的确定方法，具体为：

；

其中，为每次迭代过程中获取的离散化梯度值，/>为迭代次数，为迭代更新对抗扰动，/>为预设迭代次数；

其中，所述迭代更新梯度值总和的计算方法，具体为：

；

其中，为每次迭代过程中获取的梯度值，/>为迭代次数，/>为预设迭代次数，/>为迭代更新梯度值总和；

其中，所述第二对抗扰动信息的计算方法，具体为：

；

其中，代表取最小值，/>为迭代更新对抗扰动，/>为迭代更新离散化梯度值;

其中，所述对抗样本的计算方法，具体为：

；

其中，所述对抗样本的计算方法，具体为：

；

其中，代表限制数值范围在/>之间，/>为归一化的训练样本，/>为训练样本的离散化梯度值，即第一对抗扰动信息。

10.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至9任一项所述人脸识别模型训练方法。

11.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至9任一项所述人脸识别模型训练方法。