CN114842541A

CN114842541A - 模型的训练及人脸识别方法、装置、设备以及存储介质

Info

Publication number: CN114842541A
Application number: CN202210602215.5A
Authority: CN
Inventors: 张玉立
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-05-30
Filing date: 2022-05-30
Publication date: 2022-08-02

Abstract

本公开提供了一种模型的训练及人脸识别方法、装置、设备以及存储介质，涉及人工智能技术领域，尤其涉及深度学习、图像处理、计算机视觉等技术领域。具体实现方案为：利用识别模型的特征提取网络，提取样本人脸图像的图像特征；利用第一特征解耦网络，将图像特征与第一分离参数相乘，得到图像特征中的标识特征；利用第二特征解耦网络，将图像特征与第二分离参数相乘，得到图像特征中的非标识特征；利用第一分类网络，识别标识特征，得到第一识别结果；利用第二分类网络，识别非标识特征，得到第二识别结果；基于第一识别结果和第二识别结果，对识别模型进行训练。本公开使得训练得到用于人脸识别的识别模型更加简单、灵活。

Description

模型的训练及人脸识别方法、装置、设备以及存储介质

技术领域

本公开涉及人工智能技术领域，尤其涉及深度学习、图像处理、计算机视觉等技术领域。

背景技术

人脸识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术。例如，用摄像机或摄像头采集含有人脸的图像或视频流，进而对采集到的含有人脸的图像或视频流进行脸部识别的一系列相关技术，通常也叫做人像识别、面部识别。

发明内容

本公开提供了一种模型的训练及人脸识别方法、装置、设备以及存储介质。

根据本公开的第一方面，提供了一种用于人脸识别的模型的训练方法，包括：

获取多个样本人脸图像；

利用识别模型的特征提取网络，提取所述样本人脸图像的图像特征，所述识别模型包括：特征提取网络、第一特征解耦网络、第二特征解耦网络、第一分类网络、和第二分类网络；

利用所述第一特征解耦网络，将所述图像特征与第一分离参数相乘，得到所述图像特征中的标识特征；

利用所述第二特征解耦网络，将所述图像特征与第二分离参数相乘，得到所述图像特征中的非标识特征，其中，所述非标识特征是所述图像特征中除所述标识特征之外的特征；

利用所述第一分类网络，识别所述标识特征，得到第一识别结果；

利用所述第二分类网络，识别所述非标识特征，得到第二识别结果；

基于所述第一识别结果和所述第二识别结果，对所述识别模型进行训练。

根据本公开的第二方面，提供了一种人脸识别方法，包括：

获取待识别人脸图像，所述待识别人脸图像至少包括人脸；

利用识别模型的特征提取网络，提取所述待识别人脸图像的图像特征；所述识别模型包括：特征提取网络、第一特征解耦网络和第一分类网络；

利用所述第一特征解耦网络，将所述图像特征与第一分离参数相乘得到所述图像特征中的标识特征；

利用所述第一分类网络，识别所述标识特征，得到识别结果；

其中，所述识别模型通过上述第一方面任一项所述的训练方法训练得到。

根据本公开的第三方面，提供了一种用于人脸识别的模型的训练装置，包括：

获取模块，用于获取多个样本人脸图像；

特征提取模块，用于利用识别模型的特征提取网络，提取所述样本人脸图像的图像特征，所述识别模型包括：特征提取网络、第一特征解耦网络、第二特征解耦网络、第一分类网络、和第二分类网络；

特征解耦模块，用于利用所述第一特征解耦网络，将所述图像特征与第一分离参数相乘，得到所述图像特征中的标识特征；利用所述第二特征解耦网络，将所述图像特征与第二分离参数相乘，得到所述图像特征中的非标识特征，其中，所述非标识特征是所述图像特征中除所述标识特征之外的特征；

识别模块，用于利用所述第一分类网络，识别所述标识特征，得到第一识别结果；利用所述第二分类网络，识别所述非标识特征，得到第二识别结果；

训练模块，用于基于所述第一识别结果和所述第二识别结果，对所述识别模型进行训练。

根据本公开的第四方面，提供了一种人脸识别装置，包括：

获取模块，用于获取待识别人脸图像，所述待识别人脸图像至少包括人脸；

特征提取模块，用于利用识别模型的特征提取网络，提取所述待识别人脸图像的图像特征，所述识别模型包括：特征提取网络、第一特征解耦网络和第一分类网络；

特征解耦模块，用于利用所述第一特征解耦网络，将所述图像特征与第一分离参数相乘得到所述图像特征中的标识特征；

识别模块，用于利用所述第一分类网络，识别所述标识特征，得到识别结果；

其中，所述识别模型通过上述第三方面所述的训练装置训练得到。

根据本公开的第五方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面或第二方面所述的方法。

根据本公开的第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据第一方面或第二方面所述的方法。

根据本公开的第七方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据第一方面或第二方面所述的方法。

本公开中无需针对不同的场景分别训练不同的模型，进而也就无需针对不同的场景建立模型、标注数据等以训练模型，使得训练得到用于人脸识别的识别模型更加简单、灵活。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是本公开实施例提供的用于人脸识别的模型的训练方法的流程图；

图2是本公开实施例中识别模型的结构示意图；

图3是本公开实施例提供的人脸识别方法的流程图；

图4是本公开实施例提供的用于人脸识别的模型的训练装置的结构示意图；

图5是本公开实施例提供的人脸识别装置的结构示意图；

图6是用来实现本公开实施例的用于人脸识别的模型的训练方法或人脸识别方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

近年来，随着硬件资源等的发展，深度学习技术也得到了飞速发展，在很多领域相比传统算法都取得了不错的效果，特别是在计算机视觉领域，如目标检测，图像识别，图像增强等方向都取得了很大的成功。

人脸识别是计算机视觉领域一个重要的研究方向。随着神经网络技术的加入，人脸识别取得了一系列重大进展，目前的人脸识别方法已经超过了人类的识别能力，这使得大规模的应用成为了可能。

本公开实施例提供了一种用于人脸识别的模型的训练方法，可以包括：

获取多个样本人脸图像；

利用识别模型的特征提取网络，提取样本人脸图像的图像特征，识别模型包括：特征提取网络、第一特征解耦网络、第二特征解耦网络、第一分类网络、和第二分类网络；

利用第一特征解耦网络，将图像特征与第一分离参数相乘，得到图像特征中的标识特征；

利用第二特征解耦网络，将图像特征与第二分离参数相乘，得到图像特征中的非标识特征，其中，非标识特征是图像特征中除标识特征之外的特征；

利用第一分类网络，识别标识特征，得到第一识别结果；

利用第二分类网络，识别非标识特征，得到第二识别结果；

基于第一识别结果和第二识别结果，对识别模型进行训练。

本公开实施例中，利用识别模型的第一特征解耦网络，将利用特征提取网络提取的样本人脸图像的图像特征与第一分离参数相乘得到图像特征中的标识特征，利用第二特征解耦网络，将图像特征与第二分离参数相乘得到图像特征中的非标识特征，利用第一分类网络，识别标识特征，得到第一识别结果，利用第二分类网络，识别非标识特征，得到第二识别结果；基于第一识别结果和第二识别结果，对识别模型进行训练，即可得到用于人脸识别的识别模型，无需针对不同的场景分别训练不同的模型，进而也就无需针对不同的场景建立模型、标注数据等以训练模型，使得训练得到用于人脸识别的识别模型更加简单、灵活，也即更加方便地进行用于人脸识别的模型的训练。另外，避免针对不同场景训练不同的模型，能够降低计算资源等的消耗。

还有，本公开实施例可以训练得到能够利用识别模型的第一特征解耦网络和第二特征解耦网络，将图像特征分离得到标识特征和非标识特征，并利用标识特征进行人脸识别的识别模型，利用该识别模型可以针对任意场景的人脸图像进行识别，在识别过程中也不需要先确定待识别人脸图像的场景，再选择场景对应的模型进行识别，能够提高识别速度。且分离得到图像特征中的标识特征和非标识特征，在利用识别模型识别过程中，可以利用标识特征进行人脸识别，避免非标识特征对人脸识别准确度的影响，提高人脸识别的准确性。

另外，通过第一特征解耦网络，将图像特征与第一分离参数相乘得到图像特征中的标识特征，通过第二特征解耦网络将图像特征与第二分离参数相乘得到图像特征中的非标识特征，模型结构相对比较简单，降低了标识特征和非标识特征分离的复杂度，进而能够降低人脸识别的复杂度。

本公开实施例提供的用于人脸识别的模型的训练方法可以应用于电子设备，具体地，电子设备可以包括服务器、终端，等等。

本公开实施例提供的用于人脸识别的模型的训练方法可以应用于人脸识别场景。

图1是本公开实施例提供的用于人脸识别的模型的训练方法的流程图。参见图1，本公开实施例提供的用于人脸识别的模型的训练方法可以包括：

S101，获取多个样本人脸图像。

样本人脸图像包括人脸。

可以从开源的数据集中获取多个样本人脸图像，或者，也可以利用图像采集设备采集多个样本人脸图像。

S102，利用识别模型的特征提取网络，提取样本人脸图像的图像特征。

识别模型包括：特征提取网络、第一特征解耦网络、第二特征解耦网络、第一分类网络、和第二分类网络。

特征提取网络可以包括卷积神经网络(Convolutional Neural Networks，CNN)，如深度残差网络(Deep residual network,ResNet)，或者transformer(利用注意力机制来提高模型训练速度的模型)结构。

S103，利用第一特征解耦网络，将图像特征与第一分离参数相乘，得到图像特征中的标识特征。

S104，利用第二特征解耦网络，将图像特征与第二分离参数相乘，得到图像特征中的非标识特征。

其中，非标识特征是图像特征中除标识特征之外的特征。

标识特征可以理解为与人脸标识相关的特征，也可以称之为ID(标识)特征。

非标识特征可以理解为与人脸标识不相关的特征，例如，年龄、光线、遮挡等与人脸标识无关的一些信息。也可以称之为非ID特征。

简单理解，第一特征解耦网络和第二特征解耦网络可以称之为特征解耦模块，用于对样本人脸图像的图像特征进行分离，得到标识特征和非标识特征。

例如，第一分离参数为w，第二分离参数为1-w，即将图像特征与w相乘，得到图像特征中的标识特征，将图像特征与(1-w)相乘，得到图像特征中的非标识特征。一个例子中，w可以为一个矩阵，1-w可以表示针对w中的每一个矩阵元素，用1减去该矩阵元素，得到的新的矩阵。

第一特征解耦网络和第二特征解耦网络可以采用全连接结构。

S105，利用第一分类网络，识别标识特征，得到第一识别结果；利用第二分类网络，识别非标识特征，得到第二识别结果。

S106，基于第一识别结果和第二识别结果，对识别模型进行训练。

基于第一识别结果和第二识别结果，对识别模型的模型参数进行调整，得到调整后的模型参数，包括调整后的模型参数的识别模型即为训练得到的用于人脸识别的识别模型，也可以称之为训练好的识别模型。

针对一个样本人脸图像，将样本人脸图像输入识别模型，利用识别模型的特征提取网络，提取样本人脸图像的图像特征，利用第一特征解耦网络，将图像特征与第一分离参数相乘，得到图像特征中的标识特征；利用第二特征解耦网络，将图像特征与第二分离参数相乘，得到图像特征中的非标识特征；利用第一分类网络，识别标识特征，得到第一识别结果，并利用第二分类网络，识别非标识特征，得到第二识别结果，利用该第一识别结果和第二识别结果进行一次模型参数的调整，可以称之为一次迭代的过程，针对多个样本人脸图像分别执行该迭代过程，以对识别模型进行训练，得到用于人脸识别的识别模型。

一种可实现方式中，S106可以包括：

基于第一识别结果和第二识别结果，调整识别模型的模型参数，直至满足预定条件；

其中，预定条件包括：第一识别结果与样本人脸图像的人脸标识真值的差异满足第一预设条件，且第二识别结果满足第二预设条件。

训练好的识别模型包括调整后的模型参数。

获取多个样本人脸图像之后，可以通过人工或者自动标注的方式，对各个样本人脸图像的人脸标识真值进行标注，针对各个样本人脸图像，人脸标识真值用于表示该样本人脸图像的人脸标识，例如，“XX”的人脸，“XX”可以表示人的姓名，等等。

第一预设条件可以包括差异小于第一预设值，如小于0.1、0.01，等等。

第二预设条件可以包括第二识别结果与预设分类结果的差值小于第二预设值。

其中，第一预设值与第二预设值可以相同，也可以不同。

简单理解，调整模型参数，使得第一识别结果逼近人脸标识真值，第二识别结果逼近预设分类结果。

预设分类结果包括分类为各个类别的概率相同，例如，分类1000类，每类的概率为1/1000。

利用第二识别结果逼近分类为各个类别的概率相同的预设分类结果，即通过训练第二识别结果无法表示分类类别，即利用第二识别结果无法进行人脸识别，也即利用非标识特征无法进行人脸识别。

第一特征解耦网络和第一分类网络可以理解为标识特征分支；第二特征解耦网络和第二分类网络可以理解为非标识特征分支。

利用第一特征解耦网络，将图像特征与第一分离参数相乘，得到图像特征中的标识特征，利用第一分类网络，识别标识特征，得到第一识别结果，可以理解，第一识别结果是标识特征分支得到的结果；而利用第二特征解耦网络，将图像特征与第二分离参数相乘，得到图像特征中的非标识特征，利用第二分类网络，识别非标识特征，得到第二识别结果，第二识别结果是非标识特征分支得到的结果。

本公开实施例中可以对标识特征分支和非标识特征分支分别进行训练。

具体地，可以基于第一识别结果，调整标识特征分支的模型参数，也即调整第一特征解耦网络和第一分类网络的模型参数，直至第一识别结果与样本人脸图像的人脸标识真值的差异满足第一预设条件；基于第二识别结果，调整非标识特征分支的模型参数，也即第二特征解耦网络和第二分类网络的模型参数，直至第二识别结果满足第二预设条件，如此，响应于上述多个样本人脸图像对应的第一识别结果与样本人脸图像的人脸标识真值的差异均满足第一预设条件，且多个样本人脸图像对应的第二识别结果均满足第二预设条件，则得到用于人脸识别的识别模型。

也可以同步对标识特征分支和非标识特征分支进行训练。

具体地，可以基于第一识别结果，既调整标识特征分支的模型参数，又调整非标识特征分支的模型参数；同理，基于第二识别结果，既调整标识特征分支的模型参数，又调整非标识特征分支的模型参数，如此，响应于上述多个样本人脸图像对应的第一识别结果与样本人脸图像的人脸标识真值的差异均满足第一预设条件，且多个样本人脸图像对应的第二识别结果均满足第二预设条件，则得到用于人脸识别的识别模型。

本公开实施例中，利用第一分类网络识别标识特征得到的第一识别结果，以及利用第二分类网络识别非标识特征得到的第二识别结果，进行模型参数的调整，而标识特征是利用第一特征解耦网络得到的，非标识特征是利用第二特征解耦网络，能够方便地训练包括特征提取模块、第一特征解耦网络、第二特征解耦网络、第一分类网络和第二分类网络的识别模型，得到用于人脸识别的识别模型。

另外，训练使得第一识别结果逼近人脸标识真值，第二识别结果逼近预设分类结果，即训练使得模型能够识别标识特征得到反映人脸标识的第一识别结果，以及使得非标识特征识别无法反映人脸标识，能够训练得到通过分离出图像特征中标识特征，以利用标识特征进行人脸识别的识别模型进行人脸识别，且能够避免非标识特征对人脸识别的影响，提高识别的准确性。

一种可选地实施例中，基于第一识别结果和第二识别结果，调整识别模型的模型参数，直至满足预设条件，可以包括：

利用分类交叉熵损失，计算第一识别结果与样本人脸图像的人脸标识真值的第一损失值，并将第一损失值作为差异；利用熵正则损失，计算第二识别结果与预设分类结果的第二损失值，预设分类结果中各类别的概率相同；基于差异和第二损失值，调整模型参数，直至差异满足第一预设条件，且第二损失值满足第二预设条件，得到用于人脸识别的识别模型。

标识特征分支采用分类交叉熵损失，非标识特征分支采用熵正则损失，非标识特征分支用于限制非标识特征进行人脸分类的能力，也可以理解为，利用非标识特征无法进行分类，以确保非标识特征中不包括与人脸标识有关的信息。例如，利用非标识特征得到的第二识别结果为样本人脸图像为各个人脸类别的概率相同。

分类交叉熵损失是分类问题中比较场景的损失函数，本公开实施例中人脸识别，也是一种分类，通过该分类交叉熵损失可以准确、方便地计算第一识别结果与样本人脸图像的人脸标识真值之间的损失值，进而便于调整模型参数。

熵正则损失使网络更倾向于使用所有输入特征，而不是严重依赖输入特征中某些小部分特征，如此，能够准确反映第二识别结果与预设分类结果的差异，以更好地调整模型参数，实现非标识特征中不包括与人脸标识有关的信息的目的。

一种可选地实施例中，第一分类网络包括第一全连接层，第二分类网络包括第二全连接层。

S105中利用第一分类网络，识别标识特征，得到第一识别结果，可以包括：

将标识特征输入第一全连接层，得到输出的第一识别结果。

S105中利用第二分类网络，识别非标识特征，得到第二识别结果，可以包括：

将非标识特征输入第二全连接层，得到输出的第二识别结果。

第一全连接层和第二全连接层的结构可以相同，也可以不同。

全连接层的主要作用就是将前层，如特征解耦网络计算得到的特征空间映射样本标记空间。简单的说就是将特征表示整合成一个值，其优点在于减少特征位置对于分类结果的影响，提高了整个模型的鲁棒性。

本公开实施例还提供了一个具体的实施例，识别模型如图2所示。

识别模型主要包括特征提取模块、特征解耦模块和分类模块，其中，特征提取模块也可以称之为特征提取网络，特征解耦模块也可以称之为特征提取网络，分类模块通过全连接层来实现。

具体地，特征提取模块采用传统的CNN网络结构，例如ResNet或transformer，用来提取图片中的高级特征。特征解耦模块为全连接结构，用于学习w，图像特征与w相乘得到分离出的ID特征。图像特征与(1-w)相乘得到分离出的非ID特征。ID特征只与人脸ID有关，非ID特征包括年龄、光线、遮挡等与ID无关的一些信息。

ID特征和非ID特征后面接结构相同的全连接层。

ID特征分支采用传统的人脸分类交叉熵loss(损失)，非ID特征分支采用熵正则loss(损失)，其用来限制非ID特征进行人脸分类的能力，确保非ID特征中不包括与ID有关的信息。

利用ID特征分支采用分类交叉熵loss，非ID特征分支采用熵正则loss，可以理解为基于ID特征分支得到的第一识别结果以及分类交叉熵loss，非ID特征分支得到的第二识别结果以及熵正则loss，对识别模型进行训练，得到用于人脸识别的识别模型。具体地训练过程在上述实施例中已经进行了详述，这里不再赘述。

本公开实施例中，识别模型中增加特征解耦，通过特征解耦，以分解图片特征中的ID特征和非ID特征。利用ID特征进行人脸识别，避免非ID特征对人脸识别的影响。一方面，使得针对不同场景的人脸识别更加简便，另一方面，避免非ID特征对人脸识别准确度的影响，提高人脸识别的准确性。

另外，特征解耦可以包括第一特征解耦网络和第二特征解耦网络，利用第一特征解耦网络，将图像特征与第一分离参数相乘，得到图像特征中的标识特征；利用第二特征解耦网络，将图像特征与第二分离参数相乘，得到图像特征中的非标识特征，如此，可以通过比较简单的结构实现特征解耦。

本公开实施例还提供了一种人脸识别方法，可以包括：

获取待识别人脸图像，待识别人脸图像至少包括人脸；

利用识别模型的特征提取网络，提取待识别人脸图像的图像特征；识别模型包括：特征提取网络、第一特征解耦网络和第一分类网络；

利用第一特征解耦网络，将图像特征与第一分离参数相乘得到图像特征中的标识特征；

利用第一分类网络，识别标识特征，得到识别结果；

其中，识别模型通过上述实施例中用于人脸识别的模型的训练方法训练得到。

本公开实施例，利用预先训练好的识别模型可以针对任意场景的人脸图像进行识别，在识别过程中也不需要先确定待识别人脸图像的场景，再选择场景对应的模型进行识别，使得识别更加方便、灵活，提高了识别速度。

另外，识别模型中通过第一特征解耦网络，将图像特征与第一分离参数相乘得到图像特征中的标识特征，利用该标识特征即可进行人脸识别，模型结构相对比较简单，降低了标识特征和非标识特征分离的复杂度，进而能够降低人脸识别的复杂度。且利用标识特征进行人脸识别，能够避免非标识特征对人脸识别准确度的影响，提高了人脸识别的准确性。

图3是本公开实施例提供的人脸识别方法的流程图。参照图3，公开实施例提供的人脸识别方法可以包括：

S301，获取待识别人脸图像。

待识别人脸图像至少包括人脸。

S302，利用识别模型的特征提取网络，提取待识别人脸图像的图像特征。

识别模型包括：特征提取网络、第一特征解耦网络和第一分类网络。

S303，利用第一特征解耦网络，将图像特征与第一分离参数相乘得到图像特征中的标识特征。

S304，利用第一分类网络，识别标识特征，得到识别结果。

利用上述用于人脸识别的模型的训练方法得到识别模型之后，可以利用该识别模型进行人脸识别。

识别模型还可以包括第二特征解耦模块，通过第一特征解耦网络和第二特征解耦网络将特征提取网络得到的图像特征进行分离，得到标识特征和非标识特征。

本公开实施例中，对图像特征进行分离，提取出标识特征和非标识特征，即避免非标识特征对人脸识别准确性的影响，利用标识特征进行人脸识别，得到人脸识别的识别结果。

识别模型中增加特征解耦网络，通过特征解耦网络，以分解图片特征中的标识特征和非标识特征。标识特征只与人脸ID有关，非标识特征包括年龄、光线、遮挡等与标识无关的一些信息。利用标识特征进行人脸识别，避免非标识特征对人脸识别的影响，提高人脸识别的精度。

另外，利用识别模型的第一特征解耦网络，将图像特征与第一分离参数相乘即可得到图像特征中的标识特征，模型结构相对比较简单，降低了模型实现的难度，且降低了识别的复杂度。

由于人脸表情的多样性，人脸图像的遮挡，以及光线的复杂多变，年龄跨度，人脸角度，口罩等问题，目前人脸识别方法还存在不同场景识别的困难问题。

为了解决针对不同识别场景识别困难的问题，相关技术中人脸识别方法一般根据场景的不同，训练不同的模型；或者采用域迁移的方式来处理不同场景的人脸识别需求，但这些方法都很复杂，需要对数据进行重新标注或增加模型等，这不仅会降低模型识别的速度，而且消耗了很多不必要计算资源。

本公开中，识别模型中增加特征解耦，通过特征解耦，以分解图片特征中的标识特征和非标识特征。利用标识特征进行人脸识别，避免非标识特征对人脸识别的影响。一方面，可以针对任意场景下的待识别人脸图像，例如，针对不同年龄、光线变化、场景跨度大的情况的场景，也可以理解为针对年龄跨度大，光线复杂等复杂场景，通过该预先训练好的识别模型进行人脸识别的，得到人脸标识，无需针对不同场景训练不同的模型，在识别过程中也不需要先确定待识别人脸图像的场景，再选择场景对应的模型进行识别，使得识别更加方便，提高识别速度。也避免了针对不同场景训练不同的模型，能够降低计算资源等的消耗。另一方面，本公开实施例对ID特征和非ID特征进行分离，避免非标识特征对人脸识别准确度的影响，提高人脸识别的准确性，提高人脸识别在处理年龄跨度大，光线复杂等复杂场景下的识别精度。

另外，识别模型中可以通过第一解耦网络，将图像特征与第一分离参数相乘得到图像特征中的标识特征，通过第二解耦网络将图像特征与第二分离参数相乘得到图像特征中的非标识特征，模型结果比较简单，降低了标识特征和非标识特征分离的复杂度，进而能够降低人脸识别的复杂度。

如上述训练用于人脸识别的模型的训练方法得到识别模型的过程中，为了训练以保证通过标识特征分支，也即第一特征解耦网络准确得到标识特征，而不包括非标识特征，识别模型中不仅包括标识特征分支，还包括非标识特征分支。但模型训练好之后，即使用识别模型进行人脸识别的过程中，分离得到标识特征，通过第一分类网络即可针对标识特征进行识别的，得到最终的人脸识别的识别结果，因此，在实际使用过程中，识别模型可以为去除第二特征解耦网络和第二分类网络的模型。

如此，可以简化识别模型的结构，能够降低识别的复杂度，且能够减少资源的占用。

本公开实施例还提供了一种用于人脸识别的模型的训练装置，如图4所示，可以包括：

获取模块401，用于获取多个样本人脸图像；

特征提取模块402，用于利用识别模型的特征提取网络，提取样本人脸图像的图像特征，识别模型包括：特征提取网络、第一特征解耦网络、第二特征解耦网络、第一分类网络、和第二分类网络；

特征解耦模块403，用于利用第一特征解耦网络，将图像特征与第一分离参数相乘，得到图像特征中的标识特征；利用第二特征解耦网络，将图像特征与第二分离参数相乘，得到图像特征中的非标识特征，其中，非标识特征是图像特征中除标识特征之外的特征；

识别模块404，用于利用第一分类网络，识别标识特征，得到第一识别结果；利用第二分类网络，识别非标识特征，得到第二识别结果；

训练模块405，用于基于第一识别结果和第二识别结果，对识别模型进行训练。

可选地，训练模块405，具体用于：基于第一识别结果和第二识别结果，调整识别模型的模型参数，直至满足预定条件；

可选地，训练模块405，具体用于：利用分类交叉熵损失，计算第一识别结果与样本人脸图像的人脸标识真值的第一损失值，并将第一损失值作为差异；利用熵正则损失，计算第二识别结果与预设分类结果的第二损失值，预设分类结果中各类别的概率相同；基于差异和第二损失值，调整模型参数。

可选地，其中，第一分类网络包括第一全连接层，第二分类网络包括第二全连接层；

识别模块404，具体用于：将标识特征输入第一全连接层，得到输出的第一识别结果；将非标识特征输入第二全连接层，德雕输出的第二识别结果。

本公开实施例提供了一种人脸识别装置，如图5所示，可以包括：

获取模块501，用于获取待识别人脸图像，待识别人脸图像至少包括人脸；

特征提取模块502，用于利用识别模型的特征提取网络，提取待识别人脸图像的图像特征，识别模型包括：特征提取网络、第一特征解耦网络和第一分类网络；

特征解耦模块503，用于利用第一特征解耦网络，将图像特征与第一分离参数相乘得到图像特征中的标识特征；

识别模块504，用于利用第一分类网络，识别标识特征，得到识别结果；

其中，识别模型通过上述实施例中用于人脸识别的模型的训练装置训练得到。

可选地，识别模型为去除第二特征解耦网络和第二分类网络的模型。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图6所示，电子设备600包括计算单元601，其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序，来执行各种适当的动作和处理。在RAM 603中，还可存储电子设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605，包括：输入单元606，例如键盘、鼠标等；输出单元607，例如各种类型的显示器、扬声器等；存储单元608，例如磁盘、光盘等；以及通信单元609，例如网卡、调制解调器、无线通信收发机等。通信单元609允许电子设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理，例如用于人脸识别的模型的训练方法或人脸识别方法。例如，在一些实施例中，用于人脸识别的模型的训练方法或人脸识别方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元608。在一些实施例中，计算机程序的部分或者全部可以经由ROM602和/或通信单元609而被载入和/或安装到电子设备600上。当计算机程序加载到RAM 603并由计算单元601执行时，可以执行上文描述的用于人脸识别的模型的训练方法或人脸识别方法的一个或多个步骤。备选地，在其他实施例中，计算单元601可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行用于人脸识别的模型的训练方法或人脸识别方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种用于人脸识别的模型的训练方法，包括：

获取多个样本人脸图像；

2.根据权利要求1所述的方法，其中，所述基于所述第一识别结果和所述第二识别结果，对所述识别模型进行训练，包括：

基于所述第一识别结果和所述第二识别结果，调整所述识别模型的模型参数，直至满足预定条件；

其中，所述预定条件包括：所述第一识别结果与所述样本人脸图像的人脸标识真值的差异满足第一预设条件，且所述第二识别结果满足第二预设条件。

3.根据权利要求2所述的方法，其中，所述基于所述第一识别结果和所述第二识别结果，调整所述识别模型的模型参数，直至满足预定条件，包括：

利用分类交叉熵损失，计算所述第一识别结果与所述样本人脸图像的人脸标识真值的第一损失值，并将所述第一损失值作为所述差异；

利用熵正则损失，计算所述第二识别结果与预设分类结果的第二损失值，所述预设分类结果中各类别的概率相同；

基于所述差异和所述第二损失值，调整所述模型参数。

4.根据权利要求1至3任一项所述的方法，其中，所述第一分类网络包括第一全连接层，所述第二分类网络包括第二全连接层；

所述利用所述第一分类网络，识别所述标识特征，得到第一识别结果，包括：

将所述标识特征输入所述第一全连接层，得到输出的所述第一识别结果；

所述利用所述第二分类网络，识别所述非标识特征，得到第二识别结果，包括：

将所述非标识特征输入所述第二全连接层，得到输出的所述第二识别结果。

5.一种人脸识别方法，包括：

获取待识别人脸图像，所述待识别人脸图像至少包括人脸；

其中，所述识别模型通过上述权利要求1至4任一项所述的训练方法训练得到。

6.根据权利要求5所述的方法，其中，所述识别模型为去除第二特征解耦网络和第二分类网络的模型。

7.一种用于人脸识别的模型的训练装置，包括：

获取模块，用于获取多个样本人脸图像；

8.根据权利要求7所述的装置，其中，所述训练模块，具体用于：基于所述第一识别结果和所述第二识别结果，调整所述识别模型的模型参数，直至满足预定条件；

9.根据权利要求8所述的装置，其中，所述训练模块，具体用于：利用分类交叉熵损失，计算所述第一识别结果与所述样本人脸图像的人脸标识真值的第一损失值，并将所述第一损失值作为所述差异；利用熵正则损失，计算所述第二识别结果与预设分类结果的第二损失值，所述预设分类结果中各类别的概率相同；基于所述差异和所述第二损失值，调整所述模型参数。

10.根据权利要求7至9任一项所述的装置，其中，所述第一分类网络包括第一全连接层，所述第二分类网络包括第二全连接层；

所述识别模块，具体用于：将所述标识特征输入所述第一全连接层，得到输出的所述第一识别结果；将所述非标识特征输入所述第二全连接层，得到输出的所述第二识别结果。

11.一种人脸识别装置，包括：

特征提取模块，用于利用识别模型的特征提取网络，提取所述待识别人脸图像的图像特征；所述识别模型包括：特征提取网络、第一特征解耦网络和第一分类网络；

其中，所述识别模型通过上述权利要求7至10任一项所述的训练装置训练得到。

12.根据权利要求11所述的装置，其中，所述识别模型为去除第二特征解耦网络和第二分类网络的模型。

13.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。

15.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。