WO2021258588A1

WO2021258588A1 - 一种人脸图像识别方法、装置、设备及存储介质

Info

Publication number: WO2021258588A1
Application number: PCT/CN2020/123588
Authority: WO
Inventors: 杨馥魁
Original assignee: 北京百度网讯科技有限公司
Priority date: 2020-06-24
Filing date: 2020-10-26
Publication date: 2021-12-30
Also published as: CN111783605A; JP2023529225A; KR20220154227A

Abstract

一种人脸图像识别方法、装置、设备及存储介质，涉及人工智能中深度学习、云计算以及计算机视觉领域，具体涉及戴口罩人脸识别方面。具体实现方案为：基于预先获取的人脸遮挡图像的空间网络特征，对人脸遮挡图像进行空间变换，得到正面人脸遮挡图像（S101）；将正面人脸遮挡图像输入到人脸识别网络，得到身份识别结果（S102）。

Description

一种人脸图像识别方法、装置、设备及存储介质

本申请要求在2020年06月24日提交中国专利局、申请号为202010592663.2的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像处理技术领域，例如涉及人工智能中深度学习、云计算以及计算机视觉领域，具体涉及戴口罩人脸识别方面。

背景技术

人脸识别技术是基于人的脸部特征信息进行身份识别的一种生物识别技术，已广泛应用于生活中的各个领域。在进行人脸识别的过程中，为了提高识别准确性，通常需要将人脸图像转换为正面人脸图像后再进行身份识别。目前，相关技术通常是基于待识别人脸图像的人脸关键点特征，将待识别人脸图像转换为正面人脸图像。但是，在识别佩戴口罩、墨镜、帽子等配件的人脸遮挡图像时，由于人脸遮挡图像中的面部区域部分被遮挡，很难准确识别到人脸关键点特征，导致转换后的正面人脸图像误差较大，严重影响后续人脸识别的准确性，亟需改进。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本申请提供了一种人脸图像识别方法、装置、设备及存储介质。

本申请提供了一种人脸图像识别方法，包括：基于预先获取的人脸遮挡图像的空间网络特征，对所述人脸遮挡图像进行空间变换，得到正面人脸遮挡图像；将所述正面人脸遮挡图像输入到人脸识别网络，得到身份识别结果。

本申请还提供了一种人脸图像识别装置，包括：空间变换模块，设置为基于预先获取的人脸遮挡图像的空间网络特征，对所述人脸遮挡图像进行空间变换，得到正面人脸遮挡图像；身份识别模块，设置为将所述正面人脸遮挡图像输入到人脸识别网络，得到身份识别结果。

本申请还提供了一种电子设备，该电子设备包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请任一实施例所述的人脸图像识别方法。

本申请还提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行本申请任一实施例所述的人脸图像识别方法。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请实施例提供的一种人脸图像识别方法的流程图；

图2A是根据本申请实施例提供的另一种人脸图像识别方法的流程图；

图2B是根据本申请实施例提供的空间变换网络的网络结构示意图；

图3是根据本申请实施例提供的另一种人脸图像识别方法的流程图；

图4A是根据本申请实施例提供的另一种人脸图像识别方法的流程图；

图4B是根据本申请实施例提供的空间变换网络和人脸识别网络的联合训练的模型架构图；

图5是根据本申请实施例提供的一种人脸图像识别装置的结构示意图；

图6是用来实现本申请实施例的人脸图像识别方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1是根据本申请实施例提供的一种人脸图像识别方法的流程图。本申请实施例适用于对人脸图像进行用户身份识别的情况。尤其适用于对佩戴口罩、眼镜或帽子等配件的人脸遮挡图像进行用户身份识别的情况。该实施例可以由配置于电子设备中的人脸图像识别装置来执行，该装置可以采用软件和/或硬件来实现。如图1所示，该方法包括：步骤S101和步骤S102。

在步骤S101中，基于预先获取的人脸遮挡图像的空间网络特征，对人脸遮挡图像进行空间变换，得到正面人脸遮挡图像。

其中，人脸遮挡图像可以是因佩戴了口罩、眼镜或帽子等配件遮挡了面部的部分区域后拍摄的人脸图像。由于拍摄角度或人脸位置等原因，拍摄的人脸遮挡图像可能不是标准的正面人脸。例如，可能是侧面的人脸图像，还可能是低头的人脸图像等。本申请实施例的人脸遮挡图像的空间网络特征可以是表征获取的人脸遮挡图像与其对应的正面的人脸遮挡图像(即正面人脸遮挡图像)之间的空间位置变换关系的相关特征。可选的，该空间网络特征的类型依赖于对人脸遮挡图像进行空间变换的类型。例如，当对获取的人脸遮挡图像进行二维空间变换时，该空间网络特征可以是6个维度(即X方向和Y方向的平移、旋转和缩放)的特征表示。需要说明的是，该空间网络特征并非表征人脸遮挡图像中人脸关键点的特征。

可选的，在本申请实施例中，预先获取的人脸遮挡图像可能是用户在人脸识别系统的电子设备中上传的图像，还可能是人脸识别系统的电子设备通过其上配置的图像采集器(如摄像头)拍摄的图像。对于获取的人脸遮挡图像，先确定其空间网络特征，如可以是通过预设算法计算获取的人脸遮挡图像与其对应的正面人脸遮挡图像的空间网络特征；还可以是通过预先训练好的空间变换网络来确定获取的人脸遮挡图像的空间网络特征。对此本申请实施例不进行限定。在确定出获取的人脸遮挡图像的空间网络特征后，可以基于该空间网络特征在平移、旋转和缩放等维度下的空间位置变换关系，对该人脸遮挡图像进行平移、旋转和缩放等变换操作，得到该人脸遮挡图像对应的正面人脸遮挡图像。

可选的，在本申请实施例中，当人脸识别系统的电子设备预先获取的待识别图像是只包含人脸区域的人脸遮挡图像时，可以直接确定该人脸遮挡图像的空间网络特征，并基于该空间网络特征对该人脸遮挡图像进行空间变换，得到正面人脸遮挡图像；当人脸识别系统的电子设备预先获取的待识别图像是遮挡了部分脸部区域的全身或半身人物图像时。此时为了提高人脸识别的精准性，可以是先从全身或半身人物图像中检测人脸位置，根据检测出的人脸位置在全身或半身人物图像中提取人脸区域作为人脸遮挡图像，进而确定提取出的人脸遮挡图像的空间网络特征，来对该人脸遮挡图像进行空间变换，得到正面人脸遮挡图像。可选的，从全身或半身人物图像中检测并提取人脸区域的方式有很多，例如，可以是通过预先训练好的人脸检测网络来检测并提取全身或半身人物图像中的人脸区域。还可以是通过人脸轮廓检测算法来从全身或半身人物图像中检测并提取人脸区域等。对此本实施例不进行限定。

在步骤S102中，将正面人脸遮挡图像输入到人脸识别网络，得到身份识别结果。

其中，人脸识别网络可以是用于根据输入的人脸图像进行用户身份识别的神经网络。该人脸识别网络可以是由提取图像特征的卷积网络、提取人脸关键点的特征提取网络以及预测用户身份的激活网络等构成。

可选的，本申请实施例可以是将S101得到的正面人脸遮挡图像输入到人脸识别网络中，人脸识别网络会基于训练时的算法对输入的正面人脸遮挡图像进行分析，如先通过卷积网络提取正面人脸遮挡图像的特征图像，然后通过特征提取网络从特征图像中提取人脸关键点特征，进而通过激活网络对人脸关键点特征进行分析，预测输入的正面人脸遮挡图像对应的用户身份。

本申请实施例的技术方案，通过基于人脸遮挡图像的空间网络特征，将人脸遮挡图像转换为正面人脸遮挡图像，进而通过人脸识别网络对正面人脸遮挡图像进行用户身份识别。本申请实施例的方案，依据人脸遮挡图像的空间网络特征来确定正面人脸遮挡图像，与相关技术基于人脸关键点特征确定正面人脸遮挡图像相比，在人脸面部区域被遮挡，难以准确识别到人脸关键点的情况下，极大的降低了转换后的正脸人脸遮挡图像的误差，提高人脸识别的准确性。

图2A是根据本申请实施例提供的另一种人脸图像识别方法的流程图；图2B是根据本申请实施例提供的空间变换网络的网络结构示意图。本实施例在上述实施例的基础上，进行了进一步的优化，给出了基于预先获取的人脸遮挡图像的空间网络特征，对所述人脸遮挡图像进行空间变换，得到正面人脸遮挡图像的具体情况介绍。如图2A-2B所示，该方法具体包括：步骤S201，步骤S202，步骤S203，步骤S204以及步骤205。

在步骤S201中，将预先获取的人脸遮挡图像输入空间变换网络中的卷积网络，得到人脸遮挡图像的特征图像。

其中，本申请实施例空间变换网络可以是用于确定获取的人脸遮挡图像的空间网络特征，并基于空间网络特征对人脸遮挡图像进行空间变换操作得到正面人脸遮挡图像的神经网络。如图2B所示，该空间变换网络2包括：卷积网络21、定位网络22、变换网络23和插值网络24。

可选的，本申请实施例可以是先将获取的人脸遮挡图像输入到空间变换网络2中的卷积网络21中，卷积网络21会对输入的人脸遮挡图像进行卷积处理，提取图像特征，得到输入的人脸遮挡图像的特征图像。

在步骤S202中，将特征图像输入空间变换网络中的定位网络，得到人脸遮挡图像的空间网络特征。

可选的，本申请实施例在通过空间变换网络2的卷积网络21提取出人脸遮挡图像的特征图像后，可以将该特征图像输入到空间变换网络2的定位网络22中，该定位网络22可以是一个用来归回变换参数的网络，其会对输入的特征图像进行分析，输出人脸遮挡图像的空间网络特征。例如，当人脸遮挡图像为二维变换时，输出的人脸遮挡图像的空间网络特征可以是由X方向和Y方向的平移、旋转和缩放6个维度(2×3)的输出向量构成的空间变换矩阵。

在步骤S203中，将空间网络特征和特征图像输入空间变换网络中的变换网络，得到特征图像的像素点转换数据。

可选的。本申请实施例在得到人脸遮挡图像的空间网络特征后，可以将该空间网络特征和S201得到的特征图像一起输入到空间变换网络2的变换网络23中，该变换网络23会根据输入的空间网络特征对特征图像进行空间变换操作，具体的，变换网络23可以是对特征图像中的各像素点的原始位置坐标按照空间网络特征进行空间变换，得到各像素点变换后的位置坐标，作为特征图像的像素点转换数据。例如，可以按照下述公式(1)来根据空间网络特征，计算特征图像的像素点转换数据。

其中，

为特征图像中的第i个像素点变换后的位置坐标，即第i个像素点的转换数据；

为6维度的空间网络特征；

为特征图像中的第i个像素点的原始位置坐标。

在步骤S204中，将像素点转换数据和特征图像输入到空间变换网络中的插值网络，得到正面人脸遮挡图像。

可选的，由于S202得到的空间网络特征可能不是整数，所以经过S203得到的像素点转换数据可能也不是整数，而图像中像素点的位置坐标都是正整数，所以本申请实施例需要对S203得到的像素点转换数据进行处理，将各像素点变换后的位置坐标调整为正整数后，得到正面人脸遮挡图像。

具体的，本申请实施例可以是将S203得到的像素点转换数据和S201得到的特征图像输入到空间变换网络2的插值网络24中，此时插值网络24会根据像素点转换数据中每个像素点转换后的位置坐标和该像素点在特征图像中的原始位置坐标，对该像素点转换后的位置坐标进行插值处理，以实现将该像素点转换后的位置坐标转换为正整数，根据插值处理后的各像素点的位置坐标和各像素点的像素值生成插值后的图像，即正面人脸遮挡图像。

在步骤S205中，将正面人脸遮挡图像输入到人脸识别网络，得到身份识别结果。

本申请实施例的技术方案，通过空间变换网络中的卷积网络从获取的人脸遮挡图像中提取特征图像，传输至定位网络来确定人脸遮挡图像的空间网络特征，将空间网络特征和特征图像传输至变换网络对特征图像进行空间变换，并将得到的像素点转换数据输入至插值网络，来对像素点转换数据进行插值，得到正面人脸遮挡图像传输至人脸识别网络进行身份识别。本申请实施例的方案，通过空间变换网络中的卷积网络、定位网络、变换网络和插值网络相互配合，实现基于人脸遮挡图像的空间网络特征来确定正面人脸遮挡图像，在人脸面部区域被遮挡，难以准确识别到人脸关键点的情况下，极大的提高了转换后的正脸人脸遮挡图像的精准度，进而提高人脸识别的准确性。

图3是根据本申请实施例提供的另一种人脸图像识别方法的流程图；本实施例在上述实施例的基础上，进行了进一步的优化，给出了一种人脸图像识别方法的优选实例。如图3所示，该方法具体包括：步骤S301，步骤S302以及步骤S303。

在步骤S301中，基于预先获取的人脸遮挡图像的人脸关键点特征，对人脸遮挡图像进行对齐。

可选的，在本申请实施例中，人脸识别系统在获取人脸遮挡图像后，可以先基于人脸关键点特征，对该人脸遮挡图像进行一次对齐操作。需要说明的是，对人脸遮挡图像进行对齐的操作也是将人脸遮挡图像转换为正面人脸的过程。具体的，可以是基于特征提取算法或预先训练的人脸对齐网络，对获取的人脸遮挡图像进行人脸关键点提取，例如，可以是提取眼睛、鼻子、嘴、眉毛等区域的78个关键点特征。然后基于提取的人脸关键点特征，对获取的人脸遮挡图像进行仿射变换，实现对人脸遮挡图像的对齐操作，得到对齐后的人脸遮挡图像。

需要说明的是，本申请实施例的待识别的人脸图像是脸部区域被口罩、眼镜、帽子等配件遮挡的人脸图像，由于面部区域被遮挡，所以本步骤很难准确识别到人脸遮挡图像中的各人脸关键点特征，导致基于人脸关联关键点特征对齐后得到的人脸遮挡图像误差较大，并不是精准的正面人脸遮挡图像，还需要继续执行下述S302的操作，进一步对对齐后的人脸遮挡图像进行空间变换，以得到标准的正面人脸遮挡图像。

在步骤S302中，基于对齐后的人脸遮挡图像的空间网络特征，对人脸遮挡图像进行空间变换，得到正面人脸遮挡图像。

可选的，本申请实施例可以是根据S301基于人脸关键点特征对齐后的人脸遮挡图像的空间网络特征，对S301对齐后的人脸遮挡图像进行空间变换，得到最终的正面人脸遮挡图像。可选的，可以是将S301对齐后的人脸遮挡图像输入空间变换网络中的卷积网络，得到对齐后的人脸遮挡图像的特征图像；将所述特征图像输入所述空间变换网络中的定位网络，得到对齐后的人脸遮挡图像的空间网络特征；将所述空间网络特征和所述特征图像输入所述空间变换网络中的变换网络，得到所述特征图像的像素点转换数据；将所述像素点转换数据和所述特征图像输入到所述空间变换网络中的插值网络，得到正面人脸遮挡图像。具体的空间变换过程已在上述各实施例中介绍，在此本实施例不进行赘述。

在步骤S303中，将正面人脸遮挡图像输入到人脸识别网络，得到身份识别结果。

本申请实施例的技术方案，先基于人脸遮挡图像的人脸关键点特征，对人脸遮挡图像进行对齐处理，再基于对齐后的人脸遮挡图像的空间网络特征，进一步对对齐后的人脸遮挡图像进行空间变换，得到最终的正面人脸遮挡图像，进而通过人脸识别网络对正面人脸遮挡图像进行用户身份识别。本申请实施例的方案，基于人脸关键点特征和空间网络特征对获取的人脸遮挡图像进行两次空间变换处理，进一步提高了最终得到的正脸人脸遮挡图像的精准度，提高了人脸识别系统对于人脸识别的鲁棒性和稳定性。

图4A是根据本申请实施例提供的另一种人脸图像识别方法的流程图；图4B是根据本申请实施例提供的空间变换网络和人脸识别网络的联合训练的模型架构图。本实施例在上述实施例的基础上，进行了进一步的优化，给出了空间变换网络和人脸识别网络在模型训练阶段的具体情况介绍。

可选的，本申请实施例在模型训练阶段，对所述空间变换网络和所述人脸识别网络进行联合训练。具体的，可以是如图4B所示，将空间变换网络2的输出连接人脸识别模型4的输入，以实现将空间变换网络2和人脸识别网络4融合在一个统一的模型框架中进行联合训练。这样设置的好处是可以提高空间变换网络和人脸识别网络之间的耦合性，提高人脸遮挡图像的用户身份识别的准确性。接下来介绍具体的联合训练过程。如图4A-4B所示，该方法具体包括：步骤S401，步骤S402，步骤S403，步骤S404，步骤S405以及步骤S406。

在步骤S401中，将样本人脸遮挡图像输入到空间变换网络，得到样本正面人脸遮挡图像。

可选的，样本人脸遮挡图像可以是由大量的因戴了配件导致脸部部分区域被遮挡的人脸图像构成。可以是直接挑选脸部部分区域被遮挡的人脸图像作为样本人脸遮挡图像，还可以是对正常的无遮挡人脸图像进行遮挡处理后得到样本人脸遮挡图像。本申请实施例可以是将样本人脸遮挡图像输入到如图4B所示的空间变换网络2的卷积网络21中，卷积网络21会对输入的样本人脸遮挡图像进行特征提取，得到特征图像，输入到定位网络22、变换网络23和插值网络24中，定位网络22会对特征图像进行分析，得到空间网络特征，输入到变换网络23中，变换网络23会基于空间网络特征，对特征图像中的各像素点的位置坐标进行空间变换，得到像素点转换数据输入到插值网络24中，插值网络24会基于接收到的特征图像和像素点转换数据，对像素点转换数据进行插值处理，得到转换后的样本正面人脸遮挡图像。

在步骤S402中，将样本正面人脸遮挡图像输入到人脸识别网络，得到样本身份识别结果。

可选的，如图4B所示，由于空间变换网络2和人脸识别网络4已经融合在了一个统一的模型框架中，此时可以将空间变换网络2的插值网络24输出的样本正面人脸遮挡图像输入到人脸识别网络4中的卷积网络41中，卷积网络41会对输入的样本正面人脸遮挡图像进行特征提取，得到样本正面人脸遮挡图像的特征图像输入到特征提取网络42，特征提取网络42会进一步从输入的特征图像中提取出人脸关键点特征，输入到激活网络43中，激活网络43会基于提取到的人脸关键点特征进行样本人脸遮挡图像的用户身份预测，输出样本身份识别结果。

在步骤S403中，根据样本正面人脸遮挡图像、样本身份识别结果、样本人脸遮挡图像中标注的人脸关键点和真实身份，构建联合损失函数。

可选的，由于本申请实施例是对空间变换网络2和人脸识别网络4进行联合训练。所以作为监督信号的联合损失函数需要包括监督训练空间变换网络2的空间变换损失函数和监督训练人脸识别网络4的识别损失函数。

可选的，本申请实施例构建联合损失函数的执行过程可以包括：根据样本人脸遮挡图像中标注的人脸关键点和样本正面人脸遮挡图像，确定空间变换损失函数；根据样本人脸遮挡图像中标注的真实身份和样本身份识别结果，确定识别损失函数；根据空间变换损失函数和识别损失函数，构建联合损失函数。具体的，样本人脸遮挡图像中预先标注有准确的人脸关键点和真实身份。在构建联合损失函数时，可以是基于样本人脸遮挡图像中标注的准确的人脸关键点，对样本人脸遮挡图像进行精准对齐，转换为标准正面人脸遮挡图像，然后将该标准正面人脸遮挡图像与空间变换网络2输出的样本正面人脸遮挡图像进行匹配，计算空间变换损失函数；将样本人脸遮挡图像中标注的真实身份与人脸识别网络4预测的样本身份识别结果进行匹配，计算识别损失函数，将计算得到的空间变换损失函数和识别损失函数作为本次训练的联合损失函数。

在步骤S404中，基于联合损失函数，对空间变换网络和人脸识别网络进行监督训练。

可选的，本申请实施例可以是以空间变换损失函数和识别损失函数为监督信号，对空间变换网络2和人脸识别网络4进行监督训练，不断更新空间变换网络2和人脸识别网络4的网络参数。具体的，可以是基于空间变换损失函数监督训练后的空间变换网络2，以使训练后的空间变换网络2可以将输入的不标准的人脸遮挡图像转换为标准的正面人脸遮挡图像；基于识别损失函数监督训练后的人脸识别网络4，以使训练后的人脸识别网络4可以更为精准的从正面人脸遮挡图像中提取到人脸关键点特征，进而准确进行用户身份识别。

可选的，本申请实施例可以在对空间变换网络2和人脸识别网络4进行联合监督训练后，采用至少一组测试数据来测试训练后的空间变换网络2和人脸识别网络4的精准度，如果两个网络的精准度都满足预设精度要求，则对空间变换网络2和人脸识别网络4进行监督训练结束。

在步骤S405中，将预先获取的人脸遮挡图像输入到训练好的空间变换网络中，根据人脸遮挡图像的空间网络特征，对人脸遮挡图像进行空间变换，得到正面人脸遮挡图像。

在步骤S406中，将正面人脸遮挡图像输入到训练好的人脸识别网络，得到身份识别结果。

本申请实施例的技术方案，通过将空间变换网络和人脸识别网络融合在一个统一的模型框架中，将样本人脸遮挡图像输入到空间变换网络，得到的样本正面人脸遮挡图像输入到人脸识别网络，得到样本身份识别结果，根据样本正面人脸遮挡图像、样本身份识别结果、预先在样本人脸遮挡图像中标注的人脸关键点和真实身份，构建联合损失函数，基于联合损失函数对空间变换网络和人脸识别网络进行联合训练。通过联合训练后的空间变换网络基于人脸遮挡图像的空间网络特征，将人脸遮挡图像转换为正面人脸遮挡图像，通过联合训练后的人脸识别网络对正面人脸遮挡图像进行用户身份识别。本申请实施例的方案，将空间变换网络和人脸识别网络融合在一个统一的模型框架中，基于联合损失函数对两网络进行联合训练，以提高空间变换网络和人脸识别网络之间的耦合性，进而提高人脸遮挡图像的用户身份识别的准确性。

图5是根据本申请实施例提供的一种人脸图像识别装置的结构示意图。本申请实施例适用于对人脸图像进行用户身份识别的情况。尤其适用于对佩戴口罩、眼镜或帽子等配件的人脸遮挡图像进行用户身份识别的情况。该装置可实现本申请任意实施例所述的人脸图像识别方法。该装置可集成于电子设备中，该装置500具体包括：空间变换模块501和身份识别模块502。

其中，空间变换模块501，设置为基于预先获取的人脸遮挡图像的空间网络特征，对所述人脸遮挡图像进行空间变换，得到正面人脸遮挡图像；

身份识别模块502，设置为将所述正面人脸遮挡图像输入到人脸识别网络，得到身份识别结果。

进一步的，所述空间变换模块501包括：

特征图像确定单元，设置为将预先获取的人脸遮挡图像输入空间变换网络中的卷积网络，得到所述人脸遮挡图像的特征图像；

网络特征确定单元，设置为将所述特征图像输入所述空间变换网络中的定位网络，得到所述人脸遮挡图像的空间网络特征；

数据转换单元，设置为将所述空间网络特征和所述特征图像输入所述空间变换网络中的变换网络，得到所述特征图像的像素点转换数据；

数据差值单元，设置为将所述像素点转换数据和所述特征图像输入到所述空间变换网络中的插值网络，得到正面人脸遮挡图像。

进一步的，所述装置还包括：

图像对齐模块，设置为基于预先获取的人脸遮挡图像的人脸关键点特征，对所述人脸遮挡图像进行对齐。

进一步的，所述正面人脸遮挡图像基于空间变换网络得到，所述装置还包括：

模型训练模块，设置为在模型训练阶段，对所述空间变换网络和所述人脸识别网络进行联合训练。

进一步的，所述模型训练模块包括：

第一数据输入模块，设置为将样本人脸遮挡图像输入到所述空间变换网络，得到样本正面人脸遮挡图像；

第二数据输入模块，设置为将所述样本正面人脸遮挡图像输入到所述人脸识别网络，得到样本身份识别结果；

损失函数构建单元，设置为根据所述样本正面人脸遮挡图像、所述样本身份识别结果、所述样本人脸遮挡图像中标注的人脸关键点和真实身份，构建联合损失函数；

监督训练单元，设置为基于所述联合损失函数，对所述空间变换网络和所述人脸识别网络进行监督训练。

进一步的，所述损失函数构建单元是设置为：

根据所述样本人脸遮挡图像中标注的人脸关键点和所述样本正面人脸遮挡图像，确定空间变换损失函数；

根据所述样本人脸遮挡图像中标注的真实身份和所述样本身份识别结果，确定识别损失函数；

根据所述空间变换损失函数和所述识别损失函数，构建联合损失函数。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图6所示，是根据本申请实施例的人脸图像识别方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图6所示，该电子设备包括：一个或多个处理器601、存储器602，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。

存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的人脸图像识别方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的人脸图像识别方法。

存储器602作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的人脸图像识别方法对应的程序指令/模块(例如，附图5所示的空间变换模块501和身份识别模块502)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的人脸图像识别方法。

存储器602可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据人脸图像识别方法的电子设备的使用所创建的数据等。此外，存储器602可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器602可选包括相对于处理器601远程设置的存储器，这些远程存储器可以通过网络连接至人脸图像识别方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

人脸图像识别方法的电子设备还可以包括：输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接，图6中以通过总线连接为例。

输入装置603可接收输入的数字或字符信息，以及产生与人脸图像识别方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案，通过基于人脸遮挡图像的空间网络特征，将人脸遮挡图像转换为正面人脸遮挡图像，进而通过人脸识别网络对正面人脸遮挡图像进行用户身份识别。本申请实施例的方案，依据人脸遮挡图像的空间网络特征来确定正面人脸遮挡图像，与相关技术基于人脸关键点特征确定正面人脸遮挡图像相比，在人脸面部区域被遮挡，难以准确识别到人脸关键点的情况下，极大的降低了转换后的正脸人脸遮挡图像的误差，提高人脸识别的准确性。

注意，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由所附的权利要求范围决定。

Claims

一种人脸图像识别方法，包括：

基于预先获取的人脸遮挡图像的空间网络特征，对所述人脸遮挡图像进行空间变换，得到正面人脸遮挡图像；

将所述正面人脸遮挡图像输入到人脸识别网络，得到身份识别结果。
根据权利要求1所述的方法，其中，基于预先获取的人脸遮挡图像的空间网络特征，对所述人脸遮挡图像进行空间变换，得到正面人脸遮挡图像，包括：

将预先获取的人脸遮挡图像输入空间变换网络中的卷积网络，得到所述人脸遮挡图像的特征图像；

将所述特征图像输入所述空间变换网络中的定位网络，得到所述人脸遮挡图像的空间网络特征；

将所述空间网络特征和所述特征图像输入所述空间变换网络中的变换网络，得到所述特征图像的像素点转换数据；

将所述像素点转换数据和所述特征图像输入到所述空间变换网络中的插值网络，得到正面人脸遮挡图像。
根据权利要求1所述的方法，其中，在基于预先获取的人脸遮挡图像的空间网络特征，对所述人脸遮挡图像进行空间变换之前，还包括：

基于预先获取的人脸遮挡图像的人脸关键点特征，对所述人脸遮挡图像进行对齐。
根据权利要求1所述的方法，其中，所述正面人脸遮挡图像基于空间变换网络得到，所述方法还包括：

在模型训练阶段，对所述空间变换网络和所述人脸识别网络进行联合训练。
根据权利要求4所述的方法，其中，对所述空间变换网络和所述人脸识别网络进行联合训练，包括：

将样本人脸遮挡图像输入到所述空间变换网络，得到样本正面人脸遮挡图像；

将所述样本正面人脸遮挡图像输入到所述人脸识别网络，得到样本身份识别结果；

根据所述样本正面人脸遮挡图像、所述样本身份识别结果、所述样本人脸遮挡图像中标注的人脸关键点和真实身份，构建联合损失函数；

基于所述联合损失函数，对所述空间变换网络和所述人脸识别网络进行监督训练。
根据权利要求5所述的方法，其中，根据所述样本正面人脸遮挡图像、所述样本身份识别结果、所述样本人脸遮挡图像中标注的人脸关键点和真实身份，构建联合损失函数，包括：

根据所述样本人脸遮挡图像中标注的人脸关键点和所述样本正面人脸遮挡图像，确定空间变换损失函数；

根据所述样本人脸遮挡图像中标注的真实身份和所述样本身份识别结果，确定识别损失函数；

根据所述空间变换损失函数和所述识别损失函数，构建联合损失函数。
一种人脸图像识别装置，包括：

空间变换模块，设置为基于预先获取的人脸遮挡图像的空间网络特征，对所述人脸遮挡图像进行空间变换，得到正面人脸遮挡图像；

身份识别模块，设置为将所述正面人脸遮挡图像输入到人脸识别网络，得到身份识别结果。
根据权利要求7所述的装置，其中，所述空间变换模块包括：

特征图像确定单元，设置为将预先获取的人脸遮挡图像输入空间变换网络中的卷积网络，得到所述人脸遮挡图像的特征图像；

网络特征确定单元，设置为将所述特征图像输入所述空间变换网络中的定位网络，得到所述人脸遮挡图像的空间网络特征；

数据转换单元，设置为将所述空间网络特征和所述特征图像输入所述空间变换网络中的变换网络，得到所述特征图像的像素点转换数据；

数据差值单元，设置为将所述像素点转换数据和所述特征图像输入到所述空间变换网络中的插值网络，得到正面人脸遮挡图像。
根据权利要求7所述的装置，其中，还包括：

图像对齐模块，设置为基于预先获取的人脸遮挡图像的人脸关键点特征，对所述人脸遮挡图像进行对齐。
根据权利要求7所述的装置，其中，所述正面人脸遮挡图像基于空间变换网络得到，所述装置还包括：

模型训练模块，设置为在模型训练阶段，对所述空间变换网络和所述人脸识别网络进行联合训练。
根据权利要求10所述的装置，其中，所述模型训练模块包括：

第一数据输入模块，设置为将样本人脸遮挡图像输入到所述空间变换网络，得到样本正面人脸遮挡图像；

第二数据输入模块，设置为将所述样本正面人脸遮挡图像输入到所述人脸识别网络，得到样本身份识别结果；

损失函数构建单元，设置为根据所述样本正面人脸遮挡图像、所述样本身份识别结果、所述样本人脸遮挡图像中标注的人脸关键点和真实身份，构建联合损失函数；

监督训练单元，设置为基于所述联合损失函数，对所述空间变换网络和所述人脸识别网络进行监督训练。
根据权利要求11所述的装置，其中，所述损失函数构建单元是设置为：

根据所述样本人脸遮挡图像中标注的人脸关键点和所述样本正面人脸遮挡图像，确定空间变换损失函数；

根据所述样本人脸遮挡图像中标注的真实身份和所述样本身份识别结果，确定识别损失函数；

根据所述空间变换损失函数和所述识别损失函数，构建联合损失函数。
一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的人脸图像识别方法。
一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的人脸图像识别方法。