WO2022087941A1

WO2022087941A1 - 人脸重建模型的训练方法及装置、人脸重建方法及装置、电子设备和可读存储介质

Info

Publication number: WO2022087941A1
Application number: PCT/CN2020/124657
Authority: WO
Inventors: 卢运华; 张丽杰; 陈冠男; 刘瀚文
Original assignee: 京东方科技集团股份有限公司
Priority date: 2020-10-29
Filing date: 2020-10-29
Publication date: 2022-05-05
Also published as: CN114981835A

Abstract

一种人脸重建模型的训练方法及装置、人脸重建方法及装置、电子设备和可读存储介质。人脸重建模型的训练方法包括获取训练数据（101）；将所述第一人脸图像输入第一网络模型，获得第二人脸图像（102）；将所述目标人脸图像和所述第二人脸图像输入第二网络模型，获得判别结果（103）；获取所述第一网络模型对应的第一损失函数，并根据所述第一损失函数调节所述第一网络模型的参数（104）；获取所述第二网络模型对应的第二损失函数，并根据所述第二损失函数调节所述第二网络模型的参数（105）；交替进行上述步骤，以对所述第一网络模型和所述第二网络模型轮流进行模型训练（106）；将训练完成的第一网络模型作为人脸重建模型（107）。该方案能够提高对于人脸重建的准确度和清晰度。

Description

人脸重建模型的训练方法及装置、人脸重建方法及装置、电子设备和可读存储介质

技术领域

本公开涉及人脸重建技术领域，尤其涉及一种人脸重建模型的训练方法及装置、电子设备和可读存储介质。

背景技术

人脸重建指的是根据视频数据重建其中包括的人物的脸部图像的技术，被广泛应用于人物识别跟踪等方面，相关技术中，对于人脸重建的精确度和清晰度较差。

发明内容

本公开实施例提供一种人脸重建模型的训练方法及装置、人脸重建方法及装置，以解决对于人脸重建的精确度和清晰度较差的问题。

第一方面，本公开实施例提供了一种人脸重建模型的训练方法，包括以下步骤：

获取训练数据，所述训练数据包括目标人脸图像和与所述目标人脸图像对应的第一人脸图像，所述第一人脸图像的清晰度小于所述目标人脸图像的清晰度；

将所述第一人脸图像输入第一网络模型，获得第二人脸图像，其中，所述第一网络模型是以人脸图像为输入，以对于输入的人脸图像的重建图像为输出的生成网络模型；

将所述目标人脸图像和所述第二人脸图像输入第二网络模型，获得判别结果，其中，所述第二网络模型是以人脸图像为输入，以对于输入的人脸图像的真实性的判别结果为输出的判别网络模型，所述判别结果包括输入的人脸图像的整体的真实性和局部特征的真实性的判别结果；

获取所述第一网络模型对应的第一损失函数，并根据所述第一损失函数调节所述第一网络模型的参数；

获取所述第二网络模型对应的第二损失函数，并根据所述第二损失函数调节所述第二网络模型的参数；

交替进行上述步骤，以对所述第一网络模型和所述第二网络模型轮流进行模型训练；

将训练完成的第一网络模型作为人脸重建模型，其中，在训练完成的情况下，所述第一损失函数和所述第二损失函数的值均达到相应的目标阈值。

在一些实施例中，所述第二损失函数包含第一判别对抗损失，第二网络模型包含全局判别子网络；

所述获取所述第二网络模型对应的第二损失函数，包括：

将所述第二人脸图像标记为假，将所述目标人脸图像标记为真，将所述第二人脸图像和所述目标人脸图像分别输入所述全局判别子网络，分别得到第一判别结果和第二判别结果；

根据所述第一判别结果和所述第二判别结果得到所述第一判别对抗损失。

在一些实施例中，所述第二损失函数包含第二判别对抗损失和第三判别对抗损失，所述第二网络模型还包括眼部判别子网络和嘴部判别子网络；

所述获取所述第二网络模型对应的第二损失函数，包括：

根据所述第二人脸图像得到对应的第一眼部图像和第一嘴部图像；

根据所述目标人脸图像得到对应的第二眼部图像和第二嘴部图像；

将所述第一眼部图像和所述第一嘴部图像标记为假，将所述第二眼部图像和第二嘴部图像标记为真，将所述第一眼部图像和所述第二眼部图像分别输入到所述眼部判别子网络分别输出第三判别结果和第四判别结果；所述第一嘴部图像和第二嘴部图像分别输入到所述嘴部判别子网络分别输出第五判别结果和第六判别结果；

根据所述第三判别结果和所述第四判别结果得到第二判别对抗损失；

根据所述第五判别结果和所述第六判别结果得到第三判别对抗损失。

在一些实施例中，所述第一损失函数包含第一子损失和第二子损失；

所述获取所述第一网络模型对应的第一损失函数，包括：

获取所述目标人脸图像对应的第一人脸部位图和第二人脸部位图；

解析所述第二人脸图像，获得所述第二人脸图像对应的第三人脸部位图和第四人脸部位图，其中，所述第一人脸部位图和所述第二人脸部位图对应同一人脸图像的不同区域，所述第一人脸部位图和所述第三人脸部位图对应不同人脸图像的同一区域，所述第二人脸部位图和所述第四人脸部位图对应不同人脸图像的同一区域；

根据所述第一人脸部位图和所述第三人脸部位图之间的差异，得到所述第一子损失；

根据所述第二人脸部位图和所述第四人脸部位图之间的差异，得到所述第二子损失。

在一些实施例中，所述第一人脸部位图包括人脸图像的五官图像，所述第二人脸部位图包括所述人脸图像的皮肤图像。

在一些实施例中，所述第一损失函数包含第三子损失；

所述获取所述第一网络模型对应的第一损失函数，还包括：

获取所述目标人脸图像对应的第一特征点数据；

解析所述第二人脸图像，获得所述第二人脸图像对应的第二特征点数据；

根据所述第一特征点数据和所述第二特征点数据之间的差异，得到所述第三子损失。

在一些实施例中，所述第一特征点数据包括所述目标人脸图像的热图，所述第二特征点数据包括所述第二人脸图像的热图，其中，热图包括人脸图像的左眼热图、右眼热图、鼻部热图、嘴部热图和脸部轮廓热图中的一项或多项。

在一些实施例中，所述第一损失函数包含第四子损失；

所述获取所述第一网络模型对应的第一损失函数，还包括：

获取所述目标人脸图像对应的第一特征向量；

获取所述第二人脸图像对应的第二特征向量；

根据所述第一特征向量和所述第二特征向量之间的差异，得到所述第四子损失。

在一些实施例中，所述第一损失函数包含第五子损失；

所述获取所述第一网络模型对应的第一损失函数，还包括：

根据所述目标人脸图像和所述第二人脸图像的差异，得到所述第五子损失。

在一些实施例中，所述第一损失函数包含第六子损失和第七子损失中的一项或多项；

所述获取所述第一网络模型对应的第一损失函数，还包括：

根据所述目标人脸图像的眼部区域图像和所述第二人脸图像的眼部区域图像之间的差异的感知损失作为所述第六子损失；和/或

根据所述目标人脸图像的嘴部区域图像和所述第二人脸图像的嘴部区域图像之间的差异的感知损失作为所述第七子损失。

在一些实施例中，所述第一损失函数包含第八子损失；

所述获取所述第一网络模型对应的第一损失函数，还包括：

根据所述第一网络模型和所述第二网络模型之间的生成对抗损失获得所述第八子损失，其中，所述第二网络模型包括全局判别子网络、眼部判别子网络和嘴部判别子网络中的一项或多项，所述生成对抗损失是将所述第一网络模型输出的第二人脸图像标记为真，然后将第二人脸图像输入所述全局判别子网络、眼部判别子网络和嘴部判别子网络中的一项或多项之后，获得判别结果，并根据所获得的判别结果确定的。

第二方面，本公开实施例提供了一种人脸重建方法，包括以下步骤：

获取输入图像；

将所述输入图像输入人脸重建模型，获得人脸重建图像，其中，所述人脸重建模型是通过第一方面中任一项的人脸重建模型的训练方法进行模型训练得到的。

第三方面，本公开实施例提供了一种人脸重建模型的训练装置，包括：

训练数据获取模块，用于获取训练数据，所述训练数据包括目标人脸图像和与所述目标人脸图像对应的第一人脸图像，所述第一人脸图像的清晰度小于所述目标人脸图像的清晰度；

第一输入模块，用于将所述第一人脸图像输入第一网络模型，获得第二人脸图像，其中，所述第一网络模型是以人脸图像为输入，以对于输入的人脸图像的重建图像为输出的生成网络模型；

第二输入模块，用于将所述目标人脸图像和所述第二人脸图像输入第二网络模型，获得判别结果，其中，所述第二网络模型是以人脸图像为输入，以对于输入的人脸图像的真实性的判别结果为输出的判别网络模型，所述判别结果包括输入的人脸图像的整体的真实性和局部特征的真实性的判别结果；

第一损失函数获取模块，用于获取所述第一网络模型对应的第一损失函数，并根据所述第一损失函数调节所述第一网络模型的参数；

第二损失函数获取模块，用于获取所述第二网络模型对应的第二损失函数，并根据所述第二损失函数调节所述第二网络模型的参数；

训练模块，用于对所述第一网络模型和所述第二网络模型轮流进行模型训练；

人脸重建模型确认模块，用于将训练完成的第一网络模型作为人脸重建模型，其中，在训练完成的情况下，所述第一损失函数和所述第二损失函数的值均达到相应的目标阈值。

第四方面，本公开实施例提供了一种人脸重建装置，包括：

输入图像获取模块，用于获取输入图像；

输入模块，拥有将所述输入图像输入人脸重建模型，获得人脸重建图像，其中，所述人脸重建模型是通过第一方面中任一项的人脸重建模型的训练方法进行模型训练得到的。

第五方面，本公开实施例提供了一种电子设备，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如第一方面中任一项所述的人脸重建模型的训练方法的步骤，或者实现如第二方面中所述的人脸重建方法的步骤。

第五方面，本公开实施例提供了一种可读存储介质，其上存储有计算机程序，所述计算机程序被所述处理器执行时实现如第一方面中任一项所述的人脸重建模型的训练方法的步骤，或者实现如第二方面中所述的人脸重建方法的步骤。

本公开实施例通过建立包括第一网络模型和第二网络模型的生成对抗网络对第一网络模型和第二网络模型进行模型训练，其中，第二网络模型包括整体的真实性和局部特征的真实性的判别结果，有助于提高对于第一网络模型的输出结果判断的准确程度，从而提高训练完成的重建模型对于人脸图像重建的准确程度，也有助于提高迭代速度，从而提高模型训练效率。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对本公开实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获取其他的附图。

图1是本公开一实施例提供的人脸重建模型的训练方法的流程图；

图2是本公开一实施例提供的人脸重建方法的流程图；

图3是本公开一实施例提供的人脸重建模型的训练装置的结构图；

图4是本公开一实施例提供的人脸重建装置的结构图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例，都属于本公开保护的范围。

本公开实施例提供了一种人脸重建模型的训练方法。

如图1所示，在一个实施例中，该人脸重建模型的训练方法包括以下步骤：

步骤101：获取训练数据。

本实施例中的训练数据又称作训练集，训练数据包括目标人脸图像和第一人脸图像，训练数据包括目标人脸图像和与目标人脸图像对应的第一人脸图像，第一人脸图像的清晰度小于目标人脸图像的清晰度。其中，人脸图像的格式可以是视频数据，也可以是照片。

本实施例中的目标人脸图像和第一人脸图像可以直接由训练数据提供，也可以仅提供目标人脸图像，也就是清晰度较高的人脸图像，然后降低目标人脸图像的清晰度，生成第一人脸图像，也称作将标人脸图像退化，在退化之后，标人脸图像的清晰度降低，从而获得清晰度小于目标人脸图像的第一人脸图像。

本公开的实施例中，“清晰度”可以指的是指图像中各细部影纹及其边界的清晰程度，清晰度越高，人眼的感观效果越好。输出图像的清晰度高于输入图像的清晰度，例如是指采用本公开实施例提供的图像处理方法对输入图像进行处理，例如进行去噪、超分和/或去模糊处理，从而使处理后得到的输出图像比输入图像更清晰

在一个实施例中，可以通过为图像添加噪声、高斯模糊、调整图像的亮度及对比度、对图像进行缩放处理、对于图像进行变形处理、为图像添加运动模糊效果中的一项或多项来对目标人脸图像进行退化处理。

应当理解的是，目标人脸图像中的人脸图像的质量相对较高，例如，目标人脸图像可能具有合适的亮度和对比度、其图像比例恰当、不存在运动模糊、图像质量较高等特点，实施时，可以通过降低或增加其亮度和对比度、调整其图像比例使图像比例失调等方式使目标人脸图像退化，以获得第一人脸图像，也就是获得清晰度较低的人脸图像。

这样，能够获得目标人脸图像和第一人脸图像的训练数据。

步骤102：将所述第一人脸图像输入第一网络模型，获得第二人脸图像。

本实施例中的第一网络模型是以人脸图像为输入，以对于输入的人脸图像的重建图像为输出的生成网络模型。

本实施例中的第一网络模型作为生成器，用于对输入的第一人脸图像进行处理重建。该第一网络模型对第一人脸图像进行去模糊化或分辨率提高处理，从而由该第一人脸图像获得第二人脸图像，换句话说，该第二人脸图像是第一网络模型对于第一人脸图像的重建结果。

步骤103：将所述目标人脸图像和所述第二人脸图像输入第二网络模型，获得判别结果。

本实施例中，第二网络模型是以人脸图像为输入，以对于输入的人脸图像的真实性的判别结果为输出的判别网络模型。

本实施例中的第二网络模型相当于判别器，第一网络模型和第二网络模型共同构成生成对抗网络，以进行模型训练。

第二网络模型判别结果包括输入的人脸图像的整体的真实性和局部特征的真实性的判别结果，其中，整体的真实性指的是从人脸图像的全局角度对于输入的人脸图像的判别结果，而局部特征的真实性指的是对于人脸图像的局部细节特征的判定结果。

一般来说，作为判别器的第二网络模型的输出的判别结果为0至1之间的数值，其中，判别结果越接近1，则说明第二网络模型判别的真实性越高，反之，如果判别结果越接近0，则说明第二网络模型判别的真实性越低。

步骤104：获取所述第一网络模型对应的第一损失函数，并根据所述第一损失函数调节所述第一网络模型的参数。

步骤105：获取所述第二网络模型对应的第二损失函数，并根据所述第二损失函数调节所述第二网络模型的参数。

步骤106：交替进行上述步骤，以对所述第一网络模型和所述第二网络模型轮流进行模型训练。

进一步的，分别建立第一网络模型对应的第一损失函数，以及第二网络模型对应的第二损失函数，并根据所建立的损失函数调整相应的第一网络模型或第二网络模型的参数对第一网络模型和第二网络模型进行模型训练。

本实施例中，对于第一网络模型和第二网络模型交替训练的过程是可以调整的。例如，可以第一网络模型进行一次训练，对第二网络模型进行一次训练，再对第一网络模型进行一次训练，依此类推；也可以对第一网络模型进行多次训练之后，在对第二网络模型进行一次训练，之后再对第一网络模型进行多次训练，依此类推。显然，本实施例中对于第一网络模型和第二网络模型的训练方式并不局限于此。

步骤107：将训练完成的第一网络模型作为人脸重建模型。

本实施例汇中，在第一损失函数和第二损失函数的值均达到相应的目标阈值时，或称第一损失函数和第二损失函数均收敛的情况下，认为第一网络模型已经训练完成，该训练完成的第一网络模型就是满足人脸重建需要的人脸重建模型。需要说明的是此处的目标阈值可以根据实际情况设置，例如可以为第一损失函数或第二损失函数能达到的最小值或最大值。

在一些实施例中，所述第一损失函数包含第一子损失和第二子损失，上述步骤104包括：

解析所述第二人脸图像，获得所述第二人脸图像对应的第三人脸部位图和第四人脸部位图；

本实施例中，目标人脸图像对应的第一人脸部位图和第二人脸部位图可以由训练数据直接提供，也可以通过对目标人脸图像进行解析获得。第二人脸图像对应的第三人脸部位图和第四人脸部位图则通过对第二人脸图像解析获得。

对于人脸图像解析获得相应的人脸部位图可以利用预训练的人脸解析模型实现，该人脸解析模型可以选择RoI Tanh(Face Parsing with RoI Tanh-Warping)等现有的或改进的人脸解析模型，此处不做进一步限定。

本实施例中，第一人脸部位图和所述第二人脸部位图对应同一人脸图像的不同区域，所述第一人脸部位图和所述第三人脸部位图对应的区域是相同的，换句话说，第一人脸部位图对应目标人脸图像的某一区域，例如眼睛区域，则第三人脸部位图对应第二人脸图像的眼睛区域，类似的，第二人脸部位图和第四人脸部位图对应人脸图像的同一区域。

在一些实施例中，第一人脸部位图包括人脸图像的五官图像，第二人脸部位图包括人脸图像的皮肤图像。

也就是说，第一人脸部位图和第三人脸部位图对应人脸图像中的五官图像，本实施例中又将其称作器官图，器官指的可以是口、鼻、双眼、眉毛、耳朵等五官。第二人脸部位图和第四人脸部位图对应的是五官之外的皮肤区域。

通过分别获得器官图对应的第一子损失和皮肤图对应的第二子损失，能够分别确定第一网络模型对于器官区域和皮肤区域的重建结果，从而提高对于第一网络模型的调节精度，有助于提高模型训练效率。

应当理解的是，本实施例中的各个子损失可以以不同的方式计算，例如，可以以第一人脸部位图和第三人脸部位图的L1损失作为第一子损失，也可以以第一人脸部位图和第三人脸部位图的L2损失作为第一子损失，显然，实施时，还可以本实施例中对此不做进一步限定。其中，L1损失指的是最小绝对值偏差(LAD)，L2损失指的是最小平方误差(LSE)，具体计算方式可参考相关技术，此处不再赘述。

本实施例中，以第一子损失为通过人脸解析模型生成的目标人脸图像的器官图和第一网络模型输出的第二人脸图像的器官图之间的L2损失为例说明，本实施例中，将第一子损失记作L2_feat。

本实施例中，以第二子损失为通过人脸解析模型生成的目标人脸图像的皮肤图和第一网络模型输出的第二人脸图像的皮肤图之间的L2损失为例说明，本实施例中，将第二子损失记作L2_skin。

应当理解的是，人脸图像的人脸部位图和皮肤图是图像，能够体现从人的视觉和主观角度的感觉，也就是说，体现的是从人的视觉观察角度对于第一网络模型的输出结果和目标人脸图像之间的相似度的感受。

在一些实施例中，所述第一损失函数包含第三子损失，上述步骤104还包括：

获取所述目标人脸图像对应的第一特征点数据；

本实施例中根据目标人脸图像和第二人脸图像中的特征点进行人脸对齐分析，该人脸对齐分析的过程可以理解为通过人脸对齐模型提取目标人脸图像的第一特征点数据，然后提取第二人脸图像的第二特征点数据，将提取的第一特征点数据与第二特征点数据相对比，根据其差异值确定第三子损失。

对于特征点数据的分析可以理解为从数值角度对第一网络模型的输出结果和输入图像对应的真实人脸之间的相似度进行对比。

在一些实施例中，可以通过坐标回归提取人脸图像的特征点数据，速度较快，且计算量较小。

在其他一些实施例中，特征点数据包括人脸图像的热图，人脸图像的热图包括人脸图像的左眼热图、右眼热图、鼻部热图、嘴部热图和脸部轮廓热图中的一项或多项。例如，左眼热图指的是位于左眼对应的区域的关键点构成的热图，脸部轮廓热图指的是各器官之外的区域对应的关键点构成的热图，依此类推，生成构成人脸图像的多个局部热图。通过生成构成人脸图像的多个局部热图，有助于进一步提高对于人脸图像的特征点数据计算的精确程度。

本实施例中，首先确定关键点，关键点的数量可以根据需要设置，例如，选择68点热图；接下来，输出与关键点个数n相同的n幅热图，本实施例中为68幅热图；进一步的，寻找热图中峰值最高的点，作为关键点，或者对热图中每个像素点的贡献值进行加权计算，得到关键点坐标。

通过基于热图回归获得人脸图像的特征点数据，能够进一步提高计算精度。

实施时，首先提供一预训练的人脸对齐模型，该人脸对齐模型具体可以是AWing([ICCV 2019]Adaptive Wing Loss for Robust Face Alignment via Heatmap Regression)等人脸对齐模型，具体可参考相关技术。

接下来，分别利用人脸对齐模型获取目标人脸图像的第一特征点数据，也就是目标人脸图像的热图，利用人脸对齐模型获取第二人脸图像的第二特征点数据，也就是第二人脸图像的热图。

最后，根据第一特征点数据和第二特征点数据的差异得到第三子损失。本实施例中，第三子损失为目标人脸图像的热图和第二人脸图像的热图的L2损失，将其记作L2_heatmap。

在一些实施例中，所述第一损失函数包含第四子损失，上述步骤104还包括：

获取所述目标人脸图像对应的第一特征向量；

获取所述第二人脸图像对应的第二特征向量；

本实施例中还对目标人脸图像和第二人脸图像进行特征分析，具体的，首先计算目标人脸图像的特征向量，然后计算第二人脸图像的特征向量，最后根据这两个特征向量之间的差异确定第子损失。

本实施例中通过计算这两个特征向量的余弦相似度，然后以1减去该余弦相似度作为特征分析对应的损失函数，本实施例中将该第四子损失记作LCosSimilarity。

在一些实施例中，所述第一损失函数包含第五子损失，上述步骤104还包括：

本实施例中，还进一步引入了目标人脸图像与第一网络模型输出的人脸重建图像的L2损失作为第五子损失。实施时，可以通过预训练人脸识别模型确定目标人脸图像和第二人脸图像的差异值，人脸识别模型可以是ArcFace《ArcFace:Additive Angular Margin Loss for Deep Face Recognition》等现有的或改进的人脸识别模型。实施例中将第五子损失记作L20。

在一些实施例中，所述第一损失函数包含第六子损失和第七子损失中的一项或多项，上述步骤104还包括：

本实施例中，进一步分别对眼部区域图像和嘴部区域图像进行分析，分别确定在目标人脸图像和第二人脸图像在眼部区域图像的感知损失，作为第六子损失，记作L2_eye；确定在目标人脸图像和第二人脸图像在嘴部区域图像的感知损失，作为第七子损失，记作L2_mouth。

在一些实施例中，所述第一损失函数包含第八子损失，上述步骤104还包括：

根据所述第一网络模型和所述第二网络模型之间的生成对抗损失获得所述第八子损失。

实施时，首先将第一网络模型输出的第二人脸图像标记为真，具体的，例如将其标记为1，然后将该第二人脸图像输入全局判别子网络、眼部判别子网络和嘴部判别子网络中的一项或多项之后，获得相应的判别结果，所得到的判别结果是一个位于0至1之间的数值，根据该判别结果和1之间的差异，得到第一网络模型和所述第二网络模型之间的生成对抗损失，记作第八子损失LG。

本实施例中，第二网络模型包括全局判别子网络、眼部判别子网络和嘴部判别子网络中的一项或多项。

当将标记为真的第二人脸图像输入全局判别子网络后，根据全局判别子网络的判定结果能够确定全局对抗损失，记作LG_all；将标记为真的第二人脸图像输入眼部判别子网络后，根据眼部判别子网络的判定结果能够确定眼部对抗损失，记作LG_eye；将标记为真的第二人脸图像输入嘴部判别子网络后，根据嘴部判别子网络的判定结果能够确定嘴部对抗损失，记作LG_mouth。

在确定了上述第一子损失至第八子损失之后，能够获得第一损失函数，本实施例中将第一损失函数记作L，则:

L＝w1*L2_feat+w2*L2_skin+w3*L2_heatmap+w4*LCosSimilarity+w5*L20+w6*L2_eye+w7*L2_mouth+LG。

其中，LG＝w8*LG_all+w9*LG_eye+w10*LG_mouth。

上述公式中，w1至w10分别为各损失值对应的权重系数，可以根据需要设定，例如，可以均设置为1，也可以根据不同损失值的重要性程度，将重要性程度较大的损失值对应的系数设置的相对较大，从而获得第一网络模型对应的第一损失函数。

在一些实施例中，所述第二损失函数包含第一判别对抗损失，上述步骤106还包括：

根据所述第一判别结果和所述第二判别结果得到所述第一判别对抗损失。。

本实施例中，第二网络模型包括全局判别子网络，实施时，首先将第一网络模型输出的第二人脸图像标记为假，例如可以是标记为0，将目标人脸图像标记为真，例如可以是标记为0。然后将第二人脸图像和目标人脸图像分别输入全局判别子网络，获得判别结果，该判别结果是一个位于0至1之间的数值，其中，第二人脸图像对应的判别结果为第一判别结果，第二人脸图像对应的判别结果为第二判别结果。

接下来，根据所获得的第一判别结果和第二判别结果确定的第一网络模型和全局判别子网络对应的第一判别对抗损失，记作LD_all。

在一些实施例中，所述第二损失函数包含第二判别对抗损失和第三判别对抗损失，上述步骤106还包括：

根据所述第五判别结果和所述第六判别结果得到第三判别对抗损失。。

在确定第二判别对抗损失和第三判别对抗损失时，需要提取第二人脸图像的眼部图像和嘴部图像，本实施例中，将第二人脸图像的眼部图像记作第一眼部图像，将第二人脸图像的嘴部图像记作第一嘴部图像。

在确定第二判别对抗损失和第三判别对抗损失时，还需要提取目标人脸图像的眼部图像和嘴部图像，本实施例中，将目标人脸图像的眼部图像记作第二眼部图像，将目标人脸图像的嘴部图像记作第二嘴部图像。

将所提取的第一眼部图像和第一嘴部图像均标记为假，例如，均标记为0，将第二眼部图像和第二嘴部图像均标记为真，例如，均标记为1。

将第一眼部图像输入眼部判别子网络，获得第三判别结果；将第二眼部图像输入眼部判别子网络，获得第四判别结果；将第一嘴部图像输入嘴部判别子网络，获得第五判别结果；将第二嘴部图像输入嘴部判别子网络，获得第六判别结果。

最后，根据第三判别结果和第四判别结果的差异得到第二判别对抗损失，记作LD_eye，根据第五判别结果和第六判别结果的差异得到第三判别对抗损失，记作LD_mouth。

在确定了第一判别对抗损失、第二判别对抗损失和第三判别对抗损失之后，能够获得第二损失函数，记作LD＝w11*LD_all+w12*LD_mouth+w13*LD_mouth。其中，w11至w13为各损失值对应的权重系数。

本公开实施例还提供了一种人脸重建方法。

如图2所示，该人脸重建方法包括以下步骤：

步骤201：获取输入图像；

步骤202：将所述输入图像输入人脸重建模型，获得人脸重建数据。

本实施例中，人脸重建模型是通过以上任一项的人脸重建模型的训练方法进行模型训练得到的。

本实施例中，所使用的人脸重建模型为通过上述人脸重建模型的训练方法训练获得的人脸重建模型，将输入图像输入该人脸重建模型，能够输出与真实的人脸图像一致程度较高的人脸重建结果。

本公开提供了一种人脸重建模型的训练装置。

在一个实施例中，如图3所示，该人脸重建模型的训练装置300包括：

训练数据获取模块301，用于获取训练数据，所述训练数据包括目标人脸图像和与所述目标人脸图像对应的第一人脸图像，所述第一人脸图像的清晰度小于所述目标人脸图像的清晰度；

第一输入模块302，用于将所述第一人脸图像输入第一网络模型，获得第二人脸图像，其中，所述第一网络模型是以人脸图像为输入，以对于输入的人脸图像的重建图像为输出的生成网络模型；

第二输入模块302，用于将所述目标人脸图像和所述第二人脸图像输入第二网络模型，获得判别结果，其中，所述第二网络模型是以人脸图像为输入，以对于输入的人脸图像的真实性的判别结果为输出的判别网络模型，所述判别结果包括输入的人脸图像的整体的真实性和局部特征的真实性的判别结果；

第一损失函数获取模块304，用于获取所述第一网络模型对应的第一损失函数，并根据所述第一损失函数调节所述第一网络模型的参数；

第二损失函数获取模块305，用于获取所述第二网络模型对应的第二损失函数，并根据所述第二损失函数调节所述第二网络模型的参数；

训练模块306，用于对所述第一网络模型和所述第二网络模型轮流进行模型训练；

人脸重建模型确认模块307，用于将训练完成的第一网络模型作为人脸重建模型，其中，在训练完成的情况下，所述第一损失函数和所述第二损失函数的值均达到相应的目标阈值。

所述第二损失函数获取模块305，包括：

第一判别结果获取子模块，用于根将所述第二人脸图像标记为假，将所述目标人脸图像标记为真，将所述第二人脸图像和所述目标人脸图像分别输入所述全局判别子网络，分别得到第一判别结果和第二判别结果；

第一判别对抗损失获取子模块，用于根据所述第一判别结果和所述第二判别结果得到所述第一判别对抗损失。

所述第二损失函数获取模块305，还包括：

第二判别对抗损失获取子模块，用于

第一图像获取子模块，用于根据所述第二人脸图像得到对应的第一眼部图像和第一嘴部图像；

第二图像获取子模块，用于根据所述目标人脸图像得到对应的第二眼部图像和第二嘴部图像；

标记子模块，用于将所述第一眼部图像和所述第一嘴部图像标记为假，将所述第二眼部图像和第二嘴部图像标记为真，将所述第一眼部图像和所述第二眼部图像分别输入到所述眼部判别子网络分别输出第三判别结果和第四判别结果；所述第一嘴部图像和第二嘴部图像分别输入到所述嘴部判别子网络分别输出第五判别结果和第六判别结果；

第二判别对抗损失获取子模块，用于根据所述第三判别结果和第四判别结果得到第二判别对抗损失；

第三判别对抗损失获取子模块，用于根据所述第五判别结果和第六判别结果得到第三判别对抗损失。

第一损失函数获取模块304，包括：

人脸部位图获取子模块，用于获取所述目标人脸图像对应的第一人脸部位图和第二人脸部位图；

第一解析子模块，用于解析所述第二人脸图像，获得所述第二人脸图像对应的第三人脸部位图和第四人脸部位图，其中，所述第一人脸部位图和所述第二人脸部位图对应同一人脸图像的不同区域，所述第一人脸部位图和所述第三人脸部位图对应不同人脸图像的同一区域，所述第二人脸部位图和所述第四人脸部位图对应不同人脸图像的同一区域；

第一子损失获取子模块，用于根据所述第一人脸部位图和所述第三人脸部位图之间的差异，得到所述第一子损失；

第二子损失获取子模块，用于根据所述第二人脸部位图和所述第四人脸部位图之间的差异，得到所述第二子损失。

在一些实施例中，所述第一损失函数包含第三子损失；

所述第一损失函数获取模块304，还包括：

特征点数据获取子模块，用于获取所述目标人脸图像对应的第一特征点数据；

第二解析子模块，用于解析所述第二人脸图像，获得所述第二人脸图像对应的第二特征点数据；

第二子损失获取子模块，用于根据所述第一特征点数据和所述第二特征点数据之间的差异，得到所述第三子损失。

在一些实施例中，所述第一损失函数包含第四子损失；

所述第一损失函数获取模块304，还包括：

特征向量获取子模块，用于获取所述目标人脸图像对应的第一特征向量；

所述特征向量获取子模块，还用于获取所述第二人脸图像对应的第二特征向量；

第四子损失获取子模块，用于根据所述第一特征向量和所述第二特征向量之间的差异，得到所述第四子损失。

在一些实施例中，所述第一损失函数包含第五子损失；

所述第一损失函数获取模块304，还包括：

第五子损失获取子模块，用于根据所述目标人脸图像和所述第二人脸图像的差异，得到所述第五子损失。

所述第一损失函数获取模块304，还包括：

第六子损失获取子模块，用于根据所述目标人脸图像的眼部区域图像和所述第二人脸图像的眼部区域图像之间的差异的感知损失作为所述第六子损失；和/或

第七子损失获取子模块，用于根据所述目标人脸图像的嘴部区域图像和所述第二人脸图像的嘴部区域图像之间的差异的感知损失作为所述第七子损失。

在一些实施例中，所述第一损失函数包含第八子损失；

所述第一损失函数获取模块304，还包括：

第八子损失获取子模块，用于根据所述第一网络模型和所述第二网络模型之间的生成对抗损失获得所述第八子损失，其中，所述第二网络模型包括全局判别子网络、眼部判别子网络和嘴部判别子网络中的一项或多项，所述生成对抗损失是将所述第一网络模型输出的第二人脸图像标记为真，然后将第二人脸图像输入所述全局判别子网络、眼部判别子网络和嘴部判别子网络中的一项或多项之后，获得判别结果，并根据所获得的判别结果确定的。

本公开实施例的人脸重建模型的训练装置能够实现上述人脸重建模型的训练方法实施例的各个步骤，并至少能实现相同或相似的技术效果，此处不再赘述

本公开实施例提供了一种人脸重建装置。

如图4所示，在一个实施例中，该人脸重建装置400包括：

输入图像获取模块401，用于获取输入图像；

输入模块402，用于将所述输入图像输入人脸重建模型，获得人脸重建图像，其中，所述人脸重建模型是通过上述中任一项的人脸重建模型的训练方法进行模型训练得到的。

本公开实施例的人脸重建装置实现上述人脸重建方法的各个步骤，并至少能实现相同或相似的技术效果，此处不再赘述

本公开实施例提供了一种电子设备，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如以上任一项所述的人脸重建模型的训练方法的步骤，或者实现如上述的人脸重建方法的步骤。

本公开实施例提供了一种可读存储介质，其上存储有计算机程序，所述计算机程序被所述处理器执行时实现如以上任一项所述的人脸重建模型的训练方法的步骤，或者实现如上述的人脸重建方法的步骤。

本实施例的电子设备和可读存储介质能够实现上述人脸重建模型的训练方法和人脸重建方法的步骤，并至少能实现相同或相似的技术效果，此处不再赘述。

以上，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

一种人脸重建模型的训练方法，包括以下步骤：

获取训练数据，所述训练数据包括目标人脸图像和与所述目标人脸图像对应的第一人脸图像，所述第一人脸图像的清晰度小于所述目标人脸图像的清晰度；

将所述第一人脸图像输入第一网络模型，获得第二人脸图像，其中，所述第一网络模型是以人脸图像为输入，以对于输入的人脸图像的重建图像为输出的生成网络模型；

将所述目标人脸图像和所述第二人脸图像输入第二网络模型，获得判别结果，其中，所述第二网络模型是以人脸图像为输入，以对于输入的人脸图像的真实性的判别结果为输出的判别网络模型，所述判别结果包括输入的人脸图像的整体的真实性和局部特征的真实性的判别结果；

获取所述第一网络模型对应的第一损失函数，并根据所述第一损失函数调节所述第一网络模型的参数；

获取所述第二网络模型对应的第二损失函数，并根据所述第二损失函数调节所述第二网络模型的参数；

交替进行上述步骤，以对所述第一网络模型和所述第二网络模型轮流进行模型训练；

将训练完成的第一网络模型作为人脸重建模型，其中，在训练完成的情况下，所述第一损失函数和所述第二损失函数的值均达到相应的目标阈值。
根据权利要求1所述的方法，其中，所述第二损失函数包含第一判别对抗损失，第二网络模型包含全局判别子网络；

所述获取所述第二网络模型对应的第二损失函数，包括：

将所述第二人脸图像标记为假，将所述目标人脸图像标记为真，将所述第二人脸图像和所述目标人脸图像分别输入所述全局判别子网络，分别得到第一判别结果和第二判别结果；

根据所述第一判别结果和所述第二判别结果得到所述第一判别对抗损失。
根据权利要求2所述的方法，其中，所述第二损失函数包含第二判别对抗损失和第三判别对抗损失，所述第二网络模型还包括眼部判别子网络和嘴部判别子网络；

所述获取所述第二网络模型对应的第二损失函数，包括：

根据所述第二人脸图像得到对应的第一眼部图像和第一嘴部图像；

根据所述目标人脸图像得到对应的第二眼部图像和第二嘴部图像；

将所述第一眼部图像和所述第一嘴部图像标记为假，将所述第二眼部图像和第二嘴部图像标记为真，将所述第一眼部图像和所述第二眼部图像分别输入到所述眼部判别子网络分别输出第三判别结果和第四判别结果；所述第一嘴部图像和第二嘴部图像分别输入到所述嘴部判别子网络分别输出第五判别结果和第六判别结果；

根据所述第三判别结果和所述第四判别结果得到第二判别对抗损失；

根据所述第五判别结果和所述第六判别结果得到第三判别对抗损失。
根据权利要求1至3中任一项所述的方法，其中，所述第一损失函数包含第一子损失和第二子损失；

所述获取所述第一网络模型对应的第一损失函数，包括：

获取所述目标人脸图像对应的第一人脸部位图和第二人脸部位图；

解析所述第二人脸图像，获得所述第二人脸图像对应的第三人脸部位图和第四人脸部位图，其中，所述第一人脸部位图和所述第二人脸部位图对应同一人脸图像的不同区域，所述第一人脸部位图和所述第三人脸部位图对应不同人脸图像的同一区域，所述第二人脸部位图和所述第四人脸部位图对应不同人脸图像的同一区域；

根据所述第一人脸部位图和所述第三人脸部位图之间的差异，得到所述第一子损失；

根据所述第二人脸部位图和所述第四人脸部位图之间的差异，得到所述第二子损失。
根据权利要求4所述的方法，其中，所述第一人脸部位图包括人脸图像的五官图像，所述第二人脸部位图包括所述人脸图像的皮肤图像。
根据权利要求1至3中任一项所述的方法，其中，所述第一损失函数包含第三子损失；

所述获取所述第一网络模型对应的第一损失函数，还包括：

获取所述目标人脸图像对应的第一特征点数据；

解析所述第二人脸图像，获得所述第二人脸图像对应的第二特征点数据；

根据所述第一特征点数据和所述第二特征点数据之间的差异，得到所述第三子损失。
根据权利要求6所述的方法，其中，所述第一特征点数据包括所述目标人脸图像的热图，所述第二特征点数据包括所述第二人脸图像的热图，其中，热图包括人脸图像的左眼热图、右眼热图、鼻部热图、嘴部热图和脸部轮廓热图中的一项或多项。
根据权利要求1至3中任一项所述的方法，其中，所述第一损失函数包含第四子损失；

所述获取所述第一网络模型对应的第一损失函数，还包括：

获取所述目标人脸图像对应的第一特征向量；

获取所述第二人脸图像对应的第二特征向量；

根据所述第一特征向量和所述第二特征向量之间的差异，得到所述第四子损失。
根据权利要求1至3中任一项所述的方法，其中，所述第一损失函数包含第五子损失；

所述获取所述第一网络模型对应的第一损失函数，还包括：

根据所述目标人脸图像和所述第二人脸图像的差异，得到所述第五子损失。
根据权利要求1至3中任一项所述的方法，其中，所述第一损失函数包含第六子损失和第七子损失中的一项或多项；

所述获取所述第一网络模型对应的第一损失函数，还包括：

根据所述目标人脸图像的眼部区域图像和所述第二人脸图像的眼部区域图像之间的差异的感知损失作为所述第六子损失；和/或

根据所述目标人脸图像的嘴部区域图像和所述第二人脸图像的嘴部区域图像之间的差异的感知损失作为所述第七子损失。
根据权利要求1至3中任一项所述的方法，其中，所述第一损失函数包含第八子损失；

所述获取所述第一网络模型对应的第一损失函数，还包括：

根据所述第一网络模型和所述第二网络模型之间的生成对抗损失获得所述第八子损失，其中，所述第二网络模型包括全局判别子网络、眼部判别子网络和嘴部判别子网络中的一项或多项，所述生成对抗损失是将所述第一网络模型输出的第二人脸图像标记为真，然后将第二人脸图像输入所述全局判别子网络、眼部判别子网络和嘴部判别子网络中的一项或多项之后，获得判别结果，并根据所获得的判别结果确定的。
一种人脸重建方法，包括以下步骤：

获取输入图像；

将所述输入图像输入人脸重建模型，获得人脸重建图像，其中，所述人脸重建模型是通过权利要求1至11中任一项的人脸重建模型的训练方法进行模型训练得到的。
一种人脸重建模型的训练装置，包括：

训练数据获取模块，用于获取训练数据，所述训练数据包括目标人脸图像和与所述目标人脸图像对应的第一人脸图像，所述第一人脸图像的清晰度小于所述目标人脸图像的清晰度；

第一输入模块，用于将所述第一人脸图像输入第一网络模型，获得第二人脸图像，其中，所述第一网络模型是以人脸图像为输入，以对于输入的人脸图像的重建图像为输出的生成网络模型；

第二输入模块，用于将所述目标人脸图像和所述第二人脸图像输入第二网络模型，获得判别结果，其中，所述第二网络模型是以人脸图像为输入，以对于输入的人脸图像的真实性的判别结果为输出的判别网络模型，所述判别结果包括输入的人脸图像的整体的真实性和局部特征的真实性的判别结果；

第一损失函数获取模块，用于获取所述第一网络模型对应的第一损失函数，并根据所述第一损失函数调节所述第一网络模型的参数；

第二损失函数获取模块，用于获取所述第二网络模型对应的第二损失函数，并根据所述第二损失函数调节所述第二网络模型的参数；

训练模块，用于对所述第一网络模型和所述第二网络模型轮流进行模型训练；

人脸重建模型确认模块，用于将训练完成的第一网络模型作为人脸重建模型，其中，在训练完成的情况下，所述第一损失函数和所述第二损失函数的值均达到相应的目标阈值。
一种人脸重建装置，包括：

输入图像获取模块，用于获取输入图像；

输入模块，用于将所述输入图像输入人脸重建模型，获得人脸重建图像，其中，所述人脸重建模型是通过权利要求1至11中任一项的人脸重建模型的训练方法进行模型训练得到的。
一种电子设备，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至11中任一项所述的人脸重建模型的训练方法的步骤，或者实现如权利要求12中所述的人脸重建方法的步骤。
一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的人脸重建模型的训练方法的步骤，或者实现如权利要求12中所述的人脸重建方法的步骤。