WO2022088089A1

WO2022088089A1 - 图像处理方法、图像处理装置、电子设备及可读存储介质

Info

Publication number: WO2022088089A1
Application number: PCT/CN2020/125463
Authority: WO
Inventors: 王镜茹; 陈冠男; 胡风硕; 刘瀚文
Original assignee: 京东方科技集团股份有限公司
Priority date: 2020-10-30
Filing date: 2020-10-30
Publication date: 2022-05-05
Also published as: CN114698398A; US20230325973A1

Abstract

本公开提供一种图像处理方法、图像处理装置、电子设备及可读存储介质，该图像处理方法包括：接收输入图像；利用第一生成器对所述输入图像进行处理得到输出图像，其中，所述输出图像的清晰度高于所述输入图像的清晰度；其中，所述第一生成器是利用至少两个鉴别器对待训练生成器训练得到。本公开中，由于用于图像修复的第一生成器是采用至少两个鉴别器训练得到，因此能够使得修复的图像细节更加丰富，提高修复效果。

Description

图像处理方法、图像处理装置、电子设备及可读存储介质

技术领域

本公开实施例涉及图像处理技术领域，尤其涉及一种图像处理方法、图像处理装置、电子设备及可读存储介质。

背景技术

图像质量修复技术在老照片修复，视频清晰化等领域中有着广泛应用。当前的大多数算法使用超分辨率重构技术来修复低清图像，得到的结果通常比较平滑，或者，在人脸修复过程中人脸五官比较容易变形，因此，如何提高图像的修复效果是亟待解决的技术问题。

发明内容

本公开实施例提供一种图像处理方法、图像处理装置、电子设备及可读存储介质，用于解决目前的图像修复方法修复效果不理想的问题。

为了解决上述技术问题，本公开是这样实现的：

第一方面，本公开实施例提供了一种图像处理方法，包括：

接收输入图像；

利用第一生成器对所述输入图像进行处理得到输出图像，其中，所述输出图像的清晰度高于所述输入图像的清晰度；

其中，所述第一生成器是利用至少两个鉴别器对待训练生成器训练得到。

第二方面，本公开实施例提供了一种图像处理方法，包括：

接收输入图像；

对所述输入图像进行人脸检测，得到人脸图像；

采用如上述第一方面的方法对所述人脸图像进行处理得到第一修复训练图像，其中，所述第一修复训练图像的清晰度高于所述输入图像的清晰度；

对所述输入图像或去除所述人脸图像的输入图像进行处理得到第二修复训练图像，其中，所述第二修复训练图像的清晰度高于所述输入图像的清晰度；

将所述第一修复训练图像和所述第二修复训练图像进行融合，得到融合后的图像，所述融合图像的清晰度高于所述输入图像的清晰度。

第三方面，本公开实施例提供了一种图像处理装置，包括：

接收模块，用于接收输入图像；

处理模块，用于利用第一生成器对所述输入图像进行处理得到输出图像，其中，所述输出图像的清晰度高于所述输入图像的清晰度；

第四方面，本公开实施例提供了一种图像处理装置，包括：

接收模块，用于接收输入图像；

人脸检测模块，用于对所述输入图像进行人脸检测，得到人脸图像；

第一处理模块，用于采用如上述第一方面所述的方法对所述人脸图像进行处理得到第一修复训练图像，其中，所述第一修复训练图像的清晰度高于所述输入图像的清晰度；

第二处理模块，用于对所述输入图像或去除所述人脸图像的输入图像进行处理得到第二修复训练图像，其中，所述第二修复训练图像的清晰度高于所述输入图像的清晰度；

第五方面，本公开实施例提供了一种电子设备，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现上述第一方面的所述的图像处理方法的步骤，或者，所述程序或指令被所述处理器执行时实现上述第二方面所述的图像处理方法的步骤。

第六方面，本公开实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如上述第一方面所述的图像处理方法的步骤，或者，实现如上述第二方面所述的图像处理方法的步骤。

在本公开实施例中，由于用于图像修复的第一生成器是采用至少两个鉴别器训练得到，因此能够使得修复的图像细节更加丰富，提高修复效果。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本公开的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本公开一实施例的图像处理方法的流程示意图；

图2为本公开一实施例的多尺度的第一生成器的示意图；

图3为本公开另一实施例的图像处理方法的流程示意图；

图4为本公开又一实施例的图像处理方法的流程示意图；

图5为本公开实施例的关键点提取方法的示意图；

图6为本公开实施例的关键点蒙版图像的生成方法的示意图；

图7为本公开实施例的另一实施例的多尺度的第一生成器的示意图；

图8为本公开实施例的生成器的各类损失的示意图；

图9、图11、图13、图17、图18、图19为本公开一实施例的生成器的训练方法的示意图；

图10、图12、图14为本公开一实施例的鉴别器的训练方法的示意图；

图15为本公开实施例的人脸部位图像的示意图；

图16为本公开一实施例的生成器和鉴别器的输入和输出示意图；

图20为本公开另一实施例的生成器的训练方法的示意图；

图21为本公开另一实施例的鉴别器的训练方法的示意图；

图22为本公开另一实施例的生成器和鉴别器的输入和输出示意图；

图23为本公开又一实施例的生成器的训练方法的示意图；

图24为本公开又一实施例的鉴别器的训练方法的示意图；

图25为本公开又一实施例的图像处理方法的流程示意图；

图26为本公开一实施例的图像处理装置的结构示意图；

图27为本公开另一实施例的图像处理装置的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

请参考图1，本公开实施例提供一种图像处理方法，包括：

步骤11：接收输入图像；

所述输入图像可以为待处理的图像，例如为清晰度较低的图像。待处理图像可以是从视频中提取的视频帧，也可以是通过网络下载或者通过相机拍摄的图片，还可以为通过其他途径获取的图像，本公开的实施例对此不作限制。输入图像中例如有很多噪声，且画质比较模糊，因此需要利用本公开实施例提供的图像处理方法来去噪和/或去模糊，从而提升清晰度，实现画质增强。例如，当输入图像为彩色图像时，输入图像可以包括红色(R)通道输入图像、绿色(G)通道输入图像和蓝色(B)通道输入图像。

步骤12：利用第一生成器对所述输入图像进行处理得到输出图像，其中，所述输出图像的清晰度高于所述输入图像的清晰度；其中，所述第一生成器是利用至少两个鉴别器对待训练生成器训练得到。

第一生成器可以为已经训练好的神经网络。待训练生成器可以为基于上文描述的卷积神经网络的结构建立的，但是参数还需要训练的网络。例如，利用待训练生成器来训练第一生成器，待训练生成器的参数多于第一生成器的参数。例如，神经网络的参数包括神经网络中各个卷积层的权重参数。权重参数的绝对值越大，则该权重参数对应的神经元对神经网络的输出的贡献越大，进而对该神经网络来说越重要。通常，参数越多的神经网络的复杂度越高，其“容量”也就越大，也就意味着该神经网络能完成更复杂的学习任务。相对于待训练生成器，第一生成器得到了简化，第一生成器具有更少的参数和更简单的网络结构，使得第一生成器在其运行时占用较少的资源(例如计算资源、存储资源等)，因而可以应用于轻量级的终端。采用上述训练的方式，可以使第一生成器学习待训练生成器的推理能力，从而使第一生成器在具备简单结构的同时具备较强的推理能力。

需要说明的是，本公开的实施例中，“清晰度”例如是指图像中各细部影纹及其边界的清晰程度，清晰度越高，人眼的感观效果越好。修复训练图像的清晰度高于输入图像的清晰度，例如是指采用本公开实施例提供的图像处理方法对输入图像进行处理，例如进行去噪和/或去模糊处理，从而使处理后得到的修复训练图像比输入图像更清晰。

本公开实施例中，所述输入图像可以包含人脸图像，即第一生产器用于进行人脸修复，当然，所述输入图像也可以是其他类型的图像。

本公开实施例中，由于用于图像修复的第一生成器是采用至少两个鉴别器训练得到，因此能够使得修复的图像细节更加丰富，提高修复效果。

在本公开的一些实施例中，可选的，所述第一生成器包括N个修复模块，所述修复模块用于对输入的指定尺度的图像进行去噪和/或去模糊，提升输入的图像的清晰度。其中，N为大于或等于2的整数，在一些优选实施例中，N可以等于4，进一步优选的，请参考图2，4个修复模块包括：64*64尺度的修复模块、128*128尺度的修复模块、256*256尺度的修复模块和512*512尺度的修复模块。当然，上述修复模块的个数也可以为其他数值，每个修复模块对应的尺度也不限于上述举例的四种。

本公开实施例中，尺度是指分辨率。

本公开实施例中，可选的，所述修复模块采用的网络结构为SRCNN或U-Net。

本公开实施例中，可选的，利用第一生成器对所述输入图像进行处理得到输出图像包括：

将所述输入图像处理成N个尺度的待修复图像，其中，第一尺度的待修复图像的尺度到第N尺度的待修复图像的尺度依次递增；

利用所述N个修复模块和所述N个尺度的待修复图像，得到所述输出图像。本公开实施例中，可选的，所述N个尺度中相邻的两个尺度，后一个尺度为前一个尺度的2倍。例如，N个尺度分别64*64尺度、128*128尺度、256*256尺度和512*512尺度。

本公开实施例中，可选的，将所述输入图像处理成N个尺度的待修复图像包括：

确定所述输入图像所属的尺度区间；

将所述输入图像处理成与其所属的尺度区间对应的第j尺度的待修复图像，所述第j尺度为所述第一尺度至第N尺度中的一种；

对所述第j尺度的待修复图像进行上采样和/或下采样处理，得到其余N-1个尺度的待修复图像。

上述实施例中的上采样和下采样可以为插值，例如双立方插值等。

即，可以首先将所述输入图像处理成是N个尺度中的其中一个尺度的待修复图像，然后对待修复图像进行上采样和/或下采样图像，得到其他N-1个尺度的待修复图像。或者，也可以将所述输入图像依次采样为N个尺度的待修复图像。

请参考图2，图2所示的实施例中，首先判断输入图像的尺度所属的尺度区间，若输入图像的尺度小于或等于96*96，则对输入图像进行上采样或下采样处理，得到64*64尺度的待修复训练图像，然后，再对64*64尺度的待修复训练图像进行上采样，得到128*128、256*256、512*512尺度的待修复训练图像。若输入图像的尺度大于96*96且小于或等于192*192，则对输入图像进行上采样或下采样处理，得到128*128尺度的待修复训练图像，然后，再对128*128尺度的待修复训练图像进行下采样和上采样，得到64*64、256*256、512*512尺度的待修复训练图像。若输入图像的尺度大于192*192且小于或等于384*384，则对输入图像进行上采样或下采样处理，得到256*256尺度的待修复训练图像，然后，再对256*256尺度的待修复训练图像进行下采样和上采样，得到64*64、128*128、512*512尺度的待修复训练图像。若输入图像的尺度大于384*384，则对输入图像进行上采样或下采样处理，得到512*512尺度的待修复训练图像，然后，再对512*512尺度的待修复训练图像进行下采样，得到64*64、128*128、256*256尺度的待修复训练图像。

当然，需要说明的是，上述用于判断输入图像所属的区间的数值，可以根据需要进行选择，上述方案中是取N个尺度的待修复图像中的相邻两个尺度的中间尺度，例如64*64和128*128相邻两个尺度的中间尺度就是96*96，128*128和256*256相邻两个尺度的中间尺度就是192*192，以此类推，当然具体方案也不限于上述96*96、192*192、384*384。

上述实施例中，上采样或下采样可以通过插值方式实现。

在本公开的一些实施例中，请参考图3，利用所述N个修复模块和所述N个尺度的待修复图像，得到所述输出图像包括：

步骤31：将第一尺度的待修复图像和第一尺度的随机噪声图像进行拼接，得到第一拼接图像；将所述第一拼接图像输入至第一个修复模块中得到第一尺度的修复图像；对所述第一尺度的修复图像进行上采样处理，得到第二尺度的上采样图像；

上述第一尺度的随机噪声图像可以是随机生成的，也可以是通过对输入图像相同尺度的随机噪声图像通过上采样或下采样生成。

仍以图2为例进行说明，得到64*64尺度的待修复图像(即图2中的输入1)和64*64尺度的随机噪声图像之后，将64*64尺度的待修复图像和64*64尺度的随机噪声图像进行拼接，得到第一拼接图像，并将第一拼接图像输入到第一个修复模块中，得到64*64尺度的修复图像，然后对64*64尺度的修复图像进行上采样处理，得到128*128尺度的上采样图像；

步骤32：将第i尺度的上采样图像、第i尺度的待修复图像和第i尺度的随机噪声图像进行拼接，得到第i拼接图像；将所述第i拼接图像输入至第i个修复模块中得到第i尺度的修复图像；对所述第i尺度的修复图像进行上采样处理，得到第i+1尺度的上采样图像；其中，i为大于或等于2的整数；

第i个修复模块是位于第一个修复模块和最后一个修复模块之间的修复模块。

仍以图2为例进行说明，对于第二个修复模块，首先将得到的128*128尺度的待修复图像(即图2中的输入2)、128*128尺度的随机噪声图像以及128*128尺度的上采样图像进行拼接，得到第二拼接图像，并将第二拼接图像输入到第二个修复模块中，得到128*128尺度的修复图像，然后对128*128尺度的修复图像进行上采样处理，得到256*256尺度的上采样图像；对于第三个修复模块，首先将得到的256*256尺度的待修复图像(即图2中的输入3)、256*256尺度的随机噪声图像以及256*256尺度的上采样图像进行拼接，得到第三拼接图像，并将第三拼接图像输入到第三个修复模块中，得到256*256尺度的修复图像，然后对256*256尺度的修复图像进行上采样处理，得到512*512尺度的上采样图像；

步骤33：将第N尺度的上采样图像、第N尺寸的待修复图像和第N尺度的随机噪声图像进行拼接，得到第N拼接图像；将所述第N拼接图像输入至第N个修复模块中得到第N尺度的修复图像，作为所述第一生成器的修复训练图像。

仍以图2为例进行说明，对于最后一个修复模块，首先将得到的512*512尺度的待修复图像(即图2中的输入4)、512*512尺度的随机噪声图像以及512*512尺度的上采样图像进行拼接，得到第四拼接图像，并将第四拼接图像输入到最后一个修复模块中，得到512*512尺度的修复图像，作为所述第一生成器的修复训练图像。

本公开实施例中，在进行图像修复时，向第一生成器中加入了随机噪声，原因在于单独将模糊图像输入到第一生成器中，得到的修复图像可能会因为缺乏高频信息而出现“磨皮”过度的效果。在第一生成器的输入中加入随机噪声，随机噪声能够被映射为修复后图像上的高频信息，从而丰富修复图像的细节。

在本公开的另外一些实施例中，请参考图4，利用所述N个修复模块和所述N个尺度的待修复图像，得到所述输出图像包括：

步骤41：针对每个尺度的待修复图像，提取所述待修复图像中的关键点，生成多张关键点热图，将所述关键点热图进行合并和分类，得到每个尺度的S张关键点蒙版图像，其中，S为大于或等于2的整数；

本公开实施例中，可选的，请参考图5，可以采用4堆栈沙漏模型，提取所述待修复图像中的关键点，例如提取人脸图像中的68个关键点，生成68张关键点热图，其中，每张关键点热图上代表图像上所有像素是某个关键点(landmark)的概率。然后，请参考图6，对多张关键点热图进行合并(Merge)和分类(softmax)，得到S张对应不同面部部位(components)的关键点蒙版(mask)图像，举例来说，S可以为5，对应的面部部位分别可以是：左眼、右眼、鼻子、嘴、轮廓。当然，在本公开的其他一些实施例中，也不排除采用其他的关键点提取技术提取所述待修复图像中的关键点，提取的关键点也不限于68，关键点蒙版图像的个数也不限于5张，即面部部位不限于5。

步骤42：将第一尺度的待修复图像和第一尺度的S张关键点蒙版图像进行拼接，得到第一拼接图像；将所述第一拼接图像输入至第一个修复模块中得到第一尺度的修复图像；对所述第一尺度的修复图像进行上采样处理，得到第二尺度的上采样图像；

以图7为例进行说明，得到64*64尺度的待修复图像和64*64尺度的关键点蒙版图像之后，将64*64尺度的待修复图像和64*64尺度的关键点蒙版图像进行拼接，得到第一拼接图像，并将第一拼接图像输入到第一个修复模块中，得到64*64尺度的修复图像，然后对64*64尺度的修复图像进行上采样处理，得到128*128尺度的上采样图像；

步骤43：将所述第i尺度的上采样图像、第i尺度的待修复图像和第i尺度的S张关键点蒙版图像进行拼接，得到第i拼接图像；将所述第i拼接图像输入至第i个修复模块中得到第i尺度的修复图像；对所述第i尺度的修复图像进行上采样处理，得到第i+1尺度的上采样图像；其中，i为大于或等于2的整数；

以图7为例进行说明，对于第二个修复模块，首先将得到的128*128尺度的待修复图像、128*128尺度的关键点蒙版图像以及128*128尺度的上采样图像进行拼接，得到第二拼接图像，并将第二拼接图像输入到第二个修复模块中，得到128*128尺度的修复图像，然后对128*128尺度的修复图像进行上采样处理，得到256*256尺度的上采样图像；对于第三个修复模块，首先将得到的256*256尺度的待修复图像、256*256尺度的关键点蒙版图像以及256*256尺度的上采样图像进行拼接，得到第三拼接图像，并将第三拼接图像输入到第三个修复模块中，得到256*256尺度的修复图像，然后对256*256尺度的修复图像进行上采样处理，得到512*512尺度的上采样图像；

步骤44：将第N尺度的上采样图像、第N尺度的待修复图像和第N尺度的S张关键点蒙版图像进行拼接，得到第N拼接图像；将所述第N拼接图像输入至第N个修复模块中得到第N尺度的修复图像，作为所述第一生成器的修复训练图像。

仍以图7为例进行说明，对于最后一个修复模块，首先将得到的512*512尺度的待修复图像、512*512尺度的关键点蒙版图像以及512*512尺度的上采样图像进行拼接，得到第四拼接图像，并将第四拼接图像输入到最后一个修复模块中，得到512*512尺度的修复图像，作为所述第一生成器的修复训练图像。

本公开实施例中，将人脸关键点热图引入到图像清晰化处理中，可以在保证图像清晰化的同时，减轻人脸五官的变形程度，提高最终的图像修复效果。

下面对本公开实施例中的第一生成器的训练方法进行说明。

本公开实施例中，可选的，所述第一生成器是采用至少两个鉴别器对待训练生成器训练得到包括：根据训练图像和验证图像对所述待训练生成器和所述至少两个鉴别器进行交替训练，得到所述第一生成器，其中，所述验证图像的清晰度高于所述训练图像的清晰度，对所述待训练生成器进行训练时，所述待训练生成器的总损失包括以下至少一项：第一损失和所述至少两个鉴别器的总对抗损失。

在本公开的一些实施例中，可选的，所述第一生成器包括N个修复模块，其中，N为大于或等于2的整数，在一些优选实施例中，N可以等于4，进一步优选的，请参考图2，4个修复模块包括：64*64尺度的修复模块、128*128尺度的修复模块、256*256尺度的修复模块和512*512尺度的修复模块。当然，上述修复模块的个数也可以为其他数值，每个修复模块对应的尺度也不限于上述举例的四种。所述至少两个鉴别器包括：分别与所述N个修复模块对应的N个网络结构不同的第一类鉴别器；例如所述第一生成器包括4个修复模块，则所述至少两个鉴别器包括4个第一类鉴别器，请参考图8，4个第一类鉴别器可以分别为图8中的鉴别器1、鉴别器2、鉴别器3和鉴别器4。使用对应多个尺度的第一类鉴别器进行训练可以使训练得到的第一生成器处理输出的人脸图像比采用单一尺度的单个鉴别器进行训练得到的第一生成器输出的人脸图像更接近于真实的人脸图像，修复效果也更好，细节更丰富，形变也更小。

下面分别对待训练生成器和所述至少两个鉴别器的训练过程进行说明。

其中，请参考图9，训练所述待训练生成器包括：

步骤91：将所述训练图像处理成N个尺度的待修复训练图像；

本公开实施例中，可以首先将所述训练图像处理成是N个尺度中的其中一个尺度的待修复训练图像，然后对待修复训练图像进行上采样和/或下采样图像，得到其他N-1个尺度的待修复训练图像。或者，也可以将所述训练图像依次采样为N个尺度的待修复训练图像。

以图8为例，可以将训练图像处理成64*64、128*128、256*256和512*512尺度的四个待修复训练图像。

步骤92：将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

本公开实施例中，如果是对待训练生成器第一次训练，则是将所述N个尺度的待修复训练图像输入至待训练生成器中，如果不是第一次训练，则是将所述N个尺度的待修复训练图像输入至上一次训练后的生成器中。

待训练生成器对N个尺度的待修复训练图像的具体处理方式可以参见图3和图4所示的实施例中的处理方式，在此不再重复说明。

以图8为例，将64*64、128*128、256*256和512*512尺度的四个待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到64*64、128*128、256*256和512*512尺度的四个修复训练图像。

步骤93：针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第一鉴别结果；

以图8为例，将64*64尺度的修复训练图像设置为具有真值标签，并将具有真值标签的64*64尺度的修复训练图像输入至鉴别器1中，以得到鉴别器1的鉴别结果；将128*128尺度的修复训练图像设置为具有真值标签，并将具有真值标签的128*128尺度的修复训练图像输入至鉴别器2中，以得到鉴别器2的鉴别结果；将256*256尺度的修复训练图像设置为具有真值标签，并将具有真值标签的256*256尺度的修复训练图像输入至鉴别器3中，以得到鉴别器3的鉴别结果；将512*512尺度的修复训练图像设置为具有真值标签，并将具有真值标签的512*512尺度的修复训练图像输入至鉴别器4中，以得到鉴别器4的鉴别结果。

步骤94：基于所述第一鉴别结果计算第一对抗损失；所述总对抗损失包括所述第一对抗损失。

可选的，第一对抗损失为每个尺度的修复训练图像对应的对抗损失之和。

步骤95：根据所述总对抗损失调整所述待训练生成器的参数。

其中，请参考图10，训练所述至少两个鉴别器包括：

步骤101：将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

本公开实施例中，可以首先将所述验证图像处理成是N个尺度中的其中一个尺度的验证图像，然后对处理后的验证图像进行上采样和/或下采样图像，得到其他N-1个尺度的验证图像。或者，也可以将所述验证图像依次采样为N个尺度的验证图像。

以图8为例，可以将训练图像处理成64*64、128*128、256*256和512*512尺度的四个待修复训练图像。将验证图像处理成64*64、128*128、256*256和512*512尺度的四个验证图像。

步骤102：将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

待训练生成器对N个尺度的待修复训练图像的具体处理方式可以参见图3和图4所示的实施例中的处理方式，不再重复说明。

步骤103：针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有假值标签，并将具有假值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第三鉴别结果；将每一尺度的验证图像设置为具有真值标签，并将具有真值标签的每个验证图像输入所述第一类鉴别器以得到第四鉴别结果；

以图8为例，将64*64尺度的修复训练图像设置为具有假值标签，并将具有假值标签的64*64尺度的修复训练图像输入至鉴别器1中，以得到鉴别器1的第三鉴别结果，将64*64尺度的验证图像设置为具有真值标签，并将具有真值标签的64*64尺度的验证图像输入至鉴别器1中，以得到鉴别器1的第四鉴别结果；将128*128尺度的修复训练图像设置为具有假值标签，并将具有假值标签的128*128尺度的修复训练图像输入至鉴别器2中，以得到鉴别器2的第三鉴别结果，将128*128尺度的验证图像设置为具有真值标签，并将具有真值标签的128*128尺度的验证图像输入至鉴别器2中，以得到鉴别器2的第四鉴别结果；将256*256尺度的修复训练图像设置为具有假值标签，并将具有假值标签的256*256尺度的修复训练图像输入至鉴别器3中，以得到鉴别器3的第三鉴别结果，将256*256尺度的验证图像设置为具有真值标签，并将具有真值标签的256*256尺度的验证图像输入至鉴别器3中，以得到鉴别器3的第四鉴别结果；将512*512尺度的修复训练图像设置为具有假值标签，并将具有假值标签的512*512尺度的修复训练图像输入至鉴别器4中，以得到鉴别器4的第三鉴别结果，将512*512尺度的验证图像设置为具有真值标签，并将具有真值标签的512*512尺度的验证图像输入至鉴别器4中，以得到鉴别器4的第四鉴别结果。

步骤104：基于所述第三鉴别结果和第四鉴别结果计算第三对抗损失；

步骤105：根据所述第三对抗损失调整所述第一类鉴别器的参数以得到更新后的第一类鉴别器。

在本公开的一些实施例中，可选的，所述至少两个鉴别器还包括：分别与所述N个修复模块对应的N个网络结构不同的第一类鉴别器和第二类鉴别器，所述第二类鉴别器被配置为提升所述第一生成器对所述训练图像的人脸局部的清晰度修复，这样训练得到的第一生成器输出的图像中人脸局部特征清晰度会更高；

下面分别对待训练生成器、至少两个鉴别器的训练过程进行说明。

请参考图11，训练所述待训练生成器包括：

步骤111：将所述训练图像处理成N个尺度的待修复训练图像；

步骤112：将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

步骤113：获取第N尺度的修复训练图像的第一人脸局部图像；

在本公开的一些实施例中，可选的，所述第一人脸局部图像为眼部图像。本公开实施例中，可以直接截图的方式截取第N尺度的修复训练图像中的眼部图像作为第一人脸局部图像。

步骤114：针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第一鉴别结果；

以图8为例，将64*64尺度的修复训练图像设置为具有真值标签，并将具有真值标签的64*64尺度的修复训练图像输入至鉴别器1中，以得到鉴别器1的一鉴别结果；将128*128尺度的修复训练图像设置为具有真值标签，并将具有真值标签的128*128尺度的修复训练图像输入至鉴别器2中，以得到鉴别器2的一鉴别结果；将256*256尺度的修复训练图像设置为具有真值标签，并将具有真值标签的256*256尺度的修复训练图像输入至鉴别器3中，以得到鉴别器3的一鉴别结果；将512*512尺度的修复训练图像设置为具有真值标签，并将具有真值标签的512*512尺度的修复训练图像输入至鉴别器 4中，以得到鉴别器4的第一鉴别结果。

步骤115：将所述第一人脸局部图像设置为具有真值标签，并将具有真值标签的所述第一人脸局部图像输入至初始的第二类鉴别器或上一次训练后的第二类鉴别器，以得到第二鉴别结果；

以图8为例，图8中的鉴别器5为第二类鉴别器，将第一人脸局部图像设置为具有真值标签，并将具有真值标签的第一人脸局部图像输入至鉴别器5中，以得到鉴别器5的第二鉴别结果；

步骤116：基于所述第一鉴别结果计算第一对抗损失；基于所述第二鉴别结果计算第二对抗损失，所述总对抗损失包括所述第一对抗损失和所述第二对抗损失；

步骤117：根据所述总对抗损失对所述待训练生成器或上一次训练的生成器进行参数调整。

请参考图12，训练所述至少两个鉴别器包括：

步骤121：将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

步骤122：获取第N尺度的验证图像的第二人脸局部图像；

本公开实施例中，可选的，所述第一人脸局部图像和第二人脸局部图像为眼部图像。

本公开实施例中，可以直接截图的方式截取第N尺度的验证图像中的眼部图像作为所述第二人脸局部图像。

步骤123：将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

待训练生成器对N个尺度的待修复训练图像的具体处理方式可以参见图3和图4所示的实施例中的处理方式，再次不再重复说明。

步骤124：获取第N尺度的修复训练图像的第一人脸局部图像；

本公开实施例中，可以直接截图的方式截取第N尺度的修复训练图像中的眼部图像作为所述第一人脸局部图像。

步骤125：针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有假值标签，并将具有假值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第三鉴别结果；将每一尺度的验证图像设置为具有真值标签，并将具有真值标签的每个验证图像输入所述第一类鉴别器以得到第四鉴别结果；

步骤126：将所述第一人脸局部图像设置为具有假值标签，并将具有假值标签的所述第一人脸局部图像输入至初始的第二类鉴别器或上一次训练后的第二类鉴别器，以得到第五鉴别结果；将所述第二人脸局部图像设置为具有真值标签，并将具有真值标签的所述第二人脸局部图像输入至初始的第二类鉴别器或上一次训练后的第二类鉴别器，以得到第六鉴别结果；

步骤127：基于所述第三鉴别结果和第四鉴别结果计算第三对抗损失；基于所述第五鉴别结果和第六鉴别结果计算第四对抗损失；

步骤128：根据所述第三对抗损失调整所述第一类鉴别器的参数以得到更新后的第一类鉴别器；根据所述第四对抗损失调整所述第二类鉴别器的参数以得到更新后的第二类鉴别器。

本公开实施例中，由于眼部是人脸的最要组成部分，通过增加眼部图像的对抗损失，可以提高训练效果。

在本公开的一些实施例中，可选的，所述至少两个鉴别器还包括：X个第三类鉴别器；X为大于或等于1的正整数，所述第三类鉴别器被配置为提升所述第一生成器对所述训练图像的人脸部位的细节修复，即与其他训练方法相比较，采用该第三类鉴别器训练得到的第一生成器输出的人脸图像中的人眼图像更加清晰，人眼图像具有更多细节。

请参考图13，训练所述待训练生成器还包括：

步骤131：将所述训练图像处理成N个尺度的待修复训练图像；

将所述训练图像处理成N个尺度的待修复训练图像的具体方法可以参见上述实施例中的说明，不再重复描述。

步骤132：将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

待训练生成器对N个尺度的待修复训练图像的处理过程可以参见上述实施例中的说明，不再重复描述。

步骤133：采用人脸解析网络对所述第N尺度的修复图像进行人脸解析处理，得到所述第N尺度的修复图像对应的X张第一人脸部位图像，其中若X等于1，所述第一人脸部位图像包含一个人脸部位，若X大于1，所述X张第一人脸部位图像包含包括不同的人脸部位；

本公开实施例中，所述人脸解析网络采用语义分割网络。

本公开实施例中，所述人脸解析网络对人脸进行解析，输出的人脸部位可以包括以下至少一项：背景、脸部皮肤、左眉毛、右眉毛、左眼、右眼、左耳、右耳、鼻子、牙齿、上嘴唇、下嘴唇、衣服、头发、帽子、眼镜、脖子等。

步骤134：将所述X张第一人脸部位图像都设置为具有真值标签，并将具有真值标签的每个第一人脸部位图像输入至初始的第三类鉴别器或上一次训练后的第三类鉴别器，以得到第七鉴别结果；

步骤135：基于所述第七鉴别结果计算第五对抗损失；所述总对抗损失包括所述第五对抗损失；

步骤136：根据所述总对抗损失调整所述待训练生成器或上一次训练后的生成器的参数。

请参考图14，训练所述至少两个鉴别器包括：

步骤141：将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

步骤142：将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

步骤143：采用人脸解析网络对所述第N尺度的修复图像进行人脸解析处理，得到所述第N尺度的修复图像对应的X张第一人脸部位图像，其中X张第一人脸部位图像包含包括不同的人脸部位；采用人脸解析网络对所述第N尺度的验证图像进行人脸解析处理，得到所述第N尺度的验证图像对应的X张第二人脸部位图像，其中所述X张第二人脸部位图像包含不同的人脸部位；

本公开实施例中，所述人脸解析网络采用语义分割网络。

请参考图15，图15为所示的实施例中，X等于1，所述第三类鉴别器被配置为提升所述第一生成器对所述训练图像的人脸皮肤的细节修复，，即与其他训练方法相比较，采用该第三类鉴别器训练得到的第一生成器输出的人脸图像中的皮肤图像更加清晰，皮肤图像具有更多细节。

步骤144：将所述X张第一人脸部位图像都设置为具有假值标签，并将具有假值标签的所述第一人脸部位图像输入至初始的第三类鉴别器或上一次训练后的第三类鉴别器，以得到第八鉴别结果；将所述X张第二人脸部位图像都设置为具有真值标签，并将具有真值标签的每张第二人脸部位图像输入至初始的第三类鉴别器或上一次训练后的第三类鉴别器，以得到第九鉴别结果；

步骤145：基于所述第八鉴别结果和第九鉴别结果计算第六对抗损失；

步骤146：根据所述第六对抗损失调整所述第三类鉴别器的参数以得到更新后的第三类鉴别器。

请参考图16，图16为本公开实施例的待训练生成器和鉴别器的输入和输出示意图，从图16中可以看出，待训练生成器的输入包括N个尺度的训练图像、N个尺度的随机噪声图像(或者N个尺度的关键点蒙版图像)，待训练生成器的输出为修复后的修复训练图像；鉴别器包括上述对应N个尺度的修复模块的N个第一类鉴别器，以及，X个第三类鉴别器，鉴别器的输入包括：待训练生成器的修复训练图像、N个尺度的验证图像、第N尺度的验证图像对应的X张人脸部位图像、第N尺度的修复训练图像对应的X张人脸部位图像。

本公开实施例中，通过将人脸五官、皮肤和/或头发等分割出来，分别输入到鉴别器中判别真假，使得训练生成器器对每部分人脸进行修复时都存在一个与之对抗的过程，加强了生成器对人脸各部分的生成能力，从而得到更加丰富的细节。

在本公开的一些实施例中，可选的，所述待训练生成器的总损失还包括：人脸相似度损失；

请参考图17，训练所述待训练生成器还包括：

步骤171：将所述训练图像处理成N个尺度的待修复训练图像；

步骤172：将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

步骤172：采用关键点检测网络对所述第N尺度的修复图像进行关键点检测，得到所述第N尺度的修复图像对应的第一关键点热图；

步骤173：采用关键点检测网络对所述第N尺度的待修复训练图像进行关键点检测，得到所述第N尺度的待修复训练图像对应的第二关键点热图；

步骤174：根据所述第一关键点热图和所述第二关键点热图计算人脸相似度损失。

请参考图8，图8中的关键点检测模块即关键点检测网络，热图_1即第一关键点热图，热图_2即第二关键点热图。

本公开实施例中，可选的，请参考图5，可以采用4堆栈沙漏模型，提取所述第N尺度的待修复训练图像和修复训练图像中的关键点，例如提取人脸图像中的68个关键点，生成68张关键点热图，其中，每张关键点热图上代表图像上所有像素是某个关键点(landmark)的概率。

在本公开的一些实施例中，可选的，所述待训练生成器的总损失还包括：平均梯度损失；

请参考图18，训练所述待训练生成器还包括：

步骤181：将所述训练图像处理成N个尺度的待修复训练图像；

步骤182：将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

步骤183：计算所述第N尺寸的修复训练图像的平均梯度损失。

本公开实施例中，可选的，平均梯度损失AvgG的计算公式如下：

其中，m和n分别是第N尺寸的修复训练图像的宽和高，fi,j为第N尺寸的修复训练图像在位置(i,j)上的像素，

表示在行方向上f _i,j与相邻像素之差，

表示在列方向上f _i,j与相邻像素之差。

在本公开的一些实施例中，可选的，所述第一生成器包括N个修复模块，所述待训练生成器采用的损失包括第一损失；本实施例中，第一损失可以称为感知损失；

请参考图19，训练所述待训练生成器还包括：

步骤191：将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

步骤192：将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

步骤193：将所述N个尺度的修复训练图像和所述N个尺度的验证图像输入至VGG网络中，得到每个尺度的修复训练图像在所述VGG网络的M个目标层上的损失，M为大于或等于1的整数；所述第一损失包括所述N个尺度的修复训练图像在M个目标层上的损失。

可选的，所述第一损失包括：每个尺度的修复训练图像在M个目标层上的损失与对应的权重相乘之后相加，其中，不同尺度的修复训练图像在目标层使用的权重不同。

举例来说，待训练生成器包括4个尺度的修复模块，分别为64*64、128*128、256*256、512*512。所述VGG网络为VGG19网络，所述M个目标层分别为2-2层、3-4层、4-4层、5-4层，所述第一损失(即感知损失)L的计算公式如下：

L＝L _{per_64}+L _{per_128}+L _{per_256}+L _{per_512}

其中，L _{per_64}为64*64尺度的修复训练图像的感知损失，L _{per_128}为128*128尺度的修复训练图像的感知损失，L _{per_256}为256*256尺度的修复训练图像的感知损失，L _{per_512}为512*512尺度的修复训练图像的感知损失，

为不同尺度的修复训练图像在第2-2层的感知损失，

为不同尺度的修复训练图像在第3-4层的感知损失，

为不同尺度的修复训练图像在第4-4层的感知损失，

为不同尺度的修复训练图像在第5-4层的感知损失。

上述例子中，由于不同尺度的清晰化关注的不同，越小分辨率的尺度关注的越全局，也就对应越浅的VGG层，越大分辨率的尺度关注的越局部，也就对应越深的VGG层。

当然，在本公开的一些实施例中，不同尺度的修复训练图像在目标层使用的权重也可以相同，举例来说：

本公开实施例中，可选的，所述第一损失还包括以下至少一项：L1损失、第二损失和第三损失；

所述第一损失包括L1损失时，所述训练所述待训练生成器包括：

将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

通过比较所述N个尺度的修复训练图像和所述N个尺度的验证图像，得到L1损失；

所述第一损失包括所述第二损失时，所述训练所述待训练生成器包括：

获取第N尺度的修复训练图像的第一眼部图像和第N尺度的验证图像的第二眼部图像；

将所述第一眼部图像和所述第二眼部图像输入至VGG网络中，得到所述第一眼部图像在所述VGG网络的M个目标层上的第二损失，M为大于或等于1的整数；

所述第一损失包括所述第三损失时，所述训练所述待训练生成器包括：

获取第N尺度的修复训练图像的第一人脸皮肤图像和第N尺度的验证图像的第二人脸皮肤图像；

将所述第一人脸皮肤图像和所述第二人脸皮肤图像输入至VGG网络中，得到所述第一人脸皮肤图像在所述VGG网络的M个目标层上的第三损失。

通过上述的第二损失和第三损失，可以更好的提升输出图像的眼部区域和皮肤区域的细节。

在本公开的一些实施例中，所述至少两个鉴别器包括：第四类鉴别器和第五类鉴别器；所述第四类鉴别器被配置为保持所述第一生成器对所述训练图像的结构性特征，具体的第一生成器的输出图像可以保留输入图像的更多内容信息；所述第五类鉴别器被配置为提升所述第一生成器对所述训练图像的细节修复，具体的与其他训练方法相比，采用第五类鉴别器训练得到的第一生成器处理得到的输出图像具有更多的细节特征，清晰度更高。

请参考图20，训练所述待训练生成器包括：

步骤201：将所述训练图像处理成N个尺度的待修复训练图像；

步骤202：将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

步骤203：针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第四类鉴别器或上一次训练后的第四类鉴别器，以得到第十鉴别结果；

步骤204：基于所述第十鉴别结果计算第七对抗损失；

步骤205：针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第五类鉴别器或上一次训练后的第五类鉴别器，以得到第十一鉴别结果；

步骤206：基于所述第十一鉴别结果计算第八对抗损失；所述总对抗损失包括所述第七对抗损失和所述第八对抗损失。

步骤207：根据所述总对抗损失对所述待训练生成器或上一次训练的生成器进行参数调整。

请参考图21，训练所述至少两个鉴别器包括：

步骤211：将所述训练图像处理成N个尺度的待修复训练图像；将所述验证图像处理成N个尺度的验证图像；

步骤212：将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

步骤213：针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有假值标签，并将具有假值标签的所述修复训练图像输入至初始的第四类鉴别器或上一次训练后的第四类鉴别器，以得到第十二鉴别结果；针对每一尺度的待修复训练图像，将所述待修复训练图像设置为具有真值标签，并将具有真值标签的所述待修复训练图像输入至初始的第四类鉴别器或上一次训练后的第四类鉴别器，以得到第十三鉴别结果；

步骤214：基于所述第十二鉴别结果和第三鉴别结果计算第九对抗损失；

步骤215：根据所述第九对抗损失调整所述第四类鉴别器的参数以得到更新后的第四类鉴别器。

步骤216：针对每个尺度的修复训练图像，对所述修复训练图像和对应尺度的验证图像进行高频滤波处理，得到高频滤波后的修复训练图像和验证图像；

步骤217：针对每一尺度的高频滤波后的修复训练图像，将所述高频滤波后的修复训练图像设置为具有假值标签，并将具有假值标签的所述高频滤波后的修复训练图像输入至初始的第五类鉴别器或上一次训练后的第五类鉴别器，以得到第十四鉴别结果；针对每一尺度的高斯滤波后的验证图像，将所述高斯滤波后的验证图像设置为具有真值标签，并将具有真值标签的所述高斯滤波后的验证图像输入至初始的第五类鉴别器或上一次训练后的第五类鉴别器，以得到第十五鉴别结果；

步骤218：基于所述第十四鉴别结果和第十五鉴别结果计算第十对抗损失；

步骤219：根据所述第十对抗损失调整所述第五类鉴别器的参数以得到更新后的第五类鉴别器。

请参考图22，图22为本公开另一实施例的待训练生成器和鉴别器的输入和输出示意图，从图22中可以看出，待训练生成器的输入包括N个尺度的训练图像、N个尺度的随机噪声图像(或者N个尺度的关键点蒙版图像)，待训练生成器的输出为修复后的修复训练图像；第四类鉴别器包括上述对应N个尺度的修复模块的N个第一类鉴别器，第四类鉴别器的输入包括：待训练生成器的修复训练图像、N个尺度的训练图像。第五类鉴别器包括上述对应N个尺度的修复模块的N个第一类鉴别器，第五类鉴别器的输入包括：待训练生成器的修复训练图像进行高频滤波后的图像、N个尺度的验证图像进行高频滤波后的图像。

本公开实施例中，上述验证图像可以是与训练图像相同内容但清晰度不同的图像，也可以是与训练图像内容不同清晰度不同的图像。

上述实施例中，设计了两类鉴别器(第四类鉴别器和第五类鉴别器)，这样设计的原因在于：细节纹理是图像中的高频信息，自然图像中的高频信息具有服从某种特定分布的特征。第五类鉴别器与生成器相互对抗训练，使得生成器学习到细节纹理所服从的分布，从而能够将平滑的低清图像映射到细节丰富的真实自然图像空间上。第四类鉴别器对低清图像与它所对应的修复结果进行判别，能够约束图像在通过生成器后保持它的结构性特征，不发生形变。

本公开实施例中，可选的，所述第五类鉴别器的损失函数如下所示：

maxV(D1,G)＝log[D1(HF(y))]+log[1-D1(HF(G(x))]

第四类鉴别器的损失函数如下所示：

maxV(D2,G)＝log[D2(x)]+log[1-D2(G(x))]

其中，G代表生成器，D1和D2分别代表第五类鉴别器和第四类鉴别器，HF代表高斯高频滤波器，x表示输入生成器的训练图像，y表示真实的高清验证图像。

本公开实施例中，所述待训练生成器的总损失还包括：平均梯度损失；即待训练生成器的总损失＝第四鉴别器的损失+第五鉴别器的损失+平均梯度损失；

此时，训练所述待训练生成器还包括：

将所述训练图像处理成N个尺度的待修复训练图像；

计算所述第N尺寸的修复训练图像的平均梯度损失。

即，生成器的损失函数如下所示：

minV(D,G)＝αlog[1-D1(G(x))]+βlog[1-D2(x)]+γAvgG(G(x))

其中，α、β、γ分别代表各项损失的权重，AvgG代表平均梯度损失。平均梯度可以用来评价图像中细节纹理的丰富程度，图像中的细节越丰富，它在某个方向上的灰度值变化速度越快，平均梯度值也越大。

可选的，平均梯度损失AvgG的计算公式如下：

其中，m和n分别是第N尺寸的修复训练图像的宽和高，fi,j为第N尺寸的修复训练图像在位置(i,j)上的像素。

在本公开的另外一些实施例中，所述第一生成器包括N个修复模块，所述至少两个鉴别器包括：分别与所述N个修复模块对应的N个网络结构不同的第一类鉴别器；

其中，请参考图23，训练所述待训练生成器包括：

步骤231：将所述训练图像处理成N个尺度的待修复训练图像；

步骤232：针对每个尺度的待修复训练图像，提取所述待修复训练图像中的关键点，生成多张关键点热图，将所述关键点热图进行合并和分类，得到每个尺度的S张关键点蒙版图像，其中，S为大于或等于2的整数；

步骤233：将所述N个尺度的待修复训练图像和每个尺度的S张关键点蒙版图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

步骤234：针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第一鉴别结果；

步骤235：基于所述第一鉴别结果计算第一对抗损失；所述总对抗损失包括所述第一对抗损失；

步骤236：根据所述总对抗损失对所述待训练生成器或上一次训练的生成器进行参数调整；

请参考图24，训练所述至少两个鉴别器包括：

步骤241：将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

步骤242：针对每个尺度的待修复训练图像，提取所述待修复训练图像中的关键点，生成多张关键点热图，将所述关键点热图进行合并和分类，得到每个尺度的S张关键点蒙版图像；

步骤243：将所述N个尺度的待修复训练图像和每个尺度的S张关键点蒙版图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

步骤244：针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有假值标签，并将具有假值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第三鉴别结果；将每一尺度的验证图像设置为具有真值标签，并将具有真值标签的每个验证图像输入所述第一类鉴别器以得到第四鉴别结果；

步骤245：基于所述第三鉴别结果和第四鉴别结果计算第三对抗损失；

步骤246：根据所述第三对抗损失调整所述第一类鉴别器的参数以得到更新后的第一类鉴别器。

本公开实施例中，可选的，所述第一生成器包括N个修复模块；所述待训练生成器的总损失＝第一类鉴别器的损失+第一损失(感知损失)；

此时，训练所述待训练生成器包括：

将所述N个尺度的修复训练图像和所述N个尺度的验证图像输入至VGG网络中，得到每个尺度的修复训练图像在所述VGG网络的M个目标层上的损失，M为大于或等于1的整数；

所述第一损失包括所述N个尺度的修复训练图像在M个目标层上的损失。

L＝L _{per_64}+L _{per_128}+L _{per_256}+L _{per_512}

为不同尺度的修复训练图像在第2-2层的感知损失，

为不同尺度的修复训练图像在第3-4层的感知损失，

为不同尺度的修复训练图像在第4-4层的感知损失，

为不同尺度的修复训练图像在第5-4层的感知损失。

可选的，所述待训练生成器采用的损失还包括：逐像素的二范式(L2)损失。即所述待训练生成器的总损失＝第一类鉴别器的损失+第一损失(感知损失)+逐像素的二范式损失。

其中，L2损失的计算方法如下：将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；通过比较N个尺度的修复训练图像和N个尺度的验证图像，得到L2损失。

本公开实施例中，可选的，所述第一生成器包括N个修复模块，每个所述修复模块采用相同的网络结构；

对所述待训练生成器的训练过程包括第一训练阶段和第二训练阶段；所述第一训练阶段和所述第二训练阶段均包括对所述待训练生成器的至少一次训练过程；

在所述第一训练阶段，对每个所述修复模块进行调参时，所有修复模块共享相同的参数；

在所述第二训练阶段，每个所述修复模块分别独立调参。

可选的，在所述第一训练阶段采用的学习率(例如学习率lr＝0.0001)大于在所述第二训练阶段采用的学习率(例如学习率lr＝0.00005)，学习率越大，训练速度越快，由于第一训练阶段需要快速训练出共享的参数，因而使用较大的学习率，而第二训练阶段是更加精细的训练，因而采用较小的学习率对各个修复模块进行微调。这是因为修复模块在较低的尺度上关注人脸的结构性信息，在较高的尺度上关注人脸的细节信息。第一训练阶段之后将共享的参数解耦，使每个尺度上的超分辨率模块能够更加关注该尺度上的信息，从而达到更好的细节修复效果。

请参考图25，本公开实施例还提供一种图像处理方法，包括：

步骤251：接收输入图像；

步骤252：对所述输入图像进行人脸检测，得到人脸图像；

本公开实施例中，可选的对所述输入图像进行人脸检测，得到人脸图像包括：对所述输入图像进行人脸检测，得到检测图像，对所述检测图像进行标准化对齐，得到所述人脸图像。

步骤253：采用上述任一实施例中的方法对所述人脸图像进行处理得到第一修复训练图像，其中，所述第一修复训练图像的清晰度高于所述输入图像的清晰度；

步骤254：对所述输入图像或去除所述人脸图像的输入图像进行处理得到第二修复训练图像，其中，所述第二修复训练图像的清晰度高于所述输入图像的清晰度；

步骤255：将所述第一修复训练图像和所述第二修复训练图像进行融合，得到融合后的图像，所述融合图像的清晰度高于所述输入图像的清晰度。

本公开实施例中，可选的，对所述输入图像或去除所述人脸图像的输入图像进行处理得到第二修复训练图像包括：采用上述任一实施例中所述的方法对所述输入图像或去除所述人脸图像的输入图像进行处理得到第二修复训练图像。

请参考图26，本申请实施例还提供一种图像处理装置260，包括：

接收模块261，用于接收输入图像；

处理模块262，用于利用第一生成器对所述输入图像进行处理得到输出图像，其中，所述输出图像的清晰度高于所述输入图像的清晰度；其中，所述第一生成器是利用至少两个鉴别器对待训练生成器训练得到。

可选的，所述第一生成器包括N个修复模块，其中，N为大于或等于2的整数；

所述处理模块，用于将所述输入图像处理成N个尺度的待修复图像，其中，第一尺度的待修复图像的尺度到第N尺度的待修复图像的尺度依次递增；利用所述N个修复模块和所述N个尺度的待修复图像，得到所述输出图像。

可选的，所述N个尺度中相邻的两个尺度，后一个尺度为前一个尺度的2倍。

可选的，所述处理模块，用于确定所述输入图像所属的尺度区间；将所述输入图像处理成与其所属的尺度区间对应的第j尺度的待修复图像，所述第j尺度为所述第一尺度至第N尺度中的一种；对所述第j尺度的待修复图像进行上采样和/或下采样处理，得到其余N-1个尺度的待修复图像。

可选的，所述处理模块，用于：

将第一尺度的待修复图像和第一尺度的随机噪声图像进行拼接，得到第一拼接图像；将所述第一拼接图像输入至第一个修复模块中得到第一尺度的修复图像；对所述第一尺度的修复图像进行上采样处理，得到第二尺度的上采样图像；

将第i尺度的上采样图像、第i尺度的待修复图像和第i尺度的随机噪声图像进行拼接，得到第i拼接图像；将所述第i拼接图像输入至第i个修复模块中得到第i尺度的修复图像；对所述第i尺度的修复图像进行上采样处理，得到第i+1尺度的上采样图像；其中，i为大于或等于2的整数；

将第N尺度的上采样图像、第N尺寸的待修复图像和第N尺度的随机噪声图像进行拼接，得到第N拼接图像；将所述第N拼接图像输入至第N个修复模块中得到第N尺度的修复图像，作为所述第一生成器的输出图像。

可选的，

所述处理模块，用于：

针对每个尺度的待修复图像，提取所述待修复图像中的关键点，生成多张关键点热图，将所述关键点热图进行合并和分类，得到每个尺度的S张关键点蒙版图像，其中，S为大于或等于2的整数；

将第一尺度的待修复图像和第一尺度的S张关键点蒙版图像进行拼接，得到第一拼接图像；将所述第一拼接图像输入至第一个修复模块中得到第一尺度的修复图像；对所述第一尺度的修复图像进行上采样处理，得到第二尺度的上采样图像；

将所述第i尺度的上采样图像、第i尺度的待修复图像和第i尺度的S张关键点蒙版图像进行拼接，得到第i拼接图像；将所述第i拼接图像输入至第i个修复模块中得到第i尺度的修复图像；对所述第i尺度的修复图像进行上采样处理，得到第i+1尺度的上采样图像；其中，i为大于或等于2的整数；

将第N尺度的上采样图像、第N尺度的待修复图像和第N尺度的S张关键点蒙版图像进行拼接，得到第N拼接图像；将所述第N拼接图像输入至第N个修复模块中得到第N尺度的修复图像，作为所述第一生成器的输出图像。

可选的，采用4堆栈沙漏模型提取所述待修复图像中的关键点。

可选的，所述装置还包括：

训练模块，用于根据训练图像和验证图像对所述待训练生成器和所述至少两个鉴别器进行交替训练，得到所述第一生成器，其中，所述验证图像的清晰度高于所述训练图像的清晰度，对所述待训练生成器进行训练时，所述待训练生成器的总损失包括以下至少一项：第一损失和所述至少两个鉴别器的总对抗损失。

可选的，所述第一生成器包括N个修复模块，其中，N为大于或等于2的整数，所述至少两个鉴别器包括：分别与所述N个修复模块对应的N个网络结构不同的第一类鉴别器，以及，第二类鉴别器，所述第二类鉴别器被配置为提升所述第一生成器对所述训练图像的人脸局部的清晰度修复。

所述训练模块包括第一训练子模块；

所述第一训练子模块用于训练所述待训练生成器，包括：

将所述训练图像处理成N个尺度的待修复训练图像；

获取第N尺度的修复训练图像的第一人脸局部图像；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第一鉴别结果；

将所述第一人脸局部图像设置为具有真值标签，并将具有真值标签的所述第一人脸局部图像输入至初始的第二类鉴别器或上一次训练后的第二类鉴别器，以得到第二鉴别结果；

基于所述第一鉴别结果计算第一对抗损失；基于所述第二鉴别结果计算第二对抗损失，所述总对抗损失包括所述第一对抗损失和所述第二对抗损失；

根据所述总对抗损失对所述待训练生成器或上一次训练的生成器进行参数调整；

所述第一训练子模块用于训练所述至少两个鉴别器，包括：

获取第N尺度的验证图像的第二人脸局部图像；

获取第N尺度的修复训练图像的第一人脸局部图像；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有假值标签，并将具有假值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第三鉴别结果；将每一尺度的验证图像设置为具有真值标签，并将具有真值标签的每个验证图像输入所述第一类鉴别器以得到第四鉴别结果；

将所述第一人脸局部图像设置为具有假值标签，并将具有假值标签的所述第一人脸局部图像输入至初始的第二类鉴别器或上一次训练后的第二类鉴别器，以得到第五鉴别结果；将所述第二人脸局部图像设置为具有真值标签，并将具有真值标签的所述第二人脸局部图像输入至初始的第二类鉴别器或上一次训练后的第二类鉴别器，以得到第六鉴别结果；

基于所述第三鉴别结果和第四鉴别结果计算第三对抗损失；基于所述第五鉴别结果和第六鉴别结果计算第四对抗损失；

根据所述第三对抗损失调整所述第一类鉴别器的参数以得到更新后的第一类鉴别器；根据所述第四对抗损失调整所述第二类鉴别器的参数以得到更新后的第二类鉴别器。

可选的，所述第一人脸局部图像和第二人脸局部图像为眼部图像。

可选的，所述至少两个鉴别器还包括：X个第三类鉴别器；X为大于或等于1的正整数，所述第三类鉴别器被配置为提升所述第一生成器对所述训练图像的人脸部位的细节修复。

可选的，所述第一训练子模块用于训练所述待训练生成器，包括：

将所述训练图像处理成N个尺度的待修复训练图像；

采用人脸解析网络对所述第N尺度的修复图像进行人脸解析处理，得到所述第N尺度的修复图像对应的X张第一人脸部位图像，其中若X等于1，所述第一人脸部位图像包含一个人脸部位，若X大于1，所述X张第一人脸部位图像包含包括不同的人脸部位；

将所述X张第一人脸部位图像都设置为具有真值标签，并将具有真值标签的每个第一人脸部位图像输入至初始的第三类鉴别器或上一次训练后的第三类鉴别器，以得到第七鉴别结果；

基于所述第七鉴别结果计算第五对抗损失；所述总对抗损失包括所述第五对抗损失；

所述第一训练子模块用于训练所述至少两个鉴别器，包括：

采用人脸解析网络对所述第N尺度的修复图像进行人脸解析处理，得到所述第N尺度的修复图像对应的X张第一人脸部位图像，其中X张第一人脸部位图像包含包括不同的人脸部位；采用人脸解析网络对所述第N尺度的验证图像进行人脸解析处理，得到所述第N尺度的验证图像对应的X张第二人脸部位图像，其中所述X张第二人脸部位图像包含不同的人脸部位；

将所述X张第一人脸部位图像都设置为具有假值标签，并将具有假值标签的所述第一人脸部位图像输入至初始的第三类鉴别器或上一次训练后的第三类鉴别器，以得到第八鉴别结果；将所述X张第二人脸部位图像都设置为具有真值标签，并将具有真值标签的每张第二人脸部位图像输入至初始的第三类鉴别器或上一次训练后的第三类鉴别器，以得到第九鉴别结果；

基于所述第八鉴别结果和第九鉴别结果计算第六对抗损失；

根据所述第六对抗损失调整所述第三类鉴别器的参数以得到更新后的第三类鉴别器。

可选的，所述人脸解析网络采用语义分割网络。

可选的，X等于1，所述第三类鉴别器被配置为提升所述第一生成器对所述训练图像的人脸皮肤的细节修复。

可选的，所述待训练生成器的总损失还包括：人脸相似度损失；

所述第一训练子模块用于训练所述待训练生成器，包括：

将所述训练图像处理成N个尺度的待修复训练图像；

采用关键点检测网络对所述第N尺度的修复图像进行关键点检测，得到所述第N尺度的修复图像对应的第一关键点热图；

采用关键点检测网络对所述第N尺度的待修复训练图像进行关键点检测，得到所述第N尺度的待修复训练图像对应的第二关键点热图；

根据所述第一关键点热图和所述第二关键点热图计算人脸相似度损失。

可选的，所述待训练生成器的总损失还包括：平均梯度损失；

所述第一训练子模块用于训练所述待训练生成器，包括：

将所述训练图像处理成N个尺度的待修复训练图像；

计算所述第N尺寸的修复训练图像的平均梯度损失。

可选的，所述第一生成器包括N个修复模块，其中，N为大于或等于2的整数，每个所述修复模块采用相同的网络结构；

对所述待训练生成器的训练过程包括第一训练阶段和第二训练阶段，所述第一训练阶段和所述第二训练阶段均包括对所述待训练生成器的至少一次训练过程；

在所述第二训练阶段，每个所述修复模块分别独立调参。

可选的，在所述第一训练阶段采用的学习率大于在所述第二训练阶段采用的学习率。

可选的，所述至少两个鉴别器包括：第四类鉴别器和第五类鉴别器；所述第四类鉴别器被配置为保持所述第一生成器对所述训练图像的结构性特征；所述第五类鉴别器被配置为提升所述第一生成器对所述训练图像的细节修复。

可选的，所述训练模块还包括第二训练子模块；

所述第二训练子模块用于训练所述待训练生成器，包括：

将所述训练图像处理成N个尺度的待修复训练图像；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第四类鉴别器或上一次训练后的第四类鉴别器，以得到第十鉴别结果；

基于所述第十鉴别结果计算第七对抗损失；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第五类鉴别器或上一次训练后的第五类鉴别器，以得到第十一鉴别结果；

基于所述第十一鉴别结果计算第八对抗损失；

所述总对抗损失包括所述第七对抗损失和所述第八对抗损失；

所述第二训练子模块用于训练所述至少两个鉴别器，包括：

将所述训练图像处理成N个尺度的待修复训练图像；将所述验证图像处理成N个尺度的验证图像；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有假值标签，并将具有假值标签的所述修复训练图像输入至初始的第四类鉴别器或上一次训练后的第四类鉴别器，以得到第十二鉴别结果；针对每一尺度的待修复训练图像，将所述待修复训练图像设置为具有真值标签，并将具有真值标签的所述待修复训练图像输入至初始的第四类鉴别器或上一次训练后的第四类鉴别器，以得到第十三鉴别结果；

基于所述第十二鉴别结果和第三鉴别结果计算第九对抗损失；

根据所述第九对抗损失调整所述第四类鉴别器的参数以得到更新后的第四类鉴别器；针对每个尺度的修复训练图像，对所述修复训练图像和对应尺度的验证图像进行高频滤波处理，得到高频滤波后的修复训练图像和验证图像；

针对每一尺度的高频滤波后的修复训练图像，将所述高频滤波后的修复训练图像设置为具有假值标签，并将具有假值标签的所述高频滤波后的修复训练图像输入至初始的第五类鉴别器或上一次训练后的第五类鉴别器，以得到第十四鉴别结果；针对每一尺度的高斯滤波后的验证图像，将所述高斯滤波后的验证图像设置为具有真值标签，并将具有真值标签的所述高斯滤波后的验证图像输入至初始的第五类鉴别器或上一次训练后的第五类鉴别器，以得到第十五鉴别结果；

基于所述第十四鉴别结果和第十五鉴别结果计算第十对抗损失；

根据所述第十对抗损失调整所述第五类鉴别器的参数以得到更新后的第五类鉴别器。

所述第二训练子模块用于训练所述待训练生成器，包括：

将所述训练图像处理成N个尺度的待修复训练图像；

计算所述第N尺寸的修复训练图像的平均梯度损失。

可选的，平均梯度损失AvgG的计算公式如下：

可选的，所述第一生成器包括N个修复模块，所述至少两个鉴别器包括：分别与所述N个修复模块对应的N个网络结构不同的第一类鉴别器；

所述训练模块还包括第三训练模块；

所述第三训练子模块用于训练所述待训练生成器包括：

将所述训练图像处理成N个尺度的待修复训练图像；

针对每个尺度的待修复训练图像，提取所述待修复训练图像中的关键点，生成多张关键点热图，将所述关键点热图进行合并和分类，得到每个尺度的S张关键点蒙版图像，其中，S为大于或等于2的整数；

将所述N个尺度的待修复训练图像和每个尺度的S张关键点蒙版图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

基于所述第一鉴别结果计算第一对抗损失；所述总对抗损失包括所述第一对抗损失；

所述第三训练子模块用于训练所述至少两个鉴别器，包括：

针对每个尺度的待修复训练图像，提取所述待修复训练图像中的关键点，生成多张关键点热图，将所述关键点热图进行合并和分类，得到每个尺度的S张关键点蒙版图像；

基于所述第三鉴别结果和第四鉴别结果计算第三对抗损失；

根据所述第三对抗损失调整所述第一类鉴别器的参数以得到更新后的第一类鉴别器。

可选的，所述第一生成器包括N个修复模块；

所述第三训练子模块用于训练所述待训练生成器，包括：

可选的，所述第一损失还包括：逐像素的二范式损失。

可选的，所述第一生成器包括4个尺度的修复模块，分别为：64*64尺度的修复模块、128*128尺度的修复模块、256*256尺度的修复模块和512*512尺度的修复模块。

可选的，S等于5，所述S张关键点蒙版图像包括：左眼、右眼、鼻子、嘴和轮廓的关键点蒙版图像。

请参考图27，本公开实施例还提供一种图像处理装置，包括：

接收模块271，用于接收输入图像；

人脸检测模块272，用于对所述输入图像进行人脸检测，得到人脸图像；

第一处理模块，用于采用上述任一实施例所述的图像处理方法对所述人脸图像进行处理得到第一修复训练图像，其中，所述第一修复训练图像的清晰度高于所述输入图像的清晰度；

第二处理模块273，用于对所述输入图像或去除所述人脸图像的输入图像进行处理得到第二修复训练图像，其中，所述第二修复训练图像的清晰度高于所述输入图像的清晰度；

融合模块274，用于将所述第一修复训练图像和所述第二修复训练图像进行融合，得到融合后的图像，所述融合图像的清晰度高于所述输入图像的清晰度。

可选的，第二处理模块273，用于采用上述任一实施例所述的图像处理方法对所述输入图像或去除所述人脸图像的输入图像进行处理得到第二修复训练图像。

本公开实施例还提供一种电子设备，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现上述任一实施例中所述的图像处理方法的步骤。

本公开实施例还提供一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现杀上述任一实施例中的图像处理方法的步骤。

其中，所述处理器为上述实施例中所述的终端中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本公开的实施例进行了描述，但是本公开并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本公开的启示下，在不脱离本公开宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本公开的保护之内。

Claims

一种图像处理方法，其中，包括：

接收输入图像；

利用第一生成器对所述输入图像进行处理得到输出图像，其中，所述输出图像的清晰度高于所述输入图像的清晰度；

其中，所述第一生成器是利用至少两个鉴别器对待训练生成器训练得到。
如权利要求1所述的图像处理方法，其中，所述第一生成器包括N个修复模块，其中，N为大于或等于2的整数；利用第一生成器对所述输入图像进行处理得到输出图像包括：

将所述输入图像处理成N个尺度的待修复图像，其中，第一尺度的待修复图像的尺度到第N尺度的待修复图像的尺度依次递增；

利用所述N个修复模块和所述N个尺度的待修复图像，得到所述输出图像。
如权利要求2所述的图像处理方法，其中，所述N个尺度中相邻的两个尺度，后一个尺度为前一个尺度的2倍。
如权利要求2所述的图像处理方法，其中，将所述输入图像处理成N个尺度的待修复图像包括：

确定所述输入图像所属的尺度区间；

将所述输入图像处理成与其所属的尺度区间对应的第j尺度的待修复图像，所述第j尺度为所述第一尺度至第N尺度中的一种；

对所述第j尺度的待修复图像进行上采样和/或下采样处理，得到其余N-1个尺度的待修复图像。
如权利要求2所述的图像处理方法，其中，利用所述N个修复模块和所述N个尺度的待修复图像，得到所述输出图像包括：将第一尺度的待修复图像和第一尺度的随机噪声图像进行拼接，得到第一拼接图像；将所述第一拼接图像输入至第一个修复模块中得到第一尺度的修复图像；对所述第一尺度的修复图像进行上采样处理，得到第二尺度的上采样图像；

将第i尺度的上采样图像、第i尺度的待修复图像和第i尺度的随机噪声图像进行拼接，得到第i拼接图像；将所述第i拼接图像输入至第i个修复模块中得到第i尺度的修复图像；对所述第i尺度的修复图像进行上采样处理，得到第i+1尺度的上采样图像；其中，i为大于或等于2的整数；

将第N尺度的上采样图像、第N尺寸的待修复图像和第N尺度的随机噪声图像进行拼接，得到第N拼接图像；将所述第N拼接图像输入至第N个修复模块中得到第N尺度的修复图像，作为所述第一生成器的输出图像。
如权利要求2所述的图像处理方法，其中，

利用所述N个修复模块和所述N个尺度的待修复图像，得到所述输出图像包括：

针对每个尺度的待修复图像，提取所述待修复图像中的关键点，生成多张关键点热图，将所述关键点热图进行合并和分类，得到每个尺度的S张关键点蒙版图像，其中，S为大于或等于2的整数；

将第一尺度的待修复图像和第一尺度的S张关键点蒙版图像进行拼接，得到第一拼接图像；将所述第一拼接图像输入至第一个修复模块中得到第一尺度的修复图像；对所述第一尺度的修复图像进行上采样处理，得到第二尺度的上采样图像；

将第i尺度的上采样图像、第i尺度的待修复图像和第i尺度的S张关键点蒙版图像进行拼接，得到第i拼接图像；将所述第i拼接图像输入至第i个修复模块中得到第i尺度的修复图像；对所述第i尺度的修复图像进行上采样处理，得到第i+1尺度的上采样图像；其中，i为大于或等于2的整数；

将第N尺度的上采样图像、第N尺度的待修复图像和第N尺度的S张关键点蒙版图像进行拼接，得到第N拼接图像；将所述第N拼接图像输入至第N个修复模块中得到第N尺度的修复图像，作为所述第一生成器的输出图像。
如权利要求6所述的方法，其中，采用4堆栈沙漏模型提取所述待修复图像中的关键点。
如权利要求1所述的方法，其中，所述第一生成器是采用至少两个鉴别器对待训练生成器训练得到包括：

根据训练图像和验证图像对所述待训练生成器和所述至少两个鉴别器进行交替训练，得到所述第一生成器，其中，所述验证图像的清晰度高于所述训练图像的清晰度，对所述待训练生成器进行训练时，所述待训练生成器的总损失包括以下至少一项：第一损失和所述至少两个鉴别器的总对抗损失。
如权利要求8所述的方法，其中，所述第一生成器包括N个修复模块，其中，N为大于或等于2的整数，所述至少两个鉴别器包括：分别与所述N个修复模块对应的N个网络结构不同的第一类鉴别器，以及，第二类鉴别器；其中，所述第二类鉴别器被配置为提升所述第一生成器对所述训练图像的人脸局部的清晰度修复。
如权利要求9所述的方法，其中，

训练所述待训练生成器包括：

将所述训练图像处理成N个尺度的待修复训练图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

获取第N尺度的修复训练图像的第一人脸局部图像；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第一鉴别结果；

将所述第一人脸局部图像设置为具有真值标签，并将具有真值标签的所述第一人脸局部图像输入至初始的第二类鉴别器或上一次训练后的第二类鉴别器，以得到第二鉴别结果；

基于所述第一鉴别结果计算第一对抗损失；基于所述第二鉴别结果计算第二对抗损失，所述总对抗损失包括所述第一对抗损失和所述第二对抗损失；

根据所述总对抗损失对所述待训练生成器或上一次训练的生成器进行参数调整；

训练所述至少两个鉴别器包括：

将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

获取第N尺度的验证图像的第二人脸局部图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

获取第N尺度的修复训练图像的第一人脸局部图像；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有假值标签，并将具有假值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第三鉴别结果；将每一尺度的验证图像设置为具有真值标签，并将具有真值标签的每个验证图像输入所述第一类鉴别器以得到第四鉴别结果；

将所述第一人脸局部图像设置为具有假值标签，并将具有假值标签的所述第一人脸局部图像输入至初始的第二类鉴别器或上一次训练后的第二类鉴别器，以得到第五鉴别结果；将所述第二人脸局部图像设置为具有真值标签，并将具有真值标签的所述第二人脸局部图像输入至初始的第二类鉴别器或上一次训练后的第二类鉴别器，以得到第六鉴别结果；

基于所述第三鉴别结果和第四鉴别结果计算第三对抗损失；基于所述第五鉴别结果和第六鉴别结果计算第四对抗损失；

根据所述第三对抗损失调整所述第一类鉴别器的参数以得到更新后的第一类鉴别器；根据所述第四对抗损失调整所述第二类鉴别器的参数以得到更新后的第二类鉴别器。
如权利要求10所述的方法，其中，所述第一人脸局部图像和第二人脸局部图像为眼部图像。
如权利要求9所述的方法，其中，所述至少两个鉴别器还包括：X个第三类鉴别器；X为大于或等于1的正整数，所述第三类鉴别器被配置为提升所述第一生成器对所述训练图像的人脸部位的细节修复。
如权利要求12所述的方法，其中，

训练所述待训练生成器还包括：

将所述训练图像处理成N个尺度的待修复训练图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

采用人脸解析网络对第N尺度的修复图像进行人脸解析处理，得到所述第N尺度的修复图像对应的X张第一人脸部位图像，其中若X等于1，所述第一人脸部位图像包含一个人脸部位，若X大于1，所述X张第一人脸部位图像包含不同的人脸部位；

将所述X张第一人脸部位图像都设置为具有真值标签，并将具有真值标签的每个第一人脸部位图像输入至初始的第三类鉴别器或上一次训练后的第三类鉴别器，以得到第七鉴别结果；

基于所述第七鉴别结果计算第五对抗损失；所述总对抗损失包括所述第五对抗损失；

训练所述至少两个鉴别器还包括：

将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

采用人脸解析网络对所述第N尺度的修复图像进行人脸解析处理，得到所述第N尺度的修复图像对应的X张第一人脸部位图像，其中X张第一人脸部位图像包含包括不同的人脸部位；采用人脸解析网络对所述第N尺度的验证图像进行人脸解析处理，得到所述第N尺度的验证图像对应的X张第二人脸部位图像，其中所述X张第二人脸部位图像包含不同的人脸部位；

将所述X张第一人脸部位图像都设置为具有假值标签，并将具有假值标签的所述第一人脸部位图像输入至初始的第三类鉴别器或上一次训练后的第三类鉴别器，以得到第八鉴别结果；将所述X张第二人脸部位图像都设置为具有真值标签，并将具有真值标签的每张第二人脸部位图像输入至初始的第三类鉴别器或上一次训练后的第三类鉴别器，以得到第九鉴别结果；

基于所述第八鉴别结果和第九鉴别结果计算第六对抗损失；

根据所述第六对抗损失调整所述第三类鉴别器的参数以得到更新后的第三类鉴别器。
如权利要求12或13所述的方法，其中，X等于1，所述第三类鉴别器被配置为提升所述第一生成器对所述训练图像的人脸皮肤的细节修复。
如权利要求13所述的方法，其中，所述人脸解析网络采用语义分割网络。
如权利要求9所述的方法，其中，所述待训练生成器的总损失还包括：人脸相似度损失；

训练所述待训练生成器还包括：

将所述训练图像处理成N个尺度的待修复训练图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

采用关键点检测网络对第N尺度的修复图像进行关键点检测，得到所述第N尺度的修复图像对应的第一关键点热图；

采用关键点检测网络对所述第N尺度的待修复训练图像进行关键点检测，得到所述第N尺度的待修复训练图像对应的第二关键点热图；

根据所述第一关键点热图和所述第二关键点热图计算人脸相似度损失。
如权利要求9所述的方法，其中，所述待训练生成器的总损失还包括：平均梯度损失；

训练所述待训练生成器还包括：

将所述训练图像处理成N个尺度的待修复训练图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

计算第N尺寸的修复训练图像的平均梯度损失。
如权利要求8所述的方法，其中，所述第一生成器包括N个修复模块，其中，N为大于或等于2的整数，每个所述修复模块采用相同的网络结构；

对所述待训练生成器的训练过程包括第一训练阶段和第二训练阶段，所述第一训练阶段和所述第二训练阶段均包括对所述待训练生成器的至少一次训练过程；

在所述第一训练阶段，对每个所述修复模块进行调参时，所有修复模块共享相同的参数；

在所述第二训练阶段，每个所述修复模块分别独立调参。
如权利要求18所述的方法，其中，在所述第一训练阶段采用的学习率大于在所述第二训练阶段采用的学习率。
如权利要求8所述的方法，其中，所述至少两个鉴别器包括：第四类鉴别器和第五类鉴别器；所述第四类鉴别器被配置为保持所述第一生成器对所述训练图像的结构性特征；所述第五类鉴别器被配置为提升所述第一生成器对所述训练图像的细节修复。
如权利要求20所述的方法，其中，

训练所述待训练生成器包括：

将所述训练图像处理成N个尺度的待修复训练图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第四类鉴别器或上一次训练后的第四类鉴别器，以得到第十鉴别结果；

基于所述第十鉴别结果计算第七对抗损失；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第五类鉴别器或上一次训练后的第五类鉴别器，以得到第十一鉴别结果；

基于所述第十一鉴别结果计算第八对抗损失；

所述总对抗损失包括所述第七对抗损失和所述第八对抗损失；

根据所述总对抗损失对所述待训练生成器或上一次训练的生成器进行参数调整；

训练所述至少两个鉴别器包括：

将所述训练图像处理成N个尺度的待修复训练图像；将所述验证图像处理成N个尺度的验证图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有假值标签，并将具有假值标签的所述修复训练图像输入至初始的第四类鉴别器或上一次训练后的第四类鉴别器，以得到第十二鉴别结果；针对每一尺度的待修复训练图像，将所述待修复训练图像设置为具有真值标签，并将具有真值标签的所述待修复训练图像输入至初始的第四类鉴别器或上一次训练后的第四类鉴别器，以得到第十三鉴别结果；

基于所述第十二鉴别结果和第三鉴别结果计算第九对抗损失；

根据所述第九对抗损失调整所述第四类鉴别器的参数以得到更新后的第四类鉴别器；针对每个尺度的修复训练图像，对所述修复训练图像和对应尺度的验证图像进行高频滤波处理，得到高频滤波后的修复训练图像和验证图像；

针对每一尺度的高频滤波后的修复训练图像，将所述高频滤波后的修复训练图像设置为具有假值标签，并将具有假值标签的所述高频滤波后的修复训练图像输入至初始的第五类鉴别器或上一次训练后的第五类鉴别器，以得到第十四鉴别结果；针对每一尺度的高斯滤波后的验证图像，将所述高斯滤波后的验证图像设置为具有真值标签，并将具有真值标签的所述高斯滤波后的验证图像输入至初始的第五类鉴别器或上一次训练后的第五类鉴别器，以得到第十五鉴别结果；

基于所述第十四鉴别结果和第十五鉴别结果计算第十对抗损失；

根据所述第十对抗损失调整所述第五类鉴别器的参数以得到更新后的第五类鉴别器。
如权利要求20所述的方法，其中，所述待训练生成器的总损失还包括：平均梯度损失；

训练所述待训练生成器还包括：

将所述训练图像处理成N个尺度的待修复训练图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

计算第N尺寸的修复训练图像的平均梯度损失。
如权利要求17或22所述的方法，其中，平均梯度损失AvgG的计算公式如下：

其中，m和n分别是第N尺寸的修复训练图像的宽和高，fi,j为第N尺寸的修复训练图像在位置(i,j)上的像素。
如权利要求8所述的方法，其中，所述第一生成器包括N个修复模块，其中，N为大于或等于2的整数，所述至少两个鉴别器包括：分别与所述N个修复模块对应的N个网络结构不同的第一类鉴别器。
如权利要求24所述的方法，其中，

训练所述待训练生成器包括：

将所述训练图像处理成N个尺度的待修复训练图像；

针对每个尺度的待修复训练图像，提取所述待修复训练图像中的关键点，生成多张关键点热图，将所述关键点热图进行合并和分类，得到每个尺度的S张关键点蒙版图像，其中，S为大于或等于2的整数；

将所述N个尺度的待修复训练图像和每个尺度的S张关键点蒙版图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有真值标签，并将具有真值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第一鉴别结果；

基于所述第一鉴别结果计算第一对抗损失；所述总对抗损失包括所述第一对抗损失；

根据所述总对抗损失对所述待训练生成器或上一次训练的生成器进行参数调整；

训练所述至少两个鉴别器包括：

将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

针对每个尺度的待修复训练图像，提取所述待修复训练图像中的关键点，生成多张关键点热图，将所述关键点热图进行合并和分类，得到每个尺度的S张关键点蒙版图像；

将所述N个尺度的待修复训练图像和每个尺度的S张关键点蒙版图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

针对每一尺度的修复训练图像，将所述每一尺度的修复训练图像设置为具有假值标签，并将具有假值标签的所述修复训练图像输入至初始的第一类鉴别器或上一次训练后的第一类鉴别器，以得到第三鉴别结果；将每一尺度的验证图像设置为具有真值标签，并将具有真值标签的每个验证图像输入所述第一类鉴别器以得到第四鉴别结果；

基于所述第三鉴别结果和第四鉴别结果计算第三对抗损失；

根据所述第三对抗损失调整所述第一类鉴别器的参数以得到更新后的第一类鉴别器。
如权利要求8或24所述的方法，其中，

训练所述待训练生成器包括：

将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

将所述N个尺度的修复训练图像和所述N个尺度的验证图像输入至VGG网络中，得到每个尺度的修复训练图像在所述VGG网络的M个目标层上的损失，M为大于或等于1的整数；

所述第一损失包括所述N个尺度的修复训练图像在M个目标层上的损失。
如权利要求26所述的方法，其中，所述第一损失包括：每个尺度的修复训练图像在M个目标层上的损失与对应的权重相乘之后相加，其中，不同尺度的修复训练图像在目标层使用的权重不同。
如权利要求24所述的方法，其中，所述第一损失包括：逐像素的二范式损失。
如权利要求8所述的方法，其中，所述第一损失还包括以下至少一项：L1损失、第二损失和第三损失；

所述第一损失包括L1损失时，所述训练所述待训练生成器包括：

将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

通过比较所述N个尺度的修复训练图像和所述N个尺度的验证图像，得到L1损失；

所述第一损失包括所述第二损失时，所述训练所述待训练生成器包括：

将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

获取第N尺度的修复训练图像的第一眼部图像和第N尺度的验证图像的第二眼部图像；

将所述第一眼部图像和所述第二眼部图像输入至VGG网络中，得到所述第一眼部图像在所述VGG网络的M个目标层上的第二损失，M为大于或等于1的整数；

所述第一损失包括所述第三损失时，所述训练所述待训练生成器包括：

将所述训练图像处理成N个尺度的待修复训练图像，将所述验证图像处理成N个尺度的验证图像；

将所述N个尺度的待修复训练图像输入至待训练生成器或上一次训练后的生成器中得到N个尺度的修复训练图像；

获取第N尺度的修复训练图像的第一人脸皮肤图像和第N尺度的验证图像的第二人脸皮肤图像；

将所述第一人脸皮肤图像和所述第二人脸皮肤图像输入至VGG网络中，得到所述第一人脸皮肤图像在所述VGG网络的M个目标层上的第三损失。
如权利要求1所述的方法，其中，所述第一生成器包括4个尺度的修复模块，分别为：64*64尺度的修复模块、128*128尺度的修复模块、256*256尺度的修复模块和512*512尺度的修复模块。
如权利要求6或25所述的方法，其中，S等于5，所述S张关键点蒙版图像包括：左眼、右眼、鼻子、嘴和轮廓的关键点蒙版图像。
如权利要求2、5、6、9、18或24所述的方法，其中，所述修复模块采用的网络结构为SRCNN或U-Net。
一种图像处理方法，其中，包括：

接收输入图像；

对所述输入图像进行人脸检测，得到人脸图像；

采用如权利要求1-32任一项所述的方法对所述人脸图像进行处理得到第一修复训练图像，其中，所述第一修复训练图像的清晰度高于所述输入图像的清晰度；

对所述输入图像或去除所述人脸图像的输入图像进行处理得到第二修复训练图像，其中，所述第二修复训练图像的清晰度高于所述输入图像的清晰度；

将所述第一修复训练图像和所述第二修复训练图像进行融合，得到融合后的图像，所述融合图像的清晰度高于所述输入图像的清晰度。
如权利要求33所述的方法，其中，对所述输入图像或去除所述人脸图像的输入图像进行处理得到第二修复训练图像包括：

采用如权利要求1至32任一项所述的方法对所述输入图像或去除所述人脸图像的输入图像进行处理得到第二修复训练图像。
一种图像处理装置，其中，包括：

接收模块，用于接收输入图像；

处理模块，用于利用第一生成器对所述输入图像进行处理得到输出图像，其中，所述输出图像的清晰度高于所述输入图像的清晰度；

其中，所述第一生成器是利用至少两个鉴别器对待训练生成器训练得到。
一种图像处理装置，其中，包括：

接收模块，用于接收输入图像；

人脸检测模块，用于对所述输入图像进行人脸检测，得到人脸图像；

第一处理模块，用于采用如权利要求1至32任一项所述的方法对所述人脸图像进行处理得到第一修复训练图像，其中，所述第一修复训练图像的清晰度高于所述输入图像的清晰度；

第二处理模块，用于对所述输入图像或去除所述人脸图像的输入图像进行处理得到第二修复训练图像，其中，所述第二修复训练图像的清晰度高于所述输入图像的清晰度；

将所述第一修复训练图像和所述第二修复训练图像进行融合，得到融合后的图像，所述融合图像的清晰度高于所述输入图像的清晰度。
一种电子设备，其中，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1至32任一项所述的图像处理方法的步骤，或者，所述程序或指令被所述处理器执行时实现如权利要求33或34所述的图像处理方法的步骤。
一种可读存储介质，其中，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1至32任一项所述的图像处理方法的步骤，或者，实现如权利要求33或34所述的图像处理方法的步骤。