WO2024088111A1

WO2024088111A1 - 图像处理方法、装置、设备、介质及程序产品

Info

Publication number: WO2024088111A1
Application number: PCT/CN2023/124980
Authority: WO
Inventors: 程紫阳
Original assignee: 北京字跳网络技术有限公司
Priority date: 2022-10-28
Filing date: 2023-10-17
Publication date: 2024-05-02
Also published as: CN115641276A

Abstract

本公开提供一种图像处理方法、装置、设备、存储介质及程序产品。该方法包括：获取待处理的原始面部图像；基于第一网络对所述原始面部图像进行处理，得到所述原始面部图像的高维特征、低维特征和目标平滑属性；所述第一网络基于所述目标平滑属性，对所述高维特征和所述低维特征进行轮廓平滑处理得到高维矫正特征和低维矫正特征；基于所述高维矫正特征和所述低维矫正特征生成目标面部图像。

Description

图像处理方法、装置、设备、介质及程序产品

本申请要求于2022年10月28日提交中国国家知识产权局、申请号为202211339290.3、发明名称为“图像处理方法、装置、设备、介质及程序产品”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开涉及计算机技术领域，尤其涉及一种图像处理方法、装置、设备、介质及程序产品。

背景技术

图像处理技术广泛应用于人像或宠物图像美化的场景，其通常基于关键点来进行面部美化，例如面部轮廓的美化。然而，现有的面部轮廓美化可能由于面部关键点检测不准确等原因，平滑效果不稳定且不自然，不能满足用户对图像中面部轮廓平滑的要求。

发明内容

本公开提出一种图像处理方法、装置、设备、存储介质及程序产品，以在一定程度上解决人脸图像中面部轮廓平滑效果不佳的技术问题。

本公开第一方面，提供了一种图像处理方法，包括：

获取待处理的原始面部图像；

基于第一网络对所述原始面部图像进行处理，得到所述原始面部图像的高维特征、低维特征和目标平滑属性；

所述第一网络基于所述目标平滑属性，对所述高维特征和所述低维特征进行轮廓平滑处理得到高维矫正特征和低维矫正特征；

基于所述高维矫正特征和所述低维矫正特征生成目标面部图像。

本公开第二方面，提供了一种图像处理装置，包括：

获取模块，用于获取待处理的原始面部图像；

第一网络，用于对所述原始面部图像进行处理，得到所述原始面部图像的高维特征、低维特征和目标平滑属性；所述第一网络基于所述目标平滑属性，对所述高维特征和所述低维特征进行轮廓平滑处理得到高维矫正特征和低维矫正特征；以及基于所述高维矫正特征和所述低维矫正特征生成目标面部图像。

本公开第三方面，提供了一种电子设备，其特征在于，包括一个或者多个处理器、存储器；和一个或多个程序，其中所述一个或多个程序被存储在所述存储器中，并且被所述一个或多个处理器执行，所述程序包括用于执行根据第一方面或第二方面所述的方法的指令。

本公开第四方面，提供了一种包含计算机程序的非易失性计算机可读存储介质，当所述计算机程序被一个或多个处理器执行时，使得所述处理器执行第一方面或第二方面所述的方法。

本公开第五方面，提供了一种计算机程序产品，包括计算机程序指令，当所述计算机程序指令在计算机上运行时，使得计算机执行第一方面所述的方法。

从上面所述可以看出，本公开提供的一种图像处理方法、装置、设备、介质及程序产品，基于第一网络自适应对原始面部图像确定的目标平滑属性，对原始面部图像的高维特征和低维特征进行矫正，以实现对图像中脸部轮廓的平滑处理，而不改变图像中其他区域的特征，使得经过处理的图像更自然，提高了图像处理的效果，也在美化图像的同时减少了用户的创造成本。

附图说明

为了更清楚地说明本公开或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例的图像处理架构的示意图。

图2为本公开实施例的示例性电子设备的硬件结构示意图。

图3为本公开实施例的图像处理方法的示意性原理图。

图4为本公开实施例的图像处理方法的示意性原理图。

图5为本公开实施例的图像处理方法的流程示意图。

图6为本公开实施例的图像处理装置的示意图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本公开进一步详细说明。

需要说明的是，除非另外定义，本公开实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。

可以理解的是，在使用本公开各实施例公开的技术方案之前，均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。

例如，在响应于接收到用户的主动请求时，向用户发送提示信息，以明确地提示用户，其请求执行的操作将需要获取和使用到用户的个人信息。从而，使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。

作为一种可选的但非限定性的实现方式，响应于接收到用户的主动请求，向用户发送提示信息的方式例如可以是弹窗的方式，弹窗中可以以文字的方式呈现提示信息。此外，弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。

可以理解的是，上述通知和获取用户授权过程仅是示意性的，不对本公开的实现方式构成限定，其它满足相关法律法规的方式也可应用于本公开的实现方式中。

图1示出了本公开实施例的图像处理架构的示意图。参考图1，该图像处理架构100可以包括服务器110、终端120以及提供通信链路的网络130。服务器110和终端120之间可通过有线或无线的网络130连接。其中，服务器110可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、安全服务、CDN等基础云计算服务的云服务器。

终端120可以是硬件或软件实现。例如，终端120为硬件实现时，可以是具有显示屏并且支持页面显示的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。终端120设备为软件实现时，可以安装在上述所列举的电子设备中；其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块)，也可以实现成单个软件或软件模块，在此不做具体限定。

需要说明的是，本申请实施例所提供的图像处理方法可以由终端120来执行，也可以由服务器110来执行。应了解，图1中的终端、网络和服务器的数目仅为示意，并不旨在对其进行限制。根据实现需要，可以具有任意数目的终端、网络和服务器。

图2示出了本公开实施例所提供的示例性电子设备200的硬件结构示意图。如图2所示，电子设备200可以包括：处理器202、存储器204、网络模块206、外围接口208和总线210。其中，处理器202、存储器204、网络模块206和外围接口208通过总线210实现彼此之间在电子设备200的内部的通信连接。

处理器202可以是中央处理器(Central Processing Unit，CPU)、图像处理器、神经网络处理器(NPU)、微控制器(MCU)、可编程逻辑器件、数字信号处理器(DSP)、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路。处理器202可以用于执行与本公开描述的技术相关的功能。在一些实施例中，处理器202还可以包括集成为单一逻辑组件的多个处理器。例如，如图2所示，处理器202可以包括多个处理器202a、202b和202c。

存储器204可以配置为存储数据(例如，指令、计算机代码等)。如图2所示，存储器204存储的数据可以包括程序指令(例如，用于实现本公开实施例的图像处理方法的程序指令)以及要处理的数据(例如，存储器可以存储其他模块的配置文件等)。处理器202也可以访问存储器204存储的程序指令和数据，并且执行程序指令以对要处理的数据进行操作。存储器204可以包括易失性存储装置或非易失性存储装置。在一些实施例中，存储器204可以包括随机访问存储器(RAM)、只读存储器(ROM)、光盘、磁盘、硬盘、固态硬盘(SSD)、闪存、存储棒等。

网络模块206可以配置为经由网络向电子设备200提供与其他外部设备的通信。该网络可以是能够传输和接收数据的任何有线或无线的网络。例如，该网络可以是有线网络、本地无线网络(例如，蓝牙、WiFi、近场通信(NFC)等)、蜂窝网络、因特网、或上述的组合。可以理解的是，网络的类型不限于上述具体示例。在一些实施例中，网络模块306可以包括任意数量的网络接口控制器(NIC)、射频模块、接收发器、调制解调器、路由器、网关、适配器、蜂窝网络芯片等的任意组合。

外围接口208可以配置为将电子设备200与一个或多个外围装置连接，以实现信息输入及输出。例如，外围装置可以包括键盘、鼠标、触摸板、触摸屏、麦克风、各类传感器等输入设备以及显示器、扬声器、振动器、指示灯等输出设备。

总线210可以被配置为在电子设备200的各个组件(例如处理器202、存储器204、网络模块206和外围接口208)之间传输信息，诸如内部总线(例如，处理器-存储器总线)、外部总线(USB端口、PCI-E总线)等。

需要说明的是，尽管上述电子设备200的架构仅示出了处理器202、存储器204、网络模块206、外围接口208和总线210，但是在具体实施过程中，该电子设备200的架构还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述电子设备200的架构中也可以仅包含实现本公开实施例方案所必需的组件，而不必包含图中所示的全部组件。

为了获得更好的图像效果，人们常常使用具有美颜功能的应用程序来对图像进行处理。这类具有美颜功能的图像处理应用程序一般基于面部关键点来对图像进行美化，例如检测出面部关键点后，对面部关键点进行调整以对面部轮廓进行平滑。然而，这种方式可能由于面部关键点检测不准确等原因，平滑效果不佳且不稳定；同时，在对面部轮廓进行平滑时还可能改变面部的五官、肤色等特征，使得平滑后的面部图像整体改动过大，与真实的面部相差深远，无法满足用户对面部图像中面部轮廓平滑的要求。因此，如何提升面部图像中面部轮廓平滑效果成为了亟需解决的技术问题。

鉴于此，本公开实施例提供了一种图像处理方法、装置、设备、存储介质及程序产品。基于第一网络自适应对原始面部图像确定的目标平滑属性，对原始面部图像的高维特征和低维特征进行矫正，以实现对图像中面部轮廓的平滑处理，而不改变图像中其他区域的特征，使得经过处理的图像更自然，提高了图像处理的效果，也在美化图像的同时减少了用户的创造成本。具体到图像处理的应用程序中，能够基于第一网络自适应确定的目标平滑属性，实现一键式改变面部轮廓的流畅度，可以使图像中凹凸不平的轮廓变得平滑流畅。

参见图3，图3示出了根据本公开实施例的图像处理方法的示意性原理图。图3中，图像处理模型300的模型架构可以采用生成式对抗网络(Generative Adversarial Network，GAN)，包括生成网络310和判别网络320。可以采用第一训练样本和预设监督策略对初始的生成对抗网络进行训练得到图像处理模型300。可以将图像处理模型300中的生成网络310作为实际应用中的轮廓平滑网络330，以对待处理的原始图像进行面部轮廓的平滑处理，并得到平滑处理后的目标图像。

在一些实施例中，基于第一训练样本可以包括至少一个样本对，每个样本对包括原始训练图像A和与原始训练图像A对应的面部矫正图像B。在一些实施例中，可以基于预设的轮廓平滑标准对原始训练图像A进行特征矫正，得到对应的面部矫正图像B。具体地，可以先获取第一数量(例如3000个)的原始训练图像A，原始训练图像A中包括符合图像质量要求的面部图像，例如该面部图像的分辨率不低于1024*1024像素。其中，第一训练样本中原始训练图像A可以是人脸图像，此时可以尽可能多地覆盖各中类型的面部图像，例如，可以覆盖男性和女性的面部、各个年龄段(例如20-80岁)的面部、各种角度的面部等，从而保证训练数据的丰富性，提高模型训练的准确度。然后，根据预设的面部轮廓效果标准，人工对该原始训练图像A的面部图像进行面部轮廓的特征矫正，使得原始训练图像A的面部轮廓变得平滑，从而得到对应的面部矫正图像B。应了解，在人工进行面部轮廓的特征矫正时，可以不对面部的诸如肤色、五官、肤质等其他特征进行处理，以保证训练得到图像处理模型仅改善面部轮廓的平滑度，而不会对面部的改动过大，影响面部图像的真实性，导致图像处理效果不自然。此外，第一训练样本中原始训练图像A还可以是动物的面部图像，例如猫或狗的面部图像等。

在一些实施例中，可以基于第一训练样本和预设监督策略对生成对抗网络进行训练，得到轮廓平滑网络。为了保证训练过程中，图像处理模型300中的生成网络310能够自适应学习面部平滑的网络参数，可以设置预设监督策略，使用第一训练样本对图像处理模型300进行有监督训练，从而得到能够自适应地对输入图像匹配合适的目标平滑属性的生成网络310作为轮廓平滑网络330。

在一些实施例中，预设监督策略可以包括：设置所述生成对抗网络的输入图像的光照条件参数，以模拟所述输入图像的光照条件。进一步地，该光照条件参数可以是随机设置的。在训练阶段，输入至输出对抗网络的输入图像可以是第一训练样本中的图像，例如原始训练图像A和对应的面部矫正图像B。其中，基于光照条件参数来模拟图像处理模型300中输入图像的光照条件，能够增加输入数据的丰富度，这样图像处理模型300能够在训练过程中处理更多样化的输入图像，从而提高图像处理模型300的准确度。具体地，例如，可以采用gamma矫正算法来实现光照模拟，即可以通过设置gamma矫正算法的相关参数来设置光照条件参数。

在一些实施例中，预设监督策略可以包括：

所述生成网络基于所述第一训练样本中的所述原始训练图像生成对应的第一图像；

基于所述第一图像和所述原始训练图像分别计算所述生成网络和所述判别网络的交叉熵损失函数；

基于所述交叉熵损失函数调整所述判别网络的第一判别网络参数以使所述交叉熵损失函数最大化，以及基于所述交叉熵损失函数调整所述生成网络的第一生成网络参数以使所述交叉熵损失函数最小化。

具体地，生成网络310和判别网络320的交叉熵损失函数V(D，G)可以包括：关于第一对数函数的第一期望函数与关于第二对数函数的第二期望函数之和，其中，第一对数函数包括关于原始训练图像x的第一判别结果的对数函数，第二对数函数包括关于第一预设值(例如1)与针对原始训练图像x的生成结果的第二判别结果之差的对数函数。图像处理模型300的训练过程可以是生成网络310和判别网络320这两个网络单独且交替训练，例如可以先固定生成网络310且训练判别网络320以更新判别网络320的第一判别网络参数。此时，可以调整判别网络320的第一判别网络参数，以使得判别网络320在其输入为面部矫正图像B时输出1(即D(B)＝1)，在其输入为第一图像A’时输出0(即D(A’)＝0)。那么，图像处理模型300的训练目标是最大化交叉熵函数V(D，G)。

再固定判别网络320且训练生成网络310以更新生成网络310的第一生成网络参数。此时，可以调整生成网络310的第一生成网络参数，以使得将生成网络310输出的第一图像A’作为判别网络320的输入时，判别网络320输出1(即D(A’)＝1)。那么，图像处理模型300的训练目标是最小化交叉熵函数V(D，G)，由于此时判别网络320的第一网络参数不变，那么E_x[log D(x)]也不变，最小化交叉熵函数V(D，G)。

如此反复地执行固定生成网络310时训练判别网络320，以及固定判别网络320时训练生成网络310，直到达到纳什均衡。这样，能够使得生成网络310所生成的结果更加真实。

在一些实施例中，图像处理模型还包括与生成网络关联的平滑属性判别器，预设监督策略可以包括：

基于所述原始训练图像、所述原始训练图像的第一平滑属性、所述面部矫正图像、所述面部矫正图像的第二平滑属性和所述第一图像计算所述生成网络和所述平滑属性判别器的平滑属性损失函数；

基于所述平滑属性损失函数调整所述生成网络的第二生成网络参数，使得所述第一图像与所述第二平滑属性相匹配。

具体地，如图4所示，图4示出了根据本公开实施例的图像处理模型的示意图。图4中，图像处理模型300还包括与生成网络310关联的平滑属性判别器340，还可以在图像处理模型300中设置平滑属性判别器340以计算由生成网络310和该平滑属性判别器340的平滑属性损失函数。可以将第一训练样本中的原始训练图像A与原始训练图像的第一平滑属性R1、面部矫正图像B与面部矫正图像的第二平滑属性R2、和第一图像A’作为平滑属性判别器340的输入数据成对输入，该输入数据可以表示为对象-属性对(Image，attr)，其中Image表示输入图像，attr表示平滑属性。平滑属性判别器340对输入数据(Image，attr)进行匹配判定，如果Image和attr相匹配则判定结果为True，否则为False。例如Imgae为原始训练图像A的时候如果attr是原始训练图像A 对应的值R1则输出为True，Imgae为原始训练图像A的时候如果attr是面部矫正图像B对应的值R2则输出为False。在训练过程中，生成网络310和平滑属性判别器340单独且交替训练更新。

在更新平滑属性判别器340时，生成网络310是固定的，调整平滑属性判别器340的第二判别网络参数，以使得平滑属性判别器340的输入为(A，R1)或(B，R2)时，对应的输出为Dattr(A，R1)＝Dattr(B，R2)＝1(即True)；输入为(B，R1)、(A，R2)或(A’，R2)时，对应的输出为Dattr(B，R1)＝Dattr(A，R2)＝Dattr(A’，R2)＝0(即False)。可以将生成网络310和平滑属性判别器340的交叉熵函数作为平滑属性损失函数V(Dattr，G)，包括：关于第三对数函数的第三期望函数与关于第四对数函数的第四期望函数之和，其中，第三对数函数包括关于原始训练图像x及其属性sttr的判别结果的对数函数，第四对数函数包括关于第一预设值(例如1)与原始训练图像x及其属性sttr的生成结果之差的对数函数。那么更新平滑属性判别器340时的目标是最大化平滑属性损失函数V(Dattr，G)。

在更新生成网络310时，平滑属性判别器340是固定的，调整生成网络310的第二生成网络参数，以使得平滑属性判别器340的输入为(A’，R2)时，对应的输出为Dattr(A’，R1)＝Dattr(G(A)，R1)＝1(即True)，即使得第一图像A’与面部矫正图像B的第二平滑属性相匹配，最终让生成网络310生成的第一图像A’符合面部矫正图像B的平滑属性，从而使得生成网络310具备自适应匹配输入图像的平滑属性的特性。这样，生成网络310针对其输入图像，都能够自适应地匹配与该输入图像相适应的平滑属性，以生成适合该输入图像的轮廓平滑处理图像，以实现在生成网络310作为轮廓平滑网络进行应用时，能够提高轮廓平滑处理的效果。

在一些实施例中，预设监督策略可以包括：

基于所述第一图像和所述第一训练样本中的所述面部矫正图像计算特征矫正损失函数；

基于所述特征矫正损失函数调整基于所述特征矫正损失函数调整所述生成网络的第三生成网络参数和所述判别网络的第三判别网络参数，以使得所述特征矫正损失函数最小化。

进一步地，在一些实施例中，基于所述第一图像和所述第一训练样本中的所述面部矫正图像计算特征矫正损失函数，进一步包括：

对所述第一图像进行特征提取，得到第一高维语义特征和第一低维纹理特征；以及对所述第一训练样本中的所述面部矫正图像进行特征提取，得到第二高维语义特征和第二低维纹理特征；

基于所述第一高维语义特征和所述第二高维语义特征计算第一高维特征损失函数，以及基于所述第一低维纹理特征和所述第二低维纹理特征计算第一低维特征损失函数；

基于所述第一高维特征损失函数和所述第二低维特征损失函数之和得到所述特征矫正损失函数。

其中，高维语义特征可以指基于图像处理模型中深层网络所得到的特征，该高维语义特征可以靠近输出层，具有分辨率低、特征图的尺寸小、抽象程度高、包含更多全局信息等特点。低维纹理特征可以指基于图像处理模型中浅层网络所得到的特征，该低维纹理特征可以靠近输入层，具有分辨率较高，特征图的尺寸大、包含更多细节信息、容易与原始训练图像对齐等特点。通过对这两种特征进行矫正，能够将二者的优势相结合，从而提升图像处理模型的训练效果，以及面部轮廓平滑处理的效果。

具体地，生成网络310基于原始训练图像A生成对应的第一图像A’。可以通过图像处理模型300中的视觉处理器对第一图像A’进行特征提取，得到第一图像的第一高维语义特征F1_A’和第一低维纹理特征F2_A’；以及对第一训练样本中的面部矫正图像进行特征提取，得到第二高维语义特征F3和第二低维纹理特征F4。那么此时可以计算得到特征矫正损失函数L_F＝第一高维特征损失函数l1(F1_A’，F3)+第一低维特征损失函数l1(F2_A’，F4)，其中l1为平均绝对误差函数。

应了解，本公开中的第一生成网络参数、第二生成网络参数和第三生成网络参数均可以表示生成网络的模型参数，其可以相同或不同；第一判别网络参数、第二判别网络参数和第三判别网络参数均可以表示判别络的模型参数，其可以相同或不同。

在一些实施例中，预设监督策略可以包括：

基于原始训练图像的第一平滑属性和面部矫正图像的第二平滑属性确定所述原始训练图像的损失权重。

进一步地，基于原始训练图像的第一平滑属性和所述面部矫正图像的第二平滑属性确定所述原始训练图像的损失权重，包括：

基于平滑属性算法计算所述原始训练图像的第一平滑属性和所述面部矫正图像的第二平滑属性；

基于所述第一平滑属性和所述第二平滑属性计算所述原始训练图像的平滑改变程度；

基于所述平滑改变程度确定所述原始训练图像的损失权重，其中，所述原始训练图像的损失权重与所述平滑改变程度成正比。

在一些实施例中，基于所述第一平滑属性和所述第二平滑属性计算所述原始训练图像的平滑改变程度，可以包括：

计算所述第一平滑属性和所述第二平滑属性的属性差值；

基于所述属性差值的绝对值函数得到所述平滑改变程度。

具体地，可以分别计算原始训练图像A的第一平滑属性S_A，面部矫正图像B的第二平滑属性S_B，则原始训练图像A的平滑改变程度＝abs(S_B-S_A)，其中，abs为绝对值函数。由于平滑改变程度可以反映出每个训练样本需要进行面部轮廓改变的程度，对于面部重度凹凸不平的样本对应的损失函数权重应该更大，通过对损失权重的分配能够提升模型对平滑改变程度较大的样本的重视程度，同时减少对面部轮廓的平滑改变程度较小的样本的过度矫正，从而保证面部轮廓的平滑处理效果。那么可以据此确定原始训练图像A的损失权重与滑改变程度成正比。

经过上述预设监督策略中的一个或多个，对生成对抗网络进行训练得到训练好的图像处理模型。该训练好的图像处理模型字在训练过程中自适应学习训练样本的面部平滑的网络参数，能够自适应匹配适合输入图像的平滑属性。将其中的生成网络作为实际应用时对图像进行面部轮廓平滑处理的轮廓平滑网络，对用户输入的原始图像进行面部轮廓的处理，让面部轮廓变得平滑流畅。

在一些实施例中，基于第一训练样本和预设监督策略对生成对抗网络进行训练，得到所述轮廓平滑网络，还可以进一步包括：

基于第一训练样本和预设监督策略对生成对抗网络进行训练得到初步图像处理模型；

基于第二训练样本和所述预设监督策略对所述初步图像处理模型进行二次训练得到所述轮廓平滑网络。

进一步地，在一些实施例中，第二训练样本可以基于所述初步图像处理模型得到，具体包括：

获取包括多个面部图像的训练数据集，以及将所述面部图像输入至所述生成对抗网络中的生成网络得到第二图像；

将所述第二图像输入所述初步图像处理模型得到与所述第二图像对应的经过初步平滑处理的第三图像；

基于所述第二图像和对应的第三图像得到所述第二训练样本。

其中，由于第一训练样本的数据量较小，基于第一训练样本训练得到的初步图像处理模型(包括初步生成网络和初步判别网络)不太稳定，为了增加生成图像处理模型的稳定性，还需要使用该初步图像处理模型处理大批量的数据，得到大批量的二次训练数据集作为第二训练样本。然后使用该第二训练样本和预设监督策略对初步图像处理模型进行二次训练，得到更稳定的图像处理模型，并将该更稳定的图像处理模型中的生成网络作为轮廓平滑网络，从而提高了实际应用中面部轮廓处理的稳定性。

具体地，可以获取大批量的面部图像(例如，包括面部图像的开源数据集)，将该大批量的面部图像输入至初始的生对抗网络中的初始生成网络以生成第二图像D，得到大批量数据集set_D，然后将该大批量数据集set_D输入基于第一训练样本训练得到的初步图像处理模型得到输出的第三图像E。由第二图像D与对应的第三图像E则组成新的训练数据对，作为第二训练样本，结合预设监督策略对初步图像处理模型进行二次训练，得到新的图像处理模型。可以将该新的图像处理模型中的生成网络作为实际应用的轮廓平滑网络(例如图4中的轮廓平滑网络330)。

参见图5，图5示出了根据本公开实施例的图像处理方法的流程示意图。图5中，图像处理方法500可以包括如下步骤。

步骤S510，获取待处理的原始面部图像；

步骤S520，基于第一网络对所述原始面部图像进行处理，得到所述原始面部图像的高维特征、低维特征和目标平滑属性；

步骤S530，所述第一网络基于所述目标平滑属性，对所述高维特征和所述低维特征进行轮廓平滑处理得到高维矫正特征和低维矫正特征；

步骤S540，基于所述高维矫正特征和所述低维矫正特征生成目标面部图像。

具体地，对于待处理的原始图像imageA，用户希望将原始图像imageA中的面部轮廓进行平滑处理。可以对该原始图像imageA进行面部关键点检测得到原始图像imageA的面部关键点P。并基于面部关键点P对原始图像imageA进行面部剪裁得到原始面部图像image_Face。将原始面部图像image_Face输入训练好的第一网络(例如图3中的轮廓平滑网络330)，第一网络对原始面部图像image_Face进行特征提取得到原始面部图像image_Face的高维语义特征F1和低维纹理特征F2。由于训练好的第一网络能够基于输入数据自适应地确定与输入数据向匹配的目标平滑属性，可以对高维语义特征F1和低维纹理特征F2分别进行平滑处理得到高维语义矫正特征F1’和低维纹理矫正特征F2’。轮廓平滑网络再将高维语义矫正特征F1’和低维纹理矫正特征F2’生成平滑处理后的目标面部图像image_Face’。还可以进一步地将目标面部图像image_Face’融合至原始图像imageA中，得到对面部轮廓进行平滑处理的目标图像imageA’。根据本公开实施例的图像处理方法，基于轮廓平滑网络的自适应平滑属性对图像的高维语义特征和低维纹理特征进行矫正，以实现对图像中面部轮廓的平滑处理，而不改变图像中的其他区域的特征，使得经过处理的图像更自然，提高了图像处理的效果，也在美化图像的同时减少了用户的创造成本。具体到图像处理的应用程序中，能够基于轮廓平滑网络的自适应平滑属性，实现一键式改变面部轮廓的流畅度，可以使图像中凹凸不平的轮廓变得平滑流畅。

在实际应用中，用户可能不仅需对人像进行美化，还可能需要对动物图像(例如猫、狗等宠物)进行美化。根据本公开实施例的方法，不仅能够对人脸图像中的面部轮廓进行平滑处理，还能够对动物图像中的面部轮廓进行平滑处理，使得人像或动物图像中的面部轮廓更加平滑流畅，以及整个图像更加自然。

在一些实施例中，基于第一网络对所述原始面部图像进行处理，得到所述原始面部图像的高维特征和低维特征，包括：

所述第一网络对所述原始面部图像进行特征提取，得到所述原始面部图像的所述高维特征(例如原始面部图像image_Face的高维语义特征F1)和所述低维特征(例如原始面部图像image_Face的低维纹理特征F2)；其中，所述高维特征为语义特征，所述低维特征为纹理特征。

具体地，高维特征可以是指高维语义特征，低维特征可以是指低维纹理特征。第一网络可以对原始面部图像image_Face进行特征提取得到原始面部图像image_Face的高维语义特征F1和低维纹理特征F2。

在一些实施例中，基于第一网络对所述原始面部图像进行处理，得到所述原始面部图像的目标平滑属性，包括：

所述第一网络对所述原始面部图像进行面部轮廓检测，得到所述原始面部图像的面部轮廓特征点，并基于所述面部轮廓特征点确定所述目标平滑属性。

在一些实施例中，基于所述面部轮廓特征点确定所述目标平滑属性，包括：

基于所述面部轮廓特征点确定目标轮廓特征点，并基于所述目标轮廓特征点确定所述目标平滑属性；或，

基于所述面部轮廓特征点确定所述原始面部图像的原始平滑属性，并基于所述原始平滑属性确定所述目标平滑属性。

具体地，训练好的第一网络能够根据输入数据自适应地确定该输入数据的目标平滑属性，例如可以先确定输入数据的目标轮廓特征点，在基于该目标轮廓特征点得到对应的目标平滑属性，也可以先由输入数据的原始轮廓特征点确定原始平滑属性，再根据原始平滑属性来确定目标平滑属性。

在一些实施例中，基于所述目标平滑属性，对所述高维特征和所述低维特征进行轮廓平滑处理得到高维矫正特征和低维矫正特征，包括：

基于所述目标平滑属性设定所述高维特征和所述低维特征的损失函数权重，得到所述高维矫正特征和低维矫正特征。在一些实施例中，基于第一训练样本和预设监督策略对生成对抗网络进行训练，得到所述第一网络(例如图3中的轮廓平滑网络330)；

其中，所述第一训练样本包括至少一个样本对，所述样本对包括原始训练图像(例如图3中的原始训练图像A)和对应的面部矫正图像(例如图3中的面部矫正图像B)，所述面部矫正图像基于所述原始训练图像进行面部轮廓平滑处理得到。

在一些实施例中，所述生成对抗网络包括生成网络(例如图3中的生成网络310)和与所述生成网络关联的判别网络(例如图3中的判别网络320)，所述预设监督策略包括：

所述生成网络基于所述第一训练样本中的所述原始训练图像生成对应的第一图像(例如第一图像A’)；

基于所述第一图像和所述原始训练图像分别计算所述生成网络和所述判别网络的交叉熵损失函数(例如V(D，G))；

基于所述交叉熵损失函数调整所述判别网络的第一判别网络参数以使所述交叉熵损失函数最大化(例如)，以及基于所述交叉熵损失函数调整所述生成网络的第一生成网络参数以使所述交叉熵损失函数最小化(例如)。

在一些实施例中，所述生成对抗网络包括生成网络和与所述生成网络关联的平滑属性判别器(例如图4中的平滑属性判别器340)，所述预设监督策略包括：

基于所述原始训练图像、所述原始训练图像的第一平滑属性(例如第一平滑属性R1)、所述面部矫正图像、所述面部矫正图像的第二平滑属性(例如第二平滑属性R2)和所述第一图像计算所述生成网络和所述平滑属性判别器的平滑属性损失函数(例如V(Dattr，G))；

基于所述平滑属性损失函数调整所述生成网络的第二生成网络参数，使得所述第一图像与所述第二平滑属性相匹配(例如Dattr(A’，R1)＝Dattr(G(A)，R1)＝1)。

在一些实施例中，所述生成对抗网络包括生成网络和与所述生成网络关联的平滑属性判别器，所述预设监督策略包括：

基于所述第一图像和所述第一训练样本中的所述面部矫正图像计算特征矫正损失函数(例如特征矫正损失函数L_F)；

基于所述特征矫正损失函数调整所述生成网络的第三生成网络参数和所述判别网络的第三判别网络参数，以使得所述特征矫正损失函数最小化。

在一些实施例中，基于所述第一图像和所述第一训练样本中的所述面部矫正图像计算特征矫正损失函数，进一步包括：

在一些实施例中，所述预设监督策略包括：

在一些实施例中，基于原始训练图像的第一平滑属性和所述面部矫正图像的第二平滑属性确定所述原始训练图像的损失权重，包括：

基于所述第一平滑属性(例如第一平滑属性S_A)和所述第二平滑属性(例如第二平滑属性S_B)计算所述原始训练图像的平滑改变程度(例如平滑改变程度＝abs(S_B-S_A))；

在一些实施例中，基于所述第一平滑属性和所述第二平滑属性计算所述原始训练图像的平滑改变程度，包括：

计算所述第一平滑属性和所述第二平滑属性的属性差值；

基于所述属性差值的绝对值函数得到所述平滑改变程度。

在一些实施例中，基于第一训练样本和预设监督策略对生成对抗网络进行训练，得到所述轮廓平滑网络，还进一步包括：

基于第二训练样本和所述预设监督策略对所述初步图像处理模型进行二次训练得到所述轮廓平滑网络(例如图3-4中的轮廓平滑网络330)；

其中，第二训练样本基于所述初步图像处理模型得到，具体包括：

获取包括多个面部图像的训练数据集，以及将所述面部图像输入至所述生成对抗网络中的生成网络得到第二图像(例如第二图像D)；

将所述第二图像输入所述初步图像处理模型得到与所述第二图像对应的经过初步平滑处理的第三图像(例如第三图像E)；

在一些实施例中，所述预设监督策略包括：设置所述生成对抗网络的输入图像的光照条件参数，以模拟所述输入图像的光照条件。

需要说明的是，本公开实施例的方法可以由单个设备执行，例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下，由多台设备相互配合来完成。在这种分布式场景的情况下，这多台设备中的一台设备可以只执行本公开实施例的方法中的某一个或多个步骤，这多台设备相互之间会进行交互以完成所述的方法。

需要说明的是，上述对本公开的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

基于同一技术构思，与上述任意实施例方法相对应的，本公开还提供了一种图像处理装置，参见图6，所述图像处理装置包括：

获取模块，用于获取待处理的原始面部图像；

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本公开时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

上述实施例的装置用于实现前述任一实施例中相应的图像处理方法，并且具有相应的方法实施例的有益效果，在此不再赘述。

基于同一技术构思，与上述任意实施例方法相对应的，本公开还提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使所述计算机执行如上任一实施例所述的图像处理方法。

本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的图像处理方法，并且具有相应的方法实施例的有益效果，在此不再赘述。

所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本公开的范围(包括权利要求)被限于这些例子；在本公开的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本公开实施例的不同方面的许多其它变化，为了简明它们没有在细节中提供。

另外，为简化说明和讨论，并且为了不会使本公开实施例难以理解，在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外，可以以框图的形式示出装置，以便避免使本公开实施例难以理解，并且这也考虑了以下事实，即关于这些框图装置的实施方式的细节是高度取决于将要实施本公开实施例的平台的(即，这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如，电路)以描述本公开的示例性实施例的情况下，对本领域技术人员来说显而易见的是，可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本公开实施例。因此，这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本公开的具体实施例对本公开进行了描述，但是根据前面的描述，这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如，其它存储器架构(例如，动态RAM(DRAM))可以使用所讨论的实施例。

本公开实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本公开实施例的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

一种图像处理方法，包括：

获取待处理的原始面部图像；

基于第一网络对所述原始面部图像进行处理，得到所述原始面部图像的高维特征、低维特征和目标平滑属性；

基于所述目标平滑属性，所述第一网络对所述高维特征和所述低维特征进行轮廓平滑处理得到高维矫正特征和低维矫正特征；

基于所述高维矫正特征和所述低维矫正特征生成目标面部图像。
根据权利要求1所述的方法，其中，基于第一网络对所述原始面部图像进行处理，得到所述原始面部图像的高维特征和低维特征，包括：

所述第一网络对所述原始面部图像进行特征提取，得到所述原始面部图像的所述高维特征和所述低维特征；其中，所述高维特征为语义特征，所述低维特征为纹理特征。
根据权利要求1所述的方法，其中，基于第一网络对所述原始面部图像进行处理，得到所述原始面部图像的目标平滑属性，包括：

所述第一网络对所述原始面部图像进行面部轮廓检测，得到所述原始面部图像的面部轮廓特征点，并基于所述面部轮廓特征点确定所述目标平滑属性。
根据权利要求3所述的方法，其中，基于所述面部轮廓特征点确定所述目标平滑属性，包括：

基于所述面部轮廓特征点确定目标轮廓特征点，并基于所述目标轮廓特征点确定所述目标平滑属性；或，

基于所述面部轮廓特征点确定所述原始面部图像的原始平滑属性，并基于所述原始平滑属性确定所述目标平滑属性。
根据权利要求1所述的方法，其中，基于所述目标平滑属性，对所述高维特征和所述低维特征进行轮廓平滑处理得到高维矫正特征和低维矫正特征，包括：

基于所述目标平滑属性设定所述高维特征和所述低维特征的损失函数权重，得到所述高维矫正特征和低维矫正特征。
根据权利要求1所述的方法，其中，所述第一网络包括生成网络和与所述生成网络关联的平滑属性判别器，包括：

所述生成网络基于第一训练样本中的原始训练图像生成对应的第一图像；

基于所述原始训练图像、所述原始训练图像的第一平滑属性、面部矫正图像、所述面部矫正图像的第二平滑属性和所述第一图像计算所述生成网络和所述平滑属性判别器的平滑属性损失函数；

基于所述平滑属性损失函数调整所述生成网络的第一生成网络参数和所述平滑属性判别器的第一判别网络参数，使得所述第一图像与所述第二平滑属性相匹配；

其中，所述第一训练样本包括至少一个样本对，所述样本对包括原始训练图像和对应的面部矫正图像，所述面部矫正图像基于所述原始训练图像进行面部轮廓平滑处理得到。
根据权利要求6的方法，其中，所述第一网络还包括与所述生成网络关联的判别网络包括：

所述生成网络基于所述第一训练样本中的所述原始训练图像生成对应的第一图像；

对所述第一图像进行特征提取，得到第一高维语义特征和第一低维纹理特征；以及对所述第一训练样本中的所述人脸矫正图像进行特征提取，得到第二高维语义特征和第二低维纹理特征；

基于所述第一高维语义特征和所述第二高维语义特征计算第一高维特征损失函数，以及基于所述第一低维纹理特征和所述第二低维纹理特征计算第一低维特征损失函数；

基于所述第一高维特征损失函数和所述第二低维特征损失函数之和得到所述特征矫正损失函数；

基于所述特征矫正损失函数调整所述生成网络的第二生成网络参数和所述判别网络的第二判别网络参数，以使得所述特征矫正损失函数最小化。
一种图像处理装置，包括：

获取模块，用于获取待处理的原始面部图像；

第一网络，用于对所述原始面部图像进行处理，得到所述原始面部图像的高维特征、低维特征和目标平滑属性；所述第一网络基于所述目标平滑属性，对所述高维特征和所述低维特征进行轮廓平滑处理得到高维矫正特征和低维矫正特征；以及基于所述高维矫正特征和所述低维矫正特征生成目标面部图像。
一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。
一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使计算机执行权利要求1至7任一所述方法。
一种计算机程序产品，包括计算机程序指令，当所述计算机程序指令在计算机上运行时，使得计算机执行权利要求1至7任一所述的方法。