CN113538274A

CN113538274A - 图像美颜处理方法、装置、存储介质与电子设备

Info

Publication number: CN113538274A
Application number: CN202110793989.6A
Authority: CN
Inventors: 朱家成
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2021-07-14
Filing date: 2021-07-14
Publication date: 2021-10-22
Also published as: WO2023284401A1

Abstract

本公开提供一种图像美颜处理方法、装置、存储介质与电子设备，涉及图像与视频处理技术领域。该图像美颜处理方法包括：从视频中获取待美颜原始图像；将所述待美颜原始图像中的人脸与所述待美颜原始图像的参考帧图像中的人脸进行匹配，根据匹配结果确定所述待美颜原始图像中的人脸的稳定包围盒；基于所述待美颜原始图像中的人脸的稳定包围盒，从所述待美颜原始图像中提取原始人脸子图像；利用图像美颜网络对所述原始人脸子图像进行处理，得到对应的美颜人脸子图像；根据所述美颜人脸子图像生成所述待美颜原始图像对应的目标美颜图像。本公开改善了连续多帧图像中的人脸美颜效果不一致的问题。

Description

图像美颜处理方法、装置、存储介质与电子设备

技术领域

本公开涉及图像与视频处理技术领域，尤其涉及一种图像美颜处理方法、图像美颜处理装置、计算机可读存储介质与电子设备。

背景技术

美颜是指利用图像处理技术对图像或视频中的人像进行美化处理，以更好地满足用户的审美需求。

在对连续多帧图像(例如视频)进行美颜时，对于不同帧图像中的同一张人脸，经常存在美颜效果不一致的问题，呈现出画面闪动的现象，视觉感受非常不和谐。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开提供一种图像美颜处理方法、图像美颜处理装置、计算机可读存储介质与电子设备，进而至少在一定程度上改善对连续多帧图像中人脸美颜效果不一致的问题。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开的第一方面，提供一种图像美颜处理方法，包括：从连续多帧图像中获取待美颜原始图像；将所述待美颜原始图像中的人脸与所述待美颜原始图像的参考帧图像中的人脸进行匹配，根据匹配结果确定所述待美颜原始图像中的人脸的稳定包围盒；基于所述待美颜原始图像中的人脸的稳定包围盒，从所述待美颜原始图像中提取原始人脸子图像；利用图像美颜网络对所述原始人脸子图像进行处理，得到对应的美颜人脸子图像；根据所述美颜人脸子图像生成所述待美颜原始图像对应的目标美颜图像。

根据本公开的第二方面，提供一种图像美颜处理装置，包括：图像获取模块，被配置为从视频中获取待美颜原始图像；人脸匹配模块，被配置为将所述待美颜原始图像中的人脸与所述待美颜原始图像的参考帧图像中的人脸进行匹配，根据匹配结果确定所述待美颜原始图像中的人脸的稳定包围盒；子图像提取模块，被配置为基于所述待美颜原始图像中的人脸的稳定包围盒，从所述待美颜原始图像中提取原始人脸子图像；美颜处理模块，被配置为利用图像美颜网络对所述原始人脸子图像进行处理，得到对应的美颜人脸子图像；图像生成模块，被配置为根据所述美颜人脸子图像生成所述待美颜原始图像对应的目标美颜图像。

根据本公开的第三方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面的图像美颜处理方法及其可能的实施方式。

根据本公开的第四方面，提供一种电子设备，包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行上述第一方面的图像美颜处理方法及其可能的实施方式。

本公开的技术方案具有以下有益效果：

基于本公开的图像美颜处理方法，一方面，通过匹配待美颜原始图像中的人脸与参考帧图像中的人脸，以确定人脸的稳定包围盒，进而提取原始人脸子图像以进行美颜处理，使得待美颜原始图像中人脸的稳定包围盒在一定程度上继承了参考帧图像中的相关信息，由此，在对多帧连续图像中的不同帧待美颜原始图像进行处理时，从不同帧待美颜原始图像中所提取的人脸具有一定的连续性与稳定性，不会发生剧烈的变化，进而保证了对人脸进行美颜处理的效果一致性，例如不同帧待美颜原始图像中的人脸经过美颜处理后具有瑕疵一致性，脸部形状的一致性，皮肤纹理、肤色的一致性等，有利于提升视觉感受。另一方面，通过图像美颜网络可以实现去瑕疵或其他美颜功能，以替代相关技术中固定的多个算法流程，增加了图像美颜处理的灵活性，适用于多样的光照条件或皮肤状况，改善了图像美颜效果，并且降低了耗时与内存占用。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出本示例性实施方式中一种系统架构的示意图；

图2示出本示例性实施方式中一种电子设备的结构示意图；

图3示出本示例性实施方式中一种图像美颜处理方法的流程图；

图4示出本示例性实施方式中一种确定稳定包围盒的流程图；

图5示出本示例性实施方式中一种获取美颜人脸子图像的流程图；

图6示出本示例性实施方式中一种组合原始人脸子图像的流程图；

图7示出本示例性实施方式中一种组合原始人脸子图像的示意图；

图8示出本示例性实施方式中一种图像美颜网络的结构示意图；

图9示出本示例性实施方式中另一种图像美颜网络的结构示意图；

图10示出本示例性实施方式中一种利用图像美颜网络处理待美颜人脸图像的流程图；

图11示出本示例性实施方式中一种训练图像美颜网络的流程图；

图12示出本示例性实施方式中一种训练图像美颜网络的示意图；

图13示出本示例性实施方式中一种边界区域渐变处理的示意图；

图14示出本示例性实施方式中一种图像美颜处理方法的示意性流程图；

图15示出本示例性实施方式中一种图像美颜处理装置的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

相关技术中，一方面，在对连续多帧图像(例如视频)进行美颜时，通常需要对其中每一帧图像分别进行美颜，如果在不同帧图像之间，特别是在相邻帧图像之间，人脸发生比较明显的运动，可能导致对不同帧图像的美颜效果不一致，包括但不限于眼袋、黑眼圈、斑痘、痣等瑕疵的不一致，脸部形状的不一致，皮肤纹理的不一致，噪点的不一致等，呈现出画面的闪动现象，影响美颜后的视觉感受。另一方面，图像美颜处理通常包括固定的多个算法流程，例如基于人为设计的图像特征计算、空间滤波处理、图层融合等。然而，实际拍摄场景中可能面临复杂多样的光照条件，且拍摄对象的皮肤状况多种多样，采用上述方法无法较好地应对不同的情况，导致美颜效果不理想。

鉴于上述一个或多个问题，本公开的示例性实施方式提供一种图像美颜处理方法。下面结合图1对本示例性实施方式运行环境的系统架构与应用场景进行示例性说明。

图1示出了系统架构的示意图，该系统架构100可以包括终端110与服务器120。其中，终端110可以是智能手机、平板电脑、台式电脑、笔记本电脑等终端设备，服务器120泛指提供本示例性实施方式中图像美颜相关服务的后台系统，可以是一台服务器或多台服务器形成的集群。终端110与服务器120之间可以通过有线或无线的通信链路形成连接，以进行数据交互。

在一种实施方式中，终端110可以拍摄或者通过其他方式获取待美颜的图像或视频，将其上传至服务器120。例如，用户在终端110上打开美颜App(Application，应用程序)，从相册中选取待美颜的图像或视频，将其上传至服务器120以进行美颜，或者用户在终端110上打开直播App中的美颜功能，将实时采集的视频上传至服务器120以进行美颜。服务器120执行上述图像美颜处理方法，以得到经过美颜的图像或视频，并返回终端110。

在一种实施方式中，服务器120可以执行对图像美颜网络的训练，将经过训练的图像美颜网络发送至终端110进行部署，例如将该图像美颜网络的相关数据打包在上述美颜App或直播App的更新包中，使终端110通过更新App而获得该图像美颜网络并部署在本地。进而，终端110在拍摄或者通过其他方式获取待美颜的图像或视频后，可以通过执行上述图像美颜处理方法，调用该图像美颜网络实现图像或视频的美颜处理。

在一种实施方式中，可以由终端110执行对图像美颜网络的训练，例如从服务器120处获取图像美颜网络的基本架构，通过本地的数据集进行训练，或者从服务器120处获取数据集，对本地构建的图像美颜网络进行训练，或者完全不依赖服务器120而训练得到图像美颜网络。进而，终端110可以通过执行上述图像美颜处理方法，调用该图像美颜网络实现图像或视频的美颜处理。

由上可知，本示例性实施方式中的图像美颜处理方法的执行主体可以是上述终端110或服务器120，本公开对此不做限定。

本公开的示例性实施方式还提供一种用于执行上述图像美颜网络训练方法或图像美颜处理方法的电子设备，该电子设备可以是上述终端110或服务器120。下面以图2中的移动终端200为例，对上述电子设备的构造进行示例性说明。本领域技术人员应当理解，除了特别用于移动目的的部件之外，图2中的构造也能够应用于固定类型的设备。

如图2所示，移动终端200具体可以包括：处理器210、内部存储器221、外部存储器接口222、USB(Universal Serial Bus，通用串行总线)接口230、充电管理模块240、电源管理模块241、电池242、天线1、天线2、移动通信模块250、无线通信模块260、音频模块270、扬声器271、受话器272、麦克风273、耳机接口274、传感器模块280、显示屏290、摄像模组291、指示器292、马达293、按键294以及SIM(Subscriber Identification Module，用户标识模块)卡接口295等。

处理器210可以包括一个或多个处理单元，例如：处理器210可以包括AP(Application Processor，应用处理器)、调制解调处理器、GPU(Graphics ProcessingUnit，图形处理器)、ISP(Image Signal Processor，图像信号处理器)、控制器、编码器、解码器、DSP(Digital Signal Processor，数字信号处理器)、基带处理器和/或NPU(Neural-Network Processing Unit，神经网络处理器)等。本示例性实施方式中的图像美颜网络可以运行于GPU、DSP或NPU上，DSP与NPU通常以int型数据(整数型)运行图像美颜网络，GPU通常以float型数据(浮点型)运行图像美颜网络，相较而言，DSP与NPU上运行的功耗较低，响应速度较快，精度较低，GPU上运行的功耗较高，响应速度较满，精度较高。实际应用中，可以根据设备性能与实际需求选择合适的处理单元运行图像美颜网络，例如在对视频进行实时美颜时，对速度要求较高，可以选择DSP或NPU来运行图像美颜网络。

编码器可以对图像或视频数据进行编码(即压缩)，例如对美颜处理后得到的图像或视频进行编码，形成对应的码流数据，以减少数据传输所占的带宽；解码器可以对图像或视频的码流数据进行解码(即解压缩)，以还原出图像或视频数据，例如对待美颜的视频进行解码，以得到视频中每一帧的图像数据，提取其中的待美颜原始图像进行美颜处理。移动终端200可以处理多种编码格式的图像或视频，例如：JPEG(Joint Photographic ExpertsGroup，联合图像专家组)、PNG(Portable Network Graphics，便携式网络图形)、BMP(Bitmap，位图)等图像格式，MPEG(Moving Picture Experts Group，动态图像专家组)1、MPEG2、H.263、H.264、HEVC(High Efficiency Video Coding，高效率视频编码)等视频格式。

在一种实施方式中，处理器210可以包括一个或多个接口，通过不同的接口和移动终端200的其他部件形成连接。

内部存储器221可以用于存储计算机可执行程序代码，所述可执行程序代码包括指令。内部存储器221可以包括易失性存储器与非易失性存储器。处理器210通过运行存储在内部存储器221的指令，执行移动终端200的各种功能应用以及数据处理。

外部存储器接口222可以用于连接外部存储器，例如Micro SD卡，实现扩展移动终端200的存储能力。外部存储器通过外部存储器接口222与处理器210通信，实现数据存储功能，例如存储图像，视频等文件。

USB接口230是符合USB标准规范的接口，可以用于连接充电器为移动终端200充电，也可以连接耳机或其他电子设备。

充电管理模块240用于从充电器接收充电输入。充电管理模块240为电池242充电的同时，还可以通过电源管理模块241为设备供电；电源管理模块241还可以监测电池的状态。

移动终端200的无线通信功能可以通过天线1、天线2、移动通信模块250、无线通信模块260、调制解调处理器以及基带处理器等实现。天线1和天线2用于发射和接收电磁波信号。移动通信模块250可以提供应用在移动终端200上2G、3G、4G、5G等移动通信解决方案。无线通信模块260可以提供应用在移动终端200上的WLAN(Wireless Local Area Networks，无线局域网)(如Wi-Fi(Wireless Fidelity，无线保真)网络)、BT(Bluetooth，蓝牙)、GNSS(Global Navigation Satellite System，全球导航卫星系统)、FM(FrequencyModulation，调频)、NFC(Near Field Communication，近距离无线通信技术)、IR(Infrared，红外技术)等无线通信解决方案。

移动终端200可以通过GPU、显示屏290及AP等实现显示功能，显示用户界面。例如，当用户进行摄像头检测时，移动终端200可以在显示屏290中显示摄像头检测App(Application，应用程序)的界面。

移动终端200可以通过ISP、摄像模组291、编码器、解码器、GPU、显示屏290及AP等实现拍摄功能。例如，用户可以在隐藏摄像头检测App中开启图像或视频拍摄功能，此时可以通过摄像模组291采集待检测空间的图像。

移动终端200可以通过音频模块270、扬声器271、受话器272、麦克风273、耳机接口274及AP等实现音频功能。

传感器模块280可以包括深度传感器2801、压力传感器2802、陀螺仪传感器2803、气压传感器2804等，以实现相应的感应检测功能。

指示器292可以是指示灯，可以用于指示充电状态，电量变化，也可以用于指示消息，未接来电，通知等。马达293可以产生振动提示，也可以用于触摸振动反馈等。按键294包括开机键，音量键等。

移动终端200可以支持一个或多个SIM卡接口295，用于连接SIM卡，以实现通话与移动通信等功能。

下面结合图3对本示例性实施方式中的图像美颜网络训练方法进行说明，图3示出了该图像美颜网络训练方法的示例性流程，可以包括：

步骤S310，从连续多帧图像中获取待美颜原始图像；

步骤S320，将待美颜原始图像中的人脸与待美颜原始图像的参考帧图像中的人脸进行匹配，根据匹配结果确定待美颜原始图像中的人脸的稳定包围盒；

步骤S330，基于待美颜原始图像中的人脸的稳定包围盒，从待美颜原始图像中提取原始人脸子图像；

步骤S340，利用图像美颜网络对原始人脸子图像进行处理，得到对应的美颜人脸子图像；

步骤S350，根据美颜人脸子图像生成待美颜原始图像对应的目标美颜图像。

其中，图像美颜网络可以被训练为实现任意一种或多种美颜功能组合，美颜功能包括但不限于去瑕疵、形变、肤色调整、磨皮、光影调整等。由此，可以将图3的图像美颜处理方法作为一个阶段的美颜处理，在图3的图像美颜处理方法之前或之后，增加其他阶段的美颜处理。例如，图像美颜网络用于对图像进行去瑕疵处理。在获取待美颜原始图像后，通过图3的图像美颜处理方法进行处理，得到的目标美颜图像为去瑕疵美颜图像。后续还可以对去瑕疵美颜图像进行个性化美颜处理，得到最终的美颜图像。

一般的，去瑕疵处理对于图像美颜来说是必需的，且用户对于去瑕疵处理的需求较为固定化，可以通过图3的图像美颜处理方法实现通用化的去瑕疵美颜处理流程。相比之下，磨皮、形变、立体、肤色调整、光影调整等美颜功能不是必需的，且用户对于这些美颜功能的具体需求也呈现个性化的特点，可以将这些美颜功能称为个性化美颜处理，通常需要用户进行具体的设置后进行处理，例如用户选择其中的一种或多种美颜功能，并设置磨皮度、形变度等参数，然后由终端或服务器根据用户的设置进行处理。

需要说明的是，本公开对于图3的图像美颜处理与其他美颜处理的先后顺序不做限定。例如可以先对待处理图像进行个性化美颜处理，得到中间美颜图像，再以中间美颜图像作为待美颜原始图像，执行图3的图像美颜处理，得到的目标美颜图像为最终输出的美颜图像。

基于上述图像美颜处理方法，一方面，通过匹配待美颜原始图像中的人脸与参考帧图像中的人脸，以确定人脸的稳定包围盒，进而提取原始人脸子图像以进行美颜处理，使得待美颜原始图像中人脸的稳定包围盒在一定程度上继承了参考帧图像中的相关信息，由此，在对多帧连续图像中的不同帧待美颜原始图像进行处理时，从不同帧待美颜原始图像中所提取的人脸具有一定的连续性与稳定性，不会发生剧烈的变化，进而保证了对人脸进行美颜处理的效果一致性，例如不同帧待美颜原始图像中的人脸经过美颜处理后具有瑕疵一致性，脸部形状的一致性，皮肤纹理、肤色的一致性等，有利于提升视觉感受。另一方面，通过图像美颜网络可以实现去瑕疵或其他美颜功能，以替代相关技术中固定的多个算法流程，增加了图像美颜处理的灵活性，适用于多样的光照条件或皮肤状况，改善了图像美颜效果，并且降低了耗时与内存占用。

下面对图3中的每个步骤做具体说明。

参考图3，在步骤S310中，从连续多帧图像中获取待美颜原始图像。

其中，连续多帧图像可以是视频，也可以是连拍的图像等。该连续多帧图像为需要进行美颜处理的对象。以视频为例，其可以是当前实时拍摄或实时接收的视频流，也可以是已完成拍摄或接收的完整视频，如本地存储的一段视频。本公开对于视频的帧率、图像分辨率等参数不做限定，例如视频帧率可以采用30fps(帧每秒)、60fps、120fps等，图像分辨率可以采用720P、1080P、4K等以及对应的不同宽高比。

本示例性实施方式中，可以对视频中的每一帧原始图像均进行美颜处理，也可以从视频中筛选出一部分原始图像进行美颜处理，将需要进行美颜处理的原始图像称为待美颜原始图像。

在一种实施方式中，可以从视频中获取至少两帧待美颜原始图像。例如，可以将包含目标人脸的原始图像作为待美颜原始图像，也可以采取隔帧策略，间隔一定的帧数获取一帧待美颜原始图像。

在一种实施方式中，实时接收视频流时，可以将所接收的每一帧原始图像均作为待美颜原始图像。

继续参考图3，在步骤S320，将待美颜原始图像中的人脸与待美颜原始图像的参考帧图像中的人脸进行匹配，根据匹配结果确定待美颜原始图像中的人脸的稳定包围盒。

包围盒(Bounding Box)是指图像中包围人脸、且具有一定几何形状的区域，本公开对于包围盒的形状不做限定，如可以是矩形、梯形等任意形状。将初始检测出的人脸区域包围盒称为基础包围盒，例如可以是包含人脸的最小包围盒、或者通过相关算法得到的人脸框。对基础包围盒进行优化，例如扩展、位置修正等，将优化后的包围盒称为稳定包围盒。

本示例性实施方式中，可以对待美颜原始图像进行人脸检测，以得到人脸的相关信息，本公开对于人脸检测算法不做限定，例如可以通过特定的神经网络检测人脸关键点，包括脸部边界的关键点，根据脸部边界的关键点生成人脸的基础包围盒，通过优化得到稳定包围盒。

参考帧图像可以是上述连续多帧图像中已确定人脸稳定包围盒或者已完成美颜处理的任一帧图像，例如在对视频进行逐帧美颜处理时，可以将待美颜原始图像的上一帧图像作为参考帧图像。通过匹配待美颜原始图像与参考帧图像中的人脸，可以基于参考帧图像中的人脸的稳定包围盒，确定待美颜原始图像中的人脸的稳定包围盒。

在一种实施方式中，参考图4所示，上述将待美颜原始图像中的人脸与待美颜原始图像的参考帧图像中的人脸进行匹配，根据匹配结果确定待美颜原始图像中的人脸的稳定包围盒，可以包括以下步骤S410至S430：

步骤S410，检测待美颜原始图像中的人脸，记为待确定人脸，将待确定人脸与待美颜原始图像的参考帧图像中的已确定人脸进行匹配。

其中，待确定人脸是指需要进行美颜、但未被确定稳定包围盒的人脸，可视为身份未知的人脸，已确定人脸是指已被确定稳定包围盒的人脸，可视为身份已知的人脸。参考帧图像中已被确定稳定包围盒的人脸均为已确定人脸。相对应的，待美颜原始图像中所检测出的人脸为未被确定稳定包围盒的人脸，即待确定人脸。将待美颜原始图像中的待确定人脸与参考帧图像中的已确定人脸进行匹配，可以推断待确定人脸的稳定包围盒与该待确定人脸匹配的已确定人脸的稳定包围盒之间具有相关性，可以由此确定待确定人脸的稳定包围盒。

一般的，通过人脸检测算法可以在待美颜原始图像中检测出所有的人脸，其中可能包括不需要美颜的人脸(例如远处路人的人脸)，考虑到在图像美颜的场景中，通常需要对较大的人脸进行美颜(较小的人脸美颜后效果不明显)，因此可以通过人脸面积阈值对所检测出的人脸进行过滤。在一种实施方式中，可以根据经验或者待美颜原始图像的大小，设置人脸面积阈值，示例性的，人脸面积阈值可以是待美颜原始图像的尺寸*0.05；如果人脸的基础包围盒的面积大于或等于人脸面积阈值，则为需要美颜的人脸，可以将该人脸的基础包围盒等信息予以保留，也可以将该人脸记为待确定人脸；如果人脸的基础包围盒的面积小于人脸面积阈值，则为不需要美颜的人脸，可以删除该人脸的基础包围盒等相关信息，不对其进行后续处理。

在一种实施方式中，为便于后续对原始人脸子图像进行处理，例如对原始人脸子图像进行组合处理，或者考虑到设备性能的限制，可以设置原始人脸子图像的数量上限，即设置待确定人脸的数量上限。如可以设置为4，如果经过上述人脸面积阈值的过滤后，所保留的人脸的数量大于4，则可以从中进一步筛选出4张待确定人脸，如可以是面积最大的4张人脸，也可以是距离待美颜原始图像的中心最近的4张人脸，这样在后续对应截取4张原始人脸子图像，对于其他人脸则不进行后续处理。或者，可以进行多次美颜处理，本次处理中选取4张人脸作为待确定人脸，截取其对应的原始人脸子图像并进行美颜处理，下次处理中选取其他人脸作为待确定人脸，并截取其对应的原始人脸子图像进行美颜处理，从而完成对待处理图像中所有面积大于人脸面积阈值的基础包围盒内的人脸进行美颜处理。

在一种实施方式中，为便于跟踪与识别连续多帧图像中的人脸，可以对每一张人脸分配ID(Identity Document，标识)。例如，从第一帧开始，为每一张人脸分配ID；后续在每一帧中检测出人脸后，将每一张人脸与上一帧中的人脸进行匹配；如果匹配成功，则继承上一帧中的人脸ID与其他相关信息；如果匹配不成功，则作为新的人脸，分配新的ID。

本公开对于匹配待确定人脸与已确定人脸的方式不做限定，例如可以采用人脸识别算法，将每一张待确定人脸与每一张已确定人脸进行识别比对，如果相似度高于预设的相似度阈值，则确定待确定人脸与已确定人脸匹配成功。

在一种实施方式中，可以根据待确定人脸的基础包围盒与已确定人脸的基础包围盒的重叠度(Intersection Over Union，IOU，也称为交并比)，确定待确定人脸与已确定人脸是否匹配成功。下面提供计算重叠度的示例性方式：

获取待确定人脸的基础包围盒在待美颜原始图像中的位置，以及已确定人脸的基础包围盒在参考帧图像中的位置，统计两个基础包围盒中位置重合的像素点数量，记为k1，以及位置不重合的像素点数量，记为k2(表示待确定人脸的基础包围盒中与已确定人脸的基础包围盒不重合的像素点数量)与k3(表示已确定人脸的基础包围盒中与未确定人脸的基础包围盒不重合的像素点数量)，则两个基础包围盒的重叠度为：

在确定重叠度后，如果该重叠度达到预设的重叠度阈值，则确定该待确定人脸与该已确定人脸匹配成功。重叠度阈值可以根据经验与实际需求设定，例如可以设为0.75。

此外，还可以通过ICP(Iterative Closest Point，迭代最近邻点)算法等对待确定人脸的基础包围盒与已确定人脸的基础包围盒中的任一个进行迭代变换，并根据最终变换后的待确定人脸的基础包围盒与已确定人脸的基础包围盒中像素值相同的像素点数量与像素值不同的像素点数量计算两个基础包围盒的重叠度，由此判断是否匹配成功。

需要说明的是，由于待美颜原始图像中可能存在多个待确定人脸，参考帧图像中存在多个已确定人脸，可以分别对每一张待确定人脸与每一张已确定人脸进行匹配计算，得到相似度矩阵或重叠度矩阵，进而可以采用匈牙利算法等实现全局的最大匹配，再根据每一对待确定人脸与已确定人脸的相似度或重叠度确定其是否匹配成功。

步骤S420，如果待确定人脸与已确定人脸匹配不成功，则根据第一预设参数对待确定人脸的基础包围盒进行扩展，得到待确定人脸的稳定包围盒；

待确定人脸与已确定人脸匹配不成功，说明该待确定人脸为连续多帧图像中新出现的人脸，无法从参考帧图像中获得参考信息。因此可以在该待确定人脸的基础包围盒基础上，进行适当的扩展，得到稳定包围盒。第一预设参数为针对新出现人脸的基础包围盒的扩展参数，可以根据经验或实际需求确定，例如可以是对基础包围盒的宽度与高度均扩展1/4。

假设待确定人脸的基础包围盒表示为[bb0，bb1，bb2，bb3]，bb0为基础包围盒左上点的横坐标，bb1为基础包围盒左上点的纵坐标，bb2为基础包围盒右下点的横坐标，bb3为基础包围盒右下点的纵坐标，该基础包围盒的宽度为w，高度为h。请注意，图像中的像素坐标通常是以图像左上点为(0，0)，右下点为(W，H)，W与H表示图像的宽度与高度。因此有bb0<bb2，bb1<bb3。以E1表示第一预设参数，当根据第一预设参数对该基础包围盒进行中心扩展(即上下左右均匀扩展)时，可以得到稳定包围盒的尺寸为：

其中，expand_w与expand_h分别为待确定人脸的稳定包围盒的宽度与高度。需要说明的是，如果扩展后的宽度expand_w超出待美颜原始图像的宽度W，则expand_w＝W；如果扩展后的高度expand_h超出待美颜原始图像的高度H，则expand_h＝H。

稳定包围盒的中心点坐标等于基础包围盒的中心点坐标，即：

其中，center_x表示待确定人脸的稳定包围盒的中心点x坐标，center_y表示待确定人脸的稳定包围盒的中心点y坐标。

则可以计算稳定包围盒的左上点与右下点的坐标如下：

其中，expand_bb0为稳定包围盒左上点的横坐标，expand_bb1为稳定包围盒左上点的纵坐标，expand_bb2为稳定包围盒右下点的横坐标，expand_bb3为稳定包围盒右下点的纵坐标。由此得到待确定人脸的稳定包围盒。如果计算出的坐标超出了待美颜原始图像的边界，则以待美颜原始图像的边界坐标替代该超出边界的坐标。最终可以将该扩展包围表示为[expand_bb0，expand_bb1，expand_bb2，expand_bb3]的形式。

需要补充的是，上述各坐标通常采用图像中的像素坐标，为整数，因此在计算时，可以采用float型数据进行计算，然后进行取整，并将结果保存为int型数据。示例性的，在涉及到除法运算时，采用float型数据进行计算并缓存中间结果，在计算最终的结果(包括上述expand_w、expand_h、center_x、center_y、expand_bb0、expand_bb1、expand_bb2、expand_bb3)时进行取整，并以int型数据进行保存。

对于中心点坐标，由于保存int型数据会影响后续处理其他帧的精确性，可以保存int型与float型数据，例如将公式(3)中计算的结果保存为float型数据，如下所示：

其中，center_x_float、center_y_float表示以float型数据所保存的中心点坐标，center_x、center_y表示以int型数据所保存的中心点坐标，int()表示取整运算。

进一步的，为保证结果的准确性，可以将公式(4)更改为如下计算方法：

步骤S430，如果待确定人脸与已确定人脸匹配成功，则根据已确定人脸的稳定包围盒确定待确定人脸的稳定包围盒。

一般的，待美颜原始图像中的待确定人脸相对于与之匹配的参考帧图像中的已确定人脸来说，变化不会太大，体现为位置变化与尺寸变化均不会太大，因此可以在已确定人脸的稳定包围盒的基础上，进行适当的位置变化与尺寸变化，得到待确定人脸的稳定包围盒。

在一种实施方式中，可以根据待确定人脸的基础包围盒相对于已确定人脸的基础包围盒的位置变化参数与尺寸变化参数，对该已确定人脸的稳定包围盒进行位置变化与尺寸变化，得到该待确定人脸的稳定包围盒。

在一种实施方式中，上述根据已确定人脸的稳定包围盒确定待确定人脸的稳定包围盒，可以包括以下步骤：

基于预设稳定系数，对已确定人脸的稳定包围盒的中心点坐标与待确定人脸的基础包围盒的中心点坐标进行加权，得到待确定人脸的稳定包围盒的中心点坐标。

上述步骤表示将已确定人脸的稳定包围盒的位置与待确定人脸的基础包围盒的位置进行融合，以作为待确定人脸的稳定包围盒的位置。在融合时，采用预设稳定系数对两者的中心点坐标进行加权，预设稳定系数可以是已确定人脸的稳定包围盒的权重，可以根据经验或实际场景确定。一般的，人脸移动越快的场景，预设稳定系数越小。示例性的，在直播场景中，人脸通常在一定的范围内移动幅度很小，预设稳定系数可以设为0.9，则计算待确定人脸的稳定包围盒的中心点坐标如下：

其中，pre_center_x表示已确定人脸的稳定包围盒的中心点x坐标，pre_center_y表示已确定人脸的稳定包围盒的中心点y坐标。可见，公式(7)表示以已确定人脸的稳定包围盒的中心点坐标权重为0.9，待确定人脸的基础包围盒的中心点坐标权重为0.1，对两个中心点坐标进行加权，得到待确定人脸的稳定包围盒的中心点坐标。

与上述公式(5)类似的，可以保存int型与float型数据中心点坐标，则有：

其中，pre_center_x_float是已保存的pre_center_x的float型数据，pre_center_y_float是已保存的pre_center_y的float型数据。

通过上述加权以计算中心点坐标的方式，实质上采用了对中心点坐标进行动量更新的机制，能够避免同一张人脸的稳定包围盒的中心点坐标从参考帧图像到待美颜原始图像出现过度移动，以导致后续截取的原始人脸子图像发生抖动，影响美颜效果。

如果待确定人脸的基础包围盒的尺寸大于已确定人脸的稳定包围盒的尺寸与第一倍率之积，则根据第二预设参数对已确定人脸的稳定包围盒的尺寸进行扩展，得到待确定人脸的稳定包围盒的尺寸；

如果待确定人脸的基础包围盒的尺寸小于已确定人脸的稳定包围盒的尺寸与第二倍率之积，则根据第三预设参数对已确定人脸的稳定包围盒的尺寸进行缩小，得到待确定人脸的稳定包围盒的尺寸；第一倍率大于第二倍率；

如果待确定人脸的基础包围盒的尺寸小于已确定人脸的稳定包围盒的尺寸与第一倍率之积、且大于已确定人脸的稳定包围盒的尺寸与第二倍率之积，则将已确定人脸的稳定包围盒的尺寸作为待确定人脸的稳定包围盒的尺寸。

上述步骤表示根据待确定人脸的基础包围盒的尺寸与已确定人脸的稳定包围盒的尺寸的比较结果，分为三种情况分别进行计算。第一倍率与第二倍率可以是整数倍率，也可以是非整数倍率。在一种实施方式中，第一倍率大于或等于1，第二倍率小于1。示例性的，第一倍率可以是1，第二倍率可以是0.64。

在进行计算时，可以对宽度与高度分别进行比较与计算，例如宽度的比较结果属于上述第一种情况，高度的比较结果属于第二种情况，则分别在两种情况下计算待确定人脸的稳定包围盒的宽度与高度。

假设第一倍率为t1，第二倍率为t2，对宽度的计算进行说明：

第一种情况、如果w>pre_expand_w·t1，以E2表示第二预设参数，则有：

expand_w＝pre_expand_w+pre_expand_w·E2 (9)

第二种情况、如果w<pre_expand_w·t2，以E3表示第三预设参数，则有：

expand_w＝pre_expand_w-pre_expand_w·E3 (10)

第三种情况、如果pre_expand_w·t2<w<pre_expand_w·t1，则有：

expand_w＝pre_expand_w (11)

对于高度，同样可以按照上述三种情况分别进行计算，得到expand_h。

一般的，在视频连续多帧图像中，只要人脸不快速靠近镜头、不快速远离镜头或者不移出画面，人脸的尺寸不会发生剧烈变化，则满足上述第三种情况，此时使待确定人脸的稳定包围盒的尺寸等于已确定人脸的稳定包围盒的尺寸，即保持稳定包围盒的尺寸不变。而上述第一种情况与第二种情况均是人脸的尺寸发生剧烈变化的情况，第一种情况是人脸剧烈变大，此时根据第二预设参数适当扩大已确定人脸的稳定包围盒的尺寸，得到待确定人脸的稳定包围盒的尺寸，第二预设参数可以根据经验与实际场景确定；第二种情况是人脸剧烈变小，此时根据第三预设参数适当缩小已确定人脸的稳定包围盒的尺寸，得到待确定人脸的稳定包围盒的尺寸，第三预设参数可以根据经验与实际场景确定。

如果扩展后的宽度expand_w超出待美颜原始图像的宽度W，则expand_w＝W；如果扩展后的高度expand_h超出待美颜原始图像的高度H，则expand_h＝H。

通过上述三种情况的计算，能够避免同一张人脸的稳定包围盒的尺寸从参考帧图像到待美颜原始图像出现过度变化，以导致后续截取的原始人脸子图像发生抖动，影响美颜效果

分别得到待确定人脸的稳定包围盒的中心点坐标与尺寸后，可以计算出该稳定包围盒的左上点与右下点的坐标。如果计算出的坐标超出了待美颜原始图像的边界，则以待美颜原始图像的边界坐标替代该超出边界的坐标。最终可以将该稳定包围盒表示为[expand_bb0，expand_bb1，expand_bb2，expand_bb3]的形式。

由上可知，在待确定人脸与已确定人脸匹配成功的情况下，根据已确定人脸的稳定包围盒确定待确定人脸的稳定包围盒，使得待确定人脸在一定程度上继承了已确定人脸的稳定包围盒的信息，从而保证了不同帧图像之间人脸的稳定包围盒具有一定的连续性与稳定性，不会发生剧烈的位置或尺寸变化，进而保证了后续进行美颜处理时人脸美颜效果的一致性，防止由于人脸的剧烈变化导致美颜后的人脸发生闪动现象。

在一种实施方式中，得到待确定人脸的稳定包围盒后，可以保存其稳定包围盒的相关参数，并将该待确定人脸标记为已确定人脸，以用于后续帧中待确定人脸的匹配与稳定包围盒的确定。

继续参考图3，在步骤S330中，基于待美颜原始图像中的人脸的稳定包围盒，从待美颜原始图像中提取原始人脸子图像。

从待美颜原始图像中截取稳定包围盒部分的图像，得到原始人脸子图像。当待美颜原始图像中包括多张人脸的稳定包围盒时，可以截取每一张人脸对应的原始人脸子图像。

继续参考图3，在步骤S340中，利用图像美颜网络对原始人脸子图像进行处理，得到对应的美颜人脸子图像。

当从待美颜原始图像中提取多张原始人脸子图像时，可以分别将每一张原始人脸子图像输入图像美颜网络，得到每一张原始人脸子图像对应的美颜人脸子图像，也可以将多张原始人脸子图像进行组合后输入图像美颜网络以进行处理。在一种实施方式中，参考图5所示，上述利用图像美颜网络对原始人脸子图像进行处理，得到对应的美颜人脸子图像，可以包括以下步骤S510至S530：

步骤S510，基于图像美颜网络的输入图像尺寸将从待美颜原始图像中提取的原始人脸子图像进行组合，生成待美颜人脸图像。

输入图像尺寸是与图像美颜网络的输入层匹配的图像尺寸。本公开对于输入图像尺寸的大小以及宽高比不做限定，示例性的，可以设置输入图像尺寸的长边与短边的比例接近

在一种实施方式中，图像美颜网络可以是全卷积网络，全卷积网络可以处理不同尺寸的图像。在这种情况下，图像美颜网络对于输入的图像尺寸没有要求，尺寸的大小对于计算量、内存占用、美颜精细度有影响。可以根据用户设置的美颜精细度或者设备的性能，确定输入图像尺寸。由此，该图像美颜网络可以部署在高、中、低等不同性能的设备上，适用范围很广，无需针对不同的设备部署不同的图像美颜网络，降低了网络的训练成本。示例性的，考虑在移动终端上适合进行轻量化计算，可以将输入图像尺寸确定为较小的数值，例如为宽640*高448。

图像美颜网络的输入图像尺寸决定了待美颜人脸图像的清晰度，在清晰度较低时，不适合进行某些美颜功能，例如对于极小黑痣、干燥唇纹等微小瑕疵，其在待美颜人脸图像中占据的像素数较少，如果进行去除，则可能去除不准确，影响周围的皮肤纹理，或者产生闪动的现象。因此，根据图像美颜网络的实际部署环境，确定图像美颜网络的输入图像尺寸，进而确定图像美颜网络的美颜功能，并以此构建美颜图像数据集并进行训练。示例性的，当图像美颜网络的输入图像尺寸小于宽448*高320时，可以设置图像美颜网络不包括去除微小瑕疵的功能。

本示例性实施方式中，当获取多帧待美颜原始图像时，可以分别对每一帧待美颜原始图像中所截取的原始人脸子图像进行组合，使得一帧待美颜原始图像对应一帧待美颜人脸图像。例如，可以对视频进行逐帧美颜处理，依次对每一帧图像中所截取的原始人脸子图像进行组合，得到每一帧图像对应的每一帧待美颜人脸图像。也可以将多帧待美颜原始图像中所截取的原始人脸子图像进行组合，生成该多帧待美颜原始图像对应的一帧或多帧待美颜人脸图像。例如，可以对视频中的多帧进行合并美颜处理，将从连续多帧图像中所截取的原始人脸子图像进行任意组合，以匹配上述输入图像尺寸，如从连续两帧图像中均分别截取两张原始人脸子图像，将这四张原始人脸子图像组合为一帧待美颜人脸图像。

在获取输入图像尺寸后，需要将原始人脸子图像组合为该尺寸大小的待美颜人脸图像。具体组合的方式与原始人脸子图像的数量相关。在一种实施方式中，参考图6所示，上述基于图像美颜网络的输入图像尺寸将上述一张或多张原始人脸子图像进行组合，生成待美颜人脸图像，可以包括以下步骤S610至S630：

步骤S610，根据原始人脸子图像的数量，将输入图像尺寸分割为原始人脸子图像对应的一一对应的子图像尺寸；

步骤S620，分别基于每个子图像尺寸将对应的原始人脸子图像进行变换；

步骤S630，将变换后的原始人脸子图像进行组合，生成待美颜人脸图像。

下面结合图7举例说明。图7中Q表示原始人脸子图像的数量，图7分别示出了Q为1～4时的输入图像尺寸分割与图像组合的示例性方式。假设输入图像尺寸为宽640*高448，Q为1时，子图像尺寸也为宽640*高448；Q为2时，子图像尺寸为输入图像尺寸的一半，即宽320*高448；Q为3时，子图像尺寸分别为输入图像尺寸的0.5、0.25、0.25，即宽320*高448、宽320*高224、宽320*高224；Q为4时，子图像尺寸分别均为输入图像尺寸的0.25，即宽320*高224。将各个原始人脸子图像分别变换为与子图像尺寸一致，需要特别说明的是，当各个子图像尺寸不一致时，如Q为3的情况，可以按照原始人脸子图像的大小顺序与子图像尺寸的大小顺序，将原始人脸子图像与子图像尺寸进行一一对应，即最大的原始人脸子图像对应到最大的子图像尺寸，最小的原始人脸子图像对应到最小的子图像尺寸。在将原始人脸子图像进行变换后，再将变换后的原始人脸子图像按照图10所示的方式进行组合，生成一张待美颜人脸图像。

在一种实施方式中，当Q为偶数时，可以将输入图像尺寸进行Q等分，得到Q个相同的子图像尺寸。具体地，可以将Q分解为两个因数的乘积，即Q＝q₁*q₂，使q₁/q₂的比例与输入图像尺寸的宽高比(如

)尽可能接近，将输入图像尺寸的宽度进行q₁等分，高度进行q₂等分。当Q为奇数时，将输入图像尺寸进行Q+1等分，得到Q+1个相同的子图像尺寸，将其中的两个子图像尺寸合并为一个子图像尺寸，其余Q-1个子图像不变，由此得到Q个子图像尺寸。

在另一种实施方式中，可以先计算原始人脸子图像的尺寸比例(或面积比例)，如可以是S₁：S₂：S₃：…：S_Q，再按照该比例将输入图像尺寸分割为Q个子图像尺寸。

确定每个原始人脸子图像对应的子图像尺寸后，可以基于子图像尺寸对原始人脸子图像进行变换。在一种实施方式中，对原始人脸子图像进行变换，可以包括以下任意一条或多条：

①当原始人脸子图像的宽度与高度的大小关系与子图像尺寸的宽度与高度的大小关系不同时，将原始人脸子图像旋转90度。具体来说，在原始人脸子图像与子图像尺寸中，均为宽度大于高度或者均为宽度小于高度，则原始人脸子图像与子图像尺寸的宽度与高度的大小关系相同，无需旋转原始人脸子图像；否则，原始人脸子图像与子图像尺寸的宽度与高度的大小关系不同，需要将原始人脸子图像旋转90度(顺时针或逆时针旋转皆可)。例如，子图像尺寸为宽320*高448时，即宽度小于高度，如果原始人脸子图像为宽度大于高度的情况，则将原始人脸子图像旋转90度。

在一种实施方式中，为了保持原始人脸子图像中人脸的角度，可以不对原始人脸子图像进行旋转。

②当原始人脸子图像的尺寸大于子图像尺寸时，根据子图像尺寸将原始人脸子图像进行下采样。其中，原始人脸子图像的尺寸大于子图像尺寸，是指原始人脸子图像的宽度大于子图像尺寸的宽度，或者原始人脸子图像的高度大于子图像尺寸的高度。在图像美颜场景中，待处理图像一般是终端设备拍摄的清晰图像，其尺寸较大，因此原始人脸子图像的尺寸大于子图像尺寸是比较常见的情况，即通常情况下需要对原始人脸子图像进行下采样。

下采样可以采用双线性插值、最近邻插值等方法实现，本公开对此不做限定。

在进行下采样后，原始人脸子图像的宽度与高度中的至少一个与子图像尺寸对齐，具体包括以下几种情况：

原始人脸子图像的宽度、高度均与子图像尺寸相同；

原始人脸子图像的宽度与子图像尺寸的宽度相同，高度小于子图像尺寸的高度；

原始人脸子图像的高度与子图像尺寸的高度相同，宽度小于子图像尺寸的宽度。

需要说明的是，如果已经对原始人脸子图像进行了上述旋转，得到经过旋转的原始人脸子图像，则当该原始人脸子图像的尺寸大于子图像尺寸时，根据子图像尺寸对其进行下采样，具体的实现方式与上述原始人脸子图像的下采样方式相同，因而不再赘述。

反之，当原始人脸子图像(或经过旋转的原始人脸子图像)的尺寸小于或等于子图像尺寸时，可以不进行下采样的处理步骤。

③当原始人脸子图像的尺寸小于子图像尺寸时，根据原始人脸子图像与子图像尺寸的差值将原始人脸子图像进行填充，使填充后的原始人脸子图像的尺寸等于子图像尺寸。其中，原始人脸子图像的尺寸小于子图像尺寸，是指原始人脸子图像的宽度与高度中的至少一个小于子图像尺寸，另一个不大于子图像尺寸，具体包括以下几种情况：

原始人脸子图像的宽度小于子图像尺寸的宽度，高度也小于子图像尺寸的高度；

原始人脸子图像的宽度小于子图像尺寸的宽度，高度等于子图像尺寸的高度；

原始人脸子图像的高度小于子图像尺寸的高度，宽度等于子图像尺寸的高度。

填充时可以采用预设像素值，通常是与人脸颜色差别较大的像素值，如(R0，G0，B0)、(R255，G255，B255)等。

一般可以填充在原始人脸子图像的四周，例如将原始人脸子图像的中心与子图像尺寸的中心重合，对原始人脸子图像四周的差值部分进行填充，使填充后原始人脸子图像的尺寸与子图像尺寸一致。当然也可以将原始人脸子图像与子图像尺寸的一侧边缘对齐，对另一侧进行填充。本公开对此不做限定。

需要说明的是，如果已经对原始人脸子图像进行了上述旋转与下采样中至少一种处理，得到经过旋转与下采样中至少一种处理的原始人脸子图像，则当该原始人脸子图像的尺寸小于子图像尺寸时，根据其与子图像尺寸的差值进行填充，具体的实现方式与上述原始人脸子图像的填充方式相同，因而不再赘述。

上述①～③为常用的三种变换方式，可以根据实际需求使用其中的任意一种或多种。例如，依次采用①、②、③对每一张原始人脸子图像进行处理，将处理后的原始人脸子图像组合为待美颜人脸图像。

在上述变换中，改变了原始人脸子图像的方向、尺寸等，这是为了便于图像美颜网络的统一处理。后续还需要对美颜后的图像进行逆变换，使其恢复为与原始人脸子图像的方向、尺寸等一致，以适应待美颜原始图像的尺寸。因此，可以保存相应的变换信息，包括但不限于：对每一张原始人脸子图像旋转的方向与角度，下采样的比例，填充的像素的坐标。这样便于后续根据该变换信息进行逆变换。

在将变换后的原始人脸子图像进行组合后，可以保存组合信息，包括但不限于每一张原始人脸子图像的尺寸(即对应的子图像尺寸)以及在待美颜人脸图像中的位置，各原始人脸子图像的排列方式与顺序。后续可以根据该组合信息对美颜人脸组合图像进行拆分，以得到每个单独的美颜人脸子图像。

步骤S520，利用图像美颜网络对待美颜人脸图像进行处理，得到对应的美颜人脸图像。

本示例性实施方式中，可以根据实际需求设置任意结构的图像美颜网络。一般的，图像美颜网络的输入与输出均为图像，因此可以采用端到端(end-to-end)结构，例如可以是全卷积网络。考虑到图像美颜处理需要对图像进行较为深入的特征挖掘与学习，因此图像美颜网络可以采用深度神经网络(Deep Neural Network，DNN)，通过增加网络层数(即网络深度)以减少参数量，同时能够学习到图像的深层特征，实现像素级处理。

图8示出了图像美颜网络的示意性结构图，可以采用U-Net结构。示例性的，将待美颜人脸图像输入图像美颜网络后，由卷积层1进行一次或多次卷积操作(图4中示出卷积层1进行两次卷积操作，本公开对于每个卷积层中具体的卷积操作次数不做限定)，然后经过池化操作，得到尺寸减小的特征图像；由卷积层2再进行一轮卷积与池化操作，得到尺寸进一步减小的特征图像；由卷积层3再进行一轮卷积与池化操作，得到尺寸更小的特征图像；在卷积层4中进行卷积操作，但不进行池化操作；之后进入转置卷积层1，先进行转置卷积操作，再与卷积层3中的特征图像进行拼接，然后进行一次或多次卷积操作，得到尺寸增大的特征图像；由转置卷积层2再进行一轮转置卷积操作、与卷积层2中的特征图像的拼接、以及卷积操作，得到尺寸进一步增大的特征图像；最后由转置卷积层3再进行一轮上述操作，输出美颜人脸图像。需要说明的是，本公开对于图像美颜网络中卷积层、转置卷积层的数量不做限定，根据实际场景需求，还可以在图像美颜网络中增加其他类型的中间层，如像素重排层、Dropout层(丢弃层)、全连接层等。

在一种实施方式中，图像美颜网络可以是全卷积网络，包括：第一像素重排层、至少一个卷积层、至少一个转置卷积层、第二像素重排层，其结构可以参考图9所示。与图8的网络结构相比，主要增加了两个像素重排层。基于图9所示的图像美颜网络，上述利用图像美颜网络对待美颜人脸图像进行处理，得到对应的美颜人脸图像，可以包括图10中的步骤S1010至S1040：

步骤S1010，利用第一像素重排层对待美颜人脸图像进行由单通道到多通道的像素重排处理，得到第一特征图像。

需要说明的是，待美颜人脸图像原本可以是单通道图像(如灰度图像)，也可以是多通道图像(如RGB图像)。第一像素重排层可以将待美颜人脸图像的每个通道重排为多个通道。

在一种可选的实施方式中，步骤S1010包括：

将通道数为a的待美颜人脸图像输入第一像素重排层；

将待美颜人脸图像的每个通道中每n*n邻域的像素点分别重排至n*n个通道中的相同位置，输出通道数为a*n*n的第一特征图像。

其中，a表示待美颜人脸图像的通道数，为正整数，n表示像素重排的参数，为不小于2的正整数。以n＝2为例，遍历待美颜人脸图像的第一通道，通常从左上角开始，将每2*2格子的像素点提取出来，分别重排到4个通道中的相同位置，由此将一个通道变为四个通道，同时图像的宽和高降低到一半，将重排后的图像记为第一特征图像；采用同样的方式处理其他通道。如果待美颜人脸图像为单通道图像，则像素重排后得到四通道的第一特征图像；如果待美颜人脸图像为三通道图像，则像素重排后得到十二通道的第一特征图像。

第一像素重排层可以采用TensorFlow(一种机器学习的实现框架)中的space_to_depth函数实现，将待美颜人脸图像中的空间特征转换为深度特征，也可用采用步长为n的卷积操作实现，此时第一像素重排层可视为特殊的卷积层。

步骤S1020，利用卷积层对第一特征图像进行卷积处理，得到第二特征图像。

本公开对于卷积层的数量、卷积核尺寸、卷积层的具体结构等不做限定。卷积层用于从不同尺度上提取图像特征并学习深度信息。卷积层可以包括配套的池化层，用于对卷积后的图像进行下采样，以实现信息抽象，增大感受野，同时降低参数复杂度。

当设置多个卷积层时，可以采用逐步卷积与下采样的方式，例如可以使图像按照2倍率下降，直到最后一个卷积层输出第二特征图像，第二特征图像可以是图像美颜网络处理过程中尺寸最小的特征图像。

步骤S1030，利用转置卷积层对第二特征图像进行转置卷积处理，得到第三特征图像。

本公开对于转置卷积层的数量、转置卷积核尺寸、转置卷积层的具体结构等不做限定。转置卷积层用于对第二特征图像进行上采样，可视为卷积的相反过程，由此恢复图像的尺寸。

当设置多个转置卷积层时，可以采用逐步上采样的方式，例如可以使图像按照2倍率上升，直到最后一个转置卷积层输出第三特征图像。

在一种可选的实施方式中，卷积层与转置卷积层为完全对称的结构，则第三特征图像与第一特征图像的尺寸、通道数相同。

在一种可选的实施方式中，可以在卷积层与转置卷积层之间建立直连，如图11所示，在对应于相同尺寸的特征图像的卷积层与转置卷积层之间建立直连，由此实现卷积环节的特征图像信息直接连接到转置卷积环节中的特征图像，有利于得到信息更为全面的第三特征图像。

步骤S1040，利用第二像素重排层对第三特征图像进行由多通道到单通道的像素重排处理，得到美颜人脸组合图像。

第二像素重排层可以将第三特征图像的多个通道重排为单个通道。在一种可选的实施方式中，步骤S1240包括：

将通道数为b*n*n的第三特征图像输入第二像素重排层；

将第三特征图像的每n*n个通道中相同位置的像素点重排至单通道中的n*n邻域内，输出通道数为b的美颜人脸组合图像；

其中，b为正整数。

第二像素重排层可以采用TensorFlow中的depth_to_space函数实现，将第三特征图像中的深度特征转换为空间特征，也可用采用步长为n的转置卷积操作实现，此时第二像素重排层可视为特殊的转置卷积层。

如果卷积层与转置卷积层为完全对称的结构，即第三特征图像与第一特征图像的尺寸、通道数相同，则有a＝b，步骤S1240可以是步骤S1210的逆操作。进而，美颜人脸图像与待美颜人脸图像的通道数也相同，即图像美颜网络的处理过程不改变图像尺寸与通道数。

需要说明的是，图像美颜网络的处理过程同样不改变人脸的数量。例如待美颜人脸图像是由4张原始人脸子图像组合而成，在经过图像美颜网络的处理后，输出的美颜人脸图像中也包括4张人脸，是对4张原始人脸子图像中的人脸进行美颜后的人脸。

如果将图像美颜网络用于进行去瑕疵处理，其去瑕疵效果依赖于美颜图像数据集的质量与训练效果，而不依赖于人为设计的图像特征计算。当采用较为全面的美颜图像数据集进行充分训练后，图像美颜网络可以应对实际应用中的几乎所有情况，包括不同的光照条件、不同的皮肤状况等，实现准确、充分地检测与去除人像瑕疵。

在一种实施方式中，在图像美颜网络的训练过程，除了常规的美颜训练外，还可以增加抗闪动训练，使得经过训练的图像美颜网络可以进一步保证人脸美颜效果的一致性。参考图11所示，图像美颜处理方法还可以包括以下步骤S1110至S1140：

步骤S1110，将第一待美颜样本图像输入待训练的图像美颜网络，以输出第一美颜样本图像。

图像美颜网络可以实现不同美颜功能的组合，本示例性实施方式可以根据实际需求，获取对应于不同美颜功能的美颜图像数据集，以训练所需的图像美颜网络。例如，如果需要训练去瑕疵的图像美颜网络，则获取具有瑕疵的待美颜样本图像，通过人工去瑕疵处理，得到对应的标注图像(Ground truth)，由此构建去瑕疵的美颜图像数据集；如果需要训练去瑕疵+形变的图像美颜网络，则获取具有瑕疵的待美颜样本图像，通过人工去瑕疵与形变处理，得到对应的标注图像，由此构建去瑕疵+形变的美颜图像数据集。当然，也可以先获取标注图像，经过反向处理，得到待美颜样本图像，例如获取无瑕疵的人脸图像，对其进行添加瑕疵、反向形变(是指与美颜中的形变相反的处理，例如美颜中常进行“瘦脸”，此处可以将脸部拉宽)等处理，得到待美颜样本图像，将无瑕疵的人脸图像作为其对应的标注图像，构建去瑕疵+形变的美颜图像数据集。可见，本示例性实施方式可以通过构建不同的美颜图像数据集，训练任意一种或多种美颜功能组合的图像美颜网络。

在一种实施方式中，可以将多张人脸图像进行组合，得到一张待美颜样本图像，并可以将该多张人脸图像对应的人工美颜后图像进行组合，得到该待美颜样本图像对应的一张标注图像，然后将该待美颜样本图像与标注图像添加至美颜图像数据集中。换句话说，美颜图像数据集可以包括单人脸的图像、多人脸的图像、组合人脸的图像等不同类型。

第一待美颜样本图像用于提供图像美颜网络的美颜训练，美颜训练是指训练图像美颜网络能够美颜出高质量、自然的图像。第一待美颜样本图像可以是美颜图像数据集中的任意图像。

图像美颜网络的结构可以参考上述图8与图9部分的内容，因而不再赘述。将第一待美颜样本图像输入图像美颜网络，输出对应的第一美颜样本图像，由于此时图像美颜网络未经训练或未经充分地训练，因此第一美颜样本图像应当与理想的美颜图像存在差别，例如与第一待美颜样本图像对应的标注图像存在差别。

步骤S1120，将第二待美颜样本图像输入图像美颜网络，并通过变换参数对图像美颜网络输出的图像进行变换，得到第二美颜样本图像。

第二待美颜样本图像用于提供图像美颜网络的抗闪动训练，抗闪动训练是指训练图像美颜网络能够对连续多帧图像实现稳定、无闪动的美颜处理效果。第二待美颜样本图像可以是美颜图像数据集中的任意图像。

在一种实施方式中，可以从同一个美颜图像数据集中获取第一待美颜样本图像与第二待美颜样本图像。例如第一待美颜样本图像与第二待美颜样本图像可以是同一张图像，这样美颜图像数据集中的每一张图像均可以同时作为第一待美颜样本图像与第二待美颜样本图像被使用，从而提高数据集的使用率。

上述通过人工处理的方式所构建的美颜图像数据集为有标注数据集，其中的待美颜样本图像均具有对应的标注图像。此外，还可以构建无标注数据集，例如仅收集待美颜样本图像，不需要进行人工处理，将这些待美颜样本图像形成无标注数据集，其中的待美颜样本图像均不具有对应的标注图像。在一种实施方式中，可以在有标注数据集中获取第一待美颜样本图像，在无标注数据集中获取第二待美颜样本图像。训练过程中并不使用第二待美颜样本图像对应的标注图像。无标注数据集的获取难度远低于有标注数据集，从而有利于增加第二待美颜样本图像的数量，便于对图像美颜网络进行更加充分的抗闪动训练。

在连续多帧图像之间，由于拍摄镜头的运动或者拍摄对象本身的运动，导致图像中的主要拍摄对象(即人脸)发生变换，包括平移、旋转、缩放中的一种或多种。步骤S1120中的变换参数用于模拟不同帧图像间的这种变化，可以包括平移参数、旋转参数、缩放参数中的任意一种或多种。

在一种实施方式中，可以对视频中图像的变换参数进行统计分析，得到步骤S1120中的变换参数。

在一种实施方式中，可以通过随机生成的方式得到变换参数。具体地，图像美颜处理方法还可以包括以下步骤：

获取预设的第一数值区间、第二数值区间、第三数值区间；

在第一数值区间内随机生成平移参数，在第二数值区间内随机生成旋转参数，在第三数值区间内随机生成缩放参数。

其中，第一数值区间是针对平移参数的数值区间，第二数值区间是针对旋转参数的数值区间，第三数值区间是针对缩放参数的数值区间，分别表示视频中图像可能发生的平移、旋转、缩放的数值范围。本示例性实施方式可以根据经验与实际场景确定三个数值区间。示例性的，第一数值区间可以是[-3，3]，单位为像素，表示平移的像素数；第二数值区间可以是[-5，5]，单位为度，表示旋转的度数；第三数值区间可以是[0.97，1.03]，单位为倍，表示缩放的倍率。进而，分别在三个数值区间内生成随机数，得到平移参数、旋转参数、缩放参数，即得到步骤S320中的变换参数。

将第二待美颜样本图像输入图像美颜网络，再利用上述得到的变换参数对图像美颜网络输出的图像进行变换，即第二待美颜样本图像先经过美颜、再经过变换，得到第二美颜样本图像。

步骤S1130，通过变换参数对第二待美颜样本图像进行变换，并将变换后的第二待美颜变换图像输入图像美颜网络，以输出第三美颜样本图像。

步骤S1130相当于将步骤S1120中的美颜与变换的顺序交换，即第二待美颜图像先经过变换、再经过美颜，得到第三美颜样本图像。

步骤S1140，基于第一待美颜样本图像对应的标注图像与第一美颜样本图像的差别，第二美颜样本图像与第三美颜样本图像的差别，更新图像美颜网络训练的参数。

标注图像与第一美颜样本图像的差别反映了图像美颜网络的美颜效果，即第一美颜样本图像越接近标注图像，表示图像美颜网络的美颜效果越好。由此，可以基于标注图像与第一美颜样本图像的差别，更新图像美颜网络的参数，以实现美颜训练。

第二美颜样本图像与第三美颜样本图像的差别反映了图像美颜网络的抗闪动效果。举例来说，视频第k帧图像(记为I_k，相当于上述变换后的第二待美颜样本图像)中的人脸相对第k-1帧图像(记为I_k-1，相当于上述第二待美颜样本图像)中的人脸发生了变换，假设变换参数为P，即I_k＝I_k-1·P。在实际美颜中，需要对第k-1帧图像与第k帧图像均进行美颜处理，将第k-1帧图像与第k帧图像输入图像美颜网络后输出的图像分别记为Y(I_k-1)、Y(I_k)＝Y(I_k-1·P)，如果Y(I_k-1)·P＝Y(I_k-1·P)(相当于第二美颜样本图像等于第三美颜样本图像)，说明经过美颜处理的第k-1帧图像与第k帧图像中的人脸存在变换关系，但是人脸本身没有差别，即视频中的连续两帧图像具有美颜一致性，不存在闪动的情况。由此，可以基于第二美颜样本图像与第三美颜样本图像的差别，更新图像美颜网络的参数，以实现抗闪动训练。

上述美颜训练对图像美颜网络的参数更新与抗闪动训练对图像美颜网络的参数更新可以同时执行，也可以分开执行，本公开对此不做限定。

在一种实施方式中，步骤S1140可以包括：

基于第一待美颜样本图像对应的标注图像与第一美颜样本图像的差别，确定第一损失函数值；

基于第二美颜样本图像与第三美颜样本图像的差别，确定第二损失函数值；

根据第一损失函数值与第二损失函数值更新图像美颜网络的参数。

其中，第一损失函数用于反映图像美颜网络的美颜损失，第二损失函数用于反映图像美颜网络的抗闪动损失。第一损失函数与第二损失函数可以预先建立，例如可以采用MAE(Mean Absolute Error，平均绝对误差，即L1损失)、MSE(Mean Square Error，均方误差，即L2损失)等形式。在训练中，将标注图像与第一美颜样本图像代入第一损失函数，计算出第一损失函数值，将第二美颜样本图像与第三美颜样本图像代入第二损失函数，计算出第二损失函数值。进而，可以分别根据第一损失函数值与第二损失函数值，对图像美颜网络的参数进行梯度下降更新，也可以由第一损失函数值与第二损失函数值进一步计算出全局损失函数值，全局损失函数例如可以是第一损失函数与第二损失函数进行加权的结果，再根据全局损失函数值对图像美颜网络的参数进行梯度下降更新。

图12示出了训练图像美颜网络的示意性流程。将第一待美颜样本图像输入图像美颜网络，输出第一美颜样本图像，将第一待美颜样本图像对应的标注图像与第一美颜样本图像代入第一损失函数，得到第一损失函数值。将第二待美颜样本图像输入图像美颜网络，利用预先生成的变换参数对输出的图像进行变换处理，得到第二美颜样本图像。利用该变换参数对第二待美颜样本图像进行变换处理，再将变换处理后的图像输入图像美颜网络，输出第三美颜样本图像。将第二美颜样本图像与第三美颜样本图像代入第二损失函数，得到第二损失函数值。对第一损失函数值与第二损失函数值进行加权，得到全局损失函数值，根据全局损失函数值对图像美颜网络中的各参数进行更新。经过这样多轮的迭代更新，当图像美颜网络在上述美颜图像数据集中的验证子集上的准确率达到预设的准确率阈值或者损失值低于预设的损失阈值时，确定完成训练，得到可用于实际美颜处理的图像美颜网络。

由上可知，图像美颜网络在实现常规的美颜处理的同时，还可以对图像的平移、旋转、缩放等变换表现出美颜效果的不变性，例如视频中人脸发生平移、旋转、以及与镜头远近的变化所导致的缩放时，图像美颜网络可以保持对该人脸的美颜效果，这与上述通过稳定包围盒稳定人脸的位置与尺寸的技术手段相结合，可以进一步保证人脸美颜效果的一致性，防止连续多帧图像经过美颜后发生画面闪动的现象。

步骤S530，从美颜人脸图像中拆分出与原始人脸子图像对应的美颜人脸子图像。

其中，在对美颜人脸图像进行拆分时，可以采用上述保存的组合信息，从美颜人脸图像中拆分出特定位置、特定尺寸的子图像，即美颜人脸子图像，美颜人脸子图像与原始人脸子图像一一对应。

继续参考图3，在步骤S350中，根据美颜人脸子图像生成待美颜原始图像对应的目标美颜图像。

美颜人脸子图像为对待美颜原始图像中的人脸经过美颜处理后的结果，将其替换掉待美颜原始图像中的人脸，可以得到待美颜原始图像的美颜结果，即目标美颜图像。示例性的，可以将待美颜原始图像中的原始人脸子图像替换为对应的美颜人脸子图像，得到目标美颜图像。

在一种实施方式中，如果在将原始人脸子图像组合为待美颜人脸图像时，对原始人脸子图像进行了变换，则可以相应的对拆分得到的美颜人脸子图像进行逆变换，包括去除填充的像素、上采样、反向旋转90度等，使逆变换后的美颜人脸子图像与原始人脸子图像的方向、尺寸等一致，这样在待美颜原始图像中可以进行1:1替换，得到目标美颜图像。

美颜人脸子图像是经过图像美颜网络进行美颜处理后的人脸子图像，通常是美颜程度较高的人脸子图像。在一种实施方式中，为了增加美颜人脸子图像的真实感，在上述将待美颜原始图像中的原始人脸子图像替换为对应的美颜人脸子图像前，可以利用原始人脸子图像对美颜人脸子图像进行美颜弱化处理。美颜弱化处理是指降低美颜人脸子图像的美颜程度，以增加。下面提供美颜弱化处理的两种示例性方式：

方式一、根据设定的美颜程度参数，将原始人脸子图像融合至美颜人脸子图像。其中，美颜程度参数可以是特定美颜功能下的美颜力度参数，如去瑕疵程度。本示例性实施方式中，美颜程度参数可以是用于当前设定的参数，系统默认的参数，或者上一次美颜所使用的参数等。在确定美颜程度参数后，可以以美颜程度参数作为比重，将原始人脸子图像与美颜人脸子图像进行融合。举例来说，假设去瑕疵程度的范围为0～100，当前设定的值为a，参考如下公式：

其中，image_blend表示融合后的图像，image_ori表示原始人脸子图像，image_deblemish表示美颜人脸子图像。当a为0时，表示不进行去瑕疵处理，则完全使用原始人脸子图像；当a为100时，表示完全去瑕疵处理，则完全使用美颜人脸子图像。因此，公式(12)表示通过融合，得到介于原始人脸子图像与美颜人脸子图像中间的图像，a越大，所得到的图像越接近于美颜人脸子图像，即美颜程度越高，美颜效果越明显。

需要说明的是，如果在将原始人脸子图像组合为待美颜人脸图像时，对原始人脸子图像进行了变换，可以对拆分得到的美颜人脸子图像进行逆变换。原始人脸子图像与美颜人脸子图像具有如下关系：变换前的原始人脸子图像与逆变换后的美颜人脸子图像方向、尺寸等一致；变换后的原始人脸子图像与逆变换前的美颜人脸子图像方向、尺寸等一致。因此，在利用上述公式(12)将原始人脸子图像与美颜人脸子图像进行融合时，可以融合上述变换前的原始人脸子图像与逆变换后的美颜人脸子图像，也可以融合上述变换后的原始人脸子图像与逆变换前的美颜人脸子图像。

方式二、将原始人脸子图像的高频图像融合至美颜人脸子图像。其中，高频图像是指包含原始人脸子图像中细节纹理等高频信息的图像。

在一种实施方式中，可以通过以下方式获取高频图像：

在基于图像美颜网络的输入图像尺寸将上述一张或多张原始人脸子图像进行组合时，如果对原始人脸子图像进行下采样，则将下采样后得到的下采样人脸子图像进行上采样，得到上采样人脸子图像；

根据原始人脸子图像与上采样人脸子图像的差别，获取原始人脸子图像的高频图像。

其中，下采样人脸子图像的分辨率低于原始人脸子图像，一般在下采样的过程中，不可避免地会损失图像的高频信息。对下采样人脸子图像进行上采样，使得到的上采样人脸子图像与原始人脸子图像的分辨率相同。需要说明的是，如果对原始人脸子图像进行下采样前，还进行了旋转，则对下采样人脸子图像进行上采样后，还可以进行反向旋转，使得到的上采样人脸子图像与原始人脸子图像的方向也相同。

上采样可以采用双线性插值、最近邻插值等方法。通过上采样虽然能够恢复分辨率，但是难以完全恢复出所损失的高频信息，即上采样人脸子图像可视为原始人脸子图像的低频图像。由此，确定原始人脸子图像与上采样人脸子图像的差别，例如可以将原始人脸子图像与上采样人脸子图像相减，结果为原始人脸子图像的高频信息，将相减后的值形成图像，即原始人脸子图像的高频图像。

在另一种实施方式中，还可以通过对原始人脸子图像进行滤波，以提取高频信息，得到高频图像。

在将上述高频图像融合至美颜人脸子图像时，可以采用直接相加的方式，将高频图像叠加到美颜人脸子图像中，使得美颜人脸子图像中增加细节纹理等高频信息，更具有真实感。

由于原始人脸子图像与上采样人脸子图像通常是非常相近的，基于其差值得到的高频图像中，像素值一般较小，如RGB各通道值不超过4。然而，对于原始人脸子图像中的突变位置，比如脸上的小黑痣等，其具有强烈的高频信息，因此在高频图像中对应位置的像素值可能比较大。在将高频图像融合至原始人脸子图像时，这些位置的像素值可能产生不良影响，例如产生“痣印”等锐利边缘，导致视觉感受不自然。

针对于上述问题，在一种实施方式中，图像美颜处理方法还可以包括以下步骤：

在高频图像中确定瑕疵点；

将高频图像中上述瑕疵点周围预设区域内的像素值调整到预设数值范围内。

其中，瑕疵点是具有强烈高频信息的像素点，可以将高频图像中像素值较大的点确定为瑕疵点。或者，在一种实施方式中，可以通过以下方式确定瑕疵点：

将美颜人脸子图像与对应的原始人脸子图像相减，得到每个像素点的差值；

当判断某个像素点的差值满足预设瑕疵条件时，将该像素点在高频图像中对应的像素点确定为瑕疵点。

其中，预设瑕疵条件用于衡量美颜人脸子图像与原始人脸子图像的差别，以判断每个像素点是否为被去除的瑕疵点。在去瑕疵处理中，通常会将人脸中的小黑痣、痘等去除，并填充人脸肤色，在该位置处，美颜人脸子图像与原始人脸子图像的差别很大，因此可以通过设定预设瑕疵条件来甄别瑕疵点。

示例性的，预设瑕疵条件可以包括：各个颜色通道的差值均大于第一颜色差阈值，且各个颜色通道的差值中的至少一个大于第二颜色差阈值。第一颜色差阈值与第二颜色差阈值可以是经验阈值。例如，当颜色通道包括RGB时，第一颜色差阈值可以是20，第二颜色差阈值可以是40。由此，得到每个像素点在美颜人脸子图像中与在原始人脸子图像中的差值后，对差值中RGB三个颜色通道的具体差值进行判断，判断每个颜色通道的差值是否均大于20，以及其中是否由至少一个颜色通道的差值大于40，当满足这两个条件时，表示满足预设瑕疵条件，则将高频图像中对应位置的像素点确定为瑕疵点。

确定瑕疵点后，可以在高频图像中进一步确定瑕疵点周围的预设区域，例如可以是以瑕疵点为中心的5*5像素区域，具体的尺寸可以根据高频图像的尺寸来确定，本公开不做限定。将预设区域内的像素值调整到预设数值范围内，预设数值范围一般是较小的数值范围，可以根据经验与实际需求确定，在调整时通常需要减小像素值。示例性的，预设数值范围可以是-2～2，而瑕疵点周围的像素值可能超出-5～5，将其调整到-2～2内，实际上进行了限值处理。由此能够弱化“痣印”等锐利边缘，增加视觉上的自然感受。

以上说明了两种美颜弱化处理方式。本示例性实施方式可以同时采用这两种美颜弱化处理方式，例如，先通过方式一进行原始人脸子图像与美颜人脸子图像的融合，在此基础上，再通过方式二将高频图像叠加到其中，得到经过美颜弱化处理的美颜人脸子图像，该的美颜人脸子图像兼具有较好的美颜效果与真实感。

在一种实施方式中，在将待处理图像中的原始人脸子图像替换为对应的美颜人脸子图像时，还可以执行以下步骤：

对位于待美颜原始图像中的未替换区域与美颜人脸子图像之间的边界区域进行渐变处理，使边界区域形成平滑过渡。

其中，待美颜原始图像中的未替换区域即待美颜原始图像中除原始人脸子图像以外的区域。上述未替换区域与美颜人脸子图像之间的边界区域实际包括两部分：未替换区域中与美颜人脸子图像相邻的边界区域，以及美颜人脸子图像中与未替换区域相邻的边界区域。本示例性实施方式可以对其中任一部分进行渐变处理，也可以同时对两部分进行渐变处理。

参考图13所示，可以在美颜人脸子图像中确定一定比例(如10％)的边界区域，其从美颜人脸子图像的边缘向内延伸。需要注意的是，边界区域通常需要避开人脸部分，以避免渐变处理中改变人脸部分的颜色。例如，通过上述稳定包围盒截取原始人脸子图像，使得原始人脸子图像中的人脸与边界具有一定的距离，则美颜人脸子图像中的人脸与边界也具有一定的距离，这样在进行渐变处理时，可以较好地避开人脸部分。确定边界区域后，获取边界区域的内边缘颜色，记为第一颜色；获取未替换区域的内边缘颜色，记为第二颜色；再对边界区域进行第一颜色与第二颜色的渐变处理。由此，未替换区域与美颜人脸子图像的边界处为渐变色区域(图13中的斜线区域)，这样形成平滑过渡，防止产生颜色突变，导致视觉感受不和谐。

需要说明的是，当有多张美颜人脸子图像时，可以分别将每一张美颜人脸子图像替换掉待处理图像中对应的原始人脸子图像，并进行边界区域的渐变处理，得到一张目标美颜图像，使其具有自然、和谐的视觉感受。

图14示出了图像美颜处理方法的示意性流程，包括：

步骤S1401，从视频中确定待美颜原始图像，例如可以将当前帧作为待美颜原始图像。

步骤S1402，对待美颜原始图像进行人脸检测，得到多张人脸的基础包围盒，筛除其中面积小于人脸面积阈值的人脸，余下的人脸记为待确定人脸。

步骤S1403，根据参考帧图像中的已确定人脸对上述待确定人脸进行跟踪，获取每张待确定人脸的ID，并确定其稳定包围盒。

步骤S1404，截取稳定包围盒以内的图像，得到原始人脸子图像。

步骤S1405，根据原始人脸子图像的数量将图像美颜网络的输入图像尺寸划分为多个子图像尺寸，根据子图像尺寸对原始人脸子图像进行下采样，还可以进行旋转、填充等处理，得到每张原始人脸子图像对应的下采样人脸子图像。

步骤S1406，将下采样人脸子图像进行上采样，如果在获取下采样人脸子图像时还进行了旋转、填充等处理，则还可以进行反向旋转、去除填充等处理，得到上采样人脸子图像，其与对应的原始人脸子图像的分辨率一致。

步骤S1407，将原始人脸子图像与对应的上采样人脸子图像相减，得到原始人脸子图像的高频图像。

步骤S1408，将下采样人脸子图像组合为一张待美颜人脸图像。

步骤S1409，将待美颜人脸图像输入图像美颜网络，处理后输出美颜人脸图像。

步骤S1410，将美颜人脸图像拆分为与原始人脸子图像一一对应的美颜人脸子图像。

步骤S1411，将美颜人脸子图像与对应的原始人脸子图像按照美颜程度参数进行融合，再与该原始人脸子图像的高频图像相加，得到待替换人脸子图像。

步骤S1412，将待替换人脸子图像融合至待美颜原始图像，具体地，可以由待替换人脸子图像替换掉待美颜原始图像中的原始人脸子图像的部分，并进行边缘的颜色渐变处理，使得待美颜原始图像中的人脸被替换为美颜后的人脸，最终得到目标美颜图像。后续还可以进行个性化美颜处理。

本公开的示例性实施方式还提供一种图像美颜处理装置。参考图15所示，该图像美颜处理装置1500可以包括：

图像获取模块1510，被配置为从连续多帧图像中获取待美颜原始图像；

人脸匹配模块1520，被配置为将待美颜原始图像中的人脸与待美颜原始图像的参考帧图像中的人脸进行匹配，根据匹配结果确定待美颜原始图像中的人脸的稳定包围盒；

子图像提取模块1530，被配置为基于待美颜原始图像中的人脸的稳定包围盒，从待美颜原始图像中提取原始人脸子图像；

美颜处理模块1540，被配置为利用图像美颜网络对原始人脸子图像进行处理，得到对应的美颜人脸子图像；

图像生成模块1550，被配置为根据美颜人脸子图像生成待美颜原始图像对应的目标美颜图像。

在一种实施方式中，人脸匹配模块1520，被配置为：

检测待美颜原始图像中的人脸，记为待确定人脸，将待确定人脸与待美颜原始图像的参考帧图像中的已确定人脸进行匹配；

如果待确定人脸与已确定人脸匹配不成功，则根据第一预设参数对待确定人脸的基础包围盒进行扩展，得到待确定人脸的稳定包围盒；

如果待确定人脸与已确定人脸匹配成功，则根据已确定人脸的稳定包围盒确定待确定人脸的稳定包围盒。

在一种实施方式中，上述将待确定人脸与待美颜原始图像的参考帧图像中的已确定人脸进行匹配，包括：

根据待确定人脸的基础包围盒与已确定人脸的基础包围盒的重叠度，确定待确定人脸与已确定人脸是否匹配成功。

在一种实施方式中，上述根据已确定人脸的稳定包围盒确定待确定人脸的稳定包围盒，包括：

在一种实施方式中，美颜处理模块1540，被配置为：

基于图像美颜网络的输入图像尺寸将从待美颜原始图像中提取的原始人脸子图像进行组合，生成待美颜人脸图像；

利用图像美颜网络对待美颜人脸图像进行处理，得到对应的美颜人脸图像；

从美颜人脸图像中拆分出与原始人脸子图像对应的美颜人脸子图像。

在一种实施方式中，上述基于图像美颜网络的输入图像尺寸将从待美颜原始图像中提取的原始人脸子图像进行组合，生成待美颜人脸图像，包括：

根据原始人脸子图像的数量，将输入图像尺寸分割为与原始人脸子图像一一对应的子图像尺寸；

分别基于每个子图像尺寸将对应的原始人脸子图像进行变换；

将变换后的原始人脸子图像进行组合，生成待美颜人脸图像。

在一种实施方式中，上述分别基于每个子图像尺寸将对应的原始人脸子图像进行变换，包括以下任意一条或多条：

当原始人脸子图像的宽度与高度的大小关系与子图像尺寸的宽度与高度的大小关系不同时，将原始人脸子图像旋转90度；

当原始人脸子图像或者经过旋转的原始人脸子图像的尺寸大于子图像尺寸时，根据子图像尺寸将原始人脸子图像或者经过旋转的原始人脸子图像进行下采样；

当原始人脸子图像或者经过旋转与下采样中至少一种处理的原始人脸子图像的尺寸小于子图像尺寸时，根据原始人脸子图像的尺寸与子图像尺寸的差值将原始人脸子图像进行填充，或者根据经过旋转与下采样中至少一种处理的原始人脸子图像的尺寸与子图像尺寸的差值将经过旋转与下采样中至少一种处理的原始人脸子图像进行填充。

在一种实施方式中，图像生成模块1550，被配置为：

将待美颜原始图像中的原始人脸子图像替换为对应的美颜人脸子图像，得到目标美颜图像。

在一种实施方式中，图像生成模块1550，被配置为：

在将待美颜原始图像中的原始人脸子图像替换为对应的美颜人脸子图像前，利用原始人脸子图像对美颜人脸子图像进行美颜弱化处理。

在一种实施方式中，上述利用原始人脸子图像对美颜人脸子图像进行美颜弱化处理，包括：

根据设定的美颜程度参数，将原始人脸子图像融合至美颜人脸子图像。

将原始人脸子图像的高频图像融合至美颜人脸子图像。

在一种实施方式中，图像获取模块1510，被配置为：

在基于图像美颜网络的输入图像尺寸将从待美颜原始图像中提取的原始人脸子图像进行组合时，如果对原始人脸子图像进行下采样，则将下采样后得到的下采样人脸子图像进行上采样，得到上采样人脸子图像，上采样人脸子图像与原始人脸子图像的分辨率相同；

在一种实施方式中，图像生成模块1550，被配置为：

在将待美颜原始图像中的原始人脸子图像替换为对应的美颜人脸子图像时，对待美颜原始图像中的未替换区域与美颜人脸子图像之间的边界区域进行渐变处理，使边界区域形成平滑过渡。

在一种实施方式中，图像美颜网络为全卷积网络，包括：第一像素重排层、至少一个卷积层、至少一个转置卷积层、第二像素重排层。

美颜处理模块1530，被配置为：

利用第一像素重排层对待美颜人脸图像进行由单通道到多通道的像素重排处理，得到第一特征图像；

利用卷积层对第一特征图像进行卷积处理，得到第二特征图像；

利用转置卷积层对第二特征图像进行转置卷积处理，得到第三特征图像；

利用第二像素重排层对第三特征图像进行由多通道到单通道的像素重排处理，得到美颜人脸图像。

在一种实施方式中，美颜处理模块1530，被配置为：

将通道数为a的待美颜人脸图像输入第一像素重排层；

将待美颜人脸图像的每个通道中每n*n邻域的像素点分别重排至n*n个通道中的相同位置，输出通道数为a*n*n的第一特征图像；

其中，a为正整数，n为不小于2的正整数。

在一种实施方式中，美颜处理模块1530，被配置为：

将通道数为b*n*n的第三特征图像输入第二像素重排层；

将第三特征图像的每n*n个通道中相同位置的像素点重排至单通道中的n*n邻域内，输出通道数为b的美颜人脸图像；

其中，b为正整数，n为不小于2的正整数。

在一种实施方式中，图像美颜处理装置1500还可以包括网络训练模块，被配置为：

将第一待美颜样本图像输入待训练的图像美颜网络，以输出第一美颜样本图像；

将第二待美颜样本图像输入图像美颜网络，并通过变换参数对图像美颜网络输出的图像进行变换，得到第二美颜样本图像；

通过变换参数对第二待美颜样本图像进行变换，并将变换后的第二待美颜变换图像输入图像美颜网络，以输出第三美颜样本图像；

基于第一待美颜样本图像对应的标注图像与第一美颜样本图像的差别，第二美颜样本图像与第三美颜样本图像的差别，更新图像美颜网络训练的参数。

在一种实施方式中，美颜人脸图像包括去瑕疵美颜图像；美颜处理模块1530，被配置为：

在得到去瑕疵美颜图像后，对去瑕疵美颜图像进行个性化美颜处理，得到最终的美颜图像。

上述装置中各部分的具体细节在方法部分实施方式中已经详细说明，未披露的细节内容可以参见方法部分的实施方式内容，因而不再赘述。

本公开的示例性实施方式还提供了一种计算机可读存储介质，可以实现为一种程序产品的形式，其包括程序代码，当程序产品在电子设备上运行时，程序代码用于使电子设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。在一种可选的实施方式中，该程序产品可以实现为便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在电子设备，例如个人电脑上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的示例性实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施方式。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限定。

Claims

1.一种图像美颜处理方法，其特征在于，包括：

从连续多帧图像中获取待美颜原始图像；

将所述待美颜原始图像中的人脸与所述待美颜原始图像的参考帧图像中的人脸进行匹配，根据匹配结果确定所述待美颜原始图像中的人脸的稳定包围盒；

基于所述待美颜原始图像中的人脸的稳定包围盒，从所述待美颜原始图像中提取原始人脸子图像；

利用图像美颜网络对所述原始人脸子图像进行处理，得到对应的美颜人脸子图像；

根据所述美颜人脸子图像生成所述待美颜原始图像对应的目标美颜图像。

2.根据权利要求1所述的方法，其特征在于，所述将所述待美颜原始图像中的人脸与所述待美颜原始图像的参考帧图像中的人脸进行匹配，根据匹配结果确定所述待美颜原始图像中的人脸的稳定包围盒，包括：

检测所述待美颜原始图像中的人脸，记为待确定人脸，将所述待确定人脸与所述待美颜原始图像的参考帧图像中的已确定人脸进行匹配；

如果所述待确定人脸与所述已确定人脸匹配不成功，则根据第一预设参数对所述待确定人脸的基础包围盒进行扩展，得到所述待确定人脸的稳定包围盒；

如果所述待确定人脸与所述已确定人脸匹配成功，则根据所述已确定人脸的稳定包围盒确定所述待确定人脸的稳定包围盒。

3.根据权利要求2所述的方法，其特征在于，所述将所述待确定人脸与所述待美颜原始图像的参考帧图像中的已确定人脸进行匹配，包括：

根据所述待确定人脸的基础包围盒与所述已确定人脸的基础包围盒的重叠度，确定所述待确定人脸与所述已确定人脸是否匹配成功。

4.根据权利要求2所述的方法，其特征在于，所述根据所述已确定人脸的稳定包围盒确定所述待确定人脸的稳定包围盒，包括：

基于预设稳定系数，对所述已确定人脸的稳定包围盒的中心点坐标与所述待确定人脸的基础包围盒的中心点坐标进行加权，得到所述待确定人脸的稳定包围盒的中心点坐标。

5.根据权利要求2所述的方法，其特征在于，所述根据所述已确定人脸的稳定包围盒确定所述待确定人脸的稳定包围盒，包括：

如果所述待确定人脸的基础包围盒的尺寸大于所述已确定人脸的稳定包围盒的尺寸与第一倍率之积，则根据第二预设参数对所述已确定人脸的稳定包围盒的尺寸进行扩展，得到所述待确定人脸的稳定包围盒的尺寸；

如果所述待确定人脸的基础包围盒的尺寸小于所述已确定人脸的稳定包围盒的尺寸与第二倍率之积，则根据第三预设参数对所述已确定人脸的稳定包围盒的尺寸进行缩小，得到所述待确定人脸的稳定包围盒的尺寸；所述第一倍率大于所述第二倍率；

如果所述待确定人脸的基础包围盒的尺寸小于所述已确定人脸的稳定包围盒的尺寸与第一倍率之积、且大于所述已确定人脸的稳定包围盒的尺寸与第二倍率之积，则将所述已确定人脸的稳定包围盒的尺寸作为所述待确定人脸的稳定包围盒的尺寸。

6.根据权利要求1所述的方法，其特征在于，所述利用图像美颜网络对所述原始人脸子图像进行处理，得到对应的美颜人脸子图像，包括：

基于所述图像美颜网络的输入图像尺寸将从所述待美颜原始图像中提取的所述原始人脸子图像进行组合，生成待美颜人脸图像；

利用所述图像美颜网络对所述待美颜人脸图像进行处理，得到对应的美颜人脸图像；

从所述美颜人脸图像中拆分出与所述原始人脸子图像对应的美颜人脸子图像。

7.根据权利要求6所述的方法，其特征在于，所述基于所述图像美颜网络的输入图像尺寸将从所述待美颜原始图像中提取的所述原始人脸子图像进行组合，生成所述待美颜人脸图像，包括：

根据所述原始人脸子图像的数量，将所述输入图像尺寸分割为与所述原始人脸子图像一一对应的子图像尺寸；

分别基于每个子图像尺寸将对应的所述原始人脸子图像进行变换；

将变换后的所述原始人脸子图像进行组合，生成所述待美颜人脸图像。

8.根据权利要求7所述的方法，其特征在于，所述分别基于每个子图像尺寸将对应的所述原始人脸子图像进行变换，包括以下任意一条或多条：

当所述原始人脸子图像的宽度与高度的大小关系与所述子图像尺寸的宽度与高度的大小关系不同时，将所述原始人脸子图像旋转90度；

当所述原始人脸子图像或者经过旋转的原始人脸子图像的尺寸大于所述子图像尺寸时，根据所述子图像尺寸将所述原始人脸子图像或者所述经过旋转的原始人脸子图像进行下采样；

当所述原始人脸子图像或者经过旋转与下采样中至少一种处理的原始人脸子图像的尺寸小于所述子图像尺寸时，根据所述原始人脸子图像的尺寸与所述子图像尺寸的差值将所述原始人脸子图像进行填充，或者根据所述经过旋转与下采样中至少一种处理的原始人脸子图像的尺寸与所述子图像尺寸的差值将所述经过旋转与下采样中至少一种处理的原始人脸子图像进行填充。

9.根据权利要求6所述的方法，其特征在于，所述根据所述美颜人脸子图像生成所述待美颜原始图像对应的目标美颜图像，包括：

将所述待美颜原始图像中的所述原始人脸子图像替换为对应的所述美颜人脸子图像，得到所述目标美颜图像。

10.根据权利要求9所述的方法，其特征在于，在将所述待美颜原始图像中的所述原始人脸子图像替换为对应的所述美颜人脸子图像前，所述方法还包括：

利用所述原始人脸子图像对所述美颜人脸子图像进行美颜弱化处理。

11.根据权利要求10所述的方法，其特征在于，所述利用所述原始人脸子图像对所述美颜人脸子图像进行美颜弱化处理，包括：

根据设定的美颜程度参数，将所述原始人脸子图像融合至所述美颜人脸子图像。

12.根据权利要求10所述的方法，其特征在于，所述利用所述原始人脸子图像对所述美颜人脸子图像进行美颜弱化处理，包括：

将所述原始人脸子图像的高频图像融合至所述美颜人脸子图像。

13.根据权利要求12所述的方法，其特征在于，所述方法还包括：

在基于所述图像美颜网络的输入图像尺寸将从所述待美颜原始图像中提取的所述原始人脸子图像进行组合时，如果对所述原始人脸子图像进行下采样，则将下采样后得到的下采样人脸子图像进行上采样，得到上采样人脸子图像，所述上采样人脸子图像与所述原始人脸子图像的分辨率相同；

根据所述原始人脸子图像与所述上采样人脸子图像的差别，获取所述原始人脸子图像的高频图像。

14.根据权利要求9所述的方法，其特征在于，在将所述待美颜原始图像中的所述原始人脸子图像替换为对应的所述美颜人脸子图像时，所述方法还包括：

对位于所述待美颜原始图像中的未替换区域与所述美颜人脸子图像之间的边界区域进行渐变处理，使所述边界区域形成平滑过渡。

15.根据权利要求6所述的方法，其特征在于，所述图像美颜网络为全卷积网络，包括：第一像素重排层、至少一个卷积层、至少一个转置卷积层、第二像素重排层；

所述利用所述图像美颜网络对所述待美颜人脸图像进行处理，得到对应的美颜人脸图像，包括：

利用所述第一像素重排层对所述待美颜人脸图像进行由单通道到多通道的像素重排处理，得到第一特征图像；

利用所述卷积层对所述第一特征图像进行卷积处理，得到第二特征图像；

利用所述转置卷积层对所述第二特征图像进行转置卷积处理，得到第三特征图像；

利用所述第二像素重排层对所述第三特征图像进行由多通道到单通道的像素重排处理，得到所述美颜人脸图像。

16.根据权利要求15所述的方法，其特征在于，所述利用所述第一像素重排层对所述待美颜人脸图像进行由单通道到多通道的像素重排处理，得到第一特征图像，包括：

将通道数为a的所述待美颜人脸图像输入所述第一像素重排层；

将所述待美颜人脸图像的每个通道中每n*n邻域的像素点分别重排至n*n个通道中的相同位置，输出通道数为a*n*n的所述第一特征图像；

其中，a为正整数，n为不小于2的正整数。

17.根据权利要求15所述的方法，其特征在于，所述利用所述第二像素重排层对所述第三特征图像进行由多通道到单通道的像素重排处理，得到所述中间图像，包括：

将通道数为b*n*n的所述第三特征图像输入所述第二像素重排层；

将所述第三特征图像的每n*n个通道中相同位置的像素点重排至单通道中的n*n邻域内，输出通道数为b的所述美颜人脸图像；

其中，b为正整数，n为不小于2的正整数。

18.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将第一待美颜样本图像输入待训练的所述图像美颜网络，以输出第一美颜样本图像；

将第二待美颜样本图像输入所述图像美颜网络，并通过变换参数对所述图像美颜网络输出的图像进行变换，得到第二美颜样本图像；

通过所述变换参数对所述第二待美颜样本图像进行变换，并将变换后的第二待美颜变换图像输入所述图像美颜网络，以输出第三美颜样本图像；

基于所述第一待美颜样本图像对应的标注图像与所述第一美颜样本图像的差别，所述第二美颜样本图像与所述第三美颜样本图像的差别，更新所述图像美颜网络训练的参数。

19.根据权利要求1所述的方法，其特征在于，所述目标美颜图像包括去瑕疵美颜图像，在得到所述去瑕疵美颜图像后，所述方法还包括：

对所述去瑕疵美颜图像进行个性化美颜处理，得到最终的美颜图像。

20.一种图像美颜处理装置，其特征在于，包括：

图像获取模块，被配置为从连续多帧图像中获取待美颜原始图像；

人脸匹配模块，被配置为将所述待美颜原始图像中的人脸与所述待美颜原始图像的参考帧图像中的人脸进行匹配，根据匹配结果确定所述待美颜原始图像中的人脸的稳定包围盒；

子图像提取模块，被配置为基于所述待美颜原始图像中的人脸的稳定包围盒，从所述待美颜原始图像中提取原始人脸子图像；

美颜处理模块，被配置为利用图像美颜网络对所述原始人脸子图像进行处理，得到对应的美颜人脸子图像；

图像生成模块，被配置为根据所述美颜人脸子图像生成所述待美颜原始图像对应的目标美颜图像。

21.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至19任一项所述的方法。

22.一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至19任一项所述的方法。