WO2023124391A1

WO2023124391A1 - 妆容迁移及妆容迁移网络的训练方法和装置

Info

Publication number: WO2023124391A1
Application number: PCT/CN2022/125086
Authority: WO
Inventors: 吴文岩; 郑程耀; 甘世康; 唐斯伟; 张丽; 钱晨
Original assignee: 上海商汤智能科技有限公司
Priority date: 2021-12-30
Filing date: 2022-10-13
Publication date: 2023-07-06
Also published as: CN114283052A

Abstract

提供一种妆容迁移及妆容迁移网络的训练方法和装置，所述妆容迁移方法包括：获取待迁移目标图像和待迁移局部图像，所述待迁移目标图像包括目标对象，所述待迁移局部图像上包括所述目标对象的局部区域；通过目标妆容迁移网络分别将预设妆容风格迁移到所述待迁移目标图像和所述待迁移局部图像上，得到迁移目标图像和迁移局部图像；对所述迁移目标图像和所述迁移局部图像进行融合，得到所述目标对象的妆容迁移结果。

Description

妆容迁移及妆容迁移网络的训练方法和装置

相关申请交叉引用

本申请主张申请号为202111653519.6、申请日为2021年12月30日的中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本公开涉及计算机视觉技术领域，尤其涉及妆容迁移及妆容迁移网络的训练方法、装置、计算机设备及存储介质。

背景技术

妆容迁移是计算机视觉中图像生成领域的一个重要方向。妆容迁移是指将一种妆容风格迁移到不具有该妆容风格的图像上，例如，针对脸部图像而言，妆容迁移可以是将某种妆容风格迁移到素颜的脸部图像上。然而，传统的妆容迁移方式的还原度较低。

发明内容

本公开实施例的第一方面提供一种妆容迁移方法，所述方法包括：获取待迁移目标图像和待迁移局部图像，所述待迁移目标图像包括目标对象，所述待迁移局部图像包括所述目标对象的局部区域；通过目标妆容迁移网络将预设妆容风格迁移到所述待迁移目标图像上，得到迁移目标图像；通过所述目标容迁移网络将所述预设妆容风格迁移到所述待迁移局部图像上，得到迁移局部图像；对所述迁移目标图像和所述迁移局部图像进行融合，得到所述目标对象的妆容迁移结果。

本公开实施例的第二方面提供一种妆容迁移网络的训练方法，所述方法包括：获取待迁移样本图像和待迁移局部样本图像，所述待迁移样本图像中包括第二样本对象，所述待迁移局部样本图像中包括所述第二样本对象的局部区域；通过原始妆容迁移网络将参考样本图像中第一样本对象的妆容风格迁移到所述待迁移样本图像上，得到迁移样本图像；通过所述原始妆容迁移网络将参考局部样本图像中所述第一样本对象的妆容风格迁移到所述待迁移局部样本图像上，得到迁移局部样本图像，所述参考局部样本图像包括所述参考样本图像中目标对象的局部区域，且所述待迁移局部样本图像中包括的局部区域与所述参考局部样本图像中包括的局部区域相同；基于所述迁移样本图像和所述迁移局部样本图像对所述原始妆容迁移网络进行训练，得到目标妆容迁移网络。

本公开实施例的第三方面提供一种妆容迁移装置，所述装置包括：获取模块，用于获取待迁移目标图像和待迁移局部图像，所述待迁移目标图像包括目标对象，所述待迁移局部图像上包括所述目标对象的局部区域；迁移模块，用于通过目标妆容迁移网络将预设妆容风格迁移到所述待迁移目标图像，得到迁移目标图像；通过所述目标妆容迁移网络将所述预设妆容风格迁移到所述待迁移局部图像上，得到迁移局部图像；融合模块，用于对所述迁移目标图像和所述迁移局部图像进行融合，得到所述目标对象的妆容迁移结果。

本公开实施例的第四方面提供一种妆容迁移网络的训练装置，所述装置包括：获取模块，用于获取待迁移样本图像和待迁移局部样本图像，所述待迁移样本图像中包括第二样本对象，所述待迁移局部样本图像中包括所述第二样本对象的局部区域；第一迁移模块，用于通过原始妆容迁移网络将参考样本图像中第一样本对象的妆容风格迁移到所述待迁移样本图像上，得到迁移样本图像；第二迁移模块，用于通过所述原始妆容迁移网络将参考局部样本图像中所述第一样本对象的妆容风格迁移到所述待迁移局部样本图像上，得到迁移局部样本图像，所述参考局部样本图像包括所述参考样本图像中目标对象的局部区域，且所述待迁移局部样本图像中包括的局部区域与所述参考局部样本图像中包括的局部区域相同；训练模块，用于基于所述迁移样本图像和迁移局部样本图像对所述原始妆容迁移网络进行训练，得到目标妆容迁移网络。

本公开实施例的第五方面提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现任一实施例所述的方法。

本公开实施例的第六方面提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现任一实施例所述的方法。

本公开实施例的第七方面提供一种计算机程序产品，所述产品包括计算机程序，所述计算机程序被处理器执行时实现任一实施例所述的方法。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。

图1是妆容迁移的示意图。

图2是根据本公开实施例的妆容迁移方法的流程图。

图3是根据本公开实施例的待迁移目标图像和待迁移局部图像的示意图。

图4是根据本公开实施例的输出结果的示意图。

图5是根据本公开实施例的训练过程的示意图。

图6是根据本公开另一实施例的妆容迁移方法的流程图。

图7是根据本公开实施例的妆容迁移网络的训练方法的流程图。

图8是根据本公开另一实施例的妆容迁移网络的训练方法的流程图。

图9是根据本公开实施例的妆容迁移装置的框图。

图10是根据本公开另一实施例的妆容迁移装置的框图。

图11是根据本公开实施例的妆容迁移网络的训练装置的框图。

图12是根据本公开另一实施例的妆容迁移网络的训练装置的框图。

图13是根据本公开实施例的计算机设备的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本公开使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。另外，本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合。

应当理解，尽管在本公开可能采用术语“第一”、“第二”、“第三”等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

为了使本技术领域的人员更好的理解本公开实施例中的技术方案，并使本公开实施例的上述目的、特征和优点能够更加明显易懂，下面结合附图对本公开实施例中的技术方案作进一步详细的说明。

妆容迁移是指将一种妆容风格迁移到不具有该妆容风格的图像上，一般可以先获取具有某种妆容的图像，再通过神经网络对图像中的妆容的特征进行提取，并将提取出的妆容的特征迁移到不具有该妆容风格的图像上。所述妆容可以是通过彩绘、纹身、贴图、化妆等任意方式获得的，所述图像可以是人或动物的某个身体部位(例如，背部、脸部)的图像。为了便于说明，下文以脸部图像为例，对本公开实施例的方案进行说明。图1是妆容迁移的示意图，可以将预设妆容风格迁移到一张素颜图像101上，得到具有该预设妆容风格的迁移结果102。其中，迁移结果102中包括的脸部与素颜图像101中包括的脸部是同一个人的脸部。预设妆容风格除了图1中所示的眼部区域1021、脸颊区域1022、嘴唇区域1023等部位的妆容风格以外，还可以包括其他区域的妆容风格。本实施例中的素颜图像是指未化妆的脸部图像，当然，除了将预设妆容风格迁移到素颜图像之外，还可以将预设妆容风格迁移到具有其他妆容风格的脸部图像上，以覆盖脸部图像上原有的妆容风格，或者是与脸部图像上原有的妆容风格进行融合，得到新的妆容风格。

妆容迁移算法需要保证脸部妆容各个区域的妆容还原度，例如眼部区域的眼影、眼线、美瞳；嘴巴区域的口红高光、颜色、纹理质感等，都需要以一定的妆容还原度迁移到用户脸部上。然而，相关技术中，往往难以达到足够高的妆容还原度。

除此之外，相关技术中的妆容迁移方式往往还存在以下问题：

(1)迁移结果的鲁棒性和自然度较低。由于要迁移的脸部图像可能存在任意的光照/角度/人脸形状/遮挡状态，相关技术难以保证迁移后的图像依然是自然的，并且也难以兼顾多样的脸部图像，迁移结果往往存在违和感。

(2)迁移算法需要在迁移妆容的同时，往往会改变用户本身的可辨认的id(identity information)信息(也称为id属性信息)，id信息用于表征用户的身份信息，用户的五官形状、表情、脸部角度、眼睛的单双眼皮属性、嘴巴的张闭情况等中的任意一者或多者的改变，都可能导致id信息改变，即，导致一个用户被辨认为另一个用户。因此，在迁移强度足够的前提下，相关技术难以保证用户本身的id信息不变，即，难以保证较高的id保留度。

(3)只能以单张图像作为参考妆容，无法获得妆容在不同的视角、表情下的表现，导致迁移的妆容还原度和自然度较差。

除此之外，相关技术中一般只能在上述妆容还原度、自然度和用户可辨认id信息中的某个维度上进行增强，而无法兼顾上述各个维度的效果。即，相关技术要么以较低的妆容还原度为代价，保证迁移后的图像自然度和id保留度；要么牺牲了迁移的自然度，并明显地修改了脸部图像的一些id属性信息，来保证较强的妆容还原度。

基于此，本公开实施例提供一种妆容迁移方法，参见图2，所述方法包括步骤201至步骤203。

步骤201：获取待迁移目标图像pic_global和待迁移局部图像pic_local，所述待迁移目标图像pic_global包括目标对象，所述待迁移局部图像pic_local包括所述目标对象的局部区域。

步骤202：通过目标妆容迁移网络将预设妆容风格分别迁移到所述待迁移目标图像pic_global和所述待迁移局部图像pic_local上，得到迁移目标图像gen_global和迁移局部图像gen_local。

步骤203：对所述迁移目标图像P_global和所述迁移局部图像P_local进行融合，得到所述目标对象的妆容迁移结果。

本公开实施例的方案可用于互动娱乐、妆容美化及试妆等产品中。本公开实施例通过目标妆容迁移网络分别对待迁移目标图像pic_global和待迁移局部图像pic_local进行妆容迁移，通过对待迁移局部图像pic_local进行妆容迁移，能够更好地迁移局部区域的妆容细节，从而能够提高妆容迁移的还原度。此外，通过对包括完整目标对象的待迁移目标图像pic_global进行妆容迁移，能够提高妆容迁移的自然度。综上所述，本公开实施例的方案能够兼顾妆容迁移的自然度和还原度。

在步骤201中，待迁移目标图像可以是单独的一张图像，也可以是视频中的一帧图像或多帧视频帧，所述待迁移目标图像可以是实时采集的，也可以预先采集并存储的。在一些实施例中，所述待迁移目标图像为实时采集的视频中的包括所述目标对象的图像或视频帧，所述待迁移局部图像为从所述包括所述目标对象的图像或视频帧中裁剪出的包括所述局部区域的局部图像。所述实时采集的视频中可以包括多帧连续或不连续的视频帧，可以对视频中包括目标对象的所有视频帧进行妆容迁移，也可以选取视频中包括目标对象，且满足预设条件的视频帧进行妆容迁移。其中，所述预设条件可以包括但不限于清晰度条件、目标对象的尺寸条件等。例如，满足所述清晰度条件即视频帧的清晰度大于预设清晰度阈值；目标对象的尺寸条件即视频帧中目标对象的尺寸在预设的尺寸范围内。

待迁移目标图像pic_global可以包括完整的目标对象，例如，脸部，所述目标对象是需要进行妆容迁移的对象。目标对象可以包括多个局部区域，例如，脸部包括眼睛、鼻子、嘴巴等区域。所述待迁移局部图像pic_local上可以包括一个或多个局部区域，例如，考虑到妆容类型以及妆容效果的不同，所述待迁移局部图像pic_local可以包括左眼区域、右眼区域、鼻子区域、额头区域、苹果肌区域等至少一种。此外，为了能够更好地进行细节还原，根据妆容迁移的需求，所述待迁移局部图像pic_local上还可以仅包括一个局部区域。

待迁移局部图像pic_local可以通过对待迁移目标图像pic_global进行目标检测和图像分割得到。在一些实施例中，可以对所述目标对象的原始图像进行目标检测，确定所述原始图像中目标对象的关键点位置；基于所述目标对象的关键点位置从所述原始图像中裁剪出所述待迁移局部图像。例如，可以检测出脸部的左眼关键点、右眼关键点、鼻子关键点、嘴巴关键点等脸部关键点，基于左眼关键点的位置从所述原始图像中裁剪出左眼区域的待迁移局部图像。

在一些实施例中，从所述原始图像中裁剪出的待迁移局部图像可以是所述原始图像中具有第一预设尺寸的图像区域，所述第一预设尺寸小于所述目标对象的尺寸，且大于所述局部区域的尺寸，所述局部区域位于所述第一预设尺寸的图像区域中的第一预设位置处。在一些实施例中，所述第一预设位置可以是图像的中心位置，或者图像中横向的三分线与纵向的三分线的交点位置，或者是其他位置。由于第一预设尺寸大于所述局部区域的尺寸，能够使裁剪出的待迁移局部图像中包括完整的局部区域，例如包括完整的眼部区域、嘴巴区域等。

进一步地，还可以对目标对象的原始图像进行目标检测，确定原始图像中目标对象的位置和角度，基于所述原始图像中目标对象的位置和角度从所述原始图像中裁剪出待迁移目标图像。其中，可以基于所述原始图像中目标对象的位置和角度建立仿射矩阵，并基于所述仿射矩阵从所述原始图像中裁剪出所述待迁移目标图像。

在一些实施例中，从所述原始图像中裁剪出的待迁移目标图像可以是所述原始图像中具有第二预设尺寸的图像区域，所述第二预设尺寸大于所述目标对象的尺寸，且所述目标对象位于所述第二预设尺寸的图像区域中的第二预设位置处。在一些实施例中，所述第二预设位置可以是图像的中心位置，或者图像中横向的三分线与纵向的三分线的交点位置，或者是其他位置。由于第二预设尺寸大于所述目标对象的尺寸，能够使裁剪出的待迁移目标图像中包括完整的目标对象。

在一些实施例中，所述第一预设尺寸例如为256*256像素，所述第二预设尺寸例如为1024*1024像素，目标对象的尺寸例如为800*800像素。当然，上述数值只是一种示例性说明，并非用于限制本公开。在实际应用中，可以根据需要设置其他的尺寸。在原始图像的尺寸过大或过小的情况下，可以先对原始图像进行缩放，再从缩放后的原始图像中裁剪出所需尺寸的待迁移目标图像。或者，也可以先从原始图像中裁剪出包括目标对象的图像区域，再将裁剪出的图像区域缩放为所需的尺寸。

进一步地，由于包括目标对象的原始图像中可能包括背景区域，还可以对原始图像进行裁剪或背景分割处理，得到目标对象所在的图像区域(即待迁移目标图像)。

在一些实施例中，还可以将待迁移目标图像pic_global中目标对象调整预设角度，例如，所述预设角度满足：目标对象的头顶与下巴在竖直方向上对齐。角度调整的过程可以通过仿射变换实现。通过进行角度调整，可以便于对待迁移目标图像pic_global进行各种处理，例如，图像分割、特征提取等。

在上述实施例中，所述原始图像可以是用户上传的图像(例如，手机相册中存储的图像)，或者是通过图像采集装置实时采集到的图像。也可以由用户对原始图像进行裁剪，得到符合要求的待迁移目标图像，并直接上传待迁移目标图像进行妆容迁移。上述实施例中的基于所述目标对象的关键点位置从所述原始图像中裁剪出所述待迁移局部图像，例如可以直接从原始图像中裁剪出待迁移局部图像，也可以先从原始图像中裁剪出待迁移目标图像，再从待迁移目标图像中裁剪出所述待迁移局部图像。

一些实施例的待迁移目标图像pic_global和待迁移局部图像pic_local如图3所示，其中，待迁移局部图像pic_local包括右眼局部图像、左眼局部图像和嘴巴局部图像。在实际应用中，待迁移局部图像pic_local并不局限于包括上述3种局部图像中的部分，还可以根据实际妆容迁移需求，设置除上述3种局部图像以外的其他局部区域的图像，本公开对此并不限定。

在步骤202中，目标妆容迁移网络可以预先学习出预设妆容风格的妆容特征，从而能够将预设妆容风格迁移到所述待迁移目标图像pic_global和所述待迁移局部图像pic_local上。在一些实施例中，一个目标妆容迁移网络对应于一种预设妆容风格。可以利用具有该预设妆容风格的图像作为样本图像训练出目标妆容迁移网络。在另一些实施例中，一个目标妆容迁移网络也可以对应于多种预设妆容风格。可以利用具有所述多种预设妆容风格中每种预设妆容风格的图像作为样本图像训练出目标妆容迁移网络，其中，每种预设妆容风格的图像都携带标签信息，所述标签信息用于标识图像对应的预设妆容风格。

在一些实施例中，目标妆容迁移网络可以包括第一子网络和第二子网络，所述第一子网络用于将预设妆容风格迁移到所述待迁移目标图像pic_global上，所述第二子网络用于将预设妆容风格迁移到所述待迁移局部图像pic_local上。在一些实施例中，所述第二子网络的数量包括一个或多个，在包含至少两个第二子网络的情况下，不同的第二子网络用于对不同的局部区域的待迁移局部图像pic_local进行妆容迁移。例如，脸部图像可以包括左眼、右眼、鼻子、嘴巴等局部区域，因此，可以采用至少4个第二子网络，分别对左眼区域、右眼区域、鼻子区域、嘴巴区域进行妆容迁移。每个子网络都可以包括妆容风格提取器以及生成器，其中，妆容风格提取器用于从带妆容的图像ref中提取出妆容特征F_ref；生成器用于基于提取出的妆容特征F_ref以及待迁移的图像(即待迁移目标图像pic_global或待迁移局部图像pic_local)生成风格迁移后的图像(即迁移目标图像gen_global或迁移局部图像gen_local)。

通过采用本步骤，能够以待迁移目标图像pic_global为整体，得到目标对象整体的妆容迁移效果；同时，还能够充分挖掘出目标对象的局部区域的妆容特征，从而得到该局部区域的妆容迁移效果。

在步骤203中，将迁移局部图像gen_local融合到迁移目标图像gen_global中，得到最终的迁移图像gen_face(即妆容迁移结果)，迁移图像gen_face中包括待迁移目标图像中包括的目标对象，且该目标对象具有所述预设妆容风格。例如，待迁移目标图像pic_global中包括用户A的素颜脸部图像，预设妆容风格中包括灰色眼影、红色口红、蓝色美瞳，则迁移图像gen_face中包括具有灰色眼影、红色口红、蓝色美瞳的用户A的脸部图像。

在一些实施例中，可以对所述迁移目标图像进行语义分割，得到所述迁移目标图像中所述局部区域的位置；基于所述迁移目标图像中所述局部区域的位置将所述迁移局部图像融合到所述迁移目标图像中，得到所述目标对象的妆容迁移结果。上述图像融合过程可以采用拉普拉斯融合、羽化融合等算法实现，所采用的具体算法本公开不做限制。

上述融合过程可以在目标妆容迁移网络外部实现，也可以在目标妆容迁移网络内部实现。在通过目标妆容迁移网络内部实现图像融合的实施例中，目标妆容迁移网络中可以包括第一子网络、第二子网络和第三子网络。第一子网络用于将预设妆容风格迁移到所述待迁移目标图像上，得到迁移目标图像；第二子网络用于将预设妆容风格迁移到所述待迁移局部图像上，得到迁移局部图像。第三子网络用于获取所述迁移目标图像和所述迁移局部图像，并对所述迁移目标图像和迁移局部图像进行融合。

在一些实施例中，为了获得较好的妆容迁移效果，可以预先基于待迁移样本图像、待迁移局部样本图像、参考样本图像以及参考局部样本图像，对原始妆容迁移网络进行训练，得到所述目标妆容迁移网络。其中，所述参考样本图像ref_global包括具有所述预设妆容风格的完整的样本对象，所述参考样本图像ref_global中包括的样本对象与待迁移样本图像samp_global中包括的样本对象为同一类别的样本对象，例如，都是人脸。所述待迁移样本图像samp_global包括具有除所述预设妆容风格以外的妆容风格的样本对象，即，所述参考样本图像ref_global中包括的样本对象与待迁移样本图像samp_global中包括的样本对象带有不同的妆容。特别地，在本公开实施例中，可以将素颜作为一种特殊的妆容，也可以属于待迁移样本图像中包含的妆容种类之一。

所述待迁移局部样本图像samp_local中包括所述待迁移样本图像samp_global中的样本对象的局部区域，所述参考局部样本图像ref_local中包括所述参考样本图像ref_global中的样本对象的局部区域，且所述待迁移局部样本图像samp_local中包括的局部区域与参考局部样本图像ref_local中包括的局部区域相同。待迁移局部样本图像 samp_local与参考局部样本图像ref_local中都可以包括一种或多种局部区域。例如，二者均包括左眼区域，或者二者均包括左眼区域和鼻子区域。待迁移局部样本图像samp_local可以通过对待迁移样本图像samp_global进行目标检测和图像分割得到。

在一些实施例中，所述参考样本图像从第一图像集中选取，所述第一图像集中包括多张图像，所述第一图像集中的每张图像包括具有所述预设妆容风格的相同的样本对象。在一些实施例中，所述参考样本图像包括样本视频中的多个视频帧，所述样本视频中的多个视频帧中的每个视频帧均包括具有所述预设妆容风格的样本对象。所述样本视频可以是直接通过图像采集装置采集得到的视频，也可以是编辑后的视频。样本视频中的多个视频帧可以包括时间上连续的多个视频帧，也可以包括时间上不连续的视频帧。

在一些实施例中，所述样本视频中的多个视频帧满足以下至少一个条件：至少两帧视频帧中的样本对象的角度和/或表情不同；至少两帧视频帧中的光照强度不同。通过采用多个视频帧作为参考样本图像ref_global，能够提供足量的妆容图像，使得训练出的目标妆容迁移网络能够重复挖掘出预设妆容风格在不同角度、不同光照、不同表情下的细节变化信息，从而提高妆容迁移的还原度。

在一些实施例中，所述待迁移样本图像从第二图像集中选取，所述第二图像集中包括多张图像，所述第二图像集中的每张图像包括具有除所述预设妆容风格以外的妆容风格的样本对象，换言之，所述第二图像集中的每张图像包括不具有所述预设妆容风格的样本对象，且所述第二图像集中的至少两张图像中包括的样本对象不同。通过采用不同的目标对象的图像作为待迁移样本图像samp_global，使得训练出的目标妆容迁移网络能够充分学习到将妆容风格迁移到具有不同id的对象上的能力，从而使得妆容迁移结果的自然度更高。在本公开实施例中，可以将待迁移样本图像中包括的样本对象称为第二样本对象，将参考样本图像中包括的样本对象称为第一样本对象。

在训练时，可以通过原始妆容迁移网络将参考样本图像ref_global中的妆容风格迁移到待迁移样本图像samp_global上，得到迁移样本图像samp_gen_global；通过所述原始妆容迁移网络将参考局部样本图像ref_local中的妆容风格迁移到待迁移局部样本图像samp_local上，得到迁移局部样本图像samp_gen_local；基于所述迁移样本图像samp_gen_global和所述迁移局部样本图像samp_gen_local对所述原始妆容迁移网络进行训练，得到目标妆容迁移网络。

在对原始妆容迁移网络进行训练之前，可以先对待迁移样本图像samp_global和待迁移局部样本图像samp_local、以及对参考样本图像ref_global和参考局部样本图像ref_local进行处理，包括调整图像的尺寸以及调整图像中的样本对象的角度。其中，可以将待迁移样本图像samp_global和参考样本图像ref_global调整为相同的尺寸(例如，所述第二预设尺寸)，并将待迁移局部样本图像samp_local和参考局部样本图像ref_local调整为相同的尺寸(例如，所述第一预设尺寸)。

在一些实施例中，可以基于所述迁移样本图像samp_gen_global建立第一损失函数；基于所述迁移局部样本图像samp_gen_local建立第二损失函数；基于所述第一损失函数和所述第二损失函数对原始妆容迁移网络进行训练，得到所述目标妆容迁移网络。在一些实施例中，在目标妆容迁移网络包括第一子网络和第二子网络的情况下，可以基于所述第一损失函数对原始妆容迁移网络中的原始第一子网络进行训练，得到所述第一子网络；基于所述第二损失函数对原始妆容迁移网络中的原始第二子网络进行训练，得到所述第二子网络。

用于训练子网络的损失函数可以包括以下至少一者：

(1)用于表征所述子网络的输出图像的真实度损失的损失函数。可以将所述子网络的输出图像输入到判别器，通过判别器判断该输出图像是否为通过妆容迁移得到的合成图像，目标是使判别器无法识别出该输出图像是真实图像还是合成图像，因此，根据判别器的输出结果与真实结果之间的差异可以得到该损失函数。通过采用该损失函数，能够提高输出图像的真实度和自然度。该损失函数是通过生成器和对抗器(判别器)进行对抗得到的，因此，也可以称为对抗生成损失函数。

(2)用于表征所述子网络的输出图像与输入所述子网络的待迁移图像之间的属性相似度损失的损失函数。其中，不同的局部区域对应的属性不同，例如，眼部区域(包括左眼区域和右眼区域)对应的属性可以包括眼皮属性，所述眼皮属性用于表征眼皮是单眼皮还是双眼皮；鼻子区域对应的属性可以包括鼻梁的高度；嘴巴区域对应的属性可以包括嘴角的弧度等。可以将子网络的输出图像输入属性分类器，得到输出图像对应的属性类别，并基于输出图像对应的属性类别与输入子网络的待迁移图像(待迁移样本图像samp_global或待迁移局部样本图像samp_local)进行相似度比较，从而获取该损失函数。通过采用该损失函数，能够尽量保证迁移后的样本对象与迁移前的样本对象的id属性信息是一致的，因此，该损失函数也可以称为属性保持损失函数。

(3)用于表征所述子网络的输出图像与输入所述子网络的参考图像之间的妆容相似度损失的损失函数。可以将子网络的输出图像输入到该子网络包括的妆容风格提取器，以提取出输出图像中的妆容特征，再将输出图像中的妆容特征与输入该子网络的参考图像(参考样本图像ref_global或参考局部样本图像ref_local)中的妆容特征进行相似度比较，从而获取该损失函数。通过采用该损失函数，能够尽量保证迁移后的妆容风格与参考图像中的妆容风格是一致的，从而提高妆容迁移的还原度，因此，该损失函数也可以称为风格一致损失函数。

(4)用于表征目标样本图像与输入所述子网络的待迁移图像之间的相似度损失的损失函数；所述目标样本图像通过将输入所述子网络的待迁移图像上的妆容风格迁移到所述子网络的输出图像上得到。即，可以将子网络的输出图像作为待迁移图像，将原本输入到子网络的待迁移图像作为参考图像，再次通过该子网络进行妆容迁移，基于得到的迁移结果(目标样本图像)与原本输入到子网络的待迁移图像的相似度确定该损失函数，该损失函数也可以称为循环一致损失函数。通过采用该损失函数，能够使子网络的输出图像与原本的待迁移图像中样本对象的结构信息保持一致。结构信息包括图像中各个点的语义信息，所述语义信息用于表示像素点所属的局部区域，例如，表示像素点是属于鼻子区域还是嘴巴区域。

在上述实施例中，所述子网络可以是所述第一子网络或所述第二子网络。在子网络为第一子网络的情况下，输入子网络的待迁移图像、参考图像以及子网络的输出图像均为包括完整的目标对象的图像。在子网络为第二子网络的情况下，输入子网络的待迁移图像、参考图像以及子网络的输出图像均为包括目标对象的局部区域的图像。在第二子网络的数量为多个的情况下，第一子网络以及每个第二子网络都可以基于上述四个损失函数中的至少一者进行训练，不同的第二子网络采用的属性保持损失函数可以基于不同的属性类别获取。例如，用于处理左眼区域和右眼区域的第二子网络采用的属性保持损失函数可以基于眼皮属性类别获取，用于处理嘴巴区域的第二子网络采用的属性保持损失函数可以基于嘴唇厚度类别和/或嘴角弧度类别获取。

在一些实施例中，进行妆容迁移可能导致目标对象上被迁移的局部区域迁移后的颜色与目标对象上未被迁移的局部区域的颜色不同，例如，对人脸进行妆容迁移后，人脸部分的颜色与脖子部分的颜色可能不同。因此，为了进一步减少妆容迁移结果的违和感，提高自然度，在对所述迁移目标图像和所述迁移局部图像进行融合之后，可以对所述目标对象上未进行妆容迁移的局部区域进行颜色迁移。在一些实施例中，可以获取所述目标对象迁移后的颜色；基于所述目标对象迁移后的颜色对所述目标对象上未进行妆容迁移的区域的颜色进行调整。

进一步地，在得到所述目标对象的妆容迁移结果(输出图像)之后，还可以将输出图像还原为与待迁移目标图像相同的尺寸。例如，假设从原始图像中裁剪出的待迁移目标图像的尺寸为1024*1024像素，可以将该待迁移目标图像从1024*1024像素还原到原始尺寸。

下面以待迁移目标图像是人脸图像，待迁移局部图像是人脸上的主要妆容区域对应的局部图像为例，对本公开实施例的整体流程进行说明。其中，主要妆容区域对应的局部图像可以包括左眉局部图像、右眉局部图像、左眼局部图像、右眼局部图像、鼻子局部图像和/或嘴巴局部图像，下面的实施例中以主要妆容区域对应的局部图像包括左眼局部图像、右眼局部图像和嘴巴局部图像为例进行说明。本公开实施例的妆容迁移方法的整体流程如下：

给定一张任意尺寸的原始图像，需要将原始图像中的人脸图像，以及人脸上的主要妆容区域对应的局部图像裁剪出来，并调整到指定的大小；准备这些数据，用于下一步的妆容迁移，包括步骤(1)至步骤(4)。

(1)对原始图像进行人脸关键点检测，获取关键点坐标以及人脸的位置信息和角度信息，基于人脸的位置信息和角度信息可以生成仿射矩阵。

(2)根据仿射矩阵可以从原始图像中裁剪出尺寸为1024*1024像素的人脸图像，其中人脸居中，人脸部分占据800*800像素的大小。

(3)在1024*1024像素的人脸图像中，根据上述人脸关键点，分别将左眼局部图像、右眼局部图像、嘴巴局部图像裁剪出来，并归一化成256*256像素的大小。

(4)分别对人脸图像、左眼局部图像、右眼局部图像和嘴巴局部图像执行妆容迁移，最后把上述四种图像的妆容迁移结果融合到一张图中。同时考虑到妆容迁移后的颜色与原始肤色不同，所以对用户的原始暴露的皮肤中未进行妆容迁移的区域(例如，脖子、耳朵)进行颜色迁移，以减少违和感，提升自然度。步骤(4)进一步包括步骤(4.1)至步骤(4.3)。

(4.1)基于(1)中得到的关键点以及迁移后的四张图像(即迁移后的人脸图像gen_face、迁移后的左眼局部图像gen_left_eye、迁移后的右眼局部图像gen_right_eye和迁移后的嘴巴局部图像gen_mouth)，可以绘制出人脸的局部区域的分割图，所述分割图中包括嘴巴局部图像、左眼局部图像、右眼局部图像。

(4.2)按照分割图，将迁移后的左眼局部图像gen_left_eye、迁移后的右眼局部图像gen_right_eye和迁移后的嘴巴局部图像gen_mouth融合到迁移后的人脸图像gen_face中，得到融合结果blend_face，融合算法可以采用拉普拉斯融合，也可以采用其他融合方式。

(4.3)基于(1)中得到的仿射矩阵的逆矩阵对融合结果blend_face进行仿射变换，使得融合结果blend_face从1024*1024像素还原到原始尺寸，得到最终的迁移结果，如图4所示。

本公开实施例的目标妆容迁移网络可以包括第一子网络和至少一个第二子网络，第一子网络和各个第二子网络均可以包括特征提取器和生成器。用于对左眼局部图像进行妆容迁移的第二子网络的训练框架如图5所示，其中，该第二子网络可以与判别器、眼皮属性分类器、妆容风格提取器(也称为特征提取器)进行联合训练。上述训练框架中的两个特征提取器具有相同的网络结构。其他的第二子网络以及第一子网络可以采用类似的训练框架进行训练，只需要将其中的眼皮属性分类器以及眼皮属性保持损失函数替换成相应的属性分类器以及属性保持损失函数即可，下面以用于对左眼局部图像进行妆容迁移的第二子网络的训练过程为例进行说明，其他子网络的训练过程可以参考该第二子网络的训练过程。训练过程包括步骤(1)至步骤(7)。

(1)从一整段单id视频中通过抽帧得到一组视频帧，根据这一组视频帧建立单id妆容数据集(即前述第一图像集)。其中，单id是指视频帧中包括的样本对象为id信息均相同的样本对象，且各个视频帧中的样本对象具有相同的妆容风格。根据视频时长的不等，一个视频中一般包含1000到5000张视频帧。可以按照一定的抽帧策略(例如，按照一定的帧数间隔，或者随机抽帧等)抽取指定数量的视频帧。可以采集不同id信息的未化妆素颜人脸的图像，并建立多id素颜数据集(即前述第二图像集)，多id素颜数据集中例如可以包括1.5万张图像，每张图像中都包括一张独立的未化妆素颜人脸。单id妆容数据集和多id素颜数据集中的每张图像都可以进行上述的人脸关键点检测、人脸裁剪、局部区域裁剪等处理。

(2)对第二子网络与判别器、眼皮属性分类器、妆容风格提取器进行联合训练。

(3)每次训练，从多id素颜数据集随机抽取一张左眼局部图像src_left_eye作为素颜图(即待迁移局部样本图像)，从单id妆容数据集随机抽取一张左眼局部图像作为左眼区域的参考局部样本图像，记为ref_left_eye。

(4)将参考局部样本图像ref_left_eye送入特征提取器，得到妆容特征(例如64*1的张量)。

(5)将左眼局部图像src_left_eye和妆容特征一起输入生成器，生成迁移后的图像gen_left_eye，它是将参考局部样本图像的妆容特征迁移到左眼局部图像上的迁移效果图，并具有该左眼局部图像对应的单双眼皮属性、眼睛大小形状等id信息，并且具有妆容图像的美瞳颜色、眼睫毛、眼影等妆容信息。

(6)对于迁移后的图像gen_left_eye，从以下四个方面进行监督，这是迁移训练算法的核心：

(6.1)判别器判别迁移后的图像是合成的图像，还是真的图像，从而建立对抗生成损失函数。对抗损失函数能够提升生成结果的逼真程度(即真实度)。

(6.2)眼皮属性保持损失函数，将迁移后的图像输入眼皮属性分类器进行分类，分类结果用于表示迁移后的图像中的眼皮属性是单眼皮还是双眼皮，由于期望用户的id信息不被改变，故而分类结果应该与素颜图的分类结果一致。

(6.3)风格一致损失函数，为了保证迁移后的妆容风格与参考妆容图像的妆容风格是一样的，会把迁移后的图像gen_left_eye也输入妆容风格提取器，得到64*1的妆容特征，这一特征应该与参考局部样本图像ref_left_eye得到的妆容特征相似。

(6.4)循环一致损失函数，把迁移后的图像gen_left_eye(生成图像)作为新的素颜图，素颜图左眼局部图像src_left_eye作为参考局部样本图像，新的素颜图再次通过图5中的迁移框架进行迁移，得到的结果应该跟素颜图左眼局部图像src_left_eye相似。

(7)对于其他的区域(整脸、嘴巴、右眼)，妆容迁移生成框架与上述左眼区域的妆容迁移生成框架类似。

可以由用户上传自己的照片至例如终端的处理器，使用本公开的妆容迁移方法，从而获得迁移后的用户照片。

本公开实施例具有以下优点：

(1)可以以一段妆容视频作为输入来训练目标妆容迁移网络，妆容视频中包括多帧视频帧，每帧视频帧中包括具有预设妆容风格的目标对象。这样，可以提高妆容迁移的细节度和还原度。

(2)训练过程中采用了局部区域的属性保持损失函数，保证用户的局部属性不被改变，从而提高了妆容迁移过程中用户id信息的保留度。例如，在局部区域为左眼区域的情况下，在图5的第二子网络的训练过程中采用了眼皮属性保持损失函数，如果待迁移局部样本图像经第二子网络进行妆容迁移后得到的生成图像中眼皮属性发生改变，则眼皮属性保持损失函数的取值较大；如果生成图像中眼皮属性未发生改变，则眼皮属性保持损失函数的取值较小。因此，可以通过调整第二子网络的网络参数值，使眼皮属性保持损失函数获得较小的取值。这样，提高了妆容迁移前后眼皮属性的保留度，从而提高了用户id信息的保留度。

(3)采用多id素颜数据集和单id妆容数据集作为样本数据，单id妆容数据集中的不同图像覆盖了在特定妆容下各种角度和表情下所呈现的视觉效果，多id素颜数据集中的不同图像覆盖了多种id信息的目标对象的属性信息，从而基于两种数据集训练出的目标妆容迁移网络，既能够学习出同一妆容风格的细微变化，又能够学习出不同id信息的细微变化。因此，可以兼顾用户id信息的保留度与妆容迁移的强度(即还原度)。

(4)采用局部图像与目标对象的完整图像共同进行妆容迁移以及目标妆容迁移网络的训练，通过采用局部图像，能够使目标妆容迁移网络更好地获取局部区域的妆容细节；通过采用完整图像，能够使目标妆容迁移网络更好地把握目标对象整体的妆容特征。因此，既能保证目标对象的自然度，同时又能保证关键妆容区域的高还原度。

综上所述，本公开实施例能够同时兼顾妆容迁移的细节还原度和id保留度，并覆盖各种情况的人脸图像，提高了妆容迁移的鲁棒性，且本公开实施例的妆容迁移不以牺牲任何一个维度的性能(还原度、id保留度、鲁棒性等)为代价。

参见图6，本公开实施例还提供一种妆容迁移方法，所述方法包括步骤601至步骤602。

步骤601：获取待迁移目标图像。

步骤602：通过预先训练的目标妆容迁移网络将预设妆容风格迁移到所述待迁移目标图像上，得到迁移目标图像。

所述目标妆容迁移网络通过采用多个视频帧中的每个视频帧以及所述每个视频帧对应的迁移样本图像对原始妆容迁移网络进行训练得到，所述多个视频帧中包括妆容风格相同的样本对象，一个视频帧对应的迁移样本图像为通过所述原始妆容迁移网络将所述视频帧中的样本对象的妆容风格迁移到待迁移样本图像上得到的图像。

本实施例的相关细节可参见前一实施例中的妆容迁移方法，此处不再赘述。

参见图7，本公开实施例还提供一种妆容迁移网络的训练方法，所述方法可包括步骤701至步骤704。

步骤701：获取待迁移样本图像和待迁移局部样本图像，所述待迁移样本图像中包括第二样本对象，所述待迁移局部样本图像中包括所述第二样本对象的局部区域。

步骤702：通过原始妆容迁移网络将参考样本图像中第一样本对象的妆容风格迁移到所述待迁移样本图像上，得到迁移样本图像。

步骤703：通过原始妆容迁移网络将参考局部样本图像中第一样本对象的妆容风格迁移到所述待迁移局部样本图像上，得到迁移局部样本图像，所述参考局部样本图像包括所述参考样本图像中第一样本对象的局部区域，且所述待迁移局部样本图像中包括的局部区域与参考局部样本图像中包括的局部区域相同。

步骤704：基于所述迁移样本图像和迁移局部样本图像对所述原始妆容迁移网络进行训练，得到目标妆容迁移网络。

上述训练方法的实施例中各步骤的细节详见前述妆容迁移方法中有关目标妆容迁移网络的训练过程的实施例，此处不再赘述。

参见图8，本公开实施例还提供一种妆容迁移网络的训练方法，所述方法可包括步骤801至步骤803。

步骤801：获取多个视频帧，所述多个视频帧中包括妆容风格相同的样本对象。

步骤802：针对所述多个视频帧中的每个视频帧，通过原始妆容迁移网络将该视频帧中的样本对象的妆容风格迁移到待迁移样本图像，得到该视频帧对应的迁移样本图像。

步骤803：基于所述多个视频帧中的各个视频帧以及所述各个视频帧分别对应的迁移样本图像对所述原始妆容迁移网络进行训练，得到目标妆容迁移网络。

本公开涉及增强现实领域，通过获取现实环境中的目标对象的图像信息，进而借助各类视觉相关算法实现对目标对象的相关特征、状态及属性进行检测或识别处理，从而得到与具体应用匹配的虚拟与现实相结合的AR效果。示例性的，目标对象可涉及与人体相关的脸部、肢体、手势、动作等，或者与物体相关的标识物、标志物，或者与场馆或场所相关的沙盘、展示区域或展示物品等。视觉相关算法可涉及视觉定位、SLAM、三维重建、图像注册、背景分割、对象的关键点提取及跟踪、对象的位姿或深度检测等。具体应用不仅可以涉及跟真实场景或物品相关的导览、导航、讲解、重建、虚拟效果叠加展示等交互场景，还可以涉及与人相关的特效处理，比如妆容美化、肢体美化、特效展示、虚拟模型展示等交互场景。可通过卷积神经网络，实现对目标对象的相关特征、状态及属性进行检测或识别处理。上述卷积神经网络是基于深度学习框架进行模型训练而得到的网络模型。

本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

如图9所示，本公开实施例还提供一种妆容迁移装置，所述装置包括：获取模块901，用于获取待迁移目标图像和待迁移局部图像，所述待迁移目标图像包括目标对象，所述待迁移局部图像上包括所述目标对象的局部区域；迁移模块902，用于通过目标妆容迁移网络将预设妆容风格迁移到所述待迁移目标图像上，得到迁移目标图像；通过所述目标妆容迁移网络将所述预设妆容风格迁移到所述待迁移局部图像上，得到迁移局部图像；融合模块903，用于对所述迁移目标图像和所述迁移局部图像进行融合，得到所述目标对象的妆容迁移结果。

如图10所示，本公开实施例还提供一种妆容迁移装置，所述装置包括：获取模块1001，用于获取待迁移目标图像；迁移模块1002，用于通过目标妆容迁移网络将预设妆容风格迁移到所述待迁移目标图像上，得到迁移目标图像；所述目标妆容迁移网络通过采用多个视频帧中的每个视频帧以及所述每个视频帧对应的迁移样本图像对原始妆容迁移网络进行训练得到，所述多个视频帧中包括妆容风格相同的样本对象，一个视频帧对应的迁移样本图像为通过所述原始妆容迁移网络将所述视频帧中的样本对象的妆容风格迁移到待迁移样本图像上得到的图像。

如图11所示，本公开实施例还提供一种妆容迁移网络的训练装置，所述装置包括：获取模块1101，用于获取待迁移样本图像和待迁移局部样本图像，所述待迁移样本图像中包括第二样本对象，所述待迁移局部样本图像中包括所述第二样本对象的局部区域；第一迁移模块1102，用于通过原始妆容迁移网络将参考样本图像中第一样本对象的妆容风格迁移到所述待迁移样本图像上，得到迁移样本图像；第二迁移模块1103，用于通过所述原始妆容迁移网络将参考局部样本图像中所述第一样本对象的妆容风格迁移到所述待迁移局部样本图像上，得到迁移局部样本图像，所述参考局部样本图像包括所述参考样本图像中所述第一样本对象的局部区域，且所述待迁移局部样本图像中包括的局部区域与所述参考局部样本图像中包括的局部区域相同；训练模块1104，用于基于所述迁移样本图像和迁移局部样本图像对所述原始妆容迁移网络进行训练，得到目标妆容迁移网络。

如图12所示，本公开实施例还提供一种妆容迁移网络的训练装置，所述装置包括：获取模块1201，用于获取多个视频帧，所述多个视频帧中包括妆容风格相同的样本对象；迁移模块1202，用于针对所述多个视频帧中的每个视频帧，通过原始妆容迁移网络将该视频帧中的样本对象的妆容风格迁移到待迁移样本图像，得到该视频帧对应的迁移样本图像；训练模块1203，用于基于所述多个视频帧中的各个视频帧以及所述各个视频帧分别对应的迁移样本图像对所述原始妆容迁移网络进行训练，得到目标妆容迁移网络。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

本说明书实施例还提供一种计算机设备，其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，处理器执行所述程序时实现前述任一实施例所述的方法。

图13示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图，该设备可以包括：处理器1301、存储器1302、输入/输出接口1303、通信接口1304和总线1305。其中处理器1301、存储器1302、输入/输出接口1303和通信接口1304通过总线1305实现彼此之间在设备内部的通信连接。

处理器1301可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。处理器1301还可以包括显卡，所述显卡可以是Nvidia titan X显卡或者1080Ti显卡等。

存储器1302可以采用ROM(Read Only Memory，只读存储器)、RAM(Random Access Memory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1302可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1302中，并由处理器1301来调用执行。

输入/输出接口1303用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1304用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1305包括一通路，在设备的各个组件(例如处理器1301、存储器1302、输入/输出接口1303和通信接口1304)之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器1301、存储器1302、输入/输出接口1303、通信接口1304以及总线1305，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。

本公开实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前述任一实施例所述的方法。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同或相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅是本说明书实施例的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本说明书实施例原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本说明书实施例的保护范围。

Claims

一种妆容迁移方法，包括：

获取待迁移目标图像和待迁移局部图像，所述待迁移目标图像包括目标对象，所述待迁移局部图像包括所述目标对象的局部区域；

通过目标妆容迁移网络将预设妆容风格迁移到所述待迁移目标图像上，得到迁移目标图像；

通过所述目标妆容迁移网络将所述预设妆容风格迁移到所述待迁移局部图像上，得到迁移局部图像；

对所述迁移目标图像和所述迁移局部图像进行融合，得到所述目标对象的妆容迁移结果。
根据权利要求1所述的方法，其中，获取所述待迁移局部图像，包括：

对所述目标对象的原始图像进行目标检测，确定所述原始图像中所述目标对象的关键点位置；

基于所述目标对象的关键点位置，从所述原始图像中裁剪出所述待迁移局部图像。
根据权利要求2所述的方法，其中，基于所述目标对象的关键点位置，从所述原始图像中裁剪出所述待迁移局部图像，包括：

基于所述目标对象的关键点位置，从所述原始图像中裁剪出第一预设尺寸的图像区域，所述第一预设尺寸小于所述目标对象的尺寸，且大于所述目标对象的局部区域的尺寸，所述目标对象的局部区域位于所述第一预设尺寸的图像区域中的第一预设位置处；

将所述第一预设尺寸的图像区域确定为所述待迁移局部图像。
根据权利要求1至3中任意一项所述的方法，其中，所述待迁移目标图像为实时采集的视频中的包括所述目标对象的图像，所述待迁移局部图像为从所述包括所述目标对象的图像中裁剪出的、包括所述目标对象的局部区域的局部图像。
根据权利要求1至4中任意一项所述的方法，其中，所述目标妆容迁移网络基于待迁移样本图像、待迁移局部样本图像、参考样本图像以及参考局部样本图像共同训练得到；

其中，所述参考样本图像包括具有所述预设妆容风格的第一样本对象；

所述待迁移样本图像包括具有除所述预设妆容风格以外的妆容风格的第二样本对象；

所述待迁移局部样本图像中包括所述待迁移样本图像中的第二样本对象的局部区域；

所述参考局部样本图像中包括所述参考样本图像中的第一样本对象的局部区域，且所述待迁移局部样本图像中包括的局部区域与参考局部样本图像中包括的局部区域相同。
根据权利要求5所述的方法，其中，所述参考样本图像从第一图像集中选取，所述第一图像集中包括多张图像，所述第一图像集中的每张图像包括具有所述预设妆容风格的相同的第一样本对象；

所述待迁移样本图像从第二图像集中选取，所述第二图像集中包括多张图像，所述第二图像集中的每张图像包括具有除所述预设妆容风格以外的妆容风格的第二样本对象，且所述第二图像集中的至少两张图像中包括的第二样本对象不同。
根据权利要求5或6所述的方法，其中，所述参考样本图像包括样本视频中的多个视频帧，所述样本视频中的多个视频帧中的每个视频帧均包括具有所述预设妆容风格的第一样本对象。
根据权利要求1至7中任意一项所述的方法，其中，所述目标妆容迁移网络包括第一子网络和第二子网络；

所述第一子网络用于将所述预设妆容风格迁移到所述待迁移目标图像上；

所述第二子网络用于将所述预设妆容风格迁移到所述待迁移局部图像上。
根据权利要求1至8中任意一项所述的方法，其中，对所述迁移目标图像和所述迁移局部图像进行融合，得到所述目标对象的妆容迁移结果，包括：

对所述迁移目标图像进行语义分割，得到所述迁移目标图像中所述局部区域的位置；

基于所述迁移目标图像中所述局部区域的位置将所述迁移局部图像融合到所述迁移目标图像中，得到所述目标对象的妆容迁移结果。
根据权利要求1至9中任意一项所述的方法，其中，在对所述迁移目标图像和所述迁移局部图像进行融合之后，所述方法还包括：

获取所述目标对象迁移后的颜色；

基于所述目标对象迁移后的颜色对所述目标对象上未进行妆容迁移的区域的颜色进行调整。
一种妆容迁移网络的训练方法，包括：

获取待迁移样本图像和待迁移局部样本图像，所述待迁移样本图像中包括第二样本对象，所述待迁移局部样本图像中包括所述第二样本对象的局部区域；

通过原始妆容迁移网络将参考样本图像中第一样本对象的妆容风格迁移到所述待迁移样本图像上，得到迁移样本图像；

通过所述原始妆容迁移网络将参考局部样本图像中所述第一样本对象的妆容风格迁移到所述待迁移局部样本图像上，得到迁移局部样本图像，所述参考局部样本图像包括所述参考样本图像中所述第一样本对象的局部区域，且所述待迁移局部样本图像中包括的局部区域与所述参考局部样本图像中包括的局部区域相同；

基于所述迁移样本图像和所述迁移局部样本图像对所述原始妆容迁移网络进行训练，得到目标妆容迁移网络。
根据权利要求11所述的方法，其中，基于所述迁移样本图像和所述迁移局部样本图像对所述原始妆容迁移网络进行训练，包括：

基于所述迁移样本图像建立第一损失函数；

基于所述迁移局部样本图像建立第二损失函数；

基于所述第一损失函数和所述第二损失函数对所述原始妆容迁移网络进行训练，得到所述目标妆容迁移网络。
根据权利要求12所述的方法，其中，所述目标妆容迁移网络包括第一子网络和第二子网络，所述第一子网络用于将所述预设妆容风格迁移到所述待迁移目标图像上，所述第二子网络用于将所述预设妆容风格迁移到所述待迁移局部图像上；

基于所述第一损失函数和所述第二损失函数对所述原始妆容迁移网络进行训练，包括：

基于所述第一损失函数对原始第一子网络进行训练，得到所述第一子网络；

基于所述第二损失函数对原始第二子网络进行训练，得到所述第二子网络。
根据权利要求13所述的方法，其中，用于训练子网络的损失函数包括以下至少一者：

用于表征所述子网络的输出图像的真实度损失的损失函数；

用于表征所述子网络的输出图像与输入所述子网络的待迁移图像之间的属性相似度损失的损失函数；

用于表征所述子网络的输出图像与输入所述子网络的参考图像之间的妆容相似度损失的损失函数；

用于表征目标样本图像与输入所述子网络的待迁移图像之间的相似度损失的损失函数；所述目标样本图像通过将输入所述子网络的待迁移图像上的妆容风格迁移到所述子网络的输出图像上得到；

所述子网络为所述第一子网络或所述第二子网络。
根据权利要求11至14中任意一项所述的方法，其中，所述参考样本图像包括视频中的多个视频帧，每张参考局部样本图像包括一个视频帧中的第一样本对象的局部区域，所述多个视频帧的各个视频帧中包括的第一样本对象相同，且具有相同的妆容风格。
根据权利要求11至15中任意一项所述的方法，其中，所述待迁移样本图像的数量大于1，至少两张待迁移样本图像中的第二样本对象为不同的对象，每张待迁移局部样本图像包括一张待迁移样本图像中的第二样本对象的局部区域。
一种妆容迁移装置，包括：

获取模块，用于获取待迁移目标图像和待迁移局部图像，所述待迁移目标图像包括目标对象，所述待迁移局部图像包括所述目标对象的局部区域；

迁移模块，用于通过目标妆容迁移网络将预设妆容风格迁移到所述待迁移目标图像上，得到迁移目标图像；并用于通过所述目标妆容迁移网络将所述预设妆容风格迁移到所述待迁移局部图像上，得到迁移局部图像；

融合模块，用于对所述迁移目标图像和所述迁移局部图像进行融合，得到所述目标对象的妆容迁移结果。
一种妆容迁移网络的训练装置，包括：

获取模块，用于获取待迁移样本图像和待迁移局部样本图像，所述待迁移样本图像中包括目标对象，所述待迁移局部样本图像中包括所述目标对象的局部区域；

第一迁移模块，用于通过原始妆容迁移网络将参考样本图像中目标对象的妆容风格迁移到所述待迁移样本图像上，得到迁移样本图像；

第二迁移模块，用于通过所述原始妆容迁移网络将参考局部样本图像中目标对象的妆容风格迁移到所述待迁移局部样本图像上，得到迁移局部样本图像，所述参考局部样本图像包括所述参考样本图像中目标对象的局部区域，且所述待迁移局部样本图像中包括的局部区域与参考局部样本图像中包括的局部区域相同；

训练模块，用于基于所述迁移样本图像和迁移局部样本图像对所述原始妆容迁移网络进行训练，得到目标妆容迁移网络。
一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现权利要求1至16任意一项所述的方法。
一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至16任意一项所述的方法。
一种计算机程序产品，所述产品包括计算机程序，所述计算机程序在由处理器执行时实现权利要求1至16任意一项所述的方法。