WO2022088750A1

WO2022088750A1 - 图像生成方法和电子设备

Info

Publication number: WO2022088750A1
Application number: PCT/CN2021/105334
Authority: WO
Inventors: 申婷婷; 赵松涛; 郭益林; 宋丛礼
Original assignee: 北京达佳互联信息技术有限公司
Priority date: 2020-10-29
Filing date: 2021-07-08
Publication date: 2022-05-05
Also published as: CN112669198A

Abstract

本公开关于一种图像生成方法、装置、电子设备及存储介质，所述方法包括：获取目标图像，所述目标图像包含第一目标对象；从所述目标图像中获取所述第一目标对象的二维关键点的位置信息；基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述第一目标对象的三维模型投影至目标区域，生成特效图像，所述目标区域为所述第一目标对象在所述目标图像中所在的区域，所述三维关键点为所述第一目标对象的三维模型中与所述二维关键点对应的关键点。

Description

图像生成方法和电子设备

本公开要求于2020年10月29日提交、申请号为202011199693.3、发明名称为“图像特效的处理方法、装置、电子设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及图像处理技术领域，尤其涉及一种图像生成方法和电子设备。

背景技术

虚拟美甲是短视频应用程序或者相机应用程序的一项新功能，虚拟美甲指对图像中的指甲进行美化处理。相关技术中，目前的虚拟美甲方案通常对二维图像中的二维指甲进行美化处理。

发明内容

本公开提供了一种图像生成方法和电子设备，本公开的技术方案如下：

一方面，提供了一种图像生成方法，包括：

获取目标图像，所述目标图像包含第一目标对象；

从所述目标图像中获取所述第一目标对象的二维关键点的位置信息；

基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述三维模型投影至目标区域，生成特效图像，所述目标区域为所述第一目标对象在所述目标图像中所在的区域，所述三维关键点为所述第一目标对象的三维模型中与所述二维关键点对应的关键点。

一方面，提供了一种图像生成装置，包括：

获取模块，被配置为获取目标图像，所述目标图像包含第一目标对象；

位置信息获取模块，被配置为从所述目标图像中获取所述第一目标对象的二维关键点的位置信息；

图像生成模块，被配置为基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述三维模型投影至目标区域，生成特效图像，所述目标区域为所述第一目标对象在所述目标图像中所在的区域，所述三维关键点为所述第一目标对象的三维模型中与所述二维关键点对应的关键点。

一方面，提供了一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为所述指令，以执行下述步骤：

获取目标图像，所述目标图像包含第一目标对象；

一方面，提供了一种存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行下述步骤：

获取目标图像，所述目标图像包含第一目标对象；

一方面，提供了一种计算机程序产品，包括可读性程序代码，所述可读性程序代码可由电子设备的处理器执行下述步骤：

获取目标图像，所述目标图像包含第一目标对象；

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是一种图像生成方法的流程图。

图2a是一种指甲的上妆方案的示意图。

图2b是一种指甲的上妆方案中将三维模型投影到目标图像的流程示意图。

图3a是一种指甲的上妆方案中的目标图像。

图3b是一种指甲的上妆方案中的手部区域。

图3c是一种指甲的上妆方案中的利用指甲分割模型对手部区域进行语义分割的分割结果示意图。

图3d是一种指甲的上妆方案中的利用指甲分割模型对手部区域进行语义分割的分割结果合成图。

图3e是一种指甲的上妆方案中的指甲区域。

图3f是一种指甲的上妆方案中的指甲的关键点示意图。

图3g是一种指甲的上妆方案中的三维模型的俯视图。

图3h是一种指甲的上妆方案中的三维模型投影到指甲区域上的效果图。

图3i和图3j是一种指甲的上妆方案中的两种上妆效果图。

图4是一种图像生成装置的框图。

图5是一种图像生成电子设备的框图。

图6是一种用于对图像特效进行处理的电子设备的框图。

具体实施方式

图1是一种图像生成方法的流程图，如图1所示，该图像生成方法可以应用于终端或者服务器，在下述说明过程中，以该图像生成方法应用于终端为例。该图像生成方法包括以下步骤。

S11、获取目标图像，目标图像包含第一目标对象。

也即是获取包含第一目标对象的目标图像，在一些实施例中，目标图像也被称为待处理图像，目标图像可以理解为二维目标图像，也即是目标图像为一个平面图像。

在一些实施例中，第一目标对象为指甲，指甲包含手指甲和脚趾甲。除此之外，第一目标对象还可以为眼球、睫毛或者嘴唇等等，本公开实施例对此不做限定，在下述说明过程中，以第一目标对象为指甲为例进行说明。在一些实施例中，目标图像中可以包含一个或多个第一目标对象。

在一些实施例中，在本公开实施例提供的图像生成方法应用在直播场景的情况下，目标图像也即是直播图像，直播图像包括主播，第一目标对象也即是主播的指甲。在直播过程中，终端通过拍摄设备，比如终端自带的摄像头或者外接摄像头来获取直播图像，该终端也即是主播直播时使用的终端。另外，若本公开实施例提供的图像生成方法应用于服务器，那么终端通过拍摄设备获取直播图像，将直播图像发送给服务器，服务器获取直播图像。

在一些实施例中，在本公开实施例提供的图像生成方法应用在短视频的情况下，目标图像也即是短视频的视频帧，视频帧包括人物，第一目标对象也即是该人物的指甲。在短视频的拍摄过程中，终端能够通过拍摄设备，比如终端自带的摄像头或者外接摄像头来拍摄短视频。另外，若本公开实施例提供的图像生成方法应用于服务器，那么终端通过拍摄设备拍摄短视频，将拍摄完成的短视频发送给服务器，服务器获取短视频，从该短视频中获取视频帧。

S12、从目标图像中获取第一目标对象的二维关键点的位置信息。

在一些实施例中，终端先从目标图像中分割出第一目标对象，然后对第一目标对象进行处理，以获取二维关键点的位置信息。在一些实施例中，二维关键点为目标图像中，第一目标对象的边界点或者角点等，本公开实施例对此不做限定。

在一些实施例中，终端从目标图像中获取第一目标对象的二维关键点的位置信息时，将目标图像输入分割模型，确定目标区域，该目标区域也即是包含第一目标对象的区域。在一些实施例中，目标区域为包含第一目标对象的最小外包矩形的区域，也即是，目标区域为一个矩形区域，该矩形区域与第一目标对象的边界相切。终端将目标区域输入关键点回归模型，确定二维关键点的位置信息。

在一些实施例中，分割模型包括第一分割子模型和第二分割子模型，第一分割子模型和第二分割子模型均为预先训练完毕的模型，在一些实施例中，第一分割子模型用于从目标图像中分割出候选区域，第二分割模型用于从候选区域中分割出目标区域，也即是，在从目标图像确定目标区域时，采用的是多级分割的方法。

在一些实施例中，终端将目标图像输入第一分割子模型，通过第一分割子模型对目标图像进行语义分割，得到候选区域，候选区域包括第二目标对象，第一目标对象属于第二目标对象。终端将候选区域输入第二分割子模型，通过第而分割子模型对候选区域进行语义分割，得到目标区域。

举例来说，终端将目标图像输入第一分割子模型，通过第一分割子模型对目标图像进行语义分割，得到第一区域分割掩码，在一些实施例中，第一区域分割掩码为一张第一掩码图像，该第一掩码图像的尺寸与目标图像相同，该第一掩码图像为一个二值图像，像素点的像素值为0或者1,第一掩码图像的像素点与目标图像的像素点一一对应。终端根据第一区域分割掩码从目标图像中分割得到候选区域，也即是终端将目标图像与第一掩码图像相乘，得到候选区域，在相乘过程中，若第一掩码图像的一个像素点的像素值为1，那么目标图像对应像素点相乘后也就能够保留原本的像素值；若第一掩码图像的一个像素点的像素值为0，那么目标图像对应像素点相乘后也就为0，最终保留原本像素值的区域，也即是候选区域。终端将候选区域输入第二分割子模型，通过第二分割子模型对候选区域进行语义分割，得到第二区域分割掩码。终端根据第二区域分割掩码从候选区域中分割得到目标区域。终端将目标区域输入关键点回归模型，通过关键点回归模型对目标区域进行特征提取，得到目标区域的区域特征，基于目标区域的区域特征，获取第一目标对象的二维关键点的位置信息。

其中，第二目标对象包括第一目标对象，若第一目标对象为指甲，那么第二目标对象为手或者脚，相应的，候选区域也即是包括手或者脚的区域，在一些实施例中，终端通过第一分割子模型对目标图像进行语义分割，得到手部区域，也即是候选区域。终端通过第二分割子模型对手部区域进行语义分割，得到指甲区域，也即是目标区域。终端通过关键点回归模型，提取指甲区域中的每个指甲的二维关键点的位置信息。

通过第一分割子模型和第二分割子模型将目标图像逐级语义分割为目标区域，再通过关键点回归模型从目标区域中提取出二维关键点的位置信息。将目标图像逐级分割为目标区域，提升了第一目标对象的二维关键点提取的准确率。

在一些实施例中，为了使得上述分割模型和关键点回归模型的输出项更加稳定，终端将目标图像输入分割模型，得到第一初始区域，第一初始区域包括第一目标对象。终端对第一初始区域进行时序平滑处理，得到目标区域。终端将目标区域输入关键点回归模型，确定第一目标对象的初始二维关键点的位置信息，对初始二维关键点的位置信息进行光流稳定处理得到二维关键点的位置信息。

举例来说，终端通过第一分割子模型对目标图像进行语义分割，得到候选区域对应的第二初始区域，终端对第二初始区域进行时序平滑处理，得到候选区域。终端通过第二分割子模型对候选区域进行语义分割，得到目标区域对应的第一初始区域，终端对第一初始区域进行时序平滑处理得到目标区域。终端在获取二维关键点的位置信息时，根据关键点回归模型和光流算法对目标区域进行特征提取，得到二维关键点的位置信息。在一些实施例中，光流算法可以采用Lucas-Kanade光流算法(一种两帧差分的光流估计算法)。通过时序平滑处理可以对分割模型的输出项，也即是对目标区域的稳定性进行增强。通过光流算法可以对关键点回归模型的输出项，也即是对二维关键点的位置信息的稳定性进行增强。

S13、基于二维关键点的位置信息，以及第一目标对象的三维关键点的位置信息，将第一目标对象的三维模型投影至目标区域，生成特效图像，目标区域为第一目标对象在目标图像中所在的区域，三维关键点为三维模型中与二维关键点对应的关键点。

在一些实施例中，三维模型为已经训练完毕的模型，本公开的实施例对三维模型的训练过程不做限定。在一些实施例中，若第一目标对象为指甲，那么三维模型也即是指甲的三维模型。在一些实施例中，终端通过三维重建的方法来得到三维模型。

在一些实施例中，二维关键点的位置信息在三维模型中的三维关键点的位置信息可以为预先设定的关键点的位置信息。其中，一个二维关键点在三维模型中对应一个三维关键点。结合二维关键点的位置信息和三维关键点的位置信息，终端基于二维关键点在目标图像中的位置与三维关键点在三维模型中的位置的对应关系，能够将三维模型投影到第一目标对象在目标图像的目标区域上。

在一些实施例中，终端在将三维模型投影到第一目标对象在目标图像的目标区域上时，可以利用N点透视(Perspective NPoint，PNP)算法，基于二维关键点的位置信息和三维关键点的位置信息，确定相机的外参矩阵，相机为拍摄目标图像的相机。

其中，PNP算法的目的是求解三维-二维点对运动的方法。简单来说，就是在已知n个三维空间点坐标(相对于某个指定的坐标系A)及其二维投影位置的情况下，如何估计相机的位姿(即相机在坐标系A下的位置和姿态)。相机的外参矩阵用于描述相机在静态场景下的运动，或者在相机固定时，运动物体的刚性运动。在一些实施例中，相机的外参矩阵包含旋转矩阵和平移矩阵，其中，旋转矩阵描述了世界坐标系的坐标轴相对于相机坐标轴的方向，平移矩阵描述了相机坐标系下空间原点的位置。在一些实施例中，由于指甲的关键点的数量较少，因此终端采用P3P算法(即N＝3)来生成相机的外参矩阵。终端基于相机的外参矩阵和相机的内参矩阵，将三维模型投影到第一目标对象在目标图像的目标区域上，得到特效图像。

其中，相机的内参矩阵由相机的硬件结构决定，包含相机的焦距、主点偏移等。相机的主轴是与图像平面垂直且穿过真空的线，主轴与图像平面的焦点称为主点。主点偏移就是主点位置相对于图像平面的位置。在一些实施例中，终端可以借助blender(是一款开源的跨平台全能三维动画制作软件，提供从建模、动画、材质、渲染、到音频处理、视频剪辑等一系列动画短片制作解决方案)工具将三维模型投影到第一目标对象在目标图像的目标区域，得到特效图像。终端根据相机的内参矩阵和计算得到的相机的外参矩阵将三维模型投影到第一目标对象在目标图像的目标区域上，可以保证三维模型投影到目标区域的准确程度。

在一些实施例中，终端基于二维关键点的位置信息，以及第一目标对象的三维关键点的位置信息，将三维模型投影至目标区域，得到投影区域。终端对投影区域进行特效处理，得到特效图像。

在一些实施例中，投影区域包含第一目标对象，而且，第一目标对象在投影区域中以三维的形式存在，也即是以第一目标对象的三维模型的形式存在。对投影区域进行特效处理可以理解为对三维形式存在的第一目标对象进行美化处理，也即是对第一目标对象的三维模型进行美化处理，比如改变三维模型的渲染参数等，特效图像即包含美化后的三维的第一目标对象的图像。在一些实施例中，美化处理可以包含更换第一目标对象颜色、更换第一目标对象图案等等，也即是对三维模型的渲染参数中的渲染颜色，渲染纹理进行调整，本公开的实施例对美化处理的内容和采用的技术手段等不做具体限制。

在一些实施例中，在上述实施例的基础上，终端能够对投影区域进行微调，以保证三维模型与目标区域的匹配效果。终端从目标图像中获取第一目标对象的掩膜区域，掩膜区域用于指示第一目标对象在目标图像中的位置。终端基于掩膜区域，对投影区域中三维模型的投影位置进行调整，得到调整后的投影区域。终端对调整后的投影区域进行特效处理，得到特效图像。，其中，掩膜是由0和1组成的一个二进制图像。当在某一功能中应用掩模时，1值区域被处理，被屏蔽的0值区域不被包括在计算中。通过指定的数据值、数据范围、有限或无限值、感兴趣区和注释文件来定义图像掩模，也可以应用上述选项的任意组合作为输入来建立掩模。

本公开实施例结合第一目标对象的二维关键点的位置信息，以及，三维模型中对应的三维关键点的位置信息，将三维模型投影到目标图像的目标区域上，进而对目标区域进行特效处理。首先通过获取第一目标对象的二维关键点的位置信息和三维关键点的位置信息，然后基于二维关键点的位置信息和三维关键点的位置信息将第一目标对象的三维模型投影到目标图像的目标区域上，提高了第一目标对象在目标图像中的真实度。

在一些实施例中，终端可以将目标图像的目标区域替换为投影区域，得到最终效果图像。可选地，终端可以进一步对最终效果图像进行微调。在实际应用中，可以在最终效果图像中提取出第一目标对象的掩膜区域，掩膜区域可以理解为包含掩膜所在的图像，其中，掩膜是由0和1组成的一个二进制图像。当在某一功能中应用掩模时，1值区域被处理，被屏蔽的0值区域不被包括在计算中。通过指定的数据值、数据范围、有限或无限值、感兴趣区和注释文件来定义图像掩模，也可以应用上述选项的任意组合作为输入来建立掩模。将掩膜区域与第一目标对象在最终效果图像中的位置相匹配，使得三维模型遮挡第一目标对象的情况具有更好的鲁棒性。

基于上述关于一种图像生成方法的实施例的相关说明，下面介绍一种指甲的上妆方案，如图2a所示，该指甲的上妆方案可以涉及到手部分割模型、指甲分割模型和指甲关键点回归模型。利用手部分割模型对包含指甲的目标图像进行人手语义分割得到手部区域。利用指甲分割模型对手部区域进行指甲语义分割得到指甲区域。利用指甲关键点回归模型提取出指甲区域中每个指甲的关键点坐标。再运用PNP算法和blender工具等对指甲进行上妆，将上妆后的指甲替换或者覆盖目标图像中的指甲得到最终的美甲图像。

如图2b所示，示出了一种指甲的上妆方案中将三维模型投影到目标图像的流程示意图。根据目标图像中指甲的关键点坐标和三维模型中对应的关键点坐标，并利用P3P算法生成相机的外参矩阵。再根据相机的外参矩阵、相机的内参矩阵和三维模型，借助于blender工具将三维模型投影到指甲在目标图像的指甲区域上。

参照图3a至图3j示出了一种指甲的上妆方案中各示意图，图3a示出了目标图像，该目标图像中包含了指甲。图3b示出了手部区域。图3c示出了利用指甲分割模型对手部区域进行语义分割的分割结果示意图，图3d示出了利用指甲分割模型对手部区域进行语义分割的分割结果合成图。图3e示出了指甲区域。图3f示出了指甲的关键点示意图，关键点分别为“0”、“1”、“2”和“3”。图3g示出了三维模型的俯视图。图3h示出了三维模型投影到指甲区域上的效果图。图3i和图3j示出了两种上妆效果图。

图4是一种图像生成装置的框图。该图像生成装置可以应用于终端或者服务器中，该图像生成装置具体可以包括如下模块。

获取模块41，被配置为获取目标图像，目标图像包含第一目标对象。

位置信息获取模块42，被配置为从目标图像中获取第一目标对象的二维关键点的位置信息。

图像生成模块43，被配置为基于二维关键点的位置信息，以及第一目标对象的三维关键点的位置信息，将第一目标对象的三维模型投影至目标区域，生成特效图像，目标区域为第一目标对象在目标图像中所在的区域，三维关键点为第一目标对象的三维模型中与二维关键点对应的关键点。

在一些实施例中，图像生成模块43，包括：

外参矩阵确定单元，被配置为基于二维关键点的位置信息和三维关键点的位置信息，确定相机的外参矩阵，相机为拍摄目标图像的相机。

模型投影单元，被配置为基于相机的外参矩阵和相机的内参矩阵，将三维模型投影至目标区域，生成特效图像。

在一些实施例中，图像生成模块43，被配置为基于二维关键点的位置信息，以及第一目标对象的三维关键点的位置信息，将三维模型投影至目标区域，得到投影区域。对投影区域进行特效处理，得到特效图像。

在一些实施例中，装置还包括微调模块，被配置为从目标图像中获取第一目标对象的掩膜区域，掩膜区域用于指示第一目标对象在目标图像中的位置。基于掩膜区域，对投影区域中三维模型的投影位置进行调整，得到调整后的投影区域。

图像生成模块43，还被配置为对调整后的投影区域进行特效处理，得到特效图像。

在一些实施例中，位置信息获取模块42，包括：

分割单元，被配置为将目标图像输入分割模型，确定目标区域。

回归单元，被配置为将目标区域输入关键点回归模型，确定二维关键点的位置信息。

在一些实施例中，分割模型包括第一分割子模型和第二分割子模型，分割单元，被配置为将目标图像输入第一分割子模型，通过第一分割子模型对目标图像进行语义分割，得到候选区域，候选区域包括第二目标对象，第一目标对象属于第二目标对象。将候选区域输入第二分割子模型，通过第而分割子模型对候选区域进行语义分割，得到目标区域。

在一些实施例中，分割单元，被配置为将目标图像输入分割模型，得到第一初始区域，第一初始区域包括第一目标对象。对第一初始区域进行时序平滑处理，得到目标区域。

在一些实施例中，回归单元，被配置为将目标区域输入关键点回归模型，得到第一目标对象的初始二维关键点的位置信息。对初始二维关键点的位置信息进行光流稳定处理，得到二维关键点的位置信息。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图5是一种图像生成电子设备的框图。例如，电子设备500可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图5，电子设备500可以包括以下一个或多个组件：处理组件502，存储器504，电力组件506，多媒体组件508，音频组件510，输入/输出(I/O)的接口512，传感器组件514，以及通信组件516。

处理组件502通常控制电子设备500的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令，以完成上述图像生成方法的全部或部分步骤。此外，处理组件502可以包括一个或多个模块，便于处理组件502和其他组件之间的交互。例如，处理组件502可以包括多媒体模块，以方便多媒体组件508和处理组件502之间的交互。

存储器504被配置为存储各种类型的数据以支持在电子设备500的操作。这些数据的示例包括用于在电子设备500上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图像，视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件506为电子设备500的各种组件提供电力。电源组件506可以包括电源管理系统，一个或多个电源，及其他与为电子设备500生成、管理和分配电力相关联的组件。

多媒体组件508包括在所述电子设备500和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件508包括一个前置摄像头和/或后置摄像头。当电子设备500处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件510被配置为输出和/或输入音频信号。例如，音频组件510包括一个麦克风(MIC)，当电子设备500处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504 或经由通信组件516发送。在一些实施例中，音频组件510还包括一个扬声器，用于输出音频信号。

I/O接口412为处理组件502和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件514包括一个或多个传感器，用于为电子设备500提供各个方面的状态评估。例如，传感器组件514可以检测到电子设备500的打开/关闭状态，组件的相对定位，例如所述组件为电子设备500的显示器和小键盘，传感器组件514还可以检测电子设备500或电子设备500一个组件的位置改变，用户与电子设备500接触的存在或不存在，电子设备500方位或加速/减速和电子设备500的温度变化。传感器组件514可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件514还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件516被配置为便于电子设备500和其他设备之间有线或无线方式的通信。电子设备500可以接入基于通信标准的无线网络，如WiFi，运营商网络(如2G、3G、4G或5G)，或它们的组合。在一个示例性实施例中，通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件516还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，电子设备500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述图像生成方法。

在示例性实施例中，还提供了一种包括指令的存储介质，例如包括指令的存储器504，上述指令可由电子设备500的处理器520执行以完成上述图像生成方法。在一些实施例中，存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品，该计算机程序产品包括可读性程序代码，该可读性程序代码可由电子设备500的处理器520执行以完成上述图像生成方法。在一些实施例中，该程序代码可以存储在电子设备500的存储介质中，该存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

图6是一种用于对图像特效进行处理的电子设备的框图。例如，电子设备600可以被提供为一服务器。参照图6，电子设备600包括处理组件622，其进一步包括一个或多个处理器，以及由存储器632所代表的存储器资源，用于存储可由处理组件622的执行的指令，例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件622被配置为指令，以执行上述图像生成方法。

电子设备600还可以包括一个电源组件626被配置为电子设备600的电源管理，一个有线或无线网络接口650被配置为将电子设备600连接到网络，和一个输入输出(I/O)接口658。电子设备600可以操作基于存储在存储器632的操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

Claims

一种图像生成方法，包括：

获取目标图像，所述目标图像包含第一目标对象；

从所述目标图像中获取所述第一目标对象的二维关键点的位置信息；

基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述第一目标对象的三维模型投影至目标区域，生成特效图像，所述目标区域为所述第一目标对象在所述目标图像中所在的区域，所述三维关键点为所述三维模型中与所述二维关键点对应的关键点。
根据权利要求1所述的方法，其中，所述基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述第一目标对象的三维模型投影至目标区域，生成特效图像，包括：

基于所述二维关键点的位置信息和所述三维关键点的位置信息，确定相机的外参矩阵，所述相机为拍摄所述目标图像的相机；

基于所述相机的外参矩阵和所述相机的内参矩阵，将所述三维模型投影至所述目标区域，生成所述特效图像。
根据权利要求1所述的方法，其中，所述基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述第一目标对象的三维模型投影至目标区域，生成特效图像，包括：

基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述三维模型投影至所述目标区域，得到投影区域；

对所述投影区域进行特效处理，得到所述特效图像。
根据权利要求3所述的方法，其中，所述方法还包括：

从所述目标图像中获取所述第一目标对象的掩膜区域，所述掩膜区域用于指示所述第一目标对象在所述目标图像中的位置；

基于所述掩膜区域，对所述投影区域中所述三维模型的投影位置进行调整，得到调整后的所述投影区域；

所述对所述投影区域进行特效处理，得到所述特效图像包括：

对所述调整后的所述投影区域进行特效处理，得到所述特效图像。
根据权利要求1所述的方法，其中，所述从所述目标图像中获取所述第一目标对象的二维关键点的位置信息，包括：

将所述目标图像输入分割模型，确定所述目标区域；

将所述目标区域输入关键点回归模型，确定所述二维关键点的位置信息。
根据权利要求5所述的方法，其中，所述分割模型包括第一分割子模型和第二分割子模型，所述将所述目标图像输入分割模型，确定所述目标区域，包括：

将所述目标图像输入所述第一分割子模型，通过所述第一分割子模型对所述目标图像进行语义分割，得到候选区域，所述候选区域包括第二目标对象，所述第一目标对象属于所述第二目标对象；

将所述候选区域输入所述第二分割子模型，通过所述第而分割子模型对所述候选区域进行语义分割，得到所述目标区域。
根据权利要求5所述的方法，其中，所述将所述目标图像输入分割模型，确定所述目标区域，包括：

将所述目标图像输入所述分割模型，得到第一初始区域，所述第一初始区域包括所述第一目标对象；

对所述第一初始区域进行时序平滑处理，得到所述目标区域。
根据权利要求5所述的方法，其中，所述将所述目标区域输入关键点回归模型，确定所述二维关键点的位置信息，包括：

将所述目标区域输入所述关键点回归模型，得到所述第一目标对象的初始二维关键点的位置信息；

对所述初始二维关键点的位置信息进行光流稳定处理，得到所述二维关键点的位置信息。
一种图像生成装置，包括：

获取模块，被配置为获取目标图像，所述目标图像包含第一目标对象；

位置信息获取模块，被配置为从所述目标图像中获取所述第一目标对象的二维关键点的位置信息；

图像生成模块，被配置为基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述第一目标对象的三维模型投影至目标区域，生成特效图像，所述目标区域为所述第一目标对象在所述目标图像中所在的区域，所述三维关键点为所述第一目标对象的三维模型中与所述二维关键点对应的关键点。
根据权利要求9所述的装置，其中，所述图像生成模块，包括：

外参矩阵确定单元，被配置为基于所述二维关键点的位置信息和所述三维关键点的位置信息，确定相机的外参矩阵，所述相机为拍摄所述目标图像的相机；

模型投影单元，被配置为基于所述相机的外参矩阵和所述相机的内参矩阵，将所述三维模型投影至所述目标区域，生成所述特效图像。
根据权利要求9所述的装置，其中，所述图像生成模块，被配置为基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述三维模型投影至所述目标区域，得到投影区域；对所述投影区域进行特效处理，得到所述特效图像。
根据权利要求9所述的装置，其中，所述装置还包括微调模块，被配置为从所述目标图像中获取所述第一目标对象的掩膜区域，所述掩膜区域用于指示所述第一目标对象在所述目标图像中的位置；基于所述掩膜区域，对所述投影区域中所述三维模型的投影位置进行调整，得到调整后的所述投影区域；

所述图像生成模块，还被配置为对所述调整后的所述投影区域进行特效处理，得到所述特效图像。
根据权利要求9所述的装置，其中，所述位置信息获取模块，包括：

分割单元，被配置为将所述目标图像输入分割模型，确定所述目标区域；

回归单元，被配置为将所述目标区域输入关键点回归模型，确定所述二维关键点的位置信息。
根据权利要求13所述的装置，其中，所述分割模型包括第一分割子模型和第二分割子模型，所述分割单元，被配置为将所述目标图像输入所述第一分割子模型，通过所述第一分割子模型对所述目标图像进行语义分割，得到候选区域，所述候选区域包括第二目标对象，所述第一目标对象属于所述第二目标对象；将所述候选区域输入所述第二分割子模型，通过所述第而分割子模型对所述候选区域进行语义分割，得到所述目标区域。
根据权利要求13所述的装置，其中，所述分割单元，被配置为将所述目标图像输入所述分割模型，得到第一初始区域，所述第一初始区域包括所述第一目标对象；对所述第一初始区域进行时序平滑处理，得到所述目标区域。
根据权利要求13所述的装置，其中，所述回归单元，被配置为将所述目标区域输入所述关键点回归模型，得到所述第一目标对象的初始二维关键点的位置信息；对所述初始二维关键点的位置信息进行光流稳定处理，得到所述二维关键点的位置信息。
一种电子设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为所述指令，以执行下述步骤：

获取目标图像，所述目标图像包含第一目标对象；

从所述目标图像中获取所述第一目标对象的二维关键点的位置信息；

基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述第一目标对象的三维模型投影至目标区域，生成特效图像，所述目标区域为所述第一目标对象在所述目标图像中所在的区域，所述三维关键点为所述第一目标对象的三维模型中与所述二维关键点对应的关键点。
根据权利要求17所述的电子设备，其中，所述处理器被配置为下述步骤：

基于所述二维关键点的位置信息和所述三维关键点的位置信息，确定相机的外参矩阵，所述相机为拍摄所述目标图像的相机；

基于所述相机的外参矩阵和所述相机的内参矩阵，将所述三维模型投影至所述目标区域，生成所述特效图像。
根据权利要求17所述的电子设备，其中，所述处理器被配置为下述步骤：

基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述三维模型投影至所述目标区域，得到投影区域；

对所述投影区域进行特效处理，得到所述特效图像。
根据权利要求19所述的电子设备，其中，所述处理器被配置为下述步骤：

从所述目标图像中获取所述第一目标对象的掩膜区域，所述掩膜区域用于指示所述第一目标对象在所述目标图像中的位置；

基于所述掩膜区域，对所述投影区域中所述三维模型的投影位置进行调整，得到调整后的所述投影区域；

所述对所述投影区域进行特效处理，得到所述特效图像包括：

对所述调整后的所述投影区域进行特效处理，得到所述特效图像。
根据权利要求17所述的电子设备，其中，所述处理器被配置为下述步骤：

将所述目标图像输入分割模型，确定所述目标区域；

将所述目标区域输入关键点回归模型，确定所述二维关键点的位置信息。
根据权利要求21所述的电子设备，其中，所述分割模型包括第一分割子模型和第二分割子模型，所述处理器被配置为下述步骤：

将所述目标图像输入所述第一分割子模型，通过所述第一分割子模型对所述目标图像进行语义分割，得到候选区域，所述候选区域包括第二目标对象，所述第一目标对象属于所述第二目标对象；

将所述候选区域输入所述第二分割子模型，通过所述第而分割子模型对所述候选区域进行语义分割，得到所述目标区域。
根据权利要求21所述的电子设备，其中，所述处理器被配置为下述步骤：

将所述目标图像输入所述分割模型，得到第一初始区域，所述第一初始区域包括所述第一目标对象；

对所述第一初始区域进行时序平滑处理，得到所述目标区域。
根据权利要求21所述的电子设备，其中，所述处理器被配置为下述步骤：

将所述目标区域输入所述关键点回归模型，得到所述第一目标对象的初始二维关键点的位置信息；

对所述初始二维关键点的位置信息进行光流稳定处理，得到所述二维关键点的位置信息。
一种存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行下述步骤：

获取目标图像，所述目标图像包含第一目标对象；

从所述目标图像中获取所述第一目标对象的二维关键点的位置信息；

基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述三维模型投影至目标区域，生成特效图像，所述目标区域为所述第一目标对象在所述目标图像中所在的区域，所述三维关键点为所述第一目标对象的三维模型中与所述二维关键点对应的关键点。
一种计算机程序产品，包括可读性程序代码，所述可读性程序代码可由电子设备的处理器执行下述步骤：

获取目标图像，所述目标图像包含第一目标对象；

从所述目标图像中获取所述第一目标对象的二维关键点的位置信息；

基于所述二维关键点的位置信息，以及所述第一目标对象的三维关键点的位置信息，将所述三维模型投影至目标区域，生成特效图像，所述目标区域为所述第一目标对象在所述目标图像中所在的区域，所述三维关键点为所述第一目标对象的三维模型中与所述二维关键点对应的关键点。