WO2021035674A1

WO2021035674A1 - 一种图像生成方法、设备、可移动平台及存储介质

Info

Publication number: WO2021035674A1
Application number: PCT/CN2019/103622
Authority: WO
Inventors: 刘志鹏; 李思晋
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2019-08-30
Filing date: 2019-08-30
Publication date: 2021-03-04
Also published as: CN112106347A

Abstract

一种图像生成方法，包括：S201.获取拍摄装置(121)拍摄的环境的图像，其中，环境包括目标用户(61)；S202.确定目标用户(61)的人体关节点在图像中的位置；S203.根据人体关节点在图像中的位置确定目标动画人物(63)的动作；S204.将呈现该动作的目标动画人物(63)叠加到图像中以获取叠加后的图像。有益效果：能够确定出与图像中目标用户(61)的人体关节点对应的目标动画人物(63)的动作，生成目标动画人物(63)叠加到图像后的视频或图像，增加了用户摄影的趣味性。

Description

一种图像生成方法、设备、可移动平台及存储介质

技术领域

本发明涉及控制技术领域，尤其涉及一种图像生成方法、设备、可移动平台及存储介质。

背景技术

近年来热度越来越高的虚拟人物具有超高的人气，由于其独有的气质和无限加持的才艺，引来越来越多年轻人的追捧，甚至还有虚拟人物的主播专栏，可见虚拟人物或许是下一个短视频的风口。

以相关的短视频APP为例，其特效多是在人物背景中添加如雨滴、花瓣等，还有人物面部的特殊变化等，大多是美化背景、装饰、滤镜、夸张搞笑等技术，并没有用户与虚拟人物合影录像的技术。因此如何更好地增加拍照或录像的趣味性成为研究的热点问题。

发明内容

本发明实施例提供了一种图像生成方法、设备、可移动平台及存储介质，可以确定出与图像中目标用户的人体关节点对应的目标动画人物的动作，生成目标动画人物叠加到图像后的视频或图像，增加了用户摄影的趣味性。

第一方面，本发明实施例提供了一种图像生成方法，包括：

获取拍摄装置拍摄的环境的图像，其中，所述环境包括目标用户；

确定所述目标用户的人体关节点在所述图像中的位置；

根据所述人体关节点在所述图像中的位置确定目标动画人物的动作；

将呈现该动作的目标动画人物叠加到所述图像中以获取叠加后的图像。

第二方面，本发明实施例提供了一种图像生成设备，包括存储器和处理器；

所述存储器，用于存储程序；

所述处理器，执行所述存储器存储的程序，当程序被执行时，所述处理器用于执行如下步骤：

确定所述目标用户的人体关节点在所述图像中的位置；

第三方面，本发明实施例提供了一种可移动平台，包括：

拍摄装置，用于对环境进行拍摄；

处理器，用于获取拍摄装置拍摄的环境的图像，其中，所述环境包括目标用户；确定所述目标用户的人体关节点在所述图像中的位置；根据所述人体关节点在所述图像中的位置确定目标动画人物的动作；将呈现该动作的目标动画人物叠加到所述图像中以获取叠加后的图像。

第四方面，本发明实施例提供了一种终端设备，包括如上述第二方面所述的图像生成设备。

第五方面，本发明实施例提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现如上述第一方面所述的图像生成方法。

本发明实施例可以获取拍摄装置拍摄的包括目标用户的环境的图像，确定目标用户的人体关节点在图像中的位置，并根据人体关节点在图像中的位置确定目标动画人物的动作，从而将呈现该动作的目标动画人物叠加到图像中以获取叠加后的图像。通过这种方式，可以确定出与图像中目标用户的人体关节点对应的目标动画人物的动作，生成目标动画人物叠加到图像后的视频或图像，增加了用户摄影的趣味性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种图像生成系统的结构示意图；

图2是本发明实施例提供的一种图像生成方法的流程示意图；

图3是本发明实施例提供的另一种图像生成方法的流程示意图；

图4a是本发明实施例提供的一种人体躯干的关节点的示意图；

图4b是本发明实施例提供的一种手掌的关节点的示意图；

图5是本发明实施例提供一种图像生成方法的流程图；

图6是本发明实施例提供的一种叠加图像的示意图；

图7是本发明实施例提供的一种图像生成设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合附图，对本发明的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

本发明实施例中提供的图像生成方法可以由一种图像生成设备执行，该图像生成设备可以设置在可移动平台上，所述可移动平台上挂载有拍摄装置。在某些实施例中，所述可移动平台可以是无人控制机器人(例如无人飞行器、无人车等)或者手持式设备(例如手持云台相机)。在某些实施例中，所述图像生成设备可以设置在终端设备(例如智能手机、平板电脑、膝上型电脑等)上。下面对应用于可移动平台的图像生成方法进行说明。

本发明实施例中，所述图像生成设备可以获取拍摄装置拍摄的环境的图像，其中，所述环境包括目标用户，并可以确定目标用户的人体关节点在图像中的位置，以及根据人体关节点在图像中的位置确定目标动画人物的动作，从而将呈现该动作的目标动画人物叠加到图像中以获取叠加后的图像。在某些实施例中，所述拍摄装置拍摄的环境的图像可以为彩色图像或深度图像。

在一个实施例中，本发明在技术上主要由如图5所示的人体检测52、人体躯干的关节点检测53、手掌的关节点检测55、平面区域检测57五部分组成，其中，图5是本发明实施例提供一种图像生成方法的流程图。在某些实施例中，所述人体躯干的关节点检测53和手掌的关节点检测55可以分别通过第一关节点预测模型中的第一人体躯干关节点预测模型和第一手掌关节点预测模型来实现。

具体可以图5为例，首先可以通过可移动平台上的拍摄装置拍摄包括目标用户的图像51，并对图像进行人体检测52，得到目标用户在所述图像中的用户区域，然后根据第一人体躯干关节点预测模型进行人体躯干的关节点检测53，以预测人体躯干的关节点如手腕等的位置如三维坐标(x,y,z)，其中，z是图像坐标。在某些实施例中，所述人体躯干的关节点包括如图4a所示的18个关节点，其中，图4a是本发明实施例提供的一种人体躯干的关节点的示意图。之后可以根据人体躯干的关节点如左右手手腕的位置进行手掌区域推测54以确定出手掌图像，并通过第一手掌关节点预测模型进行手掌的关节点检测55以预测出手掌的关节点在所述图像中的位置如三维坐标。在某些实施例中，所述手掌的关节点包括如图4b所示的21个关节点，其中，图4b是本发明实施例提供的一种手掌的关节点的示意图。随后将人体躯干的关节点的位置和手掌的关节点的位置导入至预先设计好的人体三维模型进行动作生成56，以确定出目标动画人物躯干的动作和手掌动作。最后通过平面区域检测57检测到目标用户站立的平面区域58，并在将目标动画人物叠加到该平面区域58，以获取叠加后的图像，从而这样就构造出目标用户和目标动画人物一起做相同动作的图像或视频。

在一个实施例中，用户可以选取自己喜欢的目标动画人物，在某些实施例中，所述目标动画人物可以是用户预先通过三维软件如3Dmax、blender、makehuman等制作完成的。然后进入录像或拍照的界面，将可移动平台上挂载的拍摄装置朝向目标用户拍照或者录像，拍摄的图像中出现多个用户区域的位置，用户可以通过点击等选择操作选取其中一个用户区域的目标位置，并将目标动画人物叠加到所述图像中目标位置的目标用户站立的平面区域，以生成叠加后目标用户和目标动画人物做相同动作的图像或视频。

通过将目标动画人物叠加到目标用户站立的平面区域，可以避免将目标动画人物叠加到与目标用户不在一个平面的区域如水面、楼房、玻璃等，有助于使叠加后的图像或视频更加真实以及切合实际。

具体请参见图1，图1是本发明实施例提供的一种图像生成系统的结构示意图。所述系统包括：图像生成设备11和可移动平台12。在某些实施例中，所述图像生成设备11可以设置在所述可移动平台12上，即所述可移动平台12包括图像生成设备12。在某些实施例中，所述图像生成设备11可以独立于所述可移动平台12。这里为了方便说明，将可移动平台12和图像生成设备11 分别放置。其中，可移动平台12和图像生成设备11之间的通信连接可以为有线通信连接，也可以为无线通信连接。在某些实施例中，所述可移动平台12上可以挂载拍摄装置121。所述拍摄装置121用于拍摄图像或视频。在某些实施例中，所述拍摄装置121包括但不限于多光谱成像仪、高光谱成像仪、可见光相机及红外相机等。

在一个实施例中，所述图像生成设备11可以获取拍摄装置121拍摄的环境的图像，其中，所述环境包括目标用户，并确定所述目标用户的人体关节点在所述图像中的位置，以及根据所述人体关节点在所述图像中的位置确定目标动画人物的动作，从而将呈现该动作的目标动画人物叠加到所述图像中以获取叠加后的图像。

下面结合附图对应用于可移动平台的图像生成方法进行举例说明。

请参见图2，图2是本发明实施例提供的一种图像生成方法的流程示意图，所述方法可以由图像生成设备执行，所述图像生成设备可以设置在可移动平台上，所述可移动平台上挂载有拍摄装置，其中，所述可移动平台的具体解释如前所述。具体地，本发明实施例的所述方法包括如下步骤。

S201：获取拍摄装置拍摄的环境的图像，其中，所述环境包括目标用户。

本发明实施例中，图像生成设备可以获取拍摄装置拍摄的环境的图像，其中，所述环境包括目标用户。在一个示例中，所述目标用户可以为人。

在一个实施例中，所述拍摄装置拍摄的环境的图像数量可以包括一帧或多帧，本发明实施例不做具体限定。

S202：确定所述目标用户的人体关节点在所述图像中的位置。

本发明实施例中，图像生成设备可以确定所述目标用户的人体关节点在所述图像中的位置。

在一些实施例中，所述人体关节点包括人体躯干的关节点和/或手掌的关节点。在某些实施例中，所述人体躯干的关节点包括如图4a所示的18个关节点。在某些实施例中，所述手掌的关节点包括如图4b所示的21个关节点。

在一个实施例中，所述图像的数量可以为多帧，所述图像生成设备可以确定所述目标用户的人体关节点在所述多帧图像中每一帧图像中的位置。在某些实施例中，所述人体关节点在所述多帧图像中每一帧图像中的位置可以为二维坐标或三维坐标。

在一个实施例中，所述人体关节点包括人体躯干的关节点；所述图像生成设备在确定所述目标用户的人体关节点在所述图像中的位置时，可以确定所述目标用户的人体躯干的关节点在所述图像中的位置。

以图4a为例，所述图像生成设备在确定所述目标用户的人体关节点在所述图像中的位置时，可以确定如图4a所示目标用户的人体躯干的18个关节点在图像中的位置。可见，通过这种确定人体躯干的关节点在图像中的位置的实施方式，有助于为后续确定目标用户和目标动画人物的人体躯干的动作。

在一个实施例中，所述人体关节点包括手掌的关节点；所述图像生成设备在确定所述目标用户的人体关节点在所述图像中的位置时，可以确定所述目标用户的手掌的关节点在所述图像中的位置。

以图4b为例，所述图像生成设备在确定所述目标用户的人体关节点在所述图像中的位置时，可以确定如图4b所示目标用户的手掌的21个关节点在图像中的位置。可见，通过这种确定手掌的关节点在图像中的位置的实施方式，有助于为后续确定目标用户和目标动画人物的手掌的动作。

在一个实施例中，图像生成设备在确定所述目标用户的人体关节点在所述图像中的位置时，可以将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置。

在一个实施例中，所述人体关节点包括人体躯干的关节点，所述第一关节点预测模型包括第一人体躯干关节点预测模型；图像生成设备在将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置之前，可以将所述图像输入第一用户识别模型，以确定所述目标用户在所述图像中的用户区域；并根据所述目标用户在所述图像中的用户区域，从所述图像中确定所述目标用户的用户图像。

在一个实施例中，图像生成设备在将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置时，可以将所述目标用户的用户图像输入所述第一人体躯干关节点预测模型，以获取所述第一人体躯干关节点预测模型输出的人体躯干的关节点在所述图像中的位置。

以图4a为例，图像生成设备可以将目标用户的用户图像输入第一人体躯干关节点预测模型，以获取第一人体躯干关节点预测模型输出如图4a所示的人体躯干的18个关节点在图像中的位置。

在一个实施例中，所述人体关节点包括手掌的关节点，所述第一关节点预测模型包括第一手掌关节点预测模型；图像生成设备可以根据所述人体躯干关节点中的手腕关节点在所述图像中的位置，确定所述目标用户的手掌在所述图像中的第一手掌预测区域；并根据所述手掌在所述图像中的第一手掌预测区域，从所述图像中确定所述手掌的预测图像。图像生成设备可以将所述手掌的预测图像输入所述第一手掌关节点预测模型，以获取所述第一手掌关节点预测模型输出的所述目标用户的手掌的关节点在所述图像中的位置。

以图4b为例，图像生成设备可以将手掌的预测图像输入第一手掌关节点预测模型，以获取第一手掌关节点预测模型输出的如图4b所示的目标用户的手掌的21个关节点在图像中的位置。

S203：根据所述人体关节点在所述图像中的位置确定目标动画人物的动作。

本发明实施例中，图像生成设备可以根据所述人体关节点在所述图像中的位置确定目标动画人物的动作。

在一个实施例中，当所述图像的数量为多帧时，图像生成设备可以根据所述人体关节点在所述每一帧图像中的位置确定所述目标动画人物与所述每一帧图像对应的动作。

在一个实施例中，当图像生成设备确定出目标用户的人体躯干的关节点在所述图像中的位置时，图像生成设备可以根据所述人体躯干的关节点在所述图像中的位置确定所述目标动画人物的躯干的动作。在某些实施例中，图像生成设备可以根据人体躯干的关节点在图像中的位置确定与人体躯干的关节点在图像中的位置对应的目标动画人物的躯干的动作。

在一个实施例中，当图像生成设备确定出目标用户的手掌的关节点在所述图像中的位置时，图像生成设备可以根据所述手掌的关节点在所述图像中的位置确定所述目标动画人物的手掌的动作。

以图4b为例，假设目标用户的手掌关节点在图像中的位置组成了如图4b所示的目标用户的手掌的“OK”手势，则图像生成设备可以根据目标用户的手掌的“OK”手势确定目标动画人物的手掌的动作对应为“OK”手势。

在一个实施例中，图像生成设备在根据所述人体关节点在所述图像中的位置确定目标动画人物的动作之前，可以检测用户对动画人物的选择操作，并根据检测到的所述选择操作，从多个动画人物中确定所述目标动画人物。

例如，假设预先设置了多个动画人物，图像生成设备在根据所述人体关节点在所述图像中的位置确定目标动画人物的动作之前，可以输出包括多个动画人物的界面，以使用户可以通过点击、滑动等选择操作从多个动画人物中选择一个目标动画人物。

S204：将呈现该动作的目标动画人物叠加到所述图像中以获取叠加后的图像。

本发明实施例中，图像生成设备可以将呈现该动作的目标动画人物叠加到所述图像中以获取叠加后的图像。

在一个实施例中，当所述图像的数量为多帧时，图像生成设备可以将呈现与所述每一帧图像对应的动作的目标动画人物叠加到所述每一帧图像中以获取叠加后的多帧图像。

在一个实施例中，将呈现该动作的目标动画人物叠加到所述图像中以获取叠加后的图像之后，图像生成设备可以将所述叠加后的图像发送至显示设备以使所示显示装置显示所述叠加后的图像。

在一个实施例中，图像生成设备可以在所述图像中确定所述目标用户站立的平面区域，并在将呈现该动作的目标动画人物叠加到所述图像中时，将呈现该动作的目标动画人物叠加到所述图像中所述目标用户站立的平面区域。

以图6为例，图6是本发明实施例提供的一种叠加图像的示意图，如图6所示，假设图像生成设备在所述图像中确定出目标用户61站立的平面区域为62，则图像生成设备可以在将呈现该动作的目标动画人物63叠加到所述图像中目标用户61站立的平面区域62中。

在一个实施例中，图像生成设备在所述图像中确定所述目标用户站立的平面区域时，可以确定所述环境中的平面在所述图像中的多个第一平面区域；并确定所述目标用户在所述图像中的用户区域；以及将所述多个第一平面区域中包括所述用户区域下边沿的第一平面区域确定为所述目标用户站立的平面区域。

在一个实施例中，图像生成设备在确定所述环境中的平面在所述图像中的多个第一平面区域时，可以将所述图像输入第一平面区域检测模型，以获取所述第一平面区域检测模型输出的所述环境中的平面在所述图像中的多个第一平面区域的位置。

在一个实施例中，图像生成设备在将呈现该动作的目标动画人物叠加到所述图像中之前，可以检测用户的位置选择操作，并根据检测到的所述位置选择操作确定所述图像中的目标位置。

在一个实施例中，图像生成设备在确定出图像中的目标位置后，在将呈现该动作的目标动画人物叠加到所述图像中时，可以将呈现该动作的目标动画人物叠加到所述图像中的目标位置中。

请参见图3，图3是本发明实施例提供的另一种图像生成方法的流程示意图，所述方法可以由图像生成设备执行，所述图像生成设备可以设置在可移动平台上，所述可移动平台上挂载有拍摄装置，其中，所述可移动平台的具体解释如前所述。本发明实施例与上述图2所述实施例的区别在于，本发明实施例是根据获取到的环境的深度图像确定人体关节点在图像中的位置，并根据人体关节点在图像中的位置确定目标动画人物的动作，从而将呈现该动作的目标动画人物叠加到深度图像中以获取叠加后的图像。

S301：获取拍摄装置拍摄的环境的深度图像，其中，所述环境包括目标用户。

本发明实施例中，图像生成设备可以获取拍摄装置拍摄的环境的深度图像，其中，所述环境包括目标用户。

S302：将所述深度图像输入第二关节点预测模型，以获取第二关节点预测模型输出的人体关节点在所述深度图像中的位置。

本发明实施例中，图像生成设备可以将所述深度图像输入第二关节点预测模型，以获取第二关节点预测模型输出的人体关节点在所述深度图像中的位置。

在一个实施例中，所述人体关节点包括人体躯干的关节点，第二关节点预测模型包括第二人体躯干关节点预测模型；图像生成设备将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置之前，可以将所述深度图像输入第二用户识别模型，以确定所述目标用户在所述深度图像中的用户区域，并根据所述目标用户在所述深度图像中的用户区域，从所述深度图像中确定所述目标用户的用户图像。

在一个实施例中，图像生成设备将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置时，可以将所述目标用户的用户图像输入所述第二人体躯干关节点预测模型，以获取所述第二人体躯干关节点预测模型输出的人体躯干的关节点在所述深度图像中的位置。

在一个实施例中，所述人体关节点包括手掌的关节点，所述第二关节点预测模型包括第二手掌关节点预测模型；图像生成设备可以根据所述人体躯干关节点中的手腕关节点在所述深度图像中的位置，确定所述目标用户的手掌在所述深度图像中的第二手掌预测区域，并根据所述手掌所述深度图像中的第二手掌预测区域，从所述深度图像中确定所述手掌的预测图像。图像生成设备可以将所述手掌的预测图像输入所述第二手掌关节点预测模型，以获取所述第二手掌关节点预测模型输出的所述目标用户的手掌的关节点在所述深度图像中的位置。

S303：根据所述人体关节点在所述深度图像中的位置，确定所述人体关节点在所述图像中的位置。

本发明实施例中，图像生成设备可以根据所述人体关节点在所述深度图像中的位置，确定所述人体关节点在所述图像中的位置。

在一个实施例中，图像生成设备可以根据输出深度图像的拍摄装置的安装位置关系以及根据人体关节点在所述深度图像中的位置，确定所述人体关节点在所述图像中的位置。

S304：根据所述人体关节点在所述图像中的位置确定目标动画人物的动作。

本发明实施例中，图像生成设备可以根据所述人体关节点在所述图像中的位置确定目标动画人物的动作。具体实施例如前所述。

S305：将呈现该动作的目标动画人物叠加到所述图像中以获取叠加后的图像。

在一个实施例中，图像生成设备可以在所述图像中确定所述目标用户站立的平面区域，并将呈现该动作的目标动画人物叠加到所述图像中所述目标用户站立的平面区域。

在一个实施例中，图像生成设备在所述图像中确定所述目标用户站立的平面区域时，可以确定所述环境中的平面在所述图像中的多个第一平面区域，确定所述目标用户在所述图像中的用户区域，将所述多个第一平面区域中包括所述用户区域下边沿的第一平面区域确定为所述目标用户站立的平面区域。

在一个实施例中，图像生成设备在确定所述环境中的平面在所述图像中的多个第一平面区域时，可以将所述深度图像输入第二平面区域检测模型，以获取所述第二平面区域检测模型输出的所述环境中的平面在所述深度图像中的多个第二平面区域的位置；并根据所述多个第二平面区域的位置，将所述多个第二平面投影到所述图像中以确定所述图像中的多个第一平面区域。

本发明实施例可以获取拍摄装置拍摄的包括目标用户的环境的深度图像，将深度图像输入第二关节点预测模型以获取第二关节点预测模型输出的人体关节点在深度图像中的位置，并根据人体关节点在深度图像中的位置，确定人体关节点在图像中的位置，以及根据人体关节点在图像中的位置确定目标动画人物的动作，从而将呈现该动作的目标动画人物叠加到图像中以获取叠加后的图像。通过这种方式可以根据深度图像确定出目标动画人物的动作，生成目标动画人物叠加到图像中的视频或图像，增加了用户摄影的趣味性。

请参见图7，图7是本发明实施例提供的一种图像生成设备的结构示意图。具体的，所述图像生成设备包括：存储器701、处理器702以及数据接口703。

所述存储器701可以包括易失性存储器(volatile memory)；存储器701也可以包括非易失性存储器(non-volatile memory)；存储器701还可以包括上述种类的存储器的组合。所述处理器702可以是中央处理器(central processing unit，CPU)。所述处理器702还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit，ASIC)，可编程逻辑器件(programmable logic device，PLD)或其组合。具体例如可以是复杂可编程逻辑器件(complex programmable logic device，CPLD)，现场可编程逻辑门阵列(field-programmable gate array，FPGA)或其任意组合。

进一步地，所述存储器701用于存储程序，当程序被执行时所述处理器702可以调用存储器701中存储的程序，用于执行如下步骤：

确定所述目标用户的人体关节点在所述图像中的位置；

进一步地，所述图像的数量为多帧；所述处理器702还用于：

确定所述目标用户的人体关节点在所述多帧图像中每一帧图像中的位置；

根据所述人体关节点在所述每一帧图像中的位置确定所述目标动画人物与所述每一帧图像对应的动作；

将呈现与所述每一帧图像对应的动作的目标动画人物叠加到所述每一帧图像中以获取叠加后的多帧图像。

进一步地，所述处理器702还用于：

将所述叠加后的图像发送至显示设备以使所示显示装置显示所述叠加后的图像。

进一步地，所述人体关节点包括人体躯干的关节点；

所述处理器702确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

确定所述目标用户的人体躯干的关节点在所述图像中的位置；

所述处理器702根据所述人体关节点在所述图像中的位置确定目标动画人物的动作时，具体用于：

根据所述人体躯干的关节点在所述图像中的位置确定所述目标动画人物的躯干的动作。

进一步地，所述人体关节点包括手掌的关节点；

确定所述目标用户的手掌的关节点在所述图像中的位置；

根据所述手掌的关节点在所述图像中的位置确定所述目标动画人物的手掌的动作。

进一步地，所述处理器702还用于：

在所述图像中确定所述目标用户站立的平面区域；

所述处理器702将呈现该动作的目标动画人物叠加到所述图像中时，具体用于：

将呈现该动作的目标动画人物叠加到所述图像中所述目标用户站立的平面区域。

进一步地，所述处理器702在所述图像中确定所述目标用户站立的平面区域时，具体用于：

确定所述环境中的平面在所述图像中的多个第一平面区域；

确定所述目标用户在所述图像中的用户区域；

将所述多个第一平面区域中包括所述用户区域下边沿的第一平面区域确定为所述目标用户站立的平面区域。

进一步地，所述处理器702确定所述环境中的平面在所述图像中的多个第一平面区域时，具体用于：

将所述图像输入第一平面区域检测模型，以获取所述第一平面区域检测模型输出的所述环境中的平面在所述图像中的多个第一平面区域的位置。

进一步地，所述处理器702还用于：

获取所述环境的深度图像；

所述处理器702确定所述环境中的平面在所述图像中的多个第一平面区域时，具体用于：

将所述深度图像输入第二平面区域检测模型，以获取所述第二平面区域检测模型输出的所述环境中的平面在所述深度图像中的多个第二平面区域的位置；

根据所述多个第二平面区域的位置，将所述多个第二平面投影到所述图像中以确定所述图像中的多个第一平面区域。

进一步地，所述处理器702确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置。

进一步地，所述人体关节点包括人体躯干的关节点，所述第一关节点预测模型包括第一人体躯干关节点预测模型，所述处理器702将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置之前，还用于：

将所述图像输入第一用户识别模型，以确定所述目标用户在所述图像中的用户区域；

根据所述目标用户在所述图像中的用户区域，从所述图像中确定所述目标用户的用户图像；

所述处理器702将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置时，具体用于：

将所述目标用户的用户图像输入所述第一人体躯干关节点预测模型，以获取所述第一人体躯干关节点预测模型输出的人体躯干的关节点在所述图像中的位置。

进一步地，所述人体关节点包括手掌的关节点，所述第一关节点预测模型包括第一手掌关节点预测模型，所述处理器702还用于：

根据所述人体躯干关节点中的手腕关节点在所述图像中的位置，确定所述目标用户的手掌在所述图像中的第一手掌预测区域；

根据所述手掌在所述图像中的第一手掌预测区域，从所述图像中确定所述手掌的预测图像；

将所述手掌的预测图像输入所述第一手掌关节点预测模型，以获取所述第一手掌关节点预测模型输出的所述目标用户的手掌的关节点在所述图像中的位置。

进一步地，所述处理器702还用于：

获取所述环境的深度图像；

将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置；

根据所述人体关节点在所述深度图像中的位置，确定所述人体关节点在所述图像中的位置。

进一步地，所述人体关节点包括人体躯干的关节点，第二关节点预测模型包括第二人体躯干关节点预测模型，所述处理器702将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置之前，还用于：

将所述深度图像输入第二用户识别模型，以确定所述目标用户在所述深度图像中的用户区域；

根据所述目标用户在所述深度图像中的用户区域，从所述深度图像中确定所述目标用户的用户图像；

所述处理器702将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置时，具体用于：

将所述目标用户的用户图像输入所述第二人体躯干关节点预测模型，以获取所述第二人体躯干关节点预测模型输出的人体躯干的关节点在所述深度图像中的位置。

进一步地，所述人体关节点包括手掌的关节点，所述第二关节点预测模型包括第二手掌关节点预测模型，所述处理器702还用于：

根据所述人体躯干关节点中的手腕关节点在所述深度图像中的位置，确定所述目标用户的手掌在所述深度图像中的第二手掌预测区域；

根据所述手掌所述深度图像中的第二手掌预测区域，从所述深度图像中确定所述手掌的预测图像；

将所述手掌的预测图像输入所述第二手掌关节点预测模型，以获取所述第二手掌关节点预测模型输出的所述目标用户的手掌的关节点在所述深度图像中的位置。

进一步地，所述处理器702还用于：

检测用户对动画人物选择操作；

根据检测到的所述选择操作，从多个动画人物中确定所述目标动画人物。

进一步地，所述处理器702还用于：

检测用户的位置选择操作；

根据检测到的所述位置选择操作确定所述图像中的目标位置；

将呈现该动作的目标动画人物叠加到所述图像中的目标位置中。

本发明实施例还提供了一种可移动平台，包括：拍摄装置，用于对环境进行拍摄；处理器，用于获取拍摄装置拍摄的环境的图像，其中，所述环境包括目标用户；确定所述目标用户的人体关节点在所述图像中的位置；根据所述人体关节点在所述图像中的位置确定目标动画人物的动作；将呈现该动作的目标动画人物叠加到所述图像中以获取叠加后的图像。

进一步地，所述图像的数量为多帧；所述处理器还用于：

进一步地，所述处理器还用于：

进一步地，所述人体关节点包括人体躯干的关节点；

所述处理器确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

所述处理器根据所述人体关节点在所述图像中的位置确定目标动画人物的动作时，具体用于：

进一步地，所述人体关节点包括手掌的关节点；

确定所述目标用户的手掌的关节点在所述图像中的位置；

进一步地，所述处理器还用于：

在所述图像中确定所述目标用户站立的平面区域；

所述处理器将呈现该动作的目标动画人物叠加到所述图像中时，具体用于：

进一步地，所述处理器在所述图像中确定所述目标用户站立的平面区域时，具体用于：

确定所述环境中的平面在所述图像中的多个第一平面区域；

确定所述目标用户在所述图像中的用户区域；

进一步地，所述处理器确定所述环境中的平面在所述图像中的多个第一平面区域时，具体用于：

进一步地，所述处理器还用于：

获取所述环境的深度图像；

所述处理器确定所述环境中的平面在所述图像中的多个第一平面区域时，具体用于：

进一步地，所述处理器确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

进一步地，所述人体关节点包括人体躯干的关节点，所述第一关节点预测模型包括第一人体躯干关节点预测模型，所述处理器将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置之前，还用于：

所述处理器将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置时，具体用于：

进一步地，所述人体关节点包括手掌的关节点，所述第一关节点预测模型包括第一手掌关节点预测模型，所述处理器还用于：

进一步地，所述处理器还用于：

获取所述环境的深度图像；

进一步地，所述人体关节点包括人体躯干的关节点，第二关节点预测模型包括第二人体躯干关节点预测模型，所述处理器将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置之前，还用于：

所述处理器将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置时，具体用于：

进一步地，所述人体关节点包括手掌的关节点，所述第二关节点预测模型包括第二手掌关节点预测模型，所述处理器还用于：

进一步地，所述处理器还用于：

检测用户对动画人物选择操作；

进一步地，所述处理器还用于：

检测用户的位置选择操作；

在本发明的实施例中还提供一种终端设备，其特征在于，包括：如前所述的图像生成设备。在某些实施例中，所述终端设备包括拍摄装置。在某些实施例中，所述拍摄装置设置在独立于终端设备的其他设备上(例如无人飞行器、手持云台相机等)，所述图像生成设备从所述其他设备获取拍摄装置对环境拍摄的图像。

在本发明的实施例中还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现本发明图2或图3所对应实施例中描述的图像生成方法方式，也可实现图7所述本发明所对应实施例的图像生成设备，在此不再赘述。

所述计算机可读存储介质可以是前述任一实施例所述的设备的内部存储单元，例如设备的硬盘或内存。所述计算机可读存储介质也可以是所述设备的外部存储设备，例如所述设备上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述计算机可读存储介质还可以既包括所述设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所揭露的仅为本发明部分实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

一种图像生成方法，其特征在于，包括：

获取拍摄装置拍摄的环境的图像，其中，所述环境包括目标用户；

确定所述目标用户的人体关节点在所述图像中的位置；

根据所述人体关节点在所述图像中的位置确定目标动画人物的动作；

将呈现该动作的目标动画人物叠加到所述图像中以获取叠加后的图像。
根据权利要求1所述的方法，其特征在于，所述图像的数量为多帧；所述方法还包括：

确定所述目标用户的人体关节点在所述多帧图像中每一帧图像中的位置；

根据所述人体关节点在所述每一帧图像中的位置确定所述目标动画人物与所述每一帧图像对应的动作；

将呈现与所述每一帧图像对应的动作的目标动画人物叠加到所述每一帧图像中以获取叠加后的多帧图像。
根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

将所述叠加后的图像发送至显示设备以使所示显示装置显示所述叠加后的图像。
根据权利要求1-3任一项所述的方法，其特征在于，所述人体关节点包括人体躯干的关节点；

所述确定所述目标用户的人体关节点在所述图像中的位置，包括：

确定所述目标用户的人体躯干的关节点在所述图像中的位置；

所述根据所述人体关节点在所述图像中的位置确定目标动画人物的动作，包括：

根据所述人体躯干的关节点在所述图像中的位置确定所述目标动画人物的躯干的动作。
根据权利要求1-4任一项所述的方法，其特征在于，所述人体关节点包括手掌的关节点；

所述确定所述目标用户的人体关节点在所述图像中的位置，包括：

确定所述目标用户的手掌的关节点在所述图像中的位置；

所述根据所述人体关节点在所述图像中的位置确定目标动画人物的动作，包括：

根据所述手掌的关节点在所述图像中的位置确定所述目标动画人物的手掌的动作。
根据权利要求1-5任一项所述的方法，其特征在于，所述方法还包括：

在所述图像中确定所述目标用户站立的平面区域；

所述将呈现该动作的目标动画人物叠加到所述图像中，包括：

将呈现该动作的目标动画人物叠加到所述图像中所述目标用户站立的平面区域。
根据权利要求6所述的方法，其特征在于，所述在所述图像中确定所述目标用户站立的平面区域，包括：

确定所述环境中的平面在所述图像中的多个第一平面区域；

确定所述目标用户在所述图像中的用户区域；

将所述多个第一平面区域中包括所述用户区域下边沿的第一平面区域确定为所述目标用户站立的平面区域。
根据权利要求7所述的方法，其特征在于，所述确定所述环境中的平面在所述图像中的多个第一平面区域，包括：

将所述图像输入第一平面区域检测模型，以获取所述第一平面区域检测模型输出的所述环境中的平面在所述图像中的多个第一平面区域的位置。
根据权利要求7所述的方法，其特征在于，所述方法还包括：

获取所述环境的深度图像；

所述确定所述环境中的平面在所述图像中的多个第一平面区域，包括：

将所述深度图像输入第二平面区域检测模型，以获取所述第二平面区域检测模型输出的所述环境中的平面在所述深度图像中的多个第二平面区域的位置；

根据所述多个第二平面区域的位置，将所述多个第二平面投影到所述图像中以确定所述图像中的多个第一平面区域。
根据权利要求1-9任一项所述的方法，其特征在于，所述确定所述目标用户的人体关节点在所述图像中的位置，包括：

将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置。
根据权利要求10所述的方法，其特征在于，所述人体关节点包括人体躯干的关节点，所述第一关节点预测模型包括第一人体躯干关节点预测模型，所述将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置之前，还包括：

将所述图像输入第一用户识别模型，以确定所述目标用户在所述图像中的用户区域；

根据所述目标用户在所述图像中的用户区域，从所述图像中确定所述目标用户的用户图像；

所述将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置，包括：

将所述目标用户的用户图像输入所述第一人体躯干关节点预测模型，以获取所述第一人体躯干关节点预测模型输出的人体躯干的关节点在所述图像中的位置。
根据权利要求11所述的方法，其特征在于，所述人体关节点包括手掌的关节点，所述第一关节点预测模型包括第一手掌关节点预测模型，所述方法还包括：

根据所述人体躯干关节点中的手腕关节点在所述图像中的位置，确定所述目标用户的手掌在所述图像中的第一手掌预测区域；

根据所述手掌在所述图像中的第一手掌预测区域，从所述图像中确定所述手掌的预测图像；

所述将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置，包括：

将所述手掌的预测图像输入所述第一手掌关节点预测模型，以获取所述第一手掌关节点预测模型输出的所述目标用户的手掌的关节点在所述图像中的位置。
根据权利要求1-9任一项所述的方法，其特征在于，所述方法还包括：

获取所述环境的深度图像；

所述确定所述目标用户的人体关节点在所述图像中的位置，包括：

将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置；

根据所述人体关节点在所述深度图像中的位置，确定所述人体关节点在所述图像中的位置。
根据权利要求13所述的方法，其特征在于，所述人体关节点包括人体躯干的关节点，第二关节点预测模型包括第二人体躯干关节点预测模型，所述将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置之前，还包括：

将所述深度图像输入第二用户识别模型，以确定所述目标用户在所述深度图像中的用户区域；

根据所述目标用户在所述深度图像中的用户区域，从所述深度图像中确定所述目标用户的用户图像；

所述将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置，包括：

将所述目标用户的用户图像输入所述第二人体躯干关节点预测模型，以获取所述第二人体躯干关节点预测模型输出的人体躯干的关节点在所述深度图像中的位置。
根据权利要求14所述的方法，其特征在于，所述人体关节点包括手掌的关节点，所述第二关节点预测模型包括第二手掌关节点预测模型，所述方法还包括：

根据所述人体躯干关节点中的手腕关节点在所述深度图像中的位置，确定所述目标用户的手掌在所述深度图像中的第二手掌预测区域；

根据所述手掌在所述深度图像中的第二手掌预测区域，从所述深度图像中确定所述手掌的预测图像；

所述将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置，包括：

将所述手掌的预测图像输入所述第二手掌关节点预测模型，以获取所述第二手掌关节点预测模型输出的所述目标用户的手掌的关节点在所述深度图像中的位置。
根据权利要求1-15任一项所述的方法，其特征在于，所述方法还包括：

检测用户对动画人物选择操作；

根据检测到的所述选择操作，从多个动画人物中确定所述目标动画人物。
根据权利要求1-16任一项所述的方法，其特征在于，所述方法还包括：

检测用户的位置选择操作；

根据检测到的所述位置选择操作确定所述图像中的目标位置；

所述将呈现该动作的目标动画人物叠加到所述图像中，包括：

将呈现该动作的目标动画人物叠加到所述图像中的目标位置中。
一种图像生成设备，其特征在于，包括存储器和处理器；

所述存储器，用于存储程序；

所述处理器，执行所述存储器存储的程序，当程序被执行时，所述处理器用于执行如下步骤：

获取拍摄装置拍摄的环境的图像，其中，所述环境包括目标用户；

确定所述目标用户的人体关节点在所述图像中的位置；

根据所述人体关节点在所述图像中的位置确定目标动画人物的动作；

将呈现该动作的目标动画人物叠加到所述图像中以获取叠加后的图像。
根据权利要求18所述的设备，其特征在于，所述图像的数量为多帧；所述处理器还用于：

确定所述目标用户的人体关节点在所述多帧图像中每一帧图像中的位置；

根据所述人体关节点在所述每一帧图像中的位置确定所述目标动画人物与所述每一帧图像对应的动作；

将呈现与所述每一帧图像对应的动作的目标动画人物叠加到所述每一帧图像中以获取叠加后的多帧图像。
根据权利要求18或19所述的设备，其特征在于，所述处理器还用于：

将所述叠加后的图像发送至显示设备以使所示显示装置显示所述叠加后的图像。
根据权利要求18-20任一项所述的设备，其特征在于，所述人体关节点包括人体躯干的关节点；

所述处理器确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

确定所述目标用户的人体躯干的关节点在所述图像中的位置；

所述处理器根据所述人体关节点在所述图像中的位置确定目标动画人物的动作时，具体用于：

根据所述人体躯干的关节点在所述图像中的位置确定所述目标动画人物的躯干的动作。
根据权利要求18-21任一项所述的设备，其特征在于，所述人体关节点包括手掌的关节点；

所述处理器确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

确定所述目标用户的手掌的关节点在所述图像中的位置；

所述处理器根据所述人体关节点在所述图像中的位置确定目标动画人物的动作时，具体用于：

根据所述手掌的关节点在所述图像中的位置确定所述目标动画人物的手掌的动作。
根据权利要求18-22任一项所述的设备，其特征在于，所述处理器还用于：

在所述图像中确定所述目标用户站立的平面区域；

所述处理器将呈现该动作的目标动画人物叠加到所述图像中时，具体用于：

将呈现该动作的目标动画人物叠加到所述图像中所述目标用户站立的平面区域。
根据权利要求23所述的设备，其特征在于，所述处理器在所述图像中确定所述目标用户站立的平面区域时，具体用于：

确定所述环境中的平面在所述图像中的多个第一平面区域；

确定所述目标用户在所述图像中的用户区域；

将所述多个第一平面区域中包括所述用户区域下边沿的第一平面区域确定为所述目标用户站立的平面区域。
根据权利要求24所述的设备，其特征在于，所述处理器确定所述环境中的平面在所述图像中的多个第一平面区域时，具体用于：

将所述图像输入第一平面区域检测模型，以获取所述第一平面区域检测模型输出的所述环境中的平面在所述图像中的多个第一平面区域的位置。
根据权利要求24所述的设备，其特征在于，所述处理器还用于：

获取所述环境的深度图像；

所述处理器确定所述环境中的平面在所述图像中的多个第一平面区域时，具体用于：

将所述深度图像输入第二平面区域检测模型，以获取所述第二平面区域检测模型输出的所述环境中的平面在所述深度图像中的多个第二平面区域的位置；

根据所述多个第二平面区域的位置，将所述多个第二平面投影到所述图像中以确定所述图像中的多个第一平面区域。
根据权利要求18-26任一项所述的设备，其特征在于，所述处理器确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置。
根据权利要求27所述的设备，其特征在于，所述人体关节点包括人体躯干的关节点，所述第一关节点预测模型包括第一人体躯干关节点预测模型，所述处理器将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置之前，还用于：

将所述图像输入第一用户识别模型，以确定所述目标用户在所述图像中的用户区域；

根据所述目标用户在所述图像中的用户区域，从所述图像中确定所述目标用户的用户图像；

所述处理器将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置时，具体用于：

将所述目标用户的用户图像输入所述第一人体躯干关节点预测模型，以获取所述第一人体躯干关节点预测模型输出的人体躯干的关节点在所述图像中的位置。
根据权利要求28所述的设备，其特征在于，所述人体关节点包括手掌的关节点，所述第一关节点预测模型包括第一手掌关节点预测模型，所述处理器还用于：

根据所述人体躯干关节点中的手腕关节点在所述图像中的位置，确定所述目标用户的手掌在所述图像中的第一手掌预测区域；

根据所述手掌在所述图像中的第一手掌预测区域，从所述图像中确定所述手掌的预测图像；

所述处理器将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置时，具体用于：

将所述手掌的预测图像输入所述第一手掌关节点预测模型，以获取所述第一手掌关节点预测模型输出的所述目标用户的手掌的关节点在所述图像中的位置。
根据权利要求18-26任一项所述的设备，其特征在于，所述处理器还用于：

获取所述环境的深度图像；

所述处理器确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置；

根据所述人体关节点在所述深度图像中的位置，确定所述人体关节点在所述图像中的位置。
根据权利要求30所述的设备，其特征在于，所述人体关节点包括人体躯干的关节点，第二关节点预测模型包括第二人体躯干关节点预测模型，所述处理器将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置之前，还用于：

将所述深度图像输入第二用户识别模型，以确定所述目标用户在所述深度图像中的用户区域；

根据所述目标用户在所述深度图像中的用户区域，从所述深度图像中确定所述目标用户的用户图像；

所述处理器将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置时，具体用于：

将所述目标用户的用户图像输入所述第二人体躯干关节点预测模型，以获取所述第二人体躯干关节点预测模型输出的人体躯干的关节点在所述深度图像中的位置。
根据权利要求31所述的设备，其特征在于，所述人体关节点包括手掌的关节点，所述第二关节点预测模型包括第二手掌关节点预测模型，所述处理器还用于：

根据所述人体躯干关节点中的手腕关节点在所述深度图像中的位置，确定所述目标用户的手掌在所述深度图像中的第二手掌预测区域；

根据所述手掌所述深度图像中的第二手掌预测区域，从所述深度图像中确定所述手掌的预测图像；

所述处理器将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置时，具体用于：

将所述手掌的预测图像输入所述第二手掌关节点预测模型，以获取所述第二手掌关节点预测模型输出的所述目标用户的手掌的关节点在所述深度图像中的位置。
根据权利要求18-32任一项所述的设备，其特征在于，所述处理器还用于：

检测用户对动画人物选择操作；

根据检测到的所述选择操作，从多个动画人物中确定所述目标动画人物。
根据权利要求18-33任一项所述的设备，其特征在于，所述处理器还用于：

检测用户的位置选择操作；

根据检测到的所述位置选择操作确定所述图像中的目标位置；

所述处理器将呈现该动作的目标动画人物叠加到所述图像中时，具体用于：

将呈现该动作的目标动画人物叠加到所述图像中的目标位置中。
一种可移动平台，其特征在于，包括：

拍摄装置，用于对环境进行拍摄；

处理器，用于获取拍摄装置拍摄的环境的图像，其中，所述环境包括目标用户；确定所述目标用户的人体关节点在所述图像中的位置；根据所述人体关节点在所述图像中的位置确定目标动画人物的动作；将呈现该动作的目标动画人物叠加到所述图像中以获取叠加后的图像。
根据权利要求35所述的可移动平台，其特征在于，所述图像的数量为多帧；所述处理器还用于：

确定所述目标用户的人体关节点在所述多帧图像中每一帧图像中的位置；

根据所述人体关节点在所述每一帧图像中的位置确定所述目标动画人物与所述每一帧图像对应的动作；

将呈现与所述每一帧图像对应的动作的目标动画人物叠加到所述每一帧图像中以获取叠加后的多帧图像。
根据权利要求35所述的可移动平台，其特征在于，所述处理器还用于：

将所述叠加后的图像发送至显示设备以使所示显示装置显示所述叠加后的图像。
根据权利要求35-37任一项所述的可移动平台，其特征在于，所述人体关节点包括人体躯干的关节点；

所述处理器确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

确定所述目标用户的人体躯干的关节点在所述图像中的位置；

所述处理器根据所述人体关节点在所述图像中的位置确定目标动画人物的动作时，具体用于：

根据所述人体躯干的关节点在所述图像中的位置确定所述目标动画人物的躯干的动作。
根据权利要求35-37任一项所述的可移动平台，其特征在于，所述人体关节点包括手掌的关节点；

所述处理器确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

确定所述目标用户的手掌的关节点在所述图像中的位置；

所述处理器根据所述人体关节点在所述图像中的位置确定目标动画人物的动作时，具体用于：

根据所述手掌的关节点在所述图像中的位置确定所述目标动画人物的手掌的动作。
根据权利要求35-39任一项所述的可移动平台，其特征在于，所述处理器还用于：

在所述图像中确定所述目标用户站立的平面区域；

所述处理器将呈现该动作的目标动画人物叠加到所述图像中时，具体用于：

将呈现该动作的目标动画人物叠加到所述图像中所述目标用户站立的平面区域。
根据权利要求40所述的可移动平台，其特征在于，所述处理器在所述图像中确定所述目标用户站立的平面区域时，具体用于：

确定所述环境中的平面在所述图像中的多个第一平面区域；

确定所述目标用户在所述图像中的用户区域；

将所述多个第一平面区域中包括所述用户区域下边沿的第一平面区域确定为所述目标用户站立的平面区域。
根据权利要求41所述的可移动平台，其特征在于，所述处理器确定所述环境中的平面在所述图像中的多个第一平面区域时，具体用于：

将所述图像输入第一平面区域检测模型，以获取所述第一平面区域检测模型输出的所述环境中的平面在所述图像中的多个第一平面区域的位置。
根据权利要求41所述的可移动平台，其特征在于，所述处理器还用于：

获取所述环境的深度图像；

所述处理器确定所述环境中的平面在所述图像中的多个第一平面区域时，具体用于：

将所述深度图像输入第二平面区域检测模型，以获取所述第二平面区域检测模型输出的所述环境中的平面在所述深度图像中的多个第二平面区域的位置；

根据所述多个第二平面区域的位置，将所述多个第二平面投影到所述图像中以确定所述图像中的多个第一平面区域。
根据权利要求35-43任一项所述的可移动平台，其特征在于，所述处理器确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置。
根据权利要求44所述的可移动平台，其特征在于，所述人体关节点包括人体躯干的关节点，所述第一关节点预测模型包括第一人体躯干关节点预测模型，所述处理器将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置之前，还用于：

将所述图像输入第一用户识别模型，以确定所述目标用户在所述图像中的用户区域；

根据所述目标用户在所述图像中的用户区域，从所述图像中确定所述目标用户的用户图像；

所述处理器将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置时，具体用于：

将所述目标用户的用户图像输入所述第一人体躯干关节点预测模型，以获取所述第一人体躯干关节点预测模型输出的人体躯干的关节点在所述图像中的位置。
根据权利要求45所述的可移动平台，其特征在于，所述人体关节点包括手掌的关节点，所述第一关节点预测模型包括第一手掌关节点预测模型，所述处理器还用于：

根据所述人体躯干关节点中的手腕关节点在所述图像中的位置，确定所述目标用户的手掌在所述图像中的第一手掌预测区域；

根据所述手掌在所述图像中的第一手掌预测区域，从所述图像中确定所述手掌的预测图像；

所述处理器将所述图像输入第一关节点预测模型，以获取所述第一关节点预测模型输出的人体关节点在所述图像中的位置时，具体用于：

将所述手掌的预测图像输入所述第一手掌关节点预测模型，以获取所述第一手掌关节点预测模型输出的所述目标用户的手掌的关节点在所述图像中的位置。
根据权利要求35-43任一项所述的可移动平台，其特征在于，所述处理器还用于：

获取所述环境的深度图像；

所述处理器确定所述目标用户的人体关节点在所述图像中的位置时，具体用于：

将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置；

根据所述人体关节点在所述深度图像中的位置，确定所述人体关节点在所述图像中的位置。
根据权利要求47所述的可移动平台，其特征在于，所述人体关节点包括人体躯干的关节点，第二关节点预测模型包括第二人体躯干关节点预测模型，所述处理器将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置之前，还用于：

将所述深度图像输入所述第二用户识别模型，以确定所述目标用户在所述深度图像中的用户区域；

根据所述目标用户在所述深度图像中的用户区域，从所述深度图像中确定所述目标用户的用户图像；

所述处理器将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置时，具体用于：

将所述目标用户的用户图像输入所述第二人体躯干关节点预测模型，以获取所述第二人体躯干关节点预测模型输出的人体躯干的关节点在所述深度图像中的位置。
根据权利要求48所述的可移动平台，其特征在于，所述人体关节点包括手掌的关节点，所述第二关节点预测模型包括第二手掌关节点预测模型，所述处理器还用于：

根据所述人体躯干关节点中的手腕关节点在所述深度图像中的位置，确定所述目标用户的手掌在所述深度图像中的第二手掌预测区域；

根据所述手掌所述深度图像中的第二手掌预测区域，从所述深度图像中确定所述手掌的预测图像；

所述处理器将所述深度图像输入第二关节点预测模型，以获取所述第二关节点预测模型输出的人体关节点在所述深度图像中的位置时，具体用于：

将所述手掌的预测图像输入所述第二手掌关节点预测模型，以获取所述第二手掌关节点预测模型输出的所述目标用户的手掌的关节点在所述深度图像中的位置。
根据权利要求35-49任一项所述的可移动平台，其特征在于，所述处理器还用于：

检测用户对动画人物选择操作；

根据检测到的所述选择操作，从多个动画人物中确定所述目标动画人物。
根据权利要求35-50任一项所述的可移动平台，其特征在于，所述处理器还用于：

检测用户的位置选择操作；

根据检测到的所述位置选择操作确定所述图像中的目标位置；

所述处理器将呈现该动作的目标动画人物叠加到所述图像中时，具体用于：

将呈现该动作的目标动画人物叠加到所述图像中的目标位置中。
一种终端设备，其特征在于，包括：如权利要求18-34任一项所述的图像生成设备。
根据权利要求52所述的终端设备，其特征在于，所述终端设备还包括所述拍摄装置。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至17任一项所述方法。