WO2024055194A1

WO2024055194A1 - 虚拟对象生成方法、编解码器训练方法及其装置

Info

Publication number: WO2024055194A1
Application number: PCT/CN2022/118712
Authority: WO
Inventors: 徐磊
Original assignee: 维沃移动通信有限公司
Priority date: 2022-09-14
Filing date: 2022-09-14
Publication date: 2024-03-21

Abstract

本申请实施例提供了一种虚拟对象生成方法、编解码器训练方法及其装置，属于虚拟现实技术领域。上述虚拟对象生成方法包括：提取目标用户对应的第一人体特征的动作姿态，得到第一动作姿态；确定第一动作姿态对应的第一特征向量和第二特征向量，第一特征向量基于第一动作姿态确定，第二特征向量基于第一特征向量确定；对第一特征向量和第二特征向量进行解码处理，得到第二动作姿态，第二动作姿态用于表征目标用户对应的第二人体特征；基于第二动作姿态，生成虚拟对象。

Description

虚拟对象生成方法、编解码器训练方法及其装置

技术领域

本申请属于虚拟现实技术领域，具体涉及一种虚拟对象生成方法、编解码器训练方法及其装置。

背景技术

随着虚拟现实技术的成熟以及“元宇宙”概念的兴起，在一些虚拟场景中，例如虚拟会议、虚拟主播等场景，通过电子设备的摄像头捕捉用户的动作姿态，对动作姿态进行估计和分析，进而根据捕捉到的动作姿态生成虚拟对象，这样，用户以该虚拟对象的方式在虚拟场景中进行展示。

然而，上述过程中，可以基于捕捉到的动作姿态，生成与用户自身的姿态相关的虚拟对象。

发明内容

本申请实施例的目的是一种虚拟对象生成方法、编解码器训练方法及其装置，能够解决不能生成与用户自身姿态相关的虚拟对象的问题。

第一方面，本申请实施例提供了一种虚拟对象生成方法，该方法包括：

提取目标用户对应的第一人体特征的动作姿态，得到第一动作姿态；

确定所述第一动作姿态对应的第一特征向量和第二特征向量，所述第一特征向量基于所述第一动作姿态确定，所述第二特征向量基于所述第一特征向量确定；

对所述第一特征向量和所述第二特征向量进行解码处理，得到第二动作姿态，所述第二动作姿态用于表征所述目标用户对应的第二人体特征；

基于所述第二动作姿态，生成虚拟对象。

第二方面，本申请实施例提供了一种编解码器训练方法，应用于第一方面所述的方法，该编解码器训练方法包括：

将训练数据输入至待训练的编码器，生成目标特征向量对，所述训练数据包括至少一个第三动作姿态；

将所述目标特征向量对输入至待训练的解码器，生成第四动作姿态；

基于所述第三动作姿态和所述第四动作姿态，对所述待训练的编码器和所述待训练的解码器进行迭代训练，得到目标编码器和目标解码器。

第三方面，本申请实施例提供了一种虚拟对象生成装置，该装置包括：

提取模块，用于提取目标用户对应的第一人体特征的动作姿态，得到第一动作姿态；

确定模块，用于确定所述第一动作姿态对应的第一特征向量和第二特征向量，所述第一特征向量基于所述第一动作姿态确定，所述第二特征向量基于所述第一特征向量确定；

处理模块，用于对所述第一特征向量和所述第二特征向量进行解码处理，得到第二动作姿态，所述第二动作姿态用于表征所述目标用户对应的第二人体特征；

生成模块，用于基于所述第二动作姿态，生成虚拟对象。

第四方面，本申请实施例提供了一种编解码器训练装置，应用于第三方面所述的装置，该编解码器训练装置包括：

第一生成模块，用于将训练数据输入至待训练的编码器，生成目标特征向量对，所述训练数据包括至少一个第三动作姿态；

第二生成模块，用于将所述目标特征向量对输入至待训练的解码器，生成第四动作姿态；

训练模块，用于基于所述第三动作姿态和所述第四动作姿态，对待训练的编码器和所述待训练的解码器进行迭代训练，得到目标编码器和目标解码器。

第五方面，本申请实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤，或者实现如第二方面所述的方法的步骤。

第六方面，本申请实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤，或者实现如第二方面所述的方法的步骤。

第七方面，本申请实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法，或者实现如第二方面所述的方法的步骤。

第八方面，本申请实施例提供一种计算机程序产品，该程序产品被存储在存储介质中，该程序产品被至少一个处理器执行以实现如第一方面所述的方法，或者实现如第二方面所述的方法的步骤。

本申请实施例中，提取目标用户对应的第一人体特征的动作姿态，得到第一动作姿态；确定第一动作姿态对应的第一特征向量和第二特征向量；对第一特征向量和第二特征向量进行解码处理，得到第二动作姿态，第二动作姿态用于表征目标用户对应的第二人体特征；基于第二动作姿态，生成虚拟对象。本申请实施例中，可以当只提取到目标用户对应的第一人体特征的动作姿态时，即捕捉到的动作姿态的数据量较少的情况下，也能通过该第一动作姿态生成目标用户对应的虚拟对象，以此生成与用户自身的姿态相关的虚拟对象。

附图说明

图1是本申请实施例提供的虚拟对象生成方法的流程图；

图2是本申请实施例提供的虚拟对象生成方法的应用场景图之一；

图3是本申请实施例提供的虚拟对象生成方法的应用场景图之二；

图4是本申请实施例提供的虚拟对象生成方法的应用场景图之三；

图5是本申请实施例提供的编解码器训练方法的流程图；

图6是本申请实施例提供的编解码器训练方法的应用场景图之一；

图7是本申请实施例提供的编解码器训练方法的应用场景图之二；

图8是本申请实施例提供的虚拟对象生成装置的结构图；

图9是本申请实施例提供的编解码器训练装置的结构图；

图10是本申请实施例提供的电子设备的结构图；

图11是本申请实施例提供的电子设备的硬件结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的虚拟对象生成方法进行详细地说明。

本申请实施例提供了一种虚拟对象生成方法，本申请实施例提供的虚拟对象生成方法应用的虚拟场景可以是虚拟会议、虚拟主播等场景，出于清楚阐述技术方案的需要，下面以该虚拟对象生成方法应用于虚拟会议场景为例进行阐述。

请参阅图1，图1是本申请实施例提供的虚拟对象生成方法的流程图。本申请实施例提供的虚拟对象生成方法包括以下步骤：

S101，提取目标用户对应的第一人体特征的动作姿态，得到第一动作姿态。

本步骤中，可以使用人体姿态估计(Human Pose Estimation，HPE)算法对目标图像进行处理，提取目标图像中第一人体特征的动作姿态，获得第一动作姿态。其中，上述第一人体特征为目标用户对应的部分人体特征，上述第一动作姿态为目标用户做出特定动作时对应的特定关节位置的数据信息。

为便于理解，请参阅图2，在图2示出的场景中，目标用户手持电子设备，通过电子设备的摄像头获取到目标图像，图2中的目标图像包括目标用户右侧人体的第一人体特征，进而使用HPE算法提取目标图像中提取上述第一人体特征的动作姿态，获得第一动作姿态。

S102，确定所述第一动作姿态对应的第一特征向量和第二特征向量。

本步骤中，在得到第一动作姿态之后，确定第一动作姿态对应的第一特征向量和第二特征向量，其中，第一特征向量基于第一动作姿态确定，第二特征向量基于第一特征向量确定。具体的如何确定第一动作姿态对应的第一特征向量和第二特征向量的技术方案，请参阅后续实施例。

S103，对所述第一特征向量和所述第二特征向量进行解码处理，得到第二动作姿态。

本步骤中，在得到第一特征向量和第二特征向量之后，对第一特征向量和所述第二特征向量进行解码处理，得到第二动作姿态，其中，上述第二动作姿态用于表征目标用户的全部人体特征。具体的如何对第一特征向量和第二特征向量进行解码处理，得到第二动作姿态的技术方案，请参阅后续实施例。

S104，基于所述第二动作姿态，生成虚拟对象。

可选地实施方式为，使用渲染引擎(the rendering engine)对第二动作姿态进行渲染(render)，以此生成虚拟场景中的虚拟对象。

可选地，所述确定所述第一动作姿态对应的第一特征向量和第二特征向量包括：

通过目标编码器对所述第一动作姿态进行编码处理，得到所述第一特征向量；

根据特征向量数据库和所述第一特征向量，确定第二特征向量。

本实施例中，应用虚拟对象生成方法的装置预先设置有特征向量数据库，该特征向量数据库包括至少一个特征向量对，每个特征向量由两个特征向量组成。

可选地，可以人工挑选出一定数量的人体图像，使用HPE算法确定上述人体图像中的动作姿态，并对上述动作姿态进行编码处理，得到特征向量对，将上述特征向量对存储至数据库中，上述存储有特征向量对的数据库又称为特征向量数据库。

本实施例中，将第一动作姿态作为目标编码器的输入，得到第一特征向量；在得到第一特征向量之后，使用特征向量数据库对第一特征向量执行查询操作，确定第二特征向量。具体的如何使用特征向量数据库对第一特征向量执行查询操作，确定第二特征向量的技术方案，请参阅后续实施例。

可选地，上述目标编码器可以是使用生成对抗网络(Generative Adversarial Network，GAN)训练的编码器，也可以是使用卷积神经网络(Convolutional Neural Networks，CNN)训练的编码器，或使用其他神经网络训练的编码器，在此不作具体限定。为便于理解，请参阅图3，如图3所示，目标图像包括目标用户右侧人体的人体特征，使用目标编码器对目标图像进行编码处理，得到第一特征向量；进一步的，使得预设的特征向量数据库，基于第一特征向量，确定第二特征向量。

本实施例中，使用目标编码器对第一动作姿态进行编码处理，得到第一特征向量，根据特征向量数据库和第一特征向量，确定第二特征向量，在后续步骤中，基于上述第一特征向量和第二特征向量确定表征目标用户全部人体特征的第二动作姿态，进而生成完整的虚拟对象。

可选地，所述根据特征向量数据库和所述第一特征向量，确定第二特征向量包括：

根据所述特征向量数据库，确定与所述第一特征向量相关联的第三特征向量；

根据所述特征向量数据库，确定所述第三特征向量相关联的第一特征向量对；

将所述第一特征向量对中除所述第三特征向量之外的一个特征向量，确定为所述第二特征向量。

本实施例中，在特征向量数据库对所述第一特征向量进行查询，将特征向量数据库中与第一特征向量之间的向量距离最小的特征向量，确定为第三特征向量。可选地，可以使用L1范数算法、L2范数算法或者其他方式计算第一特征向量与特征向量数据库中每个特征向量之间的向量距离。

如上所述，特征向量数据库包括至少一个特征向量对，每个特征向量由两个特征向量组成。因此，在确定第三特征向量之后，对第三特征向量进行查询，确定特征向量数据库中与第三特征向量相关联的第一特征向量对，并将第一特征向量对中除第三特征向量之外的一个特征向量，确定为第二特征向量。

可选地，所述对所述第一特征向量和所述第二特征向量进行解码处理包括：

将所述第一特征向量和所述第二特征向量组合成第二特征向量对；

通过目标解码器，对所述第二特征向量对进行解码处理。

上述目标解码器可以是使用生成对抗网络训练的解码器，也可以是使用卷积神经网络训练的解码器，或使用其他神经网络训练的解码器，在此不作具体限定。

本实施例中，在得到第一特征向量和第二特征向量之后，由于目标解码器的输入数据为特征向量对，因此将第一特征向量和第二特征向量组合成第二特征向量对。将上述第二特征向量对作为目标解码器的输入，使用该目标解码器对第二特征向量对进行解码处理。

为便于理解技术方案，请参阅图4，如图4所示，将第一特征向量和第二特征向量组成的第二特征向量对作为目标解码器的输入，得到第二动作姿态，进一步的，使用渲染引擎对第二动作姿态进行渲染，生成图4中的虚拟对象。

可选地，所述提取目标用户对应的第一人体特征的动作姿态，得到第一动作姿态包括：

获取目标图像；

对所述第一人体特征进行动作姿态提取，得到所述第一动作姿态。

上述目标图像包括目标用户对应的第一人体特征。可选地，上述第一人体特征为目标用户对应的部分人体特征。

在一可选地实施场景中，目标用户可以手持电子设备，这种实施场景下，获取电子设备的摄像头拍摄到的目标图像。在另一实施场景中，目标用户也可以不手持电子设备，将电子设备固定并使用电子设备拍照，这种实施场景下，也可以通过电子设备的摄像头获取到目标图像。

在上述实施场景中，若目标用户只有部分人体出现在摄像头拍摄到的画面中，则获取到的目标图像中只包括目标用户对应的第二人体特征。

本实施例中，在获取目标图像之后，对目标图像包括的第一人体特征进行动作姿态提取，得到第一动作姿态。具体的进行动作姿态提取的方式与上述动作姿态提取的方式一致，在此不做重复阐述。

本申请实施例提供了一种编解码器训练方法，该编解码器训练方法应用于上述虚拟对象生成方法，请参阅图5，图5是本申请实施例提供的编解码器训练方法的流程图。本申请实施例提供的编解码器训练方法包括以下步骤：

S501，将训练数据输入至待训练的编码器，生成目标特征向量对。

上述训练数据包括至少一个第三动作姿态，可选地，上述训练数据可以是目标用户的手臂动作数据。

请参阅图6，本步骤中，可选地，可以将训练数据输入至待训练的编码器，使用该编码器对训练数据进行编码处理，生成目标特征向量对。其中，训练数据为动作姿态数据，目标特征向量对由两个目标特征向量组成。图6中的“特征向量1”和“特征向量2”构成一个目标特征向量对，待训练的编码器可以为生成对抗网络中的编码器。

S502，将所述目标特征向量对输入至待训练的解码器，生成第四动作姿态。

请参阅图6，本步骤中，在得到目标特征向量对后，将目标特征向量对作为待训练的解码器的输入，生成第四动作姿态。其中，待训练的解码器可以为生成对抗网络中的解码器。

S503，基于所述第三动作姿态和所述第四动作姿态，对所述待训练的编码器和所述待训练的解码器进行迭代训练，得到目标编码器和目标解码器。

本步骤中，基于第三动作姿态和第四动作姿态之间的差异，对待训练的编码器和所述待训练的解码器进行迭代训练，在编码器和解码器训练完成的情况下，得到目标编码器和目标解码器。需要说明的是，上述目标编码器和目标解码器，根据训练数据对应的虚拟场景的不同，可以应用于不同的虚拟场景。

可选地，在编码器和解码器应用于生成对抗网络的情况下，调整生成对抗网络的损失函数，在第三动作姿态和第四动作姿态之间的差异达到低于预设阈值的情况下，确定生成对抗网络包括的编码器和解码器训练完成，即得到目标编码器和目标解码器。其中，生成对抗网络中的损失函数值可以表征第三动作姿态和第四动作姿态之间的相似度。

可选地，所述将训练数据输入至待训练的编码器之前，所述方法还包括：

获取训练图像集；

对所述至少一个训练图像进行动作姿态提取，得到所述训练数据。

上述训练图像集包括至少一个训练图像，上述训练图像用于表征第二人体特征。

本实施例中，获取训练图像集，并对训练图像集包括的每个训练图像进行动作姿态提取，获得训练数据，可选地，可以使用HPE算法对训练图像进行动作姿态提取，也可以使用其他算法对训练图像进行动作姿态提取，在此不作具体限定。

请一并参阅图7，图7示出的是使用HPE算法对训练图像进行动作姿态提取的过程，将训练图像作为HPE算法的输入，输出得到每个训练图像对应的动作姿态，即训练数据。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的虚拟对象生成装置进行详细地说明。

如图8所示，虚拟对象生成装置800包括：

提取模块801，用于提取目标用户对应的第一人体特征的动作姿态，得到第一动作姿态；

确定模块802，用于确定所述第一动作姿态对应的第一特征向量和第二特征向量，所述第一特征向量基于所述第一动作姿态确定，所述第二特征向量基于所述第一特征向量确定；

处理模块803，用于对所述第一特征向量和所述第二特征向量进行解码处理，得到第二动作姿态，所述第二动作姿态用于表征所述目标用户对应的第二人体特征；

生成模块804，用于基于所述第二动作姿态，生成虚拟对象。

可选地，所述确定模块802，具体用于：

可选地，所述确定模块802，还具体用于：

根据所述特征向量数据库，确定与所述第一特征向量相关联的第三特征向量，所述第三特征向量为所述特征向量数据库中与所述第一特征向量之间的向量距离最小的特征向量；

根据所述特征向量数据库，确定所述第三特征向量相关联的第一特征向量对，所述特征向量数据库包括至少一个特征向量对；

可选地，所述处理模块803，具体用于：

通过目标解码器，对所述第二特征向量对进行解码处理。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的编解码器训练装置进行详细地说明。

如图9所示，编解码器训练装置900包括：

第一生成模块901，用于将训练数据输入至待训练的编码器，生成目标特征向量对，所述训练数据包括至少一个第三动作姿态；

第二生成模块902，用于将所述目标特征向量对输入至待训练的解码器，生成第四动作姿态；

训练模块903，用于基于所述第三动作姿态和所述第四动作姿态，对所述待训练的编码器和所述待训练的解码器进行迭代训练，得到目标编码器和目标解码器。

可选地，所述编解码器训练装置900还包括：

获取模块，用于获取训练图像集，所述训练图像集包括至少一个训练图像，所述训练图像用于表征第二人体特征；

提取模块，用于对所述至少一个训练图像进行动作姿态提取，得到所述训练数据。

本申请实施例中的虚拟对象生成装置和编解码器训练装置可以是电子设备，也可以是电子设备中的部件、例如集成电路或芯片。该电子设备可以是终端，也可以为除终端之外的其他设备。示例性的，电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(Mobile Internet Device，MID)、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personal digital assistant，PDA)等，还可以为服务器、网络附属存储器(Network Attached Storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本申请实施例不作具体限定。

本申请实施例中的虚拟对象生成装置和编解码器训练装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本申请实施例不作具体限定。

本申请实施例提供的虚拟对象生成装置能够实现图1的方法实施例实现的各个过程，为避免重复，这里不再赘述。

本申请实施例提供的编解码器训练装置能够实现图5的方法实施例实现的各个过程，为避免重复，这里不再赘述。

可选地，如图10所示，本申请实施例还提供一种电子设备1000，包括处理器1001，存储器1002，存储在存储器1002上并可在所述处理器1001上运行的程序或指令，该程序或指令被处理器1001执行时实现上述虚拟对象生成方法实施例的各个过程，或者实现上述编解码器训练方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。

图11为实现本申请实施例的一种电子设备的硬件结构示意图。

该电子设备1100包括但不限于：射频单元1101、网络模块1102、音频输出单元1103、输入单元1104、传感器1105、显示单元1106、用户输入单元1107、接口单元1108、存储器1109、以及处理器1110等部件。

本领域技术人员可以理解，电子设备1100还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器1110逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图11中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

处理器1110，还用于提取目标用户对应的第一人体特征的动作姿态，得到第一动作姿态；

确定所述第一动作姿态对应的第一特征向量和第二特征向量；

对所述第一特征向量和所述第二特征向量进行解码处理，得到第二动作姿态；

基于所述第二动作姿态，生成虚拟对象。

其中，处理器1110，还用于通过目标编码器对所述第一动作姿态进行编码处理，得到所述第一特征向量；

其中，处理器1110，还用于根据所述特征向量数据库，确定与所述第一特征向量相关联的第三特征向量；

根据所述特征向量数据库中，确定所述第三特征向量相关联的第一特征向量对；

其中，处理器1110，还用于将所述第一特征向量和所述第二特征向量组合成第二特征向量对；

通过目标解码器，对所述第二特征向量对进行解码处理。

其中，输入单元1104，用于获取目标图像；

处理器1110，还用于对所述第一人体特征进行动作姿态提取，得到所述第一动作姿态。

其中，输入单元1104，还用于将训练数据输入至待训练的编码器，生成目标特征向量对；

处理器1110，还用于将所述目标特征向量对输入至待训练的解码器，生成第四动作姿态；

其中，输入单元1104，还用于获取训练图像集；

处理器1110，还用于对所述至少一个训练图像进行动作姿态提取，得到所述训练数据。

应理解的是，本申请实施例中，输入单元1104可以包括图形处理器(Graphics Processing Unit，GPU)11041和麦克风11042，图形处理器11041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1106可包括显示面板11061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板11061。用户输入单元1107包括触控面板11071以及其他输入设备11072中的至少一种。触控面板11061，也称为触摸屏。触控面板11061可包括触摸检测装置和触摸控制器两个部分。其他输入设备11072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

存储器1109可用于存储软件程序以及各种数据。存储器1109可主要包括存储程序或指令的第一存储区和存储数据的第二存储区，其中，第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外，存储器1109可以包括易失性存储器或非易失性存储器，或者，存储器1109可以包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本申请实施例中的存储器1109包括但不限于这些和任意其它适合类型的存储器。

处理器1110可包括一个或多个处理单元；可选的，处理器1110集成应用处理器和调制解调处理器，其中，应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作，调制解调处理器主要处理无线通信信号，如基带处理器。可以理解的是，上述调制解调处理器也可以不集成到处理器1110中。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述虚拟对象生成方法实施例的各个过程，或者实现上述编解码器训练方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述虚拟对象生成方法实施例的各个过程，实现上述编解码器训练方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

本申请实施例提供一种计算机程序产品，该程序产品被存储在存储介质中，该程序产品被至少一个处理器执行以实现上述虚拟对象生成方法实施例的各个过程，或者实现上述编解码器训练方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

一种虚拟对象生成方法，其中，包括：

提取目标用户对应的第一人体特征的动作姿态，得到第一动作姿态；

确定所述第一动作姿态对应的第一特征向量和第二特征向量，所述第一特征向量基于所述第一动作姿态确定，所述第二特征向量基于所述第一特征向量确定；

对所述第一特征向量和所述第二特征向量进行解码处理，得到第二动作姿态，所述第二动作姿态用于表征所述目标用户对应的第二人体特征；

基于所述第二动作姿态，生成虚拟对象。
根据权利要求1所述的方法，其中，所述确定所述第一动作姿态对应的第一特征向量和第二特征向量包括：

通过目标编码器对所述第一动作姿态进行编码处理，得到所述第一特征向量；

根据特征向量数据库和所述第一特征向量，确定第二特征向量。
根据权利要求2所述的方法，其中，所述根据特征向量数据库和所述第一特征向量，确定第二特征向量包括：

根据所述特征向量数据库，确定与所述第一特征向量相关联的第三特征向量，所述第三特征向量为所述特征向量数据库中与所述第一特征向量之间的向量距离最小的特征向量；

根据所述特征向量数据库，确定所述第三特征向量相关联的第一特征向量对，所述特征向量数据库包括至少一个特征向量对；

将所述第一特征向量对中除所述第三特征向量之外的一个特征向量，确定为所述第二特征向量。
根据权利要求1所述的方法，其中，所述对所述第一特征向量和所述第二特征向量进行解码处理包括：

将所述第一特征向量和所述第二特征向量组合成第二特征向量对；

通过目标解码器，对所述第二特征向量对进行解码处理。
根据权利要求1所述的方法，其中，所述提取目标用户对应的第一人体特征的动作姿态，得到第一动作姿态包括：

获取目标图像，所述目标图像包括所述目标用户对应的第一人体特征；

对所述第一人体特征进行动作姿态提取，得到所述第一动作姿态。
一种编解码器训练方法，应用于如权利要求1-5中任一项所述的方法，其中，所述编解码器训练方法包括：

将训练数据输入至待训练的编码器，生成目标特征向量对，所述训练数据包括至少一个第三动作姿态；

将所述目标特征向量对输入至待训练的解码器，生成第四动作姿态；

基于所述第三动作姿态和所述第四动作姿态，对所述待训练的编码器和所述待训练的解码器进行迭代训练，得到目标编码器和目标解码器。
根据权利要求6所述的方法，其中，所述将训练数据输入至待训练的编码器之前，所述方法还包括：

获取训练图像集，所述训练图像集包括至少一个训练图像，所述训练图像用于表征第二人体特征；

对所述至少一个训练图像进行动作姿态提取，得到所述训练数据。
一种虚拟对象生成装置，其中，包括：

提取模块，用于提取目标用户对应的第一人体特征的动作姿态，得到第一动作姿态；

确定模块，用于确定所述第一动作姿态对应的第一特征向量和第二特征向量，所述第一特征向量基于所述第一动作姿态确定，所述第二特征向量基于所述第一特征向量确定；

处理模块，用于对所述第一特征向量和所述第二特征向量进行解码处理，得到第二动作姿态，所述第二动作姿态用于表征所述目标用户对应的第二人体特征；

生成模块，用于基于所述第二动作姿态，生成虚拟对象。
根据权利要求8所述的装置，其中，所述确定模块，具体用于：

通过目标编码器对所述第一动作姿态进行编码处理，得到所述第一特征向量；

根据特征向量数据库和所述第一特征向量，确定第二特征向量。
根据权利要求9所述的装置，其中，所述确定模块，还具体用于：

根据所述特征向量数据库，确定与所述第一特征向量相关联的第三特征向量，所述第三特征向量为所述特征向量数据库中与所述第一特征向量之间的向量距离最小的特征向量；

根据所述特征向量数据库，确定所述第三特征向量相关联的第一特征向量对，所述特征向量数据库包括至少一个特征向量对；

将所述第一特征向量对中除所述第三特征向量之外的一个特征向量，确定为所述第二特征向量。
根据权利要求8所述的装置，其中，所述处理模块，具体用于：

将所述第一特征向量和所述第二特征向量组合成第二特征向量对；

通过目标解码器，对所述第二特征向量对进行解码处理。
根据权利要求8所述的装置，其中，所述提取模块，具体用于：

获取目标图像，所述目标图像包括所述目标用户对应的第一人体特征；

对所述第一人体特征进行动作姿态提取，得到所述第一动作姿态。
一种编解码器训练装置，其中，应用于如权利要求8-12中任一项所述的装置，所述编解码器训练装置包括：

第一生成模块，用于将训练数据输入至待训练的编码器，生成目标特征向量对，所述训练数据包括至少一个第三动作姿态；

第二生成模块，用于将所述目标特征向量对输入至待训练的解码器，生成第四动作姿态；

训练模块，用于基于所述第三动作姿态和所述第四动作姿态，对所述待训练的编码器和所述待训练的解码器进行迭代训练，得到目标编码器和目标解码器。
根据权利要求13所述的装置，其中，所述装置还包括：

获取模块，用于获取训练图像集，所述训练图像集包括至少一个训练图像，所述训练图像用于表征第二人体特征；

提取模块，用于对所述至少一个训练图像进行动作姿态提取，得到所述训练数据。
一种电子设备，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，其中，所述程序或指令被所述处理器执行时实现如权利要求1-5任一项所述的虚拟对象生成方法的步骤，或者实现如权利要求6-7任一项所述的编解码器训练方法的步骤。
一种可读存储介质，所述可读存储介质上存储程序或指令，其中，所述程序或指令被处理器执行时实现如权利要求1-5任一项所述的虚拟对象生成方法的步骤，或者实现如权利要求6-7任一项所述的编解码器训练方法的步骤。
一种芯片，包括处理器和通信接口，其中，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如权利要求1-5任一项所述的虚拟对象生成方法的步骤，或者实现如权利要求6-7任一项所述的编解码器训练方法的步骤。
一种计算机程序产品，其中，所述计算机程序产品被存储在非易失的存储介质中，所述计算机程序产品被至少一个处理器执行时实现如权利要求1-5任一项所述的虚拟对象生成方法的步骤，或者实现如权利要求6-7任一项所述的编解码器训练方法的步骤。