CN116309999A - 一种3d虚拟形象的驱动方法、装置、电子设备及存储介质 - Google Patents

一种3d虚拟形象的驱动方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116309999A
CN116309999A CN202310248187.6A CN202310248187A CN116309999A CN 116309999 A CN116309999 A CN 116309999A CN 202310248187 A CN202310248187 A CN 202310248187A CN 116309999 A CN116309999 A CN 116309999A
Authority
CN
China
Prior art keywords
target
video frame
character
determining
emotion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310248187.6A
Other languages
English (en)
Inventor
乔志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202310248187.6A priority Critical patent/CN116309999A/zh
Publication of CN116309999A publication Critical patent/CN116309999A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明实施例涉及一种3D虚拟形象的驱动方法、装置、电子设备及存储介质,方法包括:获取目标视频中的目标视频帧及目标3D虚拟形象,目标视频帧中包含有2D人物;从目标视频帧中确定出2D人物,及确定2D人物对应的第一关键点位置集合;根据第一关键点位置集合,确定在三维空间中2D人物对应的第二关键点位置集合;根据第二关键点位置集合,确定目标视频帧对应的第一姿态数据,第一姿态数据用于表征在三维空间中2D人物对应的姿态数据;根据第一姿态数据,驱动目标3D虚拟形象。由此,本发明实施例无需一帧帧的刻画3D虚拟形象的动作,提高了驱动3D虚拟形象的效率。

Description

一种3D虚拟形象的驱动方法、装置、电子设备及存储介质
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种3D虚拟形象的驱动方法、装置、电子设备及存储介质。
背景技术
目前,驱动3D虚拟形象还需通过3D虚拟形象的一系列动作实现。而3D虚拟形象的动作主要还是依赖动画设计师一帧一帧的进行刻画,一套比较好的3D虚拟形象的动作可能就需要多个优秀的动画师花费数周甚至数月的时间来制作,费时费力。
发明内容
鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种3D虚拟形象的驱动方法、装置、电子设备及存储介质。
第一方面,本发明实施例提供一种3D虚拟形象的驱动方法,包括:
获取目标视频中的目标视频帧及目标3D虚拟形象,所述目标视频帧中包含有2D人物;
从所述目标视频帧中确定出所述2D人物,及确定所述2D人物对应的第一关键点位置集合;
根据所述第一关键点位置集合,确定在三维空间中所述2D人物对应的第二关键点位置集合;
根据所述第二关键点位置集合,确定所述目标视频帧对应的第一姿态数据,所述第一姿态数据用于表征在三维空间中所述2D人物对应的姿态数据;
根据所述第一姿态数据,驱动所述目标3D虚拟形象。
在一个可选的实施方式中,所述根据所述第二关键点位置集合,确定所述目标视频帧对应的第一姿态数据,包括:
确定在三维空间中所述2D人物对应的初始关键点位置集合及所述初始关键点位置集合对应的关键点级联关系;
根据所述初始关键点位置集合、所述关键点级联关系及所述第二关键点位置集合,确定在三维空间中所述2D人物对应的各关键点的旋转角度;
将在三维空间中所述2D人物对应的各关键点的旋转角度确定为所述目标视频帧对应的第一姿态数据。
在一个可选的实施方式中,所述方法,还包括:
根据所述目标视频帧,确定满足预设条件的视频帧集合,所述预设条件包括:在所述目标视频中位于所述目标视频帧之前的第一数量的视频帧及位于所述目标视频帧之后的第二数量的视频帧,所述视频帧中包含有所述2D人物;
针对所述视频帧集合中的每个视频帧,获取所述视频帧对应的第二姿态数据,得到所述视频帧集合对应的姿态数据集合;
根据所述姿态数据集合和所述第一姿态数据,对所述第一姿态数据进行更新,以得到所更新后的所述第一姿态数据;
所述根据所述第一姿态数据,驱动所述目标3D虚拟形象,包括:
根据更新后的所述第一姿态数据,驱动所述目标3D虚拟形象。
在一个可选的实施方式中,所述根据所述第一姿态数据,驱动所述目标3D虚拟形象,包括:
获取所述2D人物与所述目标3D虚拟形象之间的姿态对应关系;
根据所述第一姿态数据和所述姿态对应关系,确定所述目标3D虚拟形象对应的第三姿态数据;
将所述第三姿态数据重定向至所述目标3D虚拟形象上,以驱动所述目标3D虚拟形象。
在一个可选的实施方式中,所述根据所述第一姿态数据,驱动所述目标3D虚拟形象,包括:
确定所述目标视频帧中所述2D人物对应的目标情绪;
根据所述目标情绪,确定所述目标3D虚拟形象对应的人脸参数数据;
根据所述第一姿态数据及所述人脸参数数据,驱动所述目标3D虚拟形象。
在一个可选的实施方式中,所述确定所述目标视频帧中所述2D人物对应的目标情绪,包括:
确定目标视频帧中所述2D人物对应的初始情绪;
确定在所述目标视频中与所述目标视频帧相邻的第一视频帧和的第二视频帧,所述第一视频帧和所述第二视频帧中均包含有所述2D人物;
获取所述第一视频帧对应的第一情绪及所述第二视频帧对应的第二情绪;
在所述第一情绪与所述第二情绪一致且所述初始情绪与所述第一情绪及所述第二情绪均不一致的情况下,根据所述第一情绪或所述第二情绪更新所述初始情绪,以得到所述目标视频帧中所述2D人物对应的目标情绪。
在一个可选的实施方式中,所述获取目标3D虚拟形象,包括:
获取针对目标界面的目标操作指令,所述目标界面中展示有多个3D虚拟形象,所述目标操作指令通过对多个所述3D虚拟形象进行选择所生成的,所述目标操作指令中携带有所述目标3D虚拟形象对应的目标标识;
根据所述目标标识,从关联关系中确定出所述目标标识对应的目标3D虚拟形象,所述关联关系中存储有多组标识与3D虚拟形象之间的对应关系。
第二方面,本发明实施例提供一种3D虚拟形象的驱动装置,包括:
获取模块,用于获取目标视频中的目标视频帧及目标3D虚拟形象,所述目标视频帧中包含有2D人物;
确定模块,用于从所述目标视频帧中确定出所述2D人物,及确定所述2D人物对应的第一关键点位置集合;
所述确定模块,还用于根据所述第一关键点位置集合,确定在三维空间中所述2D人物对应的第二关键点位置集合;
所述确定模块,还用于根据所述第二关键点位置集合,确定所述目标视频帧对应的第一姿态数据,所述第一姿态数据用于表征在三维空间中所述2D人物对应的姿态数据;
驱动模块,用于根据所述第一姿态数据,驱动所述目标3D虚拟形象。第三方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的3D虚拟形象的驱动程序,以实现如上所述的3D虚拟形象的驱动方法。
第四方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上所述的3D虚拟形象的驱动方法。
本发明实施例提供的一种3D虚拟形象的驱动方法,包括:获取目标视频中的目标视频帧及目标3D虚拟形象,目标视频帧中包含有2D人物;从目标视频帧中确定出2D人物,及确定2D人物对应的第一关键点位置集合;根据第一关键点位置集合,确定在三维空间中2D人物对应的第二关键点位置集合;根据第二关键点位置集合,确定目标视频帧对应的第一姿态数据,第一姿态数据用于表征在三维空间中2D人物对应的姿态数据;根据第一姿态数据,驱动目标3D虚拟形象。通过以上方式,本发明实施例通过对所获取的视频帧中的2D人物进行处理,以确定在三维空间中2D人物对应的姿态数据,从而根据所确定的姿态数据驱动所获取到的3D虚拟形象,无需一帧帧的刻画3D虚拟形象的动作,提高了驱动3D虚拟形象的效率。
附图说明
图1为本发明实施例提供的一个3D虚拟形象的驱动方法的流程示意图;
图2为本发明实施例提供的一个3D虚拟形象的驱动装置的结构示意图;
图3为本发明实施例提供的一个电子设备的结构示意图;
以上附图中:
10、获取模块;20、确定模块;30、驱动模块;
400、电子设备;401、处理器;402、存储器;4021、操作系统;4022、应用程序;403、用户接口;404、网络接口;405、总线系统。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
参考图1,图1为本发明实施例提供的一个3D虚拟形象的驱动方法的流程示意图。本发明实施例提供的一种3D虚拟形象的驱动方法,包括如下步骤:
S101:获取目标视频中的目标视频帧及目标3D虚拟形象。
在本实施例中,目标视频帧中包含有2D人物。目标视频是由时间上连续的视频帧形成的,目标视频通过单目相机所获取到。通过对目标视频中的目标视频帧所包含的2D人物的动作进行分析处理,能够将2D人物的动作应用至3D虚拟形象上,从而实现3D虚拟形象的驱动。
由于目标视频中包含大量视频帧,为了将目标视频中所包含的2D人物的动作应用至3D虚拟形象上,需要从目标视频所包含的大量视频帧中提取出包含2D人物的视频帧(即目标视频帧)。其中,获取目标视频帧可通过如下方式实现,在获取到目标视频后,对目标视频进行分帧处理,得到按照时间序列排列的视频帧,对视频帧进行人体检测,当在视频帧中检测到了人体,则将该视频帧确定为目标视频帧。具体地说,可采用现有人体检测算法对视频帧进行人体检测,本实施例中对人体检测算法不做具体限定。例如,人体检测算法可为yolo-v5检测模型。
目前,在设计3D虚拟形象的动作时通常只适用于该3D虚拟形象,如果再需更换一个3D虚拟形象后,此前所涉及的动作可能就不能复用了,本实施例中为了提高3D虚拟形象的复用性,预先设置多个3D虚拟形象,并将所设置的多个3D虚拟形象进行存储,在实现3D虚拟形象时,用户可根据实际需要选择所需要的目标3D虚拟形象。具体地说,可通过如下方式获取目标3D虚拟形象:
获取针对目标界面的目标操作指令,目标界面中展示有多个3D虚拟形象,目标操作指令通过对多个3D虚拟形象进行选择所生成的,目标操作指令中携带有目标3D虚拟形象对应的目标标识;
根据目标操作指令,从关联关系中确定出目标标识对应的目标3D虚拟形象,关联关系中存储有多组标识与3D虚拟形象之间的对应关系。
在本实施例中,用户可基于终端所展示的目标界面进行目标3D虚拟形象的选择。其中,终端可为手机终端、平板终端等,本实施例中对终端的具体形式不做限定,具体可根据实际需要进行选择。目标界面为一目标3D虚拟形象的选择界面。用户可基于目标界面所展示的3D虚拟形象选择自己所需要的目标3D虚拟形象,当用户点击或触摸目标界面中的确认控件时,则生成相应的目标操作指令,目标操作指令中包括所选择的目标3D虚拟形象对应的目标标识。在终端生成目标操作指令后,将目标操作指令发送至服务器,以使得服务器获取到目标操作指令。在服务器获取到目标操作指令时,对目标操作指令进行解析,以得到目标操作指令所包含的目标标识,从关联关系中确定目标标识对应的目标3D虚拟形象。当预设设置好多个3D虚拟形象后,对每一个3D虚拟形象赋予唯一的标识,将3D虚拟形象按照标识与3D虚拟形象之间的对应关系进行存储,这样,在获取到终端发送的目标操作指令后,能够根据关联关系,获取到该目标操作指令对应的目标3D虚拟形象。
具体地说,在实现上述目标3D虚拟形象的驱动后,若用户想要更换目标3D虚拟形象,则按照上述获取目标3D虚拟形象的方式进行目标3D虚拟形象的更换。在更换目标3D虚拟形象后,按照S101~S105步骤实现更换后的目标3D虚拟形象的驱动即可。
S102:从目标视频帧中确定出2D人物,及确定2D人物对应的第一关键点位置集合。
在本实施例中,在获取到目标视频帧后,为了确定出2D人物在三维空间所对应的姿态数据,使用人体框将2D人物从目标视频中截取出来。在截取出2D人物后,利用2D关键点检测模型对2D人物的各个关键点位置进行检测,得到第一关键点位置集合,2D人物的各个关键点位置实质上为各个骨骼点位置。其中,2D关键点检测模型可通过训练卷积神经网络模型所得到的。各个关键点可根据实际需要进行设置,例如,各个关键点可包括头部、左肩、右肩、左手肘、右手肘、左手腕、右手腕、左臀、右臀、左膝盖、右膝盖、左脚踝及右脚踝。
S103:根据第一关键点位置集合,确定在三维空间中2D人物对应的第二关键点位置集合。
在本实施例中,在确定出2D人物对应的第一关键点位置集合后,将第一关键点位置集合输入至3D关键点检测模型中,以使得3D关键点检测模型输出与第一关键点位置集合对应的第二关键点位置集合。其中,同样的3D关键点检测模型可通过训练卷积神经网络模型所得到的。针对第一关键点位置集合中的每个第一关键点位置,通过3D关键点检测模型,能够得到第一关键点位置对应的第二关键点位置(其为在三维空间中2D人物所对应的),从而得到第一关键点位置集合对应的第二关键点位置集合。
S104:根据第二关键点位置集合,确定目标视频帧对应的第一姿态数据。
在本实施例中,第一姿态数据用于表征在三维空间中2D人物对应的姿态数据。在得到第二关键点位置集合后,对第二关键点位置集合进行转换处理,即可得到在三维空间中2D人物对应的姿态数据。具体地说,根据第二关键点位置集合,确定目标视频帧对应的第一姿态数据,包括:
确定在三维空间中2D人物对应的初始关键点位置集合及初始关键点位置集合对应的关键点级联关系;
根据初始关键点位置集合、关键点级联关系及第二关键点位置集合,确定在三维空间中2D人物对应的各关键点的旋转角度;
将在三维空间中所述2D人物对应的各关键点的旋转角度确定为目标视频帧对应的第一姿态数据。
在本实施例中,各关键点对应的旋转角度为三维的,用欧拉角表示。其中,预先设置并存储了在三维空间中2D人物对应的初始关键点位置集合。根据初始关键点位置集合即可确定在三维空间中2D人物对应的初始姿态数据。关键点级联关系实质上为骨骼点级联关系,其描述了骨骼点之间的父子关系,即每个骨骼点的位置、旋转及缩放等属性都与其父骨骼点有关联,父骨骼点的变换同时也会带来子骨骼点对应的变换,而子骨骼点的变换不会影响到父骨骼点的变换。所以,在确定出在三维空间中2D人物对应的初始关键点位置集合、第二关键点位置集合后,根据关键点级联关系所描述的骨骼点之间的父子关系,即可确定在三维空间中2D人物对应的各关键点的旋转角度。
在本实施例中,在执行完S104步骤得到第一姿态数据后,本实施例提供的一种3D虚拟形象的驱动方法,还包括如下步骤:
根据目标视频帧,确定满足预设条件的视频帧集合,预设条件包括:在目标视频帧中位于目标视频帧之前的第一数量的视频帧及位于目标视频帧之后的第二数量的视频帧,视频帧中包含有2D人物;
针对视频帧集合中的每个视频帧,获取视频帧对应的第二姿态数据,得到视频帧集合对应的姿态数据集合;
根据姿态数据集合和第一姿态数据,对第一姿态数据进行更新,以得到更新后的第一姿态数据。
具体地说,为了缓解3D虚拟形象的动作在时序上的抖动问题,提高其在时序上的稳定性。通过根据视频帧集合对应的姿态数据集合对第一姿态数据进行平滑处理。第一数量和第二数量的具体数值可根据实际需要进行设置,例如,第一数量可为2,第二数量也可以为2。根据姿态数据集合和第一姿态数据,第一姿态数据进行更新具体指,确定姿态数据集合中所包含的所有第二姿态数据和第一姿态数据的平均姿态数据,利用平均姿态数据对第一姿态数据进行更新,从而得到更新后的第一姿态数据。需要说明的是,在确定平均姿态数据时,根据相对应的关键点的旋转角度确定每个关键点的平均旋转角度,从而得到平均姿态数据。
S105:根据第一姿态数据,驱动目标3D虚拟形象。
在本实施例中,在得到第一姿态数据后,将第一姿态数据应用至目标3D虚拟形象上,即可实现目标3D虚拟形象的驱动。具体地说,根据第一姿态数据,驱动目标3D虚拟形象,包括:
获取2D人物与目标3D虚拟形象之间的姿态对应关系;
根据第一姿态数据和姿态对应关系,确定目标3D虚拟形象对应的第二姿态数据;
将第二姿态数据重定向至目标3D虚拟形象上,以驱动目标3D虚拟形象。
其中,针对目标视频帧中的2D人物,可以预先设置并存储该2D人物与目标3D虚拟形象之间的姿态对应关系,姿态对应关系实质上为各关键点的旋转角度之间的对应关系。当目标视频帧中的2D人物更换后,2D人物与目标3D虚拟形象之间的姿态对应关系也随之改变。通过预先设置2D人物与目标3D虚拟形象之间的姿态对应关系,以提高驱动目标3D虚拟形象的准确性。
具体地说,在上述中,得到更新后的第一姿态数据后,根据第一姿态数据,驱动目标3D虚拟形象包括:
根据更新后的第一姿态数据,驱动目标3D虚拟形象。
在本实施例中,为了更加形象驱动目标3D虚拟形象,本实施例中根据第一姿态数据,驱动目标3D虚拟形象,包括:
确定目标帧中2D人物对应的目标情绪;
根据目标情绪,确定目标3D虚拟形象对应的人脸参数数据;
根据第一姿态数据及人脸参数数据,驱动目标3D虚拟形象。
具体地说,在目标视频中包含有音频数据时,将音频数据转换成文本数据,根据文本数据确定目标视频帧中2D人物对应的目标情绪。其中,可根据现有情绪识别技术识别音频数据对应的目标情绪。在目标视频中不包含有音频数据时,对2D人物进行人脸识别,以确定2D人物对应的目标情绪,同样的,也可根据现有情绪识别技术识别人脸对应的目标情绪。预先设置并存储不同情绪与3D虚拟形象的人脸参数数据之间的对应关系,当得到目标情绪后,根据情绪与3D虚拟形象的人脸参数数据之间的对应关系,即可确定该目标情绪对应的人脸参数数据,将人脸参数数据应用至目标3D虚拟形象上,即可使得目标3D虚拟形象与2D人物的情绪保持一致。
为了提高确定目标视频帧中2D人物对应的目标情绪的准确性,本实施例中确定目标视频帧中2D人物对应的目标情绪,包括:
确定目标视频帧中2D人物对应的初始情绪;
确定在目标视频中与目标视频帧相邻的第一视频帧和第二视频帧,第一视频帧和第二视频帧中均包含有2D人物;
获取第一视频帧对应的第一情绪及第二视频帧对应的第二情绪;
在第一情绪与第二情绪一致及初始情绪与第一情绪及第二情绪均不一致的情况下,根据第一情绪或第二情绪更新初始情绪,以得到目标视频中2D人物对应的目标情绪。
具体地说,在确定目标视频帧中2D人物对应的情绪时,可能会存在识别不准确的情况,为了保证3D虚拟形象在时序上稳定性的问题,将初始所确定的目标视频帧中2D人物对应的初始情绪与位于其之前的第一视频帧对应的第一情绪和位于其之后的第二视频帧对应的第二情绪进行比较,在初始情绪、第一情绪和第二情绪一致的情况下,表征识别目标视频帧中2D人物对应的情绪较准确,可直接将初始情绪确定为目标情绪。在第一情绪和第二情绪一致且初始情绪与第一情绪及第二情绪均不相同的情况下,表征识别目标视频帧中2D人物对应情绪的不准确,为了保证3D虚拟形象在时序上稳定性将第一情绪或第二情绪确定为目标情绪。在初始情绪、第一情绪和第二情绪之间均不一致的情况下,将初始情绪确定为目标情绪即可。
本实施例提供的一种3D虚拟形象的驱动方法,通过对所获取的视频帧中的2D人物进行处理,以确定在三维空间中2D人物对应的姿态数据,从而根据所确定的姿态数据驱动所获取到的3D虚拟形象,无需一帧帧的刻画3D虚拟形象的动作,提高了驱动3D虚拟形象的效率。
参考图2,图2为本发明实施例提供的一个3D虚拟形象的驱动装置的结构示意图。本发明实施例提供的一种3D虚拟形象的驱动装置,包括:获取模块10、确定模块20及驱动模块30。其中,获取模块10,用于获取目标视频中的目标视频帧及目标3D虚拟形象,所述目标视频帧中包含有2D人物;确定模块20,用于从所述目标视频帧中确定出所述2D人物,及确定所述2D人物对应的第一关键点位置集合;所述确定模块20,还用于根据所述第一关键点位置集合,确定在三维空间中所述2D人物对应的第二关键点位置集合;所述确定模块20,还用于根据所述第二关键点位置集合,确定所述目标视频帧对应的第一姿态数据,所述第一姿态数据用于表征在三维空间中所述2D人物对应的姿态数据;驱动模块30,用于根据所述第一姿态数据,驱动所述目标3D虚拟形象。
在本实施例中,确定模块20还用于:
确定在三维空间中所述2D人物对应的初始关键点位置集合及所述初始关键点位置集合对应的关键点级联关系;
根据所述初始关键点位置集合、所述关键点级联关系及所述第二关键点位置集合,确定在三维空间中所述2D人物对应的各关键点的旋转角度;
将在三维空间中所述2D人物对应的各关键点的旋转角度确定为所述目标视频帧对应的第一姿态数据。
本实施例提供的一种3D虚拟形象的驱动装置,还包括:更新模块,更新模块用于:根据所述目标视频帧,确定满足预设条件的视频帧集合,所述预设条件包括:在所述目标视频中位于所述目标视频帧之前的第一数量的视频帧及位于所述目标视频帧之后的第二数量的视频帧,所述视频帧中包含有所述2D人物;
针对所述视频帧集合中的每个视频帧,获取所述视频帧对应的第二姿态数据,得到所述视频帧集合对应的姿态数据集合;
根据所述姿态数据集合和所述第一姿态数据,对所述第一姿态数据进行更新,以得到所更新后的所述第一姿态数据。
在本实施例中,驱动模块30还用于:
根据更新后的所述第一姿态数据,驱动所述目标3D虚拟形象。
在本实施例中,驱动模块30还用于:
获取所述2D人物与所述目标3D虚拟形象之间的姿态对应关系;
根据所述第一姿态数据和所述姿态对应关系,确定所述目标3D虚拟形象对应的第三姿态数据;
将所述第三姿态数据重定向至所述目标3D虚拟形象上,以驱动所述目标3D虚拟形象。
在本实施例中,驱动模块30还用于:
确定所述目标视频帧中所述2D人物对应的目标情绪;
根据所述目标情绪,确定所述目标3D虚拟形象对应的人脸参数数据;
根据所述第一姿态数据及所述人脸参数数据,驱动所述目标3D虚拟形象。
在本实施例中,驱动模块30还用于:
确定目标视频帧中所述2D人物对应的初始情绪;
确定在所述目标视频中与所述目标视频帧相邻的第一视频帧和的第二视频帧,所述第一视频帧和所述第二视频帧中均包含有所述2D人物;
获取所述第一视频帧对应的第一情绪及所述第二视频帧对应的第二情绪;
在所述第一情绪与所述第二情绪一致且所述初始情绪与所述第一情绪及所述第二情绪均不一致的情况下,根据所述第一情绪或所述第二情绪更新所述初始情绪,以得到所述目标视频帧中所述2D人物对应的目标情绪。
在本实施例中,获取模块10还用于:
获取针对目标界面的目标操作指令,所述目标界面中展示有多个3D虚拟形象,所述目标操作指令通过对多个所述3D虚拟形象进行选择所生成的,所述目标操作指令中携带有所述目标3D虚拟形象对应的目标标识;
根据所述目标标识,从关联关系中确定出所述目标标识对应的目标3D虚拟形象,所述关联关系中存储有多组标识与3D虚拟形象之间的对应关系。
本实施例提供的一种3D虚拟形象的驱动装置,通过对所获取的视频帧中的2D人物进行处理,以确定在三维空间中2D人物对应的姿态数据,从而根据所确定的姿态数据驱动所获取到的3D虚拟形象,无需一帧帧的刻画3D虚拟形象的动作,提高了驱动3D虚拟形象的效率。
图3为本发明实施例提供的一个电子设备的结构示意图,图3所示的电子设备400包括:至少一个处理器401、存储器402、至少一个网络接口404和其他用户接口403。电子设备400中的各个组件通过总线系统405耦合在一起。可理解,总线系统405用于实现这些组件之间的连接通信。总线系统405除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图3中将各种总线都标为总线系统405。
其中,用户接口403可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏)等。
可以理解,本发明实施例中的存储器402可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的存储器402旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器402存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统4021和应用程序4022。
其中,操作系统4021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序4022,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序4022中。
在本发明实施例中,通过调用存储器402存储的程序或指令,具体的,可以是应用程序4022中存储的程序或指令,处理器401用于执行各方法实施例所提供的方法步骤,例如包括:获取目标视频中的目标视频帧及目标3D虚拟形象,目标视频帧中包含有2D人物;从目标视频帧中确定出2D人物,及确定2D人物对应的第一关键点位置集合;根据第一关键点位置集合,确定在三维空间中2D人物对应的第二关键点位置集合;根据第二关键点位置集合,确定目标视频帧对应的第一姿态数据,第一姿态数据用于表征在三维空间中2D人物对应的姿态数据;根据第一姿态数据,驱动目标3D虚拟形象。
上述本发明实施例揭示的方法可以应用于处理器401中,或者由处理器401实现。处理器401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器401可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器402,处理器401读取存储器402中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本实施例提供的电子设备可以是如图3中所示的电子设备,可执行如图1中3D虚拟形象的驱动方法的所有步骤,进而实现图1所示3D虚拟形象的驱动方法的技术效果,具体请参照图1相关描述,为简洁描述,在此不作赘述。
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在3D虚拟形象的驱动设备侧执行的3D虚拟形象的驱动方法。
所述处理器用于执行存储器中存储的3D虚拟形象的驱动程序,以实现以下在3D虚拟形象的驱动设备侧执行的3D虚拟形象的驱动方法的步骤:获取目标视频中的目标视频帧及目标3D虚拟形象,目标视频帧中包含有2D人物;从目标视频帧中确定出2D人物,及确定2D人物对应的第一关键点位置集合;根据第一关键点位置集合,确定在三维空间中2D人物对应的第二关键点位置集合;根据第二关键点位置集合,确定目标视频帧对应的第一姿态数据,第一姿态数据用于表征在三维空间中2D人物对应的姿态数据;根据第一姿态数据,驱动目标3D虚拟形象。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种3D虚拟形象的驱动方法,其特征在于,包括:
获取目标视频中的目标视频帧及目标3D虚拟形象,所述目标视频帧中包含有2D人物;
从所述目标视频帧中确定出所述2D人物,及确定所述2D人物对应的第一关键点位置集合;
根据所述第一关键点位置集合,确定在三维空间中所述2D人物对应的第二关键点位置集合;
根据所述第二关键点位置集合,确定所述目标视频帧对应的第一姿态数据,所述第一姿态数据用于表征在三维空间中所述2D人物对应的姿态数据;
根据所述第一姿态数据,驱动所述目标3D虚拟形象。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第二关键点位置集合,确定所述目标视频帧对应的第一姿态数据,包括:
确定在三维空间中所述2D人物对应的初始关键点位置集合及所述初始关键点位置集合对应的关键点级联关系;
根据所述初始关键点位置集合、所述关键点级联关系及所述第二关键点位置集合,确定在三维空间中所述2D人物对应的各关键点的旋转角度;
将在三维空间中所述2D人物对应的各关键点的旋转角度确定为所述目标视频帧对应的第一姿态数据。
3.根据权利要求1所述的方法,其特征在于,所述方法,还包括:
根据所述目标视频帧,确定满足预设条件的视频帧集合,所述预设条件包括:在所述目标视频中位于所述目标视频帧之前的第一数量的视频帧及位于所述目标视频帧之后的第二数量的视频帧,所述视频帧中包含有所述2D人物;
针对所述视频帧集合中的每个视频帧,获取所述视频帧对应的第二姿态数据,得到所述视频帧集合对应的姿态数据集合;
根据所述姿态数据集合和所述第一姿态数据,对所述第一姿态数据进行更新,以得到所更新后的所述第一姿态数据;
所述根据所述第一姿态数据,驱动所述目标3D虚拟形象,包括:
根据更新后的所述第一姿态数据,驱动所述目标3D虚拟形象。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一姿态数据,驱动所述目标3D虚拟形象,包括:
获取所述2D人物与所述目标3D虚拟形象之间的姿态对应关系;
根据所述第一姿态数据和所述姿态对应关系,确定所述目标3D虚拟形象对应的第三姿态数据;
将所述第三姿态数据重定向至所述目标3D虚拟形象上,以驱动所述目标3D虚拟形象。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一姿态数据,驱动所述目标3D虚拟形象,包括:
确定所述目标视频帧中所述2D人物对应的目标情绪;
根据所述目标情绪,确定所述目标3D虚拟形象对应的人脸参数数据;
根据所述第一姿态数据及所述人脸参数数据,驱动所述目标3D虚拟形象。
6.根据权利要求5所述的方法,其特征在于,所述确定所述目标视频帧中所述2D人物对应的目标情绪,包括:
确定目标视频帧中所述2D人物对应的初始情绪;
确定在所述目标视频中与所述目标视频帧相邻的第一视频帧和的第二视频帧,所述第一视频帧和所述第二视频帧中均包含有所述2D人物;
获取所述第一视频帧对应的第一情绪及所述第二视频帧对应的第二情绪;
在所述第一情绪与所述第二情绪一致且所述初始情绪与所述第一情绪及所述第二情绪均不一致的情况下,根据所述第一情绪或所述第二情绪更新所述初始情绪,以得到所述目标视频帧中所述2D人物对应的目标情绪。
7.根据权利要求1所述的方法,其特征在于,所述获取目标3D虚拟形象,包括:
获取针对目标界面的目标操作指令,所述目标界面中展示有多个3D虚拟形象,所述目标操作指令通过对多个所述3D虚拟形象进行选择所生成的,所述目标操作指令中携带有所述目标3D虚拟形象对应的目标标识;
根据所述目标标识,从关联关系中确定出所述目标标识对应的目标3D虚拟形象,所述关联关系中存储有多组标识与3D虚拟形象之间的对应关系。
8.一种3D虚拟形象的驱动装置,其特征在于,包括:
获取模块,用于获取目标视频中的目标视频帧及目标3D虚拟形象,所述目标视频帧中包含有2D人物;
确定模块,用于从所述目标视频帧中确定出所述2D人物,及确定所述2D人物对应的第一关键点位置集合;
所述确定模块,还用于根据所述第一关键点位置集合,确定在三维空间中所述2D人物对应的第二关键点位置集合;
所述确定模块,还用于根据所述第二关键点位置集合,确定所述目标视频帧对应的第一姿态数据,所述第一姿态数据用于表征在三维空间中所述2D人物对应的姿态数据;
驱动模块,用于根据所述第一姿态数据,驱动所述目标3D虚拟形象。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的3D虚拟形象的驱动程序,以实现权利要求1~7中任一项所述的3D虚拟形象的驱动方法。
10.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1~7中任一项所述的3D虚拟形象的驱动方法。
CN202310248187.6A 2023-03-15 2023-03-15 一种3d虚拟形象的驱动方法、装置、电子设备及存储介质 Pending CN116309999A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310248187.6A CN116309999A (zh) 2023-03-15 2023-03-15 一种3d虚拟形象的驱动方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310248187.6A CN116309999A (zh) 2023-03-15 2023-03-15 一种3d虚拟形象的驱动方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116309999A true CN116309999A (zh) 2023-06-23

Family

ID=86826877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310248187.6A Pending CN116309999A (zh) 2023-03-15 2023-03-15 一种3d虚拟形象的驱动方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116309999A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116580169A (zh) * 2023-07-12 2023-08-11 南京硅基智能科技有限公司 一种数字人驱动方法及装置、电子设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116580169A (zh) * 2023-07-12 2023-08-11 南京硅基智能科技有限公司 一种数字人驱动方法及装置、电子设备和存储介质
CN116580169B (zh) * 2023-07-12 2023-10-31 南京硅基智能科技有限公司 一种数字人驱动方法及装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN109389030B (zh) 人脸特征点检测方法、装置、计算机设备及存储介质
CN108229343B (zh) 目标对象关键点检测方法、深度学习神经网络及装置
KR101457313B1 (ko) 템플릿 스위칭 및 특징 적응을 이용한 오브젝트 추적을 제공하는 방법, 장치 및 컴퓨터 프로그램 제품
CN107463331B (zh) 手势轨迹模拟方法、装置及电子设备
CN110610154A (zh) 行为识别方法、装置、计算机设备和存储介质
CN113392742A (zh) 异常动作确定方法、装置、电子设备及存储介质
CN109816758B (zh) 一种基于神经网络的二维角色动画生成方法和装置
CN108096833B (zh) 基于级联神经网络的体感游戏控制方法及装置、计算设备
CN110427849B (zh) 人脸姿态确定方法、装置、存储介质和电子设备
CN108304243B (zh) 界面生成方法、装置、计算机设备和存储介质
CN111290684B (zh) 图像显示方法、图像显示装置及终端设备
CN110428394B (zh) 用于目标移动侦测的方法、装置及计算机存储介质
CN116309999A (zh) 一种3d虚拟形象的驱动方法、装置、电子设备及存储介质
US20230237777A1 (en) Information processing apparatus, learning apparatus, image recognition apparatus, information processing method, learning method, image recognition method, and non-transitory-computer-readable storage medium
CN111832561B (zh) 基于计算机视觉的字符序列识别方法、装置、设备和介质
CN111273772A (zh) 基于slam测绘方法的增强现实交互方法、装置
KR102344227B1 (ko) 동체 검출 장치, 동체 검출 방법, 동체 검출 프로그램
CN107194871B (zh) 一种图像处理方法及移动终端
CN111316283B (zh) 姿势识别方法及装置
CN111444928A (zh) 关键点检测的方法、装置、电子设备及存储介质
CN110796130A (zh) 用于文字识别的方法、装置及计算机存储介质
CN110728172B (zh) 基于点云的人脸关键点检测方法、装置、系统及存储介质
CN109993067B (zh) 面部关键点提取方法、装置、计算机设备和存储介质
CN114510173A (zh) 基于增强现实的施工作业方法及装置
CN112685279B (zh) 脚本录制方法、装置、终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination