CN112927330B - 用于生成虚拟人体图像的方法和系统 - Google Patents

用于生成虚拟人体图像的方法和系统 Download PDF

Info

Publication number
CN112927330B
CN112927330B CN202110316803.8A CN202110316803A CN112927330B CN 112927330 B CN112927330 B CN 112927330B CN 202110316803 A CN202110316803 A CN 202110316803A CN 112927330 B CN112927330 B CN 112927330B
Authority
CN
China
Prior art keywords
human body
data
kinect
hand
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110316803.8A
Other languages
English (en)
Other versions
CN112927330A (zh
Inventor
童冀
徐立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qiwei Visual Media Technology Co ltd
Original Assignee
Beijing Qiwei Visual Media Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qiwei Visual Media Technology Co ltd filed Critical Beijing Qiwei Visual Media Technology Co ltd
Priority to CN202110316803.8A priority Critical patent/CN112927330B/zh
Publication of CN112927330A publication Critical patent/CN112927330A/zh
Application granted granted Critical
Publication of CN112927330B publication Critical patent/CN112927330B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/014Hand-worn input/output arrangements, e.g. data gloves
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Psychiatry (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种用于生成虚拟人体图像的方法和系统,其中方法包括:通过至少一个Kinect设备获取待捕捉人体的人体姿态图像;对人体姿态图像进行处理以获取人体姿态数据;通过动作捕捉手套获取手部姿态数据;以及将变换后的手部姿态数据与人体姿态数据相结合,获得包含手指精细动作信息的完整人体姿态数据以用于在3D引擎中呈现。本公开的方法同时使用Kinect设备和动作捕捉手套获取姿态数据,然后再将两个数组结合得到完整人体姿态数据以用于呈现,一方面避免了使用价格高昂的全身动捕设备,另一方面使用动作捕捉手套加强手部数据的采集精度,避免了仅使用Kinect设备而造成的手部图像还原度差的缺点。利用本公开的方法可以获得成本低、精度高的虚拟人体图像。

Description

用于生成虚拟人体图像的方法和系统
技术领域
本公开涉及图像处理技术,特别是涉及一种用于生成虚拟人体图像的方法和系统。
背景技术
近年来随着三维动画和游戏的发展,让一个新的名词“动作捕捉”渐渐涌现在大众面前。简单来说,所谓“动作捕捉”就是通过特定的捕捉设备将动捕演员的运动信息记录下来,作为制作动画用的原始数据。这些原始数据将用来驱动虚拟的三维动画角色模型。相对于直接绘制三维动画角色的运动,上述方法一方面降低了对美术人员工作经验的依赖,降低了相关动画制作的人力成本;另一方面它也使得所制作的动画更为逼真流畅。目前,制作虚拟角色的软件越来越多,技术也走向成熟,越来越多的人能够参与到虚拟角色的构建工作中。
现有的能够实现逼真效果的技术方案通常是,为制作虚拟角色动作的动捕演员准备一套全身的动捕设备,该动捕设备内部设置大量的高精度传感器,以用于检测人员的精细动作。该动捕演员穿戴全身的动捕设备后进行动作表演,相应的处理设备能够采集动捕设备内部高精度传感器采集的数据,从而得到用于制作动画的原始数据。
然而,传统的全身动捕设备由于包含大量的高精度器件,因此价格高昂,一般需要数万元甚至几十万、几百万,因此不利于低成本制作。另外大部分动捕设备在结合手部动作时效果较差,只能实现手掌的方向,不能生成手指精细的动作数据,难以结合虚拟场景做出手部交互的效果。此外,由于传统的动补设备结构复杂,相关动捕演员在表演动作时需要花费很多时间进行设备穿戴,因此不利于动捕演员表演。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
根据本公开的一方面,提供了一种用于生成虚拟人体图像的方法,该包括:通过至少一个Kinect设备获取待捕捉人体的人体姿态图像;对人体姿态图像进行处理以获取能够在3D引擎中驱动虚拟人体动作的人体姿态数据;通过动作捕捉手套获取包含手指精细动作信息的手部姿态数据;根据人体姿态数据中手掌相对于手臂的旋转量将手部姿态数据变换到人体姿态数据所在的坐标系中;以及将变换后的手部姿态数据与人体姿态数据相结合,获得包含手指精细动作信息的完整人体姿态数据以用于在3D引擎中呈现。
本公开的方法同时使用Kinect设备和动作捕捉手套获取姿态数据,然后再将两个数组结合得到完整人体姿态数据以用于呈现。本公开通过使用Kinect设备利用图像采集方法采集人体姿态数据,避免了使用价格高昂的全身动捕设备,同时使用动作捕捉手套加强手部数据的采集精度,避免了仅使用Kinect设备而造成的手部图像粗糙的缺点。利用本公开的方法可以获得成本低、精度高的虚拟人体图像。
根据本公开的另一方面,提供了一种用于生成虚拟人体图像的系统,包括:至少一个Kinect设备、动作捕捉手套和图像处理设备。至少一个Kinect设备配置成通过获取待捕捉人体的人体姿态图像。动作捕捉手套配置成获取包含手指精细动作信息的手部姿态数据。图像处理设备分别与至少一个Kinect设备和动作捕捉手套通信连接,配置成对人体姿态图像进行处理以获取能够在3D引擎中驱动虚拟人体动作的人体姿态数据;根据人体姿态数据中手掌相对于手臂的旋转量将手部姿态数据变换到人体姿态数据所在的坐标系中;以及将变换后的手部姿态数据与人体姿态数据相结合,获得包含手指精细动作信息的完整人体姿态数据以用于在3D引擎中呈现。
根据本公开的第三方面,本公开的实施例公开了一种计算机设备,包括:处理器;以及存储计算机程序的存储器,计算机程序在由处理器执行时使得处理器执行上述用于生成虚拟人体图像的方法。
根据本公开的第四方面,本公开的实施例公开了一种存储计算机程序的计算机可读存储介质,计算机程序在由处理器执行时使得处理器执行上述用于生成虚拟人体图像的方法。
根据本公开的一个或多个实施例,可以首先分别获取人体姿态数据和手部姿态数据,然后再将两组数据结合。在结合的过程中,以人体姿态数据的手部位置作为参照,通过平移和旋转等操作将手部姿态数据精确地结合到人体姿态数据从而获得完整人体姿态数据。通过本公开的方法得到的人物图像具有高度的完整性和连续性,避免了出现人体图像和手部图像不匹配的情况。
根据在下文中所描述的实施例,本公开的这些和其它方面将是清楚明白的,并且将参考在下文中所描述的实施例而被阐明。
附图说明
在下面结合附图对于示例性实施例的描述中,本公开的更多细节、特征和优点被公开,在附图中:
图1示出了根据示例性实施例的用于生成虚拟人体图像的方法的示意图;
图2示出了根据示例性实施例的用于生成虚拟人体图像的方法的流程图;
图3示出了根据示例性实施例的用于生成虚拟人体图像的系统的结构框图;
图4示出了根据示例性实施例的用于生成虚拟人体图像的系统的结构示意图;
图5是示出能够用于实现本公开的实施例的示例性计算机系统的结构框图。
具体实施方式
在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
在本公开中对各种示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。如本文使用的,术语“多个”意指两个或更多,并且术语“基于”应解释为“至少部分地基于”。此外,术语“和/或”以及“……中的至少一个”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
下面结合附图详细描述本公开的示例性实施例。
图1示出了根据示例性实施例的用于生成虚拟人体图像的方法的示意图。该方法仅需要让动捕演员穿戴动作捕捉手套330表演动作,并配合Kinect设备310就能生成虚拟人体图像。该方法一般性地包括以下步骤:
步骤S101,通过至少一个Kinect设备310获取待捕捉人体的人体姿态图像;
步骤S102,对人体姿态图像进行处理以获取能够在3D引擎中驱动虚拟人体动作的人体姿态数据;
步骤S103,通过动作捕捉手套330获取包含手指精细动作信息的手部姿态数据;
步骤S104,根据人体姿态数据中手掌相对于手臂的旋转量将手部姿态数据变换到人体姿态数据所在的坐标系中;以及
步骤S105,将变换后的手部姿态数据与人体姿态数据相结合,获得包含手指精细动作信息的完整人体姿态数据以用于在3D引擎中呈现。
在步骤S101中,至少一个Kinect设备310可以是任何品牌、类型的Kinect设备310。在本实施例中优选为Azure Kinect。Kinect实际是一种3D体感摄影机,用于对运动中的人体进行拍摄,在一些实施例中,它还可以具有即时动态捕捉、影像辨识、麦克风输入、语音辨识、社群互动等功能。
上述人体姿态图像包括:待捕捉人体的深度图像和颜色图像。Kinect设备310主要包括深度相机和彩色相机两个部分,其中深度相机用于获取待捕捉人体的深度图像,深度相机可以优选地包括红外深度传感器,其通过检测人体发出的红外信号检测人体各部位的深度信息。彩色相机用于获取待捕捉人体的颜色图像。上述颜色图像可以是RGB颜色模式、CMYK颜色模式或任何颜色模式的图像。
在步骤S102中,将步骤S101中得到的人体的深度图像和颜色图像输入图像处理设备320中,得到能够在3D引擎中驱动虚拟人体动作的人体姿态数据。上述图像处理设备320安装有基于上述3D引擎的图像处理软件,该3D引擎可以为任何能够处理三维图像的引擎,在本实施例中优选为unity引擎。unity是实时3D互动内容创作和运营平台,其包含游戏开发、美术、建筑、汽车设计、影视在内的所有功能。unity引擎可以提供一整套完善的软件解决方案,可用于创作、运营和变现任何实时互动的2D和3D内容。上述图像处理设备320包括任何支持unity引擎的设备,其包括手机、平板电脑、PC、游戏主机、增强现实和虚拟现实设备等。
图像处理设备320首先可以选取人体上的多个检测点,检测点可以是人体主要运动关节所在的位置,因此检测点所在位置的数据可以表示人体的运动特征。上述检测点的数量可以为10个、20个、30个等等,具体数量可以根据所希望得到的虚拟图像的精细度而定。在本实施例中,优选设置20个检测点。图像处理设备320根据S101中获取的深度图像和彩色图像获取多个检测点的深度信息和颜色信息,从而对人体动作的特征进行提取。但是由于手部相对于人的身体比例较小,只能设置较少的检测点(例如:只有手掌处和中指指尖的3个可用的检测点),因此后续获得的手部特征较少,这样输出的手部图像太粗糙,无法实现手指的精细动画效果。
为了提高手部图像的显示效果,在步骤S103中,在Kinect设备310获取待捕捉人体的人体姿态图像(在下文也被称作原始的人体姿态图像)的同时,还通过动作捕捉手套330获取包含手指精细动作信息的手部姿态数据。通过将手部姿态数据替换或带入到人体姿态数据的手部数据中,可以使人体姿态数据包含高精度的手部数据。
虽然原始的人体姿态数据中没有高精度的手部数据,但是仍然含有表示手掌位置的数据(但是不具有各个手指和关节的相关数据)。在步骤S104中,基于原始的人体姿态数据,可以获得人体小臂的位置数据和与手臂相连的手掌的位置数据,基于上述两个位置数据可以得到手掌相对于手臂的旋转量。根据上述旋转量对步骤S103中获取的手部姿态数据进行变换处理,将手部姿态数据中的表示手掌位置的数据和人体姿态数据中表示手掌位置的数据相匹配,以实现手部姿态数据和人体姿态数据的结合。
在步骤S105中,获得上述包含手指精细动作信息的完整人体姿态数据后,可以将其输入图像处理设备320。完整人体姿态数据可以用于在3D引擎下驱动虚拟人体执行相应的动作。
本实施例的方法同时使用Kinect设备和动作捕捉手套获取姿态数据,然后再将两个数组结合得到完整人体姿态数据以用于呈现。本公开通过使用Kinect设备利用图像采集方法采集人体姿态数据,避免了使用价格高昂的全身动捕设备,同时使用动作捕捉手套加强手部数据的采集精度,避免了仅使用Kinect设备而造成的手部图像还原度差的缺点。利用本公开的方法可以获得成本低、精度高的虚拟人体图像。
图2示出了根据示例性实施例的用于生成虚拟人体图像的方法的流程图。该方法包括以下步骤:
步骤S201,驱动至少一个Kinect设备310以第一预设频率获取待捕捉人体的人体姿态图像;
步骤S202,对人体姿态图像进行处理以获取能够在3D引擎中驱动虚拟人体动作的人体姿态数据;
步骤S203,多个应力传感器331分别以第一预设频率获取多个应力数据;
步骤S204,根据多个应力数据确定手部各关节的弯曲程度;
步骤S205,基于各关节的弯曲程度确定手部各骨骼的旋转量,并生成转动矩阵以作为手部姿态数据
步骤S206,将手部姿态数据中的位置坐标平移到人体姿态数据所在的坐标系中手部位置;
步骤S207,根据人体姿态数据中手掌相对于手臂的旋转量,生成旋转矩阵;
步骤S208,将旋转矩阵应用于平移后的手部姿态数据以得到变换后的手部姿态数据;
步骤S209,将变换后的手部姿态数据与人体姿态数据相结合,获得包含手指精细动作信息的完整人体姿态数据以用于在3D引擎中呈现。
为了使得获得动态的虚拟人体图像,在步骤S201中,可以驱动至少一个Kinect设备310以第一预设频率获取待捕捉人体的人体姿态图像,从而在步骤S202中得到连续的人体姿态数据流,并最终在3D引擎中呈现虚拟人体的动画。
上述Kinect设备310可以为多个,多个Kinect设备310设置在动捕演员的不同角度上,每个Kinect设备310可以在不同位置同时获取不同角度的人体姿态图像,这样可以避免出现拍摄死角并且提高后续获取的人体姿态数据的精确度。例如设置在动捕演员正面的Kinect设备310无法获取动捕演员的背部图像,因此图像处理设备320无法提取存在于背部的检测点的图像特征。在这种情况下,可以在动捕演员的背面设置一个同样的Kinect设备310以获取其背部图像。上述多个Kinect设备310可以以串联的方式连接,以将人体姿态图像同时发送到图像处理设备320。在步骤S202中,可以对上述的多角度拍摄的人体姿态图像进行处理整合,得到相对准确的人体姿态数据。
另外,由于最终的完整人体姿态数据是由初始的人体姿态数据和手部姿态数据结合而来,因此要同步至少一个Kinect设备310和动作捕捉手套330的采集频率。在步骤S201中,驱动至少一个Kinect设备310以第一预设频率获取待捕捉人体的人体姿态图像,相应地,在步骤S203中,驱动动作捕捉手套330同样以第一预设频率获取手部姿态数据(也就是多个应力传感器331分别以第一预设频率获取多个应力数据)以使得人体姿态数据和手部姿态数据同步生成。
由于Kinect设备310包含红外深度传感器,因此其获取人体姿态图像的频率较慢,一般的Kinect设备310采集频率为30fps(即每秒30帧)左右。但是动作捕捉手套330主要利用应力传感器331检测手部姿态数据,因此其采集频率较快,一般约为60fps。为了更好的匹配Kinect设备310和动作捕捉手套330的采集频率,还可以预先设置多个Kinect设备310。在步骤S201中可以驱动多个Kinect设备310以第二预设频率交替地获取待捕捉人体的人体姿态图像,以使得多个Kinect设备310整体以第一预设频率获取待捕捉人体的人体姿态图像;其中第一预设频率大于第二预设频率。具体地,例如可以设置2个Kinect设备A和B,这两个Kinect设备310可以设置在同一位置处,每个Kinect设备310的采集频率均为30fps。可以通过对Kinect设备310进行相关参数设置使得Kinect设备A先采集图像,然后间隔1/60秒后,再驱动Kinect设备B采集图像,再经过1/60秒后,Kinect设备A重新采集图像,通过如上的交替采集的方式将多个Kinect设备310的整体的采集频率提高了一倍,即从30fps提高到了60fps,从而实现了与动作捕捉手套330的采集频率的匹配。当然,在本公开另外一些实施例中,至少一个Kinect设备310还包括3个或更多个Kinect设备310,以实现与动作捕捉手套330的在更高频率处的匹配。
通过设置多个Kinect设备310的频率匹配方案还可以和上述多角度采集人体姿态图像的方案相结合得到更加优选地方案。例如,可以设置4个Kinect设备A、B、C和D,Kinect设备A、B设置在动捕演员的正面,Kinect设备C、D设置在动捕演员的背面,Kinect设备A、C同步采集图像,Kinect设备B、D同步采集图像但是与Kinect设备A、C交替采集,如此既能够实现图像的无死角采集又能实现多个Kinect设备310与动作捕捉手套330的频率匹配。
本实施例的动作捕捉手套330内部设置有多个应力传感器331,例如可以设置10、20、30或更多个应力传感器331,其具体数量可以根据希望采集的手部姿态数据的精确度而定。上述多个应力传感器331优选地设置在手部的各个关节位置处,以便于测量手部施加的应力。通过多个应力传感器331分别获取多个应力数据,上述应力数据和手部的姿态相关联。例如,在手伸直时就是所有关节应力最小的状态,手指弯曲到任意程度均可以对应于应力传感器331的不同的应力数值。因此在步骤S204中,可以根据应力数据确定手部各关节的弯曲程度。通过各关节的弯曲程度进而可以计算得到各骨骼的旋转量。
在步骤S205中,手部姿态数据可以包括多组转动矩阵,每一组转动矩阵可以根据手部各骨骼的弯曲程度计算得到。例如手部姿态数据可以包括三组转动矩阵,每一组转动矩阵包括5个转动矩阵,第一组转动矩阵用于表示五根手指的最靠近手掌的指节相对于手掌的旋转量;第二组转动矩阵用于表示五根手指的中间指节相对于最靠近手掌的指节的旋转量;而第三组转动矩阵用于表示五根手指的指尖指节相对于中间指节的旋转量。如此,手部姿态数据包含了每个指节相对于手掌的位置数据,因此包含了手指精细动作信息。
上述手部姿态数据和人体姿态数据可以共同输入到图像处理设备320中,在步骤S206至步骤S209中,图像处理设备320将手部姿态数据和人体姿态数据结合得到包含手指精细动作信息的完整人体姿态数据。具体地,上述结合过程包含两个主要步骤,即步骤S206和步骤S207。
步骤S206为坐标平移步骤,即将手部姿态数据中的位置坐标平移为人体姿态数据所在的坐标系中手部位置的坐标。由于手部姿态数据是在动作捕捉手套330中形成的,因此其空间位置坐标与人体姿态数据所在的坐标系不匹配,步骤S206的目的是将手部姿态数据中的位置坐标转换到人体姿态数据所在的坐标系中,以便于后续两组数据的结合。示例性地,手部姿态数据包含手掌根部(手掌和手臂的连接点)的位置坐标,可以将上述位置坐标直接替换为人体姿态数据中相应的手掌根部点的坐标,手部姿态数据中其他点的位置坐标进行相应的平移,以实现两组数据位置上的结合。
步骤S207为坐标旋转步骤,即根据人体姿态数据中手掌相对于手臂的旋转量,生成旋转矩阵。将旋转矩阵应用于平移后的手部姿态数据,相当于将手部姿态数据中的手掌位置与人体姿态数据中的手掌位置进行重合,以实现两组数据旋转角度上的结合。经过上述两个变换过程后将得到变换后的手部姿态数据。
由于已经实现了人体姿态数据和手部姿态数据中的手掌图像的完全重合,因此在步骤S209中,可以在图像处理设备320中直接将变换后的手部姿态数据与人体姿态数据相结合,从而获得包含手指精细动作信息的完整人体姿态数据以用于在3D引擎中呈现。
根据本公开的一个或多个实施例,可以首先分别获取人体姿态数据和手部姿态数据,然后再将两组数据结合。在结合的过程中,以人体姿态数据的手部位置作为参照,通过平移和旋转等操作将手部姿态数据精确地结合到人体姿态数据从而获得完整人体姿态数据。通过本公开的方法得到的人物图像具有高度的完整性和连续性,避免了出现人体图像和手部图像不匹配的情况。
在本实施例中,还可以在3D引擎中对上述完整人体姿态数据进行进一步操作,以实现例如在虚拟场景中人体和物体之间的交互。示例性地,可以将上述完整人体姿态数据输入3D引擎(例如,unity引擎)中,然后在3D引擎创建一个物体模型,然后通过调用3D引擎中内置的刚体碰撞函数来实现虚拟人体和虚拟物体之间的相互作用,例如实现人体触碰物体、拿起物体或被物体阻挡等的动画内容。
本公开的方法中,在通过至少一个Kinect设备310获取待捕捉人体的人体姿态数据的步骤之前还包括:对至少一个Kinect设备310进行位置较准。在Kinect设备310运行前,需要对至少其中一个Kinect设备310进行位置校准,以确定后续获得的人体姿态数据的原点坐标。
另外,本实施例的方法还包括:对完整人体姿态数据进行平滑处理。上述平滑处理可以通过使用滑动平均的算法把数据中每一帧的前后时刻的一共2n+1个帧的数据值做平均,得到当前帧的滤波结果。上述平滑处理可以防止由于动捕演员或其他数据采集设备的意外抖动而出现的画面不连续。
本公开还公开了一种用于生成虚拟人体图像的系统。图3示出了该系统的结构框图,图4示出了该系统的结构示意图。该系统包括:至少一个Kinect设备310、图像处理设备320、动作捕捉手套330。至少一个Kinect设备310配置成通过获取待捕捉人体的人体姿态图像。动作捕捉手套330配置成获取包含手指精细动作信息的手部姿态数据。图像处理设备320分别与至少一个Kinect设备310和动作捕捉手套330通信连接,例如图像处理设备320可以与Kinect设备310信号线连接,与动作捕捉手套330无线连接(例如通过蓝牙、Wi-Fi等形式连接)。图像处理设备320配置成对人体姿态图像进行处理以获取能够在3D引擎中驱动虚拟人体动作的人体姿态数据;根据人体姿态数据中手掌相对于手臂的旋转量将手部姿态数据变换到人体姿态数据所在的坐标系中;以及将变换后的手部姿态数据与人体姿态数据相结合,获得包含手指精细动作信息的完整人体姿态数据以用于在3D引擎中呈现。
上述图像处理设备320还包括:平移模块321和旋转模块322。平移模块321配置成将手部姿态数据中的位置坐标平移为人体姿态数据所在的坐标系中手部位置的坐标。旋转模块322配置成根据人体姿态数据中手掌相对于手臂的旋转量,生成旋转矩阵,以及将旋转矩阵应用于平移后的手部姿态数据以得到变换后的手部姿态数据。
至少一个Kinect设备310,还配置成以第一预设频率获取待捕捉人体的人体姿态图像。动作捕捉手套330,还配置成同样以第一预设频率获取手部姿态数据以使得人体姿态数据和手部姿态数据同步生成。
至少一个Kinect设备310包括多个Kinect设备310,并且多个Kinect设备310,配置成以第二预设频率交替地获取待捕捉人体的人体姿态图像,以使得多个Kinect设备310整体以第一预设频率获取待捕捉人体的人体姿态图像;其中第一预设频率大于第二预设频率。
至少一个Kinect设备310包括多个Kinect设备310,并且多个Kinect设备310分别设置于待捕捉人体的不同角度,并配置成分别获取多个角度的人体姿态图像。
述动作捕捉手套330还包括:多个应力传感器331和计算模块332。多个应力传感器331配置成分别获取多个应力数据。计算模块332根据多个应力数据确定手部各关节的弯曲程度,以及基于各关节的弯曲程度确定手部各骨骼的旋转量,并生成转动矩阵以作为手部姿态数据。
上述系统还包括:校准设备340,配置成对至少一个Kinect设备310进行位置较准。上述校准设备340可以是Kinect设备310内置的设备,可以通过调节Kinect设备310的相关参数实现Kinect设备310的位置较准。校准设备340还可以是独立设备,例如可以是设置在动捕演员周围的多个红外位置传感器,多个红外位置传感器通过检测动捕演员所在位置对Kinect设备310进行位置较准。
图像处理设备320还包括:平滑处理模块323,其配置成对完整人体姿态数据进行平滑处理。平滑处理模块323可以是图像处理设备320的内置模块,例如可以通过对图像处理设备320内部软件的操作实现对完整人体姿态数据进行平滑处理。
根据本公开的实施例,还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
这里,用于生成虚拟人体图像的系统300中的各部件的操作分别与前面描述的步骤S101~S105的操作类似,在此不再赘述。
参考图5,现将描述可以作为本公开的服务器或客户端的电子设备500的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506、输出单元507、存储单元508以及通信单元509。输入单元506可以是能向设备500输入信息的任何类型的设备,输入单元506可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入,并且可以包括但不限于鼠标、键盘、触摸屏、轨迹板、轨迹球、操作杆、麦克风和/或遥控器。输出单元507可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元508可以包括但不限于磁盘、光盘。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、1302.11设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如用于生成虚拟人体图像的方法。例如,在一些实施例中,用于生成虚拟人体图像的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的用于生成虚拟人体图像的方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行用于生成虚拟人体图像的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行、也可以顺序地或以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、系统和设备仅仅是示例性的实施例或示例,本公开的范围并不由这些实施例或示例限制,而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。

Claims (16)

1.一种用于生成虚拟人体图像的方法,包括:
通过至少一个Kinect设备获取待捕捉人体的人体姿态图像,包括驱动所述至少一个Kinect设备以第一预设频率获取待捕捉人体的人体姿态图像;
对所述人体姿态图像进行处理以获取能够在3D引擎中驱动所述虚拟人体动作的人体姿态数据;
通过动作捕捉手套获取包含手指精细动作信息的手部姿态数据,包括驱动所述动作捕捉手套同样以所述第一预设频率获取所述手部姿态数据以使得所述人体姿态数据和所述手部姿态数据同步生成;
根据所述人体姿态数据中手掌相对于手臂的旋转量将所述手部姿态数据变换到所述人体姿态数据所在的坐标系中;以及
将变换后的所述手部姿态数据与所述人体姿态数据相结合,获得包含手指精细动作信息的完整人体姿态数据以用于在所述3D引擎中呈现,
其中,所述至少一个Kinect设备包括多个所述Kinect设备,并且驱动所述至少一个Kinect设备以第一预设频率获取待捕捉人体的人体姿态图像还包括:
驱动多个所述Kinect设备以第二预设频率交替地获取待捕捉人体的人体姿态图像,以使得多个所述Kinect设备整体以所述第一预设频率获取待捕捉人体的人体姿态图像;其中
所述第一预设频率大于所述第二预设频率。
2.如权利要求1所述的方法,其中,根据所述人体姿态数据中手掌相对于手臂的旋转量将所述手部姿态数据变换到所述人体姿态数据所在的坐标系中还包括:
将所述手部姿态数据中的位置坐标平移到所述人体姿态数据所在的坐标系中手部位置;
根据所述人体姿态数据中手掌相对于手臂的旋转量,生成旋转矩阵;
将所述旋转矩阵应用于平移后的所述手部姿态数据以得到变换后的所述手部姿态数据。
3.如权利要求1至2中任一项所述的方法,其中,所述人体姿态图像包括:待捕捉人体的深度图像和颜色图像。
4.如权利要求1至2中任一项所述的方法,其中,所述至少一个Kinect设备包括多个所述Kinect设备,并且通过至少一个Kinect设备获取待捕捉人体的人体姿态图像还包括:
使用多个串联的所述Kinect设备分别获取人体的多个角度的人体姿态图像。
5.如权利要求1至2中任一项所述的方法,其中,所述动作捕捉手套内部设置有多个应力传感器,并且,通过动作捕捉手套获取包含手指精细动作信息的手部姿态数据还包括:
通过所述多个所述应力传感器分别获取多个应力数据;
根据所述多个应力数据确定手部各关节的弯曲程度;
基于所述各关节的弯曲程度确定手部各骨骼的旋转量,并生成转动矩阵以作为所述手部姿态数据。
6.如权利要求1至2中任一项所述的方法,其中,在通过至少一个Kinect设备获取待捕捉人体的人体姿态数据的步骤之前还包括:
对所述至少一个Kinect设备进行位置较准。
7.如权利要求1至2中任一项所述的方法,还包括:
对所述完整人体姿态数据进行平滑处理。
8.一种用于生成虚拟人体图像的系统,包括:
至少一个Kinect设备,配置成以第一预设频率获取待捕捉人体的人体姿态图像;
动作捕捉手套,配置成同样以所述第一预设频率获取包含手指精细动作信息的手部姿态数据以使得所述人体姿态数据和所述手部姿态数据同步生成;和
图像处理设备,分别与所述至少一个Kinect设备和所述动作捕捉手套通信连接,配置成对所述人体姿态图像进行处理以获取能够在3D引擎中驱动所述虚拟人体动作的人体姿态数据;
根据所述人体姿态数据中手掌相对于手臂的旋转量将所述手部姿态数据变换到所述人体姿态数据所在的坐标系中;以及
将变换后的所述手部姿态数据与所述人体姿态数据相结合,获得包含手指精细动作信息的完整人体姿态数据以用于在所述3D引擎中呈现,
其中,所述至少一个Kinect设备包括多个所述Kinect设备,并且
多个所述Kinect设备,配置成以第二预设频率交替地获取待捕捉人体的人体姿态图像,以使得多个所述Kinect设备整体以所述第一预设频率获取待捕捉人体的人体姿态图像;其中
所述第一预设频率大于所述第二预设频率。
9.如权利要求8所述的系统,其中,所述图像处理设备还包括:
平移模块,配置成将所述手部姿态数据中的位置坐标平移到所述人体姿态数据所在的坐标系中手部位置;和
旋转模块,配置成根据所述人体姿态数据中手掌相对于手臂的旋转量,生成旋转矩阵,以及将所述旋转矩阵应用于平移后的所述手部姿态数据以得到变换后的所述手部姿态数据。
10.如权利要求8至9中任一项所述的系统,其中,所述至少一个Kinect设备包括多个所述Kinect设备,并且
多个所述Kinect设备分别设置于待捕捉人体的不同角度,并配置成分别获取多个角度的人体姿态图像。
11.如权利要求8至9中任一项所述的系统,其中,所述动作捕捉手套还包括:
多个应力传感器,配置成分别获取多个应力数据;和
计算模块根据所述多个应力数据确定手部各关节的弯曲程度,以及基于所述各关节的弯曲程度确定手部各骨骼的旋转量,并生成转动矩阵以作为所述手部姿态数据。
12.如权利要求8至9中任一项所述的系统,还包括:
校准设备,配置成对所述至少一个Kinect设备进行位置较准。
13.如权利要求8至9中任一项所述的系统,其中,所述图像处理设备还包括:
平滑处理模块,配置成对所述完整人体姿态数据进行平滑处理。
14.一种计算机设备,包括:
存储器、处理器以及存储在所述存储器上的计算机程序,
其中,所述处理器被配置为执行所述计算机程序以实现权利要求1至7中任一项所述方法的步骤。
15.一种非暂态计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
16.一种计算机程序产品,包括计算机程序,其中,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
CN202110316803.8A 2021-03-17 2021-03-17 用于生成虚拟人体图像的方法和系统 Active CN112927330B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110316803.8A CN112927330B (zh) 2021-03-17 2021-03-17 用于生成虚拟人体图像的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110316803.8A CN112927330B (zh) 2021-03-17 2021-03-17 用于生成虚拟人体图像的方法和系统

Publications (2)

Publication Number Publication Date
CN112927330A CN112927330A (zh) 2021-06-08
CN112927330B true CN112927330B (zh) 2024-04-26

Family

ID=76175889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110316803.8A Active CN112927330B (zh) 2021-03-17 2021-03-17 用于生成虚拟人体图像的方法和系统

Country Status (1)

Country Link
CN (1) CN112927330B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113487674B (zh) * 2021-07-12 2024-03-08 未来元宇数字科技(北京)有限公司 一种人体位姿估计系统和方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015199502A1 (ko) * 2014-06-26 2015-12-30 한국과학기술원 증강현실 상호 작용 서비스 제공 장치 및 방법
CN108376405A (zh) * 2018-02-22 2018-08-07 国家体育总局体育科学研究所 基于双体感追踪系统的人体运动捕捉系统及捕捉方法
CN109453509A (zh) * 2018-11-07 2019-03-12 龚映清 一种基于肌电和运动捕捉的虚拟上肢控制系统及其方法
CN109542220A (zh) * 2018-10-25 2019-03-29 广州大学 一种带有校准和学习功能的手语手套、系统及实现方法
CN109782911A (zh) * 2018-12-30 2019-05-21 广州嘉影软件有限公司 基于虚拟现实的全身动作捕捉方法和系统
CN111383176A (zh) * 2020-03-18 2020-07-07 北京七维视觉传媒科技有限公司 证件照片的生成方法、客户端及服务端

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160096473A (ko) * 2015-02-05 2016-08-16 한국전자통신연구원 동작 평가 시스템 및 방법
CN108052202B (zh) * 2017-12-11 2021-06-11 深圳市星野信息技术有限公司 一种3d交互方法、装置、计算机设备及存储介质
US11741673B2 (en) * 2018-11-30 2023-08-29 Interdigital Madison Patent Holdings, Sas Method for mirroring 3D objects to light field displays

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015199502A1 (ko) * 2014-06-26 2015-12-30 한국과학기술원 증강현실 상호 작용 서비스 제공 장치 및 방법
CN108376405A (zh) * 2018-02-22 2018-08-07 国家体育总局体育科学研究所 基于双体感追踪系统的人体运动捕捉系统及捕捉方法
CN109542220A (zh) * 2018-10-25 2019-03-29 广州大学 一种带有校准和学习功能的手语手套、系统及实现方法
CN109453509A (zh) * 2018-11-07 2019-03-12 龚映清 一种基于肌电和运动捕捉的虚拟上肢控制系统及其方法
CN109782911A (zh) * 2018-12-30 2019-05-21 广州嘉影软件有限公司 基于虚拟现实的全身动作捕捉方法和系统
CN111383176A (zh) * 2020-03-18 2020-07-07 北京七维视觉传媒科技有限公司 证件照片的生成方法、客户端及服务端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
航天员虚拟交互操作训练多体感融合驱动方法研究;邹俞;晁建刚;杨进;;图学学报(第04期);134-143 *

Also Published As

Publication number Publication date
CN112927330A (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN111694429B (zh) 虚拟对象驱动方法、装置、电子设备及可读存储
CN110889890B (zh) 图像处理方法及装置、处理器、电子设备及存储介质
WO2021031819A1 (zh) 一种图像处理方法和电子设备
WO2021093453A1 (zh) 三维表情基的生成方法、语音互动方法、装置及介质
CN110517319B (zh) 一种相机姿态信息确定的方法及相关装置
US10469829B2 (en) Information processor and information processing method
WO2018119889A1 (zh) 三维场景定位方法和装置
US10846936B2 (en) Image display method and device
CN111291885A (zh) 近红外图像的生成方法、生成网络的训练方法和装置
US11074437B2 (en) Method, apparatus, electronic device and storage medium for expression driving
EP3992919A1 (en) Three-dimensional facial model generation method and apparatus, device, and medium
CN113426117B (zh) 虚拟相机拍摄参数获取方法、装置、电子设备和存储介质
CN111294665A (zh) 视频的生成方法、装置、电子设备及可读存储介质
CN110688948A (zh) 视频中人脸性别变换方法、装置、电子设备和存储介质
US20160086349A1 (en) Tracking hand pose using forearm-hand model
CN111556337B (zh) 一种媒体内容植入方法、模型训练方法以及相关装置
CN112927330B (zh) 用于生成虚拟人体图像的方法和系统
CN116342782A (zh) 生成虚拟形象渲染模型的方法和装置
CN113221767B (zh) 训练活体人脸识别模型、识别活体人脸的方法及相关装置
CN116848556A (zh) 使用多视图细化来增强三维模型
CN111291218B (zh) 视频融合方法、装置、电子设备及可读存储介质
Liu et al. Skeleton tracking based on Kinect camera and the application in virtual reality system
CN116311519B (zh) 动作识别方法、模型训练方法及装置
CN112714337A (zh) 视频处理方法、装置、电子设备和存储介质
Shi et al. Error elimination method in moving target tracking in real-time augmented reality

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant