CN108564618B - 基于多体素块的手几何运动重建方法及装置 - Google Patents

基于多体素块的手几何运动重建方法及装置 Download PDF

Info

Publication number
CN108564618B
CN108564618B CN201810320747.3A CN201810320747A CN108564618B CN 108564618 B CN108564618 B CN 108564618B CN 201810320747 A CN201810320747 A CN 201810320747A CN 108564618 B CN108564618 B CN 108564618B
Authority
CN
China
Prior art keywords
hand
voxel
motion
skeleton
human hand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810320747.3A
Other languages
English (en)
Other versions
CN108564618A (zh
Inventor
徐枫
张�浩
刘烨斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201810320747.3A priority Critical patent/CN108564618B/zh
Publication of CN108564618A publication Critical patent/CN108564618A/zh
Application granted granted Critical
Publication of CN108564618B publication Critical patent/CN108564618B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/251Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Generation (AREA)

Abstract

本发明公开了一种基于多体素块的手几何运动重建方法及装置,其中,方法包括以下步骤:根据首帧的深度数据获取人手骨架,并对多体素块进行初始化;通过多体素块中已重建好的手模型对手进行运动估计,以得到新的深度数据;将新的深度数据融合到多体素块中,更新手的几何模型,以同时重建手的运动和几何模型。该方法能够同时重建人手的几何模型和运动信息,避免了传统人手运动重建过程中对参数化模型的依赖,增强了人手重建技术的鲁棒性并拓展人手重建技术的应用范围,推动人手重建技术的发展。

Description

基于多体素块的手几何运动重建方法及装置
技术领域
本发明涉及计算机视觉及图形学技术领域,特别涉及一种基于多体素块的手几何运动重建方法及装置。
背景技术
手的重建是计算机图形学领域中一个重要且基础的问题,在虚拟/增强现实、人机交互和人工智能领域内有着广泛的应用。例如,在虚拟现实领域中,通过重建人手的几何和运动,实现人手与虚拟物体之间的交互,增强人在虚拟环境中的真实感;在人机交互领域,近年来兴起的手势识别技术通过跟踪手的运动,将手特定的运动映射到指令集,可以代替传统的键盘和鼠标进行指令的下达,实现便携,智能的人机交互;在人工智能领域,通过实时采集和重建手的运动,并结合机器学习的方法可以实现手语的自动翻译。正是由于手的重建技术具有非常广泛的应用前景,因此具有极高的科研和应用价值。
然而,现有技术仍然存在缺陷,无法在重建手运动的同时重建真实且个性化的人手几何模型,限制了人手重建技术的应用范围。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种基于多体素块的手几何运动重建方法,能够增强人手重建技术的鲁棒性并拓展人手重建技术的应用范围。
本发明的另一个目的在于提出一种基于多体素块的手几何运动重建装置。
为达到上述目的,本发明一方面实施例提出了一种基于多体素块的手几何运动重建方法,包括以下步骤:根据首帧的深度数据获取人手骨架,并对多体素块进行初始化;通过所述多体素块中已重建好的手模型对手进行运动估计,以得到新的深度数据;以及将所述新的深度数据融合到所述多体素块中,更新手的几何模型,以同时重建手的运动和所述几何模型。
本发明实施例的基于多体素块的手几何运动重建方法,通过设置首帧的深度数据,从而对多体素块进行初始化,并得到新的深度数据,将新的深度数据融合到多体素块中,重建手的运动和所述几何模型,避免了传统人手运动重建过程中对参数化模型的依赖,增强了手重建技术的鲁棒性并拓展人手重建技术的应用范围,推动人手重建技术的发展。
另外,根据本发明上述实施例的基于多体素块的手几何运动重建方法还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述根据首帧深度数据获取人手骨架,并对多体素块进行初始化,进一步包括:使用所述多个体素块分别对人手的手掌和手指进行重建;利用所述首帧获得的人手骨架获取预设姿态下的骨架,并得到首帧人手骨架相对于所述预设姿态骨架的运动;利用所述预设姿态的人手骨架获取每个体素块的尺寸;将所述预设姿态的人手骨架嵌入到所述多体素块中,并为所述每个体素计算最近的两根手骨;以及利用首帧手骨架的运动驱动多体素,以将所述首帧的深度数据融合到所述多体素块中,获得人手的初始模型。
进一步地,在本发明的一个实施例中,所述将所述新的深度数据融合到所述多体素块中,更新手的几何模型,以同时重建手的运动和所述几何模型,进一步包括:利用前一帧的人手运动作为初始值,并驱动当前预设姿态下的多体素块的tsdf场,以获得运动后的tsdf场;通过将当前深度数据约束到所述运动后tsdf场过零点,以求解人手的运动;以及利用所述人手的运动驱动体素块中的体素,将所述当前深度数据融合到所述多体素块中,更新人手模型。
进一步地,在本发明的一个实施例中,体素的运动可表示为:
T(x)=SE3(normalize(w1·dq(p1)+w2·dq(p1)),
其中,dq(p)为手骨p的运动由对偶四元数表示,normalize()是对对偶四元数进行归一化,SE3()是将对偶四元数转化为变换矩阵T。
进一步地,在本发明的一个实施例中,所述多体素块中人手模型的更新为:
Figure BDA0001625195540000021
其中,{S(x),W(x)}为体素中存储的tsdf值和其置信度,μ表示截断长度,η为:
Figure BDA0001625195540000022
进一步地,其中,xc为运动之后体素的相机坐标,Tc为世界坐标系到相机坐标系之间的变换,xc z为xc的z坐标,K表示相机投影矩阵。
为达到上述目的,本发明另一方面实施例提出了一种基于多体素块的手几何运动重建装置,包括:初始化模块,用于根据首帧的深度数据获取人手骨架,并对多体素块进行初始化;运动估计模块,用于通过所述多体素块中已重建好的手模型对手进行运动估计,以得到新的深度数据;以及重建模块,用于将所述新的深度数据融合到所述多体素块中,更新手的几何模型,以同时重建手的运动和所述几何模型。
本发明实施例的基于多体素块的手几何运动重建装置,通过设置首帧的深度数据,从而对多体素块进行初始化,并得到新的深度数据,将新的深度数据融合到多体素块中,重建手的运动和所述几何模型,避免了传统人手运动重建过程中对参数化模型的依赖,增强了手重建技术的鲁棒性并拓展人手重建技术的应用范围,推动人手重建技术的发展。
另外,根据本发明上述实施例的基于多体素块的手几何运动重建装置还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述初始化模块,进一步用于:使用所述多个体素块分别对人手的手掌和手指进行重建;利用所述首帧获得的人手骨架获取预设姿态下的骨架,并得到首帧人手骨架相对于所述预设姿态骨架的运动;利用所述预设姿态的人手骨架获取每个体素块的尺寸;将所述预设姿态的人手骨架嵌入到所述多体素块中,并为所述每个体素计算最近的两根手骨;以及利用首帧手骨架的运动驱动多体素,以将所述首帧的深度数据融合到所述多体素块中,获得人手的初始模型。
进一步地,在本发明的一个实施例中,所述重建模块,进一步用于:利用前一帧的人手运动作为初始值,并驱动当前预设姿态下的多体素块的tsdf场,以获得运动后的tsdf场;通过将当前深度数据约束到所述运动后tsdf场过零点,以求解人手的运动;以及利用所述人手的运动驱动体素块中的体素,将所述当前深度数据融合到所述多体素块中,更新人手模型。
进一步地,在本发明的一个实施例中,体素的运动可表示为:
T(x)=SE3(normalize(w1·dq(p1)+w2·dq(p1)),
其中,dq(p)为手骨p的运动由对偶四元数表示,normalize()是对对偶四元数进行归一化,SE3()是将对偶四元数转化为变换矩阵T。
进一步地,在本发明的一个实施例中,所述多体素块中人手模型的更新为:
Figure BDA0001625195540000031
其中,{S(x),W(x)}为体素中存储的tsdf值和其置信度,μ表示截断长度,η为:
Figure BDA0001625195540000032
进一步地,其中,xc为运动之后体素的相机坐标,Tc为世界坐标系到相机坐标系之间的变换,xc z为xc的z坐标,K表示相机投影矩阵。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的基于多体素块的手几何运动重建方法的流程图;
图2为根据本发明一个实施例的适合于人手重建的多体素块数据结构图;
图3为根据本发明一个实施例的基于多体素块的手几何运动重建方法的流程图;
图4为根据本发明实施例的基于多体素块的手几何运动重建装置的结构示意图。
附图标记书明:
图2(a)中,(1)为手掌体素块、(2)为大拇指体素块、(3)为食指体素块、(4)为中指体素块、(5)为无名指体素块和(6)小拇指体素块。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参照附图描述根据本发明实施例提出的基于多体素块的手几何运动重建方法及装置,首先将参照附图描述根据本发明实施例提出的基于多体素块的手几何运动重建方法。
图1为根据本发明实施例的基于多体素块的手几何运动重建方法的流程图,如图1所示,该基于多体素块的手几何运动重建方法包括以下步骤:
在步骤S101中,根据首帧的深度数据获取人手骨架,并对多体素块进行初始化。
首先,根据图2,依据人手的解剖结构,将人手表示为多体素块结构,包括以下两个部分:多体素块和人手骨架。
其中,体素块是计算机用于存储模型TSDF值的数据结构。基于体素的重建方法常用于静态场景重建(如办公室重建)或动态场景重建(如人体重建)。常见体素结构为稠密体素块或稀疏体素块,体素之间在物理空间上互不重叠。为适应人手模型的重建,提出多体素块的数据结构,如图2(a)所示,包含6个体素块,分别为手掌体素块(1)、大拇指体素块(2)、食指体素块(3)、中指体素块(4)、无名指体素块(5)和小拇指体素块(6),分别用于重建手掌和5根手指。各体素块均为长方体结构,其大小和位置由人手标准姿态下的骨架尺寸确定,各体素块中的体素在标准坐标系下可能会有重叠。
进一步地,依据人手的运动特点和解剖结构,可将人手的运动信息使用如图2(b)所示的骨架结构进行表达。该骨架结构总共包含21个结点,各结点的自由度如图2(b)所示。结点之间通过手骨相互连接,构成铰链式的运动结构,人手的运动即可由手骨的运动完全表达。人手骨架的尺寸(如食指指骨的长度)与人手的实际尺寸(如食指长度)具有非常大的相关性。所以可以通过人手骨架的尺寸确定各体素块的尺寸,并且人手骨架的运动可以带着各体素块运动。
在本发明的一个实施例中,标准姿态下的人手骨架可以通过以下方法获得:
在输入视频的首帧估计人手的骨架结点,要求视频首帧的人手姿态应接近于标准姿态。对首帧人手骨架结点进行处理,获得标准姿态下的人手骨架以及首帧人手骨架相对于标准姿态骨架的运动。
如图3所示,可以理解的,根据首帧深度数据获取人手骨架,并对多体素块进行初始化,其步骤为:
使用多个体素块分别对人手的手掌和手指进行重建;利用首帧获得的人手骨架获取预设姿态下的骨架,并得到首帧人手骨架相对于预设姿态骨架的运动;利用预设姿态的人手骨架获取每个体素块的尺寸;将预设姿态的人手骨架嵌入到多体素块中,并为每个体素计算最近的两根手骨;利用首帧手骨架的运动驱动多体素,以将首帧的深度数据融合到多体素块中,获得人手的初始模型。
进一步地,在本发明的一个实施例中,多体素块的初始化包含确定各体素块的尺寸,计算对体素影响最大的两根手骨的索引和权重,以及将第一帧的深度信息融合到多体素块中三部分。
各体素块的尺寸可通过标准姿态下的人手骨架确定。其中,手掌体素块的长和宽由处于标准姿态下的结点0、2、7和13共同决定,手掌厚度单独确定。各手指体素块的长度由各手指的指尖结点和指根结点确定,如食指体素块的长度由结点4和17确定(注意体素块的长度应大于结点4和17的距离),手指体素块的宽度和厚度尺寸相等且单独确定。
可以理解的是,对体素运动影响最大的两根手骨的计算在标准姿态下进行。首先为每个体素块确定局部坐标系。选择结点0,2,4,7,10,13分别为手掌体素块,大拇指体素块,食指体素块,中指体素块,无名指体素块和小拇指体素块局部坐标系的坐标原点。选择手掌体素块的局部坐标系为多体素块的标准坐标系,如图2(b)所示,确定每个体素块的局部坐标系到标准坐标系的旋转Ri和平移ti,其中,i的取值范围为0~5,分别对应手掌体素块(1),大拇指体素(2),食指体素块(3),中指体素块(4),无名指体素块(5)和小拇指体素块(6)。然后为每个体素块确定会对该块内体素产生影响的手骨Pi。对手掌体素块中的体素产生影响的手骨包括P0={0-1,1-2,2-3,0-4,4-5,0-7,7-8,0-10,10-11,0-13,13-14},其中m-n表示两端结点分别为m和n的手骨;对大拇指体素块中的体素产生影响的手骨包括P1={1-2,2-3,3-16};对食指体素块中的体素产生影响的手骨包括P2={0-4,4-5,5-6,6-17};对中指体素块中的体素产生影响的手骨包括P3={0-7,7-8,8-9,9-18};对无名指体素块中的体素产生影响的手骨包括P4={0-10,10-11,11-12,12-19};对小拇指体素块中的体素产生影响的手骨包括P5={0-13,13-14,14-15,15-20}。最后选择两个距离最近的手骨作为影响该体素的手骨I(x)={p1,p2},得到:
Figure BDA0001625195540000061
进一步地,使用其距离的高斯函数作为影响权重W(v)={w1,w2},得到:
Figure BDA0001625195540000062
其中,d(xs,p)表示体素到手骨线段的最近距离,xs为体素的标准坐标,得到:
xs=Rix+ti
其中,x为体素的局部坐标。
在本发明的一个实施例中,可按照动态重建的方法将第一帧手的深度数据融合到多体素块中,具体地,体素的运动可表示为:
T(x)=SE3(normalize(w1·dq(p1)+w2·dq(p1)),
其中,dq(p)为手骨p的运动由对偶四元数表示,normalize()为对对偶四元数进行归一化,SE3()为将对偶四元数转化为变换矩阵T。
在步骤S102中,通过多体素块中已重建好的手模型对手进行运动估计,以得到新的深度数据。
在本发明的一个实施例中,手的运动可由手骨的运动完全表达,即Θ={dq(pj)|pj∈P0∪P1∪P2∪P3∪P4∪P5}。求解手的运动即求解Θ,使得能量最小,其公式为:
Figure BDA0001625195540000063
其中,v为当前深度图D所包含的手数据点,TSDF(v,Θ)为将多体素块中的tsdf场经Θ运动后得到的tsdf场在v处的值。
在步骤S103中,将新的深度数据融合到多体素块中,更新手的几何模型,以同时重建手的运动和几何模型。
可以理解的是,重建手的运动和几何模型具体包括:利用前一帧的人手运动作为初始值,并驱动当前预设姿态下的多体素块的tsdf场,以获得运动后的tsdf场;通过将当前深度数据约束到运动后tsdf场过零点,以求解人手的运动;利用人手的运动驱动体素块中的体素,将当前深度数据融合到多体素块中,更新人手模型。
在本发明的一个实施例中,在获得手的运动之后,便可使用如下公式将新的数据融合到多体素块中,完成多体素块中人手模型的更新:
Figure BDA0001625195540000071
其中,{S(x),W(x)}为体素中存储的tsdf值和其置信度,μ表示截断长度,η为:
Figure BDA0001625195540000072
进一步地,其中,xc为运动之后体素的相机坐标,Tc为世界坐标系到相机坐标系之间的变换,xc z为xc的z坐标,K表示相机投影矩阵。
本发明实施例的基于多体素块的手几何运动重建方法,通过设置首帧的深度数据,从而对多体素块进行初始化,并得到新的深度数据,将新的深度数据融合到多体素块中,重建手的运动和所述几何模型,避免了传统人手运动重建过程中对参数化模型的依赖,增强了手重建技术的鲁棒性并拓展人手重建技术的应用范围,推动人手重建技术的发展。
其次参照附图描述根据本发明实施例提出的基于多体素块的手几何运动重建装置。
图4是本发明一个实施例的基于多体素块的手几何运动重建装置的结构示意图。
如图2所示,该基于多体素块的手几何运动重建装置10包括:初始化模块100、运动估计模块200和重建模块300。
其中,初始化模块100用于根据首帧的深度数据获取人手骨架,并对多体素块进行初始化。运动估计模块200用于通过多体素块中已重建好的手模型对手进行运动估计,以得到新的深度数据。重建模块300用于将新的深度数据融合到多体素块中,更新手的几何模型,以同时重建手的运动和几何模型。该基于多体素块的手几何运动重建装置10能够增强手重建技术的鲁棒性并拓展人手重建技术的应用范围,推动人手重建技术的发展。
进一步地,在本发明的一个实施例中,初始化模块100,进一步用于:使用多个体素块分别对人手的手掌和手指进行重建;利用首帧获得的人手骨架获取预设姿态下的骨架,并得到首帧人手骨架相对于预设姿态骨架的运动;利用预设姿态的人手骨架获取每个体素块的尺寸;将预设姿态的人手骨架嵌入到多体素块中,并为每个体素计算最近的两根手骨;利用首帧手骨架的运动驱动多体素,以将首帧的深度数据融合到多体素块中,获得人手的初始模型。
进一步地,在本发明的一个实施例中,重建模块300,进一步用于:利用前一帧的人手运动作为初始值,并驱动当前预设姿态下的多体素块的tsdf场,以获得运动后的tsdf场;通过将当前深度数据约束到运动后tsdf场过零点,以求解人手的运动;利用人手的运动驱动体素块中的体素,将当前深度数据融合到多体素块中,更新人手模型。
进一步地,在本发明的一个实施例中,体素的运动可表示为:
T(x)=SE3(normalize(w1·dq(p1)+w2·dq(p1)),
其中,dq(p)为手骨p的运动由对偶四元数表示,normalize()是对对偶四元数进行归一化,SE3()是将对偶四元数转化为变换矩阵T。
进一步地,在本发明的一个实施例中,多体素块中人手模型的更新为:
Figure BDA0001625195540000081
其中,{S(x),W(x)}为体素中存储的tsdf值和其置信度,μ表示截断长度,η为:
Figure BDA0001625195540000082
进一步地,其中,xc为运动之后体素的相机坐标,Tc为世界坐标系到相机坐标系之间的变换,xc z为xc的z坐标,K表示相机投影矩阵。
需要说明的是,前述对基于多体素块的手几何运动重建方法实施例的解释说明也适用于该实施例的基于多体素块的手几何运动重建装置,此处不再赘述。
本发明实施例的基于多体素块的手几何运动重建装置,通过设置首帧的深度数据,从而对多体素块进行初始化,并得到新的深度数据,将新的深度数据融合到多体素块中,重建手的运动和所述几何模型,避免了传统人手运动重建过程中对参数化模型的依赖,增强了手重建技术的鲁棒性并拓展人手重建技术的应用范围,推动人手重建技术的发展。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (8)

1.一种基于多体素块的手几何运动重建方法,其特征在于,包括以下步骤:
根据首帧的深度数据获取人手骨架,并对多体素块进行初始化,所述根据首帧深度数据获取人手骨架,并对多体素块进行初始化,进一步包括:使用所述多体素块分别对人手的手掌和手指进行重建;利用所述首帧获得的人手骨架获取预设姿态下的骨架,并得到首帧人手骨架相对于所述预设姿态骨架的运动;利用所述预设姿态的人手骨架获取每个体素块的尺寸;将所述预设姿态的人手骨架嵌入到所述多体素块中,并为所述每个体素计算最近的两根手骨;利用首帧手骨架的运动驱动多体素,以将所述首帧的深度数据融合到所述多体素块中,获得人手的初始模型;
通过所述多体素块中已重建好的手模型对手进行运动估计,以得到新的人手运动,其中,手的运动由手骨的运动完全表达,即Θ={dq(pj)|pj∈P0∪P1∪P2∪P3∪P4∪P5},其中,dq(pj)为由对偶四元数表示的手骨pj的运动,P0、P1、P2、P3、P4和P5分别表示手掌、大拇指、食指、中指、无名指和小拇指所包含的手骨;求解手的运动即求解Θ,使得能量最小,其公式为:
Figure FDA0002622923360000011
其中,v为当前深度图D所包含的手数据点,TSDF(v,Θ)为将多体素块中的tsdf场经Θ运动后得到的tsdf场在v处的值;以及
根据所述人手运动将当前深度数据融合到所述多体素块中,更新手的几何模型,以同时重建手的运动和所述几何模型。
2.根据权利要求1所述的基于多体素块的手几何运动重建方法,其特征在于,所述将所述新的深度数据融合到所述多体素块中,更新手的几何模型,以同时重建手的运动和所述几何模型,进一步包括:
利用前一帧的人手运动作为初始值,并驱动当前预设姿态下的多体素块的tsdf场,以获得运动后的tsdf场;
通过将当前深度数据约束到所述运动后tsdf场过零点,以求解人手的运动;以及
利用所述人手的运动驱动体素块中的体素,将所述当前深度数据融合到所述多体素块中,更新人手模型。
3.根据权利要求2所述的基于多体素块的手几何运动重建方法,其特征在于,体素的运动可表示为:
T(x)=SE3(normalize(w1·dq(p1)+w2·dq(p1)),
其中,dq(p)为手骨p的运动由对偶四元数表示,normalize()是对对偶四元数进行归一化,SE3()是将对偶四元数转化为变换矩阵T,p1和p2为两个距离最近的手骨,w1和w2为影响权重,
Figure FDA0002622923360000021
d(xs,p)表示体素到手骨线段的最近距离,xs为体素的标准坐标,xs=Rix+ti,x为体素的局部坐标,每个体素块的局部坐标系到标准坐标系的旋转Ri和平移ti
4.根据权利要求3所述的基于多体素块的手几何运动重建方法,其特征在于,所述多体素块中人手模型的更新为:
Figure FDA0002622923360000022
其中,{S(x),W(x)}为体素中存储的tsdf值和其置信度,μ表示截断长度,η为:
Figure FDA0002622923360000023
进一步地,其中,xc为运动之后体素的相机坐标,Tc为世界坐标系到相机坐标系之间的变换,xc z为xc的z坐标,K表示相机投影矩阵。
5.一种基于多体素块的手几何运动重建装置,其特征在于,包括:
初始化模块,用于根据首帧的深度数据获取人手骨架,并对多体素块进行初始化,所述初始化模块,进一步用于:使用所述多体素块分别对人手的手掌和手指进行重建;利用所述首帧获得的人手骨架获取预设姿态下的骨架,并得到首帧人手骨架相对于所述预设姿态骨架的运动;利用所述预设姿态的人手骨架获取每个体素块的尺寸;将所述预设姿态的人手骨架嵌入到所述多体素块中,并为所述每个体素计算最近的两根手骨;利用首帧手骨架的运动驱动多体素,以将所述首帧的深度数据融合到所述多体素块中,获得人手的初始模型;
运动估计模块,用于通过所述多体素块中已重建好的手模型对手进行运动估计,以得到新的人手运动,其中,手的运动由手骨的运动完全表达,即Θ={dq(pj)|pj∈P0∪P1∪P2∪P3∪P4∪P5},其中,dq(pj)为由对偶四元数表示的手骨pj的运动,P0、P1、P2、P3、P4和P5分别表示手掌、大拇指、食指、中指、无名指和小拇指所包含的手骨;求解手的运动即求解Θ,使得能量最小,其公式为:
Figure FDA0002622923360000024
其中,v为当前深度图D所包含的手数据点,TSDF(v,Θ)为将多体素块中的tsdf场经Θ运动后得到的tsdf场在v处的值;以及
重建模块,用于根据所述人手运动将所述当前深度数据融合到所述多体素块中,更新手的几何模型,以同时重建手的运动和所述几何模型。
6.根据权利要求5所述的基于多体素块的手几何运动重建装置,其特征在于,所述重建模块,进一步用于:
利用前一帧的人手运动作为初始值,并驱动当前预设姿态下的多体素块的tsdf场,以获得运动后的tsdf场;
通过将当前深度数据约束到所述运动后tsdf场过零点,以求解人手的运动;以及
利用所述人手的运动驱动体素块中的体素,将所述当前深度数据融合到所述多体素块中,更新人手模型。
7.根据权利要求5所述的基于多体素块的手几何运动重建装置,其特征在于,体素的运动可表示为:
T(x)=SE3(normalize(w1·dq(p1)+w2·dq(p1)),
其中,dq(p)为手骨p的运动由对偶四元数表示,normalize()是对对偶四元数进行归一化,SE3()是将对偶四元数转化为变换矩阵T,p1和p2为两个距离最近的手骨,w1和w2为影响权重,
Figure FDA0002622923360000031
d(xs,p)表示体素到手骨线段的最近距离,xs为体素的标准坐标,xs=Rix+ti,x为体素的局部坐标,每个体素块的局部坐标系到标准坐标系的旋转Ri和平移ti
8.根据权利要求5所述的基于多体素块的手几何运动重建装置,其特征在于,所述多体素块中人手模型的更新为:
Figure FDA0002622923360000032
其中,{S(x),W(x)}为体素中存储的tsdf值和其置信度,μ表示截断长度,η为:
Figure FDA0002622923360000033
进一步地,其中,xc为运动之后体素的相机坐标,Tc为世界坐标系到相机坐标系之间的变换,xc z为xc的z坐标,K表示相机投影矩阵。
CN201810320747.3A 2018-04-11 2018-04-11 基于多体素块的手几何运动重建方法及装置 Active CN108564618B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810320747.3A CN108564618B (zh) 2018-04-11 2018-04-11 基于多体素块的手几何运动重建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810320747.3A CN108564618B (zh) 2018-04-11 2018-04-11 基于多体素块的手几何运动重建方法及装置

Publications (2)

Publication Number Publication Date
CN108564618A CN108564618A (zh) 2018-09-21
CN108564618B true CN108564618B (zh) 2020-12-01

Family

ID=63534483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810320747.3A Active CN108564618B (zh) 2018-04-11 2018-04-11 基于多体素块的手几何运动重建方法及装置

Country Status (1)

Country Link
CN (1) CN108564618B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443884B (zh) * 2019-07-17 2021-07-30 清华大学 手部运动重建方法和装置
CN112905006B (zh) * 2021-01-21 2022-12-02 清华大学 基于物理仿真的虚拟现实人手交互方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246602A (zh) * 2008-02-04 2008-08-20 东华大学 基于几何骨架的人体姿态重建方法
CN102254156A (zh) * 2011-07-06 2011-11-23 清华大学 人体三维模型配准方法及装置
CN102262783A (zh) * 2011-08-16 2011-11-30 清华大学 一种三维手势运动重建方法和系统
CN105654492A (zh) * 2015-12-30 2016-06-08 哈尔滨工业大学 基于消费级摄像头的鲁棒实时三维重建方法
CN106289181A (zh) * 2015-05-22 2017-01-04 北京雷动云合智能技术有限公司 一种基于视觉测量的实时slam方法
CN107705289A (zh) * 2017-09-05 2018-02-16 重庆邮电大学 一种基于骨架拓扑结构的血管模拟重建方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7961910B2 (en) * 2009-10-07 2011-06-14 Microsoft Corporation Systems and methods for tracking a model

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246602A (zh) * 2008-02-04 2008-08-20 东华大学 基于几何骨架的人体姿态重建方法
CN102254156A (zh) * 2011-07-06 2011-11-23 清华大学 人体三维模型配准方法及装置
CN102262783A (zh) * 2011-08-16 2011-11-30 清华大学 一种三维手势运动重建方法和系统
CN106289181A (zh) * 2015-05-22 2017-01-04 北京雷动云合智能技术有限公司 一种基于视觉测量的实时slam方法
CN105654492A (zh) * 2015-12-30 2016-06-08 哈尔滨工业大学 基于消费级摄像头的鲁棒实时三维重建方法
CN107705289A (zh) * 2017-09-05 2018-02-16 重庆邮电大学 一种基于骨架拓扑结构的血管模拟重建方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
BodyFusion: Real-time Capture of Human Motion and Surface Geometry Using a Single Depth Camera;Tao Yu 等;《ICCV 2017》;20171225;第4节,图2 *
Dynamics Based 3D Skeletal Hand Tracking;Stan Melax 等;《arXiv》;20170522;1-8 *
Hand3D: Hand Pose Estimation using 3D Neural Network;Xiaoming Deng 等;《arXiv》;20170407;1-14 *
Real-Time Geometry, Albedo, and Motion Reconstruction Using a Single RGB-D Camera;KAIWEN GUO 等;《ACM Transactions on Graphics》;20170731;第36卷(第3期);32:1-32:13 *
基于深度信息探测的三维动作重建与分析;谭艾迪 等;《江西科学》;20131015;第31卷(第5期);682-686 *

Also Published As

Publication number Publication date
CN108564618A (zh) 2018-09-21

Similar Documents

Publication Publication Date Title
Zhang et al. Interacting two-hand 3d pose and shape reconstruction from single color image
CN109636831B (zh) 一种估计三维人体姿态及手部信息的方法
Erol et al. Vision-based hand pose estimation: A review
Zurdo et al. Animating wrinkles by example on non-skinned cloth
Oberweger et al. Training a feedback loop for hand pose estimation
Erol et al. A review on vision-based full DOF hand motion estimation
JP5695758B2 (ja) 手のジェスチャによるヒューマンマシンインターフェースのための方法、回路、及び、システム
Petit et al. Tracking elastic deformable objects with an RGB-D sensor for a pizza chef robot
Liang et al. Model-based hand pose estimation via spatial-temporal hand parsing and 3D fingertip localization
JP2014501011A5 (zh)
Gutiérrez A et al. An ontology of virtual humans: Incorporating semantics into human shapes
Aristidou Hand tracking with physiological constraints
Choi et al. Towards a natural motion generator: A pipeline to control a humanoid based on motion data
CN108564618B (zh) 基于多体素块的手几何运动重建方法及装置
Shi et al. Automatic 3D virtual fitting system based on skeleton driving
CN116310066A (zh) 一种单图像三维人体形态估计方法及应用
Shimada et al. Macs: Mass conditioned 3d hand and object motion synthesis
Li et al. 3D hand reconstruction from a single image based on biomechanical constraints
Che et al. Detection-guided 3D hand tracking for mobile AR applications
Oliveira et al. Animating scanned human models
CN115908651A (zh) 一种三维人体模型与骨架的同步更新方法及电子设备
Liu et al. Single-image clothed 3D human reconstruction guided by a well-aligned parametric body model
Li et al. Serial-parallel multi-scale feature fusion for anatomy-oriented hand joint detection
Fan et al. Detail-preserved real-time hand motion regression from depth
Chen et al. A data-driven approach to efficient character articulation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant