CN111353355B

CN111353355B - 动作追踪系统及方法

Info

Publication number: CN111353355B
Application number: CN201811606826.7A
Authority: CN
Inventors: 许富淞; 汪德美
Original assignee: Industrial Technology Research Institute ITRI
Current assignee: Industrial Technology Research Institute ITRI
Priority date: 2018-12-24
Filing date: 2018-12-26
Publication date: 2023-09-19
Anticipated expiration: 2038-12-26
Also published as: CN111353355A; US20200202538A1; TW202024864A; TWI715903B; US11164321B2

Abstract

一种动作追踪系统，包括第一取像模块、运算模块与数据库。第一取像模块拍摄物体的全身动作，以取得深度影像。数据库提供多个训练样本，且训练样本包括关于物体的关节的多个深度特征信息。运算模块接收深度影像，并依据深度影像与训练样本的深度特征信息，对深度影像进行相关联运算及预测，以得到物体的多个第一关节位置，并将第一关节位置投影到三维空间，以产生物体的三维骨架。其中，深度影像包括物体的肢体未被遮蔽或是物体的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽。

Description

动作追踪系统及方法

技术领域

本发明关于一种追踪系统，特别是关于一种动作追踪系统及方法。

背景技术

全身动作侦测(Full Body Tracking)技术被广泛地应用在电影工业、游戏产业、运动、复健和人机互动等领域。以目前来说，虚拟现实(virtual reality，VR)互动技术的主要提供者仅提供双手动作的侦测，并没有提供身体和下肢动作的侦测。

由于现有的全身动作追踪技术无法直接应用在头戴式VR头盔，因此对于目前全身动作侦测来说，VR互动是以穿戴动作控制器(motion controller)为主，亦即使用者必须手持动作控制器，或是在身上配戴动作控制器，以便达到全身动作侦测及追踪，如此将会造成使用上的不便。因此，全身动作追踪的设计上仍有改善的空间。

发明内容

本发明提供一种动作追踪系统及方法，以准确地获得物体的三维骨架，以便对物体的全身动作进行追踪，并增加使用上的便利性。

本发明提供一种动作追踪系统，包括第一取像模块、运算模块与数据库。第一取像模块拍摄物体的全身动作，以取得深度影像。数据库提供多个训练样本，且训练样本包括关于物体的关节的多个深度特征信息。运算模块接收深度影像，并依据深度影像与数据库的训练样本的深度特征信息，对深度影像进行相关联运算及预测，以得到物体的多个第一关节位置，并将第一关节位置投影到三维空间，以产生物体的三维骨架。其中，深度影像包括物体的肢体未被遮蔽的影像或是物体的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽的影像。

本发明提供一种动作追踪方法，包括以下步骤。拍摄物体的全身动作，以取得深度影像。提供多个训练样本，其中训练样本包括关于物体的关节的多个深度特征信息。接收深度影像。依据深度影像与训练样本的深度特征信息，对深度影像进行相关联运算及预测，以得到物体的多个第一关节位置，其中深度影像包括物体的肢体未被遮蔽的影像或是物体的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽的影像。将第一关节位置投影到三维空间。产生物体的三维骨架，其中物体的三维骨架包括物体的手指骨架。

本发明所揭露的动作追踪方法及方法，通过第一取像模块拍摄物体的全身动作，以取得深度影像，且依据深度影像与训练样本的深度特征信息，对深度影像(包括物体的肢体未被遮蔽的影像或是物体的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽的影像)进行相关联运算及预测，以得到物体的多个第一关节位置，并将第一关节位置投影到三维空间，以产生物体的三维骨架。如此一来，可准确地获得物体的三维骨架，以便对物体的全身动作进行追踪，并增加使用上的便利性。

附图说明

图1A为依据本发明的一实施例的动作追踪系统的示意图。

图1B为依据本发明的一实施例的物体的三维骨架的示意图。

图1C为第1A图的第一取像模块、运算模块与头戴式装置的配置关系示意图。

图2A为依据本发明的另一实施例的动作追踪系统的示意图。

图2B为第2A图的第一取像模块、第二取像模块、运算模块与头戴式装置的配置关系示意图。

图3为依据本发明的一实施例的动作追踪方法的流程图。

图4A与图4B为依据本发明的另一实施例的动作追踪方法的流程图。

图5为图4B的步骤S420的详细流程图。

图6为依据本发明的另一实施例的动作追踪方法的流程图。

【附图中本公开实施例主要元件符号说明】

100、200：动作追踪系统

110：第一取像模块

120、220：运算模块

130、230：数据库

140、240：头戴式装置

150：物体

210：第二取像模块

160、250：测量模块

S302～S312、S402～S422、S502～S504、S602～S604：步骤

具体实施方式

在以下所列举的各实施例中，将以相同的标号代表相同或相似的组件或组件。

图1A为依据本发明的一实施例的动作追踪系统的示意图。本实施例的动作追踪系统100适用于虚拟和扩增实境中。请参考图1A，动作追踪系统100包括第一取像模块110、运算模块120与数据库130。

第一取像模块110拍摄物体150的全身动作，以取得深度影像。在本实施例中，第一取像模块110例如为深度摄影机，且此深度摄影机也可以为广角的深度摄影机。举例来说，第一取像模块110的视野角度可以是90度、180度、270度、360度或720度等，但不用于限制本发明的实施例。另外，上述物体150例如为用户、动物、机器人或是其他具有关节部位的物体等。

数据库130可以是储存装置，例如内存或硬盘等。数据库130可以储存提供多个训练样本，且这些训练样本可以包括关于物体150的关节的多个深度特征信息。在本实施例中，前述多个训练样本可以由用户预先进行设置。例如，用户可以在物体150或用户的周围环境设置多个摄影机的动作捕捉(Motion Capture)系统，并通过这些摄影机对物体150或用户进行肢体动作的拍摄，且通过运算模块120将上述摄影机所拍摄的多种视角的影像进行分析，以物体150或用户的三维骨架。同时地，用户也可以将动作追踪系统100装设在物体150或用户上，并通过第一取像模块110拍摄物体150与用户的全身动作，以取得深度影像。

接着，运算模块120取得第一取像模块110所拍摄的深度影像，并将上述物体150或用户的三维骨架与深度影像进行关联，以计算出物体150或用户的关节的深度特征。并且，运算模块120将每一动作对应的深度特征信息作为不同的训练样本，并将上述训练样本储存于数据库130中。另外，上述训练样本中也包括有对应于物体150或用户的肢体未被遮蔽的影像的深度特征信息或对应于物体150或用户的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽的影像的深度特征信息。

在本实施例中，当物体150或用户的肢体未被遮蔽时，表示物体150或用户的全身肢体都未被遮蔽。当物体150或用户的部分肢体未被遮蔽及物体150的另一部分肢体有被遮蔽时，表示物体150或用户的部分肢体有被其他肢体遮蔽。举例来说，物体150或用户的第一肢体(例如脚)被物体150或用户的第二肢体(例如手臂)遮蔽。或是，物体150或用户的第一肢体(例如身体躯干及脚)被物体150或用户的第二肢体(例如手臂)遮蔽。第一肢体与第一取像模块110之间的距离较第二肢体与第一取像模块110之间的距离远。

运算模块120耦接第一取像模块110，接收第一取像模块110所取得的深度影像，并依据深度影像与数据库130的训练样本的深度特征信息，对深度影像进行相关联及预测运算，以得到物体150的多个第一关节位置。上述深度影像包括物体150的肢体未被遮蔽的影像或是物体150的部分肢体未被遮蔽及物体150的另一部分肢体有被遮蔽的影像。

在本实施例中，运算模块120可为处理器或微控制器等。另外，运算模块120也例如是一芯片、一电路、一电路板或储存数组程序代码的记录媒体。

在本实施例中，运算模块120例如使用深层类神经网络(Deep Neural Network，DNN)或人工智能(artificial intelligence，AI)等的处理方式，将深度影像与训练样本的深度特征信息进行相关联运算及预测，确定深度影像的对应物体150的关节位置，以得到物体150的多个第一关节位置。其中，前述深层类神经网络例如为ResNet或是其他类似的类神经网络。

举例来说，当深度影像包括物体150的肢体未被遮蔽的影像时，运算模块120可以由数据库130中取得对应此深度影像(即物体150的肢体未被遮蔽的影像)的深度特征信息，亦即与此深度影像的相似度最接近的训练样本的深度特征信息。并且，这些深度特征信息包括有对应于物体150的全身肢体未被遮蔽时的物体150的全身肢体的相关信息。接着，运算模块120将深度特征信息与深度影像进行相关联运算及预测，确定出深度影像中的物体150的关节位置，以得到物体150的多个第一关节位置。

当深度影像包括物体150的部分肢体未被遮蔽及物体150的另一部分肢体有被遮蔽的影像时，运算模块120可以由数据库130中取得对应此深度影像(即物体150的部分肢体未被遮蔽及物体150的另一部分肢体有遮蔽的影像)的深度特征信息，亦即与此深度影像的相似度最接近的训练样本的深度特征信息。并且，这些深度特征信息包括有对应于物体150的部分肢体未被遮蔽及物体150的另一部分肢体有遮蔽时的物体150的全身肢体的相关信息。接着，运算模块120便可依据深度特征信息中所记录的关节位置对深度影像进行相关联运算及预测，来确定深度影像中的物体150的关节位置，以得到物体150的多个第一关节位置。

若物体150是以用户为例，则物体150的第一关节位置例如可以包括用户的手、手臂、臀部、膝盖、脚踝、手指等的关节位置。在本实施例中，当物体150的肢体未被遮蔽时，表示物体150的全身肢体都未被遮蔽。当物体150的部分肢体未被遮蔽及物体150的另一部分肢体有被遮蔽时，表示物体150的部分肢体有被其他肢体遮蔽。举例来说，物体150的第一肢体(例如脚)被物体150的第二肢体(例如手臂)遮蔽。或是，物体150的第一肢体(例如身体躯干及脚)被物体150的第二肢体(例如手臂)遮蔽。第一肢体与第一取像模块110之间的距离较第二肢体与第一取像模块110之间的距离远。

接着，运算模块120将上述第一关节位置投影到三维空间，以产生物体150的三维骨架。也就是说，在运算模块120取得物体150的第一关节位置后，运算模块120将第一关节位置投影到三维空间，并根据第一关节位置之间的对应关系，将第一关节位置(如图1B所示的“圆点”)进行连接，以产生对应的物体150的三维骨架，如图1B所示的“圆点加连接线”。其中，图1B的物体150的三维骨架包括有使用者的手、手臂、臀部、膝盖、脚踝、手指等。如此一来，可准确地获得物体150的三维骨架，以便对物体150的全身动作进行追踪，并增加使用上的便利性。

在本实施例中，动作追踪系统100更包括头戴式装置140，且第一取像模块110与运算模块120可以设置在头戴式装置140上，如图1C所示。如此，可以将头戴式装置140装设于物体150上，以便对物体150的肢体动作进行侦测，进而有效地产生物体150的三维骨架。

在一实施例中，第一取像模块110可设置在头戴式装置140的壳体内，以对物体150进行全身动作的拍摄，且运算模块120与数据库130可设置在头戴式装置140的壳体内，以对第一取像模块110所取得的深度影像进行运算。

在另一实施例中，第一取像模块110可设置在头戴式装置140的壳体外，以对物体150进行拍摄，进而取得对应物体150的全身动作的深度影像。进一步来说，第一取像模块110可以设置在头戴式装置140的壳体外的下方、中央或上方等。

在本实施例中，将头戴式装置140穿戴于物体150的头部时，第一取像装置110由上往下的视野角度(Top-down View)，使得远离第一取像110的深度影像的物体150的肢体(例如物体150的下肢部位)容易被物体150的手臂遮挡住而无法辨识(arm-leg self-occlusions)。由于在运算模块120的数据库130内已储存物体150的肢体被遮蔽所对应的三维骨架，因此运算模块120不会受到深度影像中的物体150的肢体有被遮蔽的影响。

当深度影像包括物体150的部分肢体未被遮蔽及物体150的另一部分肢体有被遮蔽的影像时，运算模块120仍可通过数据库130内取得与此深度影像的相似度接近的训练样本的深度特征信息，并依据此深度特征信息，对深度影像中的物体150的肢体进行相关联运算及预测，以确定物体150的肢体的关节位置，使得运算模块120可精确地产生三维骨架。也就是说，在头戴式装置140的视角频繁发生手臂遮挡住身体躯干或下肢部位的情况，运算模块120仍可预测身体躯干和下肢部位的关节位置，精确地产生三维骨架。

另外，在本实施例中，运算模块120可以头戴式装置140(即动作追踪系统100)为原点，依据第一取像模块110所取得的深度影像，计算物体150的肢体到头戴式装置140的相对位置和方向及物体150的肢体的运动方向与加速度，以投影物体150对应的虚拟肢体影像(即三维骨架)至虚拟环境中。其中，虚拟环境所呈现的虚拟肢体与物体150的真实动作一致。

此外，由于第一取像模块110的视野角度可为180或360度，使得物体150的肢体距离头戴式装置140的距离太近，第一取像装置110仍可从头戴式装置140拍摄到物体150的全身动作。并且，随着物体150与头戴式装置140移动，环境背景也不断改变，通过第一取像模块110取得对应物体150的深度影像，可以有效地分辨物体150的动作和环境背景，使得动作追踪系统100可精确地产生的三维骨架，而不会受到环境背景的改变的影响。

另外，通过第一取像模块110取得对应物体150的深度影像，也可以有效地识别物体150的肢体(如脚踝、脚掌)，使得动作追踪系统100可精确地产生包含脚踝、脚掌的三维骨架。其中，脚踝、脚掌距离头戴式装置140较远。

进一步来说，动作追踪系统100可以包括测量模块160。在本实施例中，测量模块160可以是惯性测量单元(inertial measurement unit，IMU)。测量模块160连接运算模块120，测量并计算物体150的头部的位置、移动方向及移动速度，以产生头部姿态。接着，运算模块120更依据头部姿态，并将头部姿态与第一关节位置相关联，并将第一关节位置与头部姿态投影到三维空间，以产生物体的三维骨架。也就是说，运算模块120所产生的三维骨架包括有物体150的肢体(例如手、脚等)，也包括物体150的头部。另外，测量模块160也可设置在头戴式装置140的壳体内。

图2A为依据本发明的另一实施例的动作追踪系统的示意图。本实施例的动作追踪系统200适用于虚拟和扩增实境中。请参考图2A，动作追踪系统200包括第一取像模块110、第二取像模块210、运算模块220与数据库230。其中，本实施例的第一取像模块110及物体150与图1A的第一取像模块110的物体150相同或相似，故可参考图1A的实施例的说明，故在此不再赘述。

第二取像模块210拍摄物体150的全身动作，以产生全局影像。在本实施例中，第二取像模块210例如为彩色鱼眼摄影机、单色鱼眼摄影机或红外线鱼眼摄影机。并且，第二取像模块210的视野角度可以为180度以上，以便拍摄物体150的全身动作。进一步来说，第二取像模块210的视野角度也可为270度或360度或720度。

数据库230可以是储存装置，例如内存或硬盘等。数据库230可以储存并提供多个训练样本，且这些训练样本可以包括关于物体150的关节的多个深度特征信息与多个彩色特征信息。在本实施例中，前述多个训练样本可以由用户预先进行设置。其中，训练样本的深度特征信息的设置方式可以参考图1A的实施例的说明，故在此不再赘述。

另外，用户可以在物体150或用户的周围环境设置多个摄影机的动作捕捉系统，并通过这些设置在周围环境的摄影机对物体150或用户进行肢体动作的拍摄，且通过运算模块220将上述摄影机所拍摄的多种视角的影像进行分析，以取得物体150或用户的三维骨架。同时地，用户也可以将动作追踪系统200装设在物体150或用户上，并通过第二取像模块210拍摄物体150或用户的全身动作，以取得全局影像。接着，运算模块220取得第二取像模块210所拍摄的全局影像，并将上述物体150或用户的三维骨架与全局影像进行关联，以计算出物体150或用户的关节的彩色特征。并且，运算模块220将每一动作对应的彩色特征信息作为不同的训练样本，并将上述训练样本储存于数据库230中。另外，上述训练样本中也包括有对应于物体150或用户的肢体未被遮蔽的影像的彩色特征信息以及对应于物体150或用户的部分肢体未被遮蔽及物体150或用户的另一部分肢体有被遮蔽的影像的彩色特征信息。

在本实施例中，当物体150或用户的肢体未被遮蔽时，表示物体150或用户的全身肢体都未被遮蔽。当物体150或用户的部分肢体未被遮蔽及另一部分肢体有被遮蔽时，表示物体150或用户的部分肢体有被其他肢体遮蔽。举例来说，物体150或用户的第一肢体(例如脚)被物体150或用户的第二肢体(例如手臂)遮蔽。或是，物体150或用户的第一肢体(例如身体躯干及脚)被物体150或用户的第二肢体(例如手臂)遮蔽。第一肢体与第二取像模块210之间的距离较第二肢体与第二取像模块210之间的距离远。

运算模块220耦接第一取像模块110、第二取像模块210与数据库230，接收第一取像模块110所取得的深度影像及第二取像模块210所取得的全局影像。在本实施例中，运算模块220可为处理器或微控制器等。另外，运算模块220也例如是一芯片、一电路、一电路板或储存数组程序代码的记录媒体。接着，运算模块220依据深度影像、全局影像与数据库230的训练样本的深度特征信息与彩色特征信息，对深度影像进行相关联及预测运算，以得到物体150的多个第一关节位置及多个第二关节位置。上述深度影像包括物体150的肢体未被遮蔽的影像或是物体150的部分肢体未被遮蔽及物体150的另一部分肢体有被遮蔽的影像。上述全局影像包括物体150的肢体未被遮蔽的影像或是物体150的部分肢体未被遮蔽及物体150的另一部分肢体有被遮蔽的影像。

在本实施例中，运算模块220例如通过深层类神经网络或人工智能的处理方式，将深度影像与训练样本的深度特征信息及全局影像与训练样本的彩色特征信息进行相关联运算及预测，确定深度影像及全局影像中对应上述物体150的关节位置，以得到物体150的多个第一关节位置及多个第二关节位置。其中，前述深层类神经网络例如为ResNet或是其他类似的类神经网络。

举例来说，当深度影像包括物体150的肢体未被遮蔽的影像时，运算模块220可以由数据库230中取得对应此深度影像(即物体150的肢体未被遮蔽的影像)的深度特征信息，亦即与此深度影像的相似度最接近的训练样本的深度特征信息。并且，这些深度特征信息包括有对应于物体150的全身肢体未被遮蔽时的物体150的全身肢体的相关信息。接着，运算模块220将深度特征信息与深度影像进行相关联运算及预测，确定出深度影像中的物体150的关节位置，以得到物体150的多个第一关节位置。

当深度影像包括物体150的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽的影像时，运算模块220可以由数据库230中取得对应此深度影像(即物体150的部分肢体未被遮蔽及物体150的另一部分肢体有遮蔽)的深度特征信息，亦即与此深度影像的相似度最接近的训练样本的深度特征信息。并且，这些深度特征信息包括有对应于物体150的部分肢体未被遮蔽及物体150的另一部分肢体有遮蔽时的物体150的全身肢体的相关信息。接着，运算模块220依据深度特征信息中所记录的关节位置对深度影像进行相关联运算及预测，来确定深度影像中的物体150的关节位置，以得到物体150的多个第一关节位置。

另外，当全局影像包括物体150的肢体未被遮蔽的影像时，运算模块220可以由数据库230中取得对应此全局影像(即物体150的肢体未被遮蔽的影像)的彩色特征信息，亦即与此全局影像的相似度最接近的训练样本的彩色特征信息。并且，这些彩色特征信息包括有对应于物体150的全身肢体未被遮蔽时的物体150的全身肢体的相关信息。接着，运算模块220将彩色特征信息与全局影像进行相关联运算及预测，确定出全局影像中的物体150的关节位置，以得到物体150的多个第二关节位置。

当彩色影像包括物体150的部分肢体未被遮蔽及物体150的另一部分肢体有被遮蔽的影像时，运算模块220可以由数据库230中取得对应此全局影像(即物体150的部分肢体未被遮蔽及物体150的另一部分肢体有遮蔽的影像)的彩色特征信息，亦即与此全局影像的相似度最接近的训练样本的彩色特征信息。并且，这些彩色特征信息包括有对应于物体150的部分肢体未被遮蔽及物体150的另一部分肢体有遮蔽时的物体150的全身肢体的相关信息。接着，运算模块220依据彩色特征信息中所记录的关节位置进行对全局影像进行相关联运算及预测，来确定全局影像中的物体150的关节位置，以得到物体150的多个第二关节位置。

接着，运算模块220将上述第一关节位置与第二关节位置投影到三维空间，且对第一关节位置与第二关节位置进行整合运算，以产生对应的物体150的三维骨架。

举例来说，运算模块220可依据深度影像与全局影像，设定权重比例。也就是说，运算模块220可依据深度影像与全局影像的预测节点位置机率(probability)的高低，设定权重比例。在本实施例中，深度影像与全局影像所对应的权重的总和例如为1。举例来说，一般情况下，运算模块220会将深度影像与全局影像所对应的权重分别设置为0.5。

另外，若是第二取像模块210可能会受到光线或颜色的干扰，使得全局影像的预测机率下降，则运算模块220会调降全局影像所对应的权重，例如调整为0.3，且运算模块220会对应调升深度影像所对应的权重，例如调整为0.7。

此外，若是全局影像受到干扰导致全局影像的预测机率已到达无法辨识时，则运算模块220会将全局影像所对应的权重调降至0，且运算模块220会对应将深度影像所对应的权重调升至1。也就是说，动作追踪系统200会以深度影像为主来产生物体150的三维骨架，以避免造成物体150的三维骨架的准确度下降。

接着，运算模块220会依据上述权重比例，将第一关节位置与第二关节位置进行整合运算，以产生物体150的三维骨架，如图1B所示的“圆点加连接线”。

举例来说，运算模块220可以根据公式(1)将第一关节位置与第二关节位置进行迭代更新操作，并根据公式(2)将相同部位的关节位置进行群聚，再将已对应人体150的三维骨架的关节位置进行连接，以产生物体150的三维骨架。并且，公式(1)和(2)分别如下所示：

其中，为对应人体150的三维骨架的关节位置，/>为对应深度影像的第一关节位置，/>为对应全局影像的第二关节位置，/>为权重比例。其中，通过设定公式(2)的限制角度值θ，运算模块220可以有效地将限制角度值θ的范围内的相同部位的指定关节位置/>进行群聚，以避免纳入将其他部位而使得所产生的物体150的三维骨架的准确度产生下降或失真的问题。

在本实施例中，动作追踪系统200更包括头戴式装置240。并且，第一取像模块110、第二取像模块210与运算模块220可以设置在头戴式装置240上，如图2B所示。如此，可以将头戴式装置240装设于物体150上，以便对物体150的肢体动作进行侦测，进而有效地产生物体150的三维骨架。

在一实施例中，第一取像模块110与第二取像模块210可设置在头戴式装置240的壳体内，以对物体150的全身动作进行拍摄，且运算模块220与数据库230可设置在头戴式装置240的壳体内，以对第一取像模块110及第二取像模块210所取得的影像进行运算。

在另一实施例中，第一取像模块110与第二取像模块210可设置在头戴式装置240的壳体外，以对物体150进行拍摄，进而取得对应物体150的全身动作的深度影像及全局影像。进一步来说，第一取像模块110与第二取像模块210可以设置在头戴式装置240的壳体外的下方、中央或上方等。

在本实施例中，将头戴式装置240穿戴于物体150的头部时，第一取像模块110与第二取像模块210由上往下的视野角度(Top-down View)，使得远离第一取像模块110与第二取像模块210的物体150的肢体(例如物体150的下肢部位)容易被物体150的手臂遮挡住而无法辨识(arm-leg self-occlusions)。由于在运算模块220的数据库230内已储存物体150的肢体被遮蔽所对应的三维骨架，因此运算模块220不会受到影像中的物体150的肢体有被遮蔽的影响。

当深度影像及全局影像同时包括物体150的部分肢体未被遮蔽及物体150的另一部分肢体被遮蔽的影像时，运算模块220仍可通过数据库230内的深度特征信息与彩色特征信息，预测受到遮蔽的物体150的肢体的关节位置，使得运算模块220可精确地产生三维骨架。也就是说，在头戴式装置240的视角频繁发生手臂遮挡住身体躯干或下肢部位的情况，运算模块220仍可预测身体区干和下肢部位的关节位置，精确地产生三维骨架。

另外，在本实施例中，运算模块220可以头戴式装置240(即动作追踪系统200)为原点，依据第一取像模块110所取得的深度影像与第二取像模块210所取得的全局影像，计算物体150的肢体到头戴式装置240的相对位置和方向及物体150的肢体的运动方向与加速度，以投影物体150对应的虚拟肢体影像至虚拟环境中。其中，虚拟环境所呈现的虚拟肢体(即三维骨架)与物体150的真实动作一致。

此外，由于第一取像模块110与第二取像模块210的视野角度可为180或360度，使得物体150的肢体距离头戴式装置240的距离太近，第一取像模块110与第二取像模块210仍可从头戴式装置240拍摄到物体150的全身动作。并且，随着物体150与头戴式装置240移动，环境背景也不断改变，通过第一取像模块110与第二取像模块210取得对应物体150的深度影像与全局影像，可以有效地分辨物体150的动作和环境背景，使得动作追踪系统200可精确地产生的三维骨架，而不会受到环境背景的改变的影响。

另外，通过第一取像模块110与第二取像模块210取得对应物体150的深度影像与全局影像，也可以有效地识别物体150的肢体(如脚踝、脚掌)，使得动作追踪系统200可精确地产生包含脚踝、脚掌的三维骨架。其中，脚踝、脚掌距离头戴式装置240较远。

进一步来说，动作追踪系统200可以包括测量模块250。在本实施例中，测量模块250可以是惯性测量单元(inertial measurement unit，IMU)。测量模块250连接运算模块220，测量并计算物体150的头部的位置、移动方向及移动速度，以产生头部姿态。接着，运算模块220更依据头部姿态，将头部姿态、第一关节位置与第二关节位置相关联，并将第一关节位置、第二关节位置与头部姿态投影到三维空间，以产生物体的三维骨架。也就是说，运算模块220所产生的三维骨架包括有物体150的肢体(例如手、脚等)，也包括物体150的头部。另外，测量模块250可设置在头戴式装置240的壳体内。

通过上述实施例的说明，可以归纳出一种动作追踪方法。图3为依据本发明的一实施例的动作追踪方法的流程图。

在步骤S302中，拍摄物体的全身动作，以取得深度影像。在步骤S304中，提供多个训练样本，其中训练样本包括关于物体的关节的多个深度特征信息。在步骤S306中，接收深度影像。在步骤S308中，依据深度影像与训练样本的深度特征信息，对深度影像进行相关联运算及预测，以得到物体的多个第一关节位置，其中深度影像包括物体的肢体未被遮蔽的影像或是物体的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽的影像。

在步骤S310中，将第一关节位置投影到三维空间。在步骤S312中，产生物体的三维骨架。在本实施例中，步骤S302是通过深度摄影机进行，且此深度摄影机也可以为广角的深度摄影机。

图4A与图4B为依据本发明的另一实施例的动作追踪方法的流程图。在步骤S402中，拍摄物体的全身动作，以取得深度影像。在步骤S404中，拍摄物体的全身动作，以产生全局影像。在步骤S406中，提供多个训练样本，其中训练样本包括关于物体的关节的多个深度特征信息与多个彩色特征信息。

在步骤S408中，接收深度影像。在步骤S410中，依据深度影像与训练样本的深度特征信息，对深度影像进行相关联运算及预测，以得到物体的多个第一关节位置，其中深度影像包括物体的肢体未被遮蔽的影像或是物体的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽的影像。在步骤S412中，将第一关节位置投影到三维空间。

在步骤S414中，接收全局影像。在步骤S416中，依据全局影像与训练样本的彩色特征信息，对全局影像进行相关联运算及预测，以得到物体的多个第二关节位置，其中全局影像包括物体的肢体未被遮蔽的影像或是物体的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽的影像。在步骤S418中，将第二关节位置投影到三维空间。

在步骤S420中，对第一关节位置与第二关节位置进行整合运算。在步骤S422中，产生物体的三维骨架。在本实施例中，步骤S404是通过彩色鱼眼摄影机、单色鱼眼摄影机或红外线鱼眼摄影机，且彩色鱼眼摄影机、单色鱼眼摄影机或红外线鱼眼摄影机的视野角度为180度以上。另外，步骤S402是通过深度摄影机，且此深度摄影机也可以为广角的深度摄影机。

图5为图4B的步骤S420的详细流程图。在步骤S502，依据深度影像与全局影像，设定权重比例。在步骤S504中，依据权重比例，对第一关节位置与第二关节位置进行整合运算。

图6为依据本发明的另一实施例的动作追踪方法的流程图。本实施例的步骤S302～步骤S310与图3相同，可参考图3的实施例的说明，故在此不再赘述。在步骤S602中，测量并计算物体的头部的位置、移动方向及移动速度，以产生头部姿态。在步骤S604中，依据头部姿态，将头部姿态与第一关节位置相关联，并将头部姿态投影到三维空间。在步骤S312中，产生物体的三维骨架。

值得注意的是，图3、图4A、图4B、图5及图6的步骤的顺序仅用以作为说明的目的，不用于限制本发明实施例的步骤的顺序，且上述步骤的顺序可由用户视其需求而改变。并且，在不脱离本发明的精神以及范围内，上述流程图可增加额外的步骤或者使用更少的步骤。

综上所述，本发明所揭露的动作追踪方法及方法，通过第一取像模块拍摄物体的全身动作，以取得深度影像，且依据深度影像与训练样本的深度特征信息，对深度影像(包括物体的肢体未被遮蔽的影像或是物体的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽的影像)进行相关联运算及预测，以得到物体的多个第一关节位置，并将第一关节位置投影到三维空间，以产生物体的三维骨架。如此一来，可准确地获得物体的三维骨架，以便对物体的全身动作进行追踪，并增加使用上的便利性。

另外，本发明还通过第二取像模块拍摄物体的全身动作，以取得全局影像，且更依据全局影像与训练样本的彩色特征信息，对全局影像(包括物体的肢体未被遮蔽的影像或是物体的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽的影像)进行相关联运算及预测，以得到物体的多个第二关节位置，并将第二关节位置投影到三维空间，再将第一关节位置与第二关节位置进行整合运算，以产生物体的三维骨架。如此一来，还可以增加所获得的物体的三维骨架的精细度，以便对物体的全身动作进行更有效的追踪。

本发明虽以实施例揭露如上，然其并非用以限定本发明的范围，任何本领域技术人员，在不脱离本发明的精神和范围内，当可做些许的更动与润饰，因此本发明的保护范围应以权利要求书所界定为准。

Claims

1.一种动作追踪系统，包括：

第一取像模块，拍摄物体的全身动作，以取得深度影像；

数据库，提供多个训练样本，且这些训练样本包括关于该物体的关节的多个深度特征信息；

运算模块，接收该深度影像，并依据该深度影像与该数据库的这些训练样本的这些深度特征信息，对该深度影像进行相关联运算及预测，以得到该物体的多个第一关节位置，并将这些第一关节位置投影到三维空间，以产生该物体的三维骨架，其中该深度影像包括该物体的肢体未被遮蔽的影像或是该物体的部分肢体未被遮蔽及该物体的另一部分肢体有被遮蔽的影像，所述训练样本包括对应于该物体的肢体未被遮蔽的影像的深度特征信息或者对应于该物体的部分肢体未被遮蔽及该物体的另一部分肢体有被遮蔽的影像的深度特征信息；以及

头戴式装置，其中该第一取像模块与该运算模块设置在该头戴式装置上，该头戴式装置用于穿戴于该物体的头部，使得该第一取像模块以由上往下的视野角度对该物体自身进行拍摄；

当所述深度影像为该物体的肢体未被遮蔽的影像时，该运算模块获取与该深度影像对应的训练样本的深度特征信息，根据获取的深度特征信息对该深度影像进行相关联运算及预测，其中，获取的深度特征信息包括对应于物体未被遮蔽时的全身肢体的相关信息；

当所述深度影像为该物体的部分肢体未被遮蔽以及该物体的另一部分肢体有遮蔽的影像时，运算模块获取与该深度影像对应的训练样本的深度特征信息，根据获取的深度特征信息对该深度影像进行相关联运算及预测，其中，获取的深度特征信息包括对应于物体的部分肢体未被遮蔽及另一部分肢体有遮蔽时的全身肢体的相关信息。

2.如权利要求1所述的动作追踪系统，更包括：

第二取像模块，拍摄该物体的全身动作，以产生全局影像；

其中，这些训练样本更包括关于该物体的关节的多个彩色特征信息；

其中，该运算模块更接收该全局影像，并依据该全局影像与该数据库的这些训练样本的这些彩色特征信息，对该全局影像进行相关联运算及预测以得到该物体的多个第二关节位置，并将这些第二关节位置投影到该三维空间，且将这些第一关节位置与这些第二关节位置进行整合运算，以产生该物体的三维骨架，其中该全局影像包括该物体的肢体未被遮蔽的影像或是该物体的部分肢体未被遮蔽及该物体的另一部分肢体有被遮蔽的影像。

3.如权利要求2所述的动作追踪系统，其中该运算模块更依据该深度影像与该全局影像，设定权重比例，并依据该权重比例，对这些第一关节位置与这些第二关节位置进行整合运算，以产生该物体的三维骨架。

4.如权利要求2所述的动作追踪系统，其中该第二取像模块为彩色鱼眼摄影机、单色鱼眼摄影机或红外线鱼眼摄影机。

5.如权利要求2所述的动作追踪系统，其中该第二取像模块设置在该头戴式装置上。

6.如权利要求2所述的动作追踪系统，其中该第二取像模块的视野角度为180度以上。

7.如权利要求1所述的动作追踪系统，其中该第一取像模块为深度摄影机。

8.如权利要求1所述的动作追踪系统，其中该运算模块以该头戴式装置为原点，依据该深度影像，计算该物体的肢体到该头戴式装置的相对位置和方向及该物体的肢体的运动方向与加速度，以投影该物体对应的虚拟肢体影像至虚拟环境中。

9.如权利要求1所述的动作追踪系统，更包括：

测量模块，连接运算模块，测量并计算该物体的头部的位置、移动方向及移动速度，以产生头部姿态；

其中，运算模块更依据该头部姿态，将该头部姿态与这些第一关节位置相关联，并将这些第一关节位置与该头部姿态投影到该三维空间，以产生该物体的三维骨架。

10.如权利要求1所述的动作追踪系统，其中该物体的三维骨架包括该物体的手指骨架。

11.一种动作追踪方法，包括：

通过第一取像模块，拍摄物体的全身动作，以取得深度影像；

提供多个训练样本，其中这些训练样本包括关于该物体的关节的多个深度特征信息，所述训练样本包括对应于物体的肢体未被遮蔽的影像的深度特征信息或者对应于物体的部分肢体未被遮蔽及物体的另一部分肢体有被遮蔽的影像的深度特征信息；

通过运算模块，接收该深度影像；

该运算模块依据该深度影像与这些训练样本的这些深度特征信息，对该深度影像进行相关联运算及预测，以得到该物体的多个第一关节位置，其中该深度影像包括该物体的肢体未被遮蔽的影像或是该物体的部分肢体未被遮蔽及该物体的另一部分肢体有被遮蔽的影像；

该运算模块将这些第一关节位置投影到三维空间；以及

该运算模块产生该物体的三维骨架；

其中，该第一取像模块与该运算模块设置在头戴式装置上，该头戴式装置穿戴于该物体的头部，且该第一取像模块以由上往下的视野角度对该物体自身进行拍摄；

其中，所述该运算模块依据该深度影像与这些训练样本的这些深度特征信息，对该深度影像进行相关联运算及预测包括：

当所述深度影像为该物体的肢体未被遮蔽的影像时，运算模块获取与该深度影像对应的训练样本的深度特征信息，根据获取的深度特征信息对该深度影像进行相关联运算及预测，其中，获取的深度特征信息包括对应于物体未被遮蔽时的全身肢体的相关信息；

12.如权利要求11所述的动作追踪方法，其中这些训练样本更包括关于该物体的关节的多个彩色特征信息，该动作追踪方法更包括：

拍摄该物体的全身动作，以产生全局影像；

接收该全局影像；

依据该全局影像与这些训练样本的这些彩色特征信息，对该全局影像进行相关联运算及预测，以得到该物体的多个第二关节位置，其中该全局影像包括该物体的肢体未被遮蔽的影像或是该物体的部分肢体未被遮蔽及该物体的另一部分肢体有被遮蔽的影像；

将这些第二关节位置投影到该三维空间；以及

对这些第一关节位置与这些第二关节位置进行整合运算。

13.如权利要求12所述的动作追踪方法，其中对这些第一关节位置与这些第二关节位置进行整合的步骤包括：

依据该深度影像与该全局影像，设定权重比例；以及

依据该权重比例，对这些第一关节位置与这些第二关节位置进行整合运算。

14.如权利要求12所述的动作追踪方法，其中通过彩色鱼眼摄影机、单色鱼眼摄影机或红外线鱼眼摄影机，拍摄该物体的全身动作，以产生该全局影像。

15.如权利要求14所述的动作追踪方法，其中该彩色鱼眼摄影机、该单色鱼眼摄影机或该红外线鱼眼摄影机的视野角度为180度以上。

16.如权利要求11所述的动作追踪方法，其中通过深度摄影机，拍摄该物体的全身动作，以取得该深度影像。

17.如权利要求11所述的动作追踪方法，其中该物体的三维骨架包括该物体的手指骨架。

18.如权利要求11所述的动作追踪方法，更包括：

测量并计算该物体的头部的位置、移动方向及移动速度，以产生头部姿态；以及

依据该头部姿态，将该头部姿态与这些第一关节位置相关联，并将该头部姿态投影到该三维空间。