CN107787497A

CN107787497A - 用于在基于用户的空间坐标系中检测手势的方法和装置

Info

Publication number: CN107787497A
Application number: CN201680034166.2A
Authority: CN
Inventors: 金石中; 金廷勋; 李范浩
Original assignee: Vtouch Co Ltd
Current assignee: Vtouch Co Ltd
Priority date: 2015-06-10
Filing date: 2016-06-10
Publication date: 2018-03-09
Anticipated expiration: 2036-06-10
Also published as: CN107787497B; WO2016200197A1; US10846864B2; EP3309708A1; JP6839778B2; JP2018528551A; JP2020098614A; US20180173318A1; EP3309708A4; KR101754126B1

Abstract

公开了用于使用基于用户的空间坐标系从用户的运动准确地检测手势的方法和装置。根据本发明的一个方面的用于在基于用户的空间坐标系中检测手势的方法包括以下步骤：使用与用户的第一身体部分对应的第一身体坐标作为起始点来设置基于用户的空间坐标系；分析基于用户的空间坐标系中与用户的第二身体部分对应的第二身体坐标的状态随时间的运动向量状态；以及基于运动向量状态的变化来检测用户的手势。

Description

用于在基于用户的空间坐标系中检测手势的方法和装置

技术领域

本发明涉及用于在基于用户的空间坐标系中检测手势的方法和装置，并且更具体地，涉及用于使用基于用户的空间坐标系从用户的运动准确地检测手势的方法和装置，而与用户相对于用户身体的三维坐标检测元件(例如，3D相机)(在下文中称为“三维坐标检测元件”)的几何布置(例如，位置和方向)无关。

背景技术

通过身体部分的运动的手势可以通过三维坐标检测元件来执行。例如，在三维坐标检测元件中，3D相机(例如，ToF、结构化光、立体声、双光圈等)、雷达、激光雷达等被配置为从外部检测用户的身体坐标点的位置。身体的三维坐标也可以从用户穿戴的传感器来检测，诸如GPS(全球定位系统)、IPS(室内定位系统)、RSSI(接收信号强度指示)、陀螺仪传感器、加速度传感器和磁场传感器。

但是，在常规的手势识别技术中，存在缺点，即，当用户在不正对三维坐标检测元件的方向上进行运动时，根据用户的位置或方向，用户的运动被错误识别或者不能被识别。特别地，存在以下缺点：当数个设备被单个三维坐标检测元件控制时，三维坐标检测元件和用户之间的几何布置(例如，位置和方向)在每当朝每个设备执行手势时被改变，使得用户的运动不能被识别为正确的手势。

图1是图示常规手势识别技术的问题的图。

图1图示了其中用户11将他/她的手指从初始位置101在倾斜方向上移动到其侧面103，而不正对三维坐标检测元件10的情况。在常规手势识别技术中，表示上述移动的空间向量105可能被错误地识别为是手指的向前或向后移动，而与用户的意图不同。另外，还存在以下问题，即，即使做出了按照用户意图的识别，但是识别率也可能非常低。

因此，需要一种用于从用户的运动准确地检测手势的技术，无论用户与三维坐标检测元件之间的几何布置如何。

发明内容

技术问题

本发明就是根据这样的需求而构思，并且本发明的一个目的是提供用于使用基于用户的空间坐标系从用户的运动准确地检测手势的方法和装置。

技术方案

根据本发明的一个方面，提供了一种用于在基于用户的空间坐标系中检测手势的方法，包括以下步骤：定义其原点位于与用户的第一身体部分对应的第一身体坐标点处的基于用户的空间坐标系；分析在基于用户的空间坐标系中与用户的第二身体部分对应的第二身体坐标点随时间的运动向量的状态；以及基于运动向量的状态的变化来检测用户的手势。

这里，基于用户的空间坐标系包括前/后轴、左/右轴和上/下轴，并且定义基于用户的空间坐标系的步骤可以包括创建穿过第一身体坐标点和第二身体坐标点的前/后轴的步骤。

另外，定义基于用户的空间坐标系的步骤还可以包括以下步骤：创建穿过第一身体坐标点、与前/后轴垂直相交并且平行于地表面的左/右轴；以及创建穿过第一身体坐标点并且与前/后轴和左/右轴两者垂直相交的上/下轴。

另外，定义基于用户的空间坐标系的步骤还可以包括以下步骤：创建穿过第一身体坐标点、在第一坐标点处与连接第一身体坐标点和对应于第三身体部分的第三身体坐标点的直线垂直相交、并且在第一坐标点处与前/后轴垂直相交的上/下轴；以及创建穿过第一身体坐标点并且与前/后轴和上/下轴两者垂直相交的左/右轴。

另外，分析运动向量的状态的步骤可以包括以下步骤：相对于第一时间点时第二身体部分的第二身体坐标点(x₁，y₁，z₁)和第二时间点时的第二身体坐标点(x₂，y₂，z₂)，创建具有球坐标的运动向量V，如下：

另外，分析运动向量的状态的步骤还可以包括以下步骤：基于运动向量的r、θ和将运动向量的状态指定为静止状态、向前移动状态、向后移动状态和表面移动状态中的任何一个。

另外，检测用户的手势的步骤可以包括当运动向量的状态从向前移动状态改变为静止状态时确定做出了触摸手势的步骤。

另外，检测用户的手势的步骤可以包括当运动向量的状态改变为向后移动状态时确定做出了释放手势的步骤。

另外，检测用户的手势的步骤可以包括以下步骤：当运动向量的状态从向前移动状态经过静止状态改变为向后移动状态，或者从向前移动状态改变为向后移动状态时，确定做出了点击手势。

另外，检测用户的手势的步骤可以包括当运动向量的状态保持在表面移动状态时，确定在虚拟球体的表面上做出了拖动手势的步骤。此外，检测用户的手势的步骤可以包括当运动向量的状态保持在静止状态时确定做出了保持手势的步骤。

此外，检测用户的手势的步骤可以包括当运动向量的状态以向前移动状态、静止状态、向前移动状态和静止状态的顺序改变时，确定做出了深触摸手势的步骤。

根据本发明的另一个方面，提供了用于在基于用户的空间坐标系中检测手势的装置，包括：三维身体坐标接收单元，被配置为从外部三维身体坐标检测元件接收与包括用户的第一身体部分和第二身体部分的多个身体部分对应的多个身体坐标点；基于用户的空间坐标系定义单元，被配置为基于所述多个身体坐标点创建其原点位于与第一身体部分对应的第一身体坐标点处的基于用户的空间坐标系；运动向量分析单元，被配置为生成第二身体坐标点随时间的运动向量，并且确定运动向量的状态；以及手势检测单元，被配置为基于运动向量的状态的变化来检测用户的手势。

这里，基于用户的空间坐标系定义单元可以包括前/后轴定义单元，其被配置为定义穿过第一身体坐标点和第二身体坐标点的基于用户的空间坐标系的前/后轴。

另外，基于用户的空间坐标系定义单元还可以包括：左/右轴定义单元，被配置为创建穿过第一身体坐标点、与前/后轴垂直相交并且平行于地表面的左/右轴；以及上/下轴定义单元，被配置为创建穿过第一身体坐标点并且与前/后轴和左/右轴两者垂直相交的上/下轴。

可替代地，基于用户的空间坐标系定义单元还可以包括：上/下轴定义单元，被配置为创建穿过第一身体坐标点、在第一坐标点处与连接第一身体坐标点和对应于第三身体部分的第三身体坐标点的直线垂直相交、并且在第一坐标点处与前/后轴垂直相交的上/下轴；以及左/右轴定义单元，被配置为创建穿过第一身体坐标点并且与前/后轴和上/下轴两者垂直相交的左/右轴。

另外，运动向量分析单元可以包括：运动向量创建单元，被配置为相对于第一时间点时的第二身体部分的第二身体坐标点(x₁，y₁，z₁)和第二时间点时的第二身体坐标点(x₂，y₂，z₂)，创建具有球坐标的运动向量V，如下：

另外，运动向量分析单元还可以包括运动向量状态确定单元，其被配置为基于运动向量的r、θ和将运动向量的状态指定为静止状态、向前移动状态、向后移动状态和表面移动状态中的任何一个。

另外，手势检测单元可以包括：运动向量监视单元，被配置为监视运动向量的状态的变化；手势存储单元，被配置为存储与每种类型的运动向量状态的变化对应的手势的类型；以及手势确定单元，被配置为基于手势存储单元确定与运动向量状态的变化对应的用户的手势的类型。

有益效果

根据本发明，可以实现用于使用基于用户的空间坐标系从用户的运动准确地检测手势的方法和装置，而与用户与三维坐标检测元件之间的几何布置(例如，位置和方向)无关。

附图说明

图1是图示常规手势识别技术的问题的图。

图2是示出基于用户的空间坐标系的示例的图。

图3是其中图2的基于用户的空间坐标系的三个轴对应于x轴、y轴和z轴的图。

图4是示出用于定义基于用户的空间坐标系的上/下轴和左/右轴的方法的示例的图。

图5是示出用于定义基于用户的空间坐标系的上/下轴和左/右轴的方法的另一个示例的图。

图6是示出用于定义基于用户的空间坐标系的上/下轴和左/右轴的方法的又一个示例的图。

图7是图示基于用户的空间坐标系中的运动向量的图。

图8是以球坐标表示图7的运动向量的图。

图9是示出与z轴形成的运动向量的θ分量的大小与运动向量的方向之间的关系的图。

图10是示出与x轴形成的运动向量的分量的大小与运动向量的方向之间的关系的图。

图11是示出运动向量的移动状态的状态图。

图12是图示用于检测虚拟球体上的用户的手势的方法的图。

图13是图示用于检测多个虚拟球体上的用户的手势的方法的图。

图14是示出用于在基于用户的空间坐标系中检测手势的装置的示例的框图。

图15是更详细地示出图14的手势检测装置的基于用户的空间坐标系定义单元的框图。

图16是更详细地示出图14的手势检测装置的运动向量分析单元的框图。

图17是更详细地示出图14的手势检测装置的手势检测单元的框图。

图18是示出用于在基于用户的空间坐标系中检测手势的方法的示例的流程图。

具体实施方式

在下文中，将参考附图更详细地描述本发明。

图2是示出基于用户的空间坐标系的示例的图。

如图2所示，本发明基于用户形成空间坐标系。通过基于用户形成空间坐标系，用户的运动可以被解释为用户所期望的，而与用户和相机之间的几何布置无关。

首先，在基于用户的空间坐标系中，将连接用户的第一身体部分的坐标点和第二身体部分的坐标点的直线定义为“前/后轴”。

在整个说明书中，第一身体部分的坐标点用作基于用户的空间坐标系的原点。例如，第一身体部分可以被选择为用户的两只眼睛的一个。但是，只要可以用作基于用户的空间坐标系的原点，任何身体部分都可以被指定为第一身体部分。另外，第二身体部分用作利用其进行运动的身体部分。从第二身体部分的运动检测到姿势。例如，第二身体部分可以被选择为用户的特定手指的指尖。但是，只要运动随时间进行，任何身体部分都可以被指定为第二身体部分。

接下来，在第一身体部分处与前/后轴垂直相交的平面上定义“左/右轴”和“上/下轴”。当首先定义左/右轴时，上/下轴被确定为与前/后轴和左/右轴两者垂直相交的轴。在一些情况下，可以首先定义上/下轴，并且左/右轴可以被确定为与前/后轴和上/下轴两者垂直相交的轴。

左/右轴是指用户识别为是水平的轴。用户的空间被左/右轴划分为左侧和右侧。

另外，上/下轴是指用户识别为是垂直的轴。用户的空间被上/下轴划分为上侧和下侧。

此外，前/后轴是指用户识别为前面和后面的轴。用户的空间被前/后轴划分为前侧和后侧。

此外，左/右轴、上/下轴和前/后轴可以分别对应于一般空间坐标系记法中的x轴、y轴和z轴。

如图3所示，图2中的左/右轴21可以对应于x轴31。例如，x轴31的正(+)方向对应于基于用户的空间坐标系中用户的“右侧”。

上/下轴22可以对应于y轴32。例如，y轴32的正(+)方向对应于基于用户的空间坐标系中用户的“上侧”。前/后轴20可以对应于z轴30。例如，z轴30的正(+)方向对应于基于用户的空间坐标系中用户的“后侧”。

图4中图示的基于用户的空间坐标系被定为使得左/右轴与前/后轴以及重力的方向垂直，并且上/下轴与前/后轴以及左/右轴垂直。当用户站在水平表面上时，左/右轴可以首先被定义为(i)穿过第一身体部分400，(ii)垂直于重力的方向，以及(iii)在第一身体部分400处与前/后轴垂直相交，使得由用户识别出的左右方向与左/右轴的方向一致。同样，左/右轴也可以被定义为(i)穿过第一身体部分400，(ii)平行于地表面，以及(iii)在第一身体部分400处与前/后轴垂直相交，使得由用户识别出的左右方向与左/右轴的方向一致。

上/下轴被确定为在原点400处与左/右轴和前/后轴两者垂直相交的直线。

当用户站在倾斜表面上时，重力的方向与用户识别出的上/下轴的方向不一致。

因此，为了解决其中用户站在倾斜表面上的情况，左/右轴可以首先被定义为(i)穿过第一身体部分500，(ii)平行于地表面53，并且(iii)在第一身体部分500处与前/后轴垂直相交，使得由用户识别出的左右方向与左/右轴的方向一致。

在这种情况下，上/下轴被确定为在原点500处与左/右轴和前/后轴两者垂直相交的直线。

图6是示出用于定义基于用户的空间坐标系的上/下轴和左/右轴的方法的另一个示例的图。

当用户的头部倾斜时，由用户识别出的左右方向可能不平行于地表面。

上/下轴62可以被定义为(i)穿过第一身体部分600(例如，左眼)(第一身体部分可以是可以作为参考点的用户的两只眼睛中的任意一只眼睛，并且两只眼睛中占优势的一只可以被用作第一身体部分。在下文中，这在整个说明书中同样适用)，(ii)在第一身体部分600处与第一身体部分600(即，基于用户的空间坐标系的原点)和第三身体部分604(例如，右眼)的延伸线63垂直相交，以及(iii)在第一身体部分600处与前/后轴60垂直相交，使得由用户识别出的左/右轴和上/下轴即使在用户的头部倾斜时也不会改变。

左/右轴61被确定为在原点600处与前/后轴60和上/下轴62垂直相交的直线。

图7是图示基于用户的空间坐标系中的运动向量的图。

运动向量700是表示在第一时间点时用户的第二身体部分702与在第一时间点之后的第二时间点时的第二身体部分704之间的运动的向量。通过解释基于用户的空间坐标系中随时间变化的运动向量，可以识别用户手势的含义以更好地符合用户的意图。

这里，基于用户的空间坐标系的左/右轴、上/下轴和前/后轴分别由正交坐标系的x轴、y轴和z轴表示，如附图所示。(同时，z轴的正方向对应于用户的后侧)。

下面将参考图8和随后的附图更详细地描述通过解释运动向量来检测姿势的方法。

图8是以球坐标表示图7的运动向量的图。

本发明人已经发现，通过在基于用户的空间坐标系中以球坐标表示图7中所示的运动向量，可以基于运动向量非常容易地解释姿势的含义。

在图7中，第一时间点时用户的第二身体部分702的坐标和第二时间点时第二身体部分704的坐标分别由基于用户的空间坐标系中的(x₁，y₁，z₁)和(x₂，y₂，z₂)表示。

这里，表示从第一时间点到第二时间点的时间段内用户的第二身体部分的移动的运动向量可以被表示为V＝(r，θ，)。

r表示在从第一时间点到第二时间点的时间段内用户的第二身体部分的移动距离。θ表示与前/后轴的正方向形成的角度。表示在投影到x-y平面上的运动向量与左/右轴的正方向之间形成的角度(其中0°≤θ≤180°)。

另外，运动向量V可以表示为下面的等式1。

表1图示运动向量的方向与θ和的大小之间的关系。

在表1和图9和图10的示例中，运动向量的移动方向被定义为仅六个方向，即，向前方向、向后方向、向左方向、向右方向、向上方向和向下方向。即，为了简化描述，在表1中将省略其它移动方向。

表1

移动方向	Θ	Φ
			向前	135°-180°	-
向后	0°-45°	-
			向左	45°-135°	135°-225°
向右	45°-135°	315°-45°
			向上	45°-135°	45°-135°
向下	45°-135°	225°-315°

用户不能移动他/她的身体来绘制直线或完美的圆圈。即使用户的意图是将他/她的指尖移动到左侧，它实际上倾斜地移动，而不是精确地移动到左侧。因此，在解释用户的运动时有必要考虑一些误差。

考虑到这样的误差，其中θ的范围为0°≤θ≤45°的区间900被定义为后侧。在这个范围内，运动向量(即，用户的指尖)被解释为向后移动，而与的值无关。

同样，其中θ的范围为135°≤θ≤180°的区间920被定义为前侧。在这个范围内，运动向量(即，用户的指尖)被解释为向前移动，而与的值无关。

其中θ的范围为45°<θ<135°的区间910被定义为既不在前侧也不在后侧。因此，取决于的范围，当θ的范围是45°<θ<135°时，其中135°的区间1030被定义为左侧；其中的区间1020被定义为右侧；其中的区间1000被定义为上侧；并且其中的区间1010被定义为下侧。

即，当θ的范围对应于区间910时，的范围对应于区间1000、1010、1020或1030的运动向量被解释为向上、向下、向右或向左移动。

表2图示了运动向量的方向与θ和的大小之间的关系，其中运动向量的方向被进一步细分。

在表1中，运动向量的方向被定义为仅六个方向。但是，六个方向可能不足以定义指尖的移动。因此，运动向量的方向在表2中被定义为18个方向。

表2

如表2所示，可以根据时间段t₂-t₁内运动向量的θ和的大小之间的关系来确定运动向量的移动方向。

例如，当运动向量的θ和是130°和1°时，可以确定用户的指尖在时间段t₂-t₁内在向前-向右方向上移动。

图11是示出运动向量的移动状态的状态图。

如以上结合图7所述，运动向量被定义为特定时间点之间的位移。例如，运动向量被定义为每单位时间指尖的位移。

运动向量的移动状态可以被划分为如图11所示的四个状态。

在第一状态S0中，运动向量是静止的。例如，其中用户的指尖在单位时间内基本上静止的状态对应于状态S0。

在第二状态S1中，运动向量向前移动。例如，其中用户在单位时间内在远离第一身体部分(即，向前)(第一身体部分是用作基于用户的空间坐标系的原点的参考身体部分(例如，左眼))的方向上移动他/她的手指的运动对应于状态S1。

在第三状态S2中，运动向量向后移动。例如，其中用户在单位时间内在朝向第一身体部分(即，向后)(第一身体部分是用作基于用户的空间坐标系的原点的参考身体部分(例如，左眼))的方向上移动他/她的手指的运动对应于状态S2。

在第四状态S3中，运动向量在表面上移动。例如，其中用户在单位时间内将他/她的手指从第一身体部分(第一身体部分是用作基于用户的空间坐标系的原点的参考身体部分(例如，左眼))移动固定距离的运动对应于状态S3。

将更详细地描述这四个状态。

用于检测用户的手势的装置在具有预定时间间隔的每个时间点接收关于用户的第一身体部分(即，用作基于用户的空间坐标系的原点的身体部分)(例如，左眼)和第二身体部分(即，利用其在基于用户的空间坐标系中检测到手势的身体部分)(例如，特定手指的指尖)的三维坐标的信息，并且获得在每个时间点时第二身体部分的运动向量

例如，3D ToF相机将通过测量反射和返回光的时间而获取的3D图像以预定时间间隔一帧的方式进行存储，并且针对每个存储的图像帧检测第一身体部分和第二身体部分以生成第一身体部分和第二身体部分的三维坐标。

可替代地，立体声3D相机将通过使用从左和右图像传感器接收到的两个图像之间的差异获得的3D图像以预定时间间隔一帧的方式进行存储，并且针对每个存储的图像帧检测第一身体部分和第二身体部分以生成第一身体部分和第二身体部分的三维坐标。

可替代地，结构化光3D相机通过分析输入图案与通过在一个位置处投射结构化光并且然后在另一个位置处接收和投射光而获得的图案之间的差异获取3D信息，以将获取的3D图像以预定时间间隔一帧进行存储，并且针对每个存储的图像帧检测第一身体部分和第二身体部分以生成第一身体部分和第二身体部分的三维坐标。

可替代地，三维坐标提供元件可以是雷达，该雷达可以以预定时间间隔发射定向微波并且然后测量反射和返回的电磁波以找到三维坐标。雷达从每个周期检测到的信息检测第一身体部分和第二身体部分，并且生成第一身体部分和第二身体部分的三维坐标。可替代地，三维坐标提供元件可以是激光雷达，该激光雷达可以以预定时间间隔发射定向激光束同时旋转，并且然后测量反射和返回的光来识别三维坐标。激光雷达从每个旋转周期检测到的信息检测第一身体部分和第二身体部分，并且生成第一身体部分和第二身体部分的三维坐标。

可替代地，当第一身体部分和第二身体部分上穿戴GPS(全球定位系统)接收器时，针对每一帧测量从不同位置传送的无线电波的行进时间以计算其之间的距离。以每个传送点为参考点和以行进距离为半径生成球体，并且确定其中球体重叠的位置，以生成第一身体部分和第二身体部分的三维坐标。

可替代地，当第一身体部分和第二身体部分上穿戴IPS(室内定位系统)接收器时，针对每一帧测量从不同位置传送的无线电波和超声波的行进时间以计算其之间的距离，或者测量从不同位置传送的无线电波和超声波的RSSI(接收信号强度指示)以计算其之间的距离。以每个传送点为参考点并且以行进距离为半径生成球体，并且确定其中球体重叠的位置，以生成第一身体部分和第二身体部分的三维坐标。

可替代地，当第一身体部分和第二身体部分上同时穿戴9-轴传感器(即，陀螺仪传感器、加速度传感器和磁场传感器)和GPS(全球定位系统)接收器或IPS(室内定位系统)接收器时，利用通过9-轴传感器输入的姿势和运动信息校正通过GPS或IPS生成的三维坐标，以更准确地生成第一身体部分和第二身体部分的三维坐标。

为了进入第一状态S0，用户的第二身体部分不一定是完全静止的。“基本上”静止的状态被认为是第一状态S0。如上所述，这是为了考虑用户的意图和实际运动之间存在的一些误差。

即，为了进入第一状态S0，应该满足下面的等式2。

v(t)＝r<Th₁ (等式2)

这里，v(t)是时间点t时运动向量的大小。即，根据运动向量的定义，v(t)表示在时间点t时第二身体部分的速度的大小。当v(t)小于第一阈值Th₁时，可以定义运动向量基本上是静止的。第一阈值Th₁需要是足够小的值。另外，只有运动向量的大小需要非常小，而对于运动向量的θ和没有条件。

为了进入第二状态S1，用户的第二身体部分应该具有预定大小(即，不小于第二阈值Th₂的大小)的速度并且θ和满足向前移动的条件。

第二阈值Th₂需要是比第一阈值Th₁大得多的值。

例如，当如以上表1所示定义了六个移动方向(即，向上、向下、向左、向右、向前、向后)时，满足状态S1的条件被表示为下面的等式3。

v(t)＝r≥Th₂且135°≤θ≤180° (等式3)

为了进入第三状态S2，用户的第二身体部分应该具有预定大小(即，不小于第三阈值Th₃的大小)的速度并且θ和满足向后移动的条件。

例如，当如以上表1所示定义了六个移动方向(即，向上、向下、向左、向右、向前、向后)时，用于满足状态S2的条件被表示为下面的等式4。

v(t)＝r≥Th₃且0°≤θ≤45° (等式4)

为了进入第四状态S3，用户的第二身体部分应该具有预定大小(即，不小于第四阈值Th₄的大小)的速度并且θ和满足表面移动的条件。

例如，当如以上表1所示定义了六个移动方向(即，向上、向下、向左、向右、向前、向后)时，用于满足状态S3的条件被表示为下面的等式5至8。

(i)对于向上移动：v(t)＝r≥Th₄,45°≤θ≤135°且(等式5)

(ii)对于向下移动：v(t)＝r≥Th₄，45°≤θ≤135°且(等式6)

(iii)对于向左移动：v(t)＝r≥Th₄，45°≤θ≤135°且(等式7)

(iv)对于向右移动：v(t)＝r≥Th₄，45°≤θ≤135°且或(等式8)

基于多个状态(即，状态S0、S1、S2和S3)的组合来检测手势。

例如，可以基于状态S0随时间被组合两次或更多次的事实来检测其中用户的指尖不移动的“保持”手势。

可替代地，可以基于状态S1与后面的状态S0组合的事实来检测其中用户的指尖触摸某个点的“触摸”手势。

可替代地，可以基于状态S0与后面的状态S2组合的事实来检测其中用户的指尖移动离开某个点的“释放”手势。

可替代地，可以基于状态S1与后面的状态S2组合(其之间具有或不具有状态S0)的事实来检测其中用户的指尖“点击”某个点的手势。

可替代地，可以基于状态S3被组合两次或更多次的事实来检测其中用户的指尖在向上、向下、向左和向右方向中的任何一个方向上移动而不接近或移动离开第一身体坐标点的“拖动”手势。同时，在状态S3中，具体的移动方向可以通过以上等式5至8中示出的的范围来识别。

图12是图示用于检测虚拟球体上的用户的手势的方法的图。

当运动向量不向前或向后移动(即，仅向上、向下、向左或向右移动)时，运动向量的轨迹形成以第一身体部分1201为中心的虚拟球体1200。

图12图示了用户在虚拟球体1200上的一些手势。

当用户的运动向量1210的状态在时间点T0和时间点T1之间从状态S0改变为状态S1，并且然后在时间点T1改变回到状态S0时，可以确定做出了“触摸”手势。

当运动向量1220的状态在时间点T1和时间点T2之间从状态S1改变为状态S3(其之间具有或没有插入状态S0)时，可以确定在该时间段内在虚拟球体上做出了向上、向下、向左、向右等“拖动”手势。(具体的移动方向可以通过以上等式5至8中示出的的范围来识别)。

当运动向量1230的状态在时间点T2从状态S3改变为状态S2(其之间具有或没有插入状态S0)时，可以确定已在时间点T2做出了“释放”手势。

另外，当运动向量1210、1220和1230在时间点T0和时间点T3之间以这个顺序被组合时，有可能实现一系列操作，诸如选择某个对象(即，“触摸”手势)、拖动该对象到特定文件夹(即，“拖动”手势)、并且然后将它放到文件夹中(即，“释放”手势)。

可能有多个具有共同中心的虚拟球体。另外，手势可以被组合以在多个虚拟球体之间移动。

通过利用以上特性，可以实现和检测“深触摸”手势。

将描述其中第(n-1)个虚拟球体1300、第n个虚拟球体1302和第(n+1)个虚拟球体1303具有共同中心1301(其中n≥2并且n是整数)的示例。

当基于时间点T0与时间点T1之间运动向量1310的状态变化检测到触摸手势时，用户的第二身体部分位于第(n-1)个虚拟球体1300的表面上。

此后，当基于时间点T1和时间点T2之间运动向量(未示出)的状态变化检测到保持手势时，用户的第二身体部分仍然保持在第(n-1)个虚拟球体1300的表面上。(由于静止状态下运动向量的大小基本上接近于零，因此运动向量在附图中未示出。)

当基于时间点T2和时间点T3之间运动向量1320的状态变化再次检测到触摸手势时，用户的第二身体部分从第(n-1)个虚拟球体1300移动到第n个虚拟球体1302的表面。

在这种情况下，当基于时间点T3和时间点T4之间运动向量1330的状态变化检测到拖动手势时，可以检测到用户的第二身体部分在第n个虚拟球体1302的表面上向上、向下、向左、向右等移动。(具体的移动方向可以通过以上等式5至8中示出的的范围来识别)。

此后，当基于时间点T4时运动向量1340的状态变化检测到释放手势时，第二身体部分可能移回到第(n-1)个虚拟球体1300的表面。

当基于时间点T5和时间点T6之间运动向量1350的状态变化再次检测到触摸手势时，第二身体部分可能移动到第n个虚拟球体1302的表面。

此后，当基于时间点T6和时间点T7之间运动向量(未示出)的状态变化检测到保持手势时，用户的第二身体部分仍然保持在第n个虚拟球体1302的表面上。

同样，当基于时间点T7和时间点T8之间运动向量1360的状态变化检测到触摸手势时，第二身体部分可能移动到第(n+1)个虚拟球体1303的表面。

此后，当基于时间T8和时间点T9之间运动向量(未示出)的状态变化检测到保持手势时，用户的第二身体部分仍然保持在第(n+1)个虚拟球体1303的表面上。

以这种方式，在多个虚拟球体上实现的手势是可行的。

手势检测装置1400包括三维身体坐标接收单元1410、基于用户的空间坐标系定义单元1420、运动向量分析单元1430和手势检测单元1440。手势检测装置1400可以以机顶盒或控制盒的形式实现。但是，该装置不限于此，并且还可以以在网络上操作的服务器的形式来实现。可替代地，也可以将其实现为使得它被嵌入在各种家用电器中。

三维身体坐标接收单元1410从外部三维身体坐标检测元件接收与包括用户的第一身体部分(例如，一只眼睛)和第二身体部分(例如，用其进行运动的指尖)的多个身体部分对应的多个身体坐标点。

如上所述，三维身体坐标检测元件可以是各种设备，诸如3D相机、雷达和激光雷达。

三维身体坐标接收单元1410以能够经由无线或有线数据通信从三维身体坐标检测元件接收用户的身体坐标点的输入/输出(I/O)设备的形式实现。另外，该装置还可以包括用于临时存储随时间在每个帧接收到的多个身体坐标点的存储单元(诸如存储器设备)，但是它在附图中没有示出。

基于用户的空间坐标系定义单元1420基于由三维身体坐标接收单元1410接收到的多个身体坐标点创建其原点位于与用户的第一身体部分对应的第一身体坐标点处的基于用户的空间坐标系。

运动向量分析单元1430创建利用其检测到手势的第二身体坐标点的随时间的运动向量，并且确定运动向量的状态。

手势检测单元1440基于运动向量的状态改变检测用户的手势。

基于用户的空间坐标系定义单元1420包括前/后轴定义单元1422、左/右轴定义单元1424和上/下轴定义单元1426。

如上所述，前/后轴定义单元1422在基于用户的空间坐标系中定义指示用户的前侧和后侧的前/后轴。

具体而言，前/后轴定义单元1422将穿过第一身体坐标点和第二身体坐标点两者的直线定义为基于用户的空间坐标系的前/后轴。

如上所述，前/后轴可以对应于基于用户的空间坐标系中的z轴，并且用户的后侧可以对应于z轴的正(+)方向。

运动向量分析单元1430包括运动向量创建单元1432和运动向量状态确定单元1434。

运动向量创建单元1432相对于在第一时间点(t＝t₁)时的第二身体坐标点(x₁，y₁，z₁)和在第二时间点(t＝t₂)时的第二身体坐标点(x₂，y₂，z₂)创建具有如等式1和图8中所示的具有球坐标的运动向量V。

如上所述，运动向量状态确定单元1434基于球坐标中表示的运动向量的r、θ和分量的值确定运动向量的状态。因此，运动向量的状态被指定为静止状态S0、向前移动状态S1、向后移动状态S2和表面移动状态S3中的任何一个。

手势检测单元1440包括运动向量监视单元1442、手势存储单元1444和手势确定单元1446。

运动向量监视单元1442监视在对应时间点是否存在运动向量的状态变化。

例如，当运动向量的状态在时间点(t＝t1)时是状态S0，而在先前的时间点它的状态是S1时，运动向量监视单元1442识别出运动向量的状态已从状态S1改变为状态S0。

手势存储单元1444存储与每种类型的运动向量的状态变化对应的手势的类型。

例如，先前示例中的从状态S1到状态S0变化的类型(或模式)对应于“触摸”手势。物理上，这意味着其中用户的指尖(即，第二身体部分)向前移动预定时间并且然后停止的状态。即，它对应于用户用指尖触摸虚拟球体的点的动作。

运动向量的各种状态的组合对应于各种手势，并且手势存储单元1444存储关于运动向量的状态的组合以及与对应手势的关系的信息。手势存储单元1444可以由各种存储设备来实现。

手势确定单元1446参考手势存储单元1444确定与由运动向量监视单元1442获得的运动向量的状态变化的类型(或模式)对应的手势类型。最后，手势确定单元1446将手势确定为用户在对应时间点执行的手势，并且完成手势检测过程。

在步骤S100中，接收对应于每个时间点的身体坐标点。当外部三维身体坐标检测元件是3D相机时，针对与每个时间点对应的每个图像帧接收用户的身体坐标点。

在步骤S110中，基于接收到的身体坐标点定义前/后轴、上/下轴和左/右轴，以便定义基于用户的空间坐标系。

在步骤S120中，在基于用户的空间坐标系中创建与用于运动和手势检测的第二身体坐标点相关的运动向量。

在步骤S130中，确定每个时间点处的运动向量的状态。

在步骤S140中，基于运动向量的状态的变化检测手势。

在手势检测装置继续操作的同时重复执行步骤S100至S140的流程。

因此，手势检测装置确定是否继续用户的手势检测(S150)。当手势检测装置继续执行手势检测时(S152)，过程返回到步骤S100。当将终止手势检测时(S154)，不再接收身体坐标点并且终止操作。

已经参考附图和各种实施例进行了本发明的详细描述。

但是，以上描述仅仅提供用于说明本发明的示例。即，本发明不限于附图和实施例，并且显而易见，落入所附权利要求内的实施例和其它修改后的实施例将落入本发明的范围内。

Claims

1.一种用于在基于用户的空间坐标系中检测手势的方法，包括以下步骤：

定义其原点位于与用户的第一身体部分对应的第一身体坐标点处的基于用户的空间坐标系；

分析基于用户的空间坐标系中的与用户的第二身体部分对应的第二身体坐标点随时间的运动向量的状态；以及

基于运动向量的状态的变化来检测用户的手势。

2.如权利要求1所述的方法，其中基于用户的空间坐标系包括前/后轴、左/右轴和上/下轴，以及

其中定义基于用户的空间坐标系的步骤包括以下步骤：

创建穿过第一身体坐标点和第二身体坐标点的前/后轴。

3.如权利要求2所述的方法，其中定义基于用户的空间坐标系的步骤包括以下步骤：

创建穿过第一身体坐标点、与前/后轴垂直相交并且平行于地表面的左右轴；以及

创建穿过第一身体坐标点并且与前/后轴和左/右轴两者垂直相交的上/下轴。

4.如权利要求2所述的方法，其中定义基于用户的空间坐标系的步骤还包括以下步骤：

创建穿过第一身体坐标点、在第一坐标点处与连接第一身体坐标点和对应于第三身体部分的第三身体坐标点的直线垂直相交、并且在第一坐标点处与前/后轴垂直相交的上/下轴；以及

创建穿过第一身体坐标点并且与前/后轴和上/下轴两者垂直相交的左/右轴。

5.如权利要求1所述的方法，其中分析运动向量的状态的步骤包括以下步骤：

相对于第一时间点时第二身体部分的第二身体坐标点(x₁，y₁，z₁)和第二时间点时的第二身体坐标点(x₂，y₂，z₂)，创建具有球坐标的运动向量V，如下：

6.如权利要求5所述的方法，其中分析运动向量的状态的步骤还包括以下步骤：

基于运动向量的r、θ和将运动向量的状态指定为静止状态、向前移动状态、向后移动状态和表面移动状态中的任何一个。

7.如权利要求6所述的方法，其中检测用户的手势的步骤包括以下步骤：

当运动向量的状态从向前移动状态改变为静止状态时，确定做出了触摸手势。

8.如权利要求6所述的方法，其中检测用户的手势的步骤包括以下步骤：

当运动向量的状态改变为向后移动状态时，确定做出了释放手势。

9.如权利要求6所述的方法，其中检测用户的手势的步骤包括以下步骤：

当运动向量的状态从向前移动状态经过静止状态改变为向后移动状态，或者从向前移动状态改变为向后移动状态时，确定做出了点击手势。

10.如权利要求6所述的方法，其中检测用户的手势的步骤包括以下步骤：

当运动向量的状态改变为表面移动状态时，确定在虚拟球体的表面上做出了拖动手势。

11.如权利要求6所述的方法，其中检测用户的手势的步骤包括以下步骤：

当运动向量的状态保持在静止状态时，确定做出了保持手势。

12.如权利要求6所述的方法，其中检测用户的手势的步骤包括以下步骤：

当运动向量的状态以向前移动状态、静止状态、向前移动状态和静止状态的顺序改变时，确定做出了深触摸手势。

13.一种用于在基于用户的空间坐标系中检测手势的装置，包括：

三维身体坐标接收单元，被配置为从外部三维身体坐标检测元件接收与包括用户的第一身体部分和第二身体部分的多个身体部分对应的多个身体坐标点；

基于用户的空间坐标系定义单元，被配置为基于所述多个身体坐标点创建其原点位于与第一身体部分对应的第一身体坐标点处的基于用户的空间坐标系；

运动向量分析单元，被配置为生成第二身体坐标点随时间的运动向量，并且确定运动向量的状态；以及

手势检测单元，被配置为基于运动向量的状态的变化来检测用户的手势。

14.如权利要求13所述的装置，其中基于用户的空间坐标系定义单元包括：

前/后轴定义单元，被配置为定义穿过第一身体坐标点和第二身体坐标点的基于用户的空间坐标系的前/后轴。

15.如权利要求14所述的装置，其中基于用户的空间坐标系定义单元还包括：

左/右轴定义单元，被配置为创建穿过第一身体坐标点、与前/后轴垂直相交并且平行于地表面的左/右轴；以及

上/下轴定义单元，被配置为创建穿过第一身体坐标点并且与前/后轴和左/右轴两者垂直相交的上/下轴。

16.如权利要求14所述的装置，其中基于用户的空间坐标系定义单元还包括：

上下轴定义单元，被配置为创建穿过第一身体坐标点、在第一坐标点处与连接第一身体坐标点和对应于第三身体部分的第三身体坐标点的直线垂直相交、并且在第一坐标点处与前/后轴垂直相交的上/下轴；以及

左/右轴定义单元，被配置为创建穿过第一身体坐标点并且与前/后轴和上/下轴两者垂直相交的左/右轴。

17.如权利要求13所述的装置，其中所述运动向量分析单元包括：

运动向量创建单元，被配置为相对于第一时间点时的第二身体部分的第二身体坐标点(x₁，y₁，z₁)和第二时间点时的第二身体坐标点(x₂，y₂，z₂)，创建具有球坐标的运动向量V，如下：

18.如权利要求17所述的装置，其中所述运动向量分析单元还包括：

运动向量状态确定单元，被配置为基于运动向量的r、θ和将运动向量的状态指定为静止状态、向前移动状态、向后移动状态和表面移动状态中的任何一个。

19.如权利要求18所述的装置，其中所述手势检测单元包括：

运动向量监视单元，被配置为监视运动向量的状态的变化；

手势存储单元，被配置为存储与每种类型的运动向量状态的变化对应的手势的类型；以及

手势确定单元，被配置为基于手势存储单元确定与运动向量状态的变化对应的用户的手势的类型。