WO2017075932A1

WO2017075932A1 - 基于三维显示的手势操控方法和系统

Info

Publication number: WO2017075932A1
Application number: PCT/CN2016/076748
Authority: WO
Inventors: 黄源浩; 肖振中; 许宏淮; 钟亮洪
Original assignee: 深圳奥比中光科技有限公司
Priority date: 2015-11-02
Filing date: 2016-03-18
Publication date: 2017-05-11
Also published as: CN105353873A; CN105353873B

Abstract

一种基于三维显示的手势操控方法，通过获取手部的位置信息，然后建立手部在三维空间坐标系的运动轨迹（S110），根据该运动轨迹识别手部的手势动作（S120），最后根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象（S130）。即通过识别用户的手势动作，然后依据手势动作控制操作对象执行对应的操作。因此，能够实现人机自然交互且无需接触显示屏。此外，还提供一种基于三维显示的手势操控系统及装置。

Description

基于三维显示的手势操控方法和系统

【技术领域】

本发明涉及手势操作控制技术，特别是涉及人机自然交互的基于三维显示的手势操控方法和系统。

【背景技术】

人机交互、机器人和虚拟现实等领域的快速发展和广泛应用，三维交互输入新技术成为人机虚拟交互领域中众多研究学者的热点。随着这项技术的发展和不断深入，大众对其使用需求越来越高，非接触、高速、实时定位与三维操作成为该技术发展的方向。因此，传统的采用鼠标或者触摸屏控制显示屏已无法实现大众的需求。

【发明内容】

基于此，有必要提供一种人机自然交互的、非接触的基于三维显示的手势操控方法。

一种基于三维显示的手势操控方法，包括以下步骤：

获取手部的位置信息，并建立手部在三维空间坐标系的运动轨迹；

根据手部在三维空间坐标系的运动轨迹，识别手部的手势动作；

根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象。

在其中一个实施例中，所述获取手部的位置信息，并建立手部在三维空间坐标系的运动轨迹的步骤包括：

获取手部一系列连续的深度信息，根据所述深度信息形成手部在三维空间坐标系的运动轨迹。

在其中一个实施例中，所述手部的操作空间与所述三维空间坐标系成线性对应关系，其中，操作空间为手部执行一系列连续动作的真实空间。

在其中一个实施例中，所述根据手部在三维空间坐标系的运动轨迹识别手部的手势动作的步骤包括：

提取手部轮廓特征信息，并结合所述位置信息进行特征匹配对手势动作进行识别分类。

在其中一个实施例中，所述根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象的步骤包括：

存储每个手势动作与对应的控制指令的对应关系；

在识别手势动作后，从对应关系中读取该手势动作对应的控制指令；

根据所述控制指令控制三维图像中的操作对象执行对应动作。

此外，还提供一种人机自然交互的、非接触的基于三维显示的手势操控系统。

一种基于三维显示的手势操控系统，包括：

信息获取模块，用于获取手部的位置信息，

坐标建立模块，用于根据所述位置信息建立手部在三维空间坐标系的运动轨迹；

手势识别模块，用于根据手部在三维空间坐标系的运动轨迹识别手部的手势动作；

操作控制模块，用于根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象。

在其中一个实施例中，所述信息获取模块还用于获取手部一系列连续的深度信息；所述坐标建立模块还用于根据所述深度信息形成手部在三维空间坐标系的运动轨迹。

在其中一个实施例中，手部的操作空间与所述三维空间坐标系成线性对应关系，其中，操作空间为手部执行一系列连续动作的真实空间。

在其中一个实施例中，所述手势识别模块还用于提取手部轮廓特征信息，并结合所述位置信息进行特征匹配对手势动作进行识别分类。

在其中一个实施例中，所述操作控制模块包括存储模块、读取模块及执行模块；所述存储模块用于存储每个手势动作与对应的控制指令的对应关系；所述读取模块用于在识别手势动作后，从对应关系中读取该手势动作对应的控制指令；所述执行模块用于根据所述控制指令控制三维图像中的操作对象执行对应动作。

此外，还提供一种人机自然交互的、非接触的基于三维显示的手势操控装置。

一种基于三维显示的手势操控装置，其特征在于，包括深度相机、三维显示器及处理器；

所述深度相机用于获取手部的深度图像，并输出给所述处理器；

所述处理器根据所述深度图像获取手部的位置信息；并根据所述位置信息建立手部在三维空间坐标系的运动轨迹；所述处理器还用于根据手部在三维空间坐标系的运动轨迹识别手部的手势动作；所述处理器还用于根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象；

所述处理器还用于根据所述手势动作控制三维显示器显示该手势动作，并显示执行该手势动作对应的控制指令的轨迹。

上述基于三维显示的手势操控方法和系统、装置通过获取手部的位置信息，然后建立手部在三维空间坐标系的运动轨迹，根据该运动轨迹识别手部的手势动作，最后根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象。即通过识别用户的手势动作，然后依据手势动作控制操作对象执行对应的操作。因此，能够实现人机自然交互且无需接触显示屏。

【附图说明】

图1为基于三维显示的手势操控方法的流程图；

图2为物体深度计算模型的示意图；

图3(a)手与三维显示光标对应移动的示意图之一；

图3(b)手与三维显示光标对应移动的示意图之二；

图3(c)抓握对象在三维显示中跟随手移动的示意图之一；

图3(d)抓握对象在三维显示中跟随手移动的示意图之二；

图3(e)抓握对象在三维显示中跟随手移动的示意图之三；

图3(f)抓握对象在三维显示中跟随手移动的示意图之四；

图3(g)抓握对象在三维显示中跟随手移动的示意图之五；

图4基于三维显示的手势操控系统的模块图。

【具体实施方式】

为了便于理解本发明，下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳的实施例。但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施例。相反地，提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。

需要说明的是，当元件被称为“固定于”另一个元件，它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件，它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

如图1所示，为基于三维显示的手势操控方法的流程图。

获取手部的深度图像，深度图像也成为距离图像，是指从观察视角看去，图像所含信息与场景中物体表面距离相关的一种图像或一种图像通道。在深度图像中像素点的灰度值对应于场景中点的深度值。深度图像包含的信息为深度信息。

深度图像具有颜色无关性和灰度值变化方向与相机所拍摄的视场方向Z方向相同等两个性质。其中，颜色无关性是指与彩色图像相比，深度图像不会有光照、阴影以及环境变化的干扰。灰度值变化方向与相机所拍摄的视场方向Z方向相同指利用深度图像可以在一定范围内重建3D空间区域，并且可以从一定程度上解决物体遮挡或同意物体各部分重叠的问题。根据深度信息，可以很容易的把前景和背景分开，这能够降低图像识别的难度。

深度图像按照成像原理划分主要有飞行时间法、结构光及三维激光扫描等主要用于人机互动。利用深度图像进行模式识别。

在本发明中，获取深度图像可采用如下方法：第一种基于飞行时间原理，通过测量光线发射到物体表面后反射回来的时间差，从而计算出物体表面的深度信息。第二种方法类似结构光编码，投影一个己知的红外模式到场景中，通过红外CMOS相机上所记录的变形模式来测量距离。工作模式主要是识别人体及相关的动作，而识别人体的最主要核心就是骨架，通过骨骼的追踪，把人体的动作扫描到计算机上，并做相关的模拟及操作。当然，本发明中获取深度图像的方法不仅限于上述方法。

采集手部的深度信息时，检测手势动作的特征，根据手势动作给出该手势动作对应的控制指令。例如根据映射关系3D显示光标跟随手部、手部抓握对应抓取对象指令、手部抓握向前对应放大指令、抓握向后对应缩小指令等。在检测到手势动作后，就能够输出该手势动作对应的控制指令。

在本发明中，将预先采集的手势动作进行存储，如抓握、抓握向前移动等，设置与抓握、抓握向前移动对应的控制指令。因此，在用户做出抓握、抓握向前移动等动作的时候，会对应执行该动作对应的控制指令。即预先采集手势动作的数据后，任何用户做出对应的手势动作，均能够执行该手势动作对应的控制指令。

如，手掌张开、抓握分别代表放大和缩小的控制指令。或是抓握大拇指向上或向下分别代表放大和缩小的控制指令。或是抓握后手部向前或向后分别代表放大和缩小的控制指令。将类似于这些手势动作采集存储，并赋予对应的控制指令，使手势动作与控制指令之间建立对应关系。因而能够在识别出手势动作时，按照对应的控制指令执行相应的操作。在其他实施例中，也可赋予每个手势动作不同的控制指令。

手势动作的采集包括很多类，每个类也包括了许多不同的实例，这个数据采集是在自然环境下拍摄的，在真实的房间或办公室、不同的光照和角度，使得手势动作的数据采集更具有实用性。

在本实施例中，一种基于三维显示的手势操控方法，包括以下步骤：

步骤S110，获取手部的位置信息，并建立手部在三维空间坐标系的运动轨迹。本实施例可以基于深度图像获取手部的位置信息。

具体的，获取手部的位置信息，并建立手部在三维空间坐标系的运动轨迹的步骤包括：

获取手部一系列连续的深度信息，根据所述深度信息形成手部在三维空间坐标系的运动轨迹。本实施例可以基于深度图像采集技术，利用深度相机采集手部一系列连续动作的图像数据，然后从该图像数据中提取手部一系列连续的深度信息。

手部的操作空间与所述三维空间坐标系成线性对应关系，其中，操作空间为手部一系列连续动作的真实空间，利用深度相机从操作空间采集的图像数据可以获取手部一系列连续的深度信息及二维坐标信息的空间。上述三维空间坐标系是指用于显示三维图像的立体图像数据所对应的空间坐标系。

获取手部的深度信息后，就能够在三维空间坐标系找出对应的坐标点。追踪手部的骨骼信息，并将手部的动作扫描到计算机上，同时采集手部的深度信息，根据深度信息及骨骼信息结合获得手部在三维空间坐标系中对应的坐标点，用以在三维图像中定位操控位置。而在手部运动时，通过追踪手部的骨骼信息，能够依次追踪到手部在三维空间坐标系中的运动轨迹，即完成追踪手部的运动轨迹，并将实际的运动轨迹转换到三维空间坐标系中。

在一个实施例中，深度信息的获取可采用平行立体视觉的模型，假设摄像机C1的外参数用旋转矩阵R1和平移向量t1表示，摄像机C2的外参数用旋转矩阵R2和平移向量t2表示，若其中，R1＝R2，即左右摄像机平行放置，相对位置关系只存在平移，这样的立体视觉系统就是平行立体市局系统。

以摄像机C1所在的摄像机坐标系为世界坐标系，则有：

t₁＝(0，0，0)^T，R₁＝R₂＝I.；

在平行立体视觉系统中，2个摄像机的光轴相互平行，并且左右摄像机坐标系中的x中重合，极线相互平行，2个摄像机坐标系的区别就是x轴上的一个平一辆B(即“基线”)。

建立如图2所示的物体深度计算模型，计算物体深度。

如图2所示，左右摄像机光心(即透镜中心)的位置分别为C1和Cr，B为2个摄像机光心之间的平移向量，f为摄像机的焦距。设有空间中的一点P，而p1和pr则分别为电P在左右图像平面上的投影点。Z为所求的深度信息，即空间点P距离摄像机光心连线C1Cr的距离。L和R为经过摄像机光心垂直在图像平面做垂线的垂足所在点。H为经过空间点P向图像平面做垂线的垂足。

则有线性关系如下：

对上式合并化简求解，则有

上式即为求解深度信息的公式，其中，|Lp₁|-|Rp_r|即为立体匹配中获得的对应匹配点的视差值，表示空间点P在图像平面上锁成图像位置的差x1-x2，摄像机光心距离|B|和焦距f通过摄像机标定获得。

步骤S120，根据手部在三维空间坐标系的运动轨迹，识别手部的手势动作。

具体地，根据手部在三维空间坐标系的运动轨迹识别手部的手势动作的步骤包括：

在本实施例中，根据手势的深度信息，利用三维点云计算得到手势点云数据，计算后手势点云数据只包括手部关节点和手掌中心点的三维坐标位置信息，然后对手势点云数据做数据滤波处理，滤除掉手势点云数据中的噪声干扰点，得到手势点云信息。将手势点云信息，通过旋转平移将手势点云信息三维信息进行平面配准，保存配准后手势点云信息，然后提取出手势点云信息的轮廓体重点信息，轮廓特征点包括指尖点、指尖凹点和手掌中心点。

由于轮廓特征点信息结合深度图像的像素深度值映射出轮廓特征点的深度值，通过欧式距离法做距离阈值判断、筛选出关键指尖点信息，根据指尖点信息和对应指尖凹点信息结合平面配准的平面获取五个手指特征矢量，根据特征矢量恢复出手势动作。

步骤S130，根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象。

具体的，根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象的步骤包括：

存储每个手势动作与对应的控制指令的对应关系。

在识别手势动作后，从对应关系中读取该手势动作对应的控制指令。

根据所述控制指令，控制三维图像中的操作对象执行对应动作。

在识别出手势动作后，根据预存的手势动作与控制指令之间的对应关系，查找出该手势动作对应的控制指令，并根据该控制指令控制三维图像中的操作对象。

本实施例的三维图像可以采用真三维立体图像显示技术获得空间立体图像。真三维立体图像显示技术是指基于全息显示技术或基于体三维显示技术，在一定实体空间范围内显示立体图像数据，形成真实空间立体图像的一种技术。立体图像数据是具有一三维空间坐标系的图像数据，每个体像素的信息至少包括，该点像素的位置信息和图像信息。

本文的全息显示技术，主要包括传统全息图(透射式全息显示图像、反射式全息显示图像、像面式全息显示图像、彩虹式全息显示图像、合成式全息显示图像等)和计算机全息图(CGH，Computer Generated Hologram)。计算机全息图漂浮于空中并具有较广的色域，在计算机全息图中，用来产生全息图的物体需要在计算机中生成一个数学模型描述，且光波的物理干涉也被计算步骤所代替，在每一步中，CGH模型中的强度图形可以被确定，该图形可以输出到一个可重新配置的设备中，该设备对光波信息进行重新调制并重构输出。通俗的讲，CGH就是通过计算机的运算来获得一个计算机图形(虚物)的干涉图样，替代传统全息图物体光波记录的干涉过程；而全息图重构的衍射过程并没有原理上的改变，只是增加了对光波信息可重新配置的设备，从而实现不同的计算机静态、动态图形的全息显示。

基于全息显示技术，在本发明的其中一些实施例中，空间立体显示装置包括：360全息幻影成像系统，该系统包括光源、控制器、分光镜，光源可以采用射灯，控制器包括一个或多个处理器，通过通信接口接收立体图像数据，并经过处理后获得计算机图形(虚物)的干涉图样，输出该干涉图像至分光镜，并通过光源投射在分光镜上的光呈现此干涉图样，形成空间立体图像。这里的分光镜可以是特殊的镜片、或者是四面棱锥体等等。

除上述360全息幻影成像系统之外，空间立体显示装置还可以基于全息投影设备，例如，通过在空气、特殊镜片、雾屏等上形成立体影像。因此，空间立体显示装置8还可以为空气全息投影设备、激光束全息投影设备、具有360度全息显示屏的全息投影设备(其原理是将图像投影在高速旋转的镜子上，从而实现全息影像。)、以及雾幕立体成像系统等设备中之一。

然而，对于体三维显示技术，其是指利用人自身特殊的视觉机理，制造了一个由体素微粒代替分子微粒组成的显示实物，除了可以看到光波体现的形状外，还能触摸到体素的真实存在。它通过适当方式来激励位于透明显示体积内的物质，利用可见辐射的产生吸收或散射而形成体素，当体积内许多方位的物质都被激励之后，便能形成由许多分散的体素在三维空间内构成三维空间图像。

本发明还可以采用如下方法：

(1)、旋转体扫描技术，旋转体扫描技术主要用于动态物体的显示。在该技术中，一串二维图像被投影到一个旋转或移动的屏幕上，同时该屏幕以观察者无法觉察的速度在运动，因为人的视觉暂留从而在人眼中形成三维物体。因此，使用这种立体显示技术的显示系统可实现图像的真三维显示(360°可视)。系统中不同颜色的光束通过光偏转器投影到显示介质上，从而使得介质体现出丰富的色彩。同时，这种显示介质能让光束产生离散的可见光点，这些点就是体素，对应于三维图像中的任一点。一组组体素用来建立图像，观察者可从任意视点观察到这个真三维图像。基于旋转体扫描技术的显示设备中的成像空间可以由屏幕的旋转或平移产生。在屏幕扫过成像空间时在发射面上激活体素。该系统包括：激光系统、计算机控制系统、旋转显示系统等子系统。

(2)、静态体成像技术，是基于频率上转换技术形成三维立体图像的，所谓频率上转换三维立体显示是利用成像空间介质吸收多个光子后会自发辐射出一种荧光，从而产生可见的像素点。其基本原理是利用两束相互垂直的红外激光交叉作用于上转换材料上，经过上转换材料的两次共振吸收，发光中心电子被激发到高激发能级，再向下能级跃迁就可能产生可见光的发射，这样的上转换材料空间中的一个点就是一个发光的亮点，如果使两束激光的交叉点依照某种轨迹在上转换材料中做三维空间的寻址扫描，那么两束激光的交叉点所扫描过的地方应当是一条可以发射可见荧光的亮带，即可以显示出同激光交叉点运动轨迹相同的三维立体图形。这种显示方法肉眼就可以看到360°全方位可视的三维立体图像。

当然，本发明中的三维图像还可以是基于3D显示技术在显示屏上进行显示获得的3D图像。这里提到的显示屏基于3D显示技术，利用人眼的左右眼视差，使人眼对显示屏上显示的图像进行重构后获得虚拟的3D立体图像。显示屏分为眼镜式显示设备和裸眼式显示设备两大类。眼镜式显示设备利用平面显示屏配合3D眼镜共同实现。裸眼式显示设备，即裸眼3D显示器，其由3D立体现实终端、播放软件、制作软件、应用技术四部分组成，是集光学、摄影、电子计算机，自动控制、软件、3d动画制作等现代高科技技术于一体的交差立体现实系统。

基于上述不同的三维图像成像方式，可以将具有一三维空间坐标系的立体图像数据转化为所需要的输入至不同显示设备上的图像数据。这不同的显示设备基于三维图像的成像方式而采用不同的硬件设备，具体可参见现有技术中的相关内容。

在一个实施例中，手部为张开动作时，通过骨骼跟踪，识别出手部为张开动作，并查找张开动作对应的控制指令，假设张开动作对应的控制指令为起始动作，因此，此时仅显示与手部对应的光标。当在张开动作这个状态下移动手部时，通过骨骼跟踪，反馈给计算机的指令仅为跟踪手部的运动轨迹，即显示光标跟随手部的运动轨迹。由于手势操作空间与三维空间坐标系对应，因此，手部在操作空间内运动时，与三维空间坐标系对应。

如图3(a)和图3(b)所示，当确定需要对某个操作对象进行操作时，移动手部，使手部对应的光标在操作对象的控制区域内。以抓握向前移动和向后移动代表缩小和放大指令为例。在识别到抓握时，获取手部的开始位置，一般以手部的手心位置为开始位置。跟踪手部的运动轨迹，当识别为向前移动时，对应的控制指令为缩小操作对象。当识别为向后移动时，对应的控制指令为放大操作对象。

在其他实施例中，抓握动作为选中指令时，当手部对应的光标在操作对象的控制区域内，在识别到抓握动作时，以此时手部对应光标所在的对象为操作对象，即选中当前对象，可对当前对象进行移动、复制及粘贴等操作。

具体的，如图3(c)所示，当手部为抓握状态，且向前移动时，对应在三维显示中为手部对应的光标逐渐放大。如图3(d)所示，当手部为抓握状态，且向后移动时，对应在三维显示中为手部对应的光标逐渐缩小。三维显示器可处于深度相机下方或是侧边。如图3(e)和图3(f)所示，三维显示器的放置位置并不影响三维操作空间的显示。

在其他实施例中，以张开且转动手指动作为旋转指令时，当手部对应的光标在操作对象的控制区域内，在识别到张开且转动手指动作时，以此时手部对应光标所在的对象为操作对象，即对当前对象进行旋转操作。

基于上述所述实施例，一种基于三维显示的手势操控装置，包括深度相机、三维显示器及处理器。

所述深度相机用于获取手部的深度图像，并输出给所述处理器。

所述处理器根据所述深度图像获取手部的位置信息；并根据所述位置信息建立手部在三维空间坐标系的运动轨迹；所述处理器还用于根据手部在三维空间坐标系的运动轨迹识别手部的手势动作；所述处理器还用于根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象。

在本实施例中，由于是在操作空间(为手部执行一系列连续动作的真实空间)中采集手势动作。因此，三维图像采用全息显示技术可以实现裸眼三维效果。即真实空间与虚拟显示可实时对应显示。因而，在用户在对三维显示器的显示对象进行操作时，能够准确的对显示对象实施抓握、抓握移动等操作。

请结合图3(g)。例如，假设用户需要对三维显示器(采用全息显示技术的三维显示器)显示的待操作立体图像(如球拍)进行旋转及移动的操作，由于操作空间与虚拟显示是实时对应显示，因此用户仅需要在操作空间里找到与待操作立体图像对应的位置，并做出抓握动作。此时，深度相机会检测用户的手势动作，并传输给处理器。处理器则控制三维显示器显示待操作立体图像(如球拍)被用户手部抓握的状态。当用户接着在操作空间中进行抓握移动(或是挥动手臂)时，则处理器控制三维显示器显示待操作立体图像被移动(或是挥动)的轨迹。

如图4所示，为基于三维显示的手势操控系统的模块图。

信息获取模块，用于获取手部的位置信息，

信息获取模块还用于获取手部一系列连续的深度信息，坐标建立模块还用于根据所述深度信息形成手部在三维空间坐标系的运动轨迹。

手部的操作空间与所述三维空间坐标系成线性对应关系，其中，操作空间为手部执行一系列连续动作的真实空间。

手势识别模块还用于提取手部轮廓特征信息，并结合所述位置信息进行特征匹配对手势动作进行识别分类。

操作控制模块包括存储模块、读取模块及执行模块。存储模块用于存储每个手势动作与对应的控制指令的对应关系。读取模块用于在识别手势动作后，从对应关系中读取该手势动作对应的控制指令。执行模块用于根据所述控制指令控制三维图像中的操作对象执行对应动作。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

一种基于三维显示的手势操控方法，包括以下步骤：

获取手部的位置信息，并建立手部在三维空间坐标系的运动轨迹；

根据手部在三维空间坐标系的运动轨迹，识别手部的手势动作；

根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象。
根据权利要求1所述的基于三维显示的手势操控方法，其特征在于，所述获取手部的位置信息，并建立手部在三维空间坐标系的运动轨迹的步骤包括：

获取手部一系列连续的深度信息，根据所述深度信息形成手部在三维空间坐标系的运动轨迹。
根据权利要求1所述的基于三维显示的手势操控方法，其特征在于，所述手部的操作空间与所述三维空间坐标系成线性对应关系，其中，操作空间为手部执行一系列连续动作的真实空间。
根据权利要求1所述的基于三维显示的手势操控方法，其特征在于，所述根据手部在三维空间坐标系的运动轨迹识别手部的手势动作的步骤包括：

提取手部轮廓特征信息，并结合所述位置信息进行特征匹配对手势动作进行识别分类。
根据权利要求1所述的基于三维显示的手势操控方法，其特征在于，所述根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象的步骤包括：

存储每个手势动作与对应的控制指令的对应关系；

在识别手势动作后，从对应关系中读取该手势动作对应的控制指令；

根据所述控制指令控制三维图像中的操作对象执行对应动作。
一种基于三维显示的手势操控系统，其特征在于，包括：

信息获取模块，用于获取手部的位置信息，

坐标建立模块，用于根据所述位置信息建立手部在三维空间坐标系的运动轨迹；

手势识别模块，用于根据手部在三维空间坐标系的运动轨迹识别手部的手势动作；

操作控制模块，用于根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象。
根据权利要求6所述的基于三维显示的手势操控系统，其特征在于，所述信息获取模块还用于获取手部一系列连续的深度信息；所述坐标建立模块还用于根据所述深度信息形成手部在三维空间坐标系的运动轨迹。
根据权利要求6所述的基于三维显示的手势操控系统，其特征在于，手部的操作空间与所述三维空间坐标系成线性对应关系，其中，操作空间为手部执行一系列连续动作的真实空间。
根据权利要求6所述的基于三维显示的手势操控系统，其特征在于，所述手势识别模块还用于提取手部轮廓特征信息，并结合所述位置信息进行特征匹配对手势动作进行识别分类。
根据权利要求6所述的基于三维显示的手势操控系统，其特征在于，所述操作控制模块包括存储模块、读取模块及执行模块；所述存储模块用于存储每个手势动作与对应的控制指令的对应关系；所述读取模块用于在识别手势动作后，从对应关系中读取该手势动作对应的控制指令；所述执行模块用于根据所述控制指令控制三维图像中的操作对象执行对应动作。
一种基于三维显示的手势操控装置，其特征在于，包括深度相机、三维显示器及处理器；

所述深度相机用于获取手部的深度图像，并输出给所述处理器；

所述处理器根据所述深度图像获取手部的位置信息；并根据所述位置信息建立手部在三维空间坐标系的运动轨迹；所述处理器还用于根据手部在三维空间坐标系的运动轨迹识别手部的手势动作；所述处理器还用于根据所述手势动作读取对应的控制指令，并根据所述控制指令控制三维图像中的操作对象；

所述处理器还用于根据所述手势动作控制三维显示器显示该手势动作，并显示执行该手势动作对应的控制指令的轨迹。