CN111027458A

CN111027458A - 基于雷达三维轨迹特征的手势识别方法、装置及存储介质

Info

Publication number: CN111027458A
Application number: CN201911241745.6A
Authority: CN
Inventors: 阳召成; 郑鑫博
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2019-08-28
Filing date: 2019-12-06
Publication date: 2020-04-17
Anticipated expiration: 2039-12-06
Also published as: CN111027458B

Abstract

本发明涉及人机交互手势识别技术领域，公开了一种基于雷达三维轨迹特征的手势识别方法、装置及存储介质，该方法包括：步骤S10、收集多帧三维雷达手势信号；步骤S20、将所述三维雷达手势信号转化为三维轨迹数据；步骤S30、将所述三维轨迹数据输入神经网络中；步骤S40、所述神经网络对三维轨迹数据进行处理，以获得手势识别结果。此外，还提供了手势识别装置及存储介质。通过本发明提供的技术方案，解决了传统手势识别算法特征信息不足无法识别多种手势的问题，及基于雷达图像的神经网络训练成本过高的问题。

Description

基于雷达三维轨迹特征的手势识别方法、装置及存储介质

技术领域

本发明涉及人机交互手势识别技术领域，尤其涉及一种基于雷达三维轨迹特征的手势识别方法、装置及存储介质。

背景技术

在人机交互应用的研究中，手势识别技术一直都是研究热点。传统的手势识别技术的研究一种是基于可穿戴设备或者视觉传感器，但基于可穿戴设备的手势识别技术需要用户戴上相关设备才能实现较高的手势识别准确率，而且穿戴设备需要与人体接触，容易引起用户的不适，降低用户体验。另一种是基于视觉传感器的手势识别技术，虽然是非接触式的，但其在变化的光照条件下和有障碍物遮挡的情况下的手势识别准确率与性能均不高，而且该技术还容易被不法分子利用从而泄露用户隐私。第三种是基于雷达的手势识别技术，与以上两个技术相比，雷达传感器的优势在于：非接触式；可以全天时全天候工作；不会暴露用户隐私；可以穿透障碍物实现手势探测和识别；高帧率等。基于雷达传感器这些优势，越来越多人将雷达传感器应用于手势识别。

但在基于雷达传感器的手势识别技术中，由于手势动作的动态变化灵活，手势目标小等原因，在雷达信号处理、手势特征提取，再到手势识别各环节仍存在问题，主要有：问题一、手势特征信息提取不全面，采用微多普勒(时间-频率)图像，稀疏表示的微多普勒图像和距离-多普勒图像等造成手势特征信息提取不足，无法识别更多种类的手势；问题二、数据预处理不足，提取到的手势图像特征经过部分处理或直接输出到分类器进行训练，造成训练过程计算复杂度高，训练时间长，效率低下，而且随着输入图像维度的增加，这些计算复杂度会增长得更快。

因此，需要考虑如何克服传统手势识别算法特征信息不足无法识别多种手势的问题，及如何克服基于雷达图像的神经网络训练成本过高(训练样本需求数高、网络计算复杂度高)的缺点。

发明内容

本发明主要目的是提供一种基于雷达三维轨迹特征的手势识别方法、装置及存储介质，旨在解决传统手势识别算法特征信息不足无法识别多种手势的问题，及基于雷达图像的神经网络训练的问题。

为实现上述目的，本发明提供了一种基于雷达三维轨迹特征的手势识别方法，该方法包括：

步骤S10：收集多帧三维雷达手势信号；

步骤S20：将所述三维雷达手势信号转化为三维轨迹数据；

步骤S30：将所述三维轨迹数据输入神经网络中；

步骤S40：所述神经网络对三维轨迹数据进行处理，以获得手势识别结果。

进一步地，所述三维雷达手势信号为快时间、慢时间、天线通道的三维雷达手势信号。

进一步地，所述三维雷达手势信号是通过调频连续波(Frequency ModulatedContinuous Wave，FMCW)多输入多输出(Multiple-Input-Multiple-Output，MIMO)雷达收集的多帧三维雷达手势信号。

进一步地，所述三维轨迹数据为距离、多普勒、角度三维轨迹数据。

进一步地，所述神经网络包括输入层、LSTM(Long Short-Term Memory，LSTM)层和输出层，其中，所述LSTM层为长短期记忆网络，其包括三个LSTM编码器，所述输出层包括具有六输出的归一化指数函数softmax。

进一步地，所述步骤S20包括：

步骤S210：将所述三维雷达手势信号中的每一帧信号进行快时间维傅里叶变换(Fast Fourier Transform，FFT)，将快时间维转换到距离维，以得到距离FFT数据S′；

步骤S220：将所述距离FFT数据S′通过一阶递归滤波器进行杂波抑制，得到每一帧杂波抑制后距离FFT数据S″；

步骤S230：将所述距离FFT数据S′采用对数高斯-恒虚警检测器(Constant False-Alarm Rate，CFAR)检测手势目标的位置，当检测到某一帧数据中的手势目标位置时，将该帧的S″沿慢时间维先求和再取均值，积累多帧得到距离时间图，提取该图中能量最大值的位置得到距离像；

步骤S240：将所述杂波抑制后距离FFT数据S″中的慢时间维进行傅里叶变换，将慢时间维转换到多普勒维，得到多普勒-FFTS″′；

步骤S250：基于所述距离像从所述多普勒-FFTS″′中提取主多普勒分量，将多帧主多普勒分量积累得到多普勒-时间图，提取该图中能量最大值的位置得到多普勒像；

步骤S260：从所述距离FFT数据S′中对多个天线接收通道相同帧内同一手势位置处的慢时间维应用多重信号分类MUSIC(Multiple Signal Classification，MUSIC)算法，进行角度谱估计，积累多帧得到角度时间图，提取该图中能量最大值的位置得到角度像；

步骤S270：采用卡尔曼滤波(Kalman filtering)分别对所述距离像、多普勒像和角度像进行平滑去噪，从而得到距离、多普勒、角度三维轨迹数据。

进一步地，所述一阶递归滤波器的计算公式为：

S″(m,q,k)＝(1-α)*S″(m-1,q,k)+α*S′(m,q,k)

其中α是滤波器系数，S″(m,q,k)表示杂波抑制后每一帧距离FFT数据S″，m表示第m个调频信号，属于慢时间维；n表示在第m个调频信号内的第n个采样，属于快时间维；q表示快时间维n进行傅里叶变换后的值，属于距离维；k表示第k个接收天线通道，属于天线通道维。

进一步地，所述步骤S40包括：

步骤S410：所述距离、多普勒、角度三维轨迹数据，经所述输入层输入至第一个LSTM编码器；

步骤S420：依次经过三个所述LSTM编码器运算后，输出对应输入的距离、多普勒、角度轨迹的序列长度和样本数的矩阵；

步骤S430：经输出层归一化指数函数softmax实现识别手势的输出。

为实现上述目的，本发明还提供了一种手势识别装置，所述手势识别装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的手势识别程序，所述手势识别程序被所述处理器执行时实现上述手势识别方法的步骤。

此外，为实现上述目的，本发明还提供了一种存储介质，所述存储介质为计算机可读存储介质，所述存储介质上存储有手势识别程序，所述手势识别程序可被一个或者多个处理器执行，以实现上述手势识别方法的步骤。

本发明提供的基于雷达三维轨迹特征的手势识别方法、装置及存储介质，通过收集多帧快时间、慢时间、天线通道的三维雷达手势信号，及对所述三维雷达手势信号的处理，得到距离、多普勒、角度三维轨迹数据，并基于LSTM神经网络分类算法，完成手势识别，解决了传统手势识别算法特征信息不足无法识别多种手势的问题，及克服了基于雷达图像的神经网络训练成本过高的缺点。

附图说明

图1为本发明一实施例提供的基于雷达三维轨迹特征的手势识别方法流程示意图；

图2为图1中的步骤S20流程示意图；

图3(A)为本发明一实施例提供的手势动作和对应的距离-多普勒-角度轨迹特征图(第一种手势)；

图3(B)为本发明一实施例提供的手势动作和对应的距离-多普勒-角度轨迹特征图(第二种手势)；

图3(C)为本发明一实施例提供的手势动作和对应的距离-多普勒-角度轨迹特征图(第三种手势)；

图3(D)为本发明一实施例提供的手势动作和对应的距离-多普勒-角度轨迹特征图(第四种手势)；

图3(E)为本发明一实施例提供的手势动作和对应的距离-多普勒-角度轨迹特征图(第五种手势)；

图3(F)为本发明一实施例提供的手势动作和对应的距离-多普勒-角度轨迹特征图(第六种手势)；

图4为图1中的步骤S30流程示意图；

图5为本发明一实施例提供的三层LSTM神经网络结构示意图；

图6为本发明一实施例提供的识别准确率与迭代次数统计线状图；

图7为本发明一实施例提供的手势识别装置内部结构示意图；

图8为本发明一实施例提供的手势识别装置中的手势识别程序模块示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，图1为本发明一实施例提供的基于雷达三维轨迹特征的手势识别方法流程示意图，该方法包括：

步骤S10：收集多帧三维雷达手势信号；其中，所述三维雷达手势信号为快时间、慢时间、天线通道的三维雷达手势信号。具体地，在一实施例中，通过调频连续波(FrequencyModulated Continuous Wave，FMCW)多输入多输出(Multiple-Input-Multiple-Output，MIMO)雷达收集多帧三维雷达手势信号。

步骤S20：将所述三维雷达手势信号转化为三维轨迹数据；其中，所述三维轨迹数据为距离、多普勒、角度三维轨迹数据。

步骤S30：将所述三维轨迹数据输入神经网络中。

在一实施例中，将每一帧的三维雷达手势信号表示为s(m,n,k)，其中，m表示第m个调频信号，属于慢时间维；n表示在第m个调频信号内的第n个采样，属于快时间维；k表示第k个接收的天线通道，属于天线通道维，也叫空间维。

步骤S20中将所述三维雷达手势信号分别进行细化处理，对该三维雷达手势信号的快时间维依次进行傅里叶变换(Fast Fourier Transform，FFT)、杂波抑制和目标检测后得到距离像；再基于距离像对杂波抑制后的结果进行慢时间维的FFT，提取其主多普勒成分得到多普勒像；接着基于距离像对杂波抑制前的结果采用多重信号分类(Multiple SignalClassification，MUSIC)算法得到角度谱，通过对角度谱进行角度遍历可得到角度像。继而采用卡尔曼滤波器(Kalman Filter)分别对提取的距离像、多普勒像和角度像进行平滑和去噪，得到所述三维轨迹数据。

参阅图2所示，图2为图1中的步骤S20流程示意图，步骤S20包括：

步骤S210：将所述三维雷达手势信号中的每一帧信号进行快时间维傅里叶变换(Fast Fourier Transform，FFT)，将快时间维转换到距离维，得到距离FFT数据S′(m,q,k)；其中，S′表示每一帧所述三维雷达手势信号的距离FFT数据，q表示快时间维n进行傅里叶变换后的值，属于距离维。

步骤S220：将所述距离FFT数据S′通过一阶递归滤波器进行杂波抑制，得到每一帧杂波抑制后距离FFT数据S″，其中，S″表示每一帧所述三维雷达手势信号经过杂波抑制后的距离FFT数据。

考虑到在手势检测的过程中，人的身体其他部位微动或其他原因会产生许多动态干扰，这些干扰可以称为杂波。杂波抑制技术就是用于去除这些杂波。本发明提供一个一阶递归滤波器进行杂波抑制，计算公式为：

S″(m,q,k)＝(1-α)*S″(m-1,q,k)+α*S′(m,q,k)

其中,α是滤波器系数，取值为(0<α<1)，用于设置调整杂波抑制精度；S″(m,q,k)表示杂波抑制后每一帧距离FFT数据S″，m表示第m个调频信号，属于慢时间维；n表示在第m个调频信号内的第n个采样，属于快时间维；q表示快时间维n进行傅里叶变换后的值，属于距离维；k表示第k个接收天线通道，属于天线通道维。

步骤S230：将所述距离FFT数据S′采用对数高斯-恒虚警检测器(Constant False-Alarm Rate，CFAR)检测手势目标的位置，假设在第l帧检测到手势目标的位置r_hand之后，将第l帧的S″(m,q,k)沿慢时间维先求和再取均值。针对所有的帧同样采集，最后积累结果得到距离时间图，提取该图中能量最大值的位置即可得到距离像。

步骤S240：将所述杂波抑制后距离FFT数据S″中的慢时间维进行傅里叶变换，将慢时间维转换到多普勒维，得到多普勒-FFTS″′。

步骤S250：基于所述距离像从所述多普勒-FFTS″′中提取主多普勒分量，将多帧主多普勒分量积累得到多普勒-时间图，提取该图中能量最大值的位置得到多普勒像。

步骤S260：从所述距离FFT数据S′中对多个天线接收通道相同帧内同一手势位置处的慢时间维应用多重信号分类MUSIC(Multiple Signal Classification，MUSIC)算法，进行角度谱估计，积累多帧得到角度时间图，提取该图中能量最大值的位置得到角度像。

请参阅图3，图3为本发明一实施例提供的手势动作和对应的距离-多普勒-角度轨迹特征图，包括本实施例提供的6种手势实验的六种手势，分别是：单手左右挥动(图3(A))、单手上下挥动(图3(B))、单手画圆(图3(C))、单手画叉(图3(D))、单手画对号(图3(E))和单手翻转(图3(F))。

步骤S30：将所述三维轨迹数据输入神经网络中，在一实验例中，所述神经网络包括三层长短期记忆网络LSTM(Long Short-Term Memory，LSTM)。

所述神经网络包括输入层、LSTM(Long Short-Term Memory，LSTM)层和输出层，其中，所述LSTM层为长短期记忆网络，其包括三个LSTM编码器，所述输出层包括具有六输出的归一化指数函数softmax。其中，输入层负责将所述三维轨迹数据输入至第一个LSTM编码器，进行神经元编码；LSTM编码器用于将输入的所述神经元编码进行递归运算，经过三个LSTM编码器进行三次递归运算；所述输出层包括具有六个输出的归一化指数函数softmax，负责将手势识别结果输出。

请参阅图4，为图1的步骤S40的流程示意图，步骤S40：所述神经网络对三维轨迹数据进行处理，以获得手势识别结果。

所述步骤S40具体包括：

如图5所示，为本发明一实施例提供的三层LSTM神经网络结构示意图，三层LSTM神经网络10包括输入层110、第一LSTM编码器120、第二LSTM编码器130、第三LSTM编码器140和具有六个输出的归一化指数函数softmax输出层150组成。

本实施例提供以下的测试数据：

我们收集4个测试人员的实验数据，收集到的数据中每种手势包含550组双站雷达数据，总共有3300组双站雷达的数据。所有的实验数据将按照4:1的比例分为训练集和测试集。训练集所有数据被随机混合并且打乱，接下来的实验过程被重复20次，最后的实验结果取均值。

使用FMCW MIMO雷达系统能够测量目标的距离、多普勒和角度信息，能够带来更多的手势信息，本实施例设计6种手势的识别。

表1不同种类手势的识别率

手势

1

2

3

4

5

6

距离

35.1％

95.0％

52.1％

68.4％

66.6％

75.3％

多普勒

68.5％

99.3％

71.1％

76.9％

59.6％

81.4％

距离-多普勒

72.5％

99.6％

73.5％

86.1％

78.1％

84.2％

距离-多普勒-角度

96.1％

99.9％

96.5％

96.4％

96.5％

96.7％

从表1中我们可以得知，基于距离、多普勒、角度三维轨迹的手势识别方法对6种手势的识别准确率都能达到96％以上，最低识别率达到96.1％，最高识别率在99.9％，相差较小。而基于单距离轨迹、单多普勒轨迹和距离多普勒轨迹的方法所得手势识别准确率范围波动较大，最低识别率只有35.1％。

请参阅图6，为本发明一实施例提供的识别准确率与迭代次数统计线状图，使用所述手势识别方法，当迭代次数为1200时，对应的混淆矩阵如表2所示。

表2迭代次数为1200的混淆矩阵

手势

1

2

3

4

5

6

1

96.1％

0％

1.1％

1.8％

1.0％

0％

2

0％

99.9％

0％

0.1％

0％

3

0.6％

0.1％

96.5％

1.6％

0.5％

0.7％

4

2.9％

0.2％

0.4％

96.4％

0.1％

0％

5

0.8％

0.1％

0.4％

0.2％

96.5％

2.0％

6

0.4％

0.5％

1.2％

0％

1.2％

96.7％

从表2中可知，每种手势都能达到较高的手势识别率，迭代次数在比较低的情况下，也能够准确识别，这样就大大降低了训练成本，提升了识别效率。

因此，距离-多普勒-角度轨迹能够包含更多手势信息，可扩展更多种类的可识别手势。

此外，本发明还提供一种手势识别装置。

请参阅图7，是本发明实施例提供了一种手势识别装置的内部结构示意图，所述手势识别装置至少包括存储器11、处理器12、通信总线13，以及网络接口14。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是手势识别装置的内部存储单元，例如该手势识别装置的硬盘。存储器11在另一些实施例中也可以是手势识别装置的外部存储设备，例如手势识别装置上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，存储器11还可以既包括手势识别装置的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于手势识别装置的应用软件及各类数据，例如手势识别程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行手势识别程序等。

通信总线13用于实现这些组件之间的连接通信。

网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该手势识别装置与其他电子设备之间建立通信连接。

可选地，该手势识别装置还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在手势识别装置中处理的信息以及用于显示可视化的用户界面。

图7仅示出了具有组件11-14以及手势识别程序的手势识别装置，本领域技术人员可以理解的是，图7示出的结构并不构成对手势识别装置的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

在图7所示的手势识别装置实施例中，存储器11中存储有手势识别程序；处理器12执行存储器11中存储的手势识别程序时实现如下步骤：

步骤S10：收集多帧三维雷达手势信号；

步骤S20：将所述三维雷达手势信号转化为三维轨迹数据；

步骤S30：将所述三维轨迹数据输入神经网络中；

参照图8所示，为本发明手势识别装置一实施例中的手势识别程序的程序模块示意图，该实施例中，手势识别程序可以被分割为接收模块10、提取模块20、去噪模块30、识别模块40和输出模块50，示例性地：

接收模块10，用于执行检测到雷达信号，并执行接收所述多帧快时间、慢时间、天线通道的三维雷达手势信号的任务；

提取模块20，用于执行从所述三维雷达手势信号中进行距离像提取、多普勒像提取及角度像提取任务；

去噪模块30，用于对所述距离像、多普勒像和角度像进行平滑去噪任务；

识别模块40，用于执行三层LSTM神经网络的分类识别任务；

输出模块50，用于执行输出手势识别结果。

上述接收模块10、提取模块20、去噪模块30、识别模块40和输出模块50等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同，在此不再赘述。

此外，本发明实施例还提出一种存储介质，所述存储介质为计算机可读存储介质，所述存储介质上存储有手势识别程序，所述手势识别程序可被一个或多个处理器执行，以实现如下操作：

步骤S10：收集多帧三维雷达手势信号；

步骤S20：将所述三维雷达手势信号转化为三维轨迹数据；

步骤S30：将所述三维轨迹数据输入神经网络中；

本发明的存储介质具体实施方式与上述手势识别方法和装置各实施例基本相同，在此不作累述。

需要说明的是，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是无人机、手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种基于雷达三维轨迹特征的手势识别方法，其特征在于，所述手势识别方法包括：

步骤S10：收集多帧三维雷达手势信号；

步骤S20：将所述三维雷达手势信号转化为三维轨迹数据；

步骤S30：将所述三维轨迹数据输入神经网络中；

2.根据权利要求1所述的手势识别方法，其特征在于，所述三维雷达手势信号为快时间、慢时间、天线通道的三维雷达手势信号。

3.根据权利要求1所述的手势识别方法，其特征在于，所述三维雷达手势信号是通过调频连续波(Frequency Modulated Continuous Wave，FMCW)多输入多输出(Multiple-Input-Multiple-Output，MIMO)雷达收集的多帧三维雷达手势信号。

4.根据权利要求1所述的手势识别方法，其特征在于，所述三维轨迹数据为距离、多普勒、角度三维轨迹数据。

5.根据权利要求1所述的手势识别方法，其特征在于，所述神经网络包括输入层、LSTM(Long Short-Term Memory，LSTM)层和输出层，其中，所述LSTM层为长短期记忆网络，其包括三个LSTM编码器，所述输出层包括具有六输出的归一化指数函数softmax。

6.根据权利要求1所述的手势识别方法，其特征在于，所述步骤S20包括：

步骤S210：将所述三维雷达手势信号中的每一帧信号进行快时间维傅里叶变换(FastFourier Transform，FFT)，将快时间维转换到距离维，以得到距离FFT数据S′；

7.根据权利要求6所述的手势识别方法，其特征在于，所述一阶递归滤波器的计算公式为：

S″(m，q，k)＝(1-α)*S″(m-1，q，k)+α*S′(m，q，k)

其中α是滤波器系数，S″(m，q，k)表示杂波抑制后每一帧距离FFT数据S″，m表示第m个调频信号，属于慢时间维；n表示在第m个调频信号内的第n个采样，属于快时间维；q表示快时间维n进行傅里叶变换后的值，属于距离维；k表示第k个接收天线通道，属于天线通道维。

8.根据权利要求1至7中任一权利要求所述的手势识别方法，其特征在于，所述步骤S40包括：

9.一种手势识别装置，其特征在于，所述手势识别装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的手势识别程序，所述手势识别程序被所述处理器执行时实现如权利要求1至8中任一项所述的手势识别方法的步骤。

10.一种存储介质，其特征在于，所述存储介质为计算机可读存储介质，所述存储介质上存储有手势识别程序，所述手势识别程序可被一个或者多个处理器执行，以实现如权利要求1至8中任一项所述的手势识别方法的步骤。