CN102024151B - 手势动作识别模型的训练方法和手势动作识别方法 - Google Patents

手势动作识别模型的训练方法和手势动作识别方法 Download PDF

Info

Publication number
CN102024151B
CN102024151B CN 201010577408 CN201010577408A CN102024151B CN 102024151 B CN102024151 B CN 102024151B CN 201010577408 CN201010577408 CN 201010577408 CN 201010577408 A CN201010577408 A CN 201010577408A CN 102024151 B CN102024151 B CN 102024151B
Authority
CN
China
Prior art keywords
gesture motion
data
cognition
gyro
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201010577408
Other languages
English (en)
Other versions
CN102024151A (zh
Inventor
邢云冰
陈益强
黄启友
胡明清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Music Intelligent Technology (Jinan) Co.,Ltd.
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN 201010577408 priority Critical patent/CN102024151B/zh
Publication of CN102024151A publication Critical patent/CN102024151A/zh
Application granted granted Critical
Publication of CN102024151B publication Critical patent/CN102024151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供一种手势动作识别模型的训练方法,包括:通过陀螺传感器获取用于手势动作识别训练的样本数据,所述样本数据包括用于记录某一手势动作的二轴陀螺数据序列;对所得到的样本数据中的各个二轴陀螺数据序列做数据长度归一化,生成标准长度的二轴陀螺数据序列;从所得到的二轴陀螺数据序列中提取特征向量;所述特征向量反映了所述陀螺传感器的运动角度信息;利用所述的特征向量训练手势动作识别模型。本发明实时性高,适用范围广;实现简单;鲁棒性强,体感动作识别可靠。

Description

手势动作识别模型的训练方法和手势动作识别方法
技术领域
本发明涉及手势识别领域,特别涉及手势动作识别模型的训练方法和手势动作识别方法。
背景技术
人机交互,作为沟通人与设备之间的桥梁,在未来的智能输入中占据着举足轻重的位置。常见的交互设备有键盘、鼠标、手写板、触摸屏、遥控器等,这些交互设备中的软件将设备状态变化转换为各种交互语义,比如调高音量、切换电视节目频道、翻页PPT等,进而发送给目标系统。但是,传统的输入设备存在种种不足,它们的交互模式还停留在二维阶段,不能脱离平面进行3D输入。例如教师在课堂进行PPT讲课时,对PPT的操作还处于比较原始的上下翻页阶段,并且只能在固定位置(如讲台)通过鼠标或者键盘完成相应操作。而随着传感器技术的发展(如微电子机械技术的日益成熟)以及传感器价格的下降,加速度计、陀螺仪等传感设备已经从传统的专用领域(如国防,航空,航天等领域)向其它领域渗透。传感器技术在人机交互领域同样得到了应用,这使得人机交互从传统的二维空间向三维空间发展。
传感器技术应用在人机交互领域中所带来的变革之一是新型的3D输入方式,所述的3D输入方式是指借助于手持设备在三维空间通过手势动作完成信息输入的方式,这样的人机交互方式不仅为使用者解除空间和线缆的束缚,在自由的空间完成相应的人机交互,并且能够支持输入各种形状图案和文字数字信息。3D输入的关键是如何尽快识别出手势动作,手势动作识别是3D输入的基础,目前传统的手势动作识别方法主要有2种方式:
(1)利用专门的目标识别算法检测出图像中的特定手势,例如基于计算机视觉的色度直方图方法。此类方法对视频序列中的所有图像分别操作,以形成最终的手势轨迹,然后根据手势轨迹完成手势动作的识别。
(2)基于传感器的特征提取方法。此类方法对提取的特征值采用特定的模式识别算法,利用这一模式识别算法来完成手势动作识别。例如在基于加速度传感器的游戏遥控器中,普遍采用加速度数据的统计特征值来完成行为识别,进而实现游戏互动。
在第一种方法中,需要利用图像信息来实现手势动作识别。但该方法中所采用的基于视觉的轨迹跟踪算法的复杂度普遍较高,并且需要增加摄像机等硬件设备,因而加大了系统的复杂度和成本,此外,基于视觉的技术普遍对周围环境的光线和用户所处的位置和方向有强烈的依赖性。在第二种方法中,利用当前广泛存在的加速度传感器来捕捉人的手势动作,但正如参考文献1“基于角速率陀螺仪的无线鼠标的设计与实现,作者:曹青等,微计算机信息.2008,12-2:p230-232”描述的那样,由于加速度传感器在低速和匀速操作中灵敏度不高,因此识别精度和效率不高,经常会出现错判和漏判现象,只适合识别少量比较简单的动作。
发明内容
本发明的目的是克服现有手势识别方法复杂度较高、或识别精度和效率不高等缺陷,从而提供一种简单、易用、准确度高的手势识别方法。
为了实现上述目的,本发明提供了一种手势动作识别模型的训练方法,包括:
步骤1)、通过陀螺传感器获取用于手势动作识别训练的样本数据,所述样本数据包括用于记录某一手势动作的二轴陀螺数据序列;
步骤2)、对步骤1)所得到的样本数据中的各个二轴陀螺数据序列做数据长度归一化,生成标准长度的二轴陀螺数据序列;
步骤3)、从步骤2)所得到的二轴陀螺数据序列中提取特征向量;所述特征向量反映了所述陀螺传感器的运动角度信息;
步骤4)、利用所述的特征向量训练手势动作识别模型。
上述技术方案中,所述特征向量用
Figure BSA00000377641800021
表示,该向量维度是2DIM,其计算公式如下:
ev i x = sin ( x i - μ x ( x i - μ x ) 2 + ( y i - μ y ) 2 ) , ev i y = sin ( y i - μ y ( x i - μ x ) 2 + ( y i - μ y ) 2 )
其中,(xi,yi)是从步骤2)得到的二轴陀螺数据序列中所包含的陀螺传感器的水平和垂直方向的瞬时角速度,(μx,μy)是处于静止状态时统计出来的均值;特征向量
上述技术方案中,在所述的步骤1)中还包括:
对所获取的样本数据进行预处理,以去除所述样本数据中影响手势动作识别的冗余数据。
上述技术方案中,所述的预处理包括空闲数据剔除,以去除所述二轴陀螺数据序列中用于表示手势动作处于静止状态的数据。
上述技术方案中,所述的预处理包括异常数据剔除,以去除所述二轴陀螺数据序列中由于外部因素而造成的非正常数据。
上述技术方案中,所述的预处理包括数据平滑滤波。
上述技术方案中,在所述的步骤1)中,通过陀螺传感器获取用于手势动作识别训练的样本数据包括:
步骤1-1)、通过陀螺传感器获取一段时间内用于手势动作识别训练的样本数据;
步骤1-2)、对步骤1-1)所获取的样本数据进行分割,以区分不同手势动作所对应的二轴陀螺数据序列。
上述技术方案中,在所述的步骤2)中,采用插值法或亚采样法对样本数据中的各个二轴陀螺数据序列做数据长度归一化。
上述技术方案中,所述手势动作识别模型为支持向量机模型,利用所述的特征向量训练手势动作识别模型能够得到多组与所述支持向量机模型所对应的向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE,一组所述向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE对应一种类型的手势动作。
本发明还提供了一种手势动作识别方法,包括:
步骤1)、通过陀螺传感器获取待识别的手势动作,所述待识别的手势动作用二轴陀螺数据序列表示;
步骤2)、对步骤1)所得到的用于表示待识别的手势动作的二轴陀螺数据序列做数据长度归一化,将其转化为标准长度;
步骤3)、从步骤2)所得到的二轴陀螺数据序列中提取特征向量;所述特征向量反映了所述陀螺传感器的运动角度信息;
步骤4)、将前一步骤所提取的特征向量输入到权利要求1-8之一所生成的手势动作识别模型中,根据手势动作识别模型的计算结果得到待识别的手势动作的类型。
上述技术方案中,在所述的步骤1)中还包括:
对待识别的手势动作的二轴陀螺数据序列进行预处理,以去除所述二轴陀螺数据序列中影响手势动作识别的冗余数据。
上述技术方案中,所述的预处理包括空闲数据剔除,以去除所述二轴陀螺数据序列中用于表示手势动作处于静止状态的数据。
上述技术方案中,所述的预处理包括异常数据剔除,以去除所述二轴陀螺数据序列中由于外部因素而造成的非正常数据。
上述技术方案中,所述的预处理包括数据平滑滤波。
上述技术方案中,在所述步骤3)中,所述特征向量用
Figure BSA00000377641800041
表示,该向量维度是2DIM,其计算公式如下:
ev i x = sin ( x i - μ x ( x i - μ x ) 2 + ( y i - μ y ) 2 ) , ev i y = sin ( y i - μ y ( x i - μ x ) 2 + ( y i - μ y ) 2 )
其中,(xi,yi)是从步骤2)得到的二轴陀螺数据序列中所包含的陀螺传感器的水平和垂直方向的瞬时角速度,(μx,μy)是处于静止状态时统计出来的均值;特征向量
Figure BSA00000377641800044
上述技术方案中,所述手势动作识别模型为支持向量机模型,所述步骤4)包括:
步骤4-1)、由权利要求1-9之一所生成的手势动作识别模型得到多组向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE;选择其中一组结果执行步骤4-2);
步骤4-2)、将由步骤3)所得到的待识别的手势动作的特征向量
Figure BSA00000377641800045
代入下列公式,得到一计算结果:
Σ i = 0 SIZE α i × e - γ × Σ j = 0 2 × DIM ( ev j - sv ij ) 2 + β
其中,evj为特征向量
Figure BSA00000377641800047
的某一分量;
步骤4-3)、判断所述多组向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE是否都已经执行步骤4-2),若都已经执行,则执行下一步,否则取未执行的一组向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE,然后重新执行步骤4-2);
步骤4-4)、将步骤4-2)所得到的计算结果中值最大的计算结果所对应的某一组向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE所代表的手势动作类型作为待识别的手势动作的类型。
本发明的优点在于:
(1)实时性高,适用范围广。
(2)实现简单。
(3)鲁棒性强,体感动作识别可靠。
附图说明
图1为本发明的手势动作识别模型的训练方法在一个实施例中的流程图;
图2为运动方向和水平方向的夹角的示意图;
图3(a)为亚采样方式的一个实施例的示意图;
图3(b)为插值方式的一个实施例的示意图;
图4为本发明的手势动作识别方法在一个实施例中的流程图。
具体实施方式
为了方便理解,在对本发明的方法做详细说明前,首先给出本发明方法的一个可能的应用场景。在进行PPT讲课时,教师希望能够和学生进行文字交流,以增加教师与学生之间的互动。当教师使用一个输入笔在空中完成相应的手势动作输入时,例如在空中划一个“0”,如果该输入笔采集的手势动作能够被识别,而且反映到PPT界面上,那么教师就能够在自由行走的空间完成对PPT的操作,并且通过简单的几个手势动作即可实现命令的输入。在自由行走的过程中即可实现诸如对学生的反馈情况在PPT上做标注、对PPT页面做前后翻页等操作,较现有技术需要固定在讲台附近利用鼠标、键盘完成课堂交互显然更为方便。虽然在现有技术中也存在直接对输入笔采集的手势动作进行识别的相关方法,但正如背景技术中已经提到的,如果采用前述的第一种方式,该方式因为对光线和用户所处的位置和方向有强烈的依赖性,并且系统的复杂度高,所以不利于在课堂教学这样移动性强的环境中应用,如果采用前述的第二种方式,由于加速度传感器在低速和匀速操作中灵敏度不高,从而限制了手势动作识别的准确率。
针对上述应用场景,在下文中给出了本发明的手势动作识别方法的实施例。需要说明的是,在下列实施例中,在实现手势动作识别之前,需要在诸如输入笔的手持装置中放置一个陀螺传感器,由该陀螺传感器感知教师当前的手势动作状态,输出用于描述教师当前手势动作的数据,本发明的手势动作识别方法将根据这些数据来识别手势动作。
根据本发明的手势动作识别方法所实现的手势动作识别过程总体上分成两个阶段,第一阶段是训练,第二阶段是识别。下面结合图1首先对训练阶段进行描述。
训练阶段
步骤1)、通过陀螺传感器获得手势动作的二轴陀螺数据序列。
利用装有陀螺传感器的手持装置(如输入笔、遥控器等)检测用户某个独立的、包含某种语意或表达某种意图的手势动作,并记录该手势动作整个过程中的二轴陀螺数据序列。
所谓的二轴陀螺数据是由安装在输入笔上的陀螺传感器所采集到的输入笔在空间两个方向的转动角速度,二轴陀螺传感器输出图2所示的两个方向上的瞬时转动角速度,所获得的二轴陀螺数据序列采用(x0,y0,x1,y1,...,xN-1,,yN-1)标记,长度是2N(N表示一段时间内所采集的数据个数,由于存在x和y两个方向,所以总长度是2N)。由于陀螺传感器本身并不能区分在一段时间内采集到的二轴陀螺数据序列(x0,y0,x1,y1,...,xN-1,,yN-1)包括有几个手势动作,因此要得到某一手势动作的二轴陀螺数据序列就需要对一段连续时间内的陀螺传感器所发出的二轴陀螺数据序列进行分割,以区分不同手势动作所对应的二轴陀螺数据序列,区分前后手势动作之间的间隙。
要实现手势动作所对应的二轴陀螺数据序列的分割有多种实现方式,一种实现方式是设计一个专门的按钮,在手势动作的开始和结束时通过按按钮标记一个手势动作,例如在用户输入动作时按住该按钮,完成动作时松开按钮,这样就能够较为准确地得到一个手势动作所对应的二轴陀螺数据序列。另一种实现方式是通过数据分析的方法来切割手势动作。例如,由于在静止状态时,陀螺传感器所生成的二轴陀螺数据序列的值易于判断,因此可以对在静止状态时的陀螺传感器所生成的二轴陀螺数据序列进行标记,将两次静止状态之间的陀螺数据作为该手势动作对应的数据序列。在本实施例中,可以采用上述两种实现方式中的任意一种,在其他实施例中也可以采用现有技术中的其他方法。
需要说明的是,为了保证训练结果的准确性,在训练阶段需要有大量的样本数据,因此在执行本步骤时应该保证能够得到大量通过陀螺传感器所获得的手势动作的二轴陀螺数据序列,这些数据都将作为样本数据。此外,通过本发明方法最终能够识别的手势动作的类型与训练阶段所能提供的样本数据有关。例如,如果样本数据中给出了用于表示数字0-9的手势动作,而没有给出用于表示英文字母a-z的手势动作,那么在将来的识别阶段,只能识别出数字0-9,而无法识别英文字母a-z。在样本数据集中,每一种类型的手势动作应该采集有多组二轴陀螺数据序列。
步骤2)、对前一步骤所得到的样本数据进行预处理。
所述预处理的目的是去除样本数据中那些影响手势动作识别的冗余数据。在本实施例中,样本数据的预处理包括空闲数据剔除、异常数据剔除和数据平滑滤波。下面以一个手势动作所对应的二轴陀螺数据序列为例,对其数据预处理的过程进行说明,对于其它手势动作而言,它们的数据预处理过程与之类似。
步骤21)、空闲数据剔除。用户在手势动作输入开始或者结束阶段,可能会有短时间的静止状态,同时用户在连续动作过程中也有可能出现瞬间的停顿,这些在静止状态下的数据被称为空闲数据。空闲数据不包含任何运动信息,在手势动作识别过程中是无效的,甚至会影响手势动作的正常识别。因此需要剔除这些空闲数据。
在本实施例中,通过一个滤波器来剔除空闲数据,该滤波器可以通过统计的方法实现。首先计算陀螺传感器在静止状态时的均值和方差,然后设定当前正常数据的置信区间范围,如果样本数据中的某一项值落在该置信区间范围外,则认为该数据项为正常数据,若在置信区间范围之内则认为是空闲数据。这一判断过程可用下列形式表示:
如果:(|xix|<k×σx)&&(|yiy|<k×σy),那么数据(xi,yi)是空闲数据,需要从样本数据的数据序列中剔除。
其中,(xi,yi)是二轴陀螺数据,(μx,μy)是处于静止状态时统计出来的均值,(σx,σy)是处于静止状态时统计出来的方差,k是经验系数。
步骤22)、异常数据剔除。在实际的手势动作识别过程中,按下或松开按键、手的抖动以及陀螺设备供电电压不稳定等都会产生异常数据,例如,在静止状态时,陀螺的数据值突然变大,或者在运动状态时,相邻数据的变化突然变大,这些异常数据对识别性能和精度有很大影响。在本实施例中,仍然可以采用基于统计的方法来剔除这些异常数据。首先,在陀螺数据的采集过程中对历史数据进行统计分析,得到均值和方差,然后根据一定的可信度得到相应的置信区间范围。如果样本数据中的某一项值落在该置信区间范围内,则认为该数据项为正常数据,若在置信区间范围之外则认为是异常数据。这一判断过程可用下列形式表示:
如果:(|xix|>m×μy)||(|yi-μy|>m×σy),那么数据(xi,yi)是异常数据,需要从步骤21)所生成的数据序列中剔除。
其中,(xi,yi)是二轴陀螺数据,(μx,μy)是处于正常状态时对历史数据统计出来的均值,(σx,σy)是处于正常状态时对历史数据统计出来的方差,m是经验系数。
步骤23)、数据平滑滤波。陀螺传感器所采集的数据经常有数据不够平滑的缺点,因此需要在本步骤中对样本数据进行平滑滤波。平滑滤波的方法有多种,如滑动窗口算法或者中值滤波算法,在本实施例中可采用上述两种方法中的任意一种,在其他实施例中,也可以采用现有技术中的其他方法。本步骤并非是本发明方法所必须的,若陀螺传感器所采集的数据较为平滑,则本步骤可以省略。
一个手势动作的样本数据在经过上述预处理后,所得到的数据序列可以用(x0,y0,x1,y1,...,xM-1,,yM-1)表示,长度是2M(M表示采集的数据个数,由于存在x和y两个方向,所以总长度是2M。之前提到,最原始采集的数据个数是N个,总长度是2N,这N个数据经过前述的切分和预处理变成了M个,M≤N)。对手势数据做上述数据预处理,有助于更好地训练手势动作识别模型,进而提高手势动作识别的准确率。但若所采集的样本数据效果非常好,则该预处理步骤也可省略,以加快速度。
步骤3)、数据序列归一化。
由于用户在输入手势动作时,不同的人动作速度不一样,不同手势动作所要花费的时间也不一样,即使是同一个人,不同时间所输入的同一个动作所花费的时间也不尽相同,因而所采集到的手势动作的数据序列呈现不同的长度。但下文所提到的支持向量机在处理数据序列时,需要数据序列具有固定的长度,因此在本步骤中需要将不等长的数据序列归一化成等长的数据序列。
数据序列的归一化包括插值和亚采样两种实现方式,若样本数据中的数据序列的长度较标准长度更长,则可以采用亚采样的方式实现,若样本数据中的数据序列的长度较标准长度更短,则可以采用插值的方式实现。以图3(a)为例,在一数据序列中原有11个数据(图的上半部分),数据之间的间隔为1,通过亚采样最后得到8个数据(图的下半部分),因此亚采样后数据之间的间隔是
Figure BSA00000377641800091
以坐标为
Figure BSA00000377641800092
的第四个数据为例,它处于坐标4和坐标5的原始数据之间,因此它的值可以表示为坐标4和坐标5的值的加权平均值以图3(b)为例,在一数据序列中原有6个数据(图的上半部分),数据之间的间隔为1,通过插值最后得到8个数据(图的下半部分),因此插值后数据之间的间隔是
Figure BSA00000377641800094
以坐标为
Figure BSA00000377641800095
的第七个数据为例,它处于坐标4和坐标5的原始数据之间,因此它的值可以表示为坐标4和坐标5的值的加权平均值
Figure BSA00000377641800096
数据序列归一化后所得到的数据序列采用(x0,y0,x1,y1,...,xDIM-1,,yDIM-1)标记,长度是2DIM。
步骤4)、特征向量提取。
可靠的特征向量提取是影响手势动作识别性能的关键一环。用户在输入手势动作时,不同的人动作幅度不一样,因此使用传统的统计方法很难找到合适的具有较强鲁棒性的特征。此外,从用户角度来看,用户输入手势动作后期望在短时间内能得到响应,因此要求特征向量提取方法具有较低的算法复杂度。
考虑到对于同一个手势动作,不同用户的动作幅度不同(手势动作有大有小),持续时间也不同(有快有慢),唯一相同的是运动的方向性,因此将角度信息作为特征向量可以有效地消除不同人的相同手势动作的差别,这一特征向量反映了不同手势动作的本质区别。出于这一考虑,在本实施例中,以图2所示的运动方向和水平方向的夹角作为手势动作识别的特征向量,本实施例中的特征向量采用
Figure BSA00000377641800097
表征,向量维度是2DIM,其计算公式如下:
ev i x = sin ( x i - μ x ( x i - μ x ) 2 + ( y i - μ y ) 2 ) , ev i y = sin ( y i - μ y ( x i - μ x ) 2 + ( y i - μ y ) 2 ) - - - ( 1 )
其中,(xi,yi)是经过数据序列归一化后,数据序列中所包含的陀螺传感器的水平和垂直方向的瞬时角速度,(μx,μy)是处于静止状态时统计出来的均值。上述特征反映了手势动作的角度信息,因为任意一组数据(xi,yi)对应一组唯一的特征向量
Figure BSA00000377641800103
将角度特征进行sin正弦化的原因是为了将手势动作的运动特征锐化,因为正弦化后,对于平缓的动作,相对增强了数据的变化,而对于剧烈的运动,相对减缓了数据的变化。由于用户在手势动作输入时,虽然输入动作的幅度和空间跨度不同,但是在同一个时间尺度下,对于同一个输入模式,
Figure BSA00000377641800104
特征向量是一致的。因此,
Figure BSA00000377641800105
可以有效地消除因为不同人输入动作幅度不同而导致的识别困难情况,鲁棒性强且计算简单。例如,输入水平运动手势动作后,无论输入动作的幅度和跨度是否相同,在同一时间尺度下,
Figure BSA00000377641800106
的值均为(sin(1),0)。
在本实施例中,采用了上述形式的特征向量,但在其它实施例中,也可以采用其它类型的运动角度信息作为特征向量,例如,
Figure BSA00000377641800107
sign(x)表示x的符号。
步骤5)、利用手势动作的特征向量训练手势动作识别模型。
之前提到,样本数据中包括有大量的、多种类型的手势动作的二轴陀螺数据序列。这些二轴陀螺数据序列通过前一步骤提取出了各个数据序列中的特征向量,这些特征向量可以用来训练手势动作识别模型。在本实施例中,所述手势动作识别模型为支持向量机模型,该模型的训练可采用matlab内建的支持向量机工具箱实现,最终输出与支持向量机模型所对应的向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE。如何利用所述特征向量来训练支持向量机模型,最终得到上述参数为本领域技术人员所公知的,因此不在此处重复。在其他实施例中,所述手势动作识别模型还可以采用诸如神经网络模型、决策树模型等模型。
需要说明的是,在样本数据中一般包括有多个类型的手势动作,例如用于画出0-9数字的10个类型的手势动作(当然,在样本数据中每个手势动作可能做了多次,因此某个手势动作对应的二轴陀螺数据序列有多组),训练生成的支持向量机模型中的向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE的结果有多组,一组结果对应于一种类型的手势动作。
识别阶段
在完成手势动作识别模型的训练以后,就可以利用该模型对用户的手势动作进行识别。
如图4所示,在前述的应用场景中,当一个教师利用包含陀螺传感器的输入笔做出一个新的手势动作后,参照前述的步骤1)-步骤4)可计算出该手势动作所对应的二轴陀螺数据序列的特征向量
Figure BSA00000377641800111
然后将该特征向量代入公式(2)计算该新的手势动作为某一类型的手势动作的可能,即公式(2)计算结果所代表的分值:
Σ i = 0 SIZE α i × e - γ × Σ j = 0 2 × DIM ( ev j - sv ij ) 2 + β - - - ( 2 )
其中,evj为新的手势动作的特征向量
Figure BSA00000377641800113
的分量。
由于之前提到训练生成的手势动作识别模型中的向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE的结果有多组,因此上述公式的计算结果有多个,计算结果最大的参数所对应的手势动作类型就是所要识别的手势动作类型。
在上述实施例中,将教师讲课时的输入笔作为手势动作识别的装置,但在其他实施例中,显然也可以是其他的物体,比如电视切换台时的遥控器。
本发明的优点在于:
(1)实时性高,适用范围广:本发明所述的方法在手势动作的输入过程中同步实现了识别,支持向量机模型可以离线一次训练,以后实时预测,并且适合在各种手势动作输入的场合应用。例如,借助于手写数字等符号的输入,轻松的挥动就可以实现电视节目频道的切换以及音量调节等操作,对于爱好在黑暗场景欣赏电视节目的观众,安装有陀螺传感器的遥控器是一个很好的选择。
(2)实现简单:一方面,本发明所述的方法基于陀螺数据角度特征值实现手势动作的识别,简单处理直接从陀螺传感器上提取的二轴陀螺数据序列,即可得到所需的特征向量,特征向量的获取方式简单;另一方面,本发明所述的方法充分利用支持向量机模型训练阶段计算复杂,预测阶段计算简单的优势,识别的结果可以简单的表达为手势动作集合中的最大值,而公式中的所有参数可以通过多种途径以离线训练的方式获得。
(3)鲁棒性强,手势动作识别可靠:本发明所述的方法减低手势动作识别过程中环境的依赖性,提取的特征向量不受用户动作幅度和空间跨度的影响,辅助以训练好的支持向量机模型,最大程度上保证了系统的鲁棒性,不会出现遗漏和误判。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (16)

1.一种手势动作识别模型的训练方法,包括:
步骤1)、通过陀螺传感器获取用于手势动作识别训练的样本数据,所述样本数据包括用于记录某一手势动作的二轴陀螺数据序列;
步骤2)、对步骤1)所得到的样本数据中的各个二轴陀螺数据序列做数据长度归一化,生成标准长度的二轴陀螺数据序列;
步骤3)、从步骤2)所得到的二轴陀螺数据序列中提取特征向量;所述特征向量反映了所述陀螺传感器的运动角度信息;
步骤4)、利用所述的特征向量训练手势动作识别模型。
2.根据权利要求1所述的手势动作识别模型的训练方法,其特征在于,所述特征向量用表示,该向量维度是2DIM,其计算公式如下:
e v i x = sin ( x i - μ x ( x i - μ x ) 2 + ( y i - μ y ) 2 ) , e v i y = sin ( y i - μ y ( x i - μ x ) 2 + ( y i - μ y ) 2 )
其中,(xi,yi)是从步骤2)得到的二轴陀螺数据序列中所包含的陀螺传感器的水平和垂直方向的瞬时角速度,(μx,μy)是处于静止状态时统计出来的均值;特征向量
Figure FSB00000809625200014
3.根据权利要求1或2所述的手势动作识别模型的训练方法,其特征在于,在所述的步骤1)中还包括:
对所获取的样本数据进行预处理,以去除所述样本数据中影响手势动作识别的冗余数据。
4.根据权利要求3所述的手势动作识别模型的训练方法,其特征在于,所述的预处理包括空闲数据剔除,以去除所述二轴陀螺数据序列中用于表示手势动作处于静止状态的数据。
5.根据权利要求3所述的手势动作识别模型的训练方法,其特征在于,所述的预处理包括异常数据剔除,以去除所述二轴陀螺数据序列中由于外部因素而造成的非正常数据。
6.根据权利要求3所述的手势动作识别模型的训练方法,其特征在于,所述的预处理包括数据平滑滤波。
7.根据权利要求1或2所述的手势动作识别模型的训练方法,其特征在于,在所述的步骤1)中,通过陀螺传感器获取用于手势动作识别训练的样本数据包括:
步骤1-1)、通过陀螺传感器获取一段时间内用于手势动作识别训练的样本数据;
步骤1-2)、对步骤1-1)所获取的样本数据进行分割,以区分不同手势动作所对应的二轴陀螺数据序列。
8.根据权利要求1或2所述的手势动作识别模型的训练方法,其特征在于,在所述的步骤2)中,采用插值法或亚采样法对样本数据中的各个二轴陀螺数据序列做数据长度归一化。
9.根据权利要求2所述的手势动作识别模型的训练方法,其特征在于,所述手势动作识别模型为支持向量机模型,利用所述的特征向量训练手势动作识别模型能够得到多组与所述支持向量机模型所对应的向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE,一组所述向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE对应一种类型的手势动作。
10.一种手势动作识别方法,包括:
步骤1)、通过陀螺传感器获取待识别的手势动作,所述待识别的手势动作用二轴陀螺数据序列表示;
步骤2)、对步骤1)所得到的用于表示待识别的手势动作的二轴陀螺数据序列做数据长度归一化,将其转化为标准长度;
步骤3)、从步骤2)所得到的二轴陀螺数据序列中提取特征向量;所述特征向量反映了所述陀螺传感器的运动角度信息;
步骤4)、将前一步骤所提取的特征向量输入到权利要求1-8之一所生成的手势动作识别模型中,根据手势动作识别模型的计算结果得到待识别的手势动作的类型。
11.根据权利要求10所述的手势动作识别方法,其特征在于,在所述的步骤1)中还包括:
对待识别的手势动作的二轴陀螺数据序列进行预处理,以去除所述二轴陀螺数据序列中影响手势动作识别的冗余数据。
12.根据权利要求11所述的手势动作识别方法,其特征在于,所述的预处理包括空闲数据剔除,以去除所述二轴陀螺数据序列中用于表示手势动作处于静止状态的数据。
13.根据权利要求11所述的手势动作识别方法,其特征在于,所述的预处理包括异常数据剔除,以去除所述二轴陀螺数据序列中由于外部因素而造成的非正常数据。
14.根据权利要求11所述的手势动作识别方法,其特征在于,其特征在于,所述的预处理包括数据平滑滤波。
15.根据权利要求10所述的手势动作识别方法,其特征在于,在所述步骤3)中,所述特征向量用
Figure FSB00000809625200031
表示,该向量维度是2DIM,其计算公式如下:
e v i x = sin ( x i - μ x ( x i - μ x ) 2 + ( y i - μ y ) 2 ) , e v i y = sin ( y i - μ y ( x i - μ x ) 2 + ( y i - μ y ) 2 )
其中,(xi,yi)是从步骤2)得到的二轴陀螺数据序列中所包含的陀螺传感器的水平和垂直方向的瞬时角速度,(μx,μy)是处于静止状态时统计出来的均值;特征向量
Figure FSB00000809625200034
16.根据权利要求15所述的手势动作识别方法,其特征在于,所述手势动作识别模型为支持向量机模型,所述步骤4)包括:
步骤4-1)、由权利要求1-9之一所生成的手势动作识别模型得到多组向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE;选择其中一组结果执行步骤4-2);
步骤4-2)、将由步骤3)所得到的待识别的手势动作的特征向量代入下列公式,得到一计算结果:
Σ i = 0 SIZE α i × e - γ × Σ j = 0 2 × DIM ( e v j - s v ij ) 2 + β
其中,evj为特征向量
Figure FSB00000809625200037
的某一分量;
步骤4-3)、判断所述多组向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE是否都已经执行步骤4-2),若都已经执行,则执行下一步,否则取未执行的一组向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE,然后重新执行步骤4-2);
步骤4-4)、将步骤4-2)所得到的计算结果中值最大的计算结果所对应的某一组向量空间svij、拉格朗日乘子αi和γ、偏斜量参数β以及参数长度SIZE所代表的手势动作类型作为待识别的手势动作的类型。
CN 201010577408 2010-12-02 2010-12-02 手势动作识别模型的训练方法和手势动作识别方法 Active CN102024151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010577408 CN102024151B (zh) 2010-12-02 2010-12-02 手势动作识别模型的训练方法和手势动作识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010577408 CN102024151B (zh) 2010-12-02 2010-12-02 手势动作识别模型的训练方法和手势动作识别方法

Publications (2)

Publication Number Publication Date
CN102024151A CN102024151A (zh) 2011-04-20
CN102024151B true CN102024151B (zh) 2012-12-26

Family

ID=43865431

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010577408 Active CN102024151B (zh) 2010-12-02 2010-12-02 手势动作识别模型的训练方法和手势动作识别方法

Country Status (1)

Country Link
CN (1) CN102024151B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103517118B (zh) * 2012-12-28 2016-08-03 Tcl集团股份有限公司 一种遥控器的动作识别方法及系统
CN103839047B (zh) * 2013-12-30 2017-12-29 华为技术有限公司 一种人体运动轨迹的识别方法及装置
CN104601795B (zh) * 2014-11-03 2017-03-29 中国科学技术大学苏州研究院 一种智能手机用户左右手识别方法
CN104517100B (zh) * 2014-12-15 2017-09-29 中国科学院深圳先进技术研究院 手势预判方法和系统
CN105354532A (zh) * 2015-09-25 2016-02-24 天津大学 一种基于手部运动帧数据的手势识别方法
CN106203380B (zh) * 2016-07-20 2019-11-29 中国科学院计算技术研究所 超声波手势识别方法及系统
CN108089693A (zh) * 2016-11-22 2018-05-29 比亚迪股份有限公司 手势识别方法及装置、智能穿戴终端及服务器
CN106597908A (zh) * 2017-01-07 2017-04-26 武克易 一种学习桌体感控制方法
CN106873779B (zh) * 2017-02-24 2020-05-08 苏州佳世达电通有限公司 一种手势识别装置及手势识别方法
CN107918755A (zh) * 2017-03-29 2018-04-17 广州思涵信息科技有限公司 一种基于人脸识别技术的实时专注度分析方法及系统
CN109101860B (zh) * 2017-06-21 2022-05-13 富泰华工业(深圳)有限公司 电子设备及其手势识别方法
CN107688389B (zh) * 2017-08-25 2021-08-13 北京金恒博远科技股份有限公司 Vr抓取动作的优化方法及装置
CN108776794B (zh) * 2018-06-20 2023-03-28 华南师范大学 基于大数据与人工智能的教学效果画像方法和机器人系统
CN110163086B (zh) * 2019-04-09 2021-07-09 有品国际科技(深圳)有限责任公司 基于神经网络的健身动作识别方法、装置、设备及介质
CN110719135A (zh) * 2019-10-17 2020-01-21 Ut斯达康通讯有限公司 时间校准方法、系统及电子装置
CN113326801A (zh) * 2021-06-22 2021-08-31 哈尔滨工程大学 一种基于信道状态信息的人体移动方向识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
曹青等.基于角速率陀螺仪的无线鼠标的设计与实现.《微计算机信息》.2008,第24卷(第12-2期),230-232. *
王文熙.绝对角度传感器用于机器人控制.《制造业自动化》.1987,(第2期),61-65. *

Also Published As

Publication number Publication date
CN102024151A (zh) 2011-04-20

Similar Documents

Publication Publication Date Title
CN102024151B (zh) 手势动作识别模型的训练方法和手势动作识别方法
Wang et al. Hear sign language: A real-time end-to-end sign language recognition system
Liu et al. M-gesture: Person-independent real-time in-air gesture recognition using commodity millimeter wave radar
Li et al. Deep Fisher discriminant learning for mobile hand gesture recognition
Kumar et al. Sign language recognition
Yin et al. Toward natural interaction in the real world: Real-time gesture recognition
CN104516499A (zh) 利用用户接口的事件的设备和方法
Mehrotra et al. Indian sign language recognition using kinect sensor
Aggarwal et al. Online handwriting recognition using depth sensors
CN107292295B (zh) 手势分割方法及装置
Adhikari et al. A Novel Machine Learning-Based Hand Gesture Recognition Using HCI on IoT Assisted Cloud Platform.
Sarma et al. Real-Time Indian Sign Language Recognition System using YOLOv3 Model
Hu et al. Temporal interframe pattern analysis for static and dynamic hand gesture recognition
Ren et al. Intelligent contactless gesture recognition using WLAN physical layer information
Sun A survey on dynamic sign language recognition
Półrola et al. Real-time hand pose estimation using classifiers
Parthasarathy et al. Novel video benchmark dataset generation and real-time recognition of symbolic hand gestures in indian dance applying deep learning techniques
Jiang et al. A classroom concentration model based on computer vision
Dhamanskar et al. Human computer interaction using hand gestures and voice
Ji et al. Design of human machine interactive system based on hand gesture recognition
Chen et al. ViWatch: harness vibrations for finger interactions with commodity smartwatches
Chen et al. A Human Activity Recognition Approach Based on Skeleton Extraction and Image Reconstruction
Li et al. Kinect-based gesture recognition and its application in moocs recording system
Bandy et al. Demonstrating HighFiveLive: A mobile application for recognizing symbolic gestures
Zhang et al. A Non-parametric RDP Algorithm Based on Leap Motion

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230109

Address after: Room 1211, Floor 12, Building A, Binhe Business Center, Tianqiao District, Jinan, Shandong Province 250033

Patentee after: Zhongke Music Intelligent Technology (Jinan) Co.,Ltd.

Address before: 100190 No. 6 South Road, Zhongguancun Academy of Sciences, Beijing, Haidian District

Patentee before: Institute of Computing Technology, Chinese Academy of Sciences

TR01 Transfer of patent right