CN103679213A - 一种3d手势识别方法 - Google Patents

一种3d手势识别方法 Download PDF

Info

Publication number
CN103679213A
CN103679213A CN201310684231.4A CN201310684231A CN103679213A CN 103679213 A CN103679213 A CN 103679213A CN 201310684231 A CN201310684231 A CN 201310684231A CN 103679213 A CN103679213 A CN 103679213A
Authority
CN
China
Prior art keywords
stroke
gesture
similarity
feature
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310684231.4A
Other languages
English (en)
Other versions
CN103679213B (zh
Inventor
程洪
罗军
杨路
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201310684231.4A priority Critical patent/CN103679213B/zh
Publication of CN103679213A publication Critical patent/CN103679213A/zh
Application granted granted Critical
Publication of CN103679213B publication Critical patent/CN103679213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及计算机视觉和人机交互领域,具体涉及一种3D手势识别方法,包括以下步骤:通过第一层分类器,将手势的运动轨迹进行分段,得到一个个组成手势的笔画轨迹;通过标准化过程将笔画轨迹转化得到对应的标准笔画序号;提取手势多个动作的笔画序号与笔画长度组合成手势的特征序列;特征序列通过第二层分类器与模板计算相似度,得到手势所属的类。本方法在各层中,把变化的特征进行识别与标准化,用多层识别,多层标准化,最终就得到了识别结果,能准确计算出笔画方向特征的相似度、和运动特征序列的相似度。算法简单,复杂度低,正确率高。

Description

一种3D手势识别方法
技术领域
本发明涉及计算机视觉和人机交互领域,具体涉及一种3D手势识别方法。
背景技术
人与计算机的交互越来越成为人们日常生活中的一个重要组成部分,逐渐成为计算机领域的一个重要研究课题。在手势识别中,最基础、关键的是对手势的识别。在得到动态手势的运动轨迹之后,计算机便可对其进行特征的提取,根据特征信息进行识别。本算法提出了新的基于笔画特征与DTLS的多层分类算法,首先,把运动轨迹分为多个笔画,对笔画特征进行标准化,再用DTLS相似度进行匹配与识别,得到手势所属的类。
中国专利申请号为201210242290.1的发明专利申请公开了一种基于深度信息的手势识别方法,其主要技术方案为:通过深度信息进行背景建模,得到人体信息,采用肤色检测得到人手位置;跟踪人手得到手势轨迹信息。采用隐马尔科夫模型,对手势进行识别。该方法采用隐马尔科夫模型进行识别,需要大量的训练数据作为样本进行训练,同时隐马尔科夫模型的算法复杂度为O(n2T),计算比较复杂。
发明内容
本发明的目的在于提供一种3D手势识别方法,解决现有技术中计算机在识别人手时计算太过复杂,需要的计算机配置要求过高,不利于广泛应用的问题。
为解决上述的技术问题,本发明采用以下技术方案:
一种3D手势识别方法,包括以下步骤:
步骤一,通过第一层分类器,将手势的运动轨迹进行分段,得到一个个组成手势的笔画轨迹;
步骤二,通过标准化过程将笔画轨迹转化得到对应的标准笔画序号;
步骤三,提取手势多个动作的笔画序号与笔画长度组合成手势的特征序列;
步骤四,特征序列通过第二层分类器与模板计算相似度,得到手势所属的类。
更进一步的技术方案是,所述步骤一中,将手势的运动轨迹进行分段,是指在手势轨迹的方向改变超过一定阈值、速度改变超过一定阈值和方向变化率改变超过一定阈值时的位置提取识别的笔画。
更进一步的技术方案是,所述步骤二中,笔画轨迹转化得到对应的标准笔画序号是将所有的手势笔画都转化为16种标准笔画,并将笔画特征分为直线笔画特征和曲线笔画特征,通过36维直方图分为36份,每份10度,用36维直方图对所有运动方向进行统计,如果所有点的运动方向集中在当前点或起始点的运动方向上,并占60%以上,则识别为直线笔画,否则识别为曲线笔画,通过计算笔画角度分辨出直线笔画和曲线笔画分别属于16种标准笔画中的哪一种。
更进一步的技术方案是,所述步骤三中,特征序列具体是通过手势笔画分段和笔画识别,将手势生成一串笔画序列,序列中每个元素包含2个数,一个是笔画类型,另一个是笔画长度。
更进一步的技术方案是,所述步骤四中,特征序列和模板的相似度计算从二维扩展到三维,新增一维表示时间或长度;同时将长短不同的笔画进行位置对齐,获得最大的相似度。
更进一步的技术方案是,所述第二层分类器是采用方向到位置的DTLS算法进行相似度计算,设定两个同心圆,将8个直线笔画特征转换到大圆周上,把8个曲线笔画特征转化到小圆周上,实现从方向信息到位置信息的映射,把方向特征信息转换为位置特征信息,将所述位置特征信息与模板进行计算比较得到手势所属的类。
与现有技术相比,本发明的有益效果是:本方法在各层中,把变化的特征进行识别与标准化,用多层识别,多层标准化,最终就得到了识别结果,能准确计算出笔画方向特征的相似度、和运动特征序列的相似度。算法简单,复杂度低,正确率高。
附图说明
图1为本发明一种3D手势识别方法一个实施例的8种标准直线笔画示意图。
图2为本发明一种3D手势识别方法一个实施例的8种标准曲线笔画示意图。
图3为本发明一种3D手势识别方法一个实施例的手势笔画特征示意图。
图4为本发明一种3D手势识别方法一个实施例的方向到位置的转化的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明一种3D手势识别方法的一个实施例:一种3D手势识别方法,包括以下步骤:
步骤一,通过第一层分类器,将手势的运动轨迹进行分段,得到一个个组成手势的笔画轨迹;
步骤二,通过标准化过程将笔画轨迹转化得到对应的标准笔画序号;
步骤三,提取手势多个动作的笔画序号与笔画长度组合成手势的特征序列;
步骤四,特征序列通过第二层分类器与模板计算相似度,得到手势所属的类。
这里值得指出的是,上述第一层分类器和第二层分类器,是模式识别的一种说法,其输入为测试样本,输出为样本的所属类,是一个广泛的概念。
图3示出了本发明一种3D手势识别方法的一个优选实施例,所述步骤一中,将手势的运动轨迹进行分段,是指在手势轨迹的方向改变超过一定阈值、速度改变超过一定阈值和方向变化率改变超过一定阈值时的位置提取识别的笔画。
所述手势轨迹的方向改变、速度改变和方向变化率的三个方向向量可以通过以下公式算出:
a → = ( x i - x i - 1 , y i - y i - 1 )
b → = ( x i - 1 - x i - 2 , y i - 1 - y i - 2 )
c → = ( x i - 2 - x i - 3 , y i - 2 - y i - 3 )
s → = ( x start + 1 - x start , y start + 1 - y start )
式中,
Figure BDA0000437692230000036
分别是轨迹最近三处的运动方向向量,xi,yi代表当前点的x,y值,xi-1,yi-1代表前1点的x,y值。
Figure BDA0000437692230000037
是此笔画开始点的运动方向向量,xstart,ystart代表此笔画的起始点。
对于手势轨迹上的每个点,采用以下公式计算:
a · → b → | a → | · | b → | = a 1 b 1 + a 2 b 2 a 1 2 + a 2 2 · b 1 2 + b 2 2 > T 1
| | | a → | | - | | b → | | | = | a 1 2 + a 2 2 - b 1 2 + b 2 2 | > T 2
| a → · b → | a → | · | b → | - b → · c → | b → | · | c → | | = | a 1 b 1 + a 2 b 2 a 1 2 + a 2 2 · b 1 2 + b 2 2 - b 1 c 1 + b 2 c 2 b 1 2 + b 2 2 · c 1 2 + c 2 2 | > T 3
| s → · a → | s → | · | a → | | = | s 1 a 1 + s 2 a 2 s 1 2 + s 2 2 · a 1 2 + a 2 5 | > T 4
其中,T1,T2,T3,T4分别代表4个阈值。当4个式子中有一个成立时,此处就是笔画的分割点。
根据本发明一种3D手势识别方法的另一个优选实施例,所述步骤二中,笔画轨迹转化得到对应的标准笔画序号是将所有的手势笔画都转化为16种标准笔画,并将笔画特征分为直线笔画特征和曲线笔画特征,通过36维直方图分为36份,每份10度,用36维直方图对所有运动方向进行统计,如果所有点的运动方向集中在当前点或起始点的运动方向上,并占60%以上,则识别为直线笔画,否则识别为曲线笔画,通过计算笔画角度分辨出直线笔画和曲线笔画分别属于16种标准笔画中的哪一种。
根据本发明一种3D手势识别方法的另一个优选实施例,所述步骤三中,特征序列是通过手势笔画分段和笔画识别,将手势生成一串笔画序列,序列中每个元素包含2个数,一个是笔画类型,另一个是笔画长度。如图1所示,对笔画进行编号,用于生成运动特征序列,图2显示了手势生成的最终运动特征序列。
这样,就把复杂的手势轨迹点变成了一个低维的特征向量,把任意变化不定的运动轨迹变成了归一化的标准笔画序列。通过笔画识别,复杂的概念简单化了,变化的特征也标准化了。
根据本发明一种3D手势识别方法的另一个优选实施例,所述特征序列和模板的相似度计算从二维扩展到三维,新增一维表示时间或长度;同时将长短不同的笔画进行位置对齐,获得最大的相似度。
图4示出了本发明一种3D手势识别方法的另一个优选实施例,所述步骤四中,第二层分类器是采用方向到位置的DTLS算法进行相似度计算,设定两个同心圆,将8个直线笔画特征转换到大圆周上,把8个曲线笔画特征转化到小圆周上,实现从方向信息到位置信息的映射,把方向特征信息转换为位置特征信息,将所述位置特征信息与模板进行计算比较得到手势所属的类。
在计算相似度时,如果仅用方向信息,由于方向是0°到360°,在其端点0°和360°处,0°和360°在方向上是相同的,但角度差距却是最大的。
如附图4所示,采用两个同心圆,把8个直线笔画特征转换到大圆周上,把8个曲线笔画特征转化到小圆周上,从而实现从方向信息到位置信息的映射,则两个笔画的相似度计算采用下面的公式:
S = α · e ( x 1 - x 2 ) · ( x 1 - x 2 ) + ( y 1 - y 2 ) · ( y 1 - y 2 ) 2 · δ
δ = β · ( x right - x topright ) 2 + ( y right - y topright ) 2
式中,δ是计算DTLS位置映射中,β倍的圆上最近两点的距离,δ是一个固定的参数;S用于计算相似度,α是一个比例系数。
值得注意的是,由于不同人做出的手势不一,可能某个笔画很长,某个笔画很短,因此,在识别时,需要把长短不同的笔画进行位置对齐,以获得最大相似度
在进行位置对齐后,两个运动特征序列的相似度计算公式如下:
S A = Σ i ∈ [ 1,100 ] S i + Σ j ∈ [ 1 , N ] M j · 100 N
M = 1 , ( C 1,1 - C 1,2 = C 2 , 1 - C 2,2 ) 0 , ( C 1,1 - C 1,2 ≠ C 2,1 - C 2,2 )
式中,Si代表总长度为100的第i个点的笔画特征相似度,Mj代表第j个笔画转折点处的转折点相似度,N是笔画转折点的个数,C1,1,C1,2分别代表第1个序列中前一个笔画和后一笔画的类型,C2,1,C2,2分别代表第2个序列中前一个笔画和后一个笔画的类型。式中,SA就是两个序列的总体相似度。
本发明的一个优选方式:可以识别16种手势,每种手势采集30个训练样本,采用样本到类的分类器:
C = arg max n ∈ { 1,2 , . . . , N c } { Σ i = 1 s n ω n , i S A ( i ) }
式中,Nc代表类的个数,Sn代表当前类中训练样本个数,ω代表当前训练样本占整个类的权重,满足
Figure BDA0000437692230000054
SA(i)是第i个训练样本与当前测试样本的DTLS相似度。

Claims (6)

1.一种3D手势识别方法,其特征在于包括以下步骤:
步骤一,通过第一层分类器,将手势的运动轨迹进行分段,得到一个个组成手势的笔画轨迹;
步骤二,通过标准化过程将笔画轨迹转化得到对应的标准笔画序号;
步骤三,提取手势多个动作的笔画序号与笔画长度组合成手势的特征序列;
步骤四,特征序列通过第二层分类器与模板计算相似度,得到手势所属的类。
2.根据权利要求1所述的一种3D手势识别方法,其特征在于:所述步骤一中,将手势的运动轨迹进行分段,是指在手势轨迹的方向改变超过一定阈值、速度改变超过一定阈值和方向变化率改变超过一定阈值时的位置提取识别的笔画。
3.据权利要求1所述的一种3D手势识别方法,其特征在于:所述步骤二中,笔画轨迹转化得到对应的标准笔画序号是将所有的手势笔画都转化为16种标准笔画,并将笔画特征分为直线笔画特征和曲线笔画特征,通过36维直方图分为36份,每份10度,用36维直方图对所有运动方向进行统计,如果所有点的运动方向集中在当前点或起始点的运动方向上,并占60%以上,则识别为直线笔画,否则识别为曲线笔画,通过计算笔画角度分辨出直线笔画和曲线笔画分别属于16种标准笔画中的哪一种。
4.根据权利要求1所述的一种新型的3D手势识别算法,其特征在于:所述步骤三中,特征序列具体是通过手势笔画分段和笔画识别,将手势生成一串笔画序列,序列中每个元素包含2个数,一个是笔画类型,另一个是笔画长度。
5.根据权利要求1所述的一种新型的3D手势识别算法,其特征在于:所述步骤四中,特征序列和模板的相似度计算从二维扩展到三维,新增一维表示时间或长度;同时将长短不同的笔画进行位置对齐,获得最大的相似度。
6.根据权利要求1所述的一种新型的3D手势识别算法,其特征在于:所述第二层分类器是采用方向到位置的DTLS算法进行相似度计算,设定两个同心圆,将8个直线笔画特征转换到大圆周上,把8个曲线笔画特征转化到小圆周上,实现从方向信息到位置信息的映射,把方向特征信息转换为位置特征信息,将所述位置特征信息与模板进行计算比较得到手势所属的类。
CN201310684231.4A 2013-12-13 2013-12-13 一种3d手势识别方法 Active CN103679213B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310684231.4A CN103679213B (zh) 2013-12-13 2013-12-13 一种3d手势识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310684231.4A CN103679213B (zh) 2013-12-13 2013-12-13 一种3d手势识别方法

Publications (2)

Publication Number Publication Date
CN103679213A true CN103679213A (zh) 2014-03-26
CN103679213B CN103679213B (zh) 2017-02-08

Family

ID=50316701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310684231.4A Active CN103679213B (zh) 2013-12-13 2013-12-13 一种3d手势识别方法

Country Status (1)

Country Link
CN (1) CN103679213B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104360742A (zh) * 2014-11-18 2015-02-18 电子科技大学 一种3d连续手势识别方法
CN104467866A (zh) * 2014-10-14 2015-03-25 福建师范大学 一种基于角度的轨迹数据压缩方法及装置
CN105279526A (zh) * 2014-06-13 2016-01-27 佳能株式会社 分割轨迹的方法和装置
CN107633227A (zh) * 2017-09-15 2018-01-26 华中科技大学 一种基于csi的细粒度手势识别方法和系统
CN108536314A (zh) * 2017-03-06 2018-09-14 华为技术有限公司 用户身份识别方法及装置
CN110110674A (zh) * 2019-05-13 2019-08-09 湘潭大学 一种基于加速度微机电系统和基础笔画的手势识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120148097A1 (en) * 2010-12-14 2012-06-14 Electronics And Telecommunications Research Institute 3d motion recognition method and apparatus
CN103257711A (zh) * 2013-05-24 2013-08-21 河南科技大学 空间手势输入方法
CN103294996A (zh) * 2013-05-09 2013-09-11 电子科技大学 一种3d手势识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120148097A1 (en) * 2010-12-14 2012-06-14 Electronics And Telecommunications Research Institute 3d motion recognition method and apparatus
CN103294996A (zh) * 2013-05-09 2013-09-11 电子科技大学 一种3d手势识别方法
CN103257711A (zh) * 2013-05-24 2013-08-21 河南科技大学 空间手势输入方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赖英超: ""基于三维加速度传感器的空间手写识别预处理技术研究"", 《中国优秀硕士学位论文全文数据库•信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279526A (zh) * 2014-06-13 2016-01-27 佳能株式会社 分割轨迹的方法和装置
CN105279526B (zh) * 2014-06-13 2019-11-29 佳能株式会社 分割轨迹的方法和装置
CN104467866A (zh) * 2014-10-14 2015-03-25 福建师范大学 一种基于角度的轨迹数据压缩方法及装置
CN104360742A (zh) * 2014-11-18 2015-02-18 电子科技大学 一种3d连续手势识别方法
CN108536314A (zh) * 2017-03-06 2018-09-14 华为技术有限公司 用户身份识别方法及装置
CN107633227A (zh) * 2017-09-15 2018-01-26 华中科技大学 一种基于csi的细粒度手势识别方法和系统
CN107633227B (zh) * 2017-09-15 2020-04-28 华中科技大学 一种基于csi的细粒度手势识别方法和系统
CN110110674A (zh) * 2019-05-13 2019-08-09 湘潭大学 一种基于加速度微机电系统和基础笔画的手势识别方法
CN110110674B (zh) * 2019-05-13 2022-12-13 湘潭大学 一种基于加速度微机电系统和基础笔画的手势识别方法

Also Published As

Publication number Publication date
CN103679213B (zh) 2017-02-08

Similar Documents

Publication Publication Date Title
CN103679213A (zh) 一种3d手势识别方法
CN103246891B (zh) 一种基于Kinect的中国手语识别方法
CN103236064B (zh) 一种基于法向量的点云自动配准方法
CN106354252B (zh) 一种基于stdw的连续字符手势轨迹识别方法
CN105893968B (zh) 基于深度学习的文本无关的端到端的笔迹识别方法
CN104063059B (zh) 一种基于手指分割的实时手势识别方法
CN106022228B (zh) 一种基于网格纵横局部二值模式的三维人脸识别方法
CN105787471A (zh) 一种应用于助老助残移动服务机器人控制的手势识别方法
CN105956560A (zh) 一种基于池化多尺度深度卷积特征的车型识别方法
CN103390168A (zh) 基于Kinect深度信息的智能轮椅动态手势识别方法
CN104899600A (zh) 一种基于深度图的手部特征点检测方法
CN104123545A (zh) 一种实时表情特征提取及表情识别方法
CN103150747A (zh) 一种基于拓扑特征的点云配准算法
CN103400136B (zh) 基于弹性匹配的目标识别方法
CN105005769A (zh) 一种基于深度信息的手语识别方法
CN104899601A (zh) 一种手写维吾尔文单词识别方法
CN104835153A (zh) 基于稀疏表示的非刚性表面对齐方法
CN103400109A (zh) 一种手绘草图离线识别与整形方法
Aouadi et al. Word extraction and recognition in arabic. handwritten Text
CN106503626A (zh) 基于深度图像与手指轮廓匹配的并指手势识别方法
CN106446773A (zh) 一种全自动、鲁棒的三维人脸检测方法
CN104268598A (zh) 一种基于二维扫描激光的人腿检测方法
CN102693025A (zh) 一种多点触摸交互系统的触摸手识别方法
CN101882150A (zh) 一种基于核密度估计的三维模型比较和检索方法
CN103927555A (zh) 基于Kinect传感器的静态手语字母识别系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant