CN109492558A - 一种基于Leap Motion的动态手势识别方法 - Google Patents
一种基于Leap Motion的动态手势识别方法 Download PDFInfo
- Publication number
- CN109492558A CN109492558A CN201811264834.8A CN201811264834A CN109492558A CN 109492558 A CN109492558 A CN 109492558A CN 201811264834 A CN201811264834 A CN 201811264834A CN 109492558 A CN109492558 A CN 109492558A
- Authority
- CN
- China
- Prior art keywords
- gesture
- dynamic
- key point
- moment
- leap motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于LeapMotion的动态手势识别方法,包括如下步骤:用Leap Motion传感器采集动态手势的手部关键点的三维位置信息;通过计算某一时刻手部关键点的速率,结合阈值法判断手势的起始点和结束点,并将位于起始点和结束点之间的手势数据流作为动态手势的原始数据;通过特征预处理和SVD奇异值分解,实现手势数据中冗余信息的去除,得到手势特征矩阵;利用Kmeans对手势特征矩阵进行重编码,并为每一种手势训练一个HMM模型,实现手势分类。本发明基于Leap Motion,利用阈值法实现准确、高效的手势数据分割;通过SVD实现原始数据的降维,提高HMM训练的效率,实现准确、实时的手势识别。
Description
技术领域
本发明涉及人工智能及人机交互技术领域,具体涉及一种基于Leap Motion的动态手势识别方法。
背景技术
随着机器学习和计算机视觉技术的发展,在人机交互领域,与传统的键盘和鼠标相比,动态手势识别技术具有更高的舒适度和效率,得到了广泛的关注和研究。与基于数据手套的动态手势识别技术相比,基于视觉的动态手势识别技术具有交互自然、直观、方便快捷等优点,使得自然、友好的人机交互成为可能。
由于动态手势具有多变的形状,且手指间存在严重的重叠,使用单目传感器难以捕捉丰富的动态手势信息,这限制了基于单目传感器的动态手势识别技术的发展。
在动态手势识别技术中,对于采集的连续手势数据,如何采用一种准确、高效的方式界定手势的起始点和结束点,关系到手势识别系统的准确率和实时性。对于复杂的动态手势,提取的手势数据在时间维度上具有高维特性,且存在冗余数据,导致训练手势分类器需要花费较长时间。此外,动态手势是不固定时长的一串动作序列,选择的手势分类识别方法需具有很好的时间规整能力,否则会导致手势分类准确率较低。因此,发明一种能够准确界定并识别手势的实时动态手势识别方法是目前函待解决的问题。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于Leap Motion的动态手势识别方法。
本发明的目的可以通过采取如下技术方案达到:
一种基于Leap Motion的动态手势识别方法,所述的动态手势识别方法包括如下步骤:
动态手势数据采集,用Leap Motion传感器采集动态手势的手部关键点的三维位置信息;
手势分段,通过计算某一时刻手部关键点的速率,结合阈值法判断手势的起始点和结束点,并将位于起始点和结束点之间的手势数据流作为动态手势的原始数据;
手势特征处理,通过特征预处理和SVD奇异值分解,实现动态手势的原始数据中冗余信息的去除,得到手势特征矩阵;
手势识别,利用Kmeans聚类算法对手势特征矩阵进行重编码,并为每一种手势训练一个HMM模型,实现手势分类识别。
进一步地,所述的手势分段过程如下:
通过计算第i时刻手部关键点j的速率Vi j并与预设阈值Aj比较,当第i时刻手部关键点j的速率Vi j满足Vi j<Aj,1≤j≤n,即可判定该时刻为动态手势的起始点或者结束点,将位于起始点和结束点范围内的手势数据流作为动态手势的原始数据,即手势样本X,每一个手势样本X定义为:
其中表示为第j个关键点在i时刻的三维坐标值,n为动态手势的关键点个数,t为该手势样本的时间长度,手势样本X是大小为3n×t的矩阵。
进一步地,所述的第i时刻手部关键点j的速率Vi j采用如下公式计算:
其中,Δt为i时刻与(i-1)时刻的时间差。
进一步地,所述的特征预处理中将每一个手势样本X在时间维度上进行规整,得到规整后的矩阵G,具体为:
对于每一个手势样本X,计算相应时间段内手势各关键点在不同坐标轴上的最大值和最小值在i时刻第j个关键点的坐标经规整后的坐标值为采取的计算公式如下:
进一步地,所述的SVD奇异值分解实现手势数据中冗余信息的去除,具体为:
将矩阵G表示为:G=U∑VT;
对GTG进行特征值分解,得到酉矩阵V,然后对GGT进行特征值分解,得到酉矩阵U,求出矩阵∑,最后提取酉矩阵U中左侧的r列向量构成手势特征矩阵Gsvd,实现矩阵G在时间维度的压缩。
进一步地,所述的手势识别过程如下:
将手势特征矩阵Gsvd分解为多个3n维的列向量,并将所有手势样本X分解后的所有列向量进行Kmeans聚类,最后将手势特征矩阵Gsvd的每一个列向量替换为聚类后所属的类别,得到向量G';
经上述处理后得到的每一种手势所有样本的所有向量G'用于训练一个HMM模型,从而实现手势分类。
本发明相对于现有技术具有如下的优点及效果:
(1)本发明利用Leap Motion传感器高精度地采集动态手势数据,利用阈值法实现准确、高效的手势数据分割;
(2)本发明通过SVD奇异值分解实现原始手势数据的降维,显著地减少训练隐马尔科夫模型HMM的迭代计算量,提高模型的训练效率;
(3)本发明结合Kmeans聚类算法对手势特征矩阵进行重编码并训练HMM模型,实现准确、实时的手势识别。
附图说明
图1为一种基于Leap Motion的动态手势识别方法的总体流程图;
图2为一种基于Leap Motion的动态手势识别方法的手势特征处理流程图;
图3为一种基于Leap Motion的动态手势识别方法的手势识别流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如图1所示,一种基于Leap Motion的动态手势识别方法,该方法依次包括:动态手势数据采集阶段、手势分段阶段、手势特征处理阶段以及手势识别阶段。
(1)动态手势数据采集阶段:
用Leap Motion传感器采集动态手势数据,得到动态手势的26个手部关键点的三维位置信息。本发明定义10种动态手势,对应0-9共10个阿拉伯数字的书写过程。本发明采用的26个手部关键点包括:19个关节点、5个指尖点、掌心点和手腕点。
(2)手势分段阶段:
通过计算第i时刻手部关键点j的速率Vi j并与阈值Aj比较,当第i时刻手部关键点j的速率Vi j满足Vi j<Aj(1≤j≤n),即可判定该时刻为动态手势的起始点或者结束点,将位于起始点和结束点范围内的手势数据流作为动态手势的原始数据X,每一个手势样本X定义为:
其中表示为第j个关键点在i时刻的三维坐标值,n为动态手势的关键点个数,本发明取n=26,t为该手势样本的时间长度,手势样本X是大小为3n×t的矩阵。
第i时刻手部关键点j的速率Vi j采用如下公式计算:
其中,Δt为i时刻与(i-1)时刻的时间差。
(3)手势特征处理阶段:
如图2所示,手势特征处理阶段包括特征预处理和SVD奇异值分解,实现手势数据中冗余信息的去除,得到手势特征矩阵Gsvd。
其中,特征预处理将每一个手势样本X在时间维度上进行规整,得到规整后的矩阵G,具体为:
对于每一个手势样本X,计算相应时间段内手势各关键点在不同坐标轴上的最大值和最小值在i时刻第j个关键点的坐标经规整后的坐标值为采取的计算公式如下:
其中,SVD奇异值分解,实现手势数据中冗余信息的去除,具体为:
将矩阵G表示为:G=U∑VT;
对GTG进行特征值分解,得到酉矩阵V,然后对GGT进行特征值分解,得到酉矩阵U,求出矩阵∑。最后提取酉矩阵U中左侧的r列向量构成手势特征矩阵Gsvd,实现矩阵G在时间维度的压缩。
(4)手势识别阶段:
如图3所示,手势识别阶段利用Kmeans聚类算法对手势特征矩阵进行重编码,并为每一种手势训练一个HMM模型,从而实现手势分类,具体为:
将手势特征矩阵Gsvd分解为多个3n维的列向量,并将所有手势样本分解后的所有列向量进行Kmeans聚类,最后将Gsvd的每一个列向量替换为聚类后所属的类别,得到向量G';
经上述处理后得到的每一种手势所有样本的所有向量G'用于训练一个HMM模型,从而实现手势分类。
综上所述,本实施例公开了一种基于Leap Motion的动态手势识别方法,该方法利用Leap Motion高精度地采集动态手势数据,利用阈值法实现准确、高效的手势数据分割。该方法通过SVD奇异值分解实现原始手势数据的降维,显著地减少训练隐马尔科夫模型HMM的迭代计算量,提高模型的训练效率。此外,该方法结合Kmeans聚类算法对手势特征矩阵进行重编码并训练HMM模型,实现准确、实时的手势识别。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (6)
1.一种基于Leap Motion的动态手势识别方法,其特征在于,所述的动态手势识别方法包括如下步骤:
动态手势数据采集,用Leap Motion传感器采集动态手势的手部关键点的三维位置信息;
手势分段,通过计算某一时刻手部关键点的速率,结合阈值法判断手势的起始点和结束点,并将位于起始点和结束点之间的手势数据流作为动态手势的原始数据;
手势特征处理,通过特征预处理和SVD奇异值分解,实现动态手势的原始数据中冗余信息的去除,得到手势特征矩阵;
手势识别,利用Kmeans聚类算法对手势特征矩阵进行重编码,并为每一种手势训练一个HMM模型,实现手势分类识别。
2.根据权利要求1所述的一种基于Leap Motion的动态手势识别方法,其特征在于,所述的手势分段过程如下:
通过计算第i时刻手部关键点j的速率Vij并与预设阈值Aj比较,当第i时刻手部关键点j的速率Vi j满足Vi j<Aj,1≤j≤n,即可判定该时刻为动态手势的起始点或者结束点,将位于起始点和结束点范围内的手势数据流作为动态手势的原始数据,即手势样本X,每一个手势样本X定义为:
其中 表示为第j个关键点在i时刻的三维坐标值,n为动态手势的关键点个数,t为该手势样本的时间长度,手势样本X是大小为3n×t的矩阵。
3.根据权利要求2所述的一种基于Leap Motion的动态手势识别方法,其特征在于,所述的第i时刻手部关键点j的速率Vij采用如下公式计算:
其中,Δt为i时刻与(i-1)时刻的时间差。
4.根据权利要求2所述的一种基于Leap Motion的动态手势识别方法,其特征在于,所述的特征预处理中将每一个手势样本X在时间维度上进行规整,得到规整后的矩阵G,具体为:
对于每一个手势样本X,计算相应时间段内手势各关键点在不同坐标轴上的最大值和最小值1≤j≤n,在i时刻第j个关键点的坐标经规整后的坐标值为采取的计算公式如下:
5.根据权利要求4所述的一种基于Leap Motion的动态手势识别方法,其特征在于,所述的SVD奇异值分解实现手势数据中冗余信息的去除,具体为:
将矩阵G表示为:G=U∑VT;
对GTG进行特征值分解,得到酉矩阵V,然后对GGT进行特征值分解,得到酉矩阵U,求出矩阵∑,最后提取酉矩阵U中左侧的r列向量构成手势特征矩阵Gsvd,实现矩阵G在时间维度的压缩。
6.根据权利要求5所述的一种基于Leap Motion的动态手势识别方法,其特征在于,所述的手势识别过程如下:
将手势特征矩阵Gsvd分解为多个3n维的列向量,并将所有手势样本X分解后的所有列向量进行Kmeans聚类,最后将手势特征矩阵Gsvd的每一个列向量替换为聚类后所属的类别,得到向量G';
经上述处理后得到的每一种手势所有样本的所有向量G'用于训练一个HMM模型,从而实现手势分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811264834.8A CN109492558A (zh) | 2018-10-29 | 2018-10-29 | 一种基于Leap Motion的动态手势识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811264834.8A CN109492558A (zh) | 2018-10-29 | 2018-10-29 | 一种基于Leap Motion的动态手势识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109492558A true CN109492558A (zh) | 2019-03-19 |
Family
ID=65691678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811264834.8A Pending CN109492558A (zh) | 2018-10-29 | 2018-10-29 | 一种基于Leap Motion的动态手势识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109492558A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926454A (zh) * | 2021-02-26 | 2021-06-08 | 重庆长安汽车股份有限公司 | 一种动态手势识别方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598890A (zh) * | 2015-01-30 | 2015-05-06 | 南京邮电大学 | 一种基于rgb-d视频的人体行为识别方法 |
CN106598227A (zh) * | 2016-11-15 | 2017-04-26 | 电子科技大学 | 基于Leap Motion和Kinect的手势识别方法 |
CN107024989A (zh) * | 2017-03-24 | 2017-08-08 | 中北大学 | 一种基于Leap Motion手势识别的沙画制作方法 |
CN107909003A (zh) * | 2017-10-16 | 2018-04-13 | 华南理工大学 | 一种针对大词汇量的手势识别方法 |
CN107909042A (zh) * | 2017-11-21 | 2018-04-13 | 华南理工大学 | 一种连续手势切分识别方法 |
CN108182728A (zh) * | 2018-01-19 | 2018-06-19 | 武汉理工大学 | 一种基于Leap Motion的在线体感三维建模方法及系统 |
-
2018
- 2018-10-29 CN CN201811264834.8A patent/CN109492558A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598890A (zh) * | 2015-01-30 | 2015-05-06 | 南京邮电大学 | 一种基于rgb-d视频的人体行为识别方法 |
CN106598227A (zh) * | 2016-11-15 | 2017-04-26 | 电子科技大学 | 基于Leap Motion和Kinect的手势识别方法 |
CN107024989A (zh) * | 2017-03-24 | 2017-08-08 | 中北大学 | 一种基于Leap Motion手势识别的沙画制作方法 |
CN107909003A (zh) * | 2017-10-16 | 2018-04-13 | 华南理工大学 | 一种针对大词汇量的手势识别方法 |
CN107909042A (zh) * | 2017-11-21 | 2018-04-13 | 华南理工大学 | 一种连续手势切分识别方法 |
CN108182728A (zh) * | 2018-01-19 | 2018-06-19 | 武汉理工大学 | 一种基于Leap Motion的在线体感三维建模方法及系统 |
Non-Patent Citations (2)
Title |
---|
BINGYUAN XU等: "Static Hand Gesture Recognition Based on RGB-D Image and Arm Removal", 《FOURTEENTH INTERNATIONAL SYMPOSIUM ON NEURAL NETWORKS》 * |
蒋海军等: "基于奇异值分解和隐Markov模型的动态手势识别", 《信息技术与网络安全》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926454A (zh) * | 2021-02-26 | 2021-06-08 | 重庆长安汽车股份有限公司 | 一种动态手势识别方法 |
CN112926454B (zh) * | 2021-02-26 | 2023-01-06 | 重庆长安汽车股份有限公司 | 一种动态手势识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106682598B (zh) | 一种基于级联回归的多姿态的人脸特征点检测方法 | |
Yang et al. | Robust sign language recognition by combining manual and non-manual features based on conditional random field and support vector machine | |
Parui et al. | Online handwritten Bangla character recognition using HMM | |
US9448651B2 (en) | Intelligent touchscreen keyboard with finger differentiation | |
CN103226388B (zh) | 一种基于Kinect的手写方法 | |
CN106845384B (zh) | 一种基于递归模型的手势识别方法 | |
Kumar et al. | 3D text segmentation and recognition using leap motion | |
Wang et al. | Sparse observation (so) alignment for sign language recognition | |
Roy et al. | A CNN based framework for unistroke numeral recognition in air-writing | |
Kumar et al. | A lexicon-free approach for 3D handwriting recognition using classifier combination | |
CN103577843A (zh) | 一种空中手写字符串识别方法 | |
CN109993073A (zh) | 一种基于Leap Motion的复杂动态手势识别方法 | |
Stern et al. | Most discriminating segment–Longest common subsequence (MDSLCS) algorithm for dynamic hand gesture classification | |
CN105005769A (zh) | 一种基于深度信息的手语识别方法 | |
Wu et al. | Vision-based fingertip tracking utilizing curvature points clustering and hash model representation | |
CN107909042B (zh) | 一种连续手势切分识别方法 | |
CN102930270A (zh) | 基于肤色检测与背景消除的手部识别方法及系统 | |
Bastas et al. | Air-writing recognition using deep convolutional and recurrent neural network architectures | |
CN110555383A (zh) | 一种基于卷积神经网络和3d估计的手势识别方法 | |
CN107346207B (zh) | 一种基于隐马尔科夫模型的动态手势切分识别方法 | |
CN107909003B (zh) | 一种针对大词汇量的手势识别方法 | |
CN104915009A (zh) | 手势预判的方法及系统 | |
Choudhury et al. | A CNN-LSTM based ensemble framework for in-air handwritten Assamese character recognition | |
Kong et al. | FedAWR: An interactive federated active learning framework for air writing recognition | |
Aran | Vision based sign language recognition: modeling and recognizing isolated signs with manual and non-manual components |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190319 |