CN105205475A - 一种动态手势识别方法 - Google Patents

一种动态手势识别方法 Download PDF

Info

Publication number
CN105205475A
CN105205475A CN201510684375.9A CN201510684375A CN105205475A CN 105205475 A CN105205475 A CN 105205475A CN 201510684375 A CN201510684375 A CN 201510684375A CN 105205475 A CN105205475 A CN 105205475A
Authority
CN
China
Prior art keywords
mrow
msub
layer
munderover
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510684375.9A
Other languages
English (en)
Other versions
CN105205475B (zh
Inventor
孙艳丰
邢迎新
李敬华
孔德慧
王立春
王文通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201510684375.9A priority Critical patent/CN105205475B/zh
Publication of CN105205475A publication Critical patent/CN105205475A/zh
Application granted granted Critical
Publication of CN105205475B publication Critical patent/CN105205475B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种动态手势识别方法,其能够提高动态手势识别的准确率。该方法包括步骤:(1)对动态手势数据进行预处理,基于间隔取样方法扩展动态手势数据,基于canny边缘检测算子计算扩展后扩展动态手势数据的RGB三个通道的边缘,生成彩色边缘图像;(2)基于卷积神经网络模型提取手势特征序列;(3)通过步骤(2)提取的手势特征序列和手部方向特征,进行隐马尔科夫模型HMM训练,得到最接近手势样本的HMM。

Description

一种动态手势识别方法
技术领域
本发明属于计算机视觉与机器学习的技术领域,具体地涉及一种动态手势识别方法。
背景技术
手势识别是计算机视觉领域的一个重要研究方向。手势识别研究涉及计算机视觉、模式识别、图像处理、机器学习等多学科领域,是一个具有挑战性的课题。基于视觉的手势识别因其自然性在聋哑人教育教学、机器人操控、虚拟现实、人机交互、智能家居等领域有重要应用。基于视觉的手势识别的两个关键研究内容是特征表示和分类方法。常用的特征表示方法有SIFT(Scale-InvariantFeatureTransform,尺度不变特征转换),SURF(Speed-UpRobustFeature,加速尺度不变特征),HOG(HistogramofGradient,方向梯度直方图),傅立叶描述子等手形特征描述和基于光流、运动跟踪方法的手势运动信息描述;常用的分类分类方法包括模板匹配,ANN(ArtificialNeuroNetwork,人工神经网络),HMM(HiddenMarkovModel,隐马尔科夫模型)等,特别地,由于HMM对动态时序序列的优越的建模能力,在语音识别和手语手势识别中应用最广。传统的特征表示方法通常是人工预定义的特征,人工选取特征的方法有很大的局限性,通常需要图像去噪、手势分割等预处理,并且需要先验知识、经验和大量的手工调整。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提供一种动态手势识别方法,其能够提高动态手势识别的准确率。
本发明的技术解决方案是:这种动态手势识别方法,该方法包括以下步骤:
(1)对动态手势数据进行预处理,基于间隔取样方法扩展动态手势数据,基于canny边缘检测算子计算扩展后扩展动态手势数据的RGB三个通道的边缘,生成彩色边缘图像;
(2)基于卷积神经网络模型提取手势特征序列;
(3)通过步骤(2)提取的手势特征序列和手部方向特征,进行隐马尔科夫模型HMM训练,得到最接近手势样本的HMM。
本发明基于卷积神经网络模型提取手势特征序列,然后进行隐马尔科夫模型HMM训练,得到最接近手势样本的HMM,因此能够提高动态手势识别的准确率。
附图说明
图1是根据本发明的动态手势识别方法的一个具体实施例的流程图。
具体实施方式
这种动态手势识别方法,该方法包括以下步骤:
(1)对动态手势数据进行预处理,基于间隔取样方法扩展动态手势数据,基于canny边缘检测算子计算扩展后扩展动态手势数据的RGB三个通道的边缘,生成彩色边缘图像;
(2)基于卷积神经网络模型提取手势特征序列;
(3)通过步骤(2)提取的手势特征序列和手部方向特征,进行隐马尔科夫模型HMM训练,得到最接近手势样本的HMM。
本发明基于卷积神经网络模型提取手势特征序列,然后进行隐马尔科夫模型HMM训练,得到最接近手势样本的HMM,因此能够提高动态手势识别的准确率。
优选地,所述步骤(1)中间隔取样方法为:设动态手势数据序列的源帧数为n帧;表达动态手势数据序列的关键帧的帧数为x帧;这样一个手势视频序列扩展成n/x=k个视频序列,K为向下取整的整数。
优选地,在所述步骤(2)中的卷积神经网络模型由五层卷积层、三层最大池化层、两层全连接层和最后一层分类层组成,在此基础上对卷积神经网络模型每层的卷积核大小和步长做优化处理,经过卷积神经网络模型对按手形分类的数据进行反复学习与训练,将参数调到最优,使手形分类识别率达到最优。
优选地,在所述步骤(2)中第一层到第二层是将220*220*3的彩色图像进行卷积核为11*11,步长4的卷积运算,接着进行池化窗口3*3,步长为1的最大池化运算;第二层到第三层进行卷积核为5*5,步长1的卷积运算,接着进行池化窗口3*3,步长为2的最大池化运算;第三、第四、第五、第六层之间均为卷积核大小为3*3,滑动步长为1的卷积操作;之后两层为全连接层,其中,第一层全连接层节点为2048个,第二层全连接层是要提取的特征层,初始节点设置为2048个,第二层全连接层输出特征维度为64维;第八层到第九层之间为分类层,此层用softmax分类器。
优选地,在所述步骤(2)中,在方向特征上应用简化的HOG特征,将其修改成统计图像每个像素在九个方向上的个数,从而提取到9维的方向特征,并将其串联融合在从第二层全连接层提取的64维的特征向量上,生成73维的手势序列单帧特征,并作为隐马尔科夫模型的观察序列进行训练分类。
优选地,在所述步骤(3)中,对每类动态手势训练出一个HMM模型,在实验阶段针对剑桥的动态手势库中动作的类别,共训练出了九个HMM模型,然后进行测试识别;HMM模型的训练过程是给定训练样本的观察序列,对模型参数不断重估的过程,通过迭代运算对HMM模型的参数λ(A,B,π)不断调整,根据公式(1)使得观察序列O出现的概率P(O│λ)达到最大,训练一个最适合样本集的模型,
P ( O | λ ) = Σ i = 1 N Σ j = 1 N α i ( i ) a i j b j ( O t + 1 ) β t + 1 ( j ) , 1 ≤ t ≤ T - 1 - - - ( 1 ) ;
再根据Baulm-Welch算法更新来求P(O|λ)最大时的参数λ,其中at(i)表示给定模型λ,并且截止到t时刻产生观察概率o1o2…ot时,t时刻状态为si的概率,aij表示为状态si到sj的状态转移概率,bj(ot+1)表示t+1时刻状态为si条件下出现观察值ot+1的概率,βt+1(j)表示在已知模型λ且t+1时刻到T时刻产生观察序列ot+2ot+3…oT的概率。
优选地,求P(O|λ)最大时的参数λ包括以下步骤:
a)初始化HMM的参数λ(A,B,π);
b)根据观察序列O和模型参数λ估算新模型参数根据公式(2)
-(5)分别重新估计得到新的模型参数
π i ‾ = γ t ( i ) = Σ j = 1 N ξ t ( i , j ) - - - ( 2 )
α i j ‾ = Σ t = 1 T - 1 ξ t ( i , j ) / Σ t = 1 T - 1 γ t ( i ) - - - ( 3 )
b j ( k ) ‾ = Σ t = 1 , o t = v k T - 1 γ t ( i ) / Σ t = 1 T - 1 γ t ( j ) - - - ( 4 )
其中,
ξ t ( i , j ) = p ( q t = s i , q t + 1 = s j | O , λ ) = p ( q t = s i , q t + 1 = s j , O | λ ) / p ( O | λ ) = α t ( i ) a i j b j ( o t + 1 ) β t + 1 ( j ) / Σ i = 1 N Σ j = 1 N α t ( i ) a i j b j ( o t + 1 ) β t + 1 ( j ) - - - ( 5 ) ;
γt(i)表示在给定观察序列O和HMM模型参数λ的条件下,在t时刻处于状态si的概率,满足ξt(i,j)表示在给定观察序列O和HMM模型参数λ的条件下,在t时刻处于状态si并且t+1时刻处于sj的概率。
c)使用前向-后向算法计算观察序列O在模型λ下的概率P(O|λ)以及在下的概率并计算若满足 | log P ( O | &lambda; &OverBar; ) - log P ( O | &lambda; ) | < &epsiv; , ε为设定的收敛门限值,则收敛,此时的为训练得到的最接近手势样本的HMM;否则令继续执行步骤b),直至收敛。
现在给出一个本发明的详细实施例。
本发明的训练流程如图1,主要步骤如下:
1、手势数据预处理
动态手势数据的预处理主要包括面向学习方法的数据扩充以及边缘检测两个方面。由于动态手势数据的相邻帧之间变化比较小,所以基于间隔取样方法扩展动态手势视频数据量,以更好地学习与训练。间隔取样方法具体为:设手势视频序列的源帧数为n帧;表达手势视频序列的关键帧,即采样帧数为x帧;这样一个手势视频序列可以扩展成n/x=k(K向下取整)个视频序列。
为去除不同光照对图像质量的影响,基于canny边缘检测算子计算原始图像的RGB三个通道的边缘,生成彩色边缘图像。
2、手势序列单帧手势特征表示
2.1卷积神经网络模型
本发明采用的卷积神经网络模型结构类似于2012年ImageNet比赛上Hinton团队所用的卷积神经网络模型,主要由五层卷积层、三层最大池化层、两层全连接层和最后一层分类层(softmax层)组成。在此基础上对卷积神经网络模型每层的卷积核大小和步长做一些经验性的优化处理。第一层到第二层是将220*220*3的彩色图像进行卷积核为11*11,步长4的卷积运算,接着进行池化窗口3*3,步长为1的最大池化运算。同样,第二层到第三层进行卷积核为5*5,步长1的卷积运算,接着进行池化窗口3*3,步长为2的最大池化运算。第三、第四、第五、第六层之间均为卷积核大小为3*3,滑动步长为1的卷积操作。之后两层为全连接层,其中,第一层全连接层节点为2048个,第二层全连接层是我们要提取的特征层,初始节点设置为2048个,这一特征向量具有高度稀疏的特点,因此要降低特征维度。本发明通过实验验证64维可以有效表达手势特征,提取特征的准确率在95%左右,所以第二层全连接层的节点设置为64个。第八层到第九层之间为分类层,此层用softmax分类器。
经过卷积神经网络模型对按手形分类的数据的反复学习与训练,最终将参数调到最优,使手形分类识别率达到最优,从而更好的提出代表性的手势特征。
2.2融合CNN和手部方向的手势序列单帧特征表示
提取出最后一层全连接层(fc8层)所学到的特征,得到64维的特征向量。经过对卷积神经网络的特点分析,由于它具有一定的旋转不变性,因此在手势序列单帧特征阶段融合手势的方向特征。本方法在方向特征上应用简化的HOG特征,将其修改成统计图像每个像素在九个方向上的个数,从而提取到9维的方向特征,并将其串联融合在之前学习得到的64维特征上,生成73维的手势序列单帧特征,并作为隐马尔科夫模型的观察序列进行训练分类。
3、基于隐马尔科夫模型的动态手势识别
隐马尔科夫模型的关键过程是HMM模型的训练问题,本方法对每类动态手势训练出一个HMM模型,在实验阶段针对剑桥的动态手势库中动作的类别,共训练出了九个HMM模型,然后进行测试识别。HMM模型的训练过程是给定训练样本的观察序列,对模型参数不断重估的过程,通过迭代运算对HMM模型的参数λ(A,B,π)不断调整,使得观察序列O出现的概率P(O│λ)达到最大,训练一个最适合样本集的模型。根据前向变量αt(i)和后向变量βt(i)可以得出:
p ( o | x ) = &Sigma; i = 1 N &Sigma; j = 1 N &alpha; i ( i ) a i j b j ( O t + 1 ) &beta; t + 1 ( j ) , 1 &le; t &le; T - 1 - - - ( 1 )
接下来的问题就是求P(O|λ)最大是的参数λ。目前还没有一种能够由训练样本得到模型全局最优解的算法,本发明使用效果较好的Baulm-Welch算法,该算法使用迭代计算来更新新模型参数,最后是参数逐渐趋向最优值,是一种极大似然估计过程。具体的参数估计公式如下:
&pi; i &OverBar; = &gamma; t ( i ) = &Sigma; j = 1 N &xi; t ( i , j ) - - - ( 2 )
&alpha; i j &OverBar; = &Sigma; t = 1 T - 1 &xi; t ( i , j ) / &Sigma; t = 1 T - 1 &gamma; t ( i ) - - - ( 3 )
b j ( k ) &OverBar; = &Sigma; t = 1 , o t = v k T - 1 &gamma; t ( i ) / &Sigma; t = 1 T - 1 &gamma; t ( j ) - - - ( 4 )
其中,
&xi; t ( i , j ) = p ( q t = s i , q t + 1 = s j | O , &lambda; ) = p ( q t = s i , q t + 1 = s j , O | &lambda; ) / p ( O | &lambda; ) = &alpha; t ( i ) a i j b j ( o t + 1 ) &beta; t + 1 ( j ) / &Sigma; i = 1 N &Sigma; j = 1 N &alpha; t ( i ) a i j b j ( o t + 1 ) &beta; t + 1 ( j ) - - - ( 5 )
求取HMM的最优参数的具体步骤如下:
a)初始化HMM的参数λ(A,B,π);
b)根据观察序列O和模型参数λ估算新模型参数根据上面的重估公式分别重新估计得到新的模型参数
c)使用前向-后向算法计算观察序列O在模型λ下的概率P(O|λ)以及在下的概率并计算若满足 (ε为设定的收敛门限值),则收敛,此时的即为训练得到的最接近手势样本的HMM。否则令继续执行步骤b),直至收敛。
对上述方法进行了实验验证,并取得了明显的效果。实验数据集选择了剑桥的手势数据集(Kim和Cipolla2009,Cambridgehand-gesture),该数据集具有变光照、非特定人的特点。数据集包含5组不同光照下的数据集(Set1,…,Set5),每个Set下有20个不同的人完成9个手势动作(20×9)。用Set5的数据作为训练集,其他四个数据集作为测试集来测试评估。首先我们对原始数据进行数据扩充,使每个Set中每个手势动作有200个样本,然后对这些样本进行Canny边缘强化处理。
表1为在剑桥动态手势数据集上本方法与其他方法的实验结果对比,可见本方法的识别率比其他方法高。
表1
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

Claims (7)

1.一种动态手势识别方法,其特征在于,该方法包括以下步骤:
(1)对动态手势数据进行预处理,基于间隔取样方法扩展动态手势数据,基于canny边缘检测算子计算扩展后扩展动态手势数据的RGB三个通道的边缘,生成彩色边缘图像;
(2)基于卷积神经网络模型提取手势特征序列;
(3)通过步骤(2)提取的手势特征序列和手部方向特征,进行隐马尔科夫模型HMM训练,得到最接近手势样本的HMM。
2.根据权利要求1所述的动态手势识别方法,其特征在于,所述步骤(1)中间隔取样方法为:设动态手势数据序列的源帧数为n帧;表达动态手势数据序列的关键帧的帧数为x帧;这样一个手势视频序列扩展成n/x=k个视频序列,K为向下取整的整数。
3.根据权利要求2所述的动态手势识别方法,其特征在于,在所述步骤(2)中的卷积神经网络模型由五层卷积层、三层最大池化层、两层全连接层和最后一层分类层组成,在此基础上对卷积神经网络模型每层的卷积核大小和步长做优化处理,经过卷积神经网络模型对按手形分类的数据进行反复学习与训练,将参数调到最优,使手形分类识别率达到最优。
4.根据权利要求3所述的动态手势识别方法,其特征在于,在所述步骤(2)中第一层到第二层是将220*220*3的彩色图像进行卷积核为11*11,步长4的卷积运算,接着进行池化窗口3*3,步长为1的最大池化运算;第二层到第三层进行卷积核为5*5,步长1的卷积运算,接着进行池化窗口3*3,步长为2的最大池化运算;第三、第四、第五、第六层之间均为卷积核大小为3*3,滑动步长为1的卷积操作;之后两层为全连接层,其中,第一层全连接层节点为2048个,第二层全连接层节点设置为64;第八层到第九层之间为分类层,此层用softmax分类器。
5.根据权利要求4所述的动态手势识别方法,其特征在于,在所述步骤(2)中,在方向特征上应用简化的HOG特征,将其修改成统计图像每个像素在九个方向上的个数,从而提取到9维的方向特征,并将其串联融合在从第二层全连接层提取的64维的特征向量上,生成73维的手势单帧特征,手势特征帧序列作为隐马尔科夫模型的观察序列进行训练分类。
6.根据权利要求5所述的动态手势识别方法,其特征在于,在所述步骤(3)中,对每类动态手势训练出一个HMM模型,在实验阶段针对剑桥的动态手势库中动作的类别,共训练出了九个HMM模型,然后进行测试识别;HMM模型的训练过程是给定训练样本的观察序列,对模型参数不断重估的过程,通过迭代运算对HMM模型的参数λ(A,B,π)不断调整,根据公式(1)使得观察序列O出现的概率P(O│λ)达到最大,训练一个最适合样本集的模型,
再根据Baulm-Welch算法更新来求P(O|λ)最大时的参数λ。其中at(i)表示给定模型λ,并且截止到t时刻产生观察概率o1o2…ot时,t时刻状态为si的概率,aij表示为状态si到sj的状态转移概率,bj(ot+1)表示t+1时刻状态为si条件下出现观察值ot+1的概率,βt+1(j)表示在已知模型λ且t+1时刻到T时刻产生观察序列ot+2ot+3…oT的概率。
7.根据权利要求6所述的动态手势识别方法,其特征在于,求P(O|λ)最大时的参数λ包括以下步骤:
a)初始化HMM的参数λ(A,B,π);
b)根据观察序列O和模型参数λ估算新模型参数根据公式(2)-(5)分别重新估计得到新的模型参数
&pi; i &OverBar; = &gamma; t ( i ) = &Sigma; j = 1 N &xi; t ( i , j ) - - - ( 2 )
&alpha; i j &OverBar; = &Sigma; t = 1 T - 1 &xi; t ( i , j ) / &Sigma; t = 1 T - 1 &gamma; t ( i ) - - - ( 3 )
b j ( k ) &OverBar; = &Sigma; t = 1 , o t = v k T - 1 &gamma; t ( i ) / &Sigma; t = 1 T - 1 &gamma; t ( j ) - - - ( 4 )
其中,
&xi; t ( i , j ) = p ( q t = s i , q t + 1 = s j | O , &lambda; ) = p ( q t = s i , q t + 1 = s j , O | &lambda; ) / p ( O | &lambda; ) = &alpha; t ( i ) a i j b j ( o t + 1 ) &beta; t + 1 ( j ) / &Sigma; i = 1 N &Sigma; j = 1 N &alpha; t ( i ) a i j b j ( o t + 1 ) &beta; t + 1 ( j ) - - - ( 5 ) ;
γt(i)表示在给定观察序列O和HMM模型参数λ的条件下,在t时刻处于状态si的概率,满足ξt(i,j)表示在给定观察序列O和HMM模型参数λ的条件下,在t时刻处于状态si并且t+1时刻处于sj的概率。
c)使用前向-后向算法计算观察序列O在模型λ下的概率P(O|λ)以及在下的概率P(O|λ),并计算|logP(O|λ)-logP(O|λ)|,若满足|logP(O|λ)-logP(O|λ)|,ε为设定的收敛门限值,则收敛,此时的为训练得到的最接近手势样本的HMM;否则令继续执行步骤b),直至收敛。
CN201510684375.9A 2015-10-20 2015-10-20 一种动态手势识别方法 Expired - Fee Related CN105205475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510684375.9A CN105205475B (zh) 2015-10-20 2015-10-20 一种动态手势识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510684375.9A CN105205475B (zh) 2015-10-20 2015-10-20 一种动态手势识别方法

Publications (2)

Publication Number Publication Date
CN105205475A true CN105205475A (zh) 2015-12-30
CN105205475B CN105205475B (zh) 2019-02-05

Family

ID=54953147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510684375.9A Expired - Fee Related CN105205475B (zh) 2015-10-20 2015-10-20 一种动态手势识别方法

Country Status (1)

Country Link
CN (1) CN105205475B (zh)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105373785A (zh) * 2015-11-30 2016-03-02 北京地平线机器人技术研发有限公司 基于深度神经网络的手势识别检测方法与装置
CN105718878A (zh) * 2016-01-19 2016-06-29 华南理工大学 基于级联卷积神经网络的第一视角空中手写和空中交互方法
CN105893942A (zh) * 2016-03-25 2016-08-24 中国科学技术大学 一种基于eSC和HOG的自适应HMM的手语识别方法
CN106295531A (zh) * 2016-08-01 2017-01-04 乐视控股(北京)有限公司 一种手势识别方法和装置以及虚拟现实终端
CN106557173A (zh) * 2016-11-29 2017-04-05 重庆重智机器人研究院有限公司 动态手势识别方法及装置
CN106845330A (zh) * 2016-11-17 2017-06-13 北京品恩科技股份有限公司 一种基于深度卷积神经网络的二维人脸识别模型的训练方法
CN106980365A (zh) * 2017-02-21 2017-07-25 华南理工大学 基于深度卷积神经网络框架的第一视角动态手势识别方法
CN107093205A (zh) * 2017-03-15 2017-08-25 北京航空航天大学 一种基于无人机图像的三维空间建筑物窗户检测重建方法
CN107239628A (zh) * 2017-06-15 2017-10-10 清华大学 一种基于动态时序图的不确定性机车仿真模型系统构建方法
CN107390573A (zh) * 2017-06-28 2017-11-24 长安大学 基于手势控制的智能轮椅系统及控制方法
CN107563494A (zh) * 2017-08-01 2018-01-09 华南理工大学 一种基于卷积神经网络和热图的第一视角指尖检测方法
CN107704072A (zh) * 2017-06-10 2018-02-16 济南大学 一种手势交互过程中用户手势的自动纠错方法
CN107798964A (zh) * 2017-11-24 2018-03-13 郑军 一种实时识别手势的手语智能交互设备及其交互方法
CN107909003A (zh) * 2017-10-16 2018-04-13 华南理工大学 一种针对大词汇量的手势识别方法
CN108052884A (zh) * 2017-12-01 2018-05-18 华南理工大学 一种基于改进残差神经网络的手势识别方法
CN108073851A (zh) * 2016-11-08 2018-05-25 株式会社理光 一种抓取手势识别的方法、装置及电子设备
CN108292362A (zh) * 2016-01-05 2018-07-17 英特尔公司 用于光标控制的手势识别
CN108595937A (zh) * 2018-04-27 2018-09-28 中国人民解放军国防科技大学 基于行为特征的微感智能身份认证方法
CN108960171A (zh) * 2018-07-12 2018-12-07 安徽工业大学 一种基于特征迁移学习的转换手势识别到身份识别的方法
CN108960328A (zh) * 2018-07-04 2018-12-07 温州大学 一种基于汉克尔矩阵的诊断汽车轮毂轴承故障的方法
CN109409343A (zh) * 2018-12-11 2019-03-01 福州大学 一种基于活体检测的人脸识别方法
CN109409276A (zh) * 2018-10-19 2019-03-01 大连理工大学 一种健壮手语特征提取方法
CN109961005A (zh) * 2019-01-28 2019-07-02 山东大学 一种基于二维卷积网络的动态手势识别方法及系统
CN110110646A (zh) * 2019-04-30 2019-08-09 浙江理工大学 一种基于深度学习的手势图像关键帧提取方法
CN110113116A (zh) * 2019-05-14 2019-08-09 山东科技大学 基于wifi信道信息的人体行为识别方法
CN110152263A (zh) * 2018-04-17 2019-08-23 湖北新清科教育科技有限公司 一种从姿态曲线确定羽毛球动作的方法
CN110213788A (zh) * 2019-06-15 2019-09-06 福州大学 基于数据流时空特征的wsn异常检测及类型识别方法
CN106960175B (zh) * 2017-02-21 2020-01-31 华南理工大学 基于深度卷积神经网络的第一视角动态手势检测方法
CN111444488A (zh) * 2020-03-16 2020-07-24 安徽清新互联信息科技有限公司 一种基于动态手势的身份认证方法
CN111596767A (zh) * 2020-05-27 2020-08-28 广州市大湾区虚拟现实研究院 一种基于虚拟现实的姿态捕获方法和装置
CN111723620A (zh) * 2019-03-22 2020-09-29 浙江大学 一种基于深度学习的悬浮动态手势人机交互系统
CN112215210A (zh) * 2020-11-20 2021-01-12 江苏三川智能科技有限公司 一种基于ai和hmm的电梯电动车识别预警方法
CN112784812A (zh) * 2021-02-08 2021-05-11 安徽工程大学 一种深蹲动作识别方法
CN113239824A (zh) * 2021-05-19 2021-08-10 北京工业大学 一种基于3D-Ghost模块的多模态训练单模态测试的动态手势识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778407A (zh) * 2012-10-23 2014-05-07 南开大学 一种迁移学习框架下基于条件随机场的手势识别算法
CN104299012B (zh) * 2014-10-28 2017-06-30 银河水滴科技(北京)有限公司 一种基于深度学习的步态识别方法
CN104933417B (zh) * 2015-06-26 2019-03-15 苏州大学 一种基于稀疏时空特征的行为识别方法

Cited By (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105373785A (zh) * 2015-11-30 2016-03-02 北京地平线机器人技术研发有限公司 基于深度神经网络的手势识别检测方法与装置
CN105373785B (zh) * 2015-11-30 2019-08-02 北京地平线机器人技术研发有限公司 基于深度神经网络的手势识别检测方法与装置
CN108292362B (zh) * 2016-01-05 2022-04-12 英特尔公司 用于光标控制的手势识别
CN108292362A (zh) * 2016-01-05 2018-07-17 英特尔公司 用于光标控制的手势识别
CN105718878A (zh) * 2016-01-19 2016-06-29 华南理工大学 基于级联卷积神经网络的第一视角空中手写和空中交互方法
CN105718878B (zh) * 2016-01-19 2019-08-09 华南理工大学 基于级联卷积神经网络的第一视角空中手写和空中交互方法
CN105893942B (zh) * 2016-03-25 2019-04-26 中国科学技术大学 一种基于eSC和HOG的自适应HMM的手语识别方法
CN105893942A (zh) * 2016-03-25 2016-08-24 中国科学技术大学 一种基于eSC和HOG的自适应HMM的手语识别方法
CN106295531A (zh) * 2016-08-01 2017-01-04 乐视控股(北京)有限公司 一种手势识别方法和装置以及虚拟现实终端
CN108073851B (zh) * 2016-11-08 2021-12-28 株式会社理光 一种抓取手势识别的方法、装置及电子设备
CN108073851A (zh) * 2016-11-08 2018-05-25 株式会社理光 一种抓取手势识别的方法、装置及电子设备
CN106845330A (zh) * 2016-11-17 2017-06-13 北京品恩科技股份有限公司 一种基于深度卷积神经网络的二维人脸识别模型的训练方法
CN106557173B (zh) * 2016-11-29 2019-10-18 重庆重智机器人研究院有限公司 动态手势识别方法及装置
CN106557173A (zh) * 2016-11-29 2017-04-05 重庆重智机器人研究院有限公司 动态手势识别方法及装置
CN106980365A (zh) * 2017-02-21 2017-07-25 华南理工大学 基于深度卷积神经网络框架的第一视角动态手势识别方法
CN106960175B (zh) * 2017-02-21 2020-01-31 华南理工大学 基于深度卷积神经网络的第一视角动态手势检测方法
CN107093205B (zh) * 2017-03-15 2019-08-16 北京航空航天大学 一种基于无人机图像的三维空间建筑物窗户检测重建方法
CN107093205A (zh) * 2017-03-15 2017-08-25 北京航空航天大学 一种基于无人机图像的三维空间建筑物窗户检测重建方法
CN107704072A (zh) * 2017-06-10 2018-02-16 济南大学 一种手势交互过程中用户手势的自动纠错方法
CN107239628A (zh) * 2017-06-15 2017-10-10 清华大学 一种基于动态时序图的不确定性机车仿真模型系统构建方法
CN107390573B (zh) * 2017-06-28 2020-05-29 长安大学 基于手势控制的智能轮椅系统及控制方法
CN107390573A (zh) * 2017-06-28 2017-11-24 长安大学 基于手势控制的智能轮椅系统及控制方法
CN107563494A (zh) * 2017-08-01 2018-01-09 华南理工大学 一种基于卷积神经网络和热图的第一视角指尖检测方法
CN107909003A (zh) * 2017-10-16 2018-04-13 华南理工大学 一种针对大词汇量的手势识别方法
CN107909003B (zh) * 2017-10-16 2019-12-10 华南理工大学 一种针对大词汇量的手势识别方法
CN107798964A (zh) * 2017-11-24 2018-03-13 郑军 一种实时识别手势的手语智能交互设备及其交互方法
CN108052884A (zh) * 2017-12-01 2018-05-18 华南理工大学 一种基于改进残差神经网络的手势识别方法
CN110152263A (zh) * 2018-04-17 2019-08-23 湖北新清科教育科技有限公司 一种从姿态曲线确定羽毛球动作的方法
CN108595937A (zh) * 2018-04-27 2018-09-28 中国人民解放军国防科技大学 基于行为特征的微感智能身份认证方法
CN108960328A (zh) * 2018-07-04 2018-12-07 温州大学 一种基于汉克尔矩阵的诊断汽车轮毂轴承故障的方法
CN108960171A (zh) * 2018-07-12 2018-12-07 安徽工业大学 一种基于特征迁移学习的转换手势识别到身份识别的方法
CN108960171B (zh) * 2018-07-12 2021-03-02 安徽工业大学 一种基于特征迁移学习的转换手势识别到身份识别的方法
CN109409276A (zh) * 2018-10-19 2019-03-01 大连理工大学 一种健壮手语特征提取方法
CN109409343A (zh) * 2018-12-11 2019-03-01 福州大学 一种基于活体检测的人脸识别方法
CN109961005B (zh) * 2019-01-28 2021-08-31 山东大学 一种基于二维卷积网络的动态手势识别方法及系统
CN109961005A (zh) * 2019-01-28 2019-07-02 山东大学 一种基于二维卷积网络的动态手势识别方法及系统
CN111723620A (zh) * 2019-03-22 2020-09-29 浙江大学 一种基于深度学习的悬浮动态手势人机交互系统
CN110110646A (zh) * 2019-04-30 2019-08-09 浙江理工大学 一种基于深度学习的手势图像关键帧提取方法
CN110110646B (zh) * 2019-04-30 2021-05-04 浙江理工大学 一种基于深度学习的手势图像关键帧提取方法
CN110113116A (zh) * 2019-05-14 2019-08-09 山东科技大学 基于wifi信道信息的人体行为识别方法
CN110113116B (zh) * 2019-05-14 2021-06-04 山东科技大学 基于wifi信道信息的人体行为识别方法
CN110213788A (zh) * 2019-06-15 2019-09-06 福州大学 基于数据流时空特征的wsn异常检测及类型识别方法
CN111444488A (zh) * 2020-03-16 2020-07-24 安徽清新互联信息科技有限公司 一种基于动态手势的身份认证方法
CN111596767A (zh) * 2020-05-27 2020-08-28 广州市大湾区虚拟现实研究院 一种基于虚拟现实的姿态捕获方法和装置
CN111596767B (zh) * 2020-05-27 2023-05-30 广州市大湾区虚拟现实研究院 一种基于虚拟现实的姿态捕获方法和装置
CN112215210A (zh) * 2020-11-20 2021-01-12 江苏三川智能科技有限公司 一种基于ai和hmm的电梯电动车识别预警方法
CN112784812A (zh) * 2021-02-08 2021-05-11 安徽工程大学 一种深蹲动作识别方法
CN113239824A (zh) * 2021-05-19 2021-08-10 北京工业大学 一种基于3D-Ghost模块的多模态训练单模态测试的动态手势识别方法
CN113239824B (zh) * 2021-05-19 2024-04-05 北京工业大学 一种基于3D-Ghost模块的多模态训练单模态测试的动态手势识别方法

Also Published As

Publication number Publication date
CN105205475B (zh) 2019-02-05

Similar Documents

Publication Publication Date Title
CN105205475B (zh) 一种动态手势识别方法
Kamal et al. Automatic traffic sign detection and recognition using SegU-Net and a modified Tversky loss function with L1-constraint
US10929649B2 (en) Multi-pose face feature point detection method based on cascade regression
US20190228268A1 (en) Method and system for cell image segmentation using multi-stage convolutional neural networks
CN107609460B (zh) 一种融合时空双重网络流和attention机制的人体行为识别方法
CN111274921B (zh) 一种利用姿态掩模进行人体行为识别的方法
CN108898620B (zh) 基于多重孪生神经网络与区域神经网络的目标跟踪方法
CN110321967B (zh) 基于卷积神经网络的图像分类改进方法
CN106778796B (zh) 基于混合式协同训练的人体动作识别方法及系统
CN107808129B (zh) 一种基于单个卷积神经网络的面部多特征点定位方法
CN107506722A (zh) 一种基于深度稀疏卷积神经网络人脸情感识别方法
CN105825502B (zh) 一种基于显著性指导的词典学习的弱监督图像解析方法
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN108491766B (zh) 一种端到端的基于深度决策森林的人群计数方法
CN108595558B (zh) 一种数据均衡策略和多特征融合的图像标注方法
CN104517122A (zh) 一种基于优化卷积架构的图像目标识别方法
CN111507334B (zh) 一种基于关键点的实例分割方法
CN102521616B (zh) 基于稀疏表示的行人检测方法
CN106682696A (zh) 基于在线示例分类器精化的多示例检测网络及其训练方法
CN106778852A (zh) 一种修正误判的图像内容识别方法
CN105205449A (zh) 基于深度学习的手语识别方法
CN106599810B (zh) 一种基于栈式自编码的头部姿态估计方法
CN110533068B (zh) 一种基于分类卷积神经网络的图像对象识别方法
Kishore et al. Visual-verbal machine interpreter for sign language recognition under versatile video backgrounds
CN109543546B (zh) 基于深度序分布回归的步态年龄估计方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190205

Termination date: 20211020