CN105718878A - 基于级联卷积神经网络的第一视角空中手写和空中交互方法 - Google Patents

基于级联卷积神经网络的第一视角空中手写和空中交互方法 Download PDF

Info

Publication number
CN105718878A
CN105718878A CN201610033798.9A CN201610033798A CN105718878A CN 105718878 A CN105718878 A CN 105718878A CN 201610033798 A CN201610033798 A CN 201610033798A CN 105718878 A CN105718878 A CN 105718878A
Authority
CN
China
Prior art keywords
gesture
hand
coordinate
finger tip
air
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610033798.9A
Other languages
English (en)
Other versions
CN105718878B (zh
Inventor
金连文
黄毅超
刘孝睿
张鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201610033798.9A priority Critical patent/CN105718878B/zh
Publication of CN105718878A publication Critical patent/CN105718878A/zh
Application granted granted Critical
Publication of CN105718878B publication Critical patent/CN105718878B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明公开了一种基于级联卷积神经网络的第一视角空中手写和空中交互方法,包括下述步骤:S1、获取训练数据;S2、设计一个深度卷积神经网络用于手部检测;S3、设计一个深度卷积神经网络用于手势分类和指尖检测;S4、将一级网络和二级网络级联,通过一级网络输出的前景外接矩形切割出感兴趣区域从而获得包含手部的前景区域,然后将前景区域作为第二级卷积网络的输入进行指尖检测和手势识别;S5、判断手势类别,若为单指手势,则输出其指尖坐标并进行时序平滑和点间插值;S6、利用连续多帧的指尖采样坐标进行文字识别。本发明提供了一种完整的空中手写和空中交互算法,实现准确鲁棒的指尖检测和手势分类从而实现第一视角空中手写和空中交互。

Description

基于级联卷积神经网络的第一视角空中手写和空中交互方法
技术领域
本发明涉及计算机视觉以及机器学习领域,特别涉及一种基于级联卷积神经网络的第一视角空中手写和空中交互方法。
背景技术
近年来,随着虚拟现实技术(VirtualReality,VR)和增强现实技术(AugmentingReality,AR)的兴起,第一视角(EgocentricVision)手势交互技术受到学术界和工业界的广泛关注,尤其是GoogleGlass、MicrosoftHololens等智能可穿戴式设备以及Oculus等虚拟现实设备的出现使得传统的人机交互方式难以适用,急需一种算法来帮助设备理解人的交互需要,如手势操作等。手势交互技术主要涉及两个方面,手势识别和关键点定位,本发明为结合手势识别和关键点定位形成的一个综合应用,即指尖检测获得采样点以及手势识别获得书写信号。假象如下使用场景:用户在不方便使用触摸屏的情境下,可以直接在空中进行第一视角手写,完成发送信息操作;用户在需要对现实画面进行某些图像操作如拍照,在不便于使用拍照设备情况下可直接利用指尖空中画圈或其他手势实现即时拍摄。
过去一些年里,关于手势交互的算法大多数考虑利用肤色先验信息或者运动时序信息,但是都只能使用在受限的实验室环境,无法适应室内室外场景变化,光照变化等因素。另外,传统的人工特征提取无法充分刻画不同使用者的肤色变化和手部姿态多样性。最近兴起的深度学习技术正好可以解决这个特征提取问题。利用善于处理视觉信息的是深度卷积神经网络(CNN)能训练出一个能够提取图像浅层特征并逐层将浅层特征通过非线性变换抽象成高级特征的神经网络。CNN方法在各种视觉分类任务,如多类别物体识别等,获得极佳表现,同时在某些回归问题,如人脸关键点检测、行人检测等任务中亦表现出非常好的效果。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于级联卷积神经网络的第一视角空中手写和空中交互方法,解决动态视频流里面指尖检测问题和手势识别的问题,并利用手势识别作为信号,指尖检测跟踪作为采样点集,实现一套第一视角的空中手写和空中交互方案。
为了达到上述目的,本发明采用以下技术方案:
本发明基于级联卷积神经网络的第一视角空中手写和空中交互方法,包括下述步骤:
S1、获取训练数据,人工标记包含手部区域的前景区域的左上角点和右下角点,人工标记指尖所在坐标,人工标记不同手势的类别;
S2、设计一个深度卷积神经网络用于手部检测,该神经网络输入为第一视角下的单帧图像,输出为手部前景矩形的左上角坐标和右下角坐标,投入训练数据并优化欧氏范数损失函数,迭代直至参数稳定;
S3、设计一个深度卷积神经网络用于手势识别和指尖检测,该神经网络输入为仅包含手部区域的前景矩形,输出为指尖坐标和手势类别,投入训练数据并优化一个分段损失函数,迭代直至参数稳定;
S4、将一级网络和二级网络级联,通过一级网络输出的前景外接矩形切割出感兴趣区域从而获得包含手部的前景区域,然后将前景区域作为第二级卷积网络的输入进行指尖检测和手势识别;
S5、判断手势类别,若为单指手势,则输出其指尖坐标并进行时序平滑和点间插值;
S6、利用连续多帧的指尖采样坐标进行文字识别。
作为优选的技术方案,步骤S1具体为:
S1.1、通过摄像头处于人眼位置模拟第一视角,采集大规模数据,覆盖不同的场景,包括多种不同的手势,其中一种必须是单指手势而且指尖可见;
S1.2、人工标记包含手部区域的外接矩形左上角坐标和右下角坐标,人工标记手势类别,若手势为单指手势,人工标记指尖的位置;
S1.3、按照键值对的方式,配对储存图像和对应的标签真实值。
作为优选的技术方案,在所述步骤S1.1中,所采集的数据为第一视角的数据,画面包含手势。
作为优选的技术方案,在所述步骤S1.2中,所采集的数据是通过人工标价手部前景左上角坐标和右下角坐标,人工标记指尖坐标和人工标记手势类别来进行监督学习。
作为优选的技术方案,步骤S2具体为:
S2.1、合理设计一个深度卷积神经网络,包括卷积层、池化层和全卷积层,使得网络输入为三通道RGB图像,输出为两个二维坐标(xtl,ytl)和(xbr,ybr),分别代表手部前景的左上角右下角;
S2.2、其应用损失函数为:
E = 1 N Σ N ( p i - t i ) 2
其中pi代表预测的坐标值,ti代表训练样本中已经标注的坐标真实值,N代表输出坐标的个数,此处N为4,代表左上角和右下角坐标,对应的反向传播的残差为
εi=pi-ti(1≤i≤4)
S2.3、投入训练数据并应用梯度下降法优化目标函数。
作为优选的技术方案,步骤S3具体为:
S3.1、合理设计一个深度卷积神经网络,包括卷积层,池化层,全卷积层,使得网络输入为三通道RGB图像,输出为指尖的二维坐标(xft,yft)和手势分类(cgesture);
S3.2、确定其损失函数,该损失函数表示为:
E = 1 N Σ N ( p i - t i ) 2 c g e s t u r e = c g r o u n d t r u t h
E=0cgesture≠cgroundtruth
其中pi代表预测的坐标值,ti代表训练样本中已经标注的坐标真实值,N代表输出坐标的个数,此处N为2,cgroundtruth代表手势类别真实值,cgesture代表网络输出的手势,对应的反向传播的残差为:
εi=pi-ti
S3.3、投入训练数据并应用梯度下降法优化目标函数。
作为优选的技术方案,步骤S4中,利用两层卷积神经网络级联的方法,先进行手部检测,获取较小的前景区域,再进行指尖检测和手势识别。
作为优选的技术方案,步骤S5具体为:
S5.1、判断手势类别,若为单指,记录采样点坐标序列;
S5.2、进行一个滑动窗均值滤波;
Pi=pi-1+pi+pi+1
作为优选的技术方案,步骤S5中,对每一帧图像先进行手势识别,若为单指手势,则输出指尖坐标。
作为优选的技术方案,步骤S6中,利用平滑的采样点进行文字识别。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明采用了大规模数据采集人工标定的技术方案,从而能够利用深度卷积神经网络进行监督学习。
2、本发明采用了人工标定手部外接矩形坐标和指尖坐标的技术方案,从而能够利用深度卷积神经网络进行回归问题的优化训练求解。
3、本发明采用了两层级联卷积神经网络的技术方案,从而能够分两层分别着重处理不同的检测。
4、本发明采用了第一级卷积神经网络实现手部检测的技术方案,为后续的指尖检测滤除了70%以上的无用背景信息。
5、本发明采用了第二级卷积神经网络同时进行指尖检测和手势识别的技术方案,能够稳定的预测指尖的坐标同时预测手势类型
6、本发明采用了第二级卷积神经网络同时进行指尖检测和手势识别的技术方案,能够减少整体时间性能消耗。
7、本发明采用了预测指尖坐标后进行采样点平滑滤波,从而优化空中手写的视觉效果以及优化文字识别的准确率
附图说明
图1(a)-图1(b)是本发明的体验者佩戴智能眼镜的第一视角示意图;
图2是本发明第一视角采集的样本示意;
图3是本发明第一视角空中手写和交互算法流程图;
图4是本发明求解手部检测外接矩形的卷积神经网络示意图;
图5是本发明求解指尖检测和手势分类所使用的卷积神经网络示意图;
图6(a)-图6(d)是本发明优化后的卷积神经网络可视化示意图;
图7是本发明算法程序原型的连续多帧输出示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
本发明基于级联卷积深度卷积神经网络的第一视角空中手写和空中交互方法,如图3所示,包括如下步骤:
S1、获取训练数据,人工标记包含手部区域的外接矩形(前景区域)的左上角点和右下角点,人工标记指尖所在坐标,人工标记不同手势的类别;
S1.1通过摄像头处于人眼位置模拟第一视角(如图1(a)-图1(b)所示),采集大规模数据,覆盖不同的场景,包括多种不同的手势(如图2所示),其中一种必须是单指手势而且指尖可见;
S1.2人工标记包含手部区域的外接矩形左上角坐标和右下角坐标,人工标记手势类别,若手势为单指手势,人工标记指尖的位置;
S1.3按照键值对的方式,配对储存图像和对应的标签真实值;
所述步骤S1.1中,所采集的数据为第一视角的数据,画面包含手势。
在所述步骤S1.2中,所采集的数据是通过人工标价手部前景左上角坐标和右下角坐标,人工标记指尖坐标和人工标记手势类别来进行监督学习。
S2、设计一个深度卷积神经网络用于手部检测,该网络输入为第一视角下的单帧图像,输出为手部前景矩形的左上角坐标和右下角坐标,投入训练数据并优化欧氏范数损失函数,迭代直至参数稳定,如图4所示;
S2.1合理设计一个深度卷积神经网络,包括卷积层,池化层,全卷积层,使得网络输入为三通道RGB图像,输出为两个二维坐标(xtl,ytl)和(xbr,ybr);
S2.2应用损失函数为
E = 1 N Σ N ( p i - t i ) 2
其中pi代表预测的坐标值,ti代表训练样本中已经标注的坐标真实值,N代表输出坐标的个数,此处N为4,代表左上角和右下角坐标,对应的反向传播的残差为
εi=pi-ti(1≤i≤4)
S2.3、投入训练数据并应用梯度下降法优化目标函数。
S3、设计一个深度卷积神经网络用于手势识别和指尖检测,该网络输入为仅包含手部区域的前景矩形,输出为指尖坐标和手势类别,投入训练数据并优化一个分段损失函数(结合欧氏范数与交叉熵),迭代直至参数稳定,如图5所示;
S3.1合理设计一个深度卷积神经网络,包括卷积层,池化层,全卷积层,使得网络输入为三通道RGB图像(仅包含手部区域),输出为指尖的二维坐标(xft,yft)和手势分类(cgesture);
S3.2损失函数为
E = 1 N Σ N ( p i - t i ) 2 c g e s t u r e = c g r o u n d t r u t h
E=0cgesture≠cgr0undtruth
其中pi代表预测的坐标值,ti代表训练样本中已经标注的坐标真实值,N代表输出坐标的个数,此处N为2,代表指尖坐标。cgroundtruth代表手势类别真实值,cgesture代表网络输出的手势,对应的反向传播的残差为
εi=pi-ti
S3.3、投入训练数据并应用梯度下降法优化目标函数,优化后卷积神经网络可视化图如图6(a)-图6(d)所示。
S4、将一级网络和二级网络级联,通过一级网络输出的前景外接矩形切割出感兴趣区域(RegionofInterest,ROI)从而获得包含手部的前景区域,然后将前景区域作为第二级卷积网络的输入进行指尖检测和手势识别;
步骤S4中,利用两层卷积神经网络级联的方法,先进行手部检测,获取较小的前景区域,再进行指尖检测和手势识别。
S5判断手势类别,若为单指手势,则输出其指尖坐标并进行时序平滑和点间插值;
S5.1判断手势类别,若为单指,记录采样点坐标序列
S5.2进行一个滑动窗均值滤波(此处取步长为3的例子)
Pi=pi-1+pi+pi+1
步骤S5中,对每一帧图像先进行手势识别,若为单指手势,则输出指尖坐标。
S6利用连续多帧的指尖采样坐标进行文字识别,算法程序原型的连续多帧输出如图7所示;
步骤S6中,利用平滑的采样点进行文字识别。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.基于级联卷积神经网络的第一视角空中手写和空中交互方法,其特征在于,包括下述步骤:
S1、获取训练数据,人工标记包含手部区域的前景区域的左上角点和右下角点,人工标记指尖所在坐标,人工标记不同手势的类别;
S2、设计一个深度卷积神经网络用于手部检测,该神经网络输入为第一视角下的单帧图像,输出为手部前景矩形的左上角坐标和右下角坐标,投入训练数据并优化欧氏范数损失函数,迭代直至参数稳定;
S3、设计一个深度卷积神经网络用于手势识别和指尖检测,该神经网络输入为仅包含手部区域的前景矩形,输出为指尖坐标和手势类别,投入训练数据并优化一个分段损失函数,迭代直至参数稳定;
S4、将一级网络和二级网络级联,通过一级网络输出的前景外接矩形切割出感兴趣区域从而获得包含手部的前景区域,然后将前景区域作为第二级卷积网络的输入进行指尖检测和手势识别;
S5、判断手势类别,若为单指手势,则输出其指尖坐标并进行时序平滑和点间插值;
S6、利用连续多帧的指尖采样坐标进行文字识别。
2.根据权利要求1所述的基于级联卷积神经网络的第一视角空中手写和空中交互方法,其特征在于,步骤S1具体为:
S1.1、通过摄像头处于人眼位置模拟第一视角,采集大规模数据,覆盖不同的场景,包括多种不同的手势,其中一种必须是单指手势而且指尖可见;
S1.2、人工标记包含手部区域的外接矩形左上角坐标和右下角坐标,人工标记手势类别,若手势为单指手势,人工标记指尖的位置;
S1.3、按照键值对的方式,配对储存图像和对应的标签真实值。
3.根据权利要求2所述的基于级联卷积神经网络的第一视角空中手写和空中交互方法,其特征在于,在所述步骤S1.1中,所采集的数据为第一视角的数据,画面包含手势。
4.根据权利要求2所述的基于级联卷积神经网络的第一视角空中手写和空中交互方法,其特征在于,在所述步骤S1.2中,所采集的数据是通过人工标价手部前景左上角坐标和右下角坐标,人工标记指尖坐标和人工标记手势类别来进行监督学习。
5.根据权利要求1所述的基于级联卷积神经网络的第一视角空中手写和空中交互方法,其特征在于,步骤S2具体为:
S2.1、合理设计一个深度卷积神经网络,包括卷积层、池化层和全卷积层,使得网络输入为三通道RGB图像,输出为两个二维坐标(xtl,ytl)和(xbr,ybr),分别代表手部前景的左上角右下角;
S2.2、其应用损失函数为:
E = 1 N Σ N ( p i - t i ) 2
其中pi代表预测的坐标值,ti代表训练样本中已经标注的坐标真实值,N代表输出坐标的个数,此处N为4,代表左上角和右下角坐标,对应的反向传播的残差为
εi=pi-ti(1≤i≤4)
S2.3、投入训练数据并应用梯度下降法优化目标函数。
6.根据权利要求1所述的基于级联卷积神经网络的第一视角空中手写和空中交互方法,其特征在于,步骤S3具体为:
S3.1、合理设计一个深度卷积神经网络,包括卷积层,池化层,全卷积层,使得网络输入为三通道RGB图像,输出为指尖的二维坐标(xft,yft)和手势分类(cgesture);
S3.2、确定其损失函数,该损失函数表示为:
E = 1 N Σ N ( p i - t i ) 2 cgesture=cgroundtruth
E=0cgesture≠cgroundtruth
其中pi代表预测的坐标值,ti代表训练样本中已经标注的坐标真实值,N代表输出坐标的个数,此处N为2,cgroundtruth代表手势类别真实值,cgesture代表网络输出的手势,对应的反向传播的残差为:
εi=pi-ti
S3.3、投入训练数据并应用梯度下降法优化目标函数。
7.根据权利要求1所述的基于级联卷积神经网络的第一视角空中手写和空中交互方法,其特征在于,步骤S4中,利用两层卷积神经网络级联的方法,先进行手部检测,获取较小的前景区域,再进行指尖检测和手势识别。
8.根据权利要求1所述的基于级联卷积神经网络的第一视角空中手写和空中交互方法,其特征在于,步骤S5具体为:
S5.1、判断手势类别,若为单指,记录采样点坐标序列;
S5.2、进行一个滑动窗均值滤波;
pi=pi-1+pi+pi+1
9.根据权利要求8所述的基于级联卷积神经网络的第一视角空中手写和空中交互方法,其特征在于,步骤S5中,对每一帧图像先进行手势识别,若为单指手势,则输出指尖坐标。
10.根据权利要求1所述的基于级联卷积神经网络的第一视角空中手写和空中交互方法,其特征在于,步骤S6中,利用平滑的采样点进行文字识别。
CN201610033798.9A 2016-01-19 2016-01-19 基于级联卷积神经网络的第一视角空中手写和空中交互方法 Active CN105718878B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610033798.9A CN105718878B (zh) 2016-01-19 2016-01-19 基于级联卷积神经网络的第一视角空中手写和空中交互方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610033798.9A CN105718878B (zh) 2016-01-19 2016-01-19 基于级联卷积神经网络的第一视角空中手写和空中交互方法

Publications (2)

Publication Number Publication Date
CN105718878A true CN105718878A (zh) 2016-06-29
CN105718878B CN105718878B (zh) 2019-08-09

Family

ID=56147949

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610033798.9A Active CN105718878B (zh) 2016-01-19 2016-01-19 基于级联卷积神经网络的第一视角空中手写和空中交互方法

Country Status (1)

Country Link
CN (1) CN105718878B (zh)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106980365A (zh) * 2017-02-21 2017-07-25 华南理工大学 基于深度卷积神经网络框架的第一视角动态手势识别方法
CN107168527A (zh) * 2017-04-25 2017-09-15 华南理工大学 基于区域卷积神经网络的第一视角手势识别与交互方法
CN107220588A (zh) * 2017-04-20 2017-09-29 苏州神罗信息科技有限公司 一种基于级联深度神经网络的实时手势追踪方法
CN107239727A (zh) * 2016-12-07 2017-10-10 北京深鉴智能科技有限公司 手势识别方法和系统
CN107341436A (zh) * 2016-08-19 2017-11-10 北京市商汤科技开发有限公司 手势检测网络训练、手势检测及控制方法、系统及终端
CN107368182A (zh) * 2016-08-19 2017-11-21 北京市商汤科技开发有限公司 手势检测网络训练、手势检测、手势控制方法及装置
CN107563494A (zh) * 2017-08-01 2018-01-09 华南理工大学 一种基于卷积神经网络和热图的第一视角指尖检测方法
CN107977605A (zh) * 2017-11-08 2018-05-01 清华大学 基于深度学习的眼部区域边界特征提取方法及装置
CN108229277A (zh) * 2017-03-31 2018-06-29 北京市商汤科技开发有限公司 手势识别、控制及神经网络训练方法、装置及电子设备
CN108256431A (zh) * 2017-12-20 2018-07-06 中车工业研究院有限公司 一种手部位置标识方法及装置
CN108287617A (zh) * 2018-01-17 2018-07-17 阿里巴巴集团控股有限公司 一种签约方法和装置
CN108491066A (zh) * 2018-01-30 2018-09-04 歌尔科技有限公司 一种手势交互方法和装置
CN108764133A (zh) * 2018-05-25 2018-11-06 北京旷视科技有限公司 图像识别方法、装置及系统
CN109344793A (zh) * 2018-10-19 2019-02-15 北京百度网讯科技有限公司 用于识别空中手写的方法、装置、设备以及计算机可读存储介质
CN109344743A (zh) * 2018-09-14 2019-02-15 广州市浪搏科技有限公司 一种监控视频数据处理实现方法
CN109359514A (zh) * 2018-08-30 2019-02-19 浙江工业大学 一种面向deskVR的手势跟踪识别联合策略方法
CN109426776A (zh) * 2017-08-25 2019-03-05 微软技术许可有限责任公司 基于深度神经网络的对象检测
CN109784125A (zh) * 2017-11-10 2019-05-21 福州瑞芯微电子股份有限公司 深度学习网络处理装置、方法及图像处理单元
CN109858482A (zh) * 2019-01-16 2019-06-07 创新奇智(重庆)科技有限公司 一种图像关键区域检测方法及其系统、终端设备
CN110007748A (zh) * 2018-01-05 2019-07-12 广东欧珀移动通信有限公司 终端的控制方法、处理装置、存储介质及终端
CN110276415A (zh) * 2019-07-01 2019-09-24 山东浪潮人工智能研究院有限公司 一种基于深度学习的石油工业多相流流型识别方法
CN110443154A (zh) * 2019-07-15 2019-11-12 北京达佳互联信息技术有限公司 关键点的三维坐标定位方法、装置、电子设备和存储介质
CN110443231A (zh) * 2019-09-05 2019-11-12 湖南神通智能股份有限公司 一种基于人工智能的单手手指点读文字识别方法和系统
CN106960175B (zh) * 2017-02-21 2020-01-31 华南理工大学 基于深度卷积神经网络的第一视角动态手势检测方法
CN111104820A (zh) * 2018-10-25 2020-05-05 中车株洲电力机车研究所有限公司 一种基于深度学习的手势识别方法
CN111158467A (zh) * 2019-12-12 2020-05-15 青岛小鸟看看科技有限公司 一种手势交互方法和终端
CN111327608A (zh) * 2020-02-14 2020-06-23 中南大学 基于级联深度神经网络的应用层恶意请求检测方法及系统
CN111722700A (zh) * 2019-03-21 2020-09-29 Tcl集团股份有限公司 一种人机交互方法及人机交互设备
CN111860086A (zh) * 2019-06-26 2020-10-30 广州凡拓数字创意科技股份有限公司 基于深度神经网络的手势识别方法、装置及系统
CN112395993A (zh) * 2020-11-18 2021-02-23 珠海大横琴科技发展有限公司 基于监控视频数据的遮挡船只检测方法、装置及电子设备
CN112541501A (zh) * 2020-12-18 2021-03-23 北京中科研究院 一种基于视觉语言建模网络的场景文字识别方法
CN113253837A (zh) * 2021-04-01 2021-08-13 作业帮教育科技(北京)有限公司 空中书写方法、装置、线上直播系统和计算机设备
WO2023283934A1 (en) * 2021-07-16 2023-01-19 Huawei Technologies Co.,Ltd. Devices and methods for gesture-based selection

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030235332A1 (en) * 2002-06-20 2003-12-25 Moustafa Mohamed Nabil System and method for pose-angle estimation
CN104598915A (zh) * 2014-01-24 2015-05-06 深圳奥比中光科技有限公司 一种手势识别方法与装置
CN105205475A (zh) * 2015-10-20 2015-12-30 北京工业大学 一种动态手势识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030235332A1 (en) * 2002-06-20 2003-12-25 Moustafa Mohamed Nabil System and method for pose-angle estimation
CN104598915A (zh) * 2014-01-24 2015-05-06 深圳奥比中光科技有限公司 一种手势识别方法与装置
CN105205475A (zh) * 2015-10-20 2015-12-30 北京工业大学 一种动态手势识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
俞博: ""基于手指角度特征的手势识别技术研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341436A (zh) * 2016-08-19 2017-11-10 北京市商汤科技开发有限公司 手势检测网络训练、手势检测及控制方法、系统及终端
CN107368182A (zh) * 2016-08-19 2017-11-21 北京市商汤科技开发有限公司 手势检测网络训练、手势检测、手势控制方法及装置
CN107341436B (zh) * 2016-08-19 2019-02-22 北京市商汤科技开发有限公司 手势检测网络训练、手势检测及控制方法、系统及终端
CN107239727A (zh) * 2016-12-07 2017-10-10 北京深鉴智能科技有限公司 手势识别方法和系统
CN106980365A (zh) * 2017-02-21 2017-07-25 华南理工大学 基于深度卷积神经网络框架的第一视角动态手势识别方法
CN106960175B (zh) * 2017-02-21 2020-01-31 华南理工大学 基于深度卷积神经网络的第一视角动态手势检测方法
WO2018177379A1 (zh) * 2017-03-31 2018-10-04 北京市商汤科技开发有限公司 手势识别、控制及神经网络训练方法、装置及电子设备
CN108229277A (zh) * 2017-03-31 2018-06-29 北京市商汤科技开发有限公司 手势识别、控制及神经网络训练方法、装置及电子设备
US11170210B2 (en) 2017-03-31 2021-11-09 Beijing Sensetime Technology Development Co., Ltd. Gesture identification, control, and neural network training methods and apparatuses, and electronic devices
CN107220588A (zh) * 2017-04-20 2017-09-29 苏州神罗信息科技有限公司 一种基于级联深度神经网络的实时手势追踪方法
CN107168527A (zh) * 2017-04-25 2017-09-15 华南理工大学 基于区域卷积神经网络的第一视角手势识别与交互方法
CN107168527B (zh) * 2017-04-25 2019-10-18 华南理工大学 基于区域卷积神经网络的第一视角手势识别与交互方法
CN107563494A (zh) * 2017-08-01 2018-01-09 华南理工大学 一种基于卷积神经网络和热图的第一视角指尖检测方法
CN107563494B (zh) * 2017-08-01 2020-08-18 华南理工大学 一种基于卷积神经网络和热图的第一视角指尖检测方法
US11551027B2 (en) 2017-08-25 2023-01-10 Microsoft Technology Licensing, Llc Object detection based on a feature map of a convolutional neural network
CN109426776A (zh) * 2017-08-25 2019-03-05 微软技术许可有限责任公司 基于深度神经网络的对象检测
CN107977605A (zh) * 2017-11-08 2018-05-01 清华大学 基于深度学习的眼部区域边界特征提取方法及装置
CN109784125A (zh) * 2017-11-10 2019-05-21 福州瑞芯微电子股份有限公司 深度学习网络处理装置、方法及图像处理单元
CN108256431A (zh) * 2017-12-20 2018-07-06 中车工业研究院有限公司 一种手部位置标识方法及装置
CN110007748A (zh) * 2018-01-05 2019-07-12 广东欧珀移动通信有限公司 终端的控制方法、处理装置、存储介质及终端
CN108287617A (zh) * 2018-01-17 2018-07-17 阿里巴巴集团控股有限公司 一种签约方法和装置
CN108491066A (zh) * 2018-01-30 2018-09-04 歌尔科技有限公司 一种手势交互方法和装置
CN108764133A (zh) * 2018-05-25 2018-11-06 北京旷视科技有限公司 图像识别方法、装置及系统
CN108764133B (zh) * 2018-05-25 2020-10-20 北京旷视科技有限公司 图像识别方法、装置及系统
CN109359514B (zh) * 2018-08-30 2020-08-04 浙江工业大学 一种面向deskVR的手势跟踪识别联合策略方法
CN109359514A (zh) * 2018-08-30 2019-02-19 浙江工业大学 一种面向deskVR的手势跟踪识别联合策略方法
CN109344743A (zh) * 2018-09-14 2019-02-15 广州市浪搏科技有限公司 一种监控视频数据处理实现方法
CN109344743B (zh) * 2018-09-14 2023-07-25 广州市浪搏科技有限公司 一种监控视频数据处理实现方法
US11423700B2 (en) 2018-10-19 2022-08-23 Beijing Baidu Netcom Science And Technology Co., Ltd. Method, apparatus, device and computer readable storage medium for recognizing aerial handwriting
CN109344793B (zh) * 2018-10-19 2021-03-16 北京百度网讯科技有限公司 用于识别空中手写的方法、装置、设备以及计算机可读存储介质
CN109344793A (zh) * 2018-10-19 2019-02-15 北京百度网讯科技有限公司 用于识别空中手写的方法、装置、设备以及计算机可读存储介质
CN111104820A (zh) * 2018-10-25 2020-05-05 中车株洲电力机车研究所有限公司 一种基于深度学习的手势识别方法
CN109858482B (zh) * 2019-01-16 2020-04-14 创新奇智(重庆)科技有限公司 一种图像关键区域检测方法及其系统、终端设备
CN109858482A (zh) * 2019-01-16 2019-06-07 创新奇智(重庆)科技有限公司 一种图像关键区域检测方法及其系统、终端设备
CN111722700A (zh) * 2019-03-21 2020-09-29 Tcl集团股份有限公司 一种人机交互方法及人机交互设备
CN111860086A (zh) * 2019-06-26 2020-10-30 广州凡拓数字创意科技股份有限公司 基于深度神经网络的手势识别方法、装置及系统
CN110276415A (zh) * 2019-07-01 2019-09-24 山东浪潮人工智能研究院有限公司 一种基于深度学习的石油工业多相流流型识别方法
CN110443154B (zh) * 2019-07-15 2022-06-03 北京达佳互联信息技术有限公司 关键点的三维坐标定位方法、装置、电子设备和存储介质
CN110443154A (zh) * 2019-07-15 2019-11-12 北京达佳互联信息技术有限公司 关键点的三维坐标定位方法、装置、电子设备和存储介质
CN110443231A (zh) * 2019-09-05 2019-11-12 湖南神通智能股份有限公司 一种基于人工智能的单手手指点读文字识别方法和系统
CN111158467A (zh) * 2019-12-12 2020-05-15 青岛小鸟看看科技有限公司 一种手势交互方法和终端
CN111327608A (zh) * 2020-02-14 2020-06-23 中南大学 基于级联深度神经网络的应用层恶意请求检测方法及系统
CN112395993A (zh) * 2020-11-18 2021-02-23 珠海大横琴科技发展有限公司 基于监控视频数据的遮挡船只检测方法、装置及电子设备
CN112541501A (zh) * 2020-12-18 2021-03-23 北京中科研究院 一种基于视觉语言建模网络的场景文字识别方法
CN113253837A (zh) * 2021-04-01 2021-08-13 作业帮教育科技(北京)有限公司 空中书写方法、装置、线上直播系统和计算机设备
WO2023283934A1 (en) * 2021-07-16 2023-01-19 Huawei Technologies Co.,Ltd. Devices and methods for gesture-based selection

Also Published As

Publication number Publication date
CN105718878B (zh) 2019-08-09

Similar Documents

Publication Publication Date Title
CN105718878B (zh) 基于级联卷积神经网络的第一视角空中手写和空中交互方法
CN107168527B (zh) 基于区域卷积神经网络的第一视角手势识别与交互方法
CN107808143B (zh) 基于计算机视觉的动态手势识别方法
CN107563494B (zh) 一种基于卷积神经网络和热图的第一视角指尖检测方法
CN106598227B (zh) 基于Leap Motion和Kinect的手势识别方法
US10372226B2 (en) Visual language for human computer interfaces
CN105718879A (zh) 基于深度卷积神经网络的自由场景第一视角手指关键点检测方法
CN103226388B (zh) 一种基于Kinect的手写方法
Nai et al. Fast hand posture classification using depth features extracted from random line segments
CN104202547B (zh) 投影画面中提取目标物体的方法、投影互动方法及其系统
Prisacariu et al. 3D hand tracking for human computer interaction
CN104331164B (zh) 一种基于手势识别的相似度阈值分析的手势运动平滑处理方法
CN107357427A (zh) 一种用于虚拟现实设备的手势识别控制方法
CN102332095A (zh) 一种人脸运动跟踪方法和系统以及一种增强现实方法
CN108388882A (zh) 基于全局-局部rgb-d多模态的手势识别方法
CN103383731A (zh) 一种基于指尖定位的投影交互方法、系统及计算设备
CN105068748A (zh) 触屏智能设备的摄像头实时画面中用户界面交互方法
Jalab et al. Human computer interface using hand gesture recognition based on neural network
CN103336967B (zh) 一种手部运动轨迹检测方法及装置
CN104484040B (zh) 一种多媒体互动教学控制系统及教学控制方法
CN111967533B (zh) 一种基于场景识别的草图图像翻译方法
CN110796018A (zh) 一种基于深度图像和彩色图像的手部运动识别方法
CN105929962A (zh) 一种360°全息实时交互方法
CN107067031A (zh) 一种基于Wi‑Fi信号的书法姿态自动识别方法
CN108983968A (zh) 一种基于虚拟现实的图像大数据交互控制系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant