CN105718879A - 基于深度卷积神经网络的自由场景第一视角手指关键点检测方法 - Google Patents

基于深度卷积神经网络的自由场景第一视角手指关键点检测方法 Download PDF

Info

Publication number
CN105718879A
CN105718879A CN201610033819.7A CN201610033819A CN105718879A CN 105718879 A CN105718879 A CN 105718879A CN 201610033819 A CN201610033819 A CN 201610033819A CN 105718879 A CN105718879 A CN 105718879A
Authority
CN
China
Prior art keywords
finger
degree
coordinate
neural networks
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610033819.7A
Other languages
English (en)
Inventor
金连文
黄毅超
刘孝睿
张鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201610033819.7A priority Critical patent/CN105718879A/zh
Publication of CN105718879A publication Critical patent/CN105718879A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度卷积神经网络的自由场景第一视角手指关键点检测方法,包括下述步骤:S1、获取训练数据,通过合适的定位技术获取得到包含手部的区域,人工标记手指关键点所在的坐标,所述手指关键点包括指尖和手指关节点;S2、设计一个深度卷积神经网络,利用该深度卷积网络求解点坐标回归问题;S3、通过大量标记样本训练该深度卷积神经网络的权重参数,经过一定迭代到达稳定后,获得多层的卷积核参数;S4、以任意前景图片作为输入,经过网络参数的计算后准确得到手指关键点坐标。本发明提供了一种准确度高、鲁棒性好的第一视角手指关键点检测方法。

Description

基于深度卷积神经网络的自由场景第一视角手指关键点检测方法
技术领域
本发明涉及计算机视觉以及机器学习的研究领域,特别涉及一种基于深度卷积神经网络的自由场景第一视角手指关键点检测方法。
背景技术
近年来,随着智能眼镜的兴起,第一视角(EgocentricVision)手势交互技术受到学术界和工业界的广泛关注,尤其是GoogleGlass、MicrosoftHololens等智能可穿戴式设备以及Oculus等虚拟现实设备的出现使得传统的人机交互方式难以适用,急需一种算法来帮助设备理解人的交互需要,如手势操作等。手势交互技术主要涉及两个方面,手势识别和关键点定位,本发明着眼于关键点定位,即指尖检测定位和指关节检测定位。在过去的几十年中,基于计算机视觉的手部建模方法主要有基于肤色、轮廓、运动的方法。然而基于肤色的方法对背景和光线有较高的要求,基于轮廓的方法在手势发生形变的情况下效果非常不好,基于运动的方法要求背景变化不能有太大变化。总而言之,这些传统方法各自都有较大的局限性,一般都要求在特定的简单背景下才能达到较好的效果。在背景复杂多变、光照变化、手势变化、手势快速移动、摄像头移动、图像模糊等各种各样的非约束条件下,传统的手部建模方法效果很差。另外还有基于红外信息或者深度信息的RGB-D手部建模算法,然而这些技术都需要特殊而昂贵的设备,最有大规模应用前景的还是基于普通摄像头所采集的RGB图像信息的技术。
传统方法中人工定义的特征大多都有比较大的局限性,而近来兴起的深度学习技术正好可以解决这个特征提取问题。深度学习技术中比较适合处理视觉信息的主要是深度卷积神经网络(CNN),它是一种监督学习的方法,需要训练样本及其标记,通过反向传播算法,训练出一个能够提取图像浅层特征并逐层将浅层特征通过非线性变换抽象成高级特征的网络。CNN方法在各种视觉识别任务如人脸关键点检测、行人检测等任务中均表现出非常好的效果。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于深度卷积神经网络的自由场景第一视角手指关键点检测方法,解决静态图像中手指关键点检测问题,进而应用到视频流中的手指关键点识别和跟踪。。
为了达到上述目的,本发明采用以下技术方案:
本发明基于深度卷积神经网络的自由场景第一视角手指关键点检测方法,包括下述步骤:
S1、获取训练数据,通过定位技术获取得到包含手部的区域,人工标记手指关键点所在的坐标,所述手指关键点包括指尖和手指关节点;
S2、设计一个深度卷积神经网络,利用该深度卷积网络求解点坐标回归问题,其目标函数为四维向量输出和四维向量真实值之差的欧氏范数,并利用定义进行误差反向传播和梯度下降对目标函数进行优化;
S3、通过大量标记样本训练该深度卷积神经网络的权重参数,经过迭代到达稳定后,获得多层的卷积核参数;
S4、以任意前景图片作为输入,经过网络参数的计算后得到准确的手指关键点坐标。
作为优选的技术方案,步骤S1具体为:
S1.1、采集大量实际场景样本,以摄像头处于眼镜处作为第一视角模拟,进行大量录像并使得录像的每一帧包含手势姿态,数据样本需要覆盖不同场景、光照、姿势;然后,切割出包含手部区域的矩形前景图像;
S1.2、人工标记手指关键点所在位置的笛卡尔坐标,并根据图片的原始长宽进行归一化存储,即在一个长宽为(w,h)的矩形图像,手指关键点坐标为(a,b),则归一化坐标为(a/w,b/h);
S1.3、转化为一种键值对的数据存储格式,使得图片与坐标配对存储。
作为优选的技术方案,步骤S1.1和S1.2中,
所述手势姿态为单指手势姿态,手指关键点坐标经过人工标记后,第一视角的画面可见指尖和指关节。
作为优选的技术方案,所述键值对的数据存储格式包括LevelDB或LMDB的数据格式。
作为优选的技术方案,步骤S2具体为:
S2.1、设计一个深度卷积神经网络,该深度卷积神经网络包括卷积层、池化层和全卷积层,使得该深度卷积神经网络输入为三通道RGB图像,输出为二维坐标(x,y);
S2.2、确定其应用损失函数,应用损失函数用下述公式表示:
E = 1 N Σ N ( p i - t i ) 2
其中pi代表预测的坐标值,ti代表训练样本中已经标注的坐标真实值,N代表输出的手指关键点坐标的个数;
S2.3通过损失函数求解其梯度,求得反向传播的残差εi为:
εi=pi-ti;其中1≤i≤4。
作为优选的技术方案,步骤S3中还包括下述步骤:
训练该深度卷积神经网络能够提取不同层级的低层特征和高层特征。
作为优选的技术方案,步骤S4中;
所述深度卷积神经网络所输出的四个值对应为单指姿态下的指尖二维归一化坐标(x,y)以及指关节二维归一化坐标(x,y)。
作为优选的技术方案,步骤S4具体为:
S4.1、合理预处理后的前景图片输入到网络,进行一次前向传播,若一次前向传播记为函数F,则有
(x1,y1,x2,y2)=F(ImageRGB)
S4.2、最终输入为四个浮点值,代表预测的指尖关键点坐标(x1,y1)和手指关节关键点(x2,y2),去归一化后可以得到手指关键点的真实坐标并进行可视化。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明采用人工标记指尖坐标的方式,达到了为后续利用深度卷积神经网络进行监督学习提供了良好的训练样本的效果;
2、本发明采用归一化坐标结合图像文件名称进行键值对数据格式的储存,达到了训练数据尺寸的可变性;
3、本发明采用欧氏范数作为损失函数进行优化的方式,达到了利用深度卷积神经网络进行回归问题求解的效果;
4、本发明采用深度神经网络作为求解回归问题的算法,达到了提取多个层次多个维度的丰富的图像特征的优点
附图说明
图1(a)-图1(b)是本发明体验者佩戴智能眼镜的第一视角示意图;
图2是本发明的第一视角采集的样本示意;
图3是本发明的已经完成人工标注的样本;
图4是本发明的手指关键点检测定位算法流程图;
图5是本发明的求解点坐标回归问题所使用的深度卷积神经网络示意图;
图6(a)-图6(b)是本发明的卷积神经网络可视化特征图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
如图4所示,基于深度卷积神经网络的自由场景第一视角的手指关键点检测方法,包括如下步骤:
S1、获取训练数据,假设已经通过合适的定位技术获取得到包含手部的区域(前景区域),人工标记手指关键点所在的坐标,包括指尖和手指关节点;
S1.1采集大量实际场景样本,以摄像头处于眼镜处作为第一视角模拟(如图1(a)-图1(b)所示),进行大量录像并使得录像的每一帧手势姿态,数据样本需要覆盖不同场景,光照,姿势。然后,切割出包含手部区域的矩形前景图像;
步骤S1.1中,所述手势姿态为单指手势姿态,坐标经过人工标记,第一视角的画面可见指尖和指关节,如图2、图3所示。
S1.2人工标记手指关键点所在位置的笛卡尔坐标,并根据图片的原始长宽进行归一化存储,即在一个长宽为(w,h)的矩形图像,手指关键点坐标为(a,b),则归一化坐标为(a/w,b/h);
S1.3转化为一种合适的数据存储格式,使得图片与坐标配对存储;
S2、设计一个深度卷积神经网络(ConvolutionalNeuralNetwork,CNN),利用该卷积网络求解点坐标回归问题,其目标函数为四维向量输出和四维向量真实值之差的欧氏范数,并利用定义进行误差反向传播和梯度下降从而优化目标函数,如图5所示;
S2.1合理设计一个深度卷积神经网络,包括卷积层,池化层,全卷积层,使得网络输入为三通道RGB图像,输出为二维坐标(x,y);
S2.2应用损失函数为
E = 1 N Σ N ( p i - t i ) 2
其中pi代表预测的坐标值,ti代表训练样本中已经标注的坐标真实值,N代表输出坐标的个数,此处N为4,代表手指关键点(指尖和手指关节)的坐标
S2.3通过损失函数求解其梯度,可求得反向传播的残差为:
εi=pi-ti(1≤i≤4)
S3、通过大量标记样本训练该深度卷积网络的权重参数,经过一定迭代到达稳定后,获得多层的卷积核参数;
上述步骤S3中,训练该深度卷积神经网络够提取不同层级的低层特征和高层特征,如图6(a)-图6(b)所示。
S4、任意前景图片作为输入,经过网络参数的计算后可以准确得到手指关键点坐标。
S4.1、合理预处理后的前景图片输入到网络,进行一次前向传播,若一次前向传播记为函数F,则有
(x1,y1,x2,y2)=F(ImageRGB);
S4.2、最终输入为四个浮点值,代表预测的指尖关键点坐标(x1,y1)和手指关节关键点(x2,y2),去归一化后可以得到手指关键点的真实坐标并进行可视化。
上述实施例可以作为本发明的较佳实施方式,但本发明的实施方式并不受所述实施例的限制,其他任何在未背离本发明精神实质与原理下所做的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (8)

1.基于深度卷积神经网络的自由场景第一视角手指关键点检测方法,其特征在于,包括下述步骤:
S1、获取训练数据,通过定位技术获取得到包含手部的区域,人工标记手指关键点所在的坐标,所述手指关键点包括指尖和手指关节点;
S2、设计一个深度卷积神经网络,利用该深度卷积网络求解点坐标回归问题,其目标函数为四维向量输出和四维向量真实值之差的欧氏范数,并利用定义进行误差反向传播和梯度下降对目标函数进行优化;
S3、通过大量标记样本训练该深度卷积神经网络的权重参数,经过迭代到达稳定后,获得多层的卷积核参数;
S4、以任意前景图片作为输入,经过网络参数的计算后得到准确的手指关键点坐标。
2.根据权利要求1所述的基于深度卷积神经网络的自由场景第一视角手指关键点检测方法,其特征在于,步骤S1具体为:
S1.1、采集大量实际场景样本,以摄像头处于眼镜处作为第一视角模拟,进行大量录像并使得录像的每一帧包含手势姿态,数据样本需要覆盖不同场景、光照、姿势;然后,切割出包含手部区域的矩形前景图像;
S1.2、人工标记手指关键点所在位置的笛卡尔坐标,并根据图片的原始长宽进行归一化存储,即在一个长宽为(w,h)的矩形图像,手指关键点坐标为(a,b),则归一化坐标为(a/w,b/h);
S1.3、转化为一种键值对的数据存储格式,使得图片与坐标配对存储。
3.根据权利要求2所述的基于深度卷积神经网络的自由场景第一视角手指关键点检测方法,其特征在于,步骤S1.1和S1.2中,
所述手势姿态为单指手势姿态,手指关键点坐标经过人工标记后,第一视角的画面可见指尖和指关节。
4.根据权利要求2所述的基于深度卷积神经网络的自由场景第一视角手指关键点检测方法,其特征在于,步骤S1.3中,所述键值对的数据存储格式包括LevelDB或LMDB的数据格式。
5.根据权利要求1所述的基于深度卷积神经网络的自由场景第一视角手指关键点检测方法,其特征在于,步骤S2具体为:
S2.1、设计一个深度卷积神经网络,该深度卷积神经网络包括卷积层、池化层和全卷积层,使得该深度卷积神经网络输入为三通道RGB图像,输出为二维坐标(x,y);
S2.2、确定其应用损失函数,应用损失函数用下述公式表示:
E = 1 N Σ N ( p i - t i ) 2
其中pi代表预测的坐标值,ti代表训练样本中已经标注的坐标真实值,N代表输出的手指关键点坐标的个数;
S2.3通过损失函数求解其梯度,求得反向传播的残差εi为:
εi=pi-ti;其中1≤i≤4。
6.根据权利要求1所述的基于深度卷积神经网络的自由场景第一视角手指关键点检测方法,其特征在于,步骤S3中还包括下述步骤:
训练该深度卷积神经网络能够提取不同层级的低层特征和高层特征。
7.根据权利要求1所述的基于深度卷积神经网络的自由场景第一视角手指关键点检测方法,其特征在于,步骤S4中;
所述深度卷积神经网络所输出的四个值对应为单指姿态下的指尖二维归一化坐标(x,y)以及指关节二维归一化坐标(x,y)。
8.根据权利要求1所述的基于深度卷积神经网络的自由场景第一视角手指关键点检测方法,其特征在于,步骤S4具体为:
S4.1、合理预处理后的前景图片输入到网络,进行一次前向传播,若一次前向传播记为函数F,则有
(x1,y1,x2,y2)=F(ImageRGB)
S4.2、最终输入为四个浮点值,代表预测的指尖关键点坐标(x1,y1)和手指关节关键点(x2,y2),去归一化后可以得到手指关键点的真实坐标并进行可视化。
CN201610033819.7A 2016-01-19 2016-01-19 基于深度卷积神经网络的自由场景第一视角手指关键点检测方法 Pending CN105718879A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610033819.7A CN105718879A (zh) 2016-01-19 2016-01-19 基于深度卷积神经网络的自由场景第一视角手指关键点检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610033819.7A CN105718879A (zh) 2016-01-19 2016-01-19 基于深度卷积神经网络的自由场景第一视角手指关键点检测方法

Publications (1)

Publication Number Publication Date
CN105718879A true CN105718879A (zh) 2016-06-29

Family

ID=56147792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610033819.7A Pending CN105718879A (zh) 2016-01-19 2016-01-19 基于深度卷积神经网络的自由场景第一视角手指关键点检测方法

Country Status (1)

Country Link
CN (1) CN105718879A (zh)

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570485A (zh) * 2016-11-09 2017-04-19 北京航空航天大学 一种基于深度学习的筏式养殖遥感图像场景标注方法
CN106780543A (zh) * 2017-01-13 2017-05-31 深圳市唯特视科技有限公司 一种基于卷积神经网络的双框架估计深度和运动方法
CN106874914A (zh) * 2017-01-12 2017-06-20 华南理工大学 一种基于深度卷积神经网络的工业机械臂视觉控制方法
CN106897667A (zh) * 2017-01-17 2017-06-27 桂林电子科技大学 一种人脸检索方法和系统
CN106951089A (zh) * 2017-03-28 2017-07-14 深圳市石代科技有限公司 手势交互方法及系统
CN106960036A (zh) * 2017-03-09 2017-07-18 杭州电子科技大学 一种用于手势识别的数据库建立方法
CN106980365A (zh) * 2017-02-21 2017-07-25 华南理工大学 基于深度卷积神经网络框架的第一视角动态手势识别方法
CN107239728A (zh) * 2017-01-04 2017-10-10 北京深鉴智能科技有限公司 基于深度学习姿态估计的无人机交互装置与方法
CN107291232A (zh) * 2017-06-20 2017-10-24 深圳市泽科科技有限公司 一种基于深度学习与大数据的体感游戏交互方法及系统
CN107358215A (zh) * 2017-07-20 2017-11-17 重庆工商大学 一种应用于手饰增强现实系统的图像处理方法
CN107563494A (zh) * 2017-08-01 2018-01-09 华南理工大学 一种基于卷积神经网络和热图的第一视角指尖检测方法
CN108073851A (zh) * 2016-11-08 2018-05-25 株式会社理光 一种抓取手势识别的方法、装置及电子设备
CN108229488A (zh) * 2016-12-27 2018-06-29 北京市商汤科技开发有限公司 用于检测物体关键点的方法、装置及电子设备
CN108227912A (zh) * 2017-11-30 2018-06-29 北京市商汤科技开发有限公司 设备控制方法和装置、电子设备、计算机存储介质
CN108229493A (zh) * 2017-04-10 2018-06-29 商汤集团有限公司 对象验证方法、装置和电子设备
CN108229489A (zh) * 2016-12-30 2018-06-29 北京市商汤科技开发有限公司 关键点预测、网络训练、图像处理方法、装置及电子设备
CN108256431A (zh) * 2017-12-20 2018-07-06 中车工业研究院有限公司 一种手部位置标识方法及装置
CN108960178A (zh) * 2018-07-13 2018-12-07 清华大学 一种人手姿态估计方法及系统
CN108985148A (zh) * 2018-05-31 2018-12-11 成都通甲优博科技有限责任公司 一种手部关键点检测方法及装置
CN109063653A (zh) * 2018-08-07 2018-12-21 北京字节跳动网络技术有限公司 图像处理方法和装置
CN109101983A (zh) * 2018-08-02 2018-12-28 大连恒锐科技股份有限公司 一种基于深度学习的鞋样及足迹关键点检测方法
CN109190575A (zh) * 2018-09-13 2019-01-11 深圳增强现实技术有限公司 装配场景识别方法、系统及电子设备
CN109308459A (zh) * 2018-09-05 2019-02-05 南京大学 基于手指注意力模型和关键点拓扑模型的手势估计方法
CN109544536A (zh) * 2018-11-26 2019-03-29 中国科学技术大学 髋关节x光图像快速自动分析方法
CN109635630A (zh) * 2018-10-23 2019-04-16 百度在线网络技术(北京)有限公司 手部关节点检测方法、装置及存储介质
CN110443205A (zh) * 2019-08-07 2019-11-12 北京华捷艾米科技有限公司 一种手部图像分割方法及装置
CN110478911A (zh) * 2019-08-13 2019-11-22 苏州钛智智能科技有限公司 基于机器学习的智能游戏车无人驾驶方法及智能车、设备
CN110688894A (zh) * 2019-08-22 2020-01-14 平安科技(深圳)有限公司 一种手掌关键点提取方法和装置
CN106960175B (zh) * 2017-02-21 2020-01-31 华南理工大学 基于深度卷积神经网络的第一视角动态手势检测方法
CN110807410A (zh) * 2019-10-30 2020-02-18 北京百度网讯科技有限公司 关键点定位方法、装置、电子设备和存储介质
CN111768251A (zh) * 2020-09-03 2020-10-13 北京悠易网际科技发展有限公司 一种基于流量信息评估的广告投放方法、装置及电子设备
CN112101312A (zh) * 2020-11-16 2020-12-18 深圳市优必选科技股份有限公司 手部关键点的识别方法、装置、机器人和存储介质
CN112286343A (zh) * 2020-09-16 2021-01-29 青岛小鸟看看科技有限公司 定位追踪方法、平台及头戴显示系统
CN112347896A (zh) * 2020-11-02 2021-02-09 东软睿驰汽车技术(沈阳)有限公司 基于多任务神经网络的头部数据处理方法及装置
CN112927290A (zh) * 2021-02-18 2021-06-08 青岛小鸟看看科技有限公司 基于传感器的裸手数据标注方法及系统
CN113065458A (zh) * 2021-03-29 2021-07-02 新疆爱华盈通信息技术有限公司 基于手势识别的投票方法与系统、电子设备
CN113239875A (zh) * 2021-06-01 2021-08-10 恒睿(重庆)人工智能技术研究院有限公司 人脸特征的获取方法、系统、装置及计算机可读存储介质
CN113408433A (zh) * 2021-06-22 2021-09-17 华侨大学 一种智能监控的手势识别方法、装置、设备和存储介质
CN113642551A (zh) * 2020-04-27 2021-11-12 北京达佳互联信息技术有限公司 指甲关键点检测方法、装置、电子设备及存储介质
CN114240800A (zh) * 2021-12-22 2022-03-25 清华大学 面向散射场景的编码摄像图像增强方法及装置
WO2022117096A1 (zh) * 2020-12-03 2022-06-09 影石创新科技股份有限公司 第一人称视角图像识别方法、装置及计算机可读存储介质
CN113312973B (zh) * 2021-04-25 2023-06-02 北京信息科技大学 一种手势识别关键点特征提取方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030235332A1 (en) * 2002-06-20 2003-12-25 Moustafa Mohamed Nabil System and method for pose-angle estimation
CN105069413A (zh) * 2015-07-27 2015-11-18 电子科技大学 一种基于深度卷积神经网络的人体姿势识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030235332A1 (en) * 2002-06-20 2003-12-25 Moustafa Mohamed Nabil System and method for pose-angle estimation
CN105069413A (zh) * 2015-07-27 2015-11-18 电子科技大学 一种基于深度卷积神经网络的人体姿势识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
俞博: ""基于手指角度特征的手势识别技术研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
张毅: ""静态手势识别的神经网络方法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108073851B (zh) * 2016-11-08 2021-12-28 株式会社理光 一种抓取手势识别的方法、装置及电子设备
CN108073851A (zh) * 2016-11-08 2018-05-25 株式会社理光 一种抓取手势识别的方法、装置及电子设备
CN106570485B (zh) * 2016-11-09 2019-04-16 北京航空航天大学 一种基于深度学习的筏式养殖遥感图像场景标注方法
CN106570485A (zh) * 2016-11-09 2017-04-19 北京航空航天大学 一种基于深度学习的筏式养殖遥感图像场景标注方法
US10885365B2 (en) 2016-12-27 2021-01-05 Beijing Sensetime Technology Development Co., Ltd Method and apparatus for detecting object keypoint, and electronic device
CN108229488B (zh) * 2016-12-27 2021-01-01 北京市商汤科技开发有限公司 用于检测物体关键点的方法、装置及电子设备
WO2018121567A1 (zh) * 2016-12-27 2018-07-05 北京市商汤科技开发有限公司 用于检测物体关键点的方法、装置及电子设备
CN108229488A (zh) * 2016-12-27 2018-06-29 北京市商汤科技开发有限公司 用于检测物体关键点的方法、装置及电子设备
CN108229489B (zh) * 2016-12-30 2020-08-11 北京市商汤科技开发有限公司 关键点预测、网络训练、图像处理方法、装置及电子设备
CN108229489A (zh) * 2016-12-30 2018-06-29 北京市商汤科技开发有限公司 关键点预测、网络训练、图像处理方法、装置及电子设备
CN107239728A (zh) * 2017-01-04 2017-10-10 北京深鉴智能科技有限公司 基于深度学习姿态估计的无人机交互装置与方法
CN106874914B (zh) * 2017-01-12 2019-05-14 华南理工大学 一种基于深度卷积神经网络的工业机械臂视觉控制方法
CN106874914A (zh) * 2017-01-12 2017-06-20 华南理工大学 一种基于深度卷积神经网络的工业机械臂视觉控制方法
CN106780543A (zh) * 2017-01-13 2017-05-31 深圳市唯特视科技有限公司 一种基于卷积神经网络的双框架估计深度和运动方法
CN106897667A (zh) * 2017-01-17 2017-06-27 桂林电子科技大学 一种人脸检索方法和系统
CN106980365A (zh) * 2017-02-21 2017-07-25 华南理工大学 基于深度卷积神经网络框架的第一视角动态手势识别方法
CN106960175B (zh) * 2017-02-21 2020-01-31 华南理工大学 基于深度卷积神经网络的第一视角动态手势检测方法
CN106960036A (zh) * 2017-03-09 2017-07-18 杭州电子科技大学 一种用于手势识别的数据库建立方法
CN106951089A (zh) * 2017-03-28 2017-07-14 深圳市石代科技有限公司 手势交互方法及系统
CN108229493A (zh) * 2017-04-10 2018-06-29 商汤集团有限公司 对象验证方法、装置和电子设备
CN107291232A (zh) * 2017-06-20 2017-10-24 深圳市泽科科技有限公司 一种基于深度学习与大数据的体感游戏交互方法及系统
CN107358215B (zh) * 2017-07-20 2020-10-09 重庆工商大学 一种应用于手饰增强现实系统的图像处理方法
CN107358215A (zh) * 2017-07-20 2017-11-17 重庆工商大学 一种应用于手饰增强现实系统的图像处理方法
CN107563494A (zh) * 2017-08-01 2018-01-09 华南理工大学 一种基于卷积神经网络和热图的第一视角指尖检测方法
CN108227912A (zh) * 2017-11-30 2018-06-29 北京市商汤科技开发有限公司 设备控制方法和装置、电子设备、计算机存储介质
CN108256431A (zh) * 2017-12-20 2018-07-06 中车工业研究院有限公司 一种手部位置标识方法及装置
CN108985148A (zh) * 2018-05-31 2018-12-11 成都通甲优博科技有限责任公司 一种手部关键点检测方法及装置
CN108985148B (zh) * 2018-05-31 2022-05-03 成都通甲优博科技有限责任公司 一种手部关键点检测方法及装置
CN108960178A (zh) * 2018-07-13 2018-12-07 清华大学 一种人手姿态估计方法及系统
CN109101983A (zh) * 2018-08-02 2018-12-28 大连恒锐科技股份有限公司 一种基于深度学习的鞋样及足迹关键点检测方法
CN109101983B (zh) * 2018-08-02 2020-10-30 大连恒锐科技股份有限公司 一种基于深度学习的鞋样及足迹关键点检测方法
CN109063653A (zh) * 2018-08-07 2018-12-21 北京字节跳动网络技术有限公司 图像处理方法和装置
WO2020029466A1 (zh) * 2018-08-07 2020-02-13 北京字节跳动网络技术有限公司 图像处理方法和装置
CN109308459B (zh) * 2018-09-05 2022-06-24 南京大学 基于手指注意力模型和关键点拓扑模型的手势估计方法
CN109308459A (zh) * 2018-09-05 2019-02-05 南京大学 基于手指注意力模型和关键点拓扑模型的手势估计方法
CN109190575A (zh) * 2018-09-13 2019-01-11 深圳增强现实技术有限公司 装配场景识别方法、系统及电子设备
CN109635630B (zh) * 2018-10-23 2023-09-01 百度在线网络技术(北京)有限公司 手部关节点检测方法、装置及存储介质
CN109635630A (zh) * 2018-10-23 2019-04-16 百度在线网络技术(北京)有限公司 手部关节点检测方法、装置及存储介质
CN109544536A (zh) * 2018-11-26 2019-03-29 中国科学技术大学 髋关节x光图像快速自动分析方法
CN110443205B (zh) * 2019-08-07 2022-09-13 北京华捷艾米科技有限公司 一种手部图像分割方法及装置
CN110443205A (zh) * 2019-08-07 2019-11-12 北京华捷艾米科技有限公司 一种手部图像分割方法及装置
CN110478911A (zh) * 2019-08-13 2019-11-22 苏州钛智智能科技有限公司 基于机器学习的智能游戏车无人驾驶方法及智能车、设备
CN110688894B (zh) * 2019-08-22 2024-05-10 平安科技(深圳)有限公司 一种手掌关键点提取方法和装置
CN110688894A (zh) * 2019-08-22 2020-01-14 平安科技(深圳)有限公司 一种手掌关键点提取方法和装置
CN110807410B (zh) * 2019-10-30 2022-09-06 北京百度网讯科技有限公司 关键点定位方法、装置、电子设备和存储介质
CN110807410A (zh) * 2019-10-30 2020-02-18 北京百度网讯科技有限公司 关键点定位方法、装置、电子设备和存储介质
CN113642551A (zh) * 2020-04-27 2021-11-12 北京达佳互联信息技术有限公司 指甲关键点检测方法、装置、电子设备及存储介质
CN111768251A (zh) * 2020-09-03 2020-10-13 北京悠易网际科技发展有限公司 一种基于流量信息评估的广告投放方法、装置及电子设备
CN112286343A (zh) * 2020-09-16 2021-01-29 青岛小鸟看看科技有限公司 定位追踪方法、平台及头戴显示系统
US11625841B2 (en) 2020-09-16 2023-04-11 Qingdao Pico Technology Co., Ltd. Localization and tracking method and platform, head-mounted display system, and computer-readable storage medium
CN112347896A (zh) * 2020-11-02 2021-02-09 东软睿驰汽车技术(沈阳)有限公司 基于多任务神经网络的头部数据处理方法及装置
CN112101312A (zh) * 2020-11-16 2020-12-18 深圳市优必选科技股份有限公司 手部关键点的识别方法、装置、机器人和存储介质
WO2022117096A1 (zh) * 2020-12-03 2022-06-09 影石创新科技股份有限公司 第一人称视角图像识别方法、装置及计算机可读存储介质
CN112927290A (zh) * 2021-02-18 2021-06-08 青岛小鸟看看科技有限公司 基于传感器的裸手数据标注方法及系统
CN113065458B (zh) * 2021-03-29 2024-05-28 芯算一体(深圳)科技有限公司 基于手势识别的投票方法与系统、电子设备
CN113065458A (zh) * 2021-03-29 2021-07-02 新疆爱华盈通信息技术有限公司 基于手势识别的投票方法与系统、电子设备
CN113312973B (zh) * 2021-04-25 2023-06-02 北京信息科技大学 一种手势识别关键点特征提取方法及系统
CN113239875A (zh) * 2021-06-01 2021-08-10 恒睿(重庆)人工智能技术研究院有限公司 人脸特征的获取方法、系统、装置及计算机可读存储介质
CN113239875B (zh) * 2021-06-01 2023-10-17 恒睿(重庆)人工智能技术研究院有限公司 人脸特征的获取方法、系统、装置及计算机可读存储介质
CN113408433B (zh) * 2021-06-22 2023-12-05 华侨大学 一种智能监控的手势识别方法、装置、设备和存储介质
CN113408433A (zh) * 2021-06-22 2021-09-17 华侨大学 一种智能监控的手势识别方法、装置、设备和存储介质
CN114240800A (zh) * 2021-12-22 2022-03-25 清华大学 面向散射场景的编码摄像图像增强方法及装置

Similar Documents

Publication Publication Date Title
CN105718879A (zh) 基于深度卷积神经网络的自由场景第一视角手指关键点检测方法
CN105718878B (zh) 基于级联卷积神经网络的第一视角空中手写和空中交互方法
Zimmermann et al. Freihand: A dataset for markerless capture of hand pose and shape from single rgb images
Huang et al. A pointing gesture based egocentric interaction system: Dataset, approach and application
CN107563494A (zh) 一种基于卷积神经网络和热图的第一视角指尖检测方法
CN104143079B (zh) 人脸属性识别的方法和系统
Tian et al. Gesture recognition based on multilevel multimodal feature fusion
CN109410242A (zh) 基于双流卷积神经网络的目标跟踪方法、系统、设备及介质
CN110852182B (zh) 一种基于三维空间时序建模的深度视频人体行为识别方法
CN105550678A (zh) 基于全局显著边缘区域的人体动作特征提取方法
CN105160310A (zh) 基于3d卷积神经网络的人体行为识别方法
CN105354565A (zh) 基于全卷积网络人脸五官定位与判别的方法及系统
CN102622766A (zh) 多目标优化的多镜头人体运动跟踪方法
CN109086754A (zh) 一种基于深度学习的人体姿态识别方法
CN106068514A (zh) 用于在不受约束的媒体中识别面孔的系统和方法
CN109034099A (zh) 一种表情识别方法及装置
CN109934095A (zh) 一种基于深度学习的遥感图像水体提取方法及系统
CN108229503A (zh) 一种针对服装照片的特征提取方法
CN104899896B (zh) 一种基于子空间特征的多任务学习目标跟踪方法
CN107590821A (zh) 一种基于轨迹优化的目标跟踪方法及系统
CN105930793A (zh) 一种基于sae特征可视化学习的人体检测方法
Ma et al. Dynamic gesture contour feature extraction method using residual network transfer learning
CN105469103A (zh) 基于低质量grb-d数据的场景恢复方法及装置
CN103839280B (zh) 一种基于视觉信息的人体姿态跟踪方法
Pang et al. Dance video motion recognition based on computer vision and image processing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160629

WD01 Invention patent application deemed withdrawn after publication