CN107704072A - 一种手势交互过程中用户手势的自动纠错方法 - Google Patents

一种手势交互过程中用户手势的自动纠错方法 Download PDF

Info

Publication number
CN107704072A
CN107704072A CN201710434905.3A CN201710434905A CN107704072A CN 107704072 A CN107704072 A CN 107704072A CN 201710434905 A CN201710434905 A CN 201710434905A CN 107704072 A CN107704072 A CN 107704072A
Authority
CN
China
Prior art keywords
gesture
sample
feature
identified
interaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710434905.3A
Other languages
English (en)
Inventor
冯志全
孙凯云
郭小沛
艾长胜
魏军
李映君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Jinan
Original Assignee
University of Jinan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Jinan filed Critical University of Jinan
Priority to CN201710434905.3A priority Critical patent/CN107704072A/zh
Publication of CN107704072A publication Critical patent/CN107704072A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/01Indexing scheme relating to G06F3/01
    • G06F2203/012Walk-in-place systems for allowing a user to walk in a virtual environment while constraining him to a given position in the physical environment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种手势交互过程中用户手势的自动纠错方法,首先利用深度学习训练几种手势得到网络模型,针对训练过程中识别错误的手势样本集,提取这些样本的特征,并存入一个集合中。在手势交互过程中,就可以先利用hausdorff距离计算手势是否与集合中的元素相似,如果相似则说明这个手势易被我们的网络模型识别为错误手势,我们采取以某个概率强制转换成正确的样本标签,如果和集合中任意元素都不相似则识别为网络模型测试的结果。从而提高识别率,使得自然交互过程更加准确。

Description

一种手势交互过程中用户手势的自动纠错方法
技术领域
本发明涉及一种手势交互过程中用户手势的自动纠错方法。
背景技术
目前在人机交互的领域,用户更加注重交互方式的自然性。手势作为欣欣向上的新的交互方式,给我们的智能生活带来了很多便利。但是在自然交互过程中,如果手势识别率很差,导致用户在实际应用中做的手势经常被误认为错的手势。那么这种交互方式也就会逐渐被大家遗弃。因此找出容易混淆的手势,把这些手势区分开是必然、刻不容缓要解决的问题。
发明内容
为解决以上技术上的不足,本发明提供了一种手势交互过程中用户手势的自动纠错方法,它提高了手势识别效率,使得自然交互过程更加准确。
本发明是通过以下措施实现的:
本发明的一种手势交互过程中用户手势的自动纠错方法,包括以下步骤:
步骤1,采用kinect设备获取不同角度、不等距离的n种类别的手势样本,然后采用卷积神经网络模型对手势样本进行训练,得到训练过程中识别错误的手势样本;
步骤2,提取步骤1中识别错误的手势样本的特征,并将手势样本特征以及对应的手势类别存入样本集合中;
步骤3,提取待识别手势的特征,采用hausdorff距离算法计算待识别手势的特征与样本集合中所有手势样本的特征之间的距离,如果某一手势样本的特征与待识别手势的特征之间的距离小于给定阈值,则识别结果输出该手势样本特征对应的手势类别。
上述在步骤1中,采用kinect设备获取手势样本的彩色图,并将手势样本的彩色图统一裁剪成大小为225*225尺寸。
上述在步骤1中采用5种卷积、3层池化层的卷积神经网络模型。
本发明的有益效果是:本发明利用hausdorff距离计算待识别手势是否与易错手势样本集合中的手势样本相似,如果相似则采取强制输出该手势样本对应的手势类别,从而提高识别率,使得自然交互过程更加准确,对手势识别的交互方式具有很大的推广作用。
附图说明
图1为本发明的工作流程框图。
具体实施方式
下面结合附图对本发明做进一步详细的描述:
如图1所示,本发明首先利用深度学习训练几种手势得到网络模型,针对训练过程中识别错误的手势样本集,提取这些样本的特征,并存入一个集合中。在手势交互过程中,就可以先利用hausdorff距离计算手势是否与集合中的元素相似,如果相似则说明这个手势易被我们的网络模型识别为错误手势,我们采取以某个概率强制转换成正确的样本标签,如果和集合中任意元素都不相似则识别为网络模型测试的结果。从而提高识别率,使得自然交互过程更加准确。
步骤1,采用kinect设备获取不同角度、不等距离的n种类别的手势样本,然后采用卷积神经网络模型对手势样本进行训练,得到训练过程中识别错误的手势样本;
步骤2,提取步骤1中识别错误的手势样本的特征,并将手势样本特征以及对应的手势类别存入样本集合中;
步骤3,提取待识别手势的特征,采用hausdorff距离算法计算待识别手势的特征与样本集合中所有手势样本的特征之间的距离,如果某一手势样本的特征与待识别手势的特征之间的距离小于给定阈值,则识别结果输出该手势样本特征对应的手势类别。
卷积神经网络是一种特殊的深层的神经网络模型,主要由卷积层以及下采样层组成。它的特殊性体现在两个方面,一方面它的神经元间的连接是非全连接的,另一方面同一层中某些神经元之间的连接的权重是共享的。它的非全连接和权值共享的网络结构使之更类似生物的神经网络,降低了网络模型的复杂性,大大减少了网络训练的参数数量。
CNN的基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层,这种特有的两次特征提取结构减小了特征分辨率。
卷积神经网络是在BP神经网络基础上的的改进优化,与BP神经网络相比,CNN结构多了卷积运算。在一个卷积层,上一层的特征图被一个可学习的卷积核卷积,通过一个激活函数就可以得到本层特征map。用公式(1) 表示如下:
这里Mj表示输入的上一层maps集合,f()表示激活函数,表示可学习的卷积核值,b表示偏置,l表示当前卷积层。
利用图像局部相关性原理,对图像进行子抽样,可以减少数据处理量同时保留有用信息。采样层每个特征图的神经元可按照公式(2)进行计算。
式中p位降采样函数,降采样函数一般是对输入图像n*n大小的区域进行加权求和。F为激活函数,每一个输出特征图有一个偏置B和权重系数β。
卷积神经网络的权值训练方法采用反向传播的算法,我们假设第n次迭代中,输出端的第j个神经元的输出为yj(n),则该神经元的误差信号为
ej(n)=dj(n)-yj(n) (3)
定义单元j的平方误差为则输出端总的平方误差的瞬时值为
其中c包含所有的输出单元,设训练集中的样本总数为N,则平方误差的均值为
EAV为学习的目标函数,学习的目的使EAV达到最小,EAV是网络所有权值和阈值以及输入信号的的函数。
hausdorff距离是根据Felix hausdorff(1868-1942)命名的,hausdorff距离是指某一集合中离另一集合最近点的所有距离的最大值。正式的数学描述为,集合A到集合B的hausdorff距离为maximin函数,定义为:
这里a和b分别为集合A和集合B中的点,d(a,b)为两点间的尺度;一般的,我们取d(a,b)为a,b之间的欧几里得距离。
Hausdorff距离是有方向性的,除外特例,一般情况下h(A,B)不等于h(B,A)。因为hausdorff距离更一般定义为如下:
H(A,B)=max{h(A,B),h(B,A)} (7)
该式定义了A集合到B集合和从B集合到A集合的单向Hausdorff距离。这样函数的意义在于度量了两个点集间的最大不匹配程度。为了交互过程的自然性,选用的样本为普通的彩色图。通过kinect设备获取不同角度、不等距离的5种手势的彩色图,其中每种手势的样本数量为5300种。验证集中每种样本数量为100种。
在研究过程中,为了减少网络需要训练的数据量,并同时保留足够多的数据图像细节信息,将实验数据库中的手势统一成大小为225*225尺寸。
网络的框架由卷积层和采样层交替组成,最后一层为输出层。卷积层中具有多个不同的特征图,一个特征图表示提取图像的一种特征,不同的特征图使用不同的卷积核。本算法采用的5种卷积,3层池化层的CNN模型。得到识别的准确率为95.8%。
对这些样本利用python接口提取全连接层特征,得到4096维数据。将这些手势看成集合中的一个个的点,每一个点是4096维的向量。然后把所有识别错误的手势放在一个集合当中。再测试新手势的时候就可以利用 hausdorff进行计算判断是否与集合中的手势有相似的。如果小于某一个阈值,我们视为此手势为相似手势,输出应有的序号,这个序号可以根据行数来判断。否则的话运用模型进行测试。
以上所述仅是本专利的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本专利技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本专利的保护范围。

Claims (3)

1.一种手势交互过程中用户手势的自动纠错方法,其特征在于,包括以下步骤:
步骤1,采用kinect设备获取不同角度、不等距离的n种类别的手势样本,然后采用卷积神经网络模型对手势样本进行训练,得到训练过程中识别错误的手势样本;
步骤2,提取步骤1中识别错误的手势样本的特征,并将手势样本特征以及对应的手势类别存入样本集合中;
步骤3,提取待识别手势的特征,采用hausdorff距离算法计算待识别手势的特征与样本集合中所有手势样本的特征之间的距离,如果某一手势样本的特征与待识别手势的特征之间的距离小于给定阈值,则识别结果输出该手势样本特征对应的手势类别。
2.根据权利要求1所述手势交互过程中用户手势的自动纠错方法,其特征在于:在步骤1中,采用kinect设备获取手势样本的彩色图,并将手势样本的彩色图统一裁剪成大小为225*225尺寸。
3.根据权利要求1所述手势交互过程中用户手势的自动纠错方法,其特征在于:在步骤1中采用5种卷积、3层池化层的卷积神经网络模型。
CN201710434905.3A 2017-06-10 2017-06-10 一种手势交互过程中用户手势的自动纠错方法 Pending CN107704072A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710434905.3A CN107704072A (zh) 2017-06-10 2017-06-10 一种手势交互过程中用户手势的自动纠错方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710434905.3A CN107704072A (zh) 2017-06-10 2017-06-10 一种手势交互过程中用户手势的自动纠错方法

Publications (1)

Publication Number Publication Date
CN107704072A true CN107704072A (zh) 2018-02-16

Family

ID=61170070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710434905.3A Pending CN107704072A (zh) 2017-06-10 2017-06-10 一种手势交互过程中用户手势的自动纠错方法

Country Status (1)

Country Link
CN (1) CN107704072A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033978A (zh) * 2018-06-28 2018-12-18 济南大学 一种基于纠错策略的cnn-svm混合模型手势识别方法
CN112101236A (zh) * 2020-09-17 2020-12-18 济南大学 一种面向老年陪护机器人的智能纠错方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102904A (zh) * 2014-07-14 2014-10-15 济南大学 一种静态手势识别方法
CN104933408A (zh) * 2015-06-09 2015-09-23 深圳先进技术研究院 手势识别的方法及系统
CN105205475A (zh) * 2015-10-20 2015-12-30 北京工业大学 一种动态手势识别方法
CN106529475A (zh) * 2016-11-09 2017-03-22 济南大学 一种基于优化手势库分布的dnn群手势识别方法
KR101745651B1 (ko) * 2016-03-29 2017-06-09 전자부품연구원 손 제스처 인식 시스템 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102904A (zh) * 2014-07-14 2014-10-15 济南大学 一种静态手势识别方法
CN104933408A (zh) * 2015-06-09 2015-09-23 深圳先进技术研究院 手势识别的方法及系统
CN105205475A (zh) * 2015-10-20 2015-12-30 北京工业大学 一种动态手势识别方法
KR101745651B1 (ko) * 2016-03-29 2017-06-09 전자부품연구원 손 제스처 인식 시스템 및 방법
CN106529475A (zh) * 2016-11-09 2017-03-22 济南大学 一种基于优化手势库分布的dnn群手势识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
何力等: "一种基于最大似然Hausdorff距离的手势识别算法", 《电子技术》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033978A (zh) * 2018-06-28 2018-12-18 济南大学 一种基于纠错策略的cnn-svm混合模型手势识别方法
CN109033978B (zh) * 2018-06-28 2023-04-18 济南大学 一种基于纠错策略的cnn-svm混合模型手势识别方法
CN112101236A (zh) * 2020-09-17 2020-12-18 济南大学 一种面向老年陪护机器人的智能纠错方法及系统

Similar Documents

Publication Publication Date Title
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN109902677B (zh) 一种基于深度学习的车辆检测方法
CN108416394B (zh) 基于卷积神经网络的多目标检测模型构建方法
CN106127204B (zh) 一种全卷积神经网络的多方向水表读数区域检测算法
CN109934115B (zh) 人脸识别模型的构建方法、人脸识别方法及电子设备
CN108021947B (zh) 一种基于视觉的分层极限学习机目标识别方法
CN108920580A (zh) 图像匹配方法、装置、存储介质及终端
CN107194418B (zh) 一种基于对抗特征学习的水稻蚜虫检测方法
CN112837315B (zh) 一种基于深度学习的输电线路绝缘子缺陷检测方法
JP2020123330A (ja) ニューラルネットワーク学習に利用されるオートラベリングされたイメージのうちでラベル検収のためのサンプルイメージを取得する方法、及びそれを利用したサンプルイメージ取得装置
CN108304820A (zh) 一种人脸检测方法、装置及终端设备
Yue et al. Robust loop closure detection based on bag of superpoints and graph verification
JP2020126613A (ja) イメージを分析するために、ディープラーニングネットワークに利用するためのトレーニングイメージに対するラベルリング信頼度を自動的に評価するための方法、及びこれを利用した信頼度評価装置
CN111368690A (zh) 基于深度学习的海浪影响下视频图像船只检测方法及系统
CN109558902A (zh) 一种快速目标检测方法
CN104834941A (zh) 基于计算机输入下的稀疏自编码的脱机手写体识别方法
CN112598000A (zh) 题目识别方法、装置、电子设备及计算机存储介质
CN111143567B (zh) 一种基于改进神经网络的评论情感分析方法
CN110347857B (zh) 基于强化学习的遥感影像的语义标注方法
JP6892606B2 (ja) 位置特定装置、位置特定方法及びコンピュータプログラム
CN110163631A (zh) 客户精准服务方法、装置、计算机设备及存储介质
CN111582337A (zh) 基于小样本细粒度图像分析的草莓畸形状态检测方法
CN111652273A (zh) 一种基于深度学习的rgb-d图像分类方法
CN110070106A (zh) 烟雾检测方法、装置及电子设备
CN104851183A (zh) 纸币面向识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180216