CN109886164B - 一种异常手势的识别与处理方法 - Google Patents

一种异常手势的识别与处理方法 Download PDF

Info

Publication number
CN109886164B
CN109886164B CN201910094426.0A CN201910094426A CN109886164B CN 109886164 B CN109886164 B CN 109886164B CN 201910094426 A CN201910094426 A CN 201910094426A CN 109886164 B CN109886164 B CN 109886164B
Authority
CN
China
Prior art keywords
gesture
image
frame
abnormal
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910094426.0A
Other languages
English (en)
Other versions
CN109886164A (zh
Inventor
董頔
冯志全
冯仕昌
徐涛
艾长胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Jinan
Original Assignee
University of Jinan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Jinan filed Critical University of Jinan
Priority to CN201910094426.0A priority Critical patent/CN109886164B/zh
Publication of CN109886164A publication Critical patent/CN109886164A/zh
Application granted granted Critical
Publication of CN109886164B publication Critical patent/CN109886164B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种异常手势的识别与处理方法,包括:通过kinect获取人手深度图像;将[0,n/2]、[n/2,n]帧内的每一帧手势图像作CNN模型的正向传播,提取特征图像,对特征图像中的像素点进行聚类,获取第一特征值、第二特征值;利用RNN无监督学习深度网络,比较第一特征值与第二特征值的相似性;对神经网络分类后的手势图像进行正向特征提取,获取第一特征向量,将[0,n/2]帧和[n/2,n]帧进行融合,获取第二特征向量;对第一特征向量和第二特征向量进行误差逆向传播算法训练;反复迭代,得到最大相似手势。本发明解决了现有技术中对于手势的识别容易出现无法识别或者识别错误的异常问题,实现提高对异常手势的识别准确度,提升用户体验。

Description

一种异常手势的识别与处理方法
技术领域
本发明涉及虚拟现实技术领域,特别是涉及一种异常手势的识别与处理方法。
背景技术
随着虚拟现实的飞速发展,手势识别的应用已经渗透到各个行业之中,手势识别率也达到了一种比较精准的水平,但是对于手势识别中的异常捕获以及异常处理仍然是手势识别领域中的一大问题。
用户在使用手势识别相关设备时,往往会出现无法识别或者识别错误等一些异常的问题,极大的影响了用户的体验。
发明内容
本发明的目的是提供一种异常手势的识别与处理方法,旨在解决现有技术中对于手势的识别容易出现无法识别或者识别错误的异常问题,实现提高对异常手势的识别准确度,提升用户体验。
为达到上述技术目的,本发明提供了一种异常手势的识别与处理方法,所述方法包括以下步骤:
S1、通过kinect获取人手深度图像;
S2、将[0,n/2]帧内的每一帧手势图像作CNN模型的正向传播,提取特征图像,对特征图像中的像素点进行聚类,获取第一特征值;
S3、将[n/2,n]帧内的每一帧手势图像作CNN模型的正向传播,提取特征图像,对特征图像中的像素点进行聚类,获取第二特征值;
S4、利用RNN无监督学习深度网络,比较第一特征值与第二特征值的相似性,判断是否出现重复性手势;
S5、对神经网络分类后的手势图像进行正向特征提取,获取第一特征向量;将[0,n/2]帧和[n/2,n]帧进行融合,获取第二特征向量;
S6、对第一特征向量和第二特征向量进行误差逆向传播算法训练;
S7、反复迭代,得到最大相似手势,即为异常手势。
优选地,所述步骤S2具体操作为:
将[0,n/2]帧内的每一帧手势图像做CNN模型的正向传播来提取特征图像;
通过像素点聚类方法应用深度信息,将图像中的每个像素点进行聚类,利用人手形状先验知识提取出包含人手的聚类,实现人手分割;
定义初始分类点,通过最大似然准则对类中的点进行分类,分成许多小类;
将小类聚合并为较大的聚类,使用k最近邻规则来执行,迭代直到聚类数目减少到特定值,得到第一特征值。
优选地,所述通过最大似然准则对类中的点进行分类的公式如下:
P(x)=P(hand)P(x|hand)+P(forearn)P(x|hand)=π1N(x;μ1,∑1)+π2N(x;μ2,∑2)
其中,π1,π2分别是手和前臂的先验概率,N(x;μ,∑)是3D高斯分布。
优选地,所述步骤S4具体操作为:
利用RNN无监督学习深度网络,比较第一特征值与第二特征值的相似性,如果相似性小于一个阈值则判断m帧内为重复相似手势变化序列;
若特征值相似,则判断为出现异常;若特征值不相似,则判断为非异常。
优选地,所述步骤S6具体操作为:
将第一特征向量和第二特征向量相乘得到输入样本为xk=[xk1,xk2,...,xkm],输入层i与隐藏层j之间的权值为wmj(n),输入层到隐藏层输入信号和输出信号分别为:
Figure BDA0001963319980000021
Figure BDA0001963319980000022
隐藏层到输出层输入信号与输出信号为:
Figure BDA0001963319980000031
Figure BDA0001963319980000032
如果输入正向传播的输出没有得到期望的输出,则输出被传递到反向传播,并且通过最速下降法重复修改每一层神经元的权重以使均方误差最小。
优选地,所述步骤S7中,当反复迭代使用网络的实际输出与期望输出逐步逼近,直到结果逼近于利用神经网络Veggnet训练结果中的一类手势,最终判断异常手势为该手势。
优选地,所述方法还包括:
对通过kinect采集到的动态手势序列,通过中间帧遍历组合的方法进行处理,以得到动静态手势融合的手势训练,然后将动静态融合数据集输入到深度神经网络Veggnet中进行训练,最终得到类别分数图。
优选地,所述类别分数图中,通道数量等于类别数量。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
与现有技术相比,本发明提出一种捕获手势异常和解决手势识别异常的方法,通过对相邻时间段内的手势图像的特征融合与比对,检测出是否出现重复性手势来判断是否发生异常问题,从而实现在虚拟试验环境中手势无法正常识别时,通过不断重复同一个手势动作使手势重新识别,提高试验流畅性。本发明解决了现有技术中对于手势的识别容易出现无法识别或者识别错误的异常问题,实现提高对异常手势的识别准确度,提升用户体验。
附图说明
图1为本发明实施例中所提供的一种异常手势的识别与处理方法流程示意图;
图2为本发明实施例中所提供的一种重复手势识别算法流程示意图;
图3为本发明实施例中所提供的一种最大相似手势匹配算法流程示意图。
具体实施方式
为了能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
下面结合附图对本发明实施例所提供的一种异常手势的识别与处理方法进行详细说明。
如图1-3所示,本发明实施例公开了一种异常手势的识别与处理方法,所述方法包括以下步骤:
S1、通过kinect获取人手深度图像;
S2、将[0,n/2]帧内的每一帧手势图像作CNN模型的正向传播,提取特征图像,对特征图像中的像素点进行聚类,获取第一特征值;
S3、将[n/2,n]帧内的每一帧手势图像作CNN模型的正向传播,提取特征图像,对特征图像中的像素点进行聚类,获取第二特征值;
S4、利用RNN无监督学习深度网络,比较第一特征值与第二特征值的相似性,判断是否出现重复性手势;
S5、对神经网络分类后的手势图像进行正向特征提取,获取第一特征向量;将[0,n/2]帧和[n/2,n]帧进行融合,获取第二特征向量;
S6、对第一特征向量和第二特征向量进行误差逆向传播算法训练;
S7、反复迭代,得到最大相似手势,即为异常手势。
本发明实施例首先对首饰模板进行处理。由于通过kinect采集到的动态手势序列不能直接输入到CNN网络中进行训练,因此通过中间帧遍历组合的方法进行处理,以得到动静态手势融合的手势训练,然后将动静态融合数据集输入到深度神经网络Veggnet中进行训练,最终得到一个类别分数图,区分开不同的手势,再通过函数调用来完成手势识别操作。将得到的人手区域深度图剪切为n个单元,把人手深度图像再次调整大小为n个单元相同的大小,将n+1幅图像放入含Veggnet的CNN中提取特征,然后对输入图像各向同性地重缩放到一个预定义的最小图像边的尺寸,经过第一层的分类分成多个手势状态的分组。将全连接层转化为卷积层,然后将转化后的全连接层应用在整张图像上,结果得到一个类别分数图,其通道数量等于类别数量,得到的结果中,分数最大的为分类结果。
通过kinect获取手的三个骨骼节坐标,包括掌心坐标、拇指尖节点坐标、食指尖节点坐标,通过kinect获取人手深度图,将获得的图像进行预处理,调整图像的大小。
将[0,n/2]帧内的每一帧手势图像做CNN模型的正向传播来提取特征图像,将提取后的特征图像通过像素点聚类方法应用深度信息,将图像中的每个像素点进行聚类,最后利用人手形状等先验知识提取出包含人手的聚类,实现人手分割。n为一个时间段,可以根据不同场景进行调整。
定义初始分类点,通过最大似然准则对类中的点进行分类,分成许多小类:
P(x)=P(hand)P(x|hand)+P(forearn)P(x|hand)=π1N(x;μ1,∑1)+π2N(x;μ2,∑2)
其中,π1,π2分别是手和前臂的先验概率,N(x;μ,∑)是3D高斯分布。
将小类聚合并为较大的聚类,使用k最近邻规则来执行,迭代直到聚类数目减少到特定值,得到特征值n1。
同样利用上述方法,将[n/2,n]帧内的每一帧手势图像做CNN模型的正向传播,得到特征值n2。
利用RNN无监督学习深度网络,比较两个特征值n1和n2的相似性,如果相似性小于一个阈值则判断m帧内为重复相似手势变化序列。若特征值相似,则返回一个a的值为1,判断为出现异常;若特征值不相似,则返回a的值为0,此时判断为非异常。
根据输入的深度图像和人体骨骼节点获取人手区域的深度图,将之前训练好的Veggnet的CNN中的每一个分类中的图像进行正向的特征提取,提取出一个n维的向量,以其中一个为例,a(x1,x2,x3,x4……xn),当判断为重复手势时,将得到[0,n/2]和[n/2,n]的向量进行融合,得到一个特征向量b(y1,y2,y3,y4……yn)。
运用误差逆向传播算法训练多层前馈神经网络,将a、b向量相乘得到输入样本为xk=[xk1,xk2,...,xkm],输入层i与隐藏层j之间的权值为wmj(n),输入层到隐藏层输入信号和输出信号分别为:
Figure BDA0001963319980000061
Figure BDA0001963319980000062
隐藏层到输出层输入信号与输出信号为:
Figure BDA0001963319980000063
Figure BDA0001963319980000064
如果输入正向传播的输出没有得到期望的输出,则输出被传递到反向传播,并且通过最速下降法重复修改每一层神经元的权重以使均方误差最小。
通过反复迭代使用网络的实际输出与期望输出逐步逼近,直到结果逼近于利用Veggnet训练结果中的一类手势,最终判断异常手势为该手势,调用手势编号即可继续进行试验。
本发明实施例提出一种捕获手势异常和解决手势识别异常的方法,通过对相邻时间段内的手势图像的特征融合与比对,检测出是否出现重复性手势来判断是否发生异常问题,从而实现在虚拟试验环境中手势无法正常识别时,通过不断重复同一个手势动作使手势重新识别,提高试验流畅性。本发明解决了现有技术中对于手势的识别容易出现无法识别或者识别错误的异常问题,实现提高对异常手势的识别准确度,提升用户体验。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种异常手势的识别与处理方法,其特征在于,所述方法包括以下步骤:
S1、通过kinect获取人手深度图像;
S2、将[0,n/2]帧内的每一帧手势图像作CNN模型的正向传播,提取特征图像,对特征图像中的像素点进行聚类,获取第一特征值;
S3、将[n/2,n]帧内的每一帧手势图像作CNN模型的正向传播,提取特征图像,对特征图像中的像素点进行聚类,获取第二特征值;
S4、利用RNN无监督学习深度网络,比较第一特征值与第二特征值的相似性,判断是否出现重复性手势;
S5、对神经网络分类后的手势图像进行正向特征提取,获取第一特征向量;将[0,n/2]帧和[n/2,n]帧进行融合,获取第二特征向量;
S6、对第一特征向量和第二特征向量进行误差逆向传播算法训练;
S7、反复迭代,得到最大相似手势,即为异常手势。
2.根据权利要求1所述的一种异常手势的识别与处理方法,其特征在于,所述步骤S2具体操作为:
将[0,n/2]帧内的每一帧手势图像做CNN模型的正向传播来提取特征图像;
通过像素点聚类方法应用深度信息,将图像中的每个像素点进行聚类,利用人手形状先验知识提取出包含人手的聚类,实现人手分割;
定义初始分类点,通过最大似然准则对类中的点进行分类,分成许多小类;
将小类聚合并为较大的聚类,使用k最近邻规则来执行,迭代直到聚类数目减少到特定值,得到第一特征值。
3.根据权利要求2所述的一种异常手势的识别与处理方法,其特征在于,所述通过最大似然准则对类中的点进行分类的公式如下:
P(x)=P(hand)P(x|hand)+P(forearn)P(x|hand)
=π1N(x;μ1,∑1)+π2N(x;μ2,∑2)
其中,π1,π2分别是手和前臂的先验概率,N(x;μ,∑)是3D高斯分布。
4.根据权利要求1所述的一种异常手势的识别与处理方法,其特征在于,所述步骤S4具体操作为:
利用RNN无监督学习深度网络,比较第一特征值与第二特征值的相似性,如果相似性小于一个阈值则判断m帧内为重复相似手势变化序列;
若特征值相似,则判断为出现异常;若特征值不相似,则判断为非异常。
5.根据权利要求1所述的一种异常手势的识别与处理方法,其特征在于,所述步骤S6具体操作为:
将第一特征向量和第二特征向量相乘得到输入样本为xk=[xk1,xk2,...,xkm],输入层i与隐藏层j之间的权值为wmj(n),输入层到隐藏层输入信号和输出信号分别为:
Figure FDA0001963319970000021
Figure FDA0001963319970000022
隐藏层到输出层输入信号与输出信号为:
Figure FDA0001963319970000023
Figure FDA0001963319970000024
如果输入正向传播的输出没有得到期望的输出,则输出被传递到反向传播,并且通过最速下降法重复修改每一层神经元的权重以使均方误差最小。
6.根据权利要求1所述的一种异常手势的识别与处理方法,其特征在于,所述步骤S7中,当反复迭代使用网络的实际输出与期望输出逐步逼近,直到结果逼近于利用神经网络Veggnet训练结果中的一类手势,最终判断异常手势为该手势。
7.根据权利要求1-6任意一项所述的一种异常手势的识别与处理方法,其特征在于,所述方法还包括:
对通过kinect采集到的动态手势序列,通过中间帧遍历组合的方法进行处理,以得到动静态手势融合的手势训练,然后将动静态融合数据集输入到深度神经网络Veggnet中进行训练,最终得到类别分数图。
8.根据权利要求7所述的一种异常手势的识别与处理方法,其特征在于,所述类别分数图中,通道数量等于类别数量。
CN201910094426.0A 2019-01-30 2019-01-30 一种异常手势的识别与处理方法 Active CN109886164B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910094426.0A CN109886164B (zh) 2019-01-30 2019-01-30 一种异常手势的识别与处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910094426.0A CN109886164B (zh) 2019-01-30 2019-01-30 一种异常手势的识别与处理方法

Publications (2)

Publication Number Publication Date
CN109886164A CN109886164A (zh) 2019-06-14
CN109886164B true CN109886164B (zh) 2022-11-04

Family

ID=66927443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910094426.0A Active CN109886164B (zh) 2019-01-30 2019-01-30 一种异常手势的识别与处理方法

Country Status (1)

Country Link
CN (1) CN109886164B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639561A (zh) * 2020-05-17 2020-09-08 西北工业大学 基于类别自适应聚类的无监督行人重识别方法
CN113158888A (zh) * 2021-04-19 2021-07-23 广州咔隆安防科技有限公司 一种电梯异常视频识别方法
CN118555149B (zh) * 2024-07-30 2024-10-11 大数据安全工程研究中心(贵州)有限公司 一种基于人工智能的异常行为安全分析方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017027600A (ja) * 2015-07-23 2017-02-02 株式会社リコー 手振り識別方法と装置
CN108932500A (zh) * 2018-07-09 2018-12-04 广州智能装备研究院有限公司 一种基于深度神经网络的动态手势识别方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017027600A (ja) * 2015-07-23 2017-02-02 株式会社リコー 手振り識別方法と装置
CN108932500A (zh) * 2018-07-09 2018-12-04 广州智能装备研究院有限公司 一种基于深度神经网络的动态手势识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于傅立叶描述子-BP神经网络的手势识别方法;覃文军等;《东北大学学报(自然科学版)》;20090915(第09期);全文 *

Also Published As

Publication number Publication date
CN109886164A (zh) 2019-06-14

Similar Documents

Publication Publication Date Title
Kumar et al. Sign language recognition
CN105740823B (zh) 基于深度卷积神经网络的动态手势轨迹识别方法
CN103971102B (zh) 基于手指轮廓和决策树的静态手势识别方法
US9904847B2 (en) System for recognizing multiple object input and method and product for same
Rioux-Maldague et al. Sign language fingerspelling classification from depth and color images using a deep belief network
CN109886164B (zh) 一种异常手势的识别与处理方法
US20080008387A1 (en) Method and apparatus for recognition of handwritten symbols
CN104517097A (zh) 一种基于kinect的运动人体姿态识别方法
CN107066951B (zh) 一种人脸自发表情的识别方法及系统
CN104834941A (zh) 基于计算机输入下的稀疏自编码的脱机手写体识别方法
CN105549885A (zh) 滑屏操控中用户情绪的识别方法和装置
Dai Nguyen et al. Recognition of online handwritten math symbols using deep neural networks
CN109983473A (zh) 灵活的集成识别和语义处理
CN106529397A (zh) 一种非约束环境中的人脸特征点定位方法及系统
Rehman et al. A scale and rotation invariant urdu nastalique ligature recognition using cascade forward backpropagation neural network
Rajnoha et al. Handwriting comenia script recognition with convolutional neural network
Rakesh et al. Static palm sign gesture recognition with leap motion and genetic algorithm
Srininvas et al. A framework to recognize the sign language system for deaf and dumb using mining techniques
Shashidhar et al. Indian sign language recognition using 2-d convolution neural network and graphical user interface
CN109558774A (zh) 基于深度残差网络和支持向量机的物体自动识别系统
Gupta et al. Convolutional neural network based handwritten Devanagari character recognition
CN112580614B (zh) 一种基于注意力机制的手绘草图识别方法
Heer et al. An improved hand gesture recognition system based on optimized msvm and sift feature extraction algorithm
CN110135306B (zh) 基于角度损失函数的行为识别方法
Shanmugam et al. Newton algorithm based DELM for enhancing offline tamil handwritten character recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant