CN110059580B

CN110059580B - 一种基于leap motion的动态手势识别增强方法

Info

Publication number: CN110059580B
Application number: CN201910239890.4A
Authority: CN
Inventors: 吴立凡; 李华; 权巍; 韩成; 张超; 徐超; 刘�文
Original assignee: Changchun University of Science and Technology
Current assignee: Changchun University of Science and Technology
Priority date: 2019-03-27
Filing date: 2019-03-27
Publication date: 2023-01-31
Anticipated expiration: 2039-03-27
Also published as: CN110059580A

Abstract

本发明涉及一种基于leap motion的动态手势识别增强方法,其特征在于具体步骤如下：首先数据集与数据输入；其次帧补偿；如果实测特征点与数据集的移动轨迹不同或差异过大，则必定为不同的动态手势。加之静态手型的匹配识别，又可区分两个轨迹相似的动态手势相似与否。再模糊匹配。其通过帧补偿与模糊匹配的方式使线性数据对齐，实现对动态手势的识别。

Description

一种基于leap motion的动态手势识别增强方法

技术领域

本发明涉及一种基于leap motion的动态手势识别增强方法,是一种通过帧补偿与模糊匹配的计算方法,属于计算机视觉技术领域。

背景技术

随着信息化技术进步，人工智能领域逐渐走上了时代的舞台。手势识别一直是计算机视觉领域的一大课题，而这一课题中最核心的技术难点之一，便是对动态手势的识别。

由于动态手势具有强烈的不规则性，我们无法知道他从什么时候开始，从什么时候结束。除此之外，动态手势在变化过程中的速度快慢，特征点的轨迹都会有大量的数据差异。通常所使用的横向线性对比的计算方式，只能对静态的手势做出一个良好的反馈,如果想对动态手势进行分析，则需要对特征点划出的轨迹曲线的移动趋势进行估计与对比,同时构造多层次的复杂神经网络模型。本方法在保留线性对比的基础上，绕开线性趋势对比与多层次高深度神经网络构造的技术难题.提出一种名为首帧补正(取前10帧数据差的均值，进行每帧的数据补偿)的计算预处理方式，将执行线性对比之前的手势数据的起点，同步到同一个起始点附近(十分接近，但绝不完全相同)，这样一来，如果两者的特征点运动轨迹不相似，在之后的帧数据对比中就会凸现出来，这样便可以区分出不同的动态手势。

发明内容

本发明的目的在于提供一种基于leap motion的动态手势识别增强方法,通过帧补偿与模糊匹配的方式使线性数据对齐的方法，实现对动态手势的识别。

本发明的技术方案是这样实现的：一种基于leap motion的动态手势识别增强方法,其特征在于具体步骤如下：

第一部分：数据集与数据输入；

Step1：用手势数据对数据集训练并附加手势目录记录训练状态。

Step2：通过LeapMotion，或其它可获取深度信息的，双镜头红外摄相机，来追踪手掌特征点(例如手指骨骼关节)。

Step3：获取每一帧追踪到的手掌特征点所处的位置含深度信息，数据类型统一为Vector3类型，即，(x，y，z)

Step4：以每个特征点为单位，帧数为横轴，特征点在不同数轴(x，y，z)上的值为纵轴，绘制3份拟似曲线的散点图，每帧的数据捕捉量应有FPS≥60，从而保证能够拟似曲线。

第二部分：帧补偿；

Step1：分别取出数据集与实测数据中，前10帧的各轴数据。

Step2：计算出这10帧中两份数据的各节点，各方向上数值的平均差值，并返回一组Vector3类型数据(dx，dy，dz)，newX_n代表某骨骼关节点的实测数据的第n帧在X轴上的值，baseX_n代表某骨骼关节点的数据集数据的第n帧在X轴上的值有如下公式：

可获得：Vector3dPosition＝new Vector3(dx,dy,dz)；

Step3：在后续数据集与实测数据对比的过程中，令实测数据的每一项Vector3数据减去对应的平均差值(dx，dy，dz)，使得数据集与实测数据的散点拟似曲线的前10帧散点位置保持高度近似。

即：

其中finX_n代表被帧补偿之后的某骨骼关节点的实测数据在第n帧时X轴上的数据

finX_n＝newX_n-dx finY_n＝newY_n-dy finZ_n＝newZ_n-dz

可获得：Vector3tpPosition＝new Vector3(finX,finY,finZ)；

以下是数据在内存中存储的范例与完整的数学公式：

List<Vector3>tempPosition；

tempPosition[n]＝(finX_n，finY_n，finZ_n)

Tip：如果实测特征点与数据集的移动轨迹不同或差异过大，则必定为不同的动态手势。加之静态手型的匹配识别，又可区分两个轨迹相似的动态手势相似与否。

第三部分：模糊匹配。

Step1：求解模糊量。从数据集中求出各散点与散点曲线平均值的方差s，乘以极限值制约系数k，k应为小于1且大于0的正小数。例如：0.618(黄金分割率保留三位小数)，该系数可视具体情况而调整。可得模糊量为k*s

Step2:对数据集散点曲线进行模糊化。令数据集散点曲线各点+k*s或-k*s，得到上下两条与数据集散点曲线平行的散点曲线，这两条新的散点曲线之间的范围，视为匹配范围。

Step3：叠加帧补偿之后的实测数据。令以(finX_n，finY_n，finZ_n)为单位的新存储容器tempPosition中的数据为数据源，绘制一根所有特征点数据经过帧补偿处理的散点曲线，可得到一份拥有5条散点曲线的单轴对比图。

Step4：执行匹配并计算匹配率。所有在匹配范围内的散点视为通过匹配的散点，并予以计数。在对每一帧，每一特征点都执行完匹配后，已有：匹配点数量，参与匹配的散点数量。

定义：匹配率为rate，通过匹配的散点数量为m，所有参与匹配的散点数量为n。

则有：

n＝FPS*特征点数量*方向轴数量(固定为3)，在FPS≥60,同时又有16个特征点的情况下，每秒参与匹配的数据规模应不小于2880个散点，其匹配率的最小精确单位为：

本发明积极效果是通过帧补偿与模糊匹配的方式使线性数据对齐的方法，实现对动态手势的识别；由于动态手势具有强烈的不规则性，我们无法知道他从什么时候开始，从什么时候结束。除此之外，动态手势在变化过程中的速度快慢，特征点的轨迹都会有大量的数据差异。通常所使用的横向线性对比的计算方式，只能对静态的手势做出一个良好的反馈,如果想对动态手势进行分析，则需要对特征点划出的轨迹曲线的移动趋势进行估计与对比,同时构造多层次的复杂神经网络模型。本方法在保留线性对比的基础上，绕开线性趋势对比与多层次高深度神经网络构造的技术难题.提出一种名为首帧补正(取前10帧数据差的均值，进行每帧的数据补偿)的计算预处理方式，将执行线性对比之前的手势数据的起点，同步到同一个起始点附近(十分接近，但绝不完全相同)，这样一来，如果两者的特征点运动轨迹不相似，在之后的帧数据对比中就会凸现出来，这样便可以区分出不同的动态手势。

附图说明

图1是计算帧补偿值的原理图。其中，d₁，d₂......d₁₀代表前10帧，实测数据与库数据在X方向轴上的差值，dx代表平均差值。其中蓝线为X轴方向的匹配范围，黑线为匹配范围中心准线，红线为实测数据曲线。

图2是执行帧补偿行为原理图，dx代表附图1中求得的平均差值。其中蓝线为X轴方向的匹配范围，黑线为匹配范围中心准线，红线为实测数据曲线，绿线为经过帧补偿算法处理后的数据曲线。

图3为帧补偿效果对比图，其中蓝线为X轴方向的匹配范围，黑线为匹配范围中心准线，红线为实测数据曲线，绿线为经过帧补偿算法处理后的数据曲线。横轴单位为帧，纵轴单位为X方向的值。

具体实施方式

下面结合附图和实施例对本发明做进一步的描述。在本实施例中，计算机系统为CPU选择INTEL I7G4600 3.20GHz，内存大小为8GB DDR4，硬盘容量1TB HDD；计算机操作系统选用Windows 10，软件编程工具为Unity3D 2018.2.2。

第一部分：数据集与数据输入。

Step3：获取每一帧追踪到的手掌特征点所处的位置(含深度信息)，数据类型统一为Vector3类型，即，(x，y，z)

Step4：以每个特征点为单位，帧数为横轴，特征点在不同数轴(x，y，z)上的值为纵轴，绘制3份拟似曲线的散点图(每帧的数据捕捉量应有FPS≥60，从而保证能够拟似曲线)。

第二部分：帧补偿。

Step1：分别取出数据集与实测数据中，前10帧的各轴数据。

Step2：计算出这10帧中两份数据的各节点，各方向上数值的平均差值，并返回一组Vector3类型数据(dx，dy，dz)，如图1所示，将实测数据与数据集数据前10帧的差值取平均数，计算得出帧补正值。

公式&解释：

其中newX_n代表某骨骼关节点的实测数据的第n帧在X轴上的值，baseX_n代表某骨骼关节点的数据集数据的第n帧在X轴上的值。