CN110197138B

CN110197138B - 一种基于视频帧特征的快速手势识别方法

Info

Publication number: CN110197138B
Application number: CN201910404105.6A
Authority: CN
Inventors: 金波
Original assignee: Nanjing Jimuda Data Technology Co Ltd
Current assignee: Nanjing Jimuda Data Technology Co Ltd
Priority date: 2019-05-15
Filing date: 2019-05-15
Publication date: 2020-02-04
Anticipated expiration: 2039-05-15
Also published as: CN110197138A

Abstract

本发明公开一种基于视频帧特征的快速手势识别方法，具体包括以下步骤：步骤1：视频帧图像数据预处理：对输入视频帧进行预处理，数据进行校正，并将数据映射到不同的语义空间；步骤2：标准手势分割：在特定色彩空间下进行阈值化处理，采用形态学变换和平滑滤波器来消减噪声，确定手势识别区域；步骤3：提取手势特征：提取手势区域的形状特征，包括Hu矩和傅里叶描述子等；步骤4，手势识别基于学习器选择及权重计算：选择两个不同的基学习器，不同的基学习器应当被赋予不同的权重；步骤5，集成学习将不同的手势分类的结果加权得到最终的分类结果。本发明通过对视频数据提取帧级别的图像，提取出典型的手势特征，并通过集成学习方法，实现较高精度的识别方法。

Description

一种基于视频帧特征的快速手势识别方法

技术领域

本发明属于视频数据智能分析的技术领域，特别是涉及一种基于视频帧特征的快速手势识别方法。

背景技术

手势识别是一种计算机理解人体语言的方式，从而在机器和人之间建立了比文本用户界面或图形用户界面更丰富的桥梁。手势识别使人们能够与硬件设备进行通信，并且无需任何机械设备即可自然交互。手势由于直观、自然和以及易获取，已经成为人机交互的一个热点方向。

手势识别领域的研究者主要有：基于传感器数据的接触式和基于视觉的非接触式两钟。基于传感器数据的方法可以更准确地获取更多手势状态和特征，但穿戴设备会影响用户体验；基于视觉的方法能够使操作者以更加灵活和自然的方式进行人机交互，但有其局限性，不能高质量地保证手势特征的精度而影响识别精度。

发明内容

本发明为解决上述背景技术中存在的技术问题，设计一种快速和准确的手势识别方法。

本方案通过以下技术方案来实现：一种基于视频帧特征的快速手势识别方法，具体包括以下步骤：

步骤1：视频帧图像数据预处理：对输入视频帧进行预处理，数据进行校正，并将数据映射到不同的语义空间；

步骤2：标准手势分割：在特定色彩空间下进行阈值化处理，采用形态学变换和平滑滤波器来消减噪声，确定手势识别区域；

步骤3：提取手势特征：提取手势区域的形状特征，包括Hu矩和傅里叶描述子等；

步骤4，手势识别基于学习器选择及权重计算：选择两个不同的基学习器，不同的基学习器应当被赋予不同的权重；

步骤5，集成学习将不同的手势分类的结果加权得到最终的分类结果。

在进一步的实施例中，所述步骤1具体包括以下步骤：

步骤1-1，为了解决普遍光照情况下成像和显像的非线性，通过校正来进行补偿；

步骤1-2，通过高斯滤波和中值滤波来消减噪声，并加权处理：

在进一步的实施例中，所述步骤3具体包括以下步骤：

步骤3-1，形状特征融合特定手势的局部特征；

步骤3-2，步骤3-1，形状特征融合特定手势的局部特征；

步骤3-2，为了使得傅里叶描述子作为图像特征而具备尺度不变性，还需要对傅里叶描述子进行归一化处理。将得到的傅里叶描述子的每一项与第一个相除，即(FD(i))/(FD(1)),i＝2,3,…，从而得到归一化的傅里叶描述子。

在进一步的实施例中，所述步骤4具体包括以下步骤：

步骤4-1，静态的选择基学习器数量；

步骤4-2，步骤4-1，静态的选择基学习器数量；

步骤4-2，使用动态的选择基学习器数量的方法，选择两个不同的基学习器，不同的基学习器应当被赋予不同的权重。给定容忍错误率参数

给定最大的基学习器数量

第

轮集成学习器在验证集上的精度为

第

轮集成学习器在验证集上的精度为

只要当前基学习器数量且

进行

轮划分；

步骤4-3直到算法运行终止会得到一系列的验证集精度结果，从中选择精度最高的识别方法，并赋予不同的权重。

本发明的有益效果：本发明通过对视频数据提取帧级别的图像，提取出典型的手势特征，并通过集成学习方法，实现较高精度的识别方法。和已有技术相比，本发明的优点在于：典型手势可以快速从背景中分割出来，并通过集成学习方法，提高了手势识别精度。

附图说明

图1为本发明的操作流程图。

图2为本发明的手势识别效果图。

具体实施方式

在下文的描述中，给出了大量具体的细节以便提供对本发明更为彻底的理解。然而，对于本领域技术人员而言显而易见的是，本发明可以无需一个或多个这些细节而得以实施。在其他的例子中，为了避免与本发明发生混淆，对于本领域公知的一些技术特征未进行描述。

能够有效的从视频流中分离出手势区域，并融合经典手势生成不同权重的特征，通过集成学习方法进行手势识别，得到准确度较高的手势分类结果。

本发明的步骤如下：

步骤1，视频帧图像数据预处理：对输入视频帧进行预处理，数据进行校正，并将数据映射到不同的语义空间；

步骤2，标准手势分割：在特定色彩空间下进行阈值化处理，采用形态学变换和平滑滤波器来消减噪声，确定手势识别区域；

步骤3，提取手势特征：提取手势区域的形状特征，包括Hu矩和傅里叶描述子等；

步骤4，手势识别基学习器选择及权重计算：选择两个不同的基学习器，不同的基学习器应当被赋予不同的权重；

为了进一步了解本方案的操作流程：

所述步骤1具体包括以下步骤：

操作者可以通过Gamma校正来进行补偿。显示器系统一般取Gamma为2.2。

步骤1-2，通过高斯滤波和中值滤波来消减噪声，并加权处理。

高斯滤波能够保证各方向有相同的平滑程度，且能够边缘细节不被模糊，则采用的是函数作为加权，

中值滤波选取邻域中像素值的中值作为目标像素值，邻域大小设置恰当的中值滤波可以明显地消减随机噪声。

所述步骤3具体包括以下步骤：

步骤3-1，形状特征融合特定手势的局部特征；

所述步骤4包括具体以下步骤：

步骤4-1，静态的选择基学习器数量；

给定最大的基学习器数量

第

轮集成学习器在验证集上的精度为

第

轮集成学习器在验证集上的精度为

只要当前基学习器数量且

进行轮划分；

图2为使用本方法识别出的手势，由图2的右侧可见本方法识别出来的手势清晰可见，精度高。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。为了避免不必要的重复，本发明对各种可能的组合方式不再另行说明。

Claims

1.一种基于视频帧特征的快速手势识别方法，其特征在于，具体包括以下步骤：

步骤5，集成学习将不同的手势分类的结果加权得到最终的分类结果；

其中，所述步骤4具体包括以下步骤：

步骤4-1，静态的选择基学习器数量；

步骤4-2，选择两个不同的基学习器，不同的基学习器应当被赋予不同的权重，给定容忍错误率参数

给定最大的基学习器数量第

轮集成学习器在验证集上的精度为

第

轮集成学习器在验证集上的精度为

只要当前基学习器数量

且

进行轮划分；

2.根据权利要求1所述的一种基于视频帧特征的快速手势识别方法，其特征在于，所述步骤1具体包括以下步骤：

3.根据权利要求1所述的一种基于视频帧特征的快速手势识别方法，其特征在于，所述步骤3具体包括以下步骤：

步骤3-1，形状特征融合特定手势的局部特征；

步骤3-2，为了使得傅里叶描述子作为图像特征而具备尺度不变性，还需要对傅里叶描述子进行归一化处理，将得到的傅里叶描述子的每一项与第一个相除，即(FD(i))/(FD(1)),i＝2,3,…，从而得到归一化的傅里叶描述子。