CN104063703A

CN104063703A - 基于倒排索引方式的手势识别方法

Info

Publication number: CN104063703A
Application number: CN201410350194.8A
Authority: CN
Inventors: 张长水; 侯广东
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2014-07-22
Filing date: 2014-07-22
Publication date: 2014-09-24

Abstract

本发明公开一种基于倒排索引方式的手势识别方法，包括以下步骤：获取输入图像中待识别的静态手势的手势区域信息；获取所述手势区域信息的手势特征信息；将获取的手势特征信息与预设数据集中存储的手势特征信息进行分类匹配；根据分类匹配结果获取待识别的静态手势的姿势信息并输出。本发明属于利用数据进行手势识别，避免了使用模型方法识别手势所带来的大量计算，并且相对于模型方法可以识别更大量的姿势。而本发明利用线段方向加强形状上下文特征，并利用倒排索引方法进行检索操作，相比现有数据识别手势方法更快速准确。

Description

基于倒排索引方式的手势识别方法

技术领域

本发明涉及一种基于倒排索引方式的手势识别方法。

背景技术

对于手势识别的问题，目前已有的技术方案大体可以分为两类：1、使用模型的方法：这一类方法包括为手的关节结构或外形轮廓等建立模型，利用模型来推断出手的各个部位在图像上的位置，从而完成手的姿态的识别。利用模型的方法一般需要大量的计算，依靠个人计算机在实际使用中很难实时完成。2、使用数据的方法：这一类方法首先需要采集较大量的各种手势的图片，可以通过摄像头采集真实的图片，也可以通过软件合成。在这些图片上建立起数据集。数据集中的图片通过人工标注等途径，可以得到各部位的标签，即有关手的姿势的信息。对于待识别的图像，首先在数据集中找到最相似的图片，利用数据集中图片的信息作为(或推断出)待识别的图像的信息。

利用模型的方法一般需要大量的计算，依靠个人计算机在实际使用中很难实时实现。同时由于模型的限制，这类方法一般只能识别特定的几种姿势。利用数据的方法，关键之处在于，快速而比较准确地在已建立的数据集中找出姿势与待识别图像最相似的图像。现有的方法，使用Chamfer距离衡量两幅手势图像的相似程度，这样需要与数据集中图像逐一比较，虽然对这一过程进行了加速，但仍然难以满足精度和速度的要求。

发明内容

针对上述问题，本发明的目的在于提供一种基于倒排索引方式的手势识别方法。

为达到上述目的，本发明所述一种基于倒排索引方式的手势识别方法，包括以下步骤：

获取输入图像中待识别的静态手势的手势区域信息，并获取所述手势区域信息的手势特征信息；

将获取的手势特征信息与预设数据集中存储的手势特征信息进行分类匹配；

根据分类匹配结果获取待识别的静态手势的姿势信息并输出。

优选地，获取所述手势区域信息的手势特征信息具体包括以下步骤：

将图像转化成灰度图；

利用检测边缘的算法在灰度图上获取手势的边缘图；

利用线段拟合算法对手势的边缘图进行处理，获得手势的方向边缘图；

对方向边缘图中的每个边缘点利用直方图算法获得加强的形状上下文特征。

优选地，所述利用线段拟合算法对手势的边缘图进行提取获得手势的方向边缘图的具体步骤包括：

1)以边缘图中的多个交点为分叉点，获得多条互不交叉的曲线{S_i}，每条曲线由多个依次相邻的点组成，即S_i＝{p₁，p₂，…，p_Ni}；

2)连接每个曲线S_i的两个端点p₁和p_Ni的线段L_1，Ni；

3)计算S_i中各点到线段L_1，Ni的距离，选取最大距离H_m和对应的点p_m，将最大距离H_m与预设阈值ε进行比较：

若H_m＞ε，则将S_i以p_m为端点划分为两个集合，即S_i1＝{p₁，p₂，…，p_m}和S_i2＝{p_m，p_m+1，…，p_Ni}；

反之，则以当前线段作为拟合线段；

4)对S_i1和S_i2分别重复步骤2)和步骤3)操作，直到最大距离H_m小于或等于ε。

优选地，实现所述预设数据集中存储的手势特征信息的具体步骤为：

1)对多个摄取图像进行采集并分割得到预设大小的图像；

2)将每个图像均转化成灰度图，并利用检测边缘的算法在灰度图上获取手势的边缘图，并进一步利用线段拟合算法获取方向边缘图；

3)对方向边缘图中的每个边缘点利用直方图算法获得形状上下文特征；

4)对每个形状上下文特征通过层次的C均值聚类法进行分类以获得多个视觉单词；

5)建立视觉单词-图像的倒排索引表并存储。

优选地，将获取的手势特征信息与预设数据集中存储的手势特征信息进行分类匹配具体为：将获取的手势特征信息转化为视觉单词，与预设数据集内视觉单词进行匹配，使数据集中的具有最多匹配视觉单词的姿势作为识别的姿势。

本发明的有益效果为：

本发明属于利用数据进行手势识别，避免了使用模型方法识别手势所带来的大量计算，并且相对于模型方法可以识别更大量的姿势。而本发明利用线段方向加强形状上下文特征，利用倒排索引方法进行检索操作，相比现有数据识别手势方法更快速准确。

附图说明：

图1为本发明实施例经过处理得到方向边缘图的每步变化示意图；

图2为本发明实施例利用线段拟合算法得到方向边缘图的过程示意图；

图3为本发明实施例利用直方图算法获得加强的形状上下文特征的转换示意图；

图4为本发明实施例所述方法的流程图。

具体实施方式

下面结合说明书附图对本发明做进一步的描述。

首先需要建立一个预设数据集，以便于对待识别手势进行识别处理。建立预设数据集主要包括以下步骤：

通过摄像头采集很多手势图像，并对所拍摄的图像进行分割得到预设大小的图像。将每个图像均转化成灰度图，并利用检测边缘的算法在灰度图上获取手势的边缘图，并进一步利用线段拟合算法获取方向边缘图。对方向边缘图中的每个边缘点利用直方图算法获得加强的形状上下文特征。对所有特征通过层次的C均值聚类法进行分类以获得多个视觉单词，并用各自的ID表示。建立视觉单词-图像的倒排索引表并存储。表中的每一行对应一个视觉单词，记录每个视觉单词出现的图像ID。

对于上述步骤，需要说明的是：

获取手势的边缘图所使用的边缘检测方法可以是Canny边缘检测法，该检测方法是John F.Canny提出的一种边缘检测算法，该算法使用较广泛。形状上下文特征的提出是用来描述图像中物体形状的描述子，该方法已广泛应用。倒排索引也被称为反向索引，常用于文档的检索。使用倒排索引，可以快速的检索出某个单词出现的文档的列表。该检索方法较为常用。

如图4所示，本发明实施例所述一种基于倒排索引方式的手势识别方法，包括以下步骤：获取输入图像中待识别的静态手势的手势区域信息；获取所述手势区域信息的手势特征信息；将获取的手势特征信息与预设数据集中存储的手势特征信息进行分类匹配；根据分类匹配结果获取待识别的静态手势的姿势信息并输出。

如图1所示为经过处理得到方向边缘图的每步变化示意图。在进行得到方向边缘图之前，需要确定所述获取输入图像中待识别的静态手势的手势区域信息，该信息的确定目前可以采用很多方法进行处理，比如肤色分割方法，该方法为现有技术。确定手势区域信息后，接着获取手势特征信息。在图中可以看出，获取所述手势区域信息的手势特征信息具体包括以下步骤：将图像转化成灰度图；利用检测边缘的算法在灰度图上获取手势的边缘图；利用线段拟合算法对手势的边缘图进行提取获得手势的方向边缘图。该线段拟合算法得到方向边缘图的过程由图2所示可以看出。

在处理步骤上，所述利用线段拟合算法对手势的边缘图进行提取获得手势的方向边缘图的具体步骤包括：

1.1)以边缘图中的多个交点为分叉点，获得多条互不交叉的曲线{S_i}，每条曲线由多个依次相邻的点组成，即S_i＝{p₁，p₂，…，p_Ni}；

1.2)连接每个曲线S_i的两个端点p₁和p_Ni的线段L_1，Ni；

1.3)计算S_i中各点到线段L_1，Ni的距离，选取最大距离H_m和对应的点p_m，将最大距离H_m与预设阈值ε进行比较：

反之，则以当前线段作为拟合线段。

2、对方向边缘图中的每个边缘点利用直方图算法以加强形状上下文特征。该直方图算法具体可见附图3所示。在图中，左图中的不同箭头表示由上述方法计算得到的不同的角度值。而右图是对这些角度值在直方图中的具体体现。对所有特征通过层次的C均值聚类法进行分类以获得多个视觉单词；建立视觉单词-图像的倒排索引表并存储。

在识别过程中，将获取的手势特征信息与预设数据集内各个视觉单词内的特征信息进行匹配，以使其中一个视觉单词内特性信息与所获取的手势特性信息匹配数最多。对得到的这个视觉单词利用倒排索引方法在倒排索引表内进行检索，找到数据集中与待检测图片具有相同单词的图片，并将数据集中检索出的图片的姿势信息作为待检测图片的姿势信息。

以上，仅为本发明的较佳实施例，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求所界定的保护范围为准。

Claims

1.一种基于倒排索引方式的手势识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于倒排索引方式的手势识别方法，其特征在于，获取所述手势区域信息的手势特征信息具体包括以下步骤：

将图像转化成灰度图；

利用检测边缘的算法在灰度图上获取手势的边缘图；

3.根据权利要求2所述的基于倒排索引方式的手势识别方法，其特征在于，所述利用线段拟合算法对手势的边缘图进行提取获得手势的方向边缘图的具体步骤包括：

2)连接每个曲线S_i的两个端点p₁和p_Ni的线段L_1，Ni；

反之，则以当前线段作为拟合线段；

4.根据权利要求1所述的基于倒排索引方式的手势识别方法，其特征在于，实现所述预设数据集中存储的手势特征信息的具体步骤为：

1)对多个摄取图像进行采集并分割得到预设大小的图像；

3)对方向边缘图中的每个边缘点利用直方图算法加强形状上下文特征；

5)建立视觉单词-图像的倒排索引表并存储。

5.根据权利要求4所述的基于倒排索引方式的手势识别方法，其特征在于，将获取的手势特征信息与预设数据集中存储的手势特征信息进行分类匹配具体为：将获取的手势特征信息转化为视觉单词，与预设数据集内视觉单词进行匹配，使数据集中的具有最多匹配视觉单词的姿势作为识别的姿势。