CN112308041A

CN112308041A - 一种基于视觉的无人平台手势控制方法

Info

Publication number: CN112308041A
Application number: CN202011346791.5A
Authority: CN
Inventors: 任国全; 唐香珺; 王怀光; 范红波; 李晓磊; 周景涛; 吴定海; 曹凤利; 韩兰懿; 张云强
Original assignee: Army Engineering University of PLA
Current assignee: Army Engineering University of PLA
Priority date: 2020-11-26
Filing date: 2020-11-26
Publication date: 2021-02-02

Abstract

本发明公开了一种基于视觉的无人平台手势控制方法，所述方法具体如下：第一步，图像获取，第二步，图像预处理，对存储数据进行处理，包括手势图像的去噪、分割与二值化操作；第三步，特征提取，采用基于形状特征的识别算法，在边界图像的基础上根据手势区域的形状特征对手势图像进行粗分类；按照手势图像中手指的方向及数目区分为指向手势图像；然后分别在边界图像和二值图像中提取手势图像面积、周长、重心特征，构成三维特征向量；第四步，手势识别，本发明的基于视觉的无人平台手势控制方法，通过摄像机获取手势图像，通过图像预处理及特征提取，识别并读取手势数据，并将其发送给无人平台，对无人平台进行遥控。

Description

一种基于视觉的无人平台手势控制方法

技术领域

本发明涉及一种无人平台控制系统，具体涉及一种基于视觉的无人平台手势控制方法，属于无人平台控制系统技术领域。

背景技术

无论是在民用领域还是在国防安全领域，无人平台技术都得到了广泛的关注和迅猛的发展；在无人平台的使用过程中，由于工作环境的复杂性和变化性，目前仍无法完全自主地完成任务，需要操作者通过遥控技术完成无人平台的运动规划。无人平台的遥控方式有很多种，主要分为接触式遥控方式和非接触式遥控方式。传统意义上的接触式遥控方式依赖于触摸屏、键盘等交互方式。随着科技水平的不断发展，传统的接触式遥控方式在无人平台遥控中逐渐不能满足需求，由此产生了一些非接触式遥控方式越来越多被人们所使用，如手势、语音、眼动及脑电等遥控方式；手势遥控方式相比其他非接触式遥控方式在遥控过程中更为直观和自然，也更加符合人们一般操作的习惯和特点，因此应用更为广泛；根据手势的采集设备可以把手势识别系统分为两类：基于视觉的手势识别系统和基于数据手套的手势识别系统；基于数据手套的手势识别系统是最早的手势识别系统；需要用户佩戴数据手套，通过数据手套来测量出手指或者手臂的关节角度和位置等信息，进而来识别用户的手势；随着目前计算机视觉技术的发展，基于视觉的手势识别技术也越来越成熟；它主要通过摄像机来采集手势的视觉信息；从视频图像中提取手势，并进行识别；用户不需要佩戴任何的设备，可以直接与计算机之间进行交互；因为基于视觉的手势识别技术对输入设备的成本低，对用户的限制少，且人手是处于一种自然状态，使人能够以自然的方式与计算机之间进行交互的优点；所以基于视觉的手势识别技术符合人机交互技术发展的方向，也是未来手势识别技术发展的趋势和目标；但目前，无人平台的遥控主要以传统接触式遥控为主，其还无法将手势识别应用到无人平台。

发明内容

为解决上述问题，本发明提出了一种基于视觉的无人平台手势控制方法，通过构建基于视觉的手势识别系统的基本运行框架，实现无人平台的手势识别与遥控功能；对于无人平台，能够实现基于视觉的手势控制。

本发明的基于视觉的无人平台手势控制方法，所述方法具体如下：

第一步，图像获取，选用基于双目视觉的手势识别，即采用两个摄像机采集人手动作，采集后进行存储；

第二步，图像预处理，对存储数据进行处理，包括手势图像的去噪、分割与二值化操作；

第三步，特征提取，采用基于形状特征的识别算法，在边界图像的基础上根据手势区域的形状特征对手势图像进行粗分类；按照手势图像中手指的方向及数目区分为指向手势图像；然后分别在边界图像和二值图像中提取手势图像面积、周长、重心特征，构成三维特征向量；最后采用类似度进行模板匹配，实现对手势的细分类；

第四步，手势识别，在进行识别之前，通过数据建模，创建一个标准手势的样本库，当两个摄像头分别捕捉到手势，首先通过图像预处理及特征提取，获得遥控命令手势，继而与样本库进行比对，通过计算输入手势的特征向量与样本库中每一图像的特征向量的欧式距离，判定输入图像与样本图像间的匹配程度，最后选择匹配度最高的样本图像为操作指令手势。

进一步地，所述特征提取具体如下：在基于形状特征的识别算法中，通过在边界图像的基础上根据手势区域的形状特征对手势图像进行粗分类，按照手势图像中手指的方向及数目把手势图像分成向上、向右、向下和向左类型；然后分别在边界图像和二值图像中提取手势图像面积、周长、重心特征，构成三维特征向量；最后采用类似度进行模板匹配，实现对字母手势的细分类；在基于傅里叶描述的识别算法中，首先采用八邻域搜索法对二值化的手势图像进行边缘检测，得到连通的手势外轮廓，然后计算边界点序列的傅里叶系数得到傅里叶描述子，并将傅里叶描述子进行归一化，构建手势图像的特征向量，最后通过计算输入手势的特征向量与样本库中每一图像的特征向量的欧式距离，判定输入图像与样本图像间的匹配程度。

进一步地，所述图像预处理具体如下：包括手势区域的检测、分割与二值化操作，首先在较大尺度下，通过对人体躯干等结构的识别并在彩色图像中检测手势所在区域，其次利用图像分割，将手势区域分割出来，然后将得到的手势区域利用自适应阈值对图像进行二值化操作，并将背景区域置0，手势区域置1，最后再将手势区域平移至图像中心，并将图像规范为统一大小作为神经网络的输入。

进一步地，所述手势识别还包括基于CNN神经网络的动态手势识别。

本发明与现有技术相比较，本发明的基于视觉的无人平台手势控制方法，通过摄像机获取手势图像，通过图像预处理及特征提取，识别并读取手势数据，并将其发送给无人平台，对无人平台进行遥控。同时随着无人平台的实际运行，将实际运行轨迹反馈给手势操控端，通过手势操控使得无人平台能够按理想的轨迹运行。

附图说明

图1是本发明的手势控制方法流程示意图。

图2是本发明的手势识别流程示意图。

图3是本发明的图像预处理示意图。

图4是本发明的图像预处理结果示意图。

图5是本发明的常见的手势的最小外接矩形识别示意图。

具体实施方式

实施例1：

如图1至图4所示的基于视觉的无人平台手势控制方法，所述方法具体如下：

第四步，手势识别，在进行识别之前，通过数据建模，创建一个标准手势的样本库，当两个摄像头分别捕捉到手势，首先通过图像预处理及特征提取，获得遥控命令手势，继而与样本库进行比对，通过计算输入手势的特征向量与样本库中每一图像的特征向量的欧式距离，判定输入图像与样本图像间的匹配程度，最后选择匹配度最高的样本图像为操作指令手势；为减少识别时的计算量，引入手势轮廓最小外接矩形的宽长比作为特征，进行初步识别，手势轮廓的宽长比作为手势的全局特征，计算简单且能快速找到相似手势，其如图5所示。

其中，所述特征提取具体如下：在基于形状特征的识别算法中，通过在边界图像的基础上根据手势区域的形状特征对手势图像进行粗分类，按照手势图像中手指的方向及数目把手势图像分成向上、向右、向下和向左类型；然后分别在边界图像和二值图像中提取手势图像面积、周长、重心特征，构成三维特征向量；最后采用类似度进行模板匹配，实现对字母手势的细分类；在基于傅里叶描述的识别算法中，首先采用八邻域搜索法对二值化的手势图像进行边缘检测，得到连通的手势外轮廓，然后计算边界点序列的傅里叶系数得到傅里叶描述子，并将傅里叶描述子进行归一化，构建手势图像的特征向量，最后通过计算输入手势的特征向量与样本库中每一图像的特征向量的欧式距离，判定输入图像与样本图像间的匹配程度。

其中，所述图像预处理具体如下：包括手势区域的检测、分割与二值化操作，首先在较大尺度下，通过对人体躯干等结构的识别并在彩色图像中检测手势所在区域，其次利用图像分割，将手势区域分割出来，然后将得到的手势区域利用自适应阈值对图像进行二值化操作，并将背景区域置0，手势区域置1，最后再将手势区域平移至图像中心，并将图像规范为统一大小作为神经网络的输入。

其中，所述手势识别还包括基于CNN神经网络的动态手势识别，其通过模仿大脑神经突触的信息处理过程而建立的网络模型，CNN是一种局部激活的前馈型神经网络，具有局部感受、权值共享与降采样三大基本特征，典型的CNN主要由输入层、输出层、卷积层、池化层以及全连接层组成，其具有较强的容错能力与适应性。

上述实施例，仅是本发明的较佳实施方式，故凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰，均包括于本发明专利申请范围内。

Claims

1.一种基于视觉的无人平台手势控制方法，其特征在于：所述方法具体如下：

2.根据权利要求1所述的基于视觉的无人平台手势控制方法，其特征在于：所述特征提取具体如下：

在基于形状特征的识别算法中，通过在边界图像的基础上根据手势区域的形状特征对手势图像进行粗分类，按照手势图像中手指的方向及数目把手势图像分成向上、向右、向下和向左类型；然后分别在边界图像和二值图像中提取手势图像面积、周长、重心特征，构成三维特征向量；最后采用类似度进行模板匹配，实现对字母手势的细分类；在基于傅里叶描述的识别算法中，首先采用八邻域搜索法对二值化的手势图像进行边缘检测，得到连通的手势外轮廓，然后计算边界点序列的傅里叶系数得到傅里叶描述子，并将傅里叶描述子进行归一化，构建手势图像的特征向量，最后通过计算输入手势的特征向量与样本库中每一图像的特征向量的欧式距离，判定输入图像与样本图像间的匹配程度。

3.根据权利要求1所述的基于视觉的无人平台手势控制方法，其特征在于：所述图像预处理具体如下：包括手势区域的检测、分割与二值化操作，首先在较大尺度下，通过对人体躯干等结构的识别并在彩色图像中检测手势所在区域，其次利用图像分割，将手势区域分割出来，然后将得到的手势区域利用自适应阈值对图像进行二值化操作，并将背景区域置0，手势区域置1，最后再将手势区域平移至图像中心，并将图像规范为统一大小作为神经网络的输入。

4.根据权利要求1所述的基于视觉的无人平台手势控制方法，其特征在于：所述手势识别还包括基于CNN神经网络的动态手势识别。