CN111061367B

CN111061367B - 一种自助设备手势鼠标的实现方法

Info

Publication number: CN111061367B
Application number: CN201911233856.2A
Authority: CN
Inventors: 张琨; 朱锦雷; 张传锋
Original assignee: Synthesis Electronic Technology Co Ltd
Current assignee: Synthesis Electronic Technology Co Ltd
Priority date: 2019-12-05
Filing date: 2019-12-05
Publication date: 2023-04-07
Anticipated expiration: 2039-12-05
Also published as: CN111061367A

Abstract

本发明公开一种自助设备手势鼠标的实现方法，通过分析摄像头采集的视频，实时识别并且跟踪手势来驱动自助设备中的鼠标，进而完成相应的操作，本方法依靠视频驱动，交互体验自然高效，没有肢体接触，非常卫生。其次本方法通过目标手势检测与目标手势跟踪保证了资源占用与保证鼠标动作效果的平衡，在没有人机交互的情况下运行目标手势检测模型，当检测到模型后，转由手势跟踪模型跟踪，同时为了保证位置和目标手势分类准确度，在手势跟踪过程中定时执行目标手势检测模型，保证了手势鼠标良好的体验，既能保证手势识别的准确性，又能保证操作的流畅性。

Description

一种自助设备手势鼠标的实现方法

技术领域

本发明涉及一种自助设备手势鼠标的实现方法，属于机器视觉与人机交互技术领域。

背景技术

自从PC诞生以来，人机交互的方式主要是通过鼠标键盘，在交互的过程中人通过移动鼠标或者敲打键盘的方式输入信息，这种方式特点是：1、要求人比较准确的完成这些机械的动作；2、人与设备必然存在肢体接触。对于办公场景来说，不存在问题。但对于自助设备（咨询、导引、业务办理等）这种公共场所的机器，它会存在缺陷：1、交互过程不够顺畅高效；2、不够卫生。

发明内容

针对现有技术的缺陷，本发明提供一种自助设备手势鼠标的实现方法，依靠视频驱动，交互体验自然高效，没有肢体接触，非常卫生。

为了解决所述技术问题，本发明采用的技术方案是：一种自助设备手势鼠标的实现方法，包括以下步骤：

S01）、采集手势交互图像，利用安装在自助设备上的摄像头，采集目标手势与自助设备交互过程中录制的视频，从视频中抽取图像，形成原始图像集；

S02)、标注目标手势，利用图像标注软件，对原始图像集中目标手势的类别、在图片中的具体位置进行标注，形成特定格式数据集；

S03）、构建目标手势检测器，采用深度学习模型作为基本的目标手势检测器模型，然后利用步骤S02形成的特定格式数据集训练目标手势检测器，直至达到模型最高精度；

S04）、初始化，加载步骤S03训练的目标手势检测器，打开摄像头，初始化检测标志detect=1，跟踪计数track_count=0，最大跟踪计数track_max=M；

S05）、采集交互视频，实时采集自助设备摄像头录制的视频，判断检测标志detect是否等于1，如果是，则执行步骤S06，如果否，则执行步骤S08；

S06）、执行目标手势检测，将步骤S05采集的实时视频输入步骤S04加载的目标手势检测器，如果检测结果为目标手势，则进入步骤S07处理，否则返回步骤S05；

S07）、创建并初始化手势跟踪模型，采用相关滤波算法构建手势跟踪模型，利用目标手势检测器输出的目标手势位置初始化跟踪模型，重置当前的状态标志detect=0，track_count=0，进入步骤S09进行手势定位；

S08）、跟踪目标手势，将步骤S05采集的实时视频输入步骤S07构建的手势跟踪模型，如果输出错误，重置检测标志detect=1，返回步骤S05，否则，跟踪计数加一，并比较跟踪计数与最大跟踪计数，如果跟踪计数小于最大跟踪计数，直接进入步骤S09进行手势定位，如果跟踪计数大于最大跟踪计数，则重置检测标志detect=1，进入步骤S09进行手势定位；

S09）、手势定位，目标手势检测器或者手势跟踪器输出目标手势位置信息，然后根据整个手势边框位置计算边框中心坐标，以此代替手掌的位置，通过手势在摄像头中的活动区域与整个桌面建立的映射关系，计算手势鼠标的位置，手势鼠标的位置就是手势在摄像头的活动区域映射在桌面中的位置；

S10）、控制鼠标动作，依据步骤S06输出的目标手势类型和步骤S09输出的鼠标位置完成鼠标动作。

进一步的，步骤S05中摄像头拍摄人的角度与步骤S01中摄像头拍摄人的角度一致。

进一步的，步骤S01中，从采集的视频中按照固定的帧数间隔抽取图像，形成原始图像集。

进一步的，步骤S05中，从实时视频中采集每一帧图像或者每隔几帧采集一帧图像，然后进行目标手势检测或者手势跟踪。

进一步的，步骤S10完成的鼠标动作包括移动鼠标和鼠标点击操作。

本发明的有益效果：本发明首先通过分析摄像头采集的视频，实时识别并且跟踪手势来驱动自助设备中的鼠标，进而完成相应的操作，如鼠标移动、点击操作等。本方式依靠视频驱动，交互体验自然高效，没有肢体接触，非常卫生。

其次本方法保证了资源占用与保证鼠标动作效果的平衡，在没有人机交互的情况下运行目标手势检测模型，当检测到模型后，为了保证操作流畅度，转由手势跟踪模型跟踪，同时为了保证位置和目标手势分类准确度，在手势跟踪过程中定时执行目标手势检测模型。通过这样一个过程，保证了手势鼠标良好的体验，既能保证手势识别的准确性，又能保证操作的流畅性。

附图说明

图1为本方法的流程图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的说明。

实施例1

本实施例公开一种自助设备手势鼠标的实现方法，如图1所示，本方法包括以下步骤：

S01）、采集手势交互图像，利用安装在自助设备上的摄像头，采集目标手势与自助设备交互过程录制的视频。本实施例以两类手势举例，手掌表示鼠标一般状态，握拳表示鼠标左击操作。从录制视频中按照一定的规则（比如间隔相同的帧数）抽取图像，形成原始图像集；

S02）、标注目标手势，利用图像标注软件，对原始图像集中目标手势的类别、在图片中的具体位置进行标注，形成特定格式数据集；

S03）、构建目标手势检测器。很多手势识别方案采用经典方法，基于人工构建的特征去提取轮廓，然后进行识别，识别结果不够准确，鲁棒性差。本实施例采用深度学习模型（比如R-CNN、Fast-RCNN、Faster-RCNN、YOLO、SSD等）作为基本的目标手势检测器模型，然后使用步骤S02形成的特定格式数据集训练目标手势检测器，直至达到模型最高精度；

S05）、采集交互视频，实时采集自助设备摄像头录制的视频，采集每一帧或者每隔几帧采集一帧图像，判断检测标志detect是否等于1，如果是，则执行步骤S06，如果否，则执行步骤S08；

S07）、创建并初始化手势跟踪模型，当前主流的目标跟踪模型有相关滤波和深度学习，综合考虑准确度和算力要求，本实施例采用相关滤波算法（如KCF、DCF等）构建手势跟踪模型，利用目标手势检测器输出的目标手势位置初始化跟踪模型，重置当前的状态标志detect=0，track_count=0，进入步骤S09进行手势定位；

S10）、控制鼠标动作，依据步骤S06输出的目标手势类型和步骤S09输出的鼠标位置完成移动鼠标和左击鼠标的动作。

为了保证目标手势识别效果，步骤S05中摄像头拍摄人的角度与步骤S01中摄像头拍摄人的角度一致。

相比自助设备传统的输入方式，本实施例所述自助设备手势鼠标，不仅实现人机交互自然高效，还不用产生人机接触，非常卫生。还可以和语音输入相结合，使整个过程将更加流畅。

本实施例所述所述方法将目标手势检测与目标手势跟踪有机结合，在没有人机交互的情况下运行目标手势检测模型，当检测到模型后，为了保证操作流畅度，转由手势跟踪模型跟踪，同时为了保证位置和目标手势分类准确度，在手势跟踪过程中定时执行目标手势检测模型（通过设置检测标志和跟踪计数实现）。通过这样一个过程，保证了手势鼠标良好的体验。

以上描述的仅是本发明的基本原理和优选实施例，本领域技术人员根据本发明做出的改进和替换，属于本发明的保护范围。

Claims

1.一种自助设备手势鼠标的实现方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的自助设备手势鼠标的实现方法，其特征在于：步骤S05中摄像头拍摄人的角度与步骤S01中摄像头拍摄人的角度一致。

3.根据权利要求1所述的自助设备手势鼠标的实现方法，其特征在于：步骤S01中，从采集的视频中按照固定的帧数间隔抽取图像，形成原始图像集。

4.根据权利要求1所述的自助设备手势鼠标的实现方法，其特征在于：步骤S05中，从实时视频中采集每一帧图像或者每隔几帧采集一帧图像，然后进行目标手势检测或者手势跟踪。

5.根据权利要求1所述的自助设备手势鼠标的实现方法，其特征在于：步骤S10完成的鼠标动作包括移动鼠标和鼠标点击操作。