CN112380976A

CN112380976A - 基于神经网络视觉触觉传感器融合的手势识别系统及方法

Info

Publication number: CN112380976A
Application number: CN202011262611.5A
Authority: CN
Inventors: 吴幸; 黄泽鹏; 金梦歌; 钱程
Original assignee: East China Normal University
Current assignee: East China Normal University
Priority date: 2020-11-12
Filing date: 2020-11-12
Publication date: 2021-02-19

Abstract

本发明公开了基于神经网络视觉触觉传感器融合的手势识别系统，所述手势识别系统包括:视觉传感器、体感传感器、手套和手势识别模块；所述体感传感器设置于手套内，所述视觉传感器和所述体感传感器分别与所述手势识别模块连接；所述手势识别模块用于根据所述视觉传感器采集的视觉数据和所述体感传感器采集的体感数据，采用神经网络算法进行手势识别。本发明将视觉传感器采集的视觉数据和体感传感器采集的体感数据结合进行手势识别，提高了手势识别的准确度。

Description

基于神经网络视觉触觉传感器融合的手势识别系统及方法

技术领域

本发明涉及手势识别技术领域，特别涉及基于神经网络视觉触觉传感器融合的手势识别系统及方法。

背景技术

随着计算机在社会中的普及，人机交互的技术对于计算机的应用产生了积极的影响。人们越来越重视研究用于跨越人机障碍的新技术，并且使人机交互变得更自然。长期以来，手势一直被认为是一种更直观、更便捷的与计算机进行通信的交互技术。

目前的手势识别的途径通常分为接触式传感器和非接触式传感器两类。采用接触式传感器进行手势识别时，存在准确率不高的技术缺陷，采用非接触式传感器进行手势识别时，会因为环境的影响而造成准确率不高的技术缺陷。

如何提高手势识别的准确度成为一个亟待解决的技术问题。

发明内容

本发明的目的是提供基于神经网络视觉触觉传感器融合的手势识别系统及方法，以提高手势识别的准确度。

为实现上述目的，本发明提供了如下方案：

一种基于神经网络视觉触觉传感器融合的手势识别系统，所述手势识别系统包括:

视觉传感器、体感传感器、手套和手势识别模块；

所述体感传感器设置于手套内，所述视觉传感器和所述体感传感器分别与所述手势识别模块连接；

所述手势识别模块用于根据所述视觉传感器采集的视觉数据和所述体感传感器采集的体感数据，采用神经网络算法进行手势识别。

可选的，所述视觉传感器包括摄像头和嵌入式芯片；

所述摄像头与所述嵌入式芯片连接，所述嵌入式芯片与所述手势识别模块连接，所述嵌入式芯片用于对摄像头采集的图像进行预处理，获得视觉数据，并将所述视觉数据传输给所述手势识别模块。

可选的，所述体感传感器包括多个弯曲度感应模块和多个九轴姿态角度传感器；

多个所述弯曲度感应模块分别设置在所述手套内的手背部的每个手指的指关节位置；多个所述九轴姿态角度传感器设置在手套内的手背部的每个手指的指根位置和手背部的中央位置；

多个所述弯曲度感应模块和多个所述九轴姿态角度传感器分别与所述手势识别模块连接。

可选的，所述弯曲度感应模块包括电源级联模块和弯曲度传感器；

所述电源级联模块包括电源和定值电阻，所述定值电阻与所述弯曲度传感器串联连接，组成串联分压电路，所述定值电阻与弯曲度传感器的连接点作为串联分压电路的分压点，所述分压点与手势识别模块连接；

所述电源的正极端和负极端分别与所述串联分压电路的两端连接。

可选的，所述手势识别模块，具体包括：视觉数据处理子模块、体感数据处理子模块、数据拼接子模块和手势识别子模块；

所述视觉数据处理子模块，用于根据视觉数据利用训练好的卷积神经网络模型进行姿势识别，获得第一识别结果；

所述体感数据处理子模块，用于根据体感数据利用训练好的多层感知网络模型进行姿势识别，获得第二识别结果；

所述数据拼接子模块，用于将所述第一识别结果和所述第二识别结果进行归一化和拼接，获得拼接矩阵；

所述手势识别子模块用于根据拼接矩阵利用训练好的稀疏神经网络模型进行姿势识别，获得第三识别结果，作为手势识别结果。

可选的，所述手势识别系统还包括通讯模块；

所述视觉传感器和所述体感传感器分别通过所述通讯模块与所述手势识别模块连接。

一种基于神经网络视觉触觉传感器融合的手势识别方法，所述手势识别方法包括如下步骤：

获取人手的视觉数据和体感数据；

根据视觉数据利用训练好的卷积神经网络模型进行姿势识别，获得第一识别结果；

根据体感数据利用训练好的多层感知网络模型进行姿势识别，获得第二识别结果；

将所述第一识别结果和所述第二识别结果进行归一化和拼接，获得拼接矩阵；

根据拼接矩阵利用训练好的稀疏神经网络模型进行姿势识别，获得第三识别结果，作为手势识别结果。

可选的，所述卷积神经网络模型为基于迁移学习的MobileNet V2结构，所述MobileNet V2结构包括深度可分离卷积层、归一化处理层、线性激活函数层、最大池化层和全连接层；

所述多层感知网络模型包括1层输入层、2层隐藏层和1层输出层；

所述稀疏神经网络模型包括1层输入层、2层隐藏层和1层输出层。

可选的，所述根据视觉数据利用训练好的卷积神经网络模型进行姿势识别，获得第一识别结果，之前还包括：

以不同姿势下的视觉数据作为第一训练集，采用fine-tuning算法训练卷积神经网络模型中的全连接层参数，获得训练好的卷积神经网络模型；

以不同姿势下的体感数据作为第二训练集，采用误差反向传播算法训练多层感知网络模型的参数，获得训练后的多层感知网络模型；

以不同姿势下的第一识别结果和第二识别结果拼接成的拼接矩阵，作为第三训练集，采用误差反向传播算法训练稀疏神经网络模型的参数，获得训练后的稀疏神经网络模型。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的基于神经网络视觉触觉传感器融合的手势识别系统的结构图；

图2为本发明提供的体感传感器的分布图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对发明作进一步详细的说明。

如图1所示，本发明提供一种基于神经网络视觉触觉传感器融合的手势识别系统，所述手势识别系统包括:视觉传感器1、体感传感器2、手套和手势识别模块3；所述体感传感器1设置于手套内，所述视觉传感器1和所述体感传感器2分别与所述手势识别模块3连接；所述手势识别模块3用于根据所述视觉传感器采集的视觉数据和所述体感传感器采集的体感数据，采用神经网络算法进行手势识别。所述手势识别系统还包括通讯模块；所述视觉传感器和所述体感传感器分别通过所述通讯模块与所述手势识别模块连接。

其中，所述视觉传感器1包括摄像头和嵌入式芯片；所述摄像头与所述嵌入式芯片连接，所述嵌入式芯片与所述手势识别模块3连接，所述嵌入式芯片用于对摄像头采集的图像进行预处理，获得视觉数据，并将所述视觉数据传输给所述手势识别模块3。摄像头位于手部的正下方，摄像头内部通过感光矩阵，将光信号转化为电信号，摄像头的控制模块通过I2C接口对摄像头的控制寄存器进行配置，随后摄像头根据控制寄存器的配置结果对信号进行处理，如白平衡、饱和度、色彩等基础处理。图像输出格式为JPEG，通过嵌入式芯片与通讯模块的并行数据总线相连接，通过并行数据总线将视觉数据传输至手势识别模块3。具体的，使用摄像头采集手势图像：在嵌入式开发板上安装的摄像头模块可以采集实时的手势图像；运用自带嵌入式微处理器的OV5640摄像头，其具有500W像素和2592*1944的分辨率的优质产品参数，来进行视觉数据的采集。

如图2所示，所述体感传感器2包括多个弯曲度感应模块21和多个九轴姿态角度传感器22；多个所述弯曲度感应模块21分别设置在所述手套内的手背部的每个手指的指关节位置；多个所述九轴姿态角度传感器22设置在手套内的手背部的每个手指的指根位置和手背部的中央位置；多个所述弯曲度感应模块21和多个所述九轴姿态角度传感器22分别与所述手势识别模块连接。所述弯曲度感应模块21包括电源级联模块21a和弯曲度传感器21b；所述电源级联模块21a包括电源和定值电阻，所述定值电阻与所述弯曲度传感器21b串联连接，组成串联分压电路，所述定值电阻与弯曲度传感器21b的连接点作为串联分压电路的分压点，所述分压点与手势识别模块3连接；所述电源的正极端和负极端分别与所述串联分压电路的两端连接。弯曲度传感器和九轴姿态角度传感器与通讯模块相连接，通过通讯模块中的I2C接口将反映手部姿态的角度数据和反映手指弯曲度的分压数据传输给手势识别模块3，手势识别模块3首先对获取的图像数据、角度数据和分压数据分别进行处理。

所述弯曲度传感器21b为测量弯曲角度或偏转量的装置，通过不同弯曲角度改变传感器的电阻值来判断弯曲角度。具有2-Pin金属引脚(间距0.1”，其中“””表示0.1英寸)的电源级联接口，可供多模块级联使用，兼容5V、3.3V测量系统。所述九轴姿态角度传感器22设置在可穿戴手套的手背每个指根和手背中央处，能够随着手部姿态的变化，利用微处理器和先进动力学解算与卡尔曼动态滤波算法快速求解出实时运动状态，其内部自带电压稳定电路工作电压兼容3.3V～5V系统。手套五指内均具有弯曲度传感器，手势变化导致的手指弯曲张合时，会产生相应的传感器电阻阻值的变化；其接口类型为2-Pin的金属引脚；其中传感器笔直状态的电阻的阻值为25kΩ，弯曲电阻的变化为10kΩ～125kΩ，只有向印字方向弯曲时会产生弯曲电阻的可靠数据变化，其在-35℃到80℃的工作温度下可以达到一百万次以上的弯曲寿命。

九轴姿态角度传感器设置在可穿戴手套的手背每个指根和手背中央处，其利用集成的高精度的陀螺仪、加速度计、地磁场传感器，采用高性能的微处理器和先进的动力学解算与卡尔曼动态滤波算法，能够快速求解出当前的实时运动姿态。姿态测量精度静态0.05度，动态0.1度，稳定性极高。

所述手势识别模块3，具体包括：视觉数据处理子模块、体感数据处理子模块、数据拼接子模块和手势识别子模块；所述视觉数据处理子模块，用于根据视觉数据利用训练好的卷积神经网络模型进行姿势识别，获得第一识别结果；所述体感数据处理子模块，用于根据体感数据利用训练好的多层感知网络模型进行姿势识别，获得第二识别结果；所述数据拼接子模块，用于将所述第一识别结果和所述第二识别结果进行归一化和拼接，获得拼接矩阵；所述手势识别子模块用于根据拼接矩阵利用训练好的稀疏神经网络模型进行姿势识别，获得第三识别结果，作为手势识别结果。具体的，通过稀疏神经网络实现多模态识别，采用BSV(Bioinspired somatosensory–visual，基于生物仿生的视触觉)机器学习方法对视觉数据和传感器数据进行融合，具有更好的抗噪声和抗过曝、低曝光的能力。最终多模态融合识别，得出最终的手势识别结果。

具体的，视觉数据处理子模块主体为卷积神经网络，网络结构为采用迁移学习的MobileNet V2结构，网络输出为视觉数据分类结果的可能性。

本发明所采用的卷积神经网络为基于迁移学习的MobileNet V2结构，网络主体部分参考了谷歌提出的MobileNet V2结构，其主要由深度可分离卷积层、归一化处理、线性激活函数层和最大池化层组成。基于这个主体部分，在网络的最后输出部分即全连接层中，自主定义了层结构。网络的训练采用了fine-tuning的方法，仅对自定义的层结构参数进行训练，采用这种方法训练后的网络，非常好的保留了已训练好的主体部分的图像分类能力。

体感数据处理子模块主体为多层感知机网络，网络结构包含1层输入层、2层隐藏层和1层输出层。网络的输出为对体感数据分类结果的可能性。

网络结构包含1层输入层、2层隐藏层和1层输出层。输入层的输入为呈矩阵的体感数据内容，隐藏层为连接多个特征值的线性组合单元，输出层为对不同体感数据分类结果的可能性矩阵。训练过程包括：基于已有的体感数据和相应标签，采用BP算法迭代网络参数，将表现最优的参数集保存，得到训练好的针对于本例的神经网络。

手势识别子模块主体为稀疏神经网络，稀疏神经网络模拟了人脑在处理不同类型的传感信息时的融合机制。通过稀疏神经网络，对视觉数据处理子模块和体感数据处理子模块的结果进行相互融合。

网络结构包含1层输入层、2层隐藏层和1层输出层。输入层的输入为两个单独数据处理模块的输出矩阵拼接，拼接过程中进行了数据归一化处理，将两者的数据映射到统一的范围内，通过这种形式，两者的数据进行了融合。融合的结果为包含视觉分类(第一识别结果)和体感分类结果(第二识别结果)的拼接矩阵。

隐藏层为连接多个特征值的线性组合单元，输出层为对融合数据分类结果的可能性。网络训练过程包括：基于已有的融合数据和相应标签，采用BP(Error BackPropagation，误差反向传播)算法迭代网络参数以及稀疏算法，将处于稀疏阈值以上并且表现最优的参数集保存，得到训练好的稀疏神经网络。

本发明将视觉数据和置有弯曲度传感器和九轴姿态角度传感器的智能触感手套采集的手部体感数据结合起来，运用生物启发的数据融合结构，通过卷积神经网络来进行视觉处理，在特征层面实现由一个稀疏神经网络进行的视觉数据和体感数据的融合和识别。通过这种多模态融合方式，当视觉数据受到复杂环境(如图像噪声干扰和低或过曝光情况)的干扰时，可以提高识别准确率，以此来进行复杂情况下的手势识别应用，也可用于通过手势行进的机器人导航。

本发明还提供一种基于神经网络视觉触觉传感器融合的手势识别方法，所述手势识别方法包括如下步骤：

获取人手的视觉数据和体感数据。

根据视觉数据利用训练好的卷积神经网络模型进行姿势识别，获得第一识别结果。

根据体感数据利用训练好的多层感知网络模型进行姿势识别，获得第二识别结果。

将所述第一识别结果和所述第二识别结果进行归一化和拼接，获得拼接矩阵。

其中，所述卷积神经网络模型为基于迁移学习的MobileNet V2结构，所述MobileNet V2结构包括深度可分离卷积层、归一化处理层、线性激活函数层、最大池化层和全连接层；所述多层感知网络模型包括1层输入层、2层隐藏层和1层输出层；所述稀疏神经网络模型包括1层输入层、2层隐藏层和1层输出层。

所述根据视觉数据利用训练好的卷积神经网络模型进行姿势识别，获得第一识别结果，之前还包括：以不同姿势下的视觉数据作为第一训练集，采用fine-tuning算法训练卷积神经网络模型中的全连接层参数，获得训练好的卷积神经网络模型；以不同姿势下的体感数据作为第二训练集，采用误差反向传播算法训练多层感知网络模型的参数，获得训练后的多层感知网络模型；以不同姿势下的第一识别结果和第二识别结果拼接成的拼接矩阵，作为第三训练集，采用误差反向传播算法训练稀疏神经网络模型的参数，获得训练后的稀疏神经网络模型。

本发明基于多模态融合识别手势的智能系统，在采用接触式的传感器同时，应用非接触式的图像识别，利用生物启发的神经网络结构，在感知决策中融合视觉数据以及躯体可穿戴设备的体感数据，以提高识别任务的准确性。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

本文中应用了具体个例对发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

Claims

1.一种基于神经网络视觉触觉传感器融合的手势识别系统，其特征在于，所述手势识别系统包括:

视觉传感器、体感传感器、手套和手势识别模块；

2.根据权利要求1所述的基于神经网络视觉触觉传感器融合的手势识别系统，其特征在于，所述视觉传感器包括摄像头和嵌入式芯片；

3.根据权利要求1所述的基于神经网络视觉触觉传感器融合的手势识别系统，其特征在于，所述体感传感器包括多个弯曲度感应模块和多个九轴姿态角度传感器；

4.根据权利要求3所述的基于神经网络视觉触觉传感器融合的手势识别系统，其特征在于，所述弯曲度感应模块包括电源级联模块和弯曲度传感器；

5.根据权利要求1所述的基于神经网络视觉触觉传感器融合的手势识别系统，其特征在于，所述手势识别模块，具体包括：视觉数据处理子模块、体感数据处理子模块、数据拼接子模块和手势识别子模块；

所述手势识别子模块，用于根据拼接矩阵利用训练好的稀疏神经网络模型进行姿势识别，获得第三识别结果，作为手势识别结果。

6.根据权利要求1所述的基于神经网络视觉触觉传感器融合的手势识别系统，其特征在于，所述手势识别系统还包括通讯模块；

7.一种基于神经网络视觉触觉传感器融合的手势识别方法，其特征在于，所述手势识别方法包括如下步骤：

获取人手的视觉数据和体感数据；

8.根据权利要求7所述的基于神经网络视觉触觉传感器融合的手势识别方法，其特征在于，所述卷积神经网络模型为基于迁移学习的MobileNet V2结构，所述MobileNetV2结构包括深度可分离卷积层、归一化处理层、线性激活函数层、最大池化层和全连接层；

9.根据权利要求7所述的基于神经网络视觉触觉传感器融合的手势识别方法，其特征在于，所述根据视觉数据利用训练好的卷积神经网络模型进行姿势识别，获得第一识别结果，之前还包括：