CN112818936B

CN112818936B - 一种连续手势的快速识别分类方法及系统

Info

Publication number: CN112818936B
Application number: CN202110229079.5A
Authority: CN
Inventors: 张旻晋; 许达文
Original assignee: Chengdu Shihaixintu Microelectronics Co ltd
Current assignee: Chengdu Shihaixintu Microelectronics Co ltd
Priority date: 2021-03-02
Filing date: 2021-03-02
Publication date: 2022-12-09
Anticipated expiration: 2041-03-02
Also published as: CN112818936A

Abstract

本发明公开了一种连续手势快速识别分类的方法及系统，包括以下步骤：采集连续手势的视频帧数据，所述视频帧数据包括多个不同的手势模型；对所述多个不同的手势模型分别进行初始特征提取，得到初始特征向量集，所述初始特征向量集包括多个不同的初始特征向量；对所述多个不同的初始特征向量分别进行单模特征映射，得到适用于特征融合的显著特征向量集，所述显著特征向量集包括多个不同的显著特征向量；对所述多个不同的显著特征向量进行特征融合，得到融合特征向量；对所述融合特征向量进行多模特征映射，生成逐帧的手势分类视频，从而实现对连续手势进行快速识别分类。

Description

一种连续手势的快速识别分类方法及系统

技术领域

本发明涉及图像快速识别技术领域，具体涉及一种连续手势的快速识别方法及系统。

背景技术

深度学习的发展使得电子设备具备语义感知能力，手势识别被广泛使用在各种领域，包括机器人，人机交互，手语识别等。大多数情况下可以使用简单的分类算法对单个手势进行实时识别分类，但是精度不高，无法满足实际应用需求。而采用复杂的网络结构进行高精度的连续手势识别，计算量非常大，难以达到实时性预测需求。

发明内容

本发明所要解决的技术问题是：对连续手势进行高精度识别分类时因计算量大，导致识别分类速度慢，难以达到实时性预测的问题；目的在于：提供一种连续手势的快速识别分类方法及系统，实现快速对连续手势进行高精度识别分类，从而达到实时性预测需求。

本发明通过下述技术方案实现：

一种连续手势的快速识别分类方法，包括：

步骤1：采集连续手势的视频帧数据，所述视频帧数据包括多个不同的手势模型；

步骤2：对所述多个不同的手势模型分别进行初始特征提取，得到初始特征向量集，所述初始特征向量集包括多个不同的初始特征向量；

步骤3：对所述多个不同的初始特征向量分别进行单模特征映射，得到适用于特征融合的显著特征向量集，所述显著特征向量集包括多个不同的显著特征向量；

步骤4：对所述多个不同的显著特征向量进行特征融合，得到融合特征向量；

步骤5：对所述融合特征向量进行多模特征映射，生成逐帧的手势分类视频。

本发明一种连续手势的快速识别分类方法的发明点在于：分步运用简单的图像处理技术，如特征提取、显著特征捕获、特征数据融合等，逐步完成从原始视频帧数据到特征数据，再到视频帧分类结果数据的快速且高精度处理，避免了直接运用复杂的网络结构对视频帧数据进行处理，从而减小了综合计算量，达到连续手势的快速实时识别分类的目的。

作为对本发明的进一步描述，步骤2中，初始特征提取的方法依次包括：卷积神经网络操作、一维卷积操作、扩张卷积操作、激活操作、一维卷积操作和dropout操作。

其中，卷积神经网络操作避免了对图像的复杂前期预处理，可以直接输入原始视频帧数据，能够有效降低反馈神经网络的复杂性，从而在初始特征提取阶段提升了对视频帧数据的处理速度；扩张卷积操作用于增加原始视频帧中多个不同手势模型的感受野，使初始特征向量具有更明显的特征，为后续的数据处理操作提供支持；drpout操作提升到了模型的泛化型，避免产生过拟合的现象，从而提高初始特征提取过程的精度。

作为对本发明的进一步描述，步骤3中，单模特征映射的方法包括一次一维卷积操作和多次扩张残差操作。其中，扩张残差操作的方法依次包括：扩张卷积操作、relu操作、一维卷积操作和dropout操作。

relu操作进一步提高了显著特征提取过程的效率。

作为对本发明的进一步描述，步骤4中，特征融合的方法为：

步骤4.1：针对所述显著特征向量集，选择出每个显著特征向量中适用于特征融合的显著特征单元，生成显著子特征向量集；

步骤4.2：对所述显著子特征向量集进行concat操作，得到显著特征数据链；

步骤4.3：对所述显著特征数据链进行全局平均池化操作、矩阵乘法操作、relu操作、矩阵乘法操作和sigmoid操作，得到特征增强的融合特征向量。

其中，选择显著子特征向量目的在于提高显著特征数据的可靠度和准确度，可避免无用数据造成的数据冗杂，进一步提高效率；concat操作能够快速将多个显著子特征向量连接在一起；而全局平均池化操作能够淡化不同特征数据之间的相对位置的组合关系，是经过卷积神经网络的数据的准确度；矩阵乘法操作进一步提高运算速度。

作为对本发明的进一步描述，步骤5中，多模特征映射的方法为：

步骤5.1：对所述融合特征向量依次进行扩张卷积操作、激活操作、一维卷积操作和dropout操作，得到手势分类数据；

步骤5.2：对所述手势分类数据进行一次一维卷积操作，生成逐帧的手势分类视频。

一种连续手势的快速识别分类系统，包括：

数据接收模块：用于接收采集到的连续手势的视频帧数据；

初始特征提取模块，用于对视频帧数据进行初始特征提取，得到初始特征向量集；

单模特征映射模块，用于捕获初始特征向量集中多个不同的初始特征向量的显著特征，得到适用于特征融合的显著特征向量集；

特征融合模块，用于对显著特征向量集中多个不同的显著特征向量进行特征融合，得到融合特征向量；

多模特征映射模块，用于对融合特征向量进行计算，生成逐帧的手势分类视频。

作为对本发明的进一步描述，其中，

初始特征提取模块包括：卷积神经网络操作执行单元、一维卷积操作执行单元A、扩张卷积操作执行单元A、激活操作执行单元A和dropout操作执行单元A；所述视频帧数据依次经过卷积神经网络操作执行单元A、一维卷积操作执行单元A、扩张卷积操作执行单元A、激活操作执行单元A和dropout操作执行单元A处理后，得到初始特征向量集；

单模特征映射模块包括：一维卷积操作执行单元B和扩张残差操作执行单元，所述一维卷积操作执行单元B和扩张残差操作执行单元对初始特征向量集进行协同处理，得到显著特征向量集；

特征融合模块包括：特征选择单元，用于选择出每个显著特征向量中适用于特征融合的显著特征单元，生成显著子特征向量集；向量连接单元，用于将多个显著子特征向量连接在一起，得到显著特征数据链；特征增强单元，用于对显著特征数据链进行全局平均池化操作、矩阵乘法操作、relu操作、矩阵乘法操作和sigmoid操作，得到特征增强的融合特征向量；

多模特征映射模块包括：扩张卷积操作执行单元B、激活操作执行单元B、一维卷积操作执行单元C和dropout操作执行单元B和PE阵列单元；所述融合特征向量依次进行扩张卷积操作、激活操作、一维卷积操作、dropout操作和一维卷积操作，得到逐帧的手势分类视频。

作为对本发明的进一步描述，扩张残差操作执行单元包括：PE阵列子单元、激活操作执行子单元和dropout操作执行子单元，用于和一维卷积操作执行单元B一起对初始特征向量集进行数据处理，得到显著特征向量集。

本发明与现有技术相比，具有如下的优点和有益效果：

1、本发明一种连续手势的快速识别分类方法，能够有效提高连续手势的识别分类效率，达到实时预测的目的；

2、本发明一种连续手势的快速识别分类方法，能在提升识别分类效率的同时也能提高识别分类的精度。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定。在附图中：

图1为实施例1的一种连续手势的快速识别分类方法示意图。

图2为实施例2的一种连续手势的快速识别分类系统结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施例和附图，对本发明作进一步的详细说明，本发明的示意性实施方式及其说明仅用于解释本发明，并不作为对本发明的限定。

实施例1：

大多数情况下，对单个手势进行识别分类时，可以使用简单的识别分类方法来快速实现。然而，使用简单的识别分类方法存在精度低的缺点，但采用复杂的网络结构进行高精度的连续手势识别分类，计算量非常大，难以达到实时性预测需求。为此，本实施例提出一种连续手势的快速识别分类方法，实现连续手势的快速、精确识别分类。

如图1为本实施例一种连续手势的快速识别分类方法示意图。如图1所示，该方法包括：

步骤1：利用传感器采集连续手势的视频帧数据。其中，视频帧数据包括多个不同的手势模型。传感器可以是但不限于摄像机、摄像头、激光雷达。

步骤2：对多个不同的手势模型分别进行初始特征提取，得到初始特征向量集。其中，

初始特征向量集包括多个不同的初始特征向量。在本步骤中，初始特征提取依次包括：卷积神经网络操作、一维卷积操作、扩张卷积操作、激活操作、一维卷积操作和dropout操作。其中，卷积神经网络操作可避免对图像的复杂前期预处理，可以直接输入原始视频帧数据，能够有效降低反馈神经网络的复杂性，从而在初始特征提取阶段提升了对视频帧数据的处理速度；扩张卷积操作用于增加原始视频帧中多个不同手势模型的感受野，使初始特征向量具有更明显的特征，为后续的数据处理操作提供支持；drpout操作提升到了模型的泛化型，避免产生过拟合的现象，从而提高初始特征提取过程的精度。

步骤3：对多个不同的初始特征向量分别进行单模特征映射，得到适用于特征融合的显著特征向量集。其中，显著特征向量集包括多个不同的显著特征向量。在本步骤中，单模特征映射的方法包括一次一维卷积操作和多次扩张残差操作。其中，扩张残差操作的方法依次包括：扩张卷积操作、relu操作、一维卷积操作和dropout操作。relu操作的目的是进一步提高显著特征提取过程的效率。

步骤4：对多个不同的显著特征向量进行特征融合，得到融合特征向量。在本步骤中，特征融合的方法为：

针对显著特征向量集，选择出每个显著特征向量中适用于特征融合的显著特征单元，生成显著子特征向量集；

对显著子特征向量集进行concat操作，得到显著特征数据链；

对显著特征数据链进行全局平均池化操作、矩阵乘法操作、relu操作、矩阵乘法操作和sigmoid操作，得到特征增强的融合特征向量。

步骤5：对所述融合特征向量进行多模特征映射，生成逐帧的手势分类视频。在本步骤中，多模特征映射的方法具体为：

对所述融合特征向量依次进行扩张卷积操作、激活操作、一维卷积操作和dropout操作，得到手势分类数据；

对所述手势分类数据进行一次一维卷积操作，生成逐帧的手势分类视频。

实施例2：

图2为本实施例一种连续手势的快速识别分类系统结构框图。如图所示，该系统包括：

数据接收模块：用于接收采集到的连续手势的视频帧数据；

作为对本发明的进一步描述，其中，

当视频帧数据输入到初始特征提取模块中，通过PE阵列和加法树执行卷积操作，然后将初始特征提取模块输出的初始特征向量输入到单模特征映射模块中，在单模特征映射模块依次执行一维卷积操作和多个扩张残差操作，扩张残差操作包括依次执行扩张卷积操作、relu操作、一维卷积操作和dropout操作，接着将单模特征映射模块生成的显著特征向量作为集合输入特征融合模块，依次执行特显著子特征向量选择操作、全局平均池化操作、矩阵乘法操作、relu操作、矩阵乘法操作和sigmoid操作，最后将融合的特征向量输入到多模特征映射模块，依次执行多个扩张残差操作和一维卷积操作。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种连续手势的快速识别分类方法，其特征在于，包括以下步骤：

所述初始特征提取依次包括：卷积神经网络操作和一维卷积操作；

所述单模特征映射包括：一次一维卷积操作和多次扩张残差操作；

所述扩张残差操作包括：relu操作和一维卷积操作；

步骤4：对所述多个不同的显著特征向量进行特征融合，得到融合特征向量；所述特征融合包括：

步骤4.1：针对显著特征向量集，选择出每个显著特征向量中适用于特征融合的显著特征单元，生成显著子特征向量集；

步骤4.2：对显著子特征向量集进行concat操作，得到显著特征数据链；

步骤4.3：对显著特征数据链进行矩阵乘法操作、relu操作和sigmoid操作，得到特征增强的融合特征向量；

2.根据要求1所述的一种连续手势的快速识别分类方法，其特征在于，所述步骤2中，所述卷积神经网络操作和一维卷积操作之后，依次包括：扩张卷积操作、激活操作、一维卷积操作和dropout操作。

3.根据权利要求1所述的一种连续手势的快速识别分类方法，其特征在于，所述步骤3中，所述步骤所述relu操作之前，包括：扩张卷积操作；所述relu操作之后，依次包括：一维卷积操作和dropout操作。

4.根据权利要求1或2所述的一种连续手势的快速识别分类方法，其特征在于，所述步骤4.3还包括：全局平均池化操作。

5.根据权利要求4所述的一种连续手势的快速识别分类方法，其特征在于，所述多模特征映射的方法为：

6.一种连续手势的快速识别分类系统，其特征在于，包括：

数据接收模块：用于接收采集到的连续手势的视频帧数据；

多模特征映射模块，用于对融合特征向量进行计算，生成逐帧的手势分类视频；

所述初始特征提取模块包括：

卷积神经网络操作执行单元、一维卷积操作执行单元A、扩张卷积操作执行单元A、激活操作执行单元A和dropout操作执行单元A；所述视频帧数据依次经过卷积神经网络操作执行单元A、一维卷积操作执行单元A、扩张卷积操作执行单元A、激活操作执行单元A和dropout操作执行单元A处理后，得到初始特征向量集；

所述单模特征映射模块包括：

一维卷积操作执行单元B和扩张残差操作执行单元，所述一维卷积操作执行单元B和扩张残差操作执行单元对初始特征向量集进行协同处理，得到显著特征向量集；

所述特征融合模块包括：

特征选择单元，用于选择出每个显著特征向量中适用于特征融合的显著特征单元，生成显著子特征向量集；

向量连接单元，用于将多个显著子特征向量连接在一起，得到显著特征数据链；

特征增强单元，用于对显著特征数据链进行全局平均池化操作、矩阵乘法操作、relu操作、矩阵乘法操作和sigmoid操作，得到特征增强的融合特征向量；

所述多模特征映射模块包括：

扩张卷积操作执行单元B、激活操作执行单元B、一维卷积操作执行单元C和dropout操作执行单元B和PE阵列单元；所述融合特征向量依次进行扩张卷积操作、激活操作、一维卷积操作、dropout操作和一维卷积操作，得到逐帧的手势分类视频；

所述扩张残差操作执行单元包括：PE阵列子单元、激活操作执行子单元和dropout操作执行子单元，用于和一维卷积操作执行单元B一起对初始特征向量集进行数据处理，得到显著特征向量集。