CN114580525A

CN114580525A - 一种面向含缺失数据的手势动作分类方法

Info

Publication number: CN114580525A
Application number: CN202210195763.0A
Authority: CN
Inventors: 马千里; 柳真
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2022-02-25
Filing date: 2022-02-25
Publication date: 2022-06-03

Abstract

本发明公开了一种面向含缺失数据的手势动作分类方法，过程如下：获取含缺失数据的手势动作数据集，依据缺失信息将其划分为观察值集和缺失值集；利用观察值集中每一列变量的均值对缺失值集进行预填补；基于预填补的数据，训练一个基于类别感知最优运输神经网络的手势动作分类器；利用手势动作分类器对预填补数据中的观察值进行重构，隐式地利用分类器的类别感知信息对缺失值进行填补；同时，采用最优运输理论减少同类别手势动作数据分布距离，显式地利用类别感知信息对缺失值进行填补；将填补后的数据作为感知机的输入，并最终输出分类结果。本发明将类别感知和最优运输理论应用于含缺失数据的手势动作分类领域，有效提高了分类的准确率和效率。

Description

一种面向含缺失数据的手势动作分类方法

技术领域

本发明涉及数据挖掘和机器学习技术领域，具体涉及一种面向含缺失数据的手势动作分类方法。

背景技术

手势动作分类是人机交互技术的重要基础，也是相关智能设备和工业领域中不可忽视的技术。然而，由于传感器故障、障碍物阻挡和操作失误等，导致实际采集获取的手势动作数据常常包含缺失值。与此同时，已有的手势动作分类方法往往是基于数据是完整的假设，难以合理地对含缺失数据的手势动作执行分类。因此，设计面向含缺失数据的手势动作分类方法具有重要的意义。

现有的处理含缺失数据的手势动作分类方法可以简单地分为两类：直接删除包含缺失值的数据和先对缺失数据进行填补然后执行分类的方法。直接删除包含缺失值的手势动作数据容易导致观察值信息的丢失，特别是当缺失率比较高的时候。此外，在现实复杂场景中，采集的每条数据均可能不同程度都会包含缺失值，从而导致完整的数据数量极少。采用零、均值和最近邻等方法先对包含缺失值得手势动作数据进行填补，然后进行手势动作分类方法是现有方法的常见策略。然而，手势动作数据的填补和分类的过程是独立的，并且填补的过程往往是基于无监督的设定，导致填补的缺失值不可避免地引入了分类错误。

发明内容

本发明的目的是为了解决现有技术中的上述缺陷，提供一种面向含缺失数据的手势动作分类方法，该方法设计了一种基于类别感知最优运输的神经网络，在网络训练过程中采用分类器的类别感知信息对缺失数据进行填补，从而降低填补到分类的偏差。同时，为了使得填补的值更加适合分类，本发明采用最优运输理论来降低同类手势动作数据分布的差异，促使填补后的同类数据分布更加相似。

本发明的目的可以通过采取如下技术方案达到：

一种面向含缺失数据的手势动作分类方法，所述手势动作分类方法包括以下步骤：

S1、获取含缺失数据的手势动作数据集，依据缺失信息将其划分为观察值集和缺失值集；

S2、利用观察值集中每一列变量的均值对缺失值集中每一列变量进行预填补，得到预填补的完整数据集；

S3、基于预填补的完整数据集，训练一个基于类别感知最优运输神经网络的手势动作分类器，所述手势动作分类器包括一个基于类别感知最优运输的填补模块和一个基于感知机的分类模块；

S4、在所述基于类别感知最优运输的填补模块中对预填补数据中的观察值进行重构，并隐式地利用基于感知机的分类模块中的类别感知信息对缺失值进行填补；

S5、采用最优运输理论减少从同类别内随机选取的两组数据分布距离，使得同类数据分布相似，显式地利用手势动作类别感知信息对缺失值进行填补；

S6、将经过基于类别感知最优运输的填补模块填补后的完整数据作为基于感知机的分类模块的输入，训练类别感知最优运输神经网络，并将含缺失数据的测试集作为训练好的类别感知最优运输神经网络的输入，输出最终的手势动作分类结果。

进一步地，所述步骤S1过程如下：

S11、获取含缺失数据的手势动作数据集Z，表示为

其中Y_n表示第n个样本X_n的标签，n的取值范围为[1,N]，N为数据集Z中包含的样本总数，第n个样本X_n表示为(x₁,x₂,null,…,x_d,…,x_D)，其中null表示缺失值，x_d表示第d个变量，d的取值范围为[1,D]，在现实生活场景中采集得到的手势动作数据集Z，样本X_n中至少都会包含一个值为null的变量；

S12、依据数据集Z中每个样本X_n中标记为null的缺失信息，数据集Z中所有样本包含的缺失信息定义为一个N行D列的掩码矩阵M∈{m_nd}^N×D，m_nd的取值为1或者0，如果m_nd等于1表示样本X_n的第d个变量x_d为缺失值，m_nd等于0表示为观察值，依据掩码矩阵M中m_nd值全为0的对应样本的变量划分为观察值集，将m_nd值全为1的对应样本的变量划分为缺失值集。对观察值集中同一列变量进行归一化处理，减少异常数值和噪声数值对整体数据分布的影响。

进一步地，所述步骤S2过程如下：

S21、利用步骤S12中获取的观察值集，计算观察值集中所有样本同列变量数值的均值，得到一个长度为D的数组B，数组B中的每一个元素表示对应变量所在列的均值；

S22、利用步骤S21中获取的数组B对步骤S12中获取的缺失值集进行均值预填补，采用数组B中所在列对应的值对缺失值集中所有样本对应列变量值为null的变量进行预填补，将经过预填补后的缺失值集和观察值集合并得到预填补的完整数据集。

进一步地，所述步骤S3过程如下：

利用步骤S22中得到的预填补的完整数据集，训练一个基于类别感知最优运输神经网络的手势动作分类器，采用基于类别感知最优运输的填补模块执行缺失值填补任务优化的同时，将上述填补模块得到的完整数据输入到基于感知机的分类模块进行分类训练，实现对包含缺失值数据的填补任务和分类任务的联合优化，隐式地利用分类模块的类别感知信息对填补任务进行优化，降低填补数值引入的分类错误率；其中，所述基于类别感知最优运输的填补模块包括三层全连接神经网络，分别是输入层、隐藏层和输出层，输入层和输出层的维度设定为手势动作数据的变量数，隐藏层的维度为手势动作数据变量数的两倍，输出层对缺失值位置的变量进行填补；所述基于感知机的分类模块由三层神经网络组成，其输入数据是基于类别感知最优运输的填补模块执行缺失值填补后的完整数据。

进一步地，所述步骤S4过程如下：

S41、在所述基于类别感知最优运输的填补模块的输入层与输出层中观察值位置构建一对一的映射关系，对观察值进行重构，促使输出层在缺失位置得到的填补值获取观察值的分布信息，映射关系

定义如下：

其中，

表示全1的行向量，⊙表示向量间的元素积，其中样本

表示经过步骤S22中均值预填补的数据，表示所述基于类别感知最优运输的填补模块中输入层的输入值，X_imp表示所述基于类别感知最优运输的填补模块中输出层的输出值，m_n表示步骤S12中定义的缺失掩码矩阵M中的一个行向量，表示样本

的缺失掩码信息；

S42、对X_imp中观察值位置的变量，采用经过均值预填补的数据

中观察值变量对X_imp中对应观察值位置的数值进行替换，获取对含缺失值数据X_n执行填补后的完整手势动作数据X_com表示如下：

将数据集Z中所有样本X_n对应的X_com作为基于感知机的分类模块的输入数据，参与分类任务的训练，在分类任务优化过程中隐式地利用感知机的类别感知信息对缺失位置变量的填补任务进行优化，通过利用感知机的类别感知信息促使缺失位置填补的变量数值向有利于分类任务的方向进行更新。

进一步地，所述步骤S5过程如下：

S51、依据步骤S42中得到的数据集Z中所有样本X_n对应的完整手势动作数据X_com，将所有完整手势动作数据X_com组成的数据集记为Z_com，首先从Z_com中同类手势动作数据内部随机选取两组样本数量均为T的数据子集

和

其中，k表示数据集Z_com中第k类手势动作数据，a和b分别表示随机选取的不同数据子集，最优运输理论能够衡量两个离散测度α和β的分布差异，数据子集

和

依据最优运输理论转换为离散测度

和

依据最优运输理论，采用

表示同类手势动作数据内选取的两个数据子集在物理空间层面上的数据分布距离，且

的值越小，表示从同类手势动作数据内选的两个数据子集

和

间的数据分布差异越小，同类数据分布差异越小能够增加不同类别手势动作数据分布间的差异；

S52、由于数据集Z_com中所有数据X_com中的观察值一直保持不变，通过减小同类手势动作数据子集

和

之间分布差异，能使得同类手势动作数据分布更加相似，上述过程转换为对同类手势动作数据的进行填补的损失函数

具体如下：

其中，K表示数据集Z_com中的类别数，L表示在类别k内重复随机取数据子集的次数，上式采用

表示随机从类别k内选取的两个数据子集

和

Sinkhorn表示最优运输理论中的Sinkhorn算法，能够求取离散测度变换

和

之间的最优运输方案，使得随机选取的数据子集

和

之间的数据分布差异变小。

和

中的观察值集在最优运输优化过程中一直保持不变，促使缺失位置填补的值向观察值集分布靠拢，从而使得填补后的同类样本更加相似。

进一步地，所述步骤S6包括：

S61、将S52中经过最优运输理论对同类别数据进行约束后的所有数据X_com输入到基于感知机的分类模块中进行分类，分类的学习目标

表示如下：

其中，N表示数据集Z_com中的样本数，K表示数据集Z_com中的类别数，

表示对含缺失值数据X_n进行填补后的X_com是类别k的二进制标签，p(Y_n|X_com)^k表示分类器预测样本X_com为类别k的概率；

S62、X_com中缺失位置的变量信息在基于类别感知最优运输的填补模块中受到步骤S41中的

和步骤S52中的

约束进行填补任务的训练，同时X_com的缺失位置变量信息也会受到步骤S61中基于感知机的分类器模块中的

的约束进行分类任务的训练，使得X_com中缺失位置的变量信息能够同时进行填补和分类任务，基于类别感知最优运输神经网络的手势动作分类器的整体学习目标

表示如下：

通过上述学习目标

基于类别感知最优运输神经网络的分类器能够对填补和分类任务的进行联合优化，能够利用上

和

的类别信息对缺失位置的变量数据进行填补，缩减同类内手势动作数据分布差异的同时提高不同类间手势动作数据分布差异，使得填补的缺失值有利于手势动作的分类。

本发明相对于现有技术具有如下的优点及效果：

1、本发明首次将最优运输理论应用于含缺失数据的手势动作分类领域，使得填补的缺失值更加有利于分类，能够直接对含缺失值的手势动作数据进行分类；

2、本发明隐式地利用分类器在训练过程的类别感知信息对缺失值进行填补，并显式地采用最优运输理论减少同类手势动作数据分布差异，能够有效缓解填补引入的分类误差；

3、本发明将缺失数据的填补和分类任务进行联合优化，能够利用缺失数据中的观察值分布信息进行训练，从而避免直接删除含缺失值数据导致的信息丢失问题；

4、本发明直接使用含缺失值的手势动作数据进行训练，无需额外的人工专业知识协助，能够直接对含缺失数据的手势动作进行分类；

5、本发明的手势动作分类算法在数据缺失率达到了99％的Motion Capture HandPostures手势动作数据集进行测试，其手势动作分类准确率达到了97.7％。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例公开的一种面向含缺失数据的手势动作分类方法的流程图；

图2是本发明实施例公开的一种面向含缺失数据的手势动作分类方法中三层神经网络的结构图；

图3是Motion Capture Hand Postures数据集采用的手势动作数据采集感知手套示意图，用于采集握拳、撑开手、用食指点、用食指和中指点以及抓这五种手势动作数据；

图4是Motion Capture Hand Postures数据集中的五种手势动作示意图；

图5是从Motion Capture Hand Postures数据集中选取的600个测试样本中观察值集的均值对缺失值集进行填补得到的完整手势动作数据，并将其由原始36维降低到2维进行可视化的五种手势动作类别数据分布示意图；

图6是对Motion Capture Hand Postures数据集中选取的600个测试样本采用本发明实施例公开的一种面向缺失数据的手势动作分类方法进行填补得到的完整手势动作数据，并将其由原始36维降低到2维进行可视化的五种手势动作类别数据分布示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

本实施例公开了一种面向含缺失数据的手势动作分类方法，具体流程图参照附图1所示，包括下列步骤：

S1、获取含缺失数据的手势动作数据集Motion Capture Hand Postures，依据缺失信息将其划分为观察值集和缺失值集。

本实施例中，步骤S1过程如下：

S11、获取含缺失数据的手势动作数据集Motion Capture Hand Postures，该数据集的数据缺失率为99％，该数据集采用感知手套进行采集，包含有握拳、撑开手、用食指点、用食指和中指点以及抓这五种手势动作，具体的示意图见图3和图4，其中每个样本X包含36个变量；

S12、依据数据集Motion Capture Hand Postures中每个样本X中标记为null的缺失信息，可以将其定义为一个N行D列的掩码矩阵M∈{m_nd}^N×D，m_nd的取值为1或者0，如果m_nd等于1表示样本X_n的第d个变量x_d为缺失值，m_nd等于0表示为观察值，依据掩码矩阵M中m_nd值全为0的对应样本的变量划分为观察值集，将m_nd值全为1的对应样本的变量划分为缺失值集，对观察值集中同一列变量进行归一化处理，减少异常数值和噪声数值对整体数据分布的影响，在Motion Capture Hand Postures数据集中有99％的样本包含变量为null的缺失值。

S2、利用步骤S1观察值集中每一列变量的均值对缺失值集中每一列变量进行预填补，得到预填补的完整数据集；

本实施例中，步骤S2过程如下：

本实施例中，步骤S3过程如下：

S31、利用步骤S22中得到的预填补的完整数据集，将该数据集中的60％数据划分为训练集，20％数据划分为验证集，剩下的20％数据划分为测试集，采用训练集训练一个基于类别感知最优运输神经网络的手势动作分类器，采用基于类别感知最优运输的填补模块执行缺失值填补任务优化的同时，将上述填补模块得到的完整数据输入到基于感知机的分类模块进行分类训练，实现对包含缺失值数据的填补任务和分类任务的联合优化，隐式地利用分类模块的类别感知信息对填补任务进行优化，降低填补数值引入的分类错误率；其中，所述基于类别感知最优运输的填补模块包含三层全连接神经网络，分别是输入层、隐藏层和输出层，输入层和输出层的维度设定为手势动作数据的变量数，隐藏层的维度为手势动作数据变量数的两倍，输出层对缺失值位置的变量进行填补；所述基于感知机的分类模块由三层神经网络组成，其输入数据是基于类别感知最优运输的填补模块执行缺失值填补后的完整数据。

本实施例中，步骤S4过程如下：

S41、在基于类别感知最优运输的填补模块的输入层与输出层网络中观察值位置构建一对一的映射关系，对观察值进行重构，促使输出层网络在缺失位置得到的填补值获取更多观察值的分布信息，映射关系

定义如下：

其中，

表示全1的行向量，⊙表示向量间的元素积，其中样本

的缺失掩码信息；

本实施例中，步骤S5过程如下：

和

和

依据最优运输理论可转换为离散测度

和

依据最优运输理论采用

的值越小，表示从同类手势动作数据内选的两个数据子集

和

间的数据分布差异越小；

和

具体如下：

表示随机从类别k内选取的两个数据子集

和

Sinkhorn表示最优运输理论中的Sinkhorn算法，Sinkhorn算法由Marco Cuturi于2013年发表的论文《Sinkhorn Distances:Lightspeed Computation of Optimal Transport》中提出，Sinkhorn算法在上述论文的第5页有记载，能够求取离散测度变换

和

之间的最优运输方案，使得随机选取的数据子集

和

之间的数据分布差异变小，

和

中的观察值集在最优运输优化过程中一直保持不变，促使缺失位置填补的值向观察值集分布靠拢，从而使得填补后的同类样本更加相似。为了验证采用上述最优运输理论约束后的数据分布和简单采用均值预填补的差异，本发明采用了轮廓系数来衡量不同手势动作类别间的数据分布差异，轮廓系数值取值区间为[-1,1]，其值越接近1表示同类数据分布更加紧促，不同类别间数据分布更加远离。采用均值进行预填补得到的完整数据的轮廓系数值为-0.0239，而采用基于类别感知最优运输填补得到的完整数据轮廓系数值为0.0717，图5和图6中的1、2、3、4、5的点型标记分别表示握拳、撑开手、用食指点、用食指和中指点以及抓这五种手势动作数据，图5表示采用均值进行缺失值填补后的五种手势动作数据可视化图，图6表示采用本发明提出的手势动作分类方法进行缺失值填补后的五种手势动作数据可视化图，对比图5和图6可知，图6能够有效区分点型标记为1(握拳)和2(撑开手)的手势动作数据，并且在整体五种手势动作分布上计算得到的轮廓系数值比图5更小，可知采用本发明填补的数据能够增加不同类别手势动作数据间的分布距离。

本实施例中，步骤S6过程如下：

表示如下：

和步骤S52中的

表示如下：

通过上述学习目标

和

最后采用从Motion Capture Hand Postures手势动作数据集中划分的20％测试集对模型进行了测试分析，采用传统的零填补、均值填补、最近邻填补和多重填补后的分类准确率分别为20.8％，82.4％，82.9％和92.7％，而本发明提出的方法分类准确率达到了97.7％，相比传统方法本发明有效提高了手势动作分类准确率。

实施例2

本发明公开的一种面向含缺失数据的手势动作分类方法与传统的先对缺失值进行填补然后采用基于感知机的分类算法对填补后的完整数据进行分类的方法(零填补，均值填补，最近邻填补和多重填补)，在两种手写数字手势动作的开源数据集OpticalRecognition of Handwritten Digits和Pen-Based Recognition of HandwrittenDigits上，对所有样本进行了人工合成随机缺失率分别为10％，30％，50％和70％的手势动作数据上进行了分类实验，具体实验结果如表1所述：

表1.本发明与其它传统缺失数据分类方法在手写数字动作数据集上的分类准确率

表1是本发明与其它传统的先填补后对完整数据进行分类的方法在手写数字动作数据集上的分类准确率对比参照，表1中的缺失率表示在上述数据集的样本中包含null的缺失值变量在所有样本变量中的占比。从表1的实验结果对比可以看到，相比传统采用零填补、均值填补、最近邻填补和多重填补方法对缺失值进行填补后，再采用基于感知机的分类算法对完整数据进行分类的方法，本发明公开的一种面向含缺失数据的手势动作分类方法在手写数字动作数据集的不同人工合成缺失率上均能够取得更优的分类准确率，验证了本发明的有效性和实用性。

综上所述，本实施例提出的一种面向含缺失数据的手势动作分类方法，利用基于类别感知最优运输的填补模块和基于感知机的分类模块实现对含缺失值得手势动作数据进行分类，通过最优运输理论显式地利用手势动作类别感知信息减少同类别内数据分布距离，并隐式地利用基于感知机得分类模块中得类别感知信息对缺失值填补任务进行优化，使得填补得缺失值有利于分类，提高了手势动作分类的准确率。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种面向含缺失数据的手势动作分类方法，其特征在于，所述手势动作分类方法包括以下步骤：

2.根据权利要求1所述的面向含缺失数据的手势动作分类方法，其特征在于，所述步骤S1过程如下：

S11、获取含缺失数据的手势动作数据集Z，表示为

其中Y_n表示第n个样本X_n的标签，N为数据集Z中包含的样本总数，第n个样本X_n表示为(x₁，x₂，null，...，x_d，...，x_D)，其中null表示缺失值，x_d表示第d个变量，d的取值范围为[1，D]，D为样本X_n包含的变量总数；

S12、依据数据集Z中每个样本X_n中标记为null的缺失信息，数据集Z中所有样本包含的缺失信息定义为一个N行D列的掩码矩阵M∈{m_nd}^N×D，m_nd的取值为1或者0，如果m_nd等于1表示样本X_n的第d个变量x_d为缺失值，m_nd等于0表示为观察值，依据掩码矩阵M中m_nd值全为0的对应样本的变量划分为观察值集，将m_nd值全为1的对应样本的变量划分为缺失值集。

3.根据权利要求2所述的面向含缺失数据的手势动作分类方法，其特征在于，所述步骤S2过程如下：

S22、利用步骤S21中获取的数组B对步骤S12中获取的缺失值集进行均值预填补，采用数组B中所在列对应的值对缺失值集中所有样本对应列变量值为null的变量进行预填补。

4.根据权利要求3所述的面向含缺失数据的手势动作分类方法，其特征在于，所述步骤S3过程如下：

利用步骤S22中得到的预填补的完整数据集，训练一个基于类别感知最优运输神经网络的手势动作分类器，采用基于类别感知最优运输的填补模块执行缺失值填补任务优化的同时，将上述填补模块得到的完整数据输入到基于感知机的分类模块进行分类训练，实现对包含缺失值数据的填补任务和分类任务的联合优化；其中，所述基于类别感知最优运输的填补模块包括三层全连接神经网络，分别是输入层、隐藏层和输出层，输入层和输出层的维度设定为手势动作数据的变量数，隐藏层的维度为手势动作数据变量数的两倍，输出层对缺失值位置的变量进行填补；所述基于感知机的分类模块由三层神经网络组成，其输入数据是基于类别感知最优运输的填补模块执行缺失值填补后的完整数据。

5.根据权利要求4所述的面向含缺失数据的手势动作分类方法，其特征在于，所述步骤S4过程如下：