CN112465054A

CN112465054A - 一种基于fcn的多变量时间序列数据分类方法

Info

Publication number: CN112465054A
Application number: CN202011418905.2A
Authority: CN
Inventors: 包先雨; 吴共庆; 蔡伊娜; 何伊娜; 台昌杨; 阮周曦; 杨泽; 夏家铸
Original assignee: Hefei University of Technology; Shenzhen Academy of Inspection and Quarantine; Shenzhen Customs Animal and Plant Inspection and Quarantine Technology Center; Shenzhen Customs Information Center
Current assignee: Hefei University of Technology; Shenzhen Academy of Inspection and Quarantine; Shenzhen Customs Animal and Plant Inspection and Quarantine Technology Center; Shenzhen Customs Information Center
Priority date: 2020-12-07
Filing date: 2020-12-07
Publication date: 2021-03-09
Anticipated expiration: 2040-12-07
Also published as: CN112465054B; US20220180129A1

Abstract

本申请提供了一种基于FCN的多变量时间序列数据分类方法，包括：确定多变量时间序列数据对应的多变量高斯模型参数；依据多变量高斯模型参数和多变量时间序列数据生成输入条件；利用人工智能模型的学习能力，建立输入条件与多变量时间序列数据的数据类别之间的对应关系；获取目标的当前多变量时间序列数据，并依据当前多变量时间序列数据确定对应的当前输入条件；通过对应关系，确定与当前输入条件对应的当前数据类别。通过将多变量时间序列数据对应的多变量高斯模型参数作为输入条件，在保证了精度的同时，极大地提高了人工智能模型的训练速度，且数据集维度越高，提升越为显著。

Description

一种基于FCN的多变量时间序列数据分类方法

技术领域

本申请涉及数据处理领域，特别是一种基于FCN的多变量时间序列数据分类方法。

背景技术

时间序列数据广泛存在于我们的生活中，天气预测，股票市场、医疗保健、人类活动识别等领域每天都在产生大量的时间序列数据。时间序列数据的主要特征在于按时间顺序索引一系列的数据点，任何具有时序属性的数据都可以被当作时间序列数据。随着数据获取和存储能力的提升，在实际应用中对时间序列数据进行分析的需求不断增加，如何进行准确的时间序列分类是数据挖掘中最具挑战性的问题之一。在心脏病学中，对心电信号进行分类，以区别心脏病患者和健康人。在异常检测中，通过监视Unix系统上的用户系统访问活动来检测任何类型的异常行为。在人类活动识别中，根据传感器采集的数据进行人类活动判断也是一个典型的时间序列分类问题。

时间序列数据可以分为单变量时间序列(UTS，Univariate time series)和多变量时间序列(MTS，Multivariate Time Series)。由于UTS只能描述事物某一方面的性质而不能满足大部分应用领域，现在研究者的重心都放在了MTS分类，本文的研究也是针对多变量时间序列分类的。多变量时间序列可以视为多个单变量时间序列的集合，但是变量与变量之间可能还存在着相互作用。因此，MTS应该作为一个整体来对待。面对高维的多变量时间序列，如何挖掘变量之间的关系成为多变量时间序列分类领域的巨大挑战。

近些年，深度学习方法的引入为多变量时间序列分类带来了可喜的结果。与人工构造规则抽取特征、设计模型的传统方法相比，深度学习算法可以自动地学习特征，这些特征更能够提取出数据蕴藏的丰富信息，从而达到较好的分类结果。但神经网络中众多参数的训练是一笔巨大的开销，即使在当今计算机硬件快速发展、计算能力显著提高的情况下，模型的训练速度仍然较慢。

发明内容

鉴于所述问题，提出了本申请以便提供克服所述问题或者至少部分地解决所述问题的一种基于FCN的多变量时间序列数据分类方法，包括：

一种基于FCN的多变量时间序列数据分类方法，所述方法包括：

确定多变量时间序列数据对应的多变量高斯模型参数；

依据所述多变量高斯模型参数和所述多变量时间序列数据生成输入条件；

利用人工智能模型的学习能力，建立所述输入条件与所述多变量时间序列数据的数据类别之间的对应关系；

获取目标的当前多变量时间序列数据，并依据所述当前多变量时间序列数据确定对应的当前输入条件；

通过所述对应关系，确定与所述当前输入条件对应的当前数据类别；具体地，确定与当前输入条件对应的数据类别，包括：将所述对应关系中与所述当前输入条件相同的所述输入条件所对应的数据类别，确定为所述当前数据类别。

进一步地，所述确定多变量时间序列数据对应的多变量高斯模型参数的步骤，包括：

依据多变量高斯分布确定所述多变量时间序列数据中包含的特征的均值矩阵；

依据所述均值矩阵生成对应于所述多变量时间序列数据的特征关联性量化结果的协方差矩阵。

进一步地，所述依据所述多变量高斯模型参数和所述多变量时间序列数据生成输入条件的步骤，包括：

将所述多变量时间序列数据通过三次样条插值填充生成等长多变量时间序列数据；

生成所述多变量时间序列数据所对应多变量高斯模型的均值矩阵；

将所述均值矩阵和所述协方差矩阵进行拼接，生成目标矩阵；

依据所述等长多变量时间序列数据、所述协方差矩阵和所述目标矩阵生成所述输入条件。

进一步地，所述建立所述输入条件与所述多变量时间序列数据的数据类别之间的对应关系的步骤，包括：

获取用于建立所述输入条件与所述数据类别之间的对应关系的样本数据；

分析所述输入条件的特性及其规律，根据所述特性及其规律，确定所述人工神经网络的网络结构及其网络参数；

使用所述样本数据，对所述网络结构和所述网络参数进行训练和测试，确定所述输入条件与所述数据类别的所述对应关系。

进一步地，所述获取用于建立所述输入条件与所述数据类别之间的对应关系的样本数据的步骤，包括：

收集不同数据源的所述输入条件和所述数据类别；

对所述输入条件进行分析、并结合预存的专家经验信息，选取与所述数据类别相关的数据作为所述输入条件；

将所述数据类别、以及选取的所述输入条件构成的数据对，作为样本数据。

进一步地，对所述网络结构和所述网络参数进行训练，包括：

选取所述样本数据中的一部分数据作为训练样本，将所述训练样本中的所述输入条件输入到所述网络结构，通过所述网络结构的损失函数，激活函数和所述网络参数进行训练，得到实际训练结果；

确定所述实际训练结果与所述训练样本中的相应数据类别之间的实际训练误差是否满足预设训练误差；

当所述实际训练误差满足所述预设训练误差时，确定对所述网络结构和所述网络参数的所述训练完成；

和/或，

对所述网络结构和所述网络参数进行测试，包括：

选取所述样本数据中的另一部分数据作为测试样本，将所述测试样本中的所述输入条件输入到所述训练完成的所述网络结构中，以所述损失函数，激活函数和所述训练完成的所述网络参数进行测试，得到实际测试结果；

确定所述实际测试结果与所述测试样本中的相应数据类别之间的实际测试误差是否满足设定测试误差；

当所述实际测试误差满足所述设定测试误差时，确定对所述网络结构和所述网络参数的所述测试完成。

进一步地，对所述网络结构和所述网络参数进行训练，还包括：

当所述实际训练误差不满足所述设定训练误差时，通过所述网络结构的误差损失函数更新所述网络参数；

通过所述网络结构的所述损失函数，激活函数和更新后的所述网络参数进行重新训练，直至所述重新训练后的实际训练误差满足所述设定训练误差；

和/或，

对所述网络结构和所述网络参数进行测试，还包括：

当所述实际测试误差不满足所述设定测试误差时，对所述网络结构和所述网络参数进行重新训练，直至所述重新训练后的实际测试误差满足所述设定测试误差。

一种基于FCN的多变量时间序列数据分类装置，具体包括：

多变量高斯模型参数确定模块，用于确定多变量时间序列数据对应的多变量高斯模型参数；

输入条件生成模块，用于依据所述多变量高斯模型参数和所述多变量时间序列数据生成输入条件；

对应关系建立模块，用于利用人工智能模型的学习能力，建立所述输入条件与所述多变量时间序列数据的数据类别之间的对应关系；

当前输入条件确定模块，用于获取目标的当前多变量时间序列数据，并依据所述当前多变量时间序列数据确定对应的当前输入条件；

当前数据类别确定模块，用于通过所述对应关系，确定与所述当前输入条件对应的当前数据类别；具体地，确定与当前输入条件对应的数据类别，包括：将所述对应关系中与所述当前输入条件相同的所述输入条件所对应的数据类别，确定为所述当前数据类别。

进一步地，所述多变量高斯模型参数确定模块，包括：

均值矩阵确定子模块，用于依据多变量高斯分布确定所述多变量时间序列数据中包含的特征的均值矩阵；

协方差矩阵生成子模块，用于依据所述均值矩阵生成对应于所述多变量时间序列数据的特征关联性量化结果的协方差矩阵。

进一步地，所述输入条件生成模块，包括：

等长多变量时间序列数据生成子模块，用于将所述多变量时间序列数据通过三次样条插值填充生成等长多变量时间序列数据；

均值矩阵生成子模块，用于生成所述多变量时间序列数据所对应多变量高斯模型的均值矩阵；

目标矩阵生成子模块，用于将所述均值矩阵和所述协方差矩阵进行拼接，生成目标矩阵；

输入条件生成子模块，用于依据所述等长多变量时间序列数据、所述协方差矩阵和所述目标矩阵生成所述输入条件。

本申请具有以下优点：

在本申请的实施例中，通过确定多变量时间序列数据对应的多变量高斯模型参数；依据所述多变量高斯模型参数和所述多变量时间序列数据生成输入条件；利用人工智能模型的学习能力，建立所述输入条件与所述多变量时间序列数据的数据类别之间的对应关系；获取目标的当前多变量时间序列数据，并依据所述当前多变量时间序列数据确定对应的当前输入条件；通过所述对应关系，确定与所述当前输入条件对应的当前数据类别；具体地，确定与当前输入条件对应的数据类别，包括：将所述对应关系中与所述当前输入条件相同的所述输入条件所对应的数据类别，确定为所述当前数据类别。通过将多变量时间序列数据对应的多变量高斯模型参数作为输入条件，在保证了精度的同时，极大地提高了人工智能模型的训练速度，且数据集维度越高，提升越为显著。

附图说明

图1是本申请一实施例提供的一种基于FCN的多变量时间序列数据分类方法的步骤流程图；

图2是本申请一实施例提供的GM-FCN模型结构示意图；

图3是本申请一实施例提供的一种基于FCN的多变量时间序列数据分类装置的结构框图。

具体实施方式

需要说明的是，面对众多的深度学习方法，本发明将具有出色性能的FCN(FullyConvolutional Networks，全卷积网络)用于MTS分类。鉴于多变量高斯模型参数不但可以自动识别并捕获不同变量间的关联性，同时对于高维MTS还有降维的作用，本发明再结合多变量高斯模型，考虑将原始MTS数据转化为多变量高斯模型参数作为神经网络输入，提出了一种基于FCN的多变量时间序列数据分类方法。具体地，本发明设计了三种不同形式的输入，探究了三种输入方式的实验效果，发现针对高维数据，将多变量高斯模型参数作为输入取得了良好的性能，在不损失精度的同时，极大地加快神经网络的训练。

需要说明的是，时间序列数据是在一段时间内由时间戳索引的一系列观测值，可以写作：

X＝{x₁,x₂,…,x_m}

其中，x_i＝{x_i(1)，x_i(2)，…x_i(n)}；m为变量的个数；n为观测值的个数。当m＝1时，x_i表示单变量时间序列(UTS)；当m≥2时，X表示多变量时间序列(MTS)。MTS可以被视为多个UTS的集合。

数据集D＝{(X₁,Y₁)，(X₂,Y₂)，…(X_N,Y_N)}是对(X_i,Y_i)的集合，其中X_i可以是单变量或多变量时间序列，以Y_i作为其对应的one-hot标签向量。对于包含K个类别的数据集，one-hot标签向量Y_i是长度为K的向量，如果X_i的类别为j，则每个元素等j∈[1,K]等于1，否则为0。

时间序列分类的任务就是利用训练数据集训练分类模型，再利用测试数据集测试模型的分类性能，完成时间序列与其正确标签的映射关系。

参照图1，示出了本申请一实施例提供的一种基于FCN的多变量时间序列数据分类方法，所述方法包括：

S110、确定多变量时间序列数据对应的多变量高斯模型参数；

S120、依据所述多变量高斯模型参数和所述多变量时间序列数据生成输入条件；

S130、利用人工智能模型的学习能力，建立所述输入条件与所述多变量时间序列数据的数据类别之间的对应关系；

S140、获取目标的当前多变量时间序列数据，并依据所述当前多变量时间序列数据确定对应的当前输入条件；

S150、通过所述对应关系，确定与所述当前输入条件对应的当前数据类别；具体地，确定与当前输入条件对应的数据类别，包括：将所述对应关系中与所述当前输入条件相同的所述输入条件所对应的数据类别，确定为所述当前数据类别。

在本申请的实施例中，通过步骤S110-S150。通过将多变量时间序列数据对应的多变量高斯模型参数作为输入条件，在保证了精度的同时，极大地提高了人工智能模型的训练速度，且数据集维度越高，提升越为显著。

下面，将对本示例性实施例中基于FCN的多变量时间序列数据分类方法作进一步地说明。

如上述步骤S110所述，确定多变量时间序列数据对应的多变量高斯模型参数；

需要说明的是，多变量高斯分布是一元正态分布的高维泛化。与传统高斯模型不同，多变量高斯模型具备自动识别并捕获特征变量之间关联性的能力，因此多变量高斯模型非常适合于处理多变量数据。

具体地，一元高斯分布建立的模型假定不同特征变量之间没有关联性，其概率密度只考虑每个特征变量的单独变化，无法对特征变量之间的关联性信息进行识别，故无法满足MTS数据的需求。而多变量高斯模型可以在不需要建立新特征的基础上自动识别并捕获不同变量直接的关联性，考虑直接构建多变量高斯模型，来对多变量有序数据集(不同变量并不相互独立)进行处理。

在一实施例中，可以结合下列描述进一步说明步骤S110所述“确定多变量时间序列数据对应的多变量高斯模型参数”的具体过程。

如下列步骤所述，依据多变量高斯分布确定所述多变量时间序列数据中包含的特征的均值矩阵；

如下列步骤所述，依据所述均值矩阵生成对应于所述多变量时间序列数据的特征关联性量化结果的协方差矩阵。

作为一种示例，给定m维数据即{x₁，x₂，…，x_m}，其中x_i＝{x_i(1)，x_i(2)，…，x_i(n)}，n为变量的观测值个数，由多变量高斯分布可计算得到所有特征的均值矩阵为μ，如下列公式所示：

所有特征的协方差矩阵Σ的公式为，

将变长的MTS数据转变为多变量高斯模型的参数，具有两个好处。第一，是能够实现将不同长度的MTS数据映射到同一大小的空间上，即变量的维度的大小上；第二，多变量高斯模型可以利用协方差矩阵对不同特征之间的相互影响进行量化，自动识别并捕获多变量特征之间的关联性。

如上述步骤S120所述，依据所述多变量高斯模型参数和所述多变量时间序列数据生成输入条件；

需要说明的是，由于全卷积网络(FCN)的输入要求必须是等长的MTS数据，其无法直接处理可变长度的MTS数据。而在很多实际问题中MTS数据的长度往往是不一致的。例如，UCI(University of CaliforniaIrvine加州大学欧文分校)机器学习库提供的JapaneseVowels(日语元音)数据集收集了九名男性发言者连续发出两个日语元音/ae/，每位说话者的一个话语形成时间序列，其长度在7-29的范围内。所以，对于不同长度的原始MTS数据应该对其进行数据预处理将其映射到同一长度。

在一实施例中，可以结合下列描述进一步说明步骤S120所述“依据所述多变量高斯模型参数和所述多变量时间序列数据生成输入条件”的具体过程。

如下列步骤所述，将所述多变量时间序列数据通过三次样条插值填充生成等长多变量时间序列数据；

需要说明的是，通过插值法将较短的多变量时间序列进行插值填充。插值是离散函数逼近的重要方法，可通过特定函数在有限个点处的取值状况，估算出该函数在其他点处的近似值。样条插值是一种工业设计中常用的、得到平滑曲线的一种插值方法，三次样条又是其中使用较为广泛的一种。本实施例使用的插值方法就是三次样条插值法，能够将较短的原始MTS数据非常平滑地填充为当前数据集中最长样本的长度。具体算法过程如下列Algorithm 1所示：

Algorithm 1Obtaining time series datasets with equal length

Input：The train datasets Train_X and the test datasets Test_X

Output:The equal-length train datasets Train_X'and the equal-lengthtest datasets Test_X'

1.L_train←max length(Train_X)

2.L_test←max length(Test_X)

3.L_max←max(L_train,L_test)

4.Train_X'←Cubic Spline Interpolation(Train_X,L_max)

5.Test_X'←Cubic Spline Interpolation(Test_X,L_max)

其中，L_train表示训练集中最长样本的长度；L_test表示测试集中最长样本的长度，L_max表示训练集和测试集中最长样本的长度。

如下列步骤所述，生成所述多变量时间序列数据所对应多变量高斯模型的均值矩阵；

如下列步骤所述，将所述均值矩阵和所述协方差矩阵进行拼接，生成目标矩阵；

需要说明的是，本实施例将多变量高斯模型参数作为FCN的输入，具体算法过程如下列Algorithm 2所示。这样能够在即使是高维的MTS数据，它的维度大小相对于长度也是很小的，而把多变量高斯模型参数代替原来的MTS数据作为FCN的输入，进行模型训练时能够减少很多的计算量，从而能达到提高模型训练速度的目的。

Algorithm 2 Obtaining mean and covariance matrix

Input：The multivariate time series sample X

Output:The meanμ,the covariance matrixΣand the matrix C concatenatedby the mean and covariance matrix

1.μ←mean(X)

2.Σ←covariance(X)

3.C←concatenation(Σ,μ)

如下列步骤所述，依据所述等长多变量时间序列数据、所述协方差矩阵和所述目标矩阵生成所述输入条件。

综上，本实施例中作为人工智能模型的输入包括通过上述步骤生成的3种形式的时间序列数据：

1.通过三次样条插值填充得到的等长多变量时间序列；

2.多变量高斯模型的协方差矩阵；

3.将多变量高斯模型的协方差矩阵和均值矩阵进行拼接得到的新矩阵。

如上述步骤S130所述，利用人工智能模型的学习能力，建立所述输入条件与所述多变量时间序列数据的数据类别之间的对应关系；

需要说明的是，本实施例采用的全卷积神经网络由三个卷积层组成，每个卷积层包含三个操作：卷积，然后进行批归一化，其结果被馈送到ReLU激活函数。全局平均池化层将第三个卷积层结果的每个特征矩阵分别计算均值，最后输入到一个由Softmax函数激活的全连接层分类器，其神经元个数等于数据集中的类数。

作为一种示例，所述人工智能模型的卷积层：

FCN中卷积层是特征提取器，卷积层可以表示为：

s＝BN(y)

h＝ReLU(s)

通过堆叠三个卷积层来构建最终网络，其中，

是卷积运算符；BN()表示批归一化；ReLU()是激活函数。

卷积

卷积核可以将当前层神经网络上的一个子节点矩阵转化为下一层神经网络上的一个单位节点矩阵。单位节点矩阵指的是一个长和宽都为1，深度为卷积核数的节点矩阵。为了提取更丰富的特征，FCN中的三个卷积层分别包含128，256，128个卷积核，卷积核的大小分别为8*8、5*5、3*3，在一个卷积层中使用的卷积核参数都是一样的。为了卷积层前向传播结果矩阵的尺寸大小和当前层矩阵保持一致，在当前层的矩阵边界上采用全0填充(zero-padding)。

假设α为输入矩阵；使用wⁱ _x,y,z来表示对于输出单位节点矩阵中的第i个节点，卷积核输入节点(x，y，z)的权重；使用bⁱ表示第i个输出节点对应的偏置项参数。那么单位矩阵中的第i个节点的取值g(i)为：

其中，f()为当前使用的激活函数。

批归一化

训练过程中各层输入的分布随前一层参数的变化而变化，使得训练深度神经网络变得复杂。网络中的每层必须根据每批输入的不同分布重新调整其权重，从而减缓模型的训练速度。

若可以使每层输入的分布更相似，那么网络可以专注于学习类别之间的差异。Google提出了一个深度神经网络训练的技巧：批归一化(Batch Normalization，BN)，批归一化就是对训练中某一个batch的数据进行归一化处理。Batch Normalization首先求每一训练批次数据的均值与方差。然后使用求得的均值和方差对该批次的训练数据做归一化，获得均值为零，方差为一的正态分布

其中，μ_x为当前训练批次的均值；σ² _x为当前训练批次的方差；ε的作用是防止分母为零。

由于归一化后的数据基本会被限制在正态分布下，使得网络的表达能力下降。为此，Batch Normalization引入两个新的参数γ和β，对数据分布进行尺度的变换和偏移，这一步是Batch Normalization的关键，γ和β是在训练时神经网络自动学习得到的：

ReLU激活函数

在卷积块中选用了非饱和非线性的ReLU函数作为激活函数，ReLU函数是在x＝0在基础上面截去了x<0的部分，仅仅保留正的输入部分，其公式为：y＝max{0,x}。ReLU函数具有很好的稀疏性和优良的非线性特性，同时计算更加高效。

全局平均池化

传统的CNN在卷积层对原始数据进行特征提取之后会接上若干个全连接层,将卷积层产生的特征图(feature map)映射成一个固定长度的特征向量，再通过激活函数进行分类。但是，全连接层有一个非常致命的弱点就是参数量过大，尤其是与最后一个卷积层相连的全连接层。为此，FCN在最后一个卷积层之后添加一个全局平均池化层(GlobalAverage Pooling，GAP)，ResNet也采用了这种策略，将最后一个卷积层的每个特征图转化为一个特征值。减少了参数数量，降低训练模型的计算量；同时降低参数过多导致过拟合的可能。

全连接层

全连接层的每一个结点都与上一层的所有结点相连，用来把前边提取到的特征综合起来。在整个FCN中全连接层起到了分类器的作用。其基本运算如下式所示。

h＝X@W+b

其中，h是全连接层的一个输出子节点；X为输入矩阵；W为权重矩阵；@为点乘运算符；b为偏置项，是一个标量。

得到全连接层的输出后，还要经过激活函数才能得到最终的分类结果，在网络最后使用的是Softmax激活函数。Softmax函数不仅能将多个神经元的输出，映射到(0,1)区间内，还满足所有的输出值之和为1的特性，将输出层的结果经过Softmax函数激活后可以看作是属于各个分类的概率，从而来进行多分类。Softmax函数定义为：

在一实施例中，可以结合下列描述进一步说明步骤S130所述“利用人工智能模型的学习能力，建立所述输入条件与所述多变量时间序列数据的数据类别之间的对应关系”的具体过程。

在一实施例中，所述获取用于建立所述输入条件与所述数据类别之间的对应关系的样本数据的步骤，包括：

收集不同数据源的所述输入条件和所述数据类别；

在一实施例中，对所述网络结构和所述网络参数进行训练，包括：

和/或，

对所述网络结构和所述网络参数进行测试，包括：

在一实施例中，

对所述网络结构和所述网络参数进行训练，还包括：

和/或，

对所述网络结构和所述网络参数进行测试，还包括：

如上述步骤S140所述，获取目标的当前多变量时间序列数据，并依据所述当前多变量时间序列数据确定对应的当前输入条件；

如上述步骤S150所述，通过所述对应关系，确定与所述当前输入条件对应的当前数据类别；具体地，确定与当前输入条件对应的数据类别，包括：将所述对应关系中与所述当前输入条件相同的所述输入条件所对应的数据类别，确定为所述当前数据类别。

在一具体实现中，使用基于Kullback-Leibler散度和高斯模型的MTS分类方法(KLD-GMC)作为Baseline(基线)，从UCI机器学习库和CMU(Carnegie Mellon University，卡内基梅隆大学)的Graphics Lab Motion Capture Database(图形实验室运动捕获数据库)中选择了4个真实的高维数据集，评估不同预处理的数据输入到FCN网络所得到的分类性能。

具体地，UCI机器学习库提供了1个数据集，JapaneseVowels数据集。JapaneseVowels数据集采集了九名男性发出两个日语元音/ae/的语音。对每个语音样本都应用了12-degree的线性预测分析处理，形成包含12个LPC倒谱系数(即具有12个变量的MTS样本)的640个离散的时间序列，每个MTS样本的长度在7到29之间。数据集中样本的总数为640，其中，270个作为训练集，370个作为测试集。分类目标是通过两个日语元音/ae/的发音来区分九个男性说话者。

CMU建立了一个Graphics Lab Motion Capture Database，从中选择WalkvsRun数据集、KickvsPunch数据集和CMUsubject16数据集用于本具体实现的验证。表1给出了所有数据集的相关信息。

表1

根据本文方法的需要，四个数据集均经过数据预处理，分别得到通过插值填充得到的等长数据和对它们计算得到的协方差矩阵、均值矩阵。获得的3种输入数据的尺寸如表2所示：

Name	original	cov	cov_mean
				JapaneseVowels	29*12	12*12	13*12
CMUsubject16	580*62	62*62	63*62
				KickvsPunch	841*62	62*62	63*62
WalkvsRun	1918*62	62*62	63*62

表2

在表2中，以JapaneseVowels数据集的等长MTS(original)为例，29为数据集中最长样本的长度，12为数据集的维度。而对其求得的协方差矩阵尺寸为12*12，均值矩阵的尺寸为1*12，所以其协方差矩阵(cov)输入的尺寸为12*12，协方差矩阵和均值矩阵进行拼接得到的新矩阵(cov_mean)的尺寸为13*12。

本具体实现通过下列三组对比实验进行验证，分别包括：

1.将由等长MTS数据训练得到的FCN模型与KLD-GMC进行对比，验证FCN是否适用于MTS数据的分类。

2.使用相同的FCN模型，分别输入等长MTS数据和多变量高斯模型参数训练FCN，对比模型分类结果，验证利用多变量高斯模型参数训练模型是否具有良好的分类效果。

3.通过对FCN网络训练一个样本的耗时进行对比分析，验证将MTS转换多变量高斯模型参数作为训练数据能否提高模型训练速度。

评价标准：实验通过准确率来衡量的本文提出方法的性能。另外，还考虑了训练模型的耗时，对比了不同形式数据输入，FCN训练一个样本所需的时间长短。

对比实验的分类结果见表3，对比训练一个样本耗时结果见表4。

Name	KLD-GMC	FCN_mts	FCN_cov	FCN_cov_mean
					JapaneseVowels	0.981	0.992	0.843	0.989
CMUsubject16	1.000	1.000	1.000	0.966
					KickvsPunch	0.700	0.900	1.000	1.000
WalkvsRun	1.000	1.000	1.000	1.000
					AVG_Acc	0.920	0.973	0.961	0.989

表3

首先观察第一组实验的结果，根据表3第二列的结果可以看出，直接利用MTS训练得到的FCN分类模型就能取得很好的效果，在KLD-GMC基础上，准确度得到了进一步提升，证明了FCN确实适用于MTS数据的分类任务，能够自动抽取出有效特征，训练出优良的时间序列分类模型。

其次是第二组对比实验，观察表3的后三列，使用相同的FCN模型，对比分别输入等长MTS和多变量高斯模型参数进行模型训练的结果。综合在多个数据集上的实验结果，平均准确率最高的是充分利用了多变量高斯模型参数训练得到的FCN模型，这说明了模型参数确实包含了足够的信息来训练优质的MTS分类模型。但是在部分数据集上，使用模型参数训练的模型性能稍低于使用原始MTS数据训练的模型。认为造成这种结果的原因是，将MTS转换为多变量高斯模型参数时，协方差虽然能识别并捕获变量之间的相关性信息，但是可能忽略了变量值随时间变化的特征而丢失部分时序信息。不过，根据分类结果也能看出，性能依旧是是非常优越的，这说明了利用模型参数作为输入数据训练神经网络模型是有道理的，模型参数确实从原始的MTS数据中抽取出了重要信息，神经网络模型能够根据这些信息学习到能够决定MTS数据分类的特征。

然后对比表3后两列的结果，还能观察到使用协方差矩阵和拼接矩阵训练模型进行分类的结果，在绝大多数据集上，拼接矩阵效果要更好，说明均值也是MTS数据的重要属性，认为均值在整体层面上一定程度地反应了该MTS的特性。将均值矩阵拼接到协方差矩阵可以增加输入到模型的信息量，给神经网络提供更多的信息进行训练，得到更好的分类模型。这其中也存在了一个问题，虽然考虑了将协方差矩阵和均值矩阵拼接在一起增加了输入信息，但是这样简单拼接两个模型参数的做法不够合理，因为当卷积核移动到最后一行时，卷积核会对均值和部分协方差参数进行卷积操作，反而可能会使神经网络在抽取特征时迷惑，不能准确地识别特征，导致分类结果下降。针对这个问题，特别是对于低维数据集，应该设计更好的结合方式将这两个参数组合在一起，充分利用已有的信息。

Name	FCN_mts	FCN_cov	FCN_cov_mean
				JapaneseVowels	734us	504us	537us
CMUsubject16	41000us	3000us	4000us
				KickvsPunch	127000us	4000us	3000us
WalkvsRun	184000us	4000us	3000us

表4

表4展示了对于不同输入形式，FCN模型训练一个样本的耗时。协方差矩阵和拼接矩阵的大小非常相近，其FCN训练模型的耗时也约等于相等。对照数据输入的尺寸表2，可以清晰地看到，将MTS转换成多变量高斯模型参数能够极大地减小神经网络输入的数据量，减少了计算量。在表4中的结果也显示了，对于数据样本长度远大于其维度的数据集(WalkvsRun数据集)，训练时间甚至可以减少几十倍。对于很多高维数据集，它们的维度也是远小于其数据长度的，将其转换为多变量高斯模型参数可以很大程度上降低数据维度，减少模型训练时间。同时，多变量高斯模型恰好就是擅长于识别并捕获变量之间的相关性信息。所以，基于FCN的结合多变量高斯模型参数的MTS分类方法非常适合应用在高维的长时间序列上。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

参照图3，示出了本申请一实施例提供的一种基于FCN的多变量时间序列数据分类装置，具体包括：

多变量高斯模型参数确定模块310，用于确定多变量时间序列数据对应的多变量高斯模型参数；

输入条件生成模块320，用于依据所述多变量高斯模型参数和所述多变量时间序列数据生成输入条件；

对应关系建立模块330，用于利用人工智能模型的学习能力，建立所述输入条件与所述多变量时间序列数据的数据类别之间的对应关系；

当前输入条件确定模块340，用于获取目标的当前多变量时间序列数据，并依据所述当前多变量时间序列数据确定对应的当前输入条件；

当前数据类别确定模块350，用于通过所述对应关系，确定与所述当前输入条件对应的当前数据类别；具体地，确定与当前输入条件对应的数据类别，包括：将所述对应关系中与所述当前输入条件相同的所述输入条件所对应的数据类别，确定为所述当前数据类别。

在一实施例中，所述多变量高斯模型参数确定模块310，包括：

在一实施例中，所述输入条件生成模块320，包括：

在一实施例中，所述对应关系建立模块330，包括：

获取子模块，用于获取用于建立所述输入条件与所述数据类别之间的对应关系的样本数据；

分析子模块，用于分析所述输入条件的特性及其规律，根据所述特性及其规律，确定所述人工神经网络的网络结构及其网络参数；

训练子模块，用于使用所述样本数据，对所述网络结构和所述网络参数进行训练和测试，确定所述输入条件与所述数据类别的所述对应关系。

在一实施例中，所述获取子模块，包括：

收集子模块，用于收集不同数据源的所述输入条件和所述数据类别；

分析子模块，用于对所述输入条件进行分析、并结合预存的专家经验信息，选取与所述数据类别相关的数据作为所述输入条件；

样本数据生成子模块，用于将所述数据类别、以及选取的所述输入条件构成的数据对，作为样本数据。

在一实施例中，所述训练子模块，包括：

训练结果生成子模块，用于选取所述样本数据中的一部分数据作为训练样本，将所述训练样本中的所述输入条件输入到所述网络结构，通过所述网络结构的损失函数，激活函数和所述网络参数进行训练，得到实际训练结果；

训练结果误差判断子模块，用于确定所述实际训练结果与所述训练样本中的相应数据类别之间的实际训练误差是否满足预设训练误差；

训练完成判定子模块，用于当所述实际训练误差满足所述预设训练误差时，确定对所述网络结构和所述网络参数的所述训练完成；

和/或，

测试子模块，用于对所述网络结构和所述网络参数进行测试，所述测试子模块，包括：

测试结果生成子模块，用于选取所述样本数据中的另一部分数据作为测试样本，将所述测试样本中的所述输入条件输入到所述训练完成的所述网络结构中，以所述损失函数，激活函数和所述训练完成的所述网络参数进行测试，得到实际测试结果；

测试结果误差判断子模块，用于确定所述实际测试结果与所述测试样本中的相应数据类别之间的实际测试误差是否满足设定测试误差；

测试完成判定子模块，用于当所述实际测试误差满足所述设定测试误差时，确定对所述网络结构和所述网络参数的所述测试完成。

在一实施例中，

所述训练子模块，还包括：

网络参数更新子模块，用于当所述实际训练误差不满足所述设定训练误差时，通过所述网络结构的误差损失函数更新所述网络参数；

第一重训练子模块，用于通过所述网络结构的所述损失函数，激活函数和更新后的所述网络参数进行重新训练，直至所述重新训练后的实际训练误差满足所述设定训练误差；

和/或，

所述测试子模块，还包括：

第二重训练子模块，用于当所述实际测试误差不满足所述设定测试误差时，对所述网络结构和所述网络参数进行重新训练，直至所述重新训练后的实际测试误差满足所述设定测试误差。

Claims

1.一种基于FCN的多变量时间序列数据分类方法，其特征在于，所述方法包括：

确定多变量时间序列数据对应的多变量高斯模型参数；

2.根据权利要求1所述的方法，其特征在于，所述确定多变量时间序列数据对应的多变量高斯模型参数的步骤，包括：

3.根据权利要求2所述的方法，其特征在于，所述依据所述多变量高斯模型参数和所述多变量时间序列数据生成输入条件的步骤，包括：

4.根据权利要求1所述的方法，其特征在于，所述建立所述输入条件与所述多变量时间序列数据的数据类别之间的对应关系的步骤，包括：

5.根据权利要求3所述的方法，其特征在于，所述获取用于建立所述输入条件与所述数据类别之间的对应关系的样本数据的步骤，包括：

收集不同数据源的所述输入条件和所述数据类别；

6.根据权利要求4或5所述的方法，其特征在于，

对所述网络结构和所述网络参数进行训练，包括：

和/或，

对所述网络结构和所述网络参数进行测试，包括：

7.根据权利要求6所述的方法，其特征在于，

对所述网络结构和所述网络参数进行训练，还包括：

和/或，

对所述网络结构和所述网络参数进行测试，还包括：

8.一种基于FCN的多变量时间序列数据分类装置，其特征在于，具体包括：

9.根据权利要求8所述的方法，其特征在于，所述多变量高斯模型参数确定模块，包括：

10.根据权利要求9所述的方法，其特征在于，所述输入条件生成模块，包括：