CN108491886A

CN108491886A - 一种基于卷积神经网络的多元时序数据的分类方法

Info

Publication number: CN108491886A
Application number: CN201810270388.5A
Authority: CN
Inventors: 张可; 韩载道; 李媛
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2018-03-29
Filing date: 2018-03-29
Publication date: 2018-09-04

Abstract

本发明公开了一种基于卷积神经网络的多元时序数据的分类方法，它包括S1：获取多元时间序列数据；S2：对获取的多元时间序列数据进行去噪预处理；S3：采用卷积神经网络对预处理得到的多元时间序列数据降维；S4：对降维得到的数据采用分段聚合算法进行分段，计算聚合后的序列数据的欧式距离，根据欧式距离定义阈值进行区分并形成分类结果。本发明取得的有益效果是：既能较好保留原多元时序数据的基本结构特征，又能采用分段聚合方法对其进行分类分析；采用卷积神经网络对原多元时序数据降维表示；然后采用分段聚合的方法对降维表示后的结果进行特征提取，最后将该特征提取的结果采用欧氏距离形成分类方法。

Description

一种基于卷积神经网络的多元时序数据的分类方法

技术领域

本发明涉及多元时间序列数据的挖掘技术领域，特别是一种基于卷积神经网络的多元时序数据的分类方法。

背景技术

多元时序数据广泛存在于社会工业生产过程中，特别对于复杂工业生产过程产生的数据，由于其维度高，数据量大且常含有噪声，使得普通数据挖掘算法对其分析代价巨大，因此对多元时序数据的降维分析是近年研究的热点。

多元时序数据的分类研究有助于对复杂系统的建模与分析，而在实际工程应用中，由于多元变量之间的关联关系与相互作用，以及数据量巨大，因此对多元时序数据的分类分析主要是以提取原数据特征为主，达到降维和简化计算的目的。传统的多元时序数据降维方法大多基于统计学分析方法，例如主成份分析方法、奇异值分解等算法。这些方法的一个重要缺点是忽略了数据本身的结构信息。在降维的过程中必然会丢失许多重要信息，使得后续数据挖掘与分析的结果不能很好的反映原数据的特征。

缺点：当前的多元时序数据降维分类方法大多基于统计学的主成份分析方法或其改进方法，难以较好的反映多元时序数据的内在结构特征，因而对其分类结果产生影响。

因此亟需一种新的多元时序数据的降维分类方法。

发明内容

有鉴于现有技术的上述缺陷，本发明的目的就是提供一种基于卷积神经网络的多元时序数据的分类方法，既能较好保留原多元数序数据的基本结构特征，又能采用分段聚合方法对其分类分析的方法。该方法采用卷积神经网络对原多元时序数据降维表示；然后采用分段聚合的方法对降维表示后的结果进行特征提取，最后将该特征提取的结果采用欧氏距离形成分类方法。

本发明的目的是通过这样的技术方案实现的，一种基于卷积神经网络的多元时序数据的分类方法，它包括有：

S1：获取多元时间序列数据；

S2：对获取的多元时间序列数据进行去燥预处理；

S3：采用卷积神经网络对预处理得到的多元时间序列数据降维；

S4：对降维得到的数据采用分段聚合算法进行分段，计算聚合后的序列数据的欧式距离，根据欧式距离定义阈值进行区分并形成分类结果。

进一步，所述步骤S2中的去燥预处理包括有：

S21：对原始多元时间序列数据进行偏差检测，发现噪声、离群点和异常值，考察每个属性的定义域和数据类型以及每个属性可接受值的范围；

S22：通过考察数据领域内的值，通过分箱方法中的按照箱平均值法求得平滑数据值来光滑有序数据，将连续数据离散化，获取预处理后的时序数据，增加粒度。

进一步，所述步骤S3中降维的具体步骤如下：

S31：将经过步骤S2预处理后得到的多元时序数据输入卷积神经网络，计算相对应的实际输出，输入值与各层带权值矩阵相乘，得到输出结果；

S32：将所述输出结果与基于专家知识的理想输出值比较作差；采用极小误差原则在反向传播阶段更新原相乘矩阵的权值，直至满足条件。

进一步，所述步骤S4包括有：

S41：对于步骤S3所得的经过卷积神经网络降维处理后的一元时序数据，采用分段聚合算法将降维所得一元时序数据等长分段，获得各分段计算得到的平均值，将平均值组合得到的值作为降维后的新数据序列。

进一步，所述步骤S4还包括有：

S42：应用欧氏距离计算两时序数据的距离其中Q,C为两时间序列，q_i和c_i分别为两时间序列第i个点对应的数据；然后将计算得到的距离值与根据专家经验定义的分类阈值比较，形成分类结果。

由于采用了上述技术方案，本发明具有如下的优点：本发明将人工智能领域的卷积神经网络方法用于多元时间序列数据的降维，在降维过程中较好的保留了原数据的结构特征。本发明应用了经典的时序数据处理分段聚合算法，使得其能在数据降维的基础上进行欧氏距离计算，形成多元时序数据分类的新方法。为复杂工业生产过程数据建模提供了理论依据。也为异常检测、故障诊断等提供给决策依据。最重要的是本发明通过应用卷积神经网络算法，最大限度地保留了原多元时序数据的结构特征，极大得提高了分类计算的准确性。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和权利要求书来实现和获得。

附图说明

本发明的附图说明如下：

图1为基于卷积神经网络的多元时序数据的分类方法的流程示意图。

图2为基于卷积神经网络的数据降维算法流程图。

图3为待计算欧式距离的Q和C两时间序列数据示意图。

图4为Q和C两时间序列数据间的欧式距离示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

实施例：如图1至图4所示；一种基于卷积神经网络的多元时序数据的分类方法，它包括有：

S1：获取多元时间序列数据；

S2：对获取的多元时间序列数据进行去燥预处理；

所述步骤S2中的去燥预处理包括有：

S22：通过考察数据领域内的值，通过分箱方法中的按照箱平均值法求得平滑数据值来光滑有序数据，将连续数据离散化，获取预处理后的时序数据，增加粒度。本实施例中，箱中数据为：6、8、10，则按照箱平均值法求得的平滑数据值为8，这样该箱中的每一个值都会被替换为8。

所述步骤S3中降维的具体步骤如下：

S31：将经过步骤S2预处理后得到的多元时序数据输入卷积神经网络，计算相对应的实际输出，输入值与各层带权值矩阵相乘，得到输出结果；假设有二维离散函数f,x,y，,g那x么y它们的卷积定义为先将g(u,v)绕其原点旋转180度，然后平移其原点，u轴上向上平移x，v轴上向上平移y，然后两个函数相乘再积分，即得到一个点的输出。

所述步骤S4包括有：

所述步骤S4还包括有：

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于卷积神经网络的多元时序数据的分类方法，其特征在于，所述方法包括有以下步骤：

S1：获取多元时间序列数据；

S2：对获取的多元时间序列数据进行去燥预处理；

2.如权利要求1所述的基于卷积神经网络的多元时序数据的分类方法，其特征在于，所述步骤S2中的去燥预处理包括有：

3.如权利要求1所述的基于卷积神经网络的多元时序数据的分类方法，其特征在于，所述步骤S3中降维的具体步骤如下：

4.如权利要求1所述的基于卷积神经网络的多元时序数据的分类方法，其特征在于，所述步骤S4包括有：

5.如权利要求4所述的基于卷积神经网络的多元时序数据的分类方法，其特征在于，所述步骤S4还包括有：