CN108491886A - 一种基于卷积神经网络的多元时序数据的分类方法 - Google Patents
一种基于卷积神经网络的多元时序数据的分类方法 Download PDFInfo
- Publication number
- CN108491886A CN108491886A CN201810270388.5A CN201810270388A CN108491886A CN 108491886 A CN108491886 A CN 108491886A CN 201810270388 A CN201810270388 A CN 201810270388A CN 108491886 A CN108491886 A CN 108491886A
- Authority
- CN
- China
- Prior art keywords
- time series
- series data
- data
- convolutional neural
- neural networks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于卷积神经网络的多元时序数据的分类方法,它包括S1:获取多元时间序列数据;S2:对获取的多元时间序列数据进行去噪预处理;S3:采用卷积神经网络对预处理得到的多元时间序列数据降维;S4:对降维得到的数据采用分段聚合算法进行分段,计算聚合后的序列数据的欧式距离,根据欧式距离定义阈值进行区分并形成分类结果。本发明取得的有益效果是:既能较好保留原多元时序数据的基本结构特征,又能采用分段聚合方法对其进行分类分析;采用卷积神经网络对原多元时序数据降维表示;然后采用分段聚合的方法对降维表示后的结果进行特征提取,最后将该特征提取的结果采用欧氏距离形成分类方法。
Description
技术领域
本发明涉及多元时间序列数据的挖掘技术领域,特别是一种基于卷积神经网络的多元时序数据的分类方法。
背景技术
多元时序数据广泛存在于社会工业生产过程中,特别对于复杂工业生产过程产生的数据,由于其维度高,数据量大且常含有噪声,使得普通数据挖掘算法对其分析代价巨大,因此对多元时序数据的降维分析是近年研究的热点。
多元时序数据的分类研究有助于对复杂系统的建模与分析,而在实际工程应用中,由于多元变量之间的关联关系与相互作用,以及数据量巨大,因此对多元时序数据的分类分析主要是以提取原数据特征为主,达到降维和简化计算的目的。传统的多元时序数据降维方法大多基于统计学分析方法,例如主成份分析方法、奇异值分解等算法。这些方法的一个重要缺点是忽略了数据本身的结构信息。在降维的过程中必然会丢失许多重要信息,使得后续数据挖掘与分析的结果不能很好的反映原数据的特征。
缺点:当前的多元时序数据降维分类方法大多基于统计学的主成份分析方法或其改进方法,难以较好的反映多元时序数据的内在结构特征,因而对其分类结果产生影响。
因此亟需一种新的多元时序数据的降维分类方法。
发明内容
有鉴于现有技术的上述缺陷,本发明的目的就是提供一种基于卷积神经网络的多元时序数据的分类方法,既能较好保留原多元数序数据的基本结构特征,又能采用分段聚合方法对其分类分析的方法。该方法采用卷积神经网络对原多元时序数据降维表示;然后采用分段聚合的方法对降维表示后的结果进行特征提取,最后将该特征提取的结果采用欧氏距离形成分类方法。
本发明的目的是通过这样的技术方案实现的,一种基于卷积神经网络的多元时序数据的分类方法,它包括有:
S1:获取多元时间序列数据;
S2:对获取的多元时间序列数据进行去燥预处理;
S3:采用卷积神经网络对预处理得到的多元时间序列数据降维;
S4:对降维得到的数据采用分段聚合算法进行分段,计算聚合后的序列数据的欧式距离,根据欧式距离定义阈值进行区分并形成分类结果。
进一步,所述步骤S2中的去燥预处理包括有:
S21:对原始多元时间序列数据进行偏差检测,发现噪声、离群点和异常值,考察每个属性的定义域和数据类型以及每个属性可接受值的范围;
S22:通过考察数据领域内的值,通过分箱方法中的按照箱平均值法求得平滑数据值来光滑有序数据,将连续数据离散化,获取预处理后的时序数据,增加粒度。
进一步,所述步骤S3中降维的具体步骤如下:
S31:将经过步骤S2预处理后得到的多元时序数据输入卷积神经网络,计算相对应的实际输出,输入值与各层带权值矩阵相乘,得到输出结果;
S32:将所述输出结果与基于专家知识的理想输出值比较作差;采用极小误差原则在反向传播阶段更新原相乘矩阵的权值,直至满足条件。
进一步,所述步骤S4包括有:
S41:对于步骤S3所得的经过卷积神经网络降维处理后的一元时序数据,采用分段聚合算法将降维所得一元时序数据等长分段,获得各分段计算得到的平均值,将平均值组合得到的值作为降维后的新数据序列。
进一步,所述步骤S4还包括有:
S42:应用欧氏距离计算两时序数据的距离其中Q,C为两时间序列,qi和ci分别为两时间序列第i个点对应的数据;然后将计算得到的距离值与根据专家经验定义的分类阈值比较,形成分类结果。
由于采用了上述技术方案,本发明具有如下的优点:本发明将人工智能领域的卷积神经网络方法用于多元时间序列数据的降维,在降维过程中较好的保留了原数据的结构特征。本发明应用了经典的时序数据处理分段聚合算法,使得其能在数据降维的基础上进行欧氏距离计算,形成多元时序数据分类的新方法。为复杂工业生产过程数据建模提供了理论依据。也为异常检测、故障诊断等提供给决策依据。最重要的是本发明通过应用卷积神经网络算法,最大限度地保留了原多元时序数据的结构特征,极大得提高了分类计算的准确性。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和权利要求书来实现和获得。
附图说明
本发明的附图说明如下:
图1为基于卷积神经网络的多元时序数据的分类方法的流程示意图。
图2为基于卷积神经网络的数据降维算法流程图。
图3为待计算欧式距离的Q和C两时间序列数据示意图。
图4为Q和C两时间序列数据间的欧式距离示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例:如图1至图4所示;一种基于卷积神经网络的多元时序数据的分类方法,它包括有:
S1:获取多元时间序列数据;
S2:对获取的多元时间序列数据进行去燥预处理;
S3:采用卷积神经网络对预处理得到的多元时间序列数据降维;
S4:对降维得到的数据采用分段聚合算法进行分段,计算聚合后的序列数据的欧式距离,根据欧式距离定义阈值进行区分并形成分类结果。
所述步骤S2中的去燥预处理包括有:
S21:对原始多元时间序列数据进行偏差检测,发现噪声、离群点和异常值,考察每个属性的定义域和数据类型以及每个属性可接受值的范围;
S22:通过考察数据领域内的值,通过分箱方法中的按照箱平均值法求得平滑数据值来光滑有序数据,将连续数据离散化,获取预处理后的时序数据,增加粒度。本实施例中,箱中数据为:6、8、10,则按照箱平均值法求得的平滑数据值为8,这样该箱中的每一个值都会被替换为8。
所述步骤S3中降维的具体步骤如下:
S31:将经过步骤S2预处理后得到的多元时序数据输入卷积神经网络,计算相对应的实际输出,输入值与各层带权值矩阵相乘,得到输出结果;假设有二维离散函数f,x,y,,g那x么y它们的卷积定义为先将g(u,v)绕其原点旋转180度,然后平移其原点,u轴上向上平移x,v轴上向上平移y,然后两个函数相乘再积分,即得到一个点的输出。
S32:将所述输出结果与基于专家知识的理想输出值比较作差;采用极小误差原则在反向传播阶段更新原相乘矩阵的权值,直至满足条件。
所述步骤S4包括有:
S41:对于步骤S3所得的经过卷积神经网络降维处理后的一元时序数据,采用分段聚合算法将降维所得一元时序数据等长分段,获得各分段计算得到的平均值,将平均值组合得到的值作为降维后的新数据序列。
所述步骤S4还包括有:
S42:应用欧氏距离计算两时序数据的距离其中Q,C为两时间序列,qi和ci分别为两时间序列第i个点对应的数据;然后将计算得到的距离值与根据专家经验定义的分类阈值比较,形成分类结果。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (5)
1.一种基于卷积神经网络的多元时序数据的分类方法,其特征在于,所述方法包括有以下步骤:
S1:获取多元时间序列数据;
S2:对获取的多元时间序列数据进行去燥预处理;
S3:采用卷积神经网络对预处理得到的多元时间序列数据降维;
S4:对降维得到的数据采用分段聚合算法进行分段,计算聚合后的序列数据的欧式距离,根据欧式距离定义阈值进行区分并形成分类结果。
2.如权利要求1所述的基于卷积神经网络的多元时序数据的分类方法,其特征在于,所述步骤S2中的去燥预处理包括有:
S21:对原始多元时间序列数据进行偏差检测,发现噪声、离群点和异常值,考察每个属性的定义域和数据类型以及每个属性可接受值的范围;
S22:通过考察数据领域内的值,通过分箱方法中的按照箱平均值法求得平滑数据值来光滑有序数据,将连续数据离散化,获取预处理后的时序数据,增加粒度。
3.如权利要求1所述的基于卷积神经网络的多元时序数据的分类方法,其特征在于,所述步骤S3中降维的具体步骤如下:
S31:将经过步骤S2预处理后得到的多元时序数据输入卷积神经网络,计算相对应的实际输出,输入值与各层带权值矩阵相乘,得到输出结果;
S32:将所述输出结果与基于专家知识的理想输出值比较作差;采用极小误差原则在反向传播阶段更新原相乘矩阵的权值,直至满足条件。
4.如权利要求1所述的基于卷积神经网络的多元时序数据的分类方法,其特征在于,所述步骤S4包括有:
S41:对于步骤S3所得的经过卷积神经网络降维处理后的一元时序数据,采用分段聚合算法将降维所得一元时序数据等长分段,获得各分段计算得到的平均值,将平均值组合得到的值作为降维后的新数据序列。
5.如权利要求4所述的基于卷积神经网络的多元时序数据的分类方法,其特征在于,所述步骤S4还包括有:
S42:应用欧氏距离计算两时序数据的距离其中Q,C为两时间序列,qi和ci分别为两时间序列第i个点对应的数据;然后将计算得到的距离值与根据专家经验定义的分类阈值比较,形成分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810270388.5A CN108491886A (zh) | 2018-03-29 | 2018-03-29 | 一种基于卷积神经网络的多元时序数据的分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810270388.5A CN108491886A (zh) | 2018-03-29 | 2018-03-29 | 一种基于卷积神经网络的多元时序数据的分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108491886A true CN108491886A (zh) | 2018-09-04 |
Family
ID=63316763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810270388.5A Pending CN108491886A (zh) | 2018-03-29 | 2018-03-29 | 一种基于卷积神经网络的多元时序数据的分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108491886A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109408498A (zh) * | 2018-10-09 | 2019-03-01 | 厦门理工学院 | 基于特征矩阵决策树的时间序列特征识别与分解方法 |
CN110414442A (zh) * | 2019-07-31 | 2019-11-05 | 广东省智能机器人研究院 | 一种压力时序数据分段特征值预测方法 |
CN110751169A (zh) * | 2019-09-04 | 2020-02-04 | 广东工业大学 | 一种基于多元变量间的关系变化的时序分类的方法 |
CN110766056A (zh) * | 2019-09-27 | 2020-02-07 | 中山大学 | 一种融合图像生成和多标签分类的异常图像检测方法 |
WO2020155415A1 (zh) * | 2019-01-31 | 2020-08-06 | 浙江大学 | 基于特征空间的光学相干层析的三维血流造影方法及系统 |
CN112115184A (zh) * | 2020-09-18 | 2020-12-22 | 平安科技(深圳)有限公司 | 时间序列数据的检测方法、装置、计算机设备及存储介质 |
CN112669142A (zh) * | 2021-01-05 | 2021-04-16 | 深圳前海微众银行股份有限公司 | 高维行为数据的建模方法、装置、设备及可读存储介质 |
CN113485302A (zh) * | 2021-07-20 | 2021-10-08 | 山东大学 | 基于多元时序数据的车辆运行过程故障诊断方法及系统 |
-
2018
- 2018-03-29 CN CN201810270388.5A patent/CN108491886A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109408498A (zh) * | 2018-10-09 | 2019-03-01 | 厦门理工学院 | 基于特征矩阵决策树的时间序列特征识别与分解方法 |
WO2020155415A1 (zh) * | 2019-01-31 | 2020-08-06 | 浙江大学 | 基于特征空间的光学相干层析的三维血流造影方法及系统 |
US11510574B2 (en) | 2019-01-31 | 2022-11-29 | Zhejiang University | Three-dimensional (3D) optical coherence tomography angiography (OCTA) method and system based on feature space |
CN110414442A (zh) * | 2019-07-31 | 2019-11-05 | 广东省智能机器人研究院 | 一种压力时序数据分段特征值预测方法 |
CN110751169A (zh) * | 2019-09-04 | 2020-02-04 | 广东工业大学 | 一种基于多元变量间的关系变化的时序分类的方法 |
CN110751169B (zh) * | 2019-09-04 | 2023-09-29 | 广东工业大学 | 一种基于多元变量间的关系变化的时序分类的方法 |
CN110766056A (zh) * | 2019-09-27 | 2020-02-07 | 中山大学 | 一种融合图像生成和多标签分类的异常图像检测方法 |
CN112115184A (zh) * | 2020-09-18 | 2020-12-22 | 平安科技(深圳)有限公司 | 时间序列数据的检测方法、装置、计算机设备及存储介质 |
CN112669142A (zh) * | 2021-01-05 | 2021-04-16 | 深圳前海微众银行股份有限公司 | 高维行为数据的建模方法、装置、设备及可读存储介质 |
CN112669142B (zh) * | 2021-01-05 | 2024-02-20 | 深圳前海微众银行股份有限公司 | 高维行为数据的建模方法、装置、设备及可读存储介质 |
CN113485302A (zh) * | 2021-07-20 | 2021-10-08 | 山东大学 | 基于多元时序数据的车辆运行过程故障诊断方法及系统 |
CN113485302B (zh) * | 2021-07-20 | 2022-06-21 | 山东大学 | 基于多元时序数据的车辆运行过程故障诊断方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108491886A (zh) | 一种基于卷积神经网络的多元时序数据的分类方法 | |
Lemke et al. | Meta-learning for time series forecasting and forecast combination | |
CN112165464B (zh) | 一种基于深度学习的工控混合入侵检测方法 | |
CN103366180A (zh) | 一种基于自动特征学习的细胞图像分割方法 | |
CN104809230A (zh) | 一种基于多分类器集成的卷烟感官质量评估方法 | |
CN109165672A (zh) | 一种基于渐进式学习的集成分类方法 | |
Chaghari et al. | Fuzzy clustering based on Forest optimization algorithm | |
CN110046593B (zh) | 基于分段改进s变换和随机森林的复合电能质量扰动识别方法 | |
CN114697128A (zh) | 通过人工智能决策的大数据去噪方法及大数据采集系统 | |
CN106446081B (zh) | 基于变化一致性挖掘时序数据关联关系的方法 | |
Hwang et al. | Detection and correction method of erroneous data using quantile pattern and LSTM | |
KR20200094938A (ko) | 생성적 대립 네트워크를 이용한 데이터의 불균형 해결방법 | |
Shahraki et al. | An outlier detection method to improve gathered datasets for network behavior analysis in IoT | |
CN110443574B (zh) | 多项目卷积神经网络评审专家推荐方法 | |
CN109165696A (zh) | 一种聚类方法及电子设备 | |
Tian et al. | TSRN: two-stage refinement network for temporal action segmentation | |
CN117093849A (zh) | 一种基于自动生成模型的数字矩阵特征分析方法 | |
Ma | The Research of Stock Predictive Model based on the Combination of CART and DBSCAN | |
Yu et al. | Analysis and Application of the Spatio-Temporal Feature in Wind Power Prediction. | |
Zhu et al. | Software defect prediction model based on stacked denoising auto-encoder | |
CN112667394A (zh) | 一种计算机资源利用率优化方法 | |
CN109344881B (zh) | 一种基于时空连续性的扩展分类器 | |
Tuba et al. | Image clustering by generative adversarial optimization and advanced clustering criteria | |
da Silva et al. | Automated Machine Learning for Time Series Prediction | |
Yu et al. | Automatic target recognition in infrared image using morphological genetic filtering algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180904 |