CN111079842A - 一种时间序列结构体数据的模拟发生方法 - Google Patents

一种时间序列结构体数据的模拟发生方法 Download PDF

Info

Publication number
CN111079842A
CN111079842A CN201911306029.1A CN201911306029A CN111079842A CN 111079842 A CN111079842 A CN 111079842A CN 201911306029 A CN201911306029 A CN 201911306029A CN 111079842 A CN111079842 A CN 111079842A
Authority
CN
China
Prior art keywords
data
structural body
time
simulation
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911306029.1A
Other languages
English (en)
Inventor
张可
柴毅
刘超
宋鑫
张龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201911306029.1A priority Critical patent/CN111079842A/zh
Publication of CN111079842A publication Critical patent/CN111079842A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种时间序列结构体数据的模拟发生方法,包括有实际数据分类、结构体模式规范化处理、分析结构体化数据和评判模拟四个步骤;本发明将多类型数据组合的时间序列采用统一的数据结构进行记录,便于数据存储和分析;通过结构化处理使得多类型数据组合的时间序列在组成上进行统一,可以采用同类分析方法来分析多元时间序列;通过生成的模拟结构体数据,理解发生源数据的动态系统、预测将来系统走向、指导通过干预来控制将来事件。

Description

一种时间序列结构体数据的模拟发生方法
技术领域
本发明涉及信息处理技术领域,特别是一种时间序列结构体数据的模拟发生方法。
背景技术
时间序列类数据是一种根据时间顺序排列形成的数据序列,其直观的表现了产生时间序列的对象在一定时期内的变动过程,反映了某一变量受其他各种因素影响的结果。这类数据在动态系统的运行过程中最为常见,是进行状态分析、预测分析、趋势分析、因果分析等的根本数据来源,相关技术方法在经济宏观控制、气象预报、市场分析、工业自动化控制等领域广泛应用。在当前大数据和人工智能的背景下,针对时间序列的研究有极为重要的现实意义。随着研究对象的规模及复杂度的增长,能够准确反映对象变化规律的时间序列数据结构日趋复杂,其单个数据元素本身在结构上具有较大的不确定性,极可能是一组多类型的数据组合。在这样的约束下,传统针对时间序列的表示与索引、相似性搜索、聚类/分类、模式分析、预测等处理方法将不再适用。主要存在两方面的难点:1、具有多类型数据组合的时间序列采用何种统一的数据结构进行记录;2、具有多类型数据组合的时间序列在组成上的不确定性使得相关的分析方法难以适应其维度和层级深度。
通过生成的模拟结构体数据,理解发生源数据的动态系统、预测将来系统走向、指导通过干预来控制将来事件。
发明内容
本发明的目的就是提供一种时间序列结构体数据的模拟发生方法。
本发明的目的是通过这样的技术方案实现的,具体步骤如下:
1)采集待模拟数据源的多类型实际数据并分类;
2)对实际数据或反馈数据,按不同数据类型分别进行结构体模式规范化处理;
3)采用时间序列分析法,对步骤2)中所述结构体模式规范化处理后的结构体数据进行分析;
4)采用评判机制,根据步骤3)分析的结果,判断结构体数据是否可用;
若结构体数据可用,则根据该结构体数据生成模拟数据,并采用时间序列分析法对模拟数据进行分析,保留分析有效的有效模拟数据;
若结构体数据不可用,则更新结构体模式规范化处理方法,并将还未结构体模式规范化处理的数据作为反馈数据,返回步骤2)进行重新处理。
进一步,所述多类型实际数据包括有平稳时间序列数据和/或非平稳时间序列数据。
进一步,步骤1)中所述对多类型实际数据进行分类的具体方法为:
1-1)将组成实际数据的时间序列划分为多个连续子段shapelet,并计算出实际数据与每个连续子段shapelet的距离;
1-2)根据实际数据与每个连续子段shapelet的距离,构建决策树;
1-3)通过决策树,对组成实际数据的时间序列进行分类。
进一步,步骤2)中所述按不同数据类型分别进行结构体模式规范化处理的具体方法如下:
2-1)采用STL方法,将实际数据或反馈数据分解;分解为周期性数据、趋势数据和余项;
2-2)周期性数据用于构建结构体数据中的数据同步矩阵;趋势性数据和余项用于构建结构体数据中的多个基本时序数据;
2-3)得到结构体数据,包括有结构体名、结构体类型编号、最大时间长度、结构体维度、数据同步对齐矩阵和基本时序数据;
其中,结构体类型包括有随机性时间序列、平稳性时间序列、趋势性时间序列和季节性时间序列;数据同步矩阵格式包括有:矩阵第一行为时间信息、其余各行放置与对应时间信息一一对应的数据,数据再某时间节点为空,表示该时刻数据不存在;基本时序数据结构包括有数据编号、信号起始时间、信号结束时间、时间步长数组和基本数据数组。
进一步,步骤3)中所述采用时间序列分析法,对结构体数据进行分析的具体方法如下:
3-1)采用LSTM模型,训练结构体数据;
3-2)记录LSTM模型不同的参数设置、不同的STL设置对各种类型时间序列结构化的影响,为各种类型时间序列选择最优的LSTM模型设置和STL设置。
进一步,步骤4)中所述采用评判机制,判断结构体数据是否可用的具体方法为:
4-1)判断结构体数据在维度上是否与实际数据或反馈数据保持一致、判断结构体数据的完整性、判断结构体数据的大小是否在预设波动范围内、判断结构体数据的可还原性、若能正常还原则判断是否能够剔除由于结构体模式规范化处理所生成的补充空数据、判断还原数据的分类是否正确、判断还原数据的维度变化是否符合预设标准、判断还原数据的快速读取性是否达到要求;若都通过,则转向步骤4-2),若不通过则表示结构体数据不可用;
4-2)判断结构体数据中的数据同步对齐矩阵的时间信息是否满足时间序列要求、审查与时间相对应的数据、判断结构体数据序号是否满足时间序列顺序要求、判断是否有重复赋值或遗漏赋值;若都通过,则转向步骤4-3),若不通过则表示结构体数据不可用;
4-3)判断结构体数据中基本时序结构的各项参数是否与实际数据矛盾;若都通过则结构体数据可用,若不通过则表示结构体数据不可用。
进一步,步骤4)中所述根据该结构体数据生成模拟数据的具体方法为:
采用LSTM方法对结构体数据进行训练,将数据递归循环,预测生成模拟数据。
进一步,步骤4)中所述采用时间序列分析法对模拟数据进行分析,保留分析有效的有效模拟数据的具体方法为:将模拟数据还原成正常时间序列数据格式,再判断还原后的模拟数据,是否是合格的预测数据;若还原后的模拟满足被预测的实际数据的趋势性、周期性和维度时间特性,则判断为有效,反之则无效。
由于采用了上述技术方案,本发明具有如下的优点:
1、本发明将多类型数据组合的时间序列采用统一的数据结构进行记录,便于数据存储和分析;
2、本发明通过结构化处理使得多类型数据组合的时间序列在组成上进行统一,可以采用同类分析方法来分析多元时间序列;
3、通过生成的模拟结构体数据,理解发生源数据的动态系统、预测将来系统走向、指导通过干预来控制将来事件。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和权利要求书来实现和获得。
附图说明
本发明的附图说明如下。
图1为本发明的流程示意图;
图2为基本时序数据结构示意图;
图3为数据同步对齐矩阵结构示意图;
图4为实施例流程示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
一种时间序列结构体数据的模拟发生方法,如图1至图3所示,具体步骤如下:
1)采集待模拟数据源的多类型实际数据并分类;
2)对采集到的实际数据或反馈数据,按不同数据类型分别进行结构体模式规范化处理;
3)采用时间序列分析法,对步骤2)中所述结构体模式规范化处理后的结构体数据进行分析,挖掘实际数据的结构体数据;
4)采用评判机制,判定步骤3)中挖掘出的结构体数据是否可用;
若结构体数据可用,则根据该结构体数据模拟生成模拟数据,并采用时间序列分析法对模拟数据进行分析,保留分析有效的有效模拟数据;
若结构体数据不可用,则更新结构体模式规范化处理方法,并将未结构体规范化的反馈数据返回步骤2)进行重新处理。
对多类型实际数据进行分类的具体方法为:数据从数据源发送过来,先由分类器接收,完成将数据分类的工作,而分类器的工作原理,主要是运用基于shapele的时间序列分类方法。Shapelet是时间序列的连续子段,是时间序列特有的局部特征。虽然时间序列的数据是按时间顺序产生的,但是可以获取多个shapelet,来计算出原数据与这些shapelet的距离。分类器实现分类的具体流程是,数据进入分类器,通过检索发现shapelet,然后根据检索出来的shapelet构造决策树,最后利用决策树对所输入的时间序列数据进行分类。、
按不同数据类型分别进行结构体模式规范化处理的具体方法如下:采用STL方法,将实际数据或反馈数据分解。将其分解为周期性数据、趋势数据和余项。Yv=Tv+Sv+Rv v=1,…,N。STL分解法分为内循环和外循环,其中内循环主要做了趋势拟合与周期分量的计算,外循环主要用于调节。数据被分解后,周期性数据用于构建结构体中的数据同步矩阵。趋势性数据和余项用于构建结构体中的多个基本时序数据。
最后得到的结构体结构包括结构体名、结构体类型编号、最大时间长度、结构体维度、数据同步对齐矩阵、大量的基本时序数据。
其中,结构体类型包括随机性时间序列、平稳性时间序列、趋势性时间序列、季节性时间序列。
其中数据同步对齐矩阵格式为:矩阵第一行为时间信息,其余各行放置的对应时间信息的一一对应的数据。数据再某时间节点可能为空,表示该时刻该编号数据不存在。
其中基本时序数据结构包括数据编号、信号起始时间、信号结束时间、时间步长数组、基本数据数组。
分析实际数据的具体方法如下:本专利采用LSTM模型,训练结构体数据。LSTM设计有三个“门”,分别是输入门、遗忘门、输出门来影响“细胞”,门是一种让信息选择式通过的方式,而最终输出了什么值,取决于“细胞”的状态。在训练过程中,将结构化后的数据按LSTM方法训练。“细胞”中的内容根据所训练结构体数据按时间顺序变化。这样,训练过程总“细胞”的输出,是根据当前数据所对应的时间,以及对应时间的前后时间所得。依照次训练格式,生成的结构体数据。用于模拟数据发生器的数据来源。
用数据库记录,不同的LSTM参数设置、不同的STL设置对各种类型时间序列源数据结构体化的影响,根据LSTM的训练结果,记录不同类型时间序列采用最优的LSTM设置和STL设置。形成数据规范并存储。
采用评判机制,判断结构体数据是否可用的具体方法为:
首先判断处理后的结构体数据在维度上是否与原始数据保持一致。判断数据的结构体结构完整性,审视处理后的结构体数据所占内存大小是否在波动在2%以内;判断数据的结构体结构可还原性,将已经结构化的数据还原,根据是否能正常还原,能否剔除由于结构体化而补充的空数据,从而还原源数据的原结构;判断数据的聚类和分类,数据的维度变化,以及数据的快速读取性;
其次判断数据同步对齐矩阵的时间信息是否满足时间序列要求,以及审查与时间相对应的数据的情况,生成的结构体序号是否满足时间序列顺序要求,是否序号被重复赋值或遗漏赋值;
接着判断基本时序数据结构的各项参数是否与原始数据矛盾,即检索基本时序数据结构的各项参数,是否为未出现过的新数值,这是不被允许的;
最后得出产生结构体的模型规范是否一一适用于当前信号源发生的各种类型信号;
根据该结构体数据模拟生成模拟数据的具体方法为:
将生成的结构体数据,放入数据库后,使用LSTM方法,对数据库中的结构体数据进行训练,将数据递归循环,每一个历史数据的状态将影响写一个数据训练的状态,即每一个结构体数据的起始时间,结束时间,时间步长数据,基本数据数组,数据同步对齐矩阵里面的数据,都将会影响下一个结构体的训练结果。LSTM是一种预测方法,最终生成的模拟数据的数据结构和数据内容,就是结构体数据结构。
采用时间序列分析法对模拟数据进行分析的具体方法为:对模拟数据分析,是通过改变LSTM训练集的输入门it:控制上一时刻信息影响下一时刻的信息流量;改变LSTM的遗忘门ft:控制上一时刻对下一时刻影响量;改变LSTM的输出门Ot:控制当前时刻信息流入隐藏状态的信息量。通过改变这三个量,能够记录对于某一种时间序列数据,这三个量:输入门、遗忘门、输出门怎样的数值范围更适合于该种时间序列数据类型。并记录下来。从而以后再遇到同种类型的数据,就用该套LSTM控制量来训练预测。
验证模拟数据是否有效跟验证结构体数据是否有效步骤基本相识,流程是先将模拟数据还原成正常时间序列数据格式,再判断还原后的数据,是否是合格的预测数据,满足被预测的源数据的趋势性、周期性、维度等时间特性。如果时间序列数据特性一致,则判断为有效。
更新结构体模式规范化处理方法的具体方法为:更新结构体模式规范处理方法,主要是更新STL对与不同类别的时间序列数据的参数设置,例如对于不同类型的时间序列数据,使用STL内循环的次数不同,稳健迭代的次数不一样,或者是在子序列平滑过程中,延展的时间点长度不同。通过训练和反馈,更新处理方法。在数据库中存储对于不同类别的时间序列数据,最合适STL分析参数设置。
实施例,如图4所示:
一种时间序列结构体数据模拟发生的方法,它包括以下步骤:
S1:搭建硬件平台,用于接受和处理数据源的数据。
硬件平台包括输入接口、分类器、存储器、处理器、模拟数据发生源、显示器、输入输出设备。
S2:建立模型数据库,用于接收和规范数据源发来的数据;建立存储数据库用于存储管理信息数据;具体步骤如下:
S21:建立接收模块,主要是输入接口和分类器,接收信号源所有信号,运用分类器对数据初步分类。
S22:搭建模型规范模块,由存储器、处理器、模拟数据发生源组成,用于处理时间序列数据。
S23:搭建存储模块,由数据库组成,用于存储已经按结构体规范后的数据。
S2:建立两个时序数据库,一个是用于存储的存储数据库,另一个用来接收和规范数据的数据库。数据库功能如下表:
Figure BDA0002323122980000071
数据库功能规划好后,接收数据进行处理。
所述步骤S2中对数据进行处理的步骤如下:
S21:运用分类器接触数据,数据被分为:类型一、类型二、类型三、类型四。再存储到多类型时间序列样本库中。
S22:新数据接入,数据库内置触发器激活,按类型缓存新存入的数据。
S23:对类型一、类型二、类型三、类型四这四种数据分别采取方式进行结构体模式规范;
S24:将四类数据规范后的数据进行缓存,存入时间序列结构体规则库,再将存好的数据在时间序列分析方法库中,选择合适方法,进行时间序列分析。判断其规范方法是否一一符合那四种类型的时间序列数据。
S3:根据评判机制,判定时间序列分析后的数据是否可用。
具体步骤如下:
S31:审查生成数据的趋势性、周期性、随机性、综合性。
S32:校验数据时间长度以及时间信息是否与数据匹配,时间信息间隔是否一致。
S33:判断结构体数据有效性、适用性。
S34:选择合理数据设置编号存入数据库,触发规模数据产生开关。
S4:生成和接收大规模结构体数据。具体步骤如下:
S41:接收时间序列分析后的评判信息,是否接收规范后的结构体信息。
S42:评判信息通过,触发规模数据接收开关,告知模拟数据源按时间序列结构体规则库规则产生数据,存储数据库安排数据空间准备接收数据;反之,则拒绝接收数据。
S43:设置抽样间隔,将模拟数据源发生的结构体数据发送至时间序列分析方法库进行抽样审核,判断数据的结构体结构是否异常,判断数据同步对齐矩阵是否异常,无异常则继续接收数据;应当理解的是,本说明书未详细阐述的部分均属于现有技术。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (8)

1.一种时间序列结构体数据的模拟发生方法,其特征在于,具体步骤如下:
1)采集待模拟数据源的多类型实际数据并分类;
2)对实际数据或反馈数据,按不同数据类型分别进行结构体模式规范化处理;
3)采用时间序列分析法,对步骤2)中所述结构体模式规范化处理后的结构体数据进行分析;
4)采用评判机制,根据步骤3)分析的结果,判断结构体数据是否可用;
若结构体数据可用,则根据该结构体数据生成模拟数据,并采用时间序列分析法对模拟数据进行分析,保留分析有效的有效模拟数据;
若结构体数据不可用,则更新结构体模式规范化处理方法,并将还未结构体模式规范化处理的数据作为反馈数据,返回步骤2)进行重新处理。
2.如权利要求1所述的时间序列结构体数据的模拟发生方法,其特征在于,所述多类型实际数据包括有平稳时间序列数据和/或非平稳时间序列数据。
3.如权利要求1所述的时间序列结构数据的模拟发生方法,其特征在于,步骤1)中所述对多类型实际数据进行分类的具体方法为:
1-1)将组成实际数据的时间序列划分为多个连续子段shapelet,并计算出实际数据与每个连续子段shapelet的距离;
1-2)根据实际数据与每个连续子段shapelet的距离,构建决策树;
1-3)通过决策树,对组成实际数据的时间序列进行分类。
4.如权利要求1所述的时间序列结构体数据的模拟发生方法,其特征在于,步骤2)中所述按不同数据类型分别进行结构体模式规范化处理的具体方法如下:
2-1)采用STL方法,将实际数据或反馈数据分解;分解为周期性数据、趋势数据和余项;
2-2)周期性数据用于构建结构体数据中的数据同步矩阵;趋势性数据和余项用于构建结构体数据中的多个基本时序数据;
2-3)得到结构体数据,包括有结构体名、结构体类型编号、最大时间长度、结构体维度、数据同步对齐矩阵和基本时序数据;
其中,结构体类型包括有随机性时间序列、平稳性时间序列、趋势性时间序列和季节性时间序列;数据同步矩阵格式包括有:矩阵第一行为时间信息、其余各行放置与对应时间信息一一对应的数据,数据再某时间节点为空,表示该时刻数据不存在;基本时序数据结构包括有数据编号、信号起始时间、信号结束时间、时间步长数组和基本数据数组。
5.如权利要求4所述的时间序列结构数据的模拟发生方法,其特征在于,步骤3)中所述采用时间序列分析法,对结构体数据进行分析的具体方法如下:
3-1)采用LSTM模型,训练结构体数据;
3-2)记录LSTM模型不同的参数设置、不同的STL设置对各种类型时间序列结构化的影响,为各种类型时间序列选择最优的LSTM模型设置和STL设置。
6.如权利要求5所述的时间序列结构体数据的模拟发生方法,其特征在于,步骤4)中所述采用评判机制,判断结构体数据是否可用的具体方法为:
4-1)判断结构体数据在维度上是否与实际数据或反馈数据保持一致、判断结构体数据的完整性、判断结构体数据的大小是否在预设波动范围内、判断结构体数据的可还原性、若能正常还原则判断是否能够剔除由于结构体模式规范化处理所生成的补充空数据、判断还原数据的分类是否正确、判断还原数据的维度变化是否符合预设标准、判断还原数据的快速读取性是否达到要求;若都通过,则转向步骤4-2),若不通过则表示结构体数据不可用;
4-2)判断结构体数据中的数据同步对齐矩阵的时间信息是否满足时间序列要求、审查与时间相对应的数据、判断结构体数据序号是否满足时间序列顺序要求、判断是否有重复赋值或遗漏赋值;若都通过,则转向步骤4-3),若不通过则表示结构体数据不可用;
4-3)判断结构体数据中基本时序结构的各项参数是否与实际数据矛盾;若都通过则结构体数据可用,若不通过则表示结构体数据不可用。
7.如权利要求6所述的时间序列结构体数据的模拟发生方法,其特征在于,步骤4)中所述根据该结构体数据生成模拟数据的具体方法为:
采用LSTM方法对结构体数据进行训练,将数据递归循环,预测生成模拟数据。
8.如权利要求7所述的时间序列结构体数据的模拟发生方法,其特征在于,步骤4)中所述采用时间序列分析法对模拟数据进行分析,保留分析有效的有效模拟数据的具体方法为:将模拟数据还原成正常时间序列数据格式,再判断还原后的模拟数据,是否是合格的预测数据;若还原后的模拟满足被预测的实际数据的趋势性、周期性和维度时间特性,则判断为有效,反之则无效。
CN201911306029.1A 2019-12-18 2019-12-18 一种时间序列结构体数据的模拟发生方法 Pending CN111079842A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911306029.1A CN111079842A (zh) 2019-12-18 2019-12-18 一种时间序列结构体数据的模拟发生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911306029.1A CN111079842A (zh) 2019-12-18 2019-12-18 一种时间序列结构体数据的模拟发生方法

Publications (1)

Publication Number Publication Date
CN111079842A true CN111079842A (zh) 2020-04-28

Family

ID=70315300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911306029.1A Pending CN111079842A (zh) 2019-12-18 2019-12-18 一种时间序列结构体数据的模拟发生方法

Country Status (1)

Country Link
CN (1) CN111079842A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115098472A (zh) * 2022-06-30 2022-09-23 北京亚控科技发展有限公司 一种物理实体全生命周期的数字孪生方法、装置及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115098472A (zh) * 2022-06-30 2022-09-23 北京亚控科技发展有限公司 一种物理实体全生命周期的数字孪生方法、装置及设备

Similar Documents

Publication Publication Date Title
Rama-Maneiro et al. Deep learning for predictive business process monitoring: Review and benchmark
Ma et al. Query-based workload forecasting for self-driving database management systems
Zhai et al. Enabling predictive maintenance integrated production scheduling by operation-specific health prognostics with generative deep learning
CN102282516B (zh) 异常检测方法及异常检测系统
CN109409561B (zh) 多时间尺度时间序列协同预测模型的构建方法
CN110414768B (zh) 一种基于仪器电流数据的大数据分析方法
Sugiharti et al. Predictive evaluation of performance of computer science students of unnes using data mining based on naÏve bayes classifier (NBC) algorithm
US20200151207A1 (en) Method and system for automatic discovery of topics and trends over time
CN113256036B (zh) 基于Prophet-LSTNet组合模型的供电成本分析预测方法
Galbally et al. A pattern recognition approach based on DTW for automatic transient identification in nuclear power plants
CN116597939A (zh) 基于大数据的药品质量控制管理分析系统及方法
CN116539994A (zh) 基于多源时间序列数据的变电站主设备运行状态检测方法
CN117829318A (zh) 一种基于大模型算法的数字孪生系统
CN118260087A (zh) 一种数据库查询语句与服务器能耗相关性测量方法
CN118170658A (zh) 一种基于ai大模型的软件规模度量方法及系统
CN112700065B (zh) 基于深度学习的业务流程完成时间区间预测方法和系统
CN111079842A (zh) 一种时间序列结构体数据的模拟发生方法
CN117436591A (zh) 一种光伏新能源监管平台算法的深度优化方法
Bond et al. A hybrid learning approach to prognostics and health management applied to military ground vehicles using time-series and maintenance event data
CN109800887B (zh) 预测流程模型的生成方法、装置、存储介质和电子设备
Wibawa et al. Bidirectional Long Short-Term Memory (Bi-LSTM) Hourly Energy Forecasting
CN116628444A (zh) 一种基于改进元学习的水质预警方法
Relkar et al. Prediction of Air Quality index using supervised machine learning
CN114201923A (zh) 一种滑坡位移预测模型的处理方法和装置
CN118538036B (zh) 一种基于深度学习方法的交通流短期预测方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200428

RJ01 Rejection of invention patent application after publication