CN110175637A - 非平稳时序数据深度预测方法、系统、存储介质及设备 - Google Patents

非平稳时序数据深度预测方法、系统、存储介质及设备 Download PDF

Info

Publication number
CN110175637A
CN110175637A CN201910382724.XA CN201910382724A CN110175637A CN 110175637 A CN110175637 A CN 110175637A CN 201910382724 A CN201910382724 A CN 201910382724A CN 110175637 A CN110175637 A CN 110175637A
Authority
CN
China
Prior art keywords
variable
predicted
depth
prediction result
correlated variables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910382724.XA
Other languages
English (en)
Inventor
金学波
杨念香
王小艺
白玉廷
苏婷立
孔建磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Technology and Business University
Original Assignee
Beijing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Technology and Business University filed Critical Beijing Technology and Business University
Priority to CN201910382724.XA priority Critical patent/CN110175637A/zh
Publication of CN110175637A publication Critical patent/CN110175637A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种非平稳时序数据深度预测方法,包括:筛选原始多维变量中的相关变量;分解待预测变量和相关变量,得到相应的分变量;将待预测变量的分变量和相关变量的分变量分别作为深度网络的输入,经过深度网络进行预测,得到各自的预测结果;将待预测变量的预测结果和相关变量的预测结果进行融合,获得最终预测结果。本发明对原始多维变量进行筛选,减少了噪声的引入,也降低了原始数据的维度;对变量进行分解,可以得到更有效的内在数据趋势及特征分量;将待预测变量和相关变量分别预测,将各自的预测结果融合从而得到精准预测结果。本发明还提供一种非平稳时序数据深度预测系统、存储介质及计算机设备。

Description

非平稳时序数据深度预测方法、系统、存储介质及设备
技术领域
本发明涉及时间序列预测技术领域,尤其涉及一种非平稳时序数据深度预测方法、系统、存储介质及设备。
背景技术
时序数据存在于众多实际系统中,分析时序数据特征并预测其趋势,对系统控制与管理具有实际意义,如气象数据预测,股价数据分析、市场销量预测等。时序数据通常具有维度高、非线性、噪声复杂等特点,时序数据预测面临特征难以提取、趋势规律不明显、干扰因素多等挑战。
现有时序数据分析预测方法,采用单变量直接进行预测,预测网络学习到的特征有限,预测精度低;且无法得到有效的内在数据趋势及特征分量,导致数据噪声对网络训练产生极大影响。
发明内容
本发明所要解决的技术问题是针对现有技术中存在的问题,提供一种非平稳时序数据深度预测方法、系统、存储介质及设备。
为解决上述技术问题,本发明还提供一种非平稳时序数据深度预测方法,包括:
依据相关度对原始多维变量进行筛选,筛选出与待预测变量相关度最高的相关变量;
利用季节趋势分解法对所述待预测变量和所述相关变量进行分解,得到相应的分变量;
将所述待预测变量的分变量作为预先构建的第一深度网络的输入,经过所述第一深度网络进行预测,得到所述待预测变量的预测结果;
将所述相关变量的分变量作为预先构建的第二深度网络的输入,经过所述第二深度网络进行预测,得到所述相关变量的预测结果;
将所述待预测变量的预测结果和所述相关变量的预测结果进行融合,获得最终预测结果。
为解决上述技术问题,本发明还提供一种非平稳时序数据深度预测系统,包括:
变量筛选模块,用于依据相关度对原始多维变量进行筛选,筛选出与待预测变量相关度最高的相关变量;
趋势分解模块,用于利用季节趋势分解法对所述待预测变量和所述相关变量进行分解,得到相应的分变量;
分变量预测模块,用于将所述待预测变量的分变量作为预先构建的第一深度网络的输入,经过所述第一深度网络进行预测,得到所述待预测变量的预测结果;
将所述相关变量的分变量作为预先构建的第二深度网络的输入,经过所述第二深度网络进行预测,得到所述相关变量的预测结果;
结果融合模块,用于将所述待预测变量的预测结果和所述相关变量的预测结果进行融合,获得最终预测结果。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使所述计算机执行上述非平稳时序数据深度预测方法。
为解决上述技术问题,本发明还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上的并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述非平稳时序数据深度预测方法。
本发明的有益效果是:依据相关度从原始多维变量中筛选出与待预测变量相关度最高的相关变量,这样既可以挑选出对待预测变量更有效的变量,从而减少噪声的引入,也可以降低原始数据的维度,提高预测精度;利用季节趋势分解法对待预测变量和相关变量进行分解,以得到更有效的内在数据趋势及特征分量,进而降低数据噪声对网络训练的影响;将待预测变量和相关变量的分变量作为深度网络的输入,将待预测变量和相关变量分别预测,将各自的预测结果融合从而得到精准预测结果。
附图说明
图1为本发明实施例提供的非平稳时序数据深度预测方法示意性流程图;
图2为本发明实施例提供的非平稳时序数据深度预测方法实现模型框架图;
图3为本发明实施例提供的卷积神经网络CNN的卷积方式图;
图4为本发明实施例提供的深度网络Conv-BiLSTM的网络结构图;
图5为本发明实施例提供的多层感知机MLP神经元连接图;
图6为本发明实施例提供的部分相对湿度数据展示图;
图7为本发明实施例提供的相对湿度预测图;
图8为本发明实施例提供的非平稳时序数据深度预测系统示意性结构框图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1和图2给出了本发明实施例提供的一种非平稳时序数据深度预测方法示意性流程图。如图1和图2所示,该非平稳时序数据深度预测方法包括:
S1,依据相关度对原始多维变量进行筛选,筛选出与待预测变量相关度最高的相关变量;
S2,利用季节趋势分解法对所述待预测变量和所述相关变量进行分解,得到相应的分变量;
S3,将所述待预测变量的分变量作为预先构建的第一深度网络的输入,经过所述第一深度网络进行预测,得到所述待预测变量的预测结果;将所述相关变量的分变量作为预先构建的第二深度网络的输入,经过所述第二深度网络进行预测,得到所述相关变量的预测结果;
S5,将所述待预测变量的预测结果和所述相关变量的预测结果进行融合,获得最终预测结果。
除考虑数据驱动的深度网络预测技术外,还需考虑实际数据的特点。非平稳时序数据通常由多变量组成,且变量之间相互影响,且变量发展变化的内在趋势直接影响预测性能。在使用相关变量预测某个特定变量时,如果将所有变量均作为网络的输入,不仅不能提高网络的性能,反而会因为引入了更多的噪声而导致精度下降。如果仅将待预测变量作为网络的输入,那么网络学习到的特征有限,预测精度低。另外,预测的核心是挖掘数据变化趋势,在包含噪声的数据中,提取数据的趋势是提升预测性能的有效方法。
上述实施例中,针对非平稳时序数的据预测问题,依据相关度从原始多维变量中筛选出与待预测变量相关度最高的相关变量,这样既可以挑选出对待预测变量更有效的变量,从而减少噪声的引入,也可以降低原始数据的维度,提高预测精度;利用季节趋势分解法对待预测变量和相关变量进行分解,相比于其他分解方法,季节趋势分解法可以将任意的复杂时序数据分解为三个子序列,这些子序列都各具明显规律,其可以得到更有效的内在数据趋势及特征分量,进而降低数据噪声对网络训练的影响;将待预测变量和相关变量的分变量作为深度网络的输入,将待预测变量和相关变量分别预测,将各自的预测结果融合从而得到精准预。该实施例中增加一个与待预测变量高度相关的变量,增加了输入信息,使得深度网络可以学习到更多的特征,并基于此作出更精准预测。
优选地,依据相关度对原始多维变量进行筛选,筛选出与待预测变量相关度最高的相关变量,包括:利用皮尔逊相关系数法PCC得到原始多维变量各变量之间的线性相关关系,筛选出与待预测变量相关度最高的相关变量。
需要说明的是,PCC系数为1表示数据对象完全相关,为0表示数据对象不相关。也就是说,PCC系数量化了两个数据对象在一条线上的匹配程度。通过计算原始多维变量的协方差矩阵来判断各变量之间的线性关系,计算公式如下:
其中,ρx,y表示变量X及变量Y之间的皮尔逊相关系数,δx和δy分别表示变量X和变量Y的标准差,cov(X,Y)表示变量X及变量Y之间的协方差。
上述实施例中,将原始多维变量标准化,利用皮尔逊相关系数法PCC得到原始多维变量各变量之间的线性相关关系,从原始多维变量中筛选出与待预测变量相关度最高的相关变量,这样既可以挑选出对待预测变量更有效的变量,从而减少噪声的引入,也可以降低原始数据的维度,提高预测精度。
可选地,利用季节趋势分解法STL(Seasonal and Trend decomposition usingLoess,简称为STL)对保留的变量进行分解,每个变量分解得到三个分变量。三个分变量分别为趋势分量Trend,周期分量Seasonal和余项分量Residual。
将待预测变量和相关变量分解得到的三个特征分量分别作为深度网络的输入,深度网络实现了对三个特征分量的横向和时间两个维度上的特征提取,并基于此作出预测。
STL是一种时序分解算法,由两个循环机制组成,内循环嵌套在外循环里。内循环每运行一次,周期分量和趋势分量就会被更新一次,一个完整的分解运行都由ni个这样的内循环过程组成。每一个外循环通道都由内循环组成,通过外循环可以计算得到鲁棒权重,这些权重会用在下一个内循环中,用于减少趋势分量和季节分量中短暂的异常行为。第一次外循环设置的鲁棒权重都等于1,进行no次外循环。STL可将任意时序数据在某时刻的数据Yt分解趋势分量Tt、周期分量St和余项分量Rt之和,如公式(2)所示:
Yt=Tt+St+Rt t=1,2,...,N (2)
STL的每一次内循环都会先通过平滑更新周期分量,紧跟着对趋势分量进行平滑和更新。
具体分解过程如下:
a,将当前时刻的原始时序数据Yt分解为趋势分量Tt、周期项分量St和余项分量Rt之和,为趋势分量Tt赋初值Tt (0),一般设置Tt (0)=0;
b,将当前时刻的原始时序数据减去上一轮循环得到的趋势分量,得到第一时间序列Yt-Tt (k),其中,k为迭代次数;其中如果原始时序数据Yt在一些特定的点是缺失的,那么,去趋势化的序列在这个缺失的点也同样会缺失;
c,对所述第一时间序列Yt-Tt (k)进行LOESS局部多项式拟合回归,计算每一个时间点的平滑值,平滑结果组合得到临时周期子序列t=-n(p)+1,...,-N+n(p),其长度为N+2×np,其中,np为一个周期的样本数,此步骤需选定LOESS回归平滑参数ns
d,对所述临时周期子序列依次进行长度分别为np、np和3的三次滑动平均,再次进行LOESS回归,得到长度为N的第二时间序列 去除周期性差异,相当于提取周期子序列的低通量,此步骤需选定LOESS回归平滑参数nl
e,利用所述临时周期子序列减去所述第二时间序列得到周期分量的第k+1次迭代结果
f,利用原始时序数据Yt减去周期分量的第k+1次迭代结果,得到第三时间序列如果原始时序数据Yt在特定的点是缺失的,那么去周期序列在这个点同样缺失;
g,对所述第三时间序列进行LOESS回归,得到趋势分量的第K+1次迭代结果Tt (k+1),此过程需选定LOESS回归的平滑参数nt
h,判断得到的趋势分量与周期分量是否收敛,若收敛,则时间序列的趋势分量为Tt=Tt (k+1),周期项分量为余项分量为Rt=Yt-Tt-St;若不收敛,则返回步骤b,重新进行循环,直到趋势分量和周期分量收敛为止。
以上的k代表各个步骤发生的迭代次数。该分解方法设计了内循环与外循环,使算法具有足够的鲁棒性。特别地,若ni足够大,则当内循环结束时,趋势分量与周期分量已收敛;若时序数据中没有明显的异常值,可以将no设为0。np是每个周期中观察点的数量,若时间序列的周期为一天,按小时统计,则np=24。nl通常可以认定为大于或等于np的最小奇数。ns通常被设定为奇数,同时希望ns至少为7,随着ns的增加,每个周期子序列变得平滑。nt也通常被设定为奇数。
优选地,还包括预先构建深度网络的步骤;其中,所述深度网络Conv-BiLSTM为卷积神经网络CNN与双向长短期记忆网络BiLSTM的结合网络。该实施例中,深度网络结合了卷积神经网络CNN和双向LSTM,卷积神经网络CNN通过加深网络结构实现对时序特征的提取与描述,具有很强的非线性建模能力;双向LSTM在结构上是由一个向前和一个向后的LSTM组成,因其考虑了时间维度上更多的信息,可得到更精准的预测结果。卷积神经网络CNN和双向LSTM实现了对输入的两个维度上的特征自动提取,具有更高的精度。
如图3所示,卷积神经网络设置了两层卷积层,卷积核的大小设置为(3,3)。其输入和输出的维度由输入数据和输出数据决定。
如图4所示,深度网络包括一维卷积层和双向LSTM层。X1代表第1个时刻的输入,Xt代表第t个时刻的输入;1D卷积指向LSTM的箭头表示使用1D卷积提取的特征输入到LSTM中,LSTM之间的箭头表示对应时刻的ISTM输出传入到下一个时刻的LSTM中;激活单元表示一个非线性激活函数,通过这个激活函数,得到最后的输出;Y1和Yt分别表示第1个时刻和第t时刻的输出。
在实际数据中,一个时刻的数据往往受该时刻之前和之后的数据同时影响。双向LSTM在结构上是由一个向前和一个向后的LSTM组成,因其考虑了时间维度上更多的信息,可得到更精准的预测结果。
该实施例中,深度网络包括第一深度网络和第二深度网络。
优选地,预先构建第一深度网络包括:设置所述第一深度网络包括一维卷积层和双向LSTM层,所述一维卷积层设置两层卷积,双向LSTM设置为一层;将所述待预测变量的分变量和所述待预测变量分别作为所述第一深度网络的输入和输出,训练和测试所述第一深度网络。
以真实的气象数据集为例,原始气象数据集包括相对湿度、温度、风速和气压等共8个气象因素。将相对湿度作为待预测变量,利用皮尔逊相关系数法PCC得到地面10米以上的径向风速为相关变量。使用待预测变量经过分解的三个分变量和待预测变量作为第一深度网络的输入和输出,训练和测试第一深度网络。该实施例中,采用四百天的气象数据,选择80%作为训练数据,选择20%作为测试数据。所以,选择待预测变量的380天数据作为训练集,20天数据集作为测试集。经过STL分解,待预测变量分解为三个分变量,预测步长为一天(24个小时),因此,第一深度网络的输入为(24,3),输出为(24,1)。先使用训练集训练第一深度网络,使用监督学习的方式,以获得卷积神经网络的权重参数,再输入测试集,得到测试集的预测结果并保存。
预先构建第二深度网络包括:设置所述第二深度网络包括一维卷积层和双向LSTM层,所述一维卷积层设置两层卷积,双向LSTM设置为一层;将所述相关变量的分变量和所述相关变量分别作为所述第二深度网络的输入和输出,训练和测试所述第二深度网络。
使用相关变量经过分解的三个分变量和相关变量作为第二深度网络的输入和输出,训练和测试第二深度网络。该实施例中,采用四百天的气象数据,选择80%作为训练数据,选择20%作为测试数据。选择相关变量的380天数据作为训练集,20天数据集作为测试集。经过STL分解,相关变量分解为三个分变量,预测步长为一天(24个小时),因此,第二深度网络的输入为(24,3),输出为(24,1)。先使用训练集训练第二深度网络,使用监督学习的方式,以获得卷积神经网络的权重参数,再输入测试集,得到测试集的预测结果并保存。
可选地,将所述待预测变量的预测结果和所述相关变量的预测结果进行融合,获得最终预测结果,包括:利用非线性模型MLP网络将所述待预测变量的预测结果和所述相关变量的预测结果进行非线性融合,获得最终预测结果。该实施例中,使用非线性模型MLP网络进行融合,规避人为给定权重造成的融合结果发散问题,能够有效地考虑预测结果之间的非线性关系,提高了最终预测结果的精度。
该实施例中,非线性模型MLP由三层全连接神经元组成,分别为输入层,隐藏层和输出层,网络结构图如图5所示。该实施例中,采用待预测变量和相关变量两个变量进行预测,得到了两个预测结果,因此,MLP的输入层神经元设置为2,输出层神经元数设置为1。对于非线性模型MLP的隐藏层神经元数,通过多次实验得出的经验参数为5。
使用第一深度网络和第二深度网络的训练数据预测结果及训练数据的标签(即训练数据的预测结果对应的真实观测值)作为MLP的训练数据,使用第一深度网络和第二深度网络的测试数据预测结果及测试数据的标签(即测试数据预测结果对应的真实观测值)作为MLP的测试数据。并训练和测试MPL网络,测试数据的结果为最终预测结果。
本发明实施例从上述深度网络、相关变量筛选、数据趋势提取三方面考虑,以双向LSTM为主要框架,对变量从外在影响因素和内在趋势构成两个角度进行多维变换。当我们要预测原始多维变量数据中的某个特定的变量时,首先利用相关度筛选出与待预测变量存在高相关度的变量,再使用季节趋势分解方法对变量进行特征分解,以得到更有效的内在数据趋势及特征分量;将分解后的变量作为深度网络的输入,然后将不同变量的预测结果进行融合,获得最终预测结果。
本发明实施例采用的数据来源于北京气象台记录的关键气象要素数据集。原始气象数据集包括相对湿度、温度、风速和气压等共8个气象因素。利用皮尔逊相关系数法PCC得到地面10米以上的径向风速为相关变量。观测间隔为一小时(即每隔一小时记录一组观测数据)。对于少数缺失值,使用缺失值时刻的前一时刻的值代替。基于原始气象数据集对预测模型(包括了变量筛选、变量分解,分变量预测及结果融合等整个过程)进行验证,选用400天数据实验测量数据对本发明方法进行仿真计算,实验中数据的时间步长为1小时,每天24个时刻,共9600个连续时刻数据。并设置好时间戳,便于STL分解。
图6展示了相对湿度数据,可以看出原始数据具有高度非线性。考虑到保持相似的统计特征,选取前80%的数据作为训练集,20%的数据作为测试集。学习时间步长与预测时间步长均为24h,即用前24h的数据信息预测后24h的值。对两个Conv-BiLSTM得到的预测结果进行MLP融合并得到最终结果。得到相对湿度经融合方法预测的最后结果,如图7所示。预测的均方根误差为16.42,预测结果表明该实施例中面对多输入变量的非平稳时序数据深度预测方法具有实用性。
上文结合图1至图7详细描述了根据本发明实施例提供的非平稳时序数据深度预测方法。下面结合图8,详细描述本发明实施例提供的非平稳时序数据深度预测系统。该系统包括变量筛选模块、趋势分解模块、分变量预测模块和结果融合模块。
变量筛选模块,用于依据相关度对原始多维变量进行筛选,筛选出与待预测变量相关度最高的相关变量;趋势分解模块,用于利用季节趋势分解法对所述待预测变量和所述相关变量进行分解,得到相应的分变量;分变量预测模块,用于将所述待预测变量的分变量作为预先构建的第一深度网络的输入,经过所述第一深度网络进行预测,得到所述待预测变量的预测结果;将所述相关变量的分变量作为预先构建的第二深度网络的输入,经过所述第二深度网络进行预测,得到所述相关变量的预测结果;结果融合模块,用于将所述待预测变量的预测结果和所述相关变量的预测结果进行融合,获得最终预测结果。
本发明实施例中,非平稳时序数据深度预测系统的各模块可实现上述实施例中非平稳时序数据深度预测方法所描述的全部功能,其具体实现方式和取得的对应效果与方法部分对应,此处不再赘述。
本发明实施例还提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使所述计算机执行上述实施例中的非平稳时序数据深度预测方法。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上的并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例中的非平稳时序数据深度预测方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种非平稳时序数据深度预测方法,其特征在于,包括:
依据相关度对原始多维变量进行筛选,筛选出与待预测变量相关度最高的相关变量;
利用季节趋势分解法对所述待预测变量和所述相关变量进行分解,得到相应的分变量;
将所述待预测变量的分变量作为预先构建的第一深度网络的输入,经过所述第一深度网络进行预测,得到所述待预测变量的预测结果;
将所述相关变量的分变量作为预先构建的第二深度网络的输入,经过所述第二深度网络进行预测,得到所述相关变量的预测结果;
将所述待预测变量的预测结果和所述相关变量的预测结果进行融合,获得最终预测结果。
2.根据权利要求1所述的方法,其特征在于,所述依据相关度对原始多维变量进行筛选,筛选出与待预测变量相关度最高的相关变量,包括:
利用皮尔逊相关系数法PCC得到原始多维变量各变量之间的线性相关关系,筛选出与待预测变量相关度最高的相关变量。
3.根据权利要求1所述的方法,其特征在于,还包括预先构建第一深度网络和第二深度网络的步骤;其中,所述第一深度网络和第二深度网络均为卷积神经网络与双向长短期记忆网络的结合网络。
4.根据权利要求3所述的方法,其特征在于,所述预先构建第一深度网络包括:设置所述第一深度网络包括一维卷积层和双向LSTM层,所述一维卷积层设置两层卷积,双向LSTM设置为一层;
将所述待预测变量的分变量和所述待预测变量分别作为所述第一深度网络的输入和输出,训练和测试所述第一深度网络。
5.根据权利要求3所述的方法,其特征在于,所述预先构建第二深度网络包括:设置所述第二深度网络包括一维卷积层和双向LSTM层,所述一维卷积层设置两层卷积,双向LSTM设置为一层;
将所述相关变量的分变量和所述相关变量分别作为所述第二深度网络的输入和输出,训练和测试所述第二深度网络。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述将所述待预测变量的预测结果和所述相关变量的预测结果进行融合,获得最终预测结果,包括:
利用非线性模型MLP网络将所述待预测变量的预测结果和所述相关变量的预测结果进行非线性融合,获得最终预测结果。
7.一种非平稳时序数据深度预测系统,其特征在于,包括:
变量筛选模块,用于依据相关度对原始多维变量进行筛选,筛选出与待预测变量相关度最高的相关变量;
趋势分解模块,用于利用季节趋势分解法对所述待预测变量和所述相关变量进行分解,得到相应的分变量;
分变量预测模块,用于将所述待预测变量的分变量作为预先构建的第一深度网络的输入,经过所述第一深度网络进行预测,得到所述待预测变量的预测结果;
将所述相关变量的分变量作为预先构建的第二深度网络的输入,经过所述第二深度网络进行预测,得到所述相关变量的预测结果;
结果融合模块,用于将所述待预测变量的预测结果和所述相关变量的预测结果进行融合,获得最终预测结果。
8.一种计算机可读存储介质,包括指令,其特征在于,当所述指令在计算机上运行时,使所述计算机执行根据权利要求1至6任一项所述的非平稳时序数据深度预测方法。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上的并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的非平稳时序数据深度预测方法。
CN201910382724.XA 2019-05-09 2019-05-09 非平稳时序数据深度预测方法、系统、存储介质及设备 Pending CN110175637A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910382724.XA CN110175637A (zh) 2019-05-09 2019-05-09 非平稳时序数据深度预测方法、系统、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910382724.XA CN110175637A (zh) 2019-05-09 2019-05-09 非平稳时序数据深度预测方法、系统、存储介质及设备

Publications (1)

Publication Number Publication Date
CN110175637A true CN110175637A (zh) 2019-08-27

Family

ID=67690599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910382724.XA Pending CN110175637A (zh) 2019-05-09 2019-05-09 非平稳时序数据深度预测方法、系统、存储介质及设备

Country Status (1)

Country Link
CN (1) CN110175637A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232570A (zh) * 2020-10-19 2021-01-15 国网陕西省电力公司 一种正向有功总电量预测方法、装置及可读存储介质
CN112990354A (zh) * 2021-04-15 2021-06-18 中国气象局公共气象服务中心(国家预警信息发布中心) 一种构建用于风速预测的深度卷积回归网络的方法及装置
CN114971748A (zh) * 2022-07-27 2022-08-30 阿里健康科技(中国)有限公司 预测数据生成、模型训练方法、计算机设备以及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678869A (zh) * 2013-09-17 2014-03-26 中国人民解放军海军航空工程学院青岛校区 一种飞行参数缺失数据的预测估计方法
CN107730059A (zh) * 2017-11-29 2018-02-23 成都思晗科技股份有限公司 基于机器学习的变电站电量趋势预测分析的方法
CN108495341A (zh) * 2018-02-08 2018-09-04 西安电子科技大学 一种基于流向预测的资源预留方法及系统、移动通信系统
CN108596393A (zh) * 2018-04-28 2018-09-28 国信优易数据有限公司 一种金融电子资源预测模型的训练方法和装置
CN108733859A (zh) * 2017-04-21 2018-11-02 上海电气集团股份有限公司 蒸汽发生器热处理过程中支撑板形变预警方法
CN108846058A (zh) * 2018-06-01 2018-11-20 阿里巴巴集团控股有限公司 一种时间序列中的异常数据校正方法、装置及处理设备
CN108989124A (zh) * 2018-08-10 2018-12-11 中国移动通信集团海南有限公司 网络故障发现方法、电子装置及计算机可读存储介质
CN109145031A (zh) * 2018-08-20 2019-01-04 国网安徽省电力有限公司合肥供电公司 一种面向业务市场接入需求的多源数据多维重构方法
CN109299262A (zh) * 2018-10-09 2019-02-01 中山大学 一种融合多粒度信息的文本蕴含关系识别方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678869A (zh) * 2013-09-17 2014-03-26 中国人民解放军海军航空工程学院青岛校区 一种飞行参数缺失数据的预测估计方法
CN108733859A (zh) * 2017-04-21 2018-11-02 上海电气集团股份有限公司 蒸汽发生器热处理过程中支撑板形变预警方法
CN107730059A (zh) * 2017-11-29 2018-02-23 成都思晗科技股份有限公司 基于机器学习的变电站电量趋势预测分析的方法
CN108495341A (zh) * 2018-02-08 2018-09-04 西安电子科技大学 一种基于流向预测的资源预留方法及系统、移动通信系统
CN108596393A (zh) * 2018-04-28 2018-09-28 国信优易数据有限公司 一种金融电子资源预测模型的训练方法和装置
CN108846058A (zh) * 2018-06-01 2018-11-20 阿里巴巴集团控股有限公司 一种时间序列中的异常数据校正方法、装置及处理设备
CN108989124A (zh) * 2018-08-10 2018-12-11 中国移动通信集团海南有限公司 网络故障发现方法、电子装置及计算机可读存储介质
CN109145031A (zh) * 2018-08-20 2019-01-04 国网安徽省电力有限公司合肥供电公司 一种面向业务市场接入需求的多源数据多维重构方法
CN109299262A (zh) * 2018-10-09 2019-02-01 中山大学 一种融合多粒度信息的文本蕴含关系识别方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232570A (zh) * 2020-10-19 2021-01-15 国网陕西省电力公司 一种正向有功总电量预测方法、装置及可读存储介质
CN112990354A (zh) * 2021-04-15 2021-06-18 中国气象局公共气象服务中心(国家预警信息发布中心) 一种构建用于风速预测的深度卷积回归网络的方法及装置
CN112990354B (zh) * 2021-04-15 2021-08-13 中国气象局公共气象服务中心(国家预警信息发布中心) 一种构建用于风速预测的深度卷积回归网络的方法及装置
CN114971748A (zh) * 2022-07-27 2022-08-30 阿里健康科技(中国)有限公司 预测数据生成、模型训练方法、计算机设备以及存储介质
CN114971748B (zh) * 2022-07-27 2022-11-01 阿里健康科技(中国)有限公司 预测数据生成、模型训练方法、计算机设备以及存储介质

Similar Documents

Publication Publication Date Title
CN111367961B (zh) 基于图卷积神经网络的时序数据事件预测方法、系统及其应用
US10600005B2 (en) System for automatic, simultaneous feature selection and hyperparameter tuning for a machine learning model
Bruneo et al. On the use of LSTM networks for predictive maintenance in smart industries
CN110674604A (zh) 基于多维时序帧卷积lstm的变压器dga数据预测方法
CN109905270B (zh) 定位根因告警的方法、装置和计算机可读存储介质
CN110956272B (zh) 实现数据处理的方法和系统
CN109977098A (zh) 非平稳时序数据预测方法、系统、存储介质及计算机设备
CN110175637A (zh) 非平稳时序数据深度预测方法、系统、存储介质及设备
US20150120263A1 (en) Computer-Implemented Systems and Methods for Testing Large Scale Automatic Forecast Combinations
RU2670937C9 (ru) Прогнозирование операций технического обслуживания, применяемых к двигателю
Chiachio et al. A new algorithm for prognostics using Subset Simulation
CN108090686B (zh) 一种医疗事件风险评估分析方法及系统
Viner A qualitative assessment of the sources of uncertainty in climate change impacts assessment studies
CN106779240A (zh) 民航市场宏观指数的预测方法及系统
Ozyegen et al. Experimental results on the impact of memory in neural networks for spectrum prediction in land mobile radio bands
CN113380340B (zh) 飞灰浓度预测模型的训练方法、装置、计算机设备
Hart et al. An advanced cost estimation methodology for engineering systems
CN110188793A (zh) 数据异常分析方法及装置
CN107274024A (zh) 一种气象台站测量日总辐射曝辐量预测优化方法
Masteriana et al. Generalized STAR (1; 1) model with outlier-case study of begal in Medan, North Sumatera
CN115389743A (zh) 一种变压器油中溶解气体含量区间预测方法、介质及系统
CN113722308A (zh) 基于EEMD-MultiCNN-LSTM的加速度响应数据补全方法及装置
Zio et al. System reliability and risk analysis by Monte Carlo simulation
Kumari et al. MetaAnalyser-a concept and toolkit for enablement of digital twin
Özdemir et al. Performance Comparison Of Machine Learning Methods And Traditional Time Series Methods For Forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Jin Xuebo

Inventor after: Yu Xinghong

Inventor after: Wang Xiaoyi

Inventor after: Bai Yuting

Inventor after: Su Tingli

Inventor after: Kong Jianlei

Inventor before: Jin Xuebo

Inventor before: Yang Nianxiang

Inventor before: Wang Xiaoyi

Inventor before: Bai Yuting

Inventor before: Su Tingli

Inventor before: Kong Jianlei

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190827