CN113408183A - 基于预测模型的车辆基地短期复合预测方法 - Google Patents

基于预测模型的车辆基地短期复合预测方法 Download PDF

Info

Publication number
CN113408183A
CN113408183A CN202110365094.2A CN202110365094A CN113408183A CN 113408183 A CN113408183 A CN 113408183A CN 202110365094 A CN202110365094 A CN 202110365094A CN 113408183 A CN113408183 A CN 113408183A
Authority
CN
China
Prior art keywords
model
prediction
sarima
data
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110365094.2A
Other languages
English (en)
Inventor
郭苏
伍书彦
何意
宋国涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202110365094.2A priority Critical patent/CN113408183A/zh
Publication of CN113408183A publication Critical patent/CN113408183A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Molecular Biology (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Geometry (AREA)

Abstract

本发明的基于预测模型的车辆基地短期复合预测方法,包括如下步骤:步骤1,构建预测模型,步骤2,利用预测模型对车辆基地的热负荷和电负荷进行预测;步骤3,进行仿真实验,验证该预测模型的准确性。本发明基于季节性自回归滑动平均(SARIMA)模型对车辆基地负荷进行预测。

Description

基于预测模型的车辆基地短期复合预测方法
技术领域
本发明属于车辆基地短期负荷预测领域,尤其涉及基于预测模型的车辆基地短期复合预测方法。
背景技术
一定区域内,在不同的时刻,由于各方面因素的影响,其冷热电负荷一般不相同。但与此同时,由于区域系统的强大惯性,它们又不是彼此无关的,现在时刻的负荷总是与过去的负荷有关。用户对负荷的要求,在一个短时问内,常常表现为在过去负荷基础上的一种随机起伏。可以说,下一个预测时刻的负荷基本上决定于过去负荷的情况,同时,它的随机性变化也应当加以考虑。基于这样的分析,采用时间序列分析的方法来预测负荷,会是一种有效方法。考虑到区域负荷具有一定的日周期性,因此本发明基于季节性自回归滑动平均(SARIMA)模型对车辆基地负荷进行预测。
发明内容
本发明所要解决的技术问题是针对背景技术的不足提供了基于预测模型的车辆基地短期复合预测方法,对车辆基地负荷进行预测。
本发明为解决上述技术问题采用以下技术方案:
基于预测模型的车辆基地短期复合预测方法,包括如下步骤:步骤1,构建预测模型,步骤2,利用预测模型对车辆基地的热负荷和电负荷进行预测;步骤 3,进行仿真实验,验证该预测模型的准确性。
进一步的,所述预测模型为季节性自回归滑动平均模型SARIMA,其构建及预测方法步骤包括:
步骤1,进行ADF检验和自相关检验结果判断该序列是否是平稳序列;
步骤2,若序列不平稳则进行去趋势及差分处理使之成为平稳序列,反之序列平稳则不进行差分处理;
步骤3,模型的定阶,通过自相关与偏自相关图进行对模型参数初步估计,并根据模型评价指标对模型进行精确定阶;对定阶后模型进行显著性检验,验证残差是否为白噪声序列,若是则利用步骤4--步骤6中构建的模型进行预测,若不是则对模型重新进行精确定阶后生成的新的定阶后模型,直至显著性检验通过;
步骤4,构建自回归移动平均模型ARMA,自回归移动平均模型为自回归模型AR和移动平均模型MA的混合模型;自回归移动平均模型表示为ARMA(p,q),表达式:
xt=φ1xt-12xt-2+...+φpxt-p+ut1ut-12ut-2+...+φqut-q
其中,p是自回归阶数;q是移动平均阶数;xt,xt-1,xt-2,...,xt-p为不同时间点的值;φ1,φ2,...,φp为自回归系数;φ1,φ2,...,φq表示移动回归系数;ut表示白噪声,是时间序列中数值的随机波动;
步骤5,ARMA模型只能对平稳时间序列,无法产生乐观的平稳数据,其数据均值和方差会随着时间不断波动;因此,必须对得到的非平稳数据进行差分处理,即用时间序列数据减去自身的滞后值来产生差分时间序列,一阶算子定义为:
xt-xt-1=(1-B)xt
其中,B为滞后算子,Byt=yt-1;而对于季节性数据,使用季节差分算子:
xt-xt-S=(1-BS)xt
其中,S代表季节性数据的周期;
步骤6,SARIMA模型又称SARIMA(p,d,q)(P,D,Q)s模型,分别采用d阶趋势性差分与D阶周期为S季节性差分来消除时间序列中的趋势性和周期性,以得到平稳的时间序列zt,zt表示为:zt=(1-B)d(1-BS)Dxt
平稳序列zt则可以继续进行ARMA平稳序列建模,表达式为:
Figure BDA0003005529300000031
其中,
Figure BDA0003005529300000032
和θq(B)=(1-θ1B-θ2B2-…-θqBq)分别代表非季节性自回归多项式和非季节性滑动平均多项式,p和q分别为两个多项式的阶数,d为趋势性差分的阶数;ΦP(Bs)=(1-Φ1BS2B2s-…-ΦPBPS)和ΘQ(BS)=(1-Θ1BS2B2S-…-ΘQBQS)分别是季节性自回归多项式和季节性滑动平均多项式,P和Q也分别为这两个多项式的阶数,D代表季节性差分的阶数,S 则是时间序列周期。
进一步的,所述预测模型为LSTM神经网络模型,其构建及预测方法步骤包括:
步骤1,LSTM神经网络模型由四个主要元素构成:输入门、遗忘门、输出门和单元状态;设输入序列为(x1,x2,...,xt),隐藏层状态为(h1,h2,...,ht),则在t时刻有:
ft=σ(Whf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
Ct=ft·Ct-1+it·tanh(WC·[ht-1,xt]+bC)
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot·tanh(Ct)
式中:ft,it,ot分别为遗忘门、输入门和输出门,Ct表示单元状态,σ、tanh 分别为sigmoid、tanh激活函数,W和b分别表示权重和偏差矩阵;
步骤2,LSTM神经网络模型的预测过程如下:
步骤1a,确定模型的输入与输出数据,并对输入输出数据进行归一化处理;
步骤1b,将数据集分为训练集与测试集根据输入输出数据维度确定模型的输入输出层节点,并初始化模型的隐含层节点、dropout系数、误差要求精度,输入门、遗忘门、输出门参数,并利用均匀化分布对网络各个权重进行初始化;
步骤1c,LSTM模型进行拟合,通过各个门进行前向传播,并以均方根误差RMSE为目标函数,BPTT作为内核进行误差反向传播,对各个门的权重进行更新,不断迭代直至达到最大迭代次数或者误差达到要求时终止模型的训练;
步骤1d,计算误差指标,将测试拟合值进行反归一化处理与真实值进行比较,计算平均绝对误差(MAE)与平均绝对百分比误差(MAPE)。
进一步的,所述预测模型为混合模型,包括SARIMA-SADE-SVR模型和 SARIMA-LSTM模型。
进一步的,SARIMA-SADE-SVR模型的构建及预测方法步骤包括:
步骤1,分别建立SARIMA与SADE-SVR预测模型,基于车辆基地负荷数据xi进行拟合,分别得到拟合值xi (1)和xi (2)
步骤2,构造优化目标函数fitness,利用SADE算法求解ω1与ω2
Figure BDA0003005529300000041
其中,n为进行拟合的数据数目,约束条件为ω12=1。
步骤3,利用SARIMA与SADE-SVR两个模型进行预测分别得到ym (1)和ym (2),利用得到的ω1与ω2对预测结果进行加权求和得到最终预测结果。
进一步的,SARIMA-LSTM模型的构建及预测方法步骤包括:
步骤1,对车辆基地原始负荷数据用SARIMA模型进行建模,得到线性成分Lt与残差et
步骤2,利用LSTM模型拟合第一步得到的非线性残差et,并进行预测得到非线性成分预测值Nt
步骤3,将两个预测结果进行叠加。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明针对SADE-SVR模型仅考虑影响因素与车辆基地负荷数据的联系,没有考虑到时间序列本身延续性的问题,采用SARIMA模型与LSTM模型对车辆基地冷热电负荷进行预测。这里首先采用经典SARIMA模型和经典LSTM模型对负荷进行预测,算例证明,SARIMA模型和LSTM模型在超前1h负荷预测中精度高于SADE-SVR模型,而在超前24h负荷预测中精度低于SADE-SVR模型。针对负荷数据本身具有线性成分与非线性成分的特点,考虑线性模型与非线性模型组合进行预测:(1)使用并联方式建立SARIMA-SADE-SVR混合模型;(2)使用串联方式建立SARIMA-LSTM混合模型。预测结果表明:在超前1h负荷预测中, SARIMA-LSTM模型预测精度最高;而在超前24h负荷预测中,SADE-SVR模型比 SARIMA-SADE-SVR混合模型具有更高的预测精度。
附图说明
图1为SARIMA的负荷预测流程图;
图2为原始数据自相关与偏自相关图;
图3为原始数据差分后自相关与偏自相关图;
图4为模型残差检验图;
图5a为SARIMA不同尺度冷负荷预测结果图;
图5b为SARIMA不同尺度冷负荷预测误差图;
图5c为SARIMA不同尺度热负荷预测结果图;
图5d为SARIMA不同尺度热负荷预测误差图;
图5e为SARIMA不同尺度电负荷预测结果图;
图5f SARIMA不同尺度电负荷预测误差图;
图6为RNN预测方法的网络结构示意图;
图7为LSTMs结构图;
图8为LSTM负荷预测流程图;
图9中a为LSTM不同尺度冷负荷预测结果图;
图9中b为LSTM不同尺度冷负荷预测误差图;
图9中c为LSTM不同尺度热负荷预测结果图;
图9中d为LSTM不同尺度热负荷预测误差图;
图9中e为LSTM不同尺度电负荷预测结果图;
图9中f为LSTM不同尺度电负荷预测误差图;
图10为SARIMA-SADE-SVR混合模型结构图;
图11为传统混合模型的建模流程图;
图12中a为冷负荷预测结果综合对比图;
图12中b为冷负荷预测误差综合对比图;
图12中c为热负荷预测结果综合对比图;
图12中d为热负荷预测误差综合对比图;
图12中e为电负荷预测结果综合对比图;
图12中f为电负荷预测误差综合对比图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本发明的描述中,需要理解的是,术语“左侧”、“右侧”、“上部”、“下部”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,“第一”、“第二”等并不表示零部件的重要程度,因此不能理解为对本发明的限制。本实施例中采用的具体尺寸只是为了举例说明技术方案,并不限制本发明的保护范围。
基于预测模型的车辆基地短期复合预测方法,包括如下步骤:步骤1,构建预测模型,步骤2,利用预测模型对车辆基地的热负荷和电负荷进行预测;步骤 3,进行仿真实验,验证该预测模型的准确性。
本实施例供提供三种预测模型,分别为,季节性自回归滑动平均模型SARIMA、LSTM神经网络模型、混合模型(分为SARIMA-SADE-SVR模型和SARIMA-LSTM模型)。
季节性自回归滑动平均模型SARIMA如下,介绍SARIMA前首先需要介绍自回归移动平均模型(ARMA)模型,该模型为自回归模型(AR)和移动平均模型 (MA)的混合模型。AR(p)模型旨在根据给定过程的先前行为对当前观测进行建模,利用其自相关性建立起包含前期与当前行为的回归方程来达到预测目的。而MA(q)模型是时间序列的当前值与先前的过程误差值的线性回归,表现为当前值无关于过去时间点记录值,而有关于过去时间的波动项,是一段白噪声序列的加权和。
所述预测模型为季节性自回归滑动平均模型SARIMA,如图1-5所示,其构建及预测方法步骤包括:
步骤1,进行ADF(ADF检验:单位根检验Augmented Dickey-Fuller test) 检验和自相关检验结果判断该序列是否是平稳序列;
步骤2,若序列不平稳则进行去趋势及差分处理使之成为平稳序列,反之序列平稳则不进行差分处理;
步骤3,模型的定阶,通过自相关与偏自相关图进行对模型参数初步估计,并根据模型评价指标对模型进行精确定阶;对定阶后模型进行显著性检验,验证残差是否为白噪声序列,若是则利用步骤4--步骤6中构建的模型进行预测,若不是则对模型重新进行精确定阶后生成的新的定阶后模型,直至显著性检验通过;
步骤4,构建自回归移动平均模型ARMA,自回归移动平均模型为自回归模型AR和移动平均模型MA的混合模型;自回归移动平均模型表示为ARMA(p,q),表达式:
xt=φ1xt-12xt-2+...+φpxt-p+ut1ut-12ut-2+...+φqut-q
其中,p是自回归阶数;q是移动平均阶数;xt,xt-1,xt-2,...,xt-p为不同时间点的值;φ1,φ2,...,φp为自回归系数;φ1,φ2,...,φq表示移动回归系数;ut表示白噪声,是时间序列中数值的随机波动;
步骤5,ARMA模型只能对平稳时间序列,无法产生乐观的平稳数据,其数据均值和方差会随着时间不断波动;因此,必须对得到的非平稳数据进行差分处理,即用时间序列数据减去自身的滞后值来产生差分时间序列,一阶算子定义为:
xt-xt-1=(1-B)xt
其中,B为滞后算子,Byt=yt-1;而对于季节性数据,使用季节差分算子:
xt-xt-S=(1-BS)xt
其中,S代表季节性数据的周期;
步骤6,SARIMA模型又称SARIMA(p,d,q)(P,D,Q)S模型,分别采用d阶趋势性差分与D阶周期为S季节性差分来消除时间序列中的趋势性和周期性,以得到平稳的时间序列zt,zt表示为:zt=(1-B)d(1-BS)Dxt
平稳序列zt则可以继续进行ARMA平稳序列建模,表达式为:
Figure BDA0003005529300000091
其中,
Figure BDA0003005529300000092
和θq(B)=(1-θ1B-θ2B2-…-θqBq)分别代表非季节性自回归多项式和非季节性滑动平均多项式,p和q分别为两个多项式的阶数,d为趋势性差分的阶数;ΦP(BS)=(1-Φ1BS2B2S-…-ΦPBPS)和ΘQ(BS)=(1-Θ1BS2B2S-…-ΘQBQS)分别是季节性自回归多项式和季节性滑动平均多项式,P和Q也分别为这两个多项式的阶数,D代表季节性差分的阶数,S 则是时间序列周期。
以车辆基地7月1日至7月31日的冷负荷为例,建立序列周期为24的时间序列,先判断其平稳性。在MATLAB2018b环境下,使用autocorr和parcorr 函数分别对冷负荷进行自相关与偏相关检验。检验结果如图2所示。
可以看出绝大多数自相关系数和偏自相关系数在置信区间之外,基地冷负荷原始数据为非平稳时间序列。ARMA建模最基本的要求就是序列平稳,因此需要对基地负荷进行差分处理。考虑到基地负荷具有一定的日周期性,以24h为一个周期,对原始数据进行季节性差分。经过一次季节性差分,一次非季节性差分后,原始数据已经开始平稳,差分后数据的自相关与偏自相关图如下图3 所示。
对差分后数据自相关图和偏自相关图的分析,自相关系数和偏相关系数分别在和后基本都处在置信区间内,而在κ=24、κ=48和κ=96时自相关和偏自相关系数仍显著不为0,因此初步考虑p、q、P、Q的取值在1到5的范围之内。通过AIC、SC准则确定,选择AIC和SC数值最小的模型,最终确定车辆基地冷负荷的预测模型为SARIMA(1,1,1)(1,1,3)24
接着对选定模型的残差进行检验,如图3所示,我们可以看出,残差序列没有相关性,是白噪声序列,可以充分提取车辆基地冷负荷数据中的有用信息,剩余的为随机扰动序列。因此,可以确定该模型可行。
如图4所示,根据冷负荷模型建立方式,依次确定车辆基地1月份热负荷和电负荷预测模型分别为SARIMA(1,0,1)(1,1,1)24和SARIMA(2,0,0)(1,1,1)24
仿真实验
本实验需要进行预测的冷热电负荷数据与上一章相同,分别采用 SARIMA(1,1,1)(1,1,3)24、SARIMA(1,0,1)(1,1,1)24和SARIMA(2,0,0)(1,1,1)24模型对基地1月 31日、7月31日、1月31日的24h冷热电负荷进行预测。并且测试在超前1h 预测和超前24h两种尺度下SARIMA的预测精度。对于SARIMA模型,超前24h 负荷预测即在单步预测的基础上进行滚动预测,即模型每一步的预测结果会加入到下一步的预测模型之中。车辆基地SARIMA冷热电预测模型超前1h负荷预测和超前24h负荷预测结果对比如图5和表1所示。
表1 SARIMA模型预测结果对比表
Figure BDA0003005529300000101
由上图5和表1我们可以看出,SARIMA具有一定的预测能力,但在数据陡升陡降的时候,SARIMA不具备很好的预测特性,且超前24h预测的预测精度会随着步长的增大而相对减小,其主要原因是超前24h预测采用的是递归方法,随着步长在上一步预测的基础上进行预测,因此,其预测误差会产生累积效应。
与SADE-SVR模型相比较,SARIMA模型在超期1h负荷预测中预测精度优于SADE-SVM模型,但在超前24负荷预测中,其精度则低于SADE-SVM模型。由于本实施例所使用的SVR算法输入数据为影响辆基地负荷的气象因素及时间因素,即该算法主要挖掘负荷与影响因素之间的关系,所以其超前24h的负荷预测结果与超前1h的相同。
SVR模型虽然可以处理非线性问题,但是其模型主要挖掘数据之间的联系,没有考虑到负荷数据本身的延续性,SARIMA模型虽然考虑到了负荷的时序性,但其模型不具备很强的非线性处理能力。长短期记忆神经网络(LSTM)是一种有效的非线性循环神经网络,可以兼顾数据的时序性和非线性关系,因此本节使用LSTM来对轨道车辆基地冷热负荷进行预测。
基本的神经网络权值只能够向上传递,它对不同时间步之间的关联表达不够充分,因此就有了循环神经网络(recurrent neural network,RNN)。循环神经网络是于1982年由Saratha Sathasivam提出的霍普菲尔德网络。RNN的主要用途是处理和预测序列数据。全连接的前馈神经网络和卷积神经网络模型中,网络结构都是从输入层到隐藏层再到输出层,层与层之间是全连接或部分连接的,但每层之间的节点是无连接的。图6是RNN预测方法的网络结构示意图。如图1所示,xt是t时刻RNN的输入,ht是t时刻的RNN隐藏状态,yt是t时刻的RNN输出,U,V,W是RNN的权重参数矩阵。
对于任何时刻t,该时刻的隐藏状态ht是根据当前时刻的输入xt和前一时刻的隐藏状态ht-1计算得到的。
计算公式如下:
ht=f(Uxt+Wht-1+b)
其中f是RNN的激活函数,b是线性关系的偏移量。
知道了当前时刻的隐藏状态ht,当前时刻RNN的输出预测值yt的计算公式为:
yt=(Vht+C)
RNN神经网络在循环往复地做着同样的工作,这种工作方式极大地减少了网络中学习参数的数量,缩短了网络训练时间,也保证了精度。但随着时间间隔的增加,简单循环神经网络有可能丧失学习到距离过去较远的信息的能力,也就是梯度消失的问题。
在90年代中期,德国研究人员SeppHochreiter和JuergenSchmidhuber提出了一种拥有长短时记忆单元(LSTMs)的递归网络,即长短时记忆神经网络,作为消失梯度问题的解决方案。LSTM除了外部递归外,它的LSTMs还具有内部递归和自循环用来积累信息。LSTMs可以帮助保存能进行反向传播的误差。通过保持更恒定的误差,它们允许循环网络继续更多步的学习(超过1000步),从而远程链接更多的信息。LSTMs包含门控细胞中正常循环网络流之外的信息。这些信息像计算机内存中的数据一样可以通过单元进行存储、写入或读取。单元格通过打开和关闭的门(遗忘门、输入门、输出门)来决定存储什么、何时允许读取、写入和删除。与计算机上的数字存储不同,这些门是模拟信号门,由一个点乘运算和一个sigmoid激活函数的神经网络层组成,输出在0-1的范围内。模拟信号比数字信号具有可微的优点,更适合于反向传播。这些门作用于它们接收到的信号,类似于神经网络的节点,使用自己的权重集来过滤信息。这些权重,就像调节输入和隐藏状态的权重一样,是通过循环网络学习过程来调整的。也就是说,单元格通过推测、反向传播误差和梯度下降调整权重的迭代过程,学习何时允许数据进入、离开或删除。LSTM网络的记忆单元结构如图7所示。σ是三个门的激活函数,一般情况下用的是Sigmoid函数,因此数据在输入三种门的激活函数后,输出值值域为[0,1]。
Sigmoid函数是神经网络中最为常见的激活函数之一。Sigmoid函数的值域为[0,1],因此它能够将变量映射到0和1之间。特别大的正数输入Sigmoid 函数得到的输出会趋于1,在神经网络中表示神经元被激活,特别大的负数输入 Sigmoid函数得到的输出会趋于0,在神经网络中表示神经元未被激活。也就是说,不管神经元输入是多少,经过Sigmoid激活函数作用,神经元的输出范围都是[0,1]。这样当数据在网络中传递时就不会出现中间值过大而导致计算机无法处理的情况。
LSTM神经网络模型,其构建及预测方法步骤包括:
步骤1,LSTM神经网络模型由四个主要元素构成:输入门、遗忘门、输出门和单元状态;设输入序列为(x1,x2,...,xt),隐藏层状态为(h1,h2,...,ht),则在t时刻有:
ft=σ(Whf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
Ct=ft·Ct-1+it·tanh(WC·[ht-1,xt]+bC)
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot·tanh(Ct)
式中:ft,it,ot分别为遗忘门、输入门和输出门,Ct表示单元状态,σ、tanh 分别为sigmoid、tanh激活函数,W和b分别表示权重和偏差矩阵;
步骤2,LSTM神经网络模型的预测过程如下:
步骤1a,确定模型的输入与输出数据,并对输入输出数据进行归一化处理;
步骤1b,将数据集分为训练集与测试集根据输入输出数据维度确定模型的输入输出层节点,并初始化模型的隐含层节点、dropout系数、误差要求精度,输入门、遗忘门、输出门参数,并利用均匀化分布对网络各个权重进行初始化;
步骤1c,LSTM模型进行拟合,通过各个门进行前向传播,并以均方根误差RMSE为目标函数,BPTT作为内核进行误差反向传播,对各个门的权重进行更新,不断迭代直至达到最大迭代次数或者误差达到要求时终止模型的训练;
步骤1d,计算误差指标,将测试拟合值进行反归一化处理与真实值进行比较,计算平均绝对误差(MAE)与平均绝对百分比误差(MAPE)。
图8为LSTM负荷预测的主要建模流程,其中iterator指代的模型在训练时在一轮中循环迭代次数,epoch表示为训练模型设定的循环总轮数。
仿真实验
本实验使用数据与第四章相同,分别对车辆基地7月、1月、1月冷热电负荷进行预测。分别以基地冷热电负荷历史数据及其相关影响因素为输入进行预测,使用各月最后一天的负荷数据进行检验。LSTM模型迭代次数设置为120, LSTM的隐藏层节点个数设置为4,预测结果如下图9所示。
表2 LSTM模型预测结果对比表
Figure BDA0003005529300000141
由图9和表2我们可以看出,LSTM模型也具有良好的预测能力,相比于 SARIMA模型,该模型预测数据与原始数据更加贴近。但该模型也存在误差比 SARIMA模型更高的地方,例如冷负荷预测中,5时至8时原始负荷数据非常平缓,但LSTM模型的却没有表现出良好的预测能力,预测数据偏离较大。并且LSTM 模型也存在超前24h负荷预测中预测误差增大的现象,这也与LSTM长时间尺度预测中使用滚动预测使误差累积有关。
与SADE-SVR模型相比,LSTM模型也在超期1h负荷预测中有着更好的预测精度,且优于SARIMA模型。但在超前24h负荷预测中,LSTM虽然预测精度高于SARIMA模型,但仍低于SADE-SVR模型。
混合模型,包括SARIMA-SADE-SVR模型和SARIMA-LSTM模型。
有大量的实验和研究表明,单一模型在处理成分单一的时间序列问题上的确有着很好的预测效果。但现实生活中,负荷数据往往成分并不单一,其中既包括线性成分又包括非线性成分,此时仅使用单一模型来预测往往不够。因此,考虑将线性模型SARIMA分别与处理非线性能力强的SADE-SVR模型和LSTM模型混合后进行预测。
混合模型一般分为串联型和并联型两种类型。其中,串联型又分为两种情况,一种是将一种将一个模型的输出作为另一种模型的输入;另一种情况是使用一个模型拟合得到的残差作为另一个模型的输入,将第一个模型的预测结果与第二个模型的残差预测结果相结合,得到最终预测结果。并联型组合预测则是给两个模型分配权值,将两个模型的预测结果进行权值相加得到最后的预测结果。
考虑到本章使用线性模型与非线性模型的组合,仅能处理线性成分的线性模型的输出结果用非线性模型再处理没有意义,而非线性模型的输出结果含有非线性成分线性模型难以处理。因此,第一种串联型混合模型并不适用与本文实验。
另外,对于SARIMA-SADE-SVR混合模型,考虑到本文使用的SADE-SVR模型输入为车辆基地负荷影响因素,利用影响因素与负荷之间的联系来做预测,串联型第二种混合模型不能保证SARIMA模型的残差还与影响因素之间保持着相关性,因此使用并联型混合方式来对其进行预测。
而对于SARIMA-LSTM模型,考虑到实验还需研究超前24h负荷预测,对于这两种时间序列类预测模型,训练模型一般使用的是单步预测方法,难以使用超前24h对长时间序列进行训练,因此考虑使用串联型第二种混合方式来进行预测。
参考图10,SARIMA-SADE-SVR模型的构建及预测方法步骤包括:
步骤1,分别建立SARIMA与SADE-SVR预测模型,基于车辆基地负荷数据xi进行拟合,分别得到拟合值xi (1)和xi (2)
步骤2,构造优化目标函数fithess,利用SADE算法求解ω1与ω2
Figure BDA0003005529300000161
其中,n为进行拟合的数据数目,约束条件为ω12=1。
步骤3,利用SARIMA与SADE-SVR两个模型进行预测分别得到ym (1)和ym (2),利用得到的ω1与ω2对预测结果进行加权求和得到最终预测结果。
参考图11,SARIMA-LSTM模型的构建及预测方法步骤包括:
步骤1,对车辆基地原始负荷数据用SARIMA模型进行建模,得到线性成分Lt与残差et
步骤2,利用LSTM模型拟合第一步得到的非线性残差et,并进行预测得到非线性成分预测值Nt
步骤3,将两个预测结果进行叠加。
仿真实验与对比分析
分别利用SARIMA-SADE-SVR、SARIMA-LSTM模型对车辆基地7月、1 月、1月的冷热电负荷数据进行训练和预测,预测结果见下图12、表3。并与前面得到的SADE-SVR、SARIMA、LSTM预测结果进行综合对比,对比结果同样见图12和表3。
表3综合指标对比结果
Figure BDA0003005529300000171
Figure BDA0003005529300000181
由以上图表我们可以看出,在超前1h负荷预测中,混合模型都在原有模型的基础上提升了预测精度,其中SARIMA-LSTM模型在冷热电超前1h负荷预测中都拥有最高的预测精度。而对于超前24h负荷预测,仍然是SADE-SVR模型的预测精度最高,混合模型仅对时间序列类预测模型提高了预测精度,弥补了一部分滚动预测产生的累积误差。因此,实际中可以使用SARIMA-LSTM进行超前1h负荷,使用SADE-SVR模型对超前24h负荷进行预测。
有益效果:
本发明针对SADE-SVR模型仅考虑影响因素与车辆基地负荷数据的联系,没有考虑到时间序列本身延续性的问题,采用SARIMA模型与LSTM模型对车辆基地冷热电负荷进行预测。这里首先采用经典SARIMA模型和经典LSTM模型对负荷进行预测,算例证明,SARIMA模型和LSTM模型在超前1h负荷预测中精度高于SADE-SVR模型,而在超前24h负荷预测中精度低于SADE-SVR模型。针对负荷数据本身具有线性成分与非线性成分的特点,考虑线性模型与非线性模型组合进行预测:(1)使用并联方式建立SARIMA-SADE-SVR混合模型;(2)使用串联方式建立SARIMA-LSTM混合模型。预测结果表明:在超前1h负荷预测中,SARIMA-LSTM模型预测精度最高;而在超前24h负荷预测中,SADE-SVR模型比 SARIMA-SADE-SVR混合模型具有更高的预测精度。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语 (包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。上面对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以再不脱离本发明宗旨的前提下做出各种变化。

Claims (6)

1.基于预测模型的车辆基地短期复合预测方法,其特征在于:包括如下步骤:步骤1,构建预测模型,步骤2,利用预测模型对车辆基地的热负荷和电负荷进行预测;步骤3,进行仿真实验,验证该预测模型的准确性。
2.根据权利要求1所述的基于预测模型的车辆基地短期复合预测方法,其特征在于:所述预测模型为季节性自回归滑动平均模型SARIMA,其构建及预测方法步骤包括:
步骤1,进行ADF检验和自相关检验结果判断该序列是否是平稳序列;
步骤2,若序列不平稳则进行去趋势及差分处理使之成为平稳序列,反之序列平稳则不进行差分处理;
步骤3,模型的定阶,通过自相关与偏自相关图进行对模型参数初步估计,并根据模型评价指标对模型进行精确定阶;对定阶后模型进行显著性检验,验证残差是否为白噪声序列,若是则利用步骤4--步骤6中构建的模型进行预测,若不是则对模型重新进行精确定阶后生成的新的定阶后模型,直至显著性检验通过;
步骤4,构建自回归移动平均模型ARMA,自回归移动平均模型为自回归模型AR和移动平均模型MA的混合模型;自回归移动平均模型表示为ARMA(p,q),表达式:
xt=φ1xt-12xt-2+…+φpxt-p+ut1ut-12ut-2+…+φqut-q
其中,p是自回归阶数;q是移动平均阶数;xt,xt-1,xt-2,...,xt-p为不同时间点的值;φ1,φ2,...,φp为自回归系数;φ1,φ2,...,φq表示移动回归系数;ut表示白噪声,是时间序列中数值的随机波动;
步骤5,ARMA模型只能对平稳时间序列,无法产生乐观的平稳数据,其数据均值和方差会随着时间不断波动;因此,必须对得到的非平稳数据进行差分处理,即用时间序列数据减去自身的滞后值来产生差分时间序列,一阶算子定义为:
xt-xt-1=(1-B)xt
其中,B为滞后算子,Byt=yt-1;而对于季节性数据,使用季节差分算子:
xt-xt-S=(1-BS)xt
其中,S代表季节性数据的周期;
步骤6,SARIMA模型又称SARIMA(p,d,q)(P,D,Q)S模型,分别采用d阶趋势性差分与D阶周期为S季节性差分来消除时间序列中的趋势性和周期性,以得到平稳的时间序列zt,zt表示为:zt=(1-B)d(1-BS)Dxt
平稳序列zt则可以继续进行ARMA平稳序列建模,表达式为:
Figure FDA0003005529290000021
其中,
Figure FDA0003005529290000022
Figure FDA0003005529290000023
分别代表非季节性自回归多项式和非季节性滑动平均多项式,p和q分别为两个多项式的阶数,d为趋势性差分的阶数;ΦP(BS)=(1-Φ1BS2B2S-…-ΦPBPS)和ΘQ(BS)=(1-Θ1BS2B2S-…-ΘQBQS)分别是季节性自回归多项式和季节性滑动平均多项式,P和Q也分别为这两个多项式的阶数,D代表季节性差分的阶数,S则是时间序列周期。
3.根据权利要求1所述的基于预测模型的车辆基地短期复合预测方法,其特征在于:所述预测模型为LSTM神经网络模型,其构建及预测方法步骤包括:
步骤1,LSTM神经网络模型由四个主要元素构成:输入门、遗忘门、输出门和单元状态;设输入序列为(x1,x2,...,xt),隐藏层状态为(h1,h2,...,ht),则在t时刻有:
ft=σ(Whf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
Ct=ft·Ct-1+it·tanh(WC·[ht-1,xt]+bC)
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot·tanh(Ct)
式中:ft,it,ot分别为遗忘门、输入门和输出门,Ct表示单元状态,σ、tanh分别为sigmoid、tanh激活函数,W和b分别表示权重和偏差矩阵;
步骤2,LSTM神经网络模型的预测过程如下:
步骤1a,确定模型的输入与输出数据,并对输入输出数据进行归一化处理;
步骤1b,将数据集分为训练集与测试集根据输入输出数据维度确定模型的输入输出层节点,并初始化模型的隐含层节点、dropout系数、误差要求精度,输入门、遗忘门、输出门参数,并利用均匀化分布对网络各个权重进行初始化;
步骤1c,LSTM模型进行拟合,通过各个门进行前向传播,并以均方根误差RMSE为目标函数,BPTT作为内核进行误差反向传播,对各个门的权重进行更新,不断迭代直至达到最大迭代次数或者误差达到要求时终止模型的训练;
步骤1d,计算误差指标,将测试拟合值进行反归一化处理与真实值进行比较,计算平均绝对误差(MAE)与平均绝对百分比误差(MAPE)。
4.根据权利要求1所述的基于预测模型的车辆基地短期复合预测方法,其特征在于:所述预测模型为混合模型,包括SARIMA-SADE-SVR模型和SARIMA-LSTM模型。
5.根据权利要求4所述的基于预测模型的车辆基地短期复合预测方法,其特征在于:SARIMA-SADE-SVR模型的构建及预测方法步骤包括:
步骤1,分别建立SARIMA与SADE-SVR预测模型,基于车辆基地负荷数据xi进行拟合,分别得到拟合值xi (1)和xi (2)
步骤2,构造优化目标函数fitness,利用SADE算法求解ω1与ω2
Figure FDA0003005529290000041
其中,n为进行拟合的数据数目,约束条件为ω12=1;
步骤3,利用SARIMA与SADE-SVR两个模型进行预测分别得到ym (1)和ym (2),利用得到的ω1与ω2对预测结果进行加权求和得到最终预测结果。
6.根据权利要求4所述的基于预测模型的车辆基地短期复合预测方法,其特征在于:SARIMA-LSTM模型的构建及预测方法步骤包括:
步骤1,对车辆基地原始负荷数据用SARIMA模型进行建模,得到线性成分Lt与残差et
步骤2,利用LSTM模型拟合第一步得到的非线性残差et,并进行预测得到非线性成分预测值Nt
步骤3,将两个预测结果进行叠加。
CN202110365094.2A 2021-04-02 2021-04-02 基于预测模型的车辆基地短期复合预测方法 Withdrawn CN113408183A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110365094.2A CN113408183A (zh) 2021-04-02 2021-04-02 基于预测模型的车辆基地短期复合预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110365094.2A CN113408183A (zh) 2021-04-02 2021-04-02 基于预测模型的车辆基地短期复合预测方法

Publications (1)

Publication Number Publication Date
CN113408183A true CN113408183A (zh) 2021-09-17

Family

ID=77677981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110365094.2A Withdrawn CN113408183A (zh) 2021-04-02 2021-04-02 基于预测模型的车辆基地短期复合预测方法

Country Status (1)

Country Link
CN (1) CN113408183A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117725764A (zh) * 2024-02-07 2024-03-19 中汽研汽车检验中心(天津)有限公司 基于回归模型的车辆底盘多目标优化方法、设备和介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117725764A (zh) * 2024-02-07 2024-03-19 中汽研汽车检验中心(天津)有限公司 基于回归模型的车辆底盘多目标优化方法、设备和介质
CN117725764B (zh) * 2024-02-07 2024-05-03 中汽研汽车检验中心(天津)有限公司 基于回归模型的车辆底盘多目标优化方法、设备和介质

Similar Documents

Publication Publication Date Title
CN108256697B (zh) 一种用于电力系统短期负荷的预测方法
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
Gao et al. A neural network-based joint prognostic model for data fusion and remaining useful life prediction
CN111260136A (zh) 一种基于arima-lstm组合模型的楼宇短期负荷预测方法
CN111027772A (zh) 基于pca-dbilstm的多因素短期负荷预测方法
CN110059867B (zh) 一种swlstm结合gpr的风速预测方法
CN111310965A (zh) 一种基于lstm网络的飞行器航迹预测方法
CN111680786B (zh) 一种基于改进权重门控单元的时序预测方法
CN111461463A (zh) 一种基于tcn-bp的短期负荷预测方法、系统及设备
WO2019160138A1 (ja) 因果推定装置、因果推定方法、及びプログラム
CN110874616A (zh) 基于lstm网络与马尔科夫链修正误差的变压器运行预测方法
Lv et al. An improved long short-term memory neural network for stock forecast
CN110738363B (zh) 一种光伏发电功率预测方法
Pranolo et al. Optimized Three Deep Learning Models Based-PSO Hyperparameters for Beijing PM2. 5 Prediction
CN113408183A (zh) 基于预测模型的车辆基地短期复合预测方法
CN113591957A (zh) 基于lstm和马尔科夫链的风电出力短期滚动预测与校正方法
Prasad et al. An improved prediction of solar cycle 25 using deep learning based neural network
Huang et al. A decomposition‐based multi‐time dimension long short‐term memory model for short‐term electric load forecasting
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN116960962A (zh) 一种跨区域数据融合的中长期区域负荷预测方法
Shah et al. A neoteric technique using ARIMA-LSTM for time series analysis on stock market forecasting
CN115481816A (zh) 基于互补集成经验模分解的时空卷积短时交通流预测方法
CN115293406A (zh) 基于CatBoost和Radam-LSTM的光伏发电功率预测方法
Kim et al. Data-driven prognostics
Marino et al. Measuring longevity risk through a neural network Lee-Carter model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210917

WW01 Invention patent application withdrawn after publication