CN114595861A - 基于mstl和lstm模型的中长期电力负荷预测方法 - Google Patents

基于mstl和lstm模型的中长期电力负荷预测方法 Download PDF

Info

Publication number
CN114595861A
CN114595861A CN202111581634.7A CN202111581634A CN114595861A CN 114595861 A CN114595861 A CN 114595861A CN 202111581634 A CN202111581634 A CN 202111581634A CN 114595861 A CN114595861 A CN 114595861A
Authority
CN
China
Prior art keywords
data
annual
component
load
monthly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111581634.7A
Other languages
English (en)
Inventor
余蕾
岳超
马钊
田鑫
张坤
何永秀
恩格贝
王可蕙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
State Grid Ningxia Electric Power Co Ltd
Original Assignee
North China Electric Power University
State Grid Ningxia Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University, State Grid Ningxia Electric Power Co Ltd filed Critical North China Electric Power University
Priority to CN202111581634.7A priority Critical patent/CN114595861A/zh
Publication of CN114595861A publication Critical patent/CN114595861A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Abstract

本发明涉及一种基于神经网络进行电力负荷预测的方法,包括:搜集待处理年尺度数据与月尺度数据并进行相关性检验,确立年尺度数据,月尺度数据中的关键影响因素;分别关键影响因素及对应的年度电力最大负荷数据和对应的月度电力最大负荷数据,进行季节分解,得到相应的年数据趋势分量、年数据残差分量和年数据周期分量和相应的月数据趋势分量、月数据残差分量和月数据周期分量;然后分别进行协整检验和降维处理,得到LSTM模型的相应分量;将各分量输入LSTM模型中,得到个分量的预测分量;根据预测分量,采用LSTM循环神经网络的自学习能力将其进行拟合,得出电力负荷预测值。

Description

基于MSTL和LSTM模型的中长期电力负荷预测方法
技术领域
本发明涉及计算机技术领域,特别涉及一种基于神经网络进行电 力负荷预测的方法。
背景技术
目前,电力负荷预测结果关系到电力系统调度运行和生产计划的 制定,准确的负荷预测结果有助于发电企业合理安排生产计划,保障 电网的安全性和稳定性。随着“碳达峰、碳中和”目标的不断推进,电 力系统中将接入大量分布式资源,新型电力系统的负荷结构将更加多 元化,其源荷互动特征将增加电力需求的波动性,增加电网调度的难 度。因此,亟待研究一种更准确预测负荷变化、反应负荷特征的预测 方法。
电力负荷及其影响因素的时间序列往往具有复杂的非线性特征, 且呈现多个周期的变化规律,新型电力系统的负荷特性将会更加复杂, 以电动汽车为例,电动汽车柔性负荷的接入带来了更大的负荷波动性、 时变性和随机性。然而,目前对电力负荷数据进行分离预测的方法不 能较为精确地反映出多个变化周期的规律和特征。因此,研究一种可以准确刻画电力负荷序列及其影响因素不同周期特征的中长期电力 负荷预测方法是十分必要的。
发明内容
针对现有技术中存在的缺陷,本发明的目的是通过多周期趋势分 解(Multipleseasonal-trend decomposition procedure based on Loess, MSTL)算法,将电力负荷序列及其影响因素的多种周期变化规律提 取出来,该方法在提取较短时间序列周期时能够用较低的计算成本获 得极为精确的季节分量,并结合长短期记忆(long-term and short-term memory,LSTM)循环神经网络擅于处理多种时间尺度数据的优势, 建立一种基于MSTL和LSTM组合模型的电力负荷预测方法,从而 提高电力负荷预测的精度。
为达到以上目的,本发明采取的技术方案是:
基于MSTL和LSTM模型的中长期电力负荷预测方法,具体包 括如下步骤:
步骤一:搜集待处理年尺度数据与月尺度数据;
步骤二:分别对年尺度数据与月尺度数据进行相关性检验,确立 年尺度数据,月尺度数据中的关键影响因素;
步骤三:对步骤二得到的年尺度数据中的关键影响因素及对应的 年度电力最大负荷数据,进行季节分解,得到相应的年数据趋势分量、 年数据残差分量和年数据周期分量;
对步骤二得到的月尺度数据中的关键影响因素及对应的月度电 力最大负荷数据进行季节分解,得到相应的月数据趋势分量、月数据 残差分量和月数据周期分量;
步骤四:对步骤三得到的相应的年数据趋势分量、年数据残差分 量和年数据周期分量,进行协整检验和降维处理,得到LSTM模型 的年数据周期输入分量、年数据趋势输入分量和年数据残差输入分量;
对步骤三得到的相应的月数据趋势分量、月数据残差分量和月数 据周期分量进行协整检验和降维处理,得到LSTM模型的月数据周 期输入分量、月数据趋势与月数据残差输入分量;
步骤五:将年数据周期输入分量、年数据趋势输入分量、年数据 残差输入分量、月数据周期输入分量、月数据趋势输入分量与月数据 残差输入分量输入多个LSTM模型中,得到电力负荷预测值在年数 据周期预测分量、年数据趋势预测分量、年数据残差预测分量、月数 据周期预测分量、月数据趋势预测分量与月数据残差预测分量;
步骤六:根据步骤五得出的预测分量,采用LSTM循环神经网络 的自学习能力将其进行拟合,得出电力负荷预测值。
在上述方案的基础上,步骤1所述年尺度数据包括:年度气象数 据,年度经济数据,年度电力最大负荷数据;
所述月尺度数据包括:月度电力最大负荷数据,月度气象数据;
在上述方案的基础上,所述年度经济数据包括:地区生产总值, 第一产业,第二产业,第三产业,地区生产总值不变价,第一产业不 变价,第二产业不变价,第三产业不变价,全社会用电量,居民生活 用电量,耕地面积,灌溉水田,水浇地,旱地,园地,果园,城镇村及工矿用地,城市,建制镇,村庄,采矿用地,风景名胜及特殊用地, 地区生产总值,第一产业,第二产业,工业,建筑业,第三产业,交 通运输仓储和邮电业,批发和零售业、住宿和餐饮业,钢材,城镇人 口比重;
年度气象数据包括:年度平均气温、年度最高气温、年度最低气 温、年度35度以上天数和年度降雨量;
年度电力最大负荷数据包括:2010年负荷、2011年负荷、2012 年负荷、2013年负荷、2014年负荷、2015年负荷、2016年负荷、2017 年负荷、2018年负荷、2019年负荷、2020年负荷;
月度电力最大负荷数据包括:1月负荷、2月负荷、3月负荷、 4月负荷、5月负荷、6月负荷、7月负荷、8月负荷、9月负荷、 10月负荷、11月负荷、12月负荷;
月度气象数据包括:月度平均气温、月度最高气温、月度最低气 温、月度35度以上天数和月度降雨量;
在上述方案的基础上,步骤二具体包括:
计算年度气象数据与年度电力最大负荷数据间的相关系数、年度 经济数据与年度电力最大负荷数据间的相关系数,筛选出相关系数大 于0.8的作为关键影响因素,及对应的年度电力最大负荷数据;
计算月度气象数据与月度电力最大负荷数据间的相关系数,筛选 出相关系数大于0.8的作为关键影响因素,及对应的月度电力最大负 荷数据;
所述相关系数计算公式如公式(1)所示:
Figure BDA0003426264040000041
式中,Cov(X,Y)为X与Y序列的协方差,σx,σy为X,Y序列的 对应标准差。
在上述方案的基础上,步骤三具体包括:
采用多周期趋势分解算法对年尺度数据中的关键影响因素及对 应的年度电力最大负荷数据进行季节分解,得到相应的年数据趋势分 量、年数据残差分量和年数据周期分量;
Figure BDA0003426264040000051
其中,xt表示在t时刻的数据,
Figure BDA0003426264040000052
表示年数据周期分量,
Figure BDA0003426264040000053
表示 年数据趋势分量,
Figure BDA0003426264040000054
表示年数据残差分量,
Figure BDA0003426264040000055
包括多个周期分量
Figure BDA0003426264040000056
Figure BDA0003426264040000057
n表示通过多周期趋势分解算法分解得到的特定周期分 量的编号;
采用多周期趋势分解算法对月尺度数据中的关键影响因素及对 应的月度电力最大负荷数据进行季节分解,得到相应的月数据趋势分 量Tt、月数据残差分量Rt和月数据周期分量St,其中,St包括多个周期 分量St1,St2,...,Stn。
在上述方案的基础上,步骤四中年数据周期分量的处理过程包括:
采用ADF检验法对年数据周期分量进行单位根检验,筛选出不 满足平稳性要求的年数据周期分量进入下一步协整检验;
ADF检验法采用的ADF检验模型如下:
Figure BDA0003426264040000058
Figure BDA0003426264040000059
Figure BDA0003426264040000061
其中,α是常数,δt是时间趋势项,γ=ρ-1,Δyt为随机游走 序列,Δyt-i为Δyt的i阶滞后差分项,μt为随机扰动项,yt为年数 据周期分量,yt-1为Δyt的1阶滞后差分项,βi为线性趋势;
检验过程为:如果ρ<1,则yt平稳;如果ρ=1,则yt为一阶单整 非平稳序列;如果ρ>1,则yt序列发散;
ADF检验法从公式(3)开始,当不满足公式(3)检验时则按 照公式(4)、公式(5)的顺序进行检验;当原序列不存在单位根, 则确定相应序列为平稳序列,同时停止检验;
针对不满足平稳性要求的年数据周期分量,进行Jonhenson协整 检验,得到第一规则分量年数据;
其中,Jonhenson协整检验的表达式如下:
Figure BDA0003426264040000062
Figure BDA0003426264040000063
Figure BDA0003426264040000064
其中,Δyt为随机游走序列,yt为年数据周期分量,Ai为VAR 模型的内生变量系数,C为常数截距,εt为误差项,Π,Γ为影响矩 阵,yt-i为yt的i阶滞后差分项,yt-1为Δyt的1阶滞后差分项;
应用主成因分析法对通过协整检验的第一规则分量年数据进行 处理,选用Z-score方法对第一规则分量年数据进行标准化处理,得 到年数据周期输入分量Z,如公式(9)所示:
Figure BDA0003426264040000071
其中,Z为标准化后序列即年数据周期输入分量,K为第一规则 分量年数据。
在上述方案的基础上,所述年数据趋势分量、年数据残差分量、 月数据趋势分量、月数据残差分量和月数据周期分量的处理方法与年 数据周期分量处理的方法相同。
在上述方案的基础上,步骤五中的LSTM模型中的长短期记忆 单元包括输入门it、输出门ot、遗忘门ft和待学习单元pt,其中,待 学习单元pt用于记录到当前时刻t为止的所有历史信息并受到输入 门it、输出门ot和遗忘门ft控制,所述输入门it、输出门ot和遗忘门ft的输出值均在0和1之间。
在上述方案的基础上,所述长短期记忆单元的参数通过如下公式 迭代更新:
it=σ(Wxixt+Whiht-1) (10)
ft=σ(Wxfxt+Whfht-1) (11)
pt=tanh(Wxpxt+Whpht-1) (12)
ct=ft×ct-1+it×pt (13)
ot=σ(Wxoxt+Whoht-1) (14)
ht=ot×tanh(ct) (15)
式中,Wxo和Who表示输出门待学习网络参数,x1,x2,...,xτ为输入序 列数据,xt表示第t时刻的输入数据,Wxi和Whi表示输入门待学习网 络参数,Wxf和Whf为遗忘门待学习网络参数,Wxp和Whp为细胞状态待 学习网络参数,×表示逐点相乘运算,ct表示所述长短期记忆单元的 细胞状态;
LSTM模型在训练得到所述堆叠长短期记忆网络模型时,通过下 式表示损失函数:
Figure BDA0003426264040000081
其中,m为统计参数,yi为真实值,
Figure BDA0003426264040000082
为预测值,所述统计参数 m是预测数据和原始数据对应点误差的平方和的均值。
本发明的有益效果:
本发明的目的是通过多周期趋势分解(Multiple seasonal-trenddecomposition procedure based on Loess,MSTL)算法,将电力负荷 序列及其影响因素的多种周期变化规律提取出来,并基于协整检验与 主成分分析,提高输入数据的质量,缩短模型训练的时间,避免模型 可能出现过拟合的问题。最后结合LSTM神经网络的优势,将不同 时间尺度的多维度电力负荷影响因素进行拟合,得到准确性更高的中 长期电力负荷预测值。
附图说明
本发明有如下附图:
图1本发明的结构图。
图2本发明的主要步骤流程框图。
图3长短期记忆单元结构图。
图4月度负荷分解结果示意图。
图5多种方法预测值对比示意图。
具体实施方式
下将结合附图和实施例来对本发明的技术方案作进一步的详细 描述,但是应当知道,这些附图仅是为解释目的而设计的,因此不作 为本发明范围的限定。此外,除非特别指出,这些附图仅意在概念性 地说明此处描述的结构构造,而不必要依比例进行绘制。
本发明的主要步骤见图2
步骤一:搜集待处理年尺度数据与月尺度数据
搜集待处理年尺度数据与月尺度数据,所述年尺度数据包括:年 度气象数据、年度经济数据、年度电力最大负荷数据;
所述月尺度数据包括:月度电力最大负荷数据、月度气象数据;
其中,月度电力最大负荷数据包括:1月负荷、2月负荷、3月 负荷、4月负荷、5月负荷、6月负荷、7月负荷、8月负荷、9月 负荷、10月负荷、11月负荷、12月负荷;
月度气象数据包括:月度平均气温、月度最高气温、月度最低气 温、月度35度以上天数和月度降雨量;
年度气象数据包括:年度平均气温、年度最高气温、年度最低气 温、年度35度以上天数和年度降雨量;
年度经济数据包括:地区生产总值,第一产业,第二产业,第三 产业,地区生产总值不变价,第一产业不变价,第二产业不变价,第 三产业不变价,全社会用电量,居民生活用电量,耕地面积,灌溉水 田,水浇地,旱地,园地,果园,城镇村及工矿用地,城市,建制镇,村庄,采矿用地,风景名胜及特殊用地,地区生产总值,第一产业, 第二产业,工业,建筑业,第三产业,交通运输仓储和邮电业,批发 和零售业、住宿和餐饮业,钢材,城镇人口比重;
年度电力最大负荷数据数据包括:2010年负荷、2011年负荷、 2012年负荷、2013年负荷、2014年负荷、2015年负荷、2016年负 荷、2017年负荷、2018年负荷、2019年负荷、2020年负荷;
步骤二:分别对年尺度数据与月尺度数据进行相关性检验,确立 年尺度数据,月尺度数据中的关键影响因素
分别对所述年尺度数据与月尺度数据进行相关性检验,筛选出年 尺度数据中的关键影响因素及对应的年度电力最大负荷数据和月尺 度数据中的关键影响因素及对应的月度电力最大负荷数据,具体为:
计算年度气象数据与年度电力最大负荷数据间的相关系数、年度 经济数据与年度电力最大负荷数据间的相关系数,筛选出相关系数大 于0.8的作为关键影响因素,及对应的年度电力最大负荷数据;
计算月度气象数据与月度电力最大负荷数据间的相关系数,筛选 出相关系数大于0.8的作为关键影响因素,及对应的月度电力最大负 荷数据;
所述相关系数计算公式如公式(1)所示:
Figure BDA0003426264040000111
式中,Cov(X,Y)为X与Y序列的协方差,σx,σy为X,Y序列的 对应标准差。
步骤三:对步骤二得到的年尺度数据中的关键影响因素及对应的 年度电力最大负荷数据,进行季节分解,得到相应的年数据趋势分量、 年数据残差分量和年数据周期分量;
对步骤二得到的月尺度数据中的关键影响因素及对应的月度电 力最大负荷数据进行季节分解,得到相应的月数据趋势分量、月数据 残差分量和月数据周期分量;
根据年度电力最大负荷数据,首先对年尺度数据中的关键影响因 素进行季节分解,得到年数据趋势分量,年数据残差分量和年数据 周期分量;
具体包括:
采用多周期趋势分解算法(MSTL)对年数据进行季节分解,所 述年数据包括年度经济数据,年度电力最大负荷数据,年度气象数据:
MSTL算法是对周期趋势算法(STL)的一种延伸,它可以分解 具有多重季节周期的时间序列,如公式(2)所示:
Figure BDA0003426264040000112
其中,xt表示在t时刻的数据,
Figure BDA0003426264040000113
表示年数据周期分量,
Figure BDA0003426264040000114
表示 年数据趋势分量,
Figure BDA0003426264040000115
年数据残差分量,
Figure BDA0003426264040000116
包括多个周期分量
Figure BDA0003426264040000117
Figure BDA0003426264040000121
n表示通过MSTL分解得到的特定周期分量的编号。
进一步的,对月数据进行季节分解,所述月数据包括:月度气象 数据及月度电力最大负荷数据,得到月数据趋势分量Tt,月数据残差 分量Rt,月数据周期分量St,其中,St包括多个周期分量St1,St2,..., Stn,方法同上。
步骤四:对步骤三得到的相应的年数据趋势分量、年数据残差分 量和年数据周期分量,进行协整检验和降维处理,得到LSTM模型 的年数据周期输入分量、年数据趋势输入分量和年数据残差输入分量;
对步骤三得到的相应的月数据趋势分量、月数据残差分量和月数 据周期分量进行协整检验和降维处理,得到LSTM模型的月数据周 期输入分量、月数据趋势与月数据残差输入分量;
首先,对步骤三得到的年数据周期分量进行协整检验和降维处理, 得到LSTM模型年数据周期输入分量;同样,对步骤三得到的年数 据趋势分量与年数据残差分量进行协整检验和降维处理,得到LSTM 模型年数据趋势输入分量与年数据残差输入分量;
其次,对步骤三得到的月数据周期分量进行协整检验和降维处理, 得到LSTM模型月数据周期输入分量;同样,对步骤三得到的月数 据趋势分量与月数据残差分量进行协整检验和降维处理,得到LSTM 模型月数据趋势输入分量与月数据残差输入分量;
具体为:
1)对于年数据周期分量:
根据ADF检验法和Jonhenson协整检验法对年数据周期分量进 行筛选,再根据主成因分析法(PCA)对其进行降维处理,得到LSTM 模型年数据周期输入分量;
采用ADF检验法对年数据周期分量进行单位根检验,筛选出不 满足平稳性要求的年数据周期分量进入下一步协整检验;
ADF检验法采用的ADF检验模型如下:
Figure BDA0003426264040000131
Figure BDA0003426264040000132
Figure BDA0003426264040000133
其中,α是常数,δt是时间趋势项,γ=ρ-1,Δyt为随机游走 序列,Δyt-i为Δyt的i阶滞后差分项,μt为随机扰动项,yt为年数 据周期分量,yt-1为Δyt的1阶滞后差分项,βi为线性趋势。
检验过程为:如果ρ<1,则yt平稳;如果ρ=1,则yt为一阶单 整非平稳序列;如果ρ>1,则yt序列发散。因此判断一个序列是否平 稳可以通过检验ρ是否严格小于1来实现。也就是说原假设为 H0:ρ=1,备择假设为H1:ρ<1。
ADF检验法从公式(3)开始,当不满足公式(3)检验时则按 照公式(4)、公式(5)的顺序进行检验;当检验拒绝零假设,即原 序列不存在单位根,则确定相应序列为平稳序列,同时停止检验。
针对不满足平稳性要求的年数据周期分量,进行Jonhenson协整 检验,得到第一规则分量年数据;
其中,Jonhenson协整检验的表达式如下:
Figure BDA0003426264040000141
Figure BDA0003426264040000142
Figure BDA0003426264040000143
其中,Δyt为随机游走序列,yt为年数据周期分量,Ai为VAR 模型的内生变量系数,C为常数截距,εt为误差项,Π,Γ为影响矩 阵,yt-i为yt的i阶滞后差分项,yt-1为Δyt的1阶滞后差分项;
为了避免由于各分量数据间的多重共线性及特征维度过多引起 的过拟合现象,导致预测精度受到噪声影响无法呈现稳定预测,因此 需要对各分量数据进行降维滤噪。
应用主成因分析法(PCA)对通过协整检验的第一规则分量年数 据进行处理,首先,选用Z-score方法对第一规则分量年数据进行标 准化处理,得到年数据周期输入分量Z,如公式(9)所示:
Figure BDA0003426264040000144
其中,Z为标准化后序列即年数据周期输入分量,K为第一规则 分量年数据。
2)对于年数据趋势与残差分量:
根据ADF检验法对年数据趋势分量与残差分量进行筛选,再根 据PCA对其进行降维处理,得到LSTM模型年数据趋势与残差输入 分量,方法同上;
3)对于月数据周期分量:
根据ADF检验法对年数据趋势与残差分量进行筛选,再根据 PCA对其进行降维处理,得到多个LSTM模型月数据周期输入分量, 方法同上;
4)对于月数据趋势与残差分量:
根据ADF检验法对月数据趋势与残差分量进行筛选,再根据 PCA对其进行降维处理,得到LSTM模型月数据趋势与残差输入分 量,方法同上;
步骤五:将步骤四得到的各个输入分量输入多个LSTM模型中, 得到电力负荷预测值的各个预测分量。
将年数据周期输入分量、年数据趋势输入分量、年数据残差输入 分量、月数据周期输入分量、月数据趋势输入分量与月数据残差输入 分量输入多个LSTM模型中,得到电力负荷预测值在年数据周期预 测分量、年数据趋势预测分量、年数据残差预测分量、月数据周期预 测分量、月数据趋势预测分量与月数据残差预测分量;
具体为:
LSTM模型单元具体的结构如图3所示,所述长短期记忆单元包 括输入门it、输出门ot、遗忘门ft和待学习单元pt,其中,待学习 单元pt用于记录到当前时刻t为止的所有历史信息并受到输入门 it、输出门ot和遗忘门ft控制,所述输入门it、输出门ot和遗忘门 ft的输出值均在0和1之间。
所述长短期记忆单元的参数通过如下公式迭代更新:
it=σ(Wxixt+Whiht-1) (10)
ft=σ(Wxfxt+Whfht-1) (11)
pt=tanh(Wxpxt+Whpht-1) (12)
ct=ft×ct-1+it×pt (13)
ot=σ(Wxoxt+Whoht-1) (14)
ht=ot×tanh(ct) (15)
式中,Wxo和Who表示输出门待学习网络参数,x1,x2,...,xτ为输入序 列数据,xt表示第t时刻的输入数据,Wxi和Whi表示输入门待学习 网络参数,Wxf和Whf为遗忘门待学习网络参数,Wxp和Whp为细胞状态 待学习网络参数,×表示逐点相乘运算,ct表示所述长短期记忆单元 的细胞状态。
本发明LSTM模型在训练得到所述堆叠长短期记忆网络模型时, 通过下式表示损失函数:
Figure BDA0003426264040000161
其中,m为统计参数,yi为真实值,
Figure BDA0003426264040000162
为预测值,所述统计参数 m是预测数据和原始数据对应点误差的平方和的均值。
步骤六:预测最终负荷
针对步骤五得出的预测分量,采用LSTM循环神经网络的自学习 能力将其进行拟合,得出电力负荷预测值。
算例分析
(1)基础数据
待处理年尺度数据与待处理月尺度数据如表1所示
表1基础数据汇总
Figure BDA0003426264040000171
(2)相关性检验
以2010年至2020年年度电力最大负荷数据作为分析标的,通 过数据预处理及相关性分析筛选出有较强相关性的影响因素,所述有 较强相关性的影响因素包括:地区生产总值(亿元)、第一产业(亿 元)、第二产业(亿元)、第三产业(亿元)和第一产业不变价等。
以2010年1月至12月月度电力最大负荷数据至2020年1月 至12月月度电力最大负荷数据作为分析标的,通过数据预处理及相 关性分析筛选出有较强相关性的影响因素,所述有较强相关性的影响 因素包括:月度平均气温,月度最高气温,月度最低气温,月度35度以上天数,月度降雨量。
(3)季节分解
对包括月度电力最大负荷数据、年度电力最大负荷数据在内的 22组相关因素数据进行季节分解,得到各类影响因素的趋势分量、 季节分量1、季节分量2、以及残差。以月度最大负荷数据为例,可 得到如图4的分解图。
(4)协整检验
经过协整检验,保留第一产业(亿元)、地区生产总值不变价、 第一产业不变价、第一产业(万元)、批发和零售业、住宿和餐饮业 (万元)、批发和零售业、住宿和餐饮业(万元)、年度最大负荷、年 度负荷用电量等26种影响因素。
(5)计算最终负荷以及最终电量
所述最终负荷为是指2021-2025年的年度电力最大负荷,最终电 量就是指2021-2025年的的全社会总用电量。
本方法利用传统的单季节分解预测方法,单时间序列分解方法与 本方法对2010.1月至2017.7共91个月的最大负荷进行预测,并与真 实值相对比,以常用的平均绝对误差(Mean Absolute Percentage Error, MAPE)作为评判标准。所得结果对比如图5和表2所示。可以看出, 相较于常用的时序外推模型以及传统的季节分解模型,本文所提方法 在预测精度上有很大提升,并且没有出现过拟合现象。其中,在月度 最大负荷预测方面,其他方法的最优误差为8.73%,而本文方法为 2.07%,预测精度大幅提升。
表2多种方法月度预测误差对比
方法 预测误差
单季节分解预测 9.87%
单时间序列分解 8.73%
MSTL-LSTM组合模型 2.07%
最后,本方法以2010—2019年数据为训练样本,可以确定宁夏 自治区2021—2025的年最大负荷以及用电量虚拟预测值,如表3, 表4所示:
表3宁夏地区2021-2025年最大负荷预测值
年份 单位 最大负荷
2021年 万kW 1552
2022年 万kW 1664
2023年 万kW 1721
2024年 万kW 1767
2025年 万kW 1798
表4宁夏地区2021-2025年用电量预测情况
年份 单位 年度用电量
2021年 亿kWh 1345
2022年 亿kWh 1428
2023年 亿kWh 1470
2024年 亿kWh 1491
2025年 亿kWh 1501
本说明书中未作详细描述的内容属于本领域专业技术人员公知 的现有技术。

Claims (9)

1.一种基于MSTL和LSTM模型的中长期电力负荷预测方法,其特征在于,具体包括如下步骤:
步骤一:搜集待处理年尺度数据与月尺度数据;
步骤二:分别对年尺度数据与月尺度数据进行相关性检验,确立年尺度数据,月尺度数据中的关键影响因素;
步骤三:对步骤二得到的年尺度数据中的关键影响因素及对应的年度电力最大负荷数据,进行季节分解,得到相应的年数据趋势分量、年数据残差分量和年数据周期分量;
对步骤二得到的月尺度数据中的关键影响因素及对应的月度电力最大负荷数据进行季节分解,得到相应的月数据趋势分量、月数据残差分量和月数据周期分量;
步骤四:对步骤三得到的相应的年数据趋势分量、年数据残差分量和年数据周期分量,进行协整检验和降维处理,得到LSTM模型的年数据周期输入分量、年数据趋势输入分量和年数据残差输入分量;
对步骤三得到的相应的月数据趋势分量、月数据残差分量和月数据周期分量进行协整检验和降维处理,得到LSTM模型的月数据周期输入分量、月数据趋势与月数据残差输入分量;
步骤五:将年数据周期输入分量、年数据趋势输入分量、年数据残差输入分量、月数据周期输入分量、月数据趋势输入分量与月数据残差输入分量输入多个LSTM模型中,得到电力负荷预测值在年数据周期预测分量、年数据趋势预测分量、年数据残差预测分量、月数据周期预测分量、月数据趋势预测分量与月数据残差预测分量;
步骤六:根据步骤五得出的预测分量,采用LSTM循环神经网络的自学习能力将其进行拟合,得出电力负荷预测值。
2.如权利要求1所述的基于MSTL和LSTM模型的中长期电力负荷预测方法,其特征在于,步骤1所述年尺度数据包括:年度气象数据,年度经济数据,年度电力最大负荷数据;
所述月尺度数据包括:月度电力最大负荷数据,月度气象数据。
3.如权利要求2所述的基于MSTL和LSTM模型的中长期电力负荷预测方法,其特征在于,所述年度经济数据包括:地区生产总值,第一产业,第二产业,第三产业,地区生产总值不变价,第一产业不变价,第二产业不变价,第三产业不变价,全社会用电量,居民生活用电量,耕地面积,灌溉水田,水浇地,旱地,园地,果园,城镇村及工矿用地,城市,建制镇,村庄,采矿用地,风景名胜及特殊用地,地区生产总值,第一产业,第二产业,工业,建筑业,第三产业,交通运输仓储和邮电业,批发和零售业、住宿和餐饮业,钢材,城镇人口比重;
年度气象数据包括:年度平均气温、年度最高气温、年度最低气温、年度35度以上天数和年度降雨量;
年度电力最大负荷数据包括:2010年负荷、2011年负荷、2012年负荷、2013年负荷、2014年负荷、2015年负荷、2016年负荷、2017年负荷、2018年负荷、2019年负荷、2020年负荷;
月度电力最大负荷数据包括:1月负荷、2月负荷、3月负荷、4月负荷、5月负荷、6月负荷、7月负荷、8月负荷、9月负荷、10月负荷、11月负荷、12月负荷;
月度气象数据包括:月度平均气温、月度最高气温、月度最低气温、月度35度以上天数和月度降雨量。
4.如权利要求2所述的基于MSTL和LSTM模型的中长期电力负荷预测方法,其特征在于,步骤二具体包括:
计算年度气象数据与年度电力最大负荷数据间的相关系数、年度经济数据与年度电力最大负荷数据间的相关系数,筛选出相关系数大于0.8的作为关键影响因素,及对应的年度电力最大负荷数据;
计算月度气象数据与月度电力最大负荷数据间的相关系数,筛选出相关系数大于0.8的作为关键影响因素,及对应的月度电力最大负荷数据;
所述相关系数计算公式如公式(1)所示:
Figure FDA0003426264030000031
式中,Cov(X,Y)为X与Y序列的协方差,σx,σy为X,Y序列的对应标准差。
5.如权利要求4所述的基于MSTL和LSTM模型的中长期电力负荷预测方法,其特征在于,步骤三具体包括:
采用多周期趋势分解算法对年尺度数据中的关键影响因素及对应的年度电力最大负荷数据进行季节分解,得到相应的年数据趋势分量、年数据残差分量和年数据周期分量;
Figure FDA0003426264030000032
其中,xt表示在t时刻的数据,
Figure FDA0003426264030000041
表示年数据周期分量,
Figure FDA0003426264030000042
表示年数据趋势分量,
Figure FDA0003426264030000043
表示年数据残差分量,
Figure FDA0003426264030000044
包括多个周期分量
Figure FDA0003426264030000045
Figure FDA0003426264030000046
n表示通过多周期趋势分解算法分解得到的特定周期分量的编号;
采用多周期趋势分解算法对月尺度数据中的关键影响因素及对应的月度电力最大负荷数据进行季节分解,得到相应的月数据趋势分量Tt、月数据残差分量Rt和月数据周期分量St,其中,St包括多个周期分量St1,St2,...,Stn。
6.如权利要求5所述的基于MSTL和LSTM模型的中长期电力负荷预测方法,其特征在于,步骤四中年数据周期分量的处理过程包括:
采用ADF检验法对年数据周期分量进行单位根检验,筛选出不满足平稳性要求的年数据周期分量进入下一步协整检验;
ADF检验法采用的ADF检验模型如下:
Figure FDA0003426264030000047
Figure FDA0003426264030000048
Figure FDA0003426264030000049
其中,α是常数,δt是时间趋势项,γ=ρ-1,Δyt为随机游走序列,Δyt-i为Δyt的i阶滞后差分项,μt为随机扰动项,yt为年数据周期分量,yt-1为Δyt的1阶滞后差分项,βi为线性趋势;
检验过程为:如果ρ<1,则yt平稳;如果ρ=1,则yt为一阶单整非平稳序列;如果ρ>1,则yt序列发散;
ADF检验法从公式(3)开始,当不满足公式(3)检验时则按照公式(4)、公式(5)的顺序进行检验;当原序列不存在单位根,则确定相应序列为平稳序列,同时停止检验;
针对不满足平稳性要求的年数据周期分量,进行Jonhenson协整检验,得到第一规则分量年数据;
其中,Jonhenson协整检验的表达式如下:
Figure FDA0003426264030000051
Figure FDA0003426264030000052
Figure FDA0003426264030000053
其中,Δyt为随机游走序列,yt为年数据周期分量,Ai为VAR模型的内生变量系数,C为常数截距,εt为误差项,Π,Γ为影响矩阵,yt-i为yt的i阶滞后差分项,yt-1为Δyt的1阶滞后差分项;
应用主成因分析法对通过协整检验的第一规则分量年数据进行处理,选用Z-score方法对第一规则分量年数据进行标准化处理,得到年数据周期输入分量Z,如公式(9)所示:
Figure FDA0003426264030000054
其中,Z为年数据周期输入分量,K为第一规则分量年数据。
7.如权利要求6所述的基于MSTL和LSTM模型的中长期电力负荷预测方法,其特征在于,所述年数据趋势分量、年数据残差分量、月数据趋势分量、月数据残差分量和月数据周期分量的处理方法与年数据周期分量处理的方法相同。
8.如权利要求7所述的基于MSTL和LSTM模型的中长期电力负荷预测方法,其特征在于,步骤五中的LSTM模型中的长短期记忆单元包括输入门it、输出门ot、遗忘门ft和待学习单元pt,其中,待学习单元pt用于记录到当前时刻t为止的所有历史信息并受到输入门it、输出门ot和遗忘门ft控制,所述输入门it、输出门ot和遗忘门ft的输出值均在0和1之间。
9.如权利要求8所述的基于MSTL和LSTM模型的中长期电力负荷预测方法,其特征在于,所述长短期记忆单元的参数通过如下公式迭代更新:
it=σ(Wxixt+Whiht-1) (10)
ft=σ(Wxfxt+Whfht-1) (11)
pt=tanh(Wxpxt+Whpht-1) (12)
ct=ft×ct-1+it×pt (13)
ot=σ(Wxoxt+Whoht-1) (14)
ht=ot×tanh(ct) (15)
式中,Wxo和Who表示输出门待学习网络参数,x1,x2,...,xτ为输入序列数据,xt表示第t时刻的输入数据,Wxi和Whi表示输入门待学习网络参数,Wxf和Whf为遗忘门待学习网络参数,Wxp和Whp为细胞状态待学习网络参数,×表示逐点相乘运算,ct表示所述长短期记忆单元的细胞状态;
LSTM模型在训练得到所述堆叠长短期记忆网络模型时,通过下式表示损失函数:
Figure FDA0003426264030000071
其中,m为统计参数,yi为真实值,
Figure FDA0003426264030000072
为预测值,所述统计参数m是预测数据和原始数据对应点误差的平方和的均值。
CN202111581634.7A 2021-12-22 2021-12-22 基于mstl和lstm模型的中长期电力负荷预测方法 Pending CN114595861A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111581634.7A CN114595861A (zh) 2021-12-22 2021-12-22 基于mstl和lstm模型的中长期电力负荷预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111581634.7A CN114595861A (zh) 2021-12-22 2021-12-22 基于mstl和lstm模型的中长期电力负荷预测方法

Publications (1)

Publication Number Publication Date
CN114595861A true CN114595861A (zh) 2022-06-07

Family

ID=81814345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111581634.7A Pending CN114595861A (zh) 2021-12-22 2021-12-22 基于mstl和lstm模型的中长期电力负荷预测方法

Country Status (1)

Country Link
CN (1) CN114595861A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115481818A (zh) * 2022-10-12 2022-12-16 大连理工大学 一种基于时序分解的中长期径流预报方法及系统
CN116739118A (zh) * 2023-06-27 2023-09-12 国网江苏省电力有限公司南通供电分公司 一种基于LSTM-XGBoost实现误差修正机制的电力负荷预测方法
CN117709530A (zh) * 2023-12-13 2024-03-15 中国司法大数据研究院有限公司 一种消除农历新年影响的案件量预测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115481818A (zh) * 2022-10-12 2022-12-16 大连理工大学 一种基于时序分解的中长期径流预报方法及系统
CN115481818B (zh) * 2022-10-12 2023-05-30 大连理工大学 一种基于时序分解的中长期径流预报方法及系统
CN116739118A (zh) * 2023-06-27 2023-09-12 国网江苏省电力有限公司南通供电分公司 一种基于LSTM-XGBoost实现误差修正机制的电力负荷预测方法
CN117709530A (zh) * 2023-12-13 2024-03-15 中国司法大数据研究院有限公司 一种消除农历新年影响的案件量预测方法

Similar Documents

Publication Publication Date Title
CN113962364B (zh) 一种基于深度学习的多因素用电负荷预测方法
Tran et al. Nature-inspired metaheuristic ensemble model for forecasting energy consumption in residential buildings
Hong et al. Probabilistic electric load forecasting: A tutorial review
Wei et al. Prediction of residential district heating load based on machine learning: A case study
Fan et al. Development of prediction models for next-day building energy consumption and peak power demand using data mining techniques
CN111260136A (zh) 一种基于arima-lstm组合模型的楼宇短期负荷预测方法
CN114595861A (zh) 基于mstl和lstm模型的中长期电力负荷预测方法
Xiao et al. Impacts of data preprocessing and selection on energy consumption prediction model of HVAC systems based on deep learning
Moradzadeh et al. Heating and cooling loads forecasting for residential buildings based on hybrid machine learning applications: A comprehensive review and comparative analysis
Li et al. Meta-learning strategy based on user preferences and a machine recommendation system for real-time cooling load and COP forecasting
CN111915092A (zh) 基于长短时记忆神经网络的超短期风电功率预测方法
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN112149890A (zh) 基于用户用能标签的综合能源负荷预测方法及系统
Ajitha et al. Design and development of Residential Sector Load Prediction model during COVID-19 Pandemic using LSTM based RNN
CN114862032B (zh) 一种基于XGBoost-LSTM的电网负荷预测方法及装置
Chen et al. Short-term wind power forecasting using mixed input feature-based cascade-connected artificial neural networks
Zhao et al. Short-term microgrid load probability density forecasting method based on k-means-deep learning quantile regression
CN115759415A (zh) 基于lstm-svr的用电需求预测方法
CN115545333A (zh) 一种多负荷日类型配电网负荷曲线预测方法
CN107895211A (zh) 一种基于大数据的中长期电力负荷预测方法和系统
CN114819395A (zh) 一种基于长短期记忆神经网络和支持向量回归组合模型的行业中长期负荷预测方法
CN114581141A (zh) 基于特征选择与lssvr的短期负荷预测方法
Alharbi et al. Short-term wind speed and temperature forecasting model based on gated recurrent unit neural networks
CN116826745A (zh) 一种电力系统背景下的分层分区短期负荷预测方法及系统
Ning et al. Probabilistic short-term power load forecasting based on B-SCN

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination