CN116865251A - 一种短期负荷概率预测方法及系统 - Google Patents
一种短期负荷概率预测方法及系统 Download PDFInfo
- Publication number
- CN116865251A CN116865251A CN202310814016.5A CN202310814016A CN116865251A CN 116865251 A CN116865251 A CN 116865251A CN 202310814016 A CN202310814016 A CN 202310814016A CN 116865251 A CN116865251 A CN 116865251A
- Authority
- CN
- China
- Prior art keywords
- load
- short
- data
- weather forecast
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 238000012549 training Methods 0.000 claims abstract description 44
- 238000005259 measurement Methods 0.000 claims abstract description 38
- 238000013528 artificial neural network Methods 0.000 claims abstract description 24
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 19
- 238000005457 optimization Methods 0.000 claims abstract description 12
- 238000009826 distribution Methods 0.000 claims description 35
- 230000006870 function Effects 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 11
- 238000010200 validation analysis Methods 0.000 claims description 10
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 9
- 238000001556 precipitation Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- 210000002569 neuron Anatomy 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000005315 distribution function Methods 0.000 claims description 3
- 230000006403 short-term memory Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000007787 long-term memory Effects 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 34
- 238000004590 computer program Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000006872 improvement Effects 0.000 description 8
- 238000013508 migration Methods 0.000 description 6
- 230000005012 migration Effects 0.000 description 6
- 230000015654 memory Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 241001123248 Arma Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
- G06Q10/06375—Prediction of business process outcome or impact based on a proposed change
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Water Supply & Treatment (AREA)
- Power Engineering (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明提供一种短期负荷概率预测方法及系统,涉及电力系统负荷预测领域,方法包括:采集多个待预测地区的电力历史负荷实测数据和对应时间段的天气预报数据;对所述电力历史负荷实测数据和对应时间段的天气预报数据进行处理得到数据样本;基于所述数据样本对基础模型训练,得到短期负荷预测模型;所述基础模型采用深度循环神经网络RNN作为基础,并加入多任务学习框架;确定预测发布时刻,获取待预测时间段内待预测地区的天气预报数据,输入所述短期负荷预测模型中计算得到负荷预测结果。本发明在电力系统不确定性日益增大的背景下,准确的负荷概率预测结果可以作为不确定性优化方法的数据支撑,帮助相关部门做出更加合理的决策。
Description
技术领域
本发明涉及电力系统负荷预测领域,特别涉及一种短期负荷概率预测方法及系统。
背景技术
电力负荷预测不仅是电力系统规划和建设的重要依据,也是电力系统安全、经济运行的重要保障。因此,对电力负荷做出科学准确的预测是十分重要且必要的。按照结果输出形式可将负荷预测划分为点预测和概率预测,不同于点预测是提供确定的负荷预测数值,概率预测是给定未来某时刻的概率信息。随着电力负荷日趋社会化和复杂化,可预测性降低,概率预测能够针对负荷的不确定性提供更多信息,帮助决策者做出更合理的决策。
按照时间尺度可将负荷预测划分为超短期、短期、中期和长期预测,其中,短期预测周期一般是数小时到数周,主要用于安排调度计划和电力市场交易等。它一直受到较多关注,相关的预测技术相对已比较成熟。时间序列法和回归分析法属于经典的短期负荷预测方法,常见的模型包括Box-Jenkins模型、ARMA模型、多元线性回归。随着计算机科学和智能电网的发展,一些适应大数据的人工智能方法被用于短期负荷预测,包括人工神经网络、模糊回归、支持向量机等。由于更多影响因素得以被有效地考虑进来,负荷预测精度得到进一步提升。如今伴随深度学习的兴起,涌现出许多优越的网络结构,网络规模也不断扩大,对复杂非线性映射的刻画能力大幅提高,将其应用到电力负荷预测中,有望进一步提高预测精度。
近年来极端气象等事件层出不穷,对用户的用电行为产生较大影响。当某地区首次面临这种情况时,传统的根据该地区的历史数据建立的负荷短期负荷预测模型通常无法刻画此时负荷的变化,使负荷预测精度显著降低。随着极端气象发生次数愈多,影响愈深,研究这种情况下的相关负荷预测技术是有现实意义的。
发明内容
针对现有技术存在的技术问题,本发明提供了一种短期负荷概率预测方法及系统。本发明在电力系统不确定性日益增大的背景下,准确的负荷概率预测结果可以作为不确定性优化方法的数据支撑,帮助相关部门做出更加合理的决策。
为实现上述目的,本发明提供了如下的技术方案:
本发明第一方面是提供一种短期负荷概率预测方法,包括:
采集多个待预测地区的电力历史负荷实测数据和对应时间段的天气预报数据;
对所述电力历史负荷实测数据和对应时间段的天气预报数据进行处理得到数据样本;
基于所述数据样本对基础模型训练,得到短期负荷预测模型;所述基础模型采用深度循环神经网络RNN作为基础,并加入多任务学习框架;
确定预测发布时刻,获取待预测时间段内待预测地区的天气预报数据,输入所述短期负荷预测模型中计算得到负荷预测结果。
作为本发明进一步改进,所述采集多个待预测地区的电力历史负荷实测数据和对应时间段的天气预报数据,包括:
采集多个待预测地区的电力历史负荷实测数据,包括功率数据;
从气象预报部门获取各地区对应时间段的天气预报数据,包括温度、降水;
电力历史负荷实测数据和对应时间段的天气预报数据均为时间序列。
作为本发明进一步改进,所述对所述电力历史负荷实测数据和对应时间段的天气预报数据进行处理得到数据样本,包括:
对所述电力历史负荷实测数据和对应时间段的天气预报数据进行预处理,包括异常值和缺失值的检测和处理,以及对电力历史负荷实测数据和天气预报数据进行归一化,产生输入特征;接着将整个数据集划分为用于训练模型可学习参数的训练集、用于超参数寻优的验证集和用于评估模型效果的测试集;在各个数据集上利用滑动窗口法产生固定长度的训练样本、验证样本和测试样本。
作为本发明进一步改进,所述在各个数据集上利用滑动窗口法产生固定长度的训练样本、验证样本和测试样本,包括:
以T为滑动窗口的窗口长度,t0为预测发布时刻;1:t0时段称为编码器部分,t0+1:T时段称为解码器部分,解码器部分对应着每个样本的预测时段;该滑动窗口通过依次向前移动一定单位来产生所需样本;得到训练样本、验证样本和测试样本。
作为本发明进一步改进,所述输入特征包括:一是时间变量,包括月份、星期几、小时数对应的傅里叶项;二是天气预报变量,包括温度、降水;三是负荷数据滞后项,包括过去三个时刻的负荷数值。
作为本发明进一步改进,所述基于所述数据样本对基础模型训练,得到短期负荷预测模型,包括:
确定短期负荷预测模型的超参数,采用网格搜索的方法进行超参数寻优,选择一组在验证集上结果满足要求的超参数作为最优超参数;
如果需要重新训练,将训练样本和验证样本合并为新的训练集,在确定的最优超参数的基础上通过最小化损失函数来重新估计短期负荷预测模型的可学习参数,得到最终的短期负荷预测模型;否则,直接将上步最优超参数对应的训练完成的模型作为最终的短期负荷预测模型。
作为本发明进一步改进,所述超参数分为两类,一类是网络结构超参数,包括专家网络数量、专家网络和塔网络中RNN的层数和每层神经元个数、滑动窗口长度;另一类是优化参数,包括学习率、迭代次数、小批量样本数量和丢弃率。
作为本发明进一步改进,所述的短期负荷预测模型包括两部分:
第一部分是将深度循环神经网络作为基础来产生负荷概率预测结果,假设电力历史负荷实测数据的概率分布服从正态分布,利用深度循环神经网络结构实现输入特征和分布参数之间的映射;
深度循环神经网络包括输入层、隐藏层和输出层,隐藏层的输入包括当前时刻的输入和上一时刻隐藏层的输出,深度循环神经网络选择长短期记忆作为基本单元,对于时刻t,该网络首先根据式(1)对此时的隐藏状态进行更新,
ht=L(ht-1,lt-Δt:t-1,xt;Θlstm) (1)
式中,L(·)表示LSTM单元的计算函数,参数是Θlstm;ht-1和ht分别是t-1时刻和t时刻的隐藏状态;lt-Δt:t-1是滞后Δt个时间点以内的负荷值;xt是t时刻除滞后项以外的输入特征,包括时间特征和天气预报特征两类;
然后网络将隐藏状态映射为当前时刻的负荷分布参数,
式中,O(·)是仿射函数,它的参数是Θo;是概率分布的分布参数,正态分布包括均值μt和标准差σt两个参数,并在输出层添加softplus激活函数来确保σt大于零,则当前时刻负荷的概率分布为:
第二部分是在深度循环神经网络的基础上加入多任务学习框架,对多个待预测地区的电力历史负荷实测数据进行共同训练;选择MMoE作为基本的多任务学习框架,包括多个专家网络、门控网络和对应各个预测任务的塔网络;
若有来自N个待预测地区的负荷数据,对于时刻t,各个专家网络根据式(4)对此时的隐藏状态进行更新,
式中,表示第m个专家网络,是由LSTM单元构成的RNN网络,其参数是/> 和/>分别是t-1时刻和t时刻该专家网络的隐藏状态;/>和/>是t时刻第n个预测任务对应的负荷滞后值和其余输入特征;
同时,各个门控网络根据当前输入计算一组权重,
式中,表示第n个预测任务对应的门控网络,是仿射函数,它的参数是/> 包括M个权重,分别对应M个专家网络,其中第m个元素/>表示选择专家网络/>的概率;为了满足/>添加softmax激活函数;第n个塔网络的输入/>便是专家网络输出的加权组合,
各个塔网络首先根据式(7)对此时的隐藏状态进行更新,然后根据式(8)将隐藏状态映射为对应预测任务在当前时刻的负荷分布参数,
式中,和/>表示第n个预测任务对应的RNN网络和仿射网络,参数分别是和/> 是第n个预测任务在t时刻的负荷分布参数,通过式(3)计算此时的负荷分布。
作为本发明进一步改进,所述获取待预测时间段内待预测地区的天气预报数据,输入所述短期负荷预测模型中计算得到负荷预测结果,包括:
在t0之后的每个时刻,短期负荷预测模型对预测的负荷分布函数进行随机采样获得该时刻的功率场景,这个场景被传递到后续时刻代替负荷历史观测值作为输入量,然后重复此过程直到末尾时刻T,通过多次序贯采样,计算各个预测时刻采样值的均值和标准差作为该时刻负荷的分布参数。
本发明第二方面是提供一种短期负荷概率预测方系统,包括:
采集模块,用于采集多个待预测地区的电力历史负荷实测数据和对应时间段的天气预报数据;
处理模块,用于对所述电力历史负荷实测数据和对应时间段的天气预报数据进行处理得到数据样本;
训练模块,用于基于所述数据样本对基础模型训练,得到短期负荷预测模型;所述基础模型采用深度循环神经网络RNN作为基础,并加入多任务学习框架;
预测模块,用于确定预测发布时刻,获取待预测时间段内待预测地区的天气预报数据,输入所述短期负荷预测模型中计算得到负荷预测结果。
与现有技术比,本发明具有如下优点:
本发明第一部分是将深度循环神经网络(RNN)作为基础模型来产生负荷概率预测结果;第二部分是在上述模型的基础上加入多任务学习框架,对多个待预测地区的负荷进行共同训练,从而实现不同地区负荷之间信息的迁移。预测方法分为四阶段,分别是数据采集阶段、数据准备阶段、模型训练阶段和负荷预测阶段。该方法是一种能够提供准确的概率预测结果,允许多个地区的负荷共同训练的短期负荷预测方法。这种方法能够给出待预测时段内各个时刻的负荷的概率分布。该方法中的多任务学习框架能够将多个待预测地区的负荷共同进行训练,有能力挖掘到它们之间的相关性,实现不同地区之间知识的迁移,从而提高预测精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的短期负荷概率预测方法流程框图;
图2为本发明实施例的基础模型的网络结构;
图3为本发明实施例的多任务学习框架的结构;
图4为本发明实施例的滑动窗口法示意图。
具体实施方式
为了使本发明的目的和技术方案更加清晰和便于理解。以下结合附图和实施例,对本发明进行进一步的详细说明。
本发明的目的在于提供一种能够考虑负荷的不确定性且有一定能力提高某地区首次面临极端气象时的负荷预测精度的短期负荷预测方法。考虑其他出现过类似极端气象的地区能够为首次面临这种情况的地区提供可借鉴的信息,采用迁移学习中的多任务学习来实现不同地区之间知识的迁移,从而提高预测精度。最终,一种基于多任务学习和深度循环神经网络的短期负荷概率预测方法被提出。
本发明第一个目的是提供一种短期负荷概率预测方法,包括:
采集多个待预测地区的电力历史负荷实测数据和对应时间段的天气预报数据;
对所述电力历史负荷实测数据和对应时间段的天气预报数据进行处理得到数据样本;
基于所述数据样本对基础模型训练,得到短期负荷预测模型;所述基础模型采用深度循环神经网络RNN作为基础,并加入多任务学习框架;
确定预测发布时刻,获取待预测时间段内待预测地区的天气预报数据,输入所述短期负荷预测模型中计算得到负荷预测结果。
本发明基于面对目前大部分负荷预测方法无法衡量负荷的不确定性,忽略各地区负荷之间的联系,并且无法应对某地区首次出现极端气象时负荷发生变化导致预测精度降低的问题,提出短期负荷概率预测方法,短期负荷预测模型包括两部分,第一部分是将深度循环神经网络(RNN)作为基础模型来产生负荷概率预测结果;第二部分是在上述模型的基础上加入多任务学习框架,对多个待预测地区的负荷进行共同训练,从而实现不同地区负荷之间信息的迁移。预测方法分为四阶段,分别是数据采集阶段、数据准备阶段、模型训练阶段和负荷预测阶段。该方法是一种能够提供准确概率预测结果,允许多个地区的负荷共同训练的短期负荷预测方法。
当某地区首次面临极端气象等事件时,该方法可以合理选择出一些其他出现过类似情况的地区同该地区一起训练,为该地区提供一些可借鉴的信息,实现不同地区之间知识的迁移,从而提高该地区在这种情况下的负荷预测精度。
更具体的,为实现上述目的,本发明提供一种基于多任务学习和深度循环神经网络的短期负荷概率预测方法,包括以下阶段:
阶段1:数据采集阶段
采集多个待预测地区的电力历史负荷实测数据,一般为功率数据;从气象预报部门获取各地区对应时间段的天气预报数据,包括温度、降水等。两类数据均为时间序列,时间分辨率为15分钟或1小时。
阶段2:数据准备阶段
步骤2.1:首先对阶段1中的数据进行预处理,包括异常值和缺失值的检测和处理,以及对电力历史负荷实测数据和天气预报数据进行归一化。
步骤2.2:由于电力负荷具有周期性并且受天气状况影响较大,考虑以下三类特征作为模型的输入特征,一是时间变量,包括月份、星期几、小时数对应的傅里叶项;二是天气预报变量,包括温度、降水等;三是负荷数据滞后项,包括过去三个时刻的负荷数值。
步骤2.3:将整个历史数据集划分为训练集(用于模型可学习参数的训练)、验证集(用于超参数寻优)和测试集(用于评估模型效果),然后在各个数据集上利用滑动窗口法产生固定长度的训练样本、验证样本和测试样本。
阶段3:模型训练阶段
步骤3.1:确定短期负荷预测模型的超参数,采用网格搜索的方法进行超参数寻优,选择一组在验证集上表现最好的超参数作为最优超参数。
步骤3.2:如果需要重新训练模型,将训练样本和验证样本合并为新的训练集,在上步确定的最优超参数的基础上通过最小化损失函数来重新估计短期负荷预测模型的可学习参数,得到最终的短期负荷预测模型;否则,直接将上步最优超参数对应的训练完成的模型作为最终的短期负荷预测模型。
阶段4:负荷预测阶段
在实际预测时,确定预测发布时刻,从气象预报部门获取待预测时间段内待预测地区的天气预报数据,代入最终的短期负荷预测模型中计算得到待预测地区在未来24小时的负荷预测结果,时间分辨率为15分钟或1小时。
本发明能够提供准确的短期负荷概率预测结果,并且允许多个地区的负荷进行共同训练。一方面,选择概率密度函数作为概率结果的表示形式,不同于传统的点预测结果提供未来某时刻一个确定的负荷数值,这种方法能够给出待预测时段内各个时刻的负荷的概率分布。在电力系统不确定性日益增大的背景下,准确的负荷概率预测结果可以作为不确定性优化方法的数据支撑,帮助相关部门做出更加合理的决策。另一方面,不同地区之间的负荷可能是具有相关性的,该方法中的多任务学习框架能够将多个待预测地区的负荷共同进行训练,有能力挖掘到它们之间的相关性,从而提高预测精度。
下面将结合附图1对本发明作进一步说明。但本发明的内容不仅仅局限如此。
第1步:确定多个待预测地区,一般要求多个地区的负荷类型相同且规模相近,或者具有明显的相关性。如果某地区首次面临某种极端气象事件,需要选择一些其他较早出现过类似事件的地区,实现极端气象对负荷的影响信息的迁移。然后采集多个待预测地区的电力历史负荷实测数据,一般为功率数据;并从气象预报部门获取各地区对应时间段的天气预报数据,包括温度、降水等。两类数据的时间分辨率为15分钟或1小时,数据长度至少一年以上。
第2步:对第1步中的数据进行预处理,首先通过观察时间图和散点图等方法寻找异常值,并且剔除异常值和缺失值;然后对电力历史负荷实测数据按照各地区总容量进行标准化,对天气预报数据进行z-score标准化。
第3步:考虑到电力负荷具有周期性并且受天气状况影响较大,产生以下三类特征作为模型的输入特征,一是时间变量,包括月份、星期几、小时数对应的傅里叶项;二是天气预报变量,包括温度、降水等;三是负荷数据滞后项,包括过去三个时刻的负荷数值。
第4步:本发明中的短期负荷预测模型包括两部分。第一部分是将深度循环神经网络(RNN)作为基础模型来产生负荷概率预测结果(选择概率密度函数的表现形式)。假设负荷的概率分布服从正态分布,利用图2所示的网络结构实现输入特征和分布参数之间的映射。
RNN与普通神经网络类似,其基本结构也包括输入层、隐藏层和输出层,不同之处在于隐藏层的输入不仅包括当前时刻的输入,还包括上一时刻隐藏层的输出,图2也给出了按照时间展开后的网络结构。选择长短期记忆(LSTM)作为RNN的基本单元,对于时刻t,该网络首先根据式(1)对此时的隐藏状态进行更新,
ht=L(ht-1,lt-Δt:t-1,xt;Θlstm) (1)
式中,L(·)表示LSTM单元的计算函数,它的参数是Θlstm;ht-1和ht分别是t-1时刻和t时刻的隐藏状态;lt-Δt:t-1是滞后Δt个时间点以内的负荷值;xt是t时刻除滞后项以外的输入特征,包括时间特征和天气预报特征两类。
然后网络将隐藏状态映射为当前时刻的负荷分布参数,
式中,O(·)是仿射函数,它的参数是Θo;是概率分布的分布参数,如正态分布包括均值μt和标准差σt两个参数,需要在输出层添加softplus激活函数来确保σt大于零。则当前时刻负荷的概率分布为
第二部分是在上述模型的基础上加入多任务学习框架,对多个待预测地区的负荷进行共同训练,从而实现不同地区负荷之间信息的迁移。选择MMoE作为基本的多任务学习框架,它大致包括多个专家网络、门控网络和对应各个预测任务的塔网络三部分,将第一部分的基础模型拓展到这个多任务学习框架后的网络结构如图3所示。
如果有来自N个待预测地区的负荷数据,对于时刻t,各个专家网络根据式(4)对此时的隐藏状态进行更新,
式中,表示第m个专家网络,是由LSTM单元构成的RNN网络,其参数是/> 和/>分别是t-1时刻和t时刻该专家网络的隐藏状态;/>和/>是t时刻第n个预测任务对应的负荷滞后值和其余输入特征。
同时,各个门控网络根据当前输入计算一组权重,
式中,表示第n个预测任务对应的门控网络,是仿射函数,它的参数是/> 包括M个权重,分别对应M个专家网络,其中第m个元素/>表示选择专家网络/>的概率。为了满足/>需要添加softmax激活函数。因此,第n个塔网络的输入/>便是专家网络输出的加权组合,
各个塔网络首先根据式(7)对此时的隐藏状态进行更新,然后根据式(8)将隐藏状态映射为对应预测任务在当前时刻的负荷分布参数,
式中,和/>表示第n个预测任务对应的RNN网络和仿射网络,参数分别是和/> 是第n个预测任务在t时刻的负荷分布参数,然后可以通过式(3)计算此时的负荷分布。
为了实现上述负荷短期负荷预测模型的训练,在将整个历史数据集划分为训练集(用于模型可学习参数的训练)、验证集(用于超参数寻优)和测试集(用于评估模型效果)后,需要在各个数据集上利用滑动窗口法产生固定长度的训练样本、验证样本和测试样本,过程示意图如图4所示。
其中,T为滑动窗口的窗口长度,t0为预测发布时刻;1:t0时段称为编码器部分,t0+1:T时段称为解码器部分,它对应着每个样本的预测时段。该窗口通过依次向前移动一定单位来产生所需样本。
第5步:第4步中展示的负荷短期负荷预测模型包括较多超参数,这些参数对模型性能有一定影响,将它们大致分为两类,一类是网络结构超参数,包括专家网络数量、专家网络和塔网络中RNN的层数和每层神经元个数、滑动窗口长度;另一类是优化参数,包括学习率、迭代次数、小批量样本数量、丢弃率。
在确定短期负荷预测模型的超参数之后,采用网格搜索的方法进行超参数寻优。假设共有K个超参数,第k个超参数可以取mk个值,那么总共的配置组合数量为网络搜索在这些不同组合上分别训练一个模型,然后测试这些模型在验证集上性能,选择一组表现最好的超参数配置作为最优超参数。
第6步:对于时刻t,网络的损失函数为
式中,为第n个预测任务损失的权重,取1/N;/>是第n个预测任务在t时刻的CRPS评分,用于评估概率预测结果/>和实际观测值/>的吻合程度。
如果需要重新训练模型,将训练样本和验证样本合并为新的训练集,在第5步确定的最优超参数的基础上,通过最小化根据式(9)计算的整个时间窗口上的损失函数之和来重新估计短期负荷预测模型的可学习参数,包括 其中m=1,…,M,n=1,…,N,得到最终的短期负荷预测模型;否则,直接将第5步中最优超参数对应的训练完成的模型作为最终的短期负荷预测模型。
第7步:在实际预测时,确定预测发布时刻,从气象预报部门获取待预测时间段内待预测地区的天气预报数据,代入最终的短期负荷预测模型中计算得到待预测地区在未来24小时的负荷预测结果,时间分辨率为15分钟或1小时。
在预测时段,作为模型输入的负荷历史观测值不再是已知的,因此需要对模型的结构稍作调整。在t0之后的每个时刻,模型对预测的负荷分布函数进行随机采样获得该时刻的功率场景,这个场景被传递到后续时刻代替负荷历史观测值作为输入量,然后重复此过程直到末尾时刻T,这个过程被称为序贯采样,如图2中虚线箭头所示。通过多次序贯采样,计算各个预测时刻采样值的均值和标准差即为该时刻负荷的分布参数。
本发明举例说明如下:
本实例数据包括美国4个城市(波士顿、芝加哥、费城、西雅图)自2018年1月1日起共计24个月的负荷数据(波士顿自2019年1月1日起共计12个月)和天气预报数据(包括温度、云量、湿度、降水、压力),时间分辨率为1小时。通过平移负荷序列减缓各个城市之间的时差影响,并且对各个城市的电力历史负荷实测数据进行归一化,对天气预报数据进行z-score标准化。产生三类输入特征后,划分训练集(2018年1月1日至2019年2月28日)、验证集(2019年3月1日至2019年7月31日)和测试集(2019年8月1日至2019年12月31日),并通过滑动窗口法产生样本。设定预测提前期为24小时,序贯采样的次数为99次。
通过网格搜索得到模型的最优超参数配置如下:专家网络数量为5、专家网络中RNN的层数和每层神经元个数为2和8、塔网络中RNN的层数和每层神经元个数为1和40、滑动窗口长度144、学习率为0.0001、迭代次数为500、小批量样本数量为256、丢弃率为0.1。
选择最优超参数对应的训练完成的模型作为最终的短期负荷预测模型,在测试集上进行概率预测。采用CRPS、NAPS和MRE作为概率预测结果精度的衡量指标,三者均是越小越好,4个城市的预测精度列于表1。
表1负荷短期负荷预测模型在各城市测试集上的短期概率预测结果精度
本发明第二个目的是提供一种短期负荷概率预测方系统,包括:
采集模块,用于采集多个待预测地区的电力历史负荷实测数据和对应时间段的天气预报数据;
处理模块,用于对所述电力历史负荷实测数据和对应时间段的天气预报数据进行处理得到数据样本;
训练模块,用于基于所述数据样本对基础模型训练,得到短期负荷预测模型;所述基础模型采用深度循环神经网络RNN作为基础,并加入多任务学习框架;
预测模块,用于确定预测发布时刻,获取待预测时间段内待预测地区的天气预报数据,输入所述短期负荷预测模型中计算得到负荷预测结果。
本发明第三个目的是提供一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述短期负荷概率预测方法。
本发明第死个目的是提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述短期负荷概率预测方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
以上内容是对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定保护范围。
Claims (10)
1.一种短期负荷概率预测方法,其特征在于,包括:
采集多个待预测地区的电力历史负荷实测数据和对应时间段的天气预报数据;
对所述电力历史负荷实测数据和对应时间段的天气预报数据进行处理得到数据样本;
基于所述数据样本对基础模型训练,得到短期负荷预测模型;所述基础模型采用深度循环神经网络RNN作为基础,并加入多任务学习框架;
确定预测发布时刻,获取待预测时间段内待预测地区的天气预报数据,输入所述短期负荷预测模型中计算得到负荷预测结果。
2.根据权利要求1所述的一种短期负荷概率预测方法,其特征在于,
所述采集多个待预测地区的电力历史负荷实测数据和对应时间段的天气预报数据,包括:
采集多个待预测地区的电力历史负荷实测数据,包括功率数据;
从气象预报部门获取各地区对应时间段的天气预报数据,包括温度、降水;
电力历史负荷实测数据和对应时间段的天气预报数据均为时间序列。
3.根据权利要求1所述的一种短期负荷概率预测方法,其特征在于,
所述对所述电力历史负荷实测数据和对应时间段的天气预报数据进行处理得到数据样本,包括:
对所述电力历史负荷实测数据和对应时间段的天气预报数据进行预处理,包括异常值和缺失值的检测和处理,以及对电力历史负荷实测数据和天气预报数据进行归一化,产生输入特征;接着将整个数据集划分为用于训练模型可学习参数的训练集、用于超参数寻优的验证集和用于评估模型效果的测试集;在各个数据集上利用滑动窗口法产生固定长度的训练样本、验证样本和测试样本。
4.根据权利要求3所述的一种短期负荷概率预测方法,其特征在于,
所述在各个数据集上利用滑动窗口法产生固定长度的训练样本、验证样本和测试样本,包括:
以T为滑动窗口的窗口长度,t0为预测发布时刻;1:t0时段称为编码器部分,t0+1:T时段称为解码器部分,解码器部分对应着每个样本的预测时段;该滑动窗口通过依次向前移动一定单位来产生所需样本;得到训练样本、验证样本和测试样本。
5.根据权利要求3所述的一种短期负荷概率预测方法,其特征在于,
所述输入特征包括:一是时间变量,包括月份、星期几、小时数对应的傅里叶项;二是天气预报变量,包括温度、降水;三是负荷数据滞后项,包括过去三个时刻的负荷数值。
6.根据权利要求1所述的一种短期负荷概率预测方法,其特征在于,
所述基于所述数据样本对基础模型训练,得到短期负荷预测模型,包括:
确定短期负荷预测模型的超参数,采用网格搜索的方法进行超参数寻优,选择一组在验证集上结果满足要求的超参数作为最优超参数;
如果需要重新训练,将训练样本和验证样本合并为新的训练集,在确定的最优超参数的基础上通过最小化损失函数来重新估计短期负荷预测模型的可学习参数,得到最终的短期负荷预测模型;否则,直接将上步最优超参数对应的训练完成的模型作为最终的短期负荷预测模型。
7.根据权利要求6所述的一种短期负荷概率预测方法,其特征在于,
所述超参数分为两类,一类是网络结构超参数,包括专家网络数量、专家网络和塔网络中RNN的层数和每层神经元个数、滑动窗口长度;另一类是优化参数,包括学习率、迭代次数、小批量样本数量和丢弃率。
8.根据权利要求1所述的一种短期负荷概率预测方法,其特征在于,
所述的短期负荷预测模型包括两部分:
第一部分是将深度循环神经网络作为基础来产生负荷概率预测结果,假设电力历史负荷实测数据的概率分布服从正态分布,利用深度循环神经网络结构实现输入特征和分布参数之间的映射;
深度循环神经网络包括输入层、隐藏层和输出层,隐藏层的输入包括当前时刻的输入和上一时刻隐藏层的输出,深度循环神经网络选择长短期记忆作为基本单元,对于时刻t,该网络首先根据式(1)对此时的隐藏状态进行更新,
ht=L(ht-1,lt-Δt:t-1,xt;Θlstm) (1)
式中,L(·)表示LSTM单元的计算函数,参数是Θlstm;ht-1和ht分别是t-1时刻和t时刻的隐藏状态;lt-Δt:t-1是滞后Δt个时间点以内的负荷值;xt是t时刻除滞后项以外的输入特征,包括时间特征和天气预报特征两类;
然后网络将隐藏状态映射为当前时刻的负荷分布参数,
式中,O(·)是仿射函数,它的参数是Θo;是概率分布的分布参数,正态分布包括均值μt和标准差σt两个参数,并在输出层添加softplus激活函数来确保σt大于零,则当前时刻负荷的概率分布为:
第二部分是在深度循环神经网络的基础上加入多任务学习框架,对多个待预测地区的电力历史负荷实测数据进行共同训练;选择MMoE作为基本的多任务学习框架,包括多个专家网络、门控网络和对应各个预测任务的塔网络;
若有来自N个待预测地区的负荷数据,对于时刻t,各个专家网络根据式(4)对此时的隐藏状态进行更新,
式中,表示第m个专家网络,是由LSTM单元构成的RNN网络,其参数是/> 和分别是t-1时刻和t时刻该专家网络的隐藏状态;/>和/>是t时刻第n个预测任务对应的负荷滞后值和其余输入特征;
同时,各个门控网络根据当前输入计算一组权重,
式中,表示第n个预测任务对应的门控网络,是仿射函数,它的参数是/> 包括M个权重,分别对应M个专家网络,其中第m个元素/>表示选择专家网络/>的概率;为了满足/>添加softmax激活函数;第n个塔网络的输入/>便是专家网络输出的加权组合,
各个塔网络首先根据式(7)对此时的隐藏状态进行更新,然后根据式(8)将隐藏状态映射为对应预测任务在当前时刻的负荷分布参数,
式中,和/>表示第n个预测任务对应的RNN网络和仿射网络,参数分别是/>和 是第n个预测任务在t时刻的负荷分布参数,通过式(3)计算此时的负荷分布。
9.根据权利要求1所述的一种短期负荷概率预测方法,其特征在于,
所述获取待预测时间段内待预测地区的天气预报数据,输入所述短期负荷预测模型中计算得到负荷预测结果,包括:
在t0之后的每个时刻,短期负荷预测模型对预测的负荷分布函数进行随机采样获得该时刻的功率场景,这个场景被传递到后续时刻代替负荷历史观测值作为输入量,然后重复此过程直到末尾时刻T,通过多次序贯采样,计算各个预测时刻采样值的均值和标准差作为该时刻负荷的分布参数。
10.一种短期负荷概率预测方系统,其特征在于,包括:
采集模块,用于采集多个待预测地区的电力历史负荷实测数据和对应时间段的天气预报数据;
处理模块,用于对所述电力历史负荷实测数据和对应时间段的天气预报数据进行处理得到数据样本;
训练模块,用于基于所述数据样本对基础模型训练,得到短期负荷预测模型;所述基础模型采用深度循环神经网络RNN作为基础,并加入多任务学习框架;
预测模块,用于确定预测发布时刻,获取待预测时间段内待预测地区的天气预报数据,输入所述短期负荷预测模型中计算得到负荷预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310814016.5A CN116865251A (zh) | 2023-07-04 | 2023-07-04 | 一种短期负荷概率预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310814016.5A CN116865251A (zh) | 2023-07-04 | 2023-07-04 | 一种短期负荷概率预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116865251A true CN116865251A (zh) | 2023-10-10 |
Family
ID=88229758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310814016.5A Pending CN116865251A (zh) | 2023-07-04 | 2023-07-04 | 一种短期负荷概率预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116865251A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117290810A (zh) * | 2023-11-27 | 2023-12-26 | 南京气象科技创新研究院 | 基于循环卷积神经网络的短时强降水概率预报融合方法 |
CN117923331A (zh) * | 2024-01-23 | 2024-04-26 | 山东衡昊信息技术有限公司 | 一种基于吊车吊装的负荷控制系统及方法 |
CN117977584A (zh) * | 2024-04-02 | 2024-05-03 | 山东大学 | 电力负荷概率预测方法、系统、介质、设备及程序产品 |
CN118036816A (zh) * | 2024-03-04 | 2024-05-14 | 国网山东省电力公司青岛供电公司 | 新型电力系统负荷在线预测方法 |
-
2023
- 2023-07-04 CN CN202310814016.5A patent/CN116865251A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117290810A (zh) * | 2023-11-27 | 2023-12-26 | 南京气象科技创新研究院 | 基于循环卷积神经网络的短时强降水概率预报融合方法 |
CN117290810B (zh) * | 2023-11-27 | 2024-02-02 | 南京气象科技创新研究院 | 基于循环卷积神经网络的短时强降水概率预报融合方法 |
CN117923331A (zh) * | 2024-01-23 | 2024-04-26 | 山东衡昊信息技术有限公司 | 一种基于吊车吊装的负荷控制系统及方法 |
CN118036816A (zh) * | 2024-03-04 | 2024-05-14 | 国网山东省电力公司青岛供电公司 | 新型电力系统负荷在线预测方法 |
CN117977584A (zh) * | 2024-04-02 | 2024-05-03 | 山东大学 | 电力负荷概率预测方法、系统、介质、设备及程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lin et al. | An efficient deep reinforcement learning model for urban traffic control | |
CN116865251A (zh) | 一种短期负荷概率预测方法及系统 | |
CN111967688B (zh) | 一种基于卡尔曼滤波器与卷积神经网络的电力负荷预测方法 | |
CN112633604B (zh) | 一种基于i-lstm的短期用电量预测方法 | |
CN108596327B (zh) | 一种基于深度学习的地震速度谱人工智能拾取方法 | |
CN115622047B (zh) | 基于Transformer模型的电力变压器负荷预测方法 | |
CN110212524A (zh) | 一种区域电力负荷预测方法 | |
CN110443417A (zh) | 基于小波变换的多模型集成负荷预测方法 | |
CN106022549A (zh) | 基于神经网络和思维演化搜索的短期负荷预测方法 | |
KR102198302B1 (ko) | 성장 예측 방법 및 그 장치 | |
CN111461463A (zh) | 一种基于tcn-bp的短期负荷预测方法、系统及设备 | |
CN106529185B (zh) | 一种古建筑位移的组合预测方法及系统 | |
CN112381320A (zh) | 一种社区人员流量预测方法、系统、存储介质及设备 | |
CN114169416B (zh) | 一种基于迁移学习的小样本集下短期负荷预测方法 | |
CN110674965A (zh) | 基于动态特征选取的多时间步长风功率预测方法 | |
CN113837488B (zh) | 能源消耗数据预测方法、系统、设备 | |
CN115542429A (zh) | 一种基于XGBoost的臭氧质量预测方法及系统 | |
CN116306229A (zh) | 一种基于深度强化学习和迁移学习电力短期负荷预测方法 | |
CN116244647A (zh) | 一种无人机集群的运行状态估计方法 | |
CN113240181B (zh) | 一种水库调度运行滚动模拟方法及装置 | |
CN113076587A (zh) | 一种大跨度钢结构建筑微应变的短期预测方法 | |
CN113053536A (zh) | 一种基于隐马尔科夫模型的传染病预测方法、系统和介质 | |
CN116628444A (zh) | 一种基于改进元学习的水质预警方法 | |
CN116663709A (zh) | 一种基于强化解码器的电力负荷多步预测方法和装置 | |
CN110232437A (zh) | 基于cnn的时间序列预测方法和模型确定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |