CN115660161A - 一种基于时序融合Transformer模型的中期小时级负荷概率预测方法 - Google Patents

一种基于时序融合Transformer模型的中期小时级负荷概率预测方法 Download PDF

Info

Publication number
CN115660161A
CN115660161A CN202211274642.1A CN202211274642A CN115660161A CN 115660161 A CN115660161 A CN 115660161A CN 202211274642 A CN202211274642 A CN 202211274642A CN 115660161 A CN115660161 A CN 115660161A
Authority
CN
China
Prior art keywords
input
time
model
prediction
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211274642.1A
Other languages
English (en)
Inventor
李丹
谭雅
张远航
缪书唯
孙光帆
章可
贺帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Three Gorges University CTGU
Original Assignee
China Three Gorges University CTGU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Three Gorges University CTGU filed Critical China Three Gorges University CTGU
Priority to CN202211274642.1A priority Critical patent/CN115660161A/zh
Publication of CN115660161A publication Critical patent/CN115660161A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于时序融合Transformer模型的中期小时级负荷概率预测方法,包括采集某地区多个历史样本日的负荷值及相关影响因素数据;对输入数据进行分类,并将原始负荷数据重构为面板数据矩阵以缩短时间序列的长度,从而降低模型复杂度;对输入数据进行归一化,将数据集划分为训练集、验证集和测试集;设定模型超参数;建立时序融合Transformer模型;基于训练集对模型进行迭代训练,确定模型的最佳权重及偏置参数集;基于验证集优选出模型的最佳超参数,并基于最佳超参数对预测模型再训练;基于训练后的预测模型在测试集上验证模型性能。本发明提出的概率负荷预测方法可为电网运营商在中期电力优化调度和市场交易中提供更准确、更详细的负荷预测信息。

Description

一种基于时序融合Transformer模型的中期小时级负荷概率 预测方法
技术领域
本发明属于电力系统技术领域,尤其涉及电力负荷预测技术,具体涉及一种基于时序融合Transformer模型的中期小时级负荷概率预测方法。
背景技术
随着社会现代化和经济发展,国民生活越来越依赖于电力。准确的负荷预测有助于提高电力设备的利用率,并最大程度地减少能源浪费,也可以使调度人员制定适当的电网运维计划,以降低发电成本并促进电力供应。中期负荷预测的预测范围是一周到一年,它可以为制定未来发展规划、指导电力生产和规避市场风险提供必要的参考。
目前,中期负荷预测存在一些挑战:
1)随着分布式可再生能源增多和需求侧响应的实施,可再生能源发电的不确定性和个体用户响应行为的差异增加了负荷预测的复杂性和不确定性;
2)随着预测范围的延长,可用信息急剧减少;
3)电力系统规划中对中期负荷预测的要求不断增加,需要更长的预测范围和更精细的时间分辨率。
当前的中期负荷预测研究主要集中在点预测上,而概率预测可以提供更多信息来量化未来负荷的不确定性。在当前的负荷概率预测研究中,主要使用区间估计、核密度估计和分位数回归等方法。其中区间估计是指给定某个置信水平,预测该置信水平下区间的上限和下限,该方法无法详细说明预测结果的概率分布。核密度估计可以估计预测值的概率密度函数,但它依赖于大量的样本且带宽的选择比较困难。而分位数回归可直接解释不同分位点下响应变量和因变量之间的关系,成为近年来负荷概率预测文献关注的热点。但传统分位数回归的分位数预测值之间存在交叉的现象导致预测结果存在一定的不合理性。
例如刘新志等人提出的《基于Attention-ResNet-LSTM网络的中期负荷预测模型》公开了一种基于Attention-ResNet-LSTM网络的中期负荷预测模型;将Attention机制引入LSTM模型,赋予不同的权重于特征向量,加入ResNet网络后算出日负荷的预测值。但其时间分辨率较为粗糙,且其结果以确定性的形式给出,不能量化负荷预测的不确定性。
因此,本发明提出一种基于时序融合Transformer模型的中期小时级负荷概率预测方法。
发明内容
本发明主要针对上述现有中期概率负荷预测方法存在的时间分辨率粗糙、负荷不确定性量化问题,提出一种基于时序融合Transformer模型的中期小时级负荷概率预测方法,本发明精细化时间分辨率为小时级及以下,并改进分位数概率预测方法存在的分位数交叉问题来更好地量化负荷的不确定性。
一种基于时序融合Transformer模型的中期小时级负荷概率预测方法,它包括以下步骤:
步骤1:采集目标地区多个历史样本日的小时级负荷功率值及相关影响因素数据;
步骤2:将原始负荷数据重构为面板数据矩阵,并对输入数据进行分类,分为时变输入和静态协变量输入(时刻点对应的数据标签),时变输入分为已知输入(可以提前获得,包括日历特征和可预测的天气信息)和观测到的输入(仅在当前时间步获得且事先未知,包括负荷);
步骤3:对输入数据进行归一化变换,将数据集划分为训练集、验证集和测试集;
步骤4:设定模型超参数,如隐含层神经元的个数、学习率、编码器输入序列的长度、解码器输入序列的长度;
步骤5:建立时序融合Transformer模型,包括输入特征解释模块、多时间步融合模块;
步骤6:基于训练集根据损失函数对时序融合Transformer模型进行迭代训练,运用常规的梯度下降算法确定模型的最佳权重及偏置参数集;
步骤7:将验证集样本输入训练好的时序融合Transformer模型,根据验证集的误差优选出模型的最佳超参数,并基于最佳超参数对预测模型再训练;
步骤8:基于测试集利用训练好的时序融合Transformer模型对未来一个月各时刻负荷在不同分位点下的功率值进行预测,并对输出的预测结果进行反归一化,得到各预测时刻在不同分位点下的负荷预测值。
在步骤2中,对原始负荷数据的重构的目的是缩短模型要处理的时间序列长度,从而降低模型复杂度,具体地,原始的单变量时间序列[y1,y2,...,yn×m]被重构为面板数据矩阵Y∈Rm×n,其公式如下:
Figure BDA0003896544420000021
式中,y表示负荷值,n和m分别为天数及一天中的时刻点数,t表示第t天,s代表时刻点标签,也是模型的静态协变量输入;与时间相关的输入χs,t=[Zs,t,Xs,t]包括两个部分,观测到的输入Zs,t(仅在该时间步可用且事先未知)和已知输入Xs,t(外部变量,包括日历特征和可预测的天气特征)。
在步骤5中,建立的时序融合Transformer模型包括编码器、解码器、输入特征解释模块、门控循环单元(Gatedrecurrentunit,GRU)层、多时间步融合模块及线性映射模块。具体地,编码器由输入特征解释模块及两层GRU组成,解码器也由输入特征解释模块及两层GRU组成,但它们的权重及偏置参数不共享。
(1)输入特征解释模块用来解释各输入变量对输出的贡献,使得模型具有更强的可解释性,缓解了深度学习中的“黑匣子”问题。其主要公式如下:
γ=dropout(W2(ELU(W1s+b1))+b2)
cs=LayerNom(s+σ(W3γ+b3)⊙(W4γ+b4))
vt=softmax(dropout(W6(ELU(W5(Xt,cs)+b5))+b6))
Figure BDA0003896544420000031
其中,Xt=[x1,t,x2,t,...,xk,t]T为t时刻k个特征组成的输入向量,
Figure BDA0003896544420000032
是经输入特征解释模块处理后的送入其它模块的向量,cs是由静态协变量s经门控残差过程处理后的context向量(如上式所示),γ是中间变量,σ(·)是sigmoid激活函数;vt是对应于输入变量的权重向量,代表每个输入特征的重要程度;W*和b*分别是对应层的权重矩阵和偏置向量,LayerNorm表示标准的层归一化操作,ELU代表指数线性单元激活函数,dropout和softmax分别表示常规的dropout操作和softmax激活函数。
(2)GRU层用于处理时间信息。它通过保留先前有用的信息同时丢弃不相关的信息来克服循环神经网络(recurrent neural network,RNN)中的梯度消失问题。在结构上,GRU有两个门:更新门和重置门。重置门确定新输入信息如何与先前的记忆整合,而更新门定义保存到当前时间步的先前记忆的量。其核心原理如下:
zt=σ(Wz[ht-1,xt])
rt=σ(Wr[ht-1,xt])
Figure BDA0003896544420000033
Figure BDA0003896544420000034
其中,xt是当前输入,zt和rt分别是更新门输出和重置门输出,ht和ht-1分别表示t时刻和t-1时刻的隐含层状态,
Figure BDA0003896544420000035
是中间变量,Wz和Wr是对应门的权重矩阵,
Figure BDA0003896544420000036
表示Hadamard乘积,tanh表示常规的tanh激活函数。
(3)多时间步融合模块用来学习不同时间步之间的长期依赖关系,它可以根据不同时间步的重要程度对当前预测时间步之前的所有时间步的编码器和解码器的输出进行加权。然后将加权后的输出作为解码器当前预测时间步的输入,让模型专注于更重要的信息。其主要公式如下:
Attention(Q,K,V)=A(Q,K)V
Figure BDA0003896544420000037
Figure BDA0003896544420000038
Figure BDA0003896544420000039
其中,A(·)是归一化函数,n是K矩阵对应的向量的维数,hm是头的个数,Q、K和V分别由输入矩阵X分别与对应的权重矩阵相乘得到,
Figure BDA0003896544420000041
分别是Q和K的第h个头的权重矩阵,WV是所有头共享的权值矩阵V,
Figure BDA0003896544420000042
是中间变量,
Figure BDA0003896544420000043
是最终线性映射的权重矩阵。
在步骤6中,基于训练集根据损失函数对时序融合Transformer模型进行迭代训练,运用常规的梯度下降算法确定模型的最佳权重及偏置参数集。具体地,根据损失函数,运用常规的梯度下降算法对权重、偏置参数不断更新。其中本方法采用的损失函数为加入了分位数约束和预测区间惩罚项的损失函数,其优势是在避免分位数交叉的同时构建更紧凑的预测区间。具体地,假设概率点τi下的分位数损失函数定义为loss(τi)。在常用的分位数预测中,将一系列概率点0<τ1<···<τi···<τr<1下的所有分位数损失的平均值作为联合分位数损失函数
Figure BDA0003896544420000044
如下式所示:
Figure BDA0003896544420000045
Figure BDA0003896544420000046
其中
Figure BDA0003896544420000047
是概率点τi下yt的条件分位数,N是样本数,r是分位点的个数,a是中间变量。根据分位数的固有性质,对于每个概率点τ,yt的条件分位数必须满足以下要求:
Figure BDA0003896544420000048
为了提高预测结果的合理性,本发明在原始分位数损失函数中加入了违反分位数约束的惩罚项,以尽可能消除相邻分位数之间的交叉。但是,一旦加入分位数约束,预测区间将不可避免地变宽。为了得到更紧凑的预测区间,相应的预测区间惩罚项也被引入到损失函数中。则最终改进后的损失函数L如下所示:
Figure BDA0003896544420000049
其中惩罚系数W1,i和bi由不同概率点下分位数损失之间的关系分析推导得到(推导过程见具体实施方式);W2是一个比例因子,用来确保损失函数中大括号内作加法处理的两项具有相似的值,而cj=τr+1-jj用于确保随着置信区间的增大,预测区间惩罚项的权重更大。
与现有技术相比,本发明具有如下技术效果:
1)本发明基于负荷的日周期性,将原始的小时级负荷时间序列重构为面板数据矩阵,然后将时刻点作为预测模型的静态协变量输入,缩短了时间序列的长度,降低了计算成本,同时保留了日间负荷的差异性;
2)本发明利用输入特征解释模块使得模型具有更强的可解释性,每个输入变量对输出的贡献显而易见;利用多时间步融合模块使得模型可以关注到更有价值的信息,提高了模型的预测精度;
3)本发明利用时序融合Transformer模型进行中期小时级负荷的概率预测,在分位数损失函数中加入了分位数约束和预测区间惩罚项,避免了分位数预测值之间的交叉,使得预测结果更合理的同时预测区间也更加紧凑;
4)本发明提出的基于时序融合Transformer模型的中期小时级负荷概率预测方法具有更精细的时间分辨率和更高的预测精度,可为电网运营商在中期电力优化调度和市场交易中提供更准确、更详细的负荷预测信息。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1为中期负荷时间序列预测问题的描述示意图;
图2为时序融合Transformer模型图;
图3为GRU的结构示意图;
图4为多时间步融合模块的示意图;
图5为算例1测试集中半个月的预测区间图;
图6为算例2测试集中半个月的预测区间图;
图7-12为两个算例XQS,XCS,XQCS指标的箱型图;
图13为算例1中Transformer模型一天的预测曲线对比图;
图14-15为XPINRW指标的对比图;
图16为预测范围为1-30天的误差对比图。
具体实施方式
如图1所示,图1是对中期负荷时间序列预测问题的描述,预测器f的目的是同时预测接下来To天的每个时间点的负荷[ys,t,...,ys,t+τ,...,ys,t+To-1]。在给定的负荷时间序列数据集中,与时间相关的输入特征χs,t=[Zs,t,Xs,t]包括两类。观测到的输入Zs,t,仅在该时间步可用且事先未知(例如负荷)。已知输入Xs,t,可以提前获得(例如,外部变量,包括日历特征和可预测的天气信息)。则负荷预测值可以通过参数集为Θ的预测模型来估计:
Figure BDA0003896544420000051
其中,τ表示天数,s表示时刻点标签,Θ表示步骤6中优选后的参数集。
如图2所示,基于时序融合Transformer模型的中期小时级负荷概率预测方法,包括以下步骤,
步骤1:分别采集某实际地区A2016年1月1日至2017年6月30日每15分钟的负荷数据和某实际地区B2004年1月1日至2009年12月31日每小时的负荷数据。某实际地区A作为算例1,某实际地区B作为算例2。两个算例的特征描述及模型的输入输出如表1所示,其中Tt表示预测日各时刻气温,Rt表示M个分区的降雨量,St表示对应的预测时刻点,Ys,t表示模型输入的历史负荷值;Sea表示季节类型,1代表冬季,2代表春秋两季,3代表夏季;Holi代表假期类型,0表示节假日,1表示非节假日;Week代表星期类型,1-7分别代表周一到周日。
表1两个算例的特征描述
Figure BDA0003896544420000061
步骤2:将原始负荷数据重构为面板数据矩阵,并对输入数据进行分类,分为时变输入和静态协变量输入,时变输入又分为已知输入和观测到的输入。对原始负荷数据的重构的目的是缩短模型要处理的时间序列长度,具体地,原始的单变量时间序列[y1,y2,...,yn×m]被重构为面板数据矩阵Y∈Rm×n,其公式如下:
Figure BDA0003896544420000062
式中,y表示负荷值,n和m分别为天数及一天中的时刻点数;s代表时刻点标签,即模型的静态协变量输入。与时间相关的输入χs,t=[Zs,t,Xs,t]包括两个部分,观测到的输入Zs,t(仅在该时间步可用且事先未知)和已知输入Xs,t(外部变量,包括日历特征和可预测的天气特征)。
步骤3:对输入数据进行预处理,对连续性变量如气温、降雨量和历史负荷数据等采用最大最小归一化,其公式如下:
Figure BDA0003896544420000063
其中,xnorm是归一化之后的数据。对季节类型、星期类型等离散型变量,采用正弦余弦循环编码器编码,其公式如下:
[sin(2πx/xmax),cos(2πx/xmax)]
其中,x代表索引数,xmax代表索引数的最大值。对季节类型进行编码时,x∈{1,2,3};对星期类型进行编码时,x∈{1,.....,7}。对假期类型,利用one-hot编码,节假日编码为0,非节假日编码为1。对数据集按照8:1:1的比例分为训练集、验证集和测试集。
步骤4:设定模型超参数,包括隐含层神经元的个数80、学习率0.01、编码器输入序列的长度60、解码器输入序列的长度30等。
步骤5:建立时序融合Transformer模型,如图2所示,时序融合Transformer模型包括编码器、解码器、输入特征解释模块、GRU层、多时间步融合模块及线性映射模块。具体地,编码器由输入特征解释模块及两层GRU组成,解码器也由输入特征解释模块及两层GRU组成,但它们的权重及偏置参数不共享。
步骤5.1:与时间相关的输入特征χs,t-Ti:t-1和Xs,t:t+To-1被分别送入两个没有共享参数的输入特征解释模块,如图2所示。输入特征解释模块用来解释各输入变量对输出的贡献,转换后的变量
Figure BDA0003896544420000071
被送入下一模块。其主要公式如下:
γ=dropout(W2(ELU(W1s+b1))+b2)
cs=LayerNom(s+σ(W3γ+b3)⊙(W4γ+b4))
vt=softmax(dropout(W6(ELU(W5(Xt,cs)+b5))+b6))
Figure BDA0003896544420000072
其中,Xt=[x1,t,x2,t,...,xk,t]T为t时刻k个特征组成的输入向量,cs是由静态协变量s经门控残差过程处理后的context向量,γ是中间变量,σ(·)是sigmoid激活函数;vt是对应于输入变量的权重向量,代表每个输入特征的重要程度;W*和b*分别是对应层的权重矩阵和偏置向量,LayerNorm表示标准的层归一化操作,ELU代表指数线性单元激活函数。
步骤5.2:经输入特征解释模块转换后的输入
Figure BDA0003896544420000073
被分别送入两层GRU中,用于更有效地处理长期时间序列中的时间信息。GRU通过保留先前有用的信息同时丢弃不相关的信息来克服RNN中的梯度消失问题。在结构上,GRU有两个门:更新门和重置门,如图3所示。重置门确定新输入信息如何与先前的记忆整合,而更新门定义保存到当前时间步的先前记忆的量。其核心原理如下:
zt=σ(Wz[ht-1,xt])
rt=σ(Wr[ht-1,xt])
Figure BDA0003896544420000074
Figure BDA0003896544420000075
其中,xt是当前输入,zt和rt分别是更新门输出和重置门输出,ht和ht-1分别表示t时刻和t-1时刻的隐含层状态,
Figure BDA0003896544420000081
是中间变量,Wz和Wr是对应门的权重矩阵,
Figure BDA0003896544420000082
表示Hadamard乘积。
步骤5.3:编码器和解码器中最后一层GRU的输出被集成到多时间步融合模块中。多时间步融合模块用来学习不同时间步之间的长期关系,它可以根据不同时间步的重要程度对当前预测时间步之前的所有时间步的编码器和解码器的输出进行加权,如图4所示。然后将加权后的输出作为解码器当前预测时间步的输入,让模型专注于更重要的信息。其主要公式如下:
Attention(Q,K,V)=A(Q,K)V
Figure BDA0003896544420000083
Figure BDA0003896544420000084
Figure BDA0003896544420000085
其中,A(·)是归一化函数,n是K矩阵对应的向量的维数,Q、K和V分别由输入矩阵X分别与对应的权重矩阵相乘得到,
Figure BDA0003896544420000086
分别是Q和K的第h个头的权重矩阵,WV是所有头共享的权值矩阵V,
Figure BDA0003896544420000087
是最终线性映射的权重矩阵。
步骤5.4:通过对多时间步融合模块的输出进行线性映射得到分位数预测结果。
步骤6:基于训练集对时序融合Transformer模型进行迭代训练,根据损失函数,运用梯度下降算法对权重、偏置参数不断更新,最终确定模型的最佳权重及偏置参数集。本发明采用的损失函数为加入了分位数约束和预测区间惩罚项的损失函数,在避免分位数交叉的同时构建更紧凑的预测区间。具体地,假设概率点τi下的分位数损失函数定义为loss(τi)。在常用的分位数预测中,将一系列概率点0<τ1<···<τi···<τr<1下的所有分位数损失的平均值作为联合分位数损失函数,如下式所示:
Figure BDA0003896544420000088
Figure BDA0003896544420000089
其中
Figure BDA00038965444200000810
是概率点τi下yt的条件分位数,N是样本数,r是分位点的个数。根据分位数的固有性质,对于每个概率点τ,yt的条件分位数必须满足以下要求:
Figure BDA00038965444200000811
为了提高结果的合理性,在原始分位数损失函数中加入了违反分位数约束的惩罚项,以尽可能消除相邻分位数之间的分位数交叉。但是,一旦加入分位数约束,预测区间将不可避免地变宽。为了得到更紧凑的预测区间,相应的预测区间惩罚项也被引入到损失函数中。则最终改进后的损失函数如下所示:
Figure BDA0003896544420000091
其中W2是一个比例因子,确保损失函数中的两项具有相似的值,而cj=τr+1-jj用于确保随着置信区间的增大,预测区间惩罚项的权重更大。惩罚系数W1,i和bi由下面分析得到。定义Δloss(τi)=loss(τi)-loss(τi-1),则根据不同概率点下分位数损失之间的关系,原始分位数损失函数可转化为
Figure BDA0003896544420000092
Figure BDA0003896544420000093
即相邻概率的预测分位数违反了约束关系,则:
Figure BDA0003896544420000094
其中θ=τii-1是相邻两个分位数点之间的步长。当违反分位数约束,且τi≤0.5,
Figure BDA0003896544420000095
损失
Figure BDA0003896544420000096
将会减少
Figure BDA0003896544420000097
当τi≤0.5,
Figure BDA0003896544420000098
损失
Figure BDA0003896544420000099
将会减少
Figure BDA00038965444200000910
当τi>0.5,
Figure BDA00038965444200000911
损失
Figure BDA00038965444200000912
将会减少
Figure BDA00038965444200000913
显然,在违反分位数约束时减少的损失值是不合理的。因此,为了补偿不合理的损失下降,结合分析,推导出惩罚系数W1,i和bi为:
Figure BDA00038965444200000914
Figure BDA0003896544420000101
步骤7:将验证集样本输入训练好的时序融合Transformer模型,根据验证集的误差优选出模型的最佳超参数,并基于最佳超参数对预测模型再训练;
步骤8:基于测试集利用训练好的时序融合Transformer模型进行预测,并对输出的预测结果进行反归一化,得到各预测时刻在不同分位点下的负荷预测值。
图5和图6分别将算例1和算例2中时序融合Transformer模型获得的提前30天的预测曲线与测试集半个月内的实际负荷曲线进行了比较。可以看出,代表负荷点预测结果的中值曲线(实线)与实际负荷曲线具有相似的变化规律。预测区间可以在大多数时间点下充分覆盖实际负荷曲线(虚线),并且置信度较低的预测区间很好地嵌入在置信度较高的预测区间中。另外,预测区间在波峰处较宽,在波谷和过渡处较窄(在算例2中尤其明显),这表明峰值负荷的不确定性相对较高,使得预测更加困难。此外,算例2主要是住宅用电,负荷变化更规律,而算例1主要是工业用电,具有较高的不确定性和较弱的周期特性。
表2各模型评价指标及训练时间对比
Figure BDA0003896544420000102
表2所示为各模型的评价指标和训练时间,最佳值用加粗表示。为使绘图清晰美观,在图7-12、图14-15中,用模型1-5分别表示TFT、QRNN、TCN、Transformer和时序融合Transformer模型。图7-12所示为两个算例的XQS、XCS和XQCS的箱线图,描绘了这些评估指标的分布,较窄的部分以局部放大的形式在灰色箭头上方给出。图13所示为算例1中Transformer模型在不同分位点下一天的预测曲线。图14-15所示为不同置信水平下的预测区间锐度XPINRW曲线。对于XQS、XCS和XQCS,表2和图7-12表明时序融合Transformer模型优于其他模型。时序融合Transformer模型在图7-12中的位置最低,异常值少,四分位距短,表明其误差最小,性能更稳定。QRNN模型的误差更大,TFT和Transformer模型的四分位距更宽,TCN模型的异常值更多。使用原始分位数损失函数的QRNN、TCN、TFT和Transformer模型具有更高的XCS,这表明它的合理性欠佳。图13将Transformer模型的两条分位数预测曲线与实际曲线(灰色较细实线)进行了比较,如图13所示,0.55概率点的分位数曲线在某些时间点(阴影部分)小于0.45概率点的分位数曲线,这是不合理的。相比之下,时序融合Transformer模型可以避免分位数之间的交叉,提高了模型的可靠性。在预测区间锐度方面,表2和图14-15表明TCN模型在所有置信度下都最低,但其XCS误差大表明它牺牲了分位数合理性。在预测区间覆盖率PICP方面,表2显示时序融合Transformer模型和QRNN模型比其他模型具有更小的XAD和XMD,说明实际负荷值落在时序融合Transformer模型和QRNN模型的预测区间中的比例更符合相应的置信水平,并且它们的预测区间更可靠。
图16所示为算例1在预测范围为1天到30天时50%和90%置信度下的每天的XQCS和XPINRW指标情况。除了第15-19天的暂时性上涨外,XPINRW在50%和90%置信度下均呈下降趋势,并且在第15天左右达到最小值,这是因为模型的训练作为整体进行,并且误差具有时间转移效应,使得模型在短时和中部预测范围的误差较低。相反,由于时间序列的长期依赖性难以捕捉,并且天气特征的预测误差增加,XQCS随着预测范围的增加而增大。此外,XPINRW和XQCS表现出相反的趋势,这是因为预测区间越紧凑,落在其中的点越少,模型的可靠性越低,因此随着预测范围的增加,当预测区间宽度越窄时,XQCS越高。

Claims (4)

1.一种基于时序融合Transformer模型的中期小时级负荷概率预测方法,其特征在于,它包括以下步骤:
步骤1:采集目标地区多个历史样本日的小时级负荷功率值及相关天气影响因素数据;
步骤2:将包括单变量负荷时间序列数据在内的原始负荷数据重构为面板数据矩阵,并对输入数据进行分类,分为时变输入和静态协变量输入,时变输入分为已知输入和观测到的输入;
步骤3:对输入数据进行归一化变换,将数据集划分为训练集、验证集和测试集;
步骤4:设定模型超参数,如隐含层神经元的个数、学习率、编码器输入序列的长度、解码器输入序列的长度;
步骤5:建立时序融合Transformer模型,包括输入特征解释模块、多时间步融合模块;
步骤6:基于训练集根据损失函数对时序融合Transformer模型进行迭代训练,运用常规的梯度下降算法确定模型的最佳权重及偏置参数集;
步骤7:将验证集样本输入训练好的时序融合Transformer模型,根据验证集的误差优选出模型的最佳超参数,并基于最佳超参数对预测模型再训练;
步骤8:基于测试集利用训练好的时序融合Transformer模型对未来一个月各时刻负荷在不同分位点下的功率值进行预测,并对输出的预测结果进行反归一化,得到各预测时刻在不同分位点下的负荷预测值。
2.根据权利要求1所述的方法,其特征在于,在步骤2中,原始的单变量负荷时间序列[y1,y2,...,yn×m]被重构为面板数据矩阵Y∈Rm×n,其公式如下:
Figure FDA0003896544410000011
式中,y表示负荷值,n和m分别为天数及一天中的时刻点数,t表示第t天,s代表时刻点标签,也是模型的静态协变量输入;与时间相关的输入χs,t=[Zs,t,Xs,t]包括两个部分,观测到的输入Zs,t和已知输入Xs,t
3.根据权利要求1所述的方法,其特征在于,具体地,步骤5建立的时序融合Transformer模型主要包括输入特征解释模块、门控循环单元层、多时间步融合模块;
(1)输入特征解释模块用来解释各输入变量对输出的贡献,其公式包括:
γ=dropout(W2(ELU(W1s+b1))+b2)
cs=LayerNom(s+σ(W3γ+b3)⊙(W4γ+b4))
vt=softmax(dropout(W6(ELU(W5(Xt,cs)+b5))+b6))
Figure FDA0003896544410000021
其中,Xt=[x1,t,x2,t,...,xk,t]T为t时刻k个特征组成的输入向量,
Figure FDA0003896544410000022
是经输入特征解释模块处理后的送入其它模块的向量,cs是由静态协变量s经门控残差过程处理后的context向量,γ是中间变量,σ(·)是sigmoid激活函数;vt是对应于输入变量的权重向量,代表每个输入特征的重要程度;W*和b*分别是对应层的权重矩阵和偏置向量,LayerNorm表示标准的层归一化操作,ELU代表指数线性单元激活函数,dropout和softmax分别表示常规的dropout操作和softmax激活函数;
(2)门控循环单元层用于处理时间信息,其公式包括:
zt=σ(Wz[ht-1,xt])
rt=σ(Wr[ht-1,xt])
Figure FDA0003896544410000023
Figure FDA0003896544410000024
其中,xt是当前输入,zt和rt分别是更新门输出和重置门输出,ht和ht-1分别表示t时刻和t-1时刻的隐含层状态,
Figure FDA0003896544410000025
是中间变量,Wz和Wr是对应门的权重矩阵,
Figure FDA00038965444100000212
表示Hadamard乘积,tanh表示常规的tanh激活函数;
(3)多时间步融合模块用来学习不同时间步之间的长期依赖关系,其公式包括:
Attention(Q,K,V)=A(Q,K)V
Figure FDA0003896544410000026
Figure FDA0003896544410000027
Figure FDA0003896544410000028
其中,A(·)是归一化函数,n是K矩阵对应的向量的维数,hm是头的个数,Q、K和V分别由输入矩阵X分别与对应的权重矩阵相乘得到,
Figure FDA0003896544410000029
分别是Q和K的第h个头的权重矩阵,WV是所有头共享的权值矩阵V,
Figure FDA00038965444100000210
是中间变量,
Figure FDA00038965444100000211
是最终线性映射的权重矩阵。
4.根据权利要求1所述的方法,其特征在于,在步骤6中,基于训练集根据损失函数对时序融合Transformer模型进行迭代训练,运用常规的梯度下降算法确定模型的最佳权重及偏置参数集;
具体地,采用的损失函数为加入了分位数约束和预测区间惩罚项的损失函数,其优势是在避免分位数交叉的同时构建更紧凑的预测区间;
假设概率点τi下的分位数损失函数定义为loss(τi);在常用的分位数预测中,将一系列概率点0<τ1<···<τi···<τr<1下的所有分位数损失的平均值作为联合分位数损失函数l,如下式所示:
Figure FDA0003896544410000031
Figure FDA0003896544410000032
其中
Figure FDA0003896544410000033
是概率点τi下t时刻真实负荷值yt的条件分位数,N是样本数,r是分位点的个数,a是中间变量;根据分位数的固有性质,对于每个概率点τ,yt的条件分位数必须满足以下要求:
Figure FDA0003896544410000034
为了提高预测结果的合理性,在原始分位数损失函数中加入了违反分位数约束的惩罚项,以尽可能消除相邻分位数之间的交叉;为了得到更紧凑的预测区间,相应的预测区间惩罚项也被引入到损失函数中;则最终改进后的损失函数L如下所示:
Figure FDA0003896544410000035
其中W1,i和bi为惩罚系数;W2是一个比例因子,用来确保损失函数中大括号内作加法处理的两项具有相似的值,而cj=τr+1-jj用于确保随着置信区间的增大,预测区间惩罚项的权重更大。
CN202211274642.1A 2022-10-18 2022-10-18 一种基于时序融合Transformer模型的中期小时级负荷概率预测方法 Pending CN115660161A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211274642.1A CN115660161A (zh) 2022-10-18 2022-10-18 一种基于时序融合Transformer模型的中期小时级负荷概率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211274642.1A CN115660161A (zh) 2022-10-18 2022-10-18 一种基于时序融合Transformer模型的中期小时级负荷概率预测方法

Publications (1)

Publication Number Publication Date
CN115660161A true CN115660161A (zh) 2023-01-31

Family

ID=84990123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211274642.1A Pending CN115660161A (zh) 2022-10-18 2022-10-18 一种基于时序融合Transformer模型的中期小时级负荷概率预测方法

Country Status (1)

Country Link
CN (1) CN115660161A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115952928A (zh) * 2023-03-13 2023-04-11 广东电网有限责任公司佛山供电局 一种短期电力负荷预测方法、装置、设备及存储介质
CN116667326A (zh) * 2023-05-30 2023-08-29 淮阴工学院 一种电动汽车充电负荷预测方法
CN116730226A (zh) * 2023-08-16 2023-09-12 新疆塔林投资(集团)有限责任公司 悬臂起重机的安全智能监管系统及其方法
CN117013534A (zh) * 2023-09-26 2023-11-07 宁德时代新能源科技股份有限公司 发电功率预测方法、功率预测模型训练方法、装置和设备
CN117096875A (zh) * 2023-10-19 2023-11-21 国网江西省电力有限公司经济技术研究院 一种基于ST-Transformer模型的短期负荷预测方法及系统
CN117220318A (zh) * 2023-11-08 2023-12-12 国网浙江省电力有限公司宁波供电公司 电网数字化驱动控制方法及系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115952928A (zh) * 2023-03-13 2023-04-11 广东电网有限责任公司佛山供电局 一种短期电力负荷预测方法、装置、设备及存储介质
CN116667326A (zh) * 2023-05-30 2023-08-29 淮阴工学院 一种电动汽车充电负荷预测方法
CN116667326B (zh) * 2023-05-30 2024-02-23 淮阴工学院 一种电动汽车充电负荷预测方法
CN116730226A (zh) * 2023-08-16 2023-09-12 新疆塔林投资(集团)有限责任公司 悬臂起重机的安全智能监管系统及其方法
CN116730226B (zh) * 2023-08-16 2023-10-27 新疆塔林投资(集团)有限责任公司 悬臂起重机的安全智能监管系统及其方法
CN117013534A (zh) * 2023-09-26 2023-11-07 宁德时代新能源科技股份有限公司 发电功率预测方法、功率预测模型训练方法、装置和设备
CN117013534B (zh) * 2023-09-26 2024-02-20 宁德时代新能源科技股份有限公司 发电功率预测方法、功率预测模型训练方法、装置和设备
CN117096875A (zh) * 2023-10-19 2023-11-21 国网江西省电力有限公司经济技术研究院 一种基于ST-Transformer模型的短期负荷预测方法及系统
CN117096875B (zh) * 2023-10-19 2024-03-12 国网江西省电力有限公司经济技术研究院 一种基于Spatio-Temporal Transformer模型的短期负荷预测方法及系统
CN117220318A (zh) * 2023-11-08 2023-12-12 国网浙江省电力有限公司宁波供电公司 电网数字化驱动控制方法及系统
CN117220318B (zh) * 2023-11-08 2024-04-02 国网浙江省电力有限公司宁波供电公司 电网数字化驱动控制方法及系统

Similar Documents

Publication Publication Date Title
CN115660161A (zh) 一种基于时序融合Transformer模型的中期小时级负荷概率预测方法
CN113962364B (zh) 一种基于深度学习的多因素用电负荷预测方法
CN111260136A (zh) 一种基于arima-lstm组合模型的楼宇短期负荷预测方法
CN110348624B (zh) 一种基于Stacking集成策略的沙尘暴等级预测方法
CN112149879B (zh) 一种计及宏观波动性分类的新能源中长期电量预测方法
CN111160626B (zh) 一种基于分解融合的电力负荷时间序列控制方法
CN115622047A (zh) 基于Transformer模型的电力变压器负荷预测方法
CN115860177A (zh) 基于组合式机器学习模型光伏发电功率预测方法及其应用
CN115049113A (zh) 基于时间窗口和超参数自适应选择的s2s电力负荷预测系统
CN114117852B (zh) 一种基于有限差分工作域划分的区域热负荷滚动预测方法
CN115017970A (zh) 一种基于迁移学习的用气行为异常检测方法及系统
Yao et al. An integrated D-CNN-LSTM approach for short-term heat demand prediction in district heating systems
Kiruthiga et al. Intraday time series load forecasting using Bayesian deep learning method—a new approach
Mey et al. Prediction of energy consumption for variable customer portfolios including aleatoric uncertainty estimation
Sabri et al. Photovoltaic power forecasting with a long short-term memory autoencoder networks
Fatema et al. Analysing and forecasting electricity demand and price using deep learning model during the COVID-19 pandemic
CN116885699A (zh) 基于双重注意力机制的电力负荷预测方法
Ullah et al. Multi-horizon short-term load forecasting using hybrid of LSTM and modified split convolution
CN116703644A (zh) 一种基于Attention-RNN的短期电力负荷预测方法
Wang et al. A Transformer-based multi-entity load forecasting method for integrated energy systems
Al-Thelaya et al. Forecasting of bahrain stock market with deep learning: Methodology and case study
CN112529268B (zh) 一种基于流形学习的中短期负荷预测方法及装置
Cao et al. A hybrid electricity load prediction system based on weighted fuzzy time series and multi-objective differential evolution
Panda et al. Forecasting temperature anomalies of planet earth: A comparative analysis of ai models
Alikhani et al. Optimal demand response programs selection using CNN‐LSTM algorithm with big data analysis of load curves

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination