CN113344279A - 基于lstm-sam模型和池化的居民负荷预测方法 - Google Patents

基于lstm-sam模型和池化的居民负荷预测方法 Download PDF

Info

Publication number
CN113344279A
CN113344279A CN202110684640.9A CN202110684640A CN113344279A CN 113344279 A CN113344279 A CN 113344279A CN 202110684640 A CN202110684640 A CN 202110684640A CN 113344279 A CN113344279 A CN 113344279A
Authority
CN
China
Prior art keywords
load
lstm
pooling
time step
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110684640.9A
Other languages
English (en)
Other versions
CN113344279B (zh
Inventor
臧海祥
许瑞琦
刘冲冲
徐雨森
卫志农
孙国强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202110684640.9A priority Critical patent/CN113344279B/zh
Publication of CN113344279A publication Critical patent/CN113344279A/zh
Application granted granted Critical
Publication of CN113344279B publication Critical patent/CN113344279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明公开了基于LSTM‑SAM模型和池化的居民负荷预测方法,属于电力系统技术领域,通过获取多个居民用户的历史负荷数据和数值气象预报数据,随机选择某个用户作为目标用户;采用二阶段特征工程对每个用户的数据进行预处理;对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据;将训练数据池和目标用户的测试集数据输入LSTM‑SAM混合模型,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数。本发明提高了居民负荷的预测精度,为系统调度和需求响应实施提供指导,保障了电力系统的安全稳定经济运行。

Description

基于LSTM-SAM模型和池化的居民负荷预测方法
技术领域
本发明属于电力系统技术领域,涉及基于LSTM-SAM模型和池化的居民负荷预测方法。
背景技术
电力系统需要保持电力供应和电力需求间的动态平衡,负荷预测在维持电力系统稳定运行及指导电力调度中具有十分重要的现实意义。由于受到外部因素的影响,电力负荷具有一定的波动性和不确定性。相较于系统总负荷,用户级居民负荷由于缺少负荷平滑更加难以预测。此外,电力用户自发参与需求响应,导致居民负荷预测更加复杂。因此,研究精准的居民负荷预测方法是至关重要的。
现有负荷预测方法可分为传统统计方法和人工智能法。其中,传统的统计负荷预测方法容易实现,不需要获取额外的输入。但在很多情况下,由于只考虑了历史负荷数据,其准确性往往受到限制。基于人工智能的负荷预测方法可以将多个变量作为输入。具备非线性特征提取能力和容错能力的人工神经网络以及具有较强泛化能力的支持向量机是机器学习的常用算法,在小数据样本情况下表现性能优越。另一方面,高级量测体系的部署导致负荷数据量显著增加。大规模数据降低了机器学习的有效性,这一不足可通过采用深度学习算法进行克服,深度学习为有效处理海量数据提供了解决方案。相较于单一模型架构,混合模型集成了不同模型的优点,因而其预测性能得到改善,近年来被广泛关注并大量应用。除了开发性能更强的模型,改进模型输入是提高预测性能的另一种有效方法。特征工程作为一种构建有价值的模型输入的方法,已被深入研究,用于促进特征提取,提高模型泛化能力。在此背景下,使用基于LSTM-SAM模型和池化的居民负荷预测方法,以学习居民用户的用电行为特征,提高负荷预测的准确性,为电力系统运行和调度提供更可靠的指导。
发明内容
发明目的:本发明针对目前用户级居民负荷预测方法的不足,包括预测精度低、未利用除目标用户数据以外的有用信息等问题,提出基于LSTM-SAM模型和池化的居民负荷预测方法,基于LSTM-SAM混合模型,学习训练数据池中的隐藏信息,使得预测精度进一步提升。
技术方案:本发明提供了基于LSTM-SAM模型和池化的居民负荷预测方法,包括以下步骤:
(1)获取多个居民用户的历史负荷数据和数值气象预报数据,随机选择某个用户作为目标用户;
(2)采用二阶段特征工程对每个用户的数据进行预处理;
(3)对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据;
(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型,分别进行训练和预测,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数。
进一步地,步骤(2)采用二阶段特征工程对每个用户的数据进行预处理,所述二阶段特征工程方法为:
2.1历史负荷序列分解阶段,采用变分模态分解算法将观测到的负荷序列分解为多个频率分量,分别对各历史负荷分量进行后续数据预处理;
2.2多源输入维度重构阶段,分别对负荷分量和数值气象预报数据采用不同方法重构输入维度,具体方法如下:
2.2.1负荷分量输入维度重构方法:
假设待预测时刻为t,从第i个负荷分量中取一段固定长度的连续滞后负荷值,表示为:
Figure BDA0003124167560000021
i=1,2,3
其中,T是转置;
Figure BDA0003124167560000022
为待预测时刻t第i个负荷分量对应的滞后负荷时间序列;
Figure BDA0003124167560000023
是第i个负荷分量在时刻r的值,r=t-h-lag+1,t-h-lag+2,…,t-h;i是负荷分量的序号;lag是连续滞后负荷的数量;h是预测时间步长;
利用滑动窗口获取负荷数据,将获取的数据作为输入至LSTM网络一个时间步的特征向量,以一步为间隔连续滑动,获取输入至LSTM网络相邻时间步的特征向量,则第j个滑动窗口获取的向量为:
Figure BDA0003124167560000024
j=1,2,…,T0
其中,T是转置;
Figure BDA0003124167560000031
为第j个滑动窗口从待预测时刻t第i个负荷分量对应的滞后负荷时间序列中获取的向量;
Figure BDA0003124167560000032
为第i个负荷分量在时刻q的值,q=t-h-lag+j,t-h-lag+j+1,…,t-h-lag+j+n-1;j为滑动窗口的序号;n是滑动窗口的宽度;T0是滑动窗口的总数量,T0由连续滞后负荷的数量和滑动窗口的宽度决定:
T0=lag+1-n
将T0个滑动窗口获取的向量依次进行堆叠,构成如下二维特征图:
Figure BDA0003124167560000033
其中,T是转置;
Figure BDA0003124167560000034
为维度重构后待预测时刻t第i个负荷分量对应的二维输入特征,其大小为T0×n,分别对应LSTM输入中的时间步数和输入特征维度;
2.2.2数值气象预报输入维度重构方法:
融合预测时刻t的温度、相对湿度和风速预报值,并将融合后的结果重复T0次,则预测时刻t对应的二维气象特征为:
Figure BDA0003124167560000035
其中,NWPt为维度重构后待预测时刻t对应的数值气象预报特征,其大小为T0×3,T0是滑动窗口总数量;Tt、Ht和Wt分别指预测时刻t的温度、湿度和风速。
将该特征分别与预测时刻t各负荷分量的加权隐藏特征相结合。
进一步地,步骤(3)对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据,所述训练数据池构建包括:
3.1计算目标用户负荷序列和各非目标用户负荷序列的互信息,并按照互信息降序排列非目标用户,互信息计算公式为:
Figure BDA0003124167560000041
其中,Xz指第z个非目标用户的负荷数据,Y指目标用户的负荷数据,No是非目标用户的数量;
3.2将池化用户数k从1依次增加至其上限K,共形成K种池化组合。对于每种池化组合,先引入目标用户的数据,再根据排序结果从最大互信息对应的互联用户开始依次引入数据,直到引入池中的用户数量等于k;
3.3在每种池化组合中,对各池化用户经特征工程处理后的数据划分训练集和测试集,通过合并组内池化用户的训练集分别构建各负荷分量和数值气象预报的训练数据池,将其用于训练LSTM-SAM混合模型;保留目标用户的测试集数据,并将其应用于模型测试阶段,最佳池化用户个数通过比较测试集基于不同池化组合的误差指标获取。
进一步地,步骤(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型,分别进行训练和预测,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数,所述LSTM-SAM混合模型为:
4.1将LSTM模型作为混合模型的基础,LSTM模型中具体计算过程如下,假设LSTM的时间步数为Ts
fp=σ(Wfxp+Vfhp-1+bf)
C′p=tanh(Wcxp+Vchp-1+bc)
ip=σ(Wixp+Vihp-1+bi)
Cp=Cp-1⊙fp+ip⊙C′p
Op=σ(Woxp+Vohp-1+bo)
hp=Op⊙tanh(Cp)
其中,p=1,2,…,Ts,p为LSTM内时间步的序号;xp为对应时间步p的输入;hp-1为对应时间步p-1的隐藏状态;fp,ip和Op分别为对应时间步p的遗忘门输出、输入门输出和输出门输出;C′p为对应时间步p的记忆单元候选值;Cp为对应时间步p的记忆单元状态,hp为对应时间步p的隐藏状态;Vf,Vc,Vi和Vo分别为LSTM遗忘门、候选值、输入门和输出门的递归权重;Wf,Wc,Wi和Wo分别表示遗忘门、候选值、输入门和输出门的权重矩阵;bf,bc,bi和bo分别表示LSTM中遗忘门、候选值、输入门和输出门的偏置;σ(·)代表sigmoid激活函数,输出介于0和1之间,0表示将信息完全遗忘,1表示将信息全部保留;tanh(·)代表双曲正切激活函数;⊙代表逐点相乘;
4.2引入SAM,帮助LSTM识别输入重要性,SAM具体计算过程如下:
假设隐藏特征维度为m,计算不同时间步的隐藏特征相关性,则隐藏特征第d维第j个时间步的得分为:
sj,d=fsco(Wj,d[h1d,h2d,…,hTsd]),d=1,…,m,j=1,…Ts
其中,hjd为第d维第j个时间步的隐藏特征值;Wj,d为对应第d维第j个时间步得分的权重向量,在训练阶段学习;函数fsco(·)为得分函数;j为LSTM内时间步的序号;Ts为LSTM的时间步数;d为隐藏特征维度的序号;
通过使用Softmax函数进行归一化,获取和为1的特定维度得分:
Figure BDA0003124167560000051
Figure BDA0003124167560000052
其中,
Figure BDA0003124167560000053
是隐藏特征第d维第j个时间步的归一化得分;k为LSTM内时间步的序号;Ts为LSTM的时间步数;exp(·)为以e为底的指数函数;
平均各时间步上所有维度的归一化得分,分别获取对应时间步的权重,将隐藏特征向量与权重相乘,并将加权结果作为后续层的输入:
Figure BDA0003124167560000054
Figure BDA0003124167560000055
其中,αj是对应第j个时间步的权重;hj是隐藏特征第j个时间步的向量;
Figure BDA0003124167560000056
是隐藏特征第j个时间步的加权向量;
4.3基于LSTM和SAM构建具有两个输入通道的混合模型,模型包含LSTM层、注意层、concatenate层和Dense层;LSTM层分别用于提取负荷分量中隐藏的时间相关性特征以及提取考虑气象因素后的高级特征;注意力层用于加权隐藏特征,其输出结果与数值气象预报在concatenate层进行融合,并将融合结果输入后续层;经过两Dense层输出各负荷分量对应的预测结果,将其相加获取每个池化组合对应的居民负荷预测结果,并比较各池化组合下的测试集误差指标输出最佳池化用户个数。
有益效果:与现有技术相比,本发明的技术方案基于目标用户和其互联用户的历史负荷数据和数值气象预报数据,采用二阶段特征工程对数据进行预处理,经池化构建不同池化组合及相应的训练数据池,输入LSTM-SAM混合模型,对目标用户的负荷数据进行预测,提高了居民负荷的预测精度,为系统调度和需求响应实施提供指导,保障了电力系统的安全稳定经济运行。
附图说明
图1为本发明基于LSTM-SAM模型和池化的居民负荷预测方法的流程示意图。
图2为本发明负荷分量输入维度重构的示意图。
图3为本发明基于池化构建训练数据池的流程图。
图4为本发明采用的LSTM-SAM混合模型结构示意图。
图5为本发明实施例中采用所提方法的最终预测结果展示图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明提供了基于LSTM-SAM模型和池化的居民负荷预测方法,如图1所示,该方法包括以下步骤:
(1)获取多个居民用户的历史负荷数据和数值气象预报数据,随机选择某个用户作为目标用户;
(2)采用二阶段特征工程对每个用户的数据进行预处理;
(3)对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据;
(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型,分别进行训练和预测,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数。
下面结合具体实施例,详细说明使用本发明中的方法进行居民负荷预测的具体实施过程。以江苏某地区的居民负荷和气象站预报数据为例,按1小时的采样频率获取从2017年8月至2018年7月某27个用户的负荷数据和125个气象站的气象预报数据,为每个用户选择与之最近的气象站,获取气象变量,包括温度、相对湿度和风速,并将历史负荷数据和各气象变量作为模型输入。为测试模型泛化能力,将每月最后七天的数据作为测试集,其余数据作为训练集,提前一天预测居民负荷,所用预测误差评价指标为平均绝对百分比误差MAPE,平均绝对误差MAE和均方根误差RMSE。具体实施步骤如下:
步骤(2)采用二阶段特征工程对每个用户的数据进行预处理,所述二阶段特征工程方法为:
2.1历史负荷序列分解阶段,采用变分模态分解算法将观测到的负荷序列分解为趋势分量、周期分量和不确定性分量,分别对各历史负荷分量进行后续数据预处理;
2.2多源输入维度重构阶段,分别对负荷分量和数值气象预测数据采用不同方法重构输入维度,具体方法如下:
2.2.1负荷分量输入维度重构方法:
假设待预测时刻为t,从第i个历史负荷分量中取一段固定长度的连续滞后负荷值,如下式所示,本方法设置连续滞后负荷值数量的取值为24的整数倍,其上限为168:
Figure BDA0003124167560000071
Figure BDA0003124167560000072
其中,T是转置;
Figure BDA0003124167560000073
为待预测时刻t第i个负荷分量对应的滞后负荷时间序列;
Figure BDA0003124167560000074
是第i个负荷分量在时刻r的值,r=t-h-lag+1,t-h-lag+2,…,t-h;i是负荷分量的序号;lag是连续滞后负荷的数量;h是预测时间步长,本发明针对日前负荷预测,故h取24;
利用滑动窗口获取负荷数据,将获取的数据作为输入至LSTM网络一个时间步的特征向量,以一步为间隔连续滑动,获取输入至LSTM网络相邻时间步的特征向量,设置滑动窗口长度的取值为24的整数倍,其上限为144,则第j个滑动窗口获取的向量为:
Figure BDA0003124167560000081
j=1,2,…,T0
其中,T是转置;
Figure BDA0003124167560000082
为第j个滑动窗口从待预测时刻t第i个负荷分量对应的滞后负荷时间序列中获取的向量;
Figure BDA0003124167560000083
为第i个负荷分量在时刻q的值,q=t-h-lag+j,t-h-lag+j+1,…,t-h-lag+j+n-1;j为滑动窗口的序号;n是滑动窗口的宽度;T0是滑动窗口的总数量,T0由连续滞后负荷的数量和滑动窗口的宽度决定,经计算其值为25、49、73、97、121和145:
T0=lag+1-n
将T0个滑动窗口获取的向量依次进行堆叠,构成如下二维特征图:
Figure BDA0003124167560000084
其中,T是转置;
Figure BDA0003124167560000085
为维度重构后待预测时刻t第i个负荷分量对应的二维输入特征,其大小为T0×n,分别对应LSTM输入中的时间步数和输入特征维度;
负荷分量输入维度重构的示意图如图2所示。经负荷分量输入维度重构后,得到21种可能的输入形式,每种输入形式中,滞后负荷值数量、时间步数及输入特征维度间的对应关系如表1所示;本方法在不同输入形式下的居民负荷预测误差如表2所示,从表2可以看出,不论在哪一种池化组合下,本方法的预测精度随输入形式变化而变化,在同一池化组合、相同滞后负荷值数量下,通常具有适中时间步数和适中输入特征维度的预测精度更高,本方法当历史负荷分量输入形式为72历史负荷值、49时间步数和24输入特征维度时,其预测误差最小。
表1滞后负荷值数量、时间步数及输入特征维度之间的对应关系
Figure BDA0003124167560000086
Figure BDA0003124167560000091
2.2.2数值气象预报输入维度重构方法:
融合预测时刻t的温度、相对湿度和风速预报值,并将融合后的结果重复T0次,则预测时刻t对应的二维气象特征为:
Figure BDA0003124167560000092
其中,NWPt为维度重构后待预测时刻t对应的数值气象预报特征,其大小为T0×3,T0是滑动窗口总数量;Tt、Ht和Wt分别指预测时刻t的温度、湿度和风速。
将该特征分别与预测时刻t各负荷分量的加权隐藏特征相结合。
步骤(3)对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据,具体步骤的流程图如图3所示;本方法从27个居民用户中随机选择一个用户作为目标用户,其余用户为非目标用户;考虑到计算效率,设置池化用户数上限K为5,具体实际步骤包括:
3.1计算目标用户负荷序列和各非目标用户负荷序列的互信息,并按照互信息降序排列非目标用户,鉴于池化用户数上限为5,本方法实施过程中仅需考虑前4个最相关的互联用户,其与目标用户的互信息数值分别为0.855,0.835,0.832和0.830;
3.2将池化用户数k从1依次增加至上限5,共可形成5种池化组合。对于每种池化组合,先引入目标用户的数据,再根据排序结果从最大互信息对应的互联用户开始依次引入数据,直到引入池中的用户数量等于k;
3.3在每种池化组合中,对各池化用户经特征工程处理后的数据划分训练集和测试集,将每月最后7天的数据作为测试集,其余数据作为训练集;通过沿样本维度合并组内池化用户的训练集分别构建各负荷分量和数值气象预报的训练数据池,将其用于训练LSTM-SAM混合模型;保留目标用户的测试集数据,并将其应用于模型测试阶段,最佳池化用户个数为测试集预测误差最小的池化组合用户数量。
本方法基于不同池化组合的预测结果如表2所示,从表2可以看出池化用户数量将影响预测精度,综合对比所有池化组合的误差指标,四个池化用户构成的组合的预测效果最好。
表2基于不同输入形式和不同池化组合的预测结果
Figure BDA0003124167560000101
Figure BDA0003124167560000111
步骤(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型,分别进行训练和预测,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数,所述LSTM-SAM混合模型为:
4.1将LSTM模型作为混合模型的基础,LSTM模型中具体计算过程如下,假设LSTM的时间步数为Ts,由LSTM输入中的时间步数决定,即Ts=T0
fp=σ(Wfxp+Vfhp-1+bf)
C′p=tanh(Wcxp+Vchp-1+bc)
ip=σ(Wixp+Vihp-1+bi)
Cp=Cp-1⊙fp+ip⊙C′p
Op=σ(Woxp+Vohp-1+bo)
hp=Op⊙tanh(Cp)
其中,p=1,2,…,Ts,p为LSTM内时间步的序号;xp为对应时间步p的输入;hp-1为对应时间步p-1的隐藏状态;fp,ip和Op分别为对应时间步p的遗忘门输出、输入门输出和输出门输出;C′p为对应时间步p的记忆单元候选值;Cp为对应时间步p的记忆单元状态,hp为对应时间步p的隐藏状态;Vf,Vc,Vi和Vo分别为LSTM遗忘门、候选值、输入门和输出门的递归权重;Wf,Wc,Wi和Wo分别表示遗忘门、候选值、输入门和输出门的权重矩阵;bf,bc,bi和bo分别表示LSTM中遗忘门、候选值、输入门和输出门的偏置;σ(·)代表sigmoid激活函数,输出介于0和1之间,0表示将信息完全遗忘,1表示将信息全部保留;tanh(·)代表双曲正切激活函数;⊙代表逐点相乘;
4.2引入SAM,帮助LSTM识别输入重要性,SAM具体计算过程如下:
假设隐藏特征维度为m,计算不同时间步的隐藏特征相关性,则隐藏特征第d维第j个时间步的得分为:
Figure BDA0003124167560000121
d=1,…,m,j=1,…Ts
其中,hjd为第d维第j个时间步的隐藏特征值;Wj,d为对应第d维第j个时间步得分的权重向量,在训练阶段可学习;j为LSTM内时间步的序号;Ts为LSTM的时间步数;d为隐藏特征维度的序号;得分函数fsco(·)通过全连接层实现,其网络神经元数量等于LSTM网络的时间步数量;
通过使用Softmax函数进行归一化,获取和为1的特定维度得分:
Figure BDA0003124167560000122
Figure BDA0003124167560000123
其中,
Figure BDA0003124167560000124
是隐藏特征第d维第j个时间步的归一化得分;k为LSTM内时间步的序号;Ts为LSTM的时间步数;exp(·)为以e为底的指数函数;
平均各时间步上所有维度的归一化得分,分别获取对应时间步的权重,将隐藏特征向量与权重相乘,并将加权结果作为后续层的输入:
Figure BDA0003124167560000125
Figure BDA0003124167560000126
其中,αj是对应第j个时间步的权重;hj是隐藏特征第j个时间步的向量;
Figure BDA0003124167560000127
是隐藏特征第j个时间步的加权向量;
4.3基于LSTM和SAM构建具有两个输入通道的混合模型,其中,LSTM-SAM混合模型结构如图4所示:该模型由两个LSTM层,一个注意力层,一个concatenate层和两个Dense层组成,其中,SAM位于注意力层;该模型具有两个输入通道,历史负荷分量的输入通道位于第一个LSTM层,数值气象预报数据的输入通道位于concatenate层;第一个LSTM层从负荷分量中提取时间相关性,将所提隐藏特征输入注意力层,经SAM加权后输入至concatenate层,加权隐藏特征与数值气象预报在concatenate层进行融合,并将其输入第二个LSTM层,用于提取更加抽象的特征,经过两Dense层输出各负荷分量所对应的预测结果,将其相加获取每个池化组合对应的居民负荷预测结果,且根据表2中误差指标对比结果可知,本方法的最佳池化用户个数为4。将待预测时刻负荷的预测值与真实值进行比较,计算误差指标MAPE、MAE和RMSE,公式分别如下:
Figure BDA0003124167560000131
Figure BDA0003124167560000132
Figure BDA0003124167560000133
其中,le
Figure BDA0003124167560000134
分别为负荷的真实值和预测值;ntest为测试样本数;
此外,本发明提出的基于LSTM-SAM模型和池化的居民负荷预测方法选取基于ARIMA、SVR、ANN以及普通LSTM的负荷预测法作为基准预测方法,用于验证本发明所提方法提高预测精度的有效性。不同负荷预测方法进行提前一天预测的误差比较如表3所示,结果表明,不论滞后负荷值数量的多少,本发明所提方法能进一步提高居民负荷预测的准确性。图5给出了本方法基于最佳池化用户组合在不同季节下的日负荷预测曲线以及负荷的真实值曲线,图5(a)、(c)和(d)分别对应春季、秋季和冬季某日的日负荷,可以看出,本发明所提方法的相应曲线较为准确地预测了日负荷的整体趋势以及局部变化,尤其在负荷上升和下降阶段,十分贴近真实值;图5(b)为2018年夏季7月25日负荷的真实值和预测值曲线,由于负荷受温度等气象因素的影响更为显著,导致用电不确定性增加、负荷预测难度加大、所提方法的预测准确度相较其他季节略有下降,但仍然能够预测日负荷的整体变化趋势。综上所述,本发明所提方法较好地拟合了负荷真实值,能较为准确地预测不同季节的居民负荷,具有一定的可行性和实用性。
表3不同负荷预测方法的性能
Figure BDA0003124167560000141
综上所述,本发明的预测方法可用于预测用户级电力负荷,对电力系统调度、能量管理以及需求响应实施起到重要的指导作用。本发明的方法相较于其他基准负荷预测法,利用了通常被忽略的来自互联用户的有用信息,其预测精度得到明显提升,能更准确地预测居民用户负荷,进而为电力系统调度提供有价值的参考,有利于保证电网稳定经济运行。

Claims (5)

1.基于LSTM-SAM模型和池化的居民负荷预测方法,其特征在于,包括以下步骤:
(1)获取多个居民用户的历史负荷数据和数值气象预报数据,随机选择某个用户作为目标用户;
(2)采用二阶段特征工程对每个用户的数据进行预处理;
(3)对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据;
(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型,分别进行训练和预测,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数。
2.根据权利要求1所述的基于LSTM-SAM模型和池化的居民负荷预测方法,其特征在于,所述的步骤(2)中,采用二阶段特征工程对每个用户的数据进行预处理,具体包括如下步骤:
2.1)历史负荷序列分解阶段,采用变分模态分解算法将观测到的负荷序列分解为多个频率分量,分别对各历史负荷分量进行后续数据预处理;
2.2)多源输入维度重构阶段,分别对负荷分量和数值气象预报数据采用不同方法重构输入维度。
3.根据权利要求2所述的基于LSTM-SAM模型和池化的居民负荷预测方法,其特征在于,所述的步骤2.2)的具体方法如下:
2.2.1)负荷分量输入维度重构方法:
假设待预测时刻为t,从第i个负荷分量中取一段固定长度的连续滞后负荷值,表示为:
Figure FDA0003124167550000011
其中,T是转置;
Figure FDA0003124167550000012
为待预测时刻t第i个负荷分量对应的滞后负荷时间序列;
Figure FDA0003124167550000013
是第i个负荷分量在时刻r的值,r=t-h-lag+1,t-h-lag+2,…,t-h;i是负荷分量的序号;lag是连续滞后负荷的数量;h是预测时间步长;
利用滑动窗口获取负荷数据,将获取的数据作为输入至LSTM网络一个时间步的特征向量,以一步为间隔连续滑动,获取输入至LSTM网络相邻时间步的特征向量,则第j个滑动窗口获取的向量为:
Figure FDA0003124167550000021
其中,T是转置;
Figure FDA0003124167550000022
为第j个滑动窗口从待预测时刻t第i个负荷分量对应的滞后负荷时间序列中获取的向量;
Figure FDA0003124167550000023
为第i个负荷分量在时刻q的值,q=t-h-lag+j,t-h-lag+j+1,…,t-h-lag+j+n-1;j为滑动窗口的序号;n是滑动窗口的宽度;T0是滑动窗口的总数量,T0由连续滞后负荷的数量和滑动窗口的宽度决定:
T0=lag+1-n
将T0个滑动窗口获取的向量依次进行堆叠,构成如下二维特征图:
Figure FDA0003124167550000024
其中,T是转置;
Figure FDA0003124167550000025
为维度重构后待预测时刻t第i个负荷分量对应的二维输入特征,其大小为T0×n,分别对应LSTM输入中的时间步数和输入特征维度;
2.2.2)数值气象预报输入维度重构方法:
融合预测时刻t的温度、相对湿度和风速预报值,并将融合后的结果重复T0次,则预测时刻t对应的二维气象特征为:
Figure FDA0003124167550000026
其中,NWPt为维度重构后待预测时刻t对应的数值气象预报特征,其大小为T0×3,T0是滑动窗口总数量;Tt、Ht和Wt分别指预测时刻t的温度、湿度和风速。
将该特征分别与预测时刻t各负荷分量的加权隐藏特征相结合。
4.根据权利要求3所述的基于LSTM-SAM模型和池化的居民负荷预测方法,其特征在于,所述的步骤(3)中,所述的基于池化构建训练数据池包括:
3.1)计算目标用户负荷序列和各非目标用户负荷序列的互信息,并按照互信息降序排列非目标用户,互信息计算公式为:
Figure FDA0003124167550000031
其中,Xz指第z个非目标用户的负荷数据,Y指目标用户的负荷数据,No是非目标用户的数量;
3.2)将池化用户数k从1依次增加至其上限K,共形成K种池化组合;对于每种池化组合,先引入目标用户的数据,再根据排序结果从最大互信息对应的互联用户开始依次引入数据,直到引入池中的用户数量等于k;
3.3)在每种池化组合中,对各池化用户经特征工程处理后的数据划分训练集和测试集,通过合并组内池化用户的训练集分别构建各负荷分量和数值气象预报的训练数据池,将其用于训练LSTM-SAM混合模型;保留目标用户的测试集数据,并将其应用于模型测试阶段,最佳池化用户个数通过比较测试集基于不同池化组合的误差指标获取。
5.根据权利要求4所述的基于LSTM-SAM模型和池化的居民负荷预测方法,其特征在于,所述的步骤(4)中,所述的LSTM-SAM混合模型为:
4.1)将LSTM模型作为混合模型的基础,LSTM模型中具体计算过程如下,假设LSTM的时间步数为Ts
fp=σ(Wfxp+Vfhp-1+bf)
Cp′=tanh(Wcxp+Vchp-1+bc)
ip=σ(Wixp+Vihp-1+bi)
Cp=Cp-1⊙fp+ip⊙C′p
Op=σ(Woxp+Vohp-1+bo)
hp=Op⊙tanh(Cp)
其中,p=1,2,…,Ts,p为LSTM内时间步的序号;xp为对应时间步p的输入;hp-1为对应时间步p-1的隐藏状态;fp,ip和Op分别为对应时间步p的遗忘门输出、输入门输出和输出门输出;Cp’为对应时间步p的记忆单元候选值;Cp为对应时间步p的记忆单元状态,hp为对应时间步p的隐藏状态;Vf,Vc,Vi和Vo分别为LSTM遗忘门、候选值、输入门和输出门的递归权重;Wf,Wc,Wi和Wo分别表示遗忘门、候选值、输入门和输出门的权重矩阵;bf,bc,bi和bo分别表示LSTM中遗忘门、候选值、输入门和输出门的偏置;σ(·)代表sigmoid激活函数,输出介于0和1之间,0表示将信息完全遗忘,1表示将信息全部保留;tanh(·)代表双曲正切激活函数;⊙代表逐点相乘;
4.2)引入自注意力机制(SAM),帮助LSTM识别输入重要性,SAM具体计算过程如下:
假设隐藏特征维度为m,计算不同时间步的隐藏特征相关性,则隐藏特征第d维第j个时间步的得分为:
Figure FDA0003124167550000047
其中,hjd为第d维第j个时间步的隐藏特征值;Wj,d为对应第d维第j个时间步得分的权重向量,在训练阶段学习;函数fsco(·)为得分函数;j为LSTM内时间步的序号;Ts为LSTM的时间步数;d为隐藏特征维度的序号;
通过使用Softmax函数进行归一化,获取和为1的特定维度得分:
Figure FDA0003124167550000041
Figure FDA0003124167550000042
其中,
Figure FDA0003124167550000043
是隐藏特征第d维第j个时间步的归一化得分;k为LSTM内时间步的序号;Ts为LSTM的时间步数;exp(·)为以e为底的指数函数;
平均各时间步上所有维度的归一化得分,分别获取对应时间步的权重,将隐藏特征向量与权重相乘,并将加权结果作为后续层的输入:
Figure FDA0003124167550000044
Figure FDA0003124167550000045
其中,αj是对应第j个时间步的权重;hj是隐藏特征第j个时间步的向量;
Figure FDA0003124167550000046
是隐藏特征第j个时间步的加权向量;
4.3)基于LSTM和SAM构建具有两个输入通道的混合模型,模型包含LSTM层、注意层、concatenate层和Dense层;LSTM层分别用于提取负荷分量中隐藏的时间相关性特征以及提取考虑气象因素后的高级特征;注意力层用于加权隐藏特征,其输出结果与数值气象预报数据在concatenate层进行融合,并将融合结果输入后续层;经过两Dense层输出各负荷分量对应的预测结果,将其相加获取每个池化组合对应的居民负荷预测结果,并比较各池化组合下的测试集误差指标输出最佳池化用户个数。
CN202110684640.9A 2021-06-21 2021-06-21 基于lstm-sam模型和池化的居民负荷预测方法 Active CN113344279B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110684640.9A CN113344279B (zh) 2021-06-21 2021-06-21 基于lstm-sam模型和池化的居民负荷预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110684640.9A CN113344279B (zh) 2021-06-21 2021-06-21 基于lstm-sam模型和池化的居民负荷预测方法

Publications (2)

Publication Number Publication Date
CN113344279A true CN113344279A (zh) 2021-09-03
CN113344279B CN113344279B (zh) 2022-03-01

Family

ID=77478403

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110684640.9A Active CN113344279B (zh) 2021-06-21 2021-06-21 基于lstm-sam模型和池化的居民负荷预测方法

Country Status (1)

Country Link
CN (1) CN113344279B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113988373A (zh) * 2021-09-27 2022-01-28 河海大学 基于多通道卷积神经网络的多任务海量用户负荷预测方法
CN116361709A (zh) * 2023-03-31 2023-06-30 山东省计算中心(国家超级计算济南中心) 一种自适应电力负荷识别方法与设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188399A (zh) * 2019-05-07 2019-08-30 河海大学 一种基于多相关序列的大坝安全监测单测点评价方法
WO2020077232A1 (en) * 2018-10-12 2020-04-16 Cambridge Cancer Genomics Limited Methods and systems for nucleic acid variant detection and analysis
CN111310387A (zh) * 2020-02-19 2020-06-19 电子科技大学 一种燃料电池寿命预测方法
CN111582551A (zh) * 2020-04-15 2020-08-25 中南大学 风电场短期风速预测方法、系统及电子设备
CN112652326A (zh) * 2020-11-18 2021-04-13 西北工业大学 基于伪彩色时频图像及卷积网络的环境声音识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020077232A1 (en) * 2018-10-12 2020-04-16 Cambridge Cancer Genomics Limited Methods and systems for nucleic acid variant detection and analysis
CN110188399A (zh) * 2019-05-07 2019-08-30 河海大学 一种基于多相关序列的大坝安全监测单测点评价方法
CN111310387A (zh) * 2020-02-19 2020-06-19 电子科技大学 一种燃料电池寿命预测方法
CN111582551A (zh) * 2020-04-15 2020-08-25 中南大学 风电场短期风速预测方法、系统及电子设备
CN112652326A (zh) * 2020-11-18 2021-04-13 西北工业大学 基于伪彩色时频图像及卷积网络的环境声音识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HENG SHI等: "Deep Learning for Household Load Forecasting-A Novel Pooling Deep RNN", 《IEEE TRANSACTIONS ON SMART GRID》 *
贾明珠: "基于机器学习的时间序列分析方法研究与应用", 《中国优秀硕士学位论文全文数据库》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113988373A (zh) * 2021-09-27 2022-01-28 河海大学 基于多通道卷积神经网络的多任务海量用户负荷预测方法
CN113988373B (zh) * 2021-09-27 2022-09-30 河海大学 基于多通道卷积神经网络的多任务海量用户负荷预测方法
CN116361709A (zh) * 2023-03-31 2023-06-30 山东省计算中心(国家超级计算济南中心) 一种自适应电力负荷识别方法与设备
CN116361709B (zh) * 2023-03-31 2023-10-31 山东省计算中心(国家超级计算济南中心) 一种自适应电力负荷识别方法与设备

Also Published As

Publication number Publication date
CN113344279B (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
CN109754113B (zh) 基于动态时间规整与长短时间记忆的负荷预测方法
CN108197744B (zh) 一种光伏发电功率的确定方法及系统
CN109063911B (zh) 一种基于门控循环单元网络的负荷聚合体分组预测方法
Gao et al. Interpretable deep learning model for building energy consumption prediction based on attention mechanism
CN111260136A (zh) 一种基于arima-lstm组合模型的楼宇短期负荷预测方法
CN113344279B (zh) 基于lstm-sam模型和池化的居民负荷预测方法
CN111753893A (zh) 一种基于聚类和深度学习的风电机组功率集群预测方法
CN114970362B (zh) 一种多能源结构下的电网负荷调度预测方法及系统
CN112215428B (zh) 基于误差修正和模糊逻辑的光伏发电功率预测方法及系统
CN113052469B (zh) 一种缺乏量测径流小水电地区的风光水荷互补特性的计算方法
CN113255900A (zh) 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法
CN112149890A (zh) 基于用户用能标签的综合能源负荷预测方法及系统
CN112906956A (zh) 一种联合bim与cim的城市能耗预测方法
CN111563615A (zh) 一种基于特征分析与组合学习的负荷预测方法
CN114119273A (zh) 一种园区综合能源系统非侵入式负荷分解方法及系统
CN113516271A (zh) 一种基于时空神经网络的风电集群功率日前预测方法
CN112508244A (zh) 一种用户级综合能源系统多元负荷预测方法
CN115545333A (zh) 一种多负荷日类型配电网负荷曲线预测方法
Johannesen et al. Comparing recurrent neural networks using principal component analysis for electrical load predictions
CN104915727B (zh) 多维度同构异质bp神经网络光功率超短期预测方法
CN113298318A (zh) 一种新型的配电变压器重过载预测方法
Rafi et al. An effective short-term load forecasting methodology using convolutional long short term memory network
CN117151770A (zh) 一种基于注意力机制的lstm碳价预测方法和系统
CN115481788B (zh) 相变储能系统负荷预测方法及系统
CN108694475B (zh) 基于混合模型的短时间尺度光伏电池发电量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant