CN114239905A - 一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置 - Google Patents
一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置 Download PDFInfo
- Publication number
- CN114239905A CN114239905A CN202111270980.3A CN202111270980A CN114239905A CN 114239905 A CN114239905 A CN 114239905A CN 202111270980 A CN202111270980 A CN 202111270980A CN 114239905 A CN114239905 A CN 114239905A
- Authority
- CN
- China
- Prior art keywords
- resnet
- lstm model
- lstm
- basic
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000009826 distribution Methods 0.000 title claims abstract description 21
- 230000007246 mechanism Effects 0.000 claims abstract description 21
- 238000012549 training Methods 0.000 claims abstract description 17
- 230000006870 function Effects 0.000 claims description 42
- 238000010606 normalization Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 6
- 238000013277 forecasting method Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 12
- 238000013527 convolutional neural network Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/12—Timing analysis or timing optimisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Educational Administration (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于ResNet‑LSTM的配电台区短期负荷预测方法及装置,用于负荷预测的领域,包括:搭建第一ResNet‑LSTM模型,ResNet‑LSTM模型包括CNN层、LSTM层以及全连接层输出层;对第一ResNet‑LSTM模型添加注意力机制以获取第二ResNet‑LSTM模型;获取预处理的历史数据,并对第二ResNet‑LSTM模型进行训练对以获取第三ResNet‑LSTM模型;将待预测的负荷数据属于三ResNet‑LSTM模型中,并对待预测的负荷数据进行负荷预测。本发明所提方法能显著提高配电台区短期负荷预测的精度。
Description
技术领域
本发明涉及电力系统调度技术领域,尤其是涉及一种基于 ResNet-LSTM的配电台区短期负荷预测方法及装置。
背景技术
短期负荷预测指对未来几小时至几天的负荷进行预报。准确的负荷预测结果可以用于安排日前调度、设备检修,监视系统运行状态、预防事故发生,对于提高资源利用率和经济效益,保障社会的正常生产和人们的日常生活有着十分重要的意义。
负荷预测的难点主要在于其不确定性。影响负荷预测准确度的因素众多,主要包括温度、湿度、节假日等,负荷在时间序列上具有较强的波动性,且与各因素之间具有很强的非线性关系,难以显式的刻画预测模型。
目前,应用于短期负荷预测的方法可分为三类:经典方法、传统方法和智能方法。经典方法中,回归分析法结构简单,计算速度快,外推性能好,但用线性方程表述复杂问题,无法精确预测各种因素对结果的影响;时间序列法所需数据少,能反映短期内负荷的连续特点,但对节假日等对负荷影响较大的不确定因素考虑不足。传统方法中,卡尔曼滤波法表现较好:将负荷划分为随机分量和确定分量,随机分量用状态变量表示,确定分量用一阶线性模型描述,建立状态空间模型实现预测,其将系统下一时刻状态的最佳估计和系统未来的状态相结合,使模型预测结果更准确,但是实际场景下,难以得出噪音的统计特性。伴随数据采集、存储技术的发展,负荷历史数据呈现指数级增长,各种智能方法得以应用,其中神经网络的优势在于能对海量数据进行复杂建模,并基于收敛快、自适应能力强的特点,在回归预测领域独占鳌头
发明内容
有鉴于此,本发明的目的在于提供一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置,以对短负荷进行高精度的预测,提高配电台区短期负荷预测的自适应能力。
第一方面,本发明提供了一种基于ResNet-LSTM的配电台区短期负荷预测方法,具体包括如下步骤:
搭建第一ResNet-LSTM模型,所述ResNet-LSTM模型包括CNN层、 LSTM层以及全连接层输出层;
对所述第一ResNet-LSTM模型添加注意力机制以获取第二 ResNet-LSTM模型;
获取预处理的历史数据,并对所述第二ResNet-LSTM模型进行训练对所述以获取第三ResNet-LSTM模型;
将待预测的负荷数据属于所述三ResNet-LSTM模型中,并对所述待预测的负荷数据进行负荷预测。
优选的,所述获取预处理的历史数据的步骤包括:
获取历史数据并对所述历史数据进行预处理以获取预处理的历史数据。
优选的,所述对所述第二ResNet-LSTM模型进行训练对所述以获取第三ResNet-LSTM模型的步骤包括:
获取所述预处理的历史数据输出所述第二ResNet-LSTM模型并获取第一损失函数;
采用Adam算法对所述第二ResNet-LSTM模型的参数进行优化并获取第二损失函数;
判定第一损失函数是否小于第二损失函数;
若是,则获取未优化参数的所述第二ResNet-LSTM模型为所述第三 ResNet-LSTM模型;
若否,则对所述未优化参数第二ResNet-LSTM模型的参数进行更新,以获取所述第三ResNet-LSTM模型,并执行所述获取所述预处理的历史数据输出所述第二ResNet-LSTM模型并获取第一损失函数的步骤。
优选的,所述CNN层包括所第一BasicBlock残差基本模块、第二 BasicBlock残差基本模块、第三BasicBlock残差基本模块以及第四 BasicBlock残差基本模块;
所述第一BasicBlock残差基本模块、所述第二BasicBlock残差基本模块、所述第三BasicBlock残差基本模块以及所述第四BasicBlock残差基本模块依次相连;
所述第一BasicBlock残差基本模块包括3个第一BasicBlock残差基本子模块,所述第一BasicBlock残差基本子模块的卷积核数为64;
所述第二BasicBlock残差基本模块包括4个第二BasicBlock残差基本子模块,所述第二BasicBlock残差基本子模块的卷积核数为128;
所述第三BasicBlock残差基本模块包括6个第三BasicBlock残差基本子模块,所述第三BasicBlock残差基本子模块的卷积核数为256;
所述第四BasicBlock残差基本模块包括3个第四BasicBlock残差基本子模块,所述第三BasicBlock残差基本子模块的卷积核数为512。
优选的,所述全连接层输出层采用Relu函数为激活函数:
yt=Relu(wost+bo);
yt—全连接层输出量;
wo—全连接层的权重参数;
bo—全连接层的偏置;
st—全连接层的输入。
优选的,所述获取预处理的历史数据的步骤中,采用如下公式进行归一化:
Xstd—归一化之后的数据;
X—未进行归一化的数据;
Xmin(axis=0)—未进行归一化的数据中特征的最小值;
Xmax(axis=0)—未进行归一化的数据中特征的最大值;
所述全连接层输出层采用如下公式进行反归一化:
X′=Xstd*(Xmax(axis=0)-Xmin(axis=0))+Xmin(axis=0);
X′—反归一化的数据。
优选的,采用如下公式获取第一损失函数以及第二损失函数:
xact—真实值;
xpred—预测值;
YMAPE—平均绝对百分比误差
Adam算法采用如下公式:
θt—待更新的参数;
α—学习率;
式中:
β1—时间步t的梯度的一阶估计衰减率;
β2—时间步t的梯度的二阶估计衰减率;
gt—时间步t的梯度。
优选的,所述对所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型的步骤包括:
所述注意力机制的权重系数为:
et=utanh(wht+b)
ht—t时刻隐藏层的状态;
tanh—激活函数;
αt—为t时刻注意力机制对隐藏层的注意力权重值;
et—t时刻LSTM层输出ht所决定的注意力概率分布值;
u和w—权重系数;
b—偏置;
st—t时刻注意力机制隐藏层的输出值。
优选的,所述LSTM层满足如下公式:
ft=σ(Wfxxt+Wfhht-1+bf);
Wf—隐藏层中间输出;
ht与输入数据Wt是门运算的权值参数;
bf—门运算的偏置;
σ—非线性激活函数sigmoid。
另一方面,本发明提供了一种基于ResNet-LSTM的配电台区短期负荷预测装置,具体包括如下步骤:
模型搭建模块:用于搭建第一ResNet-LSTM模型,所述ResNet-LSTM 模型包括CNN层、LSTM层以及全连接层输出层;
注意力机制引入模块:用于对所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型;
训练模块:用于获取预处理的历史数据,并对所述第二ResNet-LSTM 模型进行训练对所述以获取第三ResNet-LSTM模型;
预测结果输出模块:用于将待预测的负荷数据属于所述三 ResNet-LSTM模型中,并对所述待预测的负荷数据进行负荷预测。
本发明实施例带来了以下有益效果:本发明提供了一种基于 ResNet-LSTM的配电台区短期负荷预测方法及装置,所述方法包括:搭建第一ResNet-LSTM模型,ResNet-LSTM模型包括CNN层、LSTM层以及全连接层输出层;对第一ResNet-LSTM模型添加注意力机制以获取第二 ResNet-LSTM模型;获取预处理的历史数据,并对第二ResNet-LSTM模型进行训练对以获取第三ResNet-LSTM模型;将待预测的负荷数据属于三 ResNet-LSTM模型中,并对待预测的负荷数据进行负荷预测。本发明所提方法能显著提高配电台区短期负荷预测的精度。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的34层Resnet神经网络结构示意图;
图2为本发明实施例提供的卷积神经网络基本结构示意图;
图3为本发明实施例提供的K折交叉验证方法示意图;
图4为本发明实施例提供的ResNet-LSTM混合结构loss函数曲线示意图;
图5为本发明实施例提供的24h预测效果示意图;
图6为本发明实施例提供的7天预测效果示意图;
图7为本发明实施例提供的attention结构示意图;
图8为本发明实施例提供的长短期记忆人工神经网络原理图。
图9为本发明实施例提供的一种基于ResNet-LSTM的配电台区短期负荷预测方法流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,应用于短期负荷预测的方法可分为三类:经典方法、传统方法和智能方法。经典方法中,回归分析法结构简单,计算速度快,外推性能好,但用线性方程表述复杂问题,无法精确预测各种因素对结果的影响;时间序列法所需数据少,能反映短期内负荷的连续特点,但对节假日等对负荷影响较大的不确定因素考虑不足。传统方法中,卡尔曼滤波法表现较好:将负荷划分为随机分量和确定分量,随机分量用状态变量表示,确定分量用一阶线性模型描述,建立状态空间模型实现预测,其将系统下一时刻状态的最佳估计和系统未来的状态相结合,使模型预测结果更准确,但是实际场景下,难以得出噪音的统计特性,基于此,本发明实施例提供的一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置,可以显著提高配电台区短期负荷预测的精度。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种基于 ResNet-LSTM的配电台区短期负荷预测方法及装置进行详细介绍。
实施例一:
本发明实施例一提供了一种基于ResNet-LSTM的配电台区短期负荷预测方法,具体包括如下步骤:
结合图7、图8、图9所示,搭建第一ResNet-LSTM模型,所述 ResNet-LSTM模型包括CNN层、LSTM层以及全连接层输出层;
进一步的,结合图2所示,所述CNN层包括所第一BasicBlock残差基本模块、第二BasicBlock残差基本模块、第三BasicBlock残差基本模块以及第四BasicBlock残差基本模块;
所述第一BasicBlock残差基本模块、所述第二BasicBlock残差基本模块、所述第三BasicBlock残差基本模块以及所述第四BasicBlock残差基本模块依次相连;
所述第一BasicBlock残差基本模块包括3个第一BasicBlock残差基本子模块,所述第一BasicBlock残差基本子模块的卷积核数为64;
所述第二BasicBlock残差基本模块包括4个第二BasicBlock残差基本子模块,所述第二BasicBlock残差基本子模块的卷积核数为128;
所述第三BasicBlock残差基本模块包括6个第三BasicBlock残差基本子模块,所述第三BasicBlock残差基本子模块的卷积核数为256;
所述第四BasicBlock残差基本模块包括3个第四BasicBlock残差基本子模块,所述第三BasicBlock残差基本子模块的卷积核数为512。
在所述第三BasicBlock残差基本模块第四BasicBlock残差基本模块
在本发明提供的实施例中,Attention(注意力机制)本质上是一种资源分配的机制,能突出重要信息的影响对,在此所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型;
优选的,所述对所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型的步骤包括:
所述注意力机制的权重系数为:
et=utanh(wht+b)
ht—t时刻隐藏层的状态;
tanh—激活函数;
αt—为t时刻注意力机制对隐藏层的注意力权重值;
et—t时刻LSTM层输出ht所决定的注意力概率分布值;
u和w—权重系数;
b—偏置;
st—t时刻注意力机制隐藏层的输出值。
获取预处理的历史数据,并对所述第二ResNet-LSTM模型进行训练对所述以获取第三ResNet-LSTM模型;
将待预测的负荷数据属于所述三ResNet-LSTM模型中,并对所述待预测的负荷数据进行负荷预测。
优选的,所述获取预处理的历史数据的步骤包括:
获取历史数据并对所述历史数据进行预处理以获取预处理的历史数据。
进一步的,将小时、月份、周几、是否周末、是否节假日进行one-hot 编码,丢弃原始数据中神经网络模型无法直接利用的特征,添加温度、湿度信息和月份的交互影响,以丰富数据的特征维度;将每连续的24个时刻历史数据作为一个时间序列,即根据过去24个时刻的数据预测下一时刻的负荷,为单步预测;也可根据需要改为多步预测。为了便于运算,将特征维度进行拆分,使其长宽近似相等;数据使用最大最小归一化方法进行归一化,消除奇异样本的不良影响;
采用如下公式进行归一化:
Xstd—归一化之后的数据;
X—未进行归一化的数据;
Xmin(axis=0)—未进行归一化的数据中特征的最小值;
Xmax(axis=0)—未进行归一化的数据中特征的最大值;
优选的,所述对所述第二ResNet-LSTM模型进行训练对所述以获取第三ResNet-LSTM模型的步骤包括:
获取所述预处理的历史数据输出所述第二ResNet-LSTM模型并获取第一损失函数;
采用Adam算法对所述第二ResNet-LSTM模型的参数进行优化并获取第二损失函数;
判定第一损失函数是否小于第二损失函数;
若是,则获取未优化参数的所述第二ResNet-LSTM模型为所述第三 ResNet-LSTM模型;
若否,则对所述未优化参数第二ResNet-LSTM模型的参数进行更新,以获取所述第三ResNet-LSTM模型,并执行所述获取所述预处理的历史数据输出所述第二ResNet-LSTM模型并获取第一损失函数的步骤。
采用如下公式获取第一损失函数以及第二损失函数:
xact—真实值;
xpred—预测值;
YMAPE—平均绝对百分比误差
Adam算法采用如下公式:
θt—待更新的参数;
α—学习率;
式中:
β1—时间步t的梯度的一阶估计衰减率;
β2—时间步t的梯度的二阶估计衰减率;
gt—时间步t的梯度。
优选的,所述LSTM层满足如下公式:
ft=σ(Wfxxt+Wfhht-1+bf);
Wf—隐藏层中间输出;
ht与输入数据Wt是门运算的权值参数;
bf—门运算的偏置;
σ—非线性激活函数sigmoid。
优选的,所述CNN层包括所第一BasicBlock残差基本模块、第二 BasicBlock残差基本模块、第三BasicBlock残差基本模块以及第四 BasicBlock残差基本模块;
所述第一BasicBlock残差基本模块、所述第二BasicBlock残差基本模块、所述第三BasicBlock残差基本模块以及所述第四BasicBlock残差基本模块依次相连;
所述第一BasicBlock残差基本模块包括3个第一BasicBlock残差基本子模块,所述第一BasicBlock残差基本子模块的卷积核数为64;
所述第二BasicBlock残差基本模块包括4个第二BasicBlock残差基本子模块,所述第二BasicBlock残差基本子模块的卷积核数为128;
所述第三BasicBlock残差基本模块包括6个第三BasicBlock残差基本子模块,所述第三BasicBlock残差基本子模块的卷积核数为256;
所述第四BasicBlock残差基本模块包括3个第四BasicBlock残差基本子模块,所述第三BasicBlock残差基本子模块的卷积核数为512。
优选的,所述全连接层输出层采用Relu函数为激活函数:
yt=Relu(wost+bo);
yt—全连接层输出量;
wo—全连接层的权重参数;
bo—全连接层的偏置;
st—全连接层的输入。
所述全连接层输出层采用如下公式进行反归一化:
X′=Xstd*(Xmax(axis=0)-Xmin(axis=0))+Xmin(axis=0);
X′—反归一化的数据。
在本发明提供的实施例中,在一个深度较浅的卷积神经网络上叠加 y=x,可以保证神经网络的预测结果比起浅层网络不会退化;
进一步的,所述第一BasicBlock残差基本子模块、所述第二BasicBlock 残差基本子模块、所述第三BasicBlock残差基本子模块以及所述第四 BasicBlock残差基本子模块均包括两个BasicBlock残差学习基本单元;
在本发明提供的实施例中,每个残差单元的预测值H(x)为:
H(x)=F(x,{wi})+x
H(x)—预测值;
F(x,{wi})—残差;
x—观测值。
因此残差网络学习的是预测值与观测值之差,即F(x)=H(x)-x。当卷积层数较深时,即使F(x)中某些参数趋于零,由于观测值y=x的存在,依旧可以保证学习能力不会下降;
结合图8遗忘门决定记忆单元中上一时刻的值由多少会被传入当前时刻进行学习。通过参数σ实现,σ的取值范围为(0,1),遗忘门函数使用sigmoid函数来控制输出比例:
ft=σ(Wfxxt+Wfhht-1+bf)
Wf是权重系数;
ht-1为上一序列的隐藏状态,xt是本序列数据;
bf是门运算的偏置;
σ为非线性激活函数sigmoid;
输入门决定让多少新的信息加入到单元中来。实现这个需要包括两个函数:
it=σ(Wixxt+Wihht-1+bi)
类似的,Wtx、Wth、Wgx、Wgh为权重系数;
bi、bg为偏置;
输出门决定记忆单元中储存的记忆之有多大比例可以被输出:
ot=σ(Woxxt+Wohht-1+bo)
St=gt⊙it+St-1⊙ft
在本发明提供的实施例中,训练方法法使用K折交叉验证方法进行改进,使数据集获得更强的随机性。首先将数据集随机打乱,并平均的分成K 个子数据集。在预测时随机选取K-1个子数据集作为模型的训练集,而将剩余的一个子数据集作为模型的测试集。将上述过程重复K次,最后将得到的K个结果求均值作为最终输出。这样,每一个数据都能参与正向传播与反向传播两个过程。K折交叉验证既防止了模型过拟合,也防止无法充分利用数据。
实施例二:
另一方面,本发明提供了一种基于ResNet-LSTM的配电台区短期负荷预测装置,具体包括如下步骤:
模型搭建模块:用于搭建第一ResNet-LSTM模型,所述ResNet-LSTM 模型包括CNN层、LSTM层以及全连接层输出层;
注意力机制引入模块:用于对所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型;
训练模块:用于获取预处理的历史数据,并对所述第二ResNet-LSTM 模型进行训练对所述以获取第三ResNet-LSTM模型;
预测结果输出模块:用于将待预测的负荷数据属于所述三 ResNet-LSTM模型中,并对所述待预测的负荷数据进行负荷预测。
实施例三:
结合图5以及图6,选用Global Energy Forecasting数据集中两年的历史数据进行测试,可见在整个训练过程中,loss在稳步下降,红色曲线代表预测值,蓝色曲线为实际值。ResNet-LSTM模型的预测值与实际值相比,极大值点与极小值点对应的时间完全重合,曲线趋势基本一致。尤其是夜间用电低谷时间段内,预测值与实际值几乎完全吻合,这表明本方法也可用于预测一天甚至一周的负荷,验证了所提方法的有效性。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/ 或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种基于ResNet-LSTM的配电台区短期负荷预测方法,其特征在于,具体包括如下步骤:
搭建第一ResNet-LSTM模型,所述ResNet-LSTM模型包括CNN层、LSTM层以及全连接层输出层;
对所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型;
获取预处理的历史数据,并对所述第二ResNet-LSTM模型进行训练对所述以获取第三ResNet-LSTM模型;
将待预测的负荷数据属于所述三ResNet-LSTM模型中,并对所述待预测的负荷数据进行负荷预测。
2.根据权利要求1所述的方法,其特征在于,所述获取预处理的历史数据的步骤包括:
获取历史数据并对所述历史数据进行预处理以获取预处理的历史数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述第二ResNet-LSTM模型进行训练对所述以获取第三ResNet-LSTM模型的步骤包括:
获取所述预处理的历史数据输出所述第二ResNet-LSTM模型并获取第一损失函数;
采用Adam算法对所述第二ResNet-LSTM模型的参数进行优化并获取第二损失函数;
判定第一损失函数是否小于第二损失函数;
若是,则获取未优化参数的所述第二ResNet-LSTM模型为所述第三ResNet-LSTM模型;
若否,则对所述未优化参数第二ResNet-LSTM模型的参数进行更新,以获取所述第三ResNet-LSTM模型,并执行所述获取所述预处理的历史数据输出所述第二ResNet-LSTM模型并获取第一损失函数的步骤。
4.根据权利要求1所述的方法,其特征在于,所述CNN层包括所第一BasicBlock残差基本模块、第二BasicBlock残差基本模块、第三BasicBlock残差基本模块以及第四BasicBlock残差基本模块;
所述第一BasicBlock残差基本模块、所述第二BasicBlock残差基本模块、所述第三BasicBlock残差基本模块以及所述第四BasicBlock残差基本模块依次相连;
所述第一BasicBlock残差基本模块包括3个第一BasicBlock残差基本子模块,所述第一BasicBlock残差基本子模块的卷积核数为64;
所述第二BasicBlock残差基本模块包括4个第二BasicBlock残差基本子模块,所述第二BasicBlock残差基本子模块的卷积核数为128;
所述第三BasicBlock残差基本模块包括6个第三BasicBlock残差基本子模块,所述第三BasicBlock残差基本子模块的卷积核数为256;
所述第四BasicBlock残差基本模块包括3个第四BasicBlock残差基本子模块,所述第三BasicBlock残差基本子模块的卷积核数为512。
5.根据权利要求1所述的方法,其特征在于,所述全连接层输出层采用Relu函数为激活函数:
yt=Relu(wost+bo);
yt—全连接层输出量;
wo—全连接层的权重参数;
bo—全连接层的偏置;
st—全连接层的输入。
9.根据权利要求1所述的方法,其特征在于,所述LSTM层满足如下公式:
ft=σ(Wfxxt+Wfhht-1+bf);
Wf—隐藏层中间输出;
ht与输入数据Wt是门运算的权值参数;
bf—门运算的偏置;
σ—非线性激活函数sigmoid。
10.一种基于ResNet-LSTM的配电台区短期负荷预测装置,其特征在于,具体包括如下步骤:
模型搭建模块:用于搭建第一ResNet-LSTM模型,所述ResNet-LSTM模型包括CNN层、LSTM层以及全连接层输出层;
注意力机制引入模块:用于对所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型;
训练模块:用于获取预处理的历史数据,并对所述第二ResNet-LSTM模型进行训练对所述以获取第三ResNet-LSTM模型;
预测结果输出模块:用于将待预测的负荷数据属于所述三ResNet-LSTM模型中,并对所述待预测的负荷数据进行负荷预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111270980.3A CN114239905A (zh) | 2021-10-29 | 2021-10-29 | 一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111270980.3A CN114239905A (zh) | 2021-10-29 | 2021-10-29 | 一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114239905A true CN114239905A (zh) | 2022-03-25 |
Family
ID=80743365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111270980.3A Pending CN114239905A (zh) | 2021-10-29 | 2021-10-29 | 一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114239905A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109002942A (zh) * | 2018-09-28 | 2018-12-14 | 河南理工大学 | 一种基于随机神经网络的短期负荷预测方法 |
CN109492822A (zh) * | 2018-11-24 | 2019-03-19 | 上海师范大学 | 空气污染物浓度时空域关联预测方法 |
CN111260030A (zh) * | 2020-01-13 | 2020-06-09 | 润联软件系统(深圳)有限公司 | 基于a-tcn电力负荷预测方法、装置、计算机设备及存储介质 |
CN111507521A (zh) * | 2020-04-15 | 2020-08-07 | 北京智芯微电子科技有限公司 | 台区电力负荷预测方法及预测装置 |
CN112098714A (zh) * | 2020-08-12 | 2020-12-18 | 国网江苏省电力有限公司南京供电分公司 | 一种基于ResNet-LSTM的窃电检测方法及系统 |
CN112149890A (zh) * | 2020-09-16 | 2020-12-29 | 国网山东省电力公司经济技术研究院 | 基于用户用能标签的综合能源负荷预测方法及系统 |
CN112163689A (zh) * | 2020-08-18 | 2021-01-01 | 国网浙江省电力有限公司绍兴供电公司 | 基于深度Attention-LSTM的短期负荷分位点概率预测方法 |
CN112488415A (zh) * | 2020-12-14 | 2021-03-12 | 国网江苏省电力有限公司经济技术研究院 | 基于经验模态分解和长短时记忆网络的电力负荷预测方法 |
CN112529283A (zh) * | 2020-12-04 | 2021-03-19 | 天津天大求实电力新技术股份有限公司 | 基于注意力机制的综合能源系统短期负荷预测方法 |
-
2021
- 2021-10-29 CN CN202111270980.3A patent/CN114239905A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109002942A (zh) * | 2018-09-28 | 2018-12-14 | 河南理工大学 | 一种基于随机神经网络的短期负荷预测方法 |
CN109492822A (zh) * | 2018-11-24 | 2019-03-19 | 上海师范大学 | 空气污染物浓度时空域关联预测方法 |
CN111260030A (zh) * | 2020-01-13 | 2020-06-09 | 润联软件系统(深圳)有限公司 | 基于a-tcn电力负荷预测方法、装置、计算机设备及存储介质 |
CN111507521A (zh) * | 2020-04-15 | 2020-08-07 | 北京智芯微电子科技有限公司 | 台区电力负荷预测方法及预测装置 |
CN112098714A (zh) * | 2020-08-12 | 2020-12-18 | 国网江苏省电力有限公司南京供电分公司 | 一种基于ResNet-LSTM的窃电检测方法及系统 |
CN112163689A (zh) * | 2020-08-18 | 2021-01-01 | 国网浙江省电力有限公司绍兴供电公司 | 基于深度Attention-LSTM的短期负荷分位点概率预测方法 |
CN112149890A (zh) * | 2020-09-16 | 2020-12-29 | 国网山东省电力公司经济技术研究院 | 基于用户用能标签的综合能源负荷预测方法及系统 |
CN112529283A (zh) * | 2020-12-04 | 2021-03-19 | 天津天大求实电力新技术股份有限公司 | 基于注意力机制的综合能源系统短期负荷预测方法 |
CN112488415A (zh) * | 2020-12-14 | 2021-03-12 | 国网江苏省电力有限公司经济技术研究院 | 基于经验模态分解和长短时记忆网络的电力负荷预测方法 |
Non-Patent Citations (1)
Title |
---|
HAILONG LI ET AL: ""Short-term Load Forecasting for Distribution Substations Based on Residual Neutral Networks and Long Short-Term Memory Neutral Networks with Attention Mechanism"", 《JOURNAL OF PHYSICS: CONFERENCE SERIES》, vol. 2030, 13 October 2021 (2021-10-13), pages 1 - 3 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021138925A1 (zh) | 基于改进卷积-长短时记忆神经网络的锂电池容量估算方法 | |
CN108256697B (zh) | 一种用于电力系统短期负荷的预测方法 | |
CN112990556A (zh) | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 | |
CN111310387B (zh) | 一种燃料电池寿命预测方法 | |
CN116861201B (zh) | 基于人工智能的电力供给系统 | |
CN112884236B (zh) | 一种基于vdm分解与lstm改进的短期负荷预测方法及系统 | |
CN111815065A (zh) | 基于长短时记忆神经网络的短期电力负荷预测方法 | |
CN116359742B (zh) | 基于深度学习组合扩展卡尔曼滤波的储能电池荷电状态在线估计方法及系统 | |
CN113935513A (zh) | 一种基于ceemdan的短期电力负荷预测方法 | |
CN114936682B (zh) | 基于变分模态分解的锂离子电池剩余使用寿命预测方法 | |
CN115526265A (zh) | 一种基于递进式学习结构的非侵入式负荷分解方法 | |
Nolting et al. | Can energy system modeling benefit from artificial neural networks? Application of two-stage metamodels to reduce computation of security of supply assessments | |
CN111523727B (zh) | 基于不确定过程的考虑恢复效应的电池剩余寿命预测方法 | |
CN116523148A (zh) | 一种配电网配变重过载预警方法、装置和设备 | |
CN116298936A (zh) | 在不完全电压范围内的锂离子电池智能健康状态预测方法 | |
Zhang et al. | Remaining useful life prediction of lithium-ion batteries based on TCN-DCN fusion model combined with IRRS filtering | |
CN117236380A (zh) | 一种电力系统故障预测方法、系统、电子设备和介质 | |
CN116822722A (zh) | 水位预测方法、系统、装置、电子设备及介质 | |
CN114239905A (zh) | 一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置 | |
CN116679213A (zh) | 基于集成深度学习的电动汽车动力电池soh估算方法 | |
CN115936185A (zh) | 基于dcnn-lstm-ae-am的短期电力负荷和碳排放量预测方法及系统 | |
CN114925940A (zh) | 一种基于负荷分解的节假日负荷预测方法及系统 | |
CN113221248B (zh) | 一种基于pf-garch模型的船舶系统设备状态参数预测方法 | |
CN114462771A (zh) | 用电异常分析方法、装置、设备、介质和产品 | |
CN116245334B (zh) | 一种基于深度强化学习的电力系统风险感知实时调度方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |