CN113420508A - 一种基于lstm的机组组合计算方法 - Google Patents
一种基于lstm的机组组合计算方法 Download PDFInfo
- Publication number
- CN113420508A CN113420508A CN202110770004.8A CN202110770004A CN113420508A CN 113420508 A CN113420508 A CN 113420508A CN 202110770004 A CN202110770004 A CN 202110770004A CN 113420508 A CN113420508 A CN 113420508A
- Authority
- CN
- China
- Prior art keywords
- model
- unit
- formula
- layer
- lstm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 39
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 28
- 238000013135 deep learning Methods 0.000 claims abstract description 14
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 238000003064 k means clustering Methods 0.000 claims abstract description 10
- 238000013507 mapping Methods 0.000 claims abstract description 9
- 238000010606 normalization Methods 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 42
- 230000006870 function Effects 0.000 claims description 36
- 230000008569 process Effects 0.000 claims description 21
- 230000004913 activation Effects 0.000 claims description 11
- 210000002569 neuron Anatomy 0.000 claims description 9
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 7
- 150000001875 compounds Chemical class 0.000 claims description 7
- 238000011478 gradient descent method Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 210000004027 cell Anatomy 0.000 claims description 5
- 230000007246 mechanism Effects 0.000 claims description 4
- 230000005284 excitation Effects 0.000 claims description 3
- 230000008447 perception Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000013136 deep learning model Methods 0.000 abstract description 8
- 238000012545 processing Methods 0.000 abstract description 7
- 238000012821 model calculation Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/38—Arrangements for parallely feeding a single network by two or more generators, converters or transformers
- H02J3/46—Controlling of the sharing of output between the generators, converters, or transformers
- H02J3/466—Scheduling the operation of the generators, e.g. connecting or disconnecting generators to meet a given demand
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Power Engineering (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Geometry (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于LSTM的机组组合计算方法,使用MinMaxScaler归一化方法和K‑means聚类算法对历史数据进行处理,并构建预调度模型和再调度模型,通过两步深度学习得到次日的机组组合计划。所提出的深度学习模型采用LSTM神经网络,通过学习大量的历史数据,模型训练完成后得出机组组合映射关系。在实时决策中,调用训练好的深度学习模型,即可直接得到机组组合计划,无需通过复杂的物理模型计算。第一步,输入负荷的预测数据,得到机组启停状态;第二步,输入机组启停状态和负荷的预测数据,得到机组出力。
Description
技术领域
本发明属于电力系统调度自动化技术领域,具体涉及一种基于LSTM的机组组合计算方法。
背景技术
目前,机组组合问题的研究多集中于基于物理模型驱动的决策方法。这种方法往往侧重于机理研究,从实际工程问题抽离出数学模型,再利用数学方法简化模型,最后根据模型的特点选取合适的求解算法,整个过程以严谨的数学推导作为支撑。这类方法的优点是逻辑清晰,可解释性强,但存在以下缺陷:模型的建立和求解的过程都较为复杂;求解大规模系统耗费的时间较长;新能源、新技术、新结构会给电力系统带来新的挑战,以往的模型和算法可能不再适用,需要不断地调整和更新。相较而言,以深度学习为基础的数据驱动机组组合决策方法是一种更为有效的新思路,深度学习作为新兴的研究热点,正逐步应用于电力系统优化调度的各领域。但是,如何从大量历史数据学习机组组合映射关系,又成为了一个值得研究的问题。
发明目的
本发明的目的在于应对现有技术所存在的不足,供了一种基于LSTM的机组组合计算方法,该方法所提出的深度学习模型通过学习大量的历史数据,模型训练完成后得出机组组合映射关系,在实时决策中,调用训练好的深度学习模型,即可直接得到机组组合计划,无需通过复杂的物理模型计算。
发明内容
本发明提供了一种基于LSTM的机组组合计算方法,包括以下步骤:
步骤一、使用MinMaxScaler归一化方法和K-means聚类算法对机组的历史数据进行预处理,并构建预调度模型和再调度模型,通过两步深度学习得到次日的机组组合计划;所构建的预调度模型和再调度模型采用LSTM神经网络,通过学习大量的历史数据,模型训练完成后得出机组组合映射关系;
步骤二、在实时决策中,调用步骤一中所得到的机组组合映射关系,首先,输入负荷的预测数据,得到机组启停状态;接着,输入机组启停状态和负荷的预测数据,得到机组出力值。
优选地,所述所述MinMaxScaler归一化方法表征为如式(1)所示:
优选地,所述K-means聚类算法是一个循环迭代的算法,通过以下4步实现:
(1)选择K个初始中心点,作为初始聚类中心a1,a2,…,ak;
(2)计算每个样本xi到K个聚类中心的距离,并将其分到距离最小的类中;
(3)计算K类中所有样本点的均值,作为下一次迭代的聚类中心;
(4)重复步骤(2)、(3),直到聚类中心不再改变或达到迭代次数。
优选地,所述预调度模型包括LSTM神经网络层、Dropout层、全连接层共三个部分,其输入为负荷的预测数据,输出为机组启停状态;
其中,所述LSTM神经网络层是基于RNN改善的结构模型,引入了存储单元和门机制,当前时刻能利用上一时刻句子中的信息;所述LSTM神经网络由4个部分组成:即输入门it、输出门ot、遗忘门ft和记忆单元Ct;
在所述Dropout层中,Dropout是指在深度学习的训练过程中,每次更新参数时随机断开一定比例的神经元,减弱神经元对某些局部特征的依赖性,从而提高模型的泛化能力;
所述全连接层使用了softmax激励函数作为输出层的多层感知;所述全连接指当前层与前一层网络的所有神经元是相互连接的,将提取的高维特征进行降维;该层;位于网络的末端,最后一层的单元数与分类个数相同,并且与softmax激活函数配合使用,以实现对输出特征的分类。
采用Adam算法对所述预调度模型进行训练,所述训练过程包括前向传播和反向传播两个阶段;首先,在前向传播中计算输入信号的乘积及其对应的权重,然后,将激活函数作用于这些乘积的总和,得到的输出结果与真实值所形成的误差;接着,在网络的反向传播过程中回传所形成的相关误差,通过计算损失函数对于对各参数的梯度,根据梯度下降法对权值W和偏置b进行更新,如式(2)、(3)所示
选取交叉熵误差作为损失函数,计算公式如式(4)所示:
优选地,所述再调度模型的构建方法与上述预调度模型一致,其输入为机组启停状态和负荷的预测数据,输出为机组出力值;在所述再调度模型的训练过程中,采用Adam算法对参数进行调整,所述训练过程包括前向传播和反向传播两个阶段;首先,在前向传播中计算输入信号的乘积及其对应的权重;然后,将激活函数作用于这些乘积的总和,得到的输出结果与真实值所形成的误差,在网络的反向传播过程中回传相关误差,通过计算损失函数对于对各参数的梯度,根据梯度下降法对权值W和偏置b进行更新,选取均方误差作为损失函数,计算公式如式(5)所示:
附图说明
图1为本发明提供的方法流程图。
图2为LSTM网络结构图。
图3为火电机组启停状态的预测准确率图。
图4为训练过程中的损失值变化图。
图5为模型准确度与训练样本容量的关系曲线图。
图6为损失值随着学习率变化的曲线图。
图7为损失值随着训练次数变化的收敛曲线图。
具体实施方式
本发明提供了一种基于LSTM的机组组合计算方法,使用MinMaxScaler归一化方法和K-means聚类算法对历史数据进行处理,并构建预调度模型和再调度模型,通过两步深度学习得到次日的机组组合计划。所提出的深度学习模型采用LSTM神经网络,通过学习大量的历史数据,模型训练完成后得出机组组合映射关系。在实时决策中,调用训练好的深度学习模型,即可直接得到机组组合计划,无需通过复杂的物理模型计算。第一步,输入负荷的预测数据,得到机组启停状态;第二步,输入机组启停状态和负荷的预测数据,得到机组出力值。结合图1的方法流程图进行介绍,具体包括:
步骤1:使用MinMaxScaler归一化方法和K-means聚类算法对历史数据进行处理;
步骤2:构建预调度模型,输入负荷的预测数据,得到机组启停状态;
步骤3:构建再调度模型,输入机组启停状态和负荷的预测数据,得到机组出力值。
其中,步骤1:使用MinMaxScaler归一化方法和K-means聚类算法对历史数据进行处理,具体包括:
K-means聚类算法的本质是基于欧式距离的数据划分算法,均值和方差大的维度将对数据的聚类产生决定性影响。所以未做归一化处理的数据是无法直接参与运算和比较的。选取MinMaxScaler方法实现数据的归一化:
聚类算法是指将一堆没有标签的数据自动划分成几类的方法,这个方法要保证同一类的数据有相似的特征。K-means聚类算法是一个循环迭代的算法,通过以下4步实现:
(1)选择K个初始中心点,作为初始聚类中心a1,a2,…,ak。
(2)计算每个样本xi到K个聚类中心的距离,并将其分到距离最小的类中。
(3)计算K类中所有样本点的均值,作为下一次迭代的聚类中心。
(4)重复步骤(2)、(3),直到聚类中心不再改变或达到迭代次数。
步骤2:构建预调度模型,输入负荷的预测数据,得到机组启停状态,具体包括:
预调度模型的输入为负荷的预测数据,输出为机组启停状态。网络模型构建和训练算法如下:
(1)模型构建
预调度模型包括3个部分:LSTM层、Dropout层、全连接层。
①LSTM层。RNN是一种可以获得之前的信息并进行学习的网络模型。在实践中,RNN随着时间的增长会出现梯度消失或梯度爆炸问题。为了这些问题,有学者提出了特殊的循环网络结构,如LSTM网络。
LSTM网络是基于RNN改善的结构模型,LSTM网络引入了存储单元和门机制,当前时刻能利用上一时刻句子中的信息。LSTM网络结构见图2。
LSTM网络的基本结构由4个部分组成:即输入门it、输出门ot、遗忘门ft和记忆单元Ct。遗忘门决定是否保留记忆单元之前的信息,遗忘门的输出为:
ft=σ(Wfhht-1+Wfxxt+bf) (2’)
式中,ht-1为t-1时刻隐藏层的输出;xt为当前时刻的输入;σ为sigmoid激活函数;Wfh为遗忘门的ht-1的权值;Wfx为遗忘门的xt的权重;bf为遗忘门的偏置参数。
输入门和记忆单元的状态更新如式(3’)、(4’)、(5’)所示:
it=σ(Wihht-1+Wixxt+bi) (3’)
式中,Wih为输入门的ht-1的权值;Wix为输入门的xt的权重;bi为输入门的偏置参数。为待更新的记忆单元状态;tanh为产生的激活函数;Wch为的ht-1的权值;Wcx为的xt的权重;bc为的偏置参数。Ct和Ct-1为t和t-1时刻的记忆单元状态。式(4)表明,记忆单元的状态由遗忘门控制的历史信息和输入门控制的共同决定。LSTM网络更新记忆单元后,其输出状态的具体表达式为:
ot=σ(Wohht-1+Woxxt+bo) (6’)
ht=ot·tanh(Ct) (7’)
式中,Woh为输出门的ht-1的权值;Wox为输出门的xt的权重;bo为输出门的偏置参数。ht为当前时刻隐藏层的输出。表达式(6)说明LSTM网络的输出由输出门控制的记忆单元决定,并由输出门决定其对结果的影响程度。
②Dropout层。在深度学习问题中,过拟合是一个很常见的问题。过拟合是指只能拟合训练数据,对于不在训练集中的数据不能很好地拟合,泛化能力差。对于复杂的网络模型,会使用Dropout方法防止过拟合。Dropout是指在深度学习的训练过程中,每次更新参数时随机断开一定比例的神经元,减弱神经元对某些局部特征的依赖性,从而提高模型的泛化能力。
③全连接层。全连接层使用了softmax激励函数作为输出层的多层感知,其他很多分类器如支持向量机也使用了softmax。“全连接”指的是当前层与前一层网络的所有神经元是相互连接的,将提取的高维特征进行降维。该层一般位于网络的末端,最后一层的单元数与分类个数相同,并且常与softmax激活函数配合使用,以实现对输出特征的分类。
(2)训练算法
神经网络学习的目的是找到使损失函数值最小的参数,这是求解最优参数问题。目前常用的梯度下降算法,例如,动量法,涅斯捷罗夫加速梯度法,Adam法,随机梯度下降法。
采用Adam算法对网络模型进行训练。网络的训练过程包括前向传播和反向传播两个阶段。首先在前向传播中计算输入信号的乘积及其对应的权重,然后将激活函数作用于这些乘积的总和,得到的输出结果与真实值形成误差。在网络的反向传播过程中回传相关误差,通过计算损失函数对于对各参数的梯度,根据梯度下降法对权值W和偏置b进行更新:
选取交叉熵误差作为损失函数,计算公式如下:
步骤3:构建再调度模型,输入机组启停状态和负荷的预测数据,得到机组出力值,具体包括:
再调度模型的输入为机组启停状态和负荷的预测数据,输出为机组出力值。网络模型构建和训练算法如下:
模型构建与上述预调度模型一致,此处不再赘述。
在训练过程中,采用Adam算法对参数进行调整。网络的训练过程包括前向传播和反向传播两个阶段。首先在前向传播中计算输入信号的乘积及其对应的权重,然后将激活函数作用于这些乘积的总和,得到的输出结果与真实值形成误差。在网络的反向传播过程中回传相关误差,通过计算损失函数对于对各参数的梯度,根据梯度下降法对权值W和偏置b进行更新,如式(2)、式(3)所示:
选取均方误差作为损失函数,计算公式如式(5)所示:
为使本领域技术人员更好地理解本发明以及了解本发明相对现有技术的优点,申请人结合具体实施例进行进一步的阐释。
实施例:
为了验证所提模型的合理性,采用IEEE 30系统作为算例,该系统有6台常规机组。本专利使用MATLAB2016a上调用YALMIP和Gurobi-8.0.1产生100组数据集,以6:2:2的比例划分为训练集、验证集和测试集,利用python完成数据的预处理。并在基于TensorFlow后端的keras深度学习框架下进行模型的搭建、训练和测试。硬件仿真环境为Intel(R)Core(TM)i7-6700HQ CPU@2.60GHz,运行内存大小为4GB。
1.预调度模型
图3为预调度输出结果的准确率,可以看出本专利建立的深度学习模型能够准确地预测火电机组启停状态。
2.再调度模型
图4为再调度过程训练400次损失值变化情况,可以发现随着训练的进行,损失函数的值在不断减小。提出的深度学习模型在学习,网络的权重参数在拟合数据,向最优参数靠近。模型训练到一定次数后,损失值下降到接近于0的稳定值。
表1为使用Dropout的性能比较,为了证明使用Dropout的有效性,本专利建立了一组对比实验。表1中的实验结果表明,使用Dropout后,模型的性能有所提高。这表明使用Dropout能有效地抑制过拟合,提高模型的泛化能力。
表1使用Dropout的性能比较
基于LSTM深度学习的机组组合模型需要大量的样本参与训练,若样本数量不足以支撑模型的训练和学习,则会影响模型的准确性。从图5中可以看出,当训练容量为10时,模型准确度为99.33%。;而当训练样本容量增加到60时,模型准确度达到了99.94%。这表明随着训练样本容量的增加,模型的预测结果更加精确。
学习率决定了权重迭代的步长,是一个非常敏感的参数。过大则导致模型不收敛,过小则导致模型收敛特别慢或者无法学习,故选取适当的学习率将有效地提高网络识别的性能。随着学习率的增加,模型的训练集精度增加,直到超过验证集,模型可能会从欠拟合状态过度到过拟合状态。为了对学习率的参数设置进行分析,固定其他网络参数不变,考察不同学习率对网络性能的影响。从图6可以看出,较小或较大学习率均会导致模型无法有效学习,使得损失值较大;而学习率为0.01时得到了较好的网络性能,因此选取大小为0.01的学习率。
深度学习作为新兴的研究热点,正逐步应用于电力系统优化调度的各领域。本专利针对机组组合问题,提出了基于LSTM的机组组合模型,利用两步深度学习算法,提取数据的时序特征,实现对机组组合决策的预测。相较传统方法中依赖严谨的公式推导,该方法无需复杂的物理模型计算,根据训练得出的机组组合映射关系,即可直接得到机组组合计划。实验结果表明,根据所提出模型得到的机组组合计划,能够达到较高的计算精度,且适用性较高,可作为辅助性决策工具为调控人员提供参考。
与现有技术相比,本发明的有益效果为:
本发明所提出的深度学习模型通过学习大量的历史数据,模型训练完成后得出机组组合映射关系。在实时决策中,调用训练好的深度学习模型,即可直接得到机组组合计划,无需通过复杂的物理模型计算。实验结果表明,根据所提出模型得到的机组组合计划,能够达到较高的计算精度,且适用性较高,可作为辅助性决策工具为调控人员提供参考。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的权利要求范围之内。
Claims (4)
1.一种基于LSTM的机组组合计算方法,其特征在于,包括以下步骤:
步骤一、使用MinMaxScaler归一化方法和K-means聚类算法对机组的历史数据进行预处理,并构建预调度模型和再调度模型,通过两步深度学习得到次日的机组组合计划;所构建的预调度模型和再调度模型采用LSTM神经网络,通过学习大量的历史数据,模型训练完成后得出机组组合映射关系;
步骤二、在实时决策中,调用步骤一中所得到的机组组合映射关系,首先,输入负荷的预测数据,得到机组启停状态;接着,输入机组启停状态和负荷的预测数据,得到机组出力值。
3.根据权利要求1所述的一种基于LSTM的机组组合计算方法,其特征在于,所述预调度模型包括LSTM神经网络层、Dropout层、全连接层共三个部分,其输入为负荷的预测数据,输出为机组启停状态;
其中,所述LSTM神经网络层是基于RNN改善的结构模型,引入了存储单元和门机制,当前时刻能利用上一时刻句子中的信息;所述LSTM神经网络由4个部分组成:即输入门it、输出门ot、遗忘门ft和记忆单元Ct;
在所述Dropout层中,Dropout是指在深度学习的训练过程中,每次更新参数时随机断开一定比例的神经元,减弱神经元对某些局部特征的依赖性,从而提高模型的泛化能力;
所述全连接层使用了softmax激励函数作为输出层的多层感知;所述全连接指当前层与前一层网络的所有神经元是相互连接的,将提取的高维特征进行降维;该层;位于网络的末端,最后一层的单元数与分类个数相同,并且与softmax激活函数配合使用,以实现对输出特征的分类。
采用Adam算法对所述预调度模型进行训练,所述训练过程包括前向传播和反向传播两个阶段;首先,在前向传播中计算输入信号的乘积及其对应的权重,然后,将激活函数作用于这些乘积的总和,得到的输出结果与真实值所形成的误差;接着,在网络的反向传播过程中回传所形成的相关误差,通过计算损失函数对于对各参数的梯度,根据梯度下降法对权值W和偏置b进行更新,如式(2)、(3)所示
选取交叉熵误差作为损失函数,计算公式如式(4)所示:
4.根据权利要求1所述的一种基于LSTM的机组组合计算方法,其特征在于,
所述再调度模型的构建方法与上述预调度模型一致,其输入为机组启停状态和负荷的预测数据,输出为机组出力值;
在所述再调度模型的训练过程中,采用Adam算法对参数进行调整,所述训练过程包括前向传播和反向传播两个阶段;首先,在前向传播中计算输入信号的乘积及其对应的权重;然后,将激活函数作用于这些乘积的总和,得到的输出结果与真实值所形成的误差,在网络的反向传播过程中回传相关误差,通过计算损失函数对于对各参数的梯度,根据梯度下降法对权值W和偏置b进行更新,选取均方误差作为损失函数,计算公式如式(5)所示:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110770004.8A CN113420508B (zh) | 2021-07-07 | 2021-07-07 | 一种基于lstm的机组组合计算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110770004.8A CN113420508B (zh) | 2021-07-07 | 2021-07-07 | 一种基于lstm的机组组合计算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113420508A true CN113420508A (zh) | 2021-09-21 |
CN113420508B CN113420508B (zh) | 2024-02-27 |
Family
ID=77720544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110770004.8A Active CN113420508B (zh) | 2021-07-07 | 2021-07-07 | 一种基于lstm的机组组合计算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113420508B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113884809A (zh) * | 2021-09-28 | 2022-01-04 | 国网黑龙江省电力有限公司 | 一种基于神经网络的二次设备故障定位方法及系统 |
CN116526582A (zh) * | 2023-06-29 | 2023-08-01 | 南方电网数字电网研究院有限公司 | 基于人工智能联合驱动的电力机组组合调度方法与系统 |
CN117671921A (zh) * | 2023-11-27 | 2024-03-08 | 北京智城联合科技发展有限公司 | 一种城市桥梁实时监测预警系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107239859A (zh) * | 2017-06-05 | 2017-10-10 | 国网山东省电力公司电力科学研究院 | 基于串联长短期记忆循环神经网络的供热负荷预测方法 |
US20190236455A1 (en) * | 2018-01-31 | 2019-08-01 | Royal Bank Of Canada | Pre-training neural networks with human demonstrations for deep reinforcement learning |
CN110674459A (zh) * | 2019-09-16 | 2020-01-10 | 三峡大学 | 基于GRU和Seq2Seq技术的数据驱动型机组组合智能决策方法 |
CN111709550A (zh) * | 2020-05-07 | 2020-09-25 | 中国电力科学研究院有限公司 | 一种基于深度学习的联络线计划编制方法及系统 |
CN111753893A (zh) * | 2020-06-12 | 2020-10-09 | 国网福建省电力有限公司 | 一种基于聚类和深度学习的风电机组功率集群预测方法 |
WO2021007812A1 (zh) * | 2019-07-17 | 2021-01-21 | 深圳大学 | 一种深度神经网络超参数优化方法、电子设备及存储介质 |
-
2021
- 2021-07-07 CN CN202110770004.8A patent/CN113420508B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107239859A (zh) * | 2017-06-05 | 2017-10-10 | 国网山东省电力公司电力科学研究院 | 基于串联长短期记忆循环神经网络的供热负荷预测方法 |
US20190236455A1 (en) * | 2018-01-31 | 2019-08-01 | Royal Bank Of Canada | Pre-training neural networks with human demonstrations for deep reinforcement learning |
WO2021007812A1 (zh) * | 2019-07-17 | 2021-01-21 | 深圳大学 | 一种深度神经网络超参数优化方法、电子设备及存储介质 |
CN110674459A (zh) * | 2019-09-16 | 2020-01-10 | 三峡大学 | 基于GRU和Seq2Seq技术的数据驱动型机组组合智能决策方法 |
CN111709550A (zh) * | 2020-05-07 | 2020-09-25 | 中国电力科学研究院有限公司 | 一种基于深度学习的联络线计划编制方法及系统 |
CN111753893A (zh) * | 2020-06-12 | 2020-10-09 | 国网福建省电力有限公司 | 一种基于聚类和深度学习的风电机组功率集群预测方法 |
Non-Patent Citations (2)
Title |
---|
NIVETHITHA SOMU 等: "A deep learning framework for building energy consumption forecast", 《RENEWABLE AND SUSTAINABLE ENERGY REVIEWS》, vol. 137, pages 1 - 21 * |
陈国涛 等: "基于混合神经网络深度学习的短期负荷预测", 《水电能源科学》, vol. 38, no. 4, pages 193 - 196 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113884809A (zh) * | 2021-09-28 | 2022-01-04 | 国网黑龙江省电力有限公司 | 一种基于神经网络的二次设备故障定位方法及系统 |
CN116526582A (zh) * | 2023-06-29 | 2023-08-01 | 南方电网数字电网研究院有限公司 | 基于人工智能联合驱动的电力机组组合调度方法与系统 |
CN116526582B (zh) * | 2023-06-29 | 2024-03-26 | 南方电网数字电网研究院有限公司 | 基于人工智能联合驱动的电力机组组合调度方法与系统 |
CN117671921A (zh) * | 2023-11-27 | 2024-03-08 | 北京智城联合科技发展有限公司 | 一种城市桥梁实时监测预警系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113420508B (zh) | 2024-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113420508B (zh) | 一种基于lstm的机组组合计算方法 | |
CN106600059B (zh) | 基于改进rbf神经网络的智能电网短期负荷预测方法 | |
CN113408648B (zh) | 一种结合深度学习的机组组合计算方法 | |
Settle et al. | Discriminative acoustic word embeddings: Tecurrent neural network-based approaches | |
Peng et al. | Accelerating minibatch stochastic gradient descent using typicality sampling | |
CN111626336B (zh) | 一种基于不平衡数据集的地铁故障数据分类方法 | |
CN112069310B (zh) | 基于主动学习策略的文本分类方法及系统 | |
Dash et al. | Efficient stock price prediction using a self evolving recurrent neuro-fuzzy inference system optimized through a modified differential harmony search technique | |
CN109800875A (zh) | 基于粒子群优化和降噪稀疏编码机的化工故障检测方法 | |
CN106709820A (zh) | 一种基于深度置信网络的电力系统负荷预测方法及装置 | |
Hassan et al. | A hybrid of multiobjective Evolutionary Algorithm and HMM-Fuzzy model for time series prediction | |
CN110349597B (zh) | 一种语音检测方法及装置 | |
US20220027738A1 (en) | Distributed synchronous training architecture using stale weights | |
CN108879732B (zh) | 电力系统暂态稳定评估方法及装置 | |
CN102609714A (zh) | 基于信息增益和在线支持向量机的新型分类器及分类方法 | |
CN112947300A (zh) | 一种加工质量虚拟量测方法、系统、介质及设备 | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理系统 | |
CN104732067A (zh) | 一种面向流程对象的工业过程建模预测方法 | |
Bao et al. | Restricted Boltzmann Machine‐Assisted Estimation of Distribution Algorithm for Complex Problems | |
Khosla et al. | A comparison of computational efforts between particle swarm optimization and genetic algorithm for identification of fuzzy models | |
Nguyen-Trang et al. | An efficient hybrid optimization approach using adaptive elitist differential evolution and spherical quadratic steepest descent and its application for clustering | |
Liu et al. | Prediction of share price trend using FCM neural network classifier | |
He et al. | GA-based optimization of generative adversarial networks on stock price prediction | |
D'Angelo et al. | Multi-objective evolutionary optimization of subsonic airfoils by kriging approximation and evolution control | |
Gowramma et al. | IVF Success Rates Prediction Using Hybrid ANN-GA based Machine Learning Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |