CN108764539A - 一种梯级电站的上下游水位预测方法 - Google Patents
一种梯级电站的上下游水位预测方法 Download PDFInfo
- Publication number
- CN108764539A CN108764539A CN201810464065.XA CN201810464065A CN108764539A CN 108764539 A CN108764539 A CN 108764539A CN 201810464065 A CN201810464065 A CN 201810464065A CN 108764539 A CN108764539 A CN 108764539A
- Authority
- CN
- China
- Prior art keywords
- upstream
- output
- lstm
- error
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000011144 upstream manufacturing Methods 0.000 title claims abstract description 46
- 230000008569 process Effects 0.000 claims abstract description 27
- 230000000644 propagated effect Effects 0.000 claims abstract description 19
- 125000006850 spacer group Chemical group 0.000 claims abstract description 3
- 238000012549 training Methods 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 7
- IOYNQIMAUDJVEI-BMVIKAAMSA-N Tepraloxydim Chemical group C1C(=O)C(C(=N/OC\C=C\Cl)/CC)=C(O)CC1C1CCOCC1 IOYNQIMAUDJVEI-BMVIKAAMSA-N 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 6
- 238000011478 gradient descent method Methods 0.000 claims description 6
- 230000007787 long-term memory Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 230000007774 longterm Effects 0.000 claims description 2
- 230000015654 memory Effects 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 description 11
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 9
- 238000005065 mining Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000004218 nerve net Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000009182 swimming Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000008717 functional decline Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Biophysics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种梯级电站的上下游水位预测方法,它包括以下步骤:步骤1,选取输入变量与输出变量;步骤2,对数据进行标准化处理,消除量纲的影响;步骤3,确定输入向量维数、LSTM层数、输出向量维数,以及时间步;步骤4,LSTM的前向传播过程和误差反向传播过程;前向传播过程按时间步依次输入LSTM网络,得到相应的输出值;以输出值与真实值的误差平方和为损失函数,进行误差沿时间反向传播来更新参数;步骤5,运用训练好的模型进行多时刻连续预测。将LSTM应用到梯级电站的水位预测中,可以捕捉到上游电站对下游电站的滞后性影响信息,提高预测精度,为科学的调度决策提供更加可靠的理论支撑。
Description
技术领域
本发明涉及一种梯级电站的上下游水位预测方法,属于水位预测技术领域。
背景技术
水位预测是指提前一定时间对水电站上游或下游水位进行预测。准确的水位预测对水电站调度意义重大,然而,水电站在运行过程中受到诸多因素影响,导致水电站的水位变化预测通常偏差会较大,进而影响到调度方案的实施效果。特别是具有紧密水力联系的梯级水电站,其水位上涨、下落存在滞后性,涨水、平水、退水后的稳定水位也不相同,使得下游径流式电站水位的准确预测更难实现。
目前,水利水电行业大多采用出库流量来预测水位,或者将水位数据看成时间序列建立相应预测模型。如王蒙蒙等基于支持向量回归模型对洞庭湖水位进行了预测,其预测变量为三峡逐日出库流量、清江逐日流量及洞庭湖“四水”逐日入湖流量。李欣等建立基于时空序列的RBF神经网络预测模型,来预测金沙江下游向家坝水文站的水位情况。Ashaary等采用BP神经网络来预测Timah Tasoh水库的水位变化,其采用窗处理的方式将前w个时刻的水位数据作为一个输入样本。但在梯级电站的水位预测方面,尤其是下游电站的水位,由于梯级电站之间的紧密联系,上游电站的运行情况会影响到下级电站的水位,并且因水流传播导致影响存在时间滞后性,而普通的前馈神经网络如BP神经网络或RBF神经网络难以捕捉这一特征。并且,若采用窗处理的方式将前多个时刻的水位和出力数据作为输入样本,会使输入层节点偏多,若进一步要连续预测多时刻的上下游水位,则输入层节点会随之增多,导致模型训练参数偏多,这无疑会加大模型训练的难度,降低学习效率。
发明内容
本发明提供一种梯级电站的上下游水位预测方法,此预测方法基于长短时记忆网络(Long Short-Term Memory,LSTM)。LSTM是循环神经网络的一种成功变体,能够克服原始循环神经网络的不足,学习到数据之间的长期依赖关系,将LSTM应用到水电站的水位预测中,可以保留有用的历史信息,将过去时刻的上下游水电站运行数据以及上游电站水位数据的影响反映到当前下游电站的水位预测之中。
为了实现上述的技术特征,本发明的目的是这样实现的:一种梯级电站的上下游水位预测方法,其特征在于,它包括以下步骤:
步骤1,选取输入变量与输出变量;
步骤2,对数据进行标准化处理,消除量纲的影响;
步骤3,确定输入向量维数、LSTM层数、输出向量维数,以及时间步;
步骤4,LSTM的前向传播过程和误差反向传播过程;前向传播过程按时间步依次输入LSTM网络,得到相应的输出值;以输出值与真实值的误差平方和为损失函数,进行误差沿时间反向传播来更新参数;
步骤5,运用训练好的模型进行多时刻连续预测。
2、根据权利要求1所述的一种梯级电站的上下游水位预测方法,其特征在于:所述步骤1中的输入变量为上游电站和下游电站各分电厂的出力,上游电站的上游水位;所述输出变量为下游电站的上下游水位。
3、根据权利要求1所述的一种梯级电站的上下游水位预测方法,其特征在于:所述步骤2中标准化处理过程为:
采用min-max标准化的方法,将步骤1中原始值映射到[-1,1]区间,转换函数如下:
其中,x为原始数据,x′为标准化后的数据,min为样本的最小值,max为样本的最大值。
4、根据权利要求1所述的一种梯级电站的上下游水位预测方法,其特征在于:所述步骤3中输入向量维数是指输入变量的个数;输出向量维数是指输出变量的个数;LSTM层数一般设置为1-3即可;时间步是指训练模型时每个子序列的时间数。时间步的确定采用网格搜索的方法,首先结合实际情况划分合理的范围,然后在此范围内依次进行模型训练,根据验证集损失函数最小的原则确定时间步。
5、根据权利要求1所述的一种梯级电站的上下游水位预测方法,其特征在于:所述步骤4中LSTM的前向传播过程和误差反向传播过程的详细过程为:
ct-1表示t-1时刻隐含层的单元状态,根据历史信息和当前信息来更新,用于储存长期记忆;ht-1表示t-1时刻隐含层的输出;LSTM中有三个门:输入门、遗忘门和输出门;其中it表示输入门,用以控制当前时刻的输入信息有多少会保存到单元状态中;ft表示遗忘门,用以控制前一时刻的单元状态会有多少保留到当前的状态中;ot表示输出门,用以控制新的单元状态会有多少输出到ht中;表示t时刻输入的单元状态,包含t时刻输入的信息;ct表示t时刻隐含层的单元状态,根据历史信息和当前信息来更新,用于储存长期记忆;ht表示t时刻隐含层的输出;σ表示sigmoid激活函数,tanh表示tanh激活函数。
前向传播过程的具体公式为:
遗忘门:
netf,t=Wfhht-1+Wfxxt+bf
ft=σ(netf,t) (2)
输入门:
neti,t=Wihht-1+Wixxt+bi
it=σ(neti,t) (3)
输出门:
neto,t=Wohht-1+Woxxt+bo
ot=σ(neto,t) (4)
当前输入的单元状态:
netc~,t=Wchht-1+Wcxxt+bc
隐含层的单元状态:
隐含层的输出:
输出层:
其中,表示对应元素相乘,Wfh,Wfx,Wih,Wix,Woh,Wox,Wch,Wcx,Wy分别是对应的权重矩阵,bf,bi,bo,bc,by分别为对应的偏置项;
LSTM的训练算法仍然是误差反向传播算法;由于LSTM的前向传播过程是从左到右的有序传播,因此误差反向传播过程也是沿时间反向传递,称为BPTT算法;要训练的参数包括权重矩阵Wfh,Wfx,Wih,Wix,Woh,Wox,Wch,Wcx,Wy和偏置项bf,bi,bo,bc,by;将误差沿时间反向传播,需要计算每个时刻的误差项;设t时刻真实值dt与输出层估计值yt的误差为et,0到T时刻的总误差为E,即:
需要说明的是,其中:表示梯度,如表示E对nety,t的梯度;进一步可以计算各个梯度分别为:
由和可得:
进而得到权重矩阵和偏置项的梯度:
由以上梯度公式就可以采用梯度下降法来更新权重和偏置项,本发明将梯度下降法和拟牛顿法中的BFGS算法相结合,在初始阶段误差比较大时,采用下降梯度法,当总误差减小到一定程度后,采用BFGS法来训练,并通过Wolfe-Powell线搜索来搜索合适的步长,提高了迭代效率,Wolfe-Powell线搜索准则为:
其中,ω表示模型中的所有参数,E(·)表示损失函数,E′(·)表示损失函数的梯度,δω表示下降方向,α表示搜索步长。
6、根据权利要求1所述的一种梯级电站的上下游水位预测方法,其特征在于:所述步骤5中在预测时,输入样本按照训练时的标准化方法进行标准化,得到的模型输出再进行反标准化即为水位预测值,即:
其中,x′为模型输出,x为反标准化后的预测值,min为训练样本的最小值,max为训练样本的最大值。
本发明有如下有益效果:
1、随着大数据战略的全面推进,基于机器学习的数据挖掘技术不断延伸到各种研究领域,尤其是人工智能的发展,为数据挖掘提供了新的思路。在神经网络中,循环神经网络能够考虑到数据的时序性特点,对历史的信息进行记忆并应用于当前的计算当中,因此在处理序列数据方面具有独特的优势。长短时记忆网络作为循环神经网络的一种成功变体,能够克服原始循环神经网络中存在的梯度消失或梯度爆炸问题,学习到数据之间的长期依赖关系。将LSTM应用到水电站的水位预测中,可以捕捉到上游电站对下游电站的滞后性影响信息,以及可以筛选出有用的信息,进一步提高预测精度。
2、本方法的应用,可以准确预测下游水电站连续多个时刻的上、下游水位,改善了梯级水电站多时刻水位预测能力,为科学的调度决策提供了更加可靠的理论支撑。
附图说明
下面结合附图和实施例对本发明作进一步说明。
图1为水位预测的输入变量和输出变量。
图2为LSTM的隐层单元结构图。
图3为LSTM神经网络的基本结构图。
图4为基于LSTM的上下游水位预测模型框架。
图5为B电站上游水位连续6小时水位预测误差直方图。
图6为B电站下游游水位连续6小时水位预测误差直方图。
图7为GD-BFGS算法与ADAM算法在优化性能上的差异对比图。
附表说明
表1为梯度下降法与BFGS算法相结合的参数更新算法。
表2为B水库连续6小时上游水位预测结果表。
表3为B水库连续6小时下游水位预测结果表。
附表说明
表1为梯度下降法与BFGS算法相结合的参数更新算法。
表2为GD-BFGS算法训练模型得到的B水库连续6小时上游水位预测结果表。
表3为GD-BFGS算法训练模型得到的B水库连续6小时下游水位预测结果表。
表4为ADAM算法训练模型得到的B水库连续6小时下游水位预测结果表。
表5为ADAM算法训练模型得到的B水库连续6小时下游水位预测结果表。
具体实施方式
下面通过实施例,结合图表,对本发明的技术方案做进一步说明。
实施例1:
步骤1,选取输入变量与输出变量。输入变量为上游电站和下游电站各个分电厂出力,以及上游电站的上游水位。由于电站的流量数据均是估算得到的,本身含有一定的偏差,因此没有考虑流量的数据,而是通过水位和有功等实时监测数据来间接反映流量的隐含变化。输出变量为下游电站的上下游水位。具体见图1。
步骤2,对数据进行标准化处理,消除量纲的影响。采用min-max标准化的方法,将步骤1中的原始值映射到[-1,1]区间,转换函数如下:
其中,x为原始数据,x′为标准化后的数据,min为样本的最小值,max为样本的最大值。
步骤3,确定输入向量维数、LSTM层数、输出向量维数,以及时间步。输入向量维数是指输入变量的个数;输出向量维数是指输出变量的个数;LSTM层数一般设置为1-3即可;时间步是指训练模型时每个子序列的时间数。时间步的确定采用网格搜索的方法,首先结合实际情况划分合理的范围,然后在此范围内依次进行模型训练,根据验证集损失函数最小的原则确定时间步。
步骤4,LSTM的前向传播过程和误差反向传播过程。LSTM的隐层单元结构图见图2,LSTM神经网络的基本结构图见图3。在图2中,ct-1表示t-1时刻隐含层的单元状态,根据历史信息和当前信息来更新,用于储存长期记忆;ht-1表示t-1时刻隐含层的输出;LSTM中有三个门:输入门、遗忘门和输出门,其中it表示输入门,用以控制当前时刻的输入信息有多少会保存到单元状态中;ft表示遗忘门,用以控制前一时刻的单元状态会有多少保留到当前的状态中;ot表示输出门,用以控制新的单元状态会有多少输出到ht中;表示t时刻输入的单元状态,包含t时刻输入的信息;ct表示t时刻隐含层的单元状态,根据历史信息和当前信息来更新,用于储存长期记忆;ht表示t时刻隐含层的输出;σ表示sigmoid激活函数,tanh表示tanh激活函数。
前向传播过程的具体公式为:
遗忘门:
netf,t=Wfhht-1+Wfxxt+bf
ft=σ(netf,t) (2)
输入门:
neti,t=Wihht-1+Wixxt+bi
it=σ(neti,t) (3)
输出门:
neto,t=Wohht-1+Woxxt+bo
ot=σ(neto,t) (4)
当前输入的单元状态:
netc~,t=Wchht-1+Wcxxt+bc
隐含层的单元状态:
隐含层的输出:
输出层:
其中,表示对应元素相乘,Wfh,Wfx,Wih,Wix,Woh,Wox,Wch,Wcx,Wy分别是对应的权重矩阵,bf,bi,bo,bc,by分别为对应的偏置项,yt为输出层估计值;
LSTM的训练算法仍然是误差反向传播算法。由于LSTM的前向传播过程是从左到右的有序传播,因此误差反向传播过程也是沿时间反向传递,称为BPTT算法。要训练的参数包括权重矩阵Wfh,Wfx,Wih,Wix,Woh,Wox,Wch,Wcx,Wy和偏置项bf,bi,bo,bc,by。将误差沿时间反向传播,需要计算每个时刻的误差项。设t时刻真实值dt与输出层估计值yt的误差为et,0到T时刻的总误差为E,即:
需要说明的是,其中:表示梯度,如表示E对nety,t的梯度;进一步可以计算各个梯度分别为:
由和可得:
进而得到权重矩阵和偏置项的梯度:
由以上梯度公式就可以采用梯度下降法来更新权重和偏置项。本发明将梯度下降法和拟牛顿法中的BFGS算法相结合(GD-BFGS),在初始阶段误差比较大时,采用下降梯度法,当总误差减小到一定程度后,采用BFGS法来训练,并通过Wolfe-Powell线搜索来搜索合适的步长,提高了迭代效率。Wolfe-Powell线搜索准则为:
其中,ω表示模型中的所有参数,E(·)表示损失函数,E′(·)表示损失函数的梯度,δω表示下降方向,α表示搜索步长。
这个搜索准则是为了保证α足够的小以使目标函数下降,同时又足够的大以保证新的迭代点远离当前点。参数更新算法过程见表1,模型框架见图4。
步骤5,运用训练好的模型进行预测。在预测时,输入样本按照训练时的标准化方法进行标准化,得到的模型输出再进行反标准化即为水位预测值,即
其中,x′为模型输出,x为反标准化后的预测值,min为训练样本的最小值,max为训练样本的最大值。
表1GD-BFGS的参数更新算法
实施例2
以A电站和B电站构成的梯级电站为例进行说明,其中A电站表示上游水电站,B电站表示下游水电站。输入向量维数为8维,输出向量维数为2维,LSTM层数为1层,LSTM层单元数为20,时间步为60。采用本发明设计的算法进行训练,得到B电站上游水位连续6小时水位预测误差直方图见图5,B电站下游游水位连续6小时水位预测误差直方图见图6,B水库上游水位连续6小时水位预测误差结果表见表2,B水库下游水位连续6小时水位预测误差结果表见表3。
表2B水库上游水位连续6小时水位预测误差结果表(GD-BFGS)
表3B水库下游水位连续6小时水位预测误差结果表(GD-BFGS)
说明:
(1)平均绝对误差(MAE)和均方根误差(RMSE)的计算公式为:
其中,yi表示真实值,表示预测值,N表示预测样本的个数。
(2)表中的时刻列表示根据当前时刻连续预测下6个时刻的水位。
(3)表中的均值、标准差、90%区间、MAE和RMSE均是根据水位预测的误差数据来计算。
对比分析
表4和表5分别为采用神经网络中应用较广泛的ADAM算法训练得到的B水库上游水位连续6小时水位预测误差结果表和B水库下游水位连续6小时水位预测误差结果表。对比表2和表3可以发现GD-BFGS算法训练模型得到的误差结果的各项评价指标都优于ADAM算法。图7为GD-BFGS算法与ADAM算法在优化性能上的差异对比图,可以看出GD-BFGS算法相比于ADAM算法具有快速收敛的特征。
表4B水库上游水位连续6小时水位预测误差结果表(ADAM)
表5B水库下游水位连续6小时水位预测误差结果表(ADAM)
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。
Claims (6)
1.一种梯级电站的上下游水位预测方法,其特征在于,它包括以下步骤:
步骤1,选取输入变量与输出变量;
步骤2,对数据进行标准化处理,消除量纲的影响;
步骤3,确定输入向量维数、LSTM层数、输出向量维数,以及时间步;
步骤4,LSTM的前向传播过程和误差反向传播过程;前向传播过程按时间步依次输入LSTM网络,得到相应的输出值;以输出值与真实值的误差平方和为损失函数,进行误差沿时间反向传播来更新参数;
步骤5,运用训练好的模型进行多时刻连续预测。
2.根据权利要求1所述的一种梯级电站的上下游水位预测方法,其特征在于:所述步骤1中的输入变量为上游电站和下游电站各分电厂的出力,上游电站的上游水位;所述输出变量为下游电站的上下游水位。
3.根据权利要求1所述的一种梯级电站的上下游水位预测方法,其特征在于:所述步骤2中标准化处理过程为:
采用min-max标准化的方法,将步骤1中原始值映射到[-1,1]区间,转换函数如下:
其中,x为原始数据,x′为标准化后的数据,min为样本的最小值,max为样本的最大值。
4.根据权利要求1所述的一种梯级电站的上下游水位预测方法,其特征在于:所述步骤3中输入向量维数是指输入变量的个数;输出向量维数是指输出变量的个数;LSTM层数一般设置为1-3即可;时间步是指训练模型时每个子序列的时间数。时间步的确定采用网格搜索的方法,首先结合实际情况划分合理的范围,然后在此范围内依次进行模型训练,根据验证集损失函数最小的原则确定时间步。
5.根据权利要求1所述的一种梯级电站的上下游水位预测方法,其特征在于:所述步骤4中LSTM的前向传播过程和误差反向传播过程的详细过程为:
ct-1表示t-1时刻隐含层的单元状态,根据历史信息和当前信息来更新,用于储存长期记忆;ht-1表示t-1时刻隐含层的输出;LSTM中有三个门:输入门、遗忘门和输出门;其中it表示输入门,用以控制当前时刻的输入信息有多少会保存到单元状态中;ft表示遗忘门,用以控制前一时刻的单元状态会有多少保留到当前的状态中;ot表示输出门,用以控制新的单元状态会有多少输出到ht中;表示t时刻输入的单元状态,包含t时刻输入的信息;ct表示t时刻隐含层的单元状态,根据历史信息和当前信息来更新,用于储存长期记忆;ht表示t时刻隐含层的输出;σ表示sigmoid激活函数,tanh表示tanh激活函数。
前向传播过程的具体公式为:
遗忘门:
netf,t=Wfhht-1+Wfxxt+bf
ft=σ(netf,t) (2)
输入门:
neti,t=Wihht-1+Wixxt+bi
it=σ(neti,t) (3)
输出门:
neto,t=Wohht-1+Woxxt+bo
ot=σ(neto,t) (4)
当前输入的单元状态:
netc~,t=Wchht-1+Wcxxt+bc
隐含层的单元状态:
隐含层的输出:
输出层:
其中,表示对应元素相乘,Wfh,Wfx,Wih,Wix,Woh,Wox,Wch,Wcx,Wy分别是对应的权重矩阵,bf,bi,bo,bc,by分别为对应的偏置项;
LSTM的训练算法仍然是误差反向传播算法;由于LSTM的前向传播过程是从左到右的有序传播,因此误差反向传播过程也是沿时间反向传递,称为BPTT算法;要训练的参数包括权重矩阵Wfh,Wfx,Wih,Wix,Woh,Wox,Wch,Wcx,Wy和偏置项bf,bi,bo,bc,by;将误差沿时间反向传播,需要计算每个时刻的误差项;设t时刻真实值dt与输出层估计值yt的误差为et,0到T时刻的总误差为E,即:
需要说明的是,其中:▽表示梯度,如表示E对nety,t的梯度;进一步可以计算各个梯度分别为:
由▽htE和▽ctE可得:
进而得到权重矩阵和偏置项的梯度:
由以上梯度公式就可以采用梯度下降法来更新权重和偏置项,本发明将梯度下降法和拟牛顿法中的BFGS算法相结合,在初始阶段误差比较大时,采用下降梯度法,当总误差减小到一定程度后,采用BFGS法来训练,并通过Wolfe-Powell线搜索来搜索合适的步长,提高了迭代效率,Wolfe-Powell线搜索准则为:
其中,ω表示模型中的所有参数,E(·)表示损失函数,E′(·)表示损失函数的梯度,δω表示下降方向,α表示搜索步长。
6.根据权利要求1所述的一种梯级电站的上下游水位预测方法,其特征在于:所述步骤5中在预测时,输入样本按照训练时的标准化方法进行标准化,得到的模型输出再进行反标准化即为水位预测值,即:
其中,x′为模型输出,x为反标准化后的预测值,min为训练样本的最小值,max为训练样本的最大值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810464065.XA CN108764539B (zh) | 2018-05-15 | 2018-05-15 | 一种梯级电站的上下游水位预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810464065.XA CN108764539B (zh) | 2018-05-15 | 2018-05-15 | 一种梯级电站的上下游水位预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108764539A true CN108764539A (zh) | 2018-11-06 |
CN108764539B CN108764539B (zh) | 2021-10-15 |
Family
ID=64007854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810464065.XA Active CN108764539B (zh) | 2018-05-15 | 2018-05-15 | 一种梯级电站的上下游水位预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108764539B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492839A (zh) * | 2019-01-17 | 2019-03-19 | 东华大学 | 一种基于rnn-lstm网络的矿热炉工况预测方法 |
CN109543912A (zh) * | 2018-11-29 | 2019-03-29 | 中国水利水电科学研究院 | 基于深度学习的水库最优调度决策模型生成方法 |
CN109919994A (zh) * | 2019-01-08 | 2019-06-21 | 浙江大学 | 一种基于深度学习图像处理的采煤机滚筒自动调高系统 |
CN109977747A (zh) * | 2019-01-08 | 2019-07-05 | 浙江大学 | 一种综合时空特征的煤矸识别系统 |
CN110188263A (zh) * | 2019-05-29 | 2019-08-30 | 国网山东省电力公司电力科学研究院 | 一种面向异构时距的科学研究热点预测方法及系统 |
CN110414742A (zh) * | 2019-08-02 | 2019-11-05 | 大连海事大学 | 一种多水位站联动的内河水位智能预测方法 |
CN111222698A (zh) * | 2020-01-06 | 2020-06-02 | 重庆邮电大学 | 面向物联网的基于长短时记忆网络的积水水位预测方法 |
CN111340284A (zh) * | 2020-02-24 | 2020-06-26 | 成都大汇物联科技有限公司 | 一种基于长短时记忆网络的水车室水位智能预测方法 |
WO2020143409A1 (zh) * | 2019-01-07 | 2020-07-16 | 阿里巴巴集团控股有限公司 | 预测业务指标的方法及装置 |
CN111435469A (zh) * | 2019-01-11 | 2020-07-21 | 中国长江电力股份有限公司 | 一种梯级电站中下游电站入库流量的预测方法 |
CN111475948A (zh) * | 2020-04-07 | 2020-07-31 | 青岛理工大学 | 一种基于lstm网络的地铁隧道施工时沉降新型预测方法 |
CN113344288A (zh) * | 2021-06-28 | 2021-09-03 | 南京大学 | 梯级水电站群水位预测方法、装置及计算机可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855524A (zh) * | 2012-08-14 | 2013-01-02 | 贵州乌江水电开发有限责任公司 | 多年调节水库年末消落水位预测方法及系统 |
CN106127612A (zh) * | 2016-07-05 | 2016-11-16 | 中国长江电力股份有限公司 | 水电站非弃水期下游水位变化过程预测方法 |
-
2018
- 2018-05-15 CN CN201810464065.XA patent/CN108764539B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855524A (zh) * | 2012-08-14 | 2013-01-02 | 贵州乌江水电开发有限责任公司 | 多年调节水库年末消落水位预测方法及系统 |
CN106127612A (zh) * | 2016-07-05 | 2016-11-16 | 中国长江电力股份有限公司 | 水电站非弃水期下游水位变化过程预测方法 |
Non-Patent Citations (1)
Title |
---|
트란 광 카이;송사광: "Water Level Forecasting based on Deep Learning : A Use Case of Trinity River-Texas-The United States", 《JOURNAL OF KIISE》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543912B (zh) * | 2018-11-29 | 2021-10-01 | 中国水利水电科学研究院 | 基于深度学习的水库最优调度决策模型生成方法 |
CN109543912A (zh) * | 2018-11-29 | 2019-03-29 | 中国水利水电科学研究院 | 基于深度学习的水库最优调度决策模型生成方法 |
WO2020143409A1 (zh) * | 2019-01-07 | 2020-07-16 | 阿里巴巴集团控股有限公司 | 预测业务指标的方法及装置 |
CN109977747A (zh) * | 2019-01-08 | 2019-07-05 | 浙江大学 | 一种综合时空特征的煤矸识别系统 |
CN109919994A (zh) * | 2019-01-08 | 2019-06-21 | 浙江大学 | 一种基于深度学习图像处理的采煤机滚筒自动调高系统 |
CN111435469A (zh) * | 2019-01-11 | 2020-07-21 | 中国长江电力股份有限公司 | 一种梯级电站中下游电站入库流量的预测方法 |
CN111435469B (zh) * | 2019-01-11 | 2022-04-19 | 中国长江电力股份有限公司 | 一种梯级电站中下游电站入库流量的预测方法 |
CN109492839A (zh) * | 2019-01-17 | 2019-03-19 | 东华大学 | 一种基于rnn-lstm网络的矿热炉工况预测方法 |
CN110188263A (zh) * | 2019-05-29 | 2019-08-30 | 国网山东省电力公司电力科学研究院 | 一种面向异构时距的科学研究热点预测方法及系统 |
CN110188263B (zh) * | 2019-05-29 | 2021-11-30 | 国网山东省电力公司电力科学研究院 | 一种面向异构时距的科学研究热点预测方法及系统 |
CN110414742A (zh) * | 2019-08-02 | 2019-11-05 | 大连海事大学 | 一种多水位站联动的内河水位智能预测方法 |
CN111222698A (zh) * | 2020-01-06 | 2020-06-02 | 重庆邮电大学 | 面向物联网的基于长短时记忆网络的积水水位预测方法 |
CN111340284A (zh) * | 2020-02-24 | 2020-06-26 | 成都大汇物联科技有限公司 | 一种基于长短时记忆网络的水车室水位智能预测方法 |
CN111475948A (zh) * | 2020-04-07 | 2020-07-31 | 青岛理工大学 | 一种基于lstm网络的地铁隧道施工时沉降新型预测方法 |
CN113344288A (zh) * | 2021-06-28 | 2021-09-03 | 南京大学 | 梯级水电站群水位预测方法、装置及计算机可读存储介质 |
CN113344288B (zh) * | 2021-06-28 | 2023-12-01 | 南京大学 | 梯级水电站群水位预测方法、装置及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108764539B (zh) | 2021-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108764539A (zh) | 一种梯级电站的上下游水位预测方法 | |
Yang et al. | Real-time reservoir operation using recurrent neural networks and inflow forecast from a distributed hydrological model | |
CN106709640A (zh) | 基于深度学习与支持向量回归的船舶能耗预测方法 | |
CN109615011A (zh) | 一种基于lstm的中小河流短期洪水预报方法 | |
Zhang et al. | Short-term water level prediction using different artificial intelligent models | |
CN108985515B (zh) | 一种基于独立循环神经网络的新能源出力预测方法及系统 | |
CN111815033A (zh) | 一种基于rcnn和气象时序特征的海上风电功率预测方法 | |
CN110363349B (zh) | 一种基于ascs的lstm神经网络水文预测方法及系统 | |
CN112116162B (zh) | 基于ceemdan-qfoa-lstm的输电线覆冰厚度预测方法 | |
CN110942194A (zh) | 一种基于tcn的风电预测误差区间评估方法 | |
CN111079989B (zh) | 一种基于dwt-pca-lstm的供水公司供水量预测装置 | |
CN110276472A (zh) | 一种基于lstm深度学习网络的海上风电功率超短期预测方法 | |
CN111199103A (zh) | 全电力推进船舶的全流程自动计算的航速优化方法及系统 | |
CN104050505A (zh) | 一种基于带学习因子蜂群算法的多层感知器训练方法 | |
CN112766603A (zh) | 一种交通流量预测方法、系统、计算机设备及存储介质 | |
CN115755219A (zh) | 基于stgcn的洪水预报误差实时校正方法及系统 | |
CN115186857A (zh) | 一种基于集成学习的神经网络水库水位预测方法 | |
CN111525587A (zh) | 一种基于无功负荷态势的电网无功电压控制方法及系统 | |
CN115310532A (zh) | 一种基于时空关联混合深度学习模型的流域多点预测预警方法 | |
Shen et al. | Short-term load forecasting of power system based on similar day method and PSO-DBN | |
Zaman et al. | Wind speed forecasting using ARMA and neural network models | |
CN109214513B (zh) | 一种基于自适应深度置信网络的固液废弃物智能耦合处理方法 | |
CN109146007B (zh) | 一种基于动态深度置信网络的固体废弃物智能处理方法 | |
CN116667369A (zh) | 一种基于图卷积神经网络的分布式光伏电压控制方法 | |
CN116663745A (zh) | 一种基于pca_ dwt的lstm流域水流量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |