CN115186857A - 一种基于集成学习的神经网络水库水位预测方法 - Google Patents
一种基于集成学习的神经网络水库水位预测方法 Download PDFInfo
- Publication number
- CN115186857A CN115186857A CN202210302734.XA CN202210302734A CN115186857A CN 115186857 A CN115186857 A CN 115186857A CN 202210302734 A CN202210302734 A CN 202210302734A CN 115186857 A CN115186857 A CN 115186857A
- Authority
- CN
- China
- Prior art keywords
- water level
- reservoir
- data
- output
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 198
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 27
- 238000012795 verification Methods 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 39
- 230000006870 function Effects 0.000 claims abstract description 29
- 238000012360 testing method Methods 0.000 claims abstract description 28
- 238000003062 neural network model Methods 0.000 claims abstract description 17
- 230000008859 change Effects 0.000 claims abstract description 15
- 238000010606 normalization Methods 0.000 claims abstract description 7
- 230000009466 transformation Effects 0.000 claims abstract description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 18
- 230000015654 memory Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 5
- 210000002569 neuron Anatomy 0.000 claims description 5
- 210000004205 output neuron Anatomy 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 238000013480 data collection Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims description 2
- 230000007787 long-term memory Effects 0.000 claims 2
- 230000006403 short-term memory Effects 0.000 claims 2
- GXFZCDMWGMFGFL-KKXMJGKMSA-N (+)-Tubocurarine chloride hydrochloride Chemical compound [Cl-].[Cl-].C([C@H]1[N+](C)(C)CCC=2C=C(C(=C(OC3=CC=C(C=C3)C[C@H]3C=4C=C(C(=CC=4CC[NH+]3C)OC)O3)C=21)O)OC)C1=CC=C(O)C3=C1 GXFZCDMWGMFGFL-KKXMJGKMSA-N 0.000 claims 1
- 239000008709 Curare Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Feedback Control In General (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于集成学习的神经网络水库水位预测方法,该方法包括:选取水库空间上相邻的各个水位站长期流入的水位历史数据,形成数据集;对数据集进行数值变换,即数据归一化,得到标准数据集,并对标准数据集划分为训练集、验证集和测试集;构建基于集成学习的神经网络模型,定义损失函数;选择标准数据集的数据对神经网络模型进行训练,并对训练后网络模型进行验证调参;采用Epoch‑Wise Bagging集成学习策略,选择验证后的M个最优网络模型进行测试,最终根据各个水位站的实时来水量组合预测水库未来1天以内的实时水位空间分布。该方法不仅考虑了水库水位流入水量数据时间关联性,还考虑了各个水位站间的空间相关性,更好地挖掘水库水位变化规律。
Description
技术领域
本发明属于水库水位实时预测技术领域,具体涉及一种基于集成学习的神经网络水库水位预测方法。
背景技术
水库水位是维持其生态系统结构、功能和完整性的基础。正常蓄积的水位决定水库的规模,效益和调节方式,同时又决定水工建筑物的尺寸,型式和水库的淹没损失,是水库调度最重要的一项特征任务。与此同时,水位作为水库水情变化最直接和最重要的指示,在现代湖泊研究中具有重大现实意义,寻求有效的水库水位模拟方法已成为当前研究所面临的一个重要而又紧迫的任务。
一种常用的水库水位预测方法是借助水库水位监测系统中的水位变化历史数据做输入,通过提取其统计学特征(例如均值、方差、最大值和最小值等)进而预测未来某个时间段内的水位变化趋势。从目前已有的预测效果来看,由于水库空间上相邻水位站的流入影响,基于统计学方法的水位预测精度低,预测稳定度不好。近年来,随着大数据技术、机器学习算法的普及,应用人工智能方法实时预测水库水位成为研究热点。
水库水位历史数据属于时间序列数据,空间上相邻水位站的水量流入后经过水库的调蓄作用,导致水位和流量并不总是同步变化,存在明显的相位滞后效应。应用人工智能方法,比如机器学习技术和深度学习技术,能够有效挖掘水库相邻各个水位站水流和水库水位的潜在时间关系,进而实现高精度实时预测未来某一时刻的水库水位情况。
发明内容
发明目的:根据上述提出的技术问题,而提供的一种基于集成学习的神经网络水库水位预测方法。本发明基于水库空间上相邻各个水位站采集到的水位历史数据,构建基于卷积神经网络和长短期时间记忆网络的神经网络水库水位预测模型,并使用Epoch-WiseBagging集成学习策略优化模型精度。一方面,使用二维卷积神经网络捕捉空间上不同位置水位站之间水位值的某种关联,从而提高模型的信息提取能力;另一方面,使用长短期时间记忆网络学习水库水位的时间依赖关系和变化趋势,从而提高模型水位预测的精度。
技术方案:为了解决上述技术问题,本发明提出了一种基于集成学习的神经网络水库水位预测方法,该方法包括以下步骤:
步骤1:收集水库空间上相邻的各个水位站预设时间段内流入的水位历史数据以形成水库水位样本数据;
步骤2:对步骤1中的水库水位样本数据进行数值变换,即数据归一化,以此得到标准数据集,并对标准数据集划分为训练集、验证集和测试集;
步骤3:构建基于卷积神经网络和长短期时间记忆网络混合模型,定义模型损失函数;
步骤4:使用步骤2中的训练集训练步骤3中构建的神经网络模型,并使用梯度下降策略对步骤3的损失函数进行优化;
步骤5:使用步骤2中的验证集对神经网络模型进行调参,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高的M个最优模型;
步骤6:根据Epoch-Wise Bagging集成学习策略,选择步骤5中经过验证集验证后的M个最优网络模型,使用步骤2中的测试集对这M个最优网络模型进行测试;
步骤7:将各个水位站的实时来水量组合输入到M个最优网络模型中,将这M个最优网络模型对应的M个输出结果以加权求平均的方法计算得到最终的模型输出以预测水库未来1天以内的实时水位空间分布。
进一步的,步骤1中,所述对水位历史数据进行收集并形成用于预测水库水位的输入样本数据集,其形状表示为[N,t,k],其中,N代表水库水位的输入数据总样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天的水位值。
进一步的,步骤2中的数据归一化为:
其中,Xcur分别是t和k当前需要被归一化的数值;Xmin分别是t和k的最小值;Xmax分别是t和k的最大值;
将经过归一化后的输入数据样本按照8:1:1的比例划分为训练集、验证集和测试集。
进一步的,步骤3中,所述卷积神经网络和长短期时间记忆混合模型具体包括以下几层,依次为:输入层、3个二维卷积层、第一层LSTM层、第二层LSTM层、输出层;
输入层的数据为[N,t,k],其中,N代表水库水位数据样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天内的水位值;二维卷积层共三层,分别表示为C1、C2、C3,其中卷积层表示为:C=f(wx+b),其中,f为激活函数,三层均为ReLU激活函数,为了匹配二维卷积操作,将输入层扩展一个维度,扩展后的输入形状为[N,t,k,1],通过设置卷积核的尺寸及padding操作,进一步得到经过三层二维卷积层后的输出,其输出维度为[N,m,k,256],其中,m表示经过三层卷积后的数值,其包括t天内的水位时间变化规律;输出通道数为256,其综合了k个水位站之间的水位变化数据;
将上述经过三层卷积后的输出维度进行合并,得到输出形状为[N,m*k*256]以匹配第一个LSTM层的输入,经过第一层LSTM的输出形状为[N,256],其中,中间隐藏层的神经元数量为256,最后将输出送入第二层LSTM并得到形状为[N,512]的输出,其中输出神经元的数量为512;
输出层为全连接层,接收来自第二层LSTM的输出作为其输入,并得到形状为[N,5]的输出,其中,5表示为未来一天内5个下游水位站的日平均水位数据;
所述损失函数为:
其中,Yobs为实际水库水位值,Ypre为上述神经网络模型的预测值,N表示总样本数。
进一步的,步骤4和步骤5中,网络训练过程中采用基于梯度下降策略的Adam优化器对权重参数进行优化,批处理参数batch_size设置为200,训练轮数设置为100,学习率设置为0.0001,使用Dropout正则化方法以降低网络过拟合;基于训练集搭建好网络模型后,进在验证集上调节网络的超参数,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高的M个最优模型。
进一步的,步骤6中,所述Epoch-Wise Bagging集成学习策略包括:基于训练集搭建卷积神经网络和长短期时间记忆混合模型,通过验证集调节网络的权重参数并保存M个最优精度模型作为基学习器,然后选择这M个最优基学习器进行集成学习测试进而输出M个最优基学习器的预测结果。
本发明人提出一种基于集成学习的神经网络水库水位预测系统,该系统包括以下步骤:
数据收集模块:收集水库空间上相邻的各个水位站预设时间段内流入的水位历史数据以形成水库水位样本数据;
数据处理模块:对水库水位样本数据进行数值变换,即数据归一化,以此得到标准数据集,并对标准数据集划分为训练集、验证集和测试集;
神经网络构建模块:构建基于卷积神经网络和长短期时间记忆网络混合模型,定义模型损失函数;
神经网络训练模块:使用训练集训练构建的神经网络模型,并使用梯度下降策略对损失函数进行优化;
神经网络优化模块:使用验证集对神经网络模型进行调参,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高的M个最优模型;
最优网络模型选择模块:根据Epoch-Wise Bagging集成学习策略,选择经过验证集验证后的M个最优网络模型,使用测试集对这M个最优网络模型进行测试;
水位分布预测模块:将各个水位站的实时来水量组合输入到M个最优网络模型中,将这M个最优网络模型对应的M个输出结果以加权求平均的方法计算得到最终的模型输出以预测水库未来1天以内的实时水位空间分布。
优选的,数据收集模块中,所述对水位历史数据进行收集并形成用于预测水库水位的输入样本数据集,其形状表示为[N,t,k],其中,N代表水库水位的输入数据总样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天的水位值。
优选的,数据处理模块中,数据归一化为:
其中,Xcur分别是t和k当前需要被归一化的数值;Xmin分别是t和k的最小值;Xmax分别是t和k的最大值;
将经过归一化后的输入数据样本按照8:1:1的比例划分为训练集、验证集和测试集。
优选的,神经网络构建模块中,所述卷积神经网络和长短期时间记忆混合模型具体包括以下几层,依次为:输入层、3个二维卷积层、第一层LSTM层、第二层LSTM层、输出层;
输入层的数据为[N,t,k],其中,N代表水库水位数据样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天内的水位值;二维卷积层共三层,分别表示为C1、C2、C3,其中卷积层表示为:C=f(wx+b),其中,f为激活函数,三层均为ReLU激活函数,为了匹配二维卷积操作,将输入层扩展一个维度,扩展后的输入形状为[N,t,k,1],通过设置卷积核的尺寸及padding操作,进一步得到经过三层二维卷积层后的输出,其输出维度为[N,m,k,256],其中,m表示经过三层卷积后的数值,其包括t天内的水位时间变化规律;输出通道数为256,其综合了k个水位站之间的水位变化数据;
将上述经过三层卷积后的输出维度进行合并,得到输出形状为[N,m*k*256]以匹配第一个LSTM层的输入,经过第一层LSTM的输出形状为[N,256],其中,中间隐藏层的神经元数量为256,最后将输出送入第二层LSTM并得到形状为[N,512]的输出,其中输出神经元的数量为512;
输出层为全连接层,接收来自第二层LSTM的输出作为其输入,并得到形状为[N,5]的输出,其中,5表示为未来一天内5个下游水位站的日平均水位数据;
所述损失函数为:
其中,Yobs为实际水库水位值,Ypre为上述神经网络模型的预测值,N表示总样本数。
有益效果:与现有技术相比,本发明的技术方案具有以下有益效果:
本发明的模型的计算精度既能够随着水库运行数据的积累不断提高,又对边界条件准确性的依赖低,能有效克服传统水动力学和机器学习方法计算精度不高、网络收敛慢等问题;在水库汛期调度中,可精准地预测水未来时刻实时水位,为大型水库或梯级水库的防洪、兴利调度决策提供强有力的技术支撑。
附图说明
图1为本发明的方法流程示意图;
图2为本发明的水库水位预测模型结构示意图;
图3为本发明实施例提供的水位站的空间关系示意图;
图4为本发明实施例的水库水位预测模型的训练过程示意图;
图5为本发明实施例的水库水位预测模型与其他模型的预测结果对比示意图。
具体实施方式
以下将结合附图和具体实施,对本发明的技术方案及效果进行详细说明。
本发明提出一种基于集成学习的神经网络水库水位预测方法,该方法包括以下步骤:
步骤1:收集水库空间上相邻的各个水位站预设时间段内流入的水位历史数据以形成水库水位样本数据;
步骤2:对步骤1中的水库水位样本数据进行数值变换,即数据归一化,以此得到标准数据集,并对标准数据集划分为训练集、验证集和测试集;
步骤3:构建基于卷积神经网络和长短期时间记忆网络混合模型,定义模型损失函数;
步骤4:使用步骤2中的训练集训练步骤3中构建的神经网络模型,并使用梯度下降策略对步骤3的损失函数进行优化;
步骤5:使用步骤2中的验证集对神经网络模型进行调参,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高的M个最优模型;
步骤6:根据Epoch-Wise Bagging集成学习策略,选择步骤5中经过验证集验证后的M个最优网络模型,使用步骤2中的测试集对这M个最优网络模型进行测试;
步骤7:将各个水位站的实时来水量组合输入到M个最优网络模型中,将这M个最优网络模型对应的M个输出结果以加权求平均的方法计算得到最终的模型输出以预测水库未来1天以内的实时水位空间分布。
步骤1中,所述对水位历史数据进行收集并形成用于预测水库水位的输入样本数据集,其形状表示为[N,t,k],其中,N代表水库水位的输入数据总样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天的水位值。
步骤2中的数据归一化为:
其中,Xcur分别是t和k当前需要被归一化的数值;Xmin分别是t和k的最小值;Xmax分别是t和k的最大值;
将经过归一化后的输入数据样本按照8:1:1的比例划分为训练集、验证集和测试集。
步骤3中,所述卷积神经网络和长短期时间记忆混合模型具体包括以下几层,依次为:输入层、3个二维卷积层、第一层LSTM层、第二层LSTM层、输出层;
输入层的数据为[N,t,k],其中,N代表水库水位数据样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天内的水位值;二维卷积层共三层,分别表示为C1、C2、C3,其中卷积层表示为:C=f(wx+b),其中,f为激活函数,三层均为ReLU激活函数,为了匹配二维卷积操作,将输入层扩展一个维度,扩展后的输入形状为[N,t,k,1],通过设置卷积核的尺寸及padding操作,进一步得到经过三层二维卷积层后的输出,其输出维度为[N,m,k,256],其中,m表示经过三层卷积后的数值,其包括t天内的水位时间变化规律;输出通道数为256,其综合了k个水位站之间的水位变化数据;
将上述经过三层卷积后的输出维度进行合并,得到输出形状为[N,m*k*256]以匹配第一个LSTM层的输入,经过第一层LSTM的输出形状为[N,256],其中,中间隐藏层的神经元数量为256,最后将输出送入第二层LSTM并得到形状为[N,512]的输出,其中输出神经元的数量为512;
输出层为全连接层,接收来自第二层LSTM的输出作为其输入,并得到形状为[N,5]的输出,其中,5表示为未来一天内5个下游水位站的日平均水位数据;
所述损失函数为:
其中,Yobs为实际水库水位值,Ypre为上述神经网络模型的预测值,N表示总样本数。
步骤4和步骤5中,网络训练过程中采用基于梯度下降策略的Adam优化器对权重参数进行优化,批处理参数batch_size设置为200,训练轮数设置为100,学习率设置为0.0001,使用Dropout正则化方法以降低网络过拟合;基于训练集搭建好网络模型后,进在验证集上调节网络的超参数,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高的M个最优模型。
步骤6中,所述Epoch-Wise Bagging集成学习策略包括:基于训练集搭建卷积神经网络和长短期时间记忆混合模型,通过验证集调节网络的权重参数并保存M个最优精度模型作为基学习器,然后选择这M个最优基学习器进行集成学习测试进而输出M个最优基学习器的预测结果。
实施例
如图3所示,以东江水库的水位站为例进一步说明本发明的技术方案,具体地:
第一步,获取与东江水库空间上相邻的7个水位站1956-2000年的水文时间序列数据作为水位数据样本。经过数据归一化处理后得到相应的训练集、验证集和测试集。其中1956-1990年的数据样本为训练集,1990-1995年的数据样本为验证集,1995-2000年的数据样本为测试集。
第二步,构建基于卷积神经网络和长短期时间记忆网络混合模型。水库水位预测模型具体包括:网络输入层、3个二维卷积层、第一层LSTM层、第二层LSTM层、输出层。使用赣江外洲站、抚河李家渡站、信江梅港站、饶河渡峰坑站、虎山站、修水万家埠站和汉口站7个站的水位数据参与联动预测,将其作为输入送入该水位预测模型,并预测未来一天内湖口站、星子站、都昌站、吴城站和康山站5个代表站的水位。为了提高该水库水位模型的预测精度,以每天为最小单位,t在实际测试场景中设置为7,即每个水位站连续7天内的水位值。其中,输入输出前后的形状分别为[N,7,7,1]和[N,5]。
第三步,图4为训练过程示意图。其中使用MSE(均方根误差函数)损失函数训练网络,采用Adam优化器对权重参数进行优化,批处理参数batch_size设置为200,epoch设置为100,学习率设置为0.0001,为防止网络过拟合,使用Dropout正则化手段。
第四步,在实际预测时,基于Epoch-Wise Bagging集成学习策略,根据这7个水位站的实时来水量,使用经过加权组合后的网络模型实时预测东江水库未来一天以内这5个代表站的水位空间分布情况。进一步地,该网络模型和其他水位预测模型进行了比较,图5为该实施例的水位预测模型与其他模型的预测结果对比示意图。
综上所述,本发明利用卷积神经网络和长短期时间记忆网络混合模型,基于Epoch-Wise Bagging集成学习策略能够很好地捕捉各个水位站的水位变化趋势。一方面,使用二维卷积神经网络捕捉空间上不同位置水位站之间水位值的某种关联,从而提高模型的信息提取能力;另一方面,使用长短期时间记忆网络学习水库水位的时间依赖关系和变化趋势,从而提高模型水位预测的精度。
最后应说明的是,以上实施例仅用来说明本发明的技术方案,而非对其限制。凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围内。
Claims (10)
1.一种基于集成学习的神经网络水库水位预测方法,其特征在于,包括以下步骤:
步骤1:收集水库空间上相邻的各个水位站预设时间段内流入的水位历史数据以形成水库水位样本数据;
步骤2:对步骤1中的水库水位样本数据进行数值变换,即数据归一化,以此得到标准数据集,并对标准数据集划分为训练集、验证集和测试集;
步骤3:构建基于卷积神经网络和长短期时间记忆网络混合模型,定义模型损失函数;
步骤4:使用步骤2中的训练集训练步骤3中构建的神经网络模型,并使用梯度下降策略对步骤3的损失函数进行优化;
步骤5:使用步骤2中的验证集对神经网络模型进行调参,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高的M个最优模型;
步骤6:根据Epoch-Wise Bagging集成学习策略,选择步骤5中经过验证集验证后的M个最优网络模型,使用步骤2中的测试集对这M个最优网络模型进行测试;
步骤7:将各个水位站的实时来水量组合输入到M个最优网络模型中,将这M个最优网络模型对应的M个输出结果以加权求平均的方法计算得到最终的模型输出以预测水库未来1天以内的实时水位空间分布。
2.根据权利要求1所述的一种基于集成学习的神经网络水库水位预测方法,其特征在于,步骤1中,所述对水位历史数据进行收集并形成用于预测水库水位的输入样本数据集,其形状表示为[N,t,k],其中,N代表水库水位的输入数据总样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天的水位值。
4.根据权利要求1所述的一种基于集成学习的神经网络水库水位预测方法,其特征在于,步骤3中,所述卷积神经网络和长短期时间记忆混合模型具体包括以下几层,依次为:输入层、3个二维卷积层、第一层LSTM层、第二层LSTM层、输出层;
输入层的数据为[N,t,k],其中,N代表水库水位数据样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天内的水位值;二维卷积层共三层,分别表示为C1、C2、C3,其中卷积层表示为:C=f(wx+b),其中,f为激活函数,三层均为ReLU激活函数,为了匹配二维卷积操作,将输入层扩展一个维度,扩展后的输入形状为[N,t,k,1],通过设置卷积核的尺寸及padding操作,进一步得到经过三层二维卷积层后的输出,其输出维度为[N,m,k,256],其中,m表示经过三层卷积后的数值,其包括t天内的水位时间变化规律;输出通道数为256,其综合了k个水位站之间的水位变化数据;
将上述经过三层卷积后的输出维度进行合并,得到输出形状为[N,m*k*256]以匹配第一个LSTM层的输入,经过第一层LSTM的输出形状为[N,256],其中,中间隐藏层的神经元数量为256,最后将输出送入第二层LSTM并得到形状为[N,512]的输出,其中输出神经元的数量为512;
输出层为全连接层,接收来自第二层LSTM的输出作为其输入,并得到形状为[N,5]的输出,其中,5表示为未来一天内5个下游水位站的日平均水位数据;
所述损失函数为:
其中,Yobs为实际水库水位值,Ypre为上述神经网络模型的预测值,N表示总样本数。
5.根据权利要求4所述的一种基于集成学习的神经网络水库水位预测方法,其特征在于,步骤4和步骤5中,网络训练过程中采用基于梯度下降策略的Adam优化器对权重参数进行优化,批处理参数batch_size设置为200,训练轮数设置为100,学习率设置为0.0001,使用Dropout正则化方法以降低网络过拟合;基于训练集搭建好网络模型后,进在验证集上调节网络的超参数,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高的M个最优模型。
6.根据权利要求5所述的一种基于集成学习的神经网络水库水位预测方法,其特征在于,步骤6中,所述Epoch-Wise Bagging集成学习策略包括:基于训练集搭建卷积神经网络和长短期时间记忆混合模型,通过验证集调节网络的权重参数并保存M个最优精度模型作为基学习器,然后选择这M个最优基学习器进行集成学习测试进而输出M个最优基学习器的预测结果。
7.一种基于集成学习的神经网络水库水位预测系统,其特征在于,该系统包括以下步骤:
数据收集模块:收集水库空间上相邻的各个水位站预设时间段内流入的水位历史数据以形成水库水位样本数据;
数据处理模块:对水库水位样本数据进行数值变换,即数据归一化,以此得到标准数据集,并对标准数据集划分为训练集、验证集和测试集;
神经网络构建模块:构建基于卷积神经网络和长短期时间记忆网络混合模型,定义模型损失函数;
神经网络训练模块:使用训练集训练构建的神经网络模型,并使用梯度下降策略对损失函数进行优化;
神经网络优化模块:使用验证集对神经网络模型进行调参,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高的M个最优模型;
最优网络模型选择模块:根据Epoch-Wise Bagging集成学习策略,选择经过验证集验证后的M个最优网络模型,使用测试集对这M个最优网络模型进行测试;
水位分布预测模块:将各个水位站的实时来水量组合输入到M个最优网络模型中,将这M个最优网络模型对应的M个输出结果以加权求平均的方法计算得到最终的模型输出以预测水库未来1天以内的实时水位空间分布。
8.根据权利要求7所述的一种基于集成学习的神经网络水库水位预测系统,其特征在于,数据收集模块中,所述对水位历史数据进行收集并形成用于预测水库水位的输入样本数据集,其形状表示为[N,t,k],其中,N代表水库水位的输入数据总样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天的水位值。
10.根据权利要求9所述的一种基于集成学习的神经网络水库水位预测系统,其特征在于,神经网络构建模块中,所述卷积神经网络和长短期时间记忆混合模型具体包括以下几层,依次为:输入层、3个二维卷积层、第一层LSTM层、第二层LSTM层、输出层;
输入层的数据为[N,t,k],其中,N代表水库水位数据样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天内的水位值;二维卷积层共三层,分别表示为C1、C2、C3,其中卷积层表示为:C=f(wx+b),其中,f为激活函数,三层均为ReLU激活函数,为了匹配二维卷积操作,将输入层扩展一个维度,扩展后的输入形状为[N,t,k,1],通过设置卷积核的尺寸及padding操作,进一步得到经过三层二维卷积层后的输出,其输出维度为[N,m,k,256],其中,m表示经过三层卷积后的数值,其包括t天内的水位时间变化规律;输出通道数为256,其综合了k个水位站之间的水位变化数据;
将上述经过三层卷积后的输出维度进行合并,得到输出形状为[N,m*k*256]以匹配第一个LSTM层的输入,经过第一层LSTM的输出形状为[N,256],其中,中间隐藏层的神经元数量为256,最后将输出送入第二层LSTM并得到形状为[N,512]的输出,其中输出神经元的数量为512;
输出层为全连接层,接收来自第二层LSTM的输出作为其输入,并得到形状为[N,5]的输出,其中,5表示为未来一天内5个下游水位站的日平均水位数据;
所述损失函数为:
其中,Yobs为实际水库水位值,Ypre为上述神经网络模型的预测值,N表示总样本数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210302734.XA CN115186857A (zh) | 2022-03-24 | 2022-03-24 | 一种基于集成学习的神经网络水库水位预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210302734.XA CN115186857A (zh) | 2022-03-24 | 2022-03-24 | 一种基于集成学习的神经网络水库水位预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115186857A true CN115186857A (zh) | 2022-10-14 |
Family
ID=83512153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210302734.XA Pending CN115186857A (zh) | 2022-03-24 | 2022-03-24 | 一种基于集成学习的神经网络水库水位预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115186857A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115860272A (zh) * | 2023-02-22 | 2023-03-28 | 山东捷讯通信技术有限公司 | 基于深度学习的水库多时间点智能水位预测方法及系统 |
CN115879646A (zh) * | 2023-02-15 | 2023-03-31 | 山东捷讯通信技术有限公司 | 一种水库水位预测方法、装置、介质及设备 |
CN116484729A (zh) * | 2023-04-20 | 2023-07-25 | 中国地质科学院水文地质环境地质研究所 | 基于增强型数据集和gru网络的地下水位模拟预测方法 |
-
2022
- 2022-03-24 CN CN202210302734.XA patent/CN115186857A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879646A (zh) * | 2023-02-15 | 2023-03-31 | 山东捷讯通信技术有限公司 | 一种水库水位预测方法、装置、介质及设备 |
CN115879646B (zh) * | 2023-02-15 | 2023-11-07 | 山东捷讯通信技术有限公司 | 一种水库水位预测方法、装置、介质及设备 |
CN115860272A (zh) * | 2023-02-22 | 2023-03-28 | 山东捷讯通信技术有限公司 | 基于深度学习的水库多时间点智能水位预测方法及系统 |
CN116484729A (zh) * | 2023-04-20 | 2023-07-25 | 中国地质科学院水文地质环境地质研究所 | 基于增强型数据集和gru网络的地下水位模拟预测方法 |
CN116484729B (zh) * | 2023-04-20 | 2023-09-08 | 中国地质科学院水文地质环境地质研究所 | 基于增强型数据集和gru网络的地下水位模拟预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115186857A (zh) | 一种基于集成学习的神经网络水库水位预测方法 | |
CN109272146A (zh) | 一种基于深度学习模型和bp神经网络校正的洪水预测方法 | |
CN109299812B (zh) | 一种基于深度学习模型和knn实时校正的洪水预测方法 | |
CN113468803B (zh) | 一种基于改进的woa-gru洪水流量预测方法及系统 | |
CN110766212A (zh) | 用于历史数据缺失电场的超短期光伏功率预测方法 | |
CN106650784A (zh) | 一种基于特征聚类比较的光伏电站功率预测方法及装置 | |
CN113554466B (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN108596242A (zh) | 基于小波神经网络和支持向量机的电网气象负荷预测方法 | |
CN109307159A (zh) | 一种基于用水量优化预测模型的管网漏损报警方法 | |
CN114777192B (zh) | 基于数据关联和深度学习的二级网供热自主优化调控方法 | |
CN114811713B (zh) | 基于混合深度学习的二级网户间均衡供热调控方法 | |
CN111461466A (zh) | 基于lstm时间序列的供暖户阀调节方法、系统及设备 | |
CN111723516B (zh) | 一种基于自适应深度神经网络替代模型的海水入侵模拟-优化方法 | |
CN113033081A (zh) | 一种基于som-bpnn模型的径流模拟方法及系统 | |
CN111311001B (zh) | 基于DBSCAN算法和特征选择的Bi-LSTM网络短期负荷预测方法 | |
CN114357670A (zh) | 一种基于bls和自编码器的配电网用电数据异常预警方法 | |
CN115755219A (zh) | 基于stgcn的洪水预报误差实时校正方法及系统 | |
CN115115125A (zh) | 基于深度学习融合模型的光伏功率区间概率预测方法 | |
CN116011731A (zh) | 基于机器学习算法与雨洪数值模型的厂网河联合调度方法 | |
CN115329930A (zh) | 一种基于混合深度学习模型的洪水过程概率预报方法 | |
CN113268929B (zh) | 短期负荷区间预测方法及装置 | |
CN113159395A (zh) | 一种基于深度学习的污水处理厂进水流量预测方法及系统 | |
CN116485582A (zh) | 一种基于深度学习的供热优化调控方法及装置 | |
CN116227704A (zh) | 基于边缘计算和云计算的供热能耗诊断及节能调控方法 | |
CN116090678A (zh) | 一种数据处理方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |