CN114219131A

CN114219131A - 一种基于lstm的流域径流预测方法

Info

Publication number: CN114219131A
Application number: CN202111398994.3A
Authority: CN
Inventors: 郑勇; 成静清; 刘章君; 潘雪梅; 许新发; 雷声; 温天福; 谭毅; 邹虹
Original assignee: Jiangxi Academy of Water Resources
Current assignee: Jiangxi Academy of Water Resources
Priority date: 2021-11-24
Filing date: 2021-11-24
Publication date: 2022-03-22

Abstract

本发明公开了一种基于LSTM的流域径流预测方法，基于LSTM算法结构不变的前提，将影响流域径流的因素按照三种组合方案设置为不同的输入集，将流域当日径流量设置为统一的输出集，借助LSTM模型建立输入和输出的映射关系，以对比不同学习方案下LSTM径流预测的性能，最终筛选出流域径流预测性能的最优学习方案。本发明的有益效果是：在数据可以取得的前提下，应当优先考虑将前期径流和流域前期降雨资料结合起来设置LSTM径流预测模型的输入，以取得更加良好的预测结果。研究可用于指导基于数据驱动的流域径流预测输入集数据的选取，避免不适当的输入数据导致预测结果不佳。

Description

一种基于LSTM的流域径流预测方法

技术领域

本发明涉及一种长短期记忆神经网络（LSTM）在径流预测中的应用，具体为一种基于LSTM的流域径流预测方法。

背景技术

合理的预测径流对于流域防洪和水资源调控具有重要意义。受流域水文特征高复杂性和非线性影响，水文统计学模型预测径流的精度受统计数据和模型条件的影响，当预报条件在模型条件范围内时具有良好的效果，但当预报条件接近或超出历史观测极限时，预测效果很差。具有一定物理机制的水文模型虽然可以满足预测精度，但是模型构建对流域下垫面和水文数据需求较高且参数率定过程复杂，存在参数不确定性以及模型普适性较差等问题，难以适用于基础资料缺乏的地区。

近年来，随着机器学习算法的发展。以人工神经网络和支持向量机为代表的数据驱动算法在径流预测中得到广泛应用。以应用成熟的BP神经网络（Back PropagationNeura1 Network）为例，赵文刚等以汛期和非汛期的安乡、石龟山及沙湾站的水位、流量为输入预测西洞庭湖南咀站的月经流量，预测准确率达77.8%，预报等级为乙级；李继清等以唐乃亥水文站1956-2010年的径流数据为训练样本，2011～2017年的数据为验证样本进行月和旬径流预报，单一BP 神经网络的预报合格率为 60%；王长鹏等以2008～2013年宜昌水文站的日径流数据为训练集，以其中最后90天数据为测试集进行了日径流预测，标准BP神经网络预测准确率达72.2%。

近年来，长短期记忆神经网络（LSTM）以其在时间序列模拟回归上的优势，逐渐成为径流预测的研究热点，胡庆芳等以汉江安康站及其上游石泉站的前期径流量和流域面雨量为输入构建LSTM模型对安康站日径流进行预测，训练集和检验集的效率系数最高可达0.83和0.84；张森等将LSTM应用于晋江上游控制性水文站石砻站，2013~2017年逐月径流过程进行延时回归预测，合格率为85%，确定性系数R²为0.953，达到预报甲等标准。综上可知，LSTM在径流预测的性能上优于BP神经网络，两种方法对于不同的模型输入会产生不同的预测效果，相关研究中对于采用什么样的输入数据进行预测尚无统一标准。

研究基于LSTM，在不改变算法结构的前提下，设置不同的输入集，以筛选信江流域日径流预测的最优学习方案，为基于LSTM的流域径流预测输入数据集的选取提供参考。

发明内容

本发明的目的在于提供一种基于LSTM的流域径流预测方法，基于LSTM算法结构不变的前提，将影响流域径流的因素（前期径流量和降雨量）按照三种组合方案设置为不同的输入集，将流域当日径流量设置为统一的输出集，借助LSTM模型建立输入和输出的映射关系，以对比不同学习方案下LSTM径流预测的性能，最终筛选出流域径流预测性能的最优学习方案。

为实现上述目的，本发明采用如下的技术方案：一种基于LSTM的流域径流预测方法，包括如下步骤：

第一步，获取研究区流域水文站在某一时区内径流预测的降雨数据资料，所有数据均需通过三性审查（即对数据的可靠性、一致性和代表性进行审查）后方可进行后续操作；

第二步，设计输入集；将影响流域径流的因素（如前期径流量和降雨量）按照如下组合方案设置为不同的输入级：

输入集一：以前期径流预测当日径流（方案一），输入数据为A水文站前1、2、3日流量，输出数据为当日流量；

输入集二：前期降雨预测当日径流（方案二），输入数据为A水文站及其上游B、C水文站前1日降雨量，输出数据为当日流量；

输入集三：前期径流和前期降雨预测当日径流（方案三），输入数据为A水文站前1、2、3日流量和A水文站及其上游B、C水文站前1日降雨量，输出数据为当日流量；

第三步，设计输出集；将流域当日径流量设置为上述三个方案中输入集的统一输出集；

第四步，借助LSTM模型建立上述方案输入和输出的映射关系，以对比不同学习方案下LSTM径流预测的性能，最终筛选出流域径流预测性能的最优学习方案。

其中，所述借助LSTM模型建立上述方案输入和输出的映射关系，其特征在于步骤如下：

（1）LSTM由输入层、隐藏层和输出层组成；输入层和输出层各有一层，主要用于接收数据信号和设定神经网络训练目标；隐藏层根据实际需要不限于一层，其在输入层和输出层之间建立函数关系，用于执行各种非线性变换；

（2）LSTM的隐藏层由多个神经单元构成，每个神经单元由遗忘门（f _t）、输入门（i _t）和输出门（o _t）三部分组成；其中，遗忘门（f _t）决定了t时刻神经网络状态需要移除的t-1时刻神经网络状态的信息，输入门（i _t）决定了t时刻神经网络状态需要存储的新信息，输出门（o _t）决定了t时刻神经网络状态需要输出的信息，而t时刻的神经网络状态则记录了t时刻的输入、门结构信息以及t-1时刻隐藏层状态、t-1时刻神经网络状态；

（3）LSTM的隐藏层中包含两个状态变量h和c，分别用于保存短期状态和长期状态；LSTM用遗忘门和输入门来控制长期状态c的内容，其中遗忘门决定了上一时刻的长期状态（c _t-1）有多少保留到当前时刻；输入门决定了当前时刻网络的输入（x _t）有多少保存到长期状态；LSTM用输出门来控制长期状态c有多少输出到LSTM的当前输出值；

（4）LSTM中的输入数据均需要通过输入门、输出门和遗忘门，并通过权重、偏置和激活函数以提取数据中的信息，从而进行移除或更新，再传递到下一个神经网络层中，以此类推，最后一个神经网络层的输出值即为模型预测值。

其中，基于LSTM的流域径流预测方法中，基于LSTM模型的流域径流预测计算过程如下：

步骤一：根据研究流域不同来水条件，将区域样本数据（前期降雨数据和径流数据）按照一定比例划分为训练集和测试集；

训练集数据用于构建LSTM模型，将其在测试集上的平均绝对误差

和纳什效率系数（NSE）作为衡量模型预测性能的指标；

步骤二：将t时刻的流域降雨或者径流数据的训练集作为模型的输入；

式中，

为t时刻的降雨量（mm），

为t时刻的径流量（mm）；

步骤三：通过遗忘门

移除t-1时刻神经网络状态的信息；

式中，

是遗忘门的权重矩阵，

表示把两个向量连接成一个更长的向量，

是遗忘门的偏置项，

表示激活函数为Sigmoid函数；

步骤四：通过输入门

确定用以更新神经网络状态的信息

；

式中，

是输入门的权重矩阵，

是输入门的偏置项；

式中，

是当前输入的长期状态的权重矩阵，

表示其偏置项，tanh表示激活函数为tanh函数；

式中，星号*表示按元素乘；

经过上述运算，LSTM将关于当前的记忆

和长期记忆

组合在一起形成了新的长期状态

；在遗忘门和输入门的控制下，该状态既可以保存长时间序列的信息，又能避免当前无关紧要的信息进入记忆中；

步骤五：通过输出门

和长期状态

共同决定最终输出的流域当日径流量预测值

；

式中，

是输出门的权重矩阵，

是其偏置项；

式中，tanh表示激活函数为tanh函数；

步骤六：采用平均绝对误差（MAE）和纳什效率系数（NSE）指标来评价模型模拟效果，对比三个组合方案的指标最终筛选出流域径流预测性能最优的学习方案；

平均绝对误差通过计算所有单个观测误差绝对值的平均值，可以避免误差相互抵消的问题，因而可以准确反映实际预测误差的大小，是衡量LSTM预测准确性的重要指标；纳什效率系数可以量化验证径流预测结果的精度，其取值范围 [0,1]，系数越接近于1，则预测精度越高，反之越低；

式中，m为样本数据的个数；

为样本实测径流值；

为样本预测径流值；

为 t时刻的实测径流

为t时刻的预测径流

为实测径流的均值

为预测径流的均值

；n为自预测开始的第n时刻。

本发明的有益效果是：研究设置三种LSTM径流预测学习方案，方案三以前期流量和前期降雨共同预测当日流量最终平均绝对误差均低于另外两组方案，模拟结果的纳什效率系数又最高，因此方案三表现最佳。在数据可以取得的前提下，应当优先考虑将前期径流和流域前期降雨资料结合起来设置LSTM径流预测模型的输入，以取得更加良好的预测结果。这也表明前期径流和前期降雨两方面单独拿出来对断面来水的代表性都不足，两者结合起来能够有效提高数据的代表性。研究可用于指导基于数据驱动的流域径流预测输入集数据的选取，避免不适当的输入数据导致预测结果不佳。

附图说明

图1为本发明的LSTM的输入输出映射图。

图2为本发明的LSTM的门控结构图。

图3为本发明的上饶站丰水期的降雨量。

图4为本发明的弋阳站丰水期的降雨量。

图5为本发明的梅港站丰水期的降雨量。

图6为本发明的上饶站枯水期的降雨量。

图7为本发明的弋阳站枯水期的降雨量。

图8为本发明的梅港站枯水期的降雨量。

图9为本发明的梅港站丰水期的日平均流量。

图10为本发明的梅港站枯水期的日平均流量。

图11为本发明的丰水期方案一的平均绝对误差收敛示意图。

图12为本发明的丰水期方案二的平均绝对误差收敛示意图。

图13为本发明的丰水期方案三的平均绝对误差收敛示意图。

图14为本发明的枯水期方案一的平均绝对误差收敛示意图。

图15为本发明的枯水期方案二的平均绝对误差收敛示意图。

图16为本发明的枯水期方案三的平均绝对误差收敛示意图。

图17为本发明的丰水期测试集的流量预测结果示意图。

图18为本发明的枯水期测试集的流量预测结果示意图。

具体实施方式

本发明是这样来工作和实施的，本发明的研究区为梅港水文站断面上游的信江流域。该流域属鄱阳湖水系五大流域之一，年均降水量1826mm。由于气候因素的影响，流域年内水资源分布不均，春夏两季降水量占全年总量的73%，流域出口断面最小流量为4.14 m³/s，最大流量为13800 m³/s，差异巨大，其径流具有极强的非线性特征。加之信江流域人口密度大，人均水资源量少，准确高效的径流预测对于流域洪旱灾害防治和水资源优化配置具有重要意义。

用于本发明日径流预测的降雨数据资料为上游上饶站和弋阳站以及下游梅港站2007-2019年日降雨数据，径流数据为梅港站2007-2019年实测日平均流量数据，所有数据在应用前均通过三性审查。

将可能影响流域径流的因素（如前期径流量和降雨量）按照如下组合方案设置为不同的输入级：

输入集一：以前期径流预测当日径流，输入数据为梅港站前1、2、3日流量，输出数据为当日流量；

输入集二：前期降雨预测当日径流，输入数据为梅港站及上游上饶站和弋阳站前1日降雨量，输出数据为当日流量；

输入集三：前期径流和前期降雨预测当日径流，输入数据为梅港站前1、2、3日流量和梅港站及其上游上饶站、弋阳站前1日降雨量，输出数据为当日流量；

将流域当日径流量设置为上述三个方案中输入集的统一输出集；

LSTM的工作原理：LSTM是用于处理深度学习算法的强大工具，广泛用于回归和分类。LSTM是循环神经网络的变体之一，能够解决一般循环神经网络在长序列回归上的梯度爆炸和梯度消失问题。

借助LSTM模型建立上述方案输入和输出的映射关系，其特征在于：

（1）LSTM由输入层、隐藏层和输出层组成（图1）。输入层和输出层各有一层，主要用于接收数据信号和设定神经网络训练目标；隐藏层根据实际需要不限于仅有一层，其在输入层和输出层之间建立函数关系，用于执行各种非线性变换。

（2）LSTM的隐藏层由多个神经单元构成，每个神经单元由遗忘门（f _t）、输入门（i _t）和输出门（o _t）三部分组成，图2为LSTM的门控单元结构图。其中，遗忘门（f _t）决定了t时刻神经网络状态需要移除的t-1时刻神经网络状态的信息，输入门（i _t）决定了t时刻神经网络状态需要存储的新信息，输出门（o _t）决定了t时刻神经网络状态需要输出的信息，而t时刻的神经网络状态则记录了t时刻的输入、门结构信息以及t-1时刻隐藏层状态、t-1时刻神经网络状态。

（3）如图1所示，LSTM的隐藏层中包含两个状态变量h和c，分别用于保存短期状态和长期状态。 LSTM用遗忘门和输入门来控制长期状态c的内容，其中遗忘门决定了上一时刻的长期状态（c _t-1）有多少保留到当前时刻；输入门决定了当前时刻网络的输入（x _t）有多少保存到长期状态；LSTM用输出门来控制长期状态c有多少输出到LSTM的当前输出值。

基于LSTM模型的流域径流预测具体计算过程如下：

步骤一：根据研究流域不同来水条件，将区域样本数据（前期降雨数据和径流数据）按照一定比例划分为训练集和测试集。

训练集数据用于构建LSTM模型，将其在测试集上的平均绝对误差（MAE）和纳什效率系数（NSE）作为衡量模型预测性能的指标。

式中，

为t时刻的降雨量（mm），

为t时刻的径流量（mm）。

步骤三：通过遗忘门

移除t-1时刻神经网络状态的信息；

式中，

是遗忘门的权重矩阵，

表示把两个向量连接成一个更长的向量，

是遗忘门的偏置项，

表示激活函数为Sigmoid函数；

步骤四：通过输入门

确定用以更新神经网络状态的信息

；

式中，

是输入门的权重矩阵，

是输入门的偏置项；

式中，

是当前输入的长期状态的权重矩阵，

表示其偏置项，tanh表示激活函数为tanh函数；

式中，星号*表示按元素乘；

经过上述运算，LSTM将关于当前的记忆

和长期记忆

组合在一起形成了新的长期状态

；在遗忘门和输入门的控制下，该状态既可以保存长时间序列的信息，又能避免当前无关紧要的信息进入记忆中。

步骤五：通过输出门

和长期状态

共同决定最终输出的流域当日径流量预测值

；

式中，

是输出门的权重矩阵，

是其偏置项；

式中，tanh表示激活函数为tanh函数。

步骤六：采用平均绝对误差（MAE）和纳什效率系数（NSE）指标来评价模型模拟效果，对比三个组合方案的指标最终筛选出流域径流预测性能最优的学习方案。

平均绝对误差通过计算所有单个观测误差绝对值的平均值，可以避免误差相互抵消的问题，因而可以准确反映实际预测误差的大小，是衡量LSTM预测准确性的重要指标。纳什效率系数可以量化验证径流预测结果的精度，其取值范围 [0,1]，系数越接近于1，则预测精度越高，反之越低。

式中，m为样本数据的个数；

为样本实测径流值；

为样本预测径流值；

为 t时刻的实测径流

为t时刻的预测径流

为实测径流的均值

为预测径流的均值

；n为自预测开始的第n时刻。

实施例

神经网络通过建立输入与输出的映射关系来解决非线性回归问题，在径流预测方面，神经网络的性能可通过其在预测集上的准确率来衡量。在模型构建时保证超参数不变，考虑对日径流量可能产生影响的上游来水和区间来水两方面因素，以流量和降雨量的不同组合设计三种不同的学习方案作为输入，下游梅港站当日平均流量作为输出，三种不同的输入集对应相同的输出集，以对比不同学习方案下LSTM径流预测的性能：

方案一：以前期径流预测当日径流，输入数据为梅港站前1、2、3日流量，输出数据为当日流量。这样的处理用于探究LSTM对径流趋势的预测能力。

方案二：前期降雨预测当日径流，输入数据为梅港站及上游上饶站和弋阳站前1日降雨量，输出数据为当日流量。用于判断前期降雨对径流的预测能力。

方案三：前期径流和前期降雨预测当日径流，输入数据为梅港站前1、2、3日流量和三站前1日降雨量，输出数据为当日流量。该方案用于探究前期降雨和前期径流对当日径流的预测能力。

由于信江流域降雨主要集中在4-9月，考虑不同来水条件，将研究区2007年-2019年的降雨径流数据分为丰水期（4-9月）和枯水期（10-3月）两种情况，表1和2为两种情况下三种方案的部分输入输出集数据。样本数据按照7:3的比例划分为训练集和测试集，对应的丰水期训练集样本1663组、测试集样本723组，枯水期训练集样本1656组、测试集样本710组。训练集数据用于构建LSTM模型，将其在测试集上的平均绝对误差和纳什效率系数作为衡量模型预测性能的指标。

信江干流三个水文站2007-2019年的降雨及下游梅港站的流量数据如图3-10所示。在枯水期，径流多数由前期径流或基流决定，而丰水期，径流由降水和基流共同影响。丰水期最大日平均流量达12100 m³/s，平均值为853 m³/s，枯水期最大日平均流量仅为5400m³/s，平均值为348.9 m³/s。丰水期最大日降雨量为218.5 mm，平均值为6.6 mm，枯水期最大日降雨量为96 mm，平均值为3.6 mm。

平均绝对误差通过计算所有单个观测误差的绝对值的平均值，可以避免误差相互抵消的问题，因而可以准确反映实际预测误差的大小，是衡量LSTM预测准确性的重要指标。图11-16为丰水期和枯水期LSTM在训练集和测试集上50次迭代的平均绝对误差收敛过程，测试集最终的平均绝对误差如表3所示。不论是丰水期还是枯水期，方案三以前期降雨和前期径流共同预测当日径流的模拟误差都最小，是最适合于信江流域日径流预报的方案。

丰水期和枯水期测试集的流量预测结果如图17-18所示。丰枯两种情形下，方案三的拟合效果都优于方案一和二。表4相应的给出了测试集各方案的纳什效率系数，总体看来，各方案枯水期的拟合效果都优于丰水期，这是由于枯水期数据间的差距要小于丰水期，数据本身的不稳定性更低。方案一和三都具有相当高的预测精度，其中方案三在丰水期和枯水期的纳什效率系数分别为和0.94和0.96，达到甲级预报水平。平均绝对误差和纳什效率系数两个指标均表明，方案三在信江流域径流预测中效果最佳，方案一次之，方案二最差。

Claims

1.一种基于LSTM的流域径流预测方法，其特征在于：包括如下步骤：

第一步，获取研究区流域水文站在某一时区内径流预测的降雨数据资料，所有数据均需通过三性审查后方可进行后续操作；

第二步，设计输入集；将影响流域径流的因素按照如下组合方案设置为不同的输入集：

输入集一：以前期径流预测当日径流，输入数据为A水文站前1、2、3日流量，输出数据为当日流量；

输入集二：前期降雨预测当日径流，输入数据为A水文站及其上游B、C水文站前1日降雨量，输出数据为当日流量；

输入集三：前期径流和前期降雨预测当日径流，输入数据为A水文站前1、2、3日流量和A水文站及其上游B、C水文站前1日降雨量，输出数据为当日流量；

2.根据权利要求1所述的一种基于LSTM的流域径流预测方法，其特征在于：借助LSTM模型建立上述方案输入和输出的映射关系，步骤如下：

（2）LSTM的隐藏层由多个神经单元构成，每个神经单元由遗忘门、输入门和输出门三部分组成；其中，遗忘门决定了t时刻神经网络状态需要移除的t-1时刻神经网络状态的信息，输入门决定了t时刻神经网络状态需要存储的新信息，输出门决定了t时刻神经网络状态需要输出的信息，而t时刻的神经网络状态则记录了t时刻的输入、门结构信息以及t-1时刻隐藏层状态、t-1时刻神经网络状态；

（3）LSTM的隐藏层中包含两个状态变量h和c，分别用于保存短期状态和长期状态；LSTM用遗忘门和输入门来控制长期状态c的内容，其中遗忘门决定了上一时刻的长期状态有多少保留到当前时刻；输入门决定了当前时刻网络的输入有多少保存到长期状态；LSTM用输出门来控制长期状态c有多少输出到LSTM的当前输出值；

3.根据权利要求2所述的一种基于LSTM的流域径流预测方法，其特征在于：基于LSTM模型的流域径流预测计算过程如下：

步骤一：根据研究流域不同来水条件，将区域样本数据按照一定比例划分为训练集和测试集；

训练集数据用于构建LSTM模型，将其在测试集上的平均绝对误差和纳什效率系数作为衡量模型预测性能的指标；