CN114219131A - 一种基于lstm的流域径流预测方法 - Google Patents

一种基于lstm的流域径流预测方法 Download PDF

Info

Publication number
CN114219131A
CN114219131A CN202111398994.3A CN202111398994A CN114219131A CN 114219131 A CN114219131 A CN 114219131A CN 202111398994 A CN202111398994 A CN 202111398994A CN 114219131 A CN114219131 A CN 114219131A
Authority
CN
China
Prior art keywords
runoff
lstm
input
data
gate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111398994.3A
Other languages
English (en)
Inventor
郑勇
成静清
刘章君
潘雪梅
许新发
雷声
温天福
谭毅
邹虹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Academy of Water Resources
Original Assignee
Jiangxi Academy of Water Resources
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Academy of Water Resources filed Critical Jiangxi Academy of Water Resources
Priority to CN202111398994.3A priority Critical patent/CN114219131A/zh
Publication of CN114219131A publication Critical patent/CN114219131A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Alarm Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于LSTM的流域径流预测方法,基于LSTM算法结构不变的前提,将影响流域径流的因素按照三种组合方案设置为不同的输入集,将流域当日径流量设置为统一的输出集,借助LSTM模型建立输入和输出的映射关系,以对比不同学习方案下LSTM径流预测的性能,最终筛选出流域径流预测性能的最优学习方案。本发明的有益效果是:在数据可以取得的前提下,应当优先考虑将前期径流和流域前期降雨资料结合起来设置LSTM径流预测模型的输入,以取得更加良好的预测结果。研究可用于指导基于数据驱动的流域径流预测输入集数据的选取,避免不适当的输入数据导致预测结果不佳。

Description

一种基于LSTM的流域径流预测方法
技术领域
本发明涉及一种长短期记忆神经网络(LSTM)在径流预测中的应用,具体为一种基于LSTM的流域径流预测方法。
背景技术
合理的预测径流对于流域防洪和水资源调控具有重要意义。受流域水文特征高复杂性和非线性影响,水文统计学模型预测径流的精度受统计数据和模型条件的影响,当预报条件在模型条件范围内时具有良好的效果,但当预报条件接近或超出历史观测极限时,预测效果很差。具有一定物理机制的水文模型虽然可以满足预测精度,但是模型构建对流域下垫面和水文数据需求较高且参数率定过程复杂,存在参数不确定性以及模型普适性较差等问题,难以适用于基础资料缺乏的地区。
近年来,随着机器学习算法的发展。以人工神经网络和支持向量机为代表的数据驱动算法在径流预测中得到广泛应用。以应用成熟的BP神经网络(Back PropagationNeura1 Network)为例,赵文刚等以汛期和非汛期的安乡、石龟山及沙湾站的水位、流量为输入预测西洞庭湖南咀站的月经流量,预测准确率达77.8%,预报等级为乙级;李继清等以唐乃亥水文站1956-2010年的径流数据为训练样本,2011~2017年的数据为验证样本进行月和旬径流预报,单一BP 神经网络的预报合格率为 60%;王长鹏等以2008~2013年宜昌水文站的日径流数据为训练集,以其中最后90天数据为测试集进行了日径流预测,标准BP神经网络预测准确率达72.2%。
近年来,长短期记忆神经网络(LSTM)以其在时间序列模拟回归上的优势,逐渐成为径流预测的研究热点,胡庆芳等以汉江安康站及其上游石泉站的前期径流量和流域面雨量为输入构建LSTM模型对安康站日径流进行预测,训练集和检验集的效率系数最高可达0.83和0.84;张森等将LSTM应用于晋江上游控制性水文站石砻站,2013~2017年逐月径流过程进行延时回归预测,合格率为85%,确定性系数R2为0.953,达到预报甲等标准。综上可知,LSTM在径流预测的性能上优于BP神经网络,两种方法对于不同的模型输入会产生不同的预测效果,相关研究中对于采用什么样的输入数据进行预测尚无统一标准。
研究基于LSTM,在不改变算法结构的前提下,设置不同的输入集,以筛选信江流域日径流预测的最优学习方案,为基于LSTM的流域径流预测输入数据集的选取提供参考。
发明内容
本发明的目的在于提供一种基于LSTM的流域径流预测方法,基于LSTM算法结构不变的前提,将影响流域径流的因素(前期径流量和降雨量)按照三种组合方案设置为不同的输入集,将流域当日径流量设置为统一的输出集,借助LSTM模型建立输入和输出的映射关系,以对比不同学习方案下LSTM径流预测的性能,最终筛选出流域径流预测性能的最优学习方案。
为实现上述目的,本发明采用如下的技术方案:一种基于LSTM的流域径流预测方法,包括如下步骤:
第一步,获取研究区流域水文站在某一时区内径流预测的降雨数据资料,所有数据均需通过三性审查(即对数据的可靠性、一致性和代表性进行审查)后方可进行后续操作;
第二步,设计输入集;将影响流域径流的因素(如前期径流量和降雨量)按照如下组合方案设置为不同的输入级:
输入集一:以前期径流预测当日径流(方案一),输入数据为A水文站前1、2、3日流量,输出数据为当日流量;
输入集二:前期降雨预测当日径流(方案二),输入数据为A水文站及其上游B、C水文站前1日降雨量,输出数据为当日流量;
输入集三:前期径流和前期降雨预测当日径流(方案三),输入数据为A水文站前1、2、3日流量和A水文站及其上游B、C水文站前1日降雨量,输出数据为当日流量;
第三步,设计输出集;将流域当日径流量设置为上述三个方案中输入集的统一输出集;
第四步,借助LSTM模型建立上述方案输入和输出的映射关系,以对比不同学习方案下LSTM径流预测的性能,最终筛选出流域径流预测性能的最优学习方案。
其中,所述借助LSTM模型建立上述方案输入和输出的映射关系,其特征在于步骤如下:
(1)LSTM由输入层、隐藏层和输出层组成;输入层和输出层各有一层,主要用于接收数据信号和设定神经网络训练目标;隐藏层根据实际需要不限于一层,其在输入层和输出层之间建立函数关系,用于执行各种非线性变换;
(2)LSTM的隐藏层由多个神经单元构成,每个神经单元由遗忘门(f t )、输入门(i t )和输出门(o t )三部分组成;其中,遗忘门(f t )决定了t时刻神经网络状态需要移除的t-1时刻神经网络状态的信息,输入门(i t )决定了t时刻神经网络状态需要存储的新信息,输出门(o t )决定了t时刻神经网络状态需要输出的信息,而t时刻的神经网络状态则记录了t时刻的输入、门结构信息以及t-1时刻隐藏层状态、t-1时刻神经网络状态;
(3)LSTM的隐藏层中包含两个状态变量hc,分别用于保存短期状态和长期状态;LSTM用遗忘门和输入门来控制长期状态c的内容,其中遗忘门决定了上一时刻的长期状态(c t-1)有多少保留到当前时刻;输入门决定了当前时刻网络的输入(x t )有多少保存到长期状态;LSTM用输出门来控制长期状态c有多少输出到LSTM的当前输出值;
(4)LSTM中的输入数据均需要通过输入门、输出门和遗忘门,并通过权重、偏置和激活函数以提取数据中的信息,从而进行移除或更新,再传递到下一个神经网络层中,以此类推,最后一个神经网络层的输出值即为模型预测值。
其中,基于LSTM的流域径流预测方法中,基于LSTM模型的流域径流预测计算过程如下:
步骤一:根据研究流域不同来水条件,将区域样本数据(前期降雨数据和径流数据)按照一定比例划分为训练集和测试集;
训练集数据用于构建LSTM模型,将其在测试集上的平均绝对误差
Figure RE-605633DEST_PATH_IMAGE001
和纳 什效率系数(NSE)作为衡量模型预测性能的指标;
步骤二:将t时刻的流域降雨或者径流数据的训练集作为模型的输入;
Figure RE-601402DEST_PATH_IMAGE002
式中,
Figure RE-912298DEST_PATH_IMAGE003
为t时刻的降雨量(mm),
Figure RE-41928DEST_PATH_IMAGE004
为t时刻的径流量(mm);
步骤三:通过遗忘门
Figure RE-387458DEST_PATH_IMAGE005
移除t-1时刻神经网络状态的信息;
Figure RE-6658DEST_PATH_IMAGE006
式中,
Figure RE-54118DEST_PATH_IMAGE007
是遗忘门的权重矩阵,
Figure RE-784176DEST_PATH_IMAGE008
表示把两个向量连接成一个更长 的向量,
Figure RE-187476DEST_PATH_IMAGE009
是遗忘门的偏置项,
Figure RE-711998DEST_PATH_IMAGE010
表示激活函数为Sigmoid函数;
步骤四:通过输入门
Figure RE-263065DEST_PATH_IMAGE011
确定用以更新神经网络状态的信息
Figure RE-281968DEST_PATH_IMAGE012
Figure RE-539774DEST_PATH_IMAGE013
式中,
Figure RE-500777DEST_PATH_IMAGE014
是输入门的权重矩阵,
Figure RE-273561DEST_PATH_IMAGE015
是输入门的偏置项;
Figure RE-345422DEST_PATH_IMAGE016
式中,
Figure RE-769319DEST_PATH_IMAGE017
是当前输入的长期状态的权重矩阵,
Figure RE-838906DEST_PATH_IMAGE018
表示其偏置项,tanh表示激活 函数为tanh函数;
Figure RE-98986DEST_PATH_IMAGE019
式中,星号*表示按元素乘;
经过上述运算,LSTM将关于当前的记忆
Figure RE-974538DEST_PATH_IMAGE020
和长期记忆
Figure RE-3674DEST_PATH_IMAGE021
组合在一起形成了 新的长期状态
Figure RE-57212DEST_PATH_IMAGE022
;在遗忘门和输入门的控制下,该状态既可以保存长时间序列的信息,又 能避免当前无关紧要的信息进入记忆中;
步骤五:通过输出门
Figure RE-742271DEST_PATH_IMAGE023
和长期状态
Figure RE-155935DEST_PATH_IMAGE024
共同决定最终输出的流域当日径流量 预测值
Figure RE-305156DEST_PATH_IMAGE025
Figure RE-982125DEST_PATH_IMAGE026
式中,
Figure RE-951218DEST_PATH_IMAGE027
是输出门的权重矩阵,
Figure RE-175699DEST_PATH_IMAGE028
是其偏置项;
Figure RE-445006DEST_PATH_IMAGE029
式中,tanh表示激活函数为tanh函数;
步骤六:采用平均绝对误差(MAE)和纳什效率系数(NSE)指标来评价模型模拟效果,对比三个组合方案的指标最终筛选出流域径流预测性能最优的学习方案;
平均绝对误差通过计算所有单个观测误差绝对值的平均值,可以避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小,是衡量LSTM预测准确性的重要指标;纳什效率系数可以量化验证径流预测结果的精度,其取值范围 [0,1],系数越接近于1,则预测精度越高,反之越低;
Figure RE-89614DEST_PATH_IMAGE030
Figure RE-749266DEST_PATH_IMAGE031
式中,m为样本数据的个数;
Figure RE-504732DEST_PATH_IMAGE032
为样本实测径流值;
Figure RE-113699DEST_PATH_IMAGE033
为样本预测径流值;
Figure RE-929208DEST_PATH_IMAGE034
为 t时刻的实测径流
Figure RE-872894DEST_PATH_IMAGE035
为t时刻的预测径流
Figure RE-635313DEST_PATH_IMAGE036
为实 测径流的均值
Figure RE-348054DEST_PATH_IMAGE037
为预测径流的均值
Figure RE-583732DEST_PATH_IMAGE038
;n为自预测开始 的第n时刻。
本发明的有益效果是:研究设置三种LSTM径流预测学习方案,方案三以前期流量和前期降雨共同预测当日流量最终平均绝对误差均低于另外两组方案,模拟结果的纳什效率系数又最高,因此方案三表现最佳。在数据可以取得的前提下,应当优先考虑将前期径流和流域前期降雨资料结合起来设置LSTM径流预测模型的输入,以取得更加良好的预测结果。这也表明前期径流和前期降雨两方面单独拿出来对断面来水的代表性都不足,两者结合起来能够有效提高数据的代表性。研究可用于指导基于数据驱动的流域径流预测输入集数据的选取,避免不适当的输入数据导致预测结果不佳。
附图说明
图1为本发明的LSTM的输入输出映射图。
图2为本发明的LSTM的门控结构图。
图3为本发明的上饶站丰水期的降雨量。
图4为本发明的弋阳站丰水期的降雨量。
图5为本发明的梅港站丰水期的降雨量。
图6为本发明的上饶站枯水期的降雨量。
图7为本发明的弋阳站枯水期的降雨量。
图8为本发明的梅港站枯水期的降雨量。
图9为本发明的梅港站丰水期的日平均流量。
图10为本发明的梅港站枯水期的日平均流量。
图11为本发明的丰水期方案一的平均绝对误差收敛示意图。
图12为本发明的丰水期方案二的平均绝对误差收敛示意图。
图13为本发明的丰水期方案三的平均绝对误差收敛示意图。
图14为本发明的枯水期方案一的平均绝对误差收敛示意图。
图15为本发明的枯水期方案二的平均绝对误差收敛示意图。
图16为本发明的枯水期方案三的平均绝对误差收敛示意图。
图17为本发明的丰水期测试集的流量预测结果示意图。
图18为本发明的枯水期测试集的流量预测结果示意图。
具体实施方式
本发明是这样来工作和实施的,本发明的研究区为梅港水文站断面上游的信江流域。该流域属鄱阳湖水系五大流域之一,年均降水量1826mm。由于气候因素的影响,流域年内水资源分布不均,春夏两季降水量占全年总量的73%,流域出口断面最小流量为4.14 m3/s,最大流量为13800 m3/s,差异巨大,其径流具有极强的非线性特征。加之信江流域人口密度大,人均水资源量少,准确高效的径流预测对于流域洪旱灾害防治和水资源优化配置具有重要意义。
用于本发明日径流预测的降雨数据资料为上游上饶站和弋阳站以及下游梅港站2007-2019年日降雨数据,径流数据为梅港站2007-2019年实测日平均流量数据,所有数据在应用前均通过三性审查。
将可能影响流域径流的因素(如前期径流量和降雨量)按照如下组合方案设置为不同的输入级:
输入集一:以前期径流预测当日径流,输入数据为梅港站前1、2、3日流量,输出数据为当日流量;
输入集二:前期降雨预测当日径流,输入数据为梅港站及上游上饶站和弋阳站前1日降雨量,输出数据为当日流量;
输入集三:前期径流和前期降雨预测当日径流,输入数据为梅港站前1、2、3日流量和梅港站及其上游上饶站、弋阳站前1日降雨量,输出数据为当日流量;
将流域当日径流量设置为上述三个方案中输入集的统一输出集;
LSTM的工作原理:LSTM是用于处理深度学习算法的强大工具,广泛用于回归和分类。LSTM是循环神经网络的变体之一,能够解决一般循环神经网络在长序列回归上的梯度爆炸和梯度消失问题。
借助LSTM模型建立上述方案输入和输出的映射关系,其特征在于:
(1)LSTM由输入层、隐藏层和输出层组成(图1)。输入层和输出层各有一层,主要用于接收数据信号和设定神经网络训练目标;隐藏层根据实际需要不限于仅有一层,其在输入层和输出层之间建立函数关系,用于执行各种非线性变换。
(2)LSTM的隐藏层由多个神经单元构成,每个神经单元由遗忘门(f t )、输入门(i t )和输出门(o t )三部分组成,图2为LSTM的门控单元结构图。其中,遗忘门(f t )决定了t时刻神经网络状态需要移除的t-1时刻神经网络状态的信息,输入门(i t )决定了t时刻神经网络状态需要存储的新信息,输出门(o t )决定了t时刻神经网络状态需要输出的信息,而t时刻的神经网络状态则记录了t时刻的输入、门结构信息以及t-1时刻隐藏层状态、t-1时刻神经网络状态。
(3)如图1所示,LSTM的隐藏层中包含两个状态变量hc,分别用于保存短期状态和长期状态。 LSTM用遗忘门和输入门来控制长期状态c的内容,其中遗忘门决定了上一时刻的长期状态(c t-1)有多少保留到当前时刻;输入门决定了当前时刻网络的输入(x t )有多少保存到长期状态;LSTM用输出门来控制长期状态c有多少输出到LSTM的当前输出值。
(4)LSTM中的输入数据均需要通过输入门、输出门和遗忘门,并通过权重、偏置和激活函数以提取数据中的信息,从而进行移除或更新,再传递到下一个神经网络层中,以此类推,最后一个神经网络层的输出值即为模型预测值。
基于LSTM模型的流域径流预测具体计算过程如下:
步骤一:根据研究流域不同来水条件,将区域样本数据(前期降雨数据和径流数据)按照一定比例划分为训练集和测试集。
训练集数据用于构建LSTM模型,将其在测试集上的平均绝对误差(MAE)和纳什效率系数(NSE)作为衡量模型预测性能的指标。
步骤二:将t时刻的流域降雨或者径流数据的训练集作为模型的输入;
Figure 311323DEST_PATH_IMAGE039
式中,
Figure 909794DEST_PATH_IMAGE040
为t时刻的降雨量(mm),
Figure 412582DEST_PATH_IMAGE041
为t时刻的径流量(mm)。
步骤三:通过遗忘门
Figure 703886DEST_PATH_IMAGE042
移除t-1时刻神经网络状态的信息;
Figure 423449DEST_PATH_IMAGE043
式中,
Figure 560032DEST_PATH_IMAGE044
是遗忘门的权重矩阵,
Figure 432173DEST_PATH_IMAGE045
表示把两个向量连接成一个更长的 向量,
Figure 633392DEST_PATH_IMAGE046
是遗忘门的偏置项,
Figure 325405DEST_PATH_IMAGE047
表示激活函数为Sigmoid函数;
步骤四:通过输入门
Figure 514947DEST_PATH_IMAGE048
确定用以更新神经网络状态的信息
Figure 241594DEST_PATH_IMAGE049
Figure 609122DEST_PATH_IMAGE050
式中,
Figure 804742DEST_PATH_IMAGE051
是输入门的权重矩阵,
Figure 548707DEST_PATH_IMAGE052
是输入门的偏置项;
Figure 129861DEST_PATH_IMAGE053
式中,
Figure 183137DEST_PATH_IMAGE054
是当前输入的长期状态的权重矩阵,
Figure 584162DEST_PATH_IMAGE055
表示其偏置项,tanh表示激活 函数为tanh函数;
Figure 882550DEST_PATH_IMAGE056
式中,星号*表示按元素乘;
经过上述运算,LSTM将关于当前的记忆
Figure 583790DEST_PATH_IMAGE057
和长期记忆
Figure 293120DEST_PATH_IMAGE058
组合在一起形成了 新的长期状态
Figure 961868DEST_PATH_IMAGE059
;在遗忘门和输入门的控制下,该状态既可以保存长时间序列的信息,又 能避免当前无关紧要的信息进入记忆中。
步骤五:通过输出门
Figure 47636DEST_PATH_IMAGE060
和长期状态
Figure 354114DEST_PATH_IMAGE061
共同决定最终输出的流域当日径流量预 测值
Figure 968766DEST_PATH_IMAGE062
Figure 609963DEST_PATH_IMAGE063
式中,
Figure 748689DEST_PATH_IMAGE064
是输出门的权重矩阵,
Figure 158942DEST_PATH_IMAGE065
是其偏置项;
Figure 960807DEST_PATH_IMAGE066
式中,tanh表示激活函数为tanh函数。
步骤六:采用平均绝对误差(MAE)和纳什效率系数(NSE)指标来评价模型模拟效果,对比三个组合方案的指标最终筛选出流域径流预测性能最优的学习方案。
平均绝对误差通过计算所有单个观测误差绝对值的平均值,可以避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小,是衡量LSTM预测准确性的重要指标。纳什效率系数可以量化验证径流预测结果的精度,其取值范围 [0,1],系数越接近于1,则预测精度越高,反之越低。
Figure 89300DEST_PATH_IMAGE067
Figure 516870DEST_PATH_IMAGE068
式中,m为样本数据的个数;
Figure 296477DEST_PATH_IMAGE069
为样本实测径流值;
Figure 784090DEST_PATH_IMAGE070
为样本预测径流值;
Figure 619453DEST_PATH_IMAGE071
为 t时刻的实测径流
Figure 850714DEST_PATH_IMAGE072
为t时刻的预测径流
Figure 235559DEST_PATH_IMAGE073
为 实测径流的均值
Figure 143341DEST_PATH_IMAGE074
为预测径流的均值
Figure 246426DEST_PATH_IMAGE075
;n为自预测开 始的第n时刻。
实施例
神经网络通过建立输入与输出的映射关系来解决非线性回归问题,在径流预测方面,神经网络的性能可通过其在预测集上的准确率来衡量。在模型构建时保证超参数不变,考虑对日径流量可能产生影响的上游来水和区间来水两方面因素,以流量和降雨量的不同组合设计三种不同的学习方案作为输入,下游梅港站当日平均流量作为输出,三种不同的输入集对应相同的输出集,以对比不同学习方案下LSTM径流预测的性能:
方案一:以前期径流预测当日径流,输入数据为梅港站前1、2、3日流量,输出数据为当日流量。这样的处理用于探究LSTM对径流趋势的预测能力。
方案二:前期降雨预测当日径流,输入数据为梅港站及上游上饶站和弋阳站前1日降雨量,输出数据为当日流量。用于判断前期降雨对径流的预测能力。
方案三:前期径流和前期降雨预测当日径流,输入数据为梅港站前1、2、3日流量和三站前1日降雨量,输出数据为当日流量。该方案用于探究前期降雨和前期径流对当日径流的预测能力。
由于信江流域降雨主要集中在4-9月,考虑不同来水条件,将研究区2007年-2019年的降雨径流数据分为丰水期(4-9月)和枯水期(10-3月)两种情况,表1和2为两种情况下三种方案的部分输入输出集数据。样本数据按照7:3的比例划分为训练集和测试集,对应的丰水期训练集样本1663组、测试集样本723组,枯水期训练集样本1656组、测试集样本710组。训练集数据用于构建LSTM模型,将其在测试集上的平均绝对误差和纳什效率系数作为衡量模型预测性能的指标。
Figure 766531DEST_PATH_IMAGE076
Figure 740304DEST_PATH_IMAGE077
信江干流三个水文站2007-2019年的降雨及下游梅港站的流量数据如图3-10所示。在枯水期,径流多数由前期径流或基流决定,而丰水期,径流由降水和基流共同影响。丰水期最大日平均流量达12100 m3/s,平均值为853 m3/s,枯水期最大日平均流量仅为5400m3/s,平均值为348.9 m3/s。丰水期最大日降雨量为218.5 mm,平均值为6.6 mm,枯水期最大日降雨量为96 mm,平均值为3.6 mm。
Figure 569719DEST_PATH_IMAGE078
平均绝对误差通过计算所有单个观测误差的绝对值的平均值,可以避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小,是衡量LSTM预测准确性的重要指标。图11-16为丰水期和枯水期LSTM在训练集和测试集上50次迭代的平均绝对误差收敛过程,测试集最终的平均绝对误差如表3所示。不论是丰水期还是枯水期,方案三以前期降雨和前期径流共同预测当日径流的模拟误差都最小,是最适合于信江流域日径流预报的方案。
Figure 409368DEST_PATH_IMAGE079
丰水期和枯水期测试集的流量预测结果如图17-18所示。丰枯两种情形下,方案三的拟合效果都优于方案一和二。表4相应的给出了测试集各方案的纳什效率系数,总体看来,各方案枯水期的拟合效果都优于丰水期,这是由于枯水期数据间的差距要小于丰水期,数据本身的不稳定性更低。方案一和三都具有相当高的预测精度,其中方案三在丰水期和枯水期的纳什效率系数分别为和0.94和0.96,达到甲级预报水平。平均绝对误差和纳什效率系数两个指标均表明,方案三在信江流域径流预测中效果最佳,方案一次之,方案二最差。

Claims (3)

1.一种基于LSTM的流域径流预测方法,其特征在于:包括如下步骤:
第一步,获取研究区流域水文站在某一时区内径流预测的降雨数据资料,所有数据均需通过三性审查后方可进行后续操作;
第二步,设计输入集;将影响流域径流的因素按照如下组合方案设置为不同的输入集:
输入集一:以前期径流预测当日径流,输入数据为A水文站前1、2、3日流量,输出数据为当日流量;
输入集二:前期降雨预测当日径流,输入数据为A水文站及其上游B、C水文站前1日降雨量,输出数据为当日流量;
输入集三:前期径流和前期降雨预测当日径流,输入数据为A水文站前1、2、3日流量和A水文站及其上游B、C水文站前1日降雨量,输出数据为当日流量;
第三步,设计输出集;将流域当日径流量设置为上述三个方案中输入集的统一输出集;
第四步,借助LSTM模型建立上述方案输入和输出的映射关系,以对比不同学习方案下LSTM径流预测的性能,最终筛选出流域径流预测性能的最优学习方案。
2.根据权利要求1所述的一种基于LSTM的流域径流预测方法,其特征在于:借助LSTM模型建立上述方案输入和输出的映射关系,步骤如下:
(1)LSTM由输入层、隐藏层和输出层组成;输入层和输出层各有一层,主要用于接收数据信号和设定神经网络训练目标;隐藏层根据实际需要不限于一层,其在输入层和输出层之间建立函数关系,用于执行各种非线性变换;
(2)LSTM的隐藏层由多个神经单元构成,每个神经单元由遗忘门、输入门和输出门三部分组成;其中,遗忘门决定了t时刻神经网络状态需要移除的t-1时刻神经网络状态的信息,输入门决定了t时刻神经网络状态需要存储的新信息,输出门决定了t时刻神经网络状态需要输出的信息,而t时刻的神经网络状态则记录了t时刻的输入、门结构信息以及t-1时刻隐藏层状态、t-1时刻神经网络状态;
(3)LSTM的隐藏层中包含两个状态变量hc,分别用于保存短期状态和长期状态;LSTM用遗忘门和输入门来控制长期状态c的内容,其中遗忘门决定了上一时刻的长期状态有多少保留到当前时刻;输入门决定了当前时刻网络的输入有多少保存到长期状态;LSTM用输出门来控制长期状态c有多少输出到LSTM的当前输出值;
(4)LSTM中的输入数据均需要通过输入门、输出门和遗忘门,并通过权重、偏置和激活函数以提取数据中的信息,从而进行移除或更新,再传递到下一个神经网络层中,以此类推,最后一个神经网络层的输出值即为模型预测值。
3.根据权利要求2所述的一种基于LSTM的流域径流预测方法,其特征在于:基于LSTM模型的流域径流预测计算过程如下:
步骤一:根据研究流域不同来水条件,将区域样本数据按照一定比例划分为训练集和测试集;
训练集数据用于构建LSTM模型,将其在测试集上的平均绝对误差和纳什效率系数作为衡量模型预测性能的指标;
步骤二:将t时刻的流域降雨或者径流数据的训练集作为模型的输入;
Figure 991329DEST_PATH_IMAGE001
式中,
Figure 18060DEST_PATH_IMAGE002
为t时刻的降雨量,
Figure 967561DEST_PATH_IMAGE003
为t时刻的径流量;
步骤三:通过遗忘门移除t-1时刻神经网络状态的信息;
Figure 463265DEST_PATH_IMAGE004
式中,
Figure 8778DEST_PATH_IMAGE005
是遗忘门的权重矩阵,
Figure 906326DEST_PATH_IMAGE006
表示把两个向量连接成一个更长的向量,
Figure 761150DEST_PATH_IMAGE007
是遗忘门的偏置项,
Figure 258996DEST_PATH_IMAGE008
表示激活函数为Sigmoid函数;
步骤四:通过输入门确定用以更新神经网络状态的信息
Figure 857468DEST_PATH_IMAGE009
Figure 360256DEST_PATH_IMAGE010
式中,
Figure 651560DEST_PATH_IMAGE011
是输入门的权重矩阵,
Figure 121855DEST_PATH_IMAGE012
是输入门的偏置项;
Figure 773285DEST_PATH_IMAGE013
式中,
Figure 379847DEST_PATH_IMAGE014
是当前输入的长期状态的权重矩阵,
Figure 842053DEST_PATH_IMAGE015
表示其偏置项,
Figure 550377DEST_PATH_IMAGE016
表示激 活函数为tanh函数;
Figure 225072DEST_PATH_IMAGE017
式中,星号*表示按元素乘;
经过上述运算,LSTM将关于当前的记忆
Figure 200987DEST_PATH_IMAGE018
和长期记忆
Figure 834093DEST_PATH_IMAGE019
组合在一起形成了新的 长期状态
Figure 498555DEST_PATH_IMAGE020
;在遗忘门和输入门的控制下,该状态既可以保存长时间序列的信息,又能避 免当前无关紧要的信息进入记忆中;
步骤五:通过输出门和长期状态
Figure 242520DEST_PATH_IMAGE020
共同决定最终输出的流域当日径流量预测值;
Figure 89254DEST_PATH_IMAGE021
式中,
Figure 876950DEST_PATH_IMAGE022
是输出门的权重矩阵,
Figure 809134DEST_PATH_IMAGE023
是其偏置项;
Figure 564645DEST_PATH_IMAGE024
式中,tanh表示激活函数为tanh函数;
步骤六:采用平均绝对误差和纳什效率系数指标来评价模型模拟效果,对比三个组合方案的指标最终筛选出流域径流预测性能最优的学习方案;
平均绝对误差是衡量LSTM预测准确性的重要指标;纳什效率系数可以量化验证径流预测结果的精度,其取值范围 [0,1],系数越接近于1,则预测精度越高,反之越低;
Figure 265885DEST_PATH_IMAGE025
Figure 975215DEST_PATH_IMAGE026
式中,m为样本数据的个数;
Figure 643962DEST_PATH_IMAGE027
为样本实测径流值;
Figure 729730DEST_PATH_IMAGE028
为样本预测径流值;
Figure 285476DEST_PATH_IMAGE029
为t 时刻的实测径流;
Figure 182019DEST_PATH_IMAGE030
为t时刻的预测径流;
Figure 557637DEST_PATH_IMAGE031
为实测径流的均值;
Figure 696363DEST_PATH_IMAGE032
为预测径流 的均值;n为自预测开始的第n时刻。
CN202111398994.3A 2021-11-24 2021-11-24 一种基于lstm的流域径流预测方法 Pending CN114219131A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111398994.3A CN114219131A (zh) 2021-11-24 2021-11-24 一种基于lstm的流域径流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111398994.3A CN114219131A (zh) 2021-11-24 2021-11-24 一种基于lstm的流域径流预测方法

Publications (1)

Publication Number Publication Date
CN114219131A true CN114219131A (zh) 2022-03-22

Family

ID=80698091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111398994.3A Pending CN114219131A (zh) 2021-11-24 2021-11-24 一种基于lstm的流域径流预测方法

Country Status (1)

Country Link
CN (1) CN114219131A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115221800A (zh) * 2022-09-20 2022-10-21 武汉大学 天气发生器和深度学习融合的延伸期径流集合预测方法
CN115271186A (zh) * 2022-07-18 2022-11-01 福建中锐网络股份有限公司 一种基于延时因子和PSO RNN Attention模型的水库水位预测预警方法
CN115392128A (zh) * 2022-09-07 2022-11-25 黑河水资源与生态保护研究中心 一种利用时空卷积lstm网络模拟流域径流量的方法
CN116167526A (zh) * 2023-04-13 2023-05-26 中国农业大学 径流量预测方法、装置、电子设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115271186A (zh) * 2022-07-18 2022-11-01 福建中锐网络股份有限公司 一种基于延时因子和PSO RNN Attention模型的水库水位预测预警方法
CN115271186B (zh) * 2022-07-18 2024-03-15 福建中锐网络股份有限公司 一种基于延时因子和PSO RNN Attention模型的水库水位预测预警方法
CN115392128A (zh) * 2022-09-07 2022-11-25 黑河水资源与生态保护研究中心 一种利用时空卷积lstm网络模拟流域径流量的方法
CN115392128B (zh) * 2022-09-07 2024-02-13 黑河水资源与生态保护研究中心 一种利用时空卷积lstm网络模拟流域径流量的方法
CN115221800A (zh) * 2022-09-20 2022-10-21 武汉大学 天气发生器和深度学习融合的延伸期径流集合预测方法
CN116167526A (zh) * 2023-04-13 2023-05-26 中国农业大学 径流量预测方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN114219131A (zh) 一种基于lstm的流域径流预测方法
CN110084367B (zh) 一种基于lstm深度学习模型的土壤墒情预测方法
Zhang et al. Wind speed forecasting based on quantile regression minimal gated memory network and kernel density estimation
CN109214566B (zh) 基于长短期记忆网络的风电功率短期预测方法
CN109272146B (zh) 一种基于深度学习模型和bp神经网络校正的洪水预测方法
CN109711617B (zh) 一种基于blstm深度学习的中长期径流预测方法
CN113887787B (zh) 一种基于长短时记忆网络和nsga-ii算法的洪水预报模型参数多目标优化方法
CN110110912B (zh) 一种光伏功率多模型区间预测方法
CN106022954B (zh) 基于灰色关联度的多重bp神经网络负荷预测方法
CN106845771A (zh) 一种基于前期雨量优选参数的洪水预报方法
CN108764539A (zh) 一种梯级电站的上下游水位预测方法
CN113139329B (zh) 一种基于水文相似性和人工神经网络的新安江模型参数率定方法
CN113705877A (zh) 基于深度学习模型的实时月径流预报方法
CN112182709A (zh) 大型水库叠梁门分层取水设施的下泄水温快速预测方法
CN103942434A (zh) 基于sspso-grnn的水电站厂坝结构振动响应预测方法
CN112926786B (zh) 一种基于关联规则模型和数值模拟的浅水湖泊目标水位逆向预测方法及系统
CN110969282A (zh) 一种基于lstm复合网络的径流量稳定预测方法
CN114357670A (zh) 一种基于bls和自编码器的配电网用电数据异常预警方法
CN113868938A (zh) 基于分位数回归的短期负荷概率密度预测方法、装置及系统
Shang et al. Research on intelligent pest prediction of based on improved artificial neural network
CN115330036A (zh) 基于GRU-Seq2Seq的多步长洪水预报方法及装置
CN113991711B (zh) 一种光伏电站储能系统容量配置方法
CN117709488B (zh) 基于RUN-XGBoost的大坝渗流预测方法
CN114529035A (zh) 一种基于cart的多模式集成模型的风速预报方法
CN114357865A (zh) 一种水电站径流及其关联源荷功率年场景模拟和预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination