CN114036838A - 一种基于多层lstm神经网络的垂向水温模拟方法 - Google Patents

一种基于多层lstm神经网络的垂向水温模拟方法 Download PDF

Info

Publication number
CN114036838A
CN114036838A CN202111319072.9A CN202111319072A CN114036838A CN 114036838 A CN114036838 A CN 114036838A CN 202111319072 A CN202111319072 A CN 202111319072A CN 114036838 A CN114036838 A CN 114036838A
Authority
CN
China
Prior art keywords
water temperature
layer
neural network
data set
reservoir
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111319072.9A
Other languages
English (en)
Other versions
CN114036838B (zh
Inventor
王加红
李亚
陆颖
袁旭
王子伟
秦鑫
熊定松
赖红
郭子璞
晏翠玲
张珂瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan University YNU
Original Assignee
Yunnan University YNU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan University YNU filed Critical Yunnan University YNU
Priority to CN202111319072.9A priority Critical patent/CN114036838B/zh
Publication of CN114036838A publication Critical patent/CN114036838A/zh
Application granted granted Critical
Publication of CN114036838B publication Critical patent/CN114036838B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/08Fluids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/08Thermal analysis or thermal optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于多层LSTM神经网络的垂向水温模拟方法。本发明搜集流域的气象水文数据集并修订气象水文数据集;对修订的气象水文数据集进行标准化和归一化处理得到模型输入数据集;采用Norton密度佛汝德数法进行水库水温结构判别得到水库水温结构类型;采用MI互信息计算模型输入数据集与表层水温的MI值,进行表层水温模型输入数据的筛选;构建表层水温LSTM神经网络预测模型,模型经训练和验证得到模拟表层水温;根据水库水温结构类型、上一层水温及表征河槽形态的相对储水量因子,采用MI互信息计算模型输入数据集与各深度层水温的MI值,对垂向水温模型输入数据集完成优化;构建垂向水温多层LSTM神经网络预测模型,模型经训练和验证得到垂向水温模拟方法。

Description

一种基于多层LSTM神经网络的垂向水温模拟方法
技术领域
本发明涉及一种基于多层LSTM神经网络的垂向水温模拟方法,属于水文模拟技术领域。
背景技术
水温是水环境及水生态系统评价中重要的控制要素之一,水体物理、化学性质及水生生物的生命史都与水温有密不可分联系。水温不仅影响水生物生长速度、生长周期及其空间分布,异常水温变化还可能干扰鱼类洄游行为,进而导致其种群数量降低。河、湖、水库等水体受水电开发、工业高温尾水排放、全球气候变暖等因素影响,导致水体原有温度结构发生改变,而水温结构变化对河流生态系统、水生生物的生长繁殖及农业灌溉等均会产生影响。拦河建库极大地改变了河流的物质循环和能量流动过程,是人类活动影响河流生态系统的典型形式之一,建库后会产生相对静止或流动缓慢的庞大水体,受太阳辐射和温暖来流影响,水库表层水温高、密度小,而太阳辐射不能到达水体深处,加上库内水体流速低、垂向水体热交换能力不足,中下层水体往往温度低、密度大,从而引起温度垂向分布不均匀,导致水库存在明显的水温分层现象。
典型分层型水库的垂向水温分为上、中、下三层,即变温层(表温层)、温跃层和滞温层。水温垂向分层会导致溶解氧、水生生物、化学分层和深水层水质的恶化,影响着水质及其水体物理、化学特性、从而改变生物特性群落结构,还直接影响生源要素在水库中的迁移、循环和更新速率。库区水温分层也带来了下泄水温的不确定性,下泄水温会直接影响水库下游河道的水温特征,对农田灌溉、河流养殖、河流水质和生态平衡产生一定影响,因此对垂向水温进行有效及精确的预测显得尤为重要。
目前垂向水温原型观测多采用水温链对各层水体进行监测,然而库区水下水体流态复杂,往往存在异重流现象,且超深水体静水压强较大,不利于观测设备的正常运行,使得水库原型观测难以获取连续、长时序的观测数据。因此,通常需要借助水温模型重建完整的水温时间序列。水温模拟方法可分为经验公式法和数值模拟法。常用的经验公式法有幂函数公式、朱伯芳法和张大发法。但该法缺乏对水库水温形成机制、热力学特性的考虑,普适性较低,精度不高。数学模型法有效弥补了经验公式法的不足,逐渐形成了以水动力学为代表的主流方法。数学模型法作为目前水库水温的主要模拟方法,从最初的一维模型发展到二维、三维模型,例如MIT、CE-QUAL-W2、MIKE系列等模型。数学模型法虽然具有理论严密、适用条件广泛的优点,但大部分基于物理过程的数学模型构建需有地形、水文、气象、水温等大量的、长时序、连续的野外实测数据,而大多数实测数据难以获取,同时受下垫面等条件约束,存在大量需要校准的模型参数,且往往存在“异参同效”的问题。而数据驱动模拟方法则弱化了对水文循环物理过程的描述,能建立输入输出数据之间的最优数学关系,强调数据间的关系,是大数据背景下重要的水文模拟手段。
传统水温模型构建所需数据有地形、水文、气象、水温等大量、长时序、连续的数据,大量准确数据是建立模型的基础。但由于长序列、连续的高密度实测数据采集难度大,难以获取。因而数据的缺乏限制了模型的应用与发展,输入数据量不足会导致模拟结果不准确。传统水温模型往往包括大量参数,模型大多基于物理过程,模型结构复杂,需要大量难以获取的实测数据进行参数率定,需充分理解模型机理。基于数据驱动的水温模拟方法可直接从数据层面挖掘目标值与各变量之间的相关关系,忽略了水温变化物理过程的描述,数据门槛低,具备模型结构简单、易于操作和兼容性强等特征,是未来水温模拟研究的发展方向。现有的基于神经网络的水温模拟方法缺乏对垂向水温的预测研究,均是对于表层水温的预测。而水温垂向分层会导致溶解氧、水生生物、化学分层和深水层水质的恶化,以及库区低温水下泄等现象发生,对水生生物乃至水生生态系统有着极其重要的影响,因此对于水温问题的研究不能只停留于表层水温的预测。
现有基于神经网络的水温模拟方法缺乏合适的影响因子筛选方法。原因在于对水温进行预测研究过程中,无法准确筛选出对水温影响较大的环境因子,例如降雨量、风速、辐射、气温、流量、相对湿度等多种因素。使用影响因子筛选方法,能够排除无关变量的干扰,实现模型输入变量优化,避免数据冗余。部分现有技术采用主成分分析对水温影响因子进行筛选,但由于不同类数据结构的差异(例如降雨数据是非连续的数据类型、而相对湿度数据是连续数据类型),较难用于筛选不同类型影响因子。现有的基于神经网络的水温模拟方法均未进行水库类型的判别,没有与水库水温分布情况相结合,模型计算量增大,实际运用效率较低。
发明内容
本发明针对现有水温模型在进行水温模拟预测时,难以有效筛选对目标值影响较大的因素,无法充分利用上层水温的信息,导致模拟精度低、模型运行效率低下的问题,提供一种基于多层LSTM神经网络的垂向水温模拟方法,即采用互信息MI对可能影响水温的环境因子筛选,形成数据集并对神经网络预测模型进行训练,实现表层水温模拟预测,进一步利用表层水温、水位及气象因子作为输入因子,构建多层LSTM神经网络模型,实现流域时间和空间上的表层水温及库区垂向水温预测,避免冗余计算,解决现有模型数据需求大、模拟精度低的问题。
本发明采用MI互信息筛选出对水温影响较大的因素,根据佛汝德数公式辨别水库水温结构,构建多层LSTM神经网络,实现不同深度水温模拟,适用于流域垂向水温预测,提高模拟精度及模型运行效率。
一种基于多层LSTM神经网络的垂向水温模拟方法,具体步骤如下:
(1)搜集流域的气象水文数据集,其中气象水文数据集包括目标断面的表层水温时间序列和水位;
(2)判断步骤(1)气象水文数据集中数据集的完整性,对数据集进行异常值检测,若数据集中出现单个缺失或异常,采用其对应的特征平均值代替;若数据集中出现连续多个缺失或异常,则采用线性插值法计算相应值,形成修订气象水文数据集;
(3)将步骤(2)修订气象水文数据集进行标准化和归一化处理得到模型输入数据集;
(4)采用Norton密度佛汝德数法进行水库水温结构判别得到水库水温结构类型;
(5)采用MI互信息计算模型输入数据集对表层水温的影响大小,进行输入数据的筛选;
(6)构建表层水温单层LSTM神经网络预测模型,将步骤(5)筛选的输入数据中前2/3的数据作为表层水温LSTM神经网络的训练集,剩余的1/3数据作为验证集,采用训练集的数据对表层水温LSTM神经网络进行训练;
(7)采用步骤(6)经训练的表层LSTM神经网络对验证集进行表层水温模拟,并采用实测表层水温数据对模拟结果进行验证,其中验证方法为采用相关性系数r、均方根误差RMSE、Nash-Sutcliffe效率系数NSE和平均误差MAE对模型精度进行评估;
(8)根据步骤(4)水库水温结构类型、上一层水温及各深度层对应的相对储水量,构建相应水库水温结构类型的垂向水温模型,采用MI互信息计算模型输入数据集对垂向水温的影响大小,进行输入数据的筛选;
(9)构建垂向水温多层LSTM神经网络预测模型,采用步骤(8)筛选的输入数据和垂向水温时间序列中前2/3的数据作为垂向水温多层LSTM神经网络的训练集,剩余的1/3数据作为验证集,对垂向水温LSTM神经网络进行训练;
(10)采用步骤(9)经训练的垂向LSTM神经网络对验证集进行垂向水温模拟,并采用实测水温数据对模拟结果进行验证,其中验证方法为采用相关性系数r、均方根误差RMSE、Nash-Sutcliffe效率系数NSE和平均误差MAE对模型精度进行评估。
所述步骤(1)气象水文数据集还包括降水、入库流量、出库流量、气温、风速、风向、露点温度、云量、相对湿度中的一种或多种;
所述步骤(2)数据集的完整性判断采用作图法,绘制各要素的日尺度时间过程线,通过判断日尺度时间过程线有无断点,以判断数据集的完整性;异常值检测采用作图法,绘制各要素的日尺度时间过程线,通过观察日尺度时间过程线有无突跳点,根据各要素的正常值域范围,判别数据是否异常;
所述步骤(4)Norton密度佛汝德数判别公式为
Figure BDA0003344823270000041
式中:Fr为密度佛汝德数;L为水库长度,m;Q为入库流量,m3/s;H为平均水深,m;V为库容,m3;E为标准化的垂向密度梯度,E=Δρ/(ρ0H);g为重力加速度,m3/s;
当Fr>1.0时,水库为完全混合型;
当0.5<Fr<1.0时,水库为混合型;
当0.1<Fr<0.5时,水库为弱分层型;
当Fr<0.1时,水库为稳定分层型;
其中,混合型或完全混合型水库为库内流速较大的中小型水库,垂向温度差异较小;弱分层型或稳定分层型水库的水温特性呈周期性变化;表温层,即水体表面部分水体受太阳辐射和气温影响显著,水体掺混均匀,水温差异较小;温跃层,即表温层以下的温度突变区域,垂向水温差异较大;滞温层,即温跃层以下区域,水温较低且年变幅较小的停滞静水区域;
所述步骤(5)和步骤(8)中输入数据的筛选方法为互信息,互信息以熵理论为基础,是信息论里一种有用的信息度量,能够度量输入变量与预测对象间的线性和非线性关系,也能够度量一个变量中含有的关于另一个变量的信息量;
利用互信息方法进行输入数据集的筛选步骤为
1)分别计算步骤(4)中归一化后的各气象水文数据输入数据集X对应的熵H(X)定义如下:
Figure BDA0003344823270000042
2)计算各气象水文数据输入数据集X与水温时间序列Y的联合熵H(X,Y):
Figure BDA0003344823270000043
3)计算各气象水文数据输入数据集X与水温时间序列Y的条件熵H(X|Y):
Figure BDA0003344823270000044
4)熵、条件熵、联合熵之间的关系如下:
H(X,Y)=H(X)+H(X|Y) (5)
5)计算各要素与水温数据的互信息如下:
I(X,Y)=H(X)+H(Y)-H(X,Y) (6)
式中:n为输入数据集中的自变量个数,Y表示水温,各气象水文数据输入数据集为x1,x2,…,xn,对应概率密度函数值分别为p1,p2,…,pn,p(x,y)为联合概率分布,满足p(x|y)为条件概率;
6)采用MI互信息进行数据筛选,计算输入数据集中每个影响因素的互信息MI值,对MI值进行由大到小排序,根据排序结果,筛选出与水温最大相关、最小冗余的环境因子,排除MI值最小的影响因子;目前,互信息方法已用于径流模拟、滑坡变形预测等模型输入变量的优化,表现出较高的准确性;
长短时记忆神经网络(LSTM)为循环神经网络(RNN),包括专门存储长时间信息的记忆细胞,可感知前一时刻信息,及特定的控制门结构,控制着信息流在LSTM内的传递;所述LSTM神经网络单元结构和连接见图2,在t时刻,一个LSTM单元有3个输入、2个输出,其中xt表示t时刻输入,ht-1表示t-1时刻LSTM输出,ct-1表示t-1时刻单元状态,ht表示t时刻单元输出,ct表示时刻单元输出。矩形框被称为记忆块(memory block),主要包含了三个门:遗忘门(forget gate)、输入门(input gate)以及输出门(output gate)与一个记忆单元(cell)。方框内上方水平线被称为单元状态(cell state),它类似于信息传送带可以控制信息传递给下一时刻;
遗忘门通过sigmoid函数决定上一时刻的输出数据通过或部分通过以过滤信息;
输入门通过sigmoid函数筛选输入数据以更新信息;
输出门通过sigmoid函数得到初始输出值,使用tanh函数对初始输出值进行处理得到一个-1~1的值,再将该值与初始输出值逐对相乘得到最终输出值,其中
ft=σ(Wfhht-1+Wfxxt+bf) (7)
it=σ(Wihht-1+Wixxt+bi) (8)
Figure BDA0003344823270000051
Figure BDA0003344823270000052
ot=σ(Wohht-1+Woxxt+bo) (11)
Figure BDA0003344823270000053
式中:ft为遗忘门输出;it为输入门输出;ot代表输出门输出;
Figure BDA0003344823270000061
为当前输入单元状态;xt为时间序列中t时间的输入数据;ht-1是t上一时间记忆块的输出结果;Wfh为遗忘门到单元输出的权重;Wfx为遗忘门到单元输入的权重;Wih为输入门到单元输出的权重;Wix为输入门到单元输入的权重;
Figure BDA0003344823270000062
为当前输入的单元状态到单元输出的权重;
Figure BDA0003344823270000063
为当前输入的单元状态到单元输入的权重;Woh为输出门到单元输入的权重;Wox为输出门到单元输出的权重;bf为遗忘门的偏置;bi为输入门的偏置;
Figure BDA0003344823270000064
为当前输入单元状态的偏置;bo为输出门的偏置;σ()是指sigmoid函数;tanh()是指tanh函数;
Figure BDA0003344823270000065
是指元素乘法运算;ct表示单元状态(cell state)的细胞记忆;
基于LSTM模型进行水温模拟原理(见图3),包括一个输入层(Input Layer)、一个LSTM层(LSTM Layer)、一个全连接层(Fully Connected Layer)及一个输出层(OutputLayer);输入层用于环境因子数据的输入,如
Figure BDA0003344823270000066
为气温AT、流量Q、水位WL等的时间序列,被用作输入变量来预测同一时期(无滞后时间)的水温WT(y1 y2…yn),其中n表示时间序列的长度,m表示输入变量的个数;LSTM层为模型的核心部分,包括多个细胞单元(LSTM Cell),每个细胞单元能通过输入层输入的变量进行样本学习模拟预测水温;全连接层可以把高维变到低维,同时把有用的信息保留下来,能够有效的把各单元样本学习情况结合到一起,它控制着模型的学习宽度和长度,神经元个数增加,模型复杂度提升,全连接层数加深,模型非线性表达能力提高,其中(h1t h2t…hMt)表示LSTM层在时间步长t的输出,M表示LSTM层中LSTM单元(隐藏单元)的数量;输出层的功能为输出水温(WT)模拟预测结果;
所述相关性系数计算公式为
Figure BDA0003344823270000067
均方根误差RMSE计算公式为
Figure BDA0003344823270000068
Nash-Sutcliffe效率系数NSE计算公式为
Figure BDA0003344823270000071
平均误差MAE计算公式为
Figure BDA0003344823270000072
式中:n为样本数,Tobs,i为实测流量;
Figure BDA0003344823270000073
为实测流量的平均值;Tsim,i为模拟流量,
Figure BDA0003344823270000074
为模拟流量的平均值;
所述步骤(8)中垂向水温模型构建方法为
当水库为弱分层或稳定分层型水库时,表温层的温度即为步骤(7)的表层水温,构建常规温跃层水温模拟模型,以各深度层对应的相对储水量、上一层水温值和筛选后的输入数据集中前2/3的数据作为该层水温LSTM神经网络的训练集,剩余的1/3数据作为验证集,对该层水温LSTM神经网络进行训练;
逐层往下至到达滞温层,进行滞温层的水温模拟,得到训练期水库垂向各深度层水温,即训练期水库垂向水温值分布;
采用经训练的各深度层LSTM神经网络对各深度层验证集进行水温模拟,并采用实测水温数据对模拟结果精度评估,其中模型精度评估采用相关性系数r、均方根误差RMSE、Nash-Sutcliffe效率系数NSE和平均误差MAE对模型精度进行评估;
所述步骤(8)中垂向水温模型构建方法为
当水库为完全混合型或混合型水库时,表温层的温度即为步骤(7)的表层水温,构建5~8层温跃层水温模拟模型;以各深度层对应的相对储水量、上一层水温值和筛选后的输入数据集中前2/3的数据作为该层水温LSTM神经网络的训练集,剩余的1/3数据作为验证集,对该层水温LSTM神经网络进行训练;
逐层往下至到达滞温层,进行滞温层的水温模拟,得到训练期水库垂向各深度化分层水温,即训练期水库垂向水温值分布;
采用经训练的各深度化分层LSTM神经网络对各深度化分层验证集进行水温模拟,并采用实测水温数据对模拟结果进行验证,其中验证方法为采用相关性系数r、均方根误差RMSE、Nash-Sutcliffe效率系数NSE和平均误差MAE对模型精度进行评估。
本发明的有益效果是:
(1)本发明搜集了大量的流域水文、气象等数据,并对数据集做了预处理,修订了水文气象数据集;
(2)本发明基于信息熵理论,采用互信息MI方法对可能影响水温的环境因子筛选,完成了输入数据集的优化,避免了数据冗余;
(3)本发明基于深度学习技术,研发了新颖的垂向水温模型,利用水位、河槽形态、气象因子及上层水温作为输入因子,构建了多层LSTM神经网络,包括单层LSTM模型和多层LSTM模型两部分,实现流域时间和空间上的表层水温及库区垂向水温模拟预测与数据重建,解决现有模型数据难以获取、模拟精度低的问题;
(4)本发明基于研发的水温数据驱动模型在水库开展水温模拟研究,有助于丰富和推动垂向水温模拟研究,可为江河湖泊管理及待建电站等运行调度及建设提供数据支撑,对维护河流生物多样性、保护河流健康等有现实意义。
附图说明
图1为本发明流程图;
图2为LSTM神经网络结构图;
图3为基于LSTM模型进行水温模拟原理图;
图4为多层LSTM垂向水温模型结构图。
具体实施方式
下面结合具体实施方式对本发明做进一步详细说明,但本发明的保护范围并不限于所述内容。
实施例1:一种基于多层LSTM神经网络的垂向水温模拟方法(见图1),具体步骤如下:
(1)搜集流域的气象水文数据集,其中气象水文数据集包括目标断面的表层水温时间序列和水位;气象水文数据集还可包括降水、入库流量、出库流量、气温、风速、风向、露点温度、云量、相对湿度中的一种或多种;
(2)气象水文数据集中数据集的完整性判断采用作图法,绘制各要素的日尺度时间过程线,通过判断日尺度时间过程线有无断点,以判断数据集的完整性;数据集异常值检测采用作图法,绘制各要素的日尺度时间过程线,通过观察日尺度时间过程线有无突跳点,根据各要素的正常值域范围,判别数据是否异常;对数据集中的缺失值或异常值,若为单个缺失或异常,采用其对应的特征平均值代替;若为连续多个缺失或异常,则采用线性插值法计算相应值,形成修订气象水文数据集;
(3)将步骤(2)修订气象水文数据集进行标准化和归一化处理得到模型输入数据集;数据归一化为将原始数据归一化到0~1区间;
(4)采用Norton密度佛汝德数法进行水库水温结构判别得到水库水温结构类型;
Norton密度佛汝德数判别公式为
Figure BDA0003344823270000091
式中:Fr为密度佛汝德数;L为水库长度,m;Q为入库流量,m3/s;H为平均水深,m;V为库容,m3;E为标准化的垂向密度梯度,E=Δρ/(ρ0H);g为重力加速度,m3/s;
当Fr>1.0时,水库为完全混合型;
当0.5<Fr<1.0时,水库为混合型;
当0.1<Fr<0.5时,水库为弱分层型;
当Fr<0.1时,水库为稳定分层型;
其中,混合型或完全混合型水库为库内流速较大的中小型水库,垂向温度差异较小;弱分层型或稳定分层型水库的水温特性呈周期性变化;表温层,即水体表面部分水体受太阳辐射和气温影响显著,水体掺混均匀,水温差异较小;温跃层,即表温层以下为温度突变区域,垂向水温差异较大;滞温层,即温跃层以下区域,水温较低且年变幅较小,为停滞静水区域;
(5)采用MI互信息计算模型输入数据集对表层水温的影响大小,进行输入数据的筛选;输入数据的筛选方法为互信息,互信息以熵理论为基础,是信息论里一种有用的信息度量,能够度量输入变量与预测对象间的线性和非线性关系,也能够度量一个变量中含有的关于另一个变量的信息量;
利用互信息方法进行输入数据集的筛选步骤为
1)分别计算步骤(4)中归一化后的各气象水文数据输入数据集X对应的熵H(X)定义如下:
Figure BDA0003344823270000092
2)计算各气象水文数据输入数据集X与水温时间序列Y的联合熵H(X,Y):
Figure BDA0003344823270000093
3)计算各气象水文数据输入数据集X与水温时间序列Y的条件熵H(X|Y):
Figure BDA0003344823270000094
4)熵、条件熵、联合熵之间的关系如下:
H(X,Y)=H(X)+H(X|Y) (5)
5)计算各要素与水温数据的互信息如下:
I(X,Y)=H(X)+H(Y)-H(X,Y) (6)
熵、条件熵、联合熵、互信息之间关系如下图所示:
式中:n为输入数据集中的自变量个数,Y表示水温,各气象水文数据输入数据集为x1,x2,…,xn,对应概率密度函数值分别为p1,p2,…,pn,p(x,y)为联合概率分布,满足p(x|y)为条件概率;
6)采用MI互信息进行数据筛选,计算输入数据集中每个影响因素的互信息MI值,MI值表示各组输入数据对表层水温的影响程度,对MI值进行由大到小排序,根据排序结果,对输入数据集中的影响因子进行筛选,将对表层水温影响小的输入数据剔除即MI值最小的影响因子删除,保留影响大的参与表层水温模拟;目前,互信息方法已用于径流模拟、滑坡变形预测等模型输入变量的优化,表现出较高的准确性;
(6)构建表层水温单层LSTM神经网络预测模型,将步骤(5)筛选的输入数据中前2/3的数据作为表层水温LSTM神经网络的训练集,剩余的1/3数据作为验证集,采用训练集的数据对表层水温LSTM神经网络进行训练;
长短时记忆神经网络(LSTM)为循环神经网络(RNN),包括专门存储长时间信息的记忆细胞,可感知前一时刻信息,及特定的控制门结构,控制着信息流在LSTM内的传递;LSTM神经网络单元结构和连接见图2,在t时刻,一个LSTM单元有3个输入、2个输出,其中xt表示t时刻输入,ht-1表示t-1时刻LSTM输出,ct-1表示t-1时刻单元状态,h t表示t时刻单元输出,ct表示时刻单元输出;矩形框被称为记忆块(memory block),主要包含了三个门:遗忘门(forget gate)、输入门(input gate)以及输出门(output gate)与一个记忆单元(cell);方框内上方水平线被称为单元状态(cell state),它类似于信息传送带可以控制信息传递给下一时刻;
遗忘门通过sigmoid函数决定上一时刻的输出数据通过或部分通过以过滤信息;
输入门通过sigmoid函数筛选输入数据以更新信息;
输出门通过sigmoid函数得到初始输出值,使用tanh函数对初始输出值进行处理得到一个-1~1的值,再将该值与初始输出值逐对相乘得到最终输出值,其中
ft=σ(Wfhht-1+Wfxxt+bf) (7)
it=σ(Wihht-1+Wixxt+bi) (8)
Figure BDA0003344823270000101
Figure BDA0003344823270000111
ot=σ(Wohht-1+Woxxt+bo) (11)
Figure BDA0003344823270000112
式中:ft为遗忘门输出;it为输入门输出;ot代表输出门输出;
Figure BDA0003344823270000113
为当前输入单元状态;xt为时间序列中t时间的输入数据;ht-1是t上一时间记忆块的输出结果;Wfh为遗忘门到单元输出的权重;Wfx为遗忘门到单元输入的权重;Wih为输入门到单元输出的权重;Wix为输入门到单元输入的权重;
Figure BDA0003344823270000114
为当前输入的单元状态到单元输出的权重;
Figure BDA0003344823270000115
为当前输入的单元状态到单元输入的权重;Woh为输出门到单元输入的权重;Wox为输出门到单元输出的权重;bf为遗忘门的偏置;bi为输入门的偏置;
Figure BDA0003344823270000116
为当前输入单元状态的偏置;bo为输出门的偏置;σ()是指sigmoid函数;tanh()是指tanh函数;
Figure BDA0003344823270000117
是指元素乘法运算;ct表示单元状态(cell state)的细胞记忆;
基于LSTM模型进行水温模拟原理(见图3),包括一个输入层(Input Layer)、一个LSTM层(LSTM Layer)、一个全连接层(Fully Connected Layer)及一个输出层(OutputLayer);输入层用于环境因子数据的输入,如
Figure BDA0003344823270000118
为气温AT、流量Q、水位WL等的时间序列,被用作输入变量来预测同一时期(无滞后时间)的水温WT(y1 y2…yn),其中n表示时间序列的长度,m表示输入变量的个数;LSTM层为模型的核心部分,包括多个细胞单元(LSTM Cell),每个细胞单元能通过输入层输入的变量进行样本学习模拟预测水温;全连接层可以把高维变到低维,同时把有用的信息保留下来,能够有效的把各单元样本学习情况结合到一起,它控制着模型的学习宽度和长度,神经元个数增加,模型复杂度提升,全连接层数加深,模型非线性表达能力提高,其中(h1t h2t…hMt)表示LSTM层在时间步长t的输出,M表示LSTM层中LSTM单元(隐藏单元)的数量;输出层的功能为输出水温(WT)模拟预测结果;
(7)采用步骤(6)经训练的表层LSTM神经网络对验证集进行表层水温模拟,并采用实测表层水温数据对模拟结果进行验证,其中验证方法为采用相关性系数r、均方根误差RMSE、Nash-Sutcliffe效率系数NSE和平均误差MAE对模型精度进行评估;
相关性系数计算公式为
Figure BDA0003344823270000121
均方根误差RMSE计算公式为
Figure BDA0003344823270000122
Nash-Sutcliffe效率系数NSE计算公式为
Figure BDA0003344823270000123
平均误差MAE计算公式为
Figure BDA0003344823270000124
式中:n为样本数,Tobs,i为实测流量;
Figure BDA0003344823270000125
为实测流量的平均值;Tsim,i为模拟流量,
Figure BDA0003344823270000126
为模拟流量的平均值;
(8)根据步骤(4)水库水温结构类型、上一层水温及各深度层对应的相对储水量,构建相应水库水温结构类型的垂向水温模型,采用MI互信息计算模型输入数据集对垂向水温的影响大小,进行输入数据的筛选,筛选方法与步骤(5)相同;
其中垂向水温模型构建方法为
当水库为弱分层或稳定分层型水库时,表温层的温度即为步骤(7)的表层水温,构建常规温跃层水温模拟模型;当水库为完全混合型或混合型水库时,表温层的温度即为步骤(7)的表层水温,构建5~8层温跃层水温模拟模型(见图4);
(9)构建垂向水温LSTM神经网络预测模型,采用步骤(8)筛选的输入数据和垂向水温时间序列中前2/3的数据作为垂向水温LSTM神经网络的训练集,剩余的1/3数据作为验证集,采用训练集对垂向水温LSTM神经网络进行训练;
以上一层水温值和筛选后的输入数据集中前2/3的数据作为该层水温LSTM神经网络的训练集,剩余的1/3数据作为验证集,采用训练集对该层水温LSTM神经网络进行训练;逐层往下至到达滞温层,进行滞温层的水温模拟,得到训练期水库垂向各深度层水温,即训练期水库垂向水温值分布;
采用步骤(9)经训练的垂向各深度层LSTM神经网络对各深度层验证集进行水温模拟,并计算垂向各层实测水温数据与模拟水温之间相关性系数r、均方根误差RMSE、Nash-Sutcliffe效率系数NSE和平均误差MAE验证模型精度;模型精度对应各指标数值评价标准见表1;
表1模型精度对应各指标数值评价标准
Figure BDA0003344823270000131
当相关系数r大于等于0.8时,认为模型有较好效果,当相关系数r介于0.6至0.8时,模型效果令人满意,当相关系数r低于0.6时,模型效果较差;当均方根误差RMSE小于等于1℃时,认为模型有较好效果,当均方根误差RMSE介于1至1.5℃时,模型效果令人满意,当均方根误差RMSE大于1.5℃时,模拟效果较差;当纳什效率系数NSE大于等于0.75时,可认为模型有较好模拟效果,当纳什效率系数NSE介于0.36至0.75之间,模型效果令人满意,当纳什效率系数NSE低于0.36时,模拟效果较差;当平均绝对误差MAE小于等于1℃时,认为模型有较好效果,当平均绝对误差MAE介于1至2℃时,模型效果令人满意,当平均绝对误差MAE大于2℃时,模拟效果较差。
实施例2:本实施例以某高坝大库进行垂向水温模拟;
一种基于多层LSTM神经网络的垂向水温模拟方法,具体步骤如下:
(1)搜集流域的气象水文数据集:搜集水库坝前70km处断面2018-2019年逐日的表层水温时间序列,以及2018-2019年的模型输入数据集:水位、入库流量、出库流量、气温、风速、风向、露点温度、云量、相对湿度9组数据集;
(2)判断步骤(1)气象水文数据集中数据集的完整性:采用作图法,绘制各要素的日尺度时间过程线,通过判断日尺度时间过程线有无断点,以判断数据集的完整性;数据集异常值检测采用作图法,绘制各要素的日尺度时间过程线,通过观察日尺度时间过程线有无突跳点,根据各要素的正常值域范围,判别数据是否异常;对数据集中的缺失值或异常值,采用其对应的特征平均值代替形成修订气象水文数据集;
(3)将步骤(2)修订气象水文数据集进行标准化和归一化处理得到模型输入数据集;数据归一化为将水位、入库流量、出库流量、气温、风速、风向、露点温度、云量、相对湿度数据归一化到0~1区间;
(4)采用Norton密度佛汝德数法进行水库水温结构判别得到水库水温结构类型;
Norton密度佛汝德数判别公式为
Figure BDA0003344823270000141
式中:Fr为密度佛汝德数;L为水库长度,m;Q为入库流量,m3/s;H为平均水深,m;V为库容,m3;E为标准化的垂向密度梯度,E=Δρ/(ρ0H);g为重力加速度,m3/s;
当Fr>1.0时,水库为完全混合型;
当0.5<Fr<1.0时,水库为混合型;
当0.1<Fr<0.5时,水库为弱分层型;
当Fr<0.1时,水库为稳定分层型;
其中,混合型或完全混合型水库为库内流速较大的中小型水库,垂向温度差异较小;弱分层型或稳定分层型水库的水温特性呈周期性变化;表温层,即水体表面部分水体受太阳辐射和气温影响显著,水体掺混均匀,水温差异较小;温跃层,即表温层以下为温度突变区域,垂向水温差异较大;滞温层,温跃层以下区域,水温较低且年变幅较小,为停滞静水区域;
Norton密度佛汝德数法计算结果见表2,
表2Norton密度佛汝德数法计算结果
Figure BDA0003344823270000142
由表2计算结果可知该水库的密度佛汝德数为0.0015小于0.1,故该水库水温为稳定分层型结构;
(5)采用MI互信息计算模型输入数据集对表层水温的影响大小,进行输入数据的筛选;MI互信息是计算各个自变量与水温变量之间的信息量大小,从而评价各个自变量对水温变量产生影响的重要性,可用于输入变量的筛选;
输入数据的筛选方法为互信息,互信息以熵理论为基础,是信息论里一种有用的信息度量,能够度量输入变量与预测对象间的线性和非线性关系,也能够度量一个变量中含有的关于另一个变量的信息量;
利用互信息方法进行输入数据集的筛选步骤为
1)分别计算步骤(4)中归一化后的各气象水文数据输入数据集X对应的熵H(X)定义如下:
Figure BDA0003344823270000143
2)计算各气象水文数据输入数据集X与水温时间序列Y的联合熵H(X,Y):
Figure BDA0003344823270000151
3)计算各气象水文数据输入数据集X与水温时间序列Y的条件熵H(X|Y):
Figure BDA0003344823270000152
4)熵、条件熵、联合熵之间的关系如下:
H(X,Y)=H(X)+H(X|Y) (5)
5)计算各要素与水温数据的互信息如下:
I(X,Y)=H(X)+H(Y)-H(X,Y) (6)
式中:n为输入数据集中的自变量个数,Y表示水温,各气象水文数据输入数据集为x1,x2,…,xn,对应概率密度函数值分别为p1,p2,…,pn,p(x,y)为联合概率分布,满足p(x|y)为条件概率;
本实施例采用了入库流量、出库流量、气温、风速、风向、露点温度、云量、相对湿度等9种数据,因此输入数据集中的自变量数目为n=9,数据时间范围是2018年1月1日~2019年12月31日,样本数m为730;
2)为了减少数据信息的冗余,使用MI互信息进行数据筛选,计算每个影响因素的互信息MI值,MI值表示各组输入数据对表层水温的影响程度,对MI值进行由大到小排序,根据排序结果,对输入数据集中的影响因子进行筛选,将对表层水温影响小的输入数据剔除即MI值最小的影响因子删除,保留影响大的参与表层水温模拟;目前,互信息方法已用于径流模拟、滑坡变形预测等模型输入变量的优化,表现出较高的准确性;经过计算各类影响因子数据的MI值,计算结果如表3所示:
表3表层水温影响因子互信息计算表
Figure BDA0003344823270000153
通过计算MI值,可知各影响因子对水温的重要性排序依次是:气温>相对湿度>露点温度>风向>水位>入库流量>出库流量>风速>云量;因此剔除云量数据,其他剩余的8个影响因子数据作为筛选后的输入数据集;
(6)构建表层水温LSTM神经网络预测模型,将步骤(4)筛选的2018-2019年输入数据中前2/3的数据作为表层水温LSTM神经网络的训练集,剩余的1/3数据作为验证集,采用训练集对表层水温LSTM神经网络进行训练;
长短时记忆神经网络(LSTM)为循环神经网络(RNN),包括专门存储长时间信息的记忆细胞,可感知前一时刻信息,及特定的控制门结构,控制着信息流在LSTM内的传递;LSTM神经网络单元结构和连接见图2,在t时刻,一个LSTM单元有3个输入、2个输出,其中xt表示t时刻输入,ht-1表示t-1时刻LSTM输出,ct-1表示t-1时刻单元状态,ht表示t时刻单元输出,ct表示时刻单元输出。矩形框被称为记忆块(memory block),主要包含了三个门:遗忘门(forget gate)、输入门(input gate)以及输出门(output gate)与一个记忆单元(cell)。方框内上方水平线被称为单元状态(cell state),它类似于信息传送带可以控制信息传递给下一时刻;
遗忘门通过sigmoid函数决定上一时刻的输出数据通过或部分通过以过滤信息;
输入门通过sigmoid函数筛选输入数据以更新信息;
输出门通过sigmoid函数得到初始输出值,使用tanh函数对初始输出值进行处理得到一个-1~1的值,再将该值与初始输出值逐对相乘得到最终输出值,其中
ft=σ(Wfhht-1+Wfxxt+bf) (7)
it=σ(Wihht-1+Wixxt+bi) (8)
Figure BDA0003344823270000161
Figure BDA0003344823270000162
ot=σ(Wohht-1+Woxxt+bo) (11)
Figure BDA0003344823270000163
式中:ft为遗忘门输出;it为输入门输出;ot代表输出门输出;
Figure BDA0003344823270000164
为当前输入单元状态;xt为时间序列中t时间的输入数据;ht-1是t上一时间记忆块的输出结果;Wfh为遗忘门到单元输出的权重;Wfx为遗忘门到单元输入的权重;Wih为输入门到单元输出的权重;Wix为输入门到单元输入的权重;
Figure BDA0003344823270000165
为当前输入的单元状态到单元输出的权重;
Figure BDA0003344823270000166
为当前输入的单元状态到单元输入的权重;Woh为输出门到单元输入的权重;Wox为输出门到单元输出的权重;bf为遗忘门的偏置;bi为输入门的偏置;
Figure BDA0003344823270000167
为当前输入单元状态的偏置;bo为输出门的偏置;σ()是指sigmoid函数;tanh()是指tanh函数;
Figure BDA0003344823270000168
是指元素乘法运算;ct表示单元状态(cell state)的细胞记忆;
基于LSTM模型进行水温模拟原理(见图3),包括一个输入层(Input Layer)、一个LSTM层(LSTM Layer)、一个全连接层(Fully Connected Layer)及一个输出层(OutputLayer)。输入层用于环境因子数据的输入,如
Figure BDA0003344823270000171
为气温AT、流量Q、水位WL等的时间序列,被用作输入变量来预测同一时期(无滞后时间)的水温WT(y1 y2…yn),其中n表示时间序列的长度,m表示输入变量的个数;LSTM层为模型的核心部分,包括多个细胞单元(LSTM Cell),每个细胞单元能通过输入层输入的变量进行样本学习模拟预测水温;全连接层可以把高维变到低维,同时把有用的信息保留下来,能够有效的把各单元样本学习情况结合到一起,它控制着模型的学习宽度和长度,神经元个数增加,模型复杂度提升,全连接层数加深,模型非线性表达能力提高,其中(h1t h2t…hMt)表示LSTM层在时间步长t的输出,M表示LSTM层中LSTM单元(隐藏单元)的数量;输出层的功能为输出水温(WT)模拟预测结果;
(7)采用步骤(6)经训练的表层LSTM神经网络对验证集进行表层水温模拟,并采用实测水温数据对模拟结果进行验证,其中验证方法为采用相关性系数r、均方根误差RMSE、Nash-Sutcliffe效率系数NSE和平均误差MAE对模型精度进行评估;
相关性系数计算公式为
Figure BDA0003344823270000172
均方根误差RMSE计算公式为
Figure BDA0003344823270000173
Nash-Sutcliffe效率系数NSE计算公式为
Figure BDA0003344823270000174
平均误差MAE计算公式为
Figure BDA0003344823270000175
式中:n为样本数,Tobs,i为实测流量;
Figure BDA0003344823270000176
为实测流量的平均值;Tsim,i为模拟流量,
Figure BDA0003344823270000177
为模拟流量的平均值;
表层水温的模拟结果见表4:
表4表层水温模拟效果评价表
Figure BDA0003344823270000181
由表4可知,表层水温模拟中训练期的NSE系数为0.95,验证期的NSE系数为0.90,模型模拟效果较好;训练期和验证期相关系数r均高于0.90,模型模拟效果好;平均绝对误差MAE和均方根误差RMSE都在1℃以内,根据各指标的评价标准,可知模型模拟效果较好;
(8)根据步骤(4)水库水温结构类型(稳定分层型)、上一层水温及各深度层对应的相对储水量,构建相应水库水温结构类型的垂向水温模型,由于水库为稳定分层型水库时,表温层的温度即为步骤(7)的表层水温,构建常规温跃层水温模拟模型;各深度层输入数据采用上层水温、相对储水量差值、入库流量、出库流量、气温、风速、风向、露点温度、云量、相对湿度10组时间序列数据,采用MI互信息计算模型输入数据集对垂向水温的影响大小,进行输入数据的筛选;
经过计算各类影响因子数据的MI值,计算结果如表5和表6所示:
表5温跃层水温影响因子互信息计算表
Figure BDA0003344823270000182
表6滞温层水温影响因子互信息计算表
Figure BDA0003344823270000191
表5中为温跃层水温影响因子互信息计算结果,从结果可知,云量因素对于各温跃层水温影响最小,因此在进行温跃层水温模拟时,剔除云量数据,其他剩余的10个影响因子数据作为筛选后的输入数据集;
滞温层水温模拟计算中,各气温要素影响极小,故进行排除,利用出库流量、入库流量、相对储水量差值和相对上层水温进行互信息值计算,表6为互信息计算结果,从结果可知,出库流量和入库流量因素对滞温层水温的影响较小,因此在进行滞温层水温模拟时,剔除出入库流量数据,利用相对储水量差值和相对上层水温数据作为筛选后的输入数据集;
(9)构建垂向水温LSTM神经网络预测模型,采用步骤(8)筛选的输入数据和垂向水温时间序列中前2/3的数据作为垂向水温LSTM神经网络的训练集,剩余的1/3数据作为验证集,采用训练集对垂向水温LSTM神经网络进行训练;
以上一层水温值和筛选后的输入数据集中前2/3的数据作为该层水温LSTM神经网络的训练集,剩余的1/3数据作为验证集,对该层水温LSTM神经网络进行训练;逐层往下至滞温层,进行滞温层的水温模拟,得到训练期水库垂向各深度层水温,即训练期水库垂向水温值分布;
(10)采用步骤(9)经训练的垂向各深度层LSTM神经网络对各深度层验证集进行水温模拟,并采用实测水温数据对模拟结果进行验证,其中验证方法为采用相关性系数r、均方根误差RMSE、Nash-Sutcliffe效率系数NSE和平均误差MAE对模型精度进行评估(见表7);
表7垂向水温模拟结果
Figure BDA0003344823270000201
由表7可知,通过多层LSTM模型进行垂向水温模拟,除相对深度为1155的验证期的NSE效率系数为0.89外,各层模拟结果训练期及验证期的NSE效率系数及相关系数r均高于0.90,模型模拟效果好;同时,各层模拟结果训练期及验证期的平均绝对误差、均方根误差均低于0.5℃,模型效果好。
综上所述,本发明基于多层LSTM神经网络的垂向水温模拟方法,可用于河流、湖泊及水库等的表层及垂向水温模拟预测,经某水库库区的实例分析,模型模拟效果好,模拟精度高,模型可靠。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (9)

1.一种基于多层LSTM神经网络的垂向水温模拟方法,其特征在于,具体步骤如下:
(1)搜集流域的气象水文数据集,其中气象水文数据集包括目标断面的表层水温时间序列和水位;
(2)判断步骤(1)气象水文数据集中数据集的完整性,对数据集进行异常值检测,若数据集中出现单个缺失或异常,采用其对应的特征平均值代替;若数据集中出现连续多个缺失或异常,则采用线性插值法计算相应值,形成修订气象水文数据集;
(3)将步骤(2)修订气象水文数据集进行标准化和归一化处理得到模型输入数据集;
(4)采用Norton密度佛汝德数法进行水库水温结构判别得到水库水温结构类型;
(5)采用MI互信息计算模型输入数据集对表层水温的影响大小,进行输入数据的筛选;
(6)构建表层水温单层LSTM神经网络预测模型,将步骤(5)筛选的输入数据中前2/3的数据作为表层水温LSTM神经网络的训练集,剩余的1/3数据作为验证集,采用训练集的数据对表层水温LSTM神经网络进行训练;
(7)采用步骤(6)经训练的表层LSTM神经网络对验证集进行表层水温模拟,并采用实测表层水温数据对模拟结果进行验证,其中验证方法为采用相关性系数r、均方根误差RMSE、Nash-Sutcliffe效率系数NSE和平均误差MAE对模型精度进行评估;
(8)根据步骤(4)水库水温结构类型、上一层水温和各深度层对应的相对储水量,构建相应水库水温结构类型的垂向水温模型,采用MI互信息计算模型输入数据集对垂向水温的影响大小,进行输入数据的筛选;
(9)构建垂向水温多层LSTM神经网络预测模型,采用步骤(8)筛选的输入数据和垂向水温时间序列中前2/3的数据作为垂向水温多层LSTM神经网络的训练集,剩余的1/3数据作为验证集,对垂向水温LSTM神经网络进行训练;
(10)采用步骤(9)经训练的垂向LSTM神经网络对验证集进行垂向水温模拟,并采用实测水温数据对模拟结果进行验证,其中验证方法为采用相关性系数r、均方根误差RMSE、Nash-Sutcliffe效率系数NSE和平均误差MAE对模型精度进行评估。
2.根据权利要求1所述基于多层LSTM神经网络的垂向水温模拟方法,其特征在于:步骤(1)气象水文数据集还包括降水、入库流量、出库流量、气温、风速、风向、露点温度、云量、相对湿度中的一种或多种。
3.根据权利要求1所述基于多层LSTM神经网络的垂向水温模拟方法,其特征在于:步骤(2)数据集的完整性判断采用作图法,绘制各要素的日尺度时间过程线,通过有无断点判断数据集的完整性;异常值检测采用作图法,绘制各要素的日尺度时间过程线,通过有无突跳点,根据各要素的正常值域范围,判别数据是否异常。
4.根据权利要求1所述基于多层LSTM神经网络的垂向水温模拟方法,其特征在于:步骤(4)Norton密度佛汝德数判别公式为
Figure FDA0003344823260000021
式中:Fr为密度佛汝德数;L为水库长度,m;Q为入库流量,m3/s;H为平均水深,m;V为库容,m3;E为标准化的垂向密度梯度,E=Δρ/(ρ0H);g为重力加速度,m3/s;
当Fr>1.0时,水库为完全混合型;
当0.5<Fr<1.0时,水库为混合型;
当0.1<Fr<0.5时,水库为弱分层型;
当Fr<0.1时,水库为稳定分层型。
5.根据权利要求1所述基于多层LSTM神经网络的垂向水温模拟方法,其特征在于:步骤(5)和步骤(8)中输入数据的筛选方法为MI互信息,利用MI互信息方法进行输入数据集的筛选步骤为
1)分别计算步骤(4)中归一化后的各气象水文数据输入数据集X对应的熵H(X):
Figure FDA0003344823260000022
2)计算各气象水文数据输入数据集X与水温时间序列Y的联合熵H(X,Y):
Figure FDA0003344823260000023
3)计算各气象水文数据输入数据集X与水温时间序列Y的条件熵H(X|Y):
Figure FDA0003344823260000024
4)熵、条件熵、联合熵之间的关系如下:
H(X,Y)=H(X)+H(X|Y) (5)
5)计算各要素与水温数据的互信息如下:
I(X,Y)=H(X)+H(Y)-H(X,Y) (6)
式中:n为输入数据集中的自变量个数,Y表示水温,各气象水文数据输入数据集为x1,x2,…,xn,对应概率密度函数值分别为p1,p2,…,pn,p(x,y)为联合概率分布,满足p(xy)为条件概率;
6)采用MI互信息进行数据筛选,计算输入数据集中每个影响因素的互信息MI值,对MI值进行由大到小排序,根据排序结果,筛选出与水温最大相关、最小冗余的环境因子,排除MI值最小的影响因子。
6.根据权利要求1所述基于多层LSTM神经网络的垂向水温模拟方法,其特征在于:
LSTM神经网络包括遗忘门、输入门、输出门和记忆单元;
遗忘门通过sigmoid函数决定上一时刻的输出数据通过或部分通过以过滤信息;
输入门通过sigmoid函数筛选输入数据以更新信息;
输出门通过sigmoid函数得到初始输出值,使用tanh函数对初始输出值进行处理得到一个-1~1的值,再将该值与初始输出值逐对相乘得到最终输出值;其中
ft=σ(Wfhht-1+Wfxxt+bf) (7)
it=σ(Wihht-1+Wixxt+bi) (8)
Figure FDA0003344823260000031
Figure FDA0003344823260000032
ot=σ(Wohht-1+Woxxt+bo) (11)
Figure FDA0003344823260000033
式中:ft为遗忘门输出;it为输入门输出;ot代表输出门输出;
Figure FDA0003344823260000034
为当前输入单元状态;xt为时间序列中t时间的输入数据;ht-1是t上一时间记忆块的输出结果;Wfh为遗忘门到单元输出的权重;Wfx为遗忘门到单元输入的权重;Wih为输入门到单元输出的权重;Wix为输入门到单元输入的权重;
Figure FDA0003344823260000037
为当前输入的单元状态到单元输出的权重;
Figure FDA0003344823260000038
为当前输入的单元状态到单元输入的权重;Woh为输出门到单元输入的权重;Wox为输出门到单元输出的权重;bf为遗忘门的偏置;bi为输入门的偏置;
Figure FDA0003344823260000035
为当前输入单元状态的偏置;bo为输出门的偏置;σ()是指sigmoid函数;tanh()是指tanh函数;
Figure FDA0003344823260000036
是指元素乘法运算;ct表示单元状态(cellstate)的细胞记忆。
7.根据权利要求1所述基于多层LSTM神经网络的垂向水温模拟方法,其特征在于:相关性系数计算公式为
Figure FDA0003344823260000041
均方根误差RMSE计算公式为
Figure FDA0003344823260000042
Nash-Sutcliffe效率系数NSE计算公式为
Figure FDA0003344823260000043
平均误差MAE计算公式为
Figure FDA0003344823260000044
式中:n为样本数,Tobs,i为实测流量;
Figure FDA0003344823260000045
为实测流量的平均值;Tsim,i为模拟流量,
Figure FDA0003344823260000046
为模拟流量的平均值。
8.根据权利要求4所述基于多层LSTM神经网络的垂向水温模拟方法,采用了多层LSTM模型,其特征在于:步骤(8)中垂向水温模型构建方法为
当水库为弱分层或稳定分层型水库时,表温层的温度即为步骤(7)的表层水温,构建常规温跃层水温模拟模型,以各深度层对应的相对储水量、上一层水温值和筛选后的输入数据集中前2/3的数据作为该层水温LSTM神经网络的训练集,剩余的1/3数据作为验证集,对该层水温LSTM神经网络进行训练;
逐层往下至到达滞温层,进行滞温层的水温模拟,得到训练期水库垂向各深度层水温,即训练期水库垂向水温值分布;
采用经训练的各深度层LSTM神经网络对各深度层验证集进行水温模拟,并采用实测水温数据对模拟结果进行验证,其中验证方法为采用相关性系数r、均方根误差RMSE、Nash-Sutcliffe效率系数NSE和平均误差MAE对模型精度进行评估。
9.根据权利要求8所述基于多层LSTM神经网络的垂向水温模拟方法,其特征在于:步骤(8)中垂向水温模型构建方法为
当水库为完全混合型或混合型水库时,构建5~8层温跃层水温模拟模型。
CN202111319072.9A 2021-11-09 2021-11-09 一种基于多层lstm神经网络的垂向水温模拟方法 Active CN114036838B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111319072.9A CN114036838B (zh) 2021-11-09 2021-11-09 一种基于多层lstm神经网络的垂向水温模拟方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111319072.9A CN114036838B (zh) 2021-11-09 2021-11-09 一种基于多层lstm神经网络的垂向水温模拟方法

Publications (2)

Publication Number Publication Date
CN114036838A true CN114036838A (zh) 2022-02-11
CN114036838B CN114036838B (zh) 2022-07-19

Family

ID=80136849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111319072.9A Active CN114036838B (zh) 2021-11-09 2021-11-09 一种基于多层lstm神经网络的垂向水温模拟方法

Country Status (1)

Country Link
CN (1) CN114036838B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114862035A (zh) * 2022-05-20 2022-08-05 厦门大学 一种基于迁移学习的组合式海湾水温预测方法
CN116362139A (zh) * 2023-04-14 2023-06-30 应急管理部沈阳消防研究所 基于层次化长短时记忆网络的多参量火灾检测方法
CN116595381A (zh) * 2023-06-13 2023-08-15 大连理工大学 一种水库分层水温模拟方法及系统
CN116738885A (zh) * 2023-06-16 2023-09-12 大连理工大学 一种城市河流水温预测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110715749A (zh) * 2019-09-30 2020-01-21 河海大学 适用于复杂水域的三维水温智能监测装置、系统和方法
CN111832230A (zh) * 2020-07-20 2020-10-27 南京信大气象科学技术研究院有限公司 基于相关性分析和数据均衡的能见度分层预测模型
CN111855970A (zh) * 2020-08-25 2020-10-30 中国地质科学院水文地质环境地质研究所 一种包气带水分入渗检测模拟装置
CN112116147A (zh) * 2020-09-16 2020-12-22 南京大学 一种基于lstm深度学习的河流水温预测方法
CN112836884A (zh) * 2021-02-07 2021-05-25 国网福建省电力有限公司经济技术研究院 基于Copula-DBiLSTM的综合能源系统多元负荷精确预测方法
US20210224682A1 (en) * 2020-01-16 2021-07-22 Saudi Arabian Oil Company Training of machine learning algorithms for generating a reservoir digital twin

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110715749A (zh) * 2019-09-30 2020-01-21 河海大学 适用于复杂水域的三维水温智能监测装置、系统和方法
US20210224682A1 (en) * 2020-01-16 2021-07-22 Saudi Arabian Oil Company Training of machine learning algorithms for generating a reservoir digital twin
CN111832230A (zh) * 2020-07-20 2020-10-27 南京信大气象科学技术研究院有限公司 基于相关性分析和数据均衡的能见度分层预测模型
CN111855970A (zh) * 2020-08-25 2020-10-30 中国地质科学院水文地质环境地质研究所 一种包气带水分入渗检测模拟装置
CN112116147A (zh) * 2020-09-16 2020-12-22 南京大学 一种基于lstm深度学习的河流水温预测方法
CN112836884A (zh) * 2021-02-07 2021-05-25 国网福建省电力有限公司经济技术研究院 基于Copula-DBiLSTM的综合能源系统多元负荷精确预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
顾乾晖,等: "基于QPSO优化LSTM神经网络水质预测模型的应用研究", 《网络安全技术与应》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114862035A (zh) * 2022-05-20 2022-08-05 厦门大学 一种基于迁移学习的组合式海湾水温预测方法
CN114862035B (zh) * 2022-05-20 2024-05-03 厦门大学 一种基于迁移学习的组合式海湾水温预测方法
CN116362139A (zh) * 2023-04-14 2023-06-30 应急管理部沈阳消防研究所 基于层次化长短时记忆网络的多参量火灾检测方法
CN116362139B (zh) * 2023-04-14 2024-01-30 应急管理部沈阳消防研究所 基于层次化长短时记忆网络的多参量火灾检测方法
CN116595381A (zh) * 2023-06-13 2023-08-15 大连理工大学 一种水库分层水温模拟方法及系统
CN116595381B (zh) * 2023-06-13 2024-04-02 大连理工大学 一种水库分层水温模拟方法及系统
CN116738885A (zh) * 2023-06-16 2023-09-12 大连理工大学 一种城市河流水温预测方法及系统
CN116738885B (zh) * 2023-06-16 2024-06-07 大连理工大学 一种城市河流水温预测方法及系统

Also Published As

Publication number Publication date
CN114036838B (zh) 2022-07-19

Similar Documents

Publication Publication Date Title
CN114036838B (zh) 一种基于多层lstm神经网络的垂向水温模拟方法
CN105243435B (zh) 一种基于深度学习元胞自动机模型的土壤含水量预测方法
CN108875161A (zh) 基于卷积神经网络深度学习的流量等级预测方法
CN116485584B (zh) 高寒区大底坡河流wee协同调控方法及系统
CN107609290A (zh) 一种以底栖生物多样性为目标的河流生态流量确定方法
CN111259522B (zh) 一种水文模型在地理空间上多流域并行率定的方法
CN112287294A (zh) 一种基于深度学习的时空双向土壤含水量插值方法
CN113792372A (zh) 一种基于cv-lstm组合模型的地连墙变形动态预测方法
CN111310322A (zh) 基于元胞自动机的干旱区自然绿洲空间动态模拟方法
Cui et al. A secondary modal decomposition ensemble deep learning model for groundwater level prediction using multi-data
CN116205136A (zh) 基于径流滞后信息的大尺度流域深度学习洪水预报方法
Serencam et al. Determining the water level fluctuations of Lake Van through the integrated machine learning methods
Moradi et al. Prediction of groundwater level fluctuation using methods based on machine learning and numerical model
Beran The water resources impact of future climate change and variability
CN117010274B (zh) 一种基于集成增量学习的地下水有害元素智能预警方法
Alzate-Gómez et al. Analysis of different hypotheses for modeling air–water exchange and temperature evolution in a tropical reservoir
Jang et al. Spatiotemporal algal bloom prediction of geum river, Korea using the deep learning models in company with the EFDC model
Theodoropoulos et al. Hydrodynamic habitat modelling based on freshwater macroinvertebrates
CN118194235B (zh) 一种多模式融合的降水干湿时序变化重构方法及系统
Movagharnejad et al. Artificial neural network modeling for predicting of some ion concentrations in the Karaj River
Abeysinghe et al. Prediction of thermal stratification of the Kotmale reservoir using a hydrodynamic model
Jang et al. A Hybrid Approach for the Prediction of Chlorophyll-a Concentration at the Non-monitoring Area in the Geum River, Korea
Alzate-Gómez et al. corrected Proof
Trivedi 15. Rainfall-Runoff Modelling for Assessment of Climate Change
Seifi et al. Hourly soil temperature prediction using integrated machine learning methods, GLUE uncertainty analysis, Taguchi search, and wavelet coherence analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant