CN111639748B - 一种基于lstm-bp时空组合模型的流域污染物通量预测方法 - Google Patents

一种基于lstm-bp时空组合模型的流域污染物通量预测方法 Download PDF

Info

Publication number
CN111639748B
CN111639748B CN202010411906.8A CN202010411906A CN111639748B CN 111639748 B CN111639748 B CN 111639748B CN 202010411906 A CN202010411906 A CN 202010411906A CN 111639748 B CN111639748 B CN 111639748B
Authority
CN
China
Prior art keywords
flux
model
lstm
time
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202010411906.8A
Other languages
English (en)
Other versions
CN111639748A (zh
Inventor
李立
刘迎军
王康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202010411906.8A priority Critical patent/CN111639748B/zh
Publication of CN111639748A publication Critical patent/CN111639748A/zh
Application granted granted Critical
Publication of CN111639748B publication Critical patent/CN111639748B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于LSTM‑BP时空组合模型的流域污染物通量预测方法,包括:S1、以实时监测数据作为驱动因子、前期降雨量及降雨强度作为表征土壤干湿程度的状态因子、不同土地利用下的污染物通量理论值序列作为响应因子、月份特征及水文期特征作为时间因子,对流域产汇污过程进行模拟;S2、使用基于LSTM的时间模拟器自动提取历史数据间的固有特征以及输入特征间的复杂非线性关系;S3、构建基于BP神经网络的空间组合器,自动捕获各个监测站点间的空间位置关系;S4、利用深度学习建立基于LSTM‑BP时空组合模型的流域污染物通量预测模型,实现对流域污染物日通量的精确预测。本发明为长期持续性预测流域污染物通量提供一种新的方法,且建立的模型可靠性高,预测结果精确。

Description

一种基于LSTM-BP时空组合模型的流域污染物通量预测方法
技术领域
本发明涉及流域污染物通量预测技术领域,尤其涉及一种基于LSTM-BP时空组合模型的流域污染物通量预测方法。
背景技术
生态系统中氮磷元素的过量输入是导致流域水体污染及水生态破坏的重要原因。为有效地进行流域水质管理,人们通过各种不同的方法确定流域污染物通量。总体来说,目前各种针对流域污染物通量的预测多是基于物理模型的方法。代表性的方法有:水文模拟(HSPF)模型、土壤和水评估工具(SWAT)模型、农业非点源污染(AGNPS)模型等。这类模型多以逐日的气象数据作为输入条件,并结合流域下垫面信息等,对流域进行过程及其驱动下的面源污染通量模拟。由于要对水体的机理过程进行刻画,所以这类模型通常都较为复杂且对数据及其分辨率敏感,计算单元的大小及下垫面土地利用的精细程度等都在很大程度上影响了模型的计算结果。
与流域水文和污染物迁移转化模型相比,数据驱动模型摒弃了复杂的理论模型,只是基于数理统计的方法进行目标预测,并通过最小化预测数据与真实数据间的误差来自动捕捉输入数据之间的复杂非线性关系。近年来多种数据驱动模型如支持向量机(SVM)、自回归滑动平均(ARMA)、反向传播神经网络(BP NN)、循环神经网络(RNN)、长短时记忆神经网络(LSTM NN)等被广泛应用于水环境系统中。但学者多是将机器学习与深度学习模型应用在对水体浓度或径流量的预测,多使用气象、水质、水文数据,往往忽略了数据序列的时间特性以及流域土壤干湿状态、土壤类型等信息对于径流和污染物通量时间序列的影响。
发明内容
本发明要解决的技术问题在于针对现有技术中流域水文和污染物迁移转化模型在很大程度上受到数据源及其分辨率影响的问题以及现有的研究方法未能有效提取各项数据间的时空特征的缺陷,本发明利用深度学习的高维性、非线性、自适应性以及神经元间的广泛互联性,提供一种基于LSTM-BP时空组合模型的流域污染物通量预测方法。
本发明解决其技术问题所采用的技术方案是:
本发明提供一种基于LSTM-BP时空组合模型的流域污染物通量预测方法,该方法包括以下步骤:
S1、获取各个流域监测站点的实时监测数据和历史监测数据,将实时监测数据和气象数据作为驱动因子,前期降雨量及降雨强度作为表征土壤干湿程度的状态因子,不同土地利用下的污染物通量理论值序列作为响应因子,月份特征及水文期特征作为时间因子,对流域产汇污过程进行模拟;
S2、使用基于LSTM的时间模拟器自动提取历史数据间的固有特征以及输入特征间的复杂非线性关系,将驱动、状态、响应、时间因子以及流域污染物通量的历史值作为LSTM的输入层,隐藏层输出为该流域监测站点在当前时刻的污染物通量模拟预测值;
S3、构建基于BP神经网络的空间组合器,自动捕获各个监测站点间的空间位置关系;
S4、利用深度学习建立与流域水文和污染物迁移转化模型相适应的基于LSTM-BP时空组合模型的流域污染物通量预测模型,实现对流域污染物日通量的精确预测。
进一步地,本发明的该方法中的污染物通量以流域总氮TN通量作为研究对象。
进一步地,本发明的该方法中还包括计算各个流域监测站点TN通量之间的空间相关性的方法:
在构建模型之前,计算各流域监测站TN通量间的空间相关性,结果表明各监测站TN通量间存在高度相关性,故使用单个模型来预测所有站点的TN通量,代替使用单独的模型来预测每个站点的TN通量,通过附近站点的相关输入提高模型预测性能;
计算各流域监测站TN通量间的空间相关性的公式为:
Figure BDA0002493550110000031
其中:xi和xj分别代表监测站i和监测站j的流域TN通量值序列,Cov(·)为协方差,σ(·)为标准差,r(·)是不同监测站点TN通量序列间的皮尔逊相关系数。
进一步地,本发明的步骤S1中构建状态因子的方法具体为:
流域产汇流和污染负荷过程具有明显的时间滞后性,将降雨量向后平移相应的天数,计算平移后的TN通量与降雨量的相关系数,得到在后移第3天时,相关系数达到最大值;因此,选择第3天及其前后2天,即前当时刻的前5天的总降雨量作为当前时刻的前期降雨量,并将前期降雨量以及当前时刻的降雨量等级作为表征当前时刻土壤干湿程度的指标,同时在LSTM模型的输入层增加状态因子,即前期降雨量和当前时刻降雨等级。
进一步地,本发明的步骤S1中构建响应因子的方法具体为:
计算不同土地利用下的TN通量理论值序列,其公式为:
Figure BDA0002493550110000032
其中:i=i,…,n表示流域内所包含的土地利用类型,TN表示TN通量,TNi表示第i类土地利用类型的面源污染负荷理论值,S为流域面积,Si表示第i类土地利用的面积。
进一步地,本发明的步骤S1中构建时间因子的方法具体为:
对于具有时间序列特性的污染物通量和气象数据,考虑时间因素在污染物通量的变化中起到的作用,引入月份特征及水文期特征作为时间因子。
进一步地,本发明的步骤S1中还包括对多维数据进行预处理的方法,具体为:
数据归一化:针对污染物通量、气象、前期降雨量数据,不同变量之间的度量单位不同,为避免数据对度量单位的依赖和提升训练模型的收敛速度及精度,在将数据输入到LSTM模型之前,对数据进行归一化处理;采用线性归一化的方式将数据归一化到0和1之间:
Figure BDA0002493550110000041
其中:x为原始数据,minx和maxx表示原始数据x所属变量的最小值和最大值;在输出层使用下式换算回污染物通量:
x=x*(maxx-minx)+minx
One-hot编码:针对月份、水文期、降雨量等级这类不具备序列性、不能比较大小的标称型特征,使用One-hot编码,将其转化为二进制码;水文期特征有3个分类值,对应的One-hot编码为:001表示丰水期、010表示枯水期、100表示平水期。
进一步地,本发明的步骤S2中构建基于LSTM的时间模拟器的方法具体为:
利用长短期记忆模型在时间序列预测和建模问题中的记忆长期依赖关系的能力,分别为每一个流域监测站点建立一个基于LSTM的多输入模型,来自动提取各个监测站点历史数据间的固有特征以及输入特征间的复杂非线性关系;第i个流域监测站点的LSTM模型:输入层是驱动、状态、响应、时间因子以及流域TN通量的历史值构成的输入向量(xt,xt-1,...,xt-n),隐藏层输出是该监测站点在t时刻的TN通量模拟预测值hit;在t时刻,LSTM记忆单元的输入有:当前时刻输入变量xt、前一时刻隐藏层状态变量ht-1和前一时刻记忆单元状态变量;之后模型依次通过遗忘门ft、输入门it、输出门ot;LSTM记忆单元的输出有:当前时刻输出变量ht和当前时刻记忆单元状态变量ct;因此,在流域污染物通量预测中,输入门用于控制新观测值对当前预测值的影响;同时,输出门控制着过去趋势的影响;
遗忘门ft:用于计算对长期记忆信息ct-1的丢弃程度,通过Sigmoid函数处理为0到1之间的值,0表示全部忘记,1表示全部保留;
ft=σ(Wf[ht-1,xt]+bf)
输入门it:用于计算当前时刻的输入信息xt以多大程度添加到长期记忆信息ct中;
it=σ(Wi[ht-1,xt]+bi)
候选门
Figure BDA0002493550110000051
用于计算当前输入的单元状态;
Figure BDA0002493550110000052
由此,当前时刻记忆单元状态由两部分构成:一部分是通过遗忘门丢弃掉部分长期记忆信息;另一部分是通过输入门添加当前时刻新增加的信息;即:
Figure BDA0002493550110000053
输出门ot:用于计算当前时刻信息被输出的程度;
ot=σ(Wo[ht-1,xt]+bo)
ht=ot·tanh(ct)
最后,ht会作为LSTM隐藏层的输出,得到第i个流域监测站点在t时刻的最终输出hit;其中:Wf、Wi、Wc、Wo、bf、bi、bc、bo为模型中可调参数矩阵或向量,在模型训练时,这些参数将会通过反向误差传播算法自动得到优化,σ为Sigmoid激活函数,tanh为双曲正切激活函数。
进一步地,本发明的步骤S3中构建基于BP的空间组合器的方法具体为:
利用BP神经网络的非线性表达能力,将LSTM模型的隐藏层输出作为BP模型的输入,构建一个基于BP神经网络的空间组合器来自动寻找各个站点之间的非线性映射特征,从而实现对各个流域监测站点TN通量的精确预测;
BP神经网络隐藏层第j个神经元的输出zj为:
Figure BDA0002493550110000054
经过BP神经网络隐藏层映射之后的zj直接作为输出层的输入,由输出层进行非线性拟合;到此,输出层第k个站点的输出Sk为:
Figure BDA0002493550110000055
其中,hit表示第i个站点经过LSTM模型在t时刻的输出,wij、wjk、bj、bk为模型中可调参数矩阵或向量,这些参数将通过反向误差传播算法自动得到优化,m为站点总数,I表示BP神经网络隐藏层的神经元个数,f(·)表示神经元的激活函数,选用Sigmoid激活函数。
进一步地,本发明的步骤S4中构建基于LSTM-BP时空组合模型的方法具体为:
使用深度学习框架Keras搭建LSTM-BP组合模型,并利用已经构建的预测模型模拟出流域TN通量,达到对流域TN通量快捷预测的目的;首先,输入向量是经过预处理的历史流域TN通量数据和辅助数据,其中辅助数据包括:驱动、状态、响应和时间因子;其次,将输入向量输入到基于LSTM的时间模拟器组件中,以模拟各监测站TN通量值的变化;之后,将时间模拟器给出的各监测站模拟预测值输入到基于BP的空间组合器中;最后,在输出层获得各个流域监测站点在当前时刻的TN通量预测值。
本发明产生的有益效果是:(1)本发明从数据驱动的角度,利用深度学习的高维性、非线性、自适应性以及神经元间的广泛互联性,建立了与流域水文和污染物迁移转化模型相适应的基于LSTM-BP时空组合模型的流域污染物通量预测模型;(2)以气象站的实时监测数据作为驱动因子、前期降雨量及降雨强度作为表征土壤干湿程度的状态因子、不同土地利用下的污染物通量理论值序列作为响应因子、月份特征及水文期特征作为时间因子,对流域产汇污过程进行模拟;(3)使用基于LSTM的时间模拟器自动提取历史数据间的固有特征以及输入特征间的复杂非线性关系;(4)使用基于BP的空间组合器自动捕获各个监测站点间的空间位置关系,从而实现了对流域污染物日通量的精确预测;(5)本发明为长期持续性预测流域污染物通量提供一种新的方法,且建立的模型可靠性高,预测结果精确。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例的基于LSTM-BP时空组合模型的流域污染物通量预测方法的流程图;
图2是本发明实施例的LSTM中记忆单元的内部结构图;
图3是本发明实施例的BP神经网络结构图;
图4是本发明实施例的基于LSTM-BP的流域污染物通量预测模型图;
图5是本发明实施例的测试集上TN通量预测值与实测值的散点图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明实施例以流域TN通量作为研究对象。
本发明实施例在构建模型之前,使用式(1)计算该研究区各流域监测站TN通量间的空间相关性,如表1所示。结果表明该研究区各流域监测站TN通量间存在高度相关性。这种强空间相关性支持使用单个模型来预测所有站点的TN通量,而不是使用单独的模型来预测每个站点的TN通量,因为附近站点的相关输入可以提高模型预测性能。
Figure BDA0002493550110000071
其中:xi和xj分别代表监测站i和监测站j的流域TN通量值序列,Cov(·)为协方差,σ(·)为标准差,r(·)是不同监测站点TN通量序列间的皮尔逊相关系数。
表1该研究区域不同流域监测站点TN通量间的皮尔逊相关系数
Figure BDA0002493550110000072
如图1所示,本发明实施例的基于LSTM-BP时空组合模型的流域污染物通量预测方法,包括以下步骤:
S1、以气象站的实时监测数据作为驱动因子、前期降雨量及降雨强度作为表征土壤干湿程度的状态因子、不同土地利用下的污染物通量理论值序列作为响应因子、月份特征及水文期特征作为时间因子,对流域产汇污过程进行模拟;
该步骤还包括构建驱动因子的方法。气象数据包括:降雨(PCP,mm)、最低气温(MIN,℃)、最高气温(MAX,℃)、湿度(HMD,%)、辐射(SLR,MJ/m2)及风强(WND,m/s)。降雨对于地表径流过程的影响最为显著,而湿度、辐射、风强等参数在很大程度上影响了下垫面土壤水分,从而一定程度上改变了降雨后径流和入渗的比例。因此,在LSTM模型输入层增加外部驱动因子(气象数据)。
该步骤还包括构建状态因子的方法。流域产汇流和污染负荷过程具有明显的时间滞后性。将降雨量向后平移相应的天数,使用式(1)计算平移后的污染物通量与降雨量的相关系数,得到在后移第3天时,相关系数达到最大值。因此,选择第3天及其前后2天,即前当时刻的前5天的总降雨量作为当前时刻的前期降雨量,并将前期降雨量以及当前时刻的降雨量等级作为表征当前时刻土壤干湿程度的指标,同时在LSTM模型的输入层增加状态因子(前期降雨量和当前时刻降雨等级)。
该步骤还包括构建响应因子的方法。下垫面特征对流域产汇流、产汇污过程具有重要作用。因此,需要在模型的输入特征中加入下垫面特征。对于每一类土地利用类型,使用下式计算其理论值序列:
Figure BDA0002493550110000081
其中:i=i,…,n表示流域内所包含的土地利用类型,TN表示TN通量,TNi表示第i类土地利用类型的面源污染负荷理论值,S为流域面积,Si表示第i类土地利用的面积。
该步骤还包括构建时间因子的方法。对于具有时间序列特性的污染物通量和气象数据,时间因素在污染物通量的变化中起着至关重要的作用。因此,在LSTM模型的输入层增加时间因子(月份和水文期)。
该步骤还包括对多维数据进行预处理的方法。数据归一化:针对污染物通量、气象、前期降雨量数据,不同变量之间的度量单位不同,为避免数据对度量单位的依赖和提升训练模型的收敛速度及精度,在将数据输入到LSTM模型之前,需先对数据归一化。采用线性归一化的方式将数据归一化到0和1之间:
Figure BDA0002493550110000091
其中:x为原始数据,minx和maxx表示原始数据x所属变量的最小值和最大值。在输出层使用下式换算回污染物通量:
x=x*(maxx-minx)+minx (4)
One-hot编码:针对月份、水文期、降雨量等级这类不具备序列性、不能比较大小的标称型特征,不能使用简单的数值来粗暴代替,因为特征的属性数值会影响模型权重矩阵的运算,故使用One-hot编码(独热编码),将其转化为二进制码。如水文期特征有3个分类值,对应的One-hot编码为:001表示丰水期、010表示枯水期、100表示平水期。
S2、使用基于LSTM的时间模拟器自动提取历史数据间的固有特征以及输入特征间的复杂非线性关系;
该步骤利用长短期记忆模型在时间序列预测和建模问题中的记忆长期依赖关系的能力,分别为每一个流域监测站点建立了一个基于LSTM的多输入模型,来自动提取各个监测站点历史数据间的固有特征以及输入特征间的复杂非线性关系。如图2所示,第i个流域监测站点的LSTM模型:输入层是驱动、状态、响应、时间因子以及流域TN通量的历史值构成的输入向量(xt,xt-1,...,xt-n),隐藏层输出是该监测站点在t时刻的TN通量模拟预测值hit。在t时刻,LSTM记忆单元的输入有:当前时刻输入变量xt、前一时刻隐藏层状态变量ht-1和前一时刻记忆单元状态变量ct-1。之后模型依次通过遗忘门ft、输入门it、输出门ot。LSTM记忆单元的输出有:当前时刻输出变量ht和当前时刻记忆单元状态变量ct。因此,在流域污染物通量预测中,输入门用于控制新观测值对当前预测值的影响;同时,输出门控制着过去趋势的影响。例如:当TN通量变化缓慢时,输出门趋于关闭,保持趋势信息;当TN通量急剧变化时,输入门打开以获得新的观测结果。详解如下:
遗忘门ft:用于计算对长期记忆信息ct-1的丢弃程度,通过Sigmoid函数处理为0到1之间的值,0表示全部忘记,1表示全部保留;
ft=σ(Wf[ht-1,xt]+bf) (5)
输入门it:用于计算当前时刻的输入信息xt以多大程度添加到长期记忆信息ct中;
it=σ(Wi[ht-1,xt]+bi) (6)
候选门
Figure BDA0002493550110000101
用于计算当前输入的单元状态;
Figure BDA0002493550110000102
由此,当前时刻记忆单元状态由两部分构成:一部分是通过遗忘门丢弃掉部分长期记忆信息;另一部分是通过输入门添加当前时刻新增加的信息。即:
Figure BDA0002493550110000103
输出门ot:用于计算当前时刻信息被输出的程度;
ot=σ(Wo[ht-1,xt]+bo) (9)
ht=ot·tanh(ct) (10)
最后,ht会作为LSTM隐藏层的输出,得到第i个流域监测站点在t时刻的最终输出hit。其中:Wf、Wi、Wc、Wo、bf、bi、bc、bo为模型中可调参数矩阵或向量(在模型训练时,这些参数将会通过反向误差传播算法自动得到优化),σ为Sigmoid激活函数,tanh为双曲正切激活函数;
S3、使用基于BP的空间组合器自动捕获各个监测站点间的空间位置关系;
该步骤利用BP神经网络的非线性表达能力,将LSTM模型的隐藏层输出作为BP模型的输入,构建一个基于BP神经网络的空间组合器来自动寻找各个站点之间的非线性映射特征,从而实现对各个流域监测站点TN通量的精确预测,如图3所示:
BP神经网络隐藏层第j个神经元的输出zj为:
Figure BDA0002493550110000104
经过BP神经网络隐藏层映射之后的zj直接作为输出层的输入,由输出层进行非线性拟合。到此,输出层第k个站点的输出Sk为:
Figure BDA0002493550110000105
其中,hit表示第i个站点经过LSTM模型在t时刻的输出,wij、wjk、bj、bk为模型中可调参数矩阵或向量(这些参数将通过反向误差传播算法自动得到优化),m为站点总数,I表示BP神经网络隐藏层的神经元个数,f(·)表示神经元的激活函数(这里选用Sigmoid激活函数)。
S4、利用深度学习的高维性、非线性、自适应性以及神经元间的广泛互联性,建立与流域水文和污染物迁移转化模型相适应的基于LSTM-BP时空组合模型的流域污染物通量预测模型,并实现对流域污染物日通量的精确预测。
该步骤使用深度学习框架Keras搭建了基于LSTM-BP的流域污染物通量预测模型,如图4所示。首先,输入向量是经过预处理的历史流域TN通量数据和辅助数据,其中辅助数据包括:驱动、状态、响应和时间因子。其次,将输入向量输入到基于LSTM的时间模拟器组件中,以模拟各监测站TN通量值的变化。之后,将时间模拟器给出的各监测站模拟预测值输入到基于BP的空间组合器中。最后,在输出层获得各个流域监测站点在当前时刻的TN通量预测值。
使用预测值与实测值间的均方根误差(RMSE)、平均绝对误差(MAE)以及平均绝对百分误差(MAPE)进行模型可靠性评估,计算公式如下;
Figure BDA0002493550110000111
Figure BDA0002493550110000112
Figure BDA0002493550110000113
利用训练集对LSTM-BP模型进行训练,测试集对LSTM-BP模型进行性能评估。测试集上TN通量预测值和实测值的散点图如图5所示,不同水文期的模型预测结果如表2所示。
表2测试集上不同水文期的模型预测结果
Figure BDA0002493550110000114
Figure BDA0002493550110000121
一系列试验证明:尽管对于不同流域监测站TN日通量值的预测存在一定的差异,但均具有较好的精度,可以说该模型是很适用的。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (6)

1.一种基于LSTM-BP时空组合模型的流域污染物通量预测方法,其特征在于,该方法包括以下步骤:
S1、获取各个流域监测站点的实时监测数据和历史监测数据,将实时监测数据和气象数据作为驱动因子,前期降雨量及降雨强度作为表征土壤干湿程度的状态因子,不同土地利用下的污染物通量理论值序列作为响应因子,月份特征及水文期特征作为时间因子,对流域产汇污过程进行模拟;
S2、使用基于LSTM的时间模拟器自动提取历史数据间的固有特征以及输入特征间的复杂非线性关系,将驱动、状态、响应、时间因子以及流域污染物通量的历史值作为LSTM的输入层,隐藏层输出为该流域监测站点在当前时刻的污染物通量模拟预测值;
S3、构建基于BP神经网络的空间组合器,自动捕获各个监测站点间的空间位置关系;
S4、利用深度学习建立与流域水文和污染物迁移转化模型相适应的基于LSTM-BP时空组合模型的流域污染物通量预测模型,实现对流域污染物日通量的精确预测;
该方法中的污染物通量以流域总氮TN通量作为研究对象;
步骤S2中构建基于LSTM的时间模拟器的方法具体为:
利用长短期记忆模型在时间序列预测和建模问题中的记忆长期依赖关系的能力,分别为每一个流域监测站点建立一个基于LSTM的多输入模型,来自动提取各个监测站点历史数据间的固有特征以及输入特征间的复杂非线性关系;第i个流域监测站点的LSTM模型:输入层是驱动、状态、响应、时间因子以及流域TN通量的历史值构成的输入向量(xt,xt-1,...,xt-n),隐藏层输出是该监测站点在t时刻的TN通量模拟预测值hit;在t时刻,LSTM记忆单元的输入有:当前时刻输入变量xt、前一时刻隐藏层状态变量ht-1和前一时刻记忆单元状态变量;之后模型依次通过遗忘门ft、输入门it、输出门ot;LSTM记忆单元的输出有:当前时刻输出变量ht和当前时刻记忆单元状态变量ct;因此,在流域污染物通量预测中,输入门用于控制新观测值对当前预测值的影响;同时,输出门控制着过去趋势的影响;
遗忘门ft:用于计算对长期记忆信息ct-1的丢弃程度,通过Sigmoid函数处理为0到1之间的值,0表示全部忘记,1表示全部保留;
ft=σ(Wf[ht-1,xt]+bf)
输入门it:用于计算当前时刻的输入信息xt以多大程度添加到长期记忆信息ct中;
it=σ(Wi[ht-1,xt]+bi)
候选门
Figure FDA0003781947450000021
用于计算当前输入的单元状态;
Figure FDA0003781947450000022
由此,当前时刻记忆单元状态由两部分构成:一部分是通过遗忘门丢弃掉部分长期记忆信息;另一部分是通过输入门添加当前时刻新增加的信息;即:
Figure FDA0003781947450000023
输出门ot:用于计算当前时刻信息被输出的程度;
ot=σ(Wo[ht-1,xt]+bo)
ht=ot·tanh(ct)
最后,ht会作为LSTM隐藏层的输出,得到第i个流域监测站点在t时刻的最终输出hit;其中:Wf、Wi、Wc、Wo、bf、bi、bc、bo为模型中可调参数矩阵或向量,在模型训练时,这些参数将会通过反向误差传播算法自动得到优化,σ为Sigmoid激活函数,tanh为双曲正切激活函数;
步骤S3中构建基于BP的空间组合器的方法具体为:
利用BP神经网络的非线性表达能力,将LSTM模型的隐藏层输出作为BP模型的输入,构建一个基于BP神经网络的空间组合器来自动寻找各个站点之间的非线性映射特征,从而实现对各个流域监测站点TN通量的精确预测;
BP神经网络隐藏层第j个神经元的输出zj为:
Figure FDA0003781947450000024
经过BP神经网络隐藏层映射之后的zj直接作为输出层的输入,由输出层进行非线性拟合;到此,输出层第k个站点的输出Sk为:
Figure FDA0003781947450000031
其中,hit表示第i个站点经过LSTM模型在t时刻的输出,wij、wjk、bj、bk为模型中可调参数矩阵或向量,这些参数将通过反向误差传播算法自动得到优化,m为站点总数,I表示BP神经网络隐藏层的神经元个数,f(·)表示神经元的激活函数,选用Sigmoid激活函数;
步骤S4中构建基于LSTM-BP时空组合模型的方法具体为:
使用深度学习框架Keras搭建LSTM-BP组合模型,并利用已经构建的预测模型模拟出流域TN通量,达到对流域TN通量快捷预测的目的;首先,输入向量是经过预处理的历史流域TN通量数据和辅助数据,其中辅助数据包括:驱动、状态、响应和时间因子;其次,将输入向量输入到基于LSTM的时间模拟器组件中,以模拟各监测站TN通量值的变化;之后,将时间模拟器给出的各监测站模拟预测值输入到基于BP的空间组合器中;最后,在输出层获得各个流域监测站点在当前时刻的TN通量预测值。
2.根据权利要求1所述的基于LSTM-BP时空组合模型的流域污染物通量预测方法,其特征在于,该方法中还包括计算各个流域监测站点TN通量之间的空间相关性的方法:
在构建模型之前,计算各流域监测站TN通量间的空间相关性,结果表明各监测站TN通量间存在高度相关性,故使用单个模型来预测所有站点的TN通量,代替使用单独的模型来预测每个站点的TN通量,通过附近站点的相关输入提高模型预测性能;
计算各流域监测站TN通量间的空间相关性的公式为:
Figure FDA0003781947450000032
其中:xi和xj分别代表监测站i和监测站j的流域TN通量值序列,Cov(·)为协方差,σ(·)为标准差,r(·)是不同监测站点TN通量序列间的皮尔逊相关系数。
3.根据权利要求1所述的基于LSTM-BP时空组合模型的流域污染物通量预测方法,其特征在于,步骤S1中构建状态因子的方法具体为:
流域产汇流和污染负荷过程具有明显的时间滞后性,将降雨量向后平移相应的天数,计算平移后的TN通量与降雨量的相关系数,得到在后移第3天时,相关系数达到最大值;因此,选择第3天及其前后2天,即前当时刻的前5天的总降雨量作为当前时刻的前期降雨量,并将前期降雨量以及当前时刻的降雨量等级作为表征当前时刻土壤干湿程度的指标,同时在LSTM模型的输入层增加状态因子,即前期降雨量和当前时刻降雨等级。
4.根据权利要求1所述的基于LSTM-BP时空组合模型的流域污染物通量预测方法,其特征在于,步骤S1中构建响应因子的方法具体为:
计算不同土地利用下的TN通量理论值序列,其公式为:
Figure FDA0003781947450000041
其中:i=i,…,n表示流域内所包含的土地利用类型,TN表示TN通量,TNi表示第i类土地利用类型的面源污染负荷理论值,S为流域面积,Si表示第i类土地利用的面积。
5.根据权利要求1所述的基于LSTM-BP时空组合模型的流域污染物通量预测方法,其特征在于,步骤S1中构建时间因子的方法具体为:
对于具有时间序列特性的污染物通量和气象数据,考虑时间因素在污染物通量的变化中起到的作用,引入月份特征及水文期特征作为时间因子。
6.根据权利要求1所述的基于LSTM-BP时空组合模型的流域污染物通量预测方法,其特征在于,步骤S1中还包括对多维数据进行预处理的方法,具体为:
数据归一化:针对污染物通量、气象、前期降雨量数据,不同变量之间的度量单位不同,为避免数据对度量单位的依赖和提升训练模型的收敛速度及精度,在将数据输入到LSTM模型之前,对数据进行归一化处理;采用线性归一化的方式将数据归一化到0和1之间:
Figure FDA0003781947450000042
其中:x为原始数据,minx和maxx表示原始数据x所属变量的最小值和最大值;在输出层使用下式换算回污染物通量:
x=x*(maxx-minx)+minx
One-hot编码:针对月份、水文期、降雨量等级这类不具备序列性、不能比较大小的标称型特征,使用One-hot编码,将其转化为二进制码;水文期特征有3个分类值,对应的One-hot编码为:001表示丰水期、010表示枯水期、100表示平水期。
CN202010411906.8A 2020-05-15 2020-05-15 一种基于lstm-bp时空组合模型的流域污染物通量预测方法 Expired - Fee Related CN111639748B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010411906.8A CN111639748B (zh) 2020-05-15 2020-05-15 一种基于lstm-bp时空组合模型的流域污染物通量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010411906.8A CN111639748B (zh) 2020-05-15 2020-05-15 一种基于lstm-bp时空组合模型的流域污染物通量预测方法

Publications (2)

Publication Number Publication Date
CN111639748A CN111639748A (zh) 2020-09-08
CN111639748B true CN111639748B (zh) 2022-10-11

Family

ID=72330213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010411906.8A Expired - Fee Related CN111639748B (zh) 2020-05-15 2020-05-15 一种基于lstm-bp时空组合模型的流域污染物通量预测方法

Country Status (1)

Country Link
CN (1) CN111639748B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112329990A (zh) * 2020-10-20 2021-02-05 昆明理工大学 一种基于lstm-bp神经网络的用户用电负荷预测方法
CN112348241B (zh) * 2020-10-28 2024-01-05 中国农业科学院农业资源与农业区划研究所 一种保护地农用地面源污染排放量预测方法及系统
CN112684130A (zh) * 2020-11-23 2021-04-20 深圳市水务科技有限公司 流域水质预测方法和装置、计算机可读存储介质
CN112613639A (zh) * 2020-11-30 2021-04-06 河南汇祥通信设备有限公司 一种基于lstm模型的综合管廊运维数据预测系统及方法
CN112733442B (zh) * 2020-12-31 2022-07-29 交通运输部公路科学研究所 基于深度学习的路面长期性能预测模型的构建方法
CN112906936B (zh) * 2021-01-07 2022-12-02 中地大海洋(广州)科学技术研究院有限公司 基于集成神经网络的河流污染物通量智能计算与预测方法
CN112651665B (zh) * 2021-01-14 2022-12-20 浙江鸿程计算机系统有限公司 一种基于图神经网络的地表水水质指标预测方法和装置
CN112819218B (zh) * 2021-01-27 2022-05-06 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 高分辨率城市移动源污染时空预测方法、系统及存储介质
CN113313235B (zh) * 2021-05-25 2024-05-03 江南大学 一种基于改进的lstm的空气质量预测模型装置及方法
CN113837352B (zh) * 2021-08-06 2023-07-14 中国地质大学(武汉) 基于长短期记忆神经网络的降雨-径流时空关系模拟方法
CN114034334B (zh) * 2021-09-15 2023-11-07 青岛理工大学 岩溶管道污染源和流量的识别方法
CN114386686B (zh) * 2021-12-30 2022-10-18 北京师范大学 一种基于改进lstm的流域水质短期预测方法
CN114493017A (zh) * 2022-01-28 2022-05-13 南京邮电大学 基于参数迁移的水质预测方法
CN114609008B (zh) * 2022-03-30 2023-09-01 中国科学院地理科学与资源研究所 一种气体浓度预测模型的训练方法和气体浓度预测方法
CN115358463B (zh) * 2022-08-18 2023-06-30 长沙学院 生态敏感区输变电建设工程水环境监测与影响评估方法
CN115759403B (zh) * 2022-11-15 2023-12-15 东北农业大学 一种针对寒区水循环过程的动态组合预测模型构建方法
CN116047633B (zh) * 2023-01-28 2023-10-03 广州爱浦路网络技术有限公司 一种基于5gs的降雨监测方法
CN117272813B (zh) * 2023-09-26 2024-04-30 长春师范大学 一种基于水平衡约束深度学习的土壤湿度预测方法
CN117313551A (zh) * 2023-11-28 2023-12-29 中国科学院合肥物质科学研究院 基于gat-lstm的放射性核素扩散预测方法及系统
CN117744704B (zh) * 2024-02-21 2024-04-30 云南宇松科技有限公司 一种烟气污染源采集监测系统、方法及可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110459036A (zh) * 2019-09-09 2019-11-15 四川省水利科学研究院 一种基于深度学习的山洪预警方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103175513B (zh) * 2013-03-01 2013-11-06 戴会超 水利工程影响下基于物联网的流域水文水质监控系统及方法
US10417498B2 (en) * 2016-12-30 2019-09-17 Mitsubishi Electric Research Laboratories, Inc. Method and system for multi-modal fusion model
CN109615011A (zh) * 2018-12-14 2019-04-12 河海大学 一种基于lstm的中小河流短期洪水预报方法
CN110969282A (zh) * 2019-10-17 2020-04-07 天津大学 一种基于lstm复合网络的径流量稳定预测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110459036A (zh) * 2019-09-09 2019-11-15 四川省水利科学研究院 一种基于深度学习的山洪预警方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种LSTM-BP多模型组合水文预报方法;冯钧 等;《计算机与现代化》;20180604;全文 *
基于机器学习模型的民航客流预测仿真研究;刘夏 等;《软件》;20180531;全文 *

Also Published As

Publication number Publication date
CN111639748A (zh) 2020-09-08

Similar Documents

Publication Publication Date Title
CN111639748B (zh) 一种基于lstm-bp时空组合模型的流域污染物通量预测方法
CN110084367B (zh) 一种基于lstm深度学习模型的土壤墒情预测方法
Nikoo et al. Flood-routing modeling with neural network optimized by social-based algorithm
CN114626512B (zh) 一种基于有向图神经网络的高温灾害预报方法
CN111310968A (zh) 一种基于互信息的lstm神经网络循环水文预报方法
CN109583565B (zh) 基于注意力模型长短时记忆网络的洪水预测方法
CN105243435B (zh) 一种基于深度学习元胞自动机模型的土壤含水量预测方法
CN113554466B (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN113705877A (zh) 基于深度学习模型的实时月径流预报方法
CN113505923B (zh) 一种地区电网短期负荷预测方法及系统
CN110728409B (zh) 一种洪水过程类型相似性挖掘与快速预测方法
CN114492922A (zh) 一种中长期发电量预测方法
CN115099500A (zh) 基于权重修正和drsn-lstm模型的水位预测方法
CN113033081A (zh) 一种基于som-bpnn模型的径流模拟方法及系统
CN112285376A (zh) 一种基于cnn-lstm的风速预测方法
CN115759461A (zh) 一种面向物联网的多元时间序列预测方法及系统
CN113219871A (zh) 一种养护室环境参数检测系统
CN116757303A (zh) 一种沉降预测方法、系统和设备
CN114330815A (zh) 一种基于改进goa优化lstm的超短期风电功率预测方法与系统
CN113255739A (zh) 一种鱼饲料检测与配方系统
CN115392128B (zh) 一种利用时空卷积lstm网络模拟流域径流量的方法
CN116663404A (zh) 一种耦合人工智能和贝叶斯理论的洪水预报方法及系统
CN113487069B (zh) 一种基于grace日降尺度和新型dwsdi指数的区域洪涝灾害风险评估方法
CN115423146A (zh) 一种基于多因子最近邻抽样回归和支持向量机的自适应径流预报方法
CN114611788A (zh) 一种基于gru网络的寒潮天气客观判别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20221011