CN113743017A - 一种基于计算机视觉及lstm神经网络的大流域径流模拟方法 - Google Patents

一种基于计算机视觉及lstm神经网络的大流域径流模拟方法 Download PDF

Info

Publication number
CN113743017A
CN113743017A CN202111066392.8A CN202111066392A CN113743017A CN 113743017 A CN113743017 A CN 113743017A CN 202111066392 A CN202111066392 A CN 202111066392A CN 113743017 A CN113743017 A CN 113743017A
Authority
CN
China
Prior art keywords
data
neural network
data set
lstm neural
input data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111066392.8A
Other languages
English (en)
Inventor
袁旭
陆颖
何大明
李亚
张珂瑶
王加红
王海龙
郭子璞
赖红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan University YNU
Original Assignee
Yunnan University YNU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan University YNU filed Critical Yunnan University YNU
Priority to CN202111066392.8A priority Critical patent/CN113743017A/zh
Publication of CN113743017A publication Critical patent/CN113743017A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/08Fluids

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于计算机视觉及LSTM神经网络的大流域径流模拟方法,属于水文模拟技术领域。本发明搜集流域的气象水文数据集,并将气象水文数据集进行标准化和归一化处理得到输入数据集;采用计算机视觉技术的局部二值模式算法识别和提取除流量时间序列以外的输入数据集的空间纹理特征;再利用空间金字塔映射SPM对输入数据集的空间纹理特征和强度特征进行表征;采用MIV平均影响值方法计算数据的强度特征对流量的平均影响值,进行输入数据的筛选;将筛选后的数据分为训练数据集和验证数据集,基于训练数据集对LSTM神经网络进行训练;基于验证数据集及训练后的LSTM神经网络进行径流模拟,并采用实测流量对模拟结果进行验证。

Description

一种基于计算机视觉及LSTM神经网络的大流域径流模拟方法
技术领域
本发明涉及一种基于计算机视觉及LSTM神经网络的大流域径流模拟方法,属于水文模拟技术领域。
背景技术
水文模型可分为基于物理过程的水文模型和数据驱动水文模型两大类。基于物理过程模拟方法指以水文学原理为基础,基于数学模型描述产流过程与河道演进过程,该方法存在大量需要校准的模型参数且其优化困难。相较于基于物理过程的水文模型,数据驱动水文模型方法弱化了对水循环物理过程的描述,是以建立输入输出数据之间的最优数学关系为目标的黑箱方法,该方法具备结构简单、易于操作和兼容性强等特征,避免了复杂的参数率定。
随着无人机测绘、雷达、卫星遥感等观测技术的发展,大尺度连续对地观测成为现实,全球尺度遥感影像、气象、植被覆盖等数据日益丰富,并向高精度、短时间间隔、多源化发展,为水文模拟提供了丰富的驱动数据。由于数据驱动水文模拟方法特点在于弱化对水文循环物理过程的描述,转而强调数据间的关系,因此是大数据背景下重要的水文模拟手段。然而,数据驱动水文模拟方法研究面临的机遇与挑战并存,面临的挑战主要是数据驱动模拟方法难以充分利用由卫星、遥感等手段获取的数据空间分布信息,具体表现在如下方面:各类数据(例如:降水、气温、土壤含水量、叶面积指数等)的空间异质性难以表征的问题,传统数据驱动模拟方法主要采用的是观测站点时间序列数据或网格数据平均值与径流时序建立映射关系进行预测,而地球观测卫星获得的空间覆盖数据难以被数据驱动模型充分利用。传统数据驱动模型往往忽略了输入数据的空间特性,但输入数据空间分布模式对径流模拟有重大影响,例如一场暴雨中心发生在流域出口附近,会使流域出口流量短时间内达到峰值,忽视此类气象数据空间分布特征,则会导致径流模拟的不准确。数据驱动水文模型面临的上述挑战,在大型河流更为突出。由于下垫面条件的复杂和水文气象要素时空分布的不均匀,流域产汇流呈现高度非线性。此外大型河流通常跨越多个气候分区及地貌单元,且流域内植被覆盖差异明显,导致流域产汇流机制空间差异性显著,由于传统数据驱动水文模型对流域空间差异考虑不足,难以较好的适用于大型河流降雨—径流模拟。
传统数据驱动模型采用多个站点数据(或提取利用遥测数据每个栅格的时间序列)与径流时间序列数据参与训练,而不进行数据空间信息挖掘,会使训练数据集庞大、复杂,包含大量冗余信息(例如:向邻站点间相似的观测数据),致使模拟精度降低、模拟效率变慢。
此外传统数据驱动模型缺乏合适的预报因子筛选方法。原因在于大型流域的数据输入时往往采用卫星遥感提供的面域上的数据,数据存在多个网格(包含经纬度及时间多个维度),而径流数据为流域出口断面时间序列,输入数据与径流数据间维度不同,难以有效对预报因子进行筛选。此外,部分现有技术采用互信息对径流预报因子筛选时,虽然可以比较同类型预报因子,从而进行筛选(比如不同来源的降雨数据),但由于不同类数据结构的差异(例如降雨数据是非连续的数据类型、而土壤湿度数据是连续数据类型),较难用于筛选不同类型预报因子。
发明内容
本发明针对现有数据驱动模型在大流域应用时,难以有效筛选及充分利用数据空间信息,以至于出现模拟精度低、模型运行效率低下的问题,提供一种基于计算机视觉及LSTM神经网络的大流域径流模拟方法,即以计算机视觉、MIV平均影响值、LSTM神经网络等方法为基础构建的适用于大流域的径流模拟方法。可实现海量网格数据的筛选、空间特征信息提取与表征,并适宜于大流域的径流模拟、提高模拟精度及模型运行效率;解决现有技术无法充分利用输入数据的空间特征的缺陷,从而提高大流域数据驱动水文模型的性能及模拟精度。
一种基于计算机视觉及LSTM神经网络的大流域径流模拟方法,其特征在于,具体步骤如下:
(1)搜集流域的气象水文数据集,其中气象水文数据集包括目标断面的流量时间序列和全流域的降水数据;
(2)将步骤(1)气象水文数据集进行标准化和归一化处理得到模型的输入数据集;
(3)采用计算机视觉技术的局部二值模式LBP算法识别和提取步骤(2)中除流量时间序列以外的输入数据集的空间纹理特征;再利用空间金字塔映射SPM对输入数据集的空间纹理特征和强度特征进行表征;
(4)采用MIV平均影响值方法计算步骤(3)中输入数据的强度特征对流量的平均影响值,进行输入数据的筛选;
(5)将步骤(4)筛选后包含纹理特征和强度特征的输入数据与流量时间序列两类数据中前2/3作为LSTM神经网络的训练集,对LSTM神经网络进行训练;
(6)基于筛选后的输入数据与流量时间序列两类数据中后1/3数据作为验证数据集,采用步骤(5)中训练后的LSTM神经网络进行径流模拟,并利用实测流量对模拟结果进行验证,其中验证方法为采用相关性系数和Nash-Sutcliffe效率系数对模拟结果进行评估,验证模型模拟精度。
所述步骤(1)气象水文数据集还包括全流域的气温、风速、湿度、太阳辐射、积雪覆盖、雪水当量、叶面积指数、归一化植被指数、土壤湿度、水储量中的一种或多种。
所述步骤(3)采用计算机视觉技术的局部二值模式LBP算法识别和提取步骤(2)除流量时间序列以外的模型输入数据集的空间纹理特征的具体方法为
将图像栅格邻域作为处理单元,以像素中心点的灰度值作为阈值,若邻域像素点的灰度值大于或等于中心像素点的灰度值,则邻域像素值设置为1,若邻域像素点的灰度值小于中心像素点的灰度值,则邻域像素值设置为0,得到由0和1组成的二进制序列;将由0和1组成的二进制序列转换为十进制数得到中心像素点的LBP模式,LBP算法运算原理见图1所示,
所述LBP模式算子的公式为
Figure BDA0003258486890000031
Figure BDA0003258486890000032
式中,P为邻域的像素点个数,R为邻域的半径,gc为中心像素点的灰度值,gp为第p个像素点的灰度值。
进一步的,基于SPM表征数据特征的流程如图2所示,具体的,SPM不同“层”网格划分示意图见图3;所述利用空间金字塔映射SPM对输入数据的空间纹理特征和强度特征进行表征的方法为
SPM不同“层”网格数量:
“层级”为0时,不对图像进行划分,直接统计原始图像直方图;
当“层级”为1时将图像划分为均匀的4等分,并分别提取4张子图片的直方图;
当“层级”为2时将图像划分为均匀的16等分,并提取16张子图片的直方图;
图像进行L+1的“层级”划分,当图像划分到l层时,可以沿着图像的水平和垂直方向划分为2l×2l(l∈{0,1,…L})个网格;
SPM赋予不同的“层”下直方图的权重系数计算式为
Figure BDA0003258486890000033
式中,l为第l层,L为总层数,Wl为第l层的权重。
所述步骤(4)输入数据的筛选方法
1)基于步骤(3)的数据强度信息特征构建影响因素矩阵X,利用流量时间序列构成矩阵Y,
Figure BDA0003258486890000041
Y=[y1 y2… ym]T
式中,n为输入数据集中自变量的数目,m为训练集中样本数;
2)将影响因素矩阵X中的第i个自变量在其自身基础上增加δ,形成新的影响因素输入量
Figure BDA0003258486890000042
将影响因素矩阵X中的第i个自变量在其自身基础上减少δ,形成新的影响因素输入量
Figure BDA0003258486890000043
Figure BDA0003258486890000044
Figure BDA0003258486890000045
3)分别将影响因素
Figure BDA0003258486890000046
Figure BDA0003258486890000047
作为输入量,利用BP神经网络,分别得到输出量Yi +和Yi -
Figure BDA0003258486890000048
Figure BDA0003258486890000049
4)分别计算影响因素的MIV值,根据MIV的绝对值进行由大到小排序;其中MIV值计算式为
Figure BDA00032584868900000410
式中,IMIV,i为第i个自变量的MIV值;
5)将MIV值的绝对值由大到小进行排序,并剔除排序在后四分之一的数据。
所述步骤(5)LSTM神经网络包括遗忘门、输入门、输出门和记忆单元;
遗忘门通过sigmoid函数决定上一时刻的输出数据通过或部分通过以过滤信息;
输入门通过sigmoid函数筛选输入数据以更新信息;
输出门通过sigmoid函数得到初始输出值,再根据初始输出值及当前单元状态,基于tanh函数计算最终输出结果;其中
i[t]=σ(Wix[t]+Uih[t-1]+bi)
f[t]=σ(Wfx[t]+Ufh[t-1]+bf)
g[t]=tanh(Wgx[t]+Ugh[t-1]+bg)
o[t]=σ(Wox[t]+Uoh[t-1]+bo)
Figure BDA0003258486890000051
Figure BDA0003258486890000052
式中:i[t]、f[t]、o[t]分别为输入门、遗忘门和输出门;g[t]为细胞输入;x[t]为时间序列中t时间的输入数据;h[t-1]为t上一时间记忆块的输出结果;W、U、b为每个门对应的学习参数;σ()为sigmoid函数;tanh()为tanh函数;
Figure BDA0003258486890000053
为元素乘法运算;c[t]为单元状态(cell state)的细胞记忆。
所述步骤(6)相关性系数计算公式为
Figure BDA0003258486890000054
Nash-Sutcliffe效率系数计算公式为
Figure BDA0003258486890000055
式中:Qobs,i为实测流量;
Figure BDA0003258486890000056
为实测流量的平均值;Qsim,i为模拟流量。
本发明的有益效果是:
(1)本发明以计算机视觉、MIV平均影响值、LSTM神经网络等方法为基础的径流模拟方法,可实现流域空间特征信息提取与表征,解决现有技术无法充分利用输入数据的空间特征的缺陷,提高了大流域数据驱动水文模型的模拟精度;
(2)本发明基于MIV平均影响值、计算机视觉两种方法,通过对海量数据的筛选及特征提取,减少了输入数据的维度及参与模拟的数据量,有效的缩短了模型运行时间,进一步提高了模型运行效率;
(3)本发明数据需求简单,采用各类开源数据即可满足建模需要,避免了因实测数据缺乏而无法建模的情况,保证了模型在观测资料相对匮乏的区域也能适用。
附图说明
图1为LBP算法运算原理示意图;
图2为基于SPM的数据特征表征流程图;
图3为SPM不同“层”网格划分示意图;
图4为实施例2伊洛瓦底江流域部分降水数据计算机视觉特征;
图5为实施例2中1996~2005年伊洛瓦底江流域径流拟合结果;
图6为实施例2中2006~2010年伊洛瓦底江流域径流模拟结果。
具体实施方式
下面结合具体实施方式对本发明作进一步详细说明,但本发明的保护范围并不限于所述内容。
实施例1:一种基于计算机视觉及LSTM神经网络的大流域径流模拟方法,具体步骤如下:
(1)搜集流域的气象水文数据集,其中气象水文数据集包括目标断面的流量时间序列和全流域的降水数据;
气象水文数据集还可包括全流域的气温、风速、湿度、太阳辐射、积雪覆盖、雪水当量、叶面积指数(LAI)、归一化植被指数(NDVI)、土壤湿度、水储量(重力卫星数据推求)中的一种或多种;
(2)将步骤(1)气象水文数据集进行标准化和归一化处理至0~1得到模型输入数据集;
数据标准化为统一数据分辨率,归一化处理为将气象水文原始数据归一化至0~1区间;
(3)采用计算机视觉技术的局部二值模式算法(LBP)识别和提取步骤(2)除流量时间序列以外的输入数据集的空间纹理特征;
LBP算法为将图像栅格邻域作为处理单元,并以像素中心点的灰度值作为阈值,通过与邻域内的其他像素点进行数值比较,从而展现数据纹理特征;其中采用计算机视觉技术的局部二值模式LBP算法识别和提取步骤(2)模型输入数据集中所有输入数据的空间纹理特征的具体方法为
将图像栅格邻域作为处理单元,以像素中心点的灰度值作为阈值,若邻域像素点的灰度值大于或等于中心像素点的灰度值,则邻域像素值设置为1,若邻域像素点的灰度值小于中心像素点的灰度值,则邻域像素值设置为0,得到由0和1组成的二进制序列;将由0和1组成的二进制序列转换为十进制数得到中心像素点的LBP模式,LBP算法运算原理示意图(见图1);LBP模式算子的公式为
Figure BDA0003258486890000071
Figure BDA0003258486890000072
式中,P为邻域像素点的个数,R为邻域的半径,gc为中心像素点的灰度值,gp为第p个像素点的灰度值;
再利用空间金字塔映射(SPM)对输入数据集的空间纹理特征和强度特征进行表征,
SPM为基于近似全局几何对应来进行图像分类,通过将图像划分为不同层以及越来越精细的网格块,然后统计各个网格块的局部特征直方图,再组合形成图像的特征表示,基于SPM表征数据特征的流程如图2所示,具体的,SPM不同“层”网格划分示意图见图3;
SPM不同“层”网格数量定义如下:
“层级”为0时,不对图像进行划分,直接统计原始图像直方图;
当“层级”为1时将图像划分为均匀的4等分,并分别提取4张子图片的直方图;
当“层级”为2时将图像划分为均匀的16等分,并提取16张子图片的直方图;
图像进行L+1的“层级”划分,当图像划分到l层时,可以沿着图像的水平和垂直方向划分为2l×2l(l∈{0,1,…L})个网格;
SPM赋予不同的“层”下直方图的权重系数计算式为
Figure BDA0003258486890000073
式中,l为第l层,L为总层数,Wl为第l层的权重;
SPM每次提取直方图bin值的个数相同,将每个“层”下获得的直方图加权后连接起来,即可获得一个高维特征,可保存更丰富的图像信息;SPM进行特征的提取与表征后数据集由一组图像变成包含空间纹理信息和强度信息的特征向量;
(4)采用MIV平均影响值方法计算步骤(3)中输入数据的强度特征对流量的平均影响值,进行输入数据的筛选;
MIV为输入神经元对输出神经元影响大小的指标,用于评价各个自变量对应变量产生影响的重要性,可用于输入变量的筛选;
输入数据的筛选方法
1)基于步骤(3)的数据强度信息特征构建影响因素矩阵X,利用流量时间序列构成矩阵Y,
Figure BDA0003258486890000081
Y=[y1 y2 … ym]T (4)
式中,n为输入数据集中自变量的数目,m为训练集中样本数;
2)将影响因素矩阵X中的第i个自变量在其自身基础上增加δ,形成新的影响因素输入量
Figure BDA0003258486890000082
将影响因素矩阵X中的第i个自变量在其自身基础上减少δ,形成新的影响因素输入量
Figure BDA0003258486890000083
Figure BDA0003258486890000084
Figure BDA0003258486890000085
3)分别将影响因素
Figure BDA0003258486890000086
Figure BDA0003258486890000087
作为输入量,利用BP神经网络,分别得到输出量Yi +和Yi -
Figure BDA0003258486890000088
Figure BDA0003258486890000089
4)分别计算影响因素的MIV值,MIV的绝对值表示各组输入数据对流量的影响程度大小,根据MIV的绝对值进行由大到小排序;其中MIV值计算式为
Figure BDA00032584868900000810
式中,IMIV,i为第i个自变量的MIV值;
5)将MIV的绝对值由大到小排序,并剔除排序在后四分之一的数据
(5)将步骤(4)筛选后包含纹理特征和强度特征的输入数据与流量时间序列两类数据中前2/3作为LSTM神经网络的训练集,对LSTM神经网络进行训练;
LSTM为递归神经网络,包括存储长时间信息的记忆细胞,特定的控制门结构控制着信息流在LSTM内的传递;LSTM神经网络的记忆块(memory block)包括遗忘门(forgetgate)、输入门(input gate)、输出门(output gate)和记忆单元(cell);
遗忘门通过sigmoid函数决定上一时刻的输出数据通过或部分通过以过滤信息;
输入门通过sigmoid函数筛选输入数据以更新信息;
输出门通过sigmoid函数得到初始输出值,再根据初始输出值及当前单元状态,基于tanh函数计算最终输出结果;其中
i[t]=σ(Wix[t]+Uih[t-1]+bi) (10)
f[t]=σ(Wfx[t]+Ufh[t-1]+bf) (11)
g[t]=tanh(Wgx[t]+Ugh[t-1]+bg) (12)
o[t]=σ(Wox[t]+Uoh[t-1]+bo) (13)
Figure BDA0003258486890000091
Figure BDA0003258486890000092
式中:i[t]、f[t]、o[t]分别为输入门、遗忘门和输出门;g[t]为细胞输入;x[t]为时间序列中t时间的输入数据;h[t-1]为t上一时间记忆块的输出结果;W、U、b为每个门对应的学习参数;σ()为sigmoid函数;tanh()为tanh函数;
Figure BDA0003258486890000093
为元素乘法运算;c[t]为单元状态(cell state)的细胞记忆;
(6)基于筛选后的输入数据与流量时间序列两类数据中后1/3数据作为验证数据集,采用步骤(5)中训练后的LSTM神经网络进行径流模拟,并利用实测流量对模拟结果进行验证,其中验证方法为采用相关性系数和Nash-Sutcliffe效率系数对模拟结果进行评估,来验证模型模拟精度;
其中相关性系数计算公式为
Figure BDA0003258486890000094
Nash-Sutcliffe效率系数计算公式为
Figure BDA0003258486890000095
式中:Qobs,i为实测流量;
Figure BDA0003258486890000096
为实测流量的平均值;Qsim,i为模拟流量;
相关性系数和Nash-Sutcliffe效率系数越接近1表明模拟效果越好。
实施例2:本实施例以伊洛瓦底江流域进行径流模拟;
伊洛瓦底江流域概况:伊洛瓦底江流经中、印、缅三国,流域覆盖缅甸约60%的领土,居住有超过90%的缅甸人口,被誉为缅甸母亲河。伊洛瓦底江发源于中国西藏察隅县境内,主要支流包括大盈江、瑞丽江、钦敦江、穆河、尧河及蒙河等,自两江汇合口至入海口间的干流全长2714km,流域面积约43万km2
一种基于计算机视觉及LSTM神经网络的大流域径流模拟方法,具体步骤如下:
(1)搜集流域的气象水文数据集,根据伊洛瓦底江流域的数据可获取程度,搜集流域控制断面PYAY站1996年~2010年逐日的流量时间序列,以及1996年~2010年全流域的模型输入数据集,包括:降水、气温、叶面积指数(LAI)、土壤湿度;
(2)将步骤(1)气象水文数据集进行标准化和归一化处理至0~1得到模型输入数据集;其中数据标准化为统一数据分辨率,归一化处理为:将气象水文原始数据归一化至0~1区间;具体的,将降水、气温、叶面积指数(LAI)、土壤湿度数据空间分辨率统一为0.25度、时间上标准化为逐日数据,并将原始数据归一化到0~1区间;
(3)采用计算机视觉技术的局部二值模式算法(LBP)识别和提取步骤(2)降水、气温、叶面积指数(LAI)、土壤湿度数据的空间纹理特征;LBP算法为将图像栅格邻域作为处理单元,并以像素中心点的灰度值作为阈值,通过与邻域内的其他像素点进行数值比较,从而展现数据纹理特征;其中采用计算机视觉技术的局部二值模式LBP算法识别和提取步骤(2)数据的空间纹理特征的具体方法为
将图像栅格邻域作为处理单元,以像素中心点的灰度值作为阈值,若邻域像素点的灰度值大于或等于中心像素点的灰度值,则邻域像素值设置为1,若邻域像素点的灰度值小于中心像素点的灰度值,则邻域像素值设置为0,得到由0和1组成的二进制序列;将由0和1组成的二进制序列转换为十进制数得到中心像素点的LBP模式,LBP算法运算原理(见图1);LBP模式算子的公式为
Figure BDA0003258486890000101
Figure BDA0003258486890000102
式中,P为邻域像素点的个数,R为邻域的半径,gc为中心像素点的灰度值,gp为第p个像素点的灰度值;
再利用空间金字塔映射(SPM)对降水、气温、叶面积指数(LAI)、土壤湿度数据数据的空间纹理特征和强度特征进行表征,
SPM为基于近似全局几何对应来进行图像分类,通过将图像划分为不同层以及越来越精细的网格块,然后统计各个网格块的局部特征直方图,再组合形成图像的特征表示,基于SPM表征数据特征的流程如图2所示,具体的,SPM不同“层”网格划分示意图见图3;
SPM不同“层”网格数量定义如下:
“层级”为0时,不对图像进行划分,直接统计原始图像直方图;
当“层级”为1时将图像划分为均匀的4等分,并分别提取4张子图片的直方图;
当“层级”为2时将图像划分为均匀的16等分,并提取16张子图片的直方图;
图像进行L+1的层级“层级”划分,当图像划分到l层时,可以沿着图像的水平和垂直方向划分为2l×2l(l∈{0,1,…L})个网格;
SPM赋予不同的“层”下直方图的权重系数计算式为
Figure BDA0003258486890000111
式中,l为第l层,L为总层数,Wl为第l层的权重;
SPM每次提取直方图bin值的个数相同,将每个“层”下获得的直方图加权后连接起来,即可获得一个高维特征,可保存更丰富的图像信息;SPM进行特征的提取与表征后数据集由一组图像变成包含空间纹理信息和强度信息的特征向量;
考虑到伊洛瓦底江流域面积约43万km2,空间0.25分辨率的数据,均包含585个像元,SPM的总层数L设置过大会影响模拟效率,而设置过小则会影响数据空间表征,从而影响模拟精度;通过多次运行与调试,发现SPM“层级”L取值为2时既能满足模拟精度需求的,也不会导致运算时间过长;为了节省计算机计算资源,提高模型运算效率,本实施例优选L值为2;
部分降水计算机视觉提取结果见图4;
(4)采用MIV平均影响值计算步骤(3)中输入数据的强度特征对流量的平均影响值,进行输入数据的筛选;
MIV为输入神经元对输出神经元影响大小的指标,用于评价各个自变量对应变量产生影响的重要性,可用于输入变量的筛选;
输入数据的筛选方法
1)基于步骤(3)中强度信息特征向量构建影响因素矩阵X,利用流量时间序列构成矩阵Y,
Figure BDA0003258486890000121
Y=[y1 y2 … ym]T (4)
式中,n为输入数据集中自变量的数目,m为训练集中样本数;
本实施例采用降水、气温、LAI、土壤湿度四种数据,故输入数据集中自变量的数目n为4,数据时间范围是1996年1月1日~2010年12月31日,样本数为m为5479;
2)将影响因素矩阵X中的第i个自变量在其自身基础上增加δ(δ优选10%),形成新的影响因素输入量
Figure BDA0003258486890000122
将影响因素矩阵X中的第i个自变量在其自身基础上减少δ(δ优选10%),形成新的影响因素输入量
Figure BDA0003258486890000123
Figure BDA0003258486890000124
Figure BDA0003258486890000125
3)分别将影响因素
Figure BDA0003258486890000126
Figure BDA0003258486890000127
作为输入量,利用BP神经网络,分别得到输出量Yi +和Yi -
Figure BDA0003258486890000128
Figure BDA0003258486890000129
4)分别计算影响因素的MIV值,MIV的绝对值表示各组输入数据对流量的影响程度大小,根据MIV的绝对值进行由大到小排序;其中MIV值计算式为
Figure BDA00032584868900001210
式中,IMIV,i为第i个自变量的MIV值;
经过计算各类数据MIV的绝对值:降水MIV的绝对值为0.0467、气温MIV的绝对值为0.0456、叶面积指数(LAI)MIV的绝对值为0.0152,土壤湿度MIV的绝对值为0.0051,按照MIV的绝对值从大到小排序依次是:降水>气温>叶面积指数(LAI)>土壤湿度;
5)根据MIV的绝对值从大到小排序的结果,剔除排序在后四分之一的数据;本实施例中土壤湿度数据排序在后四分之一,故土壤湿度数据对流量影响小,剔除土壤湿度数据,保留流量影响大的输入数据即含有空间纹理信息和强度信息的降水、气温、叶面积指数(LAI)的数据集参与径流模拟;
(5)将步骤(4)筛选后包含纹理特征和强度特征的输入数据与流量时间序列两类数据中前2/3作为LSTM神经网络的训练集,对LSTM神经网络进行训练;
即:采用1996~2005年(共10年)的降雨、气温、叶面积指数(LAI)数据与流量时间序列两类数据对LSTM神经网络进行训练,得到训练期LSTM神经网络模拟结果(见图5);从图5可知,模拟与实测流量过程线的趋势一致,径流过程线拟合较好;
LSTM为递归神经网络,包括存储长时间信息的记忆细胞,特定的控制门结构控制着信息流在LSTM内的传递;LSTM神经网络的记忆块(memory block)包括遗忘门(forgetgate)、输入门(input gate)、输出门(output gate)和记忆单元(cell);
遗忘门通过sigmoid函数决定上一时刻的输出数据通过或部分通过以过滤信息;
输入门通过sigmoid函数筛选输入数据以更新信息;
输出门通过sigmoid函数得到初始输出值,再根据初始输出值及当前单元状态,基于tanh函数计算最终输出结果;其中
i[t]=σ(Wix[t]+Uih[t-1]+bi) (10)
f[t]=σ(Wfx[t]+Ufh[t-1]+bf) (11)
g[t]=tanh(Wgx[t]+Ugh[t-1]+bg) (12)
o[t]=σ(Wox[t]+Uoh[t-1]+bo) (13)
Figure BDA0003258486890000131
Figure BDA0003258486890000132
式中:i[t]、f[t]、o[t]分别为输入门、遗忘门和输出门;g[t]为细胞输入;x[t]为时间序列中t时间的输入数据;h[t-1]为t上一时间记忆块的输出结果;W、U、b为每个门对应的学习参数;σ()为sigmoid函数;tanh()为tanh函数;
Figure BDA0003258486890000133
为元素乘法运算;c[t]为单元状态(cell state)的细胞记忆;
(6)基于筛选后的输入数据与流量时间序列两类数据中后1/3数据作为验证数据集,采用步骤(5)中训练后的LSTM神经网络进行径流模拟,并利用实测流量对模拟结果进行验证,其中验证方法为采用相关性系数和Nash-Sutcliffe效率系数进行验证;
即:采用2006~2010年(共5年)的数据进行径流模拟及验证,得到LSTM神经网络模拟结果(见图6);从图6可知,模拟与实测流量过程线的趋势一致,径流过程线拟合较好;
采用实测流量即流量时间序列的数据(2006~2010年的数据)对模拟结果进行验证(见表1),其中验证方法为采用相关性系数和Nash-Sutcliffe效率系数对模拟结果进行评估,来验证模型模拟精度;
其中相关性系数计算公式为
Figure BDA0003258486890000141
Nash-Sutcliffe效率系数计算公式为
Figure BDA0003258486890000142
式中:Qobs,i为实测流量;
Figure BDA0003258486890000143
为实测流量的平均值;Qsim,i为模拟流量;
表1大型河流数据驱动水文模型径流模拟评价系数
Figure BDA0003258486890000144
从模拟与实测流量过程线的拟合程度看,两者趋势一致,丰水期和枯水期过程基本吻合;相关性系数与Nash-Sutcliffe效率系数,较为接近1,都达到了很好的水平,说明本方法能够较好模拟伊洛瓦底江流域径流过程。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (8)

1.一种基于计算机视觉及LSTM神经网络的大流域径流模拟方法,其特征在于,具体步骤如下:
(1)搜集流域的气象水文数据集,其中气象水文数据集包括目标断面的流量时间序列和全流域的降水数据;
(2)将步骤(1)气象水文数据集进行标准化和归一化处理得到模型的输入数据集;
(3)采用计算机视觉技术的局部二值模式LBP算法识别和提取步骤(2)中除流量时间序列以外的输入数据集的空间纹理特征;再利用空间金字塔映射SPM对输入数据集的空间纹理特征和强度特征进行表征;
(4)采用MIV平均影响值方法计算步骤(3)中输入数据的强度特征对流量的平均影响值,进行输入数据的筛选;
(5)将步骤(4)筛选后的数据与流量时间序列两类数据中前2/3的数据作为LSTM神经网络的训练集,对LSTM神经网络进行训练;
(6)基于筛选后的数据与流量时间序列两类数据中后1/3数据作为验证数据集,采用步骤(5)中训练后的LSTM神经网络进行径流模拟,并利用实测流量对模拟结果进行验证,其中验证方法为采用相关性系数和Nash-Sutcliffe效率系数对模拟结果进行评估,验证模型模拟精度。
2.根据权利要求1所述基于计算机视觉及LSTM神经网络的大流域径流模拟方法,其特征在于:步骤(1)气象水文数据集还包括全流域的气温、风速、湿度、太阳辐射、积雪覆盖、雪水当量、叶面积指数、归一化植被指数、土壤湿度、水储量中的一种或多种。
3.根据权利要求1所述基于计算机视觉及LSTM神经网络的大流域径流模拟方法,其特征在于:步骤(3)采用计算机视觉技术的局部二值模式LBP算法识别和提取步骤(2)除流量时间序列以外的模型输入数据集的空间纹理特征的具体方法为
将图像栅格邻域作为处理单元,以像素中心点的灰度值作为阈值,若邻域像素点的灰度值大于或等于中心像素点的灰度值,则邻域像素值设置为1,若邻域像素点的灰度值小于中心像素点的灰度值,则邻域像素值设置为0,得到由0和1组成的二进制序列;将由0和1组成的二进制序列转换为十进制数得到中心像素点的LBP模式。
4.根据权利要求3所述基于计算机视觉及LSTM神经网络的大流域径流模拟方法,其特征在于:LBP模式算子的公式为
Figure FDA0003258486880000021
Figure FDA0003258486880000022
式中,P为邻域像素点的个数,R为邻域的半径,gc为中心像素点的灰度值,gp为第p个像素点的灰度值。
5.根据权利要求3或4所述基于计算机视觉及LSTM神经网络的大流域径流模拟方法,其特征在于:利用空间金字塔映射SPM对输入数据的空间纹理特征和强度特征进行表征的方法为
SPM不同“层”网格数量:
“层级”为0时,不对图像进行划分,直接统计原始图像直方图;
当“层级”为1时将图像划分为均匀的4等分,并分别提取4张子图片的直方图;
当“层级”为2时将图像划分为均匀的16等分,并提取16张子图片的直方图;
图像进行L+1的“层级”划分,当图像划分到l层时,可以沿着图像的水平和垂直方向划分为2l×2l(l∈{0,1,…L})个网格;
SPM赋予不同的“层”下直方图的权重系数计算式为
Figure FDA0003258486880000023
式中,l为第l层,L为总层数,Wl为第l层的权重。
6.根据权利要求1所述基于计算机视觉及LSTM神经网络的大流域径流模拟方法,其特征在于:步骤(4)输入数据的筛选方法
1)基于步骤(3)的数据强度信息特征构建影响因素矩阵X,利用流量时间序列构成矩阵Y,
Figure FDA0003258486880000024
Y=[y1 y2…ym]T
式中,n为输入数据集中自变量的数目,m为训练集中样本数;
2)将影响因素矩阵X中的第i个自变量在其自身基础上增加δ,形成新的影响因素输入量
Figure FDA0003258486880000025
将影响因素矩阵X中的第i个自变量在其自身基础上减少δ,形成新的影响因素输入量
Figure FDA0003258486880000031
Figure FDA0003258486880000032
Figure FDA0003258486880000033
3)分别将影响因素
Figure FDA0003258486880000034
Figure FDA0003258486880000035
作为输入量,利用BP神经网络,分别得到输出量
Figure FDA0003258486880000036
Figure FDA0003258486880000037
Figure FDA0003258486880000038
Figure FDA0003258486880000039
4)分别计算影响因素的MIV值,根据MIV的绝对值进行由大到小排序;其中MIV值计算式为
Figure FDA00032584868800000310
式中,IMIV,i为第i个自变量的MIV值;
5)将MIV的绝对值由大到小排序,并剔除排序在后四分之一的数据。
7.根据权利要求1所述基于计算机视觉及LSTM神经网络的大流域径流模拟方法,其特征在于:步骤(5)LSTM神经网络包括遗忘门、输入门、输出门和记忆单元;
遗忘门通过sigmoid函数决定上一时刻的输出数据通过或部分通过以过滤信息;
输入门通过sigmoid函数筛选输入数据以更新信息;
输出门通过sigmoid函数得到初始输出值,再根据初始输出值及当前单元状态,基于tanh函数计算最终输出结果;其中
i[t]=σ(Wix[t]+Uih[t-1]+bi)
f[t]=σ(Wfx[t]+Ufh[t-1]+bf)
g[t]=tanh(Wgx[t]+Ugh[t-1]+bg)
o[t]=σ(Wox[t]+Uoh[t-1]+bo)
Figure FDA00032584868800000311
Figure FDA00032584868800000312
式中:i[t]、f[t]、o[t]分别为输入门、遗忘门和输出门;g[t]为细胞输入;x[t]为时间序列中t时间的输入数据;h[t-1]为t上一时间记忆块的输出结果;W、U、b为每个门对应的学习参数;σ()为sigmoid函数;tanh()为tanh函数;
Figure FDA0003258486880000041
为元素乘法运算;c[t]为单元状态(cell state)的细胞记忆。
8.根据权利要求1所述基于计算机视觉及LSTM神经网络的大流域径流模拟方法,其特征在于:步骤(6)相关性系数计算公式为
Figure FDA0003258486880000042
Nash-Sutcliffe效率系数计算公式为
Figure FDA0003258486880000043
式中:Qobs,i为实测流量;
Figure FDA0003258486880000044
为实测流量的平均值;Qsim,i为模拟流量。
CN202111066392.8A 2021-09-13 2021-09-13 一种基于计算机视觉及lstm神经网络的大流域径流模拟方法 Pending CN113743017A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111066392.8A CN113743017A (zh) 2021-09-13 2021-09-13 一种基于计算机视觉及lstm神经网络的大流域径流模拟方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111066392.8A CN113743017A (zh) 2021-09-13 2021-09-13 一种基于计算机视觉及lstm神经网络的大流域径流模拟方法

Publications (1)

Publication Number Publication Date
CN113743017A true CN113743017A (zh) 2021-12-03

Family

ID=78738235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111066392.8A Pending CN113743017A (zh) 2021-09-13 2021-09-13 一种基于计算机视觉及lstm神经网络的大流域径流模拟方法

Country Status (1)

Country Link
CN (1) CN113743017A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114241303A (zh) * 2021-12-06 2022-03-25 中国水利水电科学研究院 一种基于计算机视觉技术的流域下垫面特征提取方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423811A (zh) * 2017-07-04 2017-12-01 河海大学 基于bp人工神经网络和情景模拟组合的径流变化归因识别方法
CN111310968A (zh) * 2019-12-20 2020-06-19 西安电子科技大学 一种基于互信息的lstm神经网络循环水文预报方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423811A (zh) * 2017-07-04 2017-12-01 河海大学 基于bp人工神经网络和情景模拟组合的径流变化归因识别方法
CN111310968A (zh) * 2019-12-20 2020-06-19 西安电子科技大学 一种基于互信息的lstm神经网络循环水文预报方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SHIJIE JIANG 等: "A computer vision-based approach to fusing spatiotemporal data for hydrological modeling", 《JOURNAL OF HYDROLOGY》 *
ZHEN CUI 等: "A novel hybrid XAJ-LSTM model for multi-step-ahead flood forecasting", 《HYDROLOGY RESEARCH》 *
姜淞川等: "基于LSTM网络鄱阳湖抚河流域径流模拟研究", 《华中师范大学学报(自然科学版)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114241303A (zh) * 2021-12-06 2022-03-25 中国水利水电科学研究院 一种基于计算机视觉技术的流域下垫面特征提取方法

Similar Documents

Publication Publication Date Title
CN105243435B (zh) 一种基于深度学习元胞自动机模型的土壤含水量预测方法
CN106780089B (zh) 基于神经网络元胞自动机模型的永久性基本农田划定方法
CN110458048A (zh) 顾及城镇格局特征的人口分布时空演变与认知
CN111651885A (zh) 一种智慧型海绵城市洪涝预报方法
CN107703564A (zh) 一种降雨预测方法、系统及电子设备
CN109359166B (zh) 一种空间增长动态模拟与驱动力因子贡献度同步计算方法
Yang et al. Classifying floods by quantifying driver contributions in the Eastern Monsoon Region of China
CN105184423B (zh) 一种风电场集群风速预测方法
CN112287294B (zh) 一种基于深度学习的时空双向土壤含水量插值方法
CN113139329B (zh) 一种基于水文相似性和人工神经网络的新安江模型参数率定方法
CN114861277B (zh) 一种长时序国土空间功能与结构模拟方法
CN113902580B (zh) 一种基于随机森林模型的历史耕地分布重建方法
CN114529097B (zh) 多尺度农作物物候期遥感降维预测方法
Fang et al. Application of long short-term memory (LSTM) on the prediction of rainfall-runoff in karst area
Meydani et al. Daily reservoir inflow forecasting using weather forecast downscaling and rainfall-runoff modeling: Application to Urmia Lake basin, Iran
Gauch et al. Data-driven vs. physically-based streamflow prediction models
Li et al. A method of rainfall runoff forecasting based on deep convolution neural networks
CN111062128A (zh) 一种流域汇流模拟估测方法
CN116415730A (zh) 一种预测水位的融合自注意力机制时空深度学习模型
CN113743017A (zh) 一种基于计算机视觉及lstm神经网络的大流域径流模拟方法
CN116796799A (zh) 无水文资料地区中小流域洪水降雨量阈值模型创建方法
CN114372631A (zh) 一种基于小样本学习和lstm的缺资料地区径流预测方法
CN117494419A (zh) 一种多模型耦合的流域水土流失遥感监测方法
CN115392128B (zh) 一种利用时空卷积lstm网络模拟流域径流量的方法
CN115829163B (zh) 基于多模式集成的长江中下游流域径流预测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211203

RJ01 Rejection of invention patent application after publication