CN111915058B - 基于长短时记忆网络和迁移学习的洪水预测方法与装置 - Google Patents

基于长短时记忆网络和迁移学习的洪水预测方法与装置 Download PDF

Info

Publication number
CN111915058B
CN111915058B CN202010602424.0A CN202010602424A CN111915058B CN 111915058 B CN111915058 B CN 111915058B CN 202010602424 A CN202010602424 A CN 202010602424A CN 111915058 B CN111915058 B CN 111915058B
Authority
CN
China
Prior art keywords
flood
data
similarity
target
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010602424.0A
Other languages
English (en)
Other versions
CN111915058A (zh
Inventor
张鹏程
高志鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202010602424.0A priority Critical patent/CN111915058B/zh
Publication of CN111915058A publication Critical patent/CN111915058A/zh
Application granted granted Critical
Publication of CN111915058B publication Critical patent/CN111915058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Mathematical Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Alarm Systems (AREA)

Abstract

本发明提出了一种基于长短时记忆网络和迁移学习的洪水预测方法与装置,在收集到资源流域的洪水数据信息后,通过对流域自然环境的余弦相似度计算,筛选出相似度高的流域作为源流域进行数据迁移,再利用DTW算法计算源流域与目标流域的洪水相似性,将计算出的洪水相似度与水文数据组成输入矩阵,作为模型的输入,然后利用Attention机制计算出加权数据,以便模型更好的挖掘重要特征因子的信息,最后将加权数据矩阵输入LSTM网络中建立洪水预测模型,对目标流域未来的洪水流量进行预测。本发明方法一方面克服了针对特定流域洪水预测问题中数据匮乏的特点,另一方面充分利用了LSTM网络对处理时间序列问题的优越性能,洪水预测更加准确。

Description

基于长短时记忆网络和迁移学习的洪水预测方法与装置
技术领域
本发明涉及洪水预测领域,尤其是一种基于长短时记忆网络和迁移学习的洪水预测方法与装置。
背景技术
洪水灾害是一种常见的自然灾害,它是由于特大的地表径流河槽不能容纳,洼地积水不能及时排除,或海面突然上升海水侵陆而泛滥成灾。洪水灾害是世界上最严重的自然灾害之一,不仅发生的频率高、范围广,而且影响比较深远,中国幅员辽阔,地形复杂,季风气候显著,是世界上水灾频发且影响范围较广泛的国家之一。洪水作为一种最为普遍的自然灾害,具有破坏性,对社会构成巨大威胁。因此,实用有效的洪水预报方法,有利于防灾救灾快速反应,保护生命财产安全,维护社会稳定。
现有的洪水预测方法多种多样,大致可以分为洪水模型分为物理水文概念模型和数据驱动模型两种。水文概念模型描述了其组成部分的水文过程,如自然界的水循环过程。该模型通过模拟流域内水流及河流演变过程,模拟流域内的水流过程。早在20世纪60年代,水文学者就发现了流域的气候条件分布和空间变异不均,并研究了其对流域雨流量关系的影响。从20世纪70年代到80年代中期,美国斯坦福模型、萨克拉门托模型、日本水箱模型和中国新安江模型等几个著名的物理模型得到了发展。此外,欧洲SHE模型是1986年发展起来的第一个具有高度代表性的分布式水文模型。数据驱动的智能模型主要通过分析现有的观测数据,然后建立输入输出的映射关系,预测具体水文量。随着计算能力和算法的不断发展,数以百计的数据分析和挖掘技术飞速发展。这些技术不仅包括回归分析、EM算法、贝叶斯理论等经典的概率统计方法,还包括支持向量机等经典的机器学习方法。新的递归神经网络、卷积神经网络、图形卷积网络和其他人工智能方法也在迅速发展。在现有数据条件下,研究结果令人满意。随着技术的进一步发展,许多领域的研究成果对水文预报具有重要意义。
然而水文概念模型的结构是有限的,因为还不可能使用从考虑流域物理属性导出的数学方程严格描述这些子过程。此外,它们的优化方法决定了模型参数对实测降雨流量数据的依赖性,因而在实际应用中受到限制。传统的数据驱动模式不考虑降雨流型的物理过程,这导致人们试图利用所有可用的水文数据,这大大增加了特征尺寸,需要大量的训练数据。而且,在处理某一指定流域的洪水预测问题时,由于洪水的突发性,时效性以及短期性等特点,指定流域的水文数据往往非常匮乏,从而不能为模型提供足够所需的训练数据。
发明内容
发明目的:针对现有技术中存在的问题与不足,为了准确有效的预测某个流域的洪水流量,本发明提出了一种基于长短时记忆网络和迁移学习的洪水预测方法与装置,它一方面克服了针对特定流域洪水预测问题中数据匮乏的特点,另一方面充分利用了LSTM网络对处理时间序列问题的优越性能,洪水预测更加准确。
技术方案:为实现上述发明目的,本发明所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,包括如下步骤:
(1)收集流域相关的自然地理环境数据和水文观测站点的观测数据并对收集的数据进行预处理;
(2)根据流域的自然地理环境相似度筛选出与目标流域相似的洪水流域作为源流域进行数据迁移;
(3)利用DTW算法计算源流域与目标流域的洪水相似性,将洪水预测因子与洪水相似度结合成数据矩阵作为模型的输入;
(4)计算洪水预测因子的Attention得分;
(5)将洪水预测因子的Attention得分经过激活函数处理之后,作为权重对数据矩阵进行加权;
(6)将加权后的数据矩阵输入至长短时记忆网络LSTM中,利用LSTM网络预测目标流域的洪水流量,LSTM网络模型训练过程中对迁移过来的数据进行适应性处理,对相似度高的样本进行损失放大,相似度低的样本进行损失缩小,以提高迁移数据的域适应性。
所述步骤(1)是获取数据集和相应的标签信息,所述步骤(1)进一步为:
(11)从水文监测站和网络上获取洪水数据集和相应流域的自然地理环境数据,其中洪水数据包括降雨量、降雨面积、蒸发量、水位数据和洪水流量,流域的自然地理环境数据包括冻土深度、流域面积、植被覆盖率、土壤结构和气候特征;
(12)初步处理数据,将数据中存在缺失的,含有异常值的相关数据去除。
所述步骤(2)是筛选出适合迁移的源流域进行数据迁移,所述步骤(2)进一步为:
(21)流域的自然地理环境数据选取冻土深度、流域面积、植被覆盖率、土壤结构和气候特征作为计算流域相似度的特征因子;
(22)通过上述特征因子分别计算出各候选流域与目标流域自然地理环境之间的相似度,相似度的计算公式为
Figure BDA0002559449420000031
式中,
Figure BDA0002559449420000032
Figure BDA0002559449420000033
是两个不同流域X1和X2的相似度特征因子归一化后组成的张量;
(23)将流域相似度降序排列,选取若干与目标流域相似度较大的流域作为源流域,从而进行数据迁移;
(24)将源流域与目标流域的所有数据作为模型训练的数据集,并划分为训练集和测试集,其中从源流域迁移过来所有的洪水数据和一部分目标流域的洪水数据作为训练集,另一部分目标流域的洪水数据作为测试集。
相似流域中的洪水流量时间序列之间也存在一定的相似性,计算出该相似性后,在模型训练的过程中通过对损失函数的处理可以提高迁移数据的域适应性,所述步骤(3)进一步为:
(31)对目标流域的洪水数据进行趋势化分析,计算出目标流域洪水流量平均数值,以流域的洪水平均流量时间序列作为目标流域的代表型洪水模式;
(32)令源流域中的洪水流量时间序列为Sτ,目标流域的代表型洪水流量时间序列为T,计算其长度分别为|Sτ|和|T|,其中,τ为源流域中洪水的样本量;
(33)确定两个洪水流量时间序列的归整路径,归整路径的形式为W=w1,w2,…,wk,Max(|Sτ|,|T|)≤k≤|Sτ|+|T|,wk的形式为(i,j),其中i表示的是Sτ中的i坐标,j表示的是T中的j坐标;归整路径W从w1=(1,1)开始,到wk=(|Sτ|,|T|)结束,以保证Sτ和T中的每个坐标都在W中出现;W中(i,j)的i和j是单调增加的,以保证路径不会出现循环;
(34)根据归整路径计算两个洪水流量时间序列的归整距离,公式为
Figure BDA0002559449420000034
其中iε和jε分别表示ε时刻Sτ和T的洪水流量值;
(35)最后,计算DTW距离,即距离最短的归整路径,公式为D(i,j)=Dist(i,j)+min[D(i,j),D(i,j-1),D(i-1,j-1)],整个过程可以通过递归完成,DTW距离表示成两个时间序列的相似度;
(36)重复步骤(32)-(35)对源流域中每个样本计算出与目标流域代表样本的相似度后,将源流域中相似度高的样本标记为1,相似度低的样本标记为-1,再将目标流域中用于训练的数据样本标记为0;
(37)选择降雨量、降雨面积、蒸发量和水位数据作为洪水的预测因子,将上述步骤计算出的相似度列标记与归一化后的洪水预测因子数据组成模型的输入矩阵Dt×(σ+1),矩阵的行代表时间序列,前σ列代表洪水的预测因子,第σ+1列的第一行代表洪水相似度标记,其他行用0进行填充。
所述步骤(4)中计算洪水预测因子的Attention得分,具体计算公式为
Figure BDA0002559449420000041
i=1,2,…,σ,式中,
Figure BDA0002559449420000042
表示第i个洪水预测因子的时间序列,Lt=(l1,l2,…,lt)表示洪水流量的时间序列。
步骤(5)将Attention得分进过归一化处理后最为洪水预测因子的权重,对原数据进行加权处理,所述步骤(5)进一步为:
(51)根据洪水预测因子的Attention得分计算出预测因子的权值矩阵E=(e1,e2,…,eσ),计算公式为
Figure BDA0002559449420000043
其中,
Figure BDA0002559449420000044
和b为需要训练的参数,初始化分别为1和0;
(52)对权值矩阵进行归一化处理,根据公式
Figure BDA0002559449420000045
将权值矩阵E中的数据映射到(0,1)区间中,进而得到权值对角矩阵A=diag(a1,a2,…,aσ,1);
(53)计算出矩阵D进行Attention机制加权后的矩阵P=Dt×(σ+1)*A,该矩阵就是LSTM网络的输入矩阵。
将加权后的矩阵P输入到LSTM网络中预测目标流域洪水流量的结果,所述步骤(6)进一步为:
(61)确定LSTM神经网络的拓扑结构,LSTM网络结构设计包括输入门、遗忘门、记忆细胞和输出门;输入门输入进过加权处理后t-1时刻的洪水预测因子的数据,遗忘门和记忆细胞通过Sigmoid激活函数控制前t-1时刻需要被记忆和遗忘的数据信息;输出门输出t时刻目标流域的洪水预测流量;
(62)对LSTM网络进行参数的初始化,调节网络参数,设置初始学习率r0,学习率的衰减公式为r=0.95epoch_num·r0,其中,epoch_num是当前epoch的迭代轮数;
(63)对迁移样本进行域适应处理,在对网络进行训练时,使用随机梯度下降算法,当洪水相似度标记为1时,放大损失以便更好的纠正模型,当洪水相似度标记为-1时则缩小损失,以减少相似度的数据对预测模型的影响,最后再进行迭代训练,直到到达最大迭代次数或网络学习率收敛;
(64)LSTM模型在训练集上训练好后,将测试集的数据输入到模型中,输出预测的洪水流量。
基于相同的发明构思,本发明提供的一种基于长短时记忆网络和迁移学习的洪水预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的基于长短时记忆网络和迁移学习的洪水预测方法。
有益效果:本发明提供的一种基于长短时记忆网络和迁移学习的洪水预测方法,与现有技术相比,本发明的优点在于:考虑了相似流域之间的洪水模式也存在一定的相似性,通过对相似流域的洪水数据进行迁移,克服了预测某指定流域洪水数据匮乏的特点,结合Attention机制对更重要的预测因子赋予更大的权重,以提高预测模型数据挖掘的能力;通过LSTM网络进行训练和预测降雨,考虑了时间序列的因素,提高了模型的预测精度。
附图说明
图1为本发明实施例的整体步骤图;
图2为本发明具体示例的方法流程图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,本发明实施例公开的一种基于长短时记忆网络和迁移学习的洪水预测方法,主要包括6个步骤:
步骤1:收集流域相关的自然地理环境数据和水文观测站点的观测数据并对收集的数据进行预处理;
步骤2:根据流域的自然地理环境相似度筛选出与目标流域相似的洪水流域作为源流域进行数据迁移;
步骤3:利用DTW算法计算源流域与目标流域的洪水相似性,将洪水预测因子与洪水相似度结合成数据矩阵作为模型的输入;
步骤4:计算洪水预测因子的Attention得分;
步骤5:将洪水预测因子的Attention得分经过激活函数处理之后,作为权重对数据矩阵进行加权;
步骤6:将加权后的数据矩阵输入至长短时记忆网络LSTM中,利用LSTM网络预测目标流域的洪水流量。
如图2所示,本发明实施例公开的一种长短时记忆网络和迁移学习的洪水预测方法,具体步骤如下:
步骤1:获取数据集和相应的标签信息,并对数据进行预处理。数据预处理主要是为了筛选缺失以及有异常的数据,减少无关或错误的数据影响洪水预测的准确性,具体步骤如下:
步骤11:从水文监测站和网络上获取资源流域(源流域的候选流域)和目标流域的洪水数据集和相应流域的自然地理环境数据,其中洪水数据包括降雨量、降雨面积、蒸发量、水位数据和洪水流量,流域的自然地理环境数据包括冻土深度、流域面积、植被覆盖率、土壤结构和气候特征;
步骤12:初步处理数据,将数据中存在缺失的,含有异常值的相关数据去除。
步骤2:计算流域间的自然地理环境相似度,这一步主要是为了在筛选出适合迁移的源流域进行数据迁移。具体步骤如下:
步骤21:流域的自然地理环境数据选取冻土深度、流域面积、植被覆盖率、土壤结构和气候特征作为计算流域相似度的特征因子;
步骤22:通过上述特征因子分别计算出各候选流域与目标流域自然地理环境之间的相似度,相似度的计算公式为
Figure BDA0002559449420000061
式中
Figure BDA0002559449420000062
Figure BDA0002559449420000063
是两个不同流域X1和X2的相似度特征因子归一化后组成的张量,其中土壤结构和气候特征是非数值类型数据,可以将砂质土、黏质土、壤土三种土壤结构分别定义为数值1~3,将气候特征,比如热带季风气候、亚热带季风气候、温带季风气候、温带大陆性气候和高山高原气候分别定义为数值1~5;
步骤23:将流域相似度降序排列,选取若干与目标流域相似度较大的流域作为源流域,从而进行数据迁移;
步骤24:将源流域与目标流域的所有数据作为模型训练的数据集,并划分为训练集和测试集,其中从源流域迁移过来所有的洪水数据和一部分目标流域的洪水数据作为训练集,另一部分目标流域的洪水数据作为测试集,目标流域洪水数据训练集与测试集的划分比例为7:3;
步骤3:相似流域中的洪水流量时间序列之间有一定的相似性,计算出该相似性后,在模型训练的过程中通过对损失函数的处理可以提高迁移数据的域适应性。具体步骤如下:
步骤31:对目标流域的洪水数据进行趋势化分析,计算出目标流域洪水流量平均数值,以流域的洪水平均流量时间序列作为目标流域的代表型洪水模式;
步骤32:令源流域中的洪水流量时间序列为Sτ,目标流域的代表型洪水流量时间序列为T,计算其长度分别为|Sτ|和|T|,其中τ为源流域中洪水的样本量;
步骤33:确定两个洪水流量时间序列的归整路径,归整路径的形式为W=w1,w2,…,wk,Max(|Sτ|,|T|)≤k≤|Sτ|+|T|,wk的形式为(i,j),其中i表示的是Sτ中的i坐标,j表示的是T中的j坐标。归整路径W从w1=(1,1)开始,到wk=(|Sτ|,|T|)结束,以保证Sτ和T中的每个坐标都在W中出现;W中(i,j)的i和j是单调增加的,以保证路径不会出现循环;
步骤34:根据归整路径计算两个洪水流量时间序列的归整距离,公式为
Figure BDA0002559449420000071
其中iε和jε分别表示ε时刻Sτ和T的洪水流量值;
步骤35:最后,计算DTW距离,即距离最短的归整路径,公式为D(i,j)=Dist(i,j)+min[D(i,j),D(i,j-1),D(i-1,j-1)],整个过程可以通过递归完成,DTW距离表示成两个时间序列的相似度;
步骤36:重复步骤(32)-(35)对源流域中每个样本计算出与目标流域代表样本的相似度后,将源流域中相似度高的样本标记为1,相似度低的样本标记为-1,再将目标流域中用于训练的数据样本标记为0;其中相似度高低可根据设定的阈值或比例判断,阈值和比例也可根据算法效果进行调整。
步骤37:选择降雨量、降雨面积、蒸发量和水位数据作为洪水的预测因子,将上述步骤计算出的相似度列标记与归一化后的洪水预测因子数据组成模型的输入矩阵Dt×(σ+1),矩阵的行代表时间序列,前σ列代表洪水的预测因子,第σ+1列的第一行代表洪水相似度标记,其他行用0进行填充。
步骤4:计算洪水预测因子的Attention得分,具体计算公式为
Figure BDA0002559449420000081
Figure BDA0002559449420000082
i=1,2,…,σ,式中,
Figure BDA0002559449420000083
表示第i个洪水预测因子的时间序列,Lt=(l1,l2,…,lt)表示洪水流量的时间序列。
步骤5:将Attention得分进过归一化处理后最为洪水预测因子的权重,对原数据进行加权处理,以提高模型对重要预测因子的关注程度,具体步骤如下:
步骤51:根据洪水预测因子的Attention得分计算出预测因子的权值矩阵E=(e1,e2,…,eσ),计算公式为
Figure BDA0002559449420000084
其中,
Figure BDA0002559449420000085
和b为需要训练的参数,初始化分别为1和0;
步骤52:对权值矩阵进行归一化处理,根据公式
Figure BDA0002559449420000086
将权值矩阵E中的数据映射到(0,1)区间中,进而得到权值对角矩阵A=diag(a1,a2,…,aσ,1);
步骤53:计算出矩阵D进行Attention机制加权后的矩阵P=Dt×(σ+1)*A,该矩阵就是LSTM网络的输入矩阵。
步骤6:将步骤5中加权后的矩阵输入LSTM网络中进行训练,模型稳定后在测试集上进行洪水预测,具体步骤如下:
步骤61:确定LSTM神经网络的拓扑结构,LSTM网络结构设计包括输入门、遗忘门、记忆细胞和输出门;输入门输入进过加权处理后t-1时刻的洪水预测因子的数据,遗忘门和记忆细胞通过Sigmoid激活函数控制前t-1时刻需要被记忆和遗忘的数据信息;输出门输出t时刻目标流域的洪水预测流量;
步骤62:对LSTM网络进行参数的初始化,调节网络参数,设置初始学习率r0为0.25,学习率的衰减公式为r=0.95epoch_num·r0,其中,epoch_num是当前epoch的迭代轮数;
步骤63:对迁移样本进行域适应处理,在对网络进行训练时,使用随机梯度下降算法,损失函数的公式为
Figure BDA0002559449420000087
其中μ为惩罚因子,reali洪水流量的真实值,outi为模型的预测值;当洪水相似度标记为1时,μ>1从而放大损失以便更好的纠正模型,当洪水相似度标记为-1时μ<1从而缩小损失以减少相似度低的数据对预测模型的影响,这两种情况下μ通过多次实验进行超参数的调优从而获得合适的惩罚因子值;当洪水相似度标记为0时,μ的值为1。最后再进行迭代训练,直到到达最大迭代次数或网络学习率收敛;
步骤64:LSTM模型在训练集上训练好后,将测试集的数据输入到模型中,输出预测的洪水流量。
基于相同的发明构思,本发明实施例提供的一种基于长短时记忆网络和迁移学习的洪水预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被加载至处理器时实现上述的基于长短时记忆网络和迁移学习的洪水预测方法。

Claims (8)

1.一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,包括如下步骤:
(1)收集流域相关的自然地理环境数据和水文观测站点的观测数据并对收集的数据进行预处理;
(2)根据流域的自然地理环境相似度筛选出与目标流域相似的洪水流域作为源流域进行数据迁移;
(3)利用DTW算法计算源流域与目标流域的洪水相似性,将洪水预测因子与洪水相似度结合成数据矩阵作为模型的输入;
(4)计算洪水预测因子的Attention得分;
(5)将洪水预测因子的Attention得分经过激活函数处理之后,作为权重对数据矩阵进行加权;
(6)将加权后的数据矩阵输入至长短时记忆网络LSTM中,利用LSTM网络预测目标流域的洪水流量,LSTM网络模型训练过程中对迁移过来的数据进行适应性处理,对相似度高的样本进行损失放大,相似度低的样本进行损失缩小,以提高迁移数据的域适应性。
2.根据权利要求1所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,所述步骤(1)包括:
(11)从水文监测站和网络上获取资源流域和目标流域的洪水数据集和相应流域的自然地理环境数据,其中洪水数据包括降雨量、降雨面积、蒸发量、水位数据和洪水流量,流域的自然地理环境数据包括冻土深度、流域面积、植被覆盖率、土壤结构和气候特征;
(12)初步处理数据,将数据中存在缺失的,含有异常值的相关数据去除。
3.根据权利要求1所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,所述步骤(2)包括:
(21)流域的自然地理环境数据选取冻土深度、流域面积、植被覆盖率、土壤结构和气候特征作为计算流域相似度的特征因子;
(22)通过上述特征因子分别计算出各候选流域与目标流域自然地理环境之间的相似度,相似度的计算公式为
Figure FDA0002559449410000011
式中,
Figure FDA0002559449410000012
Figure FDA0002559449410000013
是两个不同流域X1和X2的相似度特征因子归一化后组成的张量;
(23)将流域相似度降序排列,选取若干与目标流域相似度较大的流域作为源流域,从而进行数据迁移;
(24)将源流域与目标流域的所有数据作为模型训练的数据集,并划分为训练集和测试集,其中从源流域迁移过来所有的洪水数据和一部分目标流域的洪水数据作为训练集,另一部分目标流域的洪水数据作为测试集。
4.根据权利要求1所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,所述步骤(3)包括:
(31)对目标流域的洪水数据进行趋势化分析,计算出目标流域洪水流量平均数值,以流域的洪水平均流量时间序列作为目标流域的代表型洪水模式;
(32)令源流域中的洪水流量时间序列为Sτ,目标流域的代表型洪水流量时间序列为T,计算其长度分别为|Sτ|和|T|,其中τ为源流域中洪水的样本量;
(33)确定两个洪水流量时间序列的归整路径,归整路径的形式为W=w1,w2,…,wk,Max(|Sτ|,|T|)≤k≤|Sτ|+|T|,wk的形式为(i,j),其中i表示的是Sτ中的i坐标,j表示的是T中的j坐标;归整路径W从w1=(1,1)开始,到wk=(|Sτ|,|T|)结束,以保证Sτ和T中的每个坐标都在W中出现;W中(i,j)的i和j是单调增加的,以保证路径不会出现循环;
(34)根据归整路径计算两个洪水流量时间序列的归整距离,公式为
Figure FDA0002559449410000021
其中iε和jε分别表示ε时刻Sτ和T的洪水流量值;
(35)最后,计算DTW距离,即距离最短的归整路径,公式为D(i,j)=Dist(i,j)+min[D(i,j),D(i,j-1),D(i-1,j-1)],整个过程通过递归完成,DTW距离表示成两个时间序列的相似度;
(36)重复步骤(32)-(35)对源流域中每个样本计算出与目标流域代表样本的相似度后,将源流域中相似度高的样本标记为1,相似度低的样本标记为-1,再将目标流域中用于训练的数据样本标记为0;
(37)选择降雨量、降雨面积、蒸发量和水位数据作为洪水的预测因子,将上述步骤计算出的相似度列标记与归一化后的洪水预测因子数据组成模型的输入矩阵Dt×(σ+1),矩阵的行代表时间序列,前σ列代表洪水的预测因子,第σ+1列的第一行代表洪水相似度标记,其他行用0进行填充。
5.根据权利要求1所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,所述步骤(4)中Attention得分的计算公式为
Figure FDA0002559449410000031
Figure FDA0002559449410000032
式中,
Figure FDA0002559449410000033
表示第i个洪水预测因子的时间序列,Lt=(l1,l2,…,lt)表示洪水流量的时间序列,σ为预测因子数量。
6.根据权利要求4所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,所述步骤(5)包括:
(51)根据洪水预测因子的Attention得分计算出预测因子的权值矩阵E=(e1,e2,…,eσ),计算公式为
Figure FDA0002559449410000034
其中,
Figure FDA0002559449410000035
和b为需要训练的参数,初始化分别为1和0;
(52)对权值矩阵进行归一化处理,根据公式
Figure FDA0002559449410000036
将权值矩阵E中的数据映射到(0,1)区间中,进而得到权值对角矩阵A=diag(a1,a2,…,aσ,1);
(53)计算出矩阵D进行Attention机制加权后的矩阵P=Dt×(σ+1)*A,该矩阵就是LSTM网络的输入矩阵。
7.根据权利要求1所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,所述步骤(6)包括:
(61)确定LSTM神经网络的拓扑结构,LSTM网络结构设计包括输入门、遗忘门、记忆细胞和输出门;输入门输入进过加权处理后t-1时刻的洪水预测因子的数据,遗忘门和记忆细胞通过Sigmoid激活函数控制前t-1时刻需要被记忆和遗忘的数据信息;输出门输出t时刻目标流域的洪水预测流量;
(62)对LSTM网络进行参数的初始化,调节网络参数,设置初始学习率r0,学习率的衰减公式为r=0.95epoch_num·r0,其中,epoch_num是当前epoch的迭代轮数;
(63)对迁移样本进行域适应处理,在对网络进行训练时,使用随机梯度下降算法,当洪水相似度标记为1时,放大损失以便更好的纠正模型,当洪水相似度标记为-1时则缩小损失,以减少相似度的数据对预测模型的影响,最后再进行迭代训练,直到到达最大迭代次数或网络学习率收敛;
(64)LSTM模型在训练集上训练好后,将测试集的数据输入到模型中,输出预测的洪水流量。
8.一种基于长短时记忆网络和迁移学习的洪水预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被加载至处理器时实现根据权利要求1-7任一项所述的基于长短时记忆网络和迁移学习的洪水预测方法。
CN202010602424.0A 2020-06-29 2020-06-29 基于长短时记忆网络和迁移学习的洪水预测方法与装置 Active CN111915058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010602424.0A CN111915058B (zh) 2020-06-29 2020-06-29 基于长短时记忆网络和迁移学习的洪水预测方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010602424.0A CN111915058B (zh) 2020-06-29 2020-06-29 基于长短时记忆网络和迁移学习的洪水预测方法与装置

Publications (2)

Publication Number Publication Date
CN111915058A CN111915058A (zh) 2020-11-10
CN111915058B true CN111915058B (zh) 2022-08-26

Family

ID=73226678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010602424.0A Active CN111915058B (zh) 2020-06-29 2020-06-29 基于长短时记忆网络和迁移学习的洪水预测方法与装置

Country Status (1)

Country Link
CN (1) CN111915058B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906768A (zh) * 2021-02-04 2021-06-04 南京邮电大学 一种无线行为感知模型跨场景预选择方法
CN113139329B (zh) * 2021-03-04 2022-10-18 河海大学 一种基于水文相似性和人工神经网络的新安江模型参数率定方法
CN113125037B (zh) * 2021-04-06 2024-06-07 红塔烟草(集团)有限责任公司 一种基于分布式光纤在线测温系统的电缆导体温度估算方法
CN113987971B (zh) * 2021-10-27 2023-05-05 北京中地华安科技股份有限公司 洪水危险性的预警方法、装置、电子设备和介质
CN114462322B (zh) * 2022-04-12 2022-07-05 长江勘测规划设计研究有限责任公司 基于迁移学习机制的流域超标准洪水模拟发生器构建方法
CN114742419A (zh) * 2022-04-15 2022-07-12 南京信息工程大学 一种数据迁移改进数据有限区域滑坡危险性评估的方法
CN117787437A (zh) * 2023-12-19 2024-03-29 中国科学院西北生态环境资源研究院 一种多年冻土区一氧化二氮通量估算方法
CN118036481B (zh) * 2024-04-15 2024-06-18 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) 一种预测河道洪水流量的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108681585A (zh) * 2018-05-14 2018-10-19 浙江工业大学 一种基于NetSim-TL的多源迁移学习标签流行性预测模型的构建方法
CN108846444A (zh) * 2018-06-23 2018-11-20 重庆大学 面向多源数据挖掘的多阶段深度迁移学习方法
CN110580496A (zh) * 2019-07-11 2019-12-17 南京邮电大学 一种基于熵最小化的深度迁移学习系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108681585A (zh) * 2018-05-14 2018-10-19 浙江工业大学 一种基于NetSim-TL的多源迁移学习标签流行性预测模型的构建方法
CN108846444A (zh) * 2018-06-23 2018-11-20 重庆大学 面向多源数据挖掘的多阶段深度迁移学习方法
CN110580496A (zh) * 2019-07-11 2019-12-17 南京邮电大学 一种基于熵最小化的深度迁移学习系统及方法

Also Published As

Publication number Publication date
CN111915058A (zh) 2020-11-10

Similar Documents

Publication Publication Date Title
CN111915058B (zh) 基于长短时记忆网络和迁移学习的洪水预测方法与装置
Choubin et al. Precipitation forecasting using classification and regression trees (CART) model: a comparative study of different approaches
Wagena et al. Comparison of short-term streamflow forecasting using stochastic time series, neural networks, process-based, and Bayesian models
Mas et al. Modelling deforestation using GIS and artificial neural networks
Marofi et al. Predicting spatial distribution of snow water equivalent using multivariate non-linear regression and computational intelligence methods
Kalayathankal et al. A fuzzy soft flood alarm model
CN111767517B (zh) 一种应用于洪水预测的BiGRU多步预测方法、系统及存储介质
Xu et al. Deep transfer learning based on transformer for flood forecasting in data-sparse basins
Zia et al. Predicting discharge using a low complexity machine learning model
Abd-Elmaboud et al. Estimation of groundwater recharge using simulation-optimization model and cascade forward ANN at East Nile Delta aquifer, Egypt
Liu et al. Comparing machine-learning models for drought forecasting in vietnam’s cai river basin
Liu et al. Gully erosion susceptibility assessment based on machine learning-A case study of watersheds in Tuquan County in the black soil region of Northeast China
CN114372631A (zh) 一种基于小样本学习和lstm的缺资料地区径流预测方法
CN111914487A (zh) 一种基于对抗神经网络的无资料地区水文参数率定方法
Li et al. A stepwise clustered hydrological model for addressing the temporal autocorrelation of daily streamflows in irrigated watersheds
Yadav et al. Application of Artificial Neural Network and Genetic Algorithm Based Artificial Neural Network Models for River Flow Prediction.
Badyalina et al. Streamflow estimation at ungauged basin using modified group method of data handling
CN118245930A (zh) 水文事件液面预测方法、装置、存储介质及计算机设备
Nivesh et al. Prediction of river discharge of Kesinga sub-catchment of Mahanadi basin using machine learning approaches
Gholami et al. Evaluating the effects of vegetation and land management on runoff control using field plots and machine learning models
Aoulmi et al. Runoff predictions in a semiarid watershed by convolutional neural networks improved with metaheuristic algorithms and forced with reanalysis and climate data
Fan et al. Explainable machine learning model for multi-step forecasting of reservoir inflow with uncertainty quantification
CN113591608A (zh) 一种基于深度学习的高分辨率遥感影像不透水面提取方法
Mirzania et al. Enhancement groundwater level prediction using hybrid ANN-HHO model: case study (Shabestar Plain in Iran)
Jayaminda et al. Rating Performances of Global Climate Models in Capturing Monsoon Rainfall Patterns in Sri Lanka

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant