CN111915058B - 基于长短时记忆网络和迁移学习的洪水预测方法与装置 - Google Patents
基于长短时记忆网络和迁移学习的洪水预测方法与装置 Download PDFInfo
- Publication number
- CN111915058B CN111915058B CN202010602424.0A CN202010602424A CN111915058B CN 111915058 B CN111915058 B CN 111915058B CN 202010602424 A CN202010602424 A CN 202010602424A CN 111915058 B CN111915058 B CN 111915058B
- Authority
- CN
- China
- Prior art keywords
- flood
- data
- similarity
- target
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000015654 memory Effects 0.000 title claims abstract description 27
- 238000013526 transfer learning Methods 0.000 title claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 41
- 238000012549 training Methods 0.000 claims description 33
- 238000013508 migration Methods 0.000 claims description 19
- 230000005012 migration Effects 0.000 claims description 19
- 239000002689 soil Substances 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 11
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 11
- 230000007787 long-term memory Effects 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 230000008020 evaporation Effects 0.000 claims description 6
- 238000001704 evaporation Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 230000006978 adaptation Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000013461 design Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 claims description 2
- 230000003321 amplification Effects 0.000 claims description 2
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 2
- 230000001617 migratory effect Effects 0.000 claims 1
- 230000006403 short-term memory Effects 0.000 description 5
- 238000007418 data mining Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Mathematical Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Pure & Applied Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Optimization (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Alarm Systems (AREA)
Abstract
本发明提出了一种基于长短时记忆网络和迁移学习的洪水预测方法与装置,在收集到资源流域的洪水数据信息后,通过对流域自然环境的余弦相似度计算,筛选出相似度高的流域作为源流域进行数据迁移,再利用DTW算法计算源流域与目标流域的洪水相似性,将计算出的洪水相似度与水文数据组成输入矩阵,作为模型的输入,然后利用Attention机制计算出加权数据,以便模型更好的挖掘重要特征因子的信息,最后将加权数据矩阵输入LSTM网络中建立洪水预测模型,对目标流域未来的洪水流量进行预测。本发明方法一方面克服了针对特定流域洪水预测问题中数据匮乏的特点,另一方面充分利用了LSTM网络对处理时间序列问题的优越性能,洪水预测更加准确。
Description
技术领域
本发明涉及洪水预测领域,尤其是一种基于长短时记忆网络和迁移学习的洪水预测方法与装置。
背景技术
洪水灾害是一种常见的自然灾害,它是由于特大的地表径流河槽不能容纳,洼地积水不能及时排除,或海面突然上升海水侵陆而泛滥成灾。洪水灾害是世界上最严重的自然灾害之一,不仅发生的频率高、范围广,而且影响比较深远,中国幅员辽阔,地形复杂,季风气候显著,是世界上水灾频发且影响范围较广泛的国家之一。洪水作为一种最为普遍的自然灾害,具有破坏性,对社会构成巨大威胁。因此,实用有效的洪水预报方法,有利于防灾救灾快速反应,保护生命财产安全,维护社会稳定。
现有的洪水预测方法多种多样,大致可以分为洪水模型分为物理水文概念模型和数据驱动模型两种。水文概念模型描述了其组成部分的水文过程,如自然界的水循环过程。该模型通过模拟流域内水流及河流演变过程,模拟流域内的水流过程。早在20世纪60年代,水文学者就发现了流域的气候条件分布和空间变异不均,并研究了其对流域雨流量关系的影响。从20世纪70年代到80年代中期,美国斯坦福模型、萨克拉门托模型、日本水箱模型和中国新安江模型等几个著名的物理模型得到了发展。此外,欧洲SHE模型是1986年发展起来的第一个具有高度代表性的分布式水文模型。数据驱动的智能模型主要通过分析现有的观测数据,然后建立输入输出的映射关系,预测具体水文量。随着计算能力和算法的不断发展,数以百计的数据分析和挖掘技术飞速发展。这些技术不仅包括回归分析、EM算法、贝叶斯理论等经典的概率统计方法,还包括支持向量机等经典的机器学习方法。新的递归神经网络、卷积神经网络、图形卷积网络和其他人工智能方法也在迅速发展。在现有数据条件下,研究结果令人满意。随着技术的进一步发展,许多领域的研究成果对水文预报具有重要意义。
然而水文概念模型的结构是有限的,因为还不可能使用从考虑流域物理属性导出的数学方程严格描述这些子过程。此外,它们的优化方法决定了模型参数对实测降雨流量数据的依赖性,因而在实际应用中受到限制。传统的数据驱动模式不考虑降雨流型的物理过程,这导致人们试图利用所有可用的水文数据,这大大增加了特征尺寸,需要大量的训练数据。而且,在处理某一指定流域的洪水预测问题时,由于洪水的突发性,时效性以及短期性等特点,指定流域的水文数据往往非常匮乏,从而不能为模型提供足够所需的训练数据。
发明内容
发明目的:针对现有技术中存在的问题与不足,为了准确有效的预测某个流域的洪水流量,本发明提出了一种基于长短时记忆网络和迁移学习的洪水预测方法与装置,它一方面克服了针对特定流域洪水预测问题中数据匮乏的特点,另一方面充分利用了LSTM网络对处理时间序列问题的优越性能,洪水预测更加准确。
技术方案:为实现上述发明目的,本发明所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,包括如下步骤:
(1)收集流域相关的自然地理环境数据和水文观测站点的观测数据并对收集的数据进行预处理;
(2)根据流域的自然地理环境相似度筛选出与目标流域相似的洪水流域作为源流域进行数据迁移;
(3)利用DTW算法计算源流域与目标流域的洪水相似性,将洪水预测因子与洪水相似度结合成数据矩阵作为模型的输入;
(4)计算洪水预测因子的Attention得分;
(5)将洪水预测因子的Attention得分经过激活函数处理之后,作为权重对数据矩阵进行加权;
(6)将加权后的数据矩阵输入至长短时记忆网络LSTM中,利用LSTM网络预测目标流域的洪水流量,LSTM网络模型训练过程中对迁移过来的数据进行适应性处理,对相似度高的样本进行损失放大,相似度低的样本进行损失缩小,以提高迁移数据的域适应性。
所述步骤(1)是获取数据集和相应的标签信息,所述步骤(1)进一步为:
(11)从水文监测站和网络上获取洪水数据集和相应流域的自然地理环境数据,其中洪水数据包括降雨量、降雨面积、蒸发量、水位数据和洪水流量,流域的自然地理环境数据包括冻土深度、流域面积、植被覆盖率、土壤结构和气候特征;
(12)初步处理数据,将数据中存在缺失的,含有异常值的相关数据去除。
所述步骤(2)是筛选出适合迁移的源流域进行数据迁移,所述步骤(2)进一步为:
(21)流域的自然地理环境数据选取冻土深度、流域面积、植被覆盖率、土壤结构和气候特征作为计算流域相似度的特征因子;
(23)将流域相似度降序排列,选取若干与目标流域相似度较大的流域作为源流域,从而进行数据迁移;
(24)将源流域与目标流域的所有数据作为模型训练的数据集,并划分为训练集和测试集,其中从源流域迁移过来所有的洪水数据和一部分目标流域的洪水数据作为训练集,另一部分目标流域的洪水数据作为测试集。
相似流域中的洪水流量时间序列之间也存在一定的相似性,计算出该相似性后,在模型训练的过程中通过对损失函数的处理可以提高迁移数据的域适应性,所述步骤(3)进一步为:
(31)对目标流域的洪水数据进行趋势化分析,计算出目标流域洪水流量平均数值,以流域的洪水平均流量时间序列作为目标流域的代表型洪水模式;
(32)令源流域中的洪水流量时间序列为Sτ,目标流域的代表型洪水流量时间序列为T,计算其长度分别为|Sτ|和|T|,其中,τ为源流域中洪水的样本量;
(33)确定两个洪水流量时间序列的归整路径,归整路径的形式为W=w1,w2,…,wk,Max(|Sτ|,|T|)≤k≤|Sτ|+|T|,wk的形式为(i,j),其中i表示的是Sτ中的i坐标,j表示的是T中的j坐标;归整路径W从w1=(1,1)开始,到wk=(|Sτ|,|T|)结束,以保证Sτ和T中的每个坐标都在W中出现;W中(i,j)的i和j是单调增加的,以保证路径不会出现循环;
(35)最后,计算DTW距离,即距离最短的归整路径,公式为D(i,j)=Dist(i,j)+min[D(i,j),D(i,j-1),D(i-1,j-1)],整个过程可以通过递归完成,DTW距离表示成两个时间序列的相似度;
(36)重复步骤(32)-(35)对源流域中每个样本计算出与目标流域代表样本的相似度后,将源流域中相似度高的样本标记为1,相似度低的样本标记为-1,再将目标流域中用于训练的数据样本标记为0;
(37)选择降雨量、降雨面积、蒸发量和水位数据作为洪水的预测因子,将上述步骤计算出的相似度列标记与归一化后的洪水预测因子数据组成模型的输入矩阵Dt×(σ+1),矩阵的行代表时间序列,前σ列代表洪水的预测因子,第σ+1列的第一行代表洪水相似度标记,其他行用0进行填充。
步骤(5)将Attention得分进过归一化处理后最为洪水预测因子的权重,对原数据进行加权处理,所述步骤(5)进一步为:
(53)计算出矩阵D进行Attention机制加权后的矩阵P=Dt×(σ+1)*A,该矩阵就是LSTM网络的输入矩阵。
将加权后的矩阵P输入到LSTM网络中预测目标流域洪水流量的结果,所述步骤(6)进一步为:
(61)确定LSTM神经网络的拓扑结构,LSTM网络结构设计包括输入门、遗忘门、记忆细胞和输出门;输入门输入进过加权处理后t-1时刻的洪水预测因子的数据,遗忘门和记忆细胞通过Sigmoid激活函数控制前t-1时刻需要被记忆和遗忘的数据信息;输出门输出t时刻目标流域的洪水预测流量;
(62)对LSTM网络进行参数的初始化,调节网络参数,设置初始学习率r0,学习率的衰减公式为r=0.95epoch_num·r0,其中,epoch_num是当前epoch的迭代轮数;
(63)对迁移样本进行域适应处理,在对网络进行训练时,使用随机梯度下降算法,当洪水相似度标记为1时,放大损失以便更好的纠正模型,当洪水相似度标记为-1时则缩小损失,以减少相似度的数据对预测模型的影响,最后再进行迭代训练,直到到达最大迭代次数或网络学习率收敛;
(64)LSTM模型在训练集上训练好后,将测试集的数据输入到模型中,输出预测的洪水流量。
基于相同的发明构思,本发明提供的一种基于长短时记忆网络和迁移学习的洪水预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的基于长短时记忆网络和迁移学习的洪水预测方法。
有益效果:本发明提供的一种基于长短时记忆网络和迁移学习的洪水预测方法,与现有技术相比,本发明的优点在于:考虑了相似流域之间的洪水模式也存在一定的相似性,通过对相似流域的洪水数据进行迁移,克服了预测某指定流域洪水数据匮乏的特点,结合Attention机制对更重要的预测因子赋予更大的权重,以提高预测模型数据挖掘的能力;通过LSTM网络进行训练和预测降雨,考虑了时间序列的因素,提高了模型的预测精度。
附图说明
图1为本发明实施例的整体步骤图;
图2为本发明具体示例的方法流程图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,本发明实施例公开的一种基于长短时记忆网络和迁移学习的洪水预测方法,主要包括6个步骤:
步骤1:收集流域相关的自然地理环境数据和水文观测站点的观测数据并对收集的数据进行预处理;
步骤2:根据流域的自然地理环境相似度筛选出与目标流域相似的洪水流域作为源流域进行数据迁移;
步骤3:利用DTW算法计算源流域与目标流域的洪水相似性,将洪水预测因子与洪水相似度结合成数据矩阵作为模型的输入;
步骤4:计算洪水预测因子的Attention得分;
步骤5:将洪水预测因子的Attention得分经过激活函数处理之后,作为权重对数据矩阵进行加权;
步骤6:将加权后的数据矩阵输入至长短时记忆网络LSTM中,利用LSTM网络预测目标流域的洪水流量。
如图2所示,本发明实施例公开的一种长短时记忆网络和迁移学习的洪水预测方法,具体步骤如下:
步骤1:获取数据集和相应的标签信息,并对数据进行预处理。数据预处理主要是为了筛选缺失以及有异常的数据,减少无关或错误的数据影响洪水预测的准确性,具体步骤如下:
步骤11:从水文监测站和网络上获取资源流域(源流域的候选流域)和目标流域的洪水数据集和相应流域的自然地理环境数据,其中洪水数据包括降雨量、降雨面积、蒸发量、水位数据和洪水流量,流域的自然地理环境数据包括冻土深度、流域面积、植被覆盖率、土壤结构和气候特征;
步骤12:初步处理数据,将数据中存在缺失的,含有异常值的相关数据去除。
步骤2:计算流域间的自然地理环境相似度,这一步主要是为了在筛选出适合迁移的源流域进行数据迁移。具体步骤如下:
步骤21:流域的自然地理环境数据选取冻土深度、流域面积、植被覆盖率、土壤结构和气候特征作为计算流域相似度的特征因子;
步骤22:通过上述特征因子分别计算出各候选流域与目标流域自然地理环境之间的相似度,相似度的计算公式为式中和是两个不同流域X1和X2的相似度特征因子归一化后组成的张量,其中土壤结构和气候特征是非数值类型数据,可以将砂质土、黏质土、壤土三种土壤结构分别定义为数值1~3,将气候特征,比如热带季风气候、亚热带季风气候、温带季风气候、温带大陆性气候和高山高原气候分别定义为数值1~5;
步骤23:将流域相似度降序排列,选取若干与目标流域相似度较大的流域作为源流域,从而进行数据迁移;
步骤24:将源流域与目标流域的所有数据作为模型训练的数据集,并划分为训练集和测试集,其中从源流域迁移过来所有的洪水数据和一部分目标流域的洪水数据作为训练集,另一部分目标流域的洪水数据作为测试集,目标流域洪水数据训练集与测试集的划分比例为7:3;
步骤3:相似流域中的洪水流量时间序列之间有一定的相似性,计算出该相似性后,在模型训练的过程中通过对损失函数的处理可以提高迁移数据的域适应性。具体步骤如下:
步骤31:对目标流域的洪水数据进行趋势化分析,计算出目标流域洪水流量平均数值,以流域的洪水平均流量时间序列作为目标流域的代表型洪水模式;
步骤32:令源流域中的洪水流量时间序列为Sτ,目标流域的代表型洪水流量时间序列为T,计算其长度分别为|Sτ|和|T|,其中τ为源流域中洪水的样本量;
步骤33:确定两个洪水流量时间序列的归整路径,归整路径的形式为W=w1,w2,…,wk,Max(|Sτ|,|T|)≤k≤|Sτ|+|T|,wk的形式为(i,j),其中i表示的是Sτ中的i坐标,j表示的是T中的j坐标。归整路径W从w1=(1,1)开始,到wk=(|Sτ|,|T|)结束,以保证Sτ和T中的每个坐标都在W中出现;W中(i,j)的i和j是单调增加的,以保证路径不会出现循环;
步骤35:最后,计算DTW距离,即距离最短的归整路径,公式为D(i,j)=Dist(i,j)+min[D(i,j),D(i,j-1),D(i-1,j-1)],整个过程可以通过递归完成,DTW距离表示成两个时间序列的相似度;
步骤36:重复步骤(32)-(35)对源流域中每个样本计算出与目标流域代表样本的相似度后,将源流域中相似度高的样本标记为1,相似度低的样本标记为-1,再将目标流域中用于训练的数据样本标记为0;其中相似度高低可根据设定的阈值或比例判断,阈值和比例也可根据算法效果进行调整。
步骤37:选择降雨量、降雨面积、蒸发量和水位数据作为洪水的预测因子,将上述步骤计算出的相似度列标记与归一化后的洪水预测因子数据组成模型的输入矩阵Dt×(σ+1),矩阵的行代表时间序列,前σ列代表洪水的预测因子,第σ+1列的第一行代表洪水相似度标记,其他行用0进行填充。
步骤5:将Attention得分进过归一化处理后最为洪水预测因子的权重,对原数据进行加权处理,以提高模型对重要预测因子的关注程度,具体步骤如下:
步骤53:计算出矩阵D进行Attention机制加权后的矩阵P=Dt×(σ+1)*A,该矩阵就是LSTM网络的输入矩阵。
步骤6:将步骤5中加权后的矩阵输入LSTM网络中进行训练,模型稳定后在测试集上进行洪水预测,具体步骤如下:
步骤61:确定LSTM神经网络的拓扑结构,LSTM网络结构设计包括输入门、遗忘门、记忆细胞和输出门;输入门输入进过加权处理后t-1时刻的洪水预测因子的数据,遗忘门和记忆细胞通过Sigmoid激活函数控制前t-1时刻需要被记忆和遗忘的数据信息;输出门输出t时刻目标流域的洪水预测流量;
步骤62:对LSTM网络进行参数的初始化,调节网络参数,设置初始学习率r0为0.25,学习率的衰减公式为r=0.95epoch_num·r0,其中,epoch_num是当前epoch的迭代轮数;
步骤63:对迁移样本进行域适应处理,在对网络进行训练时,使用随机梯度下降算法,损失函数的公式为其中μ为惩罚因子,reali洪水流量的真实值,outi为模型的预测值;当洪水相似度标记为1时,μ>1从而放大损失以便更好的纠正模型,当洪水相似度标记为-1时μ<1从而缩小损失以减少相似度低的数据对预测模型的影响,这两种情况下μ通过多次实验进行超参数的调优从而获得合适的惩罚因子值;当洪水相似度标记为0时,μ的值为1。最后再进行迭代训练,直到到达最大迭代次数或网络学习率收敛;
步骤64:LSTM模型在训练集上训练好后,将测试集的数据输入到模型中,输出预测的洪水流量。
基于相同的发明构思,本发明实施例提供的一种基于长短时记忆网络和迁移学习的洪水预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被加载至处理器时实现上述的基于长短时记忆网络和迁移学习的洪水预测方法。
Claims (8)
1.一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,包括如下步骤:
(1)收集流域相关的自然地理环境数据和水文观测站点的观测数据并对收集的数据进行预处理;
(2)根据流域的自然地理环境相似度筛选出与目标流域相似的洪水流域作为源流域进行数据迁移;
(3)利用DTW算法计算源流域与目标流域的洪水相似性,将洪水预测因子与洪水相似度结合成数据矩阵作为模型的输入;
(4)计算洪水预测因子的Attention得分;
(5)将洪水预测因子的Attention得分经过激活函数处理之后,作为权重对数据矩阵进行加权;
(6)将加权后的数据矩阵输入至长短时记忆网络LSTM中,利用LSTM网络预测目标流域的洪水流量,LSTM网络模型训练过程中对迁移过来的数据进行适应性处理,对相似度高的样本进行损失放大,相似度低的样本进行损失缩小,以提高迁移数据的域适应性。
2.根据权利要求1所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,所述步骤(1)包括:
(11)从水文监测站和网络上获取资源流域和目标流域的洪水数据集和相应流域的自然地理环境数据,其中洪水数据包括降雨量、降雨面积、蒸发量、水位数据和洪水流量,流域的自然地理环境数据包括冻土深度、流域面积、植被覆盖率、土壤结构和气候特征;
(12)初步处理数据,将数据中存在缺失的,含有异常值的相关数据去除。
3.根据权利要求1所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,所述步骤(2)包括:
(21)流域的自然地理环境数据选取冻土深度、流域面积、植被覆盖率、土壤结构和气候特征作为计算流域相似度的特征因子;
(23)将流域相似度降序排列,选取若干与目标流域相似度较大的流域作为源流域,从而进行数据迁移;
(24)将源流域与目标流域的所有数据作为模型训练的数据集,并划分为训练集和测试集,其中从源流域迁移过来所有的洪水数据和一部分目标流域的洪水数据作为训练集,另一部分目标流域的洪水数据作为测试集。
4.根据权利要求1所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,所述步骤(3)包括:
(31)对目标流域的洪水数据进行趋势化分析,计算出目标流域洪水流量平均数值,以流域的洪水平均流量时间序列作为目标流域的代表型洪水模式;
(32)令源流域中的洪水流量时间序列为Sτ,目标流域的代表型洪水流量时间序列为T,计算其长度分别为|Sτ|和|T|,其中τ为源流域中洪水的样本量;
(33)确定两个洪水流量时间序列的归整路径,归整路径的形式为W=w1,w2,…,wk,Max(|Sτ|,|T|)≤k≤|Sτ|+|T|,wk的形式为(i,j),其中i表示的是Sτ中的i坐标,j表示的是T中的j坐标;归整路径W从w1=(1,1)开始,到wk=(|Sτ|,|T|)结束,以保证Sτ和T中的每个坐标都在W中出现;W中(i,j)的i和j是单调增加的,以保证路径不会出现循环;
(35)最后,计算DTW距离,即距离最短的归整路径,公式为D(i,j)=Dist(i,j)+min[D(i,j),D(i,j-1),D(i-1,j-1)],整个过程通过递归完成,DTW距离表示成两个时间序列的相似度;
(36)重复步骤(32)-(35)对源流域中每个样本计算出与目标流域代表样本的相似度后,将源流域中相似度高的样本标记为1,相似度低的样本标记为-1,再将目标流域中用于训练的数据样本标记为0;
(37)选择降雨量、降雨面积、蒸发量和水位数据作为洪水的预测因子,将上述步骤计算出的相似度列标记与归一化后的洪水预测因子数据组成模型的输入矩阵Dt×(σ+1),矩阵的行代表时间序列,前σ列代表洪水的预测因子,第σ+1列的第一行代表洪水相似度标记,其他行用0进行填充。
7.根据权利要求1所述的一种基于长短时记忆网络和迁移学习的洪水预测方法,其特征在于,所述步骤(6)包括:
(61)确定LSTM神经网络的拓扑结构,LSTM网络结构设计包括输入门、遗忘门、记忆细胞和输出门;输入门输入进过加权处理后t-1时刻的洪水预测因子的数据,遗忘门和记忆细胞通过Sigmoid激活函数控制前t-1时刻需要被记忆和遗忘的数据信息;输出门输出t时刻目标流域的洪水预测流量;
(62)对LSTM网络进行参数的初始化,调节网络参数,设置初始学习率r0,学习率的衰减公式为r=0.95epoch_num·r0,其中,epoch_num是当前epoch的迭代轮数;
(63)对迁移样本进行域适应处理,在对网络进行训练时,使用随机梯度下降算法,当洪水相似度标记为1时,放大损失以便更好的纠正模型,当洪水相似度标记为-1时则缩小损失,以减少相似度的数据对预测模型的影响,最后再进行迭代训练,直到到达最大迭代次数或网络学习率收敛;
(64)LSTM模型在训练集上训练好后,将测试集的数据输入到模型中,输出预测的洪水流量。
8.一种基于长短时记忆网络和迁移学习的洪水预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被加载至处理器时实现根据权利要求1-7任一项所述的基于长短时记忆网络和迁移学习的洪水预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010602424.0A CN111915058B (zh) | 2020-06-29 | 2020-06-29 | 基于长短时记忆网络和迁移学习的洪水预测方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010602424.0A CN111915058B (zh) | 2020-06-29 | 2020-06-29 | 基于长短时记忆网络和迁移学习的洪水预测方法与装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111915058A CN111915058A (zh) | 2020-11-10 |
CN111915058B true CN111915058B (zh) | 2022-08-26 |
Family
ID=73226678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010602424.0A Active CN111915058B (zh) | 2020-06-29 | 2020-06-29 | 基于长短时记忆网络和迁移学习的洪水预测方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111915058B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112906768A (zh) * | 2021-02-04 | 2021-06-04 | 南京邮电大学 | 一种无线行为感知模型跨场景预选择方法 |
CN113139329B (zh) * | 2021-03-04 | 2022-10-18 | 河海大学 | 一种基于水文相似性和人工神经网络的新安江模型参数率定方法 |
CN113125037B (zh) * | 2021-04-06 | 2024-06-07 | 红塔烟草(集团)有限责任公司 | 一种基于分布式光纤在线测温系统的电缆导体温度估算方法 |
CN113987971B (zh) * | 2021-10-27 | 2023-05-05 | 北京中地华安科技股份有限公司 | 洪水危险性的预警方法、装置、电子设备和介质 |
CN114462322B (zh) * | 2022-04-12 | 2022-07-05 | 长江勘测规划设计研究有限责任公司 | 基于迁移学习机制的流域超标准洪水模拟发生器构建方法 |
CN114742419A (zh) * | 2022-04-15 | 2022-07-12 | 南京信息工程大学 | 一种数据迁移改进数据有限区域滑坡危险性评估的方法 |
CN117787437A (zh) * | 2023-12-19 | 2024-03-29 | 中国科学院西北生态环境资源研究院 | 一种多年冻土区一氧化二氮通量估算方法 |
CN118036481B (zh) * | 2024-04-15 | 2024-06-18 | 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) | 一种预测河道洪水流量的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108681585A (zh) * | 2018-05-14 | 2018-10-19 | 浙江工业大学 | 一种基于NetSim-TL的多源迁移学习标签流行性预测模型的构建方法 |
CN108846444A (zh) * | 2018-06-23 | 2018-11-20 | 重庆大学 | 面向多源数据挖掘的多阶段深度迁移学习方法 |
CN110580496A (zh) * | 2019-07-11 | 2019-12-17 | 南京邮电大学 | 一种基于熵最小化的深度迁移学习系统及方法 |
-
2020
- 2020-06-29 CN CN202010602424.0A patent/CN111915058B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108681585A (zh) * | 2018-05-14 | 2018-10-19 | 浙江工业大学 | 一种基于NetSim-TL的多源迁移学习标签流行性预测模型的构建方法 |
CN108846444A (zh) * | 2018-06-23 | 2018-11-20 | 重庆大学 | 面向多源数据挖掘的多阶段深度迁移学习方法 |
CN110580496A (zh) * | 2019-07-11 | 2019-12-17 | 南京邮电大学 | 一种基于熵最小化的深度迁移学习系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111915058A (zh) | 2020-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111915058B (zh) | 基于长短时记忆网络和迁移学习的洪水预测方法与装置 | |
Choubin et al. | Precipitation forecasting using classification and regression trees (CART) model: a comparative study of different approaches | |
Wagena et al. | Comparison of short-term streamflow forecasting using stochastic time series, neural networks, process-based, and Bayesian models | |
Mas et al. | Modelling deforestation using GIS and artificial neural networks | |
Marofi et al. | Predicting spatial distribution of snow water equivalent using multivariate non-linear regression and computational intelligence methods | |
Kalayathankal et al. | A fuzzy soft flood alarm model | |
CN111767517B (zh) | 一种应用于洪水预测的BiGRU多步预测方法、系统及存储介质 | |
Xu et al. | Deep transfer learning based on transformer for flood forecasting in data-sparse basins | |
Zia et al. | Predicting discharge using a low complexity machine learning model | |
Abd-Elmaboud et al. | Estimation of groundwater recharge using simulation-optimization model and cascade forward ANN at East Nile Delta aquifer, Egypt | |
Liu et al. | Comparing machine-learning models for drought forecasting in vietnam’s cai river basin | |
Liu et al. | Gully erosion susceptibility assessment based on machine learning-A case study of watersheds in Tuquan County in the black soil region of Northeast China | |
CN114372631A (zh) | 一种基于小样本学习和lstm的缺资料地区径流预测方法 | |
CN111914487A (zh) | 一种基于对抗神经网络的无资料地区水文参数率定方法 | |
Li et al. | A stepwise clustered hydrological model for addressing the temporal autocorrelation of daily streamflows in irrigated watersheds | |
Yadav et al. | Application of Artificial Neural Network and Genetic Algorithm Based Artificial Neural Network Models for River Flow Prediction. | |
Badyalina et al. | Streamflow estimation at ungauged basin using modified group method of data handling | |
CN118245930A (zh) | 水文事件液面预测方法、装置、存储介质及计算机设备 | |
Nivesh et al. | Prediction of river discharge of Kesinga sub-catchment of Mahanadi basin using machine learning approaches | |
Gholami et al. | Evaluating the effects of vegetation and land management on runoff control using field plots and machine learning models | |
Aoulmi et al. | Runoff predictions in a semiarid watershed by convolutional neural networks improved with metaheuristic algorithms and forced with reanalysis and climate data | |
Fan et al. | Explainable machine learning model for multi-step forecasting of reservoir inflow with uncertainty quantification | |
CN113591608A (zh) | 一种基于深度学习的高分辨率遥感影像不透水面提取方法 | |
Mirzania et al. | Enhancement groundwater level prediction using hybrid ANN-HHO model: case study (Shabestar Plain in Iran) | |
Jayaminda et al. | Rating Performances of Global Climate Models in Capturing Monsoon Rainfall Patterns in Sri Lanka |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |