CN111915058B

CN111915058B - 基于长短时记忆网络和迁移学习的洪水预测方法与装置

Info

Publication number: CN111915058B
Application number: CN202010602424.0A
Authority: CN
Inventors: 张鹏程; 高志鹏
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2020-06-29
Filing date: 2020-06-29
Publication date: 2022-08-26
Anticipated expiration: 2040-06-29
Also published as: CN111915058A

Abstract

本发明提出了一种基于长短时记忆网络和迁移学习的洪水预测方法与装置，在收集到资源流域的洪水数据信息后，通过对流域自然环境的余弦相似度计算，筛选出相似度高的流域作为源流域进行数据迁移，再利用DTW算法计算源流域与目标流域的洪水相似性，将计算出的洪水相似度与水文数据组成输入矩阵，作为模型的输入，然后利用Attention机制计算出加权数据，以便模型更好的挖掘重要特征因子的信息，最后将加权数据矩阵输入LSTM网络中建立洪水预测模型，对目标流域未来的洪水流量进行预测。本发明方法一方面克服了针对特定流域洪水预测问题中数据匮乏的特点，另一方面充分利用了LSTM网络对处理时间序列问题的优越性能，洪水预测更加准确。

Description

基于长短时记忆网络和迁移学习的洪水预测方法与装置

技术领域

本发明涉及洪水预测领域，尤其是一种基于长短时记忆网络和迁移学习的洪水预测方法与装置。

背景技术

洪水灾害是一种常见的自然灾害，它是由于特大的地表径流河槽不能容纳，洼地积水不能及时排除，或海面突然上升海水侵陆而泛滥成灾。洪水灾害是世界上最严重的自然灾害之一，不仅发生的频率高、范围广，而且影响比较深远，中国幅员辽阔，地形复杂，季风气候显著，是世界上水灾频发且影响范围较广泛的国家之一。洪水作为一种最为普遍的自然灾害，具有破坏性，对社会构成巨大威胁。因此，实用有效的洪水预报方法，有利于防灾救灾快速反应，保护生命财产安全，维护社会稳定。

现有的洪水预测方法多种多样，大致可以分为洪水模型分为物理水文概念模型和数据驱动模型两种。水文概念模型描述了其组成部分的水文过程，如自然界的水循环过程。该模型通过模拟流域内水流及河流演变过程，模拟流域内的水流过程。早在20世纪60年代，水文学者就发现了流域的气候条件分布和空间变异不均，并研究了其对流域雨流量关系的影响。从20世纪70年代到80年代中期，美国斯坦福模型、萨克拉门托模型、日本水箱模型和中国新安江模型等几个著名的物理模型得到了发展。此外，欧洲SHE模型是1986年发展起来的第一个具有高度代表性的分布式水文模型。数据驱动的智能模型主要通过分析现有的观测数据，然后建立输入输出的映射关系，预测具体水文量。随着计算能力和算法的不断发展，数以百计的数据分析和挖掘技术飞速发展。这些技术不仅包括回归分析、EM算法、贝叶斯理论等经典的概率统计方法，还包括支持向量机等经典的机器学习方法。新的递归神经网络、卷积神经网络、图形卷积网络和其他人工智能方法也在迅速发展。在现有数据条件下，研究结果令人满意。随着技术的进一步发展，许多领域的研究成果对水文预报具有重要意义。

然而水文概念模型的结构是有限的，因为还不可能使用从考虑流域物理属性导出的数学方程严格描述这些子过程。此外，它们的优化方法决定了模型参数对实测降雨流量数据的依赖性，因而在实际应用中受到限制。传统的数据驱动模式不考虑降雨流型的物理过程，这导致人们试图利用所有可用的水文数据，这大大增加了特征尺寸，需要大量的训练数据。而且，在处理某一指定流域的洪水预测问题时，由于洪水的突发性，时效性以及短期性等特点，指定流域的水文数据往往非常匮乏，从而不能为模型提供足够所需的训练数据。

发明内容

发明目的：针对现有技术中存在的问题与不足，为了准确有效的预测某个流域的洪水流量，本发明提出了一种基于长短时记忆网络和迁移学习的洪水预测方法与装置，它一方面克服了针对特定流域洪水预测问题中数据匮乏的特点，另一方面充分利用了LSTM网络对处理时间序列问题的优越性能，洪水预测更加准确。

技术方案：为实现上述发明目的，本发明所述的一种基于长短时记忆网络和迁移学习的洪水预测方法，包括如下步骤：

(1)收集流域相关的自然地理环境数据和水文观测站点的观测数据并对收集的数据进行预处理；

(2)根据流域的自然地理环境相似度筛选出与目标流域相似的洪水流域作为源流域进行数据迁移；

(3)利用DTW算法计算源流域与目标流域的洪水相似性，将洪水预测因子与洪水相似度结合成数据矩阵作为模型的输入；

(4)计算洪水预测因子的Attention得分；

(5)将洪水预测因子的Attention得分经过激活函数处理之后，作为权重对数据矩阵进行加权；

(6)将加权后的数据矩阵输入至长短时记忆网络LSTM中，利用LSTM网络预测目标流域的洪水流量，LSTM网络模型训练过程中对迁移过来的数据进行适应性处理，对相似度高的样本进行损失放大，相似度低的样本进行损失缩小，以提高迁移数据的域适应性。

所述步骤(1)是获取数据集和相应的标签信息，所述步骤(1)进一步为：

(11)从水文监测站和网络上获取洪水数据集和相应流域的自然地理环境数据，其中洪水数据包括降雨量、降雨面积、蒸发量、水位数据和洪水流量，流域的自然地理环境数据包括冻土深度、流域面积、植被覆盖率、土壤结构和气候特征；

(12)初步处理数据，将数据中存在缺失的，含有异常值的相关数据去除。

所述步骤(2)是筛选出适合迁移的源流域进行数据迁移，所述步骤(2)进一步为：

(21)流域的自然地理环境数据选取冻土深度、流域面积、植被覆盖率、土壤结构和气候特征作为计算流域相似度的特征因子；

(22)通过上述特征因子分别计算出各候选流域与目标流域自然地理环境之间的相似度，相似度的计算公式为

式中，

和

是两个不同流域X₁和X₂的相似度特征因子归一化后组成的张量；

(23)将流域相似度降序排列，选取若干与目标流域相似度较大的流域作为源流域，从而进行数据迁移；

(24)将源流域与目标流域的所有数据作为模型训练的数据集，并划分为训练集和测试集，其中从源流域迁移过来所有的洪水数据和一部分目标流域的洪水数据作为训练集，另一部分目标流域的洪水数据作为测试集。

相似流域中的洪水流量时间序列之间也存在一定的相似性，计算出该相似性后，在模型训练的过程中通过对损失函数的处理可以提高迁移数据的域适应性，所述步骤(3)进一步为：

(31)对目标流域的洪水数据进行趋势化分析，计算出目标流域洪水流量平均数值，以流域的洪水平均流量时间序列作为目标流域的代表型洪水模式；

(32)令源流域中的洪水流量时间序列为S_τ，目标流域的代表型洪水流量时间序列为T，计算其长度分别为|S_τ|和|T|，其中，τ为源流域中洪水的样本量；

(33)确定两个洪水流量时间序列的归整路径，归整路径的形式为W＝w₁,w₂,…,w_k，Max(|S_τ|,|T|)≤k≤|S_τ|+|T|，w_k的形式为(i,j)，其中i表示的是S_τ中的i坐标，j表示的是T中的j坐标；归整路径W从w₁＝(1,1)开始，到w_k＝(|S_τ|,|T|)结束，以保证S_τ和T中的每个坐标都在W中出现；W中(i,j)的i和j是单调增加的，以保证路径不会出现循环；

(34)根据归整路径计算两个洪水流量时间序列的归整距离，公式为

其中i_ε和j_ε分别表示ε时刻S_τ和T的洪水流量值；

(35)最后，计算DTW距离，即距离最短的归整路径，公式为D(i,j)＝Dist(i,j)+min[D(i,j),D(i,j-1),D(i-1,j-1)],整个过程可以通过递归完成，DTW距离表示成两个时间序列的相似度；

(36)重复步骤(32)-(35)对源流域中每个样本计算出与目标流域代表样本的相似度后，将源流域中相似度高的样本标记为1，相似度低的样本标记为-1，再将目标流域中用于训练的数据样本标记为0；

(37)选择降雨量、降雨面积、蒸发量和水位数据作为洪水的预测因子，将上述步骤计算出的相似度列标记与归一化后的洪水预测因子数据组成模型的输入矩阵D_t×(σ+1),矩阵的行代表时间序列，前σ列代表洪水的预测因子，第σ+1列的第一行代表洪水相似度标记，其他行用0进行填充。

所述步骤(4)中计算洪水预测因子的Attention得分，具体计算公式为

i＝1,2,…,σ，式中，

表示第i个洪水预测因子的时间序列，L_t＝(l₁,l₂,…,l_t)表示洪水流量的时间序列。

步骤(5)将Attention得分进过归一化处理后最为洪水预测因子的权重，对原数据进行加权处理，所述步骤(5)进一步为：

(51)根据洪水预测因子的Attention得分计算出预测因子的权值矩阵E＝(e₁,e₂,…,e_σ),计算公式为

其中，

和b为需要训练的参数，初始化分别为1和0；

(52)对权值矩阵进行归一化处理，根据公式

将权值矩阵E中的数据映射到(0,1)区间中，进而得到权值对角矩阵A＝diag(a₁,a₂,…,a_σ,1)；

(53)计算出矩阵D进行Attention机制加权后的矩阵P＝D_t×(σ+1)*A，该矩阵就是LSTM网络的输入矩阵。

将加权后的矩阵P输入到LSTM网络中预测目标流域洪水流量的结果，所述步骤(6)进一步为：

(61)确定LSTM神经网络的拓扑结构，LSTM网络结构设计包括输入门、遗忘门、记忆细胞和输出门；输入门输入进过加权处理后t-1时刻的洪水预测因子的数据，遗忘门和记忆细胞通过Sigmoid激活函数控制前t-1时刻需要被记忆和遗忘的数据信息；输出门输出t时刻目标流域的洪水预测流量；

(62)对LSTM网络进行参数的初始化，调节网络参数，设置初始学习率r₀，学习率的衰减公式为r＝0.95^epoch_num·r₀，其中，epoch_num是当前epoch的迭代轮数；

(63)对迁移样本进行域适应处理，在对网络进行训练时，使用随机梯度下降算法，当洪水相似度标记为1时，放大损失以便更好的纠正模型，当洪水相似度标记为-1时则缩小损失，以减少相似度的数据对预测模型的影响，最后再进行迭代训练，直到到达最大迭代次数或网络学习率收敛；

(64)LSTM模型在训练集上训练好后，将测试集的数据输入到模型中，输出预测的洪水流量。

基于相同的发明构思，本发明提供的一种基于长短时记忆网络和迁移学习的洪水预测装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述计算机程序被加载至处理器时实现所述的基于长短时记忆网络和迁移学习的洪水预测方法。

有益效果：本发明提供的一种基于长短时记忆网络和迁移学习的洪水预测方法，与现有技术相比，本发明的优点在于：考虑了相似流域之间的洪水模式也存在一定的相似性，通过对相似流域的洪水数据进行迁移，克服了预测某指定流域洪水数据匮乏的特点，结合Attention机制对更重要的预测因子赋予更大的权重，以提高预测模型数据挖掘的能力；通过LSTM网络进行训练和预测降雨，考虑了时间序列的因素，提高了模型的预测精度。

附图说明

图1为本发明实施例的整体步骤图；

图2为本发明具体示例的方法流程图。

具体实施方式

下面结合具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

如图1所示，本发明实施例公开的一种基于长短时记忆网络和迁移学习的洪水预测方法，主要包括6个步骤：

步骤1：收集流域相关的自然地理环境数据和水文观测站点的观测数据并对收集的数据进行预处理；

步骤2：根据流域的自然地理环境相似度筛选出与目标流域相似的洪水流域作为源流域进行数据迁移；

步骤3：利用DTW算法计算源流域与目标流域的洪水相似性，将洪水预测因子与洪水相似度结合成数据矩阵作为模型的输入；

步骤4：计算洪水预测因子的Attention得分；

步骤5：将洪水预测因子的Attention得分经过激活函数处理之后，作为权重对数据矩阵进行加权；

步骤6：将加权后的数据矩阵输入至长短时记忆网络LSTM中，利用LSTM网络预测目标流域的洪水流量。

如图2所示，本发明实施例公开的一种长短时记忆网络和迁移学习的洪水预测方法，具体步骤如下：

步骤1：获取数据集和相应的标签信息，并对数据进行预处理。数据预处理主要是为了筛选缺失以及有异常的数据，减少无关或错误的数据影响洪水预测的准确性，具体步骤如下：

步骤11：从水文监测站和网络上获取资源流域(源流域的候选流域)和目标流域的洪水数据集和相应流域的自然地理环境数据，其中洪水数据包括降雨量、降雨面积、蒸发量、水位数据和洪水流量，流域的自然地理环境数据包括冻土深度、流域面积、植被覆盖率、土壤结构和气候特征；

步骤12：初步处理数据，将数据中存在缺失的，含有异常值的相关数据去除。

步骤2：计算流域间的自然地理环境相似度，这一步主要是为了在筛选出适合迁移的源流域进行数据迁移。具体步骤如下:

步骤21：流域的自然地理环境数据选取冻土深度、流域面积、植被覆盖率、土壤结构和气候特征作为计算流域相似度的特征因子；

步骤22：通过上述特征因子分别计算出各候选流域与目标流域自然地理环境之间的相似度，相似度的计算公式为

式中

和

是两个不同流域X₁和X₂的相似度特征因子归一化后组成的张量，其中土壤结构和气候特征是非数值类型数据，可以将砂质土、黏质土、壤土三种土壤结构分别定义为数值1～3，将气候特征，比如热带季风气候、亚热带季风气候、温带季风气候、温带大陆性气候和高山高原气候分别定义为数值1～5；

步骤23：将流域相似度降序排列，选取若干与目标流域相似度较大的流域作为源流域，从而进行数据迁移；

步骤24：将源流域与目标流域的所有数据作为模型训练的数据集，并划分为训练集和测试集，其中从源流域迁移过来所有的洪水数据和一部分目标流域的洪水数据作为训练集，另一部分目标流域的洪水数据作为测试集，目标流域洪水数据训练集与测试集的划分比例为7:3；

步骤3：相似流域中的洪水流量时间序列之间有一定的相似性，计算出该相似性后，在模型训练的过程中通过对损失函数的处理可以提高迁移数据的域适应性。具体步骤如下：

步骤31：对目标流域的洪水数据进行趋势化分析，计算出目标流域洪水流量平均数值，以流域的洪水平均流量时间序列作为目标流域的代表型洪水模式；

步骤32：令源流域中的洪水流量时间序列为S_τ，目标流域的代表型洪水流量时间序列为T，计算其长度分别为|S_τ|和|T|，其中τ为源流域中洪水的样本量；

步骤33：确定两个洪水流量时间序列的归整路径，归整路径的形式为W＝w₁,w₂,…,w_k，Max(|S_τ|,|T|)≤k≤|S_τ|+|T|，w_k的形式为(i,j)，其中i表示的是S_τ中的i坐标，j表示的是T中的j坐标。归整路径W从w₁＝(1,1)开始，到w_k＝(|S_τ|,|T|)结束，以保证S_τ和T中的每个坐标都在W中出现；W中(i,j)的i和j是单调增加的，以保证路径不会出现循环；

步骤34：根据归整路径计算两个洪水流量时间序列的归整距离，公式为

其中i_ε和j_ε分别表示ε时刻S_τ和T的洪水流量值；

步骤35：最后，计算DTW距离，即距离最短的归整路径，公式为D(i,j)＝Dist(i,j)+min[D(i,j),D(i,j-1),D(i-1,j-1)],整个过程可以通过递归完成，DTW距离表示成两个时间序列的相似度；

步骤36：重复步骤(32)-(35)对源流域中每个样本计算出与目标流域代表样本的相似度后，将源流域中相似度高的样本标记为1，相似度低的样本标记为-1，再将目标流域中用于训练的数据样本标记为0；其中相似度高低可根据设定的阈值或比例判断，阈值和比例也可根据算法效果进行调整。

步骤37：选择降雨量、降雨面积、蒸发量和水位数据作为洪水的预测因子，将上述步骤计算出的相似度列标记与归一化后的洪水预测因子数据组成模型的输入矩阵D_t×(σ+1),矩阵的行代表时间序列，前σ列代表洪水的预测因子，第σ+1列的第一行代表洪水相似度标记，其他行用0进行填充。

步骤4：计算洪水预测因子的Attention得分，具体计算公式为

i＝1,2,…,σ，式中，

步骤5：将Attention得分进过归一化处理后最为洪水预测因子的权重，对原数据进行加权处理，以提高模型对重要预测因子的关注程度，具体步骤如下：

步骤51：根据洪水预测因子的Attention得分计算出预测因子的权值矩阵E＝(e₁,e₂,…,e_σ),计算公式为

其中，

和b为需要训练的参数，初始化分别为1和0；

步骤52：对权值矩阵进行归一化处理，根据公式

步骤53：计算出矩阵D进行Attention机制加权后的矩阵P＝D_t×(σ+1)*A，该矩阵就是LSTM网络的输入矩阵。

步骤6：将步骤5中加权后的矩阵输入LSTM网络中进行训练，模型稳定后在测试集上进行洪水预测，具体步骤如下：

步骤61：确定LSTM神经网络的拓扑结构，LSTM网络结构设计包括输入门、遗忘门、记忆细胞和输出门；输入门输入进过加权处理后t-1时刻的洪水预测因子的数据，遗忘门和记忆细胞通过Sigmoid激活函数控制前t-1时刻需要被记忆和遗忘的数据信息；输出门输出t时刻目标流域的洪水预测流量；

步骤62：对LSTM网络进行参数的初始化，调节网络参数，设置初始学习率r₀为0.25，学习率的衰减公式为r＝0.95^epoch_num·r₀，其中，epoch_num是当前epoch的迭代轮数；

步骤63：对迁移样本进行域适应处理，在对网络进行训练时，使用随机梯度下降算法，损失函数的公式为

其中μ为惩罚因子，realⁱ洪水流量的真实值，outⁱ为模型的预测值；当洪水相似度标记为1时，μ>1从而放大损失以便更好的纠正模型，当洪水相似度标记为-1时μ<1从而缩小损失以减少相似度低的数据对预测模型的影响，这两种情况下μ通过多次实验进行超参数的调优从而获得合适的惩罚因子值；当洪水相似度标记为0时，μ的值为1。最后再进行迭代训练，直到到达最大迭代次数或网络学习率收敛；

步骤64：LSTM模型在训练集上训练好后，将测试集的数据输入到模型中，输出预测的洪水流量。

基于相同的发明构思，本发明实施例提供的一种基于长短时记忆网络和迁移学习的洪水预测装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，该计算机程序被加载至处理器时实现上述的基于长短时记忆网络和迁移学习的洪水预测方法。