CN115114842A

CN115114842A - 一种基于小样本迁移学习算法的暴雨内涝事件预测方法

Info

Publication number: CN115114842A
Application number: CN202210447536.2A
Authority: CN
Inventors: 刘媛媛; 刘业森; 郑敬伟; 柴福鑫; 李敏; 刘舒; 李匡; 任汉承
Original assignee: China Institute of Water Resources and Hydropower Research
Current assignee: China Institute of Water Resources and Hydropower Research
Priority date: 2022-04-27
Filing date: 2022-04-27
Publication date: 2022-09-27

Abstract

本发明提供一种基于小样本迁移学习算法的暴雨内涝事件预测方法，包括建立数值模拟模型并生成模拟结果，还包括以下步骤：利用模拟结果进行学习样本的容量扩充和特征增强；利用扩充后的学习样本对长短期记忆网络神经网络模型A进行预训练；将训练好神经网络模型各参数移植到长短期记忆网络神经网络模型B中，并对神经网络模型B进行训练；利用训练好的神经网络模型B对未参加模型训练的积水过程进行预测，生成预测结果；通过计算预测结果与模拟结果的决定系数R²来判断这两条曲线的相似程度，得到用于快速预测的长短期记忆网络神经网络模型；将新得到的暴雨‑内涝样本输入用于快速预测的长短期记忆网络神经网络模型，进行内涝积水的快速预测。

Description

一种基于小样本迁移学习算法的暴雨内涝事件预测方法

技术领域

本发明涉及水利工程的技术领域，特别是一种基于小样本迁移学习算法的暴雨内涝事件预测方法。

背景技术

近几年，城市出现极端暴雨的频次增多，随着城市规模的扩大和经济的发展，暴雨内涝给城市带来的经济损失也逐年增加，暴雨带来的内涝已经成为影响城市正常运行的主要城市型水灾害。除了提高城市防洪排涝工程标准之外，在暴雨到来之前提前预知、预判、预防城市暴雨风险，及时发布预警信息，也是城市暴雨风险管理工作中需要迫切解决的问题。

以往对城市内涝风险分析的方式，都是利用数值模拟模型，对即将到来的暴雨产生的内涝风险提前模拟评估。随着数值模拟技术的发展和基础数据精度的提高，城市洪涝模拟技术迅速发展，可以对城市内涝进行很好的模拟。但是，城市下垫面情况复杂，需要精细的水文水动力模型模拟，通过水文模型和一维河道模型、二维地表模型以及地下管网模型耦合计算，模拟城市下垫面内涝积水情况。精细的水文水动力模型，模型庞大、耦合复杂，计算效率较低。虽然近几年出现了超级计算机等硬件条件以及GPU并行计算等技术手段，数值模拟计算速度有了大幅度的提升，但是依然无法满足城市防汛应急时效上的需求。

随着大数据和人工智能时代的到来，人工智能技术在各行各业都有了成功的应用，该技术高效、智能，是未来技术发展的主要方向。然而当前绝大部分AI技术的成功应用，离不开大量的高质量标注数据样本的训练。而对于城市暴雨内涝预测这个应用场景来说，暴雨-内涝的学习样本较少，且内涝积水实际监测数据质量较差，AI技术很难应用。

申请公布号为CN107025303A的发明专利申请公开了一种基于迁移学习的城市内涝分析方法，包括：首先根据城市本身特性划分区域；然后利用每个区域内的社交媒体和传感器数据构造特征，并利用多视图学习尽心特征融合。最后利用迁移学习将数据量丰富的大城市内涝知识转移到相对较小的城市，训练小城市的内涝严重程度模型。该迁移方法是将研究对象进行了迁移。但是大城市和小城市之间学习样本差别很大，从降雨条件、到下垫面的产汇流关系，差别都非常大。将大城市训练好的网络模型，迁移到小城市，具有很大的不确定性。迁移后的模型，收敛速度、预测精度也不会有很大的提高。

发明内容

为了解决上述的技术问题，本发明提出的一种基于小样本迁移学习算法的暴雨内涝事件预测方法，在分析、对比深度学习的迁移学习的小样本学习技术、数据增强的小样本学习的基础上，结合数值模拟模型，提出适用于城市暴雨-内涝的深度学习小样本学习技术。

本发明的目的是提供一种基于小样本迁移学习算法的暴雨内涝事件预测方法，包括建立数值模拟模型并生成模拟结果，还包括以下步骤：

步骤1：利用所述模拟结果进行学习样本的容量扩充和特征增强；

步骤2：利用扩充后的所述学习样本对长短期记忆网络神经网络模型A进行预训练；

步骤3：通过迁移学习技术，将训练好神经网络模型各参数移植到长短期记忆网络神经网络模型B中，选择暴雨-内涝样本中的90%作为训练样本对所述长短期记忆网络神经网络模型B进行训练；

步骤4：利用训练好的所述长短期记忆网络神经网络模型B对未参加模型训练的积水过程进行预测，生成预测结果；

步骤5：通过计算所述预测结果与所述模拟结果的决定系数R ²来判断这两条曲线的相似程度，得到用于快速预测的长短期记忆网络神经网络模型；

步骤6：将新得到的暴雨-内涝样本输入用于快速预测的长短期记忆网络神经网络模型，进行内涝积水的快速预测。

优选的是，所述长短期记忆网络神经网络模型在RNN隐藏层中增加隐藏状态C _t、遗忘门、输入门和输出门。

在上述任一方案中优选的是，所述遗忘门的输出为f _t，公式为

其中，σ为激活函数，W _f和U _f为模型的矩阵参数，S _t-1为上一时序隐藏层的输出，x _t为本时序的样本，b _f为线性偏置参数。

在上述任一方案中优选的是，所述输入门的输出为i _t和a _t，公式为

其中，tanh为激活函数，W _i、U _i、W _a和U _a为线性参数，b _i和b _a为线性偏置参数。

在上述任一方案中优选的是，根据所述输出门的输出i _t和a _t更新C _t的状态，公式为

其中，C _t-1为上一时间的隐藏状态，e为阿达玛积。

在上述任一方案中优选的是，所述输出门的输出为o _t，公式为

其中，W _o和U _o为线性参数，b _o为线性偏置参数。

在上述任一方案中优选的是，所述RNN隐藏层的输出S _t由所述输出门的输出o _t和C _t乘积得到，

。

在上述任一方案中优选的是，预测输出

为

其中，V为线性参数，b _t为线性偏置参数。

在上述任一方案中优选的是，所述决定系数R ²的计算公式为

其中，x _j为神经网络模型的预测结果，y _j为数值模拟模型的预测结果，j为样本序号，n为样本总数。

在上述任一方案中优选的是，所述决定系数R²越接近1，表示所述神经网络模型的预测结果曲线和所述数值模拟模型的预测结果曲线的拟合程度越高。

本发明提出了一种基于小样本迁移学习算法的暴雨内涝事件预测方法，利用人工智能和数值模拟模型相结合的方法，既弥补了数值模拟模型计算效率低的缺点，又满足了人工智能算法对训练样本需求量大的要求，预测精度高、计算速度快，为实现城市内涝快速预测，提供了新思路，为人工智能技术在防洪减灾方向的应用开拓了新的研究方向。

附图说明

图1为按照本发明的基于小样本迁移学习算法的暴雨内涝事件预测方法的一优选实施例的流程图。

图2为按照本发明的基于小样本迁移学习算法的暴雨内涝事件预测方法的另一优选实施例的技术流程图。

图3为按照本发明的基于小样本迁移学习算法的暴雨内涝事件预测方法的一优选实施例的典型积水点分布示意图。

图4为按照本发明的基于小样本迁移学习算法的暴雨内涝事件预测方法的长短期记忆网络神经网络模型的一实施例的结构示意图。

图5为按照本发明的基于小样本迁移学习算法的暴雨内涝事件预测方法的神经网络模型的预测结果和数值模拟模型的预测结果的一实施例的对比示意图。

具体实施方式

下面结合附图和具体的实施例对本发明做进一步的阐述。

实施例一

如图1所示，执行步骤100，建立数值模拟模型并生成模拟结果。

执行步骤110，利用所述模拟结果进行学习样本的容量扩充和特征增强。

执行步骤120，利用扩充后的所述学习样本对长短期记忆网络神经网络模型A进行预训练。所述长短期记忆网络神经网络模型在RNN隐藏层中增加隐藏状态C _t、遗忘门、输入门和输出门。

所述遗忘门的输出为f _t，公式为

所述输入门的输出为i _t和a _t，公式为

根据所述输出门的输出i _t和a _t更新C _t的状态，公式为

其中，C _t-1为上一时间的隐藏状态，e为阿达玛积。

所述输出门的输出为o _t，公式为

其中，W _o和U _o为线性参数，b _o为线性偏置参数。

所述RNN隐藏层的输出S _t由所述输出门的输出o _t和C _t乘积得到，

则预测输出

为

其中，V为线性参数，b _t为线性偏置参数。

执行步骤130，通过迁移学习技术，将训练好神经网络模型各参数移植到长短期记忆网络神经网络模型B中，选择暴雨-内涝样本中的90%作为训练样本对所述长短期记忆网络神经网络模型B进行训练。

执行步骤140，利用训练好的所述长短期记忆网络神经网络模型B对未参加模型训练的积水过程进行预测，生成预测结果。

执行步骤150，通过计算所述预测结果与所述模拟结果的决定系数R ²来判断这两条曲线的相似程度，得到用于快速预测的长短期记忆网络神经网络模型。所述决定系数R ²的计算公式为

其中，x _j为神经网络模型的预测结果，y _j为数值模拟模型的预测结果，j为样本序号，n为样本总数。所述决定系数R²越接近1，表示所述神经网络模型的预测结果曲线和所述数值模拟模型的预测结果曲线的拟合程度越高。

执行步骤160，将新得到的暴雨-内涝样本输入用于快速预测的长短期记忆网络神经网络模型，进行内涝积水的快速预测。

实施例二

传统暴雨内涝积水的预报预警，主要依赖一二维水动力计算模型。但是，由于城市的日益扩张，地下管网铺设的越发复杂，下垫面微地形的不确定性等等，传统的水文、水动力学模型在计算精度上和实际结果误差较大，在计算速度上，计算缓慢，模型笨重。

本发明将数值模拟模型和人工神经网络相结合，通过数值模拟模型，生成大量的不同降雨条件下的暴雨-内涝样本，并以此样本，训练LSTM神经网络积水预测A模型。训练好以后，将各层的参数移植到基于实测降雨内涝事件的神经网络B模型各层中。虽然B模型的学习样本数很少，但是基于迁移学习算法，模型可以很快得到收敛，而且预测速度很快，精度更高。

人工智能和数值模拟模型相结合的方法，既弥补了数值模拟模型计算效率低的缺点，又满足了人工智能算法对训练样本需求量大的要求，预测精度高、计算速度快，为实现城市内涝快速预测，提供了新思路，为人工智能技术在防洪减灾方向的应用开拓了新的研究方向。

1、技术流程

本申请的技术流程如图2所示。

首先利用数值模型的模拟结果进行学习样本的容量扩充和特征增强，利用扩充后的学习样本对神经网络模型进行预训练，再通过迁移学习技术，将训练好神经网络模型各参数移植到对实测降雨产生内涝的快速预测中，实现内涝积水的快速预测。

基于迁移学习的方法是目前比较前沿的方法，可以将一个神经网络模型应用到一个没有充足数据的领域中。通过大量的样本进行模型的预训练，并将训练好的神经网络模型各层参数，迁移到新的神经网络模型中。再将少量的检测样本，对迁移后的模型进行调整和训练。由于少量的检测样本和大量的训练样本具有相似的特性，因此，迁移后的模型很快就可以收敛，完成训练。迁移学习减少了神经网络模型对训练样本的依赖，适用于将一个神经网络应用到一个没有充足数据、同时又有一个巨大的预先训练的数据池可以供迁移的情况，可以达到很好的预测效果。当前，迁移学习技术主要应用在CNN和RNN等模型中，但是根据问题不同，迁移学习的建模方式可以应用到不同的网络模型中。本发明将迁移学习技术，应用在RNN网络模型的变种模型，LSTM神经网络模型中，并以深圳河湾片区为例，利用该方法对片区内的暴雨内涝进行计算。

经分析计算，基于小样本迁移学习的神经网络模型，和用实测数据训练出来的神经网络模型相比，收敛速度快，计算准确性高；和数值模拟模型相比，计算效率大幅度提高，而且模拟结果误差极小。该方法基于小样本学习技术，将数值模拟模型和AI技术结合在一起，大大缩短了内涝风险预测时间，有效的解决了城市内涝预测预警的时效性问题，为解决城市内涝快速预测预警，提供了新思路，开拓了未来城市暴雨内涝智能化预测的新方向。

2、内涝积水快速预测模型构建

由于实测的暴雨-内涝事件训练样本较少，且质量较差，不能满足神经网络模型对学习样本质和量的要求。因此本发明利用数值模型，通过设置不同的设计降雨条件，生成大量的暴雨-内涝模拟结果，作为学习样本，对LSTM神经网络A模型进行训练。模型训练好以后，将学习到的参数移植到实测暴雨-内涝神经网络模型B中，利用实测的暴雨内涝样本进行学习和预测。经分析计算，基于小样本迁移学习的神经网络模型，和用实测数据训练出来的神经网络模型相比，收敛速度快，计算准确性高；和数值模拟模型相比，计算效率大幅度提高，而且模拟结果误差极小。

首先对深圳河湾片区建立数值模拟模型，计算不同降雨过程，下垫面积水点的积水情况。计算结果形成大量的暴雨-内涝样本。利用这些暴雨-内涝样本，如图3所示，河湾片区内的12个典型积水点为对象，分别利用数值模型的模拟结果，首先利用90%的样本训练LSTM神经网络模型，构建内涝积水的神经网络模型。通过大量的样本进行模型的预训练，并将训练好的神经网络模型各层参数，迁移到新的神经网络模型中。再将相对少量的实测降雨-内涝样本，对迁移后的模型进行调整和训练。由于少量的检测样本和大量的训练样本具有相似的特性，因此，迁移后的模型很快就可以收敛，完成训练。

本发明选取长短期记忆网络神经网络模型，即LSTM（Long Short Term Memory,LSTM）神经网络模型对积水情况进行训练和预测。

LSTM（Long Short Term Memory, LSTM)神经网络模型是改进的RNN循环神经网络模型，由Hochreiter & Schmidhuber提出。如图4所示，LSTM对RNN的改进主要体现，LSTM在RNN隐藏层中增加了一个隐藏状态C_t，增加了三个门，遗忘门、输入门和输出门，以解决RNN模型中，梯度消失或者梯度爆炸的问题。(Schmidhuber J et al.,2014)。

遗忘门的输出为f _t，如式（1）所示：

（1）

由式（1）可知，遗忘门的输出f _t由本时序的样本x _t和上一时序隐藏层的输出S _t-1决定，其中σ为激活函数，为sigmoid函数。由于sigmoid函数的输出是处于[0,1]之间，因此遗忘门的输出f _t处于[0,1]之间，表示遗忘上一层隐藏细胞状态的概率。W _f和U _f为模型的矩阵参数，b _f为线性偏置参数。

输入门的输出如式（2）、式（3）所示，其中式（2）中的激活函数为sigmoid函数，式（3）中的激活函数为tanh函数。

（2）

（3）

W _i、U _i、W _a和U _a为线性参数，b _i和b _a为线性偏置参数。

由这两部分输出更新C _t的状态：

（4）

其中，e为Hadamard product。

输出门的输出如式（6）所示，其中激活函数为sigmoid函数：

（5）

则隐含层的输出S _t由输出门的输出o _t和C _t乘积得到：

（6）

则预测输出如式（8）所示，激活函数为sigmoid函数：

（7）

上述公式中W _f，U _f，b _f，W _a，U _a，b _a，W _i，U _i，b _i，W _o，U _o，b _o，V，b _t均为参数，和标准的RNN算法思路一样，LSTM也通过梯度下降法迭代更新所有的参数。

积水点的积水深度主要和积水点所在汇水分区降雨量和该积水点前时序的积水深度有关系，是个多因素时间序列的预测问题，LSTM神经网络模型很适合解决此类问题。本文以图5中12个积水点为研究对象，分别建立内涝积水LSTM神经网络预测模型，输入因素包括积水点5km之内的气象站前3个时序的降雨量和该积水点前3个时序的积水深度，共6个影响因素，输出为未来1个时序该积水点的积水深度，属于LSTM模型中多因素输入，单输出的模型。由前时序的降雨量和积水点的积水深度，预测未来积水深度，通过模型的不断的循环和训练，实现对整个降雨过程中，各积水点积水深度的预测。

训练时，将分别选择暴雨-内涝样本中的90%作为训练样本，以余下的10%作为测试样本。并利用训练好的模型对未参加模型训练的积水过程进行预测。最后通过计算预测数据与模拟数据的决定系数R²来判断这两条曲线的相似程度，决定系数R ²越接近1，这两条曲线的拟合程度越高，也就是神经网络模型的预测结果和数值模型的预测结果越接近。

R ²的计算公式如式8所示。式中x _j和y _j分别表示神经网络模型的预测结果和数值模拟模型的预测结果。

（8）

本发明的模拟结果和数值模型的模拟结果对比，如图5所示。

可以看出，对于各积水点，数值模型模拟出来的积水过程和利用小样本迁移学习LSTM神经网络模型预测出来的，拟合误差非常小，决定系数R ²都在0.9以上。

选择该方法和实际监测的最大积水深度进行对比。选择没有参与训练的2018年8.29暴雨的积水点最大积水深度结果进行预测，经计算，数值模型模拟的最大积水深度和实测值之间的误差为2.92%，基于小样本迁移学习神经网络模型模拟的最大积水深度和实测值之间的误差为1.84%，预测误差降低了1.08%。由此可见，本发明比数值模拟模型的预测误差更小。

在预测时效上，在河湾片区的典型积水点，基于小样本迁移学习的神经网络模型计算一个积水点3h历时的降雨方案，计算耗时仅为0.08秒，而数值模型计算相同的降雨方案，耗时则需数小时。本方法的计算速度比数值模型提高了数万倍。如果计算网格数量增加，数值模型的计算模拟耗时也随之增加，计算效率无法满足实时模拟需求。本文提出的方法，大大节约了计算时间，可有效满足防汛应急工作需要。

为了更好地理解本发明，以上结合本发明的具体实施例做了详细描述，但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改，均仍属于本发明技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。