CN115114842A - 一种基于小样本迁移学习算法的暴雨内涝事件预测方法 - Google Patents
一种基于小样本迁移学习算法的暴雨内涝事件预测方法 Download PDFInfo
- Publication number
- CN115114842A CN115114842A CN202210447536.2A CN202210447536A CN115114842A CN 115114842 A CN115114842 A CN 115114842A CN 202210447536 A CN202210447536 A CN 202210447536A CN 115114842 A CN115114842 A CN 115114842A
- Authority
- CN
- China
- Prior art keywords
- neural network
- model
- network model
- prediction
- rainstorm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000013526 transfer learning Methods 0.000 title claims abstract description 36
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 26
- 238000003062 neural network model Methods 0.000 claims abstract description 66
- 238000004088 simulation Methods 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 32
- 230000015654 memory Effects 0.000 claims abstract description 18
- 230000006403 short-term memory Effects 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims abstract description 8
- 230000007787 long-term memory Effects 0.000 claims abstract description 7
- 238000005516 engineering process Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 18
- 239000000126 substance Substances 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 4
- 241000764238 Isis Species 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 21
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 11
- 238000009825 accumulation Methods 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000013508 migration Methods 0.000 description 5
- 230000005012 migration Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000001970 hydrokinetic effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/08—Fluids
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/14—Force analysis or force optimisation, e.g. static or dynamic forces
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于小样本迁移学习算法的暴雨内涝事件预测方法,包括建立数值模拟模型并生成模拟结果,还包括以下步骤:利用模拟结果进行学习样本的容量扩充和特征增强;利用扩充后的学习样本对长短期记忆网络神经网络模型A进行预训练;将训练好神经网络模型各参数移植到长短期记忆网络神经网络模型B中,并对神经网络模型B进行训练;利用训练好的神经网络模型B对未参加模型训练的积水过程进行预测,生成预测结果;通过计算预测结果与模拟结果的决定系数R2来判断这两条曲线的相似程度,得到用于快速预测的长短期记忆网络神经网络模型;将新得到的暴雨‑内涝样本输入用于快速预测的长短期记忆网络神经网络模型,进行内涝积水的快速预测。
Description
技术领域
本发明涉及水利工程的技术领域,特别是一种基于小样本迁移学习算法的暴雨内涝事件预测方法。
背景技术
近几年,城市出现极端暴雨的频次增多,随着城市规模的扩大和经济的发展,暴雨内涝给城市带来的经济损失也逐年增加,暴雨带来的内涝已经成为影响城市正常运行的主要城市型水灾害。除了提高城市防洪排涝工程标准之外,在暴雨到来之前提前预知、预判、预防城市暴雨风险,及时发布预警信息,也是城市暴雨风险管理工作中需要迫切解决的问题。
以往对城市内涝风险分析的方式,都是利用数值模拟模型,对即将到来的暴雨产生的内涝风险提前模拟评估。随着数值模拟技术的发展和基础数据精度的提高,城市洪涝模拟技术迅速发展,可以对城市内涝进行很好的模拟。但是,城市下垫面情况复杂,需要精细的水文水动力模型模拟,通过水文模型和一维河道模型、二维地表模型以及地下管网模型耦合计算,模拟城市下垫面内涝积水情况。精细的水文水动力模型,模型庞大、耦合复杂,计算效率较低。虽然近几年出现了超级计算机等硬件条件以及GPU并行计算等技术手段,数值模拟计算速度有了大幅度的提升,但是依然无法满足城市防汛应急时效上的需求。
随着大数据和人工智能时代的到来,人工智能技术在各行各业都有了成功的应用,该技术高效、智能,是未来技术发展的主要方向。然而当前绝大部分AI技术的成功应用,离不开大量的高质量标注数据样本的训练。而对于城市暴雨内涝预测这个应用场景来说,暴雨-内涝的学习样本较少,且内涝积水实际监测数据质量较差,AI技术很难应用。
申请公布号为CN107025303A的发明专利申请公开了一种基于迁移学习的城市内涝分析方法,包括:首先根据城市本身特性划分区域;然后利用每个区域内的社交媒体和传感器数据构造特征,并利用多视图学习尽心特征融合。最后利用迁移学习将数据量丰富的大城市内涝知识转移到相对较小的城市,训练小城市的内涝严重程度模型。该迁移方法是将研究对象进行了迁移。但是大城市和小城市之间学习样本差别很大,从降雨条件、到下垫面的产汇流关系,差别都非常大。将大城市训练好的网络模型,迁移到小城市,具有很大的不确定性。迁移后的模型,收敛速度、预测精度也不会有很大的提高。
发明内容
为了解决上述的技术问题,本发明提出的一种基于小样本迁移学习算法的暴雨内涝事件预测方法,在分析、对比深度学习的迁移学习的小样本学习技术、数据增强的小样本学习的基础上,结合数值模拟模型,提出适用于城市暴雨-内涝的深度学习小样本学习技术。
本发明的目的是提供一种基于小样本迁移学习算法的暴雨内涝事件预测方法,包括建立数值模拟模型并生成模拟结果,还包括以下步骤:
步骤1:利用所述模拟结果进行学习样本的容量扩充和特征增强;
步骤2:利用扩充后的所述学习样本对长短期记忆网络神经网络模型A进行预训练;
步骤3:通过迁移学习技术,将训练好神经网络模型各参数移植到长短期记忆网络神经网络模型B中,选择暴雨-内涝样本中的90%作为训练样本对所述长短期记忆网络神经网络模型B进行训练;
步骤4:利用训练好的所述长短期记忆网络神经网络模型B对未参加模型训练的积水过程进行预测,生成预测结果;
步骤5:通过计算所述预测结果与所述模拟结果的决定系数R 2来判断这两条曲线的相似程度,得到用于快速预测的长短期记忆网络神经网络模型;
步骤6:将新得到的暴雨-内涝样本输入用于快速预测的长短期记忆网络神经网络模型,进行内涝积水的快速预测。
优选的是,所述长短期记忆网络神经网络模型在RNN隐藏层中增加隐藏状态C t 、遗忘门、输入门和输出门。
在上述任一方案中优选的是,所述遗忘门的输出为f t ,公式为
其中,σ为激活函数,W f 和U f 为模型的矩阵参数,S t-1为上一时序隐藏层的输出,x t 为本时序的样本,b f 为线性偏置参数。
在上述任一方案中优选的是,所述输入门的输出为i t 和a t ,公式为
其中,tanh为激活函数,W i 、U i 、W a 和U a 为线性参数,b i 和b a 为线性偏置参数。
在上述任一方案中优选的是,根据所述输出门的输出i t 和a t 更新C t 的状态,公式为
其中,C t-1为上一时间的隐藏状态,e为阿达玛积。
在上述任一方案中优选的是,所述输出门的输出为o t ,公式为
其中,W o 和U o 为线性参数,b o 为线性偏置参数。
在上述任一方案中优选的是,所述RNN隐藏层的输出S t 由所述输出门的输出o t 和C t 乘积得到,
其中,V为线性参数,b t 为线性偏置参数。
在上述任一方案中优选的是,所述决定系数R 2的计算公式为
其中,x j 为神经网络模型的预测结果,y j 为数值模拟模型的预测结果,j为样本序号,n为样本总数。
在上述任一方案中优选的是,所述决定系数R2越接近1,表示所述神经网络模型的预测结果曲线和所述数值模拟模型的预测结果曲线的拟合程度越高。
本发明提出了一种基于小样本迁移学习算法的暴雨内涝事件预测方法,利用人工智能和数值模拟模型相结合的方法,既弥补了数值模拟模型计算效率低的缺点,又满足了人工智能算法对训练样本需求量大的要求,预测精度高、计算速度快,为实现城市内涝快速预测,提供了新思路,为人工智能技术在防洪减灾方向的应用开拓了新的研究方向。
附图说明
图1为按照本发明的基于小样本迁移学习算法的暴雨内涝事件预测方法的一优选实施例的流程图。
图2为按照本发明的基于小样本迁移学习算法的暴雨内涝事件预测方法的另一优选实施例的技术流程图。
图3为按照本发明的基于小样本迁移学习算法的暴雨内涝事件预测方法的一优选实施例的典型积水点分布示意图。
图4为按照本发明的基于小样本迁移学习算法的暴雨内涝事件预测方法的长短期记忆网络神经网络模型的一实施例的结构示意图。
图5为按照本发明的基于小样本迁移学习算法的暴雨内涝事件预测方法的神经网络模型的预测结果和数值模拟模型的预测结果的一实施例的对比示意图。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的阐述。
实施例一
如图1所示,执行步骤100,建立数值模拟模型并生成模拟结果。
执行步骤110,利用所述模拟结果进行学习样本的容量扩充和特征增强。
执行步骤120,利用扩充后的所述学习样本对长短期记忆网络神经网络模型A进行预训练。所述长短期记忆网络神经网络模型在RNN隐藏层中增加隐藏状态C t 、遗忘门、输入门和输出门。
所述遗忘门的输出为f t ,公式为
其中,σ为激活函数,W f 和U f 为模型的矩阵参数,S t-1为上一时序隐藏层的输出,x t 为本时序的样本,b f 为线性偏置参数。
所述输入门的输出为i t 和a t ,公式为
其中,tanh为激活函数,W i 、U i 、W a 和U a 为线性参数,b i 和b a 为线性偏置参数。
根据所述输出门的输出i t 和a t 更新C t 的状态,公式为
其中,C t-1为上一时间的隐藏状态,e为阿达玛积。
所述输出门的输出为o t ,公式为
其中,W o 和U o 为线性参数,b o 为线性偏置参数。
所述RNN隐藏层的输出S t 由所述输出门的输出o t 和C t 乘积得到,
其中,V为线性参数,b t 为线性偏置参数。
执行步骤130,通过迁移学习技术,将训练好神经网络模型各参数移植到长短期记忆网络神经网络模型B中,选择暴雨-内涝样本中的90%作为训练样本对所述长短期记忆网络神经网络模型B进行训练。
执行步骤140,利用训练好的所述长短期记忆网络神经网络模型B对未参加模型训练的积水过程进行预测,生成预测结果。
执行步骤150,通过计算所述预测结果与所述模拟结果的决定系数R 2来判断这两条曲线的相似程度,得到用于快速预测的长短期记忆网络神经网络模型。所述决定系数R 2的计算公式为
其中,x j 为神经网络模型的预测结果,y j 为数值模拟模型的预测结果,j为样本序号,n为样本总数。所述决定系数R2越接近1,表示所述神经网络模型的预测结果曲线和所述数值模拟模型的预测结果曲线的拟合程度越高。
执行步骤160,将新得到的暴雨-内涝样本输入用于快速预测的长短期记忆网络神经网络模型,进行内涝积水的快速预测。
实施例二
传统暴雨内涝积水的预报预警,主要依赖一二维水动力计算模型。但是,由于城市的日益扩张,地下管网铺设的越发复杂,下垫面微地形的不确定性等等,传统的水文、水动力学模型在计算精度上和实际结果误差较大,在计算速度上,计算缓慢,模型笨重。
本发明将数值模拟模型和人工神经网络相结合,通过数值模拟模型,生成大量的不同降雨条件下的暴雨-内涝样本,并以此样本,训练LSTM神经网络积水预测A模型。训练好以后,将各层的参数移植到基于实测降雨内涝事件的神经网络B模型各层中。虽然B模型的学习样本数很少,但是基于迁移学习算法,模型可以很快得到收敛,而且预测速度很快,精度更高。
人工智能和数值模拟模型相结合的方法,既弥补了数值模拟模型计算效率低的缺点,又满足了人工智能算法对训练样本需求量大的要求,预测精度高、计算速度快,为实现城市内涝快速预测,提供了新思路,为人工智能技术在防洪减灾方向的应用开拓了新的研究方向。
1、技术流程
本申请的技术流程如图2所示。
首先利用数值模型的模拟结果进行学习样本的容量扩充和特征增强,利用扩充后的学习样本对神经网络模型进行预训练,再通过迁移学习技术,将训练好神经网络模型各参数移植到对实测降雨产生内涝的快速预测中,实现内涝积水的快速预测。
基于迁移学习的方法是目前比较前沿的方法,可以将一个神经网络模型应用到一个没有充足数据的领域中。通过大量的样本进行模型的预训练,并将训练好的神经网络模型各层参数,迁移到新的神经网络模型中。再将少量的检测样本,对迁移后的模型进行调整和训练。由于少量的检测样本和大量的训练样本具有相似的特性,因此,迁移后的模型很快就可以收敛,完成训练。迁移学习减少了神经网络模型对训练样本的依赖,适用于将一个神经网络应用到一个没有充足数据、同时又有一个巨大的预先训练的数据池可以供迁移的情况,可以达到很好的预测效果。当前,迁移学习技术主要应用在CNN和RNN等模型中,但是根据问题不同,迁移学习的建模方式可以应用到不同的网络模型中。本发明将迁移学习技术,应用在RNN网络模型的变种模型,LSTM神经网络模型中,并以深圳河湾片区为例,利用该方法对片区内的暴雨内涝进行计算。
经分析计算,基于小样本迁移学习的神经网络模型,和用实测数据训练出来的神经网络模型相比,收敛速度快,计算准确性高;和数值模拟模型相比,计算效率大幅度提高,而且模拟结果误差极小。该方法基于小样本学习技术,将数值模拟模型和AI技术结合在一起,大大缩短了内涝风险预测时间,有效的解决了城市内涝预测预警的时效性问题,为解决城市内涝快速预测预警,提供了新思路,开拓了未来城市暴雨内涝智能化预测的新方向。
2、内涝积水快速预测模型构建
由于实测的暴雨-内涝事件训练样本较少,且质量较差,不能满足神经网络模型对学习样本质和量的要求。因此本发明利用数值模型,通过设置不同的设计降雨条件,生成大量的暴雨-内涝模拟结果,作为学习样本,对LSTM神经网络A模型进行训练。模型训练好以后,将学习到的参数移植到实测暴雨-内涝神经网络模型B中,利用实测的暴雨内涝样本进行学习和预测。经分析计算,基于小样本迁移学习的神经网络模型,和用实测数据训练出来的神经网络模型相比,收敛速度快,计算准确性高;和数值模拟模型相比,计算效率大幅度提高,而且模拟结果误差极小。
首先对深圳河湾片区建立数值模拟模型,计算不同降雨过程,下垫面积水点的积水情况。计算结果形成大量的暴雨-内涝样本。利用这些暴雨-内涝样本,如图3所示,河湾片区内的12个典型积水点为对象,分别利用数值模型的模拟结果,首先利用90%的样本训练LSTM神经网络模型,构建内涝积水的神经网络模型。通过大量的样本进行模型的预训练,并将训练好的神经网络模型各层参数,迁移到新的神经网络模型中。再将相对少量的实测降雨-内涝样本,对迁移后的模型进行调整和训练。由于少量的检测样本和大量的训练样本具有相似的特性,因此,迁移后的模型很快就可以收敛,完成训练。
本发明选取长短期记忆网络神经网络模型,即LSTM(Long Short Term Memory,LSTM)神经网络模型对积水情况进行训练和预测。
LSTM(Long Short Term Memory, LSTM)神经网络模型是改进的RNN循环神经网络模型,由Hochreiter & Schmidhuber提出。如图4所示,LSTM对RNN的改进主要体现,LSTM在RNN隐藏层中增加了一个隐藏状态Ct,增加了三个门,遗忘门、输入门和输出门,以解决RNN模型中,梯度消失或者梯度爆炸的问题。(Schmidhuber J et al.,2014)。
遗忘门的输出为f t ,如式(1)所示:
由式(1)可知,遗忘门的输出f t 由本时序的样本x t 和上一时序隐藏层的输出S t-1决定,其中σ为激活函数,为sigmoid函数。由于sigmoid函数的输出是处于[0,1]之间,因此遗忘门的输出f t 处于[0,1]之间,表示遗忘上一层隐藏细胞状态的概率。W f 和U f 为模型的矩阵参数,b f 为线性偏置参数。
输入门的输出如式(2)、式(3)所示,其中式(2)中的激活函数为sigmoid函数,式(3)中的激活函数为tanh函数。
W i 、U i 、W a 和U a 为线性参数,b i 和b a 为线性偏置参数。
由这两部分输出更新C t 的状态:
其中,e为Hadamard product。
输出门的输出如式(6)所示,其中激活函数为sigmoid函数:
则隐含层的输出S t 由输出门的输出o t 和C t 乘积得到:
则预测输出如式(8)所示,激活函数为sigmoid函数:
上述公式中W f ,U f ,b f ,W a ,U a ,b a ,W i ,U i ,b i ,W o ,U o ,b o ,V,b t 均为参数,和标准的RNN算法思路一样,LSTM也通过梯度下降法迭代更新所有的参数。
积水点的积水深度主要和积水点所在汇水分区降雨量和该积水点前时序的积水深度有关系,是个多因素时间序列的预测问题,LSTM神经网络模型很适合解决此类问题。本文以图5中12个积水点为研究对象,分别建立内涝积水LSTM神经网络预测模型,输入因素包括积水点5km之内的气象站前3个时序的降雨量和该积水点前3个时序的积水深度,共6个影响因素,输出为未来1个时序该积水点的积水深度,属于LSTM模型中多因素输入,单输出的模型。由前时序的降雨量和积水点的积水深度,预测未来积水深度,通过模型的不断的循环和训练,实现对整个降雨过程中,各积水点积水深度的预测。
训练时,将分别选择暴雨-内涝样本中的90%作为训练样本,以余下的10%作为测试样本。并利用训练好的模型对未参加模型训练的积水过程进行预测。最后通过计算预测数据与模拟数据的决定系数R2来判断这两条曲线的相似程度,决定系数R 2越接近1,这两条曲线的拟合程度越高,也就是神经网络模型的预测结果和数值模型的预测结果越接近。
R 2的计算公式如式8所示。式中x j 和y j 分别表示神经网络模型的预测结果和数值模拟模型的预测结果。
本发明的模拟结果和数值模型的模拟结果对比,如图5所示。
可以看出,对于各积水点,数值模型模拟出来的积水过程和利用小样本迁移学习LSTM神经网络模型预测出来的,拟合误差非常小,决定系数R 2都在0.9以上。
选择该方法和实际监测的最大积水深度进行对比。选择没有参与训练的2018年8.29暴雨的积水点最大积水深度结果进行预测,经计算,数值模型模拟的最大积水深度和实测值之间的误差为2.92%,基于小样本迁移学习神经网络模型模拟的最大积水深度和实测值之间的误差为1.84%,预测误差降低了1.08%。由此可见,本发明比数值模拟模型的预测误差更小。
在预测时效上,在河湾片区的典型积水点,基于小样本迁移学习的神经网络模型计算一个积水点3h历时的降雨方案,计算耗时仅为0.08秒,而数值模型计算相同的降雨方案,耗时则需数小时。本方法的计算速度比数值模型提高了数万倍。如果计算网格数量增加,数值模型的计算模拟耗时也随之增加,计算效率无法满足实时模拟需求。本文提出的方法,大大节约了计算时间,可有效满足防汛应急工作需要。
为了更好地理解本发明,以上结合本发明的具体实施例做了详细描述,但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。
Claims (10)
1.一种基于小样本迁移学习算法的暴雨内涝事件预测方法,包括建立数值模拟模型并生成模拟结果,其特征在于,还包括以下步骤:
步骤1:利用所述模拟结果进行学习样本的容量扩充和特征增强;
步骤2:利用扩充后的所述学习样本对长短期记忆网络神经网络模型A进行预训练;
步骤3:通过迁移学习技术,将训练好神经网络模型各参数移植到长短期记忆网络神经网络模型B中,选择暴雨-内涝样本中的90%作为训练样本对所述长短期记忆网络神经网络模型B进行训练;
步骤4:利用训练好的所述长短期记忆网络神经网络模型B对未参加模型训练的积水过程进行预测,生成预测结果;
步骤5:通过计算所述预测结果与所述模拟结果的决定系数R 2来判断这两条曲线的相似程度,得到用于快速预测的长短期记忆网络神经网络模型;
步骤6:将新得到的暴雨-内涝样本输入用于快速预测的长短期记忆网络神经网络模型,进行内涝积水的快速预测。
2.如权利要求1所述的基于小样本迁移学习算法的暴雨内涝事件预测方法,其特征在于,所述长短期记忆网络神经网络模型在RNN隐藏层中增加隐藏状态C t 、遗忘门、输入门和输出门。
10.如权利要求9所述的基于小样本迁移学习算法的暴雨内涝事件预测方法,其特征在于,所述决定系数R2越接近1,表示所述神经网络模型的预测结果曲线和所述数值模拟模型的预测结果曲线的拟合程度越高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210447536.2A CN115114842A (zh) | 2022-04-27 | 2022-04-27 | 一种基于小样本迁移学习算法的暴雨内涝事件预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210447536.2A CN115114842A (zh) | 2022-04-27 | 2022-04-27 | 一种基于小样本迁移学习算法的暴雨内涝事件预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115114842A true CN115114842A (zh) | 2022-09-27 |
Family
ID=83326394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210447536.2A Pending CN115114842A (zh) | 2022-04-27 | 2022-04-27 | 一种基于小样本迁移学习算法的暴雨内涝事件预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115114842A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117932347A (zh) * | 2024-03-22 | 2024-04-26 | 四川大学 | 基于对抗性迁移学习的小样本时序预测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111222698A (zh) * | 2020-01-06 | 2020-06-02 | 重庆邮电大学 | 面向物联网的基于长短时记忆网络的积水水位预测方法 |
CN111368058A (zh) * | 2020-03-09 | 2020-07-03 | 昆明理工大学 | 一种基于迁移学习的问答匹配方法 |
CN112784336A (zh) * | 2020-12-31 | 2021-05-11 | 杭州鲁尔物联科技有限公司 | 一种基于深度学习lstm网络的桥梁静态位移预测技术 |
CN113344305A (zh) * | 2021-08-05 | 2021-09-03 | 中国水利水电科学研究院 | 一种暴雨内涝事件的快速预测方法 |
CN114254826A (zh) * | 2021-12-21 | 2022-03-29 | 中国石油大学(华东) | 基于迁移学习的油田产油量预测方法 |
-
2022
- 2022-04-27 CN CN202210447536.2A patent/CN115114842A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111222698A (zh) * | 2020-01-06 | 2020-06-02 | 重庆邮电大学 | 面向物联网的基于长短时记忆网络的积水水位预测方法 |
CN111368058A (zh) * | 2020-03-09 | 2020-07-03 | 昆明理工大学 | 一种基于迁移学习的问答匹配方法 |
CN112784336A (zh) * | 2020-12-31 | 2021-05-11 | 杭州鲁尔物联科技有限公司 | 一种基于深度学习lstm网络的桥梁静态位移预测技术 |
CN113344305A (zh) * | 2021-08-05 | 2021-09-03 | 中国水利水电科学研究院 | 一种暴雨内涝事件的快速预测方法 |
CN114254826A (zh) * | 2021-12-21 | 2022-03-29 | 中国石油大学(华东) | 基于迁移学习的油田产油量预测方法 |
Non-Patent Citations (2)
Title |
---|
夏静等: "基于迁移学习的小样本重症疾病预后模型", 《生物医学工程学杂志》 * |
王宇飞等: "基于参数迁移的蒙汉神经机器翻译模型", 《计算机应用与软件》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117932347A (zh) * | 2024-03-22 | 2024-04-26 | 四川大学 | 基于对抗性迁移学习的小样本时序预测方法及系统 |
CN117932347B (zh) * | 2024-03-22 | 2024-06-11 | 四川大学 | 基于对抗性迁移学习的pm2.5预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113344305B (zh) | 一种暴雨内涝事件的快速预测方法 | |
CN109142171B (zh) | 基于特征扩张的融合神经网络的城市pm10浓度预测方法 | |
Hung et al. | An artificial neural network model for rainfall forecasting in Bangkok, Thailand | |
CN109711617B (zh) | 一种基于blstm深度学习的中长期径流预测方法 | |
CN109840587B (zh) | 基于深度学习的水库入库流量预测方法 | |
CN111767517B (zh) | 一种应用于洪水预测的BiGRU多步预测方法、系统及存储介质 | |
CN116258608B (zh) | 融合gis和bim三维技术的水利实时监测信息管理系统 | |
CN114693005B (zh) | 基于卷积傅里叶神经网络的三维地下油藏动态预测方法 | |
CN105678417A (zh) | 一种施工隧道撑子面涌水量预测方法及装置 | |
Fei et al. | Research on tunnel engineering monitoring technology based on BPNN neural network and MARS machine learning regression algorithm | |
CN107133686A (zh) | 基于时空数据模型的城市级pm2.5浓度预测方法 | |
CN116702627B (zh) | 一种基于深度卷积神经网络的城市暴雨内涝快速模拟方法 | |
CN115496015B (zh) | 一种基于流量梯度变化的水动力分析决策方法 | |
KR20220057740A (ko) | 순환신경망을 이용한 하천 지역 침수 예측 방법 | |
CN116050628A (zh) | 一种基于数字孪生的考虑预报不确定性的水库防洪优化调度方法 | |
LU505595B1 (en) | Multi-step flood forecasting method and device based on gru-seq2seq | |
CN115310532A (zh) | 一种基于时空关联混合深度学习模型的流域多点预测预警方法 | |
CN110163419B (zh) | 一种中小河流流域洪水预报的方法 | |
CN115114842A (zh) | 一种基于小样本迁移学习算法的暴雨内涝事件预测方法 | |
CN115329656A (zh) | 一种基于改进卷积神经网络的城市内涝积水分布快速预测方法 | |
Santos et al. | An artificial intelligence method for improving upscaling in complex reservoirs | |
CN117636183A (zh) | 一种基于自监督预训练的小样本遥感图像分类方法 | |
CN117648878A (zh) | 一种基于1d-cnn算法的洪水快速演进及淹没模拟方法 | |
CN111914488A (zh) | 一种基于对抗神经网络的有资料地区水文参数率定方法 | |
CN116384814A (zh) | 基于机器学习对多因素影响下机场跑道容量的评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |