CN111815037A - 一种基于注意力机制的可解释性短临极端降雨预测方法 - Google Patents
一种基于注意力机制的可解释性短临极端降雨预测方法 Download PDFInfo
- Publication number
- CN111815037A CN111815037A CN202010587176.7A CN202010587176A CN111815037A CN 111815037 A CN111815037 A CN 111815037A CN 202010587176 A CN202010587176 A CN 202010587176A CN 111815037 A CN111815037 A CN 111815037A
- Authority
- CN
- China
- Prior art keywords
- rainfall
- short
- model
- attention mechanism
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007246 mechanism Effects 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 42
- 239000011159 matrix material Substances 0.000 claims abstract description 31
- 230000007787 long-term memory Effects 0.000 claims abstract description 10
- 230000006403 short-term memory Effects 0.000 claims abstract description 10
- 238000007637 random forest analysis Methods 0.000 claims abstract description 7
- 230000008569 process Effects 0.000 claims abstract description 5
- 238000012216 screening Methods 0.000 claims abstract description 5
- 238000001556 precipitation Methods 0.000 claims description 35
- 238000003066 decision tree Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 14
- 230000015654 memory Effects 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 6
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012800 visualization Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 210000004027 cell Anatomy 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000013138 pruning Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 5
- 238000013528 artificial neural network Methods 0.000 abstract description 3
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 238000011160 research Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 3
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 241000764238 Isis Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000005442 atmospheric precipitation Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 239000003673 groundwater Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Educational Administration (AREA)
- Biophysics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Environmental & Geological Engineering (AREA)
- Atmospheric Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Ecology (AREA)
- Environmental Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种基于注意力机制的可解释性短临极端降雨预测方法,首先通过随机森林对使用参数进行筛选,然后计算待测站点的标准降水指数(SPI),将标准降水指数和所选参数组成新的矩阵输入到长短期记忆网络中进行训练,并在神经网络中加入注意力机制,在训练过程中对注意力机制的权重计算进行可视化,最后以3小时为单位,可预测目标地区未来3、6、9、12小时的降雨量,预测过程中使用注意力机制针对短临强降雨的情况进行了优化,提高了模型针对极端天气的预测能力,同时也增强了模型的可解释性。
Description
技术领域
本发明涉及降雨预测领域,尤其是一种基于注意力机制的可解释性短临极端降雨预测方法。
背景技术
大气降水是全球水循环的重要组成部分,特别是在干旱和半干旱地区,降雨是主要的供水来源。研究降雨预报对经济发展和提升人民的生活质量具有重大意义。降雨预报的类别按照预报时间来划分一般分为四类,短临预报、短期预报、中期预报和长期预报,其中短临预报可以预警泥石流等灾害的发生,同时指导当地的交通及人们的出行。另外,气象条件的变异性、多样性和复杂性使得极端降雨的情况难以预测,这给降雨预报工作带来了巨大困难。现有方法往往存在短临强降雨预测不准确的情况,如何提高对这种极端气候的预测精度成为气象领域研究的热点话题。
近年来,机器学习广泛应用于降雨预测,文献[付明明.ARIMA模型在新疆喀什地区中长期降水量预测中的应用研究[J].地下水,2019,第41卷(3):142-144.]中利用ARIMA模型预测了新疆喀什地区的年降水量,从空间的角度分析了降水的总体分布。文献[周雨婷,王栋,王远坤,王文鹏,孟德青.典型降水预报ANN多指标优选——以太湖湖西区为例[J].水文,2020,40(01):35-39.]利用多种人工神经网络对五个地区的年降水量进行预测,通过多种指标筛选出GRNN为最优神经网络。然而由于预测的时间跨度较长,对于短时降雨量没有指导意义。文献[张鹏程,贾旸旸.一种基于多层感知器的动态区域联合短时降水预报方法[J].计算机应用与软件,2018,第35卷(11):153-158,183.]利用多层感知器,结合周围站点的气象状态对目标站点进行3小时内的降雨预测,结果表明,多层感知器具有良好的预测能力。然而,对于该地的气候特征难以适用于全部地区,因此模型对于短时强降雨的情况预测准确率较低,泛化能力较为薄弱。
发明内容
发明目的:针对现有技术中存在的问题和不足,为了提高模型的预测精度和预测效率,本发明提供一种基于注意力机制的可解释性短临极端降雨预测方法,它克服了短时极端降雨预测不精确、模型训练时间长的特点,并通过对注意力机制权重的可视化有效增强了模型的可解释性。
技术方案:为实现上述发明目的,本发明所述的一种基于注意力机制的短临极端降雨预测方法,包括如下步骤:
(1)收集气象站点的观测数据并对得到的数据集进行筛选和数据清洗;
(2)利用随机森林算法计算气象站点观测得到的气象因子和降雨量的相关性,并对因子的重要性排序,选择最重要的若干因子;
(3)计算待测站点的标准降水指数;
(4)将参数融合形成新的矩阵;
(5)将筛选后的气象因子参数值和标准降水指数归一化后输入到带有注意力机制的长短期记忆网络中进行训练;
(6)模型训练好后进行注意力机制可视化并预测降雨值。
所述步骤(1)是筛选数据集和对数据集进行简单的清洗,所述步骤(1)进一步为:
(11)从气象局获取各个站点的气象观测数据,以地面站点的观测数据作为依据;地面观测数据包括总云量、风向、风速、海平面气压、3小时变压、6小时降水、低云量、低云高、露点、温度和能见度因子;
(12)将数据集根据年份分为训练数据和测试数据两部分;
(13)清洗数据,将数据中存在缺失的,含有异常值的相关数据去除。
所述步骤(2)中对降雨量密切相关的气象因子进行筛选,所述步骤(2)进一步为:
(21)从训练数据集中随机选出M个样本,然后放回,进行N次取样,每一次取样生成一个训练集,得到N个训练集;M为设定的训练集中的样本数量,N为设定的训练集数量;
(22)对于每一个训练集,训练一个决策树模型;
(23)对于单个决策树模型,在每次分裂时根据基尼指数选择最好的特征进行分裂;
(24)每一个决策树模型持续分裂,直到节点的所有训练样例都属于同一类;在分裂的过程中保留决策树的完整性,不对决策树进行剪枝操作;
(25)生成的N棵决策树组成随机森林,按多棵树分类器投票决定每个因子最终的权重大小;
(26)计算出每个因子的影响权重后,按照权重大小对相关因子进行降序排序,选出影响最大的5个因子作为模型的实验因子。
目标站点的地理位置一定程度上影响着降雨的量级和频率,季风性气候的区域降雨往往集中在一段时间内。标准化降水指数可以反映该地区一段时间内的降水变化的特点,因此,研究待测站点的降水特点可以有效的调高模型对于强降雨或极端降雨样本的预测能力,所属步骤(3)进一步为:
(32)采用极大似然法估计参数α与β;
(34)累计概率H(x)转换成标准正态分布函数,计算待测站点的标准降水指数SPI值;当0<H(x)≤0.5时:式中当0.5<H(x)<1时:式中,两式中c0=2.515517,c1=0.8028,c2=0.010328,d1=1.432788,d2=0.189269,d3=0.001308。
所述步骤(4)中将因子整合成一个矩阵,所述步骤4进一步为:
步骤(5)将长短期记忆网络中加入注意力机制,对模型进行训练,所述步骤5进一步为:
(51)初始化长短期记忆网络LSTM的权值和偏置参数;
(53)计算注意力机制的权重, 其中,为第s个因子在时间t时刻的权重,为注意力参数;Ct=ft*Ct-1+it*ct, W1,W2,Wf,Wi,Wc表示权重矩阵系数矩阵,bf,bc,bi是偏置项,·表示矩阵的乘积,*表示元素的乘积,[,]表示两个元素在水平方向上拼接为一个长向量,长短期记忆网络的神经元在t时刻的状态为Ct,输入门为it,遗忘门为ft,当前输入的单元状态为ct,经过注意力加权得到的输出序列
(55)利用批量梯度下降法计算网络的损失函数值,循环执行步骤(52)到步骤(54),更新长短期记忆网络的权值和偏置参数,待模型迭代稳定后结束模型的训练。步骤(6)待模型训练结束后,将测试集的数据输入到模型中,并记录每一时刻的注意力机制权值并进行可视化,最后输出预测的降雨值。所述步骤6进一步为:
(61)待模型训练稳定后,将测试集的数据输入到模型中,同时对模型中注意力机制计算的权重进行可视化,记录每一时刻注意力机制得到的权重值并以图的形式展示,图的横坐标为输入模型的每个因子,包括步骤(2)筛选的气象因子以及标准降水指数,纵坐标为历史时刻,不同的权重值通过颜色块来表示,颜色越深代表权重的值越大;
(62)模型输出目标站点未来3小时内的降雨值。
有益效果:本发明提供的一种基于注意力机制的可解释性短临极端降雨预测方法,与现有技术相比,本发明的优点在于:考虑了目标站点的气候特征,克服了单个站点短时间内对极端降雨预报不准确的特点,同时,长短期记忆网络存在信息丢失的问题,本方法通过加入注意力机制可以对降雨影响较大的因子赋予更高的权重,强化对于重要因子的学习能力,提高模型对于极端降雨的预测精度。另外,对注意力机制的可视化展示也增强了模型的可解释性。本发明的模型效果在全国92个气象站点得到了验证,增强了模型的泛化能力。
附图说明
图1为本发明实施例的整体步骤图;
图2为本发明具体示例的方法流程图;
图3为本发明实施例中的带有注意力机制的网络结构示意图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,本发明实施例公开的一种基于注意力机制的可解释性短临极端降雨预测方法,主要包括如下步骤:
步骤1:收集气象站点的观测数据并对得到的数据集进行筛选和数据清洗;
步骤2:利用随机森林算法计算气象站点观测得到的气象因子和降雨量的相关性,并对因子的重要性排序,选择最重要的若干因子;
步骤3:计算待测站点的标准降水指数;
步骤4:将参数融合形成新的矩阵;
步骤5:将筛选后的气象因子参数值和标准降水指数归一化后输入到带有注意力机制的长短期记忆网络中进行训练;
步骤6:待模型稳定后进行注意力机制可视化并预测降雨值。
如图2所示,本发明实施例公开的一种基于注意力机制的可解释性短临极端降雨预测方法,具体步骤如下:
步骤1:获取气象站点观测得到的气象数据,由于一些物理和人为因素的影响,数据存在异常或者缺失的问题,所以需要对数据进行清洗,筛选出数据段较为完整的标签数据作为输入数据,从数据的角度提升模型预测的准确性,具体步骤如下:
步骤11:从气象局获取各个站点的气象观测数据,以地面站点的观测数据作为主要依据。地面观测数据包括总云量、风向、风速、海平面气压、3小时变压、6小时降水、低云量、低云高、露点、温度和能见度因子;
步骤12:将数据集根据年份分为训练数据和测试数据两部分;
步骤13:初步清洗数据,将数据中存在缺失的,含有异常值的相关数据去除。
步骤2:选择和确定与降雨密切相关的气象因子,这一步主要是为了将模型的主要算力集中在对影响较大的几个气象因子上,减少了模型的计算量和训练时间,同时也可以排除干扰因子的对于模型结果的影响。具体步骤如下:
步骤21:从原始训练集中使用自助法(Bootstraping)随机选出M个样本,然后放回,进行N次取样,每一次取样生成一个训练集,得到N个训练集;本例中,随机选出100000个样本,随机进行1000次取样,生成1000个训练集,每个训练集中有100个样本;
步骤22:对于每一个训练集,训练一个决策树模型;
步骤24:每一个决策树模型持续分裂,直到该节点的所有训练样例都属于同一类。在分裂的过程中保留决策树的完整性,不对决策树进行剪枝操作;
步骤25:生成的n棵决策树组成随机森林,按多棵树分类器投票决定每个因子最终的权重大小;
步骤26:计算出每个因子的影响权重后,按照权重大小对相关因子进行降序排序,选出影响最大的5个因子作为模型的实验因子。本实验影响最大的5个因子为风向、风速、云量、温度、露点。
步骤3:模型对于样本量较少的极端降雨存在预报准确率较低的情况,极端降雨的形成与目标站点的气候情况相关,步骤2中筛选的因子是即时性的气象指标,并不能反映目标站点的气候特征。计算标准降水指数可以反映目标站点在一段时间内的降雨量情况,有效提升强降雨等小样本事件预测准确率。具体步骤如下:
步骤34:累计概率H(x)转换成标准正态分布函数,计算待测站点的SPI值。当0<H(x)≤0.5时:式中当0.5<H(x)<1时:式中,两式中c0=2.515517,c1=0.8028,c2=0.010328,d1=1.432788,d2=0.189269,d3=0.001308。
步骤4:将筛选出的5个因子和标准降水指数整合到一个矩阵中,方便模型训练,具体步骤如下:
步骤5:增加注意力机制可以有效的解决长短期记忆网络中存在的长距离信息弱化问题,注意力机制可以对影响降雨较大的因子强化训练,不丢失重要的信息,提升了模型的准确率。如图3所示,具体步骤如下:
步骤51:初始化长短期记忆网络LSTM的权值和偏置参数;
步骤53:计算注意力机制的权重, 其中,为第s个因子在时间t时刻的权重,为注意力参数;Ct=ft*Ct-1+it*ct, W1,W2,Wf,Wi,Wc表示权重矩阵系数矩阵,bf,bc,bi是偏置项,·表示矩阵的乘积,*表示元素的乘积,[,]表示两个元素在水平方向上拼接为一个长向量,长短期记忆网络的神经元在t时刻的状态为Ct,输入门为it,遗忘门为ft,当前输入的单元状态为ct,经过注意力加权得到的输出序列
步骤55:利用批量梯度下降法计算网络的损失函数值,循环执行步骤52到步骤54,更新长短期记忆网络的权值和偏置参数1000次,待模型迭代稳定后结束模型的训练。
步骤6:注意力机制可视化可以直观地展现重要因子对于降雨量的影响,增加对模型的可解释性。在训练稳定后,模型输出未来3小时内的降雨值。具体步骤如下:
步骤61:待模型训练稳定后,将测试集的数据输入到模型中,同时对模型中注意力机制计算的权重进行可视化,记录每一时刻注意力机制得到的权重值并以图的形式展示。图的横坐标为输入模型的每个因子,纵坐标为历史时刻,不同的权重值通过颜色块来表示,颜色越深代表权重的值越大;
步骤62:模型输出目标站点未来3小时内的降雨值,其中,未来6、9、12小时的降雨值可以通过多段3小时预测得到的降雨值进行拼接。
Claims (7)
1.一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,包括如下步骤:
(1)收集气象站点的观测数据并对得到的数据集进行筛选和数据清洗;
(2)利用随机森林算法计算气象站点观测得到的气象因子和降雨量的相关性,并对因子的重要性排序,选择最重要的若干因子;
(3)计算待测站点的标准降水指数;
(4)将参数融合形成新的矩阵;
(5)将筛选后的气象因子参数值和标准降水指数归一化后输入到带有注意力机制的长短期记忆网络中进行训练;
(6)模型训练好后进行注意力机制可视化并预测降雨值。
2.根据权利要求1所述的一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,所述步骤(1)包括:
(11)从气象局获取各个站点的气象观测数据,以地面站点的观测数据作为依据;地面观测数据包括总云量、风向、风速、海平面气压、3小时变压、6小时降水、低云量、低云高、露点、温度和能见度因子;
(12)将数据集根据年份分为训练数据和测试数据两部分;
(13)清洗数据,将数据中存在缺失的,含有异常值的相关数据去除。
3.根据权利要求1所述的一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,所述步骤(2)包括:
(21)从训练数据集中随机选出M个样本,然后放回,进行N次取样,每一次取样生成一个训练集,得到N个训练集;M为设定的训练集中的样本数量,N为设定的训练集数量;
(22)对于每一个训练集,训练一个决策树模型;
(23)对于单个决策树模型,在每次分裂时根据基尼指数选择最好的特征进行分裂;
(24)每一个决策树模型持续分裂,直到节点的所有训练样例都属于同一类;在分裂的过程中保留决策树的完整性,不对决策树进行剪枝操作;
(25)生成的N棵决策树组成随机森林,按多棵树分类器投票决定每个因子最终的权重大小;
(26)计算出每个因子的影响权重后,按照权重大小对相关因子进行降序排序,选出影响最大的若干因子作为模型的实验因子。
4.根据权利要求1所述的一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,所述步骤(3)包括:
(32)采用极大似然法估计参数α与β;
6.根据权利要求1所述的一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,所述步骤(5)包括:
(51)初始化长短期记忆网络LSTM的权值和偏置参数;
(53)计算注意力机制的权重,其中,为第s个因子在时间t时刻的权重,为注意力参数;Ct=ft*Ct-1+it*ct, W1,W2,Wf,Wi,Wc表示权重矩阵系数矩阵,bf,bc,bi是偏置项,·表示矩阵的乘积,*表示元素的乘积,[,]表示两个元素在水平方向上拼接为一个长向量,长短期记忆网络的神经元在t时刻的状态为Ct,输入门为it,遗忘门为ft,当前输入的单元状态为ct,经过注意力加权得到的输出序列
(55)利用批量梯度下降法计算网络的损失函数值,循环执行步骤(52)到步骤(54),更新长短期记忆网络的权值和偏置参数,待模型迭代稳定后结束模型的训练。
7.根据权利要求1所述的一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,所述步骤(6)包括:
(61)待模型训练稳定后,将测试集的数据输入到模型中,同时对模型中注意力机制计算的权重进行可视化,记录每一时刻注意力机制得到的权重值并以图的形式展示,图的横坐标为输入模型的每个因子,包括步骤(2)筛选的气象因子以及标准降水指数,纵坐标为历史时刻,不同的权重值通过颜色块来表示,颜色越深代表权重的值越大;
(62)模型输出目标站点未来3小时内的降雨值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010587176.7A CN111815037B (zh) | 2020-06-24 | 2020-06-24 | 一种基于注意力机制的可解释性短临极端降雨预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010587176.7A CN111815037B (zh) | 2020-06-24 | 2020-06-24 | 一种基于注意力机制的可解释性短临极端降雨预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111815037A true CN111815037A (zh) | 2020-10-23 |
CN111815037B CN111815037B (zh) | 2022-08-26 |
Family
ID=72854961
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010587176.7A Active CN111815037B (zh) | 2020-06-24 | 2020-06-24 | 一种基于注意力机制的可解释性短临极端降雨预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111815037B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112365091A (zh) * | 2020-11-30 | 2021-02-12 | 中国人民解放军国防科技大学 | 一种基于分类节点图注意力网络的雷达定量降水估计方法 |
CN113095590A (zh) * | 2021-04-29 | 2021-07-09 | 中国人民解放军国防科技大学 | 微波水平降雨场高时空分辨率重构分析与短临预测方法 |
CN113326981A (zh) * | 2021-05-26 | 2021-08-31 | 北京交通大学 | 基于动态时空注意力机制的大气环境污染物预测模型 |
CN113536665A (zh) * | 2021-06-18 | 2021-10-22 | 云南省交通规划设计研究院有限公司 | 基于特征工程和lstm的路表温度短临预测方法及系统 |
CN113610329A (zh) * | 2021-10-08 | 2021-11-05 | 南京信息工程大学 | 一种双流卷积长短期记忆网络的短时临近降雨预报方法 |
CN113837352A (zh) * | 2021-08-06 | 2021-12-24 | 中国地质大学(武汉) | 基于长短期记忆神经网络的降雨-径流时空关系模拟方法 |
CN114091266A (zh) * | 2021-11-24 | 2022-02-25 | 西安理工大学 | 极端降水与陆面温度增温响应关系的稳健性评估方法 |
CN114563834A (zh) * | 2022-04-27 | 2022-05-31 | 知一航宇(北京)科技有限公司 | 一种数值预报产品解释应用方法及系统 |
CN115049443A (zh) * | 2022-08-15 | 2022-09-13 | 国能日新科技股份有限公司 | 基于多尺度特征的自适应回归气象中长期优化方法及系统 |
CN115113303A (zh) * | 2022-06-21 | 2022-09-27 | 天津大学 | 基于元学习的厄尔尼诺极端天气预警方法及装置 |
CN115166874A (zh) * | 2022-07-13 | 2022-10-11 | 北京师范大学 | 基于机器学习的气象干旱指数spi构建方法 |
CN116485010A (zh) * | 2023-03-20 | 2023-07-25 | 四川省雅安市气象局 | 一种基于循环神经网络的s2s降水预测方法 |
US20230375745A1 (en) * | 2022-05-17 | 2023-11-23 | Nanjing University Of Information Science & Technology | High-temperature disaster forecast method based on directed graph neural network |
CN117290810A (zh) * | 2023-11-27 | 2023-12-26 | 南京气象科技创新研究院 | 基于循环卷积神经网络的短时强降水概率预报融合方法 |
CN117370714A (zh) * | 2023-12-07 | 2024-01-09 | 南京气象科技创新研究院 | 一种代表站定量确定方法 |
CN117708716A (zh) * | 2024-02-05 | 2024-03-15 | 敏博科技(武汉)有限公司 | 基于回归和时序融合的光伏发电功率/量预测方法及设备 |
CN113326981B (zh) * | 2021-05-26 | 2024-05-31 | 北京交通大学 | 基于动态时空注意力机制的大气环境污染物预测模型 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110288157A (zh) * | 2019-06-27 | 2019-09-27 | 电子科技大学 | 一种基于注意力机制和lstm的径流预测方法 |
CN110728411A (zh) * | 2019-10-18 | 2020-01-24 | 河海大学 | 一种基于卷积神经网络的高低空区域联合降雨预测方法 |
-
2020
- 2020-06-24 CN CN202010587176.7A patent/CN111815037B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110288157A (zh) * | 2019-06-27 | 2019-09-27 | 电子科技大学 | 一种基于注意力机制和lstm的径流预测方法 |
CN110728411A (zh) * | 2019-10-18 | 2020-01-24 | 河海大学 | 一种基于卷积神经网络的高低空区域联合降雨预测方法 |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112365091A (zh) * | 2020-11-30 | 2021-02-12 | 中国人民解放军国防科技大学 | 一种基于分类节点图注意力网络的雷达定量降水估计方法 |
CN112365091B (zh) * | 2020-11-30 | 2022-06-14 | 中国人民解放军国防科技大学 | 一种基于分类节点图注意力网络的雷达定量降水估计方法 |
CN113095590A (zh) * | 2021-04-29 | 2021-07-09 | 中国人民解放军国防科技大学 | 微波水平降雨场高时空分辨率重构分析与短临预测方法 |
CN113095590B (zh) * | 2021-04-29 | 2022-04-29 | 中国人民解放军国防科技大学 | 微波水平降雨场高时空分辨率重构分析与短临预测方法 |
CN113326981A (zh) * | 2021-05-26 | 2021-08-31 | 北京交通大学 | 基于动态时空注意力机制的大气环境污染物预测模型 |
CN113326981B (zh) * | 2021-05-26 | 2024-05-31 | 北京交通大学 | 基于动态时空注意力机制的大气环境污染物预测模型 |
CN113536665B (zh) * | 2021-06-18 | 2022-05-31 | 云南省交通规划设计研究院有限公司 | 基于特征工程和lstm的路表温度短临预测方法及系统 |
CN113536665A (zh) * | 2021-06-18 | 2021-10-22 | 云南省交通规划设计研究院有限公司 | 基于特征工程和lstm的路表温度短临预测方法及系统 |
CN113837352B (zh) * | 2021-08-06 | 2023-07-14 | 中国地质大学(武汉) | 基于长短期记忆神经网络的降雨-径流时空关系模拟方法 |
CN113837352A (zh) * | 2021-08-06 | 2021-12-24 | 中国地质大学(武汉) | 基于长短期记忆神经网络的降雨-径流时空关系模拟方法 |
CN113610329A (zh) * | 2021-10-08 | 2021-11-05 | 南京信息工程大学 | 一种双流卷积长短期记忆网络的短时临近降雨预报方法 |
CN113610329B (zh) * | 2021-10-08 | 2022-01-04 | 南京信息工程大学 | 一种双流卷积长短期记忆网络的短时临近降雨预报方法 |
CN114091266B (zh) * | 2021-11-24 | 2022-07-26 | 西安理工大学 | 极端降水与陆面温度增温响应关系的稳健性评估方法 |
CN114091266A (zh) * | 2021-11-24 | 2022-02-25 | 西安理工大学 | 极端降水与陆面温度增温响应关系的稳健性评估方法 |
CN114563834A (zh) * | 2022-04-27 | 2022-05-31 | 知一航宇(北京)科技有限公司 | 一种数值预报产品解释应用方法及系统 |
US11874429B2 (en) * | 2022-05-17 | 2024-01-16 | Nanjing University Of Information Science & Technology | High-temperature disaster forecast method based on directed graph neural network |
US20230375745A1 (en) * | 2022-05-17 | 2023-11-23 | Nanjing University Of Information Science & Technology | High-temperature disaster forecast method based on directed graph neural network |
CN115113303A (zh) * | 2022-06-21 | 2022-09-27 | 天津大学 | 基于元学习的厄尔尼诺极端天气预警方法及装置 |
CN115113303B (zh) * | 2022-06-21 | 2023-10-31 | 天津大学 | 基于元学习的厄尔尼诺极端天气预警方法及装置 |
CN115166874A (zh) * | 2022-07-13 | 2022-10-11 | 北京师范大学 | 基于机器学习的气象干旱指数spi构建方法 |
CN115049443B (zh) * | 2022-08-15 | 2022-10-28 | 国能日新科技股份有限公司 | 基于多尺度特征的自适应回归气象中长期优化方法及系统 |
CN115049443A (zh) * | 2022-08-15 | 2022-09-13 | 国能日新科技股份有限公司 | 基于多尺度特征的自适应回归气象中长期优化方法及系统 |
CN116485010A (zh) * | 2023-03-20 | 2023-07-25 | 四川省雅安市气象局 | 一种基于循环神经网络的s2s降水预测方法 |
CN116485010B (zh) * | 2023-03-20 | 2024-04-16 | 四川省雅安市气象局 | 一种基于循环神经网络的s2s降水预测方法 |
CN117290810A (zh) * | 2023-11-27 | 2023-12-26 | 南京气象科技创新研究院 | 基于循环卷积神经网络的短时强降水概率预报融合方法 |
CN117290810B (zh) * | 2023-11-27 | 2024-02-02 | 南京气象科技创新研究院 | 基于循环卷积神经网络的短时强降水概率预报融合方法 |
CN117370714A (zh) * | 2023-12-07 | 2024-01-09 | 南京气象科技创新研究院 | 一种代表站定量确定方法 |
CN117370714B (zh) * | 2023-12-07 | 2024-03-19 | 南京气象科技创新研究院 | 一种代表站定量确定方法 |
CN117708716A (zh) * | 2024-02-05 | 2024-03-15 | 敏博科技(武汉)有限公司 | 基于回归和时序融合的光伏发电功率/量预测方法及设备 |
CN117708716B (zh) * | 2024-02-05 | 2024-05-10 | 敏博科技(武汉)有限公司 | 基于回归和时序融合的光伏发电功率预测方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111815037B (zh) | 2022-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111815037B (zh) | 一种基于注意力机制的可解释性短临极端降雨预测方法 | |
Ahmed et al. | Deep learning hybrid model with Boruta-Random forest optimiser algorithm for streamflow forecasting with climate mode indices, rainfall, and periodicity | |
CN111665575B (zh) | 一种基于统计动力的中长期降雨分级耦合预报方法及系统 | |
CN114676822A (zh) | 一种基于深度学习的多属性融合空气质量预报方法 | |
Vuyyuru et al. | A novel weather prediction model using a hybrid mechanism based on MLP and VAE with fire-fly optimization algorithm | |
Hasan et al. | Automated weather event analysis with machine learning | |
CN117556197B (zh) | 一种基于人工智能的台风涡旋初始化方法 | |
CN113836808A (zh) | 一种基于重污染特征约束的pm2.5深度学习预测方法 | |
Li et al. | A method of rainfall runoff forecasting based on deep convolution neural networks | |
CN115629160A (zh) | 一种基于时空图的空气污染物浓度预测方法及系统 | |
Hennayake et al. | Machine learning based weather prediction model for short term weather prediction in Sri Lanka | |
Vosper et al. | Deep Learning for Downscaling Tropical Cyclone Rainfall to Hazard‐Relevant Spatial Scales | |
Mounier et al. | Detection of bow echoes in kilometer-scale forecasts using a convolutional neural network | |
CN113536373B (zh) | 一种脱敏气象数据的生成方法 | |
Pegion et al. | Understanding predictability of daily southeast US precipitation using explainable machine learning | |
Noor et al. | Prediction map of rainfall classification using random forest and inverse distance weighted (IDW) | |
Munir et al. | Early identification model for dengue haemorrhagic fever (DHF) outbreak areas using rule-based stratification approach | |
Zhu et al. | Long lead-time radar rainfall nowcasting method incorporating atmospheric conditions using long short-term memory networks | |
CN115345245A (zh) | 一种基于随机森林和迁移学习的热带气旋快速加强预报方法 | |
Jonnalagadda et al. | Spatial-Temporal Forecast of the probability distribution of Oceanic Nino Index for various lead times. | |
CN115238967A (zh) | 一种结合云图和相邻电站集群的光伏功率预测方法及装置 | |
Mandal et al. | Prediction of Wind Speed using Machine Learning | |
Acharya et al. | Weather Prediction Analysis by using Hybrid Markov Model and Artificial Neural Network | |
CN116449460B (zh) | 基于卷积UNet和迁移学习的区域月降水预测方法及系统 | |
Krishna et al. | Prediction of Droughts using SPEI |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |