CN111815037A - 一种基于注意力机制的可解释性短临极端降雨预测方法 - Google Patents

一种基于注意力机制的可解释性短临极端降雨预测方法 Download PDF

Info

Publication number
CN111815037A
CN111815037A CN202010587176.7A CN202010587176A CN111815037A CN 111815037 A CN111815037 A CN 111815037A CN 202010587176 A CN202010587176 A CN 202010587176A CN 111815037 A CN111815037 A CN 111815037A
Authority
CN
China
Prior art keywords
rainfall
short
model
attention mechanism
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010587176.7A
Other languages
English (en)
Other versions
CN111815037B (zh
Inventor
张鹏程
曹文南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202010587176.7A priority Critical patent/CN111815037B/zh
Publication of CN111815037A publication Critical patent/CN111815037A/zh
Application granted granted Critical
Publication of CN111815037B publication Critical patent/CN111815037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Biophysics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于注意力机制的可解释性短临极端降雨预测方法,首先通过随机森林对使用参数进行筛选,然后计算待测站点的标准降水指数(SPI),将标准降水指数和所选参数组成新的矩阵输入到长短期记忆网络中进行训练,并在神经网络中加入注意力机制,在训练过程中对注意力机制的权重计算进行可视化,最后以3小时为单位,可预测目标地区未来3、6、9、12小时的降雨量,预测过程中使用注意力机制针对短临强降雨的情况进行了优化,提高了模型针对极端天气的预测能力,同时也增强了模型的可解释性。

Description

一种基于注意力机制的可解释性短临极端降雨预测方法
技术领域
本发明涉及降雨预测领域,尤其是一种基于注意力机制的可解释性短临极端降雨预测方法。
背景技术
大气降水是全球水循环的重要组成部分,特别是在干旱和半干旱地区,降雨是主要的供水来源。研究降雨预报对经济发展和提升人民的生活质量具有重大意义。降雨预报的类别按照预报时间来划分一般分为四类,短临预报、短期预报、中期预报和长期预报,其中短临预报可以预警泥石流等灾害的发生,同时指导当地的交通及人们的出行。另外,气象条件的变异性、多样性和复杂性使得极端降雨的情况难以预测,这给降雨预报工作带来了巨大困难。现有方法往往存在短临强降雨预测不准确的情况,如何提高对这种极端气候的预测精度成为气象领域研究的热点话题。
近年来,机器学习广泛应用于降雨预测,文献[付明明.ARIMA模型在新疆喀什地区中长期降水量预测中的应用研究[J].地下水,2019,第41卷(3):142-144.]中利用ARIMA模型预测了新疆喀什地区的年降水量,从空间的角度分析了降水的总体分布。文献[周雨婷,王栋,王远坤,王文鹏,孟德青.典型降水预报ANN多指标优选——以太湖湖西区为例[J].水文,2020,40(01):35-39.]利用多种人工神经网络对五个地区的年降水量进行预测,通过多种指标筛选出GRNN为最优神经网络。然而由于预测的时间跨度较长,对于短时降雨量没有指导意义。文献[张鹏程,贾旸旸.一种基于多层感知器的动态区域联合短时降水预报方法[J].计算机应用与软件,2018,第35卷(11):153-158,183.]利用多层感知器,结合周围站点的气象状态对目标站点进行3小时内的降雨预测,结果表明,多层感知器具有良好的预测能力。然而,对于该地的气候特征难以适用于全部地区,因此模型对于短时强降雨的情况预测准确率较低,泛化能力较为薄弱。
发明内容
发明目的:针对现有技术中存在的问题和不足,为了提高模型的预测精度和预测效率,本发明提供一种基于注意力机制的可解释性短临极端降雨预测方法,它克服了短时极端降雨预测不精确、模型训练时间长的特点,并通过对注意力机制权重的可视化有效增强了模型的可解释性。
技术方案:为实现上述发明目的,本发明所述的一种基于注意力机制的短临极端降雨预测方法,包括如下步骤:
(1)收集气象站点的观测数据并对得到的数据集进行筛选和数据清洗;
(2)利用随机森林算法计算气象站点观测得到的气象因子和降雨量的相关性,并对因子的重要性排序,选择最重要的若干因子;
(3)计算待测站点的标准降水指数;
(4)将参数融合形成新的矩阵;
(5)将筛选后的气象因子参数值和标准降水指数归一化后输入到带有注意力机制的长短期记忆网络中进行训练;
(6)模型训练好后进行注意力机制可视化并预测降雨值。
所述步骤(1)是筛选数据集和对数据集进行简单的清洗,所述步骤(1)进一步为:
(11)从气象局获取各个站点的气象观测数据,以地面站点的观测数据作为依据;地面观测数据包括总云量、风向、风速、海平面气压、3小时变压、6小时降水、低云量、低云高、露点、温度和能见度因子;
(12)将数据集根据年份分为训练数据和测试数据两部分;
(13)清洗数据,将数据中存在缺失的,含有异常值的相关数据去除。
所述步骤(2)中对降雨量密切相关的气象因子进行筛选,所述步骤(2)进一步为:
(21)从训练数据集中随机选出M个样本,然后放回,进行N次取样,每一次取样生成一个训练集,得到N个训练集;M为设定的训练集中的样本数量,N为设定的训练集数量;
(22)对于每一个训练集,训练一个决策树模型;
(23)对于单个决策树模型,在每次分裂时根据基尼指数选择最好的特征进行分裂;
(24)每一个决策树模型持续分裂,直到节点的所有训练样例都属于同一类;在分裂的过程中保留决策树的完整性,不对决策树进行剪枝操作;
(25)生成的N棵决策树组成随机森林,按多棵树分类器投票决定每个因子最终的权重大小;
(26)计算出每个因子的影响权重后,按照权重大小对相关因子进行降序排序,选出影响最大的5个因子作为模型的实验因子。
目标站点的地理位置一定程度上影响着降雨的量级和频率,季风性气候的区域降雨往往集中在一段时间内。标准化降水指数可以反映该地区一段时间内的降水变化的特点,因此,研究待测站点的降水特点可以有效的调高模型对于强降雨或极端降雨样本的预测能力,所属步骤(3)进一步为:
(31)取出待测站点的降雨量,设某一时段的降雨量为x,则其τ分布的概率密度函数为:
Figure BDA0002555085890000031
式中,α为形状参数,β为尺度参数,τ(α)为Gamma函数;
(32)采用极大似然法估计参数α与β;
(33)由于Gamma函数中不包含x=0的情况,但实际情况降水量可能为0,因此累积概率公式为:H(x)=q+(1-q)G(x),其中q为降水量为0的概率,
Figure BDA0002555085890000032
G(x)为在该时间段小于降水x的概率;
(34)累计概率H(x)转换成标准正态分布函数,计算待测站点的标准降水指数SPI值;当0<H(x)≤0.5时:
Figure BDA0002555085890000033
式中
Figure BDA0002555085890000034
当0.5<H(x)<1时:
Figure BDA0002555085890000035
式中,
Figure BDA0002555085890000036
两式中c0=2.515517,c1=0.8028,c2=0.010328,d1=1.432788,d2=0.189269,d3=0.001308。
所述步骤(4)中将因子整合成一个矩阵,所述步骤4进一步为:
(41)将步骤(2)中选取的因子和站点的标准降水指数组成n行m列的矩阵
Figure BDA0002555085890000037
n代表不同时间的样本数据,m代表一条样本数据所含有的信息量,包括时间,站点编号,筛选的气象因子和标准降水指数;
(42)将矩阵
Figure BDA0002555085890000041
进行归一化处理,将矩阵中的数据转化成[0,1]范围,归一化处理后得到矩阵
Figure BDA0002555085890000042
步骤(5)将长短期记忆网络中加入注意力机制,对模型进行训练,所述步骤5进一步为:
(51)初始化长短期记忆网络LSTM的权值和偏置参数;
(52)将归一化后的矩阵
Figure BDA0002555085890000043
输入到LSTM中的输入层,
Figure BDA0002555085890000044
表示
Figure BDA0002555085890000045
中t时刻第s个因子,其中1≤t≤n,1≤s≤m,将
Figure BDA0002555085890000046
映射为
Figure BDA0002555085890000047
(53)计算注意力机制的权重,
Figure BDA0002555085890000048
Figure BDA0002555085890000049
其中,
Figure BDA00025550858900000410
为第s个因子在时间t时刻的权重,
Figure BDA00025550858900000411
为注意力参数;Ct=ft*Ct-1+it*ct,
Figure BDA00025550858900000412
Figure BDA00025550858900000413
W1,W2,Wf,Wi,Wc表示权重矩阵系数矩阵,bf,bc,bi是偏置项,·表示矩阵的乘积,*表示元素的乘积,[,]表示两个元素在水平方向上拼接为一个长向量,长短期记忆网络的神经元在t时刻的状态为Ct,输入门为it,遗忘门为ft,当前输入的单元状态为ct
Figure BDA00025550858900000414
经过注意力加权得到的输出序列
Figure BDA00025550858900000415
(54)将注意力计算得到的
Figure BDA00025550858900000416
替换步骤(53)中长短期记忆网络中的
Figure BDA00025550858900000417
来更新权值,并将更新的权值输入到下一个隐含层中;
(55)利用批量梯度下降法计算网络的损失函数值,循环执行步骤(52)到步骤(54),更新长短期记忆网络的权值和偏置参数,待模型迭代稳定后结束模型的训练。步骤(6)待模型训练结束后,将测试集的数据输入到模型中,并记录每一时刻的注意力机制权值并进行可视化,最后输出预测的降雨值。所述步骤6进一步为:
(61)待模型训练稳定后,将测试集的数据输入到模型中,同时对模型中注意力机制计算的权重进行可视化,记录每一时刻注意力机制得到的权重值并以图的形式展示,图的横坐标为输入模型的每个因子,包括步骤(2)筛选的气象因子以及标准降水指数,纵坐标为历史时刻,不同的权重值通过颜色块来表示,颜色越深代表权重的值越大;
(62)模型输出目标站点未来3小时内的降雨值。
有益效果:本发明提供的一种基于注意力机制的可解释性短临极端降雨预测方法,与现有技术相比,本发明的优点在于:考虑了目标站点的气候特征,克服了单个站点短时间内对极端降雨预报不准确的特点,同时,长短期记忆网络存在信息丢失的问题,本方法通过加入注意力机制可以对降雨影响较大的因子赋予更高的权重,强化对于重要因子的学习能力,提高模型对于极端降雨的预测精度。另外,对注意力机制的可视化展示也增强了模型的可解释性。本发明的模型效果在全国92个气象站点得到了验证,增强了模型的泛化能力。
附图说明
图1为本发明实施例的整体步骤图;
图2为本发明具体示例的方法流程图;
图3为本发明实施例中的带有注意力机制的网络结构示意图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,本发明实施例公开的一种基于注意力机制的可解释性短临极端降雨预测方法,主要包括如下步骤:
步骤1:收集气象站点的观测数据并对得到的数据集进行筛选和数据清洗;
步骤2:利用随机森林算法计算气象站点观测得到的气象因子和降雨量的相关性,并对因子的重要性排序,选择最重要的若干因子;
步骤3:计算待测站点的标准降水指数;
步骤4:将参数融合形成新的矩阵;
步骤5:将筛选后的气象因子参数值和标准降水指数归一化后输入到带有注意力机制的长短期记忆网络中进行训练;
步骤6:待模型稳定后进行注意力机制可视化并预测降雨值。
如图2所示,本发明实施例公开的一种基于注意力机制的可解释性短临极端降雨预测方法,具体步骤如下:
步骤1:获取气象站点观测得到的气象数据,由于一些物理和人为因素的影响,数据存在异常或者缺失的问题,所以需要对数据进行清洗,筛选出数据段较为完整的标签数据作为输入数据,从数据的角度提升模型预测的准确性,具体步骤如下:
步骤11:从气象局获取各个站点的气象观测数据,以地面站点的观测数据作为主要依据。地面观测数据包括总云量、风向、风速、海平面气压、3小时变压、6小时降水、低云量、低云高、露点、温度和能见度因子;
步骤12:将数据集根据年份分为训练数据和测试数据两部分;
步骤13:初步清洗数据,将数据中存在缺失的,含有异常值的相关数据去除。
步骤2:选择和确定与降雨密切相关的气象因子,这一步主要是为了将模型的主要算力集中在对影响较大的几个气象因子上,减少了模型的计算量和训练时间,同时也可以排除干扰因子的对于模型结果的影响。具体步骤如下:
步骤21:从原始训练集中使用自助法(Bootstraping)随机选出M个样本,然后放回,进行N次取样,每一次取样生成一个训练集,得到N个训练集;本例中,随机选出100000个样本,随机进行1000次取样,生成1000个训练集,每个训练集中有100个样本;
步骤22:对于每一个训练集,训练一个决策树模型;
步骤23:对于单个决策树模型,假设训练样本特征的个数为a,在每次分裂时根据基尼指数选择最好的特征进行分裂。若有K个类,样本点属于第k类的概率为pk,则基尼指数的计算公式为
Figure BDA0002555085890000061
步骤24:每一个决策树模型持续分裂,直到该节点的所有训练样例都属于同一类。在分裂的过程中保留决策树的完整性,不对决策树进行剪枝操作;
步骤25:生成的n棵决策树组成随机森林,按多棵树分类器投票决定每个因子最终的权重大小;
步骤26:计算出每个因子的影响权重后,按照权重大小对相关因子进行降序排序,选出影响最大的5个因子作为模型的实验因子。本实验影响最大的5个因子为风向、风速、云量、温度、露点。
步骤3:模型对于样本量较少的极端降雨存在预报准确率较低的情况,极端降雨的形成与目标站点的气候情况相关,步骤2中筛选的因子是即时性的气象指标,并不能反映目标站点的气候特征。计算标准降水指数可以反映目标站点在一段时间内的降雨量情况,有效提升强降雨等小样本事件预测准确率。具体步骤如下:
步骤31:取出待测站点的降雨量,设该时段的降雨量为x,则其τ分布的概率密度函数为:
Figure BDA0002555085890000071
式中,α为形状参数,β为尺度参数,τ(α)为Gamma函数;
步骤32:采用极大似然法估计参数α与β,计算公式为:
Figure BDA0002555085890000072
式中
Figure BDA0002555085890000073
xi为降水量序列的样本,
Figure BDA0002555085890000074
为该时段降水的平均值,m为计算序列的长度;
步骤33:由于Gamma函数中不包含x=0的情况,但实际情况降水量可能为0,因此累积概率公式为:H(x)=q+(1-q)G(x),其中q为降水量为0的概率,
Figure BDA0002555085890000075
G(x)即为在该时间段小于降水x的概率;
步骤34:累计概率H(x)转换成标准正态分布函数,计算待测站点的SPI值。当0<H(x)≤0.5时:
Figure BDA0002555085890000076
式中
Figure BDA0002555085890000077
当0.5<H(x)<1时:
Figure BDA0002555085890000078
式中,
Figure BDA0002555085890000079
两式中c0=2.515517,c1=0.8028,c2=0.010328,d1=1.432788,d2=0.189269,d3=0.001308。
步骤4:将筛选出的5个因子和标准降水指数整合到一个矩阵中,方便模型训练,具体步骤如下:
步骤41:将步骤2中选取的因子和站点的标准降水指数组成n行m列的矩阵
Figure BDA0002555085890000081
n代表不同时间的样本数据,m代表一条样本数据所含有的信息量,包括时间,站点编号,筛选的气象因子和标准降水指数;
步骤42:将矩阵
Figure BDA0002555085890000082
进行归一化处理,根据公式
Figure BDA0002555085890000083
将矩阵中的数据转化成[0,1]范围,其中Xmin和Xmax分别是矩阵每行的最小值和最大值,归一化处理后得到矩阵
Figure BDA0002555085890000084
步骤5:增加注意力机制可以有效的解决长短期记忆网络中存在的长距离信息弱化问题,注意力机制可以对影响降雨较大的因子强化训练,不丢失重要的信息,提升了模型的准确率。如图3所示,具体步骤如下:
步骤51:初始化长短期记忆网络LSTM的权值和偏置参数;
步骤52:将归一化后的矩阵
Figure BDA0002555085890000085
输入到LSTM中的输入层,
Figure BDA0002555085890000086
表示
Figure BDA0002555085890000087
中t时刻第s个因子的值,其中1≤t≤n,1≤s≤m。将
Figure BDA0002555085890000088
映射为
Figure BDA0002555085890000089
其中
Figure BDA00025550858900000810
激活函数为sigmoid函数,公式为
Figure BDA00025550858900000811
步骤53:计算注意力机制的权重,
Figure BDA00025550858900000812
Figure BDA00025550858900000813
其中,
Figure BDA00025550858900000814
为第s个因子在时间t时刻的权重,
Figure BDA00025550858900000815
为注意力参数;Ct=ft*Ct-1+it*ct,
Figure BDA00025550858900000816
Figure BDA00025550858900000817
W1,W2,Wf,Wi,Wc表示权重矩阵系数矩阵,bf,bc,bi是偏置项,·表示矩阵的乘积,*表示元素的乘积,[,]表示两个元素在水平方向上拼接为一个长向量,长短期记忆网络的神经元在t时刻的状态为Ct,输入门为it,遗忘门为ft,当前输入的单元状态为ct
Figure BDA00025550858900000818
经过注意力加权得到的输出序列
Figure BDA00025550858900000819
步骤54:将注意力计算得到的
Figure BDA00025550858900000820
替换步骤53中长短期记忆网络中的
Figure BDA00025550858900000821
来更新权值,并将更新的权值输入到下一个隐含层中;
步骤55:利用批量梯度下降法计算网络的损失函数值,循环执行步骤52到步骤54,更新长短期记忆网络的权值和偏置参数1000次,待模型迭代稳定后结束模型的训练。
步骤6:注意力机制可视化可以直观地展现重要因子对于降雨量的影响,增加对模型的可解释性。在训练稳定后,模型输出未来3小时内的降雨值。具体步骤如下:
步骤61:待模型训练稳定后,将测试集的数据输入到模型中,同时对模型中注意力机制计算的权重进行可视化,记录每一时刻注意力机制得到的权重值并以图的形式展示。图的横坐标为输入模型的每个因子,纵坐标为历史时刻,不同的权重值通过颜色块来表示,颜色越深代表权重的值越大;
步骤62:模型输出目标站点未来3小时内的降雨值,其中,未来6、9、12小时的降雨值可以通过多段3小时预测得到的降雨值进行拼接。

Claims (7)

1.一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,包括如下步骤:
(1)收集气象站点的观测数据并对得到的数据集进行筛选和数据清洗;
(2)利用随机森林算法计算气象站点观测得到的气象因子和降雨量的相关性,并对因子的重要性排序,选择最重要的若干因子;
(3)计算待测站点的标准降水指数;
(4)将参数融合形成新的矩阵;
(5)将筛选后的气象因子参数值和标准降水指数归一化后输入到带有注意力机制的长短期记忆网络中进行训练;
(6)模型训练好后进行注意力机制可视化并预测降雨值。
2.根据权利要求1所述的一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,所述步骤(1)包括:
(11)从气象局获取各个站点的气象观测数据,以地面站点的观测数据作为依据;地面观测数据包括总云量、风向、风速、海平面气压、3小时变压、6小时降水、低云量、低云高、露点、温度和能见度因子;
(12)将数据集根据年份分为训练数据和测试数据两部分;
(13)清洗数据,将数据中存在缺失的,含有异常值的相关数据去除。
3.根据权利要求1所述的一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,所述步骤(2)包括:
(21)从训练数据集中随机选出M个样本,然后放回,进行N次取样,每一次取样生成一个训练集,得到N个训练集;M为设定的训练集中的样本数量,N为设定的训练集数量;
(22)对于每一个训练集,训练一个决策树模型;
(23)对于单个决策树模型,在每次分裂时根据基尼指数选择最好的特征进行分裂;
(24)每一个决策树模型持续分裂,直到节点的所有训练样例都属于同一类;在分裂的过程中保留决策树的完整性,不对决策树进行剪枝操作;
(25)生成的N棵决策树组成随机森林,按多棵树分类器投票决定每个因子最终的权重大小;
(26)计算出每个因子的影响权重后,按照权重大小对相关因子进行降序排序,选出影响最大的若干因子作为模型的实验因子。
4.根据权利要求1所述的一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,所述步骤(3)包括:
(31)取出待测站点的降雨量,设某一时段的降雨量为x,则其τ分布的概率密度函数为:
Figure FDA0002555085880000021
式中,α为形状参数,β为尺度参数,τ(α)为Gamma函数;
(32)采用极大似然法估计参数α与β;
(33)由于Gamma函数中不包含x=0的情况,但实际情况降水量可能为0,因此累积概率公式为:H(x)=q+(1-q)G(x),其中q为降水量为0的概率,
Figure FDA0002555085880000022
G(x)为在该时间段小于降水x的概率;
(34)累计概率H(x)转换成标准正态分布函数,计算待测站点的标准降水指数SPI值;当0<H(x)≤0.5时:
Figure FDA0002555085880000023
式中
Figure FDA0002555085880000024
当0.5<H(x)<1时:
Figure FDA0002555085880000025
式中,
Figure FDA0002555085880000026
两式中c0=2.515517,c1=0.8028,c2=0.010328,d1=1.432788,d2=0.189269,d3=0.001308。
5.根据权利要求1所述的一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,所述步骤(4)包括:
(41)将步骤(2)中选取的因子和站点的标准降水指数组成n行m列的矩阵
Figure FDA0002555085880000027
n代表不同时间的样本数据,m代表一条样本数据所含有的信息量,包括时间,站点编号,筛选的气象因子和标准降水指数;
(42)将矩阵
Figure FDA0002555085880000028
进行归一化处理,将矩阵中的数据转化成[0,1]范围,归一化处理后得到矩阵
Figure FDA0002555085880000031
6.根据权利要求1所述的一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,所述步骤(5)包括:
(51)初始化长短期记忆网络LSTM的权值和偏置参数;
(52)将归一化后的矩阵
Figure FDA0002555085880000032
输入到LSTM中的输入层,
Figure FDA0002555085880000033
表示
Figure FDA0002555085880000034
中t时刻第s个因子,其中1≤t≤n,1≤s≤m,将
Figure FDA0002555085880000035
映射为
Figure FDA0002555085880000036
(53)计算注意力机制的权重,
Figure FDA0002555085880000037
其中,
Figure FDA0002555085880000038
为第s个因子在时间t时刻的权重,
Figure FDA0002555085880000039
为注意力参数;Ct=ft*Ct-1+it*ct,
Figure FDA00025550858800000310
Figure FDA00025550858800000311
W1,W2,Wf,Wi,Wc表示权重矩阵系数矩阵,bf,bc,bi是偏置项,·表示矩阵的乘积,*表示元素的乘积,[,]表示两个元素在水平方向上拼接为一个长向量,长短期记忆网络的神经元在t时刻的状态为Ct,输入门为it,遗忘门为ft,当前输入的单元状态为ct
Figure FDA00025550858800000312
经过注意力加权得到的输出序列
Figure FDA00025550858800000313
(54)将注意力计算得到的
Figure FDA00025550858800000314
替换步骤(53)中长短期记忆网络中的
Figure FDA00025550858800000315
来更新权值,并将更新的权值输入到下一个隐含层中;
(55)利用批量梯度下降法计算网络的损失函数值,循环执行步骤(52)到步骤(54),更新长短期记忆网络的权值和偏置参数,待模型迭代稳定后结束模型的训练。
7.根据权利要求1所述的一种基于注意力机制的可解释性短临极端降雨预测方法,其特征在于,所述步骤(6)包括:
(61)待模型训练稳定后,将测试集的数据输入到模型中,同时对模型中注意力机制计算的权重进行可视化,记录每一时刻注意力机制得到的权重值并以图的形式展示,图的横坐标为输入模型的每个因子,包括步骤(2)筛选的气象因子以及标准降水指数,纵坐标为历史时刻,不同的权重值通过颜色块来表示,颜色越深代表权重的值越大;
(62)模型输出目标站点未来3小时内的降雨值。
CN202010587176.7A 2020-06-24 2020-06-24 一种基于注意力机制的可解释性短临极端降雨预测方法 Active CN111815037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010587176.7A CN111815037B (zh) 2020-06-24 2020-06-24 一种基于注意力机制的可解释性短临极端降雨预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010587176.7A CN111815037B (zh) 2020-06-24 2020-06-24 一种基于注意力机制的可解释性短临极端降雨预测方法

Publications (2)

Publication Number Publication Date
CN111815037A true CN111815037A (zh) 2020-10-23
CN111815037B CN111815037B (zh) 2022-08-26

Family

ID=72854961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010587176.7A Active CN111815037B (zh) 2020-06-24 2020-06-24 一种基于注意力机制的可解释性短临极端降雨预测方法

Country Status (1)

Country Link
CN (1) CN111815037B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365091A (zh) * 2020-11-30 2021-02-12 中国人民解放军国防科技大学 一种基于分类节点图注意力网络的雷达定量降水估计方法
CN113095590A (zh) * 2021-04-29 2021-07-09 中国人民解放军国防科技大学 微波水平降雨场高时空分辨率重构分析与短临预测方法
CN113326981A (zh) * 2021-05-26 2021-08-31 北京交通大学 基于动态时空注意力机制的大气环境污染物预测模型
CN113536665A (zh) * 2021-06-18 2021-10-22 云南省交通规划设计研究院有限公司 基于特征工程和lstm的路表温度短临预测方法及系统
CN113610329A (zh) * 2021-10-08 2021-11-05 南京信息工程大学 一种双流卷积长短期记忆网络的短时临近降雨预报方法
CN113837352A (zh) * 2021-08-06 2021-12-24 中国地质大学(武汉) 基于长短期记忆神经网络的降雨-径流时空关系模拟方法
CN114091266A (zh) * 2021-11-24 2022-02-25 西安理工大学 极端降水与陆面温度增温响应关系的稳健性评估方法
CN114563834A (zh) * 2022-04-27 2022-05-31 知一航宇(北京)科技有限公司 一种数值预报产品解释应用方法及系统
CN115049443A (zh) * 2022-08-15 2022-09-13 国能日新科技股份有限公司 基于多尺度特征的自适应回归气象中长期优化方法及系统
CN115113303A (zh) * 2022-06-21 2022-09-27 天津大学 基于元学习的厄尔尼诺极端天气预警方法及装置
CN115166874A (zh) * 2022-07-13 2022-10-11 北京师范大学 基于机器学习的气象干旱指数spi构建方法
CN116485010A (zh) * 2023-03-20 2023-07-25 四川省雅安市气象局 一种基于循环神经网络的s2s降水预测方法
US20230375745A1 (en) * 2022-05-17 2023-11-23 Nanjing University Of Information Science & Technology High-temperature disaster forecast method based on directed graph neural network
CN117290810A (zh) * 2023-11-27 2023-12-26 南京气象科技创新研究院 基于循环卷积神经网络的短时强降水概率预报融合方法
CN117370714A (zh) * 2023-12-07 2024-01-09 南京气象科技创新研究院 一种代表站定量确定方法
CN117708716A (zh) * 2024-02-05 2024-03-15 敏博科技(武汉)有限公司 基于回归和时序融合的光伏发电功率/量预测方法及设备
CN113326981B (zh) * 2021-05-26 2024-05-31 北京交通大学 基于动态时空注意力机制的大气环境污染物预测模型

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110288157A (zh) * 2019-06-27 2019-09-27 电子科技大学 一种基于注意力机制和lstm的径流预测方法
CN110728411A (zh) * 2019-10-18 2020-01-24 河海大学 一种基于卷积神经网络的高低空区域联合降雨预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110288157A (zh) * 2019-06-27 2019-09-27 电子科技大学 一种基于注意力机制和lstm的径流预测方法
CN110728411A (zh) * 2019-10-18 2020-01-24 河海大学 一种基于卷积神经网络的高低空区域联合降雨预测方法

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365091A (zh) * 2020-11-30 2021-02-12 中国人民解放军国防科技大学 一种基于分类节点图注意力网络的雷达定量降水估计方法
CN112365091B (zh) * 2020-11-30 2022-06-14 中国人民解放军国防科技大学 一种基于分类节点图注意力网络的雷达定量降水估计方法
CN113095590A (zh) * 2021-04-29 2021-07-09 中国人民解放军国防科技大学 微波水平降雨场高时空分辨率重构分析与短临预测方法
CN113095590B (zh) * 2021-04-29 2022-04-29 中国人民解放军国防科技大学 微波水平降雨场高时空分辨率重构分析与短临预测方法
CN113326981A (zh) * 2021-05-26 2021-08-31 北京交通大学 基于动态时空注意力机制的大气环境污染物预测模型
CN113326981B (zh) * 2021-05-26 2024-05-31 北京交通大学 基于动态时空注意力机制的大气环境污染物预测模型
CN113536665B (zh) * 2021-06-18 2022-05-31 云南省交通规划设计研究院有限公司 基于特征工程和lstm的路表温度短临预测方法及系统
CN113536665A (zh) * 2021-06-18 2021-10-22 云南省交通规划设计研究院有限公司 基于特征工程和lstm的路表温度短临预测方法及系统
CN113837352B (zh) * 2021-08-06 2023-07-14 中国地质大学(武汉) 基于长短期记忆神经网络的降雨-径流时空关系模拟方法
CN113837352A (zh) * 2021-08-06 2021-12-24 中国地质大学(武汉) 基于长短期记忆神经网络的降雨-径流时空关系模拟方法
CN113610329A (zh) * 2021-10-08 2021-11-05 南京信息工程大学 一种双流卷积长短期记忆网络的短时临近降雨预报方法
CN113610329B (zh) * 2021-10-08 2022-01-04 南京信息工程大学 一种双流卷积长短期记忆网络的短时临近降雨预报方法
CN114091266B (zh) * 2021-11-24 2022-07-26 西安理工大学 极端降水与陆面温度增温响应关系的稳健性评估方法
CN114091266A (zh) * 2021-11-24 2022-02-25 西安理工大学 极端降水与陆面温度增温响应关系的稳健性评估方法
CN114563834A (zh) * 2022-04-27 2022-05-31 知一航宇(北京)科技有限公司 一种数值预报产品解释应用方法及系统
US11874429B2 (en) * 2022-05-17 2024-01-16 Nanjing University Of Information Science & Technology High-temperature disaster forecast method based on directed graph neural network
US20230375745A1 (en) * 2022-05-17 2023-11-23 Nanjing University Of Information Science & Technology High-temperature disaster forecast method based on directed graph neural network
CN115113303A (zh) * 2022-06-21 2022-09-27 天津大学 基于元学习的厄尔尼诺极端天气预警方法及装置
CN115113303B (zh) * 2022-06-21 2023-10-31 天津大学 基于元学习的厄尔尼诺极端天气预警方法及装置
CN115166874A (zh) * 2022-07-13 2022-10-11 北京师范大学 基于机器学习的气象干旱指数spi构建方法
CN115049443B (zh) * 2022-08-15 2022-10-28 国能日新科技股份有限公司 基于多尺度特征的自适应回归气象中长期优化方法及系统
CN115049443A (zh) * 2022-08-15 2022-09-13 国能日新科技股份有限公司 基于多尺度特征的自适应回归气象中长期优化方法及系统
CN116485010A (zh) * 2023-03-20 2023-07-25 四川省雅安市气象局 一种基于循环神经网络的s2s降水预测方法
CN116485010B (zh) * 2023-03-20 2024-04-16 四川省雅安市气象局 一种基于循环神经网络的s2s降水预测方法
CN117290810A (zh) * 2023-11-27 2023-12-26 南京气象科技创新研究院 基于循环卷积神经网络的短时强降水概率预报融合方法
CN117290810B (zh) * 2023-11-27 2024-02-02 南京气象科技创新研究院 基于循环卷积神经网络的短时强降水概率预报融合方法
CN117370714A (zh) * 2023-12-07 2024-01-09 南京气象科技创新研究院 一种代表站定量确定方法
CN117370714B (zh) * 2023-12-07 2024-03-19 南京气象科技创新研究院 一种代表站定量确定方法
CN117708716A (zh) * 2024-02-05 2024-03-15 敏博科技(武汉)有限公司 基于回归和时序融合的光伏发电功率/量预测方法及设备
CN117708716B (zh) * 2024-02-05 2024-05-10 敏博科技(武汉)有限公司 基于回归和时序融合的光伏发电功率预测方法及设备

Also Published As

Publication number Publication date
CN111815037B (zh) 2022-08-26

Similar Documents

Publication Publication Date Title
CN111815037B (zh) 一种基于注意力机制的可解释性短临极端降雨预测方法
Ahmed et al. Deep learning hybrid model with Boruta-Random forest optimiser algorithm for streamflow forecasting with climate mode indices, rainfall, and periodicity
CN111665575B (zh) 一种基于统计动力的中长期降雨分级耦合预报方法及系统
CN114676822A (zh) 一种基于深度学习的多属性融合空气质量预报方法
Vuyyuru et al. A novel weather prediction model using a hybrid mechanism based on MLP and VAE with fire-fly optimization algorithm
Hasan et al. Automated weather event analysis with machine learning
CN117556197B (zh) 一种基于人工智能的台风涡旋初始化方法
CN113836808A (zh) 一种基于重污染特征约束的pm2.5深度学习预测方法
Li et al. A method of rainfall runoff forecasting based on deep convolution neural networks
CN115629160A (zh) 一种基于时空图的空气污染物浓度预测方法及系统
Hennayake et al. Machine learning based weather prediction model for short term weather prediction in Sri Lanka
Vosper et al. Deep Learning for Downscaling Tropical Cyclone Rainfall to Hazard‐Relevant Spatial Scales
Mounier et al. Detection of bow echoes in kilometer-scale forecasts using a convolutional neural network
CN113536373B (zh) 一种脱敏气象数据的生成方法
Pegion et al. Understanding predictability of daily southeast US precipitation using explainable machine learning
Noor et al. Prediction map of rainfall classification using random forest and inverse distance weighted (IDW)
Munir et al. Early identification model for dengue haemorrhagic fever (DHF) outbreak areas using rule-based stratification approach
Zhu et al. Long lead-time radar rainfall nowcasting method incorporating atmospheric conditions using long short-term memory networks
CN115345245A (zh) 一种基于随机森林和迁移学习的热带气旋快速加强预报方法
Jonnalagadda et al. Spatial-Temporal Forecast of the probability distribution of Oceanic Nino Index for various lead times.
CN115238967A (zh) 一种结合云图和相邻电站集群的光伏功率预测方法及装置
Mandal et al. Prediction of Wind Speed using Machine Learning
Acharya et al. Weather Prediction Analysis by using Hybrid Markov Model and Artificial Neural Network
CN116449460B (zh) 基于卷积UNet和迁移学习的区域月降水预测方法及系统
Krishna et al. Prediction of Droughts using SPEI

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant