CN114936691A - 一种融合关联度加权与时空注意力的温度预报方法 - Google Patents
一种融合关联度加权与时空注意力的温度预报方法 Download PDFInfo
- Publication number
- CN114936691A CN114936691A CN202210535440.1A CN202210535440A CN114936691A CN 114936691 A CN114936691 A CN 114936691A CN 202210535440 A CN202210535440 A CN 202210535440A CN 114936691 A CN114936691 A CN 114936691A
- Authority
- CN
- China
- Prior art keywords
- time
- space
- attention
- temperature
- meteorological
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Abstract
本发明为一种融合关联度加权与时空注意力的温度预报方法,首先获取包括温度和多个气象要素在内的气象数据集;接着,计算各个气象要素与温度之间的关联度,将关联度进行加权,并将所有关联度加权结果在通道方向连接,得到加权后的气象时空序列数据;最后,以预测循环神经网络为基础构建温度预报模型,将温度和加权后的气象时空序列数据输入到温度预报模型中,用于未来时刻局部地区的温度预报;温度预报模型包括n个时空注意力层,每个时空注意力层包括若干个时空注意力模块,时空注意力模块利用上下文交互单元对输入和上下文信息进行互相校正来记忆短期依赖信息,利用时空记忆单元捕获气象数据的长期依赖关系。该方法能够捕捉温度突变,预报准确度更高。
Description
技术领域
本发明属于温度预报技术领域,具体是一种融合关联度加权与时空注意力的温度预报方法,可用于温度预报领域基于多要素时空序列的温度预测。
背景技术
温度预报是气象预报领域的研究热点,其目的是根据历史气象数据对未来一段时间内的温度变化进行精确预报,被广泛应用于交通控制、传染病预防、环境监测和灾害预警等领域。自动气象观测技术、遥感卫星工程技术以及智能网格预报技术的迅速发展,为基于深度学习的温度预报研究提供了丰富的数据支持。
传统的温度预报方法主要是基于物理的数值模型,它在获取数据和预测温度时需要耗费大量的计算资源和时间。随着多源、海量气象数据的出现,产生了数据驱动模型。深度学习技术特别是卷积神经网络和循环神经网络在温度预报领域取得了里程碑式的进步,更好地模拟了气象数据的非线性关系,并且解决了温度预报中数据依赖和机制复杂的问题。然而,循环神经网络倾向于时间结构的建模,缺乏捕捉温度空间变化的能力;卷积神经网络更注重空间外观变化,捕捉时序变化规律的能力较差。事实上,某地区温度变化的随机行为不仅受该地区历史气象数据的影响,而且受周围地区气象要素时空变化的影响,因此利用深度学习预测温度需要考虑长距离时空依赖。
现有的时空序列预测算法虽然能够从海量气象数据中高效准确地提取信息,但是它们通常分别对时空维度进行建模并且使用卷积操作捕捉气象数据的空间相关性,没有充分考虑温度变化的时空相关性和地理因素对温度变化的影响,忽略了不同气象要素对温度变化的影响程度,并且难以感知温度突变。
发明内容
针对现有技术的不足,本发明拟解决的技术问题是,提供一种融合关联度加权与时空注意力的温度预报方法。
本发明解决所述技术问题采用的技术方案如下:
一种融合关联度加权与时空注意力的温度预报方法,其特征在于,该方法包括如下步骤:
第一步、获取气象数据集,该数据集包括温度和多个气象要素在内的时空序列数据;
第二步、计算各个气象要素与温度之间的关联度,将各个气象要素与温度的关联度进行加权,并将各个气象要素的关联度加权结果在通道方向上连接,得到加权后的气象时空序列数据;
首先,根据式(1)对温度和各个气象要素的时空序列数据进行标准化处理;
其次,计算温度与各个气象要素之间的关联系数;
然后,根据式(3)计算各个气象要素与温度之间的关联度;
其中,rj表示不同地区温度与第j个气象要素的关联度,ξtj表示t时刻不同地区温度与第j个气象要素的关联系数,T′表示时间序列长度;
2-5)利用式(4)对关联度进行加权处理,并将各个气象要素的关联度加权结果在通道方向连接,得到加权后的气象时空序列数据;
其中,X′tj表示t时刻第j个气象要素与温度的关联度加权结果;
将所有气象要素与温度的关联度加权结果在通道方向连接得到加权后的气象时空序列数据;
第三步、基于深度学习神经网络构建温度预报模型,将温度时空序列数据和加权后的气象时空序列数据输入到温度预报模型中,温度预报模型输出预报结果,即未来时刻局部地区的时空序列温度图像;
温度预报模型以预测循环神经网络为基础,温度预报模型包括n个时空注意力层,每个时空注意力层包括若干个依次连接的时空注意力模块,所有时空注意力层相同位置的时空注意力模块依次连接,使温度预报模型的内存状态沿之字形流经整个网络;
每个时空注意力模块均包括上下文交互单元和时空记忆单元两部分,上下文交互单元包括三个注意力模块Attention1~Attention3,用于将t-1时刻第l个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的时空记忆信息进行上下文关联更新,得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的时空记忆信息
时空记忆单元利用卷积长短时记忆单元捕获时间维度信息,同时在卷积长短时记忆单元的基础上增加自注意力模块捕获空间维度信息,再将捕获的时空维度信息通过联合机制进行融合;
对于时间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息和t-1时刻第l个时空注意力层的隐藏状态信息通过卷积长短时记忆单元获取时域上第l个时空注意力层的温度变化信息,然后利用t-1时刻第l个时空注意力层的时间记忆信息生成t时刻第l个时空注意力层的时间记忆信息公式如下:
其中,ft为遗忘门,it为输入门,gt为输入调制门,σ表示sigmoid激活函数,tanh表示tanh激活函数,°表示哈达玛乘积,Wxf、Whf、Wxi、Whi、Wxg、Whg、bf、bi、bg均为可学习参数;
对于空间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息和t时刻第l-1个时空注意力层的时空记忆信息利用卷积长短时记忆单元获取当前时空注意力层的温度变化信息,然后对更新后的t时刻第l-1个时空注意力层的时空记忆信息进行校正,生成更新后的t时刻第l个时空注意力层的时空记忆信息最后,使用自注意力模块对更新后的t时刻第l个时空注意力层的时空记忆信息进行关注,得到t时刻第l个时空注意力层的时空记忆信息公式如下:
其中,ft′为遗忘门,i′t为输入门,g′t为输入调制门,SA(·)表示自注意力模块,W′xf、W′xi、W′xg、Wmf、Wmi、Wmg、b′f、b′i、b′g均为可学习参数;
O=ATT(Q,K)V (25)
其中,Wo*O表示自注意力特征图;
自注意力模块的模型表示如下:
进一步的,在第三步中,注意力模块Attention1利用t时刻第l-1个时空注意力层的隐藏状态信息校正更新t-1时刻第l个时空注意力层的隐藏状态信息从而得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息公式表示如下:
然后,根据式(8)利用查询Q′和键K′求得注意力图;
O′=ATT(Q′,K′)V′ (9)
进一步的,所述气象要素包括2米变温、低云量、总云量、风通量V分量和1000hpa风速。
与现有技术相比,本发明的优点和有益效果是:
1.本发明在气象要素的时空序列标准化处理过程中充分考虑了周围地区气象要素时空变化对目标地区温度的影响,同时针对不同气象要素对温度变化影响程度不同的特点提出RWA模块,综合考虑了各气象要素对温度变化的影响大小。
2.本发明的时空注意力模块包括上下文交互单元和时空记忆单元两部分,上下文交互单元用于对输入信息和上下文信息进行校正更新,保存短期依赖信息,能够有效捕捉温度突变,解决了ConvLSTM中输入与上下文无法交互更新捕捉温度突变的问题,该单元实现了上下文交互校正,更好地捕捉了气象数据变化的短期依赖关系。时空记忆单元对时空维度信息进行建模来捕获气象数据的长期依赖关系,为了更好地捕获空间维度上下文信息的长期依赖关系,时空记忆单元在ConvLSTM的基础上增加了自注意力模块。
附图说明
图1为本发明的整体流程图;
图2(a)为ECMWF多要素气象数据集的2米温度的时空序列图;
图2(b)为ECMWF多要素气象数据集的2米变温的时空序列图;
图2(c)为ECMWF多要素气象数据集的低云量的时空序列图;
图2(d)为ECMWF多要素气象数据集的总云量的时空序列图;
图2(e)为ECMWF多要素气象数据集的风通量V分量的时空序列图;
图2(f)为ECMWF多要素气象数据集的1000hpa风速的时空序列图;
图3为本发明的温度预测模型的整体架构图;
图4为本发明的时空注意力模块的结构示意图;
图5为本发明的上下文交互单元的注意力模块的结构示意图;
图6为本发明的时空记忆单元的自注意力模块的结构示意图。
具体实施方式
下面结合附图和具体实现方式对本发明的技术方案进行详细说明,并不以此限定本申请的保护范围。
本发明为一种融合关联度加权与时空注意力的温度预报方法(简称方法,参见图1-6),包括如下步骤:
第一步、获取气象数据集,该数据集包括温度和多个气象要素的时空序列数据;
获取气象数据集,例如ECMWF多要素气象数据集,图2为ECMWF多要素气象数据集的一个子集,观测时间从2017年1月1日8时至2020年6月10日5时,覆盖经纬度范围分别为105°E-116.25°E和30°N-41.25°N,空间分辨率为0.25度,采样频率为3小时,时空序列数据大小为45×45像素;图2(a)为2米温度的时空序列数据,选取与2米温度最相关的5个气象要素进行关联度分析,分别为2米变温、低云量、总云量、风通量V分量、1000hpa风速,时空序列数据示意图参见图2(b)~(f);
第二步、利用关联度加权分析(Relevance WeightedAnalysis,RWA)模块,计算各个气象要素与温度之间的关联度,将各个气象要素与温度的关联度进行加权,并将各个气象要素的关联度加权结果在通道方向上连接,得到加权后的气象时空序列数据;
由于温度变化受不同气象要素的影响程度各不相同,为了充分考虑不同气象要素对温度变化的关联程度,更好地指导温度预报任务,使用灰色关联分析(GreyRelationAnalysis,GRA)来衡量温度与其他气象要素之间的关联程度;GRA是一种多因素统计分析方法,被用于衡量变量序列间发展趋势异同的关联程度,GRA的基本思想是:首先将原始观测数据进行无量纲化处理,然后计算序列间的关联系数和关联度,最后根据关联度值的大小对多个因素进行排序;具体实现过程如下:
2-1)确定参考序列和比较序列:参考序列是反映任务行为特征的数据序列,比较序列是由任务行为影响因素组成的数据序列,该方法考虑不同气象要素对温度变化的影响程度,因此,参考序列为2米温度的时空序列数据,比较序列为2米变温、低云量、总云量、风通量V分量、1000hpa风速这5个气象要素的时空序列数据;
2-2)对时空序列数据进行标准化处理:为了使不同气象要素各特征之间具有可比性,应用零均值(Z-score)标准化对1000hpa风速、总云量、2米变温、风通量V分量和低云量进行标准化处理,2米温度的标准化处理过程同理,标准化处理公式如下:
其中,Xtj表示t时刻第j个气象要素的时空序列,此处j=1,2,…,5,分别表示1000hpa风速、总云量、2米变温、风通量V分量和低云量;表示t时刻第j个气象要素标准化后的时空序列,μj表示按时间维度计算得到的不同地区第j个气象要素的均值,σj表示第j个气象要素在不同地区的标准差,Xtj、μj和σj均是大小为RC×H×W的张量,其中R表示张量空间,H表示高度,W表示宽度,C表示通道数,取值为1;
2-3)求解参考序列和比较序列之间的关联系数:
关联程度是指曲线间几何形状的差别程度,因此曲线间差值大小可以作为关联程度的衡量尺度,各比较序列与参考序列在各个时刻不同地区的关联系数ξtj可由以下公式表示:
其中,ξtj表示t时刻不同地区温度与第j个气象要素的关联系数,表示在整个时间序列上不同地区温度与第j个气象要素的最小差值,表示在整个时间序列上不同地区温度与第j个气象要素的最大差值,和均为固定值,均是大小为RC×H×W的张量;|·|表示绝对值操作,*表示乘法运算,表示t时刻温度的时空序列,表示t时刻不同地区温度与第j个气象要素的差值,ξtj、均是大小为RC×H×W的张量;ρ表示分辨系数,介于0-1之间,ρ越小代表分辨力越大,本实施例取0.5;
2-4)求解各气象要素与温度之间的关联度:
由于关联系数是温度与各个气象要素在不同时刻的关联程度,因此关联程度的值不止一个,这会导致计算的信息太过于分散而不便于整体比较,因此将不同地区各个时刻的关联系数求平均,用平均值衡量温度与各个气象要素的关联度,则关联度计算公式如下:
其中,rj表示不同地区温度与第j个气象要素的关联度,其大小是RC×H×W的张量,T′表示时间序列长度;
2-5)利用式(4)对关联度进行加权处理,并将各个气象要素的关联度加权结果在通道方向上连接,得到加权后的气象时空序列数据;
其中,X′tj表示t时刻第j个气象要素与温度的关联度加权结果;
将所有气象要素与温度的关联度加权结果在通道方向连接得到加权后的气象时空序列数据X′t;
第三步、基于深度学习神经网络构建温度预报模型,将温度时空序列数据和加权后的气象时空序列数据输入到温度预报模型中,温度预报模型输出预报结果,即未来时刻局部地区的时空序列温度图像;
3-1)构建温度预报模型:如图3所示,温度预报模型以预测循环神经网络(PredRNN)为基础,温度预报模型包括n个时空注意力层(图3的横向),每个时空注意力层包括若干个依次连接的时空注意力(SpatiotemporalAttention,STA)模块(图3的纵向),所有时空注意力层相同位置的时空注意力模块依次连接,使温度预报模型的内存状态沿之字形流经整个网络;
如图4所示,每个时空注意力模块均包括上下文交互(Contextual Interaction,CI)单元和时空记忆(Spatiotemporal Memory,STM)单元两部分,上下文交互单元用于对输入信息和上下文信息进行校正更新,保存短期依赖信息,用于捕捉温度突变;时空记忆单元用于同时捕捉时空维度的相关性并利用全局感受野对空间信息进行建模;在进行温度预报时,时空注意力模块首先利用上下文交互单元对输入信息和上下文信息进行互相校正来记忆短期依赖信息,然后利用时空记忆单元对时空维度信息进行建模来捕获气象数据的长期依赖关系;
上下文交互单元通过注意力机制对输入信息和上下文信息进行相互更新,分别使用三个注意力模块Attention1~Attention3将t-1时刻第l个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的时空记忆信息进行上下文关联更新,得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的时空记忆信息
三个注意力模块的内部结构相同,如图5所示,注意力模块Attention1利用t时刻第l-1个时空注意力层的隐藏状态信息校正更新t-1时刻第l个时空注意力层的隐藏状态信息从而得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息公式表示如下:
然后,根据式(8)利用查询Q′和键K′求得注意力图;
O′=ATT(Q′,K′)V′ (9)
时空记忆单元由时间维度建模、空间维度建模和联合模块三部分组成,公式表达如下:
时空记忆单元利用卷积长短时记忆单元(ConvLSTM)在时间维度上进行建模,捕获温度变化的时间相关性;为了更好地捕获空间维度上下文信息的长期依赖关系,时空记忆单元在ConvLSTM的基础上增加了自注意力模块(Self-Attention);最后,将捕获的时空维度信息通过联合机制进行融合,以预报未来温度;
对于时间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息和t-1时刻第l个时空注意力层的隐藏状态信息通过ConvLSTM获取时域上第l个时空注意力层的温度变化信息,然后利用t-1时刻第l个时空注意力层的时间记忆信息生成t时刻第l个时空注意力层的时间记忆信息公式如下:
其中,ft为遗忘门,it为输入门,gt为输入调制门,σ表示sigmoid激活函数,tanh表示tanh激活函数,°表示哈达玛乘积,Wxf、Whf、Wxi、Whi、Wxg、Whg、bf、bi、bg均为可学习参数;
对于空间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息和t时刻第l-1个时空注意力层的时空记忆信息利用ConvLSTM获取当前时空注意力层的温度变化信息,然后对更新后的t时刻第l-1个时空注意力层的时空记忆信息进行校正,生成更新后的t时刻第l个时空注意力层的时空记忆信息最后,使用自注意力模块对更新后的t时刻第l个时空注意力层的时空记忆信息进行关注,得到t时刻第l个时空注意力层的时空记忆信息公式如下:
其中,ft′为遗忘门,i′t为输入门,g′t为输入调制门,SA(·)表示自注意力模块,W′xf、W′xi、W′xg、Wmf、Wmi、Wmg、b′f、b′i、b′g均为可学习参数;
如图6所示,将更新后的t时刻第l个时空注意力层的时空记忆信息作为自注意力模块的输入,通过关注输入层的状态来构造输出层的状态;具体地,更新后的t时刻第l个时空注意力层的时空记忆信息首先转换为查询Q、键K和值V,公式如下:
O=ATT(Q,K)V (25)
其中,Wo*O表示自注意力特征图;
自注意力模块的模型表示如下:
联合模块使用共享的输出门将上下文交互单元和时空记忆单元的信息进行无缝结合,即将来自水平和垂直方向的记忆信息连接在一起,然后应用1×1卷积层进行降维,使t时刻第l个时空注意力层的隐藏状态信息与时间记忆信息时空记忆信息具有相同维度;联合模块的公式如下:
其中,ot表示输出门,Wxo、Who、Wco、Wmo、bo、W1×1均为可学习参数;
3-2)将步骤1获取的气象数据集中的温度时空序列数据和步骤2得到的加权后的气象时空序列数据作为温度预报模型的输入,对温度预报模型进行训练,得到训练后的温度预报模型;将训练后的温度预报模型用于预报未来时刻局部地区的温度,结果用时空序列温度图像表示。
为了验证本方法的效果,利用ECMWF多要素数据集,使用预测循环神经网络(PredRNN)和本申请的温度预报模型进行温度预报,得到表1所示的对比实验结果。
表1不同模型在ECMWF多要素数据集的对比实验结果
以平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean SquareError,RMSE)、可决系数(R2)作为评价指标,从表1可知,与PredRNN相比,本申请的温度预报模型在三个评价指标均有明显改善,表明在时空记忆单元中使用自注意力模块捕捉气象数据变化空间维度的相关性,利用上下文交互单元感知温度突变,并对相关气象要素进行加权对于提升多要素温度预报结果的重要性,提升了预测准确度。
为了分析RWA模块与CI单元对多要素温度预报结果的影响,在ECMWF多要素数据集上将RWA模块和CI单元分别嵌入到自注意力联合时空网络模型(SA-JSTN)中测试其性能,实验结果如表2所示;自注意力联合时空网络模型以预测循环神经网络(PredRNN)为基础,在PredRNN的时空记忆单元中加入了自注意力模块。
表2 RWA模块和CI单元在SA-JSTN上的消融实验结果
从实验结果可以看出,SA-JSTN模型在加入RWA模块或者CI单元后,均实现了性能的提升。除此之外,在SA-JSTN模型中嵌入CI单元比嵌入RWA模块对温度预报任务更有效。需要注意的是,当SA-JSTN模型中同时嵌入RWA模块和CI单元时性能达到最好。实验结果验证了RWA模块和CI单元的有效性。
本发明未述及之处适用于现有技术。
Claims (3)
1.一种融合关联度加权与时空注意力的温度预报方法,其特征在于,该方法包括如下步骤:
第一步、获取气象数据集,该数据集包括温度和多个气象要素在内的时空序列数据;
第二步、计算各个气象要素与温度之间的关联度,将各个气象要素与温度的关联度进行加权,并将各个气象要素的关联度加权结果在通道方向上连接,得到加权后的气象时空序列数据;
首先,根据式(1)对温度和各个气象要素的时空序列数据进行标准化处理;
其次,计算温度与各个气象要素之间的关联系数;
然后,根据式(3)计算各个气象要素与温度之间的关联度;
其中,rj表示不同地区温度与第j个气象要素的关联度,ξtj表示t时刻不同地区温度与第j个气象要素的关联系数,T'表示时间序列长度;
2-5)利用式(4)对关联度进行加权处理,并将各个气象要素的关联度加权结果在通道方向上连接,得到加权后的气象时空序列数据;
其中,X′tj表示t时刻第j个气象要素与温度的关联度加权结果;
将所有气象要素与温度的关联度加权结果在通道方向连接得到加权后的气象时空序列数据;
第三步、基于深度学习神经网络构建温度预报模型,将温度时空序列数据和加权后的气象时空序列数据输入到温度预报模型中,温度预报模型输出预报结果,即未来时刻局部地区的时空序列温度图像;
温度预报模型以预测循环神经网络为基础,温度预报模型包括n个时空注意力层,每个时空注意力层包括若干个依次连接的时空注意力模块,所有时空注意力层相同位置的时空注意力模块依次连接,使温度预报模型的内存状态沿之字形流经整个网络;
每个时空注意力模块均包括上下文交互单元和时空记忆单元两部分,上下文交互单元包括三个注意力模块Attention1~Attention3,用于将t-1时刻第l个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的时空记忆信息进行上下文关联更新,得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的隐藏状态信息t时刻第l-1个时空注意力层的时空记忆信息
时空记忆单元利用卷积长短时记忆单元捕获时间维度信息,同时在卷积长短时记忆单元的基础上增加自注意力模块捕获空间维度信息,再将捕获的时空维度信息通过联合机制进行融合;
对于时间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息和t-1时刻第l个时空注意力层的隐藏状态信息通过卷积长短时记忆单元获取时域上第l个时空注意力层的温度变化信息,然后利用t-1时刻第l个时空注意力层的时间记忆信息生成t时刻第l个时空注意力层的时间记忆信息公式如下:
其中,ft为遗忘门,it为输入门,gt为输入调制门,σ表示sigmoid激活函数,tanh表示tanh激活函数,表示哈达玛乘积,Wxf、Whf、Wxi、Whi、Wxg、Whg、bf、bi、bg均为可学习参数;
对于空间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息和t时刻第l-1个时空注意力层的时空记忆信息利用卷积长短时记忆单元获取当前时空注意力层的温度变化信息,然后对更新后的t时刻第l-1个时空注意力层的时空记忆信息进行校正,生成更新后的t时刻第l个时空注意力层的时空记忆信息最后,使用自注意力模块对更新后的t时刻第l个时空注意力层的时空记忆信息进行关注,得到t时刻第l个时空注意力层的时空记忆信息公式如下:
其中,f′t为遗忘门,i′t为输入门,g′t为输入调制门,SA(·)表示自注意力模块,W′xf、W′xi、W′xg、Wmf、Wmi、Wmg、b′f、b′i、b′g均为可学习参数;
O=ATT(Q,K)V (25)
其中,Wo*O表示自注意力特征图;
自注意力模块的模型表示如下:
2.根据权利要求1所述的融合关联度加权与时空注意力的温度预报方法,其特征在于,在第三步中,注意力模块Attention1利用t时刻第l-1个时空注意力层的隐藏状态信息校正更新t-1时刻第l个时空注意力层的隐藏状态信息从而得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息公式表示如下:
然后,根据式(8)利用查询Q′和键K′求得注意力图;
O′=ATT(Q′,K′)V′ (9)
3.根据权利要求1所述的融合关联度加权与时空注意力的温度预报方法,其特征在于,所述气象要素包括2米变温、低云量、总云量、风通量V分量和1000hpa风速。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210535440.1A CN114936691A (zh) | 2022-05-06 | 2022-05-06 | 一种融合关联度加权与时空注意力的温度预报方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210535440.1A CN114936691A (zh) | 2022-05-06 | 2022-05-06 | 一种融合关联度加权与时空注意力的温度预报方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114936691A true CN114936691A (zh) | 2022-08-23 |
Family
ID=82864003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210535440.1A Pending CN114936691A (zh) | 2022-05-06 | 2022-05-06 | 一种融合关联度加权与时空注意力的温度预报方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114936691A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115307780A (zh) * | 2022-09-29 | 2022-11-08 | 中国海洋大学 | 基于时空信息交互融合的海表温度预测方法、系统及应用 |
CN115510767A (zh) * | 2022-11-21 | 2022-12-23 | 四川省气象服务中心(四川省专业气象台 四川省气象影视中心) | 基于深度时空网络的区域气温预测方法 |
CN116304778A (zh) * | 2023-05-17 | 2023-06-23 | 温州华嘉电器有限公司 | 一种用于小型断路器维护数据处理方法 |
CN117237781A (zh) * | 2023-11-16 | 2023-12-15 | 哈尔滨工业大学(威海) | 一种基于注意力机制的双元素融合时空预测方法 |
-
2022
- 2022-05-06 CN CN202210535440.1A patent/CN114936691A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115307780A (zh) * | 2022-09-29 | 2022-11-08 | 中国海洋大学 | 基于时空信息交互融合的海表温度预测方法、系统及应用 |
CN115307780B (zh) * | 2022-09-29 | 2023-01-06 | 中国海洋大学 | 基于时空信息交互融合的海表温度预测方法、系统及应用 |
CN115510767A (zh) * | 2022-11-21 | 2022-12-23 | 四川省气象服务中心(四川省专业气象台 四川省气象影视中心) | 基于深度时空网络的区域气温预测方法 |
CN115510767B (zh) * | 2022-11-21 | 2023-10-27 | 四川省气象服务中心(四川省专业气象台 四川省气象影视中心) | 基于深度时空网络的区域气温预测方法 |
CN116304778A (zh) * | 2023-05-17 | 2023-06-23 | 温州华嘉电器有限公司 | 一种用于小型断路器维护数据处理方法 |
CN117237781A (zh) * | 2023-11-16 | 2023-12-15 | 哈尔滨工业大学(威海) | 一种基于注意力机制的双元素融合时空预测方法 |
CN117237781B (zh) * | 2023-11-16 | 2024-03-19 | 哈尔滨工业大学(威海) | 一种基于注意力机制的双元素融合时空预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ghimire et al. | Deep solar radiation forecasting with convolutional neural network and long short-term memory network algorithms | |
CN111798051B (zh) | 基于长短期记忆神经网络的空气质量时空预测方法 | |
CN114936691A (zh) | 一种融合关联度加权与时空注意力的温度预报方法 | |
Yang et al. | Solar irradiance forecasting using spatio-temporal empirical kriging and vector autoregressive models with parameter shrinkage | |
Mu et al. | ENSO forecasting over multiple time horizons using ConvLSTM network and rolling mechanism | |
WO2006120724A1 (ja) | ニューラルネットワークを用いた地理情報システム | |
Jonnalagadda et al. | Forecasting atmospheric visibility using auto regressive recurrent neural network | |
CN111859054B (zh) | 气象卫星数据的处理方法及装置 | |
CN112183625A (zh) | 一种基于深度学习的pm2.5高精度时空预测方法 | |
CN115629160A (zh) | 一种基于时空图的空气污染物浓度预测方法及系统 | |
Dai et al. | Ensemble learning technology for coastal flood forecasting in internet-of-things-enabled smart city | |
Liu et al. | Estimation of precipitation induced by tropical cyclones based on machine‐learning‐enhanced analogue identification of numerical prediction | |
Zheng et al. | Weather image-based short-term dense wind speed forecast with a ConvLSTM-LSTM deep learning model | |
CN116415730A (zh) | 一种预测水位的融合自注意力机制时空深度学习模型 | |
Niu et al. | Automatic quality control of crowdsourced rainfall data with multiple noises: A machine learning approach | |
Mekanik et al. | Forecasting Victorian spring rainfall using ENSO and IOD: A comparison of linear multiple regression and nonlinear ANN | |
CN117131991A (zh) | 基于混合神经网络的城市降雨量预测方法及平台 | |
CN117233869A (zh) | 一种基于GRU-BiTCN的站点短期风速预测方法 | |
Li et al. | PV resource evaluation based on Xception and VGG19 two-layer network algorithm | |
CN116720156A (zh) | 基于图神经网络多模态气象数据融合的气象要素预报方法 | |
CN116822716A (zh) | 一种基于时空注意力的台风预测方法、系统、设备及介质 | |
CN116960962A (zh) | 一种跨区域数据融合的中长期区域负荷预测方法 | |
Bosma et al. | Estimating solar and wind power production using computer vision deep learning techniques on weather maps | |
Deo et al. | Identification of minimal timespan problem for recurrent neural networks with application to cyclone wind-intensity prediction | |
CN114970743A (zh) | 一种基于多模态深度学习的多源遥感降雨数据融合方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |