CN114936691A - 一种融合关联度加权与时空注意力的温度预报方法 - Google Patents

一种融合关联度加权与时空注意力的温度预报方法 Download PDF

Info

Publication number
CN114936691A
CN114936691A CN202210535440.1A CN202210535440A CN114936691A CN 114936691 A CN114936691 A CN 114936691A CN 202210535440 A CN202210535440 A CN 202210535440A CN 114936691 A CN114936691 A CN 114936691A
Authority
CN
China
Prior art keywords
time
space
attention
temperature
meteorological
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210535440.1A
Other languages
English (en)
Inventor
石陆魁
梁楠楹
张敬业
赵瑞云
张军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei University of Technology
Original Assignee
Hebei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei University of Technology filed Critical Hebei University of Technology
Priority to CN202210535440.1A priority Critical patent/CN114936691A/zh
Publication of CN114936691A publication Critical patent/CN114936691A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明为一种融合关联度加权与时空注意力的温度预报方法,首先获取包括温度和多个气象要素在内的气象数据集;接着,计算各个气象要素与温度之间的关联度,将关联度进行加权,并将所有关联度加权结果在通道方向连接,得到加权后的气象时空序列数据;最后,以预测循环神经网络为基础构建温度预报模型,将温度和加权后的气象时空序列数据输入到温度预报模型中,用于未来时刻局部地区的温度预报;温度预报模型包括n个时空注意力层,每个时空注意力层包括若干个时空注意力模块,时空注意力模块利用上下文交互单元对输入和上下文信息进行互相校正来记忆短期依赖信息,利用时空记忆单元捕获气象数据的长期依赖关系。该方法能够捕捉温度突变,预报准确度更高。

Description

一种融合关联度加权与时空注意力的温度预报方法
技术领域
本发明属于温度预报技术领域,具体是一种融合关联度加权与时空注意力的温度预报方法,可用于温度预报领域基于多要素时空序列的温度预测。
背景技术
温度预报是气象预报领域的研究热点,其目的是根据历史气象数据对未来一段时间内的温度变化进行精确预报,被广泛应用于交通控制、传染病预防、环境监测和灾害预警等领域。自动气象观测技术、遥感卫星工程技术以及智能网格预报技术的迅速发展,为基于深度学习的温度预报研究提供了丰富的数据支持。
传统的温度预报方法主要是基于物理的数值模型,它在获取数据和预测温度时需要耗费大量的计算资源和时间。随着多源、海量气象数据的出现,产生了数据驱动模型。深度学习技术特别是卷积神经网络和循环神经网络在温度预报领域取得了里程碑式的进步,更好地模拟了气象数据的非线性关系,并且解决了温度预报中数据依赖和机制复杂的问题。然而,循环神经网络倾向于时间结构的建模,缺乏捕捉温度空间变化的能力;卷积神经网络更注重空间外观变化,捕捉时序变化规律的能力较差。事实上,某地区温度变化的随机行为不仅受该地区历史气象数据的影响,而且受周围地区气象要素时空变化的影响,因此利用深度学习预测温度需要考虑长距离时空依赖。
现有的时空序列预测算法虽然能够从海量气象数据中高效准确地提取信息,但是它们通常分别对时空维度进行建模并且使用卷积操作捕捉气象数据的空间相关性,没有充分考虑温度变化的时空相关性和地理因素对温度变化的影响,忽略了不同气象要素对温度变化的影响程度,并且难以感知温度突变。
发明内容
针对现有技术的不足,本发明拟解决的技术问题是,提供一种融合关联度加权与时空注意力的温度预报方法。
本发明解决所述技术问题采用的技术方案如下:
一种融合关联度加权与时空注意力的温度预报方法,其特征在于,该方法包括如下步骤:
第一步、获取气象数据集,该数据集包括温度和多个气象要素在内的时空序列数据;
第二步、计算各个气象要素与温度之间的关联度,将各个气象要素与温度的关联度进行加权,并将各个气象要素的关联度加权结果在通道方向上连接,得到加权后的气象时空序列数据;
首先,根据式(1)对温度和各个气象要素的时空序列数据进行标准化处理;
Figure BDA0003628694500000011
其中,Xtj表示t时刻第j个气象要素的时空序列,
Figure BDA0003628694500000012
表示t时刻第j个气象要素标准化后的时空序列,μj表示按时间维度计算得到的不同地区第j个气象要素的均值,σj表示第j个气象要素在不同地区的标准差;
其次,计算温度与各个气象要素之间的关联系数;
然后,根据式(3)计算各个气象要素与温度之间的关联度;
Figure BDA0003628694500000021
其中,rj表示不同地区温度与第j个气象要素的关联度,ξtj表示t时刻不同地区温度与第j个气象要素的关联系数,T′表示时间序列长度;
2-5)利用式(4)对关联度进行加权处理,并将各个气象要素的关联度加权结果在通道方向连接,得到加权后的气象时空序列数据;
Figure BDA0003628694500000022
其中,X′tj表示t时刻第j个气象要素与温度的关联度加权结果;
将所有气象要素与温度的关联度加权结果在通道方向连接得到加权后的气象时空序列数据;
第三步、基于深度学习神经网络构建温度预报模型,将温度时空序列数据和加权后的气象时空序列数据输入到温度预报模型中,温度预报模型输出预报结果,即未来时刻局部地区的时空序列温度图像;
温度预报模型以预测循环神经网络为基础,温度预报模型包括n个时空注意力层,每个时空注意力层包括若干个依次连接的时空注意力模块,所有时空注意力层相同位置的时空注意力模块依次连接,使温度预报模型的内存状态沿之字形流经整个网络;
每个时空注意力模块均包括上下文交互单元和时空记忆单元两部分,上下文交互单元包括三个注意力模块Attention1~Attention3,用于将t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA0003628694500000023
t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA0003628694500000024
t时刻第l-1个时空注意力层的时空记忆信息
Figure BDA0003628694500000025
进行上下文关联更新,得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA0003628694500000026
t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA0003628694500000027
t时刻第l-1个时空注意力层的时空记忆信息
Figure BDA0003628694500000028
时空记忆单元利用卷积长短时记忆单元捕获时间维度信息,同时在卷积长短时记忆单元的基础上增加自注意力模块捕获空间维度信息,再将捕获的时空维度信息通过联合机制进行融合;
对于时间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA0003628694500000029
和t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA00036286945000000210
通过卷积长短时记忆单元获取时域上第l个时空注意力层的温度变化信息,然后利用t-1时刻第l个时空注意力层的时间记忆信息
Figure BDA00036286945000000211
生成t时刻第l个时空注意力层的时间记忆信息
Figure BDA00036286945000000212
公式如下:
Figure BDA00036286945000000213
Figure BDA0003628694500000031
Figure BDA0003628694500000032
Figure BDA0003628694500000033
其中,ft为遗忘门,it为输入门,gt为输入调制门,σ表示sigmoid激活函数,tanh表示tanh激活函数,°表示哈达玛乘积,Wxf、Whf、Wxi、Whi、Wxg、Whg、bf、bi、bg均为可学习参数;
对于空间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA0003628694500000034
和t时刻第l-1个时空注意力层的时空记忆信息
Figure BDA0003628694500000035
利用卷积长短时记忆单元获取当前时空注意力层的温度变化信息,然后对更新后的t时刻第l-1个时空注意力层的时空记忆信息
Figure BDA0003628694500000036
进行校正,生成更新后的t时刻第l个时空注意力层的时空记忆信息
Figure BDA0003628694500000037
最后,使用自注意力模块对更新后的t时刻第l个时空注意力层的时空记忆信息
Figure BDA0003628694500000038
进行关注,得到t时刻第l个时空注意力层的时空记忆信息
Figure BDA0003628694500000039
公式如下:
Figure BDA00036286945000000310
Figure BDA00036286945000000311
Figure BDA00036286945000000312
Figure BDA00036286945000000313
Figure BDA00036286945000000314
其中,ft′为遗忘门,i′t为输入门,g′t为输入调制门,SA(·)表示自注意力模块,W′xf、W′xi、W′xg、Wmf、Wmi、Wmg、b′f、b′i、b′g均为可学习参数;
将更新后的t时刻第l个时空注意力层的时空记忆信息
Figure BDA00036286945000000315
作为自注意力模块的输入,更新后的t时刻第l个时空注意力层的时空记忆信息
Figure BDA00036286945000000316
首先转换为查询Q、键K和值V,公式如下:
Figure BDA00036286945000000317
其中,
Figure BDA00036286945000000318
为可训练的1×1卷积参数矩阵;
自注意力模块的输出为t时刻第l个时空注意力层的时空记忆信息
Figure BDA00036286945000000319
公式表示如下:
Figure BDA00036286945000000320
O=ATT(Q,K)V (25)
其中,Wo*O表示自注意力特征图;
自注意力模块的模型表示如下:
Figure BDA0003628694500000041
其中,
Figure BDA0003628694500000042
为比例因子。
进一步的,在第三步中,注意力模块Attention1利用t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA0003628694500000043
校正更新t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA0003628694500000044
从而得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA0003628694500000045
公式表示如下:
Figure BDA0003628694500000046
具体地,首先将t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA0003628694500000047
转换为查询Q′,将t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA0003628694500000048
转换为键K′和值V′,公式如下:
Figure BDA0003628694500000049
Figure BDA00036286945000000410
其中,W′Q为可学习参数,
Figure BDA00036286945000000411
为可学习的1×1卷积参数矩阵;
然后,根据式(8)利用查询Q′和键K′求得注意力图;
Figure BDA00036286945000000412
其中,ATT(·)表示注意力操作,
Figure BDA00036286945000000413
为比例因子,T表示矩阵转置;
最后,根据式(9)、(10)计算得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA00036286945000000414
O′=ATT(Q′,K′)V′ (9)
Figure BDA00036286945000000415
其中,(W′O*O′)表示注意力特征图,通过注意力特征图对t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA00036286945000000416
进行作用,最终实现了
Figure BDA00036286945000000417
Figure BDA00036286945000000418
的关联,即上下文关联。
进一步的,所述气象要素包括2米变温、低云量、总云量、风通量V分量和1000hpa风速。
与现有技术相比,本发明的优点和有益效果是:
1.本发明在气象要素的时空序列标准化处理过程中充分考虑了周围地区气象要素时空变化对目标地区温度的影响,同时针对不同气象要素对温度变化影响程度不同的特点提出RWA模块,综合考虑了各气象要素对温度变化的影响大小。
2.本发明的时空注意力模块包括上下文交互单元和时空记忆单元两部分,上下文交互单元用于对输入信息和上下文信息进行校正更新,保存短期依赖信息,能够有效捕捉温度突变,解决了ConvLSTM中输入与上下文无法交互更新捕捉温度突变的问题,该单元实现了上下文交互校正,更好地捕捉了气象数据变化的短期依赖关系。时空记忆单元对时空维度信息进行建模来捕获气象数据的长期依赖关系,为了更好地捕获空间维度上下文信息的长期依赖关系,时空记忆单元在ConvLSTM的基础上增加了自注意力模块。
附图说明
图1为本发明的整体流程图;
图2(a)为ECMWF多要素气象数据集的2米温度的时空序列图;
图2(b)为ECMWF多要素气象数据集的2米变温的时空序列图;
图2(c)为ECMWF多要素气象数据集的低云量的时空序列图;
图2(d)为ECMWF多要素气象数据集的总云量的时空序列图;
图2(e)为ECMWF多要素气象数据集的风通量V分量的时空序列图;
图2(f)为ECMWF多要素气象数据集的1000hpa风速的时空序列图;
图3为本发明的温度预测模型的整体架构图;
图4为本发明的时空注意力模块的结构示意图;
图5为本发明的上下文交互单元的注意力模块的结构示意图;
图6为本发明的时空记忆单元的自注意力模块的结构示意图。
具体实施方式
下面结合附图和具体实现方式对本发明的技术方案进行详细说明,并不以此限定本申请的保护范围。
本发明为一种融合关联度加权与时空注意力的温度预报方法(简称方法,参见图1-6),包括如下步骤:
第一步、获取气象数据集,该数据集包括温度和多个气象要素的时空序列数据;
获取气象数据集,例如ECMWF多要素气象数据集,图2为ECMWF多要素气象数据集的一个子集,观测时间从2017年1月1日8时至2020年6月10日5时,覆盖经纬度范围分别为105°E-116.25°E和30°N-41.25°N,空间分辨率为0.25度,采样频率为3小时,时空序列数据大小为45×45像素;图2(a)为2米温度的时空序列数据,选取与2米温度最相关的5个气象要素进行关联度分析,分别为2米变温、低云量、总云量、风通量V分量、1000hpa风速,时空序列数据示意图参见图2(b)~(f);
第二步、利用关联度加权分析(Relevance WeightedAnalysis,RWA)模块,计算各个气象要素与温度之间的关联度,将各个气象要素与温度的关联度进行加权,并将各个气象要素的关联度加权结果在通道方向上连接,得到加权后的气象时空序列数据;
由于温度变化受不同气象要素的影响程度各不相同,为了充分考虑不同气象要素对温度变化的关联程度,更好地指导温度预报任务,使用灰色关联分析(GreyRelationAnalysis,GRA)来衡量温度与其他气象要素之间的关联程度;GRA是一种多因素统计分析方法,被用于衡量变量序列间发展趋势异同的关联程度,GRA的基本思想是:首先将原始观测数据进行无量纲化处理,然后计算序列间的关联系数和关联度,最后根据关联度值的大小对多个因素进行排序;具体实现过程如下:
2-1)确定参考序列和比较序列:参考序列是反映任务行为特征的数据序列,比较序列是由任务行为影响因素组成的数据序列,该方法考虑不同气象要素对温度变化的影响程度,因此,参考序列为2米温度的时空序列数据,比较序列为2米变温、低云量、总云量、风通量V分量、1000hpa风速这5个气象要素的时空序列数据;
2-2)对时空序列数据进行标准化处理:为了使不同气象要素各特征之间具有可比性,应用零均值(Z-score)标准化对1000hpa风速、总云量、2米变温、风通量V分量和低云量进行标准化处理,2米温度的标准化处理过程同理,标准化处理公式如下:
Figure BDA0003628694500000061
其中,Xtj表示t时刻第j个气象要素的时空序列,此处j=1,2,…,5,分别表示1000hpa风速、总云量、2米变温、风通量V分量和低云量;
Figure BDA0003628694500000062
表示t时刻第j个气象要素标准化后的时空序列,μj表示按时间维度计算得到的不同地区第j个气象要素的均值,σj表示第j个气象要素在不同地区的标准差,Xtj
Figure BDA0003628694500000063
μj和σj均是大小为RC×H×W的张量,其中R表示张量空间,H表示高度,W表示宽度,C表示通道数,取值为1;
2-3)求解参考序列和比较序列之间的关联系数:
关联程度是指曲线间几何形状的差别程度,因此曲线间差值大小可以作为关联程度的衡量尺度,各比较序列与参考序列在各个时刻不同地区的关联系数ξtj可由以下公式表示:
Figure BDA0003628694500000064
其中,ξtj表示t时刻不同地区温度与第j个气象要素的关联系数,
Figure BDA0003628694500000065
表示在整个时间序列上不同地区温度与第j个气象要素的最小差值,
Figure BDA0003628694500000066
表示在整个时间序列上不同地区温度与第j个气象要素的最大差值,
Figure BDA0003628694500000067
Figure BDA0003628694500000068
均为固定值,均是大小为RC×H×W的张量;|·|表示绝对值操作,*表示乘法运算,
Figure BDA0003628694500000069
表示t时刻温度的时空序列,
Figure BDA00036286945000000610
表示t时刻不同地区温度与第j个气象要素的差值,ξtj
Figure BDA00036286945000000611
均是大小为RC×H×W的张量;ρ表示分辨系数,介于0-1之间,ρ越小代表分辨力越大,本实施例取0.5;
2-4)求解各气象要素与温度之间的关联度:
由于关联系数是温度与各个气象要素在不同时刻的关联程度,因此关联程度的值不止一个,这会导致计算的信息太过于分散而不便于整体比较,因此将不同地区各个时刻的关联系数求平均,用平均值衡量温度与各个气象要素的关联度,则关联度计算公式如下:
Figure BDA0003628694500000071
其中,rj表示不同地区温度与第j个气象要素的关联度,其大小是RC×H×W的张量,T′表示时间序列长度;
2-5)利用式(4)对关联度进行加权处理,并将各个气象要素的关联度加权结果在通道方向上连接,得到加权后的气象时空序列数据;
Figure BDA0003628694500000072
其中,X′tj表示t时刻第j个气象要素与温度的关联度加权结果;
将所有气象要素与温度的关联度加权结果在通道方向连接得到加权后的气象时空序列数据X′t
第三步、基于深度学习神经网络构建温度预报模型,将温度时空序列数据和加权后的气象时空序列数据输入到温度预报模型中,温度预报模型输出预报结果,即未来时刻局部地区的时空序列温度图像;
3-1)构建温度预报模型:如图3所示,温度预报模型以预测循环神经网络(PredRNN)为基础,温度预报模型包括n个时空注意力层(图3的横向),每个时空注意力层包括若干个依次连接的时空注意力(SpatiotemporalAttention,STA)模块(图3的纵向),所有时空注意力层相同位置的时空注意力模块依次连接,使温度预报模型的内存状态沿之字形流经整个网络;
如图4所示,每个时空注意力模块均包括上下文交互(Contextual Interaction,CI)单元和时空记忆(Spatiotemporal Memory,STM)单元两部分,上下文交互单元用于对输入信息和上下文信息进行校正更新,保存短期依赖信息,用于捕捉温度突变;时空记忆单元用于同时捕捉时空维度的相关性并利用全局感受野对空间信息进行建模;在进行温度预报时,时空注意力模块首先利用上下文交互单元对输入信息和上下文信息进行互相校正来记忆短期依赖信息,然后利用时空记忆单元对时空维度信息进行建模来捕获气象数据的长期依赖关系;
上下文交互单元通过注意力机制对输入信息和上下文信息进行相互更新,分别使用三个注意力模块Attention1~Attention3将t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA0003628694500000073
t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA0003628694500000074
t时刻第l-1个时空注意力层的时空记忆信息
Figure BDA0003628694500000075
进行上下文关联更新,得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA0003628694500000076
t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA0003628694500000077
t时刻第l-1个时空注意力层的时空记忆信息
Figure BDA0003628694500000078
三个注意力模块的内部结构相同,如图5所示,注意力模块Attention1利用t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA0003628694500000081
校正更新t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA0003628694500000082
从而得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA0003628694500000083
公式表示如下:
Figure BDA0003628694500000084
具体地,首先将t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA0003628694500000085
转换为查询Q′,将t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA0003628694500000086
转换为键K′和值V′,公式如下:
Figure BDA0003628694500000087
Figure BDA0003628694500000088
其中,W′Q为可学习参数,
Figure BDA0003628694500000089
为可学习的1×1卷积参数矩阵;
然后,根据式(8)利用查询Q′和键K′求得注意力图;
Figure BDA00036286945000000810
其中,ATT(·)表示注意力操作,
Figure BDA00036286945000000811
为比例因子,T表示矩阵转置;
最后,根据式(9)、(10)计算得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA00036286945000000812
O′=ATT(Q′,K′)V′ (9)
Figure BDA00036286945000000813
其中,(W′O*O′)表示注意力特征图,通过注意力特征图对t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA00036286945000000814
进行作用,最终实现了
Figure BDA00036286945000000815
Figure BDA00036286945000000816
的关联,即上下文关联;
同理,注意力模块Attention2利用t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA00036286945000000817
校正更新t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA00036286945000000818
得到更新后的t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA00036286945000000819
公式如下:
Figure BDA00036286945000000820
注意力模块Attention3利用t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA00036286945000000821
校正更新t时刻第l-1个时空注意力层的时空记忆信息
Figure BDA00036286945000000822
得到更新后的t时刻第l-1个时空注意力层的时空记忆信息
Figure BDA00036286945000000823
公式如下:
Figure BDA0003628694500000091
在上下文交互单元中,当l=1时,
Figure BDA0003628694500000092
X′t表示t时刻加权后的气象时空序列;
时空记忆单元由时间维度建模、空间维度建模和联合模块三部分组成,公式表达如下:
Figure BDA0003628694500000093
其中,STMl表示第l个时空注意力层的时空记忆单元,
Figure BDA0003628694500000094
表示t-1时刻第l个时空注意力层的时间记忆信息;
Figure BDA0003628694500000095
均为大小为RC×H×W的张量;
时空记忆单元利用卷积长短时记忆单元(ConvLSTM)在时间维度上进行建模,捕获温度变化的时间相关性;为了更好地捕获空间维度上下文信息的长期依赖关系,时空记忆单元在ConvLSTM的基础上增加了自注意力模块(Self-Attention);最后,将捕获的时空维度信息通过联合机制进行融合,以预报未来温度;
对于时间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA0003628694500000096
和t-1时刻第l个时空注意力层的隐藏状态信息
Figure BDA0003628694500000097
通过ConvLSTM获取时域上第l个时空注意力层的温度变化信息,然后利用t-1时刻第l个时空注意力层的时间记忆信息
Figure BDA0003628694500000098
生成t时刻第l个时空注意力层的时间记忆信息
Figure BDA0003628694500000099
公式如下:
Figure BDA00036286945000000910
Figure BDA00036286945000000911
Figure BDA00036286945000000912
Figure BDA00036286945000000913
其中,ft为遗忘门,it为输入门,gt为输入调制门,σ表示sigmoid激活函数,tanh表示tanh激活函数,°表示哈达玛乘积,Wxf、Whf、Wxi、Whi、Wxg、Whg、bf、bi、bg均为可学习参数;
对于空间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息
Figure BDA00036286945000000914
和t时刻第l-1个时空注意力层的时空记忆信息
Figure BDA00036286945000000915
利用ConvLSTM获取当前时空注意力层的温度变化信息,然后对更新后的t时刻第l-1个时空注意力层的时空记忆信息
Figure BDA00036286945000000916
进行校正,生成更新后的t时刻第l个时空注意力层的时空记忆信息
Figure BDA00036286945000000917
最后,使用自注意力模块对更新后的t时刻第l个时空注意力层的时空记忆信息
Figure BDA00036286945000000918
进行关注,得到t时刻第l个时空注意力层的时空记忆信息
Figure BDA00036286945000000919
公式如下:
Figure BDA00036286945000000920
Figure BDA00036286945000000921
Figure BDA00036286945000000922
Figure BDA0003628694500000101
Figure BDA0003628694500000102
其中,ft′为遗忘门,i′t为输入门,g′t为输入调制门,SA(·)表示自注意力模块,W′xf、W′xi、W′xg、Wmf、Wmi、Wmg、b′f、b′i、b′g均为可学习参数;
如图6所示,将更新后的t时刻第l个时空注意力层的时空记忆信息
Figure BDA0003628694500000103
作为自注意力模块的输入,通过关注输入层的状态来构造输出层的状态;具体地,更新后的t时刻第l个时空注意力层的时空记忆信息
Figure BDA0003628694500000104
首先转换为查询Q、键K和值V,公式如下:
Figure BDA0003628694500000105
其中,
Figure BDA0003628694500000106
为可训练的1×1卷积参数矩阵;
自注意力模块的输出为t时刻第l个时空注意力层的时空记忆信息
Figure BDA0003628694500000107
公式表示如下:
Figure BDA0003628694500000108
O=ATT(Q,K)V (25)
其中,Wo*O表示自注意力特征图;
自注意力模块的模型表示如下:
Figure BDA0003628694500000109
其中,
Figure BDA00036286945000001010
为比例因子;
联合模块使用共享的输出门将上下文交互单元和时空记忆单元的信息进行无缝结合,即将来自水平和垂直方向的记忆信息连接在一起,然后应用1×1卷积层进行降维,使t时刻第l个时空注意力层的隐藏状态信息
Figure BDA00036286945000001011
与时间记忆信息
Figure BDA00036286945000001012
时空记忆信息
Figure BDA00036286945000001013
具有相同维度;联合模块的公式如下:
Figure BDA00036286945000001014
Figure BDA00036286945000001015
其中,ot表示输出门,Wxo、Who、Wco、Wmo、bo、W1×1均为可学习参数;
3-2)将步骤1获取的气象数据集中的温度时空序列数据和步骤2得到的加权后的气象时空序列数据作为温度预报模型的输入,对温度预报模型进行训练,得到训练后的温度预报模型;将训练后的温度预报模型用于预报未来时刻局部地区的温度,结果用时空序列温度图像表示。
为了验证本方法的效果,利用ECMWF多要素数据集,使用预测循环神经网络(PredRNN)和本申请的温度预报模型进行温度预报,得到表1所示的对比实验结果。
表1不同模型在ECMWF多要素数据集的对比实验结果
Figure BDA0003628694500000111
以平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean SquareError,RMSE)、可决系数(R2)作为评价指标,从表1可知,与PredRNN相比,本申请的温度预报模型在三个评价指标均有明显改善,表明在时空记忆单元中使用自注意力模块捕捉气象数据变化空间维度的相关性,利用上下文交互单元感知温度突变,并对相关气象要素进行加权对于提升多要素温度预报结果的重要性,提升了预测准确度。
为了分析RWA模块与CI单元对多要素温度预报结果的影响,在ECMWF多要素数据集上将RWA模块和CI单元分别嵌入到自注意力联合时空网络模型(SA-JSTN)中测试其性能,实验结果如表2所示;自注意力联合时空网络模型以预测循环神经网络(PredRNN)为基础,在PredRNN的时空记忆单元中加入了自注意力模块。
表2 RWA模块和CI单元在SA-JSTN上的消融实验结果
Figure BDA0003628694500000112
从实验结果可以看出,SA-JSTN模型在加入RWA模块或者CI单元后,均实现了性能的提升。除此之外,在SA-JSTN模型中嵌入CI单元比嵌入RWA模块对温度预报任务更有效。需要注意的是,当SA-JSTN模型中同时嵌入RWA模块和CI单元时性能达到最好。实验结果验证了RWA模块和CI单元的有效性。
本发明未述及之处适用于现有技术。

Claims (3)

1.一种融合关联度加权与时空注意力的温度预报方法,其特征在于,该方法包括如下步骤:
第一步、获取气象数据集,该数据集包括温度和多个气象要素在内的时空序列数据;
第二步、计算各个气象要素与温度之间的关联度,将各个气象要素与温度的关联度进行加权,并将各个气象要素的关联度加权结果在通道方向上连接,得到加权后的气象时空序列数据;
首先,根据式(1)对温度和各个气象要素的时空序列数据进行标准化处理;
Figure FDA0003628694490000011
其中,Xtj表示t时刻第j个气象要素的时空序列,
Figure FDA0003628694490000012
表示t时刻第j个气象要素标准化后的时空序列,μj表示按时间维度计算得到的不同地区第j个气象要素的均值,σj表示第j个气象要素在不同地区的标准差;
其次,计算温度与各个气象要素之间的关联系数;
然后,根据式(3)计算各个气象要素与温度之间的关联度;
Figure FDA0003628694490000013
其中,rj表示不同地区温度与第j个气象要素的关联度,ξtj表示t时刻不同地区温度与第j个气象要素的关联系数,T'表示时间序列长度;
2-5)利用式(4)对关联度进行加权处理,并将各个气象要素的关联度加权结果在通道方向上连接,得到加权后的气象时空序列数据;
Figure FDA0003628694490000014
其中,X′tj表示t时刻第j个气象要素与温度的关联度加权结果;
将所有气象要素与温度的关联度加权结果在通道方向连接得到加权后的气象时空序列数据;
第三步、基于深度学习神经网络构建温度预报模型,将温度时空序列数据和加权后的气象时空序列数据输入到温度预报模型中,温度预报模型输出预报结果,即未来时刻局部地区的时空序列温度图像;
温度预报模型以预测循环神经网络为基础,温度预报模型包括n个时空注意力层,每个时空注意力层包括若干个依次连接的时空注意力模块,所有时空注意力层相同位置的时空注意力模块依次连接,使温度预报模型的内存状态沿之字形流经整个网络;
每个时空注意力模块均包括上下文交互单元和时空记忆单元两部分,上下文交互单元包括三个注意力模块Attention1~Attention3,用于将t-1时刻第l个时空注意力层的隐藏状态信息
Figure FDA0003628694490000015
t时刻第l-1个时空注意力层的隐藏状态信息
Figure FDA0003628694490000016
t时刻第l-1个时空注意力层的时空记忆信息
Figure FDA0003628694490000017
进行上下文关联更新,得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息
Figure FDA0003628694490000021
t时刻第l-1个时空注意力层的隐藏状态信息
Figure FDA0003628694490000022
t时刻第l-1个时空注意力层的时空记忆信息
Figure FDA0003628694490000023
时空记忆单元利用卷积长短时记忆单元捕获时间维度信息,同时在卷积长短时记忆单元的基础上增加自注意力模块捕获空间维度信息,再将捕获的时空维度信息通过联合机制进行融合;
对于时间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息
Figure FDA0003628694490000024
和t-1时刻第l个时空注意力层的隐藏状态信息
Figure FDA0003628694490000025
通过卷积长短时记忆单元获取时域上第l个时空注意力层的温度变化信息,然后利用t-1时刻第l个时空注意力层的时间记忆信息
Figure FDA0003628694490000026
生成t时刻第l个时空注意力层的时间记忆信息
Figure FDA0003628694490000027
公式如下:
Figure FDA0003628694490000028
Figure FDA0003628694490000029
Figure FDA00036286944900000210
Figure FDA00036286944900000211
其中,ft为遗忘门,it为输入门,gt为输入调制门,σ表示sigmoid激活函数,tanh表示tanh激活函数,
Figure FDA00036286944900000224
表示哈达玛乘积,Wxf、Whf、Wxi、Whi、Wxg、Whg、bf、bi、bg均为可学习参数;
对于空间维度信息的捕获,首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息
Figure FDA00036286944900000212
和t时刻第l-1个时空注意力层的时空记忆信息
Figure FDA00036286944900000213
利用卷积长短时记忆单元获取当前时空注意力层的温度变化信息,然后对更新后的t时刻第l-1个时空注意力层的时空记忆信息
Figure FDA00036286944900000214
进行校正,生成更新后的t时刻第l个时空注意力层的时空记忆信息
Figure FDA00036286944900000215
最后,使用自注意力模块对更新后的t时刻第l个时空注意力层的时空记忆信息
Figure FDA00036286944900000216
进行关注,得到t时刻第l个时空注意力层的时空记忆信息
Figure FDA00036286944900000217
公式如下:
Figure FDA00036286944900000218
Figure FDA00036286944900000219
Figure FDA00036286944900000220
Figure FDA00036286944900000221
Figure FDA00036286944900000222
其中,f′t为遗忘门,i′t为输入门,g′t为输入调制门,SA(·)表示自注意力模块,W′xf、W′xi、W′xg、Wmf、Wmi、Wmg、b′f、b′i、b′g均为可学习参数;
将更新后的t时刻第l个时空注意力层的时空记忆信息
Figure FDA00036286944900000223
作为自注意力模块的输入,更新后的t时刻第l个时空注意力层的时空记忆信息
Figure FDA0003628694490000031
首先转换为查询Q、键K和值V,公式如下:
Figure FDA0003628694490000032
其中,
Figure FDA0003628694490000033
为可训练的1×1卷积参数矩阵;
自注意力模块的输出为t时刻第l个时空注意力层的时空记忆信息
Figure FDA0003628694490000034
公式表示如下:
Figure FDA0003628694490000035
O=ATT(Q,K)V (25)
其中,Wo*O表示自注意力特征图;
自注意力模块的模型表示如下:
Figure FDA0003628694490000036
其中,
Figure FDA0003628694490000037
为比例因子。
2.根据权利要求1所述的融合关联度加权与时空注意力的温度预报方法,其特征在于,在第三步中,注意力模块Attention1利用t时刻第l-1个时空注意力层的隐藏状态信息
Figure FDA0003628694490000038
校正更新t-1时刻第l个时空注意力层的隐藏状态信息
Figure FDA0003628694490000039
从而得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息
Figure FDA00036286944900000310
公式表示如下:
Figure FDA00036286944900000311
具体地,首先将t-1时刻第l个时空注意力层的隐藏状态信息
Figure FDA00036286944900000312
转换为查询Q′,将t时刻第l-1个时空注意力层的隐藏状态信息
Figure FDA00036286944900000313
转换为键K′和值V′,公式如下:
Figure FDA00036286944900000314
Figure FDA00036286944900000315
其中,W′Q为可学习参数,
Figure FDA00036286944900000316
为可学习的1×1卷积参数矩阵;
然后,根据式(8)利用查询Q′和键K′求得注意力图;
Figure FDA00036286944900000317
其中,ATT(·)表示注意力操作,
Figure FDA0003628694490000041
为比例因子,T表示矩阵转置;
最后,根据式(9)、(10)计算得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息
Figure FDA0003628694490000042
O′=ATT(Q′,K′)V′ (9)
Figure FDA0003628694490000043
其中,(W′O*O′)表示注意力特征图,通过注意力特征图对t-1时刻第l个时空注意力层的隐藏状态信息
Figure FDA0003628694490000044
进行作用,最终实现了
Figure FDA0003628694490000045
Figure FDA0003628694490000046
的关联,即上下文关联。
3.根据权利要求1所述的融合关联度加权与时空注意力的温度预报方法,其特征在于,所述气象要素包括2米变温、低云量、总云量、风通量V分量和1000hpa风速。
CN202210535440.1A 2022-05-06 2022-05-06 一种融合关联度加权与时空注意力的温度预报方法 Pending CN114936691A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210535440.1A CN114936691A (zh) 2022-05-06 2022-05-06 一种融合关联度加权与时空注意力的温度预报方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210535440.1A CN114936691A (zh) 2022-05-06 2022-05-06 一种融合关联度加权与时空注意力的温度预报方法

Publications (1)

Publication Number Publication Date
CN114936691A true CN114936691A (zh) 2022-08-23

Family

ID=82864003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210535440.1A Pending CN114936691A (zh) 2022-05-06 2022-05-06 一种融合关联度加权与时空注意力的温度预报方法

Country Status (1)

Country Link
CN (1) CN114936691A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115307780A (zh) * 2022-09-29 2022-11-08 中国海洋大学 基于时空信息交互融合的海表温度预测方法、系统及应用
CN115510767A (zh) * 2022-11-21 2022-12-23 四川省气象服务中心(四川省专业气象台 四川省气象影视中心) 基于深度时空网络的区域气温预测方法
CN116304778A (zh) * 2023-05-17 2023-06-23 温州华嘉电器有限公司 一种用于小型断路器维护数据处理方法
CN117237781A (zh) * 2023-11-16 2023-12-15 哈尔滨工业大学(威海) 一种基于注意力机制的双元素融合时空预测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115307780A (zh) * 2022-09-29 2022-11-08 中国海洋大学 基于时空信息交互融合的海表温度预测方法、系统及应用
CN115307780B (zh) * 2022-09-29 2023-01-06 中国海洋大学 基于时空信息交互融合的海表温度预测方法、系统及应用
CN115510767A (zh) * 2022-11-21 2022-12-23 四川省气象服务中心(四川省专业气象台 四川省气象影视中心) 基于深度时空网络的区域气温预测方法
CN115510767B (zh) * 2022-11-21 2023-10-27 四川省气象服务中心(四川省专业气象台 四川省气象影视中心) 基于深度时空网络的区域气温预测方法
CN116304778A (zh) * 2023-05-17 2023-06-23 温州华嘉电器有限公司 一种用于小型断路器维护数据处理方法
CN117237781A (zh) * 2023-11-16 2023-12-15 哈尔滨工业大学(威海) 一种基于注意力机制的双元素融合时空预测方法
CN117237781B (zh) * 2023-11-16 2024-03-19 哈尔滨工业大学(威海) 一种基于注意力机制的双元素融合时空预测方法

Similar Documents

Publication Publication Date Title
Ghimire et al. Deep solar radiation forecasting with convolutional neural network and long short-term memory network algorithms
CN111798051B (zh) 基于长短期记忆神经网络的空气质量时空预测方法
CN114936691A (zh) 一种融合关联度加权与时空注意力的温度预报方法
Yang et al. Solar irradiance forecasting using spatio-temporal empirical kriging and vector autoregressive models with parameter shrinkage
Mu et al. ENSO forecasting over multiple time horizons using ConvLSTM network and rolling mechanism
WO2006120724A1 (ja) ニューラルネットワークを用いた地理情報システム
Jonnalagadda et al. Forecasting atmospheric visibility using auto regressive recurrent neural network
CN111859054B (zh) 气象卫星数据的处理方法及装置
CN112183625A (zh) 一种基于深度学习的pm2.5高精度时空预测方法
CN115629160A (zh) 一种基于时空图的空气污染物浓度预测方法及系统
Dai et al. Ensemble learning technology for coastal flood forecasting in internet-of-things-enabled smart city
Liu et al. Estimation of precipitation induced by tropical cyclones based on machine‐learning‐enhanced analogue identification of numerical prediction
Zheng et al. Weather image-based short-term dense wind speed forecast with a ConvLSTM-LSTM deep learning model
CN116415730A (zh) 一种预测水位的融合自注意力机制时空深度学习模型
Niu et al. Automatic quality control of crowdsourced rainfall data with multiple noises: A machine learning approach
Mekanik et al. Forecasting Victorian spring rainfall using ENSO and IOD: A comparison of linear multiple regression and nonlinear ANN
CN117131991A (zh) 基于混合神经网络的城市降雨量预测方法及平台
CN117233869A (zh) 一种基于GRU-BiTCN的站点短期风速预测方法
Li et al. PV resource evaluation based on Xception and VGG19 two-layer network algorithm
CN116720156A (zh) 基于图神经网络多模态气象数据融合的气象要素预报方法
CN116822716A (zh) 一种基于时空注意力的台风预测方法、系统、设备及介质
CN116960962A (zh) 一种跨区域数据融合的中长期区域负荷预测方法
Bosma et al. Estimating solar and wind power production using computer vision deep learning techniques on weather maps
Deo et al. Identification of minimal timespan problem for recurrent neural networks with application to cyclone wind-intensity prediction
CN114970743A (zh) 一种基于多模态深度学习的多源遥感降雨数据融合方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination