CN114936691A

CN114936691A - 一种融合关联度加权与时空注意力的温度预报方法

Info

Publication number: CN114936691A
Application number: CN202210535440.1A
Authority: CN
Inventors: 石陆魁; 梁楠楹; 张敬业; 赵瑞云; 张军
Original assignee: Hebei University of Technology
Current assignee: Hebei University of Technology
Priority date: 2022-05-06
Filing date: 2022-05-06
Publication date: 2022-08-23

Abstract

本发明为一种融合关联度加权与时空注意力的温度预报方法，首先获取包括温度和多个气象要素在内的气象数据集；接着，计算各个气象要素与温度之间的关联度，将关联度进行加权，并将所有关联度加权结果在通道方向连接，得到加权后的气象时空序列数据；最后，以预测循环神经网络为基础构建温度预报模型，将温度和加权后的气象时空序列数据输入到温度预报模型中，用于未来时刻局部地区的温度预报；温度预报模型包括n个时空注意力层，每个时空注意力层包括若干个时空注意力模块，时空注意力模块利用上下文交互单元对输入和上下文信息进行互相校正来记忆短期依赖信息，利用时空记忆单元捕获气象数据的长期依赖关系。该方法能够捕捉温度突变，预报准确度更高。

Description

一种融合关联度加权与时空注意力的温度预报方法

技术领域

本发明属于温度预报技术领域，具体是一种融合关联度加权与时空注意力的温度预报方法，可用于温度预报领域基于多要素时空序列的温度预测。

背景技术

温度预报是气象预报领域的研究热点，其目的是根据历史气象数据对未来一段时间内的温度变化进行精确预报，被广泛应用于交通控制、传染病预防、环境监测和灾害预警等领域。自动气象观测技术、遥感卫星工程技术以及智能网格预报技术的迅速发展，为基于深度学习的温度预报研究提供了丰富的数据支持。

传统的温度预报方法主要是基于物理的数值模型，它在获取数据和预测温度时需要耗费大量的计算资源和时间。随着多源、海量气象数据的出现，产生了数据驱动模型。深度学习技术特别是卷积神经网络和循环神经网络在温度预报领域取得了里程碑式的进步，更好地模拟了气象数据的非线性关系，并且解决了温度预报中数据依赖和机制复杂的问题。然而，循环神经网络倾向于时间结构的建模，缺乏捕捉温度空间变化的能力；卷积神经网络更注重空间外观变化，捕捉时序变化规律的能力较差。事实上，某地区温度变化的随机行为不仅受该地区历史气象数据的影响，而且受周围地区气象要素时空变化的影响，因此利用深度学习预测温度需要考虑长距离时空依赖。

现有的时空序列预测算法虽然能够从海量气象数据中高效准确地提取信息，但是它们通常分别对时空维度进行建模并且使用卷积操作捕捉气象数据的空间相关性，没有充分考虑温度变化的时空相关性和地理因素对温度变化的影响，忽略了不同气象要素对温度变化的影响程度，并且难以感知温度突变。

发明内容

针对现有技术的不足，本发明拟解决的技术问题是，提供一种融合关联度加权与时空注意力的温度预报方法。

本发明解决所述技术问题采用的技术方案如下：

一种融合关联度加权与时空注意力的温度预报方法，其特征在于，该方法包括如下步骤：

第一步、获取气象数据集，该数据集包括温度和多个气象要素在内的时空序列数据；

第二步、计算各个气象要素与温度之间的关联度，将各个气象要素与温度的关联度进行加权，并将各个气象要素的关联度加权结果在通道方向上连接，得到加权后的气象时空序列数据；

首先，根据式(1)对温度和各个气象要素的时空序列数据进行标准化处理；

其中，X_tj表示t时刻第j个气象要素的时空序列，

表示t时刻第j个气象要素标准化后的时空序列，μ_j表示按时间维度计算得到的不同地区第j个气象要素的均值，σ_j表示第j个气象要素在不同地区的标准差；

其次，计算温度与各个气象要素之间的关联系数；

然后，根据式(3)计算各个气象要素与温度之间的关联度；

其中，r_j表示不同地区温度与第j个气象要素的关联度，ξ_tj表示t时刻不同地区温度与第j个气象要素的关联系数，T′表示时间序列长度；

2-5)利用式(4)对关联度进行加权处理，并将各个气象要素的关联度加权结果在通道方向连接，得到加权后的气象时空序列数据；

其中，X′_tj表示t时刻第j个气象要素与温度的关联度加权结果；

将所有气象要素与温度的关联度加权结果在通道方向连接得到加权后的气象时空序列数据；

第三步、基于深度学习神经网络构建温度预报模型，将温度时空序列数据和加权后的气象时空序列数据输入到温度预报模型中，温度预报模型输出预报结果，即未来时刻局部地区的时空序列温度图像；

温度预报模型以预测循环神经网络为基础，温度预报模型包括n个时空注意力层，每个时空注意力层包括若干个依次连接的时空注意力模块，所有时空注意力层相同位置的时空注意力模块依次连接，使温度预报模型的内存状态沿之字形流经整个网络；

每个时空注意力模块均包括上下文交互单元和时空记忆单元两部分，上下文交互单元包括三个注意力模块Attention1～Attention3，用于将t-1时刻第l个时空注意力层的隐藏状态信息

t时刻第l-1个时空注意力层的隐藏状态信息

t时刻第l-1个时空注意力层的时空记忆信息

进行上下文关联更新，得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息

t时刻第l-1个时空注意力层的隐藏状态信息

t时刻第l-1个时空注意力层的时空记忆信息

时空记忆单元利用卷积长短时记忆单元捕获时间维度信息，同时在卷积长短时记忆单元的基础上增加自注意力模块捕获空间维度信息，再将捕获的时空维度信息通过联合机制进行融合；

对于时间维度信息的捕获，首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息

和t-1时刻第l个时空注意力层的隐藏状态信息

通过卷积长短时记忆单元获取时域上第l个时空注意力层的温度变化信息，然后利用t-1时刻第l个时空注意力层的时间记忆信息

生成t时刻第l个时空注意力层的时间记忆信息

公式如下：

其中，f_t为遗忘门，i_t为输入门，g_t为输入调制门，σ表示sigmoid激活函数，tanh表示tanh激活函数，°表示哈达玛乘积，W_xf、W_hf、W_xi、W_hi、W_xg、W_hg、b_f、b_i、b_g均为可学习参数；

对于空间维度信息的捕获，首先根据更新后的t时刻第l-1个时空注意力层的隐藏状态信息

和t时刻第l-1个时空注意力层的时空记忆信息

利用卷积长短时记忆单元获取当前时空注意力层的温度变化信息，然后对更新后的t时刻第l-1个时空注意力层的时空记忆信息

进行校正，生成更新后的t时刻第l个时空注意力层的时空记忆信息

最后，使用自注意力模块对更新后的t时刻第l个时空注意力层的时空记忆信息

进行关注，得到t时刻第l个时空注意力层的时空记忆信息

公式如下：

其中，f_t′为遗忘门，i′_t为输入门，g′_t为输入调制门，SA(·)表示自注意力模块，W′_xf、W′_xi、W′_xg、W_mf、W_mi、W_mg、b′_f、b′_i、b′_g均为可学习参数；

将更新后的t时刻第l个时空注意力层的时空记忆信息

作为自注意力模块的输入，更新后的t时刻第l个时空注意力层的时空记忆信息

首先转换为查询Q、键K和值V，公式如下：

其中，

为可训练的1×1卷积参数矩阵；

自注意力模块的输出为t时刻第l个时空注意力层的时空记忆信息

公式表示如下：

O＝ATT(Q,K)V (25)

其中，W_o*O表示自注意力特征图；

自注意力模块的模型表示如下：

其中，

为比例因子。

进一步的，在第三步中，注意力模块Attention1利用t时刻第l-1个时空注意力层的隐藏状态信息

校正更新t-1时刻第l个时空注意力层的隐藏状态信息

从而得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息

公式表示如下：

具体地，首先将t-1时刻第l个时空注意力层的隐藏状态信息

转换为查询Q′，将t时刻第l-1个时空注意力层的隐藏状态信息

转换为键K′和值V′，公式如下：

其中，W′_Q为可学习参数，

为可学习的1×1卷积参数矩阵；

然后，根据式(8)利用查询Q′和键K′求得注意力图；

其中，ATT(·)表示注意力操作，

为比例因子，T表示矩阵转置；

最后，根据式(9)、(10)计算得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息

O′＝ATT(Q′,K′)V′ (9)

其中，(W′_O*O′)表示注意力特征图，通过注意力特征图对t-1时刻第l个时空注意力层的隐藏状态信息

进行作用，最终实现了

与

的关联，即上下文关联。

进一步的，所述气象要素包括2米变温、低云量、总云量、风通量V分量和1000hpa风速。

与现有技术相比，本发明的优点和有益效果是：

1.本发明在气象要素的时空序列标准化处理过程中充分考虑了周围地区气象要素时空变化对目标地区温度的影响，同时针对不同气象要素对温度变化影响程度不同的特点提出RWA模块，综合考虑了各气象要素对温度变化的影响大小。

2.本发明的时空注意力模块包括上下文交互单元和时空记忆单元两部分，上下文交互单元用于对输入信息和上下文信息进行校正更新，保存短期依赖信息，能够有效捕捉温度突变，解决了ConvLSTM中输入与上下文无法交互更新捕捉温度突变的问题，该单元实现了上下文交互校正，更好地捕捉了气象数据变化的短期依赖关系。时空记忆单元对时空维度信息进行建模来捕获气象数据的长期依赖关系，为了更好地捕获空间维度上下文信息的长期依赖关系，时空记忆单元在ConvLSTM的基础上增加了自注意力模块。

附图说明

图1为本发明的整体流程图；

图2(a)为ECMWF多要素气象数据集的2米温度的时空序列图；

图2(b)为ECMWF多要素气象数据集的2米变温的时空序列图；

图2(c)为ECMWF多要素气象数据集的低云量的时空序列图；

图2(d)为ECMWF多要素气象数据集的总云量的时空序列图；

图2(e)为ECMWF多要素气象数据集的风通量V分量的时空序列图；

图2(f)为ECMWF多要素气象数据集的1000hpa风速的时空序列图；

图3为本发明的温度预测模型的整体架构图；

图4为本发明的时空注意力模块的结构示意图；

图5为本发明的上下文交互单元的注意力模块的结构示意图；

图6为本发明的时空记忆单元的自注意力模块的结构示意图。

具体实施方式

下面结合附图和具体实现方式对本发明的技术方案进行详细说明，并不以此限定本申请的保护范围。

本发明为一种融合关联度加权与时空注意力的温度预报方法(简称方法，参见图1-6)，包括如下步骤：

第一步、获取气象数据集，该数据集包括温度和多个气象要素的时空序列数据；

获取气象数据集，例如ECMWF多要素气象数据集，图2为ECMWF多要素气象数据集的一个子集，观测时间从2017年1月1日8时至2020年6月10日5时，覆盖经纬度范围分别为105°E-116.25°E和30°N-41.25°N，空间分辨率为0.25度，采样频率为3小时，时空序列数据大小为45×45像素；图2(a)为2米温度的时空序列数据，选取与2米温度最相关的5个气象要素进行关联度分析，分别为2米变温、低云量、总云量、风通量V分量、1000hpa风速，时空序列数据示意图参见图2(b)～(f)；

第二步、利用关联度加权分析(Relevance WeightedAnalysis，RWA)模块，计算各个气象要素与温度之间的关联度，将各个气象要素与温度的关联度进行加权，并将各个气象要素的关联度加权结果在通道方向上连接，得到加权后的气象时空序列数据；

由于温度变化受不同气象要素的影响程度各不相同，为了充分考虑不同气象要素对温度变化的关联程度，更好地指导温度预报任务，使用灰色关联分析(GreyRelationAnalysis,GRA)来衡量温度与其他气象要素之间的关联程度；GRA是一种多因素统计分析方法，被用于衡量变量序列间发展趋势异同的关联程度，GRA的基本思想是：首先将原始观测数据进行无量纲化处理，然后计算序列间的关联系数和关联度，最后根据关联度值的大小对多个因素进行排序；具体实现过程如下：

2-1)确定参考序列和比较序列：参考序列是反映任务行为特征的数据序列，比较序列是由任务行为影响因素组成的数据序列，该方法考虑不同气象要素对温度变化的影响程度，因此，参考序列为2米温度的时空序列数据，比较序列为2米变温、低云量、总云量、风通量V分量、1000hpa风速这5个气象要素的时空序列数据；

2-2)对时空序列数据进行标准化处理：为了使不同气象要素各特征之间具有可比性，应用零均值(Z-score)标准化对1000hpa风速、总云量、2米变温、风通量V分量和低云量进行标准化处理，2米温度的标准化处理过程同理，标准化处理公式如下：

其中，X_tj表示t时刻第j个气象要素的时空序列，此处j＝1,2,…,5，分别表示1000hpa风速、总云量、2米变温、风通量V分量和低云量；

表示t时刻第j个气象要素标准化后的时空序列，μ_j表示按时间维度计算得到的不同地区第j个气象要素的均值，σ_j表示第j个气象要素在不同地区的标准差，X_tj、

μ_j和σ_j均是大小为R^C×H×W的张量，其中R表示张量空间，H表示高度，W表示宽度，C表示通道数，取值为1；

2-3)求解参考序列和比较序列之间的关联系数：

关联程度是指曲线间几何形状的差别程度，因此曲线间差值大小可以作为关联程度的衡量尺度，各比较序列与参考序列在各个时刻不同地区的关联系数ξ_tj可由以下公式表示：

其中，ξ_tj表示t时刻不同地区温度与第j个气象要素的关联系数，

表示在整个时间序列上不同地区温度与第j个气象要素的最小差值，

表示在整个时间序列上不同地区温度与第j个气象要素的最大差值，

和

均为固定值，均是大小为R^C×H×W的张量；|·|表示绝对值操作，*表示乘法运算，

表示t时刻温度的时空序列，

表示t时刻不同地区温度与第j个气象要素的差值，ξ_tj、

均是大小为R^C×H×W的张量；ρ表示分辨系数，介于0-1之间，ρ越小代表分辨力越大，本实施例取0.5；

2-4)求解各气象要素与温度之间的关联度：

由于关联系数是温度与各个气象要素在不同时刻的关联程度，因此关联程度的值不止一个，这会导致计算的信息太过于分散而不便于整体比较，因此将不同地区各个时刻的关联系数求平均，用平均值衡量温度与各个气象要素的关联度，则关联度计算公式如下：

其中，r_j表示不同地区温度与第j个气象要素的关联度，其大小是R^C×H×W的张量，T′表示时间序列长度；

2-5)利用式(4)对关联度进行加权处理，并将各个气象要素的关联度加权结果在通道方向上连接，得到加权后的气象时空序列数据；

将所有气象要素与温度的关联度加权结果在通道方向连接得到加权后的气象时空序列数据X′_t；

3-1)构建温度预报模型：如图3所示，温度预报模型以预测循环神经网络(PredRNN)为基础，温度预报模型包括n个时空注意力层(图3的横向)，每个时空注意力层包括若干个依次连接的时空注意力(SpatiotemporalAttention,STA)模块(图3的纵向)，所有时空注意力层相同位置的时空注意力模块依次连接，使温度预报模型的内存状态沿之字形流经整个网络；

如图4所示，每个时空注意力模块均包括上下文交互(Contextual Interaction,CI)单元和时空记忆(Spatiotemporal Memory,STM)单元两部分，上下文交互单元用于对输入信息和上下文信息进行校正更新，保存短期依赖信息，用于捕捉温度突变；时空记忆单元用于同时捕捉时空维度的相关性并利用全局感受野对空间信息进行建模；在进行温度预报时，时空注意力模块首先利用上下文交互单元对输入信息和上下文信息进行互相校正来记忆短期依赖信息，然后利用时空记忆单元对时空维度信息进行建模来捕获气象数据的长期依赖关系；

上下文交互单元通过注意力机制对输入信息和上下文信息进行相互更新，分别使用三个注意力模块Attention1～Attention3将t-1时刻第l个时空注意力层的隐藏状态信息

t时刻第l-1个时空注意力层的隐藏状态信息

t时刻第l-1个时空注意力层的时空记忆信息

t时刻第l-1个时空注意力层的隐藏状态信息

t时刻第l-1个时空注意力层的时空记忆信息

三个注意力模块的内部结构相同，如图5所示，注意力模块Attention1利用t时刻第l-1个时空注意力层的隐藏状态信息

校正更新t-1时刻第l个时空注意力层的隐藏状态信息

从而得到更新后的t-1时刻第l个时空注意力层的隐藏状态信息

公式表示如下：

具体地，首先将t-1时刻第l个时空注意力层的隐藏状态信息

转换为键K′和值V′，公式如下：

其中，W′_Q为可学习参数，

为可学习的1×1卷积参数矩阵；

然后，根据式(8)利用查询Q′和键K′求得注意力图；

其中，ATT(·)表示注意力操作，

为比例因子，T表示矩阵转置；

O′＝ATT(Q′,K′)V′ (9)

进行作用，最终实现了

与

的关联，即上下文关联；

同理，注意力模块Attention2利用t-1时刻第l个时空注意力层的隐藏状态信息

校正更新t时刻第l-1个时空注意力层的隐藏状态信息

得到更新后的t时刻第l-1个时空注意力层的隐藏状态信息

公式如下：

注意力模块Attention3利用t时刻第l-1个时空注意力层的隐藏状态信息

校正更新t时刻第l-1个时空注意力层的时空记忆信息

得到更新后的t时刻第l-1个时空注意力层的时空记忆信息

公式如下：

在上下文交互单元中，当l＝1时，

X′_t表示t时刻加权后的气象时空序列；

时空记忆单元由时间维度建模、空间维度建模和联合模块三部分组成，公式表达如下：

其中，STM_l表示第l个时空注意力层的时空记忆单元，

表示t-1时刻第l个时空注意力层的时间记忆信息；

均为大小为R^C×H×W的张量；

时空记忆单元利用卷积长短时记忆单元(ConvLSTM)在时间维度上进行建模，捕获温度变化的时间相关性；为了更好地捕获空间维度上下文信息的长期依赖关系，时空记忆单元在ConvLSTM的基础上增加了自注意力模块(Self-Attention)；最后，将捕获的时空维度信息通过联合机制进行融合，以预报未来温度；

和t-1时刻第l个时空注意力层的隐藏状态信息

通过ConvLSTM获取时域上第l个时空注意力层的温度变化信息，然后利用t-1时刻第l个时空注意力层的时间记忆信息

生成t时刻第l个时空注意力层的时间记忆信息

公式如下：

和t时刻第l-1个时空注意力层的时空记忆信息

利用ConvLSTM获取当前时空注意力层的温度变化信息，然后对更新后的t时刻第l-1个时空注意力层的时空记忆信息

进行关注，得到t时刻第l个时空注意力层的时空记忆信息

公式如下：

如图6所示，将更新后的t时刻第l个时空注意力层的时空记忆信息

作为自注意力模块的输入，通过关注输入层的状态来构造输出层的状态；具体地，更新后的t时刻第l个时空注意力层的时空记忆信息

首先转换为查询Q、键K和值V，公式如下：

其中，

为可训练的1×1卷积参数矩阵；

公式表示如下：

O＝ATT(Q,K)V (25)

其中，W_o*O表示自注意力特征图；

自注意力模块的模型表示如下：

其中，

为比例因子；

联合模块使用共享的输出门将上下文交互单元和时空记忆单元的信息进行无缝结合，即将来自水平和垂直方向的记忆信息连接在一起，然后应用1×1卷积层进行降维，使t时刻第l个时空注意力层的隐藏状态信息

与时间记忆信息

时空记忆信息

具有相同维度；联合模块的公式如下：

其中，o_t表示输出门，W_xo、W_ho、W_co、W_mo、b_o、W_1×1均为可学习参数；

3-2)将步骤1获取的气象数据集中的温度时空序列数据和步骤2得到的加权后的气象时空序列数据作为温度预报模型的输入，对温度预报模型进行训练，得到训练后的温度预报模型；将训练后的温度预报模型用于预报未来时刻局部地区的温度，结果用时空序列温度图像表示。

为了验证本方法的效果，利用ECMWF多要素数据集，使用预测循环神经网络(PredRNN)和本申请的温度预报模型进行温度预报，得到表1所示的对比实验结果。

表1不同模型在ECMWF多要素数据集的对比实验结果

以平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean SquareError,RMSE)、可决系数(R²)作为评价指标，从表1可知，与PredRNN相比，本申请的温度预报模型在三个评价指标均有明显改善，表明在时空记忆单元中使用自注意力模块捕捉气象数据变化空间维度的相关性，利用上下文交互单元感知温度突变，并对相关气象要素进行加权对于提升多要素温度预报结果的重要性，提升了预测准确度。

为了分析RWA模块与CI单元对多要素温度预报结果的影响，在ECMWF多要素数据集上将RWA模块和CI单元分别嵌入到自注意力联合时空网络模型(SA-JSTN)中测试其性能，实验结果如表2所示；自注意力联合时空网络模型以预测循环神经网络(PredRNN)为基础，在PredRNN的时空记忆单元中加入了自注意力模块。

表2 RWA模块和CI单元在SA-JSTN上的消融实验结果

从实验结果可以看出，SA-JSTN模型在加入RWA模块或者CI单元后，均实现了性能的提升。除此之外，在SA-JSTN模型中嵌入CI单元比嵌入RWA模块对温度预报任务更有效。需要注意的是，当SA-JSTN模型中同时嵌入RWA模块和CI单元时性能达到最好。实验结果验证了RWA模块和CI单元的有效性。

本发明未述及之处适用于现有技术。