CN115510767B

CN115510767B - 基于深度时空网络的区域气温预测方法

Info

Publication number: CN115510767B
Application number: CN202211456467.8A
Authority: CN
Inventors: 郑昊; 宋雯雯; 龙柯吉; 郭洁; 李亚玲; 淡嘉; 吴顺
Original assignee: Sichuan Meteorological Service Center
Current assignee: Sichuan Meteorological Service Center
Priority date: 2022-11-21
Filing date: 2022-11-21
Publication date: 2023-10-27
Anticipated expiration: 2042-11-21
Also published as: CN115510767A

Abstract

本发明公开了一种基于深度时空网络的区域气温预测方法，属于气温预测领域。所述区域气温预测方法包括：获取目标区域内气温监测点在多个时刻检测到的温度值；根据所述气温监测点检测到的温度值生成目标区域在多个时刻的气温分布图；根据所述目标区域在多个时刻的气温分布图生成所述目标区域的时空图，所述时空图用于表征所述目标区域随时间的气温变化情况；基于融入了注意力机制模块的ConvLSTM模型构建气温预测模型；将所述目标区域的时空图输入所述气温预测模型，得到目标区域的气温预测结果。本发明实现了对整个目标区域气温变化的预测，能够为现实中的工程管理提供重要的决策支持。

Description

基于深度时空网络的区域气温预测方法

技术领域

本发明属于气温预测领域，特别是涉及一种基于深度时空网络的区域气温预测方法。

背景技术

短期气温预报对工程的实施与管理具有重要意义，例如，这将有助于在建筑中开发供暖、通风和空调(HVAC)系统的全局优化控制设置；然而以往的研究主要集中在单一位置的预测，很少将任务扩展到整个区域。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于深度时空网络的区域气温预测方法。

本发明的目的是通过以下技术方案来实现的：基于深度时空网络的区域气温预测方法，包括：

获取目标区域内气温监测点在多个时刻的气温检测结果；

根据所述气温检测结果生成目标区域在每个时刻的气温分布图；

根据所述目标区域在多个时刻的气温分布图生成所述目标区域的时空图，所述时空图用于表征所述目标区域随时间的气温变化情况；

基于融入了注意力机制模块的ConvLSTM模型构建气温预测模型；

将所述目标区域的时空图输入所述气温预测模型，得到目标区域的气温预测结果。

进一步地，根据所述气温检测结果生成目标区域在每个时刻的气温分布图，包括：

获取目标区域的矢量图；

基于地理坐标将所述气温监测点投影至所述矢量图中；

对所述目标区域进行网格化；

根据一个时刻的气温检测结果生成所述矢量图中每个网格对应的气温值，得到该时刻目标区域的气温分布图。

进一步地，根据一个时刻的气温检测结果生成所述矢量图中每个网格对应的气温值，包括：

判断所述网格中是否有气温监测点；

若所述网格内有气温监测点，则判断所述网格内气温监测点的数量；

若所述网格内只有一个气温监测点，则该网格对应的气温值为该气温监测点的气温检测结果；

若所述网格内有两个及以上的气温监测点，则该网格对应的气温值为该网格内所气温监测点的气温检测结果的平均值；

若所述网格内没有气温监测点，则利用空间插值法得到该网格对应的气温值。

进一步地，若所述网格内没有气温监测点，则该网格对应的气温值的计算公式为：

式中，Z为目标网格的插值结果，m为样本点的个数，Z _i为第i (i = 1, 2, . . .m)个样本点的实际值，n为距离的权重，d _i为第i个样本点到目标网格的距离，x _i和y _i为第i个样本点的空间坐标，x _A和y _A为目标网格的空间坐标。

进一步地，所述气温预测模型包括：

ST-LSTM单元，由多层卷积和LSTM结构共同构成，用于处理输入图像中的时空特征。

注意力机制模块，用于捕获目标区域中的极端气温变化情况，所述极端气温为超出预设温度范围的温度。

进一步地，所述多层卷积由一个卷积核大小为3 × 3的卷积层、一个卷积核大小为5 × 5的卷积层和一个卷积核大小为7 × 7的卷积层组成，用于通过不同大小的卷积来捕获目标区域中各网格对应的气温值的空间邻域相关性。

进一步地，所述注意力机制模块由通道注意力单元和空间注意力单元组成；

所述通道注意力单元的描述方程为：

式中， c表示通道(channel)，F为输入的特征，表示通道注意力图，/>是Sigmod激活函数，MLP为多层感知机网络；AvgPool表示平均池化操作，MaxPool为最大池化操作； />和/>分别为MLP对于不同特征图的权重，F^c _avg表示通道平均池化特征，F^c _max表示通道最大池化特征；

所述空间注意力单元的描述方程为：

式中，s表示空间(spatial)，F为输入的特征，/>表示空间注意力图；/>是Sigmod激活函数，f为滤波器；AvgPool表示平均池化操作，MaxPool为最大池化操作；F^s _avg表示空间平均池化特征，F^s _max表示空间最大池化特征。

本发明的有益效果是：

（1）本发明提出了一种基于深度时空网络的气温预测方法，通过时空信息处理组件来将点分布的气温监测数据转换为时空图序列，然后利用深度学习模型来学习时空图图序列中复杂的非线性时空变化，最终得到目标区域的气温预测结果，实现了对整个目标区域气温变化的预测，能够为现实中的工程管理提供重要的决策支持；

（2）本发明中在对目标区域的气温数据进行处理时，利用空间插值的方法对空白网格的气温数据进行填充，避免了后续卷积操作时遗漏大量的空间信息的情况，提高了最终预测结果的准确性；

（3）本发明中采用由多个不同大小的卷积层组成的多层卷积来提取空间相关性，可以捕获到不同范围的空间相关性，从而获得了更好的预测效果；

（4）本发明中引入了注意力机制来捕获目标区域的极端气温情况，从而拥有更好的对极端气温的预测能力。

附图说明

图1为本发明中区域气温预测方法的一个实施例的流程图；

图2为时空图的构建总体过程；

图3为ST-Net对于区域气温的预测过程；

图4为研究期间整个研究区域平均气温的变化情况；

图5为各模型的RMSE随着时间的变化情况；

图6为各模型的Acc随着时间的变化情况；

图7为传统ConvLSTM模型的单个站点预测结果；

图8为MIM模型的单个站点预测结果；

图9为本实施例的气温预测模型的单个站点预测结果；

图10为区域气温预测结果可视化图像。

具体实施方式

下面将结合实施例，对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1-图10，本实施例提供了一种基于深度时空网络的区域气温预测方法：

如图1所示，基于深度时空网络的区域气温预测方法，包括：

S100.获取目标区域内气温监测点在多个时刻检测到的温度值。

所述气温监测点用于进行温度值的检测。

S200. 根据所述气温监测点检测到的温度值生成目标区域在多个时刻的气温分布图。

具体的，根据S100中每个时刻的温度值生成一幅气温分布图；由于S100中获取了多个时刻的温度值，因而本步骤中会生成多幅气温分布图。

在一个实施例中，目标区域在给定时刻的气温分布图的生成方法包括：

S210.获取目标区域的矢量图。

在一些实施例中，利用GIS技术对目标区域的地图进行矢量化得到目标区域的矢量图。

S220.基于地理坐标将所述气温监测点投影至所述矢量图中。

S230.将矢量图所示的目标区域划分为若干网格。

例如，将目标区域划分为M×N个网格。一般的，根据目标区域的大小以及目标区域内气温监测点的分布密度确定网格的划分数量。

S240.根据气温监测点在给定时刻检测到的温度值生成该时刻每个网格的温度值，得到该时刻目标区域的气温分布图。

在一些实施例中，每个网格在给定时刻的温度值的生成方法包括：

S241.判断所述网格中是否有气温监测点，若所述网格内有气温监测点，则执行S242；

S242.判断所述网格内气温监测点的数量，若所述网格内只有一个气温监测点，则执行S243，若所述网格内有两个及以上的气温监测点，则执行S244；

S243将该气温监测点在给定时刻检测到的温度值作为该网格的温度值，然后结束该网格的温度值的计算。

S244.将该网格内所有气温监测点在给定时刻检测到的温度值的平均值作为该网格的温度值，然后结束该网格的温度值的计算。

S245.若所述网格内没有气温监测点，则利用空间插值法得到该网格的温度值。

本实施例中，对于目标区域中不存在气温监测点的空白网格，利用空间插值法来将其他具有气温监测点的网格的温度值转换为这些空白网格的温度值，从而提高了后续气温预测结果的可靠性和准确性。

本实施例中利用空间插值法得到网格对应的气温值的过程为：输入所有样本点的值及各样本点所在的网格矩阵坐标(X,Y)，所述样本点为由气温监测点测得的其他网格的温度值；确定插值点A的网格矩阵坐标；确定最大搜索半径，最大样本点个数；在搜索半径内搜索出样本点P _i，同时按照公式（2）依次求出第i个样本点P _i与插值点A的距离d _i；根据公式（1）计算出插值点A的估计值Z；重复上述步骤求出所有插值点的值（即空白网格对应的气温值）。其中，公式（1）为：

式中，Z为目标网格的插值结果，m为样本点的个数，Z _i为第i (i = 1, 2, . . .m)个样本点的实际值，n为距离的权重，d _i为第i个样本点到目标网格的距离。

公式（2）为：

式中， x _i和y _i为第i个样本点的空间坐标，x _A和y _A为目标网格的空间坐标。

S300.根据所述目标区域在多个时刻的气温分布图生成所述目标区域的时空图，所述时空图用于表征所述目标区域随时间的气温变化情况。

本实施例将目标区域划分为M×N个网格，目标区域的气温分布图中，每个网格代表目标区域内对应地点的气温情况，因此将一个时刻目标区域的气温分布图其定义为一个M×N的二维矩阵。对于M x N大小的二维矩阵所代表的空间区域上的动态系统，随着时间的推移，每个网格中都有不同的温度值，将时间序列T上的图组合，便得到了(M x N) x T大小的时空图集合R。因此，任何时刻t的目标区域内的气温监测都可以用一个二维矩阵X_t∈R来表示。时空图的构建总体过程如图2所示，图2中M表示矩阵的宽度，N表示矩阵的高度；T为输入的时间序列长度，即输入图片的个数。

S400. 基于融入了注意力机制模块的ConvLSTM模型构建气温预测模型。

在一些实施例中，所述气温预测模型（记为ST-Net模型）包括ST-LSTM单元和注意力机制模块。

所述ST-LSTM单元由多层卷积和LSTM（Long-short Term Memory,长短期记忆网络）结构共同构成，用于处理输入图像中的时空特征。所述多层卷积由一个卷积核大小为3× 3的卷积层、一个卷积核大小为5 × 5的卷积层和一个卷积核大小为7 × 7的卷积层组成，用于通过不同大小的卷积来捕获区域各个地点气温在局部甚至整个区域范围的空间邻域相关性。所述LSTM结构总的全连接门被卷积层取代，从而实现对时空特征的编码。描述ST-Net的方程如下：

式中，是Sigmod激活函数，tanh是Tanh激活函数；W是针对不同信息的可训练的权重参数，其中/>为ST-Ne模型对当前输入的记忆权重，/>为ST-Net模型对上一时刻输出状态的记忆权重，/>为ST-Net模型对上一时刻单元状态的遗忘权重， />为ST-Net模型对当前输入的遗忘权重，/>为ST-Net模型对上一时刻输出状态的遗忘权重， />为ST-Net模型中的输出状态与单元状态的相乘权重， />为ST-Net模型中输入与输出的相乘权重，/>为ST-Net模型中当前输出状态与输出的相乘权重， />为ST-Net模型中当前单元状态与输出的相乘权重；X _t表示ST-Net模型在t时刻的输入；H _t-1表示ST-Net网络t-1时刻时刻输出的隐藏状态；H _t表示ST-Net模型在t时刻的隐藏状态；i的含义为记住，f的含义为遗忘；/>表示记忆机制，即记住当前t时刻多少信息； />表示遗忘机制，即遗忘当前t时刻多少信息；/>表示ST-Net模型在t时刻的单元状态；/>表示ST-Net模型在t-1时刻的单元状态；/>表示ST-Net模型在t时刻的输出。

ST-Net模型对于区域气温的预测过程如图3所示，图3中CBAM为注意力机制模块，Tanh为损失函数，Loss为真实值与预测值之间的误差；spatial interpolation model意为空间插值模型，Refine feature意为经过CBAM后得到的加强特征。

所述注意力机制模块用于捕获目标区域中的极端气温变化情况，所述极端气温为超出预设温度范围的温度。所述注意力机制模块由通道注意力单元和空间注意力单元组成。

所述通道注意力单元用于聚焦“什么”是有意义的输入图像，其描述方程为：

式中，c表示通道(channel)，F为输入的特征，表示通道注意力图，/>是Sigmod激活函数，MLP为多层感知机网络；AvgPool表示平均池化操作，MaxPool为最大池化操作； />和/>分别为MLP对于不同特征图的权重，F^c _avg表示通道平均池化特征，F^c _max表示通道最大池化特征。

为了有效计算通道注意力，需要对输入特征图的空间维度进行压缩，对于空间信息的聚合，常用的方法是平均池化。但最大池化收集了另一个重要线索，关于独特的物体特征，可以推断更细的通道上的注意力。因此，平均池化和最大池化的特征是同时使用的。将平均池化特征和最大池化特征转发到一个共享网络，从而产生通道注意力图。所述共享网络由一个多层感知机网络(MLP)组成，其中有一个隐藏层；为减少参数开销，隐藏层的激活大小设为R/C=r×1×1，其中R为下降率。将共享网络应用到每个描述符后，输出的特征向量使用element-wise求和进行合并。

所述空间注意力单元用于聚焦“哪里”是最具信息量的部分，是对通道注意力的补充，其描述方程为：

式中，s表示空间(spatial)，F为输入的特征，表示空间注意力图； />是Sigmod激活函数，f为滤波器；AvgPool表示平均池化操作，MaxPool为最大池化操作；F^s _avg表示空间平均池化特征，F^s _max表示空间最大池化特征。

为了计算空间注意力，沿着通道轴应用平均池化和最大池操作，然后将它们连接起来生成一个有效的特征描述符。然后应用卷积层生成大小为R×H×W 的空间注意力图Ms(F)，如公式（9）所示，该空间注意图编码了需要关注或压制的位置。具体来说，使用两个池化(pooling)操作聚合成一个特征图(Feature map)的通道信息，生成两个二维图: F^s _avg大小为1×H×W，F^s _max大小为1×H×W。其中， f ^7×7表示一个滤波器大小为7×7的卷积运算。

S500.将所述目标区域的时空图输入所述气温预测模型，得到目标区域的气温预测结果。

时空图输入气温预测模型后，首先由多层卷积层用不同大小的卷积核提取时空图中气温的空间分布特征，在提取空间分布特征的过程中，注意力机制模块用来突出图中气温的突变特征（例如区域的极端气温）。在经过多层卷积层和注意力机制模块后，得到时间序列上的特征图序列，将特征图序列输入至LSTM结构中进行时序相关性建模，由LSTM结构中的记忆机制来记住重要特征，遗忘机制来忘记不重要的特征，最后将综合后的剩余特征输入Tanh激活函数来获得温度的未来预测值。

下面基于一个实例对本实施例的方法和现有方法进行比较说明。以白鹤滩水电站坝区为研究区域，该区域共分布有多个气象监测站，以小时为单位采集区域内的气象数据，包括气温，风速等。气温数据集来自研究区域内多个气象监测站在2018年至2020年期间所提供的多个月份的小时气温观测数据，包括最低气温、最高气温、平均气温、位置和时间戳，共计220429条。图4显示了研究期间整个研究区域平均气温的变化情况，最低温出现在冬季，而最高温出现在夏季。

将13个月的空气质量观测数据转换为22240张图，其中前90%的数据作为训练集，后10%作为测试集。然后，使用12小时宽的滑动窗口分别对训练集和测试集进行切片。因此，总共生成了22218个序列，每个序列由12张图组成(6个用于输入，6个用于预测)。最后得到20005个图序列用于训练，2213个图序列用于测试。

本实施例使用两种方法来评价气温预测的性能，以整张图像为单位，给定任意真实图X与预测图Y。

均方根误差（RMSE）用来评价预测图Y与真实图X之间的误差以及稳定性，公式定义如下:

式中，m为温度图的宽度，n为温度图的高度，i为温度图的横坐标，j为温度图的纵坐标。

预测准确性（Acc）公式定义如下:

单步时长预测性能比较，即利用历史气温监测数据对未来1小时的气温变化进行预测。表1展示了本实施例提出的预测模型（ST-Net模型）的在测试集上的预测性能表现，并与现有的时空预测模型ConvLSTM，Memory in Memory (MIM模型)进行比较。本实施例提出的ST-Net模型与MIM模型拥有相似的性能。值得注意是，ST-Net模型从两方面做了模型轻量化工作：一方面，ST-Net模型采用多尺度卷积大小，即3×3, 5×5, 7×7的卷积大小变化，相较于ConvLSTM，MIM固定为7×7的卷积大小能够减少模型大小；另一方面，相较于ConvLSTM模型和MIM模型，ST-Net模型仅采用了3层网络层，并简化了LSTM的结构。因此，ST-Net拥有最低的模型参数量，约为ConvLSTM模型的63%，MIM模型的29%，这意味着对设备内存的需求更低，可以适用于缺乏足够计算能力的场景。此外，由于轻量化的模型结构，ST-Net模型拥有最快的模型收敛速度，耗时仅为MIM模型的40%，预测时间消耗也仅为MIM模型的47%，这些优点将十分有利于现实中模型的部署。

表1 单步时长预测性能

多步时长预测性能比较，比较这些模型在连续6小时内的预测性能，即利用历史观测对第(t, t+1, … ,t+5)时刻的区域气温变化进行预测。如图5和图6所示，可以看到所有模型的预测性能随着时间步长的增加都逐渐降低，但是本实施例提出的模型始终表现出最好的性能；图5和图6中，Proposed为本方法提出的气温预测模型（ST-Net模型），ConvLSTM和MIM是与ST-Net模型进行对比的模型。ConvLSTM模型在前2个小时的预测性能高于MIM模型，说明MIM模型相较于ConvLSTM模型虽然提高了对于长期数据的预测能力，却降低了对于最近时间点的预测性能。值得注意的是，在持续6个小时的时间跨度中，ST-Net模型的预测性能始终优于ConvLSTM模型和MIM模型，这证明了本实施例所提出的模型能够更好地捕捉到气温的时空变化，从而拥有更好的多时间步长的预测能力。

除了对区域气温预测性能进行评估外，还测试了ST-Net模型对于单一位置的预测能力，并与其它模型进行比较。在这里，以某个气象监测站为例针对本实施例的模型对未来1小时的预测能力进行进一步的分析研究，预测结果如图7、图8和图9所示，其中ConvLSTM模型取得了RMSE=0.83的预测性能，MIM模型取得了RMSE=0.99的预测性能，本实施例提出的ST-Net模型取得了RMSE=0.75的预测性能。从对于单个站点的预测结果来看，ST-Net模型仍然能够表现出最好的预测能力，同时MIM模型对于最近1小时气温的预测能力仍然弱于ConvLSTM模型，这与之前的区域气温预测结果相符。

区域气温预测的目的在于给出区域中任何地点的未来气温状况以及变化趋势，这可以为现实中的工程施工及人员安全、工程质量安全、风险管理和成本控制提供重要的决策支持。图10展示了由各个方法给出的一个连续6小时的区域气温预测图序列，并与真实气温分布图序列进行比较。可以看出，本实施例提出的方法可以很好地预测出未来第1小时研究区域西部的高温情况，以及接下来5小时温度逐渐降低的趋势。ConvLSTM模型对于未来1小时的区域气温具有一定的预测能力，而MIM模型相对而言对于未来1小时的预测能力最弱，但是MIM模型对于多步时长的区域气温的预测能力要强于ConvLSTM模型。

基于上述多个气象监测站的气温采集数据来实施短期气温预测，本实施例的方法在未来第1小时取得了RMSE = 0.62的预测性能，在未来第6小时取得了RMSE = 2.51的预测性能。因此，本实施例提出的区域气温预测方法可以对区域尺度的气温变化进行预测，从而为现实中的工程管理提供重要的决策支持。

以上所述仅是本发明的优选实施方式，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文所述构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。

Claims

1.基于深度时空网络的区域气温预测方法，其特征在于，包括：获取目标区域内气温监测点在多个时刻检测到的温度值；

根据所述气温监测点检测到的温度值生成目标区域在多个时刻的气温分布图；

将所述目标区域的时空图输入所述气温预测模型，得到目标区域的气温预测结果；目标区域在给定时刻的气温分布图的生成方法包括：

获取目标区域的矢量图；

基于地理坐标将所述气温监测点投影至所述矢量图中；将矢量图所示的目标区域划分为若干网格；

根据气温监测点在给定时刻检测到的温度值生成该时刻每个网格的温度值，得到该时刻目标区域的气温分布图；

所述网格在给定时刻的温度值的生成方法包括：判断所述网格中是否有气温监测点；

若所述网格内只有一个气温监测点，则该网格的温度值为该气温监测点在给定时刻检测到的温度值；

若所述网格内有两个及以上的气温监测点，则该网格的温度值为该网格内所有气温监测点在给定时刻检测到的温度值的平均值；

若所述网格内没有气温监测点，则利用空间插值法得到该网格的温度值；

对于没有气温监测点的网格，其温度值的计算公式为：

式中，Z为目标网格的插值结果，m为样本点的个数，Z_i为第i(i＝1，2，...m)个样本点的实际值，n为距离的权重，d_i为第i个样本点到目标网格的距离，x_i和y_i为第i个样本点的空间坐标，x_A和y_A为目标网格的空间坐标；

所述气温预测模型包括：

ST-LSTM单元，由多层卷积和LSTM结构共同构成，用于处理输入图像中的时空特征；所述LSTM结构总的全连接门被卷积层取代，从而实现对时空特征的编码；注意力机制模块，用于捕获目标区域中的极端气温变化情况，所述极端气温为超出预设温度范围的温度；

所述注意力机制模块由通道注意力单元和空间注意力单元组成；所述通道注意力单元的描述方程为：

式中，c表示通道(channel)，F为输入的特征，M_c(F)表示通道注意力图，σ是Sigmod激活函数，MLP为多层感知机网络；AvgPool表示平均池化操作，MaxPool为最大池化操作；E₀和E₁分别为MLP对于不同特征图的权重，表示通道平均池化特征，/>表示通道最大池化特征；

计算通道注意力时，同时使用平均池化和最大池化的特征，将平均池化特征和最大池化特征转发到一个共享网络，从而产生通道注意力图，所述共享网络由一个多层感知机网络MLP组成，其中有一个隐藏层；为减少参数开销，隐藏层的激活大小设为R/C＝r×1×1，其中R为下降率；将共享网络应用到每个描述符后，输出的特征向量使用element-wise求和进行合并；

所述空间注意力单元的描述方程为：

式中，s表示空间(spatial)，F为输入的特征，M_s(F)表示空间注意力图；σ是Sigmod激活函数，f为滤波器；AvgPool表示平均池化操作，MaxPool为最大池化操作；表示空间平均池化特征，/>表示空间最大池化特征；

计算空间注意力时，沿着通道轴应用平均池化和最大池操作，然后将它们连接起来生成一个有效的特征描述符；然后应用卷积层生成大小为R×H×W的空间注意力图Ms(F)，该空间注意图编码了需要关注或压制的位置；使用两个池化pooling操作聚合成一个特征图Feature map的通道信息，生成两个二维图：大小为1×H×W，/>大小为1×H×W；其中，f_7×7表示一个滤波器大小为7×7的卷积运算。

2.根据权利要求1所述的基于深度时空网络的区域气温预测方法，其特征在于，所述多层卷积由一个卷积核大小为3×3的卷积层、一个卷积核大小为5×5的卷积层和一个卷积核大小为7×7的卷积层组成，用于通过不同大小的卷积来捕获目标区域中各网格对应的气温值的空间邻域相关性。