CN114626512B

CN114626512B - 一种基于有向图神经网络的高温灾害预报方法

Info

Publication number: CN114626512B
Application number: CN202210532112.6A
Authority: CN
Inventors: 王国杰; 罗子聪; 姜彤; 王艳君; 苏布达; 王国复; 冯爱青
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2022-05-17
Filing date: 2022-05-17
Publication date: 2022-09-06
Anticipated expiration: 2042-05-17
Also published as: CN114626512A; US20230375745A1; US11874429B2

Abstract

本发明公开了一种基于有向图神经网络的高温灾害预报方法，包括步骤如下：S1，将各气象要素分别进行标准化处理，使各气象要素按比例缩放在同一取值范围内；S2，构建有向图神经网络模型，将各气象要素作为图中的节点，采用图邻接矩阵描述各节点之间的关系；再采用逐步学习策略学习节点信息，并不断更新邻接矩阵的状态；S3，确定损失函数后开始训练有向图神经网络模型，通过调整学习率、优化器、正则化参数得到满足要求的模型作为预测模型，并保存预测模型；S4，输入历史气象数据，得到未来一段时间的高温灾害指数预报，发出相应的灾害预警。本发明在模型中加入了注意力机制，能够使模型关注对变量影响大的部分，更有利于有效信息的聚合。

Description

一种基于有向图神经网络的高温灾害预报方法

技术领域

本发明涉及短期气象预报方法，尤其涉及基于有向图神经网络的高温灾害预报方法。

背景技术

气候千变万化且变化过程极其复杂，而气候异常可能导致干旱、洪水、台风等自然灾害，严重影响人类社会活动。随着社会的发展，许多气象相关行业对天气预报的准确性和及时性提出了更高的要求。气象预报的研究主要以两种方式进行，即基于物理学计算和基于数据驱动，基于物理学的气象预测模型通常依赖于大规模的数值模拟，基于观测数据模拟出大气中的物理过程；数据驱动的模型使用传统统计方法或基于深度学习的方法进行气象预测。物理参数化所固有的不确定性，或对物理过程的不完全理解是数值天气预报未来发展的主要科学挑战。传统统计方法如自回归差分移动平均模型(ARIMA)主要针对平稳的时间序列有效，且只能捕捉变量间的线性关系。早期机器学习模型如浅层神经网络受限于有限的样本容量和计算单元，对复杂函数的表示能力有限，针对复杂问题其泛化能力受到一定制约。

高温灾害通常指由于高温持续时间较长，引起人、动植物及无机环境等生命体和非生命体不适并且产生不利影响的一种气象灾害。客观分析城市高温环境，准确识别高温灾害的致灾因子，科学预测评估高温灾害风险，是城市规划积极响应城市高温的前提，也是在国土空间规划体系中融入高温灾害应对策略的基础工作。高温灾害的灾害因素主要是温度、湿度、风速等气象要素，但是由于气象要素间的相关性具有不确定性且各要素存在短时间内快速变化的特点，无法用传统统计模型模拟出致灾因子变化过程和相互作用。

气象预测本身就是大数据问题，涉及到不同时间和空间上的海量数据，是深度学习非常好的应用场景。与基于物理过程的数值天气预报(NWP)模型相比，深度学习自动化提取数据内部特征，消除了传统特征工程方法中对人为经验的依赖性。同时，这些方法在时间序列和空间格点类型的数据上相比于传统方法具有更强有力的特征提取能力，提供了一种以纯数据驱动方式建模时间序列的方法。在过去几年，神经网络的兴起推动了深度学习与各学科领域的交叉。循环神经网络首先被提出来处理时间序列上的非线性递归问题，该网络的大部分变体如LSTM(长短期记忆)、GRU(门控循环单元)等在时间序列预测上表现出的性能超越了传统统计预报方法。然而气象要素之间的影响是有向的，某一要素的变化会导致其他要素甚至整个环境状态的改变。传统的深度学习网络在处理多元时间序列上存在以下问题：(1)仅仅假设变量之间存在关系，无法模拟出某个变量的改变如何影响其他变量。(2)在处理长时间序列上的性能表现不佳，随着数据量增大，模型复杂度呈二次增长使得模型出现过拟合现象。

发明内容

发明目的：本发明的目的是提供一种能实现利用有向图神经网络反映变量之间的驱动关系，作出未来短期内高温灾害智能预报的方法。

技术方案：本发明的高温灾害预报方法，包括步骤如下：

S1，将各气象要素分别进行标准化处理，使各气象要素按比例缩放在同一取值范围内；根据具体行政区域规定的高温等级阈值，将高温灾害数值设置为0，1，2，3，分别表示无高温灾害、高温黄色预警、高温橙色预警、高温红色预警；高温灾害数值进入模型后会被编码为离散值向量(y1,y2,y3,y4)，作为标签加入输入数据，完成数据重构；

根据气象要素本身的时间周期特性，将标准化后的各气象要素基于滑动窗口法构建成多维时间序列样本集；

按照设定比例，将所述多维时间序列样本集划分为训练集、验证集和测试集；

S2，构建有向图神经网络模型；

S3，确定损失函数后开始训练有向图神经网络模型，通过调整学习率、优化器、正则化参数得到满足要求的模型作为预测模型，并保存预测模型；

S4,将历史多变量时间序列输入预测模型，根据需求改变输出步长，得到未来一段时间内的高温灾害指数预报，发出相应的灾害预警。

进一步，所述步骤S1中，各气象要素包括日最高气温、降水、风速、空气湿度、日照时数、蒸散发；

根据气象要素的周期性特征，建成多维时间序列样本集如下：

设z_t∈R^N，R表示实数，表示在时间步长t时的多元变量的值，其中z_t[i]∈R表示时间步长t时变量i的值，则给定时间长度为p的多变量数据的历史序列为：

标签集为：

其中，

分别代表g时刻的无灾害风险的概率、发出高温黄色预警概率、发出高温橙色预警概率和发出高温红色预警概率，其中g＝1，2，3，...，p。

进一步，所述步骤S2中，有向图神经网络模型需要从图的角度来建模变量之间的相互驱动关系，将各气象要素作为图中的节点，采用图邻接矩阵描述各节点之间的关系；再采用逐步学习策略学习节点信息，并不断更新邻接矩阵的状态；所述逐步学习策略为：图学习层从一个起始状态，每一次学习向图中添加一个节点，再利用循环神经网络根据节点信息自回归计算相似性得分，生成新节点与每个初始节点间的连接关系；

循环神经网络处理节点初始信息并将节点的表示向量解码为隐藏状态作为下一次迭代的输入，在迭代过程中不断聚合各节点信息，迭代过程如下：

M₁＝tanh(αE₁Θ₁)

M₂＝tanh(αE₂Θ₂)

H_t＝sigmod(W·x_t+U·H_t-1)

其中，W和U均为超参数，x_t为当前输入的时间序列数据；

sigmoid函数表达式为

e是自然对数函数的底数；E₁、E₂表示随机初始化的节点嵌入，Θ₁、Θ₂是神经网络模型参数；α是控制激活函数饱和速率的超参数，均在训练过程中被学习；A为根据节点对信息聚合后得到的邻接矩阵；H_t-1为上一层迭代的输出隐藏状态、H_t为该层的隐藏状态即节点的表示向量；

通过聚合各节点信息，不断更新图的构成，最终得到全局图邻接矩阵。

进一步，所述步骤S2中，根据气象数据的时间周期特征、能量循环与水循环和气象要素间相互影响，构建有向图神经网络模型；所述有向图神经网络模型通过嵌套式的图卷积模块和时间卷积模块将输入数据的信息进行聚合，具体实现过程如下：

图学习模块从输入时间序列数据中根据逐步学习策略方法自适应提取图邻接矩阵，作为后续图卷积模块聚合节点信息过程的输入；同时，抽样的方法每次只计算成对节点间的相似性得分，将得分作为隐藏状态在每一次计算过程中聚合得到最终的全局图邻接矩阵；

图形卷积模块由两个混合传播层组成，分别处理通过每个节点的流入和流出信息，混合传播层包括信息传播过程和信息选择过程；信息传播过程基于图邻接矩阵给定的图结构传播节点信息，信息选择过程过滤传播过程产生的噪声；

在图邻接矩阵中赋予连接节点的边不同的权重，实现在信息传播过程中加入注意力机制，表达式为：

H_t＝βH_t-1

其中，β对应每条边的权重，H_t-1为网络上一次迭代的输出隐藏状态，H_t为该层的隐藏状态即节点的表示向量。

进一步，所述时间卷积模块由四种不同大小的卷积核组成，用于提取数据的时间特征，提取过程中通过设定卷积核的大小来控制感受野，感受野的计算公式如下：

rfsize＝(out-1)*stride+ksize

其中，out为上一层感受野大小；stride为当前层感受野移动步长，默认为1；ksize为当前层卷积核大小。

进一步，所述步骤S3中，选取交叉熵损失函数作为损失函数，具体公式为：

其中，m为数据总量，p为分类数，k为当前输入数据，y′^(k)为预测值，y^k为真实值。

本发明与现有技术相比，其显著效果如下：

1、通过模拟气象要素间的有向驱动关系，提出了一种基于有向图神经网络的高温灾害预报方法；

2、由于每个要素间的相互影响程度不尽相同，本发明在模型中加入了注意力机制，能够使模型更多关注于对变量影响大的部分，更有利于有效信息的聚合；

3、本发明提出了一种能够捕获各种时间周期模式的卷积核组合，使得模型具备处理长时间序列的能力；

4、充分考虑能量循环与水循环的相互作用，结合同一尺度相互作用的日最高气温、降水、风速、空气湿度、日照时数、蒸散发，利用有向图神经网络反映变量之间的驱动关系，作出未来短期内的高温灾害精准预报，科学预测评估高温灾害风险，为气象部门的决策提供有力支持，为人们日常活动提供参考。

附图说明

图1为本发明的总框架示意图；

图2为本发明的滑动窗口设置及向输入数据形式的转化示意图；

图3(a)为本发明中“图”的示例；

图3(b)为图3(a)对应的节点示例；

图3(c)为图3(a)对应的图邻接矩阵示例图；

图4为本发明图邻接矩阵的学习过程示意图；

图5为本发明的注意力机制示意图；

图6为本发明的有向图神经网络框架示意图。

具体实施方式

下面结合说明书附图和具体实施方式对本发明做进一步详细描述。

本发明利用图神经网络建立有向网络反映日最高气温、降水、风速、空气湿度、日照时数、蒸散发之间的有向驱动关系，最终实现高温灾害的智能精准预测。图神经网络使用图形结构将变量作为图中的节点，每个节点都会有边与图中其他节点相关，依靠节点间隐藏关系的数学表示——图邻接矩阵，遵循邻域聚合策略，按照聚合节点的领域信息来迭代更新节点的表示。它既可以捕获变量间的相互依赖关系，又可以通过改进一维卷积形式来捕获时间模式，处理很长的时间序列。

如图1所示，为本发明的整体框架示意图。本发明包括如下步骤：

(1)多变量气象数据预处理；

(2)有向图神经网络的搭建；

(3)确定损失函数，训练网络；

(4)基于深度学习方法进行高温灾害预报。

本发明的具体实现过程如下：

步骤1，多变量气象数据预处理

深度学习模型需要大量的训练样本来预训练模型，时间序列预测是以历史数据分析为基础的对将来的预测，因此需要历史的包含多种气象要素的时间序列来预训练模型并验证模型的性能。

(11)数据标准化

原始数据中由于各气象要素(例如日最高气温、降水、风速、空气湿度、太阳辐射、蒸散发、地表净辐射等)的度量单位和取值范围不同，同一气象要素最大最小值之间也可能相差几个数量级，如地表净辐射的数值范围在0-10⁷之间，输入模型时会造成特征值的分布范围差异很大，会影响模型的收敛速度和精度，需要对原始数据标准化处理，使得每个变量的取值范围在-1～1之间。

(12)数据重构

作为突发气象灾害预警信号的一种，高温预警信号分三级，分别以黄色、橙色和红色表示，具体根据各行政区域规定的高温等级阈值来划分。首先人工标识历史时间序列上的高温灾害指数，即在输入数据中根据日最高气温值添加一列高温灾害指数，0表示无高温灾害风险，1表示高温黄色预警，2表示高温橙色预警，3表示高温红色预警。

(13)基于滑动窗口法构建多维时间序列样本集

对时间序列分析的目的是通过找出样本内时间序列的统计特性和发展规律性，基于规律构建时间序列模型，进行样本预测。多种气象要素都具有周期性特征，如日最高气温以月或季为周期等，因此可以在各气象要素值标准化后使用滑动窗口法构建时间序列，如图2所示，滑动窗口大小可以为30、60或90，滑动窗口每次的移动步长为1。

设z_t∈R^N(R表示实数)表示在时间步长t时的多元变量的值，其中z_t[i]∈R表示时间步长t时变量i的值，则给定时间长度为p的多变量数据的历史序列为：

每日高温灾害指数在进入模型后将被编码为离散值向量

四个值分别代表g时刻的无灾害风险概率、发出高温黄色预警概率、发出高温橙色预警概率和发出高温红色预警概率，如当日日最高气温为41.6℃，则离散值向量为(0，0，0，1)，g＝1，2，3，…，p。那么高温灾害指数可以表示为：

(14)划分数据集

将多维时间序列样本集按照一定比例(通常为7：1：2)划分为训练集、验证集和测试集，其中训练集和验证集共同参与模型的训练过程，测试集用于测试训练好的模型的效果。

步骤2，有向图神经网络的搭建

本发明中图神经网络使用图形结构将日最高气温、降水、风速、空气湿度、日照时数、蒸散发作为图中的节点，每个节点都会有边与图中其他节点相关，依靠节点间隐藏关系的数学表示——图邻接矩阵，遵循邻域聚合策略，通过图卷积模块按照聚合节点的领域信息来迭代更新节点的表示。又可以通过改进一维卷积形式来捕获时间模式，处理很长的时间序列。网络输出层由四个神经元组成，分别映射四个离散值，代表无高温灾害概率、发出高温黄色预警概率、发出高温橙色预警概率、发出高温红色预警概率。

图描述了模型中变量之间的关系，给出图相关概念的定义如下：

定义1：图

一个图被公式化为：

G＝(V，E) (3)

其中，V是节点集，E是边集(表示节点之间的关系)。

定义2：邻域节点

v∈V表示一个节点，e＝(v，u)∈E表示从u指向v的边，则有节点v的临近节点定义为：

N(v)＝{u∈V|(v，u)∈E} (4)。

定义3：邻接矩阵

邻接矩阵是图的数学表示，表示为A∈R^N×N，N表示为图中的节点数。

下面给出图邻接矩阵的一个示例：图3(a)为“图”的示例，图3(b)为图3(a)对应的节点示例，图3(c)为图3(a)对应的图邻接矩阵示例图；其中，1和0分别表示两相邻节点有无隐藏关系，如图3(c)中所示，图邻接矩阵能揭示变量间的单向或双向关系，图邻接矩阵作为外部结构输入为图卷积过程提供了信息传递的方向。

基于以上对图的定义来看，本发明将多元时间序列中的日最高气温、降水、风速、空气湿度、日照时数、蒸散发视为图中的节点，图邻接矩阵描述节点之间的关系，将使用图学习层来学习邻接矩阵。

本发明提出了一种逐步学习策略：图学习层从一个起始状态，每一次学习向图中添加一个节点，再利用循环神经网络根据节点信息自回归计算相似性得分，生成新节点与每个初始节点间的连接关系，如图4所示。

循环神经网络处理节点初始信息并将节点的表示向量解码为隐藏状态(hiddenstate)作为下一次迭代的输入(计算如公式(8))，在迭代过程中不断聚合各节点信息：

M₁＝tanh(αE₁Θ₁) (5)

M₂＝tanh(αE₂Θ₂) (6)

H_t＝sigmod(W·x_t+U·H_t-1) (8)

其中，W和U均为超参数，x_t为当前输入的时间序列数据，sigmoid函数表达式为

e是自然对数函数的底数；E₁、E₂表示随机初始化的节点嵌入，Θ₁、Θ₂是神经网络模型参数；α是控制激活函数饱和速率的超参数，均在训练过程中被学习；A为根据节点对信息聚合后得到的邻接矩阵，H_t-1为上一层迭代的输出隐藏状态、H_t为该层的隐藏状态即节点的表示向量。

图学习模块完全从输入时间序列数据本身中根据逐步学习策略方法自适应提取图邻接矩阵，作为后续图卷积模块聚合节点信息过程的输入。为了减少计算和存储的成本，本发明采用了一种抽样的方法，即每次只计算成对节点间的相似性得分，将得分作为隐藏状态在每一次计算过程中聚合得到最终的全局图邻接矩阵。这种抽样方法使得有向图神经网络模型能够随着输入数据的更新不断更新邻接矩阵，泛化性更强。

图形卷积模块由两个混合传播层组成，分别处理通过每个节点的流入和流出信息，旨在融合节点信息。混合传播层包括两个过程，信息传播过程和信息选择过程。信息传播过程基于图邻接矩阵给定的图结构传播节点信息；信息选择过程过滤传播过程产生的噪声。

考虑到气象要素间的相互影响不能一概而论，如大气热量的根本来源是太阳辐射，在同一片地区内太阳辐射相对于其他影响大气温度的因素来说应占更大的比重。因此，本发明在信息传播过程中加入注意力机制，即在图邻接矩阵中赋予连接节点的边不同的权重，如下图5所示，其表达式为：

H_t＝βH_t-1 (9)

加入注意力机制有利于消除噪声对有向图神经网络模型产生的负面影响，避免过度平滑问题，也有利于释放模型占用内存，将计算力集中到更为重要的部分。

本发明考虑到不同气象要素具有不同的时间周期特征，为了使有向图神经网络模型不受这些不同周期特征的影响，本发明在有向图神经网络模型中加入了一种由四种不同大小的卷积核组成的时间卷积模块，使其能够捕获不同的周期信号，如图6所示。时间卷积模块用于提取数据的时间特征，提取过程中通过设定卷积核的大小来控制感受野，由于时间信号往往具有几个固有周期，例如7、12、24、28和60，卷积核太大无法捕获短期时间特征，太小则无法捕获长期时间特征。为了能够捕获各种范围的周期特征和提高有向图神经网络模型处理长时间序列的能力，有向图神经网络模型将4种不同大小(1*2、1*3、1*6和1*7)的卷积核组合起来构成时间卷积模块。感受野的计算公式如下：

rfsize＝(out-1)*stride+ksize (10)

其中，out为上一层感受野大小，stride为当前层感受野移动步长，默认为1，ksize为当前层卷积核大小。如为了表示周期12，有向图神经网络模型通过设置第一层1*7的卷积核和第二层的1*6卷积核来传递输入。

时间卷积模块后紧接着四个输出神经元，每一个神经元映射一个离散值，连接后得到对应于人工标识的高温灾害指数向量的预测向量(y’₁，y’₂，y’₃，y’₄)，每一个离散值与输入变量的线性关系如下：

y’₁＝x₁w₁₁+x₂w₂₁+x₃w₃₁+......+x_iw_i1+b₁ (11)

y’₂＝x₁w₁₂+x₂w₂₂+x₃w₃₂+......+x_iw_i2+b₂ (12)

y’₃＝x₁w₁₃+x₂w₂₃+x₃w₃₃+......+x_iw_i3+b₃ (13)

y’₄＝x₁w₁₄+x₂w₂₄+x₃w₃₄+......+x_iw_i4+b₄ (14)

其中X_i表示第i个输入变量，W_ij和b_j为模型参数，j＝1，2，3，4，由模型在训练过程中自主学习。

然后通过sofxmax运算符将预测向量通过下式(15)将输出值变为正数且和为1的概率分布：

y’₁，y’₂，y’₃，y’₄＝soft max(y’₁，y’₂，y’₃，y’₄) (15)

其中，j＝1，2，3，4。通过softmax运算后，由于输出都在[0，1]，所以可以赋予其一个实际含义，即属于某个类别的概率。因此，y’₁，y’₂，y’₃，y’₄构成了一个概率分布，并取最大概率对应的类别作为输出类别。如概率分布为(0.1，0.84，0.06，0)，则输出为高温黄色预警对应的灾害指数1。

步骤3，确定损失函数，训练网络

将步骤1中处理好的训练集和验证集数据输入步骤2构建的有向图神经网络模型，进行训练，根据有向图神经网络模型的表现，调整有向图神经网络模型的参数如学习率、优化器、正则化参数等，使得有向图神经网络模型达到理想效果，训练多次保存效果最好的有向图神经网络模型作为预测模型。

由于未来的预测值没有观测数据用于验证，时间序列预测任务中无论是训练模型还是验证模型都使用历史时间序列数据。在训练过程中，损失函数通常作为学习准则，用来评估模型的预测向量与真实值向量不一样的程度，一般通过交叉熵损失函数来达到训练模型的目的。具体公式为：

其中，m为数据总量，p为分类数，在此处为4。k为当前输入数据，y’_(k)为预测向量，y_(k)为真实值向量。

确定损失函数后，开始训练有向图神经网络模型。训练过程中观察损失函数曲线是否逐渐降低最后趋于平稳，若下降速度慢或期间波动剧烈，则可以适当调整模型参数如学习率(learning rate)、批量大小(batch size)等；待损失函数曲线下降到最低并趋于平稳后，保存最佳模型作为预测模型。

步骤4，基于深度学习方法进行高温灾害预报

将一段多变量时间序列输入预测模型，即可根据需求改变输出步长，得到一段时间内的高温灾害指数序列，发出对应的高温灾害预警。

Claims

1.一种基于有向图神经网络的高温灾害预报方法，其特征在于，包括步骤如下：

S1，将各气象要素分别进行标准化处理，使各气象要素按比例缩放在同一取值范围内；根据高温预警等级，将高温灾害数值设置为0，1，2，3，分别表示无高温灾害、高温黄色预警、高温橙色预警、高温红色预警；高温灾害数值进入模型后会被编码为离散值向量(y₁，y₂，y₃，y₄)，作为标签加入输入数据，完成数据重构；

S2，构建有向图神经网络模型；实现过程如下：

有向图神经网络模型从图的角度来建模变量之间的相互驱动关系，将各气象要素作为图中的节点，采用图邻接矩阵描述各节点之间的关系；再采用逐步学习策略学习节点信息，并不断更新邻接矩阵的状态；所述逐步学习策略为：图学习层从一个起始状态，每一次学习向图中添加一个节点，再利用循环神经网络根据节点信息自回归计算相似性得分，生成新节点与每个初始节点间的连接关系；

M₁＝tanh(αE₁Θ₁)

M₂＝tanh(αE₂Θ₂)