CN116862061A

CN116862061A - 一种基于时空图卷积神经网络的多机场航班延误预测方法

Info

Publication number: CN116862061A
Application number: CN202310832643.1A
Authority: CN
Inventors: 刘健波; 张�浩
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2023-07-08
Filing date: 2023-07-08
Publication date: 2023-10-10

Abstract

本发明公开了一种基于时空图卷积神经网络的多机场航班延误预测方法。本发明中，提出了一种基于时空图卷积神经网络的多机场延误预测方法。该方法使用有向图来表达了多机场网络，使用机场延误来作为多机场网络邻接矩阵的权重，利用GCN神经网络模型可以直接作用于图结构，并且能充分提取图结构信息的特点，来提取多机场网络中的空间信息特征，利用GRU神经网络模型良好的时序捕捉能力，来提取多机场网络中的时间信息特征，两者相结合，构建一个多机场网络延误预测模型MADPNet，结合GRU神经网络模型，建立多机场航班延误预测模型，并实现多时间步预测。此方法可以有效地提取网络级机场延误在时间维度上的变化趋势。

Description

一种基于时空图卷积神经网络的多机场航班延误预测方法

技术领域

本发明属于航班延误预测领域，具体为一种基于时空图卷积神经网络的多机场航班延误预测方法。

背景技术

随着全球经济的不断发展，乘坐飞机出行逐渐成为一种普遍的选择。但由于气象等因素的影响，机场航班常常出现各种延误的问题。这对于航空公司和旅客们，都产生了较大的负面影响。航班延误，不仅会增加旅客住宿、餐饮等额外支出，而且会影响旅客的行程安排，导致错过重要的商务会议或其他紧急事务。而对于航空公司而言，频繁的航班延误不仅需要承担延误所带来的额外成本，例如员工工资、旅客赔偿等费用，而且还会对品牌形象带来负面影响。为此，良好的航班延误预测方法，可为航空公司及时调整航班调度策略，减少不必要的成本和资源浪费，也可为旅客合理规划个人行程，减少一些不必要的机场等待时间。

在预测机场航班延误的问题上，常用的一些方法：(1)历史数据分析法，此方法主要是收集过去一段时间的航班延误数据，对数据进行统计分析，计算各种指标，绘制图表等，以此来找到数据中的规律和趋势，从而预测未来可能发生的航班延误情况。这种方法执行起来简单易行，不需要复杂的计算和深厚的专业知识，直观地从大量数据中寻找规律和趋势，预测结果具有较好的可解释性。但缺点是使用静态数据，不能有效应对突发事件，如极端天气、突发故障等。(2)机器学习方法，此方法利用计算机对大量数据进行自动学习和分析，从而发现数据中的规律和关联。通过将历史航班延误数据、天气数据、航班计划数据等作为输入，机器学习模型可以预测未来的航班延误情况。目前已有的一些机器学习方法，例如支持向量机(SVM)模型，探讨了航班延误与各个关键因素之间的非线性关系；梯度提升决策树模型，通过结合基于机器学习范例的回归模型，对空中交通延误的模式进行详细分析；还有逻辑回归方法以及CART、KNN、GBM、XGB、LGBM机器学习模型等，这些传统的机器学习方法，在航班延误预测上取得了一定效。

但这些方法的泛化性能相对较差，并且都没有考虑到多机场网络的时空动态性和随机性，没有充分挖掘多机场网络的空间特征信息。

发明内容

本发明的目的在于：为了解决上述提出的问题，提供一种基于时空图卷积神经网络的多机场航班延误预测方法。

本发明采用的技术方案如下：一种基于时空图卷积神经网络的多机场航班延误预测方法，所述基于时空图卷积神经网络的多机场航班延误预测方法包括以下步骤：

S1:先进行数据采集及处理，

S2:进行多机场网络构建，根据航班历史数据，构建以机场为节点的机场间通航矩阵。如果两个机场间存在通航，则把矩阵中对应位置设为1，若不存在通航，则把矩阵对应位置设为0。这是最基本的矩阵构建，为了更加准确地描述多个机场之间的通航情况，应该考虑边的权重，边也就代表了机场与机场之间的关系。并且两个机场之间的往返航班数量、产生的延误并不是对等的，这在图结构中，可以认为多机场网络图并非是一个无向图，而是有向图。例如，在2017年8月，ZSSS到ZBAA的航班总量为1236，而ZBAA到ZSSS的航班总量为1052。两个机场之间的航班进港数量和航班出港数量是不同的，这就表明本例中的多机场网络是一种有向图结构

S3:进行特征筛选，针对多机场延误预测，在气象数据中，主要筛选温度、风向、风速、能见度、反射率、露点这几个关键的信息来作为气象数据特征

S4:进行模型的构建，建立多机场延误预测模型

针对多机场航班延误预测所具有的时空相关特性，将GCN与GRU结合构建多机场航班延误预测模型，其核心计公式如下所示：

r_t＝σ(W_r[f(x_t,A),h_t-1]+b_r) (10)

z_t＝σ(W_z[f(x_t,A),h_t-1]+b_z) (11)

c_t＝tanh(W_c[f(x_t,A),r_t*h_t-1]+b_c) (12)

h_t＝(1-z_t)*h_t-1+z_t*c_t (13)

最终构造出的预测模型如图3所示。

S5:模型输出长度的时间步，输出时间跨度的结果，之后即可结束整个预测过程。

在一优选的实施方式中，所述步骤S1中，对于机场航班历史数据，选取了2017年全国各大机场的真实航班数据；

对于机场航班气象数据，本方案从航空例行天气报告(Meteorological TerminalAviation Routine Weather Report，METAR)中提取所需的气象数据。通常，机场或者气象观测站每隔半小时或一小时会生成一个METAR，METAR是一种观测气象数据传输格式，通过世界气象组织的规范以后，成为了世界各国气象数据的常用气象数据传输格式。

在一优选的实施方式中，所述步骤S1中，对于缺失与异常数据处理：采取的方式是直接删除含有缺失值的记录，对于个别数据的缺失，采用填充法，通过特定值、平均值、中位数或者众数的方式来完成填充。对于异常数据的检测，采用MAD方法，这是一种基于中位数的异常检测方法。

在一优选的实施方式中，所述步骤S1中，将原始数据保存于MySQL数据库中，利用MySQL中的聚集函数，筛选出各个机场的不同时间段的航班信息，利用数据库表操作，计算出各个机场在同一时间段内的延误。

在一优选的实施方式中，所述步骤S2中，构建多机场网络，不仅要从有向图的角度出发，而且要考虑到边的权重问题。边的权重，我们可以通过计算两个机场之间，在某一段时间内的延误总时间，以此来作为矩阵中对应边的权值，并使用均值归一化方法，让每个权值都集中在较小的尺度和范围当中，这有利于后续的多机场延误预测模型的训练，最终完成对多机场网络邻接矩阵的构建，如图2所示。

在一优选的实施方式中，所述步骤S3中，气象数据和机场航班历史数据对于多机场延误预测模型的预测效果而言是至关重要的。其中，气象数据主要从METAR报文中提取，此报文中主要包括了机场代码、温度、风力、具体天气等气象信息，在航空运输当中，天气对于延误的影响是十分明显的，天气和机场延误之间存在强相关性，特别是METAR报文中所包含的风力、能见度等信息。

在一优选的实施方式中，所述步骤S4中，使用损失函数：

使用MSE(Mean Square Error)作为损失函数，在损失函数的基础加上正则化项，作为模型训练的目标函数，其中y是样本的实际值，是样本的预测值。

在一优选的实施方式中，所述步骤S5中，评价指标为：

均方根误差(Root Mean Square Error，RMSE)，可以直观的反应误差大小，但容易受异常值影响；平均绝对误差(Mean Absolute Error，MAE)，关注预测误差的绝对值之和的均值，对异常值的敏感性较低，是一个相对稳健的评价指标；平均绝对百分比误差(MeanAbsolute Percentage Error，MAPE)，可

以直观反映预测误差相对大小。公式中Y_i是样本的实际值，是样本的预测值。

在一优选的实施方式中，所述步骤S5中，GCN模型核心计算公式

本多机场网络是一个有向图结构，通过GCN捕捉空间信息特征。公式中A为多机场网络的邻接矩阵，是度矩阵，其中/> 为/>的转置，W₀、W₁分别为邻接矩阵/>的权重系数矩阵。

在一优选的实施方式中，所述步骤S5中，GRU模型核心计算公式

r_t＝σ(W_r[x_t,h_t-1]+b_r) (6)

z_t＝σ(W_z[x_t,h_t-1]+b_z) (7)

c_t＝tanh(W_c[x_t,r_t*h_t-1]+b_c) (8)

h_t＝(1-z_t)*h_t-1+z_t*c_t (9)

公式中，x_t表示t时刻的输入，初始时刻隐藏状态为0，h_t-1表示t-1时刻的隐藏状态(hidden state)，h_t是t时刻的隐藏状态。z_t为更新门、r_t为重置门、c_t为计算候选隐藏层，σ表示sigmoid激活函数。tanh也是激活函数中的一种，可以理解为加强的sigmoid函数，它不仅输出是非线性的，并且此函数可导，且函数的输出范围在[-1,1]之间。W_z，W_r，W_c分别为更新门、重置门、候选隐藏状态的权重矩阵。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

1、本发明中，将多机场网络，用有向图进行表示，使用机场某一时刻的总体延误时间，作为机场网络邻接矩阵中的权重表达。

2、本发明中，基于GCN神经网络模型，提取某一个时刻，多个机场在空间网络结构上的特征信息；并结合GRU神经网络模型，建立多机场航班延误预测模型，并实现多时间步预测。此方法可以有效地提取网络级机场延误在时间维度上的变化趋势。

3、本发明中，在本案例中，通过构建的MADPNet模型，可以快速准确地预测网络级机场航班延误，不需要对每个机场单独建立预测模型。

附图说明

图1为本发明的总体技术方案流程图；

图2为本发明中多机场网络邻接矩阵图；

图3为本发明中多机场航班延误预测模型图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

参照图1-3，

一种基于时空图卷积神经网络的多机场航班延误预测方法，所述基于时空图卷积神经网络的多机场航班延误预测方法包括以下步骤：

S1:先进行数据采集及处理，

S4:进行模型的构建，建立多机场延误预测模型

r_t＝σ(W_r[f(x_t,A),h_t-1]+b_r) (10)

z_t＝σ(W_z[f(x_t,A),h_t-1]+b_z) (11)

c_t＝tanh(W_c[f(x_t,A),r_t*h_t-1]+b_c) (12)

h_t＝(1-z_t)*h_t-1+z_t*c_t (13)

最终构造出的预测模型如图3所示。

所述步骤S1中，对于机场航班历史数据，选取了2017年全国各大机场的真实航班数据；

所述步骤S1中，对于缺失与异常数据处理：采取的方式是直接删除含有缺失值的记录，对于个别数据的缺失，采用填充法，通过特定值、平均值、中位数或者众数的方式来完成填充。对于异常数据的检测，采用MAD方法，这是一种基于中位数的异常检测方法。

所述步骤S1中，将原始数据保存于MySQL数据库中，利用MySQL中的聚集函数，筛选出各个机场的不同时间段的航班信息，利用数据库表操作，计算出各个机场在同一时间段内的延误。

所述步骤S2中，构建多机场网络，不仅要从有向图的角度出发，而且要考虑到边的权重问题。边的权重，我们可以通过计算两个机场之间，在某一段时间内的延误总时间，以此来作为矩阵中对应边的权值，并使用均值归一化方法，让每个权值都集中在较小的尺度和范围当中，这有利于后续的多机场延误预测模型的训练，最终完成对多机场网络邻接矩阵的构建，如图2所示。

所述步骤S3中，气象数据和机场航班历史数据对于多机场延误预测模型的预测效果而言是至关重要的。其中，气象数据主要从METAR报文中提取，此报文中主要包括了机场代码、温度、风力、具体天气等气象信息，在航空运输当中，天气对于延误的影响是十分明显的，天气和机场延误之间存在强相关性，特别是METAR报文中所包含的风力、能见度等信息。

所述步骤S4中，使用损失函数：

所述步骤S5中，评价指标为：

所述步骤S5中，GCN模型核心计算公式

所述步骤S5中，GRU模型核心计算公式

r_t＝σ(W_r[x_t,h_t-1]+b_r) (6)

z_t＝σ(W_z[x_t,h_t-1]+b_z) (7)

c_t＝tanh(W_c[x_t,r_t*h_t-1]+b_c) (8)

h_t＝(1-z_t)*h_t-1+z_t*c_t (9)

选择2017年全国各大机场的历史航班数据和气象数据，依照本方案中数据处理流程，建立多机场航班延误预测数据集。基于该数据集合，分别应用本发明提出的MADPNet模型、GRU神经网络模型、历史平均(Historical Average，HA)方法，预测网络级机场航班延误。设置MADPNet和GRU神经网络模型的输入长度为12个时间步，其中每个时间步的间隔为30分钟，模型输出长度为4的时间步。模型训练过程分别为：

构造输入：将数据集划分为训练集、验证集、测试集，以6小时为单位进行划分，输入到MADPNet和GRU神经网络模型中。

根据训练反馈结果，不断调整优化参数，如学习率、迭代次数、BatchSize等。

(3)输出：模型输出长度为4的时间步，输出时间跨度为2小时。

预测结果汇总如表1-1所示。

表1-1预测结果对比表

从表中各项指标来看，MADPNet神经网络模型在RMSE、MAE、MAPE这几项指标上均优于历史平均方法和GRU神经网络模型。GRU神经网络模型通过捕捉多机场的时序特征信息，使得模型预测达到较好效果。而MADPNet在GRU的基础上，使用了GCN来捕捉多机场网络中的空间信息特征，在预测性能上有了进一步突破。

本发明案例中提出的MADPNet模型，有效地预测了多机场航班延误，根据预测结果，管制人员调整航班调度策略，减少因航班延误而造成的不必要的成本支出，为航空高效运转提供了有力的保障。

为了进一步验证本发明中提出的MADPNet模型的可行性，选取了国内各主流机场的历史航班数据和对应气象数据进行测试。

1、数据收集与处理

依照本发明中的数据处理流程，建立多机场航班延误预测数据集。

2、模型构建与训练

基于该数据集，应用本发明方案提出的MADPNet模型，设置模型输入长度为12个时间步，其中每个时间步的间隔为30分钟，模型输出长度为4个时间步。将数据集划分为训练集、验证集、测试集，以6小时为单位进行划分，输入到MADPNet模型中。根据训练反馈结果，不断调整优化参数，如学习率、迭代次数、BatchSize等。

3、预测与评估

模型训练完成后，利用测试集对MADPNet模型进行预测和评估。结果表明，MADPNet模型在RMSE、MAE、MAPE等评价指标上优于历史平均方法和单独使用GRU神经网络模型。

4、应用与优化

根据MADPNet模型的预测结果，航空公司管制人员可以调整航班调度策略，减少因航班延误而造成的不必要的成本支出。同时，通过不断收集新的航班数据和气象数据，对MADPNet模型进行迭代优化，以提高预测准确性和实用性。

本发明中，将多机场网络，用有向图进行表示，使用机场某一时刻的总体延误时间，作为机场网络邻接矩阵中的权重表达。

本发明中，基于GCN神经网络模型，提取某一个时刻，多个机场在空间网络结构上的特征信息；并结合GRU神经网络模型，建立多机场航班延误预测模型，并实现多时间步预测。此方法可以有效地提取网络级机场延误在时间维度上的变化趋势。

本发明中，在本案例中，通过构建的MADPNet模型，可以快速准确地预测网络级机场航班延误，不需要对每个机场单独建立预测模型。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于时空图卷积神经网络的多机场航班延误预测方法，其特征在于：所述基于时空图卷积神经网络的多机场航班延误预测方法包括以下步骤：

S1:先进行数据采集及处理，

S2:进行多机场网络构建，根据航班历史数据，构建以机场为节点的机场间通航矩阵；如果两个机场间存在通航，则把矩阵中对应位置设为1，若不存在通航，则把矩阵对应位置设为0；这是最基本的矩阵构建，为了更加准确地描述多个机场之间的通航情况，应该考虑边的权重，边也就代表了机场与机场之间的关系；并且两个机场之间的往返航班数量、产生的延误并不是对等的，这在图结构中，可以认为多机场网络图并非是一个无向图，而是有向图；例如，在2017年8月，ZSSS到ZBAA的航班总量为1236，而ZBAA到ZSSS的航班总量为1052；两个机场之间的航班进港数量和航班出港数量是不同的，这就表明本例中的多机场网络是一种有向图结构

S4:进行模型的构建，建立多机场延误预测模型

r_t＝σ(W_r[f(x_t,A),h_t-1]+b_r) (10)

z_t＝σ(W_z[f(x_t,A),h_t-1]+b_z) (11)

c_t＝tanh(W_c[f(x_t,A),r_t*h_t-1]+b_c) (12)

h_t＝(1-z_t)*h_t-1+z_t*c_t (13)

最终构造出的预测模型；

2.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法，其特征在于：所述步骤S1中，对于机场航班历史数据，选取了2017年全国各大机场的真实航班数据；

对于机场航班气象数据，本方案从航空例行天气报告(Meteorological TerminalAviation Routine Weather Report，METAR)中提取所需的气象数据；通常，机场或者气象观测站每隔半小时或一小时会生成一个METAR，METAR是一种观测气象数据传输格式，通过世界气象组织的规范以后，成为了世界各国气象数据的常用气象数据传输格式。

3.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法，其特征在于：所述步骤S1中，对于缺失与异常数据处理：采取的方式是直接删除含有缺失值的记录，对于个别数据的缺失，采用填充法，通过特定值、平均值、中位数或者众数的方式来完成填充；对于异常数据的检测，采用MAD方法，这是一种基于中位数的异常检测方法。

4.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法，其特征在于：所述步骤S1中，将原始数据保存于MySQL数据库中，利用MySQL中的聚集函数，筛选出各个机场的不同时间段的航班信息，利用数据库表操作，计算出各个机场在同一时间段内的延误。

5.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法，其特征在于：所述步骤S2中，构建多机场网络，不仅要从有向图的角度出发，而且要考虑到边的权重问题；边的权重，我们可以通过计算两个机场之间，在某一段时间内的延误总时间，以此来作为矩阵中对应边的权值，并使用均值归一化方法，让每个权值都集中在较小的尺度和范围当中，这有利于后续的多机场延误预测模型的训练，最终完成对多机场网络邻接矩阵的构建。

6.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法，其特征在于：所述步骤S3中，气象数据和机场航班历史数据对于多机场延误预测模型的预测效果而言是至关重要的；其中，气象数据主要从METAR报文中提取，此报文中主要包括了机场代码、温度、风力、具体天气等气象信息，在航空运输当中，天气对于延误的影响是十分明显的，天气和机场延误之间存在强相关性，特别是METAR报文中所包含的风力、能见度等信息。

7.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法，其特征在于：所述步骤S4中，使用损失函数：

8.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法，其特征在于：所述步骤S5中，评价指标为：

均方根误差(Root Mean Square Error，RMSE)，可以直观的反应误差大小，但容易受异常值影响；平均绝对误差(Mean Absolute Error，MAE)，关注预测误差的绝对值之和的均值，对异常值的敏感性较低，是一个相对稳健的评价指标；平均绝对百分比误差(MeanAbsolute Percentage Error，MAPE)，可以直观反映预测误差相对大小；公式中Y_i是样本的实际值，是样本的预测值。

9.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法，其特征在于：所述步骤S5中，GCN模型核心计算公式

本多机场网络是一个有向图结构，通过GCN捕捉空间信息特征；公式中A为多机场网络的邻接矩阵，是度矩阵，其中/> 为/>的转置，W₀、W₁分别为邻接矩阵/>的权重系数矩阵。

10.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法，其特征在于：所述步骤S5中，GRU模型核心计算公式

r_t＝σ(W_r[x_t,h_t-1]+b_r) (6)

z_t＝σ(W_z[x_t,h_t-1]+b_z) (7)

c_t＝tanh(W_c[x_t,r_t*h_t-1]+b_c) (8)

h_t＝(1-z_t)*h_t-1+z_t*c_t (9)

公式中，x_t表示t时刻的输入，初始时刻隐藏状态为0，h_t-1表示t-1时刻的隐藏状态(hidden state)，h_t是t时刻的隐藏状态；z_t为更新门、r_t为重置门、c_t为计算候选隐藏层，σ表示sigmoid激活函数；tanh也是激活函数中的一种，可以理解为加强的sigmoid函数，它不仅输出是非线性的，并且此函数可导，且函数的输出范围在[-1,1]之间；W_z，W_r，W_c分别为更新门、重置门、候选隐藏状态的权重矩阵。