CN116307271A

CN116307271A - 一种基于航班延误波及预测的交互方法与系统

Info

Publication number: CN116307271A
Application number: CN202310551289.5A
Authority: CN
Inventors: 屈景怡; 王锦峰; 武世兴
Original assignee: Civil Aviation University of China
Current assignee: Civil Aviation University of China
Priority date: 2023-05-17
Filing date: 2023-05-17
Publication date: 2023-06-23
Anticipated expiration: 2043-05-17
Also published as: CN116307271B

Abstract

本发明请求保护一种基于航班延误波及预测的交互方法和系统，通过将历史航班数据的航班运行信息进行清洗、处理和打标签操作；再以航空器的唯一标识为关键主键，筛选出满足三级航班链条件的航班，融合组成三元组形式的航班链数据集；再对离散型和连续型的数据分别采用Catboost和Min‑Max编码，得到编码后的数据送入改进后的Transformer网络模型进行训练；将待预测的航班信息输入到训练好的航班延误波及预测模型进行预测，将该模型导出并挂载到TensorFlow Serving端，利用Docker将Serving服务和Web服务的服务环境和安装依赖项打包封装，客户通过API接口得到最终的预测结果。本发明对航班延误波及预测具有很好的预测性能，模型操作简单，易训练，易于部署。

Description

一种基于航班延误波及预测的交互方法与系统

技术领域

本发明属于数据分析大数据与人机交互领域，尤其是涉及一种基于航班延误波及预测的交互方法与系统。

背景技术

随着航空业的不断发展和全球经济的加速发展，航班运输已成为现代交通运输的重要组成部分。航空公司为了适应急速上升的航班需求要求，缓解机场服务资源有限，空域资源紧缺的问题，往往制定紧凑的航班计划安排，不断增加飞机连续利用的程度，使得同一架飞机要执行多个航班任务。如果某个航班任务发生某种原因的延误，则会波及到下游的很多航班，进而导致大面积的航班延误。因此，航班延误波及问题存在着时间和空间上的联系，若通过深度学习方法，输入相关的波及链式数据，准确预测每级航班的延误程度，就能够更好的帮助机场和航空公司管理航班，提高航班效率，降低运营成本；还能提高旅客满意度，为旅客带来良好的飞行体验，同时能够减少空中交通事故、确保飞行安全。因此，航班延误波及预测方法的研究具有重要的现实意义。

由于机器学习技术的快速发展，航班延误预测算法模型不断增多，用户对于航班延误的需求不一，项目和环境分开部署，环境离散，不方便后续的管理，因此需要设计航班延误通用预测算法平台，利用主流的Docker技术将该预测平台及其所需的依赖进行封装。在部署的目标系统上，无需使用源代码，无需处理依赖，无需编译，只要把打包的软件安装好，即可实现项目和环境统一化部署，客户通过不同的API接口实现不同算法的内部使用以及外部调用。

发明内容

有鉴于此，本发明旨在提出一种基于航班延误波及预测的交互方法与系统，以期待解决上述部分技术问题中的至少之一。

根据本发明第一方面，本发明请求保护一种基于航班延误波及预测的交互方法，其特征在于，包括：

采用Docker + Serving + Web服务架构，将已经训练好的航班延误波及网络模型导出，并在Tensorflow Serving中进行挂载；

构建Web服务，接收并解析用户的数据模型预测请求，并向用户的客户端反馈预测结果；

将航班延误波及预测服务所需要的环境和依赖项进行封装和打包，以便在不同平台环境中的部署和运行。

具体的，所述航班延误波及网络模型的训练过程包括：

将历史航班数据的航班运行信息进行清洗、处理和特征提取，获取待处理航班运行信息；

基于所述待处理航班运行信息中的实际起飞时间和实际到达时间，计算航班的起飞延误时间并划分延误等级；

采用航空器的唯一标识为主键，筛选满足多级航班链条件的航班，融合组成三元组形式的单条航班链，再连续筛选组成航班链数据集；

对所述航班链数据集的特征信息进行编码，其中，离散型特征数据进行Catboost编码，数值型特征数据进行Min-Max归一化编码；

对于航班延误预测的非生成式任务，需要将编码后的训练集航班链数据输入到改进好的transformer网络模型进行训练，生成训练好的航班延误波及网络模型，再通过编码后的验证集航班链数据监控性能指标，逐步调节航班延误波及网络模型的超参数，得到具有最优超参数的航班延误波及网络模型；

将划分出的测试集航班链数据输入到训练好的所述航班延误波及网络模型中，得到最终的输出结果，查看结果是否满足预期的要求，若不满足，则重新进行网络模型的训练。

进一步地，所述将历史航班数据的航班运行信息进行清洗、处理和特征提取，获取待处理航班运行信息，具体包括：

剔除取消航班或航班号错误的数据；

利用插值法对缺失值进行填充；

保留航班信息中空间和时间信息丰富的特征属性；

所述待处理航班运行信息中的实际起飞时间和实际到达时间，计算航班的起飞延误时间并划分延误等级，具体包括：

所述起飞延误时间计算公式为：

其中，

表示某一历史航班，

表示航班实际的到达时间，

表示航班实际的起飞时间；

利用航班运行信息数据中实际起飞时间与实际到达时间这两个特征属性，计算出每条航班的起飞延误时间，再为每个航班分配一个延误等级标签；

所述采用航空器的唯一标识为主键，筛选满足多级航班链条件的航班，融合组成三元组形式的单条航班链，再连续筛选组成航班链数据集，具体包括：

根据航班延误链式波及模型确定出多级航班链；

以航空器的唯一标识为关键主键，筛选满足多级航班条件的航班；

按照时序特性进行分组排序，选择二十四小时内满足构成航班链条件的航班，按时间进行逐级融合，融合后组成三元组形式的单条航班链；

经过连续的筛选组成航班链数据集。

进一步地，对所述航班链数据集的特征信息进行编码，其中，离散型特征数据进行Catboost编码，数值型特征数据进行Min-Max归一化编码，具体包括：

所述Min-Max编码公式为：

其中，

为某一特征属性下的一个原始值，

表示该特征属性下的最小值，

表示该特征属性下的最大值，

表示对该原始值归一化后的结果；

所述离散型特征数据的数据集

包含

个特征属性，

条数据集，标签值用

表示，则所述CatBoost编码详细过程如下：

随机打乱数据集

，得到打乱后的数据集为

。

计算先验概率

，公式如下：

其中，

表示的是每条数据的标签值，

表示分类的标签值，

表示标签值的个数，

表示标签值为

的个数，先验概率表示为标签值类别出现的概率；

用所述Catboost编码的第

条数据的第

个特征值进行编码的公式为：

其中，

为权重系数，

为先验概率。

进一步地，所述Web服务作为业务层来完成数据预处理和后处理任务，采用Tornado架构，支持异步非阻塞方式，同时处理多个用户请求，并将请求发送给TensorFlowServing，负责执行所有的数据预处理和后处理任务；

利用Docker将Serving服务和Web服务的服务环境与安装依赖项整体打包封装，以实现平台的快速部署与后续版本迭代服务管理。

根据本发明第二方面，本发明请求保护一种基于航班延误波及预测的交互系统，其特征在于，包括：

访问层、接入层、业务层和算法层；

所述访问层为用户的客户端，用于发起数据模型预测请求，并接收反馈预测结果；

所述接入层为平台端口的设置，采用Docker将Serving服务和Web服务的服务环境与安装依赖项整体打包封装，利用Docker接口与访问层进行数据传输，Docker容器内部采用gRPC进行通信；

所述业务层用于完成数据接入、数据预处理、延误预测、数据后处理和数据输出；

所述算法层是将已经训练好的航班延误波及网络模型导出，并在TensorflowServing中进行挂载，利用gRPC接口与业务层进行通信。

进一步，所述航班延误波及网络模型的训练过程包括：

进一步，所述将历史航班数据的航班运行信息进行清洗、处理和特征提取，获取待处理航班运行信息，具体包括：

剔除取消航班或航班号错误的数据；

利用插值法对缺失值进行填充；

保留航班信息中空间和时间信息丰富的特征属性；

所述基于所述待处理航班运行信息中的实际起飞时间和实际到达时间，计算航班的起飞延误时间并划分延误等级，具体包括：

所述起飞延误时间计算公式为：

其中，

表示某一历史航班，

表示航班实际的到达时间，

表示航班实际的起飞时间；

根据航班延误链式波及模型确定出多级航班链；

经过连续的筛选组成航班链数据集。

所述Min-Max编码公式为：

其中，

为某一特征属性下的一个原始值，

表示该特征属性下的最小值，

表示该特征属性下的最大值，

表示对该原始值归一化后的结果；

所述离散型特征数据的数据集

包含

个特征属性，

条数据集，标签值用

表示，则所述CatBoost编码详细过程如下：

随机打乱数据集

，得到打乱后的数据集为

。

计算先验概率

，公式如下：

其中，

表示的是每条数据的标签值，

表示分类的标签值，

表示标签值的个数，

表示标签值为

的个数，先验概率

表示为标签值类别出现的概率；

用所述Catboost编码的第

条数据的第

个特征值进行编码的公式为：

其中，

为权重系数，

为先验概率。

进一步地，采用Web服务作为业务层来完成数据预处理和后处理任务，采用Tornado架构，支持异步非阻塞方式，同时处理多个用户请求，并将请求发送给TensorFlowServing，负责执行所有的数据预处理和后处理任务；

相对于现有技术，本发明所述的一种基于航班延误波及预测的交互方法与系统具有以下有益效果：

（1）将历史航班数据的航班运行信息进行清洗、处理和打标签操作；再以航空器的唯一标识为关键主键，筛选出满足三级航班链条件的航班，融合组成三元组形式的航班链数据集；再对离散型和连续型的数据分别采用Catboost和Min-Max编码，得到编码后的数据送入改进后的Transformer网络模型进行训练；将待预测的航班信息输入到训练好的航班延误波及预测模型进行预测，将该模型导出并挂载到TensorFlow Serving端，利用Docker将Serving服务和Web服务的服务环境和安装依赖项打包封装，客户通过API接口得到最终的预测结果。本发明对航班延误波及预测具有很好的预测性能，准确率高达90.3%，模式的宏平均精确率达到了85.5%、宏平均召回率达到了93.3%、宏平均F1达到了89.7%；模型操作简单，易训练；易于部署。

（2）本发明所述的一种基于航班延误波及预测的交互方法与系统考虑到多个变量之间的关系，采用编码器的结构，并对Transformer网络模型进行优化，重构该网络的输入、输出模式，在该模型中注入卷积-池化操作块以提取航班链数据的空间信息，使其具有更好的泛化性和扩展性。

（3）本发明所述的一种基于航班延误波及预测的交互方法与系统，构造具有时序特性的三元组形式的航班链数据集，该方法整合每个航班数据的重要性，同时避免在建模和训练过程中丢失一些关键特征的情况，可以更轻松地提取和处理时间相关特征，使模型更加准确地预测航班链的整体延误等级。

（4）本发明所述的一种基于航班延误波及预测的交互方法与系统，对数据预处理提供一套可行的步骤，通过数据清洗，打标签，数据链构造以及数据编码等一系列手段，使得模型的训练更简单以及预测准确性更高。

（5）本发明所述的一种基于航班延误波及预测的交互方法与系统，利用主流的Docker + Serving + Web服务的架构设计，可以实现跨底层系统的调用，能从速度、精确度、轻量化等不同指标提供不同的模式选择，还能提供Python、Java、C++等多种语言调用的接口。

附图说明

构成本发明的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明所涉及的一种基于航班延误波及预测的交互系统的结构示意图；

图2为本文所述的Docker服务架构示意图；

图3为本发明实施例所述的航班延误链式波及模型示意图；

图4为本发明实施例所述的航班信息特征表达图；

图5为本发明实施例所述的航班数据三元组构造示意图；

图6为本发明实施例所述的三元组航班链数据集示意图；

图7为本文所述的多头注意力机制示意图；

图8为本文所述的Scaled Dot-Product Attention机制示意图；

图9为本发明实施例提供改进后的算法流程图；

图10为本文所述的航班延误波及预测方法流程示意图；

图11为本文所述的航班延误通用预测平台数据流程图；

图12为本文所述的TensorFlow Serving服务架构示意图；

图13为本文所述的Web服务架构示意图；

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于此描述的其他方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似改进，因此本发明不受下面公开的具体实施的限制。

参照附图1，根据本发明第一实施例，本发明请求保护一种基于航班延误波及预测的交互系统，其特征在于，包括：

访问层、接入层、业务层和算法层；

其中，在该实施例中，采用Docker + Serving + Web服务的架构模式能够实现跨底层系统的调用，能从速度、精确度、轻量化等不同指标提供不同的模式选择，还能提供Python、Java、C++等多种语言调用的接口。

模型基于Tensorflow进行训练完成后，使用SavedModel（pd文件）这一格式用于模型部署，其不仅包含参数的权值，还包含计算图。

模型保存好后，就到了Serving端的加载和预测。TensorFlow Serving是一个用于部署机器学习模型的高性能开源系统，它支持多种模型格式，并能够在大规模生产环境中提供稳定和高效的服务。Serving把模型挂在服务器后台，等待接收Web发送的请求和数据，收到请求后利用数据进行计算，然后再将模型计算后的结果返回给Web端。

Web服务实现模型预测请求的接收和响应，以及提供多种语言接口的调用。

Web服务作为中间层来完成数据预处理和后处理任务。因此，采用Tornado这一高性能的架构，它支持异步非阻塞方式，能够同时处理多个用户请求，并将请求发送给TensorFlow Serving，同时承担所有的数据预处理和后处理任务。

Web框架负责解析用户请求的数据。一般情况下，模型计算图的输入数据都是张量，需要对数据进行预处理，但数据的预处理过程不会写入计算图，因此需要构建Web端进行处理数据，将请求数据转换为Serving模块所需的格式，然后将请求数据发送到Serving模块进行预测。Serving模块完成预测后，将预测结果返回给Web服务模块，Web服务模块再将结果返回给用户。

利用Docker这一轻量级的虚拟技术，将Serving服务和Web服务的服务环境和安装依赖项打包封装，从而实现平台的快速部署与后续版本迭代服务管理。

如图2所示，Docker模型最主要部分就是镜像（Image）、容器（Container）、以及仓库（Registry），它提供了一个完成的生态系统，可以实现服务环境的封装和部署、应用程序的打包、运行和管理。

服务环境封装流程：

1.决定需要部署的环境和依赖库

在封装和部署应用程序时，需要决定所依赖的环境与版本等信息，包括操作系统环境、数据库、中间件、应用框架等，以及详细地记录这些依赖关系。

2.安装依赖

安装所需的依赖项和软件包的过程中，应该采用容器或虚拟环境的方式，例如Docker容器，以避免与其他应用环境发生冲突。

3.打包应用程序

打包应用程序和相关文件，例如静态文件、配置文件和支持文件等。

4.打包环境

将应用程序和其相应的环境归档打包，例如Docker镜像、虚拟机映像等，确保能在生产环境中轻松部署和启动应用程序。

服务环境部署流程：

1.编写Dockerfile

Dockerfile是一个文件，其中包含有关如何构建容器镜像的指令。这包括定义应用程序和依赖项的基础映像、添加所需的软件和库、设置容器的环境变量、开放端口等。

2.构建镜像

执行Dockerfile指令，使用Docker命令来创建和构建容器镜像。在构建构成中，Docker会自动下载和安装所需的依赖项、配置环境和添加指定的应用程序。

3.导出分发镜像

导出构建完成的容器镜像并分享给其他用户。这通常包括上传到Docker Hub或其他容器镜像库，以便在需要时轻松地拉取和部署。

4.部署容器

在目标计算平台上安装和配置Docker环境，然后使用Docker命令启动新容器。在部署时，可能需要配置容器的网络、卷挂载等功能，以适应应用程序的需求。

5.启动服务

启动应用程序前，需要在生产环境中检查配置相应的参数和环境变量，并且需要为应用程序设置合适的端口号，以确保能够响应用户请求。

6.进行部署测试和验证

进行一系列测试和验证，例如单元测试、数据测试、负载测试、网络测试等等，以确保应用程序能够在生产环境中稳定运行。

进一步，所述航班延误波及网络模型的训练过程包括：

剔除取消航班或航班号错误的数据；

利用插值法对缺失值进行填充；

保留航班信息中空间和时间信息丰富的特征属性；

其中，在该实施例中，对缺失值的处理是根据所在特征的重要程度以及缺失值的分布情况，在缺失值少且重要程度低的情况下，直接采用了均值或中位数进行填充，其效果较全局常量填充理想；在缺失率较高的情况下，例如改行航班和取消航班这两个特征属性的缺失率为98.2%，考虑到这两个特征对延误预测影响不大，所以将其直接进行了过滤处理。

所述起飞延误时间计算公式为：

其中，

表示某一历史航班，

表示航班实际的到达时间，

表示航班实际的起飞时间；

其中，在该实施例中，利用航班运行信息数据中实际起飞时间与实际到达时间这两个特征属性，计算出每条航班的起飞延误时间，再根据民航业的延误时间要求，利用Softmax分类器为每个航班分配一个延误等级标签。

如表1所示，延误等级标签是依据《民航正常管理规定》划分的，根据不同的阈值将航班延误等级细分为五类，分别是0（不延误）、1（轻度延误）、2（中度延误）、3（高度延误）以及4（重度延误）。

表1 航班延误等级划分

根据航班延误链式波及模型确定出多级航班链；

经过连续的筛选组成航班链数据集。

其中，在该实施例中，航空器的唯一标识为航班号，航班延误链式波及模型是依据航班延误波及理论构建的，即当前序的某个航班出现延误时，由于自身的延误可能导致无法继续执飞后续航班，以及可能会导致机组资源的拥堵，从而可能会波及影响到其后续的航班甚至是其他航班，导致更大范围的航班延误。

如图3所示，定义同一架航空器在一定时间范围（24h）内需要执行三个飞行任务，这三个任务之间存在依赖关系。第一次起飞的机场为一级机场，航空器从一级机场起飞执行航班任务1到达的机场称为二级机场，也称为一级到达机场或二级起飞机场，以此类推，后续机场依次命名。如果任务1因为某种原因延误了，那么就会影响到任务2和任务3的出发时间，从而导致这两个任务也延误了。因此，任务2和任务3的出发时间取决于前面任务的到达时间。这就是航班延误链式波及模型。

构造清晰的航班链式数据是一项复杂的数据特征工程，根据航班延误的链式波及特性，利用每一级航班链的时序特性，对预处理后的数据进行逐级融合，得到最终的航班链数据集。

如图4所示，从原始数据集中抽取有关航班延误和波及关系的特征属性，例如预计起飞时间、航班号、机场代码、预计起飞机场、飞行高度等等，将航班状态以规范的形式进行表达。

如图5所示，对于每个航班链数据，都可以将其表示为一个三元组形式。例如

，这表示航班链数据集中的第i条航班链数据，它在航班网络中连续执行三次飞行任务的三条单航班信息，其中

表示一级航班的飞行数据，包含一级航班的所有特征属性和波及关系，同理，

表示二级航班的航班数据，

表示三级航班的航班数据，三级航班数据的航班信息以序列形式排列组成三元组，共同构成一条链式波及航班链式数据集，顺序表示航班的链式波及关系。

如图6所示，航班链的波及数据通过

三元组形式表现，其对应的延误状态信息，通过标签来计算，并以三元组的形式与数据三元组成对匹配，标签三元组的表现形式如

，

表示第一级航班数据的延误状态，

表示第二级航班数据的延误状态，

表示第三级航班数据的延误状态，三级航班链的延误状态信息也以序列形式排列，与对应的数据三元组相匹配。

以三元组的形式将航班数据进行了重构，航班链数据的三元组构造以创新性的方式，更好地表达航班链数据特征。这种方法将三条航班数据组合在一起，每个三元组的前两个元素都包含了前序航班的航班状态信息，第三个元素是当前航班的相关特征数据。该方法能够整合每个航班数据的重要特征，同时避免了在建模和训练过程中丢失一些关键特征的情况。可以更轻松地提取和处理时间相关特征，使模型更加准确地预测航班链的整体延误等级。数据集的结构也更加清晰和易于处理。航班链中每条航班的延误等级都会对整个航班链的延误状态产生影响，因此使用航班链三元组进行预测可更全面地考虑整个航班链的历史数据和信息。同时可以按照元组的维度数调整航班链的长度，可以使模型自适应处理不同长度的航班链数据，提升了模型复用效率。

所述Min-Max编码公式为：

其中，

为某一特征属性下的一个原始值，

表示该特征属性下的最小值，

表示该特征属性下的最大值，

表示对该原始值归一化后的结果；

所述离散型特征数据的数据集

包含

个特征属性，

条数据集，标签值用

表示，则所述CatBoost编码详细过程如下：

随机打乱数据集

，得到打乱后的数据集为

。

计算先验概率

，公式如下：

其中，

表示的是每条数据的标签值，

表示分类的标签值，

表示标签值的个数，

表示标签值为

的个数，先验概率

表示为标签值类别出现的概率；

用所述Catboost编码的第

条数据的第

个特征值进行编码的公式为：

其中，

为权重系数，

为先验概率。

其中，在该实施例中，航班延误波及预测任务需要考虑多个变量之间的关系，例如航班之间的先后顺序、前序航班的延误状态等，这些变量之间的复杂关系可以通过transformer网络模型的自注意力机制来建模。

Transformer是由多个编码器结构块（Encoder）和解码器结构块（Decoder）组成，本文的波及预测模型主要就是利用Encoder结构块，每个Encoder结构块包含了多个子层，每个子层都包含一个多头自注意力层和一个前馈网络层。

如图7所示，多头自注意力机制的计算过程如下：

首先，通过三个线性变换得到每个输入元素的Query、Key和Value向量。这三个向量的计算公式如下：

其中，

，

，

都是

的矩阵，

是输入序列

中的元素，且是一个

维的向量。

然后，通过计算Query向量和所有Key向量的相似度得到权重。这里采用的是Scaled Dot-Product Attention机制，公式为：

其中，

表示Query向量和Key向量之间的内积，

表示Value向量，

是一个缩放因子，目的是避免内积过大或过小，影响梯度下降的稳定性。Softmax函数对每个Key向量计算一个权重，然后将这些权重与对应的Value向量相乘，并将结果进行求和得到最终的输出向量。

最后，将

个输出向量拼接后得到输出矩阵

：

，因此，Transformer的多头注意力机制将输入的Q、K、V特征矩阵序列通过三个线性变换得到三个不同的查询、键和值，然后将这些查询、键和值分别输入到Scaled Dot-Product Attention中进行计算，其针对输入元素与其他元素之间的相似度，并按照这些相似度进行加权求和，得到该元素经过注意力计算后的输出向量。通过这样的方式，Transformer能同时关注多个方面的输入信息，从而更好地表示输入序列中的信息。其中，Scaled Dot-ProductAttention机制示意图如图8所示。

如图9所示，在上述transformer基础上，我们采用了编码器的结构，重构了网络的输入、输出模式，在模型中注入了卷积-池化操作块以提取航班链数据的空间信息，优化了网络模型，使其具有更好的泛化性和扩展性。

如图10所示，基于Transformer航班延误波及预测模型的训练包括前向传播和反向传播。

前向传播过程则是利用编码后的训练集航班链数据输入到航班延误波及网络模型中，经过位置编码、多层自注意力机制、前馈神经网络和层归一化等步骤，最终得到网络的输出结果。而位置编码公式为：

其中，

表示元素在输入序列的位置，

表示嵌入向量中的维度，

表示嵌入向量的维度。

层归一化公式为：

其中，

表示输入向量，

表示自注意力机制，

表示前馈神经网络。

反向传播过程则是利用验证集数据的预测值计算损失函数，判断网络模型是否收敛，如不收敛，则进行误差参数的求导，更新网络参数，以得到最小化误差，使网络能够对输入序列进行正确的预测，继而得到训练好的波及预测模型。假设网络的输出向量序列为y₁,y₂, … , y_m，真实输出序列为t₁, t₂, …, t_m，则损失函数的公式可以表示为：

其中，

表示第

个输出元素的损失函数，

表示输出序列中的第

个元素，

表示真实输出序列中的第

个元素。

具体来说，使用自动微分（automatic differentiation）的方式计算误差对每个参数的导数，从而得到参数的梯度

。再使用优化算法来更新网络参数，使其误差最小化。参数更新的公式为：

其中，

表示网络参数，

表示学习率，

表示参数的梯度。

在上述基础之上，我们设置了训练参数，即采用Cross entropy loss function，初始学习率设置为0.001，使用Adam优化器进行梯度更新，为了避免过拟合，在模型中添加了0.2 的dropout。经过100轮的前向传播和反向传播训练航班延误波及网络模型，不断优化参数，得到具有最优超参数的网络模型。

具体的，将划分出的测试集航班链数据输入到训练好的航班延误波及预测模型中，得到最终的输出结果，通过模型的性能指标，例如准确率、召回率、F1值等，查看结果是否满足预期的要求，若不满足，则重新进行网络模型的训练。

各个性能指标能从不同角度表征不同尺度的模型性能，可以通过表2混淆矩阵来理解它们。

表2 混淆矩阵

准确率（Accuracy）指的是分类正确的样本数量占样本总数的比例，反映的是模型算法整体性能。但是在正负样本数量不平衡的情况下，准确率不是能很好的评价模型的性能，计算公式如下：

精确率（Precision）是指所有预测为正类的结果中，真正的正类的比例，计算公式如下：

召回率（Recall）是正确预测的正样本数占真实正样本总数的比值，计算公式如下：

F1值（F1 Score）是综合考虑的结果，是精确率和召回率的调和平均值。

如图11所示，该平台各个端口的接口扮演着至关重要的角色，用于数据传输、算法调用、结果输出等各种功能，可以将平台划分为Serving端、Web端和Docker端三个模块，每个端口都有对应的接口，以实现多类算法服务需求调用。Serving算法端服务与Web服务端利用的gRPC协议通信，封装整个平台运行环境的Docker服务与客户端是通过HTTP协议通信。航班延误通用预测平台内部接口定义如表3所示。

表3 平台内部接口设计

模型保存好，就到了Serving端的加载和预测。如图12所示，TensorFlow Serving是一个用于部署机器学习模型的开源系统，其核心是基于gRPC协议的高性能服务器，支持多种模型格式，并能够在大规模生产环境中提供稳定和高效的服务。Serving把模型挂在服务器后台，等待接收Web发送的请求和数据，收到请求后利用数据进行计算，然后再将模型计算后的结果返回给Web端。

Web服务作为中间层来完成数据预处理和后处理任务。因此，采用了Tornado这一高性能的架构，它支持异步非阻塞方式，能够同时处理多个用户请求，并将请求发送给TensorFlow Serving，同时承担所有的数据预处理和后处理任务。

如图13所示，Web服务器则负责接收和处理Web请求，并将请求转发给相应的Web框架进行处理。Web框架负责解析用户请求的数据。一般情况下，模型计算图的输入数据都是张量，需要对数据进行预处理，但数据的预处理过程不会写入计算图，因此需要构建Web端进行处理数据，将请求数据转换为Serving模块所需的格式，然后将请求数据发送到Serving模块进行预测。Serving模块完成预测后，将预测结果返回给Web服务模块，Web服务模块再将结果返回给用户。

本领域技术人员能够理解，本公开所披露的内容可以出现多种变型和改进。例如，以上所描述的各种设备或组件可以通过硬件实现，也可以通过软件、固件、或者三者中的一些或全部的组合实现。

本公开中使用了流程图用来说明根据本公开的实施例的方法的步骤。应当理解的是，前面或后面的步骤不一定按照顺序来精确的进行。相反，可以按照倒序或同时处理各种步骤。同时，也可以将其他操作添加到这些过程中。

本领域普通技术人员可以理解上述方法中的全部或部分的步骤可通过计算机程序来指令相关硬件完成，程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本公开并不限制于任何特定形式的硬件和软件的结合。

除非另有定义，这里使用的所有术语具有与本公开所属领域的普通技术人员共同理解的相同含义。还应当理解，诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义，而不应用理想化或极度形式化的意义来解释，除非这里明确地这样定义。

以上是对本公开的说明，而不应被认为是对其的限制。尽管描述了本公开的若干示例性实施例，但本领域技术人员将容易地理解，在不背离本公开的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此，所有这些修改都意图包含在权利要求书所限定的本公开范围内。应当理解，上面是对本公开的说明，而不应被认为是限于所公开的特定实施例，并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本公开由权利要求书及其等效物限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。