CN116258352A

CN116258352A - 一种航班保障任务的调度方法、装置及电子设备

Info

Publication number: CN116258352A
Application number: CN202310538885.XA
Authority: CN
Inventors: 王瑞锦; 张扬; 朱俊虎; 张凤荔; 倪佳; 赵银川; 陈政; 方锐; 李颖; 付俊超; 裴锡凯
Original assignee: Minhang Chengdu Information Technology Co ltd; University of Electronic Science and Technology of China
Current assignee: Minhang Chengdu Information Technology Co ltd; University of Electronic Science and Technology of China; Second Research Institute of CAAC
Priority date: 2023-05-15
Filing date: 2023-05-15
Publication date: 2023-06-13
Anticipated expiration: 2043-05-15
Also published as: CN116258352B

Abstract

本申请提供了一种航班保障任务的调度方法、装置及电子设备，航班保障任务的调度方法包括：获取目标航班保障任务组对应的各个航班保障代理机构的状态信息；将状态信息输入到训练好的调度策略选择模型中，确定目标航班保障任务组对应的目标航班保障节点顺序以及每个目标航班保障节点对应的目标调度策略，目标调度策略包括最早航班保障代理机构优先调度策略、最紧迫航班优先调度策略以及最短工时航班保障节点优先调度策略；基于每个目标航班保障节点的目标调度策略，确定目标航班保障任务组对应的组合目标调度策略，以便完成对目标航班保障任务组的调度。本申请实现了对各大航班的目标航班保障任务组的动态灵活调度，进而提升了机场的运行效率。

Description

一种航班保障任务的调度方法、装置及电子设备

技术领域

本申请涉及航班保障作业技术领域，尤其是涉及一种航班保障任务的调度方法、装置及电子设备。

背景技术

随着民航业的高速发展，旅客量和货运量均呈现快速增加的趋势，给民航业带来巨大发展空间的同时，也对民航的业务能效提出了更高的要求。目前各大民航机场的会通过航班保障任务的调度来实现对民航机场的运行管理。

然而，传统的航班保障任务的调度方式不能适应于不同的机场航班保障运行环境，且对于一系列的航班保障任务组，传统的航班保障任务调度会采用单一的调度方式进行航班调度，但是，这样的航班保障能力却未能尽如人意，会导致对于各大航班的航班保障任务组的调度不够灵活，进而可能会降低机场的运行效率。

发明内容

有鉴于此，本申请的目的在于提供一种航班保障任务的调度方法装置及电子设备，实现了对各大航班的目标航班保障任务组的动态灵活调度，进而提升了机场的运行效率。

本申请实施例提供了一种航班保障任务的调度方法，所述航班保障任务的调度方法包括：

获取目标航班保障任务组对应的各个航班保障代理机构的状态信息，其中，所述状态信息用于表征各个所述航班保障代理机构的调度效率信息；

将所述状态信息输入到训练好的调度策略选择模型中，确定所述目标航班保障任务组对应的目标航班保障节点顺序以及每个所述目标航班保障节点对应的目标调度策略，其中，所述目标调度策略包括最早航班保障代理机构优先调度策略、最紧迫航班优先调度策略以及最短工时航班保障节点优先调度策略；

基于每个所述目标航班保障节点的各个目标调度策略，确定所述目标航班保障任务组对应的组合调度策略，以便完成对所述目标航班保障任务组的调度。

进一步的，所述状态信息包括各个航班保障代理机构的利用率、各个航班保障代理机构的负载率以及各个航班保障代理机构的作业率，通过以下方式获取目标航班保障任务组对应的各个航班保障代理机构的状态信息：

根据目标航班保障任务组对应的航班保障代理机构的数量，确定各个航班保障代理机构的利用率；

根据各个航班保障代理机构对目标航班保障任务组中各个目标航班保障任务的调度进程，确定各个航班保障代理机构的负载率；

根据各个航班保障代理机构对目标航班保障任务组中各个目标航班保障任务的完成数量，确定各个航班保障代理机构的作业率。

进一步的，通过以下方式确定训练好的调度策略选择模型：

获取样本航班保障任务组对应的各个航班保障代理机构的初始样本状态信息；

将所述初始样本状态信息输入初始调度策略选择模型中，确定各个样本航班保障节点对应的预测调度策略；

根据所述预测调度策略和所述预测调度策略对应的预设动作价值函数，确定各个所述样本航班保障节点对应的奖励调整值；

根据所述奖励调整值，确定中间样本状态信息；

将所述中间样本状态信息输入初始调度策略选择模型进行强化学习，直至确定样本航班保障任务组中的全部样本航班保障节点的奖励调整值，确定训练好的调度策略选择模型。

进一步的，所述将所述初始样本状态信息输入初始调度策略选择模型中，确定各个样本航班保障节点对应的预测调度策略，包括：

将所述初始样本状态信息输入初始调度策略选择模型中，分别确定各个样本航班保障节点对应的最早航班保障代理机构优先调度策略分数、最紧迫航班优先调度策略分数以及最短工时航班保障节点优先调度策略分数；

基于所述最早航班保障代理机构优先调度策略分数、所述最紧迫航班优先调度策略分数以及所述最短工时航班保障节点优先调度策略分数，确定各个样本航班保障节点对应的预测调度策略。

进一步的，所述预设动作价值函数包括第一预设动作价值函数，所述第一预设动作价值函数的公式为：

；

其中，

用于表征样本航班保障任务的数量，/>

用于表征第/>

个样本航班保障任务，

用于表征第/>

个样本航班保障任务的起飞时间，/>

用于表征第/>

个样本航班保障任务的实际调度完工时间。

进一步的，所述预设动作价值函数包括第二预设动作价值函数，所述第二预设动作价值函数的公式为：

；

其中，

用于表征第n个样本航班保障节点的调度完成时间；n用于表征样本航班保障节点的数量，1<j<n,且j为正整数。

本申请实施例还提供了一种航班保障任务的调度装置，所述航班保障任务的调度装置包括：

获取模块，用于获取目标航班保障任务组对应的各个航班保障代理机构的状态信息，其中，所述状态信息用于表征各个所述航班保障代理机构的调度效率信息；

第一确定模块，用于将所述状态信息输入到训练好的调度策略选择模型中，确定所述目标航班保障任务组对应的目标航班保障节点顺序以及每个所述目标航班保障节点对应的目标调度策略，其中，所述目标调度策略包括最早航班保障代理机构优先调度策略、最紧迫航班优先调度策略以及最短工时航班保障节点优先调度策略；

第二确定模块，用于基于每个所述目标航班保障节点的各个目标调度策略，确定所述目标航班保障任务组对应的组合调度策略，以便完成对所述目标航班保障任务组的调度。

进一步的，所述获取模块中的所述状态信息包括各个航班保障代理机构的利用率、各个航班保障代理机构的负载率以及各个航班保障代理机构的作业率，通过以下方式获取目标航班保障任务组对应的各个航班保障代理机构的状态信息：

本申请实施例还提供一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如上述的航班保障任务的调度方法的步骤。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如上述的航班保障任务的调度方法的步骤。

本申请实施例提供的航班保障任务的调度方法、装置及电子设备，与现有技术中的航班保障任务调度方法相比，本申请提供的实施例通过将获取到的目标航班保障任务组对应的各个航班保障代理机构的状态信息输入到训练好的调度策略选择模型中，确定目标航班保障任务组对应的目标航班保障节点顺序以及每个目标航班保障节点对应的目标调度策略，并基于每个目标航班保障节点的目标调度策略，确定目标航班保障任务组对应的组合目标调度策略，以便完成对目标航班保障任务组的调度，通过训练好的调度策略选择模型，确定目标航班保障任务组对应的组合目标调度策略，本申请的有益效果为实现了对各大航班的目标航班保障任务组的动态灵活调度，进而提升了机场的运行效率。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的一种航班保障任务的调度方法的流程图之一；

图2示出了本申请实施例所提供的一种航班保障任务的调度方法的流程图之二；

图3示出了本申请实施例所提供的一种航班保障任务的调度装置的结构框图；

图4示出了本申请实施例所提供的一种电子设备的结构示意图。

图中：

300-航班保障任务的调度装置；310-获取模块；320-第一确定模块；330-第二确定模块；400-电子设备；410-处理器；420-存储器；430-总线。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例，都属于本申请保护的范围。

首先，对本申请可适用的应用场景进行介绍。本申请可应用于航班保障作业技术领域。

经研究发现，传统的航班保障任务的调度方式不能适应于不同的机场航班保障运行环境，且对于一系列的航班保障任务组，传统的航班保障任务调度会采用单一的调度方式进行航班调度，但是，这样的航班保障能力却未能尽如人意，会导致对于各大航班的航班保障任务组的调度不够灵活，进而可能降低机场的运行效率。

传统的航班保障任务调度方法不能充分地利用各个航班保障代理机构的相关状态信息，且传统的航班保障任务调度算法无法同时兼顾算法结果本身的效果以及算法运行过程所需要的时间长短，导致传统的航班保障任务调度方法的航班调度时间较长。在机场的运行管理过程中，相比于机场的其他调度问题，航班保障任务的调度问题更加复杂。

基于此，本申请实施例提供了一种航班保障任务的调度方法、装置及电子设备，实现了对各大航班的目标航班保障任务组的动态灵活调度，进而提升了机场的运行效率。

请参阅图1，图1为本申请实施例所提供的一种航班保障任务的调度方法的流程图之一。所如图1中所示，本申请实施例提供的航班保障任务的调度方法，包括以下步骤：

S101、获取目标航班保障任务组对应的各个航班保障代理机构的状态信息，其中，所述状态信息用于表征各个所述航班保障代理机构的调度效率信息。

该步骤中，在任一机场进行航班保障任务的调度和管理时，该机场可能需要进行航班保障任务调度的任务（即航班）数量可能不至有一个，此时，需要获取目标航班保障任务组中各个航班保障代理机构的状态信息。

这里，每个目标航班保障任务组中包括至少一个目标航班保障任务，且每个目标航班保障任务对应一个航班。

其中，航班保障是指飞机进场之后进行的一系列保障作业，包括上下轮挡、飞机加油、食品配送以及行李装配等保障任务节点，且当在保障任务节点调度完成后需要对航班保障任务的关键节点进行确认。

上述中，任一一个目标航班保障任务组均是一个对目标航班保障节点的循环调度过程，即一个目标航班保障任务组的完整调度是由至少一种目标调度策略对应的至少一个调度过程实现的，且不同的目标调度策略对应着不同的调度过程。

可选的，所述状态信息包括各个航班保障代理机构的利用率、各个航班保障代理机构的负载率以及各个航班保障代理机构的作业率，通过以下子步骤获取目标航班保障任务组对应的各个航班保障代理机构的状态信息：

子步骤1011、根据目标航班保障任务组对应的航班保障代理机构的数量，确定各个航班保障代理机构的利用率。

该步骤中，本申请提供的实施例中确定各个航班保障代理机构的利用率的公式具体为：

；

这里，

用于表征各个航班保障代理机构的利用率，/>

用于表征目标航班保障任务组对应的航班保障代理机构的数量，/>

用于表征目标航班保障任务组在当前t时刻下正在使用的航班保障代理机构的数量。

子步骤1012、根据各个航班保障代理机构对目标航班保障任务组中各个目标航班保障任务的调度进程，确定各个航班保障代理机构的负载率。

该步骤中，本申请提供的实施例中确定各个航班保障代理机构的负载率的公式具体为：

；

这里，

用于表征各个航班保障代理机构的负载率。

子步骤1013、根据各个航班保障代理机构对目标航班保障任务组中各个目标航班保障任务的完成数量，确定各个航班保障代理机构的作业率。

该步骤中，本申请提供的实施例中确定各个航班保障代理机构的作业率的公式具体为：

；

这里，

用于表征各个航班保障代理机构的作业率，k用于表征目标航班保障任务组中目标航班保障任务的总数量，/>

用于表征在t时刻下，各个航班保障代理机构对目标航班保障任务组中各个目标航班保障任务的完成数量。

S102、将所述状态信息输入到训练好的调度策略选择模型中，确定所述目标航班保障任务组对应的目标航班保障节点顺序以及每个所述目标航班保障节点对应的目标调度策略，其中，所述目标调度策略包括最早航班保障代理机构优先调度策略、最紧迫航班优先调度策略以及最短工时航班保障节点优先调度策略。

该步骤中，在确定了目标航班保障任务组对应的各个航班保障代理机构的状态信息后，将该状态信息输入到训练好的调度策略选择模型，确定目标航班保障任务组对应的目标航班保障节点顺序以及每个所述目标航班保障节点对应的目标调度策略，其中，每个目标航班保障节点对应的目标调度策略可以具体但不限制为：该目标航班保障节点对应的航班保障代理机构，以及该目标航班保障节点在上述航班保障代理机构中的调度序列。

这里，目标航班保障任务组对应的目标航班保障节点顺序可以具体为k= k11+k31+k32+k22…k34；

其中，K用于表征目标航班保障任务的总数量，

表示第i个目标航班保障任务第j个目标航班保障节点，每个目标航班保障任务的目标航班保障节点数量不定，且有些目标航班保障任务的目标航班保障节点数量可能会小于各个航班保障代理机构的数量，且各个航班保障代理机构都可以进行目标航班保障任务组中全部目标航班保障任务的调度。

其中，目标调度策略包括最早航班保障代理机构优先调度策略、最紧迫航班优先调度策略以及最短工时航班保障节点优先调度策略，每个目标调度策略对应有约束条件。

且上述中，对于各个航班保障代理机构的调度约束条件如下；

（1）目标航班保障任务的调度必须按照每个航班保障节点顺序进行调度，如第i个目标航班保障任务的节点顺序为

，则对于该航班的航班保障代理机构只能按照/>

这样的顺序来调度目标航班保障任务，即使是不同的航班保障代理机构调度该目标航班保障任务也需要按照该节点顺序。

（2）目标航班保障任务之间相互独立。

（3）同一个航班保障代理机构在某一段时间只能调度一个目标航班保障任务组中的一个目标航班保障节点，不能同时并行保障多个目标航班保障节点，多个航班保障代理机构也不能同时保障某一个目标航班保障任务中的同一个目标航班保障节点。

（4）一个目标航班保障节点可以由航班保障代理机构调度，所有的目标航班保障节点的可被调度的航班保障代理机构的数量不相同。

（5）本申请提供的实施例以一个目标航班保障任务组的调度过程为一个单位，当够目标航班保障任务组中的所有目标航班保障任务调度完成后，结束对该目标航班保障任务组的调度工作。

这里，最早航班保障代理机构优先调度策略具体为：获取目标航班保障任务组对应的各个航班保障代理机构的状态信息，确定当前时刻t下的剩余保障期望时间最短的目标航班节点进行调度（这里的剩余保障期望时间需要加上该目标航班的到达时间），其中，剩余保障期望时间用于表征各个航班保障代理机构等待目标航班到达并开始调度该目标航班的时间，如果同时存在多个最短剩余保障期望时间对应的目标航班，将上述目标航班确定为候选目标航班，计算上述候选目标航班当前航班保障节点与下一个目标航班保障节点之间的平均保障时间，并将平均保障时间最短的对应的候选目标航班的当前航班保障节点确定为当前目标航班保障节点。

然后，确定最早空闲的航班保障代理机构（从早空闲的航班保障代理机构列表中确定），若同时存在多个最早空闲的航班保障代理机构，则确定上述航班保障代理机构对当前目标航班下一目标航班保障节点的保障时间，并将上述保障时间最短的所对应的航班保障代理机构确定为当前时刻的对当前目标航班保障节点进行航班保障的目标航班保障代理机构。

本申请提供的实施例中的最早航班保障代理机构优先调度策略可以优先安排特定的目标航班保障节点进行调度，然后再组合使用其他目标调度策略。

最紧迫航班优先调度策略具体为：（目标航班保障任务组为开始进行目标航班调度或目标航班保障任务组中已经结束调度的目标航班保障任务不存在紧迫系数）当目标航班保障任务组开始进行目标航班保障节点的调度后，将目标航班保障任务中紧迫系数最低的目标航班保障任务进行优先调度的策略，其中，紧迫系数列表为

，且紧迫系数的计算公式如下：

；

其中，

用于表征第i个目标航班保障任务的紧迫系数，/>

用于表征第i个目标航班的起飞时间，/>

为当前时间，/>

用于表征第i个航班的剩余航班保障节点的期望保障时间，且/>

<1，则表示目标航班保障任务落后于计划完成时间；若/>

<1，则表示目标航班保障任务正在按照计划进行调度；若CR>1，则表示目标航班保障任务完成情况超前于计划完成时间；若CR≤0，则表示该目标航班保障任已经延迟。

上述中，在每确定一个目标航班保障任务的最小紧迫系数后，都需要重新更新该目标航班保障任务的紧迫系数列表。

上述中，最短工时航班保障节点优先调度策略具体为：为最先到达的目标航班进行优先调度，当有多个优先到达的目标航班时，确定上述目标航班的剩余航班保障节点的期望保障时间，并将时间最短的时间确定为候选航班，若个存在多个候选航班，则对比上述候选航班的下一个航班保障节点的生产时间，并将所述生产时间最短的生产时间确定为目标航班。

这样，本申请提供的实施例中的目标航班保障节点的数量是根据目标航班保障任务组中的目标航班保障任务的数量确定的，这里，通过以下实施例确定目标航班保障节点的数量，假设本申请提供的实施例中的目标航班保障任务组中的目标航班保障任务有k个，且上述k个目标航班保障任务对应的目标航班序列为

，这k个目标航班保障任务中的每个目标航班保障任务中均有/>

个航班保障节点需要处理，且假设航班保障代理机构的数量为c个。

可选的，通过以下子步骤确定训练好的调度策略选择模型：

子步骤1021、获取样本航班保障任务组对应的各个航班保障代理机构的初始样本状态信息。

子步骤1022、将所述初始样本状态信息输入初始调度策略选择模型中，确定各个样本航班保障节点对应的预测调度策略。

该步骤中，将所述初始样本状态信息输入初始调度策略选择模型中，分别确定各个样本航班保障节点对应的最早航班保障代理机构优先调度策略分数、最紧迫航班优先调度策略分数以及最短工时航班保障节点优先调度策略分数，并基于所述最早航班保障代理机构优先调度策略分数、所述最紧迫航班优先调度策略分数以及所述最短工时航班保障节点优先调度策略分数，确定各个样本航班保障节点对应的预测调度策略。

该步骤中，将最早航班保障代理机构优先调度策略分数、最紧迫航班优先调度策略分数以及最短工时航班保障节点优先调度策略分数中最大的分数值所对应的目标调度策略确定为各个样本航班保障节点对应的预测调度策略。

子步骤1023、根据所述预测调度策略和所述预测调度策略对应的预设动作价值函数，确定各个所述样本航班保障节点对应的奖励调整值。

该步骤中，初始调度策略选择模型的本质为使神经网络模型拟合预设动作价值函数后形成的强化学习模型。

其中，初始调度策略选择模型根据输入的初始样本状态信息和预设动作价值函数确定各个样本航班保障节点对应的奖励调整值，并根据不断调整的奖励调整值不断调整样本状态信息，最终确定训练好的调度策略选择模型。

这样，初始调度策略选择模型中下一个样本航班保障节点的状态信息是由当前样本航班保障节点的状态信息和当前样本航班保障节点状态信息经由该初始调度策略选择模型输出的初始调度策略决定的。

子步骤1024、根据所述奖励调整值，确定中间样本状态信息。

子步骤1025、将所述中间样本状态信息输入初始调度策略选择模型进行强化学习，直至确定样本航班保障任务组中的全部样本航班保障节点的奖励调整值，确定训练好的调度策略选择模型。

该步骤中，强化学习是一种不依靠范式，而是自主探索最佳模型的机器学习类型，它与其他机器学习方式最本质的区别在于：其处理的数据能够凭借一种标准打分，但是不知道模型在什么时候应该输出什么动作，因此只能靠算法不断地尝试能够让分支尽可能高的输出，因此可以将有限的策略作为强化学习的动作输出，通过组合使用多个策略，获取最佳结果。

这里，强化学习中均存在回报函数（动作价值函数）用于不断的迭代强化学习，且强化学习算法中常见的回报函数的表达式可以具体为：

；

其中，

用于表征某个时刻t的状态将具有的回报；γ用于表征折扣因子，且服从0≤γ≤1,用于计算某时刻的回报。

这里，将上述回报函数进行最优化求解得到的表达式具体为：

；

其中，

用于表征强化学习过程中不断变化的状态信息；/>

用于表征强化学习过程的动作，A用于表征当前状态信息能够做出的所有动作选择的集合，能够呈现不同的输出。

其中，本申请提供的实施例中的预设动作价值函数包括第一预设动作价值函数，所述第一预设动作价值函数的公式为：

；

其中，

用于表征样本航班保障任务的数量，/>

用于表征第/>

个样本航班保障任务，

用于表征第/>

个样本航班保障任务的起飞时间，/>

用于表征第/>

个样本航班保障任务的实际调度完工时间。

因此，本申请提供的实施例中的预设动作价值函数包括第二预设动作价值函数，所述第二预设动作价值函数的公式为：

；

其中，

这里，不同的预设动作价值函数用于满足对目标航班保障任务组不同的调度需求。

S103、基于每个所述目标航班保障节点的各个目标调度策略，确定所述目标航班保障任务组对应的组合调度策略，以便完成对所述目标航班保障任务组的调度。

该步骤中，每个目标航班保障节点都对应有一个目标调度策略，而目标航班保障任务组包括不同的目标航班保障任务以及若干个目标航班保障节点，因此，可以根据每个所述目标航班保障节点的目标调度策略和目标航班保障节点顺序，对目标航班保障任务组中的若干个目标航班保障任务组进行动态组合和选择，最终生成目标航班保障任务组对应的组合目标调度策略，并根据该组合目标调度策略对对应的目标航班保障任务组进行调度。

这里，本申请提供的实施例中的更够动态组合的组合目标调度策略相比于传统的对多个航班保障任务的单一的调度策略，更具灵活性，且本申请提供的实施例同时能够选择不同的航班保障代理机构进行调度，更贴近于真实的机场航班保障调度的实际环境，且提高了调度的效率，进而提升了机场的运行效率。

本申请实施例提供的航班保障任务的调度方法，与现有技术中的航班保障任务调度方法相比，本申请提供的实施例通过将获取到的目标航班保障任务组对应的各个航班保障代理机构的状态信息输入到训练好的调度策略选择模型中，确定目标航班保障任务组对应的目标航班保障节点顺序以及每个目标航班保障节点对应的目标调度策略，并基于每个目标航班保障节点的目标调度策略，确定目标航班保障任务组对应的组合目标调度策略，以便完成对目标航班保障任务组的调度，通过训练好的调度策略选择模型，确定目标航班保障任务组对应的组合目标调度策略，实现了对各大航班的目标航班保障任务组的动态灵活调度，进而提升了机场的运行效率。

请参阅图2，图2为本申请一实施例提供的一种航班保障任务的调度方法的流程图之二。如图2中所示，本申请实施例提供的航班保障任务的调度方法，包括以下步骤：

S201、获取目标航班保障任务组对应的各个航班保障代理机构的状态信息，其中，所述状态信息用于表征各个所述航班保障代理机构的调度效率信息。

S202、将所述状态信息输入到训练好的调度策略选择模型中，确定所述目标航班保障任务组对应的目标航班保障节点顺序以及每个所述目标航班保障节点对应的目标调度策略，其中，所述目标调度策略包括最早航班保障代理机构优先调度策略、最紧迫航班优先调度策略以及最短工时航班保障节点优先调度策略。

S203、根据每个所述目标航班保障节点的目标调度策略，确定所述目标航班保障任务组对应的组合目标调度策略。

该步骤中，每个目标航班保障节点都对应有一个目标调度策略，而目标航班保障任务组包括不同的目标航班保障任务以及若干个目标航班保障节点，因此，可以根据每个所述目标航班保障节点的目标调度策略和目标航班保障节点顺序，对目标航班保障任务组中的若干个目标航班保障任务组进行动态组合和选择，最终生成目标航班保障任务组对应的组合目标调度策略。

S204、根据所述组合目标调度策略，对所述目标航班保障任务组进行调度。

该步骤中，根据组合目标调度策略，对目标航班保障任务组按照目标航班保障节点顺序进行顺序的调度。

其中，S201至S202的描述可以参照S101至S102的描述，并且能达到相同的技术效果，对此不做赘述。

请参阅图3，图3为本申请实施例所提供的一种航班保障任务的调度装置的结构示意图。如图3中所示，所述航班保障任务的调度装置300包括：

获取模块310，用于获取目标航班保障任务组对应的各个航班保障代理机构的状态信息，其中，所述状态信息用于表征各个所述航班保障代理机构的调度效率信息。

可选的，所述获取模块310中的所述状态信息包括各个航班保障代理机构的利用率、各个航班保障代理机构的负载率以及各个航班保障代理机构的作业率，通过以下方式获取目标航班保障任务组对应的各个航班保障代理机构的状态信息：

根据目标航班保障任务组对应的航班保障代理机构的数量，确定各个航班保障代理机构的利用率。

根据各个航班保障代理机构对目标航班保障任务组中各个目标航班保障任务的调度进程，确定各个航班保障代理机构的负载率。

第一确定模块320，用于将所述状态信息输入到训练好的调度策略选择模型中，确定所述目标航班保障任务组对应的目标航班保障节点顺序以及每个所述目标航班保障节点对应的目标调度策略，其中，所述目标调度策略包括最早航班保障代理机构优先调度策略、最紧迫航班优先调度策略以及最短工时航班保障节点优先调度策略。

可选的，所述第一确定模块320中通过以下方式确定训练好的调度策略选择模型：

获取样本航班保障任务组对应的各个航班保障代理机构的初始样本状态信息。

将所述初始样本状态信息输入初始调度策略选择模型中，确定各个样本航班保障节点对应的预测调度策略。

根据所述预测调度策略和所述预测调度策略对应的预设动作价值函数，确定各个所述样本航班保障节点对应的奖励调整值。

根据所述奖励调整值，确定中间样本状态信息。

将所述中间样本状态信息输入初始调度策略选择模型进行强化学习。直至确定样本航班保障任务组中的全部样本航班保障节点的奖励调整值，确定训练好的调度策略选择模型。

可选的，所述将所述初始样本状态信息输入初始调度策略选择模型中，确定各个样本航班保障节点对应的预测调度策略，包括：

将所述初始样本状态信息输入初始调度策略选择模型中，分别确定各个样本航班保障节点对应的最早航班保障代理机构优先调度策略分数、最紧迫航班优先调度策略分数以及最短工时航班保障节点优先调度策略分数。

可选的，所述预设动作价值函数包括第一预设动作价值函数，所述第一预设动作价值函数的公式为：

；

其中，

用于表征样本航班保障任务的数量，/>

用于表征第/>

个样本航班保障任务，

用于表征第/>

个样本航班保障任务的起飞时间，/>

用于表征第/>

个样本航班保障任务的实际调度完工时间。

可选的，所述预设动作价值函数包括第二预设动作价值函数，所述第二预设动作价值函数的公式为：

；

其中，

第二确定模块330，用于基于每个所述目标航班保障节点的目标调度策略，确定所述目标航班保障任务组对应的组合目标调度策略，以便完成对所述目标航班保障任务组的调度。

本申请实施例提供的航班保障任务的调度装置300，与现有技术中的航班保障任务调度装置相比，本申请提供的实施例通过将获取到的目标航班保障任务组对应的各个航班保障代理机构的状态信息输入到训练好的调度策略选择模型中，确定目标航班保障任务组对应的目标航班保障节点顺序以及每个目标航班保障节点对应的目标调度策略，并基于每个目标航班保障节点的目标调度策略，确定目标航班保障任务组对应的组合目标调度策略，以便完成对目标航班保障任务组的调度，通过训练好的调度策略选择模型，确定目标航班保障任务组对应的组合目标调度策略，实现了对各大航班的目标航班保障任务组的动态灵活调度，进而提升了机场的运行效率。

请参阅图4，图4为本申请实施例所提供的一种电子设备的结构示意图。如图4中所示，所述电子设备400包括处理器410、存储器420和总线430。

所述存储器420存储有所述处理器410可执行的机器可读指令，当电子设备400运行时，所述处理器410与所述存储器420之间通过总线430通信，所述机器可读指令被所述处理器410执行时，可以执行如上述图1以及图2所示方法实施例中的航班保障任务的调度方法的步骤，具体实现方式可参见方法实施例，在此不再赘述。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的航班保障任务的调度方法的步骤，具体实现方式可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（Read-OnlyMemory，ROM）、随机存取存储器（Random Access Memory，RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。