CN116956757A - 出港航班滑行时间预测方法、电子设备和存储介质 - Google Patents
出港航班滑行时间预测方法、电子设备和存储介质 Download PDFInfo
- Publication number
- CN116956757A CN116956757A CN202311221651.9A CN202311221651A CN116956757A CN 116956757 A CN116956757 A CN 116956757A CN 202311221651 A CN202311221651 A CN 202311221651A CN 116956757 A CN116956757 A CN 116956757A
- Authority
- CN
- China
- Prior art keywords
- flight
- taxi
- time
- departure
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000012549 training Methods 0.000 claims abstract description 50
- 230000008569 process Effects 0.000 claims abstract description 38
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 30
- 238000012360 testing method Methods 0.000 claims abstract description 22
- 238000005457 optimization Methods 0.000 claims abstract description 18
- 230000010006 flight Effects 0.000 claims description 27
- 238000005070 sampling Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 230000004888 barrier function Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 23
- 239000004973 liquid crystal related substance Substances 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 12
- 238000003066 decision tree Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000011217 control strategy Methods 0.000 description 4
- 230000012010 growth Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000002015 leaf growth Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Educational Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及民用航空技术领域,公开了一种出港航班滑行时间预测方法、电子设备和存储介质,出港航班滑行时间预测方法包括:获取出港航班在地面运行过程中对滑行时间产生影响的相关特征样本,划分训练样本和测试样本;将训练样本输入到LightGBM出港航班滑行时间预测的初级模型中进行训练,得到训练模型;将测试样本输入训练模型,验证训练模型的预测性能;采用贝叶斯优化算法,获取训练模型的最优超参数取值;根据最优超参数取值,获得优化后的LightGBM出港航班滑行时间预测模型;将任一机场的航班地面运行数据的相关特征数据输入出港航班滑行时间预测模型,得到出港航班滑行时间的预测值,实现了对出港航班滑行时间的快速准确预测。
Description
技术领域
本发明涉及民用航空技术领域,具体涉及出港航班滑行时间预测方法、电子设备和存储介质。
背景技术
出港航班滑行时间会受到多种因素影响从而具有不确定性,对出港航班滑行时间快速准确的预测可以为航班时隙分配和制定推出控制策略提供客观有效的决策依据;而制定合理的推出控制策略从某种角度上讲可以缓解机场场面拥堵,减轻航班延误;同时,在出港航班滑行时间预测值准确的前提下可以开展对未来一段时间内的机场进出港吞吐能力的预测评估,实现机场的自主决策运行与控制。
目前机场出港航班滑行时间估计手段主要以人为经验判断为主,缺乏科学性的出港航班滑行时间预测方法。
发明内容
有鉴于此,本发明提供了一种出港航班滑行时间预测方法、电子设备和存储介质,以解决目前方法中存在的面对大量样本数据时的计算效率不高,关于机器学习算法中超参数的设置对模型预测性能的影响考虑不足的问题。
第一方面,本发明提供了一种出港航班滑行时间预测方法,包括:
获取出港航班在地面运行过程中对滑行时间产生影响的相关特征样本;
对所述相关特征样本进行预处理,划分训练样本和测试样本;
将所述训练样本输入到LightGBM出港航班滑行时间预测的初级模型中进行训练,得到训练模型;
将所述测试样本输入所述训练模型,评估训练模型的预测性能;
采用贝叶斯优化算法,获取所述训练模型的最优超参数取值;
根据所述最优超参数取值,获得优化后的LightGBM出港航班滑行时间预测模型;
将任一机场的航班地面运行数据的相关特征数据输入所述出港航班滑行时间预测模型,得到港航班滑行时间的预测值。
有益效果是,采用贝叶斯优化算法对基于LightGBM的出港航班滑行时间初级模型,通过使用贝叶斯优化算法寻找LightGBM算法的超参数的最优取值,可以实现对出港航班滑行时间的快速准确预测,进而为制定推出控制策略提供客观有效的决策依据,因此具有一定的实际应用意义。
在一种可选的实施方式中,所述地面运行过程包括机坪运行过程、滑行道运行过程和跑道运行过程。
在一种可选的实施方式中,所述机坪运行过程主要包括:撤轮档、牵引车辅助航空器推出至指定区域、航空器根据引导车指引滑行至机坪道口;所述滑行道运行过程主要包括:航空器在无滑行冲突的情况下经滑行道滑行至跑道入口、在有滑行冲突的情况下航空器等待冲突解决后继续经滑行道滑行至跑道入口;所述跑道运行过程主要包括:航空器在无起飞队列且满足最小尾流间隔的情况下对准跑道完成起飞、航空器在存在起飞队列或不满足最小尾流间隔的情况下完成等待后对准跑道完成起飞。
在一种可选的实施方式中,训练样本和测试样本的比例为8:2。
在一种可选的实施方式中,所述相关特征样本包括进港滑行的航班数量、出港滑行的航班数量、出港航班实际撤轮档时刻前第一预设时间内的其它出港航班的平均滑行时间、停机位位置、航空公司类型和机型。
在一种可选的实施方式中,采用皮尔逊相关系数分析出港航班滑行时间与所述相关特征样本的相关性。
在一种可选的实施方式中,对所述相关特征样本进行预处理,具体包括:
从机场实际地面运行的真实数据中选取与所述相关特征样本有关的时间的数据;
删除关键信息为空的异常数据。
在一种可选的实施方式中,所述最优超参数取值包括LightGBM算法的学习率、叶子节点数、特征抽样率、树模型的最大深度、正则化系数、最小分裂增益样本抽样率和叶子节点上的最小样本数的超参数的最优取值。
有益效果是,针对LightGBM算法的学习率、叶子节点数、特征抽样率、树模型的最大深度、正则化系数、最小分裂增益样本抽样率和叶子节点上的最小样本数等超参数寻找最优取值,以实现对出港航班滑行时间快速准确的预测,进而为制定推出控制策略提供客观有效的决策依据。
第二方面,本发明还提供了一种电子设备,至少包括存储器、处理器,所述存储器上存储有计算机程序,所述处理器在执行所述存储器上的计算机程序时实现任一项所述方法的步骤。
有益效果是,由于上述的电子设备可实现出港航班滑行时间预测方法,因此,该电子设备具有上述的出港航班滑行时间预测方法的一切有益效果。
第三方面,本发明还提供了一种存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现任一项所述的出港航班滑行时间预测方法的步骤。
有益效果是,由于上述的存储介质可实现上述的出港航班滑行时间预测方法,因此,使得该存储介质具有出港航班滑行时间预测方法的一切有益效果。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的一种出港航班滑行时间预测方法的流程图;
图2为本发明实施例的一种出港航班滑行时间预测方法的采用贝叶斯优化算法改进的LightGBM出港航班滑行时间预测流程图;
图3为本发明实施例的一种出港航班滑行时间预测方法的航班出港协同决策过程的流程图;
图4为本发明实施例的一种出港航班滑行时间预测方法的出港航班地面运行过程的流程图。
图5a为本发明实施例的一种出港航班滑行时间预测方法的出港航班滑行时间影响因素相关性分析之一;
图5b为本发明实施例的一种出港航班滑行时间预测方法的出港航班滑行时间影响因素相关性分析之二;
图5c为本发明实施例的一种出港航班滑行时间预测方法的出港航班滑行时间影响因素相关性分析之三;
图6为本发明实施例的一种出港航班滑行时间预测方法的按叶生长策略示意图;
图7a为本实施例的一种出港航班滑行时间预测方法的不同模型的出港航班滑行时间预测值与真实值对比关系之一;
图7b为本实施例的一种出港航班滑行时间预测方法的不同模型的出港航班滑行时间预测值与真实值对比关系之二;
图7c为本实施例的一种出港航班滑行时间预测方法的不同模型的出港航班滑行时间预测值与真实值对比关系之三;
图7d为本实施例的一种出港航班滑行时间预测方法的不同模型的出港航班滑行时间预测值与真实值对比关系之四。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术存在预测准确度低、处理大量样本数据时的计算效率低等问题。LightGBM以决策树作为基学习器,通过迭代来产生新的决策树,且新的决策树建立在损失函数的梯度下降的方向上,通过将所有决策树结合起来,可以得到一个预测能力强大的集成模型,且通过加入单边梯度采样、互斥特征绑定、按叶生长策略等方法来提高训练速度。但目前使用LightGBM预测出港航班滑行时间的方法较少。
下面结合图1至图7,描述本发明的实施例。
如图1和图2所示,根据本发明的实施例,一方面,提供了一种出港航班滑行时间预测方法,包括:
步骤S101:获取出港航班在地面运行过程中对滑行时间产生影响的相关特征样本;
步骤S103:对相关特征样本进行预处理,划分训练样本和测试样本;
步骤S105:将训练样本输入到LightGBM出港航班滑行时间预测的初级模型中进行训练,得到训练模型;
步骤S107:将测试样本输入训练模型,评估训练模型的预测性能;
步骤S109:采用贝叶斯优化算法,获取训练模型的最优超参数取值;
步骤S111:根据最优超参数取值,获得优化后的LightGBM出港航班滑行时间预测模型;
步骤S113:将任一机场的航班地面运行数据的相关特征数据输入出港航班滑行时间预测模型,得到港航班滑行时间的预测值。
其中,在分析机场协同决策背景下,出港航班的地面运行的过程,是根据出港航班经过的机场设施而定的,在上述分析的基础上,提取出可能对出港航班滑行时间产生影响的因素,并分析数值型影响因素的相关性,得到相关特征样本,对上述具有相关特征的样本进行预处理,之后将这些具有影响因素的相关特征样本按比例随机划分出训练样本和测试样本,根据训练样本构建LightGBM出港航班滑行时间预测的初级模型,从而得到训练模型,再将测试样本输入训练模型从而验证其预测性能。使用贝叶斯优化算法寻找上述训练好的LightGBM出港航班滑行时间预测模型的最优超参数取值,从而获得采用贝叶斯优化算法改进的LightGBM出港航班滑行时间预测模型。
将任何一个机场的航班地面运行数据按照上述步骤S101至步骤S107处理后输入到采用贝叶斯优化算法改进的LightGBM出港航班滑行时间预测模型中,采用贝叶斯优化算法改进的LightGBM出港航班滑行时间预测模型的输出即为该机场的出港航班滑行时间的预测值。
具体地,地面运行过程包括机坪运行过程、滑行道运行过程和跑道运行过程。
其中,在分析机场协同决策背景下,出港航班的地面运行的过程,是根据出港航班经过的机场设施而定的,也就是,将地面运行过程分为三部分,分别为机坪运行过程、滑行道运行过程和跑道运行过程。
机场协同决策指的是空管、机场、航空公司等多主体通过信息共享,实现对出港航班里程碑事件的时间的把握。具体来说,航空公司根据前序航班运行状态和机场保障能力计算出目标撤轮档时间和目标起飞时间,空管部门使用空中交通流量管理系统给出计算起飞时间,并依据预计出港滑行时间发布目标许可开车时间,机场依据目标许可开车时间组织乘客登机,并安排出港航班撤轮档、滑行、起飞,整个协同决策过程如图3所示。
更为具体地,机坪运行过程主要包括:撤轮档、牵引车辅助航空器推出至指定区域、航空器根据引导车指引滑行至机坪道口;滑行道运行过程主要包括:航空器在无滑行冲突的情况下经滑行道滑行至跑道入口、在有滑行冲突的情况下航空器等待冲突解决后继续经滑行道滑行至跑道入口;跑道运行过程主要包括:航空器在无起飞队列且满足最小尾流间隔的情况下对准跑道完成起飞、航空器在存在起飞队列或不满足最小尾流间隔的情况下完成等待后对准跑道完成起飞。
可以理解为,出港航班机坪运行过程为航空器在完成撤轮档后,在牵引车的辅助下推出至指定区域,待地面管制发布滑行指令后,即可在引导车的指引下滑行至机坪道口;滑行道运行过程为航空器在滑行道上滑行的过程中,若存在滑行冲突,则需要在冲突解决后继续滑行至跑道入口,若无滑行冲突,则可畅通无阻地滑行至跑道入口;跑道运行过程为航空器在存在起飞队列时,需要等待前方航班起飞后才能进入跑道,若此时不满足于前一架飞机间的最小尾流间隔,则需要等待一个最小尾流间隔后才能完成起飞,若无起飞队列且满足最小尾流间隔,则可直接进入跑道完成起飞。整个出港航班地面运行过程如图4所示。
具体地,训练样本和测试样本的比例为8:2。
对上述具有相关特征的样本进行预处理,然后将所有处理后的样本按比例随机分为训练样本与测试样本,之后将训练样本输入到LightGBM出港航班滑行时间预测模型中,从而对该模型进行训练,最后将测试样本输入到训练好的LightGBM出港航班滑行时间预测模型中,其中的训练样本和测试样本的比例为8:2,能得到更准确的训练模型。
其中,相关特征样本包括进港滑行的航班数量、出港滑行的航班数量、出港航班实际撤轮档时刻前第一预设时间内的其它出港航班的平均滑行时间、停机位位置、航空公司类型和机型。
通过上述分析可知,出港航班滑行时间是一个会受到多重因素影响的变量,因此从机场场面状况、出港航班自身属性等角度,提取了以下出港航班滑行时间影响因素:
场面上正在活动的飞机数量。进出港航班在场面运行的过程中可能需要使用同一条滑行道或跑道,此时需要出港航班等待其他航班完成对滑行道或跑道的使用后才能继续滑行。场面上正在活动的飞机数量可分为进港滑行的航班数量(单位:架次),和出港滑行的航班数量/>(单位:架次)。其中,/>定义为对于出港航班,如果进港航班m的实际着陆时刻(/>)介于出港航班n的实际撤轮档时刻(/>)和实际起飞时刻(/>)之间,则所有这样的进港航班m之和记为/>,如下式所示。
定义为对于出港航班n,如果其他出港航班m的实际撤轮档时刻(/>)介于出港航班n的实际撤轮档时刻和实际起飞时刻之间,则所有这样的出港航班m之和记为,如下式所示。
机场出港压力。机场出港压力较大的情况下,出港航班需要在滑行过程中等待,或经过非最优滑行路径滑行至跑道,从而导致其实际滑行时间增加。机场出港压力定义为出港航班n实际撤轮档时刻前20分钟内的其他出港航班的平均滑行时间,这20分钟内若无其他出港航班,则/>不存在,其具体计算公式如下式所示。
上式中,为出港航班n的实际撤轮档时刻前20分钟内的某一架出港航班的滑行时间,在出港航班n实际撤轮档时刻前20分钟内共有m架次出港航班。
停机位位置。停机位位置距离跑道端头的远近,间接影响了出港航班滑行路径的长短,从而影响其实际滑行时间。由于大型机场的停机位数量较多,为了方便计算,将位置相近的停机位划分到一类,共计4类,分别对应到数字编号1~4。
航空公司类型。不同的航空公司对飞行员有不同的要求,可能使他们的驾驶习惯不同;此外,不同的航空公司在不同的机场拥有不同的资源,如果某家航空公司在某个机场设立了基地,在该机场拥有更多所需要的设备和人员,则可以为出港航班节省更多的滑行时间。
机型。不同的机型在载客量和最小尾流间隔上存在差异,通常来说,机型越大,出港滑行所消耗的时间就越长。根据RECAT-CN标准,将机型分为5类,分别对应编号1~5,如表1所示。
表1 RECAT-CN标准机型分类
为了验证数值型影响因素的有效性,按照下式分别计算了出港航班滑行时间与进港滑行的航班数量、出港滑行的航班数量/>和机场出港压力/>的皮尔逊相关系数,图5a、图5b、图5c通过散点图分别分析了出港航班滑行时间与上述3个特征的线性相关性。
式中,为变量/>的协方差,/>和/>分别为变量/>的标准差。这里变量/>指出港航班滑行时间,变量/>分别代入为进港滑行的航班数量、出港滑行的航班数量和机场出港压力。
LightGBM出港航班滑行时间预测模型的计算流程如下:
(1)输入由维出港航班滑行时间影响因素变量/>和出港航班滑行时间/>构成的滑行时间数据集/>后,初始化基学习器:
其中,表示只有一个根节点的初始决策树,/>为损失函数,这里采用均方误差作为损失函数,如下式所示,/>为第/>个训练数据,/>为使损失函数最小化的常数。样本/>,/>为样本个数。
其中,为本轮迭代得到的学习器。
(2)对(S表示迭代次数):
a)对样本,计算损失函数的负梯度:
上式中,为第/>个样本在上一轮(第/>轮)迭代中得到的预测出港航班滑行时间,/>表示对第/>个样本的损失函数求偏导,即为损失函数的梯度,用近似替代残差。
b)用拟合得到第s棵 CART 回归树,其叶子节点区域划分为/>(C表示每棵树的叶子节点个数);
c)遍历各个叶子节点区域,计算最佳残差拟合值:
其中,表示第/>个样本在上一轮(第/>轮)迭代得到的学习器。
d)根据线性搜索法来估算叶子节点区域的值,最小化损失函数,从而更新学习器:
其中,表示上一轮(第/>轮)迭代得到的学习器,/>用于判断/>是否位于叶子节点区域/>内。
(3)重复(2)中步骤直到满足终止条件,输出最终的强学习器:
即为出港航班滑行时间预测结果。
为了提高训练速度,LightGBM 加入了单边梯度采样、互斥特征绑定和按叶生长策略。
单边梯度采样从减少样本的角度出发,保留对模型信息增益贡献多的前a%的大梯度样本,对于梯度较小的样本随机抽样b%并给它们乘上相应的系数,这样就能够在不改变原有数据分布的条件下减少样本的数量,从而提高模型的训练速度。
互斥特征绑定从减少特征的角度出发,将多个互斥的稀疏特征捆绑为一个稠密的新特征,从而减少特征数量。
按叶生长策略的示意图如图 6 所示,它从减少计算量角度出发,在每一次节点分裂时,选择信息增益最大的叶子节点进行生长,其他叶子节点不再分裂,从而避免了大量不必要的计算。
LightGBM 出港航班滑行时间预测模型的超参数设置为:树模型的最大深度(max_depth)为 3,叶子节点数(num_leaves)为 7,学习率(learning_rate)为 0.1,树模型的训练数量(n_estimators)为 100。
在另外一个实施例中,采用皮尔逊相关系数分析出港航班滑行时间与相关特征样本的相关性。
对相关特征样本进行预处理,具体包括:
步骤 S201:从机场实际地面运行的真实数据中选取与相关特征样本有关的时间的数据;
步骤 S203:删除关键信息为空的异常数据。
具有相关特征的样本来源于某机场某一月份实际地面运行过程中所记录的真实数据。但在机场实际记录过程中不可避免地会由于特殊情况导致部分数据的缺失或记录异常,因此需要对真实数据进行预处理。处理前的部分航班保障服务数据如表 2 所示。
表2 航班地面运行原始数据示例
对原始数据集的预处理包括删除数据集中实际起飞时间、实际撤轮档时间、实际降落时间等关键信息为空的异常数据;删除数据集中计算出的滑行时间为负值或超过 60分钟等的异常样本;以序号代替具体航班编号,并对机型分类。之后,根据实际到达时间、撤轮档结束时间、实际起飞时间和步骤(2)中定义的 、/>、/>,分别计算出进、出港滑行的航班数量和前 20 分钟出港航班的平均滑出时间等特征,处理后的数据集样例如表3 所示。
表3 处理后的航班地面运行数据
将上述经过预处理后的数据按8:2的比例随机分成训练样本与测试样本,然后将训练样本输入到LightGBM出港航班滑行时间预测模型中从而对该模型进行训练,之后将测试样本输入到训练好的LightGBM出港航班滑行时间预测模型中,完成对出港航班滑行时间的预测。
在另外一个实施例中,最优超参数取值包括LightGBM算法的学习率、叶子节点数、特征抽样率、树模型的最大深度、正则化系数、最小分裂增益样本抽样率和叶子节点上的最小样本数的超参数的最优取值。
可以理解为,对于LightGBM这类机器学习算法而言,从超参数到模型预测效果的映射是一个具有高评估代价的黑箱函数,而贝叶斯优化以贝叶斯定理为理论依据,充分考虑了黑箱函数的不确定性,在探索新的样本点和利用已有样本点之间取得了良好的平衡,从而很适合解决这类问题。
贝叶斯优化采用概率代理模型来近似替代当前的黑箱目标函数,这里采用高斯过程作为概率代理模型,如下式所示:
其中,为超参数向量,/>为黑箱目标函数,反映了LightGBM模型预测效果关于模型超参数的度量,/>为均值函数,/>,为方便计算将其设置为0,为协方差函数。
一个均值为0的先验分布可表示为:
其中 ,表示训练集/>,/>表 示/> 的函数值集合,/>,/>表示超参数。
由于使用了概率代理模型近似表示实际的黑箱目标函数,观测时必然存在噪声,即/>。若噪声/>服从正态分布/>,则似然分布为:
上式中,为观测到的测试集精度集合/>,/>为方差,/>为单位矩阵。
根据上述先验分布和似然分布,可得边际似然分布为:
根据高斯过程的性质,存在联合分布:
其中,为预测函数值,/>为预测输入值,
。
根据上述联合分布可得的后验分布为:
其中,为预测均值,/>为预测协方差。
直接从代理模型中选择一个最优点进行评估,通常代价高昂。因此,贝叶斯优化构建了采集函数/>,它通过最大化已观测到的数据集/>的后验分布来选择下一个评估点,这里使用期望提升函数作为采集函数,其具体公式如下式所示:
其中,表示由已观测到的数据集/>的后验分布构造出的期望提升采集函数,/>表示现有最优函数值,/>为正态分布的累积分布函数,/>为/>的数学期望,/>为/>的标准差,/>是对当前最优点取值的z-score标准化。
使用贝叶斯优化算法对学习率、叶子节点数、特征抽样率、树模型的最大深度、正则化系数、最小分裂增益样本抽样率和叶子节点上的最小样本数等LightGBM出港航班滑行时间预测模型的超参数进行寻优,各超参数的寻参范围均在符合其含义的取值范围内设定,例如feature_fraction参数通过控制每次迭代时的特征抽样率来加快训练速度,那么其取值不超过1,同时也不宜过低,因此将寻参范围设定为(0.1, 1)。再以五折交叉验证的均方根误差作为目标函数,控制迭代次数为1000次,其寻参结果如表4所示。
表4 贝叶斯优化的寻参范围和结果
同样按照8:2的比例划分训练集和测试集,以表4中的最优超参数重新训练LightGBM出港航班滑行时间预测模型,最终形成采用贝叶斯优化算法改进的LightGBM出港航班滑行时间预测模型。
为了验证效果,可以分别使用上述LightGBM出港航班滑行时间预测模型(LightGBM模型)、采用贝叶斯优化算法改进的LightGBM出港航班滑行时间预测模型(BO-LightGBM模型)、支持向量回归出港航班滑行时间预测模型(SVR模型)和BP神经网络出港航班滑行时间预测模型(BP神经网络模型)共四种算法来预测出港航班滑行时间。
为了评估不同模型间的预测效果,分别计算了±3 min以内的预测准确率、均方根误差RMSE、平均绝对误差MAE和平均绝对百分比误差MAPE共四个指标。其中,均方根误差RMSE反映了预测值与真实值之间的离散程度,平均绝对误差MAE反映了预测值与真实值之间的平均偏差程度,平均绝对百分比误差MAPE反映了预测模型的相对准确性。假设测试集中一共有个出港航班滑行时间样本,出港航班滑行时间的预测值为/>,真实值为/>,其公式为:
表5 不同模型滑出时间预测性能对比
表 6 不同模型的计算效率对比
不同模型出港航班滑行时间预测性能指标对比如表5所示,不同模型的计算消耗时间对比如表6所示,随机抽取测试集中的100组数据,不同模型的出港航班滑行时间预测值与真实值对比如图7a、图7b、图7c、图7d所示。
综合表4和表5可以看出,部分超参数的寻优结果与人为设置的有所不同,而正是由于这些超参数在设定的寻参范围内取得了最优解,才使得BO-LightGBM算法的各个评估指标均优于人为设置超参数的标准LightGBM算法。这一点在图7a至图7d中也有所体现,BO-LightGBM模型预测值与真实值之间的差距要远小于LightGBM模型。
从表5中可以看出,BP神经网络的预测效果比SVR模型和标准LightGBM算法更好,但仍不如经过贝叶斯优化寻参后的LightGBM算法结果准确。而且从表6中可以看出,BP神经网络的运算时间是所有预测模型中最长的,甚至比贝叶斯优化带来运算负担还要大,可以预想的是,在处理数据量更庞大的样本时,基于LightGBM的算法在计算效率方面相比BP神经网络将展现出更大的优势。
相较于标准LightGBM算法,BO-LightGBM算法在± 3分钟内的准确率提高了6%以上,RMSE减少了约45 s,MAE减少了约23.4 s,MAPE减少了2%左右。以上数据充分表明了提出的BO-LightGBM算法具有更高的准确性和更好的稳定性,基于BO-LightGBM算法的出港航班滑行时间预测模型是有效、合理的。
根据本发明的实施例,另一方面,还提供了一种电子设备,至少包括存储器、处理器,存储器上存储有计算机程序,处理器在执行存储器上的计算机程序时实现上述的任一项方法的步骤。
根据本发明的实施例,另一方面,还提供了一种存储介质,存储有计算机程序,计算机程序被处理器执行时实现任一项的出港航班滑行时间预测方法的步骤。
上述的实施例中,存储介质可以包括但不限于:U盘、只读存储器(ROMRead-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,处理器根据存储介质中已存储的程序代码执行上述实施例记载的方法步骤。
本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本公开的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上。
可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本公开不限制于任何特定的硬件和软件结合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种出港航班滑行时间预测方法,其特征在于,包括:
获取出港航班在地面运行过程中对滑行时间产生影响的相关特征样本;
对所述相关特征样本进行预处理,划分训练样本和测试样本;
将所述训练样本输入到LightGBM出港航班滑行时间预测的初级模型中进行训练,得到训练模型;
将所述测试样本输入所述训练模型,评估训练模型的预测性能;
采用贝叶斯优化算法,获取所述训练模型的最优超参数取值;
根据所述最优超参数取值,获得优化后的LightGBM出港航班滑行时间预测模型;
将任一机场的航班地面运行数据的相关特征数据输入所述出港航班滑行时间预测模型,得到港航班滑行时间的预测值。
2.根据权利要求1所述的出港航班滑行时间预测方法,其特征在于,所述地面运行过程包括机坪运行过程、滑行道运行过程和跑道运行过程。
3.根据权利要求2所述的出港航班滑行时间预测方法,其特征在于,所述机坪运行过程主要包括:撤轮档、牵引车辅助航空器推出至指定区域、航空器根据引导车指引滑行至机坪道口;所述滑行道运行过程主要包括:航空器在无滑行冲突的情况下经滑行道滑行至跑道入口、在有滑行冲突的情况下航空器等待冲突解决后继续经滑行道滑行至跑道入口;所述跑道运行过程主要包括:航空器在无起飞队列且满足最小尾流间隔的情况下对准跑道完成起飞、航空器在存在起飞队列或不满足最小尾流间隔的情况下完成等待后对准跑道完成起飞。
4.根据权利要求1所述的出港航班滑行时间预测方法,其特征在于,训练样本和测试样本的比例为8:2。
5.根据权利要求1至4中任一项所述的出港航班滑行时间预测方法,其特征在于,所述相关特征样本包括进港滑行的航班数量、出港滑行的航班数量、出港航班实际撤轮档时刻前第一预设时间内的其它出港航班的平均滑行时间、停机位位置、航空公司类型和机型。
6.根据权利要求5所述的出港航班滑行时间预测方法,其特征在于,采用皮尔逊相关系数分析出港航班滑行时间与所述相关特征样本的相关性。
7.根据权利要求1至4中任一项所述的出港航班滑行时间预测方法,其特征在于,对所述相关特征样本进行预处理,具体包括:
从机场实际地面运行的真实数据中选取与所述相关特征样本有关的时间的数据;
删除关键信息为空的异常数据。
8.根据权利要求1至4中任一项所述的出港航班滑行时间预测方法,其特征在于,所述最优超参数取值包括LightGBM算法的学习率、叶子节点数、特征抽样率、树模型的最大深度、正则化系数、最小分裂增益样本抽样率和叶子节点上的最小样本数的超参数的最优取值。
9.一种电子设备,至少包括存储器、处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器在执行所述存储器上的计算机程序时实现权利要求1至8中任一项所述的出港航班滑行时间预测方法的步骤。
10.一种存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的出港航班滑行时间预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311221651.9A CN116956757A (zh) | 2023-09-21 | 2023-09-21 | 出港航班滑行时间预测方法、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311221651.9A CN116956757A (zh) | 2023-09-21 | 2023-09-21 | 出港航班滑行时间预测方法、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116956757A true CN116956757A (zh) | 2023-10-27 |
Family
ID=88449696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311221651.9A Pending CN116956757A (zh) | 2023-09-21 | 2023-09-21 | 出港航班滑行时间预测方法、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116956757A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117494879A (zh) * | 2023-10-31 | 2024-02-02 | 四川大学 | 航空器的滑行时间预测方法、装置、设备及可读存储介质 |
CN118094382A (zh) * | 2024-04-26 | 2024-05-28 | 青岛民航凯亚系统集成有限公司 | 一种民用机场进港航空器滑入机坪道口预测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180012499A1 (en) * | 2016-07-07 | 2018-01-11 | Passur Aerospace, Inc. | System and Method for Predicting Aircraft Taxi Time |
CN110363361A (zh) * | 2019-07-25 | 2019-10-22 | 四川青霄信息科技有限公司 | 一种基于大数据预测可变滑动时间的方法及系统 |
CN113610282A (zh) * | 2021-07-23 | 2021-11-05 | 北京首都国际机场股份有限公司 | 航班滑行时间预测方法 |
CN113792762A (zh) * | 2021-08-24 | 2021-12-14 | 华南理工大学 | 基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质 |
-
2023
- 2023-09-21 CN CN202311221651.9A patent/CN116956757A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180012499A1 (en) * | 2016-07-07 | 2018-01-11 | Passur Aerospace, Inc. | System and Method for Predicting Aircraft Taxi Time |
CN110363361A (zh) * | 2019-07-25 | 2019-10-22 | 四川青霄信息科技有限公司 | 一种基于大数据预测可变滑动时间的方法及系统 |
CN113610282A (zh) * | 2021-07-23 | 2021-11-05 | 北京首都国际机场股份有限公司 | 航班滑行时间预测方法 |
CN113792762A (zh) * | 2021-08-24 | 2021-12-14 | 华南理工大学 | 基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117494879A (zh) * | 2023-10-31 | 2024-02-02 | 四川大学 | 航空器的滑行时间预测方法、装置、设备及可读存储介质 |
CN118094382A (zh) * | 2024-04-26 | 2024-05-28 | 青岛民航凯亚系统集成有限公司 | 一种民用机场进港航空器滑入机坪道口预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109508812B (zh) | 一种基于深度记忆网络的航空器航迹预测方法 | |
Yazdi et al. | Flight delay prediction based on deep learning and Levenberg-Marquart algorithm | |
CN116956757A (zh) | 出港航班滑行时间预测方法、电子设备和存储介质 | |
US9424745B1 (en) | Predicting traffic patterns | |
CN110503245B (zh) | 一种机场航班大面积延误风险的预测方法 | |
CN108710623B (zh) | 基于时间序列相似性度量的机场离港延误时间预测方法 | |
WO2021082393A1 (zh) | 基于大数据深度学习的机场场面可变滑出时间预测方法 | |
Choi et al. | Artificial neural network models for airport capacity prediction | |
WO2021082394A1 (zh) | 基于大数据深度学习的场面可变滑出时间预测系统 | |
Ballakur et al. | Empirical evaluation of gated recurrent neural network architectures in aviation delay prediction | |
Dhief et al. | Predicting aircraft landing time in extended-TMA using machine learning methods | |
CN113706931B (zh) | 空域的流控策略推荐方法、装置、电子设备及存储介质 | |
CN114626585B (zh) | 一种基于生成对抗网络的城市轨道交通短时客流预测方法 | |
CN110570693A (zh) | 一种基于可靠性的航班运行时间预测方法 | |
Zhang et al. | Data‐driven flight time prediction for arrival aircraft within the terminal area | |
CN113657814B (zh) | 一种航空网络风险预测方法及风险等级评估方法 | |
CN116911434A (zh) | 一种机场运行态势预测方法、装置、系统以及存储介质 | |
Li et al. | A CNN-LSTM framework for flight delay prediction | |
CN115564114A (zh) | 一种基于图神经网络的空域碳排放短期预测方法及系统 | |
CN113657671A (zh) | 一种基于集成学习的航班延误预测方法 | |
CN113284369A (zh) | 一种基于ads-b实测航路数据的预测方法 | |
CN115907079B (zh) | 一种基于注意力时空图卷积网络的空域交通流量预测方法 | |
Ma et al. | Sector entry flow prediction based on graph convolutional networks | |
CN115222150B (zh) | 一种基于Stacking的航班延误预测方法及系统 | |
Baspinar et al. | Large scale data-driven delay distribution models of european air traffic flow network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |