CN116777028A - 基于对流天气影响交通指数的机场累积延误预测方法 - Google Patents
基于对流天气影响交通指数的机场累积延误预测方法 Download PDFInfo
- Publication number
- CN116777028A CN116777028A CN202310036028.XA CN202310036028A CN116777028A CN 116777028 A CN116777028 A CN 116777028A CN 202310036028 A CN202310036028 A CN 202310036028A CN 116777028 A CN116777028 A CN 116777028A
- Authority
- CN
- China
- Prior art keywords
- delay
- airport
- departure
- index
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000001186 cumulative effect Effects 0.000 claims abstract description 34
- 238000007637 random forest analysis Methods 0.000 claims abstract description 14
- 238000013139 quantization Methods 0.000 claims abstract description 8
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 14
- 230000001934 delay Effects 0.000 claims description 9
- 230000010006 flight Effects 0.000 claims description 7
- 230000003111 delayed effect Effects 0.000 claims description 5
- 238000002790 cross-validation Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000002360 prefrontal effect Effects 0.000 claims description 3
- 238000011160 research Methods 0.000 claims description 2
- 238000012360 testing method Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000003066 decision tree Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 241000422846 Sequoiadendron giganteum Species 0.000 description 1
- 208000026527 Vissers-Bodmer syndrome Diseases 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229910000514 dolomite Inorganic materials 0.000 description 1
- 239000010459 dolomite Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及航班延误管理领域,尤其涉及一种基于对流天气影响交通指数的机场累积延误预测方法。本机场累积延误预测方法对数据预处理、终端区区域划分后,通过提出终端区对流天气影响交通指数T_CWIITI用于量化终端区对流天气对机场进离港交通流的影响,并从累积视角新定义了延误量化指标—机场离港累积延误用于反映机场的延误状况,采用随机森林回归算法建立了终端区对流天气影响下的机场离港延误预测模型,然后输入待预测样本即可得到准确度较高的机场延误状况。
Description
技术领域
本发明涉及航班延误管理领域,尤其涉及一种基于对流天气影响交通指数的机场累积延误预测方法。
背景技术
近些年来,随着中国航班需求量的迅速增长,航班延误现象日益严重,迫切需要机场和空管运行部门进行预判,及时采取有效措施,减少航班延误损失。
根据各大机场的航班延误原因数据统计,对流天气是造成航班延误的重要原因,终端区空域高度拥挤的特点,使得终端区空域的航班运行对对流天气干扰非常敏感。因此,在终端区对流天气影响下,准确有效的预测机场延误,对运行部门有重要的意义。
现有方法采用的大多是METAR报文数据,侧重于整体影响量化,缺少空间信息的引入,导致延误预测误差较大;预测方法上采用拟合或者聚类,缺少时序性的考虑;在延误特征定义上,无法准确量化机场延误积压情况的变化,导致难以准确量化终端区对流天气对机场延误的影响。
发明内容
本发明的目的在于提供一种基于对流天气影响交通指数的机场累积延误预测方法。
为解决上述技术问题,本发明提供了一种基于对流天气影响交通指数的机场累积延误预测方法,包括以下步骤:
步骤1,对气象与航班运行数据进行预处理;
步骤2,进行终端区区域划分;
步骤3,构建终端区对流天气影响交通指数;
步骤4,从累积视角重新定义延误量化指标——机场离港累积延误;
步骤5,分析T_CWITI指数与机场离港累积延误之间的相关性;
步骤6,构建融合T_CWITI指数与累积延误时序趋势的机场离港延误预测模型。
本发明的有益效果是,本发明提供了一种基于对流天气影响交通指数的机场累积延误预测方法,提出终端区对流天气影响交通指数T_CWIITI用于量化终端区对流天气对机场进离港交通流的影响,并从累积视角新定义了延误量化指标—机场离港累积延误用于反映机场的延误状况,采用随机森林回归算法建立了终端区对流天气影响下的机场离港延误预测模型,然后输入待预测样本即可得到准确度较高的机场延误状况。
附图说明
下面结合附图和实施例对本发明进一步说明:
图1为本发明的实施例的机场累积延误预测方法的流程图;
图2为本发明的实施例的终端区区域划分示意图;
图3为本发明的实施例的基于T_CWITI指数的机场延误预测模型框架图。
具体实施方式
为了更加清楚地说明本发明实施例的目的、技术方案和优点,下文将结合附图和实例,详细阐述本发明技术方案的实施过程。此处所描述的实例仅用于解释本发明的核心原理,但是并不用于限定本发明。
实施例
如图1所示,本实施例提供了一种基于对流天气影响交通指数的机场累积延误预测方法,具体实施步骤如下:
步骤1:对气象与航班运行数据进行预处理。
在本实施例中,可选的,所述对气象与航班运行数据进行预处理包括缺失值处理、异常值处理以及数据关联。
一般航班飞行计划数据、WAF(Weather Avoidance Field)数据以及METAR报文数据中存在“缺失数据项”、“异常值”以及时间粒度不统一等问题,会降低机场延误预测的精度,所以需要对这些原始数据进行数据清洗以及数据融合,以提高数据的质量。
在本实施例中,可选的,利用以下规则对航班运行数据进行预处理:
1)不考虑目的地是国外机场的离港航班数据产生的延误,将目的地是国外机场的航班数据删除;
2)对于缺少计划或实际离港时间信息的航班数据同样做删除处理,因为无法计算出该航班的延误时间;
3)当航班延误时间大于6h,该航班会被认定为是异常航班,异常航班会导致机场离港累积延误计算不准确,故需删除此类航班;
最后依据时间对多源气象数据、交通运行数据进行数据关联,以方便计算所需特征集。
步骤2:进行终端区区域划分;
在本实施例中,所述进行终端区区域划分包括:根据终端区管制边界以及进离港交通流空间分布特点对终端区进行划分。
在一种应用场景中,以广州终端区为例,具体的划分如图2所示,以机场塔台为中心、半径30KM的圆形刻画影响起落航线的近机场空域,在30KM圆形之外到边长为125KM的正方形间的空域包含了广州终端区六条空中走廊以及管制边界区域,因此按照走廊副区边界与塔台的连线,将这部分空域六分以监测GYA、VIBOS、IDUMA、LMN、ATAGA-IGONO、YIN六条走廊受对流天气的影响状况。
步骤3:构建终端区对流天气影响交通量化指数;
具体的,根据机场进离港交通流空间分布运行特点建立终端区对流天气影响交通指数T_CWITI,该指数包括整体T_CWITI指数与方向性T_CWITI指数,以量化终端区对流天气对各进离港方向交通流的影响,具体计算步骤如下:
1)计算区域i在第k个时段的WSI(Weather Severity Index)值,作为其天气影响权重系数,用WSIi(k)进行表示;其中,WSI为天气危险指数,指研究空域被危险天气覆盖的比例;可选的,WSI值可以是WAF恶劣程度等级为2和3的量占整个区域的比例;
在本实施例中,所述WAF恶劣程度是指将区域对流天气严重程度被分为4个等级,分别是对0级为飞行无影响、1级为轻度影响、2级为较重影响、3级为严重影响;
2)统计区域i在第k个时段内的航空器数量,用Ti(k)进行表示;
3)计算区域i在第k个时段的对流天气影响交通指数,用方向性T_CWITI指数T_CWITIi(k)进行表示:
T_CWITIi(k)=WSIi(k)·Ti(k);
4)计算第k个时段终端区整体对流天气影响交通指数即整体T_CWITI指数T_CWITIwhol(k):
步骤4:从累积视角重新定义机场延误量化指标——机场离港累积延误。
在一些应用场景中,离港延误总时间是描述机场延误状态的常用指标,原有离港延误总时间的计算方法,是从统计的角度计入航班计划离港时间所在时间片,反映该时间片的航班计划执行情况。原有方法中某一时间片的机场离港延误总时间是由所有航班的离港延误时间累加得到的,但单个航班的离港延误可能横跨多个时段,即不同航班的离港延误可能是由于受到不同时间范围的对流天气影响而产生的,这样一来,离港延误总时间与天气特征在时间片上难以匹配,对于航班延误的预测适应性不高。
在本实施例中,本实施例从累积视角重新定义机场延误量化指标——机场离港累积延误,量化当前时间片下机场未按计划起飞航班的延误时间总和,具体计算方法如下:
其中,dep_accu_delayk指第k个时段的离港累积延误时间;
nk指在第k个时段内发生延误的离港航班架次,既包括k时段前计划起飞但延误一直延续到k时段的航班,也包括k时段内计划起飞但发生延误的航班;
指k时段内第i架离港延误航班在k时段内产生的延误时间;
ks为k时段的起始时刻;
ke为k时段的终止时刻;
指第k时段内第i架离港延误航班实际离港时刻;
指第k时段内第i架离港延误航班计划离港时刻。
步骤5:分析T_CWITI指数与累积延误之间的相关性。
由于气象数据与机场延误数据都符合一般正态分布,并且气象特征与机场延误存在线性相关关系,因此,本实施例采用皮尔逊相关系数来分析T_CWITI指数与机场离港累积延误时间之间的相关性,以验证T_CWITI指数用于机场延误预测的可行性。
具体的,假设两个随机变量X和Y,则皮尔逊相关系数ρX,Y的计算方法如下:
cov(X,Y)=E((X-E(X))(Y-E(Y)));
式中,cov(X,Y)是X和Y的协方差,E(X)为变量X的期望。
对于本发明来讲,机场vi所在终端区的T_CWITI指数序列为X=[x1(1),x2(2),...,xi(T)],机场vi的离港累积延误序列为Y=[y1(1),y2(2),...,yi(T)],T是时间维度的长度,xi(k)表示机场vi在第k个时段的T_CWITI指数值,yi(k)表示机场vi在第k个时段的离港累积延误时间,于是ρX,Y表示T_CWITI指数与机场离港累积延误之间的皮尔逊相关系数。
步骤6:构建融合T_CWITI指数与累积延误时序趋势的机场离港延误预测模型。
在本实施例中,所述构建融合T_CWITI指数与累积延误时序趋势的机场离港延误预测模型包括:以T_CWITI指数、前序机场离港累积延误作为模型输入,以机场离港累积延误作为模型输出,采用随机森林回归算法进行训练,得到机场延误预测模型,并使用K折交叉验证法来评估模型。
在本实施例中,在分析机场延误影响因素时,延误的时序关联性很强,对于某个特定机场,其上个时间片的延误会累积到当前时间片内,因此前序机场离港累积延误可以作为延误预测模型的重要输入特征。
本实施例的目标是预测机场的小时离港累积延误时间,它可以被看作是一个回归问题。鉴于集成学习模型具有较高的预测准确性和泛化性能,以及不受相关特征影响的特性,在本实施例中,可以采用随机森林(RandomForest,RF)来进行模型训练。预测模型框架如图3所示。
随机森林(RF)是一种基于决策树理论的集成机器学习技术,由许多决策树组成。每个决策树的输入是来自给定数据集的采样数据,并具有相同的分布。通过组合弱学习器产生更强的学习器。作为bagging算法的变体,RF的思想是通过减少树之间的相关性来降低方差。由于大树定律,在有足够数据的RF中很少出现过拟合。基于树模型,RF对于异常值也是具有很强的鲁棒性的。对于回归问题,RF收集每棵树的预测结果,并选择平均结果作为最终的预测结果。
为了测试模型的泛化性能,通常需要将给定数据集划分为两份互斥的数据集合,训练集与测试集。在这里,本发明采用10倍交叉验证数据集划分方法,将数据集A划分为10个大小相似的互斥子集,即然后进行10次模型的训练与测试,每次选择其中1个子集作为测试集,余下9个子集的并集作为训练集,模型的评估结果用这十次训练/测试结果的平均值表示,具有较好的稳定性。
图3给出了延误预测模型的基本框架。在本实施例中,可选的,首先对原始数据进行特征处理,包括航班流量统计、延误特征统计、T_CWITI指数构建以及METAR报文解析,得到数据集A,再将数据集A划分为10个大小相似的互斥子集,并选取其中一个子集作为测试集,余下作为训练集,然后采用随机森林回归算法进行模型训练得到机场离港累积延误预测模型,机场离港累积延误模型的泛化性能通过10折交叉验证法得到,即进行10次模型的训练与测试,用这十次训练/测试结果的平均值表示模型的评估结果。
在本实施例中,整体T_CWITI指数是由各方向性T_CWITI指数累加得到;训练模型时,整体与方向性指数都是作为单独特征输入;通过方向性指数的应用还可以分析得出终端区对流天气对哪个进离港方向的交通流影响较大。
步骤7:验证机场延误预测模型的准确性。
所述验证机场累积延误预测模型的准确性的方法包括:选取机场的历史数据进行模型的训练与性能评估,并对比传统机场延误预测模型的精度。
为验证本实施例所提出的机场累积延误预测方法的准确性、合理性,在本实施例中,使用广州白云机场(ZGGG)2019的WAF数据、航班飞行计划数据以及METAR报文数据进行了实验,结果显示,T_CWITI指数的应用能够提高机场延误预测的精度。
Claims (8)
1.一种基于对流天气影响交通指数的机场累积延误预测方法,其特征在于,包括以下步骤:
步骤1,对气象与航班运行数据进行预处理;
步骤2,进行终端区区域划分;
步骤3,构建终端区对流天气影响交通指数;
步骤4,从累积视角重新定义延误量化指标——机场离港累积延误;
步骤5,分析T_CWITI指数与机场离港累积延误之间的相关性;
步骤6,构建融合T_CWITI指数与累积延误时序趋势的机场离港延误预测模型。
2.如权利要求1所述的机场累积延误预测方法,其特征在于,
所述步骤1中对气象与航班运行数据进行预处理包括:缺失值处理、异常值处理以及数据关联。
3.如权利要求2所述的机场累积延误预测方法,其特征在于,
所述步骤2中进行终端区区域划分包括:根据终端区管制边界以及进离港交通流空间分布特点对终端区进行划分。
4.如权利要求3所述的机场累积延误预测方法,其特征在于,
所述步骤3中构建终端区对流天气影响交通指数的方法包括:
计算区域i在第k个时段的WSI值,作为其天气影响权重系数,用WSIi(k)表示;其中,WSI为天气危险指数,指研究空域被危险天气覆盖的比例;
统计区域i在第k个时段内的航空器数量,用Ti(k)表示;
计算区域i在第k个时段的对流天气影响交通指数,用
T_CWITIi(k)表示:
T_CWITIi(k)=WSIi(k)·Ti(k)
计算第k个时段终端区整体对流天气影响交通指数,用
T_CWITIwhole(k)表示:
5.如权利要求4所述的机场累积延误预测方法,其特征在于,
所述步骤4中从累积视角重新定义延误量化指标——机场离港累积延误的方法包括:
其中,dep_accu_delayk指第k个时段的离港累积延误时间;
nk指在第k个时段内发生延误的离港航班架次,既包括k时段前计划起飞但延误一直延续到k时段的航班,也包括k时段内计划起飞但发生延误的航班;
指k时段内第i架离港延误航班在k时段内产生的延误时间;
ks为k时段的起始时刻;
ke为k时段的终止时刻;
指第k时段内第i架离港延误航班实际离港时刻;
指第k时段内第i架离港延误航班计划离港时刻。
6.如权利要求5所述的机场累积延误预测方法,其特征在于,
所述步骤5中分析T_CWITI指数与机场离港累积延误之间相关性采用皮尔逊相关系数来衡量。
7.如权利要求6所述的机场累积延误预测方法,其特征在于,
所述步骤6中构建融合T_CWITI指数与累积延误时序趋势的机场离港延误预测模型包括:
以T_CWITI指数、前序机场离港累积延误作为模型输入,以机场离港累积延误作为模型输出,采用随机森林回归算法进行训练,得到机场延误预测模型,并使用K折交叉验证法来评估模型。
8.如权利要求7所述的机场累积延误预测方法,其特征在于,还包括:
步骤7,验证机场延误预测模型的准确性;
所述验证机场延误预测模型的准确性的方法包括:
选取机场的历史数据进行模型的训练与性能评估,并对比传统机场延误预测模型的精度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310036028.XA CN116777028A (zh) | 2023-01-10 | 2023-01-10 | 基于对流天气影响交通指数的机场累积延误预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310036028.XA CN116777028A (zh) | 2023-01-10 | 2023-01-10 | 基于对流天气影响交通指数的机场累积延误预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116777028A true CN116777028A (zh) | 2023-09-19 |
Family
ID=87984792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310036028.XA Pending CN116777028A (zh) | 2023-01-10 | 2023-01-10 | 基于对流天气影响交通指数的机场累积延误预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116777028A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116096A (zh) * | 2023-10-25 | 2023-11-24 | 南京航空航天大学 | 基于多通道交通图像与深度cnn的机场延误预测方法及系统 |
-
2023
- 2023-01-10 CN CN202310036028.XA patent/CN116777028A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116096A (zh) * | 2023-10-25 | 2023-11-24 | 南京航空航天大学 | 基于多通道交通图像与深度cnn的机场延误预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210365823A1 (en) | Capacity evaluation method and device based on historical capacity similarity characteristic | |
WO2021082393A1 (zh) | 基于大数据深度学习的机场场面可变滑出时间预测方法 | |
Rodríguez-Sanz et al. | Assessment of airport arrival congestion and delay: Prediction and reliability | |
Solomentsev et al. | Sequential procedure of changepoint analysis during operational data processing | |
CN110503245B (zh) | 一种机场航班大面积延误风险的预测方法 | |
WO2021082394A1 (zh) | 基于大数据深度学习的场面可变滑出时间预测系统 | |
Kalair et al. | Anomaly detection and classification in traffic flow data from fluctuations in the flow–density relationship | |
CN109118771B (zh) | 一种城市交通常发性拥堵特征确定的方法及装置 | |
CN112634614B (zh) | 一种长下坡交通事件实时检测方法、装置及存储介质 | |
CN111160612A (zh) | 一种基于天气影响的离场航班延误分析及预测方法 | |
CN113239971B (zh) | 一种面向风场的临近预报与短期预报的融合系统 | |
CN109637196A (zh) | 航路扇区交通概率密度预测方法 | |
CN116777028A (zh) | 基于对流天气影响交通指数的机场累积延误预测方法 | |
CN110210648A (zh) | 基于灰色长短期记忆网络的管制空域战略流量预测方法 | |
CN106779222B (zh) | 机场地面等待时间预测方法及装置 | |
CN113657814B (zh) | 一种航空网络风险预测方法及风险等级评估方法 | |
CN109740818A (zh) | 一种应用于航路扇区交通的概率密度预测系统 | |
CN116957331A (zh) | 风险旅客流量范围预测方法和装置 | |
CN113284369A (zh) | 一种基于ads-b实测航路数据的预测方法 | |
CN114781704B (zh) | 一种基于过站航班保障流程的航班延误预测方法 | |
CN115277354A (zh) | 一种面向指挥控制网络管理系统的故障检测方法 | |
CN118134700A (zh) | 一种桥梁结构综合智能养护决策方法及系统 | |
CN116384807A (zh) | 基于模糊综合评价模型的航路网络拥挤态势评估方法 | |
CN108364091A (zh) | 概率性航路扇区交通需求预测流量管理系统 | |
CN115544886A (zh) | 高速电梯的失效时间节点预测方法、系统、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |