CN108710623B - 基于时间序列相似性度量的机场离港延误时间预测方法 - Google Patents

基于时间序列相似性度量的机场离港延误时间预测方法 Download PDF

Info

Publication number
CN108710623B
CN108710623B CN201810203697.0A CN201810203697A CN108710623B CN 108710623 B CN108710623 B CN 108710623B CN 201810203697 A CN201810203697 A CN 201810203697A CN 108710623 B CN108710623 B CN 108710623B
Authority
CN
China
Prior art keywords
time
delay
departure
airport
delay time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810203697.0A
Other languages
English (en)
Other versions
CN108710623A (zh
Inventor
谢华
袁立罡
刘芳子
李雨吟
胡明华
陈海燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201810203697.0A priority Critical patent/CN108710623B/zh
Publication of CN108710623A publication Critical patent/CN108710623A/zh
Application granted granted Critical
Publication of CN108710623B publication Critical patent/CN108710623B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于时间序列相似性度量的机场离港延误时间预测方法。该方法的步骤:提取并处理机场飞行计划数据;建立并计算机场延误相关指标;基于动态时间规整方法提取机场离港延误时间序列的相似性;分析机场离港延误相关指标的关联性;利用时间序列相似性特征加权方法预测机场离港延误时间。本发明克服了现有机场离港延误预测方法的缺陷,提高了机场离港延误预测的效率和精度。

Description

基于时间序列相似性度量的机场离港延误时间预测方法
技术领域
本发明属于民航技术领域,特别涉及了一种机场离港延误时间预测方法。
背景技术
延误是交通运输系统中最重要的性能指标之一,也一直是空中交通系统的一项重要研究课题。航班延误预测可以提升空管、机场、航空公司的战略及战术决策水平,及时告知旅客延误情况,以便其重新安排航行计划,从而有效缓解延误现状。
随着我国国民经济的快速发展,日益增长的航空运输需求与实际空域及机场容量的矛盾愈加明显。航班延误已造成大量负面影响,尤其在经济方面,危及了旅客、航空公司和机场等各方利益。目前,航班延误预测都是对单航班延误时间进行预测,不同机场、不同机型、不同的航空公司都会造成预测延误时间的变化,缺乏针对机场某一时间段场面整体延误情况的预测;此外,大多数预测对于数据的选择较为简单,仅从数据完整性和有效性进行筛选,缺乏对于数据特征提取的预处理过程,忽略数据本身具备的特性,造成大量数据信息的丢失,无法得到准确的预测结果。
总体而言,目前关于机场离港延误时间预测研究现状如下:
(1)在依据历史延误数据,基于时间序列相似性度量预测机场离港延误时间的研究尚处于空白,对机场整体延误情况预测缺乏科学的数据分析支持;
(2)在进行延误预测时,大多数研究通常只考虑数据的可获取性和完整性,缺乏对于数据进一步处理,容易受异常数据干扰;
(3)目前的延误预测方法,多针对单一航班进行预测,而缺乏对于某一时间段航班延误整体情况的分析;
(4)由于空中交通运输系统的复杂性、预测模型的多样性和航空系统中的数据体量,难以构建精确的航班延误预测模型,大部分研究存在考虑因素不全面的情况。
发明内容
为了解决上述背景技术提出的技术问题,本发明旨在提供基于时间序列相似性度量的机场离港延误时间预测方法,提高机场离港延误预测的效率和精度。
为了实现上述技术目的,本发明的技术方案为:
基于时间序列相似性度量的机场离港延误时间预测方法,包括以下步骤:
(1)提取并处理机场飞行计划数据;
(2)建立并计算机场延误相关指标;
(3)基于动态时间规整方法提取机场离港延误时间序列的相似性;
(4)分析机场离港延误相关指标的关联性;
(5)利用时间序列相似性特征加权方法预测机场离港延误时间。
进一步地,步骤(1)的具体过程如下:
(1a)对计划进离港时间、实际起飞机场、实际落地机场、实际起飞时间、实际落地时间、实际撤轮档时间、实际挡轮档时间、实际滑入时间、实际滑出时间缺失的历史运行记录数据进行去除,提取出有效的飞行计划数据;
(1b)针对有效的飞行计划数据,进行数据字段的有效性筛选,验证数据准确性。
进一步地,步骤(2)的具体过程如下:
(2a)定义机场离港延误相关指标,包括实际进港架次、实际离港架次、计划进港架次、计划离港架次、离港延误时间、离港延误架次、机上延误架次、机上延误时间、前序延误时间、发生前序延误的本场离港延误架次、发生前序延误的本场离港延误时间、发生前序延误且本场发生离港延误的前序延误时间、过站冗余时间、本场根延误架次、本场根延误时间、滑入时间、滑出时间、滑入架次和滑出架次;
(2b)计算上述机场离港延误相关指标,其中离港延误时间、机上延误时间、前序延误时间、发生前序延误的本场离港延误时间、发生前序延误且本场离港延误的前序延误时间、本场根延误时间、过站冗余时间、滑出时间和滑入时间的计算方法如下:
离港延误时间=实际撤轮档时间–计划离港时间;离港延误时间大于零视为有效,其它数值记为“0”;
机上延误时间=实际起飞时间–实际关舱门时间–经验滑出时间;机上延误时间大于零视为有效,其它数值记为“0”;
前序延误时间=前序计划的实际挡轮档时间–计划进港时间;前序延误时间大于零视为有效,其它数值记为“0”;
发生前序延误的本场离港延误时间=实际撤轮档时间–计划离港时间;前序延误时间大于零,且发生前序延误的本场离港延误时间大于零视为有效,其它数值记为“0”;
发生前序延误且本场离港延误的前序延误时间=前序航班撤轮档时间–前序航班计划离港时间;前序延误时间大于零视为有效,其它数值记为“0”;
本场根延误时间=实际撤轮档时间–计划离港时间;前序延误时间等于零或为首发航班,且本场根延误时间大于零视为有效,其它数值记为“0”;
过站冗余时间=(计划离港时间–计划进港时间)-(实际离港时间–实际进港时间);
滑出时间=实际起飞时间–实际撤轮档时间;滑出时间大于零视为有效,其它数值则表明该飞行计划有误,删除本条记录;
滑入时间=实际进港时间–实际撤轮档时间;大于零视为有效,其它数值则表明该飞行计划有误,删除本条记录;
基于上述指标,计算机场统计时段内所有航班的累积值,统计范围根据划设的时间粒度为准。
进一步地,所述划设的时间粒度包括15分钟、30分钟、60分钟和一天。
进一步地,步骤(3)的具体过程如下:
(3a)指定时间粒度,统计该时间粒度下各时段机场离港延误时间,构造机场离港延误时间序列;
(3b)采用动态时间规整方法度量机场离港延误时间序列距离,设时间序列X=<x1,x2,...,xi>与Y=<y1,y2,...,yj>,则这两个时间序列的距离计算公式如下:
Figure BDA0001595262120000041
其中,Ddtw(X,Y)表示序列X与Y的采用动态时间规整方法得出的DTW距离;dist(x1,y1)为序列点x1和y1之间的距离;Rest(X)和Rest(Y)表示序列X和Y除去x1和y1之后的剩余序列。
进一步地,步骤(4)的具体过程如下:
(4a)将所研究时间范围内各时间序列之间的DTW距离由小到大排序,并设置相似阈值;
(4b)根据相似阈值找出相似的时间序列,筛选其中出现频率最高的日期作为研究日期,提取与该研究日期相似度最高的7天,通过皮尔逊相关系数分析机场离港延误相关指标的关联性:
Figure BDA0001595262120000051
上式中,X为研究日期,X=<x1,x2,...,xi,...,xn>,Y为相似日期,Y=<y1,y2,...,yi,...,yn>;i为该指标时间序列号,i=1,2,3,...,n,
Figure BDA0001595262120000052
a为时间粒度,其单位为分钟,rX,Y为X与Y的某一指标的皮尔逊系数,用于表征关联性大小;Xi为研究日期某一指标第i个值,
Figure BDA0001595262120000053
为研究日期某指标该日平均值,sX为X的标准差,Yi为相似日期某一指标第i个值,
Figure BDA0001595262120000054
为研究日期某指标该日平均值,sY为Y的标准差。
进一步地,步骤(5)的具体过程如下:
(5a)在选择预测时间序列和其余所有有效机场离港延误时间序列之后,采用DTW相似性度量方法,计算预测时序与历史数据的DTW距离:
设预测时序在预测时段内的延误时间序列Y=(y1,y2,...,ym),m为预测时序的长度,历史样本延误时序X=(x1,x2,...,xk),k为历史样本延误时序长度;当计算预测时段与历史数据的DTW距离之后,通过设置相似性距离阈值distthreshold,选取小于该阈值的历史时段作为研究时段的关联时序,加入到关联时序集合中,设筛选之前的有效时序集合CX={X1,X2,...,Xr},则筛选后的关联时序集合为CX'={X1,X2,...,Xr'|r'≤r};
(5b)构建特征加权的支持向量回归模型:
首先,根据预测时段与历史数据的DTW距离distdtw(Xi,Y)建立权值公式:
Figure BDA0001595262120000055
从而得到关联时序集合CX'={X1,X2,...,Xr'|r'≤r}的加权集合
Figure BDA0001595262120000056
然后,将加权集合转化为特征加权对角矩阵:
Figure BDA0001595262120000061
在本模型中,采用高斯径向基核函数,在核函数中乘以特征加权对角矩阵:
Figure BDA0001595262120000062
其中,
Figure BDA0001595262120000063
为乘以特征加权对角矩阵后的核函数,σ为核函数的宽度参数;最后,利用训练数据集即关联时序集合CX'={X1,X2,...,Xr'|r'≤r},对上述构建的特征加权支持向量回归模型进行训练;
(5c)采集某一机场离港延误时间序列数据,利用训练好的特征加权支持向量回归模型进行机场离港延误时间预测。
采用上述技术方案带来的有益效果:
本发明探究航班延误相关因素,准确定位延误情况相似时间段,提高分析效率;而基于时间相似性度量的机场离港延误时间预测,可以获得机场一段时间内的整体延误情况,弥补了以往只针对单一航班延误预测的空缺。此外,本发明考虑了延误时序数据本身特征,将相似性作为特征向量引入预测模型中,提高机器学习方法对于数据后续挖掘的精度和效率,避免数据信息的大量损失。将本发明应用于机场离港延误的分析与预测,可为机场和空管单位在战略和预战术阶段提供有效的数据支持,有效预测延误情况的发生,并可从与延误相关的各项时序因素多角度全面分析可能发生的延误情况,以提前采取相关措施避免机场大面积延误的发生。
附图说明
图1是本发明的方法流程图。
具体实施方式
以下将结合附图,对本发明的技术方案进行详细说明。
基于时间序列相似性度量的机场离港延误时间预测方法,如图1所示,具体步骤如下。
步骤一:飞行计划数据处理和提取
(1)有效飞行计划数据的提取:对计划进离港时间、实际起飞机场、实际落地机场、实际起飞时间、实际落地时间、实际撤轮档时间、实际挡轮档时间、实际滑入时间、实际滑出时间缺失的历史运行记录数据进行去除;
(2)针对完整数据,进行数据字段的有效性筛选,验证数据准确性。
步骤二:机场离港延误相关指标定义与计算
(1)机场离港延误相关指标的定义:制定可能与机场离港延误时间相关的所有指标,包括实际进港架次、实际离港架次、计划进港架次、计划离港架次、离港延误架次、机上延误架次、机上延误时间、前序延误时间、发生前序延误的本场离港延误架次、发生前序延误的本场离港延误时间、发生前序延误且本场发生离港延误的前序延误时间、过站冗余时间、本场根延误架次(本场根延误即本场为延误始发地)、本场根延误时间、滑入时间、滑出时间、滑入架次、滑出架次共十八项指标;
(2)机场离港延误相关指标的计算:提取飞行计划中的有效字段计算上述定义指标,其中单航班的离港延误时间、机上延误时间、前序延误时间、发生前序延误的本场离港延误时间、发生前序延误且本场离港延误的前序延误时间、本场根延误时间、过站冗余时间、滑出时间、滑入时间的计算规则如下:
a)离港延误时间=实际撤轮档时间–计划离港时间(离港延误时间大于零视为有效,其它数值记为“0”)
b)机上延误时间=实际起飞时间–实际关舱门时间–经验滑出时间(机上延误时间大于零视为有效,其它数值记为“0”)
c)前序延误时间=前序计划的实际挡轮档时间–计划进港时间;前序延误时间大于零视为有效,其它数值记为“0”;
d)发生前序延误的本场离港延误时间=实际撤轮档时间–计划离港时间(前序延误时间大于零;且发生前序延误的本场离港延误时间大于零视为有效,其它数值记为“0”)
e)前序延误时间=前序航班撤轮档时间–前序航班计划离港时间(前序延误时间大于零视为有效,其它数值记为“0”)
f)本场根延误时间=实际撤轮档时间–计划离港时间(前序延误时间等于零,或为首发航班;且本场根延误时间大于零视为有效,其它数值记为“0”)
g)过站冗余时间=(计划离港时间–计划进港时间)-(实际离港时间–实际进港时间)
h)滑出时间=实际起飞时间–实际撤轮档时间(滑出时间大于零视为有效,其它数值则证明该飞行计划有误,删除本条记录)
i)滑入时间=实际进港时间–实际撤轮档时间(大于零视为有效,其它数值则证明该飞行计划有误,删除本条记录)
基于单航班上述指标,计算机场统计时段内所有航班的累积值,统计范围根据划设的时间粒度为准,划设的时间粒度包括:15分钟、30分钟、60分钟、一天。指标统计按照下述时段划分规则:
a)依据计划离港时间统计:计划离港架次、离港延误架次、离港延误时间、发生前序延误的本场离港延误时间、前序延误时间、发生前序延误的本场离港延误时间、发生前序延误且本场发生离港延误的前序延误时间、过站冗余时间、本场根延误架次、本场根延误时间
b)依据计划进港时间时间统计:计划进港架次
c)依据实际起飞时间统计:实际离港架次、机上延误架次、机上延误时间
d)依据实际落地时间统计:实际进港架次
e)依据实际挡轮档时间统计:滑入架次、滑入时间
f)依据实际撤轮档时间统计:滑出架次、滑出时间
如:机场离港延误时间,即机场在指定时间粒度下,第i个时间段离港航班(计划离港时间在第i个时间段内,且航班的撤轮档时间大于计划离港时间,即产生延误)延误时间的总和,记为di
Figure BDA0001595262120000091
其中,k为计划在第i个时间段内离场的航班,s_deptimek为航班k的计划离港时间,r_outtimek为航班k的实际撤轮档时间。
步骤三:基于DTW的机场离港延误时间序列相似性提取
(1)机场离港延误时间序列的构建:将每个时间段的机场离港延误时间按时间先后顺序记录下来形成的机场离港延误时间序列。
如:D=<(d1,1),(d2,2),...,(di,i),...,(dn,n)>。其中,采样序列的间隔相同,所以D被简记为:D=<d1,d2,...,di,...,dn>,数据点的数目n表示其长度。
(2)机场离港延误时间序列的DTW距离提取:选择指定时间粒度,统计该时间粒度下各时段机场离港延误时间,并根据研究范围和目的,构造机场离港延误时间序列,运用动态时间规整(DTW)方法度量机场离港延误时间序列距离。
动态时间规整(DTW)是一种通过弯曲时间轴来更好地对时间序列形态进行匹配映射的相似性度量方法,主要用于寻找两个给定序列之间的最佳对齐方式,查找指定时间划分粒度下最类似的历史子序列,假设存在时间序列X=<x1,x2,...,xi>与Y=<y1,y2,...,yj>,计算公式如下:
Figure BDA0001595262120000101
其中,Ddtw(X,Y)表示序列X与Y的采用动态时间规整方法得出的距离;dist(x1,y1)为序列点x1和y1之间的距离;Rest(X)和Rest(Y)表示序列X和Y除去第一个点之后的剩余序列。当序列X与Y等长时,可直接采用欧氏距离计算二者的距离;当序列X与Y长度不同时,采用DTW方法寻找两个时间序列中的最佳规整路径,并计算相应的距离。DTW计算序列X=<1,1,1,10,2,3>和Y=<1,1,1,2,10,3>的距离为Ddtw(X,Y)=18。
步骤四:基于时间相似性度量的机场离港延误相关因素分析
(1)基于DTW机场相似延误时间序列的筛选:将所研究时间范围内各时间序列之间的DTW距离由小到大排序,根据研究需要分析时间序列的相似程度,划设相似阈值;
(2)机场离港延误相关指标的关联性分析:将所研究时间范围内各时间序列之间的DTW距离由小到大排序,认为前20%的时间序列为相似,筛选其中出现频率最高的日期作为研究日期,提取与该日期相似度最高的7天,引入皮尔逊相关系数分析这7天十八项指标的关联性,判断与延误相关因素。皮尔逊系数计算公式如下:
Figure BDA0001595262120000111
其中,X为研究日期,X=<x1,x2,...,xi,...,xn>,Y为相似日期,Y=<y1,y2,...,yi,...,yn>;i为该指标时间序列号,i=1,2,3,...,n,
Figure BDA0001595262120000112
a为时间粒度,其单位为分钟,若以15分钟为时间粒度,则n=96,rX,Y为X与Y的某一指标的皮尔逊系数,用于表征关联性大小;Xi为研究日期某一指标第i个值,
Figure BDA0001595262120000113
为研究日期某指标该日平均值,sX为X的标准差,Yi为相似日期某一指标第i个值,
Figure BDA0001595262120000114
为研究日期某指标该日平均值,sY为Y的标准差。
步骤五:利用时间序列相似性特征加权方法预测机场离港延误时间
(1)机场离港延误时序特征加权模型构建:运用DTW相似性度量方法作为模型的时间序列相似性度量指标,筛选出时序关联度较高的机场离港延误时间序列组成训练样本,并利用DTW距离作为权值构建加权集合,得到特征加权模型,具体过程如下:
Step 1:筛选关联时序集合
在选择预测时间序列和其余所有有效机场离港延误时间序列之后,采用DTW相似性衡量方法,计算预测时序与历史数据的DTW距离。
假设预测时序在预测时段内的延误时间序列Y=(y1,y2,...,ym),其中m为预测时段的长度。样本延误时序X=(x1,x2,...,xk),k为样本数据长度。
当计算预测时段与历史数据进行DTW距离计算之后,通过设置相似性距离阈值distthreshold,选取在小于该阈值上的历史时段作为研究时段的关联时序,加入到关联时序集合中,即筛选条件为:distdtw(X,Y)<distthreshold,其中distdtw(X,Y)为时序X与时序Y的距离。
设在筛选之前一共有有效时序集合CX={X1,X2,…,Xr}通过筛选过后的关联时序集合为CX'={X1,X2,…,Xr'|r'≤r}。
Step 2:构建特征加权的支持向量回归模型
由于DTW距离是计算出两者之间的距离,因此接下来需要通过归一化,计算出它们与预测时段的关联度,作为它们各自的权值,公式有:
Figure BDA0001595262120000121
从而得到延误关联时序的加权集合为
Figure BDA0001595262120000122
那么,由r'个关联时序数据可整理得到模型的训练数据集。
将加权集合
Figure BDA0001595262120000123
修改为特征加权对角矩阵M为:
Figure BDA0001595262120000124
在本模型中,采用高斯径向基核函数,在核函数中乘以特征加权矩阵之后为:
Figure BDA0001595262120000125
其中σ为函数的宽度参数,控制函数的径向作用范围。
接下来,基于特征加权的支持向量回归机作为学习器,利用训练数据集即关联时序集合CX'={X1,X2,…,Xr'|r'≤r},对上述构建的特征加权支持向量回归模型进行训练。
(2)基于特征加权支持向量回归模型预测机场离港延误时间:采集某一机场离港延误时间序列数据,利用(1)中特征加权支持向量回归模型进行机场离港延误时间预测。
实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (7)

1.基于时间序列相似性度量的机场离港延误时间预测方法,其特征在于,包括以下步骤:
(1)提取并处理机场飞行计划数据;
(2)建立并计算机场延误相关指标;
(3)基于动态时间规整方法提取机场离港延误时间序列的相似性;
(4)分析机场离港延误相关指标的关联性;
(5)利用时间序列相似性特征加权方法预测机场离港延误时间;所述时间序列相似性特征加权方法就是根据预测时序与历史数据的DTW距离计算权值,并根据权值训练支持向量回归模型来预测机场离港延误时间。
2.根据权利要求1所述基于时间序列相似性度量的机场离港延误时间预测方法,其特征在于,步骤(1)的具体过程如下:
(1a)对计划进离港时间、实际起飞机场、实际落地机场、实际起飞时间、实际落地时间、实际撤轮档时间、实际挡轮档时间、实际滑入时间、实际滑出时间缺失的历史运行记录数据进行去除,提取出有效的飞行计划数据;
(1b)针对有效的飞行计划数据,进行数据字段的有效性筛选,验证数据准确性。
3.根据权利要求1所述基于时间序列相似性度量的机场离港延误时间预测方法,其特征在于,步骤(2)的具体过程如下:
(2a)定义机场离港延误相关指标,包括实际进港架次、实际离港架次、计划进港架次、计划离港架次、离港延误时间、离港延误架次、机上延误架次、机上延误时间、前序延误时间、发生前序延误的本场离港延误架次、发生前序延误的本场离港延误时间、发生前序延误且本场发生离港延误的前序延误时间、过站冗余时间、本场根延误架次、本场根延误时间、滑入时间、滑出时间、滑入架次和滑出架次;
(2b)计算上述机场离港延误相关指标,其中离港延误时间、机上延误时间、前序延误时间、发生前序延误的本场离港延误时间、发生前序延误且本场离港延误的前序延误时间、本场根延误时间、过站冗余时间、滑出时间和滑入时间的计算方法如下:
离港延误时间=实际撤轮档时间–计划离港时间;离港延误时间大于零视为有效,其它数值记为“0”;
机上延误时间=实际起飞时间–实际关舱门时间–经验滑出时间;机上延误时间大于零视为有效,其它数值记为“0”;
前序延误时间=前序计划的实际挡轮档时间–计划进港时间;前序延误时间大于零视为有效,其它数值记为“0”;
发生前序延误的本场离港延误时间=实际撤轮档时间–计划离港时间;前序延误时间大于零,且发生前序延误的本场离港延误时间大于零视为有效,其它数值记为“0”;
发生前序延误且本场离港延误的前序延误时间=前序航班撤轮档时间–前序航班计划离港时间;前序延误时间大于零视为有效,其它数值记为“0”;
本场根延误时间=实际撤轮档时间–计划离港时间;前序延误时间等于零或为首发航班,且本场根延误时间大于零视为有效,其它数值记为“0”;
过站冗余时间=(计划离港时间–计划进港时间)-(实际离港时间–实际进港时间);
滑出时间=实际起飞时间–实际撤轮档时间;滑出时间大于零视为有效,其它数值则表明该飞行计划有误,删除本条记录;
滑入时间=实际进港时间–实际撤轮档时间;大于零视为有效,其它数值则表明该飞行计划有误,删除本条记录;
基于上述指标,计算机场统计时段内所有航班的累积值,统计范围根据划设的时间粒度为准。
4.根据权利要求3所述基于时间序列相似性度量的机场离港延误时间预测方法,其特征在于:所述划设的时间粒度包括15分钟、30分钟、60分钟和一天。
5.根据权利要求1所述基于时间序列相似性度量的机场离港延误时间预测方法,其特征在于:步骤(3)的具体过程如下:
(3a)指定时间粒度,统计该时间粒度下各时段机场离港延误时间,构造机场离港延误时间序列;
(3b)采用动态时间规整方法度量机场离港延误时间序列距离,设时间序列X=<x1,x2,...,xi>与Y=<y1,y2,...,yj>,则这两个时间序列的距离计算公式如下:
Figure FDA0002713061960000031
其中,Ddtw(X,Y)表示序列X与Y的采用动态时间规整方法得出的DTW距离;dist(x1,y1)为序列点x1和y1之间的距离;Rest(X)和Rest(Y)表示序列X和Y除去x1和y1之后的剩余序列。
6.根据权利要求5所述基于时间序列相似性度量的机场离港延误时间预测方法,其特征在于:步骤(4)的具体过程如下:
(4a)将所研究时间范围内各时间序列之间的DTW距离由小到大排序,并设置相似阈值;
(4b)根据相似阈值找出相似的时间序列,筛选其中出现频率最高的日期作为研究日期,提取与该研究日期相似度最高的7天,通过皮尔逊相关系数分析机场离港延误相关指标的关联性:
Figure FDA0002713061960000041
上式中,X为研究日期,X=<x1,x2,...,xi,...,xn>,Y为相似日期,Y=<y1,y2,...,yi,...,yn>;i为该指标时间序列号,i=1,2,3,...,n,
Figure FDA0002713061960000042
a为时间粒度,其单位为分钟,rX,Y为X与Y的某一指标的皮尔逊系数,用于表征关联性大小;Xi为研究日期某一指标第i个值,
Figure FDA0002713061960000043
为研究日期某指标该日平均值,sX为X的标准差,Yi为相似日期某一指标第i个值,
Figure FDA0002713061960000044
为研究日期某指标该日平均值,sY为Y的标准差。
7.根据权利要求1所述基于时间序列相似性度量的机场离港延误时间预测方法,其特征在于:步骤(5)的具体过程如下:
(5a)在选择预测时间序列和其余所有有效机场离港延误时间序列之后,采用DTW相似性度量方法,计算预测时序与历史数据的DTW距离:
设预测时序在预测时段内的延误时间序列Y=(y1,y2,...,ym),m为预测时序的长度,历史样本延误时序X=(x1,x2,...,xk),k为历史样本延误时序长度;当计算预测时段与历史数据的DTW距离之后,通过设置相似性距离阈值distthreshold,选取小于该阈值的历史时段作为研究时段的关联时序,加入到关联时序集合中,设筛选之前的有效时序集合CX={X1,X2,...,Xr},则筛选后的关联时序集合为CX'={X1,X2,...,Xr'|r'≤r};
(5b)构建特征加权的支持向量回归模型:
首先,根据预测时段与历史数据的DTW距离distdtw(Xi,Y)建立权值公式:
Figure FDA0002713061960000045
从而得到关联时序集合CX'={X1,X2,...,Xr'|r'≤r}的加权集合
Figure FDA0002713061960000046
然后,将加权集合
Figure FDA0002713061960000047
转化为特征加权对角矩阵:
Figure FDA0002713061960000051
在本模型中,采用高斯径向基核函数,在核函数中乘以特征加权对角矩阵:
Figure FDA0002713061960000052
其中,
Figure FDA0002713061960000053
为乘以特征加权对角矩阵后的核函数,σ为核函数的宽度参数;
最后,利用训练数据集即关联时序集合CX'={X1,X2,...,Xr'|r'≤r},对上述构建的特征加权支持向量回归模型进行训练;
(5c)采集某一机场离港延误时间序列数据,利用训练好的特征加权支持向量回归模型进行机场离港延误时间预测。
CN201810203697.0A 2018-03-13 2018-03-13 基于时间序列相似性度量的机场离港延误时间预测方法 Active CN108710623B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810203697.0A CN108710623B (zh) 2018-03-13 2018-03-13 基于时间序列相似性度量的机场离港延误时间预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810203697.0A CN108710623B (zh) 2018-03-13 2018-03-13 基于时间序列相似性度量的机场离港延误时间预测方法

Publications (2)

Publication Number Publication Date
CN108710623A CN108710623A (zh) 2018-10-26
CN108710623B true CN108710623B (zh) 2021-01-05

Family

ID=63866387

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810203697.0A Active CN108710623B (zh) 2018-03-13 2018-03-13 基于时间序列相似性度量的机场离港延误时间预测方法

Country Status (1)

Country Link
CN (1) CN108710623B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109596929B (zh) * 2019-01-31 2020-11-10 国家电网有限公司 一种考虑时钟不同步影响的电压曲线相似性判断方法
CN110334839B (zh) 2019-04-15 2021-05-14 北京航空航天大学 航班延误预测方法、装置、设备及存储介质
CN110766064A (zh) * 2019-10-14 2020-02-07 中国民航大学 一种基于局部加权支持向量回归的离港滑行时间预测方法
CN110712765B (zh) * 2019-10-30 2021-06-18 北京航空航天大学 一种基于操作序列的飞行器异常操作定位方法
CN111026108B (zh) * 2019-11-15 2023-07-21 西安华运天成通讯科技有限公司 基于卫星导航的港口船舶进出港控制方法及其系统
CN112926613A (zh) * 2019-12-06 2021-06-08 北京沃东天骏信息技术有限公司 一种时间序列训练开始节点的定位方法和装置
CN112101780A (zh) * 2020-09-15 2020-12-18 南京智慧航空研究院有限公司 结构熵权法的机场场面运行综合评价方法
CN112101779A (zh) * 2020-09-15 2020-12-18 南京智慧航空研究院有限公司 基于主客观结合的结构熵权法机场场面运行综合评价系统
CN112765147A (zh) * 2021-02-01 2021-05-07 浙江大学 一种结合注意力机制的pr-lstm算法的空中交通延误预测方法
CN113008239B (zh) * 2021-03-01 2023-01-03 哈尔滨工程大学 一种多auv协同定位鲁棒延迟滤波方法
CN117291318B (zh) * 2023-11-27 2024-03-26 山东航空股份有限公司 基于多因素时间判断逻辑的航班延误预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000041166A2 (en) * 1999-01-07 2000-07-13 Microsoft Corporation Handwriting or spoken words recognition with neural networks
CN102685766A (zh) * 2012-05-13 2012-09-19 西华大学 一种基于局域最大最小概率机的无线网络流量预测方法
CN102682573A (zh) * 2012-03-31 2012-09-19 上海海洋大学 一种基于时间序列分析的风暴潮灾害预警系统
CN103577562A (zh) * 2013-10-24 2014-02-12 河海大学 一种多度量时间序列相似分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000041166A2 (en) * 1999-01-07 2000-07-13 Microsoft Corporation Handwriting or spoken words recognition with neural networks
CN102682573A (zh) * 2012-03-31 2012-09-19 上海海洋大学 一种基于时间序列分析的风暴潮灾害预警系统
CN102685766A (zh) * 2012-05-13 2012-09-19 西华大学 一种基于局域最大最小概率机的无线网络流量预测方法
CN103577562A (zh) * 2013-10-24 2014-02-12 河海大学 一种多度量时间序列相似分析方法

Also Published As

Publication number Publication date
CN108710623A (zh) 2018-10-26

Similar Documents

Publication Publication Date Title
CN108710623B (zh) 基于时间序列相似性度量的机场离港延误时间预测方法
CN106447285B (zh) 基于多维度领域关键知识的招聘信息匹配方法
CN106197424B (zh) 遥测数据驱动的无人机飞行状态识别方法
CN110503245B (zh) 一种机场航班大面积延误风险的预测方法
CN111652427B (zh) 一种基于数据挖掘分析的航班到达时刻预测方法及系统
CN109191922B (zh) 一种大规模四维航迹动态预测方法及装置
WO2021082394A1 (zh) 基于大数据深度学习的场面可变滑出时间预测系统
CN109920248B (zh) 一种基于gru神经网络的公交到站时间预测方法
CN111680870B (zh) 目标运动轨迹质量综合评估方法
CN110826788A (zh) 基于大数据深度学习的机场场面可变滑出时间预测方法
CN113159374B (zh) 一种数据驱动的城市交通流速模式识别与实时预测预警方法
CN111160612A (zh) 一种基于天气影响的离场航班延误分析及预测方法
CN112232535A (zh) 一种基于监督学习的航班离场平均延误预测方法
CN111599219B (zh) 一种基于排序学习的多数据源航班起飞时间预测方法
CN115718993A (zh) 一种飞机积冰sfip指数优化调整方法及系统
CN112101779A (zh) 基于主客观结合的结构熵权法机场场面运行综合评价系统
CN116244647A (zh) 一种无人机集群的运行状态估计方法
CN113284369B (zh) 一种基于ads-b实测航路数据的预测方法
CN108830405B (zh) 基于多指标动态匹配的实时电力负荷预测系统及其方法
CN107132515A (zh) 一种基于多维信息约束的点迹筛选方法
CN116956757A (zh) 出港航班滑行时间预测方法、电子设备和存储介质
CN110766064A (zh) 一种基于局部加权支持向量回归的离港滑行时间预测方法
CN115759470A (zh) 一种基于机器学习的航班飞行全过程燃油消耗预测方法
CN116304966A (zh) 基于多源数据融合的航迹关联方法
CN111090793B (zh) 一种基于平均延误时间序列的机场日延误特征分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant