CN111144631A - 基于贝叶斯网络算法的航班延误实时概率预测方法 - Google Patents
基于贝叶斯网络算法的航班延误实时概率预测方法 Download PDFInfo
- Publication number
- CN111144631A CN111144631A CN201911316177.1A CN201911316177A CN111144631A CN 111144631 A CN111144631 A CN 111144631A CN 201911316177 A CN201911316177 A CN 201911316177A CN 111144631 A CN111144631 A CN 111144631A
- Authority
- CN
- China
- Prior art keywords
- delay
- flight
- time
- prediction
- departure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000005516 engineering process Methods 0.000 claims abstract description 9
- 230000000694 effects Effects 0.000 claims abstract description 6
- 238000005259 measurement Methods 0.000 claims abstract description 5
- 230000010006 flight Effects 0.000 claims description 22
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- 238000007405 data analysis Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 238000012706 support-vector machine Methods 0.000 claims description 3
- 230000002411 adverse Effects 0.000 abstract description 2
- 238000013486 operation strategy Methods 0.000 abstract description 2
- 230000003203 everyday effect Effects 0.000 abstract 1
- 238000012360 testing method Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于贝叶斯网络算法的航班延误实时概率预测方法,包括:制定航班延误判定标准、分析延误波及对航班延误的影响、确定离港航班放行公平性;对延误特性进行分析,确定航班延误因素,基于贝叶斯网络创建航班延误动态预测模型;采用基于时间序列的动态预测技术对本场横向波及衡量指标进行预测,得到最终航班延误预测值,生成预测集;利用训练得到的航班延误动态预测模型对预测集数据进行概率预测,采用概率最大原则得到各航班延误等级的预测值。本发明能够对机场每天单个航班的离港延误等级进行实时概率预测,提高航班延误预测精度,及时向旅客发布延误预警通告和调整运行策略,降低由航班延误导致的各种不利影响。
Description
技术领域
本发明涉及航班延误预测技术领域,具体而言涉及一种基于贝叶斯网络算法的航班延误实时概率预测方法。
背景技术
随着我国航空运输业的迅速发展,航班量大幅增加,同时航班延误现象频频出现,成为机场运营管理的一大难题。航班延误问题不仅成为广大旅客的出行困扰,也给航空公司和机场造成巨大时间和成本损失。航空公司为达到成本最小化和资源利用最大化,将航班计划安排得较为紧凑。这使得航班延误容易引起链式反应,从而波及到更多的下游航班和机场,导致旅客滞留、机场及航空公司资源调配失衡等问题。相关部门若能对航班延误进行及时预测,采取相应措施以减少由于航班延误所带来的经济和信誉的损失。
当前,关于航班延误预测研究偏重于采用固定模型对航班延误状态进行静态预测,缺乏动态的预测研究。但在外界环境发生变化时,静态模型的预测精度易受到影响,因此,对航班延误进行实时预测十分必要。
同时,面对各种不可控因素,对航班延误预警能力不足导致航班延误现象日趋严重。自网络购票、电子客票推行开始,民航一直走在信息化领域的前端,然而,新兴的互联网、大数据技术并未在国内航空运输系统中得到充分的应用。民航管理系统作为一个典型的大数据处理系统,每时每刻都会产生大量的航班运行数据,数据来源繁杂,数据格式多样,如果数据资源得不到良好的运用,这实质是一种资源浪费。就航班延误预测而言,对多种不可控因素的实时掌握以及精确预测的关键,在于对各种数据进行互联并及时处理。因而,选用大数据技术预测航班延误顺应了时代要求和科技发展趋势。
专利号为CN201910009733.4的发明中公开提供了一种基于贝叶斯估计的航班延误预测模型的建立方法,包括:对航班延误数据进行降维处理,并且使处理后的数据满足贝叶斯分类器的需求;将处理后数据的一部分作为训练集数据,以及将处理后数据的另一部分作为测试集数据;对训练集数据进行训练,以计算贝叶斯分类器所需的后验概率,建立航班延误预测模型;以及通过测试集数据对航班延误预测模型进行模型测试,通过航班延误预测模型判断测试集数据的分类,并且根据判断正确的数量来求得航班延误预测模型的准确度。该发明虽然采用贝叶斯分类器创建了航班延误预测模型,但仍存在以下几个问题:第一,模型的数据基础为降维处理后的航班延误数据,由说明书可知,是通过主成分分析法选取的航班延误数据中的关键参数特征,预测精度不高,第二,本发明是针对单个航班是否延误进行简单的二分类预测,或对单个航班的延误时长或延误等级进行确定性的单值预测,并没有结合机场整体进行考虑,对于机场的整体调度帮助较小,实用性低。第三,对临时出现的突发状况(例如突然出现的天气问题)应变能力低,导致在某些情形下,预测精度出现较大降幅。
发明内容
本发明目的在于提供一种基于贝叶斯网络算法的航班延误实时概率预测方法,依据大数据分析技术,对大规模航班运行等数据进行存储和处理,并基于增量式贝叶斯网络模型对机场每天单个航班的离港延误等级进行实时概率预测;提高航班延误预测精度,以便于及时向旅客发布延误预警通告和调整运行策略,降低由航班延误导致的各种不利影响;另外,立足机场整体调度,对每一天的每一个离港航班延误时长等级进行概率预测,即给出离港航班延误时长所属每个延误等级的概率值,为机场整体调度提供数据基础。
为达成上述目的,结合图1,本发明提出一种基于贝叶斯网络算法的航班延误实时概率预测方法,其特征在于,所述实时概率预测方法包括:
S1:基于大数据分析技术,结合航班历史运行数据,制定航班延误判定标准、分析延误波及对航班延误的影响、确定离港航班放行公平性;
S2:对延误特性进行分析,确定航班延误因素,基于贝叶斯网络创建航班延误动态预测模型,结合航班历史运行数据生成训练数据集,对创建的航班延误动态预测模型进行训练;
S3:采用基于时间序列的动态预测技术对本场横向波及衡量指标进行预测,基于Hive框架实现航班运行数据与机场天气数据的融合,得到最终航班延误预测值,生成预测集;
S4:利用训练得到的航班延误动态预测模型对预测集数据进行概率预测,采用概率最大原则得到各航班延误等级的预测值,所述航班延误等级根据离港航班延误时长划分得到。
进一步的实施例中,所述基于时间序列的动态预测方法包括以下步骤:
S31:对延误时间序列进行小波分解;
S32:利用得到的多组数据分别训练自回归滑动平均模型,对航班延误进行预测;
S33:对得到的多组预测结果进行小波重构,得到时间序列的预测结果;
S34:将时间序列的预测结果与航班延误影响因素输入到训练好的支持向量机模型中,得到最终航班延误预测值。
进一步的实施例中,所述离港航班放行公平性的衡量指标为:
其中,表示航空公司k的归一化延误时长比率;表示在放行公平条件下,航空公司k的归一化延误时长比率;A表示各航空公司集合;N表示航空公司的数量;Dk表示航空公司k所有离港航班的总延误时长;D表示各航空公司所有离港航班的总延误时长,即 表示航空公司k所有离港航班数量;NF表示所有离港航班数量;Dk'表示在放行公平条件下,航空公司k所有离港航班的总延误时长,即则
归一化指标αeq的取值介于0-1之间,αeq越接近1,机场放行公平性越高;αeq越接近0,机场放行公平性越低。
进一步的实施例中,步骤S2中,所述对延误特性进行分析是指,分别从日特性、月特性、航空公司特性、上一机场等级影响和离港公平性影响分析离港航班延误特性。
进一步的实施例中,步骤S2中,所述确定航班延误因素是指,从延误波及因素、航班自身因素、机场服务因素、天气因素和特殊事件因素五个方面分析确定影响离港航班延误的影响因素。
进一步的实施例中,所述延误波及因素是指,分别从横向波及和纵向波及两方面进行分析;其中,所述横向波及影响因素包括本场离港延误架次和本场离港平均延误时长,所述纵向波及影响因素包括上一站延误时长和上一机场的等级;
所述航班自身因素包括计划过站时间不足、航空公司的驻地优势、各航空公司的放行公平性、计划离港时段和计划进港时段、是否处于离港高峰期、是否为节假日、航班所在月份是否处于旺季或淡季;
所述机场服务因素包括机场规模、机场服务;
所述天气因素包括出发机场的天气状况、出发机场的风向和风速、到达机场的天气状况、到达机场的风向和风速;
所述特殊事件因素包括旅客原因、流量控制、军事演习、重大社会活动、或自然灾害在内的各类特殊事件。
进一步的实施例中,所述实时概率预测方法还包括:
将新产生的航班数据实时导入航班延误动态预测模型,以对航班延误动态预测模型的结构和参数进行实时更新。
以上本发明的技术方案,与现有相比,其显著的有益效果在于:
本发明研究对象的粒度小,既不是笼统的预测某一机场或某一航空公司的逐日或逐时平均延误时长或延误率,也不是针对单个航班是否延误进行简单的二分类预测,或对单个航班的延误时长或延误等级进行确定性的单值预测,而是对每一天的每一个离港航班延误时长等级进行概率预测,即给出离港航班延误时长所属每个延误等级的概率值。
同时,以大数据平台Hadoop和HDFS分布式存储为基础,运用航班延误动态预测模型对离港航班延误时长等级进行预测,预测精度高。
随着新航班数据的产生,采用增量式学习算法对航班延误动态预测模型的结构和参数进行实时更新,实现对离港航班延误时长等级的实时预测,对突发状况应对能力强。
采用流计算对实时获取的航班信息以及天气信息进行存储和计算,进一步提高了航班延误动态预测模型的预测精度和速度。
应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。另外,所要求保护的主题的所有组合都被视为本公开的发明主题的一部分。
结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面的描述中显见,或通过根据本发明教导的具体实施方式的实践中得知。
附图说明
附图不意在按比例绘制。在附图中,在各个图中示出的每个相同或近似相同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个组成部分均被标记。现在,将通过例子并参考附图来描述本发明的各个方面的实施例,其中:
图1是本发明的基于贝叶斯网络的航班延误实时概率预测方法的流程图。
图2是本发明的具体实施例一中航班延误预测值具体预测过程流程图。
图3是本发明的贝叶斯网络结构图。
图4是本发明的更新后的贝叶斯网络结构图。
具体实施方式
为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
具体实施例一
结合图1,本发明提及一种基于贝叶斯网络的航班延误实时概率预测方法,包括如下步骤:
(1)航班延误分析:对延误判定标准及延误波及进行分析,说明延误波及对航班延误的影响,并引入离港航班放行公平性衡量指标,包括以下步骤:
步骤1:延误判定标准:例如,进港延误航班是指晚于计划到港时间后15分钟到港的航班,离港延误航班是指在计划离港时间后15分钟之后离港的航班。并对离港航班延误时长进行延误等级的划分。
步骤2:延误波及分析:分析得出延误波及对航班延误的影响分为横向波及效应和纵向波及效应。
步骤3:离港航班放行公平性:考虑到机场对不同航空公司航班保障、服务水平的不同,通常情况下,机场在离港高峰期会对基地航空公司的航班选择优先放行。因此,从离港航班延误时长的角度,提出离港航班放行公平性指标,用于衡量各航空公司航班放行的差异水平。
步骤(1)用于对延误判定标准及延误波及进行分析,说明延误波及对航班延误的影响,其中对离港延误时长等级划分如表1所示。并引入离港航班放行公平性衡量指标,如下所示:
其中,表示航空公司k的归一化延误时长比率;表示在放行公平条件下,航空公司k的归一化延误时长比率;A表示各航空公司集合;N表示航空公司的数量;Dk表示航空公司k所有离港航班的总延误时长;D表示各航空公司所有离港航班的总延误时长,即 表示航空公司k所有离港航班数量;NF表示所有离港航班数量;Dk'表示在放行公平条件下,航空公司k所有离港航班的总延误时长,即则
归一化指标αeq的取值介于0-1之间,αeq越接近1,机场放行公平性越高;αeq越接近0,机场放行公平性越低。
表1离港延误等级划分标准
延误时长D/min | 延误类别 | 延误等级 |
D=0 | 未延误 | delay0 |
0<D≤15 | 低度延误 | delay1 |
15<D≤45 | 中度延误 | delay2 |
45<D | 高度延误 | delay3 |
(2)航班延误因素确定:通过分析航班延误特性,得出离港航班延误的主要影响因素,包括以下步骤:
步骤1:延误特性分析:分别从日特性、月特性、航空公司特性、上一机场等级影响和离港公平性影响分析离港航班延误特性。
步骤2:延误影响因素的确定:主要从延误波及因素、航班自身因素、机场服务因素、天气因素以及其他因素分析确定影响离港航班延误的影响因素。
步骤(2)用于确定航班延误因素,具体的,通过分析航班延误特性,得出离港航班延误的主要影响因素,其中部分离港航班延误因素如表2所示:
表2离港航班延误因素
(3)本场横向波及指标预测:提出一种基于时间序列的动态预测方法,实现对本场横向波及指标的预测,并基于Hive框架实现航班运行数据与机场天气数据的融合;
由于航班延误问题的复杂性和随机性,使得航班延误时间序列呈现出非平稳的特性。因此,采用小波分解技术,利用其多分辨率的特性,对航班延误时间序列进行尺度为2的离散小波分解,使得时间序列平稳化。然后利用分解得到的3组数据分别训练自回归滑动平均模型,并对航班延误进行预测。对得到的3组预测结果进行小波重构,得到时间序列的预测结果。最后,将时间序列预测结果与航班延误影响因素输入到训练好的支持向量机模型中,得到最终航班延误预测值。具体预测过程如图2所示。其中,train为训练集,predict为时间序列预测结果,result为模型的最终预测结果,D1、D2、S2为小波分解得到的3组数据。
(4)预测结果分析:采用增量式贝叶斯网络模型,对单个航班的离港延误时长等级进行实时概率预测。
而步骤(4)利用训练数据集训练得到贝叶斯网络模型的结构和参数,实现对单个航班延误时长等级进行概率预测。随着新航班数据的产生,利用新产生的航班数据对贝叶斯网络模型的结构和参数进行实时更新,以克服外界环境的变化导致模型预测精度降低的问题,即采用增量式贝叶斯网络模型实现对航班延误时长等级实时概率的精准预测。
具体实施例二
下面通过某一个机场的航班延误预测实例对前述实时概率预测方法做进一步的说明。
实例数据选用2017年1月-2019年4月9日11:00航班数据作为训练集,2019年4月9日11:00-16:00数据作为新数据集,对贝叶斯网络模型的结构和参数进行更新,并选用当日计划离港时间为16:00-17:00的航班数据作为预测集,总数据量达43万多条航班数据。
介于用于本实验的航班运行数据规模较大,因此本发明选用基于打分-搜索的贝叶斯网络结构学习方法,并以高效率和准确性著称的K2算法为主,评定指标为得分越低网络结构越能充分体现数据的关联性,所得到的贝叶斯网络结构如图3所示,其网络各节点名称及其含义如表3所示。
表3贝叶斯网络各节点含义
节点名称 | 节点含义 | 节点名称 | 节点含义 |
delay | 离港延误等级 | peak | 是否处于离港高峰期 |
delaylast | 上一站延误等级 | number | 本场离港延误架次 |
rank | 上一机场等级 | duration | 本场离港平均延误时长 |
holiday | 是否为节假日 | STD/STA | 计划离港时段;计划进港时段 |
buffertime | 计划过站时间不足 | weatherD | 出发机场天气状况 |
base | 航空公司驻地优势 | windD | 出发机场风向、风速 |
fair | 航班放行公平性 | weatherA | 到达机场天气状况 |
month | 月份 | windA | 到达机场风向、风速 |
采用假设检验方法对上述贝叶斯网络结构中各条弧进行条件独立性检验,检验结果如表4所示。由检验结果可知,贝叶斯网络各条弧对应的条件独立性检验p值均远小于预定阈值0.05,说明该网络结构可信。
表4网络结构中各条弧的条件独立性检验值
贝叶斯网络参数学习是指在已知贝叶斯网络结构的情况下,对其网络中各节点与其父节点之间的的条件概率分布进行学习。介于该网络节点个数较多以及文章长度的限制,只列出该网络中部分节点的条件概率分布结果,对其余节点对应的条件概率分布不做一一讨论。其中,当起飞机场天气变量分别取值为weatherD=weatherD0,windD=windD0时,不同机场等级对应的上一站延误等级概率分布如表5所示。
表5部分节点的参数学习结果
rank1 | rank2 | rank3 | |
delay0 | 0.76424315 | 0.78339676 | 0.81798974 |
delay1 | 0.06066746 | 0.5767732 | 0.04883202 |
delay2 | 0.06674613 | 0.05909098 | 0.04930681 |
delay3 | 0.10834327 | 0.9983495 | 0.8387143 |
利用训练得到的贝叶斯网络模型对预测集数据进行概率预测,预测结果见表6。并采用概率最大原则得到各航班延误等级的预测值,其预测结果的混淆矩阵如表7所示。
表6贝叶斯网络模型更新前的概率预测结果
表7预测结果混淆矩阵
delay0 | delay1 | delay2 | delay3 | |
delay0 | 0 | 0 | 0 | 0 |
delay1 | 0 | 0 | 0 | 0 |
delay2 | 1 | 1 | 2 | 0 |
delay3 | 7 | 4 | 6 | 45 |
由表7可得,该贝叶斯网络模型的预测精度为71.21%,导致预测精度较低的原因主要在于某机场所在地区当天天气的影响。当天下午1点左右,机场所在城市自西向东逐渐发生雷电,并伴有一小时20毫米左右的短时强降水。受雷暴云团的影响,机场及其附近出现8-9级的大风。受恶劣天气的影响,某机场通行能力下降40%左右,截止到下午17:10,某机场和这个城市另一机场全天累积延误进离港航班440余架次,取消进离港航班170余架次。以此分析得到,由最初训练集得到的贝叶斯网络预测模型,无法较好预测存在天气极端恶劣等随机因素情况下航班延误等级,因此需对原贝叶斯网络模型进行结构和参数的更新。
本实验选用当天11:00-16:00航班数据作为新数据集,进行增量式贝叶斯网络模型的结构和参数进行更新,所得到的贝叶斯网络如图4所示,该网络结构同更新前的结构相同。介于该网络复杂性,各节点条件概率此处不一一列举。
利用新得到的预测模型重新对预测集进行延误时长等级的概率预测,结果如表8所示。同样采用概率最大原则得到各航班延误等级的预测值,其预测结果的混淆矩阵如表9所示。
表8贝叶斯网络模型更新后的概率预测结果
表9预测结果混淆矩阵
delay0 | delay1 | delay2 | delay3 | |
delay0 | 0 | 0 | 0 | 0 |
delay1 | 0 | 0 | 0 | 0 |
delay2 | 0 | 1 | 3 | 0 |
delay3 | 1 | 4 | 4 | 53 |
由表9可知,更新后的贝叶斯网络模型的预测精度约为84.85%,较未更新模型的预测精度提升9%左右。由此得到,对增量式贝叶斯网络预测模型进行结构和参数的更新有助于提升模型的预测精度,特别地当出现天气极端恶劣等随机因素情况下,增量式贝叶斯网络模型更新对于航班延误预测尤为重要。
该研究成果在一定程度上可用于机场运行控制人员监控机场拥挤程度,预测未来时刻航班延误情况,为采取适当的资源调度方案等提供参考,以帮助机场及时发布延误预警信息,调整机场运行调度策略和减少航班延误的发生。
在本公开中参照附图来描述本发明的各方面,附图中示出了许多说明的实施例。本公开的实施例不必定义在包括本发明的所有方面。应当理解,上面介绍的多种构思和实施例,以及下面更加详细地描述的那些构思和实施方式可以以很多方式中任意一种来实施,这是因为本发明所公开的构思和实施例并不限于任何实施方式。另外,本发明公开的一些方面可以单独使用,或者与本发明公开的其他方面的任何适当组合来使用。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。
Claims (7)
1.一种基于贝叶斯网络算法的航班延误实时概率预测方法,其特征在于,所述实时概率预测方法包括:
S1:基于大数据分析技术,结合航班历史运行数据,制定航班延误判定标准、分析延误波及对航班延误的影响、确定离港航班放行公平性;
S2:对延误特性进行分析,确定航班延误因素,基于贝叶斯网络创建航班延误动态预测模型,结合航班历史运行数据生成训练数据集,对创建的航班延误动态预测模型进行训练;
S3:采用基于时间序列的动态预测技术对本场横向波及衡量指标进行预测,基于Hive框架实现航班运行数据与机场天气数据的融合,得到最终航班延误预测值,生成预测集;
S4:利用训练得到的航班延误动态预测模型对预测集数据进行概率预测,采用概率最大原则得到各航班延误等级的预测值,所述航班延误等级根据离港航班延误时长划分得到。
2.根据权利要求1所述的基于贝叶斯网络算法的航班延误实时概率预测方法,其特征在于,所述基于时间序列的动态预测方法包括以下步骤:
S31:对延误时间序列进行小波分解;
S32:利用得到的多组数据分别训练自回归滑动平均模型,对航班延误进行预测;
S33:对得到的多组预测结果进行小波重构,得到时间序列的预测结果;
S34:将时间序列的预测结果与航班延误影响因素输入到训练好的支持向量机模型中,得到最终航班延误预测值。
4.根据权利要求1所述的基于贝叶斯网络算法的航班延误实时概率预测方法,其特征在于,步骤S2中,所述对延误特性进行分析是指,分别从日特性、月特性、航空公司特性、上一机场等级影响和离港公平性影响分析离港航班延误特性。
5.根据权利要求1所述的基于贝叶斯网络算法的航班延误实时概率预测方法,其特征在于,步骤S2中,所述确定航班延误因素是指,从延误波及因素、航班自身因素、机场服务因素、天气因素和特殊事件因素五个方面分析确定影响离港航班延误的影响因素。
6.根据权利要求1所述的基于贝叶斯网络算法的航班延误实时概率预测方法,其特征在于,所述延误波及因素是指,分别从横向波及和纵向波及两方面进行分析;其中,所述横向波及影响因素包括本场离港延误架次和本场离港平均延误时长,所述纵向波及影响因素包括上一站延误时长和上一机场的等级;
所述航班自身因素包括计划过站时间不足、航空公司的驻地优势、各航空公司的放行公平性、计划离港时段和计划进港时段、是否处于离港高峰期、是否为节假日、航班所在月份是否处于旺季或淡季;
所述机场服务因素包括机场规模、机场服务;
所述天气因素包括出发机场的天气状况、出发机场的风向和风速、到达机场的天气状况、到达机场的风向和风速;
所述特殊事件因素包括旅客原因、流量控制、军事演习、重大社会活动、或自然灾害在内的各类特殊事件。
7.根据权利要求1所述的基于贝叶斯网络算法的航班延误实时概率预测方法,其特征在于,所述实时概率预测方法还包括:
将新产生的航班数据实时导入航班延误动态预测模型,以对航班延误动态预测模型的结构和参数进行实时更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911316177.1A CN111144631B (zh) | 2019-12-19 | 2019-12-19 | 基于贝叶斯网络算法的航班延误实时概率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911316177.1A CN111144631B (zh) | 2019-12-19 | 2019-12-19 | 基于贝叶斯网络算法的航班延误实时概率预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111144631A true CN111144631A (zh) | 2020-05-12 |
CN111144631B CN111144631B (zh) | 2023-07-25 |
Family
ID=70518887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911316177.1A Active CN111144631B (zh) | 2019-12-19 | 2019-12-19 | 基于贝叶斯网络算法的航班延误实时概率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111144631B (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111695694A (zh) * | 2020-05-25 | 2020-09-22 | 南京航空航天大学 | 一种基于机器学习预测的战略性航班时刻表评估方法 |
CN111814257A (zh) * | 2020-07-20 | 2020-10-23 | 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) | 民用飞机的运营可靠度分析方法、系统及电子设备 |
CN112182059A (zh) * | 2020-08-20 | 2021-01-05 | 北京航空航天大学 | 一种航班延误特性的高阶分析方法 |
CN112232553A (zh) * | 2020-09-27 | 2021-01-15 | 同济大学 | 一种基于贝叶斯网络的高铁列车晚点影响因素诊断方法 |
CN112580204A (zh) * | 2020-12-16 | 2021-03-30 | 同济大学 | 一种铁路区间非正常事件下的列车延误时间预测方法 |
CN112801421A (zh) * | 2021-03-18 | 2021-05-14 | 瑞涯科技(上海)股份有限公司 | 一种基于概率论的飞机航班准点率的预测方法 |
CN113449915A (zh) * | 2021-06-28 | 2021-09-28 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的航班延误预测方法 |
US20210350278A1 (en) * | 2020-05-06 | 2021-11-11 | Tata Consultancy Services Limited | Method and system for minimizing passenger misconnects in airline operations through learning |
CN114493053A (zh) * | 2022-04-18 | 2022-05-13 | 北京航空航天大学 | 一种基于双阶段回归的航空网络波及效应推断方法 |
CN115062899A (zh) * | 2022-05-07 | 2022-09-16 | 南京航空航天大学 | 一种面向航空公司的空中交通延误分配公平性指标计算方法 |
CN116362430A (zh) * | 2023-06-02 | 2023-06-30 | 中国民航大学 | 一种基于在线增量mhha-sru航班延误预测方法及系统 |
CN116468186A (zh) * | 2023-06-14 | 2023-07-21 | 中国民航大学 | 一种航班链延误时间预测方法、电子设备及存储介质 |
CN117033935A (zh) * | 2023-08-03 | 2023-11-10 | 北京市市政工程设计研究总院有限公司广东分院 | 基于贝叶斯融合的统计与监测下的场降雨特征的预测方法 |
CN118095574A (zh) * | 2024-04-23 | 2024-05-28 | 中国民航大学 | 一种基于航班链的航班过站时间预测方法、介质及设备 |
CN118114576A (zh) * | 2024-01-19 | 2024-05-31 | 中国民用航空总局第二研究所 | 基于Nataf变换独立性检验的航班延误图模型检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060085164A1 (en) * | 2004-10-05 | 2006-04-20 | Leyton Stephen M | Forecast decision system and method |
US20120316845A1 (en) * | 2011-06-09 | 2012-12-13 | Pulsar Informatics, Inc. | Systems and Methods for Distributed Calculation of Fatigue-Risk Prediction and Optimization |
CN109961085A (zh) * | 2019-01-05 | 2019-07-02 | 苏咸宁 | 基于贝叶斯估计的航班延误预测模型的建立方法及装置 |
-
2019
- 2019-12-19 CN CN201911316177.1A patent/CN111144631B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060085164A1 (en) * | 2004-10-05 | 2006-04-20 | Leyton Stephen M | Forecast decision system and method |
US20120316845A1 (en) * | 2011-06-09 | 2012-12-13 | Pulsar Informatics, Inc. | Systems and Methods for Distributed Calculation of Fatigue-Risk Prediction and Optimization |
CN109961085A (zh) * | 2019-01-05 | 2019-07-02 | 苏咸宁 | 基于贝叶斯估计的航班延误预测模型的建立方法及装置 |
Non-Patent Citations (1)
Title |
---|
YI LIU AND MARK HANSEN, pages 56 - 57 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11977966B2 (en) * | 2020-05-06 | 2024-05-07 | Tata Consultancy Services Limited | Method and system for minimizing passenger misconnects in airline operations through learning |
US20210350278A1 (en) * | 2020-05-06 | 2021-11-11 | Tata Consultancy Services Limited | Method and system for minimizing passenger misconnects in airline operations through learning |
CN111695694A (zh) * | 2020-05-25 | 2020-09-22 | 南京航空航天大学 | 一种基于机器学习预测的战略性航班时刻表评估方法 |
CN111814257A (zh) * | 2020-07-20 | 2020-10-23 | 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) | 民用飞机的运营可靠度分析方法、系统及电子设备 |
CN111814257B (zh) * | 2020-07-20 | 2021-07-30 | 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) | 民用飞机的运营可靠度分析方法、系统及电子设备 |
CN112182059A (zh) * | 2020-08-20 | 2021-01-05 | 北京航空航天大学 | 一种航班延误特性的高阶分析方法 |
CN112182059B (zh) * | 2020-08-20 | 2022-05-27 | 北京航空航天大学 | 一种航班延误特性的高阶分析方法 |
CN112232553B (zh) * | 2020-09-27 | 2023-04-07 | 同济大学 | 一种基于贝叶斯网络的高铁列车晚点影响因素诊断方法 |
CN112232553A (zh) * | 2020-09-27 | 2021-01-15 | 同济大学 | 一种基于贝叶斯网络的高铁列车晚点影响因素诊断方法 |
CN112580204A (zh) * | 2020-12-16 | 2021-03-30 | 同济大学 | 一种铁路区间非正常事件下的列车延误时间预测方法 |
CN112801421A (zh) * | 2021-03-18 | 2021-05-14 | 瑞涯科技(上海)股份有限公司 | 一种基于概率论的飞机航班准点率的预测方法 |
CN113449915B (zh) * | 2021-06-28 | 2023-10-27 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的航班延误预测方法 |
CN113449915A (zh) * | 2021-06-28 | 2021-09-28 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的航班延误预测方法 |
CN114493053B (zh) * | 2022-04-18 | 2022-07-08 | 北京航空航天大学 | 一种基于双阶段回归的航空网络波及效应推断方法 |
CN114493053A (zh) * | 2022-04-18 | 2022-05-13 | 北京航空航天大学 | 一种基于双阶段回归的航空网络波及效应推断方法 |
CN115062899A (zh) * | 2022-05-07 | 2022-09-16 | 南京航空航天大学 | 一种面向航空公司的空中交通延误分配公平性指标计算方法 |
CN116362430A (zh) * | 2023-06-02 | 2023-06-30 | 中国民航大学 | 一种基于在线增量mhha-sru航班延误预测方法及系统 |
CN116362430B (zh) * | 2023-06-02 | 2023-08-01 | 中国民航大学 | 一种基于在线增量mhha-sru航班延误预测方法及系统 |
CN116468186A (zh) * | 2023-06-14 | 2023-07-21 | 中国民航大学 | 一种航班链延误时间预测方法、电子设备及存储介质 |
CN116468186B (zh) * | 2023-06-14 | 2023-08-25 | 中国民航大学 | 一种航班链延误时间预测方法、电子设备及存储介质 |
CN117033935A (zh) * | 2023-08-03 | 2023-11-10 | 北京市市政工程设计研究总院有限公司广东分院 | 基于贝叶斯融合的统计与监测下的场降雨特征的预测方法 |
CN117033935B (zh) * | 2023-08-03 | 2024-02-23 | 北京市市政工程设计研究总院有限公司 | 基于贝叶斯融合的统计与监测下的场降雨特征的预测方法 |
CN118114576A (zh) * | 2024-01-19 | 2024-05-31 | 中国民用航空总局第二研究所 | 基于Nataf变换独立性检验的航班延误图模型检测方法 |
CN118095574A (zh) * | 2024-04-23 | 2024-05-28 | 中国民航大学 | 一种基于航班链的航班过站时间预测方法、介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111144631B (zh) | 2023-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111144631A (zh) | 基于贝叶斯网络算法的航班延误实时概率预测方法 | |
CN111488896B (zh) | 一种基于多源数据挖掘的配电线路时变故障概率计算方法 | |
CN103971175B (zh) | 一种多级变电站的短期负荷预测方法 | |
Mao et al. | A novel short-term wind speed prediction based on MFEC | |
CN104156594A (zh) | 一种基于贝叶斯网的航班过站时间动态估计方法 | |
CN111415049A (zh) | 一种基于神经网络及聚类的停电敏感性分析方法 | |
CN104143170A (zh) | 低空救援空中交通调度指挥系统及其调度指挥方法 | |
Li | Analysis and Forecast of Global Civil Aviation Accidents for the Period 1942‐2016 | |
CN106779222A (zh) | 机场地面等待时间预测方法及装置 | |
Guo et al. | A new approach for interval forecasting of photovoltaic power based on generalized weather classification | |
CN104915727A (zh) | 多维度同构异质bp神经网络光功率超短期预测方法 | |
Jiao | A hybrid forecasting method for wind speed | |
Liu et al. | Advanced evaluation method for regional wind power prediction | |
Shao et al. | Air transportation delay propagation analysis with uncertainty in coloured–timed Petri nets | |
Bongo et al. | A hybrid fuzzy multi-criteria decision-making approach for mitigating air traffic congestion | |
Cheng et al. | Risk management using big real time data | |
Dillon et al. | Impact of uncertainty on wind power curtailment estimation | |
Jiang et al. | A multi-index prediction method for flight delay based on long short-term memory network model | |
Cheng | Estimation of flight delay using weighted Spline combined with ARIMA model | |
Citroen et al. | Moroccan long term electricity demand forecasting using Wavelet neural Networks | |
Vallejo et al. | Genetic algorithm applied to the specialization of neural networks for the forecast of wind and solar generation | |
Dursun | Air-traffic flow prediction with deep learning: a case study for Diyarbakır airport | |
Bao-yu et al. | Research on prediction of short-term passenger flow of urban rail transit based on deep neural network | |
Bâra et al. | Comparative analysis between wind and solar forecasting methods using artificial neural networks | |
John et al. | Spatial Hierarchical Wind Power Forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |