CN112819260B - 预测航班延时状态的数据处理系统 - Google Patents

预测航班延时状态的数据处理系统 Download PDF

Info

Publication number
CN112819260B
CN112819260B CN202110408424.1A CN202110408424A CN112819260B CN 112819260 B CN112819260 B CN 112819260B CN 202110408424 A CN202110408424 A CN 202110408424A CN 112819260 B CN112819260 B CN 112819260B
Authority
CN
China
Prior art keywords
flight
predicted
delay
prediction
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110408424.1A
Other languages
English (en)
Other versions
CN112819260A (zh
Inventor
卞磊
张宪
于淇
姚远
王殿胜
唐红武
薄满辉
翁剑英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Travelsky Mobile Technology Co Ltd
Original Assignee
China Travelsky Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Travelsky Mobile Technology Co Ltd filed Critical China Travelsky Mobile Technology Co Ltd
Priority to CN202110408424.1A priority Critical patent/CN112819260B/zh
Publication of CN112819260A publication Critical patent/CN112819260A/zh
Application granted granted Critical
Publication of CN112819260B publication Critical patent/CN112819260B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及一种预测航班延时状态的数据处理系统,包括第一数据库、第二数据库、预测模型库、存储有计算机程序的存储器和处理器;所述第一数据库用于存储航班信息记录;所述第二数据库用于存储机场气象信息记录;所述预测模型库中用于存储预先训练好的第二预测模型、第三预测模型…第N预测模型,其中,第n预测模型用于预测第n预测航班id的延时状态,n的取值为2到N。本发明能够将航班链上的延时传导因素作为影响因素来预测航班延时状态,提高了航班延时预测的准确性。

Description

预测航班延时状态的数据处理系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种预测航班延时状态的数据处理系统。
背景技术
近年来,航班运输量大幅增长,形成了繁忙和复杂的航班运输网络,时常由于多种原因素造成了大量的航班延时,即航班延误。对航班延时的有效预测可以给航空公司、机场及相关单位提供预警,为制定减缓航班延误措施赢得时间。航班延时的影响因素主要包括气象数据以及延时传导,延时传导是指航班延时不只是考虑该航班自身的因素以及直接相关的因素,还包括间接相关的因素,主要体现在该航班所在航班链上的之前航班的影响,比如前序航班因为某些因素延时,前序航班的延时会影响当前航班的起飞时间。但是,现有的预测航班延时的技术并未将延时传导因素考虑在内,因此,导致航班延时预测准确率低。
发明内容
本发明目的在于,提供一种预测航班延时状态的数据处理系统,提高了航班延时预测的准确性。
根据本发明一方面,提供了一种预测航班延时状态的数据处理系统,包括第一数据库、第二数据库、预测模型库、存储有计算机程序的存储器和处理器;所述第一数据库用于存储航班信息记录;所述第二数据库用于存储机场气象信息记录;所述预测模型库中用于存储预先训练好的第二预测模型、第三预测模型…第N预测模型,其中,第n预测模型用于预测第n预测航班id的延时状态,n的取值为2到N;
所述处理器执行所述计算机程序时,实现以下步骤:
步骤S1、实时获取计划起飞时间变更的航班id,将该航班id确定为当前需要预测的第一预测航班id,并获取所述第一预测航班id所在航班链上计划起飞时间晚于所述第一预测航班id的第二预测航班id、第三预测航班id…第M预测航班id,M大于等于2,所述航班链为预设周期内同一注册号对应的航班id按照计划起飞时间先后组成的航班id序列;
步骤S2、将M与N比较,若M小于等于N,则执行步骤S3,若M大于N,则执行步骤S4;
步骤S3、基于所述第一数据库和第二数据库分别构建第一预测航班id至第M预测航班id对应的预测特征数据,基于第一预测航班id至第m预测航班id对应的预测特征数据,拼接构建用于预测第m预测航班id延时状态的第m输入特征数据,将所述第m输入特征数据输入第m预测模型中,生成到第m预测航班id延时状态预测结果,m取值为2到M,结束流程;
步骤S4、基于所述第一数据库和第二数据库分别构建第一预测航班id至第N预测航班id对应的预测特征数据,基于第一预测航班id至第m预测航班id对应的预测特征数据,构建用于预测第m预测航班id延时状态的第m输入特征数据,将所述第m输入特征数据输入第m预测模型中,生成到第m预测航班id延时状态预测结果,m取值为2到N,基于历史数据预测第N+1预测航班id至第M预测航班id的延时状态。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种预测航班延时状态的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
本发明能够将航班链上的延时传导因素作为影响因素来预测航班延时状态,提高了航班延时预测的准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1为本发明实施例提供的预测航班延时状态的数据处理系统示意图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种预测航班延时状态的数据处理系统的具体实施方式及其功效,详细说明如后。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
本发实施例提供了一种预测航班延时状态的数据处理系统,如图1所示,包括第一数据库、第二数据库、预测模型库、存储有计算机程序的存储器和处理器;所述第一数据库用于存储航班信息记录;所述第二数据库用于存储机场气象信息记录;所述预测模型库中用于存储预先训练好的第二预测模型、第三预测模型…第N预测模型,其中,第n预测模型用于预测第n预测航班id的延时状态,n的取值为2到N;所述处理器执行所述计算机程序时,实现以下步骤:
步骤S1、实时获取计划起飞时间变更的航班id,将该航班id确定为当前需要预测的第一预测航班id,并获取所述第一预测航班id所在航班链上计划起飞时间晚于所述第一预测航班id的第二预测航班id、第三预测航班id…第M预测航班id,M大于等于2,所述航班链为预设周期内同一注册号对应的航班id按照计划起飞时间先后组成的航班id序列;
作为一种优选实施例,预测周期为一天,具体为一天内的0时到24时。
步骤S2、将M与N比较,若M小于等于N,则执行步骤S3,若M大于N,则执行步骤S4;
步骤S3、基于所述第一数据库和第二数据库分别构建第一预测航班id至第M预测航班id对应的预测特征数据,基于第一预测航班id至第m预测航班id对应的预测特征数据,拼接构建用于预测第m预测航班id延时状态的第m输入特征数据,将所述第m输入特征数据输入第m预测模型中,生成到第m预测航班id延时状态预测结果,m取值为2到M,结束流程;
步骤S4、基于所述第一数据库和第二数据库分别构建第一预测航班id至第N预测航班id对应的预测特征数据,基于第一预测航班id至第m预测航班id对应的预测特征数据,构建用于预测第m预测航班id延时状态的第m输入特征数据,将所述第m输入特征数据输入第m预测模型中,生成到第m预测航班id延时状态预测结果,m取值为2到N,基于历史数据预测第N+1预测航班id至第M预测航班id的延时状态。
需要说明的是,当第一预测航班id延时,对第一预测航班id后续N-1个以内航班的延时传导作用比较大,再后边的航班,由于间隔时间较长,中间不确定因素较多,延迟传导作用小,直接采用预测模型会导致预测不准确,因此,对第N预测航班id及之前的预测航班id可采用预设的预测模型来预测延时状态该,对第N+1预测航班id至第M预测航班id可以采用历史数据来预测延时状态。
本发明实施例能够将航班链上的延时传导因素作为影响因素来预测航班延时状态,提高了航班延时预测的准确性。
作为一种实施例,所述航班信息记录包括预测航班id、出发机场id、到达机场id、注册号、计划起飞时间、预计起飞时间、实际起飞时间和航班取消信息字段,计划起飞时间为最初计划的起飞时间,后续随着各种因素的影响,更新预计起飞时间,所述计划起飞时间的初始值和预计起飞时间的初始值相同,所述预计起飞时间动态更新,可以理解的是,实际起飞时间初始值为0,当航班实际起飞时,再在对应记录中更新对应的实际起飞时间字段。所述气象信息记录的字段包括机场id、气象类型、能见度、风速和更新时间字段,作为示例,气象信息可以每间隔一个小时更新上传一次,气象类型信息具体包括晴、暴雨、雪等。所述预测特征数据具体可包括预测航班id所对应的出发机场id的航班取消率、航班积压率以及航班延误率,气象数据特征,起飞时间特征,日期时间特征和航班链对应的第一预测航班id的延时时长标签,其中,起飞时间特征具体可包括第一预测航班id的预计起飞时间或实际起飞时间,第二预测航班id至第m预测航班id的计划起飞时间,可以理解的是,当第一预测航班id中的实际起飞时间不为0时,则起飞时间特征中对应的是第一预测航班id中的实际起飞时间,否则,对应为预计起飞时间。
为了提高延时状态的准确率,本发明实施例根据延时时间长短划分不同的延时等级,从而对应不同的延时状态,通过预测处于不同延时状态的概率,对航班延时进行预测,作为一种实施例,所述系统包括K个航班延时标签,第一标签表示航班延时W分钟以内的状态,第二标签表示航班延时W分钟至2*W分钟的状态…第K-1标签表示航班延时(K-1)*W至K*W分钟的状态,第K标签表示航班延时K*W分钟以上的状态。作为一种优选实施例,K可取值为7,W取值为30分钟,则可将航班延时在30分钟以下、30-60分钟、60-90分钟、90-120分钟、120-150分钟、150-180分钟以及180分钟以上分别用0至6的类别变量来表示,具体如表1所示。
Figure DEST_PATH_IMAGE001
作为一种实施例,所述步骤S3和步骤S4中,基于第一预测航班id至第m预测航班id对应的预测特征数据,拼接构建用于预测第m预测航班id延时状态的第m输入特征数据,可包括:
步骤S10、基于第一预测航班id至第m预测航班id对应的预测特征数据构建用于预测第n样本航班id延时状态的样本变量集
Figure DEST_PATH_IMAGE002
作为所述第m输入特征数据,其中,
Figure DEST_PATH_IMAGE003
分别表示第i预测航班id所对应的出发机场id的航班取消率、航班积压率以及航班延误率经离散分类化处理后的属性值,i的取值为1到m。以航班取消率为例,例如所有航班取消率范围在0-0.2之间,其中0.5分位点是0.05,0.75分位点是0.15,那就把航班取消率分成三类,取消率小于0.05时,取消率属性值为0,取消率是0.1时,令取消率属性值为1,取消率是0.17时,取消率属性值2,这样即可对航班取消率进行离散化,航班取消率、航班积压率也采用相同的方式离散化处理,在此不再赘述。
Figure DEST_PATH_IMAGE004
表示第一预测航班id延时时长标签变量、
Figure DEST_PATH_IMAGE005
表示第i预测航班id的气象数据特征属性值、
Figure DEST_PATH_IMAGE006
表示第一预测航班id的预计起飞时间或实际起飞时间以及第二预测航班id至第m预测航班id的计划起飞时间变量、
Figure DEST_PATH_IMAGE007
表示航班链对应的当前日期变量,航班链对应的当前日期变量具体包括对应周期所属的月份、季度和工作日/周末属性,工作日/周末属性具体为周几。
作为一种实施例,所述步骤S10包括:
步骤S101、获取第i预测航班id对应的出发机场id的延误概率:
所述第i预测航班id对应的出发机场id的延误概率为出发机场id在当前时间周期起点时刻到监测确定第一预测航班id的时刻的预测时间范围内,所涉及的航班分别处于延时W分钟至2*W分钟的状态…第K-1标签表示航班延时(K-1)*W至K*W分钟的状态,第K标签表示航班延时K*W分钟以上的状态的延误概率,Pik表示第i预测航班id对应的出发机场id在所述预测时间范围内航班延时对应第k航班延时标签的概率:
Figure DEST_PATH_IMAGE008
其中,
Figure DEST_PATH_IMAGE009
表示所述预测时间范围内第i预测航班id对应的出发机场id已经起飞的样本航班id延时时长对应第k航班延时标签的数量,
Figure DEST_PATH_IMAGE010
表示所述预测时间范围内第i预测航班id对应的出发机场id未起飞预测航班id当前预计起飞时刻与计划起飞时刻差值时长对应第k航班延时标签的数量,
Figure DEST_PATH_IMAGE011
表示所述预测时间范围内第i预测航班id对应的出发机场id原始计划起飞的航班数量,以周期为1天,从一天的0时到24时为例,所述预测时间范围为0时到监测确定第一预测航班id的时刻之间的时间段。
作为一种实施例,所述步骤S10包括:
步骤S102、获取第i预测航班id对应的出发机场id的航班取消率:
所述第i预测航班id对应的出发机场id的航班取消率包括出发机场id在当前时间周期起点时刻到监测确定第一预测航班id的时刻的预测时间范围内取消航班的概率Pix和监测确定第一样本航班id的时刻的前Q小时时间范围内消航班的概率Piy。
可以理解的是,Pix可以通过出发机场id在预测时间范围内取消航班的数量除以所述预测时间范围内出发机场id原始计划起飞的航班数量来计算得到;Piy可以通过出发机场id在监测确定第一样本航班id的时刻的前Q小时时间范围内消航班的数量除以所述预测时间范围内出发机场id原始计划起飞的航班数量来计算得到,作为一种优选示例,Q取值为1。航班积压率可以根据预测时间范围积压航班的数量除以所述预测时间范围内出发机场id原始计划起飞的航班数量来计算得到,预测时间范围积压航班的数量指的是原计划在所述预测时间范围内起飞但实际未起飞的航班数量。
作为一种实施例,所述步骤S10中,如果第一预测航班id为预设周期内对应出发机场的首发航班,则获取当前机场前Q小时的延时概率分布作为第一预测航班id延时概率分布,Q可取值为1。所述系统中可以实时存储历史延误分布概率,这样可直接从系统中获取当前机场前Q小时的延时概率分布,具体算法步骤S101中的算法相同,在此不再赘述。
作为一种实施例,所述步骤S10还包括:
步骤S13、获取航班id的气象数据特征,基于航班id的气象数据特征生成对应的航班id的气象数据特征属性值,具体包括:
步骤S113、获取航班id计划起飞时刻对应的气象类型描述信息,能见度信息和风速信息;
步骤S123、根据预设的气象类型编码映射表将气象类型描述信息转换为对应气象类型编码值
Figure DEST_PATH_IMAGE012
其中,气象类型编码映射表可包括7种气象类型信息,
Figure 662922DEST_PATH_IMAGE012
的值为1到7,气象类型与编码值一一映射,且气象类型有大小关系。
步骤S133、根据预设的能见度编码映射表将能见度信息转换为对应的能见度编码值
Figure DEST_PATH_IMAGE013
其中,能见度编码映射表表示原始能见度数值与能见度编码值
Figure 790147DEST_PATH_IMAGE013
的映射关系,
Figure 844690DEST_PATH_IMAGE013
取值为0到2,且能见度之间有大小关系。
步骤S143、根据预设的风速编码映射表将风速信息转换为对应的风速编码值
Figure DEST_PATH_IMAGE014
其中,风速编码映射表用于表示原始风速值与风速编码值
Figure 369475DEST_PATH_IMAGE014
的映射关系,
Figure 876679DEST_PATH_IMAGE014
的取值为为0到2,且风速之间有大小关系。
步骤S153、基于气象特征综合编码
Figure DEST_PATH_IMAGE015
和预设的综合编码映射表获取气象特征综合编码值
Figure DEST_PATH_IMAGE016
根据气象类型、能见度及风速的编码综合组合成新的气象特征综合编码,
Figure 451272DEST_PATH_IMAGE016
的值为0到2,综合编码间有大小关系。
步骤S163、基于航班id对应的
Figure DEST_PATH_IMAGE017
生成对应的航班id的气象数据特征属性值。
样本变量集涉及的特征取值如表2所示示例:
Figure DEST_PATH_IMAGE018
表2
作为一种实施例,所述系统还包括样本数据库,所述样本数据库用于训练得到第n预测模型,所述处理器执行所述计算机程序时,还实现以下步骤:
步骤S10、训练得到第n预测模型,n的取值为2到N,具体包括:
当n取不同数值时,第一预测航班id到第n预测航班id之间的航段数不同,第一预测航班id到第n预测航班id之间的航段数不同的每种情况下,建立对应的第n预测模型。
步骤S101、基于样本数据库构建样本航班id的预测特征数据;
步骤S102、基于第一样本航班id至第n样本航班id的预测特征数据拼接构建用于预测第n样本航班id延时状态的样本变量集;
步骤S103、将第n样本航班id延时状态的样本变量集作为因,将第n样本航班id对应的航班延时标签的实际分类概率值作为果,建立第n贝叶斯网络模型进行训练,得到第n预测模型。
预测模型可表示为:
Figure DEST_PATH_IMAGE019
上式
Figure DEST_PATH_IMAGE020
表示根据训练得到的贝叶斯模型预测的在条件X下的航班时频率。
需要说明的是,一般的机器学习方法对于离散变量只能进行分类预测,多维属性的概率推理实现较为困难,而贝叶斯网络能够基于先验条件构建变量与延误时长的条件依赖关系,推理得出条件概率下的延误时长的分布概率。因此,本发明实施例将航班id对应的的多维特征的属性值的组合视为航班id的先验条件,计算航班延时的条件概率。贝叶斯网络是一种对概率关系的有向图解描述,适用于表达和分析不确定性和概率性事物,应用于有条件地依赖多种控制因素的决策,可以从不完全、不确定的知识或信息中做出推理。可以理解的是,样本数据库中存储的用于构建样本航班id的数据与上述构建预测航班id预测特征数据一致,且构建对样本id的预测特征数据、样本变量集的方法也一样,在此不再赘述。基于训练得到的预测模型,采用
Figure DEST_PATH_IMAGE021
表示预测航班的延时时长,
Figure DEST_PATH_IMAGE022
表示延时时长在30分钟以下,
Figure DEST_PATH_IMAGE023
表示延时时长在30分钟-60分钟之间,以此类推。即推测在
Figure DEST_PATH_IMAGE024
先验信息下,延误类别的条件概率分布。从而计算
Figure 100002_DEST_PATH_IMAGE025
,得到航班延误的概率分布
Figure 100002_DEST_PATH_IMAGE026
,分别表示航班延误在30分钟以下、30-60分钟、60-90分钟、90-120分钟、120-150分钟、150-180分钟以及180分钟以上延误的概率值。
作为一种实施例,所述步骤S4中,所述基于历史数据预测第N+1预测航班id至第M预测航班id的延时状态,包括:
基于第z预测航班的出发机场id在计划起飞时刻对应的气象数据,统计历史数据中该出发机场id在同时段以及相同气象数据状况下的航班延误概率分布,作为第z预测航班的延误概率分布:
Figure DEST_PATH_IMAGE027
其中,
Figure 100002_DEST_PATH_IMAGE028
分别表示第z预测航班出发机场id在计划起飞时刻的气象类型描述信息、能见度信息和风速信息,
Figure DEST_PATH_IMAGE029
表示第z预测航班计划起飞时刻所处的时段,
Figure 100002_DEST_PATH_IMAGE030
表示根据历史数据统计得出的在条件X下的航班延时频率,z的取值为N+1到M。
所述系统还可包括显示单元,最终将一个或多个预测航班id作为目标航班id,并将目标航班id预测延时结果和部分基本信息进行显示,如下表3所示:
Figure DEST_PATH_IMAGE031
从表3可以得到,目标航班id延时时长在30分钟内的概率为73.65%。
本发明实施例提能够完整的考虑航班链式传导,对航班链上一个航班的变化而重新进行航班链上相关航班的延时状态的概率的预测。本发明实施例还采用模型和历史数据预测相结合的链式传导的不同延时状态下的概率的预测,这一结构针对较长的航班链上的预测具有通用性。此外,本发明实施例采用航班链的多类特征进行航班处于不同延时状态的概率预测,更全面的考虑了航班之间的相关关系。
本发明实施例通过贝叶斯网络或历史数据频率得出预测航班的延时状态概率分布后,由于一般预测回归模型评价采用均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)等指标评价模型效果。而本发明预测结果为概率分布,故可采用一阶矩评价模型预测效果,具体步骤如下:
步骤S21、遍历各段航班数据中以各特征作为组合条件的组合数量,当组合条件下的历史航班样本数大于1000个时,统计历史数据中这些特征属性值下的航班延时状态概率分布
Figure 100002_DEST_PATH_IMAGE032
,假设历史概率分布为实际概率分布。同时通过贝叶斯模型预测得到在先验条件下的航班延误概率分布
Figure DEST_PATH_IMAGE033
步骤S22、分别计算先验条件下的历史阶矩及预测阶矩如下:
取每个延时时长类别的中位数作为该类别的平均值,历史阶矩与预测阶矩的计算方法分别如下:
历史一阶矩:
Figure 100002_DEST_PATH_IMAGE034
预测一阶矩:
Figure DEST_PATH_IMAGE035
计算历史一阶矩与预测一阶矩的差值,作为预测模型的平均误差指标:
Figure 100002_DEST_PATH_IMAGE036
本发明实施例选取了一段时间内的的数据进行预测,分别计算了当预测航班为首发航班以及预测航班距离当前航班分别有1至7段航班时的历史阶矩与预测阶矩的差值如下表4所示,可看出,在不同的航段模型下,航班延时平均误差均保持在10分钟以下,显示了本发明实施例预测模型预测延时状态概率分布的准确度高。
Figure DEST_PATH_IMAGE037
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (9)

1.一种预测航班延时状态的数据处理系统,其特征在于,
包括第一数据库、第二数据库、预测模型库、存储有计算机程序的存储器和处理器;所述第一数据库用于存储航班信息记录;所述第二数据库用于存储机场气象信息记录;所述预测模型库中用于存储预先训练好的第二预测模型、第三预测模型…第N预测模型,其中,第n预测模型用于预测第n预测航班id的延时状态,n的取值为2到N;
所述处理器执行所述计算机程序时,实现以下步骤:
步骤S1、实时获取计划起飞时间变更的航班id,将该航班id确定为当前需要预测的第一预测航班id,并获取所述第一预测航班id所在航班链上计划起飞时间晚于所述第一预测航班id的第二预测航班id、第三预测航班id…第M预测航班id,M大于等于2,所述航班链为预设周期内同一注册号对应的航班id按照计划起飞时间先后组成的航班id序列;
步骤S2、将M与N比较,若M小于等于N,则执行步骤S3,若M大于N,则执行步骤S4;
步骤S3、基于所述第一数据库和第二数据库分别构建第一预测航班id至第M预测航班id对应的预测特征数据,基于第一预测航班id至第m预测航班id对应的预测特征数据,拼接构建用于预测第m预测航班id延时状态的第m输入特征数据,将所述第m输入特征数据输入第m预测模型中,生成到第m预测航班id延时状态预测结果,m取值为2到M,结束流程;
步骤S4、基于所述第一数据库和第二数据库分别构建第一预测航班id至第N预测航班id对应的预测特征数据,基于第一预测航班id至第m预测航班id对应的预测特征数据,构建用于预测第m预测航班id延时状态的第m输入特征数据,将所述第m输入特征数据输入第m预测模型中,生成到第m预测航班id延时状态预测结果,m取值为2到N,基于历史数据预测第N+1预测航班id至第M预测航班id的延时状态;
所述系统还包括样本数据库,所述处理器执行所述计算机程序时,还实现以下步骤:
步骤S100、训练得到第n预测模型,n的取值为2到N,具体包括:
步骤S1001、基于样本数据库构建样本航班id的预测特征数据;
步骤S1002、基于第一样本航班id至第n样本航班id的预测特征数据拼接构建用于预测第n样本航班id延时状态的样本变量集;
步骤S1003、将第n样本航班id延时状态的样本变量集作为因,将第n样本航班id对应的航班延时标签的实际分类概率值作为果,建立第n贝叶斯网络模型进行训练,得到第n预测模型:
Figure 433819DEST_PATH_IMAGE002
其中,
Figure 678856DEST_PATH_IMAGE004
表示根据训练得到的贝叶斯模型预测的在条件X下的航班延时频 率,
Figure 786489DEST_PATH_IMAGE005
分别表示第i预测航班id所对应的出发机场id的航班取消率、航班积压率 以及航班延误率经离散分类化处理后的属性值,i的取值为1到m,
Figure 509594DEST_PATH_IMAGE007
表示第一预测航班id 延时时长标签变量、
Figure 389213DEST_PATH_IMAGE009
表示第i预测航班id的气象数据特征属性值、
Figure 414938DEST_PATH_IMAGE011
表示第一预测航班 id的预计起飞时间或实际起飞时间以及第二预测航班id至第m预测航班id的计划起飞时间 变量、
Figure 9867DEST_PATH_IMAGE013
表示航班链对应的当前日期变量。
2.根据权利要求1所述的系统,其特征在于,
所述航班信息记录包括预测航班id、出发机场id、到达机场id、注册号、计划起飞时间、预计起飞时间、实际起飞时间和航班取消信息字段,所述计划起飞时间的初始值和预计起飞时间的初始值相同,所述预计起飞时间动态更新;所述气象信息记录的字段包括机场id、气象类型、能见度、风速和更新时间字段;所述预测特征数据包括预测航班id所对应的出发机场id的航班取消率、航班积压率以及航班延误率,气象数据特征,起飞时间特征,日期时间特征和航班链对应的第一预测航班id的延时时长标签。
3.根据权利要求2所述的系统,其特征在于,
所述系统包括K个航班延时标签,第一标签表示航班延时W分钟以内的状态,第二标签表示航班延时W分钟至2*W分钟的状态…第K-1标签表示航班延时(K-1)*W至K*W分钟的状态,第K标签表示航班延时K*W分钟以上的状态。
4.根据权利要求3所述的系统,其特征在于,
所述步骤S3和步骤S4中,基于第一预测航班id至第m预测航班id对应的预测特征数据,拼接构建用于预测第m预测航班id延时状态的第m输入特征数据,包括:
步骤S10、基于第一预测航班id至第m预测航班id对应的预测特征数据构建用于预测第 n样本航班id延时状态的样本变量集
Figure 536664DEST_PATH_IMAGE014
作为所述第m输入特征 数据。
5.根据权利要求4所述的系统,其特征在于,
所述步骤S10包括:
步骤S101、获取第i预测航班id对应的出发机场id的延误概率:
所述第i预测航班id对应的出发机场id的延误概率为出发机场id在当前时间周期起点时刻到监测确定第一预测航班id的时刻的预测时间范围内,所涉及的航班分别处于延时W分钟至2*W分钟的状态…第K-1标签表示航班延时(K-1)*W至K*W分钟的状态,第K标签表示航班延时K*W分钟以上的状态的延误概率,Pik表示第i预测航班id对应的出发机场id在所述预测时间范围内航班延时对应第k航班延时标签的概率:
Figure 533438DEST_PATH_IMAGE016
其中,
Figure 730065DEST_PATH_IMAGE018
表示所述预测时间范围内第i预测航班id对应的出发机场id已经起飞的样 本航班id延时时长对应第k航班延时标签的数量,
Figure 812290DEST_PATH_IMAGE020
表示所述预测时间范围内第i预测 航班id对应的出发机场id未起飞预测航班id当前预计起飞时刻与计划起飞时刻差值时长 对应第k航班延时标签的数量,
Figure 142777DEST_PATH_IMAGE022
表示所述预测时间范围内第i预测航班id对应的出发机 场id原始计划起飞的航班数量。
6.根据权利要求4所述的系统,其特征在于,
所述步骤S10包括:
步骤S102、获取第i预测航班id对应的出发机场id的航班取消率:
所述第i预测航班id对应的出发机场id的航班取消率包括出发机场id在当前时间周期起点时刻到监测确定第一预测航班id的时刻的预测时间范围内取消航班的概率Pix和监测确定第一样本航班id的时刻的前Q小时时间范围内消航班的概率Piy。
7.根据权利要求4所述的系统,其特征在于,
所述步骤S10中,如果第一预测航班id为预设周期内对应出发机场的首发航班,则获取当前机场前Q小时的延时概率分布作为第一预测航班id延时概率分布。
8.根据权利要求4所述的系统,其特征在于,
所述步骤S10还包括:
步骤S13、获取航班id的气象数据特征,基于航班id的气象数据特征生成对应的航班id的气象数据特征属性值,具体包括:
步骤S113、获取航班id计划起飞时刻对应的气象类型描述信息,能见度信息和风速信息;
步骤S123、根据预设的气象类型编码映射表将气象类型描述信息转换为对应气象类型 编码值
Figure 869425DEST_PATH_IMAGE023
步骤S133、根据预设的能见度编码映射表将能见度信息转换为对应的能见度编码值
Figure DEST_PATH_IMAGE025
步骤S143、根据预设的风速编码映射表将风速信息转换为对应的风速编码值
Figure DEST_PATH_IMAGE026
步骤S153、基于气象特征综合编码
Figure DEST_PATH_IMAGE028
和预设的综合编码映射表获取气象特 征综合编码值
Figure DEST_PATH_IMAGE030
步骤S163、基于航班id对应的
Figure DEST_PATH_IMAGE032
生成对应的航班id的气象数据特 征属性值。
9.根据权利要求1所述的系统,其特征在于,
所述步骤S4中,所述基于历史数据预测第N+1预测航班id至第M预测航班id的延时状态,包括:
基于第z预测航班的出发机场id在计划起飞时刻对应的气象数据,统计历史数据中该出发机场id在同时段以及相同气象数据状况下的航班延误概率分布,作为第z预测航班的延误概率分布:
Figure DEST_PATH_IMAGE034
其中,
Figure DEST_PATH_IMAGE036
分别表示第z预测航班出发机场id在计划起飞时刻的气象类型 描述信息、能见度信息和风速信息,
Figure DEST_PATH_IMAGE038
表示第z预测航班计划起飞时刻所处的时段,
Figure DEST_PATH_IMAGE039
表示根据历史数据统计得出的在条件X下的航班延时频率,z的取值为N+1到 M。
CN202110408424.1A 2021-04-16 2021-04-16 预测航班延时状态的数据处理系统 Active CN112819260B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110408424.1A CN112819260B (zh) 2021-04-16 2021-04-16 预测航班延时状态的数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110408424.1A CN112819260B (zh) 2021-04-16 2021-04-16 预测航班延时状态的数据处理系统

Publications (2)

Publication Number Publication Date
CN112819260A CN112819260A (zh) 2021-05-18
CN112819260B true CN112819260B (zh) 2021-09-07

Family

ID=75863593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110408424.1A Active CN112819260B (zh) 2021-04-16 2021-04-16 预测航班延时状态的数据处理系统

Country Status (1)

Country Link
CN (1) CN112819260B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378106B (zh) * 2021-08-16 2021-12-28 中航信移动科技有限公司 基于延时状态的目标数据处理系统
CN117575874B (zh) * 2024-01-16 2024-04-16 中国标准化研究院 一种基于多源数据的电子政务平台安全管理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106650985A (zh) * 2016-09-12 2017-05-10 南京航空航天大学 基于随机Petri网的不正常航班衍生事件链式效应预测方法
CN110570693A (zh) * 2019-10-24 2019-12-13 南京航空航天大学 一种基于可靠性的航班运行时间预测方法
CN112270445A (zh) * 2020-11-02 2021-01-26 中国民航大学 基于统计分析和分类预测的航班延误波及综合评估方法
CN112381336A (zh) * 2020-12-11 2021-02-19 中国民航科学技术研究院 一种航班延误时长预测方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120226647A1 (en) * 2011-03-03 2012-09-06 Business Travel Alternatives, Llc Flight itinerary delay estimation
CN110334839B (zh) * 2019-04-15 2021-05-14 北京航空航天大学 航班延误预测方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106650985A (zh) * 2016-09-12 2017-05-10 南京航空航天大学 基于随机Petri网的不正常航班衍生事件链式效应预测方法
CN110570693A (zh) * 2019-10-24 2019-12-13 南京航空航天大学 一种基于可靠性的航班运行时间预测方法
CN112270445A (zh) * 2020-11-02 2021-01-26 中国民航大学 基于统计分析和分类预测的航班延误波及综合评估方法
CN112381336A (zh) * 2020-12-11 2021-02-19 中国民航科学技术研究院 一种航班延误时长预测方法及系统

Also Published As

Publication number Publication date
CN112819260A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
US10936940B2 (en) Arrangement and method for predicting road friction within a road network
WO2022142120A1 (zh) 基于人工智能的数据检测方法、装置、服务器及存储介质
CN110232483B (zh) 深度学习负荷预测方法、装置及终端设备
CN110334839B (zh) 航班延误预测方法、装置、设备及存储介质
CN112819260B (zh) 预测航班延时状态的数据处理系统
US8635208B2 (en) Multi-state query migration in data stream management
US20190057307A1 (en) Deep long short term memory network for estimation of remaining useful life of the components
Qin et al. Simulating and Predicting of Hydrological Time Series Based on TensorFlow Deep Learning.
US12099570B2 (en) System and methods for faster processor comparisons of visual graph features
JP6775469B2 (ja) Odトラヒック予測装置、方法、及びプログラム
CN110175690A (zh) 一种景区客流量预测的方法、装置、服务器和存储介质
CN112308281A (zh) 一种温度信息预测方法及装置
Tian et al. A network traffic prediction method based on IFS algorithm optimised LSSVM
CN113537563B (zh) 污染应急管控效果评估方法及装置
JP2021193563A (ja) 資産の予測健全性解析を実行するための方法およびコンピューティングシステム
CN112183868B (zh) 交通流量预测模型的构建方法及电子设备
CN116930609A (zh) 一种基于ResNet-LSTM模型的电能计量误差分析方法
Xing et al. Research of a novel combined deterministic and probabilistic forecasting system for air pollutant concentration
CN113902229A (zh) 一种基于模糊Petri网的航班延误波及预测方法及系统
US12020129B2 (en) Learning with moment estimation using different time constants
CN117334087A (zh) 一种基于深度学习的预测空中交通流量管理延误值的回归分析方法
CN115453661B (zh) 气象预报方法、装置、设备以及存储介质
KR102539223B1 (ko) 엣지 컴퓨팅 환경에서 ami 데이터 스트림 가속처리를 위한 딥 러닝 방법
CN112667394A (zh) 一种计算机资源利用率优化方法
Li et al. Time Series Prediction of 5G Network Data Based on Improved EEMD-BiLSTM Prediction Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Bian Lei

Inventor after: Zhang Xian

Inventor after: Yu Qi

Inventor after: Yao Yuan

Inventor after: Wang Diansheng

Inventor after: Tang Hongwu

Inventor after: Bo Manhui

Inventor after: Weng Jianying

Inventor before: Bian Lei

Inventor before: Zhang Xian

Inventor before: Yu Qi

Inventor before: Yao Yuan

Inventor before: Wang Diansheng

Inventor before: Tang Hongwu

Inventor before: Bo Manhui

Inventor before: Weng Jianying

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant