CN111652427B - 一种基于数据挖掘分析的航班到达时刻预测方法及系统 - Google Patents
一种基于数据挖掘分析的航班到达时刻预测方法及系统 Download PDFInfo
- Publication number
- CN111652427B CN111652427B CN202010475290.0A CN202010475290A CN111652427B CN 111652427 B CN111652427 B CN 111652427B CN 202010475290 A CN202010475290 A CN 202010475290A CN 111652427 B CN111652427 B CN 111652427B
- Authority
- CN
- China
- Prior art keywords
- flight
- data
- time
- prediction model
- operation data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000004458 analytical method Methods 0.000 title claims abstract description 31
- 238000007418 data mining Methods 0.000 title claims abstract description 16
- 238000004364 calculation method Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000012216 screening Methods 0.000 claims abstract description 19
- 230000006870 function Effects 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 4
- KJONHKAYOJNZEC-UHFFFAOYSA-N nitrazepam Chemical compound C12=CC([N+](=O)[O-])=CC=C2NC(=O)CN=C1C1=CC=CC=C1 KJONHKAYOJNZEC-UHFFFAOYSA-N 0.000 claims description 4
- 238000013439 planning Methods 0.000 claims description 4
- 238000013524 data verification Methods 0.000 claims description 3
- 230000010006 flight Effects 0.000 abstract description 2
- 238000010276 construction Methods 0.000 description 4
- 238000012806 monitoring device Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于数据挖掘分析的航班到达时刻预测方法及系统,包括:S1、航班历史运行数据匹配融合及标准化处理;S2、历史运行数据特征筛选与相关性分析;3、构建预测模型;S4、将被预测航班的特征变量数据输入到回归预测模型中并计算得到航班剩余飞行时间的预测值。本发明从ADS‑B系统、ACARS系统等设备中采集航班历史数据,首先对数据进行关联、标准化处理,然后依据特征变量筛选、特征值计算进行皮尔森相关系数计算并构建基于XGBoost算法的回归预测模型,不断调参优化模型,得到最佳准确率的回归预测模型,在模型中输入被预测航班的特征变量数据后即可预测得到航班的预测到达时刻,提高了航班到达时刻的预测精度。
Description
技术领域
本发明涉及航班运行管理领域,尤其涉及一种基于数据挖掘分析的航班到达时刻预测方法及系统。
背景技术
民航业务量的逐年增长对航班运行水平提出了更高的要求,尤其是航空公司航班准点率、机场运行效率方面。航班到达时刻的准确估计有利于提高机场和航空公司的运行效率和安全水平,对提升航班准点率、改善航班保障与运行效率、优化资源分配与任务规划具有重要而直接的意义。当前,航班到达时刻估计准确率不够理想,数据挖掘技术的发展为航班预达时刻估计提供了新方法,丰富的航班运行历史数据库也为基于数据挖掘的预测方法提供了充足的数据支撑。
发明内容
针对现有技术存在的不足之处,本发明的目的在于提供一种基于数据挖掘分析的航班到达时刻预测方法及系统,能够从ADS-B系统、ACARS系统等设备中采集航班历史数据,首先对数据进行关联、标准化处理,然后依据特征变量筛选、特征值计算通过皮尔森相关系数计算得到各特征变量与到达时刻之间相关系统,并构建基于XGBoost算法的回归预测模型,不断调参优化模型,得到最佳准确率的回归预测模型,在模型中输入被预测航班的特征变量数据后即可预测得到航班的预测到达时刻。
本发明的目的通过下述技术方案实现:
一种基于数据挖掘分析的航班到达时刻预测方法,包括:
S1、航班历史运行数据匹配融合及标准化处理:依据特征维度参数对航班历史数据进行关联匹配、多维分类及标准化处理与存储,所述特征维度参数包括航班号、航班日期、三字码、机号、机型、起降机场,所述航班历史数据包括航班动态、ADS-B系统中的运行轨迹、ACARS系统中的运行轨迹、飞行计划航路,处理后得到历史运行数据;
S2、历史运行数据特征筛选与相关性分析:对步骤S1中的历史运行数据进行特征变量筛选、特征值计算,并对数据中各特征变量与到达时刻之间进行皮尔森相关系数计算分析;
S3、构建预测模型:利用历史运行数据及其特征变量分析结果,构建基于XGBoost算法的回归预测模型,并使用测试数据验证模型准确性,通过不断调参优化,获取最佳准确率的回归预测模型;
S4、将被预测航班的特征变量数据输入到回归预测模型中并计算得到航班剩余飞行时间的预测值。
为了更好地实现本发明,本发明步骤S1方法包括如下:
依据特征维度参数对航班历史数据进行关联匹配并构建出航班运行数据集,所述航班运行数据集包括航班号、机号、机型、起降机场、航空公司;对航班运行数据集中包括航班轨迹、航班动态在内数据进行特征计算和标准化处理,特征计算所含的特征项包括如下:航班轨迹点、与起飞机场距离D1、与目的机场距离D2、已飞行时间T1、剩余飞行时间T2、延误时间DT。
作为优选,本发明步骤S2方法包括如下:
利用皮尔森相关系数法分析历史运行数据的特征项参数与航班到达时刻之间的相关性,所述特征项参数包括航程距离、航程时间、起飞延误时间、到达延误时间、执飞机型、载客、载重;分析计算历史运行数据各飞行轨迹中的如下数据:各个航迹点的时间、与起飞时间时间差、与落地时间时间差、与起飞机场距离、与落机场距离;并筛选出具有显著相关性的属性与数据,同时去除弱相关和无相关性的的属性与数据。
作为优选,本发明步骤S2方法皮尔森相关系数计算公式如下:
其中X,Y为两个变量的样本观测值,N为样本数量。
作为优选,本发明步骤S3方法包括如下:
利用历史运行数据及其特征变量分析结果,构建基于XGBoost算法的回归预测模型,预测函数表示为:
依据步骤二筛选的历史运行数据特征参数,使用历史运行数据训练构建构建基于XGBoost算法的回归预测模型,预测函数表示为:
其中fk(Xi)为第i个样本根据第k颗回归树确定的值;
并使用不同的历史运行数据进行预测测试优化,获取得到最佳准确率的回归预测模型。
作为优选,本发明步骤S4方法包括如下:
依据步骤S3得到的回归预测模型,输入被预测航班的当前运行特征参数,运行特征参数包括航班号、航空公司、机号、机型、起降机场、载重、所在位置、已飞时间、已飞距离、剩余距离,回归预测模型计算得到航班的剩余飞行时间,并得到落地时间预测;在航班实际落地后,将实际运行特征变量与实际落地时间反馈至回归预测模型,实现对回归预测模型进行更新学习。
一种基于数据挖掘分析的航班到达时刻预测方法,包括:
S1、航班历史运行数据匹配融合及标准化处理:依据特征维度参数对航班历史数据进行关联匹配并构建出航班运行数据集,所述航班运行数据集包括航班号、机号、机型、起降机场、航空公司;对航班运行数据集中包括航班轨迹、航班动态在内数据进行特征计算和标准化处理,特征计算所含的特征项包括如下:航班轨迹点、与起飞机场距离D1、与目的机场距离D2、已飞行时间T1、剩余飞行时间T2、延误时间DT;所述航班历史数据包括航班动态、ADS-B系统中的运行轨迹、ACARS系统中的运行轨迹、飞行计划航路,处理后得到历史运行数据;
S2、历史运行数据特征筛选与相关性分析:利用皮尔森相关系数法分析步骤S1中历史运行数据的特征项参数与航班到达时刻之间的相关性,所述特征项参数包括航程距离、航程时间、起飞延误时间、到达延误时间、执飞机型、载客、载重;分析计算历史运行数据各飞行轨迹中的如下数据:各个航迹点的时间、与起飞时间时间差、与落地时间时间差、与起飞机场距离、与落机场距离;并筛选出具有显著相关性的属性与数据,同时去除弱相关和无相关性的的属性与数据;皮尔森相关系数计算公式如下:
其中X,Y为两个变量的样本观测值,N为样本数量;
S3、构建预测模型:利用历史运行数据及其特征变量分析结果,构建基于XGBoost算法的回归预测模型,预测函数表示为:
依据步骤二筛选的历史运行数据特征参数,使用历史运行数据训练构建构建基于XGBoost算法的回归预测模型,预测函数表示为:
其中fk(Xi)为第i个样本根据第k颗回归树确定的值;
并使用不同的历史运行数据进行预测测试优化,获取得到最佳准确率的回归预测模型;
S4、依据步骤S3得到的回归预测模型,输入被预测航班的当前运行特征参数,运行特征参数包括航班号、航空公司、机号、机型、起降机场、载重、所在位置、已飞时间、已飞距离、剩余距离,回归预测模型计算得到航班的剩余飞行时间,并得到落地时间预测;在航班实际落地后,将实际运行特征变量与实际落地时间反馈至回归预测模型,实现对回归预测模型进行更新学习。
一种基于数据挖掘分析的航班到达时刻预测系统,包括数据采集模块、存储模块、标准化处理模块、皮尔森相关系统计算模块、数据输入模块、回归预测模型和输出显示模块,数据采集模块用于采集输入航班历史数据,所述航班历史数据来源包括ADS-B系统、ACARS系统、雷达监视系统,标准化处理模块用于对航班历史数据按照特征维度参数进行关联匹配、多维分类及标准化处理并得到历史运行数据,所述特征维度参数包括航班号、航班日期、三字码、机号、机型、起降机场;皮尔森相关系统计算模块用于对历史运行数据中各特征变量与到达时刻之间进行皮尔森相关系数计算分析,回归预测模型用于利用历史运行数据及其特征变量分析结果构建基于XGBoost算法的回归预测模型;数据输入模块用于输入测试数据验证、优化回归预测模型,数据输入模块还用于输入被预测航班的特征变量数据;输出显示模块用于输出根据回归预测模型计算得到的航班剩余飞行时间的预测值。
本发明较现有技术相比,具有以下优点及有益效果:
(1)本发明从ADS-B系统、ACARS系统等设备中采集航班历史数据,首先对数据进行关联、标准化处理,然后依据特征变量筛选、特征值计算通过皮尔森相关系数计算得到各特征变量与到达时刻之间相关系统,并构建基于XGBoost算法的回归预测模型,不断调参优化模型,得到最佳准确率的回归预测模型,在模型中输入被预测航班的特征变量数据后即可预测得到航班的预测到达时刻。
(2)本发明充分利用历史运行数据进行标准处理、皮尔森相关系数计算处理并建立出回归预测模型,通过回归预测模型实时预测航班的预测到达时间,提高了航班到达时刻的预测精度,有利于航班飞行实时指导与实时监视。
附图说明
图1为本发明航班到达时刻预测系统的原理结构框图。
具体实施方式
下面结合实施例对本发明作进一步地详细说明:
实施例一
一种基于数据挖掘分析的航班到达时刻预测方法,包括:
S1、航班历史运行数据匹配融合及标准化处理:依据特征维度参数对航班历史数据进行关联匹配、多维分类及标准化处理与存储,所述特征维度参数包括航班号、航班日期、三字码、机号、机型、起降机场,所述航班历史数据包括航班动态、ADS-B系统中的运行轨迹、ACARS系统中的运行轨迹、飞行计划航路,处理后得到历史运行数据;本实施例的航班历史数据主要来源于航班动态、ADS-B系统中的运行轨迹、ACARS系统中的运行轨迹、飞行计划航路,当然还可以来源于其他监视设备(比如雷达监视设备)。
S2、历史运行数据特征筛选与相关性分析:对步骤S1中的历史运行数据进行特征变量筛选、特征值计算,并对数据中各特征变量与到达时刻之间进行皮尔森相关系数计算分析;
S3、构建预测模型:利用历史运行数据及其特征变量分析结果,构建基于XGBoost算法的回归预测模型,并使用测试数据验证模型准确性,通过不断调参优化,获取最佳准确率的回归预测模型;
S4、将被预测航班的特征变量数据输入到回归预测模型中并计算得到航班剩余飞行时间的预测值。
本实施例中步骤S1方法包括如下:
依据特征维度参数对航班历史数据进行关联匹配并构建出航班运行数据集,所述航班运行数据集包括航班号、机号、机型、起降机场、航空公司;对航班运行数据集中包括航班轨迹、航班动态在内数据进行特征计算和标准化处理,特征计算所含的特征项包括如下:航班轨迹点、与起飞机场距离D1、与目的机场距离D2、已飞行时间T1、剩余飞行时间T2、延误时间DT。
本实施例中步骤S2方法包括如下:
利用皮尔森相关系数法分析历史运行数据的特征项参数与航班到达时刻之间的相关性,所述特征项参数包括航程距离、航程时间、起飞延误时间、到达延误时间、执飞机型、载客、载重;分析计算历史运行数据各飞行轨迹中的如下数据:各个航迹点的时间、与起飞时间时间差、与落地时间时间差、与起飞机场距离、与落机场距离;并筛选出具有显著相关性的属性与数据,同时去除弱相关和无相关性的的属性与数据。
本实施例中步骤S2方法皮尔森相关系数计算公式如下:
其中X,Y为两个变量的样本观测值,N为样本数量。
其公式演算方法如下:
本实施例中步骤S3方法包括如下:
利用历史运行数据及其特征变量分析结果,构建基于XGBoost算法的回归预测模型,预测函数表示为:
依据步骤二筛选的历史运行数据特征参数,使用历史运行数据训练构建构建基于XGBoost算法的回归预测模型,预测函数表示为:
其中fk(Xi)为第i个样本根据第k颗回归树确定的值;
并使用不同的历史运行数据进行预测测试优化,获取得到最佳准确率的回归预测模型。
本实施例中步骤S4方法包括如下:
依据步骤S3得到的回归预测模型,输入被预测航班的当前运行特征参数,运行特征参数包括航班号、航空公司、机号、机型、起降机场、载重、所在位置、已飞时间、已飞距离、剩余距离,回归预测模型计算得到航班的剩余飞行时间,并得到落地时间预测;在航班实际落地后,将实际运行特征变量与实际落地时间反馈至回归预测模型,实现对回归预测模型进行更新学习。
如图1所示,一种基于数据挖掘分析的航班到达时刻预测系统,包括数据采集模块、存储模块、标准化处理模块、皮尔森相关系统计算模块、数据输入模块、回归预测模型和输出显示模块,数据采集模块用于采集输入航班历史数据,所述航班历史数据来源包括ADS-B系统、ACARS系统、雷达监视系统,标准化处理模块用于对航班历史数据按照特征维度参数进行关联匹配、多维分类及标准化处理并得到历史运行数据,所述特征维度参数包括航班号、航班日期、三字码、机号、机型、起降机场;皮尔森相关系统计算模块用于对历史运行数据中各特征变量与到达时刻之间进行皮尔森相关系数计算分析,回归预测模型用于利用历史运行数据及其特征变量分析结果构建基于XGBoost算法的回归预测模型;数据输入模块用于输入测试数据验证、优化回归预测模型,数据输入模块还用于输入被预测航班的特征变量数据;输出显示模块用于输出根据回归预测模型计算得到的航班剩余飞行时间的预测值。
实施例二
一种基于数据挖掘分析的航班到达时刻预测方法,包括:
S1、航班历史运行数据匹配融合及标准化处理:依据特征维度参数对航班历史数据进行关联匹配并构建出航班运行数据集,所述航班运行数据集包括航班号、机号、机型、起降机场、航空公司;对航班运行数据集中包括航班轨迹、航班动态在内数据进行特征计算和标准化处理,特征计算所含的特征项包括如下:航班轨迹点、与起飞机场距离D1、与目的机场距离D2、已飞行时间T1、剩余飞行时间T2、延误时间DT;所述航班历史数据包括航班动态、ADS-B系统中的运行轨迹、ACARS系统中的运行轨迹、飞行计划航路,处理后得到历史运行数据;
S2、历史运行数据特征筛选与相关性分析:利用皮尔森相关系数法分析步骤S1中历史运行数据的特征项参数与航班到达时刻之间的相关性,所述特征项参数包括航程距离、航程时间、起飞延误时间、到达延误时间、执飞机型、载客、载重;分析计算历史运行数据各飞行轨迹中的如下数据:各个航迹点的时间、与起飞时间时间差、与落地时间时间差、与起飞机场距离、与落机场距离;并筛选出具有显著相关性的属性与数据,同时去除弱相关和无相关性的的属性与数据;皮尔森相关系数计算公式如下:
其中X,Y为两个变量的样本观测值,N为样本数量;
S3、构建预测模型:利用历史运行数据及其特征变量分析结果,构建基于XGBoost算法的回归预测模型,预测函数表示为:
依据步骤二筛选的历史运行数据特征参数,使用历史运行数据训练构建构建基于XGBoost算法的回归预测模型,预测函数表示为:
其中fk(Xi)为第i个样本根据第k颗回归树确定的值;
并使用不同的历史运行数据进行预测测试优化,获取得到最佳准确率的回归预测模型;
S4、依据步骤S3得到的回归预测模型,输入被预测航班的当前运行特征参数,运行特征参数包括航班号、航空公司、机号、机型、起降机场、载重、所在位置、已飞时间、已飞距离、剩余距离,回归预测模型计算得到航班的剩余飞行时间,并得到落地时间预测;在航班实际落地后,将实际运行特征变量与实际落地时间反馈至回归预测模型,实现对回归预测模型进行更新学习。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于数据挖掘分析的航班到达时刻预测方法,其特征在于,包括:
S1、航班历史运行数据匹配融合及标准化处理:依据特征维度参数对航班历史数据进行关联匹配、多维分类及标准化处理与存储,所述特征维度参数包括航班号、航班日期、三字码、机号、机型、起降机场,所述航班历史数据包括航班动态、ADS-B系统中的运行轨迹、ACARS系统中的运行轨迹、飞行计划航路,处理后得到历史运行数据;
依据特征维度参数对航班历史数据进行关联匹配并构建出航班运行数据集,所述航班运行数据集包括航班号、机号、机型、起降机场、航空公司;对航班运行数据集中包括航班轨迹、航班动态在内数据进行特征计算和标准化处理,特征计算所含的特征项包括如下:航班轨迹点、与起飞机场距离D1、与目的机场距离D2、已飞行时间T1、剩余飞行时间T2、延误时间DT;
S2、历史运行数据特征筛选与相关性分析:对步骤S1中的历史运行数据进行特征变量筛选、特征值计算,并对数据中各特征变量与到达时刻之间进行皮尔森相关系数计算分析;
利用皮尔森相关系数法分析历史运行数据的特征项参数与航班到达时刻之间的相关性,所述特征项参数包括航程距离、航程时间、起飞延误时间、到达延误时间、执飞机型、载客、载重;分析计算历史运行数据各飞行轨迹中的如下数据:各个航迹点的时间、与起飞时间时间差、与落地时间时间差、与起飞机场距离、与落机场距离;并筛选出具有显著相关性的属性与数据,同时去除弱相关和无相关性的属性与数据;
S3、构建预测模型:利用历史运行数据及其特征变量分析结果,构建基于XGBoost算法的回归预测模型,预测函数表示为:
并使用不同的历史运行数据进行预测测试优化,获取得到最佳准确率的回归预测模型;
S4、将被预测航班的特征变量数据输入到回归预测模型中并计算得到航班剩余飞行时间的预测值;
依据步骤S3得到的回归预测模型,输入被预测航班的当前运行特征参数,运行特征参数包括航班号、航空公司、机号、机型、起降机场、载重、所在位置、已飞时间、已飞距离、剩余距离,回归预测模型计算得到航班的剩余飞行时间,并得到落地时间预测;在航班实际落地后,将实际运行特征变量与实际落地时间反馈至回归预测模型,实现对回归预测模型进行更新学习。
2.按照权利要求1所述的一种基于数据挖掘分析的航班到达时刻预测方法,其特征在于:所述步骤S2方法皮尔森相关系数计算公式如下:
3.一种基于数据挖掘分析的航班到达时刻预测方法,其特征在于,包括:
S1、航班历史运行数据匹配融合及标准化处理:依据特征维度参数对航班历史数据进行关联匹配并构建出航班运行数据集,所述航班运行数据集包括航班号、机号、机型、起降机场、航空公司;对航班运行数据集中包括航班轨迹、航班动态在内数据进行特征计算和标准化处理,特征计算所含的特征项包括如下:航班轨迹点、与起飞机场距离D1、与目的机场距离D2、已飞行时间T1、剩余飞行时间T2、延误时间DT;所述航班历史数据包括航班动态、ADS-B系统中的运行轨迹、ACARS系统中的运行轨迹、飞行计划航路,处理后得到历史运行数据;
S2、历史运行数据特征筛选与相关性分析:利用皮尔森相关系数法分析步骤S1中历史运行数据的特征项参数与航班到达时刻之间的相关性,所述特征项参数包括航程距离、航程时间、起飞延误时间、到达延误时间、执飞机型、载客、载重;分析计算历史运行数据各飞行轨迹中的如下数据:各个航迹点的时间、与起飞时间时间差、与落地时间时间差、与起飞机场距离、与落机场距离;并筛选出具有显著相关性的属性与数据,同时去除弱相关和无相关性的属性与数据;皮尔森相关系数计算公式如下:
S3、构建预测模型:利用历史运行数据及其特征变量分析结果,构建基于XGBoost算法的回归预测模型,预测函数表示为:
依据步骤二筛选的历史运行数据特征参数,使用历史运行数据训练构建基于XGBoost算法的回归预测模型,预测函数表示为:
并使用不同的历史运行数据进行预测测试优化,获取得到最佳准确率的回归预测模型;
S4、依据步骤S3得到的回归预测模型,输入被预测航班的当前运行特征参数,运行特征参数包括航班号、航空公司、机号、机型、起降机场、载重、所在位置、已飞时间、已飞距离、剩余距离,回归预测模型计算得到航班的剩余飞行时间,并得到落地时间预测;在航班实际落地后,将实际运行特征变量与实际落地时间反馈至回归预测模型,实现对回归预测模型进行更新学习。
4.一种用于权利要求1所述的航班到达时刻预测方法的航班到达时刻预测系统,其特征在于:包括数据采集模块、存储模块、标准化处理模块、皮尔森相关系统计算模块、数据输入模块、回归预测模型和输出显示模块,数据采集模块用于采集输入航班历史数据,所述航班历史数据来源包括ADS-B系统、ACARS系统、雷达监视系统,标准化处理模块用于对航班历史数据按照特征维度参数进行关联匹配、多维分类及标准化处理并得到历史运行数据,所述特征维度参数包括航班号、航班日期、三字码、机号、机型、起降机场;皮尔森相关系统计算模块用于对历史运行数据中各特征变量与到达时刻之间进行皮尔森相关系数计算分析,回归预测模型用于利用历史运行数据及其特征变量分析结果构建基于XGBoost算法的回归预测模型;数据输入模块用于输入测试数据验证、优化回归预测模型,数据输入模块还用于输入被预测航班的特征变量数据;输出显示模块用于输出根据回归预测模型计算得到的航班剩余飞行时间的预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010475290.0A CN111652427B (zh) | 2020-05-29 | 2020-05-29 | 一种基于数据挖掘分析的航班到达时刻预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010475290.0A CN111652427B (zh) | 2020-05-29 | 2020-05-29 | 一种基于数据挖掘分析的航班到达时刻预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111652427A CN111652427A (zh) | 2020-09-11 |
CN111652427B true CN111652427B (zh) | 2023-12-29 |
Family
ID=72346869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010475290.0A Active CN111652427B (zh) | 2020-05-29 | 2020-05-29 | 一种基于数据挖掘分析的航班到达时刻预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111652427B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112328572A (zh) * | 2020-09-17 | 2021-02-05 | 北京中数科技术有限公司 | 航班飞行历史复盘方法、装置、设备及存储介质 |
CN114428803B (zh) * | 2020-10-29 | 2023-05-26 | 上海浦昊节能环保科技有限公司 | 空压站运行优化方法、系统、存储介质及终端 |
CN112509358A (zh) * | 2020-11-19 | 2021-03-16 | 湖南湘江智能科技创新中心有限公司 | 一种基于人车站云协同的盲人乘车方法 |
CN112687128B (zh) * | 2020-11-27 | 2022-06-03 | 民航成都信息技术有限公司 | 航迹预估到达时刻的预测方法、装置及自动预测系统 |
CN112862171B (zh) * | 2021-01-29 | 2022-05-27 | 北京航空航天大学 | 一种基于时空神经网络的航班到达时间预测方法 |
CN112949915A (zh) * | 2021-02-08 | 2021-06-11 | 南京航空航天大学 | 一种基于动态排序的进场航班落地时间预测方法 |
CN113158552B (zh) * | 2021-03-25 | 2022-05-31 | 中国市政工程中南设计研究总院有限公司 | 基于时间序列的生物反应器运行状况分级预测方法及系统 |
CN113282684B (zh) * | 2021-05-31 | 2023-08-29 | 中国民航信息网络股份有限公司 | 航班季节性归类的预测方法、装置及机器可读介质 |
CN114037122A (zh) * | 2021-10-15 | 2022-02-11 | 青岛民航凯亚系统集成有限公司 | 基于大数据挖掘处理分析的航班延误预测方法 |
CN116681413B (zh) * | 2023-08-03 | 2023-10-27 | 中航信移动科技有限公司 | 一种航班到达时间确定方法、电子设备及存储介质 |
CN117272236B (zh) * | 2023-11-23 | 2024-03-12 | 青岛民航凯亚系统集成有限公司 | 一种基于航班时序的多来源预达时间融合方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197081A (zh) * | 2017-11-03 | 2018-06-22 | 上海敬之网络科技有限公司 | 一种航班延误险的数据精算模型建立方法 |
CN109598373A (zh) * | 2018-11-21 | 2019-04-09 | 青岛民航凯亚系统集成有限公司 | 一种基于ads-b数据的用于预测航班到达时间的预处理方法 |
CN110135647A (zh) * | 2019-05-21 | 2019-08-16 | 中国太平洋保险(集团)股份有限公司 | 一种基于特征建模实现趋势预测的控制方法及控制装置 |
CN110826788A (zh) * | 2019-10-30 | 2020-02-21 | 南京智慧航空研究院有限公司 | 基于大数据深度学习的机场场面可变滑出时间预测方法 |
CN111161566A (zh) * | 2019-12-30 | 2020-05-15 | 携程旅游网络技术(上海)有限公司 | 航班延误预警方法、系统、电子设备和介质 |
-
2020
- 2020-05-29 CN CN202010475290.0A patent/CN111652427B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197081A (zh) * | 2017-11-03 | 2018-06-22 | 上海敬之网络科技有限公司 | 一种航班延误险的数据精算模型建立方法 |
CN109598373A (zh) * | 2018-11-21 | 2019-04-09 | 青岛民航凯亚系统集成有限公司 | 一种基于ads-b数据的用于预测航班到达时间的预处理方法 |
CN110135647A (zh) * | 2019-05-21 | 2019-08-16 | 中国太平洋保险(集团)股份有限公司 | 一种基于特征建模实现趋势预测的控制方法及控制装置 |
CN110826788A (zh) * | 2019-10-30 | 2020-02-21 | 南京智慧航空研究院有限公司 | 基于大数据深度学习的机场场面可变滑出时间预测方法 |
CN111161566A (zh) * | 2019-12-30 | 2020-05-15 | 携程旅游网络技术(上海)有限公司 | 航班延误预警方法、系统、电子设备和介质 |
Non-Patent Citations (3)
Title |
---|
Samet Ayhan 等.KDD'18: Proceedings of the 24th ACM SIGKDD International Conference on Knowlede Discovery & Data Mining.Association for Computing Machinery,2018,33-42. * |
基于支持向量机回归的机场航班延误预测;何洋;朱金福;周秦炎;;中国民航大学学报(第01期);全文 * |
航班延误预测研究概述;付振宇;徐海文;傅强;;科技与创新(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111652427A (zh) | 2020-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111652427B (zh) | 一种基于数据挖掘分析的航班到达时刻预测方法及系统 | |
US20210133370A1 (en) | Optimizing Aircraft Flows at Airports Using Data Driven Predicted Capabilities | |
WO2021082393A1 (zh) | 基于大数据深度学习的机场场面可变滑出时间预测方法 | |
CN108710623B (zh) | 基于时间序列相似性度量的机场离港延误时间预测方法 | |
Kireev et al. | Analysis of the influence of factors on flight delays in the united states using the construction of a mathematical model and regression analysis | |
WO2021082394A1 (zh) | 基于大数据深度学习的场面可变滑出时间预测系统 | |
Fernandes et al. | Factors influencing charter flight departure delay | |
Hrastovec et al. | Machine learning model for aircraft performances | |
Chou et al. | A machine learning application for predicting and alerting missed approaches for airport management | |
Evans et al. | Improving operational acceptability of dynamic weather routes through analysis of commonly use routings | |
CN115759386B (zh) | 一种民航航班执飞结果预测方法、装置及电子设备 | |
Tian et al. | Assessment of flight block time reliability under different delay time windows: A case study | |
CN111652428B (zh) | 一种基于历史数据的航班预达时刻估算方法及系统 | |
Šimić et al. | Airport delay prediction using machine learning regression models as a tool for decision making process | |
Vishnyakova et al. | A solution to the problem of assessing aviation safety by simulation modeling | |
US12026440B1 (en) | Optimizing aircraft flows at airports using data driven predicted capabilities | |
US20230278727A1 (en) | Systems and methods for analyzing utilization of aircraft within a fleet | |
Tarasonok et al. | Models for forecasting flight delays | |
Ambekar et al. | Flight Delay Prediction System Using Machine Learning Approach | |
SAHADEVAN et al. | Prediction of gate in time of scheduled flights and schedule conformance using machine learning-based algorithms | |
Medianto et al. | Stochastic modeling of aircraft flight parameters in terminal control area based on automatic dependent surveillance-broadcast (ADS-B) data | |
Corrado | A Data-Driven Methodology to Analyze Air Traffic Management System Operations within the Terminal Airspace | |
Jarry et al. | Toward novel environmental impact assessment for ANSPs using machine learning | |
Montlaur et al. | Domain-driven multiple-criteria decision-making for flight crew decision support tool | |
Sahadevan et al. | A machine learning-based approach to predict random variation in the landing time of scheduled flights |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |