CN112329992A - 一种航班客座率预测方法、系统及电子设备 - Google Patents
一种航班客座率预测方法、系统及电子设备 Download PDFInfo
- Publication number
- CN112329992A CN112329992A CN202011140263.4A CN202011140263A CN112329992A CN 112329992 A CN112329992 A CN 112329992A CN 202011140263 A CN202011140263 A CN 202011140263A CN 112329992 A CN112329992 A CN 112329992A
- Authority
- CN
- China
- Prior art keywords
- passenger seat
- flight
- sequence
- prediction
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000010006 flight Effects 0.000 claims description 37
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000012163 sequencing technique Methods 0.000 claims description 11
- 239000013589 supplement Substances 0.000 claims description 5
- 230000001502 supplementing effect Effects 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 description 11
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Biology (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Pure & Applied Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Physics (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Optimization (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种航班客座率预测方法、系统及电子设备,首先,按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后并分段后得到多条序列,然后每条序列分别带入相应的客座率预测模型,得到航班在第M+1次运行时的客座率的多个初始预测值,具体地,一方面,基于预设阈值摒弃误差较大的初始预测值,根据选取出的N个初始预测值得到航班在第M+1次运行时的客座率的最终预测值,提高了航班客座率的预测准确度,另一方面,通过权重的方式对N个初始预测值中的每个初始预测值进行修正,进一步提高了航班客座率的预测准确度。
Description
技术领域
本发明涉及航空信息技术领域,尤其涉及一种航班客座率预测方法、系统及电子设备。
背景技术
随着我国从航空运输大国到航空运输强国战略的逐渐展开,民航业已经成为国家重要战略产业之一,是构成建设交通强国的强有力支柱,客座率指标是航空公司重要的效益参考指标之一,对于航空公司来说,建设和发展民航业需重点关注客座率指标,掌握其变化规律和影响因素,能为航空公司发展政策的拟定提供实证支持。
目前,航空公司往往根据任一航班的以往的1年、2年等的客座率通过建立数学模型的方式,对该航班的下一次运行的客座率进行预测,但预测出的客座率往往存在较大偏差,不能为航空公司发展政策的拟定提供实证支持。
发明内容
本发明提供了一种航班客座率预测方法、系统及电子设备,旨在解决的技术问题是如何提高航班客座率的预测准确度。
本发明的一种航班客座率预测方法的技术方案如下:
S1、按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后形成数列,并按照预设的不同段数对所述数列进行分段,得到多条序列,其中,每条所述序列中的每一个元素对应至少一个实际客座率,M为正整数;
S2、将每条所述序列分别带入相应的客座率预测模型中,得到所述航班在第M+1次运行时的客座率的多个初始预测值;
S3、将每两个所述初始预测值之间的偏差值与预设阈值进行对比,根据多个对比结果从多个所述初始预测值中选取N个初始预测值,N为正整数;
S4、根据所述N个初始预测值中的每个初始预测值所对应的客座率预测模型在所述航班的第M+1次运行时所分别对应的权重,分别对所述N个初始预测值中的每个初始预测值进行加权平均计算,得到所述航班在第M+1次运行时的客座率的最终预测值。
本发明的一种航班客座率预测方法的有益效果如下:
首先,按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后并分段后得到多条序列,然后每条序列分别带入相应的客座率预测模型,得到航班在第M+1次运行时的客座率的多个初始预测值,具体地,一方面,基于预设阈值摒弃误差较大的初始预测值,根据选取出的N个初始预测值得到航班在第M+1次运行时的客座率的最终预测值,提高了航班客座率的预测准确度,另一方面,通过权重的方式对N个初始预测值中的每个初始预测值进行修正,进一步提高了航班客座率的预测准确度。
在上述方案的基础上,本发明的一种航班客座率预测方法还可以做如下改进。
进一步,所述S4之前,还包括:
分别获取所述N个初始预测值中的每个初始预测值所对应的客座率预测模型的方差,并按照方差越大对应权重越小的原则分别计算所述N个初始预测值中的每个初始预测值所对应的客座率预测模型在所述航班的第M+1次运行时所分别对应的权重。
采用上述进一步方案的有益效果是:基于N个初始预测值中的每个初始预测值所对应的客座率预测模型的方差,使获取到的权重相比于人为根据经验设置的权重的准确度更高,从而进一步提高航班客座率的预测准确度。
进一步,所述S1之前,还包括:
判断所述航班在连续M次历史运行的实际客座率是否有缺失,若有,利用插值法将缺失的实际客座率补齐。
采用上述进一步方案的有益效果是:假设由于天气等客观因素时航班停运一次即该次速度实际客座率为0,但这是由于客观因素所导致的,通过插值法将缺失的实际客座率补齐,以消除客观因素所导致的误差,从而进一步提高航班客座率的预测准确度。
进一步,所述S2包括:
获取每条所述序列中的每个元素对应的所有次数的历史运行的搜索量,计算每条序列中每个元素对应的搜索量与对应的所有实际客座率的和之间的比例系数;
根据每条所述序列的比例系数及对应的自回归滑动平均模型预测出每条所述序列在所述航班在第M+1次运行时的比例系数;
通过每条所述序列在所述航班在第M+1次运行时的比例系数对每条所述序列对应的所述初始预测值进行修正。
采用上述进一步方案的有益效果是:通过每条序列在航班在第M+1次运行时的比例系数对所述航班在第M+1次运行时的客座率的多个初始预测值进行修正,使得到的所述航班在第M+1次运行时的客座率的多个初始预测值的准确度更高,从而进一步提高航班客座率的预测准确度。
进一步,还包括:
将所述航班的航班信息和所述航班在第M+1次运行时的客座率的最终预测值在航空网络地图上进行展示。
采用上述进一步方案的有益效果:便于航空公司直观查看航班的航班信息和航班在第M+1次运行时的客座率的最终预测值,提高用户体验度。
本发明的一种航班客座率预测系统的技术方案如下:
包括排序分段模块、预测模块、选取模块和加权平均模块;
所述排序分段模块用于按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后形成数列,并按照预设的不同段数对所述数列进行分段,得到多条序列,其中,每条所述序列中的每一个元素对应至少一个实际客座率,M为正整数;
所述预测模块用于将每条所述序列分别带入相应的客座率预测模型中,得到所述航班在第M+1次运行时的客座率的多个初始预测值;
所述选取模块用于将每两个所述初始预测值之间的偏差值与预设阈值进行对比,根据多个对比结果从多个所述初始预测值中选取N个初始预测值,N为正整数;
所述加权平均模块用于根据所述N个初始预测值中的每个初始预测值所对应的客座率预测模型在所述航班的第M+1次运行时所分别对应的权重,分别对所述N个初始预测值中的每个初始预测值进行加权平均计算,得到所述航班在第M+1次运行时的客座率的最终预测值。
本发明的一种航班客座率预测系统的有益效果如下:
首先,按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后并分段后得到多条序列,然后每条序列分别带入相应的客座率预测模型,得到航班在第M+1次运行时的客座率的多个初始预测值,具体地,一方面,基于预设阈值摒弃误差较大的初始预测值,根据选取出的N个初始预测值得到航班在第M+1次运行时的客座率的最终预测值,提高了航班客座率的预测准确度,另一方面,通过权重的方式对N个初始预测值中的每个初始预测值进行修正,进一步提高了航班客座率的预测准确度。
在上述方案的基础上,本发明的一种航班客座率预测系统还可以做如下改进。
进一步,还包括加权计算模块,所述加权计算模块用于分别获取所述N个初始预测值中的每个初始预测值所对应的客座率预测模型的方差,并按照方差越大对应权重越小的原则分别计算所述N个初始预测值中的每个初始预测值所对应的客座率预测模型在所述航班的第M+1次运行时所分别对应的权重。
采用上述进一步方案的有益效果是:基于N个初始预测值中的每个初始预测值所对应的客座率预测模型的方差,使获取到的权重相比于人为根据经验设置的权重的准确度更高,从而进一步提高航班客座率的预测准确度。
进一步,还包括补充模块,所述补充模块用于判断所述航班在连续M次历史运行的实际客座率是否有缺失,若有,利用插值法将缺失的实际客座率补齐。
采用上述进一步方案的有益效果是:假设由于天气等客观因素时航班停运一次即该次速度实际客座率为0,但这是由于客观因素所导致的,通过插值法将缺失的实际客座率补齐,以消除客观因素所导致的误差,从而进一步提高航班客座率的预测准确度。
进一步,所述预测模块还用于:
获取每条所述序列中的每个元素对应的所有次数的历史运行的搜索量,计算每条序列中每个元素对应的搜索量与对应的所有实际客座率的和之间的比例系数;
根据每条所述序列的比例系数及对应的自回归滑动平均模型预测出每条所述序列在所述航班在第M+1次运行时的比例系数;
通过每条所述序列在所述航班在第M+1次运行时的比例系数对每条所述序列对应的所述初始预测值进行修正。
采用上述进一步方案的有益效果是:通过每条序列在航班在第M+1次运行时的比例系数对所述航班在第M+1次运行时的客座率的多个初始预测值进行修正,使得到的所述航班在第M+1次运行时的客座率的多个初始预测值的准确度更高,从而进一步提高航班客座率的预测准确度。
进一步,还包括展示模块,所述展示模块用于将所述航班的航班信息和所述航班在第M+1次运行时的客座率的最终预测值在航空网络地图上进行展示。
采用上述进一步方案的有益效果:便于航空公司直观查看航班的航班信息和航班在第M+1次运行时的客座率的最终预测值,提高用户体验度。
本发明的一种电子设备的技术方案如下:
包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,所述处理器执行所述程序时实现上述任一项所述的一种航班客座率预测方法的步骤。
本发明的一种电子设备的有益效果如下:
首先,按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后并分段后得到多条序列,然后每条序列分别带入相应的客座率预测模型,得到航班在第M+1次运行时的客座率的多个初始预测值,具体地,一方面,基于预设阈值摒弃误差较大的初始预测值,根据选取出的N个初始预测值得到航班在第M+1次运行时的客座率的最终预测值,提高了航班客座率的预测准确度,另一方面,通过权重的方式对N个初始预测值中的每个初始预测值进行修正,进一步提高了航班客座率的预测准确度。
附图说明
图1为本发明实施例的一种航班客座率预测方法的流程示意图;
图2为本发明实施例的一种航班客座率系统的结构示意图;
图3为本发明实施例的一种电子设备的结构示意图;
具体实施方式
如图1所示,本发明实施例的一种航班客座率预测方法,包括如下步骤:
S1、按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后形成数列,并按照预设的不同段数对所述数列进行分段,得到多条序列,其中,每条序列中的每一个元素对应至少一个实际客座率,M为正整数;
S2、将每条序列分别带入相应的客座率预测模型中,得到航班在第M+1次运行时的客座率的多个初始预测值;
S3、将每两个初始预测值之间的偏差值与预设阈值进行对比,根据多个对比结果从多个初始预测值中选取N个初始预测值,N为正整数;
S4、根据N个初始预测值中的每个初始预测值所对应的客座率预测模型在航班的第M+1次运行时所分别对应的权重,分别对N个初始预测值中的每个初始预测值进行加权平均计算,得到航班在第M+1次运行时的客座率的最终预测值。
首先,按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后并分段后得到多条序列,然后每条序列分别带入相应的客座率预测模型,得到航班在第M+1次运行时的客座率的多个初始预测值,具体地,一方面,基于预设阈值摒弃误差较大的初始预测值,根据选取出的N个初始预测值得到航班在第M+1次运行时的客座率的最终预测值,提高了航班客座率的预测准确度,另一方面,通过权重的方式对N个初始预测值中的每个初始预测值进行修正,进一步提高了航班客座率的预测准确度。
以M=600、航班H为例进行说明,航班H的600次历史运行的实际客座率分别为:A1、A2……A599、A600,按照时间顺序将连续600次历史运行的实际客座率进行排序后得到的数列为:A1、A2……A599、A600,其中预设的段数可为600段、300段、200段等,可根据实际情况进行调整,那么:
1)假如预设的段数为600段时,将对应形成的序列记为第一序列,则第一序列为A1|A2|……|A599|A600,为便于表述,以符号“|”作为各段的分割符,第一序列中的每一个元素对应一个实际客座率,其中,元素可认为序列中的每个位置,例如第一序列中的第一个位置对应A1,第一序列的第二个位置对应A2,并以此类推;
2)假如预设的段数为300段时,将对应形成的序列记为第二序列,则第二序列为A1,A2|A3,A4|……|A597,A598|A599,A600,可以理解的是,由于是按照时间顺序将航班H的连续600次历史运行的实际客座率进行排序后得到的数列,第二序列中的每一个元素所对应的两个实际客座率均为相邻的两次历史运行的实际客座率,例如,第二序列中的第一个位置对应A1和A2,A1和A2对应相邻的两次历史运行,第二序列中的第二个位置对应A3和A4,A3和A4也对应相邻的两次历史运行;
3)假如预设的段数为200段时,将对应形成的序列记为第三序列,则第三序列为A1,A2,A3|A4,A5,A6|……|A595,A596,A597|A598,A599,A600,可以理解的是,第三序列中的每一个元素所对应的两个实际客座率均为相邻的三次历史运行的实际客座率,例如,第三序列中的第一个位置对应A1、A2和A3,A1、A2和A3对应相邻的三次历史运行,第三序列中的第二个位置对应A3、A4和A5,A3、A4和A5也对应相邻的三次历史运行;
将上述三条序列即第一序列、第二序列和第三序列分别带入相应的客座率预测模型中,具体地:
1)将第一序列带入相应的客座率预测模型,得到航班H在第601次运行时的客座率的初始预测值,记为第一初始预测值;
2)将第二序列带入相应的客座率预测模型,此时得到航班H在第601次和第602次运行时的客座率的初始预测值,将航班H在第601次运行时的客座率的初始预测值记为第二初始预测值;
3)将第三序列带入相应的客座率预测模型,此时得到航班H在第601次、第602次和第603次运行时的客座率的初始预测值,将航班H在第601次运行时的客座率的初始预测值记为第三初始预测值;
此时,得到分别根据三个序列得到航班H在第601次运行时的客座率的三个初始预测值即第一初始预测值、第二初始预测值和第三初始预测值;
将每两个初始预测值之间的偏差值与预设阈值进行对比,根据多个对比结果从多个初始预测值中选取N个初始预测值,具体地:
1)获取第一序列对应的第一初始预测值与第二序列对应的第二初始预测值之间的偏差值,并与预设阈值进行对比,得到第一个对比结果;
2)获取第一序列对应的第一初始预测值与第三序列对应的第三初始预测值之间的偏差值,并与预设阈值进行对比,得到第二个对比结果;
3)获取第二序列对应的第二初始预测值与第三序列对应的第三初始预测值之间的偏差值,并与预设阈值进行对比,得到第三个对比结果;
那么:
1)假如,三个对比结果中,第一个对比结果和第二个对比结果均为大于预设阈值,而第三个对比结果为小于预设阈值时,则说明第一序列对应的第一初始预测值相比于第二序列对应的第二初始预测值和第三序列对应的第三初始预测值之间的偏差值过大,而第二序列对应的第二初始预测值与第三序列对应的第三初始预测值之间的偏差值小,则选取第二序列对应的第二初始预测值与第三序列对应的第三初始预测值作为选取出的N个初始预测值,此时N=2,例如:第一序列对应的第一初始预测值为40%,第二序列对应的第二初始预测值为77%,第三序列对应的初始预测值为75%,则很明显,应该摒弃第一序列对应的第一初始预测值,选取第二序列对应的第二初始预测值和第三序列对应的第三初始预测值;
2)当三个对比结果均为小于预设阈值时,则选取第一序列对应的第一初始预测值、第二序列对应的第二初始预测值与第三序列对应的第三初始预测值作为选取出的N个初始预测值,此时N=3;
然后,根据N个初始预测值中的每个初始预测值所对应的客座率预测模型在航班H的第601次运行时所分别对应的权重,分别对N个初始预测值中的每个初始预测值进行加权平均计算,得到航班H在第601次运行时的客座率的最终预测值。
目前现有技术中,通常将通过数学模型所预测出航班H在第601次运行时的客座率的初始预测值作为最终预测值,并未对其做任何验证,由此可能会造成较大误差,例如,当直接将初始预测值即40%作为最终预测值,但由于本申请同时计算出第二序列对应的第二初始预测值为77%,第三序列对应的第三初始预测值为75%,并进行对比,并基于预设阈值摒弃误差较大的初始预测值,根据选取出的N个初始预测值得到航班H在第600次运行时的客座率的最终预测值,提高了航班客座率的预测准确度,以便于为航空公司发展政策的拟定提供实证支持,具体地:
航空公司可根据航班H的客座率的最终预测值向机场等管理部门申请调整航班的起飞时间、价格等,以增加该航班H的客座率,降低无效或高成本的飞行,提高收益。例如,当客座率的最终预测值低于预设阈值时,可向机场等管理部门申请调整该航班H的起飞时间、价格等。
可以理解的是,当三个对比结果均为大于预设阈值时,人为增大预设阈值,可以理解的是,当人为增大预设阈值时,此时航班客座率的预测准确度会有所下降,故重新选用数据集来再次训练客座率预测模型。
而且,通过对N个初始预测值中的每个初始预测值进行加权平均计算,其中,各权重可根据实际经验进行设置,例如通过多次拟合计算,能得到N个初始预测值中的每个初始预测值在N个初始预测值的之和的占比即权重,在更大程度上贴合客座率的真实值,即通过权重的方式对对N个初始预测值中的每个初始预测值进行修正,进一步提高了航班客座率的预测准确度。
可以理解为:例如,选取出的2个初始预测值为77%和75%,各自的权重为60%和40%,则加权平均计算为:77%×60%+75%×40=76.2%,即得到的客座率的最终预测值为76.2%。
其中,每条序列对应的客座率预测模型可通过自回归积分滑动平均模型、卷积神经网络、灰色预测模型、贝叶斯网络模型、马尔可夫模型或隐马尔可夫模型等训练得出,其训练过程为本领域人员所悉知,在此不做赘述,以卷积神经网络为例进行说明,当每条序列中的每一个元素对应至少两个实际客座率时,可将每一个元素所述对应至少两个实际客座率以数组、向量或矩阵等形式进行训练,以训练出客座率预测模型。
较优地,在上述技术方案中,S4之前,还包括:
S04、分别获取N个初始预测值中的每个初始预测值所对应的客座率预测模型的方差,并按照方差越大对应权重越小的原则分别计算N个初始预测值中的每个初始预测值所对应的客座率预测模型在航班的第M+1次运行时所分别对应的权重。
基于N个初始预测值中的每个初始预测值所对应的客座率预测模型的方差,使获取到的权重相比于人为根据经验设置的权重的准确度更高,从而进一步提高航班客座率的预测准确度。
其中,方差表示客座率预测模型每一次输出结果与客座率预测模型输出期望之间的误差,反映客座率预测模型的稳定性,并反映出预测的波动情况。当基于卷积神经网络训练得到客座率预测模型时,能直接计算得到客座率预测模型对应的方差,且自回归积分滑动平均模型、灰色预测模型、贝叶斯网络模型、马尔可夫模型或隐马尔可夫模型均能通过各自的方式得到方差,由于方差表示客座率预测模型每一次输出结果与客座率预测模型输出期望之间的误差,那么:
任一客座率预测模型的方差越大,则说明该客座率预测模型准确性越低,因此应为该模型赋予较小的权重,若任一客座率预测模型的预测误差的方差越小,则说明该客座率预测模型准确性越高,因此应为该模型赋予较大的权重,即按照方差越大对应权重越小的原则分别计算N个初始预测值中的每个初始预测值所对应的客座率预测模型在航班的第M+1次运行时所分别对应的权重,使最终确定出的一组权重使预测客座率的最终预测值的方差达到最小,因此,能进一步提高航班客座率的预测准确度。
较优地,在上述技术方案中,S1之前,还包括:
S01、判断航班在连续M次历史运行的实际客座率是否有缺失,若有,利用插值法将缺失的实际客座率补齐。
假设由于天气等客观因素时航班停运一次即该次速度实际客座率为0,但这是由于客观因素所导致的,通过插值法将缺失的实际客座率补齐,以消除客观因素所导致的误差,从而进一步提高航班客座率的预测准确度。
其中,差值法具体可为自然邻域法、样条函数、多项式插值法等来将缺失的实际客座率补齐,其基本思路为:通过对缺失的实际客座率的前后的多个实际客座率进行拟合后,拟合出一条曲线或直线,根据拟合出一条曲线或直线得到缺失的实际客座率。
较优地,在上述技术方案中,S2还包括:
S21、获取每条序列中的每个元素对应的所有次数的历史运行的搜索量,计算每条序列中每个元素对应的搜索量与对应的所有实际客座率的和之间的比例系数;
S22、根据每条序列的比例系数及对应的自回归滑动平均模型预测出每条序列在航班在第M+1次运行时的比例系数;
S23、通过每条序列在航班在第M+1次运行时的比例系数对每条序列对应的初始预测值进行修正。
其中,搜索量可为网页搜索量、APP搜索量、软件搜索量和电话询问量的总和,假设第一次历史运行的搜索量为10000次,第二次历史运行的搜索量为11000次,第三次历史运行的搜索量为12000次,那么:
1)第一序列中的每个元素对应一个搜索量,即A1对应10000,A2对应11000,A3对应12000,第一序列中的第一个元素即第一个位置对应的搜索量为10000,比例系数为10000:A1,并以此类推;
2)第二序列中的每个元素对应两个搜索量,第二序列中的第一个元素即第一个位置对应的搜索量为10000与11000的和,比例系数为(10000+11000):(A1+A2),并以此类推;
3)第三序列中的每个元素对应三个搜索量,第三序列中的第一个元素即第一个位置对应的搜索量为10000、11000与12000的和,比例系数为(10000+11000+12000):(A1+A2+A3),并以此类推;
然后根据分别第一序列对应的比例系数、第二序列对应的比例系数和第三序列对应的比例系数建立第一序列对应的自回归滑动平均模型、第二序列对应的自回归滑动平均模型和第三序列对应的自回归滑动平均模型,建立过程为本领域人员所悉知,在此不做赘述。
通过每条序列在航班在第M+1次运行时的比例系数对航班在第M+1次运行时的客座率的多个初始预测值进行修正,使得到的航班在第M+1次运行时的客座率的多个初始预测值的准确度更高,从而进一步提高航班客座率的预测准确度。
较优地,在上述技术方案中,还包括:
S5、将航班的航班信息和航班在第M+1次运行时的客座率的最终预测值在航空网络地图上进行展示。
其中,航班信息包括起始机场、中转机场、降落机场、时间等,可将航班的航班信息和航班在第M+1次运行时的客座率的最终预测值依附在航空网络地图上的该航班对应的航线上,便于航空公司直观查看航班的航班信息和航班在第M+1次运行时的客座率的最终预测值,提高用户体验度。
在上述各实施例中,虽然对步骤进行进行了编号S1、S2等,但只是本申请给出的具体实施例,本领域的技术人员可根据实际情况对调整S1、S2等的执行顺序,此也在本发明的保护范围内,可以理解,在一些实施例中,可以包含如上述各实施方式中的部分或全部。
如图2所示,本发明实施例的一种航班客座率预测系统200,包括排序分段模块210、预测模块220、选取模块230和加权平均模块240;
排序分段模块210用于按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后形成数列,并按照预设的不同段数对所述数列进行分段,得到多条序列,其中,每条序列中的每一个元素对应至少一个实际客座率,M为正整数;
预测模块220用于将每条序列分别带入相应的客座率预测模型中,得到航班在第M+1次运行时的客座率的多个初始预测值;
选取模块230用于将每两个初始预测值之间的偏差值与预设阈值进行对比,根据多个对比结果从多个初始预测值中选取N个初始预测值,N为正整数;
加权平均模块240用于根据N个初始预测值中的每个初始预测值所对应的客座率预测模型在航班的第M+1次运行时所分别对应的权重,分别对N个初始预测值中的每个初始预测值进行加权平均计算,得到航班在第M+1次运行时的客座率的最终预测值。
首先,按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后并分段后得到多条序列,然后每条序列分别带入相应的客座率预测模型,得到航班在第M+1次运行时的客座率的多个初始预测值,具体地,一方面,基于预设阈值摒弃误差较大的初始预测值,根据选取出的N个初始预测值得到航班在第M+1次运行时的客座率的最终预测值,提高了航班客座率的预测准确度,另一方面,通过权重的方式对N个初始预测值中的每个初始预测值进行修正,进一步提高了航班客座率的预测准确度。
较优地,在上述技术方案中,还包括加权计算模块,加权计算模块用于分别获取N个初始预测值中的每个初始预测值所对应的客座率预测模型的方差,并按照方差越大对应权重越小的原则分别计算N个初始预测值中的每个初始预测值所对应的客座率预测模型在航班的第M+1次运行时所分别对应的权重。
基于N个初始预测值中的每个初始预测值所对应的客座率预测模型的方差,使获取到的权重相比于人为根据经验设置的权重的准确度更高,从而进一步提高航班客座率的预测准确度。
较优地,在上述技术方案中,还包括补充模块,补充模块用于判断航班在连续M次历史运行的实际客座率是否有缺失,若有,利用插值法将缺失的实际客座率补齐。
假设由于天气等客观因素时航班停运一次即该次速度实际客座率为0,但这是由于客观因素所导致的,通过插值法将缺失的实际客座率补齐,以消除客观因素所导致的误差,从而进一步提高航班客座率的预测准确度。
较优地,在上述技术方案中,预测模块220还用于:
获取每条序列中的每个元素对应的所有次数的历史运行的搜索量,计算每条序列中每个元素对应的搜索量与对应的所有实际客座率的和之间的比例系数;
根据每条序列的比例系数及对应的自回归滑动平均模型预测出每条序列在航班在第M+1次运行时的比例系数;
通过每条序列在航班在第M+1次运行时的比例系数对每条序列对应的初始预测值进行修正。
通过每条序列在航班在第M+1次运行时的比例系数对航班在第M+1次运行时的客座率的多个初始预测值进行修正,使得到的航班在第M+1次运行时的客座率的多个初始预测值的准确度更高,从而进一步提高航班客座率的预测准确度。
较优地,在上述技术方案中,还包括展示模块,展示模块用于将航班的航班信息和航班在第M+1次运行时的客座率的最终预测值在航空网络地图上进行展示。
便于航空公司直观查看航班的航班信息和航班在第M+1次运行时的客座率的最终预测值,提高用户体验度。
上述关于本发明的一种航班客座率预测系统200中的各参数和各个单元模块实现相应功能的步骤,可参考上文中关于一种航班客座率预测方法的实施例中的各参数和步骤,在此不做赘述。
如图3所示,本发明实施例的一种电子设备300,包括存储器310、处理器320及存储在存储器310上并在处理器320上运行的程序330,处理器320执行程序330时实现上述任一实施的一种航班客座率预测方法的步骤。
首先,按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后并分段后得到多条序列,然后每条序列分别带入相应的客座率预测模型,得到航班在第M+1次运行时的客座率的多个初始预测值,具体地,一方面,基于预设阈值摒弃误差较大的初始预测值,根据选取出的N个初始预测值得到航班在第M+1次运行时的客座率的最终预测值,提高了航班客座率的预测准确度,另一方面,通过对N个初始预测值中的每个初始预测值进行加权平均计算,以降低偶然性因素的干扰,进一步提高了航班客座率的预测准确度。
其中,电子设备300可以选用电脑、手机等,相对应地,其程序330为电脑软件或手机APP等,且上述关于本发明的一种电子设备300中的各参数和步骤,可参考上文中一种航班客座率预测方法的实施例中的各参数和步骤,在此不做赘述。
在本发明中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种航班客座率预测方法,其特征在于,包括:
S1、按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后形成数列,并按照预设的不同段数对所述数列进行分段,得到多条序列,其中,每条所述序列中的每一个元素对应至少一个实际客座率,M为正整数;
S2、将每条所述序列分别带入相应的客座率预测模型中,得到所述航班在第M+1次运行时的客座率的多个初始预测值;
S3、将每两个所述初始预测值之间的偏差值与预设阈值进行对比,根据多个对比结果从多个所述初始预测值中选取N个初始预测值,N为正整数;
S4、根据所述N个初始预测值中的每个初始预测值所对应的客座率预测模型在所述航班的第M+1次运行时所分别对应的权重,分别对所述N个初始预测值中的每个初始预测值进行加权平均计算,得到所述航班在第M+1次运行时的客座率的最终预测值。
2.根据权利要求1所述的一种航班客座率预测方法,其特征在于,所述S4之前,还包括:
分别获取所述N个初始预测值中的每个初始预测值所对应的客座率预测模型的方差,并按照方差越大对应权重越小的原则分别计算所述N个初始预测值中的每个初始预测值所对应的客座率预测模型在所述航班的第M+1次运行时所分别对应的权重。
3.根据权利要求1所述的一种航班客座率预测方法,其特征在于,所述S1之前,还包括:
判断所述航班在连续M次历史运行的实际客座率是否有缺失,若有,利用插值法将缺失的实际客座率补齐。
4.根据权利要求1至3任一项所述的一种航班客座率预测方法,其特征在于,所述S2还包括:
获取每条所述序列中的每个元素对应的所有次数的历史运行的搜索量,计算每条序列中每个元素对应的搜索量与对应的所有实际客座率的和之间的比例系数;
根据每条所述序列的比例系数及对应的自回归滑动平均模型预测出每条所述序列在所述航班在第M+1次运行时的比例系数;
通过每条所述序列在所述航班在第M+1次运行时的比例系数对每条所述序列对应的所述初始预测值进行修正。
5.根据权利要求1至3任一项所述的一种航班客座率预测方法,其特征在于,还包括:
将所述航班的航班信息和所述航班在第M+1次运行时的客座率的最终预测值在航空网络地图上进行展示。
6.一种航班客座率预测系统,其特征在于,包括排序分段模块、预测模块、选取模块和加权平均模块;
所述排序分段模块用于按照时间顺序将航班在连续M次历史运行的实际客座率进行排序后形成数列,并按照预设的不同段数对所述数列进行分段,得到多条序列,其中,每条所述序列中的每一个元素对应至少一个实际客座率,M为正整数;
所述预测模块用于将每条所述序列分别带入相应的客座率预测模型中,得到所述航班在第M+1次运行时的客座率的多个初始预测值;
所述选取模块用于将每两个所述初始预测值之间的偏差值与预设阈值进行对比,根据多个对比结果从多个所述初始预测值中选取N个初始预测值,N为正整数;
所述加权平均模块用于根据所述N个初始预测值中的每个初始预测值所对应的客座率预测模型在所述航班的第M+1次运行时所分别对应的权重,分别对所述N个初始预测值中的每个初始预测值进行加权平均计算,得到所述航班在第M+1次运行时的客座率的最终预测值。
7.根据权利要求6所述的一种航班客座率预测系统,其特征在于,还包括加权计算模块,所述加权计算模块用于分别获取所述N个初始预测值中的每个初始预测值所对应的客座率预测模型的方差,并按照方差越大对应权重越小的原则分别计算所述N个初始预测值中的每个初始预测值所对应的客座率预测模型在所述航班的第M+1次运行时所分别对应的权重。
8.根据权利要求6所述的一种航班客座率预测系统,其特征在于,还包括补充模块,所述补充模块用于判断所述航班在连续M次历史运行的实际客座率是否有缺失,若有,利用插值法将缺失的实际客座率补齐。
9.根据权利要求6至8任一项所述的一种航班客座率预测系统,其特征在于,所述预测模块还用于:
获取每条所述序列中的每个元素对应的所有次数的历史运行的搜索量,计算每条序列中每个元素对应的搜索量与对应的所有实际客座率的和之间的比例系数;
根据每条所述序列的比例系数及对应的自回归滑动平均模型预测出每条所述序列在所述航班在第M+1次运行时的比例系数;
通过每条所述序列在所述航班在第M+1次运行时的比例系数对每条所述序列对应的所述初始预测值进行修正。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述的一种航班客座率预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011140263.4A CN112329992A (zh) | 2020-10-22 | 2020-10-22 | 一种航班客座率预测方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011140263.4A CN112329992A (zh) | 2020-10-22 | 2020-10-22 | 一种航班客座率预测方法、系统及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112329992A true CN112329992A (zh) | 2021-02-05 |
Family
ID=74312158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011140263.4A Pending CN112329992A (zh) | 2020-10-22 | 2020-10-22 | 一种航班客座率预测方法、系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112329992A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116757731A (zh) * | 2023-08-16 | 2023-09-15 | 中国民航信息网络股份有限公司 | 航班季节因子的预测方法、装置、电子设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132128A1 (en) * | 2011-11-17 | 2013-05-23 | Us Airways, Inc. | Overbooking, forecasting and optimization methods and systems |
CN103577413A (zh) * | 2012-07-20 | 2014-02-12 | 阿里巴巴集团控股有限公司 | 搜索结果排序方法及系统、搜索结果排序优化方法及系统 |
US20150356458A1 (en) * | 2014-06-10 | 2015-12-10 | Jose Oriol Lopez Berengueres | Method And System For Forecasting Future Events |
CN109858671A (zh) * | 2018-12-26 | 2019-06-07 | 携程旅游网络技术(上海)有限公司 | 预测目标航线的客座率的方法和系统 |
CN111340536A (zh) * | 2020-02-20 | 2020-06-26 | 上海携程商务有限公司 | 模型训练方法、客座率进度预测方法、系统、设备及介质 |
CN111582919A (zh) * | 2020-04-24 | 2020-08-25 | 海南太美航空股份有限公司 | 一种航班客座率预测方法和系统 |
-
2020
- 2020-10-22 CN CN202011140263.4A patent/CN112329992A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132128A1 (en) * | 2011-11-17 | 2013-05-23 | Us Airways, Inc. | Overbooking, forecasting and optimization methods and systems |
CN103577413A (zh) * | 2012-07-20 | 2014-02-12 | 阿里巴巴集团控股有限公司 | 搜索结果排序方法及系统、搜索结果排序优化方法及系统 |
US20150356458A1 (en) * | 2014-06-10 | 2015-12-10 | Jose Oriol Lopez Berengueres | Method And System For Forecasting Future Events |
CN109858671A (zh) * | 2018-12-26 | 2019-06-07 | 携程旅游网络技术(上海)有限公司 | 预测目标航线的客座率的方法和系统 |
CN111340536A (zh) * | 2020-02-20 | 2020-06-26 | 上海携程商务有限公司 | 模型训练方法、客座率进度预测方法、系统、设备及介质 |
CN111582919A (zh) * | 2020-04-24 | 2020-08-25 | 海南太美航空股份有限公司 | 一种航班客座率预测方法和系统 |
Non-Patent Citations (1)
Title |
---|
黄海等编著: "《SPSS 10.0 for Windows统计分析》", vol. 1, 西安电子科技大学出版社, pages: 222 - 31 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116757731A (zh) * | 2023-08-16 | 2023-09-15 | 中国民航信息网络股份有限公司 | 航班季节因子的预测方法、装置、电子设备和存储介质 |
CN116757731B (zh) * | 2023-08-16 | 2023-11-17 | 中国民航信息网络股份有限公司 | 航班季节因子的预测方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110334839B (zh) | 航班延误预测方法、装置、设备及存储介质 | |
EP3223170A1 (en) | Data processing method and device in data modeling | |
EP3065019B1 (en) | Method for optimum maximum range cruise speed in an aircraft | |
EP4047878A1 (en) | Traffic prediction method, device, and storage medium | |
CN112580801B (zh) | 一种强化学习训练方法及基于强化学习的决策方法 | |
CN107194491A (zh) | 一种基于公交客流和站间行程时间预测的动态调度方法 | |
EP2467685B1 (en) | Aircraft cabin noise exposure analysis | |
CN111192090A (zh) | 航班的座位分配方法、装置、存储介质和电子设备 | |
CN113282684B (zh) | 航班季节性归类的预测方法、装置及机器可读介质 | |
CN111325380A (zh) | 基于多粒度时间注意力机制确定航班客座率的方法和系统 | |
CN111582919B (zh) | 一种航班客座率预测方法和系统 | |
US20200349416A1 (en) | Determining computer-executed ensemble model | |
CN111582584A (zh) | 基于航空公司公平性的航段运行时间优化方法 | |
CN108416619B (zh) | 一种消费间隔时间预测方法、装置及可读存储介质 | |
CN113762578A (zh) | 流量预测模型的训练方法、装置和电子设备 | |
CN112329992A (zh) | 一种航班客座率预测方法、系统及电子设备 | |
CN112200625A (zh) | 一种航班资源推荐方法及装置 | |
CN110009939B (zh) | 基于asm的航班延误预测及波及分析方法 | |
CN114782114A (zh) | 一种基于CNN-GRU和SSA-GWO-LightGBM的机票价格预测方法 | |
CN111160594B (zh) | 一种到达时间的预估方法、装置及存储介质 | |
CN111340581B (zh) | 数据处理方法、装置、可读存储介质和电子设备 | |
CN115310732B (zh) | 航班延误预测方法及系统 | |
CN116542705A (zh) | 预测方法、装置和计算机可读存储介质 | |
CN115116226A (zh) | 一种基于深度强化学习模型的高速公路货车流量预测算法、软件与装置 | |
CN108734490A (zh) | 拼车折扣确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |