CN110751359B - 一种自动化航线网络评估方法、电子设备及存储介质 - Google Patents
一种自动化航线网络评估方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110751359B CN110751359B CN201910813459.6A CN201910813459A CN110751359B CN 110751359 B CN110751359 B CN 110751359B CN 201910813459 A CN201910813459 A CN 201910813459A CN 110751359 B CN110751359 B CN 110751359B
- Authority
- CN
- China
- Prior art keywords
- market
- data
- journey
- calculating
- flight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 52
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 54
- 230000010006 flight Effects 0.000 claims abstract description 27
- 238000004364 calculation method Methods 0.000 claims abstract description 15
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000005315 distribution function Methods 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims description 5
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种自动化航线网格评估方法、电子设备及存储介质,包括读取并处理数据源信息、行程数据,保存至大数据平台;对所述行程数据,选择能够描述航空市场的指标,通过聚类方式分析对航空市场进行划分,并在得到的各分类中,结合Logistics回归与深度神经网络的方法,计算航线网络评估市场的参数;调用参数与航班计划,计算该行程的市场份额与航班的客座率;若某个航班信息被人工调整,重新计算该航班所在航线航空市场的指标;通过误差平方和的方式判断所述航线所在航线网络评估市场的聚类所属类别并保存。本发明从自动化的角度,将原本基于主观经验的方式,转化为基于模型的计算方式,减少人工干预,更好调整航空公司运力安排,具有较高的容错性。
Description
技术领域
本发明涉及航空应用工程技术领域,尤其涉及一种自动化航线网格评估方法、电子设备及存储介质。
背景技术
在全球航空网络下,航空公司如何根据现有运力情况,合理的安排航线、机型,是实现盈利的一个非常重要的环节。安排运力涉及到未来的市场份额预测问题,而在全球航空网络的环境中,包括已有市场和潜在市场在内,一个规模化的网络型航空公司相关的市场数量通常会达到10万以上。如何在庞大数量的市场中,进行自动化航线网络的分析,是提高自动化运力分配,实现航空公司可持续发展的一个重要方向。
传统的市场分析技术主要包含两种:(1)对单个的市场进行分析,通常会针对该市场寻找各种影响因素及数据进行手工分析;(2)对于规模化的市场群分析,现有的技术主要通过手工下载全球分销系统GDS(GlobalDistribution System)的代理订座数据MIDT(MarketInformation Data Tape),根据设定的规则(一般是行程间12小时间隔)形成旅客的行程(Itinerary)数据。根据行程数据计算各参数,然后将参数做成数据包,每次都需要使用专门的工具读取,进行内存计算与展示。
第一种方式覆盖面太窄,无法从网络的角度得到计算结果,容易出现顾此失彼的情况,评估结果无法做到科学有效;采用第二种方式的情况下,需要在本地计算机使用SAS(一种统计分析软件)等软件进行大量的数据计算,耗费极长的时间,并且手工计算过程需要大量的人工干预,主观因素强,不同人员的数据处理结果进行评估,差距较大。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种自动化航线网格评估方法,克服现有技术中人工处理造成主观因素强的问题,将历史、航班计划的变化加入对市场的预测,进行整合调整,具有更好的容错性。
本发明的目的之二在于提供一种电子设备,克服现有技术中人工处理造成主观因素强的问题,将历史、航班计划的变化加入对市场的预测,进行整合调整,具有更好的容错性。
本发明的目的之三在于提供一种存储介质,存储有计算机程序,克服现有技术中人工处理造成主观因素强的问题,将历史、航班计划的变化加入对市场的预测,进行整合调整,具有更好的容错性。
本发明的目的之一采用如下技术方案实现:
一种自动化航线网络评估方法,包括
S100、读取并处理数据源信息、行程数据,保存至大数据平台;所述数据源信息包括MIDT数据、OAG航班计划数据、航空公司航段/行程销售数据、历史市场需求预测数据;
S200、对所述行程数据,选择能够描述航空市场的指标,通过聚类方式分析对航空市场进行划分,并在得到的各分类中,结合Logistics回归与深度神经网络的方法,计算航线网络评估市场的参数;
S300、调用所述参数与航班计划,计算该行程的市场份额与航班的客座率,完成航线网络评估;
S400、若某个航班信息被人工调整,转至S200重新计算该该航班所在航线航空市场的指标;
S500、通过误差平方和的方式判断所述航线所在航线网络评估市场的聚类所属类别,保存至所述大数据平台。
进一步地,所述S200还包括
S210、确定需要进行航线网络评估市场的市场范围,根据所述历史市场需求预测数据及行程数据,采用时间序列模型、阈值控制及航空公司生产数据对比缩放相结合的方法,对当前MIDT相同时间段的航线网络评估市场的市场规模进行预测;
S220、根据所述行程数据的区域信息、市场规模,对所述航线网络评估市场进行分类;
S230、计算分类后的行程衔接参数的分布函数,以单侧置信区间获得所述行程衔接参数的阈值;
S240、计算分类后的行程信息各旅客偏好因素的分布函数,以单侧置信区间获得所述各旅客偏好因素参数的阈值,以此阈值过去除高于阈值的行程记录;
S250、计算所述偏好因素两两之间的相关性,标记分类后偏好因素属性值中相关性高于预设数值的因素;
S260、计算航班的预估人数并与所述航空公司航段/行程销售数据中的实际行程人数比较,从所述因素中选择误差平方和最小的因素作为每一分类的旅客偏好因素项;S270、使用概率Logistics回归方法和深度神经网络方法计算所述旅客偏好因素的参数值;
S280、将所述因素参数值与所述OAG航班计划数据合并计算,得到各行程的效用值、航班在每个航线网络评估市场的承运人数比例与航空公司在每个航线网络评估市场的承运人数比例;
S290、计算所述航班在每个航线网络评估市场的承运人数比例与航空公司在每个航线网络评估市场的承运人数比例的误差,选择误差平方和最小的结果对应的参数值,作为聚类中的旅客偏好因素的参数,保存至所述大数据平台中。
进一步地,所述时间序列模型为ARIMA模型,通过AIC准则选择AIC值最小的参数作为预测参数,对航线网络评估市场的市场规模进行预测。
进一步地,所述S220中包括:
S221、计算航线网络评估市场指标,所述航线网络评估市场指标包括各航空市场的市场大小、市场中行程频率、竞争航空公司数量、市场中转行程比例、中转机场数量;
S222、通过k-means的聚类方法对所述航线网络评估市场指标进行聚类,并基于业务特点指定相距较远的聚类初始核心市场及聚类数量;
S223、计算所述聚类的簇内误差平方和,并根据相邻两个所述簇内误差平方和确定连接斜率,以此选择出最优聚类及聚类数量;
S224、保留所述最优聚类的航线网络评估市场指标至所述大数据平台。
进一步地, S270使用概率Logistics回归方法和深度神经网络方法通过效用函数计算所述因素参数值;所述概率Logistics回归方法采用极大似然法求解所述因素参数值,建立模型为
。
进一步地, S230中计算分类后的行程衔接参数与偏好因素属性值,还包括每个行程衔接参数与偏好因素属性值做出正态分布假设,以右侧97.5% 的单侧置信区间自动获取用于计算所述参数记录数量;所述右侧的单侧置信区间的计算方法为:
。
进一步地,所述S300还包括
S310、从所述大数据平台中读取需要评估的行程的OAG航班计划数据与所述各聚类的行程衔接参数、市场份额因素的参数;
S320、根据所述行程衔接参数,自动计算行程衔接的方案;
S330、根据所述市场份额参数计算行程的理论市场需求;
S340、若所述理论市场需求少于预设人数,保留并标记该行程,且将行程人数设置为0;转至S330,计算未标记的行程的理论市场需求;
S350、根据所述OAG航班计划数据中航班的座位数限制,计算各行程人数与航班客座率,并保存至所述大数据平台。
进一步地,所述S100还包括
S110、循环查询数据源,检测是否存在更新的MIDT数据与OAG航班计划数据;
S120、若存在更新的MIDT数据,则读取MIDT数据,对相同PNR下同一人的航班订座信息,根据预设规则进行拆分;所述预设规则为往返航班拆分、超过预设数量的航班在停留时间最长的中转点拆分、停留时间超过24小时的中转点拆分;
S130、对拆分后的航班订座信息添加相应的行程数据,所述航班订座信息、与所述航班订座信息相匹配的MIDT数据保存至大数据平台。
本发明的目的之二采用如下技术方案实现:
一种电子设备,包括存储器、处理器以及存储在存储器中的程序,所述程序被配置成由处理器执行,处理器执行所述程序时实现如上任一项的一种自动化航线网格评估方法的步骤。
本发明的目的之三采用如下技术方案实现:
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理执行时实现如上任意一项所述的一种自动化航线网格评估方法。
相比现有技术,本发明的有益效果在于:
提供了一种自动化航线网格评估方法、电子设备和存储介质,读取MIDT数据,OAG航班计划数据,OAG静态表、航空公司航段/行程销售数据、历史市场需求预测数据,通过数据能够较好的描述市场的相关信息。采用聚类的方式计算航线网络评估模型的参数,减少单一的市场预测方法的限制。通过误差平方和的方式判断市场的所属类别,选择误差平方和最小的方案结果所对应的类别进行归类。在航线进行反复增删的情况,可自动归类。另外,对不同参数进行计算,无需人工对市场进行判断、分类,减少人工干预而造成的误差。
且将计算与用户使用分离,后台网络评估的计算通过航班计划触发,实现评估流程自动化,且将结果保存在大数据平台中,前端用户使用、查询则只需要读取相关数据,节省时间。
附图说明
图1为本发明所提供实施例一的流程示意图;
图2为本发明所提供实施例一的深度神经网络模型示意图;
图3为本发明所提供实施例一的另一深度神经网络模型示意图;
图4为本发明所提供实施例二的电子设备结构示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
实施例一
如图1所示,本发明提供了一种自动化航线网络评估方法,包括以下步骤:
S100、读取并处理数据源信息、行程数据,保存至大数据平台;所述数据源信息包括MIDT数据、OAG航班计划数据、航空公司航段/行程销售数据、历史市场需求预测数据;
具体包括S110:循环查询数据源(FTP服务器,FileTransport Protocol),检测是否存在更新的MIDT数据与OAG航班计划数据。
S120:若存在更新的MIDT数据,则读取MIDT数据,对相同PNR(Passenger NameRecord,用于判断是否同一人订座的标识符)下同一人的航班订座信息,根据预设规则进行拆分,所述规则包括:往返航班拆分,超过3段航班在停留时间最长的中转点拆分,停留时间超过24小时的中转点拆分。
S130:对拆分后的航班订座信息添加相应的行程数据,具体包括地理信息,如匹配始发、到达机场,增加经纬度、时区信息,计算行程距离(具体算法如式(1)所示)、行程内航段距离和;
其中,表示大地球面距离,/>,/>表示地面上点1的经纬度,/>,/>表示地面上点2的经纬度。
时区信息,如匹配始发、到达机场所在时区,出发、到达时刻,增加夏令时/国际时区信息;航班信息,如匹配始发、到达机场、航班号、出发时刻,增加执飞航空公司、航班号、代码共享信息;机型信息,如匹配执飞机型,增加座位数信息。
完成后,自动保存行程数据,与行程数据按计划出发时间段范围匹配,匹配成功的MIDT数据、航空公司销售数据至大数据平台Hive数据仓库。
S200、对所述行程数据,选择能够描述航空市场的指标,通过聚类方式分析对航空市场进行划分,并在得到的各分类中,结合Logistics回归与深度神经网络的方法,计算航线网络评估市场的参数;
具体包括S210、确定需要进行航线网络评估市场的市场范围,根据所述历史市场需求预测数据及行程数据,采用时间序列模型、阈值控制及航空公司生产数据对比缩放相结合的方法,对当前MIDT相同时间段的航线网络评估市场的市场规模进行预测;
在网络中市场(含潜在市场)定义包含:(1)本航空公司在历史上存在直达、中转的市场;(2)依据当前评估期的航班计划,以本航空公司的航段始发为出发地,本航空公司所有航段的到达机场,可衔接上的所有下一航段(包含本航空公司及其他航空公司执飞)的到达机场为目的地;(3)上述市场的返程市场。
在确定评估市场范围内,根据历史市场需求预测数据及行程数据,采用时间序列模型中的ARIMA(Autoregressive Integrated MovingAverage model,如式(2)所示)及阈值控制对当前MIDI相同时间段的航线网络评估市场进行预测。
(2)
时间序列模型中的评估周市场规模则是通过ARIMA采用AIC准则(AkaikeInformation Criterion,式(3)所示)
(3)
自动选择阶数(p,q,d),通过设置不同的(0, 0, 1),(0, 1, 0), (0, 1, 1)一直递增至(4, 4, 4)。从中选择AIC值最小的组合,作为最优的预测参数进行预测,其对市场的预测值为X h。计算该市场中,MIDT数据统计结果x midt与航空公司自有客票销售数据中的市场订座数据x al的比值进行填充,填充则采用如式(4)所示的形式。
(4)
其中,n代表某市场中航空公司的数量;x al,eval表示具有自由客票销售数据的航空公司在该市场的实际销售数据/周;x midt,eval表示在MIDT中,相应航空公司的销售数据/周,由于MIDT中不包含有航空公司直销数据,因此两者的比值大于1,该公式相当于放大系数;X g为自由增长率,由当前评估周的直达航班座位数与上周的航班座位数/>的比值确定,如式(5)所示,
(5)
而对市场的需求预测,市场大小X F采用如式(6)所示的加权形式,其中为权重,缺省情况下,/>。
(6)
S220、根据行程数据的区域信息、市场规模,自动对航线网络评估市场进行分类;
S221、计算航线网络评估市场指标,航线网络评估市场指标包括S210中计算的航空市场的市场大小X F、市场中行程频率I i, nbr(行程频率即在MIDT历史数据中,某市场中的不同类型的行程数量,不同类型定义为不同日期DOW(Day of Week)、航空公司、航班号的衔接)、市场中竞争航空公司数量Al i, nbr、市场中的中转行程比例I i, inter_perc(市场中中转行程占所有行程的比例,除中转外,还有直达行程),中转机场数量Apt i, inter_nbr(市场中中转行程所经过的不同机场的数量)。上述指标能够较为全面的描述航空市场的特点。
S222、通过k-means的聚类方法对所述航线网络评估市场指标进行聚类,并基于业务特点指定相距较远的聚类初始核心市场及聚类数量。由于k-means的聚类方法需要事先指定聚类数量,且初始聚类核心对结果有一定影响。因此事先设定部分初始聚类核心市场,如BJS-CAN:国内高频市场,BJS-NYC:国际长线市场,CAN-TYO:国际短线市场。采用循环的方式,将聚类数量范围限定为[10, 市场数量]。具体的网络型航空公司包含潜在市场的全网络完整的市场数量为20万,共享度较高的市场通常是5000个,而聚类上线缺省值为1000。过多的聚类数量会导致聚类内市场数量较少,组间特征不明显。因此本实施例的聚类数量范围为[10, 1000]。
S223、计算所述聚类的簇内误差平方和,并根据相邻两个所述簇内误差平方和确定连接斜率,以此选择出最优聚类及聚类数量;
计算完每次聚类,则计算聚类的簇内误差平方和(Sum of Squares for Error,SSE),如式(7)所示,
(7)
其中,i代表某次聚类满足收敛条件后,聚类的n个簇内的第i个簇,代表标准化后的第i个簇内的第j个市场的第k个属性,/>代表标准化后的第i个簇内的核心中的第k个属性,r代表S222中的属性数量,m i 代表在第i个簇内有m i 个市场)。
连接相邻邻聚类数量S T 后,每相邻两个S T 计算连接斜率(如式(8)所示,两点确定一条直线),如(10)所示,推导过程如式(8)(9)所示,可近似认为,在聚类簇数量增大的过程中,k越接近0且小于0,则聚类方案最优。但是过多的聚类会导致系统计算效率降低,因此选择(/>角)且/>的第一个聚类方案,以此作为优选的市场聚类数量。
(8)
(9)
(10)
S224、最优聚类航线网络评估市场类别中, S221计算的航线网络评估市场指标均值会被保留,并保存至大数据平台Hive数据仓库中。
在本发明中,参数的计算方式改为聚类,将市场大小、市场中行程频率、市场中竞争航空公司数量、市场中的中转行程比例、市场中转机场数量作为聚类指标,上述指标能够较好地描述一个市场,避免了现有技术中强行划分市场的问题。
S230、计算分类后的行程衔接参数的分布函数,以单侧置信区间获得上述参数的阈值,并保存于大数据平台。
在分类中,行程衔接参数包括行程的静态绕航率、相对绕航率最小过站时间、行程时间倍率、行程最小频率、最差行程类型、中转行程类型数量等。具体的,静态绕航率,为行程多航段的大地距离和与行程所在市场的直达大地距离(式(1)表达式)的比值;相对绕航率,是指若市场中含有直达行程,则该参数与静态绕航率相同,若市场中不含直达行程,则为行程多段的大地距离与行程所在市场的最短的多段航段衔接的距离的比值;行程时间倍率,指行程时间绕航率;行程最小频率,为中转行程的频率;最差行程类型,指最差行程类型表示某市场中能够被接受的最差行程,行程从优到劣依次为直达、联程、同航空公司一次中转,联盟一次中转,非联盟一次中转,同航空公司二次中转,联盟二次中转,非联盟二次中转;中转行程类型数量,指当中转行程到达中转站之后,后续能够衔接的出港航班数量,及某一中转站的出港航班,能够衔接的进港航班数量。
对每个衔接参数均做出正态分布的假设,如式(11)—(13)所示,以右侧97.5%的单侧置信区间自动获取用于计算参数的记录数量,以统计的方式进行解释,降低每个数据处理人员主管经验所造成的误差。由于参数用于过滤极大超出正常范围的记录,因此在均值右侧方面进行限制,在均值左侧不做限制。
(11)
(12)
(13)
S240、计算分类后的行程信息各旅客偏好因素的分布函数,以单侧置信区间获得上述参数的阈值,以此阈值过去除高于阈值的行程记录。行程的偏好因素包括行程的出发时间(每隔tk- tk-1采样时间统计该采样时间内出发行程人数,如式所示,并对整条曲线标准化,计算出发时间属性,如(16)所示;出发时间(如式(17)所示)、到达时间(如式(18)所示)、过站时间、行程时间、航段时间之和、同航空公司中转、不同航空公司中转、始发航站、到达航站、中转航站、航空公司、直达。直达是如式(19)所示,式中con为行程中转类型分类变量,以nonstop直飞类型为参考值,其余三种β值为该对应衔接类型相对nonstop类型的β值。市场中每个行程必为Nonstop/Through/Online/Interline中的一种。N stops表示行程的中转次数,包括联程航班的中转。N cs表示代码共享航空公司个数。part表示前后航段执飞航空公司是否为联盟,为0-1变量。)
同样,对所述偏好因素做出正态分布假设,以右侧97.5%的单侧置信区间(均值+单侧3倍标准差,由于参数用于过滤极大超出正常范围的记录,因此在均值右侧方面进行限制,在均值左侧不做限制),自动获取用于计算参数的记录数量。
(14)
(15)(16)
(17)
(18)
(19)
S250、计算上述各偏好因素两两之间的相关性(如式(20)所示)。分类后,对相关性高于0.7的因素进行自动标记。
(20)
S260、计算航班的预估人数(如式(27)(28))并与所述航空公司航段/行程销售数据中的实际行程人数比较,从所述因素中选择误差平方和最小的因素作为每一分类的旅客偏好因素项。
S270、使用概率Logistics回归方法与深度神经网络方法通过式(17)(18)(19)等效用函数计算各因素的参数值。具体的,概率Logistics回归方法采用极大似然求解参数,建立的模型如式(21)-(24)所示,而深度神经神经网络的模型如图2、3所示。
(21)
(22)
(23)
(24)
S280、将所述因素参数值与所述OAG航班计划数据合并计算(如式(17)(18)(19),得到各行程的效用值u、航班在每个航线网络评估市场的承运人数比例mktshr eval与航空公司在每个航线网络评估市场的承运人数比例mktshr act。
S290、计算所述航班在每个航线网络评估市场的承运人数比例与航空公司在每个航线网络评估市场的承运人数比例的误差,如式(25);
(25)
选择误差平方和最小(SSE)如式(26)所示的结果对应的参数值,作为聚类中的旅客偏好因素的参数,并保存至所述大数据平台。
(26)
本发明中,采用Logistics回归及深度神经网络分别计算模型参数,避免了现有技术中,对模型的拟合程度低,后期需要大量手工参数修改的问题。
S300、调用参数与航班计划,计算该行程的市场份额与航班的客座率,完成航线网络评估。
S310:从所述大数据平台中读取需要评估的行程的OAG航班计划数据与所述各聚类的行程衔接参数、市场份额因素的参数;
S320:根据行程衔接参数,自动计算行程衔接的方案。
S330:根据所述市场份额参数,自动计算各行程的理论市场需求,如式(27)、(28)所示,根据预设的阈值,优选旅客数量多的行程。
(27)
(28)
S340、若所述理论市场需求少于预设人数,保留行程并进行标记,且将行程人数设置为0;转至S330,计算未标记的行程的理论市场需求。具体的,本实施例中,对评估结果少于0.5人的行程,则保留行程,但是行程人数设置为0,不占用座位数。从物理含义上解释,即该行程有存在的可能性,但是实际上没有人搭乘,将该部分行程进行标记,重复S330,在未标记的行程中计算理论市场需求。
S350:根据所述OAG航班计划数据中航班的座位数限制,自动计算各行程的人数与各航班的客座率,如式(29)所示,其中p代表评估的航班人数,i是航空公司n个航班中的第i个,c i 为第i个航班的座位数,d i 为第i个航班的航段大地距离。并自动保存入大数据平台Hive数据仓库。
(29)
S400、若航线被人工增删修改,转至S210重新计算该航线网络评估市场的参数。
S500、通过误差平方和(SSE)的方式判断所述市场的所属类别,使得市场中航线调整的时候能够被自动重新计算,选择误差平方和最小的类别进行归类,保存至所述大数据平台,完成航线网格评估。在航线反复增删的时候,可以自动进行归类。
本发明中,在每一类市场聚类中,采用具有自有销售数据的航空公司销售数量与MIDT市场中该航空公司代理订座的销售数量的比例进行放大,使用ARIMA自动迭代计算的市场需求预测数量,市场中直达航班的数量比例放大等三种方式进行预测,并通过权重对三种市场的预测结果进行整合调整,减少单一的市场预测方法的限制,将市场需求的预测融入了历史的变化与航班计划的变化信息,具有更好的容错性。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法,如:
一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现前述自动化航线网络评估方法的步骤。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等,如实施例二。
实施例二
如图4所示一种电子设备,包括存储器、处理器以及存储在存储器0中的程序,所述程序被配置成由处理器执行,处理器执行所述程序时实现上述自动化航线网络评估方法的步骤。
本发明提供了一种自动化航线网格评估方法、电子设备和存储介质,读取MIDT数据,OAG航班计划数据,OAG静态表、航空公司航段/行程销售数据、历史市场需求预测数据,通过数据能够较好的描述市场的相关信息。采用聚类的方式计算航线网络评估模型的参数,减少单一的市场预测方法的限制。通过误差平方和的方式判断市场的所属类别,选择误差平方和最小的方案结果所对应的类别进行归类。在航线进行反复增删的情况,可自动归类。另外,对不同参数进行计算,无需人工对市场进行判断、分类,减少人工干预而造成的误差。
且将计算与用户使用分离,后台网络评估的计算通过航班计划触发,实现评估流程自动化,且将结果保存在大数据平台中,前端用户使用、查询则则只需要读取相关数据,节省时间。
本实施例中的装置与前述实施例中的方法是基于同一发明构思下的两个方面,在前面已经对方法实施过程作了详细的描述,所以本领域技术人员可根据前述描述清楚地了解本实施中的系统的结构及实施过程,为了说明书的简洁,在此就不再赘述。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。
Claims (7)
1.一种自动化航线网络评估方法,其特征在于,包括
S100、读取并处理数据源信息、行程数据,保存至大数据平台;所述数据源信息包括MIDT数据、OAG航班计划数据、航空公司航段/行程销售数据、历史市场需求预测数据;
S200、对所述行程数据,选择能够描述航空市场的指标,通过聚类方式分析对航空市场进行划分,并在得到的各分类中,结合Logistics回归与深度神经网络的方法,计算航线网络评估市场的参数;
S300、调用所述参数与航班计划,计算该行程的市场份额与航班的客座率,完成航线网络评估;
S400、若某个航班信息被人工调整,转至S200重新计算该该航班所在航线所在航空市场的指标;
S500、通过误差平方和的方式判断所述航线所在航线网络评估市场的聚类所属类别,保存至所述大数据平台;
所述S200还包括
S210、确定需要进行航线网络评估市场的市场范围,根据所述历史市场需求预测数据及行程数据,采用时间序列模型、阈值控制及航空公司生产数据对比缩放相结合的方法,对当前MIDT相同时间段的航线网络评估市场的市场规模进行预测;
S220、根据所述行程数据的区域信息、市场规模,对所述航线网络评估市场进行分类;
S230、计算分类后的行程衔接参数的分布函数,以单侧置信区间获得所述行程衔接参数的阈值;
S240、计算分类后的行程信息各旅客偏好因素的分布函数,以单侧置信区间获得所述各旅客偏好因素参数的阈值,以此阈值过去除高于阈值的行程记录;
S250、计算所述偏好因素两两之间的相关性,标记分类后偏好因素属性值中相关性高于预设数值的因素;
S260、计算航班的预估人数并与所述航空公司航段/行程销售数据中的实际行程人数比较,从所述因素中选择误差平方和最小的因素作为每一分类的旅客偏好因素项;S270、使用概率Logistics回归方法和深度神经网络方法计算所述旅客偏好因素的参数值;
S280、将所述因素参数值与所述OAG航班计划数据合并计算,得到各行程的效用值、航班在每个航线网络评估市场的承运人数比例与航空公司在每个航线网络评估市场的承运人数比例;
S290、计算所述航班在每个航线网络评估市场的承运人数比例与航空公司在每个航线网络评估市场的承运人数比例的误差,选择误差平方和最小的结果对应的参数值,作为聚类中的旅客偏好因素的参数,保存至所述大数据平台中;
所述S220中包括:
S221、计算航线网络评估市场指标,所述航线网络评估市场指标包括各航空市场的市场大小、市场中行程频率、竞争航空公司数量、市场中转行程比例、中转机场数量;
S222、通过k-means的聚类方法对所述航线网络评估市场指标进行聚类,并基于业务特点指定相距较远的聚类初始核心市场及聚类数量;
S223、计算所述聚类的簇内误差平方和,并根据相邻两个所述簇内误差平方和确定连接斜率,以此选择出最优聚类及聚类数量;
S224、保留所述最优聚类的航线网络评估市场指标至所述大数据平台;
S270使用概率Logistics回归方法和深度神经网络方法通过效用函数计算所述因素参数值;所述概率Logistics回归方法采用极大似然法求解所述因素参数值,建立模型为
。
2.如权利要求1所述的一种自动化航线网络评估方法,其特征在于,所述时间序列模型为ARIMA模型,通过AIC准则选择AIC值最小的参数作为预测参数,对航线网络评估市场的市场规模进行预测。
3.如权利要求1所述的一种自动化航线网络评估方法,其特征在于,所述计算分类后的行程衔接参数与各旅客偏好因素的分布函数,还包括每个行程衔接参数与偏好因素做出正态分布假设,以右侧97.5% 的单侧置信区间自动获取用于计算所述参数记录数量;所述右侧的单侧置信区间的计算方法为:
。
4.如权利要求1所述的一种自动化航线网络评估方法,其特征在于,所述S300还包括
S310、从所述大数据平台中读取需要评估的行程的OAG航班计划数据与所述各聚类的行程衔接参数、市场份额因素的参数;
S320、根据所述行程衔接参数,自动计算行程衔接的方案;
S330、根据所述市场份额参数,计算行程的理论市场需求;
S340、若所述理论市场需求少于预设人数,保留并标记该行程,且将行程人数设置为0;转至S330,计算未标记的行程的理论市场需求;
S350、根据所述OAG航班计划数据中航班的座位数限制,计算各行程人数与航班客座率,并保存至所述大数据平台。
5.如权利要求1所述的一种自动化航线网络评估方法,其特征在于,所述S100还包括
S110、循环查询数据源,检测是否存在更新的MIDT数据与OAG航班计划数据;
S120、若存在更新的MIDT数据,则读取MIDT数据,对相同PNR下同一人的航班订座信息,根据预设规则进行拆分;所述预设规则为往返航班拆分、超过预设数量的航班在停留时间最长的中转点拆分、停留时间超过24小时的中转点拆分;
S130、对拆分后的航班订座信息添加相应的行程数据,所述航班订座信息、与所述航班订座信息相匹配的MIDT数据保存至大数据平台。
6.一种电子设备,其特征在于,包括存储器、处理器以及存储在存储器中的程序,所述程序被配置成由处理器执行,处理器执行所述程序时实现如权利要求1至5中任一项所述的一种自动化航线网络评估方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理执行时实现如权利要求1至5任意一项所述的一种自动化航线网络评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910813459.6A CN110751359B (zh) | 2019-08-30 | 2019-08-30 | 一种自动化航线网络评估方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910813459.6A CN110751359B (zh) | 2019-08-30 | 2019-08-30 | 一种自动化航线网络评估方法、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110751359A CN110751359A (zh) | 2020-02-04 |
CN110751359B true CN110751359B (zh) | 2023-10-13 |
Family
ID=69275889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910813459.6A Active CN110751359B (zh) | 2019-08-30 | 2019-08-30 | 一种自动化航线网络评估方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110751359B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149985B (zh) * | 2020-09-17 | 2023-06-23 | 北京工商大学 | 评价和比较图嵌入模型的可视化分析方法与系统 |
CN112801455B (zh) * | 2020-12-31 | 2024-07-19 | 携程旅游网络技术(上海)有限公司 | 航班密度调整方法、系统、电子设备和存储介质 |
CN113313523A (zh) * | 2021-06-01 | 2021-08-27 | 中国民航信息网络股份有限公司 | 一种确定可比较航班的方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105825304A (zh) * | 2015-01-09 | 2016-08-03 | 通用电气公司 | 用于航线航班操作的鲁棒的网络计划优化的方法和系统 |
CN105844346A (zh) * | 2016-03-17 | 2016-08-10 | 福州大学 | 基于arima模型的航班延误预测方法 |
CN106780273A (zh) * | 2016-12-30 | 2017-05-31 | 中国民航信息网络股份有限公司 | 旅客航班需求分析方法和系统 |
CN106779466A (zh) * | 2016-12-30 | 2017-05-31 | 中国民航信息网络股份有限公司 | 事件的处理方法及装置 |
CN107704972A (zh) * | 2017-10-27 | 2018-02-16 | 飞友科技有限公司 | 一种航线旅客需求预测方法 |
CN109446275A (zh) * | 2018-09-03 | 2019-03-08 | 厦门快商通信息技术有限公司 | 一种基于大数据的航空数据分析方法、设备及存储介质 |
CN109858671A (zh) * | 2018-12-26 | 2019-06-07 | 携程旅游网络技术(上海)有限公司 | 预测目标航线的客座率的方法和系统 |
-
2019
- 2019-08-30 CN CN201910813459.6A patent/CN110751359B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105825304A (zh) * | 2015-01-09 | 2016-08-03 | 通用电气公司 | 用于航线航班操作的鲁棒的网络计划优化的方法和系统 |
CN105844346A (zh) * | 2016-03-17 | 2016-08-10 | 福州大学 | 基于arima模型的航班延误预测方法 |
CN106780273A (zh) * | 2016-12-30 | 2017-05-31 | 中国民航信息网络股份有限公司 | 旅客航班需求分析方法和系统 |
CN106779466A (zh) * | 2016-12-30 | 2017-05-31 | 中国民航信息网络股份有限公司 | 事件的处理方法及装置 |
CN107704972A (zh) * | 2017-10-27 | 2018-02-16 | 飞友科技有限公司 | 一种航线旅客需求预测方法 |
CN109446275A (zh) * | 2018-09-03 | 2019-03-08 | 厦门快商通信息技术有限公司 | 一种基于大数据的航空数据分析方法、设备及存储介质 |
CN109858671A (zh) * | 2018-12-26 | 2019-06-07 | 携程旅游网络技术(上海)有限公司 | 预测目标航线的客座率的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110751359A (zh) | 2020-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110751359B (zh) | 一种自动化航线网络评估方法、电子设备及存储介质 | |
US6804658B2 (en) | Method and system for origin-destination passenger demand forecast inference | |
Sherali et al. | A benders decomposition approach for an integrated airline schedule design and fleet assignment problem with flight retiming, schedule balance, and demand recapture | |
CN110599767A (zh) | 一种基于网约车出行需求的长短期预测方法 | |
US11599846B2 (en) | Method and system for selection of a path for deliveries | |
US20150161636A1 (en) | Method and server for providing a set of price estimates, such as air fare price estimates | |
US20210174270A1 (en) | Rideshare vehicle demand forecasting device, method for forecasting rideshare vehicle demand, and storage medium | |
US20150276410A1 (en) | Journey planning method and system | |
CN111192090A (zh) | 航班的座位分配方法、装置、存储介质和电子设备 | |
CN105809280A (zh) | 一种机场容量需求预测方法 | |
Chen et al. | Decentralised cooperative cruising of autonomous ride-sourcing fleets | |
JP7316233B2 (ja) | データ処理システムおよびデータ処理方法 | |
Long et al. | Demand analysis in urban air mobility: A literature review | |
CN111353625B (zh) | 一种网点件量预测方法、装置、计算机设备及存储介质 | |
JP2021128478A5 (zh) | ||
CN112926809B (zh) | 一种基于聚类和改进的xgboost的航班流量预测方法及系统 | |
CN116703044A (zh) | 一种航班中转组合方法及装置 | |
CN117333093A (zh) | 配送订单的处理方法、装置、设备及存储介质 | |
CN106779245B (zh) | 基于事件的民航需求预测方法和装置 | |
CN113191533A (zh) | 仓库用工预测方法、装置、设备及存储介质 | |
CN112926796A (zh) | 一种基于特定场景的下车点推荐方法及装置 | |
Xue | Adaptive Cultural Algorithm‐Based Cuckoo Search for Time‐Dependent Vehicle Routing Problem with Stochastic Customers Using Adaptive Fractional Kalman Speed Prediction | |
CN116663834A (zh) | 航空乘务排班方法、装置、计算机设备和存储介质 | |
US20230090740A1 (en) | System and Method for Predicting Arrival Time in a Freight Delivery System | |
EP2927847A1 (en) | Journey planning method and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |