CN110751359A - 一种自动化航线网络评估方法、电子设备及存储介质 - Google Patents

一种自动化航线网络评估方法、电子设备及存储介质 Download PDF

Info

Publication number
CN110751359A
CN110751359A CN201910813459.6A CN201910813459A CN110751359A CN 110751359 A CN110751359 A CN 110751359A CN 201910813459 A CN201910813459 A CN 201910813459A CN 110751359 A CN110751359 A CN 110751359A
Authority
CN
China
Prior art keywords
market
data
flight
airline
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910813459.6A
Other languages
English (en)
Other versions
CN110751359B (zh
Inventor
杨帆
钟明
陈创希
卢春
赵磊
许南
凌国庆
雷松云
郑炜旸
常先英
张宗灵
杨秀娟
周兴
黄旭
陆峻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHINA NANFANG AIRWAYS Co Ltd
Original Assignee
CHINA NANFANG AIRWAYS Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHINA NANFANG AIRWAYS Co Ltd filed Critical CHINA NANFANG AIRWAYS Co Ltd
Priority to CN201910813459.6A priority Critical patent/CN110751359B/zh
Publication of CN110751359A publication Critical patent/CN110751359A/zh
Application granted granted Critical
Publication of CN110751359B publication Critical patent/CN110751359B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种自动化航线网格评估方法、电子设备及存储介质,包括读取并处理数据源信息、行程数据,保存至大数据平台;对所述行程数据,选择能够描述航空市场的指标,通过聚类方式分析对航空市场进行划分,并在得到的各分类中,结合Logistics回归与深度神经网络的方法,计算航线网络评估市场的参数;调用参数与航班计划,计算该行程的市场份额与航班的客座率;若某个航班信息被人工调整,重新计算该航班所在航线航空市场的指标;通过误差平方和的方式判断所述航线所在航线网络评估市场的聚类所属类别并保存。本发明从自动化的角度,将原本基于主观经验的方式,转化为基于模型的计算方式,减少人工干预,更好调整航空公司运力安排,具有较高的容错性。

Description

一种自动化航线网络评估方法、电子设备及存储介质
技术领域
本发明涉及航空应用工程技术领域,尤其涉及一种自动化航线网格评估方 法、电子设备及存储介质。
背景技术
在全球航空网络下,航空公司如何根据现有运力情况,合理的安排航线、 机型,是实现盈利的一个非常重要的环节。安排运力涉及到未来的市场份额预 测问题,而在全球航空网络的环境中,包括已有市场和潜在市场在内,一个规 模化的网络型航空公司相关的市场数量通常会达到10万以上。如何在庞大数量 的市场中,进行自动化航线网络的分析,是提高自动化运力分配,实现航空公 司可持续发展的一个重要方向。
传统的市场分析技术主要包含两种:(1)对单个的市场进行分析,通常会 针对该市场寻找各种影响因素及数据进行手工分析;(2)对于规模化的市场群 分析,现有的技术主要通过手工下载全球分销系统GDS(Global Distribution System)的代理订座数据MIDT(Market Information Data Tape),根据设定的规 则(一般是行程间12小时间隔)形成旅客的行程(Itinerary)数据。根据行程 数据计算各参数,然后将参数做成数据包,每次都需要使用专门的工具读取, 进行内存计算与展示。
第一种方式覆盖面太窄,无法从网络的角度得到计算结果,容易出现顾此 失彼的情况,评估结果无法做到科学有效;采用第二种方式的情况下,需要在 本地计算机使用SAS(一种统计分析软件)等软件进行大量的数据计算,耗费 极长的时间,并且手工计算过程需要大量的人工干预,主观因素强,不同人员 的数据处理结果进行评估,差距较大。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种自动化航线网 格评估方法,克服现有技术中人工处理造成主观因素强的问题,将历史、航班 计划的变化加入对市场的预测,进行整合调整,具有更好的容错性。
本发明的目的之二在于提供一种电子设备,克服现有技术中人工处理造成 主观因素强的问题,将历史、航班计划的变化加入对市场的预测,进行整合调 整,具有更好的容错性。
本发明的目的之三在于提供一种存储介质,存储有计算机程序,克服现有 技术中人工处理造成主观因素强的问题,将历史、航班计划的变化加入对市场 的预测,进行整合调整,具有更好的容错性。
本发明的目的之一采用如下技术方案实现:
一种自动化航线网络评估方法,包括
S100、读取并处理数据源信息、行程数据,保存至大数据平台;所述数据 源信息包括MIDT数据、OAG航班计划数据、航空公司航段/行程销售数据、历 史市场需求预测数据;
S200、对所述行程数据,选择能够描述航空市场的指标,通过聚类方式分 析对航空市场进行划分,并在得到的各分类中,结合Logistics回归与深度神经 网络的方法,计算航线网络评估市场的参数;
S300、调用所述参数与航班计划,计算该行程的市场份额与航班的客座率, 完成航线网络评估;
S400、若某个航班信息被人工调整,转至S200重新计算该航班所在航线航 空市场的指标;
S500、通过误差平方和的方式判断所述航线所在航线网络评估市场的聚类 所属类别,保存至所述大数据平台。
进一步地,所述S200还包括
S210、确定需要进行航线网络评估市场的市场范围,根据所述历史市场需 求预测数据及行程数据,采用时间序列模型、阈值控制及航空公司生产数据对 比缩放相结合的方法,对当前MIDT相同时间段的航线网络评估市场的市场规 模进行预测;
S220、根据所述行程数据的区域信息、市场规模,对所述航线网络评估市 场进行分类;
S230、计算分类后的行程衔接参数的分布函数,以单侧置信区间获得所述 行程衔接参数的阈值;
S240、计算分类后的行程信息各旅客偏好因素的分布函数,以单侧置信区 间获得所述各旅客偏好因素参数的阈值,以此阈值过去除高于阈值的行程记录;
S250、计算所述偏好属性因素两两之间的相关性,标记分类后所述属性值 中相关性高于预设数值的因素;
S260、计算航班的预估人数并与所述航空公司航段/行程销售数据中的实际 行程人数比较,从所述因素中选择误差平方和最小的因素作为每一分类的旅客 偏好因素项;
S270、使用概率Logistics回归方法和深度神经网络方法计算所述旅客偏好 因素的参数值;
S280、将所述因素参数值与所述OAG航班计划数据合并计算,得到各行程 的效用值、航班在每个航线网络评估市场的承运人数比例与航空公司在每个航 线网络评估市场的承运人数比例;
S290、计算所述航班在每个航线网络评估市场的承运人数比例与航空公司 在每个航线网络评估市场的承运人数比例的误差,选择误差平方和最小的结果 对应的参数值,作为聚类中的旅客偏好因素的参数,保存至所述大数据平台中。
进一步地,所述时间序列模型为ARIMA模型,通过AIC准则选择AIC值 最小的参数作为预测参数,对航线网络评估市场的市场规模进行预测。
进一步地,所述S220中包括:
S221、计算航线网络评估市场指标,所述航线网络评估市场指标包括各航 空市场的市场大小、市场中行程频率、竞争航空公司数量、市场中转行程比例、 中转机场数量;
S222、通过k-means的聚类方法对所述航线网络评估市场指标进行聚类, 并基于业务特点指定相距较远的聚类初始核心市场及聚类数量;
S223、计算所述聚类的簇内误差平方和,并根据相邻两个所述簇内误差平 方和确定连接斜率,以此选择出最优聚类及聚类数量;
S224、保留所述最优聚类的航线网络评估市场指标至所述大数据平台。
进一步地,S270使用概率Logistics回归方法和深度神经网络方法通过效 用函数计算所述因素参数值;所述概率Logistics回归方法采用极大似然法求解 所述因素参数值,建立模型为
Figure BDA0002185675090000053
Figure BDA0002185675090000054
进一步地,S230中计算分类后的行程衔接参数与偏好属性值,还包括每个 行程衔接参数与偏好属性值做出正态分布假设,以右侧97.5%的单侧置信区间 自动获取用于计算所述参数记录数量;所述右侧的单侧置信区间的计算方法为:
cutoff=μ+3σ。
进一步地,所述S300还包括
S310、从所述大数据平台中读取需要评估的行程的OAG航班计划数据与所 述各聚类的行程衔接参数、市场份额因素的参数;
S320、根据所述行程衔接参数,自动计算行程衔接的方案;
S330、根据所述市场份额参数计算行程的理论市场需求;
S340、若所述理论市场需求少于预设人数,保留并标记该行程,且将行程 人数设置为0;转至S330,计算未标记的行程的理论市场需求;
S350、根据所述OAG航班计划数据中航班的座位数限制,计算各行程人数 与航班客座率,并保存至所述大数据平台。
进一步地,所述S100还包括
S110、循环查询数据源,检测是否存在更新的MIDT数据与OAG航班计划 数据;
S120、若存在更新的MIDT数据,则读取MIDT数据,对相同PNR下同一 人的航班订座信息,根据预设规则进行拆分;所述预设规则为往返航班拆分、 超过预设数量的航班在停留时间最长的中转点拆分、停留时间超过24小时的中 转点拆分;
S130、对拆分后的航班订座信息添加相应的行程数据,所述航班订座信息、 与所述航班订座信息相匹配的MIDT数据保存至大数据平台。
本发明的目的之二采用如下技术方案实现:
一种电子设备,包括存储器、处理器以及存储在存储器中的程序,所述程 序被配置成由处理器执行,处理器执行所述程序时实现如上任一项的一种自动 化航线网格评估方法的步骤。
本发明的目的之三采用如下技术方案实现:
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处 理执行时实现如上任意一项所述的一种自动化航线网格评估方法。
相比现有技术,本发明的有益效果在于:
提供了一种自动化航线网格评估方法、电子设备和存储介质,读取MIDT 数据,OAG航班计划数据,OAG静态表、航空公司航段/行程销售数据、历史 市场需求预测数据,通过数据能够较好的描述市场的相关信息。采用聚类的方 式计算航线网络评估模型的参数,减少单一的市场预测方法的限制。通过误差 平方和的方式判断市场的所属类别,选择误差平方和最小的方案结果所对应的 类别进行归类。在航线进行反复增删的情况,可自动归类。另外,对不同参数 进行计算,无需人工对市场进行判断、分类,减少人工干预而造成的误差。
且将计算与用户使用分离,后台网络评估的计算通过航班计划触发,实现 评估流程自动化,且将结果保存在大数据平台中,前端用户使用、查询则只需 要读取相关数据,节省时间。
附图说明
图1为本发明所提供实施例一的流程示意图;
图2为本发明所提供实施例一的深度神经网络模型示意图;
图3为本发明所提供实施例一的另一深度神经网络模型示意图;
图4为本发明所提供实施例二的电子设备结构示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的 是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任 意组合形成新的实施例。
实施例一
如图1-3所示,本发明提供了一种自动化航线网络评估方法,包括以下步骤:
S100、读取并处理数据源信息、行程数据,保存至大数据平台;所述数据 源信息包括MIDT数据、OAG航班计划数据、航空公司航段/行程销售数据、历 史市场需求预测数据;
具体包括S110:循环查询数据源(FTP服务器,File Transport Protocol), 检测是否存在更新的MIDT数据与OAG航班计划数据。
S120:若存在更新的MIDT数据,则读取MIDT数据,对相同PNR(Passenger NameRecord,用于判断是否同一人订座的标识符)下同一人的航班订座信息,根 据预设规则进行拆分,所述规则包括:往返航班拆分,超过3段航班在停留时 间最长的中转点拆分,停留时间超过24小时的中转点拆分。
S130:对拆分后的航班订座信息添加相应的行程数据,具体包括地理信息, 如匹配始发、到达机场,增加经纬度、时区信息,计算行程距离(具体算法如 式(1)所示)、行程内航段距离和;
其中,Rearth表示大地球面距离,lat1,lon1表示地面上点1的经纬度,lat2,lon2 表示地面上点2的经纬度。
时区信息,如匹配始发、到达机场所在时区,出发、到达时刻,增加夏令 时/国际时区信息;航班信息,如匹配始发、到达机场、航班号、出发时刻,增 加执飞航空公司、航班号、代码共享信息;机型信息,如匹配执飞机型,增加 座位数信息。
完成后,自动保存行程数据,与行程数据按计划出发时间段范围匹配,匹 配成功的MIDT数据、航空公司销售数据至大数据平台Hive数据仓库。
S200、对所述行程数据,选择能够描述航空市场的指标,通过聚类方式分 析对航空市场进行划分,并在得到的各分类中,结合Logistics回归与深度神经 网络的方法,计算航线网络评估市场的参数;
具体包括S210、确定需要进行航线网络评估市场的市场范围,根据所述历 史市场需求预测数据及行程数据,采用时间序列模型、阈值控制及航空公司生 产数据对比缩放相结合的方法,对当前MIDT相同时间段的航线网络评估市场 的市场规模进行预测;
在网络中市场(含潜在市场)定义包含:(1)本航空公司在历史上存在直 达、中转的市场;(2)依据当前评估期的航班计划,以本航空公司的航段始发 为出发地,本航空公司所有航段的到达机场,可衔接上的所有下一航段(包含 本航空公司及其他航空公司执飞)的到达机场为目的地;(3)上述市场的返程 市场。
在确定评估市场范围内,根据历史市场需求预测数据及行程数据,采用时 间序列模型中的ARIMA(Autoregressive Integrated Moving Average model,如式 (2)所示)及阈值控制对当前MIDI相同时间段的航线网络评估市场进行预测。
Figure BDA0002185675090000091
时间序列模型中的评估周市场规模则是通过ARIMA采用AIC准则(AkaikeInformation Criterion,式(3)所示)
Figure BDA0002185675090000092
自动选择阶数(p,q,d),通过设置不同的(0,0,1),(0,1,0),(0,1,1)一直递增 至(4,4,4)。从中选择AIC值最小的组合,作为最优的预测参数进行预测,其对 市场的预测值为Xh。计算该市场中,MIDT数据统计结果xmidt与航空公司自有 客票销售数据中的市场订座数据xal的比值进行填充,填充则采用如式(4)所示 的形式。
Figure BDA0002185675090000093
其中,n代表某市场中航空公司的数量;xal,eval表示具有自由客票销售数据 的航空公司在该市场的实际销售数据/周;xmidt,eval表示在MIDT中,相应航空公 司的销售数据/周,由于MIDT中不包含有航空公司直销数据,因此两者的比值 大于1,该公式相当于放大系数;Xg为自由增长率,由当前评估周的直达航班座 位数sj,t与上周的航班座位数sj′,t-1的比值确定,如式(5)所示,
而对市场的需求预测,市场大小XF采用如式(6)所示的加权形式,其中 α123为权重,缺省情况下,α1=α2=1,α3=2。
Figure BDA0002185675090000102
S220、根据行程数据的区域信息、市场规模,自动对航线网络评估市场进 行分类;
S221、计算航线网络评估市场指标,航线网络评估市场指标包括S210中计 算的航空市场的市场大小X F、市场中行程频率Ii,nbr(行程频率即在MIDT历史 数据中,某市场中的不同类型的行程数量,不同类型定义为不同日期DOW(Day of Week)、航空公司、航班号的衔接)、市场中竞争航空公司数量Ali,nbr、市场中 的中转行程比例Ii,inter_perc(市场中中转行程占所有行程的比例,除中转外,还有 直达行程),中转机场数量Apti,inter_nbr(市场中中转行程所经过的不同机场的数 量)。上述指标能够较为全面的描述航空市场的特点。
S222、通过k-means的聚类方法对所述航线网络评估市场指标进行聚类, 并基于业务特点指定相距较远的聚类初始核心市场及聚类数量。由于k-means 的聚类方法需要事先指定聚类数量,且初始聚类核心对结果有一定影响。因此 事先设定部分初始聚类核心市场,如BJS-CAN:国内高频市场,BJS-NYC:国 际长线市场,CAN-TYO:国际短线市场。采用循环的方式,将聚类数量范围限 定为[10,市场数量]。具体的网络型航空公司包含潜在市场的全网络完整的市场 数量为20万,共享度较高的市场通常是5000个,而聚类上线缺省值为1000。 过多的聚类数量会导致聚类内市场数量较少,组间特征不明显。因此本实施例 的聚类数量范围为[10,1000]。
S223、计算所述聚类的簇内误差平方和,并根据相邻两个所述簇内误差平 方和确定连接斜率,以此选择出最优聚类及聚类数量;;
计算完每次聚类,则计算聚类的簇内误差平方和(Sum of Squares for Error,SSE),如式(7)所示,
其中,i代表某次聚类满足收敛条件后,聚类的n个簇内的第i个簇,x′i,j,k代 表标准化后的第i个簇内的第j个市场的第k个属性,μ′i,k代表标准化后的第i个 簇内的核心中的第k个属性,r代表S222中的属性数量,mi代表在第i个簇内 有mi个市场)。
连接相邻邻聚类数量ST后,每相邻两个ST计算连接斜率(如式(8)所示, 两点确定一条直线),如(10)所示,推导过程如式(8)(9)所示,可近似认 为,在聚类簇数量增大的过程中,k越接近0且小于0,则聚类方案最优。但是 过多的聚类会导致系统计算效率降低,因此选择k>-1(-45角)且k<0的第一个 聚类方案,以此作为优选的市场聚类数量。
Figure BDA0002185675090000121
y=(ST(a-1)-ST(a))x+(ST(a)a+ST(a)-ST(a-1)a) (9)
k=ST(a-1)-ST(a) (10)
S224、最优聚类航线网络评估市场类别中,S221计算的航线网络评估市场 指标均值会被保留,并保存至大数据平台Hive数据仓库中。
在本发明中,参数的计算方式改为聚类,将市场大小、市场中行程频率、 市场中竞争航空公司数量、市场中的中转行程比例、市场中转机场数量作为聚 类指标,上述指标能够较好地描述一个市场,避免了现有技术中强行划分市场 的问题。
S230、计算分类后的行程衔接参数的分布函数,以单侧置信区间获得上述 参数的阈值,并保存于大数据平台。
在分类中,行程衔接参数包括行程的静态绕航率、相对绕航率最小过站时 间、行程时间倍率、行程最小频率、最差行程类型、中转行程类型数量等。具 体的,静态绕航率,为行程多航段的大地距离和与行程所在市场的直达大地距 离(式(1)表达式)的比值;相对绕航率,是指若市场中含有直达行程,则该参 数与静态绕航率相同,若市场中不含直达行程,则为行程多段的大地距离与行 程所在市场的最短的多段航段衔接的距离的比值;行程时间倍率,指行程时间 绕航率;行程最小频率,为中转行程的频率;最差行程类型,指最差行程类型 表示某市场中能够被接受的最差行程,行程从优到劣依次为直达、联程、同航 空公司一次中转,联盟一次中转,非联盟一次中转,同航空公司二次中转,联 盟二次中转,非联盟二次中转;中转行程类型数量,指当中转行程到达中转站 之后,后续能够衔接的出港航班数量,及某一中转站的出港航班,能够衔接的 进港航班数量。
对每个衔接参数均做出正态分布的假设,如式(11)—(13)所示,以右 侧97.5%的单侧置信区间自动获取用于计算参数的记录数量,以统计的方式进行 解释,降低每个数据处理人员主管经验所造成的误差。由于参数用于过滤极大 超出正常范围的记录,因此在均值右侧方面进行限制,在均值左侧不做限制。
Figure BDA0002185675090000131
Figure BDA0002185675090000132
S240、计算分类后的行程信息各旅客偏好因素的分布函数,以单侧置信区间获 得上述参数的阈值,以此阈值过去除高于阈值的行程记录。行程的偏好属性因 素包括行程的出发时间(每隔tk-tk-1采样时间统计该采样时间内出发行程人数, 如式(14)(15)所示,并对整条曲线标准化,计算出发时间属性,如(16)所 示;出发时间(如式(17)所示)、到达时间(如式(18)所示)、过站时间、 行程时间、航段时间之和、同航空公司中转、不同航空公司中转、始发航站、 到达航站、中转航站、航空公司、直达。直达是如式(19)所示,式中con为 行程中转类型分类变量,以nonstop直飞类型为参考值,其余三种β值为该对应 衔接类型相对nonstop类型的β值。市场中每个行程必为 Nonstop/Through/Online/Interline中的一种。Nstops表示行程的中转次数,包括联 程航班的中转。Ncs表示代码共享航空公司个数。part表示前后航段执飞航空公 司是否为联盟,为0-1变量。)
同样,对所述偏好属性因素做出正态分布假设,以右侧97.5%的单侧置信区 间(均值+单侧3倍标准差,由于参数用于过滤极大超出正常范围的记录,因此 在均值右侧方面进行限制,在均值左侧不做限制),自动获取用于计算参数的记 录数量。
Figure BDA0002185675090000142
Figure BDA0002185675090000143
udep=βdep×ln(deppref(tdep)+1) (17)
uarr=βarr×ln(arrpref(tarr)+1) (18)
Figure BDA0002185675090000144
S250、计算上述各偏好属性因素两两之间的相关性(如式(20)所示)。分 类后,对相关性高于0.7的因素进行自动标记。
Figure BDA0002185675090000145
S260、计算航班的预估人数(如式(27)(28))并与所述航空公司航段/行 程销售数据中的实际行程人数比较,从所述因素中选择误差平方和最小的因素 作为每一分类的旅客偏好因素项。
U=udep+uarr+uelap+ucon+umktpre+ucmp (3)
S270、使用概率Logistics回归方法与深度神经网络方法通过式(17)(18) (19)等效用函数计算各因素的参数值。具体的,概率Logistics回归方法采用 极大似然求解参数,建立的模型如式(21)-(24)所示,而深度神经神经网络 的模型如图2、3所示。
Figure BDA0002185675090000151
Figure BDA0002185675090000152
Figure BDA0002185675090000153
S280、将所述因素参数值与所述OAG航班计划数据合并计算(如式(17) (18)(19),得到各行程的效用值u、航班在每个航线网络评估市场的承运人数 比例mktshreval与航空公司在每个航线网络评估市场的承运人数比例mktshract
S290、计算所述航班在每个航线网络评估市场的承运人数比例与航空公司 在每个航线网络评估市场的承运人数比例的误差,如式(25);
bias=mktshreval-mktshract (25)
选择误差平方和最小(SSE)如式(26)所示的结果对应的参数值,作为聚 类中的旅客偏好因素的参数,并保存至所述大数据平台。
本发明中,采用Logistics回归及深度神经网络分别计算模型参数,避免了 现有技术中,对模型的拟合程度低,后期需要大量手工参数修改的问题。
S300、调用参数与航班计划,计算该行程的市场份额与航班的客座率,完 成航线网络评估。
S310:从所述大数据平台中读取需要评估的行程的OAG航班计划数据与所 述各聚类的行程衔接参数、市场份额因素的参数;
S320:根据行程衔接参数,自动计算行程衔接的方案。
S330:根据所述市场份额参数,自动计算各行程的理论市场需求,如式(27)、 (28)所示,根据预设的阈值,优选旅客数量多的行程。
Figure BDA0002185675090000161
U=udep+uarr+uelap+ucon+umktpre+ucmp (28)
S340、若所述理论市场需求少于预设人数,保留行程并进行标记,且将行 程人数设置为0;转至S330,计算未标记的行程的理论市场需求。具体的,本 实施例中,对评估结果少于0.5人的行程,则保留行程,但是行程人数设置为0, 不占用座位数。从物理含义上解释,即该行程有存在的可能性,但是实际上没 有人搭乘,将该部分行程进行标记,重复S330,在未标记的行程中计算理论市 场需求。
S350:根据所述OAG航班计划数据中航班的座位数限制,自动计算各行 程的人数与各航班的客座率,如式(29)所示,其中p代表评估的航班人数,i 是航空公司n个航班中的第i个,ci为第i个航班的座位数,di为第i个航班的 航段大地距离。并自动保存入大数据平台Hive数据仓库。
Figure BDA0002185675090000162
S400、若航线被人工增删修改,转至S210重新计算该航线网络评估市场的 参数。
S500、通过误差平方和(SSE)的方式判断所述市场的所属类别,使得市场 中航线调整的时候能够被自动重新计算,选择误差平方和最小的类别进行归类, 保存至所述大数据平台,完成航线网格评估。在航线反复增删的时候,可以自 动进行归类。
本发明中,在每一类市场聚类中,采用具有自有销售数据的航空公司销售 数量与MIDT市场中该航空公司代理订座的销售数量的比例进行放大,使用 ARIMA自动迭代计算的市场需求预测数量,市场中直达航班的数量比例放大等 三种方式进行预测,并通过权重对三种市场的预测结果进行整合调整,减少单 一的市场预测方法的限制,将市场需求的预测融入了历史的变化与航班计划的 变化信息,具有更好的容错性。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本 发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发 明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式 体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、 光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器, 或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法,如:
一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理 器执行时实现前述自动化航线网络评估方法的步骤。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算 机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基 于微处理器的系统、机顶盒、可编程的消费电子设备、网络PC、小型计算机、 大型计算机、包括以上任何系统或设备的分布式计算环境等等,如实施例二。
实施例二
如图4所示一种电子设备,包括存储器、处理器以及存储在存储器0中的 程序,所述程序被配置成由处理器执行,处理器执行所述程序时实现上述自动 化航线网络评估方法的步骤。
本发明提供了一种自动化航线网格评估方法、电子设备和存储介质,读取 MIDT数据,OAG航班计划数据,OAG静态表、航空公司航段/行程销售数据、 历史市场需求预测数据,通过数据能够较好的描述市场的相关信息。采用聚类 的方式计算航线网络评估模型的参数,减少单一的市场预测方法的限制。通过 误差平方和的方式判断市场的所属类别,选择误差平方和最小的方案结果所对 应的类别进行归类。在航线进行反复增删的情况,可自动归类。另外,对不同 参数进行计算,无需人工对市场进行判断、分类,减少人工干预而造成的误差。
且将计算与用户使用分离,后台网络评估的计算通过航班计划触发,实现 评估流程自动化,且将结果保存在大数据平台中,前端用户使用、查询则则只 需要读取相关数据,节省时间。
本实施例中的装置与前述实施例中的方法是基于同一发明构思下的两个方 面,在前面已经对方法实施过程作了详细的描述,所以本领域技术人员可根据 前述描述清楚地了解本实施中的系统的结构及实施过程,为了说明书的简洁, 在此就不再赘述。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的 范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换 均属于本发明所要求保护的范围。

Claims (10)

1.一种自动化航线网络评估方法,其特征在于,包括
S100、读取并处理数据源信息、行程数据,保存至大数据平台;所述数据源信息包括MIDT数据、OAG航班计划数据、航空公司航段/行程销售数据、历史市场需求预测数据;
S200、对所述行程数据,选择能够描述航空市场的指标,通过聚类方式分析对航空市场进行划分,并在得到的各分类中,结合Logistics回归与深度神经网络的方法,计算航线网络评估市场的参数;
S300、调用所述参数与航班计划,计算该行程的市场份额与航班的客座率,完成航线网络评估;
S400、若某个航班信息被人工调整,转至S200重新计算该航班所在航线所在航空市场的指标;
S500、通过误差平方和的方式判断所述航线所在航线网络评估市场的聚类所属类别,保存至所述大数据平台。
2.如权利要求1所述的一种自动化航线网络评估方法,其特征在于,所述S200还包括
S210、确定需要进行航线网络评估市场的市场范围,根据所述历史市场需求预测数据及行程数据,采用时间序列模型、阈值控制及航空公司生产数据对比缩放相结合的方法,对当前MIDT相同时间段的航线网络评估市场的市场规模进行预测;
S220、根据所述行程数据的区域信息、市场规模,对所述航线网络评估市场进行分类;
S230、计算分类后的行程衔接参数的分布函数,以单侧置信区间获得所述行程衔接参数的阈值;
S240、计算分类后的行程信息各旅客偏好因素的分布函数,以单侧置信区间获得所述各旅客偏好因素参数的阈值,以此阈值过去除高于阈值的行程记录;
S250、计算所述偏好属性因素两两之间的相关性,标记分类后所述属性值中相关性高于预设数值的因素;
S260、计算航班的预估人数并与所述航空公司航段/行程销售数据中的实际行程人数比较,从所述因素中选择误差平方和最小的因素作为每一分类的旅客偏好因素项;
S270、使用概率Logistics回归方法和深度神经网络方法计算所述旅客偏好因素的参数值;
S280、将所述因素参数值与所述OAG航班计划数据合并计算,得到各行程的效用值、航班在每个航线网络评估市场的承运人数比例与航空公司在每个航线网络评估市场的承运人数比例;
S290、计算所述航班在每个航线网络评估市场的承运人数比例与航空公司在每个航线网络评估市场的承运人数比例的误差,选择误差平方和最小的结果对应的参数值,作为聚类中的旅客偏好因素的参数,保存至所述大数据平台中。
3.如权利要求2所述的一种自动化航线网络评估方法,其特征在于,所述时间序列模型为ARIMA模型,通过AIC准则选择AIC值最小的参数作为预测参数,对航线网络评估市场的市场规模进行预测。
4.如权利要求2所述的一种自动化航线网络评估方法,其特征在于,所述S220中包括:
S221、计算航线网络评估市场指标,所述航线网络评估市场指标包括各航空市场的市场大小、市场中行程频率、竞争航空公司数量、市场中转行程比例、中转机场数量;
S222、通过k-means的聚类方法对所述航线网络评估市场指标进行聚类,并基于业务特点指定相距较远的聚类初始核心市场及聚类数量;
S223、计算所述聚类的簇内误差平方和,并根据相邻两个所述簇内误差平方和确定连接斜率,以此选择出最优聚类及聚类数量;
S224、保留所述最优聚类的航线网络评估市场指标至所述大数据平台。
5.如权利要求2所述的一种自动化航线网络评估方法,其特征在于,S270使用概率Logistics回归方法和深度神经网络方法通过效用函数计算所述因素参数值;所述概率Logistics回归方法采用极大似然法求解所述因素参数值,建立模型为
Figure FDA0002185675080000031
Figure FDA0002185675080000032
Figure FDA0002185675080000033
6.如权利要求2所述的一种自动化航线网络评估方法,其特征在于,所述计算分类后的行程衔接参数与各旅客偏好属性因素的分布函数,还包括每个行程衔接参数与偏好属性因素做出正态分布假设,以右侧97.5%的单侧置信区间自动获取用于计算所述参数记录数量;所述右侧的单侧置信区间的计算方法为:
cutoff=μ+3σ。
7.如权利要求4所述的一种自动化航线网络评估方法,其特征在于,所述S300还包括
S310、从所述大数据平台中读取需要评估的行程的OAG航班计划数据与所述各聚类的行程衔接参数、市场份额因素的参数;
S320、根据所述行程衔接参数,自动计算行程衔接的方案;
S330、根据所述市场份额参数,计算行程的理论市场需求;
S340、若所述理论市场需求少于预设人数,保留并标记该行程,且将行程人数设置为0;转至S330,计算未标记的行程的理论市场需求;
S350、根据所述OAG航班计划数据中航班的座位数限制,计算各行程人数与航班客座率,并保存至所述大数据平台。
8.如权利要求1所述的一种自动化航线网络评估方法,其特征在于,所述S100还包括
S110、循环查询数据源,检测是否存在更新的MIDT数据与OAG航班计划数据;
S120、若存在更新的MIDT数据,则读取MIDT数据,对相同PNR下同一人的航班订座信息,根据预设规则进行拆分;所述预设规则为往返航班拆分、超过预设数量的航班在停留时间最长的中转点拆分、停留时间超过24小时的中转点拆分;
S130、对拆分后的航班订座信息添加相应的行程数据,所述航班订座信息、与所述航班订座信息相匹配的MIDT数据保存至大数据平台。
9.一种电子设备,其特征在于,包括存储器、处理器以及存储在存储器中的程序,所述程序被配置成由处理器执行,处理器执行所述程序时实现如权利要求1至8中任一项所述的一种自动化航线网络评估方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理执行时实现如权利要求1至8任意一项所述的一种自动化航线网络评估方法。
CN201910813459.6A 2019-08-30 2019-08-30 一种自动化航线网络评估方法、电子设备及存储介质 Active CN110751359B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910813459.6A CN110751359B (zh) 2019-08-30 2019-08-30 一种自动化航线网络评估方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910813459.6A CN110751359B (zh) 2019-08-30 2019-08-30 一种自动化航线网络评估方法、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110751359A true CN110751359A (zh) 2020-02-04
CN110751359B CN110751359B (zh) 2023-10-13

Family

ID=69275889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910813459.6A Active CN110751359B (zh) 2019-08-30 2019-08-30 一种自动化航线网络评估方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110751359B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112149985A (zh) * 2020-09-17 2020-12-29 北京工商大学 评价和比较图嵌入模型的可视化分析方法与系统
CN112801455A (zh) * 2020-12-31 2021-05-14 携程旅游网络技术(上海)有限公司 航班密度调整方法、系统、电子设备和存储介质
CN113313523A (zh) * 2021-06-01 2021-08-27 中国民航信息网络股份有限公司 一种确定可比较航班的方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160203722A1 (en) * 2015-01-09 2016-07-14 General Electric Company Method and system for robust network planning optimization of airline flight operations
CN105844346A (zh) * 2016-03-17 2016-08-10 福州大学 基于arima模型的航班延误预测方法
CN106779466A (zh) * 2016-12-30 2017-05-31 中国民航信息网络股份有限公司 事件的处理方法及装置
CN106780273A (zh) * 2016-12-30 2017-05-31 中国民航信息网络股份有限公司 旅客航班需求分析方法和系统
CN107704972A (zh) * 2017-10-27 2018-02-16 飞友科技有限公司 一种航线旅客需求预测方法
CN109446275A (zh) * 2018-09-03 2019-03-08 厦门快商通信息技术有限公司 一种基于大数据的航空数据分析方法、设备及存储介质
CN109858671A (zh) * 2018-12-26 2019-06-07 携程旅游网络技术(上海)有限公司 预测目标航线的客座率的方法和系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160203722A1 (en) * 2015-01-09 2016-07-14 General Electric Company Method and system for robust network planning optimization of airline flight operations
CN105825304A (zh) * 2015-01-09 2016-08-03 通用电气公司 用于航线航班操作的鲁棒的网络计划优化的方法和系统
CN105844346A (zh) * 2016-03-17 2016-08-10 福州大学 基于arima模型的航班延误预测方法
CN106779466A (zh) * 2016-12-30 2017-05-31 中国民航信息网络股份有限公司 事件的处理方法及装置
CN106780273A (zh) * 2016-12-30 2017-05-31 中国民航信息网络股份有限公司 旅客航班需求分析方法和系统
CN107704972A (zh) * 2017-10-27 2018-02-16 飞友科技有限公司 一种航线旅客需求预测方法
CN109446275A (zh) * 2018-09-03 2019-03-08 厦门快商通信息技术有限公司 一种基于大数据的航空数据分析方法、设备及存储介质
CN109858671A (zh) * 2018-12-26 2019-06-07 携程旅游网络技术(上海)有限公司 预测目标航线的客座率的方法和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112149985A (zh) * 2020-09-17 2020-12-29 北京工商大学 评价和比较图嵌入模型的可视化分析方法与系统
CN112149985B (zh) * 2020-09-17 2023-06-23 北京工商大学 评价和比较图嵌入模型的可视化分析方法与系统
CN112801455A (zh) * 2020-12-31 2021-05-14 携程旅游网络技术(上海)有限公司 航班密度调整方法、系统、电子设备和存储介质
CN113313523A (zh) * 2021-06-01 2021-08-27 中国民航信息网络股份有限公司 一种确定可比较航班的方法及系统

Also Published As

Publication number Publication date
CN110751359B (zh) 2023-10-13

Similar Documents

Publication Publication Date Title
Shavarani et al. A congested capacitated multi-level fuzzy facility location problem: An efficient drone delivery system
US8239219B2 (en) Method and apparatus for providing availability of airline seats
US6804658B2 (en) Method and system for origin-destination passenger demand forecast inference
CN104169950B (zh) 利用面向批处理的计算的数据库系统
WO2016124118A1 (zh) 一种订单处理方法与系统
Cadarso et al. Integrated airline scheduling: Considering competition effects and the entry of the high speed rail
CN110751359A (zh) 一种自动化航线网络评估方法、电子设备及存储介质
CN113657671B (zh) 一种基于集成学习的航班延误预测方法
CN110675189B (zh) 一种基于Wide&Deep模型和遗传算法的无人货架选址方法
CN111192090A (zh) 航班的座位分配方法、装置、存储介质和电子设备
Chen et al. Decentralised cooperative cruising of autonomous ride-sourcing fleets
Wang et al. Integrated method for forecasting container slot booking in intercontinental liner shipping service
Ripoll-Zarraga et al. Exploring the reasons for efficiency in Spanish airports
Wang et al. A chance-constrained programming model for airport ground movement optimisation with taxi time uncertainties
Qu et al. How many vehicles do we need? Fleet sizing for shared autonomous vehicles with ridesharing
Huo et al. The prediction of flight delay: Big data-driven machine learning approach
CN116128172A (zh) 一种空铁联运路线生成方法、系统及设备和存储介质
CN116703044A (zh) 一种航班中转组合方法及装置
Huang et al. Robust model for the assignment of outgoing flights on airport baggage unloading areas
CN117540822A (zh) 跨移动边缘网络的联邦类增量学习方法、设备和存储介质
Xue Adaptive Cultural Algorithm‐Based Cuckoo Search for Time‐Dependent Vehicle Routing Problem with Stochastic Customers Using Adaptive Fractional Kalman Speed Prediction
CN112926809B (zh) 一种基于聚类和改进的xgboost的航班流量预测方法及系统
CN114923497A (zh) 一种铁路出行的路径规划方法、装置、设备及存储介质
US20190281471A1 (en) Systems and methods for planning high altitude platform-based communication networks
SAHADEVAN et al. Prediction of gate in time of scheduled flights and schedule conformance using machine learning-based algorithms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant