CN110363341A - 一种客座率基准预测的方法及系统 - Google Patents
一种客座率基准预测的方法及系统 Download PDFInfo
- Publication number
- CN110363341A CN110363341A CN201910620777.0A CN201910620777A CN110363341A CN 110363341 A CN110363341 A CN 110363341A CN 201910620777 A CN201910620777 A CN 201910620777A CN 110363341 A CN110363341 A CN 110363341A
- Authority
- CN
- China
- Prior art keywords
- variable
- rate
- target
- data
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012512 characterization method Methods 0.000 claims abstract description 7
- 230000008859 change Effects 0.000 claims description 32
- 238000004422 calculation algorithm Methods 0.000 claims description 23
- 230000002159 abnormal effect Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 11
- 230000005856 abnormality Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012804 iterative process Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000010206 sensitivity analysis Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Algebra (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种客座率基准预测的方法及系统,该方法包括:在数据源基础数据中确定核心原始变量,数据源基础数据表征影响客座率变化的基础数据集合;对核心原始变量进行数据预处理,获得目标数据变量;利用预设回归模型,对目标数据变量进行处理,获得目标预测变量;通过对目标预测变量进行参数调整,获得拟合模型,并对拟合模型进行分析,确定回归方程;将实际客座率作为回归方程的输入值,对预测时间的目标客座率进行实时预测,获得目标客座率的预测值。本发明实现了客座率变化的实时预测,提高了客座率预测的准确性。
Description
技术领域
本发明涉及信息处理技术领域,特别是涉及一种客座率基准预测的方法及系统。
背景技术
航班客座率是衡量航线运行效率的重要指标,是预测航空公司收益的重要基础数据。在航空市场中,当航班时刻确定后,常有旅客定做后却不能如期登机,导致作为的虚耗、客座率的降低,造成航空公司的巨额经济损失,引发收益漏洞。大多数航空公司通过设计超售模型来减少客座率降低的风险,但超售控制存在较大的拒载隐患。
为了弥补收益漏洞,当前航旅系统通过提供客座率统计、监控及查询等服务,并基于客座率的告警提醒,调节超售模型。现有技术中,系统通过设置阈值对航班客座率进行监控,并基于客座率阈值进行告警提醒。
但实际上,航班的客座率往往与航线、起飞时间、国际国内等等因素有着很强的联系,而客座率阈值通常是固定的,那么在实际的管理中不能实现对客座率基准的实时预测,使得客座率的预测不准确。
发明内容
针对于上述问题,本发明提供一种客座率基准预测的方法及系统,实现了提高客座率预测的准确性。。
为了实现上述目的,本发明提供了如下技术方案:
一种客座率基准预测的方法,该方法包括:
在数据源基础数据中确定核心原始变量,所述数据源基础数据表征影响客座率变化的基础数据集合;
对所述核心原始变量进行数据预处理,获得目标数据变量;
利用预设回归模型,对所述目标数据变量进行处理,获得目标预测变量;
通过对所述目标预测变量进行参数调整,获得拟合模型,并对所述拟合模型进行分析,确定回归方程;
将实际客座率作为所述回归方程的输入值,对预测时间的目标客座率进行实时预测,获得所述目标客座率的预测值,其中,所述实际客座率与所述目标客座率存在预设时间对应关系,且所述实际客座率根据预测时间的不同是不同的。
可选地,所述在数据源基础数据中确定核心原始变量,包括:
在数据源基础数据中确定初始变量;
对所述初始变量中的异常数据进行处理,获得核心原始变量。
可选地,所述对所述核心原始变量进行数据预处理,获得目标数据变量,包括:
根据预设的客座率特征抽象算法,对所述核心原始变量进行变量属性抽取,获得变量属性;
基于所述核心原始变量的变量属性和业务场景进行特征衍生,获得衍生变量;
基于所述核心原始变量和所述衍生变量,确定目标数据变量。
可选地,该方法还包括:
基于所述目标数据变量,确定客座率变化算法;
基于所述客座率变化算法,建立单变量多元的预设回归模型。
可选地,该方法还包括:
基于所述回归方程和实时输入数据,预测获得目标客座率变化曲线;
基于所述目标客座率变化曲线,获得目标预测信息,其中,所述目标预测信息包括航段总体客座率和航段具体大仓客座率。
一种客座率基准预测的系统,该系统包括:
变量确定单元,用于在数据源基础数据中确定核心原始变量,所述数据源基础数据表征影响客座率变化的基础数据集合;
预处理单元,用于对所述核心原始变量进行数据预处理,获得目标数据变量;
变量处理单元,用于利用预设回归模型,对所述目标数据变量进行处理,获得目标预测变量;
方程确定单元,用于通过对所述目标预测变量进行参数调整,获得拟合模型,并对所述拟合模型进行分析,确定回归方程;
预测单元,用于将实际客座率作为所述回归方程的输入值,对预测时间的目标客座率进行实时预测,获得所述目标客座率的预测值,其中,所述实际客座率与所述目标客座率存在预设时间对应关系,且所述实际客座率根据预测时间的不同是不同的。
可选地,所述变量确定单元包括:
第一确定子单元,用于在数据源基础数据中确定初始变量;
异常处理子单元,用于对所述初始变量中的异常数据进行处理,获得核心原始变量。
可选地,所述预处理单元包括:
属性获取子单元,用于根据预设的客座率特征抽象算法,对所述核心原始变量进行变量属性抽取,获得变量属性;
衍生子单元,用于基于所述核心原始变量的变量属性和业务场景进行特征衍生,获得衍生变量;
第二确定子单元,用于基于所述核心原始变量和所述衍生变量,确定目标数据变量。
可选地,该系统还包括:
算法确定子单元,用于基于所述目标数据变量,确定客座率变化算法;
模型建立子单元,用于基于所述客座率变化算法,建立单变量多元的预设回归模型。
可选地,该系统还包括:
曲线预测单元,用于基于所述回归方程和实时输入数据,预测获得目标客座率变化曲线;
信息预测单元,用于基于所述目标客座率变化曲线,获得目标预测信息,其中,所述目标预测信息包括航段总体客座率和航段具体大仓客座率。
相较于现有技术,本发明提供了一种客座率基准预测的方法及系统,在数据源基础数据中确定核心原始变量;对核心原始变量进行数据预处理,获得目标数据变量;利用预设回归模型,对目标数据变量进行处理,获得目标预测变量;通过对目标预测变量进行参数调整,获得拟合模型,并对拟合模型进行分析,确定回归方程;将实际客座率作为回归方程的输入值,对预测时间的目标客座率进行实时预测,获得目标客座率的预测值。其中,实际客座率与目标客座率存在预设时间对应关系,且实际客座率根据预测时间的不同是不同的,实现了客座率变化的实时预测,提高了客座率预测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种客座率基准预测的方法的流程示意图;
图2为本发明实施例提供的一种获得目标预测变量的方法的流程示意图;
图3为本发明实施例提供的一种回归方程的迭代过程的示意图;
图4为本发明实施例提供的一种进行收益漏洞管理方法的流程示意图;
图5为本发明实施例提供的一种客座率基准预测的系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在本发明实施例中提供了一种客座率基准预测的方法,参见图1,该方法可以包括以下步骤:
S101、在数据源基础数据中确定核心原始变量;
所述数据源基础数据表征影响客座率变化的基础数据集合。在确定核心原始变量时主要进行了两方面的处理,一是选择原始变量,另一个是对异常数据进行处理,即在本发明实施例中确定核心原始变量包括:
S1011、在数据源基础数据中确定初始变量;
S1012、对所述初始变量中的异常数据进行处理,获得核心原始变量。
其中,数据源基础数据包括但不局限于:航班号、起飞机场、降落机场、航节顺序、当地起飞时间、大舱、航节里程数、航节大舱OPN数、航节大舱 MAX数、航节大舱TB数、航节大舱CAP数、客座情况统计时间、机型、航段子舱LSS数。可以基于具体的应用环境和具体的航班信息在这些基础数据中确定核心原始变量。参见表1为对基础数据进行的解释。
表1
在确定核心原始变量时,会先确定初始变量,然后对初始变量的异常数据进行处理,经过处理后的数据才可以作为核心原始变量,具体的可以为如下处理:
(1)大舱MAX=0的异常数据。如果在MAX为0的情况,CAP为0, OPN也为0,则证明是不对外进行销售的主舱位,就可以直接忽略此舱位的情况。假如发现MAX为0,CAP为0,返OPN不为0,就说明数据业务上不合理,则直接忽略这类航班的数据。
(2)里程数据项不可靠的情况。建立航班时,里程数据往往由手工输入,会出现数据不准、缺少的情况,那么航节的飞行距离,可以根据起落机场的精度和纬度计算得出。
S102、对所述核心原始变量进行数据预处理,获得目标数据变量。
该目标数据变量包括了核心原始变量和衍生变量,在本发明实施例中对核心原始变量进行数据预处理的过程包括:
S1021、根据预设的客座率特征抽象算法,对所述核心原始变量进行变量属性抽取,获得变量属性;
S1022、基于所述核心原始变量的变量属性和业务场景进行特征衍生,获得衍生变量;
S1023、基于所述核心原始变量和所述衍生变量,确定目标数据变量。
在数据预处理过程中主要包括了特征属性提取即衍生。对客座率变化历史数据,构建客座率特征抽象算法,抽象影响客座率因素的预测变量属性,根据业务场景进行特征衍生,用于刻画客座率数据特征。
根据核心原始变量得到衍生变量,核心原始变量表征对预测有重要作用的原始值,衍生变量表征对原始核心变量进行的属性变换。其中,衍生变量具有衍生特征,衍生特征包括但不局限于以下方面:
是否国际国内航线、经过的航节、航段大舱客座率、航段全体客座率、航节大舱客座率、航节所有舱位OPN数、航节所有舱位MAX、航节所有舱位TB、航节所有舱位CAP、航节所有舱位客座率、航段最低售价、航段平均售价、航段起飞前天数、起飞DOW(周几)、节日类型等。
例如:根据起飞日期这个核心原始变量,可以得到几月、周几等衍生变量。
S103、利用预设回归模型,对所述目标数据变量进行处理,获得目标预测变量。
其中,该预设回归模型的构建过程为:
基于所述目标数据变量,确定客座率变化算法;
基于所述客座率变化算法,建立单变量多元的预设回归模型。
客座率是反映航空客运公司运营效率的指标,这个值计算方法有多种,通常统计客座数据是基于物理航节,但此发明预测的客座率是要充分展现业务价值的数据,因此选择计算基于业务航段、考虑大舱、考虑里程影响的客座率。客座率计算方式具体如下:
(1)基本公式:选择MAX而非CAP,是因为大舱CAP通常可能是0 却允许订座,会导致计算异常;选择MAX也能考虑超售的影响。
(2)跨航节数据的处理,例如,假设一个航班从A城市飞到B城市,从 B城市再飞到C城市。主舱位有W、Y、J等三类,那么将计算公式如下:
基于大舱Y的客座率(其他大舱W和J类似);
整个航段AB、BC、AC的客座率。
根据上述核心原始变量和衍生变量,积累客座相关历史数据。通过历史数据的收集,从而得到面向客座率变化的预测变量,如起飞时间、航线、国内外、布局、等级、节日特点、距离起飞天数等。
参见图2,获得目标预测变量的过程为:
核心原始变量→核心原始变量集产生衍生变量,进行数据处理→选取业务强相关的预测变量子集,进行训练→添加预测变量进行训练→判断回归性,回归更好→得到新的预测变量集(目标预测变量)或者回归性不好的放弃变量重新训练。
预测变量数据如下表2进行记录:
由于客座率时间序列存在长记忆性,因此客座率变化算法采用结构化的线性回归模型、二次函数模型及指数模型。例如,根据航空运价的定价因素,确定预测变量的初始选择范围;根据训练模型得出的贡献度,逐渐增减预测变量。
需要预测的y包括:具体航段总体客座率和具体航段具体大仓客座率。
S104、通过对所述目标预测变量进行参数调整,获得拟合模型,并对所述拟合模型进行分析,确定回归方程。
基于目标预测变量估计模型参数,选取拟合方法,通过持续调整拟合方法中的回归参数,得到拟合模型,并进行评价分析,确定回归方程。例如,通过对收集到的数据中的拟合值Y,不断调整计算回归参数β。通过相对确定的回归参数,得到预测值Y。如果参数调整方式合理,则此公式则可用计算预测值,回归的迭代过程如图3所示。
根据上述迭代过程得到不同拟合模型后,主要用确定系数R2来比较客座率分析模型优劣,当R2越接近1时,表示拟合值与观测值的线性相关性越强,回归效果越好,因此,选取R2较大的模型成为这组数据的模型。同时,再综合考虑残差图、异常值检测、敏感度分析等方法进行评价。
由于建立的回归方程一般具有时间性,样本取值的时间范围会影响回归方程的适用范围,因此,回归方程得到的预报值并不是期望响应变量的精确值。通过回归分析准确确定回归方程,概括响应变量Y和一组预测变量X1, X2,....,Xp之间的关系。回归方程可以用来评估单个预测变量的重要性,也可以用来根据给定的预测变量值预测响应变量的值。
S105、将实际客座率作为所述回归方程的输入值,对预测时间的目标客座率进行实时预测,获得所述目标客座率的预测值。
其中,所述实际客座率与所述目标客座率存在预设时间对应关系,且所述实际客座率根据预测时间的不同是不同的。
通过回归分析得到的客座率预测模型基于Leg和Seg综合数据属性考虑,可以结合实时数据,预测在未来起飞的客座率变化曲线,即:基于所述回归方程和实时输入数据,预测获得目标客座率变化曲线;基于所述目标客座率变化曲线,获得目标预测信息,其中,所述目标预测信息包括航段总体客座率和航段具体大仓客座率。
基于此模型,可根据航班好展现客座率变化已有历史,同时结合预测的分时基准客座率起飞前变化曲线一并展现。
基于预测的急转客座率,可对客座率量的异常变化、上客速度猛增、猛减等异常行为进行识别,及时采取业务措施;也可根据起飞前客座率调整超售数量,管理收益漏洞。
在进行收益漏洞管理时,参见图4,主要包括两个分支,一个是实时真实客座率分支,一个是预测基准客座率分支。
得到实时真实客座率和预测基准客座率后,会基于该实时真实客座率即刻对比检查识别客座率增减异常,根据是否存在异常产生业务报警,进一步采取业务措施;根据预测基准客座率对比分析识别超售需求,根据是否需要,进行业务提醒,进一步地调整超售模型。
本发明提供了一种客座率基准预测的方法,在数据源基础数据中确定核心原始变量;对核心原始变量进行数据预处理,获得目标数据变量;利用预设回归模型,对目标数据变量进行处理,获得目标预测变量;通过对目标预测变量进行参数调整,获得拟合模型,并对拟合模型进行分析,确定回归方程;将实际客座率作为回归方程的输入值,对预测时间的目标客座率进行实时预测,获得目标客座率的预测值。其中,实际客座率与目标客座率存在预设时间对应关系,且实际客座率根据预测时间的不同是不同的,实现了客座率变化的实时预测,提高了客座率预测的准确性。
目前,大部分本发明所涉及到的客座率计算方案,大多是基于航节和CAP 进行计算的,业务意义以及容错性不强。本发明不仅在基于航节数据的基础上,考虑了航段的业务意义,而且计算方式涵盖了里程、大舱、MAX数等对业务价值有重大影响的方面,因此计算出的客座率更反应了航线的业务价值。目前,客座率在业务使用中,往往只是凭航线管理员经验设定需要产生业务管理的阈值范围,这样的设定不一定合理而且费时费力。本发明通过航线特点,对客座率产生实时基准预测,在此基础上识别出的异常将根据参考意义,而且节省人力。目前,航线管理员对超售的设置调整不够及时。本发明的客座率预测将为超售提供决策依据,可以让超售调整更科学更及时。
在本发明的另一实施例中还提供了一种客座率基准预测的系统,参见图 5,该系统包括:
变量确定单元10,用于在数据源基础数据中确定核心原始变量,所述数据源基础数据表征影响客座率变化的基础数据集合;
预处理单元20,用于对所述核心原始变量进行数据预处理,获得目标数据变量;
变量处理单元30,用于利用预设回归模型,对所述目标数据变量进行处理,获得目标预测变量;
方程确定单元40,用于通过对所述目标预测变量进行参数调整,获得拟合模型,并对所述拟合模型进行分析,确定回归方程;
预测单元50,用于将实际客座率作为所述回归方程的输入值,对预测时间的目标客座率进行实时预测,获得所述目标客座率的预测值,其中,所述实际客座率与所述目标客座率存在预设时间对应关系,且所述实际客座率根据预测时间的不同是不同的。
在上述实施例的基础上,所述变量确定单元包括:
第一确定子单元,用于在数据源基础数据中确定初始变量;
异常处理子单元,用于对所述初始变量中的异常数据进行处理,获得核心原始变量。
在上述实施例的基础上,所述预处理单元包括:
属性获取子单元,用于根据预设的客座率特征抽象算法,对所述核心原始变量进行变量属性抽取,获得变量属性;
衍生子单元,用于基于所述核心原始变量的变量属性和业务场景进行特征衍生,获得衍生变量;
第二确定子单元,用于基于所述核心原始变量和所述衍生变量,确定目标数据变量。
在上述实施例的基础上,该系统还包括:
算法确定子单元,用于基于所述目标数据变量,确定客座率变化算法;
模型建立子单元,用于基于所述客座率变化算法,建立单变量多元的预设回归模型。
在上述实施例的基础上,该系统还包括:
曲线预测单元,用于基于所述回归方程和实时输入数据,预测获得目标客座率变化曲线;
信息预测单元,用于基于所述目标客座率变化曲线,获得目标预测信息,其中,所述目标预测信息包括航段总体客座率和航段具体大仓客座率。
相较于现有技术,本发明提供了一种客座率基准预测的方法及系统,变量确定单元在数据源基础数据中确定核心原始变量;预处理单元对核心原始变量进行数据预处理,获得目标数据变量;变量处理单元利用预设回归模型,对目标数据变量进行处理,获得目标预测变量;方程确定单元通过对目标预测变量进行参数调整,获得拟合模型,并对拟合模型进行分析,确定回归方程;预测单元将实际客座率作为回归方程的输入值,对预测时间的目标客座率进行实时预测,获得目标客座率的预测值。其中,实际客座率与目标客座率存在预设时间对应关系,且实际客座率根据预测时间的不同是不同的,实现了客座率变化的实时预测,提高了客座率预测的准确性。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种客座率基准预测的方法,其特征在于,该方法包括:
在数据源基础数据中确定核心原始变量,所述数据源基础数据表征影响客座率变化的基础数据集合;
对所述核心原始变量进行数据预处理,获得目标数据变量;
利用预设回归模型,对所述目标数据变量进行处理,获得目标预测变量;
通过对所述目标预测变量进行参数调整,获得拟合模型,并对所述拟合模型进行分析,确定回归方程;
将实际客座率作为所述回归方程的输入值,对预测时间的目标客座率进行实时预测,获得所述目标客座率的预测值,其中,所述实际客座率与所述目标客座率存在预设时间对应关系,且所述实际客座率根据预测时间的不同是不同的。
2.根据权利要求1所述的方法,其特征在于,所述在数据源基础数据中确定核心原始变量,包括:
在数据源基础数据中确定初始变量;
对所述初始变量中的异常数据进行处理,获得核心原始变量。
3.根据权利要求1所述的方法,其特征在于,所述对所述核心原始变量进行数据预处理,获得目标数据变量,包括:
根据预设的客座率特征抽象算法,对所述核心原始变量进行变量属性抽取,获得变量属性;
基于所述核心原始变量的变量属性和业务场景进行特征衍生,获得衍生变量;
基于所述核心原始变量和所述衍生变量,确定目标数据变量。
4.根据权利要求3所述的方法,其特征在于,该方法还包括:
基于所述目标数据变量,确定客座率变化算法;
基于所述客座率变化算法,建立单变量多元的预设回归模型。
5.根据权利要求4所述的方法,其特征在于,该方法还包括:
基于所述回归方程和实时输入数据,预测获得目标客座率变化曲线;
基于所述目标客座率变化曲线,获得目标预测信息,其中,所述目标预测信息包括航段总体客座率和航段具体大仓客座率。
6.一种客座率基准预测的系统,其特征在于,该系统包括:
变量确定单元,用于在数据源基础数据中确定核心原始变量,所述数据源基础数据表征影响客座率变化的基础数据集合;
预处理单元,用于对所述核心原始变量进行数据预处理,获得目标数据变量;
变量处理单元,用于利用预设回归模型,对所述目标数据变量进行处理,获得目标预测变量;
方程确定单元,用于通过对所述目标预测变量进行参数调整,获得拟合模型,并对所述拟合模型进行分析,确定回归方程;
预测单元,用于将实际客座率作为所述回归方程的输入值,对预测时间的目标客座率进行实时预测,获得所述目标客座率的预测值,其中,所述实际客座率与所述目标客座率存在预设时间对应关系,且所述实际客座率根据预测时间的不同是不同的。
7.根据权利要求6所述的系统,其特征在于,所述变量确定单元包括:
第一确定子单元,用于在数据源基础数据中确定初始变量;
异常处理子单元,用于对所述初始变量中的异常数据进行处理,获得核心原始变量。
8.根据权利要求6所述的系统,其特征在于,所述预处理单元包括:
属性获取子单元,用于根据预设的客座率特征抽象算法,对所述核心原始变量进行变量属性抽取,获得变量属性;
衍生子单元,用于基于所述核心原始变量的变量属性和业务场景进行特征衍生,获得衍生变量;
第二确定子单元,用于基于所述核心原始变量和所述衍生变量,确定目标数据变量。
9.根据权利要求8所述的系统,其特征在于,该系统还包括:
算法确定子单元,用于基于所述目标数据变量,确定客座率变化算法;
模型建立子单元,用于基于所述客座率变化算法,建立单变量多元的预设回归模型。
10.根据权利要求9所述的系统,其特征在于,该系统还包括:
曲线预测单元,用于基于所述回归方程和实时输入数据,预测获得目标客座率变化曲线;
信息预测单元,用于基于所述目标客座率变化曲线,获得目标预测信息,其中,所述目标预测信息包括航段总体客座率和航段具体大仓客座率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910620777.0A CN110363341A (zh) | 2019-07-10 | 2019-07-10 | 一种客座率基准预测的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910620777.0A CN110363341A (zh) | 2019-07-10 | 2019-07-10 | 一种客座率基准预测的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110363341A true CN110363341A (zh) | 2019-10-22 |
Family
ID=68218522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910620777.0A Pending CN110363341A (zh) | 2019-07-10 | 2019-07-10 | 一种客座率基准预测的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110363341A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091407A (zh) * | 2019-10-28 | 2020-05-01 | 海南太美航空股份有限公司 | 一种航线客座率预测方法及系统 |
-
2019
- 2019-07-10 CN CN201910620777.0A patent/CN110363341A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091407A (zh) * | 2019-10-28 | 2020-05-01 | 海南太美航空股份有限公司 | 一种航线客座率预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019337807B2 (en) | Aircraft engine maintenance system and method | |
US11767132B2 (en) | System and method for aircraft contaminant monitoring and operation scheduling | |
US6804658B2 (en) | Method and system for origin-destination passenger demand forecast inference | |
AU2020244388A1 (en) | Method and server for providing fare availabilities, such as air fare availabilities | |
Baumgarten et al. | The impact of hubbing concentration on flight delays within airline networks: An empirical analysis of the US domestic market | |
CN109615226A (zh) | 一种运营指标异常监测方法 | |
CN104471573B (zh) | 更新高速缓存的数据库查询结果 | |
Negahban | Simulation-based estimation of the real demand in bike-sharing systems in the presence of censoring | |
AU2020244405A1 (en) | Method and server for providing a set of price estimates, such as air fare price estimates | |
US20150161636A1 (en) | Method and server for providing a set of price estimates, such as air fare price estimates | |
KR101265976B1 (ko) | 정량적 정보 기반의 산업기술시장 분석 시스템 및 그 방법 | |
Yang et al. | Returns to scale in the production of taxi services: an empirical analysis | |
CN107403325B (zh) | 机票订单可信度评价方法和装置 | |
JP2016540319A5 (zh) | ||
CN111192090A (zh) | 航班的座位分配方法、装置、存储介质和电子设备 | |
JP7099805B2 (ja) | 予測装置、予測システム、予測方法及びプログラム | |
KR101435096B1 (ko) | 소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법 | |
EP3736779A1 (en) | System and method for detecting vehicle environmental exposure and for determining maintenance service according to detected exposure | |
JP2019079568A (ja) | 見積もり価格、たとえば航空運賃価格見積もりの組を提供するための方法及びサーバ | |
Scarpel et al. | A data analytics approach for anticipating congested days at the São Paulo International Airport | |
JP2012526318A (ja) | 住宅価格指数を生成するシステム | |
US20200356958A1 (en) | Usage-based maintenance system for vehicles and method of operating the same | |
Hotle et al. | The impact of advance purchase deadlines on airline consumers’ search and purchase behaviors | |
CN110363341A (zh) | 一种客座率基准预测的方法及系统 | |
Wang et al. | Bike-sharing rebalancing problem by considering availability and accessibility |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191022 |
|
RJ01 | Rejection of invention patent application after publication |