CN108038508A - 中转航班的推送方法、系统、存储介质和电子设备 - Google Patents

中转航班的推送方法、系统、存储介质和电子设备 Download PDF

Info

Publication number
CN108038508A
CN108038508A CN201711370824.8A CN201711370824A CN108038508A CN 108038508 A CN108038508 A CN 108038508A CN 201711370824 A CN201711370824 A CN 201711370824A CN 108038508 A CN108038508 A CN 108038508A
Authority
CN
China
Prior art keywords
flights
delayed
delay
history
property value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711370824.8A
Other languages
English (en)
Inventor
付迪
肖铨武
聂强强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Network Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Network Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Network Technology Shanghai Co Ltd filed Critical Ctrip Travel Network Technology Shanghai Co Ltd
Priority to CN201711370824.8A priority Critical patent/CN108038508A/zh
Publication of CN108038508A publication Critical patent/CN108038508A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了中转航班的推送方法、系统、存储介质和电子设备,其中方法包括:建立包含多个历史延误航班的样本库,每个历史延误航班具有多个特征属性;基于各历史延误航班的特征属性,分别获取各历史延误航班的多个属性值;利用各历史延误航班及其属性值生成目标函数,通过优化目标函数训练用于计算预售航班延误概率的集成树模型;采用训练好的集成树模型计算所有预售航班的延误概率,筛选出延误概率未超出阈值的航班,作为非延误航班;对出发机场和到达机场对应匹配,且间隔时间在预设时间内的非延误航班进行拼接,形成中转航班推送至机票查询页面。本发明优化航班拼接,降低航变损失,提升用户体验,创造实惠且行程有保障的中转机票产品。

Description

中转航班的推送方法、系统、存储介质和电子设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种中转航班的推送方法、系统、存储介质和电子设备。
背景技术
对于飞行距离较远的航班,例如国际航班,因其航班航线复杂,且飞行距离较长,而民航运力有限,多利用中转机场降低航空公司运营成本。
另一方面,各航司为了调节不同航线上客运量,会对多个航班进行中接或拼接,提升客机运输效率。
然而,拼接航班时常因前序航班发生航变导致乘客无法赶上当前航班的情况,使用户不能放心的选择该类拼接航班。目前中国出境游需求迅速增长,而机票在出行之中是必不可少的消费,面对不同用户的多样化价格需求和服务需求,预测国际航班是否延误或取消,甚至备降,十分有必要。
此外,当前拼接航班多数中转时长超过3小时,这也是用户不愿意选择中转航班的一个原因。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
针对现有技术中的缺陷,本发明要解决的问题是,如何优化航班中转拼接,减少航班延误带来的损失,同时提升用户体验。
根据本发明的一个方面,提供一种中转航班的推送方法,所述方法包括:建立包含多个历史延误航班的样本库,每个历史延误航班具有多个特征属性,包括航班号、出发机场和到达机场、及出发时间和到达时间;基于各历史延误航班的一个或多个特征属性,分别获取各历史延误航班的延误属性值,天气属性值和行程属性值;利用各历史延误航班及其延误属性值,天气属性值和行程属性值,生成用于定义各历史延误航班的延误概率估计值与真实值之间差距及模型复杂度的目标函数,通过对目标函数进行参数优化训练集成树模型;采用训练好的集成树模型计算所有预售航班的延误概率,筛选出延误概率未超出阈值的航班,作为非延误航班;在所述非延误航班中,根据前一航程的非延误航班的到达机场,获取以该到达机场为出发机场的延误概率最低且间隔时间在预设时间内的非延误航班,作为后一航程;根据所述前一航程的非延误航班和所述后一航程的非延误航班的组合,生成航班中转信息,推送至机票查询页面。
优选地,所述延误属性值包括航班延误属性值、航线延误属性值、出发机场延误属性值和到达机场延误属性值。
优选地,获取所述航班延误属性值、航线延误属性值、出发机场延误属性值和到达机场延误属性值的步骤包括:筛选航班号、出发机场和到达机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该航班延误属性值;筛选出发机场和到达机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该出发机场至该到达机场之间的航线延误属性值;筛选出发机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该出发机场延误属性值;筛选到达机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该到达机场延误属性值。
优选地,所述天气属性值包括出发城市天气属性值和到达城市天气属性值。
优选地,获取所述出发城市天气属性值和到达城市天气属性值的步骤包括:基于各历史延误航班的出发机场定位其出发城市,获取所述出发城市在预设时段内的天气信息,包括定量属性值气温及定性属性值风力、风向和天气类型,作为该出发城市天气属性值;基于各历史延误航班的到达机场定位其到达城市,获取所述到达城市在预设时段内的天气信息,包括定量属性值气温及定性属性值风力、风向和天气类型,作为该到达城市天气属性值。
优选地,所述行程属性值包括飞行时长、飞行距离、起飞时点和到达时点。
优选地,所述目标函数为:其中为损失函数,用于定义第i个历史延误航班的延误概率估计值与真实值之间差距,yi为第i个历史延误航班是否延误的标记,为第i个历史延误航班的延误概率估计值,Ω(fk)为正则项,用于定义模型复杂度,n为样本库中样本的总个数,Obj为样本的优化目标;
所述第i个历史延误航班的延误概率估计值的计算公式为 k为决策树的个数,每个决策树中包括该第i个历史延误航班的延误属性值,天气属性值和行程属性值中的一个或多个,为决策树集合,x为每个决策树所包含的属性值的向量值;
所述正则项Ω(fk)的计算公式为:其中T为第k棵决策树的节点个数,为第k棵决策树中第j个节点上分数的模平方,γ和λ均为正则化参数,取值范围均为0~1。
优选地,进行非延误航班拼接时,所述间隔时间大于1小时且小于2小时。
优选地,上述的中转航班的推送方法还包括:对已有的预设中转航班,采用目标函数计算其前一航程的延误概率,对前一航程延误概率未超出阈值的预设中转航班,按照预设比例提高其票价。
根据本发明的另一个方面,提供一种中转航班的推送系统,所述系统包括:样本组建模块,建立包含多个历史延误航班的样本库,每个历史延误航班具有多个特征属性,包括航班号、出发机场和到达机场、及出发时间和到达时间;特征取值模块,基于各历史延误航班的一个或多个特征属性,分别获取各历史延误航班的延误属性值,天气属性值和行程属性值;模型训练模块,利用各历史延误航班及其延误属性值,天气属性值和行程属性值生成用于定义延误概率估计值与真实值差距及模型复杂度的目标函数,对所述目标函数进行参数优化训练集成树模型;延误预测模块,采用训练好的集成树模型计算所有预售航班的延误概率,筛选出延误概率未超出阈值的航班,作为非延误航班;中转拼接模块,在所述非延误航班中,根据前一航程的非延误航班的到达机场,获取以该到达机场为出发机场的延误概率最低且间隔时间在预设时间内的非延误航班,作为后一航程;信息推荐模块,根据所述前一航程的非延误航班和所述后一航程的非延误航班的组合,生成航班中转信息,推送至机票查询页面。
根据本发明的另一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的中转航班的推送方法的步骤。
根据本发明的另一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述的中转航班的推送方法的步骤。
有鉴于此,本发明与现有技术相比的有益效果在于:
本发明对海量样本进行清洗,匹配相关特征属性,训练出航变预测模型,指导航班拼接,不仅可以根据航班的动态预测组合更多实惠且高质量的中转机票产品,还可以提升用户体验,减少航班延误带来的损失。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明示例性实施例中一种中转航班的推送方法的步骤示意图;
图2示出本发明示例性实施例中延误属性值的获取步骤示意图;
图3示出本发明示例性实施例中一种中转航班的推送系统的模块示意图;
图4示出本发明示例性实施例中一种计算机可读存储介质的示意图;
图5示出本发明示例性实施例中一种电子设备的示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出本实施例中一种中转航班的推送方法的步骤示意图。参照图1所示,中转航班的推送方法包括:
步骤S101、建立包含多个历史延误航班的样本库,每个历史延误航班具有多个特征属性,包括航班号、出发机场和到达机场、及出发时间和到达时间。在建立样本库之前,会先对历史航班样本进行清洗筛选,挑出符合条件的历史航班样本,包括对各航班来自不同渠道的状态数据分别根据更新时间进行排序,选取来自不同渠道的最新状态数据;然后对来自不同渠道的各最新状态数据进行处理后,作为各航班的状态数据;再选出状态数据符合条件的航班作为样本。每条航班采用航班号+出发/到达机场+出发/到达时间的形式进行记录。
具体的,采用历史航班状态数据,对航班取消或返航或备降或延误3小时及以上标记为航变样本,属于需要识别的正样本,排除掉航班状态丢失的样本以及异常数据。由于航班状态数据来源有多个,直接使用最晚更新时间筛选样本容易产生异常数据,因此,对多个来源渠道的数据分组排序,各自选取最后一条,若状态、实际起飞到达一致,则保留一条,若有状态不同,则以到达的状态为准,其他状态视为中间状态不纳入考虑,若起飞到达时间不一致,以非空值为准,多个非空值取平均值;在同一天的同一个航班号可能对应多个航班的情况下(即备降航班),对备降航班仅保留其完整程作为样本,删除备降航段。去除最后状态为延误、可能取消、计划、删除等的航班,因这些状态属于航班动态的中间过程,没有对应的最终状态,属于信息丢失或数据未及时更新。
步骤S102、基于各历史延误航班的一个或多个特征属性,分别获取各历史延误航班的延误属性值,天气属性值和行程属性值。其中,延误属性值包括航班延误属性值、航线延误属性值、出发机场延误属性值和到达机场延误属性值。参照图2所示,延误属性值的获取步骤具体包括:步骤S1021、筛选航班号、出发机场和到达机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该航班延误属性值;步骤S1022、筛选出发机场和到达机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该出发机场至该到达机场之间的航线延误属性值;步骤S1023、筛选出发机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该出发机场延误属性值;步骤S1024、筛选到达机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该到达机场延误属性值。
航变主要影响因素有天气,距离,航司,起降机场流量等。考虑到该项目的应用场景,应对航班提前进行预测,目前天气预报数据仅支持提前预报7天,因此天气特征为起飞、到达当天回溯7天的预报天气,对天气数据进行分类,雷雨天气、晴天、风暴天气各为一类,其他类别根据各天气下航变概率进行分组。此外考虑历史特征,如该航班的历史延误率,各航司的历史延误率,该起飞到达机场的历史延误率等等,各特征的组合特征构造成新的衍生特征。
举例来说,计算各历史延误航班的数据状态记录,同航班号、出发机场、到达机场起飞前1到30天内,延误时长的均值,中位数,最大值,以及延误时长分别在0-30分钟,30-60分钟,60-90分钟,90-120分钟,120分钟以上的概率,作为航班延误属性值。计算各历史延误航班的数据状态记录,同出发机场、同到达机场起飞前1到30天内,延误时长的均值,中位数,最大值,以及延误时长分别在0-30分钟,30-60分钟,60-90分钟,90-120分钟,120分钟以上的概率,作为航线延误属性值。计算各历史延误航班的数据状态记录,同出发机场起飞前1到30天内,延误时长的均值,中位数,最大值,以及延误时长分别在0-30分钟,30-60分钟,60-90分钟,90-120分钟,120分钟以上的概率,作为出发机场延误属性值。计算各历史延误航班的数据状态记录,同到达机场起飞前1到30天内,延误时长的均值,中位数,最大值,以及延误时长分别在0-30分钟,30-60分钟,60-90分钟,90-120分钟,120分钟以上的概率,作为到达机场延误属性值。
天气属性值包括出发城市天气属性值和到达城市天气属性值。其获取方法为:基于各历史延误航班的出发机场定位其出发城市,获取该出发城市在预设时段内的天气信息,包括定量属性值气温及定性属性值风力、风向和天气类型,作为该出发城市天气属性值;基于各历史延误航班的到达机场定位其到达城市,获取该到达城市在预设时段内的天气信息,包括定量属性值气温及定性属性值风力、风向和天气类型,作为该到达城市天气属性值。
举例来说,根据历史天气预报信息,其预报地区编号先关联城市,得到各城市预报天气;样本各记录出发到达机场关联维表得到机场所在城市,城市关联可得到出发和到达天气信息;预报天气信息需选择提前5天的预报信息(即2017年11月13日发布的11月20日的天气作为11月20航班延误预测的变量),其中天气信息包含风力、风向、气温、天气类型。风力、风向均为定性变量,其值表现为风力、风向等级。气温为定量变量,其值即气温的大小值。天气类型为定性变量,因取值较多对其进行预处理,多个天气近似相同则归为一类,例如:晴、部分晴、多数晴等统一为晴天,能见度低但出现概率较低的天气如雾、浮尘、扬沙、霾、沙尘暴等归为一类;以此将近70种天气类型归纳为12种天气,作为天气变量。
另外,行程属性值包括各历史延误航班的计划飞行时长,计划飞行距离,承运航司,飞机机型(型号、最大座位数、大中小号、机款等),起飞时点及到达时点根据早中晚归约为三类。
步骤S103、利用各历史延误航班及其延误属性值,天气属性值和行程属性值,生成用于定义各历史延误航班的延误概率估计值与真实值之间差距及模型复杂度的目标函数,通过对目标函数进行参数优化训练集成树模型。目标函数为:其中为损失函数,用于定义第i个历史延误航班的延误概率估计值与真实值之间差距,yi为第i个历史延误航班是否延误的标记,为第i个历史延误航班的延误概率估计值,Ω(fk)为正则项,用于定义模型复杂度,n为样本库中样本的总个数,Obj为样本的优化目标。第i个历史延误航班的延误概率估计值的计算公式为k为决策树的个数,每个决策树中包括该第i个历史延误航班的延误属性值,天气属性值和行程属性值中的一个或多个,为决策树集合,x为每个决策树所包含的属性值的向量值。正则项Ω(fk)的计算公式为:其中T为第k棵决策树的节点个数,为第k棵决策树中第j个节点上分数的模平方,γ和λ均为正则化参数,取值范围均为0~1。
其中,集成树模型为xgboost模型,其模型基本可写成:其目标函数即为:其中对应一个回归树集合,即模型本身由多个回归树集成,而目标函数遵循一般的规则,包含拟合误差部分L和正则项Ω,各参数控制fk的结构及各树的叶子节点预测分值,训练模型通过Python实现。
具体的模型训练过程:一、数据导入Python,存为dataframe类型;对定性变量进行one_hot编码,如风力1/2/3级转为风力是否为1级和是否为2级两种变量,对定量变量进行中位数填充缺失。也即,三类取值仅用两种变量就可以完整表达,“是否为1级”取是则标识风力为1级,“是否为2级”取是则标识风力为2级,当“是否为1级”和“是否为2级”均取否则可标识风力为3级。二、样本按照时间分割为训练集和测试集,例如样本包含2016年9月20到2017年10月20日的航班动态,保留2017年8月1日后的全部样本作为测试集,不参与模型训练。三、训练模型时,按照7:3随机分割,30%的样本作为验证集,模型训练参数在验证集上计算预测误差,根据预测误差调整模型参数,直到模型收敛,得到最优训练参数。最优参数在测试集上的预测效果为模型的实际效果。
训练模型的过程中,还包括参数优化过程,使模型效果进一步提升。参数优化包括子步骤:首先对最大树深max_depth和最小叶节点权重min_child_weight进行搜索,对最小叶节点权重设置较小的值,最大树深初始为3,该参数过大容易过拟合;其次对subsample(训练样本子采样比例)和colsample_bytree(列采样比例)进行调整,两者初始在0.8,范围在0.6-1之间;最后对正则化参数进行调优,正则化参数一方面控制过拟合,另一方面限制某些变量的系数,使其具备业务可解释性。
其中,目标函数中正则项表示树的复杂度,其包含一棵树的节点个数T,及各树的叶子节点上分数的L2模平方。正则项其中γ和λ对应控制参数,通过调整这两个正则化参数,对模型复杂度进行约束(模型越复杂,在训练集上效果越好,而在真实预测过程中效果减弱),另一方面,对各系数的绝对值进行严格控制,使得一些明显与延误时长呈正向相关的变量在训练过程中衰减为0,这样达到控制过拟合和满足业务可解释性的目的。所有参数的调优过程,进行网格搜索,对参数的多个可能取值,逐一加入模型,观察其预测误差,得到最优参数。
步骤S104、采用目标函数计算所有预售航班的延误概率,筛选出延误概率未超出阈值的航班,作为非延误航班;步骤S105、在非延误航班中,根据前一航程的非延误航班的到达机场,获取以该到达机场为出发机场的延误概率最低且间隔时间在预设时间内的非延误航班,作为后一航程;步骤S106、根据前一航程的非延误航班和后一航程的非延误航班的组合,生成航班中转信息,推送至机票查询页面。其中,进行非延误航班拼接时,两个航班的间隔时间大于1小时且小于2小时。也即,对所有航班进行预测,预测结果为非航变的航班,匹配出发机场为预测航班到达机场的航班,保留其间隔时长不大于2小时的航班,进行拼接。考虑到拼接航班需要下机重新托运行李,因此预留至少1个小时时间。
另外,还可包括:对已有的预设中转航班,采用目标函数计算其前一航程的延误概率,对前一航程延误概率未超出阈值的预设中转航班,按照预设比例提高其票价。也即针对中转一次的航班,对第一程进行预测,若预测结果为非航变航班,提升产品价格,保证航班顺利成行,可提升中转航班的单量。
本实施例的方法通过优化航班拼接,提高用户体验,创造新的机票产品,提升收益。
本发明还提供一种中转航班的推送系统,参照图3所示,该系统包括:样本组建模块301,建立包含多个历史延误航班的样本库,每个历史延误航班具有多个特征属性,包括航班号、出发机场和到达机场、及出发时间和到达时间;特征取值模块302,基于各历史延误航班的一个或多个特征属性,分别获取各历史延误航班的延误属性值,天气属性值和行程属性值;模型训练模块303,利用各历史延误航班及其延误属性值,天气属性值和行程属性值生成用于定义延误概率估计值与真实值差距及模型复杂度的目标函数,对所述目标函数进行参数优化训练集成树模型;延误预测模块304,采用训练好的集成树模型计算所有预售航班的延误概率,筛选出延误概率未超出阈值的航班,作为非延误航班;中转拼接模块305,在非延误航班中,根据前一航程的非延误航班的到达机场,获取以该到达机场为出发机场的延误概率最低且间隔时间在预设时间内的非延误航班,作为后一航程;信息推荐模块306,根据前一航程的非延误航班和后一航程的非延误航班的组合,生成航班中转信息,推送至机票查询页面。
其中,各个模块的原理和工作流程和上述方法实施例一致,因此不再赘述。
在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可以实现上述任意一个实施例中所述中转航班的推送方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述中转航班的推送方法描述的根据本发明各种示例性实施方式的步骤。
参考图4所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品400,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品400可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本发明的示例性实施例中,还提供一种电子设备,该电子设备可以包括处理器,以及用于存储所述处理器的可执行指令的存储器。其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一个实施例中所述中转航班的推送方法的步骤。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图5来描述根据本发明的这种实施方式的电子设备500。图5显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:至少一个处理单元510、至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530、显示单元540等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述中转航班的推送方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元510可以执行如图1中所示的步骤。
所述存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)5201和/或高速缓存存储单元5202,还可以进一步包括只读存储单元(ROM)5203。
所述存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204,这样的程序模块5205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备500也可以与一个或多个外部设备600(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器560可以通过总线530与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明实施方式的上述中转航班的推送方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。

Claims (12)

1.一种中转航班的推送方法,其特征在于,所述方法包括:
建立包含多个历史延误航班的样本库,每个历史延误航班具有多个特征属性,包括航班号、出发机场和到达机场、及出发时间和到达时间;
基于各历史延误航班的一个或多个特征属性,分别获取各历史延误航班的延误属性值,天气属性值和行程属性值;
利用各历史延误航班及其延误属性值,天气属性值和行程属性值,生成用于定义各历史延误航班的延误概率估计值与真实值之间差距及模型复杂度的目标函数,通过对目标函数进行参数优化训练集成树模型;
采用训练好的集成树模型计算所有预售航班的延误概率,筛选出延误概率未超出阈值的航班,作为非延误航班;
在所述非延误航班中,根据前一航程的非延误航班的到达机场,获取以该到达机场为出发机场的延误概率最低且间隔时间在预设时间内的非延误航班,作为后一航程;
根据所述前一航程的非延误航班和所述后一航程的非延误航班的组合,生成航班中转信息,推送至机票查询页面。
2.如权利要求1所述的中转航班的推送方法,其特征在于,所述延误属性值包括航班延误属性值、航线延误属性值、出发机场延误属性值和到达机场延误属性值。
3.如权利要求2所述的中转航班的推送方法,其特征在于,获取所述航班延误属性值、航线延误属性值、出发机场延误属性值和到达机场延误属性值的步骤包括:
筛选航班号、出发机场和到达机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该航班延误属性值;
筛选出发机场和到达机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该出发机场至该到达机场之间的航线延误属性值;
筛选出发机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该出发机场延误属性值;
筛选到达机场相同的多个历史延误航班,计算该多个历史延误航班在各延误时段的延误概率均值,作为该到达机场延误属性值。
4.如权利要求1所述的中转航班的推送方法,其特征在于,所述天气属性值包括出发城市天气属性值和到达城市天气属性值。
5.如权利要求4所述的中转航班的推送方法,其特征在于,获取所述出发城市天气属性值和到达城市天气属性值的步骤包括:
基于各历史延误航班的出发机场定位其出发城市,获取所述出发城市在预设时段内的天气信息,包括定量属性值气温及定性属性值风力、风向和天气类型,作为该出发城市天气属性值;
基于各历史延误航班的到达机场定位其到达城市,获取所述到达城市在预设时段内的天气信息,包括定量属性值气温及定性属性值风力、风向和天气类型,作为该到达城市天气属性值。
6.如权利要求1所述的中转航班的推送方法,其特征在于,所述行程属性值包括飞行时长、飞行距离、起飞时点和到达时点。
7.如权利要求1所述的中转航班的推送方法,其特征在于,所述目标函数为:其中为损失函数,用于定义第i个历史延误航班的延误概率估计值与真实值之间差距,yi为第i个历史延误航班是否延误的标记,为第i个历史延误航班的延误概率估计值,Ω(fk)为正则项,用于定义模型复杂度,n为样本库中样本的总个数,Obj为样本的优化目标;
所述第i个历史延误航班的延误概率估计值的计算公式为 k为决策树的个数,每个决策树中包括该第i个历史延误航班的延误属性值,天气属性值和行程属性值中的一个或多个,为决策树集合,x为每个决策树所包含的属性值的向量值;
所述正则项Ω(fk)的计算公式为:其中T为第k棵决策树的节点个数,为第k棵决策树中第j个节点上分数的模平方,γ和λ均为正则化参数,取值范围均为0~1。
8.如权利要求1所述的中转航班的推送方法,其特征在于,进行非延误航班拼接时,所述间隔时间大于1小时且小于2小时。
9.如权利要求1所述的中转航班的推送方法,其特征在于,还包括:
对已有的预设中转航班,采用目标函数计算其前一航程的延误概率,对前一航程延误概率未超出阈值的预设中转航班,按照预设比例提高其票价。
10.一种中转航班的推送系统,其特征在于,所述系统包括:
样本组建模块,建立包含多个历史延误航班的样本库,每个历史延误航班具有多个特征属性,包括航班号、出发机场和到达机场、及出发时间和到达时间;
特征取值模块,基于各历史延误航班的一个或多个特征属性,分别获取各历史延误航班的延误属性值,天气属性值和行程属性值;
模型训练模块,利用各历史延误航班及其延误属性值,天气属性值和行程属性值生成用于定义延误概率估计值与真实值差距及模型复杂度的目标函数,对所述目标函数进行参数优化训练集成树模型;
延误预测模块,采用训练好的集成树模型计算所有预售航班的延误概率,筛选出延误概率未超出阈值的航班,作为非延误航班;
中转拼接模块,在所述非延误航班中,根据前一航程的非延误航班的到达机场,获取以该到达机场为出发机场的延误概率最低且间隔时间在预设时间内的非延误航班,作为后一航程;
信息推荐模块,根据所述前一航程的非延误航班和所述后一航程的非延误航班的组合,生成航班中转信息,推送至机票查询页面。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1~9任一项所述的中转航班的推送方法的步骤。
12.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~9任一项所述的中转航班的推送方法的步骤。
CN201711370824.8A 2017-12-12 2017-12-12 中转航班的推送方法、系统、存储介质和电子设备 Pending CN108038508A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711370824.8A CN108038508A (zh) 2017-12-12 2017-12-12 中转航班的推送方法、系统、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711370824.8A CN108038508A (zh) 2017-12-12 2017-12-12 中转航班的推送方法、系统、存储介质和电子设备

Publications (1)

Publication Number Publication Date
CN108038508A true CN108038508A (zh) 2018-05-15

Family

ID=62099729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711370824.8A Pending CN108038508A (zh) 2017-12-12 2017-12-12 中转航班的推送方法、系统、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN108038508A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492334A (zh) * 2018-12-11 2019-03-19 青岛心中有数科技有限公司 航班延误的模型建立方法、预测方法及装置
CN109816147A (zh) * 2018-12-26 2019-05-28 深圳市北斗智能科技有限公司 一种航空货运路由规划方法、装置、设备和存储介质
CN109933926A (zh) * 2019-03-19 2019-06-25 北京百度网讯科技有限公司 用于预测航班可靠性的方法和装置
CN110689151A (zh) * 2018-07-05 2020-01-14 北京嘀嘀无限科技发展有限公司 网约车订单处理方法、装置、设备及计算机可读存储介质
CN110727699A (zh) * 2019-10-21 2020-01-24 中国民航信息网络股份有限公司 一种信息请求方法、装置、服务器及存储介质
CN110852792A (zh) * 2019-10-28 2020-02-28 海南太美航空股份有限公司 一种基于大数据分析的航线价值评估方法及相关产品
CN110889537A (zh) * 2019-10-30 2020-03-17 东南大学 一种考虑航班延误的空铁联程出行方案生成方法
CN110928986A (zh) * 2019-10-18 2020-03-27 平安科技(深圳)有限公司 法律证据的排序和推荐方法、装置、设备及存储介质
CN110929945A (zh) * 2019-11-28 2020-03-27 海南太美航空股份有限公司 一种航线开通的预测方法、系统及电子设备
CN111079274A (zh) * 2019-12-04 2020-04-28 深圳市机场股份有限公司 机位智能分配方法、计算机装置及存储介质
CN111079968A (zh) * 2018-10-22 2020-04-28 昆山炫生活信息技术股份有限公司 基于多特征融合的景区游玩轨迹预测系统
CN111476401A (zh) * 2020-03-13 2020-07-31 海南太美航空股份有限公司 航班时刻表优化方法及系统
CN112000760A (zh) * 2020-08-26 2020-11-27 携程旅游网络技术(上海)有限公司 航班组建方法、系统、电子设备和存储介质
CN112000716A (zh) * 2020-08-26 2020-11-27 携程旅游网络技术(上海)有限公司 航线推送方法、系统、电子设备和存储介质
CN112307341A (zh) * 2020-11-02 2021-02-02 沈阳民航东北凯亚有限公司 航班推送方法及装置
CN112561281A (zh) * 2020-12-07 2021-03-26 中国民航信息网络股份有限公司 一种不正常航班的旅客保护方案的确定方法及系统
CN112801455A (zh) * 2020-12-31 2021-05-14 携程旅游网络技术(上海)有限公司 航班密度调整方法、系统、电子设备和存储介质
CN116362430A (zh) * 2023-06-02 2023-06-30 中国民航大学 一种基于在线增量mhha-sru航班延误预测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104680441A (zh) * 2015-02-03 2015-06-03 同程网络科技股份有限公司 基于航空票务的行程中转规划方法
US20160055275A1 (en) * 2014-08-21 2016-02-25 Mengjiao Wang Large scale flight simulation
CN105630979A (zh) * 2015-12-25 2016-06-01 中国民航信息网络股份有限公司 航班查询方法及装置、系统
CN106548210A (zh) * 2016-10-31 2017-03-29 腾讯科技(深圳)有限公司 机器学习模型训练方法及装置
CN106779127A (zh) * 2016-12-30 2017-05-31 中国民航信息网络股份有限公司 确定联程航班的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160055275A1 (en) * 2014-08-21 2016-02-25 Mengjiao Wang Large scale flight simulation
CN104680441A (zh) * 2015-02-03 2015-06-03 同程网络科技股份有限公司 基于航空票务的行程中转规划方法
CN105630979A (zh) * 2015-12-25 2016-06-01 中国民航信息网络股份有限公司 航班查询方法及装置、系统
CN106548210A (zh) * 2016-10-31 2017-03-29 腾讯科技(深圳)有限公司 机器学习模型训练方法及装置
CN106779127A (zh) * 2016-12-30 2017-05-31 中国民航信息网络股份有限公司 确定联程航班的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
叶倩怡 等: "基于Xgboost的商业销售预测", 《南昌大学学报(理科版)》 *
吴成仑: "《航班运营及延误管理》", 31 August 2011 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110689151A (zh) * 2018-07-05 2020-01-14 北京嘀嘀无限科技发展有限公司 网约车订单处理方法、装置、设备及计算机可读存储介质
CN110689151B (zh) * 2018-07-05 2020-07-28 北京嘀嘀无限科技发展有限公司 网约车订单处理方法、装置、设备及计算机可读存储介质
CN111079968A (zh) * 2018-10-22 2020-04-28 昆山炫生活信息技术股份有限公司 基于多特征融合的景区游玩轨迹预测系统
CN109492334B (zh) * 2018-12-11 2023-12-22 青岛心中有数科技有限公司 航班延误的模型建立方法、预测方法及装置
CN109492334A (zh) * 2018-12-11 2019-03-19 青岛心中有数科技有限公司 航班延误的模型建立方法、预测方法及装置
CN109816147A (zh) * 2018-12-26 2019-05-28 深圳市北斗智能科技有限公司 一种航空货运路由规划方法、装置、设备和存储介质
CN109933926A (zh) * 2019-03-19 2019-06-25 北京百度网讯科技有限公司 用于预测航班可靠性的方法和装置
CN109933926B (zh) * 2019-03-19 2023-11-21 北京百度网讯科技有限公司 用于预测航班可靠性的方法和装置
CN110928986B (zh) * 2019-10-18 2023-07-21 平安科技(深圳)有限公司 法律证据的排序和推荐方法、装置、设备及存储介质
CN110928986A (zh) * 2019-10-18 2020-03-27 平安科技(深圳)有限公司 法律证据的排序和推荐方法、装置、设备及存储介质
CN110727699A (zh) * 2019-10-21 2020-01-24 中国民航信息网络股份有限公司 一种信息请求方法、装置、服务器及存储介质
CN110852792A (zh) * 2019-10-28 2020-02-28 海南太美航空股份有限公司 一种基于大数据分析的航线价值评估方法及相关产品
CN110852792B (zh) * 2019-10-28 2023-10-03 海南太美航空股份有限公司 一种基于大数据分析的航线价值评估方法及相关产品
CN110889537A (zh) * 2019-10-30 2020-03-17 东南大学 一种考虑航班延误的空铁联程出行方案生成方法
CN110929945A (zh) * 2019-11-28 2020-03-27 海南太美航空股份有限公司 一种航线开通的预测方法、系统及电子设备
CN111079274A (zh) * 2019-12-04 2020-04-28 深圳市机场股份有限公司 机位智能分配方法、计算机装置及存储介质
CN111079274B (zh) * 2019-12-04 2024-04-09 深圳市机场股份有限公司 机位智能分配方法、计算机装置及存储介质
CN111476401A (zh) * 2020-03-13 2020-07-31 海南太美航空股份有限公司 航班时刻表优化方法及系统
CN112000760B (zh) * 2020-08-26 2023-10-03 携程旅游网络技术(上海)有限公司 航班组建方法、系统、电子设备和存储介质
CN112000716A (zh) * 2020-08-26 2020-11-27 携程旅游网络技术(上海)有限公司 航线推送方法、系统、电子设备和存储介质
CN112000716B (zh) * 2020-08-26 2024-02-13 携程旅游网络技术(上海)有限公司 航线推送方法、系统、电子设备和存储介质
CN112000760A (zh) * 2020-08-26 2020-11-27 携程旅游网络技术(上海)有限公司 航班组建方法、系统、电子设备和存储介质
CN112307341A (zh) * 2020-11-02 2021-02-02 沈阳民航东北凯亚有限公司 航班推送方法及装置
CN112561281A (zh) * 2020-12-07 2021-03-26 中国民航信息网络股份有限公司 一种不正常航班的旅客保护方案的确定方法及系统
CN112801455A (zh) * 2020-12-31 2021-05-14 携程旅游网络技术(上海)有限公司 航班密度调整方法、系统、电子设备和存储介质
CN116362430A (zh) * 2023-06-02 2023-06-30 中国民航大学 一种基于在线增量mhha-sru航班延误预测方法及系统
CN116362430B (zh) * 2023-06-02 2023-08-01 中国民航大学 一种基于在线增量mhha-sru航班延误预测方法及系统

Similar Documents

Publication Publication Date Title
CN108038508A (zh) 中转航班的推送方法、系统、存储介质和电子设备
CN108122052A (zh) 航班延误信息的推送方法、系统、存储介质和电子设备
CN112600717B (zh) 基于sdn的卫星网络管控协议半实物试验装置
CN104636801A (zh) 一种基于优化bp神经网络的预测输电线路可听噪声方法
CN111401601A (zh) 一种面向延误传播的航班起降时间预测方法
CN109506654A (zh) 低空航路规划方法及装置、飞行器
CN110135599A (zh) 无人机电力巡检点云智能化处理与分析服务平台
Ray et al. Hybrid methodology for short-term load forecasting
CN111415049A (zh) 一种基于神经网络及聚类的停电敏感性分析方法
Celik et al. DDDAMS-based dispatch control in power networks
CN107491517A (zh) 基于事件驱动的改签方法、系统、设备及存储介质
CN111161566B (zh) 航班延误预警方法、系统、电子设备和介质
Huang et al. Smart energy management system based on reconfigurable AI chip and electrical vehicles
CN111191845A (zh) 基于dbscan算法和kmp模式匹配法的电力通信网工单调度方法
CN107798411A (zh) 一种班车路线的评测处理方法及服务器
CN110033111A (zh) 机场场面运动规划方法和装置
Saadi et al. A hybrid improved manta ray foraging optimization with Tabu search algorithm for solving the UAV placement problem in smart cities
CN116709290A (zh) 一种基于无人机边缘计算的灾害地区应急通信方法及系统
CN115574826B (zh) 基于强化学习的国家公园无人机巡护路径优化方法
CN115310732B (zh) 航班延误预测方法及系统
CN111611332B (zh) 航线中转的优化方法及系统
CN112529419B (zh) 一种基于相关性分析的电网数据透明应用方法及系统
CN113052296A (zh) 基于深度学习卷积神经网络技术的电网输电缺陷智能管理系统
CN113449238A (zh) 无人机安全运行方法、装置、电子设备及存储介质
KR102304782B1 (ko) 인공지능 및 빅데이터 센터 구축을 위한 규모 산정 장치 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180515