CN109727073B - 访问流量控制方法、系统、电子设备和存储介质 - Google Patents

访问流量控制方法、系统、电子设备和存储介质 Download PDF

Info

Publication number
CN109727073B
CN109727073B CN201811637604.1A CN201811637604A CN109727073B CN 109727073 B CN109727073 B CN 109727073B CN 201811637604 A CN201811637604 A CN 201811637604A CN 109727073 B CN109727073 B CN 109727073B
Authority
CN
China
Prior art keywords
sales volume
day
department
sequence
obtaining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811637604.1A
Other languages
English (en)
Other versions
CN109727073A (zh
Inventor
贡志成
聂强强
肖铨武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Network Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Network Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Network Technology Shanghai Co Ltd filed Critical Ctrip Travel Network Technology Shanghai Co Ltd
Priority to CN201811637604.1A priority Critical patent/CN109727073B/zh
Publication of CN109727073A publication Critical patent/CN109727073A/zh
Application granted granted Critical
Publication of CN109727073B publication Critical patent/CN109727073B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种访问流量控制方法、系统、电子设备和存储介质,用于基于销量预测控制访问流量,最终实现销量控制。其中方法包括:获得访问流量全部开放时一航司全部航线历史每天的销量,形成全流量下该航司全航线的历史销量序列;对该历史销量序列进行时序分解获得时间特征,并获得与该历史销量序列关联的其他特征,形成特征变量集;从特征变量集中基于网络搜索和交叉验证选取特征参数,以该历史销量序列为目标参数进行模型训练,获得xgboost预测模型;根据xgboost预测模型获得未来每天全流量下该航司全航线的预测销量,根据未来每天全流量下该航司全航线的预测销量与未来每天该航司全航线的待销量,获得未来每天访问流量的开放比例。

Description

访问流量控制方法、系统、电子设备和存储介质
技术领域
本申请涉及网络订票技术领域,具体地说,涉及一种基于销量预测的访问流量控制方法、系统、电子设备和存储介质。
背景技术
销量预测是许多企业都会遇到的问题,通过销量预测以达到收益的最大化,提高企业效益。通常对于销量的预测会采用传统的时间序列方法,如ARIMA,指数平滑法(Exponential Smoothing),TBATS等方法。
时间序列方法对于日销量的预测会有一定的局限性,以ARIMA模型为例,ARIMA模型是一个线性模型,是历史观测值和误差序列的线性组合,有很强的短期记忆性。其次,时间序列方法对于查询量、订单量、节假日等重要外生变量的系数较小,敏感度低。另外,为了对销量进行管控,业务会采取人工控量的方式,干预控制可售航线,这样会破坏了销量序列的自然增减规律,使采用传统的时间序列方法预测的销量不够准确。
需要说明的是,在上述背景技术部分申请的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本申请提供一种基于销量预测的访问流量控制方法、系统、电子设备和存储介质,基于销量预测控制访问流量,最终实现销量控制。
根据本申请的一个方面,提供一种访问流量控制方法,包括:获得访问流量全部开放时一航司全部航线历史每天的销量,形成全流量下该航司全航线的历史销量序列;对所述历史销量序列进行时序分解获得时间特征,并获得与所述历史销量序列关联的其他特征,形成特征变量集;从所述特征变量集中基于网络搜索和交叉验证选取特征参数,以所述历史销量序列为目标参数进行模型训练,获得xgboost预测模型;根据所述xgboost预测模型获得未来每天全流量下该航司全航线的预测销量,根据所述未来每天全流量下该航司全航线的预测销量与未来每天该航司全航线的待销量,获得未来每天访问流量的开放比例。
优选地,上述的访问流量控制方法中,所述获得访问流量全部开放时一航司全部航线历史每天的销量的步骤包括:获得历史一天该航司在售航线的真实销量作为第一销量,及该天该航司在售航线在所有航司中的真实销量作为第二销量,以所述第一销量与所述第二销量的比值作为该航司销量占所有航司销量的占比因子;获得该航司全部航线在所有航司中该天的真实销量作为第三销量,将所述占比因子与所述第三销量相乘获得该航司该天的全航线销量;将该航司该天的全航线销量与该天的访问流量开放比例相除,获得全流量下该航司全航线该天的销量。
优选地,上述的访问流量控制方法中,所述获得全流量下该航司全航线该天的销量
Figure BDA0001930410650000023
的公式是:
Figure BDA0001930410650000022
其中全部航线包括在售航线和非在售航线。
优选地,上述的访问流量控制方法中,所述获得未来每天访问流量的开放比例的方法是:
Figure BDA0001930410650000021
其中R是未来每天访问流量占全流量的开放比例。
优选地,上述的访问流量控制方法中,对所述历史销量序列进行时序分解获得时间特征的步骤包括:采用decompose函数对所述历史销量序列进行时序分解获得周期项和趋势项,作为所述历史销量序列的时间特征。
优选地,上述的访问流量控制方法中,与所述历史销量序列关联的其他特征包括:所述历史销量序列的节假日数据;所述历史销量序列的年、月、周、天的哑变量;该航司t-1天的销量、t-1天的订单量、t-1天的查询量,其中t-1天是待训练的历史每天的前一天;该航司订单的价格区间特征、单程/往返特征、成人/儿童特征、出行目的特征、来源渠道特征。
优选地,上述的访问流量控制方法中,从所述特征变量集中基于网络搜索和交叉验证选取特征参数的步骤包括:将所述特征变量集切分为训练集和测试集,采用学习步长eta函数、最大树深max_depth函数、最小叶节点权重min_child_weight函数、训练样本的采样比例subsample函数、列采样比例colsample_bytree函数选取特征参数。
根据本申请的另一个方面,提供一种访问流量控制系统,包括:销量计算模块,用于获得访问流量全部开放时一航司全部航线历史每天的销量,形成全流量下该航司全航线的历史销量序列;变量生成模块,用于对所述历史销量序列进行时序分解获得时间特征,并获得与所述历史销量序列关联的其他特征,形成特征变量集;模型训练模块,用于从所述特征变量集中基于网络搜索和交叉验证选取特征参数,以所述历史销量序列为目标参数进行模型训练,获得xgboost预测模型;预测模块,用于根据所述xgboost预测模型获得未来每天全流量下该航司全航线的预测销量,根据所述未来每天全流量下该航司全航线的预测销量与未来每天该航司全航线的待销量,获得未来每天访问流量的开放比例。
根据本申请的另一个方面,提供一种电子设备,包括:处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述的访问流量控制方法的步骤。
根据本申请的另一个方面,提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述的访问流量控制方法的步骤。
本申请的有益效果在于:
通过估算全流量下航司全航线的历史销量序列,对历史销量序列进行时序分解获得包括周期项和趋势项的时间特征,并结合其他关联特征形成特征变量集。基于特征变量集,采用网格搜索和交叉验证选取参数,训练获得xgboost预测模型。采用xgboost预测模型获得未来每天全流量下航司全航线的预测销量,并结合未来每天航司全航线的待销量,获得未来每天的访问流量开放比例,达到控制销量的目的。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本申请实施例中一种访问流量控制方法的步骤示意图;
图2示出本申请实施例中一种访问流量控制方法的架构示意图;
图3示出本申请实施例中一种访问流量控制系统的模块示意图;
图4示出本申请实施例中一种电子设备的结构示意图;
图5示出本申请实施例中一种计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本申请将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
本申请的流量控制方法适用于在线订票平台,通过历史销量训练模型,利用训练好的模型预测未来销量,根据预测的未来销量以及未来需要管控的销量范围,对访问流量进行控制,使未来的真实销量落入需要管控的销量范围内。
图1示出实施例中访问流量控制方法的步骤图,图2示出实施例中访问流量控制方法的架构图。结合图1和图2所示,在一些实施例中,本申请的访问流量控制方法包括:
S10、获得访问流量全部开放时一航司全部航线历史每天的销量,形成全流量下该航司全航线的历史销量序列。
其中,所述的航司是指需要管控机票销量的某一航空公司。可以通过下述步骤获得访问流量全部开放时一航司全部航线历史每天的销量:首先获得历史一天该航司在售航线的真实销量,作为第一销量。所述的该航司在售航线是指该航司当天开放销售的航线,是该航司全部航线的一部分,也即全部航线包括了在售航线和非在售航线。接着获得该天该航司在售航线在所有航司中的真实销量,作为第二销量。举例来说,该天该航司在售航线包括三条,分别是A→B、A→C、D→E;第一销量即该航司该三条航线该天的真实销量;第二销量即所有航司该三条航线该天的真实销量。通过第一销量与第二销量之比,即可获得该航司销量占所有航司销量的占比因子。接着获得该航司全部航线在所有航司中该天的真实销量作为第三销量。如该航司全部航线包括六条,分别是A→B、A→C、D→E、D→F、H→J、H→K;则所有航司该六条航线该天的真实销量作为第三销量。将上述占比因子与第三销量相乘,即可获得该航司该天的全航线销量,即该航司该天全部航线的估算销量。最后将该航司该天的全航线销量与该天的访问流量开放比例相除,即获得估算的全流量下该航司全航线该天的销量。所述的全流量下该航司全航线该天的销量
Figure BDA0001930410650000053
采用公式表达为:
Figure BDA0001930410650000052
采用上述公式,依次获得访问流量全部开放时该航司全部航线历史每天的销量,形成全流量下该航司全航线的历史销量序列。该历史销量序列后续将作为模型训练的目标参数,是模型需要预测和输出的。
S20、对历史销量序列进行时序分解获得时间特征,并获得与历史销量序列关联的其他特征,形成特征变量集。
除目标参数外,模型训练还需要待选取的特征参数。S20具体包括:S201对历史销量序列进行时序分解获得时间特征,具体是采用decompose函数对历史销量序列进行时序分解,获得周期项和趋势项,作为历史销量序列的时间特征。因为销量有周期性和趋势性等时间特征,而后续将训练的xgboost模型不能像时间序列模型一样很好地学习到这些时间上的规律。因此通过时序分解获得历史销量序列的周期项和趋势项,作为时间特征加入xgboost模型训练的特征变量集中。其中decompose函数是一种时间序列应用,可以对数据进行分解形成周期部分和趋势部分,利用decompose函数分解历史销量序列的时间序列,就可以得到序列的周期和趋势,使模型训练时xgboost学习到销量在时间上的规律和特征。
以及S202获得与历史销量序列关联的其他特征,包括:历史销量序列的节假日数据,历史销量序列的年、月、周、天的哑变量,该航司t-1天的销量、t-1天的订单量、t-1天的查询量,其中t-1天是待训练的历史每天的前一天,该航司订单的价格区间特征、单程/往返特征、成人/儿童特征、出行目的特征、来源渠道特征等等。其中该航司订单的价格区间特征、单程/往返特征、成人/儿童特征、出行目的特征、来源渠道特征是对该航司订单的多维度细分,由于不同航线有不同价位,高价位航线的订单占比越高则销量越高,反之亦然,因此需要对订单的价格区间进行划分,如本实施例中按照各航线平均价位给该航司的全部航线进行价格区间划分,包括六个价格区间,分别是:0-2000元区间、2000-3000元区间、3000-4000区间、4000-5000区间、5000-6000区间、以及大于6000元区间。同时,给该航司订单区分单程订单/往返订单,成人订单/儿童订单,并区分订单的出行目的,如旅行/商务,订单的来源渠道,如APP/Online。通过估算出历史销量序列,将其作时序分解,分解的周期项和趋势项结合年、月、周、天的哑变量,t-1的销量、订单、查询量,节假日,更细维度的订单占比作为特征,形成模型训练需要的特征变量集。
S30、从特征变量集中基于网络搜索和交叉验证选取特征参数,以历史销量序列为目标参数进行模型训练,获得xgboost预测模型。
具体来说,将上述获得的特征变量集切分为训练集和测试集,采用学习步长eta函数、最大树深max_depth函数、最小叶节点权重min_child_weight函数、训练样本的采样比例subsample函数、列采样比例colsample_bytree函数等网格搜索和交叉验证方法选取特征参数,以历史销量序列为目标参数训练xgboost模型。训练过程可以参照现有的xgboost模型训练过程,模型训练前,将目标参数作log变换,使得历史销量序列更加正态。再利用xgboost训练模型,通过网格搜索和交叉验证选取参数,最后给出输出结果,并对结果作指数变换恢复成预测的销量,最终得到训练好的xgboost预测模型。
S40、根据xgboost预测模型获得未来每天全流量下该航司全航线的预测销量,根据未来每天全流量下该航司全航线的预测销量与未来每天该航司全航线的待销量,获得未来每天访问流量的开放比例。
S40具体包括S401采用训练好的xgboost预测模型获得未来每天全流量下该航司全航线的预测销量。例如要预测今天全流量下该航司全航线的预测销量,则将上述该航司的历史销量序列的周期项和趋势项结合年、月、周、天的哑变量,该航司昨天的销量、订单量、查询量,节假日,更细维度的订单占比等变量中优选的变量输入训练好的xgboost预测模型,获得今天全流量下该航司全航线的预测销量。以及S402通过未来每天全流量下该航司全航线的预测销量与未来每天该航司全航线的待销量相除,获得未来每天访问流量的开放比例。具体公式是:
Figure BDA0001930410650000071
其中R即未来每天访问流量占全流量的开放比例,未来每天该航司全航线的待销量是指未来每天该航司需要管控的销量范围。例如该航司当月销量指标是P,则将该航司当月销量指标P平均分摊到当月的每一天,获得当月每天该航司全航线的待销量。将当月每天该航司全航线的待销量除以xgboost预测模型预测的当月一天全流量下该航司全航线的预测销量,即可获得当月该天访问流量的开放比例,实现该航司的销量控制。
上述的访问流量控制方法通过估算全流量下航司全航线的历史销量序列,对历史销量序列进行时序分解获得包括周期项和趋势项的时间特征,并结合其他关联特征形成特征变量集。基于特征变量集,采用网格搜索和交叉验证选取参数,训练获得xgboost预测模型。采用xgboost预测模型获得未来每天全流量下航司全航线的预测销量,并结合未来每天航司全航线的待销量,获得未来每天的访问流量开放比例,达到控制销量的目的。
本申请实施例还提供一种访问流量控制系统。参照图3所示,在一些实施例中,访问流量控制系统包括:
销量计算模块301,用于获得访问流量全部开放时一航司全部航线历史每天的销量,形成全流量下该航司全航线的历史销量序列。例如,销量计算模块301可用于执行上述任意实施例中访问流量控制方法的步骤S10。
变量生成模块302,用于对所述历史销量序列进行时序分解获得时间特征,并获得与所述历史销量序列关联的其他特征,形成特征变量集。例如,变量生成模块302可用于执行上述任意实施例中访问流量控制方法的步骤S20。
模型训练模块303,用于从所述特征变量集中基于网络搜索和交叉验证选取特征参数,以所述历史销量序列为目标参数进行模型训练,获得xgboost预测模型。例如,模型训练模块303可用于执行上述任意实施例中访问流量控制方法的步骤S30。
预测模块304,用于根据所述xgboost预测模型获得未来每天全流量下该航司全航线的预测销量,根据所述未来每天全流量下该航司全航线的预测销量与未来每天该航司全航线的待销量,获得未来每天访问流量的开放比例。例如,预测模块304可用于执行上述任意实施例中访问流量控制方法的步骤S40。
本申请的访问流量控制系统能够通过估算全流量下航司全航线的历史销量序列,对历史销量序列进行时序分解获得包括周期项和趋势项的时间特征,并结合其他关联特征形成特征变量集。基于特征变量集,采用网格搜索和交叉验证选取参数,训练获得xgboost预测模型。采用xgboost预测模型获得未来每天全流量下航司全航线的预测销量,并结合未来每天航司全航线的待销量,获得未来每天的访问流量开放比例,达到控制销量的目的。
本申请实施例还提供一种电子设备,包括处理器和存储器,存储器中存储有可执行指令,处理器被配置为经由执行可执行指令来执行上述实施例中的访问流量控制方法的步骤。
如上所述,本申请的电子设备能够通过估算全流量下航司全航线的历史销量序列,对历史销量序列进行时序分解获得包括周期项和趋势项的时间特征,并结合其他关联特征形成特征变量集。基于特征变量集,采用网格搜索和交叉验证选取参数,训练获得xgboost预测模型。采用xgboost预测模型获得未来每天全流量下航司全航线的预测销量,并结合未来每天航司全航线的待销量,获得未来每天的访问流量开放比例,达到控制销量的目的。
图4是本申请实施例中电子设备的结构示意图,应当理解的是,图4仅仅是示意性地示出各个模块,这些模块可以是虚拟的软件模块或实际的硬件模块,这些模块的合并、拆分及其余模块的增加都在本申请的保护范围之内。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
下面参照图4来描述本申请的电子设备400。图4显示的电子设备400仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400以通用计算设备的形式表现。电子设备400的组件可以包括但不限于:至少一个处理单元410、至少一个存储单元420、连接不同平台组件(包括存储单元420和处理单元410)的总线430、显示单元440等。
其中,存储单元存储有程序代码,程序代码可以被处理单元410执行,使得处理单元410执行上述实施例中描述的访问流量控制方法的步骤。例如,处理单元410可以执行如图1至所示的步骤。
存储单元420可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)4201和/或高速缓存存储单元4202,还可以进一步包括只读存储单元(ROM)4203。
存储单元420还可以包括具有一组(至少一个)程序模块4205的程序/实用工具4204,这样的程序模块4205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线430可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备400也可以与一个或多个外部设备500(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备400交互的设备通信,和/或与使得该电子设备400能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口450进行。并且,电子设备400还可以通过网络适配器460与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器460可以通过总线430与电子设备400的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本申请实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现上述实施例描述的访问流量控制方法的步骤。在一些可能的实施方式中,本申请的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行上述实施例描述的访问流量控制方法的步骤。
如上所述,本申请的计算机可读存储介质能够通过估算全流量下航司全航线的历史销量序列,对历史销量序列进行时序分解获得包括周期项和趋势项的时间特征,并结合其他关联特征形成特征变量集。基于特征变量集,采用网格搜索和交叉验证选取参数,训练获得xgboost预测模型。采用xgboost预测模型获得未来每天全流量下航司全航线的预测销量,并结合未来每天航司全航线的待销量,获得未来每天的访问流量开放比例,达到控制销量的目的。
图5是本申请的计算机可读存储介质的结构示意图。参考图5所示,描述了根据本申请的实施方式的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
以上内容是结合具体的优选实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本申请的保护范围。

Claims (8)

1.一种访问流量控制方法,其特征在于,包括:
获得访问流量全部开放时一航司全部航线历史每天的销量,形成全流量下该航司全航线的历史销量序列;
对所述历史销量序列进行时序分解获得时间特征,包括:采用decompose函数对所述历史销量序列进行时序分解,获得周期项和趋势项,作为所述时间特征;并获得与所述历史销量序列关联的其他特征,形成特征变量集,所述其他特征包括:所述历史销量序列的节假日数据,所述历史销量序列的年、月、周、天的哑变量,该航司t-1天的销量、t-1天的订单量、t-1天的查询量,其中t-1天是待训练的历史每天的前一天;
从所述特征变量集中基于网络搜索和交叉验证选取特征参数,包括:将所述特征变量集切分为训练集和测试集,采用学习步长eta函数、最大树深max_depth函数、最小叶节点权重min_child_weight函数、训练样本的采样比例subsample函数和列采样比例colsample_bytree函数选取特征参数;并以所述历史销量序列为目标参数进行模型训练,获得xgboost预测模型;
根据所述xgboost预测模型获得未来每天全流量下该航司全航线的预测销量,根据所述未来每天全流量下该航司全航线的预测销量与未来每天该航司全航线的待销量,获得未来每天访问流量的开放比例。
2.如权利要求1所述的访问流量控制方法,其特征在于,所述获得访问流量全部开放时一航司全部航线历史每天的销量的步骤包括:
获得历史一天该航司在售航线的真实销量作为第一销量,及该天该航司在售航线在所有航司中的真实销量作为第二销量,以所述第一销量与所述第二销量的比值作为该航司销量占所有航司销量的占比因子;
获得该航司全部航线在所有航司中该天的真实销量作为第三销量,将所述占比因子与所述第三销量相乘获得该航司该天的全航线销量;
将该航司该天的全航线销量与该天的访问流量开放比例相除,获得全流量下该航司全航线该天的销量。
3.如权利要求2所述的访问流量控制方法,其特征在于,所述获得全流量下该航司全航线该天的销量
Figure FDA0002827788960000021
的公式是:
Figure FDA0002827788960000022
其中全部航线包括在售航线和非在售航线。
4.如权利要求1所述的访问流量控制方法,其特征在于,所述获得未来每天访问流量的开放比例的方法是:
Figure FDA0002827788960000023
其中R是未来每天访问流量占全流量的开放比例。
5.如权利要求1所述的访问流量控制方法,其特征在于,与所述历史销量序列关联的其他特征还包括:
该航司订单的价格区间特征、单程/往返特征、成人/儿童特征、出行目的特征、来源渠道特征。
6.一种访问流量控制系统,其特征在于,包括:
销量计算模块,用于获得访问流量全部开放时一航司全部航线历史每天的销量,形成全流量下该航司全航线的历史销量序列;
变量生成模块,用于对所述历史销量序列进行时序分解获得时间特征,包括:采用decompose函数对所述历史销量序列进行时序分解,获得周期项和趋势项,作为所述时间特征;并获得与所述历史销量序列关联的其他特征,形成特征变量集,所述其他特征包括:所述历史销量序列的节假日数据,所述历史销量序列的年、月、周、天的哑变量,该航司t-1天的销量、t-1天的订单量、t-1天的查询量,其中t-1天是待训练的历史每天的前一天;
模型训练模块,用于从所述特征变量集中基于网络搜索和交叉验证选取特征参数,包括:将所述特征变量集切分为训练集和测试集,采用学习步长eta函数、最大树深max_depth函数、最小叶节点权重min_child_weight函数、训练样本的采样比例subsample函数和列采样比例colsample_bytree函数选取特征参数;并以所述历史销量序列为目标参数进行模型训练,获得xgboost预测模型;
预测模块,用于根据所述xgboost预测模型获得未来每天全流量下该航司全航线的预测销量,根据所述未来每天全流量下该航司全航线的预测销量与未来每天该航司全航线的待销量,获得未来每天访问流量的开放比例。
7.一种电子设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至5任一项所述的访问流量控制方法的步骤。
8.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至5任一项所述的访问流量控制方法的步骤。
CN201811637604.1A 2018-12-29 2018-12-29 访问流量控制方法、系统、电子设备和存储介质 Active CN109727073B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811637604.1A CN109727073B (zh) 2018-12-29 2018-12-29 访问流量控制方法、系统、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811637604.1A CN109727073B (zh) 2018-12-29 2018-12-29 访问流量控制方法、系统、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN109727073A CN109727073A (zh) 2019-05-07
CN109727073B true CN109727073B (zh) 2021-03-05

Family

ID=66297961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811637604.1A Active CN109727073B (zh) 2018-12-29 2018-12-29 访问流量控制方法、系统、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN109727073B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625859A (zh) * 2020-05-20 2020-09-04 北京百度网讯科技有限公司 一种资源的访问控制方法、装置、电子设备和存储介质
CN113744018B (zh) * 2020-11-23 2024-06-18 北京沃东天骏信息技术有限公司 物品信息推送方法及装置、计算机可存储介质
CN115660728B (zh) * 2022-10-11 2023-10-20 南京意博软件科技有限公司 一种机票销售订单预测方法、装置、电子设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678514A (zh) * 2013-11-26 2014-03-26 安徽科大讯飞信息科技股份有限公司 一种业务趋势预测方法及系统
CN104217355A (zh) * 2014-09-11 2014-12-17 北京京东尚科信息技术有限公司 预测促销商品销量的方法和装置
CN105184618A (zh) * 2015-10-20 2015-12-23 广州唯品会信息科技有限公司 新用户的商品个性化推荐方法及系统
CN106203746A (zh) * 2016-09-30 2016-12-07 携程计算机技术(上海)有限公司 酒店群划分及需求预测的方法
CN106408341A (zh) * 2016-09-21 2017-02-15 北京小米移动软件有限公司 货品销量的预测方法及装置、电子设备
CN107274209A (zh) * 2017-05-18 2017-10-20 北京京东尚科信息技术有限公司 预测促销活动销售数据的方法和装置
CN107274231A (zh) * 2017-06-29 2017-10-20 北京京东尚科信息技术有限公司 数据预测方法及装置
CN108648023A (zh) * 2018-05-18 2018-10-12 上海电机学院 一种融合历史均值与提升树的商家客流量预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020059058A1 (en) * 1994-09-01 2002-05-16 Aaron P. Doolin Margin analysis system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678514A (zh) * 2013-11-26 2014-03-26 安徽科大讯飞信息科技股份有限公司 一种业务趋势预测方法及系统
CN104217355A (zh) * 2014-09-11 2014-12-17 北京京东尚科信息技术有限公司 预测促销商品销量的方法和装置
CN105184618A (zh) * 2015-10-20 2015-12-23 广州唯品会信息科技有限公司 新用户的商品个性化推荐方法及系统
CN106408341A (zh) * 2016-09-21 2017-02-15 北京小米移动软件有限公司 货品销量的预测方法及装置、电子设备
CN106203746A (zh) * 2016-09-30 2016-12-07 携程计算机技术(上海)有限公司 酒店群划分及需求预测的方法
CN107274209A (zh) * 2017-05-18 2017-10-20 北京京东尚科信息技术有限公司 预测促销活动销售数据的方法和装置
CN107274231A (zh) * 2017-06-29 2017-10-20 北京京东尚科信息技术有限公司 数据预测方法及装置
CN108648023A (zh) * 2018-05-18 2018-10-12 上海电机学院 一种融合历史均值与提升树的商家客流量预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于流量预测的实时流量调优架构;唐春;《https://www.zte.com.cn/china/about/magazine/zte-technologies/2018/6-cn/special-topic/Tech-Article-six》;20180827;1-7 *

Also Published As

Publication number Publication date
CN109727073A (zh) 2019-05-07

Similar Documents

Publication Publication Date Title
US11386496B2 (en) Generative network based probabilistic portfolio management
CN109727073B (zh) 访问流量控制方法、系统、电子设备和存储介质
US10346752B2 (en) Correcting existing predictive model outputs with social media features over multiple time scales
US10552426B2 (en) Adaptive conversational disambiguation system
CN112948412B (zh) 航班库存更新方法、系统、电子设备和存储介质
CN109492858A (zh) 基于机器学习的员工绩效预测方法及装置、设备、介质
US20200410355A1 (en) Explainable machine learning based on heterogeneous data
US20180113939A1 (en) Response generation
US20230359825A1 (en) Knowledge graph entities from text
US20220358594A1 (en) Counterfactual e-net learning for contextual enhanced earnings call analysis
CN112102116B (zh) 基于旅游会话的输入预测方法、系统、设备及存储介质
US20190303787A1 (en) Adaptive learning rate schedule in distributed stochastic gradient descent
CN115994611A (zh) 类别预测模型的训练方法、预测方法、设备和存储介质
CN111353642A (zh) 话务排班预测方法、装置、电子设备、存储介质
Brentnall et al. Some effects of aircraft arrival sequence algorithms
US20190304036A1 (en) Determining an effect of a message on a personal brand based on future goals
CN113094602B (zh) 酒店推荐方法、系统、设备及介质
US11810209B2 (en) Outage restoration time prediction during weather events and optimized solutions for recovery
CN115660728B (zh) 一种机票销售订单预测方法、装置、电子设备和存储介质
CN112434872A (zh) 酒店产量预测方法、系统、设备及存储介质
US20180046968A1 (en) Job profile generation based on intranet usage
CN115730872A (zh) 一种城市轨道交通平行推演系统及方法
CN115759373A (zh) 燃气日负荷预测方法、装置及设备
Liu et al. Prediction of passenger flow at sanya airport based on combined methods
US11281747B2 (en) Predicting variables where a portion are input by a user and a portion are predicted by a system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant