CN109978619A - 机票定价策略筛选的方法、系统、设备以及介质 - Google Patents
机票定价策略筛选的方法、系统、设备以及介质 Download PDFInfo
- Publication number
- CN109978619A CN109978619A CN201910225676.3A CN201910225676A CN109978619A CN 109978619 A CN109978619 A CN 109978619A CN 201910225676 A CN201910225676 A CN 201910225676A CN 109978619 A CN109978619 A CN 109978619A
- Authority
- CN
- China
- Prior art keywords
- air ticket
- pricing
- ticket pricing
- strategy
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
Abstract
本发明公开了一种机票定价策略筛选的方法、系统、设备以及介质,包括:S110,采集历史机票定价策略的历史定价数据,形成一样本集;S120,按照历史定价数据中的起飞城市将样本集划分为多个子样本集;S130,根据每一子样本集训练一预测模型;S140,获取当前的机票定价策略的定价数据;S150,根据定价数据中的起飞城市,将定价数据输入对应的预测模型获得机票定价策略的预测值;S160,根据机票定价策略的预测值对当前的机票定价策略进行排序并删除排序在后的多个机票定价策略;S170,判断每一预测模型的准确率是否大于一预设阈值,可以减少了当前的机票定价策略的总量,进而减小了后续的筛选过程的开销,提高了机票定价策略筛选的效率。
Description
技术领域
本发明涉及的是一种计算机应用领域的技术,更具体的说,涉及一种机票定价策略筛选的方法、系统、设备以及介质。
背景技术
现有的机票定价策略有许多来源渠道,因为原始机票定价策略的量过于庞大直接放入缓存会占用过多资源且效率低下,所以需要先对原始机票定价策略进行筛选,仅保留部分优质的机票定价策略放入缓存供搜索引擎进行检索。
目前的机票定价策略过滤方案为遍历整个机票定价策略数据集逐个对比机票定价策略,若A机票定价策略在所有维度上都优于B机票定价策略则A机票定价策略被保留B机票定价策略被剔除,最终留下所有未被剔除的机票定价策略进入缓存。为了支撑大规模机票定价策略的筛选过滤,耗费了大量计算资源。
发明内容
针对现有技术存在的问题,本发明的目的在于提供一种机票定价策略筛选的方法、系统、设备以及介质,能够针对每一个起飞城市建立一个预测模型,并且该预测模型为决策树模型,可以通过分布式服务器来训练每个模型即一个预测模型在一个服务器中训练运行,实现对对当前的机票价格策略的预测,从而获得该机票定价策略的预测值,根据预测值进行排序之后只保留部分预测值相对较高的部分机票定价策略,从而减少了当前的机票定价策略的总量,进而减小了后续的筛选过程的开销,提高了机票定价策略筛选的效率。
根据本发明的一个方面,提供一种机票定价策略筛选的方法,包括:
S110,采集历史机票定价策略的历史定价数据,形成一样本集,每一所述历史定价数据具有一指示该历史机票定价策略是否被应用的类别标签;
S120,按照所述历史定价数据中的起飞城市将所述样本集划分为多个子样本集,每一所述子样本集对应一个所述起飞城市;
S130,根据每一所述子样本集训练一预测模型,其中,每一所述预测模型与一个所述起飞城市对应,所述预测模型以定价数据作为输入,输出一与所述机票定价策略相关联的预测值;
S140,获取当前的所述机票定价策略的定价数据;
S150,根据所述定价数据中的起飞城市,将所述定价数据输入对应的所述预测模型获得所述机票定价策略的预测值;
S160,根据所述机票定价策略的预测值对当前的所述机票定价策略进行排序并删除排序在后的多个所述机票定价策略;
S170,判断每一所述预测模型的准确率是否大于一预设阈值,若否,则回到步骤S110。
优选的,所述S130,根据每一所述子样本集训练一预测模型包括:
S131,将子样本集划分为训练集和测试集,其中,所述训练集中的样本数量与所述测试集中的样本数量的比值为5;
S132,根据所述历史定价数据提取所述训练集和所述测试集中的样本的特征;
S133,根据所述训练集和所述测试集中的样本的特征通过决策树算法获得与所述子样本集对应的所述预测模型。
优选的,所述方法还包括:
S210,提取所述样本集中部分的样本作为一筛选样本集,所述筛选样本集中所述历史定价数据的类别标签的值为1指示该历史机票定价策略被应用,所述类别标签的值为0时指示该历史机票定价策略未被应用;
S220,对所述筛选样本集中的所述历史定价数据进行特征提取;
S230,将所提取的特征作为一筛选模型的输入,所述类别标签作为输出训练所述筛选模型;
S240,将对当前的所述机票定价策略进行排序并删除之后获得的所述机票定价策略的特征输入所述筛选模型获得所述机票定价策略的类别标签的值,并将所述类别标签的值为1的机票定价策略导入服务端的缓存中。
优选的,所述定价数据的特征包括:到达城市、起飞时间、乘客年龄、票面价格以及机票底价。
优选的,所述S130,根据每一所述子样本集训练一预测模型包括:
S310,对每一训练获得的所述预测模型进行交叉验证。
优选的,所述对每一训练获得的所述预测模型进行交叉验证包括:
S311,将所述子样本集随机划分为多个验证集;
S312,对该多个验证集中的每一验证集,将该验证集作为测试集并将其余验证集作为训练集以进行交叉验证,其中,所述训练集用于训练所述预测模型,所述测试集用于测试所述预测模型的准确率。
优选的,所述预设阈值为0.7。
根据本发明的一个方面,提供一种机票定价策略筛选的系统,包括:
采集模块,采集历史机票定价策略的历史定价数据,形成一样本集,每一所述历史定价数据具有一指示该历史机票定价策略是否被应用的类别标签;
样本获取模块,按照所述历史定价数据中的起飞城市将所述样本集划分为多个子样本集,每一所述子样本集对应一个所述起飞城市;
训练模块,根据每一所述子样本集训练一预测模型,其中,每一所述预测模型与一个所述起飞城市对应,所述预测模型以定价数据作为输入,输出一与所述机票定价策略相关联的预测值;
获取模块,获取当前的所述机票定价策略的定价数据;
预测模块,根据所述定价数据中的起飞城市,将所述定价数据输入对应的所述预测模型获得所述机票定价策略的预测值;
排序模块,根据所述机票定价策略的预测值对当前的所述机票定价策略进行排序并删除排序在后的多个所述机票定价策略;
判断模块,判断每一所述预测模型的准确率是否大于一预设阈值。
根据本发明的一个方面,提供一种机票定价策略筛选的设备,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述的机票定价策略筛选的方法的步骤。
根据本发明的一个方面,提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述机票定价策略筛选的方法的步骤。
上述技术方案的有益效果是:
本发明中的机票定价策略筛选的方法、系统、设备以及介质,能够针对每一个起飞城市建立一个预测模型,并且该预测模型为决策树模型,可以通过分布式服务器来训练每个模型即一个或多个预测模型在一个服务器中训练运行,实现对对当前的机票价格策略的预测,从而获得该机票定价策略的预测值,根据预测值进行排序之后只保留部分预测值相对较高的部分机票定价策略,从而减少了当前的机票定价策略的总量,进而减小了后续的筛选过程的开销,提高了机票定价策略筛选的效率。
本发明的其它特征和优点以及本发明的各种实施例的结构和操作,将在以下参照附图进行详细的描述。应当注意,本发明不限于本文描述的具体实施例。在本文给出的这些实施例仅仅是为了说明的目的。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1是一种机票定价策略筛选的方法的具体实施场景;
图2是一种机票定价策略筛选的方法的流程图;
图3是一种根据子样本集训练预测模型的流程示意图;
图4是一种交叉验证方法;
图5是一种机票定价策略筛选过程示意图;
图6是一种机票定价策略筛选的系统示意图;
图7是本发明的机票定价策略筛选的设备示意图;
图8是本发明的计算机可读存储介质的结构示意图。
从以下结合附图的详细描述中,本发明的特征和优点将变得更加明显。贯穿附图,相同的附图标识相应元素。在附图中,相同附图标记通常指示相同的、功能上相似的和/或结构上相似的元件。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
图1是一种机票定价策略筛选的方法的具体实施场景。图1示出的实施场景中,包括用户端101、服务端102、筛选端103,用户端101通过网络与服务端102相连,而服务端102通过网络与筛选端103相连,其中,筛选端103包括了多个服务器。该服务端102可以是但不限于任何一种可以与用户进行交互的人机交互电子产品,例如:智能手机、平板电脑以及台式电脑等。该服务端102的操作系统可以是任意操作系统,例如:Android操作系统、IOS操作系统。服务端102可以是但不限于一种能够按照实现设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)以及嵌入式设备等。服务端102还可以是台式计算机、网络主机、单个网络服务器、多个网络服务器集群或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机组成的虚拟超级计算机。网络可以包括但不限于互联网、广域网、城域网、VPN网络、无线自组织网络(Ad Hoc网络)等。筛选端103包括了多个服务器,多个服务器组成一个集群或者分布式的集群。
图2是一种机票定价策略筛选的方法的流程图。以下基于图1所示的场景,对机票定价策略筛选的方法进行详细的描述。
参考上图2,图2中示出的机票定价策略筛选的方法包括步骤S110、步骤S120、步骤S130、步骤S140、步骤S150、步骤S160以及步骤S170。步骤S110,采集历史机票定价策略的历史定价数据,形成一样本集,每一历史定价数据具有一指示该历史机票定价策略是否被应用的类别标;步骤S120,按照历史定价数据中的起飞城市将样本集划分为多个子样本集,每一子样本集对应一个起飞城市;步骤S130,根据每一子样本集训练一预测模型,其中,每一预测模型与一个起飞城市对应,预测模型以定价数据作为输入,输出一与机票定价策略相关联的预测值;步骤S140,获取当前的机票定价策略的定价数据;步骤S150,根据定价数据中的起飞城市,将定价数据输入对应的预测模型获得机票定价策略的预测值;步骤S160,根据机票定价策略的预测值对当前的机票定价策略进行排序并删除排序在后的多个机票定价策略;步骤S170,判断每一预测模型的准确率是否大于一预设阈值,若否,则回到步骤S110。
在步骤S110中,筛选端103提取数据库中的历史数据并进行采样,即采集历史机票定价策略的历史定价数据。机票定价策略可以是一个函数或一个接口也可以是一个数据集,其中包含了定价数据,在定价数据中包括:起飞城市、到达城市、起飞时间、乘客年龄、票面价格以及机票底价等信息。用户通过用户端101向服务端102发送一个机票查询请求,服务端102则在其缓存中存储的机票定价策略中匹配一个机票定价策略生成机票的价格并返回至用户端101。在步骤S110中,将采集到的历史定价数据进行数据清洗,形成一个样本集。该样本集中的历史定价数据均具有一个类别标签,该类别标签用于指示该历史机票定价策略是否被应用。例如,该类别标签为1时指示该历史机票定价策略被应用过即在当前时刻或某一历史时刻被存储于服务端102的缓存中,被用于生成机票的价格;该类别标签为0时,则指示该历史机票定价策略未被应用过,即未被布置于服务端102。
在步骤S120中,筛选端103按照历史定价数据中的起飞城市将样本集划分为多个子样本集,每一子样本集对应一个起飞城市。样本集中的历史定价数据的数量庞大,所以将该样本集按照起飞城市划分为多个子样本集,每一子样本集对应一个起飞城市。
在步骤S130中,筛选端103根据每一子样本集训练一预测模型,其中,每一预测模型与一个起飞城市对应,预测模型以定价数据作为输入,输出一与机票定价策略相关联的预测值。例如,一个起飞城市是上海的子样本集,根据该子样本集可以训练得到一个预测模型,该预测模型对应的起飞城市是上海。一个子样本集可以在筛选端103的一个服务器中进行训练,即筛选端103的一个服务器中可以进行多个子样本集的对应的预测模型的训练,这样提高了模型的训练速度,从而进一步提高了机票定价策略的筛选效率。
一些实施例中,图3是一种根据子样本集训练预测模型的流程示意图。参考图3,步骤S130还包括步骤S131、步骤S132以及步骤S133。在步骤S131中,将子样本集划分为训练集和测试集,其中,训练集中的样本数量与测试集中的样本数量的比值为5。将该子样本集随机提取20%作为测试集,而剩余的80%作为训练集用于训练预测模型。在步骤S132,根据历史定价数据提取训练集和测试集中的样本的特征。对训练集中的历史定价数据进行特征提取,该特征包括:到达城市、起飞时间、乘客年龄、票面价格以及机票底价,从样本的历史定价数据中提取数据获得上述特征对应的特征值。在步骤S133中,根据训练集和测试集中的样本的特征通过决策树算法获得与子样本集对应的预测模型。根据训练集中的样本采用决策树算法建立一预测模型,即该预测模型是一个决策树模型。决策树算法可以是但不限于ID3算法、C4.5算法、CART算法等,其中,ID3算法用的是信息增益,C4.5算法用信息增益率;CART算法使用基尼系数。通过训练集获得一个预测模型之后,再通过测试集对该预测模型进行测试,例如,可以进行剪枝等操作,以提高该预测模型的精度。
一些实施例中,在上述步骤S130还中还包括步骤S310。图4是一种交叉验证方法。参考图4,步骤S310中对每一训练获得的预测模型进行交叉验证。该步骤S310包括,S311,将子样本集随机划分为多个验证集;S312,对该多个验证集中的每一验证集,将该验证集作为测试集并将其余验证集作为训练集以进行交叉验证,其中,训练集用于训练预测模型,测试集用于测试预测模型的准确率。
在步骤S140,筛选端103获取当前的机票定价策略的定价数据。当前的机票定价策略存储于一个策略数据库中,是有待筛选后应用于服务端102的机票定价策略。该数据库中的机票定价策略会进行实施的更新。筛选端103在该策略数据库中提取当前的所有的机票定价策略的定价数据。
在步骤S150,根据定价数据中的起飞城市,将定价数据输入对应的预测模型获得机票定价策略的预测值。策略数据库中的每一个机票定价策略都会被按照起飞城市送入相应的预测模型中。机票定价策略的特征输入预测模型之后,可以一个获得该机票定价策略的预测值,该预测值可以是1或0,也可以是一个条件概率。
在步骤S160中,根据机票定价策略的预测值对当前的机票定价策略进行排序并删除排序在后的多个机票定价策略。通过步骤S150之后,可以获得策略数据库中的每一个机票定价策略的预测值(例如,概率值),根据该预测值可以对所有的机票定价策略进行降序排序,即排列在前的预测值较高,只保留排序在前的多个机票定价策略。保留下来的机票定价策略会被送入后续的筛选过程,再次经过筛选,之后获得机票定价策略会被发送至服务端102,并存储在该服务端102的缓存中。
在步骤S170,判断每一预测模型的准确率是否大于一预设阈值,若否,则回到步骤S110。准确率可以是根据单位时间内,预测模型预测之后最终被发送至服务端102的机票定价策略的数量与该预测模型所有输入的机票定价策略的数量的比值。该预设阈值为0.7、0.75或者0.73。
一些实施例中,步骤S170之后还包括步骤S210、步骤S220、步骤S230以及步骤S240。图5是一种机票定价策略筛选过程示意图。参考图5,步骤S210中,提取样本集中部分的样本作为一筛选样本集,筛选样本集中历史定价数据的类别标签的值为1指示该历史机票定价策略被应用,类别标签的值为0时指示该历史机票定价策略未被应用。步骤S220中,对筛选样本集中的历史定价数据进行特征提取。步骤S230中,将所提取的特征作为一筛选模型的输入,类别标签作为输出训练筛选模型。步骤S240中,将对当前的机票定价策略进行排序并删除之后获得的机票定价策略(即步骤S160中获得的机票定价策略)的特征输入筛选模型获得机票定价策略的类别标签的值,并将类别标签的值为1的机票定价策略导入服务端102的缓存中。
根据本发明的一个方面,提供一种机票定价策略筛选的系统。
图6是一种机票定价策略筛选的系统示意图。该系统500,包括:
采集模块501,采集历史机票定价策略的历史定价数据,形成一样本集,每一历史定价数据具有一指示该历史机票定价策略是否被应用的类别标签;
样本获取模块502,按照历史定价数据中的起飞城市将样本集划分为多个子样本集,每一子样本集对应一个起飞城市;
训练模块503,根据每一子样本集训练一预测模型,其中,每一预测模型与一个起飞城市对应,预测模型以定价数据作为输入,输出一与机票定价策略相关联的预测值;
获取模块504,获取当前的机票定价策略的定价数据;
预测模块505,根据定价数据中的起飞城市,将定价数据输入对应的预测模型获得机票定价策略的预测值;
排序模块506,根据机票定价策略的预测值对当前的机票定价策略进行排序并删除排序在后的多个机票定价策略;
判断模块507,判断每一预测模型的准确率是否大于一预设阈值。
根据本发明的一个方面,提供一种机票定价策略筛选的设备,包括:处理器;存储器,其中存储有处理器的可执行指令;其中,可执行指令在被执行时处理器执行机票定价策略筛选的方法的步骤。
图7是本发明的机票定价策略筛选的设备示意图。下面参照图7来描述根据本发明的这种实施方式的电子设备600。图7显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图2中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
根据本发明的一个方面,提供一种计算机可读存储介质,用于存储程序,程序被执行时实现上述方法的步骤。
图8是本发明的计算机可读存储介质的结构示意图。参考图8所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上,本发明的机票定价策略筛选的方法、系统、设备以及介质,能够针对每一个起飞城市建立一个预测模型,并且该预测模型为决策树模型,可以通过分布式服务器来训练每个模型即一个预测模型在一个服务器中训练运行,实现对对当前的机票价格策略的预测,从而获得该机票定价策略的预测值,根据预测值进行排序之后只保留部分预测值相对较高的部分机票定价策略,从而减少了当前的机票定价策略的总量,进而减小了后续的筛选过程的开销,提高了机票定价策略筛选的效率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (10)
1.一种机票定价策略筛选的方法,其特征在于,包括:
S110,采集历史机票定价策略的历史定价数据,形成一样本集,每一所述历史定价数据具有一指示该历史机票定价策略是否被应用的类别标签;
S120,按照所述历史定价数据中的起飞城市将所述样本集划分为多个子样本集,每一所述子样本集对应一个所述起飞城市;
S130,根据每一所述子样本集训练一预测模型,其中,每一所述预测模型与一个所述起飞城市对应,所述预测模型以定价数据作为输入,输出一与所述机票定价策略相关联的预测值;
S140,获取当前的所述机票定价策略的定价数据;
S150,根据所述定价数据中的起飞城市,将所述定价数据输入对应的所述预测模型获得所述机票定价策略的预测值;
S160,根据所述机票定价策略的预测值对当前的所述机票定价策略进行排序并删除排序在后的多个所述机票定价策略;
S170,判断每一所述预测模型的准确率是否大于一预设阈值,若否,则回到步骤S110。
2.根据权利要求1所述的机票定价策略筛选的方法,其特征在于,所述S130,根据每一所述子样本集训练一预测模型包括:
S131,将子样本集划分为训练集和测试集,其中,所述训练集中的样本数量与所述测试集中的样本数量的比值为5;
S132,根据所述历史定价数据提取所述训练集和所述测试集中的样本的特征;
S133,根据所述训练集和所述测试集中的样本的特征通过决策树算法获得与所述子样本集对应的所述预测模型。
3.根据权利要求1所述的机票定价策略筛选的方法,其特征在于,所述方法还包括:
S210,提取所述样本集中部分的样本作为一筛选样本集,所述筛选样本集中所述历史定价数据的类别标签的值为1指示该历史机票定价策略被应用,所述类别标签的值为0时指示该历史机票定价策略未被应用;
S220,对所述筛选样本集中的所述历史定价数据进行特征提取;
S230,将所提取的特征作为一筛选模型的输入,所述类别标签作为输出训练所述筛选模型;
S240,将对当前的所述机票定价策略进行排序并删除之后获得的所述机票定价策略的特征输入所述筛选模型获得所述机票定价策略的类别标签的值,并将所述类别标签的值为1的机票定价策略导入服务端的缓存中。
4.根据权利要求2所述的机票定价策略筛选的方法,其特征在于,所述定价数据的特征包括:到达城市、起飞时间、乘客年龄、票面价格以及机票底价。
5.根据权利要求2所述的机票定价策略筛选的方法,其特征在于,所述S130,根据每一所述子样本集训练一预测模型包括:
S310,对每一训练获得的所述预测模型进行交叉验证。
6.根据权利要求5所述的机票定价策略筛选的方法,其特征在于,所述对每一训练获得的所述预测模型进行交叉验证包括:
S311,将所述子样本集随机划分为多个验证集;
S312,对该多个验证集中的每一验证集,将该验证集作为测试集并将其余验证集作为训练集以进行交叉验证,其中,所述训练集用于训练所述预测模型,所述测试集用于测试所述预测模型的准确率。
7.根据权利要求1所述的机票定价策略筛选的方法,其特征在于,所述预设阈值为0.7。
8.一种机票定价策略筛选的系统,其特征在于,包括:
采集模块,采集历史机票定价策略的历史定价数据,形成一样本集,每一所述历史定价数据具有一指示该历史机票定价策略是否被应用的类别标签;
样本获取模块,按照所述历史定价数据中的起飞城市将所述样本集划分为多个子样本集,每一所述子样本集对应一个所述起飞城市;
训练模块,根据每一所述子样本集训练一预测模型,其中,每一所述预测模型与一个所述起飞城市对应,所述预测模型以定价数据作为输入,输出一与所述机票定价策略相关联的预测值;
获取模块,获取当前的所述机票定价策略的定价数据;
预测模块,根据所述定价数据中的起飞城市,将所述定价数据输入对应的所述预测模型获得所述机票定价策略的预测值;
排序模块,根据所述机票定价策略的预测值对当前的所述机票定价策略进行排序并删除排序在后的多个所述机票定价策略;
判断模块,判断每一所述预测模型的准确率是否大于一预设阈值。
9.一种机票定价策略筛选的设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-8中任意一项所述的机票定价策略筛选的方法的步骤。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1-8中任意一项所述机票定价策略筛选的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910225676.3A CN109978619B (zh) | 2019-03-25 | 2019-03-25 | 机票定价策略筛选的方法、系统、设备以及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910225676.3A CN109978619B (zh) | 2019-03-25 | 2019-03-25 | 机票定价策略筛选的方法、系统、设备以及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109978619A true CN109978619A (zh) | 2019-07-05 |
CN109978619B CN109978619B (zh) | 2021-07-06 |
Family
ID=67080332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910225676.3A Active CN109978619B (zh) | 2019-03-25 | 2019-03-25 | 机票定价策略筛选的方法、系统、设备以及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109978619B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110363433A (zh) * | 2019-07-17 | 2019-10-22 | 携程旅游网络技术(上海)有限公司 | 新开航线的评估方法、系统、电子设备和介质 |
CN112101566A (zh) * | 2020-09-11 | 2020-12-18 | 石化盈科信息技术有限责任公司 | 预测模型训练方法、价格预测方法、存储介质及电子设备 |
CN113377554A (zh) * | 2021-06-24 | 2021-09-10 | 携程旅游信息技术(上海)有限公司 | 机票价格的缓存方法、系统、设备及存储介质 |
CN113806379A (zh) * | 2020-06-15 | 2021-12-17 | 中国移动通信集团浙江有限公司 | 基于阀值乐观锁的批价方法、装置、设备及计算机介质 |
WO2024041399A1 (zh) * | 2022-08-23 | 2024-02-29 | 中国民航信息网络股份有限公司 | 一种数据处理方法、系统、电子设备及计算机存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120016718A1 (en) * | 2010-07-16 | 2012-01-19 | Qcue, Inc. | Dynamic pricing |
CN105469263A (zh) * | 2014-09-24 | 2016-04-06 | 阿里巴巴集团控股有限公司 | 一种商品推荐方法及装置 |
CN106030626A (zh) * | 2013-12-11 | 2016-10-12 | 天巡有限公司 | 用于提供诸如飞机票价可用性的票价可用性的方法和系统 |
CN106156809A (zh) * | 2015-04-24 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 用于更新分类模型的方法及装置 |
CN107194722A (zh) * | 2017-05-15 | 2017-09-22 | 马上游科技股份有限公司 | 一种共享经济下的基于数据挖掘的动态定价算法 |
CN107392644A (zh) * | 2017-06-19 | 2017-11-24 | 华南理工大学 | 一种商品购买预测建模方法 |
-
2019
- 2019-03-25 CN CN201910225676.3A patent/CN109978619B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120016718A1 (en) * | 2010-07-16 | 2012-01-19 | Qcue, Inc. | Dynamic pricing |
CN106030626A (zh) * | 2013-12-11 | 2016-10-12 | 天巡有限公司 | 用于提供诸如飞机票价可用性的票价可用性的方法和系统 |
CN105469263A (zh) * | 2014-09-24 | 2016-04-06 | 阿里巴巴集团控股有限公司 | 一种商品推荐方法及装置 |
CN106156809A (zh) * | 2015-04-24 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 用于更新分类模型的方法及装置 |
CN107194722A (zh) * | 2017-05-15 | 2017-09-22 | 马上游科技股份有限公司 | 一种共享经济下的基于数据挖掘的动态定价算法 |
CN107392644A (zh) * | 2017-06-19 | 2017-11-24 | 华南理工大学 | 一种商品购买预测建模方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110363433A (zh) * | 2019-07-17 | 2019-10-22 | 携程旅游网络技术(上海)有限公司 | 新开航线的评估方法、系统、电子设备和介质 |
CN113806379A (zh) * | 2020-06-15 | 2021-12-17 | 中国移动通信集团浙江有限公司 | 基于阀值乐观锁的批价方法、装置、设备及计算机介质 |
CN113806379B (zh) * | 2020-06-15 | 2024-04-09 | 中国移动通信集团浙江有限公司 | 基于阀值乐观锁的批价方法、装置、设备及计算机介质 |
CN112101566A (zh) * | 2020-09-11 | 2020-12-18 | 石化盈科信息技术有限责任公司 | 预测模型训练方法、价格预测方法、存储介质及电子设备 |
CN113377554A (zh) * | 2021-06-24 | 2021-09-10 | 携程旅游信息技术(上海)有限公司 | 机票价格的缓存方法、系统、设备及存储介质 |
CN113377554B (zh) * | 2021-06-24 | 2024-03-05 | 携程旅游信息技术(上海)有限公司 | 机票价格的缓存方法、系统、设备及存储介质 |
WO2024041399A1 (zh) * | 2022-08-23 | 2024-02-29 | 中国民航信息网络股份有限公司 | 一种数据处理方法、系统、电子设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109978619B (zh) | 2021-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109978619A (zh) | 机票定价策略筛选的方法、系统、设备以及介质 | |
CN106971321B (zh) | 营销信息推送方法、装置、设备以及存储介质 | |
WO2022141861A1 (zh) | 情感分类方法、装置、电子设备及存储介质 | |
CN104798043B (zh) | 一种数据处理方法和计算机系统 | |
CN107679189A (zh) | 一种兴趣点更新方法、装置、服务器和介质 | |
CN106663037A (zh) | 特征处理权衡管理 | |
CN110490625A (zh) | 用户偏好确定方法及装置、电子设备、存储介质 | |
CN108062377A (zh) | 标签图片集的建立、标签的确定方法、装置、设备及介质 | |
CN110348895A (zh) | 一种基于用户标签的个性化推荐方法、装置和电子设备 | |
US20160253681A1 (en) | Methods and systems for interpretable user behavior profiling in off-street parking | |
CN108805596A (zh) | 商品定价信息处理方法、装置、电子设备及存储介质 | |
CN107506499A (zh) | 兴趣点与建筑物之间建立逻辑关系的方法、装置及服务器 | |
KR20210082113A (ko) | 시계열 데이터의 이중 학습 장치의 동작 방법 | |
CN105843793A (zh) | 在自动模型产生期间检测和创建合适行概念的方法和系统 | |
CN112000763A (zh) | 兴趣点竞争关系确定方法、装置、设备和介质 | |
CN111027600A (zh) | 图像类别预测方法和装置 | |
CN113807062A (zh) | 一种组合密度图在线绘制方法、装置和电子设备 | |
CN109062947A (zh) | 用户画像标签查询方法、设备及计算机可读存储介质 | |
CN114418360A (zh) | 一种智慧城市运行体征大数据分析方法及装置 | |
CN114510526A (zh) | 一种线上数控展览方法 | |
CN114461853A (zh) | 视频场景分类模型的训练样本生成方法、装置及设备 | |
CN109669989A (zh) | 数据校验方法、系统、设备以及介质 | |
CN111582649B (zh) | 基于用户app独热编码的风险评估方法、装置和电子设备 | |
CN115686280A (zh) | 深度学习模型管理系统、方法、计算机设备及存储介质 | |
CN112820404A (zh) | 应用于大数据智慧医疗的信息处理方法及智慧医疗服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |