CN111080417A

CN111080417A - 用于提高预订顺畅率的处理方法、模型训练方法及系统

Info

Publication number: CN111080417A
Application number: CN201911374368.3A
Authority: CN
Inventors: 黎建辉; 邹亚鹏; 胡泓; 张秋会
Original assignee: Ctrip Computer Technology Shanghai Co Ltd
Current assignee: Ctrip Computer Technology Shanghai Co Ltd
Priority date: 2019-12-27
Filing date: 2019-12-27
Publication date: 2020-04-28

Abstract

本发明公开了一种用于预测房型变化的模型训练方法及系统、用于提高预订顺畅率的处理方法及系统、电子设备及存储介质，方法包括：获取历史订单；判断房态或房价在不同页面是否发生变化，若发生，则打标签为第一概率值，若不发生，则打标签为第二概率值；划分为训练集及测试集；将训练集输入至机器学习模型中进行训练；将测试集输入至机器学习模型中预测；判断预测结果是否符合指标，若是，获得房型变化预测模型。本发明根据历史订单构建房型变化预测模型，可以预测出发生满房或房价变高的概率高的样本，通过对预测结果的进一步处理可以实现即时更新房价的目的，进而减少用户预订流程中发生页面间跳转时的变价的次数，最终提升用户体验与品牌形象。

Description

用于提高预订顺畅率的处理方法、模型训练方法及系统

技术领域

本发明涉及计算机信息技术领域，特别涉及一种用于预测房型变化的模型训练方法、训练系统、用于提高预订顺畅率的处理方法、处理系统、电子设备及存储介质。

背景技术

用户在应用程序下单的过程中会经历一系列页面跳转的过程中，其中主要包括：酒店首页->列表页->详情页->填写页->提交页->订单详情页->支付成功。以上预订流程中每两个页面间的跳转都可能存在房态或房价的不一致的问题，一旦发生都极易影响用户体验，导致该问题一般的原因是酒店或者供应商会针对房型历史售卖或者库存情况调价或者修改房态，而用户整个下单流程因业务原因不能设计是并发安全的，所以存在用户下单过程中突然发生满房或者价格升高的情况，而导致用户预定不成功、用户体验差的缺陷。

发明内容

本发明要解决的技术问题是为了克服现有技术中用户在预定的过程，当不同页面在跳转时，可能突然发生满房或者价格升高的情况而导致用户预定不成功、用户体验差的缺陷，提供一种在用户下单前可以及时预测酒店的房态及房价的状态并对其进行及时的更新，而使用户在预定的过程中，在页面跳转的情况下，酒店的房态及房价不会发生变化的用于预测房型变化的模型训练方法、训练系统、用于提高预订顺畅率的处理方法、处理系统、电子设备及存储介质。

本发明是通过下述技术方案来解决上述技术问题：

本发明提供了一种用于预测房型变化的模型训练方法，包括以下步骤：

获取OTA(在线旅游代理)网站的历史订单，所述历史订单包括历史房型编号及所述历史房型编号对应的入住日期及离店日期；

判断用户历史订单在用户预定的过程中房型的房态或房价在不同页面是否发生变化，若发生，则将所述历史订单打标签为第一概率值，若不发生，则将所述历史订单打标签为第二概率值；

将打标签后的所述历史订单划分为训练集及测试集；

将训练集中的所述历史订单及对应打标签的第一概率值或第二概率值输入至深度机器学习模型中进行训练；

将测试集中的所述历史订单输入至训练后的深度机器学习模型中以得到与每一所述历史订单对应的房态或房价在不同页面发生变化的可能性预测值；

判断所述可能性预测值是否符合预测指标，若是，训练后的深度机器学习模型则为房型变化预测模型。

较佳地，获取OTA网站的历史订单的步骤后还包括：

从所述历史订单中提取动态特征数据，所述动态特征数据包括每一历史订单在第一页面的房态信息及房价信息以及每一历史订单在第二页面的房态信息及房价信息，所述第二页面为所述第一页面的下一跳转页面；

从所述历史订单中提取静态特征数据，所述静态特征数据包括酒店数据、供应商数据、房型数据及历史紧张度数据；

根据所述房型编号、入住日期及离店日期构建若干维度变量；

在不同的时间段计算不同的所述维度变量的动态特征数据及静态特征数据的统计变量数据，所述统计变量数据包括房态与房价变化率的方差、均值、分位数、最大值及最小值；

将训练集中的所述历史订单输入至深度机器学习模型中进行训练的步骤包括：将训练集中的所述统计变量数据输入至深度机器学习模型中进行训练；

将测试集中的所述历史订单输入至训练后的深度机器学习模型中的步骤包括：将测试集中的所述统计变量数据输入至训练后的深度机器学习模型中。

较佳地，所述维度变量包括：房型维度、房型维度与入住日期的组合维度、房型维度与入住日期及离店日期的组合维度、酒店维度、酒店维度与入住日期的组合维度、酒店维度与入住日期及离店日期的组合维度、供应商维度、供应商维度与入住日期的组合维度、供应商维度与入住日期及离店日期的组合维度。

较佳地，所述深度机器学习模型包括xgboost(一种深度机器学习模型)模型；

和/或，

所述预测指标为AUC(曲线下面积指标)指标或PR-SCORE(精确率召回率-指标)指标；

和/或，

每隔第一预设时间则更新所述房型变化预测模型。

本发明还提供了一种用于提高预订顺畅率的处理方法，所述处理方法包括：

获取OTA网站上酒店的房型编号及所述房型编号对应的入住日期及离店日期；

将所述房型编号及所述房型编号对应的入住日期及离店日期输入至利用如上任意一模型训练方法训练出的房型变化预测模型以获取每一房型的房态或房价在用户预定的过程中，在不同页面发生变化的可能性预测值；

判断所述可能性预测值是否大于变化阈值，若大于，则生成变化确认信息。

较佳地，获取OTA网站上酒店的房型编号及所述房型编号对应的入住日期及离店日期的步骤中，所述酒店为在历史预设天数范围内有订单的房型、有页面访问量的房型或者历史订单数高于热门酒店阈值的酒店，所述入住日期及所述离店日期与预测日期的天数差值均低于预设预测天数，所述离店日期与所述入住日期的天数差值低于预设入住天数；

和/或，

获取OTA网站上酒店的房型编号及所述房型编号对应的入住日期及离店日期的步骤后还包括：

根据所述房型编号及所述房型编号对应的入住日期及离店日期构建动态特征数据、静态特征数据、维度变量及统计变量数据，并将所述统计变量数据输入至房型变化预测模型以获取可能性预测值；

和/或，

通过spark(一种计算引擎)加载所述房型变化预测模型；

和/或，

生成变化确认信息的步骤后还包括：

将所述变化确认信息发送至后台处理模块，所述后台处理模块根据所述确认信息在OTA网站上更新所述房型的房态及房价信息；

和/或，

每隔第二预设时间则对所述可能性预测值进行再次预测。

本发明还提供了一种用于预测房型变化的模型训练系统，包括：历史订单获取模块、变化判断模块、划分模块、训练模块、测试模块及预测值判断模块；

所述历史订单获取模块用于获取OTA网站的历史订单，所述历史订单包括历史房型编号及所述历史房型编号对应的入住日期及离店日期；

所述变化判断模块用于判断所述历史订单在用户预定的过程中房型的房态或房价在不同页面是否发生变化，若发生，则将所述历史订单打标签为第一概率值，若不发生，则将所述历史订单打标签为第二概率值；

所述划分模块用于将打标签后的所述历史订单划分为训练集及测试集；

所述训练模块用于将训练集中的所述历史订单及对应打标签的第一概率值或第二概率值输入至深度机器学习模型中进行训练；

所述测试模块用于将测试集中的所述历史订单输入至训练后的深度机器学习模型中以得到与每一所述历史订单对应的房态或房价在不同页面发生变化的可能性预测值；

所述预测值判断模块用于判断所述可能性预测值是否符合预测指标，若是，训练后的深度机器学习模型则为房型变化预测模型。

较佳地，所述训练系统还包括：动态特征数据提取模块、静态特征数据提取模块、维度变量构建模块及统计数据计算模块；

所述动态特征数据提取模块用于从所述历史订单中提取动态特征数据，所述动态特征数据包括每一历史订单在第一页面的房态信息及房价信息以及每一历史订单在第二页面的房态信息及房价信息，所述第二页面为所述第一页面的下一跳转页面；

所述静态特征数据提取模块用于从所述历史订单中提取静态特征数据，所述静态特征数据包括酒店数据、供应商数据、房型数据及历史紧张度数据；

所述维度变量构建模块用于根据所述房型编号、入住日期及离店日期构建若干维度变量；

所述统计数据计算模块用于在不同的时间段计算不同的所述维度变量的动态特征数据及静态特征数据的统计变量数据，所述统计变量数据包括房态与房价变化率的方差、均值、分位数、最大值及最小值；

所述训练模块还用于将训练集中的所述统计变量数据输入至深度机器学习模型中进行训练；

所述测试模块还用于将测试集中的所述统计变量数据输入至训练后的深度机器学习模型中。

较佳地，所述深度机器学习模型包括xgboost模型；

和/或，

所述预测指标为AUC指标或PR-SCORE指标；

和/或，

每所述训练系统还包括更新模块，用于每隔第一预设时间则更新所述房型变化预测模型。

本发明还提供了一种用于提高预订顺畅率的处理系统，所述处理系统包括：房型获取模块、可能性预测模块及预测值判断模块；

所述房型获取模块用于获取OTA网站上酒店的房型编号及所述房型编号对应的入住日期及离店日期；

所述可能性预测模块用于将所述房型编号及所述房型编号对应的入住日期及离店日期输入至利用如上任意一模型训练系统训练出的房型变化预测模型以获取每一房型的房态或房价在用户预定的过程中，在不同页面发生变化的可能性预测值；

所述预测值判断模块用于判断所述可能性预测值是否大于变化阈值，若大于，则生成变化确认信息。

较佳地，所述房型获取模块用于获取OTA网站的下述酒店的房型编号及所述房型编号对应的入住日期及离店日期；

所述酒店为在历史预设天数范围内有订单的房型、有页面访问量的房型或者历史订单数高于热门酒店阈值的酒店，所述入住日期及所述离店日期与预测日期的天数差值均低于预设预测天数，所述离店日期与所述入住日期的天数差值低于预设入住天数；

和/或，

所述处理系统还包括预测特征提取模块，用于根据所述房型编号及所述房型编号对应的入住日期及离店日期构建动态特征数据、静态特征数据、维度变量及统计变量数据，并将所述统计变量数据输入至房型变化预测模型以获取可能性预测值；

和/或，

所述可能性预测模块用于通过spark加载所述房型变化预测模型；

和/或，

所述处理系统还包括发送模块，用于将所述变化确认信息发送至后台处理模块，所述后台处理模块根据所述确认信息在OTA网站上更新所述房型的房态及房价信息；

和/或，

所述处理系统还包括持续预测模块快，用于每隔第二预设时间则对所述可能性预测值进行再次预测。

本发明还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，

所述处理器执行所述计算机程序时实现如上任一项所述的用于预测房型变化的模型训练方法；

或，

所述处理器执行所述计算机程序时实现如上任一项所述的用于提高预订顺畅率的处理方法。

本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，

所述计算机程序被处理器执行时实现如上任一项所述的用于预测房型变化的模型训练方法的步骤；

或，

所述计算机程序被处理器执行时实现如上任一项所述的用于提高预订顺畅率的处理方法的步骤。

本发明的积极进步效果在于：本发明根据OTA网站上酒店的历史订单构建房型变化预测模型，通过该模型可以预测出发生满房或房价变高的概率高的样本，通过对预测结果的进一步处理可以实现即时更新房价的目的，进而减少用户预订流程中发生页面间跳转时的变价的次数，最终提升用户体验与OTA品牌形象。

附图说明

图1为本发明实施例1的用于预测房型变化的模型训练方法的流程图。

图2为本发明实施例1的用于预测房型变化的模型训练方法的部分流程图。

图3为本发明实施例2的用于提高预订顺畅率的处理方法的流程图。

图4为本发明实施例3的用于预测房型变化的模型训练系统的模块示意图。

图5为本发明实施例3的用于预测房型变化的模型训练系统的部分模块示意图。

图6为本发明实施例4的用于提高预订顺畅率的处理系统的模块示意图。

图7为根据本发明实施例5的电子设备的硬件结构示意图。

具体实施方式

下面通过实施例的方式进一步说明本发明，但并不因此将本发明限制在所述的实施例范围之中。

实施例1

本实施例提供了一种用于预测房型变化的模型训练方法，图1出示了该模型训练方法的流程图，包括：

步骤101、获取OTA网站的历史订单。

步骤102、判断所述用户历史订单在用户预定的过程中房型的房态或房价在不同页面是否发生变化，若不发生，则执行步骤103，若发生，则执行步骤104。

步骤103、将所述历史订单打标签为第二概率值。

步骤104、将所述历史订单打标签为第一概率值。

步骤105、将打标签后的所述历史订单划分为训练集及测试集。

步骤106、将训练集中的所述历史订单及对应打标签的第一概率值或第二概率值输入至深度机器学习模型中进行训练。

步骤107、将测试集中的所述历史订单输入至训练后的深度机器学习模型中以得到与每一所述历史订单对应的房态或房价在不同页面发生变化的可能性预测值。

步骤108、判断所述可能性预测值是否符合预测指标，若是，则执行步骤109，若未达到，则返回步骤106。

步骤109、确认训练后的深度机器学习模型则为房型变化预测模型。

其中，所述历史订单包括历史房型编号及所述历史房型编号对应的入住日期及离店日期。

其中，历史订单所包含的数据由埋点产生，针对每个跳转流程埋点纪录是否发生变价变房态的情况，每个埋点数据纪录了房型、酒店、下单日期、入离日期等完整数据，通过kafka(一分布式的流平台)以流的形式对外输出，通过DataX(一种离线数据同步工具)将数据同步到Hive(一种数据仓库工具)中的同时完成清洗。

本实施例中，为了提高房型变化预测模型的泛化能力及鲁棒性，深度机器学习模型可以选择xgboost模型,xgboost模型是一个多模型融合的提升树模型，每颗树之间通过串行的关系学习残差，最后预测的是加权测试样本在每棵树上获得的得分，而每棵单独的树是很简单的模型，具有方差小的特点，多颗树构成的森林又是个复杂的模型，具有偏差小的特点，因此，本实施例中基于xgboost模型训练后的房型变化预测模型具有偏差与方差都小的特点。

本实施例中，xgboost模型利用训练数据训练完成之后再利用测试数据对模型进行测试，因为该问题是分类问题所以评价指标选择了AUC或者PR-SCORE作为预测指标，这两个评价指标对应的值越大说明模型的效果越好。其中，又因为整个数据关联到时间序列维度，所以为了更能反映模型效果测试集的时间点必须大于训练集。

为了构建一个计算准确，能充分利用有效信息来得到准确预测结果的预测模型，如图2所示，在步骤101后还包括：

步骤201、从所述历史订单中提取动态特征数据。

步骤202、从所述历史订单中提取静态特征数据。

步骤203、根据所述房型编号、入住日期及离店日期构建若干维度变量。

步骤204、在不同的时间段计算不同的所述维度变量的动态特征数据及静态特征数据的统计变量数据。

其中，所述动态特征数据包括每一历史订单在第一页面的房态信息及房价信息以及每一历史订单在第二页面的房态信息及房价信息，所述第二页面为所述第一页面的下一跳转页面。

其中，所述静态特征数据包括酒店数据、供应商数据、房型数据及历史紧张度数据。其中，酒店数据既包括OTA网站直接对接的酒店数据，又包括通过供应商供应的间接对接的酒店数据，历史紧张度数据为预定占比的映射数据，如，A供应商下的a酒店共存在100个房间，在2019年1月1日，预定了30个，则预定占比为30％，该预定占比数据越高说明该酒店的房间越紧张。

其中，步骤204中的，维度变量包括：房型维度、房型维度与入住日期的组合维度、房型维度与入住日期及离店日期的组合维度、酒店维度、酒店维度与入住日期的组合维度、酒店维度与入住日期及离店日期的组合维度、供应商维度、供应商维度与入住日期的组合维度、供应商维度与入住日期及离店日期的组合维度的九个维度变量。不同的时间段包括历史上某一天的数据，又包括历史上若干天的聚合数据，如包括聚合过去3天、7天、30天、90天来提取统计变量数据。

由于历史订单在不断更新，因此，为了加强模型训练的准确程度，本实施例中，每隔某一预设时间则再次对深度机器学习模型进行训练以更新所述房型变化预测模型。

为了更好理解本实施例，下面举一个具体实例来对本实施例进行进一步说明：

在APP上或在OTA网站上进行埋点，从而获取若干历史订单数据，利用spark从若干历史数据中提取若干特征数据，其中，特征数据分为两类，第一类是与变价直接相关的统计变量数据，其中主要包括详情页到填写页房态与房价数据；第二类是酒店、供应商、房型等静态数据以及历史紧张度数据。其中根据预测的主键(即，房型编号及房型编号对应的入住日期及离店日期)向上聚合以及拆分共计构建9个维度变量，如房型维度、房型维度与入住日期的组合维度等等，而后，计算在不同时间段不同的所述维度变量的动态特征数据及静态特征数据的统计变量数据，如，某一维度变量为酒店维度与入住日期的组合维度，计算的为历史当天的时间数据，在具体场景下为2019年1月1日与A酒店，统计的数据则为用户预定2019年1月1日在A酒店入住的房间时，房态与房价在某一页面与下一页面变化率的方差、均值、分位数、最大值及最小值等等统计学数据，再如，某一维度变量为供应商维度与入住日期及离店日期的组合维度，计算的为过去30天的聚合的时间段的数据，在具体场景下为供应商M下的m酒店在预订的入住日期及离店日期都满足在过去30天的时间范围，统计的为在该时间范围内，用户在预定M下的m酒店的房间时，房态与房价在某一页面与下一页面变化率的方差、均值、分位数、最大值及最小值等等统计学数据。本场景下，在统计历史当天的统计数据时，每隔4个小时轮询一次维度变量，因此，可以有效利用4小时前的数据完成特征构建可以有效提升模型效果，而统计历史若干天的聚合数据时，每天只需要计算一次以提升模型训练的效率。而后，将训练集中的统计变量数据输入至深度机器学习模型中进行训练，再将测试集中的统计变量数据输入至训练后的深度机器学习模型中以获得可能性预测值，当该预测值符合预测指标时，则得到房型变化预测模型。

本实施例根据OTA网站上酒店的历史订单构建房型变化预测模型，通过该模型可以预测出发生满房或房价变高的概率高的样本，通过对预测结果的进一步处理可以实现即时更新房价的目的，进而减少用户预订流程中发生页面间跳转时的变价的次数，最终提升用户体验与OTA品牌形象。

实施例2

本实施例提供了一种用于提高预订顺畅率的处理方法，图3出示了该处理方法的流程图，包括：

步骤301、获取OTA网站上酒店的房型编号及所述房型编号对应的入住日期及离店日期。

步骤302、将所述房型编号及所述房型编号对应的入住日期及离店日期输入至房型变化预测模型以获取每一房型的房态或房价在用户预定的过程中，在不同页面发生变化的可能性预测值。

步骤303、判断所述可能性预测值是否大于变化阈值，若大于，则执行步骤304，若不大于，则执行步骤305。

步骤304、生成变化确认信息。

步骤305、确认所述房型的房态或房价不会发生变化。

其中，房型变化预测模型通过实施例1中的模型训练方法训练得到，为了提升对该模型的加载速度，本实施例中，通过spark加载所述房型变化预测模型。

其中，变化阈值根据房型变化预测模型的准曲率和和召回率设定。

其中，为了提高本实施例中的处理方法的效率，步骤301中的酒店为在历史预设天数范围内有订单的房型、有页面访问量的房型或者历史订单数高于热门酒店阈值的酒店，步骤301中的入住日期及离店日期与预测日期的天数差值均低于预设预测天数，所述离店日期与所述入住日期的天数差值低于预设入住天数。

其中，为了提取有效信息以对房态或房价进行有效预测，步骤301后还包括根据所述房型编号及所述房型编号对应的入住日期及离店日期构建动态特征数据、静态特征数据、维度变量及统计变量数据，步骤302中通过将上述统计变量数据输入至房型变化预测模型以获取可能性预测值。

其中，为了及时更新房态或房价信息，以免用户在预定过程中，在不同页面下的房态或房价不一致而降低用户体验，本实施例中，在步骤304后还包括步骤：将所述变化确认信息发送至后台处理模块，所述后台处理模块根据所述确认信息在OTA网站上更新所述房型的房态及房价信息。

应当理解，如果该酒店为供应商提供的酒店，则需要将更新后的房态和房价信息聚合到供应商提供的酒店以实现该酒店的房间的信息更新。

将酒店及对应的未来入住日期及未来离店日期输入至房型变化预测模型中以得到未来的某一时间范围内每一天的房间的房态或房价会发生变活的可能性，该酒店为在过去180天有住房订单的酒店、或在过去180天有住房页面访问量的酒店、或在历史订单数高于自定义热门酒店阈值的酒店(如酒店住房订单量位于A城市排名前100名的酒店)，未来入住日期位于未来60范围内，入住时长则为最多5天的入住时长，将房型(既包括供应商提供的，又包括OTA直接提供的)与入店日期及离店日期关联得到所有组合的维度变量，利用Zeus(一种开源扫描器)构建特征数据，以得到小时级别的实时特征数据，该特征数据每天凌晨计算一次并通过hive存储，实时特征数据在每次房型变化预测模型更新时都需要计算一次。而后，利用计算的特征数据在spark上预测，每隔4小时预测一次，将预测的结果通过设定的变化阀值进行过滤，当预测的结果超过变化阈值时，则生成变化确认信息聚合到酒店(既包括OTA直接提供的，又包括供应商提供的)，并将聚合到酒店的信息通过QMQ(一种消息中间件)的方式传给后台，后台根据接收的信息来控制实现实时房价再下载。

本实施例中，通过对不同页面发生可能性的预测以及根据预测结果对房态及房价信息的及时更新，大大增加了客户预定时在不同页面的房价及房态的一致性，从而大大增强了用户体验，提高了酒店预定的顺畅度。

实施例3

本实施例提供了一种用于预测房型变化的模型训练系统，图4出示了该模型训练系统的模块示意图，包括：历史订单获取模块401、变化判断模块402、划分模块403、训练模块404、测试模块405及预测值判断模块406。

历史订单获取模块401用于获取OTA网站的历史订单，所述历史订单包括历史房型编号及所述历史房型编号对应的入住日期及离店日期。

变化判断模块402用于判断所述用户历史订单在用户预定的过程中房型的房态或房价在不同页面是否发生变化，若发生，则将所述历史订单打标签为第一概率值，若不发生，则将所述历史订单打标签为第二概率值。

划分模块403用于将打标签后的所述历史订单划分为训练集及测试集；

训练模块404用于将训练集中的所述历史订单及对应打标签的第一概率值或第二概率值输入至深度机器学习模型中进行训练。

测试模块405用于将测试集中的所述历史订单输入至训练后的深度机器学习模型中以得到与每一所述历史订单对应的房态或房价在不同页面发生变化的可能性预测值。

预测值判断模块406用于判断所述可能性预测值是否符合预测指标，若是，训练后的深度机器学习模型则为房型变化预测模型。

其中，历史订单所包含的数据由埋点产生，针对每个跳转流程埋点纪录是否发生变价变房态的情况，每个埋点数据纪录了房型、酒店、下单日期、入离日期等完整数据，通过kafka(一分布式的流平台)以流的形式对外输出，通过DataX将数据同步到Hive中的同时完成清洗。

本实施例中，通过训练模块404利用xgboost模型训练数据之后测试模块405再利用测试数据对模型进行测试，因为该问题是分类问题所以预测值判断模块406选择了AUC或者PR-SCORE作为预测指标，这两个评价指标对应的值越大说明模型的效果越好。其中，又因为整个数据关联到时间序列维度，所以为了更能反映模型效果测试集的时间点必须大于训练集。

为了构建一个计算准确，能充分利用有效信息来得到准确预测结果的预测模型，如图5所示，本实施例中模型训练系统还包括：动态特征数据提取模块501、静态特征数据提取模块502、维度变量构建模块503及统计数据计算模块504。

动态特征数据提取模块501用于从所述历史订单中提取动态特征数据，所述动态特征数据包括每一历史订单在第一页面的房态信息及房价信息以及每一历史订单在第二页面的房态信息及房价信息，所述第二页面为所述第一页面的下一跳转页面。

静态特征数据提取模块502用于从所述历史订单中提取静态特征数据，所述静态特征数据包括酒店数据、供应商数据、房型数据及历史紧张度数据；

维度变量构建模块503用于根据所述房型编号、入住日期及离店日期构建若干维度变量。

统计数据计算模块504用于在不同的时间段计算不同的所述维度变量的动态特征数据及静态特征数据的统计变量数据，所述统计变量数据包括房态与房价变化率的方差、均值、分位数、最大值及最小值。

其中，酒店数据既包括OTA网站直接对接的酒店数据，又包括通过供应商供应的间接对接的酒店数据，历史紧张度数据为预定占比的映射数据，如，A供应商下的a酒店共存在100个房间，在2019年1月1日，预定了30个，则预定占比为30％，该预定占比数据越高说明该酒店的房间越紧张。

其中，维度变量包括：房型维度、房型维度与入住日期的组合维度、房型维度与入住日期及离店日期的组合维度、酒店维度、酒店维度与入住日期的组合维度、酒店维度与入住日期及离店日期的组合维度、供应商维度、供应商维度与入住日期的组合维度、供应商维度与入住日期及离店日期的组合维度的九个维度变量。不同的时间段包括历史上某一天的数据，又包括历史上若干天的聚合数据，如包括聚合过去3天、7天、30天、90天来提取统计变量数据。

历史订单获取模块401在APP上或在OTA网站上进行埋点，从而获取若干历史订单数据，动态特征数据提取模块501及静态特征数据提取模块502利用spark(一种计算引擎)从若干历史数据中提取若干特征数据，其中，特征数据分为两类，第一类是与变价直接相关的统计变量数据，其中主要包括详情页到填写页房态与房价数据；第二类是酒店、供应商、房型等静态数据以及历史紧张度数据。其中维度变量构建模块503根据预测的主键(即，房型编号及房型编号对应的入住日期及离店日期)向上聚合以及拆分共计构建9个维度变量，如房型维度、房型维度与入住日期的组合维度等等，而后，统计数据计算模块504计算在不同时间段不同的所述维度变量的动态特征数据及静态特征数据的统计变量数据，如，某一维度变量为酒店维度与入住日期的组合维度，计算的为历史当天的时间数据，在具体场景下为2019年1月1日与A酒店，统计的数据则为用户预定2019年1月1日在A酒店入住的房间时，房态与房价在某一页面与下一页面变化率的方差、均值、分位数、最大值及最小值等等统计学数据，再如，某一维度变量为供应商维度与入住日期及离店日期的组合维度，计算的为过去30天的聚合的时间段的数据，在具体场景下为供应商M下的m酒店在预订的入住日期及离店日期都满足在过去30天的时间范围，统计的为在该时间范围内，用户在预定M下的m酒店的房间时，房态与房价在某一页面与下一页面变化率的方差、均值、分位数、最大值及最小值等等统计学数据。本场景下，在统计历史当天的统计数据时，每隔4个小时轮询一次维度变量，因此，可以有效利用4小时前的数据完成特征构建可以有效提升模型效果，而统计历史若干天的聚合数据时，每天只需要计算一次以提升模型训练的效率。而后，训练模块404将训练集中的统计变量数据输入至深度机器学习模型中进行训练，测试模块405再将测试集中的统计变量数据输入至训练后的深度机器学习模型中以获得可能性预测值，预测值判断模块406判断当该预测值符合预测指标时，得到房型变化预测模型。

实施例4

本实施例提供了一种用于提高预订顺畅率的处理系统，图6出示了该处理方法的模块示意图，包括：房型获取模块601、可能性预测模块602及预测值判断模块603。

房型获取模块601用于获取OTA网站上酒店的房型编号及所述房型编号对应的入住日期及离店日期。

可能性预测模块602用于将所述房型编号及所述房型编号对应的入住日期及离店日期输入至通过实施例3的模型训练系统训练出的房型变化预测模型以获取每一房型的房态或房价在用户预定的过程中，在不同页面发生变化的可能性预测值。

预测值判断模块603用于判断所述可能性预测值是否大于变化阈值，若大于，则生成变化确认信息。

本实施例中，通过spark加载所述房型变化预测模型。

其中，为了提高本实施例中的处理方法的效率，房型获取模块601获取的酒店为在历史预设天数范围内有订单的房型、有页面访问量的房型或者历史订单数高于热门酒店阈值的酒店，房型获取模块601获取的入住日期及离店日期与预测日期的天数差值均低于预设预测天数，所述离店日期与所述入住日期的天数差值低于预设入住天数。

其中，为了提取有效信息以对房态或房价进行有效预测，所述处理系统还包括预测特征提取模块，用于根据所述房型编号及所述房型编号对应的入住日期及离店日期构建动态特征数据、静态特征数据、维度变量及统计变量数据，预测值判断模块603通过将上述统计变量数据输入至房型变化预测模型以获取可能性预测值。

其中，为了及时更新房态或房价信息，以免用户在预定过程中，在不同页面下的房态或房价不一致而降低用户体验，所述处理系统还包括发送模块，用于将所述变化确认信息发送至后台处理模块，所述后台处理模块根据所述确认信息在OTA网站上更新所述房型的房态及房价信息。

房型获取模块601获取酒店编号及对应的未来入住日期及未来离店日期后，可能性预测模块602将上述信息输入至房型变化预测模型中以得到未来的某一时间范围内每一天的房间的房态或房价会发生变活的可能性，该酒店为在过去180天有住房订单的酒店、或在过去180天有住房页面访问量的酒店、或在历史订单数高于自定义热门酒店阈值的酒店(如酒店住房订单量位于A城市排名前100名的酒店)，未来入住日期位于未来60范围内，入住时长则为最多5天的入住时长，将房型(既包括供应商提供的，又包括OTA直接提供的)与入店日期及离店日期关联得到所有组合的维度变量，利用Zeus(一种开源扫描器)构建特征数据，以得到小时级别的实时特征数据，该特征数据每天凌晨计算一次并通过hive存储，实时特征数据在每次房型变化预测模型更新时都需要计算一次。而后，利用计算的特征数据在spark上预测，每隔4小时预测一次，预测值判断模块603将预测的结果通过设定的变化阀值进行过滤，当预测的结果超过变化阈值时，则生成变化确认信息聚合到酒店(既包括OTA直接提供的，又包括供应商提供的)，并将聚合到酒店的信息通过QMQ的方式传给后台，后台根据接收的信息来控制实现实时房价再下载。

实施例5

本实施例提供一种电子设备，电子设备可以通过计算设备的形式表现(例如可以为服务器设备)，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中处理器执行计算机程序时可以实现实施例1中的用于预测房型变化的模型训练方法或实施例2中的用于提高预订顺畅率的处理方法。

图7示出了本实施例的硬件结构示意图，如图7所示，电子设备9具体包括：

至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93，其中：

总线93包括数据总线、地址总线和控制总线。

存储器92包括易失性存储器，例如随机存取存储器(RAM)921和/或高速缓存存储器922，还可以进一步包括只读存储器(ROM)923。

存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925，这样的程序模块924包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

处理器91通过运行存储在存储器92中的计算机程序，从而执行各种功能应用以及数据处理，例如本发明实施例1中的用于预测房型变化的模型训练方法或实施例2中的用于提高预订顺畅率的处理方法。

电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且，电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备9使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。

应当注意，尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之，上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

实施例6

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现实施例1中的用于预测房型变化的模型训练方法的步骤或实施例2中的用于提高预订顺畅率的处理方法的步骤。

其中，可读存储介质可以采用的更具体可以包括但不限于：便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。

在可能的实施方式中，本发明还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行实现实施例1中的用于预测房型变化的模型训练方法的步骤或实施例2中的用于提高预订顺畅率的处理方法的步骤。

其中，可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码，所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。

虽然以上描述了本发明的具体实施方式，但是本领域的技术人员应当理解，这仅是举例说明，本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下，可以对这些实施方式做出多种变更或修改，但这些变更和修改均落入本发明的保护范围。

Claims

1.一种用于预测房型变化的模型训练方法，其特征在于，包括以下步骤：

获取OTA网站的历史订单，所述历史订单包括历史房型编号及所述历史房型编号对应的入住日期及离店日期；

判断所述历史订单在用户预定的过程中房型的房态或房价在不同页面是否发生变化，若发生，则将所述历史订单打标签为第一概率值，若不发生，则将所述历史订单打标签为第二概率值；

将打标签后的所述历史订单划分为训练集及测试集；

2.如权利要求1所述的训练方法，其特征在于，获取OTA网站的历史订单的步骤后还包括：

3.如权利要求2所述的训练方法，其特征在于，所述维度变量包括：房型维度、房型维度与入住日期的组合维度、房型维度与入住日期及离店日期的组合维度、酒店维度、酒店维度与入住日期的组合维度、酒店维度与入住日期及离店日期的组合维度、供应商维度、供应商维度与入住日期的组合维度、供应商维度与入住日期及离店日期的组合维度。

4.如权利要求1所述的训练方法，其特征在于，所述深度机器学习模型包括xgboost模型；

和/或，

所述预测指标为AUC指标或PR-SCORE指标；

和/或，

每隔第一预设时间则更新所述房型变化预测模型。

5.一种用于提高预订顺畅率的处理方法，其特征在于，所述处理方法包括：

将所述房型编号及所述房型编号对应的入住日期及离店日期输入至利用权利要求1-4中任意一模型训练方法训练出的房型变化预测模型以获取每一房型的房态或房价在用户预定的过程中，在不同页面发生变化的可能性预测值；

6.如权利要求5所述的处理方法，其特征在于，获取OTA网站上酒店的房型编号及所述房型编号对应的入住日期及离店日期的步骤中，所述酒店为在历史预设天数范围内有订单的房型、有页面访问量的房型或者历史订单数高于热门酒店阈值的酒店，所述入住日期及所述离店日期与预测日期的天数差值均低于预设预测天数，所述离店日期与所述入住日期的天数差值低于预设入住天数；

和/或，

通过spark加载所述房型变化预测模型；

和/或，

生成变化确认信息的步骤后还包括：

和/或，

每隔第二预设时间则对所述可能性预测值进行再次预测。

7.一种用于预测房型变化的模型训练系统，其特征在于，包括：历史订单获取模块、变化判断模块、划分模块、训练模块、测试模块及预测值判断模块；

8.如权利要求7所述的训练系统，其特征在于，所述训练系统还包括：动态特征数据提取模块、静态特征数据提取模块、维度变量构建模块及统计数据计算模块；

9.如权利要求8所述的训练系统，其特征在于，所述维度变量包括：房型维度、房型维度与入住日期的组合维度、房型维度与入住日期及离店日期的组合维度、酒店维度、酒店维度与入住日期的组合维度、酒店维度与入住日期及离店日期的组合维度、供应商维度、供应商维度与入住日期的组合维度、供应商维度与入住日期及离店日期的组合维度。

10.如权利要求7所述的训练系统，其特征在于，所述深度机器学习模型包括xgboost模型；

和/或，

所述预测指标为AUC指标或PR-SCORE指标；

和/或，

11.一种用于提高预订顺畅率的处理系统，其特征在于，所述处理系统包括：房型获取模块、可能性预测模块及预测值判断模块；

所述可能性预测模块用于将所述房型编号及所述房型编号对应的入住日期及离店日期输入至利用权利要求7-10中任意一模型训练系统训练出的房型变化预测模型以获取每一房型的房态或房价在用户预定的过程中，在不同页面发生变化的可能性预测值；

12.如权利要求11所述的处理系统，其特征在于，所述房型获取模块用于获取OTA网站的下述酒店的房型编号及所述房型编号对应的入住日期及离店日期；

和/或，

13.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，

所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的用于预测房型变化的模型训练方法；

或，

所述处理器执行所述计算机程序时实现权利要求5或权利要求6所述的用于提高预订顺畅率的处理方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，

所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的用于预测房型变化的模型训练方法的步骤；

或，

所述计算机程序被处理器执行时实现权利要求5或权利要求6所述的用于提高预订顺畅率的处理方法的步骤。