CN109166012B

CN109166012B - 针对行程预定类用户的分类及信息推送的方法和装置

Info

Publication number: CN109166012B
Application number: CN201811110182.2A
Authority: CN
Inventors: 汤友花; 王安琪; 周国静; 郭毓
Original assignee: Suzhou Chuanglv Tianxia Information Technology Co ltd
Current assignee: Suzhou Chuanglv Tianxia Information Technology Co ltd
Priority date: 2018-09-21
Filing date: 2018-09-21
Publication date: 2021-05-28
Anticipated expiration: 2038-09-21
Also published as: CN109166012A

Abstract

本发明公开了一种针对行程预定类用户的分类及信息推送的方法和装置，涉及计算机机器学习技术领域，旨在解决现有的行程预订平台信息资源利用率低且用户体验差的问题。其技术方案要点是，通过用户的历史行程数据信息获得精准推荐数据集，精准推荐数据集包括训练集和测试集；通过分类决策算法以及训练集，训练得到精准推荐模型；根据测试集以及精准推荐模型，计算获得允许为用户推送信息的推送阈值；根据推送阈值，筛选出允许推送信息的用户并向这一部分用户推送对应的信息。本发明达到了能够有效提高信息资源利用率和用户体验的效果。

Description

针对行程预定类用户的分类及信息推送的方法和装置

技术领域

本发明涉及计算机机器学习技术领域，尤其是涉及一种针对行程预定类用户的分类及信息推送的方法和装置。

背景技术

传统旅游业在转向互联网发展的过程中，如何使信息资源得到有效利用是目前的研究课题之一。通过互联网推送信息时，无用的信息推送不仅会降低用户体验，也会导致信息的滥用以及信息资源的浪费。

基于这样的需求，一些行程预订平台(例如携程、途牛、蚂蜂窝、去哪儿等)以及互联网企业不断推出了各类方案以解决上述问题，例如：

D1：腾讯科技(深圳)有限公司在2013年10月22日申请的专利号为“201310501027”的中国专利，其公开了一种用户兴趣标签分类的方法及装置，包括：获取活跃用户的训练数据，训练数据包括活跃用户的第一站点数据以及活跃用户在第二站点中选择的用户兴趣标签；对第二站点兴趣标签进行二元标签转换，得到二分类器；根据用户兴趣标签以及二分类器，建立第一站点数据与第二站点兴趣标签之间的关联关系；通过二元分解算法以及该关联关系训练得到用户兴趣标签分类模型；根据新用户的第一站点数据以及用户兴趣标签分类模型，计算获得新用户在第二站点中的用户兴趣标签。达到了能够使开放平台的用户信息被第三方充分且准确利用的效果。

D2：中国联合网络通信集团有限公司在2017年7月6日申请的专利号为“201710546055”的中国专利，其公开了一种旅游用户筛选的方法和旅游用户筛选的系统，包括：获取数据，从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据；对数据进行分析处理，根据构造函数，对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析，确定用户为旅游爱好者。达到了能够有效解决旅游用户定位问题以及有效发掘新旅游用户的效果。

由上述文献可知，目前基于用户偏好来分类用户或者对用户加以特殊标签来对用户进行分类都已具备较为完善的解决方案，但是互联网平台的最终目的是在于促成消费，或者令信息资源得到充分利用以提高信息资源消耗所带来的效益。为此，本申请提出了一种新的方案。

发明内容

本发明的目的是提供一种针对行程预定类用户的分类及信息推送的方法和装置，其具有能够有效提高信息资源利用率和用户体验的效果。

本发明的上述发明目的一是通过以下技术方案得以实现的：

一种针对行程预定类用户的分类及信息推送的方法，包括：

通过用户的历史行程数据信息获得精准推荐数据集，所述精准推荐数据集包括训练集和测试集；

通过分类决策算法以及训练集，训练得到精准推荐模型；

根据所述测试集以及精准推荐模型，计算获得允许为用户推送信息的推送阈值；

根据所述推送阈值，筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息。

通过采用上述技术方案，可将用户进行定向分类，仅对允许推送信息的用户进行信息的推送，避免对推送信息的用户造成干扰，提高了用户体验，且使得信息资源利用率显著提高。

本发明进一步设置为：通过用户的历史行程数据信息获得精准推荐数据集具体包括：

确定时间窗口参数H，从所述时间窗口参数H内的用户的历史行程数据信息中提取一类特征信息形成精准推荐数据集；若用户的一类特征信息中包含二类特征信息，则标记为正例；若用户的一类特征信息中不包含二类特征信息，则标记为负例。

通过采用上述技术方案，在特定时间窗口参数H内提取用户的一类特征形成精准推荐数据集，便于捕捉用户最新的动态以及历史信息利用率情况，有效增加了数据样本的可靠性。通过正例和反例的标记，便于将对反例用户的信息推送取消，从而提高用户体验，提高信息资源利用率。

本发明进一步设置为：所述训练集和测试集均通过随机分配精准推荐数据集中的样本所得。

通过采用上述技术方案，随机分配样本所得到的训练集和测试集，更具说服力，使得模型训练和得出的各项数据更准确。

本发明进一步设置为：通过分类决策算法以及训练集，训练得到精准推荐模型具体包括：

通过分类决策算法以及训练集，训练得到精准推荐模型；根据所述精准推荐数据集以及精准推荐模型，计算获得所述精准推荐数据集中每一样本的推荐值，所述推荐值大于N且小于N+1；其中，所述推荐值越接近N+1，则表示对应的用户对推送信息的利用率越高。

通过采用上述技术方案，根据推荐值的大小可以方便地判断用户对历史推送信息的利用率，根据用户对历史推送信息的利用率高低，即可方便的筛选允许推送信息的用户，从而提高数据的处理效率。

本发明进一步设置为：根据所述测试集以及精准推荐模型，计算获得允许为用户推送信息的推送阈值具体包括：

将所述测试集的样本按照推荐值的大小降序排列，通过从第一个样本开始不断累加推荐值获得推荐总值；当所述推荐总值达到测试集所有样本的推荐值总和的设定占比值时，将最后累加的样本所对应的推荐值作为允许为用户推送信息的推送阈值。

通过采用上述技术方案，从正例中进一步筛选出了允许推送信息的用户，向这些用户推送信息，进一步地提高了信息资源的利用率，且使得用户体验更佳。

本发明进一步设置为：根据所述推送阈值，筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息具体包括：

将所述精准推荐数据集中推荐值大于推送阈值的样本所对应的用户作为允许推送信息的用户并向允许推送信息的用户推送对应的信息。

本发明进一步设置为：所述行程数据信息包括退票概率信息，所述方法还包括：

筛选所述测试集中推荐值大于推送阈值的样本作为退票概率预测数据集；

通过分类决策算法以及退票概率预测数据集，训练得到退票倾向预测模型；

根据所述退票概率预测数据集以及退票倾向预测模型，计算获得所述退票概率预测数据集中每一样本的退票倾向值；

根据所述退票倾向值，筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。

通过采用上述技术方案，能够根据用户的退票倾向值向用户推送允许的信息，即将原先推送的信息替换为特定信息。进一步的提高了信息资源的利用率，使得用户体验大大提升。

本发明进一步设置为：根据所述退票倾向值，筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息具体包括：

根据所述退票倾向值获得若干个退票倾向范围值，根据所述退票倾向范围值筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。

通过采用上述技术方案，获得了若干个退票倾向范围值，根据这些退票倾向范围值可以筛选出不同类的用户，从而按照分类好的用户类别为用户推送特定的信息，具有能够进一步提高信息资源利用率的效果。

本发明的上述发明目的二是通过以下技术方案得以实现的：

一种针对行程预定类用户的分类及信息推送的装置，包括：

数据库，用于通过用户的历史行程数据信息获得精准推荐数据集，所述精准推荐数据集包括训练集和测试集；

精准推荐模块，用于通过分类决策算法以及训练集，训练得到精准推荐模型；

阈值计算模块，用于根据所述测试集以及精准推荐模型，计算获得允许为用户推送信息的推送阈值；

用户筛选模块，用于根据所述推送阈值，筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息。

通过采用上述技术方案，数据库内存有精准推荐数据集，且将精准推荐数据集内样本按比例随机分为训练集和测试集，便于精准推荐模块训练得到精准推荐模型，也便于阈值计算模块计算推送阈值，有效增加了数据样本的可靠性。用户筛选模块会在筛选出允许推送信息的用户后向这些用户推送信息，具有能够有效提高信息资源利用率和提升用户体验的效果。

本发明进一步设置为：所述装置还包括：

退票概率预测模块，用于筛选所述测试集中与允许推送信息的用户所对应的样本作为退票概率预测数据集；

预测模型训练模块，用于通过分类决策算法以及退票概率预测数据集，训练得到退票倾向预测模型；

倾向值计算模块，用于根据所述退票概率预测数据集以及退票倾向预测模型，计算获得所述退票概率预测数据集中每一样本的退票倾向值；

推送信息调整模块，用于根据所述退票倾向值，筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。

通过采用上述技术方案，将用户的退票概率参数加入计算，以便于将允许推送信息的用户再做进一步地分类，按照用户的分类属性即可推送与用户匹配的特定信息，进一步地提高了信息资源的利用率，使得用户体验更佳。

综上所述，本发明的有益技术效果为：

1.根据精准推荐模型计算的推送阈值，即可筛选出允许推送信息的用户，具有能够有效提高信息资源利用率和用户体验的效果；

2.通过退票倾向预测模型计算的退票倾向值，可将允许推送信息的用户作进一步的分类，从而为不同类别的用户匹配特定的推送信息，具有能够进一步提高信息资源利用率、提升用户体验的效果。

附图说明

图1是本发明实施例一示出的针对行程预定类用户的分类及信息推送的方法的流程图；

图2是本发明实施例一中用于体现用户筛选过程的流程图；

图3是本发明实施例二示出的针对行程预定类用户的分类及信息推送的方法的流程图；

图4是本发明实施例二中用于体现用户筛选过程的流程图；

图5是本发明实施例四提供的针对行程预定类用户的分类及信息推送的装置的框图；

图6是本发明实施例五提供的针对行程预定类用户的分类及信息推送的装置的框图。

图中：301、数据库；302、精准推荐模块；303、阈值计算模块；304、用户筛选模块；305、退票概率预测模块；306、预测模型训练模块；307、倾向值计算模块；308、推送信息调整模块。

具体实施方式

以下结合附图对本发明作进一步详细说明。

实施例一

参照图1，为本发明公开的一种针对行程预定类用户的分类及信息推送的方法，包括：

步骤101、通过用户的历史行程数据信息获得精准推荐数据集，该精准推荐数据集包括训练集和测试集。

在本实施例中，通过用户的历史行程数据信息获得精准推荐数据集的思想是，首先确定时间窗口参数H为一个月，从这一个月内的用户的历史行程数据信息中提取一类特征信息形成精准推荐数据集，提取的一类特征信息包括用户属性信息、车票信息以及是否含有二类特征信息。二类特征信息即为历史的退改无忧服务信息，向用户推送的信息为新的退改无忧服务信息。若用户的一类特征信息中包含二类特征信息，则标记为正例。若用户的一类特征信息中不包含二类特征信息，则标记为负例。需要说明的是，训练集和测试集均通过随机分配精准推荐数据集中的样本所得，训练集的样本占精准推荐数据集的样本的80%，测试集的样本占精准推荐数据集的样本的=20%。

步骤102、通过分类决策算法以及训练集，训练得到精准推荐模型。

具体的，在本实施例中，分类决策算法采用的是xgboost算法原理，用训练集训练xgboost分类器时，参数设置为树深度50，树的个数30，步长0.1，正则项系数0.05。根据精准推荐数据集中的样本以及精准推荐模型，能够计算获得精准推荐数据集中每一样本的推荐值。需要说明的是，推荐值为大于N且小于N+1的小数，N为0，即精准推荐模型最终输出的是一个0到1的小数。当推荐值越接近1，则表示对应的用户对退改无忧服务的购买意愿越强烈。

步骤103、根据测试集以及精准推荐模型，计算获得允许为用户推送信息的推送阈值。

在本实施例中，根据测试集以及精准推荐模型计算推送阈值时，首先要将测试集的样本按照推荐值的大小降序排列，通过从第一个样本开始不断累加推荐值获得推荐总值。当推荐总值达到测试集所有样本的推荐值总和的95%时，将最后累加的样本所对应的推荐值作为允许为用户在购买车票时推送退改无忧服务信息的推送阈值。

步骤104、根据推送阈值，筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息。

具体的为，将精准推荐数据集中推荐值大于推送阈值的样本所对应的用户作为允许推送退改无忧服务信息的用户，并向这些用户推送退改无忧服务信息，其它用户则不推送退改无忧服务信息。

上述实施例的实施原理为：

基于精准推荐数据集，参照图2，精准推荐数据集中的用户（即全量用户）对应的样本经精准推荐模型计算后，输出一个推荐值。若推荐值大于推送阈值，则将对应的用户标记为正例，即确定该用户为推送用户，可向其推送常规信息（即退改无忧服务信息）。若推荐值不大于推送阈值，则将对应的用户标记为负例，即确定该用户为不推送用户，不向其推送常规信息。

实施例二

参照图3，以实施例一为基础，本实施例与实施例一的区别在于，行程数据信息还包括退票概率信息，在步骤104后还包括：

步骤201、筛选测试集中推荐值大于推送阈值的样本作为退票概率预测数据集。

步骤202、通过分类决策算法以及退票概率预测数据集，训练得到退票倾向预测模型。

需要说明的是，此处的分类决策算法采用的也是xgboost算法原理，在用退票概率预测数据集训练xgboost分类器时，对应的参数设置为树深度30，树的个数10，步长0.1，正则项系数0.05。

步骤203、根据退票概率预测数据集以及退票倾向预测模型，计算获得退票概率预测数据集中每一样本的退票倾向值。

具体的是，退票倾向预测模型最终输出的是一个0到1的小数，小数越接近1，表示对应用户的退票倾向值越大。

步骤204、根据退票倾向值，筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。

在本实施例中，筛选允许推送特定信息的用户之前，可根据退票倾向值获得两个退票倾向范围值，两个退票倾向范围值可以分别是退票概率预测数据集中按照退票倾向值降序排列的前10%的样本所对应的退票倾向值范围和后10%的样本所对应的退票倾向值范围。根据两个退票倾向范围值从允许推送信息的用户中筛选出允许推送特定信息的用户，并将向允许推送特定信息的用户推送的信息替换为对应的特定信息。

上述实施例的实施原理为：

基于精准推荐数据集，参照图4，精准推荐数据集中的用户（即全量用户）对应的样本经精准推荐模型计算后，输出一个推荐值。若推荐值大于推送阈值，则将对应的用户标记为正例，即确定该用户为推送用户。若推荐值不大于推送阈值，则将对应的用户标记为负例，即确定该用户为不推送用户，不向其推送信息。

通过退票倾向预测模型确定推送用户的退票倾向值。当用户的退票倾向值不在退票倾向范围值内时，则可向该用户推送常规信息（即退改无忧服务信息）。当用户的退票倾向值在退票倾向范围值内时，则向该用户推送特定信息。

实施例三

参照图3和图4，以实施例二为基础，本实施例与实施例二的区别在于：

在步骤204中，向允许推送特定信息的用户推送的特定信息为不同价格的退改无忧服务信息。退改无忧服务的常规价格为车票票价的3%，即向用户推送的常规信息是价格为车票票价的3%的退改无忧服务信息。根据退票倾向值降序排列的前10%的样本对应的退票倾向范围值从允许推送信息的用户中筛选出允许推送特定信息的用户，并将向这些用户推送的常规价格的退改无忧服务信息替换成为车票票价的4%的退改无忧服务信息。根据退票倾向值降序排列的后10%的样本对应的退票倾向范围值从允许推送信息的用户中筛选出允许推送特定信息的用户，并将向这些用户推送的常规价格的退改无忧服务信息替换成为车票票价的2%的退改无忧服务信息。

上述实施例的实施原理为：

通过退票倾向预测模型确定推送用户的退票倾向值。当用户的退票倾向值不在退票倾向范围值内时，则可向该用户推送常规信息（即为车票票价的3%的退改无忧服务信息）。当用户的退票倾向值在退票倾向范围值内时，若用户的退票倾向值在退票概率预测数据集中按照退票倾向值降序排列的前10%的样本所对应的退票倾向值范围内，则向该用户推送为车票票价的4%的退改无忧服务信息；若用户的退票倾向值在退票概率预测数据集中按照退票倾向值降序排列的后10%的样本所对应的退票倾向值范围内，则向该用户推送为车票票价的2%的退改无忧服务信息。

实施例四

参照图5，为本发明公开的一种针对行程预定类用户的分类及信息推送的装置，其包括：

数据库301，用于通过用户的历史行程数据信息获得精准推荐数据集，精准推荐数据集包括训练集和测试集。具体的，数据库301通过用户的历史行程数据信息获得精准推荐数据集的思想是，首先确定时间窗口大小为一个月，从这一个月内的用户的历史行程数据信息中提取一类特征信息形成精准推荐数据集，提取的一类特征信息包括用户属性信息、车票信息以及是否含有二类特征信息。二类特征信息即为历史的退改无忧服务信息，向用户推送的信息为新的退改无忧服务信息。若用户的一类特征信息中包含二类特征信息，则标记为正例。若用户的一类特征信息中不包含二类特征信息，则标记为负例。需要说明的是，训练集和测试集均通过随机分配精准推荐数据集中的样本所得，训练集的样本占精准推荐数据集的样本的80%，测试集的样本占精准推荐数据集的样本的=20%。

精准推荐模块302，用于通过分类决策算法以及训练集，训练得到精准推荐模型。具体为，分类决策算法采用的是xgboost算法原理，用训练集训练xgboost分类器时，参数设置为树深度50，树的个数30，步长0.1，正则项系数0.05。精准推荐模块302根据精准推荐数据集中的样本以及精准推荐模型，能够计算获得精准推荐数据集中每一样本的推荐值，此处推荐值为大于0且小于1的小数，即精准推荐模型最终输出是一个0到1的小数。当推荐值越接近1，则表示对应的用户对退改无忧服务的购买意愿越强烈。

阈值计算模块303，用于根据测试集以及精准推荐模型，计算获得允许为用户推送信息的推送阈值。阈值计算模块303根据测试集以及精准推荐模型计算推送阈值时，首先会将测试集的样本按照推荐值的大小降序排列，通过从第一个样本开始不断累加推荐值获得推荐总值。当推荐总值达到测试集所有样本的推荐值总和的95%时，阈值计算模块303将最后累加的样本所对应的推荐值作为允许为用户在购买车票时推送退改无忧服务信息的推送阈值。

用户筛选模块304，用于根据推送阈值，筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息。具体的为，用户筛选模块304将精准推荐数据集中推荐值大于推送阈值的样本所对应的用户作为允许推送退改无忧服务信息的用户，并向这些用户推送退改无忧服务信息，其它用户则不推送退改无忧服务信息。

上述实施例的实施原理为：

精准推荐模块302将数据库301中的样本经精准推荐模型计算后，输出一个推荐值。若推荐值大于阈值计算模块303计算得到的推送阈值，则将对应的用户标记为正例，即确定该用户为推送用户，可向其推送常规信息（即退改无忧服务信息）。若推荐值不大于计算模块303计算得到的推送阈值，则将对应的用户标记为负例，即确定该用户为不推送用户，不向其推送常规信息。

实施例五

参照图6，以实施例四为基础，本实施例与实施例四的区别在于，装置还包括：

退票概率预测模块305，用于筛选测试集中与允许推送信息的用户所对应的样本作为退票概率预测数据集。

预测模型训练模块306，用于通过分类决策算法以及退票概率预测数据集，训练得到退票倾向预测模型。具体的为，此处的分类决策算法采用的也是xgboost算法原理，在用退票概率预测数据集训练xgboost分类器时，对应的参数设置为树深度30，树的个数10，步长0.1，正则项系数0.05。

倾向值计算模块307，用于根据退票概率预测数据集以及退票倾向预测模型，计算获得退票概率预测数据集中每一样本的退票倾向值。需要说明的是，退票倾向预测模型最终输出的是一个0到1的小数，即退票倾向值是一个0到1的小数，小数越接近1，表示对应用户的退票倾向越大。

推送信息调整模块308，用于根据退票倾向值，筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。具体的，推送信息调整模块308在筛选允许推送特定信息的用户之前，会根据退票倾向值获得两个退票倾向范围值，两个退票倾向范围值可以分别是退票概率预测数据集中按照退票倾向值降序排列的前10%的样本所对应的退票倾向值范围和后10%的样本所对应的退票倾向值范围。根据两个退票倾向范围值，推送信息调整模块308从允许推送信息的用户中筛选出允许推送特定信息的用户，并将向允许推送特定信息的用户推送的信息替换为对应的特定信息。

上述实施例的实施原理为：

精准推荐模块302将数据库301中的样本经精准推荐模型计算后，输出一个推荐值。若推荐值大于阈值计算模块303计算得到的推送阈值，则将对应的用户标记为正例，即确定该用户为推送用户，可向其推送常规信息（退改无忧服务信息）。若推荐值不大于计算模块303计算得到的推送阈值，则将对应的用户标记为负例，即确定该用户为不推送用户，不向其推送常规信息（退改无忧服务信息）。

预测模型训练模块306通过退票概率预测模块305中的样本训练得到退票倾向预测模型后，倾向值计算模块307通过退票倾向预测模型确定推送用户的退票倾向值。当用户的退票倾向值不在退票倾向范围值内时，推送信息调整模块308向该用户推送常规信息（即退改无忧服务信息）。当用户的退票倾向值在退票倾向范围值内时，推送信息调整模块308向该用户推送特定信息。

实施例六

参照图6，以实施例五为基础，本实施例与实施例五的区别在于：

推送信息调整模块308从允许推送信息的用户中筛选出允许推送特定信息的用户后，将向允许推送特定信息的用户推送的信息替换成的对应的特定信息为不同价格的退改无忧服务信息。需要说明的是，退改无忧服务的常规价格为车票票价的3%；推送信息调整模块308根据退票倾向值降序排列的前10%的样本对应的退票倾向范围值从允许推送信息的用户中筛选出允许推送特定信息的用户后，将向这些用户推送的常规价格的退改无忧服务信息替换成为车票票价的4%的退改无忧服务信息；推送信息调整模块308根据退票倾向值降序排列的后10%的样本对应的退票倾向范围值从允许推送信息的用户中筛选出允许推送特定信息的用户后，将向这些用户推送的常规价格的退改无忧服务信息替换成为车票票价的2%的退改无忧服务信息。

上述实施例的实施原理为：

预测模型训练模块306通过退票概率预测模块305中的样本训练得到退票倾向预测模型后，倾向值计算模块307通过退票倾向预测模型确定推送用户的退票倾向值。

当用户的退票倾向值不在退票倾向范围值内时，推送信息调整模块308向该用户推送常规信息（即为车票票价的3%的退改无忧服务信息）。

当用户的退票倾向值在退票倾向范围值内时，若用户的退票倾向值在退票概率预测数据集中按照退票倾向值降序排列的前10%的样本所对应的退票倾向值范围内，推送信息调整模块308则向该用户推送为车票票价的4%的退改无忧服务信息；若用户的退票倾向值在退票概率预测数据集中按照退票倾向值降序排列的后10%的样本所对应的退票倾向值范围内，推送信息调整模块308则向该用户推送为车票票价的2%的退改无忧服务信息。

本具体实施方式的实施例均为本发明的较佳实施例，并非依此限制本发明的保护范围，故：凡依本发明的结构、形状、原理所做的等效变化，均应涵盖于本发明的保护范围之内。

Claims

1.一种针对行程预定类用户的分类及信息推送的方法，其特征在于，包括：

确定时间窗口参数H，从所述时间窗口参数H内的用户的历史行程数据信息中提取一类特征信息形成精准推荐数据集，所述行程数据信息包括退票概率信息，所述精准推荐数据集包括训练集和测试集，且所述训练集和测试集均通过随机分配精准推荐数据集中的样本所得；若用户的一类特征信息中包含二类特征信息，则标记为正例；若用户的一类特征信息中不包含二类特征信息，则标记为负例；其中，提取的一类特征信息包括用户属性信息、车票信息以及是否含有二类特征信息；二类特征信息即为历史的退改无忧服务信息，向用户推送的信息为新的退改无忧服务信息；

通过分类决策算法以及训练集，训练得到精准推荐模型；根据所述精准推荐数据集以及精准推荐模型，计算获得所述精准推荐数据集中每一样本的推荐值，所述推荐值大于N且小于N+1；其中，所述推荐值越接近N+1，则表示对应的用户对推送信息的利用率越高；

将所述测试集的样本按照推荐值的大小降序排列，通过从第一个样本开始不断累加推荐值获得推荐总值；当所述推荐总值达到测试集所有样本的推荐值总和的设定占比值时，将最后累加的样本所对应的推荐值作为允许为用户推送信息的推送阈值；

将所述精准推荐数据集中推荐值大于推送阈值的样本所对应的用户作为允许推送信息的用户并向允许推送信息的用户推送对应的信息；

2.一种针对行程预定类用户的分类及信息推送的装置，其特征在于，包括：

数据库（301），用于通过用户的历史行程数据信息获得精准推荐数据集，所述精准推荐数据集包括训练集和测试集；

精准推荐模块（302），用于通过分类决策算法以及训练集，训练得到精准推荐模型；

阈值计算模块（303），用于根据所述测试集以及精准推荐模型，计算获得允许为用户推送信息的推送阈值；

用户筛选模块（304），用于根据所述推送阈值，筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息；

其中，所述数据库（301）用于从确定的时间窗口大小内的用户的历史行程数据信息中提取一类特征信息形成所述精准推荐数据集，提取的一类特征信息包括用户属性信息、车票信息以及是否含有二类特征信息，二类特征信息即为历史的退改无忧服务信息；

所述精准推荐模块（302）还用于根据精准推荐数据集中的样本以及精准推荐模型，计算获得精准推荐数据集中每一样本的推荐值；阈值计算模块（303）在根据测试集以及精准推荐模型计算推送阈值时，首先会将测试集的样本按照推荐值的大小降序排列，通过从第一个样本开始不断累加推荐值获得推荐总值；当推荐总值达到测试集所有样本的推荐值总和的95%时，阈值计算模块（303）将最后累加的样本所对应的推荐值作为允许为用户在购买车票时推送退改无忧服务信息的推送阈值；

所述装置还包括：

退票概率预测模块（305），用于筛选所述测试集中与允许推送信息的用户所对应的样本作为退票概率预测数据集；

预测模型训练模块（306），用于通过分类决策算法以及退票概率预测数据集，训练得到退票倾向预测模型；

倾向值计算模块（307），用于根据所述退票概率预测数据集以及退票倾向预测模型，计算获得所述退票概率预测数据集中每一样本的退票倾向值；

推送信息调整模块（308），用于根据所述退票倾向值，筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。