CN109166012B - 针对行程预定类用户的分类及信息推送的方法和装置 - Google Patents
针对行程预定类用户的分类及信息推送的方法和装置 Download PDFInfo
- Publication number
- CN109166012B CN109166012B CN201811110182.2A CN201811110182A CN109166012B CN 109166012 B CN109166012 B CN 109166012B CN 201811110182 A CN201811110182 A CN 201811110182A CN 109166012 B CN109166012 B CN 109166012B
- Authority
- CN
- China
- Prior art keywords
- information
- user
- value
- data set
- pushing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 54
- 238000012360 testing method Methods 0.000 claims abstract description 41
- 238000012216 screening Methods 0.000 claims abstract description 30
- 238000004364 calculation method Methods 0.000 claims description 22
- 230000000694 effects Effects 0.000 abstract description 9
- 238000010801 machine learning Methods 0.000 abstract description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000545744 Hirudinea Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种针对行程预定类用户的分类及信息推送的方法和装置,涉及计算机机器学习技术领域,旨在解决现有的行程预订平台信息资源利用率低且用户体验差的问题。其技术方案要点是,通过用户的历史行程数据信息获得精准推荐数据集,精准推荐数据集包括训练集和测试集;通过分类决策算法以及训练集,训练得到精准推荐模型;根据测试集以及精准推荐模型,计算获得允许为用户推送信息的推送阈值;根据推送阈值,筛选出允许推送信息的用户并向这一部分用户推送对应的信息。本发明达到了能够有效提高信息资源利用率和用户体验的效果。
Description
技术领域
本发明涉及计算机机器学习技术领域,尤其是涉及一种针对行程预定类用户的分类及信息推送的方法和装置。
背景技术
传统旅游业在转向互联网发展的过程中,如何使信息资源得到有效利用是目前的研究课题之一。通过互联网推送信息时,无用的信息推送不仅会降低用户体验,也会导致信息的滥用以及信息资源的浪费。
基于这样的需求,一些行程预订平台(例如携程、途牛、蚂蜂窝、去哪儿等)以及互联网企业不断推出了各类方案以解决上述问题,例如:
D1:腾讯科技(深圳)有限公司在2013年10月22日申请的专利号为“201310501027”的中国专利,其公开了一种用户兴趣标签分类的方法及装置,包括:获取活跃用户的训练数据,训练数据包括活跃用户的第一站点数据以及活跃用户在第二站点中选择的用户兴趣标签;对第二站点兴趣标签进行二元标签转换,得到二分类器;根据用户兴趣标签以及二分类器,建立第一站点数据与第二站点兴趣标签之间的关联关系;通过二元分解算法以及该关联关系训练得到用户兴趣标签分类模型;根据新用户的第一站点数据以及用户兴趣标签分类模型,计算获得新用户在第二站点中的用户兴趣标签。达到了能够使开放平台的用户信息被第三方充分且准确利用的效果。
D2:中国联合网络通信集团有限公司在2017年7月6日申请的专利号为“201710546055”的中国专利,其公开了一种旅游用户筛选的方法和旅游用户筛选的系统,包括:获取数据,从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;对数据进行分析处理,根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。达到了能够有效解决旅游用户定位问题以及有效发掘新旅游用户的效果。
由上述文献可知,目前基于用户偏好来分类用户或者对用户加以特殊标签来对用户进行分类都已具备较为完善的解决方案,但是互联网平台的最终目的是在于促成消费,或者令信息资源得到充分利用以提高信息资源消耗所带来的效益。为此,本申请提出了一种新的方案。
发明内容
本发明的目的是提供一种针对行程预定类用户的分类及信息推送的方法和装置,其具有能够有效提高信息资源利用率和用户体验的效果。
本发明的上述发明目的一是通过以下技术方案得以实现的:
一种针对行程预定类用户的分类及信息推送的方法,包括:
通过用户的历史行程数据信息获得精准推荐数据集,所述精准推荐数据集包括训练集和测试集;
通过分类决策算法以及训练集,训练得到精准推荐模型;
根据所述测试集以及精准推荐模型,计算获得允许为用户推送信息的推送阈值;
根据所述推送阈值,筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息。
通过采用上述技术方案,可将用户进行定向分类,仅对允许推送信息的用户进行信息的推送,避免对推送信息的用户造成干扰,提高了用户体验,且使得信息资源利用率显著提高。
本发明进一步设置为:通过用户的历史行程数据信息获得精准推荐数据集具体包括:
确定时间窗口参数H,从所述时间窗口参数H内的用户的历史行程数据信息中提取一类特征信息形成精准推荐数据集;若用户的一类特征信息中包含二类特征信息,则标记为正例;若用户的一类特征信息中不包含二类特征信息,则标记为负例。
通过采用上述技术方案,在特定时间窗口参数H内提取用户的一类特征形成精准推荐数据集,便于捕捉用户最新的动态以及历史信息利用率情况,有效增加了数据样本的可靠性。通过正例和反例的标记,便于将对反例用户的信息推送取消,从而提高用户体验,提高信息资源利用率。
本发明进一步设置为:所述训练集和测试集均通过随机分配精准推荐数据集中的样本所得。
通过采用上述技术方案,随机分配样本所得到的训练集和测试集,更具说服力,使得模型训练和得出的各项数据更准确。
本发明进一步设置为:通过分类决策算法以及训练集,训练得到精准推荐模型具体包括:
通过分类决策算法以及训练集,训练得到精准推荐模型;根据所述精准推荐数据集以及精准推荐模型,计算获得所述精准推荐数据集中每一样本的推荐值,所述推荐值大于N且小于N+1;其中,所述推荐值越接近N+1,则表示对应的用户对推送信息的利用率越高。
通过采用上述技术方案,根据推荐值的大小可以方便地判断用户对历史推送信息的利用率,根据用户对历史推送信息的利用率高低,即可方便的筛选允许推送信息的用户,从而提高数据的处理效率。
本发明进一步设置为:根据所述测试集以及精准推荐模型,计算获得允许为用户推送信息的推送阈值具体包括:
将所述测试集的样本按照推荐值的大小降序排列,通过从第一个样本开始不断累加推荐值获得推荐总值;当所述推荐总值达到测试集所有样本的推荐值总和的设定占比值时,将最后累加的样本所对应的推荐值作为允许为用户推送信息的推送阈值。
通过采用上述技术方案,从正例中进一步筛选出了允许推送信息的用户,向这些用户推送信息,进一步地提高了信息资源的利用率,且使得用户体验更佳。
本发明进一步设置为:根据所述推送阈值,筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息具体包括:
将所述精准推荐数据集中推荐值大于推送阈值的样本所对应的用户作为允许推送信息的用户并向允许推送信息的用户推送对应的信息。
本发明进一步设置为:所述行程数据信息包括退票概率信息,所述方法还包括:
筛选所述测试集中推荐值大于推送阈值的样本作为退票概率预测数据集;
通过分类决策算法以及退票概率预测数据集,训练得到退票倾向预测模型;
根据所述退票概率预测数据集以及退票倾向预测模型,计算获得所述退票概率预测数据集中每一样本的退票倾向值;
根据所述退票倾向值,筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。
通过采用上述技术方案,能够根据用户的退票倾向值向用户推送允许的信息,即将原先推送的信息替换为特定信息。进一步的提高了信息资源的利用率,使得用户体验大大提升。
本发明进一步设置为:根据所述退票倾向值,筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息具体包括:
根据所述退票倾向值获得若干个退票倾向范围值,根据所述退票倾向范围值筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。
通过采用上述技术方案,获得了若干个退票倾向范围值,根据这些退票倾向范围值可以筛选出不同类的用户,从而按照分类好的用户类别为用户推送特定的信息,具有能够进一步提高信息资源利用率的效果。
本发明的上述发明目的二是通过以下技术方案得以实现的:
一种针对行程预定类用户的分类及信息推送的装置,包括:
数据库,用于通过用户的历史行程数据信息获得精准推荐数据集,所述精准推荐数据集包括训练集和测试集;
精准推荐模块,用于通过分类决策算法以及训练集,训练得到精准推荐模型;
阈值计算模块,用于根据所述测试集以及精准推荐模型,计算获得允许为用户推送信息的推送阈值;
用户筛选模块,用于根据所述推送阈值,筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息。
通过采用上述技术方案,数据库内存有精准推荐数据集,且将精准推荐数据集内样本按比例随机分为训练集和测试集,便于精准推荐模块训练得到精准推荐模型,也便于阈值计算模块计算推送阈值,有效增加了数据样本的可靠性。用户筛选模块会在筛选出允许推送信息的用户后向这些用户推送信息,具有能够有效提高信息资源利用率和提升用户体验的效果。
本发明进一步设置为:所述装置还包括:
退票概率预测模块,用于筛选所述测试集中与允许推送信息的用户所对应的样本作为退票概率预测数据集;
预测模型训练模块,用于通过分类决策算法以及退票概率预测数据集,训练得到退票倾向预测模型;
倾向值计算模块,用于根据所述退票概率预测数据集以及退票倾向预测模型,计算获得所述退票概率预测数据集中每一样本的退票倾向值;
推送信息调整模块,用于根据所述退票倾向值,筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。
通过采用上述技术方案,将用户的退票概率参数加入计算,以便于将允许推送信息的用户再做进一步地分类,按照用户的分类属性即可推送与用户匹配的特定信息,进一步地提高了信息资源的利用率,使得用户体验更佳。
综上所述,本发明的有益技术效果为:
1.根据精准推荐模型计算的推送阈值,即可筛选出允许推送信息的用户,具有能够有效提高信息资源利用率和用户体验的效果;
2.通过退票倾向预测模型计算的退票倾向值,可将允许推送信息的用户作进一步的分类,从而为不同类别的用户匹配特定的推送信息,具有能够进一步提高信息资源利用率、提升用户体验的效果。
附图说明
图1是本发明实施例一示出的针对行程预定类用户的分类及信息推送的方法的流程图;
图2是本发明实施例一中用于体现用户筛选过程的流程图;
图3是本发明实施例二示出的针对行程预定类用户的分类及信息推送的方法的流程图;
图4是本发明实施例二中用于体现用户筛选过程的流程图;
图5是本发明实施例四提供的针对行程预定类用户的分类及信息推送的装置的框图;
图6是本发明实施例五提供的针对行程预定类用户的分类及信息推送的装置的框图。
图中:301、数据库;302、精准推荐模块;303、阈值计算模块;304、用户筛选模块;305、退票概率预测模块;306、预测模型训练模块;307、倾向值计算模块;308、推送信息调整模块。
具体实施方式
以下结合附图对本发明作进一步详细说明。
实施例一
参照图1,为本发明公开的一种针对行程预定类用户的分类及信息推送的方法,包括:
步骤101、通过用户的历史行程数据信息获得精准推荐数据集,该精准推荐数据集包括训练集和测试集。
在本实施例中,通过用户的历史行程数据信息获得精准推荐数据集的思想是,首先确定时间窗口参数H为一个月,从这一个月内的用户的历史行程数据信息中提取一类特征信息形成精准推荐数据集,提取的一类特征信息包括用户属性信息、车票信息以及是否含有二类特征信息。二类特征信息即为历史的退改无忧服务信息,向用户推送的信息为新的退改无忧服务信息。若用户的一类特征信息中包含二类特征信息,则标记为正例。若用户的一类特征信息中不包含二类特征信息,则标记为负例。需要说明的是,训练集和测试集均通过随机分配精准推荐数据集中的样本所得,训练集的样本占精准推荐数据集的样本的80%,测试集的样本占精准推荐数据集的样本的=20%。
步骤102、通过分类决策算法以及训练集,训练得到精准推荐模型。
具体的,在本实施例中,分类决策算法采用的是xgboost算法原理,用训练集训练xgboost分类器时,参数设置为树深度50,树的个数30,步长0.1,正则项系数0.05。根据精准推荐数据集中的样本以及精准推荐模型,能够计算获得精准推荐数据集中每一样本的推荐值。需要说明的是,推荐值为大于N且小于N+1的小数,N为0,即精准推荐模型最终输出的是一个0到1的小数。当推荐值越接近1,则表示对应的用户对退改无忧服务的购买意愿越强烈。
步骤103、根据测试集以及精准推荐模型,计算获得允许为用户推送信息的推送阈值。
在本实施例中,根据测试集以及精准推荐模型计算推送阈值时,首先要将测试集的样本按照推荐值的大小降序排列,通过从第一个样本开始不断累加推荐值获得推荐总值。当推荐总值达到测试集所有样本的推荐值总和的95%时,将最后累加的样本所对应的推荐值作为允许为用户在购买车票时推送退改无忧服务信息的推送阈值。
步骤104、根据推送阈值,筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息。
具体的为,将精准推荐数据集中推荐值大于推送阈值的样本所对应的用户作为允许推送退改无忧服务信息的用户,并向这些用户推送退改无忧服务信息,其它用户则不推送退改无忧服务信息。
上述实施例的实施原理为:
基于精准推荐数据集,参照图2,精准推荐数据集中的用户(即全量用户)对应的样本经精准推荐模型计算后,输出一个推荐值。若推荐值大于推送阈值,则将对应的用户标记为正例,即确定该用户为推送用户,可向其推送常规信息(即退改无忧服务信息)。若推荐值不大于推送阈值,则将对应的用户标记为负例,即确定该用户为不推送用户,不向其推送常规信息。
实施例二
参照图3,以实施例一为基础,本实施例与实施例一的区别在于,行程数据信息还包括退票概率信息,在步骤104后还包括:
步骤201、筛选测试集中推荐值大于推送阈值的样本作为退票概率预测数据集。
步骤202、通过分类决策算法以及退票概率预测数据集,训练得到退票倾向预测模型。
需要说明的是,此处的分类决策算法采用的也是xgboost算法原理,在用退票概率预测数据集训练xgboost分类器时,对应的参数设置为树深度30,树的个数10,步长0.1,正则项系数0.05。
步骤203、根据退票概率预测数据集以及退票倾向预测模型,计算获得退票概率预测数据集中每一样本的退票倾向值。
具体的是,退票倾向预测模型最终输出的是一个0到1的小数,小数越接近1,表示对应用户的退票倾向值越大。
步骤204、根据退票倾向值,筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。
在本实施例中,筛选允许推送特定信息的用户之前,可根据退票倾向值获得两个退票倾向范围值,两个退票倾向范围值可以分别是退票概率预测数据集中按照退票倾向值降序排列的前10%的样本所对应的退票倾向值范围和后10%的样本所对应的退票倾向值范围。根据两个退票倾向范围值从允许推送信息的用户中筛选出允许推送特定信息的用户,并将向允许推送特定信息的用户推送的信息替换为对应的特定信息。
上述实施例的实施原理为:
基于精准推荐数据集,参照图4,精准推荐数据集中的用户(即全量用户)对应的样本经精准推荐模型计算后,输出一个推荐值。若推荐值大于推送阈值,则将对应的用户标记为正例,即确定该用户为推送用户。若推荐值不大于推送阈值,则将对应的用户标记为负例,即确定该用户为不推送用户,不向其推送信息。
通过退票倾向预测模型确定推送用户的退票倾向值。当用户的退票倾向值不在退票倾向范围值内时,则可向该用户推送常规信息(即退改无忧服务信息)。当用户的退票倾向值在退票倾向范围值内时,则向该用户推送特定信息。
实施例三
参照图3和图4,以实施例二为基础,本实施例与实施例二的区别在于:
在步骤204中,向允许推送特定信息的用户推送的特定信息为不同价格的退改无忧服务信息。退改无忧服务的常规价格为车票票价的3%,即向用户推送的常规信息是价格为车票票价的3%的退改无忧服务信息。根据退票倾向值降序排列的前10%的样本对应的退票倾向范围值从允许推送信息的用户中筛选出允许推送特定信息的用户,并将向这些用户推送的常规价格的退改无忧服务信息替换成为车票票价的4%的退改无忧服务信息。根据退票倾向值降序排列的后10%的样本对应的退票倾向范围值从允许推送信息的用户中筛选出允许推送特定信息的用户,并将向这些用户推送的常规价格的退改无忧服务信息替换成为车票票价的2%的退改无忧服务信息。
上述实施例的实施原理为:
基于精准推荐数据集,参照图4,精准推荐数据集中的用户(即全量用户)对应的样本经精准推荐模型计算后,输出一个推荐值。若推荐值大于推送阈值,则将对应的用户标记为正例,即确定该用户为推送用户。若推荐值不大于推送阈值,则将对应的用户标记为负例,即确定该用户为不推送用户,不向其推送信息。
通过退票倾向预测模型确定推送用户的退票倾向值。当用户的退票倾向值不在退票倾向范围值内时,则可向该用户推送常规信息(即为车票票价的3%的退改无忧服务信息)。当用户的退票倾向值在退票倾向范围值内时,若用户的退票倾向值在退票概率预测数据集中按照退票倾向值降序排列的前10%的样本所对应的退票倾向值范围内,则向该用户推送为车票票价的4%的退改无忧服务信息;若用户的退票倾向值在退票概率预测数据集中按照退票倾向值降序排列的后10%的样本所对应的退票倾向值范围内,则向该用户推送为车票票价的2%的退改无忧服务信息。
实施例四
参照图5,为本发明公开的一种针对行程预定类用户的分类及信息推送的装置,其包括:
数据库301,用于通过用户的历史行程数据信息获得精准推荐数据集,精准推荐数据集包括训练集和测试集。具体的,数据库301通过用户的历史行程数据信息获得精准推荐数据集的思想是,首先确定时间窗口大小为一个月,从这一个月内的用户的历史行程数据信息中提取一类特征信息形成精准推荐数据集,提取的一类特征信息包括用户属性信息、车票信息以及是否含有二类特征信息。二类特征信息即为历史的退改无忧服务信息,向用户推送的信息为新的退改无忧服务信息。若用户的一类特征信息中包含二类特征信息,则标记为正例。若用户的一类特征信息中不包含二类特征信息,则标记为负例。需要说明的是,训练集和测试集均通过随机分配精准推荐数据集中的样本所得,训练集的样本占精准推荐数据集的样本的80%,测试集的样本占精准推荐数据集的样本的=20%。
精准推荐模块302,用于通过分类决策算法以及训练集,训练得到精准推荐模型。具体为,分类决策算法采用的是xgboost算法原理,用训练集训练xgboost分类器时,参数设置为树深度50,树的个数30,步长0.1,正则项系数0.05。精准推荐模块302根据精准推荐数据集中的样本以及精准推荐模型,能够计算获得精准推荐数据集中每一样本的推荐值,此处推荐值为大于0且小于1的小数,即精准推荐模型最终输出是一个0到1的小数。当推荐值越接近1,则表示对应的用户对退改无忧服务的购买意愿越强烈。
阈值计算模块303,用于根据测试集以及精准推荐模型,计算获得允许为用户推送信息的推送阈值。阈值计算模块303根据测试集以及精准推荐模型计算推送阈值时,首先会将测试集的样本按照推荐值的大小降序排列,通过从第一个样本开始不断累加推荐值获得推荐总值。当推荐总值达到测试集所有样本的推荐值总和的95%时,阈值计算模块303将最后累加的样本所对应的推荐值作为允许为用户在购买车票时推送退改无忧服务信息的推送阈值。
用户筛选模块304,用于根据推送阈值,筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息。具体的为,用户筛选模块304将精准推荐数据集中推荐值大于推送阈值的样本所对应的用户作为允许推送退改无忧服务信息的用户,并向这些用户推送退改无忧服务信息,其它用户则不推送退改无忧服务信息。
上述实施例的实施原理为:
精准推荐模块302将数据库301中的样本经精准推荐模型计算后,输出一个推荐值。若推荐值大于阈值计算模块303计算得到的推送阈值,则将对应的用户标记为正例,即确定该用户为推送用户,可向其推送常规信息(即退改无忧服务信息)。若推荐值不大于计算模块303计算得到的推送阈值,则将对应的用户标记为负例,即确定该用户为不推送用户,不向其推送常规信息。
实施例五
参照图6,以实施例四为基础,本实施例与实施例四的区别在于,装置还包括:
退票概率预测模块305,用于筛选测试集中与允许推送信息的用户所对应的样本作为退票概率预测数据集。
预测模型训练模块306,用于通过分类决策算法以及退票概率预测数据集,训练得到退票倾向预测模型。具体的为,此处的分类决策算法采用的也是xgboost算法原理,在用退票概率预测数据集训练xgboost分类器时,对应的参数设置为树深度30,树的个数10,步长0.1,正则项系数0.05。
倾向值计算模块307,用于根据退票概率预测数据集以及退票倾向预测模型,计算获得退票概率预测数据集中每一样本的退票倾向值。需要说明的是,退票倾向预测模型最终输出的是一个0到1的小数,即退票倾向值是一个0到1的小数,小数越接近1,表示对应用户的退票倾向越大。
推送信息调整模块308,用于根据退票倾向值,筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。具体的,推送信息调整模块308在筛选允许推送特定信息的用户之前,会根据退票倾向值获得两个退票倾向范围值,两个退票倾向范围值可以分别是退票概率预测数据集中按照退票倾向值降序排列的前10%的样本所对应的退票倾向值范围和后10%的样本所对应的退票倾向值范围。根据两个退票倾向范围值,推送信息调整模块308从允许推送信息的用户中筛选出允许推送特定信息的用户,并将向允许推送特定信息的用户推送的信息替换为对应的特定信息。
上述实施例的实施原理为:
精准推荐模块302将数据库301中的样本经精准推荐模型计算后,输出一个推荐值。若推荐值大于阈值计算模块303计算得到的推送阈值,则将对应的用户标记为正例,即确定该用户为推送用户,可向其推送常规信息(退改无忧服务信息)。若推荐值不大于计算模块303计算得到的推送阈值,则将对应的用户标记为负例,即确定该用户为不推送用户,不向其推送常规信息(退改无忧服务信息)。
预测模型训练模块306通过退票概率预测模块305中的样本训练得到退票倾向预测模型后,倾向值计算模块307通过退票倾向预测模型确定推送用户的退票倾向值。当用户的退票倾向值不在退票倾向范围值内时,推送信息调整模块308向该用户推送常规信息(即退改无忧服务信息)。当用户的退票倾向值在退票倾向范围值内时,推送信息调整模块308向该用户推送特定信息。
实施例六
参照图6,以实施例五为基础,本实施例与实施例五的区别在于:
推送信息调整模块308从允许推送信息的用户中筛选出允许推送特定信息的用户后,将向允许推送特定信息的用户推送的信息替换成的对应的特定信息为不同价格的退改无忧服务信息。需要说明的是,退改无忧服务的常规价格为车票票价的3%;推送信息调整模块308根据退票倾向值降序排列的前10%的样本对应的退票倾向范围值从允许推送信息的用户中筛选出允许推送特定信息的用户后,将向这些用户推送的常规价格的退改无忧服务信息替换成为车票票价的4%的退改无忧服务信息;推送信息调整模块308根据退票倾向值降序排列的后10%的样本对应的退票倾向范围值从允许推送信息的用户中筛选出允许推送特定信息的用户后,将向这些用户推送的常规价格的退改无忧服务信息替换成为车票票价的2%的退改无忧服务信息。
上述实施例的实施原理为:
精准推荐模块302将数据库301中的样本经精准推荐模型计算后,输出一个推荐值。若推荐值大于阈值计算模块303计算得到的推送阈值,则将对应的用户标记为正例,即确定该用户为推送用户,可向其推送常规信息(退改无忧服务信息)。若推荐值不大于计算模块303计算得到的推送阈值,则将对应的用户标记为负例,即确定该用户为不推送用户,不向其推送常规信息(退改无忧服务信息)。
预测模型训练模块306通过退票概率预测模块305中的样本训练得到退票倾向预测模型后,倾向值计算模块307通过退票倾向预测模型确定推送用户的退票倾向值。
当用户的退票倾向值不在退票倾向范围值内时,推送信息调整模块308向该用户推送常规信息(即为车票票价的3%的退改无忧服务信息)。
当用户的退票倾向值在退票倾向范围值内时,若用户的退票倾向值在退票概率预测数据集中按照退票倾向值降序排列的前10%的样本所对应的退票倾向值范围内,推送信息调整模块308则向该用户推送为车票票价的4%的退改无忧服务信息;若用户的退票倾向值在退票概率预测数据集中按照退票倾向值降序排列的后10%的样本所对应的退票倾向值范围内,推送信息调整模块308则向该用户推送为车票票价的2%的退改无忧服务信息。
本具体实施方式的实施例均为本发明的较佳实施例,并非依此限制本发明的保护范围,故:凡依本发明的结构、形状、原理所做的等效变化,均应涵盖于本发明的保护范围之内。
Claims (2)
1.一种针对行程预定类用户的分类及信息推送的方法,其特征在于,包括:
确定时间窗口参数H,从所述时间窗口参数H内的用户的历史行程数据信息中提取一类特征信息形成精准推荐数据集,所述行程数据信息包括退票概率信息,所述精准推荐数据集包括训练集和测试集,且所述训练集和测试集均通过随机分配精准推荐数据集中的样本所得;若用户的一类特征信息中包含二类特征信息,则标记为正例;若用户的一类特征信息中不包含二类特征信息,则标记为负例;其中,提取的一类特征信息包括用户属性信息、车票信息以及是否含有二类特征信息;二类特征信息即为历史的退改无忧服务信息,向用户推送的信息为新的退改无忧服务信息;
通过分类决策算法以及训练集,训练得到精准推荐模型;根据所述精准推荐数据集以及精准推荐模型,计算获得所述精准推荐数据集中每一样本的推荐值,所述推荐值大于N且小于N+1;其中,所述推荐值越接近N+1,则表示对应的用户对推送信息的利用率越高;
将所述测试集的样本按照推荐值的大小降序排列,通过从第一个样本开始不断累加推荐值获得推荐总值;当所述推荐总值达到测试集所有样本的推荐值总和的设定占比值时,将最后累加的样本所对应的推荐值作为允许为用户推送信息的推送阈值;
将所述精准推荐数据集中推荐值大于推送阈值的样本所对应的用户作为允许推送信息的用户并向允许推送信息的用户推送对应的信息;
筛选所述测试集中推荐值大于推送阈值的样本作为退票概率预测数据集;
通过分类决策算法以及退票概率预测数据集,训练得到退票倾向预测模型;
根据所述退票概率预测数据集以及退票倾向预测模型,计算获得所述退票概率预测数据集中每一样本的退票倾向值;
根据所述退票倾向值获得若干个退票倾向范围值,根据所述退票倾向范围值筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。
2.一种针对行程预定类用户的分类及信息推送的装置,其特征在于,包括:
数据库(301),用于通过用户的历史行程数据信息获得精准推荐数据集,所述精准推荐数据集包括训练集和测试集;
精准推荐模块(302),用于通过分类决策算法以及训练集,训练得到精准推荐模型;
阈值计算模块(303),用于根据所述测试集以及精准推荐模型,计算获得允许为用户推送信息的推送阈值;
用户筛选模块(304),用于根据所述推送阈值,筛选出允许推送信息的用户并向允许推送信息的用户推送对应的信息;
其中,所述数据库(301)用于从确定的时间窗口大小内的用户的历史行程数据信息中提取一类特征信息形成所述精准推荐数据集,提取的一类特征信息包括用户属性信息、车票信息以及是否含有二类特征信息,二类特征信息即为历史的退改无忧服务信息;
所述精准推荐模块(302)还用于根据精准推荐数据集中的样本以及精准推荐模型,计算获得精准推荐数据集中每一样本的推荐值;阈值计算模块(303)在根据测试集以及精准推荐模型计算推送阈值时,首先会将测试集的样本按照推荐值的大小降序排列,通过从第一个样本开始不断累加推荐值获得推荐总值;当推荐总值达到测试集所有样本的推荐值总和的95%时,阈值计算模块(303)将最后累加的样本所对应的推荐值作为允许为用户在购买车票时推送退改无忧服务信息的推送阈值;
所述装置还包括:
退票概率预测模块(305),用于筛选所述测试集中与允许推送信息的用户所对应的样本作为退票概率预测数据集;
预测模型训练模块(306),用于通过分类决策算法以及退票概率预测数据集,训练得到退票倾向预测模型;
倾向值计算模块(307),用于根据所述退票概率预测数据集以及退票倾向预测模型,计算获得所述退票概率预测数据集中每一样本的退票倾向值;
推送信息调整模块(308),用于根据所述退票倾向值,筛选出允许推送特定信息的用户并将向允许推送特定信息的用户推送的信息替换为特定信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811110182.2A CN109166012B (zh) | 2018-09-21 | 2018-09-21 | 针对行程预定类用户的分类及信息推送的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811110182.2A CN109166012B (zh) | 2018-09-21 | 2018-09-21 | 针对行程预定类用户的分类及信息推送的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109166012A CN109166012A (zh) | 2019-01-08 |
CN109166012B true CN109166012B (zh) | 2021-05-28 |
Family
ID=64880000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811110182.2A Active CN109166012B (zh) | 2018-09-21 | 2018-09-21 | 针对行程预定类用户的分类及信息推送的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109166012B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110335099B (zh) * | 2019-05-06 | 2021-01-01 | 盛威时代科技集团有限公司 | 一种基于用户历史数据的车票购买线路推荐方法 |
CN112580681B (zh) * | 2019-09-30 | 2022-02-01 | 北京星选科技有限公司 | 用户分类方法、装置、电子设备及可读存储介质 |
CN111784049A (zh) * | 2020-06-30 | 2020-10-16 | 中国民航信息网络股份有限公司 | 一种旅客流失时间预测方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204063A (zh) * | 2016-06-30 | 2016-12-07 | 北京奇艺世纪科技有限公司 | 一种付费用户挖掘方法及装置 |
CN106845731A (zh) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | 一种基于多模型融合的潜在换机用户发现方法 |
CN107240005A (zh) * | 2017-06-13 | 2017-10-10 | 携程旅游网络技术(上海)有限公司 | 机票附加产品的推荐系统及方法 |
CN107481054A (zh) * | 2017-08-14 | 2017-12-15 | 携程计算机技术(上海)有限公司 | 酒店优惠信息的推送及装置、电子设备、存储介质 |
CN107563816A (zh) * | 2017-09-08 | 2018-01-09 | 携程计算机技术(上海)有限公司 | 电子商务网站的用户流失的预测方法及系统 |
CN107766580A (zh) * | 2017-11-20 | 2018-03-06 | 北京奇虎科技有限公司 | 消息的推送方法及装置 |
CN107818478A (zh) * | 2017-10-31 | 2018-03-20 | 携程计算机技术(上海)有限公司 | 基于预估收益的海外优惠券发放方法及系统 |
CN107944913A (zh) * | 2017-11-21 | 2018-04-20 | 重庆邮电大学 | 基于大数据用户行为分析的高潜在用户购买意向预测方法 |
-
2018
- 2018-09-21 CN CN201811110182.2A patent/CN109166012B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204063A (zh) * | 2016-06-30 | 2016-12-07 | 北京奇艺世纪科技有限公司 | 一种付费用户挖掘方法及装置 |
CN106845731A (zh) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | 一种基于多模型融合的潜在换机用户发现方法 |
CN107240005A (zh) * | 2017-06-13 | 2017-10-10 | 携程旅游网络技术(上海)有限公司 | 机票附加产品的推荐系统及方法 |
CN107481054A (zh) * | 2017-08-14 | 2017-12-15 | 携程计算机技术(上海)有限公司 | 酒店优惠信息的推送及装置、电子设备、存储介质 |
CN107563816A (zh) * | 2017-09-08 | 2018-01-09 | 携程计算机技术(上海)有限公司 | 电子商务网站的用户流失的预测方法及系统 |
CN107818478A (zh) * | 2017-10-31 | 2018-03-20 | 携程计算机技术(上海)有限公司 | 基于预估收益的海外优惠券发放方法及系统 |
CN107766580A (zh) * | 2017-11-20 | 2018-03-06 | 北京奇虎科技有限公司 | 消息的推送方法及装置 |
CN107944913A (zh) * | 2017-11-21 | 2018-04-20 | 重庆邮电大学 | 基于大数据用户行为分析的高潜在用户购买意向预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109166012A (zh) | 2019-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107657267B (zh) | 产品潜在用户挖掘方法及装置 | |
CN103336766B (zh) | 短文本垃圾识别以及建模方法和装置 | |
CN103455545B (zh) | 社交网络用户的位置估计的方法和系统 | |
CN107330459B (zh) | 一种数据处理方法、装置和电子设备 | |
CN109166012B (zh) | 针对行程预定类用户的分类及信息推送的方法和装置 | |
CN105894359A (zh) | 订单推送方法、装置及系统 | |
CN112118551B (zh) | 设备风险识别方法及相关设备 | |
CN112738729B (zh) | 一种用手机信令数据判别探亲返乡游客的方法及系统 | |
CN111680073A (zh) | 一种基于用户数据的金融服务平台政策资讯推荐方法 | |
CN110619535A (zh) | 一种数据处理方法及其装置 | |
CN111160959A (zh) | 一种用户点击转化预估方法及装置 | |
CN110517154A (zh) | 数据模型训练方法、系统及计算机设备 | |
CN112711578A (zh) | 用于云计算业务的大数据去噪方法及云计算金融服务器 | |
CN113033909A (zh) | 携转用户分析方法、装置、设备及计算机存储介质 | |
CN113935880A (zh) | 政策推荐方法、装置、设备及存储介质 | |
CN112487808A (zh) | 基于大数据的新闻消息推送方法、装置、设备及存储介质 | |
CN111797772A (zh) | 发票图像自动分类方法、系统、装置 | |
CN111402027B (zh) | 身份识别方法、商品贷审核方法、装置及终端设备 | |
CN111092764A (zh) | 一种实时动态亲密度关系分析方法及系统 | |
CN115935231A (zh) | 一种数据分类方法、装置、设备及存储介质 | |
CN113220947A (zh) | 对事件特征进行编码的方法和装置 | |
CN107622467A (zh) | 一种通勤出行模式提取方法及装置 | |
CN106408350A (zh) | 一种基于溯源数据库的用户商品推荐方法及系统 | |
CN115599985A (zh) | 目标客户识别方法和系统、电子设备及可读存储介质 | |
CN112464970A (zh) | 区域价值评估模型处理方法、装置及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |