CN114626879A - 用户出行意图的预测方法、系统、电子设备和存储介质 - Google Patents

用户出行意图的预测方法、系统、电子设备和存储介质 Download PDF

Info

Publication number
CN114626879A
CN114626879A CN202210187790.3A CN202210187790A CN114626879A CN 114626879 A CN114626879 A CN 114626879A CN 202210187790 A CN202210187790 A CN 202210187790A CN 114626879 A CN114626879 A CN 114626879A
Authority
CN
China
Prior art keywords
travel
user
historical
data
trip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210187790.3A
Other languages
English (en)
Inventor
张艺颖
汪政
汪珣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Information Service Shanghai Co Ltd
Original Assignee
Ctrip Travel Information Service Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Information Service Shanghai Co Ltd filed Critical Ctrip Travel Information Service Shanghai Co Ltd
Priority to CN202210187790.3A priority Critical patent/CN114626879A/zh
Publication of CN114626879A publication Critical patent/CN114626879A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Abstract

本发明公开了一种用户出行意图的预测方法、系统、电子设备和存储介质。该预测方法包括:获取用户的若干历史出行订单的历史出行订单数据;其中,所述历史出行订单数据包括历史订单参数数据和出行类别标签数据;将每个所述历史订单参数数据作为输入,对应的所述出行类别标签数据作为输出,构建用户出行意图预测模型;获取用户的待处理出行订单数据;将所述待处理出行订单数据输入所述用户出行意图预测模型,输出用于表征用户出行意图的预测结果。本发明通过构建用户出行意图预测模型,弥补了现有技术中预测用户出行意图依赖人工经验、准确率低的缺陷。在商务出行场景中,能够有效地识别潜在的高频商务出行用户,提高平台用户增长的召回率。

Description

用户出行意图的预测方法、系统、电子设备和存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户出行意图的预测方法、系统、电子设备和存储介质。
背景技术
消费者到企业(Customer to Business,C2B)是当前互联网时代的一种新型用户增长的商业模式。在用户出行场景下,它是指B端通过识别C端潜在的高频商务出行用户,并利用营销手段使这些用户以企业身份注册B端平台。这不仅能够通过专业的服务为这些客户带来更优的出行体验,而且能有效提高B端用户增长的召回率。
用户出行场景下构建出行意图识别系统需要考虑多种复杂的因素。当前,用户出行意图识别主要基于规则系统,通过人工经验与对B端用户的数据分析,来制定不同规则,用于挖掘C端可能的高频商务出行用户。然而,该规则系统存在以下几个问题:1.人工经验制定的规则考虑的范围有限,商务客户与非商务客户的数据不存在显著性差异,大量非商务出行客户可能被误判;2.规则系统基于单订单维度,而商务出行场景下,一次完整的出行行程通常打包了不同交通及住宿订单,规则系统无法进行全面分析;3.规则系统缺乏一个统一指标,因此缺少用于直接量化用户的商务属性价值的衡量标准。
发明内容
本发明要解决的技术问题是为了克服现有技术中的基于人工判断用户出行意图的实现方案对人工经验依赖度高,且准确度和处理效率低,以至于用户召回率低的缺陷,提供一种用户出行意图的预测方法、系统、电子设备和存储介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明提供一种用户出行意图的预测方法,包括以下步骤:
获取用户的若干历史出行订单的历史出行订单数据;
其中,历史出行订单数据包括历史订单参数数据和出行类别标签数据;
将每个历史出行订单对应的历史订单参数数据作为输入,对应的出行类别标签数据作为输出,构建用户出行意图预测模型;
获取用户的待处理出行订单数据;
将待处理出行订单数据输入用户出行意图预测模型,输出用于表征用户出行意图的预测结果。
较佳地,获取用户的若干历史出行订单的历史出行订单数据的步骤还包括:
获取用户在历史设定时间段内的第一数量的历史出行订单;
对所有历史出行订单进行归类处理,获取属于设定类别的若干历史出行订单和对应的历史出行订单数据。
较佳地,设定类别的若干历史出行订单包括属于同一单次行程的历史出行订单。
较佳地,将每个历史出行订单对应的历史订单参数数据作为输入,对应的出行类别标签数据作为输出,构建用户出行意图预测模型的步骤包括:
获取目标特征数据,目标特征数据用于表征历史订单参数数据中与用户出行相关联的数据;
将同一历史出行订单的目标特征数据作为输入,对应的出行类别标签数据作为输出,构建用户出行意图预测模型。
较佳地,目标特征数据包括用户特征数据、行程特征数据和用户行程交叉特征数据中的至少一种。
较佳地,用户出行意图预测模型基于多个弱学习模型集成训练得到。
较佳地,用户出行意图预测模型包括XGBoost(一种机器学习算法)模型。
本发明还提供一种用户出行意图的预测系统,包括:
历史订单数据获取模块,用于获取用户的若干历史出行订单的历史出行订单数据;
其中,历史出行订单数据包括历史订单参数数据和出行类别标签数据;
模型构建模块,用于将每个历史出行订单对应的历史订单参数数据作为输入,对应的出行类别标签数据作为输出,构建用户出行意图预测模型;
待处理订单数据获取模块,用于获取用户的待处理出行订单数据;
预测模块,用于将待处理出行订单数据输入用户出行意图预测模型,输出用于表征用户出行意图的预测结果。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,处理器执行计算机程序时实现上述的用户出行意图的预测方法。
本发明还提供一种计算机可读存储介质,存储计算机程序,计算机程序被处理器执行时实现上述的用户出行意图的预测方法。
本发明的积极进步效果在于:本发明中,通过模型训练得到用户出行意图的预测模型,通过模型来预测用户出行的意图(如因公行程还是因私行程),无需依赖人工经验,充分考虑了商务出行场景下用户出行行为的特性并且发挥了集成学习的优势,提高了用户出行意图识别的准确性,有效弥补了现有的挖掘C端潜在商务客户规则系统的识别召回率较低等缺陷。
附图说明
图1为本发明实施例1的用户出行意图的预测方法的流程图。
图2为本发明实施例2的用户出行意图的预测方法的流程图。
图3为本发明实施例3的用户出行意图的预测系统的模块示意图。
图4为本发明实施例4的用户出行意图的预测系统的模块示意图。
图5为本发明实施例5的电子设备结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供一种用户出行意图的预测方法,参照图1,该预测方法包括以下步骤:
S1、获取用户的若干历史出行订单的历史出行订单数据,历史出行订单数据包括历史订单参数数据和出行类别标签数据;
S2、将每个历史出行订单对应的历史订单参数数据作为输入,对应的出行类别标签数据作为输出,构建用户出行意图预测模型;
S3、获取用户的待处理出行订单数据;
S4、将待处理出行订单数据输入用户出行意图预测模型,输出用于表征用户出行意图的预测结果。
具体地,本实施例的出行类别可以包括因公和因私等。将用户的历史出行订单数据作为训练样本,得到用户出行意图预测模型。需要判断用户某次行程属于因公行程还是因私行程时,将该次行程的订单数据输入用户出行意图预测模型,便可得到用户出行意图的预测结果。
本实施例中,通过构建预测模型,自动预测用户出行意图,有效弥补了现有技术中依赖人工经验、识别率低的缺陷。在商务出行的场景中,商业平台能够有效地识别潜在的高频商务出行用户,并利用营销手段使这些用户以企业身份注册该平台,不仅能够通过专业的服务为这些用户带来更优的出行体验,而且能有效地提高平台用户增长的召回率。
实施例2
参照图2,本实施例的用户出行意图的预测方法是对实施例1的进一步改进。
具体地,在一可实施的方案中,步骤S1包括以下步骤:
S101、获取用户在历史设定时间段内的第一数量的历史出行订单;
S102、对所有历史出行订单进行归类处理,获取属于设定类别的若干历史出行订单和对应的历史出行订单数据。
例如,获取用户在历史设定时间段内共计55个出行订单,对这些出行订单按照所需要的类别进行归类处理,获取属于设定类别的出行订单40个。将归类处理后获取的订单作为训练样本,可以提高预测模型的性能。
在一可实施的方式中,设定类别的若干历史出行订单包括属于同一单次行程的历史出行订单。具体地,基于获取的历史出行订单中的交通订单、住宿订单等订单数据,建立打包一次行程的规则,将符合一次行程打包规则的订单进行打包,得到属于同一单次行程的历史出行订单。一次行程是指用户一次出行从出发到回来的全过程,符合一次行程打包规则的订单是指用户一次出行行程中从开始到结束的所有交通订单、住宿订单等。
通过对所有历史出行订单进行归类处理,获取设定类别如同一单次行程的订单,可以更加准确、有针对性地获取用户出行意图预测模型的训练样本,提高模型预测的准确性,满足用户出行意图预测模型的训练要求。
在一可实施的方式中,步骤S2包括:
S201、获取目标特征数据,目标特征数据用于表征历史订单参数数据中与用户出行相关联的数据;
S202、将同一历史出行订单的目标特征数据作为输入,对应的出行类别标签数据作为输出,构建用户出行意图预测模型。
具体地,目标特征数据可以包括但不限于用户特征数据、行程特征数据、用户行程交叉特征数据等特征数据,其中用户行程交叉特征数据是指用户含机票行程比例、用户含酒店行程比例等综合用户特征和行程特征的交叉特征数据。
通过选取合适的特征数据作为输入对模型进行训练,可以提高预测模型的性能。在商务出行的场景中,选取用户特征数据、行程特征数据、用户行程交叉数据来训练模型,可以更准确地预测用户商务出行的概率,更精确地召回潜在的高频商务出行的用户。
在一可实施的方式中,用户出行意图预测模型基于多个弱学习模型集成训练得到。
集成学习通过组合多个弱监督学习器得到一个更加全面的强监督模型,适合应用于判断用户出行模式的复杂场景,提高商务情景下对用户出行意图预测的准确度,有效挖掘C端潜在的高频商务出行客户。
在一可实施的方式中,用户出行意图预测模型包括XGBoost模型。该算法思想是在每一轮迭代过程中,通过特征分裂来生成一棵树;每新生成一棵树,实际为学习一个新的函数,该函数用于拟合上一轮预测的残差。训练完成后得到K棵子树,每个样本在每棵树种落到对应的某个叶子节点,每个叶子节点对应一个打分,该样本的最终预测值即为其对应每棵树叶子节点的打分总和。
通过XGBoost算法可以进一步提高预测模型的性能。
下面以商务出行的情形为例,对本实施例的方法作具体说明:
(1)构建一次行程算法(一次行程算法是指基于一次行程打包规则编写的算法,用于打包属于同一单次行程的订单数据)
本发明基于旅游场景下用户预定信息,每个预订人包含一个唯一的用户id,以下均表示为uid。本发明的主要目的是识别用户的商务出行意图,即对于一个特定的uid,判断其某次行程是因公行程还是因私行程的概率大小。
本发明的第一方面是构建一次行程算法。所使用的数据源包括:1.机票预定数据表;2.酒店预定数据表;3.其他类别的数据。其中,机票预定数据表包含的主要信息为:起飞城市、到达城市、起飞时间、到达时间、航班号、乘机人等。酒店预定数据表包含的主要信息为:入住城市、开始时间、结束时间、入住人等。
一次行程算法主要流程如下:
1)构建一次行程打包规则
第一步,同一个uid下,合并实际为同一次出行的机票订单。
条件1:机票类型相同、出发城市相同、到达城市相同、首程航班号相同、末程航班号相同,起飞时间相同、到达时间相同。
符合条件1的多笔机票订单,认为是同一次出行,将这些订单的信息进行聚合。聚合后的机票订单,乘机人列表为多个被聚合订单的乘机人列表并集。
第二步,同一个uid下,合并实际为同一次出行的酒店订单。
条件2:两笔订单入住城市相同、入住人相同、前一笔订单离店日期与后一笔订单入住日期相同。
符合条件2的多笔酒店订单,认为是同一次出行,将这些订单的信息进行聚合。聚合后的酒店订单,入住日期、离店日期为聚合后的入住日期与离店日期。
第三步,同一个uid下,将符合为同一次出行的机票订单、酒店订单进行合并打包。
其中,A,B,C代表不同城市,flt代表机票订单,htl代表酒店订单;A→flt→B代表从城市A搭乘飞机到城市B;B(htl)表示在城市B入住了酒店。
情景1:单张单程机票订单与酒店订单关联
情景1.1:A→flt→B(htl),满足以下条件:
机票到达城市=酒店入住城市;
机票到达日期=酒店入住日期或酒店入住日期前一天;
机票出行人与酒店出行人存在交集。
情景1.2:(htl)A→flt→B,满足以下条件:
机票起飞城市=酒店离店城市;
机票起飞日期=酒店离店日期或酒店离店日期后一天;
机票出行人与酒店出行人存在交集。
情景2:多张单程机票订单与酒店订单关联
情景2.1:A→flt→B(htl)→flt→C,满足以下条件:
前后两程酒店订单号相同;
前后两程机票订单号不同;
前一程出发城市与后一程到达城市不同;
前后两程机票出行人存在交集。
情景2.2:A→flt→B(htl)→flt→A,满足以下条件:
前后两程酒店订单号相同;
前后两程机票订单号不同;
前一程出发城市与后一程到达城市相同;
前序机票出行人、酒店出行人、后序机票出行人存在交集。
情景2.3:A(htl)→flt→B(htl),满足以下条件:
前后两程机票订单号相同;
前后两程酒店订单号不同;
前后两程酒店出行人存在交集。
情景3:往返机票订单与酒店订单关联
满足以下条件:
机票到达城市=酒店入住城市;
机票首程起飞日期<=酒店入住日期;
机票末程落地日期>=酒店离店日期;
机票出行人与酒店出行人存在交集。
情景4:纯机票行程
满足以下条件:
行程开始或结束的地点为uid的常驻地;
多程机票前后城市连贯,且期间无酒店订单。
情景5:纯酒店行程
满足以下条件:
多笔酒店入住城市相同;
上一笔酒店离店时间与下一笔酒店入住时间连续。
情景6:单机票/酒店行程
满足以下条件:
该机票订单或酒店订单无法与其他订单进行打包关联。
基于上述的一次行程打包规则,将用户历史出行订单中属于同一单次行程的订单合并打包,获取打包好的一次行程数据,该一次行程数据用于后续的因公因私判断以及模型训练。
(2)构建行程因公因私判断算法
基于一次行程打包算法,从同一用户uid下的若干历史订单数据中筛选出打包好的一次行程数据。对于一次行程数据,基于以下规则,判断其出行性质是因公出行行程或因私出行行程。
规则1:该行程下的订单数据中若含有“因公出行”标识,则确定本次行程为因公行程。
规则2:该行程下的订单数据中不含有“因公出行”标识,且满足以下任一条件,则确定本次行程为因私行程。
1)行程开始与结束期间,出行人有度假类订单;
2)行程包含18岁以下或70岁以上的出行人;
3)行程包含身份为学生的出行人;
4)行程的出发地或目的地包含出行人家庭所在地城市;
当然,也可以根据实际需求设置相应的判断规则,对一次行程数据添加“因私出行”或其他出行意图的标签。
(3)基于商务出行场景下的特殊行为模式构建数据特征
3.1用户特征数据
基于用户属性及近一年的机票预定、酒店预定数据,按不同维度进行统计。统计维度包括:
1)用户会员等级、用户常住地城市等。
2)近一年机票订单数量、近一年机票平均出行人数、近一年机票订单金额、近一年机票出发城市离散度、近一年机票到达城市离散度、近一年机票索要行程单比例、近一年机票行程单邮寄城市离散度、近一年机票出发城市为商务出行热门城市的比例、近一年机票到达城市为商务出行热门城市的比例;近一个月机票订单数量、近一个月机票平均出行人数、近一个月机票订单金额等。
3)近一年酒店订单数量、近一年酒店平均入住房间数量、近一年酒店平均入住人数、近一年酒店订单金额、近一年酒店入住城市离散度、近一年酒店入住城市为商务出行热门城市的比例;近一个月酒店订单数量、近一个月酒店平均入住房间数量、近一个月酒店平均入住人数、近一个月酒店订单金额等。
3.2行程特征数据
基于打包后并经过因公因私判断后的一次行程数据,按不同维度进行统计。统计维度包括:
1)行程开始日期、行程结束日期、出行人数、出行人年龄最大值、出行人年龄最小值、行程出发城市、行程目的地城市、出行人是否包含订单预订人、是否单人出行、行程天数、行程是否包含节假日、行程工作日占比、行程开始或结束日期是否为工作日、行程是否包含机票订单、行程是否包含酒店订单、行程出发地或目的地是否为预订人常住地、行程出发地或目的地是否为商务出行热门城市等。
2)行程中机票提前预定天数、行程中机票金额、行程中机票是否邮寄行程单、行程中机票起飞时间和到达时间的类型(早、中、晚、凌晨)、行程中酒店综合评分、行程中酒店是否包含早餐、行程中酒店入住天数、行程中酒店金额、行程中酒店是否为度假酒店等。
3.3用户行程交叉特征数据
基于用户近两年的所有一次行程数据,按不同维度进行统计。统计维度包括:
1)用户最近一周是否有因公行程、用户最近一个月是否有因公行程、用户最近三个月是否有因公行程、用户最近半年是否有因公行程、用户最近一年是否有因公行程、用户最近两年是否有因公行程等。
2)用户最近一次因公行程距今天数、用户近两年行程总数、用户近两年纯工作日行程比例、用户近两年行程开始或结束日期为工作日的行程比例、用户近两年包含节假日的行程比例、用户近两年单人出行的行程比例、用户行程的平均出行天数、用户含机票的行程比例、用户含酒店的行程比例、用户含机票和酒店的行程比例、用户目的地不为常住地的行程比例等。
(4)基于集成学习方法训练识别用户出行意图的机器学习模型
判断用户一次出行的可能为商务出行的概率,当应用了监督学习算法时,目标是训练得到一个稳定且各方面表现较好的模型,能够准确对用户的行程进行分类。然而一次行程所包含的特征数据维度较为复杂,因此利用非线性模型能够更好地拟合复杂数据的分布,并具有较好的泛化性。集成学习通过组合多个弱监督学习器以期得到一个更加全面的强监督模型,适合应用于判断用户出行模式的复杂情景。
本实施例采用集成学习中的XGBoost模型进行二分类任务,该算法思想是在每一轮迭代过程中,通过特征分裂来生成一棵树;每新生成一棵树,实际为学习一个新的函数,该函数用于拟合上一轮预测的残差。训练完成后得到K棵子树,每个样本在每棵树种落到对应的某个叶子节点,每个叶子节点对应一个打分,该样本的最终预测值即为其对应每棵树叶子节点的打分总和。在XGBoost中,通过对损失函数进行二阶泰勒展开,从而求取梯度。对基于上述内容如何实现训练XGBoost模型属于本领域技术人员能够知晓的内容,故在此不再赘述。
本实施例中,通过订单归类、特征数据提取、集成学习等步骤,进一步提高了用户出行意图预测模型的准确性,更好地适应商务出行情景中用户出行行程的复杂性,准确有效地识别出潜在的高频商务出行用户,为这些用户提供更优的出行体验,提高平台的用户召回率。
实施例3
本实施例提供一种用户出行意图的预测系统。参照图3,本实施例的用户出行意图预测系统包括:
历史订单数据获取模块1,用于获取用户的若干历史出行订单的历史出行订单数据;
其中,所述历史出行订单数据包括历史订单参数数据和出行类别标签数据;
模型构建模块2,用于将每个历史出行订单对应的历史订单参数数据作为输入,对应的出行类别标签数据作为输出,构建用户出行意图预测模型;
待处理订单数据获取模块3,用于获取用户的待处理出行订单数据;
预测模块4,用于将待处理出行订单数据输入用户出行意图预测模型,输出用于表征用户出行意图的预测结果。
由于本实施例中的用户出行意图预测系统与实施例1中的用户出行意图的预测方法的实现原理类似,故在此不再赘述。
本实施例中提供的用户出行意图的预测系统,有效弥补了现有技术中依赖人工经验、识别率低的缺陷。在商务出行的场景中,商业平台能够有效地识别潜在的高频商务出行用户,并利用营销手段使这些用户以企业身份注册该平台,不仅能够通过专业的服务为这些用户带来更优的出行体验,而且能有效地提高平台用户增长的召回率。
实施例4
在实施例3的基础上,参照图4,本实施例提供一种用户出行意图的预测系统。
在一可实施的方式中,历史订单数据获取模块1包括历史数据获取单元101,用于获取用户在历史设定时间段内的第一数量的历史出行订单;还包括归类处理单元102,用于对所有历史出行订单进行归类处理,获取属于设定类别的若干历史出行订单和对应的历史出行订单数据。
具体地,归类处理单元102可以用于对所有历史出行订单进行归类处理,获取属于同一单次行程的历史出行订单数据。
在一可实施的方式中,模型构建模块2包括特征数据获取单元201,用于获取目标特征数据;还包括模型构建单元202,用于将同一历史出行订单的目标特征数据作为输入,对应的出行类别标签数据作为输出,构建用户出行意图预测模型。
具体地,目标特征数据可以包括但不限于用户特征数据、行程特征数据、用户行程交叉特征数据等特征数据,其中,用户行程交叉特征数据是指用户含机票行程比例、用户含酒店行程比例等综合用户特征和行程特征的交叉特征数据。
在一可实施的方式中,模型构建模块2采用多个弱学习模型进行集成训练。具体地,集成训练模型可采用XGBoost模型。
由于本实施例中的用户出行意图的预测系统与实施例2中的用户出行意图的预测方法的实现原理类似,故在此不再赘述。
本实施例中提供的用户出行意图的预测系统,进一步提高了用户出行意图预测模型的准确性,更好地适应商务出行情景中用户出行行程的复杂性,准确有效地识别出潜在的高频商务出行用户,为这些用户提供更优的出行体验,提高平台的用户召回率。
实施例5
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例1-2中任一实施例提供的用户出行意图的预测方法。
如图5所示,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1-2中任一实施例所提供的用户出行意图的预测方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例6
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1-2中任一实施例所提供的用户出行意图的预测方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1-2中任一实施例所述的用户出行意图的预测方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (10)

1.一种用户出行意图的预测方法,其特征在于,所述预测方法包括以下步骤:
获取用户的若干历史出行订单的历史出行订单数据;
其中,所述历史出行订单数据包括历史订单参数数据和出行类别标签数据;
将每个所述历史出行订单对应的所述历史订单参数数据作为输入,对应的所述出行类别标签数据作为输出,构建用户出行意图预测模型;
获取用户的待处理出行订单数据;
将所述待处理出行订单数据输入所述用户出行意图预测模型,输出用于表征用户出行意图的预测结果。
2.如权利要求1所述的用户出行意图的预测方法,其特征在于,所述获取用户的若干历史出行订单的历史出行订单数据的步骤还包括:
获取用户在历史设定时间段内的第一数量的所述历史出行订单;
对所有所述历史出行订单进行归类处理,获取属于设定类别的若干所述历史出行订单和对应的所述历史出行订单数据。
3.如权利要求2所述的用户出行意图的预测方法,其特征在于,所述设定类别的若干所述历史出行订单包括属于同一单次行程的所述历史出行订单。
4.如权利要求1-3中任一项所述的用户出行意图的预测方法,其特征在于,所述将每个所述历史出行订单对应的所述历史订单参数数据作为输入,对应的所述出行类别标签数据作为输出,构建用户出行意图预测模型的步骤包括:
获取目标特征数据,所述目标特征数据用于表征所述历史订单参数数据中与用户出行相关联的数据;
将同一所述历史出行订单的所述目标特征数据作为输入,对应的所述出行类别标签数据作为输出,构建所述用户出行意图预测模型。
5.如权利要求4所述的用户出行意图的预测方法,其特征在于,所述目标特征数据包括用户特征数据、行程特征数据和用户行程交叉特征数据中的至少一种。
6.如权利要求1所述的用户出行意图的预测方法,其特征在于,所述用户出行意图预测模型基于多个弱学习模型集成训练得到。
7.如权利要求6所述的用户出行意图的预测方法,其特征在于,所述用户出行意图预测模型包括XGBoost模型。
8.一种用户出行意图的预测系统,其特征在于,所述系统包括:
历史订单数据获取模块,用于获取用户的若干历史出行订单的历史出行订单数据;
其中,所述历史出行订单数据包括历史订单参数数据和出行类别标签数据;
模型构建模块,用于将每个历史出行订单对应的历史订单参数数据作为输入,对应的出行类别标签数据作为输出,构建用户出行意图预测模型;
待处理订单数据获取模块,用于获取用户的待处理出行订单数据;
预测模块,用于将待处理出行订单数据输入用户出行意图预测模型,输出用于表征用户出行意图的预测结果。
9.一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,其特征在于,所述的处理器执行所述计算机程序时实现权利要求1-7中任一项所述的用户出行意图的预测方法。
10.一种计算机可读存储介质,存储计算机程序,其特征在于,所述的计算机程序被处理器执行时实现权利要求1-7中任一项所述的用户出行意图的预测方法。
CN202210187790.3A 2022-02-28 2022-02-28 用户出行意图的预测方法、系统、电子设备和存储介质 Pending CN114626879A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210187790.3A CN114626879A (zh) 2022-02-28 2022-02-28 用户出行意图的预测方法、系统、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210187790.3A CN114626879A (zh) 2022-02-28 2022-02-28 用户出行意图的预测方法、系统、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN114626879A true CN114626879A (zh) 2022-06-14

Family

ID=81899787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210187790.3A Pending CN114626879A (zh) 2022-02-28 2022-02-28 用户出行意图的预测方法、系统、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114626879A (zh)

Similar Documents

Publication Publication Date Title
Zhang et al. A feature selection and multi-model fusion-based approach of predicting air quality
CN104169950B (zh) 利用面向批处理的计算的数据库系统
Balmer Travel demand modeling for multi-agent transport simulations: Algorithms and systems
CN106651213B (zh) 服务订单的处理方法及装置
CN106407208A (zh) 一种城市管理本体知识库的构建方法及系统
CN110442715A (zh) 一种基于多元大数据的综合城市地理语义挖掘方法
CN112948412B (zh) 航班库存更新方法、系统、电子设备和存储介质
CN109739965B (zh) 跨领域对话策略的迁移方法及装置、设备、可读存储介质
CN112905868A (zh) 事件抽取方法、装置、设备及存储介质
CN112651671A (zh) 一种航班舱位调整方法及相关设备
Ripoll-Zarraga et al. Exploring the reasons for efficiency in Spanish airports
Ding et al. Two-stage travel itinerary recommendation optimization model considering stochastic traffic time
CN114626879A (zh) 用户出行意图的预测方法、系统、电子设备和存储介质
Sun et al. Automatic building age prediction from street view images
CN105654340A (zh) 旅客真实航程的确定方法及系统
CN111310961A (zh) 数据预测方法、装置、电子设备和计算机可读存储介质
CN115577190A (zh) 一种游客行为数据提取方法
CN114997414A (zh) 数据处理方法、装置、电子设备和存储介质
CN111062555B (zh) 城市画像的构建方法、装置、介质及电子设备
Liu et al. Optimizing the ground intra-city express delivery network: An integrated multiple centrality assessment, multi-criteria decision-making, and multi-objective integer programming model
CN112926809B (zh) 一种基于聚类和改进的xgboost的航班流量预测方法及系统
CN114565188A (zh) 用户出行意图的预测方法、系统、电子设备和存储介质
Lv et al. Ride-sharing matching of commuting private car using reinforcement learning
KR101979242B1 (ko) 건설 지식 허브 센터의 지식 제공 방법
Guan et al. Intelligent recommendation method for personalised tourist attractions based on cloud computing technology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination