CN111310961A - 数据预测方法、装置、电子设备和计算机可读存储介质 - Google Patents
数据预测方法、装置、电子设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN111310961A CN111310961A CN201811519937.4A CN201811519937A CN111310961A CN 111310961 A CN111310961 A CN 111310961A CN 201811519937 A CN201811519937 A CN 201811519937A CN 111310961 A CN111310961 A CN 111310961A
- Authority
- CN
- China
- Prior art keywords
- service
- order
- target
- information
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012545 processing Methods 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims description 119
- 238000012216 screening Methods 0.000 claims description 37
- 238000000605 extraction Methods 0.000 claims description 22
- 238000010801 machine learning Methods 0.000 claims description 19
- 238000010606 normalization Methods 0.000 claims description 8
- 238000013136 deep learning model Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种数据预测方法、装置、电子设备和计算机可读存储介质,其中,该方法包括:获取服务请求方的历史服务订单的订单数据,其中,历史服务订单为第一目标时间段之前服务请求方发起的服务订单;提取订单数据中的特征信息,得到订单特征信息;利用目标预测模型对订单特征信息进行处理,以预测服务请求方在未来的第二目标时间段内去往目标场景的概率值,其中,第二目标时间段为第一目标时间段之后的时间段。本申请实施例通过目标预测模型对订单特征信息进行处理之后,能够预测服务提供方在未来一段时间段去往目标场景的概率,从而解决现有的网约车平台智能化程度较低的技术问题。
Description
技术领域
本申请涉及互联网的技术领域,具体而言,涉及一种数据预测方法、装置、电子设备和计算机可读存储介质。
背景技术
目前,随着互联网技术的快速发展,网约车也逐渐在人们的生活中开始普及。网约车平台中一般包含快车服务、拼车服务、出租车服务、顺风车服务、专车服务等多种服务。用户在使用网约平台发起服务订单时,可根据自身需求的不同选择不同的服务。例如,有的人出行的场景是机场,有的人出行的场景是酒店,每个人的出行需求不同,使用的网约车服务也不相同。在现有的网约车平台中,只能在服务请求方发起服务订单时,根据服务请求方发起的服务订单中的目的位置为该服务请求方提供相应的服务。
随着人们生活水平的提高,以及各个服务领域服务水平的提高,网约车平台的传统服务模式已经无法满足人们的正常服务需求。因此,对网约车平台进行优化是必不可少的。
发明内容
有鉴于此,本申请实施例的目的在于提供一种数据预测方法、装置、电子设备和计算机可读存储介质,通过目标预测模型对订单特征信息进行处理之后,能够预测服务请求方在未来一段时间段去往目标场景的概率,从而解决现有的网约车平台智能化程度较低的技术问题。
根据本申请的一个方面,提供一种电子设备,可以包括一个或多个存储介质和一个或多个与存储介质通信的处理器。一个或多个存储介质存储有处理器可执行的机器可读指令。当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行所述机器可读指令,以执行一个或多个以下操作:
获取服务请求方的历史服务订单的订单数据,其中,所述历史服务订单为第一目标时间段之前所述服务请求方发起的服务订单;提取所述订单数据中的特征信息,得到订单特征信息;所述订单特征信息包括以下至少一种:服务请求方的属性特征信息,服务订单的特征信息,服务订单的场景特征信息,服务请求方的实时位置;利用目标预测模型对所述订单特征信息进行处理,以预测所述服务请求方在未来的第二目标时间段内去往目标场景的概率值,其中,所述第二目标时间段为所述第一目标时间段之后的时间段。
在本申请较佳的实施例中,所述方法还包括:若所述概率值大于或者等于预设概率值,则将所述服务请求方添加至待推送名单集合中;在所述待推送名单集合中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息,其中,所述目标引导信息用于引导服务请求方发起服务订单。
在本申请较佳的实施例中,在所述待推送名单集合中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息包括:按照预设筛选规则从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。
在本申请较佳的实施例中,按照预设筛选规则从所述待推送名单集合中选择一个或多个服务请求方包括:按照所述待推送名单集合各个服务请求方所对应的概率值,从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。
在本申请较佳的实施例中,向所选择的服务请求方发送目标引导信息包括:向所选择的服务请求方发送服务订单的优惠信息,以通过所述优惠信息引导所述服务请求方发起服务订单。
在本申请较佳的实施例中,所述订单特征包括服务请求方的属性特征信息;提取所述历史服务订单的订单数据中的特征信息包括:按照目标字段从所述历史服务订单的订单数据中提取所述服务请求方的属性特征信息,其中,所述目标字段包括以下至少之一:性别、年龄、消费水平和信用等级;或者,从数据平台中提取所述服务请求方的属性特征信息。
在本申请较佳的实施例中,所述订单特征包括服务订单的特征信息;提取所述历史服务订单的订单数据中的特征信息包括:按照所述历史服务订单的订单类型对所述订单数据进行分类处理,得到多组历史服务订单,其中,所述订单类型为历史服务订单中服务提供方用于为服务请求方提供服务的车辆服务类型确定的;统计每组历史服务订单中的订单数量,并将所述订单数量作为所述服务订单的特征信息。
在本申请较佳的实施例中,所述订单特征包括服务订单的场景特征信息;提取所述历史服务订单的订单数据中的特征信息包括:提取所述历史服务订单的订单数据中的POI数据;基于所述POI数据确定各个历史服务订单的出行场景信息;基于所述出行场景信息对所述历史服务订单进行分类,得到各个出行场景信息所对应的历史服务订单;对所述各个出行场景信息所对应的历史服务订单的数量进行归一化处理,并将归一化处理之后的数据作为所述服务订单的场景特征信息。
在本申请较佳的实施例中,所述订单特征包括服务请求方的实时位置;提取所述历史服务订单的订单数据中的特征信息包括:获取服务请求方所属服务请求方终端中定位装置的定位信息,并将所述定位信息作为所述服务请求方的实时位置。
在本申请较佳的实施例中,所述方法还包括:获取训练样本集,其中,所述训练样本集中包括多个训练样本,且历史服务请求方对应一个或多个训练样本,每个训练样本包括:在特定时间段之前历史服务请求方的历史订单特征信息和标签信息,所述标签信息用于表征在特定时间段之后,所述历史服务请求方发起的服务订单中是否包含去往目标场景的服务订单;利用训练样本集训练机器学习模型,得到所述目标预测模型,其中,所述机器学习模型包括:集成树模型或者深度学习模型。
在本申请较佳的实施例中,获取训练样本集包括:确定筛选时间段;在订单平台中筛选所述筛选时间段之前的目标服务订单,其中,所述目标服务订单的服务终点为所述目标场景;基于所述目标服务订单确定所述训练样本集。
在本申请较佳的实施例中,基于所述目标服务订单确定所述训练样本集包括:在所述目标服务订单中确定所属于每个历史服务请求方的服务订单,得到多个目标服务订单组;对每个所述目标服务订单组进行特征提取,得到所述训练样本;将每个历史服务请求方所对应的训练样本作为所述训练样本集。
在本申请较佳的实施例中,通过以下方式确定每个训练样本的标签信息,具体包括:统计所述筛选时间段之后所述历史服务请求方发起的目标服务订单;从所述目标服务订单中提取目的服务位置;根据所述目的服务位置的POI类型判断所述目的服务位置所属的场景类型;若所述目的服务位置所属的场景类型为所述目标场景,则将所述历史服务请求所对应的训练样本的标签信息设置为第一标签信息,其中,所述第一标签信息表示历史服务请求方发起的服务订单中包含去往目标场景的服务订单;若所述目的服务位置所属的场景类型不是所述目标场景,将所述历史服务请求所对应的训练样本的标签信息设置为第二标签信息,其中,所述第二标签信息表示历史服务请求方发起的服务订单中不包含去往目标场景的服务订单。
根据本申请的另一个方面,还提供一种数据预测装置,包括:第一获取单元,用于获取服务请求方的历史服务订单的订单数据,其中,所述历史服务订单为第一目标时间段之前所述服务请求方发起的服务订单;特征提取单元,用于提取所述订单数据中的特征信息,得到订单特征信息;所述订单特征信息包括以下至少一种:服务请求方的属性特征信息,服务订单的特征信息,服务订单的场景特征信息,服务请求方的实时位置;处理单元,用于利用目标预测模型对所述订单特征信息进行处理,以预测所述服务请求方在未来的第二目标时间段内去往目标场景的概率值,其中,所述第二目标时间段为所述第一目标时间段之后的时间段。
在本申请较佳的实施例中,所述装置还包括:添加单元,用于若所述概率值大于或者等于预设概率值,则将所述服务请求方添加至待推送名单集合中;选择和发送单元,用于在所述待推送名单集合中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息,其中,所述目标引导信息用于引导服务请求方发起服务订单。
在本申请较佳的实施例中,所述选择和发送单元用于:按照预设筛选规则从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。
在本申请较佳的实施例中,所述选择和发送单元还用于:按照所述待推送名单集合各个服务请求方所对应的概率值,从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。
在本申请较佳的实施例中,所述选择和发送单元还用于:向所选择的服务请求方发送服务订单的优惠信息,以通过所述优惠信息引导所述服务请求方发起服务订单。
在本申请较佳的实施例中,所述订单特征包括服务请求方的属性特征信息;所述特征提取单元用于:按照目标字段从所述历史服务订单的订单数据中提取所述服务请求方的属性特征信息,其中,所述目标字段包括以下至少之一:性别、年龄、消费水平和信用等级;或者,从数据平台中提取所述服务请求方的属性特征信息。
在本申请较佳的实施例中,所述订单特征包括服务订单的特征信息;所述特征提取单元用于:按照所述历史服务订单的订单类型对所述订单数据进行分类处理,得到多组历史服务订单,其中,所述订单类型为历史服务订单中服务提供方用于为服务请求方提供服务的车辆服务类型确定的;统计每组历史服务订单中的订单数量,并将所述订单数量作为所述服务订单的特征信息。
在本申请较佳的实施例中,所述订单特征包括服务订单的场景特征信息;所述特征提取单元用于:提取所述历史服务订单的订单数据中的POI 数据;基于所述POI数据确定各个历史服务订单的出行场景信息;基于所述出行场景信息对所述历史服务订单进行分类,得到各个出行场景信息所对应的历史服务订单;对所述各个出行场景信息所对应的历史服务订单的数量进行归一化处理,并将归一化处理之后的数据作为所述服务订单的场景特征信息。
在本申请较佳的实施例中,所述订单特征包括服务请求方的实时位置;所述特征提取单元用于:获取服务请求方所属服务请求方终端中定位装置的定位信息,并将所述定位信息作为所述服务请求方的实时位置。
在本申请较佳的实施例中,所述装置还包括:第二获取单元,用于获取训练样本集,其中,所述训练样本集中包括多个训练样本,且历史服务请求方对应一个或多个训练样本,每个训练样本包括:在特定时间段之前历史服务请求方的历史订单特征信息和标签信息,所述标签信息用于表征在特定时间段之后,所述历史服务请求方发起的服务订单中是否包含去往目标场景的服务订单;训练单元,用于利用训练样本集训练机器学习模型,得到所述目标预测模型,其中,所述机器学习模型包括:集成树模型或者深度学习模型。
在本申请较佳的实施例中,所述第二获取单元用于:确定筛选时间段;在订单平台中筛选所述筛选时间段之前的目标服务订单,其中,所述目标服务订单的服务终点为所述目标场景;基于所述目标服务订单确定所述训练样本集。
在本申请较佳的实施例中,所述第二获取单元还用于:在所述目标服务订单中确定所属于每个历史服务请求方的服务订单,得到多个目标服务订单组;对每个所述目标服务订单组进行特征提取,得到所述训练样本;将每个历史服务请求方所对应的训练样本作为所述训练样本集。
在本申请较佳的实施例中,所述装置通过以下方式确定每个训练样本的标签信息,具体包括:统计所述筛选时间段之后所述历史服务请求方发起的目标服务订单;从所述目标服务订单中提取目的服务位置;根据所述目的服务位置的POI类型判断所述目的服务位置所属的场景类型;若所述目的服务位置所属的场景类型为所述目标场景,则将所述历史服务请求所对应的训练样本的标签信息设置为第一标签信息,其中,所述第一标签信息表示历史服务请求方发起的服务订单中包含去往目标场景的服务订单;若所述目的服务位置所属的场景类型不是所述目标场景,将所述历史服务请求所对应的训练样本的标签信息设置为第二标签信息,其中,所述第二标签信息表示历史服务请求方发起的服务订单中不包含去往目标场景的服务订单。
根据本申请的另一个方面,还提供一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如上述中任一所述的数据预测方法的步骤。
根据本申请的另一个方面,还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述中任一所述的数据预测方法的步骤。
在本申请中,首先获取服务请求方的历史服务订单的订单数据;然后,提取订单数据中的特征信息,得到订单特征信息;最后,利用目标预测模型对订单特征信息进行处理,以预测服务请求方在第二目标时间段内去往目标场景的概率值。在本实施例中,通过目标预测模型对订单特征信息进行处理之后,能够预测服务请求方在未来一段时间段去往目标场景的概率,从而解决现有的网约车平台智能化程度较低的技术问题。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请一些实施例的数据预测系统100的框图;
图2示出了示出了本申请实施例所提供的一种电子设备200的示意图;
图3示出了示出了本申请实施例所提供的一种数据预测方法的流程图;
图4示出了示出了本申请实施例所提供的第一种可选地数据预测方法的流程图;
图5示出了示出了本申请实施例所提供的第二种可选地数据预测方法的流程图;
图6示出了示出了本申请实施例所提供的第三种可选地数据预测方法的流程图;
图7示出了示出了本申请实施例所提供的第四种可选地数据预测方法的流程图;
图8示出了示出了本申请实施例所提供的一种数据预测装置的示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“网约车场景”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕网约车场景进行描述,但是应该理解,这仅是一个示例性实施例。本申请可以应用于任何其他交通运输类型。例如,本申请可以应用于不同的运输系统环境,包括陆地,海洋,或航空等,或其任意组合。运输系统的交通工具可以包括出租车、私家车、顺风车、公共汽车等,或其任意组合。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
图1是本申请一些实施例的数据预测系统100的框图。例如,数据预测系统100可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。数据预测系统100可以包括服务器110、网络120、服务请求方终端130、服务提供方终端140和数据库150中的一种或多种,服务器110 中可以包括执行指令操作的处理器。
在一些实施例中,服务器110可以是单个服务器,也可以是服务器组。服务器组可以是集中式的,也可以是分布式的(例如,服务器110可以是分布式系统)。在一些实施例中,服务器110相对于终端,可以是本地的、也可以是远程的。在一些实施例中,服务器110可以在具有本申请中图2 所示的一个或多个组件的电子设备200上实现。
网络120可以用于信息和/或数据的交换。在一些实施例中,数据预测系统100中的一个或多个组件(例如,服务器110,服务请求方终端130,服务提供方终端140和数据库150)可以向其他组件发送信息和/或数据。
在一些实施例中,服务请求方终端130的用户可以是除服务实际需求者之外的其他人。在一些实施例中,服务提供方终端140的用户可以是服务实际提供者,也可以是除服务实际提供者之外的其他人。
在一些实施例中,服务请求方终端130可以包括移动设备、平板计算机、膝上型计算机、或机动车辆中的内置设备等,或其任意组合。
在一些实施例中,服务提供方终端140可以是与服务请求方终端130 类似或相同的设备。在一些实施例中,服务提供方终端140可以是具有定位技术的设备,用于定位服务提供方和/或服务提供方终端的位置。
在一些实施例中,服务请求方终端130和/或服务提供方终端140可以与其他定位设备通信以确定服务请求方、服务请求方终端130、服务提供方、或服务提供方终端140、或其任意组合的位置。在一些实施例中,服务请求方终端130和/或服务提供方终端140可以将定位信息发送给服务器110。
在一些实施例中,数据库150可以存储从服务请求方终端130和/或服务提供方终端140获得的数据。在一些实施例中,数据库150可以存储在本申请中描述的示例性方法的数据和/或指令。在一些实施例中,数据库150 可以包括大容量存储器、可移动存储器、易失性读写存储器、或只读存储器(Read-Only Memory,ROM)等,或其任意组合。
图2示出根据本申请的一些实施例的可以实现本申请思想的服务器110、服务请求方终端130、服务提供方终端140的电子设备200的示例性硬件和软件组件的示意图。例如,处理器可以用于电子设备200上,并且用于执行本申请中的功能。
电子设备200可以是通用计算机或特殊用途的计算机,两者都可以用于实现本申请的数据预测方法。本申请尽管仅示出了一个计算机,但是为了方便起见,可以在多个类似平台上以分布式方式实现本申请描述的功能,以均衡处理负载。
例如,电子设备200可以包括连接到网络的网络端口210、用于执行程序指令的一个或多个处理器220、通信总线230、和不同形式的存储介质240,例如,磁盘、ROM、或RAM,或其任意组合。示例性地,计算机平台还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备200 还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出 (Input/Output,I/O)接口250。
为了便于说明,在电子设备200中仅描述了一个处理器。然而,应当注意,本申请中的电子设备200还可以包括多个处理器,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若电子设备200的处理器执行步骤A和步骤B,则应该理解,步骤A 和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,第一处理器执行步骤A,第二处理器执行步骤B,或者第一处理器和第二处理器共同执行步骤A和B。
参见图3所示的一种数据预测方法的流程图。
图3所示的数据预测方法以应用在服务器端为例进行说明,该方法包括如下步骤:
步骤S302,获取服务请求方的历史服务订单的订单数据,其中,所述历史服务订单为第一目标时间段之前所述服务请求方发起的服务订单。
在本实施例中,第一目标时间段为预先设置的,例如,可以设置每隔一段时间段获取一次服务请求方的历史服务订单。
例如,设置每隔一天获取一次服务请求方的历史服务订单。例如,2018 年6月1日(即,上述第一目标时间段),获取2018年6月1日00:00之前服务请求方的历史服务订单;获取2018年6月2日00:00之前服务请求方的历史服务订单,以此类推,按照上述方式获取服务请求方的历史服务订单。
步骤S304,提取所述订单数据中的特征信息,得到订单特征信息;所述订单特征信息包括以下至少一种:服务请求方的属性特征信息,服务订单的特征信息,服务订单的场景特征信息,服务请求方的实时位置。
在本实施例中,在获取到历史服务订单的订单数据之后,就可以提取订单数据中的特征信息。提取到的特征信息中包括服务请求方的属性特征信息,例如,服务请求方的年龄,性别,消费能力和信用等级等等,具体将在下述实施例中进行介绍。提取到的特征信息中还包括服务订单的特征信息,例如,包括服务请求方在出租车、快车、拼车、专车等不同服务窗口下的服务订单情况,即服务请求方过去打过多少车、专车单有多少、快车单有多少等,具体将在下述实施例中进行介绍。提取到的特征信息中还包括服务订单的场景特征信息,该场景特征信息为服务请求方的出行场景特征,具体将在下述实施例中进行介绍。提取到的特征信息中还包括服务请求方的实时位置。
步骤S306,利用目标预测模型对所述订单特征信息进行处理,以预测所述服务请求方在未来的第二目标时间段内去往目标场景的概率值,其中,所述第二目标时间段为所述第一目标时间段之后的时间段。
在本实施例中,目标预测模型为预先训练好的预测模型,该目标预测模型的输出为服务请求方在未来的第二目标时间段内去往目标场景的概率值。其中,第二目标时间段为第一目标时间段之后,未来的一段时间。具体,第二时间段的长短可以根据实际需要来进行设定,本实施例不做具体限定。
上述目标场景用户可以根据实际需要来进行不同的设定,且目标场景可以设置为一个,还可以设置为多个。例如,可以设置目标场景为酒店或者旅馆,还可以设置目标场景为酒店(或者旅馆)和机场等,对此,本实施例中不做具体限定。
在本申请中,首先获取服务请求方的历史服务订单的订单数据;然后,提取订单数据中的特征信息,得到订单特征信息;最后,利用目标预测模型对订单特征信息进行处理,以预测服务请求方在第二目标时间段内去往目标场景的概率值。在本实施例中,通过目标预测模型对订单特征信息进行处理之后,能够预测服务请求方在未来一段时间段去往目标场景的概率,从而解决现有的网约车平台智能化程度较低的技术问题。
通过上述描述可知,在本实施例中,首先,获取服务请求方的历史服务订单的订单数据,然后,提取订单数据中的特征信息,得到订单特征信息。
在一个可选的实施方式中,若订单特征包括服务请求方的属性特征信息;那么步骤S304,提取所述历史服务订单的订单数据中的特征信息包括如下步骤:
步骤S11,按照目标字段从所述历史服务订单的订单数据中提取所述服务请求方的属性特征信息,其中,所述目标字段包括以下至少之一:性别、年龄、消费水平和信用等级;或者
步骤S12,从数据平台中提取所述服务请求方的属性特征信息。
也就是说,在本实施例中,可以通过两种方式获取服务请求方的属性特征信息。
第一种方式为:预先设定目标字段,该目标字段与服务请求方的属性特征信息相对应,例如,想要提取到的属性特征信息为:年龄,性别,消费水平和信用等级,那么可以将目标字段设置为与上述属性特征信息相关联的字段信息。然后,按照设定好的目标字段提取服务请求方的属性特征信息。
第二种方式为:直接从数据平台中提取服务请求方的属性特征信息。数据平台中已经预先提取到服务请求方的属性特征信息。在执行上述步骤 S304时,可以直接从数据平台中提取该属性特征信息。
需要说明的是,在本实施例中,数据平台中存储的属性特征信息按照预定更新频率进行更新,以保证获取到最新的属性特征信息。
通过上述描述可知,采用上述第二种方式获取属性特征信息,能够简化上述步骤S302至步骤S306的执行过程,节省服务器端的计算时间,从而提高数据处理的效率。
在另一个可选的实施方式中,若订单特征包括服务订单的特征信息;那么步骤S304,提取所述历史服务订单的订单数据中的特征信息包括如下步骤:
步骤S21,按照所述历史服务订单的订单类型对所述订单数据进行分类处理,得到多组历史服务订单,其中,所述订单类型为历史服务订单中服务提供方用于为服务请求方提供服务的车辆服务类型确定的;
步骤S22,统计每组历史服务订单中的订单数量,并将所述订单数量作为所述服务订单的特征信息。
在本实施例中,对服务订单按照订单类型进行了分类,其中,订单类型可以基于车辆的服务类型来确定。例如,该车辆的服务类型为:快车服务、拼车服务、出租车服务、顺风车服务、专车服务。也就是说,在本实施例中,可以按照上述车辆服务类型为历史服务订单进行分类。
在按照上述分类方式对历史服务订单进行分类之后,就可以得到多组历史服务订单。例如,订单类型为快车服务的历史服务订单,订单类型为拼车服务的历史服务订单,订单类型为出租车服务的历史服务订单,订单类型为顺风车服务的历史服务订单,订单类型为专车服务的历史服务订单。
在得到多组历史服务订单之后,就可以统计每组历史服务订单中的订单数量,并将订单数量作为服务订单的特征信息。例如,统计得到的订单数量可以为:服务请求方获取发起过多少服务订单,在发起的服务订单中订单类型为快车服务的服务订单的数量,以及订单类型为拼车服务的服务订单的数量,以及订单类型为出租车服务的服务订单的数量等等。
通过上述描述可知,在本实施例中,通过上述处理方式对历史服务订单的订单数据进行解析的方式,能够提取订单数据中更详细的特征信息。在利用提取到的该特征信息进行数据预测时,能够得到更加准确的预测结果。
在另一个可选的实施方式中,若订单特征包括服务订单的场景特征信息;,那么提取所述历史服务订单的订单数据中的特征信息包括如下步骤:
步骤S31,提取所述历史服务订单的订单数据中的POI数据;
步骤S32,基于所述POI数据确定各个历史服务订单的出行场景信息;
步骤S33,基于所述出行场景信息对所述历史服务订单进行分类,得到各个出行场景信息所对应的历史服务订单;
步骤S34,对所述各个出行场景信息所对应的历史服务订单的数量进行归一化处理,并将归一化处理之后的数据作为所述服务订单的场景特征信息。
在本实施例中,在历史服务订单的订单数据中,包含兴趣点(Point Of Interest,POI)数据。POI数据是订单数据中当前位置信息的重要载体,通过该POI数据能够反映各个历史服务订单的出行场景信息。
基于此,在本实施例中,可以从订单数据中提取POI数据。然后,按照POI数据确定各个历史服务订单的出行场景信息,以及各种出行场景信息的分布情况。例如,历史服务订单中出行场景为通勤、旅游、商务、逛街、出差等的分布情况。又例如,历史服务订单中出行起终点(包括起始点和终点)为医院,小区,写字楼,车站和机场等的分布情况。
为了得到上述分布情况,在本实施例中,可以基于POI数据确定各个历史服务订单的出行场景信息,其中,出行场景信息包括:通勤、旅游、商务、逛街、出差等,以及历史服务订单中出行起终点等信息。之后,基于出行场景信息对历史服务订单进行分类,得到各个出行场景信息所对应的历史服务订单。接下来,统计所属于各个出行场景下的历史服务订单的数量,并对数量进行归一化处理之后,得到服务订单的场景特征信息。
例如,从历史服务订单的订单数据中提取出服务请求方去酒店、去机场、去上班等各种场景的服务订单,将其转化为场景特征信息。例如,历史服务订单中存在有10种出现场景,其中,去酒店的服务订单有4单、去机场的服务订单有5单、去上班的服务订单有1单。之后,对不同出行场景下的历史服务订单进行简单的归一化处理,则出行场景为酒店的历史服务订单为4/10,出行场景为机场的历史服务订单为5/10,出行场景为上班的历史服务订单为1/10,如此即可得到相应的场景特征信息。
在另一个可选的实施方式中,若订单特征包括服务请求方的实时位置;那么步骤S304,提取所述历史服务订单的订单数据中的特征信息包括如下步骤:
步骤S41,获取服务请求方所属服务请求方终端中定位装置的定位信息,并将所述定位信息作为所述服务请求方的实时位置。
在本实施例中,在执行上述步骤S302至步骤S306时,可以通过服务请求方所属服务请求方终端中的定位装置(例如,GPS定位装置)获取服务请求方的实时定位信息,并将该定位信息作为服务请求方的实时位置。通过获取该实时位置主要是用于确定服务请求方是否处于出差状态,或者是否在外地。
若上述步骤S306中所描述的目标场景为酒店,机场或者火车站等位置,那么若基于该实时位置确定出服务请求方在外地,那么该服务请求方有较大可能出现在上述位置:即酒店,机场,火车站和汽车站等。
因此,在用户的多种出行场景下,通过添加实时位置能够更加的准确的预测服务请求方在未来一段时间段去往上述目标场景的概率值。
在本实施例中,在按照上述所描述的方式提取得到订单数据中的特征信息,得到订单特征信息之后,就可以利用目标预测模型对订单特征信息进行处理,以预测服务请求方在未来的第二目标时间段内去往目标场景的概率值。
在本实施例中,如图4所示,该方法还包括如下步骤:
步骤S308,判断概率值是否大于或者等于预设概率值;若是,则执行步骤S310和步骤S312,否则执行步骤S314;
步骤S310,将所述服务请求方添加至待推送名单集合中;
步骤S312,在所述待推送名单集合中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息,其中,所述目标引导信息用于引导服务请求方发起服务订单;
步骤S314,不执行任何操作。
通过上述描述可知,在本实施例中,在预测得到概率值之后,可以将该概率值与预设概率值进行比较。如果比较出概率值大于或者等于预设概率值,则将服务请求方添加至待推送名单集合中。
然后,在待推送名单集合中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息,以引导服务请求方发起服务订单。
通过上述描述可知,目标场景可以设置为一个,还可以设置为多个,那么当设置目标场景为多个时,可以为每个目标场景对应的预设概率值。
此时,如果预测得到各个目标场景所对应的概率值,可以将该概率值与对应的预设概率值进行比较。若比较出大于或者等于对应的预设概率值,则添加至对应的待推送名单集合中。
例如,目标场景包括酒店和机场,那么为酒店设置的预设概率值为A1,为机场设置的预设概率值为A2。在利用上述步骤S302至步骤S306所描述的方式得到服务请求方在未来的第二目标时间段内去往酒店的概率值为 B1,去往机场的概率值为B2。之后,将概率值B1与预设概率值为A1进行比较,若概率值B1大于或者等于预设概率值为A1,则将服务请求方添加到待推送名单集合C1中,否则不添加。并将概率值B2与预设概率值为 A2进行比较,若概率值B2大于或者等于预设概率值为A2,则将服务请求方添加到待推送名单集合C2中,否则不添加。
在得到待推送名单集合C1和待推送名单集合C2之后,就可以在待推送名单集合C1中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息D1,以及在待推送名单集合C2中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息D2。
需要说明的是,向目标引导信息D1和目标引导信息D2可以相同,也可以不同,本实施例不做具体限定。
在一个可选的实施方式中,如图5所示,步骤S312,在所述待推送名单集合中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息包括如下步骤:
步骤S501,按照预设筛选规则从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。
如果待推送名单集合包含大量的待推送引导信息的服务请求方,则可以从大量的服务请求方中选择部分服务请求方,并向选择出的部分服务请求方发送目标引导信息。
可选地,在本实施例中,可以按照所述待推送名单集合各个服务请求方所对应的概率值,从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。例如,从待推送名单集合中选择概率值大于某个固定阈值的服务请求方。
除此之外,还可以按照固定数量选择服务请求方,例如,从待推送名单集合中选择概率值最大的前N个服务请求方,其中,N大于1。
除此之外,还可以结合服务请求方的其他信息来进行筛选,例如,服务请求方的信用等级,发单数量等等。
除此之外,还可以结合概率值,固定数量和其他信息对待推送名单集合进行筛选,得到一个或多个服务请求方。
在一个可选的实施方式中,向所选择的服务请求方发送目标引导信息包括如下步骤:
向所选择的服务请求方发送服务订单的优惠信息,以通过所述优惠信息引导所述服务请求方发起服务订单。
在本实施例中,在预测出服务请求方未来可能去目标场景后,可通过制定相应的策略对服务请求方进行投放,刺激服务请求方发起服务订单。例如,可选出100万人提供给运营,运营可通过相应的策略过滤掉一部分,然后向剩余的服务请求方通过发送优惠券等方式引导服务请求方使用网约车服务,其中,优惠券即为上述服务订单的优惠信息。
在本实施例中,通过上述处理方式,通过预测用户的出行需求,将有去往目标场景需求的用户引导到网约车服务中,从而使用户有更好的服务体验。
在本实施例中,在利用目标预测模型对订单特征信息进行处理之前,还需要训练目标预测模型的原始模型,如图6所示,具体训练过程描述如下:
步骤S601,获取训练样本集,其中,所述训练样本集中包括多个训练样本,且历史服务请求方对应一个或多个训练样本,每个训练样本包括:在特定时间段之前历史服务请求方的历史订单特征信息和标签信息,所述标签信息用于表征在特定时间段之后,所述历史服务请求方发起的服务订单中是否包含去往目标场景的服务订单;
步骤S602,利用训练样本集训练机器学习模型,得到所述目标预测模型,其中,所述机器学习模型包括:集成树模型或者深度学习模型。
在本实施例中,首先构建训练样本集,其中,训练样本集中包括一个或多个训练样本。构建训练样本集的过程将在下述实施例中进行详细介绍。
之后,利用训练样本集训练机器学习模型,得到目标预测模型。该机器学习模型可以为集成树模型或者深度学习模型。机器学习模型输出的结果是0到1之间的float值,代表未来某时间(即,上述所描述的未来的第二目标时间段内)(例如未来3天或者7天)服务请求方去往目标场景的概率值。
在本实施例中,集成树模型可以为xgboost模型,除此之外,还可以为其他模型。
在对机器学习模型进行训练之后,还可以构建测试样本集,其中,构建测试样本集的方式与构建训练样本集的方式相同,本申请仅以训练样本集的构建方式为例进行介绍。
该测试样本集用于对训练之后的机器学习模型进行测试,以测试训练之后机器学习模型的预测效果。该预测效果的评估指标可以为准确率和召回率。召回率(Recall)和准确率(Precise)是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。通过上述处理方式,能够使得目标预测模型的预测精度更加准确。
如图7所示,获取训练样本集包括如下步骤:
步骤S701,确定筛选时间段;
在本实施例中,在构建训练样本集时,可以预先设定一个时间,称之为筛选时间段,具体可以根据实际需要来进行设定。
步骤S702,在订单平台中筛选所述筛选时间段之前的目标服务订单,其中,所述目标服务订单的服务终点为所述目标场景;
之后,从数据平台的历史服务订单中筛选出该筛选时间段之前去往目标场景的服务订单(即,目标服务订单)。其中,目标服务订单所属服务请求方构成候选人群。
步骤S703,基于所述目标服务订单确定所述训练样本集。
在筛选得到目标服务订单之后,就可以基于目标服务订单确定训练样本集。其中,候选人群中的每个服务请求方对应一个或多个训练样本,每个训练样本中均包含以下特征信息:服务请求方的属性特征信息,服务订单的特征信息,服务订单的场景特征信息,服务请求方的实时位置。
从历史数据中选取目标服务订单的目的是为了从一个更小的范围找到有去往目标场景需求的人。采用上述处理方式得到的训练样本集,能够更加准确的反映出服务请求方的出行规律,从而实现更加的准确的出行预测。
可选地,步骤S703,基于所述目标服务订单确定所述训练样本集包括如下步骤:
步骤S7031,在所述目标服务订单中确定所属于每个历史服务请求方的服务订单,得到多个目标服务订单组;
步骤S7032,对每个所述目标服务订单组进行特征提取,得到所述训练样本;
步骤S7033,将每个历史服务请求方所对应的训练样本作为所述训练样本集。
在本实施例中,从筛选得到的目标服务订单中,确定所属于每个历史服务请求方的服务订单,得到多个目标服务订单组。也即,为每个历史服务请求方构建一个目标服务订单组。针对每个目标服务订单组,进行特征提取,得到该历史服务请求方的一个训练样本。
需要说明的是,在本实施例中,可以按照时间窗筛选目标服务订单,例如,通过设置滑动时间窗口在数据平台的历史服务订单中滑动,从而选取所需的目标服务订单。例如,一个服务请求方可以根据滑动时间窗口滑动采集出多条训练样本。
例如,该滑动时间窗口的滑动步长为4天,且该滑动时间窗口的窗口大小为4天。其中,具体滑动步长和窗口大小可以根据实际需要来进行设定。假设,从2018年6月1日开始,滑动时间窗口滑动一次,在滑动时间窗口滑动一次之后,采用上述所描述的方式构建训练样本集。
假设,从2018年6月1日到2018年6月4日设定为第一个滑动时间窗口,此时的筛选时间段可以设定为2018年6月4日24:00。然后,从订单平台中筛选出该筛选时间段之前的目标服务订单。然后,基于该目标服务订单确定训练样本集,在该训练样本集中一个历史服务请求方对应一个训练样本。
从2018年6月5日到2018年6月8日设定为的第二滑动时间窗口,此时的筛选时间段可以设定为2018年6月8日24:00。然后,从订单平台中筛选出该筛选时间段之前的目标服务订单。然后,基于该目标服务订单确定训练样本集,在该训练样本集中一个历史服务请求方对应一个训练样本。
以此类推,通过上述处理方式就能够得到大量的训练样本,且一个历史服务请求方可以确定出至少一个训练样本。
相对于一个训练样本,若采集一个历史服务请求方的多个训练样本,能够更加全面的反应该历史服务请求方的特征信息,使得机器学习模型的训练过程更加准确。
在本实施例中,可以通过以下方式确定每个训练样本的标签信息,具体包括:
统计所述筛选时间段之后所述历史服务请求方发起的目标服务订单;
从所述目标服务订单中提取目的服务位置;
根据所述目的服务位置的POI类型判断所述目的服务位置所属的场景类型;
若所述目的服务位置所属的场景类型为所述目标场景,则将所述历史服务请求所对应的训练样本的标签信息设置为第一标签信息,其中,所述第一标签信息表示历史服务请求方发起的服务订单中包含去往目标场景的服务订单;
若所述目的服务位置所属的场景类型不是所述目标场景,将所述历史服务请求所对应的训练样本的标签信息设置为第二标签信息,其中,所述第二标签信息表示历史服务请求方发起的服务订单中不包含去往目标场景的服务订单。
也就是说,在本实施例中,可以根据历史服务请求方在筛选时间段之后的时间段中有没有去往目标场景的订单来生成标签信息label。若有,则为训练样本的标签信息设置为第一标签信息,表示历史服务请求方发起的服务订单中包含去往目标场景的服务订单,否则,设置为第二标签信息,表示历史服务请求方发起的服务订单中不包含去往目标场景的服务订单。
图8是示出本申请的一些实施例的数据预测装置的框图,该数据预测装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述服务器,或服务器的处理器,也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件,如图所示,数据预测装置可以包括第一获取单元810、特征提取单元820和处理单元830。
第一获取单元810,用于获取服务请求方的历史服务订单的订单数据,其中,所述历史服务订单为第一目标时间段之前所述服务请求方发起的服务订单;
特征提取单元820,用于提取所述订单数据中的特征信息,得到订单特征信息;所述订单特征信息包括以下至少一种:服务请求方的属性特征信息,服务订单的特征信息,服务订单的场景特征信息,服务请求方的实时位置;
处理单元830,用于利用目标预测模型对所述订单特征信息进行处理,以预测所述服务请求方在未来的第二目标时间段内去往目标场景的概率值,其中,所述第二目标时间段为所述第一目标时间段之后的时间段。
在本申请中,首先获取服务请求方的历史服务订单的订单数据;然后,提取订单数据中的特征信息,得到订单特征信息;最后,利用目标预测模型对订单特征信息进行处理,以预测服务请求方在第二目标时间段内去往目标场景的概率值。在本实施例中,通过目标预测模型对订单特征信息进行处理之后,能够预测服务提供方在未来一段时间段去往目标场景的概率,从而解决现有的网约车平台智能化程度较低的技术问题。
可选地,所述装置还包括:添加单元,用于若所述概率值大于或者等于预设概率值,则将所述服务请求方添加至待推送名单集合中;选择和发送单元,用于在所述待推送名单集合中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息,其中,所述目标引导信息用于引导服务请求方发起服务订单。
可选地,所述选择和发送单元用于:按照预设筛选规则从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。
可选地,所述选择和发送单元还用于:按照所述待推送名单集合各个服务请求方所对应的概率值,从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。
可选地,所述选择和发送单元还用于:向所选择的服务请求方发送服务订单的优惠信息,以通过所述优惠信息引导所述服务请求方发起服务订单。
可选地,所述订单特征包括服务请求方的属性特征信息;所述特征提取单元用于:按照目标字段从所述历史服务订单的订单数据中提取所述服务请求方的属性特征信息,其中,所述目标字段包括以下至少之一:性别、年龄、消费水平和信用等级;或者,从数据平台中提取所述服务请求方的属性特征信息。
可选地,所述订单特征包括服务订单的特征信息;所述特征提取单元用于:按照所述历史服务订单的订单类型对所述订单数据进行分类处理,得到多组历史服务订单,其中,所述订单类型为历史服务订单中服务提供方用于为服务请求方提供服务的车辆服务类型确定的;统计每组历史服务订单中的订单数量,并将所述订单数量作为所述服务订单的特征信息。
可选地,所述订单特征包括服务订单的场景特征信息;所述特征提取单元用于:提取所述历史服务订单的订单数据中的POI数据;基于所述POI 数据确定各个历史服务订单的出行场景信息;基于所述出行场景信息对所述历史服务订单进行分类,得到各个出行场景信息所对应的历史服务订单;对所述各个出行场景信息所对应的历史服务订单的数量进行归一化处理,并将归一化处理之后的数据作为所述服务订单的场景特征信息。
可选地,所述订单特征包括服务请求方的实时位置;所述特征提取单元用于:获取服务请求方所属服务请求方终端中定位装置的定位信息,并将所述定位信息作为所述服务请求方的实时位置。
可选地,所述装置还包括:第二获取单元,用于获取训练样本集,其中,所述训练样本集中包括多个训练样本,且历史服务请求方对应一个或多个训练样本,每个训练样本包括:在特定时间段之前历史服务请求方的历史订单特征信息和标签信息,所述标签信息用于表征在特定时间段之后,所述历史服务请求方发起的服务订单中是否包含去往目标场景的服务订单;训练单元,用于利用训练样本集训练机器学习模型,得到所述目标预测模型,其中,所述机器学习模型包括:集成树模型或者深度学习模型。
可选地,所述第二获取单元用于:确定筛选时间段;在订单平台中筛选所述筛选时间段之前的目标服务订单,其中,所述目标服务订单的服务终点为所述目标场景;基于所述目标服务订单确定所述训练样本集。
可选地,所述第二获取单元还用于:在所述目标服务订单中确定所属于每个历史服务请求方的服务订单,得到多个目标服务订单组;对每个所述目标服务订单组进行特征提取,得到所述训练样本;将每个历史服务请求方所对应的训练样本作为所述训练样本集。
可选地,所述装置通过以下方式确定每个训练样本的标签信息,具体包括:统计所述筛选时间段之后所述历史服务请求方发起的目标服务订单;从所述目标服务订单中提取目的服务位置;根据所述目的服务位置的POI 类型判断所述目的服务位置所属的场景类型;若所述目的服务位置所属的场景类型为所述目标场景,则将所述历史服务请求所对应的训练样本的标签信息设置为第一标签信息,其中,所述第一标签信息表示历史服务请求方发起的服务订单中包含去往目标场景的服务订单;若所述目的服务位置所属的场景类型不是所述目标场景,将所述历史服务请求所对应的训练样本的标签信息设置为第二标签信息,其中,所述第二标签信息表示历史服务请求方发起的服务订单中不包含去往目标场景的服务订单。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、 RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (28)
1.一种数据预测方法,其特征在于,包括:
获取服务请求方的历史服务订单的订单数据,其中,所述历史服务订单为第一目标时间段之前所述服务请求方发起的服务订单;
提取所述订单数据中的特征信息,得到订单特征信息;所述订单特征信息包括以下至少一种:服务请求方的属性特征信息,服务订单的特征信息,服务订单的场景特征信息,服务请求方的实时位置;
利用目标预测模型对所述订单特征信息进行处理,以预测所述服务请求方在未来的第二目标时间段内去往目标场景的概率值,其中,所述第二目标时间段为所述第一目标时间段之后的时间段。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述概率值大于或者等于预设概率值,则将所述服务请求方添加至待推送名单集合中;
在所述待推送名单集合中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息,其中,所述目标引导信息用于引导服务请求方发起服务订单。
3.根据权利要求2所述的方法,其特征在于,在所述待推送名单集合中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息包括:
按照预设筛选规则从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。
4.根据权利要求3所述的方法,其特征在于,按照预设筛选规则从所述待推送名单集合中选择一个或多个服务请求方包括:
按照所述待推送名单集合中各个服务请求方所对应的概率值,从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。
5.根据权利要求2所述的方法,其特征在于,向所选择的服务请求方发送目标引导信息包括:
向所选择的服务请求方发送服务订单的优惠信息,以通过所述优惠信息引导所述服务请求方发起服务订单。
6.根据权利要求1所述的方法,其特征在于,所述订单特征包括服务请求方的属性特征信息;
提取所述历史服务订单的订单数据中的特征信息包括:
按照目标字段从所述历史服务订单的订单数据中提取所述服务请求方的属性特征信息,其中,所述目标字段包括以下至少之一:性别、年龄、消费水平和信用等级;或者
从数据平台中提取所述服务请求方的属性特征信息。
7.根据权利要求1所述的方法,其特征在于,所述订单特征包括服务订单的特征信息;
提取所述历史服务订单的订单数据中的特征信息包括:
按照所述历史服务订单的订单类型对所述订单数据进行分类处理,得到多组历史服务订单,其中,所述订单类型为历史服务订单中服务提供方用于为服务请求方提供服务的车辆的服务类型确定的;
统计每组历史服务订单中的订单数量,并将所述订单数量作为所述服务订单的特征信息。
8.根据权利要求1所述的方法,其特征在于,所述订单特征包括服务订单的场景特征信息;
提取所述历史服务订单的订单数据中的特征信息包括:
提取所述历史服务订单的订单数据中的POI数据;
基于所述POI数据确定各个历史服务订单的出行场景信息;
基于所述出行场景信息对所述历史服务订单进行分类,得到各个出行场景信息所对应的历史服务订单;
对所述各个出行场景信息所对应的历史服务订单的数量进行归一化处理,并将归一化处理之后的数据作为所述服务订单的场景特征信息。
9.根据权利要求1所述的方法,其特征在于,所述订单特征包括服务请求方的实时位置;
提取所述历史服务订单的订单数据中的特征信息包括:
获取服务请求方所属服务请求方终端中定位装置的定位信息,并将所述定位信息作为所述服务请求方的实时位置。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取训练样本集,其中,所述训练样本集中包括多个训练样本,且历史服务请求方对应一个或多个训练样本,每个训练样本包括:在特定时间段之前历史服务请求方的历史订单特征信息和标签信息,所述标签信息用于表征在特定时间段之后,所述历史服务请求方发起的服务订单中是否包含去往目标场景的服务订单;
利用训练样本集训练机器学习模型,得到所述目标预测模型,其中,所述机器学习模型包括:集成树模型或者深度学习模型。
11.根据权利要求10所述的方法,其特征在于,获取训练样本集包括:
确定筛选时间段;
在订单平台中筛选所述筛选时间段之前的目标服务订单,其中,所述目标服务订单的服务终点为所述目标场景;
基于所述目标服务订单确定所述训练样本集。
12.根据权利要求12所述的方法,其特征在于,基于所述目标服务订单确定所述训练样本集包括:
在所述目标服务订单中确定所属于每个历史服务请求方的服务订单,得到多个目标服务订单组;
对每个所述目标服务订单组进行特征提取,得到所述训练样本;
将每个历史服务请求方所对应的训练样本作为所述训练样本集。
13.根据权利要求11所述的方法,其特征在于,通过以下方式确定每个训练样本的标签信息,具体包括:
统计所述筛选时间段之后所述历史服务请求方发起的目标服务订单;
从所述目标服务订单中提取目的服务位置;
根据所述目的服务位置的POI类型判断所述目的服务位置所属的场景类型;
若所述目的服务位置所属的场景类型为所述目标场景,则将所述历史服务请求所对应的训练样本的标签信息设置为第一标签信息,其中,所述第一标签信息表示历史服务请求方发起的服务订单中包含去往目标场景的服务订单;
若所述目的服务位置所属的场景类型不是所述目标场景,将所述历史服务请求所对应的训练样本的标签信息设置为第二标签信息,其中,所述第二标签信息表示历史服务请求方发起的服务订单中不包含去往目标场景的服务订单。
14.一种数据预测装置,其特征在于,包括:
第一获取单元,用于获取服务请求方的历史服务订单的订单数据,其中,所述历史服务订单为第一目标时间段之前所述服务请求方发起的服务订单;
特征提取单元,用于提取所述订单数据中的特征信息,得到订单特征信息;所述订单特征信息包括以下至少一种:服务请求方的属性特征信息,服务订单的特征信息,服务订单的场景特征信息,服务请求方的实时位置;
处理单元,用于利用目标预测模型对所述订单特征信息进行处理,以预测所述服务请求方在未来的第二目标时间段内去往目标场景的概率值,其中,所述第二目标时间段为所述第一目标时间段之后的时间段。
15.根据权利要求14所述的装置,其特征在于,所述装置还包括:
添加单元,用于若所述概率值大于或者等于预设概率值,则将所述服务请求方添加至待推送名单集合中;
选择和发送单元,用于在所述待推送名单集合中选择部分或者全部服务请求方,并向所选择的服务请求方发送目标引导信息,其中,所述目标引导信息用于引导服务请求方发起服务订单。
16.根据权利要求15所述的装置,其特征在于,所述选择和发送单元用于:
按照预设筛选规则从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。
17.根据权利要求16所述的装置,其特征在于,所述选择和发送单元还用于:
按照所述待推送名单集合各个服务请求方所对应的概率值,从所述待推送名单集合中选择一个或多个服务请求方;并向选择出的所述一个或多个服务请求方发送所述目标引导信息。
18.根据权利要求15所述的装置,其特征在于,所述选择和发送单元还用于:
向所选择的服务请求方发送服务订单的优惠信息,以通过所述优惠信息引导所述服务请求方发起服务订单。
19.根据权利要求14所述的装置,其特征在于,所述订单特征包括服务请求方的属性特征信息;
所述特征提取单元用于:
按照目标字段从所述历史服务订单的订单数据中提取所述服务请求方的属性特征信息,其中,所述目标字段包括以下至少之一:性别、年龄、消费水平和信用等级;或者
从数据平台中提取所述服务请求方的属性特征信息。
20.根据权利要求14所述的装置,其特征在于,所述订单特征包括服务订单的特征信息;
所述特征提取单元用于:
按照所述历史服务订单的订单类型对所述订单数据进行分类处理,得到多组历史服务订单,其中,所述订单类型为历史服务订单中服务提供方用于为服务请求方提供服务的车辆服务类型确定的;
统计每组历史服务订单中的订单数量,并将所述订单数量作为所述服务订单的特征信息。
21.根据权利要求14所述的装置,其特征在于,所述订单特征包括服务订单的场景特征信息;
所述特征提取单元用于:
提取所述历史服务订单的订单数据中的POI数据;
基于所述POI数据确定各个历史服务订单的出行场景信息;
基于所述出行场景信息对所述历史服务订单进行分类,得到各个出行场景信息所对应的历史服务订单;
对所述各个出行场景信息所对应的历史服务订单的数量进行归一化处理,并将归一化处理之后的数据作为所述服务订单的场景特征信息。
22.根据权利要求14所述的装置,其特征在于,所述订单特征包括服务请求方的实时位置;
所述特征提取单元用于:
获取服务请求方所属服务请求方终端中定位装置的定位信息,并将所述定位信息作为所述服务请求方的实时位置。
23.根据权利要求14所述的装置,其特征在于,所述装置还包括:
第二获取单元,用于获取训练样本集,其中,所述训练样本集中包括多个训练样本,且历史服务请求方对应一个或多个训练样本,每个训练样本包括:在特定时间段之前历史服务请求方的历史订单特征信息和标签信息,所述标签信息用于表征在特定时间段之后,所述历史服务请求方发起的服务订单中是否包含去往目标场景的服务订单;
训练单元,用于利用训练样本集训练机器学习模型,得到所述目标预测模型,其中,所述机器学习模型包括:集成树模型或者深度学习模型。
24.根据权利要求23所述的装置,其特征在于,所述第二获取单元用于:
确定筛选时间段;
在订单平台中筛选所述筛选时间段之前的目标服务订单,其中,所述目标服务订单的服务终点为所述目标场景;
基于所述目标服务订单确定所述训练样本集。
25.根据权利要求24所述的装置,其特征在于,所述第二获取单元还用于:
在所述目标服务订单中确定所属于每个历史服务请求方的服务订单,得到多个目标服务订单组;
对每个所述目标服务订单组进行特征提取,得到所述训练样本;
将每个历史服务请求方所对应的训练样本作为所述训练样本集。
26.根据权利要求23所述的装置,其特征在于,所述装置通过以下方式确定每个训练样本的标签信息,具体包括:
统计所述筛选时间段之后所述历史服务请求方发起的目标服务订单;
从所述目标服务订单中提取目的服务位置;
根据所述目的服务位置的POI类型判断所述目的服务位置所属的场景类型;
若所述目的服务位置所属的场景类型为所述目标场景,则将所述历史服务请求所对应的训练样本的标签信息设置为第一标签信息,其中,所述第一标签信息表示历史服务请求方发起的服务订单中包含去往目标场景的服务订单;
若所述目的服务位置所属的场景类型不是所述目标场景,将所述历史服务请求所对应的训练样本的标签信息设置为第二标签信息,其中,所述第二标签信息表示历史服务请求方发起的服务订单中不包含去往目标场景的服务订单。
27.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至13中任一所述的数据预测方法的步骤。
28.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至13中任一所述的数据预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811519937.4A CN111310961A (zh) | 2018-12-12 | 2018-12-12 | 数据预测方法、装置、电子设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811519937.4A CN111310961A (zh) | 2018-12-12 | 2018-12-12 | 数据预测方法、装置、电子设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111310961A true CN111310961A (zh) | 2020-06-19 |
Family
ID=71150578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811519937.4A Pending CN111310961A (zh) | 2018-12-12 | 2018-12-12 | 数据预测方法、装置、电子设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111310961A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111861178A (zh) * | 2020-07-13 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 服务匹配模型的训练方法、服务匹配方法、设备及介质 |
CN112131503A (zh) * | 2020-08-27 | 2020-12-25 | 长沙市到家悠享网络科技有限公司 | 数据获取方法、装置、设备 |
CN112669073A (zh) * | 2020-12-31 | 2021-04-16 | 北京嘀嘀无限科技发展有限公司 | 一种用户留存预测方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007293623A (ja) * | 2006-04-25 | 2007-11-08 | Ricoh Co Ltd | 需要予測方法及び需要予測プログラム |
CN106875066A (zh) * | 2017-02-28 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 用车出行行为的预测方法、装置、服务器以及存储介质 |
CN106897919A (zh) * | 2017-02-28 | 2017-06-27 | 百度在线网络技术(北京)有限公司 | 用车类型预测模型建立、信息提供方法及装置 |
CN107402931A (zh) * | 2016-05-19 | 2017-11-28 | 滴滴(中国)科技有限公司 | 一种出行目的地推荐方法和装置 |
US20180032928A1 (en) * | 2015-02-13 | 2018-02-01 | Beijing Didi Infinity Technology And Development C O., Ltd. | Methods and systems for transport capacity scheduling |
CN108022140A (zh) * | 2016-11-02 | 2018-05-11 | 北京嘀嘀无限科技发展有限公司 | 一种用车订单推荐方法、装置及服务器 |
-
2018
- 2018-12-12 CN CN201811519937.4A patent/CN111310961A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007293623A (ja) * | 2006-04-25 | 2007-11-08 | Ricoh Co Ltd | 需要予測方法及び需要予測プログラム |
US20180032928A1 (en) * | 2015-02-13 | 2018-02-01 | Beijing Didi Infinity Technology And Development C O., Ltd. | Methods and systems for transport capacity scheduling |
CN107402931A (zh) * | 2016-05-19 | 2017-11-28 | 滴滴(中国)科技有限公司 | 一种出行目的地推荐方法和装置 |
CN108022140A (zh) * | 2016-11-02 | 2018-05-11 | 北京嘀嘀无限科技发展有限公司 | 一种用车订单推荐方法、装置及服务器 |
CN106875066A (zh) * | 2017-02-28 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 用车出行行为的预测方法、装置、服务器以及存储介质 |
CN106897919A (zh) * | 2017-02-28 | 2017-06-27 | 百度在线网络技术(北京)有限公司 | 用车类型预测模型建立、信息提供方法及装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111861178A (zh) * | 2020-07-13 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 服务匹配模型的训练方法、服务匹配方法、设备及介质 |
CN111861178B (zh) * | 2020-07-13 | 2024-06-07 | 北京嘀嘀无限科技发展有限公司 | 服务匹配模型的训练方法、服务匹配方法、设备及介质 |
CN112131503A (zh) * | 2020-08-27 | 2020-12-25 | 长沙市到家悠享网络科技有限公司 | 数据获取方法、装置、设备 |
CN112131503B (zh) * | 2020-08-27 | 2024-01-12 | 长沙市到家悠享网络科技有限公司 | 数据获取方法、装置、设备 |
CN112669073A (zh) * | 2020-12-31 | 2021-04-16 | 北京嘀嘀无限科技发展有限公司 | 一种用户留存预测方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111275228B (zh) | 预测方法、装置、电子设备及存储介质 | |
CN106529711B (zh) | 用户行为预测方法及装置 | |
CN111260102A (zh) | 一种用户满意度预测方法、装置、电子设备及存储介质 | |
CN105744005A (zh) | 客户定位分析方法及服务器 | |
GB2547395A (en) | User maintenance system and method | |
CN108153824B (zh) | 目标用户群体的确定方法及装置 | |
CN110782301A (zh) | 一种拼单方法、装置、电子设备及计算机可读存储介质 | |
CN111310961A (zh) | 数据预测方法、装置、电子设备和计算机可读存储介质 | |
CN111275470B (zh) | 服务发起概率预测方法及其模型的训练方法和装置 | |
US20190147468A1 (en) | Location evaluation | |
CN104599002B (zh) | 预测订单价值的方法及设备 | |
US20160253681A1 (en) | Methods and systems for interpretable user behavior profiling in off-street parking | |
Tavassoli et al. | Modelling passenger waiting time using large-scale automatic fare collection data: An Australian case study | |
CN112257777A (zh) | 基于隐马尔可夫模型的离职预测方法及相关装置 | |
CN111724184A (zh) | 一种转化概率预测方法及装置 | |
CN111192090A (zh) | 航班的座位分配方法、装置、存储介质和电子设备 | |
CN113506050A (zh) | 员工绩效的评估方法、装置、电子设备及可读存储介质 | |
CN111309815A (zh) | 一种关系图谱的处理方法、装置和电子设备 | |
CN110674208B (zh) | 用于确定用户的职住地信息的方法和装置 | |
CN110852792A (zh) | 一种基于大数据分析的航线价值评估方法及相关产品 | |
CN110751403A (zh) | 信用评分方法及装置 | |
CN111314094A (zh) | 分群数据处理方法、装置、电子设备及可读存储介质 | |
JP7105176B2 (ja) | 機械学習装置、判定装置、プログラム及び機械学習方法 | |
EP4092388A2 (en) | Method and apparatus of recommending information, electronic device, storage medium, and program product | |
CN111369029A (zh) | 服务选择预测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200619 |
|
RJ01 | Rejection of invention patent application after publication |