CN111369029A

CN111369029A - 服务选择预测方法、装置、电子设备及存储介质

Info

Publication number: CN111369029A
Application number: CN201811486545.2A
Authority: CN
Inventors: 李云飞
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2018-12-06
Filing date: 2018-12-06
Publication date: 2020-07-03

Abstract

本申请实施例提供了一种服务选择预测方法、装置、电子设备及存储介质，其中，该方法包括：获取待预测用户的历史出行记录，所述历史出行记录中包括出行地址信息；将每个所述出行地址信息进行分词处理，生成所述待预测用户的至少一个出行标签；基于所述待预测用户的出行标签，以及预先训练的目标服务预测模型，得到所述待预测用户选择目标服务的概率。本申请实施例提供了一种提前确定选择目标服务的潜在用户的方法，提高了服务质量。

Description

服务选择预测方法、装置、电子设备及存储介质

技术领域

本申请涉及信息处理技术领域，具体而言，涉及一种服务选择预测方法、装置、电子设备及存储介质。

背景技术

随着汽车电子技术的持续快速发展，乘坐出租车出行和预约乘坐私家车出行等出行方式得到了长足发展，在人们日常生活出行中起到了不可替代的作用，为广大人民的日常生活、交通出行带来了极大方便。

现有技术中，当接收到用户的出行请求时，会为用户提供出行服务，对于没有发起出行请求的用户，因无法及时了解到该用户的出行需求，也就无法为该用户及时提供相关服务，导致服务效果较差。

发明内容

有鉴于此，本申请的目的在于提供一种服务选择预测方法、装置、电子设备及存储介质，以提供一种提前确定潜在用户的方法，以提高服务质量。

第一方面，本申请实施例提供了一种服务选择预测方法，包括：

获取待预测用户的历史出行记录，所述历史出行记录中包括出行地址信息；

将每个所述出行地址信息进行分词处理，生成所述待预测用户的至少一个出行标签；

基于所述待预测用户的出行标签，以及预先训练的目标服务预测模型，得到所述待预测用户选择目标服务的概率。

在一些实施例中，所述将每个所述出行地址信息进行分词处理，生成所述待预测用户的至少一个出行标签，包括：

将每个所述出行地址信息进行分词处理后，得到多个分词特征；

若所述分词特征有对应的属性特征词，将所述分词特征与对应的所述属性特征词关联后，得到所述出行标签；

若所述分词特征没有对应的属性特征词，将所述分词特征作为所述出行标签。

在一些实施方式中，根据以下步骤训练所述目标服务预测模型：

获取待训练用户的历史出行记录，以及所述待训练用户选择目标服务的真实结果；

将所述待训练用户的历史出行记录中的每个所述出行地址信息进行分词处理，生成所述待训练用户的至少一个出行标签；

将所述待训练用户的出行标签作为模型输入特征，将所述待训练用户选择目标服务的真实结果作为模型输出特征，训练得到所述目标服务预测模型。

在一些实施方式中，所述方法还包括：

基于所述目标服务预测模型提取训练权重小于预设权重阈值的非关键出行标签；

将所述非关键出行标签删除后，得到更新后的模型输入特征；

基于所述更新后的模型输入特征和所述模型输出特征，重新训练得到更新后的目标服务预测模型。

在一些实施方式中，训练得到所述目标服务预测模型之后，所述方法还包括：

基于测试用户的历史出行记录以及所述测试用户选择目标服务的真实结果，确定所述目标服务预测模型的预测准确度；

若所述预测准确度小于设定准确度阈值，重新获取新的待训练用户的历史出行记录，训练所述目标服务预测模型，直至所述预测准确度大于或等于设定准确度阈值。

在一些实施方式中，所述基于测试用户的历史出行记录以及所述测试用户选择目标服务的真实结果，确定所述目标服务预测模型的预测准确度，包括：

获取测试用户的历史出行记录，以及所述测试用户选择目标服务的真实结果；

将所述测试用户的历史出行记录中的每个所述出行地址信息进行分词处理，生成所述测试用户的至少一个出行标签；

将所述测试用户的出行标签输入所述目标服务预测模型，得到所述测试用户选择目标服务的测试概率；

基于所述测试用户选择目标服务的测试概率、所述测试用户选择目标服务的真实结果以及所述测试用户的个数，确定所述目标服务预测模型的预测准确度。

在一些实施方式中，所述基于所述测试用户选择目标服务的测试概率、所述测试用户选择目标服务的真实结果以及所述测试用户的个数，确定所述目标服务预测模型的预测准确度，包括：

根据所述测试用户选择目标服务的测试概率与预设阈值，确定所述测试用户选择目标服务的测试结果；

根据所述测试用户选择目标服务的测试结果以及所述测试用户选择目标服务的真实结果，确定所述目标服务预测模型对所述测试用户的测试准确个数；

基于所述测试准确个数以及所述测试用户的个数，确定所述目标服务预测模型的预测准确度。

在一些实施方式中，所述得到所述待预测用户选择目标服务的概率之后，所述方法还包括：

判断所述待预测用户选择目标服务的概率是否大于预设阈值；

若是，确定所述待预测用户为选择所述目标服务出行的潜在用户。

在一些实施方式中，所述目标服务为租车服务。

第二方面，本申请实施例提供了一种服务选择预测装置，包括：

记录获取模块，用于获取待预测用户的历史出行记录，所述历史出行记录中包括出行地址信息；

标签生成模块，用于将每个所述出行地址信息进行分词处理，生成所述待预测用户的至少一个出行标签；

概率确定模块，用于基于所述待预测用户的出行标签，以及预先训练的目标服务预测模型，得到所述待预测用户选择目标服务的概率。

在一些实施方式中，所述标签生成模块，具体用于：

在一些实施方式中，还包括模型训练模块，所述模型训练模块用于：

在一些实施方式中，所述模型训练模型还用于：

在一些实施方式中，还包括模型测试模块，所述模型测试模块用于：

在得到所述目标服务预测模型之后，基于测试用户的历史出行记录以及所述测试用户选择目标服务的真实结果，确定所述目标服务预测模型的预测准确度；

在一些实施方式中，所述模型测试模块，具体用于：

在一些实施方式中，所述概率确定模块还用于：

得到所述待预测用户选择目标服务的概率之后，判断所述待预测用户选择目标服务的概率是否大于预设阈值；

在一些实施方式中，所述目标服务为租车服务。

第三方面，本申请实施例提供了一种电子设备，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行时执行如第一方面任一所述的服务选择预测方法的步骤。

第四方面，本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如第一方面任一所述的服务选择预测方法的步骤。

本申请实施例提供的服务选择预测方法、装置、电子设备及存储介质，通过获取待预测用户的历史出行记录，然后对该待预测用户的历史出行记录中的出行地址信息进行分词处理后，得到待预测用户的至少一个出行标签，这样能够根据待预测用户的出行标签，以及预先训练的目标服务预测模型，确定待预测用户选择目标服务的概率，这样就能够得知待预测用户选择目标服务出行的可能性，从而便于提前确定潜在用户，并为潜在用户进行合理的资源配置，以提高服务质量。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的一种服务选择预测方法流程示意图；

图2示出了本申请实施例所提供的一种生成出行标签的方法流程示意图；

图3示出了本申请实施例所提供的一种训练目标服务预测模型的方法流程图；

图4示出了本申请实施例所提供的一种更新目标服务预测模型的方法流程图；

图5示出了本申请实施例所提供的一种测试目标服务预测模型的方法流程图；

图6示出了本申请实施例所提供的一种确定目标服务预测模型的预测准确度的方法流程图；

图7示出了本申请实施例所提供的一种目标服务预测模型预测准确度的具体确定方法流程图；

图8示出了本申请实施例所提供的一种服务选择预测装置结构示意图；

图9示出了本申请实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容，结合特定应用场景“出行服务选择预测”，给出以下实施方式。对于本领域技术人员来说，在不脱离本申请的精神和范围的情况下，可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕服务选择预测进行描述，但是应该理解，这仅是一个示例性实施例。本申请可以应用于任何其他交通运输类型，还可以应用于其它相关的处理服务。例如，本申请可以应用于不同的运输系统环境，包括陆地，海洋，或航空等，或其任意组合。运输系统的交通工具可以包括出租车、私家车、顺风车、公共汽车、火车、子弹头列车、高速铁路、地铁、船只、飞机、宇宙飞船、热气球、或无人驾驶车辆等，或其任意组合。本申请还可以包括用于提供服务选择预测处理的任何服务系统。本申请的方法和装置的应用可以包括网页、浏览器的插件、客户端终端、定制系统、内部分析系统、或人工智能机器人等，或其任意组合。

本申请实施例可以服务于出行服务平台，该出行服务平台用于根据接收的客户端的出行服务请求为用户提供相应的服务。出行服务平台可以包括多个打车系统，如包括出租车打车系统、快车打车系统、专车打车系统、顺风车打车系统等。客户端的出行服务请求中包含有出发地信息和目的地信息。

本申请实施例的服务选择预测方法可以应用于出行服务平台的服务器，也可以应用于其它任意具有处理功能的计算设备。在一些实施例中，上述服务器或计算设备可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据，以执行本申请中描述的一个或多个功能。

下面以“租车”这种目标服务为例，对本申请实施例的思想做进一步介绍。

相比打车业务，租车业务属于低频业务，用户往往数月才会产生一次需求，但是租车业务也是车辆服务行业的重要业务，能够给有需要的用户提供切实的便利，如果能够提前找到有可能需要租车的潜在用户，并提前为这部分潜在用户进行合理的激励资源和服务资源配置，对于提升整个车辆服务行业的服务水平具有重要意义。

通过研究与出行方式有关的历史数据，可以由选择租车出行的用户的出行地址发现这部分用户一些共有的特征，比如出行地址包括的大都是旅游景区，则可以推理出这部分用户为旅游爱好者；比如出行地址包括的大都是各地的商务楼，则可以推理出这部分用户为商务人士，由此进一步可以得出，旅游爱好者和商务人士选择租车出行的可能性较大。

由此可见，用户选择租车出行的可能性与历史出行地址具有一定关联关系，因而可以基于待预测用户的历史出行记录中的出行地址信息提前对这部分用户选择租车出行的可能性大小进行预测，以便进一步基于可能性大小确定这部分用户是否为上述提到的潜在用户。

基于上述思想，本申请实施例提供了一种服务选择预测方法，应用于用车平台服务器，如图1所示，具体包括如下步骤S101～S103：

S101，获取待预测用户的历史出行记录，历史出行记录中包括出行地址信息。

具体地，这里出行地址信息可以有多个，多个出行地址信息可以具有不同的属性，比如有的为旅行地址，有的为购物地址，有的为办公地址等。

用车平台服务器能够从注册用车用户中，获取待预测用户的历史出行记录，这里的待预测用户可以是所有的注册用车用户，也可以是本地的注册用车用户，也可以是任何待预测地的注册用车用户，在此不做具体限定。

其中，历史出行记录可以由这部分待预测用户的历史出行记录中得到，待预测用户在历史打车或者租车时，在用车应用(Application，APP)中输入目的地信息后并下单后生成订单，服务器会将这些订单进行存储，这些订单不仅仅包括待预测用户的目的地信息，也包括待预测用户的出发地信息，当需要对待预测用户进行服务选择预测时，会通过这些订单提取历史出行记录，当然，这些历史出行记录中会包括待预测用户的出行地址，比如出发地信息和目的地信息。

具体地，针对其中一个待预测用户的近期的多条订单信息，可以获取该待预测用户的多条历史出行记录，以两条为例，这两条历史出行记录中的出行地址信息分别包括有如下信息：

(1)出发地信息：左岸工社-南门，目的地信息：银科大厦。

(2)出发地信息：大恒科技大厦，目的地信息：中国技术交易大厦。

更具体地，为了增加预测的准确度，这些历史出行地址可以是距离当前待预测日期设定时长内生成的订单中获取的，比如距离当前待预测日期3个月内的订单中获取的历史出行记录。

S102，将每个出行地址信息进行分词处理，生成待预测用户的至少一个出行标签。

上述历史出行记录中的出行地址信息除了包括地址的分词特征，也包括其他一些连词、虚词等和地址无关的词，要准确得到能够反映用户特征的出行标签，就需要对这些出行地址信息进行分词处理，只保留能够代表用户出行标签的地址特征词。

具体地，可以由分词后得到的待预测用户的地址特征词，构成待预测用户的出行标签，这些出行标签一般能够表现用户的特征，比如是商务人士还是旅游爱好者，然后再基于这些出行标签去对确定待预测用户选择目标服务的概率。

在一种实施方式中，步骤S102中，将每个出行地址信息进行分词处理，生成待预测用户的至少一个出行标签，如图2所示，具体包括以下步骤S201～S203：

S201，将每个出行地址信息进行分词处理后，得到多个分词特征。

具体地，这里是对每个出行地址信息进行分词，具体地可以根据出行地址信息的特定语言特征，采取与该特定语言特征匹配的分词方法，比如针对中文，可以采取基于字典的分词方法和基于机器学习的分词方法，这里具体不对分词方法进行限定，对出行地址信息进行分词后，过滤掉一些常用词、虚词和连接词后，得到多个与地址相关的分词特征，比如“王府井”、“故宫”、“银泰百货”和“清华路44号”等。

S202，若分词特征有对应的属性特征词，将分词特征与对应的属性特征词关联后，得到出行标签。

上述得到的若干分词特征中，有些分词特征是具有一些属性的，比如上述例子中提到的“银科大厦”、“大恒科技大厦”、“中国技术交易大厦”的属性即为办公楼；“王府井”、“故宫”的属性即为旅游景区；“银泰百货”的属性为商场；当然还有一些分词特征，仅仅只表示一个地址，比如“清华路44号”。

服务器预先存储有地址与属性的映射关系，这里的属性通过属性特征词进行表示，在得到分词特征后，可以根据预先存储的地址与属性的映射关系，确定得到的分词特征是否有对应的属性特征词，属性特征词包括“旅游景区”、“办公楼”、“商场”等能表示分词特征属性的词汇。当确定分词特征有对应的属性特征词时，则将分词特征与对应的属性特征词关联。

比如当分词特征为“故宫”时，通过预先存储的地址与属性的映射关系，确定“故宫”的属性为旅游景区，即可以用属性特征词“旅游景区”表示，然后将将分词特征“故宫”和属性特征词“旅游景区”进行关联，得到的出行标签即为“故宫-旅游景区”。

S203，若分词特征没有对应的属性特征词，将分词特征作为出行标签。

根据上述提到的，有些分词特征仅仅只表示纯粹的地址，比如上述提到的“清华路44号”，这些地址没有对应的属性特征词，则直接将该分词特征“清华路44号”作为出行标签。

S103，基于待预测用户的出行标签，以及预先训练的目标服务预测模型，得到待预测用户选择目标服务的概率。

根据上述出行标签的生成方式，得到待预测用户的出行标签后，可以进一步地基于预先训练的目标服务预测模型来预测待预测用户选择目标服务的概率，这里的目标服务预测模型能够表示出行标签与选择目标服务出行的概率，具体地，这里的目标服务为租车服务。

上述步骤S103中得到待预测用户选择目标服务的概率后，可以基于该概率来确定待预测用户是否为潜在用户，在一种实施方式中，步骤S103中，得到待预测用户选择目标服务的概率之后，上述服务选择预测方法还包括：

判断待预测用户选择目标服务的概率是否大于预设阈值。

若是，确定待预测用户为选择目标服务出行的潜在用户。

这里的预设阈值可以是根据历史数据确定，比如根据以往历史中对待预测用户选择目标服务概率的预测结果以及后续对这些待预测用户的跟踪结果确定的最优阈值，比如由历史数据得到，当取预设阈值为0.6时，得到的潜在用户最终为真实租车用户的数量最多，则将预设阈值定为0.6。

进一步地，针对上述确定的预设阈值也可以是根据一定目标规划进行更改，比如根据当前业务预算计划，准备的电子券可能仅满足500个潜在用户，而根据历史数据得到的预设阈值0.6对应的潜在用户大概有600个，此时就需要将预设阈值进行调高，比如调为0.7。

以一具体实施例进行阐述：如本申请实施例中的预设阈值为0.7，如果得到的待预测用户A选择目标服务的概率为0.71，则确定该待预测用户A为选择目标服务出行的潜在用户，则后续就会对该待预测用户A进行优惠政策，引导该预测用户A在近期选择租车出行。

上述提到的预先训练的目标服务预测模型，表示了出行标签与选择目标服务出行的概率的映射关系，本申请实施例以目标服务为租车服务进行详细阐述：

在一种实施方式中，如图3所示，具体根据以下步骤训练目标服务预测模型，具体包括步骤S301～S303：

S301，获取待训练用户的历史出行记录，以及待训练用户选择目标服务的真实结果。

在进行训练目标服务预测模型之前，首先要建立待训练样本库，为了提高目标服务预测模型的预测准确度，这里的待训练样本库应该包括多个样本数，即待训练用户个数，具体地，这里的样本库中还应该包括每个待训练用户的历史出行记录以及对应的选择目标服务的真实结果。

具体地，这里的选择目标服务的真实结果是由待训练用户在某个历史时期是否选择目标服务确定的，比如是否选择租车出行确定的，如果待训练用户在该历史时期选择租车出行，即待训练用户选择目标服务的真实结果对应为选择目标服务，如果待训练用户在该历史时期未选择租车出行，即待训练用户选择目标服务的真实结果对应为未选择目标服务。

为了方便描述，将上述选择目标服务的待训练用户称为正样本，将未选择目标服务的待训练用户称为负样本，进一步地为了提高模型的正确率和召回率，一般选择的正样本个数和负样本个数应该接近，比如正样本和负样本的个数均为3万。

上述提到的历史时期可以是具体的某一天，也可以是具体的某一周，这里历史出行记录是从该历史时期之前且距离该历史时期设定时长内的历史订单中获取的，比如该历史时期为2018年1月1日至2018年1月5日，则历史出行记录可以在2017年10月1日至2017年12月31日的历史订单中获取。

同样地，这里的历史出行记录也包括出行地址信息，也需要对这些出行地址信息进行分词处理。

S302，将待训练用户的历史出行记录中的每个出行地址信息进行分词处理，生成待训练用户的至少一个出行标签。

这里对针对待训练用户的出行地址信息进行分词的处理过程与上述针对对待预测用户的出行地址信息进行的分词处理过程一致，在此不再具体阐述。

当得到待训练用户的出行标签后，可以基于待训练用户的出行标签以及待训练用户的选择目标服务的真实结果训练目标服务预测模型，具体如下：

S303，将待训练用户的出行标签作为模型输入特征，将待训练用户选择目标服务的真实结果作为模型输出特征，训练得到目标服务预测模型。

具体地，得到待训练用户的出行标签后，可以将这些出行标签转换为对应机器可识别的数字向量，对应地，对待训练用户选择目标服务的真实结果进行赋值，比如对选择租车出行的模型输出特征赋值为1，对未选择租车出行的模型输出特征赋值为0，输入预先选择的学习模型进行训练，得到目标服务预测模型。

这里预先选择的学习模型可以是逻辑回归模型、神经网络模型、分类树模型中的一种或者几种的结合，在此不做具体阐述。

上述目标服务预测模型训练过程中，获取到待训练用户的历史出行记录后，将历史出行记录中的所有出行地址信息都进行了分词，并基于所有的分词特征得到了出行标签，这些出行标签中有些出行标签在正样本中和负样本中出现的频次相同，且这些出行标签在模型训练中并不会影响模型训练结果，且缺失这些出行标签后，在针对待预测用户的目标服务的预测过程中，也不会起对待预测用户选择目标服务的概率产生影响，将这些出行标签称为非关键出行标签。

由于这些非关键出行标签在预测过程中微乎其微，且有时在对出行地址信息分词处理后得到的非关键出行标签的数量可能巨大，为了减少服务器在通过目标服务预测模型对待预测用户进行预测时的运算过程，可以通过对上述目标服务预测模型的训练过程进行更新，得到更新后的目标服务预测模型。

在一种实施方式中，如图4所示，上述服务选择预测方法还包括以下具体步骤S401～S403：

S401，基于目标服务预测模型提取训练权重小于预设权重阈值的非关键出行标签。

在目标服务预测模型训练过程中，最终得到的目标服务预测模型会输出影响权重很小的出行标签，即上述提到的非关键出行标签。

S402，将非关键出行标签删除后，得到更新后的模型输入特征。

S403，基于更新后的模型输入特征和模型输出特征，重新训练得到更新后的目标服务预测模型。

这些非关键出行标签删除后，可以大大减少目标服务预测模型在对待预测用户进行预测时的运算量，比如更新前的目标服务预测模型需要的模型输入特征总共包括500个，当确定有50个为非关键出行标签时，则更新后的模型输入特征就减少到450个，当在对待预测用户进行目标服务选择预测时，实际参与到运算过程中的模型输入特征的总数仅仅为450个，从而减少了目标服务预测模型在对待预测用户进行目标服务选择预测时的运算量。

这里更新后的目标服务预测模型与更新前的目标服务预测模型对待预测用户选择目标服务的概率的预测结果相近，但是因为更新后的目标服务预测模型需要的出行标签数量减少了，故在后期对待预测用户进行目标服务预测时，更新后的目标服务预测模型的运算速度较更新之前的目标服务预测模型有所提高。

进一步地，对得到的目标服务预测模型或者更新后的目标服务预测模型，需要进行预测准确度验证，下面是对目标服务预测模型或者更新后的目标服务预测模型的预测准确度的确定过程进行的详细阐述：

在一种实施方式中，步骤S303或者步骤S403后，即得到目标服务预测模型之后，如图5所示，上述方法还包括以下具体步骤S501～S502：

S501，基于测试用户的历史出行记录以及测试用户选择目标服务的真实结果，确定目标服务预测模型的预测准确度。

在进行测试目标服务预测模型的预测准确度之前，首先要建立测试样本库，这里的测试样本库中包括多个样本数，即包括多个测试用户，具体地，这里的样本库中还应该包括每个测试用户的历史出行记录以及对应的选择目标服务的真实结果。

同样，这里测试用户选择目标服务的真实结果是由测试用户在某个历史时期是否选择目标服务确定的，比如是否选择租车出行确定的，如果待训练用户在该历史时期选择租车出行，即待训练用户选择目标服务的真实结果对应为选择目标服务，如果待训练用户在该历史时期未选择租车出行，即待训练用户选择目标服务的真实结果对应为未选择目标服务。

由测试用户的历史出行记录中的出行地址信息确定出测试用户的出行标签，然后将测试用户的出行标签作为模型输入特征，输入至上述方法步骤中训练得到的目标服务预测模型中，可以得到测试用户选择目标服务的真实结果，然后与测试用户选择目标服务的真实结果相比，则可以确定目标服务预测模型的预测准确度，基于该思想，下面对确定目标服务预测模型的预测准确度进行详细阐述：

在一种实施方式中，步骤S501中，基于测试用户的历史出行记录以及测试用户选择目标服务的真实结果，确定目标服务预测模型的预测准确度，如图6所示，可以包括以下步骤S601～S604：

S601，获取测试用户的历史出行记录，以及测试用户选择目标服务的真实结果。

在建立测试样本库之前，同样可以在测试用户的某一历史时期中的订单中获取历史出行记录，然后获取该历史时期后的某一设定期限内的选择目标服务的真实结果。

这里测试样本库的建立时间可以与待训练样本库的建立时间一致，比如同时进行采样，获取10万用户，其中6万用户用于建立待训练样本库，其余4万用户用于建立训练样本库。

同样地，这里的测试用户的历史出行记录也包括出行地址信息，也需要对这些出行地址信息进行分词处理。

S602，将测试用户的历史出行记录中的每个出行地址信息进行分词处理，生成测试用户的至少一个出行标签。

这里针对测试用户的出行地址信息进行分词处理得到出行标签的过程与上述针对待训练样本和待预测样本出行地址信息进行分词处理得到出行标签的过程一致，在此不再赘述。

S603，将测试用户的出行标签输入目标服务预测模型，得到测试用户选择目标服务的测试概率。

这里将测试样本中的每个测试用户的出行标签作为模型输入特征，输入上述方法步骤中得到的目标服务预测模型，能够得到该测试样本中每个测试用户对应的选择目标服务的测试概率。

S604，基于测试用户选择目标服务的测试概率、测试用户选择目标服务的真实结果以及测试用户的个数，确定目标服务预测模型的预测准确度。

在得到测试用户选择目标服务的测试概率后，再结合测试用户选择目标服务的真实结果以及测试用户的个数，就可以确定目标服务预测模型针对测试样本库中的全部测试用户的预测准确度，具体阐述如下：

可选地，步骤S604中，基于测试用户选择目标服务的测试概率、测试用户选择目标服务的真实结果以及测试用户的个数，确定目标服务预测模型的预测准确度，如图7所示，具体包括以下步骤S701～S703：

S701，根据测试用户选择目标服务的测试概率与预设阈值，确定测试用户选择目标服务的测试结果。

这里的测试用户选择目标服务的测试结果包括选择目标服务和未目标服务两种，具体地，若测试用户选择目标服务的测试概率大于预设阈值时，则确定测试用户选择目标服务的测试结果为选择目标服务，若测试用户选择目标服务的测试概率小于或等于预设概率时，则确定测试用户选择目标服务的测试结果为未目标服务。

比如，同样针对目标服务为租车服务的情况进行说明，假设这里的预设阈值为0.7，当测试用户选择目标服务的测试概率大于0.7，则测试用户选择目标服务的测试结果为选择租车出行，当当测试用户选择目标服务的测试概率小于或等于0.7，则测试用户选择目标服务的测试结果为未选择租车出行。

S702，根据测试用户选择目标服务的测试结果以及测试用户选择目标服务的真实结果，确定目标服务预测模型对测试用户的测试准确个数。

将某个测试用户选择目标服务的测试结果与该测试用户选择目标服务的真实结果进行比较，若测试结果与真实结果相符，则确定目标服务预测模型对该测试用户选择目标服务的测试是准确的，按照这样的方法依次验证目标服务预测模型针对测试样本中每个测试用户的测试结果是否准确，从而确定目标服务预测模型对测试样本中测试用户的测试准确个数。

仍以上述例子进行说明，当针对测试用户A进行测试后，得到测试用户A的测试结果为选择租车出行，然后查看测试用户A选择目标服务的真实结果也为选择租车出行，则确定针对测试用户A的测试结果准确。

S703，基于测试准确个数以及测试用户的个数，确定目标服务预测模型的预测准确度。

这里测试用户的个数即测试样本中的测试用户的个数，将上述步骤S702中确定的测试准确个数与测试样本中的测试用户的个数做商确定比值，即可得到预测准确度。

比如，测试准确个数为M，测试用户的个数为N，预测准确度为k，则预测准确度可以按照以下公式确定：

比如，测试准确个数为25000，测试用户的个数为30000，则预测准确度为83％。

S502，若预测准确度小于设定准确度阈值，重新获取新的待训练用户的历史出行记录，训练目标服务预测模型，直至预测准确度大于或等于设定准确度阈值。

因为步骤S403得到的更新后的目标服务预测模型是针对步骤S303得到的目标服务预测模型的更新，更新目的是为了减少的目标服务预测模型在对待预测用户进行预测时的运算量，并未针对其预测准确度进行优化，所以若步骤S303得到的目标服务预测模型的预测准确度小于设定准确度阈值，那么步骤S403得到的更新后的目标服务预测模型也会小于设定准确度阈值，反之亦然，所以这里确定预测准确度可以针对步骤S303得到的目标服务预测模型，也可以针对步骤S403得到的更新后的目标服务预测模型。

若预测准确度小于设定准确度阈值时，说明当前的目标服务预测模型没有达到预设要求，可能在目标服务预测模型训练过程中的出行标签的特征不符合训练要求，需要重新获取新的待训练用户的历史出行记录，生成新的出行标签进行训练，比如设定准确度阈值为70％，当预测准确度小于70％时，则说明该目标服务预测模型需要重新进行训练，当训练完成后，继续对该目标服务预测模型的预测准确度进行测试，直至确定该目标服务预测模型的预测准确度大于或等于70％后停止训练。

在另一种实施方式中，若预测准确度小于设定准确度阈值时，说明可能在目标服务预测模型训练过程中的出行标签的数量不符合训练要求，这种情况下，需要继续增加训练样本库的数量，然后再继续训练目标服务预测模型，直至确定该目标服务预测模型的预测准确度大于或等于设定准确度阈值。

基于上述实施例，本申请还提供了服务选择预测装置，下述各种装置的实施可以参见方法的实施，重复之处不再赘述。

如图8所示，为本申请实施例提供的一种服务选择预测装置800的结构示意图，包括：

记录获取模块801，用于获取待预测用户的历史出行记录，历史出行记录中包括出行地址信息。

标签生成模块802，用于将每个出行地址信息进行分词处理，生成待预测用户的至少一个出行标签。

概率确定模块803，用于基于待预测用户的出行标签，以及预先训练的目标服务预测模型，得到待预测用户选择目标服务的概率。

标签生成模块802，可以具体用于：

将每个出行地址信息进行分词处理后，得到多个分词特征。

若分词特征有对应的属性特征词，将分词特征与对应的属性特征词关联后，得到出行标签。

若分词特征没有对应的属性特征词，将分词特征作为出行标签。

在一种实施方式中，上述服务选择预测装置还包括模型训练模块804，模型训练模块804用于：

获取待训练用户的历史出行记录，以及待训练用户选择目标服务的真实结果。

将待训练用户的历史出行记录中的每个出行地址信息进行分词处理，生成待训练用户的至少一个出行标签。

将待训练用户的出行标签作为模型输入特征，将待训练用户选择目标服务的真实结果作为模型输出特征，训练得到目标服务预测模型。

在一种实施方式中，模型训练模型804还用于：

基于目标服务预测模型提取训练权重小于预设权重阈值的非关键出行标签。

将非关键出行标签删除后，得到更新后的模型输入特征。

基于更新后的模型输入特征和模型输出特征，重新训练得到更新后的目标服务预测模型。

在一种实施方式中，上述服务选择预测装置还包括模型测试模块805，模型测试模块805用于：

在得到目标服务预测模型之后，基于测试用户的历史出行记录以及测试用户选择目标服务的真实结果，确定目标服务预测模型的预测准确度。

若预测准确度小于设定准确度阈值，重新获取新的待训练用户的历史出行记录，训练目标服务预测模型，直至预测准确度大于或等于设定准确度阈值。

模型测试模块805，可以具体用于：

获取测试用户的历史出行记录，以及测试用户选择目标服务的真实结果。

将测试用户的历史出行记录中的每个出行地址信息进行分词处理，生成测试用户的至少一个出行标签。

将测试用户的出行标签输入目标服务预测模型，得到测试用户选择目标服务的测试概率。

基于测试用户选择目标服务的测试概率、测试用户选择目标服务的真实结果以及测试用户的个数，确定目标服务预测模型的预测准确度。

模型测试模块805，可以具体用于：

根据测试用户选择目标服务的测试概率与预设阈值，确定测试用户选择目标服务的测试结果。

根据测试用户选择目标服务的测试结果以及测试用户选择目标服务的真实结果，确定目标服务预测模型对测试用户的测试准确个数。

基于测试准确个数以及测试用户的个数，确定目标服务预测模型的预测准确度。

模型训练模型804还可以用于：

将非关键出行标签删除后，得到更新后的模型输入特征。

在一种实施方式中，概率确定模块803还可以用于：

得到待预测用户选择目标服务的概率之后，判断待预测用户选择目标服务的概率是否大于预设阈值。

若是，确定待预测用户为选择目标服务出行的潜在用户。

上述模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等，或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接，或其任意组合。两个或更多个模块可以组合为单个模块，并且任何一个模块可以分成两个或更多个单元。

本申请实施例还提供了一种电子设备900，电子设备900可以是通用计算机或特殊用途的计算机，两者都可以用于实现本申请的服务选择预测方法。本申请尽管仅示出了一个计算机，但是为了方便起见，可以在多个类似平台上以分布式方式实现本申请描述的功能，以均衡处理负载。

如图9所示，电子设备900可以包括连接到网络的网络端口901、用于执行程序指令的一个或多个处理器902、通信总线903、和不同形式的存储介质904，例如，磁盘、ROM、或RAM，或其任意组合。示例性地，计算机平台还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备900还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(Input/Output，I/O)接口905。

为了便于说明，在电子设备900中仅描述了一个处理器。然而，应当注意，本申请中的电子设备900还可以包括多个处理器，因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如，若电子设备900的处理器执行步骤A和步骤B，则应该理解，步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如，第一处理器执行步骤A，第二处理器执行步骤B，或者第一处理器和第二处理器共同执行步骤A和B。

下面以一个处理器为例，处理器902执行存储介质904中存储的如下程序指令：

获取待预测用户的历史出行记录，历史出行记录中包括出行地址信息。

将每个出行地址信息进行分词处理，生成待预测用户的至少一个出行标签。

基于待预测用户的出行标签，以及预先训练的目标服务预测模型，得到待预测用户选择目标服务的概率。

在一种实施方式中，处理器902执行的程序指令具体包括：

将每个出行地址信息进行分词处理后，得到多个分词特征。

在一种实施方式中，处理器902执行的程序指令还包括：

将非关键出行标签删除后，得到更新后的模型输入特征。

基于更新后的模型输入特征和所述模型输出特征，重新训练得到更新后的目标服务预测模型。

在一种实施方式中，处理器902执行的程序指令还包括：

在训练得到目标服务预测模型之后，基于测试用户的历史出行记录以及测试用户选择目标服务的真实结果，确定目标服务预测模型的预测准确度。

在一种实施方式中，处理器902执行的程序指令具体包括：

将测试用户的历史出行记录中的每个出行地址进行分词处理，生成测试用户的至少一个出行标签。

在一种实施方式中，处理器902执行的程序指令具体包括：

在一种实施方式中，处理器902执行的程序指令还包括：

若是，确定待预测用户为选择所述目标服务出行的潜在用户。

对应于图1至图7中的服务选择预测方法，本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述服务选择预测方法的步骤。

本申请实施例提供的服务选择预测方法、装置、电子设备及存储介质，通过获取待预测用户的历史出行记录，然后对该待预测用户的历史出行记录中的出行地址信息进行分词处理后，得到待预测用户的至少一个出行标签，这样能够根据待预测用户的出行标签，以及预先训练的目标服务预测模型，确定待预测用户选择目标服务的概率，这样就能够得知待预测用户选择目标服务出行的可能性，从而便于提前确定潜在用户，并为潜在用户进行合理的资源配置，以提供服务质量。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考方法实施例中的对应过程，本申请中不再赘述。在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种服务选择预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述将每个所述出行地址信息进行分词处理，生成所述待预测用户的至少一个出行标签，包括：

3.根据权利要求1所述的方法，其特征在于，根据以下步骤训练所述目标服务预测模型：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求3或4所述的方法，其特征在于，训练得到所述目标服务预测模型之后，所述方法还包括：

6.根据权利要求4所述的方法，其特征在于，所述基于测试用户的历史出行记录以及所述测试用户选择目标服务的真实结果，确定所述目标服务预测模型的预测准确度，包括：

7.根据权利要求6所述的方法，其特征在于，所述基于所述测试用户选择目标服务的测试概率、所述测试用户选择目标服务的真实结果以及所述测试用户的个数，确定所述目标服务预测模型的预测准确度，包括：

8.根据权利要求1所述的方法，其特征在于，所述得到所述待预测用户选择目标服务的概率之后，所述方法还包括：

9.根据权利要求1所述的方法，其特征在于，所述目标服务为租车服务。

10.一种服务选择预测装置，其特征在于，包括：

11.根据权利要求10所述的装置，其特征在于，所述标签生成模块，具体用于：

12.根据权利要求10所述的装置，其特征在于，还包括模型训练模块，所述模型训练模块用于：

13.根据权利要求12所述的装置，其特征在于，所述模型训练模型还用于：

14.根据权利要求12或13所述的装置，其特征在于，还包括模型测试模块，所述模型测试模块用于：

15.根据权利要求14所述的装置，其特征在于，所述模型测试模块，具体用于：

16.根据权利要求15所述的装置，其特征在于，所述模型测试模块，具体用于：

17.根据权利要求10所述的装置，其特征在于，所述概率确定模块还用于：

18.根据权利要求10所述的装置，其特征在于，所述目标服务为租车服务。

19.一种电子设备，其特征在于，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行时执行如权利要求1至9任一所述的服务选择预测方法的步骤。

20.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至9任一所述的服务选择预测方法的步骤。