CN112767032A

CN112767032A - 一种信息处理方法、装置、电子设备及存储介质

Info

Publication number: CN112767032A
Application number: CN202110090265.5A
Authority: CN
Inventors: 缪莹莹; 董越; 赵茹亚; 杨顺欣
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2021-01-22
Filing date: 2021-01-22
Publication date: 2021-05-07

Abstract

本申请提供了一种信息处理方法、装置、电子设备及存储介质，该方法包括：从多个用户中选取目标预测模型预测准确的第一用户和目标预测模型预测不准确的第二用户；根据第二用户与第一用户的相似性关系，从第一用户中，选取与第二用户相似的目标第一用户；相似性关系用于表征第二用户与第一用户的服务使用行为是否相似；获取目标第一用户的目标用户类型，目标用户类型是根据目标预测模型对目标第一用户的当前预测结果确定的；该当前预测结果是将目标第一用户当前服务属性特征输入到目标预测模型后得到的；将目标第一用户的目标用户类型确定为第二用户的用户类型。这样，提高了目标预测模型对多个用户的整体预测精度且提高了目标预测模型的训练效率。

Description

一种信息处理方法、装置、电子设备及存储介质

技术领域

本申请涉及信息处理技术领域，具体而言，涉及一种信息处理方法、装置、电子设备及存储介质。

背景技术

随着人工智能技术的发展，人工智能技术被越来越多的应用到企业的运营业务中。具体的，基于人工智能技术训练运营业务的预测模型，并将训练好的预测模型应用到运营业务中，以使运营业务为用户提供更好的服务。

实际中，在训练预测模型的过程中，通常是根据用户在历史时间段内针对运营业务的相关特征构建样本数据集，之后，使用上述样本数据集训练预测模型，并在预测模型的相关指标达到要求后，得到训练好的预测模型，该预测模型的预测精度维持在一个目标精度范围内。目前，进一步提升预测模型的预测精度的方式，通常是通过调节预测模型的模型参数或者增加相关特征实现，但是，采用上述提升预测模型的预测精度的方式，无法有效的提高模型的整体预测精度，且降低了预测模型的训练效率。

发明内容

有鉴于此，本申请的目的在于提供一种信息处理方法、装置、电子设备及存储介质，通过从多个用户中选取目标预测模型预测准确的第一用户和预测不准确第二用户，并将与第二用户相似的目标第一用户的目标用户类型确定为该第二用户的用户类型，提高了预测模型对多个用户的整体预测精度且提高了目标预测模型的训练效率。

第一方面，本申请实施例提供了一种信息处理方法，所述方法包括：

从多个用户中选取第一用户和第二用户；所述第一用户为目标预测模型预测准确的用户，所述第二用户为所述目标预测模型预测不准确的用户；所述目标预测模型用于预测用户类型；

根据所述第二用户与所述第一用户的相似性关系，从所述第一用户中，选取与所述第二用户相似的目标第一用户；所述相似性关系用于表征所述第二用户与所述第一用户的服务使用行为是否相似；

获取所述目标第一用户的目标用户类型，所述目标用户类型是根据所述目标预测模型对所述目标第一用户的当前预测结果确定的；所述当前预测结果是将所述目标第一用户当前服务属性特征输入到所述目标预测模型后得到的；

将所述目标第一用户的目标用户类型确定为所述第二用户的用户类型。

结合第一方面，本申请实施例提供了第一方面的第一种可能的实施方式，所述第一用户对应所述目标预测模型的第一预测准确度，所述第二用户对应所述目标预测模型的第二预测准确度；

所述第一预测准确度是根据所述目标预测模型对所述第一用户的历史预测结果和所述第一用户的历史实际结果确定的；所述第二预测准确度是根据所述目标预测模型对所述第二用户的历史预测结果和所述第二用户的历史实际结果确定的；其中，所述历史预测结果与历史实际结果的差值越小，对应的预测准确度越高。

结合第一方面的第一种可能的实施方式，本申请实施例提供了第一方面的第二种可能的实施方式，所述第一用户或者所述第二用户的历史预测结果是，通过将所述第一用户或者所述第二用户在第一历史时间段内的历史服务属性特征输入到所述目标预测模型中得到的；

所述第一用户或者所述第二用户的历史实际结果是，根据所述第一用户或者所述第二用户在第二历史时间段内的指定行为确定的；所述第二历史时间段为与所述第一历史时间段连续的时间段；

所述第一历史时间段和所述第二历史时间段的第一时间长度相同，所述第一时间长度是根据目标服务的业务内容确定的。

结合第一方面的第二种可能的实施方式，本申请实施例提供了第一方面的第三种可能的实施方式，所述目标预测模型是通过目标样本数据集对初始模型训练得到的，所述目标样本数据集是根据所述第一用户和所述第二用户分别对应的历史服务属性特征和历史实际结果构建得到。

结合第一方面的第二种可能的实施方式，本申请实施例提供了第一方面的第四种可能的实施方式，所述第二用户与所述第一用户的相似性关系通过如下方法确定：

根据所述第一用户和第二用户分别对应的服务使用行为，确定所述第二用户与所述第一用户的相似性关系。

结合第一方面的第四种可能的实施方式，本申请实施例提供了第一方面的第五种可能的实施方式，所述根据所述第一用户和第二用户分别对应的服务使用行为，确定所述第二用户与所述第一用户的相似性关系，包括：

获取所述第一用户和所述第二用户在第三历史时间段内的服务使用行为特征；所述第三历史时间段的第二时间长度大于所述第一时间长度；

根据所述服务使用行为特征中所述第一用户和所述第二用户对不同服务使用行为的偏好程度，确定所述第一用户的第一用户特征和所述第二用户的第二用户特征；

根据所述第二用户特征和所述第一用户特征的相似度，建立所述第二用户与所述第一用户的相似性关系。

结合第一方面的第二种可能的实施方式，本申请实施例提供了第一方面的第六种可能的实施方式，所述当前服务属性特征和所述历史服务属性特征的第一特征种类相同；所述第一特征种类是从根据目标服务的业务内容构造的多个特征种类中选取的。

结合第一方面的第六种可能的实施方式，本申请实施例提供了第一方面的第七种可能的实施方式，所述第一特征种类包括以下至少之一：用户使用的出行服务的类型、用户使用各个出行服务的出行时间和出行路线、用户在各个出行服务中的出行频次、用户在各个出行服务中的出行成本、用户属性。

结合第一方面的第五种可能的实施方式，本申请实施例提供了第一方面的第八种可能的实施方式，所述服务使用行为特征的第二特征种类包括：

多个出行维度下所述第一用户和所述第二用户在各个出行服务下的冒泡频次、呼叫频次、完单频次；所述出行维度至少包括：季节维度、工作日维度、假日维度、峰期维度、天气维度、排队情景维度、业务线维度、路线情景维度。

结合第一方面，本申请实施例提供了第一方面的第九种可能的实施方式，在将所述目标第一用户的目标用户类型确定为所述第二用户的用户类型之后，所述方法还包括：

根据所述目标用户类型和目标服务的业务内容，生成所述第二用户对应的目标推送信息；

向所述第二用户发送所述目标推送信息。

结合第一方面，本申请实施例提供了第一方面的第十种可能的实施方式，所述方法还包括：

从所述多个用户中选取除所述第一用户和所述第二用户之外的新用户；

将所述新用户的当前服务属性特征输入到目标预测模型中，并根据所述目标预测模型的当前预测结果，确定所述新用户的用户类型。

第二方面，本申请实施例还提供了一种信息处理装置，所述装置包括：

第一选取模块，用于从多个用户中选取第一用户和第二用户；所述第一用户为目标预测模型预测准确的用户，所述第二用户为所述目标预测模型预测不准确的用户；所述目标预测模型用于预测用户类型；

第二选取模块，用于根据所述第二用户与所述第一用户的相似性关系，从所述第一用户中，选取与所述第二用户相似的目标第一用户；所述相似性关系用于表征所述第二用户与所述第一用户的服务使用行为是否相似；

获取模块，用于获取所述目标第一用户的目标用户类型，所述目标用户类型是根据所述目标预测模型对所述目标第一用户的当前预测结果确定的；所述当前预测结果是将所述目标第一用户当前服务属性特征输入到所述目标预测模型后得到的；

第一确定模块，用于将所述目标第一用户的目标用户类型确定为所述第二用户的用户类型。

结合第二方面，本申请实施例提供了第二方面的第一种可能的实施方式，所述第一用户对应所述目标预测模型的第一预测准确度，所述第二用户对应所述目标预测模型的第二预测准确度；

结合第二方面的第一种可能的实施方式，本申请实施例提供了第二方面的第二种可能的实施方式，所述第一用户或者所述第二用户的历史预测结果是，通过将所述第一用户或者所述第二用户在第一历史时间段内的历史服务属性特征输入到所述目标预测模型中得到的；

结合第二方面的第二种可能的实施方式，本申请实施例提供了第二方面的第三种可能的实施方式，所述目标预测模型是通过目标样本数据集对初始模型训练得到的，所述目标样本数据集是根据所述第一用户和所述第二用户分别对应的历史服务属性特征和历史实际结果构建得到。

结合第二方面的第二种可能的实施方式，本申请实施例提供了第二方面的第四种可能的实施方式，所述装置还包括：

第二确定模块，用于根据所述第一用户和第二用户分别对应的服务使用行为，确定所述第二用户与所述第一用户的相似性关系。

结合第二方面的第四种可能的实施方式，本申请实施例提供了第二方面的第五种可能的实施方式，所述第二确定模块根据所述第一用户和第二用户分别对应的服务使用行为，确定所述第二用户与所述第一用户的相似性关系，包括：

结合第二方面的第二种可能的实施方式，本申请实施例提供了第二方面的第六种可能的实施方式，所述当前服务属性特征和所述历史服务属性特征的第一特征种类相同；所述第一特征种类是从根据目标服务的业务内容构造的多个特征种类中选取的。

结合第二方面的第六种可能的实施方式，本申请实施例提供了第二方面的第七种可能的实施方式，所述第一特征种类包括以下至少之一：用户使用的出行服务的类型、用户使用各个出行服务的出行时间和出行路线、用户在各个出行服务中的出行频次、用户在各个出行服务中的出行成本、用户属性。

结合第二方面的第五种可能的实施方式，本申请实施例提供了第二方面的第八种可能的实施方式，所述服务使用行为特征的第二特征种类包括：

结合第二方面，本申请实施例提供了第二方面的第九种可能的实施方式，所述装置还包括：

生成模块，用于在将所述目标第一用户的目标用户类型确定为所述第二用户的用户类型之后，根据所述目标用户类型和目标服务的业务内容，生成所述第二用户对应的目标推送信息；

发送模块，用于向所述第二用户发送所述目标推送信息。

结合第二方面，本申请实施例提供了第二方面的第十种可能的实施方式，所述装置还包括：

第三选取模块，用于从所述多个用户中选取除所述第一用户和所述第二用户之外的新用户；

第三确定模块，用于将所述新用户的当前服务属性特征输入到目标预测模型中，并根据所述目标预测模型的当前预测结果，确定所述新用户的用户类型。

第三方面，本申请实施例还提供了一种电子设备，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行如第一方面任一项所述的信息处理方法的步骤。

第四方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如第一方面任一项所述的信息处理方法的步骤。

第五方面，本申请实施例还提供了一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被处理器执行时实现第一方面所述信息处理方法的步骤。

本申请实施例提供了一种信息处理方法、装置、电子设备及存储介质，通过从多个用户中选取目标预测模型预测准确的第一用户和预测不准确第二用户，由于第二用户与第一用户具有相似性关系，该相似性关系能够表征第二用户与第一用户的服务使用行为是否相似，而具有相似的服务使用行为的两个用户的模型预测结果通常也是相似的，基于此，本申请中针对模型预测不准确的第二用户，不采用根据目标预测模型对第二用户的当前预测结果确定的第二用户的用户类型，而是，基于第二用户与第一用户的相似性关系，使用目标预测模型预测准确的且与第二用户相似的目标第一用户的目标用户类型来确定第二用户的用户类型，该目标用户类型是根目标预测模型对该目标第一用户的当前预测结果确定的，这样，能够有效的提高目标预测模型对多个用户的整体预测精度，并且，该过程无需通过调节模型参数或者增加相关特征重新训练目标预测模型，提高了目标预测模型的训练效率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例提供的一种信息处理方法的流程图；

图2示出了本申请实施例提供的另一种信息处理方法的流程图；

图3示出了本申请实施例提供的另一种信息处理方法的流程图；

图4示出了本申请实施例提供的另一种信息处理方法的流程图；

图5示出了本申请实施例提供的一种信息处理装置的结构示意图；

图6示出了本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容，结合特定应用场景“网约车领域”，给出以下实施方式。对于本领域技术人员来说，在不脱离本申请的精神和范围的情况下，可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕网约车领域进行描述，但是应该理解，这仅是一个示例性实施例。本申请实施例还可以应用于其他服务领域，比如，外卖领域、跑腿领域等。

需要说明的是，本申请实施例中将会用到术语“包括”，用于指出其后所声明的特征的存在，但并不排除增加其它的特征。

本申请实施例中的术语“用户”可以指代请求服务、订购服务的个人、实体或工具。相应的，上述“用户”与“服务请求方”、“乘客”、“服务请求端”、“用户端”等可以互换。在本申请实施例中，上述用户端可以为电子设备，具体可以是智能手机、平板电脑等电子产品。

目前，训练好的应用于运营业务的预测模型的预测精度通常维持在一个目标精度范围内。目前，进一步提升预测模型的预测精度的方式，通常是通过调节预测模型的模型参数或者增加相关特征实现，但是，采用上述提升预测模型的预测精度的方式，无法有效的提高模型的整体预测精度，且降低了预测模型的训练效率。基于此，本申请实施例提供了一种信息处理方法、装置、电子设备及存储介质，通过从多个用户中选取目标预测模型预测准确的第一用户和预测不准确第二用户，并将与第二用户相似的目标第一用户的目标用户类型确定为该第二用户的用户类型，提高了预测模型对多个用户的整体预测精度且提高了目标预测模型的训练效率。

下面对本申请实施例提供的信息处理方法进行详细说明。

参照图1所示，为本申请第一实施例提供的一种信息处理方法的流程图，所述方法包括：

S101、从多个用户中选取第一用户和第二用户；所述第一用户为目标预测模型预测准确的用户，所述第二用户为所述目标预测模型预测不准确的用户；所述目标预测模型用于预测用户类型。

S102、根据所述第二用户与所述第一用户的相似性关系，从所述第一用户中，选取与所述第二用户相似的目标第一用户；所述相似性关系用于表征所述第二用户与所述第一用户的服务使用行为是否相似。

S103、获取所述目标第一用户的目标用户类型，所述目标用户类型是根据所述目标预测模型对所述目标第一用户的当前预测结果确定的；所述当前预测结果是将所述目标第一用户当前服务属性特征输入到所述目标预测模型后得到的。

S104、将所述目标第一用户的目标用户类型确定为所述第二用户的用户类型。

本申请实施例提供了一种信息处理方法，通过从多个用户中选取目标预测模型预测准确的第一用户和预测不准确第二用户，由于第二用户与第一用户具有相似性关系，该相似性关系能够表征第二用户与第一用户的服务使用行为是否相似，而具有相似的服务使用行为的两个用户的模型预测结果通常也是相似的，基于此，本申请中针对模型预测不准确的第二用户，不采用根据目标预测模型对第二用户的当前预测结果确定的第二用户的用户类型，而是，基于第二用户与第一用户的相似性关系，使用目标预测模型预测准确的且与第二用户相似的目标第一用户的目标用户类型来确定第二用户的用户类型，该目标用户类型是根目标预测模型对该目标第一用户的当前预测结果确定的，这样，能够有效的提高目标预测模型对多个用户的整体预测精度，并且，该过程无需通过调节模型参数或者增加相关特征重新训练目标预测模型，提高了目标预测模型的训练效率。

下面以上述信息处理方法应用于服务器为例，对上述信息处理方法中的各步骤作进一步说明。

其中，服务器中存储有训练好的目标预测模型，该目标预测模型用于预测用户类型。具体的，目标预测模型基于用户在第一时间段内的服务属性特征，预测用户在第二时间段内的用户类型，该第二时间段是与第一时间段连续的时间段。

在模型应用阶段，获取待预测用户类型的多个用户，并使用该目标预测模型预测上述多个用户的用户类型，以便基于这多个用户的用户类型，确定针对这多个用户的目标推送信息；这里，不同的用户类型对应的目标推送信息不同。其中，服务器中预先确定了目标预测模型预测准确的第一用户和目标预测模型预测不准确的第二用户，具体的，服务器中存储有第一用户的第一用户标识和第二用户的第二用户标识，其中，该第一用户标识用于标识第一用户和目标预测模型对第一用户预测准确；该第二用户标识用于标识第二用户和目标预测模型对第二用户预测不准确；之后，服务器通过存储的上述第一用户标识和第二用户标识，能够从获取的多个用户中选取匹配第一用户标识的第一用户和匹配第二用户标识的第二用户。

本申请实施例中，目标预测模型对多个用户中每一个用户的用户类型的具体预测方法包括：针对多个用户中的每个用户，获取该用户在第一时间段内的当前服务属性特征，将该用户的当前服务属性特征输入到上述目标预测模型中，得到该用户在第二时间段内的当前预测结果，并根据该当前预测结果确定该用户的用户类型。这里，当前服务属性特征也即目标预测模型在模型应用阶段获取的服务属性特征。可选的，上述第一时间段内可以是当前时间之前7天内的时间段(比如，当前时间为2020年8月8号，第一时间段可以是2020年8月1号到2020年8月7号的时间段)，上述第二时间段可以是当前时间及之后7天内的时间段(比如，当前时间为2020年8月8号，第二时间段可以是8月8号到2020年8月14号的时间段)。

其中，目标预测模型可以预测上述多个用户中每一个用户的用户类型并进行存储，也可以只预测上述多个用户中第一用户的用户类型并进行存储。

本申请实施例中，服务器中预存有第二用户与第一用户的相似性关系，该相似性关系用于表征第二用户与第一用户的服务使用行为是否相似。服务器根据上述相似性关系，从选取的第一用户中，选取与第二用户相似的目标第一用户，以便通过该目标第一用户的目标用户类型，确定第二用户的用户类型。

本申请实施方式中，在确定了多个用户中每一个用户的用户类型之后或者在确定了多个用户中第一用户的用户类型之后，从多个用户或者从第一用户中选取目标第一用户，并确定该目标第一用户的目标用户类型。

本申请实施例中，针对每一个第二用户的用户类型，若存在该第二用户的用户类型(即目标预测模型预测并保留了该第二用户的用户类型)，则将该用户类型更新为与该第二用户相似的目标第一用户的目标用户类型。若不存在该第二用户的用户类型(即目标预测模型并未预测该第二用户的用户类型)，则直接将与该第二用户相似的目标第一用户的目标用户类型确定为该第二用户的用户类型。

本申请实施例提供了一种信息处理方法，针对模型预测不准确的第二用户，不采用根据目标预测模型对第二用户的当前预测结果确定的第二用户的用户类型，而是，基于第二用户与第一用户的相似性关系，使用目标预测模型预测准确的且与第二用户相似的目标第一用户的目标用户类型来确定第二用户的用户类型，该目标用户类型是根目标预测模型对该目标第一用户的当前预测结果确定的，这样，能够有效的提高目标预测模型对多个用户的整体预测精度，并且，该过程无需通过调节模型参数或者增加相关特征重新训练目标预测模型，提高了目标预测模型的训练效率。

进一步的，本申请实施例提供的信息处理方法中，上述第一用户对应目标预测模型的第一预测准确度，上述第二用户对应目标预测模型的第二预测准确度；其中，上述第一预测准确度和上述第二预测准确度对应不同的用户类型。相应的，目标预测模型预测的第一用户的用户类型是准确的，目标预测模型预测的第二用户的用户类型是不准确的。

其中，上述第一预测准确度是根据目标预测模型对第一用户的历史预测结果和第一用户的历史实际结果确定的；第二预测准确度是根据目标预测模型对第二用户的历史预测结果和第二用户的历史实际结果确定的；其中，历史预测结果与历史实际结果的差值越小，对应的预测准确度越高。

在本申请实施例中，上述第一用户或者上述第二用户的历史预测结果是，通过将第一用户或者第二用户在第一历史时间段内的历史服务属性特征输入到目标预测模型中得到的；上述第一用户或者上述第二用户的历史实际结果是，根据第一用户或者第二用户在第二历史时间段内的指定行为确定的；第二历史时间段为与第一历史时间段连续的时间段；第一历史时间段和第二历史时间段的第一时间长度相同，第一时间长度是根据目标服务的业务内容确定的。

本申请实施例中，由于第一用户在第一历史时间段内针对目标服务的使用行为是稳定的，该稳定指的是第一用户在第一历史时间段内针对目标服务的使用行为与之前相比波动不大，其中，第一用户在第一历史时间段内的历史服务属性特征表征了第一用户在第一历史时间段内针对目标服务的使用行为，因此，在将第一用户在第一历史时间段内的历史服务属性特征输入到目标预测模型之后，目标预测模型得到的第一用户的历史预测结果与该第一用户在第二历史时间段内的历史实际结果相匹配，该相匹配指的是历史预测结果与历史实际结果的差值小于第一预设阈值，其中，当历史预测结果与历史实际结果的差值小于第一预设阈值时，对应目标预测模型的第一预测准确度，也即根据历史预测结果确定的用户类型与根据历史实际结果确定的用户类型相同。

本申请实施例中，由于第二用户在第一历史时间段内针对目标服务的使用行为存在不稳定的问题，该不稳定指的是第二用户在第一历史时间段内针对目标服务的使用行为与之前相比波动较大，其中，第二用户在第一历史时间段内的历史服务属性特征表征了第二用户在第一历史时间段内针对目标服务的使用行为，因此，在将第二用户在第一历史时间段内的历史服务属性特征输入到目标预测模型之后，目标预测模型得到的第二用户的历史预测结果与该第二用户在第二历史时间段内的历史实际结果不匹配，该不匹配指的是历史预测结果与历史实际结果的差值大于第一预设阈值，其中，当历史预测结果与历史实际结果的差值大于第一预设阈值时，对应目标预测模型的第二预测准确度，也即根据历史预测结果确定的用户类型与根据历史实际结果确定的用户类型不同。

其中，当确定了第一用户为目标预测模型预测准确的用户，第二用户为目标预测模型预测不准确的用户后，生成第一用户的第一用户标识和第二用户的第二用户标识，并存储上述第一用户标识和上述第二用户标识；这里，上述第一用户标识用于标识第一用户和目标预测模型对第一用户预测准确；上述第二用户标识用于标识第二用户和目标预测模型对第二用户预测不准确。

本申请实施例中，目标服务的业务内容中包括第一时间长度，该第一时间长度即第一历史时间段和第二历史时间段的时间长度。可选的，上述目标服务可以是出行服务，上述目标服务的业务内容可以是：预测用户在使用出行服务7天内的留存情况，或者是，预测用户在使用出行服务28天内的留存情况。需要说明的是，上述目标服务还可以是网约送餐(即外卖)服务、网约送物服务(即跑腿取送物服务，比如取药送药服务、取货送货服务)。

比如，当前为2020年8月15号，第一历史时间段为2020年8月1号～2020年8月7号，第二历史时间段为与第一历史时间段连续的2020年8月8号～2020年8月14号。

可选的，根据第一用户或者第二用户在第二历史时间段内的指定行为确定第一用户或者第二用户在第二历史时间段的历史实际结果，该历史实际结果表征了第一用户或者第二用户在第二历史时间段的历史实际用户类型。比如，第一用户在第二历史时间段内具有已完成订单，那么，第一用户是留存用户类型，第一用户对应的历史实际结果是100；第二用户在第二历史时间段内没有已完成的订单，那么，第二用户是流失用户类型，第二用户对应的历史实际结果是0。

进一步的，本申请实施例提供的信息处理方法中，上述目标预测模型是通过目标样本数据集对初始模型训练得到的，该目标样本数据集是根据第一用户和第二用户分别对应的历史服务属性特征和历史实际结果构建得到。

本申请实施例中，通过上述第一用户和第二用户分别对应的历史服务属性特征和历史实际结果构建目标样本数据集，之后，通过该目标样本数据集训练上述目标预测模型。可选的，目标样本数据集中还可以包括除第一用户和第二用户之外的其他用户。具体的，目标预测模型的具体训练过程包括：将目标样本数据集中每一个用户对应的历史服务属性特征输入到初始模型中，根据该初始模型输出的历史预测结果和该用户对应的历史实际结果，调整模型参数，当初始模型满足训练截止条件时，得到训练好的目标预测模型。其中，上述训练截止条件包括以下至少之一：模型参数的调整次数达到第二预设阈值、目标预测模型的预测准确度大于等于第三预设阈值。

需要说明的是，本申请实施例中使用的当前服务属性特征和历史服务属性特征均对应第一特征种类，该第一特征种类是从根据目标服务的业务内容构造的多个特征种类中选取的。

其中，上述当前服务属性特征是目标预测模型在应用阶段使用的特征，上述历史服务属性特征是训练目标预测模型时使用的特征，这两个特征对应第一特征种类；其中，在训练目标预测模型时，根据目标服务的业务内容预先构造了多个特征种类，基于多个特征种类对初始模型进行训练，在训练初始模型的过程中，不断在从这多个特征种类中选取第一特征种类，当得到训练好的目标预测模型时，得到从上述多个特征种类中选取的第一特征种类。

可选的，上述第一特征种类包括以下至少之一：用户使用的出行服务的类型、用户使用各个出行服务的出行时间和出行路线、用户在各个出行服务中的出行频次、用户在各个出行服务中的出行成本、用户属性。

上述用户使用的出行服务的类型具体可以为：最近一次出行订单对应什么服务类型、最近五次出行订单对应什么服务类型；上述用户使用各个出行服务的出行时间和出行路线可以为：最近一次出行订单距离当前时间多少天了、最近一次出行订单的具体路线、最近一次出行订单是不是高峰期等；用户在各个出行服务中的出行频次具体可以为：用户在早高峰、晚高峰、闲时段、周六日、节假日等维度下，在各个出行服务中的出行频次；其中，上述出行服务包括拼车服务、快车服务、专车服务、豪华车服务、出租车服务、顺风车服务等。上述用户在各个出行服务中的出行成本可以为：过去7天内拼车业务下的总消费金额；过去7天内拼车服务下的每一个出行订单的消费金额等；上述用户属性特征可以为年龄、性别等。

进一步的，本申请实施例中，根据第一用户和第二用户分别对应的服务使用行为，确定第二用户与第一用户的相似性关系。如图2所示，上述根据所述第一用户和第二用户分别对应的服务使用行为，确定所述第二用户与所述第一用户的相似性关系，具体包括：

S201、获取所述第一用户和所述第二用户在第三历史时间段内的服务使用行为特征；所述第三历史时间段的第二时间长度大于所述第一时间长度。

本申请实施例中，上述服务使用行为特征是用于确定第二用户与第一用户的相似性关系，因此，获取的是第一用户和第二用户在第三历史时间段内的服务使用行为特征，该第三历史时间段的第二时间长度也大于上述第一时间长度；可选的，上述第二时间长度为第一时间长度的整数倍，比如，十倍。比如，上述第一时间长度为14天，这里的第二时间长度可以140天。本申请实施例，通过获取上述第二时间长度内的服务使用行为特征，能够更加准确的确定第一用户和第二用户的相似性关系。

具体的，获取目标样本数据集包括的用户(以下简称为训练用户)的服务使用行为特征，之后，根据这多个训练用户的服务使用行为特征，生成一个高维特征矩阵。其中，每一个训练用户对应一个全排列组合出行维度(总数可达10万，甚至大于10万)的服务使用行为特征(每个服务使用行为特征对应一特征向量)，并且，本申请实施例中使用的训练用户数量庞大，以亿为单位，相应的，将每一个训练用户作为矩阵的一行，每一类服务使用行为特征作为矩阵的一列，得到多个训练用户对应的高维特征矩阵(即多个训练用户对应一个高维特征矩阵)。

在一种实施方式中，上述服务使用行为特征的第二特征种类包括：多个出行维度下所述第一用户和所述第二用户在各个出行服务下的冒泡频次、呼叫频次、完单频次；所述出行维度至少包括：季节维度、工作日维度、假日维度、峰期维度、天气维度、排队情景维度、业务线维度、路线情景维度。

这里，冒泡指的是用户输入出发地或者用户输入出发地和目的地的行为；呼叫指的是在有了出发地和目的地后，用户点击呼叫车辆的行为，这里，车辆类型根据具体的使用场景确定，比如，应用于拼车场景，呼叫指的是用户点击呼叫拼车车辆的行为；完单指的是司机(部分服务也可以是乘客)确认到达终点的行为。

这里，将用户的打车行为量化为全排列组合的各维度下用户历史的冒泡频次、呼叫频次和完单频次，构建出全量近7亿出行用户的打车行为稀疏矩阵R_(n*m)如下：

其中，这里的n代表用户数量，m代表全排列组合维度的总数(通常大于10万，甚至更多)，这里，本申请实施例框定的维度包括但不限于以下几点：四季、工作日、峰期(包括早高峰、晚高峰、节假日高峰期)、天气、排队情景、业务线、路线情景等。

举例来说，r_ij的含义可以表示为某用户i在某排列组合维度j下(例如春天、星期一、早高峰、暴雨天、排队场景、快车、通勤场景)的冒泡/呼叫/完单频次。

S202、根据所述服务使用行为特征中所述第一用户和所述第二用户对不同服务使用行为的偏好程度，确定所述第一用户的第一用户特征和所述第二用户的第二用户特征。

具体实施例中，因为服务使用行为特征中包括每个训练用户对不同服务使用行为的偏好程度，因此，对多个训练用户的服务使用行为特征组成的高维特征矩阵进行矩阵分解，得到多个训练用户对应的低维特征矩阵。

本申请实施例中，采用了一种矩阵分解算法的嵌入方法(即矩阵分解算法)，通过矩阵分解算法离线将高维特征矩阵R_n*m分解为两个低轶矩阵U_n*k和V_k*m的乘积，使得R_n*m＝U_n*k*V_k*m。其中，U_n*k代表用户特征矩阵(对应用户特征)，V_k*m代表服务行为特征矩阵(比如打车行为特征矩阵)，k为一预设常数，一般等于32、64或者128。

其中，想要精准匹配到相似训练用户并不容易，每一个训练用户基于其对不同服务使用行为的偏好程度(比如历史打车行为)都可以被量化为一个大于10万维度，甚至更高的高维稀疏特征向量(该高维稀疏特征向量表征多个种类的服务使用行为特征)，用该高维稀疏的特征向量来进行用户特征表达，不仅会占用大量的存储空间，而且噪音大、泛化能力差，数据的稀疏性也导致也很难衡量训练用户间的相似性。因此，本申请实施例中采用了一种矩阵分解算法的嵌入方法，在构建全量用户的打车行为高维稀疏矩阵(即上述高维特征矩阵)后，通过离线训练将这个高维稀疏矩阵映射为用户特征矩阵和服务行为特征矩阵(比如打车行为特征矩阵)两个低轶矩阵的乘积，将用户和服务行为(比如，打车行为)嵌入到低维空间中，以此解决数据稀疏性的问题，实现了用低维稠密的特征向量(即稠密向量)表示每一个训练用户的用户特征，稠密向量的每一个隐因子(Latent Features)可以认为是没有实际意义的，相似的训练用户往往会具有相似的稠密向量，因此，训练用户之间的相似性变可以简单的利用稠密向量之间的角度来衡量，也就是向量之间的向量空间余弦相似度(Cosine Similarity)。

S203、根据所述第二用户特征和所述第一用户特征的相似度，建立所述第二用户与所述第一用户的相似性关系。

本申请实施例中，通过计算第二用户的第一用户特征和第一用户的第二用户特征的相似度，建立第二用户与第一用户的相似性关系。其中，计算第二用户特征和第一用户特征的相似度的方法为，计算第一用户特征(对应一个稠密向量)和第二用户特征(对应另一个稠密向量)的空间余弦相似度(Cosine Similarity)。

在本申请实施例的一种应用场景中，在将所述目标第一用户的目标用户类型确定为所述第二用户的用户类型之后，可以基于确定的第二用户的目标用户类型确定目标服务针对该第二用户的运营策略，进一步的，如图3所示，在将所述目标第一用户的目标用户类型确定为所述第二用户的用户类型之后，所述方法还包括：

S301、根据所述目标用户类型和目标服务的业务内容，生成所述第二用户对应的目标推送信息。

S302、向所述第二用户发送所述目标推送信息。

结合步骤301和步骤302，上述目标推送信息可以是在网约车运营方案下的推送信息，比如，为优惠券。本申请实施例中，根据目标用户类型和目标服务的业务内容，确定目标推送信息，之后，向第二用户发送目标推送信息。其中，不同用户类型对应的目标推送信息不同。这里，首先根据目标服务的业务内容确定不同用户类型分别对应的推送信息，比如，出行服务器的拼车业务下，推送信息可以是2元优惠券和5元优惠券。之后，根据目标用户类型，确定匹配该目标用户类型的目标推送信息，比如，留存用户类型对应的优惠券为2元，流失用户类型对应的优惠券为5元。

进一步的，如图4所示，本申请实施例提供的信息处理方法，所述方法还包括：

S401、从所述多个用户中选取除所述第一用户和所述第二用户之外的新用户。

S402、将所述新用户的当前服务属性特征输入到目标预测模型中，并根据所述目标预测模型的当前预测结果，确定所述新用户的用户类型。

结合步骤401和步骤402，从多个用户中选取除第一用户和第二用户之外的新用户，之后，将新用户的当前服务属性特征输入到目标预测模型中，能够得到的新用户的用户类型，之后，同样，根据新用户的用户类型和目标服务的业务内容，生成用于推送给新用户的目标推送信息，并向新用户发送目标推送信息。这里，无论新用户的用户类型是否与第一用户或者第二用户的用户类型相同，用于推送给新用户的目标推送信息可以与用于推送给第一用户或者第二用户的目标推送信息不同。

另外，针对第一用户，同样，根据第一用户的用户类型和目标服务的业务内容，生成用于推送给第一用户的目标推送信息，并向第一用户发送目标推送信息。可选的，当第一用户的用户类型与第二用户的用户类型相同时，用于推送给第一用户的目标推送信息可以与用于推送给第二用户的目标推送信息相同。

基于同一发明构思，本申请第二实施例中还提供了与第一实施例中信息处理方法对应的信息处理装置，由于本申请第二实施例中的装置解决问题的原理与本申请第一实施例上述信息处理方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

参照图5所示，为本申请第二实施例提供的一种信息处理装置，所述装置包括：

第一选取模块501，用于从多个用户中选取第一用户和第二用户；所述第一用户为目标预测模型预测准确的用户，所述第二用户为所述目标预测模型预测不准确的用户；所述目标预测模型用于预测用户类型；

第二选取模块502，用于根据所述第二用户与所述第一用户的相似性关系，从所述第一用户中，选取与所述第二用户相似的目标第一用户；所述相似性关系用于表征所述第二用户与所述第一用户的服务使用行为是否相似；

第一获取模块503，用于获取所述目标第一用户的目标用户类型，所述目标用户类型是根据所述目标预测模型对所述目标第一用户的当前预测结果确定的；所述当前预测结果是将所述目标第一用户当前服务属性特征输入到所述目标预测模型后得到的；

第一确定模块504，用于将所述目标第一用户的目标用户类型确定为所述第二用户的用户类型。

在一种实施方式中，所述第一用户对应所述目标预测模型的第一预测准确度，所述第二用户对应所述目标预测模型的第二预测准确度；

所述第一预测准确度是根据所述目标预测模型对所述第一用户的历史预测结果和所述第一用户的历史实际结果确定的；所述第二预测准确度是根据所述目标预测模型对所述第二用户的历史预测结果和所述第二用户的历史实际结果确定的；

其中，所述历史预测结果与历史实际结果的差值越小，对应的预测准确度越高。

在一种实施方式中，所述第一用户或者所述第二用户的历史预测结果是，通过将所述第一用户或者所述第二用户在第一历史时间段内的历史服务属性特征输入到所述目标预测模型中得到的；

在一种实施方式中，所述目标预测模型是通过目标样本数据集对初始模型训练得到的，所述目标样本数据集是根据所述第一用户和所述第二用户分别对应的历史服务属性特征和历史实际结果构建得到。

在一种实施方式中，所述装置还包括：

在一种实施方式中，所述第二确定模块根据所述第一用户和第二用户分别对应的服务使用行为，确定所述第二用户与所述第一用户的相似性关系，包括：

在一种实施方式中，所述当前服务属性特征和所述历史服务属性特征的第一特征种类相同；所述第一特征种类是从根据目标服务的业务内容构造的多个特征种类中选取的。

在一种实施方式中，所述第一特征种类包括以下至少之一：用户使用的出行服务的类型、用户使用各个出行服务的出行时间和出行路线、用户在各个出行服务中的出行频次、用户在各个出行服务中的出行成本、用户属性。

在一种实施方式中，所述服务使用行为特征的第二特征种类包括：

在一种实施方式中，所述装置还包括：

发送模块，用于向所述第二用户发送所述目标推送信息。

在一种实施方式中，所述装置还包括：

本申请实施例提供了一种信息处理装置，通过从多个用户中选取目标预测模型预测准确的第一用户和预测不准确第二用户，由于第二用户与第一用户具有相似性关系，该相似性关系能够表征第二用户与第一用户的服务使用行为是否相似，而具有相似的服务使用行为的两个用户的模型预测结果通常也是相似的，基于此，本申请中针对模型预测不准确的第二用户，不采用根据目标预测模型对第二用户的当前预测结果确定的第二用户的用户类型，而是，基于第二用户与第一用户的相似性关系，使用目标预测模型预测准确的且与第二用户相似的目标第一用户的目标用户类型来确定第二用户的用户类型，该目标用户类型是根目标预测模型对该目标第一用户的当前预测结果确定的，这样，能够有效的提高目标预测模型对多个用户的整体预测精度，并且，该过程无需通过调节模型参数或者增加相关特征重新训练目标预测模型，提高了目标预测模型的训练效率。

如图6所示，本申请第三实施例还提供了一种电子设备600，所述电子设备600包括：处理器601、存储器602和总线，所述存储器602存储有所述处理器601可执行的机器可读指令，当电子设备运行时，所述处理器601与所述存储器602之间通过总线通信，所述处理器601执行所述机器可读指令，以执行如上述第一实施例提供的信息处理方法的步骤。

具体地，上述存储器602和处理器601能够为通用的存储器和处理器，这里不做具体限定，当处理器601运行存储器602存储的计算机程序时，能够执行上述第一实施例提供的信息处理方法。

对应于上述第一实施例提供的信息处理方法，本申请第四实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行上述第一实施例提供的信息处理方法的步骤。

进一步的，本申请第五实施例还提供了一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被处理器执行时实现上述第一实施例中信息处理方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考方法实施例中的对应过程，本申请中不再赘述。在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种信息处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的信息处理方法，其特征在于，所述第一用户对应所述目标预测模型的第一预测准确度，所述第二用户对应所述目标预测模型的第二预测准确度；

3.根据权利要求1所述的信息处理方法，其特征在于，所述目标预测模型是通过目标样本数据集对初始模型训练得到的，所述目标样本数据集是根据所述第一用户和所述第二用户分别对应的历史服务属性特征和历史实际结果构建得到。

4.根据权利要求1所述的信息处理方法，其特征在于，根据所述第一用户和第二用户分别对应的服务使用行为，确定所述第二用户与所述第一用户的相似性关系，包括：

获取所述第一用户和所述第二用户在第三历史时间段内的服务使用行为特征；

5.根据权利要求1所述的信息处理方法，其特征在于，在将所述目标第一用户的目标用户类型确定为所述第二用户的用户类型之后，所述方法还包括：

向所述第二用户发送所述目标推送信息。

6.根据权利要求1所述的信息处理方法，其特征在于，所述方法还包括：

7.一种信息处理装置，其特征在于，所述装置包括：

8.一种电子设备，其特征在于，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行如权利要求1至6任一项所述的信息处理方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至6任一项所述的信息处理方法的步骤。

10.一种计算机程序产品，包括计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时实现权利要求1所述信息处理方法的步骤。