CN111353094A

CN111353094A - 一种信息推送方法及装置

Info

Publication number: CN111353094A
Application number: CN201811591332.6A
Authority: CN
Inventors: 贺永正; 丁建栋; 杨育; 石贤芝
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2018-12-20
Filing date: 2018-12-20
Publication date: 2020-06-30

Abstract

本申请公开了一种信息推送方法及装置，涉及计算机技术领域，以提升信息推送的效果。本申请所述的信息推送方法包括：获取用于表征目标用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值；针对每个所述推送信息，将该推送信息对应的所述多个历史行为特征的特征值，分别输入至与该推送信息的信息类别对应的选择概率预测模型中，获取所述目标用户选择该信息类别中的推送信息的选择概率；根据所述目标用户选择每种信息类别中的推送信息的选择概率，确定针对所述目标用户的目标推送信息类别，并基于确定的目标推送信息类别，确定目标推送信息。

Description

一种信息推送方法及装置

技术领域

本申请涉及计算机技术领域，尤其是涉及一种信息推送方法及装置。

背景技术

目前，信息提供方向用户进行信息推送时，通常使用人工设计信息推送策略，向用户推送的推送信息的种类和数量很大程度上依赖制定推送策略的工作人员的经验，受工作人员主观因素的影响较大，在信息推送时具有一定的盲目性和低效性，推送给用户的信息往往是用户不需要的，无法做到针对用户的个性化需求进行有针对性的推送，造成推送效果较差，而且浪费人力成本和网络资源。

发明内容

有鉴于此，本申请的目的在于提供一种信息推送方法及装置，能够针对用户的个性化需求进行有针对的信息推送，以提升信息推送的效果。

第一方面，本申请实施例提供了一种信息推送方法，包括：

获取用于表征目标用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值；

针对每个所述推送信息，将该推送信息对应的所述多个历史行为特征的特征值，分别输入至与该推送信息的信息类别对应的选择概率预测模型中，获取所述目标用户选择该信息类别中的推送信息的选择概率；

根据所述目标用户选择每种信息类别中的推送信息的选择概率，确定针对所述目标用户的目标推送信息类别，并基于确定的目标推送信息类别，确定目标推送信息。

一种可能的实施方式中，采用下述方式生成所述推送信息类别：

针对每个所述推送信息，获取用于表征该推送信息的特征向量；

基于各个所述推送信息的所述特征向量，对多个所述推送信息进行聚类，得到至少一个推送信息类别。

一种可能的实施方式中，所述对多个所述推送信息进行聚类，包括：

从多个所述推送信息中，随机确定预设数量个推送信息作为簇中心；并根据各个所述推送信息的特征向量，将各个所述推送信息划分到各个所述簇中心对应的簇中；

针对每个簇，计算该簇中所有推送信息到该簇的簇中心之间的总距离，以及用于表征该簇中推送信息之间紧密程度和该簇中的推送信息与其他簇中的推送信息之间的分离程度的轮廓系数；

检测各个簇对应的所述总距离之和是否小于预设的距离阈值，且各个簇对应的轮廓系数之和是否大于预设的轮廓系数阈值；

如果各个簇对应的所述总距离之和不小于预设的距离阈值，和/或，各个簇对应的轮廓系数之和不大于预设的轮廓系数阈值，则返回从多个所述推送信息中，随机确定预设数量个推送信息作为簇中心的步骤；

如果各个簇对应的总距离之和小于预设的距离阈值，且各个簇对应的的轮廓系数之和大于预设的轮廓系数阈值，将最后一次聚类形成的各个簇确定为对应的各个推送信息类别。

检测迭代次数是否达到预设的迭代次数阈值；

若检测迭代次数未达到所述预设的迭代次数阈值，则结束本次迭代过程，并返回从多个所述推送信息中，随机确定预设数量个推送信息作为簇中心的步骤；

若检测迭代次数达到所述预设的迭代次数阈值，则从各次迭代过程中，选择总距离以及轮廓系数均满足预设条件的迭代过程，并将选择的该迭代过程中形成的各个簇确定为对应的各个推送信息类别。

一种可能的实施方式中，根据各个所述推送信息的特征向量，将各个所述推送信息划分到各个所述簇中心对应的簇中，包括：

将未完成分类的推送信息中任意一个推送信息确定为当前推送信息，根据当前推送信息的特征向量，以及当前簇中心的特征向量，计算当前推送信息与各个簇中心之间的距离；

将当前推送信息划分到与其距离最近的簇中心对应的簇中；

更新该簇的簇中心的特征向量，将当前推送信息作为完成分类的推送信息，并返回至将未完成分类的推送信息中任意一个推送信息确定为当前推送信息的步骤，直至所有推送信息都完成分类。

一种可能的实施方式中，计算该簇中用于表征该簇中推送信息之间紧密程度和该簇中的推送信息与其他簇中的推送信息之间的分离程度的轮廓系数，包括：

针对每个簇，计算该簇中每两个推送信息之间的距离；

根据该簇中每两个推送信息之间的距离，计算该簇中每两个推送信息之间的第一平均距离；以及

计算该簇中每个推送信息，与其他每个簇中各个推送信息之间的距离；

根据该簇中每个推送信息，与其他每个簇中各个推送信息之间的距离，计算该簇中每个推送信息与其他每个簇中各个推送信息之间的第二平均距离；

根据所述第一平均距离以及所述第二平均距离，计算该簇的轮廓系数。

一种可能的实施方式中，所述获取用于表征该推送信息的特征向量，包括：

根据各个所述推送信息，确定所述推送信息在多个推送信息特征下的特征值；

基于所述推送信息在多个推送信息特征下的特征值，构建所述推送信息的特征向量。

一种可能的实施方式中，推送信息特征包括：所述推送信息的使用概率。

一种可能的实施方式中，推送信息特征还包括：所述推送信息的数量、所述推送信息的价格、所述推送信息的选择概率和所述推送信息的成本中一种或者多种。

一种可能的实施方式中，所述历史行为特征包括以下一种或者多种：

目标用户选择任一所述推送信息的次数，所述任一推送信息的内容，所述任一推送信息的数量，所述任一推送信息的价格，目标用户使用所述任一推送信息的次数，目标用户基于所述任一推送信息产生的交易次数，目标用户基于所述任一推送信息产生的交易额，目标用户由于使用所述任一推送信息产生的交易时间，目标用户的价格敏感度和目标用户的购买力。

一种可能的实施方式中，采用下述方式训练与各个所述推送信息类别对应的选择概率预测模型：

针对每个推送信息类别，构建与该推送信息类别对应的训练样本集以及测试样本集；其中，与该推送信息类别对应的训练样本集和测试样本集中均包括多个样本用户；

针对所述测试样本集以及所述训练样本集中的各个样本用户，获取该样本用户对对应的推送信息选择和使用的历史行为特征的特征值，以及对对应的推送信息进行选择的选择概率；

根据所述测试样本集以及所述训练样本集中的各个样本用户对的历史行为特征的特征值，以及对应的选择概率，训练该推送信息类别对应的选择概率预测模型。

一种可能的实施方式中，所述获取该样本用户对对应的推送信息进行选择的选择概率具体包括：

根据该样本用户对对应的推送信息选择和使用的样本历史行为信息，确定该样本用户对其所选择的推送信息的使用率；

若所述使用率小于预设的使用率阈值，则将该样本用户确定为负样本，该样本用户对应的选择概率确定为0；

若所述使用率不小于预设的使用率阈值，则将该样本用户确定为正样本，该样本用户对应的选择概率确定为1。

一种可能的实施方式中，所述基于各个样本用户的所述样本历史行为特征的特征值以及选择概率，训练该推送信息类别对应的选择概率预测模型，包括：

从多个所述历史行为特征中，随机确定多个目标历史行为特征；

基于所述训练样本集中的样本用户在所述各个目标历史行为特征下的特征值，构建当前迭代周期的决策树；

基于当前迭代周期的决策树，以及历史迭代周期的决策树，构成当前决策树集；

基于所述测试样本集中的样本用户在各个所述目标历史行为特征下的特征值，以及对应的选择概率对所述当前决策树集进行验证，确定所述当前决策树集的误差；

在所述误差大于预设的误差阈值的情况下，完成当前迭代周期，并返回至从多个所述历史行为特征中，随机确定多个目标历史行为特征的步骤；

在所述误差不大于预设的误差阈值的情况下，将所述当前决策树集确定为所述选择概率预测模型。

一种可能的实施方式中，所述基于所述测试样本集中的样本用户在各个所述目标历史行为特征下的特征值，以及对应的选择概率对所述当前决策树集进行验证，确定所述当前决策树集的误差，包括：

基于所述测试样本集中的样本用户，在与当前决策树集中各个决策树对应的目标历史行为特征下的特征值，确定当前决策树集中各个决策树的子预测结果；

根据当前决策树集中各个决策树的子预测结果，确定所述测试样本集中样本用户的预测结果；

基于所述测试样本集中各个样本用户的预测结果，以及所述测试样本集中各个样本用户对应的选择概率，计算所述误差。

一种可能的实施方式中，所述根据当前决策树集中各个决策树的子预测结果，确定所述测试样本集中样本用户的预测结果，包括：

将所述测试样本集中样本用户对应的各个决策树的子预测结果进行加权求和，确定所述测试样本集中样本用户的预测结果。

一种可能的实施方式中，采用下述步骤确定所述推送信息：

获取多个待选推送信息，并获取用于表征多个用户对所述多个待选推送信息进行选择和使用的历史行为信息；

根据各个所述待选推送信息对应的历史行为信息，计算每个所述待选推送信息的增量回报率；

将所述增量回报率大于预设回报率阈值的待选推送信息确定为所述推送信息。

一种可能的实施方式中，所述方法还包括：确定至少一个区域范围；

所述生成所述推送信息类别，还包括：

针对至少一个区域范围，获取该区域范围内的所述推送信息，及该区域范围内的推送信息对应的特征向量；

基于该区域范围内的推送信息对应的特征向量，对该区域范围内的所述推送信息进行聚类，得到该区域范围内的所述推送信息的至少一个推送信息类别。

一种可能的实施方式中，所述确定至少一个区域范围，包括：

获取所述推送信息的对应的样本用户所在的地理位置；

基于每个样本用户所在的地理位置，确定至少一个区域范围。

一种可能的实施方式中，所述基于每个样本用户所在的地理位置，确定至少一个区域范围，包括：

基于每个样本用户所在的地理位置，获取所述地理位置中包含的至少一个城市；

基于所述至少一个城市，构建用于聚类的区域特征向量；

根据所述区域特征向量，对所述地理位置进行聚类，得到至少一个类；

基于每个类，确定与该类对应的一个区域范围。

一种可能的实施方式中，所述确定针对所述目标用户的目标推送信息类别包括：

根据所述目标用户对各个推送信息类别中的推送信息选择的选择概率的大小，选择概率的最大的前预定数量个推送信息类别，为至少一个确定的目标推送信息类别。

一种可能的实施方式中，所述基于确定的目标推送信息类别，确定目标推送信息，包括：

在所述确定的推送信息类别中，随机选择预定数量个推送信息，确定为目标推送信息。

在每个确定的推送信息类别中，各随机选择预定数量个推送信息，确定为目标推送信息。

第二方面，本申请实施例还提供一种信息推送装置，包括：

获取模块，拥有获取用于表征目标用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值；

选择概率预测模块，用于针对每个所述推送信息，将该推送信息对应的所述多个历史行为特征的特征值，分别输入至与该推送信息的信息类别对应的选择概率预测模型中，获取所述目标用户选择该信息类别中的推送信息的选择概率；

目标推送信息类别确定模块，用于根据所述目标用户选择每种信息类别中的推送信息的选择概率，确定针对所述目标用户的目标推送信息类别；

目标推送信息确定模块，用于基于确定的目标推送信息类别，确定目标推送信息。

一种可能的设计中，所述装置，还包括：

推送信息分类模块，用于采用下述方式生成所述推送信息类别：

一种可能的设计中，所述推送信息分类模块，还用于从多个所述推送信息中，随机确定预设数量个推送信息作为簇中心；并根据各个所述推送信息的特征向量，将各个所述推送信息划分到各个所述簇中心对应的簇中；

检测迭代次数是否达到预设的迭代次数阈值；

一种可能的设计中，所述推送信息分类模块，还用于将未完成分类的推送信息中任意一个推送信息确定为当前推送信息，根据当前推送信息的特征向量，以及当前簇中心的特征向量，计算当前推送信息与各个簇中心之间的距离；

将当前推送信息划分到与其距离最近的簇中心对应的簇中；

一种可能的设计中，所述推送信息分类模块，还用于针对每个簇，计算该簇中每两个推送信息之间的距离；

一种可能的设计中，所述推送信息分类模块，还用于根据各个所述推送信息，确定所述推送信息在多个推送信息特征下的特征值；

一种可能的设计中，推送信息特征包括：所述推送信息的使用概率。

一种可能的设计中，推送信息特征还包括：所述推送信息的数量、所述推送信息的价格、所述推送信息的选择概率和所述推送信息的成本中一种或者多种。

一种可能的设计中，所述历史行为特征包括以下一种或者多种：

一种可能的设计中，所述装置，还包括：选择概率预测模型训练模块，用于针对每个推送信息类别，构建与该推送信息类别对应的训练样本集以及测试样本集；其中，与该推送信息类别对应的训练样本集和测试样本集中均包括多个样本用户；

一种可能的设计中，所述选择概率预测模型训练模块，还用于根据该样本用户对对应的推送信息选择和使用的样本历史行为信息，确定该样本用户对其所选择的推送信息的使用率；

一种可能的设计中，所述选择概率预测模型训练模块，还用于从多个所述历史行为特征中，随机确定多个目标历史行为特征；

一种可能的设计中，所述选择概率预测模型训练模块，还用于基于所述测试样本集中的样本用户，在与当前决策树集中各个决策树对应的目标历史行为特征下的特征值，确定当前决策树集中各个决策树的子预测结果；

一种可能的设计中，所述选择概率预测模型训练模块，还用于将所述测试样本集中样本用户对应的各个决策树的子预测结果进行加权求和，确定所述测试样本集中样本用户的预测结果。

一种可能的设计中，所述装置，还包括：推送信息预处理模块，用于获取多个待选推送信息，并获取用于表征多个用户对所述多个待选推送信息进行选择和使用的历史行为信息；

一种可能的设计中，所述装置，还包括：区域确定模块，用于确定至少一个区域范围；

推送信息分类模块，还用于针对至少一个区域范围，获取该区域范围内的所述推送信息，及该区域范围内的推送信息对应的特征向量；

一种可能的设计中所述区域确定模块，还用于获取所述推送信息的对应的样本用户所在的地理位置；

一种可能的设计中，所述区域确定模块，还用于基于每个样本用户所在的地理位置，获取所述地理位置中包含的至少一个城市；

基于所述至少一个城市，构建用于聚类的区域特征向量；

基于每个类，确定与该类对应的一个区域范围。

一种可能的设计中，所述目标推送信息类别确定模块，具体用于按照所述目标用户对各个推送信息类别中的推送信息选择的选择概率的大小，对每个推送信息类别进行排序，选择概率的最大的前预定数量个推送信息类别，为至少一个确定的目标推送信息类别。

一种可能的设计中，所述目标推送信息确定模块，具体用于在所述确定的推送信息类别中，随机选择预定数量个推送信息，确定为目标推送信息。

一种可能的设计中，所述目标推送信息确定模块，还用于在每个确定的推送信息类别中，各随机选择预定数量个推送信息，确定为目标推送信息。

第三方面，本申请实施例还提供一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行上述第一方面，或第一方面中任一种可能的实施方式中的步骤。

第四方面，本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述第一方面，或第一方面中任一种可能的实施方式中的步骤。

本申请实施例提供的信息推送方法及装置，获取用于表征目标用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值，并使用与推送信息的信息类别对应的选择概率预测模型对上述多个历史行为特征的特征值进行计算，确定所述目标用户选择该信息类别中的推送信息的选择概率，基于上述选择概率确定针对所述目标用户的目标推送信息类别和目标推送信息。与现有技术中的人工设计推送策略相比，提高了信息推送的针对性和推送效率，并且在进行信息推送之前，提前自动预测用户对推送信息的选择概率，并基于该选择概率进行信息推送，节省了人工推算的人力成本，并提升了信息推送的准确性，进一步提高了承载信息的网络资源的利用率。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本申请一些实施例的业务需求影响因素确定方法应用的一种场景下的系统100框图；

图2示出根据本申请的一些实施例的可以实现本申请思想的服务器110、服务请求方终端130、服务提供方终端140的电子设备200的示例性硬件和软件组件的示意图；

图3示出了本申请实施例所提供的一种信息推送方法的流程图；

图4示出了本申请实施例所提供的一种信息推送方法具体应用的流程图；

图5示出了本申请实施例所提供的一种信息推送方法中选择概率预测模型的训练方法架构图；

图6示出了本申请实施例所提供的一种信息推送装置的结构示意图；

图7示出了本申请实施例提供一种信息推送装置的整体框架示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

目前，信息提供方向用户进行信息推送时，通常使用人工设计信息推送策略，向用户推送的推送信息的种类和数量很大程度上依赖制定推送策略的工作人员的经验，受工作人员主观因素的影响较大，因此具有一定的盲目性和低效性，无法做到针对目标用户的精准推送，导致人力和网络资源的浪费。

基于此，本申请实施例提供了一种信息推送方法及装置，提高信息推送的针对性和推送效率，在进行信息推送之前，提前预测用户对多个推送信息中每个推送信息的选择概率，并根据预测得到的选择概率，来确定针对用目标用户的目标推送信息，并将确定的目标推送信息推送给目标用户，实现了针对目标用户的个性化需求有针对性的向用户推送信息，以提升信息推送的效果，节省人力成本，提高网络资源利用率。

另外，本申请实施例在预测用户对各个推送信息的选择概率时，是基于表征用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值，以及预先训练的与每个推送信息类别对应的选择概率预测模型来进行的，应用在网约车领域的优惠资源推送中，能够基于乘客对优惠资源套餐进行选择和使用的历史行为特征，以及待要推送的资源套餐的类别对应的选择概率预测模型，来为乘客选择推送的优惠资源套餐，使得推送更有针对性和方向性，达到提前自动化预测进行本次信息推送结果，并基于预测结果进行准确性的信息推送，可以降低人力成本、提升承载推送信息的网络资源的利用率。

本申请所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容，结合特定应用场景“网约车出行场景”做相关介绍。对于本领域技术人员来说，在不脱离本申请的精神和范围的情况下，可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕预测网约车乘客的对多个推送信息的选择概率进行描述，但是应该理解，这仅是一个示例性实施例。本申请可以应用于任何其他交通运输类型。例如，本申请可以应用于不同的运输系统环境，包括陆地，海洋，或航空等，或其任意组合。运输系统的交通工具可以包括出租车、私家车、顺风车、公共汽车、火车、子弹头列车、高速铁路、地铁、船只、飞机、宇宙飞船、热气球、或无人驾驶车辆等，或其任意组合。本申请还可以包括用于基于互联网为用户提供服务的任何服务系统，例如，用于发送和/或接收快递的系统、用于买卖双方交易的服务系统。本申请的系统或方法的应用可以包括网页、浏览器的插件、客户端终端、定制系统、内部分析系统、或人工智能机器人等，或其任意组合。

需要说明的是，本申请实施例中将会用到术语“包括”，用于指出其后所声明的特征的存在，但并不排除增加其它的特征。

图1是本申请一些实施例的信息推送方法应用的一种场景下的系统100框图。例如，系统100可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。系统100可以包括服务器110、网络120、服务请求方终端130、服务提供方终端140和数据库150中的一种或多种，服务器110中可以包括执行指令操作的处理器112。本申请实施例提供的业务需求确定方法可以应用于上述系统100中的服务器110，具体可以由处理器112执行相关操作指令。

图2示出根据本申请的一些实施例的可以实现本申请思想的服务器110的电子设备200的示例性硬件和软件组件的示意图。例如，处理器112可以用于电子设备200上，并且用于执行本申请中的功能。

电子设备200可以是通用计算机或特殊用途的计算机，两者都可以用于实现本申请的业务需求确定方法。本申请尽管仅示出了一个计算机，但是为了方便起见，可以在多个类似平台上以分布式方式实现本申请描述的功能，以均衡处理负载。

例如，电子设备200可以包括连接到网络的网络端口210、用于执行程序指令的一个或多个处理器220、通信总线230、和不同形式的存储介质240，例如，磁盘、ROM、或RAM，或其任意组合。示例性地，计算机平台还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备200还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(Input/Output，I/O)接口250。

为了便于说明，在电子设备200中仅描述了一个处理器。然而，应当注意，本申请中的电子设备200还可以包括多个处理器，因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如，若电子设备200的处理器执行步骤A和步骤B，则应该理解，步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如，处理器执行步骤A，第二处理器执行步骤B，或者处理器和第二处理器共同执行步骤A和B。

为便于对本实施例进行理解，首先对本申请实施例所公开的一种信息推送方法进行详细介绍。

实施例一

如图3所示，本申请实施例一提供的一种信息推送方法，包括：

S301：获取用于表征目标用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值。

示例性的，所述历史行为特征包括以下一种或者多种：

目标用户选择任一所述推送信息的次数，所述任一推送信息的内容，所述任一推送信息的数量，所述任一推送信息的价格，目标用户使用所述任一推送信息的次数，目标用户基于所述任一推送信息产生的交易次数，目标用户基于所述任一推送信息产生的交易额，目标用户由于使用所述任一推送信息产生的交易时间，目标用户的价格敏感度和目标用户的购买力。这里，所述任一推送信息的内容可以包括：推送信息的全部文字内容、推送信息的摘要、或推送信息的标签等。

在一些实施例中，可以获取全部历史行为特征的全部特征值，也可以获取预定时间范围内的历史行为特征的特征值。

在一些实施例中，在获取了用于表征目标用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值之后，可以首先对多个历史行为特征的特征值进行清洗，清除多个历史行为特征的特征值中的异常数据。并且，计算每个历史行为特征的特征值的相关性，剔除相关性较高的历史行为特征的特征值。

这里，由于本申请实施例获取了用于表征目标用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值，因此，可以对通过对推送信息进行推送后能够得到的收益进行评估，对推送信息进行过滤，在进行目标推送信息选择时，只将满足预设收益阈值的推送信息作为待选的推送信息进行选择概率的计算，避免造成预算资源的浪费。

在一些实施例中，可以采用下述步骤确定所述推送信息：

获取多个待选推送信息，并获取用于表征多个用户对所述多个待选推送信息进行选择和使用的历史行为信息；根据各个所述待选推送信息对应的历史行为信息，计算每个所述待选推送信息的增量回报率；将所述增量回报率大于预设回报率阈值的待选推送信息确定为所述推送信息。

在一些实施例中，所述计算每个所述推送信息的增量回报率，包括：

获取所述用户基于所述待选推送信息产生的增量交易额，和所述用户基于所述待选推送信息产生的增量净成本；根据所述增量交易额和所述增量净成本，计算所述增量回报率。

进一步的，在一些实施例中，还可以获取推送信息的类型，获取每个类型的推送信息的数量，根据每个类型的推送信息的数量，获取每个类型的推送信息的数量占推送信息的总数量的比例，将推送信息的数量占推送信息的总数量的比例大于预设阈值的推送信息类型中的推送信息，确定为所述推送信息。

这样做，可以简化计算并降低计算量，并且可以使目标推送信息的选择更有效率、更有针对性。

由于不同区域范围，例如，不同城市中，目标用户的平均购买力、目标用户对推送信息的选择和使用方式的偏好、以及推送信息的推送方式等有很大的差别，从不同区域范围的推送信息中提取的推送信息的特征向量可能存在一定得到差异。因此，在一种可能的实施方式中，所述方法还包括：确定至少一个区域范围；

在一些实施例中，所述生成所述推送信息类别，还包括：

针对至少一个区域范围，获取该区域范围内的所述推送信息，及该区域范围内的推送信息对应的特征向量；基于该区域范围内的推送信息对应的特征向量，对该区域范围内的所述推送信息进行聚类，得到该区域范围内的所述推送信息的至少一个推送信息类别。

所述确定至少一个区域范围，包括：

获取所述推送信息的对应的样本用户所在的地理位置；基于每个样本用户所在的地理位置，确定至少一个区域范围。

所述基于每个样本用户所在的地理位置，确定至少一个区域范围，包括：

基于每个样本用户所在的地理位置，获取所述地理位置中包含的至少一个城市；基于所述至少一个城市，构建用于聚类的区域特征向量；根据所述区域特征向量，对所述地理位置进行聚类，得到至少一个类；基于每个类，确定与该类对应的一个区域范围。

针对每个区域范围中的推送信息，生成推送信息类别，并使用该区域范围中的每个推送信息的信息类别对应的选择概率预测模型，分别对多个历史行为特征的特征值进行计算，获取该区域范围中的目标用户对每个个推送信息的信息类别中的推送信息的选择概率，从而根据上述选择概率，确定目标推送信息类别和目标推送信息。由于划分了区域范围，针对每个区域范围内的推送信息进行研究和计算更有针对性，获得的历史行为特征的特征值更有代表性，可以防止由于不同区域范围内目标用户的平均购买力、目标用户对推送信息的选择和使用方式的偏好、以及推送信息的推送方式的差异，造成历史行为特征的特征值之间差异过大的问题，从而提高了使用选择概率预测模型进行计算时的正确率，进而提高了目标推送信息类别和目标推送信息选择的准确性。

S302：针对每个所述推送信息，将该推送信息对应的所述多个历史行为特征的特征值，分别输入至与该推送信息的信息类别对应的选择概率预测模型中，获取所述目标用户选择该信息类别中的推送信息的选择概率。

在进行选择概率预测模型的训练和使用之前，首先要对所述推送信息进行分类，生成所述推送信息类别。

在一些实施例中，采用下述方式生成所述推送信息类别：

针对每个所述推送信息，获取用于表征该推送信息的特征向量；基于各个所述推送信息的所述特征向量，对多个所述推送信息进行聚类，得到至少一个推送信息类别。

在一些实施例中，所述对多个所述推送信息进行聚类，包括：

所述对多个所述推送信息进行聚类，包括：

检测迭代次数是否达到预设的迭代次数阈值；

这里，上述预设条件可以包括：各个簇对应的所述总距离之和不小于预设的距离阈值，和/或，各个簇对应的轮廓系数之和不大于预设的轮廓系数阈值。

在一些实施例中，根据各个所述推送信息的特征向量，将各个所述推送信息划分到各个所述簇中心对应的簇中，包括：

将当前推送信息划分到与其距离最近的簇中心对应的簇中；

在一些实施例中，计算该簇中用于表征该簇中推送信息之间紧密程度和该簇中的推送信息与其他簇中的推送信息之间的分离程度的轮廓系数，包括：

针对每个簇，计算该簇中每两个推送信息之间的距离；

在一些实施例中，所述获取用于表征该推送信息的特征向量，包括：

在一些实施例中，推送信息特征包括：所述推送信息的使用概率。

在一些实施例中，推送信息特征还包括：所述推送信息的数量、所述推送信息的价格、所述推送信息的选择概率和所述推送信息的成本中一种或者多种。

由于对推送信息进行推送时，对于信息推送方来说，最大的目的是为了给信息推送方带来更多的活跃用户和更高的收益，而对目标用户来说，最大的目的是通过选择和使用推送信息，获得优惠或收益。通过对推送信息特征中包括的所述推送信息的使用概率这一特征进行评估，可以评估对该推送信息进行推送时，为信息推送方带来的活跃用户增加和收益的增加，也可以评估对该推送信息进行推送时，目标用户对该推送信息的选择情况。

上述所述推送信息的使用概率，可以根据目标用户选择所述推送信息的数量和目标用户使用所述推送信息的数量进行计算。具体地，可以将目标用户使用所述推送信息的数量，除以目标用户选择所述推送信息的数量，得到所述推送信息的使用概率。

具体到网约车平台的打车业务中，以上述推送信息为优惠套餐为例，上述所述推送信息的使用概率可以用核销率标识。上述核销率为，乘客购买上述优惠套餐后，使用了的优惠券的数量，与上述优惠套餐中包含的优惠券的总数的比例。

核销率高的优惠套餐，代表了乘客的购买欲和使用欲均很高，这样的优惠套餐，为网约车平台的活跃用户增加和收益的增加的同时，也为乘客带来了合理的优惠，达到了网约车平台和乘客的双赢。

因此，在具体实施时，在对所述推送信息进行分类后，可以进一步对推送信息类别进行筛选，将推送信息类别中的推送信息的使用概率大于预设使用概率阈值的推送信息类别，确定为待推送的推送信息类别，构建与待推送的推送信息类别对应的选择概率预测模型，并在待推送的推送信息类别中，确定目标推送信息类别。

在生成所述推送信息类别后，需要分别对与各个所述推送信息类别对应的选择概率预测模型进行训练。

在一些实施例中，采用下述方式训练与各个所述推送信息类别对应的选择概率预测模型：

在具体实施过程中，在构建与该推送信息类别对应的训练样本集时，获取每个样本用户对每个推送信息类别中的推送信息的选择情况，将该样本用户划分到选择数量最多的推送信息对应的推送信息类别的训练样本集中。测试样本集的构建过程与训练样本集的构建过程相同。

在一些实施例中，所述获取该样本用户对对应的推送信息进行选择的选择概率具体包括：

在确定了包含正样本和负样本的训练样本集后，比较上述训练样本集中，正样本的样本数量和负样本的样本数量，如果正样本的样本数量和负样本的样本数量之间的差值，大于样本数量差阈值，对正样本或负样本中样本数量较大的样本用户进行下采样。通过上述下采样的方式，可以达到正样本与负样本之间的样本均衡，更有利于选择概率预测模型的训练。

在一种可能的实施方式中，可以选择全部的样本用户构建训练样本集和测试样本集，也可以选择部分样本用户构建训练样本集和测试样本集。在选择部分样本用户构建训练样本集和测试样本集时，可以选择预定时间范围内的样本用户构建训练样本集和测试样本集，也可以随机选择部分样本用户构建训练样本集和测试样本集。

在一种可能的实施方式中，所述基于各个样本用户的所述样本历史行为特征的特征值以及选择概率，训练该推送信息类别对应的选择概率预测模型，包括：

在一种可能的实施方式中，所述基于所述测试样本集中的样本用户在各个所述目标历史行为特征下的特征值，以及对应的选择概率对所述当前决策树集进行验证，确定所述当前决策树集的误差，包括：

在一种可能的实施方式中，所述根据当前决策树集中各个决策树的子预测结果，确定所述测试样本集中样本用户的预测结果，包括：

具体的，基于所述测试样本集中各个样本用户的预测结果，以及所述测试样本集中各个样本用户对应的选择概率，计算当前决策树集中各个决策树的误差；根据当前决策树集中各个决策树的误差确各个决策树的子预测结果对应的权重。

针对当前决策树集中的每个决策树的子预测结果进行加权求和时，误差越低的决策树的子预测结果，赋予的权重越高。

S303：根据所述目标用户选择每种信息类别中的推送信息的选择概率，确定针对所述目标用户的目标推送信息类别，并基于确定的目标推送信息类别，确定目标推送信息。

在一种可能的实施方式中，所述确定针对所述目标用户的目所述确定针对所述目标用户的目标推送信息类别包括：

基于确定的目标推送信息类别，确定目标推送信息，包括：

在一种可能的实施方式中，所述基于确定的目标推送信息类别，确定目标推送信息，包括：

以网约车平台的优惠套餐方案的推送为例，目前，优惠套餐的配置方案全靠人工设计策略，优惠套餐的内容、价格和数量等的配置由于受到工作人员主观因素的影响，存在一定的盲目性和低效性，造成信息推送效果较差。

同时，将优惠套餐作为一种推送信息推送给用户，是为了达到借助优惠套餐提升乘客对网约车平台的粘性和留存率，并且希望乘客通过购买包含多张优惠券的优惠套餐，进一步提升乘客在网约车平台的出行频次，促进出行业务进一步的增长。然而人工设计优惠套餐的推送策略具有主观性，推送准确率较低，而且浪费人力成本。本申请实施例可以利用乘客的对多个优惠套餐中的各个套餐进行选择和对优惠套餐内的优惠券进行使用的历史行为特征进行信息推送；一方面针对优惠套餐的推送更具有针对性和方向性，另一方面对客户对优惠套餐的使用欲望做出有效的预测，可以无法提前预测进行本次信息推送为信息提供方带来的效果，节省预算资源，且可以提升目标用户粘性和留存率、促进目标用户活跃度。

实施例二

如图4所示，具体从执行主体为网约车平台的服务器角度，以推送信息为优惠套餐为例，对本申请实施例而所提供的信息推送方法加以说明。

S401：获取多个待选推送信息，并获取用于表征多个用户对所述多个待选推送信息进行选择和使用的历史行为信息；根据各个所述待选推送信息对应的历史行为信息，确定所述推送信息。

具体到网约车平台的打车业务中，以上述推送信息为优惠套餐为例，首先计算每个优惠套餐的增量投资回报率(Return on Investment，ΔROI)，每个优惠套餐的ΔROI使用下列公式进行计算：

ΔROI＝ΔGMV/Δ补贴

其中ΔGMV为使用任一优惠套餐达成的成交总额，Δ补贴为减去优惠套餐的售价之后的净补贴。具体地，假设目标用户使用20元购买了包含6张优惠券的优惠套餐，每张优惠券的优惠金额为5元，并且目标用户使用上述6张优惠券的优惠套餐呼叫网约车6次，共产生200元的打车费，则上述6张优惠券的优惠套餐的ΔROI为20。

通过将所述增量回报率大于预设回报率阈值的待选推送信息确定为所述推送信息，可以提升进行本次信息推送为信息提供方带来的整体收益情况，避免造成预算资源的浪费。

在一种可能的实施方式中，可以在获取推送信息的类型，获取每个类型的推送信息的数量，根据每个类型的推送信息的数量，确定所述推送信息。

具体到网约车平台的打车业务中，以上述推送信息为优惠套餐为例，网约车平台共推出过10000多种优惠套餐，其中占比最大的为通用优惠套餐和平峰期优惠套餐，其他类型的优惠套餐，例如，通勤优惠套餐、周末优惠套餐、休闲娱乐优惠套餐、郊县优惠套餐和学生优惠套餐等，占比很低，总占比仅15％左右，因此，可以将通用优惠套餐和平峰期优惠套餐确定为所述推送信息，计算目标用户对通用优惠套餐和平峰期优惠套餐的选择概率，并基于目标用户对通用优惠套餐和平峰期优惠套餐的选择概率，在通用优惠套餐和平峰期优惠套餐中确定目标推送信息类别和目标推送信息。

S402：确定至少一个区域范围，针对至少一个区域范围，获取该区域范围内的所述推送信息，及该区域范围内的推送信息对应的特征向量。

具体地，可以根据地理位置中包含的城市的经济、规模、需求、运力和补贴等维度，构建区域特征向量，并根据区域特征向量，对上述地理位置进行聚类。

这里，可以使用常用的聚类算法对上述地理位置进行聚类，如K-均值(k-means)算法，K-原型(k-prototype)算法等。

在一种可能的实施方式中，可以采用下述步骤对地理位置进行聚类：

从多个上述地理位置中，随机确定预设数量个地理位置作为簇中心；

并将未完成分类的地理位置中任意一个地理位置确定为当前地理位置，根据当前地理位置的区域特征向量，以及当前簇中心的区域特征向量，计算当前地理位置与各个簇中心之间的距离；

将当前地理位置划分到与其距离最近的簇中心对应的簇中；

更新该簇的簇中心的区域特征向量，将当前地理位置作为完成分类的地理位置，并返回至将未完成分类的地理位置中任意一个地理位置确定为当前地理位置的步骤，直至所有地理位置都完成分类。

得到至少一个地理位置的类，每个类中包含至少一个城市，并且基于每个类，确定与该类对应的一个区域范围。

S403：针对每个区域范围，根据该区域范围内的推送信息对应的特征向量，对该区域范围内的所述推送信息进行分类，得到该区域范围内的推送信息类别。

具体到网约车平台的打车业务中，以上述推送信息为优惠套餐为例，以优惠套餐为推送信息对应的特征向量包括：核销率。以优惠套餐为推送信息对应的特征向量还可以包括：优惠套餐中包含优惠券的张数、优惠套餐的价格、优惠套餐的购买率、优惠套餐的补贴率等中的一种或多种。

上述核销率为，目标用户购买上述优惠套餐后，使用了的优惠券的数量，与上述优惠套餐中包含的优惠券的总数的比例。

上述优惠套餐的购买率为，购买优惠套餐的用户在目标用户中的比例。

上述优惠套餐的补贴率为，优惠套餐的补贴与使用优惠套餐产生的交易额之间的比例。

在一示例中，以优惠套餐为推送信息对应的特征向量包括核销率、优惠套餐中包含优惠券的张数、优惠套餐的购买率和优惠套餐的补贴率。

根据上述以优惠套餐为推送信息对应的特征向量对优惠套餐进行分类，得到表1所示的优惠套餐类别。

类别	特征向量
		1	核销率较低，优惠券数量多，购买率一般，补贴率较低
2	核销率较高，优惠券数量多，购买率一般，补贴率较高
		3	核销率较低，优惠券数量中等，购买率一般，补贴率较低
4	核销率较高，优惠券数量中等，购买率较高，补贴率较高
		5	核销率较高，优惠券数量少，购买率较高，补贴率较低
6	核销率较高，优惠券数量少，购买率较高，补贴率较高

由于核销率高的优惠套餐，代表了乘客的购买欲和使用欲均很高，这样的优惠套餐，为网约车平台的活跃用户增加和收益的增加的同时，也为乘客带来了合理的优惠，达到了网约车平台和乘客的双赢。因此，针对上述表1所示的优惠套餐类别中，核销率较高的4类优惠套餐类别构建选择概率预测模型，并在上述表1所示的优惠套餐类别中，核销率较高的4类优惠套餐类别中确定目标推送信息类别和目标推送信息。

具体的，在具体实施中，可以为核销率设定核销率阈值，为优惠套餐的核销率大于核销率阈值的优惠套餐类别构建选择概率预测模型，并在优惠套餐的核销率大于核销率阈值的优惠套餐类别中确定目标推送信息类别和目标推送信息。

S404：针对每个区域范围内，针对每个区域范围内的每个推送信息类别，构建训练样本集和测试样本集。

在构建与该推送信息类别对应的训练样本集时，获取每个样本用户对每个推送信息类别中的推送信息的选择情况，将该样本用户划分到选择数量最多的推送信息对应的推送信息类别的训练样本集中。测试样本集的构建过程与训练样本集的构建过程相同。

在一种可能的实施方式中，在构建训练样本集和测试样本集时，获取该样本用户的核销率；

若所述核销率小于预设的核销率阈值，则将该样本用户确定为负样本，该样本用户对应的选择概率确定为0；

若所述核销率不小于预设的核销率阈值，则将该样本用户确定为正样本，该样本用户对应的选择概率确定为1。

并且在确定了包含正样本和负样本的训练样本集后，比较上述训练样本集中，正样本的样本数量和负样本的样本数量，如果正样本的样本数量和负样本的样本数量之间的差值，大于样本数量差阈值，对正样本或负样本中样本数量较大的样本用户进行下采样。通过上述下采样的方式，可以达到正样本与负样本之间的样本均衡，更有利于选择概率预测模型的训练。

S405：获取用于表征目标用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值。

具体到网约车平台的打车业务中，以上述推送信息为优惠套餐为例，具体的，上述历史行为特征包括以下一种或者多种：

目标用户选择购买任一优惠套餐的次数，购买的任一优惠套餐中包含优惠券的总张数，购买任一优惠套餐的总花费，使用任一优惠套餐达成的订单数，使用任一优惠套餐达成的成交总额(Gross Merchandise Volume，GMV)，呼叫网约车的数量，呼叫网约车后得到应答产生的订单数，呼叫网约车后在得到应答前取消的订单数，呼叫网约车后在得到应答后取消的订单数，达成的总订单数，呼叫网约车后在得到应答的概率，呼叫网约车后得到应答产生订单的概率，呼叫网约车后得到应答的平均时长，平峰期出行产生的订单占达成的总订单数的比例，平峰期出行产生的GMV占总的GMV的比例，目标用户的价格敏感度和目标用户的购买力等。

在一种可能的实施方式中，可以获取预定时间范围内的历史行为特征的特征值，例如一个月内的历史行为特征的特征值。

S406：根据所述测试样本集以及所述训练样本集中的各个样本用户对的历史行为特征的特征值，以及对应的选择概率，训练该推送信息类别对应的选择概率预测模型。

这里，可以使用xgboost算法、GBDT算法等任一机器学习算法作为选择概率预测模型中的算法。

在本申请实施例二中，仅针对上述表1所示的优惠套餐类别中，核销率较高的4类优惠套餐类别，构建选择概率预测模型，并对上述表1所示的优惠套餐类别中，核销率较高的4类优惠套餐类别对应的选择概率预测模型进行训练。

在具体实施过程中，如图5所示是选择概率预测模型的训练过程的流程图，将训练样本集中的样本用户的多个所述历史行为特征中，随机确定多个目标历史行为特征，根据随机确定的多个目标历史行为特征和训练样本集中的各个样本用户的选择概率，对选择概率预测模型进行训练，得到决策树。

之后，基于所述测试样本集中的样本用户在各个所述目标历史行为特征下的特征值，以及对应的选择概率对所述决策树进行验证，确定所述决策树的误差。

根据上述决策树的误差调整从训练样本集中的样本用户的多个所述历史行为特征中选择的目标历史行为特征，并根据新的目标历史行为特征对选择概率预测模型进行训练，得到当前决策树集。

这里，生成的下一颗决策树是在当前决策树的基础上进行优化的，而不是重新生成一颗决策树。

之后，基于所述测试样本集中的样本用户在各个所述目标历史行为特征下的特征值，以及对应的选择概率对所述当前决策树集进行验证，确定所述当前决策树集的误差。

按照上述步骤，不断迭代优化选择概率预测模型，最终通过迭代得到一个包含N个决策树的决策树集，N为正整数。需要说明的是，针对每个推送信息类别，得到的选择概率预测模型是不同的，每个推送信息类别对应的选择概率预测模型的决策树集中，决策树的数量不一定相同，即，每个推送信息类别对应的决策树集中，N不一定相同。

在对选择概率预测模型进行训练，生成决策树集的过程中，针对每个簇，计算该簇中所有推送信息到该簇的簇中心之间的总距离，以及用于表征该簇中推送信息之间紧密程度和该簇中的推送信息与其他簇中的推送信息之间的分离程度的轮廓系数，利用上述总距离和轮廓系数评价聚类结果的好坏。由于轮廓系数(Silhouette Coefficient)结合了聚类的凝聚度(Cohesion)和分离度(Separation)两个指标，使用轮廓系数可以更好地评估聚类的效果。轮廓系数的值处于-1～1之间，值越大，表示聚类效果越好。在一种可能的实施方式中，对轮廓系数的具体计算方法如下：

对于第i个元素x_i，计算x_i与其同一个簇内的所有其他元素距离的平均值，记作a_i，用于量化簇内的凝聚度。

选取x_i外的一个簇b，计算x_i与b中所有点的平均距离，遍历所有其他簇，找到最近的这个平均距离,记作b_i，用于量化簇之间分离度。

对于元素x_i，轮廓系数s_i＝(b_i–a_i)/max(a_i,b_i)。

利用每个簇的轮廓系数，计算每个簇的轮廓系数的平均值，将每个簇的轮廓系数的平均值作为当前聚类得到的决策树的轮廓系数。

利用当前聚类得到的决策树的轮廓系数评价当前聚类得到的决策树的聚类效果的好快，若当前聚类得到的决策树的轮廓系数小于0，表示聚类效果不好。如果a_i趋于0，或者b_i足够大，那么当前聚类得到的决策树的轮廓系数趋近与1，当前聚类得到的决策树的轮廓系数越趋近与1，说明聚类效果越好。

在对选择概率预测模型进行训练的过程中，通过对从训练样本集中的样本用户的多个所述历史行为特征中选择的目标历史行为特征进行调整，可以针对样本用户的每个所述历史行为特征，得到所述目标历史行为特征中包含该历史行为特征时，当前决策树集的第一误差，和所述目标历史行为特征中不包含该历史行为特征时，当前决策树集的第二误差；

根据上述当前决策树集的第一误差和当前决策树集的第二误差，确定当前决策树集的误差率，当所述当前决策树集的误差率大于预设的误差率阈值的情况下，将该历史行为特征确定为目标历史行为特征。上述目标历史行为特征，为进行选择概率计算时，使用的推送信息对应的多个历史行为特征的特征值中的一个历史行为特征。

S407：针对每个所述推送信息，将该推送信息对应的所述多个历史行为特征的特征值，分别输入至与该推送信息的信息类别对应的选择概率预测模型中，获取所述目标用户选择该信息类别中的推送信息的选择概率。

在具体实施的情况下，选择概率预测模型为步骤S206中形成的，包含N个决策树的决策树集，N为正整数。

将目标用户的针对该推送信息对应的所述多个历史行为特征的特征值，分别输入至与该推送信息的信息类别对应的选择概率预测模型中，通过决策树集中的每个决策树，得到一个子选择概率。对上述子选择概率进行加权综合，得到所述目标用户选择该信息类别中的推送信息的选择概率。

S408：根据所述目标用户选择每种信息类别中的推送信息的选择概率，确定针对所述目标用户的目标推送信息类别。

通过每个推送信息类别的选择概率预测模型进行计算，可以得到目标用户对各个推送信息类别的选择概率。

在具体实施情况下，可以对目标用户对各个推送信息类别的选择概率进行排序，将选择概率的最大的前预定数量个推送信息类别，为至少一个确定的目标推送信息类别。

具体到网约车平台的打车业务中，以上述推送信息为优惠套餐为例，可以将选择概率最高的前三个推送信息类别，确定为目标推送信息类别。

S409：基于确定的目标推送信息类别，确定目标推送信息。

在另一种可能的实施方式中，所述基于确定的目标推送信息类别，确定目标推送信息，包括：

具体到网约车平台的打车业务中，以上述推送信息为优惠套餐为例，可以在选择概率最高的前三个推送信息类别中，各选择一个推送信息，确定为目标推送信息。

在进行推送信息的选择时，也可以结合人工筛选过程，将机器选择和人工经验结合起来。

基于相同的技术构思，本申请实施例还提供一种信息推送装置、电子设备、以及计算机存储介质等，具体可参见以下实施例。

实施例三

如图6所示，本申请实施例还提供一种信息推送装置600，包括：

获取模块601，拥有获取用于表征目标用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值；

选择概率预测模块602，用于针对每个所述推送信息，将该推送信息对应的所述多个历史行为特征的特征值，分别输入至与该推送信息的信息类别对应的选择概率预测模型中，获取所述目标用户选择该信息类别中的推送信息的选择概率；

目标推送信息类别确定模块603，用于根据所述目标用户选择每种信息类别中的推送信息的选择概率，确定针对所述目标用户的目标推送信息类别；

目标推送信息确定模块604，用于基于确定的目标推送信息类别，确定目标推送信息。

一种可能的设计中，所述装置，还包括：

推送信息分类模块605，用于采用下述方式生成所述推送信息类别：

一种可能的设计中，所述推送信息分类模块605，还用于从多个所述推送信息中，随机确定预设数量个推送信息作为簇中心；并根据各个所述推送信息的特征向量，将各个所述推送信息划分到各个所述簇中心对应的簇中；

检测迭代次数是否达到预设的迭代次数阈值；

一种可能的设计中，所述推送信息分类模块605，还用于将未完成分类的推送信息中任意一个推送信息确定为当前推送信息，根据当前推送信息的特征向量，以及当前簇中心的特征向量，计算当前推送信息与各个簇中心之间的距离；

将当前推送信息划分到与其距离最近的簇中心对应的簇中；

一种可能的设计中，所述推送信息分类模块605，还用于针对每个簇，计算该簇中每两个推送信息之间的距离；

一种可能的设计中，所述装置，还包括：选择概率预测模型训练模块606，用于针对每个推送信息类别，构建与该推送信息类别对应的训练样本集以及测试样本集；其中，与该推送信息类别对应的训练样本集和测试样本集中均包括多个样本用户；

一种可能的设计中，所述选择概率预测模型训练模块606，还用于根据该样本用户对对应的推送信息选择和使用的样本历史行为信息，确定该样本用户对其所选择的推送信息的使用率；

一种可能的设计中，所述选择概率预测模型训练模块606，还用于从多个所述历史行为特征中，随机确定多个目标历史行为特征；

一种可能的设计中，所述选择概率预测模型训练模块606，还用于基于所述测试样本集中的样本用户，在与当前决策树集中各个决策树对应的目标历史行为特征下的特征值，确定当前决策树集中各个决策树的子预测结果；

一种可能的设计中，所述选择概率预测模型训练模块606，还用于将所述测试样本集中样本用户对应的各个决策树的子预测结果进行加权求和，确定所述测试样本集中样本用户的预测结果。

一种可能的设计中，所述装置，还包括：推送信息预处理模块607，用于获取多个待选推送信息，并获取用于表征多个用户对所述多个待选推送信息进行选择和使用的历史行为信息；

一种可能的设计中，所述推送信息预处理模块607，还用于获取所述用户基于所述待选推送信息产生的增量交易额，和所述用户基于所述待选推送信息产生的增量净成本；

根据所述增量交易额和所述增量净成本，计算所述增量回报率。

一种可能的设计中，所述装置，还包括：区域确定模块608，用于确定至少一个区域范围；

一种可能的设计中所述区域确定模块608，还用于获取所述推送信息的对应的样本用户所在的地理位置；

一种可能的设计中，所述区域确定模块608，还用于基于每个样本用户所在的地理位置，获取所述地理位置中包含的至少一个城市；

基于所述至少一个城市，构建用于聚类的区域特征向量；

基于每个类，确定与该类对应的一个区域范围。

一种可能的设计中，所述目标推送信息类别确定模块603，具体用于按照所述目标用户对各个推送信息类别中的推送信息选择的选择概率的大小，对每个推送信息类别进行排序，选择概率的最大的前预定数量个推送信息类别，为至少一个确定的目标推送信息类别。

一种可能的设计中，所述目标推送信息确定模块604，具体用于在所述确定的推送信息类别中，随机选择预定数量个推送信息，确定为目标推送信息。

一种可能的设计中，所述目标推送信息确定模块604，还用于在每个确定的推送信息类别中，各随机选择预定数量个推送信息，确定为目标推送信息。

实施例四

图7示出了本申请实施例四提供一种信息推送装置的整体框架，包括：

本申请实施例四获取推送信息和推送信息的特征向量，对推送信息进行预处理，并基于推送信息和推送信息的特征向量对推送信息进行聚类，生成推送信息类别。针对每个推送信息类别，生成训练样本集和测试样本集。针对训练样本集和测试样本集，获取用于表征训练样本集和测试样本集中的样本用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值，使用训练样本集和测试样本集对每个推送信息类别对应的选择概率预测模型进行训练，在训练过程中，不断迭代调整多个历史行为特征中选择的目标历史行为特征和每个目标历史行为特征的权重。

完成每个推送信息类别对应的选择概率预测模型的训练后，获取表征目标用户对多个推送信息中的每个推送信息进行选择和使用的多个历史行为特征的特征值，并使用每个推送信息类别对应的选择概率预测模型进行计算，得到目标用户选择该信息类别中的推送信息的选择概率。

依据目标用户选择该信息类别中的推送信息的选择概率，选择概率的最大的前预定数量个推送信息类别，为至少一个确定的目标推送信息类别。并基于确定的目标推送信息类别，确定目标推送信息。

用户端获取目标推送信息，并将目标推送信息展示给目标用户。

如图2所示，本申请实施例还提供一种电子设备，包括：处理器220、存储介质和总线230，所述存储介质存储有所述处理器220可执行的机器可读指令，当电子设备运行时，所述处理器220与所述存储介质之间通过总线通信230，所述处理器220执行所述机器可读指令，以执行时执行如本申请实施例提供的信息推送方法的步骤。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如如本申请实施例提供的信息推送方法的步骤。本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行信息推送方法的步骤。

具体地，该存储介质能够为通用的存储介质，如移动磁盘、硬盘等，该存储介质上的计算机程序被运行时，能够执行上述信息推送方法，从而提高信息推送的针对性和推送效率，在进行信息推送之前，提前预测用户对推送信息的选择概率，避免预算资源的浪费，更好地达到推送信息预期的提升目标用户的粘性和留存率、促进目标用户的活跃度的目的。

本申请实施例所提供的进行信息推送方法的计算机程序产品，包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种信息推送方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，采用下述方式生成所述推送信息类别：

3.根据权利要求2所述的方法，其特征在于，所述对多个所述推送信息进行聚类，包括：

4.根据权利要求2所述的方法，其特征在于，所述对多个所述推送信息进行聚类，包括：

检测迭代次数是否达到预设的迭代次数阈值；

5.根据权利要求3或4所述的方法，其特征在于，根据各个所述推送信息的特征向量，将各个所述推送信息划分到各个所述簇中心对应的簇中，包括：

将当前推送信息划分到与其距离最近的簇中心对应的簇中；

6.根据权利要求3或4所述的方法，其特征在于，计算该簇中用于表征该簇中推送信息之间紧密程度和该簇中的推送信息与其他簇中的推送信息之间的分离程度的轮廓系数，包括：

针对每个簇，计算该簇中每两个推送信息之间的距离；

7.根据权利要求2所述的方法，其特征在于，所述获取用于表征该推送信息的特征向量，包括：

8.根据权利要求7所述的方法，其特征在于，推送信息特征包括：所述推送信息的使用概率。

9.根据权利要求8所述的方法，其特征在于，推送信息特征还包括：所述推送信息的数量、所述推送信息的价格、所述推送信息的选择概率和所述推送信息的成本中一种或者多种。

10.根据权利要求1所述的方法，其特征在于，所述历史行为特征包括以下一种或者多种：

11.根据权利要求1所述的方法，其特征在于，采用下述方式训练与各个所述推送信息类别对应的选择概率预测模型：

12.根据权利要求11所述的方法，其特征在于，所述获取该样本用户对对应的推送信息进行选择的选择概率具体包括：

13.根据权利要求11所述的方法，其特征在于，所述基于各个样本用户的所述样本历史行为特征的特征值以及选择概率，训练该推送信息类别对应的选择概率预测模型，包括：

14.根据权利要求13所述的方法，其特征在于，所述基于所述测试样本集中的样本用户在各个所述目标历史行为特征下的特征值，以及对应的选择概率对所述当前决策树集进行验证，确定所述当前决策树集的误差，包括：

15.根据权利要求14所述的方法，其特征在于，所述根据当前决策树集中各个决策树的子预测结果，确定所述测试样本集中样本用户的预测结果，包括：

16.根据权利要求1所述的方法，其特征在于，采用下述步骤确定所述推送信息：

17.根据权利要求1所述的方法，其特征在于，所述方法还包括：确定至少一个区域范围；

所述生成所述推送信息类别，还包括：

18.根据权利要求17所述的方法，其特征在于，所述确定至少一个区域范围，包括：

获取所述推送信息的对应的样本用户所在的地理位置；

19.根据权利要求18所述的方法，其特征在于，所述基于每个样本用户所在的地理位置，确定至少一个区域范围，包括：

基于所述至少一个城市，构建用于聚类的区域特征向量；

基于每个类，确定与该类对应的一个区域范围。

20.根据权利要求1所述的方法，其特征在于，所述确定针对所述目标用户的目标推送信息类别包括：

21.根据权利要求1所述的方法，其特征在于，所述基于确定的目标推送信息类别，确定目标推送信息，包括：

22.根据权利要求1所述的方法，其特征在于，所述基于确定的目标推送信息类别，确定目标推送信息，包括：

23.一种信息推送装置，其特征在于，包括：

24.根据权利要求23所述的装置，其特征在于，所述装置，还包括：

25.根据权利要求24所述的装置，其特征在于，

所述推送信息分类模块，还用于从多个所述推送信息中，随机确定预设数量个推送信息作为簇中心；并根据各个所述推送信息的特征向量，将各个所述推送信息划分到各个所述簇中心对应的簇中；

26.根据权利要求24所述的装置，其特征在于，所述推送信息分类模块，还用于从多个所述推送信息中，随机确定预设数量个推送信息作为簇中心；并根据各个所述推送信息的特征向量，将各个所述推送信息划分到各个所述簇中心对应的簇中；

检测迭代次数是否达到预设的迭代次数阈值；

27.根据权利要求25或26所述的装置，其特征在于，所述推送信息分类模块，还用于将未完成分类的推送信息中任意一个推送信息确定为当前推送信息，根据当前推送信息的特征向量，以及当前簇中心的特征向量，计算当前推送信息与各个簇中心之间的距离；

将当前推送信息划分到与其距离最近的簇中心对应的簇中；

28.根据权利要求25或26所述的装置，其特征在于，所述推送信息分类模块，还用于针对每个簇，计算该簇中每两个推送信息之间的距离；

29.根据权利要求24所述的装置，其特征在于，所述推送信息分类模块，还用于根据各个所述推送信息，确定所述推送信息在多个推送信息特征下的特征值；

30.根据权利要求29所述的装置，其特征在于，推送信息特征包括：所述推送信息的使用概率。

31.根据权利要求30所述的装置，其特征在于，推送信息特征还包括：所述推送信息的数量、所述推送信息的价格、所述推送信息的选择概率和所述推送信息的成本中一种或者多种。

32.根据权利要求23所述的装置，其特征在于，所述历史行为特征包括以下一种或者多种：

33.根据权利要求23所述的装置，其特征在于，所述装置，还包括：选择概率预测模型训练模块，用于针对每个推送信息类别，构建与该推送信息类别对应的训练样本集以及测试样本集；其中，与该推送信息类别对应的训练样本集和测试样本集中均包括多个样本用户；

34.根据权利要求33所述的装置，其特征在于，所述选择概率预测模型训练模块，还用于根据该样本用户对对应的推送信息选择和使用的样本历史行为信息，确定该样本用户对其所选择的推送信息的使用率；

35.根据权利要求34所述的装置，其特征在于，所述选择概率预测模型训练模块，还用于从多个所述历史行为特征中，随机确定多个目标历史行为特征；

36.根据权利要求35所述的装置，其特征在于，所述选择概率预测模型训练模块，还用于基于所述测试样本集中的样本用户，在与当前决策树集中各个决策树对应的目标历史行为特征下的特征值，确定当前决策树集中各个决策树的子预测结果；

37.根据权利要求36所述的装置，其特征在于，所述选择概率预测模型训练模块，还用于将所述测试样本集中样本用户对应的各个决策树的子预测结果进行加权求和，确定所述测试样本集中样本用户的预测结果。

38.根据权利要求23所述的装置，其特征在于，所述装置，还包括：推送信息预处理模块，用于获取多个待选推送信息，并获取用于表征多个用户对所述多个待选推送信息进行选择和使用的历史行为信息；

39.根据权利要求23所述的装置，其特征在于，所述装置，还包括：区域确定模块，用于确定至少一个区域范围；

40.根据权利要求39所述的装置，其特征在于，所述区域确定模块，还用于获取所述推送信息的对应的样本用户所在的地理位置；

41.根据权利要求40所述的装置，其特征在于，所述区域确定模块，还用于基于每个样本用户所在的地理位置，获取所述地理位置中包含的至少一个城市；

基于所述至少一个城市，构建用于聚类的区域特征向量；

基于每个类，确定与该类对应的一个区域范围。

42.根据权利要求23所述的装置，其特征在于，所述目标推送信息类别确定模块，具体用于按照所述目标用户对各个推送信息类别中的推送信息选择的选择概率的大小，对每个推送信息类别进行排序，选择概率的最大的前预定数量个推送信息类别，为至少一个确定的目标推送信息类别。

43.根据权利要求23所述的装置，其特征在于，所述目标推送信息确定模块，具体用于在所述确定的推送信息类别中，随机选择预定数量个推送信息，确定为目标推送信息。

44.根据权利要求23所述的装置，其特征在于，所述目标推送信息确定模块，还用于在每个确定的推送信息类别中，各随机选择预定数量个推送信息，确定为目标推送信息。

45.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至22任一所述的信息推送方法的步骤。

46.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至22任一所述的信息推送方法的步骤。