CN111210072A

CN111210072A - 预测模型训练和用户资源额度确定方法及装置

Info

Publication number: CN111210072A
Application number: CN202010010460.8A
Authority: CN
Inventors: 申月; 刘子奇; 王东
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-01-06
Filing date: 2020-01-06
Publication date: 2020-05-29
Anticipated expiration: 2040-01-06
Also published as: CN111210072B

Abstract

本说明书实施例提供了一种预测模型训练和用户资源额度确定方法及装置。在预测模型训练阶段，基于分享关系图谱，得到第一用户的第一关系特征，至少基于第一关系特征得到第一特征数据，将第一特征数据和第一资源额度输入预测模型，预测模型输出第一用户针对第一资源额度的分享行为的预测数据，将预测数据与标准数据进行比较得到第一预测损失，向使得第一预测损失减小的方向，更新预测模型。在确定用户资源额度阶段，将基于分享关系图谱得到的第二用户的特征数据和多个不同档位资源额度输入预测模型，预测模型可以输出第二用户针对不同档位资源额度的分享行为数据，根据分享行为数据对不同档位资源额度进行选择，得到针对第二用户分配的资源额度。

Description

预测模型训练和用户资源额度确定方法及装置

技术领域

本说明书一个或多个实施例涉及数据处理技术领域，尤其涉及预测模型训练和用户资源额度确定方法及装置。

背景技术

随着互联网技术的发展，越来越多的服务平台可以向用户提供服务。服务平台也会为了增加用户粘度或者增加用户量等目的，向用户发送服务邀请的消息。当用户通过客户端参与服务平台的服务邀请，并将服务邀请成功分享至其他用户时，服务平台可以向该用户分配一定的资源奖励，以便激励用户继续分享该服务邀请。奖励的资源可以是电、煤气、水等实体资源，也可以是存储空间、数据流量等虚拟资源。例如，进行垃圾回收的服务平台，在老用户将该服务平台成功分享至新用户时，可以向老用户发放一定的资源奖励，该资源奖励能够促使老用户继续向其他用户分享。目前，存在预测用户在接收到不同资源额度的资源后的分享行为数据的需求。

因此，希望能有改进的方案，可以更准确地预测用户在不同资源额度下的分享行为数据，以便使得对用户分配的资源额度更有针对性，减少资源消耗。

发明内容

本说明书一个或多个实施例描述了预测模型训练和用户资源额度确定方法及装置，以便更准确地预测用户在不同资源额度下的分享行为数据，进而使得对用户分配的资源额度更有针对性，减少资源消耗。具体技术方案如下。

第一方面，实施例提供了一种用于预测用户分享行为数据的预测模型训练方法，通过计算机执行，所述方法包括：

基于分享关系图谱，获取第一用户的第一关系特征；其中，所述分享关系图谱用于表征多个用户之间的分享关系，包括多个用户节点以及用户节点之间存在分享关系时形成的连接边；

至少基于所述第一关系特征，确定所述第一用户的第一特征数据；

获取所述第一用户在接收到第一资源额度的资源之后的分享行为数据，作为标准数据；

将所述第一特征数据和所述第一资源额度输入预测模型，通过所述预测模型输出所述第一用户针对所述第一资源额度的分享行为的预测数据；

根据所述标准数据与所述预测数据的比较，确定第一预测损失；

向使得所述第一预测损失减小的方向，更新所述预测模型。

在一种实施方式中，所述基于分享关系图谱，获取第一用户的第一关系特征的步骤，包括：

通过图神经网络模型，利用所述分享关系图谱中第一用户节点及其邻居节点集的数据，进行多级特征聚合，得到所述第一用户的第一关系特征；其中，所述第一用户节点对应所述第一用户。

在一种实施方式中，所述向使得所述第一预测损失减小的方向，更新所述预测模型的步骤，包括：

向使得所述第一预测损失减小的方向，更新所述预测模型和所述图神经网络模型。

在一种实施方式中，所述至少基于所述第一关系特征，确定所述第一用户的第一特征数据的步骤，包括：

获取用于表征所述第一用户的静态属性的第一属性特征，和/或，获取用于表征所述第一用户的个体资源敏感度的第一个体特征；其中，所述第一个体特征基于所述第一用户针对不同资源额度执行个体行为时对应的个体行为数据而提取得到；

将所述第一关系特征与所述第一属性特征和/或所述第一个体特征进行融合，得到所述第一用户的第一特征数据。

在一种实施方式中，所述分享行为数据包括不同类别的子分享行为数据；

所述根据标准数据与预测数据的比较，确定第一预测损失的步骤，包括：

将所述标准数据与所述预测数据中同类别的子分享行为数据分别进行比较，得到多个类别的预测损失；

根据多个类别的第一预设权重，对多个类别的预测损失进行融合，得到所述第一预测损失。

获取所述分享关系图谱的邻接矩阵；

对所述邻接矩阵进行特征值分解，利用特征值分解结果，确定所述邻接矩阵的节点向量矩阵；

从所述节点向量矩阵中读取所述第一用户对应的第一节点向量，作为所述第一关系特征。

第二方面，实施例提供了一种确定用户资源额度以对用户进行资源分配的方法，通过计算机执行，所述方法包括：

基于分享关系图谱，获取待分配资源的第二用户的第二关系特征；其中，所述分享关系图谱用于表征多个用户之间的分享关系，包括多个用户节点以及用户节点之间存在分享关系时形成的连接边；

至少基于所述第二关系特征，确定所述第二用户的第二特征数据；

将所述第二特征数据和多个不同档位资源额度输入预测模型，通过所述预测模型输出所述第二用户针对所述多个不同档位资源额度的分享行为数据；其中，所述预测模型采用第一方面提供的方法训练完成；

根据输出的所述分享行为数据对多个不同档位资源额度进行选择，根据选择结果确定针对所述第二用户分配的资源额度。

在一种实施方式中，所述根据输出的所述分享行为数据对多个不同档位资源额度进行选择，根据选择结果确定针对所述第二用户分配的资源额度的步骤，包括：

获取待分配资源的剩余总资源；

按照输出的所述分享行为数据的大小对多个不同档位资源额度进行排序，并从排序结果中选择一个不大于所述剩余总资源的档位资源额度，作为针对所述第二用户分配的资源额度。

在一种实施方式中，所述基于分享关系图谱，获取待分配资源的第二用户的第二关系特征的步骤，包括：

通过图神经网络模型，利用所述分享关系图谱中第二用户节点及其邻居节点集的数据，进行多级特征聚合，得到所述第二用户的第二关系特征；其中，所述第二用户节点对应所述第二用户。

在一种实施方式中，所述至少基于所述第二关系特征，确定所述第二用户的第二特征数据的步骤，包括：

获取用于表征所述第二用户的静态属性的第二属性特征，和/或，获取用于表征所述用户的个体资源敏感度的第二个体特征；其中，所述第二个体特征基于所述用户针对不同资源额度执行个体行为时对应的个体行为数据而提取得到；

将所述第二关系特征与所述第二属性特征和/或所述第二个体特征进行融合，得到所述第二用户的第二特征数据。

所述根据输出的所述分享行为数据对多个不同档位资源额度进行选择，根据选择结果确定针对所述第二用户分配的资源额度的步骤，包括：

针对任意一个分享行为数据，根据多个类别的第二预设权重，对该分享行为数据中的子分享行为数据进行融合，得到该分享行为数据对应的评分值；

根据得到的评分值对多个不同档位资源额度进行选择，根据选择结果确定针对所述第二用户分配的资源额度。

第三方面，实施例提供了一种用于预测用户分享行为数据的预测模型训练装置，部署在计算机中，所述装置包括：

第一获取模块，配置为基于分享关系图谱，获取第一用户的第一关系特征；其中，所述分享关系图谱用于表征多个用户之间的分享关系，包括多个用户节点以及用户节点之间存在分享关系时形成的连接边；

第一确定模块，配置为至少基于所述第一关系特征，确定所述第一用户的第一特征数据；

第二获取模块，配置为获取所述第一用户在接收到第一资源额度的资源之后的分享行为数据，作为标准数据；

第一预测模块，配置为将所述第一特征数据和所述第一资源额度输入预测模型，通过所述预测模型输出所述第一用户针对所述第一资源额度的分享行为的预测数据；

第二确定模块，配置为根据所述标准数据与所述预测数据的比较，确定第一预测损失；

第一更新模块，配置为向使得所述第一预测损失减小的方向，更新所述预测模型。

在一种实施方式中，所述第一获取模块具体配置为：

在一种实施方式中，所述第一更新模块具体配置为：

在一种实施方式中，所述第一确定模块具体配置为：

所述第二确定模块，具体配置为：

在一种实施方式中，所述第一获取模块具体配置为：

获取所述分享关系图谱的邻接矩阵；

第四方面，实施例提供了一种确定用户资源额度以对用户进行资源分配的装置，部署在计算机中，所述装置包括：

第三获取模块，配置为基于分享关系图谱，获取待分配资源的第二用户的第二关系特征；其中，所述分享关系图谱用于表征多个用户之间的分享关系，包括多个用户节点以及用户节点之间存在分享关系时形成的连接边；

第三确定模块，配置为至少基于所述第二关系特征，确定所述第二用户的第二特征数据；

第二预测模块，配置为将所述第二特征数据和多个不同档位资源额度输入预测模型，通过所述预测模型输出所述第二用户针对所述多个不同档位资源额度的分享行为数据；其中，预测模型采用第三方面提供的装置训练完成；

第四确定模块，配置为根据输出的所述分享行为数据对多个不同档位资源额度进行选择，根据选择结果确定针对所述第二用户分配的资源额度。

在一种实施方式中，所述第四确定模块具体配置为：

获取待分配资源的剩余总资源；

在一种实施方式中，所述第三获取模块具体配置为：

在一种实施方式中，所述第三确定模块具体配置为：

所述第四确定模块，具体配置为：

第五方面，实施例提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面和第二方面中任一项所述的方法。

第六方面，实施例提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面和第二方面中任一项所述的方法。

本说明书实施例提供的方法和装置，在训练预测模型时，将第一用户的第一特征数据和第一资源额度输入预测模型，预测模型输出预测得到的第一用户在获得第一资源额度的资源时的分享行为数据，将预测的分享行为数据与真实的分享行为数据进行比较，确定第一预测损失，向使得第一预测损失减小的方向，更新预测模型的参数。由于第一特征数据基于第一关系特征得到，第一关系特征基于分享关系图谱确定，这使得该第一关系特征包含了用户之间的分享关系特征，即第一特征数据包含了用户之间的分享关系特征，特征数据更丰富，对用户的表达也更准确。采用这样的特征数据表达用户时，能够使得预测模型更准确地识别相似用户，进而更准确地预测用户在不同资源额度下的分享行为数据。在根据预测的分享行为数据对应的资源额度对用户分配资源额度时，能够使得对用户分配的资源额度更有针对性，减少资源消耗。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书披露的一个分享关系图谱的局部结构示意图；

图2为一个实施例提供的预测模型训练方法的流程示意图；

图3为一个实施例提供的图神经网络模型和预测模型联合训练的示意图；

图4为一个实施例提供的确定用户资源额度的方法流程示意图；

图5为一个实施例提供的预测模型训练装置的示意性框图；

图6为一个实施例提供的确定用户资源额度的装置的示意性框图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

服务平台可以通过客户端等形式向注册用户提供相应的服务。服务平台可以通过客户端接收用户的注册操作，接收注册用户作为待服务用户。服务平台和客户端可以采用账号来表示注册用户。为了增加用户粘度或者增加用户量等，服务平台可以向分享服务的注册用户分配一定的资源，以该资源换取用户继续分享该服务。上述资源可以包括实体资源和/或虚拟资源。实体资源包括电、煤气、水等，虚拟资源可以包括存储空间、数据流量等。

在一种实施场景中，提供垃圾回收的服务平台，可以在线下收取用户提供的可回收垃圾，并在线上将该可回收垃圾转换成一定的资源，添加至用户账户。例如，可以根据一定的换算关系将可回收垃圾转换成电量、水量、煤气量或者货币等，进而提供垃圾回收服务。

当老用户将垃圾回收的服务成功分享至新用户时，可以向老用户分配一定的资源，使得更多的用户参与到垃圾回收当中。

在另一种实施场景中，提供存储空间的云存储平台，可以为用户提供一定的存储空间。当老用户向新用户分享该云存储平台时，云存储平台可以向老用户分配一定的存储空间。

不同的用户在获取到一定资源时，可能实施不同的分享行为。例如，当用户1在获取到1度电量时，会将垃圾回收服务分享至1个用户，在获取到2度电量时，会将垃圾回收服务分享至5个用户；用户2在获取到1度电量或2度电量时，可能均不再继续分享垃圾分类服务。不同的用户在获取不同的资源额度时，存在不同的分享行为。本说明书实施例可以利用大量已有的无偏样本数据训练预测模型，由该预测模型预测用户在不同资源额度下的分享行为数据。预测模型可以采用神经网络来实现，例如卷积神经网络(Convolutional NeuralNetworks，CNN)或深度神经网络(Deep Neural Networks，DNN)等。无偏样本数据可以包括采用无偏倚的方法抽取得到的样本数据，其包括用户在接收到一定资源额度的资源之后的分享行为数据。无偏样本数据中的分享行为数据可以作为标准数据。在训练预测模型时，用于输入预测模型的用户的特征数据，可以包括属性特征，属性特征用于表征用户的静态属性，例如用户的年龄、职业、常住地等。特征数据还可以包括个体特征，该个体特征用于表征用户的个体资源敏感度，例如，该用户在接收到不同资源额度时执行的个体行为是否会发生变化以及变化的明显程度。

为了使得特征数据对用户的表达更加准确，本说明书实施例从分享关系图谱中提取用户的关系特征，至少基于该关系特征得到用户的特征数据。其中，分享关系图谱用于表征多个用户之间的分享关系，包括多个用户节点以及用户节点之间存在分享关系时形成的连接边。图1为一个分享关系图谱的局部结构示意图，圆圈代表用户节点，圆圈中的数字代表用户节点的编号，圆圈之间的连线代表连接边。用户节点代表用户。

分享关系图谱可以采用邻接矩阵的形式进行表示，其包括大量的用户节点和大量的连接边，也包含对应的用户节点数据和连接边数据。用户节点数据可以包括用户属性特征和业务属性特征。用户属性特征可以包括用户的年龄、职业、常住地、偏好等。业务属性特征可以包括是新用户还是老用户、是否为业务目标用户、所在城市的分档等。连接边数据可以包括业务统计特征和行为特征。业务统计特征可以包括历史窗口期的多种业务统计。行为特征可以包括业务关注度、活跃度等。分享关系图谱中可以不区分用户与用户之间的分享与被分享关系，即分享关系图谱为无向图。分享关系图谱可以是根据大量的用户原始数据得到。该用户原始数据可以包括n天时间窗口内用户之间的若干种成功分享行为数据，不限于资源的分享，可以是名片的分享、链接的分享等等，能够体现用户之间互动的数据均可以添加至用户原始数据中。n可以为30、60之类的数据。

下面结合图2对预测模型的训练方法进行说明。该方法可以通过计算机执行，具体的执行主体可以为任何具有计算、处理能力的装置、设备、平台或设备集群等。在训练预测模型时，可以采用大量样本数据对模型进行训练。为了更清楚地说明模型训练过程，在下文的描述中，针对大量样本数据中的任意一个样本数据(例如第一用户对应的样本数据)对模型训练过程进行说明。为了提高可读性，下文采用A表示第一用户。本实施例，通过以下步骤S210～步骤S260对预测模型的训练过程进行说明。

步骤S210：基于分享关系图谱，获取第一用户A的第一关系特征GfeatureA1。其中，该第一关系特征包含第一用户A自身特征以及第一用户A的邻居用户的特征。该第一关系特征可以采用向量表示。

本步骤中，基于分享关系图谱获取第一用户A的第一关系特征GfeatureA1时，可以包括多种实施方式。

一种实施方式中，可以通过图神经网络模型，利用分享关系图谱中第一用户节点1及其邻居节点集的数据，进行多级特征聚合，得到第一用户A的第一关系特征GfeatureA1。其中，第一用户节点1对应第一用户A。第一用户节点1采用图2分享关系图谱中的节点1表示。例如，在针对第一用户节点1进行2级特征聚合的实施方式中，可以聚合与第一用户节点1相连接的一阶邻居节点3、4和6的特征，以及二阶邻居节点2和5的特征，得到第一用户A的第一关系特征GfeatureA1。

图神经网络模型(Graph Neural Network，GNN)可以用于根据模型参数、分享关系图谱和输入的第一用户节点1，确定第一用户A的第一关系特征，其输入可以是第一用户节点，输出可以为第一关系特征。第一用户节点可以采用编号表示。

另一种实施方式中，可以获取分享关系图谱的邻接矩阵AM，对邻接矩阵AM进行特征值分解，利用特征值分解结果，确定邻接矩阵的节点向量矩阵Q，从该节点向量矩阵Q中读取第一用户A对应的第一节点向量，作为第一关系特征GfeatureA1。

其中，节点向量矩阵Q包括若干个用户节点的节点向量，节点向量用于表征用户的关系特征。对邻接矩阵AM进行特征值分解，能够提取邻接矩阵中用户节点的特征。

对邻接矩阵AM进行特征值分解时，可以在邻接矩阵AM为方阵且满足一定条件时，直接对邻接矩阵进行特征值分解，将邻接矩阵AM表示为AM＝QΣQ^-1，其中特征值矩阵Q即是节点向量矩阵。也可以在邻接矩阵AM不为方阵且满足一定条件时，对邻接矩阵AM进行奇异值分解，将得到的左奇异矩阵作为节点向量矩阵。

步骤S220：至少基于第一关系特征GfeatureA1，确定第一用户A的第一特征数据featureA1。

本步骤，可以直接将第一关系特征GfeatureA1确定为第一用户A的第一特征数据featureA1，也可以将第一关系特征GfeatureA1与第一用户A的其他特征进行融合，得到第一特征数据featureA1。

例如，可以获取用于表征第一用户A的静态属性的第一属性特征RfeatureA1，获取用于表征第一用户A的个体资源敏感度的第一个体特征PfeatureA1，将第一关系特征GfeatureA1与第一属性特征RfeatureA1和/或第一个体特征PfeatureA1进行融合，得到第一用户A的第一特征数据featureA1。

其中，第一个体特征PfeatureA1基于第一用户A针对不同资源额度执行个体行为时对应的个体行为数据而提取得到。第一属性特征和第一个体特征可以采用向量表示。具体的，第一用户A的第一属性特征和第一个体特征可以从第一用户的注册信息和/或对应的客户端中获取。客户端可以存储第一用户A针对不同资源额度执行个体行为时对应的个体行为数据。

在将第一关系特征GfeatureA1与第一属性特征RfeatureA1和/或第一个体特征PfeatureA1进行融合时，可以包括将第一关系特征GfeatureA1与第一属性特征RfeatureA1进行融合，得到第一特征数据；或者，将第一关系特征GfeatureA1与第一个体特征PfeatureA1进行融合，得到第一特征数据；或者，将第一关系特征GfeatureA1与第一属性特征RfeatureA1和第一个体特征PfeatureA1三者进行融合，得到第一特征数据。

在对特征进行融合时，可以直接将特征对应的向量拼接成维度更丰富的向量，得到融合后的特征。

第一属性特征可以包括用户的年龄、职业、常住地等特征。第一个体特征可以表征第一用户是否为高资源敏感度的用户等。将第一关系特征与第一属性特征和/或第一个体特征进行融合，能够使得第一特征数据更丰富，对第一用户的表达更准确。

步骤S230：获取第一用户A在接收到第一资源额度quota1的资源之后的分享行为数据dataA1，作为标准数据。第一资源额度的资源可以理解为对第一用户A的奖励资源。上述分享行为数据dataA1，可以从预先保存的大量无偏样本数据中获取。无偏样本数据是多个用户真实行为发生后采集到的数据。无偏样本数据中还可以包括第一用户A在接收到其他资源额度的资源之后的分享行为数据。

上述分享行为数据可以包括不同类别的子分享行为数据，例如子分享行为数据可以包括分享天数、分享次数、分享人次等。

步骤S240：将第一特征数据featureA1和第一资源额度quota1输入预测模型，通过预测模型输出第一用户A针对第一资源额度quota1的分享行为的预测数据dataA2。

预测模型用于根据模型参数以及输入的第一特征数据和第一资源额度，预测第一用户在接收到该第一资源额度的资源之后的分享行为数据，该分享行为数据可以为预测模型的输出数据。

步骤S250：根据标准数据dataA1与预测数据dataA2的比较，确定第一预测损失lossA1。

本步骤可以采用多种计算损失的函数，根据标准数据dataA1与预测数据dataA2的差异确定第一预测损失lossA1。例如，可以采用平方误差函数、对数损失函数等计算第一预测损失。

在分享行为数据包括不同类别的子分享行为数据的情况下，根据标准数据与预测数据的比较，确定第一预测损失时，可以将标准数据dataA1与预测数据dataA2中同类别的子分享行为数据分别进行比较，得到多个类别的预测损失，根据多个类别的第一预设权重，对多个类别的预测损失进行融合，得到第一预测损失lossA1。

例如，当标准数据dataA1中包括分享天数D1、分享次数F1和分享人次T1，预测数据dataA2中包括分享天数D2、分享次数F2和分享人次T2时，可以根据分享天数D1和D2的比较确定预测损失L1，根据分享次数F1和F2的比较确定预测损失L2，根据分享人次T1和T2的比较，确定预测损失L3。将θ1*L1+θ2*L2+θ3*L3的结果作为第一预测损失lossA1，其中θ1、θ2和θ3分别为分享天数、分享次数和分享人次的权重。

步骤S260：向使得第一预测损失lossA1减小的方向，更新预测模型，直至预测模型训练完成。

具体的，可以采用梯度下降法或者反向传播法，向使得第一预测损失lossA1减小的方向，调整预测模型的模型参数。

步骤S210～S260可以理解为对预测模型的一次训练过程。在调整预测模型的模型参数之后，可以继续获取其他样本数据和对应的特征数据对预测模型进行训练。当第一预测损失小于预设阈值时，或者训练次数达到预设次数时，可以确定预测模型训练完成。

由上述内容可见，本实施例中，由于第一特征数据基于第一关系特征得到，第一关系特征基于分享关系图谱确定，这使得该第一关系特征包含了用户之间的分享关系特征，即第一特征数据包含了用户之间的分享关系特征，特征数据更丰富，对用户的表达也更准确。采用这样的特征数据表达用户时，能够使得预测模型更准确地识别相似用户，进而更准确地预测用户在不同资源额度下的分享行为数据。在根据预测的分享行为数据对应的资源额度对用户分配资源额度时，能够使得对用户分配的资源额度更有针对性；按照分配的资源额度对用户分配资源时，也能使得对用户分配的资源的有效性更高，减少资源消耗。

在步骤S210的说明中提及的图神经网络模型，可以预先基于分享关系图谱训练完成，也可以与预测模型进行联合训练。下面分别对两种实施方式进行说明。

在图神经网络模型与预测模型进行联合训练时，步骤S260中，可以向使得第一预测损失lossA1减小的方向，更新预测模型和图神经网络模型。

参见图3所示的联合训练示意图。其中，将第一用户A输入图神经网络模型，图神经网络模型根据模型参数，以及从分享关系图谱中获取的第一用户节点1的数据和对应的邻居节点集的数据，进行多级特征聚合，得到第一用户A的第一关系特征GfeatureA1。图神经网络模型输出第一用户A的第一关系特征GfeatureA1。在获取第一属性特征和第一个体特征之后，将第一关系特征、第一属性特征和第一个体特征进行融合，得到第一特征数据。预测模型根据模型参数以及输入的第一特征数据和第一资源额度，确定第一用户A的分享行为数据dataA2。根据dataA1和dataA2的比较，得到第一预测损失lossA1，并向使得第一预测损失lossA1减小的方向，更新预测模型的模型参数和图神经网络模型的模型参数。该例中第一特征数据为三种特征的融合数据，这只是一种实施方式。第一特征数据也可以是第一关系特征本身，或者是第一关系特征与第一属性特征或第一个体特征的融合。

采用大量样本数据进行训练，对预测模型和图神经网络模型进行联合训练，能够使得两个模型的更新链路更统一，训练的模型也更准确。

图神经网络模型也可以基于分享关系图谱预先训练完成，在对预测模型进行训练时，无需对图神经网络模型的模型参数进行调整。对图神经网络模型进行训练，其目的是使得图神经网络模型能够提取到用户节点更丰富、更准确的关系特征，其训练过程可以包括多种实施方式，包括有监督的训练方式(有标签)和无监督的训练方式(无标签)。在有监督的训练方式中，用户节点对应存在标准标签，图神经网络模型可以通过提取的用户节点的特征来预测用户节点的标签，并根据预测的标签与标准标签进行比较，得到损失，向减小该损失的方向更新图神经网络模型。在无监督的训练方式中，利用用户节点之间的相互关系得到标准数据，由图神经网络模型提取的用户节点的特征来得到预测数据，根据预测数据与标准数据的比较得到损失，向减小该损失的方向更新图神经网络模型。

在训练完成预测模型之后，可以利用预测模型对第二用户的分享行为数据进行预测，以便根据预测结果选择针对该用户分配的资源额度，进而能够使得对用户分配的资源额度更有针对性，减少资源消耗。下面对本说明书提供的确定用户资源额度的方法进行说明。

第二用户X，可以是与训练预测模型时的第一用户A不同的用户。在一种场景中，当前没有任何关于第二用户X在得到一定资源额度的资源时的分享行为数据。在另一种场景中，当前存在关于第二用户X在得到某少数几个资源额度的资源时的分享行为数据，可以利用本说明书提供的方法预测第二用户X在得到其他未得到过的资源额度的资源时的分享行为数据。例如，第二用户X得到过资源额度为q1和q2的资源，未得到过资源额度为q3～q9的资源，则可以采用本说明书提供的方法预测第二用户X在得到资源额度为q3～q9的资源时的分享行为数据。

图4为一个实施例提供的确定用户资源额度以对用户进行资源分配的方法的流程示意图。该方法可以通过计算机执行，执行主体具体可以为任何具有计算、处理能力的装置、设备、平台或设备集群等。该方法可以包括以下步骤S410～S440。

步骤S410，基于分享关系图谱，获取待分配资源的第二用户X的第二关系特征GfeatureX。

本步骤可以包括多种实施方式。一种实施方式包括，通过图神经网络模型，利用分享关系图谱中第二用户节点及其邻居节点集的数据，进行多级特征聚合，得到第二用户X的第二关系特征GfeatureX。其中，第二用户节点对应第二用户X。本实施方式中的图神经网络模型已经训练完成。

另一种实施方式包括，可以获取基于分享关系图谱的邻接矩阵AM而得到的节点向量矩阵Q，从该节点向量矩阵Q中读取第二用户X对应的节点向量，作为第二关系特征GfeatureX。基于分享关系图谱的邻接矩阵AM而得到的节点向量矩阵Q的过程，可以参见步骤S210中的相关描述。

步骤S420，至少基于第二关系特征GfeatureX，确定第二用户X的第二特征数据featureX。

本步骤，可以直接将第二关系特征GfeatureX确定为第二用户X的第二特征数据featureX，也可以将第二关系特征GfeatureX与第二用户X的其他特征进行融合，得到第二特征数据featureX。

例如，可以获取用于表征第二用户X的静态属性的第二属性特征RfeatureX，和/或，获取用于表征第二用户X的个体资源敏感度的第二个体特征PfeatureX；将第二关系特征GfeatureX与第二属性特征RfeatureX和/或第二个体特征PfeatureX进行融合，得到第二用户X的第二特征数据featureX。

其中，第二个体特征PfeatureX基于第二用户X针对不同资源额度执行个体行为时对应的个体行为数据而提取得到。第二属性特征和第二个体特征可以采用向量表示。具体的，第二用户X的第二属性特征和第二个体特征可以从第二用户X的注册信息和/或对应的客户端中获取。客户端可以存储第二用户X针对不同资源额度执行个体行为时对应的个体行为数据。

步骤S430，将第二特征数据featureX和多个不同档位资源额度输入预测模型，通过预测模型输出第二用户X针对多个不同档位资源额度的分享行为数据dataX。其中，预测模型可以采用图2描述的方法训练完成。

其中，可以预先设定多个不同档位资源额度，其数量也可以预先设定。例如，可以设定q0～q9等十个档位资源额度。当资源表示电量时，可以设定从0.1度电到1度电之间、精确到小数点后一位的十个档位额度；当资源表示货币时，可以设定0.1元到2元之间的十个或者二十个档位。

本步骤中，预测模型可以分别将第二特征数据featureX与任意一个档位资源额度作为输入数据，通过多次执行数据预测处理，得到第二用户X针对多个不同档位资源额度的分享行为数据dataX。

例如，当多个不同档位资源额度分别包括q0～q3四个档位资源额度时，预测模型确定第二用户X针对四个档位资源额度的以下分享行为数据：q0—dataX_0，q1—dataX_1，q2—dataX_2，q3—dataX_3。

当分享行为数据可以包括不同类别的子分享行为数据，例如子分享行为数据可以包括分享天数、分享次数、分享人次等时，分享行为数据dataX_0、dataX_1、dataX_2和dataX_3的任意一个中，均包含分享天数、分享次数、分享人次数据。

根据对已有数据的研究发现，较大的分享行为数据并不一定对应着较大的资源额度。而预测模型通过对大量无偏样本数据的训练，能够很好地学习到特征数据、资源额度和分享行为数据之间的隐藏关系。因此，当将用户的特征数据和不同档位资源额度输入预测模型时，预测模型可以根据学习到的上述隐藏关系，更准确地匹配相似用户，进而预测不同档位资源额度对应的分享行为数据。依据预测得到的该用户针对不同档位资源额度的分享行为数据，可得知该用户针对不同档位资源的敏感程度。

步骤S440，根据输出的分享行为数据dataX对多个不同档位资源额度进行选择，根据选择结果确定针对第二用户X分配的资源额度。在选择时，可以直接选择最大的分享行为数据dataX对应的档位资源额度，作为针对第二用户X分配的资源额度。

当分享行为数据dataX包括不同类别的子分享行为数据时，本实施例中，可以针对任意一个分享行为数据dataX，根据多个类别的第二预设权重，对该分享行为数据中的子分享行为数据进行融合，得到该分享行为数据对应的评分值；根据得到的评分值对多个不同档位资源额度进行选择，根据选择结果确定针对第二用户X分配的资源额度。在对任意一个分享行为数据中的子分享行为数据进行融合时，可以加权相加，也可以加权相乘。

例如，针对步骤S430中的分享行为数据dataX_0(D_0，F_0，T_0)，其包括分享天数D_0、分享次数F_0和分享人次T_0,当分享天数、分享次数、分享人次的权重分别为0.2、0.3和0.5时，可以对分享天数D_0、分享次数F_0和分享人次T_0进行融合，即计算0.2*D_0+0.3*F_0+0.5*T_0的和值(此为加权相加，还可以加权相乘，针对加权相乘，不再举例说明)，将该和值直接作为评分值，或者对该和值进行预设处理后的结果作为评分值。如此，即可将每个分享行为数据转换为一个score，即将第二用户X针对四个资源额度的分享行为数据q0—dataX_0，q1—dataX_1，q2—dataX_2，q3—dataX_3，转换为：q0—scoreX_0，q1—scoreX_1，q2—scoreX_2，q3—scoreX_3，则可以直接将最大的评分值(例如为scoreX_2)对应的档位资源额度q2确定为针对第二用户X分配的资源额度。

在实际应用中，并不一定是最大的评分值对应着最大的资源额度。因此，可以根据分享行为数据来选择对应的资源额度。

在确定第二用户X的资源额度时，步骤S440还可以采用以下实施方式：

获取待分配资源的剩余总资源，按照输出的分享行为数据dataX的大小对多个不同档位资源额度进行排序，并从排序结果中选择一个不大于剩余总资源的档位资源额度，作为针对第二用户X分配的资源额度。

例如，第二用户X针对4个档位资源额度(q0～q3)的分享行为数据dataX包括：q0—dX_0，q1—dX_1，q2—dX_2，q3—dX_3。按照从大到小的顺序对第二用户X的分享行为数据dataX进行排序后，得到：q2—dX_2，q1—dX_1，q3—dX_3，q0—dX_0。由于分享行为数据与档位资源额度之间存在对应关系，上述对分享行为数据的排序结果中，也包含对不同档位资源额度的排序q2、q1、q3和q0。如果q2不大于剩余总资源，则将q2作为分配给第二用户X的资源额度；如果q2大于剩余总资源，则判断q1是否大于剩余总资源，如果不大于，则将q1作为分配给第二用户X的资源额度；如果q1大于剩余总资源，则依次分别判断q3和q0是否大于剩余总资源，直至确定不大于剩余总资源的档位资源额度。

由上述内容可见，本实施例中，由于第二特征数据基于第二关系特征得到，第二关系特征基于分享关系图谱确定，这使得该第二关系特征包含了用户之间的分享关系特征，即第二特征数据包含了用户之间的分享关系特征，特征数据更丰富，对用户的表达也更准确。将这样的特征数据输入预测模型时，能够使得预测模型更准确地识别相似用户，进而更准确地预测用户在不同资源额度下的分享行为数据。根据预测的分享行为数据对应的资源额度对用户分配资源额度，能够使得对用户分配的资源额度更有针对性；按照分配的资源额度对用户分配资源时，也能使得对用户分配的资源的有效性更高，减少资源消耗。

在一种实施场景中，某些支付平台，例如支付宝平台或银行平台，可以为用户提供相关的服务。支付平台可以在用户执行一定的操作之后向用户发放一定额度的红包。不同的用户在接收到不同额度的红包时，可能产生不同的分享行为。采用本说明书提供的实施例，可以训练预测模型，用于预测用户在接收到不同额度的红包时的分享行为数据。在预测模型训练完成后，可以根据分享关系图谱以及训练好的预测模型，确定用户针对不同档位红包额度的分享行为数据，根据分享行为数据对不同档位额度进行选择，确定针对用户分配的红包额度。

上述内容对本说明书的特定实施例进行了描述，其他实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行，并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的，或者可能是有利的。

图5为一实施例中提供的用于预测用户分享行为数据的预测模型训练装置的示意性框图，部署在计算机中。该装置实施例与图2所示实施例相对应。

该装置500包括：

第一获取模块510，配置为基于分享关系图谱，获取第一用户的第一关系特征；其中，所述分享关系图谱用于表征多个用户之间的分享关系，包括多个用户节点以及用户节点之间存在分享关系时形成的连接边；

第一确定模块520，配置为至少基于所述第一关系特征，确定所述第一用户的第一特征数据；

第二获取模块530，配置为获取所述第一用户在接收到第一资源额度的资源之后的分享行为数据，作为标准数据；

第一预测模块540，配置为将所述第一特征数据和所述第一资源额度输入预测模型，通过所述预测模型输出所述第一用户针对所述第一资源额度的分享行为的预测数据；

第二确定模块550，配置为根据所述标准数据与所述预测数据的比较，确定第一预测损失；

第一更新模块560，配置为向使得所述第一预测损失减小的方向，更新所述预测模型。

在一种实施方式中，第一获取模块530具体配置为：

在一种实施方式中，第一更新模块560具体配置为：

在一种实施方式中，第一确定模块520具体配置为：

第二确定模块550具体配置为：

在一种实施方式中，第一获取模块510具体配置为：

获取所述分享关系图谱的邻接矩阵；

图6为一实施例中提供的确定用户资源额度以对用户进行资源分配的装置的示意性框图，部署在计算机中。该装置实施例与图4所示方法实施例相对应。该装置600包括：

第三获取模块610，配置为基于分享关系图谱，获取待分配资源的第二用户的第二关系特征；其中，所述分享关系图谱用于表征多个用户之间的分享关系，包括多个用户节点以及用户节点之间存在分享关系时形成的连接边；

第三确定模块620，配置为至少基于所述第二关系特征，确定所述第二用户的第二特征数据；

第二预测模块630，配置为将所述第二特征数据和多个不同档位资源额度输入预测模型，通过所述预测模型输出所述第二用户针对所述多个不同档位资源额度的分享行为数据；其中，预测模型采用图5所述的装置训练完成；

第四确定模块640，配置为根据输出的所述分享行为数据对多个不同档位资源额度进行选择，根据选择结果确定针对所述第二用户分配的资源额度。

在一种实施方式中，用户的数量为多个；第四确定模块640具体配置为：

获取待分配资源的剩余总资源；

在一种实施方式中，第三获取模块610具体配置为：

通过图神经网络模型，利用所述分享关系图谱中第二用户节点及其邻居节点集的数据，进行多级特征聚合，得到所述第二用户的第二关系特征；其中，第二用户节点对应第二用户。

在一种实施方式中，第三确定模块620具体配置为：

获取用于表征第二用户的静态属性的第二属性特征，和/或，获取用于表征所述用户的个体资源敏感度的第二个体特征；其中，第二个体特征基于所述用户针对不同资源额度执行个体行为时对应的个体行为数据而提取得到；

第四确定模块640具体配置为：

上述装置实施例与方法实施例相对应，具体说明可以参见方法实施例部分的描述，此处不再赘述。装置实施例是基于对应的方法实施例得到，与对应的方法实施例具有同样的技术效果，具体说明可参见对应的方法实施例。

本说明书的另一实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行图2～图3描述的方法。

本说明书的另一实施例还提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现图2～图3描述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于存储介质和计算设备实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明实施例的目的、技术方案和有益效果进行了进一步的详细说明。所应理解的是，以上所述仅为本发明实施例的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种用于预测用户分享行为数据的预测模型训练方法，通过计算机执行，所述方法包括：

向使得所述第一预测损失减小的方向，更新所述预测模型。

2.根据权利要求1所述的方法，所述基于分享关系图谱，获取第一用户的第一关系特征的步骤，包括：

3.根据权利要求2所述的方法，所述向使得所述第一预测损失减小的方向，更新所述预测模型的步骤，包括：

4.根据权利要求1所述的方法，所述至少基于所述第一关系特征，确定所述第一用户的第一特征数据的步骤，包括：

5.根据权利要求1所述的方法，所述分享行为数据包括不同类别的子分享行为数据；

所述根据所述标准数据与所述预测数据的比较，确定第一预测损失的步骤，包括：

6.根据权利要求1所述的方法，所述基于分享关系图谱，获取第一用户的第一关系特征的步骤，包括：

获取所述分享关系图谱的邻接矩阵；

7.一种确定用户资源额度以对用户进行资源分配的方法，通过计算机执行，所述方法包括：

将所述第二特征数据和多个不同档位资源额度输入预测模型，通过所述预测模型输出所述第二用户针对所述多个不同档位资源额度的分享行为数据；其中，所述预测模型采用权利要求1所述的方法训练完成；

8.根据权利要求7所述的方法，所述根据输出的所述分享行为数据对多个不同档位资源额度进行选择，根据选择结果确定针对所述第二用户分配的资源额度的步骤，包括：

获取待分配资源的剩余总资源；

9.根据权利要求7所述的方法，所述基于分享关系图谱，获取待分配资源的第二用户的第二关系特征的步骤，包括：

10.根据权利要求7所述的方法，所述至少基于所述第二关系特征，确定所述第二用户的第二特征数据的步骤，包括：

11.根据权利要求7所述的方法，所述分享行为数据包括不同类别的子分享行为数据；

针对任意一个所述分享行为数据，根据多个类别的第二预设权重，对该分享行为数据中的子分享行为数据进行融合，得到该分享行为数据对应的评分值；

12.一种用于预测用户分享行为数据的预测模型训练装置，部署在计算机中，所述装置包括：

13.根据权利要求12所述的装置，所述第一获取模块，具体配置为：

14.根据权利要求13所述的装置，所述第一更新模块，具体配置为：

15.根据权利要求12所述的装置，所述第一确定模块，具体配置为：

16.根据权利要求12所述的装置，所述分享行为数据包括不同类别的子分享行为数据；

所述第二确定模块，具体配置为：

17.根据权利要求12所述的装置，所述第一获取模块，具体配置为：

获取所述分享关系图谱的邻接矩阵；

18.一种确定用户资源额度以对用户进行资源分配的装置，部署在计算机中，所述装置包括：

第二预测模块，配置为将所述第二特征数据和多个不同档位资源额度输入预测模型，通过所述预测模型输出所述第二用户针对所述多个不同档位资源额度的分享行为数据；其中，所述预测模型采用权利要求12所述的装置训练完成；

19.根据权利要求18所述的装置，所述第四确定模块，具体配置为：

获取待分配资源的剩余总资源；

20.根据权利要求18所述的装置，所述第三获取模块，具体配置为：

21.根据权利要求18所述的装置，所述第三确定模块，具体配置为：

22.根据权利要求18所述的装置，所述分享行为数据包括不同类别的子分享行为数据；

所述第四确定模块，具体配置为：

23.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-11中任一项所述的方法。

24.一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-11中任一项所述的方法。