CN113935251A

CN113935251A - 用户行为预测模型的生成方法、用户行为预测方法及装置

Info

Publication number: CN113935251A
Application number: CN202111546965.7A
Authority: CN
Inventors: 余珊珊; 梁东旭; 洪立印
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-12-17
Filing date: 2021-12-17
Publication date: 2022-01-14
Anticipated expiration: 2041-12-17
Also published as: CN113935251B

Abstract

本公开关于一种用户行为预测模型的生成方法、用户行为预测方法及装置，其中方法通过获取训练样本数据，当训练样本数据为新用户样本数据时，根据将新用户样本数据分别训练第一预测网络和第二预测网络，从而得到训练后的用户行为预测模型。由于第一预测网络是基于新用户样本数据和老用户样本数据训练后得到，第二预测网络则由新用户样本数据进行训练，且能够为第一预测网络和第二预测网络的输出赋予相应的权重，从而使得模型能够学习到用户成长过程中的兴趣变化，不仅能够有效提高模型的泛化能力，还可以提高模型的准确性。

Description

用户行为预测模型的生成方法、用户行为预测方法及装置

技术领域

本公开涉及计算机技术领域，尤其涉及一种用户行为预测模型的生成方法、用户行为预测方法及装置。

背景技术

随着计算机技术的发展，越来越多的场合需要预估用户对资源的点击率(ClickThrough Rate，CTR)、点赞率等用户行为，如在个性化推荐技术中，通过将预估点击率较高的资源推荐给用户，以便提高用户点击资源的概率。

相关技术中，由于新老用户属性的差异，现有新老用户CTR预估集成模型主要包含两类，一类是静态的集成方法，另一类是动态的集成方法。静态的集成方法是指训练一个全局的权重参数来同时考虑用户的静态属性和行为数据，然而，这种方法对于不同场景下的不同用户，权重参数是一定的，从而忽略了不同用户之间的偏好差异性。而动态的集成方法则只是基于注意力机制在每个场景下为每类特征分配不同的权重，而忽略了用户成长过程中的兴趣变化。因此，现有的新老用户CTR预估集成模型都忽略了用户兴趣的动态变化，从而导致CTR预估的准确性不高。

发明内容

本公开提供一种用户行为预测模型的生成方法、用户行为预测方法及装置，以至少解决相关技术中用户行为预估准确性不高的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种用户行为预测模型的生成方法，包括：

获取训练样本数据，所述训练样本数据包括样本账户的属性数据和行为数据；

当所述训练样本数据为新用户样本数据时，将所述新用户样本数据输入第一预测网络，得到用户行为的第一预测样本特征，所述第一预测网络的初始网络是通过老用户样本数据训练后得到的；

将所述新用户样本数据输入第二预测网络，得到用户行为的第二预测样本特征以及权重数据，所述权重数据包括用于表征所述用户行为的第一预测样本特征和第二预测样本特征分别对应的权重；

根据所述第一预测样本特征、第二预测样本特征和权重数据，对所述第一预测网络和第二预测网络进行参数调整，得到训练后的用户行为预测模型。

在其中一个实施例中，所述方法还包括：当所述训练样本数据为老用户样本数据时，通过所述老用户样本数据对所述第一预测网络进行参数调整。

在其中一个实施例中，所述训练样本数据中还包括标签信息；所述根据所述第一预测样本特征、第二预测样本特征和权重数据，对所述第一预测网络和第二预测网络进行参数调整，得到训练后的用户行为预测模型，包括：通过所述权重数据对所述第一预测样本特征和所述第二预测样本特征进行加权处理，得到加权处理后的第三预测样本特征；根据所述第一预测样本特征和标签信息确定对应的第一预测损失，以及根据所述第二预测样本特征、第三预测样本特征和标签信息确定对应的第二预测损失；根据所述第一预测损失对所述第一预测网络进行参数调整，以及根据所述第二预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型。

在其中一个实施例中，所述根据所述第一预测样本特征和标签信息确定对应的第一预测损失，包括：对所述第一预测样本特征进行归一化处理，得到对应的第一预测值，根据所述第一预测值和对应的标签信息计算第一预测损失。

在其中一个实施例中，所述根据所述第二预测样本特征、第三预测样本特征和标签信息确定对应的第二预测损失，包括：对所述第二预测样本特征进行归一化处理，得到对应的第二预测值，根据所述第二预测值和标签信息计算第三预测损失；对所述第三预测样本特征进行归一化处理，得到对应的第三预测值，根据所述第三预测值和标签信息计算第四预测损失；将所述第三预测损失与第四预测损失之和确定为第二预测损失。

在其中一个实施例中，所述第二预测网络包括用户行为预测子网络和动态调权子网络；所述将所述新用户样本数据输入第二预测网络，得到用户行为的第二预测样本特征以及权重数据，包括：将所述新用户样本数据输入第二预测网络，得到所述第二预测网络中用户行为预测子网络输出的第二预测样本特征，以及所述动态调权子网络输出的权重数据。

在其中一个实施例中，所述根据所述第一预测损失对所述第一预测网络进行参数调整，以及根据所述第二预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型，包括：采用所述第一预测损失对所述第一预测网络进行参数调整，以及采用所述第二预测损失对所述用户行为预测子网络进行参数调整，采用所述第四预测损失对所述动态调权子网络进行参数调整，得到训练后的用户行为预测模型。

在其中一个实施例中，所述新用户样本数据有多条；所述根据所述第一预测损失对所述第一预测网络进行参数调整，以及根据所述第二预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型，包括：根据每一条所述新用户样本数据分别对应的第一预测损失和第二预测损失，获取多条所述新用户样本数据对应的第一累计预测损失和第二累计预测损失；采用所述第一累计预测损失对所述第一预测网络进行参数调整，以及采用所述第二累计预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型。

根据本公开实施例的第二方面，提供一种用户行为预测方法，包括：

获取账户数据，所述账户数据包括当前的属性数据和行为数据；

当所述账户数据为新用户的账户数据时，将所述新用户的账户数据输入用户行为预测模型，得到预估的所述新用户对当前待推荐的目标资源的操作行为概率，所述用户行为预测模型根据权利要求1至8任一项所述的方法得到。

在其中一个实施例中，所述用户行为预测模型包括训练后的第一预测网络和第二预测网络；所述将所述新用户的账户数据输入用户行为预测模型，得到预估的所述新用户对当前等推荐的目标资源的操作行为概率，包括：将所述新用户的账户数据输入第一预测网络，得到对应的第一预测特征；将所述新用户的账户数据输入第二预测网络，得到对应的第二预测特征和权重数据，所述权重数据包括用于表征所述账户数据对应的第一预测特征和第二预测特征分别对应的权重；基于所述权重数据对所述第一预测特征和所述第二预测特征进行加权处理，得到加权处理后的第三预测特征；对所述第三预测特征进行归一化处理，得到所述新用户对当前待推荐的目标资源的操作行为概率。

根据本公开实施例的第三方面，提供一种用户行为预测模型的生成装置，包括：

训练样本数据获取模块，被配置为执行获取训练样本数据，所述训练样本数据包括样本账户的属性数据和行为数据；

第一预测模块，被配置为执行当所述训练样本数据为新用户样本数据时，将所述新用户样本数据输入第一预测网络，得到用户行为的第一预测样本特征，所述第一预测网络的初始网络是通过老用户样本数据训练后得到的；

第二预测模块，被配置为执行将所述新用户样本数据输入第二预测网络，得到用户行为的第二预测样本特征以及权重数据，所述权重数据包括用于表征所述用户行为的第一预测样本特征和第二预测样本特征分别对应的权重；

参数调整模块，被配置为执行根据所述第一预测样本特征、第二预测样本特征和权重数据，对所述第一预测网络和第二预测网络进行参数调整，得到训练后的用户行为预测模型。

在其中一个实施例中，所述参数调整模块还被配置为执行：当所述训练样本数据为老用户样本数据时，通过所述老用户样本数据对所述第一预测网络进行参数调整。

在其中一个实施例中，所述训练样本数据中还包括标签信息；所述参数调整模块包括：加权处理单元，被配置为执行通过所述权重数据对所述第一预测样本特征和所述第二预测样本特征进行加权处理，得到加权处理后的第三预测样本特征；损失确定单元，被配置为执行根据所述第一预测样本特征和标签信息确定对应的第一预测损失，以及根据所述第二预测样本特征、第三预测样本特征和标签信息确定对应的第二预测损失；参数调整单元，被配置为执行根据所述第一预测损失对所述第一预测网络进行参数调整，以及根据所述第二预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型。

在其中一个实施例中，所述损失确定单元被配置为执行：对所述第一预测样本特征进行归一化处理，得到对应的第一预测值，根据所述第一预测值和对应的标签信息计算第一预测损失。

在其中一个实施例中，所述损失确定单元还被配置为执行：对所述第二预测样本特征进行归一化处理，得到对应的第二预测值，根据所述第二预测值和标签信息计算第三预测损失；对所述第三预测样本特征进行归一化处理，得到对应的第三预测值，根据所述第三预测值和标签信息计算第四预测损失；将所述第三预测损失与第四预测损失之和确定为第二预测损失。

在其中一个实施例中，所述第二预测网络包括用户行为预测子网络和动态调权子网络；所述第二预测模块还被配置为执行：将所述新用户样本数据输入第二预测网络，得到所述第二预测网络中用户行为预测子网络输出的第二预测样本特征，以及所述动态调权子网络输出的权重数据。

在其中一个实施例中，所述参数调整单元还被配置为执行：采用所述第一预测损失对所述第一预测网络进行参数调整，以及采用所述第二预测损失对所述用户行为预测子网络进行参数调整，采用所述第四预测损失对所述动态调权子网络进行参数调整，得到训练后的用户行为预测模型。

在其中一个实施例中，所述参数调整单元还被配置为执行：根据每一条所述新用户样本数据分别对应的第一预测损失和第二预测损失，获取多条所述新用户样本数据对应的第一累计预测损失和第二累计预测损失；采用所述第一累计预测损失对所述第一预测网络进行参数调整，以及采用所述第二累计预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型。

根据本公开实施例的第四方面，提供一种用户行为预测装置，包括：

账户数据获取模块，被配置为执行获取账户数据，所述账户数据包括当前的属性数据和行为数据；

预测模块，被配置为执行当所述账户数据为新用户的账户数据时，将所述新用户的账户数据输入用户行为预测模型，得到预估的所述新用户对当前待推荐的目标资源的操作行为概率，所述用户行为预测模型根据如上第一方面所述的方法得到。

在其中一个实施例中，所述用户行为预测模型包括训练后的第一预测网络和第二预测网络；所述预测模块被配置为执行：将所述新用户的账户数据输入第一预测网络，得到对应的第一预测特征；将所述新用户的账户数据输入第二预测网络，得到对应的第二预测特征和权重数据，所述权重数据包括所述第一预测特征和第二预测特征分别对应的权重；基于所述权重数据对所述第一预测特征和所述第二预测特征进行加权处理，得到加权处理后的第三预测特征；对所述第三预测特征进行归一化处理，得到所述新用户对当前待推荐的目标资源的操作行为概率。

根据本公开实施例的第五方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现上述第一面或第二方面所述的方法。

根据本公开实施例的第六方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行上述第一面或第二方面所述的方法。

根据本公开实施例的第七方面，提供一种计算机程序产品，所述计算机程序产品中包括指令，所述指令被电子设备的处理器执行时，使得所述电子设备能够执行上述第一面或第二方面所述的方法。

本公开的实施例提供的技术方案至少带来以下有益效果：通过获取训练样本数据，当训练样本数据为新用户样本数据时，将新用户样本数据输入第一预测网络，得到用户行为的第一预测样本特征，并将新用户样本数据输入第二预测网络，得到用户行为的第二预测样本特征以及权重数据，进而根据第一预测样本特征、第二预测样本特征和权重数据，对第一预测网络和第二预测网络进行参数调整，得到训练后的用户行为预测模型。由于第一预测网络是基于新用户样本数据和老用户样本数据训练后得到，第二预测网络则由新用户样本数据进行训练，且能够为第一预测网络输出的第一预测样本特征和第二预测网络输出的第二预测样本特征赋予相应的权重，从而使得模型能够学习到用户成长过程中的兴趣变化，不仅能够有效提高模型的泛化能力，还可以提高模型的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种用户行为预测模型的生成方法的流程图。

图2是根据一示例性实施例示出的参数调整步骤的流程图。

图3是根据一示例性实施例示出的确定第二预测损失步骤的流程图。

图4是根据又一示例性实施例示出的一种用户行为预测模型的生成方法的流程图。

图5是根据一示例性实施例示出的一种用户行为预测方法的应用环境图。

图6是根据一示例性实施例示出的一种用户行为预测方法的流程图。

图7是根据一示例性实施例示出的预估操作行为概率步骤的流程图。

图8是根据一示例性实施例示出的一种用户行为预测模型的生成装置的框图。

图9是根据一示例性实施例示出的一种用户行为预测装置的框图。

图10是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

还需要说明的是，本公开所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于展示的数据、分析的数据等），均为经用户授权或者经过各方充分授权的信息和数据。

图1是根据一示例性实施例示出的一种用户行为预测模型的生成方法的流程图，如图1所示，包括以下步骤。

在步骤S110中，获取训练样本数据。

其中，训练样本数据是用于进行模型训练的数据，包括样本账户成长过程中不同时期的属性数据和行为数据。具体地，样本账户的属性数据包括但不限于账户标识、用户年龄、用户性别、所在省份、城市以及常用设备型号、网络类型等。行为数据则包括但不限于对应的历史资源展现信息、历史点击信息、历史关注信息、历史点赞信息、历史转发信息等。在本实施例中，可以基于用户的历史交互数据，并按交互时间获取用户成长过程中不同时期的属性数据和行为数据。由于对于用户成长过程中的不同时期，其相应的行为数据可能存在不同，因此，基于用户成长过程中不同时期的行为数据以及用户的属性数据进行模型训练，从而使得模型能够学习到用户成长过程中的兴趣变化，以提高模型的效果。

在步骤S120中，当训练样本数据为新用户样本数据时，将新用户样本数据输入第一预测网络，得到用户行为的第一预测样本特征。

其中，第一预测网络的初始网络是通过老用户样本数据训练后得到的。第一预测样本特征则是第一预测网络基于新用户样本数据提取的用于表征用户行为的第一特征数据。新用户样本数据和老用户样本数据分别是用户成长过程中不同时期的相关样本数据，具体地，可以基于用户的注册时长或使用时长等进行区分，例如，当某一用户的注册时长小于某一阈值时，则该用户对应账户的属性数据和行为数据为新用户样本数据，当某一用户的注册时长大于某一阈值时，则该用户对应账户的属性数据和行为数据为老用户样本数据；或者，当某一用户的使用时长小于某一阈值时，则该用户对应账户的属性数据和行为数据为新用户样本数据，当某一用户的使用时长大于某一阈值时，则该用户对应账户的属性数据和行为数据为老用户样本数据；或者，当某一用户间隔了较长时间（可以是预设的一个时间值）未登录账户，重新登录后的使用时间小于某一阈值时，则该用户对应账户的属性数据和行为数据为新用户样本数据，若重新登录后的使用时间小于某一阈值时，则该用户对应账户的属性数据和行为数据为老用户样本数据。

在本实施例中，当上述获取的训练样本数据为新用户样本数据时，则将新用户样本数据输入第一预测网络，从而得到网络输出的用于表征用户行为的第一预测样本特征。具体地，第一预测网络包括嵌入层和多层全连接层。在本实施例中，通过嵌入层将新用户样本数据映射到低维向量空间，得到用户行为对应的初始表示，进而将该初始表示输入到多层全连接层中，得到顶层全连接层的输出表示，该输出表示即为新用户样本数据对应的用户行为的第一预测样本特征。

在步骤S130中，将新用户样本数据输入第二预测网络，得到用户行为的第二预测样本特征以及权重数据。

其中，第二预测样本特征是第二预测网络基于新用户样本数据提取的用于表征用户行为的第二特征数据。权重数据则包括用于表征用户行为的第一预测样本特征和第二预测样本特征分别对应的权重。具体地，第二预测网络的结构在上述第一预测网络结构的基础上，还增加了一个全连接神经网络MLP。

在本实施例中，将新用户样本数据输入第二预测网络，通过第二预测网络中的嵌入层将新用户样本数据映射到低维向量空间，得到用户行为对应的初始表示，进而将该初始表示输入到多层全连接层中，得到顶层全连接层的输出表示，该输出表示即为新用户样本数据对应的用户行为的第二预测样本特征。通过全连接神经网络MLP对上述新用户样本数据进行特征提取和特征融合而得到第一预测样本特征和第二预测样本特征分别对应的权重。

在步骤S140中，根据第一预测样本特征、第二预测样本特征和权重数据，对第一预测网络和第二预测网络进行参数调整，得到训练后的用户行为预测模型。

其中，用户行为预测模型是在实际应用中可以根据用户账户数据预测用户操作行为概率的深度学习模型。具体地，本实施例中的用户行为预测模型是基于参数调整后的第一预测网络和第二预测网络得到。用户操作行为概率包括但不限于用户的点击概率、点赞概率、转发概率以及关注概率等。在本实施例中，通过上述得到的第一预测样本特征、第二预测样本特征和权重数据，分别对第一预测网络和第二预测网络进行参数调整，从而得到参数调整后的第一预测网络和第二预测网络，进而基于参数调整后的第一预测网络和第二预测网络得到训练后的用户行为预测模型。该用户行为预测模型可以用于预测用户的操作行为概率。

上述用户行为预测模型的生成方法中，通过获取训练样本数据，当训练样本数据为新用户样本数据时，将新用户样本数据输入第一预测网络，得到用户行为的第一预测样本特征，并将新用户样本数据输入第二预测网络，得到用户行为的第二预测样本特征以及权重数据，进而根据第一预测样本特征、第二预测样本特征和权重数据，对第一预测网络和第二预测网络进行参数调整，得到训练后的用户行为预测模型。由于第一预测网络是基于新用户样本数据和老用户样本数据训练后得到，第二预测网络则由新用户样本数据进行训练，且能够为第一预测网络输出的第一预测样本特征和第二预测网络输出的第二预测样本特征赋予相应的权重，从而使得模型能够学习到用户成长过程中的兴趣变化，不仅能够有效提高模型的泛化能力，还可以提高模型的准确性。

在一示例性实施例中，上述方法还可以包括：当训练样本数据为老用户样本数据时，通过老用户样本数据对第一预测网络进行参数调整。在本实施例中，模型训练过程中可以基于不同的训练样本数据对模型进行迭代训练。具体地，当训练样本数据为老用户样本数据时，通过老用户样本数据对第一预测网络进行迭代训练，以调整对应的网络参数。而当训练样本数据为新用户样本数据时，则通过上述步骤采用新用户样本数据对第一预测网络和第二预测网络进行迭代训练，以调整对应的网络参数，从而有效增加模型的泛化能力，提高模型预估的准确性。

在一示例性实施例中，上述训练样本数据中还可以包括标签信息。则如图2所示，在步骤S140中，根据第一预测样本特征、第二预测样本特征和权重数据，对第一预测网络和第二预测网络进行参数调整，得到训练后的用户行为预测模型，具体包括：

在步骤S210中，通过权重数据对第一预测样本特征和第二预测样本特征进行加权处理，得到加权处理后的第三预测样本特征。

其中，第三预测样本特征是基于上述权重数据对第一预测样本特征和第二预测样本特征进行加权处理后得到的整体预测特征。又由于权重数据是基于第二预测网络对新用户样本数据进行特征提取和特征融合后得到的第一预测样本特征和第二预测样本特征分别对应的权重，因此，基于权重数据对第一预测样本特征和第二预测样本特征进行加权处理后得到的第三预测样本特征，是考虑了用户成长过程中兴趣变化的整体预测特征，其准确性也更高。

具体地，加权处理是指乘以权重的处理。权重数据具体包括用于表征用户行为对应的第一预测样本特征的第一权重和第二预测样本特征的第二权重，因此，在本实施例中，通过将第一预测样本特征与对应的第一权重相乘，即可得到加权处理后的第一预测样本特征。同理，通过将第二预测样本特征与对应的第二权重相乘，即可得到加权处理后的第二预测样本特征。

进而通过对加权处理后的第一预测亲本特征和加权处理后的第二预测样本特征进行求和，从而得到加权处理后的第三预测亲本特征，即得到能够反应用户整体操作行为的整体预测特征。

举例来说，若权重数据为

，第一预测样本特征为

、第二预测样本特征为

，则有：

其中，

为加权处理后的第三预测样本特征，

为第一预测样本特征

对应的第一权重，

为第二预测样本特征

对应的的第二权重。

在步骤S220中，根据第一预测样本特征和标签信息确定对应的第一预测损失，以及根据第二预测样本特征、第三预测样本特征和标签信息确定对应的第二预测损失。

其中，标签信息是在模型训练过程中用于确定模型损失以调整模型参数的重要依据，也是检验模型有效性的标准参数。又由于本实施例中训练后的用户行为预测模型是用于预测用户操作行为概率的深度学习模型。因此，基于需要预测的用户具体的操作行为概率，可以采用具有相应标签信息的训练样本数据进行模型训练。例如，当需要预测的用户具体的操作行为概率为点击概率时，则对应的标签信息是样本账户是否点击样本资源的标签，当需要预测的用户具体的操作行为概率为点赞概率时，则对应的标签信息是样本账户是否对样本资源进行点赞的标签，同理，若需要预测的是其他的操作行为概率，则训练样本数据中具有相对应的标签信息。

样本资源则可以是历史时期向样本账户展现的资源，也即样本账户历史时期浏览的资源、点击的资源、关注的资源、点赞的资源以及转发的资源中的至少一种。具体地，资源包括但不限于视频、图片或文本等。在本实施例中，训练样本数据可以是基于样本账户与样本资源之间的交互而构建的，具体地，可以基于时间序列而构建不同时期的训练样本数据。例如，以标签信息为样本账户是否点击样本资源的标签为例来说，则基于历史时期A，训练样本数据中包括样本账户在历史时期A时的属性数据、样本账户在历史时期A时的行为数据以及样本账户在历史时期A时是否点击样本资源的标签信息。同理，对于历史时期B，训练样本数据中则包括样本账户在历史时期B时的属性数据、样本账户在历史时期B时的行为数据以及样本账户在历史时期B时是否点击样本资源的标签信息。

由于第一预测样本特征和第二预测样本特征是基于新用户样本数据并通过不同的网络模型而分别得到的用户行为的预测特征，而标签信息则记录了样本账户对样本资源的真实操作行为特征，因此，通过不同的网络模型输出的预测特征以及真实操作行为特征，可以通过计算得到不同网络模型的输出值与真实值之间的差异，也即损失，而损失则是在模型训练过程中用于调整模型参数的依据。又由于第一预测样本特征是基于第一预测网络得到，第二预测样本特征是基于第二预测网络得到，且第三预测样本特征是基于第二预测网络输出的权重数据进行加权处理得到，因此，在本实施例中，根据第一预测样本特征和标签信息可以确定对应的用于对第一预测网络进行训练的第一预测损失，根据第二预测样本特征、第三预测样本特征和标签信息可以确定对应的用于对第二预测网络进行训练的第二预测损失。

在步骤S230中，根据第一预测损失对第一预测网络进行参数调整，以及根据第二预测损失对第二预测网络进行参数调整，得到训练后的用户行为预测模型。

由于损失是在模型训练过程中用于调整模型参数的依据，而调整模型参数的过程即为模型更新的过程。因此，在本实施例中，可以根据第一预测损失对第一预测网络进行参数调整，从而得到参数调整后的第一预测网络，根据第二预测损失对第二预测网络进行参数调整，从而得到参数调整后的第二预测网络，进而基于参数调整后的第一预测网络和第二预测网络得到训练后的用户行为预测模型。

上述实施例中，通过权重数据对第一预测样本特征和第二预测样本特征进行加权处理，得到加权处理后的第三预测样本特征，根据第一预测样本特征和标签信息确定对应的第一预测损失，以及根据第二预测样本特征、第三预测样本特征和标签信息确定对应的第二预测损失，根据第一预测损失对第一预测网络进行参数调整，以及根据第二预测损失对第二预测网络进行参数调整，从而得到训练后的用户行为预测模型。由于本实施例是基于权重数据为第一预测网络和第二预测网络赋予相应的权重，并根据新用户样本数据对用户行为预测模型中不同的网络进行分开训练，以建模新用户成长成老用户过程中的兴趣变化，从而能够有效增加模型的泛化能力和准确性。

在一示例性实施例中，在步骤S220中，根据第一预测样本特征和标签信息确定对应的第一预测损失，具体包括：对第一预测样本特征进行归一化处理，得到对应的第一预测值，根据第一预测值和对应的标签信息计算第一预测损失。

具体地，归一化处理可以通过softmax函数实现，损失函数则可以采用交叉熵损失函数。由于第一预测样本特征是第一预测网络的顶层全连接层输出的特征表示，因此，通过对该第一预测样本特征进行归一化处理，即可得到对应的第一预测值。具体地，该第一预测值即为第一预测网络预估的用户行为概率，进而可以根据第一预测值和对应的标签信息采用损失函数计算第一预测损失，并根据第一预测损失对第一预测网络进行参数调整，以实现对第一预测网络的训练，从而有效提高第一预测网络预测的准确性。

在一示例性实施例中，如图3所示，在步骤S220中，根据第二预测样本特征、第三预测样本特征和标签信息确定对应的第二预测损失，具体包括：

在步骤S212中，对第二预测样本特征进行归一化处理，得到对应的第二预测值，根据第二预测值和对应的标签信息计算第三预测损失。

同理，通过对第二预测样本特征进行归一化处理，即可得到对应的第二预测值，进而可以根据第二预测值和对应的标签信息采用损失函数计算得到第三预测损失。

在步骤S214中，对第三预测样本特征进行归一化处理，得到对应的第三预测值，根据第三预测值和对应的标签信息计算第四预测损失。

同理，通过对第三预测样本特征进行归一化处理，即可得到对应的第三预测值，进而根据第三预测值和对应的标签信息采用损失函数计算得到第四预测损失。

举例来说，若对于训练样本数据

，第一预测网络的顶层全连接层输出的第一预测样本特征为

，第二预测网络的顶层全连接层输出的第二预测样本特征为

，第三预测样本特征为

,则分别通过softmax函数进行归一化处理，得到对应的第一预测值

、第二预测值

和第三预测值

，则对应的损失可通过如下公式进行计算：

其中，

为训练样本数据

中对应的标签信息，

为第一预测损失，

则为第三预测损失，

为第四预测损失。

在步骤S216中，将第三预测损失与第四预测损失之和确定为第二预测损失。

由于第三预测损失是基于第二预测样本特征和标签信息得到，而第四预测损失是基于第三预测样本特征和标签信息得到。又由于第二预测样本特征是基于第二预测网络得到，且第三预测样本特征是基于第二预测网络输出的权重数据进行加权处理得到，也即第二预测样本特征和第三预测样本特征都与第二预测网络相关。因此，在本实施例中，将第三预测损失与第四预测损失之和确定为第二预测损失。

上述实施例中，通过对第二预测样本特征进行归一化处理，得到对应的第二预测值，根据第二预测值和对应的标签信息计算第三预测损失，并对第三预测样本特征进行归一化处理，得到对应的第三预测值，根据第三预测值和对应的标签信息计算第四预测损失，进而是将第三预测损失与第四预测损失之和确定为第二预测损失。由于用于调整不同网络模型参数的损失是分别计算得到，因此，可以提高模型的泛化能力及准确性。

在一示例性实施例中，上述第二预测网络包括用户行为预测子网络和动态调权子网络，则在步骤S130中，将新用户样本数据输入第二预测网络，得到用户行为的第二预测样本特征以及权重数据，具体包括：将新用户样本数据输入第二预测网络，得到第二预测网络中用户行为预测子网络输出的第二预测样本特征，以及动态调权子网络输出的权重数据。

其中，用户行为预测子网络与上述第一预测网络的结构相同，但参数不同。在本实施例中，通过用户行为预测子网络的嵌入层将新用户样本数据映射到低维向量空间，得到用户行为对应的初始表示，进而将该初始表示输入到多层全连接层中，得到顶层全连接层的输出表示，该输出表示即为新用户样本数据对应的用户行为的第二预测样本特征。

动态调权子网络则是基于新用户样本数据而为第一预测网络的输出和用户行为预测子网络的输出赋予相应权重的初始网络模型。权重数据则是动态调权网络基于新用户样本数据而输出的相应权重，包括上述第一预测网络的输出对应的权重和用户行为预测子网络的输出对应的权重。在本实施例中，通过将新用户样本数据输入第二预测网络，从而得到第二预测网络中用户行为预测子网络输出的第二预测样本特征，以及第二预测网络中动态调权子网络输出的权重数据。由于第二预测样本特征和权重数据是基于不同的子网络得到，因次，有利于进一步提高模型的准确性。

在一示例性实施例中，在步骤S230中，根据第一预测损失对第一预测网络进行参数调整，以及根据第二预测损失对第二预测网络进行参数调整，得到训练后的用户行为预测模型，具体包括：采用第一预测损失对第一预测网络进行参数调整，以及采用第二预测损失对用户行为预测子网络进行参数调整，采用第四预测损失对动态调权子网络进行参数调整，得到训练后的用户行为预测模型。

具体地，由于第一预测损失是基于第一预测网络输出的第一预测样本特征与标签信息确定的，因此，基于第一预测损失对第一预测网络进行参数调整，可以得到收敛后的第一预测网络。同理，采用第二预测损失对用户行为预测子网络进行参数调整，则可以得到收敛后的用户行为预测子网络，采用第四预测损失对动态调权子网络进行参数调整，则可以得到收敛后的动态调权子网络，进而基于参数调整后的第一预测网络、用户行为预测子网络以及动态调权子网络形成训练后的用户行为预测模型。由于本实施例是对不同的子网络基于相应的损失函数分别单独进行训练，因此，有利于提高模型的准确性。

在一示例性实施例中，上述在对模型进行训练时，具体可以是在第一预测损失与第二预测损失收敛（即第一预测损失与第二预测损失最小时）时，采用第一预测损失对第一预测网络进行参数调整，以及采用第二预测损失对用户行为预测子网络进行参数调整，采用第四预测损失对动态调权子网络进行参数调整，得到训练后的用户行为预测模型。在本实施例中，通过分别最小化交叉熵损失对模型进行训练，从而有利于提高模型的准确性和稳定性。

在一示例性实施例中，当新用户样本数据有多条时，则还可以根据每一条新用户样本数据分别对应的第一预测损失和第二预测损失，而获取该多条新用户样本数据对应的第一累计预测损失和第二累计预测损失，并采用第一累计预测损失对第一预测网络进行参数调整，以及采用第二累计预测损失对第二预测网络进行参数调整，从而得到训练后的用户行为预测模型。具体地，可以根据多条新用户样本数据中每一条新用户样本数据分别对应的第一预测损失，而计算该多条训练样本数据对应的第一累计预测损失，并基于第一累计预测损失对第一预测网络进行参数调整，从而得到参数调整后的第一预测网络。同理，可以根据每一条新用户样本数据分别对应的第二预测损失，而计算该多条训练样本数据对应的第二累计预测损失，并基于第二累计预测损失对第二预测网络进行参数调整，从而得到参数调整后的第二预测网络。进而基于参数调整后的第一预测网络和第二预测网络得到训练后的用户行为预测模型。在本实施例中，通过多条训练数据的累计损失分别调整网络模型的参数，从而能够减少模型训练过程中的计算量，以提高模型训练的速度。

在一示例性实施例中，以下通过一个具体的实施例进一步说明上述用户行为预测模型的生成方法，如图4所示，具体可以包括以下步骤：

1），获取用户历史交互数据。

2），基于用户历史交互数据构建训练数据集并分批。

具体地，举例来说，以用户

和资源为视频的

发生的交互

作为一个训练样本构建训练数据集，并对训练数据集按交互时间进行分批。其中，

表示用户的属性数据，包括人口统计特征和设备特征，例如用户的年龄、性别、省份、城市，设备的型号、网络类型等，形式化表示为

，

表示用户

的第

个静态属性，

表示用户静态属性的个数；

表示用户的动态行为序列，包括用户历史的资源展现序列、点击序列、点赞序列、关注序列和转发序列，形式化表示为

，以用户的点击序列

为例，

，

，表示用户

按时间排序的点击序列，

表示用户

第

个点击的视频，

表示用户行为序列的长度。同理，对于动态行为数据中的其他类信息的表示方式均与上述历史点击信息的表示方式相类似。在本实施例中，以标签信息为用户的点击操作行为为例来说，标签信息

，表示用户

是否点击样本视频

。

3），选取一批训练样本。

具体地，从训练数据集中按顺序选取一批训练样本。对该批次中的每一个训练样本，执行下述步骤4）-步骤10）。

4），对于样本

，若是新用户样本，则将该新用户样本输入第一预测网络，得到对应网络输出的第一预测样本特征

。

5），同时，将该新用户样本输入用户行为预测子网络，从而得到对应网络输出的第二预测样本特征

。需要说明的是，若上述样本是老用户样本，则只将该老用户样本输入第一预测网络即可。

6），根据该新用户样本的动态行为序列

，采用动态调权子网络获取对应的权重数据

。

举例来说，若基于样本账户

的行为序列

统计得到样本账户的历史资源展现次数为

、历史点击次数为

、历史关注次数为

、历史点赞次数为

、历史转发次数为

，则将其输入到动态调权子网络，得到动态调权子网络输出的权重数据

。具体地，动态调权子网络可以包括多层全连接层和激活层。在本实施例中，基于样本账户的动态行为数据采用上述步骤提取对应的统计型特征，并将提取的特征（即历史资源展现次数、历史点击次数、历史关注次数、历史点赞次数、历史转发次数中的至少一种）输入多层全连接层，通过激活层对多层全连接层的输出进行激活，从而得到网络输出的权重数据。

该动态调权子网络内部的计算过程如下所示：

+

其中，

表示该动态调权子网络的参数矩阵，

为动态调权子网络的偏置，

表示向量连接操作。

和

分别表示第一预测网络和用户行为预测子网络对训练样本数据进行预测的预测样本特征的权重，具体地，其中，

为第一预测网络输出的第一预测样本特征的权重，

则为用户行为预测子网络输出的第二预测样本特征的权重。由于统计特征会随着用户的成长过程而不断变化，因此权重数据也是随之不断变化的，从而模型能够学习到用户兴趣的变化，以提高模型的泛化能力。

7），通过二维权重对第一预测样本特征和第二预测样本特征进行加权处理，得到加权处理后的第三预测样本特征。

具体地，根据第一预测网络的输出表示

和用户行为预测子网络的输出表示

，利用

为两者赋予相应的权重，得到加权后的表示

。

其中，

8），根据上述得到的

和

，以及两者的加权表示

，分别通过softmax函数得到预测的第一预测值

、第二预测值

和第三预测值

。

9），基于预测的第一预测值

、第二预测值

和第三预测值

计算与

之间的交叉熵损失。

其中，

表示第一预测网络的第一损失，

为第三损失，

表示用户行为预测子网络的第二损失，

表示动态调权子网络的第四损失。

10），分别累计批次中所有样本在各个网络的累计损失，各个网络进行参数调整。

具体地，分别最小化交叉熵损失

和

，根据批次中的累计

调整第一预测网络的参数，根据批次中的累计

调整用户行为预测子网络的参数，根据批次中的累计

调整动态调权子网络的参数。

11），重复步骤4）-步骤10），直到训练数据集中的所有批次都参与了模型训练，或者达到了指定的迭代次数，则结束训练，得到训练后的用户行为预测模型，否则返回上述选取一批训练样本的步骤。

在一示例性实施例中，本公开还提供了一种用户行为预测方法，可以应用于如图5所示的应用环境中。其中，终端510通过网络与服务器520进行交互。具体地，终端510可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器520可以用独立的服务器或者是多个服务器组成的服务器集群来实现。其中，终端510上安装有社交应用程序的客户端，服务器520上被部署对应客户端的服务平台，本实施例提供的点击率预测方法既可以应用于终端510，也可以应用于服务器520，并通过与终端510的交互，从而确定出目标账户对当前待推荐的目标资源的操作行为概率。

图6是根据一示例性实施例示出的一种用户行为预测方法，以该方法应用于图5中的服务器为例，则该方法具体可以包括如下步骤：

在步骤S610中，获取账户数据。

其中，账户数据包括用户账户当前的属性数据和行为数据。具体地，账户是指社交应用程序中的用户账户。在本实施例中，当需要向用户账户进行资源推荐时，通常为了提高推荐的准确性，可以向具有操作意向（如具有较高点击率、点赞率、转发率以及关注率）的用户进行资源推荐。因此，在向用户账户进行资源推荐前可以预估对应的操作行为概率。当前是指待要向用户账户进行资源推荐的时刻。

因此，在本实施例中，当要预估用户的操作行为概率时，首先需要获取用户账户当前的属性数据和行为数据。用户账户当前的属性数据和行为数据则是指截止到当前时刻的属性数据和行为数据。具体地，属性数据则包括但不限于账户的账户标识、用户年龄、用户性别、所在省份、城市以及常用设备型号、网络类型等。行为数据则包括但不限于对应的历史资源展现信息、历史点击信息、历史关注信息、历史点赞信息、历史转发信息等。

在步骤S620中，当账户数据为新用户的账户数据时，将该新用户的账户数据输入用户行为预测模型，得到预估的新用户对当前待推荐的目标资源的操作行为概率。

其中，用户行为预测模型是根据上述如图1至图5所述的方法得到。目标资源是指待要向用户账户推荐的资源，包括但不限于视频、图片以及文本等。在本实施例中，基于账户数据可以确定对应的用户是新用户还是老用户。又由于对于新用户来说，其能够获取到的账户数据的数据宽度（如行为数据的种类数）和深度（如数据量）均弱于老用户，基于此，本实施例针对新用户提出了一种较为准确的用户行为预测方法。

具体地，当确定账户数据为新用户的账户数据时，则将该新用户的账户数据输入用户行为预测模型，从而得到模型预估的新用户对当前待推荐的目标资源的操作行为概率，进而可以基于预估的操作行为概率进行资源推荐。

上述实施例中，通过获取账户数据，并在确定账户数据为新用户的账户数据时，将该新用户的账户数据输入用户行为预测模型，得到预估的新用户对当前待推荐的目标资源的操作行为概率，由于本公开的用户行为预测模型在训练过程中能够学习到用户成长过程中的兴趣变化，因此，模型输出的操作行为概率的准确性较高，特别是对于新用户的行为预测，能够进一步提高新用户的留存率。

在一示例性实施例中，用户行为预测模型包括训练后的第一预测网络和第二预测网络，则如图7所示，在步骤S620中，将该新用户的账户数据输入用户行为预测模型，得到预估的新用户对当前待推荐的目标资源的操作行为概率，具体包括：

在步骤S710中，将新用户的账户数据输入第一预测网络，得到对应的第一预测特征。

其中，第一预测网络是基于图1至图5所述的方法中进行参数调整后得到的，第一预测特征则是第一预测网络输出的用户行为的预测特征。具体地，在本实施例中，将新用户当前的账户数据输入第一预测网络，从而得到对应的第一预测特征。

在步骤S720中，将新用户的账户数据输入第二预测网络，得到对应的第二预测特征和权重数据。

其中，第二预测网络是基于图1至图5所述的方法中进行参数调整后得到的，第二预测特征则是第二预测网络输出的用户行为的预测特征。权重数据包括用于表征账户数据对应的第一预测特征和第二预测特征分别对应的权重，该权重数据能够体现用户的兴趣特征。具体地，在本实施例中，将新用户当前的账户数据输入第二预测网络，从而得到对应的第二预测特征和权重数据。

在步骤S730中，基于权重数据对第一预测特征和第二预测特征进行加权处理，得到加权处理后的第三预测特征。

具体地，根据第一预测特征对应的权重对第一预测特征进行加权处理，得到加权处理后的第一预测特征，根据第二预测特征对应的权重对第二预测特征进行加权处理，得到加权处理后的第二预测特征，进而计算加权处理后的第一预测特征和加权处理后的第二预测特征之和，从而得到加权处理后的第三预测特征，即得到能够反应用户当前整体情况的整体预测特征。

在步骤S740中，对第三预测特征进行归一化处理，得到新用户对当前待推荐的目标资源的操作行为概率。

由于第三预测特征是基于权重数据对第一预测特征和第二预测特征进行加权处理后得到的整体预测特征，因此，通过对第三预测特征进行归一化处理后得到的操作行为概率，其能够体现用户当前的兴趣特征，且准确性也更高。

应该理解的是，虽然图1-图7的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-图7中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

可以理解的是，本说明书中上述方法的各个实施例之间相同/相似的部分可互相参见，每个实施例重点说明的是与其他实施例的不同之处，相关之处参见其他方法实施例的说明即可。

图8是根据一示例性实施例示出的一种用户行为预测模型的生成装置框图。参照图8，该装置包括训练样本数据获取模块802，第一预测模块804，第二预测模块806和参数调整模块808。

训练样本数据获取模块802，被配置为执行获取训练样本数据，所述训练样本数据包括样本账户的属性数据和行为数据；

第一预测模块804，被配置为执行当所述训练样本数据为新用户样本数据时，将所述新用户样本数据输入第一预测网络，得到用户行为的第一预测样本特征，所述第一预测网络的初始网络是通过老用户样本数据训练后得到的；

第二预测模块806，被配置为执行将所述新用户样本数据输入第二预测网络，得到用户行为的第二预测样本特征以及权重数据，所述权重数据包括用于表征所述用户行为的第一预测样本特征和第二预测样本特征分别对应的权重；

参数调整模块808，被配置为执行根据所述第一预测样本特征、第二预测样本特征和权重数据，对所述第一预测网络和第二预测网络进行参数调整，得到训练后的用户行为预测模型。

在一个实施例中，所述参数调整模块还被配置为执行：当所述训练样本数据为老用户样本数据时，通过所述老用户样本数据对所述第一预测网络进行参数调整。

在一个实施例中，所述训练样本数据中还包括标签信息；所述参数调整模块包括：加权处理单元，被配置为执行通过所述权重数据对所述第一预测样本特征和所述第二预测样本特征进行加权处理，得到加权处理后的第三预测样本特征；损失确定单元，被配置为执行根据所述第一预测样本特征和标签信息确定对应的第一预测损失，以及根据所述第二预测样本特征、第三预测样本特征和标签信息确定对应的第二预测损失；参数调整单元，被配置为执行根据所述第一预测损失对所述第一预测网络进行参数调整，以及根据所述第二预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型。

在一个实施例中，所述损失确定单元被配置为执行：对所述第一预测样本特征进行归一化处理，得到对应的第一预测值，根据所述第一预测值和对应的标签信息计算第一预测损失。

在一个实施例中，所述损失确定单元还被配置为执行：对所述第二预测样本特征进行归一化处理，得到对应的第二预测值，根据所述第二预测值和标签信息计算第三预测损失；对所述第三预测样本特征进行归一化处理，得到对应的第三预测值，根据所述第三预测值和标签信息计算第四预测损失；将所述第三预测损失与第四预测损失之和确定为第二预测损失。

在一个实施例中，所述第二预测网络包括用户行为预测子网络和动态调权子网络；所述第二预测模块还被配置为执行：将所述新用户样本数据输入第二预测网络，得到所述第二预测网络中用户行为预测子网络输出的第二预测样本特征，以及所述动态调权子网络输出的权重数据。

在一个实施例中，所述参数调整单元还被配置为执行：采用所述第一预测损失对所述第一预测网络进行参数调整，以及采用所述第二预测损失对所述用户行为预测子网络进行参数调整，采用所述第四预测损失对所述动态调权子网络进行参数调整，得到训练后的用户行为预测模型。

在一个实施例中，所述参数调整单元还被配置为执行：根据每一条所述新用户样本数据分别对应的第一预测损失和第二预测损失，获取多条所述新用户样本数据对应的第一累计预测损失和第二累计预测损失；采用所述第一累计预测损失对所述第一预测网络进行参数调整，以及采用所述第二累计预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型。

图9是根据一示例性实施例示出的一种用户行为预测装置框图。参照图9，该装置包账户数据获取模块902和预测模块904。

账户数据获取模块902，被配置为执行获取账户数据，所述账户数据包括当前的属性数据和行为数据；

预测模块904，被配置为执行当所述账户数据为新用户的账户数据时，将所述新用户的账户数据输入用户行为预测模型，得到预估的所述新用户对当前待推荐的目标资源的操作行为概率，所述用户行为预测模型根据如上第一方面所述的方法得到。

在一个实施例中，所述用户行为预测模型包括训练后的第一预测网络和第二预测网络；所述预测模块被配置为执行：将所述新用户的账户数据输入第一预测网络，得到对应的第一预测特征；将所述新用户的账户数据输入第二预测网络，得到对应的第二预测特征和权重数据，所述权重数据包括所述第一预测特征和第二预测特征分别对应的权重；基于所述权重数据对所述第一预测特征和所述第二预测特征进行加权处理，得到加权处理后的第三预测特征；对所述第三预测特征进行归一化处理，得到所述新用户对当前待推荐的目标资源的操作行为概率。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图10是根据一示例性实施例示出的一种用于用户行为预测模型的生成方法或用户行为预测方法的电子设备S00的框图。例如，电子设备S00可以为服务器。参照图10，电子设备S00包括处理组件S20，其进一步包括一个或多个处理器，以及由存储器S22所代表的存储器资源，用于存储可由处理组件S20的执行的指令，例如应用程序。存储器S22中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件S20被配置为执行指令，以执行上述方法。

电子设备S00还可以包括：电源组件S24被配置为执行电子设备S00的电源管理，有线或无线网络接口S26被配置为将电子设备S00连接到网络，和输入输出（I/O）接口S28。电子设备S00可以操作基于存储在存储器S22的操作系统，例如Windows Server，Mac OS X，Unix，Linux，FreeBSD或类似。

在示例性实施例中，还提供了一种包括指令的计算机可读存储介质，例如包括指令的存储器S22，上述指令可由电子设备S00的处理器执行以完成上述方法。存储介质可以是计算机可读存储介质，例如，所述计算机可读存储介质可以是ROM、随机存取存储器（RAM）、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供一种计算机程序产品，所述计算机程序产品中包括指令，上述指令可由电子设备S00的处理器执行以完成上述方法。

需要说明的，上述的装置、电子设备、计算机可读存储介质、计算机程序产品等根据方法实施例的描述还可以包括其他的实施方式，具体的实现方式可以参照相关方法实施例的描述，在此不作一一赘述。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

Claims

1.一种用户行为预测模型的生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

当所述训练样本数据为老用户样本数据时，通过所述老用户样本数据对所述第一预测网络进行参数调整。

3.根据权利要求1所述的方法，其特征在于，所述训练样本数据中还包括标签信息；所述根据所述第一预测样本特征、第二预测样本特征和权重数据，对所述第一预测网络和第二预测网络进行参数调整，得到训练后的用户行为预测模型，包括：

通过所述权重数据对所述第一预测样本特征和所述第二预测样本特征进行加权处理，得到加权处理后的第三预测样本特征；

根据所述第一预测样本特征和标签信息确定对应的第一预测损失，以及根据所述第二预测样本特征、第三预测样本特征和标签信息确定对应的第二预测损失；

根据所述第一预测损失对所述第一预测网络进行参数调整，以及根据所述第二预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型。

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一预测样本特征和标签信息确定对应的第一预测损失，包括：

对所述第一预测样本特征进行归一化处理，得到对应的第一预测值，根据所述第一预测值和对应的标签信息计算第一预测损失。

5.根据权利要求3所述的方法，其特征在于，所述根据所述第二预测样本特征、第三预测样本特征和标签信息确定对应的第二预测损失，包括：

对所述第二预测样本特征进行归一化处理，得到对应的第二预测值，根据所述第二预测值和标签信息计算第三预测损失；

对所述第三预测样本特征进行归一化处理，得到对应的第三预测值，根据所述第三预测值和标签信息计算第四预测损失；

将所述第三预测损失与第四预测损失之和确定为第二预测损失。

6.根据权利要求5所述的方法，其特征在于，所述第二预测网络包括用户行为预测子网络和动态调权子网络；所述将所述新用户样本数据输入第二预测网络，得到用户行为的第二预测样本特征以及权重数据，包括：

将所述新用户样本数据输入第二预测网络，得到所述第二预测网络中用户行为预测子网络输出的第二预测样本特征，以及所述动态调权子网络输出的权重数据。

7.根据权利要求6所述的方法，其特征在于，所述根据所述第一预测损失对所述第一预测网络进行参数调整，以及根据所述第二预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型，包括：

采用所述第一预测损失对所述第一预测网络进行参数调整，以及采用所述第二预测损失对所述用户行为预测子网络进行参数调整，采用所述第四预测损失对所述动态调权子网络进行参数调整，得到训练后的用户行为预测模型。

8.根据权利要求3至7任一项所述的方法，其特征在于，所述新用户样本数据有多条；所述根据所述第一预测损失对所述第一预测网络进行参数调整，以及根据所述第二预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型，包括：

根据每一条所述新用户样本数据分别对应的第一预测损失和第二预测损失，获取多条所述新用户样本数据对应的第一累计预测损失和第二累计预测损失；

采用所述第一累计预测损失对所述第一预测网络进行参数调整，以及采用所述第二累计预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型。

9.一种用户行为预测方法，其特征在于，所述方法包括：

10.根据权利要求9所述的方法，其特征在于，所述用户行为预测模型包括训练后的第一预测网络和第二预测网络；所述将所述新用户的账户数据输入用户行为预测模型，得到预估的所述新用户对当前等推荐的目标资源的操作行为概率，包括：

将所述新用户的账户数据输入第一预测网络，得到对应的第一预测特征；

将所述新用户的账户数据输入第二预测网络，得到对应的第二预测特征和权重数据，所述权重数据包括用于表征所述账户数据对应的第一预测特征和第二预测特征分别对应的权重；

基于所述权重数据对所述第一预测特征和所述第二预测特征进行加权处理，得到加权处理后的第三预测特征；

对所述第三预测特征进行归一化处理，得到所述新用户对当前待推荐的目标资源的操作行为概率。

11.一种用户行为预测模型的生成装置，其特征在于，所述装置包括：

12.根据权利要求11所述的装置，其特征在于，所述参数调整模块还被配置为执行：

13.根据权利要求11所述的装置，其特征在于，所述训练样本数据中还包括标签信息；所述参数调整模块包括：

加权处理单元，被配置为执行通过所述权重数据对所述第一预测样本特征和所述第二预测样本特征进行加权处理，得到加权处理后的第三预测样本特征；

损失确定单元，被配置为执行根据所述第一预测样本特征和标签信息确定对应的第一预测损失，以及根据所述第二预测样本特征、第三预测样本特征和标签信息确定对应的第二预测损失；

参数调整单元，被配置为执行根据所述第一预测损失对所述第一预测网络进行参数调整，以及根据所述第二预测损失对所述第二预测网络进行参数调整，得到训练后的用户行为预测模型。

14.根据权利要求13所述的装置，其特征在于，所述损失确定单元被配置为执行：

15.根据权利要求13所述的装置，其特征在于，所述损失确定单元还被配置为执行：

16.根据权利要求15所述的装置，其特征在于，所述第二预测网络包括用户行为预测子网络和动态调权子网络；所述第二预测模块还被配置为执行：

17.根据权利要求16所述的装置，其特征在于，所述参数调整单元还被配置为执行：

18.根据权利要求13至17任一项所述的装置，其特征在于，所述参数调整单元还被配置为执行：

19.一种用户行为预测装置，其特征在于，所述装置包括：

预测模块，被配置为执行当所述账户数据为新用户的账户数据时，将所述新用户的账户数据输入用户行为预测模型，得到预估的所述新用户对当前待推荐的目标资源的操作行为概率，所述用户行为预测模型根据权利要求1至8任一项所述的方法得到。

20.根据权利要求19所述的装置，其特征在于，所述用户行为预测模型包括训练后的第一预测网络和第二预测网络；所述预测模块被配置为执行：

将所述新用户的账户数据输入第二预测网络，得到对应的第二预测特征和权重数据，所述权重数据包括所述第一预测特征和第二预测特征分别对应的权重；

21.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至8中任一项所述的用户行为预测模型的生成方法以及如权利要求9或10所述的用户行为预测方法。

22.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至8中任一项所述的用户行为预测模型的生成方法以及如权利要求9或10所述的用户行为预测方法。