CN114154050A

CN114154050A - 推荐方法、特征生成网络的训练方法、装置、电子设备

Info

Publication number: CN114154050A
Application number: CN202010930231.8A
Authority: CN
Inventors: 楼思源; 舒程珣; 温明星; 黄柏翔; 宋洋
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-09-07
Filing date: 2020-09-07
Publication date: 2022-03-08

Abstract

本公开关于一种推荐方法、装置、电子设备及存储介质，以及一种特征生成网络的训练方法、装置、电子设备及存储介质。所述推荐方法包括：获取目标账户的账户关联数据，账户关联数据包括目标账户的属性特征和行为数据；采用目标账户的账户关联数据对预训练的特征生成网络的初始化参数进行调整，生成与目标账户对应的目标特征生成网络；将目标账户的属性特征输入至目标特征生成网络，得到目标特征向量；根据目标特征向量向目标账号推荐对象。根据本公开的技术方案，对于目标账户，只需少量的样本就可以对预训练的特征生成网络进行快速调整，得到较为准确的目标特征向量，从而可以提高推荐的效率和准确性。

Description

推荐方法、特征生成网络的训练方法、装置、电子设备

技术领域

本公开涉及互联网技术领域，尤其涉及一种推荐方法、装置、电子设备及存储介质，以及一种特征生成网络的训练方法、装置、电子设备及存储介质。

背景技术

随着信息技术和互联网技术的发展，人们从信息匮乏时代步入了信息过载时代。在这种时代背景下，人们越来越难从大量的信息中找到自身感兴趣的信息。推荐系统的产生解决了这一难题。推荐系统在为用户推荐对象时，可以计算用户侧的特征向量和候选对象的特征向量的相似度，并将相似度较高的候选对象进行推荐。

相关技术中，用户侧的特征向量可以通过随机初始化表征、对现有的老账号或者对象的特征向量做变换等方式得到。但是，上述生成用户侧的特征向量的方法往往会需要大量的用户行为数据训练推荐模型。对于新用户冷启动过程而言，由于系统积累数据量过少、已产生的用户行为数据极度稀疏，因而系统并不能对新用户特征向量进行有效地学习和更新，从而影响针对新用户的推荐的准确性。

发明内容

本公开提供一种推荐方法、装置、电子设备及存储介质，以及一种特征生成网络的训练方法、装置、电子设备及存储介质，以至少解决相关技术中系统并不能对新用户特征向量进行有效地学习和更新，从而影响针对新用户的推荐的准确性的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种推荐方法，包括：

获取目标账户的账户关联数据，账户关联数据包括目标账户的属性特征和行为数据；采用目标账户的账户关联数据对预训练的特征生成网络的初始化参数进行调整，生成与目标账户对应的目标特征生成网络，预训练的特征生成网络是预先根据已获取的多个新账户的账户关联数据训练得到的；将目标账户的属性特征输入至目标特征生成网络，得到目标特征向量；根据目标特征向量向目标账号推荐对象。

在其中一个实施例中，预训练的特征生成网络的生成方式，包括：获取预设时间内产生的多个新账户的账户关联数据，每个新账户的账户关联数据包括每个新账户的属性特征和行为数据；生成与每个新账户对应的训练集，训练集包含多个训练样本，每个训练样本根据每个新账户的行为数据对每个新账户的账户关联数据进行标记得到；根据每个新账户对应的训练集中的训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络。

在其中一个实施例中，根据每个新账户对应的训练集中的训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络，包括：从每个新账户对应的训练集中获取每个新账户对应的第一训练集和第二训练集；采用每个新账户的第一训练集对特征生成网络进行训练，根据所得到的第一损失函数值对特征生成网络的基础参数进行更新，得到中间特征生成网络；采用每个新账户的第二训练集对中间特征生成网络进行训练，根据所得到的第二损失函数值获取基础参数的梯度，根据基础参数的梯度对基础参数进行更新，直至达到收敛条件，得到预训练的特征生成网络。

在其中一个实施例中，采用目标账户的账户关联数据对预训练的特征生成网络的参数进行调整，生成与目标账户对应的目标特征生成网络，包括：根据目标账户的账户关联数据生成样本集，样本集包含多个样本，每个样本根据目标账户行为数据对目标账户的账户关联数据进行标记得到；从样本集中获取第一样本集，采用第一样本集对预训练的特征生成网络进行训练，根据所得到的第三损失函数值对预训练的特征生成网络的初始化参数进行更新；从样本集中获取第二样本集，采用第二样本集对更新后的预训练的特征生成网络进行训练，根据已得到的第四损失函数值获取初始化参数的梯度，根据初始化参数的梯度对初始化参数进行更新，得到目标特征生成网络。

在其中一个实施例中，特征生成网络包括至少一层全连接层；将目标账户的属性特征输入至目标特征生成网络，得到目标特征向量，包括：将目标账户的属性特征输入至目标特征生成网络，通过目标特征生成网络中的至少一层全连接层对属性特征进行全连接处理，得到目标特征向量。

在其中一个实施例中，根据目标特征向量向目标账号推荐对象，包括：获取候选对象的对象特征向量；获取目标账户的目标特征向量和候选对象的对象特征向量之间的相似度；根据相似度对候选对象进行排序，得到排序后的候选对象；向目标账号推荐排序后的候选对象。

根据本公开实施例的第二方面，提供一种特征生成网络的训练方法，包括：

获取目标账户的账户关联数据，目标账户的账户关联数据包括目标账户的属性特征和行为数据；根据目标账户的账户关联数据生成样本集，样本集包含多个样本，每个样本根据目标账户的行为数据对目标账户的账户关联数据进行标记得到；采用样本集对预训练的特征生成网络进行调整，更新预训练的特征生成网络中的初始化参数，得到目标特征生成网络，预训练的特征生成网络是预先根据已获取的多个新账户的账户关联数据训练得到的。

在其中一个实施例中，预训练的特征生成网络的生成方式，包括：获取预设时间内产生的多个新账户的账户关联数据，每个新账户的账户关联数据包括每个新账户的属性特征和行为数据；生成与每个新账户对应的训练集，训练集包含多个训练样本，每个训练样本根据每个新账户的行为数据对每个新账户的账户关联数据进行标记得到；根据每个新账户对应的训练集的训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络。

在其中一个实施例中，采用样本集对预训练的特征生成网络进行调整，更新预训练的特征生成网络中的初始化参数，得到目标特征生成网络，包括：从样本集中获取第一样本集，采用第一样本集对预训练的特征生成网络进行训练，根据所得到的第三损失函数值对预训练的特征生成网络的初始化参数进行更新；从样本集中获取第二样本集，采用第二样本集对更新后的预训练的特征生成网络进行训练，根据已得到的第四损失函数值获取初始化参数的梯度，根据初始化参数的梯度对初始化参数进行更新，得到目标特征生成网络。

根据本公开实施例的第三方面，提供一种推荐装置，包括：

第一获取模块，被配置为执行获取目标账户的账户关联数据，账户关联数据包括目标账户的属性特征和行为数据；第一训练模块，被配置为执行采用目标账户的账户关联数据对预训练的特征生成网络的初始化参数进行调整，生成与目标账户对应的目标特征生成网络，预训练的特征生成网络是预先根据已获取的多个新账户的账户关联数据训练得到的；特征向量生成模块，被配置为执行将目标账户的属性特征输入至目标特征生成网络，得到目标特征向量；推荐模块，被配置为执行根据目标特征向量向目标账号推荐对象。

在其中一个实施例中，所述装置还包括：第二获取模块，被配置为执行获取预设时间内产生的多个新账户的账户关联数据，每个新账户的账户关联数据包括每个新账户的属性特征和行为数据；训练集生成模块，被配置为执行生成与每个新账户对应的训练集，训练集包含多个训练样本，每个训练样本根据每个新账户的行为数据对每个新账户的账户关联数据进行标记得到；第二训练模块，被配置为执行根据每个新账户对应的训练集中的训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络。

在其中一个实施例中，第二训练模块，包括：第一获取单元，被配置为执行从每个新账户对应的训练集中获取每个新账户对应的第一训练集和第二训练集；第一训练单元，被配置为执行采用每个新账户的第一训练集对特征生成网络进行训练，根据所得到的第一损失函数值对特征生成网络的基础参数进行更新，得到中间特征生成网络；第二训练单元，被配置为执行采用每个新账户的第二训练集对中间特征生成网络进行训练，根据所得到的第二损失函数值获取基础参数的梯度，根据基础参数的梯度对基础参数进行更新，直至达到收敛条件，得到预训练的特征生成网络。

在其中一个实施例中，第一训练模块，包括：样本集生成单元，被配置为执行根据目标账户的账户关联数据生成样本集，样本集包含多个样本，每个样本根据目标账户行为数据对目标账户的账户关联数据进行标记得到；第三训练单元，被配置为执行从样本集中获取第一样本集，采用第一样本集对预训练的特征生成网络进行训练，根据所得到的第三损失函数值对预训练的特征生成网络的初始化参数进行更新；第四训练单元，被配置为执行从样本集中获取第二样本集，采用第二样本集对更新后的预训练的特征生成网络进行训练，根据已得到的第四损失函数值获取初始化参数的梯度，根据初始化参数的梯度对初始化参数进行更新，得到目标特征生成网络。

在其中一个实施例中，特征生成网络包括至少一层全连接层；特征向量生成模块，被配置为执行将目标账户的属性特征输入至目标特征生成网络，通过目标特征生成网络中的至少一层全连接层对属性特征进行全连接处理，得到目标特征向量。

在其中一个实施例中，推荐模块，包括：第二获取单元，被配置为执行获取候选对象的对象特征向量；相似度确定单元，被配置为执行获取目标账户的目标特征向量和候选对象的对象特征向量之间的相似度；排序单元，被配置为执行根据相似度对候选对象进行排序，得到排序后的候选对象；推荐单元，被配置为执行向目标账号推荐排序后的候选对象。

根据本公开实施例的第四方面，提供一种特征生成网络的训练装置，包括：

第一获取模块，被配置为执行获取目标账户的账户关联数据，目标账户的账户关联数据包括目标账户的属性特征和行为数据；样本集生成模块，被配置为执行根据目标账户的账户关联数据生成样本集，样本集包含多个样本，每个样本根据目标账户的行为数据对目标账户的账户关联数据进行标记得到；第一训练模块，被配置为执行采用样本集对预训练的特征生成网络进行调整，更新预训练的特征生成网络中的初始化参数，得到目标特征生成网络，预训练的特征生成网络是预先根据已获取的多个新账户的账户关联数据训练得到的。

在其中一个实施例中，所述装置还包括：第二获取模块，被配置为执行获取预设时间内产生的多个新账户的账户关联数据，每个新账户的账户关联数据包括每个新账户的属性特征和行为数据；训练集生成模块，被配置为执行生成与每个新账户对应的训练集，训练集包含多个训练样本，每个训练样本根据每个新账户的行为数据对每个新账户的账户关联数据进行标记得到；第二训练模块，被配置为执行根据每个新账户对应的训练集的训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络。

在其中一个实施例中，第二训练模块，包括：获取单元，被配置为执行从每个新账户对应的训练集中获取每个新账户对应的第一训练集和第二训练集；第一训练单元，被配置为执行采用每个新账户的第一训练集对特征生成网络进行训练，根据所得到的第一损失函数值对特征生成网络的基础参数进行更新，得到中间特征生成网络；第二训练单元，被配置为执行采用每个新账户的第二训练集对中间特征生成网络进行训练，根据所得到的第二损失函数值获取基础参数的梯度，根据基础参数的梯度对基础参数进行更新，直至达到收敛条件，得到预训练的特征生成网络。

在其中一个实施例中，第一训练模块，包括：第三训练单元，被配置为执行从样本集中获取第一样本集，采用第一样本集对预训练的特征生成网络进行训练，根据所得到的第三损失函数值对预训练的特征生成网络的初始化参数进行更新；第四训练单元，被配置为执行从样本集中获取第二样本集，采用第二样本集对更新后的预训练的特征生成网络进行训练，根据已得到的第四损失函数值获取初始化参数的梯度，根据初始化参数的梯度对初始化参数进行更新，得到目标特征生成网络。

根据本公开实施例的第五方面，提供一种电子设备，包括：

处理器；用于存储处理器可执行指令的存储器；

其中，处理器被配置为执行指令，以实现第一方面的任一项实施例中所述的推荐方法。

根据本公开实施例的第六方面，提供一种电子设备，包括：

处理器；用于存储处理器可执行指令的存储器；

其中，处理器被配置为执行指令，以实现第二方面的任一项实施例中所述的特征生成网络的训练方法。

根据本公开实施例的第七方面，提供一种存储介质，当存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如第一方面的任一项实施例中所述的推荐方法。

根据本公开实施例的第八方面，提供一种存储介质，当存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行第二方面的任一项实施例中所述的特征生成网络的训练方法。

根据本公开实施例的第九方面，提供一种计算机程序产品，所述程序产品包括计算机程序，所述计算机程序存储在可读存储介质中，设备的至少一个处理器从所述可读存储介质读取并执行所述计算机程序，使得设备执行第一方面的任一项实施例中所述的推荐方法。

根据本公开实施例的第十方面，提供一种计算机程序产品，所述程序产品包括计算机程序，所述计算机程序存储在可读存储介质中，设备的至少一个处理器从所述可读存储介质读取并执行所述计算机程序，使得设备执行第二方面的任一项实施例中所述的特征生成网络的训练方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

通过预先部署根据多个新账户的账户关联数据训练得到的预训练的特征生成网络，在需要向目标账户推荐对象时，根据所得到的目标账户的账户关联数据对预训练的特征生成网络进行调整，得到与目标账户对应的目标特征生成网络。采用与目标特征生成网络对目标账户的账户关联数据进行处理，得到目标目标特征向量。进而根据目标特征向量向目标账户进行推荐对象。根据本公开的技术方案，由于预训练的特征生成网络已学习一定量类别的新账户的账户相关数据，对于需要推荐对象的目标账户，只需少量的样本数据便可对预训练的特征生成网络进行快速调整，得到适用于目标账户的目标特征生成网络，进而采用该目标特征生成网络对属性特征进行处理，得到较为准确的目标账户的目标特征向量，从而可以提高推荐的效率和准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种推荐方法的应用环境图。

图2是根据一示例性实施例示出的一种推荐方法的流程图。

图3是根据一示例性实施例示出的一种生成预训练的特征生成网络步骤的流程图。

图4是根据一示例性实施例示出的一种生成预训练的特征生成网络步骤的流程图。

图5是根据一示例性实施例示出的一种对特征生成网络进行训练的示意图。

图6是根据一示例性实施例示出的一种生成目标特征生成网络步骤的流程图。

图7是根据一示例性实施例示出的一种向目标账户推荐对象步骤的流程图。

图8是根据一示例性实施例示出的一种推荐方法的流程图。

图9是根据一示例性实施例示出的一种特征生成网络的训练方法的流程图。

图10是根据一示例性实施例示出的一种特征生成网络的训练方法的流程图。

图11是根据一示例性实施例示出的一种推荐装置的框图。

图12是根据一示例性实施例示出的一种特征生成网络的训练装置的框图。

图13是根据一示例性实施例示出的一种电子设备的内部结构图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开所提供的推荐方法，可以应用于如图1所示的应用环境中。其中，终端110通过网络与服务器120进行交互。终端110部署有与目标账户对应的客户端。终端110接收到推荐请求，其中，推荐请求可以是用户通过终端110触发的，也可以是终端110自行触发。服务器120响应于推荐请求，获取目标账户的账户关联数据，账户关联数据包括目标账户的属性特征和行为数据。服务器120采用目标账户的账户关联数据对预训练的特征生成网络的初始化参数进行调整，生成与目标账户对应的目标特征生成网络。其中，预训练的特征生成网络可以是服务器120预先根据已获取的多个新账户的账户关联数据训练得到的。服务器120将目标账户的属性特征输入至目标特征生成网络，得到目标特征向量。进而根据目标特征向量向目标账号推荐对象。其中，终端110可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

图2是根据一示例性实施例示出的一种推荐方法的流程图，如图2所示，推荐方法用于服务器120中，包括以下步骤。

在步骤S210中，获取目标账户的账户关联数据，账户关联数据包括目标账户的属性特征和行为数据。

其中，目标账户是指待进行推荐对象的账户。账户关联数据是指与目标账户相关的数据，不限于包括目标账户的属性特征和行为数据。属性特征是指描述目标账户相关特性的特征，例如，目标账户的年龄、性别、地理位置等。行为数据是关于机体的行为和行为发生时环境的观察报告，例如，目标账户的浏览日志、对对象的评分等。对象可以是短视频、商品、新闻、文章、音乐等资源。具体地，在客户端检测到对目标账户的推荐请求时，向服务器发送推荐请求，以使服务器响应于该推荐请求，获取目标账户的账户关联数据。其中，对目标账户的推荐请求可以是用户依需求主动触发的，也可以是客户端自行触发的。

在步骤S220中，采用目标账户的账户关联数据对预训练的特征生成网络的初始化参数进行调整，生成与目标账户对应的目标特征生成网络，预训练的特征生成网络是预先根据已获取的多个新账户的账户关联数据训练得到的。

在步骤S230中，将目标账户的属性特征输入至目标特征生成网络，得到目标特征向量。

其中，特征生成网络可以是任一种能够用于生成特征向量(Embedding)的深度学习网络，例如，Word2vec(word to vector，一种用来产生词向量的相关模型)，或者依实际情况设计的深度学习网络。新账户是指首次注册或者已注册预设时间段的账户。多个新账户的账户关联数据可以从已获取的日志中得到。

具体地，预训练的特征生成网络可以是服务器通过在线或者离线的方式，使用多个新账户的账户关联数据进行训练得到。新账户的账户关联数据不限于包括新账户的属性特征和行为数据。在服务器响应于对目标账户的推荐请求，获取目标账户的账户关联数据后，采用目标账户的账户关联数据对预训练的特征生成网络进行调整，得到适用于目标账户的目标特征生成网络。采用该适用于目标账户的目标特征生成网络对目标账户的属性特征进行处理，得到目标特征向量。

在步骤S240中，根据目标特征向量向目标账号推荐对象。

具体地，在获取与目标账户对应的目标特征向量后，通过预先部署的推荐模型根据目标特征的目标特征向量向目标账号推荐对象。其中，推荐模型不限于采用双塔模型。

上述推荐方法中，由于预训练的特征生成网络已学习一定量类别的新账户的账户相关数据，对于需要推荐对象的目标账户，只需少量的样本便可对预训练的特征生成网络进行快速调整，得到适用于目标账户的目标特征生成网络，进而采用该目标特征生成网络对目标账户的属性特征进行处理，得到较为准确的目标账户的目标特征向量，从而可以提高推荐的效率和准确性。

在一示例性实施例中，对预训练的特征生成网络的一种生成方式进行说明。如图3所示，具体可以通过以下步骤实现：

在步骤S310中，获取预设时间内产生的多个新账户的账户关联数据，每个新账户的账户关联数据包括每个新账户的属性特征和行为数据。

在本实施例中，预训练的特征生成网络可以是服务器在离线情况周期性生成的。周期依具体情况而定，可以是12小时、一天等任意时间。具体地，对于新账户，预先配置新账户对应的标签。在触发特征生成网络的预训练指令后，服务器获取已产生的周期内的日志。根据新账户对应的标签从日志中查询得到新账户以及新账户的账户关联数据。

在步骤S320中，生成与每个新账户对应的训练集，训练集包含多个训练样本，每个训练样本根据每个新账户的行为数据对每个新账户的账户关联数据进行标记得到。

在步骤S330中，根据每个新账户对应的训练集中的训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络。

具体地，每个新账户的行为数据中可以包括多个类别，例如，点击视频/未点击视频。服务器可以根据每个新账户的行为数据，对已获取的每个新账户的账户关联数据标记，得到多个训练样本。采用每个新账户对应的多个训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络。收敛条件可以预先配置，例如，损失函数值达到最小。

本实施例中，通过周期性地对特征生成网络进行训练和更新，使预训练的特征生成网络能够持续学习新的知识，从而可以使预训练的特征生成网络的初始化参数保持在较佳的位置。

在一示例性实施例中，如图4所示，在步骤S330中，根据每个新账户对应的训练集中的训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络，具体可以通过以下步骤实现：

在步骤S331中，从每个新账户对应的训练集中获取每个新账户对应的第一训练集和第二训练集。

在步骤S332中，采用每个新账户的第一训练集对特征生成网络进行训练，根据所得到的第一损失函数值对特征生成网络的基础参数进行更新，得到中间特征生成网络。

在步骤S333中，采用每个新账户的第二训练集对中间特征生成网络进行训练，根据所得到的第二损失函数值获取基础参数的梯度，根据基础参数的梯度对基础参数进行更新，直至达到收敛条件，得到预训练的特征生成网络。

其中，基础参数是指未经任何训练的特征生成网络的参数。具体地，若目标账户为新账户，在目标账户的冷启动过程中，由于目标账户产生的行为数据量较少，采用传统的模型训练方式很难得到鲁棒性较高的特征生成网络。因此，在本实施例中，采用元学习方式对所获取的多个新账户的账户行为数据的进行学习，得到一个较佳的初始化参数(即参数在解空间中的最优位置)，生成预训练的特征生成网络。元学习，又称为learning to learn(学会学习)，元学习的目标是在各种学习任务上训练模型，使预训练后的模型能够基于少量的训练样本就可以解决新的学习任务。

在本实施例中，元学习可以采用MAML(Model-Agnostic Meta-Learning，模型无关的元学习)方式被显式地训练。显示训练是指存在明确的表达式来更新模型的参数。MAML的训练过程基于任务(task)进行。在本实施例中，每个新账户对应一个任务。对每一个新账户的训练任务，基于二重梯度对特征生成网络进行两次参数更新。图5示例示出了采用MAML对特征生成网络进行预训练的流程示意图。如图5所示，在得到多个新账户的账户关联数据后，对每个新账户的属性特征进行特征表示和特征拼接，并根据行为数据对特征表示和特征拼接后的属性特征进行标注，生成每个新账户对应的训练集。采用随机抽取或者划分等方式从每个新账户对应的训练集中得到第一训练集和第二训练集。由于MAML分为两个循环：内循环和外循环。第一训练集可用于内循环训练(对应图5中的support set data，支撑集)。第二训练集可用于外循环测试(对应图5中的query set data，查询集)。

具体地，内循环和外循环共享特征生成网络中的参数，两者的梯度更新的学习率分别由超参数α和β表示。超参数α和β可以预先配置。服务器在得到一个新账户的第一训练集和第二训练集后，将第一训练集输入至特征生成网络。通过第一损失函数L_S对特征生成网络进行训练，得到第一损失函数值。进而采用所得到的第一损失函数值对特征生成网络的基础参数进行更新，直至达到收敛条件，得到更新后的基础参数(对应图5中的FastWeights)。采用更新后的基础参数对特征生成网络进行设置，得到中间特征生成网络。将第二训练集输入至中间特征生成网络。通过第二损失函数L_Q对中间特征生成网络进行训练，得到第二损失函数值。采用所得到的第二损失函数值计算基础参数的梯度，并根据基础参数的梯度对基础参数进行梯度更新，直至达到收敛条件。对基础参数进行梯度更新可以采用SGD(Stochastic Gradient Descent，随机梯度下降)方式。基于上述训练任务得到的特征生成网络，重复上述内外循环训练过程，直至对多个新账户的训练任务全部执行完毕，得到预训练的特征生产网络。在本实施例中，收敛条件可以是指损失函数值达到最小值。

本实施例中，由于MAML学习的是初始化参数θ的规则，该初始化的参数θ在参数空间中对每个任务的最优参数解θ₁,θ₂,...θ_n高度敏感，因此，对于目标账户的训练任务，只需使用少量样本数据便可对预训练的特征生成网络进行微调，使其能够在一步或者是几步梯度下降中沿着梯度方向快速达到最优点，得到性能较佳的目标特征生成网络。

在一示例性实施例中，如图6所示，在步骤S220中，采用目标账户的账户关联数据对预训练的特征生成网络的参数进行调整，生成与目标账户对应的目标特征生成网络，具体可以通过以下步骤实现：

在步骤S221中，根据目标账户的账户关联数据生成样本集，样本集包含多个样本，每个样本根据目标账户行为数据对目标账户的账户关联数据进行标记得到。

在步骤S222中，从样本集中获取第一样本集，采用第一样本集对预训练的特征生成网络进行训练，根据所得到的第三损失函数值对预训练的特征生成网络的初始化参数进行更新。

在步骤S223中，从样本集中获取第二样本集，采用第二样本集对更新后的预训练的特征生成网络进行训练，根据已得到的第四损失函数值获取初始化参数的梯度，根据初始化参数的梯度对初始化参数进行更新，得到目标特征生成网络。

在本实施例中，在基于元学习方式得到预训练的特征生成网络后，对于目标账户为新账户的训练任务，可以参照图5所示的流程示意图对预训练的特征生成网络进行调整。

具体地，目标账户的账户关联数据包括目标账户的特征，以及已产生的少量行为数据。在得到目标账户的账户关联数据后，对目标账户的属性特征进行特征表示和特征拼接，并根据行为数据对特征表示和特征拼接后的属性特征进行标注，生成目标账户对应的样本集。可以采用随机抽取或者划分等方式从样本集中得到第一样本集和第二样本集。第一样本集可用于内循环训练(对应图5中的support set data)。第二样本集可用于外循环测试(对应图5中的query set data)。将第一样本集输入至预训练的特征生成网络。通过第三损失函数对预训练的特征生成网络进行训练，得到第三损失函数值。采用所得到的第三损失函数值对预训练的特征生成网络的初始化参数进行更新，直至达到收敛条件。将第二样本集输入至更新后的预训练的特征生成网络。通过第四损失函数对更新后的预训练的特征生成网络进行训练，得到第四损失函数值。采用所得到的第四损失函数值获取初始化参数的梯度，根据初始化参数的梯度对初始化参数进行梯度更新，直至达到收敛条件，得到目标特征生成网络。在本实施例中，收敛条件可以是指损失函数值达到最小值。

本实施例中，通过采用元学习方式对特征生成网络进行预训练，赋予特征生成网络先验知识，对于目标账户为新账户的训练任务，在获取目标账户的属性特征和少量样本数据后便可通过实时更新的方式对预训练的特征生成网络进行微调，得到适用于目标账户的目标特征生成网络，从而可以提高目标账户的目标特征向量的生成精度和生成效率，进而提高推荐的准确性和推荐效率。

在一示例性实施例中，特征生成网络包括至少一层全连接层；在步骤S230中，将目标账户的属性特征输入至目标特征生成网络，得到目标特征向量，包括：将目标账户的属性特征输入至目标特征生成网络，通过目标特征生成网络中的至少一层全连接层对属性特征进行全连接处理，得到目标特征向量。

具体地，针对目标账户的特征生成网络可以单独部署。特征生成网络采用全连接网络，包括至少一层全连接层。在判断目标账户符合预设要求时，则采用上述实施例中的元学习方式得到目标账户的目标特征生成网络。预设要求不限于是目标账户为新账户、一定时间段未登录的账户等。将目标账户的属性特征输入至目标特征生成网络，通过目标特征生成网络对目标账户的属性特征进行全连接处理，得到目标特征向量。进一步地，对于不符合预设要求的账户，可以采用其他方式(例如，Embedding Lookup)得到用户账户侧的特征向量。本实施例中，通过按账户实际情况分别采用不同的深度学习模型得到用户账户侧的特征向量，可以提高用户账户侧的特征向量的准确性。

在一示例性实施例中，如图7所示，在步骤S240中，根据目标特征向量向目标账号推荐对象，具体可以通过以下步骤实现：

在步骤S241中，获取候选对象的对象特征向量。

在步骤S242中，获取目标账户的目标特征向量和候选对象的对象特征向量之间的相似度。

在步骤S243中，根据相似度对候选对象进行排序，得到排序后的候选对象；向目标账号推荐排序后的候选对象。

其中，候选对象是指待进行预测相似度的对象，其数量包括多个。候选对象可以通过预设的召回策略从全量对象或者指定的对象集合中筛选得到。例如，可以采取多路召回策略，根据目标账户的账户关联数据进行兴趣标签匹配，兴趣实体匹配，协同过滤，地理位置匹配等操作，从全量对象或者指定的对象集合中筛选得到候选对象。候选对象的对象特征向量可以通过MLP(Multilayer Perceptron，多层感知器)、one-hot编码(独热编码)、Embedding Lookup(嵌入向量查找)等方式对候选对象的对象关联数据进行处理得到。相似度可以使用点击率CTR(Click-Through Rate)、转化率CVR(Conversion Rate)等表征。

具体地，在获取与目标账户对应的目标特征向量以及候选对象的对象特征向量后，将目标账户对应的目标特征向量和候选对象的对象特征向量输入至深度学习模型。通过深度学习模型得到目标账户对应的目标特征向量和每个候选对象的对象特征向量之间的相似度。其中，深度学习模型可以依实际需求决定，例如，可以采用LR(LogisticRegression、逻辑回归模型)、GDBT(Gradient Boosting Decision Tree，梯度提升迭代决策树)、FM(Factorization Machine，因子分解机)等。根据相似度对候选对象进行排序，并将排序后的候选对象推荐至客户端。

本实施例中，通过获取多个候选对象和目标账户的相似度，基于相似度对多个候选对象进行排序，将相似度较高的候选对象推荐至客户端，有助于提高用户的留存率。

图8是根据一示例性实施例示出的一种推荐方法的流程图，如图8所示，推荐方法用于新账户冷启动过程中的视频推荐服务，包括以下步骤。

在步骤S801中，获取预设时间内产生的多个新账户的账户关联数据，每个新账户的账户关联数据包括所述每个新账户的属性特征和行为数据。

在步骤S802中，根据多个新账户的账户关联数据生成与所述每个新账户对应的训练集。训练集中的训练样本根据每个新账户的行为数据对每个新账户的属性特征进行标记得到。

在步骤S803中，基于元学习方式(例如MAML)根据多个新账户的训练集对特征生成网络进行训练，得到预训练的特征生成网络。

其中，特征生成网络采用全连接网络，包括至少一层全连接层，例如两层全连接层。参照图5示出的流程示意图以及上述实施例说明，基于元学习方式对特征生成网络进行训练，得到预训练的特征生成网络，在此不做具体阐述。

在步骤S804中，在判断目标账户为新账户时，获取目标账户的账户关联数据。目标账户的账户关联数据包括目标账户的属性特征和行为数据。目标账户的行为数据可以是浏览视频的行为数据等。

在步骤S805中，根据目标账户的账户关联数据生成与目标账户对应的样本集。样本中的样本是根据目标账户的行为数据对目标账户的属性特征进行标记得到。

在步骤S806中，根据目标账户的样本集对预训练的特征生成网络进行调整，得到目标账户对应的目标特征生成网络。其中，对预训练的特征生成网络进行调整的过程可以参照图5示出的流程示意图，在此不做具体阐述。

在步骤S807中，将目标账户的属性特征输入至目标特征生成网络，得到目标特征向量。

在步骤S808中，根据目标特征向量向目标账号推荐视频。

具体地，在获取与目标账户对应的目标特征向量以及候选视频的对象特征向量后，将目标账户对应的目标特征向量和候选视频的对象特征向量输入至深度学习模型。通过深度学习模型得到目标账户对应的目标特征向量和候选视频的对象特征向量之间的相似度。根据相似度对候选视频进行排序，并将排序后的候选视频推荐至客户端。

图9是根据一示例性实施例示出的一种特征生成网络的训练方法的流程图。特征生成网络的训练方法适用于基于少量的样本数据训练模型的场景，例如，新账户特征处理、客户端冷启动过程中的内容推荐等。如图9所示，特征生成网络的训练方法用于服务器中，包括以下步骤。

在步骤S910中，获取目标账户的账户关联数据，目标账户的账户关联数据包括目标账户的属性特征和行为数据。

在步骤S920中，根据目标账户的账户关联数据生成样本集，样本集包含多个样本，每个样本根据目标账户的行为数据对目标账户的账户关联数据进行标记得到。

在步骤S930中，采用样本集对预训练的特征生成网络进行调整，更新预训练的特征生成网络中的初始化参数，得到目标特征生成网络，预训练的特征生成网络是预先根据已获取的多个新账户的账户关联数据训练得到的。

其中，目标账户是指待进行模型训练的账户。账户关联数据是指与目标账户相关的数据，不限于包括目标账户的属性特征和行为数据。特征生成网络可以是任一种能够用于生成特征向量(Embedding)的深度学习网络，例如，Word2vec，或者依实际情况设计的深度学习网络。预训练的特征生成网络可以是服务器通过在线或者离线的方式，使用多个新账户的账户关联数据进行训练得到。新账户是指首次注册或者已注册预设时间段的账户。多个新账户的账户关联数据可以从已获取的日志中得到。

具体地，在服务器检测到对目标账户的模型训练请求时，获取目标账户的账户关联数据。服务器根据目标账户的账户关联数据生成样本集。采用目标账户的样本集对预训练的特征生成网络继续进行调整，得到适用于目标账户的目标特征生成网络。

上述特征生成网络的训练方法中，由于预训练的特征生成网络已学习一定量类别的新账户的账户相关数据，对于目标账户，只需少量的样本数据便可对预训练的特征生成网络进行快速调整，得到适用于目标账户的目标特征生成网络，从而可以提高模型性能和模型训练的效率。

在一示例性实施例中，对预训练的特征生成网络的一种生成方式进行说明。预训练的特征生成网络的生成方式，包括：获取预设时间内产生的多个新账户的账户关联数据，每个新账户的账户关联数据包括每个新账户的属性特征和行为数据；生成与每个新账户对应的训练集，训练集包含多个训练样本，每个训练样本根据每个新账户的行为数据对每个新账户的账户关联数据进行标记得到；根据每个新账户对应的训练集的训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络。

具体地，在本实施例中，预训练的特征生成网络可以是服务器在离线情况周期性生成的。周期依具体情况而定，可以是12小时、一天等任意时间。具体地，对于新账户，预先配置新账户对应的标签。在触发特征生成网络的训练指令后，服务器获取已产生的周期内的日志。根据新账户对应的标签从日志中查询得到新账户以及新账户的账户关联数据。服务器可以根据每个新账户的行为数据，对已获取的每个新账户的账户关联数据标记，得到多个训练样本。采用每个新账户对应的多个训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络。

在一示例性实施例中，根据每个新账户对应的训练集中的训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络，包括：从每个新账户对应的训练集中获取每个新账户对应的第一训练集和第二训练集；采用每个新账户的第一训练集对特征生成网络进行训练，根据所得到的第一损失函数值对特征生成网络的基础参数进行更新，得到中间特征生成网络；采用每个新账户的第二训练集对中间特征生成网络进行训练，根据所得到的第二损失函数值获取基础参数的梯度，根据基础参数的梯度对基础参数进行更新，直至达到收敛条件，得到预训练的特征生成网络。

具体地，在获取每个账户对应的训练集后，可以基于元学习方式对特征生成网络进行训练。参照图5所示的流程示意图。采用随机抽取或者划分等方式从每个账户对应的训练集中得到第一训练集和第二训练集。第一训练集可用于内循环训练(对应图5中的support set data)。第二训练集可用于外循环测试(对应图5中的query set data)。将第一训练集输入至特征生成网络。通过第一损失函数对特征生成网络进行训练，得到第一损失函数值。采用所得到的第一损失函数值对特征生成网络的基础参数进行更新，直至达到收敛条件，得到中间特征生成网络。将第二训练集输入至中间特征生成网络。通过第二损失函数对中间特征生成网络进行训练，得到第二损失函数值。采用所得到的第二损失函数值获取基础参数的梯度，根据基础参数的梯度对基础参数进行梯度更新，直至达到收敛条件，得到预训练的特征生成网络。在本实施例中，收敛条件可以是指损失函数值达到最小值。

在一示例性实施例中，采用样本集对预训练的特征生成网络进行调整，更新预训练的特征生成网络中的初始化参数，得到目标特征生成网络，包括：从样本集中获取第一样本集，采用第一样本集对预训练的特征生成网络进行训练，根据所得到的第三损失函数值对预训练的特征生成网络的初始化参数进行更新；从样本集中获取第二样本集，采用第二样本集对更新后的预训练的特征生成网络进行训练，根据已得到的第四损失函数值获取初始化参数的梯度，根据初始化参数的梯度对初始化参数进行更新，得到目标特征生成网络。

具体地，在基于元学习方式得到预训练的特征生成网络后，对于目标账户的训练任务，可以参照图5所示的流程示意图对预训练的特征生成网络进行调整。采用随机抽取或者划分等方式从样本集中得到第一样本集和第二样本集。第一样本集可用于内循环训练。第二样本可用于外循环测试。将第一样本集输入至预训练的特征生成网络。通过第三损失函数对预训练的特征生成网络进行训练，得到第三损失函数值。采用所得到的第三损失函数值对预训练的特征生成网络的初始化参数进行更新，直至达到收敛条件。将第二样本集输入至更新后的预训练的特征生成网络。通过第四损失函数对更新后的预训练的特征生成网络进行训练，得到第四损失函数值。采用所得到的第四损失函数值获取初始化参数的梯度，根据初始化参数的梯度对初始化参数进行梯度更新，直至达到收敛条件，得到目标特征生成网络。在本实施例中，收敛条件可以是指损失函数值达到最小值。

本实施例中，通过采用元学习方式对特征生成网络进行预训练，赋予特征生成网络先验知识，对于目标账户为新账户的训练任务，在获取目标账户的属性特征和少量样本数据后便可通过实时更新的方式对预训练的特征生成网络进行微调，得到适用于目标账户的性能较佳的目标特征生成网络。

图10是根据一示例性实施例示出的一种特征生成网络的训练方法的流程图，如图10所示，特征生成网络的训练方法用于服务器中，包括以下步骤。

在步骤S1001中，获取预设时间内产生的多个新账户的账户关联数据，每个新账户的账户关联数据包括所述每个新账户的属性特征和行为数据。

在步骤S1002中，根据多个新账户的账户关联数据生成与所述每个新账户对应的训练集。训练集中的训练样本根据每个新账户的行为数据对每个新账户的属性特征进行标记得到。

在步骤S1003中，基于元学习方式根据多个新账户的训练集对特征生成网络进行训练，得到预训练的特征生成网络。

在步骤S1004中，获取目标账户的账户关联数据。目标账户的账户关联数据包括目标账户的属性特征和行为数据。

在步骤S1005中，根据目标账户的账户关联数据生成与目标账户对应的样本集。样本中的样本是根据目标账户的行为数据对目标账户的属性特征进行标记得到。

在步骤S1006中，根据目标账户的样本集对预训练的特征生成网络进行调整，得到目标账户对应的目标特征生成网络。其中，对预训练的特征生成网络进行调整的过程可以参照图5示出的训练流程示意图，在此不做具体阐述。

应该理解的是，虽然上述流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

图11是根据一示例性实施例示出的一种推荐装置1100框图。参照图11，该装置包括第一获取模块1101、第一训练模块1102、特征向量生成模块1103和推荐模块1104。

第一获取模块1101，被配置为执行获取目标账户的账户关联数据，账户关联数据包括目标账户的属性特征和行为数据；第一训练模块1102，被配置为执行采用目标账户的账户关联数据对预训练的特征生成网络的初始化参数进行调整，生成与目标账户对应的目标特征生成网络，预训练的特征生成网络是预先根据已获取的多个新账户的账户关联数据训练得到的；特征向量生成模块1103，被配置为执行将目标账户的属性特征输入至目标特征生成网络，得到目标特征向量；推荐模块1104，被配置为执行根据目标特征向量向目标账号推荐对象。

在一示例性实施例中，所述装置1100还包括：第二获取模块，被配置为执行获取预设时间内产生的多个新账户的账户关联数据，每个新账户的账户关联数据包括每个新账户的属性特征和行为数据；训练集生成模块，被配置为执行生成与每个新账户对应的训练集，训练集包含多个训练样本，每个训练样本根据每个新账户的行为数据对每个新账户的账户关联数据进行标记得到；第二训练模块，被配置为执行根据每个新账户对应的训练集中的训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络。

在一示例性实施例中，第二训练模块，包括：第一获取单元，被配置为执行从每个新账户对应的训练集中获取每个新账户对应的第一训练集和第二训练集；第一训练单元，被配置为执行采用每个新账户的第一训练集对特征生成网络进行训练，根据所得到的第一损失函数值对特征生成网络的基础参数进行更新，得到中间特征生成网络；第二训练单元，被配置为执行采用每个新账户的第二训练集对中间特征生成网络进行训练，根据所得到的第二损失函数值获取基础参数的梯度，根据基础参数的梯度对基础参数进行更新，直至达到收敛条件，得到预训练的特征生成网络。

在一示例性实施例中，第一训练模块1102，包括：样本集生成单元，被配置为执行根据目标账户的账户关联数据生成样本集，样本集包含多个样本，每个样本根据目标账户行为数据对目标账户的账户关联数据进行标记得到；第三训练单元，被配置为执行从样本集中获取第一样本集，采用第一样本集对预训练的特征生成网络进行训练，根据所得到的第三损失函数值对预训练的特征生成网络的初始化参数进行更新；第四训练单元，被配置为执行从样本集中获取第二样本集，采用第二样本集对更新后的预训练的特征生成网络进行训练，根据已得到的第四损失函数值获取初始化参数的梯度，根据初始化参数的梯度对初始化参数进行更新，得到目标特征生成网络。

在一示例性实施例中，特征生成网络包括至少一层全连接层；特征向量生成模块1103，被配置为执行将目标账户的属性特征输入至目标特征生成网络，通过目标特征生成网络中的至少一层全连接层对属性特征进行全连接处理，得到目标特征向量。

在一示例性实施例中，推荐模块1104，包括：第二获取单元，被配置为执行获取候选对象的对象特征向量；相似度确定单元，被配置为执行获取目标账户的目标特征向量和候选对象的对象特征向量之间的相似度；排序单元，被配置为执行根据相似度对候选对象进行排序，得到排序后的候选对象；推荐单元，被配置为执行向目标账号推荐排序后的候选对象。

图12是根据一示例性实施例示出的一种特征生成网络的训练装置1200框图。参照图12，该装置包括第一获取模块1201、样本集生成模块1202和第一训练模块1203。

第一获取模块1201，被配置为执行获取目标账户的账户关联数据，目标账户的账户关联数据包括目标账户的属性特征和行为数据；样本集生成模块1202，被配置为执行根据目标账户的账户关联数据生成样本集，样本集包含多个样本，每个样本根据目标账户的行为数据对目标账户的账户关联数据进行标记得到；第一训练模块1203，被配置为执行采用样本集对预训练的特征生成网络进行调整，更新预训练的特征生成网络中的初始化参数，得到目标特征生成网络，预训练的特征生成网络是预先根据已获取的多个新账户的账户关联数据训练得到的。

在一示例性实施例中，所述装置1200还包括：第二获取模块，被配置为执行获取预设时间内产生的多个新账户的账户关联数据，每个新账户的账户关联数据包括每个新账户的属性特征和行为数据；训练集生成模块，被配置为执行生成与每个新账户对应的训练集，训练集包含多个训练样本，每个训练样本根据每个新账户的行为数据对每个新账户的账户关联数据进行标记得到；第二训练模块，被配置为执行根据每个新账户对应的训练集的训练样本对特征生成网络进行训练，直至达到收敛条件，得到预训练的特征生成网络。

在一示例性实施例中，第二训练模块，包括：获取单元，被配置为执行从每个新账户对应的训练集中获取每个新账户对应的第一训练集和第二训练集；第一训练单元，被配置为执行采用每个新账户的第一训练集对特征生成网络进行训练，根据所得到的第一损失函数值对特征生成网络的基础参数进行更新，得到中间特征生成网络；第二训练单元，被配置为执行采用每个新账户的第二训练集对中间特征生成网络进行训练，根据所得到的第二损失函数值获取基础参数的梯度，根据基础参数的梯度对基础参数进行更新，直至达到收敛条件，得到预训练的特征生成网络。

在一示例性实施例中，第一训练模块1203，包括：第三训练单元，被配置为执行从样本集中获取第一样本集，采用第一样本集对预训练的特征生成网络进行训练，根据所得到的第三损失函数值对预训练的特征生成网络的初始化参数进行更新；第四训练单元，被配置为执行从样本集中获取第二样本集，采用第二样本集对更新后的预训练的特征生成网络进行训练，根据已得到的第四损失函数值获取初始化参数的梯度，根据初始化参数的梯度对初始化参数进行更新，得到目标特征生成网络。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图13是根据一示例性实施例示出的一种用于推荐和/或特征生成网络的训练的设备1300的框图。例如，设备1300可以为一服务器。参照图13，设备1300包括处理组件1320，其进一步包括一个或多个处理器，以及由存储器1322所代表的存储器资源，用于存储可由处理组件1320的执行的指令，例如应用程序。存储器1322中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件1320被配置为执行指令，以执行上述推荐方法和/或特征生成网络的训练方法。

设备1300还可以包括一个电源组件1324被配置为执行设备1300的电源管理，一个有线或无线网络接口1326被配置为将设备1300连接到网络，和一个输入输出(I/O)接口1328。设备1300可以操作基于存储在存储器1322的操作系统，例如Windows Server，Mac OSX，Unix，Linux，FreeBSD或类似。

在示例性实施例中，还提供了一种包括指令的存储介质，例如包括指令的存储器1322，上述指令可由设备1300的处理器执行以完成上述方法。存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种推荐方法，其特征在于，包括：

获取目标账户的账户关联数据，所述目标账户的账户关联数据包括所述目标账户的属性特征和行为数据；

采用所述目标账户的账户关联数据对预训练的特征生成网络的初始化参数进行调整，生成与所述目标账户对应的目标特征生成网络，所述预训练的特征生成网络是预先根据已获取的多个新账户的账户关联数据训练得到的；

将所述目标账户的属性特征输入至所述目标特征生成网络，得到目标特征向量；

根据所述目标特征向量向所述目标账号推荐对象。

2.根据权利要求1所述的推荐方法，其特征在于，所述预训练的特征生成网络的生成方式，包括：

获取预设时间内产生的所述多个新账户的账户关联数据，每个新账户的账户关联数据包括所述每个新账户的属性特征和行为数据；

生成与所述每个新账户对应的训练集，所述训练集包含多个训练样本，每个训练样本根据所述每个新账户的行为数据对所述每个新账户的账户关联数据进行标记得到；

根据所述每个新账户对应的训练集中的训练样本对所述特征生成网络进行训练，直至达到收敛条件，得到所述预训练的特征生成网络。

3.根据权利要求2所述的推荐方法，其特征在于，所述根据所述每个新账户对应的训练集中的训练样本对所述特征生成网络进行训练，直至达到收敛条件，得到所述预训练的特征生成网络，包括：

从所述每个新账户对应的训练集中获取所述每个新账户对应的第一训练集和第二训练集；

采用所述每个新账户的第一训练集对所述特征生成网络进行训练，根据所得到的第一损失函数值对所述特征生成网络的基础参数进行更新，得到中间特征生成网络；

采用所述每个新账户的第二训练集对所述中间特征生成网络进行训练，根据所得到的第二损失函数值获取所述基础参数的梯度，根据所述基础参数的梯度对所述基础参数进行更新，直至达到收敛条件，得到所述预训练的特征生成网络。

4.一种特征生成网络的训练方法，其特征在于，包括：

根据所述目标账户的账户关联数据生成样本集，所述样本集包含多个样本，每个样本根据所述目标账户的行为数据对所述目标账户的账户关联数据进行标记得到；

采用所述样本集对预训练的特征生成网络进行调整，更新所述预训练的特征生成网络中的初始化参数，得到目标特征生成网络，

所述预训练的特征生成网络是预先根据已获取的多个新账户的账户关联数据训练得到的。

5.一种推荐装置，其特征在于，包括：

第一获取模块，被配置为执行获取目标账户的账户关联数据，所述账户关联数据包括所述目标账户的属性特征和行为数据；

第一训练模块，被配置为执行采用所述目标账户的账户关联数据对预训练的特征生成网络的初始化参数进行调整，生成与所述目标账户对应的目标特征生成网络，所述预训练的特征生成网络是预先根据已获取的多个新账户的账户关联数据训练得到的；

特征向量生成模块，被配置为执行将所述目标账户的属性特征输入至所述目标特征生成网络，得到目标特征向量；

推荐模块，被配置为执行根据所述目标特征向量向所述目标账号推荐对象。

6.一种特征生成网络的训练装置，其特征在于，包括：

第一获取模块，被配置为执行获取目标账户的账户关联数据，所述目标账户的账户关联数据包括所述目标账户的属性特征和行为数据；

样本集生成模块，被配置为执行根据所述目标账户的账户关联数据生成样本集，所述样本集包含多个样本，每个样本根据所述目标账户的行为数据对所述目标账户的账户关联数据进行标记得到；

第一训练模块，被配置为执行采用所述样本集对预训练的特征生成网络进行调整，更新所述预训练的特征生成网络中的初始化参数，得到目标特征生成网络，

7.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至3中任一项所述的推荐方法。

8.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求4所述的特征生成网络的训练方法。

9.一种存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至3中任一项所述的推荐方法。

10.一种存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求4所述的特征生成网络的训练方法。