CN113269612A

CN113269612A - 物品推荐方法、装置、电子设备及存储介质

Info

Publication number: CN113269612A
Application number: CN202110585850.2A
Authority: CN
Inventors: 李勇; 宋洋; 郑瑜; 高宸; 常健新; 牛亚男; 惠轶群; 金德鹏
Original assignee: Tsinghua University; Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Tsinghua University; Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-05-27
Filing date: 2021-05-27
Publication date: 2021-08-17

Abstract

本公开关于一种物品推荐方法、装置、电子设备及存储介质，属于计算机技术领域。该方法包括：基于账号在历史互动行为中交互的多个物品，获取该账号的长期兴趣特征和短期兴趣特征；对该长期兴趣特征和该短期兴趣特征进行融合，得到该账号的目标兴趣特征；基于该目标兴趣特征和目标物品的嵌入特征，确定是否对该账号推荐该目标物品。本公开通过在目标兴趣特征中较好地融合账号的长期、短期两种不同类型的兴趣偏好，从而提高了对目标物品的推荐准确度。

Description

物品推荐方法、装置、电子设备及存储介质

技术领域

本公开涉及计算机技术领域，特别涉及一种物品推荐方法、装置、电子设备及存储介质。

背景技术

随着计算机技术的发展和终端功能的多样化，用户可以通过终端随时随地浏览各类物品(例如商品或服务)，因此，如何向终端进行物品推荐逐渐成为一个热门课题。

在目前的推荐系统中，通常用户曾经产生过互动行为的物品序列作为输入，通过推荐模型学习该用户的兴趣偏好的向量表示，并预测用户在当前时刻有可能产生互动行为的目标物品。比如，将该物品序列输入到GRU(Gated Recurrent Unit，门控循环单元)模型中，将GRU模型的最后一个隐向量作为用户的兴趣偏好的向量表示，并将用户的兴趣偏好的向量表示与目标物品的向量表示这两者输入到MLP(Multi-Layer Perceptron，多层感知机)模型中，通过MLP模型预测目标物品与用户之间的最终相关性得分。

在上述过程中，GRU模型虽能够对用户整体的兴趣偏好提取一个统一的向量表示，但GRU模型的长期记忆能力不足，导致输出的兴趣偏好的向量表示更贴近于用户的短期偏好，比如，从长期来看用户更喜欢浏览“手机”这一类物品，但短期内用户多次浏览了“食品”这一类物品，GRU模型输出的兴趣偏好的向量表示则会与“食品”具有更高的相关性，导致难以向用户推荐符合用户的长期偏好物品，因此物品推荐的准确度差。

发明内容

本公开提供一种物品推荐方法、装置、电子设备及存储介质，以至少提高物品推荐的准确度。本公开的技术方案如下：

根据本公开实施例的一方面，提供一种物品推荐方法，包括：

基于账号在历史互动行为中交互的多个物品，获取所述账号的长期兴趣特征和短期兴趣特征，所述长期兴趣特征为所述多个物品的全局特征，所述短期兴趣特征为所述多个物品中符合目标条件的部分物品的局部特征；

对所述长期兴趣特征和所述短期兴趣特征进行融合，得到所述账号的目标兴趣特征；

基于所述目标兴趣特征和目标物品的嵌入特征，确定是否对所述账号推荐所述目标物品，所述嵌入特征用于表征对应物品的固有特性。

在一种可能实施方式中，所述基于账号在历史互动行为中交互的多个物品，获取所述账号的长期兴趣特征包括：

获取所述多个物品各自对应的多个嵌入特征；

将所述多个嵌入特征输入第一编码器，基于所述账号的账号特征，获取所述多个嵌入特征各自对应的多个第一权重参数；

基于所述多个第一权重参数，分别对所述多个嵌入特征进行加权，将加权后的多个嵌入特征进行融合，输出所述长期兴趣特征。

在一种可能实施方式中，所述基于账号在历史互动行为中交互的多个物品，获取所述账号的短期兴趣特征包括：

获取所述多个物品各自对应的多个嵌入特征；

将所述多个嵌入特征输入第二编码器，提取所述多个嵌入特征各自对应的多个时序特征，对所述多个时序特征进行加权池化，输出所述短期兴趣特征。

在一种可能实施方式中，所述提取所述多个嵌入特征各自对应的多个时序特征包括：

将所述多个嵌入特征输入所述第二编码器中的第一子编码器，对所述多个嵌入特征进行编码，输出所述多个时序特征。

在一种可能实施方式中，所述对所述多个时序特征进行加权池化，输出所述短期兴趣特征包括：

将所述多个嵌入特征输入所述第二编码器中的第二子编码器，提取所述多个嵌入特征之间的特征变化信息；

基于所述特征变化信息和所述多个时序特征，获取所述短期兴趣特征。

在一种可能实施方式中，所述基于所述特征变化信息和所述多个时序特征，获取所述短期兴趣特征包括：

基于所述特征变化信息，获取所述多个时序特征各自对应的多个第二权重参数；

基于所述多个第二权重参数，分别对所述多个时序特征进行加权，将加权后的多个时序特征进行融合，得到所述短期兴趣特征。

在一种可能实施方式中，所述方法还包括：

基于样本账号在历史互动行为中交互的多个样本物品，获取所述多个样本物品各自对应的多个样本嵌入特征；

将所述多个样本嵌入特征分别输入第一初始编码器和第二初始编码器，输出所述样本账号的样本长期兴趣特征和样本短期兴趣特征；

基于所述样本长期兴趣特征、所述样本短期兴趣特征、标准长期兴趣特征和标准短期兴趣特征，获取本次迭代过程的损失函数值，所述标准长期兴趣特征为所述多个样本嵌入特征的平均值，所述标准短期兴趣特征为所述多个样本物品中符合目标条件的部分物品的样本嵌入特征的平均值；

迭代训练所述第一初始编码器和所述第二初始编码器，直到符合停止条件，得到第一编码器和第二编码器，所述第一编码器用于提取账号的长期兴趣特征，所述第二编码器用于提取账号的短期兴趣特征。

在一种可能实施方式中，所述基于所述样本长期兴趣特征、所述样本短期兴趣特征、标准长期兴趣特征和标准短期兴趣特征，获取本次迭代过程的损失函数值包括：

获取第一相似度、第二相似度、第三相似度和第四相似度，所述第一相似度为所述样本长期兴趣特征和所述标准长期兴趣特征之间的相似度，所述第二相似度为所述样本长期兴趣特征和所述标准短期兴趣特征之间的相似度，所述第三相似度为所述样本短期兴趣特征和所述标准短期兴趣特征之间的相似度，所述第四相似度为所述样本短期兴趣特征和所述标准长期兴趣特征之间的相似度；

获取第一差值和第二差值，所述第一差值为所述第一相似度和所述第二相似度之间的差值，所述第二差值为所述第三相似度和所述第四相似度之间的差值；

基于所述第一差值和所述第二差值，获取所述损失函数值。

在一种可能实施方式中，所述对所述长期兴趣特征和所述短期兴趣特征进行融合，得到所述账号的目标兴趣特征包括：

获取所述多个物品各自对应的多个嵌入特征；

基于所述多个嵌入特征、所述长期兴趣特征、所述短期兴趣特征以及所述目标物品的嵌入特征，获取所述长期兴趣特征的第三权重参数和所述短期兴趣特征的第四权重参数；

基于所述第三权重参数和所述第四权重参数，分别对所述长期兴趣特征和所述短期兴趣特征进行加权，将加权后的长期兴趣特征和加权后的短期兴趣特征融合得到所述目标兴趣特征。

在一种可能实施方式中，所述基于所述多个嵌入特征、所述长期兴趣特征、所述短期兴趣特征以及所述目标物品的嵌入特征，获取所述长期兴趣特征的第三权重参数和所述短期兴趣特征的第四权重参数包括：

获取所述多个嵌入特征之间的全局编码特征，所述全局编码特征用于表征对所述多个嵌入特征进行编码后的全局化信息；

对所述长期兴趣特征、所述短期兴趣特征、所述全局编码特征以及所述目标物品的嵌入特征进行加权，得到所述第三权重参数和所述第四权重参数。

在一种可能实施方式中，所述获取所述多个嵌入特征之间的全局编码特征包括：

将所述多个嵌入特征输入融合编码器，对所述多个嵌入特征进行编码，得到隐向量序列，将所述隐向量序列中的最后一个隐向量获取为所述全局编码特征。

在一种可能实施方式中，所述对所述长期兴趣特征、所述短期兴趣特征、所述全局编码特征以及所述目标物品的嵌入特征进行加权，得到所述第三权重参数和所述第四权重参数包括：

将所述长期兴趣特征、所述短期兴趣特征、所述全局编码特征以及所述目标物品的嵌入特征进行拼接，得到拼接特征；

将所述拼接特征输入权重预测模型，对所述拼接特征进行加权处理，输出所述第三权重参数和所述第四权重参数，所述第三权重参数和所述第四权重参数之和为1。

在一种可能实施方式中，所述基于所述目标兴趣特征和目标物品的嵌入特征，确定是否对所述账号推荐所述目标物品包括：

对所述目标兴趣特征、所述目标物品的嵌入特征以及所述目标物品的上下文特征进行融合，得到目标融合特征，所述上下文特征用于表征所述账号在对所述目标物品产生互动行为时的互动场景特征；

将所述目标融合特征输入推荐模型，对所述目标融合特征进行加权，输出所述目标物品的推荐概率参数，所述推荐概率参数用于表征所述账号对所述目标物品的偏好程度；

响应于所述推荐概率参数符合推荐条件，确定对所述账号推荐所述目标物品；

响应于所述推荐概率参数不符合所述推荐条件，确定对所述账号不推荐所述目标物品。

在一种可能实施方式中，所述推荐条件为所述推荐概率参数大于推荐概率阈值；或，所述推荐条件为在多个目标物品的多个推荐概率参数按照从大到小的排序中，所述目标物品的所述推荐概率参数位于所述排序的前目标位。

根据本公开实施例的另一方面，提供一种物品推荐装置，包括：

获取单元，被配置为执行基于账号在历史互动行为中交互的多个物品，获取所述账号的长期兴趣特征和短期兴趣特征，所述长期兴趣特征为所述多个物品的全局特征，所述短期兴趣特征为所述多个物品中符合目标条件的部分物品的局部特征；

融合单元，被配置为执行对所述长期兴趣特征和所述短期兴趣特征进行融合，得到所述账号的目标兴趣特征；

确定单元，被配置为执行基于所述目标兴趣特征和目标物品的嵌入特征，确定是否对所述账号推荐所述目标物品，所述嵌入特征用于表征对应物品的固有特性。

在一种可能实施方式中，所述获取单元包括：

第一获取子单元，被配置为执行获取所述多个物品各自对应的多个嵌入特征；

第二获取子单元，被配置为执行将所述多个嵌入特征输入第一编码器，基于所述账号的账号特征，获取所述多个嵌入特征各自对应的多个第一权重参数；

第一融合子单元，被配置为执行基于所述多个第一权重参数，分别对所述多个嵌入特征进行加权，将加权后的多个嵌入特征进行融合，输出所述长期兴趣特征。

在一种可能实施方式中，所述获取单元包括：

提取池化子单元，被配置为执行将所述多个嵌入特征输入第二编码器，提取所述多个嵌入特征各自对应的多个时序特征，对所述多个时序特征进行加权池化，输出所述短期兴趣特征。

在一种可能实施方式中，所述提取池化子单元包括：

编码子子单元，被配置为执行将所述多个嵌入特征输入所述第二编码器中的第一子编码器，对所述多个嵌入特征进行编码，输出所述多个时序特征。

在一种可能实施方式中，所述提取池化子单元包括：

提取子子单元，被配置为执行将所述多个嵌入特征输入所述第二编码器中的第二子编码器，提取所述多个嵌入特征之间的特征变化信息；

第一获取子子单元，被配置为执行基于所述特征变化信息和所述多个时序特征，获取所述短期兴趣特征。

在一种可能实施方式中，所述第一获取子子单元被配置为执行：

在一种可能实施方式中，所述装置还包括训练单元，所述训练单元包括：

第三获取子单元，被配置为执行基于样本账号在历史互动行为中交互的多个样本物品，获取所述多个样本物品各自对应的多个样本嵌入特征；

输入输出子单元，被配置为执行将所述多个样本嵌入特征分别输入第一初始编码器和第二初始编码器，输出所述样本账号的样本长期兴趣特征和样本短期兴趣特征；

第四获取子单元，被配置为执行基于所述样本长期兴趣特征、所述样本短期兴趣特征、标准长期兴趣特征和标准短期兴趣特征，获取本次迭代过程的损失函数值，所述标准长期兴趣特征为所述多个样本嵌入特征的平均值，所述标准短期兴趣特征为所述多个样本物品中符合目标条件的部分物品的样本嵌入特征的平均值；

迭代训练子单元，被配置为执行迭代训练所述第一初始编码器和所述第二初始编码器，直到符合停止条件，得到第一编码器和第二编码器，所述第一编码器用于提取账号的长期兴趣特征，所述第二编码器用于提取账号的短期兴趣特征。

在一种可能实施方式中，所述第四获取子单元被配置为执行：

基于所述第一差值和所述第二差值，获取所述损失函数值。

在一种可能实施方式中，所述融合单元包括：

第五获取子单元，被配置为执行基于所述多个嵌入特征、所述长期兴趣特征、所述短期兴趣特征以及所述目标物品的嵌入特征，获取所述长期兴趣特征的第三权重参数和所述短期兴趣特征的第四权重参数；

第二融合子单元，被配置为执行基于所述第三权重参数和所述第四权重参数，分别对所述长期兴趣特征和所述短期兴趣特征进行加权，将加权后的长期兴趣特征和加权后的短期兴趣特征融合得到所述目标兴趣特征。

在一种可能实施方式中，所述第五获取子单元包括：

第二获取子子单元，被配置为执行获取所述多个嵌入特征之间的全局编码特征，所述全局编码特征用于表征对所述多个嵌入特征进行编码后的全局化信息；

加权子子单元，被配置为执行对所述长期兴趣特征、所述短期兴趣特征、所述全局编码特征以及所述目标物品的嵌入特征进行加权，得到所述第三权重参数和所述第四权重参数。

在一种可能实施方式中，所述第二获取子子单元被配置为执行：

在一种可能实施方式中，所述加权子子单元被配置为执行：

在一种可能实施方式中，所述确定单元被配置为执行：

根据本公开实施例的另一方面，提供一种电子设备，包括：

一个或多个处理器；

用于存储所述一个或多个处理器可执行指令的一个或多个存储器；

其中，所述一个或多个处理器被配置为执行上述一方面的任一种可能实施方式中的物品推荐方法。

根据本公开实施例的另一方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的至少一条指令由电子设备的一个或多个处理器执行时，使得所述电子设备能够执行上述一方面的任一种可能实施方式中的物品推荐方法。

根据本公开实施例的另一方面，提供一种计算机程序产品，包括一条或多条指令，所述一条或多条指令可以由电子设备的一个或多个处理器执行，使得所述电子设备能够执行上述一方面的任一种可能实施方式中的物品推荐方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

通过针对账号分别提取长期兴趣特征和短期兴趣特征，由于长期兴趣特征为账号在历史互动行为中交互过的所有物品的全局特征，因此能够反映账号的不随外界因素而变化的长期兴趣偏好，而短期兴趣特征为符合目标条件的部分物品的局部特征，因此能够反映账号受到外界因素影响所产生的短期兴趣偏好，使得在目标兴趣特征中能够较好地融合账号的长期、短期两种不同类型的兴趣偏好，从而在结合目标兴趣特征进行推荐时，提高了对目标物品的推荐准确度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种物品推荐方法的实施环境示意图；

图2是根据一示例性实施例示出的一种物品推荐方法的流程图；

图3是根据一示例性实施例示出的一种物品推荐方法的流程图；

图4是本公开实施例提供的一种获取短期兴趣特征的流程图；

图5是本申请实施例提供的一种物品推荐方法的原理性示意图；

图6是本申请实施例提供的一种物品推荐方法的原理性示意图；

图7是本申请实施例提供的一种物品推荐方法的训练流程图；

图8是根据一示例性实施例示出的一种物品推荐装置的逻辑结构框图；

图9示出了本公开一个示例性实施例提供的电子设备的结构框图；

图10是本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开所涉及的用户信息可以为经用户授权或者经过各方充分授权的信息。

图1是根据一示例性实施例示出的一种物品推荐方法的实施环境示意图，参见图1，在该实施环境中可以包括至少一个终端101和服务器102，下面进行详述：

终端101用于浏览各式各样的物品，该物品可以包括商品或服务，终端101上可以安装有应用程序，该应用程序可以是任一能够提供物品浏览服务的客户端，用户可以通过启动该应用程序来浏览物品，该应用程序可以是购物应用、外卖应用、旅行应用、游戏应用或者社交应用中至少一项，该物品可以包括食品、电子产品、衣服、日用品、护肤品等等，本申请实施例对此不进行具体限定。

服务器102也即是一种电子设备，用于向终端101提供物品推荐服务。服务器102可以包括一台服务器、多台服务器、云计算平台或者虚拟化中心中的至少一项。可选地，服务器102可以承担主要计算工作，终端101可以承担次要计算工作；或者，服务器102可以承担次要计算工作，终端101可以承担主要计算工作；或者，服务器102和终端101之间采用分布式计算架构进行协同计算。

可选地，终端101的设备类型可以包括：智能手机、平板电脑、车载终端、智能音箱、智能手表、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio LayerIV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机或者台式计算机中的至少一种。例如，该任一终端可以是智能手机，或者其他手持便携式电子设备。以下实施例，以终端101包括智能手机来举例说明。

本领域技术人员可以知晓，上述终端101的数量可以更多或更少。比如上述终端101可以仅为一个，或者上述终端101为几十个或几百个，或者更多数量。本公开实施例对终端101的数量和设备类型不加以限定。

图2是根据一示例性实施例示出的一种物品推荐方法的流程图，参见图2，该物品推荐方法应用于电子设备，下面以电子设备为服务器为例进行说明。

在步骤201中，基于账号在历史互动行为中交互的多个物品，获取该账号的长期兴趣特征和短期兴趣特征，该长期兴趣特征为该多个物品的全局特征，该短期兴趣特征为该多个物品中符合目标条件的部分物品的局部特征。

在步骤202中，对该长期兴趣特征和该短期兴趣特征进行融合，得到该账号的目标兴趣特征。

在步骤203中，基于该目标兴趣特征和目标物品的嵌入特征，确定是否对该账号推荐该目标物品，该嵌入特征用于表征对应物品的固有特性。

本公开实施例提供的方法，通过针对账号分别提取长期兴趣特征和短期兴趣特征，由于长期兴趣特征为账号在历史互动行为中交互过的所有物品的全局特征，因此能够反映账号的不随外界因素而变化的长期兴趣偏好，而短期兴趣特征为符合目标条件的部分物品的局部特征，因此能够反映账号受到外界因素影响所产生的短期兴趣偏好，使得在目标兴趣特征中能够较好地融合账号的长期、短期两种不同类型的兴趣偏好，从而在结合目标兴趣特征进行推荐时，提高了对目标物品的推荐准确度。

在一种可能实施方式中，基于账号在历史互动行为中交互的多个物品，获取该账号的长期兴趣特征包括：

获取该多个物品各自对应的多个嵌入特征；

将该多个嵌入特征输入第一编码器，基于该账号的账号特征，获取该多个嵌入特征各自对应的多个第一权重参数；

基于该多个第一权重参数，分别对该多个嵌入特征进行加权，将加权后的多个嵌入特征进行融合，输出该长期兴趣特征。

在一种可能实施方式中，基于账号在历史互动行为中交互的多个物品，获取该账号的短期兴趣特征包括：

获取该多个物品各自对应的多个嵌入特征；

将该多个嵌入特征输入第二编码器，提取该多个嵌入特征各自对应的多个时序特征，对该多个时序特征进行加权池化，输出该短期兴趣特征。

在一种可能实施方式中，提取该多个嵌入特征各自对应的多个时序特征包括：

将该多个嵌入特征输入该第二编码器中的第一子编码器，对该多个嵌入特征进行编码，输出该多个时序特征。

在一种可能实施方式中，对该多个时序特征进行加权池化，输出该短期兴趣特征包括：

将该多个嵌入特征输入该第二编码器中的第二子编码器，提取该多个嵌入特征之间的特征变化信息；

基于该特征变化信息和该多个时序特征，获取该短期兴趣特征。

在一种可能实施方式中，基于该特征变化信息和该多个时序特征，获取该短期兴趣特征包括：

基于该特征变化信息，获取该多个时序特征各自对应的多个第二权重参数；

基于该多个第二权重参数，分别对该多个时序特征进行加权，将加权后的多个时序特征进行融合，得到该短期兴趣特征。

在一种可能实施方式中，该方法还包括：

基于样本账号在历史互动行为中交互的多个样本物品，获取该多个样本物品各自对应的多个样本嵌入特征；

将该多个样本嵌入特征分别输入第一初始编码器和第二初始编码器，输出该样本账号的样本长期兴趣特征和样本短期兴趣特征；

基于该样本长期兴趣特征、该样本短期兴趣特征、标准长期兴趣特征和标准短期兴趣特征，获取本次迭代过程的损失函数值，该标准长期兴趣特征为该多个样本嵌入特征的平均值，该标准短期兴趣特征为该多个样本物品中符合目标条件的部分物品的样本嵌入特征的平均值；

迭代训练该第一初始编码器和该第二初始编码器，直到符合停止条件，得到第一编码器和第二编码器，该第一编码器用于提取账号的长期兴趣特征，该第二编码器用于提取账号的短期兴趣特征。

在一种可能实施方式中，基于该样本长期兴趣特征、该样本短期兴趣特征、标准长期兴趣特征和标准短期兴趣特征，获取本次迭代过程的损失函数值包括：

获取第一相似度、第二相似度、第三相似度和第四相似度，该第一相似度为该样本长期兴趣特征和该标准长期兴趣特征之间的相似度，该第二相似度为该样本长期兴趣特征和该标准短期兴趣特征之间的相似度，该第三相似度为该样本短期兴趣特征和该标准短期兴趣特征之间的相似度，该第四相似度为该样本短期兴趣特征和该标准长期兴趣特征之间的相似度；

获取第一差值和第二差值，该第一差值为该第一相似度和该第二相似度之间的差值，该第二差值为该第三相似度和该第四相似度之间的差值；

基于该第一差值和该第二差值，获取该损失函数值。

在一种可能实施方式中，对该长期兴趣特征和该短期兴趣特征进行融合，得到该账号的目标兴趣特征包括：

获取该多个物品各自对应的多个嵌入特征；

基于该多个嵌入特征、该长期兴趣特征、该短期兴趣特征以及该目标物品的嵌入特征，获取该长期兴趣特征的第三权重参数和该短期兴趣特征的第四权重参数；

基于该第三权重参数和该第四权重参数，分别对该长期兴趣特征和该短期兴趣特征进行加权，将加权后的长期兴趣特征和加权后的短期兴趣特征融合得到该目标兴趣特征。

在一种可能实施方式中，基于该多个嵌入特征、该长期兴趣特征、该短期兴趣特征以及该目标物品的嵌入特征，获取该长期兴趣特征的第三权重参数和该短期兴趣特征的第四权重参数包括：

获取该多个嵌入特征之间的全局编码特征，该全局编码特征用于表征对该多个嵌入特征进行编码后的全局化信息；

对该长期兴趣特征、该短期兴趣特征、该全局编码特征以及该目标物品的嵌入特征进行加权，得到该第三权重参数和该第四权重参数。

在一种可能实施方式中，获取该多个嵌入特征之间的全局编码特征包括：

将该多个嵌入特征输入融合编码器，对该多个嵌入特征进行编码，得到隐向量序列，将该隐向量序列中的最后一个隐向量获取为该全局编码特征。

在一种可能实施方式中，对该长期兴趣特征、该短期兴趣特征、该全局编码特征以及该目标物品的嵌入特征进行加权，得到该第三权重参数和该第四权重参数包括：

将该长期兴趣特征、该短期兴趣特征、该全局编码特征以及该目标物品的嵌入特征进行拼接，得到拼接特征；

将该拼接特征输入权重预测模型，对该拼接特征进行加权处理，输出该第三权重参数和该第四权重参数，该第三权重参数和该第四权重参数之和为1。

在一种可能实施方式中，基于该目标兴趣特征和目标物品的嵌入特征，确定是否对该账号推荐该目标物品包括：

对该目标兴趣特征、该目标物品的嵌入特征以及该目标物品的上下文特征进行融合，得到目标融合特征，该上下文特征用于表征该账号在对该目标物品产生互动行为时的互动场景特征；

将该目标融合特征输入推荐模型，对该目标融合特征进行加权，输出该目标物品的推荐概率参数，该推荐概率参数用于表征该账号对该目标物品的偏好程度；

响应于该推荐概率参数符合推荐条件，确定对该账号推荐该目标物品；

响应于该推荐概率参数不符合该推荐条件，确定对该账号不推荐该目标物品。

在一种可能实施方式中，该推荐条件为该推荐概率参数大于推荐概率阈值；或，该推荐条件为在多个目标物品的多个推荐概率参数按照从大到小的排序中，该目标物品的该推荐概率参数位于该排序的前目标位。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

图3是根据一示例性实施例示出的一种物品推荐方法的流程图，如图3所示，物品推荐方法应用于电子设备，下面以电子设备为服务器为例进行说明，该实施例包括以下步骤。

在步骤301中，服务器基于账号在历史互动行为中交互的多个物品，获取该多个物品各自对应的多个嵌入特征，该嵌入特征用于表征对应物品的固有特性。

其中，该账号是指在服务器中注册过的任一账号，用户在通过终端注册账号后，可以在终端上启动应用程序并登录该账号，接着在应用程序中与物品发生互动行为，服务器记录该账号所发起的各个互动行为以及对应的各个物品，从而能够确认与账号已发生过互动行为的各个物品，这些物品可构成账号在历史互动行为中交互的物品序列。可选地，该互动行为包括但不限于：浏览、点击、收藏、消费(即购买)等，本公开实施例不对该互动行为的类型进行具体限定。

在一些实施例中，服务器在确认该多个物品之后，对该多个物品的物品信息进行嵌入(embedding)处理，得到该多个物品的多个embedding向量，将该多个embedding向量获取为该多个嵌入特征，使得能够将物品信息转换为易于计算机处理的向量表达。其中，该嵌入特征用于表征对应物品的固有特性，换言之，每个物品的嵌入特征仅有物品本身的固有特性而决定，不会随着其他因素而改变，不同的物品具有不同的嵌入特征。

可选地，该物品信息包括但不限于：物品名称、物品价格、物品详情、物品图片、物品标识(Identification，ID)、物品所属商家名称、物品所属商家详情、物品所属商家标识等，本公开实施例不对物品信息的内容进行具体限定。

可选地，除了利用嵌入特征代表物品的固有特性之外，服务器还可以对该多个物品的物品信息进行独热(one-hot)编码，得到该多个物品的多个one-hot向量，利用该多个one-hot向量来表示物品的固有特性，并在后续处理过程中采用one-hot向量来替换embedding向量，同样能够实现类似的物品推荐过程，在这种情况下，相较于embedding向量而言，获取one-hot向量时的计算复杂度较低。

在步骤302中，服务器将该多个嵌入特征输入第一编码器，输出该账号的长期兴趣特征。

其中，该第一编码器用于提取账号的长期兴趣特征。

其中，该长期兴趣特征用于表征该多个物品的全局特征，正是由于长期兴趣特征代表了整个历史互动行为所交互过的所有物品的全局特征，这一全局特征是不会随着短期内外界因素的影响而发生改变的，因此能够反映出账号所对应的用户自身长期养成的兴趣偏好。

在一些实施例中，服务器在获取该长期兴趣特征时，可以将该多个嵌入特征输入第一编码器，基于该账号的账号特征，获取该多个嵌入特征各自对应的多个第一权重参数；基于该多个第一权重参数，分别对该多个嵌入特征进行加权，将加权后的多个嵌入特征进行融合，输出该长期兴趣特征。其中，该第一权重参数是指在对各个嵌入特征进行加权时采用的权重参数。

可选地，在训练过程中服务器可以为每个账号随机初始化一个账号特征，并随着训练过程的迭代调参，随之修改各个账号的账号特征，直到训练完毕时，能够附带训练出与各个账号对应的账号特征，接着服务器可以在数据库中存储各个账号的账号特征，以便在线上预测时根据该账号的账号标识，从数据库中读取该账号的账号特征，此时能够节约线上预测时的计算量。

可选地，该账号特征可以是基于该账号的账号信息进行embedding处理所得的embedding向量，此时能够使得账号特征能够更加针对性地反映出账号自身的特性。可选地，该账号信息包括但不限于：账号标识、账号昵称、注册时间、账号所绑定的用户信息(须经过用户授权才可使用)、账号的日活跃度、账号的周活跃度等等，本公开实施例对此不进行具体限定。

在一些实施例中，服务器在获取第一权重参数时，可以对每个嵌入特征，获取每个嵌入特征与该账号特征之间的相似度，将该相似度作为每个嵌入特征对应的第一权重参数。可选地，该相似度包括但不限于：余弦相似度、欧氏距离的倒数、向量内积等，本申请实施例不对该相似度的形式进行具体限定。

在一些实施例中，服务器在获取相似度时，还可以对每个嵌入特征，将该账号特征和每个嵌入特征进行拼接，将拼接后所得到的特征输入到一个MLP(Multi-LayerPerceptron，多层感知机)模型中，由MLP模型对拼接后所得到的特征进行加权处理，将MLP模型中最后一个隐藏层的输出向量的维度设置为1，使得最后一个隐藏层能够直接输出该账号特征和每个嵌入特征之间的相似度。

可选地，上述各个嵌入特征的第一权重参数可以是经过归一化的第一权重参数，也即，所有嵌入特征的第一权重参数相加所得的数值为1，能够避免由于第一权重参数的取值过大或过小，导致过分放大或忽略嵌入特征中的细节信息。

在一些实施例中，服务器在获取长期兴趣特征时，可以将该多个嵌入特征分别与各自对应的第一权重参数相乘，得到加权后的多个嵌入特征，将该加权后的多个嵌入特征进行按元素相加，得到该长期兴趣特征。

可选地，除了按元素相加之外，服务器还可以对该加权后的多个嵌入特征进行按元素相乘、拼接(concat)、双线性汇合等融合操作，使得加权后的多个嵌入特征能够聚合成单个的长期兴趣特征，从而达到池化的效果，本公开实施例不对加权后的多个嵌入特征的融合方式进行具体限定。

在一个示例性场景中，该第一编码器为基于注意力(attention)的池化模型，第一编码器的输入包括该多个嵌入特征以及该账号的账号特征，第一编码器的输出包括该长期兴趣特征。服务器将该多个嵌入特征和该账号特征输入第一编码器后，第一编码器获取每个嵌入特征与该账号特征之间的相似度作为每个嵌入特征的第一权重参数，并按照第一权重参数对各自对应的嵌入特征进行加权求和(即采用按元素相加的融合方式)，输出求和得到的长期兴趣特征。

在上述过程中，通过第一编码器对各个物品的嵌入特征计算第一权重参数后，利用第一权重参数对各个物品的嵌入特征进行加权，并将加权后的嵌入特征聚合成一个长期兴趣特征，使得长期兴趣特征不仅能够反映出各个物品的嵌入特征，而且还通过引入账号特征，使得在融合各个物品的嵌入特征时提供一种基于注意力机制的第一权重参数，使得长期兴趣特征具有更好的表达能力。

在步骤303中，服务器将该多个嵌入特征输入第二编码器，提取该多个嵌入特征各自对应的多个时序特征，对该多个时序特征进行加权池化，输出该账号的短期兴趣特征。

其中，该第二编码器用于提取账号的短期兴趣特征。

其中，该短期兴趣特征用于表征该多个物品中符合目标条件的部分物品的局部特征，正是由于短期兴趣特征代表了历史互动行为中部分物品的局部特征，这一局部特征是会随着短期内外界因素的影响而发生改变的，因此能够反映出账号所对应的用户受到外界因素的影响所呈现出的暂时性的兴趣偏好。

可选地，该目标条件是指在按照与该账号产生互动行为的时间戳从小到大的顺序进行排序的物品序列中位于最后的K(K≥1)位，也即，符合该目标条件的部分物品是指与该账户最近产生过互动行为的K个物品。

可选地，该目标条件还可以是指与该账号产生互动行为的时间戳与当前时刻之间的时间差小于互动采样阈值，该互动采样阈值为任一大于0的数值，例如，当互动采样阈值为1天时，符合该目标条件的部分物品是指该账号在最近1天内产生过互动行为的各个物品，本公开实施例不对该目标条件进行具体限定。

在一些实施例中，第二编码器包括第一子编码器和第二子编码器，该第一子编码器用于提取该多个时序特征，该第二子编码器用于提取该多个嵌入特征之间的特征变化信息。

基于上述第二编码器的架构，图4是本公开实施例提供的一种获取短期兴趣特征的流程图，请参考图4，服务器获取短期兴趣特征时可以执行下述步骤3031-3034：

在步骤3031中，服务器将该多个嵌入特征输入该第二编码器中的第一子编码器，对该多个嵌入特征进行编码，输出该多个时序特征。

可选地，该第一子编码器可以是任一具有编解码(Encoder-Decoder)结构的序列到序列(Sequence To Sequence，Seq2Seq)模型，例如，RNN(Recurrent Neural Network，循环神经网络)、GRU(Gated Recurrent Unit，门循环单元)、LSTM(Long Short-Term Memory，长短期记忆网络)、BLSTM(Bidirectional Long Short-Term Memory，双向长短期记忆网络)等，本公开实施例不对该第一子编码器的结构进行具体限定。

下面以第一子编码器为RNN模型为例进行说明，RNN模型包括至少一个隐藏层，每个隐藏层中包括至少一个神经元，不但隐藏层与隐藏层之间建立了“层与层”的权值连接关系，且每个隐藏层内部的神经元与神经元之间也建立了链式的“层内”权值连接关系。RNN模型的输入是该多个嵌入特征所构成的嵌入特征序列，RNN模型的输出则是对该多个嵌入特征进行编码后所得的多个时序特征所构成的时序特征序列。

可选地，对于RNN模型的每个隐藏层中的每个神经元，以当前隐藏层内上一个神经元的输出特征图(feature map)以及上一个隐藏层中对应位置的神经元的输出特征图作为输入，同时将本神经元的输出特征图输入到当前隐藏层内的下一神经元以及下一隐藏层中对应位置的神经元，从而便于提取出各个嵌入特征之间的时序关联信息。

在一些实施例中，对任一隐藏层中的任一个神经元，服务器可以通过该任一个神经元，利用训练时得到的权重矩阵，对当前隐藏层内上一个神经元的输出特征图以及上一个隐藏层中对应位置的神经元的输出特征图进行加权并融合，得到该任一个神经元的输出特征图。服务器对每个隐藏层中的每个神经元均执行上述操作，将最后一个隐藏层中各个神经元的输出特征图获取为该多个时序特征。

可选地，每个神经元在对当前隐藏层内上一个神经元的输出特征图以及上一个隐藏层中对应位置的神经元的输出特征图进行加权时，可以基于权重共享机制，采取相同的权重矩阵进行加权，或者，也可以采取不同的权重矩阵分别进行加权，本公开实施例对此不进行具体限定。

需要说明的是，在本公开实施例中仅以第一子编码器为RNN模型为例进行说明，但第一子编码器也可以是LSTM模型、BLSTM模型等，本公开实施例不对此进行具体限定。

在上述过程中，通过第一子编码器对各个嵌入特征进行编码，使得输出的各个时序特征实际上反映了各个嵌入特征在编码过程的时序关联信息，从而提升了各个时序特征的表达能力。

在步骤3032中，服务器将该多个嵌入特征输入该第二编码器中的第二子编码器，提取该多个嵌入特征之间的特征变化信息。

可选地，该第二子编码器可以是任一具有编解码结构的Seq2Seq模型，例如，GRU、RNN、LSTM、BLSTM等，本公开实施例不对该第二子编码器的结构进行具体限定。

下面以第二子编码器为GRU模型为例进行说明，GRU模型是LSTM模型的一种变体，相较于LSTM模型具有更简单的结构和更好的特征提取效果，且能够解决RNN模型中的长依赖问题、梯度消失问题。GRU模型的输入仍然是一个嵌入特征序列(即该多个嵌入特征按照时序所形成的序列)，GRU模型的输出则是一个隐向量序列，隐向量序列中的每个元素也即是对输入的嵌入特征序列中的每个嵌入特征进行编码后所得到的隐向量，而本公开实施例是取输出的隐向量序列中的最后一个隐向量作为该特征变化信息，能够简化特征变化信息的获取流程。在一些实施例中，还可以取该隐向量序列中各个隐向量的平均向量作为该特征变化信息，本公开实施例对此不进行具体限定。

可选地，在该GRU模型中包括至少一个隐藏层，在每个隐藏层中包括至少一个记忆单元，每个记忆单元以当前隐藏层内上一个记忆单元的输出隐向量以及上一隐藏层中对应位置的记忆单元的输出隐向量作为输入，同时将本记忆单元的输出隐向量输入到当前隐藏层内下一记忆单元以及下一隐藏层中对应位置的记忆单元。这样可以达到在对序列化的输入信号(嵌入特征序列)进行编码时，引入上一状态的相关信息，以便于提取出所有嵌入特征之间的特征变化信息。

在一些实施例中，对任一个隐藏层中的任一个记忆单元，服务器可以通过该任一个记忆单元，基于门控机制来对当前隐藏层内上一个记忆单元的输出隐向量以及上一隐藏层中对应位置的记忆单元的输出隐向量进行加权并融合，得到该任一个记忆单元的输出隐向量。服务器对每个隐藏层中的每个记忆单元均执行上述操作，将最后一个隐藏层中最后一个记忆单元的输出隐向量获取为该特征变化信息。

可选地，在GRU模型的每个记忆单元中，通过重置门和更新门来实现上述门控机制。重置门用于控制上一个记忆单元的输出隐向量有多大程度更新到当前记忆单元在计算输出隐向量时的候选状态，换言之，重置门主要决定了到底有多少过去的信息需要被遗忘。更新门用于控制上一个记忆单元的输出隐向量有多大程度更新到当前记忆单元的输出隐向量，换言之，更新门用于控制到底有多少过去的信息需要被传递到未来。

可选地，重置门和更新门两者均可以是一个Sigmoid函数，两者的输入均为当前隐藏层内上一个记忆单元的输出隐向量以及上一隐藏层中对应位置的记忆单元的输出隐向量，但由于两者Sigmoid函数的参数不同，导致重置门和更新门分别输出不同的激活向量。接下来，可以将重置门输出的激活向量与当前隐藏层内上一个记忆单元的输出隐向量进行按元素相乘，得到一个Hadamard(哈达玛)乘积向量，将Hadamard乘积向量再与上一隐藏层中对应位置的记忆单元的输出隐向量进行按元素相加，得到一个中间向量，将中间向量输入至tanh函数中进行激活，输出目标激活向量。接下来，获取1与更新门输出的激活向量相减所得的第一向量，将该第一向量与该中间向量进行按元素相乘，得到第二向量，此外，将更新门输出的激活向量与当前隐藏层内上一个记忆单元的输出隐向量进行按元素相乘，得到第三向量，将第二向量与第三向量进行按元素相加，即可得到当前记忆单元的输出隐向量。

需要说明的是，在本公开实施例中仅以第二子编码器为GRU模型为例进行说明，但第二子编码器也可以是LSTM模型、BLSTM模型等，本公开实施例不对此进行具体限定。

在步骤3033中，服务器基于该特征变化信息，获取该多个时序特征各自对应的多个第二权重参数。

在一些实施例中，服务器在获取第二权重参数时，可以对每个时序特征，获取每个时序特征与该特征变化信息之间的相似度，将该相似度作为每个时序特征对应的第二权重参数。可选地，该相似度包括但不限于：余弦相似度、欧氏距离的倒数、向量内积等，本申请实施例不对该相似度的形式进行具体限定。其中，该第二权重参数是指在下述步骤3034中对各个时序特征进行加权时采用的权重参数。

在一些实施例中，服务器在获取相似度时，还可以对每个时序特征，将该特征变化信息和每个时序特征进行拼接，将拼接后所得到的特征输入到一个MLP模型中，由MLP模型对拼接后所得到的特征进行加权处理，将MLP模型中最后一个隐藏层的输出向量的维度设置为1，使得最后一个隐藏层能够直接输出该特征变化信息和每个时序特征之间的相似度。

可选地，上述各个时序特征的第二权重参数可以是经过归一化的第二权重参数，也即，所有时序特征的第二权重参数相加所得的数值为1，能够避免由于第二权重参数的取值过大或过小，导致过分放大或忽略时序特征中的细节信息。

在步骤3034中，服务器基于该多个第二权重参数，分别对该多个时序特征进行加权，将加权后的多个时序特征进行融合，得到该短期兴趣特征。

在一些实施例中，服务器在获取短期兴趣特征时，可以将该多个时序特征分别与各自对应的第二权重参数相乘，得到加权后的多个时序特征，将该加权后的多个时序特征进行按元素相加，得到该短期兴趣特征。

可选地，除了按元素相加之外，服务器还可以对该加权后的多个时序特征进行按元素相乘、拼接(concat)、双线性汇合等融合操作，使得加权后的多个时序特征能够聚合成单个的短期兴趣特征，从而达到池化的效果，本公开实施例不对加权后多个时序特征的融合方式进行具体限定。

在上述步骤3033-3034中，示出了基于该特征变化信息和该多个时序特征，获取该短期兴趣特征的一种可能实施方式。也即，相当于将该特征变化信息和该多个时序特征输入至一个基于注意力的池化模型，并通过该基于注意力的池化模型，对该多个时序特征进行加权池化，输出该短期兴趣特征，从而能够使得短期兴趣特征中充分融合了各个时序特征及其特征变化信息，大大提升了短期兴趣特征的表达能力。

在上述过程中，由于针对时序特征和特征变化信息分别进行建模，也即利用第一子编码器来提取该多个时序特征，利用第二子编码器来提取特征变化信息，使得时序特征和特征变化信息具有更强的表达能力，使得短期兴趣特征具有更好的代表性，有利于提高后续物品推荐的准确度。

在一些实施例中，服务器也可以训练一个整体的具有编解码结构的Seq2Seq模型来宏观地提取该短期兴趣特征，从而能够简化短期兴趣特征的提取流程，本公开实施例不对该短期兴趣特征的提取方式进行具体限定。

在上述步骤301-303中，示出了账号在历史互动行为中交互的多个物品，获取该账号的长期兴趣特征和短期兴趣特征的一种可能实施方式。也即，分别利用第一编码器提取长期兴趣特征，利用第二编码器提取短期兴趣特征，由于第一编码器和第二编码器各自具有较强的特征提取的针对能力，使得提取出的长期兴趣特征能够表征出账号对各个物品的长期兴趣偏好(账号自身长期养成的兴趣偏好，不受外界因素影响)，而提取出的短期兴趣特征能够表征出对各个物品的短期兴趣偏好(账号因遭受外界因素影响所产生的暂时性的兴趣偏好)。

在步骤304中，服务器获取该多个嵌入特征之间的全局编码特征，该全局编码特征用于表征对该多个嵌入特征进行编码后的全局化信息。

在一些实施例中，服务器可以基于融合编码器来提取该全局编码特征，其中，该融合编码器用于提取该全局编码特征。可选地，该融合编码器可以是任一具有编解码结构的Seq2Seq模型，例如，GRU、RNN、LSTM、BLSTM等，本公开实施例不对该融合编码器的结构进行具体限定。

下面以融合编码器为GRU模型为例进行说明，GRU模型的输入是该多个嵌入特征按照时序所形成的嵌入特征序列，输出则是一个隐向量序列，隐向量序列中的每个元素也即是对输入的嵌入特征序列中的每个嵌入特征进行编码后所得到的隐向量。

在一些实施例中，服务器将该多个嵌入特征输入融合编码器，对该多个嵌入特征进行编码，得到隐向量序列，可选地，服务器将输出的隐向量序列中的最后一个隐向量获取为该全局编码特征，能够简化全局编码特征的获取流程。在一些实施例中，还可以取该隐向量序列中各个隐向量的平均向量作为该全局编码特征，本公开实施例对此不进行具体限定。其中，GRU模型的结构与功能在上述步骤3032中已经给出了详细介绍，融合编码器和第二子编码器可以具有不同的参数，因此这里不做赘述。

需要说明的是，在本公开实施例中仅以融合编码器为GRU模型为例进行说明，但融合编码器也可以是LSTM模型、BLSTM模型等，本公开实施例不对此进行具体限定。

在步骤305中，服务器对该长期兴趣特征、该短期兴趣特征、该全局编码特征以及目标物品的嵌入特征进行加权，得到该长期兴趣特征的第三权重参数和该短期兴趣特征的第四权重参数。

其中，该目标物品是指本次待推荐的物品。

在一些实施例中，服务器可以基于权重预测模型来预测该第三权重参数和该第四权重参数，其中，该权重预测模型用于预测该第三权重参数和该第四权重参数。

在一些实施例中，服务器将该长期兴趣特征、该短期兴趣特征、该全局编码特征以及该目标物品的嵌入特征进行拼接，得到拼接特征，将该拼接特征输入至该权重预测模型，通过该权重预测模型对该拼接特征进行加权处理，输出该第三权重参数和该第四权重参数。

在上述过程中，通过权重预测模型来获取第三权重参数和第四权重参数，使得第三权重参数和第四权重参数综合考量了账号的长期兴趣特征、短期兴趣特征以及全局编码特征，并且还考虑了目标物品的嵌入特征，这意味着，即使针对同一账号进行推荐，由于待推荐的目标物品是不同的，那么会导致第三权重参数和第四权重参数也不同，使得第三权重参数和第四权重参数更加精准和智能化。比如，对于较符合账号的长期兴趣偏好的目标物品，那么通常会赋予长期兴趣特征的第三权重参数较大的取值，同理，对于较符合账号的短期兴趣偏好的目标物品，那么通常会赋予短期兴趣特征的第四权重参数较大的取值。

可选地，该第三权重参数和该第四权重参数相加所得数值为1，此时该权重预测模型可以仅输出第三权重参数或者第四权重参数中的一项，再将1减去模型输出的参数，即可得到剩余的一项的取值。

可选地，除了采用拼接方式之外，服务器还可以将该长期兴趣特征、该短期兴趣特征、该全局编码特征以及该目标物品的嵌入特征进行按元素相加、按元素相乘、双线性汇合等方式进行融合，并将融合得到的特征输入至该权重预测模型，本申请实施例对此不进行具体限定。

可选地，该权重预测模型可以是任一能够预测权重参数的神经网络模型，例如，该权重预测模型可以是MLP、DNN(Deep Neural Network，深度神经网络)、注意力网络(Attention Network)等。

下面以该权重预测模型为MLP模型为例进行说明，MLP模型包括输入层、至少一个隐藏层和输出层，每个隐藏层中包括至少一个神经元，在MLP模型中，输入层、各个隐藏层以及输出层中层与层之间是全连接的，全连接的含义也即上一层中的任何一个神经元与下一层中的所有神经元均存在权值连接关系。MLP模型的输入是对该长期兴趣特征、该短期兴趣特征、该全局编码特征以及该目标物品的嵌入特征拼接所得的拼接特征，MLP模型的输出则是第三权重参数。

可选地，对于MLP模型中每个隐藏层中的每个神经元，以上一隐藏层内所有神经元的输出向量作为输入，同一将本神经元的输出向量输入到下一隐藏层内的所有神经元，便于在层与层之间充分传递全量的相关信息，以提高权重预测模型对第三权重参数的预测准确度。

在一些实施例中，对任一隐藏层中的任一个神经元，服务器可以通过该任一个神经元，利用训练时得到的权重矩阵，对上一隐藏层内所有神经元的输出向量进行加权并融合，得到该任一个神经元的输出向量。服务器对每个隐藏层中的每个神经元均执行上述操作，并将最后一个隐藏层的输出向量的维度设置1，使得最后一个隐藏层能够直接输出该第三权重参数，接着，将1减去第三权重参数所得的数值获取为第四权重参数。

需要说明的是，这里仅以MLP输出第三权重参数，并将1减去第三权重参数所得的数值获取为第四权重参数为例进行说明，在一些实施例中，也可以由MLP模型输出第四权重参数，并将1减去第四权重参数所得的数值获取为第三权重参数，在另一些实施例中，还可以由MLP模型直接输出第三权重参数和第四权重参数，且保证第三权重参数和第四权重参数相加所得的数值为1，本公开实施例对此不进行具体限定。

在上述步骤304-305中，示出了基于该多个嵌入特征、该长期兴趣特征、该短期兴趣特征以及该目标物品的嵌入特征，获取该长期兴趣特征的第三权重参数和该短期兴趣特征的第四权重参数的一种可能实施方式。由于利用权重预测模型来获取该第三权重参数和第四权重参数，该第三权重参数可以视为长期兴趣特征的注意力系数，该第四权重参数可以视为该短期兴趣特征的注意力系数，因此该权重预测模型可以视为一个注意力网络(Attention Network)，通过这一注意力网络能够精准预估出长期兴趣特征和短期兴趣特征各自的注意力系数，使得后续两者融合得到目标兴趣特征时，能够更好地分配各自的占比。

在一些实施例中，还可以将该多个嵌入特征、该长期兴趣特征、该短期兴趣特征以及该目标物品的嵌入特征输入一个单层的全连接网络，通过该全连接网络来预测该第三权重参数，并将1减去第三权重参数所得的数值获取为第四权重参数，从而能够简化第三权重参数和第四权重参数的获取流程，本申请实施例对此不进行具体限定。

在步骤306中，服务器基于该第三权重参数和该第四权重参数，分别对该长期兴趣特征和该短期兴趣特征进行加权，将加权后的长期兴趣特征和加权后的短期兴趣特征融合得到该账号的目标兴趣特征。

在一些实施例中，服务器可以将该第三权重系数与该长期兴趣特征相乘，得到加权后的长期兴趣特征，将该第四权重参数与该短期兴趣特征相乘，得到加权后的短期兴趣特征，将加权后的长期兴趣特征和加权后的短期兴趣特征进行按元素相加，得到该目标兴趣特征。

可选地，按元素相加仅仅是对加权后的长期兴趣特征和加权后的短期兴趣特征进行融合的一种可能实施方式，除此以外，还可以通过按元素相乘、拼接、双线性汇合等方式来进行融合，本公开实施例对此不进行具体限定。

在上述步骤304-306中，服务器对该长期兴趣特征和该短期兴趣特征进行融合，得到该账号的目标兴趣特征的一种可能实施方式，使得目标兴趣特征不但能够通过长期兴趣特征引入账号的自身长期养成的兴趣偏好，而且能够通过短期兴趣特征引入账号的短期内受到外界因素影响而产生的兴趣偏好，并且，由于在计算第三权重参数和第四权重参数时，来使用目标物品的嵌入特征作为该权重预测模型的一个输入项，使得，对于不同的目标物品，可以自适应地调整与之匹配的第三权重参数和第四权重参数，从而能够大大提高目标兴趣特征的表达能力，有利于提高后续物品推荐的准确性。

在一个示例性场景中，假设账号在历史互动行为中交互的多个物品包括：手机A、手机B、衣服C、手机D、手机E、食品F、食品G，可以看出，“手机”代表了账号的长期兴趣偏好，“食品”代表了账号的短期兴趣偏好，假设待推荐的目标物品为手机，那么理应为表征该账号的长期兴趣偏好的长期兴趣特征赋予更高的权重，也即，此时第三权重参数应该至少大于第四权重参数，反之，如果待推荐的目标物品为食品，那么理应为表征该账号的短期兴趣偏好的短期兴趣特征赋予更高的权重，也即，此时第四权重参数应该至少大于第三权重参数。

在步骤307中，服务器对该目标兴趣特征、该目标物品的嵌入特征以及该目标物品的上下文特征进行融合，得到目标融合特征。

其中，该上下文特征用于表征该账号在对该目标物品产生互动行为时的互动场景特征。

可选地，服务器对该账号的上下文信息进行embedding处理，将处理得到的embedding向量获取为该上下文特征，例如，该上下文信息包括但不限于：该账号在对该目标物品产生互动行为时的日期、时间、地理位置等，本公开实施例不对该上下文信息进行具体限定。

在一些实施例中，服务器可以将该目标兴趣特征、该目标物品的嵌入特征和该上下文特征进行拼接，得到该目标融合特征，从而能够简化获取目标融合特征时的计算量。

在一些实施例中，服务器可以将该目标兴趣特征、该目标物品的嵌入特征和该上下文特征进行按元素相加、按元素相乘或者双线性汇合等，得到该目标融合特征，本公开实施例不对该目标融合特征的获取方式进行具体限定。

在步骤308中，服务器将该目标融合特征输入推荐模型，对该目标融合特征进行加权，输出该目标物品的推荐概率参数。

其中，该推荐概率参数用于表征该账号对该目标物品的偏好程度，这一偏好程度是综合了账号的长期偏好和短期偏好所预测出来的一个概率参数。

可选地，服务器将该目标融合特征输入该推荐模型，通过该推荐模型对该目标融合特征进行加权处理，输出该推荐概率参数。可选地，该推荐模型可以是任一能够预测概率参数的神经网络模型，例如，该推荐模型可以是MLP、DNN、注意力网络等，本公开实施例不对该推荐模型类型进行具体限定。

下面以该推荐模型为MLP模型为例进行说明，MLP模型的结构已经在上述步骤305中进行过详细说明，因此这里不做赘述。推荐模型的输入是目标融合特征，推荐模型的输出则是推荐概率参数。

可选地，对于MLP模型中每个隐藏层中的每个神经元，以上一隐藏层内所有神经元的输出向量作为输入，同一将本神经元的输出向量输入到下一隐藏层内的所有神经元，便于在层与层之间充分传递全量的相关信息，以提高推荐模型对推荐概率参数的预测准确度。

在一些实施例中，对任一隐藏层中的任一个神经元，服务器可以通过该任一个神经元，利用训练时得到的权重矩阵，对上一隐藏层内所有神经元的输出向量进行加权并融合，得到该任一个神经元的输出向量。服务器对每个隐藏层中的每个神经元均执行上述操作，并将最后一个隐藏层的输出向量的维度设置1，使得最后一个隐藏层能够直接输出该推荐概率参数。

在步骤309中，服务器响应于该推荐概率参数符合推荐条件，确定对该账号推荐该目标物品。

可选地，该推荐条件为该推荐概率参数大于推荐概率阈值；或，该推荐条件为在多个目标物品的多个推荐概率参数按照从大到小的排序中，该目标物品的该推荐概率参数位于该排序的前目标位。其中，该推荐概率阈值是任一大于或等于0且小于或等于1的数值。

在一些实施例中，服务器响应于该推荐概率参数大于该推荐概率阈值，向该账号推荐该目标物品，也即，服务器向该账号所登录的终端发送该目标物品的物品信息，以使得该终端显示该目标物品的物品信息。上述基于推荐概率阈值所判定的推荐条件，使得推荐条件的判定过程具有较低的计算量，加快了对物品的推荐速率。

在一些实施例中，对于多个不同的目标物品，服务器重复多次执行上述步骤301-308，得到多个目标物品的多个推荐概率参数，接着，将该多个推荐概率参数按照从大到小的顺序进行排序，如果本次目标物品的推荐概率参数位于排序的前目标位(例如前N位，N≥1)，则向该账号推荐该目标物品，也即，服务器向该账号所登录的终端发送该目标物品的物品信息，以使得该终端显示该目标物品的物品信息。上述基于推荐概率参数的排位(rank)所判定的推荐条件，使得能够宏观调控每次向终端推荐目标物品的数量，使得物品推荐的数量相对来说具有更好的可控性。

上述步骤309仅示出了服务器在该推荐概率参数符合推荐条件时的处理逻辑，在一些实施例中，服务器响应于该推荐概率参数不符合该推荐条件，确定对该账号不推荐该目标物品，这种情况下，服务器可以对下一个目标物品，返回步骤301重复执行，直到找到满足推荐条件的目标物品，并向该账号进行目标物品的推荐工作，本公开实施例对此不进行具体限定。

在上述步骤307-309中，服务器基于该目标兴趣特征和目标物品的嵌入特征，确定是否对该账号推荐该目标物品。在上述过程中，通过推荐模型不但结合目标兴趣特征和目标物品的嵌入特征进行物品推荐，还融合了目标物品的上下文特征，使得推荐过程具有更高的准确度，在一些实施例中，还可以不利用该上下文特征，也即直接将该目标兴趣特征和该目标物品的嵌入特征进行融合，得到目标融合特征，并将目标融合特征输入推荐模型来预测该推荐概率参数，从而能够简化推荐模型的计算复杂度。

图5是本申请实施例提供的一种物品推荐方法的原理性示意图，请参考图5，示出了该物品推荐方法的因果学习框架，其中，U代表User(用户，即用户所对应的账号)，U_l代表用户的长期兴趣偏好(即账号的长期兴趣特征)，U_s代表用户的短期兴趣偏好(即账号的短期兴趣特征)，t代表时间戳(Timestamp)，V代表目标物品(Item)，Y代表用户、用户的长期兴趣偏好、用户的短期兴趣偏好以及目标物品之间的交互(Interaction)特征，Y即账号的目标兴趣特征。

可以看出，对于t时刻来说，用户的长期兴趣偏好U_l是用户兴趣中较为稳定不变的部分，因此由用户U本身来决定(而与时序无关)，也即，长期兴趣特征取决于账号特征；用户的短期兴趣偏好U_s是用户兴趣中较为动态变化的部分，因此t时刻用户的短期兴趣

由用户U本身、用户上一时刻的短期兴趣

以及上一时刻的交互特征Y^(t-1)共同决定，也即，短期兴趣特征取决于各个嵌入特征之间的特征变化信息；用户的交互特征Y则是用户的长期兴趣偏好U_l、短期兴趣偏好U_s以及目标物品V之间的匹配过程，因此t时刻用户的交互特征Y^(t)由用户U本身、用户的长期兴趣偏好U_l、t时刻用户的短期兴趣

以及t时刻的目标物品V^(t)共同决定，也即，目标兴趣特征取决于长期兴趣特征、短期兴趣特征以及目标物品的嵌入特征。通过分析长期兴趣偏好、短期兴趣偏好、交互特征的影响因素，即可明晰用户兴趣的演化过程，刻画出了用户的长期兴趣偏好、短期兴趣偏好与交互特征之间的关系，还描述了用户的长期兴趣偏好与短期兴趣偏好之间的区别。

图6是本申请实施例提供的一种物品推荐方法的原理性示意图，请参考图6，推荐系统中包括：第一编码器601、第二编码器602、融合预测GRU模型603(即融合编码器)、注意力网络604(即权重预测模型)和MLP模型605(即推荐模型)。其中，第二编码器602包括RNN模型6021(即第一子编码器)和演化GRU模型6022(即第二子编码器)。

在此基础上，对于嵌入特征序列

t代表时刻，u代表账号所对应的用户，分别使用两个独立的编码器601和602分别提取长期兴趣特征

和短期兴趣特征

长期兴趣特征

用于表征账号所对应用户的长期兴趣偏好，短期兴趣特征

用于表征账号所对应用户的短期兴趣偏好。

第一编码器601采用了基于注意力的池化模型，利用账号的账号特征U_l来对嵌入特征序列

进行加权池化，输出长期兴趣特征

第二编码器602则包括RNN模型6021和演化GRU模型6022，也即在RNN模型6021的基础上，采用了一个独立的演化GRU模型6022来建模用户的短期兴趣的演化信息

(即特征变化信息)，RNN模型6021用于对嵌入特征序列

进行编码，得到时序特征序列，此外还叠加了一个基于注意力的池化模型，用于基于特征变化信息

对RNN模型6021输出的时序特征序列进行加权池化，输出短期兴趣特征

融合预测GRU模型603是一个单独的GRU模型，用于从嵌入特征序列

中提取全局编码特征，该全局编码特征也即融合预测GRU模型603输出的最终时刻的隐向量表示。

接着，再将全局编码特征、第一编码器601输出的长期兴趣特征

第二编码器602输出的短期兴趣特征

以及目标物品的嵌入特征进行融合，将融合后得到的特征输入到注意力网络604中，注意力网络604为一个MLP模型，输出第三权重参数α和第四权重参数1-α。

接着，利用第三权重参数α和第四权重参数1-α，对长期兴趣特征

和短期兴趣特征

进行加权求和，得到目标兴趣特征，相当于对用户的长期兴趣偏好和短期兴趣偏好进行融合，而融合时的权重则是注意力网络604预测的数值(是一个0到1之间的数值)。

而最终对目标物品的推荐概率参数，将通过目标兴趣特征、目标物品的嵌入特征以及上下文特征进行融合，将融合所得的目标融合特征输入到MLP模型605中，由MLP模型605预测该目标物品的推荐概率参数。

在本申请实施例中，通过第一编码器601和第二编码器602，能够为用户的长期兴趣偏好和用户短期兴趣偏好，学习出一种解纠缠的表示特征，即，长期兴趣特征针对长期兴趣偏好建模，而不突出对于短期兴趣偏好的局部信息，短期兴趣特征针对短期兴趣偏好建模，而不突出对于长期兴趣偏好的全局信息，此外，同时考虑到嵌入特征序列和目标物品，通过注意力网络604自适应地决定长期兴趣偏好的重要性(第三权重参数)以及短期兴趣偏好的重要性(第四权重参数)，使得长短期兴趣偏好的融合过程具有更高的准确度，并在此基础上建模了用户长短期兴趣偏好的推荐系统，使得推荐系统不仅能够向用户所对应账号推荐符合短期兴趣偏好的目标物品，还能够向用户所对应账号推荐符合长期兴趣偏好的目标物品，大大提高了物品推荐准确度。

此外，图6中还示出了在对第一编码器601和第二编码器602进行训练时所采用的损失函数，即，在训练过程中，该嵌入特征序列包括多个样本物品的多个样本嵌入特征，由于长期兴趣偏好代表用户的一般性的兴趣，因此可以取整个嵌入特征序列中所有样本嵌入特征的均值作为第一编码器601输出的标准值

(即标准长期兴趣特征)，由于短期兴趣偏好代表用户在短期互动中体现出的动态变化的兴趣，因此可以取嵌入特征序列中距离t-1时刻最近的k(k≥1)个样本嵌入特征的均值作为第二编码器602输出的标准值

(即标准短期兴趣特征)。进一步地，可以采用自监督的方式学习推荐系统中各个模型的模型参数，例如，将第一编码器601输出的样本长期兴趣特征和标准长期兴趣特征、第二编码器602输出的样本短期兴趣特征和标准短期兴趣特征进行相似度对比学习，获取每次迭代过程的损失函数值(即对比损失)，如果损失函数值不符合停止条件，调整推荐系统内各个模型的模型参数，迭代进行训练，并获取下一次迭代过程的参数函数值，直到损失函数值符合停止条件时，停止训练。对比学习的方式将在下一个实施例中进行详述。

图7是本申请实施例提供的一种物品推荐方法的训练流程图，请参考图7，该实施例应用于电子设备，以电子设备为服务器为例进行说明，该实施例包括：

在步骤701中，服务器基于样本账号在历史互动行为中交互的多个样本物品，获取该多个样本物品各自对应的多个样本嵌入特征。

上述步骤701与上述步骤301类似，这里不做赘述。

在步骤702中，服务器获取标准长期兴趣特征和标准短期兴趣特征，该标准长期兴趣特征为该多个样本嵌入特征的平均值，该标准短期兴趣特征为该多个样本物品中符合目标条件的部分物品的样本嵌入特征的平均值。

可选地，服务器将该多个样本嵌入特征的平均值获取为该标准长期兴趣特征。

可选地，服务器将该多个样本物品中符合目标条件的部分物品的样本嵌入特征的平均值获取为该标准短期兴趣特征。

在步骤703中，服务器将该多个样本嵌入特征分别输入第一初始编码器和第二初始编码器，输出该样本账号的样本长期兴趣特征和样本短期兴趣特征。

可选地，服务器将该多个样本嵌入特征输入该第一初始编码器，输出该样本账号的样本长期兴趣特征。获取样本长期兴趣特征的过程与上述步骤302类似，这里不做赘述。

可选地，服务器将该多个样本嵌入特征输入该第二初始编码器，提取该多个样本嵌入特征各自对应的多个样本时序特征，对该多个样本时序特征进行加权池化，输出该样本账号的样本短期兴趣特征。获取样本短期兴趣特征的过程与上述步骤303类似，这里不做赘述。

在步骤704中，服务器获取第一相似度、第二相似度、第三相似度和第四相似度。

其中，第一相似度为该样本长期兴趣特征与该标准长期兴趣特征之间的相似度，第一相似度越大，代表样本长期兴趣特征与标准长期兴趣特征之间越相似，第一相似度越小，代表样本长期兴趣特征与标准长期兴趣特征之间差别越大。

可选地，服务器将该样本长期兴趣特征与该标准长期兴趣特征之间的向量内积获取为该第一相似度。

可选地，服务器将该样本长期兴趣特征与该标准长期兴趣特征之间的余弦相似度获取为该第一相似度。

可选地，服务器将该样本长期兴趣特征与该标准长期兴趣特征之间的欧氏距离的倒数获取为该第一相似度。

可选地，服务器将该样本长期兴趣特征与该标准长期兴趣特征进行拼接，将拼接后所得到的特征输入到一个MLP模型，通过MLP模型对拼接后所得到的特征进行加权处理，并将最后一个隐藏层的输出向量的维度设置为1，使得最后一个隐藏层能够直接输出该第一相似度。

其中，第二相似度为该样本长期兴趣特征与该标准短期兴趣特征之间的相似度，第二相似度越大，代表样本长期兴趣特征与该标准短期兴趣特征之间越相似，第二相似度越小，代表样本长期兴趣特征与该标准短期兴趣特征之间差别越大。

可选地，服务器将该样本长期兴趣特征与该标准短期兴趣特征之间的向量内积获取为该第二相似度。

可选地，服务器将该样本长期兴趣特征与该标准短期兴趣特征之间的余弦相似度获取为该第二相似度。

可选地，服务器将该样本长期兴趣特征与该标准短期兴趣特征之间的欧氏距离的倒数获取为该第二相似度。

可选地，服务器将该样本长期兴趣特征与该标准短期兴趣特征进行拼接，将拼接后所得到的特征输入到一个MLP模型，通过MLP模型对拼接后所得到的特征进行加权处理，并将最后一个隐藏层的输出向量的维度设置为1，使得最后一个隐藏层能够直接输出该第二相似度。

其中，第三相似度为该样本短期兴趣特征与该标准短期兴趣特征之间的相似度，第三相似度越大，代表样本短期兴趣特征与标准短期兴趣特征之间越相似，第三相似度越小，代表样本短期兴趣特征与标准短期兴趣特征之间差别越大。

可选地，服务器将该样本短期兴趣特征与该标准短期兴趣特征之间的向量内积获取为该第三相似度。

可选地，服务器将该样本短期兴趣特征与该标准短期兴趣特征之间的余弦相似度获取为该第三相似度。

可选地，服务器将该样本短期兴趣特征与该标准短期兴趣特征之间的欧氏距离的倒数获取为该第三相似度。

可选地，服务器将该样本短期兴趣特征与该标准短期兴趣特征进行拼接，将拼接后所得到的特征输入到一个MLP模型，通过MLP模型对拼接后所得到的特征进行加权处理，并将最后一个隐藏层的输出向量的维度设置为1，使得最后一个隐藏层能够直接输出该第三相似度。

其中，第四相似度为该样本短期兴趣特征与该标准长期兴趣特征之间的相似度，第四相似度越大，代表样本短期兴趣特征与标准长期兴趣特征之间越相似，第四相似度越小，代表样本短期兴趣特征与标准长期兴趣特征之间差别越大。

可选地，服务器将该样本短期兴趣特征与该标准长期兴趣特征之间的向量内积获取为该第四相似度。

可选地，服务器将该样本短期兴趣特征与该标准长期兴趣特征之间的余弦相似度获取为该第四相似度。

可选地，服务器将该样本短期兴趣特征与该标准长期兴趣特征之间的欧氏距离的倒数获取为该第四相似度。

可选地，服务器将该样本短期兴趣特征与该标准长期兴趣特征进行拼接，将拼接后所得到的特征输入到一个MLP模型，通过MLP模型对拼接后所得到的特征进行加权处理，并将最后一个隐藏层的输出向量的维度设置为1，使得最后一个隐藏层能够直接输出该第四相似度。

在步骤705中，服务器获取第一差值和第二差值，该第一差值为该第一相似度和该第二相似度之间的差值，该第二差值为该第三相似度和该第四相似度之间的差值。

在一些实施例中，服务器将该第一相似度与该第二相似度相减，得到该第一差值；将该第三相似度与该第四相似度相减，得到该第二差值。

在步骤706中，服务器基于该第一差值和该第二差值，获取本次迭代过程的损失函数值。

可选地，将该第一差值与该第二差值之间相加所得数值获取为本次迭代过程的损失函数值。

在上述步骤704-706中，服务器基于该样本长期兴趣特征、该样本短期兴趣特征、该标准长期兴趣特征和该标准短期兴趣特征，获取本次迭代过程的损失函数值，能够提高损失函数值的准确度。

在一些实施例中，服务器还可以将第一相似度和第三相似度相加，得到该损失函数值；或者，服务器还可以将该第二相似度和该第四相似度相加，得到该损失函数值，本公开实施例不对损失函数值的获取方式进行具体限定。

在步骤707中，服务器迭代训练该第一初始编码器和该第二初始编码器，直到符合停止条件，得到第一编码器和第二编码器。

其中，该第一编码器用于提取账号的长期兴趣特征，该第二编码器用于提取账号的短期兴趣特征。

可选地，如果该损失函数值不符合停止条件，服务器调整该第一初始编码器、第二初始编码器(或者还可以同时调整融合编码器、权重预测模型以及推荐模型)的模型参数，重复执行提取长期兴趣特征、短期兴趣特征，并获取损失函数值的过程，直到任一次损失函数值符合停止条件，停止训练，得到该第一编码器和该第二编码器。

可选地，该停止条件可以是迭代次数超过目标次数，该目标次数可以是任一大于或等于1的次数。

可选地，当损失函数值为第一差值与第二差值相加所得数值时，该停止条件可以是损失函数值取负数后小于损失阈值，或者，该停止条件还可以是损失函数值取对数后再取负数后小于损失阈值，其中，该损失阈值可以是任一大于或等于0的数值，本公开实施例不对停止条件的内容进行具体限定。

可选地，当损失函数值为第一相似度和第三相似度相加所得数值时，该停止条件可以是损失函数值取负数后小于损失阈值，或者，该停止条件还可以是损失函数值取对数后再取负数后小于损失阈值，其中，该损失阈值可以是任一大于或等于0的数值，本公开实施例不对停止条件的内容进行具体限定。

可选地，当损失函数值为第二相似度和第四相似度相加所得数值时，该停止条件可以是损失函数值小于损失阈值，其中，该损失阈值可以是任一大于或等于0的数值，本公开实施例不对停止条件的内容进行具体限定。

本申请实施例提供的方法，通过自监督的方式来训练第一编码器和第二编码器，使得第一编码器提取的长期兴趣特征能够精确表征用户的长期兴趣偏好，而不突出对于短期兴趣偏好的局部信息，使得第二编码器提取的短期兴趣特征能够精确表征用户的短期兴趣偏好，而不突出对于长期兴趣偏好的全局信息，从而构建出一种解纠缠的特征提取方式，使得后续的物品推荐过程具有更高的准确度。

表1示出了本申请实施例提供的物品推荐方法分别与传统的推荐系统1和2在数据集A上的测试结果，其中，推荐系统1是指在RNN模型基础上实现基于会话的推荐(Session-Based Recommendations with Recurrent Neural Networks)，推荐系统2是指构造新的RNN结构来建模用户序列，并使用注意力机制融合长短兴趣实现个性化推荐(AdaptiveUser Modeling with Long and Short-Term Preferences for PersonalizedRecommendation)。

表1

	AUC	GAUC	MRR	NDCG
					推荐系统1	0.8635	0.8680	0.3993	0.3422
推荐系统2	0.8664	0.8669	0.3617	0.2971
					本申请	0.8953	0.8936	0.4372	0.3788

表1中采取了AUC(Area Under ROC，指ROC曲线与坐标轴形成的面积)、GAUC(GroupAUC，群组AUC)、MRR(Mean Reciprocal Rank，平均排序倒数)、NDCG(NormalizedDiscounted Cumulative Gain，归一化折损累计增益)共4种不同的推荐系统性能指标，其中，ROC曲线是指接受者操作特性(Receiver Operating Characteristic)曲线。

表2则示出了本申请实施例提供的物品推荐方法分别上述推荐系统1和2在数据集B上的测试结果，采取相同的4种性能指标。

表2

	AUC	GAUC	MRR	NDCG
					推荐系统1	0.8193	0.8298	0.9166	0.9384
推荐系统2	0.7978	0.8128	0.9075	0.9318
					本申请	0.8302	0.8405	0.9262	0.9455

通过表1和表2可以看出，不管在数据集A还是在数据集B上，本申请实施例提供的物品推荐方法，相较于传统的推荐系统1和2，在4种不同的性能指标上均具有显著的性能提升，从AUC指标能够看出对推荐结果的精确性提升程度，本申请实施例提供的物品推荐方法，在数据集A上的AUC指标提升了0.03，NDCG指标提升了超过10％，在数据集B上的AUC指标提升了0.02，NDCG指标提升了超过1％。

图8是根据一示例性实施例示出的一种物品推荐装置的逻辑结构框图。参照图8，该装置包括：

获取单元801，被配置为执行基于账号在历史互动行为中交互的多个物品，获取该账号的长期兴趣特征和短期兴趣特征，该长期兴趣特征为该多个物品的全局特征，该短期兴趣特征为该多个物品中符合目标条件的部分物品的局部特征；

融合单元802，被配置为执行对该长期兴趣特征和该短期兴趣特征进行融合，得到该账号的目标兴趣特征；

确定单元803，被配置为执行基于该目标兴趣特征和目标物品的嵌入特征，确定是否对该账号推荐该目标物品，该嵌入特征用于表征对应物品的固有特性。

本公开实施例提供的装置，通过针对账号分别提取长期兴趣特征和短期兴趣特征，由于长期兴趣特征为账号在历史互动行为中交互过的所有物品的全局特征，因此能够反映账号的不随外界因素而变化的长期兴趣偏好，而短期兴趣特征为符合目标条件的部分物品的局部特征，因此能够反映账号受到外界因素影响所产生的短期兴趣偏好，使得在目标兴趣特征中能够较好地融合账号的长期、短期两种不同类型的兴趣偏好，从而在结合目标兴趣特征进行推荐时，提高了对目标物品的推荐准确度。

在一种可能实施方式中，基于图8的装置组成，该获取单元801包括：

第一获取子单元，被配置为执行获取该多个物品各自对应的多个嵌入特征；

第二获取子单元，被配置为执行将该多个嵌入特征输入第一编码器，基于该账号的账号特征，获取该多个嵌入特征各自对应的多个第一权重参数；

第一融合子单元，被配置为执行基于该多个第一权重参数，分别对该多个嵌入特征进行加权，将加权后的多个嵌入特征进行融合，输出该长期兴趣特征。

提取池化子单元，被配置为执行将该多个嵌入特征输入第二编码器，提取该多个嵌入特征各自对应的多个时序特征，对该多个时序特征进行加权池化，输出该短期兴趣特征。

在一种可能实施方式中，基于图8的装置组成，该提取池化子单元包括：

编码子子单元，被配置为执行将该多个嵌入特征输入该第二编码器中的第一子编码器，对该多个嵌入特征进行编码，输出该多个时序特征。

提取子子单元，被配置为执行将该多个嵌入特征输入该第二编码器中的第二子编码器，提取该多个嵌入特征之间的特征变化信息；

第一获取子子单元，被配置为执行基于该特征变化信息和该多个时序特征，获取该短期兴趣特征。

在一种可能实施方式中，该第一获取子子单元被配置为执行：

在一种可能实施方式中，基于图8的装置组成，该装置还包括训练单元，该训练单元包括：

第三获取子单元，被配置为执行基于样本账号在历史互动行为中交互的多个样本物品，获取该多个样本物品各自对应的多个样本嵌入特征；

输入输出子单元，被配置为执行将该多个样本嵌入特征分别输入第一初始编码器和第二初始编码器，输出该样本账号的样本长期兴趣特征和样本短期兴趣特征；

第四获取子单元，被配置为执行基于该样本长期兴趣特征、该样本短期兴趣特征、标准长期兴趣特征和标准短期兴趣特征，获取本次迭代过程的损失函数值，该标准长期兴趣特征为该多个样本嵌入特征的平均值，该标准短期兴趣特征为该多个样本物品中符合目标条件的部分物品的样本嵌入特征的平均值；

迭代训练子单元，被配置为执行迭代训练该第一初始编码器和该第二初始编码器，直到符合停止条件，得到第一编码器和第二编码器，该第一编码器用于提取账号的长期兴趣特征，该第二编码器用于提取账号的短期兴趣特征。

在一种可能实施方式中，该第四获取子单元被配置为执行：

基于该第一差值和该第二差值，获取该损失函数值。

在一种可能实施方式中，基于图8的装置组成，该融合单元802包括：

第五获取子单元，被配置为执行基于该多个嵌入特征、该长期兴趣特征、该短期兴趣特征以及该目标物品的嵌入特征，获取该长期兴趣特征的第三权重参数和该短期兴趣特征的第四权重参数；

第二融合子单元，被配置为执行基于该第三权重参数和该第四权重参数，分别对该长期兴趣特征和该短期兴趣特征进行加权，将加权后的长期兴趣特征和加权后的短期兴趣特征融合得到该目标兴趣特征。

在一种可能实施方式中，基于图8的装置组成，该第五获取子单元包括：

第二获取子子单元，被配置为执行获取该多个嵌入特征之间的全局编码特征，该全局编码特征用于表征对该多个嵌入特征进行编码后的全局化信息；

加权子子单元，被配置为执行对该长期兴趣特征、该短期兴趣特征、该全局编码特征以及该目标物品的嵌入特征进行加权，得到该第三权重参数和该第四权重参数。

在一种可能实施方式中，该第二获取子子单元被配置为执行：

在一种可能实施方式中，该加权子子单元被配置为执行：

在一种可能实施方式中，该确定单元803被配置为执行：

关于上述实施例中的装置，其中各个单元执行操作的具体方式已经在有关该物品推荐方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图9示出了本公开一个示例性实施例提供的电子设备的结构框图，以电子设备为终端900为例进行说明。该终端900可以是：智能手机、平板电脑、MP3播放器(MovingPicture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端900还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端900包括有：处理器901和存储器902。

处理器901可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器901可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器901可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器901还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器902可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器902中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器901所执行以实现本公开中各个实施例提供的物品推荐方法。

在一些实施例中，终端900还可选包括有：外围设备接口903和至少一个外围设备。处理器901、存储器902和外围设备接口903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口903相连。具体地，外围设备包括：射频电路904、触摸显示屏905、摄像头组件906、音频电路907、定位组件908和电源909中的至少一种。

外围设备接口903可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器901和存储器902。在一些实施例中，处理器901、存储器902和外围设备接口903被集成在同一芯片或电路板上；在一些其他实施例中，处理器901、存储器902和外围设备接口903中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路904用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路904通过电磁信号与通信网络以及其他通信设备进行通信。射频电路904将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路904包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路904可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路904还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本公开对此不加以限定。

显示屏905用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏905是触摸显示屏时，显示屏905还具有采集在显示屏905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器901进行处理。此时，显示屏905还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏905可以为一个，设置终端900的前面板；在另一些实施例中，显示屏905可以为至少两个，分别设置在终端900的不同表面或呈折叠设计；在再一些实施例中，显示屏905可以是柔性显示屏，设置在终端900的弯曲表面上或折叠面上。甚至，显示屏905还可以设置成非矩形的不规则图形，也即异形屏。显示屏905可以采用LCD(LiquidCrystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件906用于采集图像或视频。可选地，摄像头组件906包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件906还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路907可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器901进行处理，或者输入至射频电路904以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端900的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器901或射频电路904的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路907还可以包括耳机插孔。

定位组件908用于定位终端900的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件908可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。

电源909用于为终端900中的各个组件进行供电。电源909可以是交流电、直流电、一次性电池或可充电电池。当电源909包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端900还包括有一个或多个传感器910。该一个或多个传感器910包括但不限于：加速度传感器911、陀螺仪传感器912、压力传感器913、指纹传感器914、光学传感器915以及接近传感器916。

加速度传感器911可以检测以终端900建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器911可以用于检测重力加速度在三个坐标轴上的分量。处理器901可以根据加速度传感器911采集的重力加速度信号，控制触摸显示屏905以横向视图或纵向视图进行用户界面的显示。加速度传感器911还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器912可以检测终端900的机体方向及转动角度，陀螺仪传感器912可以与加速度传感器911协同采集用户对终端900的3D动作。处理器901根据陀螺仪传感器912采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器913可以设置在终端900的侧边框和/或触摸显示屏905的下层。当压力传感器913设置在终端900的侧边框时，可以检测用户对终端900的握持信号，由处理器901根据压力传感器913采集的握持信号进行左右手识别或快捷操作。当压力传感器913设置在触摸显示屏905的下层时，由处理器901根据用户对触摸显示屏905的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器914用于采集用户的指纹，由处理器901根据指纹传感器914采集到的指纹识别用户的身份，或者，由指纹传感器914根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器901授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器914可以被设置终端900的正面、背面或侧面。当终端900上设置有物理按键或厂商Logo时，指纹传感器914可以与物理按键或厂商Logo集成在一起。

光学传感器915用于采集环境光强度。在一个实施例中，处理器901可以根据光学传感器915采集的环境光强度，控制触摸显示屏905的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏905的显示亮度；当环境光强度较低时，调低触摸显示屏905的显示亮度。在另一个实施例中，处理器901还可以根据光学传感器915采集的环境光强度，动态调整摄像头组件906的拍摄参数。

接近传感器916，也称距离传感器，通常设置在终端900的前面板。接近传感器916用于采集用户与终端900的正面之间的距离。在一个实施例中，当接近传感器916检测到用户与终端900的正面之间的距离逐渐变小时，由处理器901控制触摸显示屏905从亮屏状态切换为息屏状态；当接近传感器916检测到用户与终端900的正面之间的距离逐渐变大时，由处理器901控制触摸显示屏905从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图9中示出的结构并不构成对终端900的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图10是本公开实施例提供的一种电子设备的结构示意图，该电子设备1000可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(CentralProcessing Units，CPU)1001和一个或一个以上的存储器1002，其中，该存储器1002中存储有至少一条程序代码，该至少一条程序代码由该处理器1001加载并执行以实现上述各个实施例提供的物品推荐方法。当然，该电子设备1000还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该电子设备1000还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种包括至少一条指令的计算机可读存储介质，例如包括至少一条指令的存储器，上述至少一条指令可由电子设备中的处理器执行以完成上述实施例中的物品推荐方法。可选地，上述计算机可读存储介质可以是非临时性计算机可读存储介质，例如，该非临时性计算机可读存储介质可以包括ROM(Read-Only Memory，只读存储器)、RAM(Random-Access Memory，随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory，只读光盘)、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品，包括一条或多条指令，该一条或多条指令可以由电子设备的处理器执行，以完成上述各个实施例提供的物品推荐方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种物品推荐方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于账号在历史互动行为中交互的多个物品，获取所述账号的长期兴趣特征包括：

获取所述多个物品各自对应的多个嵌入特征；

3.根据权利要求1所述的方法，其特征在于，所述基于账号在历史互动行为中交互的多个物品，获取所述账号的短期兴趣特征包括：

获取所述多个物品各自对应的多个嵌入特征；

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述长期兴趣特征和所述短期兴趣特征进行融合，得到所述账号的目标兴趣特征包括：

获取所述多个物品各自对应的多个嵌入特征；

6.根据权利要求1所述的方法，其特征在于，所述基于所述目标兴趣特征和目标物品的嵌入特征，确定是否对所述账号推荐所述目标物品包括：

7.一种物品推荐装置，其特征在于，包括：

8.一种电子设备，其特征在于，包括：

一个或多个处理器；

其中，所述一个或多个处理器被配置为执行所述指令，以实现如权利要求1至权利要求6中任一项所述的物品推荐方法。

9.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的至少一条指令由电子设备的一个或多个处理器执行时，使得所述电子设备能够执行如权利要求1至权利要求6中任一项所述的物品推荐方法。

10.一种计算机程序产品，其特征在于，包括一条或多条指令，所述一条或多条指令由电子设备的一个或多个处理器执行，使得所述电子设备能够执行如权利要求1至权利要求6中任一项所述的物品推荐方法。