CN112861012B

CN112861012B - 基于上下文和用户长短期偏好自适应学习的推荐方法及装置

Info

Publication number: CN112861012B
Application number: CN202110255805.0A
Authority: CN
Inventors: 赵晨阳; 于俊伟; 王俊岭; 李磊; 曹鹤玲; 廖天力; 王峰
Original assignee: Henan University of Technology
Current assignee: Henan University of Technology
Priority date: 2021-03-09
Filing date: 2021-03-09
Publication date: 2022-11-08
Anticipated expiration: 2041-03-09
Also published as: CN112861012A

Abstract

本申请实施例公开了一种基于上下文和用户长短期偏好自适应学习的推荐方法及装置，属于数据分析挖掘技术领域，该方法包括:通过CNN网络对权重多类型上下文融合的候选物品描述矩阵进行自适应学习，获得候选物品特征；根据目标用户的历史交互物品序列，结合权重多类型上下文和用户长短期偏好两个因素，基于GRU网络进行自适应学习，获得目标用户偏好特征；基于自适应学习的用户长短期偏好权重进行评分预测，确定评分预测结果，基于所述评分预测结果进行物品推荐。本申请有助于取得更加优异的推荐效果，预测的用户评分更加精确，从而提高推荐的准确性，提高用户满意度。

Description

基于上下文和用户长短期偏好自适应学习的推荐方法及装置

技术领域

本申请涉及数据分析挖掘技术领域，尤其涉及一种基于上下文和用户长短期偏好自适应学习的推荐方法及装置。

背景技术

目前，信息资源呈爆炸式增长，出现严重的“信息过载”问题，即人们很难从海量的信息中获取所需信息，推荐技术凭借对用户和物品相关信息的挖掘和分析，不仅成为用户获取所需信息的手段，而且成为电子商务公司的发展“引擎”。

目前推荐方法分为传统的推荐方法和基于深度学习的推荐方法，传统的推荐方法主要包括基于内容的推荐方法和基于协同过滤的推荐方法，其中，基于内容的推荐方法是将用户的偏好信息和物品的内容特征信息进行匹配，为用户推荐内容特征相似的物品，基于协同过滤的推荐方法是目前应用比较广泛的方法之一，其思想是根据相似用户或相似物品预测用户对物品的评分，将分值最高的一系列物品推荐给用户，该方法主要包括基于用户的协同过滤推荐方法、基于物品的协同过滤推荐方法和基于模型的协同过滤推荐方法，虽然，传统的推荐方法取得一定程度的应用，但是，该方法本质上存在一种缺陷，即这些方法无法提取用户偏好和物品的深层特征表示，从而造成一定程度的精度损失。由此可知，现有技术针对用户进行物品推荐时，具有精度损失造成预测结果准确性不高的问题。

发明内容

本申请实施例的目的在于提出一种基于上下文和用户长短期偏好自适应学习的推荐方法及装置，以解决现有技术针对用户进行物品推荐时，具有精度损失造成预测结果准确性不高的问题。

为了解决上述技术问题，本申请实施例提供一种基于上下文和用户长短期偏好自适应学习的推荐方法，采用了如下所述的技术方案：

一种基于上下文和用户长短期偏好自适应学习的推荐方法，包括：

通过CNN网络对权重多类型上下文融合的候选物品描述矩阵进行自适应学习，获得候选物品特征；

根据目标用户的历史交互物品序列，结合权重多类型上下文和用户长短期偏好两个因素，基于GRU网络进行自适应学习，获得目标用户偏好特征；

基于自适应学习的用户长短期偏好权重进行评分预测，并基于预设算法模型确定评分预测结果，进行物品推荐。

进一步的，所述获得候选物品特征和所述获得目标用户偏好特征都包括：

采用注意力机制将多类型上下文嵌入转化为一个权重上下文嵌入。

进一步的，所述通过CNN网络对权重多类型上下文融合的候选物品描述矩阵进行自适应学习，获得候选物品特征包括步骤：

获得多类型上下文嵌入生成

维的上下文嵌入矩阵C_u,p，记为

其中，

是目标用户u交互候选物品p时的上下文中类型为j的上下文嵌入，N_c是上下文类型的数量，d是上下文嵌入维度；

按照如下公式，将上下文嵌入矩阵C_u,p转化为带有上下文权重的d维权重上下文嵌入c_u,p，

ω_u,p＝softmax(e_u,p)，

其中，v₀∈R^d，W₀∈R^d×d是参数向量和参数矩阵，T是向量转置，e_u,p是d维向量，

是偏置参数，ω_u,p是N_c维的权重向量，

是类型为j的上下文嵌入

的权重；

按照如下公式：

将权重上下文嵌入融入到物品描述嵌入矩阵中的方法，使得矩阵中每一个单词嵌入都隐含着上下文信息，具体为将权重上下文嵌入c_u,p融入到维度为

的物品描述嵌入矩阵D_p中，生成维度为

的带有权重上下文信息的物品描述嵌入矩阵

其中，

是两个向量对应元素的乘积，L_p是物品描述的单词个数，d是单词的嵌入维度；

将带有权重上下文信息的物品描述嵌入矩阵

作为CNN网络的输入，自适应地学习候选物品p的特征，记为

其中，l是物品特征的维度。

进一步的，所述根据目标用户的历史交互物品序列，结合权重多类型上下文和用户长短期偏好两个因素，基于GRU网络进行自适应学习，获得目标用户偏好特征包括：

获取历史的用户物品交互序列的每一次交互信息，历史的多类型上下文的每一次交互信息转化为上下文嵌入矩阵，并通过注意力机制，将历史上下文嵌入矩阵转化为权重上下文嵌入，将权重上下文嵌入与历史物品嵌入进行融合。

进一步的，所述基于GRU网络进行自适应学习，获得目标用户偏好特征包括：

采用长度可改变的窗口机制以及上下文和候选物品自适应学习的注意力机制，进行目标用户短期偏好特征获取，具体包括步骤：

设置一个窗口阈值的最大值S，即截取GRU网络的最新的S个隐含状态作为目标用户短期偏好特征提取的依据范围；

设计一个自适应学习的机制，根据候选物品特征

和推荐时权重上下文嵌入c_u,p自适应的改变窗口长度，选择自适应的窗口长度为

获得自适应范围的隐含状态，记为

其中，

h^j∈R^l，l是隐含状态维度，v₁∈Rⁿ是参数向量，U₁∈R^n×l和W₁∈R^n×d是参数矩阵，b₁∈Rⁿ是偏置向量，T是向量转置，N_u是目标用户u的历史交互物品数量。

进一步的，所述基于GRU网络进行自适应学习，获得目标用户偏好特征之前还包括：

对于

范围内的每个隐含状态h^j，根据隐含状态和候选物品特征

相似关系以及历史上下文与推荐时上下文的相似关系，采用自适应的注意力机制学习目标用户短期偏好，具体如下公式所示，

其中，U₂∈R^n×l是参数向量，T是向量转置，U₂∈R^n×l和W₂∈R^n×d是参数矩阵，b₂∈Rⁿ是偏置向量，σ是tanh激活函数，β是隐含状态的权重向量，u^sp∈R^l是目标用户的短期偏好特征，l是短期偏好特征的维度。

进一步的，所述基于自适应学习的用户长短期偏好权重进行评分预测具体包括：

采用如下公式，获得目标用户u对候选物品p的预测评分

其中，v₃∈R^l是参数向量，T是向量转置，U₅∈R^l×l,W₅∈R^l×2l是参数矩阵，b₅∈R^l是偏置向量，δ是自适应参数，用于调节目标用户长期偏好和短期偏好因素所占的比例，⊙是向量内积。

进一步的，所述基于预设算法模型确定评分预测结果，进行物品推荐包括：

采用如下公式：

获取目标优化函数，对模型参数进行训练，若所述目标优化函数达到预设阈值，训练完成，基于训练完成得到的模型进行物品推荐，

其中，Γ是损失函数，λ是正则化参数,Θ是方法中涉及的参数集合,D_train是训练集，|D_train|是训练集中样本数量,r_u,p和

分别是目标用户u对物品p的真实评分和模型的预测评分。

为了解决上述技术问题，本申请实施例还提供了一种基于上下文和用户长短期偏好自适应学习的推荐装置，采用了如下所述的技术方案：

一种基于上下文和用户长短期偏好自适应学习的推荐装置，包括：

候选物品特征提取模块，用于获得多类型上下文嵌入生成

维的上下文嵌入矩阵C_u,p，将上下文嵌入矩阵C_u,p转化为带有上下文权重的d维权重上下文嵌入c_u,p，将权重上下文嵌入融入到物品描述嵌入矩阵中的方法，使得矩阵中每一个单词嵌入都隐含着上下文信息，具体为将权重上下文嵌入c_u,p融入到维度为

的物品描述嵌入矩阵D_p中，生成维度为

的带有权重上下文信息的物品描述嵌入矩阵

将带有权重上下文信息的物品描述嵌入矩阵

作为CNN网络的输入，自适应地学习候选物品p的特征；

目标用户偏好特征提取模块，用于获取历史的用户物品交互序列的每一次交互信息，历史的多类型上下文的每一次交互信息转化为上下文嵌入矩阵，并通过注意力机制，将历史上下文嵌入矩阵转化为权重上下文嵌入，将权重上下文嵌入与历史物品嵌入进行融合，采用长度可改变的窗口机制以及上下文和候选物品自适应学习的注意力机制，进行目标用户长短期偏好特征获取；

预测评分模块，用于基于自适应学习的用户长短期偏好权重进行评分预测，并基于预设算法模型确定评分预测结果，进行物品推荐。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现本申请实施例中提出的一种基于上下文和用户长短期偏好自适应学习的推荐方法的步骤。

与现有技术相比，本申请实施例主要有以下有益效果：

本申请实施例公开了基于上下文和用户长短期偏好自适应学习的推荐方法及装置，通过进行上下文提取，避免了上下文缺失或上下文权重欠考虑导致提取的用户偏好和物品特征缺乏上下文自适应性的问题，上下文与用户偏好或物品特征结合时，采用预设融合策略使两者进行有机的融合，而不是简单的拼接，从而有利于提高特征提取精度，结合上下文和用户长短期偏好提出一种自适应学习的推荐方法。首先提出具有权重的多类型上下文自适应学习的策略，并将该策略应用于目标用户偏好和候选物品的特征提取中。然后，提出自适应学习的目标用户长短期偏好特征提取策略。最后，将目标用户偏好特征和候选物品特征进行融合，进而预测目标用户对候选物品的评分，进行物品推荐，使得预测的用户评分更加精确，从而提高推荐的准确性，能够大幅提高用户满意度。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例中所述基于上下文和用户长短期偏好自适应学习的推荐方法的一个实施例的示意图；

图2为本申请实施例中所述多类型上下文与候选物品描述嵌入矩阵融合示意图；

图3为本申请实施例中所述用户短期偏好特征提取的示意图；

图4示出了本申请实施例中自适应对所述候选物品特征提取的一个实施例流程图；

图5示出了本申请实施例中自适应对所述目标用户进行长短期偏好特征提取的一个实施例流程图；

图6为本申请实施例中所述基于上下文和用户长短期偏好自适应学习的推荐装置的一个实施例的结构示意图；

图7为本申请实施例中计算机设备的一个实施例的结构示意图；

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

实施例一，具体参考图1，图1中示出了本申请的基于上下文和用户长短期偏好自适应学习的推荐方法一个实施例的示意图，所述的基于上下文和用户长短期偏好自适应学习的推荐方法，包括：自适应学习的候选物品特征提取、自适应学习的目标用户偏好特征提取和评分预测。

(1)自适应学习的候选物品特征提取

针对候选物品p，其特征通过CNN网络对权重多类型上下文融合的候选物品描述的自适应学习获得。主要流程如下：

首先将推荐时的多类型上下文嵌入根据注意力机制生成权重上下文嵌入，然后将权重上下文嵌入融入到候选物品p的物品描述嵌入矩阵中，最后，将带有权重上下文的物品描述嵌入矩阵输入到CNN网络中，从而获得上下文自适应学习的候选物品p的特征。具体实施步骤如下：

1-1，通过嵌入层，将候选物品p的物品描述文档转化为

维的物品描述嵌入矩阵D_p，记为

其中，L_p是物品描述的单词个数，e_k是单词嵌入向量，d是单词的嵌入维度。

1-2，通过嵌入层，将各类型上下文转化为

维的上下文嵌入矩阵C_u,p，记为

其中，

是类型为j的上下文嵌入，N_c是上下文类型的数量，d是上下文嵌入的维度。

1-3，采用注意力机制，按照公式(1)、(2)和(3)，将上下文嵌入矩阵C_u,p转化为带有上下文权重的d维权重上下文嵌入c_u,p，其中，v₀∈R^d，W₀∈R^d×d是参数向量和参数矩阵，T是向量转置，e_u,p是d维向量，

是偏置参数，ω_u,p是N_c维的权重向量，

是类型为j的上下文嵌入

的权重。

ω_u,p＝softmax(e_u,p) (2)

如图2所示，图2为本申请实施例中所述多类型上下文与候选物品描述嵌入矩阵融合示意图，具体如下：

1-4，采用将权重上下文嵌入融入到物品描述嵌入矩阵中的方法，使得矩阵中每一个单词嵌入都隐含着上下文信息，按照公式(4)，具体为将权重上下文嵌入c_u,p融入到维度为

的物品描述嵌入矩阵D_p中，生成维度为

的带有权重上下文信息的物品描述嵌入矩阵

其中，

是两个向量对应元素的乘积，L_p是物品描述的单词个数，d是单词的嵌入维度。

1-5，将带有权重上下文信息的物品描述嵌入矩阵

作为CNN网络的输入，自适应地学习候选物品p的特征，记为

其中，l是物品特征的维度。

(2)自适应学习的目标用户偏好特征提取

针对目标用户u的偏好特征提取，本发明采用注意力机制和GRU网络自适应学习用户偏好特征。主要流程如下：

输入目标用户u的历史交互物品序列和对应的历史交互上下文序列，根据注意力机制将交互上下文序列转化为权重上下文嵌入序列，然后将带有权重信息的上下文嵌入序列融入到物品嵌入序列中，最后，将带有权重信息的物品嵌入序列依次输入到GRU网络中，通过注意力机制和自适应学习的可变长度窗口机制，获得目标用户u的长期和短期偏好特征。具体技术实施步骤如下：

2-1，记目标用户u的历史交互物品序列为

其中N_u是目标用户u的历史交互物品序列的长度，x_k是d维的物品k的嵌入表示。

2-2，根据目标用户u的历史交互物品序列IS^u获取对应的历史交互上下文序列CS^u，记为

其中，

是目标用户u和物品k交互时的上下文嵌入矩阵，N_c是上下文类型的个数，

是上下文类型为j的d维上下文嵌入，可通过嵌入层获取。

2-3，根据公式(1)、(2)和(3)，采用注意力机制，将每个C_u,k转化为带有权重信息的上下文嵌入c_u,k，从而获取N_u个对应于历史物品序列的权重上下文嵌入序列。

2-4，将每个c_u,k与对应的x_k根据公式(5)进行融合。其中，

是对应元素的乘积。

2-5，将N_u个x_k,c依次输入到GRU网络中，获得GRU的每步隐含状态，记为

其中h^k∈R^l是每步的隐含状态，l是隐含特征的维度。

2-6，采用长度可改变的窗口机制以及上下文和候选物品自适应学习的注意力机制，设置一个窗口阈值的最大值S，即截取GRU网络的最新的S个隐含状态作为目标用户短期偏好特征提取的依据范围，设计一个自适应学习的机制，根据候选物品特征

和推荐时权重上下文嵌入c_u,p自适应的改变窗口长度，选择最合理的窗口长度

如公式(6)所示，获得自适应范围的隐含状态，记为

其中，h^j∈R^l，l是隐含状态维度，v₁∈Rⁿ是参数向量，U₁∈R^n×l和W₁∈R^n×d是参数矩阵，b₁∈Rⁿ是偏置向量，T是向量转置，N_u是目标用户u的历史交互物品数量。

继续参考图3，图3为本申请实施例中所述用户短期偏好特征提取的示意图，具体包括：

2-7，对于

范围内的每个隐含状态h^j，根据隐含状态和候选物品特征

相似关系以及历史上下文与推荐时上下文的相似关系，采用自适应的注意力机制学习目标用户短期偏好，具体如公式(7)(8)和(9)所示，其中，v₂∈Rⁿ是参数向量，T是向量转置，U₂∈R^n×l和W₂∈R^n×d是参数矩阵，b₂∈Rⁿ是偏置向量，σ是tanh激活函数，β是隐含状态的权重向量，u^sp∈R^l是目标用户的短期偏好特征，l是短期偏好特征的维度。

2-8，类似目标用户u的短期偏好的获取方式，根据H＝{h¹,…,h^k,…,h^Nu}，获取目标用户u的长期偏好特征，具体类似公式(7)、(8)和(9)所示，只是在公式(8)和(9)中，

被替换为N_u。

2-9，将用户偏好特征与推荐时上下文进行融合，如公式(10)和(11)所示，进一步加强用户长短期偏好特征的上下文自适应性。其中，W₃∈R^l×l,W₄∈R^l×l,E₃∈R^l×d,E₄∈R^l×d是参数矩阵，b₃∈R^l和b₄∈R^l是偏置向量，σ是ReLU激活函数,u^lp,c∈R^l和u^sp,c∈R^l分别是目标用户的含有推荐时上下文的长短期偏好特征，l是用户偏好特征的维度，

是对应元素的乘积。

(3)评分预测

目标用户u对候选物品p的预测评分由基于目标用户长期偏好的评分预测和基于目标用户短期偏好的评分预测两部分按照一个自适应的比例因子加权获得，具体地，目标用户u对候选物品p的预测评分

如下公式(12)和公式(13)所示，其中，v₃∈R^l是参数向量，T是向量转置，U₅∈R^l×l,W₅∈R^l×2l是参数矩阵，b₅∈R^l是偏置向量，δ是自适应参数，用于调节目标用户长期偏好和短期偏好因素所占的比例，⊙是向量内积。

在模型的训练中，使用公式(14)作为目标优化函数，其中，Γ是损失函数，λ是正则化参数,Θ是方法中涉及的参数集合,D_train是训练集，|D_train|是训练集中样本数量,r_u,p和

分别是目标用户u对物品p的真实评分和模型的预测评分。

实施例二，具体参考图4，图4示出了本申请实施例中自适应对所述候选物品特征提取的一个实施例流程图，具体包括如下步骤：

4-1，获得多类型上下文嵌入生成

维的上下文嵌入矩阵C_u,p，将上下文嵌入矩阵C_u,p转化为带有上下文权重的d维权重上下文嵌入c_u,p；

4-2，将权重上下文嵌入融入到物品描述嵌入矩阵中的方法，使得矩阵中每一个单词嵌入都隐含着上下文信息，具体为将权重上下文嵌入c_u,p融入到维度为

的物品描述嵌入矩阵D_p中，生成维度为

的带有权重上下文信息的物品描述嵌入矩阵

4-3，将带有权重上下文信息的物品描述嵌入矩阵

作为CNN网络的输入，自适应地学习候选物品p的特征。

实施例三，具体参考图5，图5示出了本申请实施例中自适应对所述目标用户进行长短期偏好特征提取的一个实施例流程图，具体包括如下步骤：

5-1，获取目标用户u的历史交互物品序列IS^u；

5-2，根据目标用户u的历史交互物品序列IS^u获取对应的历史交互上下文序列CS^u；

5-3，采用注意力机制，将每个C_u,k转化为带有权重信息的上下文嵌入c_u,k，从而获取N_u个对应于历史物品序列的权重上下文嵌入序列；

5-4，将每个c_u,k与对应的x_k进行融合，获取N_u个x_k,c；

5-5，将N_u个x_k,c依次输入到GRU网络中，获得GRU的每步隐含状态；

5-6，采用长度可改变的窗口机制以及上下文和候选物品自适应学习的注意力机制，设置一个窗口阈值的最大值S，即截取GRU网络的最新的S个隐含状态作为目标用户短期偏好特征提取的依据范围，设计一个自适应学习的机制，根据候选物品特征

和推荐时权重上下文嵌入c_u,p自适应的改变窗口长度；

5-7，对于

范围内的每个隐含状态h^j，根据隐含状态和候选物品特征

相似关系以及历史上下文与推荐时上下文的相似关系，采用自适应的注意力机制学习目标用户短期偏好；

5-8，类似目标用户u的短期偏好的获取方式，根据

获取目标用户u的长期偏好特征；

5-9，将用户偏好特征与推荐时上下文进行融合。

本申请实施例中所述的基于上下文和用户长短期偏好自适应学习的推荐方法，可以通过进行上下文提取，避免了上下文缺失或上下文权重欠考虑导致提取的用户偏好和物品特征缺乏上下文自适应性的问题，上下文与用户偏好或物品特征结合时，采用预设融合策略使两者进行有机的融合，而不是简单的拼接，从而有利于提高特征提取精度，结合上下文和用户长短期偏好提出一种自适应学习的推荐方法。首先提出具有权重的多类型上下文自适应学习的策略，并将该策略应用于目标用户偏好和候选物品的特征提取中。然后，提出自适应学习的目标用户长短期偏好特征提取策略。最后，将目标用户偏好特征和候选物品特征进行融合，进而预测目标用户对候选物品的评分，进行物品推荐，使得预测的用户评分更加精确，从而提高推荐的准确性，能够大幅提高用户满意度。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图6，作为对上述图1所示方法的实现，本申请提供了一种基于上下文和用户长短期偏好自适应学习的推荐装置的一个实施例，该装置实施例与图1所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图6所示，本实施例所述的基于上下文和用户长短期偏好自适应学习的推荐装置6包括：候选物品特征提取模块601、目标用户偏好特征提取模块602和预测评分模块603。其中：

候选物品特征提取模块601，用于获得多类型上下文嵌入，生成

的物品描述嵌入矩阵D_p中，生成维度为

的带有权重上下文信息的物品描述嵌入矩阵

将带有权重上下文信息的物品描述嵌入矩阵

作为CNN网络的输入，自适应地学习候选物品p的特征；

目标用户偏好特征提取模块602，用于获取历史的用户物品交互序列的每一次交互信息，历史的多类型上下文的每一次交互信息转化为上下文嵌入矩阵，并通过注意力机制，将历史上下文嵌入矩阵转化为权重上下文嵌入，将权重上下文嵌入与历史物品嵌入进行融合，采用长度可改变的窗口机制以及上下文和候选物品自适应学习的注意力机制，进行目标用户长短期偏好特征获取；

预测评分模块603，用于基于自适应学习的用户长短期偏好权重进行评分预测，并基于预设算法模型确定评分预测结果，进行物品推荐。

本申请实施例所述的基于上下文和用户长短期偏好自适应学习的推荐装置，通过进行上下文提取，避免了上下文缺失或上下文权重欠考虑导致提取的用户偏好和物品特征缺乏上下文自适应性的问题，上下文与用户偏好或物品特征结合时，采用预设融合策略使两者进行有机的融合，而不是简单的拼接，从而有利于提高特征提取精度，结合上下文和用户长短期偏好提出一种自适应学习的推荐方法。首先提出具有权重的多类型上下文自适应学习的策略，并将该策略应用于目标用户偏好和候选物品的特征提取中。然后，提出自适应学习的目标用户长短期偏好特征提取策略。最后，将目标用户偏好特征和候选物品特征进行融合，进而预测目标用户对候选物品的评分，进行物品推荐，使得预测的用户评分更加精确，从而提高推荐的准确性，能够大幅提高用户满意度。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图7，图7为本实施例计算机设备基本结构框图。

所述计算机设备7包括通过系统总线相互通信连接存储器7a、处理器7b、网络接口7c。需要指出的是，图中仅示出了具有组件7a-7c的计算机设备7，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)、可编程门阵列(Field-Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器7a至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器7a可以是所述计算机设备7的内部存储单元，例如该计算机设备7的硬盘或内存。在另一些实施例中，所述存储器7a也可以是所述计算机设备7的外部存储设备，例如该计算机设备7上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(FlashCard)等。当然，所述存储器7a还可以既包括所述计算机设备7的内部存储单元也包括其外部存储设备。本实施例中，所述存储器7a通常用于存储安装于所述计算机设备7的操作系统和各类应用软件，例如基于上下文和用户长短期偏好自适应学习的推荐方法的程序代码等。此外，所述存储器7a还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器7b在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器7b通常用于控制所述计算机设备7的总体操作。本实施例中，所述处理器7b用于运行所述存储器7a中存储的程序代码或者处理数据，例如运行所述基于上下文和用户长短期偏好自适应学习的推荐方法的程序代码。

所述网络接口7c可包括无线网络接口或有线网络接口，该网络接口7c通常用于在所述计算机设备7与其他电子设备之间建立通信连接。

本申请还提供了另一种实施方式，即提供一种非易失性计算机可读存储介质，所述非易失性计算机可读存储介质存储有基于上下文和用户长短期偏好自适应学习的推荐程序，所述基于上下文和用户长短期偏好自适应学习的推荐程序可被至少一个处理器执行，以使所述至少一个处理器执行如上述的基于上下文和用户长短期偏好自适应学习的推荐方法的步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台或者若干台终端设备(可以是计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

1.一种基于上下文和用户长短期偏好自适应学习的推荐方法，其特征在于，包括下述步骤：

通过CNN网络对权重多类型上下文融合的候选物品描述矩阵进行自适应学习，获得候选物品特征；所述获得候选物品特征包括：将推荐时的多类型上下文嵌入根据注意力机制生成权重上下文嵌入，将权重上下文嵌入融合到候选物品的物品描述嵌入矩阵中，将带有权重上下文的物品描述嵌入矩阵输入到CNN网络中，从而获得上下文自适应学习的候选物品特征；所述将权重上下文嵌入融合到候选物品的物品描述嵌入矩阵中的方式为按照公式

将权重上下文向量c_u,p融入到物品描述嵌入矩阵D_p中，生成维度为

的带有权重上下文信息的物品描述嵌入矩阵

根据目标用户的历史交互物品序列，结合权重多类型上下文和用户长短期偏好两个因素，基于GRU网络进行自适应学习，获得目标用户偏好特征；所述获得目标用户偏好特征包括：获取历史的用户物品交互序列的每一次交互信息，历史的多类型上下文的每一次交互信息转化为上下文嵌入矩阵，并通过注意力机制，将历史上下文嵌入矩阵转化为权重上下文嵌入，将权重上下文嵌入与历史物品嵌入进行融合，将带有权重信息的物品嵌入序列依次输入到GRU网络中，采用长度可改变的窗口机制以及上下文和候选物品自适应学习的注意力机制，获得目标用户长短期偏好特征；所述将权重上下文嵌入与历史物品嵌入进行融合的方式为将权重上下文嵌入c_u,k与对应的x_k根据公式

进行融合，x_k是d维的历史物品k的嵌入表示；

2.根据权利要求1所述的基于上下文和用户长短期偏好自适应学习的推荐方法，其特征在于，所述通过CNN网络对权重多类型上下文融合的候选物品描述矩阵进行自适应学习，获得候选物品特征包括下述步骤：

获得多类型上下文嵌入生成

维的上下文嵌入矩阵C_u,p，记为

其中，

ω_u,p＝softmax(e_u,p)

是偏置参数，ω_u,p是N_c维的权重向量，

是类型为j的上下文嵌入

的权重；

按照如下公式：

的物品描述嵌入矩阵D_p中,生成维度为

的带有权重上下文信息的物品描述嵌入矩阵

其中，

是对应元素的乘积，L_p是物品描述的单词个数，d是单词的嵌入维度；

将带有权重上下文信息的物品描述嵌入矩阵

作为CNN网络的输入，自适应地学习候选物品p的特征，记为，其中

l是物品特征的维度。

3.根据权利要求1所述的基于上下文和用户长短期偏好自适应学习的推荐方法，其特征在于，所述基于GRU网络进行自适应学习，获得目标用户偏好特征包括：

设计一个自适应学习的机制，根据候选物品特征

获得自适应范围的隐含状态范围，记为

其中

h^j∈R^l,l是隐含状态维度，v₁∈Rⁿ是参数向量，U₁∈R^n×l和W₁∈R^n×d是参数矩阵，b₁∈Rⁿ是偏置向量，T是向量转置，N_u是目标用户u的历史交互物品数量。

4.根据权利要求3所述的基于上下文和用户长短期偏好自适应学习的推荐方法，其特征在于，所述基于GRU网络进行自适应学习，获得目标用户偏好特征之前还包括：

对于

范围内的每个隐含状态h^j，根据隐含状态和候选物品特征

其中，v₂∈Rⁿ是参数向量，T向量转置，U₂∈R^n×l和W₂∈R^n×d是参数矩阵，b₂∈Rⁿ是偏置向量，σ是tanh激活函数，β是隐含状态的权重向量，u^sp∈R^l是目标用户的短期偏好特征，l是短期偏好特征的维度。

5.根据权利要求1至4任一项所述的基于上下文和用户长短期偏好自适应学习的推荐方法，其特征在于，所述基于自适应学习的用户长短期偏好权重进行评分预测具体包括：

采用如下公式，获得目标用户u对候选物品p的预测评分

其中，v₃∈R^l是参数向量，T是向量转置，U₅∈R^l×l,W₅∈R^l×2l是参数矩阵，b₅∈R^l是偏置向量，δ是自适应参数，用于调节目标用户长期偏好和短期偏好因素所占的比例，⊙是向量内积，u^lp,c是融合推荐时上下文的用户长期偏好，u^sp,c是融合推荐时上下文的用户短期偏好。

6.根据权利要求5所述的基于上下文和用户长短期偏好自适应学习的推荐方法,其特征在于,所述并基于预设算法模型确定评分预测结果,进行物品推荐包括：

采用如下公式：

获取目标优化函数，对模型参数进行训练，若所述目标优化函数达到预设阈值，训练完成，基于训练完成得到的模型进行物品推荐；

分别是目标用户u对物品p的真实评分和模型的预测评分。

7.一种基于上下文和用户长短期偏好自适应学习的推荐装置，其特征在于，包括：

候选物品特征提取模块，用于获得多类型上下文嵌入，生成

的物品描述嵌入矩阵D_p中，生成维度为

的带有权重上下文信息的物品描述嵌入矩阵

将带有权重上下文信息的物品描述嵌入矩阵

作为CNN网络的输入，自适应地学习候选物品p的特征；其中N_c是上下文类型的数量，L_p是物品描述的单词个数；

目标用户偏好特征提取模块，用于获取历史的用户物品交互序列的每一次交互信息，历史的多类型上下文的每一次交互信息转化为上下文嵌入矩阵，并通过注意力机制，将历史上下文嵌入矩阵转化为权重上下文嵌入，将权重上下文嵌入与历史物品嵌入进行融合，采用长度可改变的窗口机制以及上下文和候选物品自适应学习的注意力机制，进行目标用户长短期偏好特征获取；所述将权重上下文嵌入与历史物品嵌入进行融合的方式为将权重上下文嵌入c_u,k与对应的x_k根据公式

进行融合，x_k是d维的历史物品k的嵌入表示；

8.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的基于上下文和用户长短期偏好自适应学习的推荐方法的步骤。