CN104809107A

CN104809107A - 基于上下文转换向量模型的推荐方法和系统

Info

Publication number: CN104809107A
Application number: CN201510253508.7A
Authority: CN
Inventors: 王亮; 谭铁牛; 吴书; 刘强
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2015-05-18
Filing date: 2015-05-18
Publication date: 2015-07-29

Abstract

本发明公开一种基于上下文转换向量模型的推荐方法及系统，该推荐方法包括：步骤1，将上下文常用语义作用表示为一个上下文词典，将上下文表示为一个隐含向量表示，多个隐含向量表示形成隐含矩阵表示，隐含矩阵表示配合对应的权重向量生成特定属性的隐含向量表示；步骤2，基于步骤1中词典生成上下文度量转换子；步骤3，由步骤2中矩阵和用户、产品的隐含向量表示生成对应于特定环境的用户隐含向量表示和产品隐含向量表示；步骤4，由步骤3中的向量计算出预测值。本发明引入用户隐含向量表示、产品隐含向量表示、上下文集合的隐含矩阵表示，去除了原始向量空间中的一些“噪音”，获得比其他现有模型的预测更准确的效果。

Description

基于上下文转换向量模型的推荐方法和系统

技术领域

本发明涉及信息设别技术领域，更具体地涉及一种基于上下文转换向量模型(Contextual to Vector，简称Context2vec)的推荐方法和系统。

背景技术

随着互联网可获取信息的快速增长，信息过载一直为用户所诟病。推荐系统可以帮助用户快速而准确的得到所想要的信息。系统收集信息能力的剧增使得推荐系统中大量的上下文信息被收集到。现实世界中的上下文信息包括时间、地点、天气等等，这些上下文信息会对用户的习惯产生巨大的影响。

近年来，矩阵分解方法在推荐系统中得到了比较广泛的应用。矩阵分解对每个用户和产品学习一个相应的特征向量，来分别表征用户偏好和产品属性，然后利用学习到的特征向量进行产品推荐。但是传统矩阵分解方法只考虑了对历史评分信息进行分析，并未挖掘文本内容相关的信息，因此学习到的特征向量可解释性较差。

发明内容

为了解决现有技术中存在的问题，本发明的主要目的之一在于提供一种基于上下文转换向量模型的推荐系统，该上下文转换向量模型通过上下文词典的演变和操作，使得代表用户和产品的隐含向量表示随着上下文集合的改变而改变，从而能够准确地得到预测值。

为了实现上述目的，作为本发明的一个方面，本发明提出了一种基于上下文转换向量模型的推荐方法，包括以下步骤：

步骤S1，将上下文常用语义作用表示为一个上下文词典，将上下文表示为一个隐含向量表示，多个隐含向量表示形成隐含矩阵表示，隐含矩阵表示配合对应的权重向量生成特定属性的隐含向量表示；

步骤S2，基于步骤S1中上下文词典和特定属性的隐含向量表示，生成上下文度量转换子；

步骤S3，通过步骤S2中得到的所述上下文度量转换子与步骤S1中的所述隐含矩阵及用户和产品的隐含向量表示，生成对应于特定环境的隐含向量表示；

步骤S4，根据步骤S3中得到的所述隐含向量表示来计算出预测值，基于所述预测值进行推荐。

其中，所述步骤S1包括：将上下文常用语义作用表示为一个上下文词典将上下文c_m，k表示为一个隐含向量表示h_k，对应于不同上下文{c_1，k，...，c_n，k}的多个隐含向量表示[h_1，k，...，h_n，k]形成上下文集合隐含矩阵表示H_k，隐含矩阵表示配合对应的权重向量w_k生成特定属性的隐含向量表示a_k，其中k表示三种环境属性C_U，C_V，C_I；

其中，所述上下文常用语义作用分为用户U、对象V两种，基于两种上下文常用语义作用种类，上下文词典、权重向量、特定属性的隐含向量表示均分为用户、产品两类；基于三种属性：用户属性C_U、产品属性C_V、用户产品交互属性C_I，上下文词典、权重向量、特定属性的隐含向量表示均分为用户、产品、用户产品交互三类。

其中，所述步骤S2包括：基于S1中上下文词典和特定属性的隐含向量表示生成上下文度量转换子

M_{U, c_{u}}, M_{U, c_{v}}, M_{U, c_{i}}, M_{V, c_{u}}, M_{V, c_{v}}, M_{V, c_{i}},

其中为基于用户属性的用户上下文度量转换子、为基于产品属性的用户上下文度量转换子、为基于用户产品交互属性的用户上下文度量转换子、为基于用户属性的产品上下文度量转换子、为基于产品属性的产品上下文度量转换子，以及为基于用户产品交互属性的产品上下文度量转换子；所述用户和产品的各三种上下文度量转换子相加得到用户上下文度量转换子M_U，c、产品上下文度量转换子M_V，c，具体计算过程如下：

M_{U, k} = a_{U, k}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = a_{V, k}^{T} T_{V, k}^{[1 : d]},

其中

a_{U, k}^{T} = H_{k} W_{U, k},

W_U，k为n维向量，向量中的元素表示权重，计算结果如下：

M_{U, k} = {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = {(H_{k} W_{U, k})}^{T} T_{V, k}^{[1 : d]}

M_{U, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{U, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}

M_{V, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{V, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} .

其中，所述步骤S3包括：

基于步骤S2中得到的所述用户上下文度量转换子M_U，c、产品上下文度量转换子M_V，c及用户和产品的隐含向量表示u，v生成对应于特定环境的用户隐含向量表示u_c＝M_U，cu，以及对应于特定环境的产品隐含向量表示v_c＝M_V，cv，计算公式如下：

u_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]} u, v_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v

u_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, 1}^{[1 : d]} u \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, d}^{[1 : d]} u \end{matrix}], v_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, 1}^{[1 : d]} v \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, d}^{[1 : d]} v \end{matrix}] .

其中，所述步骤S4包括：

根据步骤S3中得到的所述特定环境的用户隐含向量表示、特定环境的产品隐含向量表示计算出预测值，具体计算公式如下：

\begin{matrix} {\hat{r}}_{u, v, c} = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + u_{c}^{T} v_{c} \\ = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + {[\underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}]}^{T} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v \end{matrix} .

作为本发明的另一个方面，本发明还提出了一种基于上下文转换向量模型的推荐系统，包括：

将上下文常用语义作用表示为一个上下文词典，将上下文表示为一个隐含向量表示，多个隐含向量表示形成隐含矩阵表示，隐含矩阵表示配合对应的权重向量生成特定属性的隐含向量表示的第一装置；

基于上下文词典和特定属性的隐含向量表示，生成上下文度量转换子的第二装置；

通过所述上下文度量转换子与所述隐含矩阵及用户和产品的隐含向量表示，生成对应于特定环境的隐含向量表示的第三装置；

根据所述隐含向量表示来计算出预测值的第四装置。

其中，所述第一装置执行以下步骤：

将上下文常用语义作用表示为一个上下文词典将上下文c_m，k表示为一个隐含向量表示h_k，对应于不同上下文{c_1，k，...，c_n，k}的多个隐含向量表示[h_1，k，...，h_n，k]形成上下文集合隐含矩阵表示H_k，隐含矩阵表示配合对应的权重向量w_k生成特定属性的隐含向量表示a_k，其中k表示三种环境属性C_U，C_V，C_I；

其中，所述第二装置执行以下步骤：

基于所述上下文词典和特定属性的隐含向量表示生成上下文度量转换子

M_{U, c_{u}}, M_{U, c_{v}}, M_{U, c_{i}}, M_{V, c_{u}}, M_{V, c_{v}}, M_{V, c_{i}},

M_{U, k} = a_{U, k}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = a_{V, k}^{T} T_{V, k}^{[1 : d]},

其中

a_{U, k}^{T} = H_{k} W_{U, k},

W_U，k为n维向量，向量中的元素表示权重，计算结果如下：

M_{U, k} = {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = {(H_{k} W_{U, k})}^{T} T_{V, k}^{[1 : d]}

M_{U, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{U, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}

M_{V, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{V, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} .

其中，所述第三装置执行以下步骤：基于所述用户上下文度量转换子M_U，c、产品上下文度量转换子M_V，c及用户和产品的隐含向量表示u，v生成对应于特定环境的用户隐含向量表示u_c＝N_U，cu，以及对应于特定环境的产品隐含向量表示v_c＝M_V，cv，计算公式如下：

u_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]} u, v_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v

u_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, 1}^{[1 : d]} u \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, d}^{[1 : d]} u \end{matrix}], v_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, 1}^{[1 : d]} v \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, d}^{[1 : d]} v \end{matrix}] .

其中，所述第四装置执行以下步骤：

根据所述特定环境的用户隐含向量表示、特定环境的产品隐含向量表示计算出预测值，具体计算公式如下：

\begin{matrix} {\hat{r}}_{u, v, c} = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + u_{c}^{T} v_{c} \\ = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + {[\underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}]}^{T} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v \end{matrix} .

基于上述技术方案可知，本发明的基于上下文转换向量模型的推荐方法和系统，不仅能够获取上下文的特定语义度量转换作用，而且能应用于大量上下文信息的情形中。本发明通过引入用户隐含向量表示、产品隐含向量表示和上下文集合的隐含矩阵表示，去除了原始向量空间中的一些噪音，获得了更准确的预测效果。

附图说明

图1是本发明的上下文转换向量模型的框架分解图；

图2是生成特定属性的隐含向量表示的示意图；

图3是在Movielens-1M数据集的测试结果。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明作进一步的详细说明。

本发明基于矩阵分解，提出了上下文转换向量模型。通过将用户和产品映射到隐含向量空间，对每个用户和产品学习一个d维特征向量u_i，v_j。通过引入上下文度量转换子，使得学习到特定情景的隐含向量表示u_i，k，v_j，k更加灵活，不再受限于相应的单纯形，这样不仅使得特征向量表达性更好，而且用于矩阵分解进行评分预测也更加灵活。

图1是本发明的上下文转换向量模型示意图，本发明的推荐方法包括以下步骤：

步骤S1，将上下文常用语义作用表示为一个上下文词典将上下文c_m，k表示为一个隐含向量表示h_k，对应于不同上下文{c_1，k，...c_n，k}的多个隐含向量表示[h_1，k，...，h_n，k]形成上下文集合隐含矩阵表示H_k，隐含矩阵表示配合对应的权重向量w_k生成特定属性的隐含向量表示a_k，其中k表示三种环境属性C_U，C_V，C_I。本发明中上下文常用语义作用分为用户U、对象V两种。基于两种上下文常用语义作用种类，上下文词典、权重向量、特定属性的隐含向量表示等变量，均分为用户、产品两类。例如，用户上下文词典产品上下文词典本发明涉及以下三种属性：用户属性C_U、产品属性C_V、用户产品交互属性C_I。基于三种属性种类，上下文词典、权重向量、特定属性的隐含向量表示等变量，均分为用户、产品、用户产品交互三类。对于用户上下文常用语义作用，基于三种属性分类可以分为：基于用户属性的用户上下文词典基于产品属性的用户上下文词典和基于用户产品交互属性的用户上下文词典

步骤S2，基于步骤S1中上下文词典和特定属性的隐含向量表示生成上下文度量转换子其中，基于用户、产品两种上下文常用语义作用以及用户属性、产品属性和用户产品交互属性三种属性，可以对应生成基于用户属性的用户上下文度量转换子基于产品属性的用户上下文度量转换子基于用户产品交互属性的用户上下文度量转换子基于用户属性的产品上下文度量转换子基于产品属性的产品上下文度量转换子以及基于用户产品交互属性的产品上下文度量转换子用户和产品的各三种上下文度量转换子相加得到用户上下文度量转换子M_U，c、产品上下文度量转换子M_V，c。具体计算过程如下：

M_{U, k} = a_{U, k}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = a_{V, k}^{T} T_{V, k}^{[1 : d]},

其中

a_{U, k}^{T} = H_{k} W_{U, k},

W_U，k为n维向量，其中向量中的元素表示权重。结果：

M_{U, k} = {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = {(H_{k} W_{U, k})}^{T} T_{V, k}^{[1 : d]}

M_{U, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{U, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}

M_{V, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{V, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} .

步骤S3，由步骤S2中用户上下文度量转换子M_U，c、产品上下文度量转换子M_V，c以及用户和产品的隐含向量表示u，v生成对应于特定环境的用户隐含向量表示u_c＝M_U，cu，特定环境的产品隐含向量表示v_c＝M_V，cv。将步骤S2中结果代入得：

u_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]} u, v_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v

计算如下：

u_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, 1}^{[1 : d]} u \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, d}^{[1 : d]} u \end{matrix}], v_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, 1}^{[1 : d]} v \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, d}^{[1 : d]} v \end{matrix}]

步骤S4，由步骤S3中的特定环境的用户隐含向量表示，特定环境的产品隐含向量表示计算出预测值：

\begin{matrix} {\hat{r}}_{u, v, c} = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + u_{c}^{T} v_{c} \\ = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + {[\underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}]}^{T} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v \end{matrix}

本发明还公开了一种基于上下文转换向量模型的推荐系统，包括：

根据所述隐含向量表示来计算出预测值的第四装置。

其中，所述第一装置执行以下步骤：将上下文常用语义作用表示为一个上下文词典将上下文c_m，k表示为一个隐含向量表示h_k，对应于不同上下文{c_1，k，...，c_n，k}的多个隐含向量表示[h_1，k，...，h_n，k]形成上下文集合隐含矩阵表示H_k，隐含矩阵表示配合对应的权重向量w_k生成特定属性的隐含向量表示a_k，其中k表示三种环境属性C_U，C_V，C_I；

其中，所述第二装置执行以下步骤：基于所述上下文词典和特定属性的隐含向量表示生成上下文度量转换子

M_{U, k} = a_{U, k}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = a_{V, k}^{T} T_{V, k}^{[1 : d]},

其中

a_{U, k}^{T} = H_{k} W_{U, k},

W_U，k为n维向量，向量中的元素表示权重，计算结果如下：

M_{U, k} = {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = {(H_{k} W_{U, k})}^{T} T_{V, k}^{[1 : d]}

M_{U, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{U, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}

M_{V, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{V, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} .

其中，所述第三装置执行以下步骤：基于所述用户上下文度量转换子M_U，c、产品上下文度量转换子M_V，c及用户和产品的隐含向量表示u，v生成对应于特定环境的用户隐含向量表示u_c＝M_U，cu，以及对应于特定环境的产品隐含向量表示v_c＝M_V，cv，计算公式如下：

u_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]} u, v_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v

u_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, 1}^{[1 : d]} u \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, d}^{[1 : d]} u \end{matrix}], v_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, 1}^{[1 : d]} v \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, d}^{[1 : d]} v \end{matrix}] .

其中，所述第四装置执行以下步骤：根据所述特定环境的用户隐含向量表示、特定环境的产品隐含向量表示计算出预测值，具体计算公式如下：

\begin{matrix} {\hat{r}}_{u, v, c} = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + u_{c}^{T} v_{c} \\ = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + {[\underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}]}^{T} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v \end{matrix} .

为了更好地理解上下文转换向量模型在推荐系统中的作用，以及验证本发明的实施效果，接下来以电影推荐系统为例进行说明，本示例采用Movielens-1M数据库。该数据库含有用户、产品、交互三种属性信息：用户属性信息有职业、年龄、性别，产品属性信息有类别、时长、导演，交互属性信息有陪伴、时间、地点、是否首映。环境属性信息可能会影响用户对产品的决策。比如，你可能会倾向于陪伴小孩看动画片，陪伴父母看综艺节目；周末你可能去购物；在家你可能看小说。

在Movielens-1M数据集上具体实验步骤如下：

步骤S1，将用户和电影产品分别表示为一个上下文词典将上述的用户、产品、交互三种属性信息表示为隐含向量表示h_k，对应于不同上下文{c_1，k，...，c_n，k}的多个隐含向量表示[h_1，k，...，h_n，k]形成上下文集合隐含矩阵表示H_k。实验中选取向量维度为d＝8。

步骤S2，基于步骤S1中上下文词典和上下文集合隐含矩阵表示H_k，生成上下文度量转换子M_U，k，M_V，k。

步骤S3，由步骤S2中用户上下文度量转换子M_U，c、产品上下文度量转换子M_V，c以及用户和产品的隐含向量表示u，v生成对应于特定环境的用户隐含向量表示u_c＝M_U，cu，特定环境的产品隐含向量表示v_c＝M_V，cv。

步骤S4，由步骤S3中的特定环境的用户隐含向量表示、特定环境的产品隐含向量表示计算出预测值：

\begin{matrix} {\hat{r}}_{u, v, c} = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + u_{c}^{T} v_{c} \\ = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + {[\underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}]}^{T} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v \end{matrix}

本发明将上下文转换向量模型(Context2vec)与现有的4种模型Multiverse Recommendation、FM、HeteroMF和CARS²比较。FM+、Context2vec+表示采用用户、产品、交互三种属性的实验，其他表示只采用交互属性的实验。

两种常用指标用于衡量上下文转换向量模型评分预测的性能，包括误差方均根(Root Mean Square Error，简称RMSE)和平均预测率(MeanAverage Precision，简称MAE)。

RMSE = \sqrt{\frac{Σ_{(i . j . k) &Element; Ω_{test}} {(r_{i, j, k} - {\hat{r}}_{i, j, k})}^{2}}{n_{test}};}

MAE = \frac{Σ_{(i . j . k) &Element; Ω_{test}} | r_{i, j, k} - {\hat{r}}_{i, j, k} |}{n_{test}} .

这里Ω_test指的是测试集，即10％Movielens-1M²数据集；n_test为测试集的评分。剩下的90％Movielens-1M数据集为训练集。

通过两种方法使用数据库，分别为全用户方法和冷启动方法。其中，全用户方法是随机采样数据集中10％的用户评分作为测试集，剩下90％作为训练集；而冷启动方法是随机采样数据集中不多于3个用户评分作为训练集，剩下的作为测试集，训练集仍然占90％，测试集占10％。实验结果如图3所示。从图上可以看出，本发明的推荐方法RMSE指标提高比例最高，迭代步数最少。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于上下文转换向量模型的推荐方法，包括以下步骤：

2.根据权利要求1所述的基于上下文转换向量模型的推荐方法，其中所述步骤S1包括：将上下文常用语义作用表示为一个上下文词典将上下文c_m，k表示为一个隐含向量表示h_k，对应于不同上下文{c_1，k，…，c_n，k}的多个隐含向量表示[h_1，k，…，h_n，k]形成上下文集合隐含矩阵表示H_k，隐含矩阵表示配合对应的权重向量w_k生成特定属性的隐含向量表示a_k，其中k表示三种环境属性C_U，C_V，C_I；

3.根据权利要求1所述的基于上下文转换向量模型的推荐方法，其中所述步骤S2包括：基于S1中上下文词典和特定属性的隐含向量表示生成上下文度量转换子

M_{U, k} = a_{U, k}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = a_{V, k}^{T} T_{V, k}^{[1 : d]},

其中

a_{U, k}^{T} = H_{k} W_{U, k},

W_U，k为n维向量，向量中的元素表示权重，计算结果如下：

M_{U, k} = {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = {(H_{k} W_{U, k})}^{T} T_{V, k}^{[1 : d]}

M_{U, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{U, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}

M_{V, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{V, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} .

4.根据权利要求1所述的基于上下文转换向量模型的推荐方法，其中所述步骤S3包括：

基于步骤S2中得到的所述用户上下文度量转换子M_U，c产品上下文度量转换子M_V，c及用户和产品的隐含向量表示u，v生成对应于特定环境的用户隐含向量表示u_c＝M_U，cu，以及对应于特定环境的产品隐含向量表示v_c＝M_V，cv，计算公式如下：

u_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]} u, v_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v

u_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, 1}^{[1 : d]} u \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, d}^{[1 : d]} u \end{matrix}], v_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, 1}^{[1 : d]} v \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, d}^{[1 : d]} v \end{matrix}] .

5.根据权利要求1所述的基于上下文转换向量模型的推荐方法，其中所述步骤S4包括：

\begin{matrix} {\hat{r}}_{u, v, c} = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + u_{c}^{T} v_{c} \\ = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + [\underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]} u]^{T} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v \end{matrix} .

6.一种基于上下文转换向量模型的推荐系统，包括：

根据所述隐含向量表示来计算出预测值的第四装置。

7.根据权利要求6所述的基于上下文转换向量模型的推荐系统，其中所述第一装置执行以下步骤：

将上下文常用语义作用表示为一个上下文词典将上下文c_m，k表示为一个隐含向量表示h_k，对应于不同上下文{c_1，k，…，c_n，k}的多个隐含向量表示[h_1，k，…，h_n，k]形成上下文集合隐含矩阵表示H_k，隐含矩阵表示配合对应的权重向量w_k生成特定属性的隐含向量表示a_k，其中k表示三种环境属性C_U，C_V，C_I；

8.根据权利要求6所述的基于上下文转换向量模型的推荐系统，其中所述第二装置执行以下步骤：

M_{U, c_{u}}, M_{U, c_{v}}, M_{U, c_{i}}, M_{V, c_{u}}, M_{V, c_{v}}, M_{V, c_{i}},

M_{U, k} = a_{U, k}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = a_{V, k}^{T} T_{V, k}^{[1 : d]},

其中

a_{U, k}^{T} = H_{k} W_{U, k},

W_U，k为n维向量，向量中的元素表示权重，计算结果如下：

M_{U, k} = {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}, M_{V, k} = {(H_{k} W_{U, k})}^{T} T_{V, k}^{[1 : d]}

M_{U, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{U, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]}

M_{V, c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} M_{V, k} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} .

9.根据权利要求6所述的基于上下文转换向量模型的推荐系统，其中所述第三装置执行以下步骤：基于所述用户上下文度量转换子M_U，c产品上下文度量转换子M_V，c及用户和产品的隐含向量表示u，v生成对应于特定环境的用户隐含向量表示u_c＝M_U，cu，以及对应于特定环境的产品隐含向量表示v_c＝M_V，cv，计算公式如下：

u_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]} u, v_{c} = \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v

u_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, 1}^{[1 : d]} u \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k, d}^{[1 : d]} u \end{matrix}], v_{c} = [\begin{matrix} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, 1}^{[1 : d]} v \\ . . . \\ \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k, d}^{[1 : d]} v \end{matrix}] .

10.根据权利要求6所述的基于上下文转换向量模型的推荐系统，其中所述第四装置执行以下步骤：

\begin{matrix} {\hat{r}}_{u, v, c} = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + u_{c}^{T} v_{c} \\ = b_{0} + b_{u} + b_{v} + Σ_{m = 1}^{| c |} b_{c, m} + [\underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{U, k})}^{T} T_{U, k}^{[1 : d]} u]^{T} \underset{k = C_{U}, C_{V}, C_{I}}{Σ} {(H_{k} W_{V, k})}^{T} T_{V, k}^{[1 : d]} v \end{matrix} .