CN107273438B

CN107273438B - 一种推荐方法、装置、设备及存储介质

Info

Publication number: CN107273438B
Application number: CN201710372766.6A
Authority: CN
Inventors: 傅向华; 余冲; 李坚强
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2017-05-24
Filing date: 2017-05-24
Publication date: 2021-02-23
Anticipated expiration: 2037-05-24
Also published as: CN107273438A

Abstract

本发明适用计算机技术领域，提供了一种推荐方法、装置、设备及存储介质，该方法包括：获取用户的历史评分数据、待评分物品以及待评分物品的文本内容，根据用户的历史评分数据、待评分物品以及待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，计算用户对待评分物品的预测评分，根据预测评分生成推荐列表，并向用户输出推荐列表，从而在向用户推荐物品时结合物品特征和用户特征，有效地提高了推荐的准确率，进而提高了物品的推荐效率。

Description

一种推荐方法、装置、设备及存储介质

技术领域

本发明属于计算机技术领域，尤其涉及一种推荐方法、装置、设备及存储介质。

背景技术

随着互联网技术的日新月异，用户的生活方式发生了重大的改变。在信息琳琅满目、竞争激励的互联网时代，如何帮助用户快速准确的挑选出其感兴趣的物品，对一个互联网企业至关重要。基于上述问题，推荐系统技术应运而生。协同过滤技术是推荐系统中使用最广、最受欢迎的一项技术。常用的协同过滤技术有基于最邻近方法和基于模型的方法。基于模型的方法又细分为聚类模型、贝叶斯分类模型、隐因子模型、图模型，其中对于隐因子模型的研究效果最好。

基于隐因子模型的研究可以从物品隐因子和用户隐因子两个方面进行研究。CWang等人提出的协同主题回归模型(Collaborative Topic Regression，简称CTR)利用主题模型(Latent Dirichlet Allocation，简称LDA)从物品内容描述中捕获物品隐因子，并对概率矩阵分解(Probabilistic Matrix Factorization,PMF)模型分解出的物品特征矩阵进行约束，得到了很好的推荐性能。但是CTR存在的一个问题是当物品的描述信息稀疏时，通过LDA学习的物品隐藏特征是不充分有效的。对此，Hao Wang等人提出利用栈式降噪自编码器(Stacked Denoising Autoencoder，简称SDAE)替换LDA从物品内容描述中学习更加丰富有效的物品隐藏特征的深度协同模型(Collaborative Deep Learning，简称CDL)，通过深度模型在学习隐藏特征方面的优势，CDL取得了比CTR更好的推荐效果。但是它们都只考虑了物品特征对推荐性能的影响，没有考虑用户特征对推荐的影响。

发明内容

本发明的目的在于提供一种推荐方法及装置，旨在解决现有技术推荐准确率不高，导致推荐效果不好的问题。

一方面，本发明提供了一种推荐方法，所述方法包括下述步骤：

获取用户的历史评分数据、待评分物品以及待评分物品的文本内容，所述历史评分数据包括已评分物品的文本内容；

根据所述用户的历史评分数据、待评分物品以及待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征；

根据所述用户特征矩阵、所述物品特征矩阵以及所述对应的物品隐藏特征和用户隐藏特征，计算所述用户对待评分物品的预测评分；

根据所述预测评分生成推荐列表，并向所述用户输出所述推荐列表。

另一方面，本发明提供了一种推荐装置，所述装置包括：

数据获取单元，用于获取用户的历史评分数据、待评分物品以及待评分物品的文本内容，所述历史评分数据包括已评分物品的文本内容；

模型训练单元，用于根据所述用户的历史评分数据、待评分物品以及待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征；

评分计算单元，用于根据所述用户特征矩阵、所述物品特征矩阵以及所述对应的物品隐藏特征和用户隐藏特征，计算所述用户对待评分物品的预测评分；以及

推荐输出单元，用于根据所述预测评分生成推荐列表，并向所述用户输出所述推荐列表。

另一方面，本发明还提供了一种推荐设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如所述推荐方法的步骤。

另一方面，本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如所述推荐方法的步骤。

本发明获取用户的历史评分数据、待评分物品以及待评分物品的文本内容，根据用户的历史评分数据、待评分物品以及待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到用户特征矩阵和物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，计算用户对待评分物品的预测评分，根据预测评分生成推荐列表，并向用户输出推荐列表，从而在向用户推荐物品时结合物品特征和用户特征，有效地提高了推荐的准确率，进而提高了物品的推荐效率。

附图说明

图1是本发明实施例一提供的推荐方法的实现流程图；

图2是推荐模型的示意图；

图3是本发明实施例二提供的推荐装置的结构示意图；

图4是本发明实施例二提供的推荐装置的优选结构示意图；以及

图5是本发明实施例三提供的推荐设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

以下结合具体实施例对本发明的具体实现进行详细描述：

实施例一：

图1示出了本发明实施例一提供的推荐方法的实现流程，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

在步骤S101中，获取用户的历史评分数据、待评分物品以及待评分物品的文本内容。

在本发明实施例中，历史评分数据组成评分矩阵，历史评分数据包括已评分物品的文本内容。获取的已评分物品和待评分物品的文本内容作为预设模型的输入，具体地，如图2所示，图中I表示总共有I个用户，J表示总共有J个物品，X_c∈R^J×S表示J个物品的向量表示集合，X_c为SDAE部分的原始的输入数据，其中物品的向量表示是从所有物品的文本描述信息中，选取S个关键词语组成的一个字典，然后用bag-of-words的向量方式表示每一个物品，X_c的第j行为物品j的向量表示，记为X_c,j*。其中，R∈R^I×J表示I个用户对J个物品的评分矩阵，每一个元素R_ij表示用户i对物品j的评分，X₀∈R^J×S为X_c加入噪声后的表示，

表示SDAE中第l层的输出，K_l为第l层的神经单元数，和X_c一样X_l的第j行用X_l,j*表示，L表示SDAE的层数。为了表示方便，用W⁺表示所有层的权重矩阵和偏置向量的集合。

在步骤S102中，根据用户的历史评分数据、待评分物品以及待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征。

在本发明实施例中，同时考虑物品特征和用户特征对推荐性能的影响，其中，物品特征用物品的文本内容表示，用户特征用该用户评论过的所有物品的内容描述组成的集合表示。将获取的数据中的物品特征和用户特征数据输入预设的SDAE和预设的PMF模型进行训练，得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，从而在推荐过程中自动从物品内容和评分矩阵中获取物品隐藏特征和用户隐藏特征，既考虑物品特征对推荐的影响，又考虑用户特征对推荐的影响。

优选地，在将获取的数据中的物品特征和用户特征数据输入预设的SDAE和预设的PMF模型进行训练时，根据待评分物品的文本内容，对预设的SDAE和预设的PMF模型进行训练，得到物品特征矩阵以及对应的物品隐藏特征，根据历史评分数据中用户的已评分物品的文本内容，对预设的SDAE和预设的PMF模型进行训练，得到用户特征矩阵以及对应的用户隐藏特征，从而将用户评论过的已评分物品的文本内容组成集合当作用户的个人描述信息，增加了推荐参数，进而提高推荐的准确性。

具体地，如图2所示，利用SDAE从用户的文本内容中学习用户特征时，SDAE的中间层X_L/2的输出为用户约束参数，利用SDAE从物品的文本内容中学习物品特征时，SDAE的中间层X_L/2的输出为物品约束参数，然后将SDAE的中间层X_L/2的输出作为SDAE和PMF模型相互连接、相互影响的桥梁，从用户和物品两个方面，分别使用用户约束参数和物品约束参数对PMF模型分解出来的用户特征向量u和物品特征向量v进行约束，使它们都符合以SDAE中间层的输出为均值的正态分布，即使V_i和U_i满足：

从而得到用户特征矩阵U和物品特征矩阵V，其中，λ_w、λ_n、λ_u、λ_s、λ_v是超参数，图2中的λ’_w、λ’_n也是超参数，在给定当前所有权重矩阵和偏置向量的集合W⁺下，u_i的更新规则从：u_i←(VC_iV^T+λ_uI_K)^- ¹VC_iR_i变为u_i←(VC_iV^T+λ_uI_K)^-1(VC_iR_i+λ_uf_e(X_0,j*,W⁺)^T)，其中，C_i表示预测评分的置信度。

在步骤S103中，根据用户特征矩阵、物品特征矩阵及对应的物品隐藏特征和用户隐藏特征，计算用户对待评分物品的预测评分。

在本发明实施例中，在计算用户对待评分物品的预测评分时，优选地，根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，使用公式R_ij≈(u_i)^Tv_j＝(f_e(X_0,i*,W⁺)^T+β_i)^T(f_e(X_0,j*,W⁺)^T+ε_j)计算用户对待评分物品的预测评分，从而得到用户对待评分物品的预测评分，提高推荐的准确性。其中，f_e(·,W⁺)为编码函数，f_e(X_0,i*,W⁺)为以用户i带有噪声的内容向量X_0,i*作为输入的编码函数，f_e(X_0,j*,W⁺)为以物品j带有噪声的内容向量X_0,j*作为输入的编码函数，β_i为用户i的隐含偏移量，ε_j为物品j的隐含偏移量，物品隐藏特征用向量

表示，用户隐藏特征用向量

表示。

在步骤S104中，根据预测评分生成推荐列表，并向用户输出推荐列表。

在本发明实施例中，在根据预测评分生成推荐列表时，优选地，根据预测评分对待推荐物品进行正序排序，获取排序中的前N个物品，根据获取的N个物品生成推荐列表，将推荐列表中的物品当作系统为用户生成的物品推荐项，然后向用户推荐，从而提高推荐的效率。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于一计算机可读取存储介质中，所述的存储介质，如ROM/RAM、磁盘、光盘等。

实施例二：

图3示出了本发明实施例二提供的推荐装置的结构，为了便于说明，仅示出了与本发明实施例相关的部分，其中包括：

数据获取单元31，用于获取用户的历史评分数据、待评分物品以及待评分物品的文本内容，其中，历史评分数据包括已评分物品的文本内容。

模型训练单元32，用于根据获取的数据，使用预设的深度栈式降噪自动编码学习技术和概率矩阵分解技术对预设的双向约束深度协同模型进行训练，得到用户特征矩阵和物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征。

在本发明实施例中，同时考虑物品特征和用户特征对推荐性能的影响，其中，物品特征用物品的文本内容表示，用户特征用该用户评论过的所有物品的内容描述组成的集合表示。模型训练单元将获取的数据中的物品特征和用户特征数据输入预设的SDAE和预设的PMF模型进行训练，得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，从而在推荐过程中自动从物品内容和评分矩阵中获取物品隐藏特征和用户隐藏特征，既考虑物品特征对推荐的影响，又考虑用户特征对推荐的影响。

评分计算单元33，用于根据用户特征矩阵、物品特征矩阵及对应的物品隐藏特征和用户隐藏特征，计算用户对待评分物品的预测评分。

在本发明实施例中，评分计算单元在计算用户对待评分物品的预测评分时，优选地，根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，使用公式R_ij≈(u_i)^Tv_j＝(f_e(X_0,i*,W⁺)^T+β_i)^T(f_e(X_0,j*,W⁺)^T+ε_j)计算用户对待评分物品的预测评分，从而得到用户对待评分物品的预测评分，提高推荐的准确性。其中，f_e(·,W⁺)为编码函数，f_e(X_0,i*,W⁺)为以用户i带有噪声的内容向量X_0,i*作为输入的编码函数，f_e(X_0,j*,W⁺)为以物品j带有噪声的内容向量X_0,j*作为输入的编码函数，β_i为用户i的隐含偏移量，ε_j为物品j的隐含偏移量，物品隐藏特征用向量

表示，用户隐藏特征用向量

表示。

推荐输出单元34，用于根据预测评分生成推荐列表，并向用户输出推荐列表。

在本发明实施例中，推荐输出单元在根据预测评分生成推荐列表时，优选地，根据预测评分对待推荐物品进行正序排序，获取排序中的前N个物品，根据获取的N个物品生成推荐列表，将推荐列表中的物品当作系统为用户生成的物品推荐项，然后向用户推荐，从而提高推荐的效率。

因此，优选地，如图4所示，该模型训练单元32包括：

第一训练单元421，用于根据待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到物品特征矩阵以及对应的物品隐藏特征；

第二训练单元422，用于根据历史评分数据中用户的已评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到用户特征矩阵以及对应的用户隐藏特征；

优选地，该评分计算单元33包括：

计算子单元431，用于根据训练得到的用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，使用公式R_ij≈(u_i)^Tv_j＝(f_e(X_0,i*,W⁺)^T+β_i)^T(f_e(X_0,j*,W⁺)^T+ε_j)计算用户对待评分物品的预测评分；

其中，f_e(·,W⁺)为编码函数，f_e(X_0,i*,W⁺)为以用户i带有噪声的内容向量X_0,i*作为输入的编码函数，f_e(X_0,j*,W⁺)为以物品j带有噪声的内容向量X_0,j*作为输入的编码函数，β_i为用户i的隐含偏移量，ε_j为物品j的隐含偏移量，v_j为物品隐藏特征，

u_i为用户隐藏特征，

优选地，该推荐输出单元34包括：

列表推荐单元441，用于根据预测评分对待推荐物品进行正序排序，获取排序中的前N个物品，根据获取的N个物品生成推荐列表。

在本发明实施例中，推荐装置的各单元可由相应的硬件或软件单元实现，各单元可以为独立的软、硬件单元，也可以集成为一个软、硬件单元，在此不用以限制本发明。

实施例三：

图5示出了本发明实施例三提供的推荐设备的结构，为了便于说明，仅示出了与本发明实施例相关的部分。

本发明实施例的推荐设备5包括处理器50、存储器51以及存储在存储器51中并可在处理器50上运行的计算机程序52。该处理器50执行计算机程序52时实现上述推荐方法实施例中的步骤，例如图1所示的步骤S101至S104。或者，处理器50执行计算机程序52时实现上述各装置实施例中各单元的功能，例如图3所示单元31至34的功能。

在本发明实施例中，该处理器50执行计算机程序52时实现上述各个屏幕唤醒的控制方法实施例中的步骤时，获取用户的历史评分数据、待评分物品以及待评分物品的文本内容，根据用户的历史评分数据、待评分物品以及待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，计算用户对待评分物品的预测评分，根据预测评分生成推荐列表，并向用户输出推荐列表。该推荐设备5中处理器50在执行计算机程序52时实现的步骤具体可参考实施例一中方法的描述，在此不再赘述。

实施例四：

在本发明实施例中，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述各个推荐方法实施例中的步骤，例如，图1所示的步骤S101至S104。或者，该计算机程序被处理器执行时实现上述装置实施例中各单元的功能，例如图3所示单元31至34的功能。

在本发明实施例中，获取用户的历史评分数据、待评分物品以及待评分物品的文本内容，根据用户的历史评分数据、待评分物品以及待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征，计算用户对待评分物品的预测评分，根据预测评分生成推荐列表，并向用户输出推荐列表。该计算机程序被处理器执行时实现的推荐方法进一步可参考前述方法实施例中步骤的描述，在此不再赘述。

本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质，例如，ROM/RAM、磁盘、光盘、闪存等存储器。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种推荐方法，其特征在于，所述方法包括下述步骤：

根据所述预测评分生成推荐列表，并向所述用户输出所述推荐列表；

根据所述用户的历史评分数据、待评分物品以及待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到用户特征矩阵和物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征的步骤，包括：

根据所述历史评分数据中所述用户的已评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到所述用户特征矩阵以及所述对应的用户隐藏特征，具体地，在利用预设的栈式降噪自编码器从所述用户的已评分物品的文本内容中学习用户特征时，预设的栈式降噪自编码器的中间层的输出为用户约束参数，使用所述用户约束参数对预设的概率矩阵分解模型分解出来的用户特征向量进行约束，使所述用户特征矩阵符合以预设的栈式降噪自编码器中间层的输出为均值的正态分布。

2.如权利要求1所述的方法，其特征在于，根据所述用户的历史评分数据、待评分物品以及待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到用户特征矩阵和物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征的步骤，还包括：

根据所述待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到所述物品特征矩阵以及所述对应的物品隐藏特征。

3.如权利要求1所述的方法，其特征在于，根据所述用户特征矩阵、所述物品特征矩阵以及所述对应的物品隐藏特征和用户隐藏特征，计算所述用户对待评分物品的预测评分的步骤，包括：

根据所述用户特征矩阵、所述物品特征矩阵以及所述对应的物品隐藏特征和用户隐藏特征，使用公式R_ij≈(u_i)^Tv_j＝(f_e(X_0,i*,W⁺)^T+β_i)^T(f_e(X_0,j*,W⁺)^T+ε_j)计算所述用户对待评分物品的预测评分；

所述f_e(·,W⁺)为编码函数，所述f_e(X_0,i*,W⁺)为以用户i带有噪声的内容向量X_0,i*作为输入的编码函数，所述f_e(X_0,j*,W⁺)为以物品j带有噪声的内容向量X_0,j*作为输入的编码函数，所述β_i为所述用户i的隐含偏移量，所述ε_j为所述物品j的隐含偏移量，所述v_j为所述物品隐藏特征，

所述u_i为所述用户隐藏特征，

4.如权利要求1所述的方法，其特征在于，根据所述预测评分生成推荐列表的步骤，包括：

根据所述预测评分对所述待评分物品进行正序排序，获取排序中的前N个物品，根据所述获取的N个物品生成推荐列表。

5.一种推荐装置，其特征在于，所述装置包括：

模型训练单元，用于根据所用户的历史评分数据、待评分物品以及待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征；

评分计算单元，用于根据所述用户特征矩阵、所述物品特征矩阵及所述对应的物品隐藏特征和用户隐藏特征，计算所述用户对待评分物品的预测评分；以及

推荐输出单元，用于根据所述预测评分生成推荐列表，并向所述用户输出所述推荐列表；

所述模型训练单元包括：

第二训练单元，用于根据所述历史评分数据中所述用户的已评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到所述用户特征矩阵以及所述对应的用户隐藏特征；

所述第二训练单元具体用于在利用预设的栈式降噪自编码器从所述用户的已评分物品的文本内容中学习用户特征时，预设的栈式降噪自编码器的中间层的输出为用户约束参数，使用所述用户约束参数对预设的概率矩阵分解模型分解出来的用户特征向量进行约束，使所述用户特征矩阵符合以预设的栈式降噪自编码器中间层的输出为均值的正态分布。

6.如权利要求5所述的装置，其特征在于，所述模型训练单元还包括：

第一训练单元，用于根据所述待评分物品的文本内容，对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练，得到所述物品特征矩阵以及所述对应的物品隐藏特征。

7.如权利要求5所述的装置，其特征在于，所述评分计算单元包括：

计算子单元，用于根据训练得到的所述用户特征矩阵和所述物品特征矩阵以及所述对应的物品隐藏特征和用户隐藏特征，使用公式R_ij≈(u_i)^Tv_j＝(f_e(X_0,i*,W⁺)^T+β_i)^T(f_e(X_0,j*,W⁺)^T+ε_j)计算所述用户对待评分物品的预测评分；

所述u_i为所述用户隐藏特征，

8.如权利要求5所述的装置，其特征在于，所述推荐输出单元包括：

列表推荐单元，用于根据所述预测评分对所述待评分物品进行正序排序，获取排序中的前N个物品，根据所述获取的N个物品生成推荐列表。

9.一种推荐设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述方法的步骤。