CN112100485A

CN112100485A - 一种基于评论的评分预测物品推荐方法及系统

Info

Publication number: CN112100485A
Application number: CN202010843213.6A
Authority: CN
Inventors: 杨振宇; 张鸣鸽
Original assignee: Qilu University of Technology
Current assignee: Qilu University of Technology
Priority date: 2020-08-20
Filing date: 2020-08-20
Publication date: 2020-12-18

Abstract

本发明属于物品推荐领域，提供了一种基于评论的评分预测物品推荐方法及系统。其中，基于评论的评分预测物品推荐方法包括获取用户评论和物品描述；经评分预测模型输出物品的评分预测结果；按照评分预测结果从高到低进行推荐；其中，评分预测模型包括依次连接的序列化文本层、图卷积神经网络层和多层感知机；序列化文本层用于并行提取用户评论和物品描述的特征，输出并拼接用户表示和物品表示形成节点；图卷积神经网络层用于节点和节点之间的特征学习；多层感知机用于基于特征学习的节点输出相应物品的评分预测结果。

Description

一种基于评论的评分预测物品推荐方法及系统

技术领域

本发明属于物品推荐领域，尤其涉及一种基于评论的评分预测物品推荐方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

近年来，在基于评分预测的任务中，矩阵分解(MF)是相当主流且首欢迎的方法。它能够通过利用用户和物品的潜在特征来建模用户的显式反馈(如点击、收藏、评分等)。有许多研究是基于矩阵分解方法来实现推荐系统中的评分任务。2008年发表的工作提出了经典Probabilistic Matrix Factorization(PMF)，它是以中线性因子模型，它使用与用户相关的系数，将用户的偏好建模成一个一系列向量的线性组合。随后研究者们发现，除了可以利用显式评分外，还可以利用用户的隐式反馈进行建模。于是，在用户除了显式评分外，隐式反馈信息同样有助于用户的偏好建模，因此随后提出了SVD++。该方法认为，用户除了对于项目的显式历史评分记录外，浏览记录或者收藏列表等隐反馈信息同样可以从侧面一定程度上反映用户的偏好，比如用户的收藏行为可以从侧面反映他对于这个物品感兴趣。但是数据量大且稀疏的时候，推荐结果就表现得不那么令人满意。另一个矩阵分解的缺点是无法为模型提供可解释性。当用户与物品产生了显式地交互，尽管我们能够预测得到用户可能给出的评分，但是却无法解释是什么因素在起作用。

综上所述，发明人发现，现有的基于评论的评分预测推荐存在推荐模型解释性差且用户偏好表征粗糙，进而使得推荐结果的精确性差的问题。

发明内容

为了解决上述问题，本发明提供一种基于评论的评分预测物品推荐方法及系统，其从同构空间中学习评论文本的特征，然后在图结构的空间中学习更复杂的交互，同时作用户和物品数据，实现对评分的预测更加有解释性且表征用户偏好的粒度更细，提高了推荐结果的准确性。

为了实现上述目的，本发明采用如下技术方案：

本发明的第一个方面提供一种基于评论的评分预测物品推荐方法。

在一个或多个实施例中，一种基于评论的评分预测物品推荐方法，包括：

获取用户评论和物品描述；

经评分预测模型输出物品的评分预测结果；

按照评分预测结果从高到低进行推荐；

其中，评分预测模型包括依次连接的序列化文本层、图卷积神经网络层和多层感知机；序列化文本层用于并行提取用户评论和物品描述的特征，输出并拼接用户表示和物品表示形成节点；图卷积神经网络层用于节点和节点之间的特征学习；多层感知机用于基于特征学习的节点输出相应物品的评分预测结果。

本发明的第二个方面提供一种基于评论的评分预测物品推荐系统。

在一个或多个实施例中，一种基于评论的评分预测物品推荐系统，包括：

数据获取模块，其用于获取用户评论和物品描述；

评分预测模块，其用于经评分预测模型输出物品的评分预测结果；

物品推荐模块，其用于按照评分预测结果从高到低进行推荐；

本发明的第三个方面提供一种计算机可读存储介质。

在一个或多个实施例中，一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述所述的基于评论的评分预测物品推荐方法中的步骤。

本发明的第四个方面提供一种计算机设备。

在一个或多个实施例中，一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述所述的基于评论的评分预测物品推荐方法中的步骤。

本发明的有益效果是：

(1)本发明的评分预测模型是一个异构的推荐系统模型(TextOG)，其首先从同构空间中学习评论文本的特征，然后在图结构的空间中学习更复杂的交互，该流程同时作用户和物品数据，实现了对评分的准确预测。

(2)本发明使用了一种能够无监督地学习句子的语法和结构信息的神经网络(ON-LSTM)来对评论文本进行编码，这使得在文本上的特征处理更加精细。

(3)本发明使用了图卷积神经网络来实现图结构中的复杂空域交互任务，利用空域卷积的消息传递能力，并通过扩大感受野使得图上的节点特征进一步得以丰富，用户偏好的表征粒度更细，最终提高了物品推荐的精准度。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1是本发明实施例的基于评论的评分预测物品推荐方法流程图；

图2是本发明实施例的评分预测模型结构示意图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

实施例一

参照图1，本实施例的基于评论的评分预测物品推荐方法，其包括：

S101：获取用户评论和物品描述。

具体地，用户评论包括对物品的质量或颜色等做出的评价。比如：某书包质量好，且颜色正等。

物品描述，包括物品描的类别，属性，外观等特征；比如：某物品为背包，双肩包、红色等。

S1012：经评分预测模型输出物品的评分预测结果。

推荐系统模型TextOG使用评论为用户行为和商品属性建模。它通过利用评论文本来学习用户和商品的潜在隐性因素，从而使学习的因素可以估计用户给出的评分。本实施例首先利用ON-LSTM对用户和商品的评论文本分别进行特征编码，这使得该层可以学到层次化的评论语法结构和语义信息，该部分由两个并行的神经网络组成。为了进一步学习用户和物品信息在更复杂的非欧几里得空间内的特征表示，本实施例引入一个图卷积神经网络层，从图的角度对用户信息和物品信息进行学习。在顶部有一个共享层。以联合的方式训练网络，以最小的预测误差预测等级。

本实施例所提出的评分预测模型结构如图2所示。该模型首先分别使用一个用于用户的模块和一个用于物品的模块分别对用户描述和物品评论进行建模。用户评论和项目评论分别作为输入提供给用户模块和物品模块。然后将两个模块的输出在图卷积神经网络层进行异质信息的进一步学习，并通过一个共享层产生相应的评分作为输出。

在模型的第一层，也就是序列表示层先定义了一个查表层。这是的我们可以通过词嵌入的方式来从评论文本中获取语义层面的词信息。然后我们对评论文本进行文本序列层面的学习，用于发现用户和项目的特征的公共层。它在用户模块和物品模块中有相同的表示，具体地包括一个ON-LSTM层，平均池化层。此外，序列学习模块的输出使我们可以得到降维后的用户表示和物品的评论表示，并作为图卷积神经网络层的输入，以构建基于用户和物品的图结构。本实施例使用了一个可以通过控制超参数调整节点消息的传播距离的图卷积网络结构。与直接连接全连接网络层相比，这样的图卷积网络层使用了更少的参数，且一定程度上减少了图卷积的过平滑问题。最后，本实施例通过多层感知机得到预测的评分。

具体地，如图2所示，评分预测模型包括依次连接的序列化文本层、图卷积神经网络层和多层感知机；序列化文本层用于并行提取用户评论和物品描述的特征，输出并拼接用户表示和物品表示形成节点；图卷积神经网络层用于节点和节点之间的特征学习；多层感知机用于基于特征学习的节点输出相应物品的评分预测结果。

在具体实施中，在序列化文本层中，定义一个查表层，通过词嵌入的方式来分别从用户评论和物品描述中获取语义层面的词信息。

其中，所述序列化文本层由并列的用户模块和物品模块构成，用户模块和物品模块均由依次连接的ON-LSTM网络层、平均池化层和全连接层构成。

具体地，通过一个词嵌入的方式：f：words→Rⁿ，将所有的词映射到n维的分布式表示向量，其中，words表示词典。在look-up层中，评论表示为单词嵌入矩阵，以提取其语义信息。为此，将由用户u给出的所有评论(表示为用户评论)合并到一个文档

中，该文档总共由n个单词组成。然后，为用户u建立表示为

的单词向量矩阵：

其中，doc_i ^u表示用户u的文档的第i个词。f是look-up函数，它能够返回单词的对应的单词向量，

是串联运算符。i＝1，2...，n。

使用ON-LSTM在每一个

进行计算。该层由k个神经元组成，这些神经元通过在词向量上应用可以为评论产生新对特征。ON-LSTM能够区分高低层次的信息，将无序的神经元进行特定地排序，这可以使该网络层能够在词向量所带来的词义的基础上，学到层次化的语法信息。进一步地，使用一个多层的ON-LSTM一定程度上可以学到文本的语义学习。这是深度神经网络的强大表征能力的体现。

高层级的信息意味着它要在高层级对应的编码区保留更久，不容易被遗忘门所过滤掉，而低层级的信息则意味着更容易被更新和遗忘。对于一条评论文本的编码任务来说，这样的特性能够使模型在对评论文本中的编码中将无用、冗余的信息过滤和更新，而对重要对、骨干的句子信息进行保留。使用以下式子来表示该网络结构：

f_t＝σ(W_fx_t+U_fh_t-1+b_f) (2)

i_t＝σ(W_ix_t+U_ih_t-1+b_i) (3)

o_t＝σ(W_ox_t+U_oh_t-1+b_o) (4)

其中，f_t，i_t，o_t分别表示遗忘门、输入门、输出门，它们的输入是历史信息h_t-1和当前信息x_t。σ是非线性激活函数。

把历史信息和当前信息进行一个融合后得到的当前状态。

t时刻的主遗忘门信息；

t时刻的主输出门信息；c_t：融合了历史信息和当前信息得到的最终状态；W_f：遗忘门的权重矩阵；x_t：神经网络t时刻的输入；U_f：遗忘门的更新状态；h_t-1：上一时刻的隐藏状态信息；b_f：遗忘门的偏置；W_i：输入门的权重矩阵；U_i：输入门的更新状态；b_i：输入门的偏置；W_o：输出门的权重矩阵；U_o：输出门的更新状态；b_o：输出门的偏置；W_c：融合了交集信息后的权重矩阵；U_c：融合了交集信息的更新状态；b_c：用于学习交集信息的偏置；softmax：激活函数；

主遗忘门的权重矩阵；

主遗忘门的更新状态；

主遗忘门的偏置；

主遗忘门的权重矩阵；

主遗忘门的更新状态；

主输入门的偏置；w_t：主输入门和主遗忘门的交集信息。

分别表示左向和右向的序列元素求和操作：

其中，x₁，x₂，...，x_n：用户给出的n条评论的句子序列形式；

利用平均池化操作，本实施例在特征上进行平均池化操作，取平均值作为对应于该特定用户或物品的特征。这种合并方案可以自然地处理文本的各种长度。在平均池化操作之后，将每一条评论编码减小为固定大小的向量：

p＝mean{h₁，h₂，...，h_(n-t+1)} (13)

q＝mean{h₁，h₂，...，h_(n-t+1)} (14)

其中，b₁，h₂，...，h_(n-t+1)是用户给出的所有评论的编码后的隐藏状态；

p和q分别表示我们通过平均池化得到的用户表示和物品表示。根据平均池化的输出，将全连接层的输出作为我们所考虑的用户表示x_u和物品的表示x_i：

x_u＝f(W₁×p+g) (15)

x_i＝f(W₂×q+g) (16)

其中，W₁用于学习用户特征的全连接网络中的权重矩阵；W₂：用户学习物品特征的全连接网络中的权重矩阵。

对用户和物品的节点表示进行拼接，来得到最终的用户表示：

使用ON-LSTM来分别对用户文本和物品文本进行编码，通过信息分级嵌入了层级结构。这使得在该层学习到了更紧凑的句子序列的表示形式，并在下一层的图卷积神经网络中得到节点级别的表示。

学习到更丰富的用户和物品表示，仅仅依靠对文本序列的编码是不足够的，因为用户和物品在非欧几里得空间内有着更加复杂的关系和更有价值的信息，例如偏好相近的用户和属性相近的用户。基于这样的考虑，利用图模型来进一步建模用户和物品信息。具体地，使用图卷积神经网络层来接收序列化文本层的用户表示和物品表示输出。为了利用图卷积神经网络的强大节点表征和消息传播能力，本实施例通过构建以用户为节点的图。

首先给出该部分所需要的符号表示，以便与我们清晰的描述网络结构。

定图G＝(V，E)，V表示图上的节点集合，E表示边的集合。n和m分别表示节点数量和边的数量。Z∈R^n×s表示节点的特征矩阵，其中s表示每一个节点的特征数量。L∈R^n×c表示标签矩阵，c表示标签的数量。标签矩阵是可选的，也就是说，对于图卷积网络来说，输入可以不包含标签。用伴随矩阵A∈R^n×n来描述图的结构，相应地，为伴随矩阵添加自环，

基于以上表示，我们可以给出图卷积网络的卷积操作：

f⁽⁰⁾＝H＝z_θ(U) (18)

其中，f⁽⁰⁾：图卷积层的初始化状态；z_θ(U)：表示图卷积网络生成的一个初始状态；f^(k+1)：可以理解为第k层图卷积层的输出；α：一个图卷积网络中的超参数。

是添加自环的对称的归一化矩阵。

表示图卷积网络中的度矩阵。H表示预测矩阵，它即是起始向量又是传送集，K为迭代步数，且k∈[0，K-2]。U是序列化文本层的输出样本。

与经典图卷积方法相比，该方法在传播过程中不需要增加额外的参数，因此我们可以通过很少的参数传播到图上较远的距离，这使得图上的用户和物品之间的联系更加密切，能学习到更丰富的可解释的隐式信息。

在模型的最后，使用一个两层的多层感知机来得到评分预测结果：

g(x)＝softmax(b⁽²⁾+W⁽²⁾(sigmoid(b⁽¹⁾+W⁽¹⁾U))) (21)

其中，W是可学习的连接权重矩阵，b是偏置，U是图卷积层。b⁽²⁾：第二层图卷积网络的偏置；W⁽²⁾：第二层图卷积网络的权重；sigmoid：激活函数；b⁽¹⁾：第一层图卷积网络的偏置；W⁽¹⁾：第一层图卷积网络的权重。

进一步地，使用配对损失来优化模型：

其中，y_ij：真实的评分；

预测的评分；y：表示评分。

至此，完整的描述了TextOG模型的各个组件。可以看到，模型整体上是并行与串行相结合的方式来对用户和物品的交互与评论文本的建模。这与分别对用户和物品建模然后进行预测的工作是不一样的。在本实施例中，用户和物品的交互更加紧密，所提取的特征更加丰富。

S103：按照评分预测结果从高到低进行推荐。

本实施例的评分预测模型是一个异构的推荐系统模型(TextOG)，其首先从同构空间中学习评论文本的特征，然后在图结构的空间中学习更复杂的交互，该流程同时作用户和物品数据，实现了对评分的准确预测。

本实施例使用了一种能够无监督地学习句子的语法和结构信息的神经网络(ON-LSTM)来对评论文本进行编码，这使得在文本上的特征处理更加精细。

本实施例使用了图卷积神经网络来实现图结构中的复杂空域交互任务，利用空域卷积的消息传递能力，并通过扩大感受野使得图上的节点特征进一步得以丰富，用户偏好的表征粒度更细，最终提高了物品推荐的精准度。

实施例二

本实施例提供了一种基于评论的评分预测物品推荐系统，其包括：

(1)数据获取模块，其用于获取用户评论和物品描述。

(2)评分预测模块，其用于经评分预测模型输出物品的评分预测结果。

中，该文档总共由n个单词组成。然后，为用户u建立表示为

的单词向量矩阵：

是串联运算符。i＝1，2...，n。

使用ON-LSTM在每一个

f_t＝σ(W_fx_t+U_fh_t-1+b_f) (2)

i_t＝σ(W_ix_t+U_ih_t-1+b_i) (3)

o_t＝σ(W_ox_t+U_oh_t-1+b_o) (4)

把历史信息和当前信息进行一个融合后得到的当前状态。

t时刻的主遗忘门信息；

主遗忘门的权重矩阵；

主遗忘门的更新状态；

主遗忘门的偏置；

主遗忘门的权重矩阵；

主遗忘门的更新状态；

主输入门的偏置；w_t：主输入门和主遗忘门的交集信息。

分别表示左向和右向的序列元素求和操作：

p＝mean{h₁，h₂，...，h_(n-t+1)} (13)

q＝mean{h₁，h₂，...，g_(n-t+1)} (14)

其中，h₁，h₂，...，h_(n-t+1)是用户给出的所有评论的编码后的隐藏状态；

x_u＝f(W₁×p+g) (15)

x_i＝f(W₂×q+g) (16)

基于以上表示，我们可以给出图卷积网络的卷积操作：

f⁽⁰⁾＝H＝z_θ(U) (18)

是添加自环的对称的归一化矩阵。

g(x)＝softmax(b⁽²⁾+W⁽²⁾(sigmoid(b⁽¹⁾+W⁽¹⁾U))) (21)

进一步地，使用配对损失来优化模型：

其中，y_ij：真实的评分；

预测的评分；y：表示评分。

(3)物品推荐模块，其用于按照评分预测结果从高到低进行推荐。

实施例三

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述实施例一所述的基于评论的评分预测物品推荐方法中的步骤。

实施例四

本实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述实施例一所述的基于评论的评分预测物品推荐方法中的步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(RandomAccessMemory，RAM)等。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于评论的评分预测物品推荐方法，其特征在于，包括：

获取用户评论和物品描述；

经评分预测模型输出物品的评分预测结果；

按照评分预测结果从高到低进行推荐；

2.如权利要求1所述的基于评论的评分预测物品推荐方法，其特征在于，在序列化文本层中，定义一个查表层，通过词嵌入的方式来分别从用户评论和物品描述中获取语义层面的词信息。

3.如权利要求1所述的基于评论的评分预测物品推荐方法，其特征在于，所述序列化文本层由并列的用户模块和物品模块构成，用户模块和物品模块均由依次连接的ON-LSTM网络层、平均池化层和全连接层构成。

4.如权利要求3所述的基于评论的评分预测物品推荐方法，其特征在于，在ON-LSTM网络层中，分别对用户评论和物品描述进行编码，通过信息分级嵌入了层级结构。

5.如权利要求4所述的基于评论的评分预测物品推荐方法，其特征在于，在平均池化层中，利用平均池化操作取平均值作为相应用户和物品的特征，得到用户表示和物品表示。

6.如权利要求1所述的基于评论的评分预测物品推荐方法，其特征在于，在所述图卷积神经网络层中的图以用户为节点，每个节点包含用户特征和物品特征。

7.如权利要求1所述的基于评论的评分预测物品推荐方法，其特征在于，多层感知机的层数为两层。

8.一种基于评论的评分预测物品推荐系统，其特征在于，包括：

数据获取模块，其用于获取用户评论和物品描述；

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一项所述的基于评论的评分预测物品推荐方法中的步骤。

10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于评论的评分预测物品推荐方法中的步骤。