CN111275521A

CN111275521A - 一种基于用户评论与满意层面嵌入的商品推荐方法

Info

Publication number: CN111275521A
Application number: CN202010046965.XA
Authority: CN
Inventors: 张星明; 曹人华
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2020-01-16
Filing date: 2020-01-16
Publication date: 2020-06-12
Anticipated expiration: 2040-01-16
Also published as: CN111275521B

Abstract

本发明公开了一种基于用户评论与满意层面嵌入的商品推荐方法，包括步骤：1)收集用户历史的评论评分行为，组成训练集；2)在训练中，预处理训练集中的每条评论，计算其语义向量；3)在训练中，利用步骤2)中的语义向量通过层面嵌入计算评价向量s；通过知识图谱的建模方法生成推断的评价向量

结合s计算评价生成损失L_g；4)在训练中，利用回归模型以s为输入计算预测评分

结合真实评分r_u,i计算评分预测损失L_r，计算回归模型复杂度损失L_θ，组合L_r、L_θ与步骤3)的L_g计算整体损失L，利用L对模型进行训练；5)在测试中，利用回归模型以

为输入计算预测评分

根据

生成推荐结果。本发明解决传统方法训练效率低下，模型的透明性、可解释性和准确性不足的问题。

Description

一种基于用户评论与满意层面嵌入的商品推荐方法

技术领域

本发明涉及电子商务的技术领域，尤其是指一种基于用户评论与满意层面嵌入的商品推荐方法。

背景技术

推荐系统不仅是帮助用户克服信息过载问题，从海量数据中寻找目标信息的有效工具，而且是服务提供商提升用户服务质量和增加利润的重要手段。推荐系统已经成为了现代电子商务系统不可或缺的核心模块之一，推荐方法是推荐系统的基石。衡量推荐方法好坏的标准在于其能否深刻理解用户的兴趣，同时根据商品的特性做出准确的推荐。现代电子商务系统基本都实现了用户对商品的评论模块，用户对物品的评论侧面反映了用户的真实兴趣，是一种推荐系统可以用于提升推荐准确性的重要信息源。

目前，在电子商务领域，基于用户评论的商品推荐方法可以主要分成三类：第一类通过分析用户在评论中表现的情感倾向，构建用户－物品的情感倾向矩阵，然后结合用户对物品的评分矩阵进行矩阵分解，学习用户和物品的隐藏向量表示来进行评分预测。第二类将用户历史所发表的评论和物品所接收的评论进行拼接聚合形成用户聚合评论和物品聚合评论，然后利用主题模型在聚合评论上学习其主题分布，最后将主题分布与评分矩阵分解得到的用户和物品的隐藏向量建立联系来进行评分预测。第三种利用深度学习的端对端特性，直接在用户和物品的聚合评论上应用深度神经网络模型学习用户和物品的特征表示，最后在用户和物品的特征上应用回归模型预测用户对物品的评分。第一种方法依赖于大量的手工标注成本或情感倾向分析工具的准确性，不能实现端对端的学习。第二种和第三种方法需要在用户和物品的聚合评论文本上训练，而用户和物品的聚合评论文本一般比较长且随时间增长，因此训练速度较慢和占用资源较多，因此方法的扩展性和性能有一定的局限性。同时用户在做购买决定时，是对在物品中自己感兴趣的层面进行评价权衡的过程，以往的方法没有建模这样的特性，因此在准确性和可解释性上存在一定的差距。

本发明提出了一种基于用户评论与满意层面嵌入的商品推荐方法，利用类似记忆网络的方法进行满意层面的嵌入学习，模拟用户在各个关心层面分别进行评价再综合进行购买决策的过程，提升了模型的透明性和可解释性。同时本发明改变了以往需要在聚合评论上进行模型训练的范式，实现了在单评论文本上的端对端训练，相较于现有方法，极大地提升了模型的性能和可扩展性。

发明内容

本发明的目的在于克服现有技术的不足，提出了一种基于用户评论与满意层面嵌入的商品推荐方法，解决了现有的基于用户评论的商品推荐方法在速度和可扩展性上的不足，同时在模型中模拟用户购买的决策行为，使得模型在大数据场景下的预测准确率，训练速度和可扩展性方面得到了提升，增加了模型的可解释性。

为实现上述目的，本发明所提供的技术方案为：一种基于用户评论与满意层面嵌入的商品推荐方法，包括以下步骤：

1)收集用户历史的评论评分行为，组成模型训练的四元组集合

其中

的含义分别为用户u的标识、物品i的标识、用户u对物品i的评分、用户u对物品i的评论文本；

2)在训练中，对模型训练集Ω中的每一条评论d_u,i进行预处理操作，将其处理成统一长度的文档

对每个预处理后的文档

通过词嵌入和注意力机制计算其整体语义向量Z_u,i；

3)在训练中，通过步骤2)得到的语义向量Z_u,i计算用户在各个层面的满意度向量a，同时对用户各个满意层面进行嵌入获得其嵌入矩阵表示M，结合M、a计算出用户对物品的评价向量s，利用用户嵌入与物品嵌入，通过知识图谱的建模方法生成推断的评价向量

并与s比较计算评价生成损失L_g；

4)在训练中，以评价向量s作为输入，利用回归模型计算用户对物品的预测评分

并与真实评分r_u,i比较计算评分预测损失L_r，对回归模型计算模型复杂度损失L_θ，将L_r、L_θ与步骤3)的L_g三部分损失组合生成模型整体的损失L，利用L对模型中的参数通过反向传播算法训练直至收敛；

5)在测试中，对于给定用户物品对(u,i)生成推断的评价向量

将

输入回归模型得到用户对物品的预测评分

根据

高低决定是否向用户u推荐物品i。

在步骤1)中，利用电子商务系统自带的用户评论系统收集用户对物品的历史评论评分行为，主要的信息包括评论用户的ID、被评论物品的ID、评论的内容文本、具体的评分数值；将用户、物品的ID映射成整数编号再转成one-hot编码向量

作为其标识，再与对应的评论d_u,i、评分r_u,i组织成用户历史行为的四元组集合作为后续模型的训练数据Ω。

在步骤2)中，对步骤1)中提取的训练数据集合Ω中的每一条评论d_u,i进行清洗，去除其中的非文本部分，分词并去除标点，同时对一些不影响文本语义的低频词和大量出现但无意义的停止词进行过滤；对Ω中评论进行长度统计，将出现频率前90％的最长长度作为标准长度n，对评论进行截取或填充使其长度达到n，维护一个所有评论中出现词的词表D，将每条评论文本映射成词编号的形式，处理后的文档表示为

其中w_n为文档中第n个词的编号；将

经过随机初始化或预训练的词嵌入矩阵W_d进行嵌入获得其矩阵表示C，W_d、C分别是维度为|D|×d和n×d的矩阵，其中|D|是词表的大小，d是词向量的维度；词嵌入具体是指对

中的每个词w_k应用映射

为词w_k对应的词向量；得到评论的矩阵表示后，计算其平均的语义向量

利用注意力机制计算评论文档中每个词在最终语义的重要性，表示为e＝soft max(C·H·c₀)，e是n维的向量，其第k维e_k表示文档中第k个词在最终语义的重要性，其中维度为n×n的矩阵H是注意力机制中的参数，soft max(.)是指softmax激活函数；最终评论的语义向量通过词的重要性和词向量的线性组合得到，即

其中

表示标量e_k与向量

的每个维度相乘，结果Z_u,i是d维的语义向量。

在步骤3)中，以步骤2)中得到的评论语义向量Z_u,i为输入，利用注意力机制计算用户对物品各个层面的满意度a＝sof tmax(W_aZ_u,i+b_a)，实质是|E|维的向量，|E|是层面的个数，维度为|E|×d的矩阵W_a为注意力机制中的权重，维度为|E|的向量b_a是注意力机制中的偏置；物品的各个层面利用层面嵌入能够表示成维度为|E|×d_a的矩阵M，d_a是层面嵌入向量的维度，则用户对物品的最终评价向量是满意度与层面嵌入向量的线性组合，即s＝a^TM，a^TM表满意度向量a经过转置后与矩阵M相乘，得到的结果s是d_a维的评价向量；训练时能够从评论中提取用户对物品的评价向量s，但在推荐阶段评价向量s是不可用的，因为用户购买行为总是先于评论行为发生，通过对用户和物品进行嵌入，知识图谱的建模方法被用来克服这样的困境：首先，用户u通过其标识向量

经过维度为|U|×d_u的嵌入矩阵P获得其嵌入表示

其中P^T表示P的转置，|U|表示用户个数，d_u是用户嵌入向量的维度；同理，物品i通过其标识向量

经过维度为|V|×d_i的嵌入矩阵Q等到其嵌入表示

其中Q^T表示Q的转置，|V|为物品个数，d_i为物品嵌入向量的维度，通常情况下d_i与d_u被设置成相同的值；用户对物品的评论行为能够看成是一条知识记录，即<用户u,评论内容，物品i>，知识图谱中的某种建模关系的函数φ(.)能够通过已知的两个元素用户u、物品i推断出评论的评价特征，因此，推断的评论的评价特征能够表示成

在训练过程中，这种推断被希望尽可能地精确，因此，通过s与

比较计算评价生成损失L_g，将其作为额外惩罚项使

尽可能趋近s，在推荐过程中便能用

代替s预测用户对未知物品的评分。

在步骤4)中，在训练阶段，以用户对物品的最终评价特征向量s作为输入，利用因子分解机和神经网络相结合的模型进行评分的准确预测，因子分解机通过特征之间的一阶交互和二阶交互建模比较低阶的特征，神经网络在此特征之上利用其高度非线性的特性建模高阶特征；因子分解机的一阶特征

其中w是d维的一阶交互层可学习的参数向量，

表示向量对应元素相乘；二阶交互通过维度为d×d的参数V将每维特征与一个d维的隐藏向量相联系，增加了各维特征之间的交互，因此，二阶交互特征

其中s_i、s_j表示特征向量s的第i、j维，V_i、V_j为对应的隐藏向量，

表示向量V_i的每个维度与标量s_i相乘；前馈神经网络在一阶特征和二阶特征的基础之上对评分进行预测，其过程如下：

k＝1,2,...,l，y⁰＝h_l+h_h，

其中l为神经网络的层数，y^(k-1)、y^k分别表示第k层的输入和输出，y⁰为网络的初始输入，y^l为网络的最终输出，σ(·)是激活函数，维度为d_k×d_(k-1)的矩阵

为第k层的权重，维度为d_k的向量

是第k层的偏置，d_k为第k层神经元的个数，标量b_u、b_i和b₀分别是用户u、物品i和全局的评分偏置；通过预测评分

与真实评分r_u,i比较计算评分预测损失L_r，同时为了防止神经网络在评分预测过程中过拟合，对神经网络计算模型复杂度损失L_θ，模型整体的损失L由L_r、L_θ与步骤3)的L_g组合而成，即L＝L_r+β·L_g+γ·L_θ，其中β、γ分别是损失L_g和L_θ的权重因子；针对损失L，计算模型参数相对于这个损失的梯度，利用梯度下降算法最小化这个损失直到参数收敛。

在步骤5)中，在测试阶段，给定训练好的模型，对于给定用户物品对(u,i)通过嵌入获得其嵌入表示p_u、q_i，利用p_u、q_i生成推断的评价向量

将

输入回归模型得到用户对物品的预测评分

根据

高低决定是否向用户u推荐物品i。

本发明与现有技术相比，具有如下优点与有益效果：

1、通过用户满意层面嵌入和注意力机制模拟用户在对物品的评论中先对物品各个层面分别评价再综合总结的过程，更加准确地建模了评论的语义，增加模型的透明性和可解释性。

2、本发明提出的模型实现了利用单评论文本进行端对端的训练，改变了现有方法需要用聚合文本进行训练的模式，降低了模型训练过程中的资源消耗，提高了训练的速度。

3、通过知识图谱的建模方法推断用户对物品的评价特征向量，在训练中使用惩罚项技术使推断生成的评价向量近似用户对物品的真实评价，提高了模型在推荐时的准确度。

4、本发明在电子商务领域具有广泛的应用空间，改进的训练方法适合分布式训练，同时缩短了推荐结果计算的响应时间，且易于操作，有着广阔的实践应用场景。

附图说明

图1是本发明方法流程图。

图2是模型的总体示意图。

图3是利用词嵌入和注意力机制提取评论语义的示意图。

图4是利用层面嵌入和注意力机制提取评价特征的示意图。

具体实施方式

为了更为具体地描述本发明，下面结合附图及具体实施方式对本发明的技术方案进行详细说明。

如图1和图2所示，本实施实例所提供的基于用户评论与满意层面嵌入的商品推荐方法，其包含的主要步骤如下:

1)收集用户评论评分行为，组成模型的训练、验证和测试数据，其中训练数据用来训练模型，验证数据用来确定模型的超参数，测试数据用来评测模型的实际性能。所用数据集为推荐系统研究人员利用网络爬虫从亚马逊电子商城爬取的用户评论评分记录，每一条记录都是一个json对象，我们提取其属性中的reviwerID作为用户ID，asin做为商品ID，overall作为评分r_u,i，reviewText作为评论内容d_u,i。提取所需内容后，我们对用户ID和物品ID进行one-hot编码成用户、物品的标识向量

和

同时将整个数据集以8:1:1的比例划分成训练集、验证集和测试集。训练集表示为

验证集和测试集与其具有相同的格式。

2)对于训练集Ω中的每一条评论d_u,i，首先使用正则表达式‘\w+’处理使其只保留单词部分，同时使用nltk库对保留单词进行停止词的过滤。对过滤后的文档，对其建立一个词到从1递增编号的字典D。统计每个文档的长度，对文档长度进行排序，取前90％的最长文本长度作为标准长度n，在本例中n＝300。对于处理后的每个文档，利用D将其中的词映射成对应的词编号，如果文档长度大于n则截断成n，不足则末尾用0填充，经此处理后的文档表示成

对于处理后的文档

利用如图3所示的网络结构使用词嵌入与注意力机制提取其语义表示Z_u,i。首先我们进行参数初始化，用[-1,1]的均匀分布对词嵌入矩阵W_d进行初始化，词向量的维度d根据验证集的表现设置为[16,32,64]中的某个值，用标准差为0.1的标准正态分布对注意力层参数H进行初始化。然后文档中的每个词用其编号在嵌入矩阵中查找对应向量，最后文档可以表示成一个稠密矩阵C。对文档中每个词的词向量求平均获得其平均语义向量

通过c₀、H、C计算文档中每个词向量的重要性向量e＝soft max(CHc₀)，最后以e为权重对每个词向量进行加权求和得到文档的整体语义向量

3)在训练中，为了对评论的语义进行更细粒度的建模，对于Z_u,i利用满意层面嵌入计算用户的评价向量s。具体的计算过程如图4所示，首先我们假定存在|E|个用户关注的层面，|E|的取值根据验证集的表现在[16,32,64]中选取最优值。对于每一个层面f都有一个嵌入向量m_f与之对应，为了简单起见这些向量的维度d_a被设置成与词向量一致，即d_a＝d,同时这些向量都经过标准差为0.1的正态分布进行初始化，最后得到所有层面的矩阵表示M。给定语义向量Z_u,i首先对注意力层的权重W_a用标准差为0.1的正态分布初始化，偏置向量b_a初始化为0，然后计算用户在各个层面的满意度a＝softmax(W_aZ_u,i+b_a)，最后将满意度与对应层面的满意层面嵌入向量相乘得到评价向量s＝a^TM。为了使模型在推荐时精确工作，知识图谱中的TransE模型被用来推断生成用户的评价向量。首先利用标准差为0.1的正态分布分别初始化用户、物品的嵌入矩阵P和Q，通过用户、物品标识向量

和

利用用户、物品的嵌入矩阵嵌入得到用户、物品的嵌入表示

根据TransE模型，推断生成的评价向量

为了使生成的评价向量尽可能接近真实评价向量s，l₂损失被用做评价生成损失函数，即

其中||.||₂表示对目标的矩阵或向量的每个元素平方再求和。

4)在训练中，首先对因子分解机的一阶交互层参数w、二阶交互层参数V和神经网络参数

以标准差为0.1的正态分布进行初始化。其中神经网络的层数l设置为3，每一层的神经元个数d₁、d₂、d₃分别为d、

1，

表示向下取整，每层的激活函数σ(.)都设置成线性整流函数ReLU(.)。以评价向量s为输入，首先通过因子分解机得到一阶特征

和二阶交互特征

以这两种特征之和为神经网络的输入，即y⁰＝h_l+h_h，通过神经网络的计算获得l层的输出y^l，再结合用户u、物品i和全局的评分偏置b_u、b_i和b₀得到用户对物品的预测评分

将预测评分

与真实评分r_u,i通过平方误差计算评分预测损失

同时为了防止模型过拟合，对神经网络计算一个模型复杂度损失L_θ，具体为各层权重的l₂损失之和，即

总的损失函数为三部分损失的加权和，即L＝L_r+β·L_g+γ·L_θ，其中β、γ的值在{1,0.1,0.01}中根据验证集的结果进行挑选。有了损失函数后，利用tensorflow中的Adam优化器对模型的参数进行训练直至收敛，初始的学习率通过验证集表现在{0.01,0.001,0.0001}中挑选得到，同时使用批训练机制和提前停止机制，批样本大小被设置成256。

5)在测试中，给定训练好的模型，对于测试集中每个用户、物品对(u,i)，首先经过嵌入得到其嵌入表示p_u、q_i，然后通过TransE模型生成推断评价向量

将

输入到因子分解机和神经网络中得到预测的评分

根据

决定是否向用户u推荐物品i。这种推荐方式的准确性取决于评分预测的准确性，所以我们使用评分预测的度量指标平均平方损失(MSE)来衡量推荐的准确性，MSE定义如下:

其中，

为模型的预测评分，r_u,i为用户对物品的真实评分，T为测试中用户、物品对的集合。

以上所述实施例只为本发明之较佳实施例，并非以此限制本发明的实施范围，故凡依本发明之形状、原理所作的变化，均应涵盖在本发明的保护范围内。

Claims

1.一种基于用户评论与满意层面嵌入的商品推荐方法，其特征在于，包括以下步骤：

其中

对每个预处理后的文档

通过词嵌入和注意力机制计算其整体语义向量Z_u,i；

并与s比较计算评价生成损失L_g；

5)在测试中，对于给定用户物品对(u,i)生成推断的评价向量

将

输入回归模型得到用户对物品的预测评分

根据

高低决定是否向用户u推荐物品i。

2.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法，其特征在于：在步骤1)中，利用电子商务系统自带的用户评论系统收集用户对物品的历史评论评分行为，主要的信息包括评论用户的ID、被评论物品的ID、评论的内容文本、具体的评分数值；将用户、物品的ID映射成整数编号再转成one-hot编码向量

3.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法，其特征在于：在步骤2)中，对步骤1)中提取的训练数据集合Ω中的每一条评论d_u,i进行清洗，去除其中的非文本部分，分词并去除标点，同时对一些不影响文本语义的低频词和大量出现但无意义的停止词进行过滤；对Ω中评论进行长度统计，将出现频率前90％的最长长度作为标准长度n，对评论进行截取或填充使其长度达到n，维护一个所有评论中出现词的词表D，将每条评论文本映射成词编号的形式，处理后的文档表示为

其中w_n为文档中第n个词的编号；将

中的每个词w_k应用映射χ:

利用注意力机制计算评论文档中每个词在最终语义的重要性，表示为e＝soft max(C·H·c₀)，e是n维的向量，其第k维e_k表示文档中第k个词在最终语义的重要性，其中维度为n×n的矩阵H是注意力机制中的参数，soft max(.)是指soft max激活函数；最终评论的语义向量通过词的重要性和词向量的线性组合得到，即

其中

表示标量e_k与向量

的每个维度相乘，结果Z_u,i是d维的语义向量。

4.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法，其特征在于：在步骤3)中，以步骤2)中得到的评论语义向量Z_u,i为输入，利用注意力机制计算用户对物品各个层面的满意度a＝soft max(W_aZ_u,i+b_a)，实质是|E|维的向量，|E|是层面的个数，维度为|E|×d的矩阵W_a为注意力机制中的权重，维度为|E|的向量b_a是注意力机制中的偏置；物品的各个层面利用层面嵌入能够表示成维度为|E|×d_a的矩阵M，d_a是层面嵌入向量的维度，则用户对物品的最终评价向量是满意度与层面嵌入向量的线性组合，即s＝a^TM，a^TM表满意度向量a经过转置后与矩阵M相乘，得到的结果s是d_a维的评价向量；训练时能够从评论中提取用户对物品的评价向量s，但在推荐阶段评价向量s是不可用的，因为用户购买行为总是先于评论行为发生，通过对用户和物品进行嵌入，知识图谱的建模方法被用来克服这样的困境：首先，用户u通过其标识向量

经过维度为|U|×d_u的嵌入矩阵P获得其嵌入表示

经过维度为|V|×d_i的嵌入矩阵Q等到其嵌入表示

比较计算评价生成损失L_g，将其作为额外惩罚项使

趋近s，在推荐过程中便能用

代替s预测用户对未知物品的评分。

5.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法，其特征在于：在步骤4)中，在训练阶段，以用户对物品的最终评价特征向量s作为输入，利用因子分解机和神经网络相结合的模型进行评分的准确预测，因子分解机通过特征之间的一阶交互和二阶交互建模比较低阶的特征，神经网络在此特征之上利用其高度非线性的特性建模高阶特征；因子分解机的一阶特征