CN111275521A - 一种基于用户评论与满意层面嵌入的商品推荐方法 - Google Patents

一种基于用户评论与满意层面嵌入的商品推荐方法 Download PDF

Info

Publication number
CN111275521A
CN111275521A CN202010046965.XA CN202010046965A CN111275521A CN 111275521 A CN111275521 A CN 111275521A CN 202010046965 A CN202010046965 A CN 202010046965A CN 111275521 A CN111275521 A CN 111275521A
Authority
CN
China
Prior art keywords
user
vector
comment
embedding
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010046965.XA
Other languages
English (en)
Other versions
CN111275521B (zh
Inventor
张星明
曹人华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202010046965.XA priority Critical patent/CN111275521B/zh
Publication of CN111275521A publication Critical patent/CN111275521A/zh
Application granted granted Critical
Publication of CN111275521B publication Critical patent/CN111275521B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于用户评论与满意层面嵌入的商品推荐方法,包括步骤:1)收集用户历史的评论评分行为,组成训练集;2)在训练中,预处理训练集中的每条评论,计算其语义向量;3)在训练中,利用步骤2)中的语义向量通过层面嵌入计算评价向量s;通过知识图谱的建模方法生成推断的评价向量
Figure DDA0002369767670000012
结合s计算评价生成损失Lg;4)在训练中,利用回归模型以s为输入计算预测评分
Figure DDA0002369767670000011
结合真实评分ru,i计算评分预测损失Lr,计算回归模型复杂度损失Lθ,组合Lr、Lθ与步骤3)的Lg计算整体损失L,利用L对模型进行训练;5)在测试中,利用回归模型以
Figure DDA0002369767670000015
为输入计算预测评分
Figure DDA0002369767670000013
根据
Figure DDA0002369767670000014
生成推荐结果。本发明解决传统方法训练效率低下,模型的透明性、可解释性和准确性不足的问题。

Description

一种基于用户评论与满意层面嵌入的商品推荐方法
技术领域
本发明涉及电子商务的技术领域,尤其是指一种基于用户评论与满意层面嵌入的商品推荐方法。
背景技术
推荐系统不仅是帮助用户克服信息过载问题,从海量数据中寻找目标信息的有效工具,而且是服务提供商提升用户服务质量和增加利润的重要手段。推荐系统已经成为了现代电子商务系统不可或缺的核心模块之一,推荐方法是推荐系统的基石。衡量推荐方法好坏的标准在于其能否深刻理解用户的兴趣,同时根据商品的特性做出准确的推荐。现代电子商务系统基本都实现了用户对商品的评论模块,用户对物品的评论侧面反映了用户的真实兴趣,是一种推荐系统可以用于提升推荐准确性的重要信息源。
目前,在电子商务领域,基于用户评论的商品推荐方法可以主要分成三类:第一类通过分析用户在评论中表现的情感倾向,构建用户-物品的情感倾向矩阵,然后结合用户对物品的评分矩阵进行矩阵分解,学习用户和物品的隐藏向量表示来进行评分预测。第二类将用户历史所发表的评论和物品所接收的评论进行拼接聚合形成用户聚合评论和物品聚合评论,然后利用主题模型在聚合评论上学习其主题分布,最后将主题分布与评分矩阵分解得到的用户和物品的隐藏向量建立联系来进行评分预测。第三种利用深度学习的端对端特性,直接在用户和物品的聚合评论上应用深度神经网络模型学习用户和物品的特征表示,最后在用户和物品的特征上应用回归模型预测用户对物品的评分。第一种方法依赖于大量的手工标注成本或情感倾向分析工具的准确性,不能实现端对端的学习。第二种和第三种方法需要在用户和物品的聚合评论文本上训练,而用户和物品的聚合评论文本一般比较长且随时间增长,因此训练速度较慢和占用资源较多,因此方法的扩展性和性能有一定的局限性。同时用户在做购买决定时,是对在物品中自己感兴趣的层面进行评价权衡的过程,以往的方法没有建模这样的特性,因此在准确性和可解释性上存在一定的差距。
本发明提出了一种基于用户评论与满意层面嵌入的商品推荐方法,利用类似记忆网络的方法进行满意层面的嵌入学习,模拟用户在各个关心层面分别进行评价再综合进行购买决策的过程,提升了模型的透明性和可解释性。同时本发明改变了以往需要在聚合评论上进行模型训练的范式,实现了在单评论文本上的端对端训练,相较于现有方法,极大地提升了模型的性能和可扩展性。
发明内容
本发明的目的在于克服现有技术的不足,提出了一种基于用户评论与满意层面嵌入的商品推荐方法,解决了现有的基于用户评论的商品推荐方法在速度和可扩展性上的不足,同时在模型中模拟用户购买的决策行为,使得模型在大数据场景下的预测准确率,训练速度和可扩展性方面得到了提升,增加了模型的可解释性。
为实现上述目的,本发明所提供的技术方案为:一种基于用户评论与满意层面嵌入的商品推荐方法,包括以下步骤:
1)收集用户历史的评论评分行为,组成模型训练的四元组集合
Figure BDA0002369767650000021
其中
Figure BDA0002369767650000022
的含义分别为用户u的标识、物品i的标识、用户u对物品i的评分、用户u对物品i的评论文本;
2)在训练中,对模型训练集Ω中的每一条评论du,i进行预处理操作,将其处理成统一长度的文档
Figure BDA0002369767650000023
对每个预处理后的文档
Figure BDA0002369767650000024
通过词嵌入和注意力机制计算其整体语义向量Zu,i
3)在训练中,通过步骤2)得到的语义向量Zu,i计算用户在各个层面的满意度向量a,同时对用户各个满意层面进行嵌入获得其嵌入矩阵表示M,结合M、a计算出用户对物品的评价向量s,利用用户嵌入与物品嵌入,通过知识图谱的建模方法生成推断的评价向量
Figure BDA0002369767650000031
并与s比较计算评价生成损失Lg
4)在训练中,以评价向量s作为输入,利用回归模型计算用户对物品的预测评分
Figure BDA0002369767650000032
并与真实评分ru,i比较计算评分预测损失Lr,对回归模型计算模型复杂度损失Lθ,将Lr、Lθ与步骤3)的Lg三部分损失组合生成模型整体的损失L,利用L对模型中的参数通过反向传播算法训练直至收敛;
5)在测试中,对于给定用户物品对(u,i)生成推断的评价向量
Figure BDA0002369767650000033
Figure BDA0002369767650000034
输入回归模型得到用户对物品的预测评分
Figure BDA0002369767650000035
根据
Figure BDA0002369767650000036
高低决定是否向用户u推荐物品i。
在步骤1)中,利用电子商务系统自带的用户评论系统收集用户对物品的历史评论评分行为,主要的信息包括评论用户的ID、被评论物品的ID、评论的内容文本、具体的评分数值;将用户、物品的ID映射成整数编号再转成one-hot编码向量
Figure BDA0002369767650000037
作为其标识,再与对应的评论du,i、评分ru,i组织成用户历史行为的四元组集合作为后续模型的训练数据Ω。
在步骤2)中,对步骤1)中提取的训练数据集合Ω中的每一条评论du,i进行清洗,去除其中的非文本部分,分词并去除标点,同时对一些不影响文本语义的低频词和大量出现但无意义的停止词进行过滤;对Ω中评论进行长度统计,将出现频率前90%的最长长度作为标准长度n,对评论进行截取或填充使其长度达到n,维护一个所有评论中出现词的词表D,将每条评论文本映射成词编号的形式,处理后的文档表示为
Figure BDA0002369767650000038
其中wn为文档中第n个词的编号;将
Figure BDA0002369767650000039
经过随机初始化或预训练的词嵌入矩阵Wd进行嵌入获得其矩阵表示C,Wd、C分别是维度为|D|×d和n×d的矩阵,其中|D|是词表的大小,d是词向量的维度;词嵌入具体是指对
Figure BDA0002369767650000041
中的每个词wk应用映射
Figure BDA0002369767650000042
Figure BDA0002369767650000043
为词wk对应的词向量;得到评论的矩阵表示后,计算其平均的语义向量
Figure BDA0002369767650000044
利用注意力机制计算评论文档中每个词在最终语义的重要性,表示为e=soft max(C·H·c0),e是n维的向量,其第k维ek表示文档中第k个词在最终语义的重要性,其中维度为n×n的矩阵H是注意力机制中的参数,soft max(.)是指softmax激活函数;最终评论的语义向量通过词的重要性和词向量的线性组合得到,即
Figure BDA0002369767650000045
其中
Figure BDA0002369767650000049
表示标量ek与向量
Figure BDA00023697676500000410
的每个维度相乘,结果Zu,i是d维的语义向量。
在步骤3)中,以步骤2)中得到的评论语义向量Zu,i为输入,利用注意力机制计算用户对物品各个层面的满意度a=sof tmax(WaZu,i+ba),实质是|E|维的向量,|E|是层面的个数,维度为|E|×d的矩阵Wa为注意力机制中的权重,维度为|E|的向量ba是注意力机制中的偏置;物品的各个层面利用层面嵌入能够表示成维度为|E|×da的矩阵M,da是层面嵌入向量的维度,则用户对物品的最终评价向量是满意度与层面嵌入向量的线性组合,即s=aTM,aTM表满意度向量a经过转置后与矩阵M相乘,得到的结果s是da维的评价向量;训练时能够从评论中提取用户对物品的评价向量s,但在推荐阶段评价向量s是不可用的,因为用户购买行为总是先于评论行为发生,通过对用户和物品进行嵌入,知识图谱的建模方法被用来克服这样的困境:首先,用户u通过其标识向量
Figure BDA00023697676500000411
经过维度为|U|×du的嵌入矩阵P获得其嵌入表示
Figure BDA0002369767650000046
其中PT表示P的转置,|U|表示用户个数,du是用户嵌入向量的维度;同理,物品i通过其标识向量
Figure BDA0002369767650000047
经过维度为|V|×di的嵌入矩阵Q等到其嵌入表示
Figure BDA0002369767650000048
其中QT表示Q的转置,|V|为物品个数,di为物品嵌入向量的维度,通常情况下di与du被设置成相同的值;用户对物品的评论行为能够看成是一条知识记录,即<用户u,评论内容,物品i>,知识图谱中的某种建模关系的函数φ(.)能够通过已知的两个元素用户u、物品i推断出评论的评价特征,因此,推断的评论的评价特征能够表示成
Figure BDA0002369767650000051
在训练过程中,这种推断被希望尽可能地精确,因此,通过s与
Figure BDA0002369767650000052
比较计算评价生成损失Lg,将其作为额外惩罚项使
Figure BDA0002369767650000053
尽可能趋近s,在推荐过程中便能用
Figure BDA0002369767650000054
代替s预测用户对未知物品的评分。
在步骤4)中,在训练阶段,以用户对物品的最终评价特征向量s作为输入,利用因子分解机和神经网络相结合的模型进行评分的准确预测,因子分解机通过特征之间的一阶交互和二阶交互建模比较低阶的特征,神经网络在此特征之上利用其高度非线性的特性建模高阶特征;因子分解机的一阶特征
Figure BDA0002369767650000055
其中w是d维的一阶交互层可学习的参数向量,
Figure BDA0002369767650000056
表示向量对应元素相乘;二阶交互通过维度为d×d的参数V将每维特征与一个d维的隐藏向量相联系,增加了各维特征之间的交互,因此,二阶交互特征
Figure BDA0002369767650000057
其中si、sj表示特征向量s的第i、j维,Vi、Vj为对应的隐藏向量,
Figure BDA00023697676500000513
表示向量Vi的每个维度与标量si相乘;前馈神经网络在一阶特征和二阶特征的基础之上对评分进行预测,其过程如下:
Figure BDA0002369767650000058
k=1,2,...,l,y0=hl+hh
Figure BDA0002369767650000059
其中l为神经网络的层数,y(k-1)、yk分别表示第k层的输入和输出,y0为网络的初始输入,yl为网络的最终输出,σ(·)是激活函数,维度为dk×d(k-1)的矩阵
Figure BDA00023697676500000510
为第k层的权重,维度为dk的向量
Figure BDA00023697676500000511
是第k层的偏置,dk为第k层神经元的个数,标量bu、bi和b0分别是用户u、物品i和全局的评分偏置;通过预测评分
Figure BDA00023697676500000512
与真实评分ru,i比较计算评分预测损失Lr,同时为了防止神经网络在评分预测过程中过拟合,对神经网络计算模型复杂度损失Lθ,模型整体的损失L由Lr、Lθ与步骤3)的Lg组合而成,即L=Lr+β·Lg+γ·Lθ,其中β、γ分别是损失Lg和Lθ的权重因子;针对损失L,计算模型参数相对于这个损失的梯度,利用梯度下降算法最小化这个损失直到参数收敛。
在步骤5)中,在测试阶段,给定训练好的模型,对于给定用户物品对(u,i)通过嵌入获得其嵌入表示pu、qi,利用pu、qi生成推断的评价向量
Figure BDA0002369767650000061
Figure BDA0002369767650000062
输入回归模型得到用户对物品的预测评分
Figure BDA0002369767650000063
根据
Figure BDA0002369767650000064
高低决定是否向用户u推荐物品i。
本发明与现有技术相比,具有如下优点与有益效果:
1、通过用户满意层面嵌入和注意力机制模拟用户在对物品的评论中先对物品各个层面分别评价再综合总结的过程,更加准确地建模了评论的语义,增加模型的透明性和可解释性。
2、本发明提出的模型实现了利用单评论文本进行端对端的训练,改变了现有方法需要用聚合文本进行训练的模式,降低了模型训练过程中的资源消耗,提高了训练的速度。
3、通过知识图谱的建模方法推断用户对物品的评价特征向量,在训练中使用惩罚项技术使推断生成的评价向量近似用户对物品的真实评价,提高了模型在推荐时的准确度。
4、本发明在电子商务领域具有广泛的应用空间,改进的训练方法适合分布式训练,同时缩短了推荐结果计算的响应时间,且易于操作,有着广阔的实践应用场景。
附图说明
图1是本发明方法流程图。
图2是模型的总体示意图。
图3是利用词嵌入和注意力机制提取评论语义的示意图。
图4是利用层面嵌入和注意力机制提取评价特征的示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
如图1和图2所示,本实施实例所提供的基于用户评论与满意层面嵌入的商品推荐方法,其包含的主要步骤如下:
1)收集用户评论评分行为,组成模型的训练、验证和测试数据,其中训练数据用来训练模型,验证数据用来确定模型的超参数,测试数据用来评测模型的实际性能。所用数据集为推荐系统研究人员利用网络爬虫从亚马逊电子商城爬取的用户评论评分记录,每一条记录都是一个json对象,我们提取其属性中的reviwerID作为用户ID,asin做为商品ID,overall作为评分ru,i,reviewText作为评论内容du,i。提取所需内容后,我们对用户ID和物品ID进行one-hot编码成用户、物品的标识向量
Figure BDA0002369767650000071
Figure BDA0002369767650000072
同时将整个数据集以8:1:1的比例划分成训练集、验证集和测试集。训练集表示为
Figure BDA0002369767650000073
验证集和测试集与其具有相同的格式。
2)对于训练集Ω中的每一条评论du,i,首先使用正则表达式‘\w+’处理使其只保留单词部分,同时使用nltk库对保留单词进行停止词的过滤。对过滤后的文档,对其建立一个词到从1递增编号的字典D。统计每个文档的长度,对文档长度进行排序,取前90%的最长文本长度作为标准长度n,在本例中n=300。对于处理后的每个文档,利用D将其中的词映射成对应的词编号,如果文档长度大于n则截断成n,不足则末尾用0填充,经此处理后的文档表示成
Figure BDA0002369767650000074
对于处理后的文档
Figure BDA0002369767650000075
利用如图3所示的网络结构使用词嵌入与注意力机制提取其语义表示Zu,i。首先我们进行参数初始化,用[-1,1]的均匀分布对词嵌入矩阵Wd进行初始化,词向量的维度d根据验证集的表现设置为[16,32,64]中的某个值,用标准差为0.1的标准正态分布对注意力层参数H进行初始化。然后文档中的每个词用其编号在嵌入矩阵中查找对应向量,最后文档可以表示成一个稠密矩阵C。对文档中每个词的词向量求平均获得其平均语义向量
Figure BDA0002369767650000081
通过c0、H、C计算文档中每个词向量的重要性向量e=soft max(CHc0),最后以e为权重对每个词向量进行加权求和得到文档的整体语义向量
Figure BDA0002369767650000082
3)在训练中,为了对评论的语义进行更细粒度的建模,对于Zu,i利用满意层面嵌入计算用户的评价向量s。具体的计算过程如图4所示,首先我们假定存在|E|个用户关注的层面,|E|的取值根据验证集的表现在[16,32,64]中选取最优值。对于每一个层面f都有一个嵌入向量mf与之对应,为了简单起见这些向量的维度da被设置成与词向量一致,即da=d,同时这些向量都经过标准差为0.1的正态分布进行初始化,最后得到所有层面的矩阵表示M。给定语义向量Zu,i首先对注意力层的权重Wa用标准差为0.1的正态分布初始化,偏置向量ba初始化为0,然后计算用户在各个层面的满意度a=softmax(WaZu,i+ba),最后将满意度与对应层面的满意层面嵌入向量相乘得到评价向量s=aTM。为了使模型在推荐时精确工作,知识图谱中的TransE模型被用来推断生成用户的评价向量。首先利用标准差为0.1的正态分布分别初始化用户、物品的嵌入矩阵P和Q,通过用户、物品标识向量
Figure BDA0002369767650000083
Figure BDA0002369767650000084
利用用户、物品的嵌入矩阵嵌入得到用户、物品的嵌入表示
Figure BDA0002369767650000085
根据TransE模型,推断生成的评价向量
Figure BDA0002369767650000086
为了使生成的评价向量尽可能接近真实评价向量s,l2损失被用做评价生成损失函数,即
Figure BDA0002369767650000087
其中||.||2表示对目标的矩阵或向量的每个元素平方再求和。
4)在训练中,首先对因子分解机的一阶交互层参数w、二阶交互层参数V和神经网络参数
Figure BDA0002369767650000088
以标准差为0.1的正态分布进行初始化。其中神经网络的层数l设置为3,每一层的神经元个数d1、d2、d3分别为d、
Figure BDA0002369767650000091
1,
Figure BDA0002369767650000092
表示向下取整,每层的激活函数σ(.)都设置成线性整流函数ReLU(.)。以评价向量s为输入,首先通过因子分解机得到一阶特征
Figure BDA0002369767650000093
和二阶交互特征
Figure BDA0002369767650000094
以这两种特征之和为神经网络的输入,即y0=hl+hh,通过神经网络的计算获得l层的输出yl,再结合用户u、物品i和全局的评分偏置bu、bi和b0得到用户对物品的预测评分
Figure BDA0002369767650000095
将预测评分
Figure BDA0002369767650000096
与真实评分ru,i通过平方误差计算评分预测损失
Figure BDA0002369767650000097
同时为了防止模型过拟合,对神经网络计算一个模型复杂度损失Lθ,具体为各层权重的l2损失之和,即
Figure BDA0002369767650000098
总的损失函数为三部分损失的加权和,即L=Lr+β·Lg+γ·Lθ,其中β、γ的值在{1,0.1,0.01}中根据验证集的结果进行挑选。有了损失函数后,利用tensorflow中的Adam优化器对模型的参数进行训练直至收敛,初始的学习率通过验证集表现在{0.01,0.001,0.0001}中挑选得到,同时使用批训练机制和提前停止机制,批样本大小被设置成256。
5)在测试中,给定训练好的模型,对于测试集中每个用户、物品对(u,i),首先经过嵌入得到其嵌入表示pu、qi,然后通过TransE模型生成推断评价向量
Figure BDA0002369767650000099
Figure BDA00023697676500000910
输入到因子分解机和神经网络中得到预测的评分
Figure BDA00023697676500000911
根据
Figure BDA00023697676500000912
决定是否向用户u推荐物品i。这种推荐方式的准确性取决于评分预测的准确性,所以我们使用评分预测的度量指标平均平方损失(MSE)来衡量推荐的准确性,MSE定义如下:
Figure BDA00023697676500000913
其中,
Figure BDA00023697676500000914
为模型的预测评分,ru,i为用户对物品的真实评分,T为测试中用户、物品对的集合。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

Claims (6)

1.一种基于用户评论与满意层面嵌入的商品推荐方法,其特征在于,包括以下步骤:
1)收集用户历史的评论评分行为,组成模型训练的四元组集合
Figure FDA0002369767640000011
其中
Figure FDA0002369767640000012
的含义分别为用户u的标识、物品i的标识、用户u对物品i的评分、用户u对物品i的评论文本;
2)在训练中,对模型训练集Ω中的每一条评论du,i进行预处理操作,将其处理成统一长度的文档
Figure FDA0002369767640000013
对每个预处理后的文档
Figure FDA0002369767640000014
通过词嵌入和注意力机制计算其整体语义向量Zu,i
3)在训练中,通过步骤2)得到的语义向量Zu,i计算用户在各个层面的满意度向量a,同时对用户各个满意层面进行嵌入获得其嵌入矩阵表示M,结合M、a计算出用户对物品的评价向量s,利用用户嵌入与物品嵌入,通过知识图谱的建模方法生成推断的评价向量
Figure FDA00023697676400000111
并与s比较计算评价生成损失Lg
4)在训练中,以评价向量s作为输入,利用回归模型计算用户对物品的预测评分
Figure FDA0002369767640000015
并与真实评分ru,i比较计算评分预测损失Lr,对回归模型计算模型复杂度损失Lθ,将Lr、Lθ与步骤3)的Lg三部分损失组合生成模型整体的损失L,利用L对模型中的参数通过反向传播算法训练直至收敛;
5)在测试中,对于给定用户物品对(u,i)生成推断的评价向量
Figure FDA0002369767640000016
Figure FDA0002369767640000017
输入回归模型得到用户对物品的预测评分
Figure FDA0002369767640000018
根据
Figure FDA0002369767640000019
高低决定是否向用户u推荐物品i。
2.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法,其特征在于:在步骤1)中,利用电子商务系统自带的用户评论系统收集用户对物品的历史评论评分行为,主要的信息包括评论用户的ID、被评论物品的ID、评论的内容文本、具体的评分数值;将用户、物品的ID映射成整数编号再转成one-hot编码向量
Figure FDA00023697676400000110
作为其标识,再与对应的评论du,i、评分ru,i组织成用户历史行为的四元组集合作为后续模型的训练数据Ω。
3.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法,其特征在于:在步骤2)中,对步骤1)中提取的训练数据集合Ω中的每一条评论du,i进行清洗,去除其中的非文本部分,分词并去除标点,同时对一些不影响文本语义的低频词和大量出现但无意义的停止词进行过滤;对Ω中评论进行长度统计,将出现频率前90%的最长长度作为标准长度n,对评论进行截取或填充使其长度达到n,维护一个所有评论中出现词的词表D,将每条评论文本映射成词编号的形式,处理后的文档表示为
Figure FDA0002369767640000021
其中wn为文档中第n个词的编号;将
Figure FDA0002369767640000022
经过随机初始化或预训练的词嵌入矩阵Wd进行嵌入获得其矩阵表示C,Wd、C分别是维度为|D|×d和n×d的矩阵,其中|D|是词表的大小,d是词向量的维度;词嵌入具体是指对
Figure FDA0002369767640000023
中的每个词wk应用映射χ:
Figure FDA0002369767640000024
Figure FDA0002369767640000025
为词wk对应的词向量;得到评论的矩阵表示后,计算其平均的语义向量
Figure FDA0002369767640000026
利用注意力机制计算评论文档中每个词在最终语义的重要性,表示为e=soft max(C·H·c0),e是n维的向量,其第k维ek表示文档中第k个词在最终语义的重要性,其中维度为n×n的矩阵H是注意力机制中的参数,soft max(.)是指soft max激活函数;最终评论的语义向量通过词的重要性和词向量的线性组合得到,即
Figure FDA0002369767640000027
其中
Figure FDA0002369767640000028
表示标量ek与向量
Figure FDA0002369767640000029
的每个维度相乘,结果Zu,i是d维的语义向量。
4.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法,其特征在于:在步骤3)中,以步骤2)中得到的评论语义向量Zu,i为输入,利用注意力机制计算用户对物品各个层面的满意度a=soft max(WaZu,i+ba),实质是|E|维的向量,|E|是层面的个数,维度为|E|×d的矩阵Wa为注意力机制中的权重,维度为|E|的向量ba是注意力机制中的偏置;物品的各个层面利用层面嵌入能够表示成维度为|E|×da的矩阵M,da是层面嵌入向量的维度,则用户对物品的最终评价向量是满意度与层面嵌入向量的线性组合,即s=aTM,aTM表满意度向量a经过转置后与矩阵M相乘,得到的结果s是da维的评价向量;训练时能够从评论中提取用户对物品的评价向量s,但在推荐阶段评价向量s是不可用的,因为用户购买行为总是先于评论行为发生,通过对用户和物品进行嵌入,知识图谱的建模方法被用来克服这样的困境:首先,用户u通过其标识向量
Figure FDA0002369767640000031
经过维度为|U|×du的嵌入矩阵P获得其嵌入表示
Figure FDA0002369767640000032
其中PT表示P的转置,|U|表示用户个数,du是用户嵌入向量的维度;同理,物品i通过其标识向量
Figure FDA0002369767640000033
经过维度为|V|×di的嵌入矩阵Q等到其嵌入表示
Figure FDA0002369767640000034
其中QT表示Q的转置,|V|为物品个数,di为物品嵌入向量的维度,通常情况下di与du被设置成相同的值;用户对物品的评论行为能够看成是一条知识记录,即<用户u,评论内容,物品i>,知识图谱中的某种建模关系的函数φ(.)能够通过已知的两个元素用户u、物品i推断出评论的评价特征,因此,推断的评论的评价特征能够表示成
Figure FDA0002369767640000035
在训练过程中,这种推断被希望尽可能地精确,因此,通过s与
Figure FDA0002369767640000036
比较计算评价生成损失Lg,将其作为额外惩罚项使
Figure FDA0002369767640000037
趋近s,在推荐过程中便能用
Figure FDA0002369767640000038
代替s预测用户对未知物品的评分。
5.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法,其特征在于:在步骤4)中,在训练阶段,以用户对物品的最终评价特征向量s作为输入,利用因子分解机和神经网络相结合的模型进行评分的准确预测,因子分解机通过特征之间的一阶交互和二阶交互建模比较低阶的特征,神经网络在此特征之上利用其高度非线性的特性建模高阶特征;因子分解机的一阶特征
Figure FDA0002369767640000039
其中w是d维的一阶交互层可学习的参数向量,
Figure FDA00023697676400000310
表示向量对应元素相乘;二阶交互通过维度为d×d的参数V将每维特征与一个d维的隐藏向量相联系,增加了各维特征之间的交互,因此,二阶交互特征
Figure FDA0002369767640000041
其中si、sj表示特征向量s的第i、j维,Vi、Vj为对应的隐藏向量,
Figure FDA0002369767640000042
表示向量Vi的每个维度与标量si相乘;前馈神经网络在一阶特征和二阶特征的基础之上对评分进行预测,其过程如下:
Figure FDA0002369767640000043
k=1,2,...,l,y0=hl+hh
Figure FDA0002369767640000044
其中l为神经网络的层数,y(k-1)、yk分别表示第k层的输入和输出,y0为网络的初始输入,yl为网络的最终输出,σ(·)是激活函数,维度为dk×d(k-1)的矩阵
Figure FDA0002369767640000045
为第k层的权重,维度为dk的向量
Figure FDA0002369767640000046
是第k层的偏置,dk为第k层神经元的个数,标量bu、bi和b0分别是用户u、物品i和全局的评分偏置;通过预测评分
Figure FDA0002369767640000047
与真实评分ru,i比较计算评分预测损失Lr,同时为了防止神经网络在评分预测过程中过拟合,对神经网络计算模型复杂度损失Lθ,模型整体的损失L由Lr、Lθ与步骤3)的Lg组合而成,即L=Lr+β·Lg+γ·Lθ,其中β、γ分别是损失Lg和Lθ的权重因子;针对损失L,计算模型参数相对于这个损失的梯度,利用梯度下降算法最小化这个损失直到参数收敛。
6.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法,其特征在于:在步骤5)中,在测试阶段,给定训练好的模型,对于给定用户物品对(u,i)通过嵌入获得其嵌入表示pu、qi,利用pu、qi生成推断的评价向量
Figure FDA0002369767640000048
Figure FDA0002369767640000049
输入回归模型得到用户对物品的预测评分
Figure FDA00023697676400000410
根据
Figure FDA00023697676400000411
高低决定是否向用户u推荐物品i。
CN202010046965.XA 2020-01-16 2020-01-16 一种基于用户评论与满意层面嵌入的商品推荐方法 Expired - Fee Related CN111275521B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010046965.XA CN111275521B (zh) 2020-01-16 2020-01-16 一种基于用户评论与满意层面嵌入的商品推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010046965.XA CN111275521B (zh) 2020-01-16 2020-01-16 一种基于用户评论与满意层面嵌入的商品推荐方法

Publications (2)

Publication Number Publication Date
CN111275521A true CN111275521A (zh) 2020-06-12
CN111275521B CN111275521B (zh) 2022-06-14

Family

ID=71001654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010046965.XA Expired - Fee Related CN111275521B (zh) 2020-01-16 2020-01-16 一种基于用户评论与满意层面嵌入的商品推荐方法

Country Status (1)

Country Link
CN (1) CN111275521B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115358A (zh) * 2020-09-14 2020-12-22 中国船舶重工集团公司第七0九研究所 一种利用知识图谱中多跳路径特征的个性化推荐方法
CN112182156A (zh) * 2020-09-28 2021-01-05 齐鲁工业大学 基于文本处理的方面级可解释深度网络评分预测推荐方法
CN112231577A (zh) * 2020-11-06 2021-01-15 重庆理工大学 一种融合文本语义向量和神经协同过滤的推荐方法
CN112632377A (zh) * 2020-12-21 2021-04-09 西北大学 一种基于用户评论情感分析与矩阵分解的推荐方法
CN112785331A (zh) * 2021-01-07 2021-05-11 之江实验室 一种结合评价文本的抗注入攻击的鲁棒推荐方法和系统
CN112800207A (zh) * 2021-01-13 2021-05-14 桂林电子科技大学 一种商品信息推荐方法、装置及存储介质
CN112884513A (zh) * 2021-02-19 2021-06-01 上海数鸣人工智能科技有限公司 基于深度因子分解机的营销活动预测模型结构和预测方法
CN112884551A (zh) * 2021-02-19 2021-06-01 武汉大学 一种基于近邻用户和评论信息的商品推荐方法
CN113159891A (zh) * 2021-04-24 2021-07-23 桂林电子科技大学 一种基于多种用户表示融合的商品推荐方法
CN113268657A (zh) * 2021-04-16 2021-08-17 中国人民解放军战略支援部队信息工程大学 基于评论和物品描述的深度学习推荐方法及系统
CN114049166A (zh) * 2021-10-12 2022-02-15 华南理工大学 基于离散因子分解机的物品推荐方法
CN114385926A (zh) * 2021-12-02 2022-04-22 山东师范大学 攻击环境下降低无用信息比重的鲁棒性推荐方法及系统
CN114528497A (zh) * 2022-01-18 2022-05-24 华南理工大学 一种面向物品多指标评分数据的推荐方法
CN115222486A (zh) * 2022-07-29 2022-10-21 平安科技(深圳)有限公司 物品推荐模型训练方法、物品推荐方法、装置及存储介质
CN116611896A (zh) * 2023-07-19 2023-08-18 山东省人工智能研究院 基于属性驱动解耦表征学习的多模态推荐方法
CN116610592A (zh) * 2023-07-20 2023-08-18 青岛大学 基于自然语言处理技术的可定制软件测试评价方法及系统
TWI812883B (zh) * 2020-09-22 2023-08-21 中華電信股份有限公司 在行動支付平台上推薦商品的方法及伺服器
CN117216392A (zh) * 2023-09-19 2023-12-12 北京大学 一种基于缺失数据填补的推荐方法和系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250365A (zh) * 2016-07-21 2016-12-21 成都德迈安科技有限公司 基于文本分析的消费者评论中商品属性特征词的提取方法
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
WO2018212710A1 (en) * 2017-05-19 2018-11-22 National University Of Singapore Predictive analysis methods and systems
CN109241424A (zh) * 2018-08-29 2019-01-18 陕西师范大学 一种推荐方法
CN109388731A (zh) * 2018-08-31 2019-02-26 昆明理工大学 一种基于深度神经网络的音乐推荐方法
US20190080383A1 (en) * 2017-09-08 2019-03-14 NEC Laboratories Europe GmbH Method and system for combining user, item and review representations for recommender systems
CN110334759A (zh) * 2019-06-28 2019-10-15 武汉大学 一种评论驱动的深度序列推荐方法
CN110517121A (zh) * 2019-09-23 2019-11-29 重庆邮电大学 基于评论文本情感分析的商品推荐方法及商品推荐装置
CN110648163A (zh) * 2019-08-08 2020-01-03 中山大学 一种基于用户评论的推荐算法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250365A (zh) * 2016-07-21 2016-12-21 成都德迈安科技有限公司 基于文本分析的消费者评论中商品属性特征词的提取方法
WO2018212710A1 (en) * 2017-05-19 2018-11-22 National University Of Singapore Predictive analysis methods and systems
US20190080383A1 (en) * 2017-09-08 2019-03-14 NEC Laboratories Europe GmbH Method and system for combining user, item and review representations for recommender systems
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
CN109241424A (zh) * 2018-08-29 2019-01-18 陕西师范大学 一种推荐方法
CN109388731A (zh) * 2018-08-31 2019-02-26 昆明理工大学 一种基于深度神经网络的音乐推荐方法
CN110334759A (zh) * 2019-06-28 2019-10-15 武汉大学 一种评论驱动的深度序列推荐方法
CN110648163A (zh) * 2019-08-08 2020-01-03 中山大学 一种基于用户评论的推荐算法
CN110517121A (zh) * 2019-09-23 2019-11-29 重庆邮电大学 基于评论文本情感分析的商品推荐方法及商品推荐装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LEI ZHENG 等: ""Joint Deep Modeling of Users and Items Using Reviews for"", 《ARXIV》 *
YI TAY 等: ""Multi-Pointer Co-Attention Networks for Recommendation"", 《ARXIV》 *
张宜浩等: "基于用户评论的深度情感分析和多视图协同融合的混合推荐方法", 《计算机学报》 *
曹人华 等: ""A Review Semantics Based Model for Rating Prediction"", 《IEEE ACCESS》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115358A (zh) * 2020-09-14 2020-12-22 中国船舶重工集团公司第七0九研究所 一种利用知识图谱中多跳路径特征的个性化推荐方法
CN112115358B (zh) * 2020-09-14 2024-04-16 中国船舶重工集团公司第七0九研究所 一种利用知识图谱中多跳路径特征的个性化推荐方法
TWI812883B (zh) * 2020-09-22 2023-08-21 中華電信股份有限公司 在行動支付平台上推薦商品的方法及伺服器
CN112182156A (zh) * 2020-09-28 2021-01-05 齐鲁工业大学 基于文本处理的方面级可解释深度网络评分预测推荐方法
CN112182156B (zh) * 2020-09-28 2023-02-07 齐鲁工业大学 基于文本处理的方面级可解释深度网络评分预测推荐方法
CN112231577A (zh) * 2020-11-06 2021-01-15 重庆理工大学 一种融合文本语义向量和神经协同过滤的推荐方法
CN112231577B (zh) * 2020-11-06 2022-06-03 重庆理工大学 一种融合文本语义向量和神经协同过滤的推荐方法
CN112632377A (zh) * 2020-12-21 2021-04-09 西北大学 一种基于用户评论情感分析与矩阵分解的推荐方法
CN112632377B (zh) * 2020-12-21 2023-06-27 西北大学 一种基于用户评论情感分析与矩阵分解的推荐方法
CN112785331A (zh) * 2021-01-07 2021-05-11 之江实验室 一种结合评价文本的抗注入攻击的鲁棒推荐方法和系统
CN112800207A (zh) * 2021-01-13 2021-05-14 桂林电子科技大学 一种商品信息推荐方法、装置及存储介质
CN112800207B (zh) * 2021-01-13 2022-05-13 桂林电子科技大学 一种商品信息推荐方法、装置及存储介质
CN112884551A (zh) * 2021-02-19 2021-06-01 武汉大学 一种基于近邻用户和评论信息的商品推荐方法
CN112884513A (zh) * 2021-02-19 2021-06-01 上海数鸣人工智能科技有限公司 基于深度因子分解机的营销活动预测模型结构和预测方法
CN112884551B (zh) * 2021-02-19 2023-08-18 武汉大学 一种基于近邻用户和评论信息的商品推荐方法
CN113268657A (zh) * 2021-04-16 2021-08-17 中国人民解放军战略支援部队信息工程大学 基于评论和物品描述的深度学习推荐方法及系统
CN113159891B (zh) * 2021-04-24 2022-05-17 桂林电子科技大学 一种基于多种用户表示融合的商品推荐方法
CN113159891A (zh) * 2021-04-24 2021-07-23 桂林电子科技大学 一种基于多种用户表示融合的商品推荐方法
CN114049166A (zh) * 2021-10-12 2022-02-15 华南理工大学 基于离散因子分解机的物品推荐方法
CN114049166B (zh) * 2021-10-12 2024-04-30 华南理工大学 基于离散因子分解机的物品推荐方法
CN114385926A (zh) * 2021-12-02 2022-04-22 山东师范大学 攻击环境下降低无用信息比重的鲁棒性推荐方法及系统
CN114528497A (zh) * 2022-01-18 2022-05-24 华南理工大学 一种面向物品多指标评分数据的推荐方法
CN114528497B (zh) * 2022-01-18 2024-09-24 华南理工大学 一种面向物品多指标评分数据的推荐方法
CN115222486B (zh) * 2022-07-29 2024-02-02 平安科技(深圳)有限公司 物品推荐模型训练方法、物品推荐方法、装置及存储介质
CN115222486A (zh) * 2022-07-29 2022-10-21 平安科技(深圳)有限公司 物品推荐模型训练方法、物品推荐方法、装置及存储介质
CN116611896B (zh) * 2023-07-19 2023-10-24 山东省人工智能研究院 基于属性驱动解耦表征学习的多模态推荐方法
CN116611896A (zh) * 2023-07-19 2023-08-18 山东省人工智能研究院 基于属性驱动解耦表征学习的多模态推荐方法
CN116610592A (zh) * 2023-07-20 2023-08-18 青岛大学 基于自然语言处理技术的可定制软件测试评价方法及系统
CN116610592B (zh) * 2023-07-20 2023-09-19 青岛大学 基于自然语言处理技术的可定制软件测试评价方法及系统
CN117216392A (zh) * 2023-09-19 2023-12-12 北京大学 一种基于缺失数据填补的推荐方法和系统

Also Published As

Publication number Publication date
CN111275521B (zh) 2022-06-14

Similar Documents

Publication Publication Date Title
CN111275521B (zh) 一种基于用户评论与满意层面嵌入的商品推荐方法
CN111222332B (zh) 一种结合注意力网络和用户情感的商品推荐方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN108763362B (zh) 基于随机锚点对选择的局部模型加权融合Top-N电影推荐方法
CN110245285B (zh) 一种基于异构信息网络的个性化推荐方法
CN111339415A (zh) 一种基于多交互式注意力网络的点击率预测方法与装置
CN106055661B (zh) 基于多Markov链模型的多兴趣资源推荐方法
CN112967088A (zh) 基于知识蒸馏的营销活动预测模型结构和预测方法
CN113255844B (zh) 基于图卷积神经网络交互的推荐方法及系统
CN110110372B (zh) 一种用户时序行为自动切分预测方法
CN111538841B (zh) 基于知识互蒸馏的评论情感分析方法、装置及系统
CN109190109A (zh) 融合用户信息生成评论摘要的方法及装置
CN112416956A (zh) 一种基于bert和独立循环神经网络的问句分类方法
CN111581379B (zh) 一种基于作文扣题度的自动作文评分计算方法
CN114942974A (zh) 电商平台商品用户评价情感倾向分类方法
CN115048855A (zh) 点击率预测模型及其训练方法与应用装置
CN116976505A (zh) 基于信息共享的解耦注意网络的点击率预测方法
CN117593037A (zh) 一种人机交互用户完成能力的预测方法
CN104572623B (zh) 一种在线lda模型的高效数据总结分析方法
CN106844765B (zh) 基于卷积神经网络的显著信息检测方法及装置
CN113095883A (zh) 基于深度交叉注意力网络的视频付费用户预测方法及系统
CN107291686B (zh) 情感标识的辨识方法和情感标识的辨识系统
CN116562284B (zh) 一种政务文本自动分拨模型训练方法及装置
CN116010601A (zh) 一种基于图注意力网络的方面级情感分类方法
CN115687757A (zh) 融合层次注意与特征交互的推荐方法及其应用系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220614

CF01 Termination of patent right due to non-payment of annual fee