CN111275521A - 一种基于用户评论与满意层面嵌入的商品推荐方法 - Google Patents
一种基于用户评论与满意层面嵌入的商品推荐方法 Download PDFInfo
- Publication number
- CN111275521A CN111275521A CN202010046965.XA CN202010046965A CN111275521A CN 111275521 A CN111275521 A CN 111275521A CN 202010046965 A CN202010046965 A CN 202010046965A CN 111275521 A CN111275521 A CN 111275521A
- Authority
- CN
- China
- Prior art keywords
- user
- vector
- comment
- embedding
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 239000013598 vector Substances 0.000 claims abstract description 113
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000011156 evaluation Methods 0.000 claims abstract description 41
- 230000006399 behavior Effects 0.000 claims abstract description 15
- 238000012360 testing method Methods 0.000 claims abstract description 12
- 238000004364 calculation method Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 3
- 239000011159 matrix material Substances 0.000 claims description 28
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 230000007246 mechanism Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 16
- 230000003993 interaction Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000011049 filling Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 2
- 230000002452 interceptive effect Effects 0.000 claims description 2
- 238000002156 mixing Methods 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims description 2
- 238000013459 approach Methods 0.000 claims 1
- 238000009826 distribution Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 5
- 230000002996 emotional effect Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013215 result calculation Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于用户评论与满意层面嵌入的商品推荐方法,包括步骤:1)收集用户历史的评论评分行为,组成训练集;2)在训练中,预处理训练集中的每条评论,计算其语义向量;3)在训练中,利用步骤2)中的语义向量通过层面嵌入计算评价向量s;通过知识图谱的建模方法生成推断的评价向量结合s计算评价生成损失Lg;4)在训练中,利用回归模型以s为输入计算预测评分结合真实评分ru,i计算评分预测损失Lr,计算回归模型复杂度损失Lθ,组合Lr、Lθ与步骤3)的Lg计算整体损失L,利用L对模型进行训练;5)在测试中,利用回归模型以为输入计算预测评分根据生成推荐结果。本发明解决传统方法训练效率低下,模型的透明性、可解释性和准确性不足的问题。
Description
技术领域
本发明涉及电子商务的技术领域,尤其是指一种基于用户评论与满意层面嵌入的商品推荐方法。
背景技术
推荐系统不仅是帮助用户克服信息过载问题,从海量数据中寻找目标信息的有效工具,而且是服务提供商提升用户服务质量和增加利润的重要手段。推荐系统已经成为了现代电子商务系统不可或缺的核心模块之一,推荐方法是推荐系统的基石。衡量推荐方法好坏的标准在于其能否深刻理解用户的兴趣,同时根据商品的特性做出准确的推荐。现代电子商务系统基本都实现了用户对商品的评论模块,用户对物品的评论侧面反映了用户的真实兴趣,是一种推荐系统可以用于提升推荐准确性的重要信息源。
目前,在电子商务领域,基于用户评论的商品推荐方法可以主要分成三类:第一类通过分析用户在评论中表现的情感倾向,构建用户-物品的情感倾向矩阵,然后结合用户对物品的评分矩阵进行矩阵分解,学习用户和物品的隐藏向量表示来进行评分预测。第二类将用户历史所发表的评论和物品所接收的评论进行拼接聚合形成用户聚合评论和物品聚合评论,然后利用主题模型在聚合评论上学习其主题分布,最后将主题分布与评分矩阵分解得到的用户和物品的隐藏向量建立联系来进行评分预测。第三种利用深度学习的端对端特性,直接在用户和物品的聚合评论上应用深度神经网络模型学习用户和物品的特征表示,最后在用户和物品的特征上应用回归模型预测用户对物品的评分。第一种方法依赖于大量的手工标注成本或情感倾向分析工具的准确性,不能实现端对端的学习。第二种和第三种方法需要在用户和物品的聚合评论文本上训练,而用户和物品的聚合评论文本一般比较长且随时间增长,因此训练速度较慢和占用资源较多,因此方法的扩展性和性能有一定的局限性。同时用户在做购买决定时,是对在物品中自己感兴趣的层面进行评价权衡的过程,以往的方法没有建模这样的特性,因此在准确性和可解释性上存在一定的差距。
本发明提出了一种基于用户评论与满意层面嵌入的商品推荐方法,利用类似记忆网络的方法进行满意层面的嵌入学习,模拟用户在各个关心层面分别进行评价再综合进行购买决策的过程,提升了模型的透明性和可解释性。同时本发明改变了以往需要在聚合评论上进行模型训练的范式,实现了在单评论文本上的端对端训练,相较于现有方法,极大地提升了模型的性能和可扩展性。
发明内容
本发明的目的在于克服现有技术的不足,提出了一种基于用户评论与满意层面嵌入的商品推荐方法,解决了现有的基于用户评论的商品推荐方法在速度和可扩展性上的不足,同时在模型中模拟用户购买的决策行为,使得模型在大数据场景下的预测准确率,训练速度和可扩展性方面得到了提升,增加了模型的可解释性。
为实现上述目的,本发明所提供的技术方案为:一种基于用户评论与满意层面嵌入的商品推荐方法,包括以下步骤:
3)在训练中,通过步骤2)得到的语义向量Zu,i计算用户在各个层面的满意度向量a,同时对用户各个满意层面进行嵌入获得其嵌入矩阵表示M,结合M、a计算出用户对物品的评价向量s,利用用户嵌入与物品嵌入,通过知识图谱的建模方法生成推断的评价向量并与s比较计算评价生成损失Lg;
4)在训练中,以评价向量s作为输入,利用回归模型计算用户对物品的预测评分并与真实评分ru,i比较计算评分预测损失Lr,对回归模型计算模型复杂度损失Lθ,将Lr、Lθ与步骤3)的Lg三部分损失组合生成模型整体的损失L,利用L对模型中的参数通过反向传播算法训练直至收敛;
在步骤1)中,利用电子商务系统自带的用户评论系统收集用户对物品的历史评论评分行为,主要的信息包括评论用户的ID、被评论物品的ID、评论的内容文本、具体的评分数值;将用户、物品的ID映射成整数编号再转成one-hot编码向量作为其标识,再与对应的评论du,i、评分ru,i组织成用户历史行为的四元组集合作为后续模型的训练数据Ω。
在步骤2)中,对步骤1)中提取的训练数据集合Ω中的每一条评论du,i进行清洗,去除其中的非文本部分,分词并去除标点,同时对一些不影响文本语义的低频词和大量出现但无意义的停止词进行过滤;对Ω中评论进行长度统计,将出现频率前90%的最长长度作为标准长度n,对评论进行截取或填充使其长度达到n,维护一个所有评论中出现词的词表D,将每条评论文本映射成词编号的形式,处理后的文档表示为其中wn为文档中第n个词的编号;将经过随机初始化或预训练的词嵌入矩阵Wd进行嵌入获得其矩阵表示C,Wd、C分别是维度为|D|×d和n×d的矩阵,其中|D|是词表的大小,d是词向量的维度;词嵌入具体是指对中的每个词wk应用映射 为词wk对应的词向量;得到评论的矩阵表示后,计算其平均的语义向量利用注意力机制计算评论文档中每个词在最终语义的重要性,表示为e=soft max(C·H·c0),e是n维的向量,其第k维ek表示文档中第k个词在最终语义的重要性,其中维度为n×n的矩阵H是注意力机制中的参数,soft max(.)是指softmax激活函数;最终评论的语义向量通过词的重要性和词向量的线性组合得到,即其中表示标量ek与向量的每个维度相乘,结果Zu,i是d维的语义向量。
在步骤3)中,以步骤2)中得到的评论语义向量Zu,i为输入,利用注意力机制计算用户对物品各个层面的满意度a=sof tmax(WaZu,i+ba),实质是|E|维的向量,|E|是层面的个数,维度为|E|×d的矩阵Wa为注意力机制中的权重,维度为|E|的向量ba是注意力机制中的偏置;物品的各个层面利用层面嵌入能够表示成维度为|E|×da的矩阵M,da是层面嵌入向量的维度,则用户对物品的最终评价向量是满意度与层面嵌入向量的线性组合,即s=aTM,aTM表满意度向量a经过转置后与矩阵M相乘,得到的结果s是da维的评价向量;训练时能够从评论中提取用户对物品的评价向量s,但在推荐阶段评价向量s是不可用的,因为用户购买行为总是先于评论行为发生,通过对用户和物品进行嵌入,知识图谱的建模方法被用来克服这样的困境:首先,用户u通过其标识向量经过维度为|U|×du的嵌入矩阵P获得其嵌入表示其中PT表示P的转置,|U|表示用户个数,du是用户嵌入向量的维度;同理,物品i通过其标识向量经过维度为|V|×di的嵌入矩阵Q等到其嵌入表示其中QT表示Q的转置,|V|为物品个数,di为物品嵌入向量的维度,通常情况下di与du被设置成相同的值;用户对物品的评论行为能够看成是一条知识记录,即<用户u,评论内容,物品i>,知识图谱中的某种建模关系的函数φ(.)能够通过已知的两个元素用户u、物品i推断出评论的评价特征,因此,推断的评论的评价特征能够表示成在训练过程中,这种推断被希望尽可能地精确,因此,通过s与比较计算评价生成损失Lg,将其作为额外惩罚项使尽可能趋近s,在推荐过程中便能用代替s预测用户对未知物品的评分。
在步骤4)中,在训练阶段,以用户对物品的最终评价特征向量s作为输入,利用因子分解机和神经网络相结合的模型进行评分的准确预测,因子分解机通过特征之间的一阶交互和二阶交互建模比较低阶的特征,神经网络在此特征之上利用其高度非线性的特性建模高阶特征;因子分解机的一阶特征其中w是d维的一阶交互层可学习的参数向量,表示向量对应元素相乘;二阶交互通过维度为d×d的参数V将每维特征与一个d维的隐藏向量相联系,增加了各维特征之间的交互,因此,二阶交互特征其中si、sj表示特征向量s的第i、j维,Vi、Vj为对应的隐藏向量,表示向量Vi的每个维度与标量si相乘;前馈神经网络在一阶特征和二阶特征的基础之上对评分进行预测,其过程如下:k=1,2,...,l,y0=hl+hh,其中l为神经网络的层数,y(k-1)、yk分别表示第k层的输入和输出,y0为网络的初始输入,yl为网络的最终输出,σ(·)是激活函数,维度为dk×d(k-1)的矩阵为第k层的权重,维度为dk的向量是第k层的偏置,dk为第k层神经元的个数,标量bu、bi和b0分别是用户u、物品i和全局的评分偏置;通过预测评分与真实评分ru,i比较计算评分预测损失Lr,同时为了防止神经网络在评分预测过程中过拟合,对神经网络计算模型复杂度损失Lθ,模型整体的损失L由Lr、Lθ与步骤3)的Lg组合而成,即L=Lr+β·Lg+γ·Lθ,其中β、γ分别是损失Lg和Lθ的权重因子;针对损失L,计算模型参数相对于这个损失的梯度,利用梯度下降算法最小化这个损失直到参数收敛。
在步骤5)中,在测试阶段,给定训练好的模型,对于给定用户物品对(u,i)通过嵌入获得其嵌入表示pu、qi,利用pu、qi生成推断的评价向量将输入回归模型得到用户对物品的预测评分根据高低决定是否向用户u推荐物品i。
本发明与现有技术相比,具有如下优点与有益效果:
1、通过用户满意层面嵌入和注意力机制模拟用户在对物品的评论中先对物品各个层面分别评价再综合总结的过程,更加准确地建模了评论的语义,增加模型的透明性和可解释性。
2、本发明提出的模型实现了利用单评论文本进行端对端的训练,改变了现有方法需要用聚合文本进行训练的模式,降低了模型训练过程中的资源消耗,提高了训练的速度。
3、通过知识图谱的建模方法推断用户对物品的评价特征向量,在训练中使用惩罚项技术使推断生成的评价向量近似用户对物品的真实评价,提高了模型在推荐时的准确度。
4、本发明在电子商务领域具有广泛的应用空间,改进的训练方法适合分布式训练,同时缩短了推荐结果计算的响应时间,且易于操作,有着广阔的实践应用场景。
附图说明
图1是本发明方法流程图。
图2是模型的总体示意图。
图3是利用词嵌入和注意力机制提取评论语义的示意图。
图4是利用层面嵌入和注意力机制提取评价特征的示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
如图1和图2所示,本实施实例所提供的基于用户评论与满意层面嵌入的商品推荐方法,其包含的主要步骤如下:
1)收集用户评论评分行为,组成模型的训练、验证和测试数据,其中训练数据用来训练模型,验证数据用来确定模型的超参数,测试数据用来评测模型的实际性能。所用数据集为推荐系统研究人员利用网络爬虫从亚马逊电子商城爬取的用户评论评分记录,每一条记录都是一个json对象,我们提取其属性中的reviwerID作为用户ID,asin做为商品ID,overall作为评分ru,i,reviewText作为评论内容du,i。提取所需内容后,我们对用户ID和物品ID进行one-hot编码成用户、物品的标识向量和同时将整个数据集以8:1:1的比例划分成训练集、验证集和测试集。训练集表示为验证集和测试集与其具有相同的格式。
2)对于训练集Ω中的每一条评论du,i,首先使用正则表达式‘\w+’处理使其只保留单词部分,同时使用nltk库对保留单词进行停止词的过滤。对过滤后的文档,对其建立一个词到从1递增编号的字典D。统计每个文档的长度,对文档长度进行排序,取前90%的最长文本长度作为标准长度n,在本例中n=300。对于处理后的每个文档,利用D将其中的词映射成对应的词编号,如果文档长度大于n则截断成n,不足则末尾用0填充,经此处理后的文档表示成对于处理后的文档利用如图3所示的网络结构使用词嵌入与注意力机制提取其语义表示Zu,i。首先我们进行参数初始化,用[-1,1]的均匀分布对词嵌入矩阵Wd进行初始化,词向量的维度d根据验证集的表现设置为[16,32,64]中的某个值,用标准差为0.1的标准正态分布对注意力层参数H进行初始化。然后文档中的每个词用其编号在嵌入矩阵中查找对应向量,最后文档可以表示成一个稠密矩阵C。对文档中每个词的词向量求平均获得其平均语义向量通过c0、H、C计算文档中每个词向量的重要性向量e=soft max(CHc0),最后以e为权重对每个词向量进行加权求和得到文档的整体语义向量
3)在训练中,为了对评论的语义进行更细粒度的建模,对于Zu,i利用满意层面嵌入计算用户的评价向量s。具体的计算过程如图4所示,首先我们假定存在|E|个用户关注的层面,|E|的取值根据验证集的表现在[16,32,64]中选取最优值。对于每一个层面f都有一个嵌入向量mf与之对应,为了简单起见这些向量的维度da被设置成与词向量一致,即da=d,同时这些向量都经过标准差为0.1的正态分布进行初始化,最后得到所有层面的矩阵表示M。给定语义向量Zu,i首先对注意力层的权重Wa用标准差为0.1的正态分布初始化,偏置向量ba初始化为0,然后计算用户在各个层面的满意度a=softmax(WaZu,i+ba),最后将满意度与对应层面的满意层面嵌入向量相乘得到评价向量s=aTM。为了使模型在推荐时精确工作,知识图谱中的TransE模型被用来推断生成用户的评价向量。首先利用标准差为0.1的正态分布分别初始化用户、物品的嵌入矩阵P和Q,通过用户、物品标识向量和利用用户、物品的嵌入矩阵嵌入得到用户、物品的嵌入表示根据TransE模型,推断生成的评价向量为了使生成的评价向量尽可能接近真实评价向量s,l2损失被用做评价生成损失函数,即其中||.||2表示对目标的矩阵或向量的每个元素平方再求和。
4)在训练中,首先对因子分解机的一阶交互层参数w、二阶交互层参数V和神经网络参数以标准差为0.1的正态分布进行初始化。其中神经网络的层数l设置为3,每一层的神经元个数d1、d2、d3分别为d、1,表示向下取整,每层的激活函数σ(.)都设置成线性整流函数ReLU(.)。以评价向量s为输入,首先通过因子分解机得到一阶特征和二阶交互特征以这两种特征之和为神经网络的输入,即y0=hl+hh,通过神经网络的计算获得l层的输出yl,再结合用户u、物品i和全局的评分偏置bu、bi和b0得到用户对物品的预测评分将预测评分与真实评分ru,i通过平方误差计算评分预测损失同时为了防止模型过拟合,对神经网络计算一个模型复杂度损失Lθ,具体为各层权重的l2损失之和,即总的损失函数为三部分损失的加权和,即L=Lr+β·Lg+γ·Lθ,其中β、γ的值在{1,0.1,0.01}中根据验证集的结果进行挑选。有了损失函数后,利用tensorflow中的Adam优化器对模型的参数进行训练直至收敛,初始的学习率通过验证集表现在{0.01,0.001,0.0001}中挑选得到,同时使用批训练机制和提前停止机制,批样本大小被设置成256。
5)在测试中,给定训练好的模型,对于测试集中每个用户、物品对(u,i),首先经过嵌入得到其嵌入表示pu、qi,然后通过TransE模型生成推断评价向量将输入到因子分解机和神经网络中得到预测的评分根据决定是否向用户u推荐物品i。这种推荐方式的准确性取决于评分预测的准确性,所以我们使用评分预测的度量指标平均平方损失(MSE)来衡量推荐的准确性,MSE定义如下:
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
Claims (6)
1.一种基于用户评论与满意层面嵌入的商品推荐方法,其特征在于,包括以下步骤:
3)在训练中,通过步骤2)得到的语义向量Zu,i计算用户在各个层面的满意度向量a,同时对用户各个满意层面进行嵌入获得其嵌入矩阵表示M,结合M、a计算出用户对物品的评价向量s,利用用户嵌入与物品嵌入,通过知识图谱的建模方法生成推断的评价向量并与s比较计算评价生成损失Lg;
4)在训练中,以评价向量s作为输入,利用回归模型计算用户对物品的预测评分并与真实评分ru,i比较计算评分预测损失Lr,对回归模型计算模型复杂度损失Lθ,将Lr、Lθ与步骤3)的Lg三部分损失组合生成模型整体的损失L,利用L对模型中的参数通过反向传播算法训练直至收敛;
3.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法,其特征在于:在步骤2)中,对步骤1)中提取的训练数据集合Ω中的每一条评论du,i进行清洗,去除其中的非文本部分,分词并去除标点,同时对一些不影响文本语义的低频词和大量出现但无意义的停止词进行过滤;对Ω中评论进行长度统计,将出现频率前90%的最长长度作为标准长度n,对评论进行截取或填充使其长度达到n,维护一个所有评论中出现词的词表D,将每条评论文本映射成词编号的形式,处理后的文档表示为其中wn为文档中第n个词的编号;将经过随机初始化或预训练的词嵌入矩阵Wd进行嵌入获得其矩阵表示C,Wd、C分别是维度为|D|×d和n×d的矩阵,其中|D|是词表的大小,d是词向量的维度;词嵌入具体是指对中的每个词wk应用映射χ: 为词wk对应的词向量;得到评论的矩阵表示后,计算其平均的语义向量利用注意力机制计算评论文档中每个词在最终语义的重要性,表示为e=soft max(C·H·c0),e是n维的向量,其第k维ek表示文档中第k个词在最终语义的重要性,其中维度为n×n的矩阵H是注意力机制中的参数,soft max(.)是指soft max激活函数;最终评论的语义向量通过词的重要性和词向量的线性组合得到,即其中表示标量ek与向量的每个维度相乘,结果Zu,i是d维的语义向量。
4.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法,其特征在于:在步骤3)中,以步骤2)中得到的评论语义向量Zu,i为输入,利用注意力机制计算用户对物品各个层面的满意度a=soft max(WaZu,i+ba),实质是|E|维的向量,|E|是层面的个数,维度为|E|×d的矩阵Wa为注意力机制中的权重,维度为|E|的向量ba是注意力机制中的偏置;物品的各个层面利用层面嵌入能够表示成维度为|E|×da的矩阵M,da是层面嵌入向量的维度,则用户对物品的最终评价向量是满意度与层面嵌入向量的线性组合,即s=aTM,aTM表满意度向量a经过转置后与矩阵M相乘,得到的结果s是da维的评价向量;训练时能够从评论中提取用户对物品的评价向量s,但在推荐阶段评价向量s是不可用的,因为用户购买行为总是先于评论行为发生,通过对用户和物品进行嵌入,知识图谱的建模方法被用来克服这样的困境:首先,用户u通过其标识向量经过维度为|U|×du的嵌入矩阵P获得其嵌入表示其中PT表示P的转置,|U|表示用户个数,du是用户嵌入向量的维度;同理,物品i通过其标识向量经过维度为|V|×di的嵌入矩阵Q等到其嵌入表示其中QT表示Q的转置,|V|为物品个数,di为物品嵌入向量的维度,通常情况下di与du被设置成相同的值;用户对物品的评论行为能够看成是一条知识记录,即<用户u,评论内容,物品i>,知识图谱中的某种建模关系的函数φ(.)能够通过已知的两个元素用户u、物品i推断出评论的评价特征,因此,推断的评论的评价特征能够表示成在训练过程中,这种推断被希望尽可能地精确,因此,通过s与比较计算评价生成损失Lg,将其作为额外惩罚项使趋近s,在推荐过程中便能用代替s预测用户对未知物品的评分。
5.根据权利要求1所述的一种基于用户评论与满意层面嵌入的商品推荐方法,其特征在于:在步骤4)中,在训练阶段,以用户对物品的最终评价特征向量s作为输入,利用因子分解机和神经网络相结合的模型进行评分的准确预测,因子分解机通过特征之间的一阶交互和二阶交互建模比较低阶的特征,神经网络在此特征之上利用其高度非线性的特性建模高阶特征;因子分解机的一阶特征其中w是d维的一阶交互层可学习的参数向量,表示向量对应元素相乘;二阶交互通过维度为d×d的参数V将每维特征与一个d维的隐藏向量相联系,增加了各维特征之间的交互,因此,二阶交互特征其中si、sj表示特征向量s的第i、j维,Vi、Vj为对应的隐藏向量,表示向量Vi的每个维度与标量si相乘;前馈神经网络在一阶特征和二阶特征的基础之上对评分进行预测,其过程如下:k=1,2,...,l,y0=hl+hh,其中l为神经网络的层数,y(k-1)、yk分别表示第k层的输入和输出,y0为网络的初始输入,yl为网络的最终输出,σ(·)是激活函数,维度为dk×d(k-1)的矩阵为第k层的权重,维度为dk的向量是第k层的偏置,dk为第k层神经元的个数,标量bu、bi和b0分别是用户u、物品i和全局的评分偏置;通过预测评分与真实评分ru,i比较计算评分预测损失Lr,同时为了防止神经网络在评分预测过程中过拟合,对神经网络计算模型复杂度损失Lθ,模型整体的损失L由Lr、Lθ与步骤3)的Lg组合而成,即L=Lr+β·Lg+γ·Lθ,其中β、γ分别是损失Lg和Lθ的权重因子;针对损失L,计算模型参数相对于这个损失的梯度,利用梯度下降算法最小化这个损失直到参数收敛。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010046965.XA CN111275521B (zh) | 2020-01-16 | 2020-01-16 | 一种基于用户评论与满意层面嵌入的商品推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010046965.XA CN111275521B (zh) | 2020-01-16 | 2020-01-16 | 一种基于用户评论与满意层面嵌入的商品推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111275521A true CN111275521A (zh) | 2020-06-12 |
CN111275521B CN111275521B (zh) | 2022-06-14 |
Family
ID=71001654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010046965.XA Expired - Fee Related CN111275521B (zh) | 2020-01-16 | 2020-01-16 | 一种基于用户评论与满意层面嵌入的商品推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111275521B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112115358A (zh) * | 2020-09-14 | 2020-12-22 | 中国船舶重工集团公司第七0九研究所 | 一种利用知识图谱中多跳路径特征的个性化推荐方法 |
CN112182156A (zh) * | 2020-09-28 | 2021-01-05 | 齐鲁工业大学 | 基于文本处理的方面级可解释深度网络评分预测推荐方法 |
CN112231577A (zh) * | 2020-11-06 | 2021-01-15 | 重庆理工大学 | 一种融合文本语义向量和神经协同过滤的推荐方法 |
CN112632377A (zh) * | 2020-12-21 | 2021-04-09 | 西北大学 | 一种基于用户评论情感分析与矩阵分解的推荐方法 |
CN112785331A (zh) * | 2021-01-07 | 2021-05-11 | 之江实验室 | 一种结合评价文本的抗注入攻击的鲁棒推荐方法和系统 |
CN112800207A (zh) * | 2021-01-13 | 2021-05-14 | 桂林电子科技大学 | 一种商品信息推荐方法、装置及存储介质 |
CN112884513A (zh) * | 2021-02-19 | 2021-06-01 | 上海数鸣人工智能科技有限公司 | 基于深度因子分解机的营销活动预测模型结构和预测方法 |
CN112884551A (zh) * | 2021-02-19 | 2021-06-01 | 武汉大学 | 一种基于近邻用户和评论信息的商品推荐方法 |
CN113159891A (zh) * | 2021-04-24 | 2021-07-23 | 桂林电子科技大学 | 一种基于多种用户表示融合的商品推荐方法 |
CN113268657A (zh) * | 2021-04-16 | 2021-08-17 | 中国人民解放军战略支援部队信息工程大学 | 基于评论和物品描述的深度学习推荐方法及系统 |
CN114049166A (zh) * | 2021-10-12 | 2022-02-15 | 华南理工大学 | 基于离散因子分解机的物品推荐方法 |
CN114385926A (zh) * | 2021-12-02 | 2022-04-22 | 山东师范大学 | 攻击环境下降低无用信息比重的鲁棒性推荐方法及系统 |
CN114528497A (zh) * | 2022-01-18 | 2022-05-24 | 华南理工大学 | 一种面向物品多指标评分数据的推荐方法 |
CN115222486A (zh) * | 2022-07-29 | 2022-10-21 | 平安科技(深圳)有限公司 | 物品推荐模型训练方法、物品推荐方法、装置及存储介质 |
CN116611896A (zh) * | 2023-07-19 | 2023-08-18 | 山东省人工智能研究院 | 基于属性驱动解耦表征学习的多模态推荐方法 |
CN116610592A (zh) * | 2023-07-20 | 2023-08-18 | 青岛大学 | 基于自然语言处理技术的可定制软件测试评价方法及系统 |
TWI812883B (zh) * | 2020-09-22 | 2023-08-21 | 中華電信股份有限公司 | 在行動支付平台上推薦商品的方法及伺服器 |
CN117216392A (zh) * | 2023-09-19 | 2023-12-12 | 北京大学 | 一种基于缺失数据填补的推荐方法和系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250365A (zh) * | 2016-07-21 | 2016-12-21 | 成都德迈安科技有限公司 | 基于文本分析的消费者评论中商品属性特征词的提取方法 |
CN108363753A (zh) * | 2018-01-30 | 2018-08-03 | 南京邮电大学 | 评论文本情感分类模型训练与情感分类方法、装置及设备 |
WO2018212710A1 (en) * | 2017-05-19 | 2018-11-22 | National University Of Singapore | Predictive analysis methods and systems |
CN109241424A (zh) * | 2018-08-29 | 2019-01-18 | 陕西师范大学 | 一种推荐方法 |
CN109388731A (zh) * | 2018-08-31 | 2019-02-26 | 昆明理工大学 | 一种基于深度神经网络的音乐推荐方法 |
US20190080383A1 (en) * | 2017-09-08 | 2019-03-14 | NEC Laboratories Europe GmbH | Method and system for combining user, item and review representations for recommender systems |
CN110334759A (zh) * | 2019-06-28 | 2019-10-15 | 武汉大学 | 一种评论驱动的深度序列推荐方法 |
CN110517121A (zh) * | 2019-09-23 | 2019-11-29 | 重庆邮电大学 | 基于评论文本情感分析的商品推荐方法及商品推荐装置 |
CN110648163A (zh) * | 2019-08-08 | 2020-01-03 | 中山大学 | 一种基于用户评论的推荐算法 |
-
2020
- 2020-01-16 CN CN202010046965.XA patent/CN111275521B/zh not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250365A (zh) * | 2016-07-21 | 2016-12-21 | 成都德迈安科技有限公司 | 基于文本分析的消费者评论中商品属性特征词的提取方法 |
WO2018212710A1 (en) * | 2017-05-19 | 2018-11-22 | National University Of Singapore | Predictive analysis methods and systems |
US20190080383A1 (en) * | 2017-09-08 | 2019-03-14 | NEC Laboratories Europe GmbH | Method and system for combining user, item and review representations for recommender systems |
CN108363753A (zh) * | 2018-01-30 | 2018-08-03 | 南京邮电大学 | 评论文本情感分类模型训练与情感分类方法、装置及设备 |
CN109241424A (zh) * | 2018-08-29 | 2019-01-18 | 陕西师范大学 | 一种推荐方法 |
CN109388731A (zh) * | 2018-08-31 | 2019-02-26 | 昆明理工大学 | 一种基于深度神经网络的音乐推荐方法 |
CN110334759A (zh) * | 2019-06-28 | 2019-10-15 | 武汉大学 | 一种评论驱动的深度序列推荐方法 |
CN110648163A (zh) * | 2019-08-08 | 2020-01-03 | 中山大学 | 一种基于用户评论的推荐算法 |
CN110517121A (zh) * | 2019-09-23 | 2019-11-29 | 重庆邮电大学 | 基于评论文本情感分析的商品推荐方法及商品推荐装置 |
Non-Patent Citations (4)
Title |
---|
LEI ZHENG 等: ""Joint Deep Modeling of Users and Items Using Reviews for"", 《ARXIV》 * |
YI TAY 等: ""Multi-Pointer Co-Attention Networks for Recommendation"", 《ARXIV》 * |
张宜浩等: "基于用户评论的深度情感分析和多视图协同融合的混合推荐方法", 《计算机学报》 * |
曹人华 等: ""A Review Semantics Based Model for Rating Prediction"", 《IEEE ACCESS》 * |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112115358A (zh) * | 2020-09-14 | 2020-12-22 | 中国船舶重工集团公司第七0九研究所 | 一种利用知识图谱中多跳路径特征的个性化推荐方法 |
CN112115358B (zh) * | 2020-09-14 | 2024-04-16 | 中国船舶重工集团公司第七0九研究所 | 一种利用知识图谱中多跳路径特征的个性化推荐方法 |
TWI812883B (zh) * | 2020-09-22 | 2023-08-21 | 中華電信股份有限公司 | 在行動支付平台上推薦商品的方法及伺服器 |
CN112182156A (zh) * | 2020-09-28 | 2021-01-05 | 齐鲁工业大学 | 基于文本处理的方面级可解释深度网络评分预测推荐方法 |
CN112182156B (zh) * | 2020-09-28 | 2023-02-07 | 齐鲁工业大学 | 基于文本处理的方面级可解释深度网络评分预测推荐方法 |
CN112231577A (zh) * | 2020-11-06 | 2021-01-15 | 重庆理工大学 | 一种融合文本语义向量和神经协同过滤的推荐方法 |
CN112231577B (zh) * | 2020-11-06 | 2022-06-03 | 重庆理工大学 | 一种融合文本语义向量和神经协同过滤的推荐方法 |
CN112632377A (zh) * | 2020-12-21 | 2021-04-09 | 西北大学 | 一种基于用户评论情感分析与矩阵分解的推荐方法 |
CN112632377B (zh) * | 2020-12-21 | 2023-06-27 | 西北大学 | 一种基于用户评论情感分析与矩阵分解的推荐方法 |
CN112785331A (zh) * | 2021-01-07 | 2021-05-11 | 之江实验室 | 一种结合评价文本的抗注入攻击的鲁棒推荐方法和系统 |
CN112800207A (zh) * | 2021-01-13 | 2021-05-14 | 桂林电子科技大学 | 一种商品信息推荐方法、装置及存储介质 |
CN112800207B (zh) * | 2021-01-13 | 2022-05-13 | 桂林电子科技大学 | 一种商品信息推荐方法、装置及存储介质 |
CN112884551A (zh) * | 2021-02-19 | 2021-06-01 | 武汉大学 | 一种基于近邻用户和评论信息的商品推荐方法 |
CN112884513A (zh) * | 2021-02-19 | 2021-06-01 | 上海数鸣人工智能科技有限公司 | 基于深度因子分解机的营销活动预测模型结构和预测方法 |
CN112884551B (zh) * | 2021-02-19 | 2023-08-18 | 武汉大学 | 一种基于近邻用户和评论信息的商品推荐方法 |
CN113268657A (zh) * | 2021-04-16 | 2021-08-17 | 中国人民解放军战略支援部队信息工程大学 | 基于评论和物品描述的深度学习推荐方法及系统 |
CN113159891B (zh) * | 2021-04-24 | 2022-05-17 | 桂林电子科技大学 | 一种基于多种用户表示融合的商品推荐方法 |
CN113159891A (zh) * | 2021-04-24 | 2021-07-23 | 桂林电子科技大学 | 一种基于多种用户表示融合的商品推荐方法 |
CN114049166A (zh) * | 2021-10-12 | 2022-02-15 | 华南理工大学 | 基于离散因子分解机的物品推荐方法 |
CN114049166B (zh) * | 2021-10-12 | 2024-04-30 | 华南理工大学 | 基于离散因子分解机的物品推荐方法 |
CN114385926A (zh) * | 2021-12-02 | 2022-04-22 | 山东师范大学 | 攻击环境下降低无用信息比重的鲁棒性推荐方法及系统 |
CN114528497A (zh) * | 2022-01-18 | 2022-05-24 | 华南理工大学 | 一种面向物品多指标评分数据的推荐方法 |
CN114528497B (zh) * | 2022-01-18 | 2024-09-24 | 华南理工大学 | 一种面向物品多指标评分数据的推荐方法 |
CN115222486B (zh) * | 2022-07-29 | 2024-02-02 | 平安科技(深圳)有限公司 | 物品推荐模型训练方法、物品推荐方法、装置及存储介质 |
CN115222486A (zh) * | 2022-07-29 | 2022-10-21 | 平安科技(深圳)有限公司 | 物品推荐模型训练方法、物品推荐方法、装置及存储介质 |
CN116611896B (zh) * | 2023-07-19 | 2023-10-24 | 山东省人工智能研究院 | 基于属性驱动解耦表征学习的多模态推荐方法 |
CN116611896A (zh) * | 2023-07-19 | 2023-08-18 | 山东省人工智能研究院 | 基于属性驱动解耦表征学习的多模态推荐方法 |
CN116610592A (zh) * | 2023-07-20 | 2023-08-18 | 青岛大学 | 基于自然语言处理技术的可定制软件测试评价方法及系统 |
CN116610592B (zh) * | 2023-07-20 | 2023-09-19 | 青岛大学 | 基于自然语言处理技术的可定制软件测试评价方法及系统 |
CN117216392A (zh) * | 2023-09-19 | 2023-12-12 | 北京大学 | 一种基于缺失数据填补的推荐方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111275521B (zh) | 2022-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111275521B (zh) | 一种基于用户评论与满意层面嵌入的商品推荐方法 | |
CN111222332B (zh) | 一种结合注意力网络和用户情感的商品推荐方法 | |
CN111797321B (zh) | 一种面向不同场景的个性化知识推荐方法及系统 | |
CN108763362B (zh) | 基于随机锚点对选择的局部模型加权融合Top-N电影推荐方法 | |
CN110245285B (zh) | 一种基于异构信息网络的个性化推荐方法 | |
CN111339415A (zh) | 一种基于多交互式注意力网络的点击率预测方法与装置 | |
CN106055661B (zh) | 基于多Markov链模型的多兴趣资源推荐方法 | |
CN112967088A (zh) | 基于知识蒸馏的营销活动预测模型结构和预测方法 | |
CN113255844B (zh) | 基于图卷积神经网络交互的推荐方法及系统 | |
CN110110372B (zh) | 一种用户时序行为自动切分预测方法 | |
CN111538841B (zh) | 基于知识互蒸馏的评论情感分析方法、装置及系统 | |
CN109190109A (zh) | 融合用户信息生成评论摘要的方法及装置 | |
CN112416956A (zh) | 一种基于bert和独立循环神经网络的问句分类方法 | |
CN111581379B (zh) | 一种基于作文扣题度的自动作文评分计算方法 | |
CN114942974A (zh) | 电商平台商品用户评价情感倾向分类方法 | |
CN115048855A (zh) | 点击率预测模型及其训练方法与应用装置 | |
CN116976505A (zh) | 基于信息共享的解耦注意网络的点击率预测方法 | |
CN117593037A (zh) | 一种人机交互用户完成能力的预测方法 | |
CN104572623B (zh) | 一种在线lda模型的高效数据总结分析方法 | |
CN106844765B (zh) | 基于卷积神经网络的显著信息检测方法及装置 | |
CN113095883A (zh) | 基于深度交叉注意力网络的视频付费用户预测方法及系统 | |
CN107291686B (zh) | 情感标识的辨识方法和情感标识的辨识系统 | |
CN116562284B (zh) | 一种政务文本自动分拨模型训练方法及装置 | |
CN116010601A (zh) | 一种基于图注意力网络的方面级情感分类方法 | |
CN115687757A (zh) | 融合层次注意与特征交互的推荐方法及其应用系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220614 |
|
CF01 | Termination of patent right due to non-payment of annual fee |