CN109598586B - 一种基于注意力模型的推荐方法 - Google Patents

一种基于注意力模型的推荐方法 Download PDF

Info

Publication number
CN109598586B
CN109598586B CN201811455085.7A CN201811455085A CN109598586B CN 109598586 B CN109598586 B CN 109598586B CN 201811455085 A CN201811455085 A CN 201811455085A CN 109598586 B CN109598586 B CN 109598586B
Authority
CN
China
Prior art keywords
user
score
users
emotion
scores
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811455085.7A
Other languages
English (en)
Other versions
CN109598586A (zh
Inventor
初妍
单晨琪
郑丽颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201811455085.7A priority Critical patent/CN109598586B/zh
Publication of CN109598586A publication Critical patent/CN109598586A/zh
Application granted granted Critical
Publication of CN109598586B publication Critical patent/CN109598586B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于计算机技术领域中的推荐系统领域,具体涉及一种基于注意力模型的推荐方法。本发明首先将用户对商品的评分表示成用户商品评分矩阵;然后,将用户评论中的词语映射成词向量,作为双向循环神经网络的输入,并在双向循环神经网络的隐层之后加入注意力模型,用于提取重要情感词语的特征;接着,通过注意力模型为每条评论生成情感评分;最后,将用户对商品的真实评分与情感评分进行加权,更新用户评分矩阵,使用传统的协同过滤推荐方法为用户进行推荐。本发明可以有效的改善传统的推荐方法中对输入信息的稀释问题,同时考虑用户的情感因素对评论结果的影响,能够更准确地更正用户的评分行为,进而提高了推荐的准确率。

Description

一种基于注意力模型的推荐方法
技术领域
本发明属于计算机技术领域中的推荐系统领域,具体涉及一种基于注意力模型的推荐方法。
背景技术
随着大数据时代的到来,越来越多的信息充斥着人们的生活。如何从大量的信息中迅速检索出人们需要的内容成为研究者关注的重点,推荐系统应运而生。在电子商务领域,推荐系统应用广泛。人们在选择商品时,往往无法确切的描述自己所需要物品的信息,推荐系统可以主动向用户推荐其感兴趣的商品,使商家获得了更多的利益,也让用户有了更好的使用体验。
目前,常见的推荐方法包括基于协同过滤的推荐方法和基于内容的推荐方法。这两种方法根据用户的评分及消费历史来获得推测用户的喜好,来寻找具有相似喜好的用户,从而对其进行选择的商品相互推荐。但是,这种评分方式不能准确地代表用户的喜爱程度,因为每个人评价的标准不同,用户的评级行为存在差异。
发明内容
本发明的目的在于利用循环神经网络分析用户的评论信息,在循环神经网络模型中引入注意力机制,解决传统推荐方法中没有考虑用户评价标准不同的问题,更加准确的将用户选择的产品进行相互推荐,本发明提出了一种基于注意力模型的推荐方法。实验数据表明,本发明方法所推荐出的结果比传统的推荐方法具有更高的精度。
本发明的目的是这样实现的:
一种基于注意力模型的推荐方法,包括如下步骤:
(1)建立用户评分矩阵,把m个用户对n个商品的评分形成一个m*n的评分矩阵R,矩阵中的项Rij表示用户ui对商品ij的评分;
(2)去除评论语句中的停用词,并将评论的词语映射成词向量;
(3)建立基于注意力模型的Encoder-Decoder模型,得到输出单元yi
(4)计算情感评分Score(emotion);
(5)根据用户的真实评分和情感的分进行加权,得到用户的最终得分来更新用户评分矩阵,然后计算用户评分之间的相似性,把与用户U最相似的前N个用户的近期消费商品推荐给用户U,完成推荐操作。
所述步骤(1)中的用户评分矩阵是这样建立的:m名用户构成用户集合U={u1,u2,…,um},n件商品构成项目集合I={i1,i2,…,in},用户评分矩阵R表示为:
Figure BDA0001887566950000021
其中,用户ui对商品ij的评分即为Rij
所述步骤(4)中情感评分Score(emotion)计算公式如下:
Figure BDA0001887566950000022
αi是注意力权重,其表达式为:
Figure BDA0001887566950000023
βi是i时刻状态yi的注意力得分,其表达式为:βi=Vαtan(yiWα+bα),其中,Vα和Wα是已知的权重参数,bα是偏置单元。
所述步骤(5)中对用户的真实评分和情感评分进行加权,得到用户的最终得分来更新用户评分矩阵,表达式如下:Rij=α·Score(emotion)+(1-α)·R’ij,α代表情感得分的权重分配,其值的大小在0到1之间;R’ij是用户的真实评分,通过二者的计算,为用户生成更能代表其本意的最终得分;利用更新的Rij计算用户之间的相似性,表达式为:
Figure BDA0001887566950000024
式中d(ui+uj)是n维空间上的欧式距离,即:
Figure BDA0001887566950000025
进一步地,将所有用户按照与被推荐用户U的相似度进行排序,把与用户U最相似的前N个用户的近期消费商品推荐给用户U,完成推荐操作。
本发明的有益效果在于:
本发明可以有效的改善传统的推荐方法中对输入信息的稀释问题,同时考虑用户的情感因素对评论结果的影响,可以更加准确的在户之间进行喜爱商品的推荐。
附图说明
图1是基于注意力模型的推荐方法的基本流程图;
图2是Encoder-decoder模型的基本原理;
图3是基于注意力模型的Encoder-decoder模型;
图4是双向循环神经网络模型。
具体实施方式
下面结合附图对本发明进一步详细说明。
一种基于注意力模型的推荐方法,包括如下步骤:
(1)建立用户评分矩阵,把m个用户对n个商品的评分形成一个m*n的评分矩阵R,矩阵中的项Rij表示用户ui对商品ij的评分。
(2)去除评论语句中的停用词,并将评论的词语映射成词向量,使用Word2vec工具实现将词语转换成词向量;Word2vec工具中的Skip-Gram模型利用深度学习方法,训练出有维度的词向量,这些词向量的相似度就代表了词语的相似度。
(3)建立基于注意力模型的Encoder-Decoder模型;Encoder-Decoder模型是自然语言处理中的一种成熟的序列化模型,其基本原理如附图2所示。每个词语都是一个输入状态,通过Encoder模块生成语义编码C,再通过Decoder模块对C进行解码,得到输出序列。在解码的过程中,保证了每个单词对输出状态的影响是相同的。
传统的Encoder-Decoder模型中,编码和解码之间的联系只有一个固定长度的语义向量C,编码器将整个序列的信息压缩到一个固定长度的向量中,使一些信息会被稀释掉,输入的序列越长,这种现象越严重,降低了解码的准确度。因此,在Encoder-Decoder模型中引入注意力机制。可以提取重要词语的特征,特别是情感词对于情感得分的计算。而且,注意力模型使每个输出元素yi都有对应语义编码Ci,输出结果更加全面的反应了输入的信息。基于注意力模型的Encoder-Decoder模型如附图3所示。
(4)情感评分计算。带有注意力模型的双向神经网络为每条评论生成一个情感评分。注意力模型使情感词所在的隐藏状态具有更高的权重,使得每个时刻的隐藏状态被区别对待。相比于用户自己的评级操作,情感评分能够更加真实的表现出用户的情感喜好。
(5)更新用户评分矩阵,实现推荐。根据用户的真实评分和情感的分进行加权,来更新用户评分矩阵。然后计算用户评分之间的相似性,实现推荐。
一种基于注意力模型的推荐方法的基本步骤如下:
(1)建立用户评分矩阵:m名用户构成了用户集合U={u1,u2,…,um},n件商品构成了项目结合I={i1,i2,…,in},用户评分矩阵R可以表示为:
Figure BDA0001887566950000031
其中,用户ui对商品ij的评分即为Rij
(2)去除评论语句中的停用词,并将评论的词语映射成词向量。使用Word2Vec工具将词语转换成词向量。
(3)建立基于注意力模型的Encoder-Decoder模型。每个输出单元yi都有对应语义编码Ci,Ci是由编码时的隐藏向量序列(S1,…,St)按权重相加得到的,即:
Figure BDA0001887566950000041
其中,αi是注意力权重,其表达式为:
Figure BDA0001887566950000042
βi是i时刻状态yi的注意力得分,其表达式为:βi=Vαtan(yiWα+bα)。其中,Vα和Wα是已知的权重参数,bα是偏置单元。
(4)情感评分计算。带有注意力模型的双向神经网络为每条评论生成一个情感评分,基本原理如附图4所示。通过注意力模型,情感词所在的隐藏状态具有更高的权重,使得每个时刻的隐藏状态被区别对待。最终可以计算出用户的情感评分,为:
Figure BDA0001887566950000043
(5)更新用户评分矩阵,实现推荐。对用户的真实评分和情感评分进行加权,得到用户的最终得分,更新用户评分矩阵,表达式如下:
Rij=α·Score(emotion)+(1-α)·R’ij,α代表情感得分的权重分配,其值的大小在0到1之间。R’ij是用户的真实评分。通过二者的计算,为用户生成更能代表其本意的得分。
利用更新的Rij计算用户之间的相似性,表达式为:
Figure BDA0001887566950000044
式中,d(ui+uj)是n维空间上的欧式距离,即:
Figure BDA0001887566950000045
进一步地,将所有用户按照与被推荐用户U的相似度进行排序,把与用户U最相似的前N个用户的近期消费商品推荐给用户U,完成推荐操作。

Claims (1)

1.一种基于注意力模型的推荐方法,其特征在于,包括如下步骤:
步骤1:建立用户评分矩阵,把m个用户对n个商品的评分形成一个m*n的评分矩阵R,矩阵中的项Rij表示用户ui对商品ij的评分;
m名用户构成了用户集合U={u1,u2,…,um},n件商品构成了项目结合I={i1,i2,...,in},用户评分矩阵R表示为:
Figure FDA0003825663080000011
其中,用户ui对商品ij的评分即为Rij
步骤2:去除评论语句中的停用词,并将评论的词语映射成词向量;
步骤3:建立基于注意力模型的Encoder-Decoder模型,得到输出单元yi
建立基于注意力模型的Encoder-Decoder模型,每个输出单元yi都有对应语义编码Ci,Ci是由编码时的隐藏向量序列(S1,...,St)按权重相加得到的,
Figure FDA0003825663080000012
αi是注意力权重,
Figure FDA0003825663080000013
βi是i时刻状态yi的注意力得分,βi=Vαtan(yiWα+bα);Vα和Wα是已知的权重参数,bα是偏置单元;
步骤4:计算情感评分Score(emotion);
Figure FDA0003825663080000014
步骤5:根据用户的真实评分和情感评分进行加权,得到用户的最终得分来更新用户评分矩阵,然后计算用户评分之间的相似性,把与用户U最相似的前N个用户的近期消费商品推荐给用户U,完成推荐操作
对用户的真实评分和情感评分进行加权,得到用户的最终得分,更新用户评分矩阵,表达式如下:
Rij=α·Score(emotion)+(1-α)·R’ij
其中,α代表情感得分的权重分配,其值的大小在0到1之间;R’ij是用户的真实评分,通过二者的计算,为用户生成更能代表其本意的得分;
利用更新的Rij计算用户评分 之间的相似性,表达式为:
Figure FDA0003825663080000021
其中,d(ui,uj)是n维空间上的欧式距离,
Figure FDA0003825663080000022
进一步地,将所有用户按照与被推荐用户U的相似度进行排序,把与用户U最相似的前N个用户的近期消费商品推荐给用户U,完成推荐操作。
CN201811455085.7A 2018-11-30 2018-11-30 一种基于注意力模型的推荐方法 Active CN109598586B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811455085.7A CN109598586B (zh) 2018-11-30 2018-11-30 一种基于注意力模型的推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811455085.7A CN109598586B (zh) 2018-11-30 2018-11-30 一种基于注意力模型的推荐方法

Publications (2)

Publication Number Publication Date
CN109598586A CN109598586A (zh) 2019-04-09
CN109598586B true CN109598586B (zh) 2022-11-15

Family

ID=65959974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811455085.7A Active CN109598586B (zh) 2018-11-30 2018-11-30 一种基于注意力模型的推荐方法

Country Status (1)

Country Link
CN (1) CN109598586B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069756B (zh) * 2019-04-22 2023-07-21 北京工业大学 一种考虑用户评价的资源或服务推荐方法
CN110321473B (zh) * 2019-05-21 2021-05-25 山东省计算中心(国家超级计算济南中心) 基于多模态注意力的多样性偏好信息推送方法、系统、介质及设备
CN110275964B (zh) * 2019-06-26 2023-07-14 程淑玉 基于知识图谱与循环神经网络的推荐模型
CN110489522B (zh) * 2019-07-26 2022-04-12 湖南大学 一种基于用户评分的情感词典构建方法
CN111061951A (zh) * 2019-12-11 2020-04-24 华东师范大学 一种基于双层自注意力评论建模的推荐模型
CN111695040B (zh) * 2020-06-12 2023-03-24 陕西师范大学 一种基于情感标签的时尚品推荐方法、系统及装置
CN112328893B (zh) * 2020-11-25 2022-08-02 重庆理工大学 一种基于记忆网络和协同注意力的推荐方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107038609A (zh) * 2017-04-24 2017-08-11 广州华企联信息科技有限公司 一种基于深度学习的商品推荐方法及系统
CN107133224A (zh) * 2017-04-25 2017-09-05 中国人民大学 一种基于主题词的语言生成方法
CN108388554A (zh) * 2018-01-04 2018-08-10 中国科学院自动化研究所 基于协同过滤注意力机制的文本情感识别系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10049106B2 (en) * 2017-01-18 2018-08-14 Xerox Corporation Natural language generation through character-based recurrent neural networks with finite-state prior knowledge

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107038609A (zh) * 2017-04-24 2017-08-11 广州华企联信息科技有限公司 一种基于深度学习的商品推荐方法及系统
CN107133224A (zh) * 2017-04-25 2017-09-05 中国人民大学 一种基于主题词的语言生成方法
CN108388554A (zh) * 2018-01-04 2018-08-10 中国科学院自动化研究所 基于协同过滤注意力机制的文本情感识别系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于协同过滤Attention机制的情感分析模型;赵冬梅等;《中文信息学报》;20180815(第08期);全文 *
社会媒体信息推荐关键技术研究;李洋;《中国博士学位论文全文数据库》;20180115;全文 *

Also Published As

Publication number Publication date
CN109598586A (zh) 2019-04-09

Similar Documents

Publication Publication Date Title
CN109598586B (zh) 一种基于注意力模型的推荐方法
CN107133224B (zh) 一种基于主题词的语言生成方法
CN109933664B (zh) 一种基于情感词嵌入的细粒度情绪分析改进方法
CN107608956B (zh) 一种基于cnn-grnn的读者情绪分布预测算法
CN110209789B (zh) 一种用户注意力引导的多模态对话系统及方法
CN108363695B (zh) 一种基于双向依赖语法树表征的用户评论属性抽取方法
CN110765260A (zh) 一种基于卷积神经网络与联合注意力机制的信息推荐方法
CN111914096A (zh) 基于舆情知识图谱的公共交通乘客满意度评价方法及系统
CN108256968B (zh) 一种电商平台商品专家评论生成方法
CN110688832B (zh) 一种评论生成方法、装置、设备及存储介质
CN109033294B (zh) 一种融入内容信息的混合推荐方法
CN110096587B (zh) 基于注意力机制的lstm-cnn词嵌入的细粒度情感分类模型
CN112016002A (zh) 融合评论文本层级注意力和时间因素的混合推荐方法
CN110765769A (zh) 一种基于子句特征的实体属性依赖情感分析方法
CN115630145A (zh) 一种基于多粒度情感的对话推荐方法及系统
CN111325571A (zh) 一种多任务学习的商品评论标签自动生成方法、装置及系统
CN116680363A (zh) 一种基于多模态评论数据的情感分析方法
Rani et al. Study and comparision of vectorization techniques used in text classification
CN111274493A (zh) 一种基于多源用户评论的评分预测方法
Salunkhe Attention-based bidirectional LSTM for deceptive opinion spam classification
CN115269768A (zh) 要素文本处理方法、装置、电子设备和存储介质
CN116402064B (zh) 一种评论生成方法、系统、存储介质及电子设备
CN112182227A (zh) 基于transD知识图嵌入的文本情感分类系统及方法
CN116595975A (zh) 一种基于句信息进行词信息增强的方面级情感分析方法
Purba et al. A hybrid convolutional long short-term memory (CNN-LSTM) based natural language processing (NLP) model for sentiment analysis of customer product reviews in Bangla

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant