CN109522487A - 一种基于评论的餐厅个性化推荐方法 - Google Patents

一种基于评论的餐厅个性化推荐方法 Download PDF

Info

Publication number
CN109522487A
CN109522487A CN201811574652.0A CN201811574652A CN109522487A CN 109522487 A CN109522487 A CN 109522487A CN 201811574652 A CN201811574652 A CN 201811574652A CN 109522487 A CN109522487 A CN 109522487A
Authority
CN
China
Prior art keywords
user
dining room
comment
scoring
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811574652.0A
Other languages
English (en)
Inventor
杨新武
王芊霓
赵佳琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201811574652.0A priority Critical patent/CN109522487A/zh
Publication of CN109522487A publication Critical patent/CN109522487A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于评论的餐厅个性化推荐方法,(1)训练词向量模型:读取Yelp数据集中用户的评论数据。得到词向量模型。Yelp数据集中包含餐厅,用户,用户对餐厅评论的数据;(2)读取yelp数据集中用户的评分数据,根据用户对餐厅的评分构建用户‑餐厅评分矩阵;(3)计算用户相似度;(4)预测用户对未去过的餐厅的评分:根据用户相似度为目标用户选则TopK个近似邻居,然后使用加权平均方法预测用户对未去过的餐厅的评分;(5)为用户推荐个性化的餐厅:根据步骤4获得的用户对未去过的餐厅的评分预测结果,对餐厅进行排序,为用户推荐N个最可能去的餐厅;(6)均方根误差RMSE,度量预测精度。本方法能在很大程度上提高推荐精度。

Description

一种基于评论的餐厅个性化推荐方法
技术领域
本发明属于计算机推荐算法技术领域,尤其涉及一种基于评论的餐厅个性化推荐方法。
背景技术
推荐系统是帮助用户发现内容,克服信息过载的重要工具。它通过分析用户行为,对用户兴趣建模。从而预测用户的兴趣并给用户做推荐。
协同过滤算法是最经典,应用最为成功的一种。目前主要有两类协同过滤算法:基于用户的协同过滤算法和基于项目的协同过滤算法。基于用户的协同过滤推荐算法基于这样一个假设,即如果用户对一些项目的评分比较相似,则他们对其他项目的评分也比较相似。算法根据目标用户的最近邻居(最相似的若干用户)对某个项目的评分逼近目标用户对该项目的评分。基于项目的协同过滤推荐算法认为,用户对不同项目的评分存在相似性,当需要估计用户对某个项目的评分时,可以用户对该项目的若干相似项目的评分进行估计。
在当今经济全球化和发展社会主义市场经济中,选择餐饮行业的人越来越多,近年来,餐饮市场的增长速度基本上保持在10%。消费者很难从数量众多的餐厅中快速选择出自己喜欢的餐厅。随着第三方消费点评网站的发展,其为用户提供商户信息、消费点评等信息服务,让用户可以根据其他用户对餐厅的文字等评价选择是否要去这家餐厅吃饭。
在推荐算法的角度,仅仅用评分相似性并不能很好的确定用户喜好的相似性,比如,两个用户都给某餐厅5分评价,一个评论“便宜实惠,方便快捷”,另一个评论“炒饭配辣酱很好吃很入味,又辣又香”。
在自然语言处理领域,最常用的语义表示方法是词袋子模型,该方法存在数据稀疏问题,并且不能保留词序信息。近年来,随着深度学习和表示学习的兴起,基于神经网络的数据表示技术在各个领域崭露头角。doc2vec就是一种优于词袋模型的文本表示方法在语义表达上表现良好。
本方法提出利用用户对餐厅评价内容计算的相似度来计算最近邻居,然后利用用户的最近邻居的评分来预测该用户对餐厅的评分,从而进行推荐。
发明内容
本发明的目的在于提供了一种基于评论的餐厅个性化推荐方法,利用评论信息中包含的用户偏好计算用户相似度,提高推荐系统的准确度。
本发明采用的技术方案如下:
一种基于评论的餐厅个性化推荐方法,包括以下步骤:
步骤1:训练词向量模型:读取Yelp数据集中用户的评论数据。得到词向量模型。Yelp数据集中包含餐厅,用户,用户对餐厅评论的数据;
步骤2:读取yelp数据集中用户的评分数据,根据用户对餐厅的评分构建用户-餐厅评分矩阵;
步骤3:计算用户相似度:通过两两用户对各个餐厅的评论通过步骤1训练得到的模型,计算用户间的相似度;
步骤4:预测用户对未去过的餐厅的评分:根据步骤3计算得到的用户相似度,为目标用户选则TopK个近似邻居,然后使用加权平均方法预测用户对未去过的餐厅的评分;
步骤5:为用户推荐个性化的餐厅:根据步骤4获得的用户对未去过的餐厅的评分预测结果,对餐厅进行排序,为用户推荐N个最可能去的餐厅;
步骤6:均方根误差RMSE,度量预测精度。
本方法使用评论信息来计算用户相似度是因为:相对于评分,评论能够更加具体、准确地表达用户对物品的喜好。与用户和物品的描述信息相比,用户评论的内容也更加丰富,更能体现用户的个性化特征,可以在此基础上构建更准确的个体画像。以评论“这家店虽然很贵,但环境特别好,服务特别好。”为例,该用户给该饭店打5分满分。从用户的角度可以分析出,该用户比较注重服务和环境,对价钱要求较低。可见评论的信息量远远大于评分。相对于评分,评论更能精确地分析出用户的喜好,能在很大程度上提高推荐精度。
附图说明
图1为本发明方法的实施流程图。
具体实施方式
以下结合附图和实施例对本发明进行详细说明。
步骤1:训练词向量模型:读取yelp数据集的所有用户评论数据,对数据进行处理。得到词向量模型;
从数据集中抽取所有用户的评论信息,以每行一条评论的格式存储,并对文本进行小写转换、切词等处理。调用doc2vec方法,进行模型训练。
步骤2:读取yelp数据集中用户的评分数据,根据用户对餐厅的评分构建用户-项目评分矩阵(U×S),U表示用户集合;S表示餐厅集合;rik∈U×S表示用户ui∈U对餐厅sk∈S的评分;
步骤3:计算用户相似度:
3.1:统计用户个数m,餐厅个数n;
3.2:计算用户ui,用户uj对餐厅sj的评论相似性:调用步骤1的模型,计算两条评论的相似性;遍历完n个餐厅,对结果求和取平均,作为ui,uj的最终相似性得分;对m个用户中每两两之间的相似性都进行计算,得到sim(ui,uj),用户ui,uj的相似度;
步骤4预测用户对未去过的餐厅的评分:
4.1预测用户ui对餐厅sk的评分时,先把找出对餐厅sk有评分的用户集合X,利用步骤3得到的用户相似度对nj∈X和ui的相似性评分进行排序,为目标用户选则TopK个近似邻居;
4.2用户u对餐厅k打分预测用如下公式计算:
Wuv表示用户u和用户v相似度,ruk表示用户v对餐厅k的打分,
步骤5:为用户推荐个性化的餐厅:根据步骤4获得的用户对未去过的餐厅的评分预测结果,对餐厅进行排序,为用户推荐N个最可能去的餐厅。
步骤6:均方根误差RMSE,度量预测精度:
本发明方法主要的输入信息包括,用户个人信息,餐厅信息,用户对餐厅的评论和评分信息。通过对餐厅评论信息内容的相似性找到目标用户的相似的用户后,根据目标用户的相似用户来对目标用户未打分的餐厅进行评分预测。通过挖掘评论中用户偏好信息来提高相似用户计算的准确性,进而提高推荐的准确率。

Claims (2)

1.一种基于评论的餐厅个性化推荐方法,其特征在于:包括以下步骤,
步骤1:训练词向量模型:读取Yelp数据集中用户的评论数据;得到词向量模型;Yelp数据集中包含餐厅,用户,用户对餐厅评论的数据;
步骤2:读取yelp数据集中用户的评分数据,根据用户对餐厅的评分构建用户-餐厅评分矩阵;
步骤3:计算用户相似度:通过两两用户对各个餐厅的评论通过步骤1训练得到的模型,计算用户间的相似度;
步骤4:预测用户对未去过的餐厅的评分:根据步骤3计算得到的用户相似度,为目标用户选则TopK个近似邻居,然后使用加权平均方法预测用户对未去过的餐厅的评分;
步骤5:为用户推荐个性化的餐厅:根据步骤4获得的用户对未去过的餐厅的评分预测结果,对餐厅进行排序,为用户推荐N个最可能去的餐厅;
步骤6:均方根误差RMSE,度量预测精度。
2.根据权利要求1所述的一种基于评论的餐厅个性化推荐方法,其特征在于:
步骤1:训练词向量模型:读取yelp数据集的所有用户评论数据,对数据进行处理;得到词向量模型;
从数据集中抽取所有用户的评论信息,以每行一条评论的格式存储,并对文本进行小写转换、切词等处理;调用doc2vec方法,进行模型训练;
步骤2:读取yelp数据集中用户的评分数据,根据用户对餐厅的评分构建用户-项目评分矩阵(U×S),U表示用户集合;S表示餐厅集合;rik∈U×S表示用户ui∈U对餐厅sk∈S的评分;
步骤3:计算用户相似度:
3.1:统计用户个数m,餐厅个数n;
3.2:计算用户ui,用户uj对餐厅sj的评论相似性:调用步骤1的模型,计算两条评论的相似性;遍历完n个餐厅,对结果求和取平均,作为ui,uj的最终相似性得分;对m个用户中每两两之间的相似性都进行计算,得到sim(ui,uj),用户ui,uj的相似度;
步骤4预测用户对未去过的餐厅的评分:
步骤4.1预测用户ui对餐厅sk的评分时,先把找出对餐厅sk有评分的用户集合X,利用步骤3得到的用户相似度对nj∈X和ui的相似性评分进行排序,为目标用户选则TopK个近似邻居;
步骤4.2用户u对餐厅k打分预测用如下公式计算:
Wuv表示用户u和用户v相似度,ruk表示用户v对餐厅k的打分,
步骤5:为用户推荐个性化的餐厅:根据步骤4获得的用户对未去过的餐厅的评分预测结果,对餐厅进行排序,为用户推荐N个最可能去的餐厅;
步骤6:均方根误差RMSE,度量预测精度:
本方法主要的输入信息包括,用户个人信息,餐厅信息,用户对餐厅的评论和评分信息;通过对餐厅评论信息内容的相似性找到目标用户的相似的用户后,根据目标用户的相似用户来对目标用户未打分的餐厅进行评分预测。
CN201811574652.0A 2018-12-21 2018-12-21 一种基于评论的餐厅个性化推荐方法 Pending CN109522487A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811574652.0A CN109522487A (zh) 2018-12-21 2018-12-21 一种基于评论的餐厅个性化推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811574652.0A CN109522487A (zh) 2018-12-21 2018-12-21 一种基于评论的餐厅个性化推荐方法

Publications (1)

Publication Number Publication Date
CN109522487A true CN109522487A (zh) 2019-03-26

Family

ID=65797005

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811574652.0A Pending CN109522487A (zh) 2018-12-21 2018-12-21 一种基于评论的餐厅个性化推荐方法

Country Status (1)

Country Link
CN (1) CN109522487A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110595012A (zh) * 2019-09-23 2019-12-20 海信(广东)空调有限公司 空调运行模式的推荐方法及装置
CN112487297A (zh) * 2020-12-09 2021-03-12 贝壳技术有限公司 信息推送方法、装置、电子设备和存储介质
CN112559890A (zh) * 2020-12-25 2021-03-26 深圳市富途网络科技有限公司 一种显示方法、服务器、电子设备和存储介质
CN112819518A (zh) * 2021-01-26 2021-05-18 山西三友和智慧信息技术股份有限公司 一种基于Bi-LSTM深度学习的餐厅评论情感分析系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326390A (zh) * 2016-08-17 2017-01-11 成都德迈安科技有限公司 基于协同过滤的推荐方法
CN107967357A (zh) * 2017-12-21 2018-04-27 广东小天才科技有限公司 一种好友的推送方法、系统及终端设备
CN108171535A (zh) * 2017-12-13 2018-06-15 天津科技大学 一种基于多特征的个性化餐厅推荐算法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326390A (zh) * 2016-08-17 2017-01-11 成都德迈安科技有限公司 基于协同过滤的推荐方法
CN108171535A (zh) * 2017-12-13 2018-06-15 天津科技大学 一种基于多特征的个性化餐厅推荐算法
CN107967357A (zh) * 2017-12-21 2018-04-27 广东小天才科技有限公司 一种好友的推送方法、系统及终端设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
戴国强等: "《科技大数据》", 31 August 2018, 科学技术文献出版社 *
李伟霖: "基于评论与评分的协同过滤算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110595012A (zh) * 2019-09-23 2019-12-20 海信(广东)空调有限公司 空调运行模式的推荐方法及装置
CN112487297A (zh) * 2020-12-09 2021-03-12 贝壳技术有限公司 信息推送方法、装置、电子设备和存储介质
CN112559890A (zh) * 2020-12-25 2021-03-26 深圳市富途网络科技有限公司 一种显示方法、服务器、电子设备和存储介质
CN112559890B (zh) * 2020-12-25 2024-02-09 深圳市富途网络科技有限公司 一种显示方法、服务器、电子设备和存储介质
CN112819518A (zh) * 2021-01-26 2021-05-18 山西三友和智慧信息技术股份有限公司 一种基于Bi-LSTM深度学习的餐厅评论情感分析系统

Similar Documents

Publication Publication Date Title
Chen et al. Forecasting seasonal tourism demand using a multiseries structural time series method
Chang et al. Social media analytics: Extracting and visualizing Hilton hotel ratings and reviews from TripAdvisor
Kumar et al. Applications of text mining in services management: A systematic literature review
Mao et al. Multiobjective e-commerce recommendations based on hypergraph ranking
Chen et al. Learning to rank features for recommendation over multiple categories
CN109522487A (zh) 一种基于评论的餐厅个性化推荐方法
CN108229590B (zh) 一种获取多标签用户画像的方法和装置
Ansari et al. Modeling multiple relationships in social networks
CN102982131A (zh) 一种基于马尔科夫链的图书推荐方法
CN107424043A (zh) 一种产品推荐方法及装置,电子设备
CN110503506B (zh) 基于评分数据的物品推荐方法、装置及介质
CN112991017A (zh) 基于用户评论解析的标签体系精准推荐方法
WO2020192013A1 (zh) 定向广告投放方法和装置、设备及存储介质
US20210264463A1 (en) Creating Meta-Descriptors of Marketing Messages to Facilitate In Delivery Performance Analysis, Delivery Performance Prediction and Offer Selection
CN104424296A (zh) 查询词分类方法和装置
CN103150667B (zh) 一种基于本体结构的个性化推荐方法
Hu et al. An item orientated recommendation algorithm from the multi-view perspective
WO2018176913A1 (zh) 搜索方法、装置及非临时性计算机可读存储介质
JP2013218584A (ja) 情報処理装置、方法及びプログラム、並びに、情報通信端末、その制御方法及びその制御プログラム
KR101639656B1 (ko) 광고 제공 방법 및 서버 장치
Herrmann et al. # fridaysforfuture–What does Instagram tell us about a social movement?
CN107545075B (zh) 一种基于在线评论和情境感知的餐馆推荐方法
CN116308556A (zh) 基于物联网的广告推送方法及系统
KR101976056B1 (ko) 추천 시스템 및 추천 방법
CN111159400A (zh) 一种产品评论情感分类方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190326

RJ01 Rejection of invention patent application after publication