CN107545075B - 一种基于在线评论和情境感知的餐馆推荐方法 - Google Patents
一种基于在线评论和情境感知的餐馆推荐方法 Download PDFInfo
- Publication number
- CN107545075B CN107545075B CN201710980537.2A CN201710980537A CN107545075B CN 107545075 B CN107545075 B CN 107545075B CN 201710980537 A CN201710980537 A CN 201710980537A CN 107545075 B CN107545075 B CN 107545075B
- Authority
- CN
- China
- Prior art keywords
- context
- restaurant
- comments
- user
- online
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013145 classification model Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 238000012552 review Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 11
- 238000013139 quantization Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000007477 logistic regression Methods 0.000 claims description 2
- 238000011002 quantification Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于在线评论和情境感知的餐馆推荐方法,涉及餐馆推荐。从在线评论中训练情境分类模型;从在线评论中训练特征提取模型;对用户查询进行在线处理。一方面能够充分针对在线评论和评分数据的特点,既有效地对在线评论表达了什么情境下的正面/负面意见进行区分,又准确地抽取出不同情境下哪些餐厅特征是用户偏好的;另一方面对用户的查询要求,既能够推断出潜在的情境需求,又能够根据效用模型为用户推荐最佳的餐厅列表,是一种精度高、推广性好的推荐方法,能够大幅改善用户体验。
Description
技术领域
本发明涉及餐馆推荐,尤其是涉及一种基于在线评论和情境感知的餐馆推荐方法。
背景技术
随着互联网技术的飞速发展和普及,人们可以便捷地获取周边甚至任意区域内的餐馆信息进行比较选择。在另一方面,人们接收到的餐馆信息越来越多以致有大量无效或冗余信息影响效率和时间,为了解决信息过载的问题,餐馆推荐系统应运而生(如专利CN106096993A)。餐馆推荐系统根据用户的历史数据来为每个用户提供个性化的餐馆推荐,帮助用户节省精力和时间并获得一个好的就餐体验。情境感知是目前餐馆推荐系统的一个热门研究方向,因为在不同的情境下,用户的就餐偏好和选择都是不同的,所以将情境信息融入到餐馆推荐系统中,可以使得推荐信息随之变化,为用户做出更加准确的推荐,C.Palmisano等人在2008年知识和数据工程处理期刊(IEEE Transactions on Knowledgeand Data Engineering)第20卷第11期第1535-1549页的工作,A.Karatzoglou等人在2010年推荐系统会议集(ACM Recommender Systems Conference)第79-86页的工作和G.Adomavicius等人在2005年信息系统处理期刊(ACM Transactions on InformationSystems)第23卷第1期第103-145页的工作都验证了这个结论。
传统的情境感知推荐系统仅仅利用显式的用户反馈(如每个餐馆在每个场景或情境下的评分),在实际生活中由于用户不会给出所有可能的场景和情境,该类型反馈数据的稀疏性往往导致推荐效果不理想。随着人们越来越多地在各种评论网站分享他们的就餐体验,一些研究人员开始利用在线评论来学习和推断用户在不同情境下的就餐偏好,从而缓解数据稀疏性带来的影响,如Y.Li等人在2010年国际计算语言学会议集(InternationalConference on Computational Linguistics)第692-700页的工作。然而,当前的情境感知餐馆推荐仍然存在着两个挑战。首先,由于在线评论的数量级巨大,手工标注足够多的情境和其关联的意见标签是不可取的。此外,每一个评论所关联的意见标签通常是非常嘈杂的,无疑更增加了标注的难度。在另一方面,不准确的餐厅特征往往会导致推荐性能的下降,但是现有的方法都忽略了可以通过消费体验的评论来准确推断隐式的餐厅特征的方式。
中国专利CN106096993A公开一种餐馆推荐方法及装置、电子设备。所述方法包括:在用户登录到点餐界面时,确定用户当前所在的位置;确定以所述当前所在的位置为中心的设定距离范围内的至少一个餐馆;确定用户的健康指标信息中的超标项;根据所述超标项从所述至少一个餐馆中确定与所述用户相匹配的餐馆。该发明能够为用户提供与用户的健康状况相匹配的餐馆,确保用户在外出就餐时能够健康饮食,提升用户的餐饮体验。但是,该系统不能处理用户的查询需求。综上所述,现有技术对不同情境下餐馆推荐,受到各种因素限制,精度难以保证。
发明内容
本发明的目的在于提供一种基于在线评论数据和情境感知的餐馆推荐方法。
本发明包括以下步骤:
1)从在线评论中训练情境分类模型;
2)从在线评论中训练特征提取模型;
3)对用户查询进行在线处理,所述在线处理包括以下步骤:
(1)利用情境分类模型得到查询字段的潜在语境;
(2)利用效用量化模型得到该情境下每个餐馆的被选择概率;
(3)排序概率进行有效推荐。
在步骤1)中,所述在线评论中训练情境分类模型的具体方法可为:
情境分类模型从历史的在线评论数据中学习得到一个多类分类器,当用户输入查询字段后可以根据该分类器快速的推断潜在情境,所述特征提取模型从历史的在线评论数据中学习用户的潜在偏好和餐馆的潜在特征,供后续计算使用;
所述情境分类模型包括:
为了克服实际中一个评论带多标签的问题,假设一个评论e最多关联K个标签,则e属于某个标签k的概率为p(l(e)=k)=αpb(k)+(1-α)pe(k),其中是均匀选择概率,pb(k)是该评论e对应的餐馆的所有标签的概率分布,即背景分布,N是该餐馆的评论总数,当N越大时,即评论总数越多时,背景分布pb(k)更可靠,所以权重也应更大;
为了克服实际中带标签的评论相对于总量的比例特别小的问题,假设同一个餐馆的所有评论分享同样的情境前验分布同一个组别内的用户的所有评论分享同样的情境前验分布其中是一个K维向量,因为每个餐馆至少有一个关联的情境标签,是一个2维向量,因为评论可能没有关联到任何情境标签,综合两者可以得到未带标签的评论的情境分布为:
其中,K+1表示评论不属于任何K个情境之一;
利用数据库中在所有餐馆C+={c}上的带标签评论集合E+和大量的未带标签的评论集合EU,通过最小式(1)训练情境分类模型:
其中,第一项是最大化带标签评论的似然函数,对于所有被归类到情境标签xk的评论,第二项是最大化采样样本的情境分布和未带标签的评论的情境分布之间的相似度,表示两者之间的KL散度,pc(k|b)表示未带标签的评论的估计情境分布,b是待求参数;第三项是避免过度拟合的正则项;采样过程包括对于情境标签xk的在线评论,按照的概率进行采样。
在步骤2)中,所述特征提取模型包括:
为了学习用户的偏好ax和餐馆的特征c,收集在情境x下的所有正反馈样本:L+(x)c={<e,l(e)x>},其中,包括已有标签的评论,即l(e)x=1,否则通过情境分类模型中的中间处理步骤计算,即l(e)x=p(l(e)=x|b),且该值大于某阈值的未带标签的评论(可以简单的取0.5);相应地,收集在情境x下的所有负反馈样本L-(x)c={<e,l(e)x>},其中包括未能归类到任意标签的评论,即l(e)x=0,以及上述小于某阈值的未带便签的评论。
通过学习如下式(3)得到用户的偏好ax和餐馆的特征c:
其中,对于所有带标签的评论l(e)x≡1,否则通过l(e)x=p(l(e)=x|b)计算,该求解过程可以表示为:logp(l(e)x,e)=logp(l(e)x|ax,c)+logp(e|c),其中:
在步骤3)第(1)部分,所述利用情境分类模型得到查询字段q的潜在语境步骤包括:
用户输入一个查询字段q,利用情境分类模型学习得到的参数b,采用一个多项式logistic回归模型去推断潜在的语境标签概率p(x|q,b),回归模型通过式(4)学习得到:
其中,I(l(q)=k)是一个指示函数,表示评论被归类为情境xk下的标签,q的情境分布为:
在步骤3)第(2)部分中,所述利用效用量化模型得到该情境下每个餐馆的被选择概率步骤包括:
将费用和情境作为用户选择餐馆时的两个最主要因素,则每个餐馆在情境x下的效用盈余表示为:
USx(c)=UCx(c)-UMx(cp)
其中,UC(c)=∑kakck表示用户在餐馆特征上的偏好加权和,即ak是特征ck上的偏好;同样
地,UM(cp)=ap(-cp)表示用户在费用上的偏好,综合两者可得:
为了便于处理,效用量化模型学习如式(2):
在步骤3第(3)部分中,所述排序概率进行有效推荐的步骤可为:按照概率降序向用户推荐准确的餐馆列表。
本发明一方面能够充分针对在线评论和评分数据的特点,既有效地对在线评论表达了什么情境下的正面/负面意见进行区分,又准确地抽取出不同情境下哪些餐厅特征是用户偏好的;另一方面对用户的查询要求,既能够推断出潜在的情境需求,又能够根据效用模型为用户推荐最佳的餐厅列表,是一种精度高、推广性好的推荐方法,能够大幅改善用户体验。
本发明在离线阶段从在线评论中准确推断用户偏好和餐馆特征,在在线推荐阶段从用户输入的查询字段准确推断当前潜在情境,采用一个合理的量化模型得到每个餐馆被选择的概率,为用户推荐更为准确的餐馆列表,提高了用户的就餐体验,潜在增加了用户的长期依赖率。
附图说明
图1是本发明实施例的流程示意图。
具体实施方式
本发明提供了一种基于在线评论和情境感知的餐馆推荐方法,为使本发明的目的、技术方案及效果更佳清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,根据本发明的一方面,对在线评论进行离线学习,包括以下步骤:
步骤101:包括离线学习中,从在线评论数据中训练情境分类模型步骤;
步骤102:包括离线学习中,从在线评论数据中训练特征提取模型步骤;
如图1所示,根据本发明的另一方面,对用户查询进行在线处理,包括以下步骤:
步骤103:包括在线推荐中,利用情境分类模型得到查询字段q的潜在语境步骤;
步骤104:包括在线推荐中,利用效用量化模型得到该情境下每个餐馆的被选择概率步骤;
步骤105:包括在线推荐中,排序概率进行有效推荐步骤。
更进一步的,所述训练情境分类模型步骤包括:
将在线评论数据按照带标签和不带标签的两种类型进行划分,计算带标签的评论各自对应的情境分布p(l(e)=k)=αpb(k)+(1-α)pe(k),在每个情境下,按照各自的概率进行采样形成训练集;对不带标签的评论按照假设的条件计算得到估计的情境分布最后在训练集上面按照情境分类模型学习得到分类参数
所述训练特征提取模型步骤包括:
在每个情境下,将在线评论数据按照带标签和不带标签的两种类型进行划分,带标签的评论被归类到正反馈样本集合L+(x)c={<e,l(e)x>},不带标签的评论根据在情境分类模型中计算得到的情境分布选择该情境的对应概率l(e)x=p(l(e)=x|b),如果大于某个阈值(可以简单的取0.5)则归类到正反馈样本集合,否则归类到负反馈样本集合L-(x)c={<e,l(e)x>}。最后在两个集合上共同学习优化模型,优化的目的是最大化每个情境下对应的似然函数优化的结果即为所需的用户的偏好ax和餐馆的特征c。
所述利用情境分类模型得到查询字段q的潜在语境步骤包括:
所述利用效用量化模型得到该情境下每个餐馆的被选择概率步骤包括:
根据学习得到的用户的偏好ax和餐馆的特征c,划分为费用和情境两种类型的因素,即和c={1,c1...,cK,cp},根据用户在餐馆情境特征上的效用和餐馆费用特征上的效用之差来衡量该餐馆的效用盈余然后进一步根据转换公式转换成被选择的概率
所述排序概率进行有效推荐步骤包括:
最后按照概率降序向用户推荐准确的餐馆列表。
所述在线推荐算法使用梯度下降,提高推荐结果的准确率P@N,所述准确率P@N的算法如下:
其中,R(u)N是推荐的N个餐馆,T(u)是实际用户选择的餐馆。
当然,以上说明仅仅为本发明的实例,本发明并不限于列举上述实例,应当说明的是,任何熟悉本领域的技术人员在本说明书的教导下,所做出的所有等同替代、明显变形形式,均落在本说明书的实质范围之内,理应受到本发明的保护。
Claims (5)
1.一种基于在线评论和情境感知的餐馆推荐方法,其特征在于包括以下步骤:
1)从在线评论中训练情境分类模型;所述情境分类模型包括:
克服实际中一个评论带多标签的问题,假设一个评论e最多关联K个标签,则e属于某个标签k的概率为p(l(e)=k)=αpb(k)+(1-α)pe(k),其中是均匀选择概率,pb(k)是该评论e对应的餐馆的所有标签的概率分布,即背景分布,N是该餐馆的评论总数,当N越大时,即评论总数越多时,背景分布pb(k)更可靠,所以权重也应更大;
克服实际中带标签的评论相对于总量的比例特别小的问题,假设同一个餐馆的所有评论分享同样的情境前验分布同一个组别内的用户的所有评论分享同样的情境前验分布其中是一个K维向量,因为每个餐馆至少有一个关联的情境标签,是一个2维向量,因为评论可能没有关联到任何情境标签,综合两者可以得到未带标签的评论的情境分布为:
其中,K+1表示评论不属于任何K个情境之一;
利用数据库中在所有餐馆C+={c}上的带标签评论集合E+和大量的未带标签的评论集合EU,通过最小式(1)训练情境分类模型:
其中,第一项是最大化带标签评论的似然函数,对于所有被归类到情境标签xk的评论,
第二项是最大化采样样本的情境分布和未带标签的评论的情境分布之间的相似度,表示两者之间的KL散度,pc(k|b)表示未带标签的评论的估计情境分布,b是待求参数;第三项是避免过度拟合的正则项;采样过程包括对于情境标签xk的在线评论,按照的概率进行采样;
2)从在线评论中训练特征提取模型;
3)对用户查询进行在线处理,所述在线处理包括以下步骤:
(1)利用情境分类模型得到查询字段的潜在语境;
(2)利用效用量化模型得到该情境下每个餐馆的被选择概率;所述利用效用量化模型得到该情境下每个餐馆的被选择概率步骤包括:
将费用和情境作为用户选择餐馆时的两个最主要因素,则每个餐馆在情境x下的效用盈余表示为:
USx(c)=UCx(c)-UMx(cp)
其中,UC(c)=∑kakck表示用户在餐馆特征上的偏好加权和,即ak是特征ck上的偏好;同样地,UM(cp)=ap(-cp)表示用户在费用上的偏好,综合两者得:
为了便于处理,效用量化模型学习如式(2):
(3)排序概率进行有效推荐。
2.如权利要求1所述一种基于在线评论和情境感知的餐馆推荐方法,其特征在于在步骤1)中,所述在线评论中训练情境分类模型的具体方法为:
情境分类模型从历史的在线评论数据中学习得到一个多类分类器,当用户输入查询字段后根据该分类器快速的推断潜在情境,所述特征提取模型从历史的在线评论数据中学习用户的潜在偏好和餐馆的潜在特征,供后续计算使用。
3.如权利要求1所述一种基于在线评论和情境感知的餐馆推荐方法,其特征在于在步骤2)中,所述特征提取模型包括:
为了学习用户的偏好ax和餐馆的特征c,收集在情境x下的所有正反馈样本:L+(x)c={<e,l(e)x>},其中,包括已有标签的评论,即l(e)x=1,否则通过情境分类模型中的中间处理步骤计算,即l(e)x=p(l(e)=x|b),且该值大于某阈值的未带标签的评论;相应地,收集在情境x下的所有负反馈样本L-(x)c={<e,l(e)x>},其中包括未能归类到任意标签的评论,即l(e)x=0,以及上述小于某阈值的未带便签的评论;
通过学习如下式(3)得到用户的偏好ax和餐馆的特征c:
其中,对于所有带标签的评论l(e)x≡1,否则通过l(e)x=p(l(e)=x|b)计算,该求解过程可以表示为:logp(l(e)x,e)=logp(l(e)x|ax,c)+logp(e|c),其中:
5.如权利要求1所述一种基于在线评论和情境感知的餐馆推荐方法,其特征在于在步骤3第(3)部分中,所述排序概率进行有效推荐的步骤为:按照概率降序向用户推荐准确的餐馆列表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710980537.2A CN107545075B (zh) | 2017-10-19 | 2017-10-19 | 一种基于在线评论和情境感知的餐馆推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710980537.2A CN107545075B (zh) | 2017-10-19 | 2017-10-19 | 一种基于在线评论和情境感知的餐馆推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107545075A CN107545075A (zh) | 2018-01-05 |
CN107545075B true CN107545075B (zh) | 2020-05-29 |
Family
ID=60968060
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710980537.2A Expired - Fee Related CN107545075B (zh) | 2017-10-19 | 2017-10-19 | 一种基于在线评论和情境感知的餐馆推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107545075B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109191210A (zh) * | 2018-09-13 | 2019-01-11 | 厦门大学嘉庚学院 | 一种基于Adaboost算法的宽带目标用户识别方法 |
CN109299460B (zh) * | 2018-09-18 | 2022-07-12 | 北京三快在线科技有限公司 | 分析店铺的评价数据的方法、装置、电子设备及存储介质 |
CN110968776B (zh) * | 2018-09-30 | 2023-05-23 | 北京国双科技有限公司 | 政策知识的推荐方法、装置存储介质及处理器 |
CN111695695B (zh) * | 2020-06-09 | 2023-08-08 | 北京百度网讯科技有限公司 | 用户决策行为量化分析方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012129531A1 (en) * | 2011-03-24 | 2012-09-27 | M-I-K HEALTH SOLUTIONS, LLC d/b/a INVENTIVE HEALTH SOLUTIONS | Automated healthcare integration system |
CN106649733B (zh) * | 2016-12-23 | 2020-04-10 | 中山大学 | 一种基于无线接入点情境分类与感知的在线视频推荐方法 |
CN106649884B (zh) * | 2017-01-11 | 2019-12-31 | 河南科技大学 | 一种基于用户情境分析的多媒体内容推荐方法 |
CN106951436B (zh) * | 2017-02-09 | 2020-06-19 | 华南理工大学 | 一种基于移动情境的大规模在线推荐方法 |
-
2017
- 2017-10-19 CN CN201710980537.2A patent/CN107545075B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN107545075A (zh) | 2018-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111339306B (zh) | 分类模型训练方法、分类方法及装置、设备和介质 | |
CN107220365B (zh) | 基于协同过滤与关联规则并行处理的精准推荐系统及方法 | |
CN107545075B (zh) | 一种基于在线评论和情境感知的餐馆推荐方法 | |
CN110163647B (zh) | 一种数据处理方法及装置 | |
CN109165294B (zh) | 一种基于贝叶斯分类的短文本分类方法 | |
CN111104526A (zh) | 一种基于关键词语义的金融标签提取方法及系统 | |
CN111177538B (zh) | 一种基于无监督权值计算的用户兴趣标签构建方法 | |
CN106447066A (zh) | 一种大数据的特征提取方法和装置 | |
CN112256866B (zh) | 一种基于深度学习的文本细粒度情感分析算法 | |
CN107832338B (zh) | 一种识别核心产品词的方法和系统 | |
CN104111925B (zh) | 项目推荐方法和装置 | |
CN111460251A (zh) | 数据内容个性化推送冷启动方法、装置、设备和存储介质 | |
CN111429161B (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN109086265A (zh) | 一种语义训练方法、短文本中多语义词消歧方法 | |
US20220058464A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN117522479B (zh) | 互联网广告精准投放方法及系统 | |
CN112256965A (zh) | 一种基于lambdaMart的神经协同过滤模型推荐方法 | |
CN104572733A (zh) | 用户兴趣标签分类的方法及装置 | |
CN110083766B (zh) | 一种基于元路径引导嵌入的查询推荐方法及装置 | |
Issam et al. | Financial sentiment analysis of tweets based on deep learning approach | |
CN114707041A (zh) | 消息推荐方法、装置、计算机可读介质及电子设备 | |
CN116882414B (zh) | 基于大规模语言模型的评语自动生成方法及相关装置 | |
TW201243627A (en) | Multi-label text categorization based on fuzzy similarity and k nearest neighbors | |
CN111310048B (zh) | 基于多层感知机的新闻推荐方法 | |
CN105677830B (zh) | 一种基于实体映射的异构媒体相似性计算方法及检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200529 Termination date: 20201019 |
|
CF01 | Termination of patent right due to non-payment of annual fee |