CN110990717B - 一种基于跨域关联的兴趣点推荐方法 - Google Patents
一种基于跨域关联的兴趣点推荐方法 Download PDFInfo
- Publication number
- CN110990717B CN110990717B CN201911156185.4A CN201911156185A CN110990717B CN 110990717 B CN110990717 B CN 110990717B CN 201911156185 A CN201911156185 A CN 201911156185A CN 110990717 B CN110990717 B CN 110990717B
- Authority
- CN
- China
- Prior art keywords
- user
- preference
- check
- distribution
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于跨域关联的兴趣点推荐方法,着重解决POI推荐领域存在的数据稀疏问题和冷启动用户的问题。通过分析客观的电子商务数据集反应用户的购买偏好,映射到POI领域进行辅助推荐。能够很好的解决协同过滤技术中存在的不足。本发明考虑了用户在某一段时间内的兴趣迁移问题,能够更加充分地反应用户在不同季节时间段的购买偏好变化。
Description
技术领域
本发明涉及数据推荐技术领域,具体涉及一种基于跨域关联的兴趣点推荐方法。
背景技术
随着互联网信息爆炸式的增长,推荐系统成为帮助人们在大数据中寻找适用信息的利器,它能够在海量数据中,根据用户的偏好,为用户主动推荐个性化的服务,提升用户对系统的使用体验。目前,推荐系统的服务已经从电子商务领域扩展到很多其他领域,例如社交网络、位置服务、医疗服务等行业。在推荐系统相关技术的研究中,协同过滤技术是最热门的技术之一,其虽然在研究中取得了很好的推荐效果,但是由于人们的购买能力是有限的,推荐系统能够使用的数据通常非常稀疏,这会严重影响协同过滤的推荐效果。此外,推荐系统还存在用户的冷启动问题,即一个新的用户刚进入系统时是没有历史数据的,而协同过滤的基础是分析用户的历史数据,通过计算用户自身的兴趣和物品的相似度来进行推荐(如果一个用户A喜欢物品B,物品B与物品C相似,那么就可以给用户A推荐物品C),因此,原始的协同过滤技术无法解决用户的冷启动问题。
发明内容
本发明所要解决的是现有协同过滤推荐方法存在数据稀疏性和冷启动用户的问题,提供一种基于跨域关联的兴趣点推荐方法。
为解决上述问题,本发明是通过以下技术方案实现的:
一种基于跨域关联的兴趣点推荐方法,包括步骤如下:
步骤1、将用户在源域和目标域中的数据分别存储到源域矩阵和目标域矩阵中,其中源域矩阵的内容是用户购买物品及其购买次数,目标域矩阵的内容是用户签到兴趣点及其签到次数;
步骤2、采用LDA模型对每个用户的源域矩阵和目标域矩阵分别进行用户的购买偏好和签到偏好分布进行分析,得到每个用户的购买偏好分布和签到偏好分布;
步骤3、基于当前冷启动用户的购买偏好分布与其他用户的购买偏好分布,计算当前冷启动用户与其他用户之间的用户购买偏好相似度,并据此找到源域中与当前冷启动用户购买偏好相似的用户即共同用户,并将这些共同用户的购买偏好分布和签到偏好分布形成训练集后,输入MLP模型中进行训练,得到当前冷启动用户的MLP映射函数;
步骤4、以当前冷启动用户所在的某个签到兴趣点为中心,划定一个半径为r的圆的范围,将这个范围即兴趣点商业圈内所有用户签到过的历史记录存储到兴趣点历史签到矩阵中;其中r为设定值;
步骤5、采用LDA模型对兴趣点历史签到矩阵进行分析,得到当前兴趣点商业圈内所有用户的历史签到偏好分布;
步骤6、将当前冷启动用户在步骤2所得的购买偏好分布输入到步骤3所得的MLP映射函数中,得到当前冷启动用户的匹配签到偏好分布;
步骤7、基于当前冷启动用户的匹配签到偏好分布和当前冷启动用户所在兴趣点商业圈的历史签到偏好分布,计算当前冷启动用户偏好与兴趣点商业圈内兴趣点签到偏好的匹配度;
步骤8、先将步骤2所得当前冷启动用户的购买偏好分布和步骤6所得匹配签到偏好分布进行点乘计算,再将该点乘计算的结果与步骤7得到的当前冷启动用户偏好与兴趣点商业圈内兴趣点签到偏好的匹配度进行相乘计算,得到当前冷启动用户对于兴趣点商业圈内未签到过的兴趣点的预评分,并将预评分排在前面的兴趣点推送给当前冷启动用户。
上述步骤2中,购买偏好分布通过一个K维的向量来进行表示,该向量内容是用户对购买物品的偏好权重;签到偏好分布通过一个K维的向量来进行表示,该向量内容是用户对签到兴趣点的偏好权重;其中K为设定值。
其中,表示在匹配签到偏好分布中,冷启动用户u'在某个时间段tk内匹配签到偏好主题下的词分布;/>表示在历史签到偏好分布中,冷启动用户u'在的当前的兴趣点在某个时间段tk内所处兴趣点商业圈内历史签到偏好主题下的词分布。
作为改进,步骤8还进一步包括,将当前冷启动用户对于兴趣点商业圈内未签到过的兴趣点的预评分加上该兴趣点的全局平均签到次数,得到最终预评分,并将最终预评分排在前面的兴趣点推送给当前冷启动用户。
与现有技术相比,本发明具有如下特点:
1、采用用户在电子商务领域的购买记录数据对用户偏好进行分析来辅助跨域推荐。常用的推荐技术都是基于项目评分、用户评论等显式的用户消费行为数据进行分析的。其中基于项目评分的研究通常采用矩阵分解的方法,基于用户评论的研究通常采用隐语义模型对用户的偏好进行分析。本发明采用用户隐式的消费行为购买记录数据,因为这个数据集相对于评分或评论数据来说更加客观并且更加密集。通过建立LDA模型,分析得到用户在电子商务数据集中的购买主题偏好分布以及用户在POI数据集中的签到主题偏好分布。将用户的数据存储在矩阵中,每一个用户的一行数据视作一篇文档采用模型来进行分析。
2、增加时间维度,将用户一年内的历史购物记录数据和POI签到数据划分为四个时间段进行分析。考虑到用户当前临时的购买行为也可能受到多种因素的影响,并且用户的购买偏好是阶段性的,例如用户在在某个时间段内需要为结婚做准备,那么在这个时间段内,婚庆主题的用品会占据很大的购买比重。本发明将用户在一年内的购买记录分为四个季度,对用户在不同时间段内的偏好分别进行分析。
3、基于用户的主题相似度学习用户的映射函数。考虑到传统的学习所有共同用户的分布会产生一定的数据冗余,并且会增加时间复杂度。本发明通过计算目标域冷启动用户在源域中的主题相似度来选择用来学习共同用户的函数,用户的主题相似度通过余弦相似度来衡量。最后得到夹角的值越小,代表两个用户的主题向量越相似。
4、基于跨域关联技术进行POI推荐。跨域推荐的实现是基于两个域之间存在一定的联系上实现的,考虑到用户在电子商务数据集中的偏好分布在一定程度上能够反映用户到达一个位置后可能发送的签到服务,基于这样的联系,本发明将用户在电子商务领域的偏好分布迁移到POI领域进行推荐。
附图说明
图1为一种基于跨域关联的兴趣点推荐方法的原理图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实例,对本发明进一步详细说明。
本发明利用电子商务领域数据与兴趣点(POI,Point-Of-Interest)领域数据之间的关联实现跨域推荐。本发明认为,用户在电子商务领域的数据集与用户的兴趣点签到是存在一定关联的,例如一个用户在电商网站中更偏好购买运动器材,那么他在到达一个位置后更可能发送与运动有关的兴趣点,如健身房等。在获得用户的源域和目标域的历史数据后,通过潜在狄利克雷分布(LDA,Latent Dirichlet Allocation)模型分别对用户的购买偏好和签到偏好进行分析,由于用户在不同域中的签到语义是不同的,电子商务领域的数据不能直接应用于POI领域进行推荐,因此本发明采用多层感知器(MLP,Multi-LayerPerception)的非线性映射方法,将电子商务领域分析得到的偏好分布映射到POI领域,从而实现利用辅助的电子商务数据分析用户偏好从而对用户进行POI领域的个性化推荐。
一种基于跨域关联的兴趣点推荐方法,如图1所示,其具体包括如下步骤:
步骤1、将用户在源域(即电子商务)和目标域(即兴趣点)中的数据分别存储到源域和目标域矩阵中,其中源域矩阵的内容是用户购买物品及其购买次数,目标域矩阵的内容是用户签到兴趣点及其签到次数。
在本发明中,对于每个用户,可以将其所有时间段内的源域数据形成一个源域矩阵,目标域的数据形成一个目标域矩阵。但是考虑到用户的购买偏好是具有阶段性的,本发明优选实施例中,将用户在一年内的数据划分为四个季度(一季度1月至3月、二季度4月至6月、三季度7月至9月、四季度10月至12月),由此得到4个源域矩阵(第一季度源域矩阵、第二季度源域矩阵、第三季度源域矩阵和第四季度源域矩阵)和4个目标域矩阵(第一季度目标域矩阵、第二季度目标域矩阵、第三季度目标域矩阵和第四季度目标域矩阵)。
另外,考虑到用户的签到特性受地理位置的影响,设定一个半径r,用户到达一个位置后,只统计以这个位置为圆心的半径为r的圆内的兴趣点签到次数。
每个用户ui的每一个购买偏好分布和每一个签到偏好分布分别可以通过一个K维的向量来进行表示,该向量内容是用户ui对主题Zi(即购买物品或签到地点)的偏好权重。其中偏好分布的维度K(即设定的购买物品的主题数量)和签到偏好分布的维度K(即设定的签到地点的主题数量)相同。
步骤3、基于当前冷启动用户的购买偏好分布与源域中其他用户的购买偏好分布,计算当前冷启动用户与源域中其他用户之间的用户购买偏好相似度,并据此找到源域中与当前冷启动用户购买偏好相似的用户即共同用户,并将这些共同用户的购买偏好分布和签到偏好分布/>形成训练集/>i∈{1,2,...,N}后,输入MLP模型中进行训练,得到当前冷启动用户的MLP映射函数。
当前冷启动用户与源域中其他用户之间的用户购买偏好相似度simu,u'用余弦相似度进行衡量,计算得到的夹角越小,代表越相似:
其中,是冷启动用户u'与源域中其他用户u之间的用户购买偏好相似度的集合,simu,u'是冷启动用户u'与源域中其他用户u之间的用户购买偏好相似度,/>表示冷启动用户u'在源域中的某个时间段tk内够买物品下的词分布,/>表示源域中其他用户u在源域中的某个时间段tk内够买物品下的词分布。
在本发明优选实施例中,由于考虑加入了时间维度,因此所得到的MLP映射函数为四个不同时间段下的MLP映射函数。
步骤4、以冷启动用户u'所在的某个兴趣点为中心,划定一个半径为r的圆的范围,将这个范围即兴趣点商业圈内所有用户签到过的历史记录存储到矩阵中,在目标域形成一个兴趣点历史签到矩阵。
步骤5、将这个矩阵输入到LDA模型中,分析得到在当前兴趣点商业圈内所有用户的历史签到偏好分布。
其中,代表当前冷启动用户u'与兴趣点商业圈内内兴趣点p的匹配度,/>表示在匹配签到偏好分布中,冷启动用户u'在某个时间段tk内匹配签到偏好主题下的词分布;/>表示在历史签到偏好分布中,冷启动用户u'所在的当前的兴趣点在某个时间段tk内所处兴趣点商业圈内历史签到偏好主题下的词分布;
步骤8、得到用户购买偏好与兴趣点签到分布的相似度后,用以下公式预测冷启动用户u'对于未签到过的兴趣点的可能的打分:
本发明认为,一个人的兴趣可以分为长期的和阶段性的。因此如果一个人对于某一项兴趣只是在一段时间内产生,那么相对于一个长期的兴趣,这个阶段性的兴趣得分就会较低。
为了获得更好的推荐效果,本发明将一个基本的评估函数和打分函数结合起来得到一个预测评分,以此来实现POI兴趣点的推荐:
S(u',p)=bP+ru',p
其中,bP代表目标域中所有兴趣点的全局平均签到次数。
至此,整个推荐过程就完成了。本发明着重解决POI推荐领域存在的数据稀疏问题和冷启动用户的问题。通过分析客观的电子商务数据集反应用户的购买偏好,映射到POI领域进行辅助推荐。能够很好的解决协同过滤技术中存在的不足。本发明考虑了用户在某一段时间内的兴趣迁移问题,能够更加充分地反应用户在不同季节时间段的购买偏好变化。
需要说明的是,尽管以上本发明所述的实施例是说明性的,但这并非是对本发明的限制,因此本发明并不局限于上述具体实施方式中。在不脱离本发明原理的情况下,凡是本领域技术人员在本发明的启示下获得的其它实施方式,均视为在本发明的保护之内。
Claims (3)
1.一种基于跨域关联的兴趣点推荐方法,其特征是,包括步骤如下:
步骤1、将用户在源域和目标域中的数据分别存储到源域矩阵和目标域矩阵中,其中源域矩阵的内容是用户购买物品及其购买次数,目标域矩阵的内容是用户签到兴趣点及其签到次数;
步骤2、采用LDA模型对每个用户的源域矩阵和目标域矩阵分别进行用户的购买偏好和签到偏好分布进行分析,得到每个用户的购买偏好分布和签到偏好分布;购买偏好分布通过一个K维的向量来进行表示,该向量内容是用户对购买物品的偏好权重;签到偏好分布通过一个K维的向量来进行表示,该向量内容是用户对签到兴趣点的偏好权重;其中K为设定值;
步骤3、基于当前冷启动用户的购买偏好分布与其他用户的购买偏好分布,计算当前冷启动用户与其他用户之间的用户购买偏好相似度,并据此找到源域中与当前冷启动用户购买偏好相似的用户即共同用户,并将这些共同用户的购买偏好分布和签到偏好分布形成训练集后,输入MLP模型中进行训练,得到当前冷启动用户的MLP映射函数;
步骤4、以当前冷启动用户所在的某个签到兴趣点为中心,划定一个半径为r的圆的范围,将这个范围即兴趣点商业圈内所有用户签到过的历史记录存储到兴趣点历史签到矩阵中;其中r为设定值;
步骤5、采用LDA模型对兴趣点历史签到矩阵进行分析,得到当前兴趣点商业圈内所有用户的历史签到偏好分布;
步骤6、将当前冷启动用户在步骤2所得的购买偏好分布输入到步骤3所得的MLP映射函数中,得到当前冷启动用户的匹配签到偏好分布;
步骤7、基于当前冷启动用户的匹配签到偏好分布和当前冷启动用户所在兴趣点商业圈的历史签到偏好分布,计算当前冷启动用户偏好与兴趣点商业圈内兴趣点签到偏好的匹配度;当前冷启动用户u'与兴趣点商业圈内兴趣点p的匹配度为:
其中,表示在匹配签到偏好分布中,冷启动用户u'在某个时间段tk内匹配签到偏好主题下的词分布;/>表示在历史签到偏好分布中,冷启动用户u'在的当前的兴趣点在某个时间段tk内所处兴趣点商业圈内历史签到偏好主题下的词分布;
步骤8、先将步骤2所得当前冷启动用户的购买偏好分布和步骤6所得匹配签到偏好分布进行点乘计算,再将该点乘计算的结果与步骤7得到的当前冷启动用户偏好与兴趣点商业圈内兴趣点签到偏好的匹配度进行相乘计算,得到当前冷启动用户对于兴趣点商业圈内未签到过的兴趣点的预评分,并将预评分排在前面的兴趣点推送给当前冷启动用户。
3.根据权利要求1所述的一种基于跨域关联的兴趣点推荐方法,其特征是,步骤8还进一步包括,将当前冷启动用户对于兴趣点商业圈内未签到过的兴趣点的预评分加上该兴趣点的全局平均签到次数,得到最终预评分,并将最终预评分排在前面的兴趣点推送给当前冷启动用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911156185.4A CN110990717B (zh) | 2019-11-22 | 2019-11-22 | 一种基于跨域关联的兴趣点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911156185.4A CN110990717B (zh) | 2019-11-22 | 2019-11-22 | 一种基于跨域关联的兴趣点推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110990717A CN110990717A (zh) | 2020-04-10 |
CN110990717B true CN110990717B (zh) | 2023-03-31 |
Family
ID=70085938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911156185.4A Active CN110990717B (zh) | 2019-11-22 | 2019-11-22 | 一种基于跨域关联的兴趣点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110990717B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111666462B (zh) * | 2020-04-28 | 2021-09-21 | 百度在线网络技术(北京)有限公司 | 地理位置的推荐方法、装置、设备和计算机存储介质 |
CN112100509B (zh) * | 2020-11-17 | 2021-02-09 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、服务器和存储介质 |
CN116843394B (zh) * | 2023-09-01 | 2023-11-21 | 星河视效科技(北京)有限公司 | 一种基于ai的广告推送方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897464A (zh) * | 2017-03-29 | 2017-06-27 | 广东工业大学 | 一种跨领域推荐方法及系统 |
CN107103499A (zh) * | 2017-04-26 | 2017-08-29 | 中国人民大学 | 一种基于深度学习的跨站点冷启动推荐方法 |
CN109523341A (zh) * | 2018-10-12 | 2019-03-26 | 广西师范大学 | 基于区块链技术的匿名跨域推荐方法 |
CN109684561A (zh) * | 2018-12-24 | 2019-04-26 | 宿州学院 | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 |
CN109711925A (zh) * | 2018-11-23 | 2019-05-03 | 西安电子科技大学 | 具有多个辅助域的跨域推荐数据处理方法、跨域推荐系统 |
CN109726336A (zh) * | 2018-12-21 | 2019-05-07 | 长安大学 | 一种结合出行兴趣与社交偏好的poi推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10878029B2 (en) * | 2015-09-10 | 2020-12-29 | Adobe Inc. | Incorporating social-network connections information into estimated user-ratings of videos for video recommendations |
-
2019
- 2019-11-22 CN CN201911156185.4A patent/CN110990717B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897464A (zh) * | 2017-03-29 | 2017-06-27 | 广东工业大学 | 一种跨领域推荐方法及系统 |
CN107103499A (zh) * | 2017-04-26 | 2017-08-29 | 中国人民大学 | 一种基于深度学习的跨站点冷启动推荐方法 |
CN109523341A (zh) * | 2018-10-12 | 2019-03-26 | 广西师范大学 | 基于区块链技术的匿名跨域推荐方法 |
CN109711925A (zh) * | 2018-11-23 | 2019-05-03 | 西安电子科技大学 | 具有多个辅助域的跨域推荐数据处理方法、跨域推荐系统 |
CN109726336A (zh) * | 2018-12-21 | 2019-05-07 | 长安大学 | 一种结合出行兴趣与社交偏好的poi推荐方法 |
CN109684561A (zh) * | 2018-12-24 | 2019-04-26 | 宿州学院 | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 |
Non-Patent Citations (2)
Title |
---|
《一种新的用于用于跨领域推荐的迁移学习类型》;王俊;《计算机学报》;20170329;第10卷(第40期);全文 * |
《基于深度学习的混合兴趣点推荐算法》;冯浩;《电子与信息学报》;20181221;第41卷(第4期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110990717A (zh) | 2020-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bag et al. | An efficient recommendation generation using relevant Jaccard similarity | |
CN107908740B (zh) | 信息输出方法和装置 | |
Zhao et al. | Exploring demographic information in social media for product recommendation | |
US10685181B2 (en) | Linguistic expression of preferences in social media for prediction and recommendation | |
CN110990717B (zh) | 一种基于跨域关联的兴趣点推荐方法 | |
CN102902691A (zh) | 推荐方法及系统 | |
US20090248496A1 (en) | System and method for automating market analysis from anonymous behavior profiles | |
CN109508428B (zh) | 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法 | |
GB2547395A (en) | User maintenance system and method | |
Eliyas et al. | Recommendation systems: Content-based filtering vs collaborative filtering | |
Wijnhoven et al. | Sentiment analysis and Google trends data for predicting car sales | |
Hu et al. | An item orientated recommendation algorithm from the multi-view perspective | |
KR20160065429A (ko) | 하이브리드 개인화 상품추천 방법 | |
US20140324729A1 (en) | Computerized System and Method for Determining an Action Person's Influence on a Transaction | |
Aggarwal et al. | Comparing content based and collaborative filtering in recommender systems | |
Badriyah et al. | Recommendation system for property search using content based filtering method | |
Ji et al. | BRS c S: a hybrid recommendation model fusing multi-source heterogeneous data | |
Saraswathi et al. | Deep Learning Enabled Social Media Recommendation Based on User Comments. | |
CN109684561B (zh) | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 | |
Wei et al. | Online shopping behavior analysis for smart business using big data analytics and blockchain security | |
CN108960954B (zh) | 一种基于用户群行为反馈的内容推荐方法及推荐系统 | |
Salman et al. | Product recommendation system using deep learning techniques: CNN and NLP | |
Choeh et al. | Personalized Approach for Recommending Useful Product Reviews Based on Information Gain. | |
Kinski | Google trends as complementary tool for new car sales forecasting: A cross-country comparison along the customer journey | |
Khadka et al. | Restaurant recommendation system using user based collaborative filtering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |