CN113158078A - 一种结合地点类别和社交网络的兴趣点推荐方法 - Google Patents
一种结合地点类别和社交网络的兴趣点推荐方法 Download PDFInfo
- Publication number
- CN113158078A CN113158078A CN202110418537.XA CN202110418537A CN113158078A CN 113158078 A CN113158078 A CN 113158078A CN 202110418537 A CN202110418537 A CN 202110418537A CN 113158078 A CN113158078 A CN 113158078A
- Authority
- CN
- China
- Prior art keywords
- user
- category
- place
- location
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种结合地点类别和社交网络的兴趣点推荐方法,该方法包括以下步骤数据采集及划分;构建地点类别矩阵;计算用户的地点偏好;使用社会正则化进行建模;运用结合地点类别和社交网络的兴趣点推荐算法生成推荐。本发明考虑先从用户历史签到记录获取用户地点类别偏好,然后考虑朋友间的类别偏好差异性,通过对社交网站Yelp的公开数据集进行分析,发现相比访问共同的地点,朋友之间更容易访问相同的类别。考虑朋友间地点类别偏好关系比直接考虑用户间项目偏好的关系更为合适。
Description
技术领域
本发明属于数据挖掘和自然语言处理领域,尤其涉及一种结合地点类 别和社交网络的兴趣点推荐方法。
背景技术
近些年,信息技术飞速发展,互联网在人们的生活学习工作中得到了 广泛的应用,给人们带来了极大的便捷。而移动互联网的发展和移动设备 的普及使得人们可以随时随地的接入网络获得服务。据工信部统计,截止 2018年,我国移动互联网用户和手机上网用户均超过10亿,海量的移动 互联网用户促使了社交网络的繁荣,如国内的微博用户已超过5亿,微信 用户已超过9亿,社交网络已经成为人们生活的一个重要部分。人们可以 通过社交网络来和好友保持联络,同时也可以关注和分享自己感兴趣的事。
现在4G网络已经遍布全国,5G网络也在试运行阶段,随着移动互 联网的不断升级和GPS定位技术的不断发展,获取人们的位置信息也变 得更加容易,比如现在手机上使用的APP大多都需要获取手机的位置权 限,这给基于位置的社交网络(Location-BasedSocial Networks,LBSNs) 的兴起提供了契机。现在国外的Foursquare,Yelp,Gowalla以及国内的微 博、微信和美团等LBSNs都拥有海量的用户。据统计,每个月分别有超 过5000万和7500万用户使用Foursquare和Yelp,Foursquare累计了 超过120亿条签到记录,Yelp有超过17100万条用户评论。在基于位置 的社交网络中,人们可以直接在自己所在的地点进行签到,或者发布自己 在某地的经历、感受以及对地点的评论等并公开地点的位置。这些地点都 是现实中的地点,比如餐厅、电影院、咖啡馆等。而随着城市建设的越来 越好,地点数量和种类也越来越多,人们可以体验不同的服务,但繁多的 地点在丰富人们的生活的同时,也带来了“信息过载”的问题,这么多的 地点哪个是自己喜欢的?而且随着交通出行的愈加便捷,更多的人喜欢去 新的城市旅游,还有很多人因工作需要经常去别的城市出差,在一个陌生 的环境,如何能够快速找到自己感兴趣的地点?
解决信息过载的方法一般有两种:一个是搜索引擎,人们通过输入关 键字寻找自己想要的信息;二是推荐系统,根据用户的历史记录向用户推 荐其可能感兴趣的物品,比如商品、电影和图书等。推荐系统在国内外得 到了广泛的应用,显现出了巨大的商业价值,如国外的Amazon、Netflix、 Soptify以及国内的京东、豆瓣、今日头条等,推荐内容涵盖了商品、电影、 音乐和新闻等众多领域。随着LBSNs的用户数量和用户历史记录数据的 海量累计,通过分析这些用户的签到记录和评论信息,可以获取用户的地 点偏好,从而给用户推荐其可能感兴趣的地点。由此,基于LBSNs的地 点推荐应运而生并得到了学术界和工业界的广泛重视,地点推荐不仅可以 在众多地点中选择出用户可能感兴趣的地点推荐给用户,也给LBSNs上 的服务提供商提供用户量,商家更容易让用户发现他们,同时也有利用广告机构更有效的投放广告给潜在用户,能够带来巨大的经济效益,具有重 大的现实意义。除此之外,用户也可以在LBSNs上探索周围的餐厅或者 市区的商圈等,甚至可以在一个陌生的城市迅速找到自己感兴趣的地点, 所以地点推荐也可以帮助用户快速熟悉一个陌生的环境,给用户带来巨大 的便捷。
发明内容
基于以上现有技术的不足,本发明考虑先从用户历史签到记录获取用 户地点类别偏好,然后考虑朋友间的类别偏好差异性,提出一种结合地点 类别和社交网络的兴趣点推荐方法,目的是为目标用户推荐其可能最感兴 趣的前N个兴趣点。
为了实现以上发明,提出了一种结合地点类别和社交网络的兴趣点推 荐方法,包括以下步骤:
S1、数据的采集及划分:先对数据进行预处理,删除签到次数少于五 次的用户和被签到次数少于五次的地点,然后根据时间序列选取前80%的 数据做训练集,剩下10%做测试集,从训练集中随机选取10%的交互作为 验证集,用于调整超参数;
S2、构建地点类别矩阵:根据用户的历史签到数据构造用户的地点类 别相关性矩阵;
S3、计算用户的地点偏好:使用基于用户的协同过滤方法来计算用户 的地点偏好;
S4、使用社会正则化进行建模;
S5、运用结合地点类别和社交网络的兴趣点推荐算法生成推荐。
优选的,所述步骤S1的数据采集及划分的具体步骤如下:
S101、将下载的Yelp数据集进行数据预处理;
S102、删除签到次数少于五次的用户和被签到次数少于五次的地点;
S103、将数据按照8:1:1的比例分别划分训练集、测试集和验证集。
优选的,所述步骤S2中构建地点类别矩阵的处理的具体步骤如下:
S201、根据用户的历史签到数据构造用户的地点类别相关性矩阵其中|u|是用户数量,|c|是地点类别数量,通过矩阵分解,用户 的地点类别相关性矩阵分成用户相关矩阵U∈Rk×|u|和地点类别相关性相关 矩阵其中k是潜在因子向量的维度,得到用户的地点类别相关 性矩阵如公式如下:
P≈UT×V
对于用户u,他的潜在因子向量Uu表示其对连续签到类别对的偏好程 度,对于连续签到类别对v,其潜在因子向量Vv用在两个类别之间连续签 到过的次数来表示地点类别之间的相关性,因此计算结果PT×Q就是用户的 地点类别相关性。
可选的,所述步骤S3中计算用户的地点偏好的具体步骤如下:
通过预测用户下一个签到地点的类别和用户的地点偏好以及地理距离 对用户签到活动的影响,结合这三种因素来得到用户u将到地点l签到的 概率。
可选的,所述步骤S4中使用社会正则化进行建模的具体步骤如下:
S401、使用社会正则化进行建模:
式中:λ3是权衡社会正则化作用的权重参数;F+(i)为用户i在社交网络中 主动关注的朋友列表;Sim(i,o)计算用户i和用户o在位置类别上的偏好相 似性,相似度的计算方式有很多种,采用杰卡德系数,为:
式中,Ci是用户i访问过的全体类别。
可选的,所述步骤S5中运用结合地点类别和社交网络的兴趣点推荐算 法生成推荐的具体步骤如下:
S501、对目标函数采用随机梯度下降法求解P和Q;
S502、求得P和Q之后计算用户u对未知地点l的最终分值,最后对所 有地点的分数按从高到低进行排序,选取Top-K个兴趣点作为推荐结果。
由上,本发明考虑先从用户历史签到记录获取用户地点类别偏好,然后 考虑朋友间的类别偏好差异性,通过对社交网站Yelp的公开数据集进行分 析,发现相比访问共同的地点,朋友之间更容易访问相同的类别。考虑朋 友间地点类别偏好关系比直接考虑用户间项目偏好的关系更为合适,目的 是为目标用户推荐其可能最感兴趣的前N个兴趣点。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的 技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和 其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附 图,详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的附图 作简单地介绍。
图1为本发明的结合地点类别和社交网络的兴趣点推荐方法的基本流 程图;
图2为运用结合地点类别和社交网络的兴趣点推荐算法的流程图。
具体实施方式
下面结合附图详细说明本发明的具体实施方式,其作为本说明书的一 部分,通过实施例来说明本发明的原理,本发明的其他方面、特征及其优 点通过该详细说明将会变得一目了然。在所参照的附图中,不同的图中相 同或相似的部件使用相同的附图标号来表示。
本发明的模块结构如下:
数据的采集及划分模块,下载Yelp数据集并进行数据预处理,使用 10-core设置,删除签到次数少于五次的用户和被签到次数少于五次的地 点,将数据按照8:1:1的比例分别划分训练集、测试集和验证集。
构建地点类别矩阵模块,根据用户的历史签到数据构造用户的地点类 别相关性矩阵。
计算用户的地点偏好模块,先计算用户u在地点l签到的预测概率, 在连续地点推荐中,由于已知用户当前位置,因此在建模地理因素时,只 需要考虑地理距离的影响,利用反比例模型可以得到用户u去地点l签到 的预测概率。
使用社会正则化进行建模模块,利用用户i在社交网络中主动关注的 朋友列表进行建模。
结合地点类别和社交网络的兴趣点推荐算法生成推荐模块,先对目标 函数采用随机梯度下降法求解P和Q;求得P和Q之后计算用户u对未知 地点l的最终分值,最后对所有地点的分数按从高到低进行排序,选取 Top-K个兴趣点作为推荐结果。
如图1至图2所示,本发明的结合地点类别和社交网络的兴趣点推荐 方法,包括如下步骤:
S1、数据的采集及划分:先对数据进行预处理,删除签到次数少于五 次的用户和被签到次数少于五次的地点,然后根据时间序列选取前80%的 数据做训练集,剩下10%做测试集,从训练集中随机选取10%的交互作为 验证集,用于调整超参数;;
S3、计算用户的地点偏好:使用基于用户的协同过滤方法来计算用户 的地点偏好;
S4、使用社会正则化进行建模:目前大多数有关兴趣点推荐的研究都 是直接根据相似度来考虑朋友之间的社交关系。而朋友之间对于相同地点 的偏好其实存在较大的差异。因此,传统的推荐系统依靠朋友间的相似性 或者直接从朋友处获取地点就变得非常不合适。地点类别是对地点功能和 语义的提炼,能够反映用户的个人倾向。Yelp数据集充分表明了用户间共 同签到类别的比例远远超过共同签到地点。因此,从该角度出发,提出使用社会正则化对这种差异性建模;
S5、运用结合地点类别和社交网络的兴趣点推荐算法生成推荐:基于 S2和S3阐述的内容,提出了一种将地点类别和社交网络进行结合的兴趣 点推荐方法,从而为用户生成推荐。
步骤S1中的数据的采集及划分的具体步骤如下:
S101、将下载的Yelp数据集进行数据预处理;
S102、删除签到次数少于五次的用户和被签到次数少于五次的地点;
S103、将数据按照8:1:1的比例分别划分训练集、测试集和验证集。
步骤S2中构建地点类别矩阵的处理的具体步骤如下:
S201、根据用户的历史签到数据构造用户的地点类别相关性矩阵其中|u|是用户数量,|c|是地点类别数量。通过矩阵分解,用户 的地点类别相关性矩阵分成用户相关矩阵U∈Rk×|u|和地点类别相关性相关 矩阵其中k是潜在因子向量的维度,因此可以得到用户的地点 类别相关性矩阵如公式如下:
P≈UT×V
对于用户u,他的潜在因子向量Uu表示其对连续签到类别对的偏好程 度,对于连续签到类别对v(如类别a到类别b),其潜在因子向量Vv用 在两个类别之间连续签到过的次数来表示地点类别之间的相关性,因此计 算结果PT×Q就是用户的地点类别相关性。
步骤S3中计算用户的地点偏好具体步骤如下:
通过预测用户下一个签到地点的类别和用户的地点偏好以及地理距离 对用户签到活动的影响,结合这三种因素来得到用户u将到地点l签到的 概率pu,l,其公式如下:
步骤S4中使用社会正则化进行建模的具体步骤如下:
S401、使用社会正则化进行建模:
式中:λ3是权衡社会正则化作用的权重参数;F+(i)为用户i在社交网络中 主动关注的朋友列表;Sim(i,o)计算用户i和用户o在位置类别上的偏好相 似性。相似度的计算方式有很多种,采用杰卡德系数,为:
式中,Ci是用户i访问过的全体类别,在目前的推荐系统研究进展中,社 会正则化已经得到了很多研究者的认可和使用,它缓解了协同过滤的数据 稀疏难题,对推荐的质量有一定的保障。
如图2所示,步骤S5中使用结合地点类别和社交网络的兴趣点推荐算 法的具体步骤如下:
S501、对目标函数采用随机梯度下降法求解P和Q;
S502、求得P和Q之后计算用户u对未知地点l的最终分值,最后对 所有地点的分数按从高到低进行排序,选取Top-K个兴趣点作为推荐结果。
以上所述是本发明的优选实施方式而已,当然不能以此来限定本发明 之权利范围,应当指出,对于本技术领域的普通技术人员来说,在不脱离 本发明原理的前提下,还可以做出若干改进和变动,这些改进和变动也视 为本发明的保护范围。
Claims (6)
1.一种结合地点类别和社交网络的兴趣点推荐方法,其特征在于,包括以下步骤:
S1、数据的采集及划分:先对数据进行预处理,删除签到次数少于五次的用户和被签到次数少于五次的地点,然后根据时间序列选取前80%的数据做训练集,剩下10%做测试集,从训练集中随机选取10%的交互作为验证集,用于调整超参数;
S2、构建地点类别矩阵:根据用户的历史签到数据构造用户的地点类别相关性矩阵;
S3、计算用户的地点偏好:使用基于用户的协同过滤方法来计算用户的地点偏好;
S4、使用社会正则化进行建模;
S5、运用结合地点类别和社交网络的兴趣点推荐算法生成推荐。
2.如权利要求1所述的结合地点类别和社交网络的兴趣点推荐方法,其特征在于,所述步骤S1的数据采集及划分的具体步骤如下:
S101、将下载的Yelp数据集进行数据预处理;
S102、删除签到次数少于五次的用户和被签到次数少于五次的地点;
S103、将数据按照8:1:1的比例分别划分训练集、测试集和验证集。
3.如权利要求1所述的结合地点类别和社交网络的兴趣点推荐方法,其特征在于,所述步骤S2中构建地点类别矩阵的处理的具体步骤如下:
S201、根据用户的历史签到数据构造用户的地点类别相关性矩阵其中|u|是用户数量,|c|是地点类别数量,通过矩阵分解,用户的地点类别相关性矩阵分成用户相关矩阵U∈Rk×|u|和地点类别相关性相关矩阵其中k是潜在因子向量的维度,得到用户的地点类别相关性矩阵如公式如下:
P≈UT×V
对于用户u,其潜在因子向量Uu表示其对连续签到类别对的偏好程度,对于连续签到类别对v,其潜在因子向量Vv用在两个类别之间连续签到过的次数来表示地点类别之间的相关性,计算结果PT×Q就是用户的地点类别相关性。
6.如权利要求1所述的结合地点类别和社交网络的兴趣点推荐方法,其特征在于,所述步骤S5中运用结合地点类别和社交网络的兴趣点推荐算法生成推荐的具体步骤如下:
S501、对目标函数采用随机梯度下降法求解P和Q;
S502、求得P和Q之后计算用户u对未知地点l的最终分值,最后对所有地点的分数按从高到低进行排序,选取Top-K个兴趣点作为推荐结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110418537.XA CN113158078A (zh) | 2021-04-19 | 2021-04-19 | 一种结合地点类别和社交网络的兴趣点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110418537.XA CN113158078A (zh) | 2021-04-19 | 2021-04-19 | 一种结合地点类别和社交网络的兴趣点推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113158078A true CN113158078A (zh) | 2021-07-23 |
Family
ID=76868806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110418537.XA Pending CN113158078A (zh) | 2021-04-19 | 2021-04-19 | 一种结合地点类别和社交网络的兴趣点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113158078A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107181672A (zh) * | 2017-06-09 | 2017-09-19 | 西安电子科技大学 | 在位置社交网络中基于时间分布相对熵的好友推荐方法 |
CN107766462A (zh) * | 2017-09-28 | 2018-03-06 | 重庆大学 | 基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法 |
CN108460101A (zh) * | 2018-02-05 | 2018-08-28 | 山东师范大学 | 面向位置社交网络基于地理位置正则化的兴趣点推荐方法 |
-
2021
- 2021-04-19 CN CN202110418537.XA patent/CN113158078A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107181672A (zh) * | 2017-06-09 | 2017-09-19 | 西安电子科技大学 | 在位置社交网络中基于时间分布相对熵的好友推荐方法 |
CN107766462A (zh) * | 2017-09-28 | 2018-03-06 | 重庆大学 | 基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法 |
CN108460101A (zh) * | 2018-02-05 | 2018-08-28 | 山东师范大学 | 面向位置社交网络基于地理位置正则化的兴趣点推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rashidi et al. | Exploring the capacity of social media data for modelling travel behaviour: Opportunities and challenges | |
Xie et al. | Learning graph-based poi embedding for location-based recommendation | |
Zheng et al. | Learning travel recommendations from user-generated GPS traces | |
Kefalas et al. | A time-aware spatio-textual recommender system | |
Bao et al. | Recommendations in location-based social networks: a survey | |
Li et al. | A time-aware personalized point-of-interest recommendation via high-order tensor factorization | |
Zheng et al. | GeoLife: A collaborative social networking service among user, location and trajectory. | |
Xiao et al. | Inferring social ties between users with human location history | |
Shankar et al. | Crowds replace experts: Building better location-based services using mobile social network interactions | |
Ding et al. | Objectives and state-of-the-art of location-based social network recommender systems | |
Fogli et al. | Exploiting semantics for context-aware itinerary recommendation | |
Bao et al. | A BiLSTM-CNN model for predicting users’ next locations based on geotagged social media | |
Bin et al. | A travel route recommendation system based on smart phones and IoT environment | |
Bothorel et al. | Location recommendation with social media data | |
CN105718576B (zh) | 与地理特征相关的个性化位置推荐系统 | |
Sang et al. | Activity sensor: Check-in usage mining for local recommendation | |
Zheng et al. | Location-based social networks: Locations | |
CN115408618B (zh) | 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法 | |
Song et al. | Personalized poi recommendation based on check-in data and geographical-regional influence | |
Chen et al. | Place recommendation based on users check-in history for location-based services | |
Liang | Intelligent Tourism Personalized Recommendation Based on Multi‐Fusion of Clustering Algorithms | |
Andrade et al. | From mobility data to habits and common pathways | |
Liao et al. | Fusing geographic information into latent factor model for pick-up region recommendation | |
Pan et al. | Exploiting user behavior learning for personalized trajectory recommendations | |
Tan et al. | Preference-oriented mining techniques for location-based store search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |