CN110851742A - 一种基于位置和时间信息的兴趣点推荐方法及装置 - Google Patents
一种基于位置和时间信息的兴趣点推荐方法及装置 Download PDFInfo
- Publication number
- CN110851742A CN110851742A CN201911120301.7A CN201911120301A CN110851742A CN 110851742 A CN110851742 A CN 110851742A CN 201911120301 A CN201911120301 A CN 201911120301A CN 110851742 A CN110851742 A CN 110851742A
- Authority
- CN
- China
- Prior art keywords
- interest
- point
- user
- similarity
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于社交网络兴趣推荐领域,涉及一种基于位置和时间信息的兴趣点推荐方法及装置,所述方法包括获取关于用户信息、兴趣点信息以及用户与兴趣点的互动信息的数据源;提取数据源中用户和兴趣点的特征属性;利用兴趣点位置信息建模模型,预测用户可能感兴趣且未曾访问过的兴趣点集合;利用兴趣点的签到时间信息进行建模,计算不同兴趣点之间的相似性以及兴趣点的流行度;综合该两个模型的预测值,将综合预测出来的兴趣点推荐给用户;本发明一方面有助于个人用户快速探索和熟悉新的场所和区域,另一方面有助于商家掌握用户行为特性分布,分析潜在用户,因此获得良好的经济、社会效益。
Description
技术领域
本发明属于社交网络兴趣推荐领域,涉及一种基于位置和时间信息的兴趣点推荐方法及装置。
背景技术
在信息化时代,随着互联网技术和定位技术的飞速发展以及社会经济的快速发展,人们选择出行的方式以及出行的地点越来越广泛。人们的兴趣点(point of interest,POI)如:旅游景点、电影院、博物馆、餐厅等也不断增加,然而,面对大量的POIs,人们如何根据个人喜好快速选择与自己兴趣相关的兴趣点成为了用户的一个难题。基于这样的环境下,基于位置的社交化网络(location-based social networks,LBSNs)推荐技术及其相关的应用服务应运而生,目前比较流行的LBSNs有Foursquare、Gowalla、GeoLife、微信朋友圈等。兴趣点推荐对用户和商家都有重要的应用价值。对于用户,可帮助用户快速探索和熟悉新的场所和区域;对于商家,有助于掌握用户行为特性分布,分析潜在用户,因此获得良好的经济、社会效益。因此,兴趣点推荐方法的研究具有重要的现实意义和价值。
近年来,基于位置的社交网络兴趣点推荐受到物联网巨头和电商越来越多的青睐。与此同时,许多学者对兴趣点推荐进行了大量的研究,尤其是个性化推荐技术,对改善用户体验和提高服务质量起到了重要的作用。主要是通过用户信息、社交关系、兴趣点位置信息以及签到时间等信息提出兴趣点推荐模型。目前兴趣点推荐主要分为三种:基于位置信息、基于时间信息以及基于位置和时间信息的兴趣点推荐。前两者从用户的角度出发,分别利用位置和时间信息通过计算用户的相似度为目标用户产生兴趣点推荐集合;后者综合考虑位置和时间信息,通过计算用户的相似度为目标用户产生兴趣点推荐集合。现有的推荐技术可分为基于项目的协同过滤和基于用户的协同过滤。前者以项目的角度出发,通过分析计算项目之间的相似度为目标用户产生推荐;后者以用户的角度出发,主要利用用户信息以及交互信息分析计算用户之间的相似度,从而为目标用户产生兴趣点推荐。
现有的推荐方法仍存在一下问题:
1.兴趣点具有空间特征。单考虑兴趣点的签到时间信息,忽略了兴趣点的位置信息,不能够为目标用户推荐合适兴趣点集合,如基本没有用户会在一天中访问两个距离相隔甚远的地点。
2.兴趣点具有时序特征。仅考虑兴趣点的和用户的位置信息以及兴趣点之间的位置信息,忽略了兴趣点的时序特征,从而忽略了兴趣点的隐含模式,不能够准确的为目标用户推荐合适的新的兴趣点集合,如很少会有用户会在早上或者上午去酒吧、KTV等场所。
3.兴趣点动态时限性。在兴趣点推荐中,利用基于用户的协同过滤,更多的通过用户信息、社交关系等计算用户之间的相似度产生推荐,没有更好的考虑到兴趣点的隐含模式。
发明内容
针对上述问题,本发明提出一种基于位置和时间信息的兴趣点推荐方法,包括以下步骤:
S1、从社交网络平台获取用户数据,并对用户数据进行预处理;
S2、从用户数据中提取用户在各个时间点对兴趣点的签到行为以及该兴趣点的位置信息;
S3、基于提取签到行为和位置信息以及用户信息构建用户相关属性;
S4、利用位置信息构建用户可能访问但是未曾访问的兴趣点的概率函数;
S5、根据用户的签到行为计算获取每个兴趣点在不同的时间的流行度以及兴趣点之间的相似性;
S6、综合考虑用户位置信息和签到行为的相似度构建整体相似度,并从当前用户已经签过到的兴趣点中选取兴趣点作为该用户的特征兴趣点;
S7、计算当前用户未签过到的兴趣点与该用户的特征兴趣点的整体相似度,并从当前用户未签过到的集合中选取前N个与当前用户的特征兴趣点整体相似度最高的兴趣点推荐给该用户。
进一步的,当前用户未签过到的兴趣点与该用户的特征兴趣点的整体相似度表示为:
本发明还提供一种基于位置和时间信息的兴趣点推荐装置,包括数据获取模块、数据预处理模块、基于位置信息的相似度计算模块、基于时间信息的相似度计算模块、综合相似度计算模块以及推荐模块,数据预处理模块包括数据清洗单元和数据处理单元,其中:
数据获取模块用户从社交网络公共API或直接下载现有数据源;
数据清洗单元用于删除获取的数据中重复的数据以及无效数据;
数据处理模块用于用户数据中用户签到次数小于5以及兴趣点被签到次数小于5的数据;
基于位置信息的相似度计算模块用于计算在位置信息上用户已经签过到的兴趣点与其他用户未签过到的兴趣点之间位置上的相似性;
基于时间信息的相似度计算模块用于计算在时间信息上用户已经签过到的兴趣点与其他用户未签过到的兴趣点之间时间上的相似性;
综合相似度计算模块用于引入权值综合考虑基于时间信息的相似度和基于位置信息的相似度,获得综合相似度;
推荐模块用户根据综合相似度进行降序排序,并将相似度最高N个推荐给用户。
本发明对于用户,可帮助用户快速探索和熟悉新的场所和区域;对于商家,有助于掌握用户行为特性分布,分析潜在用户,因此获得良好的经济、社会效益。
附图说明
图1为本发明一种基于位置和时间信息的兴趣点推荐的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出一种基于位置和时间信息的兴趣点推荐方法,利用兴趣点的位置信息和签到时间信息相结合,将一天24小时均等划分,通过分析计算兴趣点在一天中的流行度,即在不同时间点被访问的次数,同时结合兴趣点的位置信息,以基于项目的协同过的方式计算兴趣点之间的相似度,再根据目标用户的出行记录向用户推荐新的兴趣点集合,具体包括以下步骤:
S1、从社交网络平台获取用户数据,并对用户数据进行预处理;
S2、从用户数据中提取用户在各个时间点对兴趣点的签到行为以及该兴趣点的位置信息;
S3、基于提取签到行为和位置信息以及用户信息构建用户相关属性;
S4、利用位置信息构建用户可能访问但是未曾访问的兴趣点的概率函数;
S5、根据用户的签到行为计算获取每个兴趣点在不同的时间的流行度以及兴趣点之间的相似性;
S6、综合考虑用户位置信息和签到行为的相似度构建整体相似度,并从当前用户已经签过到的兴趣点中选取兴趣点作为该用户的特征兴趣点;
S7、计算当前用户未签过到的兴趣点与该用户的特征兴趣点的整体相似度,并从当前用户未签过到的集合中选取前N个与当前用户的特征兴趣点整体相似度最高的兴趣点推荐给该用户。
在本实施例中,数据源的获取可以直接从现有的基于社交网络的研究型推荐系统的网站中下载或者利用成熟的社交平台的公共API获取。这里需要获取的是用户-兴趣点在不同时间用户对兴趣点的签到情况,和兴趣点的位置信息数据;在本实施例中,兴趣点为用户日常生活中访问的地点,例如博物馆、图书馆、旅游景区、娱乐场所等。
本实施例还考虑到兴趣点的隐含的模式,即兴趣点在不同时间点的签到次数,例如在KTV的签到时间一般会集中在晚上。
本实施例中从获取的在线社交数据中提取的用户相关属性,主要包括用户的ID号码,用作用户的唯一标识,在后面的处理中用于区分不同用户以及向用户推荐兴趣点时作为目标用户的标识。
从获取到的数据中提取用户信息,首先从用户-兴趣点数据对中获取所有用户信息,然后将获取到的所有用户信息进行去重和无效数据去除处理,最后以用户集合U={u1,u2,...,um},用户集合U中的一个元素表示一个用户的信息,用户集合中的元素无序且不可重复。
从获取到的数据中提取兴趣点信息,首先从用户-兴趣点数据对中获取所有兴趣点信息,然后将获取到的所有兴趣点信息进行去重和无效数据去除处理,最后以兴趣点集合L={l1,l2,...,ln},兴趣点集合U中的一个元素表示一个兴趣点的信息,兴趣点集合中的元素无序且不可重复。
从获取到的数据中提取兴趣点的位置信息,从兴趣点-经纬度数据对中获取所有兴趣点的位置信息,以lat_loni=(lati,loni)来表示每个兴趣点的位置信息,其中,0<i≤n,lati表示兴趣点li的经度;loni表示兴趣点li的纬度,此处n为兴趣点集合中兴趣点的数量。
从兴趣点-签到时间数据对中获取所有兴趣点的签到时间信息,然后将获取的数据进行去除无效数据处理且允许重复数据,最后以时间集合此处将一天的时间分为tn个时间点,在本实施例中将每一个整点时刻划分为24,若签到时间不为整时刻,则根据“四舍五入”的规则对签到时间进行处理。处理规则为:若分钟数大于零且小于30,则时钟数不变,舍去分钟数,如6:29表示为t6;若分钟数大于等于30且小于等于59,则时钟数加1,同时舍去分钟数,如13:57表示t14。
在本实施例中,当前用户未签过到的兴趣点与该用户的特征兴趣点的整体相似度表示为:
dis(li,lj)=R×arccos[sin(lati)×sin(latj)+cos(lati)×cos(latj)×cos(loni-lonj)]
其中,dis(li,lj)表示兴趣点li与兴趣点lj之间的距离;R为地球的半径。
进一步的,兴趣点li与兴趣点lj基于时间的相似度表示为:
本发明还提供一种基于位置和时间信息的兴趣点推荐装置,包括数据获取模块、数据预处理模块、基于位置信息的相似度计算模块、基于时间信息的相似度计算模块、综合相似度计算模块以及推荐模块,数据预处理模块包括数据清洗单元和数据处理单元,其中:
数据获取模块用户从社交网络公共API或直接下载现有数据源;
数据清洗单元用于删除获取的数据中重复的数据以及无效数据;
数据处理模块用于用户数据中用户签到次数小于5以及兴趣点被签到次数小于5的数据;
基于位置信息的相似度计算模块用于计算在位置信息上用户已经签过到的兴趣点与其他用户未签过到的兴趣点之间位置上的相似性;
基于时间信息的相似度计算模块用于计算在时间信息上用户已经签过到的兴趣点与其他用户未签过到的兴趣点之间时间上的相似性;
综合相似度计算模块用于引入权值综合考虑基于时间信息的相似度和基于位置信息的相似度,获得综合相似度;
推荐模块用户根据综合相似度进行降序排序,并将相似度最高N个推荐给用户。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (8)
1.一种基于位置和时间信息的兴趣点推荐方法,其特征在于,包括以下步骤:
S1、从社交网络平台获取用户数据,并对用户数据进行预处理;
S2、从用户数据中提取用户在各个时间点对兴趣点的签到行为以及该兴趣点的位置信息;
S3、基于提取签到行为和位置信息以及用户信息构建用户相关属性;
S4、利用位置信息构建用户可能访问但是未曾访问的兴趣点的概率函数;
S5、根据用户的签到行为计算获取每个兴趣点在不同的时间的流行度以及兴趣点之间的相似性;
S6、综合考虑用户位置信息和签到行为的相似度构建整体相似度,并从当前用户已经签过到的兴趣点中选取访问次数最多的K个兴趣点作为该用户的特征兴趣点;
S7、计算当前用户未签过到的兴趣点与该用户的特征兴趣点的整体相似度,并从当前用户未签过到的集合中选取前N个与当前用户的特征兴趣点整体相似度最高的兴趣点推荐给该用户。
2.根据权利要求1所述的一种基于位置和时间信息的兴趣点推荐方法,其特征在于,步骤S1包括:
S11通过社交网络公共API或直接下载现有数据源获得用户数据,用户数据包括用户在兴趣点的签到行为;
S12、删除用户数据中重复的数据并清理无效数据;
S13、删除用户数据中用户签到次数小于5以及兴趣点被签到次数小于5的数据。
7.根据权利要求1所述的一种基于位置和时间信息的兴趣点推荐方法,其特征在于,时间点的划分包括选取n个时间点,将一天的时间划分为n段,若用户在一个兴趣点的签到时间在两个时间点之间,则将距离较近的一个时间点作为该兴趣点的签到时间点。
8.一种基于位置和时间信息的兴趣点推荐装置,其特征在于,包括数据获取模块、数据预处理模块、基于位置信息的相似度计算模块、基于时间信息的相似度计算模块、综合相似度计算模块以及推荐模块,数据预处理模块包括数据清洗单元和数据处理单元,其中:
数据获取模块用户从社交网络公共API或直接下载现有数据源;
数据清洗单元用于删除获取的数据中重复的数据以及无效数据;
数据处理模块用于用户数据中用户签到次数小于5以及兴趣点被签到次数小于5的数据;
基于位置信息的相似度计算模块用于计算在位置信息上用户已经签过到的兴趣点与其他用户未签过到的兴趣点之间位置上的相似性;
基于时间信息的相似度计算模块用于计算在时间信息上用户已经签过到的兴趣点与其他用户未签过到的兴趣点之间时间上的相似性;
综合相似度计算模块用于引入权值综合考虑基于时间信息的相似度和基于位置信息的相似度,获得综合相似度;
推荐模块用户根据综合相似度进行降序排序,并将相似度最高N个推荐给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911120301.7A CN110851742A (zh) | 2019-11-15 | 2019-11-15 | 一种基于位置和时间信息的兴趣点推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911120301.7A CN110851742A (zh) | 2019-11-15 | 2019-11-15 | 一种基于位置和时间信息的兴趣点推荐方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110851742A true CN110851742A (zh) | 2020-02-28 |
Family
ID=69601360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911120301.7A Pending CN110851742A (zh) | 2019-11-15 | 2019-11-15 | 一种基于位置和时间信息的兴趣点推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110851742A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182411A (zh) * | 2020-11-09 | 2021-01-05 | 广州酷狗计算机科技有限公司 | 多媒体数据推荐方法、装置、计算机设备及可读存储介质 |
CN112801749A (zh) * | 2021-02-04 | 2021-05-14 | 重庆邮电大学 | 融合用户连续签到行为序列上下文特征的兴趣点推荐方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718581A (zh) * | 2016-01-25 | 2016-06-29 | 杭州电子科技大学 | 引入空间衰减函数的兴趣点推荐算法 |
CN110008405A (zh) * | 2019-03-25 | 2019-07-12 | 华南理工大学 | 一种基于时效性的个性化消息推送方法及系统 |
CN110110244A (zh) * | 2019-04-26 | 2019-08-09 | 广东技术师范大学 | 一种融合多源信息的兴趣点推荐方法 |
-
2019
- 2019-11-15 CN CN201911120301.7A patent/CN110851742A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718581A (zh) * | 2016-01-25 | 2016-06-29 | 杭州电子科技大学 | 引入空间衰减函数的兴趣点推荐算法 |
CN110008405A (zh) * | 2019-03-25 | 2019-07-12 | 华南理工大学 | 一种基于时效性的个性化消息推送方法及系统 |
CN110110244A (zh) * | 2019-04-26 | 2019-08-09 | 广东技术师范大学 | 一种融合多源信息的兴趣点推荐方法 |
Non-Patent Citations (3)
Title |
---|
JUN ZENG 等: "A point-of-Interest Recommendation Method Using Location Similarity", 《2017 6TH IIAI INTERNATIONAL CONGRESS ON ADVANCED APPLIED INFORMATICS》, 16 November 2017 (2017-11-16), pages 436 - 440 * |
吴燕 等: "混合时空和流行度特征的兴趣点推荐算法", 《计算机工程》, vol. 44, no. 9, 15 September 2018 (2018-09-15), pages 59 - 63 * |
陈炯 等: "融合多因素的兴趣点协同推荐方法研究", 《计算机科学》, vol. 46, no. 10, 28 August 2019 (2019-08-28), pages 77 - 83 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182411A (zh) * | 2020-11-09 | 2021-01-05 | 广州酷狗计算机科技有限公司 | 多媒体数据推荐方法、装置、计算机设备及可读存储介质 |
CN112801749A (zh) * | 2021-02-04 | 2021-05-14 | 重庆邮电大学 | 融合用户连续签到行为序列上下文特征的兴趣点推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3779841B1 (en) | Method, apparatus and system for sending information, and computer-readable storage medium | |
Li et al. | A time-aware personalized point-of-interest recommendation via high-order tensor factorization | |
CN108875007B (zh) | 兴趣点的确定方法和装置、存储介质、电子装置 | |
CN105532030B (zh) | 用于分析目标实体的移动的装置、系统和方法 | |
Xiao et al. | Inferring social ties between users with human location history | |
CN107291888B (zh) | 基于机器学习统计模型的入住酒店附近生活推荐系统方法 | |
US8275649B2 (en) | Mining life pattern based on location history | |
WO2018076695A1 (zh) | 一种智能推荐系统及智能推荐方法 | |
CN107341261B (zh) | 一种面向位置社交网络的兴趣点推荐方法 | |
US20110208425A1 (en) | Mining Correlation Between Locations Using Location History | |
CN110334293B (zh) | 面向位置社交网络的基于模糊聚类的具有时间感知的位置推荐方法 | |
Marakkalage et al. | Understanding the lifestyle of older population: Mobile crowdsensing approach | |
WO2016042357A1 (en) | Predicting human movement behaviors using location services model | |
CN106767835B (zh) | 定位方法和装置 | |
CN101542516A (zh) | 基于位置的、内容定向的信息 | |
CN102067631A (zh) | 用于确定并显示个性化距离的系统与方法 | |
CN110008414B (zh) | 地理信息点的确定方法和装置 | |
CN115774819B (zh) | 一种基于层次循环神经网络的兴趣点推荐方法及系统 | |
Dokuz et al. | Discovering socially important locations of social media users | |
JP2020537252A (ja) | 類似のモバイル装置を予測するためのシステムと方法 | |
CN110851742A (zh) | 一种基于位置和时间信息的兴趣点推荐方法及装置 | |
Hasnat et al. | Destination choice modeling using location-based social media data | |
Andrade et al. | Identifying points of interest and similar individuals from raw GPS data | |
CN110263250A (zh) | 一种推荐模型的生成方法及装置 | |
Tiwari et al. | Mining popular places in a geo-spatial region based on GPS data using semantic information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200228 |