CN114065024A - 基于用户个性化生活模式的poi推荐方法 - Google Patents
基于用户个性化生活模式的poi推荐方法 Download PDFInfo
- Publication number
- CN114065024A CN114065024A CN202111303987.0A CN202111303987A CN114065024A CN 114065024 A CN114065024 A CN 114065024A CN 202111303987 A CN202111303987 A CN 202111303987A CN 114065024 A CN114065024 A CN 114065024A
- Authority
- CN
- China
- Prior art keywords
- user
- poi
- check
- sequence
- preference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000001914 filtration Methods 0.000 claims abstract description 20
- 238000007781 pre-processing Methods 0.000 claims abstract description 3
- 238000004364 calculation method Methods 0.000 claims description 54
- 239000013598 vector Substances 0.000 claims description 27
- 239000000126 substance Substances 0.000 claims description 24
- 230000006399 behavior Effects 0.000 claims description 22
- 238000012546 transfer Methods 0.000 claims description 19
- 238000003062 neural network model Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 230000007774 longterm Effects 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000011176 pooling Methods 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 238000005065 mining Methods 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 abstract 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3679—Retrieval, searching and output of POI information, e.g. hotels, restaurants, shops, filling stations, parking facilities
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Molecular Biology (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Navigation (AREA)
Abstract
一种基于用户个性化生活模式的POI推荐方法,包括:首先对用户签到数据进行预处理,通过挖掘分析用户签到数据建模用户个性化生活模式,根据用户个性化生活模式对全部POI进行过滤,并加入符合用户个性化生活模式的但用户未曾访问过的POI得到POI候选集,然后根据用户个性化生活模式对POI候选集进行重新排序,最终得到用户最感兴趣的Top‑k个POI。本发明根据用户个性化生活模式对POI集合进行过滤,有利于缓解LBSNs中数据稀疏性的问题。本发明充分挖掘用户签到序列中的用户个性化生活模式,能够提高POI推荐的准确性,同时利用用户个性化偏好模式中用户对POI类型的偏好和用户个性化行为模式进行推荐,能帮助用户发现新的POI,有利于提高POI推荐的多样性。
Description
技术领域
本发明涉及推荐系统中的POI推荐方法,POI推荐不仅可以向用户推荐下一次最有可能去的Top-k个POI,方便用户生活,还可以用于向广告商提供广告投放建议,为企业带来潜在的商业价值,同时还可以向城市交通规划提供建议等。
背景技术
随着信息技术和智能设备的快速发展,基于位置的社交网络(Location-basedSocial Networking Services,LBSNs)如Foursquare,Facebook,Gowalla,Yelp等越来越受人们的欢迎。在LBSNs上,用户可以登录打卡他们的位置并分享与他们的位置相关的内容,由于LBSNs用户数量的迅速增加,近年来从这些平台收集的用户签到数据量迅速增加,由此催生了一个新的推荐系统子领域,即兴趣点推荐(Point-of-interest Recommendation)。POI推荐是LBSNs的重要应用,一方面,可以给用户推荐可能感兴趣的兴趣点,帮助用户解决其“选择困难症”,另一方面,帮助企业寻找目标客户,给企业带来了潜在的商业价值,同时还可以向城市交通规划提供建议等。
近年来已经有非常多的POI推荐算法来根据用户偏好推荐POI,包括传统的机器学习方法和深度学习方法。这些方法大多根据用户历史签到数据学习用户偏好,结合地理影响、社会影响等来进一步完善模型,提高推荐性能。由于基于协同过滤的方法在其他领域的推荐系统中取得了成功,基于协同过滤的方法也被用于POI推荐,但是这些方法只能模拟用户的静态偏好。在实际场景中,POI本身的受欢迎程度会随着时间的变化而变化,同时用户会在特定的时间采取特定的行动,比如午餐时间去餐馆,晚上休息时间去酒吧。另一方面,用户签到行为之间存在相互影响,导致特定的POI签到顺序,如很多用户会选择晚饭后去公园,但是在公园散步后,有的用户会去商场购物,有的用户会去健身房,这也反映了不同用户的个性化偏好,所以需要更多地关注于对用户的动态偏好建模。除此之外,还有一些方法利用用户的社交关系进行POI推荐,如果两个用户是朋友关系,则这两个用户往往会有相似的POI偏好,可以向用户的朋友推荐该用户感兴趣的POI,但是这种方法受限于用户之间的信任程度,有的朋友之间也可能不会有相似的POI偏好。
目前,现有的POI推荐方法存在以下主要问题:1)现有的方法受到数据稀疏性问题的影响,与整个城市的POI数量相比,用户所去过的POI数量非常少,POI推荐的准确率不高。2)大多数现有的POI推荐方法没有充分挖掘用户签到数据,因此用户行为的规律性难以发现和利用。3)许多方法仅能推荐用户曾经去过的POI,而无法推荐符合用户个性化生活模式但用户没有去过的POI,即无法帮助用户发现新的POI。
发明内容
本发明要克服上述POI推荐方法的不足之处,提出一种基于用户个性化生活模式的POI推荐方法。
用户个性化生活模式,包括用户个性化偏好模式和用户个性化行为模式,其中用户个性化偏好模式包括用户对POI类型的偏好和用户对POI的偏好,用户对POI的偏好又包括用户对POI的长期和短期偏好以及用户签到子序列对POI偏好的影响,用户个性化行为模式指不同时间段中用户的最大转移距离。本发明对用户签到数据进行多角度挖掘分析,根据用户历史签到数据中用户对POI类型的偏好和用户下一次访问POI时间段内的个性化行为模式对POI进行过滤,得到POI候选集。建模用户对于POI长期和短期的偏好,以及用户签到子序列对用户当前POI偏好的影响,根据用户下一个访问时间,结合用户个性化偏好模式和用户个性化行为模式对POI候选集进行重新排序,最终向用户推荐Top-k个POI。本发明充分考虑了用户签到数据集的特征,通过对原始POI集合进行过滤得到POI候选集,缓解了POI推荐中的数据稀疏性问题。同时,根据用户对于POI类型偏好及用户在下一次访问POI时间段内的用户个性化生活模式,向用户推荐POI,所推荐的POI中即包括用户访问过的POI又包括符合用户偏好和用户个性化生活模式但用户未访问过的POI,提高了POI推荐的多样性。
本发明是通过以下技术方案达到上述目的:即基于用户个性化生活模式的POI推荐方法,具体的实施步骤如下:
(1)对原始数据进行预处理。对用户签到数据进行清洗,以及用户签到数据的规范化处理。
(2)对步骤(1)中所述数据进行时间划分。将用户签到数据按时间进行排序,然后按天进行划分得到用户历史签到子序列和最近签到子序列。
(3)对步骤(2)中所述数据进行用户个性化生活模式建模。首先提取用户和用户签到序列中POI类型之间的潜在信息,计算公式如下:
利用长短期记忆神经网络模型建模用户关于POI类型的偏好,计算公式如下所示:
提取用户和用户历史签到序列中POI的潜在信息,计算公式如下:
利用长短期记忆神经网络模型建模用户历史签到序列中的POI偏好,计算公式如下:
其中,为用户和用户历史签到序列中POI的潜在信息,和分别代表单个长短期记忆神经网络模型单元的输出结果和单元状态,表示用户历史签到序列中对于POI的偏好,即用户的长期偏好,同时所有用户历史签到子序列中的转化为|Sh|为单个历史签到子序列的长度。
提取用户和用户最近签到序列中POI的潜在信息,计算公式如下:
利用长短期记忆神经网络模型建模用户最近签到序列中的POI偏好,计算公式如下:
其中,为用户和用户最近签到序列中POI的潜在信息,和分别代表单个长短期记忆神经网络模型单元的输出结果和单元状态,表示用户最近签到序列中对于POI的偏好,即用户的短期偏好,同时所有用户最近签到序列中的转化为|Sn|为用户最近签到序列的长度。
将一周时间划分为48个时间段,其中包括工作日24个时间段,周末24个时间段,将所有用户签到序列中的具体时间对应到这48个时间段。
可以计算不同时间段POI集合的相似度,计算公式如下:
其中,Hi和Hj分别表示时间段i和时间段j中的POI集合,τi,j表示时间段i和时间段j中POI集合的相似度。
计算带有时间权重信息的用户历史签到子序列表示sh,计算公式如下:
其中,表示当前时间段c与用户历史签到子序列Sh中第j个时间段的相似度,Vt e,2为用户历史签到子序列Sh中第t个POI的LSTM单元状态,则n-1段用户历史签到序列Sh∈{S1,S2,...,Sn-1}可以表示为{s1,s2,...,sn-1},用户最近签到用平均池化来得到,计算公式如下:
计算每一段历史签到子序列sh∈{s1,s2,...,sn-1}对于最近签到序列sn的影响,计算公式如下:
其中,C(S)为归一化因子,函数g(sh)=Whsh用于生成sh的表示,Wh为可训练的权重矩阵,函数计算最近签到序列Sn与历史签到序列Sh的相关度,则为序列级别的用户偏好,即用户历史签到子序列对用户当前偏好的影响。
对每个用户历史签到子序列,计算用户相邻两次签到的转移距离,计算公式如下:
对每个时间段的用户个性化行为模式建模,计算每个时间段内,所有用户签到子序列的最大转移距离,计算公式如下:
Dt=max(Di) (13)
其中,Dt表示第t个时间段内用户历史签到子序列中用户的最大转移距离。
(4)根据步骤(3)中所获用户个性化偏好模式和用户个性化行为模式,对POI集合进行过滤,得到POI候选集。
计算用户最喜欢的Top-k个POI类型,计算公式如下:
Yi s=σ(Ws·Input+bs);i=1,2,...,P (15)
根据用户最喜欢的Top-k个类型对每个用户的POI候选集进行过滤,计算公式如下:
根据用户下一次访问POI时间,结合用户在该时间段内的用户个性化行为模式,从POI候选集中过滤出与用户上一次签到位置的距离在该时间段用户最大转移距离内的POI,并加入该范围内属于用户偏好Top-k个类型的但用户未去过的POI,得到最终的POI候选集,计算公式如下:
(5)对POI候选集重新排序,得到用户最喜欢的Top-k个POI。计算POI候选集中与用户上一个访问位置的距离,计算公式如下:
计算用户对于POI候选集中POI类型之间的偏好,用户历史签到序列和用户最近签到序列中用户对于POI候选集中POI的偏好,计算公式如下:
其中,Uu表示用户的嵌入向量,Cc表示POI候选集中POI类型的嵌入向量,Vv表示POI候选集中POI的嵌入向量。
计算用户历史签到子序列对于POI候选集中POI的偏好影响,计算公式如下:
其中,其中Wp∈R|L|×2d表示POI候选集中POI的投影矩阵,|L|表示POI候选集中POI的个数。
对上述指标分别进行归一化处理,对POI候选集中的POI进行重新排序得到最终用户最有可能访问的Top-K个POI,计算公式如下:
其中,fD,fv,fs分别表示归一化函数,WD,Wv,Ws分别表示距离,用户偏好和历史签到序列对POI偏好影响的权重矩阵。
进一步,步骤(1)所述的对用户签到数据进行清洗,包括清除缺失值、噪声数据、删除签到记录过少的数据。
本发明的优点是:根据用户个性化生活模式对POI集合进行过滤,有利于缓解LBSNs中数据稀疏性的问题。本发明充分挖掘用户签到序列中的用户个性化生活模式,能够提高POI推荐的准确性;同时利用用户个性化偏好模式中用户对POI类型的偏好和用户个性化行为模式进行推荐,能帮助用户发现新的POI,有利于提高POI推荐的多样性。
附图说明
图1是本发明方法的总体流程图。
图2是用户个性化生活模式说明图。
图3是用户个性化签到序列例图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将对本发明的具体实施方式作进一步的详细描述。
本发明实施例提供了一种基于用户个性化生活模式的POI推荐方法,总体流程如图1所示,该方法包括:
(1)对原始用户签到数据进行预处理。对用户签到数据进行清洗,如清除缺失值、噪声数据、删除签到记录过少的数据等,以及用户签到数据的规范化处理。
(2)对步骤(1)中所述数据进行时间划分。将用户签到数据按时间进行排序,然后按天进行划分得到用户历史签到子序列和最近签到子序列。
(3)对步骤(2)中所述数据进行用户个性化生活模式建模。如图二所示,用户个性化生活模式包括用户个性化偏好模式和用户个性化行为模式。其中用户个性化偏好模式包括用户对于POI的偏好以及用户对于POI类型的偏好,用户对于POI的偏好又包括用户对POI短期偏好、用户对POI长期偏好和用户签到子序列对POI偏好的影响。
首先提取用户和用户签到序列中POI类型之间的潜在信息,计算公式如下:
利用长短期记忆神经网络模型建模用户关于POI类型的偏好,计算公式如下所示:
提取用户和用户历史签到序列中POI的潜在信息,计算公式如下:
利用长短期记忆神经网络模型建模用户历史签到序列中的POI偏好,计算公式如下:
其中,为用户和用户历史签到序列中POI的潜在信息,和分别代表单个长短期记忆神经网络模型单元的输出结果和单元状态,表示用户历史签到序列中对于POI的偏好,即用户的长期偏好,同时所有用户历史签到子序列中的转化为|Sh|为单个历史签到子序列的长度。
提取用户和用户最近签到序列中POI的潜在信息,计算公式如下:
利用长短期记忆神经网络模型建模用户最近签到序列中的POI偏好,计算公式如下:
其中,为用户和用户最近签到序列中POI的潜在信息,和分别代表单个长短期记忆神经网络模型单元的输出结果和单元状态,表示用户最近签到序列中对于POI的偏好,即用户的短期偏好,同时所有用户最近签到序列中的转化为|Sn|为用户最近签到序列的长度。
将一周时间划分为48个时间段,其中包括工作日24个时间段,周末24个时间段,将用户签到序列中的具体时间对应到这48个时间段。
可以计算不同时间段POI集合的相似度,计算公式如下:
其中,Hi和Hj分别表示时间段i和时间段j中的POI集合,τi,j表示时间段i和时间段j中POI集合的相似度。
计算带有时间权重信息的用户历史签到子序列表示sh,计算公式如下:
其中,表示当前时间段c与用户历史签到子序列Sh中第j个时间段的相似度,Vt e,2为用户历史签到子序列Sh中第t个POI的LSTM单元状态,则n-1段用户历史签到序列Sh∈{S1,S2,...,Sn-1}可以表示为{s1,s2,...,sn-1},用户最近签到用平均池化来得到,计算公式如下:
计算每一段历史签到子序列sh∈{s1,s2,...,sn-1}对于最近签到序列sn的影响,计算公式如下:
其中,C(S)为归一化因子,函数g(sh)=Whsh用于生成sh的表示,Wh为可训练的权重矩阵,函数计算最近签到序列Sn与历史签到序列Sh的相关度,则为序列级别的用户偏好,即用户历史签到子序列对用户当前偏好的影响。
对每个用户历史签到子序列,计算用户相邻两次签到的转移距离,计算公式如下:
对每个时间段的用户个性化行为模式建模,计算每个时间段内,所有用户签到子序列的最大转移距离,计算公式如下:
Dt=max(Di) (13)
其中,Dt表示第t个时间段内用户历史签到子序列中用户的最大转移距离。
具体案例中,1082号用户在5月17日共有15条签到记录。其中在10点到11点中分别在40.63063339,-73.97712596,40.64510634,-73.9791548,40.68444569,-73.97785664有三条签到记录,在5月21日10点到11点分别在40.63072779,-73.97716999和40.64510634,-73.9791548,40.67838332,-73.94846453有三条签到记录。根据上述公式则该用户在5月17日中10点到11点转移距离分别约为1618米和4375米,该用户在5月21日中10点到11点转移距离分别约为1607米和4515米,则该用户在5月17日和5月21日10点到11点这个时间段中最大转移距离为4515米。
(4)根据步骤(3)中所获用户偏好和用户个性化生活模式,对POI集合进行过滤,得到POI候选集。
计算用户最喜欢的Top-k个POI类型,计算公式如下:
Yi s=σ(Ws·Input+bs);i=1,2,...,P (15)
根据用户最喜欢的Top-k个类型对每个用户的POI候选集进行过滤,计算公式如下:
根据用户下一次访问POI时间,结合用户在该时间段内的用户个性化行为模式,从POI候选集中过滤出与用户上一次签到位置的距离在该时间段用户最大转移距离内的POI,并加入该范围内属于用户偏好Top-k个类型的但用户未去过的POI,得到最终的POI候选集,计算公式如下:
具体案例中,在过滤出与用户上一次签到位置的距离在该时间段用户最大转移距离内的POI后,在城市POI数据集中,找出在与用户上一次签到位置的距离在该时间段用户最大转移距离内的并且属于用户最喜欢的Top-k个类型的POI,加入POI候选集,得到最终的POI候选集。
(5)对POI候选集重新排序,得到用户最喜欢的Top-k个POI。计算POI候选集中与用户上一个访问位置的距离,计算公式如下:
具体案例中,1082号用户上一次访问位置的经度为-73.80885946,纬度为40.69967673,POI候选集中的一个POI的经度为-73.80793463,纬度为40.70114391,则该POI与用户上一个访问位置的距离利用上述公式可计算得到约为180米。
计算用户对于POI候选集中POI类型之间的偏好,用户历史签到序列和用户最近签到序列中用户对于POI候选集中POI的偏好,计算公式如下:
其中,Uu表示用户的嵌入向量,Cc表示POI候选集中POI类型的嵌入向量,Vv表示POI候选集中POI的嵌入向量。
计算用户历史签到子序列对于POI候选集中POI的偏好影响,计算公式如下:
其中,其中Wp∈R|L|×2d表示POI候选集中POI的投影矩阵,|L|表示POI候选集中POI的个数。
对上述指标分别进行归一化处理,对POI候选集中的POI进行重新排序得到最终用户最有可能访问的Top-K个POI,计算公式如下:
其中,fD,fv,fs分别表示归一化函数,WD,Wv,Ws分别表示距离,用户偏好和历史签到序列对POI偏好影响的权重矩阵。
如附图1,本发明方法首先根据用户签到数据,对用户签到数据进行预处理后,建模用户个性化生活模式。根据用户个性化生活模式,对POI集合进行过滤,得到POI候选集,对POI候选集进行重新排序,最终得到用户最喜欢的Top-k个POI。
如附图2,用户个性化生活模式,包括用户个性化偏好模式和用户个性化行为模式,其中用户个性化偏好模式包括用户对POI类型的偏好和用户对POI的偏好,用户对POI的偏好又包括用户对POI的长期和短期偏好以及用户签到子序列对POI偏好的影响,用户个性化行为模式指不同时间段中用户的最大转移距离。
如附图3,用户序列模式举例。用户行为的序列模式通常有两种含义。一方面,用户会在特定的时间采取特定的行动,比如晚餐时间去餐馆,休闲时间去电影院等。另一方面。用户行为之间存在一定的时间顺序,所以会出现特定的POI访问序列,这也反映了不同用户的个性化偏好。比如,图中三位用户都会在下班后吃晚餐,但是三位用户去不同的餐馆吃不同类型晚餐,反应了用户的个性化偏好。用户一在吃完晚餐后选择去电影院看电影然后再回家;用户二在吃完晚餐后选择去商场购物然后再回家;用户三在吃完晚餐后选择去球场做运动再回家。这三种不同的访问序列也反应了用户的个性化偏好。
实施应用案例表明,本发明所提出的基于用户个性化生活模式的POI推荐方法是有效的,相对于其他设计方法,本发明方法将用户签到的绝对时间变换为时间段,并对POI集合进行两次过滤,缓解了POI推荐中的数据稀疏性问题,从多个角度挖掘用户个性化偏好模式,同时结合用户在下一次访问时间段内的用户个性化行为模式,向用户推荐POI,其中包含用户访问过的POI以及符合用户个性化偏好模式和用户个性化行为模式的用户未访问过的POI,即能够帮助用户发现新的POI,设计方案不仅能提高POI推荐的准确性,同时还能提高POI推荐的多样性。
以上的所述乃是本发明的具体实施应用案例及所运用的技术原理,本发明的保护范围不应当被视为仅限于实施应用案例所陈述的具体形式,若依本发明的构想所作的改变,其所产生的功能作用仍未超出说明书及附图所涵盖的精神时,仍应属本发明的保护范围。
Claims (2)
1.一种基于用户个性化生活模式的POI推荐方法,其特征在于,包括以下步骤:
(1)对原始数据进行预处理;对用户签到数据进行清洗,以及用户签到数据的规范化处理;
(2)对步骤(1)中所述数据进行时间划分;将用户签到数据按时间进行排序,然后按天进行划分得到用户历史签到子序列和最近签到子序列;
(3)对步骤(2)中所述数据进行用户个性化生活模式建模;首先提取用户和用户签到序列中POI类型之间的潜在信息,计算公式如下:
利用长短期记忆神经网络模型建模用户关于POI类型的偏好,计算公式如下所示:
提取用户和用户历史签到序列中POI的潜在信息,计算公式如下:
利用长短期记忆神经网络模型建模用户历史签到序列中的POI偏好,计算公式如下:
其中,为用户和用户历史签到序列中POI的潜在信息,和分别代表单个长短期记忆神经网络模型单元的输出结果和单元状态,表示用户历史签到序列中对于POI的偏好,即用户的长期偏好,同时所有用户历史签到子序列中的转化为|Sh|为单个历史签到子序列的长度;
提取用户和用户最近签到序列中POI的潜在信息,计算公式如下:
利用长短期记忆神经网络模型建模用户最近签到序列中的POI偏好,计算公式如下:
其中,为用户和用户最近签到序列中POI的潜在信息,和分别代表单个长短期记忆神经网络模型单元的输出结果和单元状态,表示用户最近签到序列中对于POI的偏好,即用户的短期偏好,同时所有用户最近签到序列中的转化为|Sn|为用户最近签到序列的长度;
将一周时间划分为48个时间段,其中包括工作日24个时间段,周末24个时间段,将所有用户签到序列中的具体时间对应到这48个时间段;
可以计算不同时间段POI集合的相似度,计算公式如下:
其中,Hi和Hj分别表示时间段i和时间段j中的POI集合,τi,j表示时间段i和时间段j中POI集合的相似度;
计算带有时间权重信息的用户历史签到子序列表示sh,计算公式如下:
其中,表示当前时间段c与用户历史签到子序列Sh中第j个时间段的相似度,为用户历史签到子序列Sh中第t个POI的LSTM单元状态,则n-1段用户历史签到序列Sh∈{S1,S2,...,Sn-1}可以表示为{s1,s2,...,sn-1},用户最近签到用平均池化来得到,计算公式如下:
计算每一段历史签到子序列sh∈{s1,s2,...,sn-1}对于最近签到序列sn的影响,计算公式如下:
其中,C(S)为归一化因子,函数g(sh)=Whsh用于生成sh的表示,Wh为可训练的权重矩阵,函数计算最近签到序列sn与历史签到序列sh的相关度,则为序列级别的用户偏好,即用户历史签到子序列对用户当前偏好的影响;
对每个用户历史签到子序列,计算用户相邻两次签到的转移距离,计算公式如下:
对每个时间段的用户个性化行为模式建模,计算每个时间段内,所有用户签到子序列的最大转移距离,计算公式如下:
Dt=max(Di) (12)
其中,Dt表示第t个时间段内用户历史签到子序列中用户的最大转移距离;
(4)根据步骤(3)中所获用户个性化偏好模式和用户个性化行为模式,对POI集合进行过滤,得到POI候选集;
计算用户最喜欢的Top-k个POI类型,计算公式如下:
Yi s=σ(Ws·Input+bs);i=1,2,...,P (14)
根据用户最喜欢的Top-k个类型对每个用户的POI候选集进行过滤,计算公式如下:
根据用户下一次访问POI时间,结合用户在该时间段内的用户个性化行为模式,从POI候选集中过滤出与用户上一次签到位置的距离在该时间段用户最大转移距离内的POI,并加入该范围内属于用户偏好Top-k个类型的但用户未去过的POI,得到最终的POI候选集,计算公式如下:
(5)对POI候选集重新排序,得到用户最喜欢的Top-k个POI;计算POI候选集中与用户上一个访问位置的距离,计算公式如下:
计算用户对于POI候选集中POI类型之间的偏好,用户历史签到序列和用户最近签到序列中用户对于POI候选集中POI的偏好,计算公式如下:
其中,Uu表示用户的嵌入向量,Cc表示POI候选集中POI类型的嵌入向量,Vv表示POI候选集中POI的嵌入向量;
计算用户历史签到子序列对于POI候选集中POI的偏好影响,计算公式如下:
其中,其中Wp∈R|L|×2d表示POI候选集中POI的投影矩阵,|L|表示POI候选集中POI的个数;
对上述指标分别进行归一化处理,对POI候选集中的POI进行重新排序得到最终用户最有可能访问的Top-K个POI,计算公式如下:
其中,fD,fv,fs分别表示归一化函数,WD,Wv,Ws分别表示距离,用户偏好和历史签到序列对POI偏好影响的权重矩阵。
2.如权利要求1所述的一种基于用户个性化生活模式的POI推荐方法,其特征在于:步骤(1)所述的对用户签到数据进行清洗,包括清除缺失值、噪声数据、删除签到记录过少的数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111303987.0A CN114065024A (zh) | 2021-11-05 | 2021-11-05 | 基于用户个性化生活模式的poi推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111303987.0A CN114065024A (zh) | 2021-11-05 | 2021-11-05 | 基于用户个性化生活模式的poi推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114065024A true CN114065024A (zh) | 2022-02-18 |
Family
ID=80274307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111303987.0A Pending CN114065024A (zh) | 2021-11-05 | 2021-11-05 | 基于用户个性化生活模式的poi推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114065024A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117591751A (zh) * | 2024-01-19 | 2024-02-23 | 国网湖北省电力有限公司信息通信公司 | 基于图嵌入的上下文忠诚度融合的兴趣点推荐方法及系统 |
-
2021
- 2021-11-05 CN CN202111303987.0A patent/CN114065024A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117591751A (zh) * | 2024-01-19 | 2024-02-23 | 国网湖北省电力有限公司信息通信公司 | 基于图嵌入的上下文忠诚度融合的兴趣点推荐方法及系统 |
CN117591751B (zh) * | 2024-01-19 | 2024-04-26 | 国网湖北省电力有限公司信息通信公司 | 基于图嵌入的上下文忠诚度融合的兴趣点推荐方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zheng et al. | Learning travel recommendations from user-generated GPS traces | |
Xiao et al. | Inferring social ties between users with human location history | |
Zheng et al. | Recommending friends and locations based on individual location history | |
Kurashima et al. | Geo topic model: joint modeling of user's activity area and interests for location recommendation | |
CN105532030B (zh) | 用于分析目标实体的移动的装置、系统和方法 | |
Wang et al. | Improving personalized trip recommendation by avoiding crowds | |
CN106960044B (zh) | 一种基于张量分解及加权hits的时间感知个性化poi推荐方法 | |
US20100211308A1 (en) | Identifying interesting locations | |
US11490220B2 (en) | System and method for accurately and efficiently generating ambient point-of-interest recommendations | |
CN108829761B (zh) | 一种兴趣点推荐方法、系统、介质及设备 | |
CN113139140B (zh) | 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法 | |
CN107633100A (zh) | 一种基于嵌入模型的兴趣点推荐方法及装置 | |
CN105894089A (zh) | 一种征信模型的建立方法、征信确定方法及对应装置 | |
EP2646973A2 (en) | Real-time personalized recommendation of location-related entities | |
Liu et al. | Mix geographical information into local collaborative ranking for POI recommendation | |
CN115408618B (zh) | 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法 | |
Wen et al. | KSTR: Keyword-aware skyline travel route recommendation | |
Duan et al. | Personalized tourism route recommendation based on user’s active interests | |
Sarkar et al. | gTour: Multiple itinerary recommendation engine for group of tourists | |
CN110874437A (zh) | 一种基于多重兴趣点对排序的个性化兴趣点推荐方法 | |
CN113158038A (zh) | 基于sta-tcn神经网络框架的兴趣点推荐方法及系统 | |
CN111538916B (zh) | 一种基于神经网络和地理影响的兴趣点推荐方法 | |
CN115422441A (zh) | 一种基于社交时空信息与用户偏好的连续兴趣点推荐方法 | |
Noorian et al. | A novel Sequence-Aware personalized recommendation system based on multidimensional information | |
Liu et al. | Dynamic metric embedding model for point-of-interest prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |