CN112784177A - 一种空间距离自适应的下一个兴趣点推荐方法 - Google Patents
一种空间距离自适应的下一个兴趣点推荐方法 Download PDFInfo
- Publication number
- CN112784177A CN112784177A CN202110062234.9A CN202110062234A CN112784177A CN 112784177 A CN112784177 A CN 112784177A CN 202110062234 A CN202110062234 A CN 202110062234A CN 112784177 A CN112784177 A CN 112784177A
- Authority
- CN
- China
- Prior art keywords
- user
- interest point
- check
- interest
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Artificial Intelligence (AREA)
- Mathematical Analysis (AREA)
- Computing Systems (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Evolutionary Computation (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种空间距离自适应的下一个兴趣点推荐方法。该方法结合马尔科夫链并且能够自适应用户个人偏好进行兴趣点推荐。使用马尔科夫链捕获用户签到序列的时序关系,并且为每个用户生成个性化的转移矩阵用于捕获用户个人偏好。引入张量分解模型解决数据集签到数据稀疏的问题,使每个转移矩阵都受到相似用户、相似兴趣点、用户潜在偏好的影响,生成更完善和高质量的用户转移矩阵,通过这个转移矩阵捕获完善的用户个人偏好和兴趣点之间的转移关系。通过用户签到序列学习用户的个性化潜在行为模式,从而捕获到有效的用户潜在个人偏好。通过融合空间距离的方法对用户长期潜在个人偏信息作出取舍,根据兴趣点间的距离自适应用户个人偏好。
Description
技术领域
本发明属于推荐系统领域,具体涉及一种根据空间距离自适应用户兴趣和兴趣点转移关系的下一个兴趣点推荐方法。
背景技术
近年来,随着网络技术的不断发展,人们在网上能够获取到的信息日益增加,从海量的数据中精确推荐用户所感兴趣的信息成了一个巨大的挑战。针对信息过载的问题,研究学者们提出了各式各样的推荐系统用于音乐、电影、广告、商品等领域。例如,在网易云音乐中会通过用户经常听的音乐推荐相似的音乐,在京东和淘宝上则会通过用户历史购买的商品以及用户曾经搜索过或者点击过的商品进行推荐商品。
兴趣点推荐和上面提到电商、音乐、广告有所不同。兴趣点推荐的用户签到数据非常稀疏,一个用户通常只会访问兴趣点集合的很小一部分。除此之外,用户访问兴趣点会受到空间和时间上的限制,相比其他领域,兴趣点推荐中的上下文信息会更加重要。例如用户在工作日早上会前往工作地点,中午的时候会选择距离工作地点比较近的餐厅用餐;而在周末的时候,他们会选择娱乐场所或者旅游景点进行签到。
目前推荐系统中常用的协同过滤可以通过签到数据预测用户对兴趣点的偏好,其中有一些是通过计算用户-用户、兴趣点-兴趣点之间的相似度来进行推荐,但是由于存在数据稀疏的问题而使得推荐精度较低。有一些则选择通过用户历史访问的兴趣点建立模型,从而推荐用户最可能访问的K个兴趣点,但其往往忽略了用户签到之间的连续关系,而这在兴趣点推荐上非常重要,因为用户的运动通常是连续,有效兴趣点推荐系统应该结合用户的签到序列、用户个人偏好以及空间上的距离。
发明内容
针对现有技术的不足,本发明提出了一种空间距离自适应的下一个兴趣点推荐方法,结合用户签到序列、上下文信息和兴趣点之间的空间关系,采用马尔科夫链和矩阵分解方法解决签到兴趣点签到数据稀疏的问题,最后通过贝叶斯排序的方式对用户的预测结果进行排序,向用户推荐下一个兴趣点。
一种空间距离自适应的下一个兴趣点推荐方法,具体包括以下步骤:
步骤一、数据获取与预处理
获取用户一系列历史签到记录,每条签到记录包含签到时间、用户名称、兴趣点,提取出所有用户和所有兴趣点,删除其中出现次数少于a次的个别兴趣点和个别用户,得到用户集合和兴趣点集合。
作为优选,a的取值为10。
步骤二、构建签到序列
将步骤一预处理后的每个用户的历史签到记录按照签到时间的先后顺序分别排序,得到每个用户按照时间顺序的签到序列。
步骤三、构建转移矩阵
根据步骤二得到的用户签到序列,采用马尔科夫链对每个用户u构建一个转移矩阵Au,其中元素表示签到序列中是否存在用户u从兴趣点i出发到兴趣点l的记录,存在则为1,否则为0;合并所有用户的转移矩阵Au得到一个转移张量A;
步骤四、估计用户签到概率
其中C为核心张量,U为用户特征矩阵,行表示用户,列表示用户的潜在特征因子;I为当前所在兴趣点i的特征矩阵,行表示当前所在兴趣点,列表示当前所在兴趣点的潜在特征因子;L为下一个兴趣点l的特征矩阵,行表示下一个兴趣点,列表示下一个兴趣点的潜在特征因子;然后根据张量模型成对之间的相互作用估计用户对兴趣点的签到概率,即估计张量中每个元素的估计值。
步骤五、计算用户标准化签到概率
定义用户u从当前所在兴趣点i出发到下一个兴趣点l的签到概率pu(i,l)为:
步骤六、计算用户转移概率
将步骤五得到的用户标准化签到概率输入到sigmoid激活函数中,得到权重参数ξ:
然后根据权重参数ξ,得到位于兴趣点i的用户u对下一个兴趣点l的转移概率:
估计张量中的元素,uU,L表示用户U与下一个兴趣点L的关系矩阵分解后得到的用户u的潜在因子向量;lL,U表示下一个兴趣点L与用户U的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;lL,I表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;iI,L表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的当前所在兴趣点i的潜在因子向量;
步骤七、学习签到概率
对步骤六的结果进行排序,定义兴趣点m和n之间的排名关系为:
P(Θ|>u,i)∝P(>u,i|Θ)P(Θ) (7)
然后根据优化公式,采用随机梯度下降法对参数Θ进行优化:
作为优选,排序方法使用贝叶斯个性化排序的方式。
步骤八、兴趣点推荐
根据步骤七学习得到的用户下一个兴趣点的签到概率,计算用户签到序列中的最后一个兴趣点对其他所有兴趣点的签到概率,将其中签到概率最大的K个兴趣点作为下一个兴趣点推荐给该用户。
本发明具有以下有益效果:
1、通过用户历史签到记录,学习用户的个性化潜在行为模式,从而捕获到有效的用户潜在的个人偏好和兴趣点之间的转移关系。通过对真实数据集的分析,当访问空间距离上接近的兴趣点的时候,相较于用户个人偏好,兴趣点之间的转移关系会对用户产生更加大的影响;而访问空间距离上相距较远的兴趣点的时候,用户个人偏好会对用户产生更大的影响。所以融合了空间距离的方法对自适应用户对不同距离的兴趣点的潜在偏好权重,实现为每个用户推荐更加准确的兴趣点。
2、使用马尔科夫链捕获用户签到序列的时序关系,并且为每个用户生成个性化的转移矩阵用于捕获用户的个人偏好和兴趣点之间的转移关系。引入张量分解模型解决数据集签到数据稀疏的问题,使每个个性化转移矩阵都受到相似用户、相似兴趣点、用户潜在偏好的影响,生成更加完善和高质量的用户转移矩阵,通过这个转移矩阵捕获完善的用户个人偏好和兴趣点转移关系。
附图说明
图1为一种空间距离自适应的下一个兴趣点推荐方法流程图
具体实施方式
以下结合附图对本发明作进一步的解释说明;
如图1所示,本方法具体包括以下步骤:
步骤一、数据获取与预处理
采用Foursquare等位置社交服务网站采集到的真实数据集,数据集中包含一系列历史签到记录,每条签到记录包含签到时间、用户、兴趣点。从数据集中提取出所有用户和所有兴趣点,因为出现次数过少的个别用户和兴趣点会对实验结果产生较大偏差,所以删除其中出现次数少于10次的个别兴趣点和个别用户,最终得到用户集合和兴趣点集合。
步骤二、构建签到序列
将步骤一预处理后的每个用户的历史签到记录按照签到时间的先后顺序分别排序,得到每个用户按照时间顺序的签到序列。
步骤三、构建转移矩阵
为捕捉用户在不同兴趣点之间的转移关系,根据步骤二得到的用户签到序列,采用马尔科夫链对每个用户u构建一个转移矩阵Au,其中元素表示签到序列中是否存在用户u从兴趣点i出发到兴趣点l的记录,存在则为1,否则为0;合并所有用户的转移矩阵Au得到一个转移张量A;
步骤四、估计用户签到概率
其中C为核心张量,U为用户特征矩阵,行表示用户,列表示用户的潜在特征因子;I为当前所在兴趣点i的特征矩阵,行表示当前所在兴趣点,列表示当前所在兴趣点的潜在特征因子;L为下一个兴趣点l的特征矩阵,行表示下一个兴趣点,列表示下一个兴趣点的潜在特征因子;
uU,L表示用户U与下一个兴趣点L的关系矩阵分解后得到的用户u的潜在因子向量;lL,U表示下一个兴趣点L与用户U的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;lL,I表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;iI,L表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的当前所在兴趣点i的潜在因子向量;uU,L、lL,I、uU,I这三个关系矩阵包含在转移张量A中。
步骤五、计算用户标准化签到概率
定义用户u从当前所在兴趣点i出发到下一个兴趣点l的签到概率pu(i,l)为:
步骤六、计算用户转移概率
将步骤五得到的用户标准化签到概率输入到sigmoid激活函数中,得到权重参数ξ:
然后根据权重参数ξ,得到位于兴趣点i的用户u对下一个兴趣点l的转移概率:
步骤七、学习签到概率
在进行下一兴趣点推荐时,将给出K个概率不同的推荐点,这些推荐点按照用户当前位置之后可能访问的可能性进行排名,此时兴趣点之间的排名顺序比其准确概率值更具有关联性,因此采用贝叶斯个性化排序的方式对步骤六的结果进行排序,定义兴趣点m和n之间的排名关系为:
P(Θ|>u,i)∝P(>u,i|Θ)P(Θ) (9)
其中Θ表示模型参数的集合,当每个用户的签到历史为独立的,通过最大化后验概率学习模型参数Θ:
定义两个兴趣点之间的排名关系:
将排名关系输入到sigmoid激活函数中进行排序:
由于该优化公式可微,所以采用随机梯度下降法对参数Θ进行优化:
步骤八、兴趣点推荐
根据步骤七学习得到的用户下一个兴趣点的签到概率,计算用户签到序列中的最后一个兴趣点对其他所有兴趣点的签到概率,将其中签到概率最大的K个兴趣点作为下一个兴趣点推荐给该用户。
Claims (3)
1.一种空间距离自适应的下一个兴趣点推荐方法,其特征在于:该方法具体包括以下步骤:
步骤一、数据获取与预处理
获取用户一系列历史签到记录,每条签到记录包含签到时间、用户名称、兴趣点,提取出所有用户和所有兴趣点,删除其中出现次数少于a次的个别兴趣点和个别用户,得到用户集合和兴趣点集合;
步骤二、构建签到序列
将步骤一预处理后的每个用户的历史签到记录按照签到时间的先后顺序分别排序,得到每个用户按照时间顺序的签到序列;
步骤三、构建转移矩阵
根据步骤二得到的用户签到序列,采用马尔科夫链对每个用户u构建一个转移矩阵Au,其中元素表示签到序列中是否存在用户u从兴趣点i出发到兴趣点l的记录,存在则为1,否则为0;合并所有用户的转移矩阵Au得到一个转移张量A;
步骤四、估计用户签到概率
其中C为核心张量,U为用户特征矩阵,行表示用户,列表示用户的潜在特征因子;I为当前所在兴趣点i的特征矩阵,行表示当前所在兴趣点,列表示当前所在兴趣点的潜在特征因子;L为下一个兴趣点l的特征矩阵,行表示下一个兴趣点,列表示下一个兴趣点的潜在特征因子;然后根据张量模型成对之间的相互作用估计用户对兴趣点的签到概率,即估计张量中每个元素的估计值;
步骤五、计算用户标准化签到概率
定义用户u从当前所在兴趣点i出发到下一个兴趣点l的签到概率pu(i,l)为:
步骤六、计算用户转移概率
将步骤五得到的用户标准化签到概率输入到sigmoid激活函数中,得到权重参数ξ:
然后根据权重参数ξ,得到位于兴趣点i的用户u对下一个兴趣点l的转移概率:
估计张量中的元素,yU,L表示用户U与下一个兴趣点L的关系矩阵分解后得到的用户u的潜在因子向量;lL,U表示下一个兴趣点L与用户U的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;lL,I表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;iI,L表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的当前所在兴趣点i的潜在因子向量;
步骤七、学习签到概率
对步骤六的结果进行排序,定义兴趣点m和n之间的排名关系为:
P(Θ|>u,i)∝P(>u,i|Θ)P(Θ) (7)
然后根据优化公式,采用随机梯度下降法对参数Θ进行优化:
步骤八、兴趣点推荐
根据步骤七学习得到的用户下一个兴趣点的签到概率,计算用户签到序列中的最后一个兴趣点对其他所有兴趣点的签到概率,将其中签到概率最大的K个兴趣点作为下一个兴趣点推荐给该用户。
2.如权利要求1所述一种空间距离自适应的下一个兴趣点推荐方法,其特征在于:步骤一中a的取值为10。
3.如权利要求1所述一种空间距离自适应的下一个兴趣点推荐方法,其特征在于:步骤七中使用的排序方法为贝叶斯个性化排序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110062234.9A CN112784177B (zh) | 2021-01-18 | 2021-01-18 | 一种空间距离自适应的下一个兴趣点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110062234.9A CN112784177B (zh) | 2021-01-18 | 2021-01-18 | 一种空间距离自适应的下一个兴趣点推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112784177A true CN112784177A (zh) | 2021-05-11 |
CN112784177B CN112784177B (zh) | 2022-04-15 |
Family
ID=75756324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110062234.9A Active CN112784177B (zh) | 2021-01-18 | 2021-01-18 | 一种空间距离自适应的下一个兴趣点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112784177B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113129084A (zh) * | 2021-05-19 | 2021-07-16 | 京东方科技集团股份有限公司 | 景区收益率分析模型构建方法、分析方法、设备及介质 |
CN114549143A (zh) * | 2022-03-18 | 2022-05-27 | 电子科技大学 | 线下停车记录与线上购买行为融合的个性化商品推荐方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933595A (zh) * | 2015-05-22 | 2015-09-23 | 齐鲁工业大学 | 一种基于马尔科夫预测模型的协同过滤推荐方法 |
CN105740401A (zh) * | 2016-01-28 | 2016-07-06 | 北京理工大学 | 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置 |
CN106960256A (zh) * | 2017-03-17 | 2017-07-18 | 中山大学 | 基于时间空间上下文的循环神经网络预测位置的方法 |
CN109492166A (zh) * | 2018-08-06 | 2019-03-19 | 北京理工大学 | 基于签到时间间隔模式的连续兴趣点推荐方法 |
-
2021
- 2021-01-18 CN CN202110062234.9A patent/CN112784177B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933595A (zh) * | 2015-05-22 | 2015-09-23 | 齐鲁工业大学 | 一种基于马尔科夫预测模型的协同过滤推荐方法 |
CN105740401A (zh) * | 2016-01-28 | 2016-07-06 | 北京理工大学 | 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置 |
CN106960256A (zh) * | 2017-03-17 | 2017-07-18 | 中山大学 | 基于时间空间上下文的循环神经网络预测位置的方法 |
CN109492166A (zh) * | 2018-08-06 | 2019-03-19 | 北京理工大学 | 基于签到时间间隔模式的连续兴趣点推荐方法 |
Non-Patent Citations (2)
Title |
---|
SHENGLIN ZHAO等: ""Aggregated Temporal Tensor Factorization Model for Point-of-Interest Recommendation"", 《NEURAL PROCESSING LETTERS》 * |
李贵等: ""基于个性化马尔科夫链的推荐算法"", 《计算机科学》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113129084A (zh) * | 2021-05-19 | 2021-07-16 | 京东方科技集团股份有限公司 | 景区收益率分析模型构建方法、分析方法、设备及介质 |
CN113129084B (zh) * | 2021-05-19 | 2024-08-16 | 京东方科技集团股份有限公司 | 景区收益率分析模型构建方法、分析方法、设备及介质 |
CN114549143A (zh) * | 2022-03-18 | 2022-05-27 | 电子科技大学 | 线下停车记录与线上购买行为融合的个性化商品推荐方法 |
CN114549143B (zh) * | 2022-03-18 | 2022-07-29 | 电子科技大学 | 线下停车记录与线上购买行为融合的个性化商品推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112784177B (zh) | 2022-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105740401B (zh) | 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置 | |
CN107133277B (zh) | 一种基于动态主题模型和矩阵分解的旅游景点推荐方法 | |
CN109062962A (zh) | 一种融合天气信息的门控循环神经网络兴趣点推荐方法 | |
CN108563755A (zh) | 一种基于双向循环神经网络的个性化推荐系统及方法 | |
CN112700274B (zh) | 一种基于用户偏好的广告点击率预估方法 | |
CN112784177B (zh) | 一种空间距离自适应的下一个兴趣点推荐方法 | |
CN111428127B (zh) | 融合主题匹配与双向偏好的个性化事件推荐方法及系统 | |
CN112650933B (zh) | 一种基于高阶聚合的图卷积融合多头注意力机制的会话推荐方法 | |
CN111241425B (zh) | 一种基于层次注意力机制的poi推荐方法 | |
Chen et al. | Next POI recommendation based on location interest mining with recurrent neural networks | |
CN113641811B (zh) | 促进购买行为的会话推荐方法、系统、设备及存储介质 | |
CN109902823A (zh) | 一种基于生成对抗网络的模型训练方法及设备 | |
Xue et al. | Forecasting hourly attraction tourist volume with search engine and social media data for decision support | |
CN116244513A (zh) | 随机群组poi推荐方法、系统、设备及存储介质 | |
He | [Retracted] Research on Tourism Route Recommendation Strategy Based on Convolutional Neural Network and Collaborative Filtering Algorithm | |
CN118132856A (zh) | 一种基于大数据的智能分析方法及系统 | |
CN109684561B (zh) | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 | |
Li et al. | Choose A Table: Tensor Dirichlet Process Multinomial Mixture Model with Graphs for Passenger Trajectory Clustering | |
Amzad et al. | Tourism recommendation system: a systematic review | |
CN114417166B (zh) | 基于行为序列和动态社交影响的连续兴趣点推荐方法 | |
CN115935067A (zh) | 面向社会化推荐的语义与结构视图融合的物品推荐方法 | |
CN112765493B (zh) | 一种用于兴趣点推荐的获取时间偏好融合序列偏好的方法 | |
CN113032688B (zh) | 针对社交网络用户在未来给定时间的访问位置预测方法 | |
Wu et al. | Mining trajectory patterns with point-of-interest and behavior-of-interest | |
CN115905682A (zh) | 一种兴趣点推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |