CN108460101B - 面向位置社交网络基于地理位置正则化的兴趣点推荐方法 - Google Patents
面向位置社交网络基于地理位置正则化的兴趣点推荐方法 Download PDFInfo
- Publication number
- CN108460101B CN108460101B CN201810111634.2A CN201810111634A CN108460101B CN 108460101 B CN108460101 B CN 108460101B CN 201810111634 A CN201810111634 A CN 201810111634A CN 108460101 B CN108460101 B CN 108460101B
- Authority
- CN
- China
- Prior art keywords
- interest
- point
- user
- feature vector
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 239000011159 matrix material Substances 0.000 claims abstract description 55
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 14
- 238000005457 optimization Methods 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000003252 repetitive effect Effects 0.000 claims description 3
- 239000004744 fabric Substances 0.000 claims 1
- 239000007787 solid Substances 0.000 claims 1
- 230000032258 transport Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种面向位置社交网络基于地理位置正则化的兴趣点推荐方法,先建立用户与兴趣点的签到频次矩阵,计算用户对兴趣点的偏好置信度;基于兴趣点之间的地理位置坐标,计算兴趣点之间的相似程度;建立兴趣点邻域关系矩阵,以相邻兴趣点的特征向量来表示目标兴趣点的特征向量;基于权重概率矩阵分解模型生成目标函数;生成最终的用户和兴趣点的潜在特征矩阵;根据最终的用户和兴趣点的潜在特征矩阵生成预测的评分矩阵;对用户进行个性化推荐。本发明从位置的角度出发探索兴趣点之间的地理关系,将地理关系以正则项的方式融入到权重概率矩阵分解模型中,优化推荐目标,提高准确率和召回率,获得更好的推荐效果,更加符合位置社交网络特点。
Description
技术领域
本发明涉及社交兴趣推荐领域,具体涉及一种面向位置社交网络基于地理位置正则化的兴趣点推荐方法。
背景技术
近年来,为了帮助用户发现更多有吸引力的位置,满足他们对兴趣点的个性化需求,兴趣点(Point-of-Interest,POI)推荐作为一种重要的信息过滤技术受到了研究者们的广泛关注。与传统推荐问题相比,POI推荐主要存在以下两方面的挑战:1)在位置社交网络(LBSN)中,用户的偏好是由用户的隐式签到数据表示的,我们只能知道用户在过去访问过哪些位置,但对于没有访问过的地点,我们不知道用户是因为不喜欢还是因为没有发现,这些混合在一起的负样本和缺失样本很难用一般的方法直接进行区分;2)POI具有地理位置信息,地理位置是表征用户行为习惯的重要因素。在实际应用中,在地理位置上相邻的兴趣点更可能被具有相似兴趣的用户所访问。用户通过访问不同的地点来表现自己不同的兴趣爱好。
针对上述面临的挑战,研究者们开始考虑如何利用POI的地理位置因素,通过扩展传统的推荐算法来提高LBSN中的兴趣点推荐性能。例如,Zhang等人利用核密度估计为每个用户使用个性化的距离分布来模拟地理影响;Lian等人为了处理用户的隐式反馈信息,提出了基于加权矩阵分解模型GeoMF,然后利用增强的潜在因子对用户的聚类现象进行建模。受签到地点总是分散在几个中心这一观察的启发,Zhao等人提出了基于遗传算法的高斯混合模型(GA-GMM)来捕获地理影响;Ye等人通过幂律分布模拟地理影响,揭示用户签到活动中的空间聚类现象。
但是,目前这些研究大都从用户的角度来分析地理位置对推荐算法的影响,从POI之间的位置关系角度来探索地理位置在推荐过程中的重要作用还没有得到充分地研究。然而从直观上来看,位置关系特征应该独立于用户的特征,能够体现POI推荐任务的不同方面,有利于进行更加精准的个性化推荐。例如,Liu等人从位置角度出发利用地理影响进行建模,所提出的IRenMF算法提高了推荐性能,但他们的工作没有考虑两地之间的明确关系。尽管在已有工作中,兴趣点之间的地理关系已经被证实为提高兴趣点推荐效果的有效因素,但是先前的工作主要从用户角度而不是位置角度对地理关系进行建模。然而在实际应用中,在地理位置上相邻的兴趣点更容易于被相似的用户访问,兴趣点之间的地理位置关系是用户选择的重要因素。因此,如何从位置的角度出发探索兴趣点之间的地理关系,将地理关系以正则项的方式融入到兴趣点推荐方法中,仍是待解决的技术问题。
发明内容
为了克服上述现有技术的不足,本发明提供了一种面向位置社交网络基于地理位置正则化的兴趣点推荐方法,从位置的角度出发探索兴趣点之间的地理关系,将地理关系以正则项的方式融入到权重概率矩阵分解模型WPMF中,优化推荐的目标,提高准确率和召回率,获得更好的推荐效果,更加符合位置社交网络的特点。
本发明所采用的技术方案是:
一种面向位置社交网络基于地理位置正则化的兴趣点推荐方法,包括以下步骤:
步骤1:建立用户与兴趣点的签到频次矩阵,计算用户对兴趣点的偏好置信度;
步骤2:基于兴趣点之间的地理位置坐标,计算兴趣点之间的相似程度;
步骤3:对兴趣点之间的相似程度进行归一化处理,得到兴趣点邻域关系矩阵,并以相邻兴趣点的特征向量来表示目标兴趣点的特征向量;
步骤4:基于权重概率矩阵分解模型,根据目标兴趣点的相邻兴趣点的特征向量和用户对兴趣点的偏好置信度,生成目标函数;
步骤5:对目标函数进行优化处理,得到最终的用户和兴趣点的潜在特征矩阵;
步骤6:根据最终的用户和兴趣点的潜在特征矩阵生成预测的评分矩阵;
步骤7:对用户进行个性化推荐。
进一步的,所述步骤1中,用户对兴趣点的偏好置信度的计算方法为:
根据用户访问兴趣点的签到信息,建立用户与兴趣点的签到频次矩阵F;
利用签到频次矩阵F中用户访问兴趣点的频次,计算用户对兴趣点的偏好置信度,其中,用户对兴趣点的偏好置信度的表达式为:
其中,αFu,i>0是一个关于Fu,i的单调递增函数,Fu,i表示用户u访问兴趣点i的频次;Wu,i为用户u对兴趣点i的偏好置信度。
进一步的,所述步骤2中,兴趣点之间的相似程度的计算公式为:
其中,sim(i,j)表示兴趣点i和j之间的相似程度,xi和xj分别表示兴趣点i和j的地理坐标坐标;σ为常数。
进一步的,所述步骤3中,对兴趣点之间的相似程度进行归一化处理,得到兴趣点邻域关系矩阵,并以相邻兴趣点的特征向量来表示目标兴趣点的特征向量,包括:
对兴趣点之间的相似程度进行归一化处理,得到兴趣点的邻域关系矩阵;
基于兴趣点之间地理位置关系,建立与目标兴趣点的相邻位置集合;
计算邻域关系矩阵的各距离度量的归一化值与目标兴趣点的相邻兴趣点集合内各相邻兴趣点的特征向量的乘积的和,得到受到相邻兴趣点影响后,目标兴趣点的特征向量。
进一步的,所述目标兴趣点的特征向量的表达式为:
其中,是距离度量的归一化值;L(i)表示兴趣点i的相邻兴趣点集合,sim(i,j)表示兴趣点i和j之间的相似程度;Vj表示兴趣点i的相邻兴趣点j的特征向量。
进一步的,所述步骤4中,基于权重概率矩阵分解模型,根据目标兴趣点的相邻兴趣点的特征向量和用户对兴趣点的偏好置信度,生成目标函数的具体过程为:
步骤4-1:基于兴趣点之间地理位置关系,建立与当前兴趣点的相邻兴趣点集合,采用集合中的兴趣点的特征向量计算当前兴趣点的潜在特征向量,基于用户对兴趣点的偏好置信度,得到当前兴趣点基于相似度的先验分布;
步骤4-2:由于兴趣点的潜在特征向量服从均值为0的正态分布,再将上述兴趣点基于相似度的先验分布融合在一起,得到带有约束的兴趣点潜在特征向量的先验分布;
步骤4-3:根据权重概率矩阵分解模型,得到用户和兴趣点的潜在特征矩阵的后验分布,通过使用户和兴趣点的潜在特征矩阵的后验分布的对数形式最大化并且超参数保持固定,得到最终的目标函数。
进一步的,所述步骤5中,对目标函数进行优化处理,得到最终的用户和兴趣点的潜在特征矩阵的具体方法为:
分别固定用户或兴趣点的潜在特征向量,使目标函数转换为二次方程最优化问题,运用最小二乘法进行优化处理,分别求出对用户和兴趣点的潜在特征向量的梯度,在给定用户和兴趣点初始的潜在特征矩阵后,通过迭代训练模型,不断更新用户和兴趣点的潜在特征矩阵,得到最终满足条件的潜在特征矩阵。
与现有技术相比,本发明的有益效果是:
(1)本发明从位置的角度出发探索兴趣点之间的地理关系,将地理关系以正则项的方式融入到权重概率矩阵分解模型中,来优化推荐的目标,能够提高准确率和召回率,获得更好的推荐效果,更加符合位置社交网络的特点;
(2)本发明在只有隐式反馈的位置社交网络数据上,通过考虑兴趣点之间的位置关系和用户本身的历史兴趣来预测用户可能会感兴趣的地点,从位置关系的角度出发,可以使兴趣点的潜在特征向量与相邻的兴趣点的潜在特征向量有关,使得模型更好地模拟用户签到行为,从而提高当前推荐系统的推荐准确率。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是本发明实施例公开的面向位置社交网络基于地理位置正则化的兴趣点推荐方法流程图;
图2a是位置社交网络中的兴趣点推荐示例中位置社交网络示意图;
图2b是位置社交网络中的兴趣点推荐示例中用户-兴趣点签到频次矩阵示意图;
图3a是Precision@k的性能比较结果;
图3b是Recall@k的性能比较结果;
图4a是λT对Precision@k的影响;
图4b是λT对Recall@k的影响。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
正如背景技术所介绍的,现有技术中存在主要从用户的角度来分析地理位置对推荐算法的影响,从POI之间的位置关系角度来探索地理位置在推荐过程中的重要作用还没有得到充分地研究的不足,为了解决如上的技术问题,本申请提出了一种面向位置社交网络基于地理位置正则化的兴趣点推荐方法,从位置的角度出发探索兴趣点之间的地理关系,将地理关系以正则项的方式融入到权重概率矩阵分解WPMF模型中。
本申请的一种典型的实施方式中,如图1所示,提供了一种面向位置社交网络基于地理位置正则化的兴趣点推荐方法,该方法包括:
步骤1:建立用户-兴趣点签到频次矩阵。
在LBSN中,一方面,签到反馈是隐式的,这意味着不能有效地从非观测项中区分出实际的样本负例和缺失项,未访问的兴趣点POI(签到频次矩阵中的缺失项)要么是用户不喜欢,要么是用户有可能喜欢但没有发现;另一方面,兴趣点POI具有地理信息,并且用户的签到行为具有聚集现象,这意味着附近的位置往往被类似的用户访问。假设在位置社交网络G中(如图2a所示),有一组用户集合U={u1...uN},和一组兴趣点集合I={i1...iM}。用户通过在不同的兴趣点上进行签到来表达他们的喜好,根据记录用户的签到信息,建立用户-兴趣点签到频次矩阵F∈RN×M,如图2b所示,其中签到频次矩阵F中每条记录信息Fu,i表示用户u访问过兴趣点POI i的次数。本发明在只有隐式反馈的位置社交网络数据上,通过考虑兴趣点之间的位置关系和用户本身的历史兴趣来预测用户可能会感兴趣的地点。
步骤2:计算用户对兴趣点的偏好置信度。
利用签到频次矩阵F中用户访问兴趣点的频次Fu,i,计算用户对兴趣点的偏好置信度,即用户u喜欢兴趣点i的权重值,其中,用户对兴趣点的偏好置信度Wu,i的表达式为:
其中,αFu,i>0是一个关于Fu,i的单调递增函数,为用户访问频次的函数,Fu,i表示用户u访问兴趣点i的频次;Wu,i为用户u对兴趣点i的偏好置信度。为了降低负例的影响,增加正例对算法的贡献度,在本发明中,将所有负例的权重Wu,i都看作是1,而将正例的权重看作是用户访问频次的函数,并且用户对该兴趣点的访问频次Fu,i越高,该样本作为正例的权重Wu,i就越大。
步骤3:基于地理位置的约束,计算兴趣点之间的相似程度。
兴趣点之间的相似程度的计算公式为:
其中,sim(i,j)表示兴趣点i和j之间的相似程度,xi和xj分别表示兴趣点i和j的地理坐标坐标(纬度和经度);σ为常数,在本实施例中设定为0.1。
步骤4:根据兴趣点之间的相似程度,建立兴趣点邻域关系矩阵,得到受到相邻兴趣点影响后,目标兴趣点的特征向量。
在本发明中,令T=(Ti,j)M×M表示兴趣点POI的邻域关系矩阵,其中,是距离度量的归一化值,是通过对兴趣点之间的相似程度sim(i,j)进行归一化处理得到的。
兴趣点之间地理位置关系为:兴趣点之间在地理位置上的远近关系(由欧式距离度量),并且根据对位置社交网络的观察,地理位置上相距越近的兴趣点越容易被共同的用户所访问,由此兴趣点之间的地理位置关系可引申为:兴趣点之间的近似关系。
在考虑兴趣点之间地理位置关系的基础上,生成与目标兴趣点i的相邻兴趣点集合L(i);邻近的兴趣点更容易被具有共同兴趣的用户所访问,即兴趣点i的潜在特征向量近似于其所有相邻兴趣点的潜在特征向量。由于目标兴趣点潜在特征向量依赖于该相邻兴趣点集合中的兴趣点的特征向量,因此,通过计算邻域关系矩阵的各距离度量的归一化值Ti,j与目标兴趣点的相邻兴趣点集合内各相邻兴趣点的特征向量Vj的乘积的和,得到受到相邻兴趣点影响后,目标兴趣点的特征向量。
受到相邻兴趣点影响后,目标兴趣点的特征向量的表达式为:
其中,是距离度量的归一化值;L(i)表示兴趣点i的相邻兴趣点集合,sim(i,j)表示兴趣点i和j之间的相似程度;Vj表示兴趣点i的相邻兴趣点j的特征向量;为兴趣点i的特征向量。
步骤5:基于权重概率矩阵分解模型生成目标函数。
所述基于权重概率矩阵分解模型生成目标函数的具体过程为:
(1)基于兴趣点之间的位置关系,选取Y个与当前兴趣点i相似度高的兴趣点j,构建与当前兴趣点的相邻兴趣点集合L(i),其潜在特征向量与集合中的兴趣点的特征向量有关,从而约束当前兴趣点的潜在特征向量,考虑了用户对兴趣点的偏好置信度,得到当前兴趣点基于相似度的先验分布,该当前兴趣点基于相似度的先验分布如下所示:
式中,N(x|μ,σ2)表示均值为μ,方差为σ2的高斯分布概率密度函数;L(i)表示兴趣点i的相邻兴趣点集合;T为兴趣点的邻域关系矩阵;Vi为兴趣点i的潜在特征向量;W为用户对兴趣点的偏好置信度矩阵。
(2)由于兴趣点的潜在特征向量服从均值为0的正态分布,再将上述兴趣点基于相似度的先验分布融合在一起,得到带有约束的兴趣点潜在特征向量的先验分布,为:
其中,Vi为兴趣点i的潜在特征向量;L(i)表示兴趣点i的相邻兴趣点集合;W为用户对兴趣点的偏好置信度矩阵。
(3)根据概率矩阵分解模型,得到用户和物品的潜在特征矩阵U和V的后验分布,为:
其中,N(x|μ,σ2)是均值为μ,方差为σ2的高斯分布概率密度函数;P是二元偏好矩阵,每条记录Pu,i∈{0,1}表示用户u是否已经访问了兴趣点i。
通过使用户和物品的潜在特征矩阵的后验分布的对数形式最大化并且超参数保持固定,得到最终的目标函数,为:
其中,λU,λV和λT是正则化参数;Uu为目标用户u的潜在特征向量;Vi为兴趣点i的潜在特征向量。
步骤6:生成最终的用户和兴趣点的潜在特征矩阵。
分别固定用户或兴趣点的潜在特征向量,使目标函数转换为二次方程最优化问题,运用最小二乘法进行优化处理,分别求出对用户和兴趣点的潜在特征向量的梯度,在给定用户和兴趣点初始的潜在特征矩阵后,通过迭代训练模型,不断更新用户和兴趣点的潜在特征矩阵,使误差逐渐缩小,直到误差减到允许的范围内,得到最终满足条件的潜在特征矩阵,其中每一步都可以保证降低成本函数的值。用户和兴趣点的潜在特征向量Uu和Vi的表达式为:
Uu=(VTWuV+λUI)-1VTWuP(u)
其中,λU,λV和λT是正则化参数,V为兴趣点的潜在特征矩阵;Wu为用户u对兴趣点的偏好置信度;U为用户的潜在特征矩阵;I为单位矩阵;P(u)为用户u的二元偏好矩阵;Wi为用户对兴趣点i的偏好置信度;P(i)为兴趣点i的二元偏好矩阵;L(i)表示兴趣点i的相邻兴趣点集合;L(j)表示兴趣点j的相邻兴趣点集合;Vm为兴趣点m的潜在特征向量。
步骤7:针对每个用户根据得到的潜在特征向量,计算其与兴趣点的内积,得到预测的评分矩阵,以所生的评分作为用户对该兴趣点的喜好程度。
步骤8:针对每个用户,选取预测的评分矩阵中最高的前k项兴趣点作为推荐结果。
下面列举一个具体的计算实施对本发明提出的面向位置社交网络基于地理位置正则化的兴趣点推荐方法进行详细说明。
(1)选取数据集
利用Gowalla在城市Austin的签到数据来评估本发明提出的基于地理位置正则化的兴趣点推荐方法。数据集抽取了19,240个用户和11,416个POI,其签到总数为997,113,其中每个用户的平均访问POI数为30,每个POI的平均访问用户数量为50。在实验中,我们随机选择80%的用户-兴趣点签到记录进行训练。参数设置是:参数α=1,并将潜在特征向量维数D设置为10。正则化参数设置为λU=λV=0.0025。通过两个广泛使用的度量Recall@k和Precision@k来评估本发明提出的基于地理位置正则化的兴趣点推荐方法。它们的公式定义如下:
其中LT(u)表示给定用户u在测试数据中的相应访问位置的集合,Lk(u)表示前k个推荐的POI集合,k是推荐列表的中POI的数目。
(2)性能比较
为了验证本发明提出的基于地理位置正则化的兴趣点推荐方法的有效性,将推荐结果与以下方法进行比较:
BPRMF:该方法采用贝叶斯个性化排序(BPR)准则给项目排序。
WBPR-D:这是一种加权排序方法,通过对每个POI对进行不同的地理距离加权来扩展BPR。
GeoMF:这种方法在一个正则化模型中,以用户的活动区域向量和POI的影响范围向量来分别扩展用户和兴趣点的潜在特征。
WPMF:这是我们的基线推荐方法,通过给负样本较小的权重来处理隐式反馈信息。
WPMF-T:这是基于地理位置正则化的兴趣点推荐方法。
实验结果如图3a和3b所示,由此可以看出:由于基于BPRMF的方法(BPRMF和WBPR-D)仅利用取样的POI对进行训练,它们比WPMF方法(WPMF,GeoMF和WPMF-T)效果差。GeoMF作为最先进的POI推荐方法,实现了比WPMF更好的性能。本发明提出的基于地理位置正则化的兴趣点推荐方法比WPMF和GeoMF都要好。这个结果表明,从位置的角度对地理影响进行建模更加合理,而且本发明提出的基于地理位置正则化的兴趣点推荐方法可以更准确地模拟签到数据。
(3)参数λT对结果的影响
在本发明提出的基于地理位置正则化的兴趣点推荐方法WPMF-T中,参数λT起着重要的作用,它平衡了用户的签到信息和地理信息。λT的值越大表示将使用更多的地理信息来训练本发明提出的方法的模型。相反,较小的λT值表示本发明提出的基于地理位置正则化的兴趣点推荐方法将主要利用用户的签到信息。图4a和4b显示了λT取不同值的实验结果:对于P recision@k和Recall@k度量,随着λT的增加,推荐性能先逐渐增加,但当λT超过一定值时,随着λT值的进一步增加,性能会下降。这个结果表明地理影响对于POI推荐是重要的,纯粹利用用户偏好不能得到更好的结果。
在本实施例中,本发明主要考虑如何从位置的角度出发来探索地理位置关系对推荐算法的影响,引入加权概率矩阵分解方法作为基本推荐框架,并在此基础上并提出了一种基于地理位置正则化的兴趣点推荐方法。在真实位置社交网络上的实验结果表明,与其它的相关工作相比,本发明提出的基于地理位置正则化的兴趣点推荐方法可以有效地利用地理信息,获得更好的推荐效果。
为了更加突出问题本身,本发明只考虑了位置之间的近邻关系,而没有考虑到用户的位置签到序列。然而在真实世界中,用户对兴趣点的访问序列体现了用户的生活习惯和兴趣爱好,对位置间的先后关系进行建模,能更好的刻画用户兴趣。本发明对用户的签到数据进行充分利用,依据签到频次多少的贡献不同,给出了带有权重的矩阵分解方法的概率表示形式。本发明中从位置关系的角度出发,可以使兴趣点的潜在特征向量与相邻的兴趣点的潜在特征向量有关,使得模型更好地模拟用户签到行为,从而提高当前推荐系统的推荐准确率。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (5)
1.一种面向位置社交网络基于地理位置正则化的兴趣点推荐方法,其特征是,包括以下步骤:
步骤1:根据用户是否访问了兴趣点,建立二元偏好矩阵;
根据用户访问兴趣点的签到信息,建立用户与兴趣点的签到频次矩阵F;利用签到频次矩阵F中用户访问兴趣点的频次,计算用户对兴趣点的权重值,其中,用户对兴趣点的权重值的表达式为:
其中,αFu,i>0是一个关于Fu,i的单调递增函数,为用户访问频次的函数,Fu,i表示用户u访问兴趣点i的频次;Wu,i为用户u对兴趣点i的权重值;
将所有负例的权重看作是1,将正例的权重看作是用户访问频次的函数,用户对该兴趣点的访问频次越高,作为正例的权重就越大;
步骤2:基于兴趣点之间的地理位置坐标,计算兴趣点之间的相似程度;选取多个与目标兴趣点相似度高的兴趣点,生成目标兴趣点的相邻兴趣点集合,建立兴趣点的邻域关系矩阵,并对邻域关系矩阵中各距离度量进行归一化处理,得到距离度量的归一化值;
步骤3:计算邻域关系矩阵中各距离度量的归一化值与目标兴趣点的相邻兴趣点集合内各相邻兴趣点的特征向量的加权和,得到受相邻兴趣点影响后,目标兴趣点的特征向量;
步骤4:基于权重概率矩阵分解模型,根据目标兴趣点的相邻兴趣点的特征向量和用户对兴趣点的权重值,生成目标函数;
其中,Wu,i为用户u对兴趣点i的权重值,Pu,i∈{0,1}表示用户u是否已经访问了兴趣点i;Vi为兴趣点i的潜在特征向量,Uu为目标用户u的潜在特征向量;为目标兴趣点的特征向量,L(i)表示兴趣点i的相邻兴趣点集合,λU,λV和λT是正则化参数;
步骤5:对目标函数进行优化处理,得到最终的用户和兴趣点的潜在特征矩阵;
步骤6:根据最终的用户和兴趣点的潜在特征矩阵生成预测的评分矩阵;
步骤7:对用户进行个性化推荐。
2.根据权利要求1所述的面向位置社交网络基于地理位置正则化的兴趣点推荐方法,其特征是,所述步骤2中,兴趣点之间的相似程度的计算公式为:
其中,sim(i,j)表示兴趣点i和j之间的相似程度,xi和xj分别表示兴趣点i和j的地理坐标;σ为常数。
3.根据权利要求1所述的面向位置社交网络基于地理位置正则化的兴趣点推荐方法,其特征是,所述目标兴趣点的特征向量的表达式为:
其中,是距离度量的归一化值;L(i)表示兴趣点i的相邻兴趣点集合,sim(i,j)表示兴趣点i和j之间的相似程度;Vj表示兴趣点i的相邻兴趣点j的特征向量。
4.根据权利要求1所述的面向位置社交网络基于地理位置正则化的兴趣点推荐方法,其特征是,所述步骤4中,基于权重概率矩阵分解模型,根据目标兴趣点的相邻兴趣点的特征向量和用户对兴趣点的权重值,生成目标函数的具体过程为:
步骤4-1:基于兴趣点之间地理位置关系,建立与当前兴趣点的相邻兴趣点集合,采用集合中的兴趣点的特征向量计算当前兴趣点的潜在特征向量,基于用户对兴趣点的权重值,得到当前兴趣点基于相似度的先验分布;
步骤4-2:由于兴趣点的潜在特征向量服从均值为0的正态分布,再将上述兴趣点基于相似度的先验分布融合在一起,得到带有约束的兴趣点潜在特征向量的先验分布;
步骤4-3:根据权重概率矩阵分解模型,得到用户和兴趣点的潜在特征矩阵的后验分布,通过使用户和兴趣点的潜在特征矩阵的后验分布的对数形式最大化并且超参数保持固定,得到最终的目标函数。
5.根据权利要求1所述的面向位置社交网络基于地理位置正则化的兴趣点推荐方法,其特征是,所述步骤5中,对目标函数进行优化处理,得到最终的用户和兴趣点的潜在特征矩阵的具体方法为:
分别固定用户或兴趣点的潜在特征向量,使目标函数转换为二次方程最优化问题,运用最小二乘法进行优化处理,分别求出对用户和兴趣点的潜在特征向量的梯度,在给定用户和兴趣点初始的潜在特征矩阵后,通过迭代训练模型,不断更新用户和兴趣点的潜在特征矩阵,得到最终满足条件的潜在特征矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810111634.2A CN108460101B (zh) | 2018-02-05 | 2018-02-05 | 面向位置社交网络基于地理位置正则化的兴趣点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810111634.2A CN108460101B (zh) | 2018-02-05 | 2018-02-05 | 面向位置社交网络基于地理位置正则化的兴趣点推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108460101A CN108460101A (zh) | 2018-08-28 |
CN108460101B true CN108460101B (zh) | 2019-05-28 |
Family
ID=63239606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810111634.2A Expired - Fee Related CN108460101B (zh) | 2018-02-05 | 2018-02-05 | 面向位置社交网络基于地理位置正则化的兴趣点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108460101B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109634983B (zh) * | 2018-12-13 | 2021-03-30 | 百度在线网络技术(北京)有限公司 | 召回兴趣点信息的确定方法、装置、设备和介质 |
CN111460248B (zh) * | 2019-01-19 | 2023-05-23 | 北京嘀嘀无限科技发展有限公司 | 用于线上到线下服务的系统和方法 |
CN112528170A (zh) * | 2019-09-19 | 2021-03-19 | 北京搜狗科技发展有限公司 | 一种用户兴趣挖掘的方法及相关装置 |
CN111241415B (zh) * | 2019-12-28 | 2023-07-21 | 四川文理学院 | 一种融合多因素社交活动的推荐方法 |
CN111680228B (zh) * | 2020-06-11 | 2022-03-18 | 浙江工商大学 | 基于地理位置融合和类别流行度的兴趣点推荐方法 |
CN112650932B (zh) * | 2021-01-04 | 2022-09-23 | 重庆邮电大学 | 一种融合社交和位置关系的神经协同过滤poi推荐方法 |
CN112800346B (zh) * | 2021-01-15 | 2022-10-14 | 郑州大学 | 一种融入空间关系的poi推荐方法及推荐系统 |
CN114792110B (zh) * | 2021-01-25 | 2024-02-13 | 南京意博软件科技有限公司 | 兴趣点数据的生成方法及装置 |
CN112784162B (zh) * | 2021-01-29 | 2023-09-19 | 东北财经大学 | 基于TS24的动态POIs推荐方法 |
CN113158089B (zh) * | 2021-04-16 | 2022-04-19 | 桂林电子科技大学 | 一种社交网位置向量化建模方法 |
CN113158078A (zh) * | 2021-04-19 | 2021-07-23 | 辽宁工程技术大学 | 一种结合地点类别和社交网络的兴趣点推荐方法 |
CN113918837B (zh) * | 2021-10-15 | 2024-02-06 | 山东大学 | 城市兴趣点类别表示的生成方法及系统 |
CN113918823A (zh) * | 2021-11-02 | 2022-01-11 | 中电万维信息技术有限责任公司 | 一种融合信任关系的排序学习poi推荐算法 |
CN114036403B (zh) * | 2022-01-07 | 2022-03-25 | 智者四海(北京)技术有限公司 | 用户兴趣探测方法、装置和存储介质 |
CN114048391B (zh) * | 2022-01-13 | 2022-04-19 | 中国测绘科学研究院 | 一种基于地理格网的兴趣活动推荐方法 |
CN115114997A (zh) * | 2022-07-18 | 2022-09-27 | 百度在线网络技术(北京)有限公司 | 确定空间约束特征的方法和条件随机场模型的训练方法 |
CN115408618B (zh) * | 2022-09-26 | 2023-10-20 | 南京工业职业技术大学 | 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法 |
CN117216397B (zh) * | 2023-09-22 | 2024-03-12 | 哈尔滨工业大学 | 一种基于区域影响的深度矩阵分解的poi推荐方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130097162A1 (en) * | 2011-07-08 | 2013-04-18 | Kelly Corcoran | Method and system for generating and presenting search results that are based on location-based information from social networks, media, the internet, and/or actual on-site location |
CN103023977B (zh) * | 2012-11-19 | 2015-07-01 | 华南理工大学 | 基于位置信息的推荐系统及推荐方法 |
US9310205B2 (en) * | 2014-02-20 | 2016-04-12 | Stubhub, Inc. | Interactive venue assistant |
CN105718576B (zh) * | 2016-01-22 | 2019-07-16 | 西安电子科技大学 | 与地理特征相关的个性化位置推荐系统 |
CN106056455A (zh) * | 2016-06-02 | 2016-10-26 | 南京邮电大学 | 一种基于位置和社交关系的群组与地点推荐方法 |
CN107341261B (zh) * | 2017-07-13 | 2020-10-27 | 南京邮电大学 | 一种面向位置社交网络的兴趣点推荐方法 |
-
2018
- 2018-02-05 CN CN201810111634.2A patent/CN108460101B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN108460101A (zh) | 2018-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108460101B (zh) | 面向位置社交网络基于地理位置正则化的兴趣点推荐方法 | |
Xu et al. | Incentive mechanism for multiple cooperative tasks with compatible users in mobile crowd sensing via online communities | |
Tingley et al. | Birds track their Grinnellian niche through a century of climate change | |
Yang et al. | On designing data quality-aware truth estimation and surplus sharing method for mobile crowdsensing | |
Zhang et al. | Location and time aware social collaborative retrieval for new successive point-of-interest recommendation | |
CN109948066B (zh) | 一种基于异构信息网络的兴趣点推荐方法 | |
CN109508428B (zh) | 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法 | |
CN106776930B (zh) | 一种融入时间和地理位置信息的地点推荐方法 | |
CN106776928B (zh) | 基于内存计算框架、融合社交及时空数据的位置推荐方法 | |
CN108804551A (zh) | 一种兼顾多样性与个性化的空间兴趣点推荐方法 | |
CN107515949B (zh) | 兴趣点预测和推荐中的用户时空相似性度量方法 | |
CN110874437B (zh) | 一种基于多重兴趣点对排序的个性化兴趣点推荐方法 | |
Hu et al. | Nonnegative matrix tri-factorization with user similarity for clustering in point-of-interest | |
CN109635990A (zh) | 一种训练方法、预测方法、装置及电子设备 | |
CN110322067A (zh) | 基于因子图模型的移动用户位置预测方法 | |
CN111104607A (zh) | 基于签到数据的地点推荐方法及装置 | |
CN115630129A (zh) | 一种社区体育健身设施步行适应性的评价方法 | |
Pálovics et al. | Location-aware online learning for top-k recommendation | |
CN107909498B (zh) | 基于最大化接受者操作特征曲线下方面积的推荐方法 | |
CN106844626B (zh) | 利用微博关键词和位置信息模拟空气质量的方法及系统 | |
Chen et al. | Using function approximation for personalized point-of-interest recommendation | |
Wei et al. | User-generated content affects urban park use: Analysis of direct and moderating effects | |
CN106779181A (zh) | 一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法 | |
CN110837540A (zh) | 一种空间位置数据的处理方法及系统 | |
CN114401211B (zh) | 一种工业无线网络设备接入IPv6网络的测试系统及测试方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190528 Termination date: 20220205 |
|
CF01 | Termination of patent right due to non-payment of annual fee |