CN109508428B - 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法 - Google Patents

基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法 Download PDF

Info

Publication number
CN109508428B
CN109508428B CN201910053067.4A CN201910053067A CN109508428B CN 109508428 B CN109508428 B CN 109508428B CN 201910053067 A CN201910053067 A CN 201910053067A CN 109508428 B CN109508428 B CN 109508428B
Authority
CN
China
Prior art keywords
interest
user
point
interest point
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910053067.4A
Other languages
English (en)
Other versions
CN109508428A (zh
Inventor
崔琳
汪材印
张志伟
潘正高
吴孝银
刘永清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201910053067.4A priority Critical patent/CN109508428B/zh
Publication of CN109508428A publication Critical patent/CN109508428A/zh
Application granted granted Critical
Publication of CN109508428B publication Critical patent/CN109508428B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法,涉及互联网技术领域,针对用户兴趣在时间上呈周期变化的特性,把用户在兴趣点上的签到行为按固定的时间段进行划分,在每一时间段,挖掘真正流行的兴趣点和双隐式信任机制(对相似类别专家的隐式信任和对潜在朋友的隐式信任)对周期兴趣点推荐的影响。在Foursquare数据集和Gowalla数据集上验证TpCsSce‑PPR模型的性能,实验结果显示TpCsSce‑PPR模型在MAE和RMSE评价指标上优于所选择的基准推荐方法。

Description

基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法
技术领域
本发明涉及互联网技术领域,特别是涉及基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法。
背景技术
随着移动互联网爆炸式增长、电子商务的迅猛发展以及智能手机的快速普及,在线社会网络下的推荐技术得到了迅速发展。在基于位置的在线社会网络下,兴趣点推荐具有时间序列模式和时间循环模式。Zhao等人针对用户在不同的时间段会喜欢不同的下一个兴趣点,提出了一种基于时空潜在排序方法的下一个兴趣点推荐技术,以细粒度的方式显式建模用户、兴趣点和时间之间的交互。Feng等人采用使用针对推荐的排序度量嵌入方法(PRME)对用户的个性化签到序列进行建模,对下一个新的兴趣点进行推荐,此模型整合了签到的序列信息、个人偏好和地理影响,以提高推荐性能。Lian等人提出使用个性化马尔科夫链来表示用户的短期爱好和长期爱好来预测下一个兴趣点。Zhang等人提出一种位置和时间感知的社会化协同检索模型,此模型同时对与用户有关的位置、时间和社会信息进行建模,进行下一个兴趣点推荐,并有效使用协同检索模型的加权估计排序成对损失实现更好的Top-N排序推荐。
兴趣点的流行度反映了兴趣点所提供的服务和产品的质量。把兴趣点的流行度作为影响兴趣点推荐的一个因素是可取的。Ying等人提出了一种称为UPOI-Mine的城市兴趣点推荐方法,在基于位置的社会网络下,同时根据社会因素、个人偏好和兴趣点流行度,进行城市内兴趣点推荐。Lim等人提出了一种基于兴趣点流行度和用户兴趣爱好的PERSTOUR模型,为用户推荐个性化的旅游兴趣点序列。此模型考虑用户旅行限制,例如时间限制以及需要在特定兴趣点的开始和结束等问题。Nicholas等人提出了一种在上下文情境下,使用社区行为和相似度进行本地搜索的兴趣点推荐模型Hapori,此模型考虑四种类型的上下文特征:时序、空间、天气和兴趣点流行度特征,这四种不同类型的情境特征对用户的兴趣点推荐有着不同的影响。Zhang等人通过使用地理相关性、社会相关性和用户与兴趣点之间的类别相关性知识提出一种新的兴趣点推荐方法GeoSoCa。GeoSoCa使用用户对兴趣点类别的偏好,对相应类别中的兴趣点流行度进行加权,并且将被加权的流行度建模为幂律分布。
从上述研究工作可以看出,用户的签到行为呈明显的周期性变化趋势。除了受自身偏好影响外,还会明显地受到兴趣点自身的流行度、社会关系和全局权威专家的影响。然而,项目流行度大都不能真正地反映项目自身流行度,如火车站是经常被访问的兴趣点,流行度偏高,但并不是用户在某个时刻想真正访问的兴趣点。来自社会关系的影响,事实上,用户在某个时间段签到的偏好不相同,那么所信任的朋友在每个时间段也不相同。比如,在就餐时,他会信任在餐馆推荐方面比较有经验的朋友,在运动时,他会信任热爱运动的朋友。另外,已有研究中,关于权威专家的定义也不精准。现有技术中的推荐方法导致兴趣点推荐的结果让人不是很满意。
发明内容
本发明实施例提供了基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法,可以解决现有技术中存在的问题。
本发明提供了基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法,其特征在于,包括以下步骤:
步骤1,采集用户签到行为数据并进行预处理;
步骤2,按照等时段划分用户签到行为数据集合,得到多个子集;
步骤3,依据TpCsSce-PPR模型对用户的签到行为数据子集进行深层语义特征分析,包括以下子步骤:
子步骤3.1,根据签到行为数据子集计算兴趣点的真流行度;
子步骤3.2,根据签到行为数据子集建立相似类别专家;
子步骤3.3,根据签到行为数据子集计算基于相似兴趣的相似度;
子步骤3.4,根据所述真流行度、相似类别专家、基于相似兴趣的相似度建立TpCsSce-PPR模型;
步骤4,使用随机梯度下降方法优化TpCsSce-PPR模型,并进行参数更新,根据更新后的用户集合和兴趣点集合,计算可观察签到矩阵。
相对于现有技术,本发明的优点在于:
1、本发明中的周期兴趣点推荐模型TpCsSce-PPR融合兴趣点真流行度、基于用户兴趣类别专家和用户信任的双隐式信任机制,基于矩阵分解技术,时间因子也被引入周期兴趣点推荐模型中,把兴趣点真流行度、用户兴趣类别专家和用户信任的朋友的双隐式信任机制当作矩阵分解的正则化项。
2、引入了某一时间段下,相似类别专家和用户信任的朋友的判定方法。当一个用户在某一时间段准备访问属于一个特定类别的兴趣点时,来自相似类别专家和此用户信任的朋友的建议是非常有参考价值的。时间滑动窗口的划分长度将会影响周期兴趣点推荐模型的结果,因此,时间滑动窗口的划分长度被反复训练以找到一个更为合适的划分值。
3、提出了一种项目真流行度的概念。已有的研究所提出的项目流行度的概念太过模糊,只考虑被频繁访问的项目。事实上,被频繁访问的项目不一定是真正流行的项目,访问次数很少的项目也不一定是不流行的项目。因此,提出了一种项目真流行度的判定方法。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法的流程图;
图2为潜在因子K的维度影响分析图;
图3为Foursquare数据集上参数α和γ对推荐性能的影响图;
图4为Gowalla数据集上参数α和γ对推荐性能的影响图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在介绍本发明的详细技术方案之前,首先提出以下几个定义:
定义1:周期兴趣点推荐。周期兴趣点推荐是指在某一时间段t∈T,把用户u最想访问的兴趣点推荐给u,并且,所推荐的兴趣点不在
Figure BDA0001951473640000041
内。
定义2:签到矩阵。兴趣点签到矩阵是一个|U|×|T|×|P|的立方体,其中,|U|是用户数、|T|是时间槽数目、|P|是兴趣点数目。兴趣点评分rutp表示用户u在时间段t期间是否访问了兴趣点p。U和P分别是基于位置的社会网络中的用户集合和兴趣点集合。需要注意的是,兴趣点签到矩阵中的大多数条目都是零,因为用户只访问了基于位置的社会网络中非常少的兴趣点。
定义3:社交关系矩阵。给定用户之间的社会关系,构造一个社会关系矩阵S|U|×|U|,其中,如果两个不同的用户ui和uj存在社会关系,
Figure BDA0001951473640000042
uj∈Fi,否则,
Figure BDA0001951473640000051
定义4:类别偏置矩阵。已有用户和兴趣点的历史签到数据和兴趣点的类别,类别偏置矩阵B|U|×|C|被构建,矩阵中的每一个元素Bu,c表示用户u访问属于类别c∈C的兴趣点的频率。C是兴趣点类别的全集,常常在基于位置的社会网络下被定义。需要强调的是一个兴趣点可以属于多个类别。
定义5:相似类别专家。用户ui的相似类别专家是与用户ui在时间槽t有共同签到类别的专家用户集合,来自这些类别专家的建议是可信的和权威的。
Figure BDA0001951473640000052
存储着时间t内,与用户ui有着相似签到类别的用户集合。在基于位置的社会网络下,设定一个正整数k>0,集合
Figure BDA0001951473640000053
被规定是前k个相似类别专家节点,当且仅当
Figure BDA0001951473640000054
是离散优化问题的解。
Figure BDA0001951473640000055
其中,
Figure BDA0001951473640000056
是与用户ui有着相似类别的专家的影响。
定义6:用户ui在时刻t信任的用户。在基于位置的社会网络下,用户ui在不同的时刻t,签到行为和爱好有着明显的区别,因此,用户ui在不同时刻信任用户可能不相同。比如,在早上6:00-9:00,用户主要吃早餐,那么他所信任的用户是能够推荐质量好的早餐的用户。在上午10:00-2:00,用户主要工作,那么他所信任的人是能够提供推荐工作地点周围兴趣点的用户。基于这种思想,用户ui在时刻t信任的用户的定义如下:
Figure BDA0001951473640000057
其中,
Figure BDA0001951473640000058
表示推荐的前k个用户中,时刻t内用户信任的用户集合,
Figure BDA0001951473640000059
表示时刻t内,用户信任的用户集合
Figure BDA00019514736400000510
中的用户对目标用户ui的影响。
定义7:兴趣点真流行度。在基于位置的社会网络下,已有的兴趣点流行度被定义为用户在此兴趣点签到次数越多,此兴趣点越流行。事实上,并非如此。例如,火车站是用户签到最多的地方,但不是值得推荐给用户真正流行的项目。相反,刚刚开业几天的餐馆,几天内就有了一些签到,尽管相比于火车站的签到少,但此餐馆也是值得可以推荐的兴趣点。因此,提出项目真流行度的定义。定义一个正整数k>0,集合
Figure BDA0001951473640000061
表示前k个真正流行的兴趣点,当且仅当
Figure BDA0001951473640000062
是离散优化问题的解。
Figure BDA0001951473640000063
其中,f(POItrue)是前k个真正流行的兴趣点对目标用户的影响。
参照图1,本发明提供了基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法,包括以下步骤:
步骤1,采集用户签到行为数据并进行预处理,本发明中用户签到行为数据来自两个目前广泛使用的基于位置的社会网络媒体网站Foursquare和Gowalla;
步骤2,按照等时段划分用户签到行为数据集合,得到多个子集。划分时间段时,为了更为细致地研究用户签到行为,按小时进行划分研究用户签到行为变化情况。
步骤3,依据TpCsSce-PPR模型对用户的签到行为进行深层语义特征分析。依据用户的当前所在的时间段信息,构建能够为用户签到行为提供帮助的项目真流行度因素与双隐式信任影响因素,把项目真流行度因素与双隐式信任影响因素作为正则化项融合到传统的低秩矩阵分解中。
具体包括以下子步骤:
子步骤3.1,定义项目流行度与浏览过该项目的用户数量成正比,在计算每个项目的流行度时,进行行向量标准化。本发明定义兴趣点真流行度会随着兴趣点被用户签到次数的增加成正比增加,但同时会随着它被用户签到的频率成反比下降。PF表示兴趣点Pi被用户签到的频率,表示此兴趣点被用户签到的总数与所有兴趣点被签到总数的比值。IPF表示反兴趣点频率,以总用户数目除以包含该签到兴趣点用户的数目,再将得到的商取对数得到:
Figure BDA0001951473640000071
在公式(4)求解兴趣点真流行度的基础之上,为了兼顾兴趣点的新颖度,即刚建立不久的兴趣点,尽管签到总数没有一些建立很久的兴趣点签到次数多,但是在单位时间段内,此兴趣点的签到次数多于老兴趣点,说明此兴趣点流行度高于老兴趣点。因此,兴趣点的新颖度定义如下:
Figure BDA0001951473640000072
在公式(5)中,兴趣点新颖度采用Sigmoid函数进行计算。其中,|Ui|表示签到此兴趣点的用户总数,tNew表示目标用户需要兴趣点推荐的当前时间,tStart表示用户兴趣点的建立时间,|tNew-tStart|表示兴趣点从开始建立到用户签到的时间段。综合公式(4)和公式(5),得到兴趣点在t时刻的真正流行度,表示如下:
POITrue=POIThe-first-true×POINovelty (6)
子步骤3.2,在时间段t内,对于用户ui签到的每一个类别,计算所有用户的兴趣类别权重u.wch,然后选择具有前K个值的用户作为用户ui的类别专家。对于获得的相似类别专家,计算用户ui和相似类别专家在时间段t的相似度,计算公式如下:
Figure BDA0001951473640000073
其中,
Figure BDA0001951473640000074
表示用户ui已访问的兴趣点,
Figure BDA0001951473640000075
表示相似类别专家uq已签到的兴趣点。采用Wiq∈Rm×m表示用户之间的兴趣相似度。
步骤3.3,定义在时间段t,基于共同评分项目数量的相似度使用如下的Jaccard相似度系数公式进行表示:
Figure BDA0001951473640000081
其中,
Figure BDA0001951473640000082
表示被用户ui和用户ul共同评分的项目集合,
Figure BDA0001951473640000083
表示用户ui和用户ul评分项目的总数。
Jaccard相似度系数只考虑用户共同评分项目数,没有考虑用户详细的评分分数和用户的具体评分偏好。因此,为了弥补Jaccard相似度系数的不足,在时间段t采取Pearson相关系数计算用户ui和ul之间的评分相似度。
Figure BDA0001951473640000084
其中,Il∈I(ui)∩I(ul)表示被用户ui和ul共同评分的项目集合,
Figure BDA0001951473640000085
Figure BDA0001951473640000086
分别表示用户ui和ul的平均评分。
综上所述,考虑在时间段t下,来自与用户ui有着共同评分用户的影响和用户之间的评分相似度影响,用户ui对ul的基于相似兴趣的信任度表示如下:
sim(ui,ul)TS=sim(ui,ul)Jaccard*sim(ui,ul)Pearson (10)
子步骤3.4,用户-兴趣点签到矩阵R划分为T={t1,t2,...,t|T|}个时间段子矩阵Rt,每一个子矩阵包含对应时间段的用户签到行为。在某一时间段下用户的签到评分Rt被分解为用户特征Ut∈Rm×k和兴趣点特征P∈Rk×n,由于用户签到行为会随时间t变化而发生变化,定义为Ut,兴趣点特征P被t时间段所有用户共享,定义为P。每一个签到类别Ct被分解为相似类别专家集合SCE和用户签到爱好Ut。依据之前描述的用户签到行为的时序敏感性分析,能够观察到用户的签到行为呈周期性变化。用户在一天的不同时间有着不同的签到偏好,也就说用户的签到行为是时间依赖的。通过估计用户在每一个时序状态t下的签到活动,获得时间依赖的用户签到偏好,其优化公式如下:
Figure BDA0001951473640000091
其中,由于用户的签到行为呈周期性变化,把用户-兴趣点签到矩阵R划分为T={t1,t2,…t|T|}个时间段子矩阵Rt,每一个子矩阵包含对应时间段的用户签到行为。在某一时间段下用户的签到评分Rt被分解为用户特征Ut∈Rm×k和兴趣点特征P∈Rk×n,m表示用户数,n表示兴趣点的数目,由于用户签到行为会随时间t变化而发生变化,定义为Ut,兴趣点特征P被t时间段所有用户共享,定义为P。每一个签到类别Ct被分解为相似类别专家集合SCE和用户签到爱好Ut
Figure BDA0001951473640000092
表示用户在时序状态t下的签到活动,
Figure BDA0001951473640000093
是在时间段t下的显示函数,α、β和γ均为正则化参数,STU为用户信任的朋友集合,Wiq表示用户和相似类别专家的相似度,sim(ui,ul)TS表示用户ui对ul的基于相似兴趣的相似度。需要注意的是,本发明考虑当t=1时,Ut-1=UT。把用户所具有的双隐式信任关系集合(包含相似类别专家集合SCE和用户信任的朋友集合STU)融合到基于时序周期变化的矩阵分解模型中,公式(11)的第二项表示在时刻t下,从社会网络的全局角度考虑相似类别专家对用户评分的影响,第三项表示在时刻t下,从社会网络的局部角度考虑用户自身信任的朋友对用户评分的影响。这两种方法对于处理推荐系统的冷启动问题特别有效,尤其是处理新用户问题。公式的第二项和第三项使新用户的隐特征向量与其相似类别专家和其信任的朋友的隐特征向量尽可能接近,从而可以间接地学习新用户的隐特征向量。
在公式(11)的基础上,加上项目真流行度正则化项,进一步完善基于矩阵分解的推荐方法的目标函数如下:
Figure BDA0001951473640000101
其中,λ是一个正则化参数,控制兴趣点真流行度的影响程度,POITrue是本发明研究中所定义的兴趣点真流行度值,λ值越大或者POITrue值越大,都表示兴趣点真流行度对目标用户的签到影响越大。
值得强调的是,在基于位置的社会网络下,用户在某个兴趣点签到,说明用户与这个兴趣点之间存在物理交互。依据访问成本和Tobler的第一定理学法则,用户往往访问当前所在位置周围较近的兴趣点。因此,非常有必要把地域影响因子作为正则化项融合到矩阵分解中。在公式(12)的基础上,加上地域影响因子正则化项,进一步完善基于矩阵分解的推荐方法的目标函数如下:
Figure BDA0001951473640000102
其中,τ是一个正则化参数,控制地域影响影响程度,sim(lg,li)表示兴趣点lg与兴趣点lj之间的相似度,N(lj)表示与兴趣点lj相似的兴趣点集合。使用高斯函数定义兴趣点lg与兴趣点lj之间的相似度sim(lg,lj):
Figure BDA0001951473640000111
其中,xj和xg分别表示兴趣点lj与兴趣点lg的地理坐标向量,δ为常数,设置δ=0.1。公式(14)表示两个兴趣点的距离越近,它们的相似度越小。
步骤4,使用随机梯度下降方法优化TpCsSce-PPR模型,并进行参数估计。
采用随机梯度下降方法对目标函数进行优化。如何计算梯度是随机梯度下降方法中最为重要的一步,每一步的更新采用如下公式执行:
Figure BDA0001951473640000112
其中,ξ是学习率,Λ表示所有涉及的模型参数,
Figure BDA0001951473640000113
对应于等式(12)所示的目标函数。为了获得等式(15)中关于Ui和Pj的梯度,可以通过执行随机梯度下降方法计算目标函数的局部最小值。有关Ui的梯度
Figure BDA0001951473640000114
计算如下:
Figure BDA0001951473640000115
因此,Ui被更新为:
Figure BDA0001951473640000116
有关Pj的梯度
Figure BDA0001951473640000117
被计算如下:
Figure BDA0001951473640000118
Pj被更新为:
Figure BDA0001951473640000121
根据更新后的用户集合和兴趣点集合,计算可观察签到矩阵
Figure BDA0001951473640000122
根据该可观察签到矩阵即可确定需要推荐的兴趣点。
算法复杂度分析
下面讨论TpCsSce-PPR周期兴趣点推荐模型的时间复杂度。整体复杂度通过计算矩阵分解模型和执行三个子算法:算法1、算法2和算法3来确定。由于子算法1、子算法2和子算法3都是执行的离线计算,因此,不考虑这三个算法的时间复杂度和计算开销。TpCsSce-PPR模型的时间复杂度主要考虑在线计算矩阵分解模型的成本,计算矩阵分解模型的成本主要用来学习隐特征向量。设用户-兴趣点签到矩阵R中,每个用户平均可观测到的签到数量为
Figure BDA0001951473640000127
每个兴趣点平均可观测的被签到数量为
Figure BDA0001951473640000128
在随机梯度下降方法的迭代中,对于所有用户而言,计算
Figure BDA0001951473640000123
的复杂度为
Figure BDA0001951473640000124
对于所有兴趣点而言,计算
Figure BDA0001951473640000125
的复杂度为
Figure BDA0001951473640000129
其中,K为潜在因子维度数,T为所划分的时间段数目。因此,TpCsSce-PPR的总的时间复杂度为
Figure BDA0001951473640000126
由于用户-兴趣点签到矩阵非常稀疏,所以,TpCsSce-PPR模型的在线计算时间复杂度与用户数目和兴趣点数量近乎呈线性关系。
实验结果与分析
下面阐述如何通过实验验证TpCsSce-PPR模型的有效性。首先,描述所使用的两个真实数据集,引入了评价指标和用于比较的基准方法,并通过实验分析选择最优的参数设置。为验证TpCsSce-PPR模型融入项目真流行度、相似类别专家和用户信任的用户能够提高周期兴趣点推荐的性能,把TpCsSce-PPR模型与所选择的基准方法进行了比较分析
实验数据集
本发明使用两个公开可用的大规模签到数据集,爬取了从2011年1月至2011年7月时间段Foursquare上的真实数据和2009年2月至2010年10月期间Gowalla上的数据。Gowalla是一个与Foursquare功能相似的基于位置的社会网络服务平台,通过在兴趣点上签到,让用户知道自己朋友的所在位置,在朋友间分享地点、活动、旅行线路等信息。Gowalla在2007年成立,于2012年已关闭。
Foursquare数据集和Gowalla数据集的统计信息如表1所示。在数据预处理阶段,把每个数据集依据签到时间分为训练集和测试集,在实际操作时,本发明使用过去的签到数据去预测未来的签到事件。
表1 Foursquare和Gowalla两个真实数据集的统计信息
Figure BDA0001951473640000131
数据集中的每一个签到记录包括用户ID、位置ID、签到频率和用户每次签到的时间戳。详细的用户信息和兴趣点信息也被包含在内。本发明过滤掉少于10次的签到用户、移除签到时间间隔大于12小时的兴趣点。因为,对于签到时间间隔大于12小时的兴趣点,这些兴趣点可能会被丢失或者可能偏离结果,因此,签到时间间隔大于12小时的兴趣点应该被滤除掉。执行上述过滤过程之后,数据集的详细统计信息如表1所示。
把训练集和测试集按如下程序划分:对于每一个用户,首先根据签到时间戳对签到记录排序,然而分别选择前60%和90%作为训练集来训练模型。也就是说,从数据集中选择已存在兴趣点签到记录的前60%作为训练数据集,去训练兴趣点推荐模型,用训练出的模型去预测剩余40%的兴趣点签到记录。同理,选择前90%的数据作为训练集来训练模型,然后使用训练出的模型去预测剩余10%的兴趣点签到记录。本发明在训练集上执行五折交叉验证来设置相应的参数。
实验设置
在TpCsSce-PPR模型中,有五个重要的参数α、γ、λ、τ和β,其中,α控制着相似兴趣类别专家对周期兴趣点推荐的影响,γ控制着用户信任的朋友对周期兴趣点推荐的影响,λ约束着兴趣点真流行度对周期兴趣点推荐的影响,τ则控制着地域范围对周期兴趣点推荐的影响,β是一个避免过拟合的正则化参数。关于相关的参数设置,初始学习率ξ被设置为0.001。执行一些验证实验来确定参数K、α和γ的最合适的值,潜在因子维度K在Foursquare数据集上被设置为25,在Gowalla数据集上被设置为20。参数α在Foursquare数据集上设置为0.5,在Gowalla数据集上设置为0.1,γ不管是在Foursquare数据集上,还是在Gowalla数据集上都设置为0.01。在下面将详细介绍如何选择最优的K值、α值和γ值。
对比方法
为了验证所提出的TpCsSce-PPR模型的有效性,将TpCsSce-PPR模型与以下三种基准方法进行比较:
(1)基础矩阵分解模型(BasicMF):传统的低秩矩阵分解模型仅仅考虑用户自身的偏好,没有考虑来自外在因素,如社会、时间和地理因素的影响。
(2)融合社会正则化项的概率矩阵分解模型(PMFSR):在传统概率矩阵分解模型的基础上,融入社会化影响,此模型不仅考虑用户自身的偏好对兴趣点推荐的影响,还考虑社会化因素对兴趣点推荐的影响。
(3)时间感知的兴趣点推荐(TPOI-Rec):TPOI-Rec模型强调,由于用户通常在一天的不同时间访问不同的兴趣点,因此,时间在兴趣点推荐模型中扮演着一个非常重要的角色。TPOI-Rec模型是一种融合时间信息的协同推荐模型,能够在一天的某一具体时间为给定用户推荐不同的兴趣点。
除了以上三种基准推荐方法外,为了验证所提出的周期兴趣点推荐模型TpCsSce-PPR的性能,分别只考虑本发明所提出的一种外在影响因素下的周期兴趣点推荐:
(4)基于项目真流行度的周期兴趣点推荐(TP-PPR):在时间段t,基于项目真流行度的周期兴趣点推荐只考虑兴趣点的绝对流行度和兴趣点的新颖度对周期兴趣点推荐的影响,即只考虑兴趣点真流行度的影响。
(5)基于双隐式信任机制影响的周期兴趣点推荐(CsSce-PPR):在时间段t,基于双隐式信任机制影响的周期兴趣点推荐,只考虑来自与目标用户签到类别相似的类别专家和目标用户信任的朋友的影响,即只考虑双隐式信任机制的影响。
潜在因子K的维度影响
在实验数据集上,验证潜在因子K的维度对推荐预测性能影响时,预设置α=γ=λ=τ=β=0.01,初始学习率ξ=0.01,与潜在因子K的维度有关的TpCsSce-PPR模型的性能变化如图2所示。图2中,(a)为Foursquare数据集上MAE值的变化,(b)为Foursquare数据集上RMSE值的变化,(c)为Gowalla数据集上MAE值的变化,(d)为Gowalla数据集上RMSE值的变化。
其中,x轴表示潜在因子K的维度变化。如图2中(a)和(b)所示,在Foursquare数据集上,TpCsSce-PPR模型所对应的MAE值和RMSE值从K=10到K=25首先减少,然后MAE值和RMSE值从K=25时开始增加。因此,当K=25时,MAE值和RMSE值在Foursquare数据集上获得最优性能。如图2中(c)和(d)所示,在Gowalla数据集上,TpCsSce-PPR模型所对应的MAE值和RMSE值从K=10到K=20首先减少,然后MAE值和RMSE值从K=20时开始增加。因此,当K=20时,MAE值和RMSE值在Gowalla数据集上获得最优性能。所以,在Foursquare数据集上,K=25;在Gowalla数据集上,K=20。
参数α和γ的影响
下面主要研究α和γ参数对TpCsSce-PPR周期兴趣点推荐性能的影响。在Foursquare数据集上,潜在因子K的维度K=25,设置λ=τ=β=0.01;在Gowalla数据集上,潜在因子K的维度K=20,设置λ=τ=β=0.01;设置初始学习率ξ=0.01。α的值在{0.01,0.05,0.1,0.5,1}范围中选取,γ的值在{0.001,0.01,0.1,1}范围中选取。实验结果如图3和图4所示,图3中(a)为60%训练数据集上MAE值的变化,(b)为60%训练数据集上RMSE值的变化,(c)为90%训练数据集上MAE值的变化,(d)为90%训练数据集上RMSE值的变化。图4中(a)为60%训练数据集上MAE值的变化,(b)为60%训练数据集上RMSE值的变化,(c)为90%训练数据集上MAE值的变化,(d)为90%训练数据集上RMSE值的变化。
从图3和图4可知,参数α和γ分别控制着TpCsSce-PPR模型融入相似类别专家信息和用户信任的用户的程度,在TpCsSce-PPR模型中起着非常重要的作用。在极端的情况下,如果α值或者γ值非常小,TpCsSce-PPR模型就简化为只考虑某一地域下和某一时间周期内项目真流行度和用户自身偏好对兴趣点推荐的影响。另一方面,如果α或者γ值非常大,对其他用户的双隐式信任将会影响整个学习过程。从图3和4中发现,不管使用哪一训练集,随着α和γ的增加,MAE和RMSE的值首先减少,当α降到在Foursquare数据集上值为0.5时,在Gowalla数据集上值为0.1时,γ降到在两个数据集上都为0.01时,MAE和RMSE的值随后将会增加。因此,在Foursquare数据集上,当α=0.5,γ=0.01时,在时间段t,来自双隐式信任机制的影响达到最优状态。在Gowalla数据集上,当α=0.1,γ=0.01时,在时间段t,来自双隐式信任机制的重影响达到最优状态。
对比实验
TpCsSce-PPR模型与其它基准方法在评价指标MAE和RMSE上的实验对比结果分别如表2和表3所示。其中,表2是在Foursquare数据集上的实验对比结果,表3是在Gowalla数据集上的实验对比结果。
表2 Foursquare数据集上各种推荐方法的预测推荐性能比较
Figure BDA0001951473640000171
表3 Gowalla数据集上各种推荐方法的预测推荐性能比较
Figure BDA0001951473640000172
从表2和表3可以发现,首先,TpCsSce-PPR、CsSce-PPR和TP-PPR比其它方法获得更好的性能,表明在传统矩阵分解模型中融入时序影响、项目真流行度的影响和双隐式信任影响确实能够提高兴趣点推荐的性能。CsSce-PPR模型性能优于TP-PPR,主要原因是某一时刻在用户可达的地理区域下,来自相似类别专家和用户信任的用户的推荐比项目真流行度更符合用户的兴趣爱好。除此之外,TpCsSce-PPR模型优于PMFSR模型和传统的矩阵分解模型BasicMF,因为在某一时间段下,融入时序因素、双隐式信任机制影响因素和项目真流行度比仅仅考虑社会关系影响和用户自身偏好有明显的提升效果。总之,TpCsSce-PPR模型与基准方法BasicMF、PMFSR和TPOI-Rec相比较,TpCsSce-PPR模型在评价指标MAE和RMSE上获得最好的性能。
从实验对比结果还可以观察到,TpCsSce-PPR模型在两个数据集上的实验结果一直优于其它方法。并且,在Foursquare数据集上的所有方法的MAE值和RMSE值要优于在Gowalla数据集上的相应方法的MAE值和RMSE值,这是因为所采集的Gowalla数据集要比Foursquare数据集稀疏。
时间间隔长度的影响
在周期兴趣点推荐中,时间间隔的长度控制着时序推荐的时间粒度。时间间隔越大意味着推荐结果越缺少时间感知。为了研究时间间隔长度对兴趣点推荐的影响,在60%的Foursquare训练数据集上,通过调节不同的时间间隔长度得到不同的MAE值和RMSE值,如表4所示。
表4 Foursquare数据集上不同时间间隔长度对预测结果的影响
Figure BDA0001951473640000181
Figure BDA0001951473640000191
在60%的Gowalla训练数据集上,通过调节不同的时间间隔长度得到不同的MAE值和RMSE值,如表5所示。
表5 Gowalla数据集上不同时间间隔长度对预测结果的影响
Figure BDA0001951473640000192
从表4和表5可以观察到,从时间间隔为1小时开始,随着时间间隔长度的增加,所有模型的MAE值和RMSE值先减少,然后在时间间隔为3小时之后,MAE值和RMSE值又增加。存在此现象的原因是,MAE值和RMSE值先增加是因为增加的时间间隔长度使数据在一个时间间隔内更为稠密。当时间间隔长度在两个数据集上为3个小时时,所有的方法获得了最好的性能。当时间间隔长度大于3小时时,尽管在一个时间间隔内的数据更为稠密,但是,因为时间间隔长度过长大大减少了时序的影响,越来越接近于传统的兴趣点推荐,一定程度上降低了周期兴趣点推荐模型预测的准确率。所提出的TpCsSce-PPR周期兴趣点推荐模型在MAE和RMSE指标上一直具有最好的性能。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (3)

1.基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法,其特征在于,包括以下步骤:
步骤1,采集用户签到行为数据并进行预处理;
步骤2,按照等时段划分用户签到行为数据集合,得到多个子集;
步骤3,依据TpCsSce-PPR模型对用户的签到行为数据子集进行深层语义特征分析,包括以下子步骤:
子步骤3.1,根据签到行为数据子集计算兴趣点的真流行度;
子步骤3.1具体包括:
PF表示兴趣点Pi被用户签到的频率,表示此兴趣点被用户签到的总数与所有兴趣点被签到总数的比值,IPF表示反兴趣点频率,以基于位置的社会网络中的用户集合U的数目除以包含该签到兴趣点用户Ui的数目,再将得到的商取对数得到:
Figure FDA0002830686470000011
兴趣点的新颖度定义如下:
Figure FDA0002830686470000012
其中,|Ui|表示签到此兴趣点的用户总数,tNew表示目标用户需要兴趣点推荐的当前时间,tStart表示用户兴趣点的建立时间,|tNew-tStart|表示兴趣点从开始建立到用户签到的时间段,综合公式(1)和公式(2),得到兴趣点在t时刻的真流行度,表示如下:
POITrue=POIThe-first-true×POINovelty (3);
子步骤3.2,根据签到行为数据子集建立相似类别专家;
子步骤3.3,根据签到行为数据子集计算基于相似兴趣的相似度;
子步骤3.4,根据所述真流行度、相似类别专家、基于相似兴趣的相似度建立TpCsSce-PPR模型;
子步骤3.4中建立的TpCsSce-PPR模型为:
Figure FDA0002830686470000021
其中,P表示基于位置的社会网络中的兴趣点集合,
Figure FDA0002830686470000022
表示用户在时序状态t下的签到活动,
Figure FDA0002830686470000023
是在时间段t下的显示函数,α、β和γ均为正则化参数,SCE为相似类别专家集合,STU为用户信任的朋友集合,T表示划分用户签到行为数据集合得到子集数量,m表示用户数,n表示兴趣点数量,Pj表示兴趣点特征,Ciq表示签到类别,Wiq表示用户和相似类别专家的相似度,sim(ui,ul)TS表示用户ui对ul的基于相似兴趣的相似度;
在公式(4)的基础上,加上项目真流行度正则化项,进一步完善基于矩阵分解的推荐方法的目标函数如下:
Figure FDA0002830686470000024
其中,λ是正则化参数,控制兴趣点真流行度的影响程度,POITrue是兴趣点真流行度值,λ值越大则POITrue值越大;
在公式(5)的基础上,加上地域影响因子正则化项,进一步完善基于矩阵分解的推荐方法的目标函数如下:
Figure FDA0002830686470000031
其中,τ是正则化参数,控制地域影响程度,sim(lg,lj)表示兴趣点lg与兴趣点lj之间的相似度,N(lj)表示与兴趣点lj相似的兴趣点集合,使用高斯函数定义兴趣点lg与兴趣点lj之间的相似度sim(lg,lj):
Figure FDA0002830686470000032
其中,xj和xg分别表示兴趣点lj与兴趣点lg的地理坐标向量,δ为常数,公式(7)表示两个兴趣点的距离越近,它们的相似度越小;
步骤4,使用随机梯度下降方法优化TpCsSce-PPR模型,并进行参数更新,根据更新后的用户集合和兴趣点集合,计算可观察签到矩阵,根据该可观察签到矩阵确定推荐给用户的兴趣点。
2.如权利要求1所述的基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法,其特征在于,子步骤3.2具体包括:在时间段t内,对于用户签到的每一个类别,计算所有用户的兴趣类别权重u.wch,然后选择具有前K个值的用户作为用户ui的相似类别专家,对于获得的相似类别专家,计算用户ui和相似类别专家在时间段t的相似度,计算公式如下:
Figure FDA0002830686470000041
其中,
Figure FDA0002830686470000042
表示用户ui已访问的兴趣点,
Figure FDA0002830686470000043
表示相似类别专家uq已签到的兴趣点,|P|表示兴趣点总数量。
3.如权利要求1所述的基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法,其特征在于,子步骤3.3具体包括:定义在时间段t,基于共同评分项目数量的相似度使用如下的Jaccard相似度系数公式进行表示:
Figure FDA0002830686470000044
其中,
Figure FDA0002830686470000045
表示被用户ui和用户ul共同评分的项目集合,
Figure FDA0002830686470000046
表示用户ui和用户ul评分项目的总数;
在时间段t采取Pearson相关系数计算用户ui和ul之间的评分相似度:
Figure FDA0002830686470000047
其中,Il∈I(ui)∩I(ul)表示被用户ui和ul共同评分的项目集合,
Figure FDA0002830686470000048
Figure FDA0002830686470000049
分别表示用户ui和ul的平均评分,
Figure FDA00028306864700000410
Figure FDA00028306864700000411
分别表示用户ui和ul的评分;
在时间段t下,来自与用户ui有着共同评分用户的影响和用户之间的评分相似度影响,用户ui对ul的基于相似兴趣的相似度表示如下:
sim(ui,ul)TS=sim(ui,ul)Jaccard*sim(ui,ul)Pearson (11)。
CN201910053067.4A 2019-01-21 2019-01-21 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法 Active CN109508428B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910053067.4A CN109508428B (zh) 2019-01-21 2019-01-21 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910053067.4A CN109508428B (zh) 2019-01-21 2019-01-21 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法

Publications (2)

Publication Number Publication Date
CN109508428A CN109508428A (zh) 2019-03-22
CN109508428B true CN109508428B (zh) 2021-03-12

Family

ID=65758251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910053067.4A Active CN109508428B (zh) 2019-01-21 2019-01-21 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法

Country Status (1)

Country Link
CN (1) CN109508428B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110119424A (zh) * 2019-04-02 2019-08-13 天津大学 基于圆桌流感算法的稀疏信任挖掘方法
CN110674344B (zh) * 2019-08-28 2022-03-08 北京爱奇艺智慧娱乐科技有限公司 生成模型及推荐影片的方法、装置、设备及存储介质
CN110874437B (zh) * 2019-11-14 2023-06-16 重庆邮电大学 一种基于多重兴趣点对排序的个性化兴趣点推荐方法
EP3901884A1 (en) 2020-04-24 2021-10-27 Naver Corporation Object recommendation using ambient mindsets
CN111680228B (zh) * 2020-06-11 2022-03-18 浙江工商大学 基于地理位置融合和类别流行度的兴趣点推荐方法
CN111708952B (zh) * 2020-06-18 2023-10-20 小红书科技有限公司 一种标签推荐方法及系统
CN112182395B (zh) * 2020-10-10 2023-08-29 深圳市万佳安物联科技股份有限公司 一种基于时间序列的金融服务个性化推荐装置和方法
US11477603B2 (en) 2021-03-03 2022-10-18 International Business Machines Corporation Recommending targeted locations and optimal experience time
CN115587250A (zh) * 2022-05-25 2023-01-10 张伟斌 用于大数据挖掘的用户兴趣分析方法及云端ai部署系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095841A (zh) * 2016-06-05 2016-11-09 西华大学 一种基于协同过滤的移动互联网广告推荐方法
CN106126615A (zh) * 2016-06-22 2016-11-16 苏州大学 一种兴趣点推荐的方法及系统
CN106570090A (zh) * 2016-10-20 2017-04-19 杭州电子科技大学 基于兴趣变化和信任关系的协同过滤推荐方法
CN107633100A (zh) * 2017-10-23 2018-01-26 苏州大学 一种基于嵌入模型的兴趣点推荐方法及装置
CN108256093A (zh) * 2018-01-29 2018-07-06 华南理工大学 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090210246A1 (en) * 2002-08-19 2009-08-20 Choicestream, Inc. Statistical personalized recommendation system
KR20110070057A (ko) * 2009-12-18 2011-06-24 한국전자통신연구원 자연어 기반 여행 추천 장치 및 방법
US8719198B2 (en) * 2010-05-04 2014-05-06 Microsoft Corporation Collaborative location and activity recommendations
CN103020308A (zh) * 2013-01-07 2013-04-03 北京趣拿软件科技有限公司 旅游攻略项目的推荐方法及装置
CN104537027B (zh) * 2014-12-19 2019-05-10 百度在线网络技术(北京)有限公司 信息推荐方法及装置
CN105635309A (zh) * 2016-01-19 2016-06-01 南京航空航天大学 基于移动云位置隐私保护的推荐系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095841A (zh) * 2016-06-05 2016-11-09 西华大学 一种基于协同过滤的移动互联网广告推荐方法
CN106126615A (zh) * 2016-06-22 2016-11-16 苏州大学 一种兴趣点推荐的方法及系统
CN106570090A (zh) * 2016-10-20 2017-04-19 杭州电子科技大学 基于兴趣变化和信任关系的协同过滤推荐方法
CN107633100A (zh) * 2017-10-23 2018-01-26 苏州大学 一种基于嵌入模型的兴趣点推荐方法及装置
CN108256093A (zh) * 2018-01-29 2018-07-06 华南理工大学 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于潜在地理——社会关系感知的兴趣点推荐研究;崔琳 等;《宿州学院学报》;20170930;第32卷(第9期);96-102 *

Also Published As

Publication number Publication date
CN109508428A (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
CN109508428B (zh) 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法
Christensen et al. Social group recommendation in the tourism domain
Aditya et al. A comparative analysis of memory-based and model-based collaborative filtering on the implementation of recommender system for E-commerce in Indonesia: A case study PT X
CN108920503A (zh) 一种基于社交网络信任度的微视频个性化推荐算法
Li et al. Next and next new POI recommendation via latent behavior pattern inference
CN109460520B (zh) 基于地理-社会关系与深隐式兴趣挖掘的兴趣点推荐方法
Eliyas et al. Recommendation systems: Content-based filtering vs collaborative filtering
Li et al. Learning recency based comparative choice towards point-of-interest recommendation
CN106708953A (zh) 基于离散粒子群优化的局部社区检测协同过滤推荐方法
CN109471982B (zh) 一种基于用户和服务聚类QoS感知的Web服务推荐方法
CN116244513B (zh) 随机群组poi推荐方法、系统、设备及存储介质
CN104239496A (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN104766219B (zh) 基于以列表为单位的用户推荐列表生成方法及系统
Braunhofer et al. Contextual information elicitation in travel recommender systems
Wu et al. A new similarity computation method in collaborative filtering based recommendation system
CN110990717B (zh) 一种基于跨域关联的兴趣点推荐方法
Dong et al. Research of hybrid collaborative filtering algorithm based on news recommendation
Zhang et al. A trust-enriched approach for item-based collaborative filtering recommendations
Zhao et al. GT-SEER: geo-temporal sequential embedding rank for point-of-interest recommendation
CN109684561B (zh) 基于用户签到行为变化的深层语义分析的兴趣点推荐方法
CN107909498B (zh) 基于最大化接受者操作特征曲线下方面积的推荐方法
CN115408618B (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法
Elahi Empirical evaluation of active learning strategies in collaborative filtering
Ito et al. A study on improvement of serendipity in item-based collaborative filtering using association rule
Zhang Improving recommender systems with rich side information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant