CN109684561B - 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 - Google Patents
基于用户签到行为变化的深层语义分析的兴趣点推荐方法 Download PDFInfo
- Publication number
- CN109684561B CN109684561B CN201811578531.3A CN201811578531A CN109684561B CN 109684561 B CN109684561 B CN 109684561B CN 201811578531 A CN201811578531 A CN 201811578531A CN 109684561 B CN109684561 B CN 109684561B
- Authority
- CN
- China
- Prior art keywords
- user
- interest
- time
- sign
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008859 change Effects 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000006399 behavior Effects 0.000 claims description 71
- 239000011159 matrix material Substances 0.000 claims description 22
- 230000000737 periodic effect Effects 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 20
- 230000001052 transient effect Effects 0.000 claims description 11
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000003542 behavioural effect Effects 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000011161 development Methods 0.000 abstract description 4
- 238000011160 research Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 241000764238 Isis Species 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于用户签到行为变化的深层语义分析的兴趣点推荐方法,涉及用户行为分析技术领域,本发明首先使用高斯核密度估计把用户签到区域分为本地区域和异地区域,依据用户签到行为所处的位置,提出一种用户签到行为兴趣变化方法,构建基于矩阵分解的LDSSCS模型,然后对用户的签到行为进行深层语义分析研究。本发明基于用户的位置变化,不仅能够为用户推荐最可能感兴趣的地点,提高用户的生活质量,而且能够为商家发掘潜在客户,增加商业利益,为基于位置的社交网络下的兴趣点推荐提供支持,促进移动应用和服务领域的进一步发展。
Description
技术领域
本发明涉及用户行为分析技术领域,特别涉及基于用户签到行为变化的深层语义分析的兴趣点推荐方法。
背景技术
近年来,随着移动互联网爆炸式增长、电子商务的迅猛发展以及智能手机的快速普及,让用户分享基于位置的体验也变得更加容易,也使得基于位置的社交网络成为移动互联网的核心因素之一,因此基于位置的社交网络下的兴趣点推荐已成为了目前研究的热点。
从用户的角度来说,兴趣点推荐可以帮助用户有效地探索符合用户偏好的新地方,增强用户的日常生活质量,给用户带来全新的、丰富的生活体验;从兴趣点商家来说,可以为企业吸引跟多的潜在客户,为潜在客户提供相关的广告,为企业带来更多的商业利益。
目前,虽然有许多针对兴趣点推荐的研究,但是,仔细观察他们的研究模型,发现很少有针对基于用户签到行为变化的兴趣点推荐进行深层的语义分析研究,所以,需要一种基于用户签到行为变化的深层语义分析的兴趣点推荐方法。
发明内容
本发明实施例提供了基于用户签到行为变化的深层语义分析的兴趣点推荐方法,用以解决现有技术中存在的问题。
基于用户签到行为变化的深层语义分析的兴趣点推荐方法,包括:
步骤一、采集用户签到行为数据,并进行预处理;
步骤二、按照等时段划分预处理后的用户签到行为数据集合C,得到T个子集;
步骤三、使用二维高斯核密度估计方法识别用户所处的本地区域或者异地区域;
步骤四、构建LDSSCS模型对用户的签到行为进行深层语义特征分析;
步骤五、优化LDSSCS模型和参数估计;
步骤六、基于Top-K的个性化动态即时兴趣点推荐给用户。
较佳地,所述步骤三中使用高斯核密度估计识别用户的本地区域或者异地区域,即指将空间二维的经纬度坐标融入到核密度估计方法中,根据用户签到历史位置的经纬度坐标得到用户将签到位置l的概率,设任意位置li的经纬度坐标为l′i=(lati,logi)T,依据用户签到的历史位置经纬度坐标,计算签到候选兴趣点位置l的概率值:
其中,|Lu|表示用户u的签到历史位置总的数量,H为核函数带宽,K为核函数,采用高斯核函数选取,如下所示:
较佳地,所述步骤三中,定义用户集合U={u1,u2,...um},兴趣点集合P={p1,p2,...pn},R∈Rm×n表示包含m个用户和n个兴趣点的用户-兴趣点签到矩阵,把R划分为T={t1,t2,...,t|T|}个时间段子矩阵Rt,每一个子矩阵包含对应时间段的用户签到行为;Z={Z1,Z2,...,ZT}分别表示用户在T={t1,t2,...,t|T|}时刻的用户兴趣点主题;SF、SD、SE分别表示目标用户的直接朋友关系集合、与目标用户有着共同签到行为的用户集合、可信推荐专家集合;β={β1,β2,…,β|T|}表示在t时刻控制着用户兴趣点主题Z分布的超参数;
在某一时间段下用户的签到评分Rt被分解为用户特征Ut和兴趣点特征P,由于用户签到行为会随时间t变化而发生变化,定义为Ut,兴趣点特征P被t时间段所有用户共享,定义为P;设置一个开关变量q,当q=0时,设用户在本地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,主要考虑用户的稳定兴趣和用户所具有的双社会关系,即包含直接朋友关系集合SF和与其具有共同签到行为关系的用户集合SD;当q=1时,设用户在异地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,主要考虑用户的混合兴趣,即稳定兴趣和短暂兴趣,以及来自可信推荐专家SE的信息;
(a)周期兴趣点推荐
其中,表示用户ui在时序状态下的签到活动,是在t时刻签到行为指示矩阵,Ut∈Rm×d是在时间状态t下的用户签到行为,表示用户的签到兴趣随时间变化而发生变化,兴趣点特征不随时间发生变化,表示为P∈Rn×d,为避免矩阵分解过拟合问题,引入γ是一个控制U、P、SD和SF的非负数参数,表示矩阵的Frobenius范数的平方,参数α和β是正则化项系数,旨在平衡本地区域下共同签到行为社会关系和共同朋友社会关系与传统协同过滤模型下的共同影响,条件项表示本地区域的两种情况,第一种情况是用户一直在本地区域,第二种情况是用户由异地区域回到了本地区域,ωik∈(0,1)表示用户ui和uk在共同签到用户兴趣点行为下的连接权重,ωif∈(0,1)表示用户ui和uf在考虑直接朋友连接关系下的权重,wik和wif的计算公式分别如下:
其中,G(ui)表示用户ui所具有的直接朋友关系集合,G(Uf)表示用户uf所具有的直接朋友关系集合,|x|表示X集合的基数;
(b)基于时间敏感的下一个兴趣点推荐
在周期兴趣点推荐的基础上,基于时间敏感的本地区域的下一个兴趣点推荐模型定义如下:
其中,正则项参数λ旨在调节用户的下一签到行为项与其他项之间的相互影响,St.t-1∈[0,1]和St.t+1∈[0,1]都是时序系数,分别用来测量用户ui在时序状态t和t-1之间的紧密度,t和t+1之间的紧密度,St.t-1和St.t+1越大,用户在时间段t-1、t和t+1之间的签到爱好越紧密,使用余弦相似度分别定义St.t-1和St.t+1:
其中,Ct-1(i,:)、Ct(i,:)和Ct+1(i,:)分别表示用户在时间段t-1、t和t+1内签到用户集合;
基于时间敏感的异地区域的下一个兴趣点推荐模型定义如下:
较佳地,所述步骤五中,采用随机梯度算法优化LDSSCS模型,使用随机梯度下降算法随机扫描所有训练数据,并沿着目标函数梯度下降的方向更新参数,每一次更新按如下公式执行:
其中,ξ是学习速率,Λ表示描述LDSSCS模型的构建过程中所涉及的参数。
较佳地,所述步骤六中,基于所构建的用户行为偏好模型,当目标用户ui在某一时刻t某一位置l想选择自己喜欢的某一兴趣点进行访问时,即是在t时刻,基于所构建的LDSSCS模型,在已知三元组(ui,t,l)的情况下,执行一个查询任务,首先判断相对于上一时刻,用户所处的位置l是本地区域还是异地区域,如果是本地区域,执行基于用户稳定兴趣和双社会关系的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户;如果是异地区域,执行基于混合兴趣和可信推荐专家信息的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户。
本发明有益效果:本发明基于用户的位置变化,不仅能够为用户推荐最可能感兴趣的地点,提高用户的生活质量,而且能够为商家发掘潜在客户,增加商业利益,为基于位置的社交网络下的兴趣点推荐提供支持,促进移动应用和服务领域的进一步发展。
附图说明
图1为本发明实施例提供的基于用户签到行为变化的深层语义分析的兴趣点推荐方法的结构示意图;
图2为本发明实施例提供的基于用户签到行为变化的本地区域推荐和异地区域推荐的结构示意图;
图3为本发明实施例提供的本地区域下用户的稳定兴趣主题Zj t的结构示意图;
图4为本发明实施例提供的短暂兴趣产生的结构示意图;
图5为本发明实施例提供的短暂兴趣消失的结构示意图;
图6为本发明实施例提供的LDSSCS模型的结构示意图。
具体实施方式
下面结合发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
参照图1和图2,本发明提供了基于用户签到行为变化的深层语义分析的兴趣点推荐方法:
(1)使用高斯核密度估计识别用户签到行为的本地区域和异地区域
针对抓取的用户签到行为数据,首先执行预处理,然后按照等时段划分预处理后的用户签到行为数据。随后,使用高斯核密度估计方法,判断用户将要签到的候选位置属于本地区域还是异地区域。
(2)依据用户的行为所处的位置,提出一种新的用户签到行为兴趣变化方法
在用户所处的整个时间周期下,依据用户兴趣子主题与其前向和后向关联子主题间的关系,拟将用户签到行为所对应的兴趣变化分为三种情况进行研究:在本地区域一直维持着稳定兴趣;到达异地区域后,用户在保持着稳定兴趣的情况下,临时产生短暂兴趣;和离开异地区域后,回到本地区域,短暂兴趣消失,用户重新只拥有稳定兴趣。
(3)构建基于矩阵分解的LDSSCS模型
把用户签到的区域分为本地区域和异地区域,构建LDSSCS模型(Local andDifferent Placse,Stable and Short Interest,Changeable Social Relations-basedPOI Recommendation Model),在本地区域下,根据用户所具有的稳定兴趣和存在的双社会关系,针对目标用户的查询,执行时序变化的周期兴趣点推荐和时间敏感的下一地点推荐;在异地区域下,根据用户所具有的混合兴趣和可信推荐专家所提供的信息,针对目标用户的查询,执行基于时序变化的周期兴趣点推荐和时间敏感的下一地点推荐,并使用随机梯度下降法对LDSSCS模型进行优化和参数估计。
面向用户签到行为变化的个性化兴趣点推荐服务系统必须能够有效分离线下和线上计算任务,因此,本发明将耗时、与查询无关的建模计算在线下完成,线上推荐只完成简单的查询和个性化推荐。
具体推荐步骤如下:
(1)采集用户签到行为数据,并进行预处理;按照等时段划分预处理后的用户签到行为数据集合C,得到T个子集;使用二维高斯核密度估计(KED,Kernel DensityEstimator)方法识别用户所处的本地区域或者异地区域;
将空间二维的经纬度坐标融入到核密度估计方法中,根据用户签到历史位置的经纬度坐标得到用户将签到位置l的概率,设任意位置li的经纬度坐标为l′i=(lati,logi)T,依据用户签到的历史位置经纬度坐标,计算签到候选兴趣点位置l的概率值:
其中,|Lu|表示用户u的签到历史位置总的数量,H为核函数带宽,K为核函数。因此用户签到最频繁的区域一般都集中在自己所在的本地区域周围,p(l|Lu)值越大,候选兴趣点位置l越靠近用户的本地区域,l越容易被用户所选取。p(l|Lu)值越小,候选兴趣点位置l越远离用户的本地区域,l越不容易被用户所选取。本发明设置一临界阈值γ,规定当p(l|Lu)≥γ时,签到候选兴趣点位置l属于本地区域。当p(l|Lu)<γ时,签到候选兴趣点位置l属于异地区域。对于核函数的选取,采用标准的高斯核函数,如下所示:
(2)用户签到行为兴趣变化表示:
尽管用户的签到行为会随着时间和所述空间发生变化,但不同时间段用户的兴趣之间存在一定的关联,这种关联反映为不同时间段用户签到行为兴趣的语义相似性,因此,用户兴趣通过用户签到行为数据集中所对应兴趣点特征词汇的出现概率表示,判断不同时期用户兴趣点间的语义相似性对应于度量两个概率分布间的近似程度。令滑动窗口包含N个时间段,把时间段t中的用户所具有的兴趣主题j记作原KL散度是不对称的,但不同时期用户兴趣间的语义相似性是对称的,即对于任意用户兴趣和 和的相似性与和的相似性相等,改进原KL散度,初步构思基于对称KL散度的用户兴趣子主题相似度为:
该用户兴趣有一组相互关联的用户子主题组成。令N是时间滑动窗口的大小,对于时间片t中的用户兴趣子主题与时间片t相邻窗内用户兴趣子主题间存在关联。滑窗内各时间片i(i=t-1,...,t-N)中与相似度最大的用户兴趣子主题为的前向关联子主题,记作时间片i(i=t+1,...,t+N)中与相似度最大的子主题成为的后关联子主题,记作根据用户兴趣子主题与其前向和后向子主题间的关系,将用户签到行为兴趣变化分为三种情况:在本地区域一直维持着稳定兴趣;到达异地区域后,用户在保持稳定兴趣的情况下,临时产生短暂兴趣;离开异地区域,回到本地区域,短暂兴趣消失,用户重新只拥有稳定兴趣。分别介绍如下:
第一、在本地区域一直维持着稳定兴趣
由于人本身一直具有稳定兴趣,并且大部分情况下在本地区域活动,所签到的兴趣点主题类型也反映了人本身所具有的稳定兴趣。在本地区域下,对于用户兴趣子主题若存在前向关联兴趣子主题使得和的相似度大于阈值ε,既并且也是的后向关联子主题,即则是的后继。
参照图3,这一现象说明用户的兴趣没有发生太大的变化,用户兴趣一直稳定。
第二、到达异地区域后,用户在保持着稳定兴趣下,临时产生短暂兴趣。
用户新到了一个异地区域,由于受异地区域特征所吸引,临时会产生短暂兴趣。但自身所具有的稳定兴趣一直保持着,所对应的数学思想表达如下:
第三、离开异地区域后,回到本地区域,短暂兴趣消失,用户重新只拥有稳定兴趣
由于是异地区域,用户迟早会离开,当用户离开异地区域,回到本地后,短暂兴趣消失,用户重新只拥有稳定兴趣。设用户在异地区域的兴趣主题为它包含用户所具有的稳定兴趣短暂兴趣主题回到本地区域后,若不存在后向关联主题使得和的相似度大于阈值ε,既不满足则在用户回到本地区域后消失。
(3)、采用LDSSCS模型,在本地区域和异地区域两种情况下,对用户的签到行为进行深层语义分析研究,执行周期兴趣点推荐和时间敏感的下一兴趣点推荐。
在基于位置的网络下,由于用户的签到行为会随时间发生周期性变化,因此把用户的签到行为划分为若干时间段,在每一时间段下,分析影响用户签到行为的因素,在时序变化周期下,主要考虑用户的兴趣爱好变化和用户的社会关系变化对用户签到行为的影响,除了考虑周期兴趣点推荐之外,还采用所提出的LDSSDCS模型对用户整体的签到行为变化进行研究,为用户推荐基于时间敏感的下一个兴趣点。
参照图6,为LDSSDCS模型的构建思路,定义用户集合U={u1,u2,...um},兴趣点集合P={p1,p2,...pn},R∈Rm×n表示包含m个用户和n个兴趣点的用户-兴趣点签到矩阵,把R划分为T={t1,t2,...,t|T|}个时间段子矩阵Rt,每一个子矩阵包含对应时间段的用户签到行为。Z={Z1,Z2,...,ZT}分别表示用户在T={t1,t2,...,t|T|}时刻的用户兴趣点主题。SF、SD、SE分别表示目标用户的直接朋友关系集合、与目标用户有着共同签到行为用户集合、可信推荐专家集合。β={β1,β2,…,β|T|}表示在t时刻控制着用户兴趣点主题Z分布的超参数。
在某一时间段下用户的签到评分Rt被分解为用户特征Ut和兴趣点特征P,由于用户签到行为会随时间t变化而发生变化,定义为Ut,兴趣点特征P被t时间段所有用户共享,定义为P。设置一个开关变量q,当q=0时,设用户在本地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,主要考虑用户的稳定兴趣和用户所具有的双社会关系(包含直接朋友关系集合SF和与其具有共同签到行为关系的用户集合SD)。当用户q=1时,设用户在异地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,主要考虑用户的混合兴趣(稳定兴趣和短暂兴趣)和来自可信推荐专家SE的信息。
另外,由于已出现的用户签到行为兴趣主题可能在后续时间段中再次出现,在图6中,对于当前时间段t,以时间段t-l中兴趣主题分布的加权作为时间段t中相应分布的先验,即时间段t中用户签到行为兴趣子主题分布服Dirichlet先验满足:
Zt=Zt-1w (4)
以下为本地区域和异地区域下的周期兴趣点推荐和时间敏感的下一地点推荐:
(a)周期兴趣点推荐
在图6所表示的LDSSCS模型中,当开关变量q=0时,用户在本地区域,把用户所具有的稳定兴趣主题双社会关系集合(包含直接朋友关系集合SF和与其具有共同签到行为关系的用户集合SD)融合到基于时序周期变化的矩阵分解模型中。所得到的最小化目标函数表示如下:
其中,表示用户ui在时序状态下的签到活动,是在t时刻签到行为指示矩阵,Ut∈Rm×d是在时间状态t下的用户签到行为,表示用户的签到兴趣随时间变化而发生变化。兴趣点特征不随时间发生变化,表示为P∈Rn×d。为避免矩阵分解过拟合问题,引入γ是一个控制U、P、SD和SF的非负数参数。表示矩阵的Frobenius范数的平方,参数α和β是正则化项系数,旨在平衡本地区域下共同签到行为社会关系和共同朋友社会关系与传统协同过滤模型下的共同影响。条件项表示本地区域的两种情况,第一种情况是用户一直在本地区域,第二种情况是用户由异地区域回到了本地区域。
ωik∈(0,1)表示用户ui和uk在共同签到用户兴趣点行为下的连接权重。
ωif∈(0,1)表示用户ui和uf在考虑直接朋友连接关系下的权重。wik和wif的计算公式分别如下:
其中,G(ui)表示用户ui所具有的直接朋友关系集合,G(Uf)表示用户uf所具有的直接朋友关系集合,|x|表示X集合的基数。
公式(8)中,相关参数的含义与公式(5)中所表达的含义一致,需要强调的几个参数是可信推荐专家集合SE和用户ui与可信推荐专家ue连接的权重ωie∈(0,1)。在进行异地区域时,依据自身丰富的有价值标签签到行为,为用户ui提供有价值的知识,让用户来到异地后,除了根据自身稳定兴趣选择访问的兴趣点外,还可以根据可信推荐专家的额建议,选择具有本土特色的一些兴趣点进行访问。可信推荐专家定义如下:采用TF-IDF值计算用户对某些兴趣点类别感兴趣的程度,计算公式如下:
其中,|u.pi:pi.c=c′|表示用户u在其所签到的兴趣点对应的类别c′上的访问次数,|u,P|表示用户u访问的所有兴趣点的总次数,|uj.c′∈uj.C|是在所有的用户中已访问类别c′的用户的数量,|U|表示所有的用户数。可见,用户u的兴趣点类别权重值越大,u.wc′越大,用户u越有希望成为此兴趣点类别的专家。因此,在某一时间段t下,计算异地区域所有用户u签到的兴趣点类别权重,在每一类别下,选择Top-K个最高的用户作为可信推荐专家SE推荐给用户。用户ui来到异地后,可以参考这些可信推荐专家的建议,选择有价值的兴趣点进行访问。另外,我们规定,用户ui与可推荐专家ue连接的权重wie=ue.wc′,
(b)基于时间敏感的下一个兴趣点推荐
在连续的时间段,用户的签到行为之间存在紧密的联系。在周期兴趣点推荐的基础上,基于时间敏感的本地区域的下一个兴趣点推荐模型定义如下:
其中,正则项参数λ旨在调节用户的下一签到行为项与其他项之间的相互影响。St.t-1∈[0,1]和St.t+1∈[0,1]都是时序系数,分别用来测量用户ui在时序状态t和t-1之间的紧密度,t和t+1之间的紧密度。St.t-1和St.t+1越大,用户在时间段t-1、t和t+1之间的签到爱好越紧密,使用余弦相似度分别定义St.t-1和St.t+1:
其中,Ct-1(i,:)、Ct(i,:)和Ct+1(i,:)分别表示用户在时间段t-1、t和t+1内签到用户集合。
基于时间敏感的异地区域的下一个兴趣点推荐模型定义如下:
公式(13)中所使用的参数与上述所述公式使用参数的含义一致。
(4)优化LDSSCS模型和估计相应的参数
第(3)不详细描述了LDSSCS模型的构建过程,构建好模型后,还需要对此模型进行优化,本项目拟采用随机梯度下降算法优化LDSSCS模型。使用随机梯度下降算法随机扫描所有训练数据,并沿着目标函数梯度下降的方向更新参数,每一次更新按如下公式执行:
(5)研究基于TOP-K的个性化动态即时兴趣点推荐服务
基于所构建的用户行为偏好模型,当目标用户ui在某一时刻t某一位置l想选择自己喜欢的某一兴趣点进行访问时,其实,就是在t时刻,基于所构建的LDSSCS模型,在已知三元组(ui,t,l)的情况下,执行一个查询任务,首先判断基于上一时刻。用户所处的位置l是本地区域还是异地区域,如果是本地区域,执行基于用户稳定兴趣和双社会关系的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户;如果是异地区域,执行基于混合兴趣和可信推荐专家信息的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户。
为验证该发明的有效性,加快算法的运行徐达,拟搭建并行分布式的云计算环境,使用Hadoop对推荐模型进行部署,采用MapReduce的工作方式对本课题所涉及的任务实施分布式并行处理。
实施例:采集和预处理用户签到行为数据集。初步打算采集Foursquare站点和Gowalla站点下的用户签到行为数据,包含用户信息、兴趣点信息、用户的签到信息等,对所采集到的用户签到行为数据进行预处理,过滤掉签到兴趣点极少的用户和被用户签到很少的兴趣点。
根据用户在不同时间段具有的兴趣爱好不同,合理划分时间段,使用高斯核密度估计用户签到所述的位置是“本地区域”还是“异地区域”。
使用对称KL散度方法计算用户兴趣在连续两个时间段的相似度,在此基础上,依据用户签到行为所处的位置,表示用户签到行为兴趣变化的种类。
构建本发明所提出的基于矩阵分解的LDSSCS模型,并使用随机梯度下降发对LDSSCS模型进行优化和参数估计。
使用所采集的Foursquare数据集和Gowalla数据集,和四种评价指标(准确率、排序度量指标、平均绝对误差和方根误差)评测本发明所提出的LDSSCS模型的性能,并和已有的兴趣点推荐方法进行性能对比分析。
综上所述,本发明基于用户的位置变化,不仅能够为用户推荐最可能感兴趣的地点,提高用户的生活质量,而且能够为商家发掘潜在客户,增加商业利益,为基于位置的社交网络下的兴趣点推荐提供支持,促进移动应用和服务领域的进一步发展。
以上公开的仅为本发明的一个具体实施例,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (3)
1.基于用户签到行为变化深层语义分析的兴趣点推荐方法,其特征在于,包括:
步骤一、采集用户签到行为数据,并进行预处理;
步骤二、按照等时段划分预处理后的用户签到行为数据集合C,得到T个子集;
步骤三、使用二维高斯核密度估计方法识别用户所处的本地区域或者异地区域;
步骤四、构建LDSSCS模型对用户的签到行为进行深层语义特征分析;
步骤五、优化LDSSCS模型和参数估计;
步骤六、将基于Top-K的个性化动态即时兴趣点推荐给用户;
所述步骤三中使用高斯核密度估计识别用户的本地区域或者异地区域,指将空间二维的经纬度坐标融入到核密度估计方法中,根据用户签到历史位置的经纬度坐标得到用户将签到位置l的概率,设任意位置li的经纬度坐标为l′i=(lati,logi)T,依据用户签到的历史位置经纬度坐标,计算签到候选兴趣点位置l的概率值:
其中,|Lu|表示用户u的签到历史位置总的数量,H为核函数带宽,K为核函数,采用高斯核函数选取,如下所示:
所述步骤四中,定义用户集合U={u1,u2,...um},兴趣点集合P={p1,p2,...pn},R∈Rm×n表示包含m个用户和n个兴趣点的用户-兴趣点签到矩阵,把R划分为T={t1,t2,...,t|T|}个时间段子矩阵Rt,每一个子矩阵包含对应时间段的用户签到行为;Z={Z1,Z2,...,ZT}分别表示用户在T={t1,t2,...,t|T|}时刻的用户兴趣点主题;SF、SD、SE分别表示目标用户的直接朋友关系集合、与目标用户有着共同签到行为的用户集合、可信推荐专家集合;β={β1,β2,…,β|T|}表示在t时刻控制着用户兴趣点主题Z分布的超参数;
在某一时间段下用户的签到评分Rt被分解为用户特征Ut和兴趣点特征P,由于用户签到行为会随时间t变化而发生变化,定义为Ut,兴趣点特征P被t时间段所有用户共享,定义为P;设置一个开关变量q,当q=0时,设用户在本地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,考虑用户的稳定兴趣和用户所具有的双社会关系,即包含直接朋友关系集合SF和与其具有共同签到行为关系的用户集合SD;当q=1时,设用户在异地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,考虑用户的混合兴趣,即稳定兴趣和短暂兴趣,以及来自可信推荐专家SE的信息;
(a)周期兴趣点推荐
其中,表示用户ui在时序状态下的签到活动,是在t时刻签到行为指示矩阵,Ut∈Rm×d是在时间状态t下的用户签到行为,表示用户的签到兴趣随时间变化而发生变化,兴趣点特征不随时间发生变化,表示为P∈Rn×d,γ是控制U、P、SD和SF的非负数参数,表示矩阵的Frobenius范数的平方,参数α和β是正则化项系数,条件项表示本地区域的两种情况,第一种情况是用户一直在本地区域,第二种情况是用户由异地区域回到了本地区域,wik∈(0,1)表示用户ui和uk在共同签到用户兴趣点行为下的连接权重,wif∈(0,1)表示用户ui和uf在考虑直接朋友连接关系下的权重,wik和wif的计算公式分别如下:
其中,G(ui)表示用户ui所具有的直接朋友关系集合,G(Uf)表示用户uf所具有的直接朋友关系集合,|x|表示X集合的基数;
(b)基于时间敏感的下一个兴趣点推荐
在周期兴趣点推荐的基础上,基于时间敏感的本地区域的下一个兴趣点推荐模型定义如下:
其中,St.t-1∈[0,1]和St.t+1∈[0,1]都是时序系数,分别用来测量用户ui在时序状态t和t-1之间的紧密度,t和t+1之间的紧密度,St.t-1和St.t+1越大,用户在时间段t-1、t和t+1之间的签到爱好越紧密,使用余弦相似度分别定义St.t-1和St.t+1:
其中,Ct-1(i,:)、Ct(i,:)和Ct+1(i,:)分别表示用户在时间段t-1、t和t+1内签到用户集合;
基于时间敏感的异地区域的下一个兴趣点推荐模型定义如下:
3.如权利要求1所述的方法,其特征在于,所述步骤六中,基于所构建的用户行为偏好模型,当目标用户ui在某一时刻t某一位置l想选择自己喜欢的某一兴趣点进行访问时,即是在t时刻,基于所构建的LDSSCS模型,在已知三元组(ui,t,l)的情况下,执行一个查询任务,首先判断相对于上一时刻,用户所处的位置l是本地区域还是异地区域,如果是本地区域,执行基于用户稳定兴趣和双社会关系的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户;如果是异地区域,执行基于混合兴趣和可信推荐专家信息的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811578531.3A CN109684561B (zh) | 2018-12-24 | 2018-12-24 | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811578531.3A CN109684561B (zh) | 2018-12-24 | 2018-12-24 | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109684561A CN109684561A (zh) | 2019-04-26 |
CN109684561B true CN109684561B (zh) | 2021-06-08 |
Family
ID=66188772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811578531.3A Active CN109684561B (zh) | 2018-12-24 | 2018-12-24 | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109684561B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399565B (zh) * | 2019-07-29 | 2021-08-06 | 北京理工大学 | 基于时空周期注意力机制的递归神经网络兴趣点推荐方法 |
CN110888951B (zh) * | 2019-11-09 | 2023-06-09 | 华东师范大学 | 一种基于语义轨迹的区域内兴趣点需求挖掘和选址方法及排名和分析系统 |
CN110990717B (zh) * | 2019-11-22 | 2023-03-31 | 广西师范大学 | 一种基于跨域关联的兴趣点推荐方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740401A (zh) * | 2016-01-28 | 2016-07-06 | 北京理工大学 | 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132194A1 (en) * | 2011-11-17 | 2013-05-23 | Giridhar Rajaram | Targeting advertisements to users of a social networking system based on events |
CN107085599B (zh) * | 2017-03-31 | 2021-05-14 | 百度在线网络技术(北京)有限公司 | Poi推荐方法、装置、设备及计算机可读存储介质 |
CN107562947B (zh) * | 2017-09-26 | 2021-07-02 | 宿州学院 | 一种移动时空感知下动态即时推荐服务模型建立方法 |
-
2018
- 2018-12-24 CN CN201811578531.3A patent/CN109684561B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740401A (zh) * | 2016-01-28 | 2016-07-06 | 北京理工大学 | 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109684561A (zh) | 2019-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110555112B (zh) | 一种基于用户正负偏好学习的兴趣点推荐方法 | |
CN108256093B (zh) | 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法 | |
CN105740401B (zh) | 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置 | |
Xing et al. | Points-of-interest recommendation based on convolution matrix factorization | |
Wang et al. | Towards real-time demand-aware sequential POI recommendation | |
CN109508428B (zh) | 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法 | |
Lu et al. | GLR: A graph-based latent representation model for successive POI recommendation | |
CN109684561B (zh) | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 | |
CN109062962A (zh) | 一种融合天气信息的门控循环神经网络兴趣点推荐方法 | |
CN104268292A (zh) | 画像系统的标签词库更新方法 | |
CN109933720B (zh) | 一种基于用户兴趣自适应演化的动态推荐方法 | |
CN108897750B (zh) | 融合多元上下文信息的个性化地点推荐方法及设备 | |
CN105528395A (zh) | 一种潜在消费者推荐方法及系统 | |
CN109190040B (zh) | 基于协同演化的个性化推荐方法及装置 | |
Chen et al. | Improved course recommendation algorithm based on collaborative filtering | |
da Costa Fortes et al. | Ensemble learning in recommender systems: Combining multiple user interactions for ranking personalization | |
CN116244513A (zh) | 随机群组poi推荐方法、系统、设备及存储介质 | |
Ma et al. | Exploring multiple spatio-temporal information for point-of-interest recommendation | |
Zheng et al. | Deep CNN‐Assisted Personalized Recommendation over Big Data for Mobile Wireless Networks | |
Noorian Avval et al. | A hybrid recommender system using topic modeling and prefixspan algorithm in social media | |
CN107909498B (zh) | 基于最大化接受者操作特征曲线下方面积的推荐方法 | |
Liao et al. | An integrated model based on deep multimodal and rank learning for point-of-interest recommendation | |
Thaipisutikul et al. | Pattern-based dual learning for point-of-interest (POI) recommendation | |
CN114417166A (zh) | 基于行为序列和动态社交影响的连续兴趣点推荐方法 | |
Ma et al. | Multi-factor fusion POI recommendation model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |