CN109684561B - 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 - Google Patents

基于用户签到行为变化的深层语义分析的兴趣点推荐方法 Download PDF

Info

Publication number
CN109684561B
CN109684561B CN201811578531.3A CN201811578531A CN109684561B CN 109684561 B CN109684561 B CN 109684561B CN 201811578531 A CN201811578531 A CN 201811578531A CN 109684561 B CN109684561 B CN 109684561B
Authority
CN
China
Prior art keywords
user
interest
time
sign
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811578531.3A
Other languages
English (en)
Other versions
CN109684561A (zh
Inventor
崔琳
汪材印
张志伟
谈成访
潘正高
刘永清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201811578531.3A priority Critical patent/CN109684561B/zh
Publication of CN109684561A publication Critical patent/CN109684561A/zh
Application granted granted Critical
Publication of CN109684561B publication Critical patent/CN109684561B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于用户签到行为变化的深层语义分析的兴趣点推荐方法,涉及用户行为分析技术领域,本发明首先使用高斯核密度估计把用户签到区域分为本地区域和异地区域,依据用户签到行为所处的位置,提出一种用户签到行为兴趣变化方法,构建基于矩阵分解的LDSSCS模型,然后对用户的签到行为进行深层语义分析研究。本发明基于用户的位置变化,不仅能够为用户推荐最可能感兴趣的地点,提高用户的生活质量,而且能够为商家发掘潜在客户,增加商业利益,为基于位置的社交网络下的兴趣点推荐提供支持,促进移动应用和服务领域的进一步发展。

Description

基于用户签到行为变化的深层语义分析的兴趣点推荐方法
技术领域
本发明涉及用户行为分析技术领域,特别涉及基于用户签到行为变化的深层语义分析的兴趣点推荐方法。
背景技术
近年来,随着移动互联网爆炸式增长、电子商务的迅猛发展以及智能手机的快速普及,让用户分享基于位置的体验也变得更加容易,也使得基于位置的社交网络成为移动互联网的核心因素之一,因此基于位置的社交网络下的兴趣点推荐已成为了目前研究的热点。
从用户的角度来说,兴趣点推荐可以帮助用户有效地探索符合用户偏好的新地方,增强用户的日常生活质量,给用户带来全新的、丰富的生活体验;从兴趣点商家来说,可以为企业吸引跟多的潜在客户,为潜在客户提供相关的广告,为企业带来更多的商业利益。
目前,虽然有许多针对兴趣点推荐的研究,但是,仔细观察他们的研究模型,发现很少有针对基于用户签到行为变化的兴趣点推荐进行深层的语义分析研究,所以,需要一种基于用户签到行为变化的深层语义分析的兴趣点推荐方法。
发明内容
本发明实施例提供了基于用户签到行为变化的深层语义分析的兴趣点推荐方法,用以解决现有技术中存在的问题。
基于用户签到行为变化的深层语义分析的兴趣点推荐方法,包括:
步骤一、采集用户签到行为数据,并进行预处理;
步骤二、按照等时段划分预处理后的用户签到行为数据集合C,得到T个子集;
步骤三、使用二维高斯核密度估计方法识别用户所处的本地区域或者异地区域;
步骤四、构建LDSSCS模型对用户的签到行为进行深层语义特征分析;
步骤五、优化LDSSCS模型和参数估计;
步骤六、基于Top-K的个性化动态即时兴趣点推荐给用户。
较佳地,所述步骤三中使用高斯核密度估计识别用户的本地区域或者异地区域,即指将空间二维的经纬度坐标融入到核密度估计方法中,根据用户签到历史位置的经纬度坐标得到用户将签到位置l的概率,设任意位置li的经纬度坐标为l′i=(lati,logi)T,依据用户签到的历史位置经纬度坐标,计算签到候选兴趣点位置l的概率值:
Figure BDA0001917189830000021
其中,|Lu|表示用户u的签到历史位置总的数量,H为核函数带宽,K为核函数,采用高斯核函数选取,如下所示:
Figure BDA0001917189830000022
较佳地,所述步骤三中,定义用户集合U={u1,u2,...um},兴趣点集合P={p1,p2,...pn},R∈Rm×n表示包含m个用户和n个兴趣点的用户-兴趣点签到矩阵,把R划分为T={t1,t2,...,t|T|}个时间段子矩阵Rt,每一个子矩阵包含对应时间段的用户签到行为;Z={Z1,Z2,...,ZT}分别表示用户在T={t1,t2,...,t|T|}时刻的用户兴趣点主题;SF、SD、SE分别表示目标用户的直接朋友关系集合、与目标用户有着共同签到行为的用户集合、可信推荐专家集合;β={β1,β2,…,β|T|}表示在t时刻控制着用户兴趣点主题Z分布的超参数;
在某一时间段下用户的签到评分Rt被分解为用户特征Ut和兴趣点特征P,由于用户签到行为会随时间t变化而发生变化,定义为Ut,兴趣点特征P被t时间段所有用户共享,定义为P;设置一个开关变量q,当q=0时,设用户在本地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,主要考虑用户的稳定兴趣和用户所具有的双社会关系,即包含直接朋友关系集合SF和与其具有共同签到行为关系的用户集合SD;当q=1时,设用户在异地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,主要考虑用户的混合兴趣,即稳定兴趣和短暂兴趣,以及来自可信推荐专家SE的信息;
(a)周期兴趣点推荐
在LDSSCS模型中,当开关变量q=0时,用户在本地区域,把用户所具有的稳定兴趣主题
Figure BDA0001917189830000031
双社会关系集合融合到基于时序周期变化的矩阵分解模型中,所得到的最小化目标函数表示如下:
Figure BDA0001917189830000041
Figure BDA0001917189830000042
其中,
Figure BDA0001917189830000043
表示用户ui在时序状态下的签到活动,
Figure BDA0001917189830000044
是在t时刻签到行为指示矩阵,Ut∈Rm×d是在时间状态t下的用户签到行为,表示用户的签到兴趣随时间变化而发生变化,兴趣点特征不随时间发生变化,表示为P∈Rn×d,为避免矩阵分解过拟合问题,引入
Figure BDA0001917189830000045
γ是一个控制U、P、SD和SF的非负数参数,
Figure BDA0001917189830000046
表示矩阵的Frobenius范数的平方,参数α和β是正则化项系数,旨在平衡本地区域下共同签到行为社会关系和共同朋友社会关系与传统协同过滤模型下的共同影响,条件项表示本地区域的两种情况,第一种情况是用户一直在本地区域,第二种情况是用户由异地区域回到了本地区域,ωik∈(0,1)表示用户ui和uk在共同签到用户兴趣点行为下的连接权重,ωif∈(0,1)表示用户ui和uf在考虑直接朋友连接关系下的权重,wik和wif的计算公式分别如下:
Figure BDA0001917189830000047
其中,
Figure BDA0001917189830000051
表示用户ui已签到的兴趣点集合,
Figure BDA0001917189830000052
表示用户uk已签到的兴趣点集合;
Figure BDA0001917189830000053
其中,G(ui)表示用户ui所具有的直接朋友关系集合,G(Uf)表示用户uf所具有的直接朋友关系集合,|x|表示X集合的基数;
当开关变量q=1时,用户在异地区域,把用户所具有的混合兴趣主题
Figure BDA0001917189830000054
可信推荐专家SE融合到基于时序周期变化的矩阵分解模型中,所得到的最小化目标函数表示如下:
Figure BDA0001917189830000055
Figure BDA0001917189830000056
(b)基于时间敏感的下一个兴趣点推荐
在周期兴趣点推荐的基础上,基于时间敏感的本地区域的下一个兴趣点推荐模型定义如下:
Figure BDA0001917189830000061
Figure BDA0001917189830000062
其中,正则项参数λ旨在调节用户的下一签到行为项与其他项之间的相互影响,St.t-1∈[0,1]和St.t+1∈[0,1]都是时序系数,分别用来测量用户ui在时序状态t和t-1之间的紧密度,t和t+1之间的紧密度,St.t-1和St.t+1越大,用户在时间段t-1、t和t+1之间的签到爱好越紧密,使用余弦相似度分别定义St.t-1和St.t+1
Figure BDA0001917189830000063
Figure BDA0001917189830000064
其中,Ct-1(i,:)、Ct(i,:)和Ct+1(i,:)分别表示用户在时间段t-1、t和t+1内签到用户集合;
基于时间敏感的异地区域的下一个兴趣点推荐模型定义如下:
Figure BDA0001917189830000071
Figure BDA0001917189830000072
较佳地,所述步骤五中,采用随机梯度算法优化LDSSCS模型,使用随机梯度下降算法随机扫描所有训练数据,并沿着目标函数梯度下降的方向更新参数,每一次更新按如下公式执行:
Figure BDA0001917189830000073
其中,ξ是学习速率,Λ表示描述LDSSCS模型的构建过程中所涉及的参数。
较佳地,所述步骤六中,基于所构建的用户行为偏好模型,当目标用户ui在某一时刻t某一位置l想选择自己喜欢的某一兴趣点进行访问时,即是在t时刻,基于所构建的LDSSCS模型,在已知三元组(ui,t,l)的情况下,执行一个查询任务,首先判断相对于上一时刻,用户所处的位置l是本地区域还是异地区域,如果是本地区域,执行基于用户稳定兴趣和双社会关系的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户;如果是异地区域,执行基于混合兴趣和可信推荐专家信息的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户。
本发明有益效果:本发明基于用户的位置变化,不仅能够为用户推荐最可能感兴趣的地点,提高用户的生活质量,而且能够为商家发掘潜在客户,增加商业利益,为基于位置的社交网络下的兴趣点推荐提供支持,促进移动应用和服务领域的进一步发展。
附图说明
图1为本发明实施例提供的基于用户签到行为变化的深层语义分析的兴趣点推荐方法的结构示意图;
图2为本发明实施例提供的基于用户签到行为变化的本地区域推荐和异地区域推荐的结构示意图;
图3为本发明实施例提供的本地区域下用户的稳定兴趣主题Zj t的结构示意图;
图4为本发明实施例提供的短暂兴趣产生的结构示意图;
图5为本发明实施例提供的短暂兴趣消失的结构示意图;
图6为本发明实施例提供的LDSSCS模型的结构示意图。
具体实施方式
下面结合发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
参照图1和图2,本发明提供了基于用户签到行为变化的深层语义分析的兴趣点推荐方法:
(1)使用高斯核密度估计识别用户签到行为的本地区域和异地区域
针对抓取的用户签到行为数据,首先执行预处理,然后按照等时段划分预处理后的用户签到行为数据。随后,使用高斯核密度估计方法,判断用户将要签到的候选位置属于本地区域还是异地区域。
(2)依据用户的行为所处的位置,提出一种新的用户签到行为兴趣变化方法
在用户所处的整个时间周期下,依据用户兴趣子主题与其前向和后向关联子主题间的关系,拟将用户签到行为所对应的兴趣变化分为三种情况进行研究:在本地区域一直维持着稳定兴趣;到达异地区域后,用户在保持着稳定兴趣的情况下,临时产生短暂兴趣;和离开异地区域后,回到本地区域,短暂兴趣消失,用户重新只拥有稳定兴趣。
(3)构建基于矩阵分解的LDSSCS模型
把用户签到的区域分为本地区域和异地区域,构建LDSSCS模型(Local andDifferent Placse,Stable and Short Interest,Changeable Social Relations-basedPOI Recommendation Model),在本地区域下,根据用户所具有的稳定兴趣和存在的双社会关系,针对目标用户的查询,执行时序变化的周期兴趣点推荐和时间敏感的下一地点推荐;在异地区域下,根据用户所具有的混合兴趣和可信推荐专家所提供的信息,针对目标用户的查询,执行基于时序变化的周期兴趣点推荐和时间敏感的下一地点推荐,并使用随机梯度下降法对LDSSCS模型进行优化和参数估计。
面向用户签到行为变化的个性化兴趣点推荐服务系统必须能够有效分离线下和线上计算任务,因此,本发明将耗时、与查询无关的建模计算在线下完成,线上推荐只完成简单的查询和个性化推荐。
具体推荐步骤如下:
(1)采集用户签到行为数据,并进行预处理;按照等时段划分预处理后的用户签到行为数据集合C,得到T个子集;使用二维高斯核密度估计(KED,Kernel DensityEstimator)方法识别用户所处的本地区域或者异地区域;
将空间二维的经纬度坐标融入到核密度估计方法中,根据用户签到历史位置的经纬度坐标得到用户将签到位置l的概率,设任意位置li的经纬度坐标为l′i=(lati,logi)T,依据用户签到的历史位置经纬度坐标,计算签到候选兴趣点位置l的概率值:
Figure BDA0001917189830000101
其中,|Lu|表示用户u的签到历史位置总的数量,H为核函数带宽,K为核函数。因此用户签到最频繁的区域一般都集中在自己所在的本地区域周围,p(l|Lu)值越大,候选兴趣点位置l越靠近用户的本地区域,l越容易被用户所选取。p(l|Lu)值越小,候选兴趣点位置l越远离用户的本地区域,l越不容易被用户所选取。本发明设置一临界阈值γ,规定当p(l|Lu)≥γ时,签到候选兴趣点位置l属于本地区域。当p(l|Lu)<γ时,签到候选兴趣点位置l属于异地区域。对于核函数的选取,采用标准的高斯核函数,如下所示:
Figure BDA0001917189830000102
(2)用户签到行为兴趣变化表示:
尽管用户的签到行为会随着时间和所述空间发生变化,但不同时间段用户的兴趣之间存在一定的关联,这种关联反映为不同时间段用户签到行为兴趣的语义相似性,因此,用户兴趣通过用户签到行为数据集中所对应兴趣点特征词汇的出现概率表示,判断不同时期用户兴趣点间的语义相似性对应于度量两个概率分布间的近似程度。令滑动窗口包含N个时间段,把时间段t中的用户所具有的兴趣主题j记作
Figure BDA00019171898300001111
原KL散度是不对称的,但不同时期用户兴趣间的语义相似性是对称的,即对于任意用户兴趣
Figure BDA00019171898300001112
Figure BDA00019171898300001113
Figure BDA00019171898300001114
Figure BDA00019171898300001115
的相似性与
Figure BDA00019171898300001116
Figure BDA00019171898300001117
的相似性相等,改进原KL散度,初步构思基于对称KL散度的用户兴趣子主题相似度为:
Figure BDA0001917189830000111
其中,p(w)和q(w)分别表示用户签到所对应的兴趣点包含的特征词汇w在用户兴趣子主题
Figure BDA0001917189830000112
Figure BDA0001917189830000113
中的出现概率。
该用户兴趣有一组相互关联的用户子主题组成。令N是时间滑动窗口的大小,对于时间片t中的用户兴趣子主题
Figure BDA0001917189830000114
与时间片t相邻窗内用户兴趣子主题间存在关联。滑窗内各时间片i(i=t-1,...,t-N)中与
Figure BDA0001917189830000115
相似度最大的用户兴趣子主题为
Figure BDA0001917189830000116
的前向关联子主题,记作
Figure BDA0001917189830000117
时间片i(i=t+1,...,t+N)中与
Figure BDA0001917189830000118
相似度最大的子主题成为
Figure BDA0001917189830000119
的后关联子主题,记作
Figure BDA00019171898300001110
根据用户兴趣子主题与其前向和后向子主题间的关系,将用户签到行为兴趣变化分为三种情况:在本地区域一直维持着稳定兴趣;到达异地区域后,用户在保持稳定兴趣的情况下,临时产生短暂兴趣;离开异地区域,回到本地区域,短暂兴趣消失,用户重新只拥有稳定兴趣。分别介绍如下:
第一、在本地区域一直维持着稳定兴趣
由于人本身一直具有稳定兴趣,并且大部分情况下在本地区域活动,所签到的兴趣点主题类型也反映了人本身所具有的稳定兴趣。在本地区域下,对于用户兴趣子主题
Figure BDA0001917189830000121
若存在前向关联兴趣子主题
Figure BDA0001917189830000122
使得
Figure BDA0001917189830000123
Figure BDA0001917189830000124
的相似度大于阈值ε,既
Figure BDA0001917189830000125
并且
Figure BDA0001917189830000126
也是
Figure BDA0001917189830000127
的后向关联子主题,即
Figure BDA0001917189830000128
Figure BDA0001917189830000129
Figure BDA00019171898300001210
的后继。
参照图3,这一现象说明用户的兴趣没有发生太大的变化,用户兴趣一直稳定。
第二、到达异地区域后,用户在保持着稳定兴趣下,临时产生短暂兴趣。
用户新到了一个异地区域,由于受异地区域特征所吸引,临时会产生短暂兴趣。但自身所具有的稳定兴趣一直保持着,所对应的数学思想表达如下:
对于用户兴趣子主题
Figure BDA00019171898300001211
把其分为两类兴趣主题,
Figure BDA00019171898300001212
Figure BDA00019171898300001213
Figure BDA00019171898300001214
表示用户在异地区域所具有的稳定兴趣,
Figure BDA00019171898300001215
表示用户到达异地区域后新产生的短暂兴趣,
Figure BDA00019171898300001216
的定义与图3所表达的思想一致,
Figure BDA00019171898300001217
Figure BDA00019171898300001218
参照图4,为
Figure BDA00019171898300001219
的定义思想,若不存在前向关联兴趣子主题
Figure BDA00019171898300001220
使得
Figure BDA00019171898300001221
Figure BDA00019171898300001222
的相似度大于阈值ε,即不满足
Figure BDA00019171898300001223
Figure BDA00019171898300001224
是在时间片t中产生的新兴趣主题,所以,用户在异地区域所具有的兴趣子主题
Figure BDA00019171898300001225
第三、离开异地区域后,回到本地区域,短暂兴趣消失,用户重新只拥有稳定兴趣
由于是异地区域,用户迟早会离开,当用户离开异地区域,回到本地后,短暂兴趣消失,用户重新只拥有稳定兴趣。设用户在异地区域的兴趣主题为
Figure BDA00019171898300001226
它包含用户所具有的稳定兴趣
Figure BDA00019171898300001227
短暂兴趣主题
Figure BDA00019171898300001228
回到本地区域后,若不存在后向关联主题
Figure BDA00019171898300001229
使得
Figure BDA00019171898300001230
Figure BDA00019171898300001231
的相似度大于阈值ε,既不满足
Figure BDA00019171898300001232
Figure BDA00019171898300001233
在用户回到本地区域后消失。
参照图5,说明用户已不再具有兴趣主题
Figure BDA00019171898300001234
因此,用户离开异地区域,回到本地区域后,所具有的兴趣子主题
Figure BDA0001917189830000131
(3)、采用LDSSCS模型,在本地区域和异地区域两种情况下,对用户的签到行为进行深层语义分析研究,执行周期兴趣点推荐和时间敏感的下一兴趣点推荐。
在基于位置的网络下,由于用户的签到行为会随时间发生周期性变化,因此把用户的签到行为划分为若干时间段,在每一时间段下,分析影响用户签到行为的因素,在时序变化周期下,主要考虑用户的兴趣爱好变化和用户的社会关系变化对用户签到行为的影响,除了考虑周期兴趣点推荐之外,还采用所提出的LDSSDCS模型对用户整体的签到行为变化进行研究,为用户推荐基于时间敏感的下一个兴趣点。
参照图6,为LDSSDCS模型的构建思路,定义用户集合U={u1,u2,...um},兴趣点集合P={p1,p2,...pn},R∈Rm×n表示包含m个用户和n个兴趣点的用户-兴趣点签到矩阵,把R划分为T={t1,t2,...,t|T|}个时间段子矩阵Rt,每一个子矩阵包含对应时间段的用户签到行为。Z={Z1,Z2,...,ZT}分别表示用户在T={t1,t2,...,t|T|}时刻的用户兴趣点主题。SF、SD、SE分别表示目标用户的直接朋友关系集合、与目标用户有着共同签到行为用户集合、可信推荐专家集合。β={β1,β2,…,β|T|}表示在t时刻控制着用户兴趣点主题Z分布的超参数。
在某一时间段下用户的签到评分Rt被分解为用户特征Ut和兴趣点特征P,由于用户签到行为会随时间t变化而发生变化,定义为Ut,兴趣点特征P被t时间段所有用户共享,定义为P。设置一个开关变量q,当q=0时,设用户在本地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,主要考虑用户的稳定兴趣和用户所具有的双社会关系(包含直接朋友关系集合SF和与其具有共同签到行为关系的用户集合SD)。当用户q=1时,设用户在异地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,主要考虑用户的混合兴趣(稳定兴趣和短暂兴趣)和来自可信推荐专家SE的信息。
另外,由于已出现的用户签到行为兴趣主题可能在后续时间段中再次出现,在图6中,对于当前时间段t,以时间段t-l中兴趣主题分布的加权作为时间段t中相应分布的先验,即时间段t中用户签到行为兴趣子主题分布服Dirichlet先验满足:
Zt=Zt-1w (4)
Zt中的每一列对应时间段t-l中的一个兴趣点-主题分布,w为权重矩阵,其值等于公式(3)中的基于对称KL散度定义的用户兴趣子主题相似度
Figure BDA0001917189830000141
以下为本地区域和异地区域下的周期兴趣点推荐和时间敏感的下一地点推荐:
(a)周期兴趣点推荐
在图6所表示的LDSSCS模型中,当开关变量q=0时,用户在本地区域,把用户所具有的稳定兴趣主题
Figure BDA0001917189830000142
双社会关系集合(包含直接朋友关系集合SF和与其具有共同签到行为关系的用户集合SD)融合到基于时序周期变化的矩阵分解模型中。所得到的最小化目标函数表示如下:
Figure BDA0001917189830000151
Figure BDA0001917189830000152
其中,
Figure BDA0001917189830000153
表示用户ui在时序状态下的签到活动,
Figure BDA0001917189830000154
是在t时刻签到行为指示矩阵,Ut∈Rm×d是在时间状态t下的用户签到行为,表示用户的签到兴趣随时间变化而发生变化。兴趣点特征不随时间发生变化,表示为P∈Rn×d。为避免矩阵分解过拟合问题,引入
Figure BDA0001917189830000155
γ是一个控制U、P、SD和SF的非负数参数。
Figure BDA0001917189830000156
表示矩阵的Frobenius范数的平方,参数α和β是正则化项系数,旨在平衡本地区域下共同签到行为社会关系和共同朋友社会关系与传统协同过滤模型下的共同影响。条件项表示本地区域的两种情况,第一种情况是用户一直在本地区域,第二种情况是用户由异地区域回到了本地区域。
ωik∈(0,1)表示用户ui和uk在共同签到用户兴趣点行为下的连接权重。
ωif∈(0,1)表示用户ui和uf在考虑直接朋友连接关系下的权重。wik和wif的计算公式分别如下:
Figure BDA0001917189830000161
其中,
Figure BDA0001917189830000162
表示用户ui已签到的兴趣点集合,
Figure BDA0001917189830000163
表示用户uk已签到的兴趣点集合。
Figure BDA0001917189830000164
其中,G(ui)表示用户ui所具有的直接朋友关系集合,G(Uf)表示用户uf所具有的直接朋友关系集合,|x|表示X集合的基数。
当开关变量q=1时,用户在异地区域,把用户所具有的混合兴趣主题(稳定兴趣和短暂兴趣)
Figure BDA0001917189830000165
可信推荐专家SE融合到基于时序周期变化的矩阵分解模型中,所得到的最小化目标函数表示如下:
Figure BDA0001917189830000166
Figure BDA0001917189830000167
公式(8)中,相关参数的含义与公式(5)中所表达的含义一致,需要强调的几个参数是可信推荐专家集合SE和用户ui与可信推荐专家ue连接的权重ωie∈(0,1)。在进行异地区域时,依据自身丰富的有价值标签签到行为,为用户ui提供有价值的知识,让用户来到异地后,除了根据自身稳定兴趣选择访问的兴趣点外,还可以根据可信推荐专家的额建议,选择具有本土特色的一些兴趣点进行访问。可信推荐专家定义如下:采用TF-IDF值计算用户对某些兴趣点类别感兴趣的程度,计算公式如下:
Figure BDA0001917189830000171
其中,|u.pi:pi.c=c′|表示用户u在其所签到的兴趣点对应的类别c′上的访问次数,|u,P|表示用户u访问的所有兴趣点的总次数,|uj.c′∈uj.C|是在所有的用户中已访问类别c′的用户的数量,|U|表示所有的用户数。可见,用户u的兴趣点类别权重值越大,u.wc′越大,用户u越有希望成为此兴趣点类别的专家。因此,在某一时间段t下,计算异地区域所有用户u签到的兴趣点类别权重,在每一类别下,选择Top-K个最高的用户作为可信推荐专家SE推荐给用户。用户ui来到异地后,可以参考这些可信推荐专家的建议,选择有价值的兴趣点进行访问。另外,我们规定,用户ui与可推荐专家ue连接的权重wie=ue.wc′
(b)基于时间敏感的下一个兴趣点推荐
在连续的时间段,用户的签到行为之间存在紧密的联系。在周期兴趣点推荐的基础上,基于时间敏感的本地区域的下一个兴趣点推荐模型定义如下:
Figure BDA0001917189830000172
Figure BDA0001917189830000181
其中,正则项参数λ旨在调节用户的下一签到行为项与其他项之间的相互影响。St.t-1∈[0,1]和St.t+1∈[0,1]都是时序系数,分别用来测量用户ui在时序状态t和t-1之间的紧密度,t和t+1之间的紧密度。St.t-1和St.t+1越大,用户在时间段t-1、t和t+1之间的签到爱好越紧密,使用余弦相似度分别定义St.t-1和St.t+1
Figure BDA0001917189830000182
Figure BDA0001917189830000183
其中,Ct-1(i,:)、Ct(i,:)和Ct+1(i,:)分别表示用户在时间段t-1、t和t+1内签到用户集合。
基于时间敏感的异地区域的下一个兴趣点推荐模型定义如下:
Figure BDA0001917189830000184
Figure BDA0001917189830000185
公式(13)中所使用的参数与上述所述公式使用参数的含义一致。
(4)优化LDSSCS模型和估计相应的参数
第(3)不详细描述了LDSSCS模型的构建过程,构建好模型后,还需要对此模型进行优化,本项目拟采用随机梯度下降算法优化LDSSCS模型。使用随机梯度下降算法随机扫描所有训练数据,并沿着目标函数梯度下降的方向更新参数,每一次更新按如下公式执行:
Figure BDA0001917189830000191
其中,ξ是学习速率,Λ表示描述LDSSCS模型的构建过程所涉及的参数,
Figure BDA0001917189830000192
对应着公式(5)、(8)、(10)和(13)所表述的目标函数。
(5)研究基于TOP-K的个性化动态即时兴趣点推荐服务
基于所构建的用户行为偏好模型,当目标用户ui在某一时刻t某一位置l想选择自己喜欢的某一兴趣点进行访问时,其实,就是在t时刻,基于所构建的LDSSCS模型,在已知三元组(ui,t,l)的情况下,执行一个查询任务,首先判断基于上一时刻。用户所处的位置l是本地区域还是异地区域,如果是本地区域,执行基于用户稳定兴趣和双社会关系的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户;如果是异地区域,执行基于混合兴趣和可信推荐专家信息的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户。
为验证该发明的有效性,加快算法的运行徐达,拟搭建并行分布式的云计算环境,使用Hadoop对推荐模型进行部署,采用MapReduce的工作方式对本课题所涉及的任务实施分布式并行处理。
实施例:采集和预处理用户签到行为数据集。初步打算采集Foursquare站点和Gowalla站点下的用户签到行为数据,包含用户信息、兴趣点信息、用户的签到信息等,对所采集到的用户签到行为数据进行预处理,过滤掉签到兴趣点极少的用户和被用户签到很少的兴趣点。
根据用户在不同时间段具有的兴趣爱好不同,合理划分时间段,使用高斯核密度估计用户签到所述的位置是“本地区域”还是“异地区域”。
使用对称KL散度方法计算用户兴趣在连续两个时间段的相似度,在此基础上,依据用户签到行为所处的位置,表示用户签到行为兴趣变化的种类。
构建本发明所提出的基于矩阵分解的LDSSCS模型,并使用随机梯度下降发对LDSSCS模型进行优化和参数估计。
使用所采集的Foursquare数据集和Gowalla数据集,和四种评价指标(准确率、排序度量指标、平均绝对误差和方根误差)评测本发明所提出的LDSSCS模型的性能,并和已有的兴趣点推荐方法进行性能对比分析。
综上所述,本发明基于用户的位置变化,不仅能够为用户推荐最可能感兴趣的地点,提高用户的生活质量,而且能够为商家发掘潜在客户,增加商业利益,为基于位置的社交网络下的兴趣点推荐提供支持,促进移动应用和服务领域的进一步发展。
以上公开的仅为本发明的一个具体实施例,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (3)

1.基于用户签到行为变化深层语义分析的兴趣点推荐方法,其特征在于,包括:
步骤一、采集用户签到行为数据,并进行预处理;
步骤二、按照等时段划分预处理后的用户签到行为数据集合C,得到T个子集;
步骤三、使用二维高斯核密度估计方法识别用户所处的本地区域或者异地区域;
步骤四、构建LDSSCS模型对用户的签到行为进行深层语义特征分析;
步骤五、优化LDSSCS模型和参数估计;
步骤六、将基于Top-K的个性化动态即时兴趣点推荐给用户;
所述步骤三中使用高斯核密度估计识别用户的本地区域或者异地区域,指将空间二维的经纬度坐标融入到核密度估计方法中,根据用户签到历史位置的经纬度坐标得到用户将签到位置l的概率,设任意位置li的经纬度坐标为l′i=(lati,logi)T,依据用户签到的历史位置经纬度坐标,计算签到候选兴趣点位置l的概率值:
Figure FDF0000011819590000011
其中,|Lu|表示用户u的签到历史位置总的数量,H为核函数带宽,K为核函数,采用高斯核函数选取,如下所示:
Figure FDF0000011819590000012
所述步骤四中,定义用户集合U={u1,u2,...um},兴趣点集合P={p1,p2,...pn},R∈Rm×n表示包含m个用户和n个兴趣点的用户-兴趣点签到矩阵,把R划分为T={t1,t2,...,t|T|}个时间段子矩阵Rt,每一个子矩阵包含对应时间段的用户签到行为;Z={Z1,Z2,...,ZT}分别表示用户在T={t1,t2,...,t|T|}时刻的用户兴趣点主题;SF、SD、SE分别表示目标用户的直接朋友关系集合、与目标用户有着共同签到行为的用户集合、可信推荐专家集合;β={β1,β2,…,β|T|}表示在t时刻控制着用户兴趣点主题Z分布的超参数;
在某一时间段下用户的签到评分Rt被分解为用户特征Ut和兴趣点特征P,由于用户签到行为会随时间t变化而发生变化,定义为Ut,兴趣点特征P被t时间段所有用户共享,定义为P;设置一个开关变量q,当q=0时,设用户在本地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,考虑用户的稳定兴趣和用户所具有的双社会关系,即包含直接朋友关系集合SF和与其具有共同签到行为关系的用户集合SD;当q=1时,设用户在异地区域,执行周期兴趣点推荐和时间敏感的下一地点推荐时,考虑用户的混合兴趣,即稳定兴趣和短暂兴趣,以及来自可信推荐专家SE的信息;
(a)周期兴趣点推荐
在LDSSCS模型中,当开关变量q=0时,用户在本地区域,把用户所具有的稳定兴趣主题
Figure FDF0000011819590000021
双社会关系集合融合到基于时序周期变化的矩阵分解模型中,所得到的最小化目标函数表示如下:
Figure FDF0000011819590000031
Figure FDF0000011819590000032
Figure FDF0000011819590000033
其中,
Figure FDF0000011819590000034
表示用户ui在时序状态下的签到活动,
Figure FDF0000011819590000035
是在t时刻签到行为指示矩阵,Ut∈Rm×d是在时间状态t下的用户签到行为,表示用户的签到兴趣随时间变化而发生变化,兴趣点特征不随时间发生变化,表示为P∈Rn×d,γ是控制U、P、SD和SF的非负数参数,
Figure FDF0000011819590000036
表示矩阵的Frobenius范数的平方,参数α和β是正则化项系数,条件项表示本地区域的两种情况,第一种情况是用户一直在本地区域,第二种情况是用户由异地区域回到了本地区域,wik∈(0,1)表示用户ui和uk在共同签到用户兴趣点行为下的连接权重,wif∈(0,1)表示用户ui和uf在考虑直接朋友连接关系下的权重,wik和wif的计算公式分别如下:
Figure FDF0000011819590000037
其中,
Figure FDF0000011819590000038
表示用户ui已签到的兴趣点集合,
Figure FDF0000011819590000039
表示用户uk已签到的兴趣点集合;
Figure FDF0000011819590000041
其中,G(ui)表示用户ui所具有的直接朋友关系集合,G(Uf)表示用户uf所具有的直接朋友关系集合,|x|表示X集合的基数;
当开关变量q=1时,用户在异地区域,把用户所具有的混合兴趣主题
Figure FDF0000011819590000045
可信推荐专家SE融合到基于时序周期变化的矩阵分解模型中,所得到的最小化目标函数表示如下:
Figure FDF0000011819590000042
Figure FDF0000011819590000043
(b)基于时间敏感的下一个兴趣点推荐
在周期兴趣点推荐的基础上,基于时间敏感的本地区域的下一个兴趣点推荐模型定义如下:
Figure FDF0000011819590000044
Figure FDF0000011819590000051
Figure FDF0000011819590000052
其中,St.t-1∈[0,1]和St.t+1∈[0,1]都是时序系数,分别用来测量用户ui在时序状态t和t-1之间的紧密度,t和t+1之间的紧密度,St.t-1和St.t+1越大,用户在时间段t-1、t和t+1之间的签到爱好越紧密,使用余弦相似度分别定义St.t-1和St.t+1
Figure FDF0000011819590000053
Figure FDF0000011819590000054
其中,Ct-1(i,:)、Ct(i,:)和Ct+1(i,:)分别表示用户在时间段t-1、t和t+1内签到用户集合;
基于时间敏感的异地区域的下一个兴趣点推荐模型定义如下:
Figure FDF0000011819590000055
Figure FDF0000011819590000056
2.如权利要求1所述的方法,其特征在于,所述步骤五中,采用随机梯度算法优化LDSSCS模型,使用随机梯度下降算法随机扫描所有训练数据,并沿着目标函数梯度下降的方向更新参数,每一次更新按如下公式执行:
Figure FDF0000011819590000061
其中,ξ是学习速率,Λ表示描述LDSSCS模型的构建过程中所涉及的参数。
3.如权利要求1所述的方法,其特征在于,所述步骤六中,基于所构建的用户行为偏好模型,当目标用户ui在某一时刻t某一位置l想选择自己喜欢的某一兴趣点进行访问时,即是在t时刻,基于所构建的LDSSCS模型,在已知三元组(ui,t,l)的情况下,执行一个查询任务,首先判断相对于上一时刻,用户所处的位置l是本地区域还是异地区域,如果是本地区域,执行基于用户稳定兴趣和双社会关系的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户;如果是异地区域,执行基于混合兴趣和可信推荐专家信息的时间敏感的下一地点推荐服务,选择前TOP-K个评分最高的兴趣点推荐给用户。
CN201811578531.3A 2018-12-24 2018-12-24 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 Active CN109684561B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811578531.3A CN109684561B (zh) 2018-12-24 2018-12-24 基于用户签到行为变化的深层语义分析的兴趣点推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811578531.3A CN109684561B (zh) 2018-12-24 2018-12-24 基于用户签到行为变化的深层语义分析的兴趣点推荐方法

Publications (2)

Publication Number Publication Date
CN109684561A CN109684561A (zh) 2019-04-26
CN109684561B true CN109684561B (zh) 2021-06-08

Family

ID=66188772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811578531.3A Active CN109684561B (zh) 2018-12-24 2018-12-24 基于用户签到行为变化的深层语义分析的兴趣点推荐方法

Country Status (1)

Country Link
CN (1) CN109684561B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399565B (zh) * 2019-07-29 2021-08-06 北京理工大学 基于时空周期注意力机制的递归神经网络兴趣点推荐方法
CN110888951B (zh) * 2019-11-09 2023-06-09 华东师范大学 一种基于语义轨迹的区域内兴趣点需求挖掘和选址方法及排名和分析系统
CN110990717B (zh) * 2019-11-22 2023-03-31 广西师范大学 一种基于跨域关联的兴趣点推荐方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740401A (zh) * 2016-01-28 2016-07-06 北京理工大学 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130132194A1 (en) * 2011-11-17 2013-05-23 Giridhar Rajaram Targeting advertisements to users of a social networking system based on events
CN107085599B (zh) * 2017-03-31 2021-05-14 百度在线网络技术(北京)有限公司 Poi推荐方法、装置、设备及计算机可读存储介质
CN107562947B (zh) * 2017-09-26 2021-07-02 宿州学院 一种移动时空感知下动态即时推荐服务模型建立方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740401A (zh) * 2016-01-28 2016-07-06 北京理工大学 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置

Also Published As

Publication number Publication date
CN109684561A (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
CN110555112B (zh) 一种基于用户正负偏好学习的兴趣点推荐方法
CN108256093B (zh) 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法
CN105740401B (zh) 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置
Xing et al. Points-of-interest recommendation based on convolution matrix factorization
Wang et al. Towards real-time demand-aware sequential POI recommendation
CN109508428B (zh) 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法
Lu et al. GLR: A graph-based latent representation model for successive POI recommendation
CN109684561B (zh) 基于用户签到行为变化的深层语义分析的兴趣点推荐方法
CN109062962A (zh) 一种融合天气信息的门控循环神经网络兴趣点推荐方法
CN104268292A (zh) 画像系统的标签词库更新方法
CN109933720B (zh) 一种基于用户兴趣自适应演化的动态推荐方法
CN108897750B (zh) 融合多元上下文信息的个性化地点推荐方法及设备
CN105528395A (zh) 一种潜在消费者推荐方法及系统
CN109190040B (zh) 基于协同演化的个性化推荐方法及装置
Chen et al. Improved course recommendation algorithm based on collaborative filtering
da Costa Fortes et al. Ensemble learning in recommender systems: Combining multiple user interactions for ranking personalization
CN116244513A (zh) 随机群组poi推荐方法、系统、设备及存储介质
Ma et al. Exploring multiple spatio-temporal information for point-of-interest recommendation
Zheng et al. Deep CNN‐Assisted Personalized Recommendation over Big Data for Mobile Wireless Networks
Noorian Avval et al. A hybrid recommender system using topic modeling and prefixspan algorithm in social media
CN107909498B (zh) 基于最大化接受者操作特征曲线下方面积的推荐方法
Liao et al. An integrated model based on deep multimodal and rank learning for point-of-interest recommendation
Thaipisutikul et al. Pattern-based dual learning for point-of-interest (POI) recommendation
CN114417166A (zh) 基于行为序列和动态社交影响的连续兴趣点推荐方法
Ma et al. Multi-factor fusion POI recommendation model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant