CN105740401A - 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置 - Google Patents

一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置 Download PDF

Info

Publication number
CN105740401A
CN105740401A CN201610059756.2A CN201610059756A CN105740401A CN 105740401 A CN105740401 A CN 105740401A CN 201610059756 A CN201610059756 A CN 201610059756A CN 105740401 A CN105740401 A CN 105740401A
Authority
CN
China
Prior art keywords
place
user
classification
users
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610059756.2A
Other languages
English (en)
Other versions
CN105740401B (zh
Inventor
礼欣
陈佳良
李侃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201610059756.2A priority Critical patent/CN105740401B/zh
Publication of CN105740401A publication Critical patent/CN105740401A/zh
Application granted granted Critical
Publication of CN105740401B publication Critical patent/CN105740401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置,属于地点推荐领域。该方法首先通过分析用户的个体行为,确定用户未来将会去到哪一类别的地点,然后通过对用户进行特征提取来对用户进行群体的划分,接着对用户所在群体中属于第一步中确定的地点类别的地点进行排序,从而为用户推荐具体地点。本发明综合考虑用户的个体行为,用户所在群体的兴趣以及用户签到地点之间的距离关系,利用地点类别作为连接个体行为和群体兴趣的桥梁,从而挖掘用户兴趣并进行推荐,其意义在于,本发明与现有技术相比,不仅能够提高推荐的质量,并且也大幅度减少了推荐算法的时间复杂度,提高了推荐效率。

Description

一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置
技术领域
本发明涉及一种兴趣地点推荐方法及装置,特别涉及一种基于用户历史行为和小组兴趣的地点推荐方法及装置,属于地点推荐技术领域。
背景技术
随着移动互联网技术的不断发展和手机等智能终端设备的普及,以及在线社交网络服务的逐渐完善,使得人类使用互联网的方式产生了深刻变革——由简单信息搜索和网页浏览转向网上社会关系的构建与维护、基于社会关系的信息创造、交流和共享。用户可以通过移动设备和社交网络分享他们目前所在的地点,并对此地点进行相关的评论,而这些行为都因为移动互联网技术的普及而变得轻而易举,由此导致的结果是信息的数量呈爆发式的增长。因此,如何从大量的信息中获取用户最感兴趣的内容就变得十分重要。而这就是推荐系统需要进行的工作。
在现有的研究中,地点推荐所使用的主流技术是:利用协同过滤的算法为用户推荐相关地点。而在这其中又主要分为两个部分:基于用户的协同过滤和基于矩阵分解模型的协同过滤。在基于用户的协同过滤中,通过利用用户对某一地点的打分来形成用户的特征向量,然后使用皮尔逊相关性公式计算不同用户的相似度,找到与待推荐用户相似的用户,最后将与待推荐用户相似的用户去过的而待推荐用户没有去过的地点作为候选地点进行推荐。在基于矩阵分解模型的协同过滤算法中,会形成一个用户和地点之间的评分矩阵,通过矩阵分解再还原的技术估算出矩阵中丢失的评分值,就可以预测用户对未去过地点的评分值。除了协同过滤相关算法外,还有利用用户社交网络的文本特征挖掘用户兴趣并进行推荐的相关研究。
但是,在采用基于用户协同过滤相关算法时,对于新用户,容易因用户历史数据空白造成冷启动等问题而导致推荐效果不佳。而基于矩阵分解的推荐算法中,用户以及地点数量众多,但是用户个人的数据稀少,这就会导致评分矩阵的维度多但数据稀疏,从而造成推荐效果不佳并且运算效率底下的问题。
发明内容
本发明的目的是为了解决在进行地点推荐时因数据稀疏而造成的推荐效果不佳和效率低下的问题,在兴趣地点推荐领域提供了一种基于个体行为特性和群体兴趣的地点推荐方法及装置。该方法能够利用个体行为特性确定用户下一步将会去往什么类型的地点,再根据用户所在群体信息对该类型的具体地点进行排序,从而为用户推荐出最符合要求的具体的兴趣地点。由于在确定用户将会出现的地点时,本发明使用地点的类型来代替具体的地点,从而大幅度减少了算法的时间复杂度,并且群体兴趣的加入,也使得更多的推荐信息被加入到推荐系统中,提高了推荐的效果。
本发明的思想是,首先,通过对用户历史签到数据的分析,计算出每个用户的具有马尔科夫性质的地点状态转移矩阵,结合该转移矩阵和用户目前所在位置,推断出用户下一次将会出现在哪一类型的地点中;其次,根据用户的特征对用户进行群体的划分,在确定用户下次出现的地点类别的情况下对用户所在群体中该类别的具体地点进行排序,从而挑选出排名靠前的具体地点推荐给用户。
本发明的具体实现步骤如下:
一种基于个体行为的地点类别预测方法,该方法包括以下步骤:
步骤一、获取用户的历史签到数据,并将用户的签到地点按时间进行排序;
步骤二、通过使用地点分类信息将用户签到的具体地点转换为地点的类别序号;
步骤三、对用户的历史数据进行预处理,形成<用户序号,目前所在地点类别,下次出现地点类别>这样的三元组形式的输入数据;
步骤四、结合输入数据,利用张量分解的方法对用户地点转移张量进行分解再还原,从而还原出张量中缺失的值;根据用户地点转移张量以及用户目前所在地点类别寻找出下次出现地点类别中的最大值对应的地点类别输出即可。
作为优选,所述地点分类信息采用Foursquare分类。
作为优选,所述利用张量分解的方法对用户地点转移张量进行分解再还原,从而还原出张量中缺失的值通过以下过程得到:
1、使用符合均值为0,协方差矩阵为λΘI的正态分布来初始化参数集合Θ{U,P,NU,NP},其中,I为单位矩阵,λΘ为与模型相关的正则化参数,U为所有用户的特征向量形成的矩阵,大小为|U|*F,|U|为用户的总数量,F为用户的特征向量的维度;P为用户目前所在的地点类别的特征向量形成的矩阵,大小为|P|*F;NU为用户下一次将要去的地点类别的特征向量形成的矩阵,但由于其将来要进行乘积运算的对象是用户特征矩阵U,所以其右上角使用U来进行表示,其大小为|NU|*F;NP与NU的意义相同,只不过其将来要进行乘积运算的对象是用户上一次去的地点类别的特征矩阵P,所以其右上角使用P来进行表示;
2、结合上一步中初始化的参数集合Θ,使用PITF张量分解公式: 来还原用户的地点类别转移张量,其中uu,f为用户u的特征向量的第f维的值;pp,f为用户目前所在地点类别p的特征向量的第f维的值;均表示用户将要去地点类别n的特征向量的第f维的值,但因其相乘的对象不同,一个相乘对象是用户u的特征值,另一个为用户目前所在地点类别p的特征值,所以右上角的标示也不同,分别为U和P;通过对这四个特征向量的每一个维度进行相乘求和,就可以最终得出用户u从地点类别p转移到类别n的可能性的值su,p,n
3、对于用户u,从输入的<用户序号,目前所在地点类别,下次出现地点类别>这样的所有关于用户u的三元组中随机挑选一个三元组<u,p,ni>;假设u所在的小组为G,利用公式计算该小组内所有用户在地点类别为p时转移到地点类别ni的可能性的平均值,记作其中|G|表示小组G中的用户数;然后根据公式来计算最终用户u从地点类别p转移到地点类别ni的可能性的值其中,ρ是一个权衡因子,取值范围为[0,1],用来权衡用户所在群体的兴趣对用户个人兴趣的影响;然后再从所有的地点类别中随机挑选出类别nj,且满足<u,p,nj>并没有出现在输入的三元组数据当中,即用户从未从地点类别p去过地点类别nj,并计算出
4、根据上一步中计算得到的带入如下公式:
l n &sigma; ( s G u , p , n i - s u , p , n j ) - &lambda; &Theta; | | &Theta; | | 2 - - - ( 1 )
其中函数σ(x)为logistic函数‖Θ‖2表示参数集合的二范式;最后使用梯度下降的优化算法,对Θ集合中每个参数中的对应的u,p,ni,nj的特征向量的每个维度的值进行一次更新计算,从而完成参数集合Θ的一次迭代;
5、重复步骤2-4,使得迭代次数满足:三元组数量×factor,其中factor为大于1的整数,factor越大,迭代的次数越多,这样尽可能使得每个输入的三元组能够被利用到;
6、迭代结束后,得到最终的参数集合Θ{U,P,NU,NP},最后利用公式就可以还原出所有用户的地点类别转移张量。
一种基于个体行为和群体兴趣的兴趣地点推荐方法,该方法包括以下步骤:
步骤一、通过使用地点分类信息将用户签到的具体地点转换为地点的类别序号;
步骤二、利用每个用户转换过的地点类别,对用户进行特征向量的建立;
步骤三、根据用户特征向量,使用聚类的方法,对用户进行分组聚类;
步骤四、结合所述一种基于个体行为的地点类别预测方法中确定的用户下一次将要出现的地点类别,对用户所在群体中的所有用户去过的该类别地点进行排序;
步骤五、将排序后的结果取TOP-N,即取前N个地点推荐给用户。
作为优选,所述地点分类信息采用Foursquare分类。
作为优选,所述聚类方法为k-means聚类方法。
作为优选,所述用户特征向量包括Foursquare中的每个地点类别对于用户的权重以及用户常驻地点的经纬度。
作为优选,所述权重通过下述公式进行计算:
u . w c = | u . v c | | u . V | * log | U | | { u : c &Element; u . C } | ; - - - ( 2 )
其中,|u.vc|表示用户u访问过地点类别c的次数,|u.V|表示用户访问所有类别的次数总和,|U|表示用户的总数,|{u:c∈u.C}|表示所有用户中访问过地点类别c的人数,u.wc表示地点类别c对用户u的权重值。
作为优选,所述对用户所在群体中的所有用户去过的该类别地点进行排序采用Weighted-HITS方法,具体过程如下:
1、对于待推荐用户u,我们已知其目前所在地点为lu*,以及其下一次将要出现的地点类别c,为了迭代计算用户u所在小组G内的所有用户和类别为c的地点的评分,我们需先对小组内的所有用户所去过的类别为c的地点进行评分的初始化,用vm·s0表示类别为c的地点vm的初始值,我们统计小组G内去过地点vm的用户数,作为地点vm的初始值vm·s0
2、对于用户u与其所在小组G,利用如下迭代公式:
u i &CenterDot; s t + 1 = &Sigma; v i &Element; V u i v i &CenterDot; s t ; - - - ( 3 )
v m &CenterDot; s t + 1 = &Sigma; u j &Element; U v m 1 d i s t ( l u * , v m ) u j &CenterDot; s t + 1 ; - - - ( 4 )
对用户u所在小组G内的所有地点进行排序,其中,ui.s和vi.s分别表示用户ui和地点vi的分数,dist(lu*,vm)代表用户现在所处的位置和地点vm的位置之间的距离,表示用户u所到过的类别为c的地点集合,表示到过地点vm的用户的集合,t表示当前的迭代次数;其中公式中计算的地点的类别均为c;
3、重复步骤2直到满足迭代次数后停止迭代,然后按照用户u所在小组G内的所有地点的分数从高到低排序并输出。
一种基于个体行为和群体兴趣的兴趣地点推荐装置,包括群体划分模块;用户地点转移矩阵模型计算模块和群体内地点排序模块,群体划分模块分别与用户地点转移矩阵模型计算模块和群体内地点排序模块相连,用户地点转移矩阵模型计算模块和群体内地点排序模块相连;
群体划分模块用于对所有用户进行小组的划分;
用户地点转移矩阵模型计算模块用于采用所述一种基于个体行为的地点类别预测方法预测用户将要去的地点类别;
群体内地点排序模块用于根据用户地点转移矩阵模型计算模块输出的地点类别将用户所在小组内所有用户去过的该类别的地点采用Weighted-HITS方法进行降序排序,并将前N个地点推荐给用户。
作为优选,所述群体划分模块采用聚类方法根据用户特征向量进行分组。
有益效果
本发明针对兴趣地点推荐领域,综合考虑个体自己本身的行为特征和个体所在群体的兴趣特征,以及用户签到地点之间的距离关系,利用地点类别作为连接个体行为和群体兴趣的桥梁,从而挖掘用户兴趣并进行推荐。其意义在于,对用户所推荐的地点更符合用户自身的行为习惯,并且能够利用相同兴趣群体的信息发掘出用户未曾到过的新的地点,有效提高推荐的质量。除此之外,在具体推荐过程中使用地点类别来进行预测,有效的解决了用户数据稀疏和状态转移矩阵维度过高的问题,大幅度减少推荐方法的时间复杂度,提升了推荐的准确度和效率。
附图说明
图1为本发明实施例中基于个体行为的地点类别预测方法流程图;
图2为本发明实施例中基于群体兴趣的地点排序方法流程图;
图3为本发明实施例中用户签到地点的类别转换示意图;
图4为本发明实施例中Foursquare地点类别层级图;
图5为本发明实施例中单个用户状态转移矩阵和所有用户地点转移张量;
图6为本发明实施例中美国洛杉矶的部分签到地点图;
图7为本发明实施例中用户所去地点之间距离的统计图;
图8为本发明实施例中所提出来的Distance-WeightedHITS算法的原理图;
图9为本发明实施例中运行效率的对比图;
图10为本发明实施例一种基于个体行为和群体兴趣的兴趣地点推荐方法流程示意图。
具体实施方式
下面结合附图与实施例对本发明进行详细介绍。
如图10所示为一种基于个体行为和群体兴趣的兴趣地点推荐方法流程示意图,从图中可以看出,根据用户的历史签到记录可以确定用户下一步要去的地点类别以及提取用户特征并进行群体划分,然后根据群体划分结果和用户下一步要去的地点类别可以对群体内的地点进行排序,根据排序结果为用户推荐具体的地点。下面对该流程进行详细介绍。
图1是本发明实施例中基于个体行为的地点类别预测方法流程图。具体流程如下:
首先,获取用户以往的签到地点记录,对每一个用户而言,其签到地点都会有时间信息,按照时间由远及近的顺序,对用户的签到地点进行排序;
其次,将用户签到地点转换为该地点所属类别。对于用户的每一个签到地点来说,它都会归属于某一个类别,比如,对于一家名叫“湘家菜馆”的饭店来说,首先它是属于“中国菜馆”这一类别的,再往上,“中国菜馆”又属于“亚洲餐馆”这一类别,而不管“亚洲餐馆”还是“美洲餐馆”,都又是属于“食物”这一大类的,所以,一个“湘家菜馆”归属于“中国菜馆”->“亚洲餐馆”->“食物”这样一个三级分类结构。因此,如图3所示,对于每一个用户的每一个具体的签到地点来讲,都能够找到其所属的类别。通常情况下有两种方式来构建这个地点的层级结构:(1)利用已有的知识构建(2)利用层级聚类方法进行构建。而在本方法中,我们利用方法(1)来构建这个地点的层级结构,我们使用Foursquare的地点分类层级结构,如图4所示,将每一个具体地点按照Foursquare的分类信息进行归类,在这里,我们将每一个地点都替换为其所属的第二个层次的类别信息。
通过以上两个步骤,用户的历史数据已经转换为有序的地点类别信息,然后对每一个用户的信息进行处理,从而形成有效的输入数据。其方法如下:对于每一个用户,依次截取其一个签到地点类别和其相邻的签到地点类别,再加上用户的序号,就形成了<用户,目前所在地点类别,下次出现地点类别>这样的三元组。因此,每一个用户的历史信息就由很多个这样的三元组组成。
如图5所示,对于每一个用户user来讲,他的地点转移状态会形成一个矩阵,通过矩阵我们就可以得到用户从一个类别的地点转移到另一个类别的地点可能性的大小,因此根据用户现在所在地点的类别Currentcategory就可以判断出用户下次将要出现的地点的类别Nextcategory。所以,我们要学习的就是这个用户的状态转移矩阵,而对所有N个用户(u1、u2、u3……)来讲,N个状态转移矩阵就形成了一个张量。我们结合PairwiseInteractionTensorFactorizationmodel(PITF)的张量分解方法和GroupBayesianPersonalizedRanking(GBPR)的优化算法,训练出每一个用户的地点转移矩阵,得到一个完整的用户转移张量。下面我们就详细描述PITF和GBPR这两个算法。
在传统的张量分解方法中,TuckerDecomposition(TD)和CanonicalDecomposition(CD)是较为常用的张量分解方法,而PITF是基于CD的张量分解方法,PITF主要关注用户、用户目前所在地点类别和用户将要出现的地点类别这三个因素之间的两两关系,其分解公式如下:
ST=UN×NU+PN×NP+UP×PU(5)
其中ST表示用户的地点类别转移张量,UN和UP均表示所有用户的特征向量形成的矩阵,但因其相乘的对象不同,所以右上角的字符也不同,分别表示相乘对象为用户下次要去的地点类别的特征矩阵N和用户目前所在地点类别的特征矩阵P;PN和PU均表示用户目前所在地点类别的特征矩阵,同理,因其相乘对象不同,所以右上角的字符也不同,分别表示相乘对象为用户下次要去的地点类别的特征矩阵P和用户的特征矩阵U;NP和NU均表示用户下次要去的地点的特征矩阵,右上角的字符分别表示相乘对象为用户目前所在地点类别的特征矩阵P和用户的特征矩阵U。我们希望能够通过学习公式5中右边的6个参数矩阵,来还原出ST中缺失的值。
对于张量ST中的某一个值,其计算公式如下:
s u , p , n = &Sigma; F u u , f N &CenterDot; n n , f U + &Sigma; F p p , f N &CenterDot; n n , f P + &Sigma; F u u , f P &CenterDot; p p , f U - - - ( 6 )
其中u代表用户,p代表用户目前所在地点类别,n代表用户将要出现的地点类别,su,p,n是一个实数值,其值越大,表示用户u从地点类别p转移到地点类别n的可能性越大;其中,uu,f为用户u的特征向量的第f维的值;pp,f为用户目前所在地点类别p的特征向量的第f维的值;nn,f为用户下一步要去的地点类别n的特征向量的第f维的值;这些变量右上角的变量表示了其相乘的对象,右上角为N表示其所乘对象为用户下一次将要去的地点类别的特征向量的某一维度的特征值;右上角为U表示其所乘对象为用户的特征向量的某一维度的特征值;右上角为P表示其所乘对象为用户目前所在的地点类别的特征向量的某一维度的特征值。而F表示这些特征向量的维度大小,其值可以根据具体的使用环境而进行更改,默认为64。由于后面所使用的GBPR的优化算法的关系,公式的第三项:会被消除,所以最终PITF的公式可以被简化为公式(7):
s u , p , n = &Sigma; F u u , f N &CenterDot; n n , f U + &Sigma; F p p , f N &CenterDot; n n , f P - - - ( 7 )
而最终我们要学习的PITF的参数如公式(8)所示,我们使用变量Θ来代表参数集合{U,P,NU,NP}。
其中,|U|表示总的用户的数量,|P|=|N|表示总的地点的数量。F为特征向量的维度大小,默认为64。所以U是用户特征向量形成的大小为|U|×F的矩阵,P为地点的特征向量形成的大小为|P|×F的矩阵,NU和NP也表示地点的特征向量形成的大小为|N|×F的矩阵,只不过其作用对象分别为用户U和用户目前所在地点P。
为了学习参数集Θ,我们采用GBPR的优化算法。GBPR算法是在传统的BayesianPersonalizedRanking(BPR)算法的基础上,结合群体兴趣这个属性而进行的一种更有效的优化算法。
在BPR算法中,它将评分的预测问题看作是排序问题,并且假设排序列表中每个项目都是严格有序的。用户对物品进行评分的目的就是希望能按照评分顺序来进行大小的排序,而在BPR中希望能忽略评分的作用而直接对物品进行排序,从而根据排序结果给物品一个大致的分数,而此分数又不会影响已经确定的排名顺序。例如下面的公式:
公式(9)左边的式子表示对于用户u来讲,他目前在地点p时,下一次将要去地点ni的概率要大于去地点nj的概率。而公式右边的两个数的意义就和PITF公式中的意义一样,分别表示在用户u的状态转移矩阵中,从地点p分别转移到地点ni和地点nj的可能性的大小。而“>”符号就表示用户下次宁愿去地点ni而不是地点nj。这样,保持用户状态转移矩阵中每一行所有项之间两两有序,就可以保证用户下次将要去的地点之间会有一个排好的序列了。在BPR算法的初始化中,如果用户u曾经从地点p到过地点ni而没有到过地点nj,则就认为 s u , p , n j > s u , p , n j .
与BPR算法不同的是,GBPR算法则认为小组整体的兴趣对用户的选择有更大的影响作用。这个思路与本发明的想法相同,即:小组的整体兴趣会对用户的抉择有着较大影响。因此,本发明采用GBPR的方法来作为优化算法。根据GBPR算法的思路,我们用如下公式来更新公式(10):
s G u , p , n i > s u , p , n j - - - ( 10 )
其中 s G u , p , n i = &rho;s G , p , n i + ( 1 - &rho; ) s u , p , n i , s G , p , n i = 1 | G | &Sigma; u &Element; G s u , p , n i , G代表用户u所在小组的集合,ρ作为小组兴趣和个人兴趣的一个权衡因子,其取值范围在(0,1)之间。然后,我们通过最大化后验概率的方法,来优化排序的结果,其公式如下:
max &Theta; p ( &Theta; | s G u , p , n i > s u , p , n j ) &Proportional; max &Theta; p ( s G u , p , n i > s u , p , n j | &Theta; ) p ( &Theta; ) - - - ( 11 )
其中,为后验概率,表示在已知用户部分偏好的情况下,参数为Θ的概率,表示后验概率所等价的贝叶斯公式的似然函数,p(Θ)表示后验概率所等价的贝叶斯公式的先验概率,∝表示等价于。在这个公式里,我们有两个假设:第一,我们假设每个用户之间是相互独立的;第二,p(Θ)是一个以0为均值,λΘI为协方差矩阵的正态分布,其中I表示单位矩阵,λΘ表示与模型相关的正则化参数,在这里我们设置λΘ为0。这些假设也与实际生活相符。与此同时,我们使用logistic函数:来得到用户u选择地点类别ni而不是类别nj的概率大小,同时,我们使用来衡量这个排序关系。综上所述,公式如下:
p ( s G u , p , n i > s u , p , n j | &Theta; ) = &sigma; ( s G u , p , n i - s u , p , n j ) = 1 1 + e - ( s G u , p , n i - s u , p , n j ) - - - ( 12 )
最后,我们使用随机梯度下降的方法来进行目标函数的优化,具体步骤如下:
G B P R = max &Theta; &Pi; ( u , p , n ) &Subset; U &times; P &times; N &sigma; ( s G u , p , n i - s u , p , n j ) p ( &Theta; ) = max &Theta; ln ( &Pi; ( u , p , n ) &Subset; U &times; P &times; N &sigma; ( s G u , p , n i - s u , p , n j ) p ( &Theta; ) ) = max &Theta; &Sigma; ( u , p , n ) &Subset; U &times; P &times; N ln &sigma; ( s G u , p , n i - s u , p , n j ) - &lambda; &Theta; | | &Theta; | | F 2 - - - ( 13 )
其中,‖Θ‖2表示参数集合的二范式。通过以上步骤的不断迭代,我们就可以训练出参数集合Θ中的所有值,然后根据PITF中的公式就可以还原出用户的状态转移张量。用户状态转移张量的确定就意味着我们能够根据用户目前所在地点的类别预测出他下一次所要出现的地点类别,这样,我们就可以根据这个类别为用户推荐具体的目标地点。
图2为本发明实施例中基于小组兴趣的地点排序算法流程图,从图中可以看出,这个部分主要是根据用户的特征向量对用户进行分组,然后从小组中为用户推荐出具体的地点。所以,在这部分中,我们首先就是要提取出用户的特征属性来建立用户的特征向量。在本发明中,我们主要从两个方面来考虑用户的特征属性:第一,用户的居住地点;第二,用户的历史签到记录。
在一些大的城市中,城市主要是根据不同的功能区来进行规划和发展的,而具有相同背景的人或者行为活动比较相似的人已经从地理上进行分组。例如,旧金山的湾区和北京的西二旗都有许多从事IT行业的人聚集在那里。图6为美国洛杉矶的城市地图,其中五角星符号的点代表签到类型为艺术和大学的地点,而这些地点都主要分散在加州大学洛杉矶分校附近,气球符号的点代表签到类型为夜店的地点,而这些地点主要分布在好莱坞和斯台普斯中心附近。一般情况下,经常出现在中心商务区的人们习惯于下班后去健身房或者酒吧,而大学学生则会在下课后去学校附近的一些场所。但是,因为隐私的原因,任何的基于地理位置的社交网络都不会提供用户具体的居住地点,所以,在这里,我们统计用户历史记录中去的次数最多地点,将这个地点作为用户的居住地点。具体的使用方法为,我们获取这个地点的经纬度坐标,将地点的经度lot.u和纬度lat.u分别作为用户特征向量的两个分量。
除此之外,我们利用用户的历史签到记录来进行用户特征向量的建立。首先我们先将用户的签到地点全部转换为Foursquare类别层级中的第一等级,而这个等级中总共有8个分类。然后,我们使用TF-IDF的权重计算方法,计算每个用户对这8种类型的权重值,使用这些权重值来表示用户。
TF-IDF的全称为TermFrequencyInverseDocumentFrequency,即词频-逆文档频率,该算法原本是用在文本文档的关键字提取中。词频,即一个词在文档中出现的频率,若一个词在一篇文档中出现的次数越多,则说明该词在这篇文档中十分重要。逆文档频率是指总文档数比上该词出现的文档数,总文档数越多,而出现该词的文档数越少,则越说明这个词在文档中的独有性。将词频和逆文档频率这两个值相乘,就得到了一个词的TF-IDF值。某个词对文章的重要性越高,它的TF-IDF值就越大。所以,排在最前面的几个词,就是这篇文章的关键词。而将TF-IDF对应到本发明中,一个用户就相当于一篇文档,而用户这个“文档”是由他的签到地点所组成的,签到地点就相当于“文档”中的“词”,而所有用户就组成了所有的“文档”,因此,就可以利用TF-IDF来计算每个地点种类对于用户的权重了,其公式如下:
u . w c = | u . c c | | u , V | * log | U | | { u : c &Element; u . C } | - - - ( 4 )
其中,|u.vc|表示用户u访问过地点种类c的次数,|u.V|表示用户访问所有类别的次数总和,|U|表示用户的总数,|{u:c∈u.C}|表示所有用户中访问过地点类别c的人数。通过计算,Foursquare类别层级中第一层的8种类别对每个用户来讲都有一个权重值,我们使用这8个权重值再加上上文提到的用户常驻地点的经纬度形成一个10维的向量来表征一个用户,具体如下:
u = < u . w c 1 , u . w c 2 , u . w c 3 , u . w c 4 , u . w c 5 , u . w c 6 , u . w c 7 , u . w c 8 , l o t . u , l a t . u > - - - ( 15 )
lot.u和lat.u分别表示常驻地点的经纬度,u.wc1…u.wc8分别表示用户的8个地点种类的权重值。
在完成对用户的特征提取后,我们就可以利用这些特征,对用户进行分组,在这里,我们使用k-means聚类方法对用户进行分组,当然,此处并不限于k-means聚类方法。k-means算法是经典的聚类算法,通过指定k的值,来将输入的数据分为k类。因为本发明中将具体地点归属到8个地点种类中,所以将k-means算法中的k设定为8,既将用户分为8组。
群体兴趣的地点排序算法流程的最后一步就是对小组内属于预测类别的地点进行排序,在本发明中,我们采用改进的HITS(Hypertext-InducedTopicSearch)方法:Weighted-HITS方法对小组内的地点进行排序。HITS算法是一个经典的链接排序算法,它通过对链接的引用次数进行迭代统计而计算出网页的权威值从而进行排序,权威值越高,排序越靠前。而对应到本发明中,则可以看作是按照地点的受欢迎程度来进行排序的,某个地点去过的人越多,则排序越靠前。但是,就地点推荐来讲,我们不应当只考虑地点的受欢迎程度,而且需要考虑推荐的地点距离用户现在所在地点的远近。图7便是对LA和NYC地区的用户所去地点距离的统计,横坐标Distance表示用户两次签到地点之间的距离,纵坐标Check-inTimes表示用户的签到次数,logscale表示对这两个数均取log值。从中可以看出,80%的用户的两次签到地点之间的距离在5km之内。因此可以得出结论:用户更加倾向于去离自己目前所在地点距离较近的地点。所以,在进行推荐地点排序的时候,我们应当从距离和受欢迎程度这两个因素进行考虑,所以我们改进HITS方法,形成Weighted-HITS方法。其公式如下:
u i &CenterDot; s t + 1 = &Sigma; v i &Element; V u i v i &CenterDot; s t - - - ( 16 )
v m &CenterDot; s t + 1 = &Sigma; u j &Element; U v m 1 d i s t ( l u * , v m ) u j &CenterDot; s t + 1 - - - ( 17 )
其中,ui.s和vi.s分别表示用户ui和地点vi的分数,dist(lu*,vm)代表用户现在所处的位置和地点vm的位置之间的距离,表示用户u所到过的地点的集合,表示到过地点vm的用户的集合,t表示当前的迭代次数,通过对dist(lu*,vm)取倒数可以发现,当距离越大时,这个地点的评分就会越低,所以,Weighted-HITS算法为用户推荐的地点既是用户评分高的,又是距离用户现在所处位置较近的地点。算法的具体原理图可以参看图8。
通过以上步骤,我们就为用户选出了符合用户行为习惯的具体地点进行推荐。
评价指标:
在传统的推荐任务中,我们需要为用户推荐若干个地点,然后与用户将来去的若干个地点进行匹配,通过查看重复度来确定推荐的准确率。但是在本发明中,我们为用户推荐的是用户下一次要去的一个地点,所以,本发明的评测方法与以往的评价方法不同,我们会为用户推荐N个地点,如果用户下一次所去的地点在我们的推荐集合中,就认为我们的推荐是有效果的。具体的公式如下
P N = 1 | U | &Sigma;P u N = 1 | U | &Sigma; S u N u - - - ( 18 )
其中,|U|表示数据中所有的用户数量,Su和Nu分别代表为用户u推荐正确的次数以及为用户u推荐的总次数,u∈U。
数据集:
关于数据集,我们使用的是Foursquare中数据集。其中主要包括LosAngeles和NewYorkCity两个城市的数据。这里面主要包括这两个城市中的用户对这两个城市中的不同地点的评论数据。时间范围为从2010年1月到2011年6月,总共18个月。由于涉及到隐私的问题,数据中只包含用户对签到地点的评论,而并不包括用户实时的签到数据,所以,我们只能把用户对地点的评论时间看作是用户的签到时间。不只是我们,其它的关于兴趣点推荐的研究工作也使用了相同的处理方式。由于每个用户签到的次数差异很大,为了减少数据稀疏性对本实验的影响,我们对数据进行预处理,只保留那些签到次数大于50的用户。该数据的具体情况可参见下表。
表1.数据集相关数据统计
备注:平均评论数是指评论数比上用户数。
实验结果:
在本发明中,我们首次使用先预测地点类型,再为用户推荐具体地点的两步推荐方式,因此,我们会从两个角度来进行实验结果的比较。首先我们先对第一步中预测地点类型的结果进行比较。我们使用FPMC和随机预测(RANDOM)的方式进行实验结果的对比。FMPC也是基于马尔科夫性质的预测方法,但不同的是,本发明(OUR)在进行优化的时候考虑到用户所在群体的属性,采用GBPR的方式进行优化,而FPMC在优化时并没有考虑到用户的群体属性。实验结果如表2所示:
表2.地点类型预测结果对比
从表格2中可以看出,本发明中的方法比其它方法有大幅的领先,这说明小组兴趣这个因素对预测会产生很大的影响,证明了本发明的想法。
接着,我们来对比不同因素对小组内地点排名的影响。在进行小组内地点排名的时候,我们采用Weighted-HITS的算法,就是结合距离(DISTANCE)和受欢迎程度(HITS)这两个因素来进行排序,因此,在进行对比试验时,我们分别使用距离,受欢迎程度来与本发明的方法进行对比,查看这些因素对最终试验结果的影响。试验结果如下表所示:
表2.小组内地点排序结果
从表中可以看出,本发明的Weighted-HITS算法的试验结果要好于分别使用HITS算法和Distance大小的试验结果,说明本发明中提出的为用户推荐距离近并且也受欢迎的地点策略是符合用户的选择习惯的。
最后,我们将本发明的方法(Proposed)和已有的经典算法进行对比,分别采用FPMC,FPMC-LR和MF算法进行对比试验。上文已经介绍过FPMC算法,而FPMC-LR算法是对FPMC算法的改进,它在进行地点转移的时候,也考虑了距离这个因素。MF算法则是经典的基于矩阵分解的协同过滤算法。具体的试验结果可以从下表中看出:
表3.最终试验结果对比
表3中Metric列包含评价指标和提高百分比两项,对同一数据集将本发明与对比技术分别向用户推荐5、10和20个地点时得到各自的准确率,然后根据得到的准确率计算本发明相对于对比技术提高的百分比。从表中可以看出,本发明提出的方法较其它方法在推荐的准确度上都有大幅度的提升。在NYC的数据集中,提升最多达到459%,接近对比方法的5倍。有效的证明了本发明提出的基于个体行为和群体兴趣的两个因素进行推荐的合理性。
除此之外,本发明另一个不同之处是先利用地点的种类进行预测,这样做的另一个好处是大大的减少了数据量,在算法的运行效率上来讲会有大幅度的提升,具体的运行时间从图9中可以看出。
综上所述,本发明提出的用户行为和小组兴趣的兴趣地点推荐方法,不仅在推荐的准确率还是在推荐的效率上,都比已有的方法有大幅度的的提升,因此,本发明是非常具有实用价值的。
为了说明本发明的内容及实施方法,本说明书给出了一个具体实施例。在实施例中引入细节的目的不是限制权利要求书的范围,而是帮助理解本发明所述方法。本领域的技术人员应理解:在不脱离本发明及其所附权利要求的精神和范围内,对最佳实施例步骤的各种修改、变化或替换都是可能的。因此,本发明不应局限于最佳实施例及附图所公开的内容。

Claims (10)

1.一种基于个体行为的地点类别预测方法,其特征在于:包括以下步骤:
步骤一、获取用户的历史签到数据,并将用户的签到地点按时间进行排序;
步骤二、通过使用地点分类信息将用户签到的具体地点转换为地点的类别序号;
步骤三、对用户的历史数据进行预处理,形成<用户序号,目前所在地点类别,下次出现地点类别>这样的三元组形式的输入数据;
步骤四、结合输入数据,利用张量分解的方法对用户地点转移张量进行分解再还原,从而还原出张量中缺失的值;根据用户地点转移张量以及用户目前所在地点类别寻找出下次出现地点类别中的最大值对应的地点类别输出即可。
2.根据权利要求1所述的一种基于个体行为的地点类别预测方法,其特征在于:所述地点分类信息采用Foursquare分类。
3.根据权利要求1或2所述的一种基于个体行为的地点类别预测方法,其特征在于:所述利用张量分解的方法对用户地点转移张量进行分解再还原,从而还原出张量中缺失的值通过以下过程得到:
(1)使用符合均值为0,协方差矩阵为λΘI的正态分布来初始化参数集合Θ{U,P,NU,NP},其中,I为单位矩阵,λΘ为与模型相关的正则化参数,U为所有用户的特征向量形成的矩阵,大小为|U|*F,|U|为用户的总数量,F为用户的特征向量的维度;P为用户目前所在的地点类别的特征向量形成的矩阵,大小为|P|*F;NU为用户下一次将要去的地点类别的特征向量形成的矩阵,但由于其将来要进行乘积运算的对象是用户特征矩阵U,所以其右上角使用U来进行表示,其大小为|NU|*F;NP与NU的意义相同,只不过其将来要进行乘积运算的对象是用户上一次去的地点类别的特征矩阵P,所以其右上角使用P来进行表示;
(2)结合上一步中初始化的参数集合Θ,使用PITF张量分解公式: s u , p , n = &Sigma; F u u , f &CenterDot; n n , f U + &Sigma; F p p , f &CenterDot; n n , f P , 来还原用户的地点类别转移张量,其中uu,f为用户u的特征向量的第f维的值;pp,f为用户目前所在地点类别p的特征向量的第f维的值;均表示用户将要去地点类别n的特征向量的第f维的值,但因其相乘的对象不同,一个相乘对象是用户u的特征值,另一个为用户目前所在地点类别p的特征值,所以右上角的标示也不同,分别为U和P;通过对这四个特征向量的每一个维度进行相乘求和,就可以最终得出用户u从地点类别p转移到类别n的可能性的值su,p,n
(3)对于用户u,从输入的<用户序号,目前所在地点类别,下次出现地点类别>这样的所有关于用户u的三元组中随机挑选一个三元组<u,p,ni>;记u所在的小组为G,利用公式计算该小组内所有用户在地点类别为p时转移到地点类别ni的可能性的平均值,记作其中|G|表示小组G中的用户数;然后根据公式来计算最终用户u从地点类别p转移到地点类别ni的可能性的值其中,ρ是一个权衡因子,取值范围为[0,1],用来权衡用户所在群体的兴趣对用户个人兴趣的影响;然后再从所有的地点类别中随机挑选出类别nj,且满足<u,p,nj>并没有出现在输入的三元组数据当中,即用户从未从地点类别p去过地点类别nj,并计算出
(4)根据上一步中计算得到的带入如下公式:
l n &sigma; ( s G u , p , n i - S u , p , n j ) - &lambda; &Theta; | | &Theta; | | 2 ; - - - ( 1 )
其中函数σ(x)为logistic函数‖Θ‖2表示参数集合的二范式;最后使用梯度下降的优化算法,对Θ集合中每个参数中的对应的u,p,ni,nj的特征向量的每个维度的值进行一次更新计算,从而完成参数集合Θ的一次迭代;
(5)重复步骤2-4,使得迭代次数满足:三元组数量×factor,其中factor为大于1的整数,factor越大,迭代的次数越多,这样尽可能使得每个输入的三元组能够被利用到;
(6)迭代结束后,得到最终的参数集合Θ{U,P,NU,NP},最后利用公式就可以还原出所有用户的地点类别转移张量。
4.一种基于个体行为和群体兴趣的兴趣地点推荐方法,其特征在于:包括以下步骤:
步骤一、通过使用地点分类信息将用户签到的具体地点转换为地点的类别序号;
步骤二、利用每个用户转换过的地点类别,对用户进行特征向量的建立;
步骤三、根据用户特征向量,使用聚类的方法,对用户进行分组聚类;
步骤四、结合权利要求1所述一种基于个体行为的地点类别预测方法中确定的用户下一次将要出现的地点类别,对用户所在群体中的所有用户去过的该类别地点进行排序;
步骤五、将排序后的结果取TOP-N,即取前N个地点推荐给用户。
5.根据权利要求4所述的一种基于个体行为和群体兴趣的兴趣地点推荐方法,其特征在于:所述地点分类信息采用Foursquare分类。
6.根据权利要求4所述的一种基于个体行为和群体兴趣的兴趣地点推荐方法,其特征在于:所述聚类方法为k-means聚类方法。
7.根据权利要求4所述的一种基于个体行为和群体兴趣的兴趣地点推荐方法,其特征在于:所述用户特征向量包括Foursquare中的每个地点类别对于用户的权重以及用户常驻地点的经纬度。
8.根据权利要求7所述的一种基于个体行为和群体兴趣的兴趣地点推荐方法,其特征在于:所述权重通过下述公式进行计算:
u . w c = | u . v c | | u . V | * log | U | | { u : c &Element; u . C } | ; - - - ( 2 )
其中,|u.vc|表示用户u访问过地点类别c的次数,|u.V|表示用户访问所有类别的次数总和,|U|表示用户的总数,|{u:c∈u.C}|表示所有用户中访问过地点类别c的人数,u.wc表示地点类别c对用户u的权重值。
9.根据权利要求4-8所述的一种基于个体行为和群体兴趣的兴趣地点推荐方法,其特征在于:所述对用户所在群体中的所有用户去过的该类别地点进行排序采用Weighted-HITS方法,具体过程如下:
(1)对于待推荐用户u,已知其目前所在地点为以及其下一次将要出现的地点类别c,为了迭代计算用户u所在小组G内的所有用户和类别为c的地点的评分,先对小组内的所有用户及其所去过的类别为c的地点进行评分的初始化,用vm·s0表示类别为c的地点vm的初始值,统计小组G内去过地点vm的用户数,作为地点vm的初始值vm·s0
(2)对于用户u与其所在小组G,利用如下迭代公式:
u i &CenterDot; s t + 1 = &Sigma; v i &Element; V u i v i &CenterDot; s t ; - - - ( 3 )
v m &CenterDot; s t + 1 = &Sigma; u j &Element; U v m 1 d i s t ( l u * , v m ) u j &CenterDot; s t + 1 ; - - - ( 4 )
对用户u所在小组G内的所有地点进行排序,其中,ui.s和vi.s分别表示用户ui和地点vi的分数,代表用户现在所处的位置和地点vm的位置之间的距离,表示用户u所到过的类别为c的地点集合,表示到过地点vm的用户的集合,t表示当前的迭代次数;其中公式中计算的地点的类别均为c;
(3)重复步骤2直到满足迭代次数后停止迭代,然后按照用户u所在小组G内的所有地点的分数从高到低排序并输出。
10.一种基于个体行为和群体兴趣的兴趣地点推荐装置,其特征在于:包括群体划分模块;用户地点转移矩阵模型计算模块和群体内地点排序模块,群体划分模块分别与用户地点转移矩阵模型计算模块和群体内地点排序模块相连,用户地点转移矩阵模型计算模块和群体内地点排序模块相连;
所述群体划分模块用于对所有用户采用聚类方法根据用户特征向量进行小组的划分;
所述用户地点转移矩阵模型计算模块用于采用权利要求1所述一种基于个体行为的地点类别预测方法预测用户将要去的地点类别;
所述群体内地点排序模块用于根据用户地点转移矩阵模型计算模块输出的地点类别将用户所在小组内所有用户去过的该类别的地点采用Weighted-HITS方法进行降序排序,并将前N个地点推荐给用户。
CN201610059756.2A 2016-01-28 2016-01-28 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置 Active CN105740401B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610059756.2A CN105740401B (zh) 2016-01-28 2016-01-28 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610059756.2A CN105740401B (zh) 2016-01-28 2016-01-28 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置

Publications (2)

Publication Number Publication Date
CN105740401A true CN105740401A (zh) 2016-07-06
CN105740401B CN105740401B (zh) 2018-12-25

Family

ID=56247784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610059756.2A Active CN105740401B (zh) 2016-01-28 2016-01-28 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置

Country Status (1)

Country Link
CN (1) CN105740401B (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127487A (zh) * 2016-08-26 2016-11-16 成都市硕达科技股份有限公司 一种防盗刷安全守护系统及其使用方法
CN106503714A (zh) * 2016-10-11 2017-03-15 湖州师范学院 一种基于兴趣点数据识别城市功能区的方法
CN106649658A (zh) * 2016-12-13 2017-05-10 重庆邮电大学 针对用户角色无差异对待和数据稀疏的推荐系统及方法
CN106909607A (zh) * 2017-01-06 2017-06-30 南京邮电大学 一种基于随机扰动技术的协同过滤群组推荐方法
CN107133262A (zh) * 2017-03-30 2017-09-05 浙江大学 一种基于多影响嵌入的个性化poi推荐方法
CN107679053A (zh) * 2017-06-12 2018-02-09 平安科技(深圳)有限公司 地点推荐方法、装置、计算机设备及存储介质
CN108255997A (zh) * 2017-12-29 2018-07-06 武汉斑马快跑科技有限公司 一种打车目的地的预测方法及系统
CN108446944A (zh) * 2018-02-05 2018-08-24 北京三快在线科技有限公司 一种常驻城市的确定方法、装置及电子设备
CN108536706A (zh) * 2017-03-02 2018-09-14 广州市动景计算机科技有限公司 榜单生成方法、装置及系统
CN108958247A (zh) * 2018-07-02 2018-12-07 深圳市益鑫智能科技有限公司 一种引导机器人
CN109429178A (zh) * 2017-09-04 2019-03-05 腾讯科技(北京)有限公司 信息推送方法、装置、存储介质和电子装置
CN109523288A (zh) * 2017-09-19 2019-03-26 富士施乐株式会社 信息处理装置
CN109684561A (zh) * 2018-12-24 2019-04-26 宿州学院 基于用户签到行为变化的深层语义分析的兴趣点推荐方法
CN110795637A (zh) * 2019-11-06 2020-02-14 黑龙江科技大学 基于5g网络和历史旅游信息的个人定制式国内旅游景区推荐系统及方法
CN111523031A (zh) * 2020-04-22 2020-08-11 北京百度网讯科技有限公司 用于推荐兴趣点的方法和装置
CN112071401A (zh) * 2020-09-05 2020-12-11 苏州贝基电子科技有限公司 一种基于大数据的健康饮食管理系统
CN112116810A (zh) * 2020-09-07 2020-12-22 东南大学 基于城市道路卡口数据的全路网路段行程时间估计方法
CN112488384A (zh) * 2020-11-27 2021-03-12 香港理工大学深圳研究院 基于社交媒体签到预测目标区域的方法、终端及存储介质
CN112699302A (zh) * 2021-01-05 2021-04-23 汕头大学 一种基于测地距离的实时推荐方法
CN112784177A (zh) * 2021-01-18 2021-05-11 杭州电子科技大学 一种空间距离自适应的下一个兴趣点推荐方法
CN112784160A (zh) * 2021-01-29 2021-05-11 电子科技大学 基于张量分解且顾及上下文语义信息的兴趣点推荐方法
TWI730539B (zh) * 2019-10-09 2021-06-11 開曼群島商粉迷科技股份有限公司 動態數位內容的顯示方法、圖形使用者介面與系統
CN117521901A (zh) * 2023-11-15 2024-02-06 广东红旗体育用品有限公司 运动场所运动健身数据统计分析系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130086072A1 (en) * 2011-10-03 2013-04-04 Xerox Corporation Method and system for extracting and classifying geolocation information utilizing electronic social media
CN103824213A (zh) * 2014-03-13 2014-05-28 北京理工大学 一种基于用户偏好与商品属性的个性化推荐方法
CN103995837A (zh) * 2014-04-25 2014-08-20 西北工业大学 一种基于群体足迹的个性化旅游路线规划方法
CN104933595A (zh) * 2015-05-22 2015-09-23 齐鲁工业大学 一种基于马尔科夫预测模型的协同过滤推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130086072A1 (en) * 2011-10-03 2013-04-04 Xerox Corporation Method and system for extracting and classifying geolocation information utilizing electronic social media
CN103824213A (zh) * 2014-03-13 2014-05-28 北京理工大学 一种基于用户偏好与商品属性的个性化推荐方法
CN103995837A (zh) * 2014-04-25 2014-08-20 西北工业大学 一种基于群体足迹的个性化旅游路线规划方法
CN104933595A (zh) * 2015-05-22 2015-09-23 齐鲁工业大学 一种基于马尔科夫预测模型的协同过滤推荐方法

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127487A (zh) * 2016-08-26 2016-11-16 成都市硕达科技股份有限公司 一种防盗刷安全守护系统及其使用方法
CN106503714A (zh) * 2016-10-11 2017-03-15 湖州师范学院 一种基于兴趣点数据识别城市功能区的方法
CN106503714B (zh) * 2016-10-11 2020-01-03 湖州师范学院 一种基于兴趣点数据识别城市功能区的方法
CN106649658A (zh) * 2016-12-13 2017-05-10 重庆邮电大学 针对用户角色无差异对待和数据稀疏的推荐系统及方法
CN106649658B (zh) * 2016-12-13 2020-06-16 重庆邮电大学 针对用户角色无差异对待和数据稀疏的推荐系统及方法
CN106909607A (zh) * 2017-01-06 2017-06-30 南京邮电大学 一种基于随机扰动技术的协同过滤群组推荐方法
CN106909607B (zh) * 2017-01-06 2019-07-09 南京邮电大学 一种基于随机扰动技术的协同过滤群组推荐方法
CN108536706A (zh) * 2017-03-02 2018-09-14 广州市动景计算机科技有限公司 榜单生成方法、装置及系统
CN107133262A (zh) * 2017-03-30 2017-09-05 浙江大学 一种基于多影响嵌入的个性化poi推荐方法
CN107133262B (zh) * 2017-03-30 2019-09-06 浙江大学 一种基于多影响嵌入的个性化poi推荐方法
WO2018227773A1 (zh) * 2017-06-12 2018-12-20 平安科技(深圳)有限公司 地点推荐方法、装置、计算机设备和存储介质
CN107679053A (zh) * 2017-06-12 2018-02-09 平安科技(深圳)有限公司 地点推荐方法、装置、计算机设备及存储介质
CN107679053B (zh) * 2017-06-12 2020-02-18 平安科技(深圳)有限公司 地点推荐方法、装置、计算机设备及存储介质
CN109429178A (zh) * 2017-09-04 2019-03-05 腾讯科技(北京)有限公司 信息推送方法、装置、存储介质和电子装置
CN109523288A (zh) * 2017-09-19 2019-03-26 富士施乐株式会社 信息处理装置
CN108255997A (zh) * 2017-12-29 2018-07-06 武汉斑马快跑科技有限公司 一种打车目的地的预测方法及系统
CN108446944A (zh) * 2018-02-05 2018-08-24 北京三快在线科技有限公司 一种常驻城市的确定方法、装置及电子设备
CN108446944B (zh) * 2018-02-05 2020-03-17 北京三快在线科技有限公司 一种常驻城市的确定方法、装置及电子设备
CN108958247A (zh) * 2018-07-02 2018-12-07 深圳市益鑫智能科技有限公司 一种引导机器人
CN109684561A (zh) * 2018-12-24 2019-04-26 宿州学院 基于用户签到行为变化的深层语义分析的兴趣点推荐方法
CN109684561B (zh) * 2018-12-24 2021-06-08 宿州学院 基于用户签到行为变化的深层语义分析的兴趣点推荐方法
TWI730539B (zh) * 2019-10-09 2021-06-11 開曼群島商粉迷科技股份有限公司 動態數位內容的顯示方法、圖形使用者介面與系統
CN110795637B (zh) * 2019-11-06 2023-04-25 黑龙江科技大学 基于5g网络和历史旅游信息的个人定制式国内旅游景区推荐方法
CN110795637A (zh) * 2019-11-06 2020-02-14 黑龙江科技大学 基于5g网络和历史旅游信息的个人定制式国内旅游景区推荐系统及方法
CN111523031A (zh) * 2020-04-22 2020-08-11 北京百度网讯科技有限公司 用于推荐兴趣点的方法和装置
CN111523031B (zh) * 2020-04-22 2023-03-31 北京百度网讯科技有限公司 用于推荐兴趣点的方法和装置
CN112071401A (zh) * 2020-09-05 2020-12-11 苏州贝基电子科技有限公司 一种基于大数据的健康饮食管理系统
CN112071401B (zh) * 2020-09-05 2021-06-15 杭州康晟健康管理咨询有限公司 一种基于大数据的健康饮食管理系统
CN112116810A (zh) * 2020-09-07 2020-12-22 东南大学 基于城市道路卡口数据的全路网路段行程时间估计方法
CN112488384B (zh) * 2020-11-27 2021-08-31 香港理工大学深圳研究院 基于社交媒体签到预测目标区域的方法、终端及存储介质
CN112488384A (zh) * 2020-11-27 2021-03-12 香港理工大学深圳研究院 基于社交媒体签到预测目标区域的方法、终端及存储介质
CN112699302A (zh) * 2021-01-05 2021-04-23 汕头大学 一种基于测地距离的实时推荐方法
CN112699302B (zh) * 2021-01-05 2023-07-04 汕头大学 一种基于测地距离的实时推荐方法
CN112784177A (zh) * 2021-01-18 2021-05-11 杭州电子科技大学 一种空间距离自适应的下一个兴趣点推荐方法
CN112784177B (zh) * 2021-01-18 2022-04-15 杭州电子科技大学 一种空间距离自适应的下一个兴趣点推荐方法
CN112784160A (zh) * 2021-01-29 2021-05-11 电子科技大学 基于张量分解且顾及上下文语义信息的兴趣点推荐方法
CN117521901A (zh) * 2023-11-15 2024-02-06 广东红旗体育用品有限公司 运动场所运动健身数据统计分析系统及方法
CN117521901B (zh) * 2023-11-15 2024-05-31 广东红旗体育用品有限公司 运动场所运动健身数据统计分析系统及方法

Also Published As

Publication number Publication date
CN105740401B (zh) 2018-12-25

Similar Documents

Publication Publication Date Title
CN105740401A (zh) 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置
He et al. Mining transition rules of cellular automata for simulating urban expansion by using the deep learning techniques
Kuo et al. Integration of ART2 neural network and genetic K-means algorithm for analyzing Web browsing paths in electronic commerce
CN101321190B (zh) 一种异构网络中的推荐方法及推荐系统
CN110399565A (zh) 基于时空周期注意力机制的递归神经网络兴趣点推荐方法
CN106651519A (zh) 基于标签信息的个性化推荐方法和系统
CN106845717A (zh) 一种基于多模型融合策略的能源效率评价方法
CN109492166A (zh) 基于签到时间间隔模式的连续兴趣点推荐方法
CN101694652A (zh) 一种基于极速神经网络的网络资源个性化推荐方法
CN107038184B (zh) 一种基于分层隐变量模型的新闻推荐方法
CN109408712A (zh) 一种旅行社用户多维信息画像的构建方法
CN106022614A (zh) 一种基于最近邻聚类的神经网络数据挖掘方法
CN108256914A (zh) 一种基于张量分解模型的兴趣点种类预测方法
CN104239496A (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN109508428A (zh) 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法
CN106156333A (zh) 一种融合社会化信息的改进单类协同过滤方法
CN112800210B (zh) 基于海量公交数据的人群画像算法
CN107045533A (zh) 基于标签的教育资源推荐方法及系统
CN108564117A (zh) 一种基于svm的贫困生辅助认定方法
CN104834944B (zh) 一种基于协同训练的城市区域空气质量估计方法
Wang et al. Analyzing potential tourist behavior using PCA and modified affinity propagation clustering based on Baidu index: Taking Beijing city as an example
CN110781940A (zh) 一种基于模糊数学的社区发现信息处理方法及系统
He et al. Next point-of-interest recommendation via a category-aware Listwise Bayesian Personalized Ranking
Zhao et al. Development of a global positioning system data-based trip-purpose inference method for hazardous materials transportation management
Hassan et al. Performance analysis of neural networks-based multi-criteria recommender systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Li Xin

Inventor after: Chen Nizhe

Inventor after: Chen Jialiang

Inventor after: Li Kan

Inventor before: Li Xin

Inventor before: Chen Jialiang

Inventor before: Li Kan

GR01 Patent grant
GR01 Patent grant