CN110334293A - 一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法 - Google Patents
一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法 Download PDFInfo
- Publication number
- CN110334293A CN110334293A CN201910627873.8A CN201910627873A CN110334293A CN 110334293 A CN110334293 A CN 110334293A CN 201910627873 A CN201910627873 A CN 201910627873A CN 110334293 A CN110334293 A CN 110334293A
- Authority
- CN
- China
- Prior art keywords
- user
- time
- fuzzy clustering
- cluster
- access
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,包括:步骤一、获取用户签到数据信息,包括用户信息、位置信息和时间信息;步骤二、通过所述位置信息提取访问位置地理特征,通过所述时间信息提取用户时间特征,根据所述访问位置地理特征和所述用户时间特征得到用户特征向量后,得到基于用户模糊聚类算法的位置推荐;根据所述时间信息和所述位置信息计算各个位置在各个时间段的位置吸引力后,得到基于位置吸引力的位置推荐;步骤三、根据所述位置推荐通过协同过滤方法预测时间感知下用户对每个未签到的访问值;步骤四、给定目标用户和时间,筛选所述每个未签到的访问值Top‑N的位置,对用户进行推荐。
Description
技术领域
本发明涉及社交网络中的位置推荐领域,具体涉及一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法。
背景技术
在海量信息背景下,推荐系统可以根据用户喜好实现信息筛选,有效地解决信息多载的问题,推荐系统可以解决信息过载的问题,已引起业界的广泛关注,位置推荐是基于位置的社交网络(LBSN:Location based Social Network)中的一个应用,旨在为用户推荐可能感兴趣的地理位置,是实现用户的个性化需求和解决信息过滤问题的重要手段。
LBSN是位置服务与传统社交网络融合后的一种新社交网络,它记录了用户在真实世界中的位置移动轨迹,在日常社交场景中需要有合适的推荐方法通过分析用户交互行为,挖掘用户和位置存在的关联关系,但对用户推荐地点时,除了考虑用户本身的兴趣,同时在为用户进行推荐时应充分考虑时效性,假设推荐系统能够分析出某用户酷爱看书,但是却是在晚间向用户推荐图书馆,也不会获得很高的用户满意度;因此为用户进行特定时间下位置推荐,可满足用户不同时间的不同需求,更为后续的路径规划、位置隐私保护等研究打下坚实理论基础。
虽然基于位置社交网络中涵盖了丰富的上下文信息(如用户社交因素,位置标签评论信息、时间因素和地理因素),但如何有效的利用这些信息和协同过滤算法相结合提高推荐的准确性引发学者们广泛关注和研究;Ren等人提出了基于上下文的概率矩阵分解方法应用于位置推荐,设计了一个融合地理信息,社交关系的兴趣度相关模型,上述模型可以为用户提供合适的位置推荐结果,但由于没有考虑时间因素的影响,无法实现在特定时间下向用户推荐位置;Yuan等人提出了一种考虑时间片影响的基于用户协同过滤算法,作者将空间影响与平滑增强技术相结合以提高推荐的性能;此外,他们开发了一种偏好传播算法以增强推荐性能,该算法使用地理-时间影响感知图来模拟签入记录,但由于签入数据集的密度低,基于小时的时间片方法会导致数据更加稀疏,而且他们只考虑用户在不同时间片的偏好差异,没有考虑到连续时间片下用户签到的相似性,没有对用户进行除相似度以外的分析以进一步提高推荐结果的准确率;Si提出对用户进行划分,仅根据用户总签到情况,将用户分成积极和不积极用户,在各用户群中进行基于协同过滤的位置推荐,这样的用户群划分较为单一,没有根据用户不同行为,对用户进行模糊划分。上述方法仅仅从基于位置社交网络所提供的上下文信息中的单个因素或几个组合关系中获取推荐结果,另外,对用户进行聚类分析以及对上下文信息的综合利用仍存在提升空间,对用户在特定时间进行位置推荐的准确性仍有待提高。
同时,协同过滤(Collaborative Filtering)技术是个性化推荐应用最早和最为成功的技术之一,基于协同过滤的方法是基于用户在地点的签到记录来进行个性化位置推荐,现有理论虽然可以为个性化地点推荐系统的构建提供理论基础和实践指导,但是仍然存在诸多缺陷与不足:
(1)当前基于位置社交网络中的推荐算法主要实现向单用户推荐合适的位置,然而没有综合考虑时间、地理位置等上下文信息对位置推荐的影响,在一定程度上制约了推荐时效性和准确性;
(2)基于用户协同过滤方法,没有考虑用户的群体特征,在相似群组中为用户进行推荐,而是基于所有用户的相似度对目标用户进行推荐,这样会让那些并不相关的用户也加入推荐评判中,并进一步增加计算的复杂度;
(3)在进行位置推荐中,现有技术往往仅通过单个用户在各位置的距离或签到次数来进行推荐,由于用户签到数据稀疏性问题,推荐精度较差,而通过全局对位置的普遍受欢迎度进行分析,可以帮助用户进行位置推荐,提高推荐精度。
发明内容
技术上述问题,本发明设计开发了一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,本发明的发明目的是解决的是具有时间感知的位置推荐问题,通过充分利用基于位置的社交网络所包含的丰富上下文信息,在完成基于模糊聚类的具有时间感知位置推荐关键问题后,有效地增强用户体验和提高用户的满意度。
本发明提供的技术方案为:
一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,包括如下步骤:
步骤一、获取用户签到数据信息,包括用户信息、位置信息和时间信息;
步骤二、通过所述位置信息提取访问位置地理特征,通过所述时间信息提取用户时间特征,根据所述访问位置地理特征和所述用户时间特征得到用户特征向量后,得到基于用户模糊聚类算法的位置推荐;以及
根据所述时间信息和所述位置信息计算各个位置在各个时间段的位置吸引力后,得到基于位置吸引力的位置推荐;
步骤三、根据所述位置推荐通过协同过滤方法预测时间感知下用户对每个未签到的访问值;
步骤四、给定目标用户和时间,筛选所述每个未签到的访问值Top-N的位置,对用户进行推荐。
优选的是,在所述步骤二中,通过所述位置信息提取访问位置地理特征包括:
将每个位置生成关于经纬度的二维特征向量,随机生成k个聚类中心Ck(0)={l1,l2,...,lk};
计算每个位置到各个聚类中心的距离,并将该位置分配给距离最小的簇,其计算方法如下:
dk(l,Ck(r))=min[dist(l,lk)],k=1,2,...,k;
将所有的位置分为k个簇后,计算每个用户u在k个簇上的地理特征向量,其计算方法如下:
其中,l表示位置,k表示聚类中心个数,L表示所有的位置,R'表示地球半径,dist(l,lk)表示位置l到聚类中心lk的的地球表面距离,r表示迭代次数,Ck(r)为迭代次数为r时的k个聚类中心,dk(l,Ck(r))表示每个位置到各个聚类中心的距离的最小值,R表示数据集上的所有签到数据,表示在数据集上的所有签到数据上,用户在簇fk下的地点上有一次访问记录。
优选的是,在所述步骤二中,通过所述时间信息提取用户时间特征过程包括:
在提取所述时间特征时,选取多个不同时间段,计算用户在各个时间段的时间特征向量计算方式如下:
其中,R表示数据集上的所有签到数据,ru,t,i=1表示在数据集上的所有签到数据上,用户在时间有一次签到记录。
优选的是,在所述步骤二中,得到基于用户模糊聚类算法的位置推荐过程包括如下步骤:
步骤1、根据所述用户特征向量采用模糊聚类方法对用户进行模糊聚类分簇,确定用户和用户相似度高的及相似的用户簇;
步骤2、在每个簇组内进行基于用户和时间相似度的位置访问值计算;
步骤3、基于求和方法,计算最终用户在任意时间内对位置的访问值。
优选的是,在所述步骤1中,
采用模糊聚类对用户进行模糊聚类,确定用户和用户相似度高的及相似的用户簇,包括:
把用户分为c个模糊组,确定每组的聚类中心ci,使模糊聚类的目标函数最小;其中,所述目标函数为:
式中,U为所述用户特征向量组成的特征向量矩阵,{c1,c2,...,cc}为c个簇组核心,mi,u为用户u关于核i的隶属度值,为第i个簇核心与第u组用户数据之间的欧几里德距离;以及
确定聚类中心ci和特征向量矩阵U的算法包括:
初始化特征向量矩阵U,隶属矩阵M选取0和1间的随机数,使其满足隶属度约束公式中的约束条件;由聚类中心的计算方法,计算c个聚类中心ci,i=1,2,...,c;计算目标价值函数,直到小于阀值时,则算法停止;
其中,所述隶属度约束公式为
优选的是,在所述步骤2中,在每个簇组内进行基于用户和时间相似度的位置访问值计算过程包括:
计算时间和时间相似度:
计算用户和用户之间的相似度:
计算基于用户和时间相似度的位置访问值:
其中,
式中,ru,l,t为用户u在时间片t时对于位置l的访问值,ru,l,t′为用户u在时间片t′时对于位置l的访问值,rv,l,t为用户v在时间片t时对于位置l的访问值;表示用户v在时间片t对于位置l的访问值,SU为在簇ck中和用户u相似度较高的前100用户集合。
优选的是,在所述步骤3中,计算基于模糊聚类的用户在任意时间内对位置的访问值包括:
优选的是,在所述步骤二中,得到基于位置吸引力的位置推荐包括:
将所述时间特征选取多个不同时间段,计算不同时间段的位置吸引力:
式中,Attl,T表示在时间段T时位置l的位置吸引力值,Ul表示访问位置l的用户群体,cu,l,t表示用户u在t时间访问位置l的次数,nl,t表示位置l在时间片t时被访问的总次数。
优选的是,在所述步骤三中,计算最终时间感知下用户对每个未签到的访问值为:t∈T。
优选的是,在所述步骤四中,对用户进行推荐过程包括:
对给定目标用户和时间,计算时间感知下用户对每个未签到的访问值后,进行降序排列,选取访问值排在前N位的Top-N位置推荐给用户。
本发明与现有技术相比较所具有的有益效果:
1、本发明对用户进行模糊聚类,用户的签到特征是复杂的,本发明从数据集中提取12个特征,采用模糊聚类的方法对用户进行聚类分析更符合用户的特征;对用户进行协同过滤时,对每个簇组分别选取相似度高的用户进行推荐计算,减少了“不太相似”用户所带来的噪声,提高了精度,并且还降低了计算复杂度;
2、本发明考虑到时间因素,向用户进行位置推荐时,在不同的时间间隙下的推荐结果不同,基于用户已签到数据,利用时间段之间的相似性对用户的签到数据进行了填补,有助于缓解用户签到数据的稀疏性问题;
3、本发明考虑地点地理信息,对地点进行聚类,结合提出的地点吸引度计算方法,相对于现有考虑所有已签到地点的方法,减少了不重要地点对推荐结果的影响。
附图说明
图1为本发明所述的推荐方法的流程示意图。
图2为各个时间段的签到总频率。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
在本发明中通过充分利用基于位置的社交网络中的上下文信息,基于签到矩阵构造基于时间段和位置经纬度区域的用户访问特征,对用户进行模糊聚类,利用模糊聚类得到的用户分组结果,在每个簇组内部的若干目标社团中找出和目标用户最相似的用户,即联系紧密的用户团体,利用用户相似度和时间相似度的位置访问值计算方法对位置进行协同过滤推荐,然后,结合所有用户的访问位置信息计算在各时段下各位置的吸引力值,最后基于用户模糊聚类和位置吸引力值的协同过滤方法进行位置推荐,根据按照用户偏好排序的候选位置推荐列表得到Top-N结果,降低访问矩阵稀疏性,并提高推荐准确度。
基于位置的社交网络可定义为三元组G(U,L,T),其中,U={u1,u2,u3...un}是用户节点集合;L={l1,l2,...,lm}是位置集合,EUL={(ui,lj)|ui∈U,lj∈L}表示用户签到行为;T={t1,t2,...,tt}是时间段的集合;每个签到记录可定义成四元组(uid,lid,locati,onti);me其中,uid表示用户的编号,lid表示位置编号,location表示地理位置的经纬度,time表示用户的签到时间;一组由n个用户、m个位置和t个时间构成的用户历史签到信息集合R,ru,l,t表示用户u在时间t对位置l的访问情况。
如图1所示,本发明提供了一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,包括如下过程:
首先,从基于位置社交网络获取的用户地点签到数据;对用户的历史签到地点进行多中心聚类,位置的分散区域,统计各个区域内的用户签到次数形成用户的访问位置地理特征向量;对时间片进行划分,得到用户在各个时间下的用户时间特征向量,这两部分特征加在一起作为用户特征向量,再利用模糊聚类算法对用户进行社团划分;
然后,利用模糊聚类得到的用户分组结果,在每个簇组内部的若干目标社团中找出和目标用户最相似的用户,基于各个时间段之间的相似度、用户和用户间相似度,计算出用户在各个时间下对各个地点的访问值;同时,结合划分时间片和用户签到数据计算各个时间下的位置吸引力;
最后,结合模糊聚类结果下的访问值和位置吸引力的协同过滤方法计算时间感知下预测用户在未签到地点的访问情况;根据访问值结果选取签到次数排名前N个位置进行推荐,得到最终的推荐结果。
实施例
如图1、图2所示,本发明提供了一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,具体包括如下步骤:
步骤1、获取用户地点签到数据,所述用户地点签到数据的属性包括:用户信息,位置信息和用户签到时间段;
步骤2、用户在用户历史签到信息集合中的签到信息表现为不同时间段的多元性,并且各个时间段的签到总频率有着明显差异,在提取用户时间特征时,由于24个时间片段过于繁琐,本实施例中定义了四个不同时间段的用户时间特征向量,
4个时间段下访问特征:将一天24小时按照进行时间段划分,具体划分如下T1={23,24,1,2,3,4},T2={5,6,7,8,9,10},T3={11,12,13,14,15,16},T4={17,18,19,20,21,22},用户在各个时间段的特征值为用户在时间段上的访问频率,其计算方式如下:
其中,R表示数据集上的所有签到数据,ru,t,i=1表示在数据集合R上,用户u在时间t有一次签到记录,否则,ru,t,i=0;
同理,其它三个时间段的访问频率也与T1类似,组成了四维的用户时间特征向量在T2、T3和T4上的特征值计算分别为:
步骤3、根据用户地点签到数据,签到地点位置信息,提取用户在各个时间段下对各位置的签到次数,构成用户访问位置的地理特征向量根据所有位置的经纬度信息,将位置进行聚类分块处理;
在本实施例中,通过k-means聚类算法对所有位置的经纬度信息进行分块处理,从而对位置进行聚类分块处理,其具体步骤算法如下:
(1)、对于每一个位置l,生成关于经纬度的二维特征向量,初始化随机生成k个聚类中心Ck(0)={l1,l2,...,lk};
(2)、计算每个位置到各个聚类中心的距离,并将该位置分配给距离最小的簇,其计算方法如下:
dk(l,Ck(r))=min[dist(l,lk)],k=1,2,...,k;
其中,R'表示地球半径,dist(l,lk)表示位置l到聚类中心lk的的地球表面距离;r表示迭代次数;Ck(r)为迭代次数为r时的k个聚类中心,dk(l,Ck(r))表示每个位置到各个聚类中心的距离的最小值,作为该位置的聚类中心;
将所有的位置L分为k个簇后,接下来计算每个用户u在k个簇上的访问频率来作为用户u的k个地理特征向量,其计算如下表示:
其中,R表示数据集上的所有签到数据,表示用户在数据集R上,用户在簇fk下的地点上有一次访问记录;在本实施例中,k取8,即将位置分为8个子簇,组成了八维的用户访问位置地理特征向量
通过与步骤2中的四个用户时间特征,统计出12个用户特征向量表示于每个用户;
步骤4、采用模糊聚类方法对用户进行聚类分簇,由于有些用户和其他人的相似度都有明显的相似特征,即该用户对于不同簇内的用户的喜好能产生积极的预测影响,因此,并非所有用户都与目标用户存在强烈的相似关系,较弱的相似关系反而会为目标用户的位置推荐带来噪声影响,本实施例中采用模糊聚类的方法,采用模糊聚类fuzzy-cmeans(FCM)对用户进行模糊聚类,确定用户和用户相似度高的及相似的用户社团,具体方法如下:
FCM(模糊聚类)把用户分为c个模糊组,并求每组的聚类中心,使得非相似性指标的目标函数达到最小,FCM使用模糊划分,使得每个给定数据点用值在0,1间的隶属度来确定其属于各个组的程度,与引入模糊划分相适应;对于隶属矩阵M中的每个隶属度值mi,u(其中,i为模糊簇编号,u为用户编号),允许有取值在0,1间的元素;加上归一化规定,一个数据集的隶属度的和总等于1。
其中,隶属度约束公式为:
FCM的目标函数为:
其中,U为所有用户的特征向量组成的N*12的特征向量矩阵,{c1,c2,...,cc}为c个12*1的簇组核心,mi,u为用户u关于核i的隶属度值,为第i个簇核心与第u组用户数据之间的欧几里德距离,且是一个加权指数;
要使得该目标函数取得最小值,即得到拉格朗日数乘子目标函数式为:
对所有输入参量求导,使上面目标函数式子达到最小的必要条件:
每次迭代聚类中心计算方法为:
每次迭代各用户对于聚类中心的隶属度为:
在运行时,FCM采用下列步骤确定聚类中心ci和隶属矩阵U,其具体算法步骤如下:
(1)、初始化用户特征向量矩阵U,初始化隶属矩阵M用取值在0和1间的随机数,使其满足隶属度约束公式中的约束条件;
(2)、由聚类中心的计算方法,计算c个聚类中心ci,i=1,2,...,c;
(3)、计算目标函数;如果它小于某个确定的阀值,或它相对上次值函数值的改变量小于某个阀值,则算法停止;
(4)、由用户对于聚类中心的隶属度公式,重新计算隶属矩阵M,返回(2);
通过上述算法,本实施例中得到了c个聚类中心和每个用户对于聚类中心的隶属度,根据隶属度值,本实施例可以把用户分为5个有交集的簇组,当用户对某个簇组中心的隶属度值大于0.1时,在此簇组中添加该用户,从而得到5个有交叉的用户群
步骤5、计算时间和时间相似度以及计算用户和用户之间的相似度如下:
(1)、计算时间和时间的相似度,两个时间片t和t'的时间相似度为这两个时间片下所有用户对所有地点的访问记录之间的余弦相似度;
其中,ru,l,t表示用户u在时间片t时对于位置l的访问值,ru,l,t′表示用户u在时间片t′时对于位置l的访问值;ru,l,t=1表示用户u在时间片t时访问了位置l,否则ru,l,t=0;ru,l,t′=1表示用户u在时间片t′时访问了位置l,否则ru,l,t′=0;
(2)、计算用户和用户的相似度,两个用户u和v的相似度为这两个用户在任意时刻对所有地点的访问记录之间的余弦相似度;
其中,ru,l,t为用户u在时间片t时对于位置l的访问值,rv,l,t为用户v在时间片t时对于位置l的访问值,ru,l,t=1为用户u在时间片t时访问了位置l,否则ru,l,t=0,rv,l,t=1表示用户v在时间片t时访问了位置l,否则rv,l,t=0;
步骤6、根据时间和时间相似度,对第t个时间段内第v个用户在第l个未签到地点的签到情况进行再次计算,得到更新的用户v在时间片t对位置l的访问值:
其中,更新的用户v在时间片t对位置l的访问值为用户在其他所有时间片的时间相似访问值之和;时间相似访问值为用户在其他时间片对位置的访问值与时间相似度占比的乘积。
由于同一簇中的用户存在访问相似度,所以在每个簇内基于用户相似度求出用户u针对特定时间t在簇ck内对位置l的访问值
其中,simu,v为用户u和用户v之间相似度,SU为在簇ck中和用户u相似度较高的前100用户集合,用户u针对特定时间t在簇ck内对位置l的访问值等于用户相似访问值之和;其中,用户相似访问值是和用户相似度占比的乘积,为更新后的用户v在时间片t对位置l的访问值;
步骤7、由于采用了FCM模糊聚类的方法,用户u可能属于好几个群(簇),用户u在每个簇中都得到了一个值,从而得到多个用户u在特定时间对于位置l的访问值,这些在不同簇中的访问值构成一个向量,即本实施例中采取求和方法来计算基于模糊聚类的用户u在任意时间对于位置l的访问值,其计算方法如下:
其中,用户u针对特定时间t在簇ck内对位置l的访问值;为基于模糊聚类的用户在任意时间对于位置的访问值,c为簇的个数。
步骤8、根据地点不同,得到用户在不同时间对不同地点的位置吸引力;位置吸引力通常与位置的访问次数和访问人数有关,两者的综合属性越高,代表该位置吸引力越高,该位置被推荐给用户的可能性越大,同时,位置吸引力与时间密切相关,根据签到的活跃度,本实施例基于时间段划分方法将24个时间隙分成了4个时间大段{T1,T2,T3,T4},以位置访问人数和访问次数为基准,采用信息熵的方法,得到的基于时间段的位置吸引力计算方法如下:
其中,Attl,T表示在时间段T时位置l的位置吸引力值,Ul表示访问位置l的用户群体,cu,l,t表示用户u在t时间访问位置l的次数,nl,t表示位置l在时间片t时被访问的总次数,由于用户倾向于访问口碑好的位置,即吸引力高的位置,本实施例中计算了各个时间大段的各个位置的吸引力值。
步骤9、综合考虑时间信息和位置信息,预测用户在未签到地点的签到次数得到Attl,T,即位置l在时间段T下的位置吸引力值,为了融合这两个数据,本实施例中采用以下算法:融合位置吸引力值计算的用户到每个未签到地点的访问值,其计算方法如下:t∈T;
步骤10、设定用户推荐的地点数目为N,其可根据具体推荐场景设定,最后将第u个用户在特定时间对最终的每个未签到地点的访问值进行降序排序,并选取排名前N个地点推荐给第u个用户。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (10)
1.一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,其特征在于,包括如下步骤:
步骤一、获取用户签到数据信息,包括用户信息、位置信息和时间信息;
步骤二、通过所述位置信息提取访问位置地理特征,通过所述时间信息提取用户时间特征,根据所述访问位置地理特征和所述用户时间特征得到用户特征向量后,得到基于用户模糊聚类算法的位置推荐;以及
根据所述时间信息和所述位置信息计算各个位置在各个时间段的位置吸引力后,得到基于位置吸引力的位置推荐;
步骤三、根据所述位置推荐通过协同过滤方法预测时间感知下用户对每个未签到的访问值;
步骤四、给定目标用户和时间,筛选所述每个未签到的访问值Top-N的位置,对用户进行推荐。
2.如权利要求1所述的面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,其特征在于,在所述步骤二中,通过所述位置信息提取访问位置地理特征包括:
将每个位置生成关于经纬度的二维特征向量,随机生成k个聚类中心Ck(0)={l1,l2,...,lk};
计算每个位置到各个聚类中心的距离,并将该位置分配给距离最小的簇,其计算方法如下:
dk(l,Ck(r))=min[dist(l,lk)],k=1,2,...,k;
将所有的位置分为k个簇后,计算每个用户u在k个簇上的地理特征向量,其计算方法如下:
其中,l表示位置,k表示聚类中心个数,L表示所有的位置,R'表示地球半径,dist(l,lk)表示位置l到聚类中心lk的的地球表面距离,r表示迭代次数,Ck(r)为迭代次数为r时的k个聚类中心,dk(l,Ck(r))表示每个位置到各个聚类中心的距离的最小值,R表示数据集上的所有签到数据,表示在数据集上的所有签到数据上,用户在簇fk下的地点上有一次访问记录。
3.如权利要求1或2所述的面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,其特征在于,在所述步骤二中,通过所述时间信息提取用户时间特征过程包括:
在提取所述时间特征时,选取多个不同时间段,计算用户在各个时间段的时间特征向量计算方式如下:
其中,R表示数据集上的所有签到数据,ru,t,i=1表示在数据集上的所有签到数据上,用户在时间有一次签到记录。
4.如权利要求3所述的面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,其特征在于,在所述步骤二中,得到基于用户模糊聚类算法的位置推荐过程包括如下步骤:
步骤1、根据所述用户特征向量采用模糊聚类方法对用户进行模糊聚类分簇,确定用户和用户相似度高的及相似的用户簇;
步骤2、在每个簇组内进行基于用户和时间相似度的位置访问值计算;
步骤3、基于求和方法,计算最终用户在任意时间内对位置的访问值。
5.如权利要求4所述的面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,其特征在于,在所述步骤1中,
采用模糊聚类对用户进行模糊聚类,确定用户和用户相似度高的及相似的用户簇,包括:
把用户分为c个模糊组,确定每组的聚类中心ci,使模糊聚类的目标函数最小;其中,所述目标函数为:
式中,U为所述用户特征向量组成的特征向量矩阵,{c1,c2,...,cc}为c个簇组核心,mi,u为用户u关于核i的隶属度值,为第i个簇核心与第u组用户数据之间的欧几里德距离;以及
确定聚类中心ci和特征向量矩阵U的算法包括:
初始化特征向量矩阵U,隶属矩阵M选取0和1间的随机数,使其满足隶属度约束公式中的约束条件;由聚类中心的计算方法,计算c个聚类中心ci,i=1,2,...,c;计算目标价值函数,直到小于阀值时,则算法停止;
其中,所述隶属度约束公式为
6.如权利要求4所述的面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,其特征在于,在所述步骤2中,在每个簇组内进行基于用户和时间相似度的位置访问值计算过程包括:
计算时间和时间相似度:
计算用户和用户之间的相似度:
计算基于用户和时间相似度的位置访问值:
其中,
式中,ru,l,t为用户u在时间片t时对于位置l的访问值,ru,l,t′为用户u在时间片t′时对于位置l的访问值,rv,l,t为用户v在时间片t时对于位置l的访问值;表示用户v在时间片t对于位置l的访问值,SU为在簇ck中和用户u相似度较高的前100用户集合。
7.如权利要求4所述的面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,其特征在于,在所述步骤3中,计算基于模糊聚类的用户在任意时间内对位置的访问值包括:
8.如权利要求5-7中任一项所述的面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,其特征在于,在所述步骤二中,得到基于位置吸引力的位置推荐包括:
将所述时间特征选取多个不同时间段,计算不同时间段的位置吸引力:
式中,Attl,T表示在时间段T时位置l的位置吸引力值,Ul表示访问位置l的用户群体,cu,l,t表示用户u在t时间访问位置l的次数,nl,t表示位置l在时间片t时被访问的总次数。
9.如权利要求8所述的面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,其特征在于,在所述步骤三中,计算最终时间感知下用户对每个未签到的访问值为:t∈T。
10.如权利要求9所述的面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法,其特征在于,在所述步骤四中,对用户进行推荐过程包括:
对给定目标用户和时间,计算时间感知下用户对每个未签到的访问值后,进行降序排列,选取访问值排在前N位的Top-N位置推荐给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910627873.8A CN110334293B (zh) | 2019-07-12 | 2019-07-12 | 面向位置社交网络的基于模糊聚类的具有时间感知的位置推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910627873.8A CN110334293B (zh) | 2019-07-12 | 2019-07-12 | 面向位置社交网络的基于模糊聚类的具有时间感知的位置推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110334293A true CN110334293A (zh) | 2019-10-15 |
CN110334293B CN110334293B (zh) | 2021-08-27 |
Family
ID=68146517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910627873.8A Active CN110334293B (zh) | 2019-07-12 | 2019-07-12 | 面向位置社交网络的基于模糊聚类的具有时间感知的位置推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110334293B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259267A (zh) * | 2020-02-20 | 2020-06-09 | 南京理工大学 | 一种基于稀疏性感知的分布式混合协同智能推荐方法 |
CN111738812A (zh) * | 2020-08-21 | 2020-10-02 | 深圳索信达数据技术有限公司 | 一种基于用户群微细分的信息推送方法及系统 |
CN111753212A (zh) * | 2020-06-09 | 2020-10-09 | 盐城网之易传媒有限公司 | 一种信息推荐方法和装置 |
CN111859178A (zh) * | 2020-04-22 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种推荐上车点的方法和系统 |
CN112488384A (zh) * | 2020-11-27 | 2021-03-12 | 香港理工大学深圳研究院 | 基于社交媒体签到预测目标区域的方法、终端及存储介质 |
CN112508725A (zh) * | 2020-12-04 | 2021-03-16 | 首都师范大学 | 一种基于社区结构的位置感知影响力最大化方法 |
CN112560910A (zh) * | 2020-12-02 | 2021-03-26 | 中国联合网络通信集团有限公司 | 用户分类方法和装置 |
CN112883292A (zh) * | 2021-02-06 | 2021-06-01 | 西北大学 | 用户行为推荐模型建立及基于时空信息的位置推荐方法 |
CN115687801A (zh) * | 2022-09-27 | 2023-02-03 | 南京工业职业技术大学 | 一种基于位置时效特征和时间感知动态相似性的位置推荐方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120109752A1 (en) * | 2009-08-19 | 2012-05-03 | Vitrue, Inc. | Systems and methods for delivering targeted content to a consumer's mobile device based on the consumer's physical location and social media memberships |
CN106056455A (zh) * | 2016-06-02 | 2016-10-26 | 南京邮电大学 | 一种基于位置和社交关系的群组与地点推荐方法 |
CN106997389A (zh) * | 2017-03-30 | 2017-08-01 | 浙江鸿程计算机系统有限公司 | 一种基于多数据集和协同张量分解的旅游景点推荐方法 |
CN107194011A (zh) * | 2017-06-23 | 2017-09-22 | 重庆邮电大学 | 一种基于社交网络的位置预测系统及方法 |
CN108804551A (zh) * | 2018-05-21 | 2018-11-13 | 辽宁工程技术大学 | 一种兼顾多样性与个性化的空间兴趣点推荐方法 |
CN109598337A (zh) * | 2018-12-05 | 2019-04-09 | 河南工业大学 | 分解模糊神经网络优化方法及装置 |
-
2019
- 2019-07-12 CN CN201910627873.8A patent/CN110334293B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120109752A1 (en) * | 2009-08-19 | 2012-05-03 | Vitrue, Inc. | Systems and methods for delivering targeted content to a consumer's mobile device based on the consumer's physical location and social media memberships |
CN106056455A (zh) * | 2016-06-02 | 2016-10-26 | 南京邮电大学 | 一种基于位置和社交关系的群组与地点推荐方法 |
CN106997389A (zh) * | 2017-03-30 | 2017-08-01 | 浙江鸿程计算机系统有限公司 | 一种基于多数据集和协同张量分解的旅游景点推荐方法 |
CN107194011A (zh) * | 2017-06-23 | 2017-09-22 | 重庆邮电大学 | 一种基于社交网络的位置预测系统及方法 |
CN108804551A (zh) * | 2018-05-21 | 2018-11-13 | 辽宁工程技术大学 | 一种兼顾多样性与个性化的空间兴趣点推荐方法 |
CN109598337A (zh) * | 2018-12-05 | 2019-04-09 | 河南工业大学 | 分解模糊神经网络优化方法及装置 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259267A (zh) * | 2020-02-20 | 2020-06-09 | 南京理工大学 | 一种基于稀疏性感知的分布式混合协同智能推荐方法 |
CN111259267B (zh) * | 2020-02-20 | 2022-09-20 | 南京理工大学 | 一种基于稀疏性感知的分布式混合协同智能推荐方法 |
CN111859178A (zh) * | 2020-04-22 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种推荐上车点的方法和系统 |
CN111859178B (zh) * | 2020-04-22 | 2024-04-09 | 北京嘀嘀无限科技发展有限公司 | 一种推荐上车点的方法和系统 |
CN111753212A (zh) * | 2020-06-09 | 2020-10-09 | 盐城网之易传媒有限公司 | 一种信息推荐方法和装置 |
CN111738812A (zh) * | 2020-08-21 | 2020-10-02 | 深圳索信达数据技术有限公司 | 一种基于用户群微细分的信息推送方法及系统 |
CN111738812B (zh) * | 2020-08-21 | 2020-12-08 | 深圳索信达数据技术有限公司 | 一种基于用户群微细分的信息推送方法及系统 |
CN112488384A (zh) * | 2020-11-27 | 2021-03-12 | 香港理工大学深圳研究院 | 基于社交媒体签到预测目标区域的方法、终端及存储介质 |
CN112560910B (zh) * | 2020-12-02 | 2024-03-01 | 中国联合网络通信集团有限公司 | 用户分类方法和装置 |
CN112560910A (zh) * | 2020-12-02 | 2021-03-26 | 中国联合网络通信集团有限公司 | 用户分类方法和装置 |
CN112508725A (zh) * | 2020-12-04 | 2021-03-16 | 首都师范大学 | 一种基于社区结构的位置感知影响力最大化方法 |
CN112508725B (zh) * | 2020-12-04 | 2023-02-17 | 首都师范大学 | 一种基于社区结构的位置感知影响力最大化方法 |
CN112883292A (zh) * | 2021-02-06 | 2021-06-01 | 西北大学 | 用户行为推荐模型建立及基于时空信息的位置推荐方法 |
CN112883292B (zh) * | 2021-02-06 | 2023-04-18 | 西北大学 | 用户行为推荐模型建立及基于时空信息的位置推荐方法 |
CN115687801B (zh) * | 2022-09-27 | 2024-01-19 | 南京工业职业技术大学 | 基于位置时效特征和时间感知动态相似性的位置推荐方法 |
CN115687801A (zh) * | 2022-09-27 | 2023-02-03 | 南京工业职业技术大学 | 一种基于位置时效特征和时间感知动态相似性的位置推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110334293B (zh) | 2021-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110334293A (zh) | 一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法 | |
CN108804551B (zh) | 一种兼顾多样性与个性化的空间兴趣点推荐方法 | |
CN105532030B (zh) | 用于分析目标实体的移动的装置、系统和方法 | |
Xu et al. | Understanding aggregate human mobility patterns using passive mobile phone location data: A home-based approach | |
CN105045858B (zh) | 基于投票的出租车载客点推荐方法 | |
EP3241370B1 (en) | Analyzing semantic places and related data from a plurality of location data reports | |
Wang et al. | Urban2vec: Incorporating street view imagery and pois for multi-modal urban neighborhood embedding | |
Xu et al. | A survey for mobility big data analytics for geolocation prediction | |
CN106101222A (zh) | 信息的推送方法和装置 | |
CN109241454A (zh) | 一种将社交网络和图像内容融合的兴趣点推荐方法 | |
Li et al. | A multi-dimensional context-aware recommendation approach based on improved random forest algorithm | |
McKenzie et al. | Measuring urban regional similarity through mobility signatures | |
CN114662015A (zh) | 一种基于深度强化学习的兴趣点推荐方法及系统 | |
Luan et al. | Collaborative tensor factorization and its application in POI recommendation | |
CN106202369A (zh) | 基于lbs与游客特征大数据分析的旅游信息推送方法 | |
CN107220856A (zh) | 一种移动消费群组识别的系统及方法 | |
CN104615707B (zh) | 信息点的确定方法及装置 | |
Huang et al. | Stpr: A personalized next point-of-interest recommendation model with spatio-temporal effects based on purpose ranking | |
CN108513262A (zh) | 基于合成似真路径的位置隐私保护方法 | |
Nawshin et al. | Modeling weather-aware prediction of user activities and future visits | |
CN106779181A (zh) | 一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法 | |
Huck et al. | Fuzzy Bayesian inference for mapping vague and place-based regions: a case study of sectarian territory | |
CN112784160B (zh) | 基于张量分解且顾及上下文语义信息的兴趣点推荐方法 | |
Yu et al. | RePiDeM: A refined POI demand modeling based on multi-source data | |
Tang et al. | Discovering urban functional zones from biased and sparse points of interests and sparse human activities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |