CN108804551A - 一种兼顾多样性与个性化的空间兴趣点推荐方法 - Google Patents
一种兼顾多样性与个性化的空间兴趣点推荐方法 Download PDFInfo
- Publication number
- CN108804551A CN108804551A CN201810489720.7A CN201810489720A CN108804551A CN 108804551 A CN108804551 A CN 108804551A CN 201810489720 A CN201810489720 A CN 201810489720A CN 108804551 A CN108804551 A CN 108804551A
- Authority
- CN
- China
- Prior art keywords
- user
- interest
- place
- point
- social
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims abstract description 44
- 230000003595 spectral effect Effects 0.000 claims abstract description 8
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 7
- 230000004927 fusion Effects 0.000 claims abstract description 4
- 239000008186 active pharmaceutical agent Substances 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000006855 networking Effects 0.000 claims description 6
- 230000017105 transposition Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000000638 solvent extraction Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 19
- 238000009826 distribution Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000007418 data mining Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种兼顾多样性与个性化的空间兴趣点推荐方法,涉及空间兴趣点推荐技术领域。包括:构建地理‑社会关系模型;计算模型中地点对在位置和社会联系上的相关度;构建相关度矩阵W;划分模型中构建的用户社会关系网络图G;计算在划分时的损失函数;选取令损失函数最小的特征向量并对图G中的顶点进行划分,得到k个具有多样性的兴趣点集合;从k个兴趣点集合中各选取一个最能拟合用户偏好的兴趣点组成一个融合多样性与个性化的兴趣点推荐列表。本发明提供的一种兼顾多样性与个性化的空间兴趣点推荐方法,融合兴趣点的地理‑社会关系模型、谱聚类算法、矩阵分解算法,使得为用户推荐的兴趣点具备较高准确率的同时还兼顾了多样性。
Description
技术领域
本发明涉及空间兴趣点推荐技术领域,具体涉及一种兼顾多样性与个性化的空间兴趣点推荐方法。
背景技术
随着移动互联网的发展和智能移动设备的普及应用,兴趣点(即用户感兴趣的地点,如餐馆、电影院、景点等)数据越来越丰富,同时也吸引了大量数据挖掘研究者的关注。一个良好的兴趣点推荐方法不仅可以为用户发现新的感兴趣的地点,扩宽用户视野,还应该有助于商家展开各种基于位置的服务,提高盈利收入。当前,大多数兴趣点推荐算法主要从三个方面展开研究,分别是兴趣点的地理特征、用户访问兴趣点的时间特征、访问兴趣点的用户的社会特征。Learning geographical preferences for point-of-interestrecommendation.Proceedings of the 19th ACM SIGKDD International Conference onKnowledge Discovery and Data Mining(KDD),2013,1043-1051.Liu等人通过综合计算用户对地点的兴趣、距离及兴趣点本身的受欢迎程度,获取用户对兴趣点的偏好程度;Aspatial-temporal probabilistic matrix factorization model for point-of-interest recommendation.Proceedings of the 2016Siam International Conferenceon Data Mining(SIAM),2016,117-125.Li等人结合地理因素和时间因素构建了用户的兴趣动态变化模型,以求获得更准确的兴趣点推荐效果;现有技术中还包括利用用户之间的社会联系对兴趣点推荐算法进行改进,使得兴趣点的推荐综合考虑了兴趣点的位置关系和访问兴趣点的用户之间的社会关系。然而,上述兴趣点推荐算法大都注重推荐结果的准确性,而忽略了推荐结果的多样性,导致推荐结果之间通常比较相似,从而不能有效扩展用户视野。
发明内容
针对现有技术存在的问题,本发明提供一种兼顾多样性与个性化的空间兴趣点推荐方法,融合兴趣点的地理-社会关系模型、谱聚类算法、矩阵分解算法,使得为用户推荐的兴趣点具备较高准确率的同时还兼顾了多样性。
为了实现上述目的,一种基于三层动态粒子群算法的多分类器模型构建方法,包括以下步骤:
步骤1:根据移动社交网络应用软件提供的数据,构建地理-社会关系模型,具体步骤如下:
步骤1.1:根据移动社交网络应用软件中查询到的用户访问地点的纬度值lat和经度值lon,建立用户访问地点集合P,令P={p1,...,pi,...,pn},其中,pi=(lati,loni),且i=1,2,…,n;
步骤1.2:构建用户社会关系网络图G,令G=(U,E),其中,U为所有用户的集合,ua∈U,ub∈U,边(ua,ub)∈E为用户ua和ub具有朋友关系;所述用户ua和ub具有朋友关系是指用户双方互为登记在对方社交软件的好友列表里,或者他们是亲属、同事等关系;
步骤1.3:建立所有用户的签到记录集合CK,令CK={<ua,pk,tr>|ua∈U,pi∈P},那么,访问过地点pk的用户集合UPk={ua|<ua,pk,*>∈CK},其中*表示任意时间;
步骤2:根据所构建的地理-社会关系模型中地点对之间的地理-社会距离,计算模型中地点对在位置和社会联系上的相关度;
步骤3:根据地理-社会关系模型的地点集合P中任意一对地点之间的相关度,构建n×n阶的相关度矩阵W,其中,wij为相关度矩阵中的元素,表示地点pi和pj之间的相关度;
步骤4:将构建的用户社会关系网络图G通过谱聚类算法中的规范割集准则划分成2个最优子图G1和G2,以N维向量q=[q1,q2,...,qN]记录用户社会关系网络图的划分方法;
步骤5:计算在划分最优子图时所截断的用户社会关系网络图G中边(ua,ub)的权重之和的函数,即损失函数Ncut(G1,G2),损失函数为最小值时划分方案为最佳方案;所述损失函数的计算公式如下:
其中,L=D-W,D为相关度矩阵W的对角矩阵,且有qT为向量q的转置,d1和d2分别为用户社会关系网络子图G1和G2的权值之和,c1和c2均为常数,用于标记用户社会关系网络图G中的顶点o的聚类归属;
由于损失函数Ncut(G1,G2)经推导可化为广义瑞利熵的形式,根据瑞利熵性质可知,特征向量q为最小值时损失函数Ncut(G1,G2)也为最小值;
步骤6:根据瑞利熵性质,取前M个令损失函数Ncut(G1,G2)为最小值的特征向量q,组成N×M矩阵R,其中第o个行向量代表顶点o,利用k-means聚类对用户社会关系网络图G中的顶点进行划分,最终得到k个聚类,即k个具有多样性的兴趣点集合;
步骤7:根据用户个数以及k个兴趣点集合中兴趣点的个数,构建k个用户-兴趣点访问次数矩阵,采用矩阵分解算法分别对k个用户-兴趣点访问次数矩阵进行拟合,从k个兴趣点集合中各选取一个最能拟合用户偏好的兴趣点,最终得到一个融合多样性与个性化的兴趣点推荐列表。
进一步地,所述步骤2中计算模型中地点对在位置和社会联系上的相关度的公式如下:
S(pi,pj)=1-Dgs(pi,pj);
其中,S(pi,pj)为地点对(pi,pj)在位置和社会联系上的相关度,Dgs(pi,pj)为地点对(pi,pj)之间的地理-社会距离;所述地点对(pi,pj)之间的地理-社会距离Dgs(pi,pj)的计算公式如下:
Dgs(pi,pj)=ω·DP(pi,pj)+(1-ω)·DS(pi,pj);
其中,DP(pi,pj)为地点对(pi,pj)之间的地理距离,DS(pi,pj)为地点对(pi,pj)之间的社会距离,ω为区间[0,1]内调节地点对(pi,pj)之间地理距离和社会距离在计算兴趣点的地理-社会距离时所占比重的参数;所述地点对(pi,pj)之间地理距离DP(pi,pj)和社会距离DS(pi,pj)的计算公式如下:
其中,E(pi,pj)为地点对(pi,pj)之间的欧氏距离,maxD为地点集合P中任意两点之间的最大距离,CUij为同时访问过地点pi和地点pj的用户集合,Upi为访问过地点pi的用户集合,Upj为访问过地点pj的用户集合;所述地点对(pi,pj)之间的欧氏距离E(pi,pj)的计算公式如下:
其中,lati、loni分别为地点pi的纬度值和经度值,latj、lonj分别为地点pj的纬度值和经度值。
本发明的有益效果:
本发明提出一种兼顾多样性与个性化的空间兴趣点推荐方法,融合兴趣点的地理-社会关系模型、谱聚类算法,令推荐的兴趣点具有较高的多样性,再结合矩阵分解算法对兴趣点进行拟合,使得最终为用户推荐的兴趣点具备较高准确率的同时还兼顾了多样性。
附图说明
图1为本发明实施例中兼顾多样性与个性化的空间兴趣点推荐方法的流程图;
图2为本发明实施例中谱聚类算法示意图;
图3为本发明实施例中训练数据集大小对DPFM和PFM算法结果的影响图;
其中,(a)为训练数据集大小对DPFM和PFM算法结果的多样性指标影响图;(b)为训练数据集大小对DPFM和PFM算法结果的准确率指标影响图;(c)为训练数据集大小对DPFM和PFM算法结果的召回率指标影响图。
具体实施方式
为了使本发明的目的、技术方案及优势更加清晰,下面结合附图和具体实施例对本发明做进一步详细说明。此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
一种兼顾多样性与个性化的空间兴趣点推荐方法,流程如图1所示,具体方法如下所述:
步骤1:根据移动社交网络应用软件提供的数据,构建地理-社会关系模型,具体步骤如下:
步骤1.1:根据移动社交网络应用软件中查询到的用户访问地点的纬度值lat和经度值lon,建立用户访问地点集合P,令P={p1,...,pi,...,pn},其中,pi=(lati,loni),且i=1,2,…,n。
步骤1.2:构建用户社会关系网络图G,令G=(U,E),其中,U为所有用户的集合,ua∈U,ub∈U,边(ua,ub)∈E为用户ua和ub具有朋友关系;所述用户ua和ub具有朋友关系是指用户双方互为登记在对方社交软件的好友列表里,或者他们是亲属、同事等关系。
步骤1.3:建立所有用户的签到记录集合CK,令CK={<ua,pk,tr>|ua∈U,pi∈P},那么,访问过地点pk的用户集合UPk={ua|<ua,pk,*>∈CK},其中*表示任意时间。
本实例中,采用Gowalla的2009年2月到2010年10月的用户签到数据作为分析数据(可从Stanford Large Network Dataset Collection取得)。该数据主要由用户社交关系网络图和用户签到记录的时空数据组成。其中,社会关系网络图中的节点代表用户,边代表用户之间的关系,该数据集涵盖了196591个节点以及950327条边;签到记录涵盖了从2009年2月份到2010年10月份共计6442890条记录,主要由用户id、签到时间、签到地点的经度、纬度以及签到地点的id组成。实验截取其中位于美国芝加哥市的经度在-88.04到-87.50之间,纬度在41.68到41.98之间的地区的数据作为实验分析数据,再删除其中签到次数少于5次的用户数据以及被访问次数少于5次的兴趣点数据,最终的数据包括41742条签到记录、1078个兴趣点和739名用户。
步骤2:根据所构建的地理-社会关系模型中地点对之间的地理-社会距离,计算模型中地点对在位置和社会联系上的相关度。
所述计算模型中地点对在位置和社会联系上的相关度的公式如公式(1)所示:
S(pi,pj)=1-Dgs(pi,pj) (1)
其中,S(pi,pj)为地点对(pi,pj)在位置和社会联系上的相关度,Dgs(pi,pj)为地点对(pi,pj)之间的地理-社会距离;所述地点对(pi,pj)之间的地理-社会距离Dgs(pi,pj)的计算公式如公式(2)所示:
Dgs(pi,pj)=ω·DP(pi,pj)+(1-ω)·DS(pi,pj) (2)
其中,DP(pi,pj)为地点对(pi,pj)之间的地理距离,DS(pi,pj)为地点对(pi,pj)之间的社会距离,ω为区间[0,1]内调节地点对(pi,pj)之间地理距离和社会距离在计算兴趣点的地理-社会距离时所占比重的参数;所述地点对(pi,pj)之间地理距离DP(pi,pj)和社会距离DS(pi,pj)的计算公式如公式(3)和公式(4)所示:
其中,E(pi,pj)为地点对(pi,pj)之间的欧氏距离,maxD为地点集合P中任意两点之间的最大距离,CUij为同时访问过地点pi和地点pj的用户集合,Upi为访问过地点pi的用户集合,Upj为访问过地点pj的用户集合;所述地点对(pi,pj)之间的欧氏距离E(pi,pj)的计算公式如公式(5)所示:
其中,lati、loni分别为地点pi的纬度值和经度值,latj、lonj分别为地点pj的纬度值和经度值。
步骤3:根据地理-社会关系模型的地点集合P中任意一对地点之间的相关度,构建n×n阶的相关度矩阵W,其中,wij为相关度矩阵中的元素,表示地点pi和pj之间的相关度。
步骤4:将构建的用户社会关系网络图G通过谱聚类算法中的规范割集准则划分成2个最优子图G1和G2,以N维向量q=[q1,q2,...,qN]记录用户社会关系网络图的划分方法。
本实施例中,谱聚类算法示意图如图2所示,若用户社会关系网络图G中的顶点o属于最优子图G1,则令qo=c1,若用户社会关系网络图G中的顶点o属于最优子图G2,则令qo=c2,以此类推,其中,o=1,…,N,ck为常数,用于标记顶点o的聚类归属,N=7。
步骤5:计算在划分最优子图时所截断的用户社会关系网络图G中边(ua,ub)的权重之和的函数,即损失函数Ncut(G1,G2),损失函数为最小值时划分方案为最佳方案;所述损失函数的计算公式如公式(6)所示:
其中,L=D-W,D为相关度矩阵W的对角矩阵,且有qT为向量q的转置,d1和d2分别为用户社会关系网络子图G1和G2的权值之和,c1和c2均为常数,用于标记用户社会关系网络图G中的顶点o的聚类归属。
由于损失函数Ncut(G1,G2)经推导可化为广义瑞利熵的形式,根据瑞利熵性质可知,特征向量q为最小值时损失函数Ncut(G1,G2)也为最小值。
本实施例中,若使损失函数Ncut(G1,G2)为最小值,需满足qTLq为最小值,而损失函数可化为广义瑞利熵的形式,即因此,只要使特征向量q为最小值,损失函数Ncut(G1,G2)也为最小值。
本实施例中,划分方案的划分准则如公式(7)所示:
其中,qo为N维向量q中的元素,d为用户社会关系网络图G的权值之和。
步骤6:根据瑞利熵性质,取前M个令损失函数Ncut(G1,G2)为最小值的特征向量q,组成N×M矩阵R,其中第o个行向量代表顶点o,利用k-means聚类对用户社会关系网络图G中的顶点进行划分,最终得到k个聚类,即k个具有多样性的兴趣点集合。
根据瑞利熵性质,当q为L的最小特征值、次小特征值、……、最大特征值对应的特征向量时,分别取到R(L,q)的最小值、次小值、……、最大值,结合公式(6)可知,当q为L的最小特征值、次小特征值、……、最大特征值对应的特征向量时,qTLq分别取得了最小值、次小值、……、最大值,由此可得到满足min(qTLq)的最佳划分方案,即满足损失函数Ncut(G1,G2)为最小值的最佳划分方案。
本实施例中,k取10,要将带权无向图G划分为10个子图,则可取前2个最小特征值对应的特征向量,组成一个7×2矩阵R,第o个行向量代表顶点o,然后利用k-means聚类划分顶点,最终得到10个聚类。
步骤7:根据用户个数以及k个兴趣点集合中兴趣点的个数,构建k个用户-兴趣点访问次数矩阵,采用矩阵分解算法分别对k个用户-兴趣点访问次数矩阵进行拟合,从k个兴趣点集合中各选取一个最能拟合用户偏好的兴趣点,最终得到一个融合多样性与个性化的兴趣点推荐列表。
本实施例中,根据用户个数S以及10个兴趣点集合中兴趣点的个数T,构建10个S×T维的用户-兴趣点访问次数矩阵F,用来记录用户访问兴趣点的次数,其中,矩阵中的元素fst表示用户s访问兴趣点t的次数,而fst满足以yst为均值的泊松分布,则yst可以组成一个与矩阵F具有相同行列数的S×T矩阵Y,并且矩阵Y可被分解为一个s×h维的矩阵U和一个t×h维的矩阵V,其中U中的元素usl(l=1,…,h)表示用户s对兴趣点潜在属性l的偏好程度,V中的元素vtl(l=1,…,h)表示兴趣点t对潜在属性l的贴近程度。
令usl、vtl服从Gamma先验分布,则参数为α和β条件下取得的矩阵U的概率p(U|α,β)和矩阵U的概率p(V|α,β)可采用公式(8)和公式(9)表示:
其中,α={α1,α2,…,αh}为Gamma分布的形状参数,且αl>0,β={β1,β2,…,βh}为Gamma分布的尺度参数,且βl>0,usl>0,vtl>0,Г(·)为Gamma函数。
基于公式(8)和公式(9),矩阵F满足矩阵Y的泊松概率分布p(F|Y)可采用公式(10)表示:
其中,
由于Y=UVT,故在给定条件为F时,U、V的后验概率p(U,V|F,α,β)可采用公式(11)表示:
p(U,V|F,α,β)∝p(F|Y)p(U|α,β)p(V|α,β) (11)
求取公式(11)的最大值,即可得到最能拟合F的矩阵U和矩阵V。
为求取公式(11)的最大值,取公式(11)的对数作为函数L(U,V|F),如公式(12)所示:
根据公式(12),分别求函数L(U,V|F)对参数usl、vtl的偏导,得到公式(13)和公式(14):
采用随机梯度下降法对公式(12)中的参数usl、vtl进行求解,分别以公式(13)和公式(14)最为斜率,以为步长,得到迭代公式如公式(15)和公式(16)所示:
利用公式(15)和公式(16)分别对参数usl和vtl进行迭代,最终得到拟合度较高的Y=UVT,用来预测用户访问兴趣点的次数。
本实施例中,分别采用矩阵分解算法中概率因子模型(PFM)和以地理-社会关系为基础的概率因子模型(DPFM)实现了兴趣点的多样性与个性化推荐,并对这两种算法的推荐效果进行对比,分别采用多样性、准确率和召回率三个指标对算法的效果和性能进行评价。
所述多样性、准确率和召回率三个指标的度量方法如公式(17)-公式(19)所示:
其中,DivLrec为多样性指标,precision@k为准确率指标,recall@k为召回率指标,Lrec表示推荐兴趣点的列表,Ltest为测试兴趣点列表,由测试集中选出的前k个用户访问次数最多的兴趣点组成,且有k=|Ltest|=|Lrec|,DivLrec的高低反映了推荐结果多样性的程度,其值越大,推荐列表Lrec的多样性程度越高,precision@k和recall@k的高低反映了推荐结果个性化的程度,其值越大,推荐列表Lrec的个性化程度越高。
本实施例中,令本方法的参数ω=0.9,M=2,k=10,而PFM中的参数则根据文献MaH,LiuC,King I,et al.Probabilistic factor models for web site recommendation[C].//Proc of the 34th International ACM SIGIR Conference on Research andDevelopment in Information Retrieval.Beijing:ACM,2011:265-274.中的最优参数设定,αk=20、βk=0.2,分别以10%、20%、……90%的数据集作为两种算法的训练集,剩下的90%、80%、……10%的数据做为测试集,为了克服k-means聚类结果的随机性,针对每个用户的推荐结果的评估重复10次取平均值,再取整体用户的平均值作为推荐系统的整体评估值,对DPFM、PFM进行对比,对比结果如图3所示。
由图3(a)可知,我们提出的DPFM算法的多样性普遍高于不进行多样性分析的PFM算法;而图3(b)显示有三分之二的结果表明DPFM算法的准确率高于PFM,图3(c)显示DPFM算法的召回率高于PFM。综上所述,DPFM算法推荐的兴趣点列表在多样性和准确性方面都同时优于PFM方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;因而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。
Claims (2)
1.一种兼顾多样性与个性化的空间兴趣点推荐方法,其特征在于,包括以下步骤:
步骤1:根据移动社交网络应用软件提供的数据,构建地理-社会关系模型,具体步骤如下:
步骤1.1:根据移动社交网络应用软件中查询到的用户访问地点的纬度值lat和经度值lon,建立用户访问地点集合P,令P={p1,...,pi,...,pn},其中,pi=(lati,loni),且i=1,2,...,n;
步骤1.2:构建用户社会关系网络图G,令G=(U,E),其中,U为所有用户的集合,ua∈U,ub∈U,边(ua,ub)∈E为用户ua和ub具有朋友关系;所述用户ua和ub具有朋友关系是指用户双方互为登记在对方社交软件的好友列表里,或者他们是亲属、同事等关系;
步骤1.3:建立所有用户的签到记录集合CK,令CK={<ua,pk,tr>|ua∈U,pi∈P},那么,访问过地点pk的用户集合UPk={ua|<ua,pk,*>∈CK},其中*表示任意时间;
步骤2:根据所构建的地理-社会关系模型中地点对之间的地理-社会距离,计算模型中地点对在位置和社会联系上的相关度;
步骤3:根据地理-社会关系模型的地点集合P中任意一对地点之间的相关度,构建n×n阶的相关度矩阵W,其中,wij为相关度矩阵中的元素,表示地点pi和pj之间的相关度;
步骤4:将构建的用户社会关系网络图G通过谱聚类算法中的规范割集准则划分成2个最优子图G1和G2,以N维向量q=[q1,q2,...,qN]记录用户社会关系网络图的划分方法;
步骤5:计算在划分最优子图时所截断的用户社会关系网络图G中边(ua,ub)的权重之和的函数,即损失函数Ncut(G1,G2),损失函数为最小值时划分方案为最佳方案;所述损失函数的计算公式如下:
其中,L=D-W,D为相关度矩阵W的对角矩阵,且有qT为向量q的转置,d1和d2分别为用户社会关系网络子图G1和G2的权值之和,c1和c2均为常数,用于标记用户社会关系网络图G中的顶点o的聚类归属;
由于损失函数Ncut(G1,G2)经推导可化为广义瑞利熵的形式,根据瑞利熵性质可知,特征向量q为最小值时损失函数Ncut(G1,G2)也为最小值;
步骤6:根据瑞利熵性质,取前M个令损失函数Ncut(G1,G2)为最小值的特征向量q,组成N×M矩阵R,其中第o个行向量代表顶点o,利用k-means聚类对用户社会关系网络图G中的顶点进行划分,最终得到k个聚类,即k个具有多样性的兴趣点集合;
步骤7:根据用户个数以及k个兴趣点集合中兴趣点的个数,构建k个用户-兴趣点访问次数矩阵,采用矩阵分解算法分别对k个用户-兴趣点访问次数矩阵进行拟合,从k个兴趣点集合中各选取一个最能拟合用户偏好的兴趣点,最终得到一个融合多样性与个性化的兴趣点推荐列表。
2.根据权利要求1所述的兼顾多样性与个性化的空间兴趣点推荐方法,其特征在于,所述步骤2中计算模型中地点对在位置和社会联系上的相关度的公式如下:
S(pi,pj)=1-Dgs(pi,pj);
其中,S(pi,pj)为地点对(pi,pj)在位置和社会联系上的相关度,Dgs(pi,pj)为地点对(pi,pj)之间的地理-社会距离;所述地点对(pi,pj)之间的地理-社会距离Dgs(pi,pj)的计算公式如下:
Dgs(pi,pj)=ω·DP(pi,pj)+(1-ω)·Ds(pi,pj);
其中,DP(pi,pj)为地点对(pi,pj)之间的地理距离,Ds(pi,pj)为地点对(pi,pj)之间的社会距离,ω为区间[0,1]内调节地点对(pi,pj)之间地理距离和社会距离在计算兴趣点的地理-社会距离时所占比重的参数;所述地点对(pi,pj)之间地理距离DP(pi,pj)和社会距离DS(pi,pj)的计算公式如下:
其中,E(pi,pj)为地点对(pi,pj)之间的欧氏距离,max D为地点集合P中任意两点之间的最大距离,CUij为同时访问过地点pi和地点pj的用户集合,Upi为访问过地点pi的用户集合,Upj为访问过地点pj的用户集合;所述地点对(pi,pj)之间的欧氏距离E(pi,pj)的计算公式如下:
其中,lati、loni分别为地点pi的纬度值和经度值,latj、lonj分别为地点pj的纬度值和经度值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810489720.7A CN108804551B (zh) | 2018-05-21 | 2018-05-21 | 一种兼顾多样性与个性化的空间兴趣点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810489720.7A CN108804551B (zh) | 2018-05-21 | 2018-05-21 | 一种兼顾多样性与个性化的空间兴趣点推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108804551A true CN108804551A (zh) | 2018-11-13 |
CN108804551B CN108804551B (zh) | 2021-06-04 |
Family
ID=64091305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810489720.7A Expired - Fee Related CN108804551B (zh) | 2018-05-21 | 2018-05-21 | 一种兼顾多样性与个性化的空间兴趣点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108804551B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020883A (zh) * | 2018-12-12 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 一种对评分矩阵中的未知评分进行预测的方法及装置 |
CN110119475A (zh) * | 2019-01-29 | 2019-08-13 | 成都信息工程大学 | 一种poi推荐方法及推荐系统 |
CN110222278A (zh) * | 2019-06-18 | 2019-09-10 | 东北大学 | 综合因素下用户位置的获取方法 |
CN110298687A (zh) * | 2019-05-23 | 2019-10-01 | 香港理工大学深圳研究院 | 一种区域吸引力评估方法及设备 |
CN110334293A (zh) * | 2019-07-12 | 2019-10-15 | 吉林大学 | 一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法 |
CN110362652A (zh) * | 2019-07-19 | 2019-10-22 | 辽宁工程技术大学 | 基于空间-语义-数值相关度的空间关键字Top-K查询方法 |
CN110619090A (zh) * | 2019-08-05 | 2019-12-27 | 香港理工大学深圳研究院 | 一种区域吸引力评估方法及设备 |
CN111209475A (zh) * | 2019-12-27 | 2020-05-29 | 武汉大学 | 一种基于时空序列和社会嵌入排名的兴趣点推荐方法及装置 |
WO2020147145A1 (en) * | 2019-01-19 | 2020-07-23 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for online to offline services |
CN113486237A (zh) * | 2021-06-07 | 2021-10-08 | 海南太美航空股份有限公司 | 一种航班信息的推荐方法、系统、存储介质和电子设备 |
CN113590971A (zh) * | 2021-08-13 | 2021-11-02 | 浙江大学 | 一种基于类脑时空感知表征的兴趣点推荐方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090012955A1 (en) * | 2007-07-03 | 2009-01-08 | John Chu | Method and system for continuous, dynamic, adaptive recommendation based on a continuously evolving personal region of interest |
CN102594905A (zh) * | 2012-03-07 | 2012-07-18 | 南京邮电大学 | 一种基于场景的社交网络位置兴趣点推荐方法 |
CN102695120A (zh) * | 2011-03-25 | 2012-09-26 | 北京千橡网景科技发展有限公司 | 用于向移动终端的用户提供poi信息的方法和设备 |
CN103096242A (zh) * | 2011-11-03 | 2013-05-08 | 腾讯科技(深圳)有限公司 | 基于位置服务的用户推荐方法及系统 |
CN108874877A (zh) * | 2018-05-03 | 2018-11-23 | 浙江大学城市学院 | 一种面向位置社交网络的基于图链接分析的兴趣点推荐方法 |
-
2018
- 2018-05-21 CN CN201810489720.7A patent/CN108804551B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090012955A1 (en) * | 2007-07-03 | 2009-01-08 | John Chu | Method and system for continuous, dynamic, adaptive recommendation based on a continuously evolving personal region of interest |
CN102695120A (zh) * | 2011-03-25 | 2012-09-26 | 北京千橡网景科技发展有限公司 | 用于向移动终端的用户提供poi信息的方法和设备 |
CN103096242A (zh) * | 2011-11-03 | 2013-05-08 | 腾讯科技(深圳)有限公司 | 基于位置服务的用户推荐方法及系统 |
CN102594905A (zh) * | 2012-03-07 | 2012-07-18 | 南京邮电大学 | 一种基于场景的社交网络位置兴趣点推荐方法 |
CN108874877A (zh) * | 2018-05-03 | 2018-11-23 | 浙江大学城市学院 | 一种面向位置社交网络的基于图链接分析的兴趣点推荐方法 |
Non-Patent Citations (9)
Title |
---|
DA-CHUAN ZHANG 等: "Point of interest recommendation with social and geographical influence", 《BIG DATA》 * |
SHENGLIN ZHAO 等: "Capturing Geographical Influence in POI Recommendations", 《 NEURAL INFORMATION PROCESSING》 * |
任星怡 等: "基于用户签到行为的兴趣点推荐", 《计算机学报》 * |
刘树栋 等: "基于位置的社会化网络推荐系统", 《计算机学报》 * |
唐延欢 等: "融合地理-社会关系的空间聚类方法", 《小型微型计算机系统》 * |
崔琳 等: "基于潜在地理——社会关系感知的兴趣点推荐研究", 《宿州学院学报》 * |
李玉翔: "基于网络社区的用户兴趣建模与推荐技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
李琳 等: "融合评分矩阵与评论文本的商品推荐模型", 《计算机学报》 * |
陈召新: "基于谱聚类的个性化推荐算法", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020883A (zh) * | 2018-12-12 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 一种对评分矩阵中的未知评分进行预测的方法及装置 |
WO2020147145A1 (en) * | 2019-01-19 | 2020-07-23 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for online to offline services |
CN110119475A (zh) * | 2019-01-29 | 2019-08-13 | 成都信息工程大学 | 一种poi推荐方法及推荐系统 |
CN110298687A (zh) * | 2019-05-23 | 2019-10-01 | 香港理工大学深圳研究院 | 一种区域吸引力评估方法及设备 |
CN110298687B (zh) * | 2019-05-23 | 2021-04-16 | 香港理工大学深圳研究院 | 一种区域吸引力评估方法及设备 |
CN110222278A (zh) * | 2019-06-18 | 2019-09-10 | 东北大学 | 综合因素下用户位置的获取方法 |
CN110222278B (zh) * | 2019-06-18 | 2022-05-17 | 东北大学 | 综合因素下用户位置的获取方法 |
CN110334293A (zh) * | 2019-07-12 | 2019-10-15 | 吉林大学 | 一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法 |
CN110334293B (zh) * | 2019-07-12 | 2021-08-27 | 吉林大学 | 面向位置社交网络的基于模糊聚类的具有时间感知的位置推荐方法 |
CN110362652A (zh) * | 2019-07-19 | 2019-10-22 | 辽宁工程技术大学 | 基于空间-语义-数值相关度的空间关键字Top-K查询方法 |
CN110362652B (zh) * | 2019-07-19 | 2022-11-22 | 辽宁工程技术大学 | 基于空间-语义-数值相关度的空间关键字Top-K查询方法 |
CN110619090A (zh) * | 2019-08-05 | 2019-12-27 | 香港理工大学深圳研究院 | 一种区域吸引力评估方法及设备 |
CN110619090B (zh) * | 2019-08-05 | 2022-01-21 | 香港理工大学深圳研究院 | 一种区域吸引力评估方法及设备 |
CN111209475A (zh) * | 2019-12-27 | 2020-05-29 | 武汉大学 | 一种基于时空序列和社会嵌入排名的兴趣点推荐方法及装置 |
CN111209475B (zh) * | 2019-12-27 | 2022-03-15 | 武汉大学 | 一种基于时空序列和社会嵌入排名的兴趣点推荐方法及装置 |
CN113486237A (zh) * | 2021-06-07 | 2021-10-08 | 海南太美航空股份有限公司 | 一种航班信息的推荐方法、系统、存储介质和电子设备 |
CN113486237B (zh) * | 2021-06-07 | 2023-06-27 | 海南太美航空股份有限公司 | 一种航班信息的推荐方法、系统、存储介质和电子设备 |
CN113590971A (zh) * | 2021-08-13 | 2021-11-02 | 浙江大学 | 一种基于类脑时空感知表征的兴趣点推荐方法及系统 |
CN113590971B (zh) * | 2021-08-13 | 2023-11-07 | 浙江大学 | 一种基于类脑时空感知表征的兴趣点推荐方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108804551B (zh) | 2021-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804551A (zh) | 一种兼顾多样性与个性化的空间兴趣点推荐方法 | |
Hang et al. | Exploring student check-in behavior for improved point-of-interest prediction | |
CN108460101B (zh) | 面向位置社交网络基于地理位置正则化的兴趣点推荐方法 | |
CN107133277B (zh) | 一种基于动态主题模型和矩阵分解的旅游景点推荐方法 | |
CN110334293B (zh) | 面向位置社交网络的基于模糊聚类的具有时间感知的位置推荐方法 | |
Davtalab et al. | A POI recommendation approach integrating social spatio-temporal information into probabilistic matrix factorization | |
CN109948066B (zh) | 一种基于异构信息网络的兴趣点推荐方法 | |
Xing et al. | Points-of-interest recommendation based on convolution matrix factorization | |
CN107341261B (zh) | 一种面向位置社交网络的兴趣点推荐方法 | |
Li et al. | A multi-dimensional context-aware recommendation approach based on improved random forest algorithm | |
Chen et al. | MPE: A mobility pattern embedding model for predicting next locations | |
Gao et al. | Identification of urban regions’ functions in Chengdu, China, based on vehicle trajectory data | |
Rahimi et al. | Behavior-based location recommendation on location-based social networks | |
CN111324816A (zh) | 一种基于区域划分和上下文影响的兴趣点推荐方法 | |
Pálovics et al. | Location-aware online learning for top-k recommendation | |
Shaikh et al. | An AHP/TOPSIS-based approach for an optimal site selection of a commercial opening utilizing geospatial data | |
CN114528480A (zh) | 一种基于k均值聚类的时间感知自适应兴趣点推荐方法 | |
Hu et al. | A framework to detect and understand thematic places of a city using geospatial data | |
Lang et al. | POI recommendation based on a multiple bipartite graph network model | |
Noorian Avval et al. | A hybrid recommender system using topic modeling and prefixspan algorithm in social media | |
Vahidnia | Point-of-interest recommendation in location-based social networks based on collaborative filtering and spatial kernel weighting | |
Yan et al. | Identification of secondary functional areas and functional structure analysis based on multisource geographic data | |
Pan et al. | Exploiting user behavior learning for personalized trajectory recommendations | |
Gao et al. | Personalized recommendation method of POI based on deep neural network | |
Yu et al. | Personalized POI groups recommendation in location-based social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210604 |