CN107220312B - 一种基于共现图的兴趣点推荐方法及系统 - Google Patents

一种基于共现图的兴趣点推荐方法及系统 Download PDF

Info

Publication number
CN107220312B
CN107220312B CN201710332672.6A CN201710332672A CN107220312B CN 107220312 B CN107220312 B CN 107220312B CN 201710332672 A CN201710332672 A CN 201710332672A CN 107220312 B CN107220312 B CN 107220312B
Authority
CN
China
Prior art keywords
node
interest
user
nodes
occurrence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710332672.6A
Other languages
English (en)
Other versions
CN107220312A (zh
Inventor
李玉华
张军
李瑞轩
辜希武
袁清亮
梁天安
徐明丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201710332672.6A priority Critical patent/CN107220312B/zh
Publication of CN107220312A publication Critical patent/CN107220312A/zh
Application granted granted Critical
Publication of CN107220312B publication Critical patent/CN107220312B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于共现图的兴趣点推荐方法及系统,推荐方法包含了数据收集与处理,共现图构建,相似度计算,位置因素建模,以及用户推荐五个过程。基于共现图的兴趣点推荐方法,其特征在于利用用户的签到数据构建兴趣点之间的共现图,之后基于共现图计算节点之间的两种相似性,进而根据图中节点间的相似性对用户进行兴趣点推荐。本发明使用基于兴趣点之间的相似性这一新的角度进行推荐,推荐方法充分挖掘了已有数据中的信息,解决了兴趣点推荐过程中的稀疏性,以及大规模社交网络中推荐方法的可伸缩性问题。

Description

一种基于共现图的兴趣点推荐方法及系统
技术领域
本发明属于数据挖掘和推荐技术领域,更具体地,涉及一种位置社交网络中的基于共现图的兴趣点推荐方法及系统。
背景技术
兴趣点(Point of interest,POI)推荐起源于基于位置的移动互联网的发展,POI推荐是基于已有数据向用户推荐其可能感兴趣的位置。POI推荐服务对于基于位置的社交网络(Location-based Social Network,LBSN)中的用户以及商家都有莫大的益处,精准的推荐方法可以极大的节省用户的时间,提升用户的体验度;同时商家能够通过推荐系统发现潜在的顾客。以上原因促使POI推荐问题成为工业界与学术界中重要的研究问题。
POI推荐不同于传统推荐,其特殊的挑战在于:(1)隐式的反馈数据,数据中只有用户的签到信息,而没有喜好信息;(2)位置影响较大,用户更倾向于访问较近的位置;(3)数据稀疏性问题,POI推荐中的数据稀疏性主要体现在:用户签到的POI数量稀少,对于签到活动的描述信息简短,同时缺乏POI本身的描述信息;(4)冷启动问题,难以对新的用户和新的POI进行精准的推荐;(5)时间特性,用户在不同时间段访问的位置类型差异性很大。时间敏感的POI推荐算法也是目前学术研究的热点;(6)网络动态性,LBSN网络中,用户的签到信息每时每刻都在源源不断的产生。增量式可扩展的POI推荐算法将更适用于生产实践。以上的特殊性造成传统的推荐方法不能够直接运用到POI推荐问题中。
目前的解决方案主要是将POI推荐中的特有因素融入到普通推荐中去。已有的融入模型有两种:融合模型和联合模型。融合模型对不同的因素进行分别建模,并融合分别得到的推荐结果;联合模型将多个因素统一到同一模型中建模,并给出唯一的推荐结果。POI推荐场景中特殊的因素包括了位置,时间,POI的类别等因素。已有的模型大多从用户的角度出发对用户的喜好和行为习惯直接建模,例如:基于用户的协同过滤方法,以及使用概率图模型对用户访问POI的决策过程进行建模。然而稀疏的签到信息会削弱从用户的角度出发对用户兴趣进行建模的效果。同时因为用户的数量远远大于POI的数量,所以已有的研究模型具有较差的可伸缩性,难以适应大规模LBSN网络中的实时位置推荐。
发明内容
针对现有技术的以上缺陷及改进需求,本发明的目的在于提供了一种基于共现图的兴趣点推荐方法及系统,由此解决现有技术中POI推荐中的数据存在的稀疏性问题,以及大规模社交网络中POI推荐的可伸缩性较差的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于共现图的兴趣点推荐方法,包括:
S1、计算预先构建的共现图中任意两个节点间的相似性,所述相似性表示所述任意两个节点之间的相近程度,其中,所述共现图表示在基于位置的社交网络LBSN中所有用户已访问的兴趣点之间的共现关系,所述共现图中的节点表示所有用户已访问的兴趣点,所述共现图中的边的权重表示同时访问过该边对应的兴趣点对的用户数量;
S2、根据用户u访问的历史位置集合Lu,由
Figure BDA0001292936690000021
得到用户u访问位置l所处区域的概率,其中,lui∈Lu
Figure BDA0001292936690000022
n表示集合Lu的大小,σ表示最大化似然函数的带宽,l属于LBSN中所有用户已访问的兴趣点,但不属于Lu中的兴趣点;
S3、由所述任意两个节点间的相似性得到各待推荐的候选节点与Lu间的相似性,由所述概率fgeo(l|u)得到用户访问各待推荐的候选节点所处区域的概率,结合两者对用户u进行兴趣点推荐,其中,待推荐的候选节点属于与Lu中各节点直接相连的一阶邻居节点以及与Lu中各节点间接相连但有共同一阶邻居节点的二阶邻居节点。
优选地,在步骤S1之前,所述方法还包括:
获取基于位置的社交网络LBSN中的每个用户在历史时间段T内访问过的所有兴趣点集合,由所有用户访问的兴趣点组成共现图的节点;
对于每一个用户,用户u在历史时间段T内访问过的所有兴趣点集合Lu中任意的两个元素对lui和luj,其中,ui≠uj,若在所述共现图中不存在lui和luj之间的无向边,则在所述共现图中利用一条无向边连接节点lui和luj,并将该边的权重赋值为1,若在所述共现图中存在lui和luj之间的无向边,则将节点lui和luj之间的无向边的权重值加1。
优选地,步骤S1具体包括以下子步骤:
S1.1、由
Figure BDA0001292936690000031
得到所述共现图中任意节点li和lj之间的共现概率,其中,w(li,lj)表示所述共现图中节点li和lj之间直接相连的无向边的权重,W为所述共现图中所有边的权重和;
S1.2、由
Figure BDA0001292936690000032
得到所述共现图中节点li相对于节点lj之间的一阶相似性;
S1.3、由
Figure BDA0001292936690000033
得到所述共现图中节点li相对于节点lj之间的二阶相似性,其中,lk为与节点lj直接相连的邻居节点。
优选地,步骤S3具体包括以下子步骤:
S3.1、由
Figure BDA0001292936690000041
获取用户对各候选节点ln的喜爱程度,其中,候选节点ln是所述共现图中与Lu中各节点直接相连的一阶邻居节点或间接相连但具有共同一阶邻居节点的二阶邻居节点,p(ln|lm)表示节点ln相对于节点lm之间的一阶相似性,p'(ln|lm)表示节点ln相对于节点lm之间的二阶相似性;
S3.2、对所有候选节点ln,计算用户访问各候选节点ln所处区域的概率fgeo(ln|u);
S3.3、由s(u,ln)=fgeo(ln|u)*fpre(ln|u)得到用户u访问各候选节点ln的总评分,将评分最高的前k个兴趣点推荐给用户u,其中,k为正整数。
按照本发明的另一方面,提供了一种基于共现图的兴趣点推荐系统,包括:
相似性计算模块,用于计算预先构建的共现图中任意两个节点间的相似性,所述相似性表示所述任意两个节点之间的相近程度,其中,所述共现图表示在基于位置的社交网络LBSN中所有用户已访问的兴趣点之间的共现关系,所述共现图中的节点表示所有用户已访问的兴趣点,所述共现图中的边的权重表示同时访问过该边对应的兴趣点对的用户数量;
访问概率计算模块,用于根据用户u访问的历史位置集合Lu,由
Figure BDA0001292936690000042
得到用户u访问位置l所处区域的概率,其中,lui∈Lu
Figure BDA0001292936690000043
n表示集合Lu的大小,σ表示最大化似然函数的带宽,l属于LBSN中所有用户已访问的兴趣点,但不属于Lu中的兴趣点;
兴趣点推荐模块,用于由所述任意两个节点间的相似性得到各待推荐的候选节点与Lu间的相似性,由所述概率fgeo(l|u)得到用户访问各待推荐的候选节点所处区域的概率,结合两者对用户u进行兴趣点推荐,其中,待推荐的候选节点属于与Lu中各节点直接相连的一阶邻居节点以及与Lu中各节点间接相连但有共同一阶邻居节点的二阶邻居节点。
优选地,所述系统还包括:
信息采集模块,用于获取基于位置的社交网络LBSN中的每个用户在历史时间段T内访问过的所有兴趣点集合,由所有用户访问的兴趣点组成共现图的节点;
共现图构建模块,用于对于每一个用户,用户u在历史时间段T内访问过的所有兴趣点集合Lu中任意的两个元素对lui和luj,其中,ui≠uj,若在所述共现图中不存在lui和luj之间的无向边,则在所述共现图中利用一条无向边连接节点lui和luj,并将该边的权重赋值为1,若在所述共现图中存在lui和luj之间的无向边,则将节点lui和luj之间的无向边的权重值加1。
优选地,所述相似性计算模块包括:
共现概率计算模块,用于由
Figure BDA0001292936690000051
得到所述共现图中任意节点li和lj之间的共现概率,其中,w(li,lj)表示所述共现图中节点li和lj之间直接相连的无向边的权重,W为所述共现图中所有边的权重和;
一阶相似性计算模块,用于由
Figure BDA0001292936690000052
得到所述共现图中节点li相对于节点lj之间的一阶相似性;
二阶相似性计算模块,用于由
Figure BDA0001292936690000053
得到所述共现图中节点li相对于节点lj之间的二阶相似性,其中,lk为与节点lj直接相连的邻居节点。
优选地,所述兴趣点推荐模块包括:
候选点喜爱程度计算模块,用于由
Figure BDA0001292936690000061
获取用户对各候选节点ln的喜爱程度,其中,候选节点ln是所述共现图中与Lu中各节点直接相连的一阶邻居节点或间接相连但具有共同一阶邻居节点的二阶邻居节点,p(ln|lm)表示节点ln相对于节点lm之间的一阶相似性,p'(ln|lm)表示节点ln相对于节点lm之间的二阶相似性;
候选点访问概率计算模块,用于对所有候选节点ln,计算用户访问各候选节点ln所处区域的概率fgeo(ln|u);
兴趣点推荐子模块,用于由s(u,ln)=fgeo(ln|u)*fpre(ln|u)得到用户u访问各候选节点ln的总评分,将评分最高的前k个兴趣点推荐给用户u,其中,k为正整数。
总体而言,本发明方法与现有技术方案相比,能够取得下列有益效果:本发明不仅能够缓解签到数据稀疏的问题,同时具有较高的可伸缩性,因此本发明能够适应大规模LBSN网络中的实时推荐。
附图说明
图1为本发明实施例公开的一种基于共现图的兴趣点推荐方法的流程示意图;
图2为本发明实施例公开的一种共现图的构建示例图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明中的兴趣点推荐方法依托于LBSN网络。LBSN网络可以表示为G=(U,L,E),其中U={u1,u2,…,um}代表LBSN网络中所有用户的集合;L={l1,l2,…,ln}表示LBSN网络中所有兴趣点的集合,兴趣点也可以被称为位置;E代表LBSN网络中的边,其包含了两种关系:用户ui和用户uj之间的朋友关系F,以及用户u和位置l之间的访问关系R;本发明中使用Lu表示用户u访问过的所有兴趣点的集合。
如图1所示为本发明实施例公开的一种基于共现图的兴趣点推荐方法的流程示意图,在图1所示的方法中包括以下步骤:
S1、计算预先构建的共现图中任意两个节点间的相似性,上述相似性表示任意两个节点之间的相近程度,其中,共现图表示在基于位置的社交网络LBSN中所有用户已访问的兴趣点之间的共现关系,共现图中的节点表示所有用户已访问的兴趣点,共现图中的边的权重表示同时访问过该边对应的兴趣点对的用户数量;
其中,在步骤S1之前,还包括共现图的构建:
本发明中的共现图的定义如下:共现图是一个无向带权图,其表示各兴趣点之间的共现关系。共现图可以表示为G=(L,E),其中,共现图中的节点集合L={l1,l2,…,ln}表示LBSN网络中所有兴趣点的集合;E代表共现图中的边,边的权重表示两个兴趣点共现的次数,例如:边(l1,w,l2)表示兴趣点l1和兴趣点l2共现次数为w,即共有w个用户同时访问过兴趣点l1和兴趣点l2。构建共现图的具体方法如下:
获取基于位置的社交网络LBSN中的每个用户在历史时间段T内访问过的所有兴趣点集合,由所有用户访问的兴趣点组成共现图的节点;T的取值根据实际需要确定,优选取值为半年。
其中,收集的用户访问的兴趣点信息包括:签到的用户信息,签到时间,签到地点,签到内容,签到地点的经纬度信息,数据收集的过程可以通过LBSN网络提供的API接口获得。
对于每一个用户,用户u在历史时间段T内访问过的所有兴趣点集合Lu中任意的两个元素对lui和luj,其中,ui≠uj,若在所述共现图中不存在lui和luj之间的无向边,则在所述共现图中利用一条无向边连接节点lui和luj,并将该边的权重赋值为1,若在所述共现图中存在lui和luj之间的无向边,则将节点lui和luj之间的无向边的权重值加1,即该边更新为(lui,w+1,luj)。
例如,如下表1所示是LBSN网络中用户的访问示例,图2是由表1的访问列表得到的共现图。图中节点l2和l3之间的边权重为2,其表示共有2个用户同时访问过l2和l3。节点l1和l2之间的边权重为1,其表示只有1个用户同时访问过节点l1和l2。共现图中边的权重是由所有用户的决策所形成的。因为集体的智慧具有更高的可信度,所以我们可以认为相对于节点l1和l2,节点l2和l3之间具有更强的关联性,因而未来更可能被用户同时访问。
表1
用户 访问兴趣点的列表
u<sub>1</sub> [l<sub>1</sub>,l<sub>2</sub>,l<sub>3</sub>]
u<sub>2</sub> [l<sub>2</sub>,l<sub>3</sub>,l<sub>4</sub>]
u<sub>3</sub> [l<sub>3</sub>,l<sub>4</sub>,l<sub>5</sub>]
其中,步骤S1具体包括以下子步骤:
S1.1、由
Figure BDA0001292936690000081
得到所述共现图中任意节点li和lj之间的共现概率,其中,w(li,lj)表示所述共现图中节点li和lj之间直接相连的无向边的权重,W为所述共现图中所有边的权重和,在此其作为归一化因子;
其中,共现概率定义了两个兴趣点之间的相关性。当共同访问li和lj的用户数越多,即w(li,lj)的值越大,此时节点li和lj之间的共现概率越大。当节点li和lj之间无直接边相连时,两节点之间的共现概率为0,即:
Figure BDA0001292936690000082
S1.2、由
Figure BDA0001292936690000091
得到所述共现图中节点li相对于节点lj之间的一阶相似性;
其中,p(li,lj)为步骤S1.1得到的节点li和lj之间的共现概率,同样的当节点li和lj之间无直接的边相连时,节点li和lj之间的一阶相似性为0。一阶相似性即条件概率p(li|lj),定义了已知节点lj的条件下,得到节点li的概率。值得注意的是:条件概率是非对称的,即p(li|lj)一般不等于p(lj|li)。相似性间的不对称主要由节点的流行度和位置因素所造成的。
一阶相似性度量了共现图中两个兴趣点的直接相似性。但是共现图中的数据仅是已观察到的,众多节点之间的直接联系并未真正展现出来。因此,我们可以认为在共现图中的边仅是冰山一角,仍有节点之间的关系还未被用户发掘出来。为了更好的捕捉节点之间未知的关系,下面定义节点之间的二阶相似性用以捕捉潜在的关系。
共现图中的节点对li和lj的二阶相似性定义为节点li和lj的邻居结构的相似性。数学上,定义Nbl=(l1,l2,l3,....)为节点l的邻居节点,则节点对li和lj之间的二阶相似性即为
Figure BDA0001292936690000092
Figure BDA0001292936690000093
之间的相似性。如果节点li和lj之间没有相同的直接邻居,则节点li和lj之间的二阶相似性为0。
当网络中两个节点li和lj之间共享的邻居占比越大,两个节点相似的可信度越大。因此可以理解为从节点lj出发到达节点li的概率越大。因此采用步骤S1.3计算节点间的二阶相似性。
S1.3、由
Figure BDA0001292936690000094
得到所述共现图中节点li相对于节点lj之间的二阶相似性,其中,lk为与节点lj直接相连的邻居节点。
S2、根据用户u访问的历史位置集合Lu,由
Figure BDA0001292936690000095
得到用户u访问位置l所处区域的概率,其中,lui∈Lu
Figure BDA0001292936690000101
n表示集合Lu的大小,σ表示最大化似然函数的带宽,l属于LBSN中所有用户已访问的兴趣点,但不属于Lu中的兴趣点;
已有分析指出用户访问的兴趣点在地理(geographical)位置上呈聚簇分布,因此地理位置因素对于用户的签到行为有着巨大的影响。该步骤使用核密度的方式对影响用户签到的地理位置因素进行建模。给定用户已访问的位置集合Lu,Lu的大小为n,即用户历史访问过n个位置。则对于一个未被访问的地点l,u访问l的概率可由步骤S2计算得到。
其中,其中带宽σ的值由数据驱动的方法得到,即使用交叉验证的方式选择最大化似然函数Y的带宽σ。
Figure BDA0001292936690000102
其中位置lv为验证集中用户访问的位置,其中,可以通过将原始所有签到数据随机划分出十分之一的数据作为验证集。函数fgeo表示的是用户u访问位置l所处区域的概率。
S3、由任意两个节点间的相似性得到各待推荐的候选节点与Lu间的相似性,由概率fgeo(l|u)得到用户访问各待推荐的候选节点所处区域的概率,结合两者对用户u进行兴趣点推荐,其中,待推荐的候选节点属于与Lu中各节点直接相连的一阶邻居节点以及与Lu中各节点间接相连但有共同一阶邻居节点的二阶邻居节点。
用户兴趣点推荐的目标是推荐给用户可能会喜欢,但未被用户访问过的兴趣点。用户兴趣点推荐的具体执行过程为:
S3.1、由
Figure BDA0001292936690000103
获取用户对各候选节点ln的喜爱程度,其中,候选节点ln是所述共现图中与Lu中各节点直接相连的一阶邻居节点或间接相连但具有共同一阶邻居节点的二阶邻居节点,p(ln|lm)表示节点ln相对于节点lm之间的一阶相似性,p'(ln|lm)表示节点ln相对于节点lm之间的二阶相似性;
S3.2、对所有候选节点ln,计算用户访问各候选节点ln所处区域的概率fgeo(ln|u);
其中,fgeo是基于用户的行为习惯得到的用户访问该区域的概率。
S3.3、由s(u,ln)=fgeo(ln|u)*fpre(ln|u)得到用户u访问各候选节点ln的总评分,将评分最高的前k个兴趣点推荐给用户u,其中,k为正整数。
下面以表1的用户访问数据为例对本发明中的推荐方法进行说明。
对所有用户所访问的兴趣点列表进行遍历,对于单个用户访问的兴趣点列表中的任意两个兴趣点的组合,在共现图中以无向边的方式进行连接。
例如用户u1的访问列表为L=[l1,l2,l3],则对L中任意两个兴趣点的组合即[(l1,l2),(l3,l1),(l2,l3)]在共现图中以无向边进行连接。对于用户u2和用户u3执行同样的操作,最后可以得到共现图如附图2所示。
图2中节点l2和l3之间的边权重为2,其表示共有2个用户同时访问过l2和l3。节点l1和l2之间的边权重为1,其表示只有1个用户同时访问过节点l1和l2。共现图中边的权重是由所有用户的决策所形成的。因为集体的智慧具有更高的可信度,所以我们可以认为相对于节点l1和l2,节点l2和l3之间具有更强的关联性,因而未来更可能被用户同时访问。
基于构建的共现图,可以计算得出所有节点之间的相似性。为了简明起见,表2给出了节点l1和节点l2与其他节点之间的一阶相似性和二阶相似性。其他节点之间的相似性可按照相同原理进行计算。
表2
节点对 一阶相似性 二阶相似性
(l<sub>1</sub>,l<sub>2</sub>) 1/2 0
(l<sub>1</sub>,l<sub>3</sub>) 1/2 0
(l<sub>1</sub>,l<sub>4</sub>) 0 7/24
(l<sub>1</sub>,l<sub>5</sub>) 0 1/12
(l<sub>2</sub>,l<sub>1</sub>) 1/4 0
(l<sub>2</sub>,l<sub>3</sub>) 1/2 0
(l<sub>2</sub>,l<sub>4</sub>) 1/4 0
(l<sub>2</sub>,l<sub>5</sub>) 0 7/48
计算共现图中节点之间的相似性后,利用核密度估计的方式估计某一兴趣点的访问概率。例如,对于用户u1而言,核密度方式估计兴趣点l4被访问的概率:
Figure BDA0001292936690000121
针对用户进行兴趣点推荐的过程结合了利用相似性搜寻候选节点的过程以及使用核密度估计兴趣点被访问的概率的过程。
针对用户u1而言,假设其已访问兴趣点为l1,l2和l3。针对用户u1已访问过的兴趣点l1,l2和l3邻近的兴趣点l4和l5,计算用户访问这些兴趣点的概率。假设用户访问的兴趣点集合为Lu,则兴趣点相似性搜索的过程只考虑在共现图中Lu中的节点通过一步和两步可达的节点。因此候选的兴趣点集合相对较小。这使得该推荐方法在大规模LBSN中具有较好的可伸缩性。同时,共现图中节点间边的权重是由用户的集体智慧决定的,因而模型更具健壮性。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于共现图的兴趣点推荐方法,其特征在于,包括:
S1、计算预先构建的共现图中任意两个节点间的相似性,所述相似性表示所述任意两个节点之间的相近程度,其中,所述共现图表示在基于位置的社交网络LBSN中所有用户已访问的兴趣点之间的共现关系,所述共现图中的节点表示所有用户已访问的兴趣点,所述共现图中的边的权重表示同时访问过该边对应的兴趣点对的用户数量;
S2、根据用户u访问的历史位置集合Lu,由
Figure FDA0001292936680000011
得到用户u访问位置l所处区域的概率,其中,lui∈Lu
Figure FDA0001292936680000012
n表示集合Lu的大小,σ表示最大化释然函数的带宽,l属于LBSN中所有用户已访问的兴趣点,但不属于Lu中的兴趣点;
S3、由所述任意两个节点间的相似性得到各待推荐的候选节点与Lu间的相似性,由所述概率fgeo(l|u)得到用户访问各待推荐的候选节点所处区域的概率,结合两者对用户u进行兴趣点推荐,其中,待推荐的候选节点属于与Lu中各节点直接相连的一阶邻居节点以及与Lu中各节点间接相连但有共同一阶邻居节点的二阶邻居节点。
2.根据权利要求1所述的方法,其特征在于,在步骤S1之前,所述方法还包括:
获取基于位置的社交网络LBSN中的每个用户在历史时间段T内访问过的所有兴趣点集合,由所有用户访问的兴趣点组成共现图的节点;
对于每一个用户,用户u在历史时间段T内访问过的所有兴趣点集合Lu中任意的两个元素对lui和luj,其中,ui≠uj,若在所述共现图中不存在lui和luj之间的无向边,则在所述共现图中利用一条无向边连接节点lui和luj,并将该边的权重赋值为1,若在所述共现图中存在lui和luj之间的无向边,则将节点lui和luj之间的无向边的权重值加1。
3.根据权利要求1所述的方法,其特征在于,步骤S1具体包括以下子步骤:
S1.1、由
Figure FDA0001292936680000021
得到所述共现图中任意节点li和lj之间的共现概率,其中,w(li,lj)表示所述共现图中节点li和lj之间直接相连的无向边的权重,W为所述共现图中所有边的权重和;
S1.2、由
Figure FDA0001292936680000022
得到所述共现图中节点li相对于节点lj的一阶相似性;
S1.3、由
Figure FDA0001292936680000023
得到所述共现图中节点li相对于节点lj的二阶相似性,其中,lk为与节点lj直接相连的邻居节点。
4.根据权利要求3所述的方法,其特征在于,步骤S3具体包括以下子步骤:
S3.1、由
Figure FDA0001292936680000024
获取用户对各候选节点ln的喜爱程度,其中,候选节点ln是所述共现图中与Lu中各节点直接相连的一阶邻居节点或间接相连但具有共同一阶邻居节点的二阶邻居节点,p(ln|lm)表示节点ln相对于节点lm之间的一阶相似性,p'(ln|lm)表示节点ln相对于节点lm之间的二阶相似性;
S3.2、对所有候选节点ln,计算用户访问各候选节点ln所处区域的概率fgeo(ln|u);
S3.3、由s(u,ln)=fgeo(ln|u)*fpre(ln|u)得到用户u访问各候选节点ln的总评分,将评分最高的前k个兴趣点推荐给用户u,其中,k为正整数。
5.一种基于共现图的兴趣点推荐系统,其特征在于,包括:
相似性计算模块,用于计算预先构建的共现图中任意两个节点间的相似性,所述相似性表示所述任意两个节点之间的相近程度,其中,所述共现图表示在基于位置的社交网络LBSN中所有用户已访问的兴趣点之间的共现关系,所述共现图中的节点表示所有用户已访问的兴趣点,所述共现图中的边的权重表示同时访问过该边对应的兴趣点对的用户数量;
访问概率计算模块,用于根据用户u访问的历史位置集合Lu,由
Figure FDA0001292936680000031
得到用户u访问位置l所处区域的概率,其中,lui∈Lu
Figure FDA0001292936680000032
n表示集合Lu的大小,σ表示最大化似然函数的带宽,l属于LBSN中所有用户已访问的兴趣点,但不属于Lu中的兴趣点;
兴趣点推荐模块,用于由所述任意两个节点间的相似性得到各待推荐的候选节点与Lu间的相似性,由所述概率fgeo(l|u)得到用户访问各待推荐的候选节点所处区域的概率,结合两者对用户u进行兴趣点推荐,其中,待推荐的候选节点属于与Lu中各节点直接相连的一阶邻居节点以及与Lu中各节点间接相连但有共同一阶邻居节点的二阶邻居节点。
6.根据权利要求5所述的系统,其特征在于,所述系统还包括:
信息采集模块,用于获取基于位置的社交网络LBSN中的每个用户在历史时间段T内访问过的所有兴趣点集合,由所有用户访问的兴趣点组成共现图的节点;
共现图构建模块,用于对于每一个用户,用户u在历史时间段T内访问过的所有兴趣点集合Lu中任意的两个元素对lui和luj,其中,ui≠uj,若在所述共现图中不存在lui和luj之间的无向边,则在所述共现图中利用一条无向边连接节点lui和luj,并将该边的权重赋值为1,若在所述共现图中存在lui和luj之间的无向边,则将节点lui和luj之间的无向边的权重值加1。
7.根据权利要求5所述的系统,其特征在于,所述相似性计算模块包括:
共现概率计算模块,用于由
Figure FDA0001292936680000041
得到所述共现图中任意节点li和lj之间的共现概率,其中,w(li,lj)表示所述共现图中节点li和lj之间直接相连的无向边的权重,W为所述共现图中所有边的权重和;
一阶相似性计算模块,用于由
Figure FDA0001292936680000042
得到所述共现图中节点li相对于节点lj之间的一阶相似性;
二阶相似性计算模块,用于由
Figure FDA0001292936680000043
得到所述共现图中节点li相对于节点lj之间的二阶相似性,其中,lk为与节点lj直接相连的邻居节点。
8.根据权利要求7所述的系统,其特征在于,所述兴趣点推荐模块包括:
候选点喜爱程度计算模块,用于由
Figure FDA0001292936680000044
获取用户对各候选节点ln的喜爱程度,其中,候选节点ln是所述共现图中与Lu中各节点直接相连的一阶邻居节点或间接相连但具有共同一阶邻居节点的二阶邻居节点,p(ln|lm)表示节点ln相对于节点lm之间的一阶相似性,p'(ln|lm)表示节点ln相对于节点lm之间的二阶相似性;
候选点访问概率计算模块,用于对所有候选节点ln,计算用户访问各候选节点ln所处区域的概率fgeo(ln|u);
兴趣点推荐子模块,用于由s(u,ln)=fgeo(ln|u)*fpre(ln|u)得到用户u访问各候选节点ln的总评分,将评分最高的前k个兴趣点推荐给用户u,其中,k为正整数。
CN201710332672.6A 2017-05-12 2017-05-12 一种基于共现图的兴趣点推荐方法及系统 Active CN107220312B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710332672.6A CN107220312B (zh) 2017-05-12 2017-05-12 一种基于共现图的兴趣点推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710332672.6A CN107220312B (zh) 2017-05-12 2017-05-12 一种基于共现图的兴趣点推荐方法及系统

Publications (2)

Publication Number Publication Date
CN107220312A CN107220312A (zh) 2017-09-29
CN107220312B true CN107220312B (zh) 2020-08-14

Family

ID=59944067

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710332672.6A Active CN107220312B (zh) 2017-05-12 2017-05-12 一种基于共现图的兴趣点推荐方法及系统

Country Status (1)

Country Link
CN (1) CN107220312B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108376354A (zh) * 2018-01-10 2018-08-07 链家网(北京)科技有限公司 一种基于网络图结构的推荐方法及装置
CN108491425B (zh) * 2018-02-07 2020-10-27 中山大学 一种对长尾兴趣点进行扩展的模型构建方法
CN109284449B (zh) * 2018-10-23 2020-06-16 厦门大学 兴趣点的推荐方法和装置
CN109299377B (zh) * 2018-10-26 2020-11-13 东软集团股份有限公司 文章推荐方法、装置、可读存储介质及电子设备
CN110210905A (zh) * 2019-05-31 2019-09-06 拉扎斯网络科技(上海)有限公司 特征相似度计算方法、装置、电子设备及计算机存储介质
CN111666292B (zh) 2020-04-24 2023-05-26 百度在线网络技术(北京)有限公司 用于检索地理位置的相似度模型建立方法和装置
CN113486237B (zh) * 2021-06-07 2023-06-27 海南太美航空股份有限公司 一种航班信息的推荐方法、系统、存储介质和电子设备
CN117171452A (zh) * 2022-05-12 2023-12-05 中国人民解放军国防科技大学 确定时空共现区、非公共场所及用户社会行为关系的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542489A (zh) * 2011-12-27 2012-07-04 纽海信息技术(上海)有限公司 一种基于用户兴趣关联的推荐方法
CN103399883A (zh) * 2013-07-19 2013-11-20 百度在线网络技术(北京)有限公司 根据用户兴趣点/关注点进行个性化推荐的方法和系统
CN105045858A (zh) * 2015-07-10 2015-11-11 湖南科技大学 基于投票的出租车载客点推荐方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102594905B (zh) * 2012-03-07 2014-07-16 南京邮电大学 一种基于场景的社交网络位置兴趣点推荐方法
US9282161B1 (en) * 2012-10-26 2016-03-08 Amazon Technologies, Inc. Points of interest recommendations
CN104731962B (zh) * 2015-04-03 2018-10-12 重庆邮电大学 一种社交网络中基于相似社团的好友推荐方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542489A (zh) * 2011-12-27 2012-07-04 纽海信息技术(上海)有限公司 一种基于用户兴趣关联的推荐方法
CN103399883A (zh) * 2013-07-19 2013-11-20 百度在线网络技术(北京)有限公司 根据用户兴趣点/关注点进行个性化推荐的方法和系统
CN105045858A (zh) * 2015-07-10 2015-11-11 湖南科技大学 基于投票的出租车载客点推荐方法

Also Published As

Publication number Publication date
CN107220312A (zh) 2017-09-29

Similar Documents

Publication Publication Date Title
CN107220312B (zh) 一种基于共现图的兴趣点推荐方法及系统
Wang et al. Trust-enhanced collaborative filtering for personalized point of interests recommendation
Wu et al. Spatial and social media data analytics of housing prices in Shenzhen, China
Gao et al. A personalized point-of-interest recommendation model via fusion of geo-social information
Ying et al. Mining user check-in behavior with a random walk for urban point-of-interest recommendations
Yang et al. Modeling user activity preference by leveraging user spatial temporal characteristics in LBSNs
Campana et al. Recommender systems for online and mobile social networks: A survey
CN108804551B (zh) 一种兼顾多样性与个性化的空间兴趣点推荐方法
Ying et al. A temporal-aware POI recommendation system using context-aware tensor decomposition and weighted HITS
CN110119475B (zh) 一种poi推荐方法及推荐系统
Xing et al. Points-of-interest recommendation based on convolution matrix factorization
Chen et al. Effective and efficient user account linkage across location based social networks
CN106960044B (zh) 一种基于张量分解及加权hits的时间感知个性化poi推荐方法
CN107341261B (zh) 一种面向位置社交网络的兴趣点推荐方法
McKitrick et al. Collecting, analyzing, and visualizing location-based social media data: review of methods in GIS-social media analysis
CN107145541B (zh) 基于超图结构的社交网络推荐模型构建方法
Gu et al. Context aware matrix factorization for event recommendation in event-based social networks
Zhu et al. Exploiting viral marketing for location promotion in location-based social networks
Shafik et al. Recommendation system comparative analysis: internet of things aided networks
US20170236226A1 (en) Computerized systems, processes, and user interfaces for globalized score for a set of real-estate assets
Zhang et al. Unveiling transit mobility structure towards sustainable cities: An integrated graph embedding approach
Terroso-Sáenz et al. Human mobility prediction based on social media with complex event processing
Zhang et al. Who are my familiar strangers? Revealing hidden friend relations and common interests from smart card data
Vahidnia Point-of-interest recommendation in location-based social networks based on collaborative filtering and spatial kernel weighting
Huang et al. On interesting place finding in social sensing: An emerging smart city application paradigm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant