CN107133262A - 一种基于多影响嵌入的个性化poi推荐方法 - Google Patents

一种基于多影响嵌入的个性化poi推荐方法 Download PDF

Info

Publication number
CN107133262A
CN107133262A CN201710203640.6A CN201710203640A CN107133262A CN 107133262 A CN107133262 A CN 107133262A CN 201710203640 A CN201710203640 A CN 201710203640A CN 107133262 A CN107133262 A CN 107133262A
Authority
CN
China
Prior art keywords
mrow
msub
poi
user
check
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710203640.6A
Other languages
English (en)
Other versions
CN107133262B (zh
Inventor
陈岭
应鸳凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201710203640.6A priority Critical patent/CN107133262B/zh
Publication of CN107133262A publication Critical patent/CN107133262A/zh
Application granted granted Critical
Publication of CN107133262B publication Critical patent/CN107133262B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于多影响嵌入的个性化POI推荐方法,通过对7张二分图(用户‑用户图、用户‑时间段图、POI‑时间段图、POI‑区域层次图、POI‑类别层次图、用户‑性别图以及用户‑POI图)和check‑in序列进行联合嵌入学习,整合了社交、时间、地理、语义、用户性别、用户偏好以及序列方面影响,同时具有一定的扩展性,可以方便地整合其它方面影响,从而有效解决数据稀疏性与冷启动问题,为用户提供高质量的POI推荐。

Description

一种基于多影响嵌入的个性化POI推荐方法
技术领域
本发明涉及POI推荐领域,尤其涉及一种基于多影响嵌入的个性化POI推荐方法。
背景技术
随着装备GPS智能设备的快速发展,产生了基于位置的社交网络服务(Location-based Social Networking Services,LBSNs),如Foursquare、Facebook Places、GooglePlaces等。在LBSNs上,用户可以登录(check-in)商店、餐厅等POI(Point of Interest)并分享。由于LBSNs用户众多并能覆盖广大的区域,在其基础上出现了POI推荐服务,不仅可以帮助用户认识新的POI和探索不熟悉的区域,而且可以方便广告主向目标用户推送移动广告。
然而,通过用户的位置历史来推断用户对POI的偏好具有很大的挑战。第一,一个用户能够访问的POI是有限的,而城市中有数量庞大的POI,对于传统的基于协同过滤(Collaborative Filtering,CF)的推荐方法,用户-POI矩阵过于稀疏。第二,当用户访问新的区域时,用户旅行局部性现象(Travel Locality)使POI推荐更具挑战。此外,当增加一个新用户时,其有限的位置历史为用户偏好建模增加了难度,从而很难为其提供准确的推荐服务,称为冷启动问题。为了解决上述数据稀疏性及冷启动问题,传统的个性化POI推荐方法往往利用社交、时间、地理、序列、语义等方面的影响。
1)社交影响(Social Effect):用户的位置历史与其朋友的位置历史平均重合约10%,说明社交影响可能仅仅起到有限的作用,但仍不能忽略其影响。
2)时间影响(Temporal Effect):现实生活中,用户的check-in行为表现出很强的时间周期性、非统一性和连续性。
3)地理影响(Geographical Effect):当用户访问一个新的区域或者城市时,他的偏好或行为模式会与在家附近时不同,该问题称为兴趣漂移(Interest Drift)。比如,当一位来自杭州的越剧爱好者访问香港时,他很大可能会去光顾香港的购物中心或者特色餐厅,而不是遵循其在杭州时的行为模式。
4)序列影响(Sequential Effect):人类流动性研究表明,人们的移动展现较强的序列模式。比如,用户出机场后很大概率会接着访问旅馆。
5)语义影响(Semantic Effect):最近的一项针对Whrrl数据集的分析表明用户的check-in行为展现出很强的语义规律。换句话说,同一个用户check-in过的POI内容往往在语义上是相似的。然而,一般的个性化POI推荐方法仅利用了上述部分影响,没有一个能准确整合上述所有方面影响的方法。
发明内容
为解决当前个性化POI推荐的数据稀疏性及冷启动问题,本发明提出了一种基于多影响嵌入的个性化POI推荐方法。
一种基于多影响嵌入的个性化POI推荐方法,包括三个阶段:
第一阶段:构建用户-用户图、用户-性别图、POI-类别层次图、POI-区域层次图、用户-时间段图、POI-时间段图以及用户-POI图7个二分图;构建check-in序列;
第二阶段:根据构建的7个二分图建立图嵌入模型,根据check-in序列建立序列嵌入模型,并对两个模型进行联合嵌入学习,得到用户、POI、时间段、性别、POI类别以及区域的嵌入表示;
第三阶段:根据第二阶段获得的嵌入表示、用户信息以及用户查询信息对POI进行打分,并根据POI分数对POI降序排序,取前f个POI作为推荐结果提供给用户。
第一阶段的具体过程为:
(1-1)根据输入的用户社交信息提取用户的朋友关系,构建用户-用户图;
(1-2)根据输入的户信息数据提取用户的性别特征,构建用户-性别图;
(1-3)读取输入的POI信息的类别标签,并根据输入的POI类别层次结构,构建POI-类别层次图;
(1-4)首先利用空间金字塔的树状结构对整个空间区域进行划分和索引,然后根据空间金字塔构建POI-区域层次图;
(1-5)首先读取用户check-in历史数据,然后从用户check-in历史数据中提取每个用户在各时间段内check-in的频次,构建用户-时间段图;
(1-6)从用户check-in历史数据中提取每个POI在各时间段内被访问的频次,构建POI-时间段图;
(1-7)从用户check-in历史数据中提取每个用户对各个POI的访问频次,构建用户-POI图;
(1-8)给定一个时间间隔,当用户的当前check-in与上一次check-in的时间差不大于该时间间隔时,将当前check-in并入当前check-in序列,从而构建所有用户的check-in序列。
所述的一个POI定义为一个特殊场所(例如:一家饭店、一家剧院等,POI具有三个属性:ID、地理坐标(经纬度)以及POI内容;所述的POI内容为与POI相关的文本语义信息,如类别标签。
步骤(1-4)中,本发明预先将空间区域按层次划分形成空间金字塔,作为优先,与POI相连的区域为空间金字塔最底层的区域。
第二阶段的具体过程为:
(2-1)根据第一阶段建立的每个二分图,利用图嵌入方法LINE构建图嵌入模型;
(2-2)根据第一阶段建立的check-in序列,利用序列嵌入方法skip-gram构建序列嵌入模型;
(2-3)根据构建的图嵌入模型和序列嵌入模型,进行图和序列联合嵌入式学习,得到用户、POI、时间段、性别、POI类别以及区域的嵌入表示。
步骤(2-1)中,针对每个二分图构建与其对应的图嵌入式模型,模型的目标函数为:
其中,XA和XB表示两种类型的节点集,ε表示边集;xi为节点集XA中的第i个节点,xj为节点集XB中的第j个节点,eij属于边集ε,表示节点xi与节点xj之间的边,wij为边eij的边权,p(xj|xi)为节点xi产生节点xj的条件概率。
为解决计算成本高的问题,对目标函数进行求解的过程中,采用负采样方法,根据每条边的噪音分布采几条负边进行求解,每条边的目标函数为:
其中σ(·)为sigmoid函数;k为负边的采样数量;m用于计数,取值范围为1~k;为节点xj的向量表示,为节点xi的向量表示;表示根据噪音分布Pn(x)∝dx 3/4采样得到的负样本的期望值;目标函数的第一项对可观测的边进行建模,第二项对根据噪音分布采样得到的负边进行建模。
在步骤(2-2)中,本发明通过skip-gram整合check-in序列影响,将每个POIvi当成“词”,用户check-in序列当成一个“句子”,所有用户的check-in序列构成一个“文档”,然后从check-in序列中学习POI的嵌入表示,check-in序列的目标函数为:
其中,K为上下文窗口大小;k为负采样数目;为第i个POI,vj为第j个POI,为POIvj的向量表示;分别为POIvi及其上下文POIvc的向量表示,表示根据噪音分布Pn(v)∝dv 3/4采样得到的负样本的期望值。
在步骤(2-3)中,联合嵌入学习的目标函数为:
O=Ouu+Oug+Ouv+Out+Ovw+Ovr+Ovt+Oseq
其中,Ouu为用户-用户图嵌入的目标函数,Oug为用户-性别图嵌入的目标函数,Ouv为用户-POI图嵌入的目标函数,Out为用户-时间段图嵌入的目标函数,Ovw为POI-类别层次图嵌入的目标函数,Ovr为POI-区域层次图嵌入的目标函数,Ovt为POI-时间段图嵌入的目标函数,Oseq为check-in序列嵌入的目标函数;
在每轮的训练过程中,首先根据各结构采样概率选择一个二分图或check-in序列集合,如果选择的是二分图,则从其边集中采一条边和k条负边,然后更新相应对象的嵌入表示,如果选择的是check-in序列,则从其POI集中选择一个POI及其上下文POI和k个负样本,然后更新相应POI的嵌入表示,直到实际采样总数超过采样总数N为止。
第三阶段的具体过程为:
(3-1)将给定查询的时间和位置映射为时间段和区域;
(3-2)根据第二阶段获得的嵌入表示对POI进行打分,并根据POI分数对POI降序排序,取前f个POI作为推荐结果提供给用户;POI分数的计算公式为:
其中,其中为用户u的嵌入表示,为查询时间τ所在时间段t的嵌入表示,为查询位置l所在区域r的嵌入表示,为用户性别的嵌入表示,为POI的嵌入式表示。
本发明通过图和序列的联合嵌入学习方法整合社交、时间、地理、语义、序列等多方面影响,克服数据稀疏性和冷启动问题,为用户提供高质量的个性化POI推荐。本发明的优点包括:
1)整合社交、时间、地理、序列、语义等多方面影响进行个性化POI推荐,解决数据稀疏性问题;
2)采用联合嵌入的框架,具有一定的扩展性,可以方便地整合其它方面影响,解决了冷启动问题。
3)通过区域嵌入表示过滤出本地特色场所,解决用户在不同区域旅行产生的兴趣漂移问题。
附图说明
图1是本发明基于多影响嵌入个性化POI推荐方法流程图;
图2是实施例中POI-类别层次图;
图3是将空间区域分成空间金字塔示意图;
图4是实施例中POI-区域层次图;
图5是实施例中check-in序列嵌入模型示意图;
图6是实施例中联合学习算法流程图;
图7是实施例中输出结果的嵌入表示。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
如图1所示的是本发明基于多影响嵌入的个性化POI推荐方法的流程图,根据图1可知,本发明基于多影响嵌入的个性化POI推荐方法主要包括三个阶段,分别为:二分图与check-in序列构建、图与序列联合嵌入学习以及POI打分与推荐。
第一阶段:二分图与check-in序列的构建
该阶段主要是构建7张二分图和check-in序列,7张二分图分别为:用户-用户图、用户-性别图、POI-类别层次图、POI-区域层次图、用户-时间段图、POI-时间段图以及用户-POI图,构建方法具体为:
S101,用户-用户图的构建:
根据输入的用户社交信息提取用户的朋友关系,进而构建用户-用户图,该用户-用户图定义为表示用户间的社交关系,其中,表示用户集合,且εuu表示用户与用户之间的边集;若用户ui和用户uj间是朋友关系,则用户ui和用户uj间有一条边eij,且此时边权wij=1;否则用户ui和用户uj间没有边eij
S102,用户-性别图的构建:
根据输入的户信息数据提取用户的性别特征,进而构建用户-性别图,该用户-性别图定义为其中,表示性别类型(男、女)集合,且εug表示用户和性别之间的边集;若用户ui的性别为gj,则用户ui和性别gj间存在一条边eij,且此时,边权wij=1;否则用户ui和性别gj间没有边eij
S103,POI-类别层次图的构建:
首先,读取输入的POI信息和POI类别层次结构数据;
一个POI定义为一个特殊场所(例如:一家饭店、一家剧院等)。POI具有三个属性:ID、地理坐标以及内容。本实施例用v和lv分别表示一个POI的ID及其地理坐标(经纬度),此外,每个POI都有与其相关的文本语义信息,如类别标签。POI类别层次结构是对各种POI由大到小、粗粒度到细粒度的总结与分类,是后续构建POI-类别层次图的基础。
然后,基于POI类别层次结构,根据每个POI的类别标签,构建POI-类别层次图;
如图2所示,POI-类别层次图定义为其中,表示POI集合,表示POI类别集合,εvw表示POI与POI类别之间的边集,εww表示POI类别与POI类别之间的边集。需要注意的是数据集中存在POI类别体系(树状结构),图中与POI相连的是POI类别体系中最底层的类别。
则POIvi和POI类别wj间存在一条边eij,否则POIvi和POI类别wj间不存在边eij
若POI类别wi属于类别wj,则POI类别wi和POI类别wj间存在一条边eij,否则没有,POI类别wi和POI类别wj间不存在边eij
当边eij存在时,边权wij=1。
S104,POI-区域层次图的构建:
首先,利用空间金字塔的树状结构对整个空间区域进行划分和索引;如图3所示,空间金字塔将空间区域分解为H层,其中第一层仅含一个表示整个空间的格子区域,第h层将整个空间分为4h-1个格子区域。因此,整个空间区域可以递归地分成不同粒度的层,其中最底层粒度最小且格子区域最多。
然后,根据空间金子塔,构建POI-区域层次图;如图4所示,POI-区域层次图是一个二分图,定义为其中,表示区域集合,εvr表示POI与区域之间的边集,εrr表示区域与区域之间的边集。需要注意的是本实施例事先将空间区域按层次划分形成空间金字塔,图4中与POI相连的区域为空间金字塔最底层的区域。
若POIvi位于区域rj内,则POIvi和区域rj间存在一条边eij,否则,POIvi和区域rj间不存在边eij
若区域ri处在区域rj内,则区域ri和区域rj间存在一条边eij,否则区域ri和区域rj间不存在边eij
当边eij存在时,边权wij=1。
S105,用户-时间段图的构建:
首先,读取输入的用户check-in历史数据;
用一个六元组来表示一个check-in行为,即:性别为g的用户u在时间t访问了场所v,其中,为场所v的内容。对于每个用户u建立了其位置历史其中,包含与用户u相关的并以时间戳升序排列的check-in行为,本实施例中的数据集包括所有用户位置历史,即
然后,从用户check-in历史数据中提取每个用户在各时间段内check-in的频次,构建用户-时间段图;
用户-时间段图定义为其中,表示时间段集合,εut是用户与时间段间的边集。用户ui和时间段tj间的边权wij定义为用户ui在时间段tj内check-in的频数。
S106,POI-时间段图的构建:
从用户check-in历史数据中提取每个POI在各时间段内被访问的频次,构建POI-时间段图;POI-时间段图是一个二分图,定义为 其中,εvt是POI与时间段间的边集。POIvi和时间段tj间的边权wij为POIvi在时间段tj内被访问的频数。
S107,用户-POI图的构建:
从用户check-in历史数据中提取每个用户对各个POI的访问频次,构建用户-POI图;用户-POI图是一个二分图,定义为其中,εuv是用户和POI间的边集,用户ui和POIvi间的边权wij定义为用户ui访问POIvi的频数。
S108,check-in序列的构建:
给定一个时间间隔,当用户的连续两次check-in时间差不大于该时间间隔时,将其并入当前check-in序列,从而构建所有用户的check-in序列。
确定一个时间间隔ΔT,如果在用户的位置历史中存在一段序列其中则认为该序列为用户的第n段check-in序列。本实施例中的check-in序列集包括所有用户的所有check-in序列,即其中Su表用户u位置历史中所有check-in序列的集合。
第二阶段:图与序列联合嵌入学习
S201,利用图嵌入方法LINE构建图嵌入模型:
针对第一阶段构建的每个二分图其中,XA和XB表示两种类型的节点集,ε表示边集;定义XA中节点xi产生XB中节点xj的条件概率为:
其中是XA中节点xi的嵌入表示,是XB中节点xj的嵌入表示,则p(·|xi)为节点xi到XB中所有节点的条件概率。使条件概率分布p(·|xi)与其经验分布保持相近,其中degi=∑jwij,其目标函数为等式(2),其中,d(·,·)为两个分布的KL-散度,λi表示节点xi的重要程度,本发明提出方法中令λi=degi。因此得到等式(3),通过最小化等式(3)学习得到不同类型节点在空间中的嵌入表示。
优化目标(3)时,计算条件概率p2(·|xi)需要将所有节点都加一遍,计算成本过高。为了解决该问题,本发明采用负采样方法,根据每条边(i,j)的噪音分布采几条负边。针对每条边,其目标函数为:
其中σ(x)=1/(1+exp(-x))为sigmoid函数;第一项对可观测的边进行建模,第二项对根据噪音分布采样得到的负边进行建模;k为负边的采样数量;Pn(x)∝dx 3/4为噪音分布,其中dx为节点x的出度。
S202,针对check-in序列,利用序列嵌入方法skip-gram构建序列嵌入模型:
本发明提出方法通过skip-gram整合check-in序列影响,将每个POIvi当成“词”,用户check-in序列当成一个“句子”,所有用户的check-in序列构成一个“文档”,然后从check-in序列中学习POI的嵌入表示。如图5所示,skip-gram模型根据序列中的当前POIvi推断其上下文POIvi-K到vi+K。其目标函数为最大化平均log概率:
其中,K为上下文窗口大小,p(vi+c|vi)为softmax函数;分别为POIvi及其上下文POIvc的向量表示。
为了提高word2vec模型的学习效率,主要有两种加速策略,即层次softmax和负采样。本发明选择了与LINE模型优化方法一致的负采样方法,即最大化上下文POI的出现log概率同时最小化负样本的出现log概率,从而一个易于优化的新目标函数定义如下:
其中σ(x)=1/(1+exp(-x)),可以确保k为负采样数目;表示根据噪音分布Pn(v)∝dv 3/4采样得到的负样本的期望值。
S203,根据构建的图嵌入模型和序列嵌入模型,进行图和序列联合嵌入式学习,得到用户、POI、时间段、性别、POI类别、区域的嵌入表示;
首先,输入二分图、check-in序列以及其它相关参数;输入本实施例构建的7张二分图:用户-用户图、用户-时间段图、POI-时间段图、POI-区域层次图、POI-类别层次图、用户-性别图和用户-POI图,以及check-in序列集合。此外,采样总数N、负采样数k、嵌入表示维度d以及各部分的采样概率为提前定义的一些模型参数。
然后,通过联合训练算法学习用户、POI等的嵌入表示;
针对上述7张二分图与check-in序列,本实施例提出通过联合嵌入学习对上述图和序列进行联合嵌入学习,即最小化所有目标函数的和:
O=Ouu+Oug+Ouv+Out+Ovw+Ovr+Ovt+Oseq (8)
对于目标函数(8),其联合训练算法流程如图6,在每轮训练前以一定采样概率先从上述各图与序列集合中选择一个结构(一个图或序列集合)进行采样,如果选择了其中一个图,则对其进行边采样,否则对check-in序列进行POI采样。在每轮的训练过程中,首先根据各结构采样概率选择一个结构,如果选择的是图,则从其边集中采一条边和k条负边,然后更新相应对象的嵌入表示,如果选择的是序列,则从其POI集中选择一个POI及其上下文POI和k个负样本,然后更新相应POI的嵌入表示,直到实际采样总数超过采样总数N为止。
最后,输出用户、POI、时间段、性别、POI类别、区域的嵌入表示。如图7所示,输出结果为用户、POI、性别、时间段、POI类别和区域的d-维嵌入表示。
第三阶段:POI打分与推荐
S301,给定一个查询,将给定查询的时间和位置映射为时间段和区域;
对于带有查询时间τ和位置l且性别为g的查询用户u,即q=(u,τ,l,g),本发明将时间τ和位置l映射为时间段t和区域r。
步骤2:基于用户、POI等嵌入表示为POI打分,并选择分数最大的若干项作为推荐;
一旦得到用户、POI、区域、时间以及性别的嵌入表示,通过等式(17)计算区域r内用户u以前没有访问过的POI分数,最后根据POI分数对这些POI进行降序排序,选择前f个POI作为推荐结果。
其中为用户的嵌入表示,为查询时间τ所在时间段t的嵌入表示,为查询位置l所在区域r的嵌入表示,为用户性别的嵌入表示。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于多影响嵌入的个性化POI推荐方法,包括三个阶段:
第一阶段:构建用户-用户图、用户-性别图、POI-类别层次图、POI-区域层次图、用户-时间段图、POI-时间段图以及用户-POI图7个二分图;构建check-in序列;
第二阶段:根据构建的7个二分图建立图嵌入模型,根据check-in序列建立序列嵌入模型,并对两个模型进行联合嵌入学习,得到用户、POI、时间段、性别、POI类别以及区域的嵌入表示;
第三阶段:根据第二阶段获得的嵌入表示、用户信息以及用户查询信息对POI进行打分,并根据POI分数对POI降序排序,取前f个POI作为推荐结果提供给用户。
2.如权利要求1所述的基于多影响嵌入的个性化POI推荐方法,其特征在于,所述第一阶段的具体过程为:
(1-1)根据输入的用户社交信息提取用户的朋友关系,构建用户-用户图;
(1-2)根据输入的户信息数据提取用户的性别特征,构建用户-性别图;
(1-3)读取输入的POI信息的类别标签,并根据输入的POI类别层次结构,构建POI-类别层次图;
(1-4)首先利用空间金字塔的树状结构对整个空间区域进行划分和索引,然后根据空间金字塔构建POI-区域层次图;
(1-5)首先读取用户check-in历史数据,然后从用户check-in历史数据中提取每个用户在各时间段内check-in的频次,构建用户-时间段图;
(1-6)从用户check-in历史数据中提取每个POI在各时间段内被访问的频次,构建POI-时间段图;
(1-7)从用户check-in历史数据中提取每个用户对各个POI的访问频次,构建用户-POI图;
(1-8)给定一个时间间隔,当用户的当前check-in与上一次check-in的时间差不大于该时间间隔时,将当前check-in并入当前check-in序列,从而构建所有用户的check-in序列。
3.如权利要求2所述的基于多影响嵌入的个性化POI推荐方法,其特征在于,所述POI定义为一个特殊场所,且POI具有三个属性:ID、地理坐标以及类别标签。
4.如权利要求1所述的基于多影响嵌入的个性化POI推荐方法,其特征在于,所述第二阶段的具体过程为:
(2-1)根据第一阶段建立的每个二分图,利用图嵌入方法LINE构建图嵌入模型;
(2-2)根据第一阶段建立的check-in序列,利用序列嵌入方法skip-gram构建序列嵌入模型;
(2-3)根据构建的图嵌入模型和序列嵌入模型,进行图和序列联合嵌入式学习,得到用户、POI、时间段、性别、POI类别以及区域的嵌入表示。
5.如权利要求4所述的基于多影响嵌入的个性化POI推荐方法,其特征在于,步骤(2-1)中,针对每个二分图构建与其对应的图嵌入式模型,模型的目标函数为:
<mrow> <msub> <mi>O</mi> <mrow> <msub> <mi>X</mi> <mi>A</mi> </msub> <msub> <mi>X</mi> <mi>B</mi> </msub> </mrow> </msub> <mo>=</mo> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>e</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;Element;</mo> <mi>&amp;epsiv;</mi> </mrow> </munder> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>
其中,XA和XB表示两种类型的节点集,ε表示边集;xi为节点集XA中的第i个节点,xj为节点集XB中的第j个节点,eij属于边集ε,表示节点xi与节点xj之间的边,wij为边eij的边权,p(xj|xi)为节点xi产生节点xj的条件概率。
6.如权利要求5所述的基于多影响嵌入的个性化POI推荐方法,其特征在于,对目标函数进行求解的过程中,采用负采样方法,根据每条边的噪音分布采几条负边进行求解,每条边的目标函数为:
其中σ(·)为sigmoid函数;k为负边的采样数量;m用于计数,取值范围为1~k;为节点xj的向量表示,为节点xi的向量表示;表示根据噪音分布Pn(x)∝dx 3/4采样得到的负样本的期望值;目标函数的第一项对可观测的边进行建模,第二项对根据噪音分布采样得到的负边进行建模。
7.如权利要求5所述的基于多影响嵌入的个性化POI推荐方法,其特征在于,在步骤(2-2)中,通过skip-gram整合check-in序列影响,将每个POIvi当成“词”,用户check-in序列当成一个“句子”,所有用户的check-in序列构成一个“文档”,然后从check-in序列中学习POI的嵌入表示,check-in序列的目标函数为:
其中,K为上下文窗口大小;k为负采样数目;为第i个POI,vj为第j个POI,为POIvj的向量表示;分别为POIvi及其上下文POIvc的向量表示,表示根据噪音分布Pn(v)∝dv 3/4采样得到的负样本的期望值。
8.如权利要求7所述的基于多影响嵌入的个性化POI推荐方法,其特征在于,在步骤(2-3)中,联合嵌入学习的目标函数为:
O=Ouu+Oug+Ouv+Out+Ovw+Ovr+Ovt+Oseq
<mrow> <msub> <mi>O</mi> <mrow> <mi>u</mi> <mi>u</mi> </mrow> </msub> <mo>=</mo> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>e</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;Element;</mo> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>u</mi> <mi>u</mi> </mrow> </msub> </mrow> </munder> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>O</mi> <mrow> <mi>u</mi> <mi>g</mi> </mrow> </msub> <mo>=</mo> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>e</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;Element;</mo> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>u</mi> <mi>g</mi> </mrow> </msub> </mrow> </munder> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> 2
<mrow> <msub> <mi>O</mi> <mrow> <mi>u</mi> <mi>v</mi> </mrow> </msub> <mo>=</mo> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>e</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;Element;</mo> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>u</mi> <mi>v</mi> </mrow> </msub> </mrow> </munder> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>O</mi> <mrow> <mi>u</mi> <mi>t</mi> </mrow> </msub> <mo>=</mo> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>e</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;Element;</mo> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>u</mi> <mi>t</mi> </mrow> </msub> </mrow> </munder> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>O</mi> <mrow> <mi>v</mi> <mi>w</mi> </mrow> </msub> <mo>=</mo> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>e</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;Element;</mo> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>v</mi> <mi>w</mi> </mrow> </msub> <mo>&amp;cup;</mo> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>w</mi> <mi>w</mi> </mrow> </msub> </mrow> </munder> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>O</mi> <mrow> <mi>v</mi> <mi>r</mi> </mrow> </msub> <mo>=</mo> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>e</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;Element;</mo> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>v</mi> <mi>r</mi> </mrow> </msub> <mo>&amp;cup;</mo> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>r</mi> <mi>r</mi> </mrow> </msub> </mrow> </munder> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>O</mi> <mrow> <mi>v</mi> <mi>t</mi> </mrow> </msub> <mo>=</mo> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>e</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;Element;</mo> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>v</mi> <mi>t</mi> </mrow> </msub> </mrow> </munder> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>
其中,Ouu为用户-用户图嵌入的目标函数,Oug为用户-性别图嵌入的目标函数,Ouv为用户-POI图嵌入的目标函数,Out为用户-时间段图嵌入的目标函数,Ovw为POI-类别层次图嵌入的目标函数,Ovr为POI-区域层次图嵌入的目标函数,Ovt为POI-时间段图嵌入的目标函数,Oseq为check-in序列嵌入的目标函数;
在每轮的训练过程中,首先根据各结构采样概率选择一个二分图或check-in序列集合,如果选择的是二分图,则从其边集中采一条边和k条负边,然后更新相应对象的嵌入表示,如果选择的是check-in序列,则从其POI集中选择一个POI及其上下文POI和k个负样本,然后更新相应POI的嵌入表示,直到实际采样总数超过采样总数N为止。
9.如权利要求8所述的基于多影响嵌入的个性化POI推荐方法,其特征在于,所述第三阶段的具体过程为:
(3-1)将给定查询的时间和位置映射为时间段和区域;
(3-2)根据第二阶段获得的嵌入表示对POI进行打分,并根据POI分数对POI降序排序,取前f个POI作为推荐结果提供给用户;POI分数的计算公式为:
<mrow> <mi>S</mi> <mo>=</mo> <msup> <mover> <mi>u</mi> <mo>&amp;RightArrow;</mo> </mover> <mi>T</mi> </msup> <mo>&amp;CenterDot;</mo> <mover> <mi>v</mi> <mo>&amp;RightArrow;</mo> </mover> <mo>+</mo> <msup> <mover> <mi>t</mi> <mo>&amp;RightArrow;</mo> </mover> <mi>T</mi> </msup> <mo>&amp;CenterDot;</mo> <mover> <mi>v</mi> <mo>&amp;RightArrow;</mo> </mover> <mo>+</mo> <msup> <mover> <mi>r</mi> <mo>&amp;RightArrow;</mo> </mover> <mi>T</mi> </msup> <mo>&amp;CenterDot;</mo> <mover> <mi>v</mi> <mo>&amp;RightArrow;</mo> </mover> <mo>+</mo> <msup> <mover> <mi>g</mi> <mo>&amp;RightArrow;</mo> </mover> <mi>T</mi> </msup> <mo>&amp;CenterDot;</mo> <mover> <mi>v</mi> <mo>&amp;RightArrow;</mo> </mover> </mrow>
其中,其中为用户u的嵌入表示,为查询时间τ所在时间段t的嵌入表示,为查询位置l所在区域r的嵌入表示,为用户性别的嵌入表示,为POI的嵌入式表示。
CN201710203640.6A 2017-03-30 2017-03-30 一种基于多影响嵌入的个性化poi推荐方法 Expired - Fee Related CN107133262B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710203640.6A CN107133262B (zh) 2017-03-30 2017-03-30 一种基于多影响嵌入的个性化poi推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710203640.6A CN107133262B (zh) 2017-03-30 2017-03-30 一种基于多影响嵌入的个性化poi推荐方法

Publications (2)

Publication Number Publication Date
CN107133262A true CN107133262A (zh) 2017-09-05
CN107133262B CN107133262B (zh) 2019-09-06

Family

ID=59715867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710203640.6A Expired - Fee Related CN107133262B (zh) 2017-03-30 2017-03-30 一种基于多影响嵌入的个性化poi推荐方法

Country Status (1)

Country Link
CN (1) CN107133262B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944007A (zh) * 2018-02-06 2018-04-20 中山大学 一种结合情境信息的个性化餐厅推荐方法
CN107944489A (zh) * 2017-11-17 2018-04-20 清华大学 基于结构语义融合的大规模混合图特征学习方法
CN108074016A (zh) * 2017-12-25 2018-05-25 苏州大学 基于位置社交网络的用户关系强度预测方法、装置及设备
CN108876509A (zh) * 2018-05-11 2018-11-23 上海赢科信息技术有限公司 利用poi分析用户标签的方法及系统
CN109902708A (zh) * 2018-12-29 2019-06-18 华为技术有限公司 一种推荐模型训练方法及相关装置
CN109977309A (zh) * 2019-03-21 2019-07-05 杭州电子科技大学 基于多关键字和用户偏好的组合兴趣点查询方法
CN110119475A (zh) * 2019-01-29 2019-08-13 成都信息工程大学 一种poi推荐方法及推荐系统
CN110515986A (zh) * 2019-08-27 2019-11-29 腾讯科技(深圳)有限公司 一种社交网络图的处理方法、装置及存储介质
CN110929162A (zh) * 2019-12-04 2020-03-27 腾讯科技(深圳)有限公司 基于兴趣点的推荐方法、装置、计算机设备和存储介质
CN111104599A (zh) * 2019-12-23 2020-05-05 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN111125272A (zh) * 2018-10-31 2020-05-08 百度在线网络技术(北京)有限公司 一种区域特征获取方法、装置、计算机设备及介质
CN111177585A (zh) * 2018-11-13 2020-05-19 北京四维图新科技股份有限公司 地图poi反馈方法及装置
CN111460044A (zh) * 2019-01-21 2020-07-28 阿里巴巴集团控股有限公司 地理位置数据处理方法及装置
CN112650932A (zh) * 2021-01-04 2021-04-13 重庆邮电大学 一种融合社交和位置关系的神经协同过滤poi推荐方法
US20210356290A1 (en) * 2020-09-14 2021-11-18 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for recommending point of interest, device, and medium
US11775604B2 (en) 2020-04-24 2023-10-03 Naver Corporation Method of locating points of interest in a geographic area
US11836159B2 (en) 2019-10-11 2023-12-05 Visa International Service Association System, method, and computer program product for analyzing a relational database using embedding learning

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699818A (zh) * 2015-03-25 2015-06-10 武汉大学 一种多源异构的多属性poi融合方法
CN105740401A (zh) * 2016-01-28 2016-07-06 北京理工大学 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置
CN106056413A (zh) * 2016-06-06 2016-10-26 四川大学 基于时空偏好的兴趣点推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699818A (zh) * 2015-03-25 2015-06-10 武汉大学 一种多源异构的多属性poi融合方法
CN105740401A (zh) * 2016-01-28 2016-07-06 北京理工大学 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置
CN106056413A (zh) * 2016-06-06 2016-10-26 四川大学 基于时空偏好的兴趣点推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李伟: "基于情境的POI个性化推荐方法研究", 《武汉大学学报信息科学版》 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944489A (zh) * 2017-11-17 2018-04-20 清华大学 基于结构语义融合的大规模混合图特征学习方法
CN107944489B (zh) * 2017-11-17 2018-10-16 清华大学 基于结构语义融合的大规模混合图特征学习方法
CN108074016A (zh) * 2017-12-25 2018-05-25 苏州大学 基于位置社交网络的用户关系强度预测方法、装置及设备
CN108074016B (zh) * 2017-12-25 2021-07-30 苏州大学 基于位置社交网络的用户关系强度预测方法、装置及设备
CN107944007A (zh) * 2018-02-06 2018-04-20 中山大学 一种结合情境信息的个性化餐厅推荐方法
CN108876509A (zh) * 2018-05-11 2018-11-23 上海赢科信息技术有限公司 利用poi分析用户标签的方法及系统
CN111125272A (zh) * 2018-10-31 2020-05-08 百度在线网络技术(北京)有限公司 一种区域特征获取方法、装置、计算机设备及介质
CN111177585A (zh) * 2018-11-13 2020-05-19 北京四维图新科技股份有限公司 地图poi反馈方法及装置
CN109902708A (zh) * 2018-12-29 2019-06-18 华为技术有限公司 一种推荐模型训练方法及相关装置
CN111460044B (zh) * 2019-01-21 2023-06-30 阿里巴巴集团控股有限公司 地理位置数据处理方法及装置
CN111460044A (zh) * 2019-01-21 2020-07-28 阿里巴巴集团控股有限公司 地理位置数据处理方法及装置
CN110119475A (zh) * 2019-01-29 2019-08-13 成都信息工程大学 一种poi推荐方法及推荐系统
CN109977309A (zh) * 2019-03-21 2019-07-05 杭州电子科技大学 基于多关键字和用户偏好的组合兴趣点查询方法
CN109977309B (zh) * 2019-03-21 2021-05-04 杭州电子科技大学 基于多关键字和用户偏好的组合兴趣点查询方法
CN110515986B (zh) * 2019-08-27 2023-01-06 腾讯科技(深圳)有限公司 一种社交网络图的处理方法、装置及存储介质
CN110515986A (zh) * 2019-08-27 2019-11-29 腾讯科技(深圳)有限公司 一种社交网络图的处理方法、装置及存储介质
US11836159B2 (en) 2019-10-11 2023-12-05 Visa International Service Association System, method, and computer program product for analyzing a relational database using embedding learning
CN110929162A (zh) * 2019-12-04 2020-03-27 腾讯科技(深圳)有限公司 基于兴趣点的推荐方法、装置、计算机设备和存储介质
CN110929162B (zh) * 2019-12-04 2021-08-03 腾讯科技(深圳)有限公司 基于兴趣点的推荐方法、装置、计算机设备和存储介质
CN111104599A (zh) * 2019-12-23 2020-05-05 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN111104599B (zh) * 2019-12-23 2023-08-18 北京百度网讯科技有限公司 用于输出信息的方法和装置
US11775604B2 (en) 2020-04-24 2023-10-03 Naver Corporation Method of locating points of interest in a geographic area
US20210356290A1 (en) * 2020-09-14 2021-11-18 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for recommending point of interest, device, and medium
CN112650932A (zh) * 2021-01-04 2021-04-13 重庆邮电大学 一种融合社交和位置关系的神经协同过滤poi推荐方法
CN112650932B (zh) * 2021-01-04 2022-09-23 重庆邮电大学 一种融合社交和位置关系的神经协同过滤poi推荐方法

Also Published As

Publication number Publication date
CN107133262B (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN107133262B (zh) 一种基于多影响嵌入的个性化poi推荐方法
CN111428147B (zh) 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
Hu et al. A graph-based approach to detecting tourist movement patterns using social media data
CN109726336B (zh) 一种结合出行兴趣与社交偏好的poi推荐方法
CN109241454B (zh) 一种将社交网络和图像内容融合的兴趣点推荐方法
Zhao et al. Personalized recommendations of locally interesting venues to tourists via cross-region community matching
CN110119475B (zh) 一种poi推荐方法及推荐系统
Pham et al. A general model for out-of-town region recommendation
Ying et al. A temporal-aware POI recommendation system using context-aware tensor decomposition and weighted HITS
Xu et al. A dynamic topic model and matrix factorization-based travel recommendation method exploiting ubiquitous data
Jiao et al. A novel next new point-of-interest recommendation system based on simulated user travel decision-making process
CN109948066B (zh) 一种基于异构信息网络的兴趣点推荐方法
CN110457420A (zh) 兴趣点位置识别方法、装置、设备及存储介质
Chehreghan et al. A geometric-based approach for road matching on multi-scale datasets using a genetic algorithm
Chen et al. Next POI recommendation based on location interest mining with recurrent neural networks
CN116664719B (zh) 一种图像重绘模型训练方法、图像重绘方法及装置
Hable-Khandekar et al. Machine learning techniques for air quality forecasting and study on real-time air quality monitoring
Zhang et al. City2vec: Urban knowledge discovery based on population mobile network
CN107392392A (zh) 基于深度学习的微博转发预测方法
Setiowati et al. Context-based awareness in location recommendation system to enhance recommendation quality: A review
Tilahun et al. Prey predator algorithm for travelling salesman problem: application on the Ethiopian tourism sites
Xie et al. We know your preferences in new cities: Mining and modeling the behavior of travelers
Rodríguez-Echeverría et al. Density-based spatial clustering and ordering points approach for characterizations of tourist behaviour
CN107402919A (zh) 基于图的机器翻译数据选择方法及机器翻译数据选择系统
Manca et al. Fuzzy analysis for modeling regional delineation and development: the case of the Sardinian Mining Geopark

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190906