CN112131490A - 一种知识图谱驱动下区域敏感的兴趣点推荐方法 - Google Patents

一种知识图谱驱动下区域敏感的兴趣点推荐方法 Download PDF

Info

Publication number
CN112131490A
CN112131490A CN202010989380.1A CN202010989380A CN112131490A CN 112131490 A CN112131490 A CN 112131490A CN 202010989380 A CN202010989380 A CN 202010989380A CN 112131490 A CN112131490 A CN 112131490A
Authority
CN
China
Prior art keywords
interest
point
user
attribute
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010989380.1A
Other languages
English (en)
Other versions
CN112131490B (zh
Inventor
金嘉晖
苗子佳
汤家凯
张竞慧
罗军舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202010989380.1A priority Critical patent/CN112131490B/zh
Publication of CN112131490A publication Critical patent/CN112131490A/zh
Application granted granted Critical
Publication of CN112131490B publication Critical patent/CN112131490B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种知识图谱驱动下区域敏感的兴趣点推荐方法。给定用户和用户所处的地理位置以及用户的历史访问记录,兴趣点推荐希望寻找到用户将来最有可能访问的k个兴趣点。本发明以知识图谱作为辅助手段,其节点包含实体节点和属性节点,边表示实体与实体、实体与属性的关系。知识图谱可以串联各类兴趣点实体的关系,同时有效表征地理空间关系。基于知识图谱学习兴趣点类型特征和属性特征,并用L维向量表示。然后根据兴趣点地理位置关系定义区域范围以表征区域环境特征,结合兴趣点特征描述地理影响,共同进行兴趣点推荐。最后,使用基于知识图谱的位置兴趣点推荐算法进一步筛选候选结果,将得分最高的k个兴趣点作为结果返回给用户。

Description

一种知识图谱驱动下区域敏感的兴趣点推荐方法
技术领域
本发明涉及知识图谱及其在兴趣点推荐领域的应用,尤其涉及一种知识图谱驱动下区域敏感的兴趣点推荐方法。
背景技术
随着现代信息技术的高速发展和位置感知技术的不断加强,互联网上层出不穷的应用引发了数据的爆炸式增长,人们从信息匮乏时代步入了信息过载时代。在这种时代背景下,人们越来越难从大量的信息中找到自身感兴趣的信息,但同时,海量的数据也为挖掘用户偏好提供了契机,由此产生了兴趣点推荐技术。兴趣点是地理信息系统中的一个概念,泛指一切可以抽象为点的地理对象,如学校、餐馆、加油站、医院、超市等,其中必须包含位置点的名称、类别、经度、纬度等信息,也可以包含该兴趣点的评分、热度等其他信息,这些信息共同构成该兴趣点的语义。兴趣点推荐旨在分析用户的兴趣特点和行为特征,从而在未来向用户个性化推荐他们可能感兴趣的地点。随着大数据的支持和深度学习技术的发展,兴趣点推荐逐渐引起了学术界和工业界的广泛关注。
传统的兴趣点推荐技术,主要是根据用户的历史访问数据来判断用户的个人偏好,再结合用户当前所处区域内兴趣点的特征进行推荐。然而这无法实时感知用户所处区域环境的变化,因为不同的地理区域具有截然不同的环境特点,使得用户在不同区域中往往表现出对于兴趣点(的类型、属性等)明显的偏好差异。并且传统兴趣点推荐技术无法关联不同类型兴趣点实体。每个兴趣点都隶属于某种类型,类型之间存在相似性,使得用户往往对于相似类型的兴趣点表现出相似偏好,但是在处理复杂的数据耗时长,也只能学习用户和兴趣点的浅层特征,不能高效地为用户提供个性化推荐。
针对传统兴趣点推荐技术面临的挑战,可以引入知识图谱作为新的辅助手段,作为兴趣点推荐应用有力的数据支撑。知识图谱是结构化的语义知识库,旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图。对于兴趣点推荐而言,知识图谱串联了各类实体的关系,有利于缓解数据稀疏性问题;同时,知识图谱可以表示地点实体,从而有利于有效表征地理空间关系。然而,对于融合多源异构数据的知识图谱,其属性众多,离散型和连续型属性共存且分属不同量纲,因此如何表征异构属性、表征类型相似性以解决这些缺陷,又如何刻画动态变化的用户兴趣点偏好并设计满足动态实时性需求成为了新的挑战。为此,亟待研究一种知识图谱驱动下区域敏感的兴趣点推荐算法以优化推荐系统性能。
发明内容
发明目的:针对以上现有技术存在的问题,本发明提出了一种知识图谱驱动下区域敏感的兴趣点推荐方法,着重解决传统兴趣点推荐算法中无法实时感知区域环境变化的问题。预先构建面向城市兴趣点推荐领域的知识图谱,分别提出基于知识图谱的特征提取模型与基于动态区域的兴趣点推荐算法,以实现提高兴趣点推荐性能的目的。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种知识图谱驱动下区域敏感的兴趣点推荐方法,该方法包括以下步骤:
步骤1.构建面向兴趣点领域的知识图谱G=(P,Y),P={p1,p2,…,p|P|}代表兴趣点实体集合,
Figure BDA0002690328580000021
代表属性三元组,其中,A={a1,a2,…,a|A|}代表属性集合,V={v1,v2,…,v|V|}代表属性值集合;
步骤2.对于知识图谱G中任意属性三元组Y(p,a,v),计算兴趣点实体p在属性a的映射函数下其属性值v的预测向量
Figure BDA0002690328580000022
Figure BDA0002690328580000023
与属性值v的真实向量拟合后得到L维向量,表示兴趣点的实体属性特征eattr
步骤3.利用庞加莱球面模型表示学习技术对知识图谱中的兴趣点实体学习兴趣点类型特征etype
步骤4.得到兴趣点实体pi的属性特征
Figure BDA0002690328580000024
和类型特征
Figure BDA0002690328580000025
后,兴趣点的语义特征信息由属性特征和类型特征联合表示,共同构成兴趣点的语义特征
Figure BDA0002690328580000026
联合区域内所有兴趣点的语义特征,构成该区域环境特征
Figure BDA0002690328580000027
步骤5.利用用户历史访问数据与区域环境信息建模用户兴趣偏好
Figure BDA0002690328580000028
综合利用兴趣点语义特征
Figure BDA0002690328580000029
区域环境特征
Figure BDA00026903285800000210
用户兴趣偏好
Figure BDA00026903285800000211
得到用户Uj在当前区域环境下对兴趣点的兴趣偏好ej,i;取预测得分最高的k个兴趣点实体向用户Uj推荐。
进一步的,步骤(2)中,计算兴趣点实体p在属性a的映射函数下其属性值v的预测向量
Figure BDA00026903285800000212
Figure BDA00026903285800000213
与属性值v的真实向量拟合后得到L维向量,表示兴趣点的实体属性特征eattr,具体步骤为:
步骤201.对于兴趣点知识图谱中的任意属性三元组Y(p,a,v),通过式(1)计算兴趣点实体p关于属性a映射函数嵌入后的距离度量:
dis(p,a,v)=-||f(pWa+ba)-Vpa||L1/L2+b1 (1)
其中,f(·)表示变换到属性空间后的实体嵌入,Wa表示属性a对应的变换矩阵,ba表示属性a变换下的偏置,Vpa表示实际属性值嵌入,L1、L2表示L1范数和L2范数,b1表示归一化偏置,dis(·)表示理想值与实际值的差距,其值越大代表兴趣点实体p经过属性a的映射函数越接近于实际属性值v,即该映射函数可信度高;
步骤202.对于兴趣点知识图谱G中的任意属性三元组Y(p,a,v),其属性a对应一个变换矩阵Wa,兴趣点实体p经过Wa映射后其属性值v的向量,表示为
Figure BDA0002690328580000031
拟合
Figure BDA0002690328580000032
与v的空间距离,以学习实体兴趣点p在属性a下的表示;
步骤203.拟合知识图谱G中的所有属性三元组,损失记为loss。,迭代降低该损失,学习兴趣点的实体属性特征eattr
步骤(3)中,利用庞加莱球面模型表示学习技术对知识图谱中的兴趣点实体学习兴趣点类型特征,具体步骤为:
步骤301.在庞加莱球面模型中,设u、t代表类型层次结构中两个不同类型节点的嵌入向量表示,arcosh(·)表示反双曲余弦函数,d(u,t)表示两个向量间的双曲空间距离,用欧氏空间的坐标表示庞加莱球面距离公式为:
Figure BDA0002690328580000033
步骤302.如式(2)所示,通过两个向量的范式捕获类型的层次结构,通过两个向量的距离得到其相似性,然后利用类型的层次结构和其相似性联合训练学习类型节点的类型特征etype
步骤(4)中,首先将兴趣点的语义特征信息由属性特征和类型特征联合表示,共同构成兴趣点的语义特征
Figure BDA0002690328580000034
具体方法如下:
步骤40101.得到兴趣点实体pi的属性特征
Figure BDA0002690328580000035
和类型特征
Figure BDA0002690328580000036
步骤40102.将属性特征
Figure BDA0002690328580000037
和类型特征
Figure BDA0002690328580000038
联合表示为兴趣点实体pi的语义特征
Figure BDA0002690328580000039
Figure BDA0002690328580000041
其中W1表示属性特征
Figure BDA0002690328580000042
和类型特征
Figure BDA0002690328580000043
联合时的转换矩阵,CONCAT(·)表示特征的联合;
步骤40103.在构造的兴趣点知识图谱中,兴趣点集合P={p1,p2,…pn}表示兴趣点集合中包含n个兴趣点,兴趣点语义集合
Figure BDA0002690328580000044
表示P中每个兴趣点所对应的语义信息。
进一步的,步骤(4)中,联合区域内所有兴趣点的特征,构成该区域环境特征
Figure BDA0002690328580000045
具体方法如下:
步骤40201.在知识图谱基础上,根据兴趣点实体的经纬度位置构造空间语义图S=(ND,ED),i∈ND表示G中的某个兴趣点pi,v包含的语义信息为
Figure BDA0002690328580000046
表示pi的语义特征,ed∈ED表示边两端的兴趣点在空间上存在近邻关系;
步骤40202.空间语义图中的边代表现实世界中兴趣点之间的邻近关系,利用兴趣点之间的拓扑距离定义兴趣点区域范围,对于兴趣点pi,将其邻居兴趣点集合表示为N(pi),任意邻居兴趣点po∈N(pi)对应的兴趣点语义特征表示为
Figure BDA0002690328580000047
Wneigh表示邻居兴趣点聚合时的转换矩阵,bneigh表示邻居兴趣点聚合时的偏置,首先聚合其邻居兴趣点语义特征表示邻域语义特征:
Figure BDA0002690328580000048
步骤40203.兴趣点pi的区域环境特征由邻域语义信息
Figure BDA0002690328580000049
和兴趣点pi语义信息
Figure BDA00026903285800000410
联合表示,W2表示联合时的转换矩阵:
Figure BDA00026903285800000411
其中σ是激活函数,为了达到动态区域的要求,利用式(4)和式(5)迭代聚合多跳距离内的兴趣点语义信息,表征兴趣点pi的不同范围区域环境特征
Figure BDA00026903285800000412
步骤(5)中,首先利用用户历史访问数据与区域环境信息建模用户兴趣偏好
Figure BDA00026903285800000413
具体方法如下:
步骤50101.按访问时间由前向后排序用户Uj的历史访问记录Hj={o1,p2,…,pn}(已按访问时间由前向后排序),当前访问兴趣点为pi,则当前轮次模型训练的任务是训练算法参数拟合用户Uj对于兴趣点pi的数值评分sj,i
步骤50102.采用门控循环单元建模用户兴趣偏好,联合式(4)、式(5),用户Uj当前访问的兴趣点pi区域环境特征如式(6)所示,其中Aggregate(·)表示聚合邻居兴趣点语义特征,得到邻域语义特征:
Figure BDA0002690328580000051
通过式(6),分别计算用户Uj历史记录Hj中各个兴趣点的区域环境特征,记为
Figure BDA0002690328580000052
步骤50103.用户Uj的兴趣偏好由
Figure BDA0002690328580000053
中区域环境特征序列通过门控循环单元GRU(·)刻画,如式(7):
Figure BDA0002690328580000054
进一步的,步骤(5)中,综合利用兴趣点语义特征
Figure BDA0002690328580000055
区域环境特征
Figure BDA0002690328580000056
用户兴趣偏好
Figure BDA0002690328580000057
得到用户Uj在当前区域环境下对兴趣点的兴趣偏好ej,i,具体方法如下:
步骤50201.将用户Uj兴趣偏好
Figure BDA0002690328580000058
与区域环境特征
Figure BDA0002690328580000059
交互,得到用户Uj在当前区域环境中的兴趣偏好
Figure BDA00026903285800000510
如式(8)所示:
Figure BDA00026903285800000511
其中W3表示用户Uj兴趣偏好的转换矩阵,W4表示区域环境特征的转换矩阵,b2表示联合时的偏置,式(8)实际意义表示用户对于区域环境中的兴趣偏好;
步骤50202.将用户Uj在当前区域环境中的兴趣偏好
Figure BDA00026903285800000512
与兴趣点语义特征
Figure BDA00026903285800000513
交互得到用户Uj在当前区域环境下对兴趣点的兴趣偏好ej,i,如式(9)所示:
Figure BDA00026903285800000514
其中W5表示用户Uj在当前区域环境中的兴趣偏好的转换矩阵,W6表示兴趣点语义特征的转换矩阵,b3表示联合时的偏置,式(9)实际意义表示用户在当前区域环境下对于兴趣点的偏好;
步骤50203.对于式(9),需将其转换为与sj,i相同的数值型数据作为模型的输出,该数值型数据的实际意义表示推荐算法预测用户Uj对于兴趣点pi的数值评分。
进一步的,步骤(5)中,取预测得分最高的k个兴趣点向用户Uj推荐,具体方法如下:
步骤50301.将该过程视为一个多分类任务,在深度神经网络模型中通过归一化指数函数(Softmax)处理多分类任务;
步骤50302.拟合模型预测用户对于兴趣点的评分和真实数据集中用户对于兴趣点的评分,根据最小化目标损失函数以监督训练推荐算法;
步骤50303.基于训练所得的区域语义敏感的位置兴趣点推荐算法,预测用户Uj对于城市兴趣点集合P中各个兴趣点的偏好得分,记为集合
Figure BDA0002690328580000061
Figure BDA0002690328580000062
步骤50304.设定一个距离因子β(0<β<1),兴趣点pi在扩展空间语义图中距离当前位置loc的拓扑距离为n跳,则推荐模型预测用户Uj对兴趣点pi的兴趣偏好打分如式(12)所示:
Figure BDA0002690328580000063
步骤50305.记用户Uj对于城市兴趣点集合P中各个兴趣点的最终偏好得分为集合scorefinal,针对Top-k兴趣点推荐目标,从偏好得分集合scorefinal中取预测得分最高的k个兴趣点作为推荐项,拟向用户Uj推荐。
有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果:
(1)可以实时感知用户所处区域环境的变化。不同的地理区域具有截然不同的环境特点,使得用户在不同区域中往往表现出对于兴趣点(的类型、属性等)明显的偏好差异,因此在推荐系统中考虑区域环境影响至关重要,而以往研究工作中静态区域划分无法实时体现用户所处区域环境的变化,影响推荐的实际效果。
(2)提高兴趣点推荐系统的准确性。基于知识图谱的兴趣点推荐系统解决了传统兴趣点推荐系统中无法细粒度建模用户和物品实体的问题,丰富兴趣点实体联系,缓解数据稀疏性,增强了数据的语义信息和实体之间的联系以进一步提高推荐准确度。
附图说明
图1知识图谱驱动下区域敏感的兴趣点推荐方法流程图;
图2兴趣点推荐算法流程图;
图3知识图谱驱动下区域敏感的兴趣点推荐方法流程图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明。
本发明的目标是基于兴趣点领域知识图谱完成区域敏感的用户个性化兴趣点推荐任务。知识图谱,是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,是由“节点-边-节点”三元组构成的集合。在兴趣点关系知识图谱中,节点可以包括店铺(兴趣点)或商圈(区域)等实体,如“肯德基”、“万达广场”,也可以包括人均价格、店铺星级、店铺类型等属性节点;节点与节点之间的边称作关系,包括实体与实体、实体与属性等关系的边,如“肯德基”和“麦当劳”之间的关系为“邻近”关系,“肯德基”和“万达广场”之间的关系为“坐落于”关系。
本发明构建面向城市兴趣点推荐领域的知识图谱,分别提出基于知识图谱的特征提取模型与基于动态区域的兴趣点推荐算法建模用户兴趣偏好,预测用户对于兴趣点的打分,向用户推荐他最可能感兴趣的k个兴趣点。为此,本发明具体执行步骤如下:
步骤1.构建面向兴趣点领域的知识图谱。将兴趣点关系中的店铺(兴趣点)和商圈(区域),如“肯德基”、“万达广场”,映射成知识图谱中的实体节点。将人均价格、店铺星级、店铺类型等属性,如“日本料理”、“五星级”,映射成知识图谱中的属性节点。将实体与实体、实体与属性等关系,如“邻近”、“坐落于”,映射成节点之间的边。因此得到兴趣点关系的知识图谱G=(P,Y),P={p1,p,…,p|P|}代表兴趣点实体集合,
Figure BDA0002690328580000071
代表属性三元组,其中,A={a1,a2,…,a|A|}代表属性集合,V={v1,v2,…,v|V|}代表属性值集合。
步骤2.从兴趣点关系知识图谱中获得兴趣点的属性。例如,对于兴趣点实体“肯德基”,可以得到“快餐”、“人均消费30元”、“店铺评分4分”等属性信息。例如对于知识图谱G中的属性三元组(肯德基,人均消费,30元),计算兴趣点实体“肯德基”在属性“人均消费”的映射函数下其属性值“30元”的预测向量,将其与属性值“30元”的真实向量拟合后得到L维向量,表示兴趣点“肯德基”的实体属性特征
Figure BDA0002690328580000081
步骤201.对于兴趣点知识图谱中的任意属性三元组Y(p,a,v),通过式(1)计算兴趣点实体p关于属性a映射函数嵌入后的距离度量:
dis(p,a,v) =-||f(pWa+ba)-Vpa||L1/L2+b1 (1)
其中,f(·)表示变换到属性空间后的实体嵌入,Wa表示属性a对应的变换矩阵,ba表示属性a变换下的偏置,Vpa表示实际属性值嵌入,L1、L2表示L1范数和L2范数,b1表示归一化偏置,dis(·)表示理想值与实际值的差距,其值越大代表兴趣点实体p经过属性a的映射函数越接近于实际属性值v,即该映射函数可信度高;
步骤202.对于兴趣点知识图谱G中的任意属性三元组Y(p,a,v),其属性a对应一个变换矩阵Wa,兴趣点实体p经过Wa映射后其属性值v的向量,表示为
Figure BDA0002690328580000082
拟合
Figure BDA0002690328580000083
与v的空间距离,以学习实体兴趣点p在属性a下的表示;
步骤203.拟合知识图谱G中的所有属性三元组,损失记为loss。迭代降低该损失,学习兴趣点的实体属性特征eattr
步骤3.利用庞加莱球面模型表示学习技术对知识图谱中的兴趣点实体学习兴趣点类型特征,具体步骤为:
步骤301.在庞加莱球面模型中,设u、t代表类型层次结构中两个不同类型节点的嵌入向量表示,arcosh(·)表示反双曲余弦函数,d(u,t)表示两个向量间的双曲空间距离,用欧氏空间的坐标表示庞加莱球面距离公式为:
Figure BDA0002690328580000084
步骤302.如式(2)所示,通过两个向量的范式捕获类型的层次结构,通过两个向量的距离得到其相似性,然后利用类型的层次结构和其相似性联合训练学习类型节点的类型特征etype
步骤4.得到兴趣点实体pi的属性特征
Figure BDA0002690328580000091
和类型特征
Figure BDA0002690328580000092
后,兴趣点的语义特征信息由属性特征和类型特征联合表示,共同构成兴趣点的语义特征
Figure BDA0002690328580000093
联合区域内所有兴趣点的语义特征,构成该区域环境特征
Figure BDA0002690328580000094
为此,步骤4分为学习兴趣点的语义特征和学习区域环境特征两个子过程,具体步骤如下:
子过程401.将兴趣点的语义特征信息由属性特征和类型特征联合表示,共同构成兴趣点的语义特征
Figure BDA0002690328580000095
步骤40101.得到兴趣点实体pi的属性特征
Figure BDA0002690328580000096
和类型特征
Figure BDA0002690328580000097
步骤40102.将属性特征
Figure BDA0002690328580000098
和类型特征
Figure BDA0002690328580000099
联合表示为兴趣点实体pi的语义特征
Figure BDA00026903285800000910
Figure BDA00026903285800000911
其中W1表示属性特征
Figure BDA00026903285800000912
和类型特征
Figure BDA00026903285800000913
联合时的转换矩阵,CONCAT(·)表示特征的联合;
步骤40103.在构造的兴趣点知识图谱中,兴趣点集合P={o1,o2,…Pn}表示兴趣点集合中包含n个兴趣点,兴趣点语义集合
Figure BDA00026903285800000914
表示P中每个兴趣点所对应的语义信息。
子过程402.联合区域内所有兴趣点的特征,构成该区域环境特征
Figure BDA00026903285800000915
步骤40201.在知识图谱基础上,根据兴趣点实体的经纬度位置构造空间语义图S=(ND,ED),i∈ND表示G中的某个兴趣点pi,v包含的语义信息为
Figure BDA00026903285800000916
表示pi的语义特征,ed∈ED表示边两端的兴趣点在空间上存在近邻关系;
步骤40202.空间语义图中的边代表现实世界中兴趣点之间的邻近关系,利用兴趣点之间的拓扑距离定义兴趣点区域范围,对于兴趣点pi,将其邻居兴趣点集合表示为N(pi),任意邻居兴趣点po∈N(pi)对应的兴趣点语义特征表示为
Figure BDA00026903285800000917
Wneigh表示邻居兴趣点聚合时的转换矩阵,bneigh表示邻居兴趣点聚合时的偏置,首先聚合其邻居兴趣点语义特征表示邻域语义特征:
Figure BDA0002690328580000101
步骤40203.兴趣点pi的区域环境特征由邻域语义信息
Figure BDA0002690328580000102
和兴趣点pi语义信息
Figure BDA0002690328580000103
联合表示,W2表示联合时的转换矩阵:
Figure BDA0002690328580000104
其中σ是激活函数,为了达到动态区域的要求,利用式(4)和式(5)迭代聚合多跳距离内的兴趣点语义信息,表征兴趣点pi的不同范围区域环境特征
Figure BDA0002690328580000105
步骤5.利用用户历史访问数据与区域环境信息建模用户兴趣偏好
Figure BDA0002690328580000106
综合利用兴趣点语义特征
Figure BDA0002690328580000107
区域环境特征
Figure BDA0002690328580000108
用户兴趣偏好
Figure BDA0002690328580000109
得到用户Uj在当前区域环境下对兴趣点的兴趣偏好ej,i;取预测得分最高的k个兴趣点向用户Uj推荐。为此,步骤5分为建模用户兴趣偏好、学习用户在当前区域环境下对兴趣点的兴趣偏好和取预测得分最高的k个兴趣点向用户进行推荐三个子过程,具体步骤如下:
子过程501.利用用户历史访问数据与区域环境信息建模用户兴趣偏好
Figure BDA00026903285800001010
步骤50101.按访问时间由前向后排序用户Uj的历史访问记录Hj={p1,p2,…,pn}(已按访问时间由前向后排序),当前访问兴趣点为pi,则当前轮次模型训练的任务是训练算法参数拟合用户Uj对于兴趣点pi的数值评分sj,i
步骤50102.采用门控循环单元建模用户兴趣偏好,联合式(4)、式(5),用户Uj当前访问的兴趣点pi区域环境特征如式(6)所示,其中Aggregate(·)表示聚合邻居兴趣点语义特征,得到邻域语义特征:
Figure BDA00026903285800001011
通过式(6),分别计算用户Uj历史记录Hj中各个兴趣点的区域环境特征,记为
Figure BDA00026903285800001012
步骤50103.用户Uj的兴趣偏好由
Figure BDA00026903285800001013
中区域环境特征序列通过门控循环单元GRU(·)刻画,如式(7):
Figure BDA0002690328580000111
子过程502.综合利用兴趣点语义特征
Figure BDA0002690328580000112
区域环境特征
Figure BDA0002690328580000113
用户兴趣偏好
Figure BDA0002690328580000114
得到用户Uj在当前区域环境下对兴趣点的兴趣偏好ej,i
步骤50201.将用户Uj兴趣偏好
Figure BDA0002690328580000115
与区域环境特征
Figure BDA0002690328580000116
交互,得到用户Uj在当前区域环境中的兴趣偏好
Figure BDA0002690328580000117
如式(8)所示:
Figure BDA0002690328580000118
其中W3表示用户Uj兴趣偏好的转换矩阵,W4表示区域环境特征的转换矩阵,b2表示联合时的偏置,式(8)实际意义表示用户对于区域环境中的兴趣偏好;
步骤50202.将用户Uj在当前区域环境中的兴趣偏好
Figure BDA0002690328580000119
与兴趣点语义特征
Figure BDA00026903285800001110
交互得到用户Uj在当前区域环境下对兴趣点的兴趣偏好ej,i,如式(9)所示:
Figure BDA00026903285800001111
其中W5表示用户Uj在当前区域环境中的兴趣偏好的转换矩阵,W6表示兴趣点语义特征的转换矩阵,b3表示联合时的偏置,式(9)实际意义表示用户在当前区域环境下对于兴趣点的偏好;
步骤50203.对于式(9),需将其转换为与sj,i相同的数值型数据作为模型的输出,该数值型数据的实际意义表示推荐算法预测用户Uj对于兴趣点pi的数值评分。
子过程503.取预测得分最高的k个兴趣点向用户Uj推荐。
步骤50301.将该过程视为一个多分类任务,在深度神经网络模型中通过归一化指数函数(Softmax)处理多分类任务;
步骤50302.拟合模型预测用户对于兴趣点的评分和真实数据集中用户对于兴趣点的评分,根据最小化目标损失函数以监督训练推荐算法;
步骤50303.基于训练所得的区域语义敏感的位置兴趣点推荐算法,预测用户Uj对于城市兴趣点集合P中各个兴趣点的偏好得分,记为集合
Figure BDA00026903285800001112
Figure BDA0002690328580000121
步骤50304.设定一个距离因子β(0<β<1),兴趣点pi在扩展空间语义图中距离当前位置loc的拓扑距离为n跳,则推荐模型预测用户Uj对兴趣点pi的兴趣偏好打分如式(12)所示:
Figure BDA0002690328580000122
步骤50305.记用户Uj对于城市兴趣点集合P中各个兴趣点的最终偏好得分为集合scorefinal,针对Top-k兴趣点推荐目标,从偏好得分集合scorefinal中取预测得分最高的k个兴趣点作为推荐项,拟向用户Uj推荐。

Claims (8)

1.一种知识图谱驱动下区域敏感的兴趣点推荐方法,其特征在于,该方法包括以下步骤:
步骤1.构建面向兴趣点领域的知识图谱G=(P,Y),P={p1,p2,...,p|P|}代表兴趣点实体集合,
Figure FDA00026903285700000112
代表属性三元组,其中,A={a1,a2,...,a|A|}代表属性集合,V={v1,v2,...,v|V|}代表属性值集合;
步骤2.对于知识图谱G中任意属性三元组Y(p,a,v),计算兴趣点实体p在属性a的映射函数下其属性值v的预测向量
Figure FDA00026903285700000113
Figure FDA00026903285700000114
与属性值v的真实向量拟合后得到L维向量,表示兴趣点的实体属性特征eattr
步骤3.利用庞加莱球面模型表示学习技术对知识图谱中的兴趣点实体学习兴趣点类型特征etype
步骤4.得到兴趣点实体pi的属性特征
Figure FDA0002690328570000011
和类型特征
Figure FDA0002690328570000012
后,兴趣点的语义特征信息由属性特征和类型特征联合表示,共同构成兴趣点的语义特征
Figure FDA0002690328570000013
联合区域内所有兴趣点的语义特征,构成该区域环境特征
Figure FDA0002690328570000014
步骤5.利用用户历史访问数据与区域环境信息建模用户兴趣偏好
Figure FDA00026903285700000111
综合利用兴趣点语义特征
Figure FDA0002690328570000016
区域环境特征
Figure FDA0002690328570000017
用户兴趣偏好
Figure FDA0002690328570000018
得到用户Uj在当前区域环境下对兴趣点的兴趣偏好ej,i;取预测得分最高的k个兴趣点实体向用户Uj推荐。
2.根据权利要求1所述的一种知识图谱驱动下区域敏感的兴趣点推荐方法,其特征在于,步骤(2)中,计算兴趣点实体p在属性a的映射函数下其属性值v的预测向量
Figure FDA0002690328570000019
Figure FDA00026903285700000110
与属性值v的真实向量拟合后得到L维向量,表示兴趣点的实体属性特征eattr,具体步骤为:
步骤201.对于兴趣点知识图谱中的任意属性三元组Y(p,a,v),通过式(1)计算兴趣点实体p关于属性a映射函数嵌入后的距离度量:
dis(p,a,v)=-||f(pWa+ba)-Vpa||L1/L2+b1 (1)
其中,f(·)表示变换到属性空间后的实体嵌入,Wa表示属性a对应的变换矩阵,ba表示属性a变换下的偏置,Vpa表示实际属性值嵌入,L1、L2表示L1范数和L2范数,b1表示归一化偏置,dis(·)表示理想值与实际值的差距,其值越大代表兴趣点实体p经过属性a的映射函数越接近于实际属性值v,即该映射函数可信度高;
步骤202.对于兴趣点知识图谱G中的任意属性三元组Y(p,a,v),其属性a对应一个变换矩阵Wa,兴趣点实体p经过Wa映射后其属性值v的向量,表示为
Figure FDA0002690328570000029
拟合
Figure FDA00026903285700000210
与v的空间距离,以学习实体兴趣点p在属性a下的表示;
步骤203.拟合知识图谱G中的所有属性三元组,损失记为loss,迭代降低该损失,学习兴趣点的实体属性特征eattr
3.根据权利要求1所述的一种知识图谱驱动下区域敏感的兴趣点推荐方法,其特征在于,步骤(3)中,利用庞加莱球面模型表示学习技术对知识图谱中的兴趣点实体学习兴趣点类型特征,具体步骤为:
步骤301.在庞加莱球面模型中,设u、t代表类型层次结构中两个不同类型节点的嵌入向量表示,arcosh(·)表示反双曲余弦函数,d(u,t)表示两个向量间的双曲空间距离,用欧氏空间的坐标表示庞加莱球面距离公式为:
Figure FDA0002690328570000021
步骤302.如式(2)所示,通过两个向量的范式捕获类型的层次结构,通过两个向量的距离得到其相似性,然后利用类型的层次结构和其相似性联合训练学习类型节点的类型特征etype
4.根据权利要求1所述的一种知识图谱驱动下区域敏感的兴趣点推荐方法,其特征在于,步骤(4)中,首先将兴趣点的语义特征信息由属性特征和类型特征联合表示,共同构成兴趣点的语义特征
Figure FDA0002690328570000022
具体方法如下:
步骤40101.得到兴趣点实体pi的属性特征
Figure FDA0002690328570000023
和类型特征
Figure FDA0002690328570000024
步骤40102.将属性特征
Figure FDA0002690328570000025
和类型特征
Figure FDA0002690328570000026
联合表示为兴趣点实体pi的语义特征
Figure FDA0002690328570000027
Figure FDA0002690328570000028
其中W1表示属性特征
Figure FDA0002690328570000031
和类型特征
Figure FDA0002690328570000032
联合时的转换矩阵,CONCAT(·)表示特征的联合;
步骤40103.在构造的兴趣点知识图谱中,兴趣点集合P={p1,p2,...pn}表示兴趣点集合中包含n个兴趣点,兴趣点语义集合
Figure FDA0002690328570000033
表示P中每个兴趣点所对应的语义信息。
5.根据权利要求1所述的一种知识图谱驱动下区域敏感的兴趣点推荐方法,其特征在于,步骤(4)中,联合区域内所有兴趣点的特征,构成该区域环境特征
Figure FDA0002690328570000034
具体方法如下:
步骤40201.在知识图谱基础上,根据兴趣点实体的经纬度位置构造空间语义图S=(ND,ED),i∈ND表示G中的某个兴趣点pi,v包含的语义信息为
Figure FDA0002690328570000035
表示pi的语义特征,ed∈ED表示边两端的兴趣点在空间上存在近邻关系;
步骤40202.空间语义图中的边代表现实世界中兴趣点之间的邻近关系,利用兴趣点之间的拓扑距离定义兴趣点区域范围,对于兴趣点pi,将其邻居兴趣点集合表示为N(pi),任意邻居兴趣点po∈N(pi)对应的兴趣点语义特征表示为
Figure FDA0002690328570000036
Wneigh表示邻居兴趣点聚合时的转换矩阵,bneigh表示邻居兴趣点聚合时的偏置,首先聚合其邻居兴趣点语义特征表示邻域语义特征:
Figure FDA0002690328570000037
步骤40203.兴趣点pi的区域环境特征由邻域语义信息
Figure FDA0002690328570000038
和兴趣点pi语义信息
Figure FDA0002690328570000039
联合表示,W2表示联合时的转换矩阵:
Figure FDA00026903285700000310
其中σ是激活函数,为了达到动态区域的要求,利用式(4)和式(5)迭代聚合多跳距离内的兴趣点语义信息,表征兴趣点pi的不同范围区域环境特征
Figure FDA00026903285700000311
6.根据权利要求1所述的一种知识图谱驱动下区域敏感的兴趣点推荐方法,其特征在于,步骤(5)中,首先利用用户历史访问数据与区域环境信息建模用户兴趣偏好
Figure FDA0002690328570000041
具体方法如下:
步骤50101.按访问时间由前向后排序用户Uj的历史访问记录Hj={p1,p2,...,pn}(已按访问时间由前向后排序),当前访问兴趣点为pi,则当前轮次模型训练的任务是训练算法参数拟合用户Uj对于兴趣点pi的数值评分sj,i
步骤50102.采用门控循环单元建模用户兴趣偏好,联合式(4)、式(5),用户Uj当前访问的兴趣点pi区域环境特征如式(6)所示,其中Aggregate(·)表示聚合邻居兴趣点语义特征,得到邻域语义特征:
Figure FDA0002690328570000042
通过式(6),分别计算用户Uj历史记录Hj中各个兴趣点的区域环境特征,记为
Figure FDA0002690328570000043
步骤50103.用户Uj的兴趣偏好由
Figure FDA0002690328570000044
中区域环境特征序列通过门控循环单元GRU(·)刻画,如式(7):
Figure FDA0002690328570000045
7.根据权利要求1所述的一种知识图谱驱动下区域敏感的兴趣点推荐方法,其特征在于,步骤(5)中,综合利用兴趣点语义特征
Figure FDA0002690328570000046
区域环境特征
Figure FDA0002690328570000047
用户兴趣偏好
Figure FDA0002690328570000048
得到用户Uj在当前区域环境下对兴趣点的兴趣偏好ej,i,具体方法如下:
步骤50201.将用户Uj兴趣偏好
Figure FDA0002690328570000049
与区域环境特征
Figure FDA00026903285700000410
交互,得到用户Uj在当前区域环境中的兴趣偏好
Figure FDA00026903285700000411
如式(8)所示:
Figure FDA00026903285700000412
其中W3表示用户Uj兴趣偏好的转换矩阵,W4表示区域环境特征的转换矩阵,b2表示联合时的偏置,式(8)实际意义表示用户对于区域环境中的兴趣偏好;
步骤50202.将用户Uj在当前区域环境中的兴趣偏好
Figure FDA00026903285700000413
与兴趣点语义特征
Figure FDA00026903285700000414
父互得到用户Uj在当前区域环境下对兴趣点的兴趣偏好ej,i,如式(9)所示:
Figure FDA0002690328570000051
其中W5表示用户Uj在当前区域环境中的兴趣偏好的转换矩阵,W6表示兴趣点语义特征的转换矩阵,b3表示联合时的偏置,式(9)实际意义表示用户在当前区域环境下对于兴趣点的偏好;
步骤50203.对于式(9),需将其转换为与sj,i相同的数值型数据作为模型的输出,该数值型数据的实际意义表示推荐算法预测用户Uj对于兴趣点pi的数值评分。
8.根据权利要求1所述的一种知识图谱驱动下区域敏感的兴趣点推荐方法,其特征在于,步骤(5)中,取预测得分最高的k个兴趣点向用户Uj推荐,具体方法如下:
步骤50301.将该过程视为一个多分类任务,在深度神经网络模型中通过归一化指数函数(Softmax)处理多分类任务;
步骤50302.拟合模型预测用户对于兴趣点的评分和真实数据集中用户对于兴趣点的评分,根据最小化目标损失函数以监督训练推荐算法;
步骤50303.基于训练所得的区域语义敏感的位置兴趣点推荐算法,预测用户Uj对于城市兴趣点集合P中各个兴趣点的偏好得分,记为集合
Figure FDA0002690328570000052
Figure FDA0002690328570000053
步骤50304.设定一个距离因子β(0<β<1),兴趣点pi在扩展空间语义图中距离当前位置loc的拓扑距离为n跳,则推荐模型预测用户Uj对兴趣点pi的兴趣偏好打分如式(12)所示:
Figure FDA0002690328570000054
步骤50305.记用户Uj对于城市兴趣点集合P中各个兴趣点的最终偏好得分为集合scorefinal,针对Top-k兴趣点推荐目标,从偏好得分集合scorefinal中取预测得分最高的k个兴趣点作为推荐项,拟向用户Uj推荐。
CN202010989380.1A 2020-09-18 2020-09-18 一种知识图谱驱动下区域敏感的兴趣点推荐方法 Active CN112131490B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010989380.1A CN112131490B (zh) 2020-09-18 2020-09-18 一种知识图谱驱动下区域敏感的兴趣点推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010989380.1A CN112131490B (zh) 2020-09-18 2020-09-18 一种知识图谱驱动下区域敏感的兴趣点推荐方法

Publications (2)

Publication Number Publication Date
CN112131490A true CN112131490A (zh) 2020-12-25
CN112131490B CN112131490B (zh) 2022-11-15

Family

ID=73843035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010989380.1A Active CN112131490B (zh) 2020-09-18 2020-09-18 一种知识图谱驱动下区域敏感的兴趣点推荐方法

Country Status (1)

Country Link
CN (1) CN112131490B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905905A (zh) * 2021-01-22 2021-06-04 杭州电子科技大学 一种位置社交网络中兴趣点-区域联合推荐方法
CN113111302A (zh) * 2021-04-21 2021-07-13 上海电力大学 一种基于非欧空间的信息提取方法
CN113190593A (zh) * 2021-05-12 2021-07-30 《中国学术期刊(光盘版)》电子杂志社有限公司 一种基于数字人文知识图谱的搜索推荐方法
CN113656709A (zh) * 2021-08-24 2021-11-16 东北大学 一种融合知识图谱和时序特征的可解释兴趣点推荐方法
CN113688164A (zh) * 2021-07-28 2021-11-23 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于知识图谱关联分析的兴趣点查询方法及系统
CN113901319A (zh) * 2021-10-18 2022-01-07 桂林电子科技大学 一种基于序列语义与属性图特征学习的地点推荐方法
CN117808089A (zh) * 2024-02-29 2024-04-02 山东大学 一种基于双空间信息聚合的知识图谱推荐方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188208A (zh) * 2019-06-04 2019-08-30 河海大学 一种基于知识图谱的信息资源查询推荐方法和系统
CN110555112A (zh) * 2019-08-22 2019-12-10 桂林电子科技大学 一种基于用户正负偏好学习的兴趣点推荐方法
CN111523029A (zh) * 2020-04-20 2020-08-11 浙江大学 一种基于知识图谱表示学习的个性化推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188208A (zh) * 2019-06-04 2019-08-30 河海大学 一种基于知识图谱的信息资源查询推荐方法和系统
CN110555112A (zh) * 2019-08-22 2019-12-10 桂林电子科技大学 一种基于用户正负偏好学习的兴趣点推荐方法
CN111523029A (zh) * 2020-04-20 2020-08-11 浙江大学 一种基于知识图谱表示学习的个性化推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
尤耀华等: "基于矩阵分解的感知兴趣点智能推荐算法仿真", 《计算机仿真》 *
杨晋吉等: "一种知识图谱的排序学习个性化推荐算法", 《小型微型计算机系统》 *
马理博等: "话题-位置-类别感知的兴趣点推荐", 《计算机科学》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905905A (zh) * 2021-01-22 2021-06-04 杭州电子科技大学 一种位置社交网络中兴趣点-区域联合推荐方法
CN113111302A (zh) * 2021-04-21 2021-07-13 上海电力大学 一种基于非欧空间的信息提取方法
CN113111302B (zh) * 2021-04-21 2023-05-12 上海电力大学 一种基于非欧空间的信息提取方法
CN113190593A (zh) * 2021-05-12 2021-07-30 《中国学术期刊(光盘版)》电子杂志社有限公司 一种基于数字人文知识图谱的搜索推荐方法
CN113688164A (zh) * 2021-07-28 2021-11-23 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于知识图谱关联分析的兴趣点查询方法及系统
CN113656709A (zh) * 2021-08-24 2021-11-16 东北大学 一种融合知识图谱和时序特征的可解释兴趣点推荐方法
CN113656709B (zh) * 2021-08-24 2023-07-25 东北大学 一种融合知识图谱和时序特征的可解释兴趣点推荐方法
CN113901319A (zh) * 2021-10-18 2022-01-07 桂林电子科技大学 一种基于序列语义与属性图特征学习的地点推荐方法
CN113901319B (zh) * 2021-10-18 2024-03-26 桂林电子科技大学 一种基于序列语义与属性图特征学习的地点推荐方法
CN117808089A (zh) * 2024-02-29 2024-04-02 山东大学 一种基于双空间信息聚合的知识图谱推荐方法及系统
CN117808089B (zh) * 2024-02-29 2024-06-11 山东大学 一种基于双空间信息聚合的知识图谱推荐方法及系统

Also Published As

Publication number Publication date
CN112131490B (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
CN112131490B (zh) 一种知识图谱驱动下区域敏感的兴趣点推荐方法
Zhang et al. Using OpenStreetMap point-of-interest data to model urban change—A feasibility study
Huang et al. Activity patterns, socioeconomic status and urban spatial structure: what can social media data tell us?
Hu et al. A framework for extracting urban functional regions based on multiprototype word embeddings using points-of-interest data
Majid et al. A context-aware personalized travel recommendation system based on geotagged social media data mining
WO2019233258A1 (zh) 信息发送方法、装置、系统和计算机可读存储介质
Xu et al. Topic based context-aware travel recommendation method exploiting geotagged photos
US20150363700A1 (en) Discovering Functional Groups of an Area
Qi et al. Privacy-aware point-of-interest category recommendation in internet of things
Shao et al. Clustering big spatiotemporal-interval data
Le Falher et al. Where is the Soho of Rome? Measures and algorithms for finding similar neighborhoods in cities
Yu et al. Road network generalization considering traffic flow patterns
Xing et al. Points-of-interest recommendation based on convolution matrix factorization
TW201727558A (zh) 地理區域的熱力展現方法和裝置
McArdle et al. Classifying pedestrian movement behaviour from GPS trajectories using visualization and clustering
Yue et al. Detect: Deep trajectory clustering for mobility-behavior analysis
McKitrick et al. Collecting, analyzing, and visualizing location-based social media data: review of methods in GIS-social media analysis
Chehreghan et al. An assessment of spatial similarity degree between polylines on multi-scale, multi-source maps
Ying et al. Semantic trajectory-based high utility item recommendation system
Sun et al. Exploring the urban region-of-interest through the analysis of online map search queries
Psyllidis et al. Regionalization of social interactions and points-of-interest location prediction with geosocial data
Zhu et al. Data integration to create large-scale spatially detailed synthetic populations
Üsküplü et al. Discovering activity patterns in the city by social media network data: a case study of istanbul
Shoman et al. Centrality-based hierarchy for street network generalization in multi-resolution maps
CN115408618A (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant