CN111949885B - 一种面向旅游景点的个性化推荐方法 - Google Patents

一种面向旅游景点的个性化推荐方法 Download PDF

Info

Publication number
CN111949885B
CN111949885B CN202010874707.0A CN202010874707A CN111949885B CN 111949885 B CN111949885 B CN 111949885B CN 202010874707 A CN202010874707 A CN 202010874707A CN 111949885 B CN111949885 B CN 111949885B
Authority
CN
China
Prior art keywords
user
layer
vector
expression vector
representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010874707.0A
Other languages
English (en)
Other versions
CN111949885A (zh
Inventor
古天龙
梁浩宏
宾辰忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN202010874707.0A priority Critical patent/CN111949885B/zh
Publication of CN111949885A publication Critical patent/CN111949885A/zh
Application granted granted Critical
Publication of CN111949885B publication Critical patent/CN111949885B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种面向旅游景点的个性化推荐方法,首先利用原始数据集构建用户知识图谱和景点知识图谱;然后对用户知识图谱进行进行特征学习,得到第一用户表示向量和第一项目表示向量;之后基于第一用户表示向量对景点知识图谱进行特征学习,得到第二用户表示向量和第二项目表示向量;接着将第一用户表示向量和第二用户表示向量组合成最终用户表示向量;并将第二项目表示向量直接作为最终项目表示向量;最后将最终用户表示向量和最终项目表示向量进行深层次的交互,以预测得到用户对景点的偏好概率,从而完成旅游景点的个性化推荐。本发明能够避免陷入单一知识图谱的特征学习,以提高推荐的准确度。

Description

一种面向旅游景点的个性化推荐方法
技术领域
本发明涉及个性化推荐技术领域,具体涉及一种面向旅游景点的个性化推荐方法。
背景技术
伴随着信息技术和互联网行业的发展,特别是电子支付的兴起,用户的选择平台越来越多,旅游,出行预订方式和消费方式也在发生改变。当注重服务的各行业拥抱数字化与智慧科技之后,为了推动行业的数字化升级,各大平台纷纷推出智能解决方案,各大行业的数据量增长非常迅速,信息过载成了人们处理信息的挑战。对于具体用户而言,如何在以指数增长的资源中快速、准确地定位到自己需要的内容是一个非常重要且极具挑战的事情。对于服务提供商而言,如何把恰当的商品及时呈现给用户,从而促进交易量和经济增长,也是一件颇具难度的事情,而个性化推荐的诞生极大地缓解了这个困难。
个性化推荐是指通过挖掘用户在网络上留下的“信息足迹”,采集并分析用户的网络行为与消费偏好,根据不同的推荐算法将精准的、契合度高的内容推荐给用户。个性化推荐算法的产生与发展极大地便利了人们的生产与生活。对于用户而言,不用再为在海量的信息中检索需要的内容而苦恼,对于服务提供商而言能够更好地分析用户的历史行为,为用户提供个性化的决策支持和信息服务。个性化推荐的目标是既满足用户意识到的需求,也能满足用户没有意识到的需求,或意识到,但没有表达出来的需求,让用户超越个体的视野,避免只见树木不见森林。
虽然个性化推荐算法发展至今已经有十多年的历史了,但是科研人员仍不断致力于探索更加高效的推荐算法,但是现在的个性化推荐技术仍有不完善之处,从用户角度来看,应从多角度考虑用户行为信息、细化商品类别、推荐结果更注重时效性、推荐结果质量更高、推荐内容更多样化、预测结果更准确等这几个角度出发。对于面向旅游景点的个性化推荐领域,由于每个用户的偏好不尽相同,每个用户及景点的交互数据并不是很丰富,因此如何精准的把握用户兴趣偏好问题、如何解决数据稀疏问题、如何解决冷启动问题、如何避免推荐景点的单调与重复问题是该领域个性化推荐的难点。
发明内容
本发明提供一种面向旅游景点的个性化推荐方法,通过构建用户知识图谱和景点知识图谱再结合图表示学习的方法来实现对用户的个性化推荐,力求降低用户检索景点信息的难度,为用户推荐最合适的景点。
为解决上述问题,本发明是通过以下技术方案实现的:
一种面向旅游景点的个性化推荐方法,其具体包括步骤如下:
步骤1、从点评网站获取原始数据集,并利用原始数据集构建用户知识图谱和景点知识图谱;
步骤2、将步骤1所构建的用户知识图谱送入到图卷积神经网络中,利用图表示学习的方法对构建的用户知识图谱进行特征学习,得到第一用户表示向量和第一项目表示向量;
步骤3、将步骤1所构建的景点知识图谱和第一用户表示向量送入到图卷积神经网络中,利用图表示学习的方法对构建的景点知识图谱进行特征学习,得到第二用户表示向量和第二项目表示向量;
步骤4、将步骤2所得到的第一用户表示向量和步骤3所得到的第二用户表示向量组合成最终用户表示向量;同时将步骤3所得到的第二项目表示向量直接作为最终项目表示向量;
步骤5、利用多层前馈神经网络对步骤4所得到的最终用户表示向量和最终项目表示向量进行深层次的交互,在细粒度上捕获用户的个性化偏好,以预测得到用户对景点的偏好概率;
步骤6、对于待推荐用户,将该用户对景点的偏好概率从大到小排序,并取前k个偏好概率较大的景点作为该用户的景点推荐列表,其中k为预设推荐景点的个数。
上述步骤1中,用户知识图谱和景点知识图谱为采用RDF的形式表示的知识图谱。
上述步骤4中,第一用户表示向量和第二用户表示向量采用二者加权和的方式组合成最终用户表示向量,或者第一用户表示向量和第二用户表示向量采用二者的加权拼接的方式组合成最终用户表示向量。
与现有技术相比,本发明具有如下特点:
1、本发明引入了用户和景点知识图谱作为辅助信息,它包含了实体(项或项属性)之间丰富的语义关联信息,能够很好的解决数据稀疏问题,与其他类型的辅助信息相比,引入知识图谱可以使推荐效果具有以下优势:准确性,知识图谱为用户和景点引入了更多的语义关系,能够深入挖掘用户的偏好;多样性,知识图谱提供了不同类型的连接,有利于推荐结果的发散,避免了将推荐结果限制为单一类型;可解释性,知识图谱可以将用户的交互历史和推荐结果联系起来,从而提高用户对推荐结果的接受度和满意度,增强用户对推荐结果的信任度。
2、本发明设计了一个模型很好地结合了用户知识图谱学习和景点知识图谱学习,用基于图卷积神经网络的方法从用户知识图谱学习用户表示向量,再将用户表示向量引入景点知识图谱中联合学习得到景点表示向量,实现了用户知识图谱和景点知识图谱的无缝统一。
3、本发明使用目前最流行的图表示学习的方法GCN将知识图谱中的三元组向量化,由于图卷积神经网络在学习高阶图的目标节点表示方面显示出巨大优势,该方法不仅保留原来数据的特征,还极大地简化了计算,有效地挖掘KG中的高阶结构信息和语义信息来捕获用户的个性化偏好,较好地与景点推荐系统进行融合。
4、本发明使用了深度学习技术来提升表征学习能力。深度神经网络的优势在于其强大的表征学习能力。利用深度学习技术从用户和景点表示向量中学习出有效的隐因子特征表示,为了尽量提高模型的准确性,研究者往往会使用丰富的、甚至异构的内容数据。这些特征从不同的维度展现了不同的信息,而且特征间的组合通常是非常有意义的。传统的交叉特征是由工程师手动设计的,这有很大的局限性,成本很高,并且不能拓展到未曾出现过的交叉模式中。用神经网络自动学习高阶的特征交互模式,弥补了人工特征工程带来的种种局限性。
附图说明
图1为一种面向旅游景点的个性化推荐方法的流程图。
图2为用户知识图谱示例图。
图3为景点知识图谱示例图。
图4为面向旅游景点的个性化推荐方法的整体模型图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实例,并参照附图,对本发明进一步详细说明。
参见图1,一种面向旅游景点的个性化推荐方法,具体包括以下步骤:
步骤1:从点评网站中获取原始数据集,并对原始数据集进行处理后,构建用户知识图谱和景点知识图谱。
从最大点评网站下载原始数据集,由于原始数据集庞大且内容复杂,其中包含很多空值字符串以及无法识别的乱码数据,这些都需要进行处理,先将原始JSON数据通过大数据框架MapReduce提取相应字段及字段值,然后将预处理好的数据导入分布式文件存储系统HDFS中,搭建大数据集群环境来部署相应的任务节点,通过分析数据的结构特点做数据清洗,形成最终的数据集文件。处理好的原始数据集包含多个用户对多景点的评级数据、景点数据信息及用户属性信息。
知识图谱(Knowledge Graph,KG)本质上是一个以实体ε为节点,边R表示其关系的大型有向语义网络,其目的是描述客观世界的概念实体事件及其之间的关系。本发明采用RDF的形式表示知识图谱,RDF是知识图谱的一种常见表示形式,它是一个三元组的集合,每个三元组表示存在一个关系r从头实体eh指向尾实体et,其中实体代表实体对象(对象的属性值),关系代表实体对象之间的关系(对象的属性)。
在本发明中,将用户属性值作为节点,将用户属性作为边,构建用户知识图谱kgU={(eh,et,ru)|eh,et∈εu,ru∈Ru},如图2所示。将景点属性值作为节点,将景点属性作为边,构建景点知识图谱
Figure BDA0002652278180000048
如图3所示。对于每个用户u∈U或者景点i∈I,在各自对应的知识图谱中都有与之对应的实体eu∈εU或者ei∈εI。在用户知识图谱中,ru表示用户KG中实体之间的关系(属性),总共14种关系:年龄、性别、职业、所在地邮编等。在景点知识图谱中,ri表示景点KG中实体之间的关系(属性),总共32种关系:景点的类型、最佳游览时间、消费价格/等级、地理位置等属性信息。
步骤2:将步骤1所构建的用户知识图谱和景点知识图谱分别送入到图卷积神经网络中,利用图表示学习的方法对构建的用户知识图谱和景点知识图谱进行特征学习,分别得到用户表示向量和景点表示向量。
本发明采用图卷积神经网络(Graph Convolution Neural Network,GCN)学习用户和景点的表示向量,引入图表示学习的方法处理推荐系统中知识图谱的相关信息,有助于增强个性化推荐的学习能力,实现更加精准的个性化偏好建模,从而提高推荐的准确度和用户满意度。
Figure BDA0002652278180000041
表示用户集合,用
Figure BDA0002652278180000042
表示景点集合,其中M=|U|和N=|I|分别表示用户和景点的个数,一个用户交互过的景点集合用C={(ul,i1),(ul,i2),...,(ul,i|ul|)},l∈{0,1,2,...,M}表示,其中ul<<N表示该用户行为序列中交互过的景点个数,用
Figure BDA0002652278180000043
表示用户-景点交互矩阵,每个用户-景点交互对用(ul,ij)∈X,l∈{0,1,2,...,M},j∈{0,1,2,...,N}表示,上述ul∈U,ij∈I,本发明使用0-1隐式反馈数据作为交互标签,如果用户和景点之间的存在交互则定义
Figure BDA0002652278180000044
否则
Figure BDA0002652278180000045
在许多推荐领域的研究工作中,基本的输入通常是一个非常稀疏的0-1矩阵,但随着用户(项目)的数量急剧增加,用户(项目)表示向量的维度也会成比例的增加,所以典型的one-hot表示向量会造成维数灾难。在本发明引入了两个低维特征矩阵
Figure BDA0002652278180000046
Figure BDA0002652278180000047
替换传统的0-1特征矩阵,用来保存M个用户和N个项目的表示向量,du和di属于模型超参数,分别表示用户表示向量的维度和项目表示向量的维度。用户的特征矩阵和项目的特征矩阵随着模型进行端到端训练,矩阵的起始状态采用高斯分布随机初始化。由于每个用户和项目都有唯一标识符,标识符与矩阵的索引一一对应,根据标识符可以快速地在特征矩阵中找出对应的表示向量。例如某用户ul的标识符是l,某项目ij的标识符是j,那么用户的特征矩阵EU中第l列和项目的特征矩阵EI中第j列分别代表用户表示向量ul和项目表示向量ij,本发明采用一系列的用户-项目交互对(ul,ij)∈X作为模型的输入。
由于本发明只关注学习用户表示向量和项目表示,所以忽略实体之间的关系向量。在构建了用户知识图谱后,把用户知识图谱当作一个无向图,给定一对待训练的用户-景点交互对(ul,ij):
1)用户知识图谱学习(UEK):
在UEK部分,如图4组合层的上半部分所示,它描绘了给定待训练用户-景点交互对(ul,ij)中用户实体的两层邻居示例,也即局部感受野的范围。首先通过用户的特征矩阵EU得到用户的初始表示向量ul,再从目标用户ul的邻域中进行邻居采样作为这一层的接收域,用Νh(ul)表示用户ul在用户知识图谱中第h∈[1,H]层的邻居集合,通过图卷积神经网络从第1层到第H层逐层聚合邻居信息来计算该用户的表示向量,随着训练的迭代不断更新用户的表示和模型的参数。目标用户ul经过h层图卷积之后的表示向量为:
Figure BDA0002652278180000051
本发明采用非线性修正函数ReLU作为图卷积神经网络的激活函数,ReLU(x)=max(0,x),公式(1)中[;]表示向量的拼接操作,
Figure BDA0002652278180000052
表示目标用户ul的第h层邻居的共享权重转换矩阵,
Figure BDA0002652278180000053
表示目标用户ul第h-1层邻居的聚合表示向量,为了实现邻域中的每个邻居置换不变性,这里使用元素加权平均聚合器aggregator来聚合每层的邻居信息,每层邻居信息的聚合计算公式为:
Figure BDA0002652278180000054
Figure BDA0002652278180000055
公式(3)中sigmoid函数定义为σ(x)=1/(1+exp(-x)),
Figure BDA0002652278180000056
表示第h层邻居信息聚合器的权重矩阵,它在第h层的所有邻居上共享,MEAN(·)表示参数集合中每个向量累和的平均值。
将用户知识图谱送入到UEK后,最终的输出是第一用户表示向量u和第一项目表示向量i。
2)景点知识图谱学习(IEK):
在IEK部分,如图4组合层的下半部分所示,它描绘了给定待训练用户-景点交互对(ul,ij)中ij的一层邻居示例,(ul,ij)与UEK部分给出的用户-景点交互对是相同的。虽然两部分都是使用图卷积神经网络来学习用户和景点的表示向量,但二者的区别在于学习景点的表示过程中引入了用户表示向量,并根据用户ul对景点ij与其邻居之间关系的偏好程度来聚合ij的邻居信息,从而考虑了用户与景点之间的关联性,本发明使用Nh(ij)表示第h层与实体ij直接相连的邻居集合,
Figure BDA0002652278180000057
表示第h层实体ij与每个邻居i∈Nh(ij)之间的关系,
Figure BDA0002652278180000058
表示关系
Figure BDA0002652278180000059
对ul的重要程度。
Figure BDA00026522781800000510
由函数
Figure BDA00026522781800000511
计算得到,为了简单起见直接采用内积计算方式:
Figure BDA00026522781800000512
公式(4)中
Figure BDA00026522781800000513
是从UEK部分学到的ul表示向量,
Figure BDA00026522781800000514
是每个实体之间关系的表示向量。这样做的好处是我们使用能够捕获用户个人画像的表示向量来计算对关系的偏好程度,从而进一步挖掘用户的潜在兴趣和动机。在景点推荐场景中,用户喜欢某处景点可能是喜欢这个景点中的“价格”或景点的“星级”,我们认为通过计算用户对景点属性的得分,可以得到聚合每个景点邻居信息的权重。但这里有个问题,如果用户的表示向量起始状态是随机初始化的,则会导致计算分数的不确定性,在现实场景中,每个用户都包含许多属性信息,如性别、年龄、职业等,这些属性信息构成了用户的个人画像,由于每个用户的画像不同会导致用户对电影偏好的动机不同,例如,用户A和用户B对同一景点的评分都是5分,用户A可能喜欢景点的类型,那么用户A对“景点类型”关系计算的分数将明显高于其他关系计算的分数;用户B可能喜欢景点的价格,那么用户B对“价格”关系计算的分数将明显高于其他关系计算的分数,虽然这两个用户对该景点的评分相同,但能更准确地挖掘用户潜在的个性化偏好。
在计算了用户ul与各关系的得分后,利用计算出的得分对
Figure BDA0002652278180000061
的邻居进行线性组合,同样采用多层聚合的方式来学习景点实体的表示向量,每层邻居的采样策略和UEK部分相同。第h∈[1,H]层邻居的聚合表示向量
Figure BDA0002652278180000062
的计算公式为:
Figure BDA0002652278180000063
Figure BDA0002652278180000064
公式(5)中的e表示ij在第h层的每个邻居向量,
Figure BDA0002652278180000065
表示经过softmax函数规范化的用户-关系得分。类似地,本发明使用另一组转换和权重矩阵生成目标实体的第h层表示向量:
Figure BDA0002652278180000066
将用户知识图谱送入到IEK后,最终的输出是第二用户表示向量u′和第二项目表示向量i′。
步骤3:采用多层感知器(Multi-Layer Perceptron,MLP)技术,即用多层前馈神经网络对最终用户表示向量和最终项目表示向量进行深层次的交互,在细粒度上捕获用户的个性化偏好,以提高推荐的准确性并最终预测得到用户对景点的偏好概率。
如图4的组合层(Combining Layer)所示,是结合用户知识图谱学习和景点知识图谱学习的关键部分。组合层在给定的形式化输入下共同训练了用户知识图谱和景点知识图谱。
对于最终用户表示向量Zu:采用二者加权和的方式或二者的加权拼接的方式将第一用户表示向量u和第二用户表示向量u′组合成最终用户表示向量Zu
Zu=θu+(1-θ)u′ or Zu=[θu;(1-θ)u′] (8)
公式(8)中的θ是一个可调参数来控制u和u′的比重
对于最终项目表示向量Zi:直接将所得到的第二项目表示向量i′作为最终项目表示向量Zi
通过引入从用户端知识图谱中学到的用户表示向量来计算用户对项目实体之间关系的偏好程度,并以此作为权重来聚合项目邻居的特征信息,从而考虑了目标用户与项目之间的相互影响。UEK和IEK部分都能够提取用户特征,将UEK和IEK学到的用户特征进行组合是为了平滑二者对整体模型的影响以避免陷入单一知识图谱的特征学习。
得到用户和景点的最终表示向量之后,使用多层前馈神经网络对用户和景点之间的交互作用进行更深层次的建模。上述的用户和景点表示向量合为一个表示向量后将其输入到含有多个前馈神经网络的偏好层P:
pq(z)=ReLU(Wqpq-1(z)+bq),q∈[1,Q] (9)
公式(9)中偏好层P的隐含层数为Q,将P中第q层隐含层定义为pq(z),将p0(z)=z=[Zu;Zi]作为整个神经网络的输入层,Wq和bq分别为第q层的权重矩阵和偏置向量,最后利用P层顶部的sigmoid层产生概率来表示用户对景点的偏好程度
Figure BDA0002652278180000076
Figure BDA0002652278180000077
公式(10)中的ωQ+1表示最后一层的权重向量。为了使每一批训练样本的计算模式固定并且更高效,在保持经典梯度下降法(GD)的稳定下降特性和随机梯度下降(SGD)的随机特性的同时,本发明使用小批量梯度下降法(mini-batch SGD)来更新模型参数,模型最小化的损失函数如下:
Figure BDA0002652278180000073
公式(11)中L表示sigmoid交叉熵损失函数,y表示训练样本的标签集,
Figure BDA0002652278180000074
Figure BDA0002652278180000075
分别代表正、负用户-景点交互对集合,公式(11)中的最后一项为L2正则化项以避免出现过拟合现象。
步骤4:对于待推荐用户,将该用户对各景点的偏好概率从大到小排序,并取偏好概率排在前k位的景点作为该用户的景点推荐列表,其中k为预设推荐景点的个数。
需要说明的是,尽管以上本发明所述的实施例是说明性的,但这并非是对本发明的限制,因此本发明并不局限于上述具体实施方式中。在不脱离本发明原理的情况下,凡是本领域技术人员在本发明的启示下获得的其它实施方式,均视为在本发明的保护之内。

Claims (3)

1.一种面向旅游景点的个性化推荐方法,其特征是,其具体包括步骤如下:
步骤1、获取原始数据集,并利用原始数据集构建用户知识图谱和景点知识图谱;
步骤2、将步骤1所构建的用户知识图谱送入到图卷积神经网络中,利用图表示学习的方法对构建的用户知识图谱进行特征学习,得到第一用户表示向量;
在用户知识图谱学习UEK部分,它描绘了给定待训练用户-景点交互对(ul,ij)中用户实体的两层邻居示例,也即局部感受野的范围;首先通过用户的特征矩阵EU得到用户的初始表示向量ul,再从目标用户ul的邻域中进行邻居采样作为这一层的接收域,用Nh(ul)表示用户ul在用户知识图谱中第h∈[1,H]层的邻居集合,通过图卷积神经网络从第1层到第H层逐层聚合邻居信息来计算该用户的表示向量,随着训练的迭代不断更新用户的表示和模型的参数;目标用户ul经过h层图卷积之后的表示向量为:
Figure FDA0003540896360000011
采用非线性修正函数ReLU作为图卷积神经网络的激活函数,ReLU(x)=max(0,x),公式(1)中[;]表示向量的拼接操作,
Figure FDA0003540896360000012
表示目标用户ul的第h层邻居的共享权重转换矩阵,
Figure FDA0003540896360000013
表示目标用户ul第h-1层邻居的聚合表示向量,为了实现邻域中的每个邻居置换不变性,这里使用元素加权平均聚合器aggregator来聚合每层的邻居信息,每层邻居信息的聚合计算公式为:
Figure FDA0003540896360000014
Figure FDA0003540896360000015
公式(3)中sigmoid函数定义为σ(x)=1/(1+exp(-x)),
Figure FDA0003540896360000016
表示第h层邻居信息聚合器的权重矩阵,它在第h层的所有邻居上共享,MEAN(·)表示参数集合中每个向量累和的平均值;
将用户知识图谱送入到用户知识图谱学习UEK后,最终的输出是第一用户表示向量u;
步骤3、将步骤1所构建的景点知识图谱和步骤2所得到的第一用户表示向量同时送入到图卷积神经网络中,利用图表示学习的方法对构建的景点知识图谱进行特征学习,得到第二用户表示向量和第二项目表示向量;
在景点知识图谱学习IEK部分,它描绘了给定待训练用户-景点交互对(ul,ij)中ij的一层邻居示例,(ul,ij)与UEK部分给出的用户-景点交互对是相同的;学习景点的表示过程中引入了用户表示向量,并根据用户ul对景点ij与其邻居之间关系的偏好程度来聚合ij的邻居信息,从而考虑了用户与景点之间的关联性,使用Nh(ij)表示第h层与实体ij直接相连的邻居集合,
Figure FDA0003540896360000017
表示第h层实体ij与每个邻居i∈Nh(ij)之间的关系,
Figure FDA0003540896360000021
表示关系
Figure FDA0003540896360000022
对ul的重要程度;
Figure FDA0003540896360000023
由函数
Figure FDA0003540896360000024
计算得到,为了简单起见直接采用内积计算方式:
Figure FDA0003540896360000025
公式(4)中
Figure FDA0003540896360000026
是从UEK部分学到的ul的表示向量,
Figure FDA0003540896360000027
是每个实体之间关系的表示向量;
在计算了用户ul与各关系的得分后,利用计算出的得分对
Figure FDA0003540896360000028
的邻居进行线性组合,同样采用多层聚合的方式来学习景点实体的表示向量,每层邻居的采样策略和用户知识图谱学习UEK部分相同;第h∈[1,H]层邻居的聚合表示向量
Figure FDA0003540896360000029
的计算公式为:
Figure FDA00035408963600000210
Figure FDA00035408963600000211
公式(5)中的e表示ij在第h层的每个邻居向量,
Figure FDA00035408963600000212
表示经过softmax函数规范化的用户-关系得分;使用另一组转换和权重矩阵生成目标实体的第h层表示向量:
Figure FDA00035408963600000213
将用户知识图谱送入到景点知识图谱学习IEK后,最终的输出是第二用户表示向量u′和第二项目表示向量i′;
步骤4、将步骤2所得到的第一用户表示向量和步骤3所得到的第二用户表示向量组合成最终用户表示向量Zu;同时将步骤3所得到的第二项目表示向量直接作为最终项目表示向量Zi
步骤5、利用多层前馈神经网络对步骤4所得到的最终用户表示向量和最终项目表示向量进行深层次的交互,在细粒度上捕获用户的个性化偏好,即将最终用户表示向量和最终项目表示向量合为一个表示向量后将其输入到含有多个前馈神经网络的偏好层P:
pq(z)=ReLU(Wqpq-1(z)+bq),q∈[1,Q] (8)
公式(8)中偏好层P的隐含层数为Q,将P中第q层隐含层定义为pq(z),将p0(z)=z=[Zu;Zi]作为整个神经网络的输入层,Wq和bq分别为第q层的权重矩阵和偏置向量,最后利用P层顶部的sigmoid层产生概率来表示用户对景点的偏好程度
Figure FDA00035408963600000216
Figure FDA00035408963600000215
公式(9)中的ωQ+1表示最后一层的权重向量;
以预测得到用户对景点的偏好概率;
步骤6、对于待推荐用户,将该用户对景点的偏好概率从大到小排序,并取前k个偏好概率较大的景点作为该用户的景点推荐列表,其中k为预设推荐景点的个数。
2.根据权利要求1所述的一种面向旅游景点的个性化推荐方法,其特征是,步骤1中,用户知识图谱和景点知识图谱为采用RDF的形式表示的知识图谱。
3.根据权利要求1所述的一种面向旅游景点的个性化推荐方法,其特征是,步骤4中,第一用户表示向量和第二用户表示向量采用二者加权和的方式组合成最终用户表示向量,或者第一用户表示向量和第二用户表示向量采用二者的加权拼接的方式组合成最终用户表示向量。
CN202010874707.0A 2020-08-27 2020-08-27 一种面向旅游景点的个性化推荐方法 Active CN111949885B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010874707.0A CN111949885B (zh) 2020-08-27 2020-08-27 一种面向旅游景点的个性化推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010874707.0A CN111949885B (zh) 2020-08-27 2020-08-27 一种面向旅游景点的个性化推荐方法

Publications (2)

Publication Number Publication Date
CN111949885A CN111949885A (zh) 2020-11-17
CN111949885B true CN111949885B (zh) 2022-05-03

Family

ID=73366633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010874707.0A Active CN111949885B (zh) 2020-08-27 2020-08-27 一种面向旅游景点的个性化推荐方法

Country Status (1)

Country Link
CN (1) CN111949885B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765490A (zh) * 2021-01-28 2021-05-07 重庆兆光科技股份有限公司 一种基于知识图谱和图卷积网络的信息推荐方法及系统
CN112801751B (zh) * 2021-02-04 2022-12-23 重庆邮电大学 一种多任务图神经网络的个性化景区推荐方法
CN113449201A (zh) * 2021-06-22 2021-09-28 上海明略人工智能(集团)有限公司 跨会话推荐方法、系统、存储介质及电子设备
CN113505311B (zh) * 2021-07-12 2022-03-11 中国科学院地理科学与资源研究所 一种可根据“潜在语义空间”的旅游景点交互推荐方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103888785A (zh) * 2014-03-10 2014-06-25 百度在线网络技术(北京)有限公司 信息的提供方法和装置
CN107729444B (zh) * 2017-09-30 2021-01-12 桂林电子科技大学 一种基于知识图谱的个性化旅游景点推荐方法
CN108920527A (zh) * 2018-06-07 2018-11-30 桂林电子科技大学 一种基于知识图谱的个性化推荐方法
CN109189944A (zh) * 2018-09-27 2019-01-11 桂林电子科技大学 基于用户正负反馈画像编码的个性化景点推荐方法及系统
CN109977283B (zh) * 2019-03-14 2021-03-05 中国人民大学 一种基于知识图谱和用户足迹的旅游推荐方法和系统
CN110297964A (zh) * 2019-03-28 2019-10-01 特斯联(北京)科技有限公司 一种基于大数据分析的旅游景点推荐方法及装置
CN110288436A (zh) * 2019-06-19 2019-09-27 桂林电子科技大学 一种基于游客偏好建模的个性化景点推荐方法
CN110287336B (zh) * 2019-06-19 2021-08-27 桂林电子科技大学 一种面向旅游景点推荐的游客画像构建方法
CN110489547A (zh) * 2019-07-11 2019-11-22 桂林电子科技大学 一种基于混合式监督学习的旅游景点推荐方法及装置
CN110555112B (zh) * 2019-08-22 2022-07-15 桂林电子科技大学 一种基于用户正负偏好学习的兴趣点推荐方法
CN111143705B (zh) * 2019-12-26 2021-05-28 北京工业大学 一种基于图卷积网络的推荐方法

Also Published As

Publication number Publication date
CN111949885A (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
CN111949885B (zh) 一种面向旅游景点的个性化推荐方法
CN109299396B (zh) 融合注意力模型的卷积神经网络协同过滤推荐方法及系统
CN108804689B (zh) 面向问答平台的融合用户隐连接关系的标签推荐方法
CN108829763B (zh) 一种基于深度神经网络的影评网站用户的属性预测方法
CN111563164B (zh) 一种基于图神经网络的特定目标情感分类方法
Forouzandeh et al. Presentation a Trust Walker for rating prediction in recommender system with Biased Random Walk: Effects of H-index centrality, similarity in items and friends
CN111881342A (zh) 一种基于图孪生网络的推荐方法
CN111125530B (zh) 一种基于多类型特征深度学习的信息流推荐方法
Moscato et al. A survey about community detection over On-line Social and Heterogeneous Information Networks
Tian et al. Evolutionary programming based deep learning feature selection and network construction for visual data classification
CN111143705B (zh) 一种基于图卷积网络的推荐方法
CN111881363A (zh) 一种基于图交互网络的推荐方法
Bagavathi et al. Multi-Net: a scalable multiplex network embedding framework
Navgaran et al. Evolutionary based matrix factorization method for collaborative filtering systems
CN110866145A (zh) 一种共同偏好辅助的深度单类协同过滤推荐方法
Alshmrany Adaptive learning style prediction in e-learning environment using levy flight distribution based CNN model
WO2022218139A1 (zh) 融合注意力机制的个性化搜索方法和搜索系统
CN113806630A (zh) 基于注意力的多视角特征融合跨域推荐方法及装置
Song et al. Coarse-to-fine: A dual-view attention network for click-through rate prediction
Nasiri et al. A node representation learning approach for link prediction in social networks using game theory and K-core decomposition
CN115270007A (zh) 一种基于混合图神经网络的poi推荐方法及系统
CN117216281A (zh) 一种基于知识图谱的用户兴趣扩散推荐方法及系统
Chen et al. Poverty/investment slow distribution effect analysis based on Hopfield neural network
CN117251586A (zh) 多媒体资源推荐方法、装置及存储介质
CN116304370A (zh) 一种基于逻辑盒嵌入推理的协同过滤方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant