CN110489547A - 一种基于混合式监督学习的旅游景点推荐方法及装置 - Google Patents
一种基于混合式监督学习的旅游景点推荐方法及装置 Download PDFInfo
- Publication number
- CN110489547A CN110489547A CN201910623885.3A CN201910623885A CN110489547A CN 110489547 A CN110489547 A CN 110489547A CN 201910623885 A CN201910623885 A CN 201910623885A CN 110489547 A CN110489547 A CN 110489547A
- Authority
- CN
- China
- Prior art keywords
- sight spot
- vector
- tourist
- sight
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/358—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Animal Behavior & Ethology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种基于混合式监督学习的旅游景点推荐方法,包括:获取游客历史游览数据;构建景点知识图谱;对景点知识图谱根据景点的属性类别进行相应的属性子图抽取;生成景点序列;对景点序列进行训练将景点序列映射到低维向量空间中,生成特征向量;对每个景点在不同属性下的向量进行相加平均得到每个景点的融合语义特征向量;学习游客向量和景点潜在向量;将所述游客向量和融合语义特征通过矩阵分解得到第一交互向量;利用多层感知机得到游客向量和景点潜在向量的第二交互向量;将第一交互向量与第二交互向量拼接并做归一化处理得到游客对景点的评分;将游客对景点的评分从高到低排序,取前K个分数最高对应的景点,得到top_k景点推荐列表。
Description
技术领域
本发明涉及机器学习、知识图谱以及智能推荐等技术领域,具体是涉及一种基于混合式监督学习的旅游景点推荐方法及装置。
背景技术
根据中国旅游局相关数据可知,近年来,中国人民出行旅游次数逐年上涨。人民对于个性化旅游推荐的需求变得越来越大。推荐系统的目的旨在根据用户的偏好以及商品的特征帮助用户推荐其可能喜欢的商品,进而提高推荐效率和用户满意度。传统的推荐系统虽然能够给用户提供一些推荐,但用户在海量的旅游信息推荐面前,反而难以做出抉择。因此,一个能够根据用户画像以及历史游玩信息做出准确推荐的旅游推荐系统显得至关重要。
根据以往的推荐系统研究,大致可以分为两类,一类是无监督式学习,如基于Word2vec,TransE,这类方法无标签,推荐的结果准确率不高。一类是有监督式学习,如基于深度学习做推荐,这类方法学习到的项目向量包含的语义信息不全,可解释性低,交互矩阵数据稀疏。
目前,NCF(神经协同过滤)在电影推荐方面达到了不错的效果,但是它采用one-hot编码,假设词语之间是相关独立的,但通常情况下,电影与电影之间是相互影响;其次在数据量的较多情况下会造成数据矩阵稀疏和维度爆炸。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于混合式监督学习的旅游景点推荐方法及装置,以解决目前深度学习中推荐精度不高和推荐结果个性化程度低等问题。
为实现上述目的及其他相关目的,本发明提供一种基于混合式监督学习的旅游景点推荐方法,该推荐方法包括:
获取游客历史游览数据,包括景点以及各个景点的景点属性值;
为所有景点以及景点属性值设置一个唯一的id编码;
将景点及景点属性值转化为三元组,构建景点知识图谱并可视化;
对所述景点知识图谱根据景点的属性类别进行相应的属性子图抽取;
利用随机游走方法根据景点知识图谱中的每种属性子图生成景点序列,所述景点序列中的元素包括景点实体、属性和景点属性值;
利用神经网络语言模型对所述景点序列进行训练将所述景点序列映射到低维向量空间中,将景点实体和景点属性值转化成特征向量;
对每个景点在不同属性下的向量进行相加平均得到每个景点的融合语义特征向量;
通过神经网络学习游客向量和景点潜在向量;
将所述游客向量和融合语义向量通过矩阵分解得到第一交互向量;
利用多层感知机得到游客向量和潜在向量的第二交互向量;
将所述第一交互向量与所述第二交互向量拼接并做归一化处理得到游客对景点的评分;
将游客对景点的评分从高到低排序,取前K个分数最高对应的景点,得到top_k景点推荐列表。
可选地,该方法还包括对所述历史游览数据进行去重和实体消岐。
可选地,将历史游览数据中的景点属性值按照区间划分。
可选地,所述特征向量通过以下方式得到:
在所述景点知识图谱中取景点实体ID和景点属性值ID;
针对每个景点知识图谱中的每种属性子图通过带偏置的随机游走策略生景点序列;
利用神经网络语言模型Word2Vec将景点序列映射到低维空间将每个景点的景点实体和景点属性值转化成特征向量。
为实现上述目的及其他相关目的,本发明还提供一种基于混合式监督学习的旅游景点推荐装置,该推荐装置包括:
数据获取模块,用于获取游客历史游览数据,包括景点以及各个景点的景点属性值;
编码模块,用于为所有景点以及景点属性值设置一个唯一的id编码;
可视化模块,用于将景点及景点属性值转化为三元组,构建景点知识图谱并可视化;
抽取模块,用于对所述景点知识图谱根据景点的属性类别进行相应的属性子图抽取;
景点序列生成模块,用于利用随机游走方法根据景点知识图谱中的每种属性子图生成景点序列,所述景点序列中的元素包括景点实体、属性和景点属性值;
向量化模块,用于利用神经网络语言模型对所述景点序列进行训练将所述景点序列映射到低维向量空间中,将景点实体和景点属性值转化成特征向量;
融合模块,用于对每个景点在不同属性下的向量进行相加平均得到每个景点的融合语义特征向量;
第一学习模块,用于通过神经网络学习游客向量和景点潜在向量;
分解模块,用于将所述游客向量和融合语义向量通过矩阵分解得到第一交互向量;
第二学习模块,用于利用多层感知机得到游客向量和潜在向量的第二交互向量;
拼接模块,用于将所述第一交互向量与所述第二交互向量拼接并做归一化处理得到游客对景点的评分;
排序模块,用于将游客对景点的评分从高到低排序,取前K个分数最高对应的景点,得到top_k景点推荐列表。
可选地,该装置还包括预处理模块,用于对所述历史游览数据进行去重和实体消岐。
可选地,该装置还包括区间划分模块,用于将历史游览数据中的景点属性值按照区间划分。
可选地,所述特征向量通过以下方式得到:
在所述景点知识图谱中取景点实体ID和景点属性值ID;
针对每个景点知识图谱中的每种属性子图通过带偏置的随机游走策略生景点序列;
利用神经网络语言模型Word2Vec将景点序列映射到低维空间将每个景点的景点实体和景点属性值转化成特征向量。
为实现上述目的及其他相关目的,本发明还提供一种电子终端,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器存储的计算机程序,以使所述设备执行所述的推荐方法。
为实现上述目的及其他相关目的,本发明还提供一种计算机可读存储介质,存储计算机程序,所述计算机程序被处理器运行时执行所述的推荐方法。
如上所述,本发明的一种基于混合式监督学习的旅游景点推荐方法及装置,具有以下有益效果:
1、以<景点,关系,属性值>三元组为单元构建知识图谱。三元组的使用不仅简化了数据的存储,还保持了景点所具有的属性;知识图谱的使用准确的描述了景点及其属性的关系,使得数据具有可靠性和准确性。
2、本发明将景点按照属性类别分别抽取属性子图,而以往的做法是单独考虑景点。子图抽取保持了景点在不同属性下所具有的语义信息,能够根据游客的不同偏好进行推荐,提高了推荐的个性化服务和用户满意度。
3、本发明在预训练阶段使用网络表示学习中随机游走的方法得到游客潜在游览序列,用神经网络语言模型将景点序列向量化,这为后续神经网络模型提供了较好的输入,提高了推荐的准确度。
4、集合非监督式学习方法和监督式学习方法。利用非监督学习方法获取景点知识图谱中的节点结构和旅游特征语义,同时利用监督式学习方法学习游客访问景点的高级交互特征。
5、本发明同时将深度神经网络和协同过滤方法运用到旅游景点推荐领域,优化了模型的建模能力,提高了推荐的准确度。
附图说明
为了进一步阐述本发明所描述的内容,下面结合附图对本发明的具体实施方式作进一步详细的说明。应当理解,这些附图仅作为典型示例,而不应看作是对本发明的范围的限定。
图1为一种基于混合式监督学习的旅游景点推荐方法的流程图;
图2为随机游走示例图;
图3为景点知识图谱展示图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明以基于知识图谱的旅游景点推荐作为实例描述本发明方法的具体实施过程。其基于混合式监督学习的旅游景点推荐方法框架图如图1所示。具体包括以下步骤:
S1获取游客历史游览数据,包括景点以及各个景点的景点属性值;
S2为所有景点以及景点属性值设置一个唯一的id编码;
S3将景点及景点属性值转化为三元组,构建景点知识图谱并可视化;
S4对所述景点知识图谱根据景点的属性类别进行相应的属性子图抽取;
S5利用随机游走方法根据景点知识图谱中的每种属性子图生成景点序列,所述景点序列中的元素包括景点实体、属性和景点属性值;
S6利用神经网络语言模型对所述景点序列进行训练将所述景点序列映射到低维向量空间中,将景点实体和景点属性值转化成特征向量;
S7对每个景点在不同属性下的特征向量进行相加平均得到每个景点的融合语义向量;
S8通过神经网络学习游客向量和景点潜在向量;
S9将所述游客向量和融合语义向量通过矩阵分解得到第一交互向量;
S10利用多层感知机得到游客向量和景点潜在向量的第二交互向量;
S11将所述第一交互向量与所述第二交互向量拼接并做归一化处理得到游客对景点的评分;
S12将游客对景点的评分从高到低排序,取前K个分数最高对应的景点,得到top_k景点推荐列表。
下面对本实施例中的步骤S1~S12作具体说明。
步骤S1,获取游客历史游览数据,包括景点以及各个景点的景点属性值。
具体地,利用网络爬虫工具从携程、去哪儿、途牛等主流旅游网站爬取游客的历史游览数据,包括景点及景点的景点属性值。如游客小明游览的景点按时间序列为:象山公园→步行街→日月双塔→靖江王府→芦笛岩→漓江竹筏→十里画廊→蝴蝶泉→兴坪古镇→古东瀑布→独秀峰。以景点象山公园为例,地理位置:桂林市象山区,门票价格:54元,景点等级:5A级,适宜游玩的季节:春季,夏季,秋季,景点类型:公园,自然风光。
由于爬取的游客历史游览数据不能够直接使用,需要对数据进行预处理。首先对景点数据去重和实体消岐。具体为象鼻山景区和象山公园代指同一个景点,那么处理时将二者视为同一个景点。
由于景点属性值分为离散数据和连续数据,为方便后续计算和使用,将历史游览数据中的景点属性值按照区间划分。其中,以景点门票价格为例,分为免费的,20元,30元,50元,80元,100元等不同金额,按照区间{(0),(0-30),(30-60),(60-80),(80-100),(大于100)}划分等级。
步骤S2,为所有景点以及景点属性值设置一个唯一的id编码。具体涉及到游客ID、景点ID、景点属性ID、景点属性值ID。其中,游客ID表存储的是用户名称和对应的ID值,景点ID表存储的是景点名称和对应的ID值,景点属性ID表存储的是属性名称和对应的ID值,景点属性值ID表存储的是景点的所有属性值名称和所对应的ID值。如游客1的账号名acdsa,将此游客标记ID为1,游客2的账号名小明,将此游客标记ID为2,以此类推。其他数据处理方式亦同。
步骤S3、将景点及景点属性值转化为三元组,构建景点知识图谱并可视化;其中三元组表示为(h,r,t),其中h是景点实体,r是属性,t是景点属性值,例如:象山公园景区位于桂林市象山区”,则可以用三元组<象山公园,景点位置,桂林市象山区>表示,其中“象山公园”为景点实体,“景点位置”为三元组的关系属性,“桂林市象山区”为景点的属性。使用Neo4j数据库将构造好的三元组进行存储。使用这样的表示方法,可以有效的描述景点的特征,满足用户对景点属性特征的个性化的需求。三元组的景点实体和景点属性值表示为结点,边表示节点之间的关系。根据编码好ID,利用Neo4j构建旅游景点知识图谱,并可视化。图3为构建好的部分景点知识图谱可视化图。
步骤S4对所述景点知识图谱根据景点的属性类别进行相应的属性子图抽取;
步骤S5利用随机游走方法根据景点知识图谱中的每种属性子图生成景点序列,所述景点序列中的元素包括景点实体、属性和景点属性值;
步骤S6利用神经网络语言模型对所述景点序列进行训练将所述景点序列映射到低维向量空间中,将景点实体和景点属性值转化成特征向量;其中,特征向量通过以下方式得到:
步骤S61、在所述景点知识图谱中取景点实体ID和景点属性值ID;
步骤S62、针对每个景点属性子图通过带偏置的随机游走策略生长度为L的景点序列S=[u1,u2...un]。每次随机选一个源节点u,uj表示游走过程中第j个节点,初始节点u0=u。节点uj由以下的概率分布生成:
其中D表示知识图谱中边的集合,πvx是节点v和x之间的转移概率,Z是一个正则化参数,在具体的实验中Z=1。随机游走遍历了边(t,v),并停留在节点v。通过计算边(v,x)上的转移概率πvx来判断序列中的下一个节点。计算公式如下:
πvx=α(t,x)*wvx (2)
其中wvx是边上的权重(没有权重时默认为1),α表示节点之间的边上的偏执。计算如下:
其中dtx属于(0,1,2)表示节点t和x之间的最小跳数。dtx=0表示x就是t本身,dtx=1表示x为x1或者x3,dtx=2表示x为x2,p和q是两个监督随机游走的参数。
参数p可以控制重新访问当前节点的可能性。将p设置为较大的值(>max(q,1))可以确保在后续采样过程中不会对已经访问的节点进行采样(除非下一个节点没有其它的邻居节点)。如果将p设置为较小的值(<min(q,1)),算法将会回退一步,这将使得采样的节点靠近初始结点t。
参数q允许在当前节点周围或者远离当前节点采样。如果q>1,随机游走采样的序列将靠近节点t,这样随机游走采集到的景点序列和广度优先类似。相反如果q<1,随机游走采样的节点将逐渐远离节点t,这样采集到的景点序列和深度优先类似。通过设置合适的参数q可以使得采样在深度优先和广度优先之间达到平衡。当p=q=1时,相当于传统的DeepWalk。
步骤S63、利用神经网络语言模型对所述景点序列进行训练将所述景点序列映射到低维向量空间中,将景点实体和景点属性值转化成特征向量。
S7对每个景点在不同属性下的向量进行相加平均得到每个景点的融合语义向量;
基于神经网络语言模型的目标函数通常取为如下对数似然函数:
其中N表示当前序列中节点的个数,表示一个特征向量,由目标节点uj的上下文节点组成。
通过Node2Vec训练后的特征向量,具有相似结构和相同属性的景点的语义值比较相似。例如七星公园和象鼻山公园的旅游类型、票价、具有相似性,所对应的景点实体向量在向量空间的距离比较近。通过预训练得到的景点向量会提高推荐的准确度。
每一个游客对景点的偏好不同,如部分游客喜欢自然风光,古迹等,有的游客不喜欢爬山等。再如游客是何时游玩的,如温泉大部分时间是冬季,推荐时不可能推荐夏季去泡温泉。为了学习到游客和景点交互。
步骤S8、通过神经网络学习游客向量和景点潜在向量。具体做法为将用户ID用one-hot encoding编码初始化游客向量。qi表示上述通过网络表示学习到景点潜在向量。
pu=PTvu U (5)
qi=QTvi I (6)
PTvu U表示用户的潜在向量pu,P是一个k*m的用户特征矩阵,k为游客数,m为用户特征向量维度。
QTvi I表示项目的潜在向量qi。Q是一个n*m的矩阵,n为景点数量,m为景点特征向量的维度。
步骤S9、将所述游客向量和融合语义向量通过矩阵分解得到第一交互向量(低级交互语义信息);然后,将第一交互向量映射到输出层。
φMF=pu⊙qi (6)
⊙表示向量的逐元素乘积。
步骤S10、利用多层感知机得到游客向量和景点潜在向量的第二交互向量(高级语义信息交互),网络模型定义如下:
这里的Wx,bx和αx分别表示第x层的感知机中的的权重矩阵,偏置向量(神经网络的神经元阈值)和激活函数。具体使用几层网络根据实验效果确定,针对本实施例中的旅游数据集采用2层深度学习网络效果最佳,涉及的参数都使用随机高斯分布生成。
步骤S11、模型混合,将所述第一交互向量与所述第二交互向量拼接并做归一化处理得到游客对景点的评分,通过激活函数σ映射到输出层。这里激活函数采用relu,因为它同时支持稀疏数据,使模型不至于过拟合。
使用Adam对算法参数进行优化。对模型迭代多次直至收敛,才停止训练。其损失函数如下:
步骤S12将游客对景点的评分从高到低排序,取前K个分数最高对应的景点,得到top_k景点推荐列表。
步骤S121、为了更好地训练模型以及提高推荐的准确度,当用户向该模型输入用户未访问的景点时,系统为每个正例景点都随机从数据集中选择4个负例一起训练。
步骤S122、通过训练,该模型会输出每个景点的打分。根据每个景点的打分从高到低排序,得到排名前10的top_k推荐列表。
本方法的最大改进之处是于在一般的神经协同过滤基础上预训练了初始化的向量。传统使用one-hot编码会造成数据稀疏和维度爆炸。而本发明将网络表示学习中的方法运用到深度学习网络中,既避免了数据稀疏和维度爆炸这一问题,又通过网络表示学习方法可以有效的学习景点与景点之间的相似性。这为神经协同过滤模型提供良好的输入,提高了景点的推荐效果。
本发明首先构建景点的知识图谱属性子图,通过网络表示学习方法预训练学习到每个景点在不同属性子图下的向量,然后再利用神经协同过滤模型预测下一个景点,以此提高推荐准确度。
本发明还提供一种基于混合式监督学习的旅游景点推荐装置,该推荐装置包括:
数据获取模块,用于获取游客历史游览数据,包括景点以及各个景点的景点属性值;
编码模块,用于为所有景点以及景点属性值设置一个唯一的id编码;
可视化模块,用于将景点及景点属性值转化为三元组,构建景点知识图谱并可视化;
抽取模块,用于对所述景点知识图谱根据景点的属性类别进行相应的属性子图抽取;
景点序列生成模块,用于利用随机游走方法根据景点知识图谱中的每种属性子图生成景点序列,所述景点序列中的元素包括景点实体、属性和景点属性值;
向量化模块,用于利用神经网络语言模型对所述景点序列进行训练将所述景点序列映射到低维向量空间中,将景点实体和景点属性值转化成特征向量;
融合模块,用于对每个景点在不同属性下的向量进行相加平均得到每个景点的融合语义特征向量;
第一学习模块,用于通过神经网络学习游客向量和景点潜在向量;
分解模块,用于将所述游客向量和融合语义向量通过矩阵分解得到第一交互向量;
第二学习模块,用于利用多层感知机得到游客向量和潜在向量的第二交互向量;
拼接模块,用于将所述第一交互向量与所述第二交互向量拼接并做归一化处理得到游客对景点的评分;
排序模块,用于将游客对景点的评分从高到低排序,取前K个分数最高对应的景点,得到top_k景点推荐列表。
在一些实施例中,该装置还包括预处理模块,用于对所述历史游览数据进行去重和实体消岐。
在一些实施例中,该装置还包括区间划分模块,用于将历史游览数据中的景点属性值按照区间划分。
在一些实施例中,所述特征向量通过以下方式得到:
在所述景点知识图谱中取景点实体ID和景点属性值ID;
针对每个景点知识图谱中的每种属性子图通过带偏置的随机游走策略生景点序列;
利用神经网络语言模型Word2Vec将景点序列映射到低维空间将每个景点的景点实体和景点属性值转化成特征向量。
需要说明的是,由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例的内容请参见方法部分的实施例的描述,这里暂不赘述。
为实现上述目的及其他相关目的,本发明还提供一种电子终端,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器存储的计算机程序,以使所述设备执行所述的推荐方法。
为实现上述目的及其他相关目的,本发明还提供一种计算机可读存储介质,存储计算机程序,所述计算机程序被处理器运行时执行所述的推荐方法。
需要说明的是,由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例的内容请参见方法部分的实施例的描述,这里暂不赘述。
本发明还提供一种存储介质,存储计算机程序,所述计算机程序被处理器运行时执行前述的推荐方法。
本发明还提供一种电子终端,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器存储的计算机程序,以使所述设备执行前述的推荐方法。
所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器((RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可以是内部存储单元或外部存储设备,例如插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字卡(Secure Digital,SD),闪存卡(Flash Card)等。进一步地,所述存储器还可以既包括内部存储单元,也包括外部存储设备。所述存储器用于存储所述计算机程序以及其他程序和数据。所述存储器还可以用于暂时地存储己经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (10)
1.一种基于混合式监督学习的旅游景点推荐方法,其特征在于,该推荐方法包括:
获取游客历史游览数据,包括景点以及各个景点的景点属性值;
为所有景点以及景点属性值设置一个唯一的id编码;
将景点及景点属性值转化为三元组,构建景点知识图谱并可视化;
对所述景点知识图谱根据景点的属性类别进行相应的属性子图抽取;
利用随机游走方法根据景点知识图谱中的每种属性子图生成景点序列,所述景点序列中的元素包括景点实体、属性和景点属性值;
利用神经网络语言模型对所述景点序列进行训练将所述景点序列映射到低维向量空间中,将景点实体和景点属性值转化成特征向量;
对每个景点在不同属性下的向量进行相加平均得到每个景点的融合语义特征向量;
通过神经网络学习游客向量和景点潜在向量;
将所述游客向量和融合语义特征通过矩阵分解得到第一交互向量;
利用多层感知机得到游客向量和景点潜在向量的第二交互向量;
将所述第一交互向量与所述第二交互向量拼接并做归一化处理得到游客对景点的评分;
将游客对景点的评分从高到低排序,取前K个分数最高对应的景点,得到top_k景点推荐列表。
2.根据权利要求1所述的一种基于混合式监督学习的旅游景点推荐方法,其特征在于,该方法还包括对所述历史游览数据进行去重和实体消岐。
3.根据权利要求2所述的一种基于混合式监督学习的旅游景点推荐方法,其特征在于,将历史游览数据中的景点属性值按照区间划分。
4.根据权利要求1所述的一种基于混合式监督学习的旅游景点推荐方法,其特征在于,所述特征向量通过以下方式得到:
在所述景点知识图谱中取景点实体ID和景点属性值ID;
针对每个景点知识图谱中的每种属性子图通过带偏置的随机游走策略生景点序列;
利用神经网络语言模型Word2Vec将景点序列映射到低维空间将每个景点的景点实体和景点属性值转化成特征向量。
5.一种基于混合式监督学习的旅游景点推荐装置,其特征在于,该推荐装置包括:
数据获取模块,用于获取游客历史游览数据,包括景点以及各个景点的景点属性值;
编码模块,用于为所有景点以及景点属性值设置一个唯一的id编码;
可视化模块,用于将景点及景点属性值转化为三元组,构建景点知识图谱并可视化;
抽取模块,用于对所述景点知识图谱根据景点的属性类别进行相应的属性子图抽取;
景点序列生成模块,用于利用随机游走方法根据景点知识图谱中的每种属性子图生成景点序列,所述景点序列中的元素包括景点实体、属性和景点属性值;
向量化模块,用于利用神经网络语言模型对所述景点序列进行训练将所述景点序列映射到低维向量空间中,将景点实体和景点属性值转化成特征向量;
融合模块,用于对每个景点在不同属性下的向量进行相加平均得到每个景点的融合语义特征向量;
第一学习模块,用于通过神经网络学习游客向量和景点潜在向量;
分解模块,用于将所述游客向量和融合语义向量通过矩阵分解得到第一交互向量;
第二学习模块,用于利用多层感知机得到游客向量和潜在向量的第二交互向量;
拼接模块,用于将所述第一交互向量与所述第二交互向量拼接并做归一化处理得到游客对景点的评分;
排序模块,用于将游客对景点的评分从高到低排序,取前K个分数最高对应的景点,得到top_k景点推荐列表。
6.根据权利要求5所述的一种基于混合式监督学习的旅游景点推荐装置,其特征在于,该装置还包括预处理模块,用于对所述历史游览数据进行去重和实体消岐。
7.根据权利要求6所述的一种基于混合式监督学习的旅游景点推荐装置,其特征在于,该装置还包括区间划分模块,用于将历史游览数据中的景点属性值按照区间划分。
8.根据权利要求5所述的一种基于混合式监督学习的旅游景点推荐装置,其特征在于,所述特征向量通过以下方式得到:
在所述景点知识图谱中取景点实体ID和景点属性值ID;
针对每个景点知识图谱中的每种属性子图通过带偏置的随机游走策略生景点序列;
利用神经网络语言模型Word2Vec将景点序列映射到低维空间将每个景点的景点实体和景点属性值转化成特征向量。
9.一种电子终端,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器存储的计算机程序,以使所述设备执行权利要求1~4任意一项的推荐方法。
10.一种计算机可读存储介质,存储计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1~4任意一项的推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910623885.3A CN110489547A (zh) | 2019-07-11 | 2019-07-11 | 一种基于混合式监督学习的旅游景点推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910623885.3A CN110489547A (zh) | 2019-07-11 | 2019-07-11 | 一种基于混合式监督学习的旅游景点推荐方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110489547A true CN110489547A (zh) | 2019-11-22 |
Family
ID=68547004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910623885.3A Pending CN110489547A (zh) | 2019-07-11 | 2019-07-11 | 一种基于混合式监督学习的旅游景点推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110489547A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929162A (zh) * | 2019-12-04 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 基于兴趣点的推荐方法、装置、计算机设备和存储介质 |
CN110955834A (zh) * | 2019-11-27 | 2020-04-03 | 西北工业大学 | 一种知识图谱驱动的个性化精准推荐方法 |
CN111160756A (zh) * | 2019-12-26 | 2020-05-15 | 马上游科技股份有限公司 | 基于二次人工智能算法的景区评估方法及模型 |
CN111241408A (zh) * | 2020-01-21 | 2020-06-05 | 武汉轻工大学 | 推荐模型的构建系统及方法 |
CN111353106A (zh) * | 2020-02-26 | 2020-06-30 | 贝壳技术有限公司 | 推荐方法和装置、电子设备和存储介质 |
CN111507796A (zh) * | 2020-04-07 | 2020-08-07 | 桂林电子科技大学 | 一种基于知识图谱的网上商城商品推荐方法 |
CN111695928A (zh) * | 2020-04-29 | 2020-09-22 | 安徽四创电子股份有限公司 | 一种基于wifi的商业推荐方法 |
CN111949885A (zh) * | 2020-08-27 | 2020-11-17 | 桂林电子科技大学 | 一种面向旅游景点的个性化推荐方法 |
CN112257517A (zh) * | 2020-09-30 | 2021-01-22 | 中国地质大学(武汉) | 一种基于景点聚类和群体情感识别的旅游景点推荐系统 |
CN112256835A (zh) * | 2020-10-29 | 2021-01-22 | 东南大学 | 一种精准描述知识图谱中元素语义的子图抽取方法 |
CN112508636A (zh) * | 2020-11-03 | 2021-03-16 | 上海财经大学 | 一种护肤品推荐方法 |
CN112784153A (zh) * | 2020-12-31 | 2021-05-11 | 山西大学 | 融合属性特征注意力与异质类型信息的旅游景点推荐方法 |
CN112801751A (zh) * | 2021-02-04 | 2021-05-14 | 重庆邮电大学 | 一种多任务图神经网络的个性化景区推荐方法 |
JP7399216B2 (ja) | 2021-12-20 | 2023-12-15 | ネイバー コーポレーション | ユーザ嗜好に基づいた場所個人化推薦のための方法、コンピュータシステム、およびコンピュータプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491469A (zh) * | 2018-03-07 | 2018-09-04 | 浙江大学 | 引入概念标签的神经协同过滤概念描述词推荐算法 |
CN108563653A (zh) * | 2017-12-21 | 2018-09-21 | 清华大学 | 一种用于知识图谱中知识获取模型的构建方法及系统 |
-
2019
- 2019-07-11 CN CN201910623885.3A patent/CN110489547A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563653A (zh) * | 2017-12-21 | 2018-09-21 | 清华大学 | 一种用于知识图谱中知识获取模型的构建方法及系统 |
CN108491469A (zh) * | 2018-03-07 | 2018-09-04 | 浙江大学 | 引入概念标签的神经协同过滤概念描述词推荐算法 |
Non-Patent Citations (4)
Title |
---|
XIANGNAN HE,ETC: "Neural Collaborative Filtering", 《WWW "17: PROCEEDINGS OF THE 26TH INTERNATIONAL CONFERENCE ON WORLD WIDE WEB》 * |
武玲梅: "基于深度神经网络的推荐模型研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
贾中浩等: "旅游知识图谱特征学习的景点推荐", 《智能系统学报》 * |
黄华升: "基于知识图谱的个性化学习资源推荐研究", 《软件工程》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110955834A (zh) * | 2019-11-27 | 2020-04-03 | 西北工业大学 | 一种知识图谱驱动的个性化精准推荐方法 |
CN110955834B (zh) * | 2019-11-27 | 2023-07-07 | 西北工业大学 | 一种知识图谱驱动的个性化精准推荐方法 |
CN110929162A (zh) * | 2019-12-04 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 基于兴趣点的推荐方法、装置、计算机设备和存储介质 |
CN111160756A (zh) * | 2019-12-26 | 2020-05-15 | 马上游科技股份有限公司 | 基于二次人工智能算法的景区评估方法及模型 |
CN111241408A (zh) * | 2020-01-21 | 2020-06-05 | 武汉轻工大学 | 推荐模型的构建系统及方法 |
CN111353106B (zh) * | 2020-02-26 | 2021-05-04 | 贝壳找房(北京)科技有限公司 | 推荐方法和装置、电子设备和存储介质 |
CN111353106A (zh) * | 2020-02-26 | 2020-06-30 | 贝壳技术有限公司 | 推荐方法和装置、电子设备和存储介质 |
CN111507796A (zh) * | 2020-04-07 | 2020-08-07 | 桂林电子科技大学 | 一种基于知识图谱的网上商城商品推荐方法 |
CN111695928A (zh) * | 2020-04-29 | 2020-09-22 | 安徽四创电子股份有限公司 | 一种基于wifi的商业推荐方法 |
CN111949885A (zh) * | 2020-08-27 | 2020-11-17 | 桂林电子科技大学 | 一种面向旅游景点的个性化推荐方法 |
CN112257517A (zh) * | 2020-09-30 | 2021-01-22 | 中国地质大学(武汉) | 一种基于景点聚类和群体情感识别的旅游景点推荐系统 |
CN112257517B (zh) * | 2020-09-30 | 2023-04-21 | 中国地质大学(武汉) | 一种基于景点聚类和群体情感识别的旅游景点推荐系统 |
CN112256835B (zh) * | 2020-10-29 | 2021-07-23 | 东南大学 | 一种精准描述知识图谱中元素语义的子图抽取方法 |
CN112256835A (zh) * | 2020-10-29 | 2021-01-22 | 东南大学 | 一种精准描述知识图谱中元素语义的子图抽取方法 |
CN112508636A (zh) * | 2020-11-03 | 2021-03-16 | 上海财经大学 | 一种护肤品推荐方法 |
CN112784153A (zh) * | 2020-12-31 | 2021-05-11 | 山西大学 | 融合属性特征注意力与异质类型信息的旅游景点推荐方法 |
CN112801751A (zh) * | 2021-02-04 | 2021-05-14 | 重庆邮电大学 | 一种多任务图神经网络的个性化景区推荐方法 |
JP7399216B2 (ja) | 2021-12-20 | 2023-12-15 | ネイバー コーポレーション | ユーザ嗜好に基づいた場所個人化推薦のための方法、コンピュータシステム、およびコンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110489547A (zh) | 一种基于混合式监督学习的旅游景点推荐方法及装置 | |
CN107679661B (zh) | 一种基于知识图谱的个性化旅游路线规划方法 | |
CN110288436A (zh) | 一种基于游客偏好建模的个性化景点推荐方法 | |
CN110287336B (zh) | 一种面向旅游景点推荐的游客画像构建方法 | |
CN112749339A (zh) | 一种基于旅游知识图谱的旅游路线推荐方法及系统 | |
CN106295506A (zh) | 一种基于集成卷积神经网络的年龄识别方法 | |
CN107145961A (zh) | 一种基于改进遗传算法的旅游行程规划方法 | |
CN112528639B (zh) | 对象识别方法和装置、存储介质及电子设备 | |
CN106776928A (zh) | 基于内存计算框架、融合社交环境及时空数据的位置推荐方法 | |
CN108509607A (zh) | 一种基于Louvain算法的社区发现方法及系统 | |
CN109871504A (zh) | 一种基于异构信息网络与深度学习的课程推荐系统 | |
CN104156464A (zh) | 基于微视频特征数据库的微视频检索方法及装置 | |
CN107016566A (zh) | 基于本体的用户模型构建方法 | |
CN109949174A (zh) | 一种异构社交网络用户实体锚链接识别方法 | |
CN105843793A (zh) | 在自动模型产生期间检测和创建合适行概念的方法和系统 | |
CN110175192A (zh) | 一种基于主题序列模式的旅游产品推荐方法 | |
He et al. | Visual sensemaking of massive crowdsourced data for design ideation | |
CN115186197A (zh) | 一种基于端到端双曲空间的用户推荐方法 | |
CN114637863A (zh) | 一种基于传播的知识图谱推荐方法 | |
CN111882381B (zh) | 一种基于协同记忆网络的旅游推荐方法 | |
CN111797331A (zh) | 基于群智感知的多目标多约束路线推荐方法 | |
CN116340541A (zh) | 一种文博知识图谱系统构建方法 | |
Cao et al. | Simulation and formation mechanisms of urban landscape design based on discrete dynamic models driven by big data | |
Unlu | Chatmap: Large Language Model Interaction with Cartographic Data | |
CN109308313A (zh) | 基于文化资源评价的资源富集区识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191122 |
|
RJ01 | Rejection of invention patent application after publication |