CN112836119A - 一种基于加权异构信息网络的景点推荐方法 - Google Patents

一种基于加权异构信息网络的景点推荐方法 Download PDF

Info

Publication number
CN112836119A
CN112836119A CN202110104713.2A CN202110104713A CN112836119A CN 112836119 A CN112836119 A CN 112836119A CN 202110104713 A CN202110104713 A CN 202110104713A CN 112836119 A CN112836119 A CN 112836119A
Authority
CN
China
Prior art keywords
user
path
meta
weighted
paths
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110104713.2A
Other languages
English (en)
Inventor
王磊
宋阳春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN202110104713.2A priority Critical patent/CN112836119A/zh
Publication of CN112836119A publication Critical patent/CN112836119A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于加权异构信息网络的景点推荐方法,具体包括:步骤1、获取用户景点数据;步骤2、将用户和景点关系构建加权异构信息网络;步骤3、抽象加权异构信息网络图,定义加权网络模式;步骤4、获取多条从用户类型到用户类型的元路径集,引入加权元路径;步骤5、计算用户之间的相似度;步骤6、计算用户对景点的预测评分;得到目标用户访问景点的概率;步骤7、将步骤6中的预测评分以降序方式排列,生成景点推荐列表;选取TOP‑N的景点集作为结果推荐给用户。本发明综合利用用户景点的交互信息,解决了现有的景点推荐方法数据稀疏,推荐精度低的问题。属性附加信息以有效提高推荐的准确性和多样性。

Description

一种基于加权异构信息网络的景点推荐方法
技术领域
本发明属于数据挖掘推荐技术领域,涉及一种基于加权异构信息网络的景点推荐方法。
背景技术
随着旅游者消费观念的转变以及消费能力的提高,用户旅游消费习惯逐渐向“刚需化发展”,旅游需求日益趋于个性化。目前国内外互联网在线旅游平台为用户提供了方便快捷的信息服务,但与此同时用户被大量的信息淹没,推荐方法的出现为解决信息过载问题提供了一条有效途径。景点推荐方法通过分析用户的兴趣和需求,推断与之相关的目的地或景点集,从而过滤掉大量的无关信息,辅助人们的出游规划。目前现有的景点推荐方法虽然有一定的效果,但大多只利用了用户和景点的评分交互信息,未考虑其他重要的辅助信息。由于旅游本身周期长,频次低,用户景点评分交互信息少,数据稀疏,只利用评分因素会导致算法的推荐精度低。
发明内容
本发明的目的是提供一种基于加权异构信息网络的景点推荐方法,解决了现有的景点推荐方法数据稀疏,推荐精度低的问题。
本发明所采用的技术方案是,一种基于加权异构信息网络的景点推荐方法,具体按照以下步骤实施:
步骤1、获取用户旅游数据集,经去重,剔除无效数据的处理操作后,得到最终的有效数据集;
步骤2、根据步骤1用户旅游数据集的结构特征,将用户旅游数据集的关系构建为加权异构信息网络;
步骤3、根据步骤2得到的加权异构信息网络的节点类型以及节点类型之间的关系,将加权异构信息网络抽象为加权异构网络模式。只保留节点之间的类型关系,对网络中节点和边的类型进行限制,使得异构信息网络半结构化;
步骤4、基于步骤3中加权异构网络模式,获取多条从用户类型到用户类型的元路径集,引入加权元路径;
步骤5、根据步骤4中加权和非加权元路径,计算每条元路径上用户之间的相似度;
步骤6、根据步骤5中求得元路径上用户相似度值,计算每条元路径上用户对景点的预测评分;经过融合得到最终目标用户对景点的预测评分;
步骤7、将步骤6中的预测评分以降序方式排列,生成景点推荐列表;选取TOP-N的景点集作为结果推荐给用户。
本发明的特点还在于,
步骤2具体步骤为:定义用户景点加权异构网络模型G=<V,E,A,R,W>,其中节点v∈V表示一个实体,有向边<u,v>∈E表示节点u到节点v存在关系;权重w∈W表示边上的权重,映射函数ψ:w→W表示每条边的权重w∈W属于集合W;A表示一个实体类型集合,映射函数φ:V→A表示每个实体v∈V属于一个特定的实体类型,即φ(v)∈A;R表示一个链接关系类型集合,映射函数
Figure BDA0002916898520000021
E→R表示每条边<u,u>∈E属于一个特定的链接关系类型,即
Figure BDA0002916898520000022
该网络中实体类型的数量|A|>1且链接关系类型数量|R|>1,完成该异构信息网络的构建。
步骤3具体步骤为,根据步骤2中的加权异构信息网络中的实体及关系,以实体类型为节点,连接关系类型为边,边上的权值为权重,构建其网络模式图,记为TG=(A,R,W),它是带有实体类型映射φ:V→A,关系类型映射
Figure BDA0002916898520000031
E→R和权重映射ψ:w→W的信息网络G=<V,E,A,R,W>的元模式。
在步骤4中基于步骤3中加权网络模式,利用广度优先的图搜索方法,获取多条从用户类型到用户类型的元路径,根据旅游领域知识分析,用户是否选择一个景点受“吃、住、行、游、娱、购”六要素的影响,设置用户到每个要素的元路径,用户到“游”要素的元路径的权值为用户对景点的评分,用户到“吃、住、行、娱、购”要素以及景点主题属性的元路径的权值设为1,从语义上,不同元路径代表的物理意义不同,所体现出的节点间关联程度也不同。
步骤4中引入元路径的具体过程为,在加权网络模式上定义加权元路径P,加权元路径对关系属性值有所约束的一种扩展元路径,表示为
Figure BDA0002916898520000032
如果关系R在链接上具有属性值,则属性函数的函数值δ(R)是关系R属性值范围内的一个取值集合;否则δ(R)为空集;
Figure BDA0002916898520000033
表示Ai与Ai+1之间的关系Ri具有属性值δi(Ri);约束条件C用于约束属性函数之间的关系;若加权元路径中所有属性函数取值均为空集,相应的约束条件C也为空集,则该路径退化为非加权元路径,即非加权元路径是加权元路径的一种特例;若用户U与景点A间的评分关系的属性值取值为1至5分,加权元路径
Figure BDA0002916898520000034
则表示两个用户对景点的评分均为1,意味着用户和目标用户不喜欢相同的景点;异构信息网络中不同元路径蕴含了不同的语义信息。
在步骤5计算元路径上用户相似度时,对于加权元路径首先按照具体的权值分解为多个原子元路径,然后用基于元路径的相似度计算方法PathSim计算每条原子元路径的用户相似度,最后将带权元路径的所有原子元路径的用户相似度求和,得到加权元路径下的用户相似度;对于非加权元路径,直接使用PathSim方法计算非加权元路径下的用户相似度。
步骤6中通过基于步骤5中的元路径计算得到的不同元路径上的用户相似度值,应用于基于用户的协同过滤推荐算法中,得到不同元路径影响的用户对景点的预测评分值,然后采用线性回归方法预测评分值赋予不同的权重,融合为最终的预测评分。
步骤5的具体过程为:
步骤5.1、将加权元路径P按照具体的权值分解为多个原子元路径Pi,定义原子元路径为,如果加权元路径中所有属性值函数δ(R)取特定值,则该路径称为原子元路径;加权元路径为一组原子元路径,其中包含满足约束C的所有原子元路径;以元路径U-A-U为例,若用户U与景点A间的评分关系的属性值取值为1至5分,
Figure BDA0002916898520000041
Figure BDA0002916898520000042
都是原子元路径,加权元路径
Figure BDA0002916898520000043
是一组5个原子元路径,即
Figure BDA0002916898520000044
Figure BDA0002916898520000045
步骤5.2、用基于元路径的相似度计算方法PathSim,计算每个原子元路径上用户的相似度;给定一个对称的原子元路径Pi,两个相同类型的顶点对象x和y的PathSim计算如公式(1)所示:
Figure BDA0002916898520000046
其中px→y是x与y之间的路径实例,px→x是x与x之间的路径实例,py→y是y与y之间的路径实例;
步骤5.3、将该带权元路径的所有原子元路径的相似度求和,得到加权元路径P下的用户相似度如公式(2)所示,通过原子元路径上所有用户的相似度矩阵,将该带权元路径的所有原子元路径的相似度求和,得到加权元路径下的用户相似度矩阵:
Figure BDA0002916898520000051
在用户对景点的评分元路径上使用PathSim,计算用户相似度的过程时,若有3个用户对2个景点的评分矩阵,评分分值为1和5;用户对景点的评分元路径为U-A-U,属于加权元路径,首先将其分解为原子元路径
Figure BDA0002916898520000052
Figure BDA0002916898520000053
然后分别使用公式(1)计算原子元路径上两个用户的相似度,
Figure BDA0002916898520000054
上用户u1和u2的相似度为:
Figure BDA0002916898520000055
步骤5.4、使用PathSim方法计算非加权元路径下用户的相似度,如步骤5.2中公式(1)所示。
步骤6的过程具体为:
步骤6.1、基于步骤5中的元路径,求得用户相似度值,对每条元路径上的相似度值进行排序,根据K近邻的方法找出和当前用户u拥有相似偏好的K名用户集合Ku,则不同元路径影响的用户对景点的预测评分值如下公式(3)所示:
Figure BDA0002916898520000056
式(3)中,Pu,j为用户对景点的预测评分值;
Figure BDA0002916898520000061
表示用户u和用户v的平均打分值,消除用户打分偏好对最后结果的影响;Ku为与用户最相似的用户集合;
步骤6.2、将步骤6.1得到不同元路径影响的用户对景点的预测评分后,采用线性回归方法为每一个基于单一元路径的预测评分值赋予不同的权重,融合为最终的预测评分。
获取用户旅游数据集包括用户、景点、以及景点附近相关要素,景点附近相关要素包括吃住行娱购,即景点附近餐饮、住宿、交通、娱乐、购物的数据。
本发明的有益效果是,本发明一种基于加权异构信息网络的景点推荐方法,针对用户旅游数据的稀疏性问题,在考虑到用户景点的交互信息的同时,还通过增加元路径数量考虑了景点的属性附加信息,从而丰富有效数据,缓解稀疏性问题,提高了推荐的准确性和多样性。
附图说明
图1是本发明一种基于加权异构信息网络的景点推荐方法的流程图;
图2是现有景点推荐方法的用户和景点之间交互的简单示例图;
图3是本发明中用户景点加权异构信息网络示意图;
图4是本发明中加权异构信息网络的加权网络模式图;
图5是本发明中基于加权元路径的PathSim相似度度量示例。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明一种基于加权异构信息网络的景点推荐方法,如图1所示,具体包括以下步骤:
步骤1、获取用户旅游数据集,经去重,剔除无效数据的处理操作后,得到最终的有效数据集。
获取用户旅游数据集包括用户、景点、以及景点附近相关要素,景点附近相关要素包括吃住行娱购,即包括景点附近餐饮、住宿、交通、娱乐、购物的数据;
步骤2、根据步骤1中用户旅游数据集的结构特征,将用户旅游数据集的关系构建为加权异构信息网络;
构建加权异构信息网络时,根据用户和景点的评分矩阵,景点的主题属性以及景点与各个要素之间的距离构建加权异构信息网络。
步骤2具体步骤为:定义用户景点加权异构网络模型G=<V,E,A,R,W>,其中节点v∈V表示一个实体,有向边<u,v>∈E表示节点u到节点v存在关系;权重w∈W表示边上的权重,映射函数ψ:w→W表示每条边的权重w∈W属于集合W;A表示一个实体类型集合,映射函数φ:V→A表示每个实体v∈V属于一个特定的实体类型,即φ(v)∈A;R表示一个链接关系类型集合,映射函数
Figure BDA0002916898520000071
E→R表示每条边<u,v>∈E属于一个特定的链接关系类型,即
Figure BDA0002916898520000072
该网络中实体类型的数量|A|>1且链接关系类型数量|R|>1,完成该异构信息网络的构建。
步骤3、根据步骤2得到的异构信息网络的节点类型以及节点类型之间的关系,将加权异构信息网络图抽象为加权异构网络模式,只保留节点之间的类型关系,对网络中节点和边的类型进行限制,使得异构信息网络半结构化,加权异构网络模式便于语义探索和模式挖掘。
步骤3具体步骤为:根据步骤2中的加权异构信息网络中的实体及关系,以实体类型为节点,连接关系类型为边,边上的权值为权重,构建其网络模式图,记为TG=(A,R,W),它是带有实体类型映射φ:V→A,关系类型映射
Figure BDA0002916898520000081
E→R和权重映射ψ:w→W的信息网络G=<V,E,A,R,W>的元模式。
步骤4、基于步骤3中加权异构网络模式,获取多条从用户类型到用户类型的元路径集,引入加权元路径;
步骤4中利用广度优先的图搜索方法,获取多条从用户类型到用户类型的元路径,根据旅游领域知识分析,用户是否选择一个景点受“吃、住、行、游、娱、购”六要素的影响,设置用户到每个要素的元路径,用户到“游”要素的元路径的权值为用户对景点的评分,用户到“吃、住、行、娱、购”要素以及景点主题属性的元路径的权值设为1,从语义上,不同元路径代表的物理意义不同,所体现出的节点间关联程度也不同。
步骤4中引入元路径的具体过程为:在加权网络模式上定义加权元路径P,加权元路径对关系属性值有所约束的一种扩展元路径,表示为
Figure BDA0002916898520000082
如果关系R在链接上具有属性值,则属性函数的函数值δ(R)是关系R属性值范围内的一个取值集合;否则δ(R)为空集;
Figure BDA0002916898520000083
表示Ai与Ai+1之间的关系Ri具有属性值δi(Ri);约束条件C用于约束属性函数之间的关系;若加权元路径中所有属性函数取值均为空集,相应的约束条件C也为空集,则该路径退化为非加权元路径,即非加权元路径是加权元路径的一种特例;若用户U与景点A间的评分关系的属性值取值为1至5分,加权元路径
Figure BDA0002916898520000084
则表示两个用户对景点的评分均为1,意味着用户和目标用户不喜欢相同的景点;异构信息网络中不同元路径蕴含了不同的语义信息。
步骤5、根据步骤4中加权和非加权元路径,计算每条元路径上用户之间的相似度;
在步骤5计算用户相似度时,对于加权元路径首先按照具体的权值分解为多个原子元路径,然后用基于元路径的相似度计算方法PathSim计算每条原子元路径的用户相似度,最后将带权元路径的所有原子元路径的用户相似度求和,得到加权元路径下的用户相似度;对于非加权元路径,直接使用PathSim方法计算非加权元路径下的用户相似度。
步骤5的具体过程为:
步骤5.1、将加权元路径P按照具体的权值分解为多个原子元路径Pi,定义原子元路径为,如果加权元路径中所有属性值函数δ(R)取特定值,则该路径称为原子元路径;加权元路径为一组原子元路径,其中包含满足约束C的所有原子元路径;以元路径U-A-U为例,若用户U与景点A间的评分关系的属性值取值为1至5分,
Figure BDA0002916898520000091
Figure BDA0002916898520000092
都是原子元路径,加权元路径
Figure BDA0002916898520000093
是一组5个原子元路径,即
Figure BDA0002916898520000094
Figure BDA0002916898520000095
步骤5.2、用基于元路径的相似度计算方法PathSim,计算每个原子元路径上用户的相似度;给定一个对称的原子元路径Pi,两个相同类型的顶点对象x和y的PathSim计算如公式(1)所示:
Figure BDA0002916898520000096
其中px→y是x与y之间的路径实例,px→x是x与x之间的路径实例,py→y是y与y之间的路径实例;
步骤5.3、将该带权元路径的所有原子元路径的相似度求和,得到加权元路径P下的用户相似度如公式(2)所示,通过原子元路径上所有用户的相似度矩阵,将该带权元路径的所有原子元路径的相似度求和,得到加权元路径下的用户相似度矩阵:
Figure BDA0002916898520000101
在用户对景点的评分元路径上使用PathSim,计算用户相似度的过程时,若有3个用户对2个景点的评分矩阵,评分分值为1和5;用户对景点的评分元路径为U-A-U,属于加权元路径,首先将其分解为原子元路径
Figure BDA0002916898520000102
Figure BDA0002916898520000103
然后分别使用公式(1)计算原子元路径上两个用户的相似度,
Figure BDA0002916898520000104
上用户u1和u2的相似度为:
Figure BDA0002916898520000105
步骤5.4、使用PathSim方法计算非加权元路径下用户的相似度,如步骤5.2中公式(1)所示。
步骤6、根据步骤5中求得元路径上用户相似度值,计算每条元路径上用户对景点的预测评分;经过融合得到最终目标用户对景点的预测评分;
通过基于步骤5中的元路径计算得到的不同元路径上的用户相似度值,应用于基于用户的协同过滤推荐算法中,得到不同元路径影响的用户对景点的预测评分值,然后采用线性回归方法为每条元路径的预测评分值赋予不同的权重,融合为最终的预测评分。
步骤6的过程具体为:
步骤6.1、基于步骤5中的元路径,求得用户相似度值,对每条元路径上的相似度值进行排序,根据K近邻的方法找出和当前用户u拥有相似偏好的K名用户集合Ku,则不同元路径影响的用户对景点的预测评分值如下公式(3)所示:
Figure BDA0002916898520000111
式(3)中,Pu,j为用户对景点的预测评分值;
Figure BDA0002916898520000112
表示用户u和用户v的平均打分值,消除用户打分偏好对最后结果的影响;Ku为与用户最相似的用户集合;
步骤6.2、将步骤6.1得到不同元路径影响的用户对景点的预测评分后,采用线性回归方法为每一个基于单一元路径的预测评分值赋予不同的权重,融合为最终的预测评分。
步骤7、将步骤6中的预测评分以降序方式排列,生成景点推荐列表;选取TOP-N的景点集作为结果推荐给用户。
实施例
现有方法如果只利用图2中的(a)在用户景点评分交互矩阵,使用协同过滤方法可以推断出,用户u4可能访问景点a2和a3,然而再考虑图2中的(b)属性矩阵时,会发现景点a3对于u4是一个更好的推荐,因为景点a1和a3有相同的属性m1
本实施例一种基于加权异构信息网络的景点推荐方法,具体实现过程如下:
步骤1、通过爬虫技术获取西安市旅游数据集,经去重,对数据进行无效剔除处理操作后,得到最终的有效数据集,数据集中用户对景点的评分数据共10544条;用户有11203个,景点有1849个;景点附近相关要素:餐饮有6种类型包括大排档、快餐服务点、特色餐厅、宴会餐厅、主题餐厅、农家乐和户外烧烤;住宿有7种类型包括星级酒店、民宿客栈、公寓、别墅农家院、青年旅舍、招待所;交通有8种类型包括飞机、火车、高铁、轮船、地铁、公交、出租、自驾;娱乐有4种类型包括消闲类、文化类、体育类、娱乐类;购物有5种类型包括免税店、景区购物中心、景区购物市集、团队安排购物场所、景区边小店;景点主题属性有6种类型包括自然景观类、人文景观类、乡村田园类、现代娱乐类、博物馆类、综合吸引类。
步骤1中数据集中定义实体类型、表示及数目,实体类型包括用户、景点、餐饮、住宿、交通、娱乐,购物,主题;表示是指每种实体类型的表示字符,字符U表示用户类型,字符A表示景点类型,字符R表示餐饮类型,字符H表示住宿类型,字符T表示交通类型,字符E表示娱乐类型,字符S表示购物类型,字符M表示主题类型,数据集元素示例具体如表1所示:
表1数据集元素示例
实体类型 表示 数目
用户 U 11203
景点 A 1849
餐饮 R 6
住宿 H 7
交通 T 8
娱乐 E 4
购物 S 5
主题 M 6
步骤2、构建加权异构信息网络时,首先把用户景点实体以及景点附近餐饮住宿交通娱乐购物方面的属性映射为如图3所示中相应的节点;
根据加权异构信息网络的定义,具体的构建过程如下:首先把用户景点实体以及景点在餐饮住宿交通游览娱乐购物主题方面的属性映射为图中相应的节点;用实体或属性的类型作为相应节点的类型。根据景点拥有的属性值,添加从景点指向属性的边,比如景点与主题,景点与住宿,景点与餐饮等,这些关系为单值关系,权重设定为1,可认为是非加权边。若用户对景点有评分信息,则添加从该用户指向景点的边,边的权重为用户对景点的评分,评分范围为1-5分。异构信息网络中的每一个节点都拥有与实际物理类型一致的节点类型。
步骤3、构建加权异构网络模式具体根据图3中的加权异构信息网络中的实体及关系,以实体类型为节点,连接关系类型为边,边上的权值为权重,构建其网络模式图,图3的网络模式中,用户和景点有评分和被评分关系,景点和餐饮住宿交通娱乐购物有拥有和被拥有关系,景点和主题有属于和包含关系。
步骤4、根据元路径的定义,本实施例从吃住行游娱购六要素方面出发,定义用户元路径集,如表2所示;
表2用户元路径集
元路径 元路径的语义信息
U-A-U 与目标用户浏览过同一个景点的用户
U-A-R-A-U 与目标用户在餐饮要素上有相同偏好的用户
U-A-H-A-U 与目标用户在住宿要素上有相同偏好的用户
U-A-T-A-U 与目标用户在交通要素上有相同偏好的用户
U-A-E-A-U 与目标用户在娱乐要素上有相同偏好的用户
U-A-S-A-U 与目标用户在购物要素上有相同偏好的用户
U-A-M-A-U 与目标用户游览过同一主题景点的用户
步骤5、计算用户相似度,如图5所示,在用户对景点的评分元路径上使用PathSim计算用户相似度的过程,以3个用户对2个景点的评分矩阵为例,用户对景点的评分元路径为U-A-U,属于加权元路径,首先将其分解为原子元路径
Figure BDA0002916898520000141
Figure BDA0002916898520000142
然后分别使用公式(1)计算原子元路径上两个用户的相似度,例如
Figure BDA0002916898520000143
上用户u1和u2的相似度为:
步骤6、计算用户对景点的预测评分时,基于表2中的7条元路径,在步骤5中求得两用户在餐饮、住宿、交通等方面的7个相似度值,对每条元路径上的相似度值进行排序,根据K近邻的方法找出和当前用户u拥有相似偏好的K名用户集合Ku,则得到不同元路径影响的用户对景点的预测评分值。
步骤7、将最终的预测评分以降序方式排列,选取TOP-N的景点集作为结果推荐给用户。

Claims (10)

1.一种基于加权异构信息网络的景点推荐方法,其特征在于,具体按照以下步骤实施:
步骤1、获取用户旅游数据集,经去重,剔除无效数据的处理操作后,得到最终的有效数据集;
步骤2、根据步骤1用户旅游数据集的结构特征,将用户旅游数据集的关系构建加权异构信息网络;
步骤3、根据步骤2得到的异构信息网络的节点类型以及节点类型之间的关系,将加权异构信息网络图抽象为加权异构网络模式,只保留节点之间的类型关系,对网络中节点和边的类型进行限制,使得异构信息网络半结构化;
步骤4、基于步骤3中加权异构网络模式,获取多条从用户类型到用户类型的元路径集,引入加权元路径;
步骤5、根据步骤4中加权和非加权元路径,计算每条元路径上用户之间的相似度;
步骤6、根据步骤5中求得元路径上用户相似度值,计算每条元路径上用户对景点的预测评分;经过融合得到最终目标用户对景点的预测评分;
步骤7、将步骤6中的预测评分以降序方式排列,生成景点推荐列表;选取TOP-N的景点集作为结果推荐给用户。
2.根据权利要求1所述的一种基于加权异构信息网络的景点推荐方法,其特征在于,所述步骤2具体步骤为:定义用户景点加权异构网络模型G=<V,E,A,R,W>,其中节点v∈V表示一个实体,有向边<u,v>∈E表示节点u到节点v存在关系;权重w∈W表示边上的权重,映射函数ψ:w→W表示每条边的权重w∈W属于集合W;A表示一个实体类型集合,映射函数φ:V→A表示每个实体v∈V属于一个特定的实体类型,即φ(v)∈A;R表示一个链接关系类型集合,映射函数
Figure FDA0002916898510000021
表示每条边<u,v>∈E属于一个特定的链接关系类型,即
Figure FDA0002916898510000022
该网络中实体类型的数量|A|>1且链接关系类型数量|R|>1,完成该异构信息网络的构建。
3.根据权利要求2所述的一种基于加权异构信息网络的景点推荐方法,其特征在于,所述步骤3具体步骤为,根据步骤2中的加权异构信息网络中的实体及关系,以实体类型为节点,连接关系类型为边,边上的权值为权重,构建其网络模式图,记为TG=(A,R,W),它是带有实体类型映射φ:V→A,关系类型映射
Figure FDA0002916898510000023
和权重映射ψ:w→W的信息网络G=<V,E,A,R,W>的元模式。
4.根据权利要求3所述的一种基于加权异构信息网络的景点推荐方法,其特征在于,在所述步骤4中基于步骤3中加权网络模式,利用广度优先的图搜索方法,获取多条从用户类型到用户类型的元路径,根据旅游领域知识分析,用户是否选择一个景点受“吃、住、行、游、娱、购”六要素的影响,设置用户到每个要素的元路径,用户到“游”要素的元路径的权值为用户对景点的评分,用户到“吃、住、行、娱、购”要素以及景点主题属性的元路径的权值设为1,从语义上,不同元路径代表的物理意义不同,所体现出的节点间关联程度也不同。
5.根据权利要求4所述的一种基于加权异构信息网络的景点推荐方法,其特征在于,所述步骤4中引入元路径的具体过程为,在加权网络模式上定义加权元路径P,加权元路径对关系属性值有所约束的一种扩展元路径,表示为
Figure FDA0002916898510000031
如果关系R在链接上具有属性值,则属性函数的函数值δ(R)是关系R属性值范围内的一个取值集合;否则δ(R)为空集;
Figure FDA0002916898510000032
表示Ai与Ai+1之间的关系Ri具有属性值δi(Ri);约束条件C用于约束属性函数之间的关系;若加权元路径中所有属性函数取值均为空集,相应的约束条件C也为空集,则该路径退化为非加权元路径,即非加权元路径是加权元路径的一种特例;若用户U与景点A间的评分关系的属性值取值为1至5分,加权元路径
Figure FDA0002916898510000033
则表示用户对景点的评分为1,意味着用户并不喜欢该景点;加权元路径
Figure FDA0002916898510000034
则指用户和目标用户不喜欢相同的景点;异构信息网络中不同元路径蕴含了不同的语义信息。
6.根据权利要求5所述的一种基于加权异构信息网络的景点推荐方法,其特征在于,所述在步骤5计算用户相似度时,对于加权元路径首先按照具体的权值分解为多个原子元路径,然后用基于元路径的相似度计算方法PathSim计算每条原子元路径的用户相似度,最后将带权元路径的所有原子元路径的用户相似度求和,得到加权元路径下的用户相似度;对于非加权元路径,直接使用PathSim方法计算非加权元路径下的用户相似度。
7.根据权利要求6所述的一种基于加权异构信息网络的景点推荐方法,其特征在于,所述步骤6中通过基于步骤5中的元路径计算得到的不同元路径上的用户相似度值,应用于基于用户的协同过滤推荐算法中,得到不同元路径影响的用户对景点的预测评分值,然后采用线性回归方法预测评分值赋予不同的权重,融合为最终的预测评分。
8.根据权利要求5所述的一种基于加权异构信息网络的景点推荐方法,其特征在于,所述步骤5的具体过程为:
步骤5.1、将加权元路径P按照具体的权值分解为多个原子元路径Pi,定义原子元路径为,如果加权元路径中所有属性值函数δ(R)取特定值,则该路径称为原子元路径;加权元路径为一组原子元路径,其中包含满足约束C的所有原子元路径;以元路径U-A-U为例,若用户U与景点A间的评分关系的属性值取值为1至5分,
Figure FDA0002916898510000041
Figure FDA0002916898510000042
都是原子元路径,加权元路径
Figure FDA0002916898510000043
是一组5个原子元路径,即
Figure FDA0002916898510000044
Figure FDA0002916898510000045
步骤5.2、用基于元路径的相似度计算方法PathSim,计算每个原子元路径上用户的相似度;给定一个对称的原子元路径Pi,两个相同类型的顶点对象x和y的PathSim计算如公式(1)所示:
Figure FDA0002916898510000046
其中px→y是x与y之间的路径实例,px→x是x与x之间的路径实例,py→y是y与y之间的路径实例;
步骤5.3、将该带权元路径的所有原子元路径的相似度求和,得到加权元路径P下的用户相似度如公式(2)所示,通过原子元路径上所有用户的相似度矩阵,将该带权元路径的所有原子元路径的相似度求和,得到加权元路径下的用户相似度矩阵:
Figure FDA0002916898510000047
在用户对景点的评分元路径上使用PathSim,计算用户相似度的过程时,若有3个用户对2个景点的评分矩阵,用户对景点的评分元路径为U-A-U,属于加权元路径,首先将其分解为原子元路径
Figure FDA0002916898510000048
Figure FDA0002916898510000049
然后分别使用公式(1)计算原子元路径上两个用户的相似度,
Figure FDA00029168985100000410
上用户u1和u2的相似度为:
Figure FDA0002916898510000051
步骤5.4、使用PathSim方法计算非加权元路径下用户的相似度,如步骤5.2中公式(1)所示。
9.根据权利要求6所述的一种基于加权异构信息网络的景点推荐方法,其特征在于,所述步骤6的过程具体为:
步骤6.1、基于步骤5中的元路径,求得用户相似度值,对每条元路径上的相似度值进行排序,根据K近邻的方法找出和当前用户u拥有相似偏好的K名用户集合Ku,则不同元路径影响的用户对景点的预测评分值如下公式(3)所示:
Figure FDA0002916898510000052
式(3)中,Pu,j为用户对景点的预测评分值;
Figure FDA0002916898510000053
表示用户u和用户v的平均打分值,消除用户打分偏好对最后结果的影响;Ku为与用户最相似的用户集合;
步骤6.2、将步骤6.1得到不同元路径影响的用户对景点的预测评分后,采用线性回归方法为每一个基于单一元路径的预测评分值赋予不同的权重,融合为最终的预测评分。
10.根据权利要求1所述的一种基于加权异构信息网络的景点推荐方法,其特征在于,所述获取用户旅游数据集包括用户、景点、以及景点附近相关要素,景点附近相关要素包括吃住行娱购,即景点附近餐饮、住宿、交通、娱乐、购物的数据。
CN202110104713.2A 2021-01-26 2021-01-26 一种基于加权异构信息网络的景点推荐方法 Pending CN112836119A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110104713.2A CN112836119A (zh) 2021-01-26 2021-01-26 一种基于加权异构信息网络的景点推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110104713.2A CN112836119A (zh) 2021-01-26 2021-01-26 一种基于加权异构信息网络的景点推荐方法

Publications (1)

Publication Number Publication Date
CN112836119A true CN112836119A (zh) 2021-05-25

Family

ID=75930868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110104713.2A Pending CN112836119A (zh) 2021-01-26 2021-01-26 一种基于加权异构信息网络的景点推荐方法

Country Status (1)

Country Link
CN (1) CN112836119A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807681A (zh) * 2021-09-02 2021-12-17 中车青岛四方车辆研究所有限公司 轨道交通车辆用户需求匹配方法、计算机产品、存储介质
CN113836395A (zh) * 2021-08-30 2021-12-24 河南大学 一种基于异构信息网络的服务开发者按需推荐方法及系统
CN113961699A (zh) * 2021-09-26 2022-01-21 北京清华同衡规划设计研究院有限公司 一种旅游资源调查方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354862A (zh) * 2016-09-06 2017-01-25 山东大学 一种异构网络中多维个性化推荐方法
US20170140262A1 (en) * 2012-03-09 2017-05-18 Nara Logics, Inc. Systems and methods for providing recommendations based on collaborative and/or content-based nodal interrelationships
CN106802956A (zh) * 2017-01-19 2017-06-06 山东大学 一种基于加权异构信息网络的电影推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170140262A1 (en) * 2012-03-09 2017-05-18 Nara Logics, Inc. Systems and methods for providing recommendations based on collaborative and/or content-based nodal interrelationships
CN106354862A (zh) * 2016-09-06 2017-01-25 山东大学 一种异构网络中多维个性化推荐方法
CN106802956A (zh) * 2017-01-19 2017-06-06 山东大学 一种基于加权异构信息网络的电影推荐方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836395A (zh) * 2021-08-30 2021-12-24 河南大学 一种基于异构信息网络的服务开发者按需推荐方法及系统
CN113807681A (zh) * 2021-09-02 2021-12-17 中车青岛四方车辆研究所有限公司 轨道交通车辆用户需求匹配方法、计算机产品、存储介质
CN113807681B (zh) * 2021-09-02 2024-01-05 中车青岛四方车辆研究所有限公司 轨道交通车辆用户需求匹配方法、计算机产品、存储介质
CN113961699A (zh) * 2021-09-26 2022-01-21 北京清华同衡规划设计研究院有限公司 一种旅游资源调查方法和系统

Similar Documents

Publication Publication Date Title
CN112836119A (zh) 一种基于加权异构信息网络的景点推荐方法
CN107729444B (zh) 一种基于知识图谱的个性化旅游景点推荐方法
Simeon et al. Exploring tourists’ cultural experiences in Naples through online reviews
KR101558910B1 (ko) 여가 활동들을 위한 혼합형 모델 추천기
CN105159933B (zh) 旅游信息推荐方法及装置
Ryan et al. Theme parks and a structural equation model of determinants of visitor satisfaction—Janfusan Fancyworld, Taiwan
Pessemier et al. Hybrid group recommendations for a travel service
Zhen et al. The rise of the internet city in China: Production and consumption of internet information
CN109977283A (zh) 一种基于知识图谱和用户足迹的旅游推荐方法和系统
CN110263256A (zh) 基于多模态异质信息的个性化推荐方法
CN106197444A (zh) 一种路线规划方法、系统
KR20160029330A (ko) 사용자 특성 및 여행지 특성에 기반한 여행지 추천 시스템 및 방법
Anuar et al. Understanding the factors influencing formation of tourist friendly destination concept
Zhao et al. Walkability scoring: Why and how does a three-dimensional pedestrian network matter?
Alrasheed et al. A multi-level tourism destination recommender system
Thomsen et al. An analysis of Airbnb online reviews: user experience in 16 US cities
García-Magariño ABSTUR: an agent-based simulator for tourist urban routes
CN110532464B (zh) 一种基于多旅游上下文建模的旅游推荐方法
Li et al. Study on tourism consumer behavior and countermeasures based on big data
Olivari et al. Are Italian cities already 15-minute? Presenting the Next Proximity Index: A novel and scalable way to measure it, based on open data
Mittal et al. A personalized time-bound activity Recommendation System
Hoang et al. Factors affecting ecotourism loyalty with the moderating role of social influence-Empirical evidence in Vietnam
CN108717640B (zh) 旅游信息的数据处理方法和电子设备
Akter et al. The mediating effects of place satisfaction and support for community: An evaluation of the performance of small and medium tourism enterprises in Bangladesh
CN115470362A (zh) 基于城市时空知识图谱的兴趣点实时推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210525