CN104881472A - 一种基于网络数据收集的旅游线路景点组合推荐方法 - Google Patents

一种基于网络数据收集的旅游线路景点组合推荐方法 Download PDF

Info

Publication number
CN104881472A
CN104881472A CN201510283999.XA CN201510283999A CN104881472A CN 104881472 A CN104881472 A CN 104881472A CN 201510283999 A CN201510283999 A CN 201510283999A CN 104881472 A CN104881472 A CN 104881472A
Authority
CN
China
Prior art keywords
sight spot
sight
combination
spot
spots
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510283999.XA
Other languages
English (en)
Other versions
CN104881472B (zh
Inventor
赵渺希
贾锐澜
吴江月
顾沁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201510283999.XA priority Critical patent/CN104881472B/zh
Publication of CN104881472A publication Critical patent/CN104881472A/zh
Application granted granted Critical
Publication of CN104881472B publication Critical patent/CN104881472B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于网络数据收集的旅游线路景点组合推荐方法,包括:确定某个目标旅游景点的地理位置,并对其区域范围内所有景点进行搜索,将所有景点中的任意两个以及任意三个景点进行组合;对各个景点、二元景点组合、三元景点组合名称的网络文本数量进行统计;获取二元景点组合中每两个景点间的距离,以及计算三元景点组合中每三个景点间两两距离的总和;计算二元景点组合、三元景点组合的关联热度及关联系数;计算各个景点组合中景点所需要花费时间的总和;将各个景点组合中景点所需要花费时间的总和分别与时间阈值进行比较,得到有效的景点组合。本发明可以将词频共现方法运用至不同旅游景点的组合上,继而进行辅助景点推荐。

Description

一种基于网络数据收集的旅游线路景点组合推荐方法
技术领域
本发明涉及一种旅游线路景点推荐方法,尤其是一种基于网络数据收集的旅游线路景点组合推荐方法,属于旅游景点推荐领域。
背景技术
目前网络上现有的旅游景点热度信息如百度指数、百度旅游预测等平台上的数据资料均为单一景点的关注热度,缺乏对多景点之间关联程度的量化表现,导致在具体旅游线路规划中、某既定景点确定的情况下,无法对景点组合进行适宜的选择。
此外,在现有的旅游景点组合推荐方法的专利文献中,如专利号为200810181564.4,名称为“景点推荐装置及方法”的发明专利,对景点组合具有一定的指导意义,但在实践中也存在一定的不足,该专利的主要问题在于:计算景点组合的关联程度时缺少对空间距离、游览时间等实际影响因素的考虑,难以形成合理的景点组合推荐。
发明内容
本发明的目的是为了解决上述现有技术的缺陷,提供了一种基于网络数据收集的旅游线路景点组合推荐方法,该方法可以将词频共现方法运用至不同旅游景点的组合,在贴近现实条件的约束下、使景点组合的关联程度量化,继而进行辅助景点的组合推荐。
本发明的目的可以通过采取如下技术方案达到:
一种基于网络数据收集的旅游线路景点组合推荐方法,包括以下步骤:
S1、对旅游者输入的某个目标旅游景点进行卫星定位,确定该目标旅游景点的地理位置;
S2、在网络地图中对某个以所述目标旅游景点为中心的区域范围内的所有景点进行搜索,并储存所有景点的名称及数量信息,将所有景点中的任意两个以及任意三个景点进行组合,分别得到二元景点组合名称和三元景点组合名称;
S3、获取各个景点所需的一般游览时间,以及在社交网络平台对各个景点名称、各个二元景点组合名称、各个三元景点组合名称的网络文本数量进行统计;
S4、获取二元景点组合中每两个景点间的距离,以及获取三元景点组合中每两个景点间的距离,并叠加计算出每三个景点间两两距离的总和;
S5、根据二元景点组合中每两个景点间的总距离,计算二元景点组合的关联热度及关联系数,以及根据三元景点组合中每三个景点间两两距离的总和,计算三元景点组合的关联热度及关联系数;
S6、根据各个景点所需的一般游览时间,计算各个景点组合中景点所需要花费时间的总和;
S7、根据旅游者选择的旅游模式,将各个景点组合中景点所需要花费时间的总和分别与所选择旅游模式对应的时间阈值进行比较,若所需要花费时间的总和≤时间阈值,则该景点组合作为推荐,即该景点组合为有效的景点组合;若所需要花费时间的总和>时间阈值,则该景点组合不作为推荐;
S8、将有效的景点组合按关联热度大小排序后输出。
作为一种实施方案,步骤S3中,所述获取各个景点所需的一般游览时间,具体为:搜索各个景点的详细网络信息,统计游览各个景点所需的时间范围,取平均值后进行记录。
作为一种实施方案,步骤S3中,所述在社交网络平台对各个景点名称、各个二元景点组合名称、各个三元景点组合名称的网络文本数量进行统计,具体包括:
S31、利用网络文本数据库,对各个景点名称进行搜索,得到含有各个景点名称的网络文本数量,该数量记为Sx,其中X表示景点X,以此作为在网络文本数据库中各景点出现的词频数的依据;
S32、利用网络文本数据库,对各个二元景点组合的名称进行搜索,得到含有各个二元景点组合名称的网络文本数量,记为Sx∩y,其中X、Y分别表示景点X和景点Y,以此作为在网络文本数据库中各景点组合出现的词频数的依据;
S33、利用网络文本数据库,直接对各个三元景点组合名称进行搜索,得到含有各景点组合名称的网络文本数量,记为Sx∩y∩Z,其中X、Y、Z分别表示景点X、景点Y和景点Z,以此作为在网络文本数据库中各景点组合出现的词频数的依据。
作为一种实施方案,步骤S4中,所述获取二元景点组合中每两个景点间的距离,具体为:
将二元景点组合名称提取出来,连入网络数据库,在百度地图中分别拾取两个景点对应的地理位置信息,并获取两个景点间的实际距离,而两个景点间的实际距离的两倍即为两个景点间的总距离,总距离记为dxy,其中X、Y分别表示景点X和景点Y。
作为一种实施方案,步骤S4中,所述获取三元景点组合中每两个景点间的距离,并叠加计算出每三个景点间两两距离的总路程,具体为:
将三元景点组合名称提取出来,连入网络数据库,在百度地图中分别拾取三个景点对应的地理位置信息,并获取每两个景点间的实际距离dxy、dxz和dyz,其中X、Y、Z分别表示景点X、景点Y和景点Z;将dxy、dxz和dyz相加,得到三元景点组合中每三个景点间两两距离的总和。
作为一种实施方案,步骤S5中,所述二元景点组合的关联热度的计算,具体为:
给定一个关联规则X+Y,它表示在所规划的一条一日游旅游线路中,将景点X和景点Y作为相邻的两个旅游目的地;将X+Y这一规则出现的可能性量化,定义为X+Y的关联热度,记为P(x+y),而将X景点的词频数记为Sx、Y景点的词频数记为Sy,X景点和Y景点组合的词频数记为Sx∩y,给定一个关系式,即:
P ( x + y ) = S x ∩ y S x + S y - S x ∩ y
该式表示将景点X和景点Y作为相邻的两个旅游目的地的可能性,P值越高,表示可能性越大。
作为一种实施方案,步骤S5中,所述二元景点组合的关联系数通过下式计算:
R x ∩ y = P x ∩ y d 2
关联系数Sx∩y表示景点X和景点Y的关联程度;关联热度Px∩y表示景点X和景点Y这一组合的关注热度;d表示两个景点间的总距离。
作为一种实施方案,步骤S5中,所述三元景点组合的关联热度的计算,具体为:
给定一个关联规则X+Y+Z,它表示在规划的一条一日游旅游线路中,将景点X、景点Y和景点Z作为相邻的三个旅游目的地;将X+Y+Z这一规则出现的可能性量化,定义为X+Y+Z的关热度数,记为P(x+y+z),而将X景点的词频数记为Sx、Y景点的词频数记为Sy,X景点和Y景点组合的词频数记为Sx∩y,X景点和Z景点组合的词频数记为Sx∩z,Y景点和Z景点组合的词频数记为Sy∩z,X景点、Y景点和Z景点组合的词频数记为Sx∩y∩Z,给定一个关系式,即:
P ( x + y + z ) = S x ∩ y ∩ z S x + S y + S z - S x ∩ y - S x ∩ z - S y ∩ z + S x ∩ y ∩ z
该式表示景点X、景点Y和景点Z作为相邻的三个旅游目的地的可能性,P值越高,可能性越大。
作为一种实施方案,步骤S5中,所述三元景点组合的关联系数通过下式计算:
R x ∩ y ∩ z = P x ∩ y ∩ z d 2
关联系数Rx∩y∩Z表示景点X、景点Y和景点Z的关联程度;关联热度Px∩y∩z表示景点X、景点Y和景点Z这一组合的关注热度;d表示三个景点间两两距离的总和。
本发明相对于现有技术具有如下的有益效果:
1、本发明所使用的词频共现方法基于网络文本数据库,通过同时搜索两个及以上词语的组合,根据搜索结果数量得到该词语组合的网络词频。通过词频共现的方法能够表现出任意两个词语的关联情况,通过具体的数值分析可以将这一关联情况量化,将该方法运用至不同旅游景点的组合上,使景点组合的关联程度量化,继而辅助景点推荐。
2、本发明所使用的数据来源于社交网络平台的搜索结果,利用了在旅游景点组合方面的网络关注度,将景点之间实际关联程度建立在实时更新的网络关注度的基础上,再加上空间距离和游览时间这2个主要影响因素的约束,使得计算出的景点关联程度更具有时效性和真实性,在实际应用上更具竞争力。
3、本发明量化景点组合关联程度的方法依据了社会物理学的引力模型,将空间相互作用理论应用到旅游景点的选择方面。
附图说明
图1为本发明实施例1的基于网络数据收集的旅游线路景点组合推荐方法的流程图。
图2为本发明实施例1的二元景点组合中景点X和景点Y的词频共现示意图。
图3为本发明实施例1的三元景点组合中景点X、景点Y和景点Z的词频共现示意图。
图4为本发明实施例1的各个景点关联热度与距离示意图(景点的圆越大代表该景点的网络关注度越高)。
图5为本发明实施例1的关联程度最高的二元景点组合示意图(景点的圆越大代表该景点的网络关注度越高)。
图6本发明实施例1的关联程度最高的三元景点组合示意图(景点的圆越大代表该景点的网络关注度越高)。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1:
如图1所示,本实施例的旅游线路景点组合推荐方法包括以下步骤:
1)旅游者在系统中输入某目标旅游景点A,在本实施例中定义A为旅游线路中首个旅游景点(以广州的花城广场为例),且假定旅游者最终回到出发地;
2)系统接收到旅游者输入的信息后,对目标旅游景点A进行卫星定位,确定其地理位置;
3)在网络地图中对某范围内所有景点进行搜索
在本步骤中,利用网络地图在以该目标旅游景点A为中心、半径100km以内的区域范围内搜索所有旅游景点;
4)储存所有景点名称及数量的信息,如下表1所示;
景点名称
花城广场
黄埔军校旧址
陈家祠
荔枝湾涌
白云山
越秀公园
表1 以花城广场为示例的部分周边景点
5)将所有景点中的任意两个景点进行组合
在该步骤中,不考虑每两个景点间的先后顺序,每个景点和其余景点的组合有且仅有一次,如下表2所示;
景点的二元组合名称
花城广场∩黄埔军校旧址
花城广场∩陈家祠
花城广场∩荔枝湾
花城广场∩白云山
花城广场∩越秀公园
表2 二元景点组合的组合结果示例
6)将所有景点中的任意三个景点进行组合。
在该步骤中,不考虑每三个景点间的先后顺序,每个景点和其余任意两个个景点的组合有且仅有一次,得到二元景点组合名称如下表3所示;
景点的三元组合名称
花城广场∩黄埔军校旧址∩陈家祠
花城广场∩黄埔军校旧址∩荔枝湾
花城广场∩黄埔军校旧址∩白云山
花城广场∩黄埔军校旧址∩越秀公园
花城广场∩陈家祠∩荔枝湾
花城广场∩陈家祠∩白云山
花城广场∩陈家祠∩越秀公园
花城广场∩荔枝湾∩白云山
花城广场∩荔枝湾∩越秀公园
花城广场∩白云山∩越秀公园
表3 三元景点组合的组合结果示例
7)获取游览各个景点所需的一般游览时间
搜索各个景点的详细网络信息,统计游览各个景点所需的时间范围,取平均值后,以小时为单位进行记录,得到三元景点组合名称如下表4所示;
景点名称 游览用时t(h)
花城广场 3
黄埔军校旧址 1
陈家祠 1
荔枝湾涌 2
白云山 3
越秀公园 3
表4 各个景点游览用时示例表
8)在社交网络平台中,对步骤4)中得到的景点名称的网络文本(如微博)数量进行统计
在本步骤中,利用网络文本数据库,对各个景点名称进行搜索,得到含有各个景点名称的网络文本(如微博)数量,该数量记为Sx,其中X表示景点X。以此作为在网络文本数据库中各景点出现的词频数的依据,如下表5所示;
景点名称 搜索关键词 搜索数量
花城广场 花城广场 3703620
黄埔军校旧址 黄埔军校旧址 181498
陈家祠 陈家祠 1604437
荔枝湾涌 荔枝湾 2169492
白云山 广州白云山 6768556
越秀公园 越秀公园 1571244
表5 各个景点名称在微博搜索结果数量的示例表
9)在社交网络平台中,对步骤5)中得到的二元景点组合名称的网络文本(如微博)数量进行统计
在本步骤中,利用网络文本数据库,对各个二元景点组合的名称进行搜索,得到含有各景点组合名称的网络文本(如微博)数量,记为Sx∩y,其中X、Y分别表示景点X和景点Y,如图2所示,以此作为在网络文本数据库中各景点组合出现的词频数的依据,如下表6所示;
二元景点组合名称 搜索关键词 搜索结果量
花城广场∩黄埔军校旧址 花城广场 黄埔军校 511
花城广场∩陈家祠 花城广场 陈家祠 741
花城广场∩荔枝湾 花城广场 荔枝湾 57736
花城广场∩白云山 花城广场 白云山 292804
花城广场∩越秀公园 花城广场 越秀公园 98977
表6 二元景点组合名称在微博搜索结果数量的示例表
10)在社交网络平台中,对步骤6)中得到的景点的三元组合名称的网络文本(如微博)数量进行统计
在本步骤中,利用网络文本数据库,直接对各个三元景点组合名称进行搜索,得到含有各景点组合名称的网络文本数量,记为Sx∩y∩Z,其中X、Y、Z分别表示景点X、景点Y和景点Z,如图3所示,以此作为在网络文本(如微博)数据库中各景点组合出现的词频数的依据,如下表7所示;
三元景点组合名称 搜索关键词 搜索结果量
花城广场∩黄埔军校旧址∩陈家祠 花城广场 黄埔军校 陈家祠 43
花城广场∩黄埔军校旧址∩荔枝湾 花城广场 黄埔军校 荔枝湾 56
花城广场∩黄埔军校旧址∩白云山 花城广场 黄埔军校 白云山 45
花城广场∩黄埔军校旧址∩越秀公园 花城广场 黄埔军校 越秀公园 299
花城广场∩陈家祠∩荔枝湾 花城广场 陈家祠 荔枝湾 209
花城广场∩陈家祠∩白云山 花城广场 陈家祠 白云山 134
花城广场∩陈家祠∩越秀公园 花城广场 陈家祠 越秀公园 58
花城广场∩荔枝湾∩白云山 花城广场 荔枝湾 白云山 568
花城广场∩荔枝湾∩越秀公园 花城广场 荔枝湾 越秀公园 66
花城广场∩白云山∩越秀公园 花城广场 白云山 越秀公园 119
表7 三元景点组合名称在微博搜索数量结果的示例表
11)获取步骤5)中二元景点组合中每两个景点间的距离
在本步骤中,将步骤5)中得到的景点组合名称提取出来,连入网络数据库,在百度地图中分别拾取两个景点对应的地理位置信息,并获取两个景点间的实际距离;假定旅游路线完整封闭,且旅游者最终回到起点,故在二元景点组合问题上,将两个景点间的总距离计算为来回的路程之和,即为两个景点间距离的两倍,总距离记为dxy,X、Y分别表示景点X和景点Y,如下表8所示;
二元景点组合名称 距离d(km)
花城广场∩黄埔军校旧址 42.88
花城广场∩陈家祠 21.00
花城广场∩荔枝湾涌 25.82
花城广场∩白云山 16.48
花城广场∩越秀公园 17.34
表8 二元景点组合的景点间距离示例表
12)获取步骤6)中三元景点组合中每两个景点间的距离,并叠加计算出每三个景点间两两距离的总和。
在本步骤中,将步骤6)中得到的景点组合名称提取出来,连入网络数据库,在百度地图中分别拾取3个景点对应的地理位置信息,并获取每两个景点之间的实际距离dxy、dxz和dyz,X、Y、Z分别表示景点X、景点Y和景点Z;将dxy、dxz和dyz相加,得到三元景点组合中每三个景点间两两距离的总和,如下表9所示;
三元景点组合名称 距离d(km)
花城广场∩黄埔军校旧址∩陈家祠 62.23
花城广场∩黄埔军校旧址∩荔枝湾 64.3
花城广场∩黄埔军校旧址∩白云山 57.57
花城广场∩黄埔军校旧址∩越秀公园 58.47
花城广场∩陈家祠∩荔枝湾 27.78
花城广场∩陈家祠∩白云山 27.78
花城广场∩陈家祠∩越秀公园 23.73
花城广场∩荔枝湾∩白云山 30.24
花城广场∩荔枝湾∩越秀公园 26.19
花城广场∩白云山∩越秀公园 24
表9 三元景点组合的景点距离总和示例表
13)计算二元景点组合的关联热度P
在本步骤中,给定一个关联规则,形如X+Y,它表示在所规划的一条一日游旅游线路中,将景点X和景点Y作为相邻的两个旅游目的地;将X+Y这一规则出现的可能性量化,定义为X+Y的关联热度,记为P(x+y),而将X景点的词频数记为Sx、Y景点的词频数记为Sy,X景点和Y景点组合的词频数记为Sx∩y,给定一个关系式,即:
P ( x + y ) = S x ∩ y S x + S y - S x ∩ y
该式表示将景点X和景点Y作为相邻的两个旅游目的地的可能性,P值越高,可能性越大,如下表10所示;
2阶景点组合名称 搜索关键词 搜索结果量 关联热度P
花城广场∩黄埔军校旧址 花城广场 黄埔军校 511 0.000132
花城广场∩陈家祠 花城广场 陈家祠 741 0.00014
花城广场∩荔枝湾 花城广场 荔枝湾 57736 0.009928
花城广场∩白云山 花城广场 白云山 292804 0.028764
花城广场∩越秀公园 花城广场 越秀公园 98977 0.019123
表10 二元景点组合计算得出的关联热度示例表
14)计算三元景点组合的关联热度P
在本步骤中,给定一个关联规则,形如X+Y+Z,它表示在规划的一条一日游旅游线路中,将景点X、景点Y和景点Z作为相邻的三个旅游目的地。将X+Y+Z这一规则出现的可能性量化,定义为X+Y+Z的关热度数,记为P(x+y+z),而将X景点的词频数记为Sx、Y景点的词频数记为Sy,X景点和Y景点组合的词频数记为Sx∩y,X景点和Z景点组合的词频数记为Sx∩z,Y景点和Z景点组合的词频数记为Sy∩z,X景点、Y景点和Z景点组合的词频数记为Sx∩y∩Z。给定一个关系式,即:
P ( x + y + z ) = S x ∩ y ∩ z S x + S y + S z - S x ∩ y - S x ∩ z - S y ∩ z + S x ∩ y ∩ z
该式就表示景点X、景点Y和景点Z作为相邻的3个旅游目的地的可能性,P值越高,可能性越大,如下表11所示;
表11 三元景点组合计算得出的关联热度示例表
各个景点关联热度与距离可如图4所示。
15)计算二元景点组合的关联系数R
在本步骤中,对关联系数R以及关联热度P建立一个关系式,首先需要明确景点之间的实际关联程度受多种实际因素的影响,本实施例使用空间距离以及游览时间这2个主要影响因素来约束R和P两者的关系;
在关系式的建立中,本实施例引用社会物理学中的引力模型来处理,将研究的问题理解为研究两个地点之间的吸引力,基于空间相互作用理论,主体间相互作用及联系强度一方面受距离影响,另一方面与两地的规模有关,在旅游的问题中,将规模看做人群的聚集情况;则有引力模型的形式为:
R x ∩ y = GM x M y d 2
Rx∩y表示一段时间内旅游者先后到达景点X与景点Y的需求程度,即两地的相对吸引力;Mx、My分别表示一段时间内人群在景点X与景点Y的聚集程度;d表示两个景点之间的距离;G是引力常量。
由于在本实施例涉及的问题中,不要求具体数值,而是对于所有样本数据之间的比较,因此我们将关系式中的常量G舍去;此外,人群关注程度可与人群聚集程度对应,因两者呈正相关,因此,将MxMy简化为Px∩y,最终得到关系式为:
R x ∩ y = P x ∩ y d 2
关联系数Rx∩y表示景点X和景点Y的关联程度;关联热度Px∩y表示景点X和景点Y这一组合的关注热度;d表示两个景点间的总距离,即上述两个景点间距离的两倍,二元景点组合的关联系数如下表12所示,其中关联程度最高的二元景点组合如图5所示;
二元景点组合名称 关联系数R
花城广场∩黄埔军校旧址 7.17901E-08
花城广场∩陈家祠 3.1416E-07
花城广场∩荔枝湾 1.48919E-05
花城广场∩白云山 0.000104636
花城广场∩越秀公园 6.36001E-05
表12 二元景点组合计算得出的关联系数示例表
16)计算三元景点组合的关联系数R
在本步骤中,将步骤15)中的推演过程推衍至景点的三元组合,得到关系式为:
R x ∩ y ∩ z = P x ∩ y ∩ z d 2
关联系数Rx∩y∩Z表示景点X、景点Y和景点Z的关联程度;关联热度Px∩y∩z表示景点X、景点Y和景点Z这一组合的关注热度;d表示三个景点间两两距离的总和,三元景点组合的关联系数如下表13所示,其中关联程度最高的三元景点组合如图6所示;
三元景点组合名称 关联系数R
花城广场∩黄埔军校旧址∩陈家祠 2.02346E-09
花城广场∩黄埔军校旧址∩荔枝湾 2.25886E-09
花城广场∩黄埔军校旧址∩白云山 1.31064E-09
花城广场∩黄埔军校旧址∩越秀公园 1.63284E-08
花城广场∩陈家祠∩荔枝湾 3.66245E-08
花城广场∩陈家祠∩白云山 1.47774E-08
花城广场∩陈家祠∩越秀公园 1.53323E-08
花城广场∩荔枝湾∩白云山 5.09257E-08
花城广场∩荔枝湾∩越秀公园 1.32182E-08
花城广场∩白云山∩越秀公园 1.7813E-08
表13 三元景点组合计算得出的关联系数示例表
17)计算各个景点组合中景点所需要花费时间的总和t
在本步骤中,提取步骤7)中得到的游览各个景点所需的一般游览时间,计算各个景点组合中景点所需要花费的时间的总和t。
18)设置时间阀值T
在本步骤中,确定一天内最佳旅游小时数,并将其设置为时间阀值T,该时间阀值T的数值大小可因旅游者的要求而上下浮动,若旅游者偏好轻松的行程,则时间阀值T向下浮动;若旅游者偏好紧凑的行程,则时间阀值T向上浮动;
19)旅游者选择旅游模式
在本步骤中,可由旅游者选择的旅游模式,例如“轻松”到“紧凑”不等,以此确定时间阀值T的数值,时间阀值T作为约束景点选择的条件之一,对于给定的景点,其游览时间总和不得多于一定的阀值,以免旅行者的旅行舒适度下降;
20)将景点组合总用时t带入条件中进行筛选
在本步骤中,将步骤17)中的各个景点组合中景点所需要花费的时间的总和t与时间阀值T(在本实施例中,暂使用T=6小时这一数值进行计算)进行比较,若t≤T,则该景点组合作为推荐,即该景点组合为有效的景点组合,若t>T,则该景点组合不作为推荐,如下表14和表15所示;
二元景点组合名称 t(h) 是否推荐
花城广场∩黄埔军校旧址 4
花城广场∩陈家祠 4
花城广场∩荔枝湾 5
花城广场∩白云山 6
花城广场∩越秀公园 6
表14 所有二元景点组合经过阀值筛选后的结果示例表
三元景点组合名称 t(h) 是否推荐
花城广场∩黄埔军校旧址∩陈家祠 5
花城广场∩黄埔军校旧址∩荔枝湾 6
花城广场∩黄埔军校旧址∩白云山 7
花城广场∩黄埔军校旧址∩越秀公园 7
花城广场∩陈家祠∩荔枝湾 6
花城广场∩陈家祠∩白云山 7
花城广场∩陈家祠∩越秀公园 7
花城广场∩荔枝湾∩白云山 8
花城广场∩荔枝湾∩越秀公园 8
花城广场∩白云山∩越秀公园 9
表15 所有三元景点组合经过阀值筛选后的结果示例表
21)将有效的景点组合按关联程度P的大小排序后依次输出
在本步骤中,将步骤20)中得到的有效的景点组合按关联程度P的大小进行排序,按照由大到小的顺序依次输出景点组合名称,如下表16和表17所示;
二元景点组合名称 关联系数R
花城广场∩白云山 0.000104636
花城广场∩越秀公园 6.36001E-05
花城广场∩荔枝湾 1.48919E-05
花城广场∩陈家祠 3.1416E-07
花城广场∩黄埔军校旧址 7.17901E-08
表16 最终按关联程度降序输出的二元景点组合推荐结果示例表
三元景点组合名称 关联系数R
花城广场∩陈家祠∩荔枝湾 2.25886E-09
花城广场∩黄埔军校旧址∩荔枝湾 5.09257E-08
花城广场∩黄埔军校旧址∩陈家祠 1.32182E-08
表17 最终按关联程度降序输出的三元景点组合推荐结果示例表
22)旅游者对所推荐的关联程度P依次下降的景点组合进行选择。
综上所述,本发所使用的词频共现方法基于网络文本数据库,通过同时搜索两个及以上词语的组合,根据搜索结果数量得到该词语组合的网络词频。通过词频共现的方法能够表现出任意两个词语的关联情况,通过具体的数值分析可以将这一关联情况量化,将该方法运用至不同旅游景点的组合上,使景点组合的关联程度量化,继而辅助景点推荐;所使用的数据来源于社交网络平台的搜索结果,利用了在旅游景点组合方面的网络关注度,将景点之间实际关联程度建立在实时更新的网络关注度的基础上,再加上空间距离和游览时间这2个主要影响因素的约束,使得计算出的景点关联程度更具有时效性和真实性,在实际应用上更具竞争力。
以上所述,仅为本发明专利优选的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。

Claims (9)

1.一种基于网络数据收集的旅游线路景点组合推荐方法,其特征在于:所述方法包括以下步骤:
S1、对旅游者输入的某个目标旅游景点进行卫星定位,确定该目标旅游景点的地理位置;
S2、在网络地图中对某个以所述目标旅游景点为中心的区域范围内的所有景点进行搜索,并储存所有景点的名称及数量信息,将所有景点中的任意两个以及任意三个景点进行组合,分别得到二元景点组合名称和三元景点组合名称;
S3、获取各个景点所需的一般游览时间,以及在社交网络平台对各个景点名称、各个二元景点组合名称、各个三元景点组合名称的网络文本数量进行统计;
S4、获取二元景点组合中每两个景点间的距离,以及获取三元景点组合中每两个景点间的距离,并叠加计算出每三个景点间两两距离的总和;
S5、根据二元景点组合中每两个景点间的总距离,计算二元景点组合的关联热度及关联系数,以及根据三元景点组合中每三个景点间两两距离的总和,计算三元景点组合的关联热度及关联系数;
S6、根据各个景点所需的一般游览时间,计算各个景点组合中景点所需要花费时间的总和;
S7、根据旅游者选择的旅游模式,将各个景点组合中景点所需要花费时间的总和分别与所选择旅游模式对应的时间阈值进行比较,若所需要花费时间的总和≤时间阈值,则该景点组合作为推荐,即该景点组合为有效的景点组合;若所需要花费时间的总和>时间阈值,则该景点组合不作为推荐;
S8、将有效的景点组合按关联热度大小排序后输出。
2.根据权利要求1所述的一种基于网络数据收集的旅游线路景点组合推荐方法,其特征在于:步骤S3中,所述获取各个景点所需的一般游览时间,具体为:搜索各个景点的详细网络信息,统计游览各个景点所需的时间范围,取平均值后进行记录。
3.根据权利要求1所述的一种基于网络数据收集的旅游线路景点组合推荐方法,其特征在于:步骤S3中,所述在社交网络平台对各个景点名称、各个二元景点组合名称、各个三元景点组合名称的网络文本数量进行统计,具体包括:
S31、利用网络文本数据库,对各个景点名称进行搜索,得到含有各个景点名称的网络文本数量,该数量记为Sx,其中X表示景点X,以此作为在网络文本数据库中各景点出现的词频数的依据;
S32、利用网络文本数据库,对各个二元景点组合的名称进行搜索,得到含有各个二元景点组合名称的网络文本数量,记为Sx∩y,其中X、Y分别表示景点X和景点Y,以此作为在网络文本数据库中各景点组合出现的词频数的依据;
S33、利用网络文本数据库,直接对各个三元景点组合名称进行搜索,得到含有各景点组合名称的网络文本数量,记为Sx∩y∩z,其中X、Y、Z分别表示景点X、景点Y和景点Z,以此作为在网络文本数据库中各景点组合出现的词频数的依据。
4.根据权利要求1所述的一种基于网络数据收集的旅游线路景点组合推荐方法,其特征在于:步骤S4中,所述获取二元景点组合中每两个景点间的距离,具体为:
将二元景点组合名称提取出来,连入网络数据库,在百度地图中分别拾取两个景点对应的地理位置信息,并获取两个景点间的实际距离,而两个景点间的实际距离的两倍即为两个景点间的总距离,总距离记为dxy,其中X、Y分别表示景点X和景点Y。
5.根据权利要求1所述的一种基于网络数据收集的旅游线路景点组合推荐方法,其特征在于:步骤S4中,所述获取三元景点组合中每两个景点间的距离,并叠加计算出每三个景点间两两距离的总路程,具体为:
将三元景点组合名称提取出来,连入网络数据库,在百度地图中分别拾取三个景点对应的地理位置信息,并获取每两个景点间的实际距离dxy、dxz和dyz,其中X、Y、Z分别表示景点X、景点Y和景点Z;将dxy、dxz和dyz相加,得到三元景点组合中每三个景点间两两距离的总和。
6.根据权利要求1所述的一种基于网络数据收集的旅游线路景点组合推荐方法,其特征在于:步骤S5中,所述二元景点组合的关联热度的计算,具体为:
给定一个关联规则X+Y,它表示在所规划的一条一日游旅游线路中,将景点X和景点Y作为相邻的两个旅游目的地;将X+Y这一规则出现的可能性量化,定义为X+Y的关联热度,记为P(x+y),而将X景点的词频数记为Sx、Y景点的词频数记为Sy,X景点和Y景点组合的词频数记为Sx∩y,给定一个关系式,即:
P ( x + y ) = S x ∩ y S x + S y - S x ∩ y
该式表示将景点X和景点Y作为相邻的两个旅游目的地的可能性,P值越高,表示可能性越大。
7.根据权利要求6所述的一种基于网络数据收集的旅游线路景点组合推荐方法,其特征在于:步骤S5中,所述二元景点组合的关联系数通过下式计算:
R x ∩ y = R x ∩ y d 2
关联系数Rx∩y表示景点X和景点Y的关联程度;关联热度Px∩y表示景点X和景点Y这一组合的关注热度;d表示两个景点间的总距离。
8.根据权利要求1所述的一种基于网络数据收集的旅游线路景点组合推荐方法,其特征在于:步骤S5中,所述三元景点组合的关联热度的计算,具体为:
给定一个关联规则X+Y+Z,它表示在规划的一条一日游旅游线路中,将景点X、景点Y和景点Z作为相邻的三个旅游目的地;将X+Y+Z这一规则出现的可能性量化,定义为X+Y+Z的关热度数,记为P(x+y+z),而将X景点的词频数记为Sx、Y景点的词频数记为Sy,X景点和Y景点组合的词频数记为Sx∩y,X景点和Z景点组合的词频数记为Sx∩z,Y景点和Z景点组合的词频数记为Sy∩z,X景点、Y景点和Z景点组合的词频数记为Sx∩y∩z,给定一个关系式,即:
P ( x + y + z ) = X x ∩ y ∩ z S x + S y + S z - S x ∩ y - S x ∩ z - S y ∩ z + S x ∩ y ∩ z
该式表示景点X、景点Y和景点Z作为相邻的三个旅游目的地的可能性,P值越高,可能性越大。
9.根据权利要求8所述的一种基于网络数据收集的旅游线路景点组合推荐方法,其特征在于:步骤S5中,所述三元景点组合的关联系数通过下式计算:
R x ∩ y ∩ z = P x ∩ y ∩ z d 2
关联系数Rx∩y∩z表示景点X、景点Y和景点Z的关联程度;关联热度Px∩y∩z表示景点X、景点Y和景点Z这一组合的关注热度;d表示三个景点间两两距离的总和。
CN201510283999.XA 2015-05-28 2015-05-28 一种基于网络数据收集的旅游线路景点组合推荐方法 Active CN104881472B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510283999.XA CN104881472B (zh) 2015-05-28 2015-05-28 一种基于网络数据收集的旅游线路景点组合推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510283999.XA CN104881472B (zh) 2015-05-28 2015-05-28 一种基于网络数据收集的旅游线路景点组合推荐方法

Publications (2)

Publication Number Publication Date
CN104881472A true CN104881472A (zh) 2015-09-02
CN104881472B CN104881472B (zh) 2018-09-14

Family

ID=53948965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510283999.XA Active CN104881472B (zh) 2015-05-28 2015-05-28 一种基于网络数据收集的旅游线路景点组合推荐方法

Country Status (1)

Country Link
CN (1) CN104881472B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184422A (zh) * 2015-09-28 2015-12-23 华南理工大学 一种基于互联网词频的智慧旅游线路规划辅助方法
WO2017054330A1 (zh) * 2015-09-29 2017-04-06 百度在线网络技术(北京)有限公司 资源组合处理方法、装置、设备及计算机存储介质
CN106600482A (zh) * 2016-12-30 2017-04-26 西北工业大学 多源社交数据融合的多角度旅游信息感知与智能推荐方法
WO2017128003A1 (zh) * 2016-01-25 2017-08-03 郭子明 推荐景点时的技术信息采集方法以及推荐系统
WO2017128004A1 (zh) * 2016-01-25 2017-08-03 郭子明 景点推荐时的技术信息展示方法以及推荐系统
WO2017128005A1 (zh) * 2016-01-25 2017-08-03 郭子明 根据时间推荐景点的方法以及推荐系统
CN107451903A (zh) * 2017-08-18 2017-12-08 四川融慧文创旅游资源开发有限公司 定制化旅游的方法及装置
CN109522345A (zh) * 2018-11-19 2019-03-26 百度在线网络技术(北京)有限公司 用于显示信息的方法及装置
CN110333682A (zh) * 2019-07-18 2019-10-15 乐播新瑞(北京)文化传媒有限公司 一种远程自动化音频控制中控系统及其音频播放控制方法
CN107729610B (zh) * 2017-09-15 2019-12-10 华南理工大学 一种基于网络游记的旅游推荐线路图生成方法
CN117575117A (zh) * 2023-10-23 2024-02-20 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 城市成熟型游憩区慢行空间连接网络推荐方法、系统及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101738188A (zh) * 2008-11-27 2010-06-16 财团法人资讯工业策进会 景点推荐装置和方法
CN103020308A (zh) * 2013-01-07 2013-04-03 北京趣拿软件科技有限公司 旅游攻略项目的推荐方法及装置
US20130226622A1 (en) * 2012-02-08 2013-08-29 Tomtom North America Inc. Methods Using Speed Distribution Profiles
CN103678429A (zh) * 2012-09-26 2014-03-26 阿里巴巴集团控股有限公司 一种旅游线路的推荐方法以及装置
CN104463730A (zh) * 2014-12-29 2015-03-25 广州神马移动信息科技有限公司 基于旅游目标地域来挖掘旅游路线的方法和设备
CN104504064A (zh) * 2014-12-19 2015-04-08 百度在线网络技术(北京)有限公司 一种信息推荐方法和装置
CN104537070A (zh) * 2014-12-29 2015-04-22 广州神马移动信息科技有限公司 挖掘旅游目的地景点的方法和设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101738188A (zh) * 2008-11-27 2010-06-16 财团法人资讯工业策进会 景点推荐装置和方法
US20130226622A1 (en) * 2012-02-08 2013-08-29 Tomtom North America Inc. Methods Using Speed Distribution Profiles
CN103678429A (zh) * 2012-09-26 2014-03-26 阿里巴巴集团控股有限公司 一种旅游线路的推荐方法以及装置
CN103020308A (zh) * 2013-01-07 2013-04-03 北京趣拿软件科技有限公司 旅游攻略项目的推荐方法及装置
CN104504064A (zh) * 2014-12-19 2015-04-08 百度在线网络技术(北京)有限公司 一种信息推荐方法和装置
CN104463730A (zh) * 2014-12-29 2015-03-25 广州神马移动信息科技有限公司 基于旅游目标地域来挖掘旅游路线的方法和设备
CN104537070A (zh) * 2014-12-29 2015-04-22 广州神马移动信息科技有限公司 挖掘旅游目的地景点的方法和设备

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184422A (zh) * 2015-09-28 2015-12-23 华南理工大学 一种基于互联网词频的智慧旅游线路规划辅助方法
WO2017054330A1 (zh) * 2015-09-29 2017-04-06 百度在线网络技术(北京)有限公司 资源组合处理方法、装置、设备及计算机存储介质
US10521437B2 (en) 2015-09-29 2019-12-31 Baidu Online Network Technology (Beijing) Co., Ltd. Resource portfolio processing method, device, apparatus and computer storage medium
WO2017128003A1 (zh) * 2016-01-25 2017-08-03 郭子明 推荐景点时的技术信息采集方法以及推荐系统
WO2017128004A1 (zh) * 2016-01-25 2017-08-03 郭子明 景点推荐时的技术信息展示方法以及推荐系统
WO2017128005A1 (zh) * 2016-01-25 2017-08-03 郭子明 根据时间推荐景点的方法以及推荐系统
CN106600482A (zh) * 2016-12-30 2017-04-26 西北工业大学 多源社交数据融合的多角度旅游信息感知与智能推荐方法
CN107451903A (zh) * 2017-08-18 2017-12-08 四川融慧文创旅游资源开发有限公司 定制化旅游的方法及装置
CN107729610B (zh) * 2017-09-15 2019-12-10 华南理工大学 一种基于网络游记的旅游推荐线路图生成方法
CN109522345A (zh) * 2018-11-19 2019-03-26 百度在线网络技术(北京)有限公司 用于显示信息的方法及装置
CN110333682A (zh) * 2019-07-18 2019-10-15 乐播新瑞(北京)文化传媒有限公司 一种远程自动化音频控制中控系统及其音频播放控制方法
CN117575117A (zh) * 2023-10-23 2024-02-20 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 城市成熟型游憩区慢行空间连接网络推荐方法、系统及介质

Also Published As

Publication number Publication date
CN104881472B (zh) 2018-09-14

Similar Documents

Publication Publication Date Title
CN104881472A (zh) 一种基于网络数据收集的旅游线路景点组合推荐方法
CN109977283B (zh) 一种基于知识图谱和用户足迹的旅游推荐方法和系统
WO2016107417A1 (zh) 基于旅游目标地域来挖掘旅游路线的方法和设备
Zheng et al. GeoLife: A collaborative social networking service among user, location and trajectory.
CN104050196B (zh) 一种兴趣点数据冗余检测方法及装置
CN106407352B (zh) 基于深度学习的交通图像检索方法
CN104537027B (zh) 信息推荐方法及装置
Hood et al. A GPS-based bicycle route choice model for San Francisco, California
CN102102992B (zh) 基于多级网络划分的匹配道路初筛方法及地图匹配系统
CN107024217B (zh) 城际交通的路线规划的方法、装置及系统
CN107195180B (zh) 一种基于电警数据的交通出行轨迹提取方法和装置
CN110264709A (zh) 基于图卷积网络的道路的交通流量的预测方法
CN103823900B (zh) 信息点重要性确定方法和装置
Mishra et al. A Sentiment analysis-based hotel recommendation using TF-IDF Approach
CN105677804A (zh) 权威站点的确定以及权威站点数据库的建立方法和装置
CN103605752A (zh) 一种基于语义识别的地址匹配方法
CN104850604A (zh) 一种基于张量的用户轨迹挖掘方法
CN109284498A (zh) 自提柜推荐方法、自提柜推荐装置和电子装置
CN103808325A (zh) 交通出行方案的生成方法及装置
CN105184422A (zh) 一种基于互联网词频的智慧旅游线路规划辅助方法
CN110263840B (zh) 一种线路分析方法、装置及程序产品、存储介质
CN104636457B (zh) 一种位置搜索认知的方法及装置
CN106708837A (zh) 兴趣点搜索方法、装置
Lee et al. Crowd-sourced carpool recommendation based on simple and efficient trajectory grouping
KR102370988B1 (ko) 사용자 빅데이터를 활용한 여행 정보 제공 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant