CN105468679A - 一种旅游信息处理与方案提供方法 - Google Patents

一种旅游信息处理与方案提供方法 Download PDF

Info

Publication number
CN105468679A
CN105468679A CN201510782529.8A CN201510782529A CN105468679A CN 105468679 A CN105468679 A CN 105468679A CN 201510782529 A CN201510782529 A CN 201510782529A CN 105468679 A CN105468679 A CN 105468679A
Authority
CN
China
Prior art keywords
information
sight spot
label
spot
sight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510782529.8A
Other languages
English (en)
Other versions
CN105468679B (zh
Inventor
胡艳丽
谭真
白亮
邬郑
王宇恒
方阳
李清韦
张飞宇
张笑楠
秦煜东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201510782529.8A priority Critical patent/CN105468679B/zh
Publication of CN105468679A publication Critical patent/CN105468679A/zh
Application granted granted Critical
Publication of CN105468679B publication Critical patent/CN105468679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种旅游信息处理与方案提供方法,包括:获取旅游景点相关信息;对旅游景点相关信息进行结构化处理获得景点有效信息,并将结构化的景点有效信息存储于数据库中;对景点有效信息进行分布式标签分类,将所有景点划入多个风景区,并将景点划分信息存储于数据库中;获取用户需求,并根据用户需求与数据库中的景点有效信息与景点划分信息生成推荐路游线路;将推荐路游线路反馈给用户。本发明能从互联网纷繁复杂的信息中获取景点有效信息,并针对游客的个性化需求提出可行的方案,为用户定制个性化的服务。

Description

一种旅游信息处理与方案提供方法
技术领域
本发明涉及信息处理技术,特别地,涉及一种旅游信息处理与方案提供方法。
背景技术
随着信息时代的到来,互联网对人类生活的影响也日益明显,越来越多的公众通过网络来实现自己的目的。但是互联网上越来越多的信息给人们的生活带来方便的同时,也为人们对信息的选择提出了巨大的挑战,以旅游为例,游客在进行旅游线路规划的过程中将面对纷繁复杂的服务信息,游客很难在众多的推荐信息中徐拿去对自己最有利的方案,而且不同的消费者其消费需求也不尽相同,现阶段传统的服务信息推荐模式主要采取信息打包、定时推送的模式(如通过专门的旅游推荐网站),即有什么推荐什么,没有考虑用户的个人喜好以及当前时刻是否存在消费需求。
针对现有技术中缺乏从用户需求出发定制旅游信息服务的问题,目前尚缺乏有效的解决方案。
发明内容
针对现有技术中缺乏从用户需求出发定制旅游信息服务的问题,本发明的目的在于提出一种旅游信息处理与方案提供方法,能从互联网纷繁复杂的信息中获取景点有效信息,并针对游客的个性化需求提出可行的方案,为用户定制个性化的服务。
基于上述目的,本发明提供的技术方案如下:
根据本发明的一个方面,提供了一种旅游信息处理与方案提供方法,包括:
获取旅游景点相关信息;
对旅游景点相关信息进行结构化处理获得景点有效信息,并将结构化的景点有效信息存储于数据库中;
对景点有效信息进行分布式标签分类,将所有景点划入多个风景区,并将景点划分信息存储于数据库中;
获取用户需求,并根据用户需求与数据库中的景点有效信息与景点划分信息生成推荐路游线路;
将推荐路游线路反馈给用户。
其中,获取旅游景点相关信息包括:
连接至因特网,获取与景点有关的标签;
根据标签进行检索,并访问被检索到的网站或网页;
从被检索到的网站或网页开始使用网络爬虫采集与旅游景点相关的文本和数据信息。
其中,对旅游景点相关信息进行结构化处理获得景点有效信息包括:
从旅游景点相关信息中提取出陈述数据,每个陈述数据中均包括S(Subject),P(Predicate),O(Object),C(Context)四种要素的资源标识字符串;
选定陈述数据中的基本数据类型要素对应的资源标识字符串,并为每个基本数据类型要素分配一个与之唯一对应的负整数数字标识;
选定陈述数据中的概念指向类型要素对应的资源标识字符串,并为每个基本数据类型要素分配一个与之唯一对应的正整数数字标识;
将陈述数据中的S、P、O、C四种要素以负整数数字标识与正整数数字标识的形式表示,获得景点有效信息。
并且,将结构化的景点有效信息存储于数据库中,为将陈述数据中的S、P、O、C四种要素以负整数数字标识与正整数数字标识的形式、负整数数字标识与基本数据类型要素的资源标识字符串的映射表、以及正整数数字标识与概念指向类型要素的映射表存储于数据库中。
概念标签包括自然景观与人文景观,其中,自然景观标签包括以下至少之一的子标签:山、水、岛、洲、湖、海、礁、森林、沙漠、草原、田园;人文景观标签包括以下至少之一的子标签:寺庙、道观、教堂、游乐场、购物街、展览馆、纪念馆、古镇、石窟、古寨、宫殿、园林、花园、植物园、阁楼、水电站、动物园;自然景观与人文景观的子标签还可以进一步包括新的子标签。
其中,对景点有效信息进行分布式标签分类包括:
从景点有效信息中提取出以数字标识形式储存的部分陈述数据中,提取出各景点的标签与标签权重;
根据各景点的标签与标签权重构建神经网络;
使用随机梯度下降法对神经网络进行优化,获得的标签分类结果是各景点标签的m维词向量。
并且,标签包括n个概念标签、w个位置标签与一个级别标签Lj,根据各景点的标签与标签权重构建神经网络包括:
将所有n个概念标签首尾相接形成n*m维向量x,将w个位置标签首尾相接形成w*m维向量y,并根据x、y与级别标签Lj构建第一层神经网络;
分别对x、y进行不同的线性变换、加入不同的偏置项后,使用激活函数激活获得Tx、Ty,并根据Tx、Ty构建第二层神经网络;
将Tx、Ty与Lj首尾相接,分别进行线性变换,并加入偏置项,构建第三层神经网络;
将第三层神经网络的计算结果使用激活函数处理后在W个景点节点上输出归一化概率Y,W个景点节点构成最后一层神经网络。
同时,将所有景点划入多个风景区包括:
根据位置标签将所有景点分为多个区域;
在每个区域中指定著名景点,基于著名景点进行合并与聚类,将区域中的所有景点划分为多个风景区。
并且,在每个区域中指定著名景点,基于著名景点进行合并与聚类,将区域中的所有景点划分为多个风景区包括:
指定k个著名景点;
以每个著名景点各自为一风景区中心,根据距离与标签相似度判定条件将非著名景点划入k个著名景点为中心的风景区中,获得k个风景区与风景区内的相似度;
对未划入k个风景区的非著名景点进行增量式聚类,获得n个可行的聚类结果,将区域中的所有景点划分为k+n个风景区、每个风景区内景点的相似度与风景区间的相似度。
其中,获取用户需求,并根据用户需求与数据库中的景点有效信息与景点划分信息生成推荐路游线路包括:
在旅游路线的规划中,系统根据用户提交的请求,考虑了用户偏好、景区特征以及所处位置等信息,提出针对旅游路线规划的改进蚁群偶遇算法,提高蚂蚁一次周游的质量,缩短系统运算时间,改进路径规划问题中的路线求法,利用实时的环境信息实现路径的动态规划,实现旅游景区的负载均衡以及旅游路线的实时调整,在最短的时间内给出一个最优的路线规划,实现了路径的智能规划和实时调整。
从上面所述可以看出,本发明提供的技术方案通过获取景点相关信息并提取出有效信息将景点分类后按照用户需求计算路游线路并推送给用户,能从互联网纷繁复杂的信息中获取景点有效信息,并针对游客的个性化需求提出可行的方案,为用户定制个性化的服务。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例的一种旅游信息处理与方案提供方法的流程图;
图2为根据本发明实施例的一种旅游信息处理与方案提供方法中,采用神经网络训练标签词向量的一个实施例;
图3为根据本发明实施例的一种旅游信息处理与方案提供方法的系统的结构图;
图4为根据本发明实施例的一种旅游信息处理与方案提供方法中,用户通过手机APP与系统交互的流程图;
图5为根据本发明实施例的一种旅游信息处理与方案提供方法中,用户需求为旅游体验最大化时返回的旅游线路推荐图;
图6为根据本发明实施例的一种旅游信息处理与方案提供方法中,用户需求为旅游体验-时间比最大化时返回的旅游线路推荐图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进一步进行清楚、完整、详细地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的一个实施例,提供了一种旅游信息处理与方案提供方法,
如图1所示,根据本发明的实施例提供的旅游信息处理与方案提供方法包括:
步骤S101,获取旅游景点相关信息;
步骤S103,对旅游景点相关信息进行结构化处理获得景点有效信息,并将结构化的景点有效信息存储于数据库中;
步骤S105,对景点有效信息进行分布式标签分类,将所有景点划入多个风景区,并将景点划分信息存储于数据库中;
步骤S107,获取用户需求,并根据用户需求与数据库中的景点有效信息与景点划分信息生成推荐路游线路;
步骤S109,将推荐路游线路反馈给用户。
在一个实施例中,该方法数据采集阶段、知识库建模阶段、景点分类阶段、景点聚类阶段、数据存储阶段。在数据采集阶段中,我们采集Internet上和旅游相关的数据,例如名称、所属城市、省份、景点类别,景点描述、门票、适合游玩时间、景点面积、国家评级、景区出入口经纬度信息、景点图片等等;在知识库建模阶段,通过采集到的数据在服务器上建立关于旅游的知识库;在景点分类阶段,通过景点的国家评价等级对景点的级别进行分类;在景点聚类阶段,以国家著名景点为中心,对周围的景点进行聚类,将城市的景点划分为不同的片区;在数据存储阶段,加划分好的片区和景点数据存储在后台的服务器上。完成上述步骤后,用户输入条件,进行线路推荐。
其中,获取旅游景点相关信息包括:
连接至因特网,获取与景点有关的标签;
根据标签进行检索,并访问被检索到的网站或网页;
从被检索到的网站或网页开始使用网络爬虫采集与旅游景点相关的文本和数据信息。
在一个实施例中,采用标准的浏览器-服务器(B/S)架构体系,客户端无需部署,直接通过浏览器就可以进行数据库管理。采用MVC设计模式,实现系统良好的层次化、模块化分工。将数据库的标准操作API从容器层剥离出来,独立构成一个服务体系。这样做使得数据库管理系统与其他使用到数据库的程序能共享同一套API,最大限度的保证代码重用性和代码一致性。授权的任何程序都能以远程调用的方式,轻松读写数据库。采用分布式数据库作为后台数据支撑平台,确保数据库的规模可以水平扩展。
其中,对旅游景点相关信息进行结构化处理获得景点有效信息包括:
从旅游景点相关信息中提取出陈述数据,每个陈述数据中均包括S(Subject),P(Predicate),O(Object),C(Context)四种要素的资源标识字符串;
选定陈述数据中的基本数据类型要素对应的资源标识字符串,并为每个基本数据类型要素分配一个与之唯一对应的负整数数字标识;
选定陈述数据中的概念指向类型要素对应的资源标识字符串,并为每个基本数据类型要素分配一个与之唯一对应的正整数数字标识;
将陈述数据中的S、P、O、C四种要素以负整数数字标识与正整数数字标识的形式表示,获得景点有效信息。
并且,将结构化的景点有效信息存储于数据库中,为将陈述数据中的S、P、O、C四种要素以负整数数字标识与正整数数字标识的形式、负整数数字标识与基本数据类型要素的资源标识字符串的映射表、以及正整数数字标识与概念指向类型要素的映射表存储于数据库中。
在数据库标准API层中,我们提出了一种四元组数据的数据模式:认为四元组是所有概念数据的基本形态,由S(Subject),P(Predicate),O(Object),C(Context)四要素构成。一个四元组就是一个陈述(Statement)。概念数据就是由大量陈述所构成的集合。通过陈述来构建概念知识,达到清晰化表述概念的目的。
传统的概念描述方法,是由四个URI构成的,URI是用来标识资源(Resource)的唯一字符串,这个串一般都比较长,在存储、排序、查询时都非常浪费资源。在实际应用中,陈述的数量非常庞大,对陈述各维度的查询极其频繁。本文通过一种方法将所有的URI都统一转为4字节的整型,来代替原有的标识资源,将空间耗费基本上压缩一个数量级,提高了查询的效率。
正统的URI分两类,一类为基本数据类型的URI。这种URI用来表示字符串、数值、日期等基本数据类型,这种URI是将数据转成字符串后,再加上类型后缀组成。如:"1"^^xs:integer,1是数据,^^xs:integer是其类型后缀。对于这种URI,我们用负整数为其分配一个唯一ID,然后用映射表实现ID到URI的双向映射。另一类的URI是指向概念的,它是由一个组织前缀加上组织内部对这个概念的唯一标识组成。这个唯一标识本来就是系统自动来分配的,只要能保证唯一性,什么样的值都可以。所以,对这类URI,我们采用系统自动分配一个正整数作为其内部ID。我们直接将这个ID与这个概念对应起来,绕过了URI,也不需要ID到URI的映射表。通过特定规则,我们可以导出任意形态的URI,与标准接轨,但在内部,我们采用这种高度压缩的方式来表示,能极大节省系统的资源开销。通过上述两种方式,我们就实现了陈述(四元组)的内部“标准化”。
在知识库的构建中,我们采用分布式的Mongo数据库。它用C++编写,性能优越,部署简单,既可以单机使用,又具有极强的水平扩展能力。通过复制功能,还能保证数据库服务的高可用性,单个节点的损害不会破坏数据完整性。另外,它的备份、还原功能也做得很好,符合我们知识库平台的需求。
概念标签包括自然景观与人文景观,其中,自然景观标签包括以下至少之一的子标签:山、水、岛、洲、湖、海、礁、森林、沙漠、草原、田园;人文景观标签包括以下至少之一的子标签:寺庙、道观、教堂、游乐场、购物街、展览馆、纪念馆、古镇、石窟、古寨、宫殿、园林、花园、植物园、阁楼、水电站、动物园;自然景观与人文景观的子标签还可以进一步包括新的子标签。
其中,对景点有效信息进行分布式标签分类包括:
从景点有效信息中提取出以数字标识形式储存的部分陈述数据中,提取出各景点的标签与标签权重;
根据各景点的标签与标签权重构建神经网络;
使用随机梯度下降法对神经网络进行优化,获得的标签分类结果是各景点标签的m维词向量。
并且,标签包括n个概念标签、w个位置标签与一个级别标签Lj,根据各景点的标签与标签权重构建神经网络包括:
将所有n个概念标签首尾相接形成n*m维向量x,将w个位置标签首尾相接形成w*m维向量y,并根据x、y与级别标签Lj构建第一层神经网络;
分别对x、y进行不同的线性变换、加入不同的偏置项后,使用激活函数激活获得Tx、Ty,并根据Tx、Ty构建第二层神经网络;
将Tx、Ty与Lj首尾相接,分别进行线性变换,并加入偏置项,构建第三层神经网络;
将第三层神经网络的计算结果使用激活函数处理后在W个景点节点上输出归一化概率Y,W个景点节点构成最后一层神经网络。
图3示出的是词向量的神经网络的一个实施例。如图3所示,L1,…,Ln-1,Ln是景点的n个概念标签;3个位置标签Ls,Lq,Lx分别表示景点所属的省份(直辖市),地区以及县(县级市);Lj表示景点的级别。现在需要根据这已知的不同标签类型预测景点。C(l)表示标签l所对应的词向量,整个模型中使用同一个词向量库,数据存储在矩阵中,矩阵的大小为(|V|×m)中。其中|V|表示词表的大小,m表示词向量的维度。词表中包括景点的标签类型,所属省份(直辖市),地区,以及县(县级市)。
神经网络中第一层(由下往上数,下同)是将景点的n个属性标签进行首尾相接拼起来,形成一个n*m维的向量,并表示为x。再讲景点的w个位置属性进行首尾拼接起来,形成一个w*m维的向量,并表示为y。
神经网络中的第二层中,分别对x和y进行不同线性变换Hx与Hy,再加上不同偏置项dx与dy,最后使用激活函数F进行激活,得到Tx和Ty
神经网络中的第三层中对Tx,Ty以及Lj进行首尾拼接,并分别进行线性变换Ux、Uy、Hj,再加上偏置项dj
网络的最后一层一共有W个节点,W为景点的个数,每个节点yi表示景点为i的未归一化log概率。最后使用softmax激活函数将输出值Y归一化成概率。最终Y的计算公式为:
Y=b+Wxx+Wyy+U3F(UxF(dx+Hxx)+UyF(dy+Hyy)+dj+HjLj)
在构建好深度神经网络之后,我们随机梯度下降法对模型进行优化。
对景点进行多标签标注,标注的属性可以是所属省市、开放时间,淡旺季的划分、类型、所属景区、是否为核心景点等信息。
同时,将所有景点划入多个风景区包括:
根据位置标签将所有景点分为多个区域;
在每个区域中指定著名景点,基于著名景点进行合并与聚类,将区域中的所有景点划分为多个风景区。
并且,在每个区域中指定著名景点,基于著名景点进行合并与聚类,将区域中的所有景点划分为多个风景区包括:
指定k个著名景点;
以每个著名景点各自为一风景区中心,根据距离与标签相似度判定条件将非著名景点划入k个著名景点为中心的风景区中,获得k个风景区与风景区内的相似度;
对未划入k个风景区的非著名景点进行增量式聚类,获得n个可行的聚类结果,将区域中的所有景点划分为k+n个风景区、每个风景区内景点的相似度与风景区间的相似度。
在一个实施例中,用户输入总体游玩时间、每天游玩时间、早晨出发时间、晚上返回时间(是否包含返程时间)、午休时间、景点类型、酒店级别等信息,分布式协同过滤算法根据以上信息生成推荐旅游线路。部分条件太强导致无法生成满足条件的旅游线路时,忽略某些次要条件并重新进行推荐。在进行线路规划的过程中,首先在风景区之间进行线路规划,再对风景区内部进行线路规划。对已有的著名景区(游玩时间超过一天的),根据不同的线路进行内部分类,规划具体的旅游线路。合理规划时间问题,在时间冗余的情况下为用户推荐有价值游玩的地点。
在一个实施例中,用户通过手机APP与系统进行交互,如图4所示。首先,APP示出一个初始化界面,用户在上方进行地理位置、时间、用户个性化喜好等筛选。数据库根据用户喜好进行旅游线路推荐,根据旅游线路经过的地点推荐周边的餐饮和酒店服务,并返回整个路径的规划过程以及推荐的酒店餐饮信息。用户根据自己的情况进行参考与选择,用户可点开线路上的每个景点观看景点的关键路径规划。
例如,用户从国防科大出发游览长沙的风景:当用户选择喜好偏向为无时间限制、希望获得最完整的旅游体验时,返回的线路会尝试遍历风景区内的所有景点,如图5所示;当用户选择喜好偏向为在时间受限时,返回的线路会在时间允许的范围内仅游览多个风景区中的著名景点,具有最高的时间性价比,如图6所示。
在旅游路线的规划中,系统根据用户提交的请求,考虑了用户偏好、景区特征以及所处位置等信息,提出针对旅游路线规划的改进蚁群偶遇算法,提高蚂蚁一次周游的质量,缩短系统运算时间,改进路径规划问题中的路线求法,利用实时的环境信息实现路径的动态规划,实现旅游景区的负载均衡以及旅游路线的实时调整,在最短的时间内给出一个最优的路线规划,实现了路径的智能规划和实时调整。
根据本发明的另一个方面,提供了一种旅游信息处理与方案提供系统,使用了前述的旅游信息处理与方案提供方法,系统结构图如图2所示。
景点相关数据采集模块采用自主开发的分布式爬虫,可以在多个网站、论坛以及交友网站中爬取和景点相关的数据。
数据库构建模块对爬取到的文本数据进行结构化处理,提取其中的可用信息,例如景点名称、景点所属省份、景点开放时间等等,结构化处理的过程采用机器处理和人工处理相结合,将处理结束后的结构化数据存储在数据库中。
景点分类模块将存储在数据库中的数据采用自主开发的分布式多标签分类技术,对景点进行划分,将划分的结果存储在数据库中。
动态规划模块在旅游线路推荐的过程中采用多层次动态规划的算法,根据用户需求获取最佳的旅游推荐线路。
结果展现模块采用较好的UI界面,达到友好展示的目的。
在一个实施例中,旅游信息处理与方案提供系统被细分为4个模块,包括位置感知模块、路径规划模块、信息推荐模块、前端显示模块。
位置感知模块通过定位装置判断用户实时位置,同时系统自动索引数据库中对应编号的旅游者历史旅游记录;路径规划模块通过从本地服务器中获取到的数据,进行数据预处理,通过用户输入的个性化条件,进行自主的旅游线路规划;信息推荐模块通过获得旅游景点周围的餐饮和景点信息,以综合排序的方式推荐给用户,提供更加全面的个性化服务;前端显示模块支持更好的用户体验,其中包含用户输入模块,路径规划模块,以及路径显示模块。
综上所述,借助于本发明的上述技术方案,通过获取景点相关信息并提取出有效信息将景点分类后按照用户需求计算路游线路并推送给用户,能从互联网纷繁复杂的信息中获取景点有效信息,并针对游客的个性化需求提出可行的方案,为用户定制个性化的服务。
所属领域的普通技术人员应当理解:以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种旅游信息处理与方案提供方法,其特征在于,包括:
获取旅游景点相关信息;
对所述旅游景点相关信息进行结构化处理获得景点有效信息,并将结构化的所述景点有效信息存储于数据库中;
对所述景点有效信息进行分布式标签分类,将所有景点划入多个风景区,并将所述景点划分信息存储于数据库中;
获取用户需求,并根据所述用户需求与所述数据库中的所述景点有效信息与所述景点划分信息生成推荐路游线路;
将所述推荐路游线路反馈给用户。
2.根据权利要求1所述的一种旅游信息处理与方案提供方法,其特征在于,所述获取旅游景点相关信息包括:
连接至因特网,获取与景点有关的标签;
根据所述标签进行检索,并访问被检索到的网站或网页;
从被检索到的网站或网页开始使用网络爬虫采集与旅游景点相关的文本和数据信息。
3.根据权利要求1所述的一种旅游信息处理与方案提供方法,其特征在于,对所述旅游景点相关信息进行结构化处理获得景点有效信息包括:
从所述旅游景点相关信息中提取出陈述数据,所述每个陈述数据中均包括S、P、O、C四种要素的资源标识字符串;
选定所述陈述数据中的基本数据类型要素对应的资源标识字符串,并为每个基本数据类型要素分配一个与之唯一对应的负整数数字标识;
选定所述陈述数据中的概念指向类型要素对应的资源标识字符串,并为每个基本数据类型要素分配一个与之唯一对应的正整数数字标识;
将所述陈述数据中的S、P、O、C四种要素以负整数数字标识与正整数数字标识的形式表示,获得所述景点有效信息。
4.根据权利要求3所述的一种旅游信息处理与方案提供方法,其特征在于,将结构化的所述景点有效信息存储于数据库中,为将所述陈述数据中的S、P、O、C四种要素以负整数数字标识与正整数数字标识的形式、负整数数字标识与基本数据类型要素的资源标识字符串的映射表、以及正整数数字标识与概念指向类型要素的映射表存储于数据库中。
5.根据权利要求4所述的一种旅游信息处理与方案提供方法,其特征在于,对所述景点有效信息进行分布式标签分类包括:
从所述景点有效信息中提取出以数字标识形式储存的部分陈述数据中,提取出各景点的标签与标签权重;
根据所述各景点的标签与标签权重构建神经网络;
使用随机梯度下降法对所述神经网络进行优化,获得的标签分类结果是各景点标签的m维词向量。
6.根据权利要求5所述的一种旅游信息处理与方案提供方法,其特征在于,所述标签包括n个概念标签、w个位置标签与一个级别标签Lj,根据所述各景点的标签与标签权重构建神经网络包括:
将所有n个概念标签首尾相接形成n*m维向量x,将w个位置标签首尾相接形成w*m维向量y,并根据x、y与级别标签Lj构建第一层神经网络;
分别对x、y进行不同的线性变换、加入不同的偏置项后,使用激活函数激活获得Tx、Ty,并根据Tx、Ty构建第二层神经网络;
将Tx、Ty与Lj首尾相接,分别进行线性变换,并加入偏置项,构建第三层神经网络;
将第三层神经网络的计算结果使用激活函数处理后在W个景点节点上输出归一化概率Y,W个景点节点构成最后一层神经网络。
7.根据权利要求6所述的一种旅游信息处理与方案提供方法,其特征在于,所述概念标签包括自然景观与人文景观,其中,所述自然景观标签包括以下至少之一的子标签:山、水、岛、洲、湖、海、礁、森林、沙漠、草原、田园;所述人文景观标签包括以下至少之一的子标签:寺庙、道观、教堂、游乐场、购物街、展览馆、纪念馆、古镇、石窟、古寨、宫殿、园林、花园、植物园、阁楼、水电站、动物园;所述自然景观与人文景观的子标签还可以进一步包括新的子标签。
8.根据权利要求6所述的一种旅游信息处理与方案提供方法,其特征在于,将所有景点划入多个风景区包括:
根据位置标签将所有景点分为多个区域;
在每个区域中指定著名景点,基于著名景点进行合并与聚类,将区域中的所有景点划分为多个风景区。
9.根据权利要求8所述的一种旅游信息处理与方案提供方法,其特征在于,在每个区域中指定著名景点,基于著名景点进行合并与聚类,将区域中的所有景点划分为多个风景区包括:
指定k个著名景点;
以每个著名景点各自为一风景区中心,根据距离与标签相似度判定条件将非著名景点划入k个著名景点为中心的风景区中,获得k个风景区与风景区内的相似度;
对未划入k个风景区的非著名景点进行增量式聚类,获得n个可行的聚类结果,将区域中的所有景点划分为k+n个风景区、每个风景区内景点的相似度与风景区间的相似度。
10.根据权利要求1所述的一种旅游信息处理与方案提供方法,其特征在于,获取用户需求,并根据所述用户需求与所述数据库中的所述景点有效信息与所述景点划分信息生成推荐路游线路,为在旅游路线的规划中,系统根据用户提交的请求,考虑了用户偏好、景区特征以及所处位置等信息,使用针对旅游路线规划的改进蚁群偶遇算法,利用实时的环境信息实现路径的动态规划。
CN201510782529.8A 2015-11-13 2015-11-13 一种旅游信息处理与方案提供方法 Active CN105468679B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510782529.8A CN105468679B (zh) 2015-11-13 2015-11-13 一种旅游信息处理与方案提供方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510782529.8A CN105468679B (zh) 2015-11-13 2015-11-13 一种旅游信息处理与方案提供方法

Publications (2)

Publication Number Publication Date
CN105468679A true CN105468679A (zh) 2016-04-06
CN105468679B CN105468679B (zh) 2019-04-12

Family

ID=55606380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510782529.8A Active CN105468679B (zh) 2015-11-13 2015-11-13 一种旅游信息处理与方案提供方法

Country Status (1)

Country Link
CN (1) CN105468679B (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096785A (zh) * 2016-06-13 2016-11-09 北京游谱科技发展有限公司 一种基于行程规划的线路定制方法、系统
CN106127622A (zh) * 2016-06-20 2016-11-16 四川上略互动网络技术有限公司 一种旅游数据处理系统
CN106354859A (zh) * 2016-09-06 2017-01-25 北京易游华成科技有限公司 景点推荐设备、方法及系统
CN107070986A (zh) * 2017-03-01 2017-08-18 深圳春沐源农业科技有限公司 游览路线制定方法、系统、智能终端和服务器
CN107050864A (zh) * 2017-03-24 2017-08-18 中国农业大学 一种游戏互动方法、互动系统的搭建方法及搭建装置
CN107491452A (zh) * 2016-06-13 2017-12-19 英属安圭拉商乐走走股份有限公司 能快速且精准搜寻旅游景点的方法
CN107741988A (zh) * 2017-10-29 2018-02-27 南京坤艮信息科技有限公司 一种旅游网站的自学习模式
CN108061558A (zh) * 2017-11-30 2018-05-22 深圳中兴网信科技有限公司 智能路线导航方法、装置、服务器、移动终端和存储介质
CN108228765A (zh) * 2017-12-27 2018-06-29 浙江中测新图地理信息技术有限公司 基于空间与主题的多维度科普导览方法
CN108648058A (zh) * 2018-05-15 2018-10-12 北京三快在线科技有限公司 产品排序方法及装置,电子设备、存储介质
CN108829690A (zh) * 2018-04-03 2018-11-16 广州市宝比万像软件科技有限公司 景区文化创作综合服务平台和管理方法
CN108921666A (zh) * 2018-06-29 2018-11-30 百度在线网络技术(北京)有限公司 旅游信息推荐方法、装置、设备及存储介质
CN109034389A (zh) * 2018-08-02 2018-12-18 黄晓鸣 信息推荐系统的人机交互式修正方法、装置、设备和介质
CN109145219A (zh) * 2018-09-10 2019-01-04 百度在线网络技术(北京)有限公司 基于互联网文本挖掘的兴趣点有效性判断方法和装置
CN109166006A (zh) * 2018-08-17 2019-01-08 苏州诚满信息技术有限公司 一种用于电子票务的智能导购方法及其系统
CN109359287A (zh) * 2018-07-12 2019-02-19 福州大学 交互式文化旅游景区景点在线推荐系统及方法
CN109376947A (zh) * 2018-11-16 2019-02-22 叶金华 资源共享疗养管理系统
CN109409612A (zh) * 2018-11-12 2019-03-01 平安科技(深圳)有限公司 一种路径规划方法、服务器及计算机存储介质
CN109558977A (zh) * 2018-11-26 2019-04-02 上海景域文化传播股份有限公司 旅游行程评估、规划方法
CN109858885A (zh) * 2019-02-15 2019-06-07 北京无二之旅科技有限公司 一种旅行方案的构建方法及装置
CN109947873A (zh) * 2017-08-14 2019-06-28 清华大学 景点知识地图构建方法、装置、设备及可读存储介质
CN110019201A (zh) * 2017-10-09 2019-07-16 阿里巴巴集团控股有限公司 一种生成结构化数据的方法、装置及系统
CN110166815A (zh) * 2019-05-28 2019-08-23 腾讯科技(深圳)有限公司 一种视频内容的显示方法、装置、设备及介质
CN110222275A (zh) * 2019-04-26 2019-09-10 平安科技(深圳)有限公司 一种基于智能推荐的旅游路线规划方法及相关设备
CN110463228A (zh) * 2017-03-07 2019-11-15 天巡有限公司 基于地理和用户情境的内容推荐和显示
CN110598778A (zh) * 2019-09-04 2019-12-20 卓尔智联(武汉)研究院有限公司 旅游推荐方法、计算机装置及可读存储介质
CN111651543A (zh) * 2020-05-26 2020-09-11 广东农工商职业技术学院(农业部华南农垦干部培训中心) 一种农垦地图数据的展示方法及系统
CN111815844A (zh) * 2020-07-22 2020-10-23 中国人民解放军海军航空大学 智能机器导游及其控制方法、控制装置、存储介质
CN111832483A (zh) * 2020-07-14 2020-10-27 北京百度网讯科技有限公司 一种兴趣点有效性识别方法、装置、设备以及存储介质
CN112632379A (zh) * 2020-12-24 2021-04-09 北京百度网讯科技有限公司 路线推荐方法、装置、电子设备和存储介质
CN112766526A (zh) * 2021-01-28 2021-05-07 重庆周游科技有限公司 一种旅游产品方案的自动打包方法
CN114049102A (zh) * 2022-01-11 2022-02-15 环球数科集团有限公司 旅游团的数据筛选方法、装置和计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117471A (zh) * 2009-12-31 2011-07-06 上海天那电器有限公司 自助旅游多媒体网络服务平台
CN103678429A (zh) * 2012-09-26 2014-03-26 阿里巴巴集团控股有限公司 一种旅游线路的推荐方法以及装置
US8782034B1 (en) * 2011-08-17 2014-07-15 Google Inc. Utilizing information about user-visited places to recommend novel spaces to explore
CN104463730A (zh) * 2014-12-29 2015-03-25 广州神马移动信息科技有限公司 基于旅游目标地域来挖掘旅游路线的方法和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117471A (zh) * 2009-12-31 2011-07-06 上海天那电器有限公司 自助旅游多媒体网络服务平台
US8782034B1 (en) * 2011-08-17 2014-07-15 Google Inc. Utilizing information about user-visited places to recommend novel spaces to explore
CN103678429A (zh) * 2012-09-26 2014-03-26 阿里巴巴集团控股有限公司 一种旅游线路的推荐方法以及装置
CN104463730A (zh) * 2014-12-29 2015-03-25 广州神马移动信息科技有限公司 基于旅游目标地域来挖掘旅游路线的方法和设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MICHAEL WILLIAMS: "基于标签加权的HTML 文档分类算法", 《研究与开发》 *
冯淑华: "《旅游地理学》", 31 December 2011, 华中科技大学出版社 *
李书玲等: "改进型RBF神经网络的多标签算法研究", 《计算机科学》 *

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096785A (zh) * 2016-06-13 2016-11-09 北京游谱科技发展有限公司 一种基于行程规划的线路定制方法、系统
CN107491452A (zh) * 2016-06-13 2017-12-19 英属安圭拉商乐走走股份有限公司 能快速且精准搜寻旅游景点的方法
CN106127622A (zh) * 2016-06-20 2016-11-16 四川上略互动网络技术有限公司 一种旅游数据处理系统
CN106354859A (zh) * 2016-09-06 2017-01-25 北京易游华成科技有限公司 景点推荐设备、方法及系统
CN107070986A (zh) * 2017-03-01 2017-08-18 深圳春沐源农业科技有限公司 游览路线制定方法、系统、智能终端和服务器
CN110463228A (zh) * 2017-03-07 2019-11-15 天巡有限公司 基于地理和用户情境的内容推荐和显示
CN107050864A (zh) * 2017-03-24 2017-08-18 中国农业大学 一种游戏互动方法、互动系统的搭建方法及搭建装置
CN109947873B (zh) * 2017-08-14 2021-11-23 清华大学 景点知识地图构建方法、装置、设备及可读存储介质
CN109947873A (zh) * 2017-08-14 2019-06-28 清华大学 景点知识地图构建方法、装置、设备及可读存储介质
CN110019201A (zh) * 2017-10-09 2019-07-16 阿里巴巴集团控股有限公司 一种生成结构化数据的方法、装置及系统
CN107741988A (zh) * 2017-10-29 2018-02-27 南京坤艮信息科技有限公司 一种旅游网站的自学习模式
CN108061558A (zh) * 2017-11-30 2018-05-22 深圳中兴网信科技有限公司 智能路线导航方法、装置、服务器、移动终端和存储介质
CN108228765A (zh) * 2017-12-27 2018-06-29 浙江中测新图地理信息技术有限公司 基于空间与主题的多维度科普导览方法
CN108829690A (zh) * 2018-04-03 2018-11-16 广州市宝比万像软件科技有限公司 景区文化创作综合服务平台和管理方法
CN108648058A (zh) * 2018-05-15 2018-10-12 北京三快在线科技有限公司 产品排序方法及装置,电子设备、存储介质
CN108648058B (zh) * 2018-05-15 2020-07-10 北京三快在线科技有限公司 产品排序方法及装置,电子设备、存储介质
CN108921666A (zh) * 2018-06-29 2018-11-30 百度在线网络技术(北京)有限公司 旅游信息推荐方法、装置、设备及存储介质
CN109359287A (zh) * 2018-07-12 2019-02-19 福州大学 交互式文化旅游景区景点在线推荐系统及方法
CN109034389A (zh) * 2018-08-02 2018-12-18 黄晓鸣 信息推荐系统的人机交互式修正方法、装置、设备和介质
CN109166006A (zh) * 2018-08-17 2019-01-08 苏州诚满信息技术有限公司 一种用于电子票务的智能导购方法及其系统
CN109166006B (zh) * 2018-08-17 2021-05-18 浙江力石科技股份有限公司 一种用于电子票务的智能导购方法及其系统
CN109145219B (zh) * 2018-09-10 2020-12-25 百度在线网络技术(北京)有限公司 基于互联网文本挖掘的兴趣点有效性判断方法和装置
CN109145219A (zh) * 2018-09-10 2019-01-04 百度在线网络技术(北京)有限公司 基于互联网文本挖掘的兴趣点有效性判断方法和装置
US11347782B2 (en) 2018-09-10 2022-05-31 Baidu Online Network Technology (Beijing) Co., Ltd. Internet text mining-based method and apparatus for judging validity of point of interest
CN109409612B (zh) * 2018-11-12 2024-05-28 平安科技(深圳)有限公司 一种路径规划方法、服务器及计算机存储介质
WO2020098252A1 (zh) * 2018-11-12 2020-05-22 平安科技(深圳)有限公司 一种路径规划方法、服务器及计算机存储介质
CN109409612A (zh) * 2018-11-12 2019-03-01 平安科技(深圳)有限公司 一种路径规划方法、服务器及计算机存储介质
CN109376947A (zh) * 2018-11-16 2019-02-22 叶金华 资源共享疗养管理系统
CN109558977A (zh) * 2018-11-26 2019-04-02 上海景域文化传播股份有限公司 旅游行程评估、规划方法
CN109858885A (zh) * 2019-02-15 2019-06-07 北京无二之旅科技有限公司 一种旅行方案的构建方法及装置
CN110222275A (zh) * 2019-04-26 2019-09-10 平安科技(深圳)有限公司 一种基于智能推荐的旅游路线规划方法及相关设备
CN110166815B (zh) * 2019-05-28 2023-03-10 腾讯科技(深圳)有限公司 一种视频内容的显示方法、装置、设备及介质
CN110166815A (zh) * 2019-05-28 2019-08-23 腾讯科技(深圳)有限公司 一种视频内容的显示方法、装置、设备及介质
CN110598778A (zh) * 2019-09-04 2019-12-20 卓尔智联(武汉)研究院有限公司 旅游推荐方法、计算机装置及可读存储介质
CN111651543A (zh) * 2020-05-26 2020-09-11 广东农工商职业技术学院(农业部华南农垦干部培训中心) 一种农垦地图数据的展示方法及系统
CN111832483A (zh) * 2020-07-14 2020-10-27 北京百度网讯科技有限公司 一种兴趣点有效性识别方法、装置、设备以及存储介质
CN111832483B (zh) * 2020-07-14 2024-03-08 北京百度网讯科技有限公司 一种兴趣点有效性识别方法、装置、设备以及存储介质
CN111815844A (zh) * 2020-07-22 2020-10-23 中国人民解放军海军航空大学 智能机器导游及其控制方法、控制装置、存储介质
CN112632379A (zh) * 2020-12-24 2021-04-09 北京百度网讯科技有限公司 路线推荐方法、装置、电子设备和存储介质
CN112766526A (zh) * 2021-01-28 2021-05-07 重庆周游科技有限公司 一种旅游产品方案的自动打包方法
CN114049102A (zh) * 2022-01-11 2022-02-15 环球数科集团有限公司 旅游团的数据筛选方法、装置和计算机设备
CN114049102B (zh) * 2022-01-11 2022-04-26 环球数科集团有限公司 旅游团的数据筛选方法、装置和计算机设备

Also Published As

Publication number Publication date
CN105468679B (zh) 2019-04-12

Similar Documents

Publication Publication Date Title
CN105468679B (zh) 一种旅游信息处理与方案提供方法
Arefieva et al. A machine learning approach to cluster destination image on Instagram
Jiang et al. Author topic model-based collaborative filtering for personalized POI recommendations
Liu et al. A real-time personalized route recommendation system for self-drive tourists based on vehicle to vehicle communication
Jiang et al. Personalized travel sequence recommendation on multi-source big social media
Lee et al. Do online information sources really make tourists visit more diverse places?: Based on the social networking analysis
Murgante et al. Smart cities in a smart world
CN105427209A (zh) 一种全景智慧旅游系统
Henderson The development of tourist destinations in the Gulf: Oman and Qatar compared
CN108444491A (zh) 一种旅游出行路线的优化规划方法
Xu et al. A dynamic topic model and matrix factorization-based travel recommendation method exploiting ubiquitous data
Kirshner et al. Energy landscapes in Mozambique: The role of the extractive industries in a post-conflict environment
CN102446225A (zh) 一种实时搜索的方法、装置和系统
CN105023047A (zh) 一种基于行程单的旅游服务个性化在线点餐实现方法
CN105069513A (zh) 一种旅游行程规划管理的方法及系统
CN104537029A (zh) 查询处理方法及装置
CN106197444A (zh) 一种路线规划方法、系统
Duarte-Duarte et al. Methodological proposal for the identification of tourist routes in a particular region through clustering techniques
CN107025254A (zh) 一种航线目的地搜索方法及装置
CN101013438A (zh) 电子地图的图文和多媒体数据扩展和查询的方法
Liu et al. A novel recommendation system for the personalized smart tourism route: Design and implementation
Tilahun et al. Prey predator algorithm for travelling salesman problem: application on the Ethiopian tourism sites
Tang et al. Synergizing Spatial Optimization with Large Language Models for Open-Domain Urban Itinerary Planning
Satria et al. Big data analysis of sustainable tourism competitiveness in East Java Province
Hung et al. A smart-travel system based on social network service for cloud environment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant