CN108269024A - 一种基于大数据的旅游目的地评价方法 - Google Patents
一种基于大数据的旅游目的地评价方法 Download PDFInfo
- Publication number
- CN108269024A CN108269024A CN201810097326.9A CN201810097326A CN108269024A CN 108269024 A CN108269024 A CN 108269024A CN 201810097326 A CN201810097326 A CN 201810097326A CN 108269024 A CN108269024 A CN 108269024A
- Authority
- CN
- China
- Prior art keywords
- city
- tourist famous
- component attributes
- tourist
- comment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims abstract description 13
- 230000008451 emotion Effects 0.000 claims description 38
- 238000012545 processing Methods 0.000 claims description 27
- 238000005259 measurement Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims description 4
- 230000004308 accommodation Effects 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 claims description 3
- 235000013305 food Nutrition 0.000 claims description 2
- 230000035945 sensitivity Effects 0.000 claims description 2
- 238000012512 characterization method Methods 0.000 claims 1
- 238000010276 construction Methods 0.000 abstract description 8
- 238000000605 extraction Methods 0.000 abstract description 4
- 230000010365 information processing Effects 0.000 abstract description 4
- 238000004458 analytical method Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于大数据的旅游目的地评价方法,其利用从互联网络中获取到的对旅游目的地的点评信息进行信息处理和提取,获得能够对旅游目的地加以评价的信息参数,用以对旅游目的地进行估分计算,整个过程中不会参杂人为因素对估分计算结果的影响,全部依据互联网络中对旅游目的地的客观品论信息,因此依据由此获得的估分计算结果对旅游目的地加以评价,能够客观真实的反映大众对旅游目的地的评价情况,从而为发现旅游目的地的已有优势和不足以及推动旅游目的地区域的建设改进提供指导信息。
Description
技术领域
本发明涉及大数据技术和信息提取技术领域,具体涉及一种基于大数据的旅游目的地评价方法。
背景技术
随着“大数据”时代的到来,人们对于海量数据的挖掘和运用,这预示着新一波生产率增长和消费者盈余浪潮的到来。旅游业作为一个信息高度密集的行业,旅游者的流动与评论在产生了大量的数据。这些数据中隐藏了大量旅游者与旅游地的重要信息。
相比传统的旅游研究方法与数据获取方法,这类基于大数据的信息,一方面真实,都是源于旅游者真实的行为以及行为数据,比传统的问卷技术采样更为客观,更能反映社会真实。另一方面,这类数据更新及时,可以几乎实时有效地反映客观事实。
如果能够有效地采集这类旅游者在网络上留存的大数据,可以通过游客的评论中,发现对于旅游目的地的真实实时的评价,这对于发现旅游目的地的已有优势和不足、推动旅游目的地区域的建设改进而言,具有巨大的现实价值和指导意义。
发明内容
针对现有技术中存在的不足,本发明的目的在于提供一种基于大数据的旅游目的地评价方法,用于依据大数据的采集实现对旅游目的地的综合评价,为发现旅游目的地的已有优势和不足以及推动旅游目的地区域的建设改进提供指导信息。
为实现上述目的,本发明采用了如下技术方案:
基于大数据的旅游目的地评价方法,包括如下步骤:
获取互联网络中对旅游目的地的点评信息;所述点评信息包括点评人信息、点评时间信息和点评内容文本信息;
对获取的旅游目的地的点评信息中的点评内容文本信息进行分词识别处理,根据所述分词识别处理结果识别出所述点评内容文本信息中所描述的旅游目的地要素属性,并利用预设的情感词典识别出所述分词识别处理结果中针对所述旅游目的地要素属性的情况描述状态;
通过所获取的旅游目的地的各点评信息所体现的各不同点评人在不同点评时间的点评内容文本信息中识别出的各种旅游目的地要素属性及其相应的情况描述状态加以统计,根据对每种旅游目的地要素属性的出现次数的统计对相应旅游目的地要素属性进行关注重要性估分计算,根据对每种旅游目的地要素属性对应的情况描述状态的统计对相应旅游目的地要素属性进行情感评价估分计算,从而得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值,用以分别表征旅游目的地在所述各中旅游目的地要素属性上的评价情况。
上述基于大数据的旅游目的地评价方法中,作为优选方案,所述旅游目的地的点评信息的获取方式具体为:
a1)获取互联网络中抓取针对旅游目的地进行点评描述的点评人、点评时间和点评描述文字信息,并使用纯文本格式加以存储;
a2)根据预设的旅游目的地无关敏感词数据库,采用敏感词识别技术对纯文本格式的点评描述文字信息进行无关敏感词识别,进而删除所述点评描述文字信息中的无关敏感词,将剩余的文字信息作为旅游目的地的点评内容文本信息;
a3)将由此获得的点评人信息、点评时间信息和点评内容文本信息作为旅游目的地的点评信息。
上述基于大数据的旅游目的地评价方法中,作为优选方案,所述旅游目的地要素属性包括如下的任意一种或多种:资源景区、人造景区、娱乐活动、运动康体、节庆事件、餐饮美食、酒店住宿、购物商品、旅游服务、旅游价格、旅游解说、旅游设施、经济水平、环境风貌、外部交通、内部交通、游憩场所、公共服务、安全治安、地方氛围、居民态度、天气气候。
上述基于大数据的旅游目的地评价方法中,作为优选方案,所述旅游目的地要素属性的识别方式具体为:
b1)基于对旅游目的地的点评信息中的点评内容文本信息的分词识别处理结果,根据先验知识分别判断所述分词识别处理结果中划分出的每个词语是否为对旅游目的地的评论描述词语,进而提取出其中的各个评论描述词语;
b2)利用人工分类的方式或机器学习的分类方式,分别对提取出的各个评论描述词语进行旅游目的地要素属性类别的归类,使得归类所得的每一个旅游目的地要素属性类别中的评论描述词语都是在描述旅游目的同一个要素属性;
b3)分别统计归类所得的各个旅游目的地要素属性类别中评论描述词语的出现频次,将出现频次由高到低排列靠前的一个或多个旅游目的地要素属性类别所对应的旅游目的地要素属性,罗列为识别出的旅游目的地要素属性。
上述基于大数据的旅游目的地评价方法中,作为优选方案,利用预设的情感词典识别出所述分词识别处理结果中针对所述旅游目的地要素属性的情况描述状态的识别方式具体为:
c1)基于对旅游目的地的点评信息中的点评内容文本信息的分词识别处理结果,分别对划分出的每个词语利用预设的情感词典进行对比识别,判别所述词语是否属于情感描述词;
c2)根据预设的情感词典,判断所判别出的情感描述词的情感评价类别;所述情感评价类别包括情感正面评价类、情感负面评价类和情感中立评价类;
c3)记录所述情感描述词的情感评价类别状态,作为其对应旅游目的地要素属性的情况描述状态。
上述基于大数据的旅游目的地评价方法中,作为优选方案,根据对每种旅游目的地要素属性对应的情况描述状态的统计对相应旅游目的地要素属性进行情感评价估分计算的计算方式具体为:
在统计周期时间内,分别统计每种旅游目的地要素属性对应的各个情况描述状态;若一个情况描述状态为情感正面评价类,则相应旅游目的地要素属性的对应的情感评价分值加1;若一个情况描述状态为情感负面评价类,则相应旅游目的地要素属性的对应的情感评价分值减1;若一个情况描述状态为情感中立评价类,则相应旅游目的地要素属性的对应的情感评价分值加0;由此分别针对每种旅游目的地要素属性进行统计累加,分别计算得到每种旅游目的地要素属性对应的情感评价分值。
上述基于大数据的旅游目的地评价方法中,作为优选方案,根据对每种旅游目的地要素属性的出现次数的统计对相应旅游目的地要素属性进行关注重要性估分计算的计算方式具体为:
在统计周期时间内,分别统计每种旅游目的地要素属性的出现次数;若一种旅游目的地要素属性出现一次,则相应旅游目的地要素属性的关注重要性评价分值加1;由此分别统计累加,计算得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值。
上述基于大数据的旅游目的地评价方法中,作为优选方案,得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值后,表征旅游目的地在各种旅游目的地要素属性上的评价情况的具体方式为:
建立旅游目的地的评价二维坐标系,所述评价二维坐标系的纵坐标轴y为关注重要性评价分值坐标轴,所述评价二维坐标系的横坐标轴x为情感评价分值坐标轴;从而,根据针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值,确定每种旅游目的地要素属性在所述评价二维坐标系中的坐标位置;若旅游目的地要素属性的关注重要性评价分值和情感评价分值越高,则旅游目的地在相应旅游目的地要素属性上的综合评价越高,反之则越低。
相比于现有技术,本发明具有如下有益效果:
本发明基于大数据的旅游目的地评价方法,利用从互联网络中获取到的对旅游目的地的点评信息进行信息处理和提取,获得能够对旅游目的地加以评价的信息参数,用以对旅游目的地进行估分计算,整个过程中不会参杂人为因素对估分计算结果的影响,全部依据互联网络中对旅游目的地的客观品论信息,因此依据由此获得的估分计算结果对旅游目的地加以评价,能够客观真实的反映大众对旅游目的地的评价情况,从而为发现旅游目的地的已有优势和不足以及推动旅游目的地区域的建设改进提供指导信息。
附图说明
图1为本发明基于大数据的旅游目的地评价方法的流程图。
图2为评价二维坐标系中IPA分析示意图。
具体实施方式
下面结合附图对本发明作进一步的详细说明。
本发明提供了一种基于大数据的旅游目的地评价方法,用于依据大数据的采集实现对旅游目的地的综合评价,从而为发现旅游目的地的已有优势和不足以及推动旅游目的地区域的建设改进提供指导信息。如图1所示,本发明的旅游目的地评价方法包括如下步骤:
步骤一:获取互联网络中对旅游目的地的点评信息;所述点评信息包括点评人信息、点评时间信息和点评内容文本信息。
具体应用时,可以从携程网的目的地指南频道等旅游相关网站的相关频道中利用网络抓取器进行点评信息的抓取,其获取方式可以具体设计为:
a1)获取互联网络中抓取针对旅游目的地进行点评描述的点评人、点评时间和点评描述文字信息,并使用纯文本格式加以存储。将这些点评人、点评时间和点评描述文字信息存储为纯文本格式,是为了更便于后续的文字信息提取和处理。
a2)根据预设的旅游目的地无关敏感词数据库,采用敏感词识别技术对纯文本格式的点评描述文字信息进行无关敏感词识别,进而删除所述点评描述文字信息中的无关敏感词,将剩余的文字信息作为旅游目的地的点评内容文本信息。这里,可将一些广告信息、垃圾信息等表示无关信息的相关词语作为无关敏感词,组合构建一个预设的旅游目的地无关敏感词数据库,从而通过该步骤的处理,就能够将点评描述文字信息中出现的广告信息、垃圾信息等无关信息通过无关敏感词识别和删除的方式给删除掉,仅保留与旅游目的地的评价有关的文字信息,作为旅游目的地的点评内容文本信息。
a3)将由此获得的点评人信息、点评时间信息和点评内容文本信息作为旅游目的地的点评信息。
步骤二:对获取的旅游目的地的点评信息中的点评内容文本信息进行分词识别处理,根据所述分词识别处理结果识别出所述点评内容文本信息中所描述的旅游目的地要素属性,并利用预设的情感词典识别出所述分词识别处理结果中针对所述旅游目的地要素属性的情况描述状态。
该步骤中,利用分词技术对文本信息进行分词识别处理在互联网络信息处理领域中是非常成熟的技术,因此利用分词技术对获取的旅游目的地的点评信息中的点评内容文本信息进行分词识别处理是非常容易实现的。在获得分词识别处理结果后,从中识别出旅游目的地要素属性的识别方式可以设计具体为:
b1)基于对旅游目的地的点评信息中的点评内容文本信息的分词识别处理结果,根据先验知识分别判断所述分词识别处理结果中划分出的每个词语是否为对旅游目的地的评论描述词语,进而提取出其中的各个评论描述词语;
b2)利用人工分类的方式或机器学习的分类方式,分别对提取出的各个评论描述词语进行旅游目的地要素属性类别的归类,使得归类所得的每一个旅游目的地要素属性类别中的评论描述词语都是在描述旅游目的同一个要素属性;
b3)分别统计归类所得的各个旅游目的地要素属性类别中评论描述词语的出现频次,将出现频次由高到低排列靠前的一个或多个旅游目的地要素属性类别所对应的旅游目的地要素属性,罗列为识别出的旅游目的地要素属性。
而具体而言,所识别到的旅游目的地要素属性可以是如下的任意一种:资源景区、人造景区、娱乐活动、运动康体、节庆事件、餐饮美食、酒店住宿、购物商品、旅游服务、旅游价格、旅游解说、旅游设施、经济水平、环境风貌、外部交通、内部交通、游憩场所、公共服务、安全治安、地方氛围、居民态度、天气气候。当然,有可能一则旅游目的地的点评内容文本信息中对多种旅游目的地要素属性的情况均存在评价描述,因此也有可能从旅游目的地的一则点评内容文本信息中识别出上述旅游目的地要素属性之中的多种。
而利用预设的情感词典识别出所述分词识别处理结果中针对所述旅游目的地要素属性的情况描述状态的识别方式可以具体设计为:
c1)基于对旅游目的地的点评信息中的点评内容文本信息的分词识别处理结果,分别对划分出的每个词语利用预设的情感词典进行对比识别,判别所述词语是否属于情感描述词;
c2)根据预设的情感词典,判断所判别出的情感描述词的情感评价类别;所述情感评价类别包括情感正面评价类、情感负面评价类和情感中立评价类;
c3)记录所述情感描述词的情感评价类别状态,作为其对应旅游目的地要素属性的情况描述状态。
在该处理过程中,针对于中文描述的情感评价类别判断,可以采用台湾大学研发的中文情感极性词典NTUSD作为预设的情感词典使用,其中表达积极情绪的情感描述词即属于情感正面评价类,表达消极情绪的情感描述词即属于情感负面评价类,而表达中性情绪的情感描述词即属于情感中立评价类。将分词识别处理结果中划分出的每个词语利用预设的情感词典分别进行对比识别,便能够确定该词语是否属于情感描述词,若是,并能够进一步判断出该情感描述词的情感评价类别。
步骤三:通过所获取的旅游目的地的各点评信息所体现的各不同点评人在不同点评时间的点评内容文本信息中识别出的各种旅游目的地要素属性及其相应的情况描述状态加以统计,根据对每种旅游目的地要素属性的出现次数的统计对相应旅游目的地要素属性进行关注重要性估分计算,根据对每种旅游目的地要素属性对应的情况描述状态的统计对相应旅游目的地要素属性进行情感评价估分计算,从而得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值,用以分别表征旅游目的地在所述各中旅游目的地要素属性上的评价情况。
该步骤中,根据对每种旅游目的地要素属性的出现次数的统计对相应旅游目的地要素属性进行关注重要性估分计算的计算方式可以具体设计为:在统计周期时间内,分别统计每种旅游目的地要素属性的出现次数;若一种旅游目的地要素属性出现一次,则相应旅游目的地要素属性的关注重要性评价分值加1;由此分别统计累加,计算得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值。
该步骤中,根据对每种旅游目的地要素属性对应的情况描述状态的统计对相应旅游目的地要素属性进行情感评价估分计算的计算方式可以具体设计为:在统计周期时间内,分别统计每种旅游目的地要素属性对应的各个情况描述状态;若一个情况描述状态为情感正面评价类,则相应旅游目的地要素属性的对应的情感评价分值加1;若一个情况描述状态为情感负面评价类,则相应旅游目的地要素属性的对应的情感评价分值减1;若一个情况描述状态为情感中立评价类,则相应旅游目的地要素属性的对应的情感评价分值加0;由此分别针对每种旅游目的地要素属性进行统计累加,分别计算得到每种旅游目的地要素属性对应的情感评价分值。
这里中的统计周期时间可以是一个预设定的周期时长,例如以一个月、一个季度或者一个年度作为一个统计周期。在统计得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值之后,这些信息就可以用以分别表征旅游目的地在所述各中旅游目的地要素属性上的评价情况。
具体而言,可以采用IPA分析方法(Importance-Performance Analysis)来分析表征旅游目的地在各种旅游目的地要素属性上的评价情况。IPA分析方法(Importance-Performance Analysis),即重要性及其表现分析法;IPA分析方法把重要因素和满意度的测量值置于二维象限中,以重要因素和满意度的平均值作为交叉点,具体划分为4个区域,即改进区(重点改进)、优势区(继续努力)、机会区(低预先事项)和维持区(不宜刻意追求)。其中,改进区揭示访问者认为非常重要的因素,但在具体旅游地的表现不令人满意,这是旅游目的地今后努力的方向;在优势区,访问者认为重要的因素在旅游地的表现非常好,今后要继续保持良好状态;在机会区,访问者认为不重要的因素在旅游地的表现也很差;在维持区,访问者认为不重要的因素在旅游地的表现较好。
因此,基于IPA分析方法的思想,在得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值后,表征旅游目的地在各种旅游目的地要素属性上的评价情况的具体方式可以设计为:建立旅游目的地的评价二维坐标系,所述评价二维坐标系的纵坐标轴y为关注重要性评价分值坐标轴,所述评价二维坐标系的横坐标轴x为情感评价分值坐标轴;从而,根据针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值,确定每种旅游目的地要素属性在所述评价二维坐标系中的坐标位置;若旅游目的地要素属性的关注重要性评价分值和情感评价分值越高,则旅游目的地在相应旅游目的地要素属性上的综合评价越高,反之则越低。由此,以各种旅游目的地要素属性的关注重要性评价分值的平均值和情感评价分值的平均值作为交叉点,在评价二维坐标系中可划分出四个象限区域,如图2所示,从而通过每种旅游目的地要素属性在评价二维坐标系中的坐标位置,可以评价为:
如果旅游目的地要素属性是位于第一象限(A象限),表示其关注重要性评价分值和情感评价分值皆较高,则可以判断该旅游目的地要素属性的情况应该继续保持;
如果旅游目的地要素属性是位于第二象限(B象限),表示其关注重要性评价分值较低、但情感评价分值较高,则可以判断该旅游目的地要素属性存在建设过度或供应过度的情况;
如果旅游目的地要素属性是位于第三象限(C象限),表示其关注重要性评价分值和情感评价分值皆较低,则可以判断该旅游目的地要素属性的建设或供应优先级较低;
如果旅游目的地要素属性是位于第四象限(D象限),表示其关注重要性评价分值较高、但情感评价分值较低,则可以判断该旅游目的地要素属性的情况需要加强建设或改善供应。
这样以来,就达到了对旅游目的地进行综合评价的目的,能够用以为发现旅游目的地的已有优势和不足、以及推动旅游目的地区域的建设改进提供指导意义。
综上所述,本发明基于大数据的旅游目的地评价方法,利用从互联网络中获取到的对旅游目的地的点评信息进行信息处理和提取,获得能够对旅游目的地加以评价的信息参数,用以对旅游目的地进行估分计算,整个过程中不会参杂人为因素对估分计算结果的影响,全部依据互联网络中对旅游目的地的客观品论信息,因此依据由此获得的估分计算结果对旅游目的地加以评价,能够客观真实的反映大众对旅游目的地的评价情况,从而为发现旅游目的地的已有优势和不足以及推动旅游目的地区域的建设改进提供指导信息。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (8)
1.基于大数据的旅游目的地评价方法,其特征在于,包括如下步骤:
获取互联网络中对旅游目的地的点评信息;所述点评信息包括点评人信息、点评时间信息和点评内容文本信息;
对获取的旅游目的地的点评信息中的点评内容文本信息进行分词识别处理,根据所述分词识别处理结果识别出所述点评内容文本信息中所描述的旅游目的地要素属性,并利用预设的情感词典识别出所述分词识别处理结果中针对所述旅游目的地要素属性的情况描述状态;
通过所获取的旅游目的地的各点评信息所体现的各不同点评人在不同点评时间的点评内容文本信息中识别出的各种旅游目的地要素属性及其相应的情况描述状态加以统计,根据对每种旅游目的地要素属性的出现次数的统计对相应旅游目的地要素属性进行关注重要性估分计算,根据对每种旅游目的地要素属性对应的情况描述状态的统计对相应旅游目的地要素属性进行情感评价估分计算,从而得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值,用以分别表征旅游目的地在所述各中旅游目的地要素属性上的评价情况。
2.根据权利要求1所述基于大数据的旅游目的地评价方法,其特征在于,所述旅游目的地的点评信息的获取方式具体为:
a1)获取互联网络中抓取针对旅游目的地进行点评描述的点评人、点评时间和点评描述文字信息,并使用纯文本格式加以存储;
a2)根据预设的旅游目的地无关敏感词数据库,采用敏感词识别技术对纯文本格式的点评描述文字信息进行无关敏感词识别,进而删除所述点评描述文字信息中的无关敏感词,将剩余的文字信息作为旅游目的地的点评内容文本信息;
a3)将由此获得的点评人信息、点评时间信息和点评内容文本信息作为旅游目的地的点评信息。
3.根据权利要求1所述基于大数据的旅游目的地评价方法,其特征在于,所述旅游目的地要素属性包括如下的任意一种或多种:资源景区、人造景区、娱乐活动、运动康体、节庆事件、餐饮美食、酒店住宿、购物商品、旅游服务、旅游价格、旅游解说、旅游设施、经济水平、环境风貌、外部交通、内部交通、游憩场所、公共服务、安全治安、地方氛围、居民态度、天气气候。
4.根据权利要求1所述基于大数据的旅游目的地评价方法,其特征在于,所述旅游目的地要素属性的识别方式具体为:
b1)基于对旅游目的地的点评信息中的点评内容文本信息的分词识别处理结果,根据先验知识分别判断所述分词识别处理结果中划分出的每个词语是否为对旅游目的地的评论描述词语,进而提取出其中的各个评论描述词语;
b2)利用人工分类的方式或机器学习的分类方式,分别对提取出的各个评论描述词语进行旅游目的地要素属性类别的归类,使得归类所得的每一个旅游目的地要素属性类别中的评论描述词语都是在描述旅游目的同一个要素属性;
b3)分别统计归类所得的各个旅游目的地要素属性类别中评论描述词语的出现频次,将出现频次由高到低排列靠前的一个或多个旅游目的地要素属性类别所对应的旅游目的地要素属性,罗列为识别出的旅游目的地要素属性。
5.根据权利要求1所述基于大数据的旅游目的地评价方法,其特征在于,利用预设的情感词典识别出所述分词识别处理结果中针对所述旅游目的地要素属性的情况描述状态的识别方式具体为:
c1)基于对旅游目的地的点评信息中的点评内容文本信息的分词识别处理结果,分别对划分出的每个词语利用预设的情感词典进行对比识别,判别所述词语是否属于情感描述词;
c2)根据预设的情感词典,判断所判别出的情感描述词的情感评价类别;所述情感评价类别包括情感正面评价类、情感负面评价类和情感中立评价类;
c3)记录所述情感描述词的情感评价类别状态,作为其对应旅游目的地要素属性的情况描述状态。
6.根据权利要求5所述基于大数据的旅游目的地评价方法,其特征在于,根据对每种旅游目的地要素属性对应的情况描述状态的统计对相应旅游目的地要素属性进行情感评价估分计算的计算方式具体为:
在统计周期时间内,分别统计每种旅游目的地要素属性对应的各个情况描述状态;若一个情况描述状态为情感正面评价类,则相应旅游目的地要素属性的对应的情感评价分值加1;若一个情况描述状态为情感负面评价类,则相应旅游目的地要素属性的对应的情感评价分值减1;若一个情况描述状态为情感中立评价类,则相应旅游目的地要素属性的对应的情感评价分值加0;由此分别针对每种旅游目的地要素属性进行统计累加,分别计算得到每种旅游目的地要素属性对应的情感评价分值。
7.根据权利要求1所述基于大数据的旅游目的地评价方法,其特征在于,根据对每种旅游目的地要素属性的出现次数的统计对相应旅游目的地要素属性进行关注重要性估分计算的计算方式具体为:
在统计周期时间内,分别统计每种旅游目的地要素属性的出现次数;若一种旅游目的地要素属性出现一次,则相应旅游目的地要素属性的关注重要性评价分值加1;由此分别统计累加,计算得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值。
8.根据权利要求1所述基于大数据的旅游目的地评价方法,其特征在于,得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值后,表征旅游目的地在各种旅游目的地要素属性上的评价情况的具体方式为:
建立旅游目的地的评价二维坐标系,所述评价二维坐标系的纵坐标轴y为关注重要性评价分值坐标轴,所述评价二维坐标系的横坐标轴x为情感评价分值坐标轴;从而,根据针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值,确定每种旅游目的地要素属性在所述评价二维坐标系中的坐标位置;若旅游目的地要素属性的关注重要性评价分值和情感评价分值越高,则旅游目的地在相应旅游目的地要素属性上的综合评价越高,反之则越低。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810097326.9A CN108269024A (zh) | 2018-01-31 | 2018-01-31 | 一种基于大数据的旅游目的地评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810097326.9A CN108269024A (zh) | 2018-01-31 | 2018-01-31 | 一种基于大数据的旅游目的地评价方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108269024A true CN108269024A (zh) | 2018-07-10 |
Family
ID=62777090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810097326.9A Pending CN108269024A (zh) | 2018-01-31 | 2018-01-31 | 一种基于大数据的旅游目的地评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108269024A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108961106A (zh) * | 2018-07-27 | 2018-12-07 | 贵州省山地资源研究所 | 喀斯特洞穴旅游资源评价模型及系统、信息数据处理终端 |
CN109523292A (zh) * | 2018-10-09 | 2019-03-26 | 湖南城市学院 | 一种旅游导览信息处理方法及系统、信息数据处理终端 |
CN109544394A (zh) * | 2018-11-06 | 2019-03-29 | 北京腾云天下科技有限公司 | 一种旅游地评估方法和计算设备 |
CN109858973A (zh) * | 2019-02-18 | 2019-06-07 | 成都中科大旗软件有限公司 | 一种区域旅游产业发展的分析方法 |
CN109978389A (zh) * | 2019-03-28 | 2019-07-05 | 吴道钰 | 一种对旅游景点进行消费者综合评价的方法 |
CN110059922A (zh) * | 2019-03-11 | 2019-07-26 | 北京比速信息科技有限公司 | 基于互联网游客点评数据的线上满意度评价方法 |
CN110598134A (zh) * | 2019-09-23 | 2019-12-20 | 钟栎娜 | 一种基于大数据的旅游目的地智能数据报告生成方法 |
CN110633370A (zh) * | 2019-09-19 | 2019-12-31 | 携程计算机技术(上海)有限公司 | Ota酒店标签的生成方法、系统、电子设备和介质 |
CN110781300A (zh) * | 2019-09-20 | 2020-02-11 | 南宁师范大学 | 基于百度百科知识图谱的旅游资源文化特色评分算法 |
CN111078894A (zh) * | 2019-12-17 | 2020-04-28 | 中国科学院遥感与数字地球研究所 | 一种基于隐喻主题挖掘的景区评价知识库构建方法 |
CN112417256A (zh) * | 2020-10-20 | 2021-02-26 | 中国环境科学研究院 | 一种基于互联网的自然保护地认知评价系统及方法 |
CN112926804A (zh) * | 2021-04-09 | 2021-06-08 | 广州宸祺出行科技有限公司 | 一种基于用户接受度的推荐上车点的筛选方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156287A (zh) * | 2016-06-24 | 2016-11-23 | 杭州天迈网络有限公司 | 基于旅游需求模板的景区评价数据分析舆情满意度方法 |
CN106407236A (zh) * | 2015-08-03 | 2017-02-15 | 北京众荟信息技术有限公司 | 一种面向点评数据的情感倾向性检测方法 |
-
2018
- 2018-01-31 CN CN201810097326.9A patent/CN108269024A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106407236A (zh) * | 2015-08-03 | 2017-02-15 | 北京众荟信息技术有限公司 | 一种面向点评数据的情感倾向性检测方法 |
CN106156287A (zh) * | 2016-06-24 | 2016-11-23 | 杭州天迈网络有限公司 | 基于旅游需求模板的景区评价数据分析舆情满意度方法 |
Non-Patent Citations (2)
Title |
---|
宋子千: "《中国旅游评论 2015 第4辑》", 30 November 2015 * |
王少兵,吴升: "基于景点在线评论文本的游客关注度和情感分析", 《贵州大学学报(自然科学版)》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108961106A (zh) * | 2018-07-27 | 2018-12-07 | 贵州省山地资源研究所 | 喀斯特洞穴旅游资源评价模型及系统、信息数据处理终端 |
CN109523292A (zh) * | 2018-10-09 | 2019-03-26 | 湖南城市学院 | 一种旅游导览信息处理方法及系统、信息数据处理终端 |
CN109544394A (zh) * | 2018-11-06 | 2019-03-29 | 北京腾云天下科技有限公司 | 一种旅游地评估方法和计算设备 |
CN109858973A (zh) * | 2019-02-18 | 2019-06-07 | 成都中科大旗软件有限公司 | 一种区域旅游产业发展的分析方法 |
CN110059922A (zh) * | 2019-03-11 | 2019-07-26 | 北京比速信息科技有限公司 | 基于互联网游客点评数据的线上满意度评价方法 |
CN109978389A (zh) * | 2019-03-28 | 2019-07-05 | 吴道钰 | 一种对旅游景点进行消费者综合评价的方法 |
CN110633370B (zh) * | 2019-09-19 | 2023-07-04 | 携程计算机技术(上海)有限公司 | Ota酒店标签的生成方法、系统、电子设备和介质 |
CN110633370A (zh) * | 2019-09-19 | 2019-12-31 | 携程计算机技术(上海)有限公司 | Ota酒店标签的生成方法、系统、电子设备和介质 |
CN110781300A (zh) * | 2019-09-20 | 2020-02-11 | 南宁师范大学 | 基于百度百科知识图谱的旅游资源文化特色评分算法 |
CN110781300B (zh) * | 2019-09-20 | 2022-08-23 | 南宁师范大学 | 基于百度百科知识图谱的旅游资源文化特色评分算法 |
CN110598134A (zh) * | 2019-09-23 | 2019-12-20 | 钟栎娜 | 一种基于大数据的旅游目的地智能数据报告生成方法 |
CN111078894A (zh) * | 2019-12-17 | 2020-04-28 | 中国科学院遥感与数字地球研究所 | 一种基于隐喻主题挖掘的景区评价知识库构建方法 |
CN111078894B (zh) * | 2019-12-17 | 2023-09-12 | 中国科学院遥感与数字地球研究所 | 一种基于隐喻主题挖掘的景区评价知识库构建方法 |
CN112417256A (zh) * | 2020-10-20 | 2021-02-26 | 中国环境科学研究院 | 一种基于互联网的自然保护地认知评价系统及方法 |
CN112417256B (zh) * | 2020-10-20 | 2024-05-24 | 中国环境科学研究院 | 一种基于互联网的自然保护地认知评价系统及方法 |
CN112926804A (zh) * | 2021-04-09 | 2021-06-08 | 广州宸祺出行科技有限公司 | 一种基于用户接受度的推荐上车点的筛选方法及系统 |
CN112926804B (zh) * | 2021-04-09 | 2024-04-26 | 广州宸祺出行科技有限公司 | 一种基于用户接受度的推荐上车点的筛选方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108269024A (zh) | 一种基于大数据的旅游目的地评价方法 | |
CN109325085B (zh) | 一种城市用地功能识别与变化检测方法 | |
Song et al. | Does geo-located social media reflect the visit frequency of urban parks? A city-wide analysis using the count and content of photographs | |
Orellana et al. | Exploring visitor movement patterns in natural recreational areas | |
CN103533501B (zh) | 一种地理围栏生成方法 | |
Zheng et al. | Chinese tourists in Nordic countries: An analysis of spatio-temporal behavior using geo-located travel blog data | |
Mou et al. | Cycling in Tibet: An analysis of tourists’ spatiotemporal behavior and infrastructure | |
CN107529135A (zh) | 基于智能设备数据的用户活动类型判别方法 | |
CN113806419B (zh) | 基于时空大数据的城市区域功能识别模型及识别方法 | |
CN109146155A (zh) | 基于多源数据融合的城市交通出行需求确定方法及系统 | |
Li et al. | A Method of selecting potential development regions based on GPS and social network models–from the perspective of tourist behavior | |
CN117217872A (zh) | 一种基于游客画像智能生成景区游玩方案的方法 | |
Fang et al. | Research on the correlation between pedestrian density and street spatial characteristics of commercial blocks in downtown area: A case study on Shanghai Tianzifang | |
Li et al. | Construction of Smart City Street Landscape Big Data‐Driven Intelligent System Based on Industry 4.0 | |
Yu et al. | Intergenerational differences in the urban vibrancy of TOD: Impacts of the built environment on the activities of different age groups | |
Yu et al. | Analyzing the structure of tourism destination network based on digital footprints: Taking Guilin, China as a case | |
Lu et al. | Spatial and temporal distribution characteristics of flower-viewing tourism and its influencing factors in China | |
CN116822798B (zh) | 一种用于城乡风貌特色塑造的区域地方性度量方法 | |
CN107121143B (zh) | 一种协同poi数据的道路选取方法 | |
Chaudhuri et al. | Application of web-based Geographical Information System (GIS) in tourism development | |
Li | Application of Spatial-Temporal Behavioral Trajectory Analysis in the Space Design of Digital Villages | |
Paul | Analysing tourism attractiveness using probabilistic travel model: A study of Gangtok and its surroundings | |
Hung et al. | The influence of tourism dependency on tourism impact and development support attitude | |
Xu | Research on the construction of cultural tourism market in Shenyang based on big data | |
Marchi et al. | Measuring destination image of an Italian island: An analysis of online content generated by local operators and tourists. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180710 |