CN108108454A - 一种基于多语种舆情分析的旅游大数据系统 - Google Patents

一种基于多语种舆情分析的旅游大数据系统 Download PDF

Info

Publication number
CN108108454A
CN108108454A CN201711459797.1A CN201711459797A CN108108454A CN 108108454 A CN108108454 A CN 108108454A CN 201711459797 A CN201711459797 A CN 201711459797A CN 108108454 A CN108108454 A CN 108108454A
Authority
CN
China
Prior art keywords
big data
analysis
tourism
language
subsystem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711459797.1A
Other languages
English (en)
Inventor
张慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Global Tone Communication Technology Qingdao Co Ltd
Original Assignee
Global Tone Communication Technology Qingdao Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Global Tone Communication Technology Qingdao Co Ltd filed Critical Global Tone Communication Technology Qingdao Co Ltd
Priority to CN201711459797.1A priority Critical patent/CN108108454A/zh
Publication of CN108108454A publication Critical patent/CN108108454A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/12Hotels or restaurants

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种基于多语种舆情分析的旅游大数据系统,包括跨语言大数据采集子系统、跨语言大数据处理子系统和跨语言大数据分析应用子系统,跨语言大数据采集子系统用于采集多维度旅游舆情数据采集,并实时发送至跨语言大数据处理子系统和跨语言大数据分析应用子系统,跨语言大数据处理子系统对采集到的多语种数据的智能处理分析并将分析结果发送至跨语言大数据分析应用子系统,跨语言大数据分析应用子系统将分析结果进行推广和应用。本发明通过全球多语种数据源的采集和机器自动翻译和处理,融合国内旅游大数据,形成全球旅游大数据知识图谱和旅游智库,以全球视野助力旅游发展。

Description

一种基于多语种舆情分析的旅游大数据系统
技术领域
本发明涉及旅游大数据平台技术。
背景技术
作为全球第四大入境目的地国家,我国旅游业国际化进程不断加快。近几年国家持续推进入境旅游便利化政策和加强海外市场宣传推广,入境旅游强势增长,同时伴随着国家的战略推进和国家自贸区建设,也为入境旅游市场带来新的增长点。2017年上半年入境旅游人数 6950 万人次,比上年同期增长2.4%,国际旅游收入601亿美元,比上年同期增长4.3%。目前全国各省市都在积极实施国际化旅游目的地战略,针对入境旅游展开了海外客源市场的大力推广和宣传营销,旅游目的地竞争日益加剧。但是海外市场精准营销、城市品牌针对性推广仍然困难重重,并且海外游客的旅游满意度情况无法真实掌握。
发明内容
本发明所要解决的技术问题是提供一种基于多语种舆情分析的旅游大数据系统,运用大数据技术、机器翻译和新媒体手段,实现海外多语种旅游舆情信息的采集、处理和分析,为国际旅游市场拓展、国际旅游营销判断、国际游客定位、海外旅游舆情监测和分析、对外服务优化和产品提升提供服务。
本发明解决上述技术问题所采用的技术方案是:一种基于多语种舆情分析的旅游大数据系统,包括跨语言大数据采集子系统、跨语言大数据处理子系统和跨语言大数据分析应用子系统,跨语言大数据采集子系统用于采集多维度旅游舆情数据采集,并实时发送至跨语言大数据处理子系统和跨语言大数据分析应用子系统,跨语言大数据处理子系统对采集到的多语种数据的智能处理分析并将分析结果发送至跨语言大数据分析应用子系统,跨语言大数据分析应用子系统将分析结果进行推广和应用。
进一步地,跨语言大数据采集子系统包括实时抓取配置平台,实时抓取配置平台能够抓取和监测网站和关键词。
进一步地,跨语言大数据处理子系统通过包括垃圾信息自动过滤、清洗、智能去重、HTML内容提取和快照存储的手段对采集到的数据进行初步分析,并对原始数据采用筛选、派生计算和模型计算的手段进行加工处理,并通过分类和计算汇编成报表、图和表。
进一步地,跨语言大数据分析应用子系统包括智能分析模块、海外旅游智库、海外旅游舆情实时监测模块、海外旅游舆情专题分析模块、海外精准营销模块、国际旅游资讯服务模块和大数据可视化展示模块,其中,智能分析模块通过文本自动摘要技术、文本聚类技术和语义搜索技术,实现传播分析、全球客源地分析、旅游情感分析、全球游客分析和社交媒体分析,并能结合大数据分析模型,自动生成用户需要的分析报告,输出报告文件;海外旅游智库为用户提供海外各第旅游竞争力查询、旅游品牌海外影响力查询、海外旅游资讯查询和海外旅游相关文献查询端口,海外旅游舆情实时监测模块能够自动、实时监测全球旅游舆情信息,并根据信息的热度,自动进行热度舆情提醒显示;大数据可视化展示模块将各类数据进行分析建模,并利用可视化技术将多语种旅游舆情大数据以图形化的形式展示出来。
本发明的有益效果是:1、本发明通过全球多语种数据源的采集和机器自动翻译和处理,融合国内旅游大数据,形成全球旅游大数据知识图谱和旅游智库,以全球视野助力旅游发展。2、本发明通过旅游热点实时监测(智能语义分析、机器自动翻译、智能采编、智能预警)和全球旅游舆情实时分析(舆情受众画像及传播分析、旅游区域分析、情感倾向分析、游客画像分析),为市场推广和精准营销提供真实、全面、有效的数据支撑。3、本发明针对多语种旅游舆情、旅游产业动态、营销媒体进行实时监测并进行专题分析,获得海外市场的旅游资讯、评价、意向、喜好和习惯,助力政府了解海外游客真实的需求和感受,助力对外服务提升、产品优化和提高国际竞争力。
附图说明
图1是本发明的整体架构图。
具体实施方式
以下结合附图对本发明具体实施方案做进一步详细说明,应当指出的是,实施例只是对本发明技术方案的具体阐述,并不是对本发明的限定。
如图1所示,本发明的基于多语种舆情分析的旅游大数据系统主要包括三大子系统,分别是跨语言大数据采集子系统、跨语言大数据处理子系统以及跨语言大数据分析应用子系统。
1、跨语言大数据采集子系统
通过网络爬虫技术和多种类型的数据采集引擎,对全球32+万数据源(新媒体社交平台、海外媒体平台、旅游相关平台)进行7×24小时不间断多维度数据采集,实现多语种旅游舆情数据自动化抓取,并支持分布并发处理,确保数据更新的实时性。数据都统一存储和管理在数据中心,其中基于神经网络的机器翻译引擎被无缝应用于三个子系统中。
跨语言大数据采集子系统设置了灵活的抓取配置平台,支持抓取关键词和抓取网址等参数的自定义,可灵活配置需要抓取和监测的网站和关键词。
2、跨语言大数据处理子系统
跨语言大数据处理子系统实现对采集到的多语种数据的智能处理分析,包括垃圾信息自动过滤、清洗、智能去重、HTML内容提取、快照存储等。系统对原始数据采用筛选、派生计算、模型计算等加工处理手段,进行进一步的分类,再辅助汇总和必要的加工计算,编织成报表、图、表等结果。该子系统支持对数据进行自动化处理,支持按照旅游的科学范式,生成创新型旅游统计计算方法和各类指数算法模型。
3、跨语言大数据分析应用子系统
全球旅游舆情数据采集过来之后,经过大数据分析处理后,就可以进行相关数据的分析应用了。跨语言大数据分析应用子系统包括智能分析、海外旅游智库、海外旅游舆情实时监测、海外旅游舆情专题分析、海外精准营销、国际旅游资讯服务、大数据可视化展示等。
智能分析:通过文本自动摘要技术、文本聚类技术、语义搜索等技术,可以实现传播分析、全球客源国(城市)分析、旅游情感分析、全球游客分析、社交媒体分析等。结合大数据分析模型,自动生成用户需要的分析报告,输出报告文件。
海外旅游智库可以为用户提供海外各国(城市)旅游竞争力查询、旅游品牌海外影响力查询、海外旅游资讯查询、海外旅游相关文献查询等功能。系统内嵌的机器翻译引擎会自动将多语种信息翻译成中文,用户可以对感兴趣的数据查看中文和对应的原文。
海外旅游舆情实时监测:可以自动、实时监测全球旅游舆情信息,并根据信息的热度,自动进行热度舆情提醒显示。用户可以根据舆情热点内容和传播速度快速反应。通过语义分析,发现最新鲜、最重要的热点资讯并针对性地推送给用户。
大数据可视化展示:将各类数据进行分析建模,并利用可视化技术将多语种旅游舆情大数据以图形化的形式展示出来。

Claims (4)

1.一种基于多语种舆情分析的旅游大数据系统,其特征是,包括跨语言大数据采集子系统、跨语言大数据处理子系统和跨语言大数据分析应用子系统,跨语言大数据采集子系统用于采集多维度旅游舆情数据采集,并实时发送至跨语言大数据处理子系统和跨语言大数据分析应用子系统,跨语言大数据处理子系统对采集到的多语种数据的智能处理分析并将分析结果发送至跨语言大数据分析应用子系统,跨语言大数据分析应用子系统将分析结果进行推广和应用。
2.根据权利要求1所述的一种基于多语种舆情分析的旅游大数据系统,其特征是,跨语言大数据采集子系统包括实时抓取配置平台,实时抓取配置平台能够抓取和监测网站和关键词。
3.根据权利要求1所述的一种基于多语种舆情分析的旅游大数据系统,其特征是,跨语言大数据处理子系统通过包括垃圾信息自动过滤、清洗、智能去重、HTML内容提取和快照存储的手段对采集到的数据进行初步分析,并对原始数据采用筛选、派生计算和模型计算的手段进行加工处理,并通过分类和计算汇编成报表、图和表。
4.根据权利要求1所述的一种基于多语种舆情分析的旅游大数据系统,其特征是,跨语言大数据分析应用子系统包括智能分析模块、海外旅游智库、海外旅游舆情实时监测模块、海外旅游舆情专题分析模块、海外精准营销模块、国际旅游资讯服务模块和大数据可视化展示模块,其中,智能分析模块通过文本自动摘要技术、文本聚类技术和语义搜索技术,实现传播分析、全球客源地分析、旅游情感分析、全球游客分析和社交媒体分析,并能结合大数据分析模型,自动生成用户需要的分析报告,输出报告文件;海外旅游智库为用户提供海外各第旅游竞争力查询、旅游品牌海外影响力查询、海外旅游资讯查询和海外旅游相关文献查询端口,海外旅游舆情实时监测模块能够自动、实时监测全球旅游舆情信息,并根据信息的热度,自动进行热度舆情提醒显示;大数据可视化展示模块将各类数据进行分析建模,并利用可视化技术将多语种旅游舆情大数据以图形化的形式展示出来。
CN201711459797.1A 2017-12-28 2017-12-28 一种基于多语种舆情分析的旅游大数据系统 Pending CN108108454A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711459797.1A CN108108454A (zh) 2017-12-28 2017-12-28 一种基于多语种舆情分析的旅游大数据系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711459797.1A CN108108454A (zh) 2017-12-28 2017-12-28 一种基于多语种舆情分析的旅游大数据系统

Publications (1)

Publication Number Publication Date
CN108108454A true CN108108454A (zh) 2018-06-01

Family

ID=62213987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711459797.1A Pending CN108108454A (zh) 2017-12-28 2017-12-28 一种基于多语种舆情分析的旅游大数据系统

Country Status (1)

Country Link
CN (1) CN108108454A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108876540A (zh) * 2018-06-20 2018-11-23 中译语通科技(青岛)有限公司 一种基于大数据和跨语言科技的闭环旅游营销系统
CN109271529A (zh) * 2018-10-10 2019-01-25 内蒙古大学 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法
CN109446405A (zh) * 2018-09-12 2019-03-08 中国科学院自动化研究所 基于大数据的旅游产业推广方法及系统
CN109492225A (zh) * 2018-11-08 2019-03-19 大连瀚闻资讯有限公司 一种小语种国家的舆情信息文本处理方法
CN109697214A (zh) * 2018-11-30 2019-04-30 武汉烽火众智数字技术有限责任公司 一种旅游数据分析系统及方法
CN109978389A (zh) * 2019-03-28 2019-07-05 吴道钰 一种对旅游景点进行消费者综合评价的方法
WO2020000847A1 (zh) * 2018-06-25 2020-01-02 中译语通科技股份有限公司 一种基于新闻大数据的恐慌指数监测分析方法及系统
CN110837593A (zh) * 2019-11-05 2020-02-25 韶关学院 一种基于聚焦爬虫技术的旅游跟踪系统
CN113326870A (zh) * 2021-05-11 2021-08-31 中科迅(深圳)科技有限公司 一种基于大数据的多平台旅游数据融合系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140173406A1 (en) * 2012-12-17 2014-06-19 Amadeus S.A.S. Recommendation engine for interactive search forms
CN104809634A (zh) * 2015-05-11 2015-07-29 中国旅游研究院 旅游数据调研与监测系统
CN106066892A (zh) * 2016-06-20 2016-11-02 四川上略互动网络技术有限公司 一种基于多源数据融合的旅游信息数据处理方法
CN107515954A (zh) * 2017-09-30 2017-12-26 广东美的制冷设备有限公司 家用设备报告的生成方法、大数据系统和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140173406A1 (en) * 2012-12-17 2014-06-19 Amadeus S.A.S. Recommendation engine for interactive search forms
CN104809634A (zh) * 2015-05-11 2015-07-29 中国旅游研究院 旅游数据调研与监测系统
CN106066892A (zh) * 2016-06-20 2016-11-02 四川上略互动网络技术有限公司 一种基于多源数据融合的旅游信息数据处理方法
CN107515954A (zh) * 2017-09-30 2017-12-26 广东美的制冷设备有限公司 家用设备报告的生成方法、大数据系统和存储介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108876540A (zh) * 2018-06-20 2018-11-23 中译语通科技(青岛)有限公司 一种基于大数据和跨语言科技的闭环旅游营销系统
WO2020000847A1 (zh) * 2018-06-25 2020-01-02 中译语通科技股份有限公司 一种基于新闻大数据的恐慌指数监测分析方法及系统
CN109446405B (zh) * 2018-09-12 2021-04-30 中国科学院自动化研究所 基于大数据的旅游产业推广方法及系统
CN109446405A (zh) * 2018-09-12 2019-03-08 中国科学院自动化研究所 基于大数据的旅游产业推广方法及系统
CN109271529B (zh) * 2018-10-10 2020-09-01 内蒙古大学 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法
CN109271529A (zh) * 2018-10-10 2019-01-25 内蒙古大学 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法
CN109492225A (zh) * 2018-11-08 2019-03-19 大连瀚闻资讯有限公司 一种小语种国家的舆情信息文本处理方法
CN109697214A (zh) * 2018-11-30 2019-04-30 武汉烽火众智数字技术有限责任公司 一种旅游数据分析系统及方法
CN109697214B (zh) * 2018-11-30 2022-07-08 武汉烽火众智数字技术有限责任公司 一种旅游数据分析系统及方法
CN109978389A (zh) * 2019-03-28 2019-07-05 吴道钰 一种对旅游景点进行消费者综合评价的方法
CN110837593A (zh) * 2019-11-05 2020-02-25 韶关学院 一种基于聚焦爬虫技术的旅游跟踪系统
CN113326870A (zh) * 2021-05-11 2021-08-31 中科迅(深圳)科技有限公司 一种基于大数据的多平台旅游数据融合系统
CN113326870B (zh) * 2021-05-11 2023-08-04 中科迅(深圳)科技有限公司 一种基于大数据的多平台旅游数据融合系统

Similar Documents

Publication Publication Date Title
CN108108454A (zh) 一种基于多语种舆情分析的旅游大数据系统
CN103092950B (zh) 一种网络舆情地理位置实时监控系统和方法
Roidt et al. Learning from integrated management approaches to implement the Nexus
CN103139256B (zh) 一种多租户网络舆情监控方法及系统
CN109242553A (zh) 一种用户行为数据推荐方法、服务器及计算机可读介质
CN106383887A (zh) 一种环保新闻数据采集和推荐展示的方法及系统
CN105956016A (zh) 关联信息可视化处理系统
CN109460922A (zh) 一种具有电力行业特征的网络舆情分析与辅助决策系统
CN106599174A (zh) 一种新闻实时推荐系统及其方法
CN102346901A (zh) 一种互联网药品交易主体信用评估系统及其方法
CN101576892A (zh) 地点区域确定方法和装置
CN106534784A (zh) 一种用于视频分析数据结果集的采集分析存储统计系统
Pettit et al. Big bicycle data processing: From personal data to urban applications
CN102663083A (zh) 基于分布式计算的大规模社交网络信息抽取方法
CN110321446A (zh) 相关数据推荐方法、装置、计算机设备及存储介质
CN110889632B (zh) 一种公司形象提升系统的数据监测分析系统
CN107679086A (zh) 一种大数据处理系统
CN112860835A (zh) 一种自然资源数据管理方法及系统
CN107590672A (zh) 基于马斯洛需求层次理论的推荐方法及装置
CN107798101A (zh) 用户自由点选配置的网页数据采集方法及系统
CN108805755B (zh) 一种旅游套餐生成方法及装置
CN100495403C (zh) 联机分析处理系统中处理非空数据的方法和装置
CN103900537A (zh) 一种基于3s技术的海岛资源动态监测系统及方法
Lawu et al. Social media data crowdsourcing as a new stream for environmental planning & monitoring: A review
CN107092618A (zh) 一种信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180601