CN107066565A - 一种旅游热点预测系统 - Google Patents

一种旅游热点预测系统 Download PDF

Info

Publication number
CN107066565A
CN107066565A CN201710214028.9A CN201710214028A CN107066565A CN 107066565 A CN107066565 A CN 107066565A CN 201710214028 A CN201710214028 A CN 201710214028A CN 107066565 A CN107066565 A CN 107066565A
Authority
CN
China
Prior art keywords
data
prediction
visitor
module
hot spot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710214028.9A
Other languages
English (en)
Inventor
曹磊
陈龙
庞子龙
王子剑
李震川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Connaught Intelligent Technology Co Ltd
Original Assignee
Shanghai Connaught Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Connaught Intelligent Technology Co Ltd filed Critical Shanghai Connaught Intelligent Technology Co Ltd
Priority to CN201710214028.9A priority Critical patent/CN107066565A/zh
Publication of CN107066565A publication Critical patent/CN107066565A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种旅游热点预测系统,包括数据采集模块、输入模块和预测模块;所述数据采集模块用于采集预测数据并发送给所述预测模块,所述预测数据包括:景区相关数据、地区数据和游客行为数据;所述输入模块用于输入时间和热点信息至所述预测模块;所述预测模块设置有神经网络,所述神经网络根据所述预测数据、所述时间和所述热点信息预测旅游热点。本方案能够进行旅游热点的预测。

Description

一种旅游热点预测系统
技术领域
本发明涉及热点预测技术领域,尤其涉及一种旅游热点预测系统。
背景技术
互联网上每时每刻都有数十亿条的资讯信息被用户发布、获取、评价与传播,如何在这动态而分散信息活动中挖掘其中的热点话题成为互联网的研究重点。
目前一般通过K-means文本聚类及关键词提取等方法对舆情热点并转为词向量模型,并统计出舆情热点词语;也有通过抓取舆情信息聚类分析,从分析类别的内容和数量上阐述舆情热点。
可见,目前的统计方法一般只能判断热点信息,无法进行旅游热点的预测。
发明内容
有鉴于此,本发明要解决的技术问题是提供一种旅游热点预测系统,能够进行旅游热点的预测。
本发明的技术方案是这样实现的:
一种旅游热点预测系统,包括数据采集模块、输入模块和预测模块;
所述数据采集模块用于采集预测数据并发送给所述预测模块,所述预测数据包括:景区相关数据、地区数据和游客行为数据;
所述输入模块用于输入时间和热点信息至所述预测模块;
所述预测模块设置有神经网络,所述神经网络根据所述预测数据、所述时间和所述热点信息预测旅游热点。
优选的,还包括情感分析模块;
所述情感分析模块,用于根据所述游客行为数据分析游客的情感,生成游客情感数据并发送至所述预测模块。
优选的,所述根据所述游客行为数据分析游客的情感,生成游客情感数据包括:
将所述游客行为数据的文本数据进行分词并转换为词向量,将所述词向量填充为句向量,将所述句向量输入用于情感分析的长短时记忆网络,分析游客的情感,生成游客情感数据。
优选的,所述转换为词向量包括:
通过转换工具将词语转换为词向量,所述转换工具为Word2Vec。
优选的,在所述将所述词向量填充为句向量之后,还包括:
设置句向量长度为N,若词语数量小于N则在所述句向量后部填充0使所述句向量长度为N。
优选的,所述神经网络为深度神经网络。
本发明提出的旅游热点预测系统,通过采集景区相关数据、地区数据和游客行为数据,并输入时间和热点信息,从而神经网络可以根据所述预测数据、所述时间和所述热点信息预测旅游热点。
附图说明
图1为本发明实施例提出的旅游热点预测系统的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提出了一种旅游热点预测系统1,包括数据采集模块101、输入模块102和预测模块103;
所述数据采集模块用于采集预测数据并发送给所述预测模块,所述预测数据包括:景区相关数据、地区数据和游客行为数据;
所述输入模块用于输入时间和热点信息至所述预测模块;
所述预测模块设置有神经网络,所述神经网络根据所述预测数据、所述时间和所述热点信息预测旅游热点。
可见,本发明提出的旅游热点预测系统,通过采集景区相关数据、地区数据和游客行为数据,并输入时间和热点信息,从而神经网络根据所述预测数据、所述时间和所述热点信息预测旅游热点。
在本实施例中,旅游热点系统将定期从官方接口获取每个时间段景区相关数据如:景区人流量,景区票价,景区内部收费票价,景区公交数量,景区停车场容量,景区工作人员数量,景区类型(游乐场、人文景点、自然景点);同时,旅游热点系统将将定期获取景区所在地区每个时间段相关数据,如:地区人流量、地区酒店数量、地区经济指数、地区车流量、地区五星级酒店数量、地区人均收入、地区旅行社数量、地区导游数量、地区人文景点游客数量、地区自然景点游客数量、地区游乐场游客数量;另外,旅游热点系统也会使用网络爬虫定期从网络爬去相关的游客行为数据,如:旅游网站用户游记、用户对景点评论、用户点击率、浏览次数、用户对景区好评率、景区相关的旅行社产品数量、旅行社产品购买人数等。
在本发明的一个优选实施例中,旅游热点预测系统还包括情感分析模块;
所述情感分析模块,用于根据所述游客行为数据分析游客的情感,生成游客情感数据并发送至所述预测模块。
其中,根据所述游客行为数据分析游客的情感,生成游客情感数据包括:
将所述游客行为数据的文本数据进行分词并转换为词向量,将所述词向量填充为句向量,将所述句向量输入用于情感分析的长短时记忆网络,分析游客的情感,生成游客情感数据。
具体的,通过转换工具Word2Vec将词语转换为词向量。
在情感分析时,首先使用结巴分词将文本进行分词,然后使用Word2Vec工具将已分词语转换为词向量,而后使用填充序列方法将语句转换为句向量。得到句向量后将其输入进入用于情感分析的长短时记忆网络中,学习出情感分类。
其中,基于长短时记忆网络(LSTM)的情感分析方法对旅游网站不同景区用户游记及用户评论分析其情感倾向,分为喜欢、讨厌两种情感分类,并统计整体情感倾向,生成游客情感数据。
在本实施例中,可以设置句向量长度为N,若词语数量小于N则在所述句向量后部填充0使所述句向量长度为N,从而便于长短时记忆网络的分析。
在本发明的一个优选实施例中,神经网络为深度神经网络。
在本实施例中,神经网络的作用是根据数据进行预测。
深度神经网络具有优异的特征学习能力,深度神经网络模型结构具有一定的深度,通常具有4层、5层,甚至10多层的隐藏层;通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使预测更加容易。
本发明实施例提出的旅游热点预测系统进行预测时,系统采集景区相关数据、地区数据和游客行为数据,情感分析模块根据所述游客行为数据分析游客的情感数据,将景区相关数据、地区数据和游客行为数据、情感数据当前时间和热点信息数据输入到深层神经网络中,深层神经网络从多种数据中学习隐藏关系,通过各种数据之间的隐藏关系预测未来旅游热点。
在本实施例中,深度神经网络(DNN),也可以使用深度卷积网络或者长短时记忆网络进行代替,其中深度卷积网络可能能够挖掘更加深入的数据间隐藏关系,但容易过拟合;长短时记忆网络可以将时间序列也考虑在预测分析中。
综上所述,本发明实施例至少可以实现如下效果:
在本发明实施例中,通过采集景区相关数据、地区数据和游客行为数据,并输入时间和热点信息,从而神经网络根据所述预测数据、所述时间和所述热点信息预测旅游热点。
在本发明实施例中,旅游热点预测系统还包括情感分析模块,从而可以统计游客的情感数据并作为输入数据输入,使预测结果更加准确。
在本发明实施例中,设置句向量长度为N,若词语数量小于N则在所述句向量后部填充0使所述句向量长度为N,从而可以规范句向量的长度,便于长短时记忆网络的分析。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (6)

1.一种旅游热点预测系统,其特征在于,包括数据采集模块、输入模块和预测模块;
所述数据采集模块用于采集预测数据并发送给所述预测模块,所述预测数据包括:景区相关数据、地区数据和游客行为数据;
所述输入模块用于输入时间和热点信息至所述预测模块;
所述预测模块设置有神经网络,所述神经网络根据所述预测数据、所述时间和所述热点信息预测旅游热点。
2.如权利要求1所述的旅游热点预测系统,其特征在于,还包括情感分析模块;
所述情感分析模块,用于根据所述游客行为数据分析游客的情感,生成游客情感数据并发送至所述预测模块。
3.如权利要求2所述的旅游热点预测系统,其特征在于,所述根据所述游客行为数据分析游客的情感,生成游客情感数据包括:
将所述游客行为数据的文本数据进行分词并转换为词向量,将所述词向量填充为句向量,将所述句向量输入用于情感分析的长短时记忆网络,分析游客的情感,生成游客情感数据。
4.如权利要求3所述的旅游热点预测系统,其特征在于,所述转换为词向量包括:
通过转换工具将词语转换为词向量,所述转换工具为Word2Vec。
5.如权利要求1所述的旅游热点预测系统,其特征在于,在所述将所述词向量填充为句向量之后,还包括:
设置句向量长度为N,若词语数量小于N则在所述句向量后部填充0使所述句向量长度为N。
6.如权利要求1-5任一项所述的旅游热点预测系统,其特征在于,所述神经网络为深度神经网络。
CN201710214028.9A 2017-04-01 2017-04-01 一种旅游热点预测系统 Pending CN107066565A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710214028.9A CN107066565A (zh) 2017-04-01 2017-04-01 一种旅游热点预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710214028.9A CN107066565A (zh) 2017-04-01 2017-04-01 一种旅游热点预测系统

Publications (1)

Publication Number Publication Date
CN107066565A true CN107066565A (zh) 2017-08-18

Family

ID=59602137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710214028.9A Pending CN107066565A (zh) 2017-04-01 2017-04-01 一种旅游热点预测系统

Country Status (1)

Country Link
CN (1) CN107066565A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188339A (zh) * 2018-02-23 2019-08-30 清华大学 景点评价方法、装置、计算机设备和存储介质
CN111652444A (zh) * 2020-06-05 2020-09-11 南京机电职业技术学院 一种基于K-means和LSTM的日游客量预测方法
CN111882344A (zh) * 2020-06-12 2020-11-03 智云众(北京)信息技术有限公司 基于景区热度的广告投放方法、装置、设备及存储介质
CN112100367A (zh) * 2019-05-28 2020-12-18 贵阳海信网络科技有限公司 一种景区舆情预警方法及装置
CN117132004A (zh) * 2023-10-27 2023-11-28 四川省建筑设计研究院有限公司 基于神经网络的公共场所人流密度预测方法、系统及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007306085A (ja) * 2006-05-09 2007-11-22 Tsutomu Miyake 電子メール配信サーバ装置
CN102510529A (zh) * 2011-09-22 2012-06-20 中国科学技术大学 对节目进行点播量预测和存储调度的方法
CN103634341A (zh) * 2012-08-22 2014-03-12 鸿富锦精密工业(深圳)有限公司 移动终端、云服务器以及热门景点的识别方法
CN106339447A (zh) * 2016-08-23 2017-01-18 达而观信息科技(上海)有限公司 一种自动预测热点视频的系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007306085A (ja) * 2006-05-09 2007-11-22 Tsutomu Miyake 電子メール配信サーバ装置
CN102510529A (zh) * 2011-09-22 2012-06-20 中国科学技术大学 对节目进行点播量预测和存储调度的方法
CN103634341A (zh) * 2012-08-22 2014-03-12 鸿富锦精密工业(深圳)有限公司 移动终端、云服务器以及热门景点的识别方法
CN106339447A (zh) * 2016-08-23 2017-01-18 达而观信息科技(上海)有限公司 一种自动预测热点视频的系统及方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188339A (zh) * 2018-02-23 2019-08-30 清华大学 景点评价方法、装置、计算机设备和存储介质
CN110188339B (zh) * 2018-02-23 2020-08-11 清华大学 景点评价方法、装置、计算机设备和存储介质
CN112100367A (zh) * 2019-05-28 2020-12-18 贵阳海信网络科技有限公司 一种景区舆情预警方法及装置
CN111652444A (zh) * 2020-06-05 2020-09-11 南京机电职业技术学院 一种基于K-means和LSTM的日游客量预测方法
CN111652444B (zh) * 2020-06-05 2023-07-21 南京机电职业技术学院 一种基于K-means和LSTM的日游客量预测方法
CN111882344A (zh) * 2020-06-12 2020-11-03 智云众(北京)信息技术有限公司 基于景区热度的广告投放方法、装置、设备及存储介质
CN117132004A (zh) * 2023-10-27 2023-11-28 四川省建筑设计研究院有限公司 基于神经网络的公共场所人流密度预测方法、系统及设备
CN117132004B (zh) * 2023-10-27 2024-02-09 四川省建筑设计研究院有限公司 基于神经网络的公共场所人流密度预测方法、系统及设备

Similar Documents

Publication Publication Date Title
An et al. Design of recommendation system for tourist spot using sentiment analysis based on CNN-LSTM
CN107066565A (zh) 一种旅游热点预测系统
CN103778215B (zh) 一种基于情感分析和隐马尔科夫模型融合的股市预测方法
Wang et al. Fine-grained assessment of greenspace satisfaction at regional scale using content analysis of social media and machine learning
Celikyilmaz et al. LDA based similarity modeling for question answering
CN107578292B (zh) 一种用户画像构建系统
Rong et al. Deep rolling: A novel emotion prediction model for a multi-participant communication context
CN109241255A (zh) 一种基于深度学习的意图识别方法
CN109885824A (zh) 一种层次的中文命名实体识别方法、装置及可读存储介质
CN108549658A (zh) 一种基于语法分析树上注意力机制的深度学习视频问答方法及系统
Wang et al. Learning performance prediction via convolutional GRU and explainable neural networks in e-learning environments
CN103869998A (zh) 一种对输入法所产生的候选项进行排序的方法及装置
Luo et al. Exploring destination image through online reviews: an augmented mining model using latent Dirichlet allocation combined with probabilistic hesitant fuzzy algorithm
CN113741759B (zh) 评论信息的展示方法、装置、计算机设备和存储介质
Blanchard et al. Intelligibility and first passage times in complex urban networks
Wan et al. Constructing the quality measurement model of street space and its application in the old town in Wuhan
Yin Forecast without historical data: objective tourist volume forecast model for newly developed rural tourism areas of China
Yin et al. ADPR: An attention-based deep learning point-of-interest recommendation framework
Wang et al. Sentiment Classification of Educational Tourism Reviews Based on Parallel CNN and LSTM with Attention Mechanism
Mou et al. Understanding tourists' travel behavior before, during, and after the trip with data from social media platforms
Chen et al. Web Evaluation Analysis of Tourism Destinations Based on Data Mining
Chai-Allah et al. Mining crowdsourced text to capture hikers' perceptions associated with landscape features and outdoor physical activities
Zhao et al. Assessing and interpreting perceived park accessibility, usability and attractiveness through texts and images from social media
Kaczmarek et al. Spatial planning text information processing with use of machine learning methods
Ishikawa et al. Social big data: case studies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170818