CN104850653A - 一种基于流式数据挖掘的游客流量短时及趋势预测系统 - Google Patents

一种基于流式数据挖掘的游客流量短时及趋势预测系统 Download PDF

Info

Publication number
CN104850653A
CN104850653A CN201510296129.6A CN201510296129A CN104850653A CN 104850653 A CN104850653 A CN 104850653A CN 201510296129 A CN201510296129 A CN 201510296129A CN 104850653 A CN104850653 A CN 104850653A
Authority
CN
China
Prior art keywords
data
layer
input
network
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510296129.6A
Other languages
English (en)
Inventor
陈勇
胡中骥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Science And Technology Co Ltd Is Swum In Jiangsu At Once
Original Assignee
Science And Technology Co Ltd Is Swum In Jiangsu At Once
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Science And Technology Co Ltd Is Swum In Jiangsu At Once filed Critical Science And Technology Co Ltd Is Swum In Jiangsu At Once
Priority to CN201510296129.6A priority Critical patent/CN104850653A/zh
Publication of CN104850653A publication Critical patent/CN104850653A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于流式数据挖掘的游客流量短时及趋势预测系统,包括用户终端和景区数据终端采集的数据,通过建立数据仓库进行多维度的统计,通过转化计算公式获得输入变量参数,通过径向基函数神经网络建立预测模型。本发明基于流式数据挖掘的游客流量短时及趋势预测系统,应用的数据源包括智能终端采集的数据、景区运营、商务平台后台数据等,根据径向基函数网络建立的模型,可以用于实时的人流量预测,实现辅助决策的作用。

Description

一种基于流式数据挖掘的游客流量短时及趋势预测系统
技术领域
本发明涉及数据挖掘技术领域,更具体的讲是一种基于流式数据挖掘的游客流量短时及趋势预测系统。
背景技术
自IBM公司于2008年提出“智慧地球”概念以来,作为其中的一个重要部分——“智慧旅游”引起了国内广泛的关注。之后国家政策的扶持以及互联网的发展,使得新兴的在线旅游市场发展势头迅猛。根据劲旅咨询最新发布《2013年中国在线旅游市场研究报告》,2013年中国旅游市场总交易额约为29475亿元,其中在线旅行市场交易额约为2522亿元,中国旅游市场在线渗透率为8.6%。
人们面对着大量的数据,却往往无法找到需要的信息,信息爆炸使得如何有效地利用和处理大量的数据成为当今世界共同关心的问题。随着数据库技术、人工智能、数理统计和云计算等技术的发展,数据挖掘技术在各行各业得到了迅速应用。
从技术角度来讲,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中人们事先不知道但又是潜在有用的信息和知识的过程;从商业角度来讲,数据挖掘是一种新的商业信息处理技术,其主要特点是对数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取有利于商业决策的关键信息和知识。
随着智能终端的普及、在线旅游市场的发展和旅游监管部门及景区的信息化,监管部门、景区和其它机构积攒了大量的数据,为数据挖掘技术的引入提供了充分的条件。
目前的旅游信息管理系统在基础数据统计、监测方面发挥了重要作用,却并未实现对隐藏知识的充分挖掘;从海量的数据中进行游客流量短时及趋势预测,挖掘其中蕴含的巨大价值,成为目前亟待解决的问题之一。数据挖掘技术在旅游市场的应用,将使得现代旅游成为充满便捷、人性化、以及蕴含巨大经济市场的智慧旅游。
发明内容
本发明的目的是为了提升对具体旅游数据进行有效挖掘的能力,提供一种基于流式数据挖掘的游客流量短时及趋势预测系统。
本发明所采用的技术方案是:
用户终端和景区数据终端采集的数据,通过建立数据仓库进行多维度的统计,然后依据历史游客数据,根据景区接待量、游客流量走势、天气预报、国家法定节假日、民俗节日、宗教节日、景区节日等诸多因素,并参考门票、酒店、餐饮、导游、停车位的预定量,通过转化计算公式获得输入变量参数,通过径向基函数神经网络(Neural Network,NN)算法建立预测模型,从而根据当前实测数据预测出未来短时段内(分钟、小时)、某月、某周、某日的游客高峰流量、低谷流量及总流量。
径向基函数网络由三个层组成,输入层、隐含层和线性输出层。输入层用于与外界的数据交换,其中包含很多节点;第二层是所有网络中仅有的一个隐含层,它负责输入数据的输入空间到隐含空间的非线性变换。一般来说隐含层包含高维数据,且维度越高,逼近越准确。输出层负责对隐藏节点活动作出反应。隐含层利用权重参数ω与输出层连接。整个RBF网络的输出表示为:
这里,Ri(x)代表激活函数,即径向基函数(RBF)。
其中,ci为数据中心,X(x1,...xn)T,Y(y1,...yn)T分别为输入和输出向量。
在非线性变换中,有多种基函数可以选择,比如:
1)Gaussian函数
R i ( x ) = exp ( - | | x - c i | | 2 / 2 s i 2 ) , ( i = 1,2 , L , m ) - - - ( 2 )
2)Reflected sigmoid函数
R i ( x ) = 1 1 + e ( | | x - c i | | / 2 ) 2 d i 2 , ( i , = 1,2 , L , m ) - - - ( 3 )
3)逆Multiquadric函数
R i ( x ) = 1 [ ( | | x - c i | | / 2 ) 2 + d i 2 ] a , a > 0 , ( i = 1,2 , L , m ) - - - ( 4 )
其中||x-ci||是欧几里得范数,ci,si和Ri分别是中心、宽度和第i个隐藏输出单元。其中,高斯函数是最常用的基函数之一。
我们可以看出,径向基函数神经网络的输出其实是所有神经元响应的加权的总和,x越远离中心ci,函数的取值越小,即相互作用越小。
径向基函数网络可以利用在隐含层设定足够的神经元节点来逼近任何非线性函数,同时它是一种典型的局部逼近网络。在学习训练过程中,径向基函数网络只有少数几个权值在调整时会影响输出,因此径向基函数网络与其它全局逼近神经网络(如BP神经网络)的一个很大优点就是收敛快。
各个景区流量预判分析,在依据真实可靠的历史数据基础上,辅以合理的参考因素,经过科学的计算,才能够得到可供政府部门或职能机构进行宏观调控的数据资料。
本发明的有益效果是,
本发明基于流式数据挖掘的游客流量短时及趋势预测系统,应用的数据源包括智能终端采集的数据、景区运营、商务平台后台数据等,根据径向基函数网络建立的模型,可以用于实时的人流量预测,实现辅助决策的作用。
下面结合附图对本发明作进一步详细描述。
附图说明
图1为本发明的径向基函数网络的结构示意图。
具体实施方式
为了加深对本发明的理解,下面结合附图和实施例对本发明作进一步详细的说明。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明的具体实施例是,
用户终端和景区数据终端采集的数据,通过建立数据仓库进行多维度的统计,然后依据历史游客数据,根据景区接待量、游客流量走势、天气预报、国家法定节假日、民俗节日、宗教节日、景区节日等诸多因素,并参考门票、酒店、餐饮、导游、停车位的预定量,通过转化计算公式获得输入变量参数,通过径向基函数神经网络(Neural Network,NN)算法建立预测模型,从而根据当前实测数据预测出未来短时段内(分钟、小时)、某月、某周、某日的游客高峰流量、低谷流量及总流量。
如图1所示,径向基函数网络由三个层组成,输入层、隐含层和线性输出层。输入层用于与外界的数据交换,其中包含很多节点;第二层是所有网络中仅有的一个隐含层,它负责输入数据的输入空间到隐含空间的非线性变换。一般来说隐含层包含高维数据,且维度越高,逼近越准确。输出层负责对隐藏节点活动作出反应。隐含层利用权重参数ω与输出层连接。整个RBF网络的输出表示为:
这里,Ri(x)代表激活函数,即径向基函数(RBF)。
其中,ci为数据中心,X(x1,...xn)T,Y(y1,...yn)T分别为输入和输出向量。
在非线性变换中,有多种基函数可以选择,比如:
4)Gaussian函数
R i ( x ) = exp ( - | | x - c i | | 2 / 2 s i 2 ) , ( i = 1,2 , L , m ) - - - ( 2 )
5)Reflected sigmoid函数
R i ( x ) = 1 1 + e ( | | x - c i | | / 2 ) 2 d i 2 , ( i , = 1,2 , L , m ) - - - ( 3 )
6)逆Multiquadric函数
R i ( x ) = 1 [ ( | | x - c i | | / 2 ) 2 + d i 2 ] a , a > 0 , ( i = 1,2 , L , m ) - - - ( 4 )
其中||x-ci||是欧几里得范数,ci,si和Ri分别是中心、宽度和第i个隐藏输出单元。其中,高斯函数是最常用的基函数之一。
我们可以看出,径向基函数神经网络的输出其实是所有神经元响应的加权的总和,x越远离中心ci,函数的取值越小,即相互作用越小。
径向基函数网络可以利用在隐含层设定足够的神经元节点来逼近任何非线性函数,同时它是一种典型的局部逼近网络。在学习训练过程中,径向基函数网络只有少数几个权值在调整时会影响输出,因此径向基函数网络与其它全局逼近神经网络(如BP神经网络)的一个很大优点就是收敛快。
各个景区流量预判分析,在依据真实可靠的历史数据基础上,辅以合理的参考因素,经过科学的计算,才能够得到可供政府部门或职能机构进行宏观调控的数据资料。
要说明的是,以上所述实施例是对本发明技术方案的说明而非限制,所属技术领域普通技术人员的等同替换或者根据现有技术而做的其他修改,只要没超出本发明技术方案的思路和范围,均应包含在本发明所要求的权利范围之内。

Claims (2)

1.一种基于流式数据挖掘的游客流量短时及趋势预测系统,其特征在于:包括
用户终端和景区数据终端采集的数据,通过建立数据仓库进行多维度的统计,
通过转化计算公式获得输入变量参数,
通过径向基函数神经网络建立预测模型。
2.根据权利要求1所述的基于流式数据挖掘的游客流量短时及趋势预测系统,其特征在于:
径向基函数网络由三个层组成,输入层、隐含层和线性输出层,
输入层用于与外界的数据交换,其中包含很多节点;
第二层是所有网络中仅有的一个隐含层,它负责输入数据的输入空间到隐含空间的非线性变换;
隐含层利用权重参数ω与输出层连接;
整个RBF网络的输出表示为:
这里,Ri(x)代表激活函数,即径向基函数(RBF)。
其中,ci为数据中心,X(xl,...xn)T,Y(yl,...yn)T分别为输入和输出向量。
CN201510296129.6A 2015-06-03 2015-06-03 一种基于流式数据挖掘的游客流量短时及趋势预测系统 Pending CN104850653A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510296129.6A CN104850653A (zh) 2015-06-03 2015-06-03 一种基于流式数据挖掘的游客流量短时及趋势预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510296129.6A CN104850653A (zh) 2015-06-03 2015-06-03 一种基于流式数据挖掘的游客流量短时及趋势预测系统

Publications (1)

Publication Number Publication Date
CN104850653A true CN104850653A (zh) 2015-08-19

Family

ID=53850297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510296129.6A Pending CN104850653A (zh) 2015-06-03 2015-06-03 一种基于流式数据挖掘的游客流量短时及趋势预测系统

Country Status (1)

Country Link
CN (1) CN104850653A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105258694A (zh) * 2015-11-10 2016-01-20 上海斐讯数据通信技术有限公司 一种游览路线生成方法和生成系统
CN107103394A (zh) * 2017-05-27 2017-08-29 重庆大学 一种基于神经网络的轨道交通实时客流预测方法
CN108053242A (zh) * 2017-12-12 2018-05-18 携程旅游信息技术(上海)有限公司 景点门票票量预测方法、系统、设备及存储介质
CN108416464A (zh) * 2018-01-31 2018-08-17 山东汇贸电子口岸有限公司 一种基于手机移动终端的客流预测方法及系统
CN108877226A (zh) * 2018-08-24 2018-11-23 交通运输部规划研究院 景区交通旅游预测方法及预警系统
CN109993341A (zh) * 2018-09-29 2019-07-09 上海电科智能系统股份有限公司 一种基于径向基函数神经网络的客流量预测方法
CN110046764A (zh) * 2019-04-12 2019-07-23 成都四方伟业软件股份有限公司 预测客流量的方法及装置
CN110322075A (zh) * 2019-07-10 2019-10-11 上饶市中科院云计算中心大数据研究院 一种基于混合优化rbf神经网络的景区客流量预测方法及系统
CN111193734A (zh) * 2019-12-27 2020-05-22 杭州安恒信息技术股份有限公司 基于http流量态势的用户行为分析方法
CN111476691A (zh) * 2019-01-23 2020-07-31 上海新联纬讯科技发展股份有限公司 一种客流预测系统及预测方法
CN114358667A (zh) * 2022-03-21 2022-04-15 创意信息技术股份有限公司 一种基于rbf网络学习的景区风险预测模型构建方法
CN116757300A (zh) * 2023-07-03 2023-09-15 萍乡亦远科技服务有限公司 基于循环卷积网络的智能预订数据处理方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080000273A (ko) * 2006-06-27 2008-01-02 강희석 Rfid 카드를 이용한 복수 입장권 발급 시스템 및 방법
CN102376025A (zh) * 2010-08-17 2012-03-14 同济大学 一种模拟手机数据并评估城市路网交通状态的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080000273A (ko) * 2006-06-27 2008-01-02 강희석 Rfid 카드를 이용한 복수 입장권 발급 시스템 및 방법
CN102376025A (zh) * 2010-08-17 2012-03-14 同济大学 一种模拟手机数据并评估城市路网交通状态的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
毕天姝等: "基于径向基函数神经网络和模糊控制系统的电网故障诊断新方法", 《中国电机工程学报》 *
汪秋菊等: "基于网络关注度的旅游景区客流量预警:研究框架与实证分析—以国家游泳中心水立方为例", 《旅游论坛》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105258694A (zh) * 2015-11-10 2016-01-20 上海斐讯数据通信技术有限公司 一种游览路线生成方法和生成系统
CN107103394A (zh) * 2017-05-27 2017-08-29 重庆大学 一种基于神经网络的轨道交通实时客流预测方法
CN108053242A (zh) * 2017-12-12 2018-05-18 携程旅游信息技术(上海)有限公司 景点门票票量预测方法、系统、设备及存储介质
CN108053242B (zh) * 2017-12-12 2021-02-09 携程旅游信息技术(上海)有限公司 景点门票票量预测方法、系统、设备及存储介质
CN108416464A (zh) * 2018-01-31 2018-08-17 山东汇贸电子口岸有限公司 一种基于手机移动终端的客流预测方法及系统
CN108877226A (zh) * 2018-08-24 2018-11-23 交通运输部规划研究院 景区交通旅游预测方法及预警系统
CN108877226B (zh) * 2018-08-24 2020-08-18 交通运输部规划研究院 景区交通旅游预测方法及预警系统
CN109993341A (zh) * 2018-09-29 2019-07-09 上海电科智能系统股份有限公司 一种基于径向基函数神经网络的客流量预测方法
CN111476691A (zh) * 2019-01-23 2020-07-31 上海新联纬讯科技发展股份有限公司 一种客流预测系统及预测方法
CN110046764A (zh) * 2019-04-12 2019-07-23 成都四方伟业软件股份有限公司 预测客流量的方法及装置
CN110322075A (zh) * 2019-07-10 2019-10-11 上饶市中科院云计算中心大数据研究院 一种基于混合优化rbf神经网络的景区客流量预测方法及系统
CN111193734A (zh) * 2019-12-27 2020-05-22 杭州安恒信息技术股份有限公司 基于http流量态势的用户行为分析方法
CN114358667A (zh) * 2022-03-21 2022-04-15 创意信息技术股份有限公司 一种基于rbf网络学习的景区风险预测模型构建方法
CN116757300A (zh) * 2023-07-03 2023-09-15 萍乡亦远科技服务有限公司 基于循环卷积网络的智能预订数据处理方法及系统
CN116757300B (zh) * 2023-07-03 2024-04-19 深圳市捷信达电子有限公司 基于循环卷积网络的智能预订数据处理方法及系统

Similar Documents

Publication Publication Date Title
CN104850653A (zh) 一种基于流式数据挖掘的游客流量短时及趋势预测系统
Dong et al. Hourly energy consumption prediction of an office building based on ensemble learning and energy consumption pattern classification
Zhang et al. Citywide cellular traffic prediction based on densely connected convolutional neural networks
Ghaderi et al. Deep forecast: Deep learning-based spatio-temporal forecasting
Chen et al. A graph convolutional stacked bidirectional unidirectional-LSTM neural network for metro ridership prediction
Kisi et al. Precipitation forecasting using wavelet-genetic programming and wavelet-neuro-fuzzy conjunction models
CN106021508A (zh) 基于社交媒体的突发事件应急信息挖掘方法
Zhang et al. A Traffic Prediction Method of Bicycle-sharing based on Long and Short term Memory Network.
CN107045785B (zh) 一种基于灰色elm神经网络的短时交通流量预测的方法
CN111652425A (zh) 一种基于粗糙集和长短期记忆网络的河流水质预测方法
Arora et al. A study of applications of RBF network
CN112668773B (zh) 一种入库流量的预测方法、装置及电子设备
CN114492978A (zh) 一种基于多层注意力机制的时空序列预测方法及设备
Wang A stock price prediction method based on BiLSTM and improved transformer
Wu et al. Assessment of waterlogging risk in the deep foundation pit projects based on projection pursuit model
Liu et al. A method for short-term traffic flow forecasting based on GCN-LSTM
Nezzar et al. Mid-Long Term Load Forecasting using Multi-Model Artificial Neural Networks.
Fang et al. Idle time window prediction in cellular networks with deep spatiotemporal modeling
Ma et al. Review and comparison of the demand analysis methods of maritime emergency resources
Niu et al. De-Trend First, Attend Next: A Mid-Term PV forecasting system with attention mechanism and encoder–decoder structure
Bhatnagar et al. Role of machine learning in sustainable engineering: a review
Li et al. Resilience Assessment of Urban Distribution Network Under Heavy Rain: A Knowledge-Informed Data-Driven Approach
Geng et al. A LSTM based campus network traffic prediction system
Chen et al. Rainfall-runoff short-term forecasting method based on LSTM
Liu et al. Growth scale prediction of big data for information systems based on a deep learning SAEP method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 212009 Jiangsu province Zhenjiang new Dingmao Road No. 468 by twelve Gemini building A room 05-2300

Applicant after: Polytron Technologies Inc travel

Address before: 212009 Jiangsu province Zhenjiang new Dingmao Road No. 468 by twelve Gemini building A room 05-2300

Applicant before: Science and Technology Co., Ltd. is swum in Jiangsu at once

COR Change of bibliographic data
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150819

WD01 Invention patent application deemed withdrawn after publication