CN111652444A - 一种基于K-means和LSTM的日游客量预测方法 - Google Patents

一种基于K-means和LSTM的日游客量预测方法 Download PDF

Info

Publication number
CN111652444A
CN111652444A CN202010506167.0A CN202010506167A CN111652444A CN 111652444 A CN111652444 A CN 111652444A CN 202010506167 A CN202010506167 A CN 202010506167A CN 111652444 A CN111652444 A CN 111652444A
Authority
CN
China
Prior art keywords
daily
lstm
sample
prediction
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010506167.0A
Other languages
English (en)
Other versions
CN111652444B (zh
Inventor
袁佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Institute of Mechatronic Technology
Original Assignee
Nanjing Institute of Mechatronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Institute of Mechatronic Technology filed Critical Nanjing Institute of Mechatronic Technology
Priority to CN202010506167.0A priority Critical patent/CN111652444B/zh
Publication of CN111652444A publication Critical patent/CN111652444A/zh
Application granted granted Critical
Publication of CN111652444B publication Critical patent/CN111652444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于K‑means和LSTM的日游客量预测方法建立日游客量预测样本序列数据库,采用Kmeans算法对样本数据集进行聚类分析,基于分析结果建立LSTM预测模型,景区利用预训练好的模型对日游客量进行预测,并在线对现有的模型进行优化升级。本发明准确地预测出后续的游客量,预测精度高,让旅游经营和管理者提前对游客量有一个清晰的认知,从而提升旅游者的出行体验和优化旅游产业。

Description

一种基于K-means和LSTM的日游客量预测方法
技术领域
本发明涉及游客量预测领域,特别涉及基于一种基于K-means和LSTM的日游客量预测方法。
背景技术
随着经济飞速的发展,我国的国民生活水平普遍提高,旅游行业作为新兴行业异军突起,逐渐成为了我国部分地区的主要甚至是支柱产业。近年来,景区超载、游客拥挤等问题层出不穷,带来的安全隐患严重影响了旅游者的出行体验,同时也限制了旅游产业的健康发展。
现有的基金价格模型多采用传统机器学习的方法,而日游客量受多因素耦合影响,多特征因素与日游客预测有着高度的非线性,现有方法受限于非线性数据挖掘能力导致预测精度往往不高。另一方面,绝大数方法没有考虑日游客预测的多模态属性,忽略了实际应用情况中,日游客量与旅游行情模式存在着固有关联。因此,亟待提出一种预测精度高的日游客量预测方法,准确地预测出后续的游客量,让旅游经营和管理者提前对游客量有一个清晰的认知,通过合理调度和配置有限旅游资源的方式最大限度的避免这种混乱局面的产生,从而提升旅游者的出行体验和优化旅游产业。
发明内容
为了解决上述存在问题。本发明提出一种基于K-means和LSTM的日游客量预测方法,准确地预测出后续的游客量,让旅游经营和管理者提前对游客量有一个清晰的认知,通过合理调度和配置有限旅游资源的方式最大限度的避免这种混乱局面的产生,从而提升旅游者的出行体验和优化旅游产业。为达此目的:
本发明提出一种基于K-means和LSTM的日游客量预测方法,具体步骤如下:
步骤1:日游客预测系统录入景区每天的游客相关百度指数以及实际日游客量;
步骤2:将步骤1的游客因素特征数据进行归一化处理;
步骤3:基于步骤2处理好的数据,采用动态时窗的方法提取序列,建立日游客量预测样本序列数据库;
步骤4:采用Kmeans算法对样本数据集进行聚类分析,将样本集分成3个训练集,分别对应淡季、旺季和平稳季;
步骤5:分别对步骤4中的3个训练集建立LSTM预测模型,并训练直到网络收敛;
步骤6:景区上传过去几天的日游客相关百度指数以及实际日游客量作为待预测样本,经过步骤2的归一化处理,基于Kmeans算法对预测样本进行分类得出旅游季的模式类别;
步骤7:针对步骤6的类别结果,利用步骤5中预训练好的模型对日游客量进行预测,并将结果上传至显示界面;
步骤8:对于预测值差较大的情况,数据库每隔一个周期将数据发送至上位机,在线对现有的模型进行优化升级,从而不断提升模型预测精度。
作为本发明进一步改进,所述步骤1中景区每天的游客相关百度指数,主要关键词“景区名”百度指数、关键词“景区名+旅游攻略”百度指数、关键词“景区名+天气”百度指数、关键词“景区名+门票”百度指数、关键词“景区名+在哪里”百度指数等。
作为本发明进一步改进,所述步骤2中数据归一化处理为:
Figure BDA0002526618730000021
其中,xi是第i个游客因素特征的归一化处理的结果,
Figure BDA0002526618730000022
Figure BDA0002526618730000023
为第i个游客因素特征的原始数据的最大值和最小值,
Figure BDA0002526618730000024
为第i个游客因素特征的归一化前的数值,i∈{1,2,…,n},n为游客因素特征数。
作为本发明进一步改进,所述步骤3中建立日游客量预测样本序列的提取方式为,以十天为一个周期,以历史的七天的历史数据序列X={X1,X2,X3,X4,X5,X6,X7}为输入,其中Xk={x1,x2,…,xn},xi为归一化后的游客因素特征。以后三天的日游客量预测值Y={Y1,Y2,Y3}为预测输出,其中Y1,Y2,Y3为后续三天的日游客量。每个序列样本按时间逐天滑动生成,从而建立日游客量预测样本序列数据库。
作为本发明进一步改进,所述步骤4中Kmeans算法具体是:
步骤4.1将7天的输入样本序列特征扁平化成一维向量,维度为7*n;
步骤4.2从样本集中随机选择3个样本{μ1,μ2,μ3},作为初始质心;
步骤4.3计算每个样本X与质心μj之间的距离
ditance=||X-μj||2
步骤4.4将样本X与最近的质心μj归为一类;
步骤4.5更新质心
Figure BDA0002526618730000031
其中,Ci为旅游季的模式类别聚类簇集,i∈{1,2,3}。
步骤4.6重复步骤4.3-4.5,直到达到最大迭代次数100或质心更新幅度小于阈值,最终得到三种旅游季的模式类别的样本数据。
作为本发明进一步改进,所述步骤5中每种旅游季的模式类别下构建的LSTM模型,由输入门、忘记门、输出门和细胞状态组成。
神经元细胞中每个时刻不同门的更新公式如下:
遗忘门:ft=sigmoid(wf*[ht-1,xt]+bf)
输入门:it=sigmoid(wi*[ht-1,xt]+bi)
输入的候选状态:
Figure BDA0002526618730000032
记忆细胞的输出:
Figure BDA0002526618730000033
输出门:ot=sigmoid(wo*[ht-1,xt]+bo)
单元输出:ht=ot*tanh(ct)
其中,wi、wf、wo、wc分别为输入门、遗忘门、输出门以及细胞状态的权值矩阵;bi、bf、bo、bc为对应的偏置项;ht-1为t-1时刻的隐藏层状态;xt为t时刻的输入向量;tanh为双曲正切激活函数。
每个LSTM模型的输入序列长度为7,输出序列长度为3,分别为隐含层的三个时刻的输出ht-2、ht-1、ht,将此作为未来三天的日游客量预测值。利用上述的预测值输出与原始数据的真事值进行整个LSTM网络的损失函数的计算,本发明采用均平方根误差损失函数,其表达式如下:
Figure BDA0002526618730000041
其中,T为每批次训练的样本数,
Figure BDA0002526618730000042
为第i个样本第j天的日游客量真实值,
Figure BDA0002526618730000043
为第i个样本第j天的日游客量预测值。利用随机梯度下降(SGD)优化算法对均平方根误差损失函数进行优化,并将结果进行反向传播,实现网络参数的更新,直至LSTM模型达到收敛,此时认为模型训练完成。
作为本发明进一步改进,所述步骤8中将预测值和实际值差值较大的日游客量预测样本增添进训练集中,并确定实际的三天游客量为相对应的标签。数据库每隔一个周期将数据发送至上位机,对模型进行重新训练,整个训练过程与步骤4-5保持一致,最终实现模型的优化升级,以增强模型的泛化性和预测精度。
本发明提出一种基于K-means和LSTM的日游客量预测方法,有益效果在于:
1.本发明利用深度学习LSTM算法,使得日游客量预测更加智能化,非线性数据挖掘能力强。
2.本发明预测精度高,能准确地预测出后续的游客量,让旅游经营和管理者提前对游客量有一个清晰的认知。
3.本发明考虑日游客预测的多模态属性,使用K-means算法重视日游客量与旅游行情模式存在着固有关联,更加贴近实际应用情况,算法泛化性能较好。
4.本发明算法实现简单,系统构建成本较低。
5.本发明根据预测差值实时更新数据库,在增强模型泛化性的同时提高模型的预测精度。
附图说明
图1是本发明提出的基于K-means和LSTM的日游客量预测方法架构图;
图2是本发明提出的K-means聚类分析投影至二维平面的结果;
图3是本发明提出的日游客量LSTM预测模型图;
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
本发明提出一种基于K-means和LSTM的日游客量预测方法,准确地预测出后续的游客量,让旅游经营和管理者提前对游客量有一个清晰的认知,通过合理调度和配置有限旅游资源的方式最大限度的避免这种混乱局面的产生,从而提升旅游者的出行体验和优化旅游产业。如图1所示是一种基于K-means和LSTM的日游客量预测方法架构图。
步骤1:日游客预测系统录入景区每天的游客相关百度指数以及实际日游客量,景区每天的游客相关百度指数,主要关键词“景区名”百度指数、关键词“景区名+旅游攻略”百度指数、关键词“景区名+天气”百度指数、关键词“景区名+门票”百度指数、关键词“景区名+在哪里”百度指数等。
步骤2:将步骤1的游客因素特征数据进行归一化处理,
Figure BDA0002526618730000051
其中,xi是第i个游客因素特征的归一化处理的结果,
Figure BDA0002526618730000052
Figure BDA0002526618730000053
为第i个游客因素特征的原始数据的最大值和最小值,
Figure BDA0002526618730000054
为第i个游客因素特征的归一化前的数值,i∈{1,2,…,n},n为游客因素特征数。
步骤3:基于步骤2处理好的数据,采用动态时窗的方法提取序列,建立日游客量预测样本序列的提取方式为,以十天为一个周期,以历史的七天的历史数据序列X={X1,X2,X3,X4,X5,X6,X7}为输入,其中Xk={x1,x2,…,xn},
xi为归一化后的游客因素特征。以后三天的日游客量预测值Y={Y1,Y2,Y3}为预测输出,其中Y1,Y2,Y3为后续三天的日游客量。每个序列样本按时间逐天滑动生成,从而建立日游客量预测样本序列数据库。
步骤4:采用Kmeans算法对样本数据集进行聚类分析,将样本集分成3个训练集,分别对应淡季、旺季和平稳季,如图2所示为K-means聚类分析投影至二维平面的结果,本发明提出的K-means算法具体如下:
步骤4.1将7天的输入样本序列特征扁平化成一维向量,维度为7*n;
步骤4.2从样本集中随机选择3个样本{μ1,μ2,μ3},作为初始质心;
步骤4.3计算每个样本X与质心μj之间的距离
ditance=||X-μj||2
步骤4.4将样本X与最近的质心μj归为一类;
步骤4.5更新质心
Figure BDA0002526618730000061
其中,Ci为旅游季的模式类别聚类簇集,i∈{1,2,3}。
步骤4.6重复步骤4.3-4.5,直到达到最大迭代次数100或质心更新幅度小于阈值,最终得到三种旅游季的模式类别的样本数据。
步骤5:分别对步骤4中的3个训练集建立LSTM预测模型,每种旅游季的模式类别下构建的LSTM模型,由输入门、忘记门、输出门和细胞状态组成。
神经元细胞中每个时刻不同门的更新公式如下:
遗忘门:ft=sigmoid(wf*[ht-1,xt]+bf)
输入门:it=sigmoid(wi*[ht-1,xt]+bi)
输入的候选状态:
Figure BDA0002526618730000062
记忆细胞的输出:
Figure BDA0002526618730000071
输出门:ot=sigmoid(wo*[ht-1,xt]+bo)
单元输出:ht=ot*tanh(ct)
其中,wi、wf、wo、wc分别为输入门、遗忘门、输出门以及细胞状态的权值矩阵;bi、bf、bo、bc为对应的偏置项;ht-1为t-1时刻的隐藏层状态;xt为t时刻的输入向量;tanh为双曲正切激活函数。
如图3所示本发明提出的LSTM日游客量预测模型,每个LSTM模型的输入序列长度为7,输出序列长度为3,分别为隐含层的三个时刻的输出ht-2、ht-1、ht,将此作为未来三天的日游客量预测值。利用上述的预测值输出与原始数据的真事值进行整个LSTM网络的损失函数的计算,本发明采用均平方根误差损失函数,其表达式如下:
Figure BDA0002526618730000072
其中,T为每批次训练的样本数,
Figure BDA0002526618730000073
为第i个样本第j天的日游客量真实值,
Figure BDA0002526618730000074
为第i个样本第j天的日游客量预测值。利用随机梯度下降(SGD)优化算法对均平方根误差损失函数进行优化,并将结果进行反向传播,实现网络参数的更新,直至LSTM模型达到收敛,此时认为模型训练完成。
步骤6:景区上传过去几天的日游客相关百度指数以及实际日游客量作为待预测样本,经过步骤2的归一化处理,基于Kmeans算法对预测样本进行分类得出旅游季的模式类别;
步骤7:针对步骤6的类别结果,利用步骤5中预训练好的模型对日游客量进行预测,并将结果上传至显示界面;
步骤8:将预测值和实际值差值较大的日游客量预测样本增添进训练集中,并确定实际的三天游客量为相对应的标签。数据库每隔一个周期将数据发送至上位机,对模型进行重新训练,整个训练过程与步骤4-5保持一致,最终实现模型的优化升级,以增强模型的泛化性和预测精度。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。

Claims (7)

1.一种基于K-means和LSTM的日游客量预测方法,具体步骤如下,其特征在于,
步骤1:日游客预测系统录入景区每天的游客相关百度指数以及实际日游客量;
步骤2:将步骤1的游客因素特征数据进行归一化处理;
步骤3:基于步骤2处理好的数据,采用动态时窗的方法提取序列,建立日游客量预测样本序列数据库;
步骤4:采用Kmeans算法对样本数据集进行聚类分析,将样本集分成3个训练集,分别对应淡季、旺季和平稳季;
步骤5:分别对步骤4中的3个训练集建立LSTM预测模型,并训练直到网络收敛;
步骤6:景区上传过去几天的日游客相关百度指数以及实际日游客量作为待预测样本,经过步骤2的归一化处理,基于Kmeans算法对预测样本进行分类得出旅游季的模式类别;
步骤7:针对步骤6的类别结果,利用步骤5中预训练好的模型对日游客量进行预测,并将结果上传至显示界面;
步骤8:对于预测值差较大的情况,数据库每隔一个周期将数据发送至上位机,在线对现有的模型进行优化升级,从而不断提升模型预测精度。
2.根据权利要求1所述的一种基于K-means和LSTM的日游客量预测方法,其特征在于;
所述步骤1中景区每天的游客相关百度指数,主要关键词“景区名”百度指数、关键词“景区名+旅游攻略”百度指数、关键词“景区名+天气”百度指数、关键词“景区名+门票”百度指数、关键词“景区名+在哪里”百度指数等。
3.根据权利要求1所述的一种基于K-means和LSTM的日游客量预测方法,其特征在于;
所述步骤2中数据归一化处理为:
Figure FDA0002526618720000011
其中,xi是第i个游客因素特征的归一化处理的结果,
Figure FDA0002526618720000012
Figure FDA0002526618720000013
为第i个游客因素特征的原始数据的最大值和最小值,
Figure FDA0002526618720000014
为第i个游客因素特征的归一化前的数值,i∈{1,2,…,n},n为游客因素特征数。
4.根据权利要求1所述的一种基于K-means和LSTM的日游客量预测方法,其特征在于;
所述步骤3中建立日游客量预测样本序列的提取方式为,以十天为一个周期,以历史的七天的历史数据序列X={X1,X2,X3,X4,X5,X6,X7}为输入,其中
Xk={x1,x2,…,xn},xi为归一化后的游客因素特征。以后三天的日游客量预测值Y={Y1,Y2,Y3}为预测输出,其中Y1,Y2,Y3为后续三天的日游客量。每个序列样本按时间逐天滑动生成,从而建立日游客量预测样本序列数据库。
5.根据权利要求1所述的一种基于K-means和LSTM的日游客量预测方法,其特征在于;
所述步骤4中Kmeans算法具体是:
步骤4.1将7天的输入样本序列特征扁平化成一维向量,维度为7*n;
步骤4.2从样本集中随机选择3个样本{μ1,μ2,μ3},作为初始质心;
步骤4.3计算每个样本X与质心μj之间的距离
ditance=||X-μj||2
步骤4.4将样本X与最近的质心μj归为一类;
步骤4.5更新质心
Figure FDA0002526618720000021
其中,Ci为旅游季的模式类别聚类簇集,i∈{1,2,3}。
步骤4.6重复步骤4.3-4.5,直到达到最大迭代次数100或质心更新幅度小于阈值,最终得到三种旅游季的模式类别的样本数据。
6.根据权利要求1所述的一种基于K-means和LSTM的日游客量预测方法,其特征在于;
所述步骤5中每种旅游季的模式类别下构建的LSTM模型,由输入门、忘记门、输出门和细胞状态组成。
神经元细胞中每个时刻不同门的更新公式如下:
遗忘门:ft=sigmoid(wf*[ht-1,xt]+bf)
输入门:it=sigmoid(wi*[ht-1,xt]+bi)
输入的候选状态:
Figure FDA0002526618720000022
记忆细胞的输出:
Figure FDA0002526618720000031
输出门:ot=sigmoid(wo*[ht-1,xt]+bo)
单元输出:ht=ot*tanh(ct)
其中,wi、wf、wo、wc分别为输入门、遗忘门、输出门以及细胞状态的权值矩阵;bi、bf、bo、bc为对应的偏置项;ht-1为t-1时刻的隐藏层状态;xt为t时刻的输入向量;tanh为双曲正切激活函数。
每个LSTM模型的输入序列长度为7,输出序列长度为3,分别为隐含层的三个时刻的输出ht-2、ht-1、ht,将此作为未来三天的日游客量预测值。利用上述的预测值输出与原始数据的真事值进行整个LSTM网络的损失函数的计算,本发明采用均平方根误差损失函数,其表达式如下:
Figure FDA0002526618720000032
其中,T为每批次训练的样本数,
Figure FDA0002526618720000033
为第i个样本第j天的日游客量真实值,
Figure FDA0002526618720000034
为第i个样本第j天的日游客量预测值。利用随机梯度下降(SGD)优化算法对均平方根误差损失函数进行优化,并将结果进行反向传播,实现网络参数的更新,直至LSTM模型达到收敛,此时认为模型训练完成。
7.根据权利要求1所述的一种基于K-means和LSTM的日游客量预测方法,其特征在于;
所述步骤8中将预测值和实际值差值较大的日游客量预测样本增添进训练集中,并确定实际的三天游客量为相对应的标签。数据库每隔一个周期将数据发送至上位机,对模型进行重新训练,整个训练过程与步骤4-5保持一致,最终实现模型的优化升级,以增强模型的泛化性和预测精度。
CN202010506167.0A 2020-06-05 2020-06-05 一种基于K-means和LSTM的日游客量预测方法 Active CN111652444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010506167.0A CN111652444B (zh) 2020-06-05 2020-06-05 一种基于K-means和LSTM的日游客量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010506167.0A CN111652444B (zh) 2020-06-05 2020-06-05 一种基于K-means和LSTM的日游客量预测方法

Publications (2)

Publication Number Publication Date
CN111652444A true CN111652444A (zh) 2020-09-11
CN111652444B CN111652444B (zh) 2023-07-21

Family

ID=72347362

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010506167.0A Active CN111652444B (zh) 2020-06-05 2020-06-05 一种基于K-means和LSTM的日游客量预测方法

Country Status (1)

Country Link
CN (1) CN111652444B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112306981A (zh) * 2020-11-03 2021-02-02 广州科泽云天智能科技有限公司 一种面向高性能计算系统故障日志的故障预测方法
CN115130786A (zh) * 2022-08-11 2022-09-30 华侨大学 一种景区游客饱和量的判断方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101212057B1 (ko) * 2012-04-09 2012-12-13 장준호 관광객의 관광행동패턴 예측모델을 이용한 관광정보 제공시스템 및 그 제공방법
CN107066565A (zh) * 2017-04-01 2017-08-18 上海诺悦智能科技有限公司 一种旅游热点预测系统
CN107967542A (zh) * 2017-12-21 2018-04-27 国网浙江省电力公司丽水供电公司 一种基于长短期记忆网络的售电量预测方法
CN108446759A (zh) * 2018-02-11 2018-08-24 陕西师范大学 基于季节性长短期记忆网络模型的旅游客流量预测方法
CN109299825A (zh) * 2018-09-26 2019-02-01 重庆英传智能科技研究院有限公司 一种基于轨道交通实时客流的预测方法及预测系统
CN110348608A (zh) * 2019-06-18 2019-10-18 西安交通大学 一种基于模糊聚类算法改进lstm的预测方法
CN110674999A (zh) * 2019-10-08 2020-01-10 国网河南省电力公司电力科学研究院 基于改进聚类和长短期记忆深度学习的小区负荷预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101212057B1 (ko) * 2012-04-09 2012-12-13 장준호 관광객의 관광행동패턴 예측모델을 이용한 관광정보 제공시스템 및 그 제공방법
CN107066565A (zh) * 2017-04-01 2017-08-18 上海诺悦智能科技有限公司 一种旅游热点预测系统
CN107967542A (zh) * 2017-12-21 2018-04-27 国网浙江省电力公司丽水供电公司 一种基于长短期记忆网络的售电量预测方法
CN108446759A (zh) * 2018-02-11 2018-08-24 陕西师范大学 基于季节性长短期记忆网络模型的旅游客流量预测方法
CN109299825A (zh) * 2018-09-26 2019-02-01 重庆英传智能科技研究院有限公司 一种基于轨道交通实时客流的预测方法及预测系统
CN110348608A (zh) * 2019-06-18 2019-10-18 西安交通大学 一种基于模糊聚类算法改进lstm的预测方法
CN110674999A (zh) * 2019-10-08 2020-01-10 国网河南省电力公司电力科学研究院 基于改进聚类和长短期记忆深度学习的小区负荷预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨晨威 等: "基于旅游网络文本数据的区域...规划方法研究——以新疆为例", 创新驱动与智慧发展——2018年中国城市交通规划年会论文集 *
黄先开 等: "百度指数与旅游景区游客量的关系及预测研究-一北京故宫为例", 旅游学刊 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112306981A (zh) * 2020-11-03 2021-02-02 广州科泽云天智能科技有限公司 一种面向高性能计算系统故障日志的故障预测方法
CN115130786A (zh) * 2022-08-11 2022-09-30 华侨大学 一种景区游客饱和量的判断方法和装置

Also Published As

Publication number Publication date
CN111652444B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
US20240132078A1 (en) Driving model training method, driver identification method, apparatus, device and medium
CN111401433B (zh) 用户信息获取方法、装置、电子设备及存储介质
CN109754113A (zh) 基于动态时间规整与长短时间记忆的负荷预测方法
CN109034264A (zh) 交通事故严重性预测csp-cnn模型及其建模方法
CN108875809A (zh) 联合attention机制与神经网络的生物医学实体关系分类方法
CN110990718B (zh) 一种公司形象提升系统的社会网络模型构建模块
CN111859010B (zh) 一种基于深度互信息最大化的半监督音频事件识别方法
CN110555459A (zh) 基于模糊聚类和支持向量回归的成绩预测方法
CN111222847A (zh) 基于深度学习与非监督聚类的开源社区开发者推荐方法
CN112529638B (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN111652444B (zh) 一种基于K-means和LSTM的日游客量预测方法
CN106485289A (zh) 一种菱镁矿矿石的品级的分类方法及设备
Elayidom et al. A generalized data mining framework for placement chance prediction problems
CN113269647A (zh) 基于图的交易异常关联用户检测方法
CN117235560A (zh) 一种基于som-gmm-rf的建筑施工企业活跃度预测方法
CN113627070A (zh) 一种短期光伏功率预测方法
CN108320027B (zh) 一种基于量子计算的大数据处理方法
CN116933946A (zh) 一种基于客流去向结构的轨道交通od客流预测方法及系统
CN115526246A (zh) 一种基于深度学习模型的自监督分子分类方法
CN110335160A (zh) 一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及系统
Missaoui et al. Multi-stream continuous hidden Markov models with application to landmine detection
CN117437507A (zh) 一种用于评价图像识别模型的偏见性评估方法
CN112347162A (zh) 一种基于在线学习的多元时序数据规则挖掘方法
Xu et al. MM-UrbanFAC: Urban functional area classification model based on multimodal machine learning
CN113051474B (zh) 一种融合多平台多终端搜索指数的客流预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant