CN110852476A - 客流预测方法、装置、计算机设备和存储介质 - Google Patents
客流预测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN110852476A CN110852476A CN201910934590.8A CN201910934590A CN110852476A CN 110852476 A CN110852476 A CN 110852476A CN 201910934590 A CN201910934590 A CN 201910934590A CN 110852476 A CN110852476 A CN 110852476A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- time period
- historical
- model
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000003062 neural network model Methods 0.000 claims abstract description 25
- 230000000306 recurrent effect Effects 0.000 claims abstract description 17
- 238000012795 verification Methods 0.000 claims description 50
- 238000010606 normalization Methods 0.000 claims description 27
- 238000004422 calculation algorithm Methods 0.000 claims description 24
- 230000007613 environmental effect Effects 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 7
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012821 model calculation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种客流预测方法、装置、计算机设备和存储介质,所述方法包括:接收输入的预测时间段,获取预测时间段对应的目标特征变量;获取训练好的客流预测模型,客流预测模型是以历史时间段内包含的特征变量和历史时间段内的历史客流数据作为训练样本、用以计算输入的特征变量对应的客流量的时间递归神经网络模型;将目标特征变量输入客流预测模型中,在客流预测模型的输出端得到预测时间段内的预测客流量。通过此方法,能够拟合复杂的非线性和动态关系,实现预测结果的准确性更高的客流预测。
Description
技术领域
本发明涉及计算机技术领域,具体地涉及一种客流预测方法、装置、计算机设备和存储介质。
背景技术
在对火车站等固定空间的客流预测中,通常采用传统的时间序列模型;如:自回归(AR:Auto-regressive)模型、移动平均(MA:Moving-Average)模型、自回归移动平均(ARIMA:Auto-Regressive Integrated Moving Average)模型等进行预测。其中,自回归模型是是用自身做回归变量的过程,即利用前期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型,它是时间序列中的一种常见形式;移动平均模型是以移动平均法为思想训练得到的模型,移动平均法指的是根据时间序列资料、逐项推移,依次计算包含一定项数的序时平均值,以反映长期趋势的方法;自回归移动平均模型则是将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。
上述模型在对客流进行预测时,仅考虑了时间序列的相关特征,未考虑其它因素的影响,如天气、节假日等,且在当要求客流数据满足线性分布或平稳定分布等要求较高的预测情况时,采取上述模型进行客流预测时,存在预测的精度不高、对样本数据拟合程度低等局限性。
发明内容
本发明解决的技术问题是如何能够拟合复杂的非线性和动态关系,实现预测结果的准确性更高的客流预测。
为解决上述技术问题,本发明实施例提供一种客流预测方法,包括:接收输入的预测时间段,获取所述预测时间段对应的目标特征变量;获取训练好的客流预测模型,所述客流预测模型是以历史时间段内包含的特征变量和所述历史时间段内的历史客流数据作为训练样本、用以计算输入的特征变量对应的客流量的时间递归神经网络模型;将所述目标特征变量输入所述客流预测模型中,在所述客流预测模型的输出端得到所述预测时间段内的预测客流量。
可选的,所述客流预测模型的生成方式,包括:获取若干个历史时间段内的历史客流数据,计算每个所述历史时间段内的历史客流量;收集每个所述历史时间段内的环境信息,对所述环境信息进行分析得到每个所述历史时间段内的样本特征变量;获取初始时间递归神经网络模型,将每个所述历史时间段内的样本特征变量和历史客流量作为一对训练样本输入所述初始时间递归神经网络模型进行模型训练,得到所述客流预测模型。
可选的,所述对所述环境信息进行分析得到每个所述历史时间段内的样本特征变量之后,还包括:获取预设归一化算法,按照所述预设归一化算法将所述样本特征变量进行归一化;所述获取所述预测时间段对应的目标特征变量之后,还包括:按照所述预设归一化算法将所述目标特征变量进行归一化;所述将所述目标特征变量输入所述客流预测模型中,包括:将归一化后的所述目标特征向量输入所述客流预测模型中;所述在所述客流预测模型的输出端得到所述预测时间段内的预测客流量之后,还包括:按照与所述预设归一算法对应的逆算法对所述预测客流量进行还原。
可选的,所述得到所述客流预测模型之后,还包括:获取验证时间段内的记录客流量;获取所述验证时间段内的验证特征变量;将所述验证特征变量输入所述客流预测模型中,在所述客流预测模型的输出端得到所述验证时间段内的验证客流量;计算所述记录客流量和所述验证客流量之间的差值,若所述差值大于预设值,则根据所述记录客流量更新所述客流预测模型。
可选的,所述客流是目标车站的客流,所述获取若干个历史时间段内的历史客流数据,包括:利用在所述目标车站进出口处设置的客户采集设备采集所述历史时间段内的历史客流数据。
可选的,所述获取若干个历史时间段内的历史客流数据之后,还包括:若检测到所述历史客流数据中存在数据缺失,则识别缺失数据对应的第一时间段;从基于时间维度构建的客流跟踪模型中,选取所述第一时间段对应的第二时间段;获取所述第二时间段对应的客流数据作为所述第一时间段对应的客流数据。
可选的,所述预测时间段和所述历史时间段的时长相同。
本发明还提供一种客流预测装置,所述装置包括:输入模块,用于接收输入的预测时间段,获取所述预测时间段对应的目标特征变量;模型获取模块,用于获取训练好的客流预测模型,所述客流预测模型是以历史时间段内包含的特征变量和所述历史时间段内的历史客流数据作为训练样本、用以计算输入的特征变量对应的客流量的时间递归神经网络模型;模型分析模块,用于将所述目标特征变量输入所述客流预测模型中,在所述客流预测模型的输出端得到所述预测时间段内的预测客流量。
本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述方法的步骤。
本发明实施例还提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
本发明实施例提供一种客流预测方法,包括:接收输入的预测时间段,获取预测时间段对应的目标特征变量;获取训练好的客流预测模型,客流预测模型是以历史时间段内包含的特征变量和历史时间段内的历史客流数据作为训练样本、用以计算输入的特征变量对应的客流量的时间递归神经网络模型;将目标特征变量输入客流预测模型中,在客流预测模型的输出端得到预测时间段内的预测客流量。较之现有技术,本发明中的客流预测方法,可以以历史时间段内的历史客流量作为训练样本,基于LSTM神经网络训练出用于客流预测的客流预测模型,用户可输入预测时间段,即可自动获取此预测时间段内的目标特征变量,根据模型来计算此预测时间段内的预测客流量;通过此方法,由于训练客流预测模型的样本,为此固定空间的历史时间段内的特征变量和历史客流量,模型的训练样本更加符合分析的场景,使得模型能够更加准确对客流量进行预测。另外,LSTM模型能够拟合复杂的非线性和动态关系,预测范围更广、拟合效果较好。
进一步地,利用LSTM神经网络模型,以若干个历史时间段内的样本特征变量和历史客流量为训练样本训练出的客流预测模型,能够有效拟合复杂的非线性和动态关系,提高对样本数据的拟合度,使得客流预测模型更符合客流数据满足线性分布或平稳定分布等要求较高的预测情况,提高此情况下预测结果的准确性。
进一步地,对本方法中模型训练阶段和最终客流预测阶段的特征变量都按照预设归一算法进行归一化处理,能够有效减少数据计算量,降低设备计算压力,并提高计算的准确性。
进一步地,提供了一种模型验证方法,通过验证集来对模型的预测结果进行验证,当预测结果与实际客流相差较大时,则可分析差距原因,对模型进行更新,从而进一步提高模型的预测准确性。
进一步地,在对火车站、汽车站等固定空间的客流进行预测时,可直接利用车站进出口处设置的客户采集设备来获取历史时间段内的历史客流数据,作为模型训练的数据来源。
进一步地,可建立基于时间维度管理采集到的客流数据的客流跟踪模型,若某一时间段内的客流数据存在缺失的情况,可从客流跟踪模型中获取替代的客流数据,从而避免了由于客流数据缺失导致训练出的模型的不准确。
附图说明
图1是本发明一实施例提供的一种客流预测方法的流程图;
图2是本发明一实施例提供的一种客流预测模型的生成方式的流程图;
图3是本发明一实施例提供的一种模型验证方式的流程图;
图4是本发明一实施例提供的一种客流预测装置的结构示意图。
具体实施方式
如背景技术所言,现有客流预测模型在对客流进行预测时,存在预测的精度不高、对样本数据拟合程度低等局限性问题。
为解决上述技术问题,本发明实施例提供一种客流预测方法,包括:接收输入的预测时间段,获取预测时间段对应的目标特征变量;获取训练好的客流预测模型,客流预测模型是以历史时间段内包含的特征变量和历史时间段内的历史客流量作为训练样本对、能够计算输入的特征变量出对应的客流量的时间递归神经网络模型;将目标特征变量输入客流预测模型中,在客流预测模型的输出端得到预测时间段内的预测客流量。
此客流预测方法可以拟合复杂的非线性和动态关系,提高模型的拟合效果,更加准确对客流量进行预测。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本实施例的方案可以应用于火车站或者汽车站等固定空间的客流预测。本实施例的方案可以由终端与已训练好的客流预测模型相连接,终端根据用户输入的预测时间段获取对应的目标特征变量,将目标特征变量输入客流预测模型中,预测出在此预测时间段内的预测客流量。
请参见图1,图1是本发明实施例的一种客流预测方法的流程图。该客流预测方法具体可以包括如下步骤:
步骤S102,接收输入的预测时间段,获取预测时间段对应的目标特征变量。
其中,预测时间段是要对固定空间内的客流进行预测的时间段,例如,预测火车站下周一的客流量,则下周一整天为预测时间段。
目标特征变量是在预测时间段内存在的、与预测时间段内客流量相关的特征变量;例如天气情况,火车站的排班车次、是否周末、是否节假日等等特征变量。技术人员可根据历史上次固定空间内客流的变化情况,分析出若干个对客流变化有影响的特征变量,并获取预测时间段内存在的特征变量作为目标特征变量。例如,当预设时间段为下周一整天,所预测的固定空间为上海火车站,则可以根据天气预报获取上海下周一的天气情况作为天气维度的目标特征变量;从火车站的车次表中获取下周一上海火车站的排班车次,作为另一个目标特征变量。
当用户需要对预设时间段内,一个固定空间内的客流量进行预测时,可获取预设时间段内此固定空间中存在的目标特征变量,根据这些目标特征变量来对此固定空间中预设时间段内的客流进行预测。可设置多个数据接口来获取预设时间段内的目标特征变量,如设置一个连接天气预报的网站的数据接口,可通过此数据接口从网站中读取预设时间段固定空间对应的天气状况,从而获取天气维度的目标特征变量等等,也可以根据各目标特征变量的数据来源来设置其他的数据接口,并在对应的数据接口中设置数据清洗、处理的规则,以提取可直接进行分析的目标特征变量。
步骤S104,获取训练好的客流预测模型,所述客流预测模型是以历史时间段内包含的特征变量和所述历史时间段内的历史客流数据作为训练样本、用以计算输入的特征变量对应的客流量的时间递归神经网络模型。
客流预测模型是以固定空间内历史中多个时间段的客流量为样本数据来源,获取每一历史时间段内此固定空间内包含的特征变量和其对应的历史客流量,通过多次大数据训练和回归分析,得到能够识别出各特征变量对固定空间内客流量影响的客流预测模型。客流预测模型是基于时间递归(LSTM,Long-Short Term Memory)进行大数据训练的神经网络模型。
步骤S106,将目标特征变量输入客流预测模型中,在客流预测模型的输出端得到预测时间段内的预测客流量。
具体地,训练出客流预测模型后,将预设时间段内的目标特征变量输入到训练好的客流预测模型中,即可从模型的输出端得到此预测时间段内的预测客流量。
上述客流预测方法中,以历史时间段内的历史客流量作为训练样本,基于LSTM神经网络训练出用于客流预测的客流预测模型,用户可输入预测时间段,即可自动获取此预测时间段内的目标特征变量,根据模型来计算此预测时间段内的预测客流量;通过此方法,由于训练客流预测模型的样本,为此固定空间的历史时间段内的特征变量和历史客流量,模型的训练样本更加符合分析的场景,使得模型能够更加准确对客流量进行预测。另外,LSTM模型能够拟合复杂的非线性和动态关系,预测范围更广、拟合效果较好。
在一个实施例中,请参见图2,图2提供了一种客流预测模型的生成方式,具体包括以下步骤:
步骤S202,获取若干个历史时间段内的历史客流数据,计算每个历史时间段内的历史客流量。
历史时间段是过去一段时间,其时间长度可以根据分析需求取值,例如可以取10分钟,半小时等等。历史时间段内的历史客流数据即在每个历史时间段内在固定空间内驻足的人流;如对于固定空间上海火车站而言,在昨天早上7:00至7:10分的历史客流数据,即为采集到的这10分钟内的累计客流;历史客流数据中除包含客流量,也可包含其他客户信息,如人脸图像等等。可获取在过去若干个历史时间段内的历史客流数据,对每个历史时间段内的客流情况进行计算,得到此历史时间段的历史客流量
步骤S204,收集每个历史时间段内的环境信息,对环境信息进行分析得到每个历史时间段内的样本特征变量。
环境信息是用于提取每个历史时间段内的样本特征变量的数据来源信息,例如每个历史时间段内的天气状况,车站的车辆排次表等等;由于历史时间段已经发生,技术人员可直接收集每个历史时间段内的环境信息,并根据经验或模型训练要求对环境信息进行提取归纳,得到每个历史时间段内的样本特征变量。样本特征变量为此若干个历史时间段内的特征变量,用于作为训练模型的样本。
步骤S206,获取初始时间递归神经网络模型,将每个历史时间段内的样本特征变量和历史客流量作为一对训练样本输入初始时间递归神经网络模型进行模型训练,得到客流预测模型。
初始时间递归神经网络模型为未训练的LSTM神经网络模型,本LSTM神经网络模型包含两个LSTM层,两个Dropout层,以及两个全连接层。其中,LSTM层用于基于输入的历史客流量抽取有效的与时序相关的特征变量,LSTM层输入的历史客流量可按照设定的时序长度作为输入单位。训练出此半小时内特征变量对客流量的影响;Dropout层用于防止模型过拟合。
LSTM神经网络模型的单元公式包括:
遗忘门:ft=σ(Wf·[ht-1,xt]+bf)
其中,ft表示t时刻遗忘门限,ht-1表示t-1时刻单元的输出,Wf表示遗忘门权重,bf表示全连接层偏置。
输入门:it=σ(Wi·[ht-1,xt]+bi);
其中,it表示t时刻输入门限,Wi表示输入门权重,bi表示输入门偏置。
更新门:
其中,Ct表示t时刻cell的总状态,Ct-1为t-1时刻cell状态。
输出门:Ot=σ(WO·[ht-1,xt]+bo)
ht=Ot*tanh(Ct)
其中,Ot表示t时刻的输出门限,WO表示输出门权重,bo表示输出门偏置,ht表示t时刻的输出。
对初始时间递归神经网络模型进行数据训练的样本为若干个历史时间段内的样本特征变量和历史客流量,每一历史时间段内的样本特征变量可以有多个,LSTM神经网络模型通过多重细胞传导,多次回归,并通过Dropout层避免数据过拟合,直至训练出的客流预测模型能够根据输入的目标特征变量预测其对应的客流量。
本实施例中,利用LSTM神经网络模型,以若干个历史时间段内的样本特征变量和历史客流量为训练样本训练出的客流预测模型,能够有效拟合复杂的非线性和动态关系,提高对样本数据的拟合度,使得客流预测模型更符合客流数据满足线性分布或平稳定分布等要求较高的预测情况,提高此情况下预测结果的准确性。
在一个实施例中,图2中的步骤S204中对环境信息进行分析得到每个历史时间段内的样本特征变量之后,还可以包括:获取预设归一化算法,按照预设归一化算法将样本特征变量进行归一化。图1中的步骤S102中获取预测时间段对应的目标特征变量之后,还包括:按照预设归一化算法将目标特征变量进行归一化。步骤S106将目标特征变量输入客流预测模型中,可以包括:将归一化后的目标特征向量输入客流预测模型中。步骤S106在客流预测模型的输出端得到预测时间段内的预测客流量之后,还可以包括:按照与预设归一算法对应的逆算法对预测客流量进行还原。
预设归一算法是将特征变量的变化情况进行标准化的算法,可以采用Min-max标准化,将特征变量值映射到[0,1]区间,其归一化公式为:
其中,x*为归一化后的特征变量值,x为初始的特征变量值,xmax和xmin为时间段特征变量值归一化时的最大值和最小值。例如,可对天气情况这一特征变量进行评分,晴天无风为1分,下雨为0分等等,将每一特征变量进行数值归一化,便于模型训练。特征变量的值的归一化,可从模型训练时开始进行,即对所有参与本方法中的特征变量,都进行数值归一化。
在根据客流预测模型得到预测客流量之后,需要将预测客流量根据特征变量的归一化进行逆向还原,得到最终的预测值,逆向还原公式如下:
y=ypred*(ymax-ymin)+ymin
其中,ypred为模型预测值,ymax和ymin为时间段客流归一化时的最大值和最小值。
本实施例中,对本方法中模型训练阶段和最终客流预测阶段的特征变量都按照预设归一算法进行归一化处理,能够有效减少数据计算量,降低设备计算压力,并提高计算的准确性。
在一个实施例中,图2中的步骤S206得到客流预测模型之后,还可以包括模型验证的操作,请参见图3,该模型验证方式具体包括以下步骤:
步骤S302,获取验证时间段内的记录客流量。
验证时间段、验证特征变量是用于模型验证的验证集,验证时间段可以为过去某一段或多段时间,而验证时间段内的记录客流量则为对验证时间段内实际采集到的客流量。
在模型训练时,可将样本集按照一定比例分割为训练集和验证集,以训练集作为训练样本进行上述的模型训练步骤,而验证集则用于验证模型的准确性。
步骤S304,获取验证时间段内的验证特征变量。
验证特征变量则是在验证时间段内的特征变量,在模型验证时获取验证特征变量作为模型输入。
步骤S306,将验证特征变量输入客流预测模型中,在客流预测模型的输出端得到验证时间段内的验证客流量。
客流预测模型对输入的验证特征变量进行分析,根据已训练的神经元计算出验证客流量,即通过模型计算得到验证时间段对应的客流量。
步骤S308,计算记录客流量和验证客流量之间的差值,若差值大于预设值,则根据记录客流量更新客流预测模型。
记录客流量与验证客流量之间的差值,即为模型计算结果与实际客流量之间的差值,技术人员可设置一个判定阈值(即预设值)来判定是否需要对模型进行调整,若差值较大,则技术人员可分析差值大的理由,增加模型训练样本,或者补充样本特征变量,对模型进行补充训练,从而提高模型的预测准确性。
本实施例中,提供了一种模型验证方法,通过验证集来对模型的预测结果进行验证,当预测结果与实际客流相差较大时,则可分析差距原因,对模型进行更新,从而进一步提高模型的预测准确性。
在一个实施例中,客流是目标车站的客流,图2中的步骤S202获取若干个历史时间段内的历史客流数据,可以包括:利用在目标车站进出口处设置的客户采集设备采集历史时间段内的历史客流数据。
具体地,在对火车站、汽车站等固定空间的客流进行预测时,可根据车站进出口处设置的客户采集设备来获取历史时间段内的历史客流数据,客户采集设备可以为车站进出口处的刷卡机、摄像头等等设备。而对于这些用户采集设备获取的历史客流数据除了可获取历史客流量以外,还可以获取对应的客户数据,如身份证号、性别、年龄等等,可将这些客户数据作为辅助分析变量,对客流预测模型的预测结果进行调整或者进一步分析。
本实施例中,在对火车站、汽车站等固定空间的客流进行预测时,可直接利用车站进出口处设置的客户采集设备来获取历史时间段内的历史客流数据,作为模型训练的数据来源。
在一个实施例中,图2中的步骤S202获取若干个历史时间段内的历史客流数据之后,还可以包括:若检测到历史客流数据中存在数据缺失,则识别缺失数据对应的第一时间段;从基于时间维度构建的客流跟踪模型中,选取第一时间段对应的第二时间段;获取第二时间段对应的客流数据作为第一时间段对应的客流数据。
具体地,若获取用于模型训练的历史客流数据时,若发现其中某段时间内存在数据缺失,如摄像头等数据采集设备断电未采集到其中一段时间内的历史客流数据,则可补全缺失的客流数据。
可建立基于时间维度管理客流数据的客流跟踪模型,此客流跟踪模型可记录每一时间维度下的特征变量,以及采集到的客流数据;在某一段时间的客流数据缺失时,可从客流跟踪模型中获取特征变量相似,或者上一周上一月中对应的时间段的客流数据作为替代的客流数据,补充到缺失的时间段中。其中,第一时间段为客流数据缺失的时间段,第二时间段为用于替代第一时间段的客流数据的时间段。
可选的,上述客流跟踪模型可采用时间维度上线性插值实现:线性插值利用已知点建立合适的线性插值函数f(x),未知值由对应点xi求出的函数值f(xi)近似代替;数据异常处理采用同一摄像头前一周时间内同一时刻值的平均值替代。
本实施例中,可建立基于时间维度管理采集到的客流数据的客流跟踪模型,若某一时间段内的客流数据存在缺失的情况,可从客流跟踪模型中获取替代的客流数据,从而避免了由于客流数据缺失导致训练出的模型的不准确。
在一个实施例中,上述的预测时间段和历史时间段的时长相同。
具体地,训练样本中历史客流量的历史时间段与预测时间段的时间长度相同。例如要预测的预设时间段为半小时,则历史客流量也按照半小时为输入单位,即将历史客流量切分为每半小时单位内的客流数据,分析这半小时内的特征变量。
本实施例中,在模型训练时即确定一个固定时长的作为历史时间段,由此训练得到的客流预测模型,在对未来此固定时长内的客流量进行预测时,预测结果更为准确。
在一个实施例中,请参见图4,本发明还提供一种客流预测装置,该客流预测装置可以包括:
输入模块100,用于接收输入的预测时间段,获取预测时间段对应的目标特征变量。
模型获取模块200,用于获取训练好的客流预测模型,客流预测模型是以历史时间段内包含的特征变量和历史时间段内的历史客流数据作为训练样本、用以计算输入的特征变量对应的客流量的时间递归神经网络模型。
模型分析模块300,用于将目标特征变量输入客流预测模型中,在客流预测模型的输出端得到预测时间段内的预测客流量。
在一个实施例中,上述客流预测装置还可以包括:
历史客流量获取模块,用于获取若干个历史时间段内的历史客流数据,计算每个历史时间段内的历史客流量。
样本特征变量获取模块,用于收集每个历史时间段内的环境信息,对环境信息进行分析得到每个历史时间段内的样本特征变量。
模型训练模块,用于获取初始时间递归神经网络模型,将每个历史时间段内的样本特征变量和历史客流量作为一对训练样本输入初始时间递归神经网络模型进行模型训练,得到客流预测模型。
在一个实施例中,上述客流预测装置还可以包括:
样本特征归一化模块,用于获取预设归一化算法,按照预设归一化算法将样本特征变量进行归一化。
目标特征归一化模块,用于按照预设归一化算法将目标特征变量进行归一化。
图4中的模型分析模块300,还用于将归一化后的目标特征向量输入客流预测模型中。
还原模块,用于按照与预设归一算法对应的逆算法对预测客流量进行还原。
在一个实施例中,上述客流预测装置还可以包括:
记录客流量获取模块,用于获取验证时间段内的记录客流量。
验证特征变量获取模块,用于获取验证时间段内的验证特征变量。
验证客流量计算模块,用于将验证特征变量输入客流预测模型中,在客流预测模型的输出端得到验证时间段内的验证客流量。
模型更新模块,用于计算记录客流量和验证客流量之间的差值,若差值大于预设值,则根据记录客流量更新客流预测模型。
在一个实施例中,客流是目标车站的客流,上述历史客流量获取模块,还用于利用在目标车站进出口处设置的客户采集设备采集历史时间段内的历史客流数据。
在一个实施例中,上述客流预测装置还可以包括:
缺失处理模块,用于若检测到历史客流数据中存在数据缺失,则识别缺失数据对应的第一时间段。
替代时间段选取模块,用于从基于时间维度构建的客流跟踪模型中,选取第一时间段对应的第二时间段。
数据替代模块,用于获取第二时间段对应的客流数据作为第一时间段对应的客流数据。
在一个实施例中,上述客流预测装置中预测时间段和历史时间段的时长相同。
关于客流预测装置的工作原理、工作方式的更多内容,可以参照上述图1至图3中的相关描述,这里不再赘述。
进一步地,本发明实施例还公开一种计算机设备,包括存储器和处理器,存储器上存储有能够在处理器上运行的计算机指令,处理器运行计算机指令时执行上述图1至图3所示实施例中的方法技术方案。
进一步地,本发明实施例还公开一种存储介质,其上存储有计算机指令,计算机指令运行时执行上述图1至图3所示实施例中的方法技术方案。优选地,存储介质可以包括诸如非挥发性(non-volatile)存储器或者非瞬态(non-transitory)存储器等计算机可读存储介质。存储介质可以包括ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (10)
1.一种客流预测方法,其特征在于,所述方法包括:
接收输入的预测时间段,获取所述预测时间段对应的目标特征变量;
获取训练好的客流预测模型,所述客流预测模型是以历史时间段内包含的特征变量和所述历史时间段内的历史客流数据作为训练样本、用以计算输入的特征变量对应的客流量的时间递归神经网络模型;
将所述目标特征变量输入所述客流预测模型中,在所述客流预测模型的输出端得到所述预测时间段内的预测客流量。
2.根据权利要求1所述的方法,其特征在于,所述客流预测模型的生成方式,包括:
获取若干个历史时间段内的历史客流数据,计算每个所述历史时间段内的历史客流量;
收集每个所述历史时间段内的环境信息,对所述环境信息进行分析得到每个所述历史时间段内的样本特征变量;
获取初始时间递归神经网络模型,将每个所述历史时间段内的样本特征变量和历史客流量作为一对训练样本输入所述初始时间递归神经网络模型进行模型训练,得到所述客流预测模型。
3.根据权利要求2所述的方法,其特征在于,所述对所述环境信息进行分析得到每个所述历史时间段内的样本特征变量之后,还包括:
获取预设归一化算法,按照所述预设归一化算法将所述样本特征变量进行归一化;
所述获取所述预测时间段对应的目标特征变量之后,还包括:
按照所述预设归一化算法将所述目标特征变量进行归一化;
所述将所述目标特征变量输入所述客流预测模型中,包括:
将归一化后的所述目标特征向量输入所述客流预测模型中;
所述在所述客流预测模型的输出端得到所述预测时间段内的预测客流量之后,还包括:
按照与所述预设归一算法对应的逆算法对所述预测客流量进行还原。
4.根据权利要求2所述的方法,其特征在于,所述得到所述客流预测模型之后,还包括:
获取验证时间段内的记录客流量;
获取所述验证时间段内的验证特征变量;
将所述验证特征变量输入所述客流预测模型中,在所述客流预测模型的输出端得到所述验证时间段内的验证客流量;
计算所述记录客流量和所述验证客流量之间的差值,若所述差值大于预设值,则根据所述记录客流量更新所述客流预测模型。
5.根据权利要求2所述的方法,其特征在于,所述客流是目标车站的客流,所述获取若干个历史时间段内的历史客流数据,包括:
利用在所述目标车站进出口处设置的客户采集设备采集所述历史时间段内的历史客流数据。
6.根据权利要求2所述的方法,其特征在于,所述获取若干个历史时间段内的历史客流数据之后,还包括:
若检测到所述历史客流数据中存在数据缺失,则识别缺失数据对应的第一时间段;
从基于时间维度构建的客流跟踪模型中,选取所述第一时间段对应的第二时间段;
获取所述第二时间段对应的客流数据作为所述第一时间段对应的客流数据。
7.根据权利要求1所述的方法,其特征在于,所述预测时间段和所述历史时间段的时长相同。
8.一种客流预测装置,其特征在于,所述装置包括:
输入模块,用于接收输入的预测时间段,获取所述预测时间段对应的目标特征变量;
模型获取模块,用于获取训练好的客流预测模型,所述客流预测模型是以历史时间段内包含的特征变量和所述历史时间段内的历史客流数据作为训练样本、用以计算输入的特征变量对应的客流量的时间递归神经网络模型;模型分析模块,用于将所述目标特征变量输入所述客流预测模型中,在所述客流预测模型的输出端得到所述预测时间段内的预测客流量。
9.一种计算机设备,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至7任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910934590.8A CN110852476A (zh) | 2019-09-29 | 2019-09-29 | 客流预测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910934590.8A CN110852476A (zh) | 2019-09-29 | 2019-09-29 | 客流预测方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110852476A true CN110852476A (zh) | 2020-02-28 |
Family
ID=69597211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910934590.8A Pending CN110852476A (zh) | 2019-09-29 | 2019-09-29 | 客流预测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110852476A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112114963A (zh) * | 2020-09-07 | 2020-12-22 | 中国银行股份有限公司 | 服务器内存容量预测方法及装置 |
CN112308318A (zh) * | 2020-11-02 | 2021-02-02 | 沈阳民航东北凯亚有限公司 | 一种排队时间预测方法、装置、设备及存储介质 |
CN112330074A (zh) * | 2020-12-02 | 2021-02-05 | 公安部交通管理科学研究所 | 一种基于移动警务的卡口流量预警方法 |
CN112380925A (zh) * | 2020-10-27 | 2021-02-19 | 北京城建智控科技有限公司 | 数据处理方法、装置、设备和存储介质 |
CN112434859A (zh) * | 2020-11-26 | 2021-03-02 | 国电南瑞科技股份有限公司 | 一种结合客流预测技术的轨道交通地下站环控调节方法 |
CN113177657A (zh) * | 2021-04-20 | 2021-07-27 | 上海大学 | 轨道交通客流预测方法及装置 |
CN113691398A (zh) * | 2021-08-13 | 2021-11-23 | 北京金山云网络技术有限公司 | 节点带宽的预测方法、装置、电子设备和存储介质 |
CN113935757A (zh) * | 2020-06-29 | 2022-01-14 | 阿里巴巴集团控股有限公司 | 客流量的确定方法及装置、非易失性存储介质 |
CN114154696A (zh) * | 2021-11-19 | 2022-03-08 | 中国建设银行股份有限公司 | 资金流预测方法、系统、计算机设备及存储介质 |
CN114266390A (zh) * | 2021-12-17 | 2022-04-01 | 北京沃东天骏信息技术有限公司 | 训练方法、客流量预测方法、装置、电子设备及存储介质 |
CN114611751A (zh) * | 2022-01-20 | 2022-06-10 | 广西工业职业技术学院 | 一种预测模型生成方法、存储介质及预测方法 |
CN116703011A (zh) * | 2023-08-09 | 2023-09-05 | 民航机场规划设计研究总院有限公司 | 航空旅客流量分布预测方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103247177A (zh) * | 2013-05-21 | 2013-08-14 | 清华大学 | 大规模路网交通流实时动态预测系统 |
US20180137412A1 (en) * | 2016-11-16 | 2018-05-17 | Cisco Technology, Inc. | Network traffic prediction using long short term memory neural networks |
CN108197739A (zh) * | 2017-12-29 | 2018-06-22 | 中车工业研究院有限公司 | 一种城市轨道交通乘客流量预测方法 |
CN109034449A (zh) * | 2018-06-14 | 2018-12-18 | 华南理工大学 | 基于深度学习和乘客行为模式的短期公交客流预测方法 |
CN109859469A (zh) * | 2019-02-15 | 2019-06-07 | 重庆邮电大学 | 一种基于集成lstm神经网络的车流量预测方法 |
CN109886444A (zh) * | 2018-12-03 | 2019-06-14 | 深圳市北斗智能科技有限公司 | 一种交通短时客流预测方法、装置、设备和存储介质 |
-
2019
- 2019-09-29 CN CN201910934590.8A patent/CN110852476A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103247177A (zh) * | 2013-05-21 | 2013-08-14 | 清华大学 | 大规模路网交通流实时动态预测系统 |
US20180137412A1 (en) * | 2016-11-16 | 2018-05-17 | Cisco Technology, Inc. | Network traffic prediction using long short term memory neural networks |
CN108197739A (zh) * | 2017-12-29 | 2018-06-22 | 中车工业研究院有限公司 | 一种城市轨道交通乘客流量预测方法 |
CN109034449A (zh) * | 2018-06-14 | 2018-12-18 | 华南理工大学 | 基于深度学习和乘客行为模式的短期公交客流预测方法 |
CN109886444A (zh) * | 2018-12-03 | 2019-06-14 | 深圳市北斗智能科技有限公司 | 一种交通短时客流预测方法、装置、设备和存储介质 |
CN109859469A (zh) * | 2019-02-15 | 2019-06-07 | 重庆邮电大学 | 一种基于集成lstm神经网络的车流量预测方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113935757A (zh) * | 2020-06-29 | 2022-01-14 | 阿里巴巴集团控股有限公司 | 客流量的确定方法及装置、非易失性存储介质 |
CN112114963A (zh) * | 2020-09-07 | 2020-12-22 | 中国银行股份有限公司 | 服务器内存容量预测方法及装置 |
CN112380925A (zh) * | 2020-10-27 | 2021-02-19 | 北京城建智控科技有限公司 | 数据处理方法、装置、设备和存储介质 |
CN112308318A (zh) * | 2020-11-02 | 2021-02-02 | 沈阳民航东北凯亚有限公司 | 一种排队时间预测方法、装置、设备及存储介质 |
CN112308318B (zh) * | 2020-11-02 | 2024-05-28 | 沈阳民航东北凯亚有限公司 | 一种排队时间预测方法、装置、设备及存储介质 |
CN112434859B (zh) * | 2020-11-26 | 2022-08-26 | 国电南瑞科技股份有限公司 | 一种结合客流预测技术的轨道交通地下站环控调节方法 |
CN112434859A (zh) * | 2020-11-26 | 2021-03-02 | 国电南瑞科技股份有限公司 | 一种结合客流预测技术的轨道交通地下站环控调节方法 |
CN112330074A (zh) * | 2020-12-02 | 2021-02-05 | 公安部交通管理科学研究所 | 一种基于移动警务的卡口流量预警方法 |
CN113177657B (zh) * | 2021-04-20 | 2022-08-30 | 上海大学 | 轨道交通客流预测方法及装置 |
CN113177657A (zh) * | 2021-04-20 | 2021-07-27 | 上海大学 | 轨道交通客流预测方法及装置 |
CN113691398A (zh) * | 2021-08-13 | 2021-11-23 | 北京金山云网络技术有限公司 | 节点带宽的预测方法、装置、电子设备和存储介质 |
CN114154696A (zh) * | 2021-11-19 | 2022-03-08 | 中国建设银行股份有限公司 | 资金流预测方法、系统、计算机设备及存储介质 |
CN114266390A (zh) * | 2021-12-17 | 2022-04-01 | 北京沃东天骏信息技术有限公司 | 训练方法、客流量预测方法、装置、电子设备及存储介质 |
CN114611751A (zh) * | 2022-01-20 | 2022-06-10 | 广西工业职业技术学院 | 一种预测模型生成方法、存储介质及预测方法 |
CN116703011A (zh) * | 2023-08-09 | 2023-09-05 | 民航机场规划设计研究总院有限公司 | 航空旅客流量分布预测方法、装置、电子设备及存储介质 |
CN116703011B (zh) * | 2023-08-09 | 2023-10-20 | 民航机场规划设计研究总院有限公司 | 航空旅客流量分布预测方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110852476A (zh) | 客流预测方法、装置、计算机设备和存储介质 | |
CN110610280B (zh) | 一种电力负荷短期预测方法、模型、装置及系统 | |
EP3514823A2 (en) | Machine learning-based semiconductor manufacturing yield prediction system and method | |
CN107506868B (zh) | 一种短时电力负荷预测的方法及装置 | |
CN112766535B (zh) | 一种考虑负荷曲线特征的建筑负荷预测方法及系统 | |
CN112803398A (zh) | 基于经验模态分解和深度神经网络的负荷预测方法及系统 | |
CN106874511B (zh) | 一种基于绝缘子金属附件腐蚀电荷量预测系统的数据库 | |
CN112258251A (zh) | 基于灰色关联的电动汽车换电需求的集成学习预测方法及系统 | |
CN114290960A (zh) | 获取动力电池的电池健康度的方法、装置和车辆 | |
CN112633556A (zh) | 一种基于混合模型的短期电力负荷预测方法 | |
CN114924203A (zh) | 一种电池soh预测分析方法及电动汽车 | |
CN111985731B (zh) | 城市公共交通站点人数的预测方法及系统 | |
CN117538783A (zh) | 一种基于时域融合变换器的锂离子电池荷电状态估计方法 | |
CN117370759A (zh) | 基于人工智能的燃气用量预测方法 | |
CN110740063B (zh) | 基于信号分解和周期特性的网络流量特征指标预测方法 | |
CN117748447A (zh) | 一种基于调压事件分析的配电网线变关系诊断方法、系统 | |
CN115511230B (zh) | 一种电能替代潜力分析预测方法 | |
CN115170304B (zh) | 风险特征描述的提取方法和装置 | |
CN109800923B (zh) | 一种分散式风力发电短期功率组合预测方法 | |
Kumar et al. | Bidirectional LSTM Network-Based Short-Term Load Forecasting Method in Smart Grids | |
CN114629103A (zh) | 一种基于inception结构负荷分解模型的楼宇负荷分解方法 | |
CN114550454B (zh) | 一种基于交通流矩阵组合模型的交通流量预测方法 | |
Su et al. | Daily Passenger Volume Prediction in the Bus Transportation System using ARIMAX Model with Big Data | |
CN113837873B (zh) | 汽车金融贷款等待时间的预估方法、设备及计算介质 | |
CN117833243B (zh) | 一种电力短期需求预测方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200228 |