CN110619427A - 基于序列到序列学习模型的交通指数预测方法和装置 - Google Patents
基于序列到序列学习模型的交通指数预测方法和装置 Download PDFInfo
- Publication number
- CN110619427A CN110619427A CN201910790602.4A CN201910790602A CN110619427A CN 110619427 A CN110619427 A CN 110619427A CN 201910790602 A CN201910790602 A CN 201910790602A CN 110619427 A CN110619427 A CN 110619427A
- Authority
- CN
- China
- Prior art keywords
- sequence
- network
- traffic index
- lstm
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000008859 change Effects 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 239000010410 layer Substances 0.000 claims description 32
- 238000010586 diagram Methods 0.000 claims description 24
- 239000002356 single layer Substances 0.000 claims description 15
- 238000012795 verification Methods 0.000 description 11
- 230000008901 benefit Effects 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于序列到序列学习模型的交通指数预测方法和装置,方法包括:获取交通指数输入时间序列;将交通指数输入时间序列作为序列到序列学习模型的输入对象;其中,序列到序列学习模型由编码器网络和解码器网络组成,编码器网络为以LSTM单元作为基本循环单元的LSTM网络,解码器网络为以LSTM单元作为基本循环单元的LSTM网络;利用编码器网络对交通指数输入时间序列进行特征提取,得到时间变化特征向量;利用解码器网络对时间变化特征向量进行处理,将处理得到的交通指数输出时间序列作为预测结果。本发明提高了对交通指数的预测精度,能够更好地刻画交通指数的非线性变化。
Description
技术领域
本发明涉及软件领域,尤其涉及一种基于序列到序列学习模型的交通指数预测方法和装置。
背景技术
交通相当于城市的血脉,为城市源源不断的输送生产力,交通指数是用来衡量当前交通拥堵状况的概念性指数值,交通指数取值在0-10之间,数值越高表明当前交通拥堵状况越严重,交通指数预测可以为决策者发现问题,制定策略提供数据支持,同时,也可帮助公众合理规划出行方案。
国内外关于交通预测的方法大致分为两类,第一类是基于确定数学模型的预测方法,如韩超等基于差分自回归移动平均模型(ARIMA)对短时交通流实时自适应预测;杨兆升等基于卡尔曼滤波对交通流量进行实时预测;还有指数平滑模型等。这类方法求解简单,但是适应性较差,一般只适应于某一类数据,例如差分自回归移动平均模型(ARIMA)对于平稳型数据有较好的预测能力,当数据并不属于平稳型数据时,该模型无法捕捉数据间的规律,预测能力较差,卡尔曼滤波只适用于线性、离散和有限维的数据。第二类是基于智能模型的预测方法,这类方法适应性更好,对数据的类型要求较低。但是,该类方法也存在求解困难,难于训练等缺点。例如BP模型,容易出现过拟合,并且对于复杂的数据,该模型无法捕捉到数据间的关系,预测能力较差。
发明内容
本发明的一个目的是解决至少上述问题和/或缺陷,并提供至少后面将说明的优点。
为了实现根据本发明的这些目的和其它优点,提供了一种可提高交通指数预测精度的基于序列到序列学习模型的交通指数预测方法,包括:
获取交通指数输入时间序列;
将所述交通指数输入时间序列作为序列到序列学习模型的输入对象;其中,所述序列到序列学习模型由编码器网络和解码器网络组成,所述编码器网络为以LSTM单元作为基本循环单元的LSTM网络,所述解码器网络为以LSTM单元作为基本循环单元的LSTM网络;
利用所述编码器网络对所述交通指数输入时间序列进行特征提取,得到所述交通指数时间序列的时间变化特征向量;
利用所述解码器网络对所述交通指数输入时间序列的时间变化特征向量进行处理,将处理得到的交通指数输出时间序列作为预测结果。
优选的是,所述的基于序列到序列学习模型的交通指数预测方法中,所述方法还包括:
利用时序图展示所述处理得到的交通指数输出时间序列。
优选的是,所述的基于序列到序列学习模型的交通指数预测方法中,所述编码器网络为单层LSTM网络,所述解码器网络为单层LSTM网络。
优选的是,所述的基于序列到序列学习模型的交通指数预测方法中,所述编码器网络中LSTM单元的个数为所述解码器网络中LSTM单元的个数的2倍;所述编码器网络中LSTM单元中隐层节点的个数为300,所述解码器网络中LSTM单元中隐层节点的个数为300。
优选的是,所述的基于序列到序列学习模型的交通指数预测方法中,所述编码器网络中LSTM单元的个数为4,所述解码器网络中LSTM单元的个数为2。
为了实现根据本发明的这些目的和其它优点,提供了一种可提高交通指数预测精度的基于序列到序列学习模型的交通指数预测装置,包括:
获取模块,用于获取交通指数输入时间序列;
输入模块,用于将所述交通指数输入时间序列作为序列到序列学习模型的输入对象;其中,所述序列到序列学习模型由编码器网络和解码器网络组成,所述编码器网络为以LSTM单元作为基本循环单元的LSTM网络,所述解码器网络为以LSTM单元作为基本循环单元的LSTM网络;
提取模块,用于利用所述编码器网络对所述交通指数输入时间序列进行特征提取,得到所述交通指数时间序列的时间变化特征向量;
处理模块,用于利用所述解码器网络对所述交通指数输入时间序列的时间变化特征向量进行处理,将处理得到的交通指数输出时间序列作为预测结果。
优选的是,所述的基于序列到序列学习模型的交通指数预测装置中,所述装置还包括:
展示模块,用于利用时序图展示所述处理得到的交通指数输出时间序列。
优选的是,所述的基于序列到序列学习模型的交通指数预测装置中,所述编码器网络为单层LSTM网络,所述解码器网络为单层LSTM网络。
优选的是,所述的基于序列到序列学习模型的交通指数预测装置中,所述编码器网络中LSTM单元的个数为所述解码器网络中LSTM单元的个数的2倍;所述编码器网络中LSTM单元中隐层节点的个数为300,所述解码器网络中LSTM单元中隐层节点的个数为300。
优选的是,所述的基于序列到序列学习模型的交通指数预测装置中,所述编码器网络中LSTM单元的个数为4,所述解码器网络中LSTM单元的个数为2。
本发明至少包括以下有益效果:
本发明提供了一种基于序列到序列学习模型的交通指数预测方法,包括:获取交通指数输入时间序列;将所述交通指数输入时间序列作为序列到序列学习模型的输入对象;其中,所述序列到序列学习模型由编码器网络和解码器网络组成,所述编码器网络为以LSTM单元作为基本循环单元的LSTM网络,所述解码器网络为以LSTM单元作为基本循环单元的LSTM网络;利用所述编码器网络对所述交通指数输入时间序列进行特征提取,得到所述交通指数时间序列的时间变化特征向量;利用所述解码器网络对所述交通指数输入时间序列的时间变化特征向量进行处理,将处理得到的交通指数输出时间序列作为预测结果。本发明采用序列到序列的深度学习模型,以LSTM单元为基本循环单元来提取交通指数的时间变化特征,进而对未来时刻的交通指数进行预测。与ARIMA和智能模型方法(LSTM)相比,本发明在时间序列预测常用评价指标下均表现最优,提高了对交通指数的预测精度,能够更好地刻画交通指数的非线性变化,适用于城市交通指数的预测,能够达到工程应用的要求。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例的流程图;
图2为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例的序列到序列学习模型的示意图;
图3为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例的LSTM单元的示意图;
图4为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中交通指数输入时间序列的示意图;
图5(a)为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中输入阶段LSTM单元个数为96,输出阶段LSTM单元个数取值不同所得到的验证结果的示意图;
图5(b)为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中输入阶段LSTM单元个数为48,输出阶段LSTM单元个数取值不同所得到的验证结果的示意图;
图5(c)为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中输入阶段LSTM单元个数为32,输出阶段LSTM单元个数取值不同所得到的验证结果的示意图;
图6为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中输入阶段LSTM单元个数为输出阶段LSTM单元个数的2倍的情况下所得到的验证结果的示意图;
图7为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中交通指数预测结果的示意图;
图8为本发明的基于序列到序列学习模型的交通指数预测装置的一个实施例的示意图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
如图1所示,本发明提供了一种基于序列到序列学习模型的交通指数预测方法,包括:
步骤101,获取交通指数输入时间序列。在步骤101中,可以在有关交通部门获取交通指数数据。
步骤102,将所述交通指数输入时间序列作为序列到序列学习模型的输入对象;其中,所述序列到序列学习模型由编码器网络和解码器网络组成,所述编码器网络为以LSTM单元作为基本循环单元的LSTM网络,所述解码器网络为以LSTM单元作为基本循环单元的LSTM网络。
在步骤102中,所采用的序列到序列学习模型是预先建立的模型。在一个实施例中,选用Diederik Kingma和Jimmy Ba提出的Adam算法对序列到序列学习模型进行训练,该算法在试验中相对于其他种类的随机优化算法有很大的优势。在一个实施例中,在有关交通部门获得了2016年9月份,2017年9月份,2018年9月份,三个月每日00:00-23:45时段以15min为粒度的交通指数数据,共计8600余条数据。将上述数据的前80%作为训练集,后20%作为测试集。
步骤103,利用所述编码器网络对所述交通指数输入时间序列进行特征提取,得到所述交通指数时间序列的时间变化特征向量。
步骤104,利用所述解码器网络对所述交通指数输入时间序列的时间变化特征向量进行处理,将处理得到的交通指数输出时间序列作为预测结果。
序列到序列学习模型(Seq2Seq模型)的优点在于其编码解码的思想,本发明利用编码层对1,…,t时刻的交通指数特征进行提取,再利用解码层对特征解码,得到t,…,t+n时刻的交通指数。
Seq2Seq结构主要解决输入和输出序列不对等情况和一般模型无法解决的信息不能长时间记忆的问题。在交通指数预测上,我们用来输入的历史交通指数序列的长度,不一定和要预测出来的交通指数序列长度一致,并且,在预测问题上,也需要对输入的信息进行长时期的记忆。基于此,本发明选用Seq2Seq+LSTM网络(Long Short-Term Memory,长短期记忆网络)进行交通指数预测。
图2为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例的序列到序列学习模型的示意图。编码层网络是以LSTM单元作为基本循环单元的LSTM网络,而解码层也是以LSTM单元作为基本循环单元的LSTM网络。编码层网络和解码层网络可以均采用单层LSTM网络。若作为编码器网络的单层LSTM网络的时间步长为N,则在1时刻的信息会传入2时刻,2时刻的信息(包含1和2时刻的所有信息)会传入3时刻,...,N-1时刻的信息(包含前N-1时刻的所有信息)会传入N时刻。在时间步长N内,前一个时间点传送入下一个时间点的信息是逐渐累加的,在N时刻包含最多信息,但是N时刻作为是一个时间步的结尾,信息无法向下传递,会损失一部分有用信息。Seq2Seq网络结构的优点就在于,把N处的隐层状态即包含前N时刻的所有信息(记做C)传入解码层网络,对C进行解码实现预测。
具体地,交通指数输入时间序列X={x1,x2,x3,…,xN}中每个时刻的交通指数xt分别作为编码层网络中每个LSTM单元的输入。上面1时刻的信息就是交通指数输入时间序列X={x1,x2,x3,…,xN}中的x1,2时刻的信息为交通指数输入时间序列X={x1,x2,x3,…,xN}的x2,N时刻的信息为交通指数输入时间序列X={x1,x2,x3,…,xN}的xN。编码层网络输出的C为对交通指数输入时间序列进行特征提取所得到的时间变化特征向量。解码层网络对交通指数输入时间序列的时间变化特征向量进行处理,解码层网络每个LSTM单元的输出构成交通指数输出时间序列Y={y1,y2,…,yM}的一个值。
上述时间变化特征向量可以反映交通指数随时间变化的特征,包括短时变化特征和长时周期特征。当所获取的交通指数输入时间序列的时间窗较小,比如来自于一天内的某个小时或者某个时段,则时间变化特征向量更倾向于反映交通指数输入时间序列的短时波动性,即短时变化特征。当所获取的交通指数输入时间序列的时间窗较大,比如来自于几天或者几个星期,则时间变化特征向量更倾向于反映交通指数输入时间序列的长时周期特征。其原因在于,交通指数往往会以天、星期、月份甚至年份为单位呈现一种周期性的变化规律。
在本发明的序列到序列学习模型中,编码层网络和解码层网络均以LSTM单元作为其基本循环单元。LSTM网络是一种时间递归神经网络,LSTM的提出解决了传统RNN网络的梯度消失和梯度爆炸的问题。每个LSTM单元用输入门、输出门和遗忘门来控制不同阶段的数据输入和输出。LSTM单元的具体结构如图3所示。
(1)遗忘门
通过sigmiod来实现,将输入的信息[ht-1,xt](ht-1代表上一时刻的输出,包含着t时刻之前的信息,xt代表当前时刻的输入,包含t时刻的信息)送入sigmoid函数里,输出一个(0-1)的值(ft),1表示输入的信息全部保留,0表示输入的信息全部遗忘。
ft=σ(wf·[ht-1,xt]+bf)
(2)输入门
决定要在细胞状态里存储信息。分两步完成,第一步通过sigmoid函数输出it,it取值范围为(0-1),即表示要更新的信息比例,第二步通过tanh建立候选状态at。
it=σ(wi·[ht-1,xt]+bi)
at=tanh(wa·[ht-1,xt]+ba)
(3)输出门
对上一状态ct-1进行信息的遗忘,对当前候选状态at进行更新,输出当前时刻细胞状态ct。
上述就是LSTM的门结构,在更新细胞状态之后,LSTM也会有输出ht。通过tanh对细胞状态ct进行筛选,然后通过sigmoid对筛选后的ct进行输出。
ot=σ(wo·[ht-1,xt]+bo)
ht=tanh(ct)×ot
LSTM单元当前时刻的细胞状态ct和细胞输出ht作为下一时刻的输入,如此往复,LSTM网络通过这种方式实现信息的记忆,相比于传统的RNN,LSTM网络能够实现更长时间的记忆。
本发明采用序列到序列的深度学习模型,以LSTM单元为基本循环单元来提取交通指数的时间变化特征,进而对未来时刻的交通指数进行预测。与ARIMA和智能模型方法(LSTM)相比,本发明在时间序列预测常用评价指标下均表现最优,对交通指数具有很高的预测精度,能够更好地刻画交通指数的非线性变化,适用于城市交通指数的预测,能够达到工程应用的要求。
在一个实施例中,本发明的基于序列到序列学习模型的交通指数预测方法中,所述方法还包括:利用时序图展示所述处理得到的交通指数输出时间序列。可以将预测出的交通指数输出时间序列以时序图的形式展示出来,以便更加直观地查看交通指数在未来时刻的变化情况。
在一个实施例中,本发明的基于序列到序列学习模型的交通指数预测方法中,所述编码器网络为单层LSTM网络,所述解码器网络为单层LSTM网络。
也可以将编码器网络和解码器网络设计成多层LSTM网络,但是多层LSTM网络会增加模型的复杂度,增加运算时间。因此,在兼顾预测精度和运算效率的情况下,优选将将编码器网络和解码器网络设计成单层层LSTM网络。
在一个实施例中,本发明的基于序列到序列学习模型的交通指数预测方法中,所述编码器网络中LSTM单元的个数为所述解码器网络中LSTM单元的个数的2倍;所述编码器网络中LSTM单元中隐层节点的个数为300,所述解码器网络中LSTM单元中隐层节点的个数为300。
在一个实施例中,本发明的基于序列到序列学习模型的交通指数预测方法中,所述编码器网络中LSTM单元的个数为4,所述解码器网络中LSTM单元的个数为2。
为了评价模型的预测精度,选用均方根误差(RMSE)和平均绝对值误差(MAE)作为评价指标:
均方根误差(RMSE):
平均绝对值误差(MAE):
其中,RMSE计算观测值yi与真值偏差的平方和与观测次数(m)比值的平方根;MAE计算观测值yi与真值偏差的绝对值与观测次数(m)比值。i=1,2,3,…n,n代表测量次数。当上述指标越小时,表明预测值与真值越接近,精度越高。
对于每个LSTM单元中隐层节点个数的选择,采用参数搜索的方法对不同隐层节点取值进行选择。选用100,200,300作为隐层节点个数,经过实验发现随着隐层节点个数的增加,对交通指数的预测精度在提高,继续选用400,500作为隐层节点个数,对交通指数的预测精度增加,增加幅度较小,但是运行时间相对较长。相比之下,综合预测精度与运算效率两个方面,选择300作为隐层节点个数。
在有关交通部门获得了2018年9月份每日00:00-23:45时段15min粒度的交通指数数据。图4为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中交通指数输入时间序列的示意图,包含了2018年9月3日-2018年9月10日交通指数。将这些交通指数数据作为交通指数输入时间序列用于模型参数的选择。
在序列到序列学习模型中,需要为编码器网络和解码器网络选择合适的LSTM单元个数和每个单元输入或输出的数据个数。以input_time steps,input_length,output_time steps,output_length分别表示输入阶段的LSTM单元个数,每个LSTM单元的输入数据个数,输出阶段的LSTM单元个数,每个LSTM单元的输出数据个数,则输入阶段的参数可表示为(input_time steps,input_length),输出阶段的参数可表示为(output_time steps,output_length)。
本发明的交通指数预测为单变量预测,因此可以进行以下设置:input_length=output_length=1。
进一步地,采用参数搜索方法对input_time steps和output_time steps的参数值进行选择。
第一步:据图4可知,交通指数成周期性分布,一天可以作为其最小周期,以15min为时间粒度,一天有96个交通指数数据。基于此,对input_time steps和output_timesteps进行参数搜索,以96的因子作为参数搜索的范围。“input_time steps”和“output_time steps”的参数假设见表1。
表1“input_time steps”和“output_time steps”的参数假设
参数验证结果见图5(a)、图5(b)和图5(c)。输入阶段LSTM单元个数和输出阶段LSTM单元个数分别与输入序列的长度和输出序列的长度相等。图5(a)、图5(b)和图5(c)中横坐标(m,n)表示输入序列和输出序列的长度,例如(96,48)表示输入96个点的数据来预测48个点的数据,即用一天24小时的96个点预测第二天的前12个小时的48个点。图5(a)、图5(b)和图5(c)均绘制了RMSE曲线和MAE曲线,其中,用空心圆代表在某一个(m,n)下RMSE,用实心圆代表某一个(m,n)下MAE,并用箭头指示出结合RMSE和MAE判断出的误差最小的点。
图5(a)为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中输入阶段LSTM单元个数为96,输出阶段LSTM单元个数取值不同所得到的验证结果的示意图。图5(a)中(96,48)为结合RMSE和MAE判断出的误差最小的点。图5(b)为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中输入阶段LSTM单元个数为48,输出阶段LSTM单元个数取值不同所得到的验证结果的示意图。图5(b)中以(48,24)为结合RMSE和MAE判断出的误差最小的点。图5(c)为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中输入阶段LSTM单元个数为32,输出阶段LSTM单元个数取值不同所得到的验证结果的示意图。图5(c)中以(32,16)为结合RMSE和MAE判断出的误差最小的点。
第二步:根据上述分析可知,当输入阶段的参数为(2k,1),输出阶段的参数为(k,1)时误差最小。即若输入阶段的参数为(96,1),则输出阶段的参数取(48,1)时,误差最小;若输入阶段的参数为(48,1),则输出阶段的参数取(24,1)时,误差最小。于是构造输入阶段的参数为(2m,1),输出阶段的参数为(m,1)的数据来进行参数搜索。“input_time steps”,“output_time steps”参数关系假设见表2。
表2“input_time steps”和“output_time steps”参数关系假设
input_time steps | 96 | 48 | 32 | 24 | 16 | 12 | 8 | 6 | 4 | 2 |
output_time steps | 48 | 24 | 16 | 12 | 8 | 6 | 4 | 3 | 2 | 1 |
参数验证结果见图6。图6为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中输入阶段LSTM单元个数为输出阶段LSTM单元个数的2倍的情况下所得到的验证结果的示意图。图6中横坐标(m,n)表示输入序列和输出序列的长度,例如(96,48)表示输入96个点的数据来预测48个点的数据,即用一天24小时的96个点预测第二天的前12个小时的48个点。图6绘制了RMSE曲线和MAE曲线,其中,用空心圆代表在某一个(m,n)下RMSE,用实心圆代表某一个(m,n)下MAE,并用箭头指示出结合RMSE和MAE判断出的误差最小的点。据图6知,(4,2)处误差最小。
在一个实施例中,基于上述结论对输入阶段和输出阶段的参数进行设置。输入阶段的参数选用(4,1),输出阶段的参数选用(2,1),即用前六十分钟的交通指数预测后三十分钟的交通指数。采用上述参数设置对2018年9月25日至2018年9月26日的交通指数进行预测。在预测过程中,用9月25日第一个六十分钟(00:00-1:00)的真实交通指数预测之后的三十分钟(1:00-1:30)的交通指数,再用00:30-1:30的真实交通指数预测1:30-2:30的交通指数,即通过多次预测过程,得到2018年9月25日至9月26日的交通指数预测结果。
图7为本发明的基于序列到序列学习模型的交通指数预测方法的一个实施例中交通指数预测结果的示意图。图7将2018年9月25日至9月26日的真实交通指数和交通预测结果进行展示,两条曲线基本完全重合,证明本实施例的预测模型的预测精度高。
在一个实施例中,将本发明的序列到序列学习模型与现有的ARIMA模型和LSTM模型做对比。在有关交通部门获得了2016年9月份,2017年9月份,2018年9月份,三个月每日00:00-23:45时段以15min为粒度的交通指数数据,共计8600余条数据。三种模型均选取数据集的前80%做训练集,后20%做测试集。ARIMA模型中的三个参数(p,d,q)选取(5,1,0)(即数据中滞后数为5,差分阶数为1阶,预测误差滞后数为0)。现有的LSTM模型和本发明应用的Seq2Seq模型的隐层神经元个数300,训练次数5000,优化算法采用Adam算法,输出阶段的参数设置为(2,1)。基于现有的LSTM模型和本发明的Seq2Seq模型网络结构的差异,将现有LSTM模型的输入阶段参数设置为(2,1),本发明应用的Seq2Seq模型的输入阶段参数设置为(4,1)。结果见表3。本发明的序列到序列学习模型,在RMSE和MAE评价标准下均优于上述两种模型。
表3模型对比验证
RMSE | MAE | |
现有的ARIMA模型 | 0.362 | 0.243 |
现有的LSTM模型 | 0.733 | 0.484 |
本发明的Seq2Seq模型 | 0.228 | 0.153 |
图8为本发明的基于序列到序列学习模型的交通指数预测装置的一个实施例的示意图。装置包括:获取模块201,用于获取交通指数输入时间序列;输入模块202,用于将所述交通指数输入时间序列作为序列到序列学习模型的输入对象;其中,所述序列到序列学习模型由编码器网络和解码器网络组成,所述编码器网络为以LSTM单元作为基本循环单元的LSTM网络,所述解码器网络为以LSTM单元作为基本循环单元的LSTM网络;提取模块203,用于利用所述编码器网络对所述交通指数输入时间序列进行特征提取,得到所述交通指数时间序列的时间变化特征向量;处理模块204,用于利用所述解码器网络对所述交通指数输入时间序列的时间变化特征向量进行处理,将处理得到的交通指数输出时间序列作为预测结果。
本发明采用序列到序列的深度学习模型,以LSTM单元为基本循环单元来提取交通指数的时间变化特征,进而对未来时刻的交通指数进行预测。与ARIMA和智能模型方法(LSTM)相比,本发明在时间序列预测常用评价指标下均表现最优,对交通指数具有很高的预测精度,能够更好地刻画交通指数的非线性变化,适用于城市交通指数的预测,能够达到工程应用的要求。
在一个实施例中,所述的基于序列到序列学习模型的交通指数预测装置中,所述装置还包括:展示模块,用于利用时序图展示所述处理得到的交通指数输出时间序列。
在一个实施例中,所述的基于序列到序列学习模型的交通指数预测装置中,所述编码器网络为单层LSTM网络,所述解码器网络为单层LSTM网络。
在一个实施例中,所述的基于序列到序列学习模型的交通指数预测装置中,所述编码器网络中LSTM单元的个数为所述解码器网络中LSTM单元的个数的2倍;所述编码器网络中LSTM单元中隐层节点的个数为300,所述解码器网络中LSTM单元中隐层节点的个数为300。
在一个实施例中,所述的基于序列到序列学习模型的交通指数预测装置中,所述编码器网络中LSTM单元的个数为4,所述解码器网络中LSTM单元的个数为2。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用。它完全可以被适用于各种适合本发明的领域。对于熟悉本领域的人员而言,可容易地实现另外的修改。因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (10)
1.基于序列到序列学习模型的交通指数预测方法,其特征在于,包括:
获取交通指数输入时间序列;
将所述交通指数输入时间序列作为序列到序列学习模型的输入对象;其中,所述序列到序列学习模型由编码器网络和解码器网络组成,所述编码器网络为以LSTM单元作为基本循环单元的LSTM网络,所述解码器网络为以LSTM单元作为基本循环单元的LSTM网络;
利用所述编码器网络对所述交通指数输入时间序列进行特征提取,得到所述交通指数时间序列的时间变化特征向量;
利用所述解码器网络对所述交通指数输入时间序列的时间变化特征向量进行处理,将处理得到的交通指数输出时间序列作为预测结果。
2.如权利要求1所述的基于序列到序列学习模型的交通指数预测方法,其特征在于,所述方法还包括:
利用时序图展示所述处理得到的交通指数输出时间序列。
3.如权利要求1所述的基于序列到序列学习模型的交通指数预测方法,其特征在于,所述编码器网络为单层LSTM网络,所述解码器网络为单层LSTM网络。
4.如权利要求3所述的基于序列到序列学习模型的交通指数预测方法,其特征在于,所述编码器网络中LSTM单元的个数为所述解码器网络中LSTM单元的个数的2倍;所述编码器网络中LSTM单元中隐层节点的个数为300,所述解码器网络中LSTM单元中隐层节点的个数为300。
5.如权利要求4所述的基于序列到序列学习模型的交通指数预测方法,其特征在于,所述编码器网络中LSTM单元的个数为4,所述解码器网络中LSTM单元的个数为2。
6.一种基于序列到序列学习模型的交通指数预测装置,其特征在于,包括:
获取模块,用于获取交通指数输入时间序列;
输入模块,用于将所述交通指数输入时间序列作为序列到序列学习模型的输入对象;其中,所述序列到序列学习模型由编码器网络和解码器网络组成,所述编码器网络为以LSTM单元作为基本循环单元的LSTM网络,所述解码器网络为以LSTM单元作为基本循环单元的LSTM网络;
提取模块,用于利用所述编码器网络对所述交通指数输入时间序列进行特征提取,得到所述交通指数时间序列的时间变化特征向量;
处理模块,用于利用所述解码器网络对所述交通指数输入时间序列的时间变化特征向量进行处理,将处理得到的交通指数输出时间序列作为预测结果。
7.如权利要求6所述的基于序列到序列学习模型的交通指数预测装置,其特征在于,所述装置还包括:
展示模块,用于利用时序图展示所述处理得到的交通指数输出时间序列。
8.如权利要求6所述的基于序列到序列学习模型的交通指数预测装置,其特征在于,所述编码器网络为单层LSTM网络,所述解码器网络为单层LSTM网络。
9.如权利要求8所述的基于序列到序列学习模型的交通指数预测装置,其特征在于,所述编码器网络中LSTM单元的个数为所述解码器网络中LSTM单元的个数的2倍;所述编码器网络中LSTM单元中隐层节点的个数为300,所述解码器网络中LSTM单元中隐层节点的个数为300。
10.如权利要求9所述的基于序列到序列学习模型的交通指数预测装置,其特征在于,所述编码器网络中LSTM单元的个数为4,所述解码器网络中LSTM单元的个数为2。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910790602.4A CN110619427A (zh) | 2019-08-26 | 2019-08-26 | 基于序列到序列学习模型的交通指数预测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910790602.4A CN110619427A (zh) | 2019-08-26 | 2019-08-26 | 基于序列到序列学习模型的交通指数预测方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110619427A true CN110619427A (zh) | 2019-12-27 |
Family
ID=68922002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910790602.4A Pending CN110619427A (zh) | 2019-08-26 | 2019-08-26 | 基于序列到序列学习模型的交通指数预测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110619427A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956341A (zh) * | 2019-12-31 | 2020-04-03 | 京东城市(北京)数字科技有限公司 | 停车场流量预测方法、装置、电子设备及存储介质 |
CN112712695A (zh) * | 2020-12-30 | 2021-04-27 | 桂林电子科技大学 | 一种交通流预测方法、装置及存储介质 |
CN112967518A (zh) * | 2021-02-01 | 2021-06-15 | 浙江工业大学 | 一种公交专用道条件下公交车辆轨迹的Seq2Seq预测方法 |
CN113360848A (zh) * | 2021-06-04 | 2021-09-07 | 北京工商大学 | 一种时序数据预测方法及装置 |
CN114004429A (zh) * | 2022-01-04 | 2022-02-01 | 苏州元澄科技股份有限公司 | 一种用于构建数字城市的数据处理方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105160866A (zh) * | 2015-08-07 | 2015-12-16 | 浙江高速信息工程技术有限公司 | 一种基于深度学习神经网络结构的交通流预测方法 |
CN106663373A (zh) * | 2014-08-19 | 2017-05-10 | 高通股份有限公司 | 用于交通效率和流控制的系统和方法 |
CN109561084A (zh) * | 2018-11-20 | 2019-04-02 | 四川长虹电器股份有限公司 | 基于lstm自编码网络的url参数异常值检测方法 |
CN109902862A (zh) * | 2019-02-13 | 2019-06-18 | 北京航空航天大学 | 一种融合时间注意力机制的时间序列预测系统 |
CN110021165A (zh) * | 2019-03-18 | 2019-07-16 | 浙江工业大学 | 一种基于Autoencoder-LSTM融合模型的交通流预测方法 |
-
2019
- 2019-08-26 CN CN201910790602.4A patent/CN110619427A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106663373A (zh) * | 2014-08-19 | 2017-05-10 | 高通股份有限公司 | 用于交通效率和流控制的系统和方法 |
CN105160866A (zh) * | 2015-08-07 | 2015-12-16 | 浙江高速信息工程技术有限公司 | 一种基于深度学习神经网络结构的交通流预测方法 |
CN109561084A (zh) * | 2018-11-20 | 2019-04-02 | 四川长虹电器股份有限公司 | 基于lstm自编码网络的url参数异常值检测方法 |
CN109902862A (zh) * | 2019-02-13 | 2019-06-18 | 北京航空航天大学 | 一种融合时间注意力机制的时间序列预测系统 |
CN110021165A (zh) * | 2019-03-18 | 2019-07-16 | 浙江工业大学 | 一种基于Autoencoder-LSTM融合模型的交通流预测方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956341A (zh) * | 2019-12-31 | 2020-04-03 | 京东城市(北京)数字科技有限公司 | 停车场流量预测方法、装置、电子设备及存储介质 |
CN112712695A (zh) * | 2020-12-30 | 2021-04-27 | 桂林电子科技大学 | 一种交通流预测方法、装置及存储介质 |
CN112712695B (zh) * | 2020-12-30 | 2021-11-26 | 桂林电子科技大学 | 一种交通流预测方法、装置及存储介质 |
CN112967518A (zh) * | 2021-02-01 | 2021-06-15 | 浙江工业大学 | 一种公交专用道条件下公交车辆轨迹的Seq2Seq预测方法 |
CN112967518B (zh) * | 2021-02-01 | 2022-06-21 | 浙江工业大学 | 一种公交专用道条件下公交车辆轨迹的Seq2Seq预测方法 |
CN113360848A (zh) * | 2021-06-04 | 2021-09-07 | 北京工商大学 | 一种时序数据预测方法及装置 |
CN114004429A (zh) * | 2022-01-04 | 2022-02-01 | 苏州元澄科技股份有限公司 | 一种用于构建数字城市的数据处理方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110619427A (zh) | 基于序列到序列学习模型的交通指数预测方法和装置 | |
CN108510741B (zh) | 一种基于Conv1D-LSTM神经网络结构的交通流预测方法 | |
CN108009674A (zh) | 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN101480143B (zh) | 一种预测灌区作物单产量的方法 | |
CN109583565A (zh) | 基于注意力模型长短时记忆网络的洪水预测方法 | |
CN112364975A (zh) | 基于图神经网络的终端运行状态预测方法及系统 | |
CN110188936B (zh) | 基于多因素空间选择深度学习算法的短时交通流预测方法 | |
CN109492748B (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN110852515A (zh) | 基于混合长短时记忆神经网络的水质指标预测方法 | |
CN111652425A (zh) | 一种基于粗糙集和长短期记忆网络的河流水质预测方法 | |
CN111310981A (zh) | 一种基于时间序列的水库水位趋势预测方法 | |
CN115906954A (zh) | 一种基于图神经网络的多变量时间序列预测方法及装置 | |
CN111178585A (zh) | 基于多算法模型融合的故障接报量预测方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN112288137A (zh) | 一种计及电价和Attention机制的LSTM短期负荷预测方法及装置 | |
CN113360848A (zh) | 一种时序数据预测方法及装置 | |
CN113435124A (zh) | 一种基于长短时记忆和径向基函数神经网络的水质时空关联预测方法 | |
CN114444561A (zh) | 基于CNNs-GRU融合深度学习模型的PM2.5预测方法 | |
CN110909928A (zh) | 能源负荷短期预测方法、装置、计算机设备及存储介质 | |
CN112508286A (zh) | 一种基于Kmeans-BiLSTM-DMD模型的短期负荷预测方法 | |
CN115456245A (zh) | 一种感潮河网区溶解氧预测方法 | |
CN115713044B (zh) | 一种多工况切换下的机电设备剩余寿命分析方法和装置 | |
CN112767692A (zh) | 基于SARIMA-GA-Elman组合模型的短时交通流量预测系统 | |
CN112529270A (zh) | 基于深度学习的水流量预测模型 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191227 |
|
RJ01 | Rejection of invention patent application after publication |