CN116434531A - 一种基于Conv1D-LSTM模型的短时交通流预测方法 - Google Patents
一种基于Conv1D-LSTM模型的短时交通流预测方法 Download PDFInfo
- Publication number
- CN116434531A CN116434531A CN202211613064.XA CN202211613064A CN116434531A CN 116434531 A CN116434531 A CN 116434531A CN 202211613064 A CN202211613064 A CN 202211613064A CN 116434531 A CN116434531 A CN 116434531A
- Authority
- CN
- China
- Prior art keywords
- short
- traffic flow
- conv1d
- lstm
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000012360 testing method Methods 0.000 claims abstract description 26
- 238000013528 artificial neural network Methods 0.000 claims abstract description 22
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 8
- 230000007787 long-term memory Effects 0.000 claims abstract description 7
- 230000006403 short-term memory Effects 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 15
- 238000010606 normalization Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 9
- 210000002569 neuron Anatomy 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 5
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 241000728173 Sarima Species 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/065—Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及一种基于Conv1D‑LSTM模型的短时交通流预测方法,该方法包括:S1、采集交通数据并进行预处理;S2、计算不同路段之间的皮尔逊相关系数,确定与预测路段具有显著空间相关性的S个相邻路段,并将历史交通数据划分为训练集和测试集;S3、建立Conv1D‑LSTM短时交通流预测模型,包括用于对输入数据进行特征提取的一维卷积网络,以及用于进行时间序列预测的长短期记忆神经网络;S4、基于时序反向传播算法,采用训练集对Conv1D‑LSTM短时交通流预测模型进行迭代训练;S5、采用训练好的Conv1D‑LSTM短时交通流预测模型对测试集进行短时交通流预测。与现有技术相比,本发明充分考虑交通量在时间和空间两个维度上的依赖关系,具有预测准确性高的优点。
Description
技术领域
本发明涉及交通流预测技术领域,尤其是涉及一种基于Conv1D-LSTM模型的短时交通流预测方法。
背景技术
人们出行需求的快速增长对交通系统的承载能力提出了更高的要求。构建智能交通系统(ITS),根据交通状况合理规划引导交通流量和居民流动性非常关键。
迅速准确的交通流预测和及时科学的交通流引导,可以促进交通运输业的进步,促进社会的高效运行。
传统的交通流预测基于时间序列分析模型,考虑到交通流在时间维度上具有显著的前后依赖关系,使用数理统计方法对历史交通数据进行处理。具代表性的算法有历史平均法(HA)、自回归移动平均法(ARIMA)、卡尔曼滤波法(KF)。这类模型虽有强可解释性,但由于时变交通数据具有非线性和随机性的特点,基于参数模型的交通量预测方法精度不高,无法应对交通突发事件。此外,还有一些基于传统机器学习的预测模型,如支持向量回归、K-近邻、随机森林回归等方法,这种方法能够处理高维数据,并能捕捉复杂的非线性关系,但这些方法仅适用于相对较小的数据集。
随着数据的复杂性和多样性的增加,大量具有时间和空间特性的数据出现,传统的数据分析和建模方法存在一定的局限性。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供了一种基于Conv1D-LSTM模型的短时交通流预测方法,充分考虑交通量在时间和空间两个维度上的依赖关系,具有预测准确性高的优点。
本发明的目的可以通过以下技术方案来实现:
本发明给出了一种基于Conv1D-LSTM模型的短时交通流预测方法,该方法包括以下子步骤:
步骤S1、采集交通数据并进行数据预处理;
步骤S2、计算不同路段之间的皮尔逊相关系数,确定与预测路段具有显著空间相关性的S个相邻路段,并将预测路段和S个相邻路段的历史交通数据划分为训练集和测试集,用滑动窗口在训练集和测试集生成时空相关矩阵,作为预测模型的输入数据;
步骤S3、建立Conv1D-LSTM短时交通流预测模型,包括用于对输入数据进行特征提取的一维卷积网络Conv1D,以及用于进行时间序列预测的长短期记忆神经网络LSTM;
步骤S4、基于时序反向传播算法BPTT,采用训练集数据对Conv1D-LSTM短时交通流预测模型进行迭代训练;
步骤S5、采用训练好的Conv1D-LSTM短时交通流预测模型对测试集进行短时交通流预测。
优选地,所述步骤S1中的数据预处理具体为:对采集到的交通数据检查是否存在脏数据,并依据脏数据类型分别进行处理;所述脏数据包括缺失值、重复值、格式不一致值、异常值及含有特殊符号的数据。
优选地,所述步骤S2中将预测路段的历史交通数据和S个相邻路段的交通数据划分为训练集和测试集,用滑动窗口在训练集和测试集生成时空相关矩阵,作为预测模型的输入数据,具体为:
将预测路段的历史交通数据和S个相邻路段的交通数据设定比例划分训练集和测试集,通过滑动时间窗口在训练集和测试集以时间步长k为预测间隔,即采用前k个时间段,预测下一个时间段,创建出k×S阶的时空相关矩阵作为预测模型的输入数据。
优选地,所述时空相关矩阵的表达式为:
式中,k为时间步长;S为路段数;s表示路段;t表示时间;xt-1,s表示在t-1时刻路段s的交通流量数据。
优选地,所述步骤S2还包括对预测模型的输入数据进行归一化预处理,所述归一化预处理采用Min-Max标准化方法。
优选地,所述步骤S3中的Conv1D-LSTM短时交通流预测模型包括依次连接的输入层、一维卷积网络Conv1D层、2个长短期记忆神经网络LSTM层、全连接层和输出层;其中,所述一维卷积网络Conv1D包括一维卷积层和池化层;
输入的时空相关矩阵通过一维卷积网络Conv1D进行空间特征提取,输出具有空间特征的序列;将具有空间特征的序列输入至长短期记忆神经网络LSTM,根据时间段[t-k,t-1]内的历史流量信息来预测t时刻的交通流,其中,k为代表预测间隔的时间步长。
优选地,所述步骤S3中还包括:经过长短期记忆神经网络LSTM层后设定dropout率,给Conv1D-LSTM短时交通流预测模型增加正则化约束。
优选地,所述步骤S4包括以下子步骤:
步骤S41、初始化权值矩阵;
步骤S42、将训练集经过归一化后的交通流量数据输入到Conv1D-LSTM短时交通流预测模型中,经过一维卷积网络Conv1D进行一维卷积和最大池化处理,捕捉交通流空间特征;
步骤S43、将卷积后的结果输入到长短期记忆神经网络LSTM隐藏层,在训练时通过dropout方法暂时舍弃部分神经元,经过三个控制门后,输出第一个隐含层结果;
步骤S44、将输出结果作为第二个长短期记忆神经网络LSTM隐含层的输入,重复步骤S43,得到第二个隐含层的输出结果;
步骤S45、第二个长短期记忆神经网络LSTM隐含层的结果经过全连接层后输出,得到交通流量预测值;
步骤S46、根据预测值与实际值计算MSE,作为误差目标函数;
步骤S47、利用时序反向传播算法BPTT进行训练,根据误差信号更新各层连接权值,直到模型达到最小误差或最大迭代次数后,停止权值的更新并结束训练。
优选地,所述方法还包括:步骤S6、用测试集的预测结果与实际值进行比较,采用性能评估指标对Conv1D-LSTM短时交通流预测模型进行性能评估,若不符合要求,转步骤S3对Conv1D-LSTM短时交通流预测模型的参数进行调整训练。
优选地,所述步骤S6中的性能评估指标包括平均绝对误差MAE、均方根误差RMSE和平均绝对百分比误差MAPE。
与现有技术相比,本发明具有以下优点:
1)本发明考虑到交通流预测会受相邻路段交通流的影响,通过一维卷积网络和长短期记忆神经网络来更好地捕捉到交通流的空间相关性和时序依赖关系,利用数据分析和深度学习技术,提高交通流预测的精度和可靠性,能够更好的在实践中强化智能交通系统的部署,并为居民出行和交通管理部门提供及时的交通信息;
2)本发明预测的交通流实时性好,居民依靠短时预测的结果合理规划出行的时间与路线,节省出行时间,提升出行效率提供稳定的交通流信息,为强化路段协调管理与规划提供精准的技术手段,将有助于提升城市治理的数字化进程,提高城市居民的幸福指数。
3)本发明对收集到的交通数据进行预处理,对异常数据或缺失数据进行修正,从而得到有效的交通流量数据,保证交通量预测输入数据集的质量;
4)本发明在长短期记忆神经网络LSTM层后,加入dropout方法,相当于给模型增加了正则化约束,通过设置一定的dropout率,部分神经元在学习过程中被暂时丢弃,它们的连接不会传输到下一层,避免模型参数过多或训练数据过少都可能使模型过拟合,从而可以提高模型的泛化能力,同时提高模型的训练速度。
附图说明
图1为本发明的方法流程图;
图2为交通数据集划分处理示意图;
图3为Conv1D-LSTM短时交通流预测模型的架构示意图;
图4为实施例中Conv1D-LSTM短时交通流预测模型的训练过程示意图;
图5为实施例中Conv1D-LSTM短时交通流预测模型的实现伪代码示意图;
图6为实施例中真实值与预测值曲线示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
如图1所示,本发明给出了一种基于Conv1D-LSTM模型的短时交通流预测方法,该方法包括以下子步骤:
步骤S1、采集交通数据并进行数据预处理;
步骤S2、计算不同路段之间的皮尔逊相关系数,确定与预测路段具有显著空间相关性的S个相邻路段,并将预测路段和S个相邻路段的历史交通数据划分为训练集和测试集,用滑动窗口在训练集和测试集生成时空相关矩阵,作为预测模型的输入数据;
步骤S3、建立Conv1D-LSTM短时交通流预测模型,包括用于对输入数据进行特征提取的一维卷积网络Conv1D,以及用于进行时间序列预测的长短期记忆神经网络LSTM;
步骤S4、基于时序反向传播算法BPTT,采用训练集数据对Conv1D-LSTM短时交通流预测模型进行迭代训练;
步骤S5、采用训练好的Conv1D-LSTM短时交通流预测模型对测试集进行短时交通流预测。
接下来,结合图2~6给出本发明的具体实施过程进行详细介绍。
本实施例给出了一种基于Conv1D-LSTM模型的短时交通流预测方法,该方法包括:
1、对采集到的交通数据进行预处理,对异常数据或缺失数据进行修正,从而得到有效的交通流量数据,保证交通量预测输入数据集的质量,具体包括以下子步骤:
1.1、对缺失数据进行检查,检测交通数据的完整性:通过遍历所有数据,按照指定的时间间隔对时间数据进行排列,检查时间信息和时间信息对应的交通数据是否存在缺失;原始数据集中若丢失了少量数据,可以通过时间序列预测的方法或根据其上下游的交通流数据来填补缺失的信息;
1.2、检查交通流数据中是否有重复数据:对多余的数据一般采用删除处理。
1.3、对异常数据进行统计法判别:
异常数据是与正常数据相比过高或过低的数据;如果数据呈正态分布,可以应用3σ原则:如果一个值与平均值的偏差超过标准偏差的3倍,则该值被认为是异常值。数据值大于μ+3σ或小于μ-3σ的概率为P(|x-μ|>3σ)≤0.003,属于极小概率事件;因此,当误差大于3σ时,可以判断为异常值。
1.4、对异常数据进行物理法判别:
由于道路最大通行能力的限制,交通流量应在合理范围内。当数值偏离交通流量参数正常范围时,则视为异常数据。
式中,q为交通量,fc为修正系数,一般为1.3-1.5,C为道路通行能力(veh/h),T为时间间隔(min);
1.5、在识别出异常数据后,有两种处理方式:删除或修正数据:
如果采集的数据量很大,删除异常数据对研究影响较小;若采集的数据量少,删除异常值会导致样本量不足,从而改变数据的原有分布,因此,可以对异常值进行修正,把它当成缺失数据进行处理。
2、在对原始数据清理完成之后,根据皮尔逊相关系数,计算不同路段交通流量之间特定的空间相关性,从而得出有明显空间相关性的路段个数。
2.1、计算各路段的小时交通流量,通过皮尔逊相关系数计算两条路段的交通流量之间的相关性:该统计指标用来描述两个变量(x,y)之间的线性相关性。两个变量之间的相关系数ρ的绝对值越大,两个变量之间的线性相关性越强,反之亦然,计算公式如下:
2.2、对各路段之间交通流量的空间相关性进行分析,道路上的交通流量会受到其他路段的影响,通过计算结果,确定出连续S个相邻路段的交通流量之间会有显著的空间相关性。
3、构造数据集,按一定比例将数据划分为训练集和测试集。如图2所示,取k个时刻的交通量和S个相邻路段的交通量为输入特征,形成k×S维的矩阵,以此作为模型的数据输入。
3.1、结合空间相关性分析,选取与预测路段相关的历史流量数据,以及在空间上与预测路段存在强相关的S个邻近路段的历史交通流量数据作为数据集。
3.2、按比例划分数据集,用滑动窗口在训练和测试数据上生成样本。滑动窗口的时间步长为k,根据[t-k,t-1]时间段内预测路段以及与预测路段存在显著空间相关的上下游路段的历史交通流量数据,生成时空相关矩阵。
3.3、利用上述方法创建出的时空相关矩阵如下所示。
其中,k为时间步长;S为路段数;s表示路段(一列代表一个路段),t表示时间(一行代表一个时刻);xt-1,s表示在t-1时刻路段s的交通流量数据。
4、将数据输入模型前,使用Min-Max归一化将交通流量转换为[0,1]范围之间,以提高模型迭代速度和准确性,公式如下所示。经过归一化处理后,数据序列的相对大小并未改变,整体变化趋势也保持一致。
5、建立Conv1D-LSTM短时交通流预测模型,将一维卷积网络和长短期记忆神经网络相结合,提取交通流的时空特征,并对短时交通流进行预测。
5.1、建立一维卷积网络,由一维卷积层和池化层组成:
对输入矩阵可以通过一维卷积网络考虑预测路段上下游交通流量对预测结果的影响,从而学习到数据中的空间特征。采用64个过滤器进行特征提取,然后通过ReLU函数激活,接着通过max-pooling进行池化处理,最终的输出序列作为后面LSTM层的输入。
5.2、将具有空间特征的时间序列输入到长短期记忆神经网络(Long short-termmemory network)。根据时间段[t-k,t-1]内的历史流量信息来预测t时刻的交通流。X作为LSTM的输入,LSTM的输出为H=(H1,H2,…,Ht),通过式(5)-式(10)的迭代提取到交通量的时间特征,并进行预测。
it=σ(WixXt+WihHt-1+bi)#(5)
ft=σ(WfxXt+WfhHt-1+bf)#(6)
ot=σ(WoxXt+WohHt-1+bo)#(9)
式中,Xt是t时刻的输入向量,ht为训练之后得到的输出值,ft,it,ot分别是遗忘门、输入门和输出门,Wfx,Wix,Wcx,Wcx和Wfh,Wih,Wch,Woh是权重矩阵,bf,bi,bc,bo偏置向量,Ht-1为时间t-1的隐藏状态,ct为时间t的细胞状态,
5.3、在LSTM层后,加入dropout方法,相当于给模型增加了正则化约束。通过设置一定的dropout率,部分神经元在学习过程中被暂时丢弃,它们的连接不会传输到下一层,避免模型参数过多或训练数据过少都可能使模型过拟合,从而可以提高模型的泛化能力,同时提高模型的训练速度。
5.4、LSTM隐藏层的输出ht后,经全连接层传递,最终的交通流预测值由式(11)计算得出。Yt为模型的输出,即t时刻交通流量预测值。
Yt=W×Ht+b#(11)
5.5、确定ConvlD-LSTM模型整体框架。初步建立起模型网络结构:输入层、一维卷积网络层、2个长短期记忆神经网络层、全连接层和输出层。该模型结构如图3所示。
6、通过训练数据集对ConvlD-LSTM模型迭代优化,直到满足停止条件,确定出最终模型参数。训练过程如图4所示。
6.1、初始化权值矩阵。
6.2、将训练集经过归一化后的交通流量数据输入到模型中,进行一维卷积和最大池化处理,来捕捉交通流空间特征。
6.3、将卷积后的结果输入到LSTM隐藏层,在训练时通过dropout方法将部分神经元暂时舍弃,不将其传入下一层,防止过拟合。经过三个控制门(输入门、遗忘门和输出门)后,输出第一个隐含层结果。
6.4、将输出结果作为第二个LSTM隐含层的输入,重复步骤S63,得到第二个隐含层的输出结果。
6.5、第二个LSTM隐含层的结果经过全连接层后输出,得到交通流量预测值。
6.6、根据预测值与实际值计算MSE,作为误差目标函数。
6.7、利用BPTT算法进行训练,根据误差信号更新各层连接权值,直到模型达到最小误差或最大迭代次数后,停止权值的更新并结束训练。
图5给出了本实施例中Conv1D-LSTM短时交通流预测模型的训练伪代码。
7、将学习到的Conv1D-LSTM模型应用于测试集中,进行短时交通流预测。
7.1、将测试集数据带入到训练后的Conv1D-LSTM模型中,得到归一化的预测交通流量数据。
7.2、对模型的输出值进行反归一化操作,得到与初始数据量级相同的预测值。
y=y[0-1]*(ymax-ymin)+ymin#(12)
8、用测试集的预测结果与实际值进行比较,对模型进行性能评估。
选取平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)作为误差的量化指标,来衡量预测结果的可靠性。其计算表达式如下。
9、选取SVR模型和SARIMA模型对相同的实例交通流数据进行预测,并其结果与Conv1D-LSTM模型预测结果进行比较。通过对比不同模型的评估指标,验证模型的准确性及有效性。不同模型的评价指标结果表1所示。
表1
模型 | MAE | RMSE | MAPE |
Conv1D-LSTM | 11.388 | 15.513 | 14.344 |
SVR | 11.590 | 15.912 | 15.483 |
SARIMA | 13.394 | 20.756 | 15.021 |
结果显示基于Conv1D-LSTM模型的短时交通流预测方法具有更低的MAE、RMSE、MAPE,其预测精度优于传统预测方法,表现出更强的拟合效果,如图6所示。该模型既能够考虑历史交通流,也能够关注上下游交通状况对预测路段的影响,可以提高预测能力。在模型对比中Conv1D-LSTM模型表现最佳,计算更加便捷,预测结果更加准确稳定。
提出的基于Conv1D-LSTM模型的交通流预测方法不同于那些仅考虑交通流时间序列的传统方法,该模型考虑到交通流预测会受相邻路段交通流的影响。在该模型中,主要通过一维卷积网络和长短期记忆神经网络来更好地捕捉到交通流的空间相关性和时序依赖关系。利用数据分析和深度学习技术,提高交通流预测的精度和可靠性,能够更好的在实践中强化智能交通系统的部署,并为居民出行和交通管理部门提供及时的交通信息。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于Conv1D-LSTM模型的短时交通流预测方法,其特征在于,该方法包括以下子步骤:
步骤S1、采集交通数据并进行数据预处理;
步骤S2、计算不同路段之间的皮尔逊相关系数,确定与预测路段具有显著空间相关性的S个相邻路段,并将预测路段和S个相邻路段的历史交通数据划分为训练集和测试集,用滑动窗口在训练集和测试集生成时空相关矩阵,作为预测模型的输入数据;
步骤S3、建立Conv1D-LSTM短时交通流预测模型,包括用于对输入数据进行特征提取的一维卷积网络Conv1D,以及用于进行时间序列预测的长短期记忆神经网络LSTM;
步骤S4、基于时序反向传播算法BPTT,采用训练集数据对Conv1D-LSTM短时交通流预测模型进行迭代训练;
步骤S5、采用训练好的Conv1D-LSTM短时交通流预测模型对测试集进行短时交通流预测。
2.根据权利要求1所述的一种基于Conv1D-LSTM模型的短时交通流预测方法,其特征在于,所述步骤S1中的数据预处理具体为:对采集到的交通数据检查是否存在脏数据,并依据脏数据类型分别进行处理;所述脏数据包括缺失值、重复值、格式不一致值、异常值及含有特殊符号的数据。
3.根据权利要求1所述的一种基于Conv1D-LSTM模型的短时交通流预测方法,其特征在于,所述步骤S2中将预测路段的历史交通数据和S个相邻路段的交通数据划分为训练集和测试集,用滑动窗口在训练集和测试集生成时空相关矩阵,作为预测模型的输入数据,具体为:
将预测路段的历史交通数据和S个相邻路段的交通数据设定比例划分训练集和测试集,通过滑动时间窗口在训练集和测试集以时间步长k为预测间隔,即采用前k个时间段,预测下一个时间段,创建出k×S阶的时空相关矩阵作为预测模型的输入数据。
5.根据权利要求3所述的一种基于Conv1D-LSTM模型的短时交通流预测方法,其特征在于,所述步骤S2还包括对预测模型的输入数据进行归一化预处理,所述归一化预处理采用Min-Max标准化方法。
6.根据权利要求1所述的一种基于Conv1D-LSTM模型的短时交通流预测方法,其特征在于,所述步骤S3中的Conv1D-LSTM短时交通流预测模型包括依次连接的输入层、一维卷积网络Conv1D层、2个长短期记忆神经网络LSTM层、全连接层和输出层;其中,所述一维卷积网络Conv1D包括一维卷积层和池化层;
输入的时空相关矩阵通过一维卷积网络Conv1D进行空间特征提取,输出具有空间特征的序列;将具有空间特征的序列输入至长短期记忆神经网络LSTM,根据时间段[t-k,t-1]内的历史流量信息来预测t时刻的交通流,其中,k为代表预测间隔的时间步长。
7.根据权利要求6所述的一种基于Conv1D-LSTM模型的短时交通流预测方法,其特征在于,所述步骤S3中还包括:经过长短期记忆神经网络LSTM层后设定dropout率,给Conv1D-LSTM短时交通流预测模型增加正则化约束。
8.根据权利要求7所述的一种基于Conv1D-LSTM模型的短时交通流预测方法,其特征在于,所述步骤S4包括以下子步骤:
步骤S41、初始化权值矩阵;
步骤S42、将训练集经过归一化后的交通流量数据输入到Conv1D-LSTM短时交通流预测模型中,经过一维卷积网络Conv1D进行一维卷积和最大池化处理,捕捉交通流空间特征;
步骤S43、将卷积后的结果输入到长短期记忆神经网络LSTM隐藏层,在训练时通过dropout方法暂时舍弃部分神经元,经过三个控制门后,输出第一个隐含层结果;
步骤S44、将输出结果作为第二个长短期记忆神经网络LSTM隐含层的输入,重复步骤S43,得到第二个隐含层的输出结果;
步骤S45、第二个长短期记忆神经网络LSTM隐含层的结果经过全连接层后输出,得到交通流量预测值;
步骤S46、根据预测值与实际值计算MSE,作为误差目标函数;
步骤S47、利用时序反向传播算法BPTT进行训练,根据误差信号更新各层连接权值,直到模型达到最小误差或最大迭代次数后,停止权值的更新并结束训练。
9.根据权利要求1所述的一种基于Conv1D-LSTM模型的短时交通流预测方法,其特征在于,所述方法还包括:步骤S6、用测试集的预测结果与实际值进行比较,采用性能评估指标对Conv1D-LSTM短时交通流预测模型进行性能评估,若不符合要求,转步骤S3对Conv1D-LSTM短时交通流预测模型的参数进行调整训练。
10.根据权利要求9所述的一种基于Conv1D-LSTM模型的短时交通流预测方法,其特征在于,所述步骤S6中的性能评估指标包括平均绝对误差MAE、均方根误差RMSE和平均绝对百分比误差MAPE。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211613064.XA CN116434531A (zh) | 2022-12-15 | 2022-12-15 | 一种基于Conv1D-LSTM模型的短时交通流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211613064.XA CN116434531A (zh) | 2022-12-15 | 2022-12-15 | 一种基于Conv1D-LSTM模型的短时交通流预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116434531A true CN116434531A (zh) | 2023-07-14 |
Family
ID=87086084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211613064.XA Pending CN116434531A (zh) | 2022-12-15 | 2022-12-15 | 一种基于Conv1D-LSTM模型的短时交通流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116434531A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116703008A (zh) * | 2023-08-02 | 2023-09-05 | 山东高速股份有限公司 | 一种用于新建公路的交通出行量预测方法、设备及介质 |
CN118644988A (zh) * | 2024-08-09 | 2024-09-13 | 华东交通大学 | 一种基于云边协同训练的分布式交通流预测方法 |
-
2022
- 2022-12-15 CN CN202211613064.XA patent/CN116434531A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116703008A (zh) * | 2023-08-02 | 2023-09-05 | 山东高速股份有限公司 | 一种用于新建公路的交通出行量预测方法、设备及介质 |
CN116703008B (zh) * | 2023-08-02 | 2023-10-31 | 山东高速股份有限公司 | 一种用于新建公路的交通出行量预测方法、设备及介质 |
CN118644988A (zh) * | 2024-08-09 | 2024-09-13 | 华东交通大学 | 一种基于云边协同训练的分布式交通流预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492830B (zh) | 一种基于时空深度学习的移动污染源排放浓度预测方法 | |
CN111612243B (zh) | 交通速度预测方法、系统及存储介质 | |
CN114220271B (zh) | 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质 | |
CN116434531A (zh) | 一种基于Conv1D-LSTM模型的短时交通流预测方法 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN113096388B (zh) | 一种基于梯度提升决策树的短时交通流量预测方法 | |
CN110599766B (zh) | 一种基于sae-lstm-sad的道路交通拥堵传播预测方法 | |
CN112270355B (zh) | 基于大数据技术与sae-gru的主动安全预测方法 | |
CN110610232A (zh) | 一种基于深度学习的长期及短期交通流预测模型构建方法 | |
CN110648014A (zh) | 一种基于时空分位数回归的区域风电预测方法及系统 | |
Zhao et al. | Short term traffic flow prediction of expressway service area based on STL-OMS | |
CN111047078B (zh) | 交通特征预测方法、系统及存储介质 | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及系统 | |
CN114252879A (zh) | 基于InSAR反演与多影响因子的大范围滑坡形变预测方法 | |
CN115545350A (zh) | 综合深度神经网络与强化学习的车辆路径问题求解方法 | |
CN115410372B (zh) | 基于贝叶斯lstm的高速公路交通流量可靠预测方法 | |
CN106526710A (zh) | 一种雾霾预测方法及装置 | |
CN113360848A (zh) | 一种时序数据预测方法及装置 | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理系统 | |
CN114065996A (zh) | 基于变分自编码学习的交通流预测方法 | |
CN116885699A (zh) | 基于双重注意力机制的电力负荷预测方法 | |
CN114596726A (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
CN112784479A (zh) | 一种洪水流量预测的方法 | |
CN113128666A (zh) | 基于Mo-S-LSTMs模型的时间序列多步预测方法 | |
CN113255963A (zh) | 基于路元拆分和深度学习模型lstm的路面使用性能预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |