CN117116045A

CN117116045A - 一种基于时空序列深度学习的交通流量预测方法及装置

Info

Publication number: CN117116045A
Application number: CN202311070477.2A
Authority: CN
Inventors: 杜圣东; 吴秋池; 胡节; 苏敏; 杨涛
Original assignee: Southwest Jiaotong University
Current assignee: Southwest Jiaotong University
Priority date: 2023-08-24
Filing date: 2023-08-24
Publication date: 2023-11-24

Abstract

本发明涉及一种基于时空序列深度学习的交通流量预测方法及装置，包括：获取道路形状以及道路的交通流量历史数据；对交通流量历史数据按照相关的时间关联顺序进行预处理，并按照批的形式进一步整理为张量的形式，构建交通流量历史数据的多变量时空序列数据集；将多变量时空序列数据集划分为训练数据集、验证数据集和测试数据集；利用训练数据集对交通流量预测模型进行训练；采集当前时刻的交通流量数据，将采集的当前时刻的交通流量数据输入训练好的交通流量预测模型，预测未来时刻的时序值。本发明能够在实际的交通流量预测应用中，预测出交通流量的有效变化情况，可以辅助交通流量的管理人员对当前交通流量情况提供参考和安全风险评估。

Description

一种基于时空序列深度学习的交通流量预测方法及装置

技术领域

本发明涉及一种基于时空序列深度学习的交通流量预测方法及装置，属于时空序列的深度学习预测技术领域。

背景技术

在最近的几十年里，随着全球化和经济的步伐加快，越来越多的车辆开始行驶在了道路上，给交通系统的管理带来了巨大的压力，也对于交通系统的安全性、高效性和方便性有了更高的要求。伴随着经济实惠的交通传感器技术的不断应用，电脑元器件存储技术价格的下降，人们能够收集到爆炸式的交通流量数据，这些数据促使着智能交通系统和智慧城市的不断发展。同时，智能交通系统的诞生能够更好的解决交通拥堵、出行路线规划、道路健康检查、管理突发公共安全事件等问题，提高交通资源的利用率，使得智慧城市建造规划，城市居民生活出行质量得到提高。因此对于特定时期的交通流量的长期时空列预测有着十分重要的意义。

从人工智能的历史来看待，伴随着从传统的机器学习方法向深度学习的不断迈进，交通流量时空列预测也由这种方式不断改进。

一开始，基于统计和神经网络的相关模型被首次应用在了交通流预测领域。参考文献“Real-time road traffic prediction with spatio-temporal correlations,”(W.Min and L.Wynter,T ransp.Res.Part C Emerg.T echnol.,vol.19,no.4,pp.606–616,Aug.2011.)和参考文献“New bayesian combination method for short-termtraffic flow forecasting,”(J.Wang,W.Deng,and Y.Guo,T ransp.Res.Part CEmerg.Technol.,vol.43,pp.79–94,Jun.2014)利用统计模型回归综合移动平均(ARIMA)和贝叶斯网络从概率的角度出发，对空间有关的依赖性进行建模，但是这些模型有着高度的线性性质，阻碍了有效地模拟交通流内部的高度非线性，而且其内部结构计算量大，占用内存。

相较于传统的机器学习方法，深度学习能够更好的发掘出深层信息，提高模型整体的高度非线性。参考文献“Learning traffic as images:A deep convolutionalneural network for large-scale transportation network speed pre-diction,”(X.Ma et al.,Sensors,vol.17,no.4,p.818,Apr.2017.)采用CNN(卷积神经网络)提取交通网络转换为规则网格的空间特征，由于其强大的特征提取能力，能够较好的发掘出空间的关联关系，然而固有的网格转换导致了不规则交通网络固有拓扑信息的丢失。参考文献“Diffusion-convolutional neural net-works,”(J.Atwood and D.Towsley,inAdv.Neural Inf.Process.Syst.29,Barcelona,Spain,Dec.2016,pp.1993–2001.)采用图卷积网络(GCN)将经典的卷积网络推广到图域和频域范围，从图信号的角度入手，进而将深度学习推广到非欧几里得域，更加有效的读取空间信息。参考文献“Graph wavenet fordeep spatial-temporal graph modeling,”(Z.Wu,S.Pan,G.Long,J.Jiang,and C.Zhang,in Proc.28th Int.Joint Conf.Artif.Intell.,Macao,China,Aug.2019,pp.1907–1913.)提出了一种Graph WaveNet模型，利用图卷积网络和TCN(时间卷积网络)对每个节点进行可学习的嵌入，提高了隐藏空间模式的交通预测的准确性。但是一旦训练，它们的空间依赖关系仍然是固定的。

参考文献“Long short-term memory neural network for traffic speedprediction using remote microwave sensor data,”(X.Ma,Z.Tao,Y.Wang,H.Yu,andY.Wang,T ransp.Res.Part C Emerg.T echnol.,vol.54,pp.187–197,May 2015.)指出了在传统的RNN网络中，建模时间依赖性方面受到限制。参考文献“Long short-termmemory”(S.Hochreiter and J.Schmidhuber,Neural Comput.,vol.9,no.8,pp.1735–1780,Nov.1997)提出了LSTM用以改善RNN的不足，有利于跨越多个时间点，形成长期的记忆单元，但是仍然存在耗时的训练过程和建模长期可扩展性有限的问题。参考文献“Attention isall you need,”(A.Vaswani et al.,in Adv.Neural Inf.Process.Syst.30,Long Beach,CA,USA,Dec.2017,pp.5998–6008.)采用注意力机制的架构，实现高效的序列学习。在一层中，可以自适应地从不同长度的输入序列中捕获长期时变依赖关系。

综上所述，现有的预测模型因为时空数据的未来时间不确定性，模型泛化能力不高，对于时间维度和空间维度二者学习方向的刻画不充分，在实际应用中存在预测精度低、鲁棒性不强、适应性不好等缺点。

发明内容

为了克服现有技术中存在的缺陷，本发明旨在提供一种基于时空序列深度学习的交通流量预测方法及装置。

本发明解决上述技术问题所提供的技术方案是：一种基于时空序列深度学习的交通流量预测方法，包括：

获取道路形状以及道路的交通流量历史数据；

对交通流量历史数据按照相关的时间关联顺序进行预处理，并按照批的形式进一步整理为张量的形式，构建交通流量历史数据的多变量时空序列数据集；

将多变量时空序列数据集划分为训练数据集、验证数据集和测试数据集，并将其中的数据按照样本的每个属性进行标准化；

构建交通流量预测模型；所述交通流量预测模型包括卷积网络层、时间卷积网络层、spaceblock块层、Layer Norm层、时间卷积网络层、Layer Norm层、两个卷积层，所述时间卷积网络层由时间Embedding层、时间MLP层、空洞卷积层和GRN层构成，所述space block块层由3部分组成，第一部分为基于切比雪夫公式的自适应图卷积网络层，第二部分为基于自注意力机制的多头attention层，第三部分为过滤信息的GRN层；

利用训练数据集对交通流量预测模型进行训练；

采集当前时刻的交通流量数据，将采集的当前时刻的交通流量数据输入训练好的交通流量预测模型，预测未来时刻的时序值。

进一步的技术方案是，所述交通流量历史数据通过交通站点感应器获取。

进一步的技术方案是，所述预处理包括异常值和缺失值的差错补齐。

进一步的技术方案是，所述标准化的方式是按照每个样本属性求出均值μ和方差σ，按照Z-score公式进行计算得到新的数据集x'。

进一步的技术方案是，所述交通流量预测模型的训练步骤包络：

将训练数据集作为输入，输入到交通流量预测模型内进行预测；

设置损失函数Loss对交通流量预测模型进行迭代更新训练，直至训练条件终止，生成训练好的交通流量预测模型，可用于预测未来时刻的时序值。

进一步的技术方案是，将训练数据集作为输入，输入到交通流量预测模型内进行预测包括：

S1、将训练数据集输入一个卷积核为1×1，通道数为embed_size的卷积网络层，丰富输入张量语义；

S2、将数据输入时间卷积网络层，得到有关于时间的隐藏状；

S21、将特有的时间信息经过时间Embedding层和输入数据相加，增强时间信息；

S22、利用时间MLP层对时间维度进行扩维，利于后续扩散卷积的操作，再将结果输入到扩散卷积层中；

S23、将得到的结果输入到GRN层中，过滤无用信息；

S24、重复步骤S22-S23，并将每次步骤S22输出的结果做一次卷积并累加；

S25、将步骤S24的结果和步骤S22的结果相加并通过一个LayerNorm层，得到时间卷积网络层的整体输出；

S3、将数据输入到一个构建的spaceblock块层；

S31、将邻接矩阵标准化后同输入数据一起输入自适应图卷积网络层；

S32、输入一个GRN网络层；

S33、输入基于自注意力机制的多头attention层并将步骤S32的结果和输出相加相继输入到一个LayerNorm层和Dropout层；

S34、再次输入到另一个GRN网络层，并将步骤S31的结果和输出相加相继输入到一个LayerNorm层和Dropout层；

S4、多次重复步骤S2，并重复用Relu函数激活；

S5、将步骤S3的结果和步骤S2的结果相加输入到一个LayerNorm层；

S6、再次输入到一个时间卷积网络层，并将步骤S1的结果和输出项加入到一个LayerNorm层；

S7、重复步骤S2-S6，并重复用Relu函数激活；

S8、将得到的数据结果送入两个卷积层达到降维和减少样本属性的效果。进一步的技术方案是，邻接矩阵标准化公式为：

D_ii＝∑_iA_ijfor i＝1,....,N

式中：A表示开始的邻接矩阵，D表示对角矩阵；I_N表示长度为N的单位方阵；λ_MAX表示A矩阵中的最大特征值。

进一步的技术方案是，所述两个卷积层的设计方案为：

其内部的卷积是一个卷积核为1×1，将时间维度看做通道数的卷积，用以得到需要的输出时间窗口维度；

外部的卷积也是一个卷积核为1×1，将属性维度看做通道数，用以还原及预测未来值的卷积。

一种电子设备，包括至少一个处理器，以及与所述至少一个处理器通信连接的存储器；所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的一种基于时空序列深度学习的交通流量预测方法。

一种基于交通流量收集与深度学习的交通处理器流量决策装置，包括：

交通流量感应收集模块，用于收集交通流量预测的相关信息，利用低价的存储技术和高效的收集装置，收集例如车辆拥塞流量、道路形状或者平均车速等因素；

信息流动处理模块，用于对平均车速等交通相关流量信息和道路形状及行驶路线信息进行预处理和信息预测及融合；

流量预测模型，用于基于一种基于时空序列深度学习的交通流量预测方法来预测未来时刻的时序值；

决策执行模块，根据处理后的信息及相关的预测值，做出交流方面限流或者维护道路等多种决策。

本发明具有以下有益效果：

一、本发明将各种交通流量和道路形状、行驶路线作为输入，能够获取整个城市交通的必要信息，做出考虑地面交通重要低端交通管控的决策，使得决策能够在保证交通安全间隔的同时，高效地规划出行路线，充分利用交通道路资源；

二、提出了时间卷积网层(TCNx)，利用其中的扩散卷积模块，能够在有限的层数内提高对于时间序列跨度的感知范围，利用其中的GRN(门控剩余网络)在较少的迭代次数下感知出时间信息的内在联系，减少错误信息的学习，提高对于不同时间段的区分，有效的筛选出和学习出有效信息；

三、提出了自适应的图卷积学习，能够在原本图卷积的基础之上，感知原本邻接矩阵之外的信息，学习出一个不一样的邻接矩阵表达，通过层数的堆叠，能够深层次的发掘出有关于空间维度的内在联系，提高模型的预测水平，利于长期的时间序列的跨越预测。在拓扑图的基础之上，发掘出有用的空间信息；

四、提出了spaceblock块层网络，能够在自适应的图卷积学习之上，更加有效的发掘出有效信息，提高整体模型的欠拟合，加强模型整体的训练强度，利用自注意力机制，提高特征维度，特别是空间维度之上的有效学习，发掘出数据相互之间的关联关系，聚合出原本数据没有的新的学习表达，增强模型整体的表达和应用能力；

五、实验表明，该发明能够在实际的交通流量预测应用中，预测出交通流量的有效变化情况，可以辅助交通流量的管理人员对当前交通流量情况提供参考和安全风险评估。

附图说明

图1是整体发明方法的流程示意图；

图2是本方法的模型设计架构图；

图3是对于模型当中TCNx模块的解释图；

图4是对GRN模块的原理解释图；

图5是对多头注意力机制的解释图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的一种基于时空序列深度学习的交通流量预测方法，包括：

步骤S1、获取交通站点利用感应器所收集的交通数据，获取需要预测道路的形状；

步骤S2、对交通流量历史数据按照相关的时间关联顺序进行预处理，并按照批的形式进一步整理为张量的形式，构建交通流量数据的多变量时空序列数据集；

对收集到的数据进行异常值和缺失值的差错补齐，每条数据按照历史1小时的记录来预测未来1小时的输出，批量的大小设置为50来表示张量。

步骤S3、将多变量时空序列数据集划分为训练数据集、验证数据集和测试数据集，并将其中的数据按照样本的每个属性进行标准化；

将数据集x按照7:2:1的比例划分训练集、验证集和测试集，标准化的方式是按照每个样本属性求出均值μ和方差σ，按照Z-score公式进行计算得到新的数据集x'：

将训练集输入交通流量预测模型通过以下步骤进行预测，获得预测值；

步骤S4、将此多变量时空序列数据集输入一个卷积核为1×1，通道数为embed_size的卷积网络层，丰富输入张量语义；

步骤S5、将数据输入TCNx(时间卷积网络层)，得到有关于时间的隐藏状态。TCNx层由时间Embedding层、时间MLP层、空洞卷积层和GRN层构成；

步骤S51、将特有的时间信息经过Embbeding和输入数据相加，增强时间信息；

对于Embbeding层，是将一个t∈R^T由{0,1，…,T-1}构建的向量输入到Embbeding网络层中，得到一个t'∈R^T×C的张量，其中C表示属性数或者通道数，最后广播得到t”∈R^B ^×N×T×C，B表示批的数量，N表示邻接矩阵的节点数；

步骤S52、利用时间MLP层对时间维度进行扩维，利于后续扩散卷积的操作，再将结果输入扩散卷积层中；

所述步骤中的一次扩散卷积F公式在1-D的序列上为：

在本式中：X∈R^T表示输入的数据；f∈R^k表示一个卷积核；f(t)表示在第t个时间点的卷积核参数；X(i)表示在第i个位置上X的值；d表示扩散卷积的扩散因子；k表示卷积核的整体大小；

扩散因果卷积的整体公式为：

h＝tanh(Θ₁＊X+b)⊙σ(Θ₂＊X+c)

在本式中：tanh表示tanh激活函数；σ表示sigmoid激活函数；Θ₁、Θ₂、b、c都表示模型需要学习的参数；Θ＊X表示在4-D序列上所做的扩散卷积操作；⊙表示哈达玛积；

步骤S53、将得到的结果h输入到GRN(门控剩余网络)层中，过滤无用信息；

步骤中所提到的GRN网络表示的整体公式如下：

GRN(a)＝Dropout(LayerNorm(a+GLU(η₁)))

η₁＝W₁η₂+b₁

η₂＝ELU(W₂a+b₂)

GLU(γ)＝σ(W₃γ+b₃)⊙(W₄γ+b₄)

在本式中：a和γ分别表示各自网络的输入；W₁、W₂、W₃、W₄、b₁、b₂、b₃、b₄表示网络模型需要学习的参数；⊙表示哈达玛积；ELU表示ELU激活函数；

步骤S54、重复步骤S52～S53，并将每次S52输出的结果做一次卷积核为1×1的卷积并累加；

步骤S55、将步骤S54的结果和步骤S52的结果相加并通过一个LayerNorm层，得到TCNx层的整体输出；

步骤S6、将数据输入到一个构建的spaceblock块层，主要由3部分组成，第一部分为基于切比雪夫公式的自适应图卷积网络层，第二部分为基于自注意力机制的多头attention层，第三部分为过滤信息的GRN层。

步骤S61、将邻接矩阵标准化后同输入数据一起输入自适应图卷积网络层；

其中，邻接矩阵标准化公式如下：

D_ii＝∑_iA_ijfor i＝1,....,N

在上述的式子中：A表示开始的邻接矩阵，D表示对角矩阵；I_N表示长度为N的单位方阵；λ_MAX表示A矩阵中的最大特征值；

自适应的图卷积网络层公式如下：

切比雪夫多项式为：

T₀(x)＝1

T₁(x)＝x

T_n(x)＝2xT_n-1-T_n-2

图卷积的公式为：

在式中：Θ_i表示所要学习的参数；

而自适应体现在，输入图卷积网络的中的矩阵不单单是/>还要多加上一个需要学习的自适应邻接矩阵，公式如下：

其中：E₁,E₂∈R^N×C，C表示需要学习的参数大小；

步骤S62、输入一个GRN网络层；

步骤S63、输入基于自注意力机制的多头attention层并将S62的结果和输出相加相继输入到一个LayerNorm层和Dropout层；

步骤S63的多头自注意力机制层公式表示如下：

注意力机制的公式为：

在本式中：Q、K、V表示不同的张量，d_k表示K的属性维度大小；

MlutiHead(Q,K,V)＝Concat(head₁,…,head_h)W^o

where head_i＝Attention(QW_i ^Q,KW_i ^K,VW_i ^V)

在上述的式子中：而/>都表示需要学习的参数，Concat表示将向量拼接起来，自注意力表示在输入时，K＝Q＝V＝X

步骤S64、再次输入到另一个GRN网络层，并将S61的结果和输出相加相继输入到一个LayerNorm层和Dropout层；

步骤S7、多次重复步骤S6，并重复用Relu函数激活；

步骤S8、将步骤S6的结果和步骤S5的结果相加输入到一个LayerNorm层；

步骤S9、再次输入到一个TCNx层，并将S3的结果和输出项加入到一个LayerNorm层；

步骤S10、重复步骤S5～步骤S9，并重复用Relu函数激活；

步骤S11、将得到的数据结果送入2个设计好的卷积层达到降维和减少样本属性的效果；

2个卷积层设计方案为：

内部的卷积是一个卷积核为1×1，将时间维度看做通道数的卷积，用以得到需要的输出时间窗口维度；

外部的卷积也是一个卷积核为1×1，将属性维度看做通道数，用以还原及预测未来值的卷积；

步骤S12、设置好相关的损失函数Loss对预测模型进行迭代更新训练，直至训练条件终止，生成训练好的预测模型，可用于预测未来时刻的时序值；

其中损失函数设置为MSE，公式如下：

其中：n表示样本的个数，表示预测值，Y_i表示真实值；

步骤S13、采集当前时刻的交通流量数据，将采集的当前时刻的交通流量数据输入训练好的交通流量预测模型，预测未来时刻的时序值。

在步骤S12中，验证集的评价指标也被设置为了MSE且采用Adam优化器来训练，学习率设置为1e-3，权重衰减设置为1e-3。

仿真实验

为了验证一种基于时空序列深度学习的交通流量预测方法的有效性，进行了基于真实数据集的多变量时空序列预测实验。实验环境采用Python开发语言和PyTorch深度学习框架。除此之外，本方法将与HA、ARIMA、LSVR、FNN、FC-LSTM、DCRNN、STGCN、GraphWaveNet、STTN的方法进行比较，上述方法的简单说明如下：

HA：历史平均，将交通流量建模为季节过程，并使用前几个季节的加权平均作为预测，是时间序列预测的经典方法。

ARIMA：带卡尔曼滤波的自回归综合移动平均模型，是传统机器学习领域时间序列预测的经典方法，广泛应用于时间序列预测。

LSVR：线性支持向量机回归，传统的机器学习任务，使用线性支持向量机进行回归任务，在支持向量机流行的日期有着广泛的应用。

FNN：具有两层隐藏层和L2正则化的前馈神经网络。

FC-LSTM：具有全连接LSTM隐藏单元的递归神经网络(FC-LSTM)。

DCRNN：DCRNN采用双向随机游走和编解码器的空间依赖关系，并采用调度算法。

Graph WaveNet：Graph WaveNet在图卷积中加入自适应邻接矩阵，并采用空洞扩散卷积结构提取有效信息。

STTN：STTN基于时间模型学习和空间模型学习两个方向的模块设计，具体采用注意力机制为主要架构，提取出长期学习的有效价值。

将RMSE、RAE和MAPE作为模型误差的分析指标，用于评估各种方法的预测性能，误差指标的计算公式如下所示：

相对平方根误差：

其中：n表示样本的个数，表示预测值，Y_i表示真实值；

相对绝对误差：

其中：n表示样本的个数，表示预测值，Y_i表示真实值；

平均绝对百分比误差：

其中：n表示样本的个数，表示预测值，Y_i表示真实值；

实施例一

本实验数据来源于2012年5月至6月，加利福尼亚州高速公路系统228个传感器站工作日的PeMSD7(M)交通数据集。该数据集以5分钟为采样频率，包含了交通速度一个特征信息。用历史1小时窗口的数据预测未来1小时数据。并选取第15分钟，第30分钟，第45分钟的数据进行比较。采用RMSE、RAE和MAPE评价指标，实验结果如表1所示。

表1

以上所述，并非对本发明作任何形式上的限制，虽然本发明已通过上述实施例揭示，然而并非用以限定本发明，任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内，可利用上述揭示的技术内容作出些变动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种基于时空序列深度学习的交通流量预测方法，其特征在于，包括：

获取道路形状以及道路的交通流量历史数据；

利用训练数据集对交通流量预测模型进行训练；

2.根据权利要求1所述的一种基于时空序列深度学习的交通流量预测方法，其特征在于，所述交通流量历史数据通过交通站点感应器获取。

3.根据权利要求1所述的一种基于时空序列深度学习的交通流量预测方法，其特征在于，所述预处理包括异常值和缺失值的差错补齐。

4.根据权利要求1所述的一种基于时空序列深度学习的交通流量预测方法，其特征在于，所述标准化的方式是按照每个样本属性求出均值μ和方差σ，按照Z-score公式进行计算得到新的数据集x'。

5.根据权利要求1所述的一种基于时空序列深度学习的交通流量预测方法，其特征在于，所述交通流量预测模型的训练步骤包络：

6.根据权利要求5所述的一种基于时空序列深度学习的交通流量预测方法，其特征在于，将训练数据集作为输入，输入到交通流量预测模型内进行预测包括：

S23、将得到的结果输入到GRN层中，过滤无用信息；

S3、将数据输入到一个构建的spaceblock块层；

S32、输入一个GRN网络层；

S4、多次重复步骤S2，并重复用Relu函数激活；

S7、重复步骤S2-S6，并重复用Relu函数激活；

S8、将得到的数据结果送入两个卷积层达到降维和减少样本属性的效果。

7.根据权利要求6所述的一种基于时空序列深度学习的交通流量预测方法，其特征在于，邻接矩阵标准化公式为：

D_ii＝∑_iA_ijfor i＝1,....,N

8.根据权利要求6所述的一种基于时空序列深度学习的交通流量预测方法，其特征在于，所述两个卷积层的设计方案为：

9.一种电子设备，其特征在于，包括至少一个处理器，以及与所述至少一个处理器通信连接的存储器；所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至8中任一项所述的一种基于时空序列深度学习的交通流量预测方法。

10.一种基于交通流量收集与深度学习的交通处理器流量决策装置，其特征在于，包括：

流量预测模型，用于基于权利要求1-8任一项所述的一种基于时空序列深度学习的交通流量预测方法来预测未来时刻的时序值；