CN116895157A

CN116895157A - 一种基于趋势时空图卷积的交通流量预测方法、系统及介质

Info

Publication number: CN116895157A
Application number: CN202310986221.XA
Authority: CN
Inventors: 宗欣露; 余帆; 王春枝; 叶志伟; 刘伟; 陈宏伟; 严灵毓; 徐慧
Original assignee: Hubei University of Technology
Current assignee: Hubei University of Technology
Priority date: 2023-08-07
Filing date: 2023-08-07
Publication date: 2023-10-17

Abstract

本发明属于交通流量预测技术领域，公开了一种基于趋势时空图卷积的交通流量预测方法、系统及介质，首先，编码器将时间自注意力和因果卷积相结合，捕获交通流量的长期和短期趋势时间依赖；再通过图卷积网络和门控循环神经网络融合，捕捉局部空间相关性和动态时空相关性；其次基于编码器提取的时间和空间特征，通过时空交互模块来模拟时空异质性；接着解码器与编码器类的是学习交通流量的时空特征；最后基于编码‑解码器提取到的时空特征，利用时间编码解码注意力来拟合历史交通流量对未来预测的影响，用来解决基于Transformer模型的交通流量预测模型的性能问题。本发明在真实世界的数据集上进行实验，取得了良好的实验结果。

Description

一种基于趋势时空图卷积的交通流量预测方法、系统及介质

技术领域

本发明属于交通流量预测技术领域，尤其涉及一种基于趋势时空图卷积的交通流量预测方法。

背景技术

不断发展的交通基础设施和不断变化的人们的出行需求，要求对交通资源进行有效优化和高效配置。解决这些问题的必要性体现在智能交通系统(Intelligent TrafficSystem，简称ITS)领域。智能交通系统的两个核心支柱：智能交通基础设施和数据分析算法，设备例如传感器来收集大量的交通数据，而后者则是将交通数据转化为有用的信息。交通流量预测是智能交通系统的基础任务之一，通过交通流量大数据预测地区未来的交通量，从而使社区管理者能够对交通调度和流动进行更好的管理，同时准确的交通流量预测能够预测出某个时间段的区域交通情况，对人们带来出行上的便利，通过预测做出交通决策是一种简洁高效解决交通拥堵的方案。

交通流量预测方法根据历史交通流量数据创建预测模型，预测未来一段时间的交通流量状态，但交通流量通常是非线性和不确定性的，是一种时序信息预测，且随着交通流量数据的增长，预测的复杂度也在上升。对于交通流量数据来说，因为交通网络拓扑图，使得交通流量预测不仅仅是时序预测，还有着时空异质性。在空间相关性建模，图卷积网路(GCN)能够聚合拓扑图中节点和邻近节点的特征，被用于提取交通道路网络的空间特征，但并不是所有节点仅仅受附近节点的影响，也不是所有的附近节点都会有影响，这意味着节点之间的依赖关系是非局部的，而且不同的时间的附近节点影响也是不同的，说明节点之间存在时空异质性，利用门控循环单元(GRU)来拟合时空异质性更符合真实的交通流量，尽管在处理局部时空依赖有着良好的性能，但是忽略了全局的特征。在时空建模，基于Transformer的多头时间注意力学习全局的时间依赖，但是Transformer长的序列相关性学习会丢失局部时序信息和短期趋势性的关联。

通过上述分析，现有技术存在的问题及缺陷为：

(1)基于Transformer的交通预测方法在捕获空间依赖上面表现不好，其中的多头注意力没有考虑到交通网络的拓扑图结构，在关注空间依赖性贡献很少。

(2)用于预测交通流量的Transformer在时序依赖上时间自注意力关注的是单个节点对之间的相关性，而没有考虑交通流量的短期趋势性，从而忽略了短期趋势的交通变化对未来交通状况的影响。

(3)传统的Transformer在时间特征和空间特征提取采取串联或相加提取时空异质性特征，简单的串联和相加难以模拟真实交通流量，从而降低了交通流量预测的能力。

发明内容

针对现有技术存在的问题，本发明提供了一种基于趋势时空图卷积的交通流量预测方法。

本发明是这样实现的，一种基于趋势时空图卷积的交通流量预测方法，基于趋势时空图卷积的交通流量预测方法主要创新在于融合时间和空间嵌入层来增强交通数据的特征，结合时间自注意力与因果卷积为交通流量序列的长短期依赖提供深入的建模，并利用图卷积网络与门控循环神经网络动态地捕获空间依赖。此外，该方法还通过时空交互模块模拟了时空异质性，并在编码-解码结构中嵌入了注意力机制和前馈神经网络，以准确地预测未来交通流量，确保历史数据对未来预测的有效影响。

进一步，包括如下步骤：

S1：使用时间和空间嵌入层来增强输入交通流量数据的特征X，时间和空间嵌入有节点的相对位置嵌入和时间嵌入构成；

S2：利用各层编码器中的时间自注意力和因果卷积的结合模块对输入交通流量序列的长期和短期趋势时间依赖进行建模，利用图卷积网络和门控循环神经网络的融合提取局部空间依赖和动态时空相关性，前者是时间特征提取模块，后者是空间特征提取模块；

S3：利用各层编码器中提取到的时间和空间特征，通过时空交互模块来模拟时空异质性；

S4：使用各层编码器中的基于RELU激活函数和全连接层组合的前馈神经网络来拟合历史时空特征提取模块捕获的时空特征，输出历史序列的时空特征；

S5：与编码器类似，解码器各层中利用时间和空间嵌入来增强输入的未来交通流量数据的特征；

S6：与编码器类似，解码器各层中使用时空特征提取模块来捕获输入交通流量数据的时空特征；

S7：基于解码器捕获到的时空特征，利用时间编码解码注意力来提取各层编码器的历史时空特征和解码器的未来时空特征，构建历史交通流量对未来交通流量的相关性，预测未来交通流量，模拟了每个历史时间的交通流量特征对未来交通流量的交互影响；

S8：与编码器类似，解码器各层中使用前馈神经网络来拟合编码器和解码时空特征，并输出得到的未来交通流量预测。

进一步，S1采用的时间空间嵌入具体包括：

S101：通过相对位置编码嵌入得到序列的顺序信息X_PE＝X+PE_pos，表达式为：

其中X为特征向量输入，pos为特征矩阵的节点位置，d_model为特征矩阵映射到多头注意力空间中的维度大小，i为节点属性在时序中的位置，sin和cos分别是正弦和余弦函数；

S102：通过对交通网络拓扑图的邻接矩阵进行拉普拉斯归一化，再进行线性变化，得到高阶的邻接矩阵的嵌入信息，用来得到空间依赖X_S：

S103：将时间和空间嵌入信息融合到输入的历史交通流量数据，可以表示为：

其中P表示时间步长，N表示节点数，d表示特征维度。

进一步，S2具体包括：

S201：时间自注意力负责关注历史时间序列的每个节点的长期时间依赖，将时空数据映射到高维的查询、键、值矩阵；并通过缩放点积，更新节点的特征表示，捕获全局长期的时间依赖；

S202：因果卷积挖掘相邻时间序列的局部时间依赖，得到短期趋势时间依赖，并通过和时间自注意力相融合得到卷子自注意力，用来学习长期和短期趋势时间依赖；

S203：图卷积网络用来聚合相邻节点的空间依赖，得到局部空间依赖；

S204：门控循环神经网络用来更新节点之间的空间依赖，并且通过门控机制得到循环的时序信息，使图卷积网络得到的空间依赖具有动态时空相关性。

进一步，S201具体包括：在第一层编码器中，将S1中得到的用线性变化为高维的值矩阵V，可表示为：

其中W^V为权重参数。

进一步，S202具体包括：

S211：首先，在第一层编码器中，将步骤S1中得到的用因果卷积得到卷积聚合的结果，在通过线性变化为高维的查询矩阵Q，键矩阵K，可表示为：

其中Φ^Q,Φ^K为卷积核的参数；

S212：然后将时间自注意力和因果卷积进行缩放点积，计算长期和短期趋势的时间注意力分数，相关公式如下：

d_k＝d_model/S；

其中，W¹,W^V为权重参数矩阵，Φ^Q,Φ^K为卷积核的参数，S为多头自注意力中的头的数量，||为多头之间的连接，d_k为每个子空间的特征维度；

S213：最后将卷积自注意力的输出进行正则化残差连接：

其中，LayerNorm为层特征归一化函数。

进一步，S203具体包括：在第一层编码器中，将S1中得到的和邻接矩阵A用图卷积聚合相邻节点的空间依赖，相关公式如下：

F(X,A)＝σ(AXW₀)

其中W₀为权重参数矩阵，σ为sigmoid激活函数。

进一步，S204具体包括：将步骤S203得到的F(X,A)通过门控机制得到循环的时序信息，使图卷积网络得到的空间依赖具有动态时空相关性，相关公式如下：

其中，u_t为t时刻的更新门状态，r_t为t时刻的重置门状态，C_t为t时刻的候选隐藏层状态，W_u,W_r,W_C为权重参数矩阵，b_u,b_r,b_C为偏置系数，[]为矩阵连接，H_t-1为t-1时刻的输出，tanh为激活函数，σ为sigmoid激活函数。

进一步，S3具体包括：

S301：利用各层编码器中提取到的时间特征X^l和空间特征H_t获得交互门，相关公式如下：

g＝σ(X_tW_l+H_tW_t+b)

其中σ为sigmoid函数，X_t,H_t分别为步骤S2.2.3和步骤S2.4的输出，W_l,W_t为参数权重，b为偏置系数；

S302：利用S301得到的交互门，融合交互信息得到编码层的输出，相关公式如下：

X_en＝g⊙X_t+(1-g)⊙H_t

其中⊙代表矩阵乘积。

进一步，S7具体包括：

S701：首先利用编码层的输出X_en通过线性转化为高阶的编码器的键矩阵en_K和值矩阵en_V，得到历史交通流量的时空特征；

S702：然后利用时空特征模块和时空交互模块得到解码器的输出；

S703：最后在将解码器的输出进行线性变化为高阶的查询矩阵de_Q，并于en_K和en_V进行缩放点积计算，构建历史交通流量对未来交通流量的相关性，预测未来交通流量，模拟了每个历史时间的交通流量特征对未来交通流量的交互影响，相关公式如下：

其中X_de为解码器的输出。

进一步，S8具体包括：

将时间编码解码注意力输出的隐藏表示经过前馈网络变化，过程如下：

FFN(X_de)＝W₂ReLU(W₁X_de+b₁)+b₂

其中，W₁,W₂为可学习的参数权重矩阵，b₁,b₂为偏置系数，ReLU为激活函数；

如此循环迭代下去，得到解码器的最终输出并通过线性转化为/>通过平均绝对误差(MAE)作为损失函数。

本发明的另一目的在于提供一种计算机设备，计算机设备包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行所述的基于趋势时空图卷积的交通流量预测方法的步骤。

本发明的另一目的在于提供一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行所述的基于趋势时空图卷积的交通流量预测方法的步骤。

本发明提供的交通流量预测方法采用了多种技术组合，包括时空嵌入、时间自注意力、因果卷积、图卷积网络和门控循环神经网络等。以下是对应的系统模块：

1)时空嵌入模块:

从交通数据中提取时间和空间的特征。

使用相对位置编码嵌入得到序列的顺序信息。

通过交通网络的邻接矩阵得到空间嵌入信息。

结合时间和空间嵌入信息。

2)时间特征提取模块:

利用时间自注意力捕获长期时间依赖性。

结合因果卷积捕获短期时间依赖性。

融合长短期时间特性。

3)空间特征提取模块:

使用图卷积网络聚合邻近节点的空间信息。

门控循环神经网络更新节点之间的时空相关性。

4)时空交互模块:

利用提取到的时间和空间特征来模拟时空异质性。

5)前馈神经网络模块:

用于拟合历史和预测时空特征。

6)编码器-解码器结构:

编码器用于捕获历史交通流量数据的时空特征。

解码器利用编码器提取的特征和解码器本身提取的未来特征来预测未来的交通流量。

7)注意力机制模块:

在解码器中，利用时间编码解码注意力提取编码器的历史时空特征和解码器的未来时空特征。

为了实现上述方法，你可能需要设计和实现以下几个主要部分：

-数据预处理和特征工程：整理和清洗交通流量数据，并从中提取有助于模型训练的特征。

-模型设计：设计上述描述中的各种模块并组合在一起。

-模型训练和优化：使用历史交通流量数据训练模型，并进行优化。

-模型评估：在验证集和测试集上评估模型的性能。

-预测和应用：使用模型预测未来的交通流量。

结合上述的技术方案和解决的技术问题，本发明所要保护的技术方案所具备的优点及积极效果为：

第一，本发明提出一种基于趋势时空图卷积的交通流量预测方法，传统的Transformer的交通预测方法使用多头自注意力机制没有考虑到交通网络的拓扑图结构，在捕获空间依赖上面表现不好。本模型结合图卷积和门控循环神经网络，捕捉局部空间相关性和动态时空相关性，通过与现有技术比较，结果显示本模型在各项性能上得到了不错的提升，验证了本模型的优越性

本发明使用Transformer网络对交通流量时序信息进行并行化的长期依赖提取，与传统的Transformer的时间自注意力相比，本模型结合因果卷积，根据交通流量的特性具有的趋势特性，捕获长期和短期趋势时间依赖，通过与现有技术比较，结果表示本模型有效的拟合了交通流量数据的时间特征。

本发明将时间和空间两个方面的特征输出了交互模块中，通过交互模块可将复杂的空间拓扑结构和时序依赖进行有效融合，相较其他的时空融合模型有更强的特征融合能力，与其他模型实验对比，具有更低的预测误差和更高的预测准确率。

本发明提出一种基于趋势时空图卷积的交通流量预测方法，提出的时间自注意力和因果卷积的结合可以有效的学习交通流量的长期时间依赖和特有的短期趋势性，利用图卷积和门口循环神经网络来模拟有效的空间相关性，并且使用交互模块来进行有效的时空融合，通过在两个真实的交通流量数据集上证明了本发明的有效性。

第二，本发明提供的一种基于趋势时空图卷积的交通流量预测方法，可以部署到导航软件中帮助人们制定更加高效合理的出行方案，将极大的提高交通流量预测的准确性、大大的增加人们的出行效率和降低管理成本。

第三，每条权利要求总结其带来的显著的技术进步：

1.权利要求1：

整体框架设计：提供了一个完整且详细的交通流量预测流程，涵盖了从数据的输入、特征的提取到最终预测输出的每一个关键步骤。

融合时间和空间特性：强调了时间和空间嵌入在交通流量预测中的核心作用，确保模型能够充分理解交通流量在时空上的变化趋势。

2.权利要求2(S1)：

时间空间嵌入：通过节点的相对位置嵌入和时间嵌入来强化输入特征，确保模型捕获了趋势中的每一个细微变化。

提取序列顺序信息：特别关注了序列的顺序信息，使得模型对时间序列中的前后关系有更强的感知。

3.权利要求3(S2)：

时间自注意力与因果卷积：创新性地结合了时间自注意力与因果卷积，不仅关注了全局的长期时间依赖，还关注了局部的短期时间依赖。

图卷积网络与门控循环神经网络的融合：通过这种结合，模型不仅聚合了空间上的邻近信息，还可以动态地更新这些信息，使得预测更加准确。

4.权利要求4(S201)：

高维值矩阵的线性变化：使模型在提取特征时有更大的表示能力，从而更好地捕获和理解输入数据中的各种复杂模式。

这些权利要求的技术进步突出了如何结合和优化多种先进的深度学习技术，为交通流量预测提供了一个更加精确和高效的方法。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图做简单的介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的基于趋势时空图卷积的交通流量预测方法流程图；

图2是本发明实施例提供的编码-解码器中的时空交互模块示意图；其中，表表示输入的时间特征，/>表示输入的空间特征，/>表示提取到的时空异质性特征，σ表示sigmoid激活函数；

图3是本发明实施例提供的编码-解码器中的时空特征提取模块示意图；其中，表示输入，/>表表示提取到的时间特征，/>表示提取到的空间特征；

图4是本发明实施例提供的解码器中的时间编码解码注意力模块示意图；其中Q,K,V表示趋势图卷积变化的特征，softmax表示归一化处理；

图5是本发明实施例提供的势时空图卷积的交通流量预测方法(DGCNT)的模型总体框架图；

图6是本发明实施例提供的本发明提出的方法与MGT模型在HZMetro数据集上的实验数据对比图；其中，(a)HZMetro RMSE，(b)HZMetro MAE，(c)HZMetro MAPE。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有技术存在的问题，本发明提供了一种基于趋势时空图卷积的交通流量预测方法，下面结合附图对本发明作详细的描述。

如图1所示，本发明实施例提供的基于趋势时空图卷积的交通流量预测方法，包括如下步骤：

S3：利用各层编码器中提取到的时间和空间特征，通过时空交互模块来模拟时空异质性；如图2所示；

S6：与编码器类似，解码器各层中使用时空特征提取模块来捕获输入交通流量数据的时空特征；如图3所示；

S7：基于解码器捕获到的时空特征，利用时间编码解码注意力来提取各层编码器的历史时空特征和解码器的未来时空特征，构建历史交通流量对未来交通流量的相关性，预测未来交通流量，模拟了每个历史时间的交通流量特征对未来交通流量的交互影响；如图4所示；

图5是本发明实施例提供的势时空图卷积的交通流量预测方法(DGCNT)的模型总体框架图。

S1采用的时间空间嵌入具体包括：

其中P表示时间步长，N表示节点数，d表示特征维度。

S2具体包括：

S201具体包括：在第一层编码器中，将S1中得到的用线性变化为高维的值矩阵V，可表示为：

其中W^V为权重参数。

S202具体包括：

其中Φ^Q,Φ^K为卷积核的参数；

d_k＝d_model/S；

S213：最后将卷积自注意力的输出进行正则化残差连接：

其中，LayerNorm为层特征归一化函数。

S203具体包括：在第一层编码器中，将S1中得到的和邻接矩阵A用图卷积聚合相邻节点的空间依赖，相关公式如下：

F(X,A)＝σ(AXW₀)

其中W₀为权重参数矩阵，σ为sigmoid激活函数。

S204具体包括：将步骤S203得到的F(X,A)通过门控机制得到循环的时序信息，使图卷积网络得到的空间依赖具有动态时空相关性，相关公式如下：

S3具体包括：

g＝σ(X_tW_l+H_tW_t+b)

X_en＝g⊙X_t+(1-g)H_t

其中⊙代表矩阵乘积。

S7具体包括：

其中X_de为解码器的输出。

进一步，S8具体包括：

FFN(X_de)＝W₂ReLU(W₁X_de+b₁)+b₂

本发明的应用实施例提供了一种计算机设备，计算机设备包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行基于趋势时空图卷积的交通流量预测方法的步骤。

本发明的应用实施例提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行基于趋势时空图卷积的交通流量预测方法的步骤。

本实验在计算机程序上的模型参数设置：多头注意力层中的d_model为16，头的数量为4，学习率为0.001，批量大小为8，模型中的隐藏层维度为64，训练批次为100，使用Adam优化器训练模型。

数据集一：HZMetro来自中国杭州地铁系统。日期范围为2019年1月1日至2019年1月25日，关注的时间段为5：30至23：30。交通流量(包括流入和流出)按15分钟的时间间隔进行汇总，一天内共有73个时间间隔，根据周末和节假日为每天创建一个休息日指标，运营的车站数量为80个，所以连通图就是80×80的邻接矩阵。

数据集二：SHMetro该数据集基于中国上海的地铁系统，其日期涵盖2016年7月1日至2016年9月30日的三个月。车站数量为288个，所以邻接矩阵为288×288。

在实验中，输入的数据的值被归一化到[0,1],数据集按照60％，20％，20％划分为训练集，验证集，测试集，使用当前时长节点之前60分钟的数据预测之后15到60分钟的交通流量。

为验证本发明的有效性，将本发明方法与其他模型进行实验对比，通过评价标准做对比，对比结果包括：

表1和表2是本发明实施例方法和各种基线和先进方法在HZMetro和SHMetro数据集上15，30，45和60分钟上平均预测结果对比。可以看出DGCNT在RMSE指标上表现最好，提升了5％左右，更加能够模拟真实的交通流量，其次在HZMetro数据集MAE和MAPE也表现最优，SHMetro的MAE和MAPE分别为最优和次优。

表1HZMetro数据集对比结果

表2 SHMetro数据集对比结果

Methods	RMSE	MAE	MAPE
				FNN	67.76	32.43	23.85
DCRNN	58.69	28.78	21.63
				ASTGCN	56.39	27.37	20.05
STSGCN	55.62	26.23	19.63
				MGT	47.92	23.88	16.97
本发明方法	46.40	23.69	17.38

其中，表中各方法介绍包括：

FNN：前馈神经网络，使用隐藏层的多层感知机进行预测；

DCRNN：扩散卷积递归神经网络，通过将空间依赖性建模为双向图随机游走，提出了一种图卷积运算，扩散卷积，同时捕获空间和时间依赖性进行预测；

ATGNN由文献《Attention Based Spatial-Temporal Graph ConvolutionalNetworks for Traffic Flow Forecasting》提出：基于注意力的时空图神经网络，通过注意力机制捕获空间依赖，用1D卷积考虑局部上下文信息，并对交通流量进行预测；

STSGCN由文献《Spatial-Temporal Synchronous Graph ConvolutionalNetworks:A New Framework for Spatial-Temporal Network Data Forecasting》提出：基于ST块，结合多同步图提取更多的空间特征；

MGT由文献《Meta Graph Transformer:A Novel Framework for Spatial–Temporal Traffic Prediction》提出：使用的传统Transformer框架，自注意力机制提取时间和空间特征，这也是本发明方法主要对比的方法；

其中RMSE：均方根误差；MAE：平均绝对误差；MAPE：平均绝对百分比误差。

图6是本发明提出的方法与MGT在HZMetro数据集上的实验数据对比图。其中，(a)HZMetro RMSE，(b)HZMetro MAE，(c)HZMetro MAPE。

基于上述描述，此交通流量预测方法采用了多种技术组合，包括时空嵌入、时间自注意力、因果卷积、图卷积网络和门控循环神经网络等。以下是对应的系统模块：

1)时空嵌入模块:

从交通数据中提取时间和空间的特征。

使用相对位置编码嵌入得到序列的顺序信息。

通过交通网络的邻接矩阵得到空间嵌入信息。

结合时间和空间嵌入信息。

2)时间特征提取模块:

利用时间自注意力捕获长期时间依赖性。

结合因果卷积捕获短期时间依赖性。

融合长短期时间特性。

3)空间特征提取模块:

使用图卷积网络聚合邻近节点的空间信息。

门控循环神经网络更新节点之间的时空相关性。

4)时空交互模块:

利用提取到的时间和空间特征来模拟时空异质性。

5)前馈神经网络模块:

用于拟合历史和预测时空特征。

6)编码器-解码器结构:

编码器用于捕获历史交通流量数据的时空特征。

7)注意力机制模块:

-模型设计：设计上述描述中的各种模块并组合在一起。

-模型评估：在验证集和测试集上评估模型的性能。

-预测和应用：使用模型预测未来的交通流量。

从这个描述中可以看出，这是一个非常先进的交通流量预测方法，结合了多种现代深度学习技术来捕获和预测交通流量的时空模式。

基于提供的基于趋势时空图卷积的交通流量预测方法，以下是两个具体的实施例及其实现方案：

实施例1：大都市交通流量预测

背景：在大都市中，确保交通的流畅性对于整个城市的运作至关重要。预测交通流量可以帮助城市规划者提前做好准备，如调整交通灯的时间、安排公交车班次等。

1.数据收集：使用城市内的交通摄像头、车流量计数器和移动应用等手段收集交通流量数据。

2.数据预处理：对收集到的数据进行清洗，去除异常值，并标准化数据。

3.根据提供的方法，利用时间和空间嵌入层来增强输入数据特征。

4.使用编码器-解码器结构进行模型训练，其中编码器捕获历史交通流量数据的时空特征，解码器则预测未来的交通流量。

5.使用模型预测的结果指导城市交通管理。

实施例2：大型活动前后的交通流量预测

背景：大型活动如音乐节、体育比赛等通常会导致周边地区的交通压力增加。预测这些活动前后的交通流量对于活动组织者和政府部门都是非常有价值的。

1.数据收集：除了常规的交通流量数据收集，还需要考虑活动相关的数据，如活动的开始和结束时间、预期参与人数等。

2.数据预处理：除了基本的数据清洗和标准化，还可以将活动相关数据与交通数据进行融合。

3.根据提供的方法，增强输入数据的时间和空间特征。

4.使用编码器-解码器结构进行模型训练。

5.根据预测结果，为大型活动的交通管理做出决策，如增加临时交通警察、设立临时停车场等。

以上两个实施例展示了如何根据不同的实际应用场景，采取不同的实现方案，利用基于趋势时空图卷积的交通流量预测方法来解决实际问题。

应当注意，本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现；软件部分可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于趋势时空图卷积的交通流量预测方法，其特征在于，融合时间和空间嵌入层来增强交通数据的特征，结合时间自注意力与因果卷积为交通流量序列的长短期依赖提供深入的建模，并利用图卷积网络与门控循环神经网络动态地捕获空间依赖；该方法还通过时空交互模块模拟了时空异质性，并在编码-解码结构中嵌入了注意力机制和前馈神经网络，以准确地预测未来交通流量，确保历史数据对未来预测的有效影响。

2.如权利要求1所述的基于趋势时空图卷积的交通流量预测方法，其特征在于，包括如下步骤：

3.如权利要求1所述的基于趋势时空图卷积的交通流量预测方法，其特征在于，S1采用的时间空间嵌入具体包括：

其中P表示时间步长，N表示节点数，d表示特征维度。

4.如权利要求1所述的基于趋势时空图卷积的交通流量预测方法，其特征在于，S2具体包括：

5.如权利要求1所述的基于趋势时空图卷积的交通流量预测方法，其特征在于，S201具体包括：在第一层编码器中，将S1中得到的用线性变化为高维的值矩阵V，可表示为：

其中W^V为权重参数；

S202具体包括：首先，在第一层编码器中，将步骤S1中得到的用因果卷积得到卷积聚合的结果，在通过线性变化为高维的查询矩阵Q，键矩阵K，可表示为：

其中Φ^Q,Φ^K为卷积核的参数；

然后将时间自注意力和因果卷积进行缩放点积，计算长期和短期趋势的时间注意力分数，相关公式如下：

d_k＝d_model/S；

最后将卷积自注意力的输出进行正则化残差连接：

其中，LayerNorm为层特征归一化函数；

F(X,A)＝σ(AXW₀)

其中W₀为权重参数矩阵，σ为sigmoid激活函数；

6.如权利要求2所述的基于趋势时空图卷积的交通流量预测方法，其特征在于，S3具体包括：

g＝σ(X_tW_l+H_tW_t+b)

X_en＝g⊙X_t+(1-g)H_t

其中⊙代表矩阵乘积。

7.如权利要求2所述的基于趋势时空图卷积的交通流量预测方法，其特征在于，S7具体包括：

其中X_de为解码器的输出。

8.如权利要求2所述的基于趋势时空图卷积的交通流量预测方法，其特征在于，S8具体包括：

FFN(X_de)＝W₂ReLU(W₁X_de+b₁)+b₂

9.一种基于趋势时空图卷积的交通流量预测方法，其特征在于，包括：

1)时空嵌入模块:

从交通数据中提取时间和空间的特征；

使用相对位置编码嵌入得到序列的顺序信息；

通过交通网络的邻接矩阵得到空间嵌入信息；

结合时间和空间嵌入信息；

2)时间特征提取模块:

利用时间自注意力捕获长期时间依赖性；

结合因果卷积捕获短期时间依赖性；

融合长短期时间特性；

3)空间特征提取模块:

使用图卷积网络聚合邻近节点的空间信息；

门控循环神经网络更新节点之间的时空相关性；

4)时空交互模块:

利用提取到的时间和空间特征来模拟时空异质性；

5)前馈神经网络模块:

用于拟合历史和预测时空特征；

6)编码器-解码器结构:

编码器用于捕获历史交通流量数据的时空特征；

解码器利用编码器提取的特征和解码器本身提取的未来特征来预测未来的交通流量；

7)注意力机制模块:

10.一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行权利要求1到8任一项所述的基于趋势时空图卷积的交通流量预测方法的步骤。