CN114330671A - 一种基于Transformer时空图卷积网络的交通流预测方法 - Google Patents
一种基于Transformer时空图卷积网络的交通流预测方法 Download PDFInfo
- Publication number
- CN114330671A CN114330671A CN202210009238.5A CN202210009238A CN114330671A CN 114330671 A CN114330671 A CN 114330671A CN 202210009238 A CN202210009238 A CN 202210009238A CN 114330671 A CN114330671 A CN 114330671A
- Authority
- CN
- China
- Prior art keywords
- time
- traffic flow
- prediction
- data
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Traffic Control Systems (AREA)
Abstract
本发明涉及一种基于Transformer时空图卷积网络的交通流预测方法,属于交通流预测技术领域,包括以下步骤:根据路网部署的探测器及其之间的连通性和欧氏距离构造静态邻接矩阵;对探测器所采集到的交通流原始数据按指定时间间隔进行合并;对数据集采用最大最小方法进行归一化处理,并构建交通流时空图,将数据集分为训练集和测试集;构造基于Transformer时空图卷积网络预测模型;将训练集数据作为输入,训练预测模型;利用训练完成的时空图卷积网络预测模型对测试集进行交通流预测,并根据预测结果和实际交通数据,对预测误差进行评价分析。相比传统方法而言,本方法可以有效提取交通流数据中的时空相关性,更加充分地挖掘交通流数据中的信息,提升其预测精度。
Description
技术领域
本发明属于交通流预测技术领域,涉及一种基于Transformer时空图卷积网络的交通流预测方法。
背景技术
随着城市化建设的推进,我国的机动车保有量不断攀升,截止2021年12月,机动车保有量达到3.93亿,世界第一。交通拥堵逐渐成为主要的社会问题之一。智能交通系统的应用发展有助于缓解交通拥堵,而交通流预测则是保证智能交通系统有效性的关键之一。准确的交通流预测尤其是长期预测一方面能够帮助出行者提前获得未来交通信息,制定更好的出行计划;另一方面帮助管理者制定合理的交通诱导方案,提高交通运行效率,从而缓解交通拥堵。因此准确的长期交通流预测至关重要。
交通流预测方法主要分为三类:时序分析方法、机器学习方法和深度学习方法。由于交通流数据是由部署的检测器按固定时间间隔生成的连续时间序列数据。早期主要利用自回归综合移动平均(ARIMA)、卡尔曼滤波等时间序列分析方法进行预测。但它们都基于线性假设,并要求数据是平滑的。而实际的交通流数据通常是非线性的,这使得时序分析方法很难得到满意的结果。
机器学习如向量自回归(VAR)和支持向量回归(SVR)等方法对交通数据进行特征工程建模,揭示数据中的非线性关系,然后不断调整和优化模型参数,预测交通趋势。但是机器学习的建模工作需要专业的人来设计并具有一定的难度。而且上述两类方法都只考虑了时间信息,忽略了空间信息对准确预测的重要性。
深度学习可以自动提取更复杂的特征,在交通流预测中引起了广泛的关注。现有研究表明基于循环神经网络(RNN)的方法,如长短期记忆网络(LSTM)比上述的时序分析方法和机器学习方法取得了更好的效果。为了同时学习交通数据的时空相关性,融合卷积神经网络(CNN)和RNN的方法被采用。然而,CNN不能处理非欧几里德数据,导致路网包含的空间信息丢失。因此,时空图卷积网络框架被广泛应用于交通流预测。其中,图的节点是交通探测器,边和权值由探测器之间的连通性和欧氏距离确定。为此,部分学者提出将图卷积网络(GCN)引入交通流预测领域,利用时空卷积同时捕获时空相关性。还有学者通过构造自适应邻接矩阵进一步捕获空间相关性,同时采用时间卷积网络(TCN)来捕获时间相关性。
尽管上述方法在交通流预测方面取得了良好效果,但实际上受道路结构和等级、天气变化以及突发事故等因素的影响,交通流数据的空间相关性是动态变化的,然而现有方法都很难捕获到这种空间动态变化。而且对于长期预测而言,基于RNN的方法存在梯度消失或爆炸的问题;基于CNN的方法受到有限接受域的限制。虽然TCN实现了指数增长的接收域。但是堆叠的卷积层仍会降低模型的性能。因此,现有的方法对长期预测也有一定的困难。Transformer利用高度并行的自注意机制实现了高效的序列学习,可以从输入序列中自适应地捕获长期时间依赖关系。
发明内容
有鉴于此,本发明的目的在于提供一种基于Transformer时空图卷积网络的交通流预测方法,设计新的基于Transformer时空图卷积网络模型(Transformer basedSpatial-Temporal Graph Convolution Network,Trans-STGCN),设计结构多头自注意模块,提取路网拓扑结构信息;设计动态演化图卷积模块,为每个时间片学习一个新的图,并利用自注意机制自适应地动态调整节点之间的相关强度;设计时间多头自注意模块和时间位置嵌入,提取时间相关性。并通过优化Transformer结构,使得Trans-STGCN有更准确的长期预测能力。本方法能够更好地提取时空相关性,并能提高预测精度。
为达到上述目的,本发明提供如下技术方案:
一种基于Transformer时空图卷积网络的交通流预测方法,该方法包括以下步骤:
S1、根据路网部署的探测器及其之间的连通性和欧氏距离构造静态邻接矩阵;
S2、对探测器所采集到的交通流原始数据按指定时间间隔进行合并;
S3、构建交通流时空图G=(V,E,A),并对数据集采用最大最小方法进行归一化处理,将数据集分为训练集和测试集;
S4、构造基于Transformer时空图卷积网络预测模型Trans-STGCN(Transformerbased Spatial-Temporal Graph Convolution Network,Trans-STGCN);所述的预测模型以Transformer为基干网络,其包含多个残差块、层归一化块、时间位置嵌入、动态演化图卷积模块和多头自注意模块。所述多头自注意模块包括一个结构多头自注意模块和一个时间多头自注意模块。在每个动态演化图卷积模块和多头自注意模块的末尾串行所述残差块和层归一化块。所述残差块用于避免有效交通流数据特征的丢失;所述层归一化块用于加速模型的训练过程,使其更快的收敛;所述结构多头自注意模块用于提取路网拓扑结构信息;所述时间位置嵌入和时间多头自注意模块用于提取交通流数据长期时间相关性;所述动态演化图卷积模块用于提取交通流数据空间相关性;
S5、训练预测模型:将训练集作为时空图卷积网络预测模型的输入,求解模型最优参数从而完成模型训练;
S6、利用训练完成的时空图卷积网络预测模型对测试集进行交通流预测,并根据预测结果和实际交通数据,对预测误差进行评价分析。
进一步,在步骤S1中,具体包括:将部署的探测器作为图的节点;探测器之间的道路连通则对应节点之间用边连接;静态邻接矩阵的权重由两个探测器之间的距离计算,其中aij表示vi和vj两个传感器之间的权重,表示探测器之间的距离,σ是距离的标准差,得到一个带权重的静态邻接矩阵A∈RN×N。
进一步,在步骤S2中,具体包括:获取N个探测器相同时间范围内的交通流数据,原始交通流量数据为探测器在一定时间间隔内经过的车辆数;指定时间间隔为5分钟,某时刻的交通流数据指的是从此时刻开始经过指定时间间隔(例如5分钟)的交通流数据;数据集形式如下所示:
最大最小归一化计算表达式为:
其中,minXt和maxXt分别为t时刻交通流数据中的最小值与最大值,为节点i在t时刻进行归一化操作后的交通流数据;预测未来Tf时刻交通流量时,选取前Tp个时间间隔交通流作为输入,即:取t-Tp+1,t-Tp+2,…,t时刻的交通流量作为网络输入:
其中,Tf表示预测的未来时间长度,Tp表示输入的历史时间长度,t为当前时刻。
进一步,在步骤S4中,所述构造基于Transformer时空图卷积网络预测模型具体包括:在输入进入到编码器/解码器之前,增加一个结构多头自注意模块来提取路网拓扑结构信息;然后用独热编码代替正弦余弦位置编码,用时间多头自注意模块代替Transformer原来的多头自注意块,来提取交通流数据的长期时间相关性;去掉Transformer原有的前馈神经网络层,替换成一个动态演化图卷积模块,进行空间相关性提取。
进一步,所述步骤S4具体包括以下步骤:
S41、结构多头自注意模块的设计与实现:
加入邻接矩阵计算注意力权重,计算公式如下:
score=softmax(a(QS,KS))=softmax(σ(AαT[QS,KS]))
将score与值VS相乘得到一个头的自注意向量headi:
head=scoreVS
最终结构多头自注意结果为:
S42、时间位置嵌入的设计与实现:
将结构多头自注意模块的输出XS和历史w周中同一天的Tf个流量记录Xg以及历史d天的Tf个流量记录Xl连接得到一个N×(w*Tf+d*Tf+Tp)的新序列[XS,Xg,Xl],其中,[·]表示连接操作,XS为结构多头自注意模块的输出,Tp为输入的历史时间长度,Tf为预测的时间长度;
S43、时间多头自注意模块的设计与实现:
将包含空间结构信息和时间位置信息的输入X(0)通过权重矩阵转换为索引QT、键KT和值VT;
在注意力机制中加入相对位置信息,计算公式如下:
head=score(VT+rpV)
得到时间多头自注意模块的结果为:
将得到的时间多头自注意结果进行残差连接和层归一化操作,层归一化计算公式如下:
其中,E(·)表示期望,Var(·)表示方差,∈为很小的一个数,用于避免除0;
然后进行残差连接操作,X(0)+LN(H);
S44、动态演化图卷积模块的设计与实现:
使用门控循环单元(GRU)来演化GCN参数,即Wt=GRU(Ht,Wt-1);GRU计算过程如下:
Zt=sigmoid(WZXt+UZHt-1+BZ)
Rt=sigmoid(WRXt+URHt-1+BR)
其中,为了更容易地识别GRU的功能,使用Xt,Ht-1,和Ht作为局部变量名代替Ht,Wt和Wt-1,⊙表示点乘;输入为节点特征矩阵Ht(即时间多头自注意模块经过残差连接和层归一化后的输出)和上一个时间片的GCN参数Wt-1,输出为当前时间的GCN参数Wt;在本方法中,使用DEGCU(Dynamic Evolving Graph Convolution Unit)指代动态演化图卷积操作;
对时间多头自注意模块的输出进行矩阵相乘和softmax非线性激活计算,得到空间自注意力矩阵St,计算公式如下:
然后利用节点之间的相似度计算动态邻接矩阵DA,计算公式如下:
其中,γ是控制激活函数饱和率的超参数,DAt∈RN×N为t时刻的动态邻接矩阵;
将静态邻接矩阵与动态邻接矩阵分别用于动态演化图卷积操作,得到:
将动态演化卷积模块的输出进行残差连接和层归一化处理(同步骤S43中所述操作)。
进一步,在步骤S5中,训练预测模型包括:
选择目标函数,将训练集作为时空图卷积网络预测模型的输入,求解模型最优参数从而完成模型训练;
在训练过程中,将历史数据经过结构多头自注意模块提取空间结构信息,并加入时间位置信息后得到的新输入X(0)输入编码器,编码器通过L个编码器层将输入序列X(0)映射到中间表示序列X(L),解码器采用L个解码器层生成预测结果其中解码器输入为X(L)和历史真实数据;使用平均绝对误差(MAE)作为损失函数,计算公式如下:
进一步,在步骤S6中,具体包括:
在测试过程中,输入解码器的历史真实数据被模型本身生成的预测值所取代,解码器输入为X(L)和所有之前生成的将最终的预测结果进行反标准化操作,转换为真实交通流数据,以便对预测误差进行评价分析;采用以下的评价标准对预测误差进行评价分析:
1)平均绝对误差(MAE):
2)均方根误差(RMSE):
3)平均绝对百分误差(MAPE):
本发明的有益效果在于:
本发明提出的一种基于Transformer时空图卷积网络的交通流预测方法,旨在提高交通流量预测的精度。空间维度上,通过结构多头自注意模块提取路网拓扑结构信息;进一步地,通过动态演化图卷积模块,利用图卷积和门控循环单元(GRU)为每个时间片提取动态空间相关性,同时采用自注意力机制构造动态邻接矩阵,使得模型能自适应地动态调整节点之间的相关强度。在时间维度上,通过时间位置嵌入和时间多头自注意模块提取长期时间相关性。相比传统方法而言,所述预测方法可以有效提取交通流数据中的时空相关性,更加充分地挖掘交通流数据中的信息,故能提升其预测精度。此外,所述方法使用了残差连接和层归一化,一定程度上避免了有效交通流数据特征的丢失并提高了预测的精度。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明所述方法的流程图;
图2为本发明的Trans-STGCN的模型结构图;
图3为动态演化图卷积单元示意图;
图4为动态演化图卷积模块示意图;
图5为本发明Trans-STGCN模型的交通流数据预测结果图。
具体实施方式
下面结合附图对本发明技术方案进行详细说明。
图1为本发明所述方法的流程图,如图1所示,本发明提供的一种基于Transformer时空图卷积网络的交通流预测方法,具体按照如下步骤实现:
步骤1:根据路网部署的探测器及其之间的连通性和欧氏距离构造静态邻接矩阵的步骤具体包括:将部署的探测器作为图的节点;探测器之间的道路连通则对应节点之间用边连接;静态邻接矩阵的权重由两个探测器之间的距离计算,其中aij表示vi和vj两个传感器之间的权重,表示探测器之间的距离,σ是距离的标准差。得到一个带权重的静态邻接矩阵A∈RN×N。
步骤2:对探测器所采集到的交通流原始数据按指定时间间隔进行合并。获取N个探测器相同时间范围内的交通流数据,原始交通流量数据为探测器在一定时间间隔内经过的车辆数。所述的指定时间间隔为5分钟,下述某时刻的交通流数据指的是从此时刻开始经过指定时间间隔(例如5分钟)的交通流数据。数据集形式如下所示:
步骤3:构建交通流时空图G=(V,E,A),对数据采用最大最小方法进行归一化处理,并将数据集分为训练集和测试集。交通流时空图G=(V,E,A)在时间片t上的交通流数据用矩阵表示。其中,V为N个节点的集合,E为两个节点之间的边的集合,A是静态邻接矩阵。
最大最小归一化计算表达式为:
其中,minXt和maxXt分别为t时刻交通流数据中的最小值与最大值,为节点i在t时刻进行归一化操作后的交通流数据。本发明中,预测未来Tf时刻交通流量时,选取前Tp个时间间隔交通流作为输入,即:取t-Tp+1,t-Tp+2,…,t时刻的交通流量作为网络输入:
其中,Tf表示预测的未来时间长度,Tp表示输入的历史时间长度,t为当前时刻。
步骤4:如图2所示,图2为本发明的Trans-STGCN的模型结构图,本发明实施例提供的Trans-STGCN,在标准Transformer的基础上进行改进。具体地,本发明在输入进入到编码器/解码器之前,增加了一个结构多头自注意模块来提取路网拓扑结构信息。然后用独热编码代替正弦余弦位置编码,用时间多头自注意模块代替Transformer原来的多头自注意块,来提取交通流数据的长期时间相关性。另外,本发明去掉Transformer原有的前馈神经网络层,替换成一个动态演化图卷积模块,进行空间相关性提取。
4.1:结构多头自注意模块的设计与实现。
加入邻接矩阵计算注意力权重,计算公式如下:
Score=softmax(a(QS,KS))=softmax(σ(AαT[QS,KS]))
将score与值VS相乘得到一个头的自注意向量headi:
head=scoreVS
最终结构多头自注意结果为:
4.2:时间位置嵌入的设计与实现。
将结构多头自注意模块的输出XS和历史w周中同一天的Tf个流量记录Xg以及历史d天的Tf个流量记录Xl连接得到一个N×(w*Tf+d*Tf+Tp)的新序列[XS,Xg,Xl],其中,[·]表示连接操作,XS为结构多头自注意模块的输出,Tp为输入的历史时间长度,Tf为预测的时间长度。
4.3:时间多头自注意模块的设计与实现。
将包含空间结构信息和时间位置信息的输入X(0)通过权重矩阵转换为索引QT、键KT和值VT。
在注意力机制中加入相对位置信息,计算公式如下:
head=score(VT+rpV)
得到时间多头自注意模块的结果为:
将得到的时间多头自注意结果进行残差连接和层归一化操作。层归一化计算公式如下:
其中,E(·)表示期望,Var(·)表示方差,∈为很小的一个数,用于避免除0。
然后进行残差连接操作,X(0)+LN(H)。
4.4:动态演化图卷积模块的设计与实现。
图3为动态演化图卷积单元示意图,图4为动态演化图卷积模块示意图,如图3、图4所示,本设计为了捕获动态空间相关性,使用GRU来演化GCN参数,即Wt=GRU(Ht,Wt-1)。GRU计算过程如下:
Zt=sigmoid(WZXt+UZHt-1+BZ)
Rt=sigmoid(WRXt+URHt-1+BR)
其中,为了更容易地识别GRU的功能,使用Xt,Ht-1,和Ht作为局部变量名代替Ht,Wt和Wt-1,⊙表示点乘。输入为节点特征矩阵Ht(即时间多头自注意模块经过残差连接和层归一化后的输出)和上一个时间片的GCN参数Wt-1,输出为当前时间的GCN参数Wt。在本设计中,使用DEGCU(Dynamic Evolving Graph Convolution Unit)指代动态演化图卷积操作。
对时间多头自注意模块的输出进行矩阵相乘和softmax非线性激活计算,得到空间自注意力矩阵St,计算公式如下:
然后利用节点之间的相似度计算动态邻接矩阵DA,计算公式如下:
其中,γ是控制激活函数饱和率的超参数,DAt∈RN×N为t时刻的动态邻接矩阵。
将静态邻接矩阵与动态邻接矩阵分别用于动态演化图卷积操作,得到:
将动态演化卷积模块的输出进行残差连接和层归一化处理(同4.3中所述操作)。
步骤5:训练所述预测模型。
选择目标函数,将训练集作为时空图卷积网络预测模型的输入,求解模型最优参数从而完成模型训练。
在训练过程中,将历史数据经过结构多头自注意模块提取空间结构信息,并加入时间位置信息后得到的新输入X(0)输入编码器,编码器通过L个编码器层将输入序列X(0)映射到中间表示序列X(L),解码器采用L个解码器层生成预测结果其中解码器输入为X(L)和历史真实数据。本设计使用平均绝对误差(MAE)作为损失函数,计算公式如下:
步骤6:利用训练完成的时空图卷积网络预测模型对测试集进行交通流预测,并根据预测结果和实际交通数据,对预测误差进行评价分析。
在测试过程中,输入解码器的历史真实数据被模型本身生成的预测值所取代,解码器输入为X(L)和所有之前生成的将最终的预测结果进行反标准化操作,转换为真实交通流数据,以便对预测误差进行评价分析。在本实施例中,采用以下的评价标准对预测误差进行评价分析:
1)平均绝对误差(MAE):
2)均方根误差(RMSE):
3)平均绝对百分误差(MAPE):
实施例:
1)选取实验数据
选取美国加州运输机构(CalTrans)性能测量系统(PeMS)每30秒实时采集一次的数据作为数据集。原始的交通流数据被聚合成5分钟的间隔,包含Dstrict08共170个探测器在2016年7月1号到2016年8月31号的数据。将前43天的数据作为训练集,进行模型参数训练。后19天的数据作为测试集,进行预测。
2)参数确定
在建立模型过程中,涉及的主要参数有:编码器/解码器层数L、历史交通流数据量Tp、预测交通流数据量Tf、模型维度dmodel、最大截取距离m、历史天数d、历史周数w、卷积核K、自注意头个数h、控制激活函数饱和率参数γ,各参数设定如表1所示。
参数 | 设定值 | 参数 | 设定值 | 参数 | 设定值 | 参数 | 设定值 | 参数 | 设定值 |
L | 4 | T<sub>p</sub> | 12 | T<sub>f</sub> | 12 | d<sub>model</sub> | 64 | m | 2 |
d | 1 | w | 1 | K | 3 | h | 8 | γ | 3 |
表1
3)实验结果
选取6个基线方法(ARIMA、SVR、FC-LSTM、STGCN、GMAN、ASTGNN)和本发明提出的方法一起进行交通流预测任务。结果见表2。
方法 | MAE | RMSE | MAPE(%) |
ARIMA | 25.73 | 45.30 | 19.88 |
SVR | 24.99 | 36.05 | 17.39 |
FC-LSTM | 24.71 | 34.66 | 18.50 |
STGCN | 18.01 | 11.32 | 28.44 |
GMAN | 14.66 | 22.89 | 9.47 |
ASTGNN | 12.72 | 22.60 | 8.78 |
Trans-STGCN(ours) | 12.63 | 22.45 | 8.68 |
表2
根据表2可知,我们的STDE-GCN相比于现有的预测方法均表现出优越的性能。另外,本发明也选取了一个探测器一天的预测结果与真实值进行了可视化处理,结果如图5所示。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (8)
1.一种基于Transformer时空图卷积网络的交通流预测方法,其特征在于:该方法包括以下步骤:
S1、根据路网部署的探测器及其之间的连通性和欧氏距离构造静态邻接矩阵;
S2、对探测器所采集到的交通流原始数据按指定时间间隔进行合并;
S3、构建交通流时空图G=(V,E,A),并对数据集采用最大最小方法进行归一化处理,将数据集分为训练集和测试集;
S4、构造基于Transformer时空图卷积网络预测模型Trans-STGCN(Transformer basedSpatial-TemporalGraph Convolution Network,Trans-STGCN);
S5、训练预测模型:将训练集作为时空图卷积网络预测模型的输入,求解模型最优参数从而完成模型训练;
S6、利用训练完成的时空图卷积网络预测模型对测试集进行交通流预测,并根据预测结果和实际交通数据,对预测误差进行评价分析。
4.根据权利要求3所述的一种基于Transformer时空图卷积网络的交通流预测方法,其特征在于:在步骤S3中,具体包括:交通流时空图G=(V,E,A)在时间片t上的交通流数据用矩阵表示,其中,V为N个节点的集合,E为两个节点之间的边的集合,A是静态邻接矩阵;
最大最小归一化计算表达式为:
其中,minXt和maxXt分别为t时刻交通流数据中的最小值与最大值,为节点i在t时刻进行归一化操作后的交通流数据;预测未来Tf时刻交通流量时,选取前Tp个时间间隔交通流作为输入,即:取t-Tp+1,t-Tp+2,…,t时刻的交通流量作为网络输入:
其中,Tf表示预测的未来时间长度,Tp表示输入的历史时间长度,t为当前时刻。
5.根据权利要求4所述的一种基于Transformer时空图卷积网络的交通流预测方法,其特征在于:在步骤S4中,所述构造基于Transformer时空图卷积网络预测模型具体包括:在输入进入到编码器/解码器之前,增加一个结构多头自注意模块来提取路网拓扑结构信息;然后用独热编码代替正弦余弦位置编码,用时间多头自注意模块代替Transformer原来的多头自注意块,来提取交通流数据的长期时间相关性;去掉Transformer原有的前馈神经网络层,替换成一个动态演化图卷积模块,进行空间相关性提取。
6.根据权利要求5所述的一种基于Transformer时空图卷积网络的交通流预测方法,其特征在于:所述步骤S4具体包括以下步骤:
S41、结构多头自注意模块的设计与实现:
加入邻接矩阵计算注意力权重,计算公式如下:
score=softmax(a(QS,KS))=softmax(σ(AαT[QS,KS]))
将score与值VS相乘得到一个头的自注意向量headi:
head=scoreVS
最终结构多头自注意结果为:
S42、时间位置嵌入的设计与实现:
将结构多头自注意模块的输出XS和历史w周中同一天的Tf个流量记录Xg以及历史d天的Tf个流量记录Xl连接得到一个N×(w*Tf+d*Tf+Tp)的新序列[XS,Xg,Xl],其中,[·]表示连接操作,XS为结构多头自注意模块的输出,Tp为输入的历史时间长度,Tf为预测的时间长度;
S43、时间多头自注意模块的设计与实现:
将包含空间结构信息和时间位置信息的输入X(0)通过权重矩阵转换为索引QT、键KT和值VT;
在注意力机制中加入相对位置信息,计算公式如下:
head=score(VT+rpV)
得到时间多头自注意模块的结果为:
将得到的时间多头自注意结果进行残差连接和层归一化操作,层归一化计算公式如下:
其中,E(·)表示期望,Var(·)表示方差,∈为很小的一个数,用于避免除0;
然后进行残差连接操作,X(0)+LN(H);
S44、动态演化图卷积模块的设计与实现:
使用GRU来演化GCN参数,即Wt=GRU(Ht,Wt-1);GRU计算过程如下:
Zt=sigmoid(WzXt+UZHt-1+Bz)
Rt=sigmoid(WRXt+URHt-1+BR)
其中,为了更容易地识别GRU的功能,使用Xt,Ht-1,和Ht作为局部变量名代替Ht,Wt和Wt-1,⊙表示点乘;输入为节点特征矩阵Ht和上一个时间片的GCN参数Wt-1,输出为当前时间片的GCN参数Wt;在本方法中,使用DEGCU(Dynamic Evolving Graph Convolution Unit)指代动态演化图卷积操作;
对时间多头自注意模块的输出进行矩阵相乘和softmax非线性激活计算,得到空间自注意力矩阵St,计算公式如下:
然后利用节点之间的相似度计算动态邻接矩阵DA,计算公式如下:
其中,γ是控制激活函数饱和率的超参数,DAt∈RN×N为t时刻的动态邻接矩阵;
将静态邻接矩阵与动态邻接矩阵分别用于动态演化图卷积操作,得到:
将动态演化卷积模块的输出进行残差连接和层归一化处理(同步骤S43中所述操作);
7.根据权利要求6所述的一种基于Transformer时空图卷积网络的交通流预测方法,其特征在于:在步骤S5中,训练预测模型:
选择目标函数,将训练集作为时空图卷积网络预测模型的输入,求解模型最优参数从而完成模型训练;
在训练过程中,将历史数据经过结构多头自注意模块提取空间结构信息,并加入时间位置信息后得到的新输入X(0)输入编码器,编码器通过L个编码器层将输入序列X(0)映射到中间表示序列X(L),解码器采用L个解码器层生成预测结果其中解码器输入为X(L)和历史真实数据;使用平均绝对误差(MAE)作为损失函数,计算公式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210009238.5A CN114330671A (zh) | 2022-01-06 | 2022-01-06 | 一种基于Transformer时空图卷积网络的交通流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210009238.5A CN114330671A (zh) | 2022-01-06 | 2022-01-06 | 一种基于Transformer时空图卷积网络的交通流预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114330671A true CN114330671A (zh) | 2022-04-12 |
Family
ID=81024312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210009238.5A Pending CN114330671A (zh) | 2022-01-06 | 2022-01-06 | 一种基于Transformer时空图卷积网络的交通流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114330671A (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114743072A (zh) * | 2022-05-24 | 2022-07-12 | 中国科学院计算机网络信息中心 | 一种短期时间序列预测模型的训练方法 |
CN114781609A (zh) * | 2022-04-19 | 2022-07-22 | 华东交通大学 | 一种基于多模式动态残差图卷积网络的交通流预测方法 |
CN114973653A (zh) * | 2022-04-27 | 2022-08-30 | 中国计量大学 | 一种基于时空图卷积网络的交通流预测方法 |
CN115019505A (zh) * | 2022-05-27 | 2022-09-06 | 湖南大学 | 一种交通流速度的预测方法及装置 |
CN115034496A (zh) * | 2022-06-27 | 2022-09-09 | 北京交通大学 | 基于GCN-Transformer的城市轨道交通节假日短时客流预测方法 |
CN115392595A (zh) * | 2022-10-31 | 2022-11-25 | 北京科技大学 | 基于图卷积神经网络和Transformer的时空短期风速预测方法及系统 |
CN115545269A (zh) * | 2022-08-09 | 2022-12-30 | 南京信息工程大学 | 一种基于卷积自注意力Transformer模型的电网参数辨识方法 |
CN115620510A (zh) * | 2022-08-25 | 2023-01-17 | 重庆邮电大学 | 一种基于自适应窗口注意力提取时空依赖的交通流预测方法 |
CN115619052A (zh) * | 2022-12-20 | 2023-01-17 | 安徽农业大学 | 一种城市交通流量预测方法 |
CN115809747A (zh) * | 2023-02-06 | 2023-03-17 | 东南大学 | 一种基于金字塔式因果网络的耦合信息流长期预测方法 |
CN115985098A (zh) * | 2022-12-29 | 2023-04-18 | 中国科学院合肥物质科学研究院 | 基于自注意力机制和循环图卷积网络的交通流预测方法 |
CN116188921A (zh) * | 2022-11-30 | 2023-05-30 | 中咨公路养护检测技术有限公司 | 一种基于多图融合的隧道瓦斯浓度预测方法 |
CN116192669A (zh) * | 2023-03-07 | 2023-05-30 | 西安电子科技大学 | 基于动态时空图卷积的网络流量预测方法 |
CN116192666A (zh) * | 2023-02-09 | 2023-05-30 | 西安电子科技大学 | 一种基于时空相关的网络节点和链路剩余资源预测方法 |
CN116187210A (zh) * | 2023-05-04 | 2023-05-30 | 生态环境部华南环境科学研究所(生态环境部生态环境应急研究所) | 一种lstm耦合机理模型的时空多源近岸海域水质时序预测方法 |
CN116203907A (zh) * | 2023-03-27 | 2023-06-02 | 淮阴工学院 | 一种化工过程故障诊断报警方法及系统 |
CN116432868A (zh) * | 2023-06-12 | 2023-07-14 | 深圳大学 | 基于节点查询集的地铁客流量预测方法、装置及存储介质 |
CN117096875A (zh) * | 2023-10-19 | 2023-11-21 | 国网江西省电力有限公司经济技术研究院 | 一种基于ST-Transformer模型的短期负荷预测方法及系统 |
CN117437776A (zh) * | 2023-10-18 | 2024-01-23 | 南昌大学 | 一种智能交通系统中交通流预测方法及其系统 |
CN117688453A (zh) * | 2024-02-02 | 2024-03-12 | 山东科技大学 | 一种基于时空嵌入注意力网络的交通流量预测方法 |
CN118036477A (zh) * | 2024-04-11 | 2024-05-14 | 中国石油大学(华东) | 一种基于时空图神经网络的井位及井控参数优化方法 |
CN116543554B (zh) * | 2023-05-01 | 2024-05-14 | 兰州理工大学 | 基于动态相关性的时空Transformer交通流预测方法 |
CN118114057A (zh) * | 2024-04-30 | 2024-05-31 | 西北工业大学 | 模型训练方法、径流预测方法、电子设备和存储介质 |
-
2022
- 2022-01-06 CN CN202210009238.5A patent/CN114330671A/zh active Pending
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114781609A (zh) * | 2022-04-19 | 2022-07-22 | 华东交通大学 | 一种基于多模式动态残差图卷积网络的交通流预测方法 |
CN114973653A (zh) * | 2022-04-27 | 2022-08-30 | 中国计量大学 | 一种基于时空图卷积网络的交通流预测方法 |
CN114973653B (zh) * | 2022-04-27 | 2023-12-19 | 中国计量大学 | 一种基于时空图卷积网络的交通流预测方法 |
CN114743072A (zh) * | 2022-05-24 | 2022-07-12 | 中国科学院计算机网络信息中心 | 一种短期时间序列预测模型的训练方法 |
CN115019505A (zh) * | 2022-05-27 | 2022-09-06 | 湖南大学 | 一种交通流速度的预测方法及装置 |
CN115019505B (zh) * | 2022-05-27 | 2024-04-30 | 湖南大学 | 一种交通流速度的预测方法及装置 |
CN115034496A (zh) * | 2022-06-27 | 2022-09-09 | 北京交通大学 | 基于GCN-Transformer的城市轨道交通节假日短时客流预测方法 |
CN115545269A (zh) * | 2022-08-09 | 2022-12-30 | 南京信息工程大学 | 一种基于卷积自注意力Transformer模型的电网参数辨识方法 |
CN115620510A (zh) * | 2022-08-25 | 2023-01-17 | 重庆邮电大学 | 一种基于自适应窗口注意力提取时空依赖的交通流预测方法 |
CN115620510B (zh) * | 2022-08-25 | 2023-12-05 | 重庆邮电大学 | 一种基于自适应窗口注意力提取时空依赖的交通流预测方法 |
CN115392595B (zh) * | 2022-10-31 | 2022-12-27 | 北京科技大学 | 基于图卷积神经网络和Transformer的时空短期风速预测方法及系统 |
CN115392595A (zh) * | 2022-10-31 | 2022-11-25 | 北京科技大学 | 基于图卷积神经网络和Transformer的时空短期风速预测方法及系统 |
CN116188921B (zh) * | 2022-11-30 | 2023-10-13 | 中咨公路养护检测技术有限公司 | 一种基于多图融合的隧道瓦斯浓度预测方法 |
CN116188921A (zh) * | 2022-11-30 | 2023-05-30 | 中咨公路养护检测技术有限公司 | 一种基于多图融合的隧道瓦斯浓度预测方法 |
CN115619052A (zh) * | 2022-12-20 | 2023-01-17 | 安徽农业大学 | 一种城市交通流量预测方法 |
CN115985098A (zh) * | 2022-12-29 | 2023-04-18 | 中国科学院合肥物质科学研究院 | 基于自注意力机制和循环图卷积网络的交通流预测方法 |
CN115985098B (zh) * | 2022-12-29 | 2023-08-29 | 中国科学院合肥物质科学研究院 | 基于自注意力机制和循环图卷积网络的交通流预测方法 |
CN115809747B (zh) * | 2023-02-06 | 2023-05-09 | 东南大学 | 一种基于金字塔式因果网络的耦合信息流长期预测方法 |
CN115809747A (zh) * | 2023-02-06 | 2023-03-17 | 东南大学 | 一种基于金字塔式因果网络的耦合信息流长期预测方法 |
CN116192666A (zh) * | 2023-02-09 | 2023-05-30 | 西安电子科技大学 | 一种基于时空相关的网络节点和链路剩余资源预测方法 |
CN116192669A (zh) * | 2023-03-07 | 2023-05-30 | 西安电子科技大学 | 基于动态时空图卷积的网络流量预测方法 |
CN116192669B (zh) * | 2023-03-07 | 2024-06-07 | 西安电子科技大学 | 基于动态时空图卷积的网络流量预测方法 |
CN116203907B (zh) * | 2023-03-27 | 2023-10-20 | 淮阴工学院 | 一种化工过程故障诊断报警方法及系统 |
CN116203907A (zh) * | 2023-03-27 | 2023-06-02 | 淮阴工学院 | 一种化工过程故障诊断报警方法及系统 |
CN116543554B (zh) * | 2023-05-01 | 2024-05-14 | 兰州理工大学 | 基于动态相关性的时空Transformer交通流预测方法 |
CN116187210B (zh) * | 2023-05-04 | 2023-07-21 | 生态环境部华南环境科学研究所(生态环境部生态环境应急研究所) | 一种lstm耦合机理模型的时空多源近岸海域水质时序预测方法 |
CN116187210A (zh) * | 2023-05-04 | 2023-05-30 | 生态环境部华南环境科学研究所(生态环境部生态环境应急研究所) | 一种lstm耦合机理模型的时空多源近岸海域水质时序预测方法 |
CN116432868A (zh) * | 2023-06-12 | 2023-07-14 | 深圳大学 | 基于节点查询集的地铁客流量预测方法、装置及存储介质 |
CN116432868B (zh) * | 2023-06-12 | 2023-09-19 | 深圳大学 | 基于节点查询集的地铁客流量预测方法、装置及存储介质 |
CN117437776A (zh) * | 2023-10-18 | 2024-01-23 | 南昌大学 | 一种智能交通系统中交通流预测方法及其系统 |
CN117096875B (zh) * | 2023-10-19 | 2024-03-12 | 国网江西省电力有限公司经济技术研究院 | 一种基于Spatio-Temporal Transformer模型的短期负荷预测方法及系统 |
CN117096875A (zh) * | 2023-10-19 | 2023-11-21 | 国网江西省电力有限公司经济技术研究院 | 一种基于ST-Transformer模型的短期负荷预测方法及系统 |
CN117688453A (zh) * | 2024-02-02 | 2024-03-12 | 山东科技大学 | 一种基于时空嵌入注意力网络的交通流量预测方法 |
CN117688453B (zh) * | 2024-02-02 | 2024-04-30 | 山东科技大学 | 一种基于时空嵌入注意力网络的交通流量预测方法 |
CN118036477A (zh) * | 2024-04-11 | 2024-05-14 | 中国石油大学(华东) | 一种基于时空图神经网络的井位及井控参数优化方法 |
CN118114057A (zh) * | 2024-04-30 | 2024-05-31 | 西北工业大学 | 模型训练方法、径流预测方法、电子设备和存储介质 |
CN118114057B (zh) * | 2024-04-30 | 2024-07-02 | 西北工业大学 | 模型训练方法、径流预测方法、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114330671A (zh) | 一种基于Transformer时空图卷积网络的交通流预测方法 | |
CN111612206B (zh) | 一种基于时空图卷积神经网络的街区人流预测方法及系统 | |
CN111223301B (zh) | 一种基于图注意力卷积网络的交通流量预测方法 | |
CN109142171B (zh) | 基于特征扩张的融合神经网络的城市pm10浓度预测方法 | |
CN110570651A (zh) | 一种基于深度学习的路网交通态势预测方法及系统 | |
CN112949828B (zh) | 一种基于图学习的图卷积神经网络交通预测方法及系统 | |
CN112767682A (zh) | 一种基于图卷积神经网络的多尺度交通流量预测方法 | |
CN111506835B (zh) | 一种融合用户时间特征和个性特征的数据特征提取方法 | |
CN111862592B (zh) | 一种基于rgcn的交通流预测方法 | |
CN115051929B (zh) | 基于自监督目标感知神经网络的网络故障预测方法及装置 | |
CN115206092B (zh) | 一种基于注意力机制的BiLSTM和LightGBM模型的交通预测方法 | |
CN115376317B (zh) | 一种基于动态图卷积和时序卷积网络的交通流预测方法 | |
CN112116137A (zh) | 一种基于混合深度神经网络的学生辍课预测方法 | |
CN117494034A (zh) | 基于交通拥堵指数和多源数据融合的空气质量预测方法 | |
CN115862319A (zh) | 一种面向时空图自编码器的交通流量预测方法 | |
CN116307152A (zh) | 时空交互式动态图注意力网络的交通预测方法 | |
CN116168548A (zh) | 一种基于多特征融合的时空注意图卷积网络的交通流预测方法 | |
Liu et al. | A method for short-term traffic flow forecasting based on GCN-LSTM | |
CN117236492A (zh) | 基于动态多尺度图学习的交通需求预测方法 | |
CN117035013A (zh) | 一种采用脉冲神经网络预测动态网络链路的方法 | |
CN116578858A (zh) | 基于图神经网络的空压机故障预测与健康度评价方法及系统 | |
CN112115754A (zh) | 基于烟花差分进化混合算法-极限学习机的短时交通流预测模型 | |
Shi et al. | Air Quality Prediction Model Based on Spatio-temporal Graph Convolution Neural Networks | |
Liu et al. | A genetic-algorithm-based neural network approach for short-term traffic flow forecasting | |
Shen et al. | Short-Term Metro Origin-Destination Passenger Flow Prediction via Spatio-Temporal Dynamic Attentive Multi-Hypergraph Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |