CN115938112A - 交通需求预测方法、系统、电子设备及计算机存储介质 - Google Patents
交通需求预测方法、系统、电子设备及计算机存储介质 Download PDFInfo
- Publication number
- CN115938112A CN115938112A CN202211470118.1A CN202211470118A CN115938112A CN 115938112 A CN115938112 A CN 115938112A CN 202211470118 A CN202211470118 A CN 202211470118A CN 115938112 A CN115938112 A CN 115938112A
- Authority
- CN
- China
- Prior art keywords
- time
- characteristic
- matrix
- attention
- head
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 239000011159 matrix material Substances 0.000 claims abstract description 139
- 238000000605 extraction Methods 0.000 claims abstract description 49
- 230000002123 temporal effect Effects 0.000 claims description 21
- 230000007246 mechanism Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 6
- 238000005065 mining Methods 0.000 abstract description 5
- 238000004364 calculation method Methods 0.000 description 13
- 238000013527 convolutional neural network Methods 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 11
- 238000011160 research Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 3
- 238000009792 diffusion process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000012733 comparative method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种交通需求预测方法、系统、电子设备及计算机存储介质,涉及智慧交通技术领域,方法包括获取交通数据中的时序特征;根据所述时序特征进行时序信息编码,得到输入特征矩阵;根据所述输入特征矩阵利用时间上的多头门控自注意力提取模块进行特征提取,得到带有时间特征的特征矩阵;根据所述带有时间特征的特征矩阵利用空间上的多头门控递归图注意力模块进行特征提取,得到带有时间特征和空间特征的特征矩阵;获取预设时间交通数据;根据所述预设时间交通数据和所述带有时间特征和空间特征的特征矩阵确定预测结果。本发明通过充分挖掘交通数据中的时空特征,从而实现快速且准确地对城市交通需求进行预测。
Description
技术领域
本发明涉及智慧交通技术领域,特别是涉及一种交通需求预测方法、系统、电子设备及计算机存储介质。
背景技术
近几年,随着城市交通的快速发展,人们的交通需求日益增大,越来越多的城市致力于发展智能交通系统(ITS)。这也引起众多学者对相关问题展开了研究,如城市交通信号灯配时优化、轨道交通线路规划和出行路线个性化推荐等。其中需要解决的基本问题是交通需求预测。通过预知城市各区域交通需求数量,可以预先合理地分配交通资源,从而缓解交通拥堵,节省出行者的交通时间和避免公共资源的浪费。为了给人们的日常出行提供更好的服务,以及最大化利用交通资源,进行交通需求的预测是十分有必要的。
后来,随着卷积神经网络(Convolutional Neural Network,CNN)和递归神经网络(Recurrent Neural Network,RNN)分别在计算机图像处理领域和自然语言处理(NaturalLanguage Processing,NLP)领域的广泛应用,越来越多的研究工作开始将深度神经网络应用于交通预测上。这些研究工作可以分为基于卷积神经网络的方法、基于循环神经网络的方法,和融合了卷积神经网络和循环神经网络的方法。与之前传统的参数模型方法和传统的机器学习方法相比,这些基于深度学习的方法能够在不过度依赖人工的情况下取得更好的效果。虽然这些方法能够取得一定的成功,但是准确的、长期的预测仍然存在需要解决的问题。众所周知,城市交通需求数据是一种时空数据,描述的是城市内不同区域或站点沿着时间维度产生的交通需求量。需要解决的问题就是如何对这种时空数据同时考虑时间和空间维度的建模。
对于时间维度的特征提取,现有的研究工作要么采用的是循环神经网络的方式,要么采用一维卷积神经网络的方式。现有的基于循环神经网络的研究工作中采用的是长短期记忆(Long Short-Term Memory,LSTM)或门控递归单元(Gate Recurrent Unit,GRU)捕捉时间相关性,但是RNN在捕捉时间相关性时容易受到梯度消失的影响,这在长期预测问题中尤为严重。现有的基于卷积神经网络的研究工作中采用的是一维卷积的方式,而卷积核的感受野范围有限,因此只能从局部来观测时序序列中的依赖关系。
对于空间维度的特征提取,现有的研究工作要么采用的是卷积神经网络的方式,要么采用的是图卷积神经网络的方式。研究者们尝试将整个交通研究区域网格化,使用卷积神经网络来提取空间相关性。但是由于道路网络的拓扑结构,站点与站点之间的往往呈现的是一种非欧几里得空间关系。传统的卷积神经网络对这种非结构化的数据无法正确地提取特征,即传统的离散卷积在非欧几里得结构数据上无法保持平移不变性。后来,由于图卷积神经网络(Graph Convolution Networks,GCN)在处理非欧几里得结构数据时具有出色的表现,它可以建立拓扑关联,进而有效地提取空间特征,所以近几年图卷积神经网络也被广泛应用于交通领域。但是,在图卷积操作中,往往需要昂贵的矩阵运算并且过渡依赖于图的结构信息,因此需要取得满意的效果也是很困难的。
现有的方法未能充分挖掘出时空特征信息,且拓展性查,求解精度较低等缺点。
发明内容
本发明的目的是提供一种交通需求预测方法、系统、电子设备及计算机存储介质,通过充分挖掘交通数据中的时空特征,从而实现快速且准确地对城市交通需求进行预测。
为实现上述目的,本发明提供了如下方案:
一种交通需求预测方法,包括:
获取交通数据中的时序特征;
根据所述时序特征进行时序信息编码,得到输入特征矩阵;所述输入特征矩阵包括全局时间特征矩阵和局部时间特征矩阵;
根据所述输入特征矩阵利用时间上的多头门控自注意力提取模块进行特征提取,得到带有时间特征的特征矩阵;
根据所述带有时间特征的特征矩阵利用空间上的多头门控递归图注意力模块进行特征提取,得到带有时间特征和空间特征的特征矩阵;
获取预设时间交通数据;
根据所述预设时间交通数据和所述带有时间特征和空间特征的特征矩阵确定预测结果。
可选地,所述输入特征矩阵的表达式为:
Xt (0)=Xt+GEt+PEt
其中,Xt (0)为输入特征矩阵,Xt为时间步t的交通需求特征矩阵,GEt为全局时间特征矩阵,PEt为局部时间特征矩阵,t为时间步。
可选地,所述根据所述输入特征矩阵利用时间上的多头门控自注意力提取模块进行特征提取,得到带有时间特征的特征矩阵,具体包括:
根据所述输入特征矩阵利用自注意力机制进行处理,得到时序数据;
根据所述时序数据进行门控操作,得到带有时间特征的特征矩阵;所述门控操作包括线性投影和sigmoid操作。
可选地,所述根据所述预设时间交通数据和所述带有时间特征和空间特征的特征矩阵确定预测结果,具体包括:
将所述预设时间交通数据进行全局时间特征和局部时间特征嵌入,得到解码器输入;
根据所述解码器输入利用带遮挡的时间上的多头门控自注意力进行处理,得到时序信息;
根据所述时序信息和所述带有时间特征和空间特征的特征矩阵利用所述时间上的多头门控自注意力提取模块确定时间上的多头门控自注意力提取模块输出结果;
根据所述时间上的多头门控自注意力提取模块输出结果和所述带有时间特征和空间特征的特征矩阵利用所述空间上的多头门控递归图注意力模块确定预测结果。
本发明还提供一种交通需求预测系统,包括:
时序特征获取模块,用于获取交通数据中的时序特征;
时序信息编码模块,用于根据所述时序特征进行时序信息编码,得到输入特征矩阵;所述输入特征矩阵包括全局时间特征矩阵和局部时间特征矩阵;
多头门控自注意力提取模块,用于根据所述输入特征矩阵利用时间上的多头门控自注意力提取模块进行特征提取,得到带有时间特征的特征矩阵;
多头门控递归图注意力模块模块,用于根据所述带有时间特征的特征矩阵利用空间上的多头门控递归图注意力模块进行特征提取,得到带有时间特征和空间特征的特征矩阵;
预设时间交通数据获取模块,用于获取预设时间交通数据;
预测模块,用于根据所述预设时间交通数据和所述带有时间特征和空间特征的特征矩阵确定预测结果。
可选地,所述输入特征矩阵的表达式为:
可选地,所述多头门控自注意力提取模块,具体包括:
自注意力机制单元,用于根据所述输入特征矩阵利用自注意力机制进行处理,得到时序数据;
门控操作单元,用于根据所述时序数据进行门控操作,得到带有时间特征的特征矩阵;所述门控操作包括线性投影和sigmoid操作。
可选地,所述预测模块,具体包括:
嵌入单元,用于将所述预设时间交通数据进行全局时间特征和局部时间特征嵌入,得到解码器输入;
时序信息确定单元,用于根据所述解码器输入利用带遮挡的时间上的多头门控自注意力进行处理,得到时序信息;
解码器时间上的多头门控自注意力提取模块输出结果确定单元,用于根据所述时序信息和所述带有时间特征和空间特征的特征矩阵利用所述时间上的多头门控自注意力提取模块确定时间上的多头门控自注意力提取模块输出结果;
预测单元,用于根据所述时间上的多头门控自注意力提取模块输出结果和所述带有时间特征和空间特征的特征矩阵利用所述空间上的多头门控递归图注意力模块确定预测结果。
本发明还提供一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述任意一项所述的方法。
本发明还提供一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上述任意一项所述的方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明获取交通数据中的时序特征;根据所述时序特征进行时序信息编码,得到输入特征矩阵;所述输入特征矩阵包括全局时间特征矩阵和局部时间特征矩阵;根据所述输入特征矩阵利用时间上的多头门控自注意力提取模块进行特征提取,得到带有时间特征的特征矩阵;根据所述带有时间特征的特征矩阵利用空间上的多头门控递归图注意力模块进行特征提取,得到带有时间特征和空间特征的特征矩阵;获取预设时间交通数据;根据所述预设时间交通数据和所述带有时间特征和空间特征的特征矩阵确定预测结果,通过充分挖掘交通数据中的时空特征,从而实现快速且准确地对城市交通需求进行预测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的交通需求预测方法总览图;
图2为本发明提供的多头门控自注意力提取模块示意图;
图3为本发明提供的多头门控递归图注意力模块示意图;
图4为本发明提供的交通需求预测方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种交通需求预测方法、系统、电子设备及计算机存储介质,通过充分挖掘交通数据中的时空特征,从而实现快速且准确地对城市交通需求进行预测。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1和图4所示,本发明提供的一种交通需求预测方法,专门适用于交通需求的多变量时序预测,包括:
步骤101:获取交通数据中的时序特征。
步骤102:根据所述时序特征进行时序信息编码,得到输入特征矩阵;所述输入特征矩阵包括全局时间特征矩阵和局部时间特征矩阵。
时序信息编码:通过设计一个时序信息编码模块完成,采用了局部时间信息和全局时间信息嵌入的方案,假设在时间步t,有特征矩阵Xt,并可以从时间步t得到该时间所属的分钟、小时、第几天、第几周、月份等维度的信息,可以通过线性层将维度投影到f′维,得到t时间步交通需求的全局时间特征矩阵N为需要预测的虚拟区域个数;而局部时间特征矩阵的获取则使用了相对位置编码,如公式(1)所示:
其中pos∈{1,2,...}表示位于时序序列中的位置,pi∈{1,2,...,f′}表示位于特征序列中的位置。通过公式(1)可得到t时间步交通需求的局部时间特征矩阵则在t时间步,包含全局时间特征和局部时间特征嵌入的输入特征矩阵可由公式(2)计算得到:
步骤103:根据所述输入特征矩阵利用时间上的多头门控自注意力提取模块进行特征提取,得到带有时间特征的特征矩阵。
步骤103,具体包括:根据所述输入特征矩阵利用自注意力机制进行处理,得到时序数据;根据所述时序数据进行门控操作,得到带有时间特征的特征矩阵;所述门控操作包括线性投影和sigmoid操作。
时序特征提取:通过设计一个如图2所示的时间上的多头门控自注意力提取模块完成,主要由自注意力机制和门控操作组成。自注意力机制是注意力机制的一种变体形式,其减少了对外部信息的依赖,更擅长捕捉数据的内部相关性。其定义如公式(3)所示:
其中,Q、K、V和f′分别代表查询、键、值和它们的维度,在时间维度T上,键和值的维度相同,查询的维度可以和键值不同,如图2中的时间长度Tq和Tv可以是不等的,Q、K、和V三者都是站点沿时间维度的上的二维特征矩阵,Attention(Q,K,V)为自注意力计算公式。
使用多头自注意力机制可以使得该方法同时关注来自不同位置的不同表示子空间的信息,为了减少弱相关信息的影响,添加了一个输出门来控制,对时序数据进行线性投影和sigmoid操作,从而能够学习到一种模式来控制经过多头自注意力机制的输出结果。在时间上的多头门控自注意力模块定义如公式(4)所示:
其中,h表示头的个数,d=f′/h,d为单个头中的维度大小,⊙为Hadamard乘积,Qi=QWi Q i={1,2,...,h},Ki=KWi K,Vi=VWi V,Qi′=QWi Q′,参数矩阵Wi Q,Wi K,Wi V和headi为第i个头的门控自注意力计算。Qi′为第i个头的查询值映射计算,σ为Sigmoid计算,GatedSelfAttention为带门控的多头自注意力计算值。
步骤104:根据所述带有时间特征的特征矩阵利用空间上的多头门控递归图注意力模块进行特征提取,得到带有时间特征和空间特征的特征矩阵。
空间特征提取:通过设计一个如图3所示的空间上的多头门控递归图注意力模块来完成,主要由GAT和GRU组成。GAT同GCN一样可以将传统的卷积操作从结构化数据推广到图结构数据,并且能够捕捉隐藏在图中的非结构化信息。GAT的总体思想是使用注意力网络来对邻域内节点信息进行聚合,即用子网络来计算邻居节点对目标节点的重要程度,然后根据计算出来的重要程度对邻居节点做聚合,而子网络是可学习的,这增强了泛化能力。在本发明方法中,给定t时间步的输入特征矩阵其中表示t时间步i节点的特征信息,目标节点i与所有邻居节点j(j=1,2,...,N)的相关度计算如公式(5):
若在不同的时间点对数据使用图注意力提取空间特征,则假设了不同时间点的空间特征分布是独立的,而这是不成立的。因为这一时间步的空间特征分布影响了下一时间步的空间特征分布,所以有必要利用上一时间步的空间特征分布信息捕获这一时间步的空间特征分布。为了捕捉这种跨空间维度的动态信息,进一步设计了一个门控递归图注意力单元(Gate Recurrent GraphAttention Unit,GRGAU),计算公式定义如下:
其中,和分别为输入和输出的特征矩阵,Rt为重置门,Zt为更新门,Wxr、Wxz、Wxh、Whr、Whz和br、bz和都是参数矩阵,为计算流程中的参数,tanh为激活函数,Xt′为多头门控图注意力计算结果,为t时刻的隐藏状态。
步骤105:获取预设时间交通数据。
步骤106:根据所述预设时间交通数据和所述带有时间特征和空间特征的特征矩阵确定预测结果。
步骤106,具体包括:
将所述预设时间交通数据进行全局时间特征和局部时间特征嵌入,得到解码器输入。
根据所述解码器输入利用带遮挡的时间上的多头门控自注意力进行处理,得到时序信息。
根据所述时序信息和所述带有时间特征和空间特征的特征矩阵利用所述时间上的多头门控自注意力提取模块确定时间上的多头门控自注意力提取模块输出结果。
根据所述时间上的多头门控自注意力提取模块输出结果和所述带有时间特征和空间特征的特征矩阵利用所述空间上的多头门控递归图注意力模块确定预测结果。
构造编解码器结构:同多数编解结构相同,本发明的编码器由Le层相同的编码层组成,每一层由两个基本模块组成,即时间上的多头门控自注意力模块和空间上的多头门控递归图注意力模块,两者分别捕捉交通需求数据在时间维度上的特征和在空间维度上的特征。解码器由Ld层相同的解码器层组成,每一层由三个基本模块组成,两个时间的多头门控自注意力模块和一个空间的多头门控递归图注意力模块。时间的多头门控自注意力模块和编码器中的有所不同,第一个模块捕捉解码器输入序列中的时序信息,并使用了masked机制来防止每个时序位置关注到未来的序列信息;第二个模块用来捕捉解码器序列(查询)和编码器输出序列(键值)的相关性。空间的多头门控递归图注意力模块也和编码器中的有所不同,初始的隐藏状态输入为编码器最后输出的隐藏状态经过解码器Ld层后,可得到输出再经过线性层将维度f′映射回f,截取末尾Tp个时间步的交通需求特征矩阵,得到最终的预测结果本发明中除全局时间增嵌入和局部时间嵌入外,其他模块之间均采用残差连接和层归一化以确保模型在层数加深时仍然能够得到有效地训练。
在本发明中,首先,使用了带门控的自注意力来提取序列中的时序特征。其次,使用了图注意力来捕捉非结构化空间中不同变量之间的空间依赖性。最后,提出了使用门控递归单元与隐藏的空间状态相结合,以捕捉到多层次的空间依赖。
本实施实例采用了纽约市出租车数据集和旧金山湾区自行车数据集进行实验分析。数据集的相关信息如表1所示。
表1数据集统计表
采用平均绝对误差(MAE)、均方根误差(RMSE)来评估不同方法的预测性能。两者定义如下:
如表2所示,本发明对比的方法如下,HA:计算历史需求值的平均值来预测未来值。SVR:一种利用线性支持向量机来进行回归任务的方法。XGBoost:一种基于梯度提升树的方法。FC-LSTM:一种将LSTM和前馈神经网络结合的方法。LSTNet:一种将卷积神经网络和递归神经网络结合的方法。Graph WaveNet:一种空间-时间图卷积网络,它将扩散图卷积与扩张卷积结合起来。MTGNN:一种适用于多变量时序预测的图神经网络框架,它设计了专门的图学习模块提取变量之间的依赖关系。
本发明的设置如下,将所有数据集按7:1:2的比例分为训练集、验证集和测试集,并使用标准归一化方法。历史时间步长Th设置为12,预测时间步长Tp设置为12,预测前Tb个步长设置为Th/2。使用Pytorch框架来实现GSTGAT方法,学习率设置为0.001,batch size设置为32。所有的方法都由Adam算法进行优化,使用MSE作为损失函数。使用Early Stopping方法来防止过拟合,patience设置为5,训练的epochs不超过100。对于所有比较的方法,调整它们的关键参数,以确保具有最佳性能。
所有实验都是重复训练5次的平均结果,表2显示了在预测时间步长为12时,本发明方法和其它方法的比较结果。本发明方法在两个数据集上都取得了最好的表现结果。由于纽约市出租车的需求相比于旧金山湾区的自行车的需求要大得多,因此各种方法在出租车数据集上计算出的评价指标都要比自行车数据集上的值要大。
HA、SVR、XGBoost、FC-LSTM的表现较差,因为这些方法只考虑了时间相关性,没有考虑空间相关性。LSTNet将递归神经网络和卷积神经网络结合起来,同时捕捉了时间相关性和空间相关性,因此相比于前几种方法效果更好。GraphWaveNet和MTGNN采用了图卷积来捕捉空间相关性,因此在这种非结构化的数据上有更好的表现,虽然这两种方法都提出了自适应的邻接矩阵,但在没有给定图邻接矩阵的情况下,这两种方法都不能有效的进行预测。在纽约市出租车数据集上,本发明提供的方法在MAE和RMSE上分别比最近的方法MTGNN提高了5.4%和3.2%,在旧金山湾区自行车数据上,本发明提供的方法在MAE和RMSE上分别比最近的方法MTGNN提高了3.7%和4.1%。
表2不同方法在纽约出租车和旧金山湾区自行车数据集上的实验比较表
本发明还提供一种交通需求预测系统,包括:
时序特征获取模块,用于获取交通数据中的时序特征。
时序信息编码模块,用于根据所述时序特征进行时序信息编码,得到输入特征矩阵;所述输入特征矩阵包括全局时间特征矩阵和局部时间特征矩阵。
多头门控自注意力提取模块,用于根据所述输入特征矩阵利用时间上的多头门控自注意力提取模块进行特征提取,得到带有时间特征的特征矩阵。
多头门控递归图注意力模块模块,用于根据所述带有时间特征的特征矩阵利用空间上的多头门控递归图注意力模块进行特征提取,得到带有时间特征和空间特征的特征矩阵。
预设时间交通数据获取模块,用于获取预设时间交通数据。
预测模块,用于根据所述预设时间交通数据和所述带有时间特征和空间特征的特征矩阵确定预测结果。
作为一种可选地实施方式,所述输入特征矩阵的表达式为:
作为一种可选地实施方式,所述多头门控自注意力提取模块,具体包括:
自注意力机制单元,用于根据所述输入特征矩阵利用自注意力机制进行处理,得到时序数据。
门控操作单元,用于根据所述时序数据进行门控操作,得到带有时间特征的特征矩阵;所述门控操作包括线性投影和sigmoid操作。
作为一种可选地实施方式,所述预测模块,具体包括:
嵌入单元,用于将所述预设时间交通数据进行全局时间特征和局部时间特征嵌入,得到解码器输入。
时序信息确定单元,用于根据所述解码器输入利用带遮挡的时间上的多头门控自注意力进行处理,得到时序信息。
解码器时间上的多头门控自注意力提取模块输出结果确定单元,用于根据所述时序信息和所述带有时间特征和空间特征的特征矩阵利用所述时间上的多头门控自注意力提取模块确定时间上的多头门控自注意力提取模块输出结果。
预测单元,用于根据所述时间上的多头门控自注意力提取模块输出结果和所述带有时间特征和空间特征的特征矩阵利用所述空间上的多头门控递归图注意力模块确定预测结果。
本发明还提供一种电子设备,包括:
一个或多个处理器。
存储装置,其上存储有一个或多个程序。
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述中任意一项所述的方法。
本发明还提供一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上述中任意一项所述的方法。
本发明公开一种基于门控时空图注意力的城市交通需求预测方法,依次包含以下步骤:通过设计一个采用局部时间信息和全局时间信息嵌入的方案完成了时序信息编码;通过自注意力机制结合门控操作的方案完成了时序特征提取;通过结合图注意力网络和门控递归单元的方案完成了空间特征提取;最后通过构造出编解码器实现了城市交通需求预测方法,能够实现端到端的运行。本发明实例还在纽约市出租车数据集和旧金山自行车数据集上进行了实验对比分析,通过RMSE和MAE这两个评价指标做出了定量分析,从而验证了提出的方法预测的准确性。本发明可拓展性高、鲁棒性好、实用性全面,可为智慧城市交通提供必要的参考,十分便利于交通运营管理,具有广阔的应用空间。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种交通需求预测方法,其特征在于,包括:
获取交通数据中的时序特征;
根据所述时序特征进行时序信息编码,得到输入特征矩阵;所述输入特征矩阵包括全局时间特征矩阵和局部时间特征矩阵;
根据所述输入特征矩阵利用时间上的多头门控自注意力提取模块进行特征提取,得到带有时间特征的特征矩阵;
根据所述带有时间特征的特征矩阵利用空间上的多头门控递归图注意力模块进行特征提取,得到带有时间特征和空间特征的特征矩阵;
获取预设时间交通数据;
根据所述预设时间交通数据和所述带有时间特征和空间特征的特征矩阵确定预测结果。
2.根据权利要求1所述的交通需求预测方法,其特征在于,所述输入特征矩阵的表达式为:
Xt (0)=Xt+GEt+PEt
其中,Xt (0)为输入特征矩阵,Xt为时间步t的交通需求特征矩阵,GEt为全局时间特征矩阵,PEt为局部时间特征矩阵,t为时间步。
3.根据权利要求1所述的交通需求预测方法,其特征在于,所述根据所述输入特征矩阵利用时间上的多头门控自注意力提取模块进行特征提取,得到带有时间特征的特征矩阵,具体包括:
根据所述输入特征矩阵利用自注意力机制进行处理,得到时序数据;
根据所述时序数据进行门控操作,得到带有时间特征的特征矩阵;所述门控操作包括线性投影和sigmoid操作。
4.根据权利要求1所述的交通需求预测方法,其特征在于,所述根据所述预设时间交通数据和所述带有时间特征和空间特征的特征矩阵确定预测结果,具体包括:
将所述预设时间交通数据进行全局时间特征和局部时间特征嵌入,得到解码器输入;
根据所述解码器输入利用带遮挡的时间上的多头门控自注意力进行处理,得到时序信息;
根据所述时序信息和所述带有时间特征和空间特征的特征矩阵利用所述时间上的多头门控自注意力提取模块确定时间上的多头门控自注意力提取模块输出结果;
根据所述时间上的多头门控自注意力提取模块输出结果和所述带有时间特征和空间特征的特征矩阵利用所述空间上的多头门控递归图注意力模块确定预测结果。
5.一种交通需求预测系统,其特征在于,包括:
时序特征获取模块,用于获取交通数据中的时序特征;
时序信息编码模块,用于根据所述时序特征进行时序信息编码,得到输入特征矩阵;所述输入特征矩阵包括全局时间特征矩阵和局部时间特征矩阵;
多头门控自注意力提取模块,用于根据所述输入特征矩阵利用时间上的多头门控自注意力提取模块进行特征提取,得到带有时间特征的特征矩阵;
多头门控递归图注意力模块模块,用于根据所述带有时间特征的特征矩阵利用空间上的多头门控递归图注意力模块进行特征提取,得到带有时间特征和空间特征的特征矩阵;
预设时间交通数据获取模块,用于获取预设时间交通数据;
预测模块,用于根据所述预设时间交通数据和所述带有时间特征和空间特征的特征矩阵确定预测结果。
6.根据权利要求5所述的交通需求预测系统,其特征在于,所述输入特征矩阵的表达式为:
Xt (0)=Xt+GEt+PEt
其中,Xt (0)为输入特征矩阵,Xt为时间步t的交通需求特征矩阵,GEt为全局时间特征矩阵,PEt为局部时间特征矩阵,t为时间步。
7.根据权利要求5所述的交通需求预测系统,其特征在于,所述多头门控自注意力提取模块,具体包括:
自注意力机制单元,用于根据所述输入特征矩阵利用自注意力机制进行处理,得到时序数据;
门控操作单元,用于根据所述时序数据进行门控操作,得到带有时间特征的特征矩阵;所述门控操作包括线性投影和sigmoid操作。
8.根据权利要求5所述的交通需求预测系统,其特征在于,所述预测模块,具体包括:
嵌入单元,用于将所述预设时间交通数据进行全局时间特征和局部时间特征嵌入,得到解码器输入;
时序信息确定单元,用于根据所述解码器输入利用带遮挡的时间上的多头门控自注意力进行处理,得到时序信息;
解码器时间上的多头门控自注意力提取模块输出结果确定单元,用于根据所述时序信息和所述带有时间特征和空间特征的特征矩阵利用所述时间上的多头门控自注意力提取模块确定时间上的多头门控自注意力提取模块输出结果;
预测单元,用于根据所述时间上的多头门控自注意力提取模块输出结果和所述带有时间特征和空间特征的特征矩阵利用所述空间上的多头门控递归图注意力模块确定预测结果。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至4中任意一项所述的方法。
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至4中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211470118.1A CN115938112B (zh) | 2022-11-23 | 2022-11-23 | 交通需求预测方法、系统、电子设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211470118.1A CN115938112B (zh) | 2022-11-23 | 2022-11-23 | 交通需求预测方法、系统、电子设备及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115938112A true CN115938112A (zh) | 2023-04-07 |
CN115938112B CN115938112B (zh) | 2024-08-23 |
Family
ID=86556903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211470118.1A Active CN115938112B (zh) | 2022-11-23 | 2022-11-23 | 交通需求预测方法、系统、电子设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115938112B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116862573A (zh) * | 2023-09-05 | 2023-10-10 | 华侨大学 | 基于增量训练的城际网约车短期出行需求预测方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183862A (zh) * | 2020-09-29 | 2021-01-05 | 长春理工大学 | 一种城市路网的交通流量预测方法及系统 |
CN113065690A (zh) * | 2021-03-19 | 2021-07-02 | 浙江财经大学 | 一种交通预测方法及装置 |
CN114493014A (zh) * | 2022-01-28 | 2022-05-13 | 湖南大学 | 多元时间序列预测方法、系统及计算机产品、存储介质 |
CN114492992A (zh) * | 2022-01-25 | 2022-05-13 | 重庆邮电大学 | 一种基于Transformer的自适应时空图神经网络交通流预测方法及系统 |
CN114742210A (zh) * | 2022-05-10 | 2022-07-12 | 浙江师范大学 | 混合神经网络训练方法、交通流预测方法、设备和介质 |
US11495055B1 (en) * | 2021-11-10 | 2022-11-08 | Huazhong University Of Science And Technology | Pedestrian trajectory prediction method and system based on multi-interaction spatiotemporal graph network |
CN115346372A (zh) * | 2022-08-16 | 2022-11-15 | 重庆邮电大学 | 一种基于图神经网络的多组件融合交通流量预测方法 |
-
2022
- 2022-11-23 CN CN202211470118.1A patent/CN115938112B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183862A (zh) * | 2020-09-29 | 2021-01-05 | 长春理工大学 | 一种城市路网的交通流量预测方法及系统 |
CN113065690A (zh) * | 2021-03-19 | 2021-07-02 | 浙江财经大学 | 一种交通预测方法及装置 |
US11495055B1 (en) * | 2021-11-10 | 2022-11-08 | Huazhong University Of Science And Technology | Pedestrian trajectory prediction method and system based on multi-interaction spatiotemporal graph network |
CN114492992A (zh) * | 2022-01-25 | 2022-05-13 | 重庆邮电大学 | 一种基于Transformer的自适应时空图神经网络交通流预测方法及系统 |
CN114493014A (zh) * | 2022-01-28 | 2022-05-13 | 湖南大学 | 多元时间序列预测方法、系统及计算机产品、存储介质 |
CN114742210A (zh) * | 2022-05-10 | 2022-07-12 | 浙江师范大学 | 混合神经网络训练方法、交通流预测方法、设备和介质 |
CN115346372A (zh) * | 2022-08-16 | 2022-11-15 | 重庆邮电大学 | 一种基于图神经网络的多组件融合交通流量预测方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116862573A (zh) * | 2023-09-05 | 2023-10-10 | 华侨大学 | 基于增量训练的城际网约车短期出行需求预测方法及系统 |
CN116862573B (zh) * | 2023-09-05 | 2023-12-05 | 华侨大学 | 基于增量训练的城际网约车短期出行需求预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115938112B (zh) | 2024-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860951B (zh) | 一种基于动态超图卷积网络的轨道交通客流预测方法 | |
Zhang et al. | DNEAT: A novel dynamic node-edge attention network for origin-destination demand prediction | |
CN111612243B (zh) | 交通速度预测方法、系统及存储介质 | |
Bai et al. | Spatio-temporal graph convolutional and recurrent networks for citywide passenger demand prediction | |
Ye et al. | Attention-based spatio-temporal graph convolutional network considering external factors for multi-step traffic flow prediction | |
Bao et al. | Spatial–temporal complex graph convolution network for traffic flow prediction | |
Zhang et al. | A Traffic Prediction Method of Bicycle-sharing based on Long and Short term Memory Network. | |
Li et al. | Graph CNNs for urban traffic passenger flows prediction | |
CN111009129B (zh) | 基于时空深度学习模型的城市道路交通流预测方法及装置 | |
CN115440032A (zh) | 一种长短期公共交通流量预测方法 | |
CN116128122A (zh) | 一种考虑突发因素的城市轨道交通短时客流预测方法 | |
CN110570035A (zh) | 同时建模时空依赖性和每日流量相关性的人流量预测系统 | |
Xiong et al. | DCAST: a spatiotemporal model with DenseNet and GRU based on attention mechanism | |
Danfeng et al. | Subway passenger flow forecasting with multi-station and external factors | |
CN115938112A (zh) | 交通需求预测方法、系统、电子设备及计算机存储介质 | |
CN117475638B (zh) | 基于多通道超图卷积网络的交通od客流预测方法及系统 | |
Chen et al. | Prediction of public bus passenger flow using spatial–temporal hybrid model of deep learning | |
CN118262516A (zh) | 一种基于多种注意力神经网络的车辆交通预测方法及系统 | |
Huang et al. | Multistep coupled graph convolution with temporal-attention for traffic flow prediction | |
CN117392846A (zh) | 一种时空自适应图学习融合动态图卷积的交通流预测方法 | |
CN117593878A (zh) | 一种突发事件下的城市轨道交通短时od需求预测方法 | |
Li et al. | TwoResNet: Two-level resolution neural network for traffic forecasting on freeway networks | |
CN116739170A (zh) | 一种基于自适应超图的交通预测方法及系统 | |
ABBAS | A survey of research into artificial neural networks for crime prediction | |
He et al. | Dyna-PTM: OD-enhanced GCN for metro passenger flow prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |