CN113435658B - 一种基于时空融合相关性和注意力机制的交通流预测方法 - Google Patents
一种基于时空融合相关性和注意力机制的交通流预测方法 Download PDFInfo
- Publication number
- CN113435658B CN113435658B CN202110777603.2A CN202110777603A CN113435658B CN 113435658 B CN113435658 B CN 113435658B CN 202110777603 A CN202110777603 A CN 202110777603A CN 113435658 B CN113435658 B CN 113435658B
- Authority
- CN
- China
- Prior art keywords
- traffic
- matrix
- time
- graph
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000004927 fusion Effects 0.000 title claims abstract description 19
- 230000007246 mechanism Effects 0.000 title claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims abstract description 91
- 238000010586 diagram Methods 0.000 claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims abstract description 10
- 230000009466 transformation Effects 0.000 claims abstract description 9
- 238000013528 artificial neural network Methods 0.000 claims description 16
- 230000003044 adaptive effect Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 10
- 230000007787 long-term memory Effects 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 7
- 230000000306 recurrent effect Effects 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 6
- 125000004122 cyclic group Chemical group 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 5
- 230000015654 memory Effects 0.000 claims description 4
- 229910052739 hydrogen Inorganic materials 0.000 claims description 3
- 230000006403 short-term memory Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 230000007774 longterm Effects 0.000 abstract description 6
- 230000006978 adaptation Effects 0.000 abstract description 2
- 230000002776 aggregation Effects 0.000 abstract description 2
- 238000004220 aggregation Methods 0.000 abstract description 2
- 238000000605 extraction Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/148—Wavelet transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Algebra (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
Abstract
本发明公开了一种基于时空融合相关性和注意力机制的交通流预测方法,属于智慧城市交通预测技术领域。所述方法通过小波变换对交通流数据进行卷积操作,通过尺度超参数s在不同交通图中进行调整适应,从而可以更好提取局部空间特征,避免了原来需要规定n跳邻居来实现特征信息的聚合表示,且由于图小波矩阵是一个稀疏矩阵,所以也降低了计算复杂度。同时通过时间信息融合机制,可以更好地对时间特征进行表示,提高了长期预测的准确度。
Description
技术领域
本发明涉及一种基于时空融合相关性和注意力机制的交通流预测方法,属于智慧城市交通预测技术领域。
背景技术
作为交通管理系统的一部分,准确的交通流预测已经受到了越来越多的关注。在交通预测场景中,城市道路结构相互联系性强,往往存在非线性的结构依赖,另外交通流数据往往存在时间依赖关系,会随着时间呈现动态变化,而图神经网络作为一种用于预测非欧几里得结构数据的重要方法,非常适用于交通流预测。
图神经网络具体可以分为频域方法和空域方法两种。频域方法是通过相关信号转换分析理论将图上的信号映射到频域中并定义卷积操作。空域的方法是直接在图中定义卷积操作,虽然没有严格理论公式的限制,但是难度很大。因此,图神经网络的本质是将复杂的高维交通数据映射为低维数据,并通过迭代不断聚合交通网络中各个节点与其邻居节点的特征信息,从而在图中进行学习预测。
近年来国内外有许多研究尝试利用图神经网络方法来提取交通流中复杂的结构特征来加强预测效果,比如Zhao等人提出了一种时间图卷积网络(T-gcn),他们通过将图卷积神经网络与Gated Recurrent Unit(GRU)结合进行交通预测,Yu等人通过卷积网络以及门控机制分别对时间和空间特征进行了提取,并将其用与交通预测工作。然而,这些方法在提取局部特征表示过程中需要规定邻居结点跳数,通过n跳邻居来聚合邻接信息,无法很好地解决图卷积特征提取中缺乏灵活性和局部提取能力差地问题。另外,这些方法需要通过拉普拉斯矩阵的特征向量定义图中的卷积操作,而该这些特征向量是稠密的,因此在大型图中计算复杂度很大,而城市交通流预测往往需要面对的就是大型的图,因此这些方法在实际应用中还存在着计算时间久,算力要求大的缺点。
循环神经网络(RNN)是进行时间序列预测的主要方法之一。该网络具有记忆性,因此对序列的非线性特征进行学习时具有一定优势。近几年,国内外有许多学者对循环神经网络进行了相关的应用,但是随着时间序列的不断增加,它将逐渐遗忘过去的特征信息。总结来说,它善于提取局部时间特征信息,但是缺乏全局信息的提取能力,因此它的长期预测精度较低,而交通流预测中往往需要对长期的交通流数据进行预测来达到路线规划、城市管理的目的,所以如果简单将现有循环神经网络应用于交通流预测中,则无法进行准确预测。
综上,交通预测需要在空间维度和时间维度上面进行特征提取,而现有的方法没有很好地在空间上灵活且有效地提取特征信息,另外在实际应用中还存在计算复杂度大,计算时间长的缺点。在时间维度上则缺乏全局特征提取能力,导致长期预测准确性较差这一结果。
发明内容
为了提高交通流预测的精度,本发明提供了一种基于时空融合相关性和注意力机制的交通流预测方法,所述方法包括:
步骤S1:获取交通数据并进行预处理;所述交通数据包括交通图中各个路段之间的连通关系图对应的邻接矩阵和交通图中各个路段对应的传感器节点收集到的交通速度数据;
步骤S2:根据预处理后的交通数据,通过图小波层以及自适应矩阵获得各个路段对应的传感器节点的空间特征表示;
步骤S3:根据所述邻接矩阵计算出交通图中所有传感器节点之间的注意力权重矩阵,并根据注意力权重矩阵和步骤S2获得的各个路段对应的传感器节点的空间特征表示获得新的空间特征表示Hatten;
步骤S4:根据步骤S3获得的新的空间特征表示Hatten,分别通过改进了的循环神经网络MRNN和注意力网络层Transformer层得到各个路段对应的传感器节点的局部时间特征表示以及全局时间特征表示,然后通过时间信息融合机制将二者进行融合得到各个路段对应的传感器节点的时间特征表示;所述改进了的循环神经网络MRNN为添加了长期记忆单元的循环神经网络MRNN;
步骤S5:根据步骤S4得到的时间特征表示数据获得交通图中各个路段的交通流预测值。
可选的,所述步骤S2包括:
步骤S21通过预处理过的邻接矩阵计算出交通图的Laplace矩阵L;
步骤S22通过Laplace矩阵L计算图小波基,再对图小波基和预处理后的交通速度数据进行卷积操作得到各个路段对应的传感器节点的局部空间特征表示;
步骤S23计算自适应矩阵Wadp,获得各个路段对应的传感器节点的全局空间特征表示;
步骤S24根据步骤S22获得的局部空间特征表示和步骤S23获得的全局空间特征表示进行结合得到各个路段对应的传感器节点的空间特征表示。
可选的,所述步骤S21包括:
根据公式(3)计算出交通图的Laplace矩阵L:
其中,n表示传感器节点数,In表示单位矩阵;W表示预处理过的邻接矩阵,Wij表示预处理过的邻接矩阵W中的各个元素,i=1,2,……,n;j=1,2,……,n。
可选的,所述步骤S22包括:
利用小波变换在谱域中对交通速度数据进行卷积操作,然后通过逆变换将谱域中的卷积结果映射回图域中,从而完成对交通图中每个传感器节点的局部特征表示,如公式(4)-(7)所示:
ψs=UGsUT (4)
Gs=diag(g(sλ1),…,g(sλn)) (5)
其中,U表示Laplace矩阵的特征向量,Gs表示图小波的尺度矩阵,s用以控制图小波的尺度大小,λi是Laplace矩阵的特征值,表示频域中的交通速度数据,/>表示对交通速度数据x进行卷积操作,ψs表示图小波基,⊙表示矩阵元素对应相乘。
可选的,所述步骤S23中自适应矩阵计算公式为:
其中,E1和E2是两个自适应参数矩阵,T表示转置操作;
所述步骤S24包括:
根据公式(9)计算各个路段对应的传感器节点的空间特征表示:
其中,Λ表示图卷积操作中的卷积核,其初始化为单位矩阵;表示第l层的空间特征表示,ω1、ω2表示学习矩阵。
可选的,所述步骤S3包括:
根据公式(10)计算交通图中各个传感器节点的注意力权重矩阵:
根据公式(11)获得新的空间特征表示Hatten:
其中,d表示交通速度数据的空间特征表示的维度,ωQ、ωK、ωV表示不同的学习矩阵。
可选的,所述步骤S4包括:
根据公式(12)和(13)计算得到各个路段对应的传感器节点的局部时间特征表示HL:
HL=[z(1),...,z(T)] (13)
其中,a表示Hatten的维度序号,c表示时间序号,h(t)表示时刻t的短期记忆隐藏单元,m(t)表示时刻t的长期记忆隐层单元,表示第a维在时刻t的差分记忆参数,z(t)表示时间t的局部时间特征,1≤t≤T,HL表示最终的局部时间特征表示,K表示长期记忆滤波长度;ωzh、ωzm、ωhh、ωhx、ωd、ωm、ωc表示不同的学习权重矩阵;bz、bh、bd、bm表示不同的偏移向量;
根据公式(14)-(17)计算得到各个路段对应的传感器节点的全局时间特征表示HG:
其中,dmodel表示Hatten的维度,表示在时刻t维度f的时间嵌入表示,k表示注意力头个数,HG表示全局时间特征矩阵;
根据公式(18)将局部时间特征和全局时间特征进行信息融合,得到传感器节点的时间特征表示:
OT=Conv(RELU(ωlHL×ωGHG)) (18)
其中,ωl和ωG分别为局部时间特征和全局时间特征的权重矩阵。
可选的,若交通图中各个路段之间的连通关系图对应的邻接矩阵由0和1构成,则无需进行预处理,其中0表示两路段之间不连接,1表示两路段之间连接;若交通图中各个路段之间的连通关系图对应的邻接矩阵由表示路段之间的距离数据构成,则将表示路段之间的距离数据转换为0至1之间的数值;所述预处理过的邻接矩阵W中的各个元素Wij为:
其中,dij表示传感器节点i和传感器节点j之间的距离,σ2是方差系数,用于控制邻接矩阵的数值范围,∈是阈值,用于控制邻接权重分布矩阵的稀疏性。
可选的,所述步骤S1中对交通数据中的交通速度数据进行预处理,包括:
根据公式(2)对交通速度数据进行归一化处理,将其范围调整至区间[0,1]内:
其中,X为原始交通速度数据,min表示原始交通速度数据中的最小值,max表示原始交通速度数据中的最大值。
本发明有益效果是:
通过小波变换对交通流数据进行卷积操作,通过尺度超参数s在不同交通图中进行调整适应,从而可以更好提取局部空间特征,避免了原来需要规定n跳邻居来实现特征信息的聚合表示,且由于图小波矩阵是一个稀疏矩阵,所以也降低了计算复杂度。同时通过时间信息融合机制,可以更好地对时间特征进行表示,提高了长期预测的准确度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明方法中的所选取数据集拓扑结构图。
图2是本发明方法的网络结构图。
图3是本发明方法中的时间融合机制结构图。
图4是数据集中传感器采集数据示意图。
图5是本发明空间特征矩阵热力图。
图6是本发明在真实数据集上的预测效果图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
现有的交通监测系统中,会在各路段设有传感器以监测过往车辆的车速,本申请在对交通流进行预测时,需要获取交通图各个路段之间的连通关系图以及交通图中各个路段设置的传感器所收集到的实时交通速度数据。
实施例一:
本实施例提供一种基于时空融合相关性和注意力机制的交通流预测方法,所述方法在获取交通图各个路段之间的连通关系图以及交通图各个路段对应的传感器所收集到的实时交通速度数据后,采用下述步骤实现对于交通图中的交通流预测,包括:
S1对数据进行预处理;
实际应用中,如果要城市交通流进行预测,需要获取城市交通图,并将交通图各个路段之间的连通关系图以邻接矩阵方式存储,本申请后续以图1所示的交通图为例对本申请方法进行说明,该交通图为本申请选取的真实数据集的拓扑结构图。本申请所选择的真实数据集是美国华盛顿州西雅图地区高速公路上的车流数据Freeway traffic dataset,该数据覆盖了四条相连的高速公路:I-5、I-90、I-405和SR-520,参见图1。
本发明选取了数据清洗后2015年一整年的高质量交通数据信息,包括了323个传感器节点,采取了每隔5min的平均通行速度。
实例中的数据集中每个传感器节点代表一个路段,所选择的数据包括两个部分。第一个是所选择的交通图各个路段之间的连通关系图,以邻接矩阵的方式保存;第二个是每个路段对应的传感器所收集到的交通速度数据。
S11原始邻接矩阵可能是由0和1构成的,也可能由表示路段之间的距离数据构成。
若是由0和1构成,则0表示两路段之间不连接,1表示两路段之间连接。
若是由表示路段之间的距离数据构成,则根据公式(1)处理原始的邻接矩阵中的各元素,即将表示路段之间的距离数据转换为0至1之间的数值,得到预处理过的邻接矩阵W。
其中,预处理过的邻接矩阵W中的各元素为:
其中,dij表示传感器节点i和传感器节点j之间的距离,σ2是方差系数,用于控制邻接矩阵的数值范围,∈是阈值,用于控制邻接权重分布矩阵的稀疏性。
S12根据公式(2)对交通速度数据进行归一化处理,将其范围调整至区间[0,1]内。
其中,X为原始交通速度数据,min表示原始交通速度数据中的最小值,max表示原始交通速度数据中的最大值。
S2经过归一化处理之后的交通速度数据分别通过图小波层以及自适应矩阵获得图中各个传感器节点的局部空间特征表示以及全局空间特征表示,然后将两种空间特征表示进行结合从而获得交通速度数据的空间特征表示。
S21通过预处理过的邻接矩阵以计算出交通图的Laplace矩阵L。
其中,n表示传感器节点数,In表示单位矩阵。
S22通过Laplace矩阵L计算图小波基,再对图小波基和交通速度数据进行卷积操作得到局部空间特征表示。
利用小波变换在谱域中对交通速度数据进行卷积操作,然后通过逆变换将谱域中的卷积结果映射回图域中,从而完成对交通图中每个传感器节点的局部特征表示,如公式(4)-(7)所示。
ψs=UGsUT (4)
Gs=diag(g(sλ1),...,g(sλn)) (5)
其中,U表示Laplace矩阵的特征向量,Gs表示图小波的尺度矩阵,s用以控制图小波的尺度大小,λi是Laplace矩阵的特征值,表示频域中的交通速度数据,/>表示对交通速度数据x进行卷积操作,ψs表示图小波基,⊙表示矩阵元素对应相乘。
S23计算自适应矩阵Wadp,如公式(8)所示。
其中,E1和E2是两个自适应参数矩阵,自适应矩阵可以让网络自主地学习到一些重要的隐藏特征信息,作为提取全局空间特征信息的方法,对图小波学习到的特征信息起到补充作用。最后得到最终的空间特征表示,如公式(9)所示,其中表示第l层的空间特征表示,ω1、ω2表示学习矩阵。
其中,Λ表示图卷积操作中的卷积核,初始化为单位矩阵。
S3根据邻接矩阵计算出交通图中所有传感器节点之间的注意力关系矩阵,通过注意力权重矩阵进行空间特征表示的自相关学习,从而能更好地挖掘潜在的空间特征关系。
通过注意力机制计算交通图中各个传感器节点的注意力权重矩阵,该注意力权重矩阵其实是各个传感器节点和与其连通的传感器节点之间的相关系数,通过该注意力权重矩阵可以更好地利用交通图中重要传感器节点的空间特征信息,如公式(10)和(11)所示,其中,d表示交通速度数据的空间特征表示的维度,/>表示注意力权重矩阵,Hatten表示通过注意力权重矩阵学习到的新的空间特征表示。
其中,ωQ、ωK、ωV表示不同的学习矩阵,本实施例中,学习矩阵按正态分布进行随机初始化。
S4以交通速度数据的空间特征表示Hatten作为输入数据,分别通过MRNN和Transformer层得到交通速度数据的局部时间特征表示以及全局时间特征表示,然后通过时间信息融合机制将两部分特征表示进行融合得到交通速度数据的时间特征表示。
S41获取交通速度数据的局部时间特征表示;
由步骤S3的结果Hatten作为输入数据,通过MRNN得到交通流数据的局部时间特征表示,MRNN结构如公式(12)所示,最后可得到时间局部特征表示HL,如公式(13)所示。
HL=[z(1),...,z(T)] (13)
其中,a表示Hatten的维度序号,c表示时间序号,h(t)表示时刻t的短期记忆隐藏单元,m(t)表示时刻t的长期记忆隐层单元,表示第a维在时刻t的差分记忆参数,z(t)表示时间t的局部时间特征,1≤t≤T,HL表示最终的局部时间特征表示,K表示长期记忆滤波长度。
ωzh、ωzm、ωhh、ωhx、ωd、ωm、ωc表示不同的学习权重矩阵;bz、bh、bd、bm表示不同的偏移向量。
S42获取交通速度数据的全局时间特征表示;
若要获取交通速度数据的全局时间特征表示,首先需要得到交通速度数据的的时间嵌入表示,然后与步骤S3的结果Hatten相加得到输入数据Ht′p,然后通过Transformer层的得到交通流数据的全局时间特征表示,如公式(14)-(17)所示。其中dmodel表示Hatten的维度,1≤a≤dmodel,表示在时刻t维度f的时间嵌入表示,k表示注意力头个数,ωQ、ωK、ωV表示不同的权重矩阵,HG表示最终的全局时间特征矩阵,1≤f≤dmodel。
HG=[attenion1(H′t p),...,attenionK(H′t p)] (17)
S43将局部时间特征和全局时间特征进行信息融合,如公式(18)所示。Conv表示卷积操作,将n个时间步映射为一个时间步,ωl、ωG分别为局部时间特征和全局时间特征的权重矩阵,为按正态分布初始化的矩阵。
OT=Conv(RELU(ωlHL×ωGHG)) (18)
S5将步骤S4获得的传感器节点的时间特征矩阵OT作为输入数据,通过预测层得到最终的输出值。
为验证本申请方法的预测性能,本申请选择真实的交通流数据进行仿真实验,图1为本发明选取的真实数据集的拓扑结构图。所选择的数据集是美国华盛顿州西雅图地区高速公路上的车流数据Freeway traffic dataset,该数据覆盖了四条相连的高速公路包括了I-5、I-90、I-405和SR-520。
本发明选取了数据清洗后2015年一整年的高质量交通数据信息,包括了323个传感器节点,采取了每隔5min的平均通行速度。
图4展示了道路中传感器采集数据的示意图,传感器可以得到自身所处的地理位置信息以及通过此处的车辆的速度信息。图4中道路1和道路2属于邻接道路,传感器1和传感器2每30秒测得一组数据,然后计算5分钟的平均速度,作为最后的交通速度数据。通过全球定位系统轨迹与其对应的传感器地理位置信息进行匹配,可以得到邻接矩阵信息。
本发明提供的基于时空融合相关性和注意力机制的交通流预测模型结构框架如图2所示。通过图小波变化可以得到交通流数据的局部空间特征表示,通过自适应矩阵可以获得交通流数据的全局空间特征表示。其中,图小波矩阵是一个稀疏的矩阵,如图5所示。图5中展示了Freeway traffic dataset前50个节点的热力图,从图5中可以看到图小波矩阵相比于传统的傅里叶变换得到的Laplace矩阵的特征矩阵要稀疏很多,这方便在大型图中进行计算。将得到的输出值作为注意力层的输入,注意力层可以按照节点重要性程度进行权重的分配。
本发明的时间特征融合机制机构图如图3所示。将MRNN层得到的输出作为局部时间特征表示,将Transformer层的输出作为全局时间特征表示,然后通过相乘将两种特征表示进行融合,时间特征表示是呈现非线性关系的,所以通过Relu函数进行非线性表示,再通过卷积层将所有的历史时间进行权重加和。
本发明在Freeway traffic dataset这个真实数据集中进行了预测,其预测效果如图6所示。数据的分割策略为:数据前70%作为模型的训练集,剩下的数据中20%作为验证集,10%作为测试集。模型的批处理大小设置为32,采用Adam作为模型训练优化器。图6中通过前60分钟的历史数据来预测未来15分钟的交通速度,本申请选取了一天的预测数据,并与真实的数据进行了比较,从图6可以看出预测值与真实值的趋势一致,在突变点两者数值也基本一致,结果说明本发明有很好的拟合性。
本申请提供的预测方法,通过小波变换对交通速度数据进行卷积操作,进而获得各传感器节点的局部空间特征表示,而现有技术中,小波基通常用于数据的去噪处理,本申请创造性的提出使用小波变换提取数据的空间特征,从而使得对于交通流的预测更准确,而且由于图小波矩阵是一个稀疏矩阵,相对于现有技术中采用傅里叶变换的方法,所以也降低了计算复杂度。同时本申请方法通过时间信息融合机制,在循环神经网络的基础上增加了长期记忆单元,可以更好地对时间特征进行表示,提高了长期预测的准确度。
本发明实施例中的部分步骤,可以利用软件实现,相应的软件程序可以存储在可读取的存储介质中,如光盘或硬盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于时空融合相关性和注意力机制的交通流预测方法,其特征在于,所述方法包括:
步骤S1:获取交通数据并进行预处理;所述交通数据包括交通图中各个路段之间的连通关系图对应的邻接矩阵和交通图中各个路段对应的传感器节点收集到的交通速度数据;
步骤S2:根据预处理后的交通数据,通过图小波层以及自适应矩阵获得各个路段对应的传感器节点的空间特征表示;
步骤S3:根据所述邻接矩阵计算出交通图中所有传感器节点之间的注意力权重矩阵,并根据注意力权重矩阵和步骤S2获得的各个路段对应的传感器节点的空间特征表示获得新的空间特征表示Hatten;
步骤S4:根据步骤S3获得的新的空间特征表示Hatten,分别通过改进了的循环神经网络MRNN和注意力网络层Transformer层得到各个路段对应的传感器节点的局部时间特征表示以及全局时间特征表示,然后通过时间信息融合机制将二者进行融合得到各个路段对应的传感器节点的时间特征表示;所述改进了的循环神经网络MRNN为添加了长期记忆单元的循环神经网络MRNN;
步骤S5:根据步骤S4得到的时间特征表示数据获得交通图中各个路段的交通流预测值;
所述步骤S2包括:
步骤S21通过预处理过的邻接矩阵计算出交通图的Laplace矩阵L;
步骤S22通过Laplace矩阵L计算图小波基,再对图小波基和预处理后的交通速度数据进行卷积操作得到各个路段对应的传感器节点的局部空间特征表示;
步骤S23计算自适应矩阵Wadp,获得各个路段对应的传感器节点的全局空间特征表示;
步骤S24根据步骤S22获得的局部空间特征表示和步骤S23获得的全局空间特征表示进行结合得到各个路段对应的传感器节点的空间特征表示;
所述步骤S22包括:
利用小波变换在谱域中对交通速度数据进行卷积操作,然后通过逆变换将谱域中的卷积结果映射回图域中,从而完成对交通图中每个传感器节点的局部特征表示,如公式(4)-(7)所示:
ψs=UGsUT (4)
Gs=diag(g(sλ1),…,g(sλn)) (5)
其中,U表示Laplace矩阵的特征向量,Gs表示图小波的尺度矩阵,s用以控制图小波的尺度大小,λi是Laplace矩阵的特征值,表示频域中的交通速度数据,/>表示对交通速度数据x进行卷积操作,ψs表示图小波基,⊙表示矩阵元素对应相乘。
2.根据权利要求1所述的方法,其特征在于,所述步骤S21包括:
根据公式(3)计算出交通图的Laplace矩阵L:
其中,n表示传感器节点数,In表示单位矩阵;W表示预处理过的邻接矩阵,Wij表示预处理过的邻接矩阵W中的各个元素,i=1,2,……,n;j=1,2,……,n。
3.根据权利要求2所述的方法,其特征在于,所述步骤S23中自适应矩阵计算公式为:
其中,E1和E2是两个自适应参数矩阵,T表示转置操作;
所述步骤S24包括:
根据公式(9)计算各个路段对应的传感器节点的空间特征表示:
其中,Λ表示图卷积操作中的卷积核,其初始化为单位矩阵;表示第l层的空间特征表示,ω1、ω2表示学习矩阵。
4.根据权利要求3所述的方法,其特征在于,所述步骤S3包括:
根据公式(10)计算交通图中各个传感器节点的注意力权重矩阵:
根据公式(11)获得新的空间特征表示Hatten:
其中,d表示交通速度数据的空间特征表示的维度,ωQ、ωK、ωV表示不同的学习矩阵。
5.根据权利要求4所述的方法,其特征在于,所述步骤S4包括:
根据公式(12)和(13)计算得到各个路段对应的传感器节点的局部时间特征表示HL:
HL=[z(1),…,z(T)] (13)
其中,a表示新的空间特征表示Hatten的维度序号,c表示时间序号,h(t)表示时刻t的短期记忆隐藏单元,m(t)表示时刻t的长期记忆隐层单元,表示第a维在时刻t的差分记忆参数,z(t)表示时间t的局部时间特征,1≤t≤T,HL表示最终的局部时间特征表示,K表示长期记忆滤波长度;
ωzh、ωzm、ωhh、ωhx、ωd、ωm、ωc表示不同的学习权重矩阵;bz、bh、bd、bm表示不同的偏移向量;
根据公式(14)-(17)计算得到各个路段对应的传感器节点的全局时间特征表示HG:
HG=[attenion1(H′t p),…,attenionK(Ht′p)] (17)
其中,dmodel表示Hatten的维度,表示在时刻t维度f的时间嵌入表示,k表示注意力头个数,HG表示全局时间特征矩阵;
根据公式(18)将局部时间特征和全局时间特征进行信息融合,得到传感器节点的时间特征表示:
OT=Conv(RELU(ωlHL×ωGHG)) (18)
其中,ωl和ωG分别为局部时间特征和全局时间特征的权重矩阵。
6.根据权利要求5所述的方法,其特征在于,若交通图中各个路段之间的连通关系图对应的邻接矩阵由0和1构成,则无需进行预处理,其中0表示两路段之间不连接,1表示两路段之间连接;若交通图中各个路段之间的连通关系图对应的邻接矩阵由表示路段之间的距离数据构成,则将表示路段之间的距离数据转换为0至1之间的数值;所述预处理过的邻接矩阵W中的各个元素Wij为:
其中,dij表示传感器节点i和传感器节点j之间的距离,σ2是方差系数,用于控制邻接矩阵的数值范围,∈是阈值,用于控制邻接权重分布矩阵的稀疏性。
7.根据权利要求6所述的方法,其特征在于,所述步骤S1中对交通数据中的交通速度数据进行预处理,包括:
根据公式(2)对交通速度数据进行归一化处理,将其范围调整至区间[0,1]内:
其中,X为原始交通速度数据,min表示原始交通速度数据中的最小值,max表示原始交通速度数据中的最大值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110777603.2A CN113435658B (zh) | 2021-07-09 | 2021-07-09 | 一种基于时空融合相关性和注意力机制的交通流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110777603.2A CN113435658B (zh) | 2021-07-09 | 2021-07-09 | 一种基于时空融合相关性和注意力机制的交通流预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113435658A CN113435658A (zh) | 2021-09-24 |
CN113435658B true CN113435658B (zh) | 2024-04-30 |
Family
ID=77759742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110777603.2A Active CN113435658B (zh) | 2021-07-09 | 2021-07-09 | 一种基于时空融合相关性和注意力机制的交通流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113435658B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114492992A (zh) * | 2022-01-25 | 2022-05-13 | 重庆邮电大学 | 一种基于Transformer的自适应时空图神经网络交通流预测方法及系统 |
CN115346372B (zh) * | 2022-08-16 | 2024-01-02 | 云南公路联网收费管理有限公司 | 一种基于图神经网络的多组件融合交通流量预测方法 |
CN116050672B (zh) * | 2023-03-31 | 2023-06-20 | 山东银河建筑科技有限公司 | 基于人工智能的城市管理方法及系统 |
CN116597657A (zh) * | 2023-07-17 | 2023-08-15 | 四川省商投信息技术有限责任公司 | 基于人工智能的城市交通预测方法、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183862A (zh) * | 2020-09-29 | 2021-01-05 | 长春理工大学 | 一种城市路网的交通流量预测方法及系统 |
CN112382095A (zh) * | 2020-11-26 | 2021-02-19 | 长沙理工大学 | 一种多源数据融合的城市快速路交通状态估计方法 |
CN112801404A (zh) * | 2021-02-14 | 2021-05-14 | 北京工业大学 | 一种基于自适应空间自注意力图卷积的交通预测方法 |
-
2021
- 2021-07-09 CN CN202110777603.2A patent/CN113435658B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183862A (zh) * | 2020-09-29 | 2021-01-05 | 长春理工大学 | 一种城市路网的交通流量预测方法及系统 |
CN112382095A (zh) * | 2020-11-26 | 2021-02-19 | 长沙理工大学 | 一种多源数据融合的城市快速路交通状态估计方法 |
CN112801404A (zh) * | 2021-02-14 | 2021-05-14 | 北京工业大学 | 一种基于自适应空间自注意力图卷积的交通预测方法 |
Non-Patent Citations (1)
Title |
---|
面向路网交通流态势预测的图神经网络模型;姜山 等;《计算机科学与探索》;20210205;1084-1090 * |
Also Published As
Publication number | Publication date |
---|---|
CN113435658A (zh) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113435658B (zh) | 一种基于时空融合相关性和注意力机制的交通流预测方法 | |
CN107180530B (zh) | 一种基于深度时空卷积循环网络的路网状态预测方法 | |
CN113313947B (zh) | 短期交通预测图卷积网络的路况评估方法 | |
Long et al. | Unified spatial-temporal neighbor attention network for dynamic traffic prediction | |
CN104484911B (zh) | 基于QoE的个性化自动驾驶参数优化设定方法 | |
CN111223301A (zh) | 一种基于图注意力卷积网络的交通流量预测方法 | |
CN113591380B (zh) | 基于图高斯过程的交通流预测方法、介质及设备 | |
Yan et al. | Spatial-temporal chebyshev graph neural network for traffic flow prediction in iot-based its | |
CN111583648B (zh) | 融合gps数据和卡口流量数据的城市交通流量预测方法 | |
CN112071062B (zh) | 一种基于图卷积网络和图注意力网络的行车时间估计方法 | |
CN115578852B (zh) | 一种基于dstgcn的交通预测方法 | |
CN111047078B (zh) | 交通特征预测方法、系统及存储介质 | |
CN113538910A (zh) | 一种自适应的全链条城市区域网络信号控制优化方法 | |
CN112863182B (zh) | 基于迁移学习的跨模态数据预测方法 | |
CN110570035B (zh) | 同时建模时空依赖性和每日流量相关性的人流量预测系统 | |
CN112633602B (zh) | 一种基于gis地图信息的交通拥堵指数预测方法及装置 | |
CN113283581B (zh) | 多融合图网络协同多通道注意力模型及其应用和应用方法 | |
CN116029459B (zh) | 结合图傅里叶变换tmgcn交通流预测模型的提取方法 | |
CN115376317B (zh) | 一种基于动态图卷积和时序卷积网络的交通流预测方法 | |
CN116052427B (zh) | 基于私家车出行轨迹数据的城市间跨区域移动性预测方法及装置 | |
CN116596151B (zh) | 基于时空图注意力的交通流量预测方法及计算设备 | |
CN115966083A (zh) | 一种基于时空解耦的分布式交通流预测方法与系统 | |
CN116913088A (zh) | 一种用于高速公路的智能流量预测方法 | |
CN112101132B (zh) | 一种基于图嵌入模型和度量学习的交通状况预测方法 | |
US20240029556A1 (en) | Short-term traffic flow prediction method based on causal gated-low-pass graph convolutional network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |