CN114299723A - 一种交通流量预测方法 - Google Patents

一种交通流量预测方法 Download PDF

Info

Publication number
CN114299723A
CN114299723A CN202210139206.7A CN202210139206A CN114299723A CN 114299723 A CN114299723 A CN 114299723A CN 202210139206 A CN202210139206 A CN 202210139206A CN 114299723 A CN114299723 A CN 114299723A
Authority
CN
China
Prior art keywords
data
layer
space
traffic
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210139206.7A
Other languages
English (en)
Other versions
CN114299723B (zh
Inventor
王玲
贾高峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN202210139206.7A priority Critical patent/CN114299723B/zh
Publication of CN114299723A publication Critical patent/CN114299723A/zh
Application granted granted Critical
Publication of CN114299723B publication Critical patent/CN114299723B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种交通流量预测方法,属于智能交通领域。所述方法包括:获取训练集,所述训练集包括:周期数据和近期数据,其中,周期数据为以周为周期的历史交通数据,近期数据为近期时间段的历史交通数据;其中,所述交通数据包括:交通流量、交通速度和道路占有率;构建交通流量预测模型,将周期数据和近期数据作为交通流量预测模型的输入,训练所述交通流量预测模型,以预测未来时间段的交通流量;采集当前时刻的交通数据,将采集的当前时刻的交通数据输入训练好的交通流量预测模型,预测未来时间段的交通流量。采用本发明,能够提高城市交通流量预测值的精度。

Description

一种交通流量预测方法
技术领域
本发明涉及智能交通领域,特别是指一种交通流量预测方法。
背景技术
交通流量预测是智能交通系统中最具挑战性的任务之一,这项任务对于许多交通服务(如车流控制、道路行程规划和导航等)都是非常重要和关键的。城市级道路交通流量的预测在实际生产中具有重要意义。然而其性能受到道路网络结构、以及复杂多变的实际交通状况影响,难以用数学公式精确描述。
交通流量预测作为典型的时空数据预测问题,不同类别的交通数据内嵌于连续空间。由于现实道路交通网络的状态在不断变化,数据集作为道路交通网络状态的一种描述,也在随时间发生相应的动态变化。因此,如何有效提取数据中的时态、空间依赖及其相关性对解决这类问题至关重要。近年来,许多研究使用图神经网络来对交通流量建模并取得了很好的效果。与传统的深度学习方法相比,图神经网络可以更有效的建模数据中的空间依赖关系,从而帮助提高预测的准确度。尽管这些模型取得了优异的性能,但仍存在一些问题。针对数据中的空间依赖信息,现有方法中大量使用谱图卷积、扩散卷积等图卷积方法。然而,这些图卷积方法中大都使用基于距离或者相似度的方法来生成朴素的依赖图,其内包含的空间依赖信息通常是不完整的,不能直接用于预测任务。为了更有效地提取数据中的空间依赖,有的方法提出动态图结构学习模块改进图卷积操作,或是基于图卷积操作设计自适应空间依赖矩阵,用于捕获数据中节点间复杂的空间依赖和不确定性。然而,上述基于图卷积的方法还需结合卷积、循环神经网络模块来建模时态依赖,使得这些方法使用不同的模块来对数据中的时态依赖和空间依赖分别建模,割裂了数据中的时空关联性。时空依赖受限于节点间的空间距离和时间长度,通常具有局部性。为此有方法利用连续时间步的空间依赖图设计时空图卷积模块,来同步捕获数据中的时态、空间依赖。然而上述工作的问题在于它们在提取数据中的时空关联模块时考虑的都是静态图,而真实世界中交通流量的空间依赖关系是变化的,某些随机性的异常事件甚至会导致空间依赖急剧变化,如道路检修,车辆故障等。
此外,周期是时间序列的重要特征,交通流量等数据存在一定的周期特征,比如每天的早晚高峰,以及工作日和周末的车流量差异。针对数据中的周期特征,一些研究考虑将多个时间段数据作为模型的输入。常见的方法包括借助CNN(Convolution neuralnetwork)将输入数据的多周期片段沿卷积操作的通道维拼接提取数据特征,或是通过残差连接跳跃指定时间步长数量的RNN(Recurrent neural network)单元达到对周期性的建模。但它们的缺陷在于没有充分考虑多个时间段数据与预测目标间的不同关系,而且忽略了时态、空间依赖同步捕获的问题。
目前,现有的交通流量预测方法存在以下主要问题:
1)忽略了空间关系的动态变化对交通流量数据的时态、空间依赖提取能力的影响;
2)使用不同的模块预测交通流量数据中的时态依赖和空间依赖关系,割裂了数据中的时空关联性;
3)没有充分利用交通流量数据中的周期性变化特征构建时空依赖模型。
发明内容
本发明实施例提供了交通流量预测方法,能够提高城市交通流量预测值的精度。所述技术方案如下:
本发明实施例提供了一种交通流量预测方法,包括:
获取训练集,所述训练集包括:周期数据和近期数据,其中,周期数据为以周为周期的历史交通数据,近期数据为近期时间段的历史交通数据,即周期数据和近期数据;所述交通数据包括:交通流量、交通速度和道路占有率;
构建交通流量预测模型,将周期数据和近期数据作为交通流量预测模型的输入,训练所述交通流量预测模型,以预测未来时间段的交通流量;其中,针对周期数据,利用模式编码组件重构输入得到输出的原理对其进行建模,在建模过程中,构建局部化时空图模拟数据中的时空依赖,基于构建的局部化时空图,使用注意力机制来同步捕获数据中的时空动态关联,并提取周期特征;针对近期数据,利用模式迁移组件计算提取到的周期特征与近期数据之间的相似度,选择性的迁移周期特征融入到预测目标数据中;
采集当前时刻的交通数据,将采集的当前时刻的交通数据输入训练好的交通流量预测模型,预测未来时间段的交通流量。
进一步地,所述获取训练集,所述训练集包括:周期数据和近期数据,其中,周期数据为以周为周期的历史交通数据,近期数据为近期时间段的历史交通数据包括:
确定交通流量预测模型的输入、输出变量,采集所述变量对应的历史交通数据;其中,输入变量包括:交通流量、交通速度和道路占有率;输出变量包括:交通流量;
对采集的历史交通数据进行预处理,将预处理后的历史交通数据划分为训练集、验证集和测试集,其中,所述训练集包括:周期数据Xweek和近期数据Xrecent
进一步地,在S102之前所述方法包括:
根据获取的历史交通数据,将其空间路网结构定义为拓扑空间图
Figure BDA0003505964600000036
其中,
Figure BDA0003505964600000031
为图中节点的集合,
Figure BDA0003505964600000032
为节点个数,对应路网中的N个传感器/路段;
Figure BDA0003505964600000033
为边的集合,表示节点间的连通性;A∈RN×N为图G的邻接矩阵,R为实数集;
将预处理后的历史交通数据视为在所述拓扑空间图上的图信号序列。
进一步地,所述将预处理后的历史交通数据视为在所述拓扑空间图上的图信号序列包括:
将在t时刻传感器/路段i观测到的交通数据
Figure BDA0003505964600000034
视为节点i在t时刻的信号值,则在t时刻,路网所观测到的数据表示为图信号
Figure BDA0003505964600000035
其中,F为每个传感器/路段所记录的变量的数量。
进一步地,所述交通流量预测模型包括:输入层、模式编码组件、模式迁移组件和输出层;其中,所述输入层包括:第一输入层和第二输入层,将周期数据Xweek输入第一输入层,近期数据Xrecent输入第二输入层;
在输入层中,对输入数据,将拓扑空间图中每个时刻的各节点信号向量使用1×1的卷积核卷积操作映射到高维特征空间Xemb=Conv1×1(Xin);其中,Xin表示周期数据Xweek或近期数据Xrecent,Conv1×1(·)表示1×1的卷积核卷积操作;
将可学习的时态编码矩阵P使用广播机制添加到数据Xemb中,得到:
X*=Conv1×1(Xin)+P
其中,当输入为Xweek时,X*表示第一输入层输出的处理后的周期数据
Figure BDA0003505964600000041
当输入为Xrecent时,X*表示第二输入层输出的处理后的近期数据
Figure BDA0003505964600000042
进一步地,所述模式编码组件包括:编码器和解码器;所述编码器由l层编码层组成,l=1,2,3,每一层编码层包括:时空图注意力模块和降维多层感知器模块;其中,
在编码器中,周期数据
Figure BDA0003505964600000043
输入到第一层编码层中对应的时空图注意力模块中进行处理输出
Figure BDA0003505964600000044
经过残差连接和层正则化输入到降维多层感知器模块中,得到第一层编码层的输出H(1),将第一层编码层的输出H(1)作为第二层编码层的输入,对应得到输出H(2),同理得到第三层编码层的输出H(3);其中,
编码器的输出Xencode=H(3)
在时空图注意力模块中,将拓扑空间图中节点间的信息传播表示为扩散过程,利用随机游走理论建模交通数据中信息的扩散过程,得到局部化时空图AST∈RτN×τN来模拟数据中的时空依赖,其中,τ表示扩散步长,时空图中包含τN个时空节点,对每个时空节点对应的注意力系数向量取其中最大的u个元素,即topu得到关联图Etop来动态的捕获节点的远距离依赖,并结合局部化时空图AST和topu关联图Etop得到动态的节点依赖矩阵Mask作为注意力的掩膜矩阵,其中,Mask=Etop+AST
解码器由多层全连接层组成,输入为Xencode,输出为
Figure BDA0003505964600000045
进一步地,所述模式迁移组件由l层模式迁移层实现,各模式迁移此层包括:时空图注意力模块、自注意力模块和前馈层;其中,
近期数据
Figure BDA0003505964600000046
输入到第一层模式迁移层中时空图注意力模块进行处理输出
Figure BDA0003505964600000047
经过残差连接和层正则化输入到自注意力模块作为自注意力的输入Q,Xencode作为输入K和V,输出为
Figure BDA0003505964600000048
第一层模式迁移层中自注意力模块的输出
Figure BDA0003505964600000049
经过残差连接和层正则化输入到该模式迁移层中的前馈层进行处理,并经过残差连接和层正则化得到输出O(1),将输出O(1)和Xencode输入到第二层模式迁移层,对应得到输出O(2),同理得到第三层模式迁移层的输出O(3),其中,
Figure BDA00035059646000000410
在时空图注意力模块中,将拓扑空间图中节点间的信息传播表示为扩散过程,利用随机游走理论建模交通数据中信息的扩散过程,得到局部化时空图AST∈RτN×τN来模拟数据中的时空依赖,其中,τ表示扩散步长,时空图中包含τN个时空节点,对每个时空节点对应的注意力系数向量取其中最大的u个元素,即topu得到关联图Etop来动态的捕获节点的远距离依赖,并结合局部化时空图AST和topu关联图Etop得到动态的节点依赖矩阵Mask作为注意力的掩膜矩阵,其中,Mask=Etop+AST
进一步地,所述输出层包括:第一输出层和第二输出层;
所述交通流量预测模型的预测结果为:
Figure BDA0003505964600000051
其中,⊙是矩阵对应元素相乘的哈达马积;Ww和Wr分别为模式编码组件和模式迁移组件输出的权重参数;
Figure BDA0003505964600000052
为未来时间段交通流量的预测值,
Figure BDA0003505964600000053
为第一输出层的输出,
Figure BDA0003505964600000054
为第二输出层输出。
本发明实施例提供的技术方案带来的有益效果至少包括:
1)针对交通流量等时空数据拓扑空间图中各节点信息随时间动态变化的性质,以及扩散卷积等图卷积操作在不同的扩散步却使用相同的图节点信息等问题,特别是在预测城市路网等对象所产生的交通流量等数据时,考虑预测目标是未来某个时间段内路网中各路段的交通流量,本发明构建了局部化时空图,能够有效模拟数据中的时空依赖,包括:当前时刻节点的邻居对其的影响、节点历史时刻状态对其自身的影响以及邻居历史时刻的状态对该节点的影响。这些复杂的节点间时空依赖特征对于准确预测十分重要。
2)针对当前交通数据预测方法在提取数据中的时空依赖时大都使用不同的模块对时态和空间依赖分别建模,割裂了数据中的时空关联性。为了更准确的同步捕获数据中的动态时空关联关系,针对两种不同的输入,各自使用注意力机制来同步捕获数据中复杂多变的时空动态关联,无需对时态和空间依赖分别建模,能够自适应的学习时间和空间两个维度下节点间的依赖关系。
3)对周期数据,考虑到它与预测目标数据的相似性,利用模式编码组件重构输入得到输出的原理对其进行建模。对近期数据,该方法设计了模式迁移组件提取周期特征辅助预测,在模式迁移组件中,通过利用自注意力机制计算得到的周期数据和近期数据之间的相似度(由模式迁移组件输出的权重参数体现),选择性的迁移周期特征融入到预测目标数据中,能够滤除周期数据与预期目标数据中的噪声等差异,从而帮助模型更好的利用数据中的周期性信息提高城市交通流量预测值的精度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的交通流量预测方法的流程示意图;
图2为本发明实施例提供的交通数据的图信号表示示意图;
图3为本发明实施例提供的交通流量预测模型的结构示意图;
图4为本发明实施例提供的局部化时空图示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
如图1所示,本发明实施例提供了一种交通流量预测方法,包括:
S101,获取训练集,所述训练集包括:周期数据和近期数据,其中,周期数据为以周为周期的历史交通数据,近期数据为近期时间段的历史交通数据,即周期数据和近期数据;所述交通数据包括:交通流量、交通速度和道路占有率;具体可以包括以下步骤:
A1,确定交通流量预测模型的输入、输出变量,采集所述变量对应的历史交通数据;其中,输入变量包括:交通流量、交通速度和道路占有率;输出变量包括:交通流量;
本实施例中,针对交通数据的周期性质可知,采集的历史交通数据包括:周期、近期两种不同时间段的时间-空间-特征三维张量。
A2,对采集的历史交通数据进行预处理,将预处理后的历史交通数据划分为训练集、验证集和测试集,其中,所述训练集包括:周期数据Xweek和近期数据Xrecent,具体可以包括以下步骤:
A21,对采集的历史交通数据,采用平均值法修补缺失的数据,并采用Z-Score方法对采集的历史交通数据进行归一化处理,以消除变量之间由于量纲造成的影响;
A22,对采集的历史交通数据进行预处理,将预处理后的历史交通数据划分为训练集、验证集和测试集,其中,所述训练集包括:周期数据Xweek和近期数据Xrecent,并得到预测目标数据Y,其中,周期数据和近期数据作为交通流量预测模型的输入数据。
本实施例中,可以以6:2:2的比例拆分预处理后的交通数据,生成训练集、验证集和测试集,以训练和验证所述交通流量预测模型。
本实施例中,预测目标数据Y是未来某个时间段内路网中各路段的交通流量。
为了更好地理解本发明,在S102之前,所述方法包括:
B1,根据获取的历史交通数据,将其空间路网结构定义为拓扑空间图
Figure BDA0003505964600000071
其中,
Figure BDA0003505964600000072
为图中节点的集合,
Figure BDA0003505964600000073
为节点个数,对应路网中的N个传感器/路段;
Figure BDA0003505964600000074
为边的集合,表示节点间的连通性;A∈RN×N为图G的邻接矩阵,R为实数集;
本实施例中,将获取的历史交通数据建模为图的形式,从而建立数据每个时刻对应的拓扑空间图,并确定拓扑空间图的邻接矩阵。
B2,将预处理后的历史交通数据视为在所述拓扑空间图上的图信号序列。
本实施例中,例如,在t时刻传感器/路段i观测到的交通数据
Figure BDA0003505964600000075
视为节点i在t时刻的信号值,在t时刻路网所观测到的数据表示为图信号:
Figure BDA0003505964600000076
(R为实数集),其中F为每个传感器/路段所记录的变量的数量。以图2中交通数据为例,交通路网表示为拓扑图,记录每个时间步该拓扑空间图各节点的变量值得到图2(a)中表示为图信号序列的交通数据。图2中每个节点记录三种变量的数值:交通流量、交通速度和道路占有率,作为节点的特征。
给定过去Th个时间步下,N个传感器/路段所记录的F个变量的观测值:
Figure BDA0003505964600000077
是时间-空间-特征三维张量数据,其中Th为时间维度值,N为空间维度值,F为特征维度值,交通数据预测方法的目标是:学习一个函数f,给定输入其能够预测接下来Tp个时间步路网中各路段的交通流量
Figure BDA0003505964600000078
其中
Figure BDA0003505964600000079
表示节点i从t+1时刻起预测得到的未来的目标变量值。
Figure BDA00035059646000000710
本实施例中的预测方法的输入包含两种不同时间段的数据:近期数据和周期数据(例如,以周为周期的数据),假设交通数据的采样频率为q次/天,当前时刻为t0,预测时间范围为接下来Tp个时间步,则近期数据可以表示为:
Figure BDA0003505964600000081
即为与预测时间段直接相邻的历史时间片段数据,其中,Tr和Tp分别表示近期数据Xrecent和预测目标Y所对应的时间段,Xrecent是时间-空间-特征三维张量数据;类似的,可以将以周为周期的数据表示为:
Figure BDA0003505964600000082
即为过去几周中与预测目标相同时间段的数据,其中,Tw表示周期数据Xweek所对应的时间段,是时间-空间-特征三维张量数据。
本实施例中,将Xrecent和Xweek视为在所述拓扑空间图上的图信号序列。
S102,构建交通流量预测模型,将周期数据和近期数据作为交通流量预测模型的输入,训练所述交通流量预测模型,以预测未来时间段的交通流量;其中,针对周期数据,利用模式编码组件重构输入得到输出的原理对其进行建模,在建模过程中,构建局部化时空图模拟数据中的时空依赖,基于构建的局部化时空图,使用注意力机制来同步捕获数据中的时空动态关联,并提取周期特征;针对近期数据,利用模式迁移组件计算提取到的周期特征与近期数据之间的相似度,选择性的迁移周期特征融入到预测目标数据中;
本实施例中,所述交通流量预测模型包括:输入层、模式编码(PE)组件、模式迁移(PT)组件和输出层;其中,所述输入层包括:第一输入层和第二输入层,将周期数据Xweek输入第一输入层,近期数据Xrecent输入第二输入层;
在输入层中,为了交通流量预测模型可以更有效的提取数据中的时态和空间依赖,对输入数据
Figure BDA0003505964600000083
(此处Xin为周期数据Xweek或近期数据Xrecent),首先将拓扑空间图中每个时刻的各节点信号向量(即输入数据的节点表示)使用1×1的卷积核卷积操作映射到高维特征空间
Figure BDA0003505964600000084
其中Femb表示经1×1的卷积核卷积操作处理后的特征维度值;其中,Xin表示周期数据Xweek或近期数据Xrecent,Conv1×1(·)表示1×1的卷积核卷积操作;
将可学习的时态编码矩阵
Figure BDA0003505964600000085
使用广播机制添加到数据Xemb中,使注意力机制具备分辨数据的前后相对顺序能力,进一步提升时空图注意力模块捕获时态因果信息的能力,得到:
X*=Conv1×1(Xin)+P (2)
如图2所示,方法中包含两个输入层,输入分别为Xrecent、Xweek,当输入为Xweek时,X*表示第一输入层输出的处理后的周期数据
Figure BDA0003505964600000091
当输入为Xrecent时,X*表示第二输入层输出的处理后的近期数据
Figure BDA0003505964600000092
Figure BDA0003505964600000093
分别作为接下来模式编码组件、模式迁移组件中时空图注意力模块的输入。
自编码器是一种旨在将输入数据复制到输出的网络模型。在编码阶段它将输入压缩成一种隐藏空间表示,在解码阶段利用编码得到的隐藏空间表示重构输入得到输出。降噪自编码器在输入数据中加入噪声迫使其学习输入信号的更加鲁棒的表达。相比于一般自编码器,其具有更强的泛化能力。本实施例中,将历史周期数据可以看作是夹杂了大量噪声的预测目标数据,受降噪自编码器启发,本实施例中所述模式编码组件是一个降噪自编码器,如图3所示,所述模式编码组件主要包括:编码器和解码器;所述编码器由堆叠了3层子网络层即编码层构成,每一层子网络主要包含:时空图注意力模块和降维多层感知器模块,在上述使用残差连接和层正则化来优化模型的训练过程防止梯度消失/爆炸问题。本实施例中,所述模式编码组件使用周期数据
Figure BDA0003505964600000094
来重构预测目标数据。在模型训练阶段,通过将重构误差计算模式编码组件的梯度反向传播,更新该部分组件中的网络参数,所述模式编码组件不仅可以通过重构输入得到预测值的近似表达,并且可以对输入数据进行编码,用于后续的模式迁移模块中。
本实施例中,在编码器中,周期数据
Figure BDA0003505964600000095
输入到第一层编码层中对应的时空图注意力模块中进行处理输出
Figure BDA0003505964600000096
经过残差连接和层正则化输入到降维多层感知器模块中,得到第一层编码层的输出H(1),将第一层编码层的输出H(1)作为第二层编码层的输入,对应得到输出H(2),同理得到第三层编码层的输出H(3);其中,编码器的输出Xencode=H(3);解码器由多层全连接层组成,输入为Xencode,输出为
Figure BDA0003505964600000097
具体的:
在时空图注意力模块中,首先将拓扑空间图中节点间的信息传播表示为扩散过程,利用随机游走理论建模交通数据中信息的扩散过程,得到局部化时空图AST来模拟数据中的时空依赖;具体的:
将拓扑空间图中节点间的信息传播表示为扩散过程,该扩散过程具有马尔可夫性,因此又可以表示为图上的随机游走(Random walk)。交通数据作为时空数据,在每个时刻图中节点状态是动态变化的,针对每一个扩散步,需要考虑其对应时间步的图信号数据。本实施例中,针对交通流量等时空数据拓扑空间图中各节点信息随时间动态变化的性质,对交通数据这一具有时空特性的数据使用随机游走理论得到局部化时空图(Spatial-temporal graph)AST∈RτN×τN来模拟数据中的时空依赖,其中,τ表示扩散步长,时空图中包含τN个时空节点,所得到的时空图中时空节点不仅具有空间属性,还具有时间属性,模拟的时空依赖包括:当前时刻空间节点的邻居对其的影响、空间节点历史时刻状态对其自身的影响以及邻居历史时刻的状态对该空间节点的影响。这些复杂的空间节点间时空依赖特征对于准确预测十分重要。图4为构建的局部化时空图,其中图4(a)显示了过往的方法对时空依赖分别建模所导致的时态依赖和空间依赖的割裂性;图4(b)为本文所提出的局部化时空图建模的时空依赖,通过随机游走捕获不同时刻而非单一时刻的图信号;图4(c)为τ=3时所对应的时空图AST的形式,使用多个不同阶的邻接矩阵A(τ)组成AST。其中,A(τ)表示τ阶邻接矩阵(A(1)=A),对于空间节点i,τ阶邻接矩阵包含了它的τ阶邻,其τ阶邻表示经过τ个空间节点即可到达i的所有空间节点集合。
需要说明的是:
为了更好地理解本发明,将局部化时空图中的节点称为:时空节点,将上文的拓扑空间图中的节点称为:空间节点;相比于空间节点,此处的时空节点额外具备时态性质。
在捕获数据中的动态关联时,注意力机制相比于图卷积操作具有更高的灵活性。但是简单引入全量注意力会带来大量的噪声,增加模型学习的难度。此外,除了近距离的空间节点间会存在时空依赖之外,远距离的空间节点也会具有某些关联,即它们可能共享相似的“时态模式”,例如:在交通高峰期,从住宅区去往商业区办公楼的主干道路会出现类似的拥堵情况。考虑到有限步的随机游走无法到达这些遥远位置,即无法对远距离的时态相似性建模。为此,需借助注意力机制,同步捕获数据中复杂多变的时空动态关联,这样,无需对时态和空间依赖分别建模,能够自适应的学习时间和空间两个维度下空间节点间的依赖关系,具体的:
本实施例在局部化时空图的基础上进一步提出时空图注意力来捕获空间节点间复杂的时空动态关联。第l(l=1,2,3)层编码层中的时空图注意力使用第l-1层编码层的输出
Figure BDA0003505964600000101
作为输入,其中T(l-1)、N和F(l-1)分别表示对应的时间纬度值、空间纬度值和特征维度值。特别的,
Figure BDA0003505964600000102
时空图注意力的输入H(l-1)经过三个不同的1×1卷积核的卷积操作映射到三个不同的特征空间得到对应的Q、K和
Figure BDA0003505964600000111
也就是说,使用卷积层沿输入数据的时间维捕获各空间节点的长序列时态依赖;然后使用多头注意力机制(Multi-head attention),将Q、K和
Figure BDA0003505964600000112
沿时间维切分为多个头得到多个局部时态空间,针对每个头(heads)计算注意力达到同步提取局部时空依赖特征的效果:
Z*=Concat(head1,…,heads,…,headS) (3)
其中,
Figure BDA0003505964600000113
表示多头注意力的输出,Z*经过矩阵变换:
Figure BDA0003505964600000114
将时间维度值恢复为T(l-1)=Sτ,空间维度值恢复为N,得到时空图注意力模块的输出
Figure BDA0003505964600000115
Concat(head1,…,heads,…,headS)表示拼接(concatenate)多个头的操作,每个
Figure BDA0003505964600000116
对应一组相邻的τ个连续时间步的图信号数据。使用上述多头注意力机制,从而为空间节点添加了时态属性,每一个头对应有τN个时空节点,其对应的时空图注意力模块的输入数据为
Figure BDA0003505964600000117
Figure BDA0003505964600000118
通过Q与K做矩阵乘法计算得到注意力系数矩阵M∈RτN×τN,矩阵中第i行注意力系数向量Mi∈RτN对应的qi与K={k1,…,kj,…,kτN}的点积;Mij为向量qi与kj的乘积值,表示时空节点i对时空节点j的注意力系数:
Figure BDA0003505964600000119
对每个时空节点对应的注意力系数向量Mi取其中最大的u个元素,即topu得到关联图Etop来动态的捕获时空节点的远距离依赖。当时空节点i对应AST的第i行
Figure BDA00035059646000001110
中大于0的元素个数小于u,即时空节点i对应的时空关联节点个数
Figure BDA00035059646000001111
时,则第i个时空节点对应的注意力系数向量不变;若时空节点i的时空关联节点个数
Figure BDA00035059646000001112
时,取未关联的时空节点中注意力系数最大的
Figure BDA00035059646000001113
个时空节点作为时空节点i的远距离动态依赖。结合局部化时空图AST和topu关联图Etop得到动态的节点依赖矩阵Mask作为注意力的掩膜矩阵,可以有效降低方法的学习难度,减弱噪声影响;其中,Mask表示为:
Mask=Etop+AST (5)
其中,矩阵的第i行第j列的元素Maskij表示时空节点j(j=1,2,…,τN)与时空节点i之间是否存在依赖关系,Maskij=0表示无依赖,Maskij≠0表示存在依赖;
在时空图注意力模块计算时,时空节点i的信息通过聚合与其存在依赖关系的时空节点j(Maskij≠0)的信息vj来得到更新,使用SoftMax函数计算聚合时的权重aij
Figure BDA0003505964600000121
Figure BDA0003505964600000122
Figure BDA0003505964600000123
其中,
Figure BDA0003505964600000124
表示时空节点i经过时空图注意力模块聚合相关时空节点信息更新之后的状态;aij表示时空节点i在更新自身状态时,考虑时空节点j对应的状态向量vj对它影响的权重,当Maskij=0时,对应的aij=0。
本实施例中,降维多层感知器函数可以表示为:
Figure BDA0003505964600000125
其中,
Figure BDA0003505964600000126
为降维多层感知器模块中可学习的参数,X(l)为第l层编码层中降维多层感知器模块的输入,对应的输出是H(l),T(l)和F(l)分别表示经降维多层感知器处理之后的时间维度值和特征维度值。
本实施例中,解码器是一个多层全连接网络,PE组件的输出分为两部分,一是编码输出:编码状态
Figure BDA0003505964600000127
二是解码输出:
Figure BDA0003505964600000128
其中,编码输出可用于提取周期数据中的周期特征,解码输出利用周期数据重构目标输出,提升模型的预测精度。
本实施例中,所述模式迁移组件由堆叠的三层子网络即模式迁移层实现,每一层子网络主要包含:时空图注意力模块,自注意力模块和前馈层;其中,
PT组件的输入为近期数据
Figure BDA0003505964600000129
与PE组件相同,各模式迁移层的输入数据首先经过时空图注意力模块提取数据中的复杂时空依赖,之后时空图注意力模块的输出
Figure BDA00035059646000001210
经过残差连接和层正则化后输入到自注意力模块经卷积层映射后作为Q,同时将PE组件的编码输出
Figure BDA00035059646000001211
输入到自注意力模块经两个不同的卷积层映射后得到K和V,利用得到的Q、K和V,计算自注意力得到输出
Figure BDA00035059646000001212
第三层模式迁移层中自注意力模块的输出
Figure BDA00035059646000001213
经过残差连接和层正则化输入到前馈层得到输出,该输出经过残差连接和层正则化得到组件输出O(1),将输出O(1)和Xencode输入到第二层模式迁移层,对应得到输出O(2),同理得到第三层模式迁移层的输出O(3),其中,
Figure BDA00035059646000001214
在上述三种模块均使用残差连接和层正则化来优化模型的训练过程防止梯度消失/爆炸问题。
本实施例中,自注意力模块包含两种输入,分别为模式迁移组件中时空图注意力模块的输出
Figure BDA0003505964600000131
和模式编码组件中编码器的输出
Figure BDA0003505964600000132
在自注意力模块中对拓扑空间图中每个空间节点各自通过自注意力层,利用节点自身近期特征和周期特征的相似性计算注意力,其中,自注意力通过缩放点积的形式计算得到输出
Figure BDA0003505964600000133
Figure BDA0003505964600000134
其中,
Figure BDA0003505964600000135
表示第l层模式迁移层中自注意力模块的输出,Q为时空图注意力模块的输出
Figure BDA0003505964600000136
经残差连接和层正则化后,通过1×1卷积核的卷积操作映射后的结果,K和V是PE组件的编码输出
Figure BDA0003505964600000137
经两个不同的1×1卷积层映射后得到的结果,SoftMax为激活函数。
本实施例中,所述输出层包括:第一输出层和第二输出层;PE组件与第一输出层相连,PT组件与第二输出层相连;
本实施例中,输出层将PE组件的解码输出与PT组件的输出加权融合得到最终的预测结果为:
Figure BDA0003505964600000138
其中,⊙是矩阵对应元素相乘的哈达马积;Ww和Wr分别为模式编码组件和模式迁移组件输出的权重参数;
Figure BDA0003505964600000139
为未来时间段交通流量的预测值,
Figure BDA00035059646000001310
为第一输出层的输出,
Figure BDA00035059646000001311
为第二输出层输出。
这样,不同于过往的序列到序列(sequence-to-sequence)模型分步预测,本实施例提出的预测方法能够一次性输出目标时间段的全部预测结果,缓解了自回归模型中误差累积的问题。
本实施例中,将周期数据和近期数据作为交通流量预测模型的输入,训练所述交通流量预测模型,其中,输入和输出时间段分别为Tw=12、Tr=24和Tp=12,局部化时空图中扩散步长τ=3,PE和PT组件的输入层映射维度Femb分别为72、36,批数量(Batch size)设置为16,选用Adam(Adaptive moment estimation)优化算法,初始学习率设定为0.001,衰减率为0.92每个epoch,模型训练40个epoch。
本实施例中,使用L2损失作为方法的损失函数loss:
Figure BDA00035059646000001312
其中,Y为真实的预测目标数据,即:真实的交通流量;
本实施例中,使用平均绝对误差MAE(Mean absolute error),均方根误差RMSE(Root mean square error)作为评估准则来评估预测方法的性能,两值越小越好。
Figure BDA0003505964600000141
Figure BDA0003505964600000142
S103,采集当前时刻的交通数据,将采集的当前时刻的交通数据输入训练好的交通流量预测模型,预测未来时间段的交通流量。
本发明实施例所述的交通流量预测方法,通过采集城市多空间交通网络数据,捕获数据中复杂的时态、空间依赖及其关联性(简称:时空关联),并利用数据中的周期特征降低模型学习的难度,能够提升城市交通流量预测值的准确性,可以更好地为城市道路规划决策方案作依据。
综上,本实施例提出的交通流量预测方法至少具有以下有益效果:
1)针对交通流量等时空数据拓扑空间图中各空间节点信息随时间动态变化的性质,以及扩散卷积等图卷积操作在不同的扩散步却使用相同的图节点信息等问题,特别是在预测城市路网等对象所产生的交通流量等数据时,考虑预测目标是未来某个时间段内路网中各路段的交通流量,本发明构建了局部化时空图,能够有效模拟数据中的时空依赖,包括:当前时刻空间节点的邻居对其的影响、空间节点历史时刻状态对其自身的影响以及邻居历史时刻的状态对该空间节点的影响,这些复杂的节点间时空依赖特征对于准确预测十分重要。
2)针对当前交通数据预测方法在提取数据中的时空依赖时大都使用不同的模块对时态和空间依赖分别建模,割裂了数据中的时空关联性。为了更准确的同步捕获数据中的动态时空关联关系,针对两种不同的输入,各自使用注意力机制来同步捕获数据中复杂多变的时空动态关联,无需对时态和空间依赖分别建模,能够自适应的学习时间和空间两个维度下节点间的依赖关系。
3)对周期数据,考虑到它与预测目标数据的相似性,利用模式编码组件重构输入得到输出的原理对其进行建模。对近期数据,该方法设计了模式迁移组件提取周期特征辅助预测,在模式迁移组件中,通过利用自注意力机制计算得到的周期数据和近期数据之间的相似度(由模式迁移组件输出的权重参数体现),选择性的迁移周期特征融入到预测目标数据中,能够滤除周期数据与预期目标数据中的噪声等差异,从而帮助模型更好的利用数据中的周期性信息提高城市交通流量预测值的精度。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种交通流量预测方法,其特征在于,包括:
获取训练集,所述训练集包括:周期数据和近期数据,其中,周期数据为以周为周期的历史交通数据,近期数据为近期时间段的历史交通数据,所述交通数据包括:交通流量、交通速度和道路占有率;
构建交通流量预测模型,将周期数据和近期数据作为交通流量预测模型的输入,训练所述交通流量预测模型,以预测未来时间段的交通流量;其中,针对周期数据,利用模式编码组件重构输入得到输出的原理对其进行建模,在建模过程中,构建局部化时空图模拟数据中的时空依赖,基于构建的局部化时空图,使用注意力机制来同步捕获数据中的时空动态关联,并提取周期特征;针对近期数据,利用模式迁移组件计算提取到的周期特征与近期数据之间的相似度,选择性的迁移周期特征融入到预测目标数据中;
采集当前时刻的交通数据,将采集的当前时刻的交通数据输入训练好的交通流量预测模型,预测未来时间段的交通流量。
2.根据权利要求1所述的交通流量预测方法,其特征在于,所述获取训练集,所述训练集包括:周期数据和近期数据,其中,周期数据为以周为周期的历史交通数据,近期数据为近期时间段的历史交通数据包括:
确定交通流量预测模型的输入、输出变量,采集所述变量对应的历史交通数据;其中,输入变量包括:交通流量、交通速度和道路占有率;输出变量包括:交通流量;
对采集的历史交通数据进行预处理,将预处理后的历史交通数据划分为训练集、验证集和测试集,其中,所述训练集包括:周期数据Xweek和近期数据Xrecent
3.根据权利要求1所述的交通流量预测方法,其特征在于,在S102之前所述方法包括:
根据获取的历史交通数据,将其空间路网结构定义为拓扑空间图
Figure FDA0003505964590000011
其中,
Figure FDA0003505964590000012
为图中节点的集合,
Figure FDA0003505964590000013
为节点个数,对应路网中的N个传感器/路段;
Figure FDA0003505964590000014
为边的集合,表示节点间的连通性;A∈RN×N为图G的邻接矩阵,R为实数集;
将预处理后的历史交通数据视为在所述拓扑空间图上的图信号序列。
4.根据权利要求3所述的交通流量预测方法,其特征在于,所述将预处理后的历史交通数据视为在所述拓扑空间图上的图信号序列包括:
将在t时刻传感器/路段i观测到的交通数据
Figure FDA0003505964590000021
视为节点i在t时刻的信号值,则在t时刻,路网所观测到的数据表示为图信号
Figure FDA0003505964590000022
其中,F为每个传感器/路段所记录的变量的数量。
5.根据权利要求2所述的交通流量预测方法,其特征在于,所述交通流量预测模型包括:输入层、模式编码组件、模式迁移组件和输出层;其中,所述输入层包括:第一输入层和第二输入层,将周期数据Xweek输入第一输入层,近期数据Xrecent输入第二输入层;
在输入层中,对输入数据,将拓扑空间图中每个时刻的各节点信号向量使用1×1的卷积核卷积操作映射到高维特征空间Xemb=Conv1×1(Xin);其中,Xin表示周期数据Xweek或近期数据Xrecent,Conv1×1(·)表示1×1的卷积核卷积操作;
将可学习的时态编码矩阵P使用广播机制添加到数据Xemb中,得到:
X*=Conv1×1(Xin)+P
其中,当输入为Xweek时,X*表示第一输入层输出的处理后的周期数据
Figure FDA0003505964590000023
当输入为Xrecent时,X*表示第二输入层输出的处理后的近期数据
Figure FDA0003505964590000024
6.根据权利要求5所述的交通流量预测方法,其特征在于,所述模式编码组件包括:编码器和解码器;所述编码器由l层编码层组成,l=1,2,3,每一层编码层包括:时空图注意力模块和降维多层感知器模块;其中,
在编码器中,周期数据
Figure FDA0003505964590000025
输入到第一层编码层中对应的时空图注意力模块中进行处理输出
Figure FDA0003505964590000026
经过残差连接和层正则化输入到降维多层感知器模块中,得到第一层编码层的输出H(1),将第一层编码层的输出H(1)作为第二层编码层的输入,对应得到输出H(2),同理得到第三层编码层的输出H(3);其中,
编码器的输出Xencode=H(3)
在时空图注意力模块中,将拓扑空间图中节点间的信息传播表示为扩散过程,利用随机游走理论建模交通数据中信息的扩散过程,得到局部化时空图AST∈RτN×τN来模拟数据中的时空依赖,其中,τ表示扩散步长,时空图中包含τN个时空节点,对每个时空节点对应的注意力系数向量取其中最大的u个元素,即topu得到关联图Etop来动态的捕获节点的远距离依赖,并结合局部化时空图AST和topu关联图Etop得到动态的节点依赖矩阵Mask作为注意力的掩膜矩阵,其中,Mask=Etop+AST
解码器由多层全连接层组成,输入为Xencode,输出为
Figure FDA0003505964590000031
7.根据权利要求6所述的交通流量预测方法,其特征在于,所述模式迁移组件由l层模式迁移层实现,l=1,2,3,各模式迁移此层包括:时空图注意力模块、自注意力模块和前馈层;其中,
近期数据
Figure FDA0003505964590000032
输入到第一层模式迁移层中时空图注意力模块进行处理输出
Figure FDA0003505964590000033
经过残差连接和层正则化输入到自注意力模块作为自注意力的输入Q,Xencode作为输入K和V,输出为
Figure FDA0003505964590000034
第一层模式迁移层中自注意力模块的输出
Figure FDA0003505964590000035
经过残差连接和层正则化输入到该模式迁移层中的前馈层进行处理,并经过残差连接和层正则化得到输出O(1),将输出O(1)和Xencode输入到第二层模式迁移层,对应得到输出O(2),同理得到第三层模式迁移层的输出O(3),其中,
Figure FDA0003505964590000036
在时空图注意力模块中,将拓扑空间图中节点间的信息传播表示为扩散过程,利用随机游走理论建模交通数据中信息的扩散过程,得到局部化时空图AST∈RτN×τN来模拟数据中的时空依赖,其中,τ表示扩散步长,时空图中包含τN个时空节点,对每个时空节点对应的注意力系数向量取其中最大的u个元素,即topu得到关联图Etop来动态的捕获节点的远距离依赖,并结合局部化时空图AST和topu关联图Etop得到动态的节点依赖矩阵Mask作为注意力的掩膜矩阵,其中,Mask=Etop+AST
8.根据权利要求7所述的交通流量预测方法,其特征在于,所述输出层包括:第一输出层和第二输出层;
所述交通流量预测模型的预测结果为:
Figure FDA0003505964590000037
其中,⊙是矩阵对应元素相乘的哈达马积;Ww和Wr分别为模式编码组件和模式迁移组件输出的权重参数;
Figure FDA0003505964590000038
为未来时间段交通流量的预测值,
Figure FDA0003505964590000039
为第一输出层的输出,
Figure FDA00035059645900000310
为第二输出层输出。
CN202210139206.7A 2022-02-15 2022-02-15 一种交通流量预测方法 Active CN114299723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210139206.7A CN114299723B (zh) 2022-02-15 2022-02-15 一种交通流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210139206.7A CN114299723B (zh) 2022-02-15 2022-02-15 一种交通流量预测方法

Publications (2)

Publication Number Publication Date
CN114299723A true CN114299723A (zh) 2022-04-08
CN114299723B CN114299723B (zh) 2022-11-08

Family

ID=80977049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210139206.7A Active CN114299723B (zh) 2022-02-15 2022-02-15 一种交通流量预测方法

Country Status (1)

Country Link
CN (1) CN114299723B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114925836A (zh) * 2022-07-20 2022-08-19 中国海洋大学 基于动态多视图图神经网络的城市交通车流量推理方法
CN115049022A (zh) * 2022-08-12 2022-09-13 天津大学 基于时间差分的数据处理方法及装置
CN116050672A (zh) * 2023-03-31 2023-05-02 山东银河建筑科技有限公司 基于人工智能的城市管理方法及系统
CN116071932A (zh) * 2023-03-09 2023-05-05 华东交通大学 交通流量预测方法、系统、存储介质及终端设备
CN116110226A (zh) * 2023-02-14 2023-05-12 清华大学 交通流量预测方法、装置及电子设备
CN116245255A (zh) * 2023-03-30 2023-06-09 湖南大学 一种在线时空交通流预测方法
CN116913097A (zh) * 2023-09-14 2023-10-20 江西方兴科技股份有限公司 一种交通状态预测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827544A (zh) * 2019-11-11 2020-02-21 重庆邮电大学 一种基于图卷积循环神经网络的短时交通流控制方法
CN113379156A (zh) * 2021-06-30 2021-09-10 南方科技大学 速度预测方法、装置、设备及存储介质
CN113808396A (zh) * 2021-09-01 2021-12-17 浙江工业大学 基于交通流量数据融合的交通速度预测方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827544A (zh) * 2019-11-11 2020-02-21 重庆邮电大学 一种基于图卷积循环神经网络的短时交通流控制方法
CN113379156A (zh) * 2021-06-30 2021-09-10 南方科技大学 速度预测方法、装置、设备及存储介质
CN113808396A (zh) * 2021-09-01 2021-12-17 浙江工业大学 基于交通流量数据融合的交通速度预测方法和系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114925836A (zh) * 2022-07-20 2022-08-19 中国海洋大学 基于动态多视图图神经网络的城市交通车流量推理方法
CN114925836B (zh) * 2022-07-20 2022-11-29 中国海洋大学 基于动态多视图图神经网络的城市交通车流量推理方法
CN115049022A (zh) * 2022-08-12 2022-09-13 天津大学 基于时间差分的数据处理方法及装置
CN115049022B (zh) * 2022-08-12 2022-10-21 天津大学 基于时间差分的数据处理方法及装置
CN116110226A (zh) * 2023-02-14 2023-05-12 清华大学 交通流量预测方法、装置及电子设备
CN116110226B (zh) * 2023-02-14 2023-08-08 清华大学 交通流量预测方法、装置及电子设备
CN116071932A (zh) * 2023-03-09 2023-05-05 华东交通大学 交通流量预测方法、系统、存储介质及终端设备
CN116071932B (zh) * 2023-03-09 2023-06-20 华东交通大学 交通流量预测方法、系统、存储介质及终端设备
CN116245255A (zh) * 2023-03-30 2023-06-09 湖南大学 一种在线时空交通流预测方法
CN116050672A (zh) * 2023-03-31 2023-05-02 山东银河建筑科技有限公司 基于人工智能的城市管理方法及系统
CN116913097A (zh) * 2023-09-14 2023-10-20 江西方兴科技股份有限公司 一种交通状态预测方法及系统
CN116913097B (zh) * 2023-09-14 2024-01-19 江西方兴科技股份有限公司 一种交通状态预测方法及系统

Also Published As

Publication number Publication date
CN114299723B (zh) 2022-11-08

Similar Documents

Publication Publication Date Title
CN114299723B (zh) 一种交通流量预测方法
CN111612206B (zh) 一种基于时空图卷积神经网络的街区人流预测方法及系统
CN115240425B (zh) 一种基于多尺度时空融合图网络的交通预测方法
CN113313947B (zh) 短期交通预测图卷积网络的路况评估方法
CN111612243A (zh) 交通速度预测方法、系统及存储介质
CN115440032B (zh) 一种长短期公共交通流量预测方法
CN115273464A (zh) 一种基于改进的时空Transformer的交通流量预测方法
CN110570035B (zh) 同时建模时空依赖性和每日流量相关性的人流量预测系统
US20240054321A1 (en) Traffic prediction
CN113570859B (zh) 一种基于异步时空膨胀图卷积网络的交通流量预测方法
CN113762595B (zh) 通行时间预测模型训练方法、通行时间预测方法及设备
CN116187555A (zh) 基于自适应动态图的交通流预测模型构建方法及预测方法
Huang et al. Learning multiaspect traffic couplings by multirelational graph attention networks for traffic prediction
CN116307152A (zh) 时空交互式动态图注意力网络的交通预测方法
CN115935796A (zh) 一种基于时空异质的和同步的图卷积网络交通流预测方法
CN114287023A (zh) 用于交通预测的多传感器学习系统
CN115206092A (zh) 一种基于注意力机制的BiLSTM和LightGBM模型的交通预测方法
CN113112792A (zh) 一种基于语义信息的多模块交通密集度预测方法
CN117116045A (zh) 一种基于时空序列深度学习的交通流量预测方法及装置
CN116258253A (zh) 一种基于贝叶斯神经网络的车辆od预测方法
CN113408786B (zh) 一种交通特征预测方法及系统
CN116434569A (zh) 基于stnr模型的交通流量预测方法及系统
CN115168327A (zh) 基于多层树状长短期记忆网络的大规模数据时空预测方法
CN117456736B (zh) 基于多尺度时空动态交互网络的交通流量预测方法
CN117456738B (zh) 一种基于etc门架数据的高速公路交通量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant