CN110717627B - 一种基于对偶图框架的全量交通预测方法 - Google Patents

一种基于对偶图框架的全量交通预测方法 Download PDF

Info

Publication number
CN110717627B
CN110717627B CN201910934228.0A CN201910934228A CN110717627B CN 110717627 B CN110717627 B CN 110717627B CN 201910934228 A CN201910934228 A CN 201910934228A CN 110717627 B CN110717627 B CN 110717627B
Authority
CN
China
Prior art keywords
edge
node
nodes
edges
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910934228.0A
Other languages
English (en)
Other versions
CN110717627A (zh
Inventor
魏龙
蔡登�
余正旭
金仲明
黄建强
华先胜
何晓飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910934228.0A priority Critical patent/CN110717627B/zh
Publication of CN110717627A publication Critical patent/CN110717627A/zh
Application granted granted Critical
Publication of CN110717627B publication Critical patent/CN110717627B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q50/40

Abstract

本发明公开了一种基于对偶图框架的全量交通预测方法,包括:(1)将路网结构表示为拓扑图,将路口作为节点,将连接路口的路段作为边;准备历史的边、节点数据以及未来的边、节点数据;(2)构造历史信息编码器,将历史数据输入到编码器中,通过多层的对偶映射,实现边和节点之间的信息传递,将多层对偶映射的输出拼接为历史特征张量;(3)构造未来预测解码器,将历史特征张量解码成未来时空特征,输出未来预测结果;(4)将预测结果和实际数据之间的误差作为损失函数来进行模型训练,直到损失函数收敛;(5)用训练好的模型,进行模型测试,测试完毕后进行应用。本发明的预测结果能够得到未来交通状况的全量完整描述,预测准确度高。

Description

一种基于对偶图框架的全量交通预测方法
技术领域
本发明属于人工智能和时间序列预测领域,尤其是涉及一种基于对偶图框架的全量交通预测方法。
背景技术
交通预测任务是指在给定区域路网范围内,根据一段历史时期的交通数据,预测一段未来时期的交通数据,包括车流量、平均车速、通行时间预测等。交通预测是智能交通系统(ITS)中的核心,广泛地应用于交通效率优化、交通风险控制、路径规划与导航等方面。交通预测是一个很有挑战性的问题,难点在于如何建模路网不同位置间的复杂时空依赖关系。
交通预测可以归类为带有路网结构的时间序列预测问题,国内外的政府交通部门和专家学者对此已经进行了几十年的探索。早在上世纪六十年代,就出现了基于模型的方法,这些方法通常采用人工模拟或者物理近似等手段。但是它们普遍缺乏灵活性,因此难以拟合高度动态变化的交通状况。后来基于数据驱动的方法逐渐兴起。到了上世纪九十年代,整合移动平均自回归模型(ARIMA)成为主流。进入21世纪以后,机器学习方法被广泛应用于交通预测,例如支持向量回归(SVR)等。这些经典的浅层模型因为模型容量和表达能力有限,在描述路网交通的时空关系上仍然效果一般。近年来,随着深度学习技术在图像、文本、语音等任务上取得的巨大进展,开始有学者将深度神经网络模型运用到交通预测问题上。直接使用现成的卷积神经网络(CNN)、循环神经网络(RNN)、多层自编码器(SAE)等模型,就可以取得不错的效果。
路网具有一个自然的图(graph)结构,即将路口看作节点(node),将路口之间的路段看作边(edge)。借助于当前快速发展的图神经网络(GNN),最近的交通预测趋势是将图网络置于一个时序预测框架里面。作为图网络的典型代表,图卷积网络(GCN)被活跃地应用于CNN或者RNN模型中来进行交通预测。通常做法是先构建一个邻接矩阵,表示路网上交通条件(比如节点之间的通行时间),然后用邻接矩阵构建图卷积,以此描述相近节点之间的传播行为。这类代表性技术包括发表在第27届国际人工智能联合大会(IJCAI 2018)上的文章《Spatio-Temporal Graph Convolutional Networks:A Deep Learning Framework forTraffic Forecasting》(STGCN)、发表在国际表示学习会议(ICLR 2018)上的文章《Diffusion Convolutional Recurrent Neural Network:Data-Driven TrafficForecasting》(DCRNN)、以及2018年出现在康奈尔大学Arxiv预印网站上的技术文章《Dynamic Spatio-temporal Graph-based CNNs for Traffic Prediction》(DST-GCNN)等。这些方法在抓取路网的交通动态方法表现出良好的效果。
然而,上述这些预测方法都只关注节点上的预测,它们忽略了使用边上的信息,也没有对边上的交通做出预测。因为缺失了边上的预测,其预测结果对于描述整体交通状况而言是不全面、不完整的。事实上,在目前的城市路网中,用于收集交通数据的传感器通常同时布置于路口和路段上,这些传感器能够实时监测车辆行为和交通状况。无论是节点还是边上的交通数据,都不应该被忽略。此外,即使单独做节点上的交通预测,因为边和节点是相互关联和影响的,忽略了边上的信息也会让节点的预测结果不够准确。
发明内容
本发明提供了一种基于对偶图框架的全量交通预测方法,很好地解决了现有交通预测方法中存在的边上预测结果缺失的问题;即使只做节点的预测,因为考虑了边上的历史数据,本发明也能够得到更好的预测准确度。
一种基于对偶图框架的全量交通预测方法,包括以下步骤:
(1)将路网结构表示为拓扑图,将路口作为节点,将连接路口的路段作为边;准备历史的边、节点数据以及未来的边、节点数据;
(2)构造历史信息编码器,将历史数据输入到编码器中,通过多层的对偶映射,实现边和节点之间的信息传递,将多层对偶映射的输出拼接为历史特征张量;
(3)构造未来预测解码器,将历史特征张量解码成未来时空特征,输出未来预测结果;
(4)将预测结果和实际数据之间的误差作为损失函数来进行模型训练,直到损失函数收敛;
(5)用训练好的模型,进行模型测试,测试完毕后进行应用。
本发明提出了一个对偶图的框架来同时利用边和节点的历史数据,做边和节点的预测,得到全量的未来交通预测结果。核心模块对偶映射自然地模拟了边和节点上的信息交互行为,深刻地揭示了时空图网络上的信息传播规律。区别于以往只考虑节点之间时空依赖关系的做法,本发明考虑了整张路网上节点和边之间的传播规律。因此,本发明能够提供未来交通的“全量”预测,得到完整的交通描述。
步骤(2)中,所述的历史信息编码器由多个对偶映射模块依次堆叠而成,通过每个对偶映射模块完成一次节点与相邻的边的信息交互,同时完成一次边与相邻节点的信息交互,进而分别完成节点特征和边特征的更新;通过多个对偶映射模块的叠加,将边和节点上所有对偶映射模块的输出各自拼接起来,得到节点和边的历史特征张量
Figure BDA0002221155410000031
Figure BDA0002221155410000032
所述的对偶映射模块包含两个消息传递函数φ和ψ,分别表示从节点到边和从边到节点的信息传播行为,φ和ψ都是多层感知机;
消息传递函数φ将节点特征
Figure BDA0002221155410000034
转化为节点消息,该消息将被传递给和节点v相连的边;消息传递函数ψ将边特征
Figure BDA0002221155410000033
转化为边消息,该消息将被传递给和边e相连的节点。
所述的边特征的更新公式为:
Figure BDA0002221155410000048
其中,∈e是一个可以学习的数值参数,
Figure BDA0002221155410000049
表示一条边的特征增量,公式为
Figure BDA00022211554100000410
其中,AGGε(·)表示传递到一条边的所有消息的聚合函数,v表示节点,e表示边,
Figure BDA00022211554100000417
表示边e的起点和终点的集合,
Figure BDA00022211554100000411
为节点上的历史数据。
所述的节点特征的更新公式为:
Figure BDA00022211554100000412
其中,∈v是一个可以学习的数值参数,
Figure BDA00022211554100000413
表示一个节点的特征增量,公式为:
Figure BDA00022211554100000414
其中,AGGv(·)表示传递到一个节点的所有消息的聚合函数,ε(v)表示所有和v相连的所有边的集合,
Figure BDA00022211554100000415
为边上的历史数据。
所述对偶映射模块的输出使用两个特征输出函数rv和rε,用于分别生成每个节点和每条边的特征表示,
Figure BDA00022211554100000416
其中,rv和rε让节点和边的特征维度从C1变为C2,rv和rε是多层感知机。
所述节点和边的历史特征张量公式为:
Figure BDA0002221155410000041
其中,
Figure BDA0002221155410000042
为节点的历史特征张量,
Figure BDA0002221155410000043
为边的历史特征张量,
Figure BDA0002221155410000044
Figure BDA0002221155410000045
分别表示第h个隐藏层输出的节点和边的特征,对于一个包含了H个对偶映射模块的历史信息编码器,第h层的映射关系表示为
Figure BDA0002221155410000046
其中,DualMap(·)表示对偶映射。
步骤(3)中,所述的未来预测解码器进行预测的公式为:
Figure BDA0002221155410000047
其中,Dv和Dε分别将节点和边的历史特征张量映射为未来节点和边的预测,这两个函数是多层感知机。Dv的输入层维度是
Figure BDA0002221155410000051
输出层的维度是TVC;Dε的输入层维度是
Figure BDA0002221155410000052
输出层的维度是TEC。
步骤(4)中,使用平均绝对误差作为训练的损失函数,对于预测的未来交通数据
Figure BDA0002221155410000053
和实际的未来交通数据
Figure BDA0002221155410000054
损失函数的形式为
Figure BDA0002221155410000055
其中,||·||表示l_1范数,若不能得到边上的数据,则将上式中边的误差项去掉,只保留节点上的误差项。然后,通过随机梯度下降(SGD)的方式进行模型训练,直到损失函数收敛。
步骤(5)中,对于新来的测试数据,首先导入步骤(4)中保存的模型;然后按照步骤(1)、(2)、(3)的顺序,得到未来的交通预测结果;最后,用平均绝对误差(MAP),平均绝对百分比误差(MAPE)或者均方根误差(RMSE)来评估模型在测试集上的准确率。
与现有技术相比,本发明具有以下有益效果:
1、就任务场景而言,本发明拓展了现有技术的应用范围。之前的技术,例如STGCN、DST-GCNN和DCRNN,只利用了节点的历史信息,只能做未来的节点交通预测。而本发明同时利用了历史的节点和边的信息,可以同时做未来的节点和边的交通预测。本发明的预测结果能够得到未来交通状况的全量完整描述,更有利于交通疏导、风险防控、路线规划等后续任务。
2、就推演策略而言,本发明弥补了现有技术的不足之处。现有的STGCN和DST-GCNN等方法一次只能够做未来一个时刻的节点预测。如果需要同时预测多个时刻,则STGCN需要经过多次的模型前向传播,而DST-GCNN则更需要训练多个模型,带来了额外的计算负担。另一种DCRNN技术可以一次同时做未来多个时刻的节点预测,但是因为它使用了次序输出,即未来每个时刻的节点预测依赖于上个时刻的预测结果,所以存在误差累积的风险。本发明能够同时预测未来多个时刻的交通数据,并且取消了未来不同时刻之间的依赖关系,从而避免了误差累积。
3、就模型结构而言,在每个对偶映射模块里面,本发明使用了消息传递机制,而没有采用STGCN、DST-GCNN和DCRNN中的GCN单元。主要原因包括两点:(1)GCN中所需要的邻接矩阵只能用来建模节点之间的传播规律,而不能用来建模节点和边之间的交互行为;(2)即使采用了GCN,因为交通路况是动态变化的,GCN中所涉及的邻接矩阵也应该动态变化,而估计动态邻接矩阵需要额外的计算负担(例如DST-GCNN中的做法)。本发明的权重矩阵只表示图的拓扑关系,是一个只包含了0,1二值的矩阵,无需知道节点之间的距离,对路网的先验信息要求更低。
附图说明
图1为本发明一种基于对偶图框架的全量交通预测方法的流程示意图;
图2为本发明一种基于对偶图框架的全量交通预测方法的整体结构示意图;
图3为本发明实施例对偶映射模块的示意图;
图4为本发明实施例用SUMO平台模拟路网示意图;
图5为本发明实施例在SUMO模拟数据边上车流量的预测效果图;
图6为本发明实施例在SUMO模拟数据节点上车流量的预测效果图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
如图1所示,一种基于对偶图框架的全量交通预测方法,包括以下步骤:
步骤1,准备工作:准备路网拓扑图和数据。路网拓扑图为无权重有向图。数据分为历史的边和节点的数据,在训练阶段还包括未来的边和节点数据。
步骤2,历史信息编码器(Encoder):将历史数据输入到编码器中。在编码器内部,通过多层的对偶映射,来实现边和节点的特征更新。在每个对偶映射内部,通过消息传递(message passing)的机制建模节点和边之间的交互规律。将多层对偶映射的输出拼接为历史特征张量。
步骤3,未来预测解码器(Decoder):将历史特征张量解码成未来时空特征,输出未来预测结果。
步骤4,模型训练:将步骤1、2、3的预测结果和未来实际交通数据的误差作为损失函数来进行训练,保存训练好的模型。
步骤5,模型测试:对于测试集中的历史数据,导入训练好的模型,按照步骤1、2、3的顺序,输出未来预测结果。
本发明方法的整体结构如图2所示,输入为T′个历史时刻的节点和边上的交通数据
Figure BDA0002221155410000077
Figure BDA0002221155410000078
输出为预测得到的T个未来时刻的节点和边上的交通数据
Figure BDA0002221155410000071
Figure BDA0002221155410000072
整个模型分为历史信息编码器(Encoder)和未来预测解码器(Decoder)两部分:
历史信息编码器:由H个对偶映射(DualMap)模块依次堆叠而来。通过每个对偶映射模块,完成一次节点(边)与相邻的边(节点)的信息交互,进而分别完成节点和边上特征的更新。通过多个对偶映射模块的叠加,扩大了特征更新的感受野范围,实现了路网上更大范围的信息交互。然后将边和节点上所有对偶映射的输出各自拼接起来,得到历史特征张量表示
Figure BDA0002221155410000073
Figure BDA0002221155410000074
未来预测解码器:通过由两个多层感知机构成的解码器,将历史特征张量
Figure BDA0002221155410000075
Figure BDA0002221155410000076
分别映射为未来节点和边上的预测结果。将其和实际的未来交通数据的误差作为监督信息来训练整个模型。
如图3所示,对偶映射模块对输入的节点和边完成一次特征更新。具体来说,每个节点通过N2E模块φ将消息传递到相邻的边;每条边通过E2N模块ψ将消息传递到相邻节点。边的特征更新为边上的原来特征与其接收到的相邻节点消息之和;节点的特征更新为节点的原来特征与其接收到的相邻边消息之和。图3中4个矩形模块均表示多层感知机。
下面就图2和图3中所涉及的多层感知机(MLP)结构作统一说明。在本发明中,所有多层感知机都包含两个隐藏层。对于一个输入层维度为d1,隐藏层维度为d2,输出层维度为d3的多层感知机,将其表示为MLP(d1,d2,d3)。它由三个全连层依次复合构成:
Figure BDA0002221155410000081
Figure BDA0002221155410000082
Figure BDA0002221155410000083
其中f3中使用了0.5的随机剔除(dropout)比率。相邻层之间的激活函数为tanh(·)。本发明中所有涉及到的多层感知机模块结构如表1所示。
表1
Figure BDA0002221155410000084
接下来对以上5个步骤的具体内容展开介绍。
步骤1中的准备工作分为路网拓扑图和数据两方面:
步骤(1-1),将路网结构表示为拓扑图,将路口作为节点,将连接路口的路段作为边。本发明和以往做法的一个重大区别是,本发明无需边上权重(或者距离),因此减少了对动态图权重的依赖。用
Figure BDA0002221155410000085
和ε分别表示节点和(有向)边的集合,用
Figure BDA0002221155410000086
以及E=|ε|分别表示节点和边的个数。对于每个节点
Figure BDA0002221155410000087
用ε(v)表示所有和v相连的所有边(包括进向和出向)的集合;对于每条边e∈ε,用
Figure BDA0002221155410000088
表示e的起点和终点的集合。
步骤(1-2),假设需要利用T′个历史时刻的交通数据预测T个未来时刻的交通数据,那么节点和边上的历史数据可以分别表示为三维的张量
Figure BDA0002221155410000096
Figure BDA0002221155410000097
其形状分别为T′×V×C和T′×E×C。这里T′个时刻的历史观察通常具有固定的时间间隔(例如5分钟)。C表示输入特征的维度,特征一般指平均车速、(一段时间的)车流量等。在通常的包含四个方向的路口,特征维度的大小为4,分别代表4个方向的平均车速或者车流量。在有向边上,特征维度通常为1。这里为了记号简单起见,假设边和节点的特征维度相同,对于特征维度不同的情形,也可类似处理。在训练阶段,还需要准备未来的实际交通数据
Figure BDA0002221155410000091
Figure BDA0002221155410000092
其形状分别为T×V×C和T×E×C。这里
Figure BDA0002221155410000098
Figure BDA0002221155410000093
在时间上是前后相接的,
Figure BDA0002221155410000099
Figure BDA0002221155410000094
亦然。特别地,如果没有边上的数据,则在使用本发明的模型时,
Figure BDA00022211554100000910
Figure BDA0002221155410000095
皆取零。
步骤2为构造历史信息编码器。本步骤从低层到高层逐渐学习不同层次边和节点的特征。本步骤分为以下三个子步骤:
步骤(2-1):构造多层感知机(MLP)。
该子步骤中的多层感知机是本发明模型中的最基本单元。一个多层感知机是多个全连层的复合,层与层之间使用了非线性激活函数。
步骤(2-2):构造对偶映射(DualMap)模块。
对偶映射用来建模节点和边之间的信息交互。所谓“对偶”的意思是,相邻节点之间信息交互需要经过连接它们的边,而共享端点的边之间的信息交互需要经过它们的共享端点。通过一个对偶映射模块,输入特征
Figure BDA00022211554100000911
Figure BDA00022211554100000912
可以变为
Figure BDA00022211554100000913
Figure BDA00022211554100000914
同时改变边和节点上的特征维度。
具体而言,本子步骤可以分为以下三个更细的步骤:
步骤(2-2-1):构造消息传递函数。设置输入特征维度为C1。对于每个节点
Figure BDA00022211554100000915
Figure BDA00022211554100000916
表示该节点的输入特征,形状为T′×C1;对于每条边e∈ε,
Figure BDA00022211554100000917
表示该边的输入特征,形状为T′×C1。本发明在此引入两个消息传递函数φ和ψ,分别表示从节点到边(N2E)和从边到节点(E2N)的信息传播行为。具体来说,φ将节点特征
Figure BDA0002221155410000101
转化为节点消息,这个消息将被传递给和v相连的边;类似地,Ψ将边特征
Figure BDA0002221155410000102
转化为边消息,这个消息将被传递给和e相连的节点。注意,本发明对所有节点,共享同一个节点消息传递函数φ;对所有边,共享同一个边信息传递函数Ψ。φ和ψ都是多层感知机,这两个多层感知机输入层和输出层的维度都是T′C1
步骤(2-2-2):更新边和节点的特征。本发明引入AGGε(·)表示传递到一条边的所有消息的聚合(aggregation)函数,一般选取最大或者平均池化(pooling)。通过该函数,我们可以得到一条边上的特征增量
Figure BDA0002221155410000103
这里聚合的消息来源包括(有向)边的起点和终点,这是因为本发明认为一条边的上游和下游交通都会对这条边的交通产生影响。然后,将边的特征增量和其原始特征加和,就可以得到更新后的边的特征
Figure BDA0002221155410000104
其中∈e是一个可以学习的数值参数。在得到更新后的边的特征后,可以利用类似的方式得到节点的特征更新。首先借助于节点的消息聚合函数AGGv(·)来计算节点的特征增量
Figure BDA0002221155410000105
这里的AGGv(·)可以选取和AGGε(·)相同的形式。然后更新节点特征
Figure BDA0002221155410000106
同样,∈v也是一个可以学习的数值参数
步骤(2-2-3):构造特征输出函数。设置输出特征维度为C2。本发明引入两个特征输出函数rν和rε来分别生成每个节点和每条边的特征表示,
Figure BDA0002221155410000107
这里rν和rε让节点和边的特征维度从C1变为C2。rv和rε同样也是多层感知机,这两个多层感知机输入层维度是T′C1,输出层的维度都是T′C2
至此,我们介绍了单个对偶映射的构造形式。用函数DualMap(·)表示对偶映射,那么单个对偶映射模块可以表示为
Figure BDA00022211554100001116
可以看出,在一个对偶映射模块内,每个节点或边的特征受到其相邻的边或节点的影响。为了扩大感受野和影响范围,需要多个对偶映射的叠加。
步骤(2-3):构造历史信息编码器。借助于步骤(2-2)中引入的对偶映射,可以得到多层对偶映射,即历史信息编码器。对于一个包含了H个对偶映射模块的历史信息编码器,其第h层的映射关系可以表示为
Figure BDA0002221155410000111
其中
Figure BDA0002221155410000112
Figure BDA0002221155410000113
分别表示第h个隐藏层的节点和边的特征,其形状分别是T′×V×Ch和T′×E×Ch。特别地,
Figure BDA0002221155410000114
表示输入的历史交通数据。在这个历史信息编码器中,每个节点(边)的输出向量受到它的
Figure BDA0002221155410000115
度(degree)邻居节点(边)和
Figure BDA0002221155410000116
度邻居边(节点)的聚集消息影响,这里
Figure BDA0002221155410000117
表示向下取整函数。
在得到最后一个对偶映射的输出
Figure BDA0002221155410000118
Figure BDA0002221155410000119
之后,通过把所有隐藏层输出的特征拼接起来,可以得到整个历史特征张量
Figure BDA00022211554100001110
这里的拼接是沿着特征维度方向进行的。
步骤3:构造未来预测解码器。在得到步骤(2-3)的历史特征张量
Figure BDA00022211554100001111
Figure BDA00022211554100001112
之后,本发明引入了未来预测解码器D=(Dv,Dε)来预测未来交通数据
Figure BDA00022211554100001113
其中,Dv和Dε分别将节点和边的历史特征张量映射为未来节点和边的预测,这两个函数也都是多层感知机。Dv的输入层维度是
Figure BDA00022211554100001114
输出层的维度是TVC;Dε的输入层维度是
Figure BDA00022211554100001115
输出层的维度是TEC。
步骤4:模型训练。本发明使用平均绝对误差(MAE)作为训练的损失函数。对于预测的未来交通数据
Figure BDA0002221155410000121
和实际的未来交通数据
Figure BDA0002221155410000122
损失函数的形式为
Figure BDA0002221155410000123
其中||·||表示l_1范数。如果不能得到边上的数据,可以将上式中边的误差项去掉,只保留节点上的误差项。
然后,通过随机梯度下降(SGD)的方式进行模型训练,直到损失函数收敛。最后保存训练好的模型。
步骤5:模型测试。对于新来的测试数据,首先导入步骤(4)中保存的模型;然后按照步骤(1)、(2)、(3)的顺序,得到未来的交通预测结果;最后,用平均绝对误差(MAP),平均绝对百分比误差(MAPE)或者均方根误差(RMSE)来评估模型在测试集上的准确率。
为验证本发明的有效性,如图4所示,本发明借助于SUMO平台模拟了一个实际路网。SUMO是一个广泛使用的交通模拟平台,可以生成和实际路况非常接近的交通数据。图4中的路网包含21个路口和72条有向路段。每个路口有3或4个方向,每个路段和路口包含三个车道。车辆的达到服从泊松(Poisson)分布。车流类型包含了早晚高峰、平峰时段、潮汐车流等多种实际常见情形。一共生成了14天的数据,包含10个工作日和2个周末。训练集来自8个工作日,验证集来自另外2个工作日,测试集来自2个周末。数据每隔5分钟收集一次,即统计每个路口或者路段5分钟通过的车辆总数作为每隔5分钟的特征。为了简单起见,对于路口,将其所有方向的车流量加起来作为其特征。因此对于边和节点,特征维度C都取1。
另外,本发明还选取了另外两个常用的交通数据集METR-LA和PeMSD7来评估效果。其中METR-LA取自美国洛杉矶县高速路网,包含207个节点。数据从2012年3月1日持续到2012年6月30日。PeMSD7来自美国加利福尼亚州主要大都会区的高速路系统,包含加利福尼亚州7区的228个测试站。时间范围是2012年5月和6月的工作日。这两个数据集都是车流速度数据,每隔5分钟收集一次,特征维度C取1。这两个数据集都只包含节点数据,没有边上的数据,因此在使用本发明的模型时,边上的输入
Figure BDA0002221155410000132
取零。在数据预处理时,用了常用的Z-score正则化技术。三个数据集的概况列于表2中。
表2
Figure BDA0002221155410000131
评价标准:平均绝对误差(MAP)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)。数值越小表示预测越准确。
比较对象:在节点交通预测方面,主要和最近的三项交通预测技术DCRNN、STGCN、DST-GCNN相比,另外包括一些基础方法,例如历史平均(HA)、ARIMA、两层前项传播网络(FNN)、全连(FC)-LSTM。
实现细节:本发明的对偶图模型中,默认的H=2。在三个数据集上,都是用历史1小时的数据作为输入,即历史时刻T′=12。在Synth-SUMO和METR-LA上预测未来15分钟、30分钟和60分钟三个时刻,在PeMSD7上预测未来15分钟、30分钟和45分钟三个时刻。模型用SGD作为优化器,SGD中的动量(momentum)为0.9,权重衰减(weight decay)为5e-4,初始学习率为0.001,之后第50遍(epoch)衰减为原来的1/10,总共训练100遍。每个批次(mini-batch)包含64条数据。
表3中展示了在Synth-SUMO数据集节点预测上的定量比较结果。可以看到本发明的DualGraph模型因为同时利用了边和节点的历史信息,所以得到了更为准确的预测结果,这说明了边上的信息对节点的预测有促进作用。这里为了简单起见,只展示了MAE评价标准的结果,另外两个评价标准表现类似。
表3
Figure BDA0002221155410000141
表4中展示了本发明的方法在Synth-SUMO数据集上利用(√)或者没有利用(×)边的信息的预测结果,node pred.表示节点预测,edge pred.表示边上的预测。可以看到边上的预测准确度和节点预测的准确度相近;而且在使用了边的信息之后,节点的预测准确度比不用边的信息要高。这里同时展示了不同深度H下的比较结果,可以看到H=2时效果最好。这里也只展示了MAE评价标准的结果。
表4
Figure BDA0002221155410000142
如图5和图6所示,分别表示了本发明与对比方法在Synth-SUMO上的边和节点预测曲线图,两个图中对应的是同一次测试中1小时后的预测结果。边和节点分别对应图4中放大位置的边和节点,选取了测试集中一天的数据,GroudTruth表示真实数据,横坐标的单位为5分钟。因为边的预测没有现有的对比方法,所以在图5中只展示了和真实结果的对比。可以看到,本发明的DualGraph模型能够很好地预测交通预测的趋势,相比对比方法,能够捕捉到更细粒度的交通变化。
表5中展示了在两个公开数据集METR-LA和PeMSD7上的比较结果,这里只进行了节点预测的对比。可以看到本发明的模型DualGraph可以在大部分情形下取得最佳结果。这说明,即使做单独的节点预测任务,本发明也可以取得有竞争力的结果。同时可以注意到,对于长时(1小时)预测,本发明的优势更为凸显,这验证了本发明相比DCRNN等技术,具有减弱误差累积的功能。
表5
Figure BDA0002221155410000151
另外,现有的只做节点预测任务可以看做本发明适用的一种特殊情形,即本发明也可以用来在没有边上历史数据的条件下,只做节点上的交通预测。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于对偶图框架的全量交通预测方法,其特征在于,包括以下步骤:
(1)将路网结构表示为拓扑图,将路口作为节点,将连接路口的路段作为边;准备历史的边、节点数据以及未来的边、节点数据;
(2)构造历史信息编码器,将历史数据输入到编码器中,通过多层的对偶映射,实现边和节点之间的信息传递,将多层对偶映射的输出拼接为历史特征张量;
所述的历史信息编码器由多个对偶映射模块依次堆叠而成,通过每个对偶映射模块完成一次节点与相邻的边的信息交互,同时完成一次边与相邻节点的信息交互,进而分别完成节点特征和边特征的更新;通过多个对偶映射模块的叠加,将边和节点上所有对偶映射模块的输出各自拼接起来,得到节点和边的历史特征张量
Figure FDA0003393528140000011
Figure FDA0003393528140000012
(3)构造未来预测解码器,将历史特征张量解码成未来时空特征,输出未来预测结果;
所述的未来预测解码器进行预测的公式为:
Figure FDA0003393528140000013
其中,
Figure FDA0003393528140000017
和Dε分别将节点和边的历史特征张量映射为未来节点和边的预测,这两个函数是多层感知机;
(4)将预测结果和实际数据之间的误差作为损失函数来进行模型训练,直到损失函数收敛;
具体的,使用平均绝对误差作为训练的损失函数,对于预测的未来交通数据
Figure FDA0003393528140000014
和实际的未来交通数据
Figure FDA0003393528140000015
损失函数的形式为
Figure FDA0003393528140000016
其中,||·||表示l_1范数,若不能得到边上的数据,则将上式中边的误差项去掉,只保留节点上的误差项;
(5)用训练好的模型,进行模型测试,测试完毕后进行应用。
2.根据权利要求1所述的基于对偶图框架的全量交通预测方法,其特征在于,所述的对偶映射模块包含两个消息传递函数φ和ψ,分别表示从节点到边和从边到节点的信息传播行为,φ和ψ都是多层感知机;
消息传递函数φ将节点特征
Figure FDA0003393528140000021
转化为节点消息,该消息将被传递给和节点v相连的边;消息传递函数ψ将边特征
Figure FDA0003393528140000022
转化为边消息,该消息将被传递给和边e相连的节点。
3.根据权利要求1所述的基于对偶图框架的全量交通预测方法,其特征在于,所述的边特征的更新公式为:
Figure FDA0003393528140000023
其中,∈e是一个可以学习的数值参数,
Figure FDA00033935281400000212
表示一条边的特征增量,公式为
Figure FDA0003393528140000025
其中,AGGε(·)表示传递到一条边的所有消息的聚合函数,v表示节点,e表示边,
Figure FDA00033935281400000213
表示边e的起点和终点的集合,
Figure FDA0003393528140000026
为节点上的历史数据;
所述的节点特征的更新公式为:
Figure FDA0003393528140000027
其中,∈v是一个可以学习的数值参数,
Figure FDA0003393528140000028
表示一个节点的特征增量,公式为:
Figure FDA0003393528140000029
其中,
Figure FDA00033935281400000215
表示传递到一个节点的所有消息的聚合函数,ε(v)表示所有和v相连的所有边的集合,
Figure FDA00033935281400000210
为边上的历史数据。
4.根据权利要求3所述的基于对偶图框架的全量交通预测方法,其特征在于,所述对偶映射模块的输出使用两个特征输出函数
Figure FDA00033935281400000214
和rε,用于分别生成每个节点和每条边的特征表示,
Figure FDA00033935281400000211
其中,
Figure FDA00033935281400000216
和rε让节点和边的特征维度从C1变为C2,rν和rε是多层感知机。
5.根据权利要求1所述的基于对偶图框架的全量交通预测方法,其特征在于,所述节点和边的历史特征张量公式为:
Figure FDA0003393528140000031
其中,
Figure FDA0003393528140000032
为节点的历史特征张量,
Figure FDA0003393528140000033
为边的历史特征张量,
Figure FDA0003393528140000034
Figure FDA0003393528140000035
分别表示第h个隐藏层输出的节点和边的特征,对于一个包含了H个对偶映射模块的历史信息编码器,第h层的映射关系表示为
Figure FDA0003393528140000036
其中,DualMap(·)表示对偶映射。
CN201910934228.0A 2019-09-29 2019-09-29 一种基于对偶图框架的全量交通预测方法 Active CN110717627B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910934228.0A CN110717627B (zh) 2019-09-29 2019-09-29 一种基于对偶图框架的全量交通预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910934228.0A CN110717627B (zh) 2019-09-29 2019-09-29 一种基于对偶图框架的全量交通预测方法

Publications (2)

Publication Number Publication Date
CN110717627A CN110717627A (zh) 2020-01-21
CN110717627B true CN110717627B (zh) 2022-01-25

Family

ID=69211127

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910934228.0A Active CN110717627B (zh) 2019-09-29 2019-09-29 一种基于对偶图框架的全量交通预测方法

Country Status (1)

Country Link
CN (1) CN110717627B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353009B (zh) 2020-02-03 2021-10-26 百度在线网络技术(北京)有限公司 建立路线耗时预估模型、预估路线耗时的方法及对应装置
CN111292549B (zh) * 2020-02-03 2022-03-22 百度在线网络技术(北京)有限公司 建立路线耗时预估模型的方法、预估路线耗时的方法及对应装置
CN111540198B (zh) * 2020-04-17 2021-07-27 浙江工业大学 基于有向图卷积神经网络的城市交通态势识别方法
US20210398439A1 (en) * 2020-06-18 2021-12-23 The Hong Kong University Of Science And Technology Peer-inspired student performance prediction in interactive online question pools with graph neural network
CN111696355A (zh) * 2020-06-29 2020-09-22 中南大学 动态图卷积交通速度预测方法
CN112529311A (zh) * 2020-12-16 2021-03-19 南京中兴力维软件有限公司 一种基于图卷积分析的道路流量预测方法和装置
CN112633180B (zh) * 2020-12-25 2022-05-24 浙江大学 一种基于对偶记忆模块的视频异常检测方法及系统
CN112668797B (zh) * 2020-12-31 2023-06-16 中山大学 一种长短期交通预测方法
CN114944053B (zh) * 2022-03-16 2023-05-23 浙江工业大学 一种基于时空超图神经网络的交通流预测方法
CN116913104B (zh) * 2023-08-09 2024-03-19 西南大学 基于张量鲁棒分解的平均车速预测方法、装置、存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303839A (zh) * 2015-12-04 2016-02-03 中国科学院遥感与数字地球研究所 潜在拥堵道路交叉点的预测方法和装置
CN109785629A (zh) * 2019-02-28 2019-05-21 北京交通大学 一种短时交通流量预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303839A (zh) * 2015-12-04 2016-02-03 中国科学院遥感与数字地球研究所 潜在拥堵道路交叉点的预测方法和装置
CN109785629A (zh) * 2019-02-28 2019-05-21 北京交通大学 一种短时交通流量预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Dual Graph for Traffic Forecasting;Long Wei 等;《IEEE Access ( Early Access )》;20191209;第1-10页 *
Traffic flow forecasting based on rough set and neural network;Qingle Pang 等;《2010 Sixth International Conference on Natural Computation》;20100923;第1920-1924页 *
基于深度学习的车流量预测方法研究;史亚星;《计算机与数字工程》;20190531;第47卷(第5期);第1160-1163页 *

Also Published As

Publication number Publication date
CN110717627A (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
CN110717627B (zh) 一种基于对偶图框架的全量交通预测方法
CN109887282B (zh) 一种基于层级时序图卷积网络的路网交通流预测方法
US11270579B2 (en) Transportation network speed foreeasting method using deep capsule networks with nested LSTM models
CN109492814B (zh) 一种城市交通流量预测方法、系统及电子设备
Azadeh et al. Integration of artificial neural networks and genetic algorithm to predict electrical energy consumption
Alaloul et al. Data processing using artificial neural networks
CN111860951A (zh) 一种基于动态超图卷积网络的轨道交通客流预测方法
CN113313947A (zh) 短期交通预测图卷积网络的路况评估方法
Li et al. Data augmented deep behavioral cloning for urban traffic control operations under a parallel learning framework
CN114170789B (zh) 基于时空图神经网络的智能网联车换道决策建模方法
CN112071062B (zh) 一种基于图卷积网络和图注意力网络的行车时间估计方法
Zhang et al. A Traffic Prediction Method of Bicycle-sharing based on Long and Short term Memory Network.
Agami et al. A neural network based dynamic forecasting model for Trend Impact Analysis
CN106529818A (zh) 基于模糊小波神经网络的水质评价预测方法
CN109840628A (zh) 一种短时多区域车速预测方法及系统
Huo et al. Cooperative control for multi-intersection traffic signal based on deep reinforcement learning and imitation learning
CN112990485A (zh) 基于强化学习的知识策略选择方法与装置
CN112288080A (zh) 面向脉冲神经网络的自适应模型转化方法及系统
CN113537580A (zh) 一种基于自适应图学习的公共交通客流预测方法及系统
CN113326919A (zh) 一种基于计算图的交通出行方式选择预测方法
CN115659275A (zh) 非结构化人机交互环境中的实时准确轨迹预测方法及系统
CN114565187A (zh) 一种基于图时空自编码网络的交通路网数据预测方法
CN117116048A (zh) 基于知识表示模型和图神经网络的知识驱动交通预测方法
Kong et al. Mobility trajectory generation: a survey
Mukhtar et al. CCGN: Centralized collaborative graphical transformer multi-agent reinforcement learning for multi-intersection signal free-corridor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant