CN112382094B

CN112382094B - 基于时空势能场的城市交通流量可解释预测方法

Info

Publication number: CN112382094B
Application number: CN202011269906.5A
Authority: CN
Inventors: 王静远; 寄家豪; 张虎; 吕卫锋
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2020-11-13
Filing date: 2020-11-13
Publication date: 2022-03-15
Anticipated expiration: 2040-11-13
Also published as: CN112382094A

Abstract

本发明公开了一种基于时空势能场的城市交通流量可解释预测方法，用一系列时空势能场来建模交通流量背后的物理机制。首先采用风场分解算法把交通流量分解成为时空势能场，然后为时空势能场设计包含时间模块和空间模块的深度模型来分别建模动态时空依赖，预测出未来时空势能场，最后用预测得到的未来时空势能场来推理交通流量，使得交通流量的变化有迹可循。本发明的方法既具有深度学习方法在性能方面的优越性，又能够对交通流量的预测结果进行物理层面的解释，在一定程度上推进了深度学习方法在智能交通领域的应用。

Description

基于时空势能场的城市交通流量可解释预测方法

技术领域

本发明涉及智慧城市技术领域，更具体的说是涉及一种基于时空势能场的城市交通流量可解释预测方法。

背景技术

城市交通流量预测是智能交通系统中的一个基础问题，在交通管理和公众安全领域有着非常重要的作用。其利用城市中产生的移动轨迹数据，诸如汽车、人、自行车等轨迹来衡量某一区域的流(入/出)量大小，进而通过历史数据对将来该区域的交通流量进行预测。

目前，现有的针对交通流量预测的研究可以分为两大类：基于统计学的方法和基于深度学习的方法。基于统计学的方法通常有着较强的解释性，着重考虑交通流量在时间上的自相关性，把交通流量预测看成一个时间序列预测问题，然而由于这类模型不能很好地捕捉复杂的非线性关系和动态的时空依赖，因而在性能方面有所欠缺。深度学习方法却有着极强的非线性表征能力，而且拥有专门应对时间和空间建模的神经网络结构，所以基于深度学习的方法通常能够很好地建模交通数据中复杂的动态时空依赖，从而获得优越的性能。

但是深度学习模型的结构过于复杂，人们无法直观理解其给出结果的过程和依据，即存在不可解释的问题。虽然现有的研究给出了一些解释神经网络的方法，然而就时空数据预测而言，关于如何建模具有物理意义的城市动力学机制的研究还不够深入。

因此，如何高效地建模交通流量背后的物理过程，使得交通流量预测问题同时获得高性能和解释性是本领域技术人员亟需解决的问题。

发明内容

有鉴于此，本发明提供了一种可解释的时空深度模型来进行交通流量的预测。受到重力场驱动水流的启发，考虑用一系列时空势能场来建模交通流量背后的物理机制。首先采用风场分解算法把交通流量分解成为时空势能场，接着为时空势能场设计包含时间模块和空间模块的深度模型来分别建模动态时空依赖，预测出未来时空势能场，最后用预测得到的未来时空势能场来推理交通流量，使得交通流量的变化有迹可循。

为了实现上述目的，本发明采用如下技术方案：

一种基于时空势能场的城市交通流量可解释预测方法，包括如下步骤：

步骤1：根据城市交通轨迹数据构建具备时间序列关系的时空流量图；

步骤2：采用经典社区划分算法对所述时空流量图进行社区划分，获得建模时空流量图；

步骤3：采用风场分解算法将所述建模时空流量图分解为若干流量多树，根据所述流量多树构建时空势能场；

步骤4：根据所述时空势能场进行时空建模，构建时空势能估计模型；

步骤5：将所述时空势能场输入所述时空势能估计模型，获得未来时空势能场，根据所述未来时空势能场推理交通流量，获得未来交通流量的城市分布。

优选的，所述步骤1的具体过程为：

步骤11：对城市进行网格划分，把轨迹数据嵌入到城市网格中，构建每个网格区域的空间数据样例，所述空间数据样例包括相邻四个方向的流入量和流出量，从而得到空间栅格框架；

步骤12：将空间栅格框架转化为流量图，所述流量图中节点为所述空间栅格框架中的所述网格区域，所述节点之间的边为相邻所述网格区域之间的流量，边的方向代表流量的方向，所述流量图为一个有向图；

步骤13：将每个时间段的所述流量图按照先后顺序排列得到所述流量图的时间序列，所述时间序列内的所述流量图作为所述时空流量图。

优选的，所述步骤2中采用经典社区划分算法，对所述时空流量图进行社区划分，通过最大化社区内流量、最小化社区间流量的策略把整个城市划分为相对较小的连续区域，以便于获得更易建模和解释的时空流量图，即获得所述建模时空流量图。

优选的，所述步骤3中通过风场分解算法把每个所述建模时空流量图分解为四个正交的所述流量多树，每个所述流量多树均对应构建一个时空势能场，时空势能场是一个标量场，其背后对应的是一个流量多树，且该多树是被分解的所述建模时空流量图的生成树，该多树的节点集合与被分解的所述建模时空流量图保持一致，而边集合是被分解的所述建模时空流量图边集合的真子集。

优选的，步骤3中采用所述风场分解算法的具体实现过程为：

步骤31：每个所述建模时空流量图均存在正向流量和逆向流量，均可以被分解为两个流量多树Ti，初始化所述流量多树Ti的骨干节点集合B和骨干边扩展方向集合D为空集合；

步骤32：初始化所述建模时空流量图的所述正向流量和所述逆向流量的所述流量多树T1和T2，并为每棵多树选择对应的骨干节点b1和b2，以及所述骨干点对应扩展方向d1和d2，d1和d2相互垂直；

步骤33：对于第i棵多树，沿方向di扩展骨干节点bi得到骨干子图Gb，并加入所述流量多树Ti；

步骤34：沿着方向di的垂直方向扩展所述骨干子图Gb中的每个节点得到齿边子图Gt，并加入所述流量多树Ti；

步骤35：判断所述齿边子图Gt中所有节点是否均被扩展选择过，如果是，则生成所述流量多树Ti；否则，选择一个未选择过的节点p沿方向di选择不会成环的边扩展节点p，并加入所述骨干子图Gb和所述多树Ti中，并返回步骤34；

步骤36：获得多树T1和多树T2，若一条边同时出现在T1和T2中，则将该边在两棵多树中的流量均减半；随机选择所述多树T1和所述多树T2中的节点为零时能点，沿着多树的边计算各节点相对应的势能，获得初始时空势能场；

步骤37：令所述初始时空势能场的最小势能节点的势能为0，沿着多树的边更新各节点相对应的势能，得到所述时空势能场。

优选的，所述步骤4的具体步骤为：

步骤41：进行时间建模，根据所述时空势能场结合门控循环单元构建时间模型，采用隐藏状态向量表征时间模型学习信息；将所有所述时空势能场构建成一个时间序列，通过所述门控循环单元来捕捉所述时空势能场在时间上的自相关性，并用隐藏状态向量h_v,t来表征时间模块学习到的信息，并作为输入传递到空间建模；

步骤42：进行空间建模，利用所述隐藏状态向量初始化空间表征获得时空表征，使用多头图注意力网络来迭代所述时空表征；

步骤43：将所述时空表征输入全连接的多层感知机映射出所述未来时空势能场。

优选的，所述步骤5中进行交通流量预测的具体过程为：

步骤51：初始化推理获得的时空流量图G，令每条边流量均为0；

步骤52：对于每一个未计算的社区，初始化该社区对应的社区时空流量图Gc，令每条边流量均为0；

步骤53：初始化每个社区的所述未来时空势能场对应的建模时空流量图Gm，令每条边流量为0；

步骤54：应用步骤31-步骤37的逆过程将每个社区对应的所述未来时空势能场转化为所述建模时空流量图Gm；判断所述未来时空势能场中的边是否均被转化，如果未完全转化，选择一条未转化的边(u,v)，如果u的势能大于v的势能，则将所述建模时空流量图Gm中边(u,v)的流量设为u的势能减去v的势能，否则将所述建模时空流量图Gm中边(u,v)的流量设为v的势能减去u的势能，并将边(u,v)标记为已转化；如果完全转化，则将所述建模时空流量图Gm的每条边对应加到所述社区时空流量图Gc中；

步骤55：根据所述社区时空流量图Gc在所述时空流量图G中的位置，将所述社区时空流量图Gc的每条边对应加入所述时空流量图G中，获得每个社区对应的时空流量图，判断当前交通流量状态。

经由上述的技术方案可知，与现有技术相比，本发明公开提供了一种基于时空势能场的城市交通流量可解释预测方法，开创性地提出了时空势能场的概念，用于建模交通流量背后的物理机制，同时开发了风场分解算法来构建时空势能场，然后为时空势能场设计了包含时间模块和空间模块的深度模型来分别建模，实现其时间相关性和空间依赖性。本发明的方法既具有深度学习方法在性能方面的优越性，又能够对交通流量的预测结果进行物理层面的解释，在一定程度上推进了深度学习方法在智能交通领域的应用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1附图为本发明提供的整体框架示意图；

图2附图为本发明提供的概念示意图；

图3附图为本发明提供的多种方法在交通领域任务上的性能对比图；

图4附图为本发明提供的多种方法在所有任务上的整体对比图；

图5附图为本发明提供的风场分解过程流量多树形成图；

图6附图为本发明提供的分解获得两个多树示意图；

图7附图为本发明提供的交通流量和时空势能场空间分布对比图；

图8附图为本发明提供的不同时间段时空势能场空间分布示意图；

图9附图为本发明提供的时空势能场的时间分布图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种基于时空势能场的城市交通流量可解释预测方法，包括如下步骤：

S1：根据城市交通轨迹数据构建具备时间序列关系的时空流量图；

S11：对城市进行网格划分，把轨迹数据嵌入到城市网格中，构建每个网格区域的空间数据样例，空间数据样例包括相邻四个方向的流入量和流出量，从而得到空间栅格框架；

S12：将空间栅格框架转化为流量图，流量图中节点为空间栅格框架中的网格区域，节点之间的边为相邻网格区域之间的流量，边的方向代表流量的方向，流量图为一个有向图；

S13：将每个时间段的流量图按照先后顺序排列得到流量图的时间序列，获得时空流量图G(V_G,E_G)，其中V_G表示时空流量图的节点集合，E_G表示时空流量图的边集合；

S2：采用经典社区划分算法对时空流量图进行社区划分，获得建模流量图；对时空流量图进行社区划分，通过最大化社区内流量、最小化社区间流量的策略把整个城市划分为相对较小的连续区域，以便于获得更易建模和解释的时空流量图，即获得建模时空流量图；

S3：采用风场分解算法将建模时空流量图分解为若干流量多树T(V_T,E_T)，根据流量多树构建时空势能场，其中，V_T＝V_G，

时空势能场是一个标量场，其背后对应的是一个流量多树，每个建模时空流量图均被分解为四个正交的流量多树，每个流量多树均对应构建一个时空势能场，多树是被分解流量图的生成树，该多树的节点集合与被分解流量图保持一致，而边集合是被分解流量图边集合的真子集；流量多树是风场分解算法的中间产物，但其结构是时空势能场的隐含空间结构，该结构不随时间变化，而时空势能场是随时间变化的；

流量图分解就是把一个时空流量图G(V_G,E_G)分解为流量多树T₁,T₂,…,T_k，且对于任意的i，j，有

和

S31：每个建模时空流量图均存在正向流量和逆向流量，均可以被分解为两个流量多树Ti，初始化流量多树Ti的骨干节点集合B和骨干边扩展方向集合D为空集合；

S32：初始化建模时空流量图的正向流量和逆向流量的流量多树T1和T2，并为每棵多树选择对应的骨干节点b1和b2，以及骨干点对应扩展方向d1和d2，d1和d2相互垂直；

S33：对于第i棵多树，沿方向di扩展骨干节点bi得到骨干子图Gb，并加入流量多树Ti；

S34：沿着方向di的垂直方向扩展骨干子图Gb中的每个节点得到齿边子图Gt，并加入流量多树Ti；

S35：判断齿边子图Gt中所有节点是否均被扩展选择过，如果是，则生成流量多树Ti；否则，选择一个未选择过的节点p沿方向di选择不会成环的边扩展节点p，并加入骨干子图Gb和多树Ti中，并返回S34；

S36：获得多树T1和多树T2，若一条边同时出现在T1和T2中，则将该边在两棵多树中的流量均减半；随机选择多树T1和多树T2中的节点为零时能点，沿着多树的边计算各节点相对应的势能，获得初始时空势能场；

S37：令初始时空势能场的最小势能节点的势能为0，沿着多树的边更新各节点相对应的势能，得到时空势能场；

S4：根据所述时空势能场进行时空建模，构建时空势能估计模型；

S41：进行时间建模，根据时空势能场结合门控循环单元构建时间模型，采用隐藏状态向量表征时间模型学习信息；所有时空势能场可以构成一个时间序列，通过门控循环单元来捕捉其在时间上的自相关性，并用隐藏状态向量h_v,t来表征时间模块学习到的信息，然后将其作为输入传递到空间建模；时空势能场的历史数据指的是分解过的时空势能场；

其中流量多树节点v在时间步t的势能表示为p_v,t，多树节点的历史势能数据(及时空势能场的势能)可以被表示为时间序列{p_v,1…p_v,t-1}；给定当前时间步t，考虑最近的t_S个时间步，也就是从时间步t-t_S到时间步t-1；为了对时间信息进行建模，使用门控循环单元(GRU)对最近的势能子序列编码，在时间步t，根据GRU网络更新节点v的隐状态，表示为

h_v,t＝GRU(h_v,t-1,p_v,t) (1)

其中输入h_v,t-1为多树节点v在时间步t-1的隐藏状态向量，p_v,t为多树节点v在时间步t的势能，输出h_v,t就是多树节点v在时间步t的隐藏状态向量，其编码了必要的时间信息编码，作为空间模块的输入；

S42：进行空间建模，利用隐藏状态向量初始化空间表征获得时空表征，使用多头图注意力网络来迭代时空表征，使时空势能估计模型学习更多的空间信息，时空表征为融合了时间信息的空间表征；

S421：为了捕捉空间相关性，使用多头图注意力网络(GAT)，其更新函数可以表示为

N^(z)＝GAT(N^z-1|t) (2)

N^(z)的第v_k列

为节点v_k的图表示，v_k是多树节点集合V中的一个节点，z表示对于一个特定时间步t的迭代的轮次；

S422：GAT模型旨在学习一个多树节点在时间t的动态表示，具体来说，通过时间建模的结果来初始化节点的空间表示为

为了方便，这里忽略了

的时间索引，GAT的一个关键点在于设置两个节点之间的注意力权重，这里设两个节点v_i和v_j的权重为

其中α为注意力权重，ω和W_(·)是可学习参数，(·)^T表示转置操作，N_vi表示v_i的邻居；

S423：为了捕捉复杂的空间依赖并且稳定化自注意力的学习过程，使用多头注意力机制，具体来说，用了M个独立的注意力机制，产生如下时空表征输出

其中||代表拼接操作，

是第m个注意力机制计算的正则化后的注意力系数，W^(m)是相关的输入线性变换权重矩阵；

S43：将时空表征输入全连接的多层感知机映射出未来时空势能场；

使用一个基于多层感知机的预测器来估计多树中节点v在时间步t的势能

采用平方误差来计算模型的误差，从而进行时空势能估计模型的迭代更新，公式如下

S5：将时空势能场输入时空势能估计模型，获得未来时空势能场，根据未来时空势能场推理交通流量，获得未来交通流量的城市分布；

进行交通流量预测的具体过程为：

S51：初始化推理获得的时空流量图G，令每条边流量均为0；

S52：对于每一个未计算的社区，初始化该社区对应的社区时空流量图Gc，令每条边流量均为0；

S53：初始化每个社区的未来时空势能场对应的建模时空流量图Gm，令每条边流量为0；

S54：应用S31-S37的逆过程将每个社区对应的未来时空势能场转化为建模时空流量图Gm；判断未来时空势能场中的边是否均被转化，如果未完全转化，选择一条未转化的边(u,v)，如果u的势能大于v的势能，则将建模时空流量图Gm中边(u,v)的流量设为u的势能减去v的势能，否则将建模时空流量图Gm中边(u,v)的流量设为v的势能减去u的势能，并将边(u,v)标记为已转化；如果完全转化，则将建模时空流量图Gm的每条边对应加到社区时空流量图Gc中；

S55：根据社区时空流量图Gc在时空流量图G中的位置，将社区时空流量图Gc的每条边对应加入时空流量图G中，获得每个社区对应的时空流量图，判断当前交通流量状态。

实施例

间栅格框架(Spatial Raster Framework)，空间栅格框架是将空间区域细分为规则网格，框架中的每个网格都是一个空间数据样本；附图2(a)给出了一个4×4空间栅格框架的示例，每一个网格都包含了在四个方向上从邻居流入和流出到邻居的流量。

流量图(Flow Graph)，时空流量图G(V_G,E_G)是一个有向图，图中节点为栅格框架中的网格区域，节点之间的边为相邻网格区域之间的流量，边的方向代表流量的方向；附图2(b)展示了一个4×4空间栅格框架对应的流量图，这里边上的两种颜色分别代表主流量图和副流量图，其区别在于所包含边的方向的不同。

流量多树(Flow Poly-tree)，流量多树T(V_T,E_T)是流量图的有向生成树，将其按照水平方向和垂直方向进行扩展分解，流量多树的节点集合与被分解流量图保持一致(V_T＝G_T)，而边集合是被分解流量图边集合的真子集

附图2(c)和2(d)就是流量图2(b)的流量多树，因为2(c)和2(d)的节点集合均与2(b)中的节点集合一致，而边集合是2(b)中边集合的真子集。

流量图分解(Flow Graph Decomposition)，流量图分解就是把一个流量图G分解为流量多树T₁,T₂,…,T_k，且对于任意的i，j，有边集合

和

势能场(Potential Energy Field)，时空势能场是一个标量场，相邻节点之间的梯度代表了流量多树的边上的流量；附图2(d)到2(f)给出了由流量多树构建时空势能场的一个示例，附图2(d)给定一个包含16个节点和15条边的流量多树，边上的数字代表流量大小；附图2(e)任意指定一个零势能点，可以计算出其余节点的相对势能大小；附图2(f)是将附图2(e)最小的负数势能设置为0，然后势能场的势能值,根据新指定的零势能点进行调整，但节点之间的相对大小保持不变。

附图1为本发明提出的深度学习框架流程图。与传统的深度学习过程相比该框架的不同之处在于使用时空势能场而非流量图进行了时空模型预测，因为时空势能场提供了重要的潜在信息，可以用于解释预测的交通流量。

本发明的方法基于一个重要的思想，即交通流量是由一组潜在的时空势能场驱动的，类似于水流是由重力场驱动的。然而，由水流模型推广到交通流量模型并不简单，与水流不同，交通流可能存在环，而环的存在违背了势能场的概念。为了解决这个问题，本发明提出将交通流量图分解为若干个组成部分，每一部分都是无环的，然后对每一部分的时空势能场进行建模，而通过模型学习之后的势能场为解释交通流量提供了基础。此外，为了保持时空势能场的良好的可解释性(交通流量和时空流量图在长距离上的影响会更加复杂)，本发明提出将整个城市区域分割为一些社区，然后对每个独立的社区建模(分治策略)。

社区划分的目的在于将要学习的区域分为更小的连续区域，每个区域代表一个更小的空间范围，以便于基于时空势能场获得更易建模和解释的时空流量图。给定一个城市对应的完整时空流量图结构，和图中相邻节点之间的历史交通流量数据，社区划分的目标是最大化区域内交通流量并且最小化区域间交通流量。这个问题类似于社交网络中的社区划分。因此这里采用经典社区划分算法(Girvan-Newman(GN)算法)，针对有向图的改进版，该算法的主要思想是从网络中逐步地移除边，然后基于模块度(一个用于度量社区划分结果好坏的指标)分割网络，其中边的移除指标采用边的中心度，也就是所有点对之间的最短路中经过这条边的数量，显然中心度越小的边越容易成为社区之间的边，被用于划分不同的社区。

流量图分解的目标在于将一个社区的流量图分解为四个正交的流量多树，每个多树对应一个时空势能场。然而，流量图分解问题在计算上具有很大的挑战性。首先，对于这个图论问题是否存在解是不明确的，进一步来讲，在分解的过程中会产生多少个多树也是不明确的，最后，分解流量图也是存在困难的，尤其是空间形状不规则的社区。为了证明分解问题是可解的，使用了一个定理，该定理解释了什么样的图可被分解为边集合不相交的生成树。

定理1：有穷图G有k个边集合不相交的生成树，当且仅当对于V_G的每一个非空子集X，Δ_G(V_G)＝0并且Δ_G(X)≥0。

其中，Δ_G(X)＝k(|X|-1)-|E_X|，|·|符号表示集合中元素的数量。判断一个图能否被分解为k个边集合不相交的生成树，只需要确认定理中的两个条件是否满足即可，而事实上，当k＝2时，时空流量图恰好满足这两个条件，这使得流量图分解问题变得可解。

基于定理1，本发明设计了如图3所示的风场分解算法把流量图分解为多树，进而构造时空势能场。思路是将时空流量图映射到四个基础方向上：从北向南，从南向北，从东向西，从西向东。流量图在每一个基础方向的映射组成了一个梳子形状的多树，接着通过多树便可以构建时空势能场。这样的分解有两个优点。首先，它足够简单可以被推广到任意形状的时空流量图上，第二，分解中的基础方向是正交的，使得人们可以很容易地基于常识来解释时空势能场。

势能场的时空建模：

这里要预测一个多树节点v在时间步t的势能，表示为p_v,t。该预测过程可以在所有的多树节点上并行进行，依次实现时间建模和空间建模。

交通流量预测：

在每一个社区的时空势能场被估计出来之后，交通流量预测部分将根据时空势能场生成流量多树，然后通过组合每个社区的流量多树预测城市的时空流量图，如图4中介绍了详细的算法流程。

如图5所述为采用风场分解算法分解时空流量图生成流量多树的结构变化过程。图5(a)选取骨干点r2和r9，设定r2对应的扩展反向为垂直方向，r9对应的扩折方向为水平方向，r2为多树T2的骨干点，r9为多树T1的骨干点，首先对T1进行扩展，r9沿水平方向扩展经过r10、r11到r12，形成一条如图5(b)的红色骨干子图；然后对骨干子图上的节点沿垂直方向进行扩展，r9扩展到r5、r10扩展到r6、r11扩展到r7、r12经过r8、r4扩展到r2，扩展节点与骨干节点之间的边为齿边，构成齿边子图，将骨干子图和齿边子图加入到T1中，形成图5(c)所示的多树；由于还存在r1和r3两个未被选择的节点，随机选择r3沿水平方向不会成环的边扩展，r3扩展到r4为骨干边，加入到骨干子图和T1中，形成图5(d)所示的多树；再沿着垂直方向扩展r3到r1，形成齿边加入到T1中，最终形成如图6(a)的多树T1，图5(f)为按照上述方法扩展r2形成的扩展图，最终形成如图6(b)所示的多树T2。上述分解过程为将时空流量图的逆向流量分解为两个流量多树的过程，正向流量分解过程相同。

采用本发明方法实现交通流量预测的一个具体实施例：

1.实验设置

1.1数据集及预处理

来自GAIA公开数据集的西安出租车数据集，包含了3784063条出租车轨迹，每隔3秒钟采样一次；北京出租车数据集包含了60828387条出租车轨迹，每隔1分钟采样一次；波尔图出租车数据集包含了1891921条出租车轨迹，每隔15秒采样一次。对于每一个数据集，都选取前80％作为训练样本，其余数据作为测试样本。

分别把西安、北京和波尔图的城市面积划分为18×18、32×32和12×8的区域，使得这三个城市每个区域的实际大小大概为500m×500m。为了评估不同预测长度的表现，将时间间隔分别对西安、北京和波尔图数据集设定为5分钟、30分钟和60分钟。在训练数据和测试数据采样时均采用滑动窗口方法。

1.2评价标准和基线模型

采用均方根误差(Root Mean Square Error,RMSE)和决定系数(Coefficient ofdetermination,R²)来评价本发明的技术方案和其他基线方法，其中基线方法包括：(1)历史均值(Historical Average,HA)，(2)差分整合移动平均自回归(AutoregressiveIntegrated Moving Average Model,ARIMA)，(3)时空自回归(Spatio-Temporal AutoRegressive model,STAR)，(4)长短时记忆网络(Long Short-Term Memory,LSTM)，(5)极端梯度提升(Extreme Gradient Boosting,XGBoost)，(6)卷积长短时记忆网络(Convolutional LSTM,CLSTM)，(7)时空残差卷积网络(Spatial Temporal ResidualNetworks,STResNet)，(8)时空动态网络(Spatial Temporal Dynamic Networks,STDN)。

1.3任务设置

对于每个数据集，使用前90％的训练数据来训练模型，使用剩余的10％来优化模型。在所有的测试数据集上，分别使用下一、二和四跳来生成三种任务。然后根据验证集中的表现设定超参数。批次大小设定为100。对于西安、北京和波尔图的社区数分别设定为4，12和8。一个社区的流量图由4个流量多树组成。对于时间信息而言，设定GRU的输入序列长度为4，隐层表征的维度为128。在空间建模中设定参数M＝8。多层感知机拥有一个隐藏层，该隐藏层包含128个隐层单元。所有的表征的初始化都是由一个均值为0，方差为0.01的截断正态分布完成的，所有偏置量同样被初始化为0。设定最大的轮次为100，选择学习率为0.001和带有早停机制的Adam优化器来训练模型直至收敛。

2.结果分析

表1所示为本发明所提出方法与其他方法在交通预测任务上的性能对比，“m”和“h”分别代表分钟和小时，RMSE指标越小代表性能越好，R²指标越大说明性能越好。

表1本发明方法与基线方法的评价值

表2所示为本发明所提出方法与其他方法在所有任务上的整体对比，对于每一个任务都可以得到一个所有方法的性能排名，Win times代表该方法在所有任务上获胜(排名为第一)的次数，AVG arithmetic ranking代表该方法在所有任务上排名的算数平均数，AVG geometric ranking则代表排名的几何平均数，可以看到，本发明方法以显著的优势超越其他基准方法。

表2本发明方法与基线方法的所有任务性能比对

传统的自回归方法表现一般，包括HA，ARIMA和STAR，这些方法太简单以至于无法捕捉交通流量预测任务中的时间动态性。然而，得益于深度学习的非线性建模能力，LSTM表现得更好一些。通过对比LSTM和CLSTM，可以发现空间因素在这个任务中起到了至关重要的作用。因此表现较好的模型均为时空模型。在所有的竞争者中，本发明提出的方法时空势能场(ST-PEF)建模表现得最好，本发明的方法和其他时空模型的主要区别就在于它的时空势能场中，这也表明本发明提出的时空势能场有着很重要的意义。

总的来说，深度学习模型比经典统计模型表现得更好，时间因素和空间因素在交通流量预测任务中都起到了很重要的作用。本发明提出的基于时空势能场的可解释预测方法，把时空势能场和深度学习技术有机结合起来，得到了很好的预测性能和可解释性。

基于本发明提供的方法，在北京出租车数据集上的进行时空势能场分析，从而验证本方案提出的时空势能场可以揭示隐藏的城市动态模式，解释交通流的物理过程，具体分析如下：

1)隐藏模式

如图7展示了流量和势能场关键区域的空间分布。给定一个流量图，可以通过简单加和在所有方向上进出这个区域的流量进而来得到该区域的流入量和流出量。对于每个社区而言，选择流出量最高的前4％区域作为流出量的关键区域并用红色表示，同理选择流入量最高的前4％区域作为流入量的关键区域并用黄色表示。如果流入量和流出量的关键区域重合的话，就用蓝色表示。如此就得到了附图7(a)，对于势能场用同样的方法可以得到附图7(b)，只不过势能场关键区域的选择依据的是高/低势能而非流入/出量，高势能区域用红色表示，低势能区域用黄色表示。

可以看出在流量图中有很多重合区域而在势能场中却没有，表明势能场是更容易理解的。举例说明，在许多研究中，一个在晚高峰有更高流出量的区域可以被定义为工作区，但如果流入量同样很高的话，那么这个区域更有可能是一个交通站。区别于流量，势能场可以清晰地定义一个功能区，晚上的高势能区域是工作区，低势能区域是住宅区。另一方面，流量图的关键区域分散在整个城市中，而势能场的关键区域则倾向于聚集形成毗连区，更有可能成为功能区。总而言之，势能场更好地揭示了交通流中不明显的隐藏模式，提供了一种更容易理解的方法。

2)深度可解释性

图8为不同时间段的时空势能场空间分布图，包含(a)-(d)四个子图分别代表不同时间段的空间分布图，其中图8(a)代表周内早高峰，图8(b)代表周内晚高峰，图8(c)代表周末早高峰，图8(d)代表周末晚高峰。图8展示了在工作日和周末关键势能区域的空间分布。采用和附图7同样的处理方法得到关键区域，高势能区域用红色表示，低势能区域用黄色表示，并使用蓝色箭头来表示由于势能的不同而导致的流量方向，从高势能区域指向低势能区域，然后用蓝色圆圈标记在早高峰和晚高峰势能场倒转的区域簇，即势能潮汐效应。

可以看出在工作日上午，如附图8(a)所示，在势能的驱动下，人们通常来自他们居住的郊区(势能高的地区)，前往他们工作的市中心(势能低的地区)；然而在晚高峰，如附图8(b)所示，流向翻转，人们从工作区向住宅区移动。这说明在工作日的交通流量演化过程中存在着势能潮汐效应，正是这种势能潮汐效应驱动着交通流的演化。到了周末，这种现象并不存在于整个城市，而是存在于两个区域，购物中心和火车站。在早高峰时，如附图8(c)所示，势能场驱使人们去西单、王府井等商业街和北京南站等火车站，因为这些区域处于低势能状态。在晚高峰时，如附图8(d)所示，同一区域的势能变高，促使人们离开这些区域，一部分人去往居民区，一部分人则去往三里屯这样的酒吧街。

图9为时空势能场的时间分布图，包含(a)和(b)两个子图分别代表周内和周末的时间分布图。图9是在工作日和周末关键区域势能的时间分布，住宅区(Residential area)与办公区(Office area)之间在工作日存在势能潮汐效应，而在周末不太明显。但从附图9(b)可以看出，购物街(Shopping street)和火车站(Train station)的势能在上午较低，但在上午之后上下起伏了三次，导致这些区域的交通流向其他地方流动，例如到达火车站的旅客离开火车站回家。对于居民区而言，势能保持相对较低的状态，说明在周末，家总是一个吸引人的地方。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于时空势能场的城市交通流量可解释预测方法，其特征在于，包括如下步骤：

步骤1：根据城市交通轨迹数据构建时空流量图；

步骤3：采用风场分解算法将所述建模时空流量图分解为若干流量多树，并根据所述流量多树构建时空势能场；通过风场分解算法把每个所述建模时空流量图分解为四个正交的所述流量多树，每个所述流量多树均对应构建一个时空势能场；时空势能场是一个标量场，对应的是一个流量多树，且所述流量多树是被分解的所述建模时空流量图的生成树，所述流量多树的节点集合与被分解的所述建模时空流量图保持一致，边集合是被分解的所述建模时空流量图边集合的真子集；

采用所述风场分解算法的具体实现过程为：

步骤36：获得多树T1和多树T2，若一条边同时出现在T1和T2中，则将该边在两棵多树中的流量均减半；随机选择所述多树T1和所述多树T2中的节点为零势能点，沿着多树的边计算各节点相对应的势能，获得初始时空势能场；

步骤37：令所述初始时空势能场的最小势能节点的势能为0，沿着多树的边更新各节点相对应的势能，得到所述时空势能场；

步骤4：根据所述时空势能场进行时空建模，构建时空势能估计模型；将所述时空势能场输入所述时空势能估计模型，获得未来时空势能场；

步骤5：根据所述未来时空势能场推理交通流量，获得未来交通流量的城市分布。

2.根据权利要求1所述的基于时空势能场的城市交通流量可解释预测方法，其特征在于，所述步骤1的具体过程为：

步骤12：将空间栅格框架转化为流量图，所述流量图中节点为所述空间栅格框架中的所述网格区域，所述节点之间的边为相邻所述网格区域之间的流量，边的方向代表所述流量的方向；

3.根据权利要求1所述的基于时空势能场的城市交通流量可解释预测方法，其特征在于，所述步骤2中采用经典社区划分算法，对所述时空流量图进行社区划分，通过最大化社区内流量和最小化社区间流量的策略把整个城市划分为相对较小的连续区域，获得所述建模时空流量图。

4.根据权利要求1所述的基于时空势能场的城市交通流量可解释预测方法，其特征在于，所述步骤4的具体步骤为：

5.根据权利要求1所述的基于时空势能场的城市交通流量可解释预测方法，其特征在于，所述步骤5中进行交通流量预测的具体过程为：

步骤54：将每个社区对应的所述未来时空势能场转化为所述建模时空流量图Gm；判断所述未来时空势能场中的边是否均被转化，如果未完全转化，选择一条未转化的边(u,v)，如果u的势能大于v的势能，则将所述建模时空流量图Gm中边(u,v)的流量设为u的势能减去v的势能，否则将所述建模时空流量图Gm中边(u,v)的流量设为v的势能减去u的势能，并将边(u,v)标记为已转化；如果完全转化，则将所述建模时空流量图Gm的每条边对应加到所述社区时空流量图Gc中；