CN115273472B

CN115273472B - 一种基于图卷积网络表示道路的通行时间预测方法及系统

Info

Publication number: CN115273472B
Application number: CN202210892673.7A
Authority: CN
Inventors: 王杜娟; 殷允强; 朱嘉诚; 王大江
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2022-07-27
Filing date: 2022-07-27
Publication date: 2023-05-02
Anticipated expiration: 2042-07-27
Also published as: CN115273472A

Abstract

本发明公开了一种基于图卷积网络表示道路的通行时间预测方法，涉及智能交通管理平台技术领域，解决了有的预测方法无法结合多类依赖信息的问题，其技术方案要点是：包括S100、获取初始行程数据，对所述初始行程数据进行预处理，得到路网关系图和多次行程记录；S200、构建组合模型，从所述路网关系图和多次行程记录中提取空间维度信息、时间维度信息和外部维度信息；S300、将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚合，得到预测结果；通过组合模型针对空间、时间和外部信息不同的特征选择构建了不同的模型进行深度特征提取，克服了传统模型无法综合考虑影响因素的问题，提高了预测的准确性。

Description

一种基于图卷积网络表示道路的通行时间预测方法及系统

技术领域

本发明涉及智能交通管理平台技术领域，更具体地说，它涉及一种基于图卷积网络表示道路的通行时间预测方法及系统。

背景技术

随着越来越多的车辆进入城市地区，交通拥堵已成为许多城市的一个重大问题。解决交通拥堵的方案之一是开发智能公共交通系统。行程时间预测是智能公共交通系统中最基本的任务之一。它测量两个确定位置之间的通行时间，并为交通系统提供基线信息。准确的通行时间预测对于智能交通系统中的车辆调度、路线规划、拥堵控制等问题具有重要意义。基于模型的预测方法在过去的几十年中得到了广泛的研究，它侧重于模拟真实的交通行为来预测通行时间，而数据驱动的预测方法则基于历史数据进行预测。随着基于位置的服务和叫车应用程序的应用，产生了大量浮动汽车轨迹数据，数据驱动的方法变得越来越流行。经典时间序列分析是在通行时间预测中捕获时间信息的最广泛使用的数据驱动方法。它假设未来值取决于历史值和随机噪声。广泛使用的时间序列模型包括季节性ARIMA模型、自回归移动平均和广义自回归条件异方差模型。计机器学习算法经常被部署在这个领域。与时间序列模型相比，统计机器学习算法往往具有非线性特征和更灵活的函数拟合能力，因此在通行时间预测领域得到了广泛的应用。随着深度学习的发展，深度神经网络(DNN)被证明具有足够的深度来处理大规模的高维数据。

随着大数据技术和机器学习的发展，支持向量机和深度神经网络等新方法已成功用于预测通行时间。然而，现有的预测方法无法适应于具有多种依赖关系的通行时间预测任务，特别对于路况复杂、动态程度高的城市路网短途出行时间预测，其包含道路网络关系的空间依赖，通行时间的时间依赖以及天气等外部依赖。现有的预测方法多考虑单个依赖信息，无法结合多类依赖信息。

发明内容

本申请的目的是提供一种基于图卷积网络表示道路的通行时间预测方法及系统，在预测时，克服多维度结合的困难，充分考虑多种不同的依赖信息，该方法通过构建组合模型，实现多维度深度特征提取和城市路网中短途通行时间预测任务，解决传统预测方法的不足。

本申请的上述技术目的是通过以下技术方案得以实现的：包括

S100、获取初始行程数据，对所述初始行程数据进行预处理，得到路网关系图和多次行程记录；

S200、构建组合模型，从所述路网关系图和多次行程记录中提取空间维度信息、时间维度信息和外部维度信息；

S300、将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚合，得到预测结果。

采用上述技术方案，通过构建组合模型，同时考虑空间维度、时间维度以及外部维度的信息，预测通行时间，组合模型针对空间、时间和外部信息不同的特征选择构建了不同的模型进行深度特征提取，克服了传统模型无法综合考虑影响因素的问题，提高了预测的准确性。

进一步的，在步骤S200中，包括，构建图卷积网络从所述路网关系图和多次行程记录中提取空间维度信息，构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度信息，构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息。

进一步的，所述构建图卷积网络从所述路网关系图和多次行程记录中提取空间维度信息，包括：

S211、将所述多次行程记录作为所述图卷积网络的输入，将所述行程记录中的通过路段作为所述图卷积网络的节点，对节点的邻居节点分配采样权重，根据采样权重在路网关系图上进行采样，获取节点的采样邻居；

S212、聚合当前层节点的采样邻居的特征向量，得到当前层邻居特征向量；将当前层节点特征向量和所述当前层邻居特征向量输入全连接层，进行维度变化，然后进行归一化处理，得到下一层的节点特征向量；循环至深度K，得到第K层的节点特征向量作为空间维度信息。

进一步的，所述节点v的采样邻居，通过以下方法获得：通过转向关系赋予节点采样权重,通过所述采样权重计算各个邻居节点的采样概率，设置邻居节点采样数量，按采样概率从大至小采样邻居节点，得到节点的采样邻居。

进一步的，所述采样概率，通过以下公式计算得出：

其中，R为0-1之间的随机数，W_i为邻居节点对应的采样权重，S_i为邻居节点的采样概率。

进一步的，所述采样权重包括：直行采样权重W_straight、右转采样权重W_right、左转采样权重W_left和掉头采样权重W_turn；所述直行采样权重W_straight>右转采样权重W_right>左转采样权重W_left>掉头采样权重W_turn。

进一步的，所述构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度信息，包括以下步骤：

S221、取所述行程记录中的通过路段的静态特征为所述长短期记忆网络的输入；

S222、计算遗忘门、细胞状态更新值和更新门状态，通过所述遗忘门、细胞状态更新值和更新门状态更新细胞状态；

S223、遍历各个通过路段，将所述长短期记忆网络的输出作为时间维度信息。

进一步的，所述构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息，包括以下步骤：

S231、取所述行程记录中的通过路段的静态特征为所述宽深模型的输入，所述静态特征分为：离散变量和连续变量；

S232、在宽模型中，对离散变量进行独热编码，获得独热离散变量，计算独热离散变量的交叉特征，获得交叉变量，将所述连续变量和交叉变量合并得到宽模型变量，将所述宽模型变量通过仿射转换，获得宽模型输出；在深模型中，将各个离散变量输入对应的嵌入层，获得各个离散变量的嵌入特征，将所述嵌入特征和连续变量输入多层感知机组，获得深模型输出；

S233、将所述宽模型输出和深模型输出进行拼接，获得外部维度信息。

进一步的，还包括S400、将训练集数据输入所述组合模型，计算每次训练的损失函数，根据计算得到的损失函数，反向传播梯度更新组合模型的采样权重和偏置，采用Adam优化器优化网络参数，得到训练后的组合模型。

本申请另一方面还提供一种基于图卷积网络表示道路的通行时间预测系统，包括：

特征提取模块，用于获取初始行程数据，对所述初始行程数据进行预处理，得到路网关系图和多次行程记录；

组合模型模块，用于构建组合模型，从所述路网关系图和多次行程记录中提取空间维度信息、时间维度信息和外部维度信息；

预测输出模块，用于将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚合，得到预测结果。

与现有技术相比，本申请具有以下有益效果：

1.本申请通过构建组合模型，同时考虑空间维度、时间维度以及外部维度的信息，预测通行时间，组合模型针对空间、时间和外部信息不同的特征选择构建了不同的模型进行深度特征提取，克服了传统模型无法综合考虑影响因素的问题，提高了预测的准确性。

2.本申请在时间维度上，采用长短期记忆网络对片段的局部信息和序列的长期依赖关系进行提取；在空间维度上，采用图卷积网络对路网关系进行建模，通过设置采样权重进行邻居采样，克服了传统图卷积网络需要在整个图上学习的缺点，使得在大规模道路网络上的应用成为可能；在外部维度上，采用宽深模型深度提取，融合离散/连续特征，采用两层结构能够增加模型提取复杂特征的学习和泛化能力。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定。在附图中：

图1为本发明一实施例提供的预测方法流程示意图；

图2为本发明一实施例提供的组合模型的结构示意图；

图3为本发明一实施例提供的图卷积网络的结构示意图；

图4为本发明一实施例提供的长短期记忆网络的结构示意图；

图5为本发明一实施例提供的宽深模型的结构示意图。

具体实施方式

在下文中，可在本发明的各种实施例中使用的术语“包括”或“可包括”指示所发明的功能、操作或元件的存在，并且不限制一个或更多个功能、操作或元件的增加。此外，如在本发明的各种实施例中所使用，术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合，并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。

在本发明的各种实施例中使用的术语仅用于描述特定实施例的目的并且并非意在限制本发明的各种实施例。除非另有限定，否则在这里使用的所有术语(包括技术术语和科学术语) 具有与本发明的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义，除非在本发明的各种实施例中被清楚地限定。

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施例和附图，对本发明作进一步的详细说明，本发明的示意性实施方式及其说明仅用于解释本发明，并不作为对本发明的限定。

实施例1：一种基于图卷积网络表示道路的通行时间预测方法，

如图1所示，通行时间预测方法，包括：

在步骤S100中，获取初始行程数据，具体地，获取某平台开放的“行程到达时间预估数据集”为初始行程数据，初始行程数据中包含若干网约车的行程记录D，每一次行程记录 d(d∈D)，包含该次行程记录的出发时间s，行程到达时间a，通过路段p，时间信息t,以及行程发生时的外部信息o；其中，时间信息t包括：行程发生时的日期、时间和星期信息，外部信息o包括：司机id、乘客id、天气、温度、交通拥挤度。

所有行程发生在路网G＝(L,A)上；其中L＝{l₁,…,l_N}表示所有路段的集合,A＝

代表任意两个路段的连接关系，即：L包含所有行程记录d中的通过路段p。本实施例的研究目标为：基于行程记录{s,p,t,o}和路网关系G,预测行程d的通行时间，即a-s,即：构造基于{s,p,t,o,G}的回归模型，预测通行时间并最小化预测值与a-s的误差。

在步骤S100中，对初始行程数据进行预处理，得到路网关系图和多次行程记录，具体的，

获取所有路段的集合以及任意两个路段的连接关系，构造路网关系图G＝(L,A)；假设初始行程数据中包含M次行程记录，规范化初始行程数据，得到行程记录

其中，通过路段

l_oj表示行程 o中车辆通过的第j个路段的路段特征。

路段特征包含：静态特征st和动态特征dy，即：l_oj＝{st,dy}；静态特征st＝{路段标号，路段距离，平均速度，路段交通状态，路段行驶百分比},(注：在行程结束路段，行驶百分比小于1)；动态特征为人工构建，将一天分为288时间节点，相邻时间点相隔5分钟，计算所有节点在每一时间节点的平均通行时间

其中，

表示第n条记录中路段l_i在时间点x的行程时间，m是在时间点x通过路段l_i的记录总数。基于行程记录的出发时间s_o确定时间点x并构造路段l_oj，(l_oj∈p_o)的动态特征

其中，

表示路段l_oj在s_o五分钟、十分钟、十五分钟前的平均通行时间，

表示路段l_oj在s_o一小时、两小时前的平均通行时间，

表示路段l_oj在s_o一天、两天前此时平均通行时间，

表示路段l_oj在s_o一周前此时的平均通行时间。

在步骤S200中，构建组合模型，从路网关系图G＝(L,A)和多次行程记录

中提取空间维度信息、时间维度信息和外部维度信息；具体地，包括：

S210、构建图卷积网络从路网关系图和多次行程记录中提取空间维度信息；

S220、构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度信息；

S230、构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息。

在S210中，包括，S211、将多次行程记录

作为图卷积网络的输入，将行程记录中的通过路段

作为图卷积网络的节点，对节点分配采样权重W，根据采样权重W在路网关系图G＝(L,A)上进行采样，获取节点的采样邻居。

发明人发现，路段之间不同的转向关系和路口红绿灯的类型对其互相连通的紧密程度有直接影响，因此可以分析转向关系和路口红绿灯的类型，设置采样权重W。例如，通常情况下，直行权重W_straight>右转权重W_right>左转权重W_left>掉头权重W_turn。

具体的，在本实施例中，我们仅根据转向关系设置权重，直行权重W_straight＝3，右转权重W_right＝2，左转权重W_left＝1，掉头权重W_turn＝0.5，无连接关系权重W＝0。

将行程记录d＝{(p_o,s_o,t_o,o_o,a_o)}∈D输入图卷积网络，将行程记录中的通过路段

作为图卷积网络的节点，人工设置邻居聚合深度K和采样数量；首先遍历通过路段l_oj∈p_o，在路网关系图G上，生成路段l_oj在聚合深度k(k∈K)，的邻居节点集合

并根据转向关系生成每个节点对应的采样权重

计算邻居节点的采样概率S＝[S_i,…S_n]，其中

为节点i的采样概率，R是遍历样本时产生的0-1之间的随机数，W_i是节点i的采样权重，基于采样概率S对

采样得到采样邻居的集合N(l_oj)^k。通过对邻居节点进行采样获得采样邻居，模型不必在完整的路网关系图G上学习训练，能够提升训练速度，节省计算资源。

在S210中，包括，S212、聚合当前层节点的采样邻居的特征向量，得到当前层邻居特征向量；将当前层节点特征向量和所述当前层邻居特征向量输入全连接层，进行维度变化，然后进行归一化处理，得到下一层的节点特征向量；循环至深度K，得到第K层的节点特征向量作为空间维度信息。

具体地，循环深度k∈K,生成l_oj∈p_o在深度k的聚合向量，邻居节点在深度k的特征向量为

当k＝1时，

此处使用平均聚合算法，

表示路段l_oj的邻居聚合向量，MEAN表示元素平均运算，其中 W为权重，U表示向量拼接操作，σ(·)为Sigmod激活函数。

当k＞1时，首先拼接当前节点的向量和邻居节点向量得到当前层表示

将

通过具有激活函数σ的全连接层转换：

对

作归一化处理：

其中

表示向量

的模，

表示路段u在深度k的向量表示。循环聚合运算

可得下一深度的向量表示。

循环至深度K，输出节点l_oj∈p_o在K处的聚合向量

作为空间维度信息输出。

在S220中，包括以下步骤：

S221、取所述行程记录中的通过路段的静态特征st为所述长短期记忆网络的输入；

S222、计算遗忘门f_t、细胞状态更新值g_t和更新门状态i_t，通过所述遗忘门f_t、细胞状态更新值g_t和更新门状态i_t更新细胞状态c_t；

S223、遍历各个通过路段l_oj，将所述长短期记忆网络的输出h_t作为时间维度信息。

具体地，根据数据集分析，人工设置最大路段数量为200，对小于最大数量的行程数据在末尾补0，对于超过最大数量的序列数据进行末尾截取。

第一步，遍历路径序列l_oj∈p_o中的每一个路段l_oj，记当前遍历次序为t，当前路段表示为x_t←l_oj，依次计算

f_t＝σ(W_f[x_t；h_t-1]+b_f),

g_t＝tanh(W_g[x_t；h_t-1]+b_g

i_t＝σ(W_i[x_t；h_t-1]+b_i)

o_t＝σ(W_o[x_t；h_t-1]+b_o)

c_t＝f_t⊙c_t-1+i_t⊙g_t

h_t＝o_t⊙tan h(c_t)

其中，W为权重向量，b为偏差，[·,·]代表向量拼接操作，σ为sigmod激活函数，tanh为 tanh激活函数，⊙表示逐元素乘法。

第二步，完成计算后，更新c_t和h_t，输入新路段l_oj∈p_o，x_t←l_oj，循环计算。

第三步，遍历结束p_o后，选择最后一个路段l_oj的h_t作为时间维度信息输出。

在步骤S230中，包括以下步骤：

S231、取所述行程记录中的通过路段静态特征st为所述长短期记忆网络的输入，所述静态特征st分为：离散变量和连续变量；

具体地，在宽模型中，输入变量x＝[连续变量，离散变量]，其中，连续变量＝{距离，历史平均速度，通过百分比，温度}，离散变量＝{路段标号，路口标号，日期，时间点，晴雨，司机标号},上述的连续变量和离散变量均取自通过路段的静态特征st。

第一步，对离散变量做独热编码，然后对离散变量两两交叉计算得到交叉特征

其中f_x和f_y表示两个one-hot编码的独热离散变量，M是人为区分这两个特征的参数，交叉特征代表任两特征的交叉关系。

第二步，将

与x合并得到

对x_wide做仿射变换降低维度得到O_wide←ReLu(W×x_wide+b)作为宽模型的输出。

在深模型中，输入变量x＝[连续变量，离散变量]，其中，连续变量＝{距离，历史平均速度，通过百分比，温度}，离散变量＝{路段标号，路口标号，日期，时间点，晴雨，司机标号}，上述的连续变量和离散变量均取自通过路段的静态特征st。

第一步，将各个离散变量输入各个嵌入层，得到各离散变量的嵌入表示x_embed。

第二步，拼接嵌入表示与连续变量，得到深模型变量x_deep＝[连续变量,x_embed]。

第三步，深模型变量x_deep输入双层256维的MLP非线性转换得到深模型输出，

最后，拼接O_deep与O_wide输出Output＝[O_deep,O_wide]，得到外部维度信息。

通行时间预测方法，还包括S400、将训练集数据输入所述组合模型，计算每次训练的损失函数，根据计算得到的损失函数，反向传播更新组合模型的采样权重和偏置，采用Adam优化器优化网络参数，得到训练后的组合模型。

具体地，将图卷积网络、长短期记忆网络和宽深模型的输出连接起来并输入到1层回归器以产生预测。然后共同训练宽深模型、图卷积网络和长短期记忆网络，以充分利用这三种模型。使用平均误差百分比作为训练损失函数

其中y_i和

是第i条行程记录中的真实出行时间和预测值，n是记录总数。模型中的所有参数在MAPE损失下使用反向传播(BP)和链式求导法则联合训练。由于三个模块的组合，难以选择合适的全局学习率，我们选择一种具有自适应步长和动量的随机梯度下降方法(Adam)来优化模型。划分数据为训练集，交叉验证集与测试集，通过随机交叉验证优化模型超参数，最终在测试集上评估模型效果。然后我们使用一组最新生成的数据进一步微调模型，以确保模型适应最新的数据分布。

本实施例另一方面还提供一种基于图卷积网络表示道路的通行时间预测系统，包括：

和预测输出模块，用于将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚合，得到预测结果。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于图卷积网络表示道路的通行时间预测方法，其特征是：包括

S300、将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚合，得到预测结果；

在步骤S200中，包括，构建图卷积网络从所述路网关系图和多次行程记录中提取空间维度信息，构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度信息，构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息；

所述构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息，包括以下步骤：

S233、将所述宽模型输出和深模型输出进行拼接，获得外部维度信息；

所述连续变量包括：距离、历史平均速度、通过百分比和温度，所述离散变量包括：路段标号、路口标号、日期、时间点、晴雨和司机标号。

2.根据权利要求1所述的一种基于图卷积网络表示道路的通行时间预测方法，其特征是：所述构建图卷积网络从所述路网关系图和多次行程记录中提取空间维度信息，包括：

3.根据权利要求2所述的一种基于图卷积网络表示道路的通行时间预测方法，其特征是：所述节点v的采样邻居，通过以下方法获得：通过转向关系赋予节点采样权重,通过所述采样权重计算各个邻居节点的采样概率，设置邻居节点采样数量，按采样概率从大至小采样邻居节点，得到节点的采样邻居。

4.根据权利要求3所述的一种基于图卷积网络表示道路的通行时间预测方法，其特征是：所述采样概率，通过以下公式计算得出：

5.根据权利要求4所述的一种基于图卷积网络表示道路的通行时间预测方法，其特征是：所述采样权重包括：直行采样权重W_straight、右转采样权重W_right、左转采样权重W_left和掉头采样权重W_turn；所述直行采样权重W_straight>右转采样权重W_right>左转采样权重W_left>掉头采样权重W_turn。

6.根据权利要求1所述的一种基于图卷积网络表示道路的通行时间预测方法，其特征是：所述构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度信息，包括以下步骤：

7.根据权利要求1-6任一所述的一种基于图卷积网络表示道路的通行时间预测方法，其特征是：还包括S400、将训练集数据输入所述组合模型，计算每次训练的损失函数，根据计算得到的损失函数，反向传播更新组合模型的采样权重和偏置，采用Adam优化器优化网络参数，得到训练后的组合模型。

8.一种基于图卷积网络表示道路的通行时间预测系统，其特征在于，用于实现如权利要求1所述的一种基于图卷积网络表示道路的通行时间预测方法，包括：

和预测输出模块，用于将所述空间维度信息、时间维度信息和外部维度信息通过回归器聚合，得到预测结果；

所述组合模型模块还用于，构建图卷积网络从所述路网关系图和多次行程记录中提取空间维度信息，构建长短期记忆网络从所述路网关系图和多次行程记录中提取时间维度信息，构建宽深模型从所述路网关系图和多次行程记录中提取外部维度信息；