CN115828121A

CN115828121A - 基于邻接dbscan融合时变多图卷积网络的交通流预测方法

Info

Publication number: CN115828121A
Application number: CN202211454634.5A
Authority: CN
Inventors: 施佺; 包银鑫; 曹阳; 沈琴琴; 余弦; 张腾云; 曹晨洋
Original assignee: Nantong University
Current assignee: Nantong University
Priority date: 2022-11-21
Filing date: 2022-11-21
Publication date: 2023-03-21

Abstract

本发明公开一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法，包括以下步骤：采集车流量数据，对原始数据进行预处理；构建邻接DBSCAN聚类算法对传感器节点进行密度聚类，划分为多个节点簇；对每个节点簇的传感器生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵，并划分训练集和测试集；构建时变多图卷积网络，该网络由多图空间特征提取模块和时变特征提取模型组成；利用训练集训练时变多图卷积网络，并用测试集测试模型的预测精度。本发明通过构建邻接DBSCAN聚类算法对交通传感器节点进行预筛选有效获取关联性高的节点簇，并通过构建的时变多图卷积网络有效提取交通流的动态多周期时空特征，提高了高关联性传感器节点之间的交通流预测精度。

Description

基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法

技术领域

本发明属于智能交通和人工智能领域，具体为一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法。

背景技术

随着无人驾驶技术的快速发展，与之配套的数据采集技术蓬勃发展，比如车辆定位数据、街景数据、道路传感器数据等交通数据集呈现爆发式增长，此类数据有效丰富了智能交通系统的数据基础。智能交通系统通过科学的交通调度和管理，可以有效提高路网中车流的效率。交通流预测作为智能交通系统的重要组成，根据历史观察准确及时的交通流预测有助于道路使用者制定更好的出行计划，缓解交通拥堵，提高交通运营效率。因此，如何提高交通流预测模型的精度至关重要。

目前，基于深度学习的图卷积网络被广泛用于一般路网交通流预测。目前现有的基于图卷积网络的交通流预测方法大多忽视节点之间的聚集特征，很少有将节点聚类为多个高关联的节点簇，分别进行预测来提高预测精度。DBSCAN是常见的基于密度的节点聚类算法，但此方法大多处理离散的节点聚类。在交通流中，节点除了离散分布在地图上，节点之间还存在道路连接，直接使用DBSCAN进行聚类，容易导致节点簇中存在与其他节点无连接的节点的情况。交通流不仅受到邻域和历史交通流的影响，还受到外界特征的影响，传统方法缺乏有效的内部特征和外部特征编码，导致预测模型很难有效的捕获交通流的动态时空特征。

发明内容

发明目的：针对上述问题，本发明引入一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法。该方法针对传统聚类算法忽视了节点之间的连接性，在利用DBSCAN进行一次聚类的基础上，通过在一次聚类的节点簇中构建邻接矩阵筛选无连接的节点；针对传统图卷积方法无法有效编码交通流内部特征和外部空间特征，提出邻接图特征提取模块、关联图特征提取模块和出行意愿图特征提取模块，三种模块的贡献由自注意力模块进行融合提取，输出得到多图空间特征。针对传统图卷积网络忽视长期时变特征的影响，提出时变特征提取模块，该模块主要由分周期特征提取模块、时周期特征提取模块和日周日提取模块组成。三个模块的输出由自注意力模块进行特征融合。本发明通过对交通节点进行二次聚类，并有效结合交通流多图特征和时变特征，实现交通流预测精度的提高。

技术方案：一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法

步骤1)采集城市道路或城际道路上交通传感器记录的车流量数据并传输至交通大数据集群，对原始数据进行预处理，剔除异常值和修复缺失值；

步骤2)构建邻接DBSCAN聚类算法对传感器节点进行密度聚类，划分为多个节点簇；

步骤3)对每个节点簇的传感器生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵，并划分训练集和测试集；

步骤4)构建时变多图卷积网络，该网络由多图空间特征提取模块和时变特征提取模型组成；

步骤5)利用训练集训练时变多图卷积网络，并用测试集测试模型的预测精度。

进一步，所述步骤1)中，采集城市道路或城际道路上的交通传感器S_i的数据，传感器关键状态数据有经度D_lon(i)、纬度D_lat(i)和记录时间D_tim(i)，传感器关键交通数据有交通流量D_veh(i)、交通速度D_speed(i)、交通密度D_den(i)、环境状况D_wea(i)，i是传感器的编号；将上述传感器数据统一传送至基于Hadoop的交通大数据集群，得到原始数据集D_i；对原始数据进行异常值剔除和缺失值填充；其中，异常值采用3σ原则结合异常值数据前后一周的平均值进行判断和剔除；如果缺失值的时间跨度超过一天，则采用相邻传感器节点对应天数据的正常数据进行填充；如果缺失值的时间跨度小于一天，则采用前后一天数据的平均值进行填充；数据预处理完成后，对预处理后的数据进行标准化，采用D*＝(D_i-Mean(D))/Std(D)实现，其中Mean(D)和Std(D)分别是数据集的平均值和标准差，D*是标准化后的数据集。

进一步，所述步骤2)中，构建邻接DBSCAN聚类算法对传感器节点进行密度聚类，具体步骤如下：

步骤2-1：构建DBSCAN聚类算法对交通节点进行一阶段聚类，具体步骤如下：

步骤2-1-1：输入传感器经纬度数据D_lon(i)和D_lat(i)，i∈N，N是传感器的数量；首先扫描所有传感器的经纬度数据，利用欧氏距离计算第i个传感器和第j个传感器之间的距离Dist(i，j)；

步骤2-1-2：如果某个传感器半径范围R内的传感器数量大于等于设定的最小数量，则将其纳入核心点列表，并将其密度直达的传感器形成对应的临时聚类簇；

步骤2-1-3：对于每一个临时聚类簇，检查其中的传感器是否为核心点，如果是核心点，则将该传感器对应的临时聚类簇和当前的临时聚类簇进行合并，得到新的临时聚类簇；

步骤2-1-4：重复步骤2-1-2和2-1-3的操作，直到当前临时聚类簇中的每一个点要么不在核心点列表，要么密度直达的传感器都已经在当前临时聚类簇中，将此时的临时聚类簇升级为聚类簇；

步骤2-1-5：继续对剩余的临时聚类簇进行步骤2-1-4的合并操作，直到全部的临时聚类簇被处理；

步骤2-1-6：经过DBSCAN的聚类操作，将传感器节点V＝{v₁，v₂，...，v_i，...，v_N}，划分为K个节点簇，V_k代表第k个节点簇所包含的节点集合；

步骤2-2：构建邻接矩阵来对每个节点簇进行二次聚类。具体步骤如下：

步骤2-2-1：对每个节点簇V_k构建对应的邻接矩阵A_k，遍历计算

N_k是第k个节点簇的节点数量，查找出

的节点v_s；

步骤2-2-2：将节点v_s与其他节点簇的节点进行邻接矩阵构建，若满足节点v_s与节点簇V_j构建的邻接矩阵

且节点v_s与节点簇V_j边界点的距离最小，则将节点v_s划分到节点簇V_j中；

步骤2-2-3：重复步骤2-2-1和步骤2-2-2操作，直到所有节点簇中的节点都存在连接关系；

步骤2-3：二次聚类完成后，得到新的节点簇

k∈PN，PN是节点簇的数量，每个新节点簇中含有的节点数为

进一步，所述步骤3)中，根据节点簇中传感器的经纬度和所记录的交通数据生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵，具体步骤如下：

步骤3-1：构造时变特征矩阵；使用图

来表示传感器和交通特征之间的关系，

H_k＝{h_n，1，h_n，2，h_n，3，...，h_n，t，...，h_n，T}，t∈T，代表第k个节点簇在T时刻内记录的交通特征；h_n，t代表第n个传感器在t时刻的交通流数据，时间间隔为传感器记录间隔，得到特征矩阵G_k如下所示：

其中，特征矩阵G_k的行为每个节点所记录的交通特征，即T时刻内的流量、速度和密度，行数代表第k个节点簇中的节点数；将特征矩阵G_k按照5分钟、1小时和24小时的时间间隔拆分为分周期特征H_min(k)、时周期特征H_hour(k)和日周期特征H_day(k)，按照固定比例将周期特征划分为训练集和测试集；

步骤3-2：构造邻接矩阵；节点簇中的邻接矩阵被定义为

代表节点之间是否存在直接连接；

步骤3-3：构造关联矩阵；节点簇内部节点之间不仅存在物理上的连接，还存在数据关联，利用皮尔逊相关系数方法来计算不同节点之间的相关性并构成关联矩阵

将皮尔逊相关系数方法定义为：

其中，h_i，t(k)和h_j，t(k)分别是第k个节点簇中传感器i和j在t时刻的特征，Std(h_i(k))和Std(h_j(k))是所选节点的标准差，Mean(h_i(k))和Mean(h_j(k))是所选节点的均值；遍历计算，得到所有节点簇的关联矩阵

步骤3-4：构造出行意愿特征矩阵

代表节点i到节点j的出行意愿，出行意愿大则

反之则为0，默认i到j的出行意愿等价为j到i的出行意愿；通过计算得到出行意愿特征矩阵

进一步，所述步骤4)中，构造时变多图卷积网络，该网络由多图空间特征提取模块和时变特征提取模型组成，具体步骤如下：

步骤4-1：构造多图空间特征提取模块，由邻接图特征提取模块、关联图特征提取模块和出行意愿图特征提取模块组成，三种模块的贡献由自注意力模块进行融合提取，输出得到多图空间特征；多图空间特征提取模块作用在于提取多时段交通特征的动态空间特征，具体步骤如下：

步骤4-1-1：确定多图空间特征提取模块的输入，在步骤3)中将节点簇的输入分为分周期特征H_min∈[N，L]、时周期特征H_hou∈[N，L]和日周期特征H_day∈[N，L]，空间特征的提取需要对三种周期特征进行通道叠加和融合，叠加融合操作为H_F＝f_conv(H_min||H_hour||H_day)∈[N，1，L]，其中||代表串联操作，用于通道叠加；f_conv为2D卷积操作，用于通道融合；H_F为融合特征输入，N代表节点数，L代表输入序列长度；

步骤4-1-2：构造邻接图特征提取模块；根据步骤3-2计算得到的邻接矩阵

采用图卷积网络进行特征提取，操作为：

其中

为第l+1层的邻接图特征输出，

为邻接图特征提取模块中的权重，f_A为激活函数；将邻接图特征提取模块的最终输出定义为H_adj；

步骤4-1-3：构造关联图特征提取模块；根据步骤3-3计算得到的关联矩阵

采用图卷积网络进行特征提取，操作为：

其中

为第l+1层的关联图特征输出，

为关联图特征提取模块中的权重；将关联图特征提取模块的最终输出定义为H_cor；

步骤4-1-4：构造出行意愿图特征提取模块；根据步骤3-4计算得到的出行意愿特征矩阵

采用图卷积网络进行特征提取，操作为：

其中

为第l+1层的出行意愿图特征输出，

为邻接图特征提取模块中的权重；将出行意愿图特征提取模块的最终输出定义为H_int；

步骤4-1-5：构建自注意力模块对步骤4-1-2到步骤4-1-3的特征进行融合输出，将操作定义为H_S＝f_A(f_Att(H_adj)+f_Att(H_cor)+f_Att(H_int))，其中f_Att为自注意模块的前向计算，定义为：

Tr是转置操作；最终得到多图空间特征提取模块的输出为H_S；

步骤4-2：构造时变特征提取模块，用于提取多周期时间特征；时变特征提取模块主要由分周期特征提取模块、时周期特征提取模块和日周日提取模块组成；三个模块的输出由自注意力模块进行特征融合，最终得到交通流的预测输出；具体步骤如下：

步骤4-2-1：确定时变特征提取模块的输入；确定分周期特征提取模块的输入为H_MI＝f_conv(H_min||H_S)∈[N，1，L]；确定时周期特征提取模块的输入为H_HI＝f_conv(H_hou||H_S)∈[N，1，L]；确定日周期特征提取模块的输入为H_DI＝f_conv(H_day||H_S)∈[N，1，L]；

步骤4-2-2：构造分周期特征提取模块；建立门控扩张因果卷积模块来避免1维CNN梯度消失的情况；首先通过扩张因果卷积，将输入H_MI∈[N，L]映射为H_MI1||H_MI2∈[N，2c_out]，操作定义为H_MI1||H_MI2＝f(W_DilaH_MI+b_Dila)，将通道拆分为H_MI1∈[N，c_out]和H_MI2∈[N，c_out]，W_Dila和b_Dila是扩展因果卷积的权重和偏置项，c_out是预测输出的序列长度；经过GLU门控单元，Y_M＝H_MI1⊙σ(H_MI2)∈[N，c_out]，得到分周期特征Y_M；

步骤4-2-3：构造时周期特征提取模块；同步骤4-2-2，通过扩张因果卷积，将输入H_HI∈[N，L]映射为H_HI1||H_HI2∈[N，2c_out]，操作定义为H_HI1||H_HI2＝f(W_DilaH_HI+b_Dila)，将通道拆分为H_HI1∈[N，c_out]和H_HI2∈[N，c_out]；经过GLU门控单元，Y_H＝H_HI1⊙σ(H_HI2)∈[N，c_out]，得到时周期特征Y_H；

步骤4-2-4：构造日周期特征提取模块；同步骤4-2-2，通过扩张因果卷积，将输入H_DI∈[N，L]映射为H_DI1||H_DI2∈[N，2c_out]，操作定义为H_DI1||H_DI2＝f(W_DilaH_DI+b_Dila)，将通道拆分为H_DI1∈[N，c_out]和H_DI2∈[N，c_out]；经过GLU门控单元，Y_D＝H_DI1⊙σ(H_DI2)∈[N，c_out]，得到日周期特征Y_D；

步骤4-2-5：构建自注意力模块对步骤4-2-2到4-2-4的周期特征进行融合，将操作定义为Y_T＝f_A(f_Att(Y_M)+f_Att(Y_H)+f_Att(Y_D))；最终得到预测的交通特征为Y_T∈[N，c_out]。

进一步，所述步骤5)中，用训练集训练时变多图卷积网络，并用测试集测试模型的预测精度，具体步骤如下：

步骤5-1：构建时变多图卷积网络的基本架构，初始化网络权重，确定网络的输入和输出维度，确定超参数如激活函数、初始训练步长、批处理大小和最大迭代次数等；

步骤5-2：利用训练集训练时变多图卷积网络，确定均方根误差为损失函数，优化器为Adam，在训练过程中实时迭代网络的参数；

步骤5-3：训练完成后，使用测试集测试模型的预测精度，展示模型的预测结果。

有益效果：本发明的交通流预测方法，该方法针对现有的基于图卷积网络的交通流预测方法大多忽视节点之间的聚集特征，很少有将节点聚类为多个高关联的节点簇；同时传统方法注重交通流邻域和历史交通流的影响忽视外界特征的影响，，导致预测模型很难有效的捕获交通流的动态时空特征。本发明通过构建邻接DBSCAN融合时变多图卷积网络实现不同节点簇下交通流动态时空特征的提取，提高模型的预测精度。

本发明引入一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法。该方法针对传统聚类算法忽视了节点之间的连接性，在利用DBSCAN进行一次聚类的基础上，通过在一次聚类的节点簇中构建邻接矩阵筛选无连接的节点；针对传统图卷积方法无法有效编码交通流内部特征和外部空间特征，提出邻接图特征提取模块、关联图特征提取模块和出行意愿图特征提取模块，三种模块的贡献由自注意力模块进行融合提取，输出得到多图空间特征。针对传统图卷积网络忽视长期时变特征的影响，提出时变特征提取模块，该模块主要由分周期特征提取模块、时周期特征提取模块和日周日提取模块组成。三个模块的输出由自注意力模块进行特征融合。本发明通过对交通节点进行二次聚类，并有效结合交通流多图特征和时变特征，实现交通流预测精度的提高。

附图说明

图1为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法步骤示意图；

图2为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法流程图；

图3为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法邻接DBSCAN聚类示意图，(a)为DBSCAN一次聚类，(b)为DBSCAN二次聚类；

图4为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法模型结构图；

图5为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法模型训练迭代图；

图6为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法测试集真实数据和预测数据对比图。

具体实施方式

下面将结合说明书附图对本发明的技术方法做进一步的详细说明。

如图1-2所示，一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法，包括如下步骤：

所述步骤1)中，采集城市道路或城际道路上的交通传感器S_i的数据，传感器关键状态数据有经度D_lon(i)、纬度D_lat(i)和记录时间D_tim(i)，传感器关键交通数据有交通流量D_veh(i)、交通速度D_speed(i)、交通密度D_den(i)、环境状况D_wea(i)，i是传感器的编号；将上述传感器数据统一传送至基于Hadoop的交通大数据集群，得到原始数据集D_i；对原始数据进行异常值剔除和缺失值填充；其中，异常值采用3σ原则结合异常值数据前后一周的平均值进行判断和剔除；如果缺失值的时间跨度超过一天，则采用相邻传感器节点对应天数据的正常数据进行填充；如果缺失值的时间跨度小于一天，则采用前后一天数据的平均值进行填充；数据预处理完成后，对预处理后的数据进行标准化，采用D*＝(D_i-Mean(D))/Std(D)实现，其中Mean(D)和Std(D)分别是数据集的平均值和标准差，D*是标准化后的数据集。使用PEMS03加州交通高速交通数据作为交通节点数据，采集的时间间隔为5分钟。

所述步骤2)中，构建邻接DBSCAN聚类算法对传感器节点进行密度聚类，如图3所示，具体步骤如下：

步骤2-2：构建邻接矩阵来对每个节点簇进行二次聚类，具体步骤如下：

N_k是第k个节点簇的节点数量，查找出

的节点v_s；

步骤2-3：二次聚类完成后，得到新的节点簇

k∈PN，PN是节点簇的数量，每个新节点簇中含有的节点数为

所述步骤3)中，根据节点簇中传感器的经纬度和所记录的交通数据生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵，具体步骤如下：

步骤3-1：构造时变特征矩阵；使用图

来表示传感器和交通特征之间的关系，

步骤3-2：构造邻接矩阵；节点簇中的邻接矩阵被定义为

代表节点之间是否存在直接连接；

将皮尔逊相关系数方法定义为：

步骤3-4：构造出行意愿特征矩阵

代表节点i到节点j的出行意愿，出行意愿大则

步骤4)构建时变多图卷积网络，结构如图4所示，该网络由多图空间特征提取模块(a)和时变特征提取模型(b)组成；

所述步骤4)中，构造时变多图卷积网络，该网络由多图空间特征提取模块和时变特征提取模型组成，具体步骤如下：

步骤4-1-1：确定多图空间特征提取模块的输入，在步骤3)中将节点簇的输入分为分周期特征H_min∈[N，L]、时周期特征H_hour∈[N，L]和日周期特征H_day∈[N，L]，空间特征的提取需要对三种周期特征进行通道叠加和融合，叠加融合操作为H_F＝f_conv(H_min||H_hour||H_day)∈[N，1，L]，其中||代表串联操作，用于通道叠加；f_conv为2D卷积操作，用于通道融合；H_F为融合特征输入，N代表节点数，L代表输入序列长度；

采用图卷积网络进行特征提取，操作为：

其中

为第l+1层的邻接图特征输出，

采用图卷积网络进行特征提取，操作为：

其中

为第l+1层的关联图特征输出，

采用图卷积网络进行特征提取，操作为：

其中

为第l+1层的出行意愿图特征输出，

步骤4-1-5：构建自注意力模块对步骤4-1-2到步骤4-1-3的特征进行融合输出，将操作定义为H_S＝f_A(f_Att(H_adj)+f_Att(H_cor)+f_Att(H_int))，其中f_Att为自注意模块的前向计算，定义为：f_Att(H)＝(H)^Tr·Atten(H)，

步骤4-2-1：确定时变特征提取模块的输入；确定分周期特征提取模块的输入为H_MI＝f_conv(H_min||H_S)∈[N，1，L]；确定时周期特征提取模块的输入为H_HI＝f_conv(H_hour||H_S)∈[N，1，L]；确定日周期特征提取模块的输入为H_DI＝f_conv(H_day||H_S)∈[N，1，L]；

步骤4-2-2：构造分周期特征提取模块；建立门控扩张因果卷积模块来避免1维CNN梯度消失的情况；首先通过扩张因果卷积，将输入H_MI∈[N，L]映射为H_MI1||H_MI2∈[N，2c_out]，操作定义为H_MI1||H_MI＝f(W_DilaH_MI+b_Dila)，将通道拆分为H_MI∈[N，c_out]和H_MI2∈[N，c_out]，W_Dila和b_Dila是扩展因果卷积的权重和偏置项，c_out是预测输出的序列长度；经过GLU门控单元，Y_M＝H_MI1⊙σ(H_MI)∈[N，c_out]，得到分周期特征Y_M；

步骤4-2-3：构造时周期特征提取模块；同步骤4-2-2，通过扩张因果卷积，将输入H_HI∈[N，L]映射为H_HI||H_HI∈[N，2c_out]，操作定义为H_HI1||H_HI＝f(W_DilaH_HI+b_Dila)，将通道拆分为H_HI1∈[N，c_out]和H_HI∈[N，c_out]；经过GLU门控单元，Y_H＝H_HI⊙σ(H_HI)∈[N，c_out]，得到时周期特征Y_H；

步骤4-2-4：构造日周期特征提取模块；同步骤4-2-2，通过扩张因果卷积，将输入H_DI∈[N，L]映射为H_DI1||H_DI2∈[N，2c_out]，操作定义为H_DI1||H_DI2＝f(W_DilaH_DI+b_Dila)，将通道拆分为H_DI∈[N，c_out]和H_DI∈[N，c_out]；经过GLU门控单元，Y_D＝H_DI1⊙σ(H_DI2)∈[N，c_out]，得到日周期特征Y_D；

所述步骤5)中，用训练集训练时变多图卷积网络，并用测试集测试模型的预测精度，具体步骤如下：

步骤5-2：利用训练集训练时变多图卷积网络，确定均方根误差为损失函数，优化器为Adam，在训练过程中实时迭代网络的参数，迭代如图5所示；

步骤5-3：训练完成后，使用测试集测试模型的预测精度，展示模型的预测结果，预测结果对比如图6所示。

本发明针对传统聚类算法忽视了节点之间的连接性，在利用DBSCAN进行一次聚类的基础上，通过在一次聚类的节点簇中构建邻接矩阵筛选无连接的节点；针对传统图卷积方法无法有效编码交通流内部特征和外部空间特征，提出邻接图特征提取模块、关联图特征提取模块和出行意愿图特征提取模块，三种模块的贡献由自注意力模块进行融合提取，输出得到多图空间特征。针对传统图卷积网络忽视长期时变特征的影响，提出时变特征提取模块，该模块主要由分周期特征提取模块、时周期特征提取模块和日周日提取模块组成。三个模块的输出由自注意力模块进行特征融合。本发明通过对交通节点进行二次聚类，并有效结合交通流多图特征和时变特征，实现交通流预测精度的提高。

以上所述仅为本发明在城市道路或城际道路数据集下较好的实施方式，本发明保护范围并不以上述实施方式为限制，但凡本领域普通技术人员根据本发明所揭示内容所作的等效修改和其他修饰变化，皆应纳入权利要求书记载的保护范围。

Claims

1.一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法，其特征在于：所述步骤1)中，采集城市道路或城际道路上的交通传感器S_i的数据，传感器关键状态数据有经度D_lon(i)、纬度D_lat(i)和记录时间D_tim(i)，传感器关键交通数据有交通流量D_veh(i)、交通速度D_speed(i)、交通密度D_den(i)、环境状况D_wea(i)，i是传感器的编号；将上述传感器数据统一传送至基于Hadoop的交通大数据集群，得到原始数据集D_i；对原始数据进行异常值剔除和缺失值填充；其中，异常值采用3σ原则结合异常值数据前后一周的平均值进行判断和剔除；如果缺失值的时间跨度超过一天，则采用相邻传感器节点对应天数据的正常数据进行填充；如果缺失值的时间跨度小于一天，则采用前后一天数据的平均值进行填充；数据预处理完成后，对预处理后的数据进行标准化，采用D*＝(D_i-Mean(D))/Std(D)实现，其中Mean(D)和Std(D)分别是数据集的平均值和标准差，D*是标准化后的数据集。

3.根据权利要求1所述的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法，其特征在于：所述步骤2)中，构建邻接DBSCAN聚类算法对传感器节点进行密度聚类，具体步骤如下：

步骤2-1-1：输入传感器经纬度数据D_lon(i)和D_lat(i)，i∈N，N是传感器的数量；首先扫描所有传感器的经纬度数据，利用欧氏距离计算第i个传感器和第j个传感器之间的距离Dist(i,j)；

步骤2-1-6：经过DBSCAN的聚类操作，将传感器节点V＝{v₁,v₂,…,v_i,…,v_N}，划分为K个节点簇，V_k代表第k个节点簇所包含的节点集合；

N_k是第k个节点簇的节点数量，查找出

的节点v_s；

步骤2-3：二次聚类完成后，得到新的节点簇

PN是节点簇的数量，每个新节点簇中含有的节点数为

4.根据权利要求1所述的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法，其特征在于：所述步骤3)中，根据节点簇中传感器的经纬度和所记录的交通数据生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵，具体步骤如下：

步骤3-1：构造时变特征矩阵；使用图

来表示传感器和交通特征之间的关系，

步骤3-2：构造邻接矩阵；节点簇中的邻接矩阵被定义为

代表节点之间是否存在直接连接；

将皮尔逊相关系数方法定义为：

步骤3-4：构造出行意愿特征矩阵

代表节点i到节点j的出行意愿，出行意愿大则

5.根据权利要求4所述的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法，其特征在于：所述步骤4)中，构造时变多图卷积网络，该网络由多图空间特征提取模块和时变特征提取模型组成，具体步骤如下：

步骤4-1-1：确定多图空间特征提取模块的输入，在步骤3)中将节点簇的输入分为分周期特征H_min∈[N，L]、时周期特征H_hou∈[N，L]和日周期特征H_day∈[N，L]，空间特征的提取需要对三种周期特征进行通道叠加和融合，叠加融合操作为H_F＝f_conv(H_min||H_ho||H_day)∈[N，1，L]，其中||代表串联操作，用于通道叠加；f_conv为2D卷积操作，用于通道融合；H_F为融合特征输入，N代表节点数，L代表输入序列长度；