CN115828121A - 基于邻接dbscan融合时变多图卷积网络的交通流预测方法 - Google Patents
基于邻接dbscan融合时变多图卷积网络的交通流预测方法 Download PDFInfo
- Publication number
- CN115828121A CN115828121A CN202211454634.5A CN202211454634A CN115828121A CN 115828121 A CN115828121 A CN 115828121A CN 202211454634 A CN202211454634 A CN 202211454634A CN 115828121 A CN115828121 A CN 115828121A
- Authority
- CN
- China
- Prior art keywords
- time
- extraction module
- feature extraction
- graph
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000004927 fusion Effects 0.000 title claims abstract description 30
- 238000000605 extraction Methods 0.000 claims abstract description 126
- 239000011159 matrix material Substances 0.000 claims abstract description 88
- 238000012549 training Methods 0.000 claims abstract description 36
- 238000012360 testing method Methods 0.000 claims abstract description 26
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 230000000737 periodic effect Effects 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000010586 diagram Methods 0.000 claims description 17
- 101100061188 Drosophila melanogaster dila gene Proteins 0.000 claims description 12
- 230000002159 abnormal effect Effects 0.000 claims description 12
- 230000001364 causal effect Effects 0.000 claims description 12
- 241000970807 Thermoanaerobacterales Species 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract 1
- 230000006870 function Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
Images
Landscapes
- Traffic Control Systems (AREA)
Abstract
本发明公开一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法,包括以下步骤:采集车流量数据,对原始数据进行预处理;构建邻接DBSCAN聚类算法对传感器节点进行密度聚类,划分为多个节点簇;对每个节点簇的传感器生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵,并划分训练集和测试集;构建时变多图卷积网络,该网络由多图空间特征提取模块和时变特征提取模型组成;利用训练集训练时变多图卷积网络,并用测试集测试模型的预测精度。本发明通过构建邻接DBSCAN聚类算法对交通传感器节点进行预筛选有效获取关联性高的节点簇,并通过构建的时变多图卷积网络有效提取交通流的动态多周期时空特征,提高了高关联性传感器节点之间的交通流预测精度。
Description
技术领域
本发明属于智能交通和人工智能领域,具体为一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法。
背景技术
随着无人驾驶技术的快速发展,与之配套的数据采集技术蓬勃发展,比如车辆定位数据、街景数据、道路传感器数据等交通数据集呈现爆发式增长,此类数据有效丰富了智能交通系统的数据基础。智能交通系统通过科学的交通调度和管理,可以有效提高路网中车流的效率。交通流预测作为智能交通系统的重要组成,根据历史观察准确及时的交通流预测有助于道路使用者制定更好的出行计划,缓解交通拥堵,提高交通运营效率。因此,如何提高交通流预测模型的精度至关重要。
目前,基于深度学习的图卷积网络被广泛用于一般路网交通流预测。目前现有的基于图卷积网络的交通流预测方法大多忽视节点之间的聚集特征,很少有将节点聚类为多个高关联的节点簇,分别进行预测来提高预测精度。DBSCAN是常见的基于密度的节点聚类算法,但此方法大多处理离散的节点聚类。在交通流中,节点除了离散分布在地图上,节点之间还存在道路连接,直接使用DBSCAN进行聚类,容易导致节点簇中存在与其他节点无连接的节点的情况。交通流不仅受到邻域和历史交通流的影响,还受到外界特征的影响,传统方法缺乏有效的内部特征和外部特征编码,导致预测模型很难有效的捕获交通流的动态时空特征。
发明内容
发明目的:针对上述问题,本发明引入一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法。该方法针对传统聚类算法忽视了节点之间的连接性,在利用DBSCAN进行一次聚类的基础上,通过在一次聚类的节点簇中构建邻接矩阵筛选无连接的节点;针对传统图卷积方法无法有效编码交通流内部特征和外部空间特征,提出邻接图特征提取模块、关联图特征提取模块和出行意愿图特征提取模块,三种模块的贡献由自注意力模块进行融合提取,输出得到多图空间特征。针对传统图卷积网络忽视长期时变特征的影响,提出时变特征提取模块,该模块主要由分周期特征提取模块、时周期特征提取模块和日周日提取模块组成。三个模块的输出由自注意力模块进行特征融合。本发明通过对交通节点进行二次聚类,并有效结合交通流多图特征和时变特征,实现交通流预测精度的提高。
技术方案:一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法
步骤1)采集城市道路或城际道路上交通传感器记录的车流量数据并传输至交通大数据集群,对原始数据进行预处理,剔除异常值和修复缺失值;
步骤2)构建邻接DBSCAN聚类算法对传感器节点进行密度聚类,划分为多个节点簇;
步骤3)对每个节点簇的传感器生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵,并划分训练集和测试集;
步骤4)构建时变多图卷积网络,该网络由多图空间特征提取模块和时变特征提取模型组成;
步骤5)利用训练集训练时变多图卷积网络,并用测试集测试模型的预测精度。
进一步,所述步骤1)中,采集城市道路或城际道路上的交通传感器Si的数据,传感器关键状态数据有经度Dlon(i)、纬度Dlat(i)和记录时间Dtim(i),传感器关键交通数据有交通流量Dveh(i)、交通速度Dspeed(i)、交通密度Dden(i)、环境状况Dwea(i),i是传感器的编号;将上述传感器数据统一传送至基于Hadoop的交通大数据集群,得到原始数据集Di;对原始数据进行异常值剔除和缺失值填充;其中,异常值采用3σ原则结合异常值数据前后一周的平均值进行判断和剔除;如果缺失值的时间跨度超过一天,则采用相邻传感器节点对应天数据的正常数据进行填充;如果缺失值的时间跨度小于一天,则采用前后一天数据的平均值进行填充;数据预处理完成后,对预处理后的数据进行标准化,采用D*=(Di-Mean(D))/Std(D)实现,其中Mean(D)和Std(D)分别是数据集的平均值和标准差,D*是标准化后的数据集。
进一步,所述步骤2)中,构建邻接DBSCAN聚类算法对传感器节点进行密度聚类,具体步骤如下:
步骤2-1:构建DBSCAN聚类算法对交通节点进行一阶段聚类,具体步骤如下:
步骤2-1-1:输入传感器经纬度数据Dlon(i)和Dlat(i),i∈N,N是传感器的数量;首先扫描所有传感器的经纬度数据,利用欧氏距离计算第i个传感器和第j个传感器之间的距离Dist(i,j);
步骤2-1-2:如果某个传感器半径范围R内的传感器数量大于等于设定的最小数量,则将其纳入核心点列表,并将其密度直达的传感器形成对应的临时聚类簇;
步骤2-1-3:对于每一个临时聚类簇,检查其中的传感器是否为核心点,如果是核心点,则将该传感器对应的临时聚类簇和当前的临时聚类簇进行合并,得到新的临时聚类簇;
步骤2-1-4:重复步骤2-1-2和2-1-3的操作,直到当前临时聚类簇中的每一个点要么不在核心点列表,要么密度直达的传感器都已经在当前临时聚类簇中,将此时的临时聚类簇升级为聚类簇;
步骤2-1-5:继续对剩余的临时聚类簇进行步骤2-1-4的合并操作,直到全部的临时聚类簇被处理;
步骤2-1-6:经过DBSCAN的聚类操作,将传感器节点V={v1,v2,...,vi,...,vN},划分为K个节点簇,Vk代表第k个节点簇所包含的节点集合;
步骤2-2:构建邻接矩阵来对每个节点簇进行二次聚类。具体步骤如下:
步骤2-2-3:重复步骤2-2-1和步骤2-2-2操作,直到所有节点簇中的节点都存在连接关系;
进一步,所述步骤3)中,根据节点簇中传感器的经纬度和所记录的交通数据生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵,具体步骤如下:
步骤3-1:构造时变特征矩阵;使用图来表示传感器和交通特征之间的关系,Hk={hn,1,hn,2,hn,3,...,hn,t,...,hn,T},t∈T,代表第k个节点簇在T时刻内记录的交通特征;hn,t代表第n个传感器在t时刻的交通流数据,时间间隔为传感器记录间隔,得到特征矩阵Gk如下所示:
其中,特征矩阵Gk的行为每个节点所记录的交通特征,即T时刻内的流量、速度和密度,行数代表第k个节点簇中的节点数;将特征矩阵Gk按照5分钟、1小时和24小时的时间间隔拆分为分周期特征Hmin(k)、时周期特征Hhour(k)和日周期特征Hday(k),按照固定比例将周期特征划分为训练集和测试集;
步骤3-3:构造关联矩阵;节点簇内部节点之间不仅存在物理上的连接,还存在数据关联,利用皮尔逊相关系数方法来计算不同节点之间的相关性并构成关联矩阵将皮尔逊相关系数方法定义为: 其中,hi,t(k)和hj,t(k)分别是第k个节点簇中传感器i和j在t时刻的特征,Std(hi(k))和Std(hj(k))是所选节点的标准差,Mean(hi(k))和Mean(hj(k))是所选节点的均值;遍历计算,得到所有节点簇的关联矩阵
进一步,所述步骤4)中,构造时变多图卷积网络,该网络由多图空间特征提取模块和时变特征提取模型组成,具体步骤如下:
步骤4-1:构造多图空间特征提取模块,由邻接图特征提取模块、关联图特征提取模块和出行意愿图特征提取模块组成,三种模块的贡献由自注意力模块进行融合提取,输出得到多图空间特征;多图空间特征提取模块作用在于提取多时段交通特征的动态空间特征,具体步骤如下:
步骤4-1-1:确定多图空间特征提取模块的输入,在步骤3)中将节点簇的输入分为分周期特征Hmin∈[N,L]、时周期特征Hhou∈[N,L]和日周期特征Hday∈[N,L],空间特征的提取需要对三种周期特征进行通道叠加和融合,叠加融合操作为HF=fconv(Hmin||Hhour||Hday)∈[N,1,L],其中||代表串联操作,用于通道叠加;fconv为2D卷积操作,用于通道融合;HF为融合特征输入,N代表节点数,L代表输入序列长度;
步骤4-1-2:构造邻接图特征提取模块;根据步骤3-2计算得到的邻接矩阵采用图卷积网络进行特征提取,操作为: 其中为第l+1层的邻接图特征输出,为邻接图特征提取模块中的权重,fA为激活函数;将邻接图特征提取模块的最终输出定义为Hadj;
步骤4-1-3:构造关联图特征提取模块;根据步骤3-3计算得到的关联矩阵采用图卷积网络进行特征提取,操作为: 其中为第l+1层的关联图特征输出,为关联图特征提取模块中的权重;将关联图特征提取模块的最终输出定义为Hcor;
步骤4-1-4:构造出行意愿图特征提取模块;根据步骤3-4计算得到的出行意愿特征矩阵采用图卷积网络进行特征提取,操作为:其中为第l+1层的出行意愿图特征输出,为邻接图特征提取模块中的权重;将出行意愿图特征提取模块的最终输出定义为Hint;
步骤4-1-5:构建自注意力模块对步骤4-1-2到步骤4-1-3的特征进行融合输出,将操作定义为HS=fA(fAtt(Hadj)+fAtt(Hcor)+fAtt(Hint)),其中fAtt为自注意模块的前向计算,定义为: Tr是转置操作;最终得到多图空间特征提取模块的输出为HS;
步骤4-2:构造时变特征提取模块,用于提取多周期时间特征;时变特征提取模块主要由分周期特征提取模块、时周期特征提取模块和日周日提取模块组成;三个模块的输出由自注意力模块进行特征融合,最终得到交通流的预测输出;具体步骤如下:
步骤4-2-1:确定时变特征提取模块的输入;确定分周期特征提取模块的输入为HMI=fconv(Hmin||HS)∈[N,1,L];确定时周期特征提取模块的输入为HHI=fconv(Hhou||HS)∈[N,1,L];确定日周期特征提取模块的输入为HDI=fconv(Hday||HS)∈[N,1,L];
步骤4-2-2:构造分周期特征提取模块;建立门控扩张因果卷积模块来避免1维CNN梯度消失的情况;首先通过扩张因果卷积,将输入HMI∈[N,L]映射为HMI1||HMI2∈[N,2cout],操作定义为HMI1||HMI2=f(WDilaHMI+bDila),将通道拆分为HMI1∈[N,cout]和HMI2∈[N,cout],WDila和bDila是扩展因果卷积的权重和偏置项,cout是预测输出的序列长度;经过GLU门控单元,YM=HMI1⊙σ(HMI2)∈[N,cout],得到分周期特征YM;
步骤4-2-3:构造时周期特征提取模块;同步骤4-2-2,通过扩张因果卷积,将输入HHI∈[N,L]映射为HHI1||HHI2∈[N,2cout],操作定义为HHI1||HHI2=f(WDilaHHI+bDila),将通道拆分为HHI1∈[N,cout]和HHI2∈[N,cout];经过GLU门控单元,YH=HHI1⊙σ(HHI2)∈[N,cout],得到时周期特征YH;
步骤4-2-4:构造日周期特征提取模块;同步骤4-2-2,通过扩张因果卷积,将输入HDI∈[N,L]映射为HDI1||HDI2∈[N,2cout],操作定义为HDI1||HDI2=f(WDilaHDI+bDila),将通道拆分为HDI1∈[N,cout]和HDI2∈[N,cout];经过GLU门控单元,YD=HDI1⊙σ(HDI2)∈[N,cout],得到日周期特征YD;
步骤4-2-5:构建自注意力模块对步骤4-2-2到4-2-4的周期特征进行融合,将操作定义为YT=fA(fAtt(YM)+fAtt(YH)+fAtt(YD));最终得到预测的交通特征为YT∈[N,cout]。
进一步,所述步骤5)中,用训练集训练时变多图卷积网络,并用测试集测试模型的预测精度,具体步骤如下:
步骤5-1:构建时变多图卷积网络的基本架构,初始化网络权重,确定网络的输入和输出维度,确定超参数如激活函数、初始训练步长、批处理大小和最大迭代次数等;
步骤5-2:利用训练集训练时变多图卷积网络,确定均方根误差为损失函数,优化器为Adam,在训练过程中实时迭代网络的参数;
步骤5-3:训练完成后,使用测试集测试模型的预测精度,展示模型的预测结果。
有益效果:本发明的交通流预测方法,该方法针对现有的基于图卷积网络的交通流预测方法大多忽视节点之间的聚集特征,很少有将节点聚类为多个高关联的节点簇;同时传统方法注重交通流邻域和历史交通流的影响忽视外界特征的影响,,导致预测模型很难有效的捕获交通流的动态时空特征。本发明通过构建邻接DBSCAN融合时变多图卷积网络实现不同节点簇下交通流动态时空特征的提取,提高模型的预测精度。
本发明引入一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法。该方法针对传统聚类算法忽视了节点之间的连接性,在利用DBSCAN进行一次聚类的基础上,通过在一次聚类的节点簇中构建邻接矩阵筛选无连接的节点;针对传统图卷积方法无法有效编码交通流内部特征和外部空间特征,提出邻接图特征提取模块、关联图特征提取模块和出行意愿图特征提取模块,三种模块的贡献由自注意力模块进行融合提取,输出得到多图空间特征。针对传统图卷积网络忽视长期时变特征的影响,提出时变特征提取模块,该模块主要由分周期特征提取模块、时周期特征提取模块和日周日提取模块组成。三个模块的输出由自注意力模块进行特征融合。本发明通过对交通节点进行二次聚类,并有效结合交通流多图特征和时变特征,实现交通流预测精度的提高。
附图说明
图1为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法步骤示意图;
图2为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法流程图;
图3为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法邻接DBSCAN聚类示意图,(a)为DBSCAN一次聚类,(b)为DBSCAN二次聚类;
图4为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法模型结构图;
图5为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法模型训练迭代图;
图6为本发明的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法测试集真实数据和预测数据对比图。
具体实施方式
下面将结合说明书附图对本发明的技术方法做进一步的详细说明。
如图1-2所示,一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法,包括如下步骤:
步骤1)采集城市道路或城际道路上交通传感器记录的车流量数据并传输至交通大数据集群,对原始数据进行预处理,剔除异常值和修复缺失值;
所述步骤1)中,采集城市道路或城际道路上的交通传感器Si的数据,传感器关键状态数据有经度Dlon(i)、纬度Dlat(i)和记录时间Dtim(i),传感器关键交通数据有交通流量Dveh(i)、交通速度Dspeed(i)、交通密度Dden(i)、环境状况Dwea(i),i是传感器的编号;将上述传感器数据统一传送至基于Hadoop的交通大数据集群,得到原始数据集Di;对原始数据进行异常值剔除和缺失值填充;其中,异常值采用3σ原则结合异常值数据前后一周的平均值进行判断和剔除;如果缺失值的时间跨度超过一天,则采用相邻传感器节点对应天数据的正常数据进行填充;如果缺失值的时间跨度小于一天,则采用前后一天数据的平均值进行填充;数据预处理完成后,对预处理后的数据进行标准化,采用D*=(Di-Mean(D))/Std(D)实现,其中Mean(D)和Std(D)分别是数据集的平均值和标准差,D*是标准化后的数据集。使用PEMS03加州交通高速交通数据作为交通节点数据,采集的时间间隔为5分钟。
步骤2)构建邻接DBSCAN聚类算法对传感器节点进行密度聚类,划分为多个节点簇;
所述步骤2)中,构建邻接DBSCAN聚类算法对传感器节点进行密度聚类,如图3所示,具体步骤如下:
步骤2-1:构建DBSCAN聚类算法对交通节点进行一阶段聚类,具体步骤如下:
步骤2-1-1:输入传感器经纬度数据Dlon(i)和Dlat(i),i∈N,N是传感器的数量;首先扫描所有传感器的经纬度数据,利用欧氏距离计算第i个传感器和第j个传感器之间的距离Dist(i,j);
步骤2-1-2:如果某个传感器半径范围R内的传感器数量大于等于设定的最小数量,则将其纳入核心点列表,并将其密度直达的传感器形成对应的临时聚类簇;
步骤2-1-3:对于每一个临时聚类簇,检查其中的传感器是否为核心点,如果是核心点,则将该传感器对应的临时聚类簇和当前的临时聚类簇进行合并,得到新的临时聚类簇;
步骤2-1-4:重复步骤2-1-2和2-1-3的操作,直到当前临时聚类簇中的每一个点要么不在核心点列表,要么密度直达的传感器都已经在当前临时聚类簇中,将此时的临时聚类簇升级为聚类簇;
步骤2-1-5:继续对剩余的临时聚类簇进行步骤2-1-4的合并操作,直到全部的临时聚类簇被处理;
步骤2-1-6:经过DBSCAN的聚类操作,将传感器节点V={v1,v2,...,vi,...,vN},划分为K个节点簇,Vk代表第k个节点簇所包含的节点集合;
步骤2-2:构建邻接矩阵来对每个节点簇进行二次聚类,具体步骤如下:
步骤2-2-3:重复步骤2-2-1和步骤2-2-2操作,直到所有节点簇中的节点都存在连接关系;
步骤3)对每个节点簇的传感器生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵,并划分训练集和测试集;
所述步骤3)中,根据节点簇中传感器的经纬度和所记录的交通数据生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵,具体步骤如下:
步骤3-1:构造时变特征矩阵;使用图来表示传感器和交通特征之间的关系,Hk={hn,1,hn,2,hn,3,...,hn,t,...,hn,T},t∈T,代表第k个节点簇在T时刻内记录的交通特征;hn,t代表第n个传感器在t时刻的交通流数据,时间间隔为传感器记录间隔,得到特征矩阵Gk如下所示:
其中,特征矩阵Gk的行为每个节点所记录的交通特征,即T时刻内的流量、速度和密度,行数代表第k个节点簇中的节点数;将特征矩阵Gk按照5分钟、1小时和24小时的时间间隔拆分为分周期特征Hmin(k)、时周期特征Hhour(k)和日周期特征Hday(k),按照固定比例将周期特征划分为训练集和测试集;
步骤3-3:构造关联矩阵;节点簇内部节点之间不仅存在物理上的连接,还存在数据关联,利用皮尔逊相关系数方法来计算不同节点之间的相关性并构成关联矩阵将皮尔逊相关系数方法定义为: 其中,hi,t(k)和hj,t(k)分别是第k个节点簇中传感器i和j在t时刻的特征,Std(hi(k))和Std(hj(k))是所选节点的标准差,Mean(hi(k))和Mean(hj(k))是所选节点的均值;遍历计算,得到所有节点簇的关联矩阵
步骤4)构建时变多图卷积网络,结构如图4所示,该网络由多图空间特征提取模块(a)和时变特征提取模型(b)组成;
所述步骤4)中,构造时变多图卷积网络,该网络由多图空间特征提取模块和时变特征提取模型组成,具体步骤如下:
步骤4-1:构造多图空间特征提取模块,由邻接图特征提取模块、关联图特征提取模块和出行意愿图特征提取模块组成,三种模块的贡献由自注意力模块进行融合提取,输出得到多图空间特征;多图空间特征提取模块作用在于提取多时段交通特征的动态空间特征,具体步骤如下:
步骤4-1-1:确定多图空间特征提取模块的输入,在步骤3)中将节点簇的输入分为分周期特征Hmin∈[N,L]、时周期特征Hhour∈[N,L]和日周期特征Hday∈[N,L],空间特征的提取需要对三种周期特征进行通道叠加和融合,叠加融合操作为HF=fconv(Hmin||Hhour||Hday)∈[N,1,L],其中||代表串联操作,用于通道叠加;fconv为2D卷积操作,用于通道融合;HF为融合特征输入,N代表节点数,L代表输入序列长度;
步骤4-1-2:构造邻接图特征提取模块;根据步骤3-2计算得到的邻接矩阵采用图卷积网络进行特征提取,操作为: 其中为第l+1层的邻接图特征输出,为邻接图特征提取模块中的权重,fA为激活函数;将邻接图特征提取模块的最终输出定义为Hadj;
步骤4-1-3:构造关联图特征提取模块;根据步骤3-3计算得到的关联矩阵采用图卷积网络进行特征提取,操作为: 其中为第l+1层的关联图特征输出,为关联图特征提取模块中的权重;将关联图特征提取模块的最终输出定义为Hcor;
步骤4-1-4:构造出行意愿图特征提取模块;根据步骤3-4计算得到的出行意愿特征矩阵采用图卷积网络进行特征提取,操作为:其中为第l+1层的出行意愿图特征输出,为邻接图特征提取模块中的权重;将出行意愿图特征提取模块的最终输出定义为Hint;
步骤4-1-5:构建自注意力模块对步骤4-1-2到步骤4-1-3的特征进行融合输出,将操作定义为HS=fA(fAtt(Hadj)+fAtt(Hcor)+fAtt(Hint)),其中fAtt为自注意模块的前向计算,定义为:fAtt(H)=(H)Tr·Atten(H), Tr是转置操作;最终得到多图空间特征提取模块的输出为HS;
步骤4-2:构造时变特征提取模块,用于提取多周期时间特征;时变特征提取模块主要由分周期特征提取模块、时周期特征提取模块和日周日提取模块组成;三个模块的输出由自注意力模块进行特征融合,最终得到交通流的预测输出;具体步骤如下:
步骤4-2-1:确定时变特征提取模块的输入;确定分周期特征提取模块的输入为HMI=fconv(Hmin||HS)∈[N,1,L];确定时周期特征提取模块的输入为HHI=fconv(Hhour||HS)∈[N,1,L];确定日周期特征提取模块的输入为HDI=fconv(Hday||HS)∈[N,1,L];
步骤4-2-2:构造分周期特征提取模块;建立门控扩张因果卷积模块来避免1维CNN梯度消失的情况;首先通过扩张因果卷积,将输入HMI∈[N,L]映射为HMI1||HMI2∈[N,2cout],操作定义为HMI1||HMI=f(WDilaHMI+bDila),将通道拆分为HMI∈[N,cout]和HMI2∈[N,cout],WDila和bDila是扩展因果卷积的权重和偏置项,cout是预测输出的序列长度;经过GLU门控单元,YM=HMI1⊙σ(HMI)∈[N,cout],得到分周期特征YM;
步骤4-2-3:构造时周期特征提取模块;同步骤4-2-2,通过扩张因果卷积,将输入HHI∈[N,L]映射为HHI||HHI∈[N,2cout],操作定义为HHI1||HHI=f(WDilaHHI+bDila),将通道拆分为HHI1∈[N,cout]和HHI∈[N,cout];经过GLU门控单元,YH=HHI⊙σ(HHI)∈[N,cout],得到时周期特征YH;
步骤4-2-4:构造日周期特征提取模块;同步骤4-2-2,通过扩张因果卷积,将输入HDI∈[N,L]映射为HDI1||HDI2∈[N,2cout],操作定义为HDI1||HDI2=f(WDilaHDI+bDila),将通道拆分为HDI∈[N,cout]和HDI∈[N,cout];经过GLU门控单元,YD=HDI1⊙σ(HDI2)∈[N,cout],得到日周期特征YD;
步骤4-2-5:构建自注意力模块对步骤4-2-2到4-2-4的周期特征进行融合,将操作定义为YT=fA(fAtt(YM)+fAtt(YH)+fAtt(YD));最终得到预测的交通特征为YT∈[N,cout]。
步骤5)利用训练集训练时变多图卷积网络,并用测试集测试模型的预测精度。
所述步骤5)中,用训练集训练时变多图卷积网络,并用测试集测试模型的预测精度,具体步骤如下:
步骤5-1:构建时变多图卷积网络的基本架构,初始化网络权重,确定网络的输入和输出维度,确定超参数如激活函数、初始训练步长、批处理大小和最大迭代次数等;
步骤5-2:利用训练集训练时变多图卷积网络,确定均方根误差为损失函数,优化器为Adam,在训练过程中实时迭代网络的参数,迭代如图5所示;
步骤5-3:训练完成后,使用测试集测试模型的预测精度,展示模型的预测结果,预测结果对比如图6所示。
本发明针对传统聚类算法忽视了节点之间的连接性,在利用DBSCAN进行一次聚类的基础上,通过在一次聚类的节点簇中构建邻接矩阵筛选无连接的节点;针对传统图卷积方法无法有效编码交通流内部特征和外部空间特征,提出邻接图特征提取模块、关联图特征提取模块和出行意愿图特征提取模块,三种模块的贡献由自注意力模块进行融合提取,输出得到多图空间特征。针对传统图卷积网络忽视长期时变特征的影响,提出时变特征提取模块,该模块主要由分周期特征提取模块、时周期特征提取模块和日周日提取模块组成。三个模块的输出由自注意力模块进行特征融合。本发明通过对交通节点进行二次聚类,并有效结合交通流多图特征和时变特征,实现交通流预测精度的提高。
以上所述仅为本发明在城市道路或城际道路数据集下较好的实施方式,本发明保护范围并不以上述实施方式为限制,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修改和其他修饰变化,皆应纳入权利要求书记载的保护范围。
Claims (6)
1.一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法,其特征在于,包括以下步骤:
步骤1)采集城市道路或城际道路上交通传感器记录的车流量数据并传输至交通大数据集群,对原始数据进行预处理,剔除异常值和修复缺失值;
步骤2)构建邻接DBSCAN聚类算法对传感器节点进行密度聚类,划分为多个节点簇;
步骤3)对每个节点簇的传感器生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵,并划分训练集和测试集;
步骤4)构建时变多图卷积网络,该网络由多图空间特征提取模块和时变特征提取模型组成;
步骤5)利用训练集训练时变多图卷积网络,并用测试集测试模型的预测精度。
2.根据权利要求1所述的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法,其特征在于:所述步骤1)中,采集城市道路或城际道路上的交通传感器Si的数据,传感器关键状态数据有经度Dlon(i)、纬度Dlat(i)和记录时间Dtim(i),传感器关键交通数据有交通流量Dveh(i)、交通速度Dspeed(i)、交通密度Dden(i)、环境状况Dwea(i),i是传感器的编号;将上述传感器数据统一传送至基于Hadoop的交通大数据集群,得到原始数据集Di;对原始数据进行异常值剔除和缺失值填充;其中,异常值采用3σ原则结合异常值数据前后一周的平均值进行判断和剔除;如果缺失值的时间跨度超过一天,则采用相邻传感器节点对应天数据的正常数据进行填充;如果缺失值的时间跨度小于一天,则采用前后一天数据的平均值进行填充;数据预处理完成后,对预处理后的数据进行标准化,采用D*=(Di-Mean(D))/Std(D)实现,其中Mean(D)和Std(D)分别是数据集的平均值和标准差,D*是标准化后的数据集。
3.根据权利要求1所述的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法,其特征在于:所述步骤2)中,构建邻接DBSCAN聚类算法对传感器节点进行密度聚类,具体步骤如下:
步骤2-1:构建DBSCAN聚类算法对交通节点进行一阶段聚类,具体步骤如下:
步骤2-1-1:输入传感器经纬度数据Dlon(i)和Dlat(i),i∈N,N是传感器的数量;首先扫描所有传感器的经纬度数据,利用欧氏距离计算第i个传感器和第j个传感器之间的距离Dist(i,j);
步骤2-1-2:如果某个传感器半径范围R内的传感器数量大于等于设定的最小数量,则将其纳入核心点列表,并将其密度直达的传感器形成对应的临时聚类簇;
步骤2-1-3:对于每一个临时聚类簇,检查其中的传感器是否为核心点,如果是核心点,则将该传感器对应的临时聚类簇和当前的临时聚类簇进行合并,得到新的临时聚类簇;
步骤2-1-4:重复步骤2-1-2和2-1-3的操作,直到当前临时聚类簇中的每一个点要么不在核心点列表,要么密度直达的传感器都已经在当前临时聚类簇中,将此时的临时聚类簇升级为聚类簇;
步骤2-1-5:继续对剩余的临时聚类簇进行步骤2-1-4的合并操作,直到全部的临时聚类簇被处理;
步骤2-1-6:经过DBSCAN的聚类操作,将传感器节点V={v1,v2,…,vi,…,vN},划分为K个节点簇,Vk代表第k个节点簇所包含的节点集合;
步骤2-2:构建邻接矩阵来对每个节点簇进行二次聚类,具体步骤如下:
步骤2-2-3:重复步骤2-2-1和步骤2-2-2操作,直到所有节点簇中的节点都存在连接关系;
4.根据权利要求1所述的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法,其特征在于:所述步骤3)中,根据节点簇中传感器的经纬度和所记录的交通数据生成时变特征矩阵、邻接矩阵、关联矩阵和出行意愿矩阵,具体步骤如下:
步骤3-1:构造时变特征矩阵;使用图来表示传感器和交通特征之间的关系,Hk={hn,1,hn,2,hn,3,...,hn,t,...,hn,T},t∈T,代表第k个节点簇在T时刻内记录的交通特征;hn,t代表第n个传感器在t时刻的交通流数据,时间间隔为传感器记录间隔,得到特征矩阵Gk如下所示:
其中,特征矩阵Gk的行为每个节点所记录的交通特征,即T时刻内的流量、速度和密度,行数代表第k个节点簇中的节点数;将特征矩阵Gk按照5分钟、1小时和24小时的时间间隔拆分为分周期特征Hmin(k)、时周期特征Hhour(k)和日周期特征Hday(k),按照固定比例将周期特征划分为训练集和测试集;
步骤3-3:构造关联矩阵;节点簇内部节点之间不仅存在物理上的连接,还存在数据关联,利用皮尔逊相关系数方法来计算不同节点之间的相关性并构成关联矩阵将皮尔逊相关系数方法定义为: 其中,hi,t(k)和hj,t(k)分别是第k个节点簇中传感器i和j在t时刻的特征,Std(hi(k))和Std(hj(k))是所选节点的标准差,Mean(hi(k))和Mean(hj(k))是所选节点的均值;遍历计算,得到所有节点簇的关联矩阵
5.根据权利要求4所述的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法,其特征在于:所述步骤4)中,构造时变多图卷积网络,该网络由多图空间特征提取模块和时变特征提取模型组成,具体步骤如下:
步骤4-1:构造多图空间特征提取模块,由邻接图特征提取模块、关联图特征提取模块和出行意愿图特征提取模块组成,三种模块的贡献由自注意力模块进行融合提取,输出得到多图空间特征;多图空间特征提取模块作用在于提取多时段交通特征的动态空间特征,具体步骤如下:
步骤4-1-1:确定多图空间特征提取模块的输入,在步骤3)中将节点簇的输入分为分周期特征Hmin∈[N,L]、时周期特征Hhou∈[N,L]和日周期特征Hday∈[N,L],空间特征的提取需要对三种周期特征进行通道叠加和融合,叠加融合操作为HF=fconv(Hmin||Hho||Hday)∈[N,1,L],其中||代表串联操作,用于通道叠加;fconv为2D卷积操作,用于通道融合;HF为融合特征输入,N代表节点数,L代表输入序列长度;
步骤4-1-2:构造邻接图特征提取模块;根据步骤3-2计算得到的邻接矩阵采用图卷积网络进行特征提取,操作为: 其中为第l+1层的邻接图特征输出,为邻接图特征提取模块中的权重,fA为激活函数;将邻接图特征提取模块的最终输出定义为Hadj;
步骤4-1-3:构造关联图特征提取模块;根据步骤3-3计算得到的关联矩阵采用图卷积网络进行特征提取,操作为: 其中为第l+1层的关联图特征输出,为关联图特征提取模块中的权重;将关联图特征提取模块的最终输出定义为Hcor;
步骤4-1-4:构造出行意愿图特征提取模块;根据步骤3-4计算得到的出行意愿特征矩阵采用图卷积网络进行特征提取,操作为:其中为第l+1层的出行意愿图特征输出,为邻接图特征提取模块中的权重;将出行意愿图特征提取模块的最终输出定义为Hint;
步骤4-1-5:构建自注意力模块对步骤4-1-2到步骤4-1-3的特征进行融合输出,将操作定义为HS=fA(fAtt(Hadj)+fAtt(Hcor)+fAtt(Hint)),其中fAtt为自注意模块的前向计算,定义为:fAtt(H)=(H)Tr·Atten(H), Tr是转置操作;最终得到多图空间特征提取模块的输出为HS;
步骤4-2:构造时变特征提取模块,用于提取多周期时间特征;时变特征提取模块主要由分周期特征提取模块、时周期特征提取模块和日周日提取模块组成;三个模块的输出由自注意力模块进行特征融合,最终得到交通流的预测输出;具体步骤如下:
步骤4-2-1:确定时变特征提取模块的输入;确定分周期特征提取模块的输入为HMI=fconv(Hmin||HS)∈[N,1,L];确定时周期特征提取模块的输入为HHI=fconv(Hhour||HS)∈[N,1,L];确定日周期特征提取模块的输入为HDI=fconv(Hday||HS)∈[N,1,L];
步骤4-2-2:构造分周期特征提取模块;建立门控扩张因果卷积模块来避免1维CNN梯度消失的情况;首先通过扩张因果卷积,将输入HMI∈[N,L]映射为HMI1||HMI2∈[N,2cout],操作定义为HMI1||HMI2=f(WDilaHMI+bDila),将通道拆分为HMI1∈[N,cout]和HMI2∈[N,cout],WDila和bDila是扩展因果卷积的权重和偏置项,cout是预测输出的序列长度;经过GLU门控单元,YM=HMI1⊙σ(HMI2)∈[N,cout],得到分周期特征YM;
步骤4-2-3:构造时周期特征提取模块;同步骤4-2-2,通过扩张因果卷积,将输入HHI∈[N,L]映射为HHI1||HHI2∈[N,2cout],操作定义为HHI1||HHI2=f(WDilaHHI+bDila),将通道拆分为HHI1∈[N,cout]和HHI2∈[N,cout];经过GLU门控单元,YH=HHI1⊙σ(HHI2)∈[N,cout],得到时周期特征YH;
步骤4-2-4:构造日周期特征提取模块;同步骤4-2-2,通过扩张因果卷积,将输入HDI∈[N,L]映射为HDI1||HDI2∈[N,2cout],操作定义为HDI1||HDI2=f(WDilaHDI+bDila),将通道拆分为HDI1∈[N,cout]和HDI2∈[N,Cout];经过GLU门控单元,YD=HDI1⊙σ(HDI2)∈[N,cout],得到日周期特征YD;
步骤4-2-5:构建自注意力模块对步骤4-2-2到4-2-4的周期特征进行融合,将操作定义为YT=fA(fAtt(YM)+fAtt(YH)+fAtt(YD));最终得到预测的交通特征为YT∈[N,cout]。
6.根据权利要求1所述的一种基于邻接DBSCAN融合时变多图卷积网络的交通流预测方法,其特征在于:所述步骤5)中,用训练集训练时变多图卷积网络,并用测试集测试模型的预测精度,具体步骤如下:
步骤5-1:构建时变多图卷积网络的基本架构,初始化网络权重,确定网络的输入和输出维度,确定超参数如激活函数、初始训练步长、批处理大小和最大迭代次数等;
步骤5-2:利用训练集训练时变多图卷积网络,确定均方根误差为损失函数,优化器为Adam,在训练过程中实时迭代网络的参数;
步骤5-3:训练完成后,使用测试集测试模型的预测精度,展示预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211454634.5A CN115828121A (zh) | 2022-11-21 | 2022-11-21 | 基于邻接dbscan融合时变多图卷积网络的交通流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211454634.5A CN115828121A (zh) | 2022-11-21 | 2022-11-21 | 基于邻接dbscan融合时变多图卷积网络的交通流预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115828121A true CN115828121A (zh) | 2023-03-21 |
Family
ID=85529607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211454634.5A Withdrawn CN115828121A (zh) | 2022-11-21 | 2022-11-21 | 基于邻接dbscan融合时变多图卷积网络的交通流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115828121A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116821834A (zh) * | 2023-08-29 | 2023-09-29 | 浙江北岛科技有限公司 | 基于内嵌传感器的真空断路器检修管理系统 |
CN116915626A (zh) * | 2023-07-24 | 2023-10-20 | 青海师范大学 | 一种k-均匀超网络同步能力的评估方法及系统 |
-
2022
- 2022-11-21 CN CN202211454634.5A patent/CN115828121A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116915626A (zh) * | 2023-07-24 | 2023-10-20 | 青海师范大学 | 一种k-均匀超网络同步能力的评估方法及系统 |
CN116915626B (zh) * | 2023-07-24 | 2024-04-19 | 青海师范大学 | 一种k-均匀超网络同步能力的评估方法及系统 |
CN116821834A (zh) * | 2023-08-29 | 2023-09-29 | 浙江北岛科技有限公司 | 基于内嵌传感器的真空断路器检修管理系统 |
CN116821834B (zh) * | 2023-08-29 | 2023-11-24 | 浙江北岛科技有限公司 | 基于内嵌传感器的真空断路器检修管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111161535B (zh) | 基于注意力机制的图神经网络交通流量预测方法及系统 | |
CN115828121A (zh) | 基于邻接dbscan融合时变多图卷积网络的交通流预测方法 | |
CN110517482B (zh) | 一种基于3d卷积神经网络的短时交通流预测方法 | |
CN112418547A (zh) | 一种基于gcn-lstm组合模型的公交车站点客流量预测方法 | |
CN114092832B (zh) | 一种基于并联混合卷积网络的高分辨率遥感影像分类方法 | |
CN112966853B (zh) | 基于时空残差混合模型的城市路网短时交通流预测方法 | |
CN111966823B (zh) | 一种面向标签噪声的图节点分类方法 | |
CN112767682A (zh) | 一种基于图卷积神经网络的多尺度交通流量预测方法 | |
CN104573879A (zh) | 基于最优相似日集的光伏电站出力预测方法 | |
CN107656987A (zh) | 一种基于lda模型的地铁站点功能挖掘方法 | |
CN109086926B (zh) | 一种基于组合神经网络结构的短时轨道交通客流预测方法 | |
CN110765582B (zh) | 基于马尔可夫链的自组织中心K-means微电网场景划分方法 | |
CN113591380A (zh) | 基于图高斯过程的交通流预测方法、介质及设备 | |
CN105654136A (zh) | 一种基于深度学习的大规模遥感影像目标自动识别方法 | |
CN112785848A (zh) | 一种交通数据预测方法以及系统 | |
CN115935796A (zh) | 一种基于时空异质的和同步的图卷积网络交通流预测方法 | |
CN114565187A (zh) | 一种基于图时空自编码网络的交通路网数据预测方法 | |
CN115879619A (zh) | 一种变电站日前碳排放因子预测方法及系统 | |
CN115936069A (zh) | 一种基于时空注意力网络的交通流预测方法 | |
CN115862324A (zh) | 一种智慧交通的时空同步图卷积神经网络及交通预测方法 | |
CN113793227B (zh) | 一种用于社交网络事件的类人智能感知与预测方法 | |
CN115376317A (zh) | 一种基于动态图卷积和时序卷积网络的交通流预测方法 | |
CN111462492A (zh) | 一种基于里奇流的关键路段检出方法 | |
CN113657645B (zh) | 基于注意力机制的时空连接增强3dcnn交通预测方法 | |
CN114913689A (zh) | 一种基于先验知识时变图卷积网络的交通流预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230321 |
|
WW01 | Invention patent application withdrawn after publication |