CN114913689A - 一种基于先验知识时变图卷积网络的交通流预测方法 - Google Patents

一种基于先验知识时变图卷积网络的交通流预测方法 Download PDF

Info

Publication number
CN114913689A
CN114913689A CN202210616802.XA CN202210616802A CN114913689A CN 114913689 A CN114913689 A CN 114913689A CN 202210616802 A CN202210616802 A CN 202210616802A CN 114913689 A CN114913689 A CN 114913689A
Authority
CN
China
Prior art keywords
time
matrix
traffic
dynamic
traffic flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210616802.XA
Other languages
English (en)
Other versions
CN114913689B (zh
Inventor
施佺
包银鑫
曹晨阳
何星鸿
刁志鹏
鲁子琦
沈琴琴
曹志超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN202210616802.XA priority Critical patent/CN114913689B/zh
Publication of CN114913689A publication Critical patent/CN114913689A/zh
Application granted granted Critical
Publication of CN114913689B publication Critical patent/CN114913689B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • G08G1/0145Measuring and analyzing of parameters relative to traffic conditions for specific applications for active traffic flow control

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开一种基于先验知识时变图卷积网络的交通流预测方法,步骤如下:收集交通流数据,传输至交通大数据集群。对采集的数据进行预处理;生成交通图和特征矩阵,按照记录时间生成时间序列,将其划分为训练集和测试集;生成稳定特征矩阵和动态特征矩阵,利用编码器‑解码器结合自注意力机制将两种矩阵融合为先验知识图矩阵;构建先验知识时变图卷积网络,该网络由动态空间特征提取组件和动态长期时间特征提取组件组成;用训练集训练先验知识时变图卷积网络,并用测试集测试模型的预测精度。本发明通过构建编码器‑解码器结合自注意力机制有效提取传感器多层次的稳定和动态节点特征,提高了传感器节点之间的动态关联特性,实现模型精度的提升。

Description

一种基于先验知识时变图卷积网络的交通流预测方法
技术领域
本发明属于智能交通和机器学习领域,具体为一种基于先验知识时变图卷积网络的交通流预测方法。
背景技术
随着人们生活水平的稳步提高,私家车保有量逐年稳步增长,这也直接导致了道路上的交通拥堵问题日益严重。传统方法增加交通基础设施是治标不治本的,要根本解决交通拥堵问题,智能交通系统是重要的科学手段之一。智能交通系统通过智能交通管理和调度,科学的诱导交通路网中的流量运行,提高人们的出行效率,有效降低交通拥堵状况。交通流作为智能交通系统的重要组成部分,具有重要研究意义。实时准确的交通流预测不仅可以为交通管理部门提供可靠实时的未来交通流变化,还可以帮助其制定科学合理的交通诱导方案和交通管理策略。因此,如何提高交通流预测模型的精度至关重要。
目前,基于深度学习的机器学习方法被广泛用于交通流预测,其中,由于图卷积网络对非欧几里得路网有着良好的时空特征提取能力,在处理实际路网时,具有较好的预测精度。目前已有部分图卷积网络变体使用改进邻接矩阵来分别提取传感器节点的动态和静态关联特征,但此类方法大多忽视了传感器节点之间的有效距离、数据关联和外部干扰等先验知识的影响,无法有效提取节点之间的关联特征。同时,上述方法往往很少考虑交通流的长期时间特征,导致预测模型很难有效捕获交通流的动态长期时间特征。
发明内容
发明目的:针对上述问题,本发明引入一种基于先验知识时变图卷积网络的交通流预测方法。该方法针对传统方法大多忽视了传感器节点之间的有效距离、数据关联和外部干扰等先验知识的影响,无法有效提取节点之间的关联特征。同时,传统方法往往很少考虑交通流的长期时间特征,导致预测模型很难有效捕获交通流的动态长期时间特征。为此,本发明根据交通传感器所处的位置和数据关联生成稳定特征矩阵,根据交通传感器所在的环境变量生成动态特征矩阵,利用编码器-解码器结合自注意力机制将稳定特征和动态特征矩阵融合为先验知识图矩阵;利用图卷积操作结合先验知识图矩阵提取交通流的动态空间特征;根据不同时间间隔分别构建周期序列和邻近序列,利用3D卷积操作提取动态时间特征,利用膨胀卷积操作提取长期时间特征;构建投影模块,用于连接动态空间特征、动态时间特征和长期时间特征的输出来映射最终预测值。本发明通过深入提取传感器节点的关联特征结合新颖的动态长期特征提取组件实现交通流时空特征的有效提取。
技术方案:一种基于先验知识时变图卷积网络的交通流预测方法,包括以下步骤:
步骤1)收集高速公路或城市干线上交通传感器记录的交通流数据,传输至交通大数据集群;对采集的交通流数据进行数据预处理以降低冗余度;
步骤2)根据交通传感器位置和预处理后的交通流数据生成交通图和特征矩阵,按照记录时间生成时间序列,将其划分为训练集和测试集;
步骤3)根据交通传感器位置和预处理后的交通流数据关联生成稳定特征矩阵,根据交通传感器所在的环境变量生成动态特征矩阵,利用编码器-解码器结合自注意力机制将稳定特征矩阵和动态特征矩阵融合为先验知识图矩阵;
步骤4)构建先验知识时变图卷积网络,该网络由动态空间特征提取组件和动态长期时间特征提取组件组成;
步骤5)利用训练集训练先验知识时变图卷积网络,并用测试集测试网络的预测精度。
进一步,所述步骤1)中,采集布置在高速公路或城市干线上N个传感器的交通流数据。将每个传感器定义为Datan={idn,lonn,latn,timen,flown},n∈N,其中idn,lonn,latn,timen,flown分别是第n个传感器的序号、经度、纬度、记录时间和交通流数据(流量、速度或密度)。由于传感器自身硬件或外界环境的不稳定性,容易导致传感器记录的数据存在异常值或缺失值。其中,异常值数据采用3σ原则进行发现和剔除。对于时间跨度较小的缺失值,使用前后相邻一天的同一时间段的数据进行填充;对于时间跨度较大的缺失值,直接进行剔除。数据修复完成后,为了降低数据量纲的影响,对数据进行标准化处理,通过公式flow*=(flown-Mean(flow))/Std(flow)实现,其中Mean(flow)和Std(flow)分别是N个传感器记录的交通流的平均值和标准差,flow*是标准化后的交通流数据。
进一步,所述步骤2)中,根据传感器位置和交通流数据生成交通图和特征矩阵。使用图特征矩阵G=(V,H)来描述不同传感器之间的关系,其中,V={v1,v2,…,vn,…,vN}代表不同的传感器节点,H是={h1,h2,…,ht,…,hT},t∈T,代表每个传感器所记录的T时刻内的交通流数据,hn,t代表第n个传感器在t时刻的交通流数据,T是传感器记录的最后时间节点。因此可以构建图特征矩阵G如下:
Figure BDA0003673580430000031
其中,图特征矩阵G的行为特征数,即为1到T时刻的交通流数据,行为节点数,该矩阵维度为[N,T]。按照记录时间生成矩阵后,按照固定比例将数据集划分为训练集和测试集。
进一步,所述步骤3)中,根据交通传感器所处的位置和数据关联生成稳定特征矩阵,根据交通传感器所在的环境变量生成动态特征矩阵,利用编码器-解码器结合自注意力机制将稳定特征和动态特征矩阵融合为先验知识图矩阵。具体步骤如下:
步骤3-1:构造稳定特征矩阵As,稳定特征矩阵由有效距离矩阵和节点关联矩阵组成,具体步骤如下:
步骤3-1-1:计算有效距离矩阵。根据交通传感器n的经纬度数据{lonn,latn}和交通传感器m的经纬度数据{lonm,latm},使用Haversine公式计算节点之间的物理距离,
Figure BDA0003673580430000032
其中,
Figure BDA0003673580430000033
R为地球半径,取平均值为6371千米,d为传感器m和n的物理距离,由此可以得到任意两个传感器之间的物理距离dmn。考虑到部分节点虽然直线距离最近,但是相互之间不存在直接联系,因此直线距离不能有效反应节点的相互作用。为此,建立任意两节点的可达关系判别式:
Figure BDA0003673580430000034
其中N为两个节点之间传感器数量。结合物理距离dmn和可达关系判别式pmn生成有效距离
Figure BDA0003673580430000035
根据任意两节点之间的有效距离生成有效距离矩阵As1
步骤3-1-2:计算节点关联矩阵。利用皮尔逊相关系数方法来计算节点间的关联系数,将皮尔逊相关系数方法定义为:
Figure BDA0003673580430000036
其中,Hm(t)和Hn(t)分别是传感器m和n在t时刻的特征,Std(Hm)和Std(Hn)分别是所选特征的标准差,Mean(Hm)和Mean(Hn)分别是所选特征的均值。根据任意两节点之间的关联系数生成节点关联矩阵As2
步骤3-2:构造动态特征矩阵Ad,动态特征矩阵主要由环境变量构成,环境变量主要包含天气、气候、特殊事件等。以天气情况为例,天气越好,人们的出行欲望越大;天气越恶劣,人们出行欲望越小。定义传感器m和n之间的环境度量emn,emn∈[0,1],将环境度量取值定义如表1所示:
表1不同天气对应的舒适度值
Figure BDA0003673580430000041
获取传感器m和n所在位置的天气数据{Weatherm}和{Weathern},根据表1计算传感器之间的环境度量emn。根据任意两节点之间的环境度量值生成动态特征矩阵Ad
步骤3-3:构造先验知识提取模块,主要由编码器解码器结合自注意力机制组成,具体步骤如下:
步骤3-3-1:构造编码器模块。编码器模块主要由3D卷积操作堆叠而成,通过下采样方式,对输入的稳定和动态特征矩阵的串联矩阵进行特征提取,编码器输入特征为XEn=As1||As2||Ad,||是串联操作,编码器操作定义为:
Figure BDA0003673580430000042
其中,fA是激活函数,
Figure BDA0003673580430000043
Figure BDA0003673580430000044
分别是编码器操作的输入和输出,
Figure BDA0003673580430000045
是编码器待学习的参数。经过多次编码后,将编码器的最终输出定义为YEn
步骤3-3-2:构造自注意力机制。引入自注意力机制计算输入特征的每个位置的重要性,将自注意力机制操作定义为:XDe=(YEn)Tr·Atten(YEn),其中
Figure BDA0003673580430000046
Tr是转置操作,自注意力机制提取编码器的输出得到解码器的输入特征XDe
步骤3-3-3:构造解码器模块。解码器模块主要由2D反卷积堆叠而成,通过上采样方式,对输入的自注意力特征进行特征解码,解码器操作定义为:
Figure BDA0003673580430000051
Figure BDA0003673580430000052
Figure BDA0003673580430000053
分别是解码器操作的输入和输出,
Figure BDA0003673580430000054
是解码器待学习的参数。经过多次解码后,将解码器的最终输出定义为YDe
步骤3-4:解码器最终输出YDe即为稳定特征和动态特征矩阵融合而成的先验知识图矩阵Ak,其维度为[N,N]。
进一步,所述步骤4)中,构建先验知识时变图卷积网络,该网络由动态空间特征提取组件和动态长期时间特征提取组件组成,具体步骤如下:
步骤4-1:构造动态空间特征提取组件。采用图卷积操作作为空间特征提取组件,结合步骤3-4的先验知识图矩阵Ak计算空间特征输出,将改进后的图卷积操作定义为:Hl+1=f(Hl,A)=fA(AkHlWl),其中Hl和Hl+1分别是图卷积操作提取前后的道路特征值。提取数轮后,经过残差操作,动态空间特征输出YS
步骤4-2:构造动态长期时间特征提取组件,该组件分别由动态和长期时间特征提取组件组成,具体步骤为:
步骤4-2-1:构造动态时间特征提取组件;将交通流数据H按照不同时间间隔分为邻近序列和周期序列,其中邻近序列时间间隔为1小时,周期序列时间间隔为24小时,得到新的邻近序列Hpro和周期序列Hper;串联两种序列特征,利用3D卷积操作提取动态时间特征,输入特征为XDT=Hpro||Hper,操作定义为
Figure BDA0003673580430000055
Figure BDA0003673580430000056
Figure BDA0003673580430000057
分别是3D卷积操作的输入和输出,
Figure BDA0003673580430000058
是3D卷积核的待学习的参数,最终输出动态时间特征YDT
步骤4-2-2:构造长期时间特征提取组件。考虑传统的LSTM方法需要迭代数轮才能提取较为长期的时间特征,采用TCN中的膨胀卷积操作来提取长期时间特征,将膨胀卷积操作定义为
Figure BDA0003673580430000059
Figure BDA00036735804300000510
Figure BDA00036735804300000511
分别是膨胀卷积操作的输入和输出,
Figure BDA00036735804300000512
是膨胀卷积核的待学习的参数。与其他2D卷积不同,膨胀卷积中的卷积核膨胀率为2,以便采集更大范围的特征。最终输出长期时间特征提取组件YLT
步骤4-3:构建投影模块,用于连接不同组件的输出来映射最终预测值,将投影模块定义为:YP=WT*(YDT||YLT)+WSYS,其中WT和WS分别是动态空间特征提取组件和动态长期时间特征提取组件的权重,YDT和YLT分别是动态时间特征和长期时间特征的输出;
步骤4-4:确定总体网络架构,将步骤4-1到步骤4-3进行组合,得到先验知识时变图卷积网络。
进一步,所述步骤5)中,利用训练集训练先验知识时变图卷积网络,并用测试集测试模型的预测精度,具体步骤如下:
步骤5-1:初始化先验知识时变图卷积网络的网络权重、输入和输出维度、隐藏层层数、激活函数、步长、批处理大小和各层维度;
步骤5-2:利用训练集训练模型,确定评价函数为均方误差,在训练过程中实时更新模型中的权重;
步骤5-3:训练完成后,利用测试集测试模型,并展示模型的预测结果。
有益效果:本发明的交通流预测方法,该方法针对传统方法大多忽视了传感器节点之间的有效距离、数据关联和外部干扰等先验知识的影响,无法有效提取节点之间的关联特征以及很少考虑交通流的长期时间特征,导致预测模型很难有效捕获交通流的动态长期时间特征,本发明通过构建先验知识图矩阵有效提取节点的复杂关联特征,并利用动态长期时间特征有效反应交通流的时间特征,提高模型的预测精度。
本发明针对传统方法大多忽视了传感器节点之间的有效距离、数据关联和外部干扰等先验知识的影响,无法有效提取节点之间的关联特征。同时,传统方法往往很少考虑交通流的长期时间特征,导致预测模型很难有效捕获交通流的动态长期时间特征。为此,本发明根据交通传感器所处的位置和数据关联生成稳定特征矩阵,根据交通传感器所在的环境变量生成动态特征矩阵,利用编码器-解码器结合自注意力机制将稳定特征和动态特征矩阵融合为先验知识图矩阵;利用图卷积操作结合先验知识图矩阵提取交通流的动态空间特征;根据不同时间间隔分别构建周期序列和邻近序列,利用3D卷积操作提取动态时间特征,利用膨胀卷积操作提取长期时间特征;构建投影模块,用于连接动态空间特征、动态时间特征和长期时间特征的输出来映射最终预测值。本发明通过深入提取传感器节点的关联特征结合新颖的动态长期特征提取组件实现交通流时空特征的有效提取。
附图说明
图1为本发明的一种基于先验知识时变图卷积网络的交通流预测方法步骤示意图;
图2为本发明的一种基于先验知识时变图卷积网络的交通流预测方法流程图;
图3为本发明的一种基于先验知识时变图卷积网络的交通流预测方法模型结构图;
图4为本发明的一种基于先验知识时变图卷积网络的交通流预测方法模型训练迭代图;
图5为本发明的一种基于先验知识时变图卷积网络的交通流预测方法测试集真实数据和预测数据对比图。
具体实施方式
下面将结合说明书附图对本发明的技术方法做进一步的详细说明。
如图1-3所示,一种基于先验知识时变图卷积网络的交通流预测方法,包括如下步骤:
步骤1)收集高速公路或城市干线上交通传感器记录的交通流数据,传输至交通大数据集群;对采集的交通流数据进行数据预处理以降低冗余度;
所述步骤1中,采集布置在高速公路或城市干线上N个传感器的交通流数据。将每个传感器定义为Datan={idn,lonn,latn,timen,flown},n∈N,其中idn,lonn,latn,timen,flown分别是第n个传感器的序号、经度、纬度、记录时间和交通流数据(流量、速度或密度)。由于传感器自身硬件或外界环境的不稳定性,容易导致传感器记录的数据存在异常值或缺失值。其中,异常值数据采用3σ原则进行发现和剔除。对于时间跨度较小的缺失值,使用前后相邻一天的同一时间段的数据进行填充;对于时间跨度较大的缺失值,直接进行剔除。数据修复完成后,为了降低数据量纲的影响,对数据进行标准化处理,通过公式flow*=(flown-Mean(flow))/Std(flow)实现,其中Mean(flow)和Std(flow)分别是N个传感器记录的交通流的平均值和标准差,flow*是标准化后的交通流数据。
使用PEMS-BAY加州交通高速交通数据作为测试数据,有325个传感器共计六个月的数据(2017.1.1~2017.6.31)。采集的时间间隔为5分钟。
步骤2)根据交通传感器位置和预处理后的交通流数据生成交通图和特征矩阵,按照记录时间生成时间序列,将其划分为训练集和测试集;
所述步骤2中,根据传感器位置和交通流数据生成交通图和特征矩阵。使用图特征矩阵G=(V,H)来描述不同传感器之间的关系,其中,V={v1,v2,…,vn,…,vN}代表不同的传感器节点,H是={h1,h2,…,ht,…,hT},t∈T,代表每个传感器所记录的T时刻内的交通流数据,hn,t代表第n个传感器在t时刻的交通流数据,T是传感器记录的最后时间节点。因此可以构建图特征矩阵G如下:
Figure BDA0003673580430000081
其中,图特征矩阵G的行为特征数,即为1到T时刻的交通流数据,行为节点数,该矩阵维度为[N,T]。按照记录时间生成矩阵后,按照固定比例将数据集划分为训练集和测试集。
步骤3)根据交通传感器位置和预处理后的交通流数据关联生成稳定特征矩阵,根据交通传感器所在的环境变量生成动态特征矩阵,利用编码器-解码器结合自注意力机制将稳定特征矩阵和动态特征矩阵融合为先验知识图矩阵;
所述步骤3中,根据交通传感器所处的位置和数据关联生成稳定特征矩阵,根据交通传感器所在的环境变量生成动态特征矩阵,利用编码器-解码器结合自注意力机制将稳定特征和动态特征矩阵融合为先验知识图矩阵。具体步骤如下:
步骤3-1:构造稳定特征矩阵As,稳定特征矩阵由有效距离矩阵和节点关联矩阵组成,具体步骤如下:
步骤3-1-1:计算有效距离矩阵。根据交通传感器n的经纬度数据{lonn,latn}和交通传感器m的经纬度数据{lonm,latm},使用Haversine公式计算节点之间的物理距离,
Figure BDA0003673580430000082
其中,
Figure BDA0003673580430000083
R为地球半径,取平均值为6371千米,d为传感器m和n的物理距离,由此可以得到任意两个传感器之间的物理距离dmn。考虑到部分节点虽然直线距离最近,但是相互之间不存在直接联系,因此直线距离不能有效反应节点的相互作用。为此,建立任意两节点的可达关系判别式:
Figure BDA0003673580430000084
其中N为两个节点之间传感器数量。结合物理距离dmn和可达关系判别式pmn生成有效距离
Figure BDA0003673580430000085
根据任意两节点之间的有效距离生成有效距离矩阵As1
步骤3-1-2:计算节点关联矩阵。利用皮尔逊相关系数方法来计算节点间的关联系数,将皮尔逊相关系数方法定义为:
Figure BDA0003673580430000086
其中,Hm(t)和Hn(t)分别是传感器m和n在t时刻的特征,Std(Hm)和Std(Hn)分别是所选特征的标准差,Mean(Hm)和Mean(Hn)分别是所选特征的均值。根据任意两节点之间的关联系数生成节点关联矩阵As2
步骤3-2:构造动态特征矩阵Ad,动态特征矩阵主要由环境变量构成,环境变量主要包含天气、气候、特殊事件等。以天气情况为例,天气越好,人们的出行欲望越大;天气越恶劣,人们出行欲望越小。定义传感器m和n之间的环境度量emn,emn∈[0,1],将环境度量取值定义如表1所示:
表1不同天气对应的舒适度值
Figure BDA0003673580430000091
获取传感器m和n所在位置的天气数据{Weatherm}和{Weathern},根据表1计算传感器之间的环境度量emn。根据任意两节点之间的环境度量值生成动态特征矩阵Ad
步骤3-3:构造先验知识提取模块,主要由编码器解码器结合自注意力机制组成,具体步骤如下:
步骤3-3-1:构造编码器模块。编码器模块主要由3D卷积操作堆叠而成,通过下采样方式,对输入的稳定和动态特征矩阵的串联矩阵进行特征提取,编码器输入特征为XEn=As1||As2||Ad,||是串联操作,编码器操作定义为:
Figure BDA0003673580430000092
其中,fA是激活函数,
Figure BDA0003673580430000093
Figure BDA0003673580430000094
分别是编码器操作的输入和输出,
Figure BDA0003673580430000095
是编码器待学习的参数。经过多次编码后,将编码器的最终输出定义为YEn
步骤3-3-2:构造自注意力机制。引入自注意力机制计算输入特征的每个位置的重要性,将自注意力机制操作定义为:XDe=(YEn)Tr·Atten(YEn),其中
Figure BDA0003673580430000096
Tr是转置操作,自注意力机制提取编码器的输出得到解码器的输入特征XDe
步骤3-3-3:构造解码器模块。解码器模块主要由2D反卷积堆叠而成,通过上采样方式,对输入的自注意力特征进行特征解码,解码器操作定义为:
Figure BDA0003673580430000097
Figure BDA0003673580430000098
Figure BDA0003673580430000099
分别是解码器操作的输入和输出,
Figure BDA00036735804300000910
是解码器待学习的参数。经过多次解码后,将解码器的最终输出定义为YDe
步骤3-4:解码器最终输出YDe即为稳定特征和动态特征矩阵融合而成的先验知识图矩阵Ak,其维度为[N,N]。
步骤4)构建先验知识时变图卷积网络,该网络由动态空间特征提取组件和动态长期时间特征提取组件组成;
所述步骤4中,构建先验知识时变图卷积网络,该网络由动态空间特征提取组件和动态长期时间特征提取组件组成,具体步骤如下:
步骤4-1:构造动态空间特征提取组件。采用图卷积操作作为空间特征提取组件,结合步骤3-4的先验知识图矩阵Ak计算空间特征输出,将改进后的图卷积操作定义为:Hl+1=f(Hl,A)=fA(AkHlWl),其中Hl和Hl+1分别是图卷积操作提取前后的道路特征值。提取数轮后,经过残差操作,动态空间特征输出YS
步骤4-2:构造动态长期时间特征提取组件,该组件分别由动态和长期时间特征提取组件组成,具体步骤为:
步骤4-2-1:构造动态时间特征提取组件;将交通流数据H按照不同时间间隔分为邻近序列和周期序列,其中邻近序列时间间隔为1小时,周期序列时间间隔为24小时,得到新的邻近序列Hpro和周期序列Hper;串联两种序列特征,利用3D卷积操作提取动态时间特征,输入特征为XDT=Hpro||Hper,操作定义为
Figure BDA0003673580430000101
Figure BDA0003673580430000102
Figure BDA0003673580430000103
分别是3D卷积操作的输入和输出,
Figure BDA0003673580430000104
是3D卷积核的待学习的参数。最终输出动态时间特征YDT
步骤4-2-2:构造长期时间特征提取组件。考虑传统的LSTM方法需要迭代数轮才能提取较为长期的时间特征,采用TCN中的膨胀卷积操作来提取长期时间特征,将膨胀卷积操作定义为
Figure BDA0003673580430000105
Figure BDA0003673580430000106
Figure BDA0003673580430000107
分别是膨胀卷积操作的输入和输出,
Figure BDA0003673580430000108
是膨胀卷积核的待学习的参数。与其他2D卷积不同,膨胀卷积中的卷积核膨胀率为2,以便采集更大范围的特征。最终输出长期时间特征提取组件YLT
步骤4-3:构建投影模块,用于连接不同组件的输出来映射最终预测值,将投影模块定义为:YP=WT*(YDT||YLT)+WSYS,其中WT和WS分别是动态空间特征提取组件和动态长期时间特征提取组件的权重,YDT和YLT分别是动态时间特征和长期时间特征的输出;
步骤4-4:确定总体网络架构,将步骤4-1到步骤4-3进行组合,得到先验知识时变图卷积网络。
步骤5)利用训练集训练先验知识时变图卷积网络,并用测试集测试网络的预测精度。
所述步骤5中,利用训练集训练先验知识时变图卷积网络,并用测试集测试模型的预测精度,具体步骤如下:
步骤5-1:初始化先验知识时变图卷积网络的网络权重、输入和输出维度、隐藏层层数、激活函数、步长、批处理大小和各层维度;
步骤5-2:利用训练集训练模型,确定评价函数为均方误差(MSE),在训练过程中实时更新模型中的权重,如图5所示;
步骤5-3:训练完成后,利用测试集测试模型,并展示模型的预测结果,如图8所示。
本发明针对传统方法大多忽视了传感器节点之间的有效距离、数据关联和外部干扰等先验知识的影响,无法有效提取节点之间的关联特征。同时,传统方法往往很少考虑交通流的长期时间特征,导致预测模型很难有效捕获交通流的动态长期时间特征。为此,本发明根据交通传感器所处的位置和数据关联生成稳定特征矩阵,根据交通传感器所在的环境变量生成动态特征矩阵,利用编码器-解码器结合自注意力机制将稳定特征和动态特征矩阵融合为先验知识图矩阵;利用图卷积操作结合先验知识图矩阵提取交通流的动态空间特征;根据不同时间间隔分别构建周期序列和邻近序列,利用3D卷积操作提取动态时间特征,利用膨胀卷积操作提取长期时间特征;构建投影模块,用于连接动态空间特征、动态时间特征和长期时间特征的输出来映射最终预测值。本发明通过深入提取传感器节点的关联特征结合新颖的动态长期特征提取组件实现交通流时空特征的有效提取。
以上所述仅为本发明在交通干线或高速公路数据集下较好的实施方式,本发明保护范围并不以上述实施方式为限制,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修改和其他修饰变化,皆应纳入权利要求书记载的保护范围。

Claims (9)

1.一种基于先验知识时变图卷积网络的交通流预测方法,其特征在于:包括以下步骤:
步骤1)收集高速公路或城市干线上交通传感器记录的交通流数据,传输至交通大数据集群;对采集的交通流数据进行数据预处理以降低冗余度;
步骤2)根据交通传感器位置和预处理后的交通流数据生成交通图和特征矩阵,按照记录时间生成时间序列,将其划分为训练集和测试集;
步骤3)根据交通传感器位置和预处理后的交通流数据关联生成稳定特征矩阵,根据交通传感器所在的环境变量生成动态特征矩阵,利用编码器-解码器结合自注意力机制将稳定特征矩阵和动态特征矩阵融合为先验知识图矩阵;
步骤4)构建先验知识时变图卷积网络,该网络由动态空间特征提取组件和动态长期时间特征提取组件组成;
步骤5)利用训练集训练先验知识时变图卷积网络,并用测试集测试网络的预测精度。
2.根据权利要求1所述的一种基于先验知识时变图卷积网络的交通流预测方法,其特征在于:所述步骤1)中采集交通流数据及对交通流数据进行预处理的具体步骤为:采集布置在高速公路或城市干线上N个交通传感器的交通流数据,将每个交通传感器定义为Datan={idn,lonn,latn,timen,flown},n∈N,其中idn,lonn,latn,timen,flown分别是第n个传感器的序号、经度、纬度、记录时间和交通流数据;异常值数据采用3σ原则进行发现和剔除;对于时间跨度小的缺失值,使用前后相邻一天的同一时间段的数据进行填充;对于时间跨度大的缺失值,直接进行剔除;然后对交通流数据进行标准化处理,通过公式flow*=(flown-Mean(flow))/Std(flow)实现,其中Mean(flow)和Std(flow)分别是N个交通传感器记录的交通流的平均值和标准差,flow*是标准化后的交通流数据。
3.根据权利要求1所述的一种基于先验知识时变图卷积网络的交通流预测方法,其特征在于:所述步骤2)的具体步骤包括:使用图特征矩阵G=(V,H)来描述不同交通传感器之间的关系,其中,V={v1,v2,…,vn,…,vN}代表不同的传感器节点,H是={h1,h2,…,ht,…,hT},t∈T,代表每个交通传感器所记录的T时刻内的交通流数据,hn,t代表第n个交通传感器在t时刻的交通流数据,T是传感器记录的最后时间节点;因此构建图特征矩阵G如下:
Figure FDA0003673580420000021
其中,图特征矩阵G的行为特征数,即为1到T时刻的交通流数据,行为节点数,该矩阵维度为[N,T];按照记录时间生成矩阵后,按照固定比例将数据集划分为训练集和测试集。
4.根据权利要求1所述的一种基于先验知识时变图卷积网络的交通流预测方法,其特征在于:所述步骤3)中稳定特征矩阵由有效距离矩阵和节点关联矩阵组成,生成该矩阵的具体步骤如下:
步骤1-1:计算有效距离矩阵;根据交通传感器n的经纬度数据{lonn,latn}和交通传感器m的经纬度数据{lonm,latm},使用Haversine公式计算节点之间的物理距离,
Figure FDA0003673580420000022
其中,
Figure FDA0003673580420000023
R为地球半径,d为传感器m和n的物理距离,由此得到任意两个传感器之间的物理距离dmn;建立任意两节点的可达关系判别式:
Figure FDA0003673580420000024
其中N为两个节点之间传感器数量;结合物理距离dmn和可达关系判别式pmn生成有效距离
Figure FDA0003673580420000025
根据任意两节点之间的有效距离生成有效距离矩阵As1
步骤1-2:计算节点关联矩阵;利用皮尔逊相关系数方法来计算节点间的关联系数,将皮尔逊相关系数方法定义为:
Figure FDA0003673580420000026
其中,Hm(t)和Hn(t)分别是交通传感器m和n在t时刻的特征,Std(Hm)和Std(Hn)分别是所选特征的标准差,Mean(Hm)和Mean(Hn)分别是所选特征的均值;根据任意两节点之间的关联系数生成节点关联矩阵As2
5.根据权利要求1所述的一种基于先验知识时变图卷积网络的交通流预测方法,其特征在于:所述步骤3)中动态特征矩阵由环境变量构成,生成该矩阵的具体步骤如下:定义交通传感器m和n之间的环境度量emn,emn∈[0,1],将环境度量取值定义如表1所示:
表1不同天气对应的舒适度值
Figure FDA0003673580420000031
获取交通传感器m和n所在位置的天气数据{Weatherm}和{Weathern},根据表1计算传感器之间的环境度量emn;根据任意两节点之间的环境度量值生成动态特征矩阵Ad
6.根据权利要求4所述的一种基于先验知识时变图卷积网络的交通流预测方法,其特征在于:所述步骤3)中利用编码器-解码器结合自注意力机制将稳定特征矩阵和动态特征矩阵融合为先验知识图矩阵的具体步骤包括:
步骤2-1:构造编码器模块;编码器模块由3D卷积操作堆叠而成,通过下采样方式,对输入的稳定和动态特征矩阵的串联矩阵进行特征提取,编码器输入特征为XEn=As1||As2||Ad,||是串联操作,Ad为动态特征矩阵,编码器操作定义为:
Figure FDA0003673580420000032
其中,fA是激活函数,
Figure FDA0003673580420000033
Figure FDA0003673580420000034
分别是编码器操作的输入和输出,
Figure FDA0003673580420000035
是编码器待学习的参数;经过多次编码后,将编码器的最终输出定义为YEn
步骤2-2:构造自注意力机制;引入自注意力机制计算输入特征的每个位置的重要性,将自注意力机制操作定义为:XDe=(YEn)Tr·Atten(YEn),其中
Figure FDA0003673580420000036
Tr是转置操作,自注意力机制提取编码器的输出得到解码器的输入特征XDe
步骤2-3:构造解码器模块;解码器模块由2D反卷积堆叠而成,通过上采样方式,对输入的自注意力特征进行特征解码,解码器操作定义为:
Figure FDA0003673580420000037
Figure FDA0003673580420000038
Figure FDA0003673580420000039
分别是解码器操作的输入和输出,
Figure FDA00036735804200000310
是解码器待学习的参数;经过多次解码后,将解码器的最终输出定义为YDe
步骤2-4:解码器最终输出YDe即为稳定特征和动态特征矩阵融合而成的先验知识图矩阵Ak,其维度为[N,N]。
7.根据权利要求1所述的一种基于先验知识时变图卷积网络的交通流预测方法,其特征在于:所述步骤4)的具体步骤如下:
步骤3-1:构造动态空间特征提取组件;采用图卷积操作作为空间特征提取组件,结合先验知识图矩阵Ak计算空间特征输出,将改进后的图卷积操作定义为:Hl+1=f(Hl,A)=fA(AkHlWl),其中Hl和Hl+1分别是图卷积操作提取前后的道路特征值;提取数轮后,经过残差操作,动态空间特征输出YS
步骤3-2:构造动态长期时间特征提取组件,该组件分别由动态和长期时间特征提取组件组成;
步骤3-3:构建投影模块,用于连接不同组件的输出来映射最终预测值,将投影模块定义为:YP=WT*(YDT||YLT)+WSYS,其中WT和WS分别是动态空间特征提取组件和动态长期时间特征提取组件的权重,YDT和YLT分别是动态时间特征和长期时间特征的输出;
步骤3-4:确定总体网络架构,将步骤3-1到步骤3-3进行组合,得到先验知识时变图卷积网络。
8.根据权利要求7所述的一种基于先验知识时变图卷积网络的交通流预测方法,其特征在于:步骤3-2的具体步骤包括:
步骤4-1:构造动态时间特征提取组件;将交通流数据H按照不同时间间隔分为邻近序列和周期序列,其中邻近序列时间间隔为1小时,周期序列时间间隔为24小时,得到新的邻近序列Hpro和周期序列Hper;串联两种序列特征,利用3D卷积操作提取动态时间特征,输入特征为XDT=Hpro||Hper,操作定义为
Figure FDA0003673580420000041
Figure FDA0003673580420000042
Figure FDA0003673580420000043
分别是3D卷积操作的输入和输出,
Figure FDA0003673580420000044
是3D卷积核的待学习的参数,最终输出动态时间特征YDT
步骤4-2:构造长期时间特征提取组件;采用TCN中的膨胀卷积操作来提取长期时间特征,将膨胀卷积操作定义为
Figure FDA0003673580420000045
Figure FDA0003673580420000046
Figure FDA0003673580420000047
分别是膨胀卷积操作的输入和输出,
Figure FDA0003673580420000048
是膨胀卷积核的待学习的参数;最终输出长期时间特征提取组件YLT
9.根据权利要求书所述的一种基于先验知识时变图卷积网络的交通流预测方法,其特征在于:所述步骤5的具体步骤如下:
步骤5-1:初始化先验知识时变图卷积网络的网络权重、输入和输出维度、隐藏层层数、激活函数、步长、批处理大小和各层维度;
步骤5-2:利用训练集训练模型,确定评价函数为均方误差,在训练过程中实时更新模型中的权重;
步骤5-3:训练完成后,利用测试集测试模型,并展示模型的预测结果。
CN202210616802.XA 2022-06-01 2022-06-01 一种基于先验知识时变图卷积网络的交通流预测方法 Active CN114913689B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210616802.XA CN114913689B (zh) 2022-06-01 2022-06-01 一种基于先验知识时变图卷积网络的交通流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210616802.XA CN114913689B (zh) 2022-06-01 2022-06-01 一种基于先验知识时变图卷积网络的交通流预测方法

Publications (2)

Publication Number Publication Date
CN114913689A true CN114913689A (zh) 2022-08-16
CN114913689B CN114913689B (zh) 2023-06-16

Family

ID=82771229

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210616802.XA Active CN114913689B (zh) 2022-06-01 2022-06-01 一种基于先验知识时变图卷积网络的交通流预测方法

Country Status (1)

Country Link
CN (1) CN114913689B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115985098A (zh) * 2022-12-29 2023-04-18 中国科学院合肥物质科学研究院 基于自注意力机制和循环图卷积网络的交通流预测方法
CN116580564A (zh) * 2023-07-12 2023-08-11 北京赛目科技股份有限公司 一种交通流预测方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966853A (zh) * 2021-02-04 2021-06-15 南通大学 基于时空残差混合模型的城市路网短时交通流预测方法
US20210209939A1 (en) * 2020-12-08 2021-07-08 Harbin Engineering University Large-scale real-time traffic flow prediction method based on fuzzy logic and deep LSTM
CN113313947A (zh) * 2021-05-31 2021-08-27 湖南大学 短期交通预测图卷积网络的路况评估方法
CN113327417A (zh) * 2021-05-28 2021-08-31 南通大学 基于3d动态时空残差卷积关联网络的交通流预测方法
CN113822460A (zh) * 2021-06-23 2021-12-21 腾讯科技(深圳)有限公司 一种交通流量预测方法、装置、电子设备和存储介质
CN114511154A (zh) * 2022-02-22 2022-05-17 南通大学 一种基于时空复杂图卷积网络的交通流预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210209939A1 (en) * 2020-12-08 2021-07-08 Harbin Engineering University Large-scale real-time traffic flow prediction method based on fuzzy logic and deep LSTM
CN112966853A (zh) * 2021-02-04 2021-06-15 南通大学 基于时空残差混合模型的城市路网短时交通流预测方法
CN113327417A (zh) * 2021-05-28 2021-08-31 南通大学 基于3d动态时空残差卷积关联网络的交通流预测方法
CN113313947A (zh) * 2021-05-31 2021-08-27 湖南大学 短期交通预测图卷积网络的路况评估方法
CN113822460A (zh) * 2021-06-23 2021-12-21 腾讯科技(深圳)有限公司 一种交通流量预测方法、装置、电子设备和存储介质
CN114511154A (zh) * 2022-02-22 2022-05-17 南通大学 一种基于时空复杂图卷积网络的交通流预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
丁新宇等: "基于深度时空残差网络的路网短时交通流预测", 《计算机工程与设计》 *
包银鑫等: "基于改进时空残差卷积神经网络的城市路网短时交通流预测", 《计算机应用》 *
戴俊明等: "基于多时空图卷积网络的交通流预测", 《计算机应用研究》 *
李志帅等: "基于图卷积神经网络和注意力机制的短时交通流量预测", 《交通工程》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115985098A (zh) * 2022-12-29 2023-04-18 中国科学院合肥物质科学研究院 基于自注意力机制和循环图卷积网络的交通流预测方法
CN115985098B (zh) * 2022-12-29 2023-08-29 中国科学院合肥物质科学研究院 基于自注意力机制和循环图卷积网络的交通流预测方法
CN116580564A (zh) * 2023-07-12 2023-08-11 北京赛目科技股份有限公司 一种交通流预测方法及装置
CN116580564B (zh) * 2023-07-12 2023-09-15 北京赛目科技股份有限公司 一种交通流预测方法及装置

Also Published As

Publication number Publication date
CN114913689B (zh) 2023-06-16

Similar Documents

Publication Publication Date Title
CN110264709B (zh) 基于图卷积网络的道路的交通流量的预测方法
CN107767659B (zh) 基于arima模型的共享单车吸引量和发生量预测方法
CN114913689A (zh) 一种基于先验知识时变图卷积网络的交通流预测方法
CN109409499B (zh) 一种基于深度学习和卡尔曼滤波修正的轨迹恢复方法
CN110163439A (zh) 一种基于注意力机制的城市规模出租车轨迹预测方法
CN112966853B (zh) 基于时空残差混合模型的城市路网短时交通流预测方法
CN112069573B (zh) 一种基于元胞自动机的城市群空间模拟方法、系统及设备
CN113792929B (zh) 交通流量预测方法、电子设备及存储介质
CN107845261B (zh) 一种基于张量融合交通信息的汽车全局工况动态重构方法
CN110738855B (zh) 一种数据稀疏时间段的道路交通流状况预测方法
Yang et al. Markov chain-based approach of the driving cycle development for electric vehicle application
CN111461426A (zh) 一种基于深度学习的高精度行程时长预测方法
CN116187591B (zh) 基于动态时空趋势的商业停车场剩余车位数量预测方法
CN114881356A (zh) 基于粒子群算法优化bp神经网络的城市交通碳排预测方法
CN112633602B (zh) 一种基于gis地图信息的交通拥堵指数预测方法及装置
CN116049668A (zh) 一种基于机器学习的自动驾驶事故严重程度预测方法
CN111554118A (zh) 一种公交车到站时间的动态预测方法及系统
CN115099328A (zh) 基于对抗网络的交通流量预测方法、系统、设备及存储介质
CN114511154A (zh) 一种基于时空复杂图卷积网络的交通流预测方法
CN114202120A (zh) 一种针对多源异构数据的城市交通行程时间预测方法
CN113327417B (zh) 基于3d动态时空残差卷积关联网络的交通流预测方法
CN115828121A (zh) 基于邻接dbscan融合时变多图卷积网络的交通流预测方法
CN113744541B (zh) 对抗图卷积网络的路网排放缺失时空分布重构方法及系统
CN115985104A (zh) 一种交通流量预测装置、预测方法及预测模型构建方法
CN113127591B (zh) 一种基于Transformer和LSTM的位置预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant