CN113570861B - 一种基于合成数据的交通流量预测方法及装置 - Google Patents
一种基于合成数据的交通流量预测方法及装置 Download PDFInfo
- Publication number
- CN113570861B CN113570861B CN202110845180.3A CN202110845180A CN113570861B CN 113570861 B CN113570861 B CN 113570861B CN 202110845180 A CN202110845180 A CN 202110845180A CN 113570861 B CN113570861 B CN 113570861B
- Authority
- CN
- China
- Prior art keywords
- data
- traffic
- sensors
- traffic flow
- real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 27
- 230000004927 fusion Effects 0.000 claims description 11
- 239000002131 composite material Substances 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims description 6
- 230000010354 integration Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000003042 antagnostic effect Effects 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000013256 Gubra-Amylin NASH model Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Human Resources & Organizations (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于合成数据的交通流量预测方法及装置,针对每一个簇采用该簇传感器的真实交通数据,训练出一个对应的时空依赖性生成对抗网络,利用交通速度和占用率来构造潜在变量以生成合成交通数据,并将合成交通数据与真实交通数据进行结合得到输入数据,然后采用卷积神经网络提取时间特征,将提取的节点特征输入到多图卷积神经网络,以得到预测结果。本发明技术方案能够对交通流量进行准确的预测,且其性能优于现有的最先进的模型。
Description
技术领域
本申请属于交通流量预测技术领域,尤其涉及一种基于合成数据的交通流量预测方法及装置。
背景技术
交通流量预测是智能交通系统的重要组成部分,旨在根据历史的交通流量来预测未来的交通流量,从而为交通管理人员和出行者提供准确及时的交通信息。通过提前了解交通信息,交通管理者可以实施相应的交通管理措施,以防止交通拥堵。出行者也可以提前规划或调整出行路线。然而,由于交通网络具有复杂的拓扑结构且交通流量具有不稳定的变化模式,准确可靠的交通流量预测一直是一个重大的挑战。
随着可用数据量和计算能力的指数级增长,包括传统机器学习和深度学习在内的数据驱动方法在各个领域得到了迅速发展,它们在特征提取方面的有效性在许多工作中得到了证明。在交通领域,与传统的机器学习方法(如支持向量机和K最近邻算法)相比,深度学习方法能够更有效地处理高维数据,自动获取复杂和抽象的特征,因此它更适合于解决交通预测问题。
近十年来,许多深度学习方法在交通预测领域得到了广泛的应用,并在预测精度上取得了较为满意的结果。其中,两种主流模型引起了广泛的关注:卷积神经网络(CNN)和图卷积神经网络(GCN)。使用CNN和GCN已经成为近年来研究的热点,因为它们可以通过卷积运算自动高效地捕获空间信息。由于CNN擅长处理欧几里得数据,因此基于CNN的模型通常将交通网络视为一幅图像或许多的网格,从而忽略了交通网络的非欧几里得特性。由于GCN具有出色的处理非欧几里得数据的能力,因此可被应用于解决这一问题。具体来说,基于GCN的模型将交通网络看作一个图结构,其中节点和边分别表示传感器以及传感器之间的相关性。基于以上表示,GCN模型能够获得比CNN模型更好的预测结果,因为它们不仅能够充分地利用交通网络的非欧几里得结构,而且能够有效地编码传感器之间的异质关联性。
虽然深度学习方法可以获得较好的预测结果,但仍存在一些缺陷。首先,以往的大部分研究都忽略了交通流量的隐性变化模式,难以对交通流量的时空依赖性进行全面的建模。其次,大多数研究都是构建表征能力有限的简单图,忽略了传感器之间隐藏的异质相关性,这可能会限制图卷积神经网络提取深层次非欧几里得空间特征的能力。
发明内容
本申请的目的是提供一种基于合成数据的交通流量预测方法及装置,以克服现有技术忽略了交通流量的隐性变化模式、忽略了传感器之间隐藏的异质相关性的问题。
为了实现上述目的,本申请技术方案如下:
一种基于合成数据的交通流量预测方法,包括:
将交通网络中所有传感器分类为多个簇,针对每一个簇采用该簇传感器的真实交通数据,训练出一个对应的时空依赖性生成对抗网络;
将真实交通数据根据传感器对应的簇输入到训练好的时空依赖性生成对抗网络,生成合成交通数据,并将合成交通数据与真实交通数据进行结合得到输入数据;
将输入数据输入到传感器对应的卷积神经网络中,提取每个传感器的时间特征,并将所有传感器的时间特征展平并连接为节点特征矩阵;
将节点特征矩阵输入到带有距离图、真实流量关联图和合成流量关联图的图卷积神经网络,提取空间特征,并连接提取的空间特征得到高层次空间特征;
将高层次空间特征输入到带有融合图的图卷积神经网络得到预测结果。
进一步的,所述时空依赖性生成对抗网络,包括一个基本生成对抗网络GAN,所述基本生成对抗网络GAN的生成器输入的潜在变量为真实交通速度和占用率,所述基本生成对抗网络GAN的鉴别器的输入为真实交通流量数据和合成交通数据。
进一步的,所述将输入数据输入到传感器对应的卷积神经网络中,提取每个传感器的时间特征,包括:
将输入数据根据传感器的数量N切成N个切片,每个切片对应着一个传感器;
在每个切片上应用两个CNN层来学习每个传感器的时间特征。
进一步的,所述距离图用于表示传感器的地理位置,用ADG表示;所述真实流量关联图用于表示真实交通数据对应的传感器之间的灰色关联度,用ARG表示;所述合成流量关联图用于表示合成交通数据对应的传感器之间的灰色关联度,用ASG表示,其中:
所述距离图ADG的加权邻接矩阵表示为:
其中σDis表示距离的标准差,ε表示阈值,Disx,y表示传感器x和y之间的距离;
所述真实流量关联图ARG的加权邻接矩阵表示为:
所述合成流量关联图ASG的加权邻接矩阵表示为:
进一步的,所述融合图由距离图、真实流量关联图和合成流量关联图加权整合而成,用AFG表示,所述融合图AFG的加权邻接矩阵表示为:
其中α、β和η分别表示三种权重系数,ε表示阈值。
本申请还提出了一种基于合成数据的交通流量预测装置,包括处理器以及存储有若干计算机指令的存储器,所述计算机指令被处理器执行时实现所述基于合成数据的交通流量预测方法的步骤。
本申请提出的一种基于合成数据的交通流量预测方法及装置,提出了一种新的深度学习模型以提高交通流量预测的准确度。首先,提出了一种新的时空依赖性生成对抗网络,它能够利用交通速度和占用率来构造潜在变量(生成对抗网络中生成器的输入)以生成合成数据(合成交通流量),从而帮助模型捕获交通流量的隐性变化模式。此外,为了实现深层次非欧几里得空间特征的有效提取,提出了一种新的多图卷积神经网络,从多个角度对传感器之间的异质相关性进行探索和建模。最终,在两组真实数据集上的实验结果表明,本申请所提出的模型能够对交通流量进行准确的预测,且其性能优于现有的最先进的模型。
附图说明
图1为本申请基于合成数据的交通流量预测方法流程图;
图2为生成对抗网络GAN示意图;
图3为本申请整体网络模型示意图;
图4为在两组数据集上不同模型的预测交通流量和真实交通流量对比图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请提供的一种基于合成数据的交通流量预测方法,用于对交通流量进行预测。交通流量预测旨在根据交通网络中N个传感器的历史观测交通状态(如交通流量、速度和占用率)来预测未来的交通流量。本申请将交通网络定义为一个加权无向图G=(V,E,A),其中V代表一组节点;E代表节点之间的连通性;代表一个加权邻接矩阵,用来表示节点之间的接近程度;N代表传感器的数量。在时间点t,G上所有节点的交通状态可以表示为一个图信号其中R代表每个节点的特征维数。基于这些表示,交通流量预测问题可以看作是学习一个函数f,它能够将T个历史时间点的图信号映射为T′个未来时间点的图信号,如公式(1)所示:
[Xt+1,Xt+2,...,Xt+T′]=f([Xt-T+1,Xt-T+2,...,Xt];G) (1)
本申请提供了一种时空多图卷积神经网络模型,来对交通流量进行预测,时空多图卷积神经网络模型包括三个部分:时空依赖性生成对抗网络、传感器卷积神经网络和多图卷积神经网络。
本申请的一个实施例,如图1所示,提供了一种基于合成数据的交通流量预测方法,包括:
步骤S1、将交通网络中所有传感器分类为多个簇,针对每一个簇采用该簇传感器的真实交通数据,训练出一个对应的时空依赖性生成对抗网络。
生成对抗网络GAN是一种有效的生成工具,它可以通过模拟真实数据的分布来生成逼真的合成数据。如图2所示,GAN的架构由两个相互对抗的组件构成,称为生成器(G)和鉴别器(D)。目前大多数基于GAN的模型生成的合成数据没有时空相关性(如图像、视频和文本),因此潜在变量(GAN中生成器的输入)大多是元素相互独立的随机变量,显然不适用于生成合成的交通流量数据,因为交通数据具有很强的时空依赖性,而这些依赖性可能会被由随机向量构造的潜在变量所破坏。关于GAN的详细描述这里不再赘述。
本实施例提出了一种新的时空依赖性生成对抗网络(STDGAN)来生成高质量的合成交通流量数据,如图3所示,包括一个基本生成对抗网络GAN。与GAN不同的是,STDGAN利用交通速度和占用率来构造潜在变量,通过将给定传感器在给定日期的真实交通速度和占用率输入到生成器中,就可以得到给定传感器在给定日期的合成交通流量数据。鉴别器的输入为真实交通流量数据和合成交通数据。对于STDGAN的训练,也就是采用本申请构造的潜在变量对GAN进行训练。交通速度和占用率都具有时空依赖性,并且可以提供交通流量中未包含的一些其它交通信息。通过这种方式,生成的合成交通流量数据将包含时空依赖性以及更多的交通信息,从而有助于模型捕获交通流量的隐性变化模式。本实施例利用真实的交通流量、速度和占用率对STDGAN模型进行训练,然后生成高质量的合成交通流量数据来支持交通预测。
由于不同传感器记录的交通流量通常具有不同的变化模式,GAN对数据非常敏感,交通流量的各种变化模式可能会使GAN模型的训练变得困难,从而导致GAN模型性能不佳。因此,使用所有传感器的交通流量来训练单一的STDGAN模型是不合适的。为了解决这一问题,本申请根据所有传感器的历史交通流量模式将它们划分为不同的簇,然后为每个簇训练相应的STDGAN模型。这使得每个STDGAN模型都能聚焦于对应簇的变化模式,从而增强STDGAN模型的训练稳定性。
本实施例将交通网络中所有传感器分类为多个簇,即将N个传感器分为K个簇。分类方法可以采用K-means算法,或其他分类方法。
采用K-means算法将所有传感器划分为K个簇并采用肘部法来合理地确定最优的K值,因为肘部法可以有效地利用所有传感器记录的历史交通流量数据。在某一个簇中,和分别表示真实的交通流量、速度和占用率,其中S表示该簇中传感器的个数,L表示时间点的总数。
然后,将RV、RS和RO进一步划分为以天为单位的样本。RVs h={rv1,rv2,...,rvM}(1≤h≤H,1≤s≤S)表示给定传感器s在给定日期h的真实交通流量样本,表示给定传感器s在给定日期h的真实交通速度样本,表示给定传感器s在给定日期h的真实交通占用率样本,其中M表示一天中时间点的数量,H表示总天数,rvm(1≤m≤M)、rsm(1≤m≤M)和rom(1≤m≤M)分别表示第m个真实交通流量值、真实交通速度值和真实交通占用率值。此外,为了使潜在变量与GAN中生成器的输入形式一致,和被合并在一起来构建真实的交通速度占用率样本rsom′(1≤m′≤2M)表示第m′个真实交通速度占用率值。
本实施例时空依赖性生成对抗网络(STDGAN),鉴别器的输入为真实交通流量数据转换后的真实交通流量图像,即需要将真实交通流量样本图像化,将时间序列转换为图像可以增强模型的特征提取能力。将时间序列编码为图像的方法,分别是格拉姆角求和场(GASF)和格拉姆角求差场(GADF)。与GADF相比,GASF的主对角线可以直接用于重构时间序列,能够有效降低计算成本,提高模型效率。因此本申请采用了GASF。GASF可以将真实交通流量样本(时间序列数据)编码为图像,同时保留真实交通流量样本中的时间依赖性特征,这有利于获得高质量的合成交通流量图像。关于GASF的详细描述这里不再赘述,通过使用GASF将每个真实交通流量样本RVs h编码为真实交通流量图像最终可以得到所有的真实交通流量图像并表示为输入到生成对抗网络(GAN)中生成合成交通流量图像,再还原为合成交通流量样本。
假设pRSO和分别表示真实交通速度占用率样本的分布和真实交通流量图像的分布。G从pRSO接收潜在变量z来生成合成交通流量图像G(z)。D接收来自的真实交通流量图像和合成交通流量图像G(z),并尝试对它们进行区分。训练G和D的过程类似于一个二元极小极大博弈,G试图欺骗D,而D试图在真实数据和合成数据之间做出正确的判断。D和G的损失函数如公式(2)和(3)所示,GAN的值函数V(D,G)如公式(4)所示:
在训练过程中,训练目标是最大化D的损失函数值,最小化G的损失函数值。通过交替训练D和G,使得G生成的合成交通流量图像的分布可以收敛到真实交通流量图像的分布。
步骤S2、将真实交通数据根据传感器对应的簇输入到训练好的时空依赖性生成对抗网络,生成合成交通数据,并将合成交通数据与真实交通数据进行结合得到输入数据。
将来自K个簇的所有合成交通流量样本进行整合,形成完整的合成交通流量数据然后,将得到的真实交通流量数据RV和合成交通流量数据SV进行结合,以构建用于后续流程的输入数据PD的构建过程由公式(5)、(6)和(7)来表示:
其中,rvn,l和svn,l分别表示传感器n在l时刻的真实交通流量和合成交通流量。
步骤S3、将输入数据输入到传感器对应的卷积神经网络中,提取每个传感器的时间特征,并将所有传感器的时间特征展平并连接为节点特征矩阵。
假设表示来自PD的输入数据样本,其中T表示历史时间点的长度。输入数据样本被分成N个切片每个切片对应着一个传感器。然后,在每个切片上应用两个CNN层来学习每个传感器的时间特征。也就是说,本申请每个传感器对应两个CNN层,构建为整个卷积神经网络。最后将所有传感器提取到的时间特征展平并连接,以构建节点特征矩阵其中LT表示特征的维度。构建NFM的整个计算过程如公式(8)和(9)所示:
tfn=ReLU(ReLU(Slin⊙Γ+b1)⊙Γ+b2),n=1,2,...,N (8)
NFM=[Flat(tf1),Flat(tf2),...,Flat(tfN)] (9)
其中⊙表示点积,Γ表示一维卷积核,ReLU表示一种激活函数,tfn表示传感器n的时间特征,Flat()表示展平操作,b1和b2表示偏置项。
步骤S4、将节点特征矩阵输入到带有距离图、真实流量关联图和合成流量关联图的图卷积神经网络,提取空间特征,并连接提取的空间特征得到高层次空间特征。
为了对建模传感器之间的异质相关性进行全面建模以提取深层次的非欧几里得空间特征,本申请提出了一种新的多图卷积神经网络MGCN,如图3所示,总共生成了四个不同的图:距离图、真实流量关联图、合成流量关联图和一个融合图。
其中,使用传感器的地理位置来生成距离图。在交通网络中,相邻的两个传感器可能具有很高的相似性。因此本实施例使用传感器的地理位置来生成距离图,并利用基于阈值的高斯核算法得到距离图ADG的加权邻接矩阵,如公式(10)所示:
其中σDis表示距离的标准差,ε表示阈值,Disx,y表示传感器x和y之间的距离。
使用真实交通流量和合成交通流量来分别生成真实流量关联图和合成流量关联图。共享相似交通流量模式的两个传感器可能具有较高的相似性,因此,本实施例使用真实交通流量和合成交通流量来分别生成真实流量关联图和合成流量关联图。真实流量关联图ARG和合成流量关联图ASG的加权邻接矩阵可以使用灰色关联分析获得,如公式(11)和(12)所示:
融合图是通过整合上述的三个图得到的,它能够帮助GCN对传感器之间隐藏的异质相关性进行建模。融合图AFG的加权邻接矩阵的计算过程如公式(13)所示:
其中α、β和η分别表示三种权重系数,ε表示阈值。
本实施例在节点特征矩阵NFM上分别应用带有三个不同图的GCN(对应加权邻接矩阵ADG、ARG和ASG)来提取空间特征。然后,将这些空间特征连接起来以构建高层次空间特征。
步骤S5、将高层次空间特征输入到带有融合图的图卷积神经网络得到预测结果。
最后,在所得到的高层次空间特征上应用带有融合图的另一个GCN(对应加权邻接矩阵AFG),以进一步建模传感器之间的空间依赖性,因为融合图中隐藏的关联信息有助于GCN提取深层次的非欧几里得空间特征。本实施例采用频谱公式来实现GCN,有利于降低计算成本和提取高质量的特征。
其中,F(q)、W(q)和LM(q)分别表示第q层的隐藏特征,权重参数和图拉普拉斯矩阵。U表示第一层的输入特征,ReLU表示一种激活函数。关于GCN,已经是比较成熟的技术,这里不再赘述。
本申请采用真实交通数据先训练好每个簇对应的时空依赖性生成对抗网络,然后将真实交通数据根据传感器对应的簇输入到训练好的时空依赖性生成对抗网络,生成合成交通数据样本,并将合成交通数据样本与真实交通数据样本进行结合得到输入数据训练样本,最后通过步骤S3-5训练好后续的传感器卷积神经网络和多图卷积神经网络,从而完成整个网络模型的训练。之后,采用步骤S2-5,将T个历史时间点的真实交通数据输入到训练好的模型中,即可预测出T′个未来时间点的交通流量。
本申请还提供了采用两组真实交通数据集PeMSD4和PeMSD7来评估技术方案的性能。PeMSD4数据集包含来自旧金山湾区205个传感器的交通数据,该数据的收集时间为2017年6月1日至2017年6月30日。PeMSD7数据集包含来自洛杉矶县101个传感器的交通数据,该数据的收集时间为2017年6月1日至2017年7月31日。这两组数据集中交通数据的采样间隔为5分钟,这意味着每个传感器每天包含288个时间点。
采用三种常用的统计指标:平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)来评估不同模型的性能。
在STDGAN的训练过程中,采用学习率为0.0002的Adam优化器,训练代数设置为150,批量大小设置为32。除此之外,对于MGCN和其它基线模型,均采用学习率为0.001的Adam优化器,并将训练代数设置为50,批量大小设置为64,且采用早停法来防止模型过拟合。
对于每个传感器,使用两个一维卷积层来提取时间特征。每个卷积层中的滤波器数量为64,滤波器长度为3,激活函数为ReLU。
带有距离图的GCN、带有真实流量关联图的GCN和带有合成流量关联图的GCN都包含三个图卷积层,每层包含256个滤波器。带有融合图的GCN包含一个图卷积层,该层中滤波器的个数等于预测范围的长度。α、β和η都设置为1/3。ε设置为0.5。每个图卷积层中的激活函数为ReLU。
为了进一步说明本申请技术方案预测准确性,将申请模型(MGCN-SD)与现有技术中的GCN、STGCN、DCRNN模型的预测结果通过可视化的方法呈现在图4中。图4(a)显示了传感器#400464在2017年6月27日的预测值和真实值。图4(b)显示了传感器#717595在2017年7月23日的预测值和真实值。可以看出,相比于GCN、STGCN和DCRNN,本申请能更加准确地捕获交通流量的波动趋势,特别是在高峰时段(例如8:00和17:00)。此外,与其它三种模型相比,当交通流量波动频繁时,本申请模型的预测结果更为平滑和稳定。因此,可以得出结论,本申请所提出的MGCN-SD模型能更有效地捕获复杂的交通流量模式,能够取得更好的预测结果。
本申请提出了一种新的深度学习模型,即基于合成数据的时空多图卷积神经网络模型(MGCN-SD),以实现准确、稳定的交通流量预测。本申请的主要贡献分为以下四点:
(1)提出了一种新的深度学习模型以全面捕获交通流量的时空依赖性。具体而言,该模型不仅能有效识别交通流量的隐性变化模式,而且能对传感器之间的异质相关性(特别是隐藏的异质相关性)进行全面的探索和建模。
(2)提出了一种新的时空依赖性生成对抗网络(STDGAN),以生成高质量的合成交通流量数据,从而帮助模型捕获交通流量的隐性变化模式。现有的生成对抗网络(GAN)模型大都使用随机向量来构造潜在变量(GAN中生成器的输入),而STDGAN则是利用交通速度和占用率来构造潜在变量,因此其生成的合成交通流量数据不仅具有时空依赖性,而且包含了更多的交通信息。
(3)提出了一种新的多图卷积神经网络(MGCN),从多个角度对传感器间之间的异质相关性进行建模。具体而言,首先构建了三个带有不同图的GCN,以针对传感器之间的异质相关性进行初次建模。然后,将这三个不同的图整合成一个融合图,并利用该融合图和一个新的GCN来针对传感器之间隐藏的异质相关性进行二次建模,从而有效提取出深层次的非欧几里得空间特征。
(4)为了验证所提出模型的优越性,在两组真实的交通数据集上进行了大量的实验。实验结果表明,所提出的模型在多个预测范围表现出了比当前最先进的模型更优越的性能。
在另一个实施例中,本申请还提供了一种基于合成数据的交通流量预测装置,包括处理器以及存储有若干计算机指令的存储器,所述计算机指令被处理器执行时实现所述基于合成数据的交通流量预测方法的步骤。
关于基于合成数据的交通流量预测装置的具体限定可以参见上文中对于基于合成数据的交通流量预测方法的限定,在此不再赘述。上述基于合成数据的交通流量预测装置可全部或部分通过软件、硬件及其组合来实现。可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上对应的操作。
存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器中存储有可在处理器上运行的计算机程序,所述处理器通过运行存储在存储器内的计算机程序,从而实现本发明实施例中的网络拓扑布局方法。
其中,所述存储器可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器用于存储程序,所述处理器在接收到执行指令后,执行所述程序。
所述处理器可能是一种集成电路芯片,具有数据的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等。可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (3)
1.一种基于合成数据的交通流量预测方法,其特征在于,所述基于合成数据的交通流量预测方法,包括:
将交通网络中所有传感器分类为多个簇,针对每一个簇采用该簇传感器的真实交通数据,训练出一个对应的时空依赖性生成对抗网络;
将真实交通数据根据传感器对应的簇输入到训练好的时空依赖性生成对抗网络,生成合成交通数据,并将合成交通数据与真实交通数据进行结合得到输入数据;
将输入数据输入到传感器对应的卷积神经网络中,提取每个传感器的时间特征,并将所有传感器的时间特征展平并连接为节点特征矩阵;
将节点特征矩阵输入到带有距离图、真实流量关联图和合成流量关联图的图卷积神经网络,提取空间特征,并连接提取的空间特征得到高层次空间特征;
将高层次空间特征输入到带有融合图的图卷积神经网络得到预测结果;
所述时空依赖性生成对抗网络,包括一个基本生成对抗网络GAN,所述基本生成对抗网络GAN的生成器输入的潜在变量为真实交通速度和占用率,所述基本生成对抗网络GAN的鉴别器的输入为真实交通流量数据和合成交通数据;
所述距离图用于表示传感器的地理位置,用ADG表示;所述真实流量关联图用于表示真实交通数据对应的传感器之间的灰色关联度,用ARG表示;所述合成流量关联图用于表示合成交通数据对应的传感器之间的灰色关联度,用ASG表示,其中:
所述距离图ADG的加权邻接矩阵表示为:
其中σDis表示距离的标准差,ε表示阈值,Disx,y表示传感器x和y之间的距离;
所述真实流量关联图ARG的加权邻接矩阵表示为:
所述合成流量关联图ASG的加权邻接矩阵表示为:
所述融合图由距离图、真实流量关联图和合成流量关联图加权整合而成,用AFG表示,所述融合图AFG的加权邻接矩阵表示为:
其中α、β和η分别表示三种权重系数,ε表示阈值。
2.根据权利要求1所述的基于合成数据的交通流量预测方法,其特征在于,所述将输入数据输入到传感器对应的卷积神经网络中,提取每个传感器的时间特征,包括:
将输入数据根据传感器的数量N切成N个切片,每个切片对应着一个传感器;
在每个切片上应用两个CNN层来学习每个传感器的时间特征。
3.一种基于合成数据的交通流量预测装置,包括处理器以及存储有若干计算机指令的存储器,其特征在于,所述计算机指令被处理器执行时实现权利要求1至权利要求2中任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110845180.3A CN113570861B (zh) | 2021-07-26 | 2021-07-26 | 一种基于合成数据的交通流量预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110845180.3A CN113570861B (zh) | 2021-07-26 | 2021-07-26 | 一种基于合成数据的交通流量预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113570861A CN113570861A (zh) | 2021-10-29 |
CN113570861B true CN113570861B (zh) | 2022-09-27 |
Family
ID=78167534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110845180.3A Active CN113570861B (zh) | 2021-07-26 | 2021-07-26 | 一种基于合成数据的交通流量预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113570861B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114221876B (zh) * | 2021-11-16 | 2024-03-12 | 山东师范大学 | 基于模糊控制与多特征融合的承载网流量预测方法及系统 |
CN116777046A (zh) * | 2023-05-11 | 2023-09-19 | 中国科学院自动化研究所 | 交通预训练模型构建和交通预测方法、装置及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109493599A (zh) * | 2018-11-16 | 2019-03-19 | 南京航空航天大学 | 一种基于生成式对抗网络的短时交通流预测方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2590151A1 (en) * | 2011-11-03 | 2013-05-08 | Deutsche Telekom AG | A framework for the systematic study of vehicular mobility and the analysis of city dynamics using public web cameras |
US11470101B2 (en) * | 2018-10-03 | 2022-10-11 | At&T Intellectual Property I, L.P. | Unsupervised encoder-decoder neural network security event detection |
CN110164128B (zh) * | 2019-04-23 | 2020-10-27 | 银江股份有限公司 | 一种城市级智能交通仿真系统 |
CN110363989A (zh) * | 2019-07-11 | 2019-10-22 | 汉王科技股份有限公司 | 交通流量检测方法、装置、电子设备及存储介质 |
CN110909909A (zh) * | 2019-09-03 | 2020-03-24 | 南京理工大学 | 基于深度学习和多层时空特征图的短时交通流预测方法 |
CN110491129A (zh) * | 2019-09-24 | 2019-11-22 | 重庆城市管理职业学院 | 基于时空图的发散卷积循环神经网络的交通流预测方法 |
CN112950924B (zh) * | 2019-12-10 | 2022-08-19 | 东北大学秦皇岛分校 | 一种基于深度学习的复杂交通路网交通速度预测方法 |
CN111798662A (zh) * | 2020-07-31 | 2020-10-20 | 公安部交通管理科学研究所 | 一种基于时空网格化数据的城市交通事故预警方法 |
CN112991721A (zh) * | 2021-02-04 | 2021-06-18 | 南通大学 | 基于图卷积网络节点关联度的城市路网交通速度预测方法 |
CN112949828B (zh) * | 2021-03-04 | 2023-08-04 | 湖南大学 | 一种基于图学习的图卷积神经网络交通预测方法及系统 |
-
2021
- 2021-07-26 CN CN202110845180.3A patent/CN113570861B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109493599A (zh) * | 2018-11-16 | 2019-03-19 | 南京航空航天大学 | 一种基于生成式对抗网络的短时交通流预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113570861A (zh) | 2021-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111612206B (zh) | 一种基于时空图卷积神经网络的街区人流预测方法及系统 | |
Liang et al. | Fine-grained urban flow prediction | |
CN113570861B (zh) | 一种基于合成数据的交通流量预测方法及装置 | |
Asadi et al. | A convolution recurrent autoencoder for spatio-temporal missing data imputation | |
Zhang et al. | TrafficGAN: Off-deployment traffic estimation with traffic generative adversarial networks | |
Du et al. | GAN-based anomaly detection for multivariate time series using polluted training set | |
Lin et al. | A SOM-based approach to estimating design hyetographs of ungauged sites | |
CN113591380A (zh) | 基于图高斯过程的交通流预测方法、介质及设备 | |
Tang et al. | Dynamic origin‐destination flow estimation using automatic vehicle identification data: A 3D convolutional neural network approach | |
Xu et al. | Multivariate time series forecasting based on causal inference with transfer entropy and graph neural network | |
CN113806419B (zh) | 基于时空大数据的城市区域功能识别模型及识别方法 | |
CN115565369B (zh) | 一种基于超图的时空超图卷积交通流量预测方法及系统 | |
Cheng et al. | Analysis and forecasting of the day-to-day travel demand variations for large-scale transportation networks: a deep learning approach | |
CN112906813A (zh) | 一种基于密度聚类和胶囊神经网络的浮选工况识别方法 | |
Liu et al. | Pristi: A conditional diffusion framework for spatiotemporal imputation | |
Xie et al. | Research of PM2. 5 prediction system based on CNNs-GRU in Wuxi urban area | |
CN115599779A (zh) | 一种城市道路交通缺失数据插值方法及相关设备 | |
CN113887704A (zh) | 交通信息预测方法、装置、设备及存储介质 | |
Zhang et al. | Sageformer: Series-aware graph-enhanced transformers for multivariate time series forecasting | |
Liu et al. | Do we really need graph neural networks for traffic forecasting? | |
Zhou et al. | Expanding the prediction capacity in long sequence time-series forecasting | |
Cao et al. | A hybrid deep learning-based traffic forecasting approach integrating adjacency filtering and frequency decomposition | |
Yao et al. | ModeRNN: Harnessing spatiotemporal mode collapse in unsupervised predictive learning | |
CN112101132A (zh) | 一种基于图嵌入模型和度量学习的交通状况预测方法 | |
Li et al. | A two-stream graph convolutional neural network for dynamic traffic flow forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231221 Address after: Room 296, Building 3, Kuai 16, Zhuantang Science and Technology Economic Zone, Xihu District, Hangzhou City, Zhejiang Province, 310024 Patentee after: Hangzhou half cloud Technology Co.,Ltd. Address before: No.18 Xueyuan street, Xiasha Higher Education Park, Hangzhou City, Zhejiang Province, 310018 Patentee before: ZHEJIANG University OF FINANCE & ECONOMICS |