CN115358462A - 一种关联多交叉口交通流量预测方法 - Google Patents
一种关联多交叉口交通流量预测方法 Download PDFInfo
- Publication number
- CN115358462A CN115358462A CN202210992810.4A CN202210992810A CN115358462A CN 115358462 A CN115358462 A CN 115358462A CN 202210992810 A CN202210992810 A CN 202210992810A CN 115358462 A CN115358462 A CN 115358462A
- Authority
- CN
- China
- Prior art keywords
- traffic flow
- data
- time
- intersection
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 239000013598 vector Substances 0.000 claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000011176 pooling Methods 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 230000002123 temporal effect Effects 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims abstract description 5
- 238000012795 verification Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000005457 optimization Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Game Theory and Decision Science (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种关联多交叉口交通流量预测方法。本发明步骤如下:1、收集关联交叉口交通流量数据,对交叉口车流数据进行预处理后划分为训练集、验证集和测试集;2、使用CNN对输入的交叉口车流数据提取空间特征;3、将空间特征作为输入,使用Transformer提取时间特征;4、当Decoder层全部执行完毕后,三个时间窗口数据最终分别输三个向量,三个向量堆叠后输入到平均池化层;5、设置模型参数;6、训练模型直至最大训练周期,使用最终模型对关联多交叉口做交通流量预测任务。本发明分别利用CNN和Transformer提取关联多交叉口的空间和时间特征。使用可学习的时间编码嵌入Transformer的位置编码,将位置信息和时间信息共同注入模型,帮助模型更好地学习到交通量的时间特征。
Description
技术领域
本发明涉及深度学习领域。提供一种关联多交叉口交通流量预测方法,具体为一种基于Transformer和CNN来对关联多交叉口进行交通流量预测的深度学习方法。
背景技术
面对复杂的交通环境,通过交通流参数的预测,可以提高城市道路资源的利用率,了解到未来数天、数周、数月的参数发展趋势,为城市交通信号控制提供数据支撑和准确的交通诱导信息。交通流预测问题是一个时空序列问题,即利用数据之中所蕴含的时间、空间信息来对未来的区域内不同交叉口的交通流量进行预测。
交叉口是道路路网中最复杂的部分,因为它涉及到各种不同的对象,如车辆和行人。随着交通需求的增加,城市十字路口的交通拥堵问题也日益严重。针对交叉口的交通流量预测,有着许多相应的研究。比如Wenrui Qu等人通过整合k-最近邻(KNN)和Elman神经网络建模方法,建立了一个基于交叉口短期交通流量预测的双层叠加模型,此方法虽然能一定程度提高预测精度,但是由于不同交通时序数据之间通常存在复杂的非线性时空相关关系,传统方法模型难以挖掘交通时空序列数据之间的深层关系,因此深度学习方法对于交通流量预测任务来讲是一个很好的选择。Daeho Kim等人提出了一种基于多交叉口交通流量预测的协同交通信号控制方法(TFP-CTSC),该方法使用LSTM模型做交通流量预测任务,此方法虽然使用LSTM序列模型提取了交通流的时间特征,但是未考虑到多交叉口交通流数据还存在着空间信息。Wan Li等人提出了一种新的深度交叉时空网络(DISTN),用于交通流量预测,分别考虑了使用卷积神经网络(CNN)和长短期记忆网络(LSTM)来提取交通流量的空间和时间特征,将深度学习方法应用于交叉口交通量预测,此方法虽分析了数据是时空特征,但是LSTM模型有着无法并行训练以及面对特别长的依赖关系却无能为力的缺点。
发明内容:
本发明的目的是针对以上问题新提出了一种关联多交叉口交通流量预测方法。本发明解决其技术问题所采用的技术方案包含以下步骤:
步骤1、制作关联交叉口交通流量数据集。
本发明根据应用的具体交通区域收集关联交叉口交通流量数据,即交叉口车流数据。同时对收集到的交叉口车流数据进行预处理,并按照2:2:1的比例分为训练集、验证集和测试集。
本发明使用min-max标准化进行数据预处理,具体处理过程如下:
当数据x按照最小值中心化后,再按极差(最大值-最小值)缩放,数据被收敛到[0,1]之间。归一化后求优过程范围变小,寻优过程变得平缓,更容易正确收敛到最优解。计算公式如下所示:
步骤2、使用CNN提取空间特征。
本发明所提模型的输入包含三个时间窗口的交叉口车流数据,分别为上一个时间窗口的车流数据、上一个时间窗口前一周的同时刻数据以及上一个时间窗口前一个月的同时刻数据。其中,每个时间窗口包含H个时间步,每个时间步的交通车流数据描述为一个二维矩阵。
对输入的三个时间窗口进行分别处理,即将每个时间窗口数据中的H个二维矩阵堆叠输入CNN(Convolutional Neural Network,卷积神经网络)。使用二维卷积层实现关联交叉口空间特征的提取。t时刻第n层卷积层的输出会经过一个残差连接。最后通过全连接层,转换为一个一维空间特征向量Yt,将该空间特征向量Yt作为Transformer网络的输入,用于捕获时间相关性。
步骤3、使用Transformer网络提取时间特征。
Transformer网络的输入是包含了H个时间步的空间特征向量序列,表示为(Yt-H,Yt-H+1,…,Yt),其中Yt是由时间步t的流量数据,经过n个卷积层后,输出的空间特征向量,训练该网络来预测所有关联交叉口的在未来H个时间步的车流量。
输入数据的形状为[H,M],其中M表示每个时间步,所有关联交叉口的车流方向数量总和,H表示时间步的数量。
Transformer是一种Seq2Seq模型,由Encoder层接受输入,由Decoder层得到输出。
步骤4、当Decoder层全部执行完毕后,三个时间窗口数据的最终输出分别为Znow、Zweek、Zmonth。将这个三个向量进行堆叠,然后输入到平均池化层。平均池化即对邻域特征点值求平均,将邻域内的特征点整合得到新的特征。平均池化相比全连接层,能够大幅度减少网络参数,从而减少过拟合现象。
步骤5、设置模型参数。
设置模型训练次数epoch以及学习率α。设置损失函数来衡量模型的运行情况。损失函数公式如下所示:
其中,α表示学习率,Loss表示损失函数,表示预测的流量数据,qt+1表示实际的流量数据。损失函数用于衡量预测输出值和实际值有多接近,即预测的下一个时间窗口的交通流量大小与实际的下一个时间窗口的交通流量大小的误差。
为了更全面的评估算法预测性能,本发明使用均方误差(MSE),平均绝对误差(MAE)这两种损失函数来衡量模型的预测效果。这两个都是最常用的回归损失函数,都能够很好地量化模型的预测效果。
最后还需设置优化算法,使用合适的优化算法能有效提高训练模型的速度。梯度下降是一种寻找目标函数,即损失函数最小化的方法,它利用梯度信息,通过不断迭代调整参数来寻找合适的目标值,是目前神经网络中使用最为广泛的优化算法之一。本发明使用Adam作为模型的优化算法。
步骤6、算法最大训练周期到达时停止训练。使用最终得到的交通流量预测模型,对关联多交叉口做交通流量预测任务。
本发明的有益效果:
(1)本发明的交通流预测针对的是关联多交叉口。现有的许多研究都是针对单交叉口进行的,单个交叉口交通拥堵的改善,可能会造成相邻交叉口拥堵状况的加重,并不能确切的从整体上提高通行效率。
(2)本发明提出了一种新的基于Transformer和CNN的关联多交叉口交通流量预测方法。将关联多交叉口的流量数据构造为一个形状为(交叉口数量×车道数量)的二维矩阵,从而使用CNN进行关联多交叉口的空间特征提取。创新性地在交叉口流量预测上使用Transformer模型,相比于LSTM,Transformer可以避免递归,以便允许并行计算,减少训练时间,并减少由于长期依赖性而导致的性能下降,并且在预测精度方面有着更加优秀的表现。此外,本发明还考虑了交通量的每周和每月的周期趋势,使用平均池化层能够对交通流的周期特征进行学习。
综上所述,针对以上模型中存在的不足之处。本发明提出了一种基于Transformer和CNN的关联多交叉口交通流量预测方法,用于对关联交叉口做交通流量预测任务。其中卷积神经网络(CNN)和Transformer分别在图像领域以及序列模型领域都取得了巨大的成功。相比LSTM,Transformer模型可以避免递归,允许并行计算减少训练时间,并减少由于长期依赖性而导致的性能下降,而且相对于LSTM,其结构灵活性和通用性更强,可以捕捉信息相关性的范围更广。此外,本发明还考虑了交通流量的每周和每月的周期趋势,使用平均池化层学习交通流量的周期性特征。
附图说明
图1为本发明实施例所提供的模型示意图;
图2为本发明实施例所提供的CNN模型示意图;
图3为本发明实施例所提供的Transformer的Encoder层结构图;
图4为本发明实施例所提供的Transformer的Decoder层结构图;
图5为本发明实施例所提供的平均池化层结构图。
具体实施方式
为了让相关人员能够更清晰了解本发明的技术内容,将使用以下实施例详细介绍。发明提出了一种新的多交叉口交通流量预测方法。主要工作包括以下两个方面:1)基于关联多交叉口上的各种非线性空间关系,以及交通量中潜在的时间依赖关系,提出了一种基于Transformer和CNN(Convolutional Neural Network,卷积神经网络)的关联多交叉口的交通流量预测方法。分别利用CNN和Transformer提取关联多交叉口的空间和时间特征。使用可学习的时间编码嵌入Transformer的位置编码,将位置信息和时间信息共同注入模型,帮助模型能够更好地学习到交通量的时间特征。此外,本发明还考虑了交通流量周期趋势对交通流量预测的影响,使用平均池化层提取交通流量周期特征。
本发明实施例的实现包括以下步骤:
步骤一、制作关联交叉口交通流量数据集。
根据应用本方法的具体交通区域收集关联交叉口交通流量数据,即交叉口车流数据。同时对其预处理并按照2:2:1的比例分为训练集、验证集和测试集。本方法使用min-max标准化,作为数据预处理的方法。具体方法为:当数据x按照最小值中心化后,再按极差(最大值-最小值)缩放,数据被收敛到[0,1]之间。归一化后求优过程范围变小,寻优过程变得平缓,更容易正确收敛到最优解。计算公式如下所示:
在模型中,考虑了早高峰,双休日,节假日等外来因素,增强了随机性。
步骤2、使用CNN提取空间特征。
本发明的模型结构如图1所示。模型的输入包含了三个时间窗口的车流数据,分别为上一个时间窗口的车流数据(Xt-H,Xt-H+1,…,Xt),上一个时间窗口前一周的同时刻数据(Xt-H-week,Xt-H-week+1,…,Xt-week),上一个时间窗口前一个月的同时刻数据(Xt-H-month,Xt-H-month+1,…,Xt-month)。其中,每个时间窗口包含H个时间步,每个时间步的交通车流数据可描述为一个二维矩阵。对输入的三个时间窗口进行分别处理,即将每个时间窗口数据中的H个二维矩阵堆叠输入CNN。
由于交叉口之间往往互相关联,上下游的交叉口都可能会影响目标交叉口的车流预测工作。本发明使用CNN提取关联交叉口的空间特征。其中CNN的输入为一个包含了H个时间步的车流数据的时间窗口。
在时间步t时,给定路网的历史流量数据可以被描述为一个矩阵:
其中,对于矩阵中的每个元素,上标的格式为(路口编号——车流方向编号),下标表示时间步t。矩阵的每一行表示第N个目标交叉口所有车流方向在时刻t的交通流量。如图所示,每个交叉口有着12个车流方向。因此,车流数据一共有12列,矩阵的每一列代表从交叉口1到交叉口N,某一车流方向的交通量。
当一个时间步的数据可以被描述为一个矩阵时,就很容易想到可以将该矩阵作为CNN的输入。
本发明的卷积模型如图2所示,通过使用卷积核大小为(2,2),padding大小为(2,1)的二维卷积层实现关联交叉口空间特征的提取。卷积之后加上个ReLU和Dropout层。
步骤3、使用Transformer提取时间特征。
Transformer的输入是包含了H个时间步的空间特征向量序列,表示为(Yt-H,Yt-H+1,…,Yt),其中Yt是由时间步t的流量数据,经过n个卷积层后,输出的空间特征向量,其中H是历史时间步长。训练该网络来预测所有关联交叉口的在未来H个时间步的车流量。
输入数据的形状为[H,M],其中M表示每个时间步,所有关联交叉口的车流方向数量总和,H表示时间步的数量。
Transformer其实是一种Seq2Seq模型,由Encoder层接受输入,由Decoder层得到输出。
Transformer的Encoder层包括了两个子层:
第一个子层是Multi-Head Attention,用于计算输入的self-attention。
第二个子层是Feed Forward,是一个简单的全连接网络。
在每个子层的最后都模拟了残差网络,每个子层的输出公式都如下所示:
LayerNorm(x+Sublayer(x)) (3)
Encoder层结构如图3所示。Encoder的输入由以下三部分组成:
输入编码。在原始的Transformer模型中,模型的输入是一个高维度的特征向量。该特征向量通过Word2Vec等词嵌入方法将输入文本转化得到,称为嵌入向量。本发明使用全连接层来替代词嵌入方法对输入数据进行编码,经过全连接层,输入数据的形状变为[H,E],其中H表示输入的时间步个数,E表示输入数据的特征大小。
位置编码。Transformer给Encoder层的输入添加了一个额外的向量PositionalEncoding。该向量的维度和嵌入向量维度相同,用于提供相对位置信息。这个向量能决定当前时间步在时间窗口中的位置,Transformer能通过该向量学习时间步的位置信息。
全局时间编码。在Transformer模型的基础上,本发明除了使用位置编码进行局部位置嵌入,还考虑到时间戳信息在实际应用中的有效性,使用时间序列数据对应时间戳中提取的月位置嵌入、周位置嵌入、星期位置嵌入、小时位置嵌入以及分钟位置嵌入编码为叠加的位置编码共同构成可学习的嵌入。
最后将上述的三个向量相加,作为输入送到Encoder层。
Transformer的Decoder层包括了三个子层:
第一个子层是Masked Multi-Head Attention,也是计算输入的self-attention。但是因为在生成的时候是无法知道未来的信息的,所以需要将未来的信息遮盖,对于一个序列,在时间步为t的时刻,解码输出应该只能依赖于t时刻之前的输出,而不能依赖t之后的输出。因此需要做掩码操作。
第二个子层是Encoder-Decoder Attention。将Encoder层的输出以及MaskedMulti-Head Attention子层的输出做attention计算。
第三个子层是Feed Forward,与Encoder层相同。
Decoder层的结构如图4所示。
Decoder层的输入是由历史数据中靠近预测数据的部分与空向量拼接,该空向量长度为待预测数据长度。
步骤4、当Decoder层全部执行完毕后,三个时间窗口数据的最终输出分别为Znow,Zweek,Zmonth。将这个三个向量进行堆叠,输入到平均池化层。平均池化层的结构如图5所示,计算公式如下所示:
步骤五、设置模型参数。
设置模型训练次数epoch以及学习率α。设置损失函数来衡量模型的运行情况。
(1)均方误差(MSE)的定义如以下公式所示:
(2)平均绝对误差(MAE)的定义如以下公式所示:
最后还需设置优化算法,使用合适的优化算法能有效提高训练模型的速度。梯度下降是一种寻找目标函数,即损失函数最小化的方法,它利用梯度信息,通过不断迭代调整参数来寻找合适的目标值,是目前神经网络中使用最为广泛的优化算法之一。本发明使用Adam作为模型的优化算法。
步骤6、算法最大训练周期到达时停止训练。使用最终得到的交通流量预测模型,对关联多交叉口做交通流量预测任务。
应当知晓的是,本说明书未详细阐述的部分均属于现有技术。相关技术人员应该明白,上述实施例仅仅为了帮助阅读人员理解本发明的原理和实现方法,本发明所保护的范围不局限与这样的实施例。凡在本发明基础上做出的同等替换均在本发明权利的保护范围内。
Claims (9)
1.一种关联多交叉口交通流量预测方法,其特征在于包含以下步骤:
步骤1、根据具体交通区域收集关联交叉口交通流量数据,即交叉口车流数据;同时对交叉口车流数据进行预处理后划分为训练集、验证集和测试集;
步骤2、使用CNN对输入的交叉口车流数据提取空间特征;
步骤3、将CNN输出的空间特征作为Transformer的输入,使用Transformer提取时间特征;
步骤4、当Transformer的Decoder层全部执行完毕后,三个时间窗口数据最终分别输出Znow、Zweek、Zmonth;将三个向量Znow、Zweek、Zmonth进行堆叠,输入到平均池化层;
步骤5、设置模型参数;
步骤6、训练模型直至最大训练周期,使用最终得到的交通流量预测模型,对关联多交叉口做交通流量预测任务。
2.根据权利要求1所述的一种关联多交叉口交通流量预测方法,其特征在于步骤1按照2:2:1的比例分为训练集、验证集和测试集。
4.根据权利要求2或3所述的一种关联多交叉口交通流量预测方法,其特征在于,模型的输入包含三个时间窗口的车流数据,分别为上一个时间窗口的车流数据(Xt-H,Xt-H+1,…,Xt),上一个时间窗口前一周的同时刻数据(Xt-H-week,Xt-H-week+1,…,Xt-week),上一个时间窗口前一个月的同时刻数据(Xt-H-month,Xt-H-month+1,…,Xt-month);其中,每个时间窗口包含H个时间步,每个时间步的交通车流数据描述为一个二维矩阵;对输入的三个时间窗口分别进行处理,即将每个时间窗口数据中的H个二维矩阵堆叠输入CNN。
7.据权利要求5或6所述的一种关联多交叉口交通流量预测方法,其特征在于,Transformer网络的输入是包含了H个时间步的空间特征向量序列,表示为(Yt-H,Yt-H+1,…,Yt),其中Yt是由时间步t的车流数据,经过n个卷积层后,输出的空间特征向量,训练Transformer网络来预测所有关联交叉口的在未来H个时间步的车流数据;输入数据的形状为[H,M],其中M表示每个时间步所有关联交叉口的车流方向数量总和,H表示时间步的数量。
8.据权利要求7所述的一种关联多交叉口交通流量预测方法,其特征在于,Encoder的输入由以下三部分组成:
1)输入编码向量:使用全连接层来替代词嵌入方法对输入数据进行编码,经过全连接层,输入数据的形状变为[H,E],其中H表示输入的时间步数量,E表示输入数据的特征大小;
2)位置编码向量:给Encoder层的输入添加了一个额外的向量Positional Encoding;该向量的维度和嵌入向量维度相同,用于提供相对位置信息;这个向量能决定当前时间步在时间窗口中的位置,Transformer能通过该向量学习时间步的位置信息;
3)全局时间编码向量:使用时间序列数据对应时间戳中提取的月位置嵌入、周位置嵌入、星期位置嵌入、小时位置嵌入以及分钟位置嵌入编码为叠加的位置编码共同构成可学习的全局时间编码向量;
最后将上述三个向量相加作为输入送到Encoder层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210992810.4A CN115358462A (zh) | 2022-08-18 | 2022-08-18 | 一种关联多交叉口交通流量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210992810.4A CN115358462A (zh) | 2022-08-18 | 2022-08-18 | 一种关联多交叉口交通流量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115358462A true CN115358462A (zh) | 2022-11-18 |
Family
ID=84002496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210992810.4A Pending CN115358462A (zh) | 2022-08-18 | 2022-08-18 | 一种关联多交叉口交通流量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115358462A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116229178A (zh) * | 2023-03-14 | 2023-06-06 | 安徽大学 | 一种基于Transformer针对少量训练样本的图像分类方法 |
-
2022
- 2022-08-18 CN CN202210992810.4A patent/CN115358462A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116229178A (zh) * | 2023-03-14 | 2023-06-06 | 安徽大学 | 一种基于Transformer针对少量训练样本的图像分类方法 |
CN116229178B (zh) * | 2023-03-14 | 2023-11-24 | 安徽大学 | 一种基于Transformer针对少量训练样本的图像分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111400620B (zh) | 基于时空嵌入Self-Attention的用户轨迹位置预测方法 | |
CN111612243B (zh) | 交通速度预测方法、系统及存储介质 | |
CN111161535A (zh) | 基于注意力机制的图神经网络交通流量预测方法及系统 | |
Bao et al. | Spatial–temporal complex graph convolution network for traffic flow prediction | |
CN115273464A (zh) | 一种基于改进的时空Transformer的交通流量预测方法 | |
CN114299723A (zh) | 一种交通流量预测方法 | |
CN117096867A (zh) | 一种短期电力负荷预测方法、装置、系统及存储介质 | |
CN116502777B (zh) | 一种基于Transformer的四维航迹长时预测方法及其装置 | |
CN115510174A (zh) | 一种基于路网像素化的Wasserstein生成对抗流量数据插补方法 | |
CN115358462A (zh) | 一种关联多交叉口交通流量预测方法 | |
CN116612645A (zh) | 一种高速公路服务区车流量预测方法 | |
CN115982567A (zh) | 一种基于序列到序列模型的制冷系统负荷预测方法 | |
CN116777068A (zh) | 一种基于因果Transformer的网络化数据预测方法 | |
CN117688453B (zh) | 一种基于时空嵌入注意力网络的交通流量预测方法 | |
CN117852701B (zh) | 一种基于特征注意力机制的交通流预测方法及系统 | |
CN112633579B (zh) | 一种基于域对抗的交通流迁移预测方法 | |
CN117593878A (zh) | 一种突发事件下的城市轨道交通短时od需求预测方法 | |
CN115953902B (zh) | 一种基于多视图时空图卷积网络的交通流预测方法 | |
CN115938112B (zh) | 交通需求预测方法、系统、电子设备及计算机存储介质 | |
CN116404637A (zh) | 电力系统短期负荷预测方法和电力系统短期负荷预测装置 | |
CN116756498A (zh) | 一种基于lstm和分位数回归的径流概率预测算法 | |
CN114267170A (zh) | 基于考虑人类流动性的图时空Transformer模型的交通流预测方法 | |
Jun-Fang et al. | Traffic flow state prediction based on space-time correlation of vehicle trajectory using the deep hybrid model | |
CN113821929B (zh) | 基于时空注意力机制的高速路网站点流量预测方法及系统 | |
CN115620514B (zh) | 一种基于自适应广义PageRank图神经网络的交通流预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |