CN113762338A - 一种基于多重图注意力机制的交通流预测方法、设备及介质 - Google Patents
一种基于多重图注意力机制的交通流预测方法、设备及介质 Download PDFInfo
- Publication number
- CN113762338A CN113762338A CN202110868311.XA CN202110868311A CN113762338A CN 113762338 A CN113762338 A CN 113762338A CN 202110868311 A CN202110868311 A CN 202110868311A CN 113762338 A CN113762338 A CN 113762338A
- Authority
- CN
- China
- Prior art keywords
- traffic flow
- prediction
- model
- initial predicted
- attention mechanism
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000007246 mechanism Effects 0.000 title claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000005457 optimization Methods 0.000 claims abstract description 22
- 230000003993 interaction Effects 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 9
- 230000007787 long-term memory Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000006403 short-term memory Effects 0.000 claims description 6
- 102100040954 Ephrin-A1 Human genes 0.000 claims description 4
- 101000965523 Homo sapiens Ephrin-A1 Proteins 0.000 claims description 4
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 238000009792 diffusion process Methods 0.000 claims description 4
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Evolutionary Biology (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Physics (AREA)
- Marketing (AREA)
- Molecular Biology (AREA)
- General Business, Economics & Management (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多重图注意力机制的交通流预测方法、设备及介质,方法为:获取训练样本;构建由若干交通流预测子模型构成的交通流预测生成组合模型GC‑GE和由编码器、注意力机制及全连接层构成的交通流预测优化模型GA‑OP;GC‑GE使用每个预测子模型进行初始预测;GA‑OP通过对历史交通流、初始预测交通流、交通流外部因素进行编码,利用注意力机制获取三者间的两两交互关系,并将这些张量拼接到全连接层上进行评分以对整个模型进行训练;最后根据评分确定GC‑GE中各子模型的权重,以此获得最终的预测交通流。本发明不仅考虑了交通流的时空相关性,还考虑交通流外部因素的影响,保证了预测结果的有效性。
Description
技术领域
本发明属于智能交通技术领域,尤其涉及一种基于多重图注意力机制的交通流预测方法、设备及介质。
背景技术
随着经济的发展,我国城市规模不断扩大,城市人口也急剧上涨,人们对便捷交通出行需求的不断增加,汽车保有量持续快速的增长,这给有限的道路资源带来了巨大的压力。
国内外的实践经验已表明,仅依靠增加道路建设来缓解城市交通拥堵是很难实现的,城市交通系统的管控方式应该从被动式管控转变为主动式管控。近年来,智能交通系统(ITS)的概念被提出,期望在不用大量兴建新的城市道路和其他交通设施的前提下,通过大数据和各种智能算法技术把人、车、道路等信息综合起来考虑,规划出合理的交通路径提高车辆运行效率,从而减小道路通行压力。智能的交通系统成为一种缓解交通矛盾行之有效的策略。在智能交通系统的众多分支中,交通流预测是其中的一项基础性工作,也是一项具有挑战性的研究课题。准确的交通流量预测可以预估未来时间的交通状况,提前做好规划措施,引导驾驶员选择到达目的地的最佳路径,为城市规划道路建设提供参考意见等。因此,近几十年来的交通流量预测受到了许多研究者的关注。
国内外提出了很多用于交通流预测的方法,早期的一些方法是基于统计学的预测模型,如历史平均、时间序列、卡尔曼滤波、支持向量机、非参数回归、小波理论等,对于具有很强的随机性和不确定性的非线性交通数据而言,这类模型受时序波动影响较大,预测精准度较低。随着深度学习的发展,越来越多的深度学习方法被用来对交通流预测,不仅可以对更复杂的数据进行建模,而且取得了更高的精准度,如支持向量机和神经网络等。近几年,基于图卷积网络方法开始被研究者们广泛运用于交通流预测,充分考虑了交通流的时空相关性,预测精准度得到进一步提高,如时空图卷积神经网络(ST-GCN),扩散卷积循环神经网络(DCRNN)等。
由于交通流的不确定性和非线性,传统的单一模型并不能对所有道路都具有很好的适用性,难以满足主动式管理的精度要求,同时,现有的研究主要利用的是直接数据融合的优点,在复杂路段上表现并不好,再者,大部分模型没有考虑交通流外部因素的影响,如天气、节假日、事件、事故等,其预测结果有效性不能得到保证。
发明内容
本发明提供一种基于多重图注意力机制的交通流预测方法,考虑交通流外部因素的影响,提高交通流预测的精准度。
为实现上述技术目的,本发明采用如下技术方案:
一种基于多重图注意力机制的交通流预测方法,包括:
获取若干训练样本:取T′+T个连续时刻的交通流数据作为一个训练样本,取前面的T′个连续时刻的交通流数据为历史交通流数据,记后面的T个连续时刻的交通流数据为真实交通流数据;
构建模型:将n个不同类型的交通流预测模型分别作为预测子模型,组合构建交通流预测生成组合模型;构建交通流预测优化模型,包括编码器、注意力机制模块、全连接层;
使用训练样本训练模型:使用每个预测子模型分别根据训练样本中的历史交通流数据进行交通流预测,得到对应的初始预测交通流数据;对历史交通流、初始预测交通流和交通流外部因素分别使用编码器进行编码,并利用注意力机制模块获取这三者的两两交互关系,再将得到的两两交互关系张量连接并由全连接层处理得到次级预测交通流;对全连接层输出的次级预测交通流进行第一次评分,以及根据训练样本中的真实交通流数据对初始预测交通流进行第二次评分,以通过两次评分的交叉熵对交通流预测生成组合模型和交通流预测优化模型进行整体训练;
交通流预测与优化:获取当前最近T′个连续时刻的交通流数据,输入至训练完毕的交通流预测生成组合模型中的每个预测子模型;训练完毕的交通流预测生成组合模型和交通流预测优化模型,分别输出当前之后T个连续时刻的初始预测交通流和次级预测交通流;对次级预测交通流进行第一次评分,并根据第一次评分结果计算每个预测子模型的预测概率,再利用预测概率对初始预测交通流进行加权计算,得到当前之后T个连续时刻的最终预测交通流。
在更优的技术方案中,训练交通流预测生成组合模型和交通流预测优化模型的训练样本中,每个时刻t的交通流数据包括路网中所有路段的所有特征,均表示为路网在时刻t的拓扑图信号其中,N是路网包括的路段数量,P为每个路段的特征数量。
在更优的技术方案中,所述交通流外部因素包括:天气、节假日、事件和事故,路段的特征包括:速度、时间占有率、空间占有率。
在更优的技术方案中,n个不同类型的交通流预测模型,分别为:扩散卷积循环神经网络DCRNN、时空图卷积网络ST-GCN、图多注意网络GMAN和动态时空图卷积神经网络DGCNN。
在更优的技术方案中,交通流预测优化模型包括3个编码器,其中:
用于对历史交通流编码的编码器,采用1个时间卷积层和1个单向的长短期记忆层构成,将最后一个隐藏状态作为历史交通流的运动编码;
用于对初始预测交通流编码的编码器,采用1个时间卷积层和1个单向的长短期记忆层构成,将最后一个隐藏状态作为历史交通流的运动编码;
用于对交通流外部因素编码的编码器,采用1个时间卷积层和1个双向的长短期记忆层构成,将隐藏状态序列作为交通流外部因素的编码。
在更优的技术方案中,交通流预测优化模型包括3个注意力机制模块,每个注意力机制模块均利用缩放点积注意力,并采用的是键映射、查询映射和值映射的线性层;
第一个注意力机制模块,将每个编码后的交通流外部因素嵌入到编码后的历史交通流中,得到交通流外部因素与历史交通流之间的相互关系,记为历史交通流张量;
第二个注意力机制模块,将每个编码后的交通流外部因素嵌入到编码后的初始预测交通流中,得到交通流外部因素与初始预测交通流之间的相互关系,记为初始预测交通流张量;
第三个注意力机制模块,将所有编码后的初始预测交通流相互融合,得到不同初始预测交通流之间的相互关系,记为初始预测交通流相互张量。
在更优的技术方案中,对次级预测交通流进行第一次评分的计算式为:
式中,S1为第一次评分值,Ui,j表示将注意力机制模块得到的两两交互关系张量连接得到的包含全部交通流信息的张量,f′()表示全连接层处理,i用于区分不同的交通流外部因素,l为交通流外部因素的个数,j用于区分不同的预测子模型,n表示预测子模型的个数;
对初始预测交通流进行第二次评分的计算式为:
式中,S2为第二次评分值,FGT表示训练样本中的真实交通流数据,Fj表示第j个预测子模型得到的初始预测交通流,Dist(·)表示累积的距离平方误差,τ表示温度因子;
两次评分的交叉熵可表示为:
λ=CrossEntropy(S1(Fi,j),S2(Fj))
式中,λ为得到的交叉熵值,CrossEntropy()为交叉熵函数。
在更优的技术方案中,每个预测子模型的预测概率的计算式为:
式中,pj为计算得到的第j个预测子模型的预测概率;
利用预测概率对初始预测交通流进行加权计算的计算式为:
式中,F′为最终预测交通流。
一种电子设备,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现上述中任一项所述的交通流预测方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述中任一项所述的交通流预测方法。
有益效果
本发明不仅考虑了交通流的时空相关性,还考虑交通流外部因素的影响,如天气、节假日、事件、事故等,保证了预测结果的有效性。同时组合预测也充分发挥各单项预测模型优势,提高了模型的泛化能力,适用于不同的复杂道路环境中,进一步提高未来交通流预测的精准度。
附图说明
图1是本申请实施例所述方法的整体框架图,
图2是本申请实施例所述方法中的交通流预测优化模型的流程图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例以本发明的技术方案为依据开展,给出了详细的实施方式和具体的操作过程,对本发明的技术方案作进一步解释说明。
本发明提供一种基于多重图注意力机制的交通流预测方法,如图1所示,包括以下步骤:
步骤1,获取若干训练样本:
取T′+T个连续时刻的交通流数据作为一个训练样本,取前面的T′个连续时刻的交通流数据为历史交通流数据,记后面的T个连续时刻的交通流数据为真实交通流数据。
步骤2,构建模型:
将n个不同类型的交通流预测模型分别作为预测子模型,组合构建交通流预测生成组合模型;构建交通流预测优化模型,包括编码器、注意力机制模块、全连接层。如图2所示。
本实施例设有4个预测子模型,分别为:扩散卷积循环神经网络DCRNN、时空图卷积网络ST-GCN、图多注意网络GMAN和动态时空图卷积神经网络DGCNN。其中:
DCRNN是一种用于交通流预测的深度学习框架,在交通流中包含空间和时间依赖关系。DCRNN通过在图上使用双向随机游动捕获空间依赖性,使用带定时采样的编码器-解码器结构捕获时间依赖性。
ST-GCN没有使用常规的卷积和循环单元,而是在图上提出问题,并建立具有完全卷积结构的模型,这使得训练速度更快,参数更少,通过建模多尺度交通网络有效地捕获了综合时空相关性。
GMAN采用编码器-解码器架构,其中编码器和解码器均由多个时空注意块组成,以模拟时空因素对交通状况的影响。编码器对输入流量特征进行编码,解码器预测输出序列。在编码器和解码器之间,应用变换注意力层来转换编码的交通特征,以生成未来时间步长的序列表示作为解码器的输入。变换注意力机制对历史和未来时间步长之间的直接关系进行建模,这有助于缓解预测时间步长之间的错误传播问题。
DGCNN深度学习框架的核心是发现动态拉普拉斯矩阵估计的拉普拉斯矩阵变化。DGCNN将张量分解纳入到深度学习框架中,将实时交通数据分解为稳定且依赖于长期时空交通关系的全局分量和捕捉交通波动的局部分量吧,并设计一种新的估计具有上述两个分量图的动态拉普拉斯矩阵的方法。
步骤3,使用训练样本训练模型:
步骤3.1,使用每个预测子模型分别根据训练样本中的历史交通流数据进行交通流预测,得到对应的初始预测交通流数据。
步骤3.2,对历史交通流、初始预测交通流和交通流外部因素分别使用编码器进行编码,并利用注意力机制模块获取这三者的两两交互关系,再将得到的两两交互关系张量连接并由全连接层处理得到次级预测交通流。
交通流预测优化模型包括3个编码器,其中:
(1)用于对历史交通流编码的编码器,采用1个时间卷积层和1个单向的长短期记忆层构成,将最后一个隐藏状态作为历史交通流的运动编码;
(2)用于对初始预测交通流编码的编码器,采用1个时间卷积层和1个单向的长短期记忆层构成,将最后一个隐藏状态作为历史交通流的运动编码;
(3)用于对交通流外部因素编码的编码器,采用1个时间卷积层和1个双向的长短期记忆层构成,将隐藏状态序列作为交通流外部因素的编码。
交通流预测优化模型包括3个注意力机制模块,每个注意力机制模块均利用缩放点积注意力,并采用的是键映射、查询映射和值映射的线性层,其中:
第一个注意力机制模块(C2T),将每个编码后的交通流外部因素嵌入到编码后的历史交通流中,得到交通流外部因素与历史交通流之间的相互关系,记为历史交通流张量Xi(Ti);
第二个注意力机制模块(C2F),将每个编码后的交通流外部因素嵌入到编码后的初始预测交通流中,得到交通流外部因素与初始预测交通流之间的相互关系,记为初始预测交通流张量Yi(Fi,j);
第三个注意力机制模块(F2F),将所有编码后的初始预测交通流相互融合,得到不同初始预测交通流之间的相互关系,记为初始预测交通流相互张量Z(Fi,j)。
将上述得到的历史交通流张量Xi(Ti)、初始预测交通流张量Yi(Fi,j)以及初始预测交通流相互张量Z(Fi,j),连接在一起完整表示为:Ui,j=Contat(Xi(Ti),Yi(Ti),Z(Fi,j))。
步骤3.3,对全连接层输出的次级预测交通流进行第一次评分,以及根据训练样本中的真实交通流数据对初始预测交通流进行第二次评分,以通过两次评分的交叉熵对交通流预测生成组合模型和交通流预测优化模型进行整体训练。
其中,对全连接层输出的次级预测交通流进行第一次评分的计算式为:
式中,S1为第一次评分值,Ui,j表示将注意力机制模块得到的两两交互关系张量连接得到的包含全部交通流信息的张量,f′()表示全连接层处理,i用于区分不同的交通流外部因素,l为交通流外部因素的个数,j用于区分不同的预测子模型,n表示预测子模型的个数;
对初始预测交通流进行第二次评分的计算式为:
式中,S2为第二次评分值,FGT表示训练样本中的真实交通流数据,Fj表示第j个预测子模型得到的初始预测交通流,Dist(·)表示累积的距离平方误差,τ表示温度因子。
两次评分的交叉熵可表示为:
λ=CrossEntropy(S1(Fi,j),S2(Fj))
式中,λ为得到的交叉熵值,CrossEntropy()为交叉熵函数。
步骤4,交通流预测与优化:
步骤4.1,获取当前最近T′个连续时刻的交通流数据,输入至训练完毕的交通流预测生成组合模型中的每个预测子模型;
步骤4.2,训练完毕的交通流预测生成组合模型和交通流预测优化模型,分别输出当前之后T个连续时刻的初始预测交通流和次级预测交通流;
步骤4.3,对次级预测交通流进行第一次评分,并根据第一次评分结果计算每个预测子模型的预测概率,再利用预测概率对初始预测交通流进行加权计算,得到当前之后T个连续时刻的最终预测交通流;
其中,在该步骤4.3中对步骤4.2得到的次级预测交通流进行第一次评分,与步骤3.3的第一次评分的计算式相同。
根据第一次评分结果计算每个预测子模型的预测概率的计算式为:
式中,pj为计算得到的第j个预测子模型的预测概率;
利用预测概率对初始预测交通流进行加权计算的计算式为:
式中,F′为最终预测交通流。
为验证本实施例方法对交通流预测的精准度,使用本实施例方法对若干测试样本进行交通流预测,然后计算最终预测结果的平均绝对百分误差MAPE、平均绝对误差MAE和均方根误差RMSE,以与未考虑交通流外部因素的各预测子模型进行比较,可得本实施例方法的平均绝对百分误差MAPE、平均绝对误差MAE和均方根误差RMSE相对更小,因此本实施例的交通流预测方法的精准度得到提高。
上述平均绝对百分误差MAPE、平均绝对误差MAE和均方根误差RMSE的计算式分别为:
实施例2
本实施例提供一种电子设备,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现实施例1所述的交通流预测方法。
实施例3
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现实施例1所述的交通流预测方法。
以上实施例为本申请的优选实施例,本领域的普通技术人员还可以在此基础上进行各种变换或改进,在不脱离本申请总的构思的前提下,这些变换或改进都应当属于本申请要求保护的范围之内。
Claims (10)
1.一种基于多重图注意力机制的交通流预测方法,其特征在于,包括:
获取若干训练样本:取T′+T个连续时刻的交通流数据作为一个训练样本,取前面的T′个连续时刻的交通流数据为历史交通流数据,记后面的T个连续时刻的交通流数据为真实交通流数据;
构建模型:将n个不同类型的交通流预测模型分别作为预测子模型,组合构建交通流预测生成组合模型;构建交通流预测优化模型,包括编码器、注意力机制模块、全连接层;
使用训练样本训练模型:使用每个预测子模型分别根据训练样本中的历史交通流数据进行交通流预测,得到对应的初始预测交通流数据;对历史交通流、初始预测交通流和交通流外部因素分别使用编码器进行编码,并利用注意力机制模块获取这三者的两两交互关系,再将得到的两两交互关系张量连接并由全连接层处理得到次级预测交通流;对全连接层输出的次级预测交通流进行第一次评分,以及根据训练样本中的真实交通流数据对初始预测交通流进行第二次评分,以通过两次评分的交叉熵对交通流预测生成组合模型和交通流预测优化模型进行整体训练;
交通流预测与优化:获取当前最近T′个连续时刻的交通流数据,输入至训练完毕的交通流预测生成组合模型中的每个预测子模型;训练完毕的交通流预测生成组合模型和交通流预测优化模型,分别输出当前之后T个连续时刻的初始预测交通流和次级预测交通流;对次级预测交通流进行第一次评分,并根据第一次评分结果计算每个预测子模型的预测概率,再利用预测概率对初始预测交通流进行加权计算,得到当前之后T个连续时刻的最终预测交通流。
3.根据权利要求1所述的方法,其特征在于,所述交通流外部因素包括:天气、节假日、事件和事故,路段的特征包括:速度、时间占有率、空间占有率。
4.根据权利要求1所述的方法,其特征在于,n个不同类型的交通流预测模型,分别为:扩散卷积循环神经网络DCRNN、时空图卷积网络ST-GCN、图多注意网络GMAN和动态时空图卷积神经网络DGCNN。
5.根据权利要求1所述的方法,其特征在于,交通流预测优化模型包括3个编码器,其中:
用于对历史交通流编码的编码器,采用1个时间卷积层和1个单向的长短期记忆层构成,将最后一个隐藏状态作为历史交通流的运动编码;
用于对初始预测交通流编码的编码器,采用1个时间卷积层和1个单向的长短期记忆层构成,将最后一个隐藏状态作为历史交通流的运动编码;
用于对交通流外部因素编码的编码器,采用1个时间卷积层和1个双向的长短期记忆层构成,将隐藏状态序列作为交通流外部因素的编码。
6.根据权利要求1所述的方法,其特征在于,交通流预测优化模型包括3个注意力机制模块,每个注意力机制模块均利用缩放点积注意力,并采用的是键映射、查询映射和值映射的线性层;
第一个注意力机制模块,将每个编码后的交通流外部因素嵌入到编码后的历史交通流中,得到交通流外部因素与历史交通流之间的相互关系,记为历史交通流张量;
第二个注意力机制模块,将每个编码后的交通流外部因素嵌入到编码后的初始预测交通流中,得到交通流外部因素与初始预测交通流之间的相互关系,记为初始预测交通流张量;
第三个注意力机制模块,将所有编码后的初始预测交通流相互融合,得到不同初始预测交通流之间的相互关系,记为初始预测交通流相互张量。
7.根据权利要求1所述的方法,其特征在于,对次级预测交通流进行第一次评分的计算式为:
式中,S1为第一次评分值,Ui,j表示将注意力机制模块得到的两两交互关系张量连接得到的包含全部交通流信息的张量,f′()表示全连接层处理,i用于区分不同的交通流外部因素,l为交通流外部因素的个数,j用于区分不同的预测子模型,n表示预测子模型的个数;
对初始预测交通流进行第二次评分的计算式为:
式中,S2为第二次评分值,FGT表示训练样本中的真实交通流数据,Fj表示第j个预测子模型得到的初始预测交通流,Dist(·)表示累积的距离平方误差,τ表示温度因子;
两次评分的交叉熵可表示为:
λ=CrossEntropy(S1(Fi,j),S2(Fj))
式中,λ为得到的交叉熵值,CrossEntropy()为交叉熵函数。
9.一种电子设备,包括存储器及处理器,所述存储器中存储有计算机程序,其特征在于,所述计算机程序被所述处理器执行时,使得所述处理器实现如权利要求1~8中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110868311.XA CN113762338B (zh) | 2021-07-30 | 2021-07-30 | 一种基于多重图注意力机制的交通流预测方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110868311.XA CN113762338B (zh) | 2021-07-30 | 2021-07-30 | 一种基于多重图注意力机制的交通流预测方法、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113762338A true CN113762338A (zh) | 2021-12-07 |
CN113762338B CN113762338B (zh) | 2023-08-25 |
Family
ID=78788195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110868311.XA Active CN113762338B (zh) | 2021-07-30 | 2021-07-30 | 一种基于多重图注意力机制的交通流预测方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113762338B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114566047A (zh) * | 2022-03-02 | 2022-05-31 | 中远海运科技股份有限公司 | 一种基于短时路况预测算法的预警方法及系统 |
CN114582128A (zh) * | 2022-03-10 | 2022-06-03 | 浙江大学 | 基于图离散注意力网络的交通流预测方法、介质及设备 |
CN116597657A (zh) * | 2023-07-17 | 2023-08-15 | 四川省商投信息技术有限责任公司 | 基于人工智能的城市交通预测方法、设备及介质 |
CN116824838A (zh) * | 2022-11-07 | 2023-09-29 | 苏州规划设计研究院股份有限公司 | 基于自适应时间序列分解的路网级交通流集成预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754605A (zh) * | 2019-02-27 | 2019-05-14 | 中南大学 | 一种基于注意力时态图卷积网络的交通预测方法 |
WO2020010717A1 (zh) * | 2018-07-13 | 2020-01-16 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
US20200097815A1 (en) * | 2018-09-21 | 2020-03-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for predicting passenger flow |
CN111292534A (zh) * | 2020-02-13 | 2020-06-16 | 北京工业大学 | 一种基于聚类与深度序列学习的交通状态估计方法 |
CN112801404A (zh) * | 2021-02-14 | 2021-05-14 | 北京工业大学 | 一种基于自适应空间自注意力图卷积的交通预测方法 |
CN113112793A (zh) * | 2021-03-29 | 2021-07-13 | 华南理工大学 | 一种基于动态时空相关性的交通流预测方法 |
-
2021
- 2021-07-30 CN CN202110868311.XA patent/CN113762338B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020010717A1 (zh) * | 2018-07-13 | 2020-01-16 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
US20200097815A1 (en) * | 2018-09-21 | 2020-03-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for predicting passenger flow |
CN109754605A (zh) * | 2019-02-27 | 2019-05-14 | 中南大学 | 一种基于注意力时态图卷积网络的交通预测方法 |
CN111292534A (zh) * | 2020-02-13 | 2020-06-16 | 北京工业大学 | 一种基于聚类与深度序列学习的交通状态估计方法 |
CN112801404A (zh) * | 2021-02-14 | 2021-05-14 | 北京工业大学 | 一种基于自适应空间自注意力图卷积的交通预测方法 |
CN113112793A (zh) * | 2021-03-29 | 2021-07-13 | 华南理工大学 | 一种基于动态时空相关性的交通流预测方法 |
Non-Patent Citations (1)
Title |
---|
杜圣东;李天瑞;杨燕;王浩;谢鹏;洪西进;: "一种基于序列到序列时空注意力学习的交通流预测模型", 计算机研究与发展, no. 08 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114566047A (zh) * | 2022-03-02 | 2022-05-31 | 中远海运科技股份有限公司 | 一种基于短时路况预测算法的预警方法及系统 |
CN114582128A (zh) * | 2022-03-10 | 2022-06-03 | 浙江大学 | 基于图离散注意力网络的交通流预测方法、介质及设备 |
CN116824838A (zh) * | 2022-11-07 | 2023-09-29 | 苏州规划设计研究院股份有限公司 | 基于自适应时间序列分解的路网级交通流集成预测方法 |
CN116597657A (zh) * | 2023-07-17 | 2023-08-15 | 四川省商投信息技术有限责任公司 | 基于人工智能的城市交通预测方法、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113762338B (zh) | 2023-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Veres et al. | Deep learning for intelligent transportation systems: A survey of emerging trends | |
CN111161535B (zh) | 基于注意力机制的图神经网络交通流量预测方法及系统 | |
CN109697852B (zh) | 基于时序交通事件的城市道路拥堵程度预测方法 | |
Liu et al. | Contextualized spatial–temporal network for taxi origin-destination demand prediction | |
CN113762338B (zh) | 一种基于多重图注意力机制的交通流预测方法、设备及介质 | |
CN115240425B (zh) | 一种基于多尺度时空融合图网络的交通预测方法 | |
CN110570651A (zh) | 一种基于深度学习的路网交通态势预测方法及系统 | |
CN112330215B (zh) | 一种城市用车需求量预测方法、设备及存储介质 | |
CN109493599A (zh) | 一种基于生成式对抗网络的短时交通流预测方法 | |
CN111738535A (zh) | 轨道交通时空短时客流预测方法、装置、设备及存储介质 | |
CN112863180B (zh) | 交通速度预测方法、装置、电子设备及计算机可读介质 | |
CN116128122B (zh) | 一种考虑突发因素的城市轨道交通短时客流预测方法 | |
CN115273464A (zh) | 一种基于改进的时空Transformer的交通流量预测方法 | |
Li et al. | Origin and destination forecasting on dockless shared bicycle in a hybrid deep-learning algorithms | |
CN111242395B (zh) | 用于od数据的预测模型构建方法及装置 | |
CN114692984A (zh) | 基于多步耦合图卷积网络的交通预测方法 | |
CN114299723A (zh) | 一种交通流量预测方法 | |
CN115204478A (zh) | 一种结合城市兴趣点和时空因果关系的公共交通流量预测方法 | |
US20240143999A1 (en) | Multi-modal data prediction method based on causal markov model | |
Deng et al. | The pulse of urban transport: Exploring the co-evolving pattern for spatio-temporal forecasting | |
Xing et al. | A data fusion powered bi-directional long short term memory model for predicting multi-lane short term traffic flow | |
Dai et al. | Spatio-temporal deep learning framework for traffic speed forecasting in IoT | |
CN115862324A (zh) | 一种智慧交通的时空同步图卷积神经网络及交通预测方法 | |
CN113159371B (zh) | 基于跨模态数据融合的未知目标特征建模与需求预测方法 | |
Miao et al. | A queue hybrid neural network with weather weighted factor for traffic flow prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |