CN116187555A - 基于自适应动态图的交通流预测模型构建方法及预测方法 - Google Patents
基于自适应动态图的交通流预测模型构建方法及预测方法 Download PDFInfo
- Publication number
- CN116187555A CN116187555A CN202310124440.7A CN202310124440A CN116187555A CN 116187555 A CN116187555 A CN 116187555A CN 202310124440 A CN202310124440 A CN 202310124440A CN 116187555 A CN116187555 A CN 116187555A
- Authority
- CN
- China
- Prior art keywords
- time
- traffic flow
- node
- space
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000010586 diagram Methods 0.000 title claims abstract description 32
- 238000010276 construction Methods 0.000 title claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims abstract description 84
- 239000013598 vector Substances 0.000 claims abstract description 78
- 230000003068 static effect Effects 0.000 claims abstract description 24
- 230000003993 interaction Effects 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims description 44
- 230000003044 adaptive effect Effects 0.000 claims description 40
- 230000004927 fusion Effects 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 14
- 230000007246 mechanism Effects 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000005096 rolling process Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 201000010099 disease Diseases 0.000 claims description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 10
- 230000008859 change Effects 0.000 abstract description 6
- 239000012633 leachable Substances 0.000 abstract description 6
- 230000000875 corresponding effect Effects 0.000 description 15
- 230000009286 beneficial effect Effects 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 5
- 238000009825 accumulation Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Biophysics (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明属于智能交通领域,具体涉及基于自适应动态图的交通流预测模型构建方法及预测方法,包括:计算路网上节点时间序列相似度,构建路网静态邻接矩阵;为路网节点分配可学习嵌入向量,与时间编码结合为时空编码,构建动态邻接图,表示节点关系的时间演化;将静态邻接矩阵与动态邻接矩阵融合得到自适应动态邻接矩阵;构建图卷积编码器‑解码器网络结构,将交通流数据与动态邻接矩阵输入编码器,通过自适应动态图卷积循环网络进行特征提取;通过编码器和解码器之间的交互注意力,对编码器输出特征进行加权融合;将带有权重的特征输入解码器,得到交通流预测值。本发明能够有效预测交通流时空变化特征和规律,预测精度高,提升交通流预测效果。
Description
技术领域
本发明属于智能交通领域,更具体地,涉及基于自适应动态图的交通流预测模型构建方法及预测方法。
背景技术
随着大数据与物联网的快速发展,城市建设呈现出智能化的特点。交通线路中,感应线圈、微波雷达和地磁等传感器记录了大量数据,这些数据为智能交通系统(ITS)提供了有力支持。交通预测作为ITS的重要组成部分,可以在交通动态规划中发挥重要作用,为交通部门制定科学决策提供重要依据。交通数据由多数量、多类别传感器采集而来,不仅每条时序数据有复杂的自身相关性,错综分布的路网结构也导致数据之间存在潜在的相互依赖性。因此,交通流预测不同于一般的多变量时序预测问题,还应考虑路网拓扑结构导致的各个变量之间复杂的依赖关系。
目前大多数基于图卷积的交通预测方法,需要预先定义邻接矩阵,以此表示节点间依赖关系,也有少部分研究自适应地学习节点间依赖关系,然而这种方法获取的图邻接矩阵是静态的,是不随时间变化的。在实际交通状况中,节点之间的关系存在动态变化模式,静态图无法准确描述现实情况。现有图神经网络在构建交通流预测模型时,往往分别处理时间与空间维度的特征,这种策略将时空信息独立建模,导致模型不能获取全局信息,从而影响模型预测效果。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种基于自适应动态图的交通流预测模型构建方法及预测方法,其目的在于通过获取路网的全局信息以提高模型预测精度。
为实现上述目的,按照本发明的一个方面,提供了一种基于自适应动态图的交通流预测模型构建方法,包括:构建图卷积编码器-解码器网络结构以及训练样本集,通过迭代训练得到交通流预测模型;
其中,所述训练样本集中每个训练样本包括该训练样本所取时间段前Q时间步对应的Q个时刻的自适应动态图以及后P时间步对应的P个时刻的交通流标签数据;时刻tj的自适应动态图由路网的静态邻接矩阵与路网在时刻tj的自适应邻接矩阵融合得到,自适应邻接矩阵是通过对路网各节点在时刻tj的时空编码向量进行拼接处理得到,且融合权重以及拼接处理权重均为所述迭代训练过程中的待学习参数;
所述时空编码向量的构建方式为:为每个节点分配一个空间嵌入向量,空间嵌入向量作为网络参数,在所述迭代训练过程中学习得到;将所述所取时间段在不同时间尺度下划分多个时间步,将各时间尺度下的时间特征编码为向量并进行拼接和降维,得到多个时刻的时间嵌入向量,该降维权重为所述迭代训练过程中的待学习参数;将时刻tj的时间嵌入向量与节点vi的所述空间嵌入向量加权融合,得到节点vi在时刻tj的时空编码向量。
本发明的有益效果为:本发明方法为了充分利用路网结构信息,在构建训练样本时,提出了动态时空嵌入方法,融合时空特征,包含多尺度时间嵌入与空间嵌入,构建随时间变化的自适应邻接矩阵。空间嵌入将节点编码为能够表示图结构信息的静态向量,时间嵌入将每个时间步的时间信息编码成特征向量。两个向量结合构成时空编码向量,每个节点对应的多个时空编码向量,能够表示节点相关性的动态时空演化。因此,采用本方法所构建的预测模型能够有效预测交通流的时空变化特征和规律,预测精度高,具有较佳的交通流预测效果。
进一步,所述融合方式为加权求和,两个权重的加和取值为1。
本发明的进一步有益效果时:采用加权的方式,可以既考虑静态的空间信息,又考虑随时间变化的信息。,同时涉及到的参数比较少,方式简单高效。
进一步,所述图卷积编码器-解码器网络结构中的编码器单元采用门控循环单元GGRU;
其中,所述门控循环单元GGRU是由动态自适应图卷积与门控循环单元GRU结合得到,且动态自适应图卷积的图卷积方式为:W=ESWS;式中,H表示隐藏特征矩阵;I表示单位矩阵;表示时刻tj对应的自适应动态图;表示时刻tj的交通流数据;W∈RN×2×F×h为权重矩阵,ES∈RN×e为由各节点的空间嵌入向量所构成的空间嵌入矩阵,N为节点总个数,e为每个节点的空间嵌入向量的维度;WS∈Re×2×F×h为权重矩阵,是待学习的节点共享参数。
本发明的进一步有益效果是:考虑到谱图卷积中权重矩阵为共享参数,而对于交通流数据,某些节点之间的交通流序列模式存在一定相似性,而某些节点之间的交通流模式可能毫不相关,权重矩阵作为共享参数,对于节点学习不够突出,因此重新定义谱图卷积,利用张量分解的方法,令谱图卷积中的权重矩阵为ES和WS的乘积,其中,ES∈RN×e为节点嵌入向量构成的矩阵,WS∈Re×2×F×h为权重矩阵,作为节点共享参数。在能够突出学习节点之间的不同相似性的同时,参数量不大且收敛速度快。
进一步,图卷积编码器-解码器网络结构中的编码器采用Q个GGRU级联连接;在进行编码操作时,将每个训练样本所取时间段前Q时间步对应的Q个时刻的自适应动态图和交通流数据对应输入级联连接的Q个门控循环单元GGRU,并将由各节点的空间嵌入向量所构成的空间嵌入矩阵分别输入所述Q个门控循环单元GGRU,每个GGRU根据其输入信息进行编码输出,编码方式具体为:
式中,表示当前时刻tj对应的自适应动态图;为当前时刻tj的交通流数据;表示输出门的输出;分别为输出门所输出的上一时刻tj-1和当前时刻tj的输入数据的隐藏特征;为重置门的输出;为更新门的输出;σ为sigmoid激活函数;⊙为哈达玛积;Θr、Θz和Θh表示图卷积。
本发明的进一步有益效果是:每个GGRU的编码操作融合前述提到的动态自适应图卷积,该动态自适应卷积能够突出学习节点之间的不同相似性的同时,参数量不大且收敛速度快,因此,每个GGRU能够较为适应路网的具体场景。
进一步,在每一次迭代训练的过程中,为编码器中各GGRU的输出分配权重,作为图卷积编码器-解码器网络结构中的解码器的输入,其中,权重分配方式为:
式中,D为特征变换后的维度,K为注意力机制头数,f1、f2、f3为全连接层,用于维度变换;表示节点vi经过编码器编码输出的隐藏特征;表示节点vi经过交互注意力得到的隐藏特征,所有节点在时刻t′的经过交互注意力得到的隐藏特征表示为Ct′∈RN×D;γt,t′ (k)表示注意力分数;αt,t′ (k)表示注意力系数;t′=tQ+1,tQ+2,...,tQ+P;表示节点vi在过去Q步的时空编码矩阵;表示节点vi在未来P步的时空编码矩阵。
本发明的进一步有益效果是:本发明基于时空编码向量,在编码器和解码器之间引入一种交互注意力机制,用于对编码器的输出分配权重并输入解码器,以将历史交通流特征转换为未来交通流特征。这种注意力机制学习了历史和未来时间步之间的直接映射关系,以避免多步递归预测中错误累积的问题。
进一步,所述静态邻接矩阵通过动态时间规整算法构建得到。
本发明的进一步有益效果是:基于动态规划思想,将两两节点间的历史时间序列数据之间的距离调整到最小,得到最小化的节点相关性矩阵,矩阵中各元素数值越小表明对应的两个节点之间的交通流序列越相似,该方法精度高,提高预测模型的训练效果。
本发明还提供一种基于自适应动态图的交通流预测方法,包括:
根据历史交通流数据,构建历史多时刻的自适应动态图;
采用如上所述的一种基于自适应动态图的交通流预测模型构建方法所构建得到的交通流预测模型,根据历史多时刻的自适应动态图,预测得到未来交通流数据。
本发明的有益效果是:本方法采用前述的基于自适应动态图的交通流预测模型构建方法所构建的交通流预测模型,进行交通流预测。由于在交通流预测模型的构建过程中,通过融合时空特征的方式来构建训练样本,具体的,时空特征包含多尺度时间嵌入与空间嵌入,通过对各个节点的时空特征拼接融合,构建随时间变化的自适应邻接矩阵,其中,空间嵌入是指将节点编码为能够表示图结构信息的静态向量,时间嵌入是指将每个时间步的时间信息编码成特征向量。两个向量结合构成时空编码向量,每个节点对应多个时空编码向量,能够表示节点相关性的动态时空演化。因此,本方法所采用的预测模型能够有效预测交通流的时空变化特征和规律,预测精度高,具有较佳的交通流预测效果。
进一步,在预测的过程中,所述交通流预测模型中各编码器单元的输出经分配权重后作为解码器的输入,权重分配方式如上所述。
本发明的进一步有益效果是:本方法在执行预测过程中,引入上述交互注意力机制,用于对编码器的输出分配权重并输入解码器,以将历史交通流特征转换为未来交通流特征。这种注意力机制学习了历史和未来时间步之间的直接映射关系,以避免多步递归预测中错误累积的问题。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序被处理器运行时控制所述存储介质所在设备执行如上所述的一种基于自适应动态图的交通流预测模型构建方法和/或如上所述的一种基于自适应动态图的交通流预测方法。
总体而言,通过本发明所构思的以上技术方案,能够取得以下有益效果:
本发明公开了一种自适应动态图卷积循环网络交通流预测方法,包括:计算路网上节点时间序列的相似度,构建路网静态邻接矩阵;为路网节点分配一组可学习的嵌入向量,与时间编码结合为时空编码,并以此构建动态邻接图,用以表示节点关系的时间演化;将静态邻接矩阵与动态邻接矩阵融合,得到自适应动态邻接矩阵;构建图卷积编码器-解码器网络结构,将交通流数据与动态邻接矩阵共同输入编码器,通过自适应动态图卷积循环网络进行特征提取;通过编码器和解码器之间的交互注意力模块,对编码器输出特征进行加权融合;将带有权重的特征输入解码器,得到交通流预测值。本发明方法能够有效预测交通流的时空变化特征和规律,预测精度高,提升了交通流预测效果。
附图说明
图1为本发明实施例提供的基于图卷积编码器-解码器网络结构的交通流预测模型整体框架图;
图2为本发明实施例提供的融合自适应图卷积的门控循环单元的具体内部结构图;
图3为本发明实施例提供的PeMSD4数据集中0号节点上交通流量的实际值与预测值的对比图;
图4为本发明实施例提供的PeMSD8数据集中0号节点上交通流量的实际值与预测值的对比图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例一
一种基于自适应动态图的交通流预测模型构建方法,包括:构建图卷积编码器-解码器网络结构以及训练样本集,通过迭代训练得到交通流预测模型;
其中,训练样本集中每个训练样本包括该训练样本所取时间段前Q时间步对应的Q个时刻的自适应动态图以及后P时间步对应的P个时刻的交通流标签数据;时刻tj的自适应动态图由路网的静态邻接矩阵与路网在时刻tj的自适应邻接矩阵融合得到,自适应邻接矩阵是通过对路网各节点在时刻tj的时空编码向量进行拼接处理得到,且融合权重以及拼接处理权重均为所述迭代训练过程中的待学习参数;
时空编码向量的构建方式为:为每个节点分配一个空间嵌入向量,空间嵌入向量作为网络参数,在所述迭代训练过程中学习得到;将所取时间段在不同时间尺度下划分多个时间步,将各时间尺度下的时间特征编码为向量并进行拼接和降维,得到多个时刻的时间嵌入向量,该降维权重为上述迭代训练过程中的待学习参数;将时刻tj的时间嵌入向量与节点vi的上述空间嵌入向量加权融合,得到节点vi在时刻tj的时空编码向量。
本实施例方法采用Q个时刻的自适应动态图来预测未来时间步的交通流数据,由于时刻tj的自适应动态图由路网的静态邻接矩阵与路网在时刻tj的自适应邻接矩阵融合得到,而自适应邻接矩阵是通过对路网各节点在时刻tj的时空编码向量进行拼接处理得到,因此Q个时刻的自适应动态图拼接可构成路网的自适应邻接矩阵,能够表示节点关系的时间演化。
本方法提出了动态时空嵌入方法,包含多尺度时间嵌入与空间嵌入。空间嵌入将节点编码为能够表示图结构信息的静态向量,时间嵌入将每个时间步的时间信息编码成特征向量。两个向量结合构成时空编码向量,每个节点对应的多个时空编码向量,能够表示节点相关性的动态时空演化。因此,本方法能够有效预测交通流的时空变化特征和规律,预测精度高,具有较佳的交通流预测效果。其中,将融合的权重以及拼接的权重作为待学习参数,自适应性强,提高预测精度。
具体的,关于时空编码向量的构建,实现方式例如:(1)学习空间嵌入矩阵。为每个节点分配一个维度为e的嵌入向量vi∈V。节点嵌入向量作为网络参数随机初始化,通过网络训练得到最终学习表示。节点嵌入向量构成的空间嵌入矩阵,表示为ES∈RN×e,是一个向量。(2)学习时间嵌入矩阵。提取时间特征,包括时刻特征与日特征。根据数据记录时间间隔,将一天划分为Td个时间步,例如,每5分钟记录一条数据,则Td=288;一周天数为7天,令Tw=7,将两个时间特征分别编码为one-hot向量,得到eTw∈R7,通过向量拼接得到维度为的向量,将其输入多层全连接网络,层间采用ReLU函数激活,最后得到每个时间点j的时间嵌入ei T∈Re,维度与节点嵌入一致。(3)将时间嵌入与空间嵌入矩阵相加融合,得到时空编码矩阵。对于节点vi∈V,在时刻tj的时空编码向量为时空编码的构造方式简单直接、无需过多参数,却是整体网络的核心,用于实现动态图演化,也是从历史到未来进行转换的关键,本方法通过自动学习的方式来学习路网中节点在空间上的依赖关系,适应性强。
可作为进一步优选的实施方案,图卷积编码器-解码器网络结构中的编码器单元采用门控循环单元GGRU;
其中,门控循环单元GGRU是由动态自适应图卷积与门控循环单元GRU结合得到,且动态自适应图卷积的图卷积方式为: W=ESWS;式中,H表示隐藏特征矩阵;I表示单位矩阵;表示时刻tj对应的自适应动态图;表示时刻tj的交通流数据;W∈RN×2×F×h为权重矩阵,ES∈RN×e为由各节点的空间嵌入向量所构成的空间嵌入矩阵,N为节点总个数,e为每个节点的空间嵌入向量的维度;WS∈Re×2×F×h为权重矩阵,是待学习的节点共享参数。
现对上述卷积方式进行说明如下:
通常谱图卷积公式为:其中,W∈R2×F×h为权重矩阵,是待学习参数。对于图中节点,图卷积的W是参数共享的,共享参数的方式有助于学习所有节点最突出的模式,但是对于交通流数据可能是次优的。某些节点之间的交通流序列模式存在一定相似性,而某些节点之间的交通流模式可能毫不相关。一种直接简单的方法是为每个节点分配唯一的参数空间,参数矩阵表示为W′∈RN×2×F×h,这会造成参数量过大,出现难以收敛等问题。因此考虑采用张量分解的方法,令W'=ESWS,其中,ES∈RN×e为节点嵌入向量构成的矩阵,WS∈Re×2×F×h为权重矩阵,是节点共享参数。重新定义图卷积:
进一步,图卷积编码器-解码器网络结构中的编码器采用Q个GGRU级联连接;在进行编码操作时,将每个训练样本所取时间段前Q时间步对应的Q个时刻的自适应动态图和交通流数据对应输入级联连接的Q个门控循环单元GGRU,并将由各节点的空间嵌入向量所构成的空间嵌入矩阵分别输入所述Q个门控循环单元GGRU,每个GGRU根据其输入信息进行编码输出,编码方式具体为:
式中,表示当前时刻tj对应的自适应动态图;为当前时刻tj的交通流数据;表示输出门的输出;分别为输出门所输出的上一时刻tj-1和当前时刻tj的输入数据的隐藏特征;为重置门的输出;为更新门的输出;σ为sigmoid激活函数;⊙为哈达玛积;Θr、Θz和Θh表示图卷积。
GRU是LSTM的一种变体,通过门控机制来实现对当前时刻输入的控制和过去状态的信息保留,从而实现时序特征提取。不同的是,GRU只包含两个门,更新门与重置门,更新门的值越大,重置门的值越小,表示上一状态的信息保留得越少。将动态自适应图卷积与门控循环单元结合,对于时刻tj,图对应的自适应邻接矩阵为融合图卷积的门控循环单元内部计算公式如上。
在时空多步预测任务上,一些模型采用递归输出方式,训练时使用真实历史时间序列作为下一时刻输入,测试时,将上一时刻输出作为下一时刻输入。由于训练集与测试集分布存在差异,这种方式会导致性能下降。为了降低多步预测的误差,减少输出时间,可作为进一步优选的实施方案,提出一种基于时空编码的注意力机制,计算未来时空编码与过去时空编码的注意力系数,为编码器输出的隐藏特征分配权重,得到解码器的输入表示。也就是,在每一次迭代训练的过程中,为编码器中各GGRU的输出分配权重,作为交通流预测网络中的解码器的输入,其中,权重分配方式为:
式中,D为特征变换后的维度,K为注意力机制头数,f1、f2、f3为全连接层,用于维度变换;表示节点vi经过编码器编码输出的隐藏特征;表示节点vi经过交互注意力得到的隐藏特征,所有节点在时刻t′的经过交互注意力得到的隐藏特征表示为Ct′∈RN×D;γt,t′ (k)表示注意力分数;αt,t′ (k)表示注意力系数;t′=tQ+1,tQ+2,...,tQ+P;表示节点vi在过去Q步的时空编码矩阵;表示节点vi在未来P步的时空编码矩阵。
可作为优选的实施方案,静态邻接矩阵通过动态时间规整算法构建得到。
具体的,采用动态时间规整DTW,计算路网上节点时间序列的相似度,构建路网静态邻接矩阵,并使用Top-K机制进行稀疏化。动态时间规整DTW常用于衡量两个长度不一致的时间序列的相关性。基于动态规划思想,将两两节点间的历史时间序列数据之间的距离调整到最小,得到最小化的节点相关性矩阵,矩阵中各元素数值越小表明对应的两个节点之间的交通流序列越相似,最后得到静态邻接矩阵Apre。
实施例二
一种基于自适应动态图的交通流预测方法,包括:
根据历史交通流数据,构建历史多时刻的自适应动态图;
采用如上实施例一所述的一种基于自适应动态图的交通流预测模型构建方法所构建得到的交通流预测模型,根据历史多时刻的自适应动态图,预测得到未来交通流数据。
可作为优选的实施方案,在预测的过程中,交通流预测模型中各编码器单元的输出经分配权重后作为解码器的输入,权重分配方式如实施例一所述。
为了说明本发明的实施效果,现给出如下实例实验:
(1)获取数据集。
选用两个公开数据集(PeMSD4、PeMSD8)进行实验。PeMSD4是从旧金山湾区307个检测点收集到的数据,日期为2018年1月1日至2018年2月29日,共59天。PeMSD8是从圣贝纳迪诺170个检测点收集到的数据,日期为2016年7月1日至2016年8月31日,共62天。两个数据集采样间隔都为5min,每个传感器记录特征包括经过路面的车流量、车速、道路占有率。实验前使用标准归一化对数据进行预处理,并将数据集按6∶2∶2的比例划分为训练集、验证集和测试集。
(2)实验设置
训练数据的批量大小设置为64,输入步长为12,输出步长选择6和12,即用前1h的数据预测未来30min和1h的交通流量。对于PeMSD4数据集,学习率设为0.005,对于PeMSD8数据集,学习率设为0.003,epoch设置为100,采用ADAM优化器,使用平均绝对误差(MeanAbsolute Error,MAE)作为损失函数。为了防止过拟合,使用Early Stopping策略(早停法),当验证集的误差连续10个epoch不下降时,停止训练。实验采用平均绝对误差(MeanAbsolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)作为评价指标。
选择了五个基线模型进行对比分析,分别是LSTM、DCRNN、STGCN、ASTGCN、AGCRN。其中,LSTM:长短期记忆网络,一种经典的时序网络,在实验中对每个节点分别搭建训练模型,该模型无法提取节点之间的空间依赖。STGCN:利用一维时序卷积来提取交通数据时间依赖,利用谱图卷积来提取路网空间依赖,将两个模块交替叠加。DCRNN:扩散卷积递归网络,将道路拓扑结构视为有向图,使用双向随机游走的方式获取图结构,将图卷积与GRU结合,构建编码器-解码器网络,递归输出未来预测值。ASTGCN:考虑不同尺度的交通流数据,分别对时、天、周三个时间属性建模,每个模块包含时间、空间注意力和时间、空间卷积。AGCRN:提出了自适应图卷积,通过学习节点嵌入向量构造邻接矩阵,结合GRU进行预测。
(3)实验结果及分析
实验结果如表1和表2所示。LSTM模型性能最差,原因是LSTM只能提取时间维度特征,无法利用道路拓扑信息。而其他基于图的预测模型考虑了节点之间的空间依赖性,因此,预测结果明显优于LSTM,而本实施例所构建模型(ADGCRN:Adaptive dynamic graphconvolutional recurrent network)实现了比其他模型更先进的预测性能。例如,对于PeMSD4数据集上1h的预测任务,ADGCRN在MAE上比AGCRN降低了5.31%,比DCRNN降低了11.62%,说明该模型在长期预测任务上有更优的表现。图3显示了ADGCRN在某工作日的预测能力,可以看出,在早高峰与晚高峰时,交通流量波动明显,但ADGCRN依然很好的拟合了“双峰”模式,捕捉到了流量的变化趋势,保持了较低的预测误差。ADGCRN采用可学习的方式捕获路网中节点隐藏作用关系,考虑了路网潜在拓扑结构随时间的演化。
在不增加过多参数的前提下,利用时间编码与节点嵌入矩阵结合,巧妙的将静态图转化为动态图,有助于提高预测精度。另外,时间编码除了用于生成动态图,还用于输入时空交互注意力层,一次性得到未来的输出表示,减少了递归输出的误差累积。
表1PeMSD4数据集实验结果
表2PeMSD8数据集实验结果
因此,通过动态时间规整方法得到交通流序列之间的相关性,构建非时变静态图,注意到交通流有显著的周期性特征,将时间编码与节点嵌入融合为时空编码,并以此构建随时间周期演化的动态图,静态图与动态图融合为自适应动态图。与交通流数据共同输入编码器。编码器由改进的自适应图卷积门控循环单元构成,提取交通流的时间、空间特征,编码器和解码器之间添加交互注意力模块,将提取到的时空特征进行加权融合。本方法通过对两个真实的公路交通数据集进行交通流预测实验,验证模型预测性能,结果表明,该模型取得了比其他模型更好的预测效果。
相关技术方案同实施例一,在此不再赘述。
实施例三
一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序被处理器运行时控制所述存储介质所在设备执行如上实施例一所述的一种基于自适应动态图的交通流预测模型构建方法和/或如上实施例二所述的一种基于自适应动态图的交通流预测方法。
相关技术方案同实施例一和实施例二,在此不再赘述。
总的来说,本发明公开了一种自适应动态图卷积循环网络交通流预测方法,包括:计算路网上节点时间序列的相似度,构建路网静态邻接矩阵;为路网节点分配一组可学习的嵌入向量,与时间编码结合为时空编码,并以此构建动态邻接图,用以表示节点关系的时间演化;将静态邻接矩阵与动态邻接矩阵融合,得到自适应动态邻接矩阵;构建图卷积编码器-解码器网络结构,将交通流数据与动态邻接矩阵共同输入编码器,通过自适应动态图卷积循环网络进行特征提取;通过编码器和解码器之间的交互注意力模块,对编码器输出特征进行加权融合;将带有权重的特征输入解码器,得到交通流预测值。本发明方法能够有效预测交通流的时空变化特征和规律,预测精度高,提升了交通流预测效果。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于自适应动态图的交通流预测模型构建方法,其特征在于,包括:构建图卷积编码器-解码器网络结构以及训练样本集,通过迭代训练得到交通流预测模型;
其中,所述训练样本集中每个训练样本包括该训练样本所取时间段前Q时间步对应的Q个时刻的自适应动态图以及后P时间步对应的P个时刻的交通流标签数据;时刻tj的自适应动态图由路网的静态邻接矩阵与路网在时刻tj的自适应邻接矩阵融合得到,自适应邻接矩阵是通过对路网各节点在时刻tj的时空编码向量进行拼接处理得到,且融合权重以及拼接处理权重均为所述迭代训练过程中的待学习参数;
所述时空编码向量的构建方式为:为每个节点分配一个空间嵌入向量,空间嵌入向量作为网络参数,在所述迭代训练过程中学习得到;将所述所取时间段在不同时间尺度下划分多个时间步,将各时间尺度下的时间特征编码为向量并进行拼接和降维,得到多个时刻的时间嵌入向量,该降维权重为所述迭代训练过程中的待学习参数;将时刻tj的时间嵌入向量与节点vi的所述空间嵌入向量加权融合,得到节点vi在时刻tj的时空编码向量。
2.根据权利要求1所述的交通流预测模型构建方法,其特征在于,所述融合方式为加权求和,两个权重的加和取值为1。
5.根据权利要求4所述的交通流预测模型构建方法,其特征在于,图卷积编码器-解码器网络结构中的编码器采用Q个GGRU级联连接;在进行编码操作时,将每个训练样本所取时间段前Q时间步对应的Q个时刻的自适应动态图和交通流数据对应输入级联连接的Q个门控循环单元GGRU,并将由各节点的空间嵌入向量所构成的空间嵌入矩阵分别输入所述Q个门控循环单元GGRU,每个GGRU根据其输入信息进行编码输出,编码方式具体为:
6.根据权利要求5所述的交通流预测模型构建方法,其特征在于,在每一次迭代训练的过程中,为编码器中各GGRU的输出分配权重,作为图卷积编码器-解码器网络结构中的解码器的输入,其中,权重分配方式为:
7.根据权利要求1所述的交通流预测模型构建方法,其特征在于,所述静态邻接矩阵通过动态时间规整算法构建得到。
8.一种基于自适应动态图的交通流预测方法,其特征在于,包括:
根据历史交通流数据,构建历史多时刻的自适应动态图;
采用如权利要求1至7任一项所述的一种基于自适应动态图的交通流预测模型构建方法所构建得到的交通流预测模型,根据历史多时刻的自适应动态图,预测得到未来交通流数据。
9.根据权利要求8所述的交通流预测方法,其特征在于,在预测的过程中,所述交通流预测模型中各编码器单元的输出经分配权重后作为解码器的输入,权重分配方式如权利要求6所述的一种基于自适应动态图的交通流预测模型构建方法所述。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序被处理器运行时控制所述存储介质所在设备执行如权利要求1至7任一项所述的一种基于自适应动态图的交通流预测模型构建方法和/或如权利要求8或9所述的一种基于自适应动态图的交通流预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310124440.7A CN116187555A (zh) | 2023-02-16 | 2023-02-16 | 基于自适应动态图的交通流预测模型构建方法及预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310124440.7A CN116187555A (zh) | 2023-02-16 | 2023-02-16 | 基于自适应动态图的交通流预测模型构建方法及预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116187555A true CN116187555A (zh) | 2023-05-30 |
Family
ID=86436060
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310124440.7A Pending CN116187555A (zh) | 2023-02-16 | 2023-02-16 | 基于自适应动态图的交通流预测模型构建方法及预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116187555A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116884215A (zh) * | 2023-07-14 | 2023-10-13 | 北京百度网讯科技有限公司 | 交通状态的预测、模型的生成方法、装置、设备及介质 |
CN116959257A (zh) * | 2023-08-14 | 2023-10-27 | 重庆邮电大学 | 基于自适应图嵌入的起始地-目的地时间预测方法和装置 |
CN117074627A (zh) * | 2023-10-16 | 2023-11-17 | 三科智能(山东)集团有限公司 | 基于人工智能的医疗实验室空气质量监测系统 |
CN117273241A (zh) * | 2023-11-17 | 2023-12-22 | 北京京东乾石科技有限公司 | 一种处理数据的方法和装置 |
CN117351239A (zh) * | 2023-10-11 | 2024-01-05 | 兰州交通大学 | 一种图卷积自编码器支持下的多尺度道路网相似性计算方法 |
CN117437776A (zh) * | 2023-10-18 | 2024-01-23 | 南昌大学 | 一种智能交通系统中交通流预测方法及其系统 |
CN117456736A (zh) * | 2023-12-22 | 2024-01-26 | 湘江实验室 | 基于多尺度时空动态交互网络的交通流量预测方法 |
CN117496699A (zh) * | 2023-10-30 | 2024-02-02 | 重庆邮电大学 | 一种面向多元交通流时空数据信息的交通流预测方法 |
CN117593045A (zh) * | 2024-01-19 | 2024-02-23 | 华侨大学 | 一种商用车辆需求预测方法、装置、设备及存储介质 |
CN118135788A (zh) * | 2024-02-17 | 2024-06-04 | 东莞理工学院 | 一种面向智慧城市的交通流态势预测方法及其感知设备 |
CN118522157A (zh) * | 2024-07-23 | 2024-08-20 | 中国电建集团西北勘测设计研究院有限公司 | 交通信息预测方法、装置、设备及介质 |
-
2023
- 2023-02-16 CN CN202310124440.7A patent/CN116187555A/zh active Pending
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116884215A (zh) * | 2023-07-14 | 2023-10-13 | 北京百度网讯科技有限公司 | 交通状态的预测、模型的生成方法、装置、设备及介质 |
CN116884215B (zh) * | 2023-07-14 | 2024-05-31 | 北京百度网讯科技有限公司 | 交通状态的预测、模型的生成方法、装置、设备及介质 |
CN116959257A (zh) * | 2023-08-14 | 2023-10-27 | 重庆邮电大学 | 基于自适应图嵌入的起始地-目的地时间预测方法和装置 |
CN117351239A (zh) * | 2023-10-11 | 2024-01-05 | 兰州交通大学 | 一种图卷积自编码器支持下的多尺度道路网相似性计算方法 |
CN117074627A (zh) * | 2023-10-16 | 2023-11-17 | 三科智能(山东)集团有限公司 | 基于人工智能的医疗实验室空气质量监测系统 |
CN117074627B (zh) * | 2023-10-16 | 2024-01-09 | 三科智能(山东)集团有限公司 | 基于人工智能的医疗实验室空气质量监测系统 |
CN117437776B (zh) * | 2023-10-18 | 2024-09-06 | 南昌大学 | 一种智能交通系统中交通流预测方法及其系统 |
CN117437776A (zh) * | 2023-10-18 | 2024-01-23 | 南昌大学 | 一种智能交通系统中交通流预测方法及其系统 |
CN117496699A (zh) * | 2023-10-30 | 2024-02-02 | 重庆邮电大学 | 一种面向多元交通流时空数据信息的交通流预测方法 |
CN117496699B (zh) * | 2023-10-30 | 2024-09-10 | 重庆邮电大学 | 一种面向多元交通流时空数据信息的交通流预测方法 |
CN117273241B (zh) * | 2023-11-17 | 2024-04-05 | 北京京东乾石科技有限公司 | 一种处理数据的方法和装置 |
CN117273241A (zh) * | 2023-11-17 | 2023-12-22 | 北京京东乾石科技有限公司 | 一种处理数据的方法和装置 |
CN117456736B (zh) * | 2023-12-22 | 2024-03-12 | 湘江实验室 | 基于多尺度时空动态交互网络的交通流量预测方法 |
CN117456736A (zh) * | 2023-12-22 | 2024-01-26 | 湘江实验室 | 基于多尺度时空动态交互网络的交通流量预测方法 |
CN117593045A (zh) * | 2024-01-19 | 2024-02-23 | 华侨大学 | 一种商用车辆需求预测方法、装置、设备及存储介质 |
CN117593045B (zh) * | 2024-01-19 | 2024-04-09 | 华侨大学 | 一种商用车辆需求预测方法、装置、设备及存储介质 |
CN118135788A (zh) * | 2024-02-17 | 2024-06-04 | 东莞理工学院 | 一种面向智慧城市的交通流态势预测方法及其感知设备 |
CN118522157A (zh) * | 2024-07-23 | 2024-08-20 | 中国电建集团西北勘测设计研究院有限公司 | 交通信息预测方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116187555A (zh) | 基于自适应动态图的交通流预测模型构建方法及预测方法 | |
Busari et al. | Crude oil price prediction: A comparison between AdaBoost-LSTM and AdaBoost-GRU for improving forecasting performance | |
CN115240425B (zh) | 一种基于多尺度时空融合图网络的交通预测方法 | |
CN116128122B (zh) | 一种考虑突发因素的城市轨道交通短时客流预测方法 | |
CN114299723B (zh) | 一种交通流量预测方法 | |
CN112863180A (zh) | 交通速度预测方法、装置、电子设备及计算机可读介质 | |
Zheng et al. | Hybrid deep learning models for traffic prediction in large-scale road networks | |
CN110570035B (zh) | 同时建模时空依赖性和每日流量相关性的人流量预测系统 | |
CN113762338B (zh) | 一种基于多重图注意力机制的交通流预测方法、设备及介质 | |
CN112988851B (zh) | 反事实预测模型数据处理方法、装置、设备及存储介质 | |
CN115688871A (zh) | 基于预训练增强的多元时间序列预测方法及系统 | |
CN113112793A (zh) | 一种基于动态时空相关性的交通流预测方法 | |
CN115348182B (zh) | 一种基于深度堆栈自编码器的长期频谱预测方法 | |
CN110889560A (zh) | 一种具有深度可解释性的快递序列预测的方法 | |
CN117875520B (zh) | 基于动态图时空演化挖掘的公共安全事件预测方法及系统 | |
Li et al. | Cycle-based signal timing with traffic flow prediction for dynamic environment | |
Wu et al. | Learning spatial–temporal pairwise and high-order relationships for short-term passenger flow prediction in urban rail transit | |
CN117593878A (zh) | 一种突发事件下的城市轨道交通短时od需求预测方法 | |
CN113190632B (zh) | 一种轨迹复原算法的模型建立方法及系统 | |
CN114882364A (zh) | 数据处理方法、服务器和存储介质 | |
Liu et al. | OD demand forecasting for the large-scale dockless sharing bike system: a deep learning approach | |
Ma et al. | Data Model of Key Indicators of Urban Architectural Design Based on Long‐and Short‐Term Convolutional Memory Network | |
CN116050640B (zh) | 基于自适应多图卷积的多模式交通系统短时客流预测方法 | |
CN117496699B (zh) | 一种面向多元交通流时空数据信息的交通流预测方法 | |
CN118587893B (zh) | 基于动态自适应卷积神经网络的城市交通流预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |