CN116205383A - 一种基于元学习的静态动态协同图卷积交通预测方法 - Google Patents
一种基于元学习的静态动态协同图卷积交通预测方法 Download PDFInfo
- Publication number
- CN116205383A CN116205383A CN202310496971.9A CN202310496971A CN116205383A CN 116205383 A CN116205383 A CN 116205383A CN 202310496971 A CN202310496971 A CN 202310496971A CN 116205383 A CN116205383 A CN 116205383A
- Authority
- CN
- China
- Prior art keywords
- graph
- convolution
- dynamic
- features
- static
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003068 static effect Effects 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000000284 extract Substances 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 38
- 230000003044 adaptive effect Effects 0.000 claims description 22
- 238000009792 diffusion process Methods 0.000 claims description 22
- 238000004220 aggregation Methods 0.000 claims description 19
- 238000013507 mapping Methods 0.000 claims description 19
- 230000002776 aggregation Effects 0.000 claims description 17
- 230000002123 temporal effect Effects 0.000 claims description 14
- 238000010586 diagram Methods 0.000 claims description 10
- 238000012546 transfer Methods 0.000 claims description 10
- 230000007246 mechanism Effects 0.000 claims description 8
- 230000004931 aggregating effect Effects 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 4
- 238000006116 polymerization reaction Methods 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 2
- 230000006978 adaptation Effects 0.000 claims 1
- 230000009471 action Effects 0.000 abstract description 4
- 238000000605 extraction Methods 0.000 description 8
- 230000002596 correlated effect Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 238000005096 rolling process Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000002679 ablation Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
- G08G1/0145—Measuring and analyzing of parameters relative to traffic conditions for specific applications for active traffic flow control
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Analytical Chemistry (AREA)
- Marketing (AREA)
- Chemical & Material Sciences (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Educational Administration (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于元学习的静态动态协同图卷积交通预测方法,采用堆叠图卷积单元的图卷积模块来提取时空特征,每个图卷积单元包括一个基于元学习的时间门控卷积层M‑TGCL和一个静态动态协同图卷积层SDCGCL,M‑TGCL采用元学习来增强空间和时间特征之间的联系,从而能够对拥堵传播过程进行建模,考虑到静态因素和动态因素对交通流量的单独作用和共同作用,SDCGCL旨在对这两类因素进行协同建模,以深入提取空间特征。为了适应不同道路上局部交通状况的多样性,根据特定局部交通状况选择性地聚合不同层次的时空特征,使模型能够提取出细粒度的时空特征,提高了预测模型的稳健性和预测的可靠性。
Description
技术领域
本申请属于交通预测技术领域,尤其涉及一种基于元学习的静态动态协同图卷积交通预测方法。
背景技术
作为智能交通系统的重要组成部分,交通流量预测对于许多交通应用场景至关重要,如提供交通信息以缓解交通拥堵并为交通管理者决策提供便利。交通流量预测旨在通过分析历史交通状况以预测未来交通流量。然而,交通数据中隐含的复杂时空特征使得实现准确可靠的交通流量预测具有很大的挑战性。
到目前为止,学者们已经开展了许多研究工作,通过捕获时空特征来提高交通流量预测的准确性和可靠性,其中时空模型受到了广泛关注。本质上,时空模型通过分析不同道路上交通流量的相互作用以提取空间特征,并对每条道路上的交通流量进行序列建模以提取时间特征。虽然时空模型取得了可喜的进展,但仍然存在着导致交通流量预测准确性和可靠性不高的诸多问题。例如,现有模型通常不会在空间和时间特征之间建立深度联系,导致模型从交通数据中提取复杂时空特征的能力不足。又如,交通流量受到静态因素(如交通网络拓扑结构、区域功能相似性)和动态(如商业活动、交通事故)因素的单独作用和共同作用的影响。然而,现有模型直接将上述因素进行叠加,导致无法提取出深层次的空间特征。又如,现有模型捕获时空特征时没有考虑不同道路上的局部交通状况,无法捕获细粒度特征。
发明内容
本申请的目的是提供一种基于元学习的静态动态协同图卷积交通预测方法,以解决现有技术无法提取出深层次的空间特征以及无法捕获细粒度特征的问题。
为了实现上述目的,本申请技术方案如下:
一种基于元学习的静态动态协同图卷积交通预测方法,包括:
获取交通流量数据,采用多头自注意力机制提取得到全局特征,对全局特征进行映射操作和节点级注意力聚合操作得到动态图;
根据交通网络图及其节点之间的隐式依赖关系,生成自适应图;
将交通流量数据、隐式依赖关系、自适应图和动态图输入到堆叠图卷积单元的图卷积模块,每个图卷积单元包括一个基于元学习的时间门控卷积层和一个静态动态协同图卷积层,所述基于元学习的时间门控卷积层结合隐式依赖关系从输入的交通流量数据中提取时间特征,输入到静态动态协同图卷积层,所述静态动态协同图卷积层从输入的时间特征、自适应图和动态图中提取出时空特征;
对各个图卷积模块输出的时空特征进行聚合得到聚合特征,然后对聚合特征进行预测操作,得到预测结果。
进一步的,所述对全局特征进行映射操作和节点级注意力聚合操作得到动态图,包括:
其中,表示所有节点的全局特征,/>是批量大小,N表示节点数,/>是输入窗口大小;/>表示卷积核,/>是隐藏特征的特征维度,/>是注意力头的数量;/>是可学习的参数集;/>是偏置集;/>是映射操作后的全局特征,/>是图卷积单元的隐藏维度;/>表示动态相似图的邻接矩阵;/>是历史动态图的邻接矩阵;/>是动态图的邻接矩阵,
进一步的,所述根据交通网络图及其节点之间的隐式依赖关系,生成自适应图,包括:
进一步的,所述图卷积单元的传播规则表示为:
其中和/>分别表示第l个图卷积单元中基于元学习的时间门控卷积层和静态动态协同图卷积层的输出特征,/>和/>分别表示第l个图卷积单元中基于元学习的时间门控卷积层和静态动态协同图卷积层的操作,/>表示节点之间的隐式依赖关系,/>表示第l个自适应图/>的邻接矩阵集,/>表示动态图的邻接矩阵集。
进一步的,所述基于元学习的时间门控卷积层结合隐式依赖关系从输入的交通流量数据中提取时间特征,包括:
通过映射操作提取元知识:
其中和/>是可学习参数集,/>和/>是偏置集,/>和/>是第l个图卷积单元中基于元学习的时间门控卷积层中具有空间特征的元知识,/>是时间门控卷积的卷积核大小,/>是节点之间的隐式依赖关系,/>为映射操作;
时间门控卷积对任一节点的卷积运算可表示为:
其中和/>分别是时间门控卷积对节点/>卷积运算的输入和输出特征,/>和/>是大小相等的特征,/>表示激活函数,/>表示哈达玛乘积,/>表示残差连接函数,第l个图卷积单元中基于元学习的时间门控卷积层的输出表示为:
进一步的,所述静态动态协同图卷积层从输入的时间特征、自适应图和动态图中提取出时空特征,包括:
在第l个图卷积单元中生成一个共性图:
其中、/>、/>、/>、/>和/>是可学习参数集,/>、和/>分别是自适应图、动态图和共性图的第一个扩散卷积运算的输出,大小为,/>、/>和/>分别是自适应图、动态图和共性图的第二个扩散卷积运算的输出,大小为/>。
进一步的,所述对各个图卷积模块输出的时空特征进行聚合得到聚合特征,包括:
进一步的,所述对聚合特征进行预测操作,得到预测结果,包括:
本申请提出的一种基于元学习的静态动态协同图卷积交通预测方法,通过元学习来增强空间和时间特征之间的联系,并支持空间特征的深度提取;采用注意力机制为每个节点选择性地聚合适当的特征,使模型能够提取出细粒度的时空特征。
附图说明
图1为本申请基于元学习的静态动态协同图卷积交通预测方法流程图。
图2为本申请基于元学习的静态动态协同图卷积网络模型示意图。
图3为基于元学习的时间门控卷积层示意图。
图4为静态动态协同图卷积层示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
其中和/>分别是函数/>的输入和输出窗口大小,/>表示在时间步t所有节点交通状况的特征矩阵,/>表示在时间步t所有节点的交通流量。表示交通网络图,/>表示交通网络图中的节点集,/>表示交通网络图中的边集,/>表示边属性的加权邻接矩阵,N表示节点数,D表示节点的特征维度。
本申请提出了一种基于元学习的静态动态协同图卷积网络模型(M-SDCGCN),旨在通过元学习来增强空间和时间特征之间的联系,并支持空间特征的深度提取,其整体结构如图2所示。总体而言,M-SDCGCN模型由一个图生成器模块、堆叠图卷积单元的图卷积模块和一个输出模块组成。堆叠图卷积单元的图卷积模块由多个基于元学习的静态动态协同图卷积单元(M-SDCGCM)堆叠而成,每个图卷积单元包括一个基于元学习的时间门控卷积层(M-TGCL)和一个静态动态协同图卷积层(SDCGCL)。图生成器模块以数据驱动的方式分别构建了自适应图和动态图,以量化节点之间的隐式和时变依赖关系。然后,将自适应图、动态图和节点之间的隐式依赖关系输入M-SDCGCM单元,使模型能够从交通数据中提取出高度相关的空间和时间特征。每个M-SDCGCM单元包含一个用于时间特征提取的M-TGCL组件和一个用于空间特征提取的SDCGCL组件。此外,为了应对不同道路上的不同局部交通状况,采用注意力机制为每个节点选择性地聚合适当的特征,使模型能够提取出细粒度的时空特征。最后,输出模块根据细粒度特征得到预测结果。
在一个实施例中,如图1所示,提出的一种基于元学习的静态动态协同图卷积交通预测方法,包括:
步骤S1、获取交通流量数据,采用多头自注意力机制提取得到全局特征,对全局特征进行映射和节点级注意力聚合操作得到动态图。
捕获不同道路上交通流量的交互模式有利于交通流量预测。然而,仅使用先验知识(如地理邻近度)来描述此类交互模式可能具有欺骗性。此外,此类交互模式会随着时间而改变。本申请利用图生成器模块生成自适应图来量化节点之间的隐式依赖关系,生成动态图来描述节点之间的时变依赖关系。
具体而言,图生成器模块采用多头自注意力机制来执行全局特征的提取操作。对于每个节点,这个过程可以表示如下:
是queries和keys矩阵的维度;/>是values矩阵的维度;/>是注意力头的数量(设为/>);/>是可学习的参数;/>表示层归一化操作;/>表示多头自注意力操作;/>是节点/>的全局特征。/>
其中,表示所有节点的全局特征;/>是批量大小;表示卷积核;/>是可学习的参数集;/>是偏置集;/>是映射操作后的全局特征;/>是M-SDCGCN的隐藏维度;/>表示动态相似图的邻接矩阵,它是基于/>中节点间相似度获得的,如等式(11)经过激活函数处理得到;是可用的历史动态图的邻接矩阵(即图生成器在前一个训练或预测步骤中生成的动态图);/>是动态图的邻接矩阵,它基于节点属性细粒度地结合了当前和历史空间特征;/>是/>的平均张量表示,/>和
步骤S2、根据交通网络图及其节点之间的隐式依赖关系,生成自适应图。
其中和/>分别是第l个源和目标节点的嵌入,/>是源和目标节点的嵌入的维度。/>,/>是图卷积单元M-SDCGCM的数量,在一个具体的实施例中/>的取值为4,第l个自适应图/>的邻接矩阵集/>可以用等式(15)表示:
将交通流量数据、隐式依赖关系、自适应图和动态图输入到堆叠图卷积单元的图卷积模块,每个图卷积单元包括一个基于元学习的时间门控卷积层和一个静态动态协同图卷积层,所述基于元学习的时间门控卷积层结合隐式依赖关系从输入的交通流量数据中提取时间特征,输入到静态动态协同图卷积层,所述静态动态协同图卷积层从输入的时间特征、自适应图和动态图中提取出时空特征。
在得到隐式依赖关系、自适应图和动态图之后,本申请通过堆叠图卷积单元的图卷积模块进一步从交通数据中提取出高度相关的空间和时间特征(时空特征)。每个图卷积单元(M-SDCGCM)包含一个用于时间特征提取的基于元学习的时间门控卷积层(M-TGCL)和一个用于空间特征提取的静态动态协同图卷积层(SDCGCL)。本申请堆叠图卷积单元的图卷积模块包括个图卷积单元,/>的取值为4。
第l个图卷积单元的传播规则表示为:
需要注意的,第一个图卷积单元(M-SDCGCM)的输入是特征矩阵和隐式依赖/>,也就是说/>的初始输入中/>是/>。而之后第l个图卷积单元的输入,则是第l-1个图卷积单元中SDCGCL组件的输出特征/>,以及对应的隐式依赖/>。
以下通过具体的实施例,来分别描述基于元学习的时间门控卷积层(M-TGCL)和静态动态协同图卷积层(SDCGCL)。
在一个具体的实施例中,基于元学习的时间门控卷积层:
由于交通网络中拥堵传播过程的特点,获取高度相关的空间和时间特征可以提高交通流量预测的可靠性。现有模型试图通过直接构建时空同步图来捕获高度相关的空间和时间特征,这种扩大邻接矩阵的方法不灵活且计算成本高(如将邻接矩阵从/>扩大到/>)。为了解决上述问题,本申请提出的M-TGCL组件在保留原始邻接矩阵大小的同时,增强了空间和时间特征之间的联系,为此类特征的联合提取提供了更大的灵活性。如图3所示,本申请提出的M-TGCL组件使用元学习从节点之间的隐式依赖关系中提取元知识,然后将其转换为时间门控卷积层(TGCL)的参数以链接空间和时间特征。
对于任一节点,元知识/>和/>分别取自/>和/>。然后,本申请将/>的矩阵形状由/>转化为/>,并将转化后的元知识/>作为TGCL的卷积核参数/>。同理,/>作为TGCL的偏置参数/>。通常TGCL对任一节点的卷积运算可表示为等式(20)和(21):
其中和/>分别是TGCL对节点/>卷积运算的输入和输出特征,/>和/>是大小相等的特征,/>表示激活函数,/>表示哈达玛乘积,/>表示残差连接函数,它使用线性映射或填充来匹配连接维度。最后,第l个M-SDCGCM模块中M-TGCL组件的输出可以表示为等式(22)。
在一个具体的实施例中,静态动态协同图卷积层:
交通流量受到静态和动态因素的单独作用和共同作用。虽然使用参数共享策略有助于提取共性特征,但对于静态和动态因素的协同建模可能存在问题。例如,当静态图和动态图的邻接矩阵集大小不一致时,参数不能被直接共享。此外,此类硬参数共享方法可能会传递无效甚至有害信息,从而误导模型学习。因此,本申请所提出的SDCGCL组件通过生成额外的共性图用于静态和动态因素的协同建模,从而能够针对这两类因素对交通流量的单独作用和共同作用进行建模,如图4所示。
具体而言,为了描述静态和动态这两类因素对交通流量的共同作用,本申请生成了一个共性图。在第l个M-SDCGCM模块中,生成过程可以表示为等式(23)和(24)。
其中、/>、/>、/>、/>和/>是可学习参数集,/>、/>和/>分别是自适应图、动态图和共性图的第一个扩散卷积运算的输出,大小为,/>、/>和/>分别是自适应图、动态图和共性图的第二个扩散卷积运算的输出,大小为/>。请注意,本申请将静态和动态因素的共性特征/>和/>输入到共性图的扩散卷积运算中,有助于针对这两类因素对交通流量的共同作用进行建模。
步骤S4、对各个图卷积模块输出的时空特征进行聚合得到聚合特征,然后对聚合特征进行预测操作,得到预测结果。
在多个M-SDCGCMs模块在不同层次提取高度相关的空间和时间特征后,输出模块负责聚合适当的时空特征并生成预测。由于不同道路上的局部交通状况各不相同,因此不同道路上的交通流量预测应使用不同层次的时空特征。此外,即使是同一道路上的交通流量在不同时段也可能具有不同的复杂度。受此启发,基于节点观察到的特定局部交通状况,输出模块通过注意力机制选择性地聚合不同层次的时空特征,其过程可以表示为等式(33)和(34)。
然后,输出模块进一步提取时空特征并生成预测结果。具体而言,输出模块使用了两个参数共享的图卷积和一个TGCL,如等式(35)和(36)所示。
为了验证本申请技术方案的有效性,将本申请的M-SDCGCN模型与目前最先进的以下时空模型进行比较:扩散卷积递归神经网络(DCRNN);Graph WaveNet;MTGNN;自适应图卷积递归网络(AGCRN);图多注意力网络(GMAN);基于注意力机制的时空图神经网络(ASTGNN);时空图神经受控微分方程(STG-NCDE);自适应时空图神经网络(Ada-STNet)。
采用三个有效且具有代表性的指标来评估上述模型和本申请提出的M-SDCGCN模型的预测性能,即平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)。
实验中超参数设置如下:模型的输入和输出窗口大小和/>均设置为12,表明本申请使用前一小时的历史交通状况来预测后一小时的未来交通流量。扩散步长/>设置为2。源和目标节点的嵌入的维度/>设置为10。M-SDCGCM模块的数量/>设置为4。图生成器模块中隐藏特征的维度/>设置为32。注意力头的数量/>设置为4。批量大小/>设置为64。M-SDCGCN模型的隐藏维度/>设置为40。TGCL的卷积核大小/>设置为3。优化器设置为Adam。学习率设置为0.001,每5个训练代数的衰减率设置为0.9。训练代数设置为150。早停的容忍度设置为30。
本申请比较了不同模型的短期(提前15分钟)、中期(提前30分钟)和长期(提前60分钟)预测性能。表1中记录了每个模型五次预测实验的平均结果。
表1 不同模型在三个交通流量数据集上的预测性能比较
从表1的结果可以得出以下结论:
(1)所有模型在PeMSD7和PeMSD8上的指标均明显低于在PeMSD4上的指标,说明PeMSD4记录的交通状况更复杂。
(2)在三个数据集上,本申请提出的M-SDCGCN模型在整体预测性能方面优于目前最先进的时空模型,验证了M-SDCGCN模型的有效性和稳健性。
(3)在三个数据集上,DCRNN模型的预测性能均不佳,表明仅使用预定义图不足以完全捕获空间特征。STG-NCDE模型表现出有竞争力的预测性能,验证了使用神经受控微分方程捕捉时空特征的可行性。
(4)与仅使用自适应图的MTGNN模型和AGCRN模型相比,结合了预定义图和自适应图的Graph WaveNet模型在PeMSD4上具有良好的预测性能,而在PeMSD7和PeMSD8上表现更优。这表明,当交通状况更简单时预定义图对模型预测性能的贡献更大。
(5)分别根据时间特征和节点属性调整预定义图的ASTGNN模型和Ada-STNet模型在短期预测时表现良好,但在长期预测时表现一般,而直接计算传感器之间相关性的GMAN模型则相反。这表明,预定义图主要有助于模型在短期预测方面的性能提升。
本申请还通过消融实验,比较了所提出的M-SDCGCN模型的不同变体,以衡量不同组件对M-SDCGCN模型预测性能的贡献。具体而言,设计了如下变体:
AF (w/o a):在没有注意力聚合操作的情况下获得聚合特征的M-SDCGCN模型。具体而言,它通过元素相加获得聚合特征。
SDC (w/o cmn):在SDCGCL组件中,不对共性图进行扩散卷积操作的M-SDCGCN模型。
w/o Meta:不使用元学习的M-SDCGCN模型。
:通过元学习得出无空间特征元知识的M-SDCGCN模型。具体而言,它通过等式(14)为元知识的学习生成一个额外的邻接矩阵。注意这个额外的邻接矩阵不参与自适应图上的扩散卷积运算和梯度下降,因此不包含空间特征。
为了更详细地展示不同组件对本申请提出的M-SDCGCN模型的贡献,分别在复杂数据集PeMSD4和简单数据集PeMSD8上进行了消融实验。表2中报告了每个变体五次实验的平均结果。
表2 M-SDCGCN模型不同变体的预测性能比较
从表2可以得出以下结论:
(1) AF(w/o a)和DG(w/o a)的表现均比本申请提出的M-SDCGCN模型差,表明采用节点级注意力聚合操作来提取细粒度特征有助于提高模型预测性能。
(2) SDC(w/o cmn)的表现比本申请提出的M-SDCGCN模型差,验证了本申请提出的SDCGCL组件的有效性。此外,SDC(w/o cf)与M-SDCGCN模型在PeMSD8上的预测性能差距比在PeMSD4上更小,表明静态因素和动态因素的共性特征的输入在更复杂的交通状况下可以发挥更大的作用。
(3) w/o Meta的预测性能验证了引入元学习以链接空间和时间特征的有效性。此外,Meta (w/o s)的预测性能表明,不增强空间和时间特征之间联系的元学习效果甚微。
(4) Meta-pre在PeMSD4上表现最差,但在PeMSD8上表现最好,表明从预定义图中学习的元知识可以在简单的交通状况下提高模型的预测性能,但在复杂的交通状况下可能会误导模型。
本申请提出了一种M-SDCGCN时空模型来研究节点级交通流量预测。针对交通网络中拥堵传播过程的特点,M-TGCL组件采用元学习来增强空间和时间特征之间的联系,从而能够对拥堵传播过程进行建模。考虑到静态因素和动态因素对交通流量的单独作用和共同作用,本申请提出的SDCGCL组件旨在对这两类因素进行协同建模,以深入提取空间特征。为了适应不同道路上局部交通状况的多样性,M-SDCGCN模型根据特定局部交通状况选择性地聚合不同层次的时空特征,提高了M-SDCGCN模型的稳健性和预测的可靠性。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种基于元学习的静态动态协同图卷积交通预测方法,其特征在于,所述基于元学习的静态动态协同图卷积交通预测方法,包括:
获取交通流量数据,采用多头自注意力机制提取得到全局特征,对全局特征进行映射操作和节点级注意力聚合操作得到动态图;
根据交通网络图及其节点之间的隐式依赖关系,生成自适应图;
将交通流量数据、隐式依赖关系、自适应图和动态图输入到堆叠图卷积单元的图卷积模块,每个图卷积单元包括一个基于元学习的时间门控卷积层和一个静态动态协同图卷积层,所述基于元学习的时间门控卷积层结合隐式依赖关系从输入的交通流量数据中提取时间特征,输入到静态动态协同图卷积层,所述静态动态协同图卷积层从输入的时间特征、自适应图和动态图中提取出时空特征;
对各个图卷积模块输出的时空特征进行聚合得到聚合特征,然后对聚合特征进行预测操作,得到预测结果。
2.根据权利要求1所述的基于元学习的静态动态协同图卷积交通预测方法,其特征在于,所述对全局特征进行映射操作和节点级注意力聚合操作得到动态图,包括:
其中,表示所有节点的全局特征,/>是批量大小,N表示节点数,/>是输入窗口大小;/>表示卷积核,/>是隐藏特征的特征维度,/>是注意力头的数量;/>是可学习的参数集;/>是偏置集;/>是映射操作后的全局特征,/>是图卷积单元的隐藏维度;/>表示动态相似图的邻接矩阵;是历史动态图的邻接矩阵;/>是动态图的邻接矩阵,
5.根据权利要求4所述的基于元学习的静态动态协同图卷积交通预测方法,其特征在于,所述基于元学习的时间门控卷积层结合隐式依赖关系从输入的交通流量数据中提取时间特征,包括:
通过映射操作提取元知识:
其中和/>是可学习参数集,/>和/>是偏置集,和/>是第l个图卷积单元中基于元学习的时间门控卷积层中具有空间特征的元知识,/>是时间门控卷积的卷积核大小,/>是节点之间的隐式依赖关系,/>为映射操作;
时间门控卷积对任一节点的卷积运算可表示为:
其中和/>分别是时间门控卷积对节点/>卷积运算的输入和输出特征,/>和/>是大小相等的特征,/>表示激活函数,/>表示哈达玛乘积,/>表示残差连接函数,第l个图卷积单元中基于元学习的时间门控卷积层的输出表示为:
6.根据权利要求4所述的基于元学习的静态动态协同图卷积交通预测方法,其特征在于,所述静态动态协同图卷积层从输入的时间特征、自适应图和动态图中提取出时空特征,包括:
在第l个图卷积单元中生成一个共性图:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310496971.9A CN116205383B (zh) | 2023-05-05 | 2023-05-05 | 一种基于元学习的静态动态协同图卷积交通预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310496971.9A CN116205383B (zh) | 2023-05-05 | 2023-05-05 | 一种基于元学习的静态动态协同图卷积交通预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116205383A true CN116205383A (zh) | 2023-06-02 |
CN116205383B CN116205383B (zh) | 2023-07-18 |
Family
ID=86513349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310496971.9A Active CN116205383B (zh) | 2023-05-05 | 2023-05-05 | 一种基于元学习的静态动态协同图卷积交通预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116205383B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117456590A (zh) * | 2023-12-25 | 2024-01-26 | 天津生联智慧科技发展有限公司 | 一种针对智能城市应用的视觉转换的人脸识别方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111161535A (zh) * | 2019-12-23 | 2020-05-15 | 山东大学 | 基于注意力机制的图神经网络交通流量预测方法及系统 |
CN112988723A (zh) * | 2021-02-09 | 2021-06-18 | 北京工业大学 | 一种基于空间自注意力图卷积循环神经网络的交通数据修复方法 |
CN115240425A (zh) * | 2022-07-26 | 2022-10-25 | 西北师范大学 | 一种基于多尺度时空融合图网络的交通预测方法 |
CN115512545A (zh) * | 2022-09-30 | 2022-12-23 | 浙江财经大学 | 一种基于时空动态图卷积网络的交通速度预测方法 |
CN115578851A (zh) * | 2022-07-14 | 2023-01-06 | 西北师范大学 | 一种基于mgcn的交通预测方法 |
CN115618934A (zh) * | 2022-10-12 | 2023-01-17 | 北京市科学技术研究院 | 一种基于时空图卷积网络的地铁短时客流量预测方法 |
US20230058520A1 (en) * | 2021-07-27 | 2023-02-23 | Huzhou University | Traffic flow forecasting method based on deep graph gaussian processes |
-
2023
- 2023-05-05 CN CN202310496971.9A patent/CN116205383B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111161535A (zh) * | 2019-12-23 | 2020-05-15 | 山东大学 | 基于注意力机制的图神经网络交通流量预测方法及系统 |
CN112988723A (zh) * | 2021-02-09 | 2021-06-18 | 北京工业大学 | 一种基于空间自注意力图卷积循环神经网络的交通数据修复方法 |
US20230058520A1 (en) * | 2021-07-27 | 2023-02-23 | Huzhou University | Traffic flow forecasting method based on deep graph gaussian processes |
CN115578851A (zh) * | 2022-07-14 | 2023-01-06 | 西北师范大学 | 一种基于mgcn的交通预测方法 |
CN115240425A (zh) * | 2022-07-26 | 2022-10-25 | 西北师范大学 | 一种基于多尺度时空融合图网络的交通预测方法 |
CN115512545A (zh) * | 2022-09-30 | 2022-12-23 | 浙江财经大学 | 一种基于时空动态图卷积网络的交通速度预测方法 |
CN115618934A (zh) * | 2022-10-12 | 2023-01-17 | 北京市科学技术研究院 | 一种基于时空图卷积网络的地铁短时客流量预测方法 |
Non-Patent Citations (2)
Title |
---|
LING ZHAO等: "T-GCN: A Temporal Graph Convolutional Network for Traffic Prediction", JOURNAL OF L ATE X CLASS FILES, vol. 14, no. 8, pages 1 - 11 * |
王竟成等: "基于图卷积网络的交通预测综述", 北京工业大学学报, vol. 47, no. 8, pages 954 - 970 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117456590A (zh) * | 2023-12-25 | 2024-01-26 | 天津生联智慧科技发展有限公司 | 一种针对智能城市应用的视觉转换的人脸识别方法及装置 |
CN117456590B (zh) * | 2023-12-25 | 2024-04-02 | 天津生联智慧科技发展有限公司 | 一种针对智能城市应用的视觉转换的人脸识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116205383B (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112529168B (zh) | 一种基于gcn的属性多层网络表示学习方法 | |
Cirstea et al. | EnhanceNet: Plugin neural networks for enhancing correlated time series forecasting | |
CN111737592B (zh) | 一种基于异构传播协同知识感知网络的推荐方法 | |
Wang et al. | Tdefsi: Theory-guided deep learning-based epidemic forecasting with synthetic information | |
CN112910711B (zh) | 一种基于自注意力卷积网络的无线业务流量预测方法、设备及介质 | |
Yao et al. | Online truth discovery on time series data | |
Zhou et al. | Accurate traffic matrix completion based on multi-Gaussian models | |
CN116205383B (zh) | 一种基于元学习的静态动态协同图卷积交通预测方法 | |
CN115512545B (zh) | 一种基于时空动态图卷积网络的交通速度预测方法 | |
CN113672865A (zh) | 一种基于深度图高斯过程的交通流量预测方法 | |
Tang et al. | Dynamic origin‐destination flow estimation using automatic vehicle identification data: A 3D convolutional neural network approach | |
CN113239904B (zh) | 基于卷积神经网络的高分辨率密集目标计数方法 | |
Liu et al. | Pristi: A conditional diffusion framework for spatiotemporal imputation | |
Chen et al. | Physics-guided graph meta learning for predicting water temperature and streamflow in stream networks | |
CN115879542A (zh) | 一种面向非独立同分布异构数据的联邦学习方法 | |
Ranbaduge et al. | Differentially private vertical federated learning | |
CN116090504A (zh) | 图神经网络模型训练方法及装置、分类方法、计算设备 | |
Zhan et al. | Neural networks for geospatial data | |
CN116306780B (zh) | 一种动态图链接生成方法 | |
CN117391816A (zh) | 一种异质图神经网络推荐方法、装置及设备 | |
Zhang et al. | A novel approach of tensor‐based data missing estimation for Internet of Vehicles | |
CN115953902A (zh) | 一种基于多视图时空图卷积网络的交通流预测方法 | |
CN115238134A (zh) | 用于生成图数据结构的图向量表示的方法及装置 | |
CN114124580A (zh) | 一种基于Slater社会选择理论的网络入侵检测方法 | |
Zhang et al. | Dac-ml: domain adaptable continuous meta-learning for urban dynamics prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |