CN117456736B - 基于多尺度时空动态交互网络的交通流量预测方法 - Google Patents

基于多尺度时空动态交互网络的交通流量预测方法 Download PDF

Info

Publication number
CN117456736B
CN117456736B CN202311782907.3A CN202311782907A CN117456736B CN 117456736 B CN117456736 B CN 117456736B CN 202311782907 A CN202311782907 A CN 202311782907A CN 117456736 B CN117456736 B CN 117456736B
Authority
CN
China
Prior art keywords
time
space
information
attention
scale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311782907.3A
Other languages
English (en)
Other versions
CN117456736A (zh
Inventor
梁伟
杨秋月
唐鸿凯
黄素珍
梁栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiangjiang Laboratory
Original Assignee
Xiangjiang Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiangjiang Laboratory filed Critical Xiangjiang Laboratory
Priority to CN202311782907.3A priority Critical patent/CN117456736B/zh
Publication of CN117456736A publication Critical patent/CN117456736A/zh
Application granted granted Critical
Publication of CN117456736B publication Critical patent/CN117456736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/065Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例中提供了一种基于多尺度时空动态交互网络的交通流量预测方法,属于交通控制系统技术领域,具体包括:步骤1,获取城市路网中的历史交通流数据并进行数据预处理;步骤2,获取不同时间尺度下的静态依赖关系,以及,模拟时间维度和空间维度的信息在目标交通路网结构上传播对应的特性,得到时间参数和空间参数;步骤3,得到每个时间尺度下的时空特征;步骤4,将每个时间尺度下的时空特征聚合并利用Huber损失函数构建交通流预测模型;步骤5,利用训练集数据进行预设轮次的梯度下降,更新模型参数,直到模型收敛,得到目标预测模型对目标交通路网的交通流量进行预测。通过本发明的方案,提高了预测效率、精准度和适应性。

Description

基于多尺度时空动态交互网络的交通流量预测方法
技术领域
本发明实施例涉及交通控制系统技术领域,尤其涉及一种基于多尺度时空动态交互网络的交通流量预测方法。
背景技术
交通流数据被认为是时空数据的一种典型例子,描述的是发生在时间和空间维度上交通流数据的变化,单从时间和空间两个维度来看,时间维度指的是通过历史数据反映出不同的时间段(比如工作日和周末)对交通流数据的影响,空间维度指的是通过历史数据反映出不同的路段(商业区和住宅区)对交通流数据的影响。除此之外,时间维度与空间维度不是独立存在的,所以在对时空数据建模时,还应考虑复杂的时空交互关系,因此这项任务时非常具有挑战性的。现有的方法通常侧重于在单一的时间或空间维度上捕获流量模式,而忽略了时空上的交互作用;或者将空间特征的输出输入到时间特征中,以间接捕获时空相关性,并且严重依赖于先验知识。然而,这限制了模型的通用性和它们适应交通模式中的动态变化的能力。
可见,亟需一种预测效率、精准度和适应性强的基于多尺度时空动态交互网络的交通流量预测方法。
发明内容
有鉴于此,本发明实施例提供一种基于多尺度时空动态交互网络的交通流量预测方法,至少部分解决现有技术中存在预测效率、精准度和适应性较差的问题。
本发明实施例提供了一种基于多尺度时空动态交互网络的交通流量预测方法,包括:
步骤1,获取城市路网中的历史交通流数据并进行数据预处理,然后利用图卷积神经网络提取其数据静态特征;
步骤2,将数据静态特征输入多尺度时空编码器获取不同时间尺度下的静态依赖关系,以及,将数据静态特征输入时空交互编码器模拟时间维度和空间维度的信息在目标交通路网结构上传播对应的特性,得到时间参数和空间参数;
步骤3,将不同时间尺度下的静态依赖关系输入时空动态感知解码器中对应的时空动态感知注意力模块,以及,将时间参数和空间参数分别作用在每个时空动态感知注意力模块的时间和空间注意力机制中,得到每个时间尺度下的时空特征;
步骤4,将每个时间尺度下的时空特征聚合并利用Huber损失函数构建交通流预测模型;
步骤5,利用训练集数据进行预设轮次的梯度下降,更新模型参数,直到模型收敛,得到目标预测模型对目标交通路网的交通流量进行预测。
根据本发明实施例的一种具体实现方式,所述多尺度时空编码器包括多个依次连接的线性层,所述时空交互编码器包括多个依次连接的时空交互模块。
根据本发明实施例的一种具体实现方式,所述步骤2具体包括:
步骤2.1,将数据静态特征对应的时间序列输入多尺度时空编码器,每个线性层将前一个线性层的输出作为输入,并生成更大尺度的子序列作为输出,形成不同时间尺度下的静态依赖关系;
步骤2.2,在每个步长中,时空交互模块将当前t时刻输入的神经元和上一时刻隐层状态/>分别划分为时间信息分区和空间信息分区;
步骤2.3,模拟时间信息分区和空间信息分区之间的交互信息,生成时空交互信息并利用其分别过滤时间信息分区和空间信息分区,得到当前信息与历史信息对应的时间存储块和空间存储块,并使用门控单元控制时间信息分区和空间信息分区在不同时刻信息流入或流出的程度;
步骤2.4,根据当前时刻的时空信息、交互过滤后的时间信息以及空间信息计算t时刻需要输出的隐层状态;
步骤2.5,将时空交互模块各个时刻输出的交互过滤后的时间信息与空间信息分别拼接在一起,并利用多层感知机学习特定的时间参数和空间参数。
根据本发明实施例的一种具体实现方式,所述时空动态感知解码器包括多个基于滑动窗口的时空动态感知注意力模块,所述基于滑动窗口的时空动态感知注意力模块的数量与线性层的数量相同。
根据本发明实施例的一种具体实现方式,所述步骤3具体包括:
步骤3.1,将不同时间尺度下的静态依赖关系输入对应的时空动态感知注意力模块,以及,将时空交互编码器生成的时间维度所显示的共性分别嵌入到第个注意力模块中的矩阵/>,/>和/>中,根据时间感知注意力机制和多头机制得到每个时间尺度下的时间特征;
步骤3.2,将时间注意力模块捕获的时间特征作为空间注意力模块的输入,并嵌入时空交互编码器生成的空间维度所显示的共性,最后在空间维度上对所有传感器之间的隐式依赖关系进行捕获,得到每个时间尺度下的时空特征。
根据本发明实施例的一种具体实现方式,所述时间感知注意力机制的表达式为
其中,表示第/>个注意力模块的时间维度查询矩阵Query,/>表示第/>个注意力模块的时间维度键矩阵Key,/>表示第/>个注意力模块的时间维度值矩阵Value,/>为/>的维度,/>为可学习的时间参数,/>为时间间隔,/>为Sigmoid激活函数,为tanh激活函数,/>为归一化指数函数;
所述多头机制的表达式为
其中,表示第/>个注意力模块中时间注意力模块的输出,分别表示各个维度的大小,/>,/>,/>分别代表/>,/>,/>的第/>个映射部分,/>表示多头数量,/>表示时间注意力模块输出的可学习权值矩阵,/>表示时间注意力模块输出的偏置项。
根据本发明实施例的一种具体实现方式,所述步骤4具体包括:
步骤4.1,将每个时间尺度下的时空特征累加后利用多层感知机预测输出;
步骤4.2,根据预测输出和Huber损失函数构建交通流预测模型。
根据本发明实施例的一种具体实现方式,所述预测输出的表达式为
所述Huber损失函数的表达式为
其中,为一个阈值控制范围的误差损失的参数,/>表示第/>个注意力模块的输出,/>表示第/>个注意力模块输出的可学习权值矩阵,/>表示第/>个注意力模块输出的偏置项,/>表示注意力模块的总个数。
本发明实施例中的基于多尺度时空动态交互网络的交通流量预测方案,包括:步骤1,获取城市路网中的历史交通流数据并进行数据预处理,然后利用图卷积神经网络提取其数据静态特征;步骤2,将数据静态特征输入多尺度时空编码器获取不同时间尺度下的静态依赖关系,以及,将数据静态特征输入时空交互编码器模拟时间维度和空间维度的信息在目标交通路网结构上传播对应的特性,得到时间参数和空间参数;步骤3,将不同时间尺度下的静态依赖关系输入时空动态感知解码器中对应的时空动态感知注意力模块,以及,将时间参数和空间参数分别作用在每个时空动态感知注意力模块的时间和空间注意力机制中,得到每个时间尺度下的时空特征;步骤4,将每个时间尺度下的时空特征聚合并利用Huber损失函数构建交通流预测模型;步骤5,利用训练集数据进行预设轮次的梯度下降,更新模型参数,直到模型收敛,得到目标预测模型对目标交通路网的交通流量进行预测。
本发明实施例的有益效果为:通过本发明的方案,构建时空交互编码器与多尺度时空编码器,旨在模拟时空交互,从全局角度提取特定位置的时间和空间模式,以及显示获取不同时间尺度下的时间相关性,以及构建时空动态感知解码器,旨在从局部的角度对不同尺度的时空输入执行维度映射操作。随后,将第一阶段的输出嵌入到时空动态感知注意力模块,该模块基于滑动窗口的时空动态感知,允许模型捕获隐式的时空特征,最后,融合了几种不同时间尺度的交通模式来预测未来的交通流量,提高了预测效率、精准度和适应性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种基于多尺度时空动态交互网络的交通流量预测方法的流程示意图;
图2为本发明实施例提供的一种基于多尺度时空动态交互网络的交通流量预测方法的具体实施过程示意图;
图3为本发明实施例提供的一种基于多尺度时空动态交互网络的交通流量预测方法的模型总体框架图;
图4为本发明实施例提供的一种时空交互模块的处理流程示意图;
图5为本发明实施例提供的一种基于滑动窗口的时间感知注意力的处理流程示意图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本发明,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
本发明实施例提供一种基于多尺度时空动态交互网络的交通流量预测方法,所述方法可以应用于城市管理场景的交通控制过程中。
参见图1,为本发明实施例提供的一种基于多尺度时空动态交互网络的交通流量预测方法的流程示意图。如图1和图2所示,所述方法主要包括以下步骤:
步骤1,获取城市路网中的历史交通流数据并进行数据预处理,然后利用图卷积神经网络提取其数据静态特征;
具体实施时,将结合图例介绍本发明的预测模型,如图3所示。该模型包括两个阶段:第一阶段是构建时空交互编码器与多尺度时空编码器,旨在模拟时空交互,从全局角度提取特定位置的时间和空间模式,以及显示获取不同时间尺度下的时间相关性。在第二阶段中构建时空动态感知解码器,旨在从局部的角度对不同尺度的时空输入执行维度映射操作。随后,将第一阶段的输出嵌入到时空动态感知注意力模块,该模块基于滑动窗口的时空动态感知,允许模型捕获隐式的时空特征。最后,融合了几种不同时间尺度的交通模式来预测未来的交通流量。
交通流数据是一种典型的时空数据,由一组部署在交通网络结构中的N个传感器及其邻接关系组成。本发明使用来表示交通路网的邻接矩阵,其中/>表示节点/>和节点/>之间存在一个连接,每个传感器定期记录多个属性,包括交通流量和交通速度。在本发明中,只考虑交通流作为唯一的输入特性。因此,使用/>来表示/>个时间步长中所/>个传感器的交通流数据,其中/>。本发明的目标是基于/>个时间步长的历史数据和邻接矩阵学习映射函数/>,以预测未来/>个时间步长的交通流量数据:
(1)
其中,/>分别表示各个维度的大小。
首先可以使用图卷积运算聚合每个节点自身及其邻居的信息,旨在捕获网络内的静态依赖关系。具体计算公式如下:
(2)
其中,/>分别表示各个维度的大小,/>为卷积操作,/>表示城市道路网格结构的连通矩阵,/>,/>,/>,/>,/>为一个常数表示某一维度的大小,/>表示修正后的线性单元激活函数。
步骤2,将数据静态特征输入多尺度时空编码器获取不同时间尺度下的静态依赖关系,以及,将数据静态特征输入时空交互编码器模拟时间维度和空间维度的信息在目标交通路网结构上传播对应的特性,得到时间参数和空间参数;
在上述实施例的基础上,所述多尺度时空编码器包括多个依次连接的线性层,所述时空交互编码器包括多个依次连接的时空交互模块。
进一步的,所述步骤2具体包括:
步骤2.1,将数据静态特征对应的时间序列输入多尺度时空编码器,每个线性层将前一个线性层的输出作为输入,并生成更大尺度的子序列作为输出,形成不同时间尺度下的静态依赖关系;
步骤2.2,在每个步长中,时空交互模块将当前t时刻输入的神经元和上一时刻隐层状态/>分别划分为时间信息分区和空间信息分区;
步骤2.3,模拟时间信息分区和空间信息分区之间的交互信息,生成时空交互信息并利用其分别过滤时间信息分区和空间信息分区,得到当前信息与历史信息对应的时间存储块和空间存储块,并使用门控单元控制时间信息分区和空间信息分区在不同时刻信息流入或流出的程度;
步骤2.4,根据当前时刻的时空信息、交互过滤后的时间信息以及空间信息计算t时刻需要输出的隐层状态;
步骤2.5,将时空交互模块各个时刻输出的交互过滤后的时间信息与空间信息分别拼接在一起,并利用多层感知机学习特定的时间参数和空间参数。
时空交互编码器由图卷积,时空交互模块组成,旨在模拟时间和空间两个纬度的信息在整个交通路网结构上传播所反应的特性。首先通过图卷积来捕获城市道路网格中的静态依赖关系,接着构建时空交互模块,该模块包含了两个门控来协作捕获时间和空间依赖性,形成时间和空间特定的分区,然后模拟时空交互模式,并过滤掉冗余特征。最后,将时空交互模块各个时刻输出的时间与空间信息分别拼接在一起,并利用多个多层感知机学习特定的时间、空间参数用于后续解码器。多尺度时空编码器旨在显示地获取不同时间尺度下的时间相关性,该编码器首先通过图卷积来捕获城市道路网格中的静态依赖关系,然后利用多个不同维度的线性层来获取不同尺度的静态依赖关系,并将不同层的输出作为解码器的输入。
具体实施时,多尺度时空编码器旨在显示地获取不同时间尺度下的时间相关性。该编码器应用多个线性层将原始时间序列层次化抽取从小尺度到大尺度的子序列。这种多尺度结构使模型能在不同的时间尺度上观察原始时间序列。多尺度金字塔网络通过堆叠多个线性层生成多尺度子序列。每个线性层将前一个线性层的输出作为输入,并生成更大尺度的子序列作为输出。
具体的,构建三个多尺度的线性层,其计算公式如下。
(3)
其中,/>,/>分别为第一层,第二层,第三层线性层的输出,/>分别表示第1、2、3线性层的可学习权值矩阵,/>分别表示第1、2、3线性层的偏置项。
如图4所示,时空交互模块利用专门的记忆单元确保梯度在传递跨越很多步骤之后不会消失,从而能够克服传统的循环神经网络在训练中遇到的困难,并且能够学习到长期的依赖关系。具体来说,在每个步长中,时空交互模块将当前时刻与上一时刻神经元存储的信息分别划分成两个部分:时间信息与空间信息,然后通过两者交互来生成时空交互信息,并利用生成的时空交互信息来分别对时间和空间信息进行过滤,最后通过门控机制联合上一时间步信息提取充分交互过滤后的时间特征、空间特征。具体实现步骤如下:
首先,将神经元的存储信息分为两部分。把当前t时刻输入的神经元和上一时刻隐层状态/>分别划分为两个分区,包括时间信息分区和空间信息分区。具体的划分公式如下:
(4)
(5)
(6)
(7)
其中,,/>用于捕获当前时刻的神经元和上一时刻的隐层状态中时间信息分区,/>,/>,用于捕获当前时刻的神经元和上一时刻的隐层状态中空间信息分区,/>分别为/>时刻神经元/>与/>时刻隐藏状态/>的时间信息分区,/>分别为/>时刻神经元/>与/>时刻隐藏状态/>的空间信息分区,/>分别表示各个维度的大小。
接着,本发明考虑到神经元获得的信息可能包含相互依赖的信息。比如时间信息分区中,由于共用了同样的参数空间和/>,它可能包括纯时间信息及其与空间信息的交互信息。因此,有必要模拟和过滤这两个分区之间的交互信息。从数学上讲,这个过程的形式是:
(8)
(9)
其中,分别为时间和空间维度中当前时刻和上一时刻的交互,/>为在时间维度上交互的两个可学习权值矩阵,/>为在空间维度上交互的两个可学习权值矩阵,/>为在时间维度上交互的两个偏置项,/>为在空间维度上交互的两个偏置项。
然后,利用生成的时空交互信息分别过滤时间信息分区、空间信息分区。本发明为了保证过滤地透彻,分别引入了时间维度共享信息代理和空间维度共享信息代理/>具体过滤公式如下所示。
(10)
(11)
(12)
(13)
其中,/>,/>,/>分别为过滤后/>时刻神经元的专属时间信息、空间信息分区以及/>时刻隐层状态的专属时间信息、空间信息。
在分别对和/>神经元分区与过滤后,可以得到当前信息与历史信息的两种专属特定类型的存储块:时间存储块、空间存储块。通过之前的过滤操作,在两种存储块中对时间无关甚至有害的空间分区信息或对空间无关的甚至有害的时间分区信息被过滤掉了。为了保证两个目标单元格时间信息与空间信息与历史信息进行合理交互并生成特定的模型参数,本发明使用门控单元使其控制在不同时刻信息流入或流出的程度。具体实现如下。
(14)
(15)
其中,/>分别为/>时刻该神经单元输出的时间信息以及空间信息,为可学习的权值矩阵, />为偏置项,/>为sigmoid函数,/>为连接操作,/>表示某一维度的大小。
接着,需要存储当前时刻的时空信息/>,用于计算步长之间传递的隐藏状态/>。在对时空信息计算中,仍然利用门控机制控制当前时刻/>的时间信息分区、空间信息分区以及时空交互信息的流动,其计算公式如下。
(16)
其中为tanh激活函数, />为时空信息的可学习权值矩阵,为时空信息的偏置项。
最后,将利用当前时刻的时空信息、交互过滤后的时间信息以及空间信息来计算/>时刻需要输出的隐层状态,其计算公式为。
(17)
其中为/>时刻输出的隐层状态, />为/>时刻隐层状态的可学习权值矩阵, />为/>时刻隐层状态的偏置项。
最后,需要是利用过滤交互后的专属时间信息、专属空间信息,来生成后解码器中特定位置特定时间与空间的参数。将时间参数空间视为信息在时间维度流转应遵循的规律,空间参数则是在空间维度应遵循的规律。
本发明将时空交互模块各个时刻输出的时间与空间信息分别拼接在一起,并利用多层感知机学习特定的时间、空间参数,具体公式如下所示。
(18)
(19)
其中为拼接操作,/>为多层感知器,/>,/>分别为时间参数和空间参数的可学习权值矩阵,/>,/>分别为时间参数和空间参数的偏置项,分别为时间参数、空间参数。
步骤3,将不同时间尺度下的静态依赖关系输入时空动态感知解码器中对应的时空动态感知注意力模块,以及,将时间参数和空间参数分别作用在每个时空动态感知注意力模块的时间和空间注意力机制中,得到每个时间尺度下的时空特征;
在上述实施例的基础上,所述时空动态感知解码器包括多个基于滑动窗口的时空动态感知注意力模块,所述基于滑动窗口的时空动态感知注意力模块的数量与线性层的数量相同。
进一步的,所述步骤3具体包括:
步骤3.1,将不同时间尺度下的静态依赖关系输入对应的时空动态感知注意力模块,以及,将时空交互编码器生成的时间维度所显示的共性分别嵌入到第个注意力模块中的矩阵/>,/>和/>中,根据时间感知注意力机制和多头机制得到每个时间尺度下的时间特征;
步骤3.2,将时间注意力模块捕获的时间特征作为空间注意力模块的输入,并嵌入时空交互编码器生成的空间维度所显示的共性,最后在空间维度上对所有传感器之间的隐式依赖关系进行捕获,得到每个时间尺度下的时空特征。
进一步的,所述时间感知注意力机制的表达式为
其中,表示第/>个注意力模块的时间维度查询矩阵Query,/>表示第/>个注意力模块的时间维度键矩阵Key,/>表示第/>个注意力模块的时间维度值矩阵Value,/>为/>的维度,/>为可学习的时间参数,/>为时间间隔,/>为Sigmoid激活函数,为tanh激活函数,/>为归一化指数函数;
所述多头机制的表达式为
其中,表示第/>个注意力模块中时间注意力模块的输出,分别表示各个维度的大小,/>,/>,/>分别代表/>,/>,/>的第/>个映射部分,/>表示多头数量,/>表示时间注意力模块输出的可学习权值矩阵,/>表示时间注意力模块输出的偏置项。
具体实施时,为了准确的预测未来的交通流量,本发明设计了一个基于滑动窗口的时空动态感知注意力模块来构建时空动态感知解码器,并将多尺度时空编码器产生的多个输出分别作为多个时空动态感知注意力模块的输入,而且将时间和空间参数分别作用在时间和空间注意力机制中,如图5所示。
注意力机制可以使得神经网络不再平等地关注所有输入,而是选择相对重要的部分输入进行处理,来获得更好的输出。但是传统的注意力机制计算量巨大,为了克服注意力机制的平方计算复杂度,本发明提出了一种基于滑动窗口的时空动态感知注意力模块,并在时间注意力子模块中考虑时间跨度带来的影响,以提升整体竞争效率。
滑动窗口机制对输入的时间序列进行划分,划分出来的窗口之间并不是独立的,而是两两窗口之间有一定的重合,旨在保障让部分时间步对应的信息同时出现在多个窗口中,来达到相邻窗口之间的合理交互。比如,一个大小为12的输入时间序列被分割成了窗口大小S=4的5个窗口,每个窗口都有一个可学习的代理张量作为规范注意中的“查询”。
1)时间注意力层
将解码模块生成的时间维度所显示的共性分别嵌入到第个注意力模块中的/>和/>中,如图5所示。具体计算公式如下
(20)
(21)
(22)
其中为第/>个注意力模块的时间维度“查询“矩阵,/>分别表示各个维度的大小。/>,/>也分别表示各个维度的大小。/>为多尺度时空编码器的第/>个线性层的输出,/>为第/>层第/>个窗口的可学习代理张量。,/>分别为时空交互编码器为第/>个注意力模块所产生的不同时间参数。
相比于传统的注意力,本发明建立了一个更具适应性的时间感知机制去灵活地了解时间间隔对每个时间步的影响,时间感知注意力机制具体计算公式如下。
(23)
(24)
其中,公式(23)为时间感知注意力的相关性计算公式,为/>的维度,/>为可学习的时间参数,/>为时间间隔,/>为Sigmoid激活函数,/>为tanh激活函数,公式(24)为时间感知注意力计算公式,其中/>为归一化指数函数。
除此之外,本发明还使用多头机制保证特征的多样性,公式如下:
(25)
(26)
其中表示第/>个注意力模块中时间注意力模块的输出,分别表示各个维度的大小,/>,/>,/>分别代表/>,/>,/>的第/>个映射部分,/>是多头数量。
2)空间注意力层
为了增强模型对时空依赖关系的捕获,本发明将时间注意力模块捕获的时间特征直接作为空间注意力模块的输入,并嵌入解码模块生成的空间维度所显示的共性,最后在空间维度上对所有传感器之间的隐式依赖关系进行捕获。空间注意力模块的Q,K,V计算如下。
(27)
(28)
(29)
其中,/>分别为时空交互解码器为第/>个注意力模块所产生的不同时间参数。
利用传统的注意力计算时空隐式依赖,并利用多头机制捕获多样性,相比于时间Attention模块,只有的计算方式有所区别,计算公式如下:
(30)
(31)
(32)
(33)
其中,/>,/>分别代表/>,/>,/>第/>个映射部分,/>表示空间注意力模块输出的可学习权值矩阵,/>表示空间注意力模块输出的偏置项,/>表示第/>个注意力模块中空间注意力模块的输出。
最后,将时间维度中的每个窗口输出聚合为第个时空感知注意力模块的输出,计算公式如下:
(34)
其中为求和函数,/>为第/>个时空感知注意力模块的输出,分别表示各个维度的大小。/>为第/>个滑动窗口的时间隐式依赖关系/>
步骤4,将每个时间尺度下的时空特征聚合并利用Huber损失函数构建交通流预测模型;
在上述实施例的基础上,所述步骤4具体包括:
步骤4.1,将每个时间尺度下的时空特征累加后利用多层感知机预测输出;
步骤4.2,根据预测输出和Huber损失函数构建交通流预测模型。
进一步的,所述预测输出的表达式为
所述Huber损失函数的表达式为
其中,为一个阈值控制范围的误差损失的参数,/>表示第/>个注意力模块的输出,/>表示第/>个注意力模块输出的可学习权值矩阵,/>表示第/>个注意力模块输出的偏置项,/>表示注意力模块的总个数。
例如,为了提升精度,本发明堆叠了L=3个时空动态感知注意力模块,并将其累加后利用多层感知机预测输出,计算公式如下。
(35)
最后,本发明使用Huber损失函数来作为模型的损失函数, 因为它对训练数据中的一些异常数值比较包容,其计算公式如下。
(36)
其中是一个阈值控制范围的误差损失的参数。
步骤5,利用训练集数据进行预设轮次的梯度下降,更新模型参数,直到模型收敛,得到目标预测模型对目标交通路网的交通流量进行预测。
具体实施时,在构建好交通流预测模型后,可以利用训练集数据进行预设轮次的梯度下降,更新交通流预测模型的模型参数,直到模型收敛,得到目标预测模型对目标交通路网的交通流量进行预测。
本实施例提供的基于多尺度时空动态交互网络的交通流量预测方法,通过第一阶段构建时空交互编码器与多尺度时空编码器。时空交互编码器由图卷积,时空交互模块组成,旨在模拟时间和空间两个纬度的信息在整个交通路网结构上传播所反应的特性。首先通过图卷积来捕获城市道路网格中的静态依赖关系,接着构建时空交互模块,该模块包含了两个门控来协作捕获时间和空间依赖性,形成时间和空间特定的分区,然后模拟时空交互模式,并过滤掉冗余特征。最后,将时空交互模块各个时刻输出的时间与空间信息分别拼接在一起,并利用多个多层感知机学习特定的时间、空间参数用于后续解码器。多尺度时空编码器旨在显示地获取不同时间尺度下的时间相关性,该编码器首先通过图卷积来捕获城市道路网格中的静态依赖关系,然后利用多个不同维度的线性层来获取不同尺度的静态依赖关系,并将不同层的输出作为解码器的输入;第二阶段构建时空动态感知解码器,该解码器由多个基于滑动窗口的时空动态感知注意力模块组成,该模块旨在能够在不依赖于相同的参数的情况下,动态地捕获时间维度和空间维度的特征。为了实现这一点,本发明设计了一种滑动窗口机制在减少计算量的同时,能够促进相邻窗口之间的丰富交互,以确保合并丰富的信息上下文。并将数据划分为三个不同的时间粒度,允许从时间和空间两个维度中提取动态特征,利用第一阶段的时空交互解码器分别生成特定的时间与空间参数,并将其嵌入到注意力计算中。此外,本发明还针对时间维度设计了时间感知注意力机制,确保自适应的时间间隔,进一步提高了模型的灵活性;最后构建输出层,输出层将多个不同时间粒度的时空动态感知注意力模块聚合在一起,然后利用Huber损失函数构建本发明的交通流预测目标函数;最后利用训练集数据进行多轮次的梯度下降,更新模型参数,直到模型收敛得到目标预测模型对目标交通路网的交通流量进行预测,提高了预测效率、精准度和适应性。
下面将结合一个具体实施例对本发明进行说明,本发明利用交通流的公开数据集PEMS04来做实验,将数据集的60%作为训练集,20%作为验证集,20%作为测试集,并且本发明利用前1小时预测后1小时的交通流量。本发明采用平均绝对误差(MAE)、平均绝对百分比误差(MAPE)以及均方根误差(RMSE)来作为最后实验结果的评价指标。其计算公式如下。
(37)
(38)
(39)。
表1
从实验结果可以看出,本发明相比于其它交通流预测方法表现更为优秀。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (4)

1.一种基于多尺度时空动态交互网络的交通流量预测方法,其特征在于,包括:
步骤1,获取城市路网中的历史交通流数据并进行数据预处理,然后利用图卷积神经网络提取其数据静态特征;
步骤2,将数据静态特征输入多尺度时空编码器获取不同时间尺度下的静态依赖关系,以及,将数据静态特征输入时空交互编码器模拟时间维度和空间维度的信息在目标交通路网结构上传播对应的特性,得到时间参数和空间参数,其中,所述多尺度时空编码器包括多个依次连接的线性层,所述时空交互编码器包括多个依次连接的时空交互模块;
所述步骤2具体包括:
步骤2.1,将数据静态特征对应的时间序列输入多尺度时空编码器,每个线性层将前一个线性层的输出作为输入,并生成更大尺度的子序列作为输出,形成不同时间尺度下的静态依赖关系;
步骤2.2,在每个步长中,时空交互模块将当前t时刻输入的神经元和上一时刻隐层状态/>分别划分为时间信息分区和空间信息分区;
步骤2.3,模拟时间信息分区和空间信息分区之间的交互信息,生成时空交互信息并利用其分别过滤时间信息分区和空间信息分区,得到当前信息与历史信息对应的时间存储块和空间存储块,并使用门控单元控制时间信息分区和空间信息分区在不同时刻信息流入或流出的程度;
步骤2.4,根据当前时刻t的时空信息、交互过滤后的时间信息以及空间信息计算t时刻需要输出的隐层状态;
步骤2.5,将时空交互模块各个时刻输出的交互过滤后的时间信息与空间信息分别拼接在一起,并利用多层感知机学习特定的时间参数和空间参数;
步骤3,将不同时间尺度下的静态依赖关系输入时空动态感知解码器中对应的时空动态感知注意力模块,以及,将时间参数和空间参数分别作用在每个时空动态感知注意力模块的时间和空间注意力机制中,得到每个时间尺度下的时空特征,其中,所述时空动态感知解码器包括多个基于滑动窗口的时空动态感知注意力模块,所述基于滑动窗口的时空动态感知注意力模块的数量与线性层的数量相同;
所述步骤3具体包括:
步骤3.1,将不同时间尺度下的静态依赖关系输入对应的时空动态感知注意力模块,以及,将时空交互编码器生成的时间维度所显示的共性分别嵌入到第个注意力模块中的矩阵/>,/>和/>中,根据时间感知注意力机制和多头机制得到每个时间尺度下的时间特征;
步骤3.2,将时间注意力模块捕获的时间特征作为空间注意力模块的输入,并嵌入时空交互编码器生成的空间维度所显示的共性,最后在空间维度上对所有传感器之间的隐式依赖关系进行捕获,得到每个时间尺度下的时空特征;
步骤4,将每个时间尺度下的时空特征聚合并利用Huber损失函数构建交通流预测模型;
步骤5,利用训练集数据进行预设轮次的梯度下降,更新模型参数,直到模型收敛,得到目标预测模型对目标交通路网的交通流量进行预测。
2.根据权利要求1所述的方法,其特征在于,所述时间感知注意力机制的表达式为
其中,表示第/>个注意力模块的时间维度查询矩阵Query,/>表示第/>个注意力模块的时间维度键矩阵Key,/>表示第/>个注意力模块的时间维度值矩阵Value,/>为/>的维度,/>为可学习的时间参数,/>为时间间隔,/>为Sigmoid激活函数,/>为tanh激活函数,/>为归一化指数函数;
所述多头机制的表达式为
其中,表示第/>个注意力模块中时间注意力模块的输出,/>分别表示各个维度的大小,/>,/>,/>分别代表/>,/>,/>的第/>个映射部分,/>表示多头数量,/>表示时间注意力模块输出的可学习权值矩阵,/>表示时间注意力模块输出的偏置项。
3.根据权利要求2所述的方法,其特征在于,所述步骤4具体包括:
步骤4.1,将每个时间尺度下的时空特征累加后利用多层感知机预测输出;
步骤4.2,根据预测输出和Huber损失函数构建交通流预测模型。
4.根据权利要求3所述的方法,其特征在于,所述预测输出的表达式为
所述Huber损失函数的表达式为
其中,为一个阈值控制范围的误差损失的参数,/>表示第/>个注意力模块的输出,表示第/>个注意力模块输出的可学习权值矩阵,/>表示第/>个注意力模块输出的偏置项,/>表示注意力模块的总个数。
CN202311782907.3A 2023-12-22 2023-12-22 基于多尺度时空动态交互网络的交通流量预测方法 Active CN117456736B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311782907.3A CN117456736B (zh) 2023-12-22 2023-12-22 基于多尺度时空动态交互网络的交通流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311782907.3A CN117456736B (zh) 2023-12-22 2023-12-22 基于多尺度时空动态交互网络的交通流量预测方法

Publications (2)

Publication Number Publication Date
CN117456736A CN117456736A (zh) 2024-01-26
CN117456736B true CN117456736B (zh) 2024-03-12

Family

ID=89580293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311782907.3A Active CN117456736B (zh) 2023-12-22 2023-12-22 基于多尺度时空动态交互网络的交通流量预测方法

Country Status (1)

Country Link
CN (1) CN117456736B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118071121A (zh) * 2024-04-19 2024-05-24 湘江实验室 一种基于实时位置的打车方法、装置、设备及介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114611383A (zh) * 2022-02-25 2022-06-10 武汉大学 一种基于时空多尺度图卷积网络的交通流预测模型的构建方法以及交通流预测方法
CN114611814A (zh) * 2022-03-21 2022-06-10 中南大学 聚合多尺度时空相似信息的城市交通流预测方法
CN115240425A (zh) * 2022-07-26 2022-10-25 西北师范大学 一种基于多尺度时空融合图网络的交通预测方法
CN115578851A (zh) * 2022-07-14 2023-01-06 西北师范大学 一种基于mgcn的交通预测方法
CN116187555A (zh) * 2023-02-16 2023-05-30 华中科技大学 基于自适应动态图的交通流预测模型构建方法及预测方法
CN116311921A (zh) * 2023-03-01 2023-06-23 中国矿业大学 一种基于多空间尺度时空Transformer的交通速度预测方法
CN116721538A (zh) * 2023-05-18 2023-09-08 汕头大学 一种用于动态交通状况下的自适应学习交通流预测的方法
CN116895157A (zh) * 2023-08-07 2023-10-17 湖北工业大学 一种基于趋势时空图卷积的交通流量预测方法、系统及介质
CN116935649A (zh) * 2023-08-09 2023-10-24 中国矿业大学 多视角融合的时空动态图卷积网络城市交通流量预测方法
CN117195976A (zh) * 2023-10-11 2023-12-08 华东交通大学 一种基于分层注意力的交通流量预测方法及系统
CN117236492A (zh) * 2023-09-06 2023-12-15 西南交通大学 基于动态多尺度图学习的交通需求预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11842271B2 (en) * 2019-08-29 2023-12-12 Nec Corporation Multi-scale multi-granularity spatial-temporal traffic volume prediction
US20230140289A1 (en) * 2021-11-03 2023-05-04 Qatar Foundation For Education, Science And Community Development Traffic accident prediction systems and methods

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114611383A (zh) * 2022-02-25 2022-06-10 武汉大学 一种基于时空多尺度图卷积网络的交通流预测模型的构建方法以及交通流预测方法
CN114611814A (zh) * 2022-03-21 2022-06-10 中南大学 聚合多尺度时空相似信息的城市交通流预测方法
CN115578851A (zh) * 2022-07-14 2023-01-06 西北师范大学 一种基于mgcn的交通预测方法
CN115240425A (zh) * 2022-07-26 2022-10-25 西北师范大学 一种基于多尺度时空融合图网络的交通预测方法
CN116187555A (zh) * 2023-02-16 2023-05-30 华中科技大学 基于自适应动态图的交通流预测模型构建方法及预测方法
CN116311921A (zh) * 2023-03-01 2023-06-23 中国矿业大学 一种基于多空间尺度时空Transformer的交通速度预测方法
CN116721538A (zh) * 2023-05-18 2023-09-08 汕头大学 一种用于动态交通状况下的自适应学习交通流预测的方法
CN116895157A (zh) * 2023-08-07 2023-10-17 湖北工业大学 一种基于趋势时空图卷积的交通流量预测方法、系统及介质
CN116935649A (zh) * 2023-08-09 2023-10-24 中国矿业大学 多视角融合的时空动态图卷积网络城市交通流量预测方法
CN117236492A (zh) * 2023-09-06 2023-12-15 西南交通大学 基于动态多尺度图学习的交通需求预测方法
CN117195976A (zh) * 2023-10-11 2023-12-08 华东交通大学 一种基于分层注意力的交通流量预测方法及系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Graph Attention Network With Spatial-Temporal Clustering for Traffic Flow Forecasting in Intelligent Transportation System;Yan Chen 等;IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS;20230831;第24卷(第8期);第8727-8737页 *
Graph learning-based spatial-temporal graph convolutional neural networks for traffic forecasting;Na Hu 等;Connection Science;20211130;第34卷(第1期);第429-448页 *
Na Hu 等.Multi-range bidirectional mask graph convolution based GRU networks for traffic prediction.Journal of Systems Architecture.2022,第1-11页. *
一种基于序列到序列时空注意力学习的交通流预测模型;杜圣东 等;计算机研究与发展;20200831;第57卷(第8期);第1715-1728页 *
基于多时间尺度时空图网络的交通流量预测模型;汪鸣 等;计算机科学;20220831;第49卷(第7期);第40-48页 *
面向高速公路通行时间分布预测的时空混合密度神经网络;杜渐 等;计算机系统应用;20230301;第32卷(第4期);第308-316页 *

Also Published As

Publication number Publication date
CN117456736A (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
CN110675623B (zh) 基于混合深度学习的短时交通流量预测方法、系统、装置
CN110827544B (zh) 一种基于图卷积循环神经网络的短时交通流控制方法
CN117456736B (zh) 基于多尺度时空动态交互网络的交通流量预测方法
US7389282B2 (en) System and method for predictive analysis and predictive analysis markup language
CN114299723B (zh) 一种交通流量预测方法
CN115512545B (zh) 一种基于时空动态图卷积网络的交通速度预测方法
CN116187555A (zh) 基于自适应动态图的交通流预测模型构建方法及预测方法
CN111860787A (zh) 一种含有缺失数据的耦合有向图结构流量数据的短期预测方法及装置
CN110570035A (zh) 同时建模时空依赖性和每日流量相关性的人流量预测系统
CN113177470A (zh) 行人轨迹预测方法、装置、设备及存储介质
CN113177626A (zh) 数据驱动的复杂系统机理自动学习方法、系统及设备
CN115935796A (zh) 一种基于时空异质的和同步的图卷积网络交通流预测方法
Tang et al. Spatio-temporal latent graph structure learning for traffic forecasting
CN117175588A (zh) 基于时空相关性的用电负荷预测方法及装置
CN117148197A (zh) 一种基于集成Transformer模型的锂离子电池寿命预测方法
CN115862324A (zh) 一种智慧交通的时空同步图卷积神经网络及交通预测方法
CN116052254A (zh) 基于扩展卡尔曼滤波神经网络的视觉连续情感识别方法
CN114572229A (zh) 一种基于图神经网络的车速预测方法、装置、介质及设备
CN114037056A (zh) 一种生成神经网络的方法、装置、计算机设备和存储介质
Prabowo et al. Traffic forecasting on new roads unseen in the training data using spatial contrastive pre-training
CN116579468A (zh) 基于云系记忆的台风生成预测方法、装置、设备及介质
CN116434569A (zh) 基于stnr模型的交通流量预测方法及系统
CN114566048A (zh) 一种基于多视角自适应时空图网络的交通控制方法
CN115600744A (zh) 一种基于手机数据的共享时空注意力卷积网络人口数量预测方法
CN115168327A (zh) 基于多层树状长短期记忆网络的大规模数据时空预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant