CN116681176A - 一种基于聚类和异构图神经网络的交通流预测方法 - Google Patents

一种基于聚类和异构图神经网络的交通流预测方法 Download PDF

Info

Publication number
CN116681176A
CN116681176A CN202310689450.5A CN202310689450A CN116681176A CN 116681176 A CN116681176 A CN 116681176A CN 202310689450 A CN202310689450 A CN 202310689450A CN 116681176 A CN116681176 A CN 116681176A
Authority
CN
China
Prior art keywords
traffic
nodes
matrix
graph
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310689450.5A
Other languages
English (en)
Other versions
CN116681176B (zh
Inventor
韩士元
罗磊
李�昊
龚开
李忠涛
周劲
杨晓晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Jinan
Original Assignee
University of Jinan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Jinan filed Critical University of Jinan
Priority to CN202310689450.5A priority Critical patent/CN116681176B/zh
Publication of CN116681176A publication Critical patent/CN116681176A/zh
Application granted granted Critical
Publication of CN116681176B publication Critical patent/CN116681176B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/065Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Analysis (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Chemical & Material Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)

Abstract

本发明提供了一种基于聚类和异构图神经网络的交通流预测方法,属于交通流预测领域,所述交通流预测方法包括聚类模块、图转换模块以及时空特征学习模块;聚类模块通过动态时间规整算法与瓦瑟斯坦距离度量各节点在交通模式上的相似性,并使用谱聚类将节点按交通模式划分为不同簇;图转换模块用以自适应地为同簇节点构造元路径图;时空特征学习模块用以根据元路径图捕获节点间的时空相关性。本发明可以移植并应用于多种现有的基于图神经网络的交通流预测模型,在其基础上对交通数据的异质性建模,提高其预测精度。

Description

一种基于聚类和异构图神经网络的交通流预测方法
技术领域
本发明属于智慧城市交通预测技术领域,具体涉及一种基于聚类和异构图神经网络的交通流预测方法。
背景技术
准确预测交通路网中的交通流数据,对于构建智慧交通系统有着重大意义,可以帮助出行的车辆做出更优的道路规划,以及帮助交通管理部门对交通资源做出更为合理的分配。
如今,交通传感器的广泛安置使得研究人员可以获得大量交通流数据,并利用数据驱动的方法来解决交通流预测问题。由于传统卷积神经网络不适合处理图结构的数据,许多基于图神经网络的交通流预测模型被提出。
交通流预测问题本质属于时空数据挖掘问题。近年来,许多研究人员开始将图神经网络(graph neural network, GNN)引入到时空图结构数据的预测中。扩散卷积循环神经网(diffusion convolutional recurrent neural network, DCRNN)采用扩散图卷积来对空间信息在图结构中的扩散过程进行建模,并使用循环神经网络(recurrent neuralnetwork, RNN)对时间相关性进行建模。基于注意力的时空图卷积网络(attention basedspatial-temporal graph convolutional networks, ASTGCN)使用两个注意力层分别来捕捉空间相关性和时间相关性的动态变化。基于outlook注意力和图嵌入的交通流预测模型(model that combines outlook attention and graph embedding,MOAGE)利用outlook注意力对空间和时间维度的精细级信息进行编码,并通过node2vec算法学习路网的节点表示。然而,目前大多模型更侧重于对交通节点之间的时空关联进行建模,忽略了交通流数据的异质性对预测结果的影响。
交通流数据的异质性表现在:由于各交通节点所处区域的功能特性不同,节点所观察到的交通模式也有所差异,具体体现为交通数据的变化趋势不同以及交通数据的数值分布不同。这说明,一些虽然在空间上相距较远的节点可能会因为所处区域的功能特性相似而最终在交通状态的演变上呈现相似的规律与特点。因此,忽略这种异质性的预测模型很难捕捉到交通模式相似的节点间的关联性,从而导致其预测能力有限。
发明内容
针对上述存在的问题,本发明旨在提供基于聚类和异构图神经网络的交通流预测方法,该方法主要由聚类模块、图转换模块和时空特征学习模块三个模块组成。聚类模块将交通数据的特征矩阵作为输入,度量各交通节点之间在交通模式上的相似性,以此作为依据将节点划分为不同簇,然后输出各节点的簇划分结果;图转换模块根据聚类模块的簇划分结果,将路网的各节点赋予类别属性,即将路网由同构图转化为异构图,接着利用异构图神经网络GTN来自适应地得到一组元路径以及各元路径下的同构图。时空特征学习模块将原始路网、特征矩阵以及元路径图作为输入,旨在捕获各节点交通数据在时间和空间维度上相关性,并通过相似节点之间潜在的联系对其进一步加强,然后输出预测结果。其具体步骤如下:
步骤S1:给定一个加权有向图描述交通路网的拓扑结构。路网中的每个 交通传感器被视作一个节点,连接相邻传感器的路段被视作边,代表节点 集,则是节点的个数,代表边集,邻接矩阵被用来表示节点之间的相邻关系。 将路段长度的倒数作为边的权重,若两节点间没有相邻关系,则对应的邻接矩阵元素为0。
步骤S2: 将路网上交通传感器所采集的交通信息作为路网节点的属性特征,表示 为一个特征矩阵,其中表示历史时间序列的长度,则表示时刻所有传感器所采集到的交通信息数据,表示第个传感器 所采集到的长度为的历史交通信息数据。节点的属性特征可以是交通流量、交通速度、交 通密度等交通信息。
步骤S3:将特征矩阵输入到聚类模块中,聚类模块根据节点间交通模式(主要体 现在交通数据变化趋势和交通数据数值分布)把路网中的交通节点划分为不同的簇,从而 使交通节点带有类型属性。
步骤S3所述的聚类模块,其具体的处理过程为:
S3.1 将特征矩阵作为输入,利用快速动态时间规整算法度量各交通节点之间 分别在数据变化趋势上相似性,得到相似矩阵
S3.2将特征矩阵作为输入,利用瓦瑟斯坦距离度量各交通节点之间分别在数据 数值分布上的相似性,得到相似矩阵
步骤S3.2所述的利用瓦瑟斯坦距离度量各交通节点之间分别在数据数值分布上的相似性,其具体的处理过程为:
S3.2.1找出中所有元素的最大值与最小值,得到二者的差。
S3.2.2确定组数,以此得到各组的分点。
S3.2.3 将每个传感器采集到的交通数据就能转化成概率分布。例如,对于第个 传感器,统计其采集到的数值出现在各组的频率,记作, 其中代表第个传感器所采集到的数据的数值出现在第组的频率,则有。如 此,第个传感器的采集到的交通数据就能转化成概率分布
S3.2.4设定概率质量之间的转换成本,得到瓦瑟斯坦距离具体形式。例如,第个 节点第组的概率质量与第个节点第组的概率质量之间的转换成本可设定为二者数值 之差的绝对值,则交通节点之间的瓦瑟斯坦距离为:
式中:表示的联合概率分布的集合,概率分布则是该集合中 的一个元素,即要求的边缘分布正好是
S3.2.4 利用线性规划对瓦瑟斯坦距离进行求解。
S3.3 为了避免量纲对后续计算的影响,分别对进行归一化。
S3.4结合来构造相似矩阵,以度量各节点之间在交通模式 上的相似性,相似矩阵的元素可设定为:
S3.5将相似矩阵作为输入,利用谱聚类算法将节点划分为个不同的簇,节点 由于被划分到不同的簇从而得到类别属性,路网也因此由同构图转变为异构图。
步骤S4:将节点簇划分结果与路网邻接矩阵输入到图转换模块中,图转换模块能自适应地学习出同类节点的元路径以及元路径所对应的元路径图。
步骤S4所述的图转换模块,其具体的处理过程为:
S4.1对于转变为异构图的路网,利用以下方式建立可以对其进行描述的一组邻接 矩阵:设分别表示节点类型和边类型的集合。节点类型为聚类模块得到的各簇所 代表的类型,有;边类型则根据边两端的节点类型来定义,分别代表两种类型不同的边,设边类型的数量为,有。转化 为异构图的路网可以用一组邻接矩阵表示,其中是只包含某种类型 边的邻接矩阵,即当从第个节点到第个节点有类型为的边时,邻接矩阵行第元素是非零的。
S4.2将描述异构图的一组邻接矩阵作为输入,利用Graph Transformer Network(GTN)根据设定的通道数和图转换层数自适应地学习出元路径以及元路径所对应 的元路径图,具体方式如下:
在异构图中,若给定边类型序列,则代表元路径的邻接矩阵可 由邻接矩阵相乘所得到的,即:
相比于许多一般的异构图神经网络需要手动设计元路径,GTN可以根据给定的数据和任务自动学习出元路径。任意长度元路径的邻接矩阵可利用公式(2)自适应地得到
式中:表示元路径的邻接矩阵,表示边类型的集合,是第个边类型 的权值,并且是可学习的。此外,对图转换模块设置多个通道,以此来考虑元路径类型的多 样性,不同的通道得出不同的元路径。
步骤S5:将特征矩阵以及由路网原始的邻接矩阵与元路径图的邻接矩阵组成 的一个多通道的张量输入时空特征学习模块,时空特征学习模块输出最终 预测结果,其中表示所图转换模块所生成的元路径图的数量,时空特征学习时空特征学 习模块的作用在于:一方面,可从原始交通数据中提取节点间基本的时空关联性;另一方 面,可从元路径图中提取相似节点之间的关联性来对基本时空关联性进行补充和加强。
步骤S5所述的时空特征学习模块,其具体的处理过程为:
S5.1选择时空特征学习器。理论上现有的所有基于图神经网络的时空数据处理模型都可作为时空特征学习器使用,如T-GCN、DCRNN、ASTGCN、MOAGE等。
S5.2 利用时空特征学习器对每个通道的邻接矩阵进行处理,使得处于同一图结构的节点的时空特征得以聚合。
S5.3 使用全连接层对各通道上的信息进行融合并输出预测结果。
基于上述步骤,本发明的有益效果是:本发明公开了基于聚类和异构图神经网络的交通流预测方法,与现有技术相比,本发明的改进之处在于:
本发明提出了一种新颖的对交通流数据异质性建模的方法,使得预测模型在捕获交通流数据中复杂的时空相关性的同时,还能考虑交通模式相似的节点间的关联性。
本发明尝试将属于异构图神经网络的GTN引入交通流预测领域,由于GTN自身可与各种图神经网络进行组合,因此本发明可与各类基于图神经网络的时空预测模型相结合并增强其预测效果。
本发明在两个交通数据集上分别进行了大量的对比实验,实验结果表明所提出的方法是可以与基于图神经网络的时空预测模型相结合,并在一定程度上加强它们的预测效果的。
附图说明
图1为解释交通流数据异质性的说明图。交通流数据的异质性表现在:由于各交通节点所处区域的功能特性不同,节点所观察到的交通模式也有所差异,具体体现为交通数据的变化趋势不同以及交通数据的数值分布不同.如图1(a)所示,A、B、C是济南市历下区三个具有不同功能特性的区域,分别对应于住宅区、公园区、商业区。图1(b)显示了这三个区域不同的车流量变化趋势,在工作日,由于人们通常白天上班,晚上回家,因此驶入C地区的车流量在上午时段会逐渐增多并很快达到峰值,而与之相反,驶入A地区的车流量会在晚上逐渐增多并较晚达到峰值。除此之外,由于在工作日去公园游玩的人较少,因此B地区相较于A地区和C地区的流量要少很多。图1(c)显示了这三个区域不同的车流量数值分布情况。
图2为本发明所提出的一种基于聚类和异构图神经网络的交通流预测方法的流程图。
图3为本发明中的图转换模块的流程图。
图4为本发明与T-GCN模型结合后的T-GCN+模型,在不同聚类簇数下,预测未来15分钟交通流数据得到的RSME值结果图。
具体实施方案
为了使本领域的普通技术人员能够更好地理解本发明的技术方案,下面结合附图和实施例对本发明的技术方案做进一步的描述。
参考附图1-4所示的基于聚类和异构图神经网络的交通流预测方法,包括以下步骤:
步骤S1:选择用来进行对模型进行训练和测试的真实交通数据集,本方案选择了以下两个数据集:
(1) SZ-taxi。该数据集包含了从2015年1月1日到1月31日期间在深圳罗湖区156 条主要道路上的出租车行驶速度。数据主要包括两部分:一部分是的邻接矩阵,每 一行表示一条道路,矩阵中的值表示道路之间的连通性;另一部分是特征矩阵,它记录了每 条道路上交通速度的变化情况,每一行代表一条道路,每一列是不同时间段道路上的平均 交通速度。该数据集采样的时间间隔为15分钟。
(2) Los-loop。该数据集是由洛杉矶县的高速公路环路探测器实时采集的,并从2012年3月1日至3月7日选择了207个传感器及其探测到的交通速度数据,每5分钟汇总一次。数据集包括邻接矩阵和特征矩阵。邻接矩阵由交通网络中传感器之间的距离计算。
在本方案中,输入数据被归一化到[0,1]区间。此外,80%的数据被用作训练集,20%被用作测试集。
步骤S2:给定一个加权有向图描述交通路网的拓扑结构。路网中的每个 交通传感器被视作一个节点,连接相邻传感器的路段被视作边,代表节点 集,则是节点的个数,代表边集,邻接矩阵被用来表示节点之间的相邻关系。 将路段长度的倒数作为边的权重,若两节点间没有相邻关系,则对应的邻接矩阵元素为0。
将路网上交通传感器所采集的交通信息作为路网节点的属性特征,表示为一个特 征矩阵,其中表示历史时间序列的长度,则表示时 刻所有传感器所采集到的交通信息数据,表示第个传感器所采集到的长度为 的历史交通信息数据。
步骤S3:将特征矩阵输入到聚类模块中,聚类模块根据节点间交通模式(主要体 现在交通数据变化趋势和交通数据数值分布)把路网中的交通节点划分为不同的簇,从而 使交通节点带有类型属性。
步骤S3所述的聚类模块,其具体的处理过程为:
S3.1 将特征矩阵作为输入,利用快速动态时间规整算法度量各交通节点之间 分别在数据变化趋势上相似性,得到相似矩阵。快速动态时间规整的算法描述具体如 下:
算法1.fast-DTW算法
输入:时间序列,时间序列,搜索长度
输出:在趋势变化上的相似性
①for do
②for do
;
④if then
⑤else if then
⑥else if then
⑦else if then
⑧else if then
⑨else
⑩end
⑪end
⑫ return
S3.2将特征矩阵作为输入,利用瓦瑟斯坦距离度量各交通节点之间分别在数据 数值分布上的相似性,得到相似矩阵
步骤S3.2所述的利用瓦瑟斯坦距离度量各交通节点之间分别在数据数值分布上的相似性,其具体的处理过程为:
S3.2.1找出中所有元素的最大值与最小值,得到二者的差。
S3.2.2确定组数,以此得到各组的分点。
S3.2.3 将每个传感器采集到的交通数据就能转化成概率分布。例如,对于第个 传感器,统计其采集到的数值出现在各组的频率,记作, 其中代表第个传感器所采集到的数据的数值出现在第组的频率,则有。如 此,第个传感器的采集到的交通数据就能转化成概率分布
S3.2.4设定概率质量之间的转换成本,得到瓦瑟斯坦距离具体形式。例如,第个 节点第组的概率质量与第个节点第组的概率质量之间的转换成本可设定为二者数值 之差的绝对值,则交通节点之间的瓦瑟斯坦距离为:
式中:表示的联合概率分布的集合,概率分布则是该集合中 的一个元素,即要求的边缘分布正好是
S3.2.5 利用线性规划对瓦瑟斯坦距离进行求解。
S3.3 为了避免量纲对后续计算的影响,分别对进行归一化。
S3.4结合来构造相似矩阵,以度量各节点之间在交通模式 上的相似性,相似矩阵的元素可设定为:
S3.5将相似矩阵作为输入,利用谱聚类算法将节点划分为个不同的簇,节点 由于被划分到不同的簇从而得到类别属性,路网也因此由同构图转变为异构图。切图方式 为Ncut的谱聚类算法的具体描述如下:
算法2.Ncut谱聚类法
输入:节点集,相似矩阵, 降维后的维度, 聚类方法,聚类后的 簇数
输出:簇划分
① 由相似矩阵构建度矩阵
② 计算拉普拉斯矩阵
③ 构建标准化后的拉普拉斯矩阵
④ 计算最小的个特征值所各自对应的特征向量;
⑤ 将各自对应的特征向量组成的矩阵按行标准化,最终组成维的特征矩阵
⑥ 对中的每一行作为一个维的样本,共个样本,用输入的聚类方法进行聚 类,聚类维数为
⑦ 得到簇划分
步骤S4:将节点簇划分结果与路网邻接矩阵输入到图转换模块中,图转换模块能自适应地学习出同类节点的元路径以及元路径所对应的元路径图。
步骤S4所述的图转换模块,其具体的处理过程为。
S4.1对于转变为异构图的路网,利用以下方式建立可以对其进行描述的一组邻接 矩阵:设分别表示节点类型和边类型的集合。节点类型为聚类模块得到的各簇所 代表的类型,有;边类型则根据边两端的节点类型来定义,分别代表两种类型不同的边,设边类型的数量为,有。转化 为异构图的路网可以用一组邻接矩阵表示,其中是只包含某种类型 边的邻接矩阵,即当从第个节点到第个节点有类型为的边时,邻接矩阵行第 列的元素是非零的。
S4.2将描述异构图的一组邻接矩阵作为输入,利用Graph Transformer Network(GTN)根据设定的通道数和图转换层数自适应地学习出元路径以及元路径所对应 的元路径图,具体方式如下:
在异构图中,若给定边类型序列,则代表元路径的邻接矩阵可 由邻接矩阵相乘所得到的,即
相比于许多一般的异构图神经网络需要手动设计元路径,GTN可以根据给定的数据和任务自动学习出元路径。任意长度元路径的邻接矩阵可利用公式(2)自适应地得到
式中:表示元路径的邻接矩阵,表示边类型的集合,是第个边类型 的权值,并且是可学习的。此外,对图转换模块设置多个通道,以此来考虑元路径类型的多 样性,不同的通道得出不同的元路径。
步骤S5:将特征矩阵以及由路网原始的邻接矩阵与元路径图的邻接矩阵组成 的一个多通道的张量输入时空特征学习模块,时空特征学习模块输出最终 预测结果,其中表示所图转换模块所生成的元路径图的数量,时空特征学习时空特征学 习模块的作用在于:一方面,可从原始交通数据中提取节点间基本的时空关联性;另一方 面,可从元路径图中提取相似节点之间的关联性来对基本时空关联性进行补充和加强。
步骤S5所述的时空特征学习模块,其具体的处理过程为:
S5.1选择时空特征学习器。理论上现有的所有基于图神经网络的时空数据处理模型都可作为时空特征学习器使用,如T-GCN、DCRNN、ASTGCN、MOAGE等。
S5.2 利用时空特征学习器对每个通道的邻接矩阵进行处理,使得处于同一图结构的节点的时空特征得以聚合。
S5.3 使用全连接层对各通道上的信息进行融合并输出预测结果。
下面结合实施例对本发明做进一步的详细说明。
本实施例使用本发明提出的交通流预测方法在SZ-taxi和Los-loop两个真实数据集上对其预测性能进行实验与评估。在实施例中,输入数据被归一化到[0,1]区间。此外,80%的数据被用作训练集,20%被用作测试集,以此来预测未来15分钟、30分钟和60分钟的交通数据。
本实施例选择将T-GCN、DCRNN、ASTGCN、MOAGE相关组件作为本发明所提出交通流预测方法的时空特征学习模块,以此来验证该方法对这类深度时空预测模型的加强与辅助作用。
本实施例采用了三个回归任务常使用的性能度量:均方根误差(root meansquare error, RMSE)、平均绝对值误差(mean absolute error, MAE)以及精度(Accuracy),以评估真实交通信息与预测值之间的差异。这三种性能度量的计算方法为:
本实施例所选取的基线模型如下:
1) HA。历史平均模型。将交通数据的演变视作为一个以日为周期的变化过程。某个时间步的预测结果是每日该时间步所有历史数据的平均值。
2) ARIMA。整合移动平均自回归模型是一种应用广泛的时间序列预测模型,它将移动平均和自回归相结合。
3) GRU。门控循环单元是一种简单而有效的RNN结构,使用门控机制来记忆更多的长期信息,用于时间序列建模。
4) DCRNN。扩散卷积递归神经网络分别使用基于双向随机游走的扩散卷积和编码器-解码器结构来处理空间相关性和时间相关性。
5) T-GCN。该模型结合了GCN和GRU,使用GCN捕获空间相关性,并使用GRU学习交通数据在时间上变化的动态性。
6) ASTGCN。基于注意力的时空图卷积网络,引入了空间和时间维度上的注意力机制。
7) MOAGE。该模型使用outlook注意力机制来模拟路网中的时空依赖关系,并用node2vec算法学习路网的节点表示。
本实施例中的实验均在Linux服务器(CPU: Intel(R) Xeon(R)Gold 6226R CPU @2.90GHz, GPU: NVIDIA GeForce GTX 3090)上基于Pytorch框架进行训练与测试。经过多次实验,本实施例所选取的超参数如表1所示。
表1 超参数设置
本实施例利用本发明所提出的方法对基线模型中的深度时空模型进行了增强,并将增强后的模型命名为“基础模型+”。增强后的模型与基线模型进行比较结果如表2所示。
表2 不同模型在SZ-taxi数据集上的性能比较
表3 不同模型在Los-loop数据集上的性能比较
由表2和表3可知,传统的非深度模型,如HA与ARIMA,因其基于线性和平稳的假设,从而在应对复杂且非线性的交通数据时表现出明显的局限性。通过比较发现,基于深度学习的模型通常比传统的非深度模型效果更好,其中,同时考虑时间相关性和空间相关性的模型都优于GRU这类只考虑了时间相关性的传统深度模型。
在增强后模型与其基础模型的比较中,平均而言,增强后的模型在SZ-taxi数据集上有5.7%的RMSE改进、5.7%的MAE改进以及2.0%的Accuracy改进,且在Los-loop数据集上有13.1%的RMSE改进、11.5%的MAE改进以及1.5%的Accuracy改进。之所以本发明提出的方法会对基于图神经网络的时空预测模型有如此明显的改进,是因为SZ-taxi数据集与Los-loop数据集有众多的交通节点,这些节点不可能只呈现单一的交通模式,但一般的模型无法有效地对节点的交通模式进行区分,且无法在此基础上利用好相似节点之间的共同演变规律与特征。相反,本发明所提出的方法可以度量节点在交通模式上的相似性,进而对节点进行聚类,并使用异构图神经网络来聚合相似节点之间的特征,最终帮助基础模型捕获到更多相关性以提高预测精度。另外,由于图转换网络本身就可与不同的图神经网络进行组合,因此本发明所提出的方法在理论上很容易移植于任何基于图神经网络的时空数据预测模型。
除此之外,本方法的超参数选择对预测效果有很大影响。例如,不同的聚类簇数对于方本法的增强效果有很大的影响,因此本实施例选择了不同的聚类簇数进行试验,并通过比较各自的预测结果来选择最佳聚类簇数。以T-GCN+模型预测未来15分钟交通流数据为例,对于SZ-taxi和Los-loop两个数据集,聚类簇数从[2,3,4,5,6,7]中选择,并且其余超参数不变,进而分析预测精度的变化。图4显示了在不同聚类簇数的情况下T-GCN+模型预测出的RMSE和MAE结果。从图中可以看出,处理SZ-loop数据集时,选择聚类簇数为5预测结果最好,而对于Los-loop数据集来说,选择聚类簇数为6预测结果最好。这是由于Los-loop数据集所包含的交通节点在总数量比SZ-taxi数据集多,因而其包含的交通模式种类较多。由图4可知,随着聚类簇数的增加,预测误差会先降低后提高。分析其原因,当聚类簇数大于一定程度时,一方面模型的复杂度和计算难度会大大增加;另一方面,聚类簇数的增加可能会导致同簇的交通节点数量变少,进而使得模型更加难以总结出存在于同簇节点之间的交通演变规律。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (1)

1.一种基于聚类和异构图神经网络的交通流预测方法,其特征在于,构建基于聚类和异构图神经网络的交通流预测框架,该框架包括聚类模块、图转换模块和时空特征学习模块,基于聚类和异构图神经网络的交通流预测方法包括以下步骤:
步骤S1: 给定一个加权有向图描述交通路网的拓扑结构,路网中的每个交通传感器被视作一个节点,连接相邻传感器的路段被视作边,/>代表节点集,/>则是节点的个数,/>代表边集,邻接矩阵/>被用来表示节点之间的相邻关系,将路段长度的倒数作为边的权重,若两节点间没有相邻关系,则对应的邻接矩阵元素为0;
步骤S2: 将路网上交通传感器所采集的交通信息作为路网节点的属性特征,表示为一个特征矩阵,其中/>表示历史时间序列的长度,则/>表示/>时刻所有传感器所采集到的交通信息数据,/>表示第/>个传感器所采集到的长度为/>的历史交通信息数据,节点的属性特征可以是交通流量、交通速度、交通密度等交通信息;
步骤S3:将特征矩阵输入到聚类模块中,聚类模块根据节点间交通模式(主要体现在交通数据变化趋势和交通数据数值分布)把路网中的交通节点划分为不同的簇,从而使交通节点带有类型属性;
步骤S3所述的聚类模块,其具体的处理过程为:
S3.1 将特征矩阵作为输入,利用快速动态时间规整算法度量各交通节点之间分别在数据变化趋势上相似性,得到相似矩阵/>
S3.2将特征矩阵作为输入,利用瓦瑟斯坦距离度量各交通节点之间分别在数据数值分布上的相似性,得到相似矩阵/>
步骤S3.2所述的利用瓦瑟斯坦距离度量各交通节点之间分别在数据数值分布上的相似性,其具体的处理过程为:
S3.2.1找出中所有元素的最大值与最小值,得到二者的差;
S3.2.2确定组数,以此得到各组的分点;
S3.2.3 将每个传感器采集到的交通数据就能转化成概率分布,例如,对于第个传感器,统计其采集到的数值出现在各组的频率,记作/>,其中代表第/>个传感器所采集到的数据的数值出现在第/>组的频率,则有/>,如此,第/>个传感器的采集到的交通数据就能转化成概率分布/>
S3.2.4设定概率质量之间的转换成本,得到瓦瑟斯坦距离具体形式,例如,第个节点第/>组的概率质量与第/>个节点第/>组的概率质量之间的转换成本可设定为二者数值之差的绝对值,则交通节点/>与/>之间的瓦瑟斯坦距离为:
式中:表示/>和/>的联合概率分布的集合,概率分布/>则是该集合中的一个元素,即要求/>的边缘分布正好是/>和/>
S3.2.4 利用线性规划对瓦瑟斯坦距离进行求解;
S3.3 为了避免量纲对后续计算的影响,分别对和/>进行归一化;
S3.4结合和/>来构造相似矩阵/>,以度量各节点之间在交通模式上的相似性,相似矩阵/>的元素可设定为:
S3.5将相似矩阵作为输入,利用谱聚类算法将节点划分为/>个不同的簇,节点由于被划分到不同的簇从而得到类别属性,路网也因此由同构图转变为异构图;
步骤S4:将节点簇划分结果与路网邻接矩阵输入到图转换模块中,图转换模块能自适应地学习出同类节点的元路径以及元路径所对应的元路径图;
步骤S4所述的图转换模块,其具体的处理过程为:
S4.1对于转变为异构图的路网,利用以下方式建立可以对其进行描述的一组邻接矩阵:设和/>分别表示节点类型和边类型的集合,节点类型为聚类模块得到的各簇所代表的类型,有/>;边类型则根据边两端的节点类型来定义,/>分别代表两种类型不同的边,设边类型的数量为/>,有/>,转化为异构图的路网/>可以用一组邻接矩阵/>表示,其中/>是只包含某种类型边的邻接矩阵,即当从第/>个节点到第/>个节点有类型为/>的边时,邻接矩阵/>第/>行第/>元素是非零的;
S4.2将描述异构图的一组邻接矩阵作为输入,利用Graph TransformerNetwork(GTN)根据设定的通道数和图转换层数自适应地学习出元路径以及元路径所对应的元路径图,具体方式如下:
在异构图中,若给定边类型序列,则代表元路径/>的邻接矩阵/>可由邻接矩阵相乘所得到的,即
相比于许多一般的异构图神经网络需要手动设计元路径,GTN可以根据给定的数据和任务自动学习出元路径,任意长度元路径的邻接矩阵可利用公式(2)自适应地得到
式中:表示元路径的邻接矩阵,/>表示边类型的集合,/>是第/>个边类型/>的权值,并且是可学习的,此外,对图转换模块设置多个通道,以此来考虑元路径类型的多样性,不同的通道得出不同的元路径;
步骤S5:将特征矩阵以及由路网/>原始的邻接矩阵与元路径图的邻接矩阵组成的一个多通道的张量/>输入时空特征学习模块,时空特征学习模块输出最终预测结果,其中/>表示所图转换模块所生成的元路径图的数量,时空特征学习时空特征学习模块的作用在于:一方面,可从原始交通数据中提取节点间基本的时空关联性;另一方面,可从元路径图中提取相似节点之间的关联性来对基本时空关联性进行补充和加强;
步骤S5所述的时空特征学习模块,其具体的处理过程为:
S5.1选择时空特征学习器,理论上现有的所有基于图神经网络的时空数据处理模型都可作为时空特征学习器使用,如T-GCN、DCRNN、ASTGCN、MOAGE等;
S5.2 利用时空特征学习器对每个通道的邻接矩阵进行处理,使得处于同一图结构的节点的时空特征得以聚合;
S5.3 使用全连接层对各通道上的信息进行融合并输出预测结果。
CN202310689450.5A 2023-06-12 2023-06-12 一种基于聚类和异构图神经网络的交通流预测方法 Active CN116681176B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310689450.5A CN116681176B (zh) 2023-06-12 2023-06-12 一种基于聚类和异构图神经网络的交通流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310689450.5A CN116681176B (zh) 2023-06-12 2023-06-12 一种基于聚类和异构图神经网络的交通流预测方法

Publications (2)

Publication Number Publication Date
CN116681176A true CN116681176A (zh) 2023-09-01
CN116681176B CN116681176B (zh) 2024-05-03

Family

ID=87785189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310689450.5A Active CN116681176B (zh) 2023-06-12 2023-06-12 一种基于聚类和异构图神经网络的交通流预测方法

Country Status (1)

Country Link
CN (1) CN116681176B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117009839A (zh) * 2023-09-28 2023-11-07 之江实验室 基于异构超图神经网络的患者聚类方法和装置
CN117648197A (zh) * 2024-01-30 2024-03-05 西安电子科技大学 基于对抗学习与异构图学习的序列化微服务资源预测方法
CN117974340A (zh) * 2024-03-29 2024-05-03 昆明理工大学 结合深度学习分类与图聚类的社交媒体事件检测方法
CN118262527A (zh) * 2024-05-29 2024-06-28 常州知更鸟科技有限公司 基于大数据的交通平台数据管理方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889546A (zh) * 2019-11-20 2020-03-17 浙江省交通规划设计研究院有限公司 一种基于注意力机制的交通流量模型训练方法
WO2021109318A1 (zh) * 2019-12-03 2021-06-10 东南大学 一种城市路网短期交通运行状态估计与预测方法
CN113779429A (zh) * 2021-09-18 2021-12-10 平安国际智慧城市科技股份有限公司 交通拥堵态势预测方法、装置、设备及存储介质
CN114254543A (zh) * 2020-09-24 2022-03-29 罗伯特·博世有限公司 利用深度状态空间模型的预测
US11295241B1 (en) * 2021-02-19 2022-04-05 Sailpoint Technologies, Inc. System and method for incremental training of machine learning models in artificial intelligence systems, including incremental training using analysis of network identity graphs
CN114461934A (zh) * 2021-12-31 2022-05-10 北京工业大学 基于动态交通网络的多模态出行方式融合推荐方法
US20220327514A1 (en) * 2018-11-30 2022-10-13 Visa International Service Association System, method, and computer program product for generating embeddings for objects
CN115578680A (zh) * 2022-09-09 2023-01-06 北京理工大学 一种视频理解方法
CN115935796A (zh) * 2022-11-21 2023-04-07 南通大学 一种基于时空异质的和同步的图卷积网络交通流预测方法
CN116227721A (zh) * 2023-03-16 2023-06-06 国网福建省电力有限公司经济技术研究院 基于生成对抗网络的用户负荷率预测方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220327514A1 (en) * 2018-11-30 2022-10-13 Visa International Service Association System, method, and computer program product for generating embeddings for objects
CN110889546A (zh) * 2019-11-20 2020-03-17 浙江省交通规划设计研究院有限公司 一种基于注意力机制的交通流量模型训练方法
WO2021109318A1 (zh) * 2019-12-03 2021-06-10 东南大学 一种城市路网短期交通运行状态估计与预测方法
CN114254543A (zh) * 2020-09-24 2022-03-29 罗伯特·博世有限公司 利用深度状态空间模型的预测
US11295241B1 (en) * 2021-02-19 2022-04-05 Sailpoint Technologies, Inc. System and method for incremental training of machine learning models in artificial intelligence systems, including incremental training using analysis of network identity graphs
CN113779429A (zh) * 2021-09-18 2021-12-10 平安国际智慧城市科技股份有限公司 交通拥堵态势预测方法、装置、设备及存储介质
CN114461934A (zh) * 2021-12-31 2022-05-10 北京工业大学 基于动态交通网络的多模态出行方式融合推荐方法
CN115578680A (zh) * 2022-09-09 2023-01-06 北京理工大学 一种视频理解方法
CN115935796A (zh) * 2022-11-21 2023-04-07 南通大学 一种基于时空异质的和同步的图卷积网络交通流预测方法
CN116227721A (zh) * 2023-03-16 2023-06-06 国网福建省电力有限公司经济技术研究院 基于生成对抗网络的用户负荷率预测方法及系统

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
HAN SHI-YUAN 等: "Traffic Forecasting Based on Integration of Adaptive Subgraph Reformulation and Spatio-Temporal Deep Learning Model", 《ELECTRONICS》, vol. 11, no. 6, 9 March 2022 (2022-03-09), pages 861 *
MINGYU KANG等: "CWGAN: A Graph Vector Based Traffic Missing Data Adversarial Generation Approach", 《2020 CHINESE AUTOMATION CONGRESS (CAC)》, 29 January 2021 (2021-01-29), pages 6234 - 6238 *
XIAO-YUE MA 等: "Traffic Flow Prediction Algorithm Based on Flexible Neural Tree", 《2019 INTERNATIONAL CONFERENCE ON SECURITY, PATTERN ANALYSIS, AND CYBERNETICS (SPAC)》, 4 May 2020 (2020-05-04), pages 97 - 100 *
ZHI QIAO 等: "Heterogeneous Network Embedding With Enhanced Event Awareness Via Triplet Network", 《2021 INTERNATIONAL CONFERENCE ON NETWORKING AND NETWORK APPLICATIONS (NANA)》, 10 December 2021 (2021-12-10), pages 231 - 235 *
孔锐 等: "基于条件约束的胶囊生成对抗网络", 《自动化学报》, vol. 46, no. 01, 15 January 2020 (2020-01-15), pages 94 - 107 *
李昊 等: "异构数据库环境下的交通信息共享技术研究", 《公路交通科技》, no. 06, 30 June 2006 (2006-06-30), pages 140 - 144 *
梁尘逸 等: "基于异构信息网络与TF-IDF的核心药物发现算法", 《计算机时代》, no. 05, 2 May 2023 (2023-05-02), pages 31 - 35 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117009839A (zh) * 2023-09-28 2023-11-07 之江实验室 基于异构超图神经网络的患者聚类方法和装置
CN117009839B (zh) * 2023-09-28 2024-01-09 之江实验室 基于异构超图神经网络的患者聚类方法和装置
CN117648197A (zh) * 2024-01-30 2024-03-05 西安电子科技大学 基于对抗学习与异构图学习的序列化微服务资源预测方法
CN117648197B (zh) * 2024-01-30 2024-05-03 西安电子科技大学 基于对抗学习与异构图学习的序列化微服务资源预测方法
CN117974340A (zh) * 2024-03-29 2024-05-03 昆明理工大学 结合深度学习分类与图聚类的社交媒体事件检测方法
CN118262527A (zh) * 2024-05-29 2024-06-28 常州知更鸟科技有限公司 基于大数据的交通平台数据管理方法

Also Published As

Publication number Publication date
CN116681176B (zh) 2024-05-03

Similar Documents

Publication Publication Date Title
CN116681176B (zh) 一种基于聚类和异构图神经网络的交通流预测方法
CN110570651B (zh) 一种基于深度学习的路网交通态势预测方法及系统
Son et al. Some novel hybrid forecast methods based on picture fuzzy clustering for weather nowcasting from satellite image sequences
CN111932026B (zh) 基于数据融合和知识图谱嵌入的城市流量模式挖掘方法
CN115578851B (zh) 一种基于mgcn的交通预测方法
CN113159364A (zh) 一种大型交通场站的客流预测方法及系统
CN112863182B (zh) 基于迁移学习的跨模态数据预测方法
US20240143999A1 (en) Multi-modal data prediction method based on causal markov model
CN109242170A (zh) 一种基于数据挖掘技术的城市道路管理系统及方法
CN113962472A (zh) 一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法
Xu et al. A graph spatial-temporal model for predicting population density of key areas
CN112419711B (zh) 基于改进gmdh算法的封闭式停车场停车需求预测方法
CN112101132B (zh) 一种基于图嵌入模型和度量学习的交通状况预测方法
Tian et al. Characterizing the activity patterns of outdoor jogging using massive multi-aspect trajectory data
CN115204477A (zh) 一种上下文感知图递归网络的自行车流量预测方法
CN116797274A (zh) 一种基于Attention-LSTM-LightGBM的共享单车需求量预测方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN116311921A (zh) 一种基于多空间尺度时空Transformer的交通速度预测方法
Kim et al. A daily tourism demand prediction framework based on multi-head attention CNN: The case of the foreign entrant in South Korea
CN116307152A (zh) 时空交互式动态图注意力网络的交通预测方法
CN115269758A (zh) 面向乘客诱导的路网客流状态推演方法及系统
CN117272849B (zh) 区域停车场饱和度的预测方法、系统及可读存储介质
CN118133084A (zh) 基于分层图卷积网络的无监测站区域空气质量预测方法和装置
CN112883133B (zh) 基于时序数据和功能演变数据的流量预测方法
CN113159371B (zh) 基于跨模态数据融合的未知目标特征建模与需求预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant