CN114925836B - 基于动态多视图图神经网络的城市交通车流量推理方法 - Google Patents

基于动态多视图图神经网络的城市交通车流量推理方法 Download PDF

Info

Publication number
CN114925836B
CN114925836B CN202210849898.4A CN202210849898A CN114925836B CN 114925836 B CN114925836 B CN 114925836B CN 202210849898 A CN202210849898 A CN 202210849898A CN 114925836 B CN114925836 B CN 114925836B
Authority
CN
China
Prior art keywords
road
traffic flow
traffic
module
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210849898.4A
Other languages
English (en)
Other versions
CN114925836A (zh
Inventor
于彦伟
代少杰
王金帅
董军宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ocean University of China
Original Assignee
Ocean University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ocean University of China filed Critical Ocean University of China
Priority to CN202210849898.4A priority Critical patent/CN114925836B/zh
Publication of CN114925836A publication Critical patent/CN114925836A/zh
Application granted granted Critical
Publication of CN114925836B publication Critical patent/CN114925836B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/065Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Medical Informatics (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于动态多视图图神经网络的城市交通车流量推理方法,属于智能交通技术领域。本发明首先根据交通路网的结构和属性信息构建亲和图;其次,在路网空间和路段属性特征亲和图上执行多视图图卷积操作,以捕获空间和属性特征的依赖性;然后设计了一种时序自注意力机制,以区分不同时间粒度上的流量模式对最终推理结果的依赖性;最后设计了一个联合学习目标函数,通过结合空间和时间交通车流量模式来指导路段的表征学习,以推理车流量。本发明能够对城市交通路网中未安装监控设备的路段进行准确的车流量推理,提升了推理的准确度,对于优化交通调度、改善交通环境、提高城市智能化管理水平和构建智慧城市具有重要意义。

Description

基于动态多视图图神经网络的城市交通车流量推理方法
技术领域
本发明涉及一种基于动态多视图图神经网络的城市交通车流量推理方法,属于智能交通技术领域。
背景技术
城市交通车流量推理旨在解决无监控道路上的数据缺失问题,是智能交通系统(Intelligent Transportation System, ITS)的重要研究内容,车流量推理对于提高城市道路交通运行的安全性,充分利用城市道路设施,优化交通调度,改善交通环境,提高城市智能化管理水平,减少道路交通拥堵,构建智慧城市具有重要意义。
随着移动互联网技术的快速发展,实时交通监控对于各种城市应用具有非常重要的意义和价值,例如智能交通系统、基于位置的推荐和用户移动性建模。准确的全市交通车流量监测可以为公众提供高效便捷的交通服务,例如,详细的交通车流量是交通灯智能控制的数据基础,如果在所有交叉口的每个方向都没有观测到的车流量,就不可能实现整个区域的智能交通信号控制。此外,了解不同路段的交通模式,有助于更好地决策交通调度和缓解交通拥堵问题。因此,对城市交通车流量信息的有效推断对于智能交通系统和城市计算场景的成功至关重要。虽然估计城市交通路网上的交通车流量为各种数据驱动的智慧城市应用提供了巨大的好处,但它面临着几个亟待解决的关键挑战:
第一,任意缺失值。由于各种因素的产生,例如传感器错误或网络间通信故障,从而通过监控设备获得的交通车流量数据可能在任意时间段和位置缺失。这种任意缺失的数据会带来信息噪声,阻碍交通模式建模,可能导致交通车流量推理的性能下降。
第二,尽管各种监控设备(如监控摄像头、交通雷达或环形探测器)的部署越来越多,但由于安装和维护成本较高,考虑到整个城市的交通路网规模,各种监控设备的地理覆盖范围仍然非常有限。值得注意的是,与基于历史交通数据车流量预测问题不同,车流量推理任务没有任何可用于未受监控道路的历史数据。因此,如何在没有(或非常有限的)历史数据的情况下,通过探索复杂的时空依赖关系来进行自适应性地学习,进行交通车流量推断,仍然是一个重大挑战。
第三,复杂地时空依赖关系。复杂的交通模式表现为时间依赖和多粒度的时间关系。不同粒度的交通数据变化规律可能呈现不同的时间模式(例如,每小时、每天、每周),它们相互补充、相互依赖。此外,就地理相关性而言,单个路段的交通车流量会受其他邻接路段交通车流量的影响,且各种道路环境特征,例如:速度限制和车道数,也会对道路车流量产生影响。在城市道路网络上,很难同时对交通车流量的复杂空间相关性和时间相关性进行建模。
发明内容
为解决智慧交通系统领域中的车流量推理推荐问题,本发明的目的是提供一种基于动态多视图图神经网络的城市交通车流量推理方法,以弥补现有技术的不足。
为实现上述发明目的,本发明采取的具体技术方案如下:
一种基于动态多视图图神经网络的城市交通车流量推理方法,包括如下步骤:
S1:收集路网数据,利用交叉口将路网分割成短的路段;将该路网数据分为训练数据和测试数据;
S2:构建亲和图,包括空间亲和图和属性特征亲和图;
S3:构建图卷积网络基础模型:设计空间卷积模块、属性特征卷积模块、公共卷积模块和多视图融合模块;
S4:所述图卷积网络基础模型中引入时间自注意力机制,将对应于不同时间粒度的路段特征纳入时间自注意力机制,再将时间自注意力模块扩展为多头的,在历史时间片上计算多个时间自注意力头,以计算最终的路段表征;
S5:构建所述图卷积网络基础模型中的目标函数,最终得到动态多视图图神经网络模型;
S6:利用训练数据对所述动态多视图图神经网络模型进行训练,再根据已有的路网数据最终学习的路段特征向量利用所述动态多视图图神经网络模型推理车流量。
进一步的,所述S1中:利用交叉口将路网分割成短的路段;每个路段都是有向的,用于连接两个相邻的十字路口,使用
Figure 467934DEST_PATH_IMAGE001
表示路网中路段的集合;对于每个路段
Figure 866335DEST_PATH_IMAGE002
,将其路段特征表示为
Figure 964741DEST_PATH_IMAGE003
,例如路段等级、路段长度,车道数、限速等上下文信息,以X表示所有路段的特征矩阵。
进一步的,所述S2具体为:
(1)构建空间亲和图
每个空间关联图
Figure 918791DEST_PATH_IMAGE004
是基于道路网络在时间片
Figure 869692DEST_PATH_IMAGE005
上的权重图,其中每个路段是图中的一个节点,边表示路段之间的连接关系;例如,如果路段
Figure 36231DEST_PATH_IMAGE006
的终点交叉路口是路段
Figure 254723DEST_PATH_IMAGE007
的起点交叉路口,则会在路段
Figure 848515DEST_PATH_IMAGE006
和路段
Figure 519668DEST_PATH_IMAGE007
之间创建一条边
Figure 519591DEST_PATH_IMAGE008
。因此,道路网络的空间关系由空间亲和图建模,路段的车道数目越多,交通车流量就越大;路段上的车道数量是影响交通车流量的重要因素。因此,对边
Figure 123748DEST_PATH_IMAGE008
的权重定义如下:
Figure 186644DEST_PATH_IMAGE009
(1)
其中,
Figure 876252DEST_PATH_IMAGE010
表示路段
Figure 915752DEST_PATH_IMAGE006
上的车道数,
Figure 867091DEST_PATH_IMAGE011
表示路段
Figure 68265DEST_PATH_IMAGE007
上的车道数目,
Figure 979589DEST_PATH_IMAGE012
是一个线性函数,
Figure 291622DEST_PATH_IMAGE013
是sigmoid激活函数,将权重范围压缩到(0,1);
(2)构建属性特征亲和图
道路特征相似的路段,其流量模式也是类似的。考虑了五种类型的道路特征,即道路类型、道路长度、车道数、速度限制以及路段起点/终点进口道数量,还将路段每个时间片上的车流量值作为额外的路段特征;对于没有监控设备的路段,采用空间上最临近的k个路段的平均车流量作为车流量特征;然后,使用基于kNN方法从路段属性特征矩阵X中提取最相近的路段,生成属性特征亲和图。
更进一步的,首先计算n个路段中的属性特征相似性矩阵
Figure 106256DEST_PATH_IMAGE014
,使用余弦相似性式计算两个路段之间的相似度分数,这是一种获得两个向量之间相似性的常用方法:
Figure 478332DEST_PATH_IMAGE015
(2)
其中,
Figure 611373DEST_PATH_IMAGE016
Figure 727096DEST_PATH_IMAGE017
表示路段
Figure 393308DEST_PATH_IMAGE006
和路段
Figure 201864DEST_PATH_IMAGE007
的属性特征向量,然后,为每个路段选择top-k相似路段来构建边,最后得到路网在路段属性维度上的邻接矩阵
Figure 87780DEST_PATH_IMAGE018
进一步的,所述S3中:
将多视图的嵌入按照以下计算方式融合:
Figure 39818DEST_PATH_IMAGE019
(11)
其中,注意力权重表示为
Figure 753346DEST_PATH_IMAGE020
Figure 529541DEST_PATH_IMAGE021
Figure 669797DEST_PATH_IMAGE022
Figure 392903DEST_PATH_IMAGE023
(3)
其中,
Figure 269592DEST_PATH_IMAGE024
表示第l层的输出,
Figure 449644DEST_PATH_IMAGE025
Figure 44573DEST_PATH_IMAGE026
表示所有路段的属性特征矩阵,f表示特征维度,
Figure 305790DEST_PATH_IMAGE027
表示可学习的投影层,此外,
Figure 69609DEST_PATH_IMAGE028
Figure 922028DEST_PATH_IMAGE029
,I是单位矩阵,
Figure 207516DEST_PATH_IMAGE030
是空间维度上的邻接矩阵,
Figure 788537DEST_PATH_IMAGE031
是矩阵
Figure 374239DEST_PATH_IMAGE032
第i行第j列的值,
Figure 600821DEST_PATH_IMAGE033
是矩阵
Figure 639184DEST_PATH_IMAGE034
第i行第i列的值,
Figure 743669DEST_PATH_IMAGE034
是计算运行中的中间矩阵,用d表示所有路段的嵌入维度;
使用
Figure 183877DEST_PATH_IMAGE035
和X作为输入执行属性特征卷积操作:
Figure 846940DEST_PATH_IMAGE036
(4)
通过属性特征卷积操作,可以生成路段在属性维度第l层的特征嵌入
Figure 107020DEST_PATH_IMAGE037
,其中,
Figure 513730DEST_PATH_IMAGE038
是用于嵌入变换的可训练权重矩阵,
Figure 572560DEST_PATH_IMAGE039
Figure 140944DEST_PATH_IMAGE040
Figure 419479DEST_PATH_IMAGE041
Figure 98722DEST_PATH_IMAGE035
是属性维度上的邻接矩阵,
Figure 749408DEST_PATH_IMAGE042
是矩阵
Figure 488694DEST_PATH_IMAGE035
第i行第j列的值,
Figure 988946DEST_PATH_IMAGE043
是矩阵
Figure 737459DEST_PATH_IMAGE044
第i行第i列的值,
Figure 511161DEST_PATH_IMAGE044
是计算运行中的中间矩阵;
根据路段在空间和属性特征维度下的嵌入定义了一个公共嵌入
Figure 686927DEST_PATH_IMAGE045
,计算公式如下:
Figure 408896DEST_PATH_IMAGE046
(7)
更进一步的,所述S3具体为:
S3-1:空间卷积模块
为了建模跨区域的空间相关性并聚合来自相邻路段的空间上下文信号,基于谱图理论在空间亲和图
Figure 695520DEST_PATH_IMAGE047
上设计了卷积层;基于以下传播方案定义多层空间卷积规则:
Figure 586378DEST_PATH_IMAGE048
(3)
其中,
Figure 933046DEST_PATH_IMAGE049
表示第l层的输出,
Figure 142310DEST_PATH_IMAGE025
Figure 498205DEST_PATH_IMAGE026
表示所有路段的属性特征矩阵,f表示特征维度,
Figure 568536DEST_PATH_IMAGE027
表示可学习的投影层,此外,
Figure 351684DEST_PATH_IMAGE028
Figure 877606DEST_PATH_IMAGE050
,I是单位矩阵,
Figure 37192DEST_PATH_IMAGE030
是空间维度上的邻接矩阵,
Figure 135598DEST_PATH_IMAGE051
是矩阵
Figure 316744DEST_PATH_IMAGE052
第i行第j列的值,
Figure 766180DEST_PATH_IMAGE053
是矩阵
Figure 198298DEST_PATH_IMAGE054
第i行第i列的值,用d表示所有路段的嵌入维度;
S3-2:属性特征卷积模块
简单的空间图卷积运算无法编码与图拓扑结构和相应节点特征有关的复杂依赖关系,即当仅执行空间图卷积时,可能无法区分道路约束和道路特征的重要性。直观上来说,道路属性特征越相似,交通车流量就越相似。因此,使用
Figure 682369DEST_PATH_IMAGE018
Figure 43206DEST_PATH_IMAGE026
作为输入执行属性特征卷积操作:
Figure 979938DEST_PATH_IMAGE036
(4)
其中,
Figure 215747DEST_PATH_IMAGE055
是用于嵌入变换的可训练权重矩阵,即通过属性特征卷积操作,可以生成路段的属性特征嵌入
Figure 787280DEST_PATH_IMAGE056
S3-3公共卷积模块
实际上,城市路网的空间和属性特征并非完全无关。因此,模型不仅需要提取这两个维度中特定于路段的嵌入信息,还需要提取这两个维度共享的公共信息。因此,设计了公共卷积模块(common-GCN),利用参数共享策略执行卷积运算;通过下式定义层间传播规则:
Figure 83132DEST_PATH_IMAGE057
(5)
Figure 772740DEST_PATH_IMAGE058
(6)
给定空间图
Figure 48126DEST_PATH_IMAGE059
和特征图
Figure 241209DEST_PATH_IMAGE060
,可以得到路段的两种表示
Figure 442384DEST_PATH_IMAGE061
Figure 822549DEST_PATH_IMAGE062
Figure 904556DEST_PATH_IMAGE063
表示所有路段在公共空间维度上在第l+1层的表示,
Figure 952146DEST_PATH_IMAGE064
表示所有路段在公共属性维度上在第l+1层的表示,Relu为激活函数;
Figure 324222DEST_PATH_IMAGE065
表示在公共维度上第l层可学习的投影层,根据路段在空间和属性特征维度下的嵌入定义了一个公共嵌入
Figure 457263DEST_PATH_IMAGE066
,计算公式如下:
Figure 808872DEST_PATH_IMAGE067
(7)
S3-4:多视图融合模块
在融合模块中,设计了一个注意力层来执行这个聚合过程
Figure 710969DEST_PATH_IMAGE068
,计算过程如下:
Figure 519525DEST_PATH_IMAGE069
(8)
其中,
Figure 405441DEST_PATH_IMAGE070
表示n个路段在H s ,H f 和H c 三个嵌入空间上的注意力权重,以一个路段在空间维度上的向量表示
Figure 557812DEST_PATH_IMAGE071
为例,首先对路段嵌入
Figure 845574DEST_PATH_IMAGE072
执行非线性变换操作,然后使用一个共享的注意力向量
Figure 559452DEST_PATH_IMAGE073
去计算注意力权重
Figure 401506DEST_PATH_IMAGE074
,计算公式如下:
Figure 360497DEST_PATH_IMAGE075
(9)
其中,
Figure 502765DEST_PATH_IMAGE076
代表可训练的参数矩阵,
Figure 387545DEST_PATH_IMAGE077
偏置向量,得到路段
Figure 45508DEST_PATH_IMAGE006
在属性特征、公共维度上的注意力权重
Figure 306725DEST_PATH_IMAGE078
Figure 772341DEST_PATH_IMAGE079
;之后,采用softmax函数来标准化注意力权重,计算方式如下:
Figure 93601DEST_PATH_IMAGE080
(10)
其中
Figure 411712DEST_PATH_IMAGE081
表示在空间维度上的标准化的注意力权重,
Figure 476620DEST_PATH_IMAGE082
Figure 327902DEST_PATH_IMAGE083
;将这一定义扩展到所有路段,计算得到的注意力权重表示为
Figure 554484DEST_PATH_IMAGE084
Figure 622541DEST_PATH_IMAGE085
Figure 225560DEST_PATH_IMAGE022
;最后,将多视图的嵌入按照以下计算方式融合:
Figure 665769DEST_PATH_IMAGE086
(11)
其中,H表示所有路段经过注意力机制融合后的向量表示,H s 表示所有路段在空间维度上的向量表示,H f 表示所有路段在属性维度上的向量表示,H c 表示所有路段在空间维度上的向量表示。
进一步的,所述S4中:
为了捕获车流量在各种粒度上时间的依赖性(例:一个路段在将来5分钟的流量受该路段前5分钟流量信息的影响,且前一天、前一周同一时间段的流量信息具有显著联系),设计了在时间维度上截取四种类型的时间片,(1)当前时间片
Figure 328831DEST_PATH_IMAGE087
;(2)最近时间片
Figure 355955DEST_PATH_IMAGE088
;(3)每天时间片
Figure 28245DEST_PATH_IMAGE089
;(4)每周时间片
Figure 322960DEST_PATH_IMAGE090
。然后,将对应于不同时间粒度的路段特征纳入时间自注意力机制,时间自注意力模块计算方式定义如下:
Figure 156924DEST_PATH_IMAGE091
(12)
其中,
Figure 674274DEST_PATH_IMAGE092
表示路段
Figure 353517DEST_PATH_IMAGE006
在所有相关时间片上的一个嵌入拼接矩阵,
Figure 33897DEST_PATH_IMAGE093
Figure 38762DEST_PATH_IMAGE094
表示在H i 上的权重转移矩;进一步将时间先后信息嵌入到位置编码矩阵P中,以区分车流量信息的时间先后顺序,P定义如下:
Figure 40479DEST_PATH_IMAGE095
(13)
能够建模不同时间粒度车流量变化趋势的节点嵌入计算方式如下:
Figure 54571DEST_PATH_IMAGE096
(14)
其中,
Figure 589457DEST_PATH_IMAGE097
是一个可训练的线性转换矩阵。
将时间自注意力模块扩展为多头的,在历史时间片上计算多个时间自注意力头,以计算最终的路段表征:
Figure 263759DEST_PATH_IMAGE098
(15)
其中,head代表注意力头的数量,设计一个全连接的网络FC来聚合多个注意力头的表示。
进一步的,S5中所述目标函数为:
Figure 251307DEST_PATH_IMAGE099
(22)
其中,λ表示正则项的超参数,
Figure 803511DEST_PATH_IMAGE100
来表示模型的所有参数,通过联合训练无监督的随机游走目标函数
Figure 192904DEST_PATH_IMAGE101
和半监督的流量约束目标函数
Figure 775457DEST_PATH_IMAGE102
,模型框架能够有效地建模车流量的空间和时间动态模式;
Figure 515880DEST_PATH_IMAGE103
(16)
其中,
Figure 606196DEST_PATH_IMAGE104
表示路段
Figure 850095DEST_PATH_IMAGE006
Figure 860340DEST_PATH_IMAGE007
之间在t时间片上的相似度分数,
Figure 556901DEST_PATH_IMAGE105
表示路段
Figure 450907DEST_PATH_IMAGE006
和rk之间在t时间片上的相似度分数,即
Figure 316357DEST_PATH_IMAGE106
Figure 4828DEST_PATH_IMAGE107
之间的相似度,
Figure 188684DEST_PATH_IMAGE108
代表sigmoid函数,
Figure 886382DEST_PATH_IMAGE109
表示在随机游走过程中使用
Figure 868988DEST_PATH_IMAGE110
采样的节点集,
Figure 728360DEST_PATH_IMAGE111
表示在t时间片上
Figure 133933DEST_PATH_IMAGE110
的负边采样集,vj和vk表示路段j和路段k;
Figure 369742DEST_PATH_IMAGE112
(17)
其中,超参数
Figure 209785DEST_PATH_IMAGE113
用来平衡当前、最近、每天和每周的车流量模式的重要性,
Figure 505637DEST_PATH_IMAGE114
是当前车流量模式的目标函数,
Figure 929665DEST_PATH_IMAGE115
是最近车流量模式的目标函数,
Figure 207980DEST_PATH_IMAGE116
是每天的车流量模式目标函数,
Figure 401064DEST_PATH_IMAGE117
是每周的车流量目标函数;
Figure 867818DEST_PATH_IMAGE118
(18)
Figure 280607DEST_PATH_IMAGE119
(19)
Figure 858219DEST_PATH_IMAGE120
(20)
Figure 436968DEST_PATH_IMAGE121
(21)
其中,
Figure 838737DEST_PATH_IMAGE122
表示路段
Figure 971778DEST_PATH_IMAGE006
在时间片t上的真实车流量,
Figure 884239DEST_PATH_IMAGE123
表示路段rj在时间片t上的真实流量,T表示所有的时间片集合;假设特征向量相似的路段在车流量信息上也更加相似,则
Figure 818959DEST_PATH_IMAGE124
的目的是在时间片为t的嵌入空间中,
Figure 158674DEST_PATH_IMAGE125
表示所有有监控设备的路段集合,查询出与目标路段
Figure 513432DEST_PATH_IMAGE006
最相似的且已安装监控设备最相似的k个路段
Figure 683380DEST_PATH_IMAGE126
,从而推断路段
Figure 439984DEST_PATH_IMAGE006
的车流量。
更进一步的,所述S5中:
无监督的目标函数对动态时空上下文信息进行编码,学习路段的特征向量。在提出的模型中,使用节点
Figure 419441DEST_PATH_IMAGE127
在时间片t上的动态表征
Figure 261495DEST_PATH_IMAGE106
来捕获基于空间亲和图
Figure 453442DEST_PATH_IMAGE127
的局部空间拓扑结构信息。具体而言,在每个时间片上使用二元交叉熵损失函数,以鼓励在固定长度随机游走的序列中,同时包含的节点具有更高的相似度:
Figure 831596DEST_PATH_IMAGE128
(16)
其中,
Figure 716375DEST_PATH_IMAGE104
表示路段
Figure 780146DEST_PATH_IMAGE006
Figure 775784DEST_PATH_IMAGE007
之间在t时间片上的相似度分数,即
Figure 5515DEST_PATH_IMAGE106
Figure 795616DEST_PATH_IMAGE129
之间的相似度,计算方式可以是任何向量相似性度量函数(例如,内积运算),
Figure 612263DEST_PATH_IMAGE108
代表sigmoid函数,
Figure 677171DEST_PATH_IMAGE109
表示在随机游走过程中使用
Figure 764337DEST_PATH_IMAGE130
采样的节点集,
Figure 522078DEST_PATH_IMAGE111
表示在t时间片上节点
Figure 91600DEST_PATH_IMAGE127
的负边采样集。
另外,城市车流量信息呈现显著的周期性,在推理车流量信息时,除了考虑当前的时间片,还应考虑车流量的周期性。具体来说,考虑四种粒度的车流量模式,即当前模式、最近模式、每天模式和每周模式。将上述四种粒度的车流量模式整合在模型的目标函数中,使用半监督学习范式定义损失函数,如下所示:
Figure 199014DEST_PATH_IMAGE131
(17)
其中,超参数
Figure 170381DEST_PATH_IMAGE132
用来平衡当前、最近、每天和每周的车流量模式的重要性。
Figure 99023DEST_PATH_IMAGE118
(18)
Figure 657305DEST_PATH_IMAGE119
(19)
Figure 64016DEST_PATH_IMAGE120
(20)
Figure 889889DEST_PATH_IMAGE121
(21)
其中,
Figure 723853DEST_PATH_IMAGE122
表示路段
Figure 766502DEST_PATH_IMAGE006
在时间片t上的真实车流量;假设特征向量相似的路段在车流量信息上也更加相似,则
Figure 711324DEST_PATH_IMAGE133
的目的是在时间片为t的嵌入空间中,查询出与目标路段
Figure 391704DEST_PATH_IMAGE006
最相似的且已安装监控设备的top-k路段
Figure 163613DEST_PATH_IMAGE134
,从而推断路段
Figure 929444DEST_PATH_IMAGE006
的车流量。
最后,将
Figure 412378DEST_PATH_IMAGE135
Figure 947265DEST_PATH_IMAGE136
通过超参数
Figure 881286DEST_PATH_IMAGE137
Figure 665571DEST_PATH_IMAGE138
集成到一个联合学习框架中,超参数用于平衡空间结构近邻性和时空流量模式的重要性。最终的联合目标函数定义为
Figure 984819DEST_PATH_IMAGE139
Figure 108633DEST_PATH_IMAGE140
(22)
其中,λ表示正则项的超参数,
Figure 189722DEST_PATH_IMAGE100
来表示模型的所有参数,通过联合目标函数,模型框架能够有效地建模车流量的空间和时间动态模式。
进一步的,所述S6中, 根据最终学习的路段特征向量按照以下计算方式来推理未安装监控设备路段
Figure 664565DEST_PATH_IMAGE006
在时间片t上的车流量:
Figure 489302DEST_PATH_IMAGE141
(23)
一种基于动态多视图图神经网络的城市交通车流量推理系统,包括交通数据库模块100、空间亲和图构建模块101、属性特征亲和图构建模块102、空间卷积模块103、属性特征卷积模块104、公共卷积模块105、多视图融合模块106、多头时序自注意力模块107、联合学习与优化模块108和车流量推理模块109;
交通数据库模块100:用于所述S1中收集路网数据,利用交叉口将路网分割成短的路段;
空间亲和图构建模块101:用于所述S2中构建空间亲和图,以建模交通路网的空间关联信息;
属性特征亲和图构建模块102:用于所述S2中构建属性特征亲和图,以建模交通路网的属性特征关联信息;
空间卷积模块103:用于所述S3中构建空间卷积模块,以提取交通路网的空间关联信息;
属性特征卷积模块104:用于所述S3中构建属性特征卷积模块,以提取交通路网的属性特征关联信息;
公共卷积模块105:用于所述S3中构建公共卷积模块,以提取城市路网的空间和属性特征,以及这两个特征共享的公共信息;
多视图融合模块106:用于所述S3中构建多视图融合模块,以将不同视图的嵌入信息借助注意力机制融合;
多头时序自注意力模块107:用于所述S4中的时间自注意力机制,以从不同的时间粒度上建模每个路段的车流量模式;
联合学习与优化模块108:用于得到所述S5的目标函数,以获得每一时间片上、每一路段的表征;
车流量推理模块109:用于所述S6中的车流量推理。
本发明的优点和有益效果:
(1) 不同于交通车流量预测问题,本发明的车流量推理模型不依赖于历史流量信息;(2) 相比传统的车流量推理方法,本发明不需要借助完整的机动车GSP轨迹数据,不需要借助交通模拟器去进行车流量数据的填补和模拟;(3) 本发明通过从道路内和道路间维度联合建模复杂的空间校正和时间依赖性来推理城市交通路网中没有监控设备路段上的车流量;(4)本发明在空间和特征亲和图上结合多视图的图卷积和时间自注意力机制,自适应地学习道路段特征向量在拓扑结构和上下文特征中的深层时间相关性;(5)设计了一个联合学习目标函数,该函数由无监督随机游走和半监督时空车流量约束组成,用于增强城市范围内交通车流量推理的路段表征学习。综上所述,本发明能够对城市交通路网中未安装监控设备的路段进行准确的车流量推理,进一步提升推理的准确度,对于优化交通调度,改善交通环境,提高城市智能化管理水平,减少道路交通拥堵,构建智慧城市具有重要意义。
本发明首先根据交通路网的结构和属性信息构建亲和图;其次,在路网空间和路段属性特征亲和图上执行多视图图卷积操作,以捕获空间和属性特征的依赖性;然后设计了一种时序自注意力机制,以区分不同时间粒度上的流量模式对最终推理结果的依赖性;最后设计了一个联合学习目标函数,通过结合空间和时间交通车流量模式来指导路段的表征学习,以便准确地推理车流量。
附图说明
图1是交通车流量推理示意图。
图2是基于动态多视图图神经网络的城市交通车流量推理的流程图。
图3是本发明的总体框架图。
图4是不同时间粒度依赖关系说明图。
图5是本发明在杭州数据集上对超参数(嵌入维度和注意力的头数head)的敏感性实验。
图6是本发明在济南数据集上对超参数(嵌入维度和注意力的头数head)的敏感性实验。
图3中,交通数据库模块100、空间亲和图构建模块101、属性特征亲和图构建模块102、空间卷积模块103、属性特征卷积模块104、公共卷积模块105、多视图融合模块106、多头时序自注意力模块107、联合学习与优化模块108和车流量推理模块109。
具体实施方式
以下通过具体实施例并结合附图对本发明做进一步说明。
实施例1:
将本发明要解决的技术问题转化为一个推理问题,如图1所示,根据给定的路网结构以及已安装监控设备路段的流量信息
Figure 231737DEST_PATH_IMAGE142
,t代表时间点,去推理在每个时间片上未安装监控设备的路段的流量信息
Figure 483726DEST_PATH_IMAGE143
在所有时间片上的流量信息,即推理出图1右侧路段-时间流量矩阵当中问号处的值。
一种基于动态多视图图神经网络的城市交通车流量推理方法,如图2所示,具体步骤如下:
步骤1,利用交叉口将路网分割成短路段,所述路网映射为网络节点的方式。每个路段连接两个相邻的十字路口,需要注意的是路段是有向的,使用
Figure 180287DEST_PATH_IMAGE144
表示路网中路段的集合;对于每个路段
Figure 808714DEST_PATH_IMAGE145
,将其路段特征表示为
Figure 674164DEST_PATH_IMAGE146
,例如路段等级,路段长度,车道数,限速等上下文信息,以X表示所有路段的特征矩阵。
步骤2,亲和图的构建,空间亲和图的构建方式基于车道数目的权重设置策略,属性特征亲和图的构建方式基于道路特征的权重设置策略;
(1)空间亲和图的构建模块
每个空间关联图
Figure 97056DEST_PATH_IMAGE147
是基于道路网络在时间片
Figure 546491DEST_PATH_IMAGE148
上的权重图,其中每个路段是图中的一个节点,边表示路段之间的连接关系;例如,如果路段
Figure 713031DEST_PATH_IMAGE006
的终点交叉路口是路段
Figure 170338DEST_PATH_IMAGE007
的起点交叉路口,则会在路段
Figure 764130DEST_PATH_IMAGE006
和路段
Figure 169704DEST_PATH_IMAGE007
之间创建一条边
Figure 405513DEST_PATH_IMAGE008
。因此,道路网络的空间关系由空间亲和图建模,路段的车道数目越多,交通车流量就越大;路段上的车道数量是影响交通车流量的重要因素。因此,对边
Figure 212932DEST_PATH_IMAGE008
的权重定义为:
Figure 744670DEST_PATH_IMAGE149
(1)
(2)属性特征亲和图的构建模块
道路特征相似的路段,其流量模式也是类似的。具体来说,方法考虑了五种类型的道路特征,即道路类型、道路长度、车道数、速度限制以及路段起点/终点进口道数量,还将路段每个时间片上的车流量值作为额外的路段特征。对于没有监控设备的路段,采用空间上最临近的k个路段的平均车流量作为车流量特征。然后,使用基于kNN方法从路段属性特征矩阵X中提取最相近的路段,生成属性特征亲和图。具体来说,首先计算n个路段中的属性特征相似性矩阵
Figure 903118DEST_PATH_IMAGE014
,使用余弦相似性式计算两个路段之间的相似度分数,这是一种获得两个向量之间相似性的常用方法。
步骤3,多视图的图卷积
(1)空间卷积模块
为了建模跨区域的空间相关性并聚合来自相邻路段的空间上下文信号,基于谱图理论在空间亲和图
Figure 942619DEST_PATH_IMAGE150
上设计了卷积层,其中层间传播规则定义为:
Figure 604544DEST_PATH_IMAGE151
(3)
(2)属性特征卷积模块
然而,简单的空间图卷积运算可能无法编码与图拓扑结构和相应节点特征有关的复杂依赖关系,即当仅执行空间图卷积时,可能无法区分道路约束和道路特征的重要性。直观上来说,道路属性特征越相似,交通车流量就越相似。因此,使用
Figure 569833DEST_PATH_IMAGE018
和X作为输入执行属性特征卷积操作:
Figure 949998DEST_PATH_IMAGE152
(4)
(3)公共卷积模块
实际上,城市路网的空间和属性特征并非完全无关。因此,模型不仅需要提取这两个维度中特定于路段的嵌入信息,还需要提取这两个维度共享的公共信息。因此,设计了common-GCN模块,利用参数共享策略执行卷积运算,通过下式定义层间传播规则:
Figure 527610DEST_PATH_IMAGE153
(5)
Figure 309622DEST_PATH_IMAGE154
(6)
给定空间图
Figure 183162DEST_PATH_IMAGE155
和特征图
Figure 316203DEST_PATH_IMAGE156
,可以得到两种表示
Figure 431926DEST_PATH_IMAGE157
Figure 334023DEST_PATH_IMAGE158
;根据路段在空间和属性特征维度下的嵌入定义了一个公共嵌入
Figure 658693DEST_PATH_IMAGE159
,计算公式如下:
Figure 747871DEST_PATH_IMAGE160
(7)
(4)多视图融合模块
在融合模块中,设计了一个注意力层来执行这个聚合过程
Figure 932865DEST_PATH_IMAGE068
,计算过程为:
Figure 689469DEST_PATH_IMAGE161
(8)
其中,
Figure 904812DEST_PATH_IMAGE070
表示n个路段在H s ,H f 和H c 三个嵌入空间上的注意力权重;以一个路段在空间维度中的向量表示
Figure 12445DEST_PATH_IMAGE071
为例,首先对
Figure 469971DEST_PATH_IMAGE072
执行非线性变换操作,然后使用一个共享的注意力向量
Figure 81081DEST_PATH_IMAGE162
去计算注意力权重
Figure 729975DEST_PATH_IMAGE074
,计算公式如下:
Figure 793746DEST_PATH_IMAGE163
(9)
其中,
Figure 54963DEST_PATH_IMAGE164
代表可训练的参数矩阵,
Figure 520579DEST_PATH_IMAGE077
偏置向量,可以得到路段
Figure 343304DEST_PATH_IMAGE006
在属性特征、公共维度上的注意力权重
Figure 159950DEST_PATH_IMAGE078
Figure 959279DEST_PATH_IMAGE079
;之后,采用softmax函数来标准化注意力权重,计算方式如下:
Figure 544981DEST_PATH_IMAGE165
(10)
Figure 541537DEST_PATH_IMAGE082
Figure 579900DEST_PATH_IMAGE083
;将这一定义扩展到所有路段,计算得到的注意力权重表示为
Figure 448499DEST_PATH_IMAGE084
Figure 888707DEST_PATH_IMAGE085
Figure 787655DEST_PATH_IMAGE022
;最后,将多视图的嵌入按照以下计算方式融合:
Figure 578894DEST_PATH_IMAGE166
(11)
步骤4,多头时序自注意力机制
如图4所示,为了捕获车流量在各种粒度上时间的依赖性(例:一个路段在将来5分钟的流量受该路段前5分钟流量信息的影响,且前一天、前一周同一时间段的流量信息具有显著联系),设计了在时间维度上截取四种类型的时间片,(1)当前时间片
Figure 720025DEST_PATH_IMAGE087
;(2)最近时间片
Figure 280320DEST_PATH_IMAGE088
;(3)每天时间片
Figure 347239DEST_PATH_IMAGE089
;(4)每周时间片
Figure 625774DEST_PATH_IMAGE167
。然后,将对应于不同时间粒度的路段特征纳入时间自注意力机制,计算方式如下:
Figure 305017DEST_PATH_IMAGE168
(12)
其中,
Figure 985397DEST_PATH_IMAGE092
表示路段
Figure 491727DEST_PATH_IMAGE006
在所有相关时间片上的一个嵌入拼接矩阵,
Figure 726399DEST_PATH_IMAGE169
Figure 209333DEST_PATH_IMAGE094
表示在H i 上的权重转移矩;进一步将时间先后信息嵌入到位置编码矩阵P中,以区分车流量信息的时间先后顺序,P定义如下:
Figure 744220DEST_PATH_IMAGE170
(13)
能够建模不同时间粒度车流量变化趋势的节点嵌入计算方式如下:
Figure 881503DEST_PATH_IMAGE171
(14)
其中,
Figure 869051DEST_PATH_IMAGE172
是一个可训练的线性转换矩阵。
如果将时间自注意力模块扩展为多头的,根据下式可以计算最终的路段表征:
Figure 890097DEST_PATH_IMAGE173
(15)
其中,head代表多头时序自注意力模块中的注意力头的数量,设计一个全连接的网络
Figure 545069DEST_PATH_IMAGE174
来聚合多个注意力头的表示。
步骤5,联合学习与优化
无监督的目标函数对动态时空上下文信息进行编码,学习路段的特征向量。在提出的模型中,使用节点
Figure 626157DEST_PATH_IMAGE127
在时间片t上的动态表征
Figure 602466DEST_PATH_IMAGE175
来捕获基于空间亲和图
Figure 161623DEST_PATH_IMAGE127
的局部空间拓扑结构信息。具体而言,在每个时间片上使用二元交叉熵损失函数
Figure 139944DEST_PATH_IMAGE176
,以鼓励在固定长度随机游走的序列中,同时包含的节点具有更高的相似度。
Figure 391933DEST_PATH_IMAGE177
(16)
所述目标函数具体包括基于随机游走的无监督目标函数,基于车流量约束的半监督目标函数。另外,城市车流量信息呈现显著的周期性,在推理车流量信息时,除了考虑当前的时间片,还应考虑车流量的周期性。具体来说,考虑四种粒度的车流量模式,即当前模式、最近模式、每天模式和每周模式。将上述四种粒度的车流量模式整合在模型的目标函数中,使用半监督学习范式定义损失函数,如下式:
Figure 852608DEST_PATH_IMAGE178
(17)
最后,将
Figure 481036DEST_PATH_IMAGE179
Figure 313863DEST_PATH_IMAGE180
通过超参数
Figure 2333DEST_PATH_IMAGE181
Figure 451769DEST_PATH_IMAGE182
集成到一个联合学习框架中,超参数用于平衡空间结构近邻性和时空流量模式的重要性。最终的联合目标函数定义为
Figure 854193DEST_PATH_IMAGE183
Figure 807106DEST_PATH_IMAGE184
(22)
步骤6,在获得最终的每一时刻路段网络表征之前,需要先对模型进行训练优化。将具有交通车流量信息的路段随机分为两组,分别用于训练(80%)和测试(20%)。进一步随机选取20%的训练数据设置为验证集,使用验证集对模型进行多轮调参,确定公式(22)中的参数
Figure 666478DEST_PATH_IMAGE185
的最优取值,具体来说,首先将所有参数先设置为1,每次选择一个参数并固定其余参数进行调整,利用验证集进行10次推荐预测,取平均MAPE,平均RMSE的和作为算法的效果指标调整参数设置,当两者的和为最小时该参数即调整为最优,接着再取一个未被调整的参数,重复上述步骤,直到所有参数都被调整为最优。
步骤7,交通车流量推理
根据最终学习的路段特征向量按照以下计算方式来推理未安装监控设备路段
Figure 72051DEST_PATH_IMAGE006
在时间片t上的车流量:
Figure 812255DEST_PATH_IMAGE186
(23)
一种基于动态多视图图神经网络的城市交通车流量推理系统,如图3所示,包括交通数据库模块100、空间亲和图构建模块101、属性特征亲和图构建模块102、空间卷积模块103、属性特征卷积模块104、公共卷积模块105、多视图融合模块106、多头时序自注意力模块107、联合学习与优化模块108和车流量推理模块109,如图3,以下对各部分进行具体说明:
交通数据库模块100:该数据库包括城市的路网结构信息以及每个路段的特征属性信息,每条记录格式为:<起点路口ID,终点路口ID,路段长度,路段等级,路段车道数目,路段限速,起点进口道数量,终点进口道数量等>;路段和监控设备的匹配信息,每条记录的格式为:<监控设备ID,起点路口ID,终点路口ID >;已安装监控设备路段的流量信息,每条记录的格式为:<起点路口ID,终点路口ID,起始时间,结束时间,车流量信息>;
空间亲和图构建模块101:根据上述技术方案步骤2所述方法建模交通路网的空间关联信息;
属性特征亲和图构建模块102:根据上述技术方案步骤2建模交通路网的属性特征关联信息;
空间卷积模块103:根据上述技术方案步骤3提取交通路网的空间关联信息;
属性特征卷积模块104:根据上述技术方案步骤3提取交通路网的属性特征关联信息;
公共卷积模块105:根据上述技术方案步骤3,城市路网的空间和属性特征并非完全无关,因此,不仅需要提取这两个空间和属性中特定于路段的嵌入信息,还需要提取这两个维度共享的公共信息;
多视图融合模块106:根据上述技术方案步骤3将不同视图的嵌入信息借助注意力机制融合;
多头时序自注意力模块107:根据上述技术方案步骤4从不同的时间粒度上建模每个路段的车流量模式,如图4所示,假设当前的时间片为2016年8月20号8:30-8:35,则2016年8月20号8:20-8:30对应的车流量模式的近期模式
Figure 885253DEST_PATH_IMAGE187
;2016年8月18号8:30-8:35和2016年8月19号8:30-8:35对应的车流量模式的天模式
Figure 649947DEST_PATH_IMAGE188
;2016年8月06号8:30-8:35和2016年8月13号8:30-8:35对应的车流量模式的周模式
Figure 808396DEST_PATH_IMAGE189
联合学习与优化模块108:根据上述技术方案步骤5,优化联合目标函数,进行多轮调参,获得每一时间片上、每一路段的表征
Figure 316737DEST_PATH_IMAGE190
,n和m分别表示路段和时间片的数量,d表示所有路段的嵌入维度。
车流量推理模块109:根据上述技术方案步骤6对没有安装监控设备的路段进行车流量推理。
本发明在实验中的时间片长度设置为5分钟,将具有交通车流量信息的路段随机分为两组,分别用于训练(80%)和测试(20%),设计了三个实验验证。
本发明采用广泛使用的回归任务评估指标:均方根误差(RMSE)和平均绝对百分比误差(MAPE)来衡量车流量推理模型结果的准确性,这两个指标越小,代表模型性能越好。RMSE和MAPE的计算方式如下:
Figure 745707DEST_PATH_IMAGE191
(24)
Figure 946881DEST_PATH_IMAGE192
(25)
Figure 327047DEST_PATH_IMAGE193
(26)
其中,n和m分别表示路段和时间片的数量,
Figure 373500DEST_PATH_IMAGE194
表示在时间片t上路段
Figure 919626DEST_PATH_IMAGE006
车流量的真值/推理值。
实验一:本发明提出的模型与其他模型的性能比较
本实验中的对比方法如下:
(1)k-最近邻(kNN):该模型计算的结果是在每个时间片上查找距离目标路段最邻近的k个已安装监控设备路段的车流量,并计算其平均值。
(2)Context Average(CA):该模型根据路段的属性特征,从已安装监控设备路段中查询在路段属性特征方面最相似的K个路段的车流量,计算其平均值。
(3)Multilayer Perceptron(MLP):该模型将路段的属性特征作为输入,将其合并到多层感知器中进行车流量预测。
(4)XGBoost:XGBoost是一种广泛使用的集成学习模型,它使用梯度增强树对每个路段的交通车流量进行回归预测,在每个时间片上分别使用XGBoost进行训练。
(5) ST-SSL:该模型基于半监督的学习框架,能够融合来自不同来源的数据,在ST-SSL中,通过构建时空亲和图来建模跨时间间隔和路段的空间和时间相关性。
(6)CityVolInf:该模型将基于SSL的相似性模块与交通模拟模块相结合,对相邻路段之间车流量的时空相关性和车流量传播模式进行建模。
(7)CT-Gen:该模型是一种基于键值记忆神经网络的高效模型,它假定相邻道路可能具有相似的交通车流量,具有相同道路特性的路段共享相似的交通车流量模式。CT-Gen由候选选择模块和键值注意网络组成,前者选择有监控设备的相关路段作为候选路段,后者学习有监控设备路段之间的外部依赖关系。
(8)JMDI:该模型是一种基于强化学习的方法,用于从不完整的轨迹中学习车辆完整的移动信息,该方法引入了一个带有半监督学习机制的图嵌入组件来估计整个城市空间的交通车流量信息。
表1为本发明与不同对比方法在杭州市和济南市进行车流量推理的性能比对
Figure 291701DEST_PATH_IMAGE195
从表1中,可以观察到,与其他车流量推理模型相比,本发明提出的基于动态多视图的图神经网络模型获得了最佳的推理结果。特别地,本发明相对于性能最好的对比方法CT-Gen在
Figure 424743DEST_PATH_IMAGE196
Figure 806045DEST_PATH_IMAGE197
以及RMSE指标上分别提升了37.54%、23.88%和28.55%(在两个实验数据集中取性能提升的平均值)。
实验二:消融实验
主要验证本发明各个组成模块的必要性,各个模型的变体描述如下:
(1)CTVI-TA:该模型变体删除了时序上的自注意力机制模块,直接使用从空间和属性特征相似图中学习到的特征向量来进行交通车流量推理任务。
(2) CTVI-PE:该模型变体删除了位置编码结构,忽略了车流量历史序列的先后顺序,以验证其必要性。
(3)CTVI-RW:该模型变体不考虑用于增强最终目标函数的无监督损失
Figure 944028DEST_PATH_IMAGE198
。具体来说,将
Figure 487005DEST_PATH_IMAGE199
设置为0,其他组件保持不变。
(4)CTVI-VL:该模型变体不考虑车流量损失
Figure 841763DEST_PATH_IMAGE200
,其目的是验证交通车流量模式约束的必要性。具体来说,将
Figure 26756DEST_PATH_IMAGE201
Figure 33894DEST_PATH_IMAGE202
设置为0。
(5)CTVI-C:该模型变体通过将
Figure 747772DEST_PATH_IMAGE203
设置为0,不考虑当前交通车流量的约束。
(6)CTVI-R:该模型变体通过将
Figure 855405DEST_PATH_IMAGE204
设置为0,不考虑近期交通车流量的约束。
(7)CTVI-W:该模型变体通过将
Figure 312931DEST_PATH_IMAGE205
设置为0,不考虑每天交通车流量的约束。
(8)CTVI-W:该模型变体通过将
Figure 425506DEST_PATH_IMAGE206
设置为0,不考虑每周交通车流量的约束。
表2为本发明与不同对比方法在杭州市和济南市进行车流量推理的性能比对
Figure 575865DEST_PATH_IMAGE207
CTVI-TA和CTVI-PE的主要目的是验证本发明框架结构的作用。CTVI-RW、CTVI-VL、CTVI-C、CTVI-R、CTVI-D和CTVI-W更关注目标函数的设置,目标函数的每一项分别反映了随机游走增强和当前的/最近的/每日的/每周的交通车流量模式约束。CTVI-TA、CTVI-RW和本发明之间的比较分别强调了时间自注意力结构和无监督随机游走增强的有效性。从表中,可以观察到CTVI-VL在杭州和济南数据集的所有变量中表现最差,这表明时空车流量模式约束在推理车流量方面的有效性。
实验三:超参数敏感性实验
该研究了超参数对模型推理精度的影响,即嵌入维度和注意力的头数head。在杭州数据集上的实验结果如图5所示,在济南数据集上的实验结果图6所示,需要注意的是,为了保持
Figure 905215DEST_PATH_IMAGE208
Figure 900853DEST_PATH_IMAGE209
以及RMSE具有大致相同的数值范围,本发明将RMSE乘以了0.01。可以观察到,在两个实验数据集上,嵌入维度d为128时,模型可以获得最佳的推理性能。随着维数
Figure 130583DEST_PATH_IMAGE210
的增加,模型趋于过度拟合。
以上计划方案,仅为本发明中的实施方法,但本发明的保护范围不限于此,所有熟悉该技术的人员在本发明所披露的技术范围以内,可理解想到的替换或者变换,都应该包含在本发明的保护范围之内,所以,本发明的保护范围应以权利要求书的保护范围为准。

Claims (4)

1.一种基于动态多视图图神经网络的城市交通车流量推理方法,其特征在于,包括如下步骤:
S1:收集路网数据,利用交叉口将路网分割成短的路段;将该路网数据分为训练数据和测试数据;
S2:构建亲和图,包括空间亲和图和属性特征亲和图;所述S2具体为:
S2-1:构建空间亲和图
每个空间关联图
Figure FDA0003904277720000011
是基于道路网络在时间片ti上的权重图,其中每个路段是图中的一个节点,边表示路段之间的连接关系,对边ei,j的权重定义如下:
Figure FDA0003904277720000012
其中,lanei表示路段ri上的车道数,liner是一个线性函数,σ是sigmoid激活函数,将权重范围压缩到(0,1);
S2-2:构建属性特征亲和图
考虑了五种类型的道路特征,即道路类型、道路长度、车道数、速度限制以及路段起点/终点进口道数量,还将路段每个时间片上的车流量值作为额外的路段特征;对于没有监控设备的路段,采用空间上临近的k个路段的平均车流量作为车流量特征;然后,使用基于kNN方法从路段属性特征矩阵X中提取最相近的路段,生成属性特征亲和图;
S3:构建图卷积网络基础模型:设计空间卷积模块、属性特征卷积模块、公共卷积模块和多视图融合模块;所述S3中:
将多视图的嵌入按照以下计算方式融合:
H=aS·Hs+aF·Hf+aC·Hc, (11)
注意力权重表示为aS=diag(as),aF=diag(af)和aC=diag(ac)
Figure FDA0003904277720000013
其中,
Figure FDA0003904277720000014
表示可学习的投影层,
Figure FDA0003904277720000015
Figure FDA0003904277720000016
X表示所有路段的属性特征矩阵,f表示特征维度,此外,
Figure FDA0003904277720000017
表示第l层的输出,用d表示所有路段的嵌入维度;
Figure FDA0003904277720000021
其中,
Figure FDA0003904277720000022
是用于嵌入变换的可训练权重矩阵,即通过属性特征卷积操作,可以生成路段的属性特征嵌入
Figure FDA0003904277720000023
根据路段在空间和属性特征维度下的嵌入定义了一个公共嵌入
Figure FDA0003904277720000024
计算公式如下:
Figure FDA0003904277720000025
S4:所述基础模型中引入时间自注意力机制,将对应于不同时间粒度的路段表示纳入时间自注意力机制,再将时间自注意力模块扩展为多头的,在历史时间片上计算多个时间自注意力头,以计算最终的路段表征;所述S4中:
所述时间自注意力模块计算方式定义如下:
Si=(hi+P)WQ((Hi+P)WK)T(i={1,2,...,n}) (12)
其中,
Figure FDA0003904277720000026
表示路段ri在所有相关时间片上的一个嵌入拼接矩阵,
Figure FDA0003904277720000027
表示在Hi上的权重转移矩;将时间先后信息嵌入到位置编码矩阵P中,以区分车流量信息的时间先后顺序,P定义如下:
Figure FDA0003904277720000028
能够建模不同时间粒度车流量变化趋势的节点嵌入计算方式如下:
Figure FDA0003904277720000029
其中,
Figure FDA00039042777200000210
是一个可训练的线性转换矩阵;
将时间自注意力模块扩展为多头的,在历史时间片上计算多个时间自注意力头,以计算最终的路段表征:
Figure FDA00039042777200000211
其中,head代表多头时序自注意力模块中的注意力头的数量,设计一个全连接的网络FC来聚合多个注意力头的表示;
S5:构建所述基础模型中的目标函数,最终得到动态多视图图神经网络模型;所述S5中目标函数为:
Figure FDA0003904277720000031
其中,λ表示正则项的超参数,Θ来表示模型的所有参数,通过联合目标函数,模型框架能够有效地建模车流量的空间和时间动态模式;
Figure FDA0003904277720000032
其中,
Figure FDA0003904277720000033
表示路段ri和rj之间在t时间片上的相似度分数,即
Figure FDA0003904277720000034
Figure FDA0003904277720000035
之间的相似度,σ代表sigmoid函数,
Figure FDA0003904277720000036
表示在随机游走过程中使用vi采样的节点集,Negt(vi)表示在t时间片上节点vi的负边采样集;
Figure FDA0003904277720000037
其中,超参数
Figure FDA0003904277720000038
用来平衡当前、最近、每天和每周的车流量模式的重要性;
Figure FDA0003904277720000039
Figure FDA00039042777200000310
Figure FDA00039042777200000311
Figure FDA00039042777200000312
其中,
Figure FDA00039042777200000313
表示路段ri在时间片t上的真实车流量;假设特征向量相似的路段在车流量信息上也更加相似,则
Figure FDA00039042777200000314
的目的是在时间片为t的嵌入空间中,查询出与目标路段ri最相似的且已安装监控设备的top-k路段
Figure FDA00039042777200000315
从而推断路段ri的车流量;
S6:利用训练数据对所述动态多视图图神经网络模型进行训练,再根据已有的路网数据最终学习的路段特征向量利用所述模型推理车流量;所述S6中,根据最终学习的路段特征向量按照以下计算方式来推理未安装监控设备路段ri在时间片t上的车流量:
Figure FDA0003904277720000041
2.如权利要求1所述的城市交通车流量推理方法,其特征在于,所述S1中:利用交叉口将路网分割成短的路段;每个路段都是有向的,用于连接两个相邻的十字路口,使用R={r1,r2,...,rn}表示路网中路段的集合;对于每个路段ri,将其路段特征表示为
Figure FDA0003904277720000042
以X表示所有路段的特征矩阵。
3.如权利要求1所述的城市交通车流量推理方法,其特征在于,所述S2-2中,首先计算n个路段中的属性特征相似性矩阵
Figure FDA0003904277720000043
使用余弦相似性式计算两个路段之间的相似度分数,这是一种获得两个向量之间相似性的常用方法:
Figure FDA0003904277720000044
其中,xi和xj表示路段ri和路段rj的属性特征向量,然后,为每个路段选择top-k相似路段来构建边,最后得到路网在路段属性维度上的邻接矩阵Af
4.一种动态多视图图神经网络的城市交通车流量推理系统,其执行如权利要求1所述的方法步骤,其特征在于,该系统包括交通数据库模块(100)、空间亲和图构建模块(101)、属性特征亲和图构建模块(102)、空间卷积模块(103)、属性特征卷积模块(104)、公共卷积模块(105)、多视图融合模块(106)、多头时序自注意力模块(107)、联合学习与优化模块(108)和车流量推理模块(109);
所述交通数据库模块(100):用于所述S1分割路段,该数据库包括城市交通的路网结构信息、路段的属性特征信息、以及安装交通监控设备的流量信息;
所述空间亲和图构建模块(101):用于S2中建模交通路网的空间关联信息;
所述属性特征亲和图构建模块(102):用于S2中建模交通路网的属性特征关联信息;
所述空间卷积模块(103):用于所述S3中提取交通路网的空间关联信息;
所述属性特征卷积模块(104):用于所述S3中提取交通路网的属性特征关联信息;
所述公共卷积模块(105):用于所述S3中,城市路网的空间和属性特征并非完全无关,因此,不仅需要提取这两个空间和属性中特定于路段的嵌入信息,还需要提取这两个维度共享的公共信息;
所述多视图融合模块(106):用于所述S3中,将不同视图的嵌入信息借助注意力机制融合;
所述多头时序自注意力模块(107):用于据所述S4中,从不同的时间粒度上建模每个路段的车流量模式;
所述联合学习与优化模块(108):用于据所述S5中,优化联合目标函数,进行多轮调参,获得每一时间片上、每一路段的表征
Figure FDA0003904277720000051
所述车流量推理模块(109):用于所述S6中对没有安装监控设备的路段进行车流量推理。
CN202210849898.4A 2022-07-20 2022-07-20 基于动态多视图图神经网络的城市交通车流量推理方法 Active CN114925836B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210849898.4A CN114925836B (zh) 2022-07-20 2022-07-20 基于动态多视图图神经网络的城市交通车流量推理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210849898.4A CN114925836B (zh) 2022-07-20 2022-07-20 基于动态多视图图神经网络的城市交通车流量推理方法

Publications (2)

Publication Number Publication Date
CN114925836A CN114925836A (zh) 2022-08-19
CN114925836B true CN114925836B (zh) 2022-11-29

Family

ID=82815973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210849898.4A Active CN114925836B (zh) 2022-07-20 2022-07-20 基于动态多视图图神经网络的城市交通车流量推理方法

Country Status (1)

Country Link
CN (1) CN114925836B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116994427A (zh) * 2023-07-04 2023-11-03 重庆邮电大学 一种基于大数据的道路路况预测方法
CN116631195B (zh) * 2023-07-20 2023-10-13 江西师范大学 一种基于城市子区域热点路口挖掘的区域异常检测方法
CN117409381B (zh) * 2023-12-14 2024-03-08 杭州像素元科技有限公司 基于场景图像分割的高速公路收费站拥堵检测模型及方法
CN117541026B (zh) * 2024-01-08 2024-03-19 保定市宏远顺达物流运输有限公司 一种智能物流运输车辆调度方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111161535A (zh) * 2019-12-23 2020-05-15 山东大学 基于注意力机制的图神经网络交通流量预测方法及系统
CN112767682A (zh) * 2020-12-18 2021-05-07 南京航空航天大学 一种基于图卷积神经网络的多尺度交通流量预测方法
US11238729B1 (en) * 2020-09-11 2022-02-01 Toyota Motor Engineering & Manufacturing North America, Inc. Systems and methods for traffic flow prediction
CN114299723A (zh) * 2022-02-15 2022-04-08 北京科技大学 一种交通流量预测方法
CN114495492A (zh) * 2021-12-31 2022-05-13 中国科学院软件研究所 一种基于图神经网络的交通流预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450568B (zh) * 2021-06-30 2022-07-19 兰州理工大学 一种基于时空注意力机制的卷积网络交通流预测模型
CN113971496A (zh) * 2021-11-03 2022-01-25 北京航空航天大学 活动影响下的城市交通路网状态演化趋势预测方法及系统
CN114120652A (zh) * 2021-12-21 2022-03-01 重庆邮电大学 一种基于动态图神经网络的交通流量预测方法
CN114299728B (zh) * 2021-12-29 2023-04-21 杭州电子科技大学 结合注意力机制与动态时空卷积模型的车辆流量预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111161535A (zh) * 2019-12-23 2020-05-15 山东大学 基于注意力机制的图神经网络交通流量预测方法及系统
US11238729B1 (en) * 2020-09-11 2022-02-01 Toyota Motor Engineering & Manufacturing North America, Inc. Systems and methods for traffic flow prediction
CN112767682A (zh) * 2020-12-18 2021-05-07 南京航空航天大学 一种基于图卷积神经网络的多尺度交通流量预测方法
CN114495492A (zh) * 2021-12-31 2022-05-13 中国科学院软件研究所 一种基于图神经网络的交通流预测方法
CN114299723A (zh) * 2022-02-15 2022-04-08 北京科技大学 一种交通流量预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于城市交通监控大数据的工作位置推理方法;陈凯 等;《计算机应用》;20210131;全文 *
基于城市交通监控大数据的行程时间估计;李文明 等;《大数据》;20210228;全文 *

Also Published As

Publication number Publication date
CN114925836A (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN114925836B (zh) 基于动态多视图图神经网络的城市交通车流量推理方法
CN110889546B (zh) 一种基于注意力机制的交通流量模型训练方法
CN109754605B (zh) 一种基于注意力时态图卷积网络的交通预测方法
CN111400620B (zh) 基于时空嵌入Self-Attention的用户轨迹位置预测方法
CN111832814A (zh) 一种基于图注意力机制的空气污染物浓度预测方法
CN111612243B (zh) 交通速度预测方法、系统及存储介质
Yan et al. Spatial-temporal chebyshev graph neural network for traffic flow prediction in iot-based its
CN114299723B (zh) 一种交通流量预测方法
Jin et al. A GAN-based short-term link traffic prediction approach for urban road networks under a parallel learning framework
CN114287023B (zh) 用于交通预测的多传感器学习系统
CN113762338B (zh) 一种基于多重图注意力机制的交通流预测方法、设备及介质
CN114863699B (zh) 一种基于数字孪生的城市车路协同交通流预测方法
CN114495500B (zh) 一种基于对偶动态时空图卷积的交通预测方法
CN113538910A (zh) 一种自适应的全链条城市区域网络信号控制优化方法
CN115510174A (zh) 一种基于路网像素化的Wasserstein生成对抗流量数据插补方法
Huang et al. Learning multiaspect traffic couplings by multirelational graph attention networks for traffic prediction
CN116853272A (zh) 一种融合复杂网络和图Transformer的自动驾驶车辆行为预测方法及系统
CN115376317B (zh) 一种基于动态图卷积和时序卷积网络的交通流预测方法
Xu et al. AGNP: Network-wide short-term probabilistic traffic speed prediction and imputation
CN114202120A (zh) 一种针对多源异构数据的城市交通行程时间预测方法
CN113159403A (zh) 路口行人轨迹预测的方法及装置
CN116307152A (zh) 时空交互式动态图注意力网络的交通预测方法
Zhang et al. Off-deployment traffic estimation—a traffic generative adversarial networks approach
CN116486611A (zh) 一种城市道路车辆速度预测方法
He et al. Dyna-PTM: OD-enhanced GCN for metro passenger flow prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant