CN112216101B - 一种基于弹性学习框架的交通预测方法及系统 - Google Patents

一种基于弹性学习框架的交通预测方法及系统 Download PDF

Info

Publication number
CN112216101B
CN112216101B CN202010932785.1A CN202010932785A CN112216101B CN 112216101 B CN112216101 B CN 112216101B CN 202010932785 A CN202010932785 A CN 202010932785A CN 112216101 B CN112216101 B CN 112216101B
Authority
CN
China
Prior art keywords
traffic
sequence
data
time
elastic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010932785.1A
Other languages
English (en)
Other versions
CN112216101A (zh
Inventor
刘宏飞
许淼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202010932785.1A priority Critical patent/CN112216101B/zh
Publication of CN112216101A publication Critical patent/CN112216101A/zh
Application granted granted Critical
Publication of CN112216101B publication Critical patent/CN112216101B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于弹性学习框架的交通预测方法及系统,属于智能交通领域。方法包括:获取交通流数据、道路交通事件数据、路网数据等交通数据,构建多源异构的交通数据底盘,并根据路段连接关系建立路网图;利用深度学习算法分别搭建时空注意力子模型、时空卷积子模型、交通事件子模型,构建弹性学习框架;利用线下历史数据训练预测模型,获取模型最优参数;将交通数据底盘中的线上实时数据输入优化后的弹性学习框架,实现考虑道路交通事件的交通预测。本发明提供系统实现了上述方法。本发明技术方案考虑道路交通事件对路网交通的影响,构建弹性学习框架实现更精准的交通预测。

Description

一种基于弹性学习框架的交通预测方法及系统
技术领域
本发明属于智能交通技术领域,具体涉及一种考虑道路交通事件的弹性学习框架交通预测方法及系统。
背景技术
交通预测(Traffic Flow Forecasting)在工程中具体通过预测交通流参数实现,基于预测所获得的数据了解和发展最佳交通网络,以实现交通高效流动和最小交通拥堵等问题的解决,交通流参数包括行程时间、速度、流量等具体数据,交通预测的不确定性来自于交通和道路状况的复杂性和高动态性,以及各种其他不可预测的、特殊的因素。道路交通事件,包括车道限制、道路建设和交通事故碰撞等,是重要的因素之一,往往会在有限的时间内对道路通行能力产生巨大的影响。
现有技术的交通预测方法,以机器学习算法获得预测模型,通过预测模型对多源的交通数据融合后进行交通流参数预测,如利用卷积神经网络(CNN)捕获交通流与交通数据之间的空间依赖性,利用循环神经网络(RNN)获取交通流与交通数据的时间相关性,以及基于经典模型的变体结构或聚合结构进行时空预测。目前交通预测方法中的预测模型至少存在以下挑战。一方面,考虑到交通路网的复杂化,CNN无法有效地捕获路网的空间拓扑关系;另一方面,在建模和预测交通状态时,不能考虑外部因素的影响,使得预测模型在正常情况下表现良好,但在出现道路交通事件等极端情况下性能很差。
基于上述问题,一些交通预测方案中尝试对路网拓扑结构建模,并考虑道路交通事件等外部因素的影响,进而提高交通预测精度、保障道路通行能力。然而,在大数据的基础上,计算量的增加会造成预测模型的执行效率降低。针对此问题,考虑从预测模型改进的角度进行的研究较难获得突破,现有研究方向多为通过硬件设施的升级来增加算力、提高执行速度进而提高预测模型的运行效率。
发明内容
针对上述技术问题,本发明目的旨在提供一种交通预测方法及系统,通过在模型预测过程中,捕捉时序数据序列的权重,弹性控制数据的输入,实现预测模型的弹性学习,既在面对复杂路网和外部因素时,可以获得较高的交通预测精度,又有利于预测模型预测时执行效率的提高。
本发明的第一个方面提供了一种基于弹性学习框架的交通预测方法,其包括如下步骤:
建立多源异构的交通数据底盘,以便动态地提供路网对象的时空信号序列;所述时空信号序列包含携带交通事件信息的交通事件序列;
建立并训练弹性学习框架,以便训练后使用所述时空信号序列获得预测序列时动态地为其分配计算资源;所述弹性学习框架包括只处理所述交通事件序列的交通事件子模型,以便在使用所述弹性学习框架预测时,仅在交通事件序列不为空的情况下为所述交通事件子模型分配计算资源。
在上述技术方案的一个改进中,交通预测方法具体包括如下步骤:
步骤100,建立交通数据底盘,所述交通数据底盘用于从多数据源获取路网对象的交通信息数据,并输出指定路网对象的有向加权路网图以及与指定交通预测问题相关的且建立于所述有向加权路网图的时空信号序列;
所述交通信息数据,包括:路网数据、交通流数据和交通事件数据;
所述时空信号序列,包括:由线下交通流数据及线下交通事件数据产生的第一时空信号序列,和,由线上交通流数据及线上交通事件数据产生的第二时空信号序列;一所述时空信号序列包含同一时间片的一交通流序列和一交通事件序列;
步骤200,通过所述交通数据底盘获得基于一路网对象和一交通预测问题的多个第一时空信号序列,从所述多个第一时空信号序列中划分出一训练集和一验证集;
步骤300,构建弹性学习框架,使用所述训练集和所述验证集训练所述弹性学习框架获得所述交通预测问题的预测序列;
所述弹性学习框架,包括:
时空注意力子模型,用于接收交通流序列并输出携带其时间关联信息的第一信号序列;
时空卷积子模型,用于接收所述第一信号序列,使用包含扩散卷积网络的Seq2Seq模型计算并输出第二信号序列;
交通事件子模型,用于接收交通事件序列,并将其自编码为外部特征序列;所述外部特征序列,用于与所述第二信号序列融合生成第三信号序列;
以及,
全连接层,用于接收所述第二信号序列或者所述第三信号序列,并融合输出为预测序列;
步骤400,从所述交通数据底盘获取基于所述路网对象和所述交通预测问题的第二时空信号序列,并输入训练好的弹性学习框架以获得预测序列;仅在第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架的交通事件子模型分配计算资源。
在该类技术方案的实施例中,获取交通流数据、道路交通事件数据、路网数据,对数据进行预处理,构建多源异构的交通数据底盘,并根据路段连接关系建立路网图;利用深度学习算法分别搭建时空注意力子模型、时空卷积子模型、交通事件子模型,构建弹性学习框架。弹性学习框架的构建思路在于:利用注意力机制算法搭建时空注意力子模型,捕捉交通流数据在空间和时间维度上的动态关联性,有选择地关注输入序列中有用的部分,实现在时间和空间上不同路段权重的弹性学习;利用扩散图卷积网络,将空间依赖关系建模为有向图上的扩散过程,利用一种循环神经网络来建模时间依赖关系,然后用扩散卷积代替循环神经网络单元中的矩阵乘法,实现时空模型融合,搭建时空卷积子模型;考虑道路交通事件对交通预测的影响,提取交通事件上下文信息构建外部因素特征值,进而对序列事件建模,搭建交通事件子模型。当路网中有交通事件发生时,将道路交通事件作为路网正常运行状态的一种刺激信号,触发交通事件子模型捕获交通事件信息,实现交通预测的弹性控制;采用Seq2Seq(Sequence to Sequence)结构进行多步交通预测,结合三个子模型建立弹性学习框架,编码器(Encoder)和解码器(Decoder)均采用时空卷积子模型,最后通过全连接层将子模块的输出融合。对数据底盘中的历史数据进行数据集划分,对数据集采用一种计划抽样的方法,线下训练弹性学习框架中的预测模型,获取预测模型的最优参数。将交通数据底盘中的线上实时数据输入优化后的弹性学习框架,实现考虑道路交通事件的交通预测。
在该类技术方案中一些实施例中,交通数据底盘将处理后的交通事件数据,作为弹性学习框架的交通事件子模型的输入时,分为两部分:已获取的历史数据,用于线下模型训练;地图软件用户上传或网络爬虫算法采集的实时数据,用于线上实时预测。
上述技术方案进一步的一个改进在于,所述有向加权路网图表示为G=(V,E,A),其中,V为路网对象全部N个节点的集合,E为路网对象全部边的集合,加权邻接矩阵
Figure BDA0002670838020000041
权值ai,j由依赖节点i与节点j间距离并设有节点间距离阈值的径向基函数定义。
上述技术方案进一步的另一个改进在于,所述交通流序列的获取方法包括步骤:
步骤111,选取一时间片,所述时间片中包含满足一分布的若干时刻;
步骤112,对所述时间片中任一时刻t,从数据源中提取该时刻所述路网对象的一交通流数据Xt,所述时间片的全部交通流数据构成一序列;
步骤113,使用时序分解算法将该序列中任一时刻t的交通流数据Xt分解为包含趋势项Tt、周期项St和余项Xt的形式,并以该形式输出所述交通流序列。11.根据权利要求2所述的交通预测方法,其特征在于,所述交通事件序列获取方法包括步骤:
步骤121,选择交通事件数据中上下文信息中n个特征属性,建立一交通事件数据在所述有向加权路网图N个节点上t时刻的外部因素特征矩阵
Figure BDA0002670838020000042
Figure BDA0002670838020000043
其中,对所述特征属性中持续时间特征进行min-max归一化,处理为[0,1]区间内的数值;对所述特征属性中其他特征进行one-hot编码;
步骤122,以所述交通事件数据对应所述有向加权路网图的节点为事件路段节点的,建立所述事件路段节点在t时刻与其他节点的节点距离矩阵
Figure BDA0002670838020000044
Figure BDA0002670838020000045
步骤123,融合一交通事件数据在t时刻的所述外部因素特征矩阵和所述节点距离矩阵为一矩阵
Figure BDA0002670838020000046
对于一个选定的时间片,如果该时间片结束于t时刻,则输出包含
Figure BDA0002670838020000047
的序列为该时间片的交通事件序列。
上述技术方案进一步的另一个改进在于,步骤200中,通过时间滑窗法从所述多个第一时空信号序列中划分出一训练集和一验证集,其中,所述多个第一时空信号序列中任一第一时空信号序列的时间片不与其他第一时空信号序列的时间片重叠。
上述技术方案进一步的另一个改进在于,步骤300中,在对时空卷积子模型训练时,使用计划采样法消除训练时输入的第一时空信号序列与预测时输入的第二时空信号序列的分布差异。
上述技术方案进一步的另一个改进在于,步骤300中,训练所述弹性学习框架时,其采样率εi被控制为按一衰减策略随训练的进度而衰减;所述衰减策略包括线性衰减、指数衰减或反向sigmoid衰减法。
本发明的第二个方面提供了一种基于弹性学习框架的交通预测系统,其包括:数据底盘模块、弹性学习框架模块、训练模块和预测模块;其中,
所述数据底盘模块用于:提供多源异构的交通数据底盘,以便动态地输出路网对象的时空信号序列;
所述时空信号序列包含携带交通事件信息的交通事件序列;
所述弹性学习框架模块用于:存储弹性学习框架的指令和参数;
所述弹性学习框架包括只处理所述交通事件序列的交通事件子模型;
所述训练模块用于:选取数据底盘模块提供的第一时空信号序列,并创建训练集和测试集;使用所述训练集和测试集训练所述弹性学习框架,并更新所述弹性学习框架模块中弹性学习框架的参数;
所述预测模块用于:读取数据底盘模块输出的第二时空信号序列;读取所述弹性学习框架的指令和参数,并为所述弹性学习框架的指令和参数分配计算资源;执行所述弹性学习框架的指令获得预测序列;分配计算资源的方法为:当所述第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架全部指令和参数分配计算资源;当所述第二时空信号序列的交通事件序列为空时,为所述弹性学习框架除所述交通事件子模型外的指令和参数分配计算资源。
上述技术方案进一步的另一个改进在于,所述数据底盘模块包括处理器和用于存储程序指令的存储器,所述程序指令致使所述处理器执行以下步骤:
步骤100,建立交通数据底盘,所述交通数据底盘用于从多数据源获取路网对象的交通信息数据,并输出指定路网对象的有向加权路网图以及与指定交通预测问题相关的且建立于所述有向加权路网图的时空信号序列;其中,
所述交通信息数据,包括:路网数据、交通流数据和交通事件数据;
所述时空信号序列,包括:由线下交通流数据及线下交通事件数据产生的第一时空信号序列,和,由线上交通流数据及线上交通事件数据产生的第二时空信号序列;一所述时空信号序列包含同一时间片的一交通流序列和一交通事件序列;
上述技术方案进一步的另一个改进在于,所述训练模块包括处理器和用于存储程序指令的存储器,所述程序指令致使所述处理器执行以下步骤:
步骤200,通过所述交通数据底盘获得基于一路网对象和一交通预测问题的多个第一时空信号序列,从所述多个第一时空信号序列中划分出一训练集和一验证集;
步骤300,构建弹性学习框架,使用所述训练集和所述验证集训练所述弹性学习框架获得所述交通预测问题的预测序列;其中,
所述弹性学习框架,包括:
时空注意力子模型,用于接收交通流序列并输出携带其时间关联信息的第一信号序列;
时空卷积子模型,用于接收所述第一信号序列,使用包含扩散卷积网络的Seq2Seq模型计算并输出第二信号序列;
交通事件子模型,用于接收交通事件序列,并将其自编码为外部特征序列;所述外部特征序列,用于与所述第二信号序列融合生成第三信号序列;
以及,
全连接层,用于接收所述第二信号序列或者所述第三信号序列,并融合输出为预测序列;
上述技术方案进一步的另一个改进在于,所述训练模块包括处理器和用于存储程序指令的存储器,所述程序指令致使所述处理器执行以下步骤:
步骤400,从所述交通数据底盘获取基于指定路网对象和指定交通预测问题的第二时空信号序列,并输入训练好的弹性学习框架以获得预测序列;仅在第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架的交通事件子模型分配计算资源。
基于本文中各技术方案及其实施例的说明,本发明提供技术方案带来的有益效果包括但不限于:
本发明技术方案提供的方法和系统考虑了路网中道路交通事件的影响,将道路交通事件作为路网正常运行状态的一种刺激信号,获取交通事件上下文信息构建特征值,并搭建交通事件子模型,仅当路网中有交通事件发生时,触发交通事件子模型实现交通预测,从而实现一种可弹性控制的预测;
本发明技术方案构建的用于交通预测的弹性学习框架,包括利用注意力机制捕捉交通流数据在空间和时间维度上的动态关联性,有选择地关注输入序列中有用的部分,实现在时间和空间上不同路段权重的弹性训练学习;
在类Seq2Seq形式的多步预测模型训练过程中,利用计划采样方法消除了解码器的训练输入分布和预测输入分布之间的差异,改善模型预测性能,提高交通预测精度;
为实现弹性计算,本发明新构建了多源异构的交通数据底盘,以便存储历史数据并不断获取实时数据,分别用来实现了线下模型训练和线上实时预测,实现了训练时与预测时数据的弹性使用。
附图说明
图1为本发明一个交通预测方法实施例的流程图;
图2为本发明一个交通预测方法实施例中各步骤之间的数据流示意图;
图3为本发明一个交通预测方法实施例中弹性学习框架的结构示意图;
图4为本发明一个交通预测系统实施例的系统结构示意图;
图5为本发明另一个交通预测系统实施例的系统结构示意图;
图6为本发明一个实施例中包含多个路网对象的区域路网示意图;
图7为本发明一个实施例中路段行程时间数据STL分解结果示意图;
图8为本发明一个实施例中弹性学习框架的结构示意图;
图9为本发明一个实施例中路段行程时间问题的预测序列示意图。
具体实施方式
下面将结合本发明实施例的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本文中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本文中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分不到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本发明实施例方案的目的.
本发明提供技术方案的构思在于,考虑道路交通事件信息,通过深度学习算法构建弹性学习框架,以实现更精确的并具备一定计算弹性的交通预测技术方案。在本发明提供的多个交通预测方法的实施例中,涉及术语弹性学习框架,本文中该术语是一种通过描述深度学习网络结构表述深度学习过程的计算机分析方法,根据对深度学习网络结构的详细描述,本领域技术人员可以毫无疑义的直接实现该计算机分析方法,即选择计算机硬件平台、创建相应的程序指令、分配计算资源和存储资源并运行程序指令致使使用者在计算机硬件平台上获得预期结果数据。
本发明的各个交通预测方法的实施例均基于如下技术方案:
建立多源异构的交通数据底盘,以便动态地提供路网对象的时空信号序列;所述时空信号序列包含携带交通事件信息的交通事件序列;
建立并训练弹性学习框架,以便训练后使用所述时空信号序列获得预测序列时动态地为其分配计算资源;所述弹性学习框架包括只处理所述交通事件序列的交通事件子模型,以便在使用所述弹性学习框架预测时,仅在交通事件序列不为空的情况下为所述交通事件子模型分配计算资源。
可以理解的是,交通数据底盘是一种结构化描述的数据处理方法,可以基于集中或者分布式的、虚拟硬件或者真实硬件的数据应用服务器实现,当数据应用服务器与多个数据源通信连接并读取同一路网对象的交通信息数据,即视为是实现了交通数据底盘的多源。当数据应用服务器的一些存储器以两种以上的数据结构存储上述同一路网对象的交通信息数据,同时,另一些存储器存储数据预处理单元的指令和路网构建单元的指令,数据预处理单元的指令致使数据应用服务器的处理器对获取的路网交通信息数据进行预处理以动态提供路网对象的时空信号序列,路网构建单元的指令致使数据应用服务器的处理器建立并输出路网对象的有向加权路网图,即视为是实现了交通数据底盘的异构。
可以理解的是,一个交通预测问题是针对一个具体路网对象的一些特定时间数据的预测,本发明各个实施例中均以一个路网对象的一个交通预测问题为例予以说明,但本发明技术方案也可以仅针对多个路网对象的多个交通预测问题,对于选定的路网对象和交通预测问题,本领域技术人员可以根据现有技术以各示范为例的构建具体的弹性学习框架予以实施。
如图1、2、3所示的,作为各实施例的基础示范,在本文交通预测方法的第一实施例中,包括以下步骤100至400:
步骤100,建立交通数据底盘,所述交通数据底盘用于从多数据源获取路网对象的交通信息数据,并输出指定路网对象的有向加权路网图以及与指定交通预测问题相关的且建立于所述有向加权路网图的时空信号序列。
所述交通信息数据,包括:路网数据、交通流数据和交通事件数据。
所述时空信号序列,包括:由线下交通流数据及线下交通事件数据产生的第一时空信号序列,和,由线上交通流数据及线上交通事件数据产生的第二时空信号序列;一所述时空信号序列包含同一时间片的一交通流序列和一交通事件序列。
示范的,本实施例中步骤100通过数据底盘模块实现,数据底盘模块是运行于数据应用服务器的指令,数据应用服务器与多个提供数据源的数据读取接口通信连接,数据源包括地图导航系统中的用户数据、网络爬虫系统中的采集数据、现有数据库提供的历史记录。这些数据源至少提供两类数据,第一类是线下记录的历史数据,如线下交通流数据及线下交通事件数据,这类数据可以通过建立大容量数据镜像的方式在数据应用服务器的存储器上永久保存,或者压缩传输;第二类是在线上即使获取的实时数据,如线上交通流数据及线上交通事件数据,这类数据一般通过数据源即时的传递给数据应用服务器,这类数据由于考虑实时性,一般不经过压缩传输,可以是通过一个预测请求携带并发送给交通预测系统,交通预测系统作为响应的返回预测序列,也可以是仅仅为数据本身经过一个请求设备的预处理,集中的发送给交通预测系统。各数据源提供数据的数据结构是异构的,并且可以包含多个路网对象,这些异构数据经过一个数据预处理单元处理为基于指定路网对象的时空信号序列,同时,通过路网构建单元获得该路网对象的有向加权路网图,因此交通数据底盘作为程序模块,其输入输出的数据均是异构的。
可以理解的是,对于一个用于预测的时空信号序列,其对应一个连续的时间片,为便于计算机分析,离散的选取满足一定分布特征的选取该时间片的若干时刻,对时空信号序列实现连续时间片的数值化,这个分布特征可以是均匀或者不均匀的,如对于第t-τ时刻至第t时刻的一个时间片,选取一个分布的,可以选定第t-τ、t-τ+1、t-τ+2、……、t-1、t等t-τ+1个中间时刻。该时间片的交通流序列是对于选定的一个或者若干特征在该时间片上连续时刻点的以离散化、数值化的方式的体现。时空信号序列中的交通事件序列是该时间片中交通事件的若干特征属性的局部性的体现,因此,在该时间片上一个或者多个时刻,可以存在或者不存在交通事件序列,对于t时刻如果不存在交通事件序列,在本文中表述为交通事件序列在该时刻为空,反之,则为交通事件序列在该时刻不为空。
示范的,本实施例中,有向加权路网图表示为G=(V,E,A),其中,V为路网对象全部N个节点的集合,E为路网对象全部边的集合,加权邻接矩阵
Figure BDA0002670838020000101
Figure BDA0002670838020000102
本实施例中,路网对象的一个节点即为一个路段,路网对象的一个边表示了路段之间的直接联通关系,是有向的,加权邻接矩阵的中的权重作为路段之间相关性的强弱的数值化表示。本实施例中,加权邻接矩阵中的权重为考虑路段行驶方向下对同向路段距离的相关性表示。在一些其他实施例中,考虑具体交通预测问题,可以修改有向加权路网图的节点和边的定义,以及加权邻接矩阵的提取方式以便所述有向加权路网图携带不同的路段相邻关系信息或者路段连接关系信息。
可以理解的是,路网数据实际上携带了包括关注路网对象的静态信息,由路网数据可以提取一关注路网对象的有向加权路网图,该有向加权路网图包含空间特征对一个弹性学习框架的训练是有影响的,对于携带不同有向加权路网图的训练请求,产生的弹性学习框架的参数变量会不同。交通流数据和交通事件数据是基于具体一个或者多个路网的时序信息,在基于一个有向加权路网图的提取为时空信号序列后,时空信号序列实际包含了预测所需要的时间特征和空间特征。有向加权路网图可以是实时提取的,也可以是预提取的。
步骤200,通过所述交通数据底盘获得基于一路网对象和一交通预测问题的多个第一时空信号序列,从所述多个第一时空信号序列中划分出一训练集和一验证集。优选的,本实施例中,所述训练集和所述验证集包含多个不重叠时间片的第一时空信号序列。
可以理解的是,第一时空信号序列均为历史数据所生成的时空信号序列,对于一次完整的训练,训练集和验证集中各个第一时空信号序列的时间片长度是固定的,训练完毕后,利用训练出的弹性学习框架进行预测的一个第二时空信号序列的时间片长度也应当与训练时第一时空信号序列的时间片长度一致。本实施例中弹性学习框架采用有监督学习方式设计和训练。
步骤300,构建弹性学习框架,使用所述训练集和所述验证集训练所述弹性学习框架获得所述交通预测问题的预测序列。
具体的,本实施例的弹性学习框架使用深度学习网络的结构描述时,其包括:时空注意力子模型、时空卷积子模型、交通事件子模型和全连接层。
示范的,本实施例关注路段节点对交通预测问题的重要度影响,因此时空注意力子模型首先为时间注意力网络,用于接收交通流序列并输出携带其受到注意力关注的时间关联信息的第一信号序列。
示范的,本实施例考虑时空卷积子模型,用于接收所述第一信号序列,使用包含扩散卷积网络的Seq2Seq模型计算并输出第二信号序列。根据交通流数据和有向加权图输出交通流数据在空间和时间维度上与有向加权图中不同路段的动态关联性。可以理解的是,本实施例的全连接层和时空卷积子模型共同构成现有的Seq2Seq模型的范式,本实施例的全连接层是现有的Seq2Seq模型的范式中输出前的步骤,本实施例的Seq2Seq结构与现有技术的Seq2Seq结构区别在于,在Seq2Seq结构全连接输出前,根据第一时空信号序列中的交通事件序列是否为空,选择将其中的解码器末端各隐蔽层的输出向量,即第二信号序列的各项,是否分别与本次迭代的外部特征序列融合,即选择使用第二信号序列全连接输出还是第三信号序列全连接输出。
示范的,本实施例中交通事件子模型,用于接收交通事件序列,并将其自编码为外部特征序列;所述外部特征序列,用于与所述第二信号序列融合生成第三信号序列。本实施例中外部特征序列对于t时刻的交通事件序列所生成的外部特征序列利用广播机制与第二信号序列中的各个信号矩阵分别进行融合,融合后的各个信号矩阵即为第三信号序列中的各个信号矩阵。可以理解的是,本发明的交通事件子模型是关注当前时刻的,存在事件后就会被编码,与时空卷积子模型的输出层的输出进行concatenate,由于时空卷积子模型的输出层节点有T个,所以利用广播机制,相当于做个T维的复制,随后每个时间点进行全连接(FC),得到结果。
示范的,本实施例中全连接层用于接收所述第二信号序列或者所述第三信号序列,并融合输出为预测序列。本实施例中,弹性学习框架目的在于根据获得的第t-τ时刻至第t时刻时间片的时空信号序列获得第t+1时刻至第t+T时刻时间片的预测序列,因此,在建立全连接层时其输出层节点为T个,一次输出预测序列中的T个预测量。
步骤400,从所述交通数据底盘获取基于所述路网对象和所述交通预测问题的第二时空信号序列,并输入训练好的弹性学习框架以获得预测序列;仅在第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架的交通事件子模型分配计算资源。
可以理解的是,上述各实施步骤实质是根据路网对象的数据源所提供的交通数据获得该交通对象的预测序列的一种交通预测方法,预测序列可以为某路段的未来交通流或者其他含义的数值。该方法的实施分为三个阶段:构建阶段、训练阶段和预测阶段。其中,构建阶段包括非特异性构建,如步骤100中构建的交通数据底盘,这种交通数据底盘一般是通用性的,即交通数据底盘可操作的数据包含与多个路网对象相关的数据,当运行交通数据底盘的设备响应一个携带具体路段和时间片信息的请求时,将返回该路网对象在该时间片的时空信号序列以及时空信号序列所对应的该路网对象的有向加权路网图。构建阶段还包括特异性构建,如步骤300中,对于具体的交通预测问题,需要构建针对该问题的弹性学习框架,确定内部神经网络节点的分布结构和节点响应规则,这种特异性构建,可以是根据预设数据自动化实施的也可以是多次动态调整的,构建结果将产生适用于具体的交通预测问题的弹性学习框架。在训练阶段,可以请求运行交通数据底盘的设备提供指定路网对象的若干时间片的时空信号序列以便建立训练集和验证集,在一训练模块上配置训练策略对弹性学习框架进行训练,以得到参数优化后的弹性学习框架。如步骤400的,在预测阶段,通过运行交通数据底盘的设备获得指定同一路网对象的一时间片的时空信号序列,交由参数优化后的弹性学习框架预测获得结果,为实现弹性学习框架的计算资源的弹性配置,在一预测模块上配置资源分配策略为判断第二时空信号序列中交通事件序列是否为空,仅在第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架的交通事件子模型分配计算资源。
示范的,在交通预测方法的第二实施例中,包括了一种适用于本交通预测方法的有向加权路网图及其获取方法,该有向加权路网图适用于交通预测问题涉及路段距离的影响的场景。本实施例在考虑路段间距离因素时,有向加权路网图的一个具体表示为G=(V,E,A),其中,V为路网对象的路网中N个节点的集合,E为边集合,A为表示V中节点之间的关联强度加权邻接矩阵。
加权邻接矩阵
Figure BDA0002670838020000131
使用阈值高斯核定义V中各节点之间的关联强度ai,j如下:
Figure BDA0002670838020000132
其中,di,j表示节点i和节点j的距离,σ是距离的标准差,κ是阈值,通过di,j计算的ai,j表示节点i与节点j之间的关联强度,用于约束所述的时空注意力子模型中空间注意力机制的表达过程,以便其捕捉交通流数据在空间和时间维度上的动态关联性,有选择地关注输入序列中有用的部分,实现在时间和空间上不同路段权重的弹性学习。借由上述阈值高斯核的示范,在其他实施例中权重ai,j也可以由依赖节点i与节点j间距离并设有节点间距离阈值的径向基函数定义。
示范的,在交通预测方法的第三实施例中,提供了一种适用于本交通预测方法中交通流序列的获取方法,其包括步骤111至113:
步骤111,选取一时间片,所述时间片中包含满足一分布的若干时刻;在本实施例中选取分布为固定间隔的分布,即固定一个时间间隔的时刻分布,在另一些实施例中,可以采用不同的抽样分布策略,以优化对训练进度。
步骤112,对所述时间片中任一时刻t,从数据源中提取该时刻所述路网对象的一交通流数据Xt,所述时间片的全部交通流数据构成一序列。
步骤113,使用时序分解算法将该序列中任一时刻t的交通流数据Xt分解为包含趋势项Tt、周期项St和余项Xt的形式,并以该形式输出所述交通流序列。
具体的,本实施例中通过一个包含在交通数据底盘的预处理单元,预处理单元包含的指令致使数据应用服务器的处理器完成上述的时序数据分解过程,即以鲁棒局部加权回归作为平滑方法的时间序列分解算法STL(Seasonal-Trend Decomposition ProcedureBased on Loess),将本实施例中所述的交通流数据分解为趋势项、周期项和余项,进行可视化分析数据的动态变化。
示范的,在交通预测方法的第四实施例中,包括了一种适用于本交通预测方法中交通事件序列获取方法,其包括步骤121至123:
步骤121,选择交通事件数据中上下文信息中n个特征属性,建立一交通事件数据在所述有向加权路网图N个节点上t时刻的外部因素特征矩阵
Figure BDA0002670838020000141
Figure BDA0002670838020000142
其中,
Figure BDA0002670838020000143
为t时刻k节点的特征属性数值化后的特征向量,对所述特征属性中持续时间特征进行min-max归一化,处理为[0,1]区间内的数值;对所述特征属性中其他特征进行one-hot编码。持续时间特征不限于一个交通事件的具体持续时间,而应视为一类描述时间段特点的特征属性,其具备时间上的延续性。
步骤122,以所述交通事件数据对应所述有向加权路网图的节点为事件路段节点的,建立所述事件路段节点在t时刻与其他节点的节点距离矩阵
Figure BDA0002670838020000144
Figure BDA0002670838020000145
Figure BDA0002670838020000146
为事件路段节点与节点k的节点距离。
步骤123,融合一交通事件数据在t时刻的所述外部因素特征矩阵和所述节点距离矩阵为一矩阵
Figure BDA0002670838020000147
对于一个选定的时间片,如果该时间片结束于t时刻,则输出包含
Figure BDA0002670838020000148
的序列为该时间片的交通事件序列。
可以理解的是,本实施例中,上述方法构思在于考虑当路网中有交通事件发生时,将道路交通事件作为路网正常运行状态的一种刺激信号,触发交通事件子模型捕获交通事件信息,以便实现交通预测的弹性控制。
具体的,本实施例中,考虑道路交通事件对交通预测的影响,提取交通事件上下文信息,其包括事件类型、事件开始时间、结束时间和持续时间4个特征属性,对持续时间特征进行min-max归一化,处理为[0,1]区间内的数值,对其他特征进行one-hot编码,构建模型外部因素特征值为
Figure BDA0002670838020000149
Figure BDA00026708380200001410
其中,无事件发生路段记为空值;计算该交通事件对应路段节点与其他节点在t时刻的欧氏距离
Figure BDA00026708380200001411
事件路段与自身的欧氏距离为0;融合上述数据构建t时刻的交通事件序列
Figure BDA00026708380200001412
Figure BDA0002670838020000151
本实施例中,利用堆栈自编码器SAE(StackedAutoEncoder)搭建交通事件子模型,当一个时间片结束于t时刻时,上述Xsub-t作为该时间片时空信号序列中向弹性学习框架输入时交由交通事件子模型的交通事件序列。
示范的,在交通预测方法的第五实施例中,包括了一种适用于本交通预测方法中用于建立训练集和验证集的第一时空信号的时间片选取方法以及时空注意力子模型搭建方法。
具体的,本实施例中,通过时间滑窗法从所述多个第一时空信号序列中划分出一训练集和一验证集,其中,所述多个第一时空信号序列中任一第一时空信号序列的时间片不与其他第一时空信号序列的时间片重叠。时间滑窗指沿时间方向的取固定时间间隔的对交通流数据进行聚合。聚合后的一交通流序列表示为
Figure BDA0002670838020000152
其中,N为路网节点数,
Figure BDA0002670838020000153
Figure BDA0002670838020000154
τ为间隔为时间滑窗时长的时间序列数。
具体的,本实施例中,利用注意力算法搭建时空注意力子模型,捕捉交通流数据在空间和时间维度上的动态关联性,实现在时间和空间上不同路段权重的弹性学习,因此本实施例的时空注意力子模型的空间注意力由有向加权路网图进行空间关联强度的表达,选用时间注意力Bahdanau Attention机制,其算法如下。
时间注意矩阵:S=Ws·σ((χW1)W2(W3χ)T+bs);
时间i和j的依赖程度:
Figure BDA0002670838020000155
动态调整输入:
χ′=(X′t-τ+1,X′t-τ+2,…,X′t)T=(Xt-τ+1,Xt-τ+2,…,Xt)TS′;
其中,Ws,W1,W2,W3,bs是可学习参数,激活函数采用sigmoid σ,S′为归一化时间注意矩阵。
可以理解的是,上述注意力机制在另一些实施例中也可以选用Luong Attention等其他现有注意力机制,或者对此进行进一步的改进。本领域技术人员有能力借由上述描述配置具体注意力机制以实现本文中的时空注意力子模型。
示范的,在交通预测方法的第六实施例中,包括了一种适用于本交通预测方法中时空卷积子模型的创建方法及其训练方法。
具体的,本实施例中,利用扩散图卷积网络DGCN(Diffusion GraphConvolutional Network),将空间依赖关系建模为有向图上的扩散过程,利用一种循环神经网络——门控循环单元网络GRU(Gated Recurrent Units)来建模时间依赖关系,然后用扩散卷积代替GRU单元中的矩阵乘法,实现时空模型融合。
首先,进行空间依赖性建模,以t时刻为例,一个图信号表示为X′t
扩散卷积过程:
Figure BDA0002670838020000161
其中,*G是扩散图卷积操作,m∈{1,2,…,M},fθ是一个卷积核,
Figure BDA0002670838020000162
是卷积核的参数,
Figure BDA0002670838020000163
Figure BDA0002670838020000164
分别表示扩散过程和反扩散过程的状态转移矩阵,而且,DO=diag(A1)是外对角矩阵,其中,A为上述有向加权路网图的权值矩阵,1为全1向量,DI=diag(AT1);
扩散卷积层:
Figure BDA0002670838020000165
利用一个扩散卷积层将m维特征映射到p维输出,
其中,
Figure BDA0002670838020000166
是输出,p∈{1,2,…,P},{fΘp,m,:,:}是卷积核,其参数张量为
Figure BDA0002670838020000167
激活函数采用ReLU;
然后,进行时间依赖性建模,用扩散卷积代替GRU中的矩阵乘法,从而得到扩散图卷积门控循环单元DCGRU,计算过程为:
重置门:rt=σ(Θr*G[X′t,Ht-1])
更新门:ut=σ(Θu*G[X′t,Ht-1]+bu)
候选隐藏状态:
Figure BDA0002670838020000168
隐藏状态输出:
Figure BDA0002670838020000169
其中,ΘruC是对应卷积核的参数,bu,bc是模型可学习参数,σ是sigmoid激活函数,⊙表示矩阵点乘。
可以理解的是,本实施例中的时空卷积子模型是一种改进的DCGRU结构,对于DCGRU中的GRU部分也可以替换为基础的RNN或者对于大规模数据适用的LSTM等单元网络,用扩散卷积代替单元网络中的矩阵乘法,以形成改进的DCRNN或者改进的DCLSTM等其它结构的改进的扩散卷积网络来实现。这些基于DGCN,利用扩散卷积替换GRU、LSTM或者RNN等单元网络内的矩阵乘法,以形成DCGRN、DCLSTM或者DCRNN,并分别作为Seq2Seq结构中的编码器部分和解码器部分的各个实施例,在本发明提供的交通预测方法公开后,所带来的效果对本领域技术人员是可以预期的。
具体的,在本实施例的步骤300中,在对时空卷积子模型训练时,使用计划采样法消除训练时输入的第一时空信号序列与预测时输入的第二时空信号序列的分布差异。本实施例中的计划采样法,在训练时,采样率εi在训练过程中是变化的,具体步骤包括:
1)设定第i次迭代时,Seq2Seq结构的时空卷积子模型中的解码器以概率εi选择真实值作为输入,以1-εi选择模型输出的预测值作为输入;
2)利用线性比率下降方法进行控制采样率,表达式为:
εi=max(ε,k-ci);
其中,0≤ε<1是输入模型的最小真实值数量,k和c是衰减的偏移量和斜率,取决于预期的收敛速度。
作为示范的,为实现上述各技术方案及技术方案的结合或者等同技术方案,本发明还提供了一种交通预测系统,在该交通预测系统的多个实施例其均包括:数据底盘模块、弹性学习框架模块、训练模块和预测模块;其中,
数据底盘模块、弹性学习框架模块、训练模块和预测模块通过通信总线互相通信连接;
所述数据底盘模块用于:提供多源异构的交通数据底盘,以便动态地输出路网对象的时空信号序列;
所述时空信号序列包含携带交通事件信息的交通事件序列;
所述弹性学习框架模块用于:存储弹性学习框架的指令和参数;
所述弹性学习框架包括只处理所述交通事件序列的交通事件子模型;
所述训练模块用于:选取数据底盘模块提供的第一时空信号序列,并创建训练集和测试集;使用所述训练集和测试集训练所述弹性学习框架,并更新所述弹性学习框架模块中弹性学习框架的参数;
所述预测模块用于:读取数据底盘模块输出的第二时空信号序列;读取所述弹性学习框架的指令和参数,并为所述弹性学习框架的指令和参数分配计算资源;执行所述弹性学习框架的指令获得预测序列;分配计算资源的方法为:当所述第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架全部指令和参数分配计算资源;当所述第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架除所述交通事件子模型外的指令和参数分配计算资源。
可以理解的是,这些实施例中的数据底盘模块、弹性学习框架模块、训练模块和预测模块是具备处理能力的具体数据处理设备,这些设备可以是分布式的、虚拟的或者是具体的计算机硬件,这些计算机硬件被配置为在运行相关的程序指令时完成上述各模块的功能。
基于上述构思,具体的,如图4所示,作为各实施例的基础示范,在本文交通预测系统的第一实施例中,对于一个携带交通预测问题信息的消息,交通预测系统的训练模块接收该消息,并配置数据底盘模块以便其提供时空信息序列适用于该交通预测问题;基于一个配置的,训练模块建立弹性学习框架及其超参数和初始参数,并通过读取的时空信息序列训练该弹性学习框架,并将训练好的弹性学习框架存储在弹性学习框架模块中;在训练结束后,预测模块基于一个内部信号的,读取弹性学习框架,并根据数据底盘模块的时空信息序列分配弹性学习框架的计算资源并输出预测序列作为对交通预测问题的响应。在一些具体的实施例中,当训练模块和/或预测模块在检测到交通事件信息时,即判定为在原时间序列中有激励,训练模块和/或预测模块被配置为采用条件指令来检测原始输入,动态的控制交通事件子模块的触发,以实现对计算资源的节约。
可以理解的是,本实施例的说明仅在于帮助本领域技术人员理解各模块的关键作用,以及为其他实施例提供理解基础,对于具体的创建数据、命令执行和消息传递并不限定于具体的模块,本领域技术人员可以基于本文说明予以其他方式的实施。如图5示出本发明的另一个交通预测系统的实施例。其中没有显式的设置数据底盘模块和弹性学习框架模块,数据底盘模块中构建交通数据底盘的功能由独立的数据底盘构建模块实现,其他功能分担在其他计算设备上,并独立设置弹性学习框架构建模块,将弹性学习框架作为数据整体的传输至训练模块,并随着训练模块的训练结束,将优化后的弹性学习框架整体传输给预测模块由其使用。
示范的,在本文交通预测系统的第二实施例中,数据底盘模块包括处理器和用于存储程序指令的存储器,所述程序指令致使所述处理器执行以下步骤:
步骤100,建立交通数据底盘,所述交通数据底盘用于从多数据源获取路网对象的交通信息数据,并输出指定路网对象的有向加权路网图以及与指定交通预测问题相关的且建立于所述有向加权路网图的时空信号序列;其中,
所述交通信息数据,包括:路网数据、交通流数据和交通事件数据;
所述时空信号序列,包括:由线下交通流数据及线下交通事件数据产生的第一时空信号序列,和,由线上交通流数据及线上交通事件数据产生的第二时空信号序列;一所述时空信号序列包含同一时间片的一交通流序列和一交通事件序列;
示范的,在本文交通预测系统的第三实施例中,训练模块包括处理器和用于存储程序指令的存储器,所述程序指令致使所述处理器执行以下步骤:
步骤200,通过所述交通数据底盘获得基于一路网对象和一交通预测问题的多个第一时空信号序列,从所述多个第一时空信号序列中划分出一训练集和一验证集;
步骤300,构建弹性学习框架,使用所述训练集和所述验证集训练所述弹性学习框架获得所述交通预测问题的预测序列;其中,
所述弹性学习框架,包括:
时空注意力子模型,用于接收交通流序列并输出携带其时空关联信息的第一信号序列;
时空卷积子模型,用于接收所述第一信号序列,使用包含扩散卷积网络的Seq2Seq模型计算并输出第二信号序列;
交通事件子模型,用于接收交通事件序列,并将其自编码为外部特征序列;所述外部特征序列,用于与所述第二信号序列融合生成第三信号序列;
以及,
全连接层,用于接收所述第二信号序列或者所述第三信号序列,并融合输出为预测序列;
示范的,在本文交通预测系统的第四实施例中,训练模块包括处理器和用于存储程序指令的存储器,所述程序指令致使所述处理器执行以下步骤:
步骤400,从所述交通数据底盘获取基于指定路网对象和指定交通预测问题的第二时空信号序列,并输入训练好的弹性学习框架以获得预测序列;仅在第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架的交通事件子模型分配计算资源。
进一步的,本文通过以下的具体实施例结合上述各个相关实施例的,对本申请技术方案进行具体说明。
参照图6至9,为本发明提出的一种考虑道路交通事件的弹性学习框架实现交通预测的具体实施例,借由上述的交通预测方法实施例和交通预测系统实施例实现。
具体的,本实施例中首先构建交通预测系统的硬件平台,包括:与多个作为数据源的外部系统通信连接的数据应用服务器,数据应用服务器中运行数据管理应用进程和动态创建和实现交通数据底盘的进程;与所述数据应用服务器通信连接的交通预测服务器,交通预测服务器运行提供实现训练模块功能的第一进程和实现预测模块功能的第二进程。
具体的,数据应用服务器与提供如图6所示的一区域内路网相关数据的数据源连接,以便获取该区域内多个路网对象的全部或者部分的交通流数据、道路交通事件数据和路网数据。数据底盘构建模块,用于建立多源异构的交通数据底盘,包括数据预处理单元,对获取的路网交通信息数据进行预处理,还包括路网构建单元,用于建立有向加权的路网图。本实施例中,第一进程的指令包括弹性学习框架构建模块,用于搭建时空注意力子模型、时空卷积子模型、交通事件子模型,建立弹性学习框架;第一进程的指令还包括,用于数据集划分,并利用计划采样方法,通过线下历史数据训练交通预测模型,优化各子模型的参数的指令;第二进程的指令包括,用于将线上实时交通信息数据输入到优化后的预测模型,输出交通预测结果。具体实施例指令可以通过集成开发环境Anaconda3实现Python编程,基于TensorFlow后台,利用Keras库搭建弹性学习框架,实现交通预测。
本实施例在步骤100中,基于一个携带指定路网对象和指定交通预测问题的请求,数据应用服务器建立一该请求的交通数据底盘,其中路网对象为包含区域内自北向南的路段ID=’5121406951797818448’的数据段。具体路网数据信息如表1所示。
表1路网数据示例
Figure BDA0002670838020000201
Figure BDA0002670838020000211
本实施例中,路网数据包含路段ID、道路等级、车道数、车道宽度、路段长度、路段坐标串和行车方向;道路交通事件数据包括每一条事件信息包含事件ID、路段ID(与路网数据中相对应)、经纬度、事件描述、事件类型(路段拥堵、道路故障、交通事故、违规行驶或恶劣天气)、事件开始时间和结束时间。表2提供了为2019年12月的一条交通事件数据记录的数据结构示例作为一个道路交通事件的示例。
表2道路交通事件数据示例
Figure BDA0002670838020000212
本实施例的多个数据源提供的交通流数据包括交通流量、速度、占有率和行程时间里的一种或几种特征,本实施例的交通预测问题,选择行程时间进行具体的交通预测,因此交通数据底盘仅提取交通流数据的行程时间字段。
本实施例在步骤100中,获取交通流数据、道路交通事件数据、路网数据,对数据进行预处理,构建多源异构的交通数据底盘,并根据路段连接关系建立路网图,以便根据时间片生成预测序列。具体包括:
本实施例的交通预测问题,既考虑路段行驶方向,又对同向路段距离的影响进行了量化表示,以路网数据中的各路段为节点,采用交通预测方法的第二实施例建立指定路段的有向加权路网图。
本实施例的交通预测问题,数据预处理还包括时序数据分解过程,利用时间序列分解算法STL,将某时刻的交通流数据Xt分解为趋势项Tt、周期项St和余项Rt,公式表达为Xt=Tt+St+Rt,t=1,2,…,利用Python或R等其他编程语言实现算法。示范的,对路段ID=’5121406951797818448’,其12月份的一时间片的行程时间数据进行预处理后,获得如图7所示的分解序列,分解得出数据的趋势性和周期性,并根据余项可以直观获取异常点,其中,observed_X为交通流数据在一个连续多个时间片的可视化展示,trend_T、seasonal_S、resid_R分别为各时间片趋势项Tt、周期项St和余项Rt的序列的可视化展示。在一些其他实施例中周期项可以按周期长短分解成多个,如季度周期、周周期等。
具体的,在步骤200中,由于本实施例交通预测问题为对上述路段的行程时间进行预测,因此第一进程从交通数据底盘获取路网中2019-10-08至2019-12-25内包含行程时间的交通信息数据预处理为第一时空信号序列创建训练集和验证集。
具体的,在步骤300中,利用深度学习算法分别搭建时空注意力子模型、时空卷积子模型、交通事件子模型,构建如图8所示的弹性学习框架。
具体的,本实施例利用注意力算法搭建时空注意力子模型,即使用交通预测方法第四实施例提供方法捕捉交通流数据在空间和时间维度上的动态关联性,实现在时间和空间上不同路段权重的弹性学习。根据第一进程的指令,建立弹性学习框架为基于时刻t的输入时空信号序列为均匀分布的τ项,预测序列为均匀分布的T项的预测模型,其输入形为
Figure BDA0002670838020000221
行程时间数据以5min的窗口大小进行聚合,其中
Figure BDA0002670838020000222
t-τ+1时刻与t-τ+2时刻间隔5min。空间注意力由步骤一中有向加权路网图进行空间关联强度的表达,图8中Sub-1利用交通预测方法的第五实施例的时间注意力Bahdanau Attention算法实现,其输入层节点为τ个。
具体的,本实施例利用交通预测方法第六实施例的方法搭建图8中Sub-2所示的时空卷积子模型,实现时空模型融合,其输入层序列节点为τ个,输出层序列节点为T个,其Seq2Seq结构的编码器和解码器中,循环层layer=2,每层单元数unit=64。
具体的,本实施例利用交通预测方法第四实施例的方法搭建搭建图4中Sub-3所示的交通事件子模型,计算事件路段节点与其他节点在t时刻的欧氏距离
Figure BDA0002670838020000223
融合交通流数据构建子模型输入为
Figure BDA0002670838020000224
Figure BDA0002670838020000225
交通事件子模型中,堆叠自编码器隐藏层hidden layer=3;采用Seq2Seq(Sequence toSequence)结构进行多步交通预测,结合三个子模型建立弹性学习框架,编码器和解码器均采用时空卷积子模型,最后通过全连接层将子模块输出融合,预测未来T步的行程时间,结果表示为
Figure BDA0002670838020000226
Figure BDA0002670838020000231
本实施方式步骤300中,前述步骤对数据底盘中的历史数据进行数据集划分,对数据集采用计划采样的方法,本步骤采用线下训练弹性学习框架中的预测模型,获取预测模型的最优参数。因为在前述步骤中,针对交通预测问题,时间序列数据存在明显的周期和趋势,数据集的划分考虑时间顺序,利用时间滑窗法,在时间轴上获取了行程时间数据集划分成不重叠的训练集和验证集。因此使用交通预测方法的第六实施例提供的训练方法对弹性学习框架训练,考虑模型训练开始时,泛化能力较差,来自于线下交通流数据的真实值的输入对模型的训练有帮助,在训练后期,模型已经足够好并能进行合理的采样,利用其中的计划采样方法,采样率εi在训练过程中是变化的。以1-εi选择模型输出的预测值作为输入;利用线性比率下降方法进行控制采样率,表达式为:
εi=max(ε,k-ci)
其中,0≤ε<1是输入模型的最小真实值数量,k和c是衰减的偏移量和斜率,取决于预期的收敛速度。
本步骤中,对于弹性学习框架的参数优化,选择默认参数为β1=0.9,β2=0.999,
Figure BDA0002670838020000232
的Adam优化器,初始学习率lr=1e-2,从epoch=20时每10个epoch学习率下降1/10,并在验证集中使用早期停止策略,具体优化结果:扩散卷积过程中,最大步长K=3。
步骤四:将交通数据底盘中的线上实时数据输入优化后的弹性学习框架,实现考虑道路交通事件的行程时间多步预测。图9示出了以路网对象路段ID=’5121406951797818448’的行程时间预测问题的预测结果,图9中预测值1为本发明弹性学习框架的多个预测序列拼接的预测结果,为验证本发明的有效性,建立其他现有技术中无交通事件子模块的对比预测模型,预测值2为该对比模型的预测结果,可以看出,预测值1和真实值相近,尤其在突发变化时,触发交通事件子模块可以更精确地捕捉未来行程时间的变化趋势。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于弹性学习框架的交通预测方法,其包括如下步骤:
建立多源异构的交通数据底盘;所述交通数据底盘用于从多数据源获取路网对象的交通信息数据,并输出指定路网对象的有向加权路网图以及与指定交通预测问题相关的且建立于所述有向加权路网图的时空信号序列,以便动态地提供路网对象的时空信号序列;所述时空信号序列包含携带交通事件信息的交通事件序列;
建立并训练弹性学习框架,以便训练后使用所述时空信号序列获得预测序列时动态地为其分配计算资源;所述弹性学习框架包括只处理所述交通事件序列的交通事件子模型,以便在使用所述弹性学习框架预测时,仅在交通事件序列不为空的情况下为所述交通事件子模型分配计算资源;
其中,
训练所述弹性学习框架的方法包含步骤:选取所述交通数据底盘提供的第一时空信号序列,并创建训练集和测试集;使用所述训练集和测试集训练所述弹性学习框架,并更新所述弹性学习框架的参数;
使用所述弹性学习框架预测的方法包含步骤:读取所述交通数据底盘提供的第二时空信号序列;读取所述弹性学习框架的指令和参数,并为所述弹性学习框架的指令和参数分配计算资源;执行所述弹性学习框架的指令获得预测序列;
分配所述计算资源的方法包含步骤:当所述第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架全部指令和参数分配计算资源;当所述第二时空信号序列的交通事件序列为空时,为所述弹性学习框架除所述交通事件子模型外的指令和参数分配计算资源。
2.根据权利要求1所述的交通预测方法,其特征在于,其包括如下步骤:
步骤100,建立交通数据底盘,所述交通数据底盘用于从多数据源获取路网对象的交通信息数据,并输出指定路网对象的有向加权路网图以及与指定交通预测问题相关的且建立于所述有向加权路网图的时空信号序列;
所述交通信息数据,包括:路网数据、交通流数据和交通事件数据;
所述时空信号序列,包括:由线下交通流数据及线下交通事件数据产生的第一时空信号序列,和,由线上交通流数据及线上交通事件数据产生的第二时空信号序列;一所述时空信号序列包含同一时间片的一交通流序列和一交通事件序列;
步骤200,通过所述交通数据底盘获得基于一路网对象和一交通预测问题的多个第一时空信号序列,从所述多个第一时空信号序列中划分出一训练集和一验证集;
步骤300,构建弹性学习框架,使用所述训练集和所述验证集训练所述弹性学习框架获得所述交通预测问题的预测序列;
所述弹性学习框架,包括:
时空注意力子模型,用于接收交通流序列并输出携带其时间关联信息的第一信号序列;
时空卷积子模型,用于接收所述第一信号序列,使用包含扩散卷积网络的Seq2Seq模型计算并输出第二信号序列;
交通事件子模型,用于接收交通事件序列,并将其自编码为外部特征序列;所述外部特征序列,用于与所述第二信号序列融合生成第三信号序列;
以及,
全连接层,用于接收所述第二信号序列或者所述第三信号序列,并融合输出为预测序列;
步骤400,从所述交通数据底盘获取基于所述路网对象和所述交通预测问题的第二时空信号序列,并输入训练好的弹性学习框架以获得预测序列;仅在第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架的交通事件子模型分配计算资源。
3.根据权利要求2所述的交通预测方法,其特征在于:所述有向加权路网图表示为G=(V,E,A),其中,V为路网对象全部N个节点的集合,E为路网对象全部边的集合,加权邻接矩阵
Figure FDA0003123827100000021
权值ai,j由依赖节点i与节点j间距离并设有节点间距离阈值的径向基函数定义。
4.根据权利要求2所述的交通预测方法,其特征在于,所述交通流序列的获取方法包括步骤:
步骤111,选取一时间片,所述时间片中包含满足一分布的若干时刻;
步骤112,对所述时间片中任一时刻t,从数据源中提取该时刻所述路网对象的一交通流数据Xt,所述时间片的全部交通流数据构成一序列;
步骤113,使用时序分解算法将该序列中任一时刻t的交通流数据Xt分解为包含趋势项Tt、周期项St和余项Xt的形式,并以该形式输出所述交通流序列。
5.根据权利要求2所述的交通预测方法,其特征在于,所述交通事件序列获取方法包括步骤:
步骤121,选择交通事件数据中上下文信息中n个特征属性,建立一交通事件数据在所述有向加权路网图N个节点上t时刻的外部因素特征矩阵
Figure FDA0003123827100000031
Figure FDA0003123827100000032
其中,对所述特征属性中持续时间特征进行min-max归一化,处理为[0,1]区间内的数值;对所述特征属性中其他特征进行one-hot编码;
步骤122,以所述交通事件数据对应所述有向加权路网图的节点为事件路段节点的,建立所述事件路段节点在t时刻与其他节点的节点距离矩阵
Figure FDA0003123827100000033
Figure FDA0003123827100000034
步骤123,融合一交通事件数据在t时刻的所述外部因素特征矩阵和所述节点距离矩阵为一矩阵
Figure FDA0003123827100000035
对于一个选定的时间片,如果该时间片结束于t时刻,则输出包含
Figure FDA0003123827100000036
的序列为该时间片的交通事件序列。
6.根据权利要求2所述的交通预测方法,其特征在于,步骤200中,通过时间滑窗法从所述多个第一时空信号序列中划分出一训练集和一验证集,其中,所述多个第一时空信号序列中任一第一时空信号序列的时间片不与其他第一时空信号序列的时间片重叠。
7.根据权利要求2所述的交通预测方法,其特征在于,步骤300中,在对时空卷积子模型训练时,使用计划采样法消除训练时输入的第一时空信号序列与预测时输入的第二时空信号序列的分布差异。
8.根据权利要求2所述的交通预测方法,其特征在于,步骤300中,训练所述弹性学习框架时,其采样率εi被控制为按一衰减策略随训练的进度而衰减;所述衰减策略包括线性衰减、指数衰减或反向sigmoid衰减法。
9.一种交通预测系统,其包括:数据底盘模块、弹性学习框架模块、训练模块和预测模块;其中,
所述数据底盘模块用于:提供多源异构的交通数据底盘,以便动态地输出路网对象的时空信号序列;
所述时空信号序列包含携带交通事件信息的交通事件序列;
所述弹性学习框架模块用于:存储弹性学习框架的指令和参数;
所述弹性学习框架包括只处理所述交通事件序列的交通事件子模型;
所述训练模块用于:选取数据底盘模块提供的第一时空信号序列,并创建训练集和测试集;使用所述训练集和测试集训练所述弹性学习框架,并更新所述弹性学习框架模块中弹性学习框架的参数;
所述预测模块用于:读取数据底盘模块输出的第二时空信号序列;读取所述弹性学习框架的指令和参数,并为所述弹性学习框架的指令和参数分配计算资源;执行所述弹性学习框架的指令获得预测序列;分配计算资源的方法为:当所述第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架全部指令和参数分配计算资源;当所述第二时空信号序列的交通事件序列为空时,为所述弹性学习框架除所述交通事件子模型外的指令和参数分配计算资源。
10.根据权利要求9所述的交通预测系统,其特征在于:
所述数据底盘模块包括处理器和用于存储程序指令的存储器,所述程序指令致使所述处理器执行以下步骤:
步骤100,建立交通数据底盘,所述交通数据底盘用于从多数据源获取路网对象的交通信息数据,并输出指定路网对象的有向加权路网图以及与指定交通预测问题相关的且建立于所述有向加权路网图的时空信号序列;其中,
所述交通信息数据,包括:路网数据、交通流数据和交通事件数据;
所述时空信号序列,包括:由线下交通流数据及线下交通事件数据产生的第一时空信号序列,和,由线上交通流数据及线上交通事件数据产生的第二时空信号序列;一所述时空信号序列包含同一时间片的一交通流序列和一交通事件序列;和/或,
所述训练模块包括处理器和用于存储程序指令的存储器,所述程序指令致使所述处理器执行以下步骤:
步骤200,通过所述交通数据底盘获得基于一路网对象和一交通预测问题的多个第一时空信号序列,从所述多个第一时空信号序列中划分出一训练集和一验证集;
步骤300,构建弹性学习框架,使用所述训练集和所述验证集训练所述弹性学习框架获得所述交通预测问题的预测序列;其中,
所述弹性学习框架,包括:
时空注意力子模型,用于接收交通流序列并输出携带其时间关联信息的第一信号序列;
时空卷积子模型,用于接收所述第一信号序列,使用包含扩散卷积网络的Seq2Seq模型计算并输出第二信号序列;
交通事件子模型,用于接收交通事件序列,并将其自编码为外部特征序列;所述外部特征序列,用于与所述第二信号序列融合生成第三信号序列;
以及,
全连接层,用于接收所述第二信号序列或者所述第三信号序列,并融合输出为预测序列;
和/或,
所述训练模块包括处理器和用于存储程序指令的存储器,所述程序指令致使所述处理器执行以下步骤:
步骤400,从所述交通数据底盘获取基于指定路网对象和指定交通预测问题的第二时空信号序列,并输入训练好的弹性学习框架以获得预测序列;仅在第二时空信号序列的交通事件序列不为空时,为所述弹性学习框架的交通事件子模型分配计算资源。
CN202010932785.1A 2020-09-08 2020-09-08 一种基于弹性学习框架的交通预测方法及系统 Active CN112216101B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010932785.1A CN112216101B (zh) 2020-09-08 2020-09-08 一种基于弹性学习框架的交通预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010932785.1A CN112216101B (zh) 2020-09-08 2020-09-08 一种基于弹性学习框架的交通预测方法及系统

Publications (2)

Publication Number Publication Date
CN112216101A CN112216101A (zh) 2021-01-12
CN112216101B true CN112216101B (zh) 2021-08-24

Family

ID=74049382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010932785.1A Active CN112216101B (zh) 2020-09-08 2020-09-08 一种基于弹性学习框架的交通预测方法及系统

Country Status (1)

Country Link
CN (1) CN112216101B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989539B (zh) * 2021-04-07 2022-08-09 上海交通大学 一种基于交叉路口转移计算的交通预测方法
CN113256985B (zh) * 2021-06-28 2021-09-17 智道网联科技(北京)有限公司 一种交通拥堵预测方法、装置和电子设备
CN113505536A (zh) * 2021-07-09 2021-10-15 兰州理工大学 一种优化的基于时空图卷积网络的交通流预测模型
CN114582128B (zh) * 2022-03-10 2023-08-04 浙江大学 基于图离散注意力网络的交通流预测方法、介质及设备
CN115410368A (zh) * 2022-08-24 2022-11-29 吉林化工学院 基于dgcn的行程时间预测方法
CN117407744B (zh) * 2023-12-13 2024-03-22 卓世科技(海南)有限公司 基于数字孪生的多源数据融合方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111127888A (zh) * 2019-12-23 2020-05-08 广东工业大学 一种基于多源数据融合的城市交通流预测方法
CN111275971A (zh) * 2020-02-18 2020-06-12 山西交通控股集团有限公司 一种高速公路交通流量预测方法
CN111540199A (zh) * 2020-04-21 2020-08-14 浙江省交通规划设计研究院有限公司 一种基于多模态融合和图注意力机制的高速交通流预测方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9037519B2 (en) * 2012-10-18 2015-05-19 Enjoyor Company Limited Urban traffic state detection based on support vector machine and multilayer perceptron
CN109242140A (zh) * 2018-07-24 2019-01-18 浙江工业大学 一种基于LSTM_Attention网络的交通流预测方法
CN108830430A (zh) * 2018-08-01 2018-11-16 苏州大学张家港工业技术研究院 用于交通流量预测的卷积神经网络多点回归预测模型
CN109410575B (zh) * 2018-10-29 2020-05-01 北京航空航天大学 一种基于胶囊网络和嵌套式长短时记忆神经网络的路网状态预测方法
CN109697852B (zh) * 2019-01-23 2021-04-02 吉林大学 基于时序交通事件的城市道路拥堵程度预测方法
CN110570651B (zh) * 2019-07-15 2020-10-30 浙江工业大学 一种基于深度学习的路网交通态势预测方法及系统
CN110909909A (zh) * 2019-09-03 2020-03-24 南京理工大学 基于深度学习和多层时空特征图的短时交通流预测方法
CN110491129A (zh) * 2019-09-24 2019-11-22 重庆城市管理职业学院 基于时空图的发散卷积循环神经网络的交通流预测方法
CN110827546B (zh) * 2019-11-21 2021-02-26 银江股份有限公司 一种信号交叉口路段短期速度预测方法
AU2020101023A4 (en) * 2020-06-16 2020-07-23 Guizhou Minzu University A Novel Deep Learning Approach for Distributed Traffic Flow Forecasting

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111127888A (zh) * 2019-12-23 2020-05-08 广东工业大学 一种基于多源数据融合的城市交通流预测方法
CN111275971A (zh) * 2020-02-18 2020-06-12 山西交通控股集团有限公司 一种高速公路交通流量预测方法
CN111540199A (zh) * 2020-04-21 2020-08-14 浙江省交通规划设计研究院有限公司 一种基于多模态融合和图注意力机制的高速交通流预测方法

Also Published As

Publication number Publication date
CN112216101A (zh) 2021-01-12

Similar Documents

Publication Publication Date Title
CN112216101B (zh) 一种基于弹性学习框架的交通预测方法及系统
Atitallah et al. Leveraging Deep Learning and IoT big data analytics to support the smart cities development: Review and future directions
Fei et al. CPS data streams analytics based on machine learning for Cloud and Fog Computing: A survey
Vlahogianni et al. Temporal evolution of short‐term urban traffic flow: a nonlinear dynamics approach
Chen et al. Multiple local 3D CNNs for region-based prediction in smart cities
Darmoul et al. Multi-agent immune networks to control interrupted flow at signalized intersections
Hussein et al. A bi-directional agent-based pedestrian microscopic model
Zhang et al. A Traffic Prediction Method of Bicycle-sharing based on Long and Short term Memory Network.
Wang et al. Learning performance prediction via convolutional GRU and explainable neural networks in e-learning environments
CN112863180A (zh) 交通速度预测方法、装置、电子设备及计算机可读介质
Rahman et al. Short-term traffic speed prediction for freeways during hurricane evacuation: a deep learning approach
Huang et al. Learning multiaspect traffic couplings by multirelational graph attention networks for traffic prediction
Miletić et al. A review of reinforcement learning applications in adaptive traffic signal control
Fan et al. Deep learning for intelligent traffic sensing and prediction: recent advances and future challenges
US20220237345A1 (en) Computing system for implementing and operating model describing target system, and method of predicting behavior of target system using the same
Li et al. Early validation of cyber–physical space systems via multi-concerns integration
Dai et al. Spatio-temporal deep learning framework for traffic speed forecasting in IoT
Agafonov Short-term traffic data forecasting: a deep learning approach
Xiao et al. Parking prediction in smart cities: A survey
Alghamdi et al. Multi-stage deep probabilistic prediction for travel demand
Hua et al. Freeway traffic speed prediction under the intelligent driving environment: a deep learning approach
Naheliya et al. A Hybrid Deep Learning Method for Short-Term Traffic Flow Forecasting: GSA-LSTM
CN116258253A (zh) 一种基于贝叶斯神经网络的车辆od预测方法
Zhao et al. Enhancing traffic signal control with composite deep intelligence
US11947627B2 (en) Context aware anomaly detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant