CN111598325A - 基于层次聚类和分层注意力机制的交通速度预测方法 - Google Patents

基于层次聚类和分层注意力机制的交通速度预测方法 Download PDF

Info

Publication number
CN111598325A
CN111598325A CN202010393385.8A CN202010393385A CN111598325A CN 111598325 A CN111598325 A CN 111598325A CN 202010393385 A CN202010393385 A CN 202010393385A CN 111598325 A CN111598325 A CN 111598325A
Authority
CN
China
Prior art keywords
traffic speed
road section
data
weight
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010393385.8A
Other languages
English (en)
Inventor
刘端阳
徐鑫博
唐龙峰
范鑫烨
陈雪
沈国江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010393385.8A priority Critical patent/CN111598325A/zh
Publication of CN111598325A publication Critical patent/CN111598325A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/052Detecting movement of traffic to be counted or controlled with provision for determining speed or overspeed

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

基于层次聚类和分层注意力机制的交通速度预测方法,首先采用层次聚类方法将历史交通速度数据进行划分和聚类;然后,设计基于分层注意力机制的神经网络模型,该模型充分考虑了交通速度数据的时空关联性,有效利用分层注意力机制来捕捉时空特征,并对不同路段和不同历史时间段赋予不同的影响权重。最后,选择合适的簇数据来训练和测试神经网络模型,训练好的模型可以预测目标路段未来若干个时间段的平均交通速度。本发明方法采用了层次聚类方法对历史数据进行了划分和聚类,簇内数据具有较高相似度,更适合于神经网络模型的训练;同时,采用了分层注意力机制来设计神经网络模型,有效地捕捉了交通速度数据的时空特性,更好地提高了预测准确性。

Description

基于层次聚类和分层注意力机制的交通速度预测方法
技术领域
本发明涉及智能交通的交通速度预测,可以预测未来若干个时间段的路段平均速度,交通速度预测可以用于路径规划,也可以用于交通控制、交通诱导和交通管理。
背景技术
随着交通环境的日益复杂、道路交通车流量的急剧增加,城市道路交通拥堵问题愈加严重。在智能交通系统(Intelligent Transportation System,ITS)中,交通速度预测具有重要意义,如果能有效地预测未来一段时间内各个路段的交通速度,便可以提前进行有效的交通管控,能大大缓解甚至避免交通拥堵。在智能交通系统中,交通速度是描述交通流的基本参数,交通速度预测是指预测未来一段时间内通过某条路段的平均速度。交通速度预测方法的研究,不仅有利于旅行者进行路径规划,也有利于交通管理者进行交通信号控制、交通诱导和交通管理。
常用的交通速度预测方法主要有自回归差分移动平均模型(AutoregressiveIntegrated Moving Average Model,ARIMA)、卡尔曼滤波、贝叶斯模型(Bayesian)、支持向量机(Support Vector Machine,SVM)等。这些方法虽然易于实现,操作简单,但没有充分利用交通流的周期性和时序性,受数据扰动影响较大。
近些年,深度学习的迅速发展为交通速度预测提供了更多有效的方法。循环神经网络(Recurrent Neural Network,RNN)具有更优的序列数据处理能力,可以对交通速度的时间依赖性进行分析,获得较优的预测精度。卷积神经网络(Convolutional NeuralNetwork,CNN)和RNN综合使用,可以在考虑时序特性的同时,实现利用CNN来提取交通流的空间特性。另外,深度信念网络(Deep Belief Network,DBN)也在短时交通流预测中取得了不错的效果。虽然现有的深度学习方法在算法效率与预测精度上有所提高,但由于没有考虑历史数据对当前时间段的影响,这些基于深度学习的交通速度预测方法仍具有一定的局限性。交通速度预测作为序列预测任务,历史数据中不同时间段的速度对未来时间段的预测具有不同的影响效果,然而各种深度学习模型并未挖掘这种内在的特征,从而在一定程度上影响了预测精度。
目前,现有的交通速度预测方法主要存在以下问题:1)常用的各种预测方法,如ARIMA模型、卡尔曼滤波、贝叶斯模型和支持向量机等,没有充分利用交通流的周期性和时序性,受数据扰动影响较大,预测准确性有限;2)基于深度学习的预测方法,虽然在一定程度上提高了算法效率和预测精度,但忽略了历史数据的影响,影响了预测精度;
发明内容
本发明要克服现有技术的上述不足之处,提供基于层次聚类和分层注意力机制的交通速度预测方法。
本发明方法首先采用层次聚类方法将历史交通速度数据划分为若干个簇;然后,设计基于分层注意力机制的神经网络模型,该模型充分考虑了交通速度数据的时空关联性,分别利用空间注意力机制和时间注意力机制来捕捉空间特征和时间特征。最后,根据当前日期的数据,选择合适的簇数据,生成样本数据集,训练和测试神经网络模型,训练好的模型可以预测目标路段未来若干个时间段的平均交通速度。本发明方法采用了层次聚类方法,以时间为单位对历史数据进行了划分和聚类,簇内数据具有较高相似度,并以此为基础训练神经网络模型,提高了预测精度。同时,本发明方法设计的神经网络模型,采用了分层注意力机制,对上下游各个路段和不同的历史时间段分别赋予了不同的影响权重,有效地捕捉了交通速度数据的时空特性,更好地提高了预测准确性。
本发明是通过以下技术方案来达到上述目的,即基于层次聚类和分层注意力机制的交通速度预测方法,具体的实施步骤如下:
(1)获取目标路段及其上下游路段的历史交通速度数据。根据路段中安装的电警卡口装置,采集并记录过车数据。在过车数据的基础上,根据同一辆车在上下游出现的时间差和路段距离,计算各个时间段的路段平均速度。
(2)数据预处理。由于检测器故障或数据传输失败,采集的数据存在缺失或异常,所以需要进行数据预处理,修正这些异常数据。
(3)对目标路段的历史交通速度数据进行层次聚类。由于天气变化、节假日和突发事故,某一天或某几天的交通速度数据分布会不同于正常情况下的数据分布。如果直接把交通速度数据拆分为训练数据集和测试数据集,模型预测的准确性可能会很低。因此,为了考虑不同交通环境的影响,采用层次聚类方法对预处理数据进行处理,将分布相似的数据进行合并,从而把历史交通速度数据划分成若干个簇,簇内数据具有较高的相似度,聚类后的簇数据更适合模型的训练和测试,有效地提高了模型的预测精度。层次聚类方法的具体过程如下:
s31.按天划分目标路段的历史交通速度数据。将预处理后的交通速度数据按天进行划分,形成若干个初始簇,所述的初始簇就是层次聚类的底层节点;
s32.初始化阈值θ和最大相似度SIM_MAX。阈值θ用于判断算法是否结束,根据经验值设定阈值θ的初值。最大相似度SIM_MAX的初值为相对较大的值,远大于阈值θ。
s33.采用自下而上的聚合策略进行层次聚类。如果当前SIM_MAX大于或等于θ,则采用皮尔森相关系数计算任意两个簇的相似度,并比较这些相似度值,选取相似度最大的两个簇将其合并为一个簇,同时将SIM_MAX的值更新为当前的最大相似度;
s34.重复步骤s33,直至当前SIM_MAX小于阈值θ,最后获得M个簇的交通速度数据,其中M为簇的个数。
(4)设计基于分层注意力机制的神经网络模型。基于分层注意力机制的神经网络模型是以Seq2Seq模型为基础,包括Encoder层、Decoder层和全连接层。在Encoder层,将上下游路段的历史交通速度数据作为输入,利用空间注意力机制来捕捉交通速度数据的空间特征,并通过一个双向LSTM(Long Short-Term Memory:长短期记忆)网络来确定每条上下游路段的影响权重;在Decoder层,将Encoder层的输出和目标路段的历史交通速度数据作为输入,利用时间注意力机制来挖掘交通速度数据的时间特征,并通过另外一个双向LSTM网络来确定过去若干个时间段的影响权重;最后,由全连接层计算得到预测结果。由于注意力机制也称为Attention,所以Encoder层的空间注意力机制也称为空间Attention,Decoder层的时间注意力机制也称为时间Attention。
Encoder层主要用于提取上下游路段对目标路段未来交通速度的影响程度,Encoder层的输入为上下游路段的历史交通速度数据S。
Figure BDA0002486458690000051
其中,
Figure BDA0002486458690000052
i取值范围为[1,n],n表示选取的上下游路段数,l表示时间段的个数,t表示某个时间段,而l与t表示过去的某个时间段,如t-l+1表示t时间段之前的第(l-1)个时间段。S表示所选取的n条上下游路段在过去l个时间段的平均交通速度矩阵,Si表示路段i在过去l个时间段的平均交通速度向量,
Figure BDA0002486458690000053
表示路段i在j时间段的平均交通速度,j取值范围为[t-l+1,t]。
Encoder层中的空间注意力机制的内部状态变化为:
Figure BDA0002486458690000054
Figure BDA0002486458690000055
其中,公式(1)用于计算各个上下游路段在l个时间段的空间权重,
Figure BDA0002486458690000056
表示路段i在t时间段的空间权重,i取值范围为[1,n],t时间段的空间权重向量为
Figure BDA0002486458690000057
m是隐藏层尺寸,
Figure BDA0002486458690000058
是元状态,
Figure BDA0002486458690000061
是隐藏层状态,Si是输入的上下游路段i的历史交通速度数据,
Figure BDA0002486458690000062
是Encoder层中上一次迭代的隐藏层状态、元状态和路段i的交通速度数据的拼接,
Figure BDA0002486458690000063
Figure BDA0002486458690000064
是权重项,
Figure BDA0002486458690000065
Figure BDA0002486458690000066
是偏置项,且
Figure BDA0002486458690000067
tanh(·)函数是双曲正切函数,为激活函数;公式(2)是Softmax函数,即归一化指数函数,用于空间权重的归一化计算,
Figure BDA0002486458690000068
是路段i在t时间段的归一化空间权重,归一化t时间段的空间权重向量为
Figure BDA0002486458690000069
Encoder层在迭代运算的过程中生成l个时间段的空间权重向量,依次为et-l+1,et-l+2,…,et,相应的归一化空间权重向量为αt-l+1t-l+2,…,αt,运算过程总共迭代l次,第一次生成et-l+1和αt-l+1,第二次生成et-l+2和αt-l+2,以此类推,第l次生成et和αt。随后,根据t时间段的空间权重向量,输入的历史交通速度数据被加权转换为:
Figure BDA00024864586900000610
因此,向量
Figure BDA00024864586900000611
包含了各个上下游路段的空间特征信息,类似地计算出其它时间段加权转换后的历史交通速度数据,即
Figure BDA00024864586900000612
Encoder层中的双向LSTM网络的内部状态变化为:
Figure BDA00024864586900000613
Figure BDA00024864586900000614
Figure BDA00024864586900000615
he,t=We,tht+be,t (7)
其中,
Figure BDA00024864586900000616
Figure BDA00024864586900000617
分别表示前向LSTM网络的隐藏层状态和权重项,
Figure BDA00024864586900000618
Figure BDA00024864586900000619
分别表示反向LSTM网络的隐藏层状态和权重项,将两者拼接则得到了双向LSTM的隐藏层状态
Figure BDA0002486458690000071
Figure BDA0002486458690000072
是对ht的线性变换,用于计算公式(1)的空间权重,
Figure BDA0002486458690000073
是权重项,
Figure BDA0002486458690000074
是偏置项。Encoder层中的双向LSTM网络的输入为加权转换后的历史交通速度数据,即
Figure BDA0002486458690000075
双向LSTM网络将进行l次迭代,每次迭代输出其隐藏层状态,分别为ht-l+1,ht-l+2,…,ht,因此,Encoder层输出的隐藏层状态包含加权转换后的历史交通速度数据。
Decoder层的输入为Encoder层输出的l隐藏层状态和目标路段的历史交通速度数据,分别为ht-l+1,ht-l+2,…,ht和y,其中,y=(yt-l+1,yt-l+2,…,yt),yj是目标路段在j时间段的平均交通速度,j取值范围为[t-l+1,t]。
Decoder层中的时间注意力机制的内部状态变化为:
Figure BDA0002486458690000076
Figure BDA0002486458690000077
其中,公式(8)用于计算Encoder层输出的隐藏层状态在不同时间段的时间权重,
Figure BDA0002486458690000078
表示Encoder层输出的隐藏层状态hi在t时间段的时间权重,i取值范围为[t-l+1,t],t时间段的时间权重向量为
Figure BDA0002486458690000079
k是隐藏层的尺寸,
Figure BDA00024864586900000710
是元状态,
Figure BDA00024864586900000711
是隐藏层状态,
Figure BDA00024864586900000712
是Encoder层输出的隐藏层状态,
Figure BDA00024864586900000713
是Decoder层中的上一轮迭代的隐藏层状态、元状态和Encoder层输出的隐藏层状态的拼接,
Figure BDA00024864586900000714
Figure BDA00024864586900000715
是权重项,
Figure BDA00024864586900000716
Figure BDA00024864586900000717
是偏置项,且
Figure BDA0002486458690000081
公式(9)是归一化指数函数,用于时间权重的归一化计算,
Figure BDA0002486458690000082
是隐藏层状态hi在t时间段的归一化时间权重,归一化时间权重向量为
Figure BDA0002486458690000083
该时间权重向量表示Encoder层输出的l个隐藏层状态对t时间段的影响。Decoder层在迭代运算的过程中生成l个时间段的时间权重向量,依次为dt-l+1,dt-l+2,…,dt,相应的归一化时间权重向量为βt-l+1t-l+2,…,βt,运算过程总共迭代l次,第一次生成dt-l+1和βt-l+1,第二次生成dt-l+2和βt-l+2,以此类推,第l次生成dt和βt。随后,根据时间权重向量,获得t时间段的上下文向量(Context Vector),具体如下:
Figure BDA0002486458690000084
同样,计算获得其它时间段的上下文向量,即Vt-l+1,Vt-l+2,…,Vt-1。将上下文向量与目标路段的历史交通速度数据进行拼接,获得加权转换后的目标路段历史交通速度数据,具体计算方法如下:
Figure BDA0002486458690000085
其中,
Figure BDA0002486458690000086
是加权转换后目标路段在t时间段的交通速度,yt是输入的目标路段在t时间段的平均交通速度,
Figure BDA0002486458690000087
表示t时间段的上下文向量Vt与目标路段交通速度yt的拼接,
Figure BDA0002486458690000088
是权重项,
Figure BDA0002486458690000089
是偏置项。类似地计算出其它时间段加权转换后的目标路段历史交通速度数据,即
Figure BDA00024864586900000810
Decoder层中的双向LSTM网络的内部状态变化为:
Figure BDA00024864586900000811
Figure BDA0002486458690000091
Figure BDA0002486458690000092
hd,t=Wd,th′t+bd,t (15)
其中,
Figure BDA0002486458690000093
Figure BDA0002486458690000094
分别表示前向LSTM网络的隐藏层状态和权重项,
Figure BDA0002486458690000095
Figure BDA0002486458690000096
分别表示反向LSTM网络的隐藏层状态和权重项,两者拼接可得到双向LSTM的隐状态
Figure BDA0002486458690000097
是对h′t的线性变换,用于计算公式(8)的时间权重,
Figure BDA0002486458690000098
是权重项,
Figure BDA0002486458690000099
是偏置项。Decoder层中的双向LSTM网络的输入为加权转换后的目标路段历史交通速度数据,即
Figure BDA00024864586900000910
双向LSTM网络将进行l次迭代,并输出最后的隐藏层状态,即h′t,因此,Decoder层输出的隐藏层状态不仅包含空间特征信息,也包含时间特征信息。
最后,由全连接层计算得到预测结果,具体计算如下:
Figure BDA00024864586900000911
其中,
Figure BDA00024864586900000912
是目标路段在t+1时间段的平均交通速度预测值,
Figure BDA00024864586900000913
是t时间段的上下文向量与Decoder层输出的隐藏层状态的拼接,
Figure BDA00024864586900000914
是权重项,
Figure BDA00024864586900000915
是偏置项。
损失函数采用均方误差(Mean Square Error,MSE),具体如下:
Figure BDA00024864586900000916
其中,loss为损失函数,
Figure BDA00024864586900000917
为目标路段交通速度的预测值,
Figure BDA00024864586900000918
为目标路段交通速度的真实值,N表示训练样本个数。
(5)获取当前日期的交通速度数据,并作相应的数据预处理。当前日期的交通速度数据获取方法与步骤(1)相同,包括目标路段及其上下游路段的交通速度数据。随后,检查是否存在异常数据,并作相应的数据预处理。
(6)生成样本数据集,训练和测试基于分层注意力机制的神经网络模型。计算步骤(5)获取的目标路段交通速度数据与步骤(3)生成的M个簇数据的相似度,选择相似度最高的簇数据。以选择的簇数据和对应时间段的上下游路段交通速度数据为样本数据集,按一定比例拆分并生成训练数据集和测试数据集,训练和测试步骤(4)设计的神经网络模型,从而确定模型中所有的权重项和偏置项。
(7)预测目标路段未来时间段的平均交通速度。基于步骤(6)训练和测试所得的神经网络模型,采用步骤(5)获取的当前日期的交通速度数据,对目标路段未来若干个时间段的平均交通速度进行预测。
优选地,时间段的长度为5分钟。
优选地,步骤(2)中,采用过去一段时间的历史均值来修正异常数据。
优选地,步骤(4)中,l的取值为12。
优选地,步骤(6)中,按7:3的比例拆分并生成训练数据集和测试数据集。
优选地,步骤(7)中,预测的未来时间段包括未来0-5分钟、未来5-10分钟、未来10-15分钟、未来15-20分钟、未来20-25分钟和未来25-30分钟。
本发明的有益效果在于:(1)本发明充分考虑了历史交通速度数据的周期性和时序性,采用层次聚类方法对历史数据进行了划分和聚类,簇内数据拥有相似的分布,更适合于神经网络模型的训练;(2)本发明采用分层注意力机制设计了神经网络模型,有效地捕捉历史交通速度数据的空间特征和时间特征,并对不同路段和不同历史时间段赋予不同的影响权重,从而获得更准确的预测结果。
附图说明
图1是本发明方法的总体流程图。
图2是本发明方法的层次聚类流程图。
图3是本发明方法的基于分层注意力机制的神经网络模型。
具体实施方式
下面结合附图进一步说明本发明的技术方案。
本发明的基于层次聚类和分层注意力机制的交通速度预测方法,具体的实施步骤如下:
(1)获取目标路段及其上下游路段的历史交通速度数据。根据路段中安装的电警卡口装置,采集并记录过车数据。在过车数据的基础上,根据同一辆车在上下游出现的时间差和路段距离,计算各个时间段的路段平均速度,其中时间段的长度为5分钟。
(2)数据预处理。由于检测器故障或数据传输失败,采集的数据存在缺失或异常,所以需要进行数据预处理,采用过去一段时间的历史均值来修正这些异常数据。
(3)对目标路段的历史交通速度数据进行层次聚类。由于天气变化、节假日和突发事故,某一天或某几天的交通速度数据分布会不同于正常情况下的数据分布。如果直接把交通速度数据拆分为训练数据集和测试数据集,模型预测的准确性可能会很低。因此,为了考虑不同交通环境的影响,采用层次聚类方法对预处理数据进行处理,将分布相似的数据进行合并,从而把历史交通速度数据划分成若干个簇,簇内数据具有较高的相似度,聚类后的簇数据更适合模型的训练和测试,有效地提高了模型的预测精度。层次聚类方法的具体过程如下:
s31.按天划分目标路段的历史交通速度数据。将预处理后的交通速度数据按天进行划分,形成若干个初始簇,所述的初始簇就是层次聚类的底层节点;
s35.初始化阈值θ和最大相似度SIM_MAX。阈值θ用于判断算法是否结束,根据经验值设定阈值θ的初值。最大相似度SIM_MAX的初值为相对较大的值,远大于阈值θ。
s32.采用自下而上的聚合策略进行层次聚类。如果当前SIM_MAX大于或等于θ,则采用皮尔森相关系数计算任意两个簇的相似度,并比较这些相似度值,选取相似度最大的两个簇将其合并为一个簇,同时将SIM_MAX的值更新为当前的最大相似度;
s33.重复步骤s33,直至当前SIM_MAX小于阈值θ,最后获得M个簇的交通速度数据,其中M为簇的个数。
(4)设计基于分层注意力机制的神经网络模型。基于分层注意力机制的神经网络模型是以Seq2Seq模型为基础,包括Encoder层、Decoder层和全连接层。在Encoder层,将上下游路段的历史交通速度数据作为输入,利用空间注意力机制来捕捉交通速度数据的空间特征,并通过一个双向LSTM网络来确定每条上下游路段的影响权重;在Decoder层,将Encoder层的输出和目标路段的历史交通速度数据作为输入,利用时间注意力机制来挖掘交通速度数据的时间特征,并通过另外一个双向LSTM网络来确定过去若干个时间段的影响权重;最后,由全连接层计算得到预测结果。由于注意力机制也称为Attention,所以Encoder层的空间注意力机制也称为空间Attention,Decoder层的时间注意力机制也称为时间Attention。
Encoder层主要用于提取上下游路段对目标路段未来交通速度的影响程度,Encoder层的输入为上下游路段的历史交通速度数据S。
Figure BDA0002486458690000131
其中,
Figure BDA0002486458690000132
i取值范围为[1,n],n表示选取的上下游路段数,l表示时间段的个数,l的取值为12,t表示某个时间段,时间段的长度为5分钟,而l与t表示过去的某个时间段,如t-l+1表示t时间段之前的第(l-1)个时间段。S表示所选取的n条上下游路段在过去l个时间段的平均交通速度矩阵,Si表示路段i在过去l个时间段的平均交通速度向量,
Figure BDA0002486458690000133
表示路段i在j时间段的平均交通速度,j取值范围为[t-l+1,t]。
Encoder层中的空间注意力机制的内部状态变化为:
Figure BDA0002486458690000134
Figure BDA0002486458690000135
其中,公式(1)用于计算各个上下游路段在l个时间段的空间权重,
Figure BDA0002486458690000136
表示路段i在t时间段的空间权重,i取值范围为[1,n],t时间段的空间权重向量为
Figure BDA0002486458690000141
m是隐藏层尺寸,
Figure BDA0002486458690000142
是元状态,
Figure BDA0002486458690000143
是隐藏层状态,Si是输入的上下游路段i的历史交通速度数据,
Figure BDA0002486458690000144
是Encoder层中上一次迭代的隐藏层状态、元状态和路段i的交通速度数据的拼接,
Figure BDA0002486458690000145
Figure BDA0002486458690000146
是权重项,
Figure BDA0002486458690000147
Figure BDA0002486458690000148
是偏置项,且
Figure BDA0002486458690000149
tanh(·)函数是双曲正切函数,为激活函数;公式(2)是Softmax函数,即归一化指数函数,用于空间权重的归一化计算,
Figure BDA00024864586900001410
是路段i在t时间段的归一化空间权重,归一化t时间段的空间权重向量为
Figure BDA00024864586900001411
Encoder层在迭代运算的过程中生成l个时间段的空间权重向量,依次为et-l+1,et-l+2,…,et,相应的归一化空间权重向量为αt-l+1t-l+2,…,αt,运算过程总共迭代l次,第一次生成et-l+1和αt-l+1,第二次生成et-l+2和αt-l+2,以此类推,第l次生成et和αt。随后,根据t时间段的空间权重向量,输入的历史交通速度数据被加权转换为:
Figure BDA00024864586900001412
因此,向量
Figure BDA00024864586900001413
包含了各个上下游路段的空间特征信息,类似地计算出其它时间段加权转换后的历史交通速度数据,即
Figure BDA00024864586900001414
Encoder层中的双向LSTM网络的内部状态变化为:
Figure BDA00024864586900001415
Figure BDA00024864586900001416
Figure BDA00024864586900001417
he,t=We,tht+be,t (7)
其中,
Figure BDA00024864586900001418
Figure BDA00024864586900001419
分别表示前向LSTM网络的隐藏层状态和权重项,
Figure BDA0002486458690000151
Figure BDA0002486458690000152
分别表示反向LSTM网络的隐藏层状态和权重项,将两者拼接则得到了双向LSTM的隐藏层状态
Figure BDA0002486458690000153
Figure BDA0002486458690000154
是对ht的线性变换,用于计算公式(1)的空间权重,
Figure BDA0002486458690000155
是权重项,
Figure BDA0002486458690000156
是偏置项。Encoder层中的双向LSTM网络的输入为加权转换后的历史交通速度数据,即
Figure BDA0002486458690000157
双向LSTM网络将进行l次迭代,每次迭代输出其隐藏层状态,分别为ht-l+1,ht-l+2,…,ht,因此,Encoder层输出的隐藏层状态包含加权转换后的历史交通速度数据。
Decoder层的输入为Encoder层输出的l隐藏层状态和目标路段的历史交通速度数据,分别为ht-l+1,ht-l+2,…,ht和y,其中,y=(yt-l+1,yt-l+2,…,yt),yj是目标路段在j时间段的平均交通速度,j取值范围为[t-l+1,t],时间段的长度为5分钟。
Decoder层中的时间注意力机制的内部状态变化为:
Figure BDA0002486458690000158
Figure BDA0002486458690000159
其中,公式(8)用于计算Encoder层输出的隐藏层状态在不同时间段的时间权重,
Figure BDA00024864586900001510
表示Encoder层输出的隐藏层状态hi在t时间段的时间权重,i取值范围为[t-l+1,t],t时间段的时间权重向量为
Figure BDA00024864586900001511
k是隐藏层的尺寸,
Figure BDA00024864586900001512
是元状态,
Figure BDA00024864586900001513
是隐藏层状态,
Figure BDA00024864586900001514
是Encoder层输出的隐藏层状态,
Figure BDA00024864586900001515
是Decoder层中的上一轮迭代的隐藏层状态、元状态和Encoder层输出的隐藏层状态的拼接,
Figure BDA00024864586900001516
Figure BDA0002486458690000161
是权重项,
Figure BDA0002486458690000162
Figure BDA0002486458690000163
是偏置项,且
Figure BDA0002486458690000164
公式(9)是归一化指数函数,用于时间权重的归一化计算,
Figure BDA0002486458690000165
是隐藏层状态hi在t时间段的归一化时间权重,归一化时间权重向量为
Figure BDA0002486458690000166
该时间权重向量表示Encoder层输出的l个隐藏层状态对t时间段的影响。Decoder层在迭代运算的过程中生成l个时间段的时间权重向量,依次为dt-l+1,dt-l+2,…,dt,相应的归一化时间权重向量为βt-l+1t-l+2,…,βt,运算过程总共迭代l次,第一次生成dt-l+1和βt-l+1,第二次生成dt-l+2和βt-l+2,以此类推,第l次生成dt和βt。随后,根据时间权重向量,获得t时间段的上下文向量,具体如下:
Figure BDA0002486458690000167
同样,计算获得其它时间段的上下文向量,即Vt-l+1,Vt-l+2,…,Vt-1。将上下文向量与目标路段的历史交通速度数据进行拼接,获得加权转换后的目标路段历史交通速度数据,具体计算方法如下:
Figure BDA0002486458690000168
其中,
Figure BDA0002486458690000169
是加权转换后目标路段在t时间段的交通速度,yt是输入的目标路段在t时间段的平均交通速度,
Figure BDA00024864586900001610
表示t时间段的上下文向量Vt与目标路段交通速度yt的拼接,
Figure BDA00024864586900001611
是权重项,
Figure BDA00024864586900001612
是偏置项。类似地计算出其它时间段加权转换后的目标路段历史交通速度数据,即
Figure BDA00024864586900001613
Decoder层中的双向LSTM网络的内部状态变化为:
Figure BDA0002486458690000171
Figure BDA0002486458690000172
Figure BDA0002486458690000173
hd,t=Wd,th′t+bd,t (15)
其中,
Figure BDA0002486458690000174
Figure BDA0002486458690000175
分别表示前向LSTM网络的隐藏层状态和权重项,
Figure BDA0002486458690000176
Figure BDA0002486458690000177
分别表示反向LSTM网络的隐藏层状态和权重项,两者拼接可得到双向LSTM的隐状态
Figure BDA0002486458690000178
是对h′t的线性变换,用于计算公式(8)的时间权重,
Figure BDA0002486458690000179
是权重项,
Figure BDA00024864586900001710
是偏置项。Decoder层中的双向LSTM网络的输入为加权转换后的目标路段历史交通速度数据,即
Figure BDA00024864586900001711
双向LSTM网络将进行l次迭代,并输出最后的隐藏层状态,即h′t,因此,Decoder层输出的隐藏层状态不仅包含空间特征信息,也包含时间特征信息。
最后,由全连接层计算得到预测结果,具体计算如下:
Figure BDA00024864586900001712
其中,
Figure BDA00024864586900001713
是目标路段在t+1时间段的平均交通速度预测值,
Figure BDA00024864586900001714
是t时间段的上下文向量与Decoder层输出的隐藏层状态的拼接,
Figure BDA00024864586900001715
是权重项,
Figure BDA00024864586900001716
是偏置项。
损失函数采用均方误差(Mean Square Error,MSE),具体如下:
Figure BDA00024864586900001717
其中,loss为损失函数,
Figure BDA00024864586900001718
为目标路段交通速度的预测值,
Figure BDA00024864586900001719
为目标路段交通速度的真实值,N表示训练样本个数。
(5)获取当前日期的交通速度数据,并作相应的数据预处理。当前日期的交通速度数据获取方法与步骤(1)相同,包括目标路段及其上下游路段的交通速度数据。随后,检查是否存在异常数据,并作相应的数据预处理。
(6)生成样本数据集,训练和测试基于分层注意力机制的神经网络模型。计算步骤(5)获取的目标路段交通速度数据与步骤(3)生成的M个簇数据的相似度,选择相似度最高的簇数据。以选择的簇数据和对应时间段的上下游路段交通速度数据为样本数据集,按7:3的比例拆分并生成训练数据集和测试数据集,训练和测试步骤(4)设计的神经网络模型,从而确定模型中所有的权重项和偏置项。
(7)预测目标路段未来时间段的平均交通速度。基于步骤(6)训练和测试所得的神经网络模型,采用步骤(5)获取的当前日期的交通速度数据,对目标路段未来若干个时间段的平均交通速度进行预测,其中,预测的未来时间段包括未来0-5分钟、未来5-10分钟、未来10-15分钟、未来15-20分钟、未来20-25分钟和未来25-30分钟。
如附图1,本发明方法的总体流程图。首先,获取目标路段及其上下游路段的历史交通速度数据,并作相应的数据预处理;然后,采用层次聚类方法,对目标路段的历史交通速度数据进行聚类,获得若干个簇数据,簇内数据具有较高的相似度;接着,设计基于分层注意力机制的神经网络模型,模型Encoder层以上下游路段的历史交通速度数据作为输入,利用空间注意力机制来捕捉交通速度数据的空间特征,并通过双向LSTM网络来确定每条上下游路段的影响权重,模型的Decoder层,则以Encoder层的输出和目标路段的历史交通速度数据作为输入,利用时间注意力机制来挖掘交通速度数据的时间特征,并通过另外一个双向LSTM网络来确定过去若干个时间段的影响权重。随后,获取当前日期的交通速度数据,并作相应的数据预处理,包括目标路段及其上下游路段的交通速度数据,并在此基础上,选择相似度最高的簇数据和对应时间段的上下游路段交通速度数据为样本数据集,按比例拆分并生成训练数据集和测试数据集,训练和测试神经网络模型。最后,应用训练好的神经网络模型,预测目标路段未来若干个时间段的平均交通速度。
如附图2,本发明方法的层次聚类流程图。首先,按天划分目标路段的历史交通速度数据,获得若干个初始簇,也即层次聚类的底层节点;然后,初始化阈值θ和最大相似度SIM_MAX,其中,SIM_MAX的初值为相对较大的值,远大于阈值θ;接着,比较SIM_MAX和θ的大小,如果SIM_MAX≥θ,则采用皮尔森相关系数计算任意两个簇的相似度,并从中选取相似度最大的两个簇进行合并,同时更新SIM_MAX的值为当前的最大相似度;重复以上步骤,直至SIM_MAX<θ;最后,获得M个簇的历史交通速度数据。
如附图3,本发明方法的基于分层注意力机制的神经网络模型,模型包括Encoder层、Decoder层和全连接层。Encoder层的输入为上下游路段的历史交通速度数据,即S1,S2,…,Sn;经过空间Attention迭代运算获得l个时间段的空间权重向量,即et-l+1,et-l+2,…,et,再经过Softmax函数进行归一化计算,获得归一化的空间权重向量,即αt-l+1t-l+2,…,αt;而不同时间段的空间权重向量对输入的上下游路段的历史交通速度数据进行加权转换,加权转换后的历史交通速度数据是Encoder层双向LSTM的输入,即
Figure BDA0002486458690000201
Encoder层的双向LSTM进行l次迭代运算,每次迭代运算,不仅输出其隐藏层状态至Decoder层,即ht-l+1,ht-l+2,…,ht,而且隐藏层状态在进行线性变换后,即he,t-l+1,he,t-l+2,…,he,t,输出至空间Attention,用于计算各个上下游路段在不同时间段的空间权重。Decoder层的输入为Encoder层输出的隐藏层状态和目标路段的历史交通速度数据,即ht-l+1,ht-l+2,…,ht和y,其中y=(yt-l+1,yt-l+2,…,yt);经过时间Attention迭代运算获得l个时间段的时间权重向量,即dt-l+1,dt-l+2,…,dt,再经过Softmax函数进行归一化计算,获得归一化的时间权重向量,即βt-l+1t-l+2,…,βt;根据时间权重向量,获得不同时间段的上下文向量,即Vt-l+1,Vt-l+2,…,Vt,而不同时间段的上下文向量对输入的目标路段的历史交通速度数据进行加权转换,加权转换后的历史交通速度数据是Decoder层双向LSTM的输入,即
Figure BDA0002486458690000202
Decoder层的双向LSTM也进行l次迭代运算,每次迭代运算,其相应的隐藏层状态在进行线性变换后,即hd,t-l+1,hd,t-l+2,…,hd,t,输出至时间Attention,用于计算各个隐藏层状态在不同时间段的时间权重,同时,双向LSTM最后一次运算的隐藏层状态,即h′t,将输出至全连接层。全连接层的输入为t时间段的上下文向量Vt与Decoder层双向LSTM输出的隐藏层状态h′t,输出为目标路段在t+1时间段的平均交通速度预测值
Figure BDA0002486458690000211
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (6)

1.基于层次聚类和分层注意力机制的交通速度预测方法,包括如下步骤:
(1)获取目标路段及其上下游路段的历史交通速度数据;根据路段中安装的电警卡口装置,采集并记录过车数据;在过车数据的基础上,根据同一辆车在上下游出现的时间差和路段距离,计算各个时间段的路段平均速度;
(2)数据预处理;由于检测器故障或数据传输失败,采集的数据存在缺失或异常,所以需要进行数据预处理,修正这些异常数据;
(3)对目标路段的历史交通速度数据进行层次聚类;层次聚类方法的具体过程如下:
s31.按天划分目标路段的历史交通速度数据;将预处理后的交通速度数据按天进行划分,形成若干个初始簇,所述的初始簇就是层次聚类的底层节点;
s32.初始化阈值θ和最大相似度SIM_MAX;阈值θ用于判断算法是否结束,根据经验值设定阈值θ的初值;最大相似度SIM_MAX的初值为相对较大的值,远大于阈值θ;
s33.采用自下而上的聚合策略进行层次聚类;如果当前SIM_MAX大于或等于θ,则采用皮尔森相关系数计算任意两个簇的相似度,并比较这些相似度值,选取相似度最大的两个簇将其合并为一个簇,同时将SIM_MAX的值更新为当前的最大相似度;
s34.重复步骤s33,直至当前SIM_MAX小于阈值θ,最后获得M个簇的交通速度数据,其中M为簇的个数;
(4)设计基于分层注意力机制的神经网络模型;基于分层注意力机制的神经网络模型是以Seq2Seq模型为基础,包括Encoder层、Decoder层和全连接层;在Encoder层,将上下游路段的历史交通速度数据作为输入,利用空间注意力机制来捕捉交通速度数据的空间特征,并通过一个双向LSTM网络来确定每条上下游路段的影响权重;在Decoder层,将Encoder层的输出和目标路段的历史交通速度数据作为输入,利用时间注意力机制来挖掘交通速度数据的时间特征,并通过另外一个双向LSTM网络来确定过去若干个时间段的影响权重;最后,由全连接层计算得到预测结果;
Encoder层主要用于提取上下游路段对目标路段未来交通速度的影响程度,Encoder层的输入为上下游路段的历史交通速度数据S;
Figure FDA0002486458680000021
其中,
Figure FDA0002486458680000022
i取值范围为[1,n],n表示选取的上下游路段数,l表示时间段的个数,t表示某个时间段,而l与t表示过去的某个时间段,如t-l+1表示t时间段之前的第(l-1)个时间段;S表示所选取的n条上下游路段在过去l个时间段的平均交通速度矩阵,Si表示路段i在过去l个时间段的平均交通速度向量,
Figure FDA0002486458680000023
表示路段i在j时间段的平均交通速度,j取值范围为[t-l+1,t];
Encoder层中的空间注意力机制的内部状态变化为:
Figure FDA0002486458680000024
Figure FDA0002486458680000025
其中,公式(1)用于计算各个上下游路段在l个时间段的空间权重,
Figure FDA0002486458680000026
表示路段i在t时间段的空间权重,i取值范围为[1,n],t时间段的空间权重向量为
Figure FDA0002486458680000027
m是隐藏层尺寸,
Figure FDA0002486458680000028
是元状态,
Figure FDA0002486458680000029
是隐藏层状态,Si是输入的上下游路段i的历史交通速度数据,
Figure FDA00024864586800000210
是Encoder层中上一次迭代的隐藏层状态、元状态和路段i的交通速度数据的拼接,
Figure FDA00024864586800000211
Figure FDA00024864586800000212
是权重项,
Figure FDA00024864586800000213
Figure FDA00024864586800000214
是偏置项,且
Figure FDA00024864586800000215
tanh(·)函数是双曲正切函数,为激活函数;公式(2)是Softmax函数,即归一化指数函数,用于空间权重的归一化计算,
Figure FDA00024864586800000216
是路段i在t时间段的归一化空间权重,归一化t时间段的空间权重向量为
Figure FDA00024864586800000217
Encoder层在迭代运算的过程中生成l个时间段的空间权重向量,依次为et-l+1,et-l+2,…,et,相应的归一化空间权重向量为αt-l+1t-l+2,…,αt,运算过程总共迭代l次,第一次生成et-l+1和αt-l+1,第二次生成et-l+2和αt-l+2,以此类推,第l次生成et和αt;随后,根据t时间段的空间权重向量,输入的历史交通速度数据被加权转换为:
Figure FDA0002486458680000031
因此,向量
Figure FDA0002486458680000032
包含了各个上下游路段的空间特征信息,类似地计算出其它时间段加权转换后的历史交通速度数据,即
Figure FDA0002486458680000033
Encoder层中的双向LSTM网络的内部状态变化为:
Figure FDA0002486458680000034
Figure FDA0002486458680000035
Figure FDA0002486458680000036
he,t=We,tht+be,t (7)
其中,
Figure FDA0002486458680000037
Figure FDA0002486458680000038
分别表示前向LSTM网络的隐藏层状态和权重项,
Figure FDA0002486458680000039
Figure FDA00024864586800000310
分别表示反向LSTM网络的隐藏层状态和权重项,将两者拼接则得到了双向LSTM的隐藏层状态
Figure FDA00024864586800000311
是对ht的线性变换,用于计算公式(1)的空间权重,
Figure FDA00024864586800000312
是权重项,
Figure FDA00024864586800000313
是偏置项;Encoder层中的双向LSTM网络的输入为加权转换后的历史交通速度数据,即
Figure FDA00024864586800000314
双向LSTM网络将进行l次迭代,每次迭代输出其隐藏层状态,分别为ht-l+1,ht-l+2,…,ht,因此,Encoder层输出的隐藏层状态包含加权转换后的历史交通速度数据;
Decoder层的输入为Encoder层输出的l隐藏层状态和目标路段的历史交通速度数据,分别为ht-l+1,ht-l+2,…,ht和y,其中,y=(yt-l+1,yt-l+2,…,yt),yj是目标路段在j时间段的平均交通速度,j取值范围为[t-l+1,t];
Decoder层中的时间注意力机制的内部状态变化为:
Figure FDA0002486458680000041
Figure FDA0002486458680000042
其中,公式(8)用于计算Encoder层输出的隐藏层状态在不同时间段的时间权重,
Figure FDA0002486458680000043
表示Encoder层输出的隐藏层状态hi在t时间段的时间权重,i取值范围为[t-l+1,t],t时间段的时间权重向量为
Figure FDA0002486458680000044
k是隐藏层的尺寸,
Figure FDA0002486458680000045
是元状态,
Figure FDA0002486458680000046
是隐藏层状态,
Figure FDA0002486458680000047
是Encoder层输出的隐藏层状态,
Figure FDA0002486458680000048
是Decoder层中的上一轮迭代的隐藏层状态、元状态和Encoder层输出的隐藏层状态的拼接,
Figure FDA0002486458680000049
Figure FDA00024864586800000410
是权重项,
Figure FDA00024864586800000411
Figure FDA00024864586800000412
是偏置项,且
Figure FDA00024864586800000413
公式(9)是归一化指数函数,用于时间权重的归一化计算,
Figure FDA00024864586800000414
是隐藏层状态hi在t时间段的归一化时间权重,归一化时间权重向量为
Figure FDA00024864586800000415
该时间权重向量表示Encoder层输出的l个隐藏层状态对t时间段的影响;Decoder层在迭代运算的过程中生成l个时间段的时间权重向量,依次为dt-l+1,dt-l+2,…,dt,相应的归一化时间权重向量为βt-l+1t-l+2,…,βt,运算过程总共迭代l次,第一次生成dt-l+1和βt-l+1,第二次生成dt-l+2和βt-l+2,以此类推,第l次生成dt和βt;随后,根据时间权重向量,获得t时间段的上下文向量,具体如下:
Figure FDA00024864586800000416
同样,计算获得其它时间段的上下文向量,即Vt-l+1,Vt-l+2,…,Vt-1;将上下文向量与目标路段的历史交通速度数据进行拼接,获得加权转换后的目标路段历史交通速度数据,具体计算方法如下:
Figure FDA0002486458680000051
其中,
Figure FDA0002486458680000052
是加权转换后目标路段在t时间段的交通速度,yt是输入的目标路段在t时间段的平均交通速度,
Figure FDA0002486458680000053
表示t时间段的上下文向量Vt与目标路段交通速度yt的拼接,
Figure FDA0002486458680000054
是权重项,
Figure FDA0002486458680000055
是偏置项;类似地计算出其它时间段加权转换后的目标路段历史交通速度数据,即
Figure FDA0002486458680000056
Decoder层中的双向LSTM网络的内部状态变化为:
Figure FDA0002486458680000057
Figure FDA0002486458680000058
Figure FDA0002486458680000059
hd,t=Wd,th′t+bd,t (15)
其中,
Figure FDA00024864586800000510
Figure FDA00024864586800000511
分别表示前向LSTM网络的隐藏层状态和权重项,
Figure FDA00024864586800000512
Figure FDA00024864586800000513
分别表示反向LSTM网络的隐藏层状态和权重项,两者拼接可得到双向LSTM的隐状态
Figure FDA00024864586800000514
是对h′t的线性变换,用于计算公式(8)的时间权重,
Figure FDA00024864586800000515
是权重项,
Figure FDA00024864586800000516
是偏置项;Decoder层中的双向LSTM网络的输入为加权转换后的目标路段历史交通速度数据,即
Figure FDA00024864586800000517
双向LSTM网络将进行l次迭代,并输出最后的隐藏层状态,即h′t,因此,Decoder层输出的隐藏层状态不仅包含空间特征信息,也包含时间特征信息;
最后,由全连接层计算得到预测结果,具体计算如下:
Figure FDA00024864586800000518
其中,
Figure FDA00024864586800000519
是目标路段在t+1时间段的平均交通速度预测值,
Figure FDA00024864586800000520
是t时间段的上下文向量与Decoder层输出的隐藏层状态的拼接,
Figure FDA0002486458680000061
是权重项,
Figure FDA0002486458680000062
是偏置项;
损失函数采用均方误差(Mean Square Error,MSE),具体如下:
Figure FDA0002486458680000063
其中,loss为损失函数,
Figure FDA0002486458680000064
为目标路段交通速度的预测值,
Figure FDA0002486458680000065
为目标路段交通速度的真实值,N表示训练样本个数;
(5)获取当前日期的交通速度数据,并作相应的数据预处理;当前日期的交通速度数据获取方法与步骤(1)相同,包括目标路段及其上下游路段的交通速度数据;随后,检查是否存在异常数据,并作相应的数据预处理;
(6)生成样本数据集,训练和测试基于分层注意力机制的神经网络模型;计算步骤(5)获取的目标路段交通速度数据与步骤(3)生成的M个簇数据的相似度,选择相似度最高的簇数据;以选择的簇数据和对应时间段的上下游路段交通速度数据为样本数据集,按一定比例拆分并生成训练数据集和测试数据集,训练和测试步骤(4)设计的神经网络模型,从而确定模型中所有的权重项和偏置项;
(7)预测目标路段未来时间段的平均交通速度;基于步骤(6)训练和测试所得的神经网络模型,采用步骤(5)获取的当前日期的交通速度数据,对目标路段未来若干个时间段的平均交通速度进行预测。
2.如权利要求1所述的基于层次聚类和分层注意力机制的交通速度预测方法,其特征在于:时间段的长度为5分钟。
3.如权利要求1所述的基于层次聚类和分层注意力机制的交通速度预测方法,其特征在于:步骤(2)中,采用过去一段时间的历史均值来修正异常数据。
4.如权利要求1所述的基于层次聚类和分层注意力机制的交通速度预测方法,其特征在于:步骤(4)中,l的取值为12。
5.如权利要求1所述的基于层次聚类和分层注意力机制的交通速度预测方法,其特征在于:步骤(6)中,按7:3的比例拆分并生成训练数据集和测试数据集。
6.如权利要求1所述的基于层次聚类和分层注意力机制的交通速度预测方法,其特征在于:步骤(7)中,预测的未来时间段包括未来0-5分钟、未来5-10分钟、未来10-15分钟、未来15-20分钟、未来20-25分钟和未来25-30分钟。
CN202010393385.8A 2020-05-11 2020-05-11 基于层次聚类和分层注意力机制的交通速度预测方法 Pending CN111598325A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010393385.8A CN111598325A (zh) 2020-05-11 2020-05-11 基于层次聚类和分层注意力机制的交通速度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010393385.8A CN111598325A (zh) 2020-05-11 2020-05-11 基于层次聚类和分层注意力机制的交通速度预测方法

Publications (1)

Publication Number Publication Date
CN111598325A true CN111598325A (zh) 2020-08-28

Family

ID=72185238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010393385.8A Pending CN111598325A (zh) 2020-05-11 2020-05-11 基于层次聚类和分层注意力机制的交通速度预测方法

Country Status (1)

Country Link
CN (1) CN111598325A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308336A (zh) * 2020-11-18 2021-02-02 浙江大学 一种基于多步时序预测的高速铁路大风限速动态处置方法
CN112633332A (zh) * 2020-12-08 2021-04-09 天津大学 一种基于时空关联信息挖掘的太阳风速度预测方法
CN113326972A (zh) * 2021-05-06 2021-08-31 大连海事大学 基于实时公交车速度统计数据的公交专用道短时速度预测方法
CN113362598A (zh) * 2021-06-04 2021-09-07 重庆高速公路路网管理有限公司 一种高速公路服务区车流量预测方法
CN113627676A (zh) * 2021-08-18 2021-11-09 湘潭大学 一种基于多注意力因果关系的交通预测方法及系统
CN114038212A (zh) * 2021-10-19 2022-02-11 南京航空航天大学 基于双阶段注意力机制和深度强化学习的信号灯控制方法
CN116385970A (zh) * 2023-04-07 2023-07-04 暨南大学 基于时空序列数据的人流聚集预测模型
CN117831287A (zh) * 2023-12-29 2024-04-05 北京大唐高鸿数据网络技术有限公司 高速公路拥堵指数的确定方法、装置、设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070713A (zh) * 2019-04-15 2019-07-30 浙江工业大学 一种基于双向嵌套lstm神经网络的交通流预测方法
US20200135017A1 (en) * 2018-10-29 2020-04-30 Beihang University Transportation network speed foreeasting method using deep capsule networks with nested lstm models

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200135017A1 (en) * 2018-10-29 2020-04-30 Beihang University Transportation network speed foreeasting method using deep capsule networks with nested lstm models
CN110070713A (zh) * 2019-04-15 2019-07-30 浙江工业大学 一种基于双向嵌套lstm神经网络的交通流预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DUANYANG LIU, ETC.: "Traffic Speed Prediction: An Attention-Based Method" *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308336A (zh) * 2020-11-18 2021-02-02 浙江大学 一种基于多步时序预测的高速铁路大风限速动态处置方法
CN112308336B (zh) * 2020-11-18 2023-12-19 浙江大学 一种基于多步时序预测的高速铁路大风限速动态处置方法
CN112633332A (zh) * 2020-12-08 2021-04-09 天津大学 一种基于时空关联信息挖掘的太阳风速度预测方法
CN113326972A (zh) * 2021-05-06 2021-08-31 大连海事大学 基于实时公交车速度统计数据的公交专用道短时速度预测方法
CN113326972B (zh) * 2021-05-06 2024-01-05 大连海事大学 基于实时公交车速度统计数据的公交专用道短时速度预测方法
CN113362598A (zh) * 2021-06-04 2021-09-07 重庆高速公路路网管理有限公司 一种高速公路服务区车流量预测方法
CN113627676A (zh) * 2021-08-18 2021-11-09 湘潭大学 一种基于多注意力因果关系的交通预测方法及系统
CN113627676B (zh) * 2021-08-18 2023-09-01 湘潭大学 一种基于多注意力因果关系的交通预测方法及系统
CN114038212A (zh) * 2021-10-19 2022-02-11 南京航空航天大学 基于双阶段注意力机制和深度强化学习的信号灯控制方法
CN116385970A (zh) * 2023-04-07 2023-07-04 暨南大学 基于时空序列数据的人流聚集预测模型
CN116385970B (zh) * 2023-04-07 2024-05-28 暨南大学 基于时空序列数据的人流聚集预测模型
CN117831287A (zh) * 2023-12-29 2024-04-05 北京大唐高鸿数据网络技术有限公司 高速公路拥堵指数的确定方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN111598325A (zh) 基于层次聚类和分层注意力机制的交通速度预测方法
CN110097755B (zh) 基于深度神经网络的高速公路交通流量状态识别方法
CN111832225B (zh) 一种构建汽车行驶工况的方法
CN110503833B (zh) 一种基于深度残差网络模型的入口匝道联动控制方法
CN109800692B (zh) 一种基于预训练卷积神经网络的视觉slam回环检测方法
CN111612243A (zh) 交通速度预测方法、系统及存储介质
CN108986453A (zh) 一种基于情境信息的交通状况预测方法、系统及装置
CN113487066A (zh) 基于多属性增强图卷积-Informer模型的长时序货运量预测方法
CN106709588B (zh) 预测模型构建方法和设备以及实时预测方法和设备
CN109086926B (zh) 一种基于组合神经网络结构的短时轨道交通客流预测方法
CN113487856B (zh) 基于图卷积网络及注意力机制的交通流组合预测模型
CN113139468B (zh) 融合局部目标特征与全局特征的视频摘要生成方法
CN112270355A (zh) 基于大数据技术与sae-gru的主动安全预测方法
CN113570859A (zh) 一种基于异步时空膨胀图卷积网络的交通流量预测方法
CN114495507A (zh) 融合时空注意力神经网络和交通模型的交通流预测方法
CN116307152A (zh) 时空交互式动态图注意力网络的交通预测方法
CN112257847A (zh) 一种基于CNN和LSTM预测地磁Kp指数的方法
CN114596726B (zh) 基于可解释时空注意力机制的停车泊位预测方法
CN112927507B (zh) 一种基于LSTM-Attention的交通流量预测方法
CN113806857A (zh) 一种基于变分图自编码器的高速列车节能制动方法
CN117436653A (zh) 一种网约车出行需求的预测模型构建方法和预测方法
CN114912719B (zh) 一种基于图神经网络的异质交通个体轨迹协同预测方法
CN117494034A (zh) 基于交通拥堵指数和多源数据融合的空气质量预测方法
Ramhormozi et al. Multi-task graph neural network for truck speed prediction under extreme weather conditions
Xiang et al. Traffic state estimation of signalized intersections based on stacked denoising auto-encoder model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Liu Duanyang

Inventor after: Xu Xinbo

Inventor after: Tang Longfeng

Inventor after: Fan Xinye

Inventor after: Chen Xue

Inventor after: Shen Guojiang

Inventor before: Liu Duanyang

Inventor before: Xu Xinbo

Inventor before: Tang Longfeng

Inventor before: Fan Xinye

Inventor before: Chen Xue

Inventor before: Shen Guojiang

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200828