CN109035762A - 一种基于时空宽度学习的交通速度预测方法 - Google Patents

一种基于时空宽度学习的交通速度预测方法 Download PDF

Info

Publication number
CN109035762A
CN109035762A CN201810691891.8A CN201810691891A CN109035762A CN 109035762 A CN109035762 A CN 109035762A CN 201810691891 A CN201810691891 A CN 201810691891A CN 109035762 A CN109035762 A CN 109035762A
Authority
CN
China
Prior art keywords
section
speed
matrix
moment
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810691891.8A
Other languages
English (en)
Other versions
CN109035762B (zh
Inventor
赵春晖
崔紫强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201810691891.8A priority Critical patent/CN109035762B/zh
Publication of CN109035762A publication Critical patent/CN109035762A/zh
Application granted granted Critical
Publication of CN109035762B publication Critical patent/CN109035762B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于时空宽度学习的交通速度预测方法。该方法充分考虑了交通速度的时间特性和空间特性,同时考虑了天气和节假日的影响,并引入宽度学习的思想建立预测模型。时间特性方面,本方法提取了速度信号的时序慢特征作为特征节点。空间特性方面,本方法提出了一种滑动窗口相关系数法搜寻对预测路段速度有影响的相关路段,并将这些路段的速度数据作为扩展自变量引入模型。本方法在引入宽度学习思想建立预测模型的同时引入L1和L2正则化对特征进行稀疏选择,防止模型的过拟合。本方法考虑了时空特性,具有很强的可解释性,相比传统的预测方法,提高了预测精度,而且一定程度缩短了建模时间,为交通速度预测方法的研究指明了新的方向。

Description

一种基于时空宽度学习的交通速度预测方法
技术领域
本发明属于交通时序数据分析和预测研究领域,特别是涉及一种基于时空 相关性和宽度学习的交通速度预测方法。
背景技术
21世纪以来,人口数量急剧增长,城市化进程飞速发展,路网总量和机动 车数量不断增长,交通拥堵状况越来越严重。准确合理地预估交通车速,实时 评价交通状况,可以有效地疏导交通,显著改善交通拥堵状况,并且可以辅助 管理者合理地实施交通管制,对保护人民生命财产,维护公共安全以及提升城 市形象有着及其重要的意义。
交通速度是一种时间序列数据,具有临近性和周期性的特点。前人对此已 经做了相应的研究和探讨,目前,对交通速度预测的方法主要有传统的时间序 列模型,如ARIMA。近几年,随着人工智能和数据挖掘等技术的发展,一些机 器学习方法,如支持向量回归、神经网络模型等也被广泛地运用在交通预测中。 其中,传统的时间序列模型,由于其是基于线性的,难以模拟道路的真实状况, 且没有考虑数据的周期性。而神经网络等机器学习模型不但需要较长的训练时 间,而且容易造成模型过拟合等问题,难以实现对实际交通速度实时预测。此 外,现存的方法大多是对某一条道路单独建模,而忽略其他相关路段的影响。但实际上,由于城市交通网的存在,不同道路之间的车流量、车速等存在一定 关系,即不同道路间会相互影响。基于单一道路的模型并不能很好地运用在实 际的城市道路预测中,基于此,本发明考虑了相关路段的相互影响。此外,由 于交通速度数据是一种时序性数据,本发明采用慢特征分析的方法有效提取交 通速度数据中变化缓慢的特征。又由于天气和节假日等随机因素会对交通速度 造成一定程度的影响,本发明引入了天气和节假日等随机因素。综上,本发明 所提出的基于时空宽度学习的交通速度预测方法,既考虑了相关路段的影响, 又有效提取了时序数据的慢特征,且融入了天气和节假日因素的影响。模型的 训练上,采用了与宽度学习结构相似的模型,其训练时间短,拟合效果好。同 时引入了L1和L2正则化来防止模型的过拟合。到目前为止,尚未见到与本发 明相关的研究报道。
发明内容
本发明的目的在于针对现有交通速度预测方法的不足,提供一种基于时空 宽度学习的交通速度预测方法。
本发明的目的是通过以下技术方案来实现的:一种基于时空宽度学习的交 通速度预测方法,该方法包括以下步骤:
步骤1:建模数据预处理:对各路段的速度数据和对应时刻的天气类型、节 假日类型进行预处理。
对于速度数据,将获取的车辆速度数据按照不同路段分类,按时间先后顺 序排序。对需要分析的每一个路段,选取第k时刻之后的1小时作为时间间 隔,k表示该时间间隔的起点,用该时间间隔内该路段上速度的平均值来代替 第k时刻的速度。k=0,1,2,…,23,即每个时间间隔的起点为整点,从而每个路段 每天被分割成24个时刻(0点到23点),每一个时刻对应一个固定的速度值。 则路段i在m天内获得的速度向量可以表示为vi T(1×24m),其中,i为路段代 号,i=1,2,…,L,L为路段总数。
对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型 分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量 对应时刻的天气和日期类型,路段i在m天内的天气数据表示为wi T(1×24m), 日期类别数据表示为di T(1×24m)。
步骤2:搜寻对预测路段的速度有影响的路段,并定义为待预测路段的相关 路段:
(2.1)设c为待预测路段代号。删掉vc T的第一个样本和vi T(i=1,2,…,L,i≠c) 的最后一个样本后重新对齐,构成L个新的速度向量Vi T(1×24m)。
(2.2)对于L个新的速度向量Vi T(1×24m),(i=1,2,…,L),用一个长度为K 个样本的一维滑动窗口滑过vi T(1×24m),每次向后滑动12个样本,那么一共可 以滑动z次,其中z=(24m-K)/12。将路段i在第j个滑动窗口中的数据所组成的 列向量记为则所有路段在第j个滑动窗口中的列向量组成一个 矩阵窗口移动z次共得到z个矩阵,对于第j个矩阵,按照 下式计算与其他L-1个列向量的相关系数
其中,vnck j为路段c在第j个滑动窗口中的数据所组成的列向量中的第k个元素;为vnck j的均值,为vnik j的均值,
那么,路段c与任意路段i的速度滑动相关程度系数定义为Rci,由下式得到:
(2.3)然后依据Rci确定相关路段:将Rci按照降序排列,从中选取前F个最 大值所对应的路段代号i,则相关路段确定完毕。表示在除路段c以外的路段中 选取了F个与路段c相关的路段,其路段代号记为r1,r2,...,rF,这些相关路段的速 度将作为变量用于预测模型的建立。
步骤3:确定模型的输入变量
对于路段代号为c的待预测路段,在第M~m天内,采用如下四部分的样本 对第t时刻的交通速度vc(t)进行预测:
第一部分为:路段c在t-24M,t-24(M-1),...,t-24时刻的速度;
第二部分为:路段c在t-N,t-(N-1),...t-1时刻的速度;
第三部分为:步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度 vr1,vr2,...,vrF
第四部分为:路段c在t时刻的天气和时间类型wc(t),dc(t)。
路段c在t-24M,t-24(M-1),...,t-24时刻的速度、路段c在t-N,t-(N-1),...t-1时刻的速度、步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度 vr1,vr2,...,vrF、路段c在t时刻的天气和时间类型wc(t),dc(t)依次构成长度为 M+N+F+2的预测变量。
24(m-M)个预测变量和响应变量组成维度为24(m-M)×(M+N+F+2)的预测 变量矩阵X'和维度为24(m-M)×1的响应变量矩阵Y。
步骤4:提取速度变量的慢特征
(4.1)取步骤3中所述预测变量矩阵X'的前M+N+F列,作为速度变量矩 阵X'1,对于X'1的第i列X1i',进行如下式所示的减均值的中心化处理:
X1i=X1i'-var(X1i') (12)
其中,i=1,2,…,M+N+F,var(X1i')表示X1的第i列的均值。
中心化处理后的X1i组成新的变量矩阵X1
(4.2)构造X1的协方差矩阵,并进行SVD分解,如下式所示:
X1X1 T=UΛUT (13)
按下式进行白化处理:
B=Λ-1/2UTX1=QX1 (14)
其中,B为白化后的矩阵,Q=Λ-1/2UT是白化矩阵。
(4.3)对B的第二行开始的每一行减去前一行所得到的差分矩阵再进行 SVD分解,求解得到正交矩阵P,Ω表示对角矩阵。
则静态慢特征S1=PB=WX1,其中,W=PQ。
(4.4)对S1进行行向量差分,从第2行开始,每行减去上一行得到新的矩 阵,即得到动态慢特征S2
(4.5)去掉S1的第一行,与S2按行方向进行拼接,得到特征维度为2(M+N+F) 的速度慢特征矩阵S。
步骤5:建立基于时空宽度学习的交通速度预测模型;
步骤6:在线预测;
(6.1)对测试样本,首先执行步骤1到步骤3,得到测试样本的待预测变 量矩阵Xt(p×(M+N+F+2))和响应变量矩阵Yt(p×1),p为测试样本个数。
(6.2)取Xt的前M+N+F列为速度变量矩阵首先对的每一列进行 与训练集相同的中心化处理。然后按下式提取静态慢特征:
其中W为步骤(4.3)中获取的W。对求行向量差分,第1行减去训练 集的最后一行,从第2行开始,每行减去前一行。这样得到一个新的矩阵,即 是动态慢特征进行行方向的拼接,得到p×(2M+2N+2F)维的速度 慢特征矩阵St
(6.3)将速度慢特征矩阵St与对应的天气因素wt和节假日因素dt代入步骤5 所建立的预测模型,得到预测结果
进一步地,所述步骤5包括以下子步骤:
(5.1)构建网络的特征节点。将静态慢特征S1和动态慢特征S2作为由原始 数据映射得到的特征节点,S1作为第一组映射特征,记为Z1;S2作为第二组映 射特征,记为Z2;对应时刻的天气因素和节假日因素[wc,dc]记为Z3。给定记号 Z=[Z1,Z2,Z3]表示两组映射特征和其他特征。
(5.2)构造增强节点:
其中,ξj是第j组增强节点的激活函数,是第j组增强节点的随机权重系数矩阵,为第j组增强节点的偏置项。前g组增强节点被记为Hg=[H1,H2...,Hg]。
(5.3)将网络的所有特征节点和增强节点连接到输出端,如下式所示:
(5.4)采用ElasticNet的思想,同时引入L1和L2正则化。求解权重Wm
λ1λ2为正则化系数。
进一步地,删掉vc T的第一个样本和vi T(i=1,2,…,L,i≠c)的最后一个样本后 重新对齐,对齐的目的是为了分析其他路段i上一时刻的速度对待预测路段c当 前时刻的速度的影响。
与现有技术相比,本发明的有益效果是:本方法从实际交通数据的时间特 性和空间特性着手,克服了传统回归分析方法没有考虑到的问题,充分挖掘了 交通速度的时空相关性。首先,在时间相关性方面,该方法不仅在构造变量时 考虑了交通数据的临近性和周期性,而且利用慢特征分析提取速度的时序慢特 征作为特征节点;其次,在空间相关性方面,对于每一个待预测路段,都考虑 与其相关的路段对其的影响。本发明在考虑时空相关性的同时,考虑了外界因 素(天气和节假日)对交通速度的影响。此外,本发明利用了宽度学习的思想 用于模型的建立,在保证精度的同时,加快了线下训练和在线预测的速度,且引入了L1、L2正则化,有效避免了模型的过拟合。为交通速度预测提供了一种 有效易行的方法,为实际道路状况预测的研究指明了新的方向。本发明所提出 的交通速度预测方法充分考虑了时空相关性。时间相关性方面,利用慢特征分 析提取速度数据的时序慢特征,空间方面,对每一个预测路段,都考虑与其相 关的路段对其的影响。且发明在保证了精度的同时,线下训练和在线预测的时 间都非常快,保证了效率,是一种有效易行的方法。
附图说明
图1是本发明基于时空宽度学习的交通速度预测方法建模流程图。
图2是使用本发明寻找相关路段的方法所找到的与路段306相关性最强的 前5个路段与路段306的相关程度。
图3是采用本发明基于时空宽度学习的交通速度方法对路段306的预测速 度与真实速度的比较图。
图4为支持向量回归方法对路段306的预测速度与真实速度的比较图。
图5为神经网络方法对路段306的预测速度与真实速度的比较图。
具体实施方式
下面结合附图和具体实例,对本发明作进一步详细说明。
本实例所采用数据为杭州市8000辆出租车2013年10月1日~2014年1月 31日的为期四个月,共计123天的GPS信号数据,GPS数据中包括速度值和采 样时间以及位置信息。
如图1所示,本发明是基于时空宽度学习的交通速度预测方法,该方法包 括以下步骤:
步骤1:建模数据预处理。
对各路段的速度数据和对应时刻的天气类型、节假日类型进行预处理。
对于速度数据,将获取的车辆速度数据按照不同路段分类,按时间先后顺 序排序。对需要分析的每一个路段,选取第k时刻之后的1小时作为时间间 隔,k表示该时间间隔的起点,用该时间间隔内该路段上速度的平均值来代替 第k时刻的速度。k=0,1,2,…,23,即每个时间间隔的起点为整点,从而每个路段 每天被分割成24个时刻(0点到23点),每一个时刻对应一个固定的速度值。 则路段i在m天内获得的速度向量可以表示为vi T(1×24m),其中,i为路段代 号,i=1,2,…,L,L为路段总数。本实例中,我们对杭州市出租车2013年10月1 日~2014年1月31日的为期四个月,共计123天的GPS信号进行了预处理,并 从中随机选出了246个路段的数据进行接下来的分析,m=123,L=246。
考虑到天气和节假日影响,还需要对天气和节假日类型数据进行预处理。由于外界因素的定性表述无 法引入模型中,所以本发明对天气、节假日等外界因素进行定量划分。对于天气,按照降水量大小将其分 类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上 述速度变量对应时刻的天气和日期类型,路段i在m天内的天气数据表示为wi T(1×24m),日期类别数据 表示为di T(1×24m)。本实例中,对于天气,按照降水量大小将其分为三类,第一类是干燥无降水的天气, 比如晴天、多云等;第二类是中度湿润,比如小雨、中雨、小雪、大雾等;第三类是高度湿润,比如大雨、大雪等,分别用数值1、2、3表示。对于节假日的影响,将日期类型分为三类:工作日、周末、节假日, 分别用数值1、2、3来表示。路段i在m天内的天气数据表示为wi T(1×24m),日期类别数据表示为di T(1×24 m)。本实例中,共获取为期四个月123天每天24小时的天气,以及123天每天的节假日类型,天气和节 假日类型数据均对应于速度向量。如表1所示为某一路段预处理后的部分数据的格式示例。
表1
路段代号 当前速度 时间 天气 节假日
186 35 2013/10/1 8:00 1 3
186 35 2013/10/1 9:00 1 3
186 32.1429 2013/10/1 10:00 1 3
186 32 2013/10/1 11:00 1 3
186 33.3571 2013/10/1 12:00 1 3
186 34 2013/10/1 13:00 1 3
186 30.4 2013/10/1 14:00 1 3
步骤2:搜寻对预测路段的速度有影响的路段,并定义为待预测路段的相关 路段
(2.1)设c为待预测路段代号。本实例以c=306为例,路段306代表莫干 山路(从天目山路到金家渡中路)路段。删掉vc T的第一个样本和vi T (i=1,2,…,L,i≠c)的最后一个样本后重新对齐,构成L个新的速度向量 Vi T(1×24m),这样对齐的目的是为了分析其他路段i上一时刻的速度对待预测路 段c当前时刻的速度的影响。
(2.2)对于L个新的速度向量Vi T(1×24m),(i=1,2,…,L),用一个长度为K 个样本的一维滑动窗口滑过vi T(1×24m),每次向后滑动12个样本,那么一共可 以滑动z次,其中z=(24m-K)/12。将路段i在第j个滑动窗口中的数据所组成的 列向量记为则所有路段在第j个滑动窗口中的列向量组成一个 矩阵窗口移动z次共得到z个矩阵,对于第j个矩阵,按照 下式计算与其他L-1个列向量的相关系数
其中,vnck j为路段c在第j个滑动窗口中的数据所组成的列向量中的第k个元素;为vnck j的均值,为vnik j的均值,本实 例中,按上式计算路段306与其他245个路段的相关系数
那么,路段306与任意路段i的速度滑动相关程度系数定义为Rci,由下式 得到:
(2.3)然后依据Rci确定相关路段:将Rci按照降序排列,从中选取前F个最 大值所对应的路段代号i,则相关路段确定完毕。表示在除路段c以外的路段中 选取了F个与路段c相关的路段,其路段代号记为r1,r2,...,rF,这些相关路段的速 度将作为变量用于预测模型的建立。本实例中,将R306,i按照降序排列,图2为 降序排列后的前5个路段的相关程度,本实例中F选为2,从中选取前2个最大 值所对应的路段代号i。可以看出,路段305的相关程度最高,为3.1070,路段 308的相关程度第二高,为2.5193。则相关路段确定完毕,即在除路段306以 外的路段中选取了2个与路段306相关的路段,其路段代号分别为 r1=305,r1=308,相关路段的速度将作为变量用于预测模型的建立。
步骤3:确定模型的输入变量
对于路段代号为c的待预测路段,在第M~m天内,采用如下四部分的样本 对第t时刻的交通速度vc(t)进行预测:
第一部分为:路段c在t-24M,t-24(M-1),...,t-24时刻的速度;
第二部分为:路段c在t-N,t-(N-1),...t-1时刻的速度;
第三部分为:步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度 vr1,vr2,...,vrF
第四部分为:路段c在t时刻的天气和时间类型wc(t),dc(t)。
路段c在t-24M,t-24(M-1),...,t-24时刻的速度、路段c在t-N,t-(N-1),...t-1时刻的速度、步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度 vr1,vr2,...,vrF、路段c在t时刻的天气和时间类型wc(t),dc(t)依次构成长度为 M+N+F+2的预测变量。24(m-M)个预测变量和响应变量组成维度为 24(m-M)×(M+N+F+2)的预测变量矩阵X'和维度为24(m-M)×1的响应变量矩阵 Y。本实例中,考虑到交通速度会存在以星期(7天)为周期的周期性,将M选 为7。关于N的选择,本实例选取N=6用来体现交通速度数据的时间临近性。 预测路段为306,则由24(123-7)=2784个预测变量和响应变量可得到预测变 量矩阵X(2784×17)和响应变量矩阵Y(2784×1)。取前2401个样本作为训练集,第 2402~2784个样本作为测试集。
步骤4:提取速度变量的慢特征
(4.1)取步骤3中所述预测变量矩阵X'的前M+N+F列,作为速度变量矩 阵X'1,本实例中,M+N+F=7+6+2=15,共15列。对于X'1的第i列X1i',进行如 下式所示的减均值的中心化处理:
X1i=X1i'-var(X1i') (21)
其中,i=1,2,…,M+N+F,var(X1i')表示X1的第i列的均值。
中心化处理后的X1i组成新的变量矩阵X1
(4.2)构造X1的协方差矩阵,并进行SVD分解,如下式所示:
X1X1 T=UΛUT (22)
按下式进行白化处理:
Z=Λ-1/2UTX1=QX1 (23)
其中,Z为白化后的矩阵,Q=Λ-1/2UT是白化矩阵。表示对Z的第二行开始的 每一行减去前一行所得到的差分矩阵。
(4.3)对B的第二行开始的每一行减去前一行所得到的差分矩阵再进行 SVD分解,求解得到正交矩阵P,Ω表示对角矩阵。
则静态慢特征S1=PB=WX1,其中,W=PQ。
(4.4)对S1进行行向量差分,从第2行开始,每行减去上一行得到新的矩 阵,即得到动态慢特征S2
(4.5)去掉S1的第一行,与S2按行方向进行拼接,得到特征维度为2(M+N+F) 的速度慢特征矩阵S。本实例得到2400×30维的速度慢特征矩阵S。
步骤5:建立基于时空宽度学习的交通速度预测模型
(5.1)构建网络的特征节点。将静态慢特征S1和动态慢特征S2作为由原始 数据映射得到的特征节点,S1作为第一组映射特征,记为Z1;S2作为第二组映 射特征,记为Z2;对应时刻的天气因素和节假日因素[wc,dc]记为Z3。给定记号 Z=[Z1,Z2,Z3]表示两组映射特征和其他特征。
(5.2)构造增强节点:
其中,ξj是第j组增强节点的激活函数,是第j组增强节点的随机权重系数矩阵,为第j组增强节点的偏置项。前g组增强节点被记为Hg=[H1,H2...,Hg]。 本实例中,的维度为2400×1,g取为100,即构造100个增强节点,增强节点 的激活函数均为sigmoid函数。
(5.3)将网络的所有特征节点和增强节点连接到输出端,如下式所示:
(5.4)采用ElasticNet的思想,同时引入L1和L2正则化。本实例中,L1 正则化参数λ1设为0.5,L2正则化参数λ2设为0.25。求解权重Wm
步骤6:在线预测
(6.1)对测试样本,首先执行步骤1到步骤3,得到测试样本的待预测变 量矩阵Xt(p×(M+N+F+2))和响应变量矩阵Yt(p×1),p为测试样本个数。本实例 中,对步骤3所划分出的包含383个样本的测试集,首先执行步骤1到步骤3, 得到测试样本的预测变量矩阵Xt(383×17)和响应变量矩阵Yt(383×1)。
(6.2)取Xt的前M+N+F=15列为速度变量矩阵首先对的每一列进 行与训练集相同的中心化处理。然后按下式提取静态慢特征:
其中W为步骤(4.3)中获取的W。对求行向量差分,第1行减去训练集的 最后一行,从第2行开始,每行减去前一行。这样得到一个新的矩阵,即是动 态慢特征进行行方向的拼接,得到p×(2M+2N+2F)维的速度慢特 征矩阵St。本实例中得到383×30维的速度慢特征矩阵St
(6.3)将速度慢特征矩阵St与对应的天气因素wt和节假日因素dt代入步骤5 所建立的预测模型,得到预测结果计算测试集真实标签与预测结果的均方 误差RMSE,为0.889911。并绘制真实值与预测结果的曲线图,如图3所示。 从图中可以看出,本发明方法可以很好的跟随真实速度的变化趋势,实现交通 速度的较为准确的预测。为与常用的机器学习算法作对比,本实例将该方法与 支持向量回归、神经网络模型作了对比,图4为支持向量回归方法的预测结果 与真实值的对比曲线图,图5为神经网络方法的预测结果与真实值的对比曲线 图。表2为三种方法在测试集上的RMSE以及模型训练时间对比。从表中可以 看出,本方法不但缩短了模型训练的时间,而且减小了均方误差,提高了预测 精度。
表2
模型 测试集RMSE 训练耗时
本发明所述模型 0.8899 0.23s
支持向量回归 0.9427 0.76s
神经网络 1.1748 3.21s
为了进一步证明模型的有效性,随机选取10个路段,分别用本发明所述方 法和其他两个对比方法进行建模,建模过程同上。计算测试集的RMSE,结果 如表3所示。
表3
本发明所述模型 支持向量回归 神经网络
路段306 0.8899 0.9427 1.1784
路段302 2.7762 3.0105 3.0450
路段102 1.4694 1.7488 2.7623
路段1376 1.2387 1.2209 1.2866
路段185 1.7301 1.7781 1.8634
路段267 3.6634 3.7440 3.9750
路段503 3.1016 3.2283 3.0245
路段369 1.7893 2.2310 2.5732
路段414 3.5668 4.1035 3.9801
路段617 2.6468 3.1986 3.2315
10个路段RMSE均值 2.2872 2.5206 2.6920
从表中可以看出,与其他方法相比,本发明所述方法具有更低的预测误差, 且结论具有普遍性。

Claims (7)

1.一种基于时空宽度学习的交通速度预测方法,其特征在于,该方法包括以下步骤:
步骤1:建模数据预处理:对各路段的速度数据和对应时刻的天气类型、节假日类型进行预处理。
步骤2:搜寻对预测路段的速度有影响的路段,并定义为待预测路段的相关路段。
步骤3:确定模型的输入变量;
步骤4:提取速度变量的慢特征。
步骤5:建立基于时空宽度学习的交通速度预测模型;
步骤6:在线预测。
2.根据权利要求1所述的方法,其特征在于,所述步骤1具体为:
对于速度数据,将获取的车辆速度数据按照不同路段分类,按时间先后顺序排序。对需要分析的每一个路段,选取第k时刻之后的1小时作为时间间隔,k表示该时间间隔的起点,用该时间间隔内该路段上速度的平均值来代替第k时刻的速度。k=0,1,2,…,23,即每个时间间隔的起点为整点,从而每个路段每天被分割成24个时刻(0点到23点),每一个时刻对应一个固定的速度值。则路段i在m天内获得的速度向量可以表示为vi T(1×24m),其中,i为路段代号,i=1,2,…,L,L为路段总数。
对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期类型,路段i在m天内的天气数据表示为wi T(1×24m),日期类别数据表示为di T(1×24m)。
3.根据权利要求1所述的方法,其特征在于,所述步骤2具体为:
步骤2:搜寻对预测路段的速度有影响的路段,并定义为待预测路段的相关路段:
(2.1)设c为待预测路段代号。删掉vc T的第一个样本和vi T(i=1,2,…,L,i≠c)的最后一个样本后重新对齐,构成L个新的速度向量Vi T(1×24m)。对齐的目的是为了分析其他路段i上一时刻的速度对待预测路段c当前时刻的速度的影响。
(2.2)对于L个新的速度向量Vi T(1×24m),(i=1,2,…,L),用一个长度为K个样本的一维滑动窗口滑过vi T(1×24m),每次向后滑动12个样本,那么一共可以滑动z次,其中z=(24m-K)/12。将路段i在第j个滑动窗口中的数据所组成的列向量记为则所有路段在第j个滑动窗口中的列向量组成一个矩阵窗口移动z次共得到z个矩阵,对于第j个矩阵,按照下式计算与其他L-1个列向量的相关系数
其中,vnck j为路段c在第j个滑动窗口中的数据所组成的列向量中的第k个元素;为vnck j的均值, 为vnik j的均值,
那么,路段c与任意路段i的速度滑动相关程度系数定义为Rci,由下式得到:
(2.3)然后依据Rci确定相关路段:将Rci按照降序排列,从中选取前F个最大值所对应的路段代号i,则相关路段确定完毕。表示在除路段c以外的路段中选取了F个与路段c相关的路段,其路段代号记为r1,r2,...,rF,这些相关路段的速度将作为变量用于预测模型的建立。
4.根据权利要求1所述的方法,其特征在于,所述步骤3具体为:
对于路段代号为c的待预测路段,在第M~m天内,采用如下四部分的样本对第t时刻的交通速度vc(t)进行预测:
第一部分为:路段c在t-24M,t-24(M-1),...,t-24时刻的速度;
第二部分为:路段c在t-N,t-(N-1),...t-1时刻的速度;
第三部分为:步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度vr1,vr2,...,vrF
第四部分为:路段c在t时刻的天气和时间类型wc(t),dc(t)。
路段c在t-24M,t-24(M-1),...,t-24时刻的速度、路段c在t-N,t-(N-1),...t-1时刻的速度、步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度vr1,vr2,...,vrF、路段c在t时刻的天气和时间类型wc(t),dc(t)依次构成长度为M+N+F+2的预测变量。
24(m-M)个预测变量和响应变量组成维度为24(m-M)×(M+N+F+2)的预测变量矩阵X'和维度为24(m-M)×1的响应变量矩阵Y。
5.根据权利要求1所述的方法,其特征在于,所述步骤4具体为:
(4.1)取步骤3中所述预测变量矩阵X'的前M+N+F列,作为速度变量矩阵X′1,对于X′1的第i列X1i',进行如下式所示的减均值的中心化处理:
X1i=X1i'-var(X1i') (3)
其中,i=1,2,…,M+N+F,var(X1i')表示X1的第i列的均值。
中心化处理后的X1i组成新的变量矩阵X1
(4.2)构造X1的协方差矩阵,并进行SVD分解,如下式所示:
X1X1 T=UΛUT (4)
按下式进行白化处理:
B=Λ-1/2UTX1=QX1 (5)
其中,B为白化后的矩阵,Q=Λ-1/2UT是白化矩阵。
(4.3)对B的第二行开始的每一行减去前一行所得到的差分矩阵再进行SVD分解,求解得到正交矩阵P,Ω表示对角矩阵。
则静态慢特征S1=PB=WX1,其中,W=PQ。
(4.4)对S1进行行向量差分,从第2行开始,每行减去上一行得到新的矩阵,即得到动态慢特征S2
(4.5)去掉S1的第一行,与S2按行方向进行拼接,得到特征维度为2(M+N+F)的速度慢特征矩阵S。
步骤5:建立基于时空宽度学习的交通速度预测模型。
6.根据权利要求1所述的方法,其特征在于,所述步骤6具体为:
(6.1)对测试样本,首先执行步骤1到步骤3,得到测试样本的待预测变量矩阵Xt(p×(M+N+F+2))和响应变量矩阵Yt(p×1),p为测试样本个数。
(6.2)取Xt的前M+N+F列为速度变量矩阵首先对的每一列进行与训练集相同的中心化处理。然后按下式提取静态慢特征:
其中W为步骤(4.3)中获取的W。对求行向量差分,第1行减去训练集的最后一行,从第2行开始,每行减去前一行。这样得到一个新的矩阵,即是动态慢特征进行行方向的拼接,得到p×(2M+2N+2F)维的速度慢特征矩阵St
(6.3)将速度慢特征矩阵St与对应的天气因素wt和节假日因素dt代入步骤5所建立的预测模型,得到预测结果
7.根据权利要求1所述的方法,其特征在于,所述步骤5具体为:
(5.1)构建网络的特征节点。将静态慢特征S1和动态慢特征S2作为由原始数据映射得到的特征节点,S1作为第一组映射特征,记为Z1;S2作为第二组映射特征,记为Z2;对应时刻的天气因素和节假日因素[wc,dc]记为Z3。给定记号Z=[Z1,Z2,Z3]表示两组映射特征和其他特征。
(5.2)构造增强节点:
其中,ξj是第j组增强节点的激活函数,是第j组增强节点的随机权重系数矩阵,为第j组增强节点的偏置项。前g组增强节点被记为Hg=[H1,H2...,Hg]。
(5.3)将网络的所有特征节点和增强节点连接到输出端,如下式所示:
(5.4)采用ElasticNet的思想,同时引入L1和L2正则化。求解权重Wm
λ1λ2为正则化系数。
CN201810691891.8A 2018-06-28 2018-06-28 一种基于时空宽度学习的交通速度预测方法 Active CN109035762B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810691891.8A CN109035762B (zh) 2018-06-28 2018-06-28 一种基于时空宽度学习的交通速度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810691891.8A CN109035762B (zh) 2018-06-28 2018-06-28 一种基于时空宽度学习的交通速度预测方法

Publications (2)

Publication Number Publication Date
CN109035762A true CN109035762A (zh) 2018-12-18
CN109035762B CN109035762B (zh) 2020-12-18

Family

ID=65521911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810691891.8A Active CN109035762B (zh) 2018-06-28 2018-06-28 一种基于时空宽度学习的交通速度预测方法

Country Status (1)

Country Link
CN (1) CN109035762B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109828552A (zh) * 2019-02-22 2019-05-31 北京工业大学 一种基于宽度学习系统的间歇过程故障监测与诊断方法
CN110009135A (zh) * 2019-03-08 2019-07-12 浙江大学 一种基于宽度学习的风电功率预测方法
CN110299005A (zh) * 2019-06-10 2019-10-01 浙江大学 一种基于深度集成学习的城市大规模路网交通速度预测方法
CN110570019A (zh) * 2019-08-14 2019-12-13 中国地质大学(武汉) 一种基于宽度学习的烧结过程综合焦比时序预测方法
CN111613054A (zh) * 2020-05-07 2020-09-01 浙江大学 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法
CN113098910A (zh) * 2021-05-13 2021-07-09 福州大学 基于时空粒度和三宽度学习的网络入侵检测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408913A (zh) * 2014-11-03 2015-03-11 东南大学 一种考虑时空相关性的交通流三参数实时预测方法
CN104537260A (zh) * 2015-01-14 2015-04-22 清华大学 基于缓慢特征回归的动态软测量方法和系统
KR20150072471A (ko) * 2013-12-19 2015-06-30 건국대학교 산학협력단 시공간 확률 모델을 이용한 교통 흐름 예측 시스템
CN106971547A (zh) * 2017-05-18 2017-07-21 福州大学 一种考虑时空相关性的短时交通流预测方法
CN107464419A (zh) * 2017-08-28 2017-12-12 北京工业大学 一种考虑时空特性的短时交通流预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150072471A (ko) * 2013-12-19 2015-06-30 건국대학교 산학협력단 시공간 확률 모델을 이용한 교통 흐름 예측 시스템
CN104408913A (zh) * 2014-11-03 2015-03-11 东南大学 一种考虑时空相关性的交通流三参数实时预测方法
CN104537260A (zh) * 2015-01-14 2015-04-22 清华大学 基于缓慢特征回归的动态软测量方法和系统
CN106971547A (zh) * 2017-05-18 2017-07-21 福州大学 一种考虑时空相关性的短时交通流预测方法
CN107464419A (zh) * 2017-08-28 2017-12-12 北京工业大学 一种考虑时空特性的短时交通流预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张蓉: "基于多维多尺度数据的交通速度预测模型研究", 《中国优秀硕士学位论文全文数据库工程科技II辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109828552A (zh) * 2019-02-22 2019-05-31 北京工业大学 一种基于宽度学习系统的间歇过程故障监测与诊断方法
CN109828552B (zh) * 2019-02-22 2020-08-28 北京工业大学 一种基于宽度学习系统的间歇过程故障监测与诊断方法
CN110009135A (zh) * 2019-03-08 2019-07-12 浙江大学 一种基于宽度学习的风电功率预测方法
CN110299005A (zh) * 2019-06-10 2019-10-01 浙江大学 一种基于深度集成学习的城市大规模路网交通速度预测方法
CN110570019A (zh) * 2019-08-14 2019-12-13 中国地质大学(武汉) 一种基于宽度学习的烧结过程综合焦比时序预测方法
CN111613054A (zh) * 2020-05-07 2020-09-01 浙江大学 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法
CN113098910A (zh) * 2021-05-13 2021-07-09 福州大学 基于时空粒度和三宽度学习的网络入侵检测方法及系统

Also Published As

Publication number Publication date
CN109035762B (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
CN109035762A (zh) 一种基于时空宽度学习的交通速度预测方法
Cai et al. Landslide detection using densely connected convolutional networks and environmental conditions
CN109034448B (zh) 基于车辆轨迹语义分析和深度信念网络的轨迹预测方法
CN113487066B (zh) 基于多属性增强图卷积-Informer模型的长时序货运量预测方法
CN110322695A (zh) 一种基于深度学习的短时交通流预测方法
CN108710875A (zh) 一种基于深度学习的航拍公路车辆计数方法及装置
CN108629978A (zh) 一种基于高维路网和循环神经网络的交通轨迹预测方法
CN109034449A (zh) 基于深度学习和乘客行为模式的短期公交客流预测方法
Wang et al. Regional landslide susceptibility zoning with considering the aggregation of landslide points and the weights of factors
CN113362598B (zh) 一种高速公路服务区车流量预测方法
CN105493109A (zh) 使用多个数据源的空气质量推断
CN112365708B (zh) 基于多图卷积网络的景区交通量预测模型建立和预测方法
CN106910199A (zh) 面向城市空间信息采集的车联网众包方法
CN107704970A (zh) 一种基于Spark的需求侧负荷预测方法
CN112419711B (zh) 基于改进gmdh算法的封闭式停车场停车需求预测方法
CN114969007A (zh) 一种基于功能混合度和集成学习的城市功能区识别方法
CN113806419A (zh) 基于时空大数据的城市区域功能识别模型及识别方法
CN109829588A (zh) 基于上下文的张量轨迹路径规划方法
CN106228268A (zh) 一种基于收费数据的高速公路旅行时间的预测方法
CN110070720B (zh) 提高交叉口占道施工区通行能力模型拟合度的计算方法
Gong et al. Spatio-temporal parking occupancy forecasting integrating parking sensing records and street-level images
CN109543922A (zh) 用于有桩共享单车站点群的分时段借还量预测方法
CN116958649A (zh) 一种街道空间城市功能分类方法及相关设备
CN115909717A (zh) 一种基于深度学习的高速公路短时交通流预测方法
Liu et al. An ensembled RBF extreme learning machine to forecast road surface temperature

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant