CN109598936A - 一种基于动态stknn模型的短时交通预测方法 - Google Patents

一种基于动态stknn模型的短时交通预测方法 Download PDF

Info

Publication number
CN109598936A
CN109598936A CN201811547414.0A CN201811547414A CN109598936A CN 109598936 A CN109598936 A CN 109598936A CN 201811547414 A CN201811547414 A CN 201811547414A CN 109598936 A CN109598936 A CN 109598936A
Authority
CN
China
Prior art keywords
time
road segment
prediction
subregion
data point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811547414.0A
Other languages
English (en)
Other versions
CN109598936B (zh
Inventor
陆锋
程诗奋
彭澎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Geographic Sciences and Natural Resources of CAS
Original Assignee
Institute of Geographic Sciences and Natural Resources of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Geographic Sciences and Natural Resources of CAS filed Critical Institute of Geographic Sciences and Natural Resources of CAS
Priority to CN201811547414.0A priority Critical patent/CN109598936B/zh
Publication of CN109598936A publication Critical patent/CN109598936A/zh
Application granted granted Critical
Publication of CN109598936B publication Critical patent/CN109598936B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0133Traffic data processing for classifying traffic situation

Abstract

本发明公开了一种基于动态STKNN模型的短时交通预测方法,步骤为:a、特征表示:通过对每个道路片段历史天的交通条件求平均值,利用平均速度向量来对每个道路片段进行特征表示;b、交通模式自动识别:通过AP聚类算法自动识别道路网络相似的交通模式;c、自动划分时间区间:针对自动识别出的多种交通模式,通过K‑Means算法自动划分时间区间;d、构建自适应的STKNN模型:针对步骤2和步骤3获取的每个交通模式的每个时间区间,分别构建STKNN模型。本发明可以直接帮助交通管理部门制定合理和高效的策略来缓解交通拥堵,实现道路网络交通流量的再分配,同时可以帮助大众实现准确的路径规划。

Description

一种基于动态STKNN模型的短时交通预测方法
技术领域
本发明涉及一种短时交通预测方法,尤其涉及一种基于动态STKNN模型的短时交通预测方法,属于信息技术服务领域。
背景技术
短时交通预测作为智能交通系统重要的一部分,可以帮助用户合理的规划路径以及提供智能的位置服务,缓解道路拥堵,从而减少交通排放,同时,可以帮助交通部门实施有效的交通管制、合理配置基础设施以及优化信号灯的时间,从而提高交通的操作效率。
在过去几十年,大量的时空建模方法被提出用于解决短时交通预测的问题,这些方法为短时交通预测提供了可选方案,但依然存在很多未解决的技术问题。考虑到交通条件在时间上具有非线性和非平稳性变化特征,即便是相同的道路片段,在不同的时间区间具有不同的变化模式,例如在峰值区间道路片段的相关性强度要高于平峰区间;在拥堵时空间邻居的大小要小于自由流,因此短时交通预测模型的结构应该能适应交通条件的动态变化。然而,现有技术针对整个时间范围建模,其隐喻的假设是把交通预测当作一个静态的点过程,忽略了交通条件在时间上的动态属性特征,导致模型结构在整个时间范围内仍是固定不变的,例如相同的道路片段在不同的时间区间(早高峰和晚高峰)具有相同数目的空间邻居,这是预测模型无法获得满意结果的一个主要原因。另一方面,现有技术采用人为设定全局固定的时间区间的划分策略,使得不同交通变化模式的道路片段具有相同的时间区间,例如某些道路片段的早高峰在6: 00-8:00,而另一些道路片段的早高峰在5:00-7:00,因此无法反映细粒度的时间非平稳性变化特征。
精确的表示时空对于短时交通预测模型精度的提升至关重要,可以通过在预测模型中整合时空信息或交通条件的动态特性来实现。现有技术在整合时空信息方面取得了一定的成功,例如引入时空状态矩阵来表征交通条件;构建自适应的模型来抓取道路交通的异质属性特征,使得短时交通预测模型的精度有了一定的提升。然而,在刻画交通条件在时间上的动态性方面依然存在不足。鉴于此,本发明考虑道路交通的空间异质性和时间非平稳性特征,提出了一种动态的STKNN模型实现短时交通的高效预测。
发明内容
为了解决上述技术所存在的不足之处,本发明提供了一种基于动态STKNN 模型的短时交通预测方法。
为了解决以上技术问题,本发明采用的技术方案是:一种基于动态 STKNN模型的短时交通预测方法,方法的整体步骤为:
a、特征表示:构建表示所有道路片段历史时刻交通条件的三维张量,三维张量的每一个切面代表每个道路片段所有历史天的交通条件变化曲线;通过对每个道路片段历史天的交通条件求平均值,利用平均速度向量来对每个道路片段进行特征表示;
b、交通模式自动识别:通过AP聚类算法自动识别道路网络相似的交通模式;
c、自动划分时间区间:针对自动识别出的多种交通模式,通过K-Means算法自动划分时间区间,用于比较不同时间区间交通条件的变化差异;
d、构建自适应的STKNN模型:针对步骤2和步骤3获取的每个交通模式的每个时间区间,分别构建STKNN模型。
步骤a、特征表示的具体方法为:假设道路网络存在N条道路片段,道路片段u的历史交通条件Xu可表示为其中,表示维度为D×T的二维实数集,表示道路片段u在第i天的时间序列,D 表示历史总天数,T表示一天中总的时间间隔,因此,整个道路网络的历史交通条件可以用一个三维张量X表示,则Xu,d,t表示道路片段u在第d天t时刻的交通条件值,表示维度为N×D×T的实数集;对每个道路片段所有历史天的对应时间间隔的交通条件求平均,利用平均时间序列来表示每个道路片段的历史交通条件的平均变化模式,其形式化表示如公式Ⅰ,其中∑为求和符号。
步骤b的具体方法为:将所有交通条件的特征数据集表示为U,可以将看作T维空间内的1个数据点,则待聚类的数据点可用索引表示为{1,2,...,N};将所有样本点看作网络中的节点,输入相似度矩阵S,i,k∈[1,N],其中si,k表示数据点i和数据点k之间的相似度,si,k的值越大表示数据点i与数据点k的距离越近,数据点k作为数据点i的聚类中心的能力越强;sk,k称为偏好度,作为数据点k能否成为代表点的评判标准,该值越大表明该点成为代表点的可能性越大,偏好度通常取相似度的中位数;通过节点之间的双向信息传递直至收敛,得到聚类中心集合,使得网络全局函数最大,如公式Ⅱ所示:
其中,F为所有数据点聚类中心点的集合,arg max为当因变量最大时求变量的函数,ci为数据点i的聚类中心点,表示第i个点到其对应的类代表点ci之间的相似度。hk是对潜在代表点ck的惩罚值,表示若数据点ci选择数据点k作为其类代表点,即ci=k,那么数据点k必须选择自身作为聚类中心点,即ck=k;否则,数据点k不能成为聚类中心点;
在AP聚类算法迭代过程中传递两类信息,每种消息考虑不同类型的竞争,分别为吸引度信息ri,k和归属度信息ai,k;其中,ri,k表示从数据点i发送信息到数据点k,表示数据点k适合作为数据点i的聚类中心的程度;ai,k表示从数据点k发送信息到数据点i,描述数据点i选择数据点k作为聚类中心的适合程度;通过建立和聚类准则函数对应的因子图模型,应用置信传播理论进行信息的更新,使得因子图的全局函数最大,完成聚类;其信息更新过程按照公式Ⅲ:
其中,←表示信息更新过程中的赋值操作,k'表示所有满足k'≠k条件的数据点,i'表示所有满足i'≠{i,k}或i'≠k条件的数据点;当算法收敛或达到一定的迭代次数时,每个数据点i的聚类中心ci,当且仅当k满足公式Ⅳ。
步骤c、自动划分时间区间的具体方法为:通过步骤2识别的道路网络交通模式,假设第m个交通模式时间序列zm,i表示第m个交通模式在时间间隔i的交通条件;时间序列分区的目的是划分到km个不相交的同质类表示将第m个交通模式划分的第i个时间分区,km表示第m个交通模式时间序列的分区个数,可在迭代过程中通过计算平均轮廓系数来自动确定,nm,j表示第m个交通模式下第j个分区的样本数;针对序列数据聚类问题,定义如公式Ⅴ的映射关系:
其中,b为时间序列分区边界点的集合,为映射符号,bj为第m个交通模式下第j个分区的左边界;可定义一个准则函数Jm来度量分区的质量,通过寻找一个分区策略使得准则函数达到最优;准则函数Jm的定义如公式Ⅵ:
其中,Hm,j描述了分区的异质性,μm,j为分区的均值,最小化准则函数直到分区边界点不再移动;在每一步的迭代过程中,引入严格的顺序限制,聚类中前半部分的样本只允许移动到后半部分的样本只允许移动到在聚类中样本zm,j移动到聚类产生的准则函数的变化如公式Ⅶ计算:
当且仅当ΔJ(zj,j,l)<0,才重新分配该样本并更新聚类均值和准则函数的值,此时如公式Ⅷ所示:其中,zj为第m个交通模式在第j个分区的交通条件,μj为分区的均值,nj为第j个分区的样本数,l表示第l个分区。
步骤d、STKNN模型的建立方法包括步骤:样本构建、距离函数定义、候选邻居选取、预测函数定义、预测值生成。
样本构建的方法为:利用时空状态矩阵表征道路片段每一时刻的交通条件,所有历史时刻的交通条件数据则堆叠形成时空三维立方体,并划分为历史时空数据集、训练时空数据集、测试时空数据集;
假设Ym,j为第m个交通模式的第j个分区的历史交通条件数据集,即Ym,j为整个道路网络的历史交通条件的子集,仅取对应交通模式下的时间区间的交通条件构建预测模型;其中,Nm为第m个交通模式的道路片段数目;Tm,j为第m 个交通模式中第j个分区的时间间隔数目,Tm,j=nm,j;为了便于后续计算,我们将Ym,j进行重排,将所有历史天的时间区间按时间顺序排成一列,形成其中Yrm,j表示第m个交通模式的第j个分区所有道路片段的历史交通条件矩阵,Trm,j=D×Tm,j,Trm,j为第m个交通模式中第j个分区在历史总天数的时间间隔数目,即将3维张量转化为2维矩阵;
以第m个交通模式的第j个分区的历史交通条件数据集为例,道路片段u在时间间隔t的时空状态矩阵可定义为其中,ln表示道路片段u 的空间邻居个数,lc表示时间窗口的长度,ln∈[1,Nm],lc∈[1,Trm,j];为了便于描述,令G=Yrm,j,则Gu表示第m个交通模式的第j个分区下第u个道路片段所有历史天的交通条件时间序列;
在空间维度,采用互相关函数来选取空间邻居,给定两个道路片段u和v,互相关函数可定义为如公式Ⅸ:
其中,为时间序列Gu和时间序列GV在延迟的互相关系数,μu和μv分别为Gu和Gv的均值,σu和σv分别为Gu和GV的标准差,E表示数学期望;通过公式Ⅸ可以看到,互相关函数可看作关于时间延迟的函数,使得互相关函数取值最大的时间延迟值即为周围路段v对预测路段u影响的平均延迟时间,即满足公式Ⅹ:
其中,ψv为平均延迟时间,当且仅当ψv在预测时间范围Δt内,才能对预测道路片段产生影响,即可被选为目标道路片段的空间邻居,形式化定义如公式Ⅺ:
其中,为道路片段u的空间邻居的集合,在逻辑符号中含义为任意一个;
在时间维度,采用自相关函数确定时间窗口的大小;给定预测道路片段 u,在时间延迟δ下的自相关函数ρu(δ)可定义为公式Ⅻ:
其中,E表示数学期望,Gu,t表示第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t的交通条件时间序列,μu为Gu的均值,σu为Gu的标准差,Gu,t-δ为第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t不受时间延迟δ影响的交通条件时间序列;
在利用自相关选取时间窗口时,保证在最大延迟范围内,交通条件具有显著的时间依赖性;然后在此范围内,采用交叉验证,选取使得预测模型误差最小的时间延迟,即为最优的时间窗口大小;在获取了空间邻居和时间窗口,按照时间顺序堆叠每个时间间隔的时空状态矩阵,则可得到3维的时空张量,然后按照设定的训练天数和测试天数,可将时空张量划分为历史时空张量、训练时空张量、测试时空张量;
距离函数定义的方法为:分别在时空状态矩阵的时间和空间维度赋予权重来构造权重欧几里得距离函数;采用时空权重欧几里得距离函数来为预测道路片段选取候选邻居;时空权重矩阵的定义如下:在时间维度,按照时间的线性分布赋值道路片段u的时间权重其中ti和tj分别表示时间权重矩阵中第ti和tj个值;在空间维度,利用互相关系数表示空间权重其中si 和sj表示空间权重矩阵中第si和sj个值;时空权重的分配方式如公式ⅩⅢ所示:
通过在时空状态矩阵中引入时空权重,时空权重欧几里得距离函数Γu,t定义如公式ⅩⅣ:
其中,MCu,t定义为道路片段u在时间间隔t的时空状态矩阵;
候选邻居选取方法为:通过计算时空状态矩阵之间的欧几里得距离,得到预测道路的个候选邻居;通过计算任意两个时空状态矩阵MCu,t和MCu,tk之间的权重欧几里得距离d(Γu,t,Γu,tk),MCu,t和MCu,tk分别表示道路片段u在时间间隔t和tk的时空状态矩阵;选取个距离最小的时空状态矩阵,则可得到预测道路的个候选邻,如公式ⅩⅤ:
其中,trac表示矩阵的迹;Γu,t,Γu,tk表示道路片段u在时间间隔t和tk的时空权重状态矩阵;
预测函数定义的方法为:利用高斯函数为选取的个候选邻居分配不同的权重,从而整合得到目标道路片段u的预测值如公式ⅩⅥ所示:
其中,表示预测道路片段的第个候选邻居下一时刻的交通条件,为预测道路片段的第个候选邻居的权重,个候选邻居与预测道路片段之间的距离;a为高斯权重参数,采用交叉验证的方式,选取使得预测误差最小的a值作为其参数值;
预测值生成的方法为:整合个候选邻居下一时刻的交通条件值得到目标道路片段交通条件的预测值。
本发明通过对各路段各时段交通条件的整合与分析实现了对道路拥堵预测的功能;AP聚类算法来自动识别道路网络存在的交通模式,使得相同聚类的道路片段具有强的空间相关性,从而简化了预测模型的输入;利用K-Means算法来为每种交通模式划分时间区间,通过比较不同道路片段在不同交通模式的时间区间下交通条件的差异性,来刻画时间非平稳性特征,从而解决了现有技术采用人为划分时间区间的方式或者针对整个时间范围建模存在的问题。在此基础上,我们提出三维时空张量数据模型来表征交通条件,考虑道路网络存在的空间异质性,为每个道路片段构建自适应的STKNN模型,实现了短时交通的高效预测。本发明可以直接帮助交通管理部门制定合理和高效的策略来缓解交通拥堵,实现道路网络交通流量的再分配,同时可以帮助大众实现准确的路径规划。
附图说明
图1为本发明的总体步骤流程图。
图2为图1中聚类和分区后交通模式1下的效果参考图。
图3为图1中聚类和分区后交通模式N下的效果参考图。
具体实施方式
下面结合具体实施方式对本发明作进一步详细的说明。
如图1~3所示的一种基于动态STKNN模型的短时交通预测方法,方法的整体步骤为:
a、特征表示:构建表示所有道路片段历史时刻交通条件的三维张量,三维张量的每一个切面代表每个道路片段所有历史天的交通条件变化曲线;通过对每个道路片段历史天的交通条件求平均值,利用平均速度向量来对每个道路片段进行特征表示;
假设道路网络存在N条道路片段,道路片段u的历史交通条件Xu可表示为其中,表示维度为D×T的二维实数集,表示道路片段u在第i天的时间序列,D表示历史总天数,T表示一天中总的时间间隔,例如按照5分钟的时间间隔进行采样,则T=288。因此,整个道路网络的历史交通条件可以用一个三维张量X表示,则Xu,d,t表示道路片段u在第d天t时刻的交通条件值,表示维度为 N×D×T的实数集。对每个道路片段所有历史天的对应时间间隔的交通条件求平均,利用平均时间序列来表示每个道路片段的历史交通条件的平均变化模式,其形式化表示如公式Ⅰ,其中∑为求和符号。
b、交通模式自动识别:通过AP聚类算法自动识别道路网络相似的交通模式;通过步骤1对每个道路片段的历史交通条件特征进行表示后,本发明采用 AP聚类算法来识别道路片段相似的交通模式。将所有交通条件的特征数据集表示为U,可以将看作T维空间内的1个数据点,则待聚类的数据点可用索引表示为{1,2,...,N}。AP聚类算法将所有样本点看作网络中的节点,输入相似度矩阵S,i,k∈[1,N],其中si,k表示数据点i和数据点k之间的相似度,使用欧式距离的负值表示,si,k的值越大表示数据点i与数据点k的距离越近,数据点k作为数据点i的聚类中心的能力越强。sk,k称为偏好度,作为数据点k能否成为代表点的评判标准,该值越大表明该点成为代表点的可能性越大,偏好度通常取相似度的中位数。通过节点之间的双向信息传递直至收敛,得到聚类中心集合,使得网络全局函数最大,如公式Ⅱ所示:
其中,F为所有数据点聚类中心点的集合,arg max为当因变量最大时求变量的函数,ci为数据点i的聚类中心点,表示第i个点到其对应的类代表点 ci之间的相似度。hk是对潜在代表点ck的惩罚值,表示若数据点ci选择数据点k作为其类代表点,即ci=k,那么数据点k必须选择自身作为聚类中心点,即ck=k;否则,数据点k不能成为聚类中心点。
在AP聚类算法迭代过程中传递两类信息,每种消息考虑不同类型的竞争,分别为吸引度信息ri,k和归属度信息ai,k。其中,ri,k表示从数据点i发送信息到数据点k,表示数据点k适合作为数据点i的聚类中心的程度;ai,k表示从数据点k发送信息到数据点i,描述数据点i选择数据点k作为聚类中心的适合程度。通过建立和聚类准则函数对应的因子图模型,应用置信传播理论进行信息的更新,使得因子图的全局函数最大,完成聚类。其信息更新过程按照公式Ⅲ:
其中,←表示信息更新过程中的赋值操作,k'表示所有满足k'≠k条件的数据点,i'表示所有满足i'≠{i,k}或i'≠k条件的数据点;当算法收敛或达到一定的迭代次数时,每个数据点i的聚类中心ci,当且仅当k满足公式Ⅳ:
c、自动划分时间区间:针对自动识别出的多种交通模式,通过K-Means算法自动划分时间区间,用于比较不同时间区间交通条件的变化差异;通过步骤 2识别的道路网络交通模式,本发明利用Warped K-Means算法得到每种交通模式的时间区间划分策略。假设第m个交通模式时间序列zm,i表示第m个交通模式在时间间隔i的交通条件。时间序列分区的目的是划分到km个不相交的同质类 1<km<<T,表示将第m个交通模式划分的第i个分区。其中,km表示第m 个交通模式时间序列的分区个数,可在迭代过程中通过计算平均轮廓系数来自动确定,nm,j表示第m个交通模式下第j个分区的样本数,j∈[1,km]。针对序列数据聚类问题,定义如公式Ⅴ的映射关系:
其中,b为时间序列分区边界点的集合,为映射符号,bj为第m个交通模式下第j个分区的左边界。可定义一个准则函数Jm来度量分区的质量,通过寻找一个分区策略使得准则函数达到最优。准则函数Jm的定义如公式Ⅵ:
其中,Hm,j描述了分区的异质性,μm,j为分区的均值。利用取样迭代优化策略来最小化准则函数,直到分区边界点不再移动。在每一步的迭代过程中,引入严格的顺序限制,聚类中前半部分的样本只允许移动到后半部分的样本只允许移动到在聚类中样本zm,j移动到聚类产生的准则函数的变化按照如下公式Ⅶ计算:
当且仅当ΔJ(zj,j,l)<0,才重新分配该样本并更新聚类均值和准则函数的值,此时如公式Ⅷ所示:其中,zj为第m个交通模式在第j个分区的交通条件,μj为分区的均值,nj为第j个分区的样本数,l表示第l个分区。
d、自适应的STKNN模型:针对步骤2和步骤3获取的每个交通模式的每个时间区间,分别构建STKNN模型。
通过步骤2自动识别道路网路的交通模式以及步骤3获取每种交通模式的分区策略,考虑空间异质性和时间非平稳性的存在,本发明针对不同模式下不同时间区间中的不同道路片段构建自适应的STKNN模型,以实现短时交通的预测。具体包括如下步骤:
a、样本构建;利用时空状态矩阵表征道路片段每一时刻的交通条件,所有历史时刻的交通条件数据则堆叠形成时空三维立方体,并划分为历史时空数据集、训练时空数据集、测试时空数据集;假设Ym,j为第m个交通模式的第j 个分区的历史交通条件数据集,即Ym,j为整个道路网络的历史交通条件的子集,仅取对应交通模式下的时间区间的交通条件构建预测模型。其中,Nm为第m个交通模式的道路片段数目;Tm,j为第m个交通模式的第j个分区的时间间隔数目,Tm,j=nm,j。为了便于后续计算,我们将Ym,j进行重排,将所有历史天的时间区间按时间顺序排成一列,形成其中Yrm,j表示第m个交通模式的第j个分区所有道路片段的历史交通条件矩阵,Trm,j=D×Tm,j,Trm,j为第m个交通模式中第j个分区在历史总天数的时间间隔数目,即将3维张量转化为2维矩阵。
在道路网络中,道路片段的交通条件通常受其周围道路片段的影响,同时在时间维度具有时间依赖性。因此,本发明利用时空状态矩阵来表征每个道路片段每个时间间隔的交通条件。确定时空状态矩阵的关键在于如何确定空间邻居和时间窗口。以第m个交通模式的第j个分区的历史交通条件数据集为例,道路片段u在时间间隔t的时空状态矩阵可定义为其中,ln表示道路片段u的空间邻居个数,lc表示时间窗口的长度,ln∈[1,Nm],lc∈[1,Trm,j]。为了便于描述,令G=Yrm,j,则Gu表示第m个交通模式的第j个分区下第u个道路片段所有历史天的交通条件时间序列,
在空间维度,本发明采用互相关函数来选取空间邻居,给定两个道路片段 u和v,互相关函数可定义为如公式Ⅸ:
其中,为时间序列Gu和时间序列GV在延迟的互相关系数,μu和μv分别为Gu和Gv的均值,σu和σv分别为Gu和GV的标准差,E表示数学期望。通过公式Ⅸ可以看到,互相关函数可看作关于时间延迟的函数,使得互相关函数取值最大的时间延迟值即为周围路段v对预测路段u影响的平均延迟时间,即满足公式Ⅹ:
其中,ψv为平均延迟时间,当且仅当ψv在预测时间范围Δt内,才能对预测道路片段产生影响,即可被选为目标道路片段的空间邻居,形式化定义如公式Ⅺ:
其中,为道路片段u的空间邻居的集合,在逻辑符号中含义为任意一个。
在时间维度,本发明采用自相关函数确定时间窗口的大小。给定预测道路片段u,在时间延迟δ下的自相关函数ρu(δ)可定义为公式Ⅻ:
其中,E表示数学期望,Gu,t表示第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t的交通条件时间序列,μu为Gu的均值,σu为Gu的标准差,Gu,t-δ为第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t不受时间延迟δ影响的交通条件时间序列。
在利用自相关选取时间窗口时,保证在最大延迟范围内,交通条件具有显著的时间依赖性。然后在此范围内,采用交叉验证,选取使得预测模型误差最小的时间延迟,即为最优的时间窗口大小。在获取了空间邻居和时间窗口,按照时间顺序堆叠每个时间间隔的时空状态矩阵,则可得到3维的时空张量,然后按照设定的训练天数和测试天数,可将时空张量划分为历史时空张量、训练时空张量、测试时空张量。
b、距离函数定义;分别在时空状态矩阵的时间和空间维度赋予权重来构造权重欧几里得距离函数;本发明采用时空权重欧几里得距离函数来为预测道路片段选取候选邻居。时空权重矩阵的定义如下:在时间维度,按照时间的线性分布赋值道路片段u的时间权重其中ti和tj分别表示时间权重矩阵中第ti和tj个值。在空间维度,利用互相关系数表示空间权重其中 si和sj表示空间权重矩阵中第si和sj个值;时空权重的分配方式如公式ⅩⅢ所示:
通过在时空状态矩阵中引入时空权重,时空权重欧几里得距离函数Γu,t定义如公式ⅩⅣ:
c、候选邻居选取;通过计算时空状态矩阵之间的欧几里得距离,得到预测道路的个候选邻居;通过计算任意两个时空状态矩阵MCu,t和MCu,tk之间的权重欧几里得距离d(Γu,t,Γu,tk),MCu,t和MCu,tk表示道路片段u在时间间隔t和tk 的时空状态矩阵。选取个距离最小的时空状态矩阵,则可得到预测道路的个候选邻,如公式ⅩⅤ:
其中,trac表示矩阵的迹;Γu,t,Γu,tk表示道路片段u在时间间隔t和tk的时空权重状态矩阵。
d、预测函数定义;利用高斯函数为选取的个候选邻居分配不同的权重,从而整合得到目标道路片段u的预测值如公式ⅩⅥ。
其中,表示预测道路片段的第个候选邻居下一时刻的交通条件,为预测道路片段的第个候选邻居的权重,个候选邻居与预测道路片段之间的距离。a为高斯权重参数,采用交叉验证的方式,选取使得预测误差最小的a值作为其参数值,a=0.029。
e、预测值生成;整合个候选邻居下一时刻的交通条件值得到目标道路片段交通条件的预测值。
本发明相比现有技术主要有以下优点:
a、本发明通过AP聚类算法来自动识别道路网络存在的交通模式,使得相同聚类的道路片段具有强的空间相关性,从而简化了预测模型的输入;
b、K-Means算法来为每种交通模式划分时间区间,通过比较不同道路片段在不同交通模式的时间区间下交通条件的差异性,来刻画时间非平稳性特征,从而解决了现有技术采用人为划分时间区间的方式或者针对整个时间范围建模存在的问题;
c、我们提出三维时空张量数据模型来表征交通条件,考虑道路网络存在的空间异质性,为每个道路片段构建自适应的STKNN模型,实现了短时交通的高效预测;
d、本发明可以直接帮助交通管理部门制定合理和高效的策略来缓解交通拥堵,实现道路网络交通流量的再分配,同时可以帮助大众实现准确的路径规划。
上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。

Claims (10)

1.一种基于动态STKNN模型的短时交通预测方法,其特征在于:所述方法的整体步骤为:
a、特征表示:构建表示所有道路片段历史时刻交通条件的三维张量,三维张量的每一个切面代表每个道路片段所有历史天的交通条件变化曲线;通过对每个道路片段历史天的交通条件求平均值,利用平均速度向量来对每个道路片段进行特征表示;
b、交通模式自动识别:通过AP聚类算法自动识别道路网络相似的交通模式;
c、自动划分时间区间:针对自动识别出的多种交通模式,通过K-Means算法自动划分时间区间,用于比较不同时间区间交通条件的变化差异;
d、构建自适应的STKNN模型:针对步骤b和步骤c获取的每个交通模式的每个时间区间,分别构建STKNN模型。
2.根据权利要求1所述的基于动态STKNN模型的短时交通预测方法,其特征在于:所述步骤a、特征表示的具体方法为:假设道路网络存在N条道路片段,道路片段u的历史交通条件Xu可表示为其中,表示维度为D×T的二维实数集,表示道路片段u在第i天的时间序列,D表示历史总天数,T表示一天中总的时间间隔,因此,整个道路网络的历史交通条件可以用一个三维张量X表示,则Xu,d,t表示道路片段u在第d天t时刻的交通条件值,表示维度为N×D×T的实数集;对每个道路片段所有历史天的对应时间间隔的交通条件求平均,利用平均时间序列来表示每个道路片段的历史交通条件的平均变化模式,其形式化表示如公式Ⅰ,其中∑为求和符号。
3.根据权利要求1所述的基于动态STKNN模型的短时交通预测方法,其特征在于:所述步骤b中的AP聚类算法具体为:将所有交通条件的特征数据集表示为U,可以将看作T维空间内的1个数据点,则待聚类的数据点可用索引表示为{1,2,...,N};将所有样本点看作网络中的节点,输入相似度矩阵S,其中si,k表示数据点i和数据点k之间的相似度,si,k的值越大表示数据点i与数据点k的距离越近,数据点k作为数据点i的聚类中心的能力越强;sk,k称为偏好度,作为数据点k能否成为代表点的评判标准,该值越大表明该点成为代表点的可能性越大,偏好度通常取相似度的中位数;通过节点之间的双向信息传递直至收敛,得到聚类中心集合,使得网络全局函数最大,如公式Ⅱ所示:
其中,F为所有数据点聚类中心点的集合,argmax为当因变量最大时求变量的函数,ci为数据点i的聚类中心点,表示第i个点到其对应的类代表点ci之间的相似度。hk是对潜在代表点ck的惩罚值,表示若数据点ci选择数据点k作为其类代表点,即ci=k,那么数据点k必须选择自身作为聚类中心点,即ck=k;否则,数据点k不能成为聚类中心点;
在AP聚类算法迭代过程中传递两类信息,每种消息考虑不同类型的竞争,分别为吸引度信息ri,k和归属度信息ai,k;其中,ri,k表示从数据点i发送信息到数据点k,表示数据点k适合作为数据点i的聚类中心的程度;ai,k表示从数据点k发送信息到数据点i,描述数据点i选择数据点k作为聚类中心的适合程度;通过建立和聚类准则函数对应的因子图模型,应用置信传播理论进行信息的更新,使得因子图的全局函数最大,完成聚类;其信息更新过程按照公式Ⅲ:
其中,←表示信息更新过程中的赋值操作,k'表示所有满足k'≠k条件的数据点,i'表示所有满足i'≠{i,k}或i'≠k条件的数据点;当算法收敛或达到一定的迭代次数时,每个数据点i的聚类中心ci,当且仅当k满足公式Ⅳ。
4.根据权利要求1所述的基于动态STKNN模型的短时交通预测方法,其特征在于:所述步骤c中通过K-Means算法自动划分时间区间的具体方法为:通过步骤2识别的道路网络交通模式,假设第m个交通模式时间序列zm,i表示第m个交通模式在时间间隔i的交通条件;时间序列分区的目的是划分到km个不相交的同质类1<km<<T,表示将第m个交通模式划分的第i个时间分区,km表示第m个交通模式时间序列的分区个数,可在迭代过程中通过计算平均轮廓系数来自动确定,nm,j表示第m个交通模式下第j个分区的样本数;针对序列数据聚类问题,定义如公式Ⅴ的映射关系:
其中,b为时间序列分区边界点的集合,为映射符号,bj为第m个交通模式下第j个分区的左边界;可定义一个准则函数Jm来度量分区的质量,通过寻找一个分区策略使得准则函数达到最优;准则函数Jm的定义如公式Ⅵ:
其中,Hm,j描述了分区的异质性,μm,j为分区的均值,最小化准则函数直到分区边界点不再移动;在每一步的迭代过程中,引入严格的顺序限制,聚类中前半部分的样本只允许移动到后半部分的样本只允许移动到在聚类中样本zm,j移动到聚类产生的准则函数的变化如公式Ⅶ计算:
当且仅当ΔJ(zj,j,l)<0,才重新分配该样本并更新聚类均值和准则函数的值,此时如公式Ⅷ所示:其中,zj为第m个交通模式在第j个分区的交通条件,μj为分区的均值,nj为第j个分区的样本数,l表示第l个分区。
5.根据权利要求1所述的基于动态STKNN模型的短时交通预测方法,其特征在于:所述步骤d中STKNN模型的建立方法包括步骤:样本构建、距离函数定义、候选邻居选取、预测函数定义、预测值生成。
6.根据权利要求5所述的基于动态STKNN模型的短时交通预测方法,其特征在于:所述样本构建的方法为:利用时空状态矩阵表征道路片段每一时刻的交通条件,所有历史时刻的交通条件数据则堆叠形成时空三维立方体,并划分为历史时空数据集、训练时空数据集、测试时空数据集;
假设Ym,j为第m个交通模式的第j个分区的历史交通条件数据集,即Ym,j为整个道路网络的历史交通条件的子集,仅取对应交通模式下的时间区间的交通条件构建预测模型;其中,Nm为第m个交通模式的道路片段数目;Tm,j为第m个交通模式中第j个分区的时间间隔数目,Tm,j=nm,j;为了便于后续计算,我们将Ym,j进行重排,将所有历史天的时间区间按时间顺序排成一列,形成其中Yrm,j表示第m个交通模式的第j个分区所有道路片段的历史交通条件矩阵,Trm,j=D×Tm,j,Trm,j为第m个交通模式中第j个分区在历史总天数的时间间隔数目,即将3维张量转化为2维矩阵;
以第m个交通模式的第j个分区的历史交通条件数据集为例,道路片段u在时间间隔t的时空状态矩阵可定义为其中,ln表示道路片段u的空间邻居个数,lc表示时间窗口的长度,ln∈[1,Nm],lc∈[1,Trm,j];为了便于描述,令G=Yrm,j,则Gu表示第m个交通模式的第j个分区下第u个道路片段所有历史天的交通条件时间序列;
在空间维度,采用互相关函数来选取空间邻居,给定两个道路片段u和v,互相关函数可定义为如公式Ⅸ:
其中,为时间序列Gu和时间序列GV在延迟的互相关系数,μu和μv分别为Gu和Gv的均值,σu和σv分别为Gu和GV的标准差,E表示数学期望;通过公式Ⅸ可以看到,互相关函数可看作关于时间延迟的函数,使得互相关函数取值最大的时间延迟值即为周围路段v对预测路段u影响的平均延迟时间,即满足公式Ⅹ:
其中,ψv为平均延迟时间,当且仅当ψv在预测时间范围Δt内,才能对预测道路片段产生影响,即可被选为目标道路片段的空间邻居,形式化定义如公式Ⅺ:
其中,为道路片段u的空间邻居的集合, 在逻辑符号中含义为任意一个;
在时间维度,采用自相关函数确定时间窗口的大小;给定预测道路片段u,在时间延迟δ下的自相关函数ρu(δ)可定义为公式Ⅻ:
其中,E表示数学期望,Gu,t表示第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t的交通条件时间序列,μu为Gu的均值,σu为Gu的标准差,Gu,t-δ为第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t不受时间延迟δ影响的交通条件时间序列;
在利用自相关选取时间窗口时,保证在最大延迟范围内,交通条件具有显著的时间依赖性;然后在此范围内,采用交叉验证,选取使得预测模型误差最小的时间延迟,即为最优的时间窗口大小;在获取了空间邻居和时间窗口,按照时间顺序堆叠每个时间间隔的时空状态矩阵,则可得到3维的时空张量,然后按照设定的训练天数和测试天数,可将时空张量划分为历史时空张量、训练时空张量、测试时空张量。
7.根据权利要求5所述的基于动态STKNN模型的短时交通预测方法,其特征在于:所述距离函数定义的方法为:分别在时空状态矩阵的时间和空间维度赋予权重来构造权重欧几里得距离函数;采用时空权重欧几里得距离函数来为预测道路片段选取候选邻居;时空权重矩阵的定义如下:在时间维度,按照时间的线性分布赋值道路片段u的时间权重其中ti和tj分别表示时间权重矩阵中第ti和tj个值;在空间维度,利用互相关系数表示空间权重其中si和sj表示空间权重矩阵中第si和sj个值;时空权重的分配方式如公式ⅩⅢ所示:
通过在时空状态矩阵中引入时空权重,时空权重欧几里得距离函数Γu,t定义如公式ⅩⅣ:
其中,MCu,t定义为道路片段u在时间间隔t的时空状态矩阵。
8.根据权利要求5所述的基于动态STKNN模型的短时交通预测方法,其特征在于:所述候选邻居选取的方法为:通过计算时空状态矩阵之间的欧几里得距离,得到预测道路的个候选邻居;通过计算任意两个时空状态矩阵MCu,t和MCu,tk之间的权重欧几里得距离d(Γu,t,Γu,tk),MCu,t和MCu,tk分别表示道路片段u在时间间隔t和tk的时空状态矩阵;选取个距离最小的时空状态矩阵,则可得到预测道路的个候选邻,如公式ⅩⅤ:
其中,trac表示矩阵的迹;Γu,t,Γu,tk表示道路片段u在时间间隔t和tk的时空权重状态矩阵。
9.根据权利要求5所述的基于动态STKNN模型的短时交通预测方法,其特征在于:所述预测函数定义的方法为:利用高斯函数为选取的个候选邻居分配不同的权重,从而整合得到目标道路片段u的预测值如公式ⅩⅥ所示:
其中,表示预测道路片段的第个候选邻居下一时刻的交通条件,为预测道路片段的第个候选邻居的权重,个候选邻居与预测道路片段之间的距离;a为高斯权重参数,采用交叉验证的方式,选取使得预测误差最小的a值作为其参数值。
10.根据权利要求5所述的基于动态STKNN模型的短时交通预测方法,其特征在于:所述预测值生成的方法为:整合个候选邻居下一时刻的交通条件值得到目标道路片段交通条件的预测值。
CN201811547414.0A 2018-12-18 2018-12-18 一种基于动态stknn模型的短时交通预测方法 Active CN109598936B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811547414.0A CN109598936B (zh) 2018-12-18 2018-12-18 一种基于动态stknn模型的短时交通预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811547414.0A CN109598936B (zh) 2018-12-18 2018-12-18 一种基于动态stknn模型的短时交通预测方法

Publications (2)

Publication Number Publication Date
CN109598936A true CN109598936A (zh) 2019-04-09
CN109598936B CN109598936B (zh) 2020-01-10

Family

ID=65963012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811547414.0A Active CN109598936B (zh) 2018-12-18 2018-12-18 一种基于动态stknn模型的短时交通预测方法

Country Status (1)

Country Link
CN (1) CN109598936B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287989A (zh) * 2019-05-21 2019-09-27 武汉大学 一种基于轮廓系数和ap聚类算法的离散覆盖仓库选址方法
CN110299005A (zh) * 2019-06-10 2019-10-01 浙江大学 一种基于深度集成学习的城市大规模路网交通速度预测方法
CN110428614A (zh) * 2019-07-11 2019-11-08 银江股份有限公司 一种基于非负张量分解的交通拥堵热度时空预测方法
CN111915877A (zh) * 2019-05-08 2020-11-10 阿里巴巴集团控股有限公司 一种车流路径分布信息的处理方法、装置及电子设备
CN111986489A (zh) * 2019-11-07 2020-11-24 深圳鼎然信息科技有限公司 交通工具的智能安全预警方法、装置、系统及存储介质
CN113420414A (zh) * 2021-05-27 2021-09-21 四川大学 一种基于动态时空分析的短时交通流预测模型
CN113553350A (zh) * 2021-05-27 2021-10-26 四川大学 一种相似演化模式聚类及动态时区划分的交通流分区模型
CN114255591A (zh) * 2021-12-17 2022-03-29 重庆中信科信息技术有限公司 考虑时空相关性的短时交通流预测方法、装置及存储介质
CN116682262A (zh) * 2023-06-14 2023-09-01 中国科学院地理科学与资源研究所 一种多模式交通成本评价方法
US20230294728A1 (en) * 2022-03-18 2023-09-21 Gm Cruise Holdings Llc Road segment spatial embedding

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004185305A (ja) * 2002-12-03 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> 交通渋滞予測方法、交通渋滞予測装置、交通渋滞予測プログラム、およびそのプログラムを記録した記録媒体
JP4098526B2 (ja) * 2002-01-10 2008-06-11 株式会社アイ・トランスポート・ラボ 交通情報提供システム及びその方法、交通情報提供プログラム
CN103903452A (zh) * 2014-03-11 2014-07-02 东南大学 交通流短时预测方法
CN105701571A (zh) * 2016-01-13 2016-06-22 南京邮电大学 一种基于神经网络组合模型的短时交通流量预测方法
CN106022385A (zh) * 2016-05-26 2016-10-12 华南理工大学 基于动态规划和K-means聚类的特征选择算法
CN106128100A (zh) * 2016-06-30 2016-11-16 华南理工大学 一种基于Spark平台的短时交通流量预测方法
CN106530685A (zh) * 2015-09-11 2017-03-22 杭州海康威视数字技术股份有限公司 一种交通数据短时预测方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4098526B2 (ja) * 2002-01-10 2008-06-11 株式会社アイ・トランスポート・ラボ 交通情報提供システム及びその方法、交通情報提供プログラム
JP2004185305A (ja) * 2002-12-03 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> 交通渋滞予測方法、交通渋滞予測装置、交通渋滞予測プログラム、およびそのプログラムを記録した記録媒体
CN103903452A (zh) * 2014-03-11 2014-07-02 东南大学 交通流短时预测方法
CN106530685A (zh) * 2015-09-11 2017-03-22 杭州海康威视数字技术股份有限公司 一种交通数据短时预测方法及装置
CN105701571A (zh) * 2016-01-13 2016-06-22 南京邮电大学 一种基于神经网络组合模型的短时交通流量预测方法
CN106022385A (zh) * 2016-05-26 2016-10-12 华南理工大学 基于动态规划和K-means聚类的特征选择算法
CN106128100A (zh) * 2016-06-30 2016-11-16 华南理工大学 一种基于Spark平台的短时交通流量预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
伍元凯: "基于动态张量填充的短时交通流预测研究", 《中国优秀硕士学位论文全文数据库》 *
廖赛: "基于近邻路段相关交通状态的短时道路交通速度预测", 《中国优秀硕士学位论文全文数据库》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915877A (zh) * 2019-05-08 2020-11-10 阿里巴巴集团控股有限公司 一种车流路径分布信息的处理方法、装置及电子设备
CN110287989B (zh) * 2019-05-21 2021-04-16 武汉大学 一种基于轮廓系数和ap聚类算法的离散覆盖仓库选址方法
CN110287989A (zh) * 2019-05-21 2019-09-27 武汉大学 一种基于轮廓系数和ap聚类算法的离散覆盖仓库选址方法
CN110299005A (zh) * 2019-06-10 2019-10-01 浙江大学 一种基于深度集成学习的城市大规模路网交通速度预测方法
CN110299005B (zh) * 2019-06-10 2020-11-17 浙江大学 一种基于深度集成学习的城市大规模路网交通速度预测方法
CN110428614A (zh) * 2019-07-11 2019-11-08 银江股份有限公司 一种基于非负张量分解的交通拥堵热度时空预测方法
CN110428614B (zh) * 2019-07-11 2021-02-05 银江股份有限公司 一种基于非负张量分解的交通拥堵热度时空预测方法
CN111986489B (zh) * 2019-11-07 2021-08-03 深圳鼎然信息科技有限公司 交通工具的智能安全预警方法、装置、系统及存储介质
CN111986489A (zh) * 2019-11-07 2020-11-24 深圳鼎然信息科技有限公司 交通工具的智能安全预警方法、装置、系统及存储介质
CN113420414A (zh) * 2021-05-27 2021-09-21 四川大学 一种基于动态时空分析的短时交通流预测模型
CN113553350A (zh) * 2021-05-27 2021-10-26 四川大学 一种相似演化模式聚类及动态时区划分的交通流分区模型
CN113420414B (zh) * 2021-05-27 2022-08-30 四川大学 一种基于动态时空分析的短时交通流预测模型
CN113553350B (zh) * 2021-05-27 2023-07-18 四川大学 一种相似演化模式聚类及动态时区划分的交通流分区模型
CN114255591A (zh) * 2021-12-17 2022-03-29 重庆中信科信息技术有限公司 考虑时空相关性的短时交通流预测方法、装置及存储介质
US20230294728A1 (en) * 2022-03-18 2023-09-21 Gm Cruise Holdings Llc Road segment spatial embedding
CN116682262A (zh) * 2023-06-14 2023-09-01 中国科学院地理科学与资源研究所 一种多模式交通成本评价方法
CN116682262B (zh) * 2023-06-14 2024-03-08 中国科学院地理科学与资源研究所 一种多模式交通成本评价方法

Also Published As

Publication number Publication date
CN109598936B (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN109598936A (zh) 一种基于动态stknn模型的短时交通预测方法
CN105163326B (zh) 一种基于无线网络话务特征的小区聚类方法和系统
CN106600059A (zh) 基于改进rbf神经网络的智能电网短期负荷预测方法
Li et al. A hybrid fingerprint quality evaluation model for WiFi localization
CN106650763A (zh) 一种电力缴费渠道分析的指标选择、权值优化与渠道规划的计算方法
Ghahramani et al. IoT-based route recommendation for an intelligent waste management system
CN109063911A (zh) 一种基于门控循环单元网络的负荷聚合体分组预测方法
CN102024179A (zh) 一种基于半监督学习的ga-som聚类方法
CN107845260B (zh) 一种用户公交出行方式的识别方法
CN103927394A (zh) 一种基于svm的多标签主动学习分类方法及系统
CN113159364A (zh) 一种大型交通场站的客流预测方法及系统
CN109584552A (zh) 一种基于网络向量自回归模型的公交到站时间预测方法
CN106910199A (zh) 面向城市空间信息采集的车联网众包方法
CN116110234B (zh) 基于人工智能的车流量预测方法、装置及其应用
CN109814066A (zh) 基于神经网络学习的rssi室内定位测距方法、室内定位平台
CN110164129A (zh) 基于gernn的单交叉口多车道交通流量预测方法
CN108834079A (zh) 一种在异构网络中基于移动性预测的负载均衡优化方法
CN114444378A (zh) 一种区域风电集群的短期功率预测方法
CN109657147A (zh) 基于萤火虫和加权极限学习机的微博异常用户检测方法
CN110362900A (zh) 一种led寿命的预测方法
CN108717581A (zh) 一种基于蒙特卡罗模拟的水库调度随机多属性决策方法
CN113011630A (zh) 一种大数据配电网台区时空负荷短期预测方法
CN104217296A (zh) 一种上市公司绩效综合评价方法
CN117094535B (zh) 基于人工智能的能源补给管理方法及系统
CN109214610A (zh) 一种基于长短期记忆神经网络的饱和电力负荷预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant