CN115660156A - 一种用于交通站点客流拥堵延误预测的方法及系统 - Google Patents
一种用于交通站点客流拥堵延误预测的方法及系统 Download PDFInfo
- Publication number
- CN115660156A CN115660156A CN202211269386.7A CN202211269386A CN115660156A CN 115660156 A CN115660156 A CN 115660156A CN 202211269386 A CN202211269386 A CN 202211269386A CN 115660156 A CN115660156 A CN 115660156A
- Authority
- CN
- China
- Prior art keywords
- traffic
- data set
- time period
- station
- delay
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Traffic Control Systems (AREA)
Abstract
本发明提出了一种客流拥堵延误的预测方法及系统,属于通勤延误预测技术领域,在历史延误数据集中选取待测时间周期的临近、过去几天同一时间、过去几周同一时间的延误数据,并据这些数据构建交通站点两两之间的显式和隐式交通关系图,使客流拥堵延误预测的输入数据充分考虑交通站点历史时间维度上的时间特征,以及相邻或相关性强的交通站点在空间维度上的空间特征,在此基础上还将外部影响因素的特征参与到客流拥堵延误的预测中,不仅充分考虑了站点自身的历史数据,还要考虑各交通站点之间的时空相关性以及各种外部影响因素,提高了客流拥堵延误预测模型的准确度和适用性。
Description
技术领域
本发明涉及通勤延误预测技术领域,特别是涉及一种客流拥堵延误的预测方法及系统。
背景技术
随着城市现代化的快速发展,各个大城市已普及建设地铁或快速公交这种便利人员出行的交通方式,然而虽然地铁或者快速公交具有载客量大的特点,但在通勤高峰期经常出现供需不平衡。由于车容量和站台的承载能力的限制,高峰时段大量客流在短时间内聚集在线路的某个站点,拥挤导致乘客慢行,满载率高乘客挤不上车导致大量乘客被滞留站台,会延长乘客的等候时间和延误乘客的整体旅行时间。将拥堵造成的出行时间的增加称为客流拥堵延误,对于运营商来说,通过客流拥堵延误预测的结果掌握车站当前实时客流状态,有助于提高乘客的出行体验。
在现实中,交通站点的客流量受地理位置、时间、交通状况等多种因素影响,具有复杂的非线性。对于不同站点,物理位置相邻的站点之间会相互影响,不相邻的站点也可能存在相似的交通模式,对于相同站点,历史交通状况与未来交通状况密切相关。除此之外,客流拥堵情况与出行外部因素如天气状况等之间存在密切关系。因此,准确地预测站点的客流拥堵延误,不仅需要充分考虑站点自身的历史交通数据,还要考虑各站点之间的时空相关性以及各种外部因素。
发明内容
本发明的目的是提供一种客流拥堵延误的预测方法及系统,有效提高了客流拥堵延误预测的准确性。
为实现上述目的,本发明提供了如下方案:
一种客流拥堵延误的预测方法,包括:
获取各交通站点的历史通勤数据。
根据所述历史通勤数据,确定在任一历史时间周期每一交通站点的历史拥堵延误率,得到历史延误数据集;每一交通站点的历史拥堵延误率由以所述交通站点为目的站或起始站的若干个有向交通站点对的历史拥堵延误率确定;所述有向交通站点对的历史拥堵延误率表示由所述有向交通站点对中的起始交通站点到所述有向交通站点对中的目的交通站点的历史拥堵延误率。
根据所述历史延误数据集,确定在待测时间周期的临近延误数据集、日周期延误数据集和周周期延误数据集;所述临近延误数据集中包括所述待测时间周期前若干个时间周期的历史拥堵延误率;所述日周期延误数据集中包括所述待测时间周期前若干日内同一时间周期的历史拥堵延误率;所述周周期延误数据集中包括所述待测时间周期前若干周内同一时间周期的历史拥堵延误率。
根据所述临近延误数据集、所述日周期延误数据集和所述周周期延误数据集中的各交通站点的历史拥堵延误率,计算任意两个交通站点之间的相关性距离。
构造各交通站点之间的交通模式关系图;所述交通模式关系图中包括若干个交通站点以及各交通站点两两之间的相关性距离。
构造各交通站点之间的交通拓扑关系图;所述交通拓扑关系图中包括若干个交通站点以及各交通站点两两之间的连接关系。
对所述待测时间周期内的外部影响因素的特征进行提取,得到外部影响因素特征。
将所述待测时间周期、所述临近延误数据集、所述日周期延误数据集、所述周周期延误数据集、所述交通模式关系图、所述交通拓扑关系图和所述外部影响因素特征输入到客流拥堵延误率预测模型中,预测得到在所述待测时间周期任一交通站点的拥堵延误率。
可选地,所述将所述待测时间周期、所述临近延误数据集、所述日周期延误数据集、所述周周期延误数据集、所述交通模式关系图、所述交通拓扑关系图和所述外部影响因素特征输入到客流拥堵延误率预测模型中,预测得到在所述待测时间周期任一交通站点的拥堵延误率,具体包括:
基于时空注意力机制,对所述临近延误数据集、所述日周期延误数据集和所述周周期延误数据集进行时间和空间上的信息融合,得到注意力增强延误数据集。
对所述交通拓扑关系图、所述交通模式关系图和所述注意力增强延误数据集进行卷积处理,得到各交通站点之间的空间特征矩阵。
基于双向循环层网络对所述空间特征矩阵进行正反两个方向延误率的时间依赖性特征提取,得到时间特征矩阵。
将所述外部影响因素特征、所述空间特征矩阵和所述时间特征矩阵进行融合,得到在所述待测时间周期任一交通站点的拥堵延误率。
可选地,在所述将所述待测时间周期、所述临近延误数据集、所述日周期延误数据集、所述周周期延误数据集、所述交通模式关系图、所述交通拓扑关系图和所述外部影响因素特征输入到客流拥堵延误率预测模型中,预测得到在所述待测时间周期任一交通站点的拥堵延误率之前,所述预测方法还包括:
在所述历史延误数据集中,确定任一历史时间周期为目标时间周期。
根据所述历史延误数据集,确定在所述目标时间周期内的临近延误数据集、日周期延误数据集和周周期延误数据集。
根据所述临近延误数据集、所述日周期延误数据集和所述周周期延误数据集中的各所述交通站点的历史拥堵延误率,计算任意两个交通站点之间的相关性距离。
构造各交通站点之间的交通模式关系图;所述交通模式关系图中包括若干个交通站点以及各交通站点两两之间的相关性距离。
构造各交通站点之间的交通拓扑关系图;所述交通拓扑关系图中包括若干个交通站点以及各交通站点两两之间的连接关系。
对所述目标时间周期内的外部影响因素的特征进行提取,得到外部影响因素特征。
以所述临近延误数据集、所述日周期延误数据集、所述周周期延误数据集、所述交通模式关系图、所述交通拓扑关系图和所述外部影响因素特征作为所述客流拥堵延误率预测模型的输入,以在所述目标时间周期各交通站点的拥堵延误率为目标输出,对所述客流拥堵延误率预测模型进行训练。
可选地,所述根据所述历史通勤数据,确定在任一历史时间周期每一交通站点的历史拥堵延误率,得到历史延误数据集,具体包括:
针对任一交通站点,计算得到在任一历史时间周期通过所述交通站点去到另一交通站点的预估通行时间均值。
根据所述历史通勤数据,计算得到在任一历史时间周期通过所述交通站点去到另一交通站点的实际通行时间均值。
针对任一历史时间周期,根据各乘客在所述历史时间周期通过所述交通站点去到另一交通站点的实际通行时间均值和所述预估通行时间均值,确定各乘客在所述历史时间周期通过所述交通站点的拥堵延误时间。
确定在所述历史时间周期内通过所述交通站点的拥堵延误时间不为零的乘客个数,得到拥堵延误乘客数量。
根据所述历史时间周期内所述交通站点的拥堵延误乘客数量以及所述历史时间周期内所述交通站点的乘客总数,确定所述历史时间周期内所述交通站点的拥堵延误率。
可选地,根据下式计算得到在任一历史时间周期通过所述交通站点去到另一交通站点的预估通行时间均值:
其中,E(tpq)为乘客在任一历史时间周期通过所述交通站点p去到其他交通站点q的预估通行时间均值,p和q取值均为站点总数,为乘客进入交通站点p到候车站台的步行时间均值,为p站的发车间隔时间,为p站的列车运行时间均值,为乘客从候车站台到退出交通站点q的步行时间均值,E(Δtp)为乘客在交通站点p的拥堵延误时间均值。
可选地,根据下式计算得到在所述历史时间周期内所述交通站点的拥堵延误率:
根据下式计算得到历史时间周期xm交通站点p的拥堵延误乘客数量:
可选地,根据下式确定待测时间周期的临近延误数据集:
其中,concat[]为序列拼接函数,t为待测时间周期,αt-1为所述待测时间周期的前一个历史时间周期各交通站点的历史拥堵延误率组成的拥堵延误率序列,lc为所述临近延误数据集中拥堵延误率序列的个数,为实数域,N为站点个数,C表示特征属性个数。
根据下式确定待测时间周期的日周期延误数据集:
其中,pd为日周期跨度,ld为所述日周期延误数据集中拥堵延误率序列的个数。
根据下式确定待测时间周期的周周期延误数据集:
其中,pw为周周期跨度,lw为所述周周期延误数据集中拥堵延误率序列的个数。
可选地,根据下式构造得到各交通站点之间的交通模式关系图:
其中,V为所有交通站点的集合,V={v1,v2,v3,…,vN},Ep为所述交通模式关系图的边集,eij表示交通站点vi和交通站点vj的连线,Ap表示相关性矩阵,wp(i,j)表示交通站点vi和交通站点vj的相关性强度,dtw(i,j)表示使用动态时间规整算法计算的交通站点vi的拥堵延误率序列和交通站点vj的拥堵延误率序列之间的距离,β表示根据动态时间规整算法计算的距离的衰减率。
根据下式构造得到各交通站点之间的交通拓扑关系图:
其中,Er为所述交通拓扑关系图的边集,Ar为邻接矩阵,Ar,ij为交通站点vi和交通站点vj的连接关系,Ar,ij为1,则代表交通站点vi和交通站点vj相邻,Ar,ij为0,则代表交通站点vi和交通站点vj不相邻。
可选地,所述外部影响因素包括天气信息、节假日信息和时间信息;所述对所述待测时间周期内的外部影响因素的特征进行提取,得到外部影响因素特征,具体包括:
对所述天气信息的特征进行提取,得到天气信息特征。
对所述节假日信息的特征进行提取,得到节假日信息特征。
对所述时间信息的特征进行提取,得到时间信息特征。
对应于前述的客流拥堵延误的预测方法,本发明还提供了一种客流拥堵延误的预测系统,所述客流拥堵延误的预测系统在被计算机运行时,执行如前文所述的客流拥堵延误的预测方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的一种客流拥堵延误的预测方法及系统,预测方法包括:获取各交通站点的历史通勤数据;根据历史通勤数据,确定在任一历史时间周期每一交通站点的历史拥堵延误率,得到历史延误数据集;根据历史延误数据集,确定在待测时间周期内各交通站点的临近延误数据集、日周期延误数据集和周周期延误数据集;根据临近延误数据集、日周期延误数据集和周周期延误数据集中的各交通站点的历史拥堵延误率,计算各交通站点两两之间的相关性距离;构造各交通站点之间的交通模式关系图和交通拓扑关系图;对待测时间周期内的外部影响因素的特征进行提取,得到外部影响因素特征;将待测时间周期、临近延误数据集、日周期延误数据集、周周期延误数据集、交通模式关系图、交通拓扑关系图和外部影响因素特征输入到客流拥堵延误率预测模型中,预测得到在待测时间周期任一交通站点的拥堵延误率。本发明提供的客流拥堵延误预测方法,在历史延误数据集中选取待测时间周期的临近、过去几天同一时间、过去几周同一时间的延误数据,并据这些数据构建交通站点之间的交通模式关系图和交通拓扑关系图,使客流拥堵延误预测的输入数据充分考虑交通站点历史时间维度上的时间特征,以及相邻或相关性强的交通站点在空间维度上的空间特征,在此基础上还将外部影响因素的特征参与到客流拥堵延误的预测中,不仅充分考虑了站点自身的历史数据,还考虑各交通站点之间的时空相关性以及各种外部影响因素,提高了客流拥堵延误预测模型的准确度和适用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的一种客流拥堵延误的预测方法的流程图;
图2为本发明实施例1提供的预测方法中步骤S2的流程图;
图3为本发明实施例1提供的预测方法中步骤S7的流程图;
图4为本发明实施例2提供的一种客流拥堵延误的预测系统的结构示意图;
图5为本发明实施例2提供的预测系统中预测模型训练模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
对于运营商来说,通过客流拥堵延误预测的结果掌握车站当前实时客流状态,有助于提高乘客的出行体验。在现实中,交通站点流量受地理位置、时间、交通状况等多种因素影响,具有复杂的非线性。对于不同站点,物理位置相邻的站点之间会相互影响,不相邻的站点也可能存在相似的交通模式,对于相同站点,历史交通状况与未来交通状况密切相关。因此,本发明提供了一种客流拥堵延误的预测方法及系统,不仅充分考虑了各站点自身的历史通勤数据,还考虑各交通站点之间的时空相关性以及各种外部影响因素,提高了客流拥堵延误预测的准确性。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1:
本实施例提供了一种客流拥堵延误的预测方法,如图1所示的流程图,该预测方法包括:
S1、获取各交通站点的历史通勤数据。
S2、根据所述历史通勤数据,确定在任一历史时间周期每一交通站点的历史拥堵延误率,得到历史延误数据集;每一所述交通站点的历史拥堵延误率由以所述交通站点为目的地的若干个有向交通站点对的历史拥堵延误率确定,所述有向交通站点对的历史拥堵延误率表示由所述有向交通站点对中的起始交通站点到所述有向交通站点对中的目的交通站点的历史拥堵延误率;如图2所示的流程图,步骤S2,具体包括:
S21、针对任一交通站点,计算得到在任一历史时间周期通过所述交通站点去到另一交通站点的预估通行时间均值。
在未发生拥堵时,对于乘客从进入一起始交通站点开始,到走出一目的交通站点,完成一次通行,所需要考虑到的时间包括:从进入起始交通站点入口步行走到起始交通站点候车站台的时间在候车站台等待的时间 是一个近似的均匀分布U(0,Hnormal),Hnormal为非高峰时间段的发车间隔时间、上车后移动到目的交通站点的列车运行时间以及到站下车后从目的交通展台的候车站台步行走到目的交通展台出口的时间乘客的步行时间服从正态分布N(μ,σ2),如下式所示:
但是当乘客出行时间遭遇早高峰或晚高峰这种客流高峰时间的时候,在原先时间的基础上,还要算上因客流拥堵而延误的时间Δtp,如下式所示:
在本实施例中,将所有乘客的消耗的各种时间和最终通行时间求均值,并将乘客的在候车站台的等待时间近似为站点发车间隔时间的一半,根据下式计算得到乘客在任一历史时间周期通过起始交通站点p去到其他目的交通站点q的预估通行时间均值:
其中,E’(tpq)为乘客在任一历史时间周期通过交通站点p去到另一交通站点q的预估通行时间均值,p和q取值均为站点总数,为乘客进入交通站点p到候车站台的步行时间均值,为高峰时段下p站的发车间隔时间,为p站的列车运行时间均值,当车辆按时间表运行时 为乘客从候车站台到走出交通站点q的步行时间均值,E(Δtp)为乘客在p站的拥堵延误时间均值。
S22、根据所述历史通勤数据,计算得到任一乘客在任一历史时间周期通过所述交通站点去到另一交通站点的实际通行时间均值;将时间范围分为k个周期x1,x2,…,xk,对于在时间xm进入交通站点的乘客,其实际通行时间可以通过AFC(Automatic FareCollection System)数据计算得出,如下式所示:
其中,E(tpq)代表乘客在任一历史时间周期通过交通站点p去到另一交通站点q的实际通行时间均值,每一个数据均代表两个站点之间的实际通行时间,如则代表在xm时间周期时,乘客通过第2个站点到第1个站点的实际通行时间。
S23、确定乘客在任一历史时间周期内通过所述交通站点的拥堵延误时间;针对任一历史时间周期,根据各乘客的在任一历史时间周期通过所述交通站点去到另一交通站点的实际通行时间均值和所述预估通行时间均值,确定各乘客在所述历史时间周期内通过所述交通站点的拥堵延误时间;在实际通行时间和预估通行时间均得到后,由于除拥堵延误时间以外均为已知量,则利用二者求差,即可得到拥堵延误时间;本实施例中,根据下式计算拥堵延误时间均值:
S24、确定在所述历史时间周期内通过所述交通站点的拥堵延误时间不为零的乘客个数,得到所述历史时间周期内所述交通站点的拥堵延误乘客数量;本实施例中,根据下式计算得到历史时间周期xm交通站点p的拥堵延误乘客数量:
如果乘客平均到达站台,平均等待时间等于高峰时段发车间隔时间的一半。换句话说,即使站台没有拥堵,一半的乘客等候时间超过发车时间的一半。因此,为避免由于这部分乘客造成的计算误差,本实施例中使用完整发车间隔作为无拥堵延误的乘客的最大等待时间,超过整个发车时间的乘客被视为延误,延误的乘客人数可根据下式计算:
其中,Pt为高峰时间段集合。
S25、根据所述历史时间周期内所述交通站点的拥堵延误乘客数量以及所述历史时间周期内所述交通站点的乘客总数,确定所述历史时间周期内所述交通站点的拥堵延误率;本实施例中,根据下式计算得到在所述历史时间周期内所述交通站点的拥堵延误率:
S3、根据所述历史延误数据集,确定在待测时间周期内各所述交通站点的临近延误数据集、日周期延误数据集和周周期延误数据集。
所述临近延误数据集中包括所述待测时间周期前若干个时间周期的历史拥堵延误率;根据下式确定待测时间周期的临近延误数据集:
其中,concat[]为序列拼接函数,t为待测时间周期,αt-1为所述待测时间周期的前一个历史时间周期各交通站点的历史拥堵延误率组成的拥堵延误率序列,lc为所述临近延误数据集中拥堵延误率序列的个数,为实数域,N为站点个数,C表示特征属性个数。
所述日周期延误数据集中包括所述待测时间周期前若干日内同一时间周期的历史拥堵延误率;根据下式确定待测时间周期的日周期延误数据集:
所述周周期延误数据集中包括所述待测时间周期前若干周内同一时间周期的历史拥堵延误率;根据下式确定待测时间周期的周周期延误数据集:
S4、根据所述临近延误数据集、所述日周期延误数据集和所述周周期延误数据集中的各所述交通站点的历史拥堵延误率,计算各交通站点两两之间的相关性距离。
S5、构造各交通站点之间的交通模式关系图;所述交通模式关系图中包括若干个交通站点以及各交通站点两两之间的相关性距离;根据下式构造得到各交通站点之间的交通模式关系图:
其中,V为所有交通站点的集合,V={v1,v2,v3,…,vN},Ep为所述交通模式关系图的边集,eij表示交通站点vi和交通站点vj的连线,Ap表示相关性矩阵,wp(i,j)表示交通站点vi和交通站点vj的相关性强度,dtw(i,j)表示使用动态时间规整算法计算的交通站点vi的拥堵延误率序列和交通站点vj的拥堵延误率序列之间的距离,β表示根据动态时间规整算法计算的距离的衰减率。
S6、构造各交通站点之间的交通拓扑关系图;所述交通拓扑关系图中包括若干个交通站点以及各交通站两两之间的连接关系;根据下式构造得到各交通站点之间的交通拓扑关系图:
其中,Er为所述交通拓扑关系图的边集,Ar为邻接矩阵,Ar,ij为交通站点vi和交通站点vj的连接关系,Ar,ij为1,则代表交通站点vi和交通站点vj相邻,Ar,ij为0,则代表交通站点vi和交通站点vj不相邻。
S7、对所述待测时间周期内的外部影响因素的特征进行提取,得到外部影响因素特征;如图3所示的流程图,本实施例中步骤S7,具体包括:
S71、对所述天气信息的特征进行提取,得到天气信息特征;根据下式提取天气信息特征:
S72、对所述节假日信息的特征进行提取,得到节假日信息特征;根据下式提取节假日信息特征:
S73、对所述时间信息的特征进行提取,得到时间信息特征;根据下式提取时间信息特征:
其中,为时间信息特征,为时间信息,extdh()为时间信息特征提取函数。具体来说,时间信息为当前是周几,一般来说,每周的五个工作日有不一样的特征,特别是周一和周五,如周五的下班高峰期18:00~18:15的客流量特征与其他几个工作日的18:00~18:15的客流量特征就存在不同。
在通过步骤S3~S7得到用于客流拥堵延误率预测的输入数据后,还需要对输入数据中的离散型变量利用One-Hot编码进行数字化,对于连续型变量则通过Min-Max线性归一化缩放到[0,1]范围。Min-Max线性归一化的公式为:
其中,Xmax为数据的最大值,Xmin为数据的最小值。
S8、通过客流拥堵延误预测模型,预测得到待测时间周期任一交通站点的拥堵延误率;将所述待测时间周期、所述临近延误数据集、所述日周期延误数据集、所述周周期延误数据集、所述交通模式关系图、所述交通拓扑关系图和所述外部影响因素特征输入到客流拥堵延误率预测模型中,预测得到在所述待测时间周期任一交通站点的拥堵延误率。步骤S8,具体包括:
S81、基于时空注意力机制,对所述临近延误数据集、所述日周期延误数据集和所述周周期延误数据集进行时间和空间上的信息融合,得到注意力增强延误数据集。
S82、对所述交通拓扑关系图、所述交通模式关系图和所述注意力增强延误数据集进行卷积处理,得到各交通站点之间的空间特征矩阵。
S83、基于双向循环层网络对所述空间特征矩阵进行正反两个方向延误率的时间依赖性特征提取,得到时间特征矩阵。
S84、将所述外部影响因素特征、所述空间特征矩阵和所述时间特征矩阵进行融合,得到在所述待测时间周期任一交通站点的拥堵延误率。
可选地,在步骤S8之前,所述预测方法还包括:
X1、在所述历史延误数据集中,确定任一历史时间周期为目标时间周期。
X2、根据所述历史延误数据集,确定在所述目标时间周期内各所述交通站点的临近延误数据集、日周期延误数据集和周周期延误数据集。
X3、根据所述临近延误数据集、所述日周期延误数据集和所述周周期延误数据集中的各所述交通站点的历史拥堵延误率,计算各交通站点两两之间的相关性距离。
X4、构造各交通站点之间的交通模式关系图;所述交通模式关系图中包括若干个交通站点以及各交通站点两两之间的相关性距离。
X5、构造各交通站点之间的交通拓扑关系图;所述交通拓扑关系图中包括若干个交通站点以及各交通站点两两之间的连接关系。
X6、对所述目标时间周期内的外部影响因素的特征进行提取,得到外部影响因素特征。
X7、对输入数据中的离散型变量利用One-Hot编码进行数字化,对于连续型变量则通过Min-Max线性归一化缩放到[0,1]范围。
X8、跳转到步骤X1,重复执行步骤X1~X7,并将得到的多组数据按比例分为训练数据集和测试数据集。
X9、利用训练数据集对客流拥堵延误率预测模型进行训练;以所述目标时间周期的临近延误数据集、所述目标时间周期的日周期延误数据集、所述目标时间周期的周周期延误数据集、所述交通模式关系图、所述交通拓扑关系图和所述目标时间周期的外部影响因素特征作为所述客流拥堵延误率预测模型的输入,以在所述目标时间周期各交通站点的拥堵延误率为目标输出,对所述客流拥堵延误率预测模型进行训练。
X10、在完成对客流拥堵延误预测模型的训练后,利用测试数据集的数据输入到客流拥堵延误率预测模型中进行测试,采用均方根误差(RMSE)和平均绝对误差(MAE)作为预测结果的评价指标,当模型对测试集进行测试所达到的效果不理想时,需调整网络模型的参数直到测试效果理想,保存训练好的网络模型架构和网络参数;均方根误差RMSE和平均绝对误差MAE分别如下式所示:
当下阶段,也有一些应用深度学习方法对客流拥堵延误进行预测的研究,但这些研究也存在一些缺点:基于CNN的模型只考虑了二维欧几里得空间中站点间的绝对距离关系,而交通网络中的非欧几里得结构特征,无法有效捕获空间相关性;基于LSTM结构只能利用正向依赖,由于长期门控内存链,不可避免地会过滤出有用的信息降低预测精度;基于GCN的模型图的有效构建仍然是当前研究中有待解决的问题;除此之外,客流拥堵情况与出行外部因素如天气状况等之间存在密切关系。即现有的研究在空间相关性、时间依赖性以及外部影响因素上考虑不全面。
为验证本发明所提的预测模型的有效性,选取厦门市快速公交的44个站点的客流拥堵延误数据和厦门市地铁24个站点的客流拥堵延误数据作为研究对象,预测时间间隔Δt=15min。所使用数据集为厦门市2019年6月3日至12月27日周一至周五7:35-9:35的客流拥堵延误数据以及天气数据。其中前125天数据用于训练模型,用最后25天的数据进行测试。将本发明的客流拥堵延误预测模型与现有的八种模型进行了比较,包括浅层模型和最先进的深度学习模型,接下来对八个模型以及基于本发明模型所构建的变体模型进行介绍:
本发明将提供的预测模型和以往7种模型(ARIMA、LSTM、BiLSTM、CNN、GCN、ASTGCN、T-MGCN)进行比较,并且将本发明的预测模型与基于该预测模型构建的7个变体模型(AST-RGCN只使用拓扑结构图来执行图的卷积操作、AST-PGCN只使用交通模式图来执行图的卷积操作、ASTMGCN-Daily只考虑时序特点中日周期的时间特征、ASTMGCN-Weekly只考虑时序特点中周周期的时间特征、ASTMGCN-NoExt不考虑所有的外部影响因素信息、ASTMGCN-None不考虑所有的辅助信息、ASTMGCN-NoAST不考虑时空注意力机制)进行比较,根据均方根误差(RMSE)和平均绝对误差(MAE)作为评价指标,评价本发明所提模型有效性:
分别在厦门市快速公交数据集和厦门市地铁数据集上,基于RMSE和MAE的评价指标对本发明所提供的预测模型(STA-MGCN)和其余基准模型进行验证和比较,如表1所示。
表1两个数据集下基于RMSE和MAE的不同模型比较
对表1的结果进行分析,可以发现:1)深度学习方法(LSTM、BiLSTM、CNN、GCN、ASTGCN、GCN-BiLSTM、STA-MGCN)比传统时间序列分析(ARIMA)取得更好的预测精度,表明深度学习方法能够更好地捕获非线性的时空关联性;2)时空深度学习方法(ASTGCN、GCN-BiLSTM、STA-MGCN)比普通的深度学习方法(LSTM、BiLSTM、CNN、GCN)取得更好的预测精度,表明有效捕获时空关联有利于提高预测精度;3)基于图的方法相较于CNN能够更好的对交通网络进行建模,并且相较于单向LSTM,BiLSTM可以做出更精确的序列预测;4)本发明所提供的预测模型在两个数据集中均取得最佳预测精度,表明全面考虑多种空间相关性、时间依赖性以及外部因素有助于提高预测精度。
为验证所提模型中各模块的有效性,本实施例中进行了消融实验,构建了7个基于本模型的变体模型,并在两个数据集上进行实验,如表2和表3所示。
表2多图有效性验证
对表2的多图有效性验证进行分析,如表2所示:1)本发明所提模型性能优于2个变体,表明两张相关性图都有助于提升最终的结果;2)2个变体模型中,仅利用交通模式相关性图的模型整体性能较好,表明历史交通模式对未来的交通状况有很强的指示作用。
表3辅助信息效性验证
对表3的辅助信息有效性验证进行分析,如表3所示:1)本发明所提供的预测模型表现最好,而去除所有的辅助信息的模型的表现最差,表明辅助信息的有效性;2)仅有周期性信息的性能几乎与完整模型相同,表明周期性信息是所有辅助信息的中最有效的;3)当去除时空注意力机制后,模型性能仍优于GCN-BiLSTM,表明本发明所提供的预测模型在提取空间相关性和外部影响因素特征的优势,当结合时空注意机制,可以进一步减少预测误差。
综上所述,本发明提供的客流拥堵延误预测模型不仅对多样空间相关性和时间依赖性关注,增强对现实时空依赖性的提取,还融入了其他外部影响因素。此外,本发明所提供的预测模型还通过堆叠的双向循环层提高了其捕获长期上下文和生成更高层次的序列数据表示能力,并且融合时空注意机制学习交通数据的动态时空相关性,提高模型预测精度。在不同的两个真实数据集上评估了本发明所提模型的有效性,其性能明显优于其他基准模型,证实了本发明的模型更适合客流拥堵延误短时预测,更能够满足工程上的需求。
实施例2:
本发明实施例1的预测方法也可以借助于图4和图5所示的一种客流拥堵延误的预测系统的架构来实现。如图4所示,该预测系统可以包括:历史延误数据集确定模块、临近延误数据集确定模块、日周期延误数据集确定模块、周周期延误数据集确定模块、交通模式关系图构造模块、交通拓扑关系图构造模块、外部特征提取模块和预测模型训练模块;一些模块还可以有用于实现其功能的子单元,例如图5所示的,在预测模型训练模块中包括时空注意力调整单元、空间特征提取单元、时间特征提取单元、多源特征融合单元和预测输出单元。当然,图4和图5所示的架构只是示例性的,在一些实施方式中,可以在一些模块中添加其他的单元;另外在需要实现不同的功能时,根据实际需要,也可以省略图4和图5示出的系统中的一个或至少两个组件。
技术中的程序部分可以被认为是以可执行的代码和/或相关数据的形式而存在的“产品”或“制品”,通过计算机可读的介质所参与或实现的。有形的、永久的储存介质可以包括任何计算机、处理器、或类似设备或相关的模块所用到的内存或存储器。例如,各种半导体存储器、磁带驱动器、磁盘驱动器或者类似任何能够为软件提供存储功能的设备。
所有软件或其中的一部分有时可能会通过网络进行通信,如互联网或其他通信网络。此类通信可以将软件从一个计算机设备或处理器加载到另一个。例如:从视频目标检测设备的一个服务器或主机计算机加载至一个计算机环境的硬件平台,或其他实现系统的计算机环境,或与提供目标检测所需要的信息相关的类似功能的系统。因此,另一种能够传递软件元素的介质也可以被用作局部设备之间的物理连接,例如光波、电波、电磁波等,通过电缆、光缆或者空气等实现传播。用来载波的物理介质如电缆、无线连接或光缆等类似设备,也可以被认为是承载软件的介质。在这里的用法除非限制了有形的“储存”介质,其他表示计算机或机器“可读介质”的术语都表示在处理器执行任何指令的过程中参与的介质。
本文中应用了具体个例,但以上描述仅是对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;本领域的技术人员应该理解,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种客流拥堵延误的预测方法,其特征在于,所述预测方法包括:
获取各交通站点的历史通勤数据;
根据所述历史通勤数据,确定在任一历史时间周期每一交通站点的历史拥堵延误率,得到历史延误数据集;每一交通站点的历史拥堵延误率由以所述交通站点为目的站或起始站的若干个有向交通站点对的历史拥堵延误率确定;所述有向交通站点对的历史拥堵延误率表示由所述有向交通站点对中的起始交通站点到所述有向交通站点对中的目的交通站点的历史拥堵延误率;
根据所述历史延误数据集,确定在待测时间周期的临近延误数据集、日周期延误数据集和周周期延误数据集;所述临近延误数据集中包括所述待测时间周期前若干个时间周期的历史拥堵延误率;所述日周期延误数据集中包括所述待测时间周期前若干日内同一时间周期的历史拥堵延误率;所述周周期延误数据集中包括所述待测时间周期前若干周内同一时间周期的历史拥堵延误率;
根据所述临近延误数据集、所述日周期延误数据集和所述周周期延误数据集中的各交通站点的历史拥堵延误率,计算任意两个交通站点之间的相关性距离;
构造各交通站点之间的交通模式关系图;所述交通模式关系图中包括若干个交通站点以及各交通站点两两之间的相关性距离;
构造各交通站点之间的交通拓扑关系图;所述交通拓扑关系图中包括若干个交通站点以及各交通站点两两之间的连接关系;
对所述待测时间周期内的外部影响因素的特征进行提取,得到外部影响因素特征;
将所述待测时间周期、所述临近延误数据集、所述日周期延误数据集、所述周周期延误数据集、所述交通模式关系图、所述交通拓扑关系图和所述外部影响因素特征输入到客流拥堵延误率预测模型中,预测得到在所述待测时间周期任一交通站点的拥堵延误率。
2.根据权利要求1所述的预测方法,其特征在于,所述将所述待测时间周期、所述临近延误数据集、所述日周期延误数据集、所述周周期延误数据集、所述交通模式关系图、所述交通拓扑关系图和所述外部影响因素特征输入到客流拥堵延误率预测模型中,预测得到在所述待测时间周期任一交通站点的拥堵延误率,具体包括:
基于时空注意力机制,对所述临近延误数据集、所述日周期延误数据集和所述周周期延误数据集进行时间和空间上的信息融合,得到注意力增强延误数据集;
对所述交通拓扑关系图、所述交通模式关系图和所述注意力增强延误数据集进行卷积处理,得到各交通站点之间的空间特征矩阵;
基于双向循环层网络对所述空间特征矩阵进行正反两个方向延误率的时间依赖性特征提取,得到时间特征矩阵;
将所述外部影响因素特征、所述空间特征矩阵和所述时间特征矩阵进行融合,得到在所述待测时间周期任一交通站点的拥堵延误率。
3.根据权利要求1所述的预测方法,其特征在于,在所述将所述待测时间周期、所述临近延误数据集、所述日周期延误数据集、所述周周期延误数据集、所述交通模式关系图、所述交通拓扑关系图和所述外部影响因素特征输入到客流拥堵延误率预测模型中,预测得到在所述待测时间周期任一交通站点的拥堵延误率之前,所述预测方法还包括:
在所述历史延误数据集中,确定任一历史时间周期为目标时间周期;
根据所述历史延误数据集,确定在所述目标时间周期内的临近延误数据集、日周期延误数据集和周周期延误数据集;
根据所述临近延误数据集、所述日周期延误数据集和所述周周期延误数据集中的各所述交通站点的历史拥堵延误率,计算任意两个交通站点之间的相关性距离;
构造各交通站点之间的交通模式关系图;所述交通模式关系图中包括若干个交通站点以及各交通站点两两之间的相关性距离;
构造各交通站点之间的交通拓扑关系图;所述交通拓扑关系图中包括若干个交通站点以及各交通站点两两之间的连接关系;
对所述目标时间周期内的外部影响因素的特征进行提取,得到外部影响因素特征;
以所述临近延误数据集、所述日周期延误数据集、所述周周期延误数据集、所述交通模式关系图、所述交通拓扑关系图和所述外部影响因素特征作为所述客流拥堵延误率预测模型的输入,以在所述目标时间周期各交通站点的拥堵延误率为目标输出,对所述客流拥堵延误率预测模型进行训练。
4.根据权利要求1所述的预测方法,其特征在于,所述根据所述历史通勤数据,确定在任一历史时间周期每一交通站点的历史拥堵延误率,得到历史延误数据集,具体包括:
针对任一交通站点,计算得到在任一历史时间周期通过所述交通站点去到另一交通站点的预估通行时间均值;
根据所述历史通勤数据,计算得到在任一历史时间周期通过所述交通站点去到另一交通站点的实际通行时间均值;
针对任一历史时间周期,根据各乘客在所述历史时间周期通过所述交通站点去到另一交通站点的实际通行时间均值和所述预估通行时间均值,确定各乘客在所述历史时间周期通过所述交通站点的拥堵延误时间;
确定在所述历史时间周期内通过所述交通站点的拥堵延误时间不为零的乘客个数,得到拥堵延误乘客数量;
根据所述历史时间周期内所述交通站点的拥堵延误乘客数量以及所述历史时间周期内所述交通站点的乘客总数,确定所述历史时间周期内所述交通站点的拥堵延误率。
8.根据权利要求1所述的预测方法,其特征在于,根据下式构造得到各交通站点之间的交通模式关系图:
其中,V为所有交通站点的集合,V={v1,v2,v3,…,vN},Ep为所述交通模式关系图的边集,eij表示交通站点vi和交通站点vj的连线,Ap表示相关性矩阵,wp(i,j)表示交通站点vi和交通站点vj的相关性强度,dtw(i,j)表示使用动态时间规整算法计算的交通站点vi的拥堵延误率序列和交通站点vj的拥堵延误率序列之间的距离,β表示根据动态时间规整算法计算的距离的衰减率;
根据下式构造得到各交通站点之间的交通拓扑关系图:
其中,Er为所述交通拓扑关系图的边集,Ar为邻接矩阵,Ar,ij为交通站点vi和交通站点vj的连接关系,Ar,ij为1,则代表交通站点vi和交通站点vj相邻,Ar,ij为0,则代表交通站点vi和交通站点vj不相邻。
9.根据权利要求5所述的预测方法,其特征在于,所述外部影响因素包括天气信息、节假日信息和时间信息;所述对所述待测时间周期内的外部影响因素的特征进行提取,得到外部影响因素特征,具体包括:
对所述天气信息的特征进行提取,得到天气信息特征;
对所述节假日信息的特征进行提取,得到节假日信息特征;
对所述时间信息的特征进行提取,得到时间信息特征。
10.一种客流拥堵延误的预测系统,其特征在于,所述客流拥堵延误的预测系统在被计算机执行时,运行如权利要求1~9任一项所述的客流拥堵延误的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211269386.7A CN115660156A (zh) | 2022-10-18 | 2022-10-18 | 一种用于交通站点客流拥堵延误预测的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211269386.7A CN115660156A (zh) | 2022-10-18 | 2022-10-18 | 一种用于交通站点客流拥堵延误预测的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115660156A true CN115660156A (zh) | 2023-01-31 |
Family
ID=84988325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211269386.7A Pending CN115660156A (zh) | 2022-10-18 | 2022-10-18 | 一种用于交通站点客流拥堵延误预测的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115660156A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116029459A (zh) * | 2023-02-28 | 2023-04-28 | 速度时空信息科技股份有限公司 | 结合图傅里叶变换tmgcn交通流预测模型的提取方法 |
-
2022
- 2022-10-18 CN CN202211269386.7A patent/CN115660156A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116029459A (zh) * | 2023-02-28 | 2023-04-28 | 速度时空信息科技股份有限公司 | 结合图傅里叶变换tmgcn交通流预测模型的提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tekouabou et al. | Improving parking availability prediction in smart cities with IoT and ensemble-based model | |
CN112470199B (zh) | 用于点对点流量预测的系统和方法 | |
CN108197739B (zh) | 一种城市轨道交通乘客流量预测方法 | |
Xue et al. | Short‐term bus passenger demand prediction based on time series model and interactive multiple model approach | |
Christofa et al. | Person-based traffic responsive signal control optimization | |
US8798897B2 (en) | Real-time traffic analysis through integration of road traffic prediction and traffic microsimulation models | |
Chen et al. | Uncertainty in urban mobility: Predicting waiting times for shared bicycles and parking lots | |
Huang et al. | A novel bus-dispatching model based on passenger flow and arrival time prediction | |
CN110570678B (zh) | 一种公交车辆从起点到终点总行驶时间预测方法及装置 | |
CN106887141B (zh) | 基于排队论的连续交通节点拥塞程度预测模型、系统及方法 | |
Fan et al. | Predicting vacant parking space availability: a long short-term memory approach | |
Balasubramanian et al. | An adaptive long-term bus arrival time prediction model with cyclic variations | |
CN114529081A (zh) | 一种时空联合的交通流量预测方法及装置 | |
CN115660156A (zh) | 一种用于交通站点客流拥堵延误预测的方法及系统 | |
CN116046008A (zh) | 基于态势感知的路线规划方法、系统及效能评估装置 | |
CN115691165A (zh) | 一种交通信号灯调度方法、装置、设备及可读存储介质 | |
CN116453343A (zh) | 智能网联环境下基于流量预测的智能交通信号控制优化算法、软件与系统 | |
Xiong et al. | DCAST: a spatiotemporal model with DenseNet and GRU based on attention mechanism | |
Büchel et al. | Modeling conditional dependencies for bus travel time estimation | |
Lv et al. | An origin–destination passenger flow prediction system based on convolutional neural network and passenger source-based attention mechanism | |
Rahman et al. | Attention based deep hybrid networks for traffic flow prediction using google maps data | |
CN111667083B (zh) | 网约车预估价确定方法和装置 | |
CN111209979A (zh) | 监控车辆电压的方法、装置及电子设备 | |
Liu et al. | A hybrid model based on kalman filter and neutral network for traffic prediction | |
Gupta et al. | LSTM based real-time smart parking system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |