CN115759322A - 一种城市轨道交通客流预测和影响的分析方法 - Google Patents

一种城市轨道交通客流预测和影响的分析方法 Download PDF

Info

Publication number
CN115759322A
CN115759322A CN202211125563.4A CN202211125563A CN115759322A CN 115759322 A CN115759322 A CN 115759322A CN 202211125563 A CN202211125563 A CN 202211125563A CN 115759322 A CN115759322 A CN 115759322A
Authority
CN
China
Prior art keywords
passenger flow
training
day
model
rail transit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211125563.4A
Other languages
English (en)
Inventor
史桂芳
江筱薇
程娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinling Institute of Technology
Original Assignee
Jinling Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinling Institute of Technology filed Critical Jinling Institute of Technology
Priority to CN202211125563.4A priority Critical patent/CN115759322A/zh
Publication of CN115759322A publication Critical patent/CN115759322A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种城市轨道交通客流预测和影响的分析方法,先获取原始数据,并划分训练集和测试集;随后利用训练集训练神经网络模型,利用测试集评估训练后模型的预测效果;训练过程中,基于损失函数不断优化模型参数,直到达到最大迭代次数;影响评估过程中,将训练集和测试集进行合并,训练最终模型。基于最终模型确定部份依赖函数,绘制输入变量与输出变量的部分依赖图,评估每日新增病例对日客流量的定量影响。本发明表现了更快的收敛速度和更小的均方误差,同时得益于其简化的结构,可更快地趋于收敛和稳定。绘制了日客流量与每日新增病例、天气属性的部份依赖图,相对于当前建立的轨道交通日客流量预测方法,具有更高的实用性和可靠性。

Description

一种城市轨道交通客流预测和影响的分析方法
技术领域
本发明属于交通管理领域,特别涉及一种基于GRU神经网络模型的城市轨道交通客流预测和影响的分析方法。
背景技术
近几年的突发公共事件对城市轨道交通产生了巨大影响。研究影响的客流量预测有助于精准评估城市轨道交通出行需求,对于城市轨道交通在后时代的运营态势预判、组织管理策略制定具有重要的意义。
针对轨道交通客流量预测,现有技术采用的方法分为参数模型预测和非参数模型预测两大类。参数模型多基于自回归时间序列模型,利用历史客流量估计模型参数,对未来客流量进行预测。相比参数模型,非参数模型可以更灵活、有效地处理客流量与多维影响因素之间的非线性关系,但是非参数模型的“黑匣子”特性使其无法评估输入与输出变量之间的定量关系。当前研究采用非参数模型的研究均着重于客流量的预测效果,而未解释各因素对客流量的影响程度。此外,影响因素层面,当前研究集中在天气属性和节假日属性,仅考虑显著影响客流量的外部因素,而此类事件对客流量的影响存在一定的研究空白。
发明内容
本发明通过构建一种城市轨道交通客流预测和影响分析的方法,结合高效的GRU神经网络模型进行客流量预测,并纳入每日新增病例数、天气属性、气温、节假日属性、历史客流量因素,可更好地实现对客流量的精准预测。
一种城市轨道交通客流预测和影响的分析方法,包括如下步骤:
步骤1:数据准备;
步骤2:模型训练。
优选的是,本发明步骤1的数据准备,具体过程为:
步骤1.1:获取原始数据集;获取信息包括外部因素和内部因素两类:外部因素包括每日新增病例数、以及当日对应的天气属性、最高气温、最低气温和节假日属性;内部因素为轨道交通日客流量;
步骤1.2:划分训练集和测试集;将获取的原始数据划分训练集和测试集;利用训练集训练神经网络模型,利用测试集评估训练后模型的预测效果;
步骤1.3:数据标准化;第i天的数据结构,其输入变量维度为t×n,t代表时间步,n代表特征维度;考虑一周7天为一个周期,若要预测第i天的轨道交通日客流量,则采用第i天当天及前7天的特征作为输入,即时间步长设置为8,t=1,…,8;每一天的特征包括该日新增病例数、天气属性、最低气温、最高气温、节假日属性以及昨日客流量,共6个特征维度,即n=1,…,6;第i天的输入变量维数为8×6=48维,而第i天的输出变量为当日客流量,对应时间步为0,特征维度为6的变量
Figure SMS_1
优选的是,本发明步骤2的模型训练,具体过程为:
步骤2.1:门控循环单元神经网络模型;采用门控循环单元神经网络对轨道交通日客流量进行预测,门控循环单元神经网络的表达式如下:
Figure SMS_2
其中,xt是当前时间步t的输入,ht是时间步t的隐藏状态,ht-1是上一时间步的隐藏状态,rt,zt分别为重置门和更新门,
Figure SMS_3
为候选隐藏状态,Wir,Wiz,Win分别为输入xt与重置门、更新门、候选隐藏状态的权重,Whz,Whn别为隐藏状态与更新门、候选隐藏状态的权重,Whr为隐藏状态与重置门的权重,bir,biz,bin,bhz,bhn为偏置向量,σ为Sigmoid激活函数,tanh为tanh激活函数,*为哈达玛积;
步骤2.2:采用PyTorch进行门控循环单元神经网络训练;设置门控循环单元神经网络参数,采用的Adam优化器将动量算法和RMSProp算法结合,用动量累积梯度,让收敛速度更快的同时,波动幅度更;采用的损失函数为均方误差损失;训练过程中,基于损失函数不断优化模型参数,直到达到最大迭代次数,
步骤2.3:影响评估,将训练集和测试集进行合并训练最终模型,基于最终模型确定部份依赖函数,绘制输入变量与输出变量的部分依赖图,评估每日新增病例对日客流量的定量影响;部分依赖图的绘制依赖于拟合后的模型,通过变量干预方法,描述一个特征变量对预测结果的平均边际效应,绘制特征变量x与输出变量y的部分依赖图,步骤如下:
⑦确定特征x的可能取值[x1,x2,…,xk],令i=1;
⑧将数据集的特征x的取值强制变更为xi
⑨基于拟合模型,计算数据集输出结果的平均值yi
⑩在部分依赖图绘制点(xi,yi);
Figure SMS_4
令i=i+1,重复步骤②、③、④,直至i=k,点(xk,yk)绘制完毕;
Figure SMS_5
获取最终部分依赖图;
代入至当前的日客流量预测问题,若需要绘制第i天当日的新增病例数
Figure SMS_6
与该天日客流量
Figure SMS_7
的部分依赖图,当
Figure SMS_8
等于z时,部分依赖图函数表达如下所示:
Figure SMS_9
其中,z为新增病例数
Figure SMS_10
的可能取值,z=0,1,…6,n为样本数;NGRU为采用全样本训练后的门控循环单元神经网络。
一种基于GRU神经网络模型的城市轨道交通客流预测和影响的分析方法,先获取原始数据,并划分训练集和测试集;随后利用训练集训练神经网络模型,利用测试集评估训练后模型的预测效果;训练过程中,基于损失函数不断优化模型参数,直到达到最大迭代次数;影响评估过程中,将训练集和测试集进行合并,训练最终模型。基于最终模型确定部份依赖函数,绘制输入变量与输出变量的部分依赖图,评估每日新增病例对日客流量的定量影响。
本发明的基于GRU神经网络模型,将每日新增病例数、天气属性、气温、节假日属性、历史客流量作为输入,对后时代城市轨道日客流量进行预测。结果表明,GRU神经网络可实现日客流量的精确预测,相比于LSTM神经神经网络,表现了更快的收敛速度和更小的均方误差,进一步论证了GRU作为LSTM的变体,保留了LSTM处理长期依赖问题的能力,同时得益于其简化的结构,可更快地趋于收敛和稳定。基于训练后的GRU神经网络模型,绘制了日客流量与每日新增病例、天气属性的部份依赖图,相对于当前建立的轨道交通日客流量预测方法,具有更高的实用性和可靠性。
附图说明
图1是城市轨道交通客流预测和影响的分析方法的流程示意图。
图2是第i天的数据结构示意图。
图3是GRU神经网络结构示意图。
图4是上海城市轨道交通日客流量时间序列示意图。
图5是GRU神经网络训练集迭代过程示意图。
图6是测试集预测结果示意图。
图7是日客流量与每日新增病例的部分依赖图示意图。
图8是日客流量与天气属性的部分依赖图示意图。
具体实施方式
下面结合附图对本发明的技术方案进行详细说明:
如图1所示,一种城市轨道交通客流预测和影响的分析方法,包括如下步骤:
步骤1:数据准备。
步骤1.1:获取原始数据集。获取信息包括外部因素和内部因素两类。外部因素包括每日新增病例数、以及当日对应的天气属性、最高气温、最低气温和节假日属性;内部因素为轨道交通日客流量。
步骤1.2:划分训练集和测试集。将获取的原始数据划分训练集和测试集。利用训练集训练神经网络模型,利用测试集评估训练后模型的预测效果。
步骤1.3:数据标准化。第i天的数据结构,其输入变量维度为t×n,t代表时间步,n代表特征维度。考虑一周7天为一个周期,若要预测第i天的轨道交通日客流量,则采用第i天当天及前7天(共8天)的特征作为输入,即时间步长设置为8,t=1,…,8。每一天的特征包括该日新增病例数、天气属性、最低气温、最高气温、节假日属性以及昨日客流量,共6个特征维度,即n=1,…,6。第i天的输入变量维数为8×6=48维。而第i天的输出变量为当日客流量,对应时间步为0,特征维度为6的变量
Figure SMS_11
如图2所示的第i天的数据结构。
步骤2:模型训练。
步骤2.1:GRU神经网络模型。采用门控循环单元(Gated Recurrent Unit,GRU)神经网络对轨道交通日客流量进行预测。如图3的GRU神经网络结构的表达式如下:
Figure SMS_12
其中,xt是当前时间步t的输入,ht是时间步t的隐藏状态,ht-1是上一时间步的隐藏状态。rt,zt分别为重置门和更新门,
Figure SMS_13
为候选隐藏状态。Wir,Wiz,Win分别为输入xt与重置门、更新门、候选隐藏状态的权重,Whz,Whn别为隐藏状态与更新门、候选隐藏状态的权重。bir,biz,bin,bhz,bhn为偏置向量。σ为Sigmoid激活函数,tanh为tanh激活函数,*为哈达玛积。
步骤2.2:采用PyTorch进行GRU神经网络训练。GRU神经网络参数设置如下表所示。采用的Adam优化器将动量算法和RMSProp(Root Mean Square Propagation)算法结合,用动量累积梯度,让收敛速度更快的同时,波动幅度更。采用的损失函数为均方误差损失。训练过程中,基于损失函数不断优化模型参数,直到达到最大迭代次数。
GRU神经网络参数设置表
Figure SMS_14
Figure SMS_15
步骤2.3:影响评估。
将训练集和测试集进行合并训练最终模型。基于最终模型确定部份依赖函数,绘制输入变量与输出变量的部分依赖图,评估每日新增病例对日客流量的定量影响。部分依赖图(Partial Dependence Plot,PDP)的绘制依赖于拟合后的模型,通过变量干预方法,描述一个特征变量对预测结果的平均边际效应。绘制特征变量x与输出变量y的部分依赖图,步骤如下:
①确定特征x的可能取值[x1,x2,…,xk],令i=1;
②将数据集的特征x的取值强制变更为xi
③基于拟合模型,计算数据集输出结果的平均值yi
④在PDP绘制点(xi,yi)
⑤令i=i+1,重复步骤②、③、④,直至i=k,点(xk,yk)绘制完毕
⑥获取最终PDP。
代入至当前的日客流量预测问题,若需要绘制第i天当日的新增病例数
Figure SMS_16
与该天日客流量
Figure SMS_17
的部分依赖图,当
Figure SMS_18
等于z时,PDP函数表达如下所示:
Figure SMS_19
其中,z为新增病例数
Figure SMS_20
的可能取值,z=0,1,…6。n为样本数;NGRU为采用全样本训练后的GRU神经网络。
实施例:
利用上海轨道交通日客流量,分析时间跨度为2020年6月1日至2021年12月31日(共579天),测试本发明。获取信息包括上海轨道交通日客流量、每日新增病例数,以及当日对应的天气属性和节假日属性,数据均来自官方微博。将获取的原始数据按照3:1的比例划分训练集和测试集,训练集为前429天(2020年6月8日至2021年8月10日),测试集为后143天(2021年8月11日至2021年12月31日),如图4所示。
相关数据将用作后续预测模型的输入和输出。分析的579天中,有24天出现了病例,占比4%。天气属性方面,共249天有雨,占比43%;最低气温和最高气温的平均值分别为17℃和23℃。节假日属性方面,休假日共399天,包括周末、春节、清明节、劳动节、端午节、中秋节、国庆节休假,占比31%。579天中,日客流量平均值为958.7万人次,标准差为228.7万人次。
变量描述性统计
Figure SMS_21
基于训练集(2020年),采用GRU神经网络进行迭代训练,将LSTM网络的训练结果用作对比。从图5中可以看出,GRU和LSTM在100次迭代后均取得了较好的收敛效果。但LSTM在初期波动较大,且在80次迭代后,均方误差才降低至与GRU持平的水准。相比之下,GRU对应的曲线更平滑,在训练初期就快速收敛,40次迭代后趋于稳定。由此可知,GRU神经网络得益于其简单、高效的优势,收敛速度和稳定性优于LSTM。
如图6所示,基于训练后的GRU神经网络模型,对测试集进行预测,同样采用LSTM进行对比。其中(a)为采用GRU测试集预测的结果示意图,(b)为采用LSTM测试集预测的结果示意图,GRU和LSTM的预测值均能体现日客流量以周为单位的周期性变化,同时也能较好地反应十一假期产生的客流量突变。相比之下,GRU的预测值与真实值更为接近,均方误差为4075.56(万人次)2,预测精度为95.25%。而LSTM对局部峰值的预测存在较大偏差,均方误差为4921.46(万人次)2,预测精度为94.40%。说明GRU可以取得更好的预测效果。
通过部分依赖图,获取外部因素与结合训练集和测试集,训练GRU模型,绘制日客流量对各输入变量的部份依赖图。经过分析,各时间步的新增病例和天气属性均满足该前提条件。而最低气温、最高气温、节假日属性自身的时间序列存在强相关性,且同一时间步的最低气温和最高气温之间也高度相关,因此在后续的分析中没有纳入这三类变量。
图7的部分依赖图展示了日客流量与每个时间步的新增病例数之间的关系,其中t代表时间步。对于变量“每日新增病例”,t=1对应当天的新增病例数,依此类推,t=2对应前一天,t=3对应一周前。
根据分析,无论对于哪个时间步,日客流量与新增病例之间都呈负相关。其中,当天(t=1)和前一天(t=2)的新增病例对日客流量的影响最大。随着新增人数递增,日客流量呈较大幅度减少。说明若出现新增本土病例,轨道交通出行量会减少。定量来看,前一天的新增病例数每增加一例,日客流量平均减少5.46万人次,而当天新增病例数每增加一例,日客流量平均减少4.68万人次。可见,昨日新增病例对今日客流量的影响较大,而今日客流量对当日的敏感度反而稍低,说明当天的轨道交通出行会更大程度地根据昨日进行调整。随着时间往前推移,更前些天(t=3,4,K,8)的新增病例数对今日客流量的影响程度会越来越低。
类似的,图8显示了日客流量与天气属性的部分依赖图,当天(t=1)的天气属性对日客流量的影响最大。随着时间步向前推移,天气属性对日客流量的影响逐渐减小。相较于不下雨(天气属性为0)的情况,当天有雨(天气属性为1)时,日客流量平均减少20.76万人次。说明雨天会大幅度地减少轨道交通出行量。
结果标明:①GRU神经网络模型的预测精度为95.25%,高于LSTM的94.40%,说明GRU能实现更优的预测精度。②GRU模型在训练初期不会出现大幅波动,收敛速度比LSTM更快。③新增病例数与日客流量呈负相关。昨日新增病例每增加1例,日客流量平均减少5.46万人次。④相较于未下雨的情况,雨天时的日客流量平均减少20.76万人次。
因此,本发明的判别结果更加可靠和实用,有利于城市轨道交通在后时代的运营态势预判、组织管理工作的开展。

Claims (3)

1.一种城市轨道交通客流预测和影响的分析方法,其特征在于包括如下步骤:
步骤1:数据准备;
步骤2:模型训练。
2.根据权利要求1所述的城市轨道交通客流预测和影响的分析方法,其特征在于上述步骤1的数据准备,具体过程为:
步骤1.1:获取原始数据集;获取信息包括外部因素和内部因素两类:外部因素包括每日新增确诊病例数、以及当日对应的天气属性、最高气温、最低气温和节假日属性;内部因素为轨道交通日客流量;
步骤1.2:划分训练集和测试集;将获取的原始数据划分训练集和测试集;利用训练集训练神经网络模型,利用测试集评估训练后模型的预测效果;
步骤1.3:数据标准化;第i天的数据结构,其输入变量维度为t×n,t代表时间步,n代表特征维度;考虑一周7天为一个周期,若要预测第i天的轨道交通日客流量,则采用第i天当天及前7天的特征作为输入,即时间步长设置为8,t=1,…,8;每一天的特征包括该日新增病例数、天气属性、最低气温、最高气温、节假日属性以及昨日客流量,共6个特征维度,即n=1,…,6;第i天的输入变量维数为8×6=48维,而第i天的输出变量为当日客流量,对应时间步为0,特征维度为6的变量
Figure QLYQS_1
3.根据权利要求2所述的城市轨道交通客流预测和影响的分析方法,其特征在于上述步骤2的模型训练,具体过程为:
步骤2.1:门控循环单元神经网络模型;采用门控循环单元神经网络对轨道交通日客流量进行预测,门控循环单元神经网络的表达式如下:
Figure QLYQS_2
其中,xt是当前时间步t的输入,ht是时间步t的隐藏状态,ht-1是上一时间步的隐藏状态,rt,zt分别为重置门和更新门,
Figure QLYQS_3
为候选隐藏状态,Wir,Wiz,Win分别为输入xt与重置门、更新门、候选隐藏状态的权重,Whz,Whn别为隐藏状态与更新门、候选隐藏状态的权重,Whr为隐藏状态与重置门的权重,bir,biz,bin,bhz,bhn为偏置向量,σ为Sigmoid激活函数,tanh为tanh激活函数,*为哈达玛积;
步骤2.2:采用PyTorch进行门控循环单元神经网络训练;设置门控循环单元神经网络参数,采用的Adam优化器将动量算法和RMSProp算法结合,用动量累积梯度,让收敛速度更快的同时,波动幅度更;采用的损失函数为均方误差损失;训练过程中,基于损失函数不断优化模型参数,直到达到最大迭代次数,
步骤2.3:影响评估,将训练集和测试集进行合并训练最终模型,基于最终模型确定部份依赖函数,绘制输入变量与输出变量的部分依赖图,评估每日新增病例对日客流量的定量影响;部分依赖图的绘制依赖于拟合后的模型,通过变量干预方法,描述一个特征变量对预测结果的平均边际效应,绘制特征变量x与输出变量y的部分依赖图,步骤如下:
①确定特征x的可能取值[x1,x2,…,xk],令i=1;
②将数据集的特征x的取值强制变更为xi
③基于拟合模型,计算数据集输出结果的平均值yi
④在部分依赖图绘制点(xi,yi);
⑤令i=i+1,重复步骤②、③、④,直至i=k,点(xk,yk)绘制完毕;
⑥获取最终部分依赖图;
代入至当前的日客流量预测问题,若需要绘制第i天当日的新增病例数
Figure QLYQS_4
与该天日客流量
Figure QLYQS_5
的部分依赖图,当
Figure QLYQS_6
等于z时,部分依赖图函数表达如下所示:
Figure QLYQS_7
其中,z为新增病例数
Figure QLYQS_8
的可能取值,z=0,1,…6,n为样本数;NGRU为采用全样本训练后的门控循环单元神经网络。
CN202211125563.4A 2022-09-16 2022-09-16 一种城市轨道交通客流预测和影响的分析方法 Pending CN115759322A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211125563.4A CN115759322A (zh) 2022-09-16 2022-09-16 一种城市轨道交通客流预测和影响的分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211125563.4A CN115759322A (zh) 2022-09-16 2022-09-16 一种城市轨道交通客流预测和影响的分析方法

Publications (1)

Publication Number Publication Date
CN115759322A true CN115759322A (zh) 2023-03-07

Family

ID=85349848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211125563.4A Pending CN115759322A (zh) 2022-09-16 2022-09-16 一种城市轨道交通客流预测和影响的分析方法

Country Status (1)

Country Link
CN (1) CN115759322A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117252311A (zh) * 2023-11-16 2023-12-19 华南理工大学 一种基于改进lstm网络的轨道交通客流预测方法
CN117591919A (zh) * 2024-01-17 2024-02-23 北京工业大学 客流预测方法、装置、电子设备和存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117252311A (zh) * 2023-11-16 2023-12-19 华南理工大学 一种基于改进lstm网络的轨道交通客流预测方法
CN117252311B (zh) * 2023-11-16 2024-03-15 华南理工大学 一种基于改进lstm网络的轨道交通客流预测方法
CN117591919A (zh) * 2024-01-17 2024-02-23 北京工业大学 客流预测方法、装置、电子设备和存储介质
CN117591919B (zh) * 2024-01-17 2024-03-26 北京工业大学 客流预测方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN115759322A (zh) 一种城市轨道交通客流预测和影响的分析方法
CN106485262B (zh) 一种母线负荷预测方法
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN112289034A (zh) 基于多模态时空数据的深度神经网络鲁棒交通预测方法
CN113205207A (zh) 一种基于XGBoost算法的用电短期负荷波动预测方法及系统
CN109492748B (zh) 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法
CN110826791A (zh) 一种基于长短时记忆神经网络的混合风功率预测方法
CN111301426A (zh) 基于gru网络模型预测未来行驶过程能耗的方法
CN113962314A (zh) 一种基于联邦学习的非侵入式企业负荷分解方法
CN112418476A (zh) 一种超短期电力负荷预测方法
CN111160650B (zh) 一种基于Adaboost算法的交通流特性分析与预测方法
CN109754122A (zh) 一种基于随机森林特征提取的bp神经网络的数值预测方法
CN111832839B (zh) 基于充分增量学习的能耗预测方法
CN112651543A (zh) 一种基于vmd分解与lstm网络的日用电量预测方法
CN114066052A (zh) 基于改进tcn修正累积误差的可调节负荷功率多步预测方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN113988415A (zh) 一种中长期电力负荷预测方法
CN113222234A (zh) 基于集成模态分解的用气需求预测方法及其系统
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN116167456A (zh) 一种基于编码对比和分类矫正的联邦学习方法
CN115796030A (zh) 一种基于图卷积的交通流量预测方法
CN115616333A (zh) 一种配电网线损预测方法及系统
CN113393035B (zh) 一种电动汽车日充放电功率预测方法
CN113947904A (zh) 基于s-g滤波和深信度网络的多尺度短时交通流预测方法
CN113642784A (zh) 一种计及风机状态的风电功率超短期预测的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination