CN111027673B - 一种地铁客流量预测方法 - Google Patents

一种地铁客流量预测方法 Download PDF

Info

Publication number
CN111027673B
CN111027673B CN201911115405.9A CN201911115405A CN111027673B CN 111027673 B CN111027673 B CN 111027673B CN 201911115405 A CN201911115405 A CN 201911115405A CN 111027673 B CN111027673 B CN 111027673B
Authority
CN
China
Prior art keywords
passenger flow
data
subway
neural network
gate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911115405.9A
Other languages
English (en)
Other versions
CN111027673A (zh
Inventor
胡继华
文梓豪
袁均良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201911115405.9A priority Critical patent/CN111027673B/zh
Publication of CN111027673A publication Critical patent/CN111027673A/zh
Application granted granted Critical
Publication of CN111027673B publication Critical patent/CN111027673B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Entrepreneurship & Innovation (AREA)

Abstract

本发明涉及交通预测领域,更具体的,涉及一种地铁客流量预测方法。本发明基于门控循环单元GRU模型来对地铁人流量数据进行预测;然后通过随机搜索及贝叶斯优化方法,实现网络模型超参数自动调整,尽量逼近最佳参数,获得准确的人流量预测信息,本发明主要在软件平台实现,不需要高成本的投资建设费用,不需要耗费大量的人力。本发明适用于大规模城域网中的人流量的预测。本发明可为地铁当局提供参考,有效地将有限的资源分配给过度拥挤的区域,改善地铁的服务。

Description

一种地铁客流量预测方法
技术领域
本发明涉及交通预测领域,更具体地,涉及一种地铁客流量预测方法。
背景技术
地铁出行是一种高效且安全系数高的一种出行方式,是人们出行首选的交通方式之一。但随着客流量的增大,许多问题也体现了出来,在每日的早晚高峰以及节假日期间,许多地铁站点人满为患,地铁站点特别是换乘站点承受着十分大的压力,因此,如何对地铁班次进行合理的调度,成为公共交通运输的一个主要问题。在这个问题里,预测地铁站的人流量处于一个十分重要的地位,若能根据预测出来的地铁站人流量进行地铁班次合理的调度,那将使得公共交通变得更加的舒适以及安全。
大数据对公共交通有着十分重大的作用,现实世界中大数据的快速增长为研究人流量预测问题提供了一个很好的平台。近几年,大数据分析技术也在交通运输领域应用开来。而目前的大数据分析技术需要高成本的投资建设费用以及耗费大量的人力,并且预测效果差强人意,从而导致大数据的分析难以在日常生活中推广开来。
发明内容
为了解决现有技术中大数据分析技术需要高成本的投资建设费用以及耗费大量的人力,预测效果差的不足,本发明提供了一种地铁客流量预测方法。
为解决上述技术问题,本发明的技术方案如下:
一种地铁客流量预测方法,包括以下步骤:
步骤S1:获取地铁客流数据,对地铁客流数据进行特征分析,得到影响地铁客流数据的影响因素;
步骤S2:对影响因素进行数字化处理,得到影响因素数据;
步骤S3:基于影响因素数据得到最终的地铁客流数据,将最终的地铁客流数据划分为训练数据集、测试集以及验证集;
步骤S4:基于门控循环单元GRU构建自动调优循环神经网络;
步骤S5:将训练数据集输入到自动调优循环神经网络中对自动调优循环神经网络进行训练,得到训练好的自动调优循环神经网络;
步骤S6:将测试集输入到训练好的自动调优循环神经网络中,得到地铁客流数据的预测结果;
步骤S7:使用随机搜索及贝叶斯优化方法,对训练好的自动调优循环神经网络进行优化,得到优化后的自动调优循环神经网络;
步骤S8:通过均方根误差公式以及平均绝对百分比误差公式对优化后的自动调优循环神经网络进行评价,并使用验证集验证优化后的自动调优循环神经网络的准确性。
优选的,在步骤S1中,经过特征性分析,造成地铁客流量波动的影响因素包括:工作日带来的固定上下班客流、非工作日出游客流、节假日带来的工作日调整以及归乡返程客流、天气因素导致出行方式的改变所带来的客流。
优选的,在步骤S2中,对影响因素进行数字化处理的具体步骤如下:节假日的取值范围为0-1,其中,0代表非节假日,1代表节假日;星期的取值范围为1-7,其中1-7分别代表星期一到星期天;小时的取值范围为0-23,分别代表一天中的24小时;天气的取值范围为0-1,其中0代表不下雨,1为代表下雨;客流量平均值的取值范围为0-20000,代表每小时平均客流量,最终将所有影响因素数据拼接组合在一起,得到最终的输入数据,该输入数据的位数是变长的,并且随着小时数增加而增加,所增加的数据为下一小时的实时客流量。
优选的,将影响因素数据拼接的具体过程如下:
假设节假日为F1、星期为F2、小时为F3、天气为F4,R1为第一个实时客流量,R2为第二个实时客流量,Rn为第n个实时客流量,D为地铁客流数据;
D=[F1,F2,F3,F4,R1,R2,...Rn]。
优选的,在所述的自动调优循环神经网络的工作原理如下:
所述的自动调优循环神经网络包括输入层,特征提取层以及输出层,
将训练数据集输入至自动调优循环神经网络的输入层后,输入层将训练数据集的数据发送到特征提取层中,在特征提取层中,输入层的数据被传送到由GRU单元连接而成的RNN网络中,在特征提取层中一共有n个GRU单元,在GRU单元中,RNN网络首先对训练数据集进行前向传播处理,之后再进行反向传播,更新RNN网络中每一层的参数,并输出最后的结果;
特征提取层的输出R为:
R=GRU(D) (1)
同时在特征提取层中对GRU的输出做一次丢失处理防止过拟合:
R'=dropout(R) (2)
输出层选取GRU最后一个节点作为输出:
Output=Last(R') (3)
优选的,在特征提取层中的GRU单元中,对训练数据集进行前向传播的具体过程如下:
首先,对训练数据集进行前向传播,具体的计算过程如下:
rt=σ(Wr·[ht-1,xt]) (4)
zt=σ(Wz·[ht-1,xt]) (5)
Figure BDA0002273897230000031
Figure BDA0002273897230000032
yt=σ(Wo·ht) (8)
其中,ht为t时刻的输出,xt为t时刻的输入,r代表重置门,z代表更新门,
Figure BDA0002273897230000033
代表候选信息,σ表示sigmod函数;
在遗忘门中,ft为遗忘门的输出,Wf和bf分别为遗忘门的权值和偏差;
在输入门中,it为输入门的输出,Wi和bi分别为遗忘门的权值和偏差,
Figure BDA0002273897230000034
为t时刻备选的用来更新的内容;/>
在输出门中,ot为输出门的输出,Wo和bo分别为遗忘门的权值和偏差;
候选信息梯度:
Figure BDA0002273897230000035
更新门梯度:
Figure BDA0002273897230000036
重置门梯度:
Figure BDA0002273897230000037
往前面步反传时间轴上的误差信号:
Figure BDA0002273897230000041
优选的,在特征提取层中的GRU单元中,对训练数据集进行反向传播的具体过程如下:
候选信息相关:
Figure BDA0002273897230000042
Figure BDA0002273897230000043
Figure BDA0002273897230000044
更新门相关:
Figure BDA0002273897230000045
Figure BDA0002273897230000046
Figure BDA0002273897230000047
重置门相关:
Figure BDA0002273897230000048
Figure BDA0002273897230000049
Figure BDA00022738972300000410
/>
其中L为损失函数,Whr,Whz
Figure BDA00022738972300000411
为Wr,Wz,/>
Figure BDA00022738972300000412
的h部分,Wxr,Wxz,/>
Figure BDA00022738972300000413
为Wr,Wz,/>
Figure BDA00022738972300000414
的x部分。
与现有技术相比,本发明技术方案的有益效果是:
本发明基于门控循环单元GRU模型来对地铁人流量数据进行预测;然后通过随机搜索及贝叶斯优化方法,实现网络模型超参数自动调整,尽量逼近最佳参数。并且本发明实验主要在软件平台实现,不需要高成本的投资建设费用,不需要耗费大量的人力。本发明适用于大规模城域网中的人流量的预测。本发明可为地铁当局提供参考,有效地将有限的资源分配给过度拥挤的区域,改善服务。
附图说明
图1为本发明的步骤流程图。
图2为自动调优循环神经网络的流程图。
图3为GRU的工作原理图。
图4为不同的超参数在不同方法下的搜索情况。
图5为GRU不同节点数最终的训练收敛情况。
图6为珠江新城地铁站出站模型超参数搜索结果。
图7为珠江新城地铁站出站模型超参数搜索结果的重点区间图。
图8为包含天气数据的超参数结果对比图。
图9为科韵路地铁站的出站客流量。
图10为科韵路地铁站的进站客流量。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,一种地铁客流量预测方法,包括以下步骤:
步骤S1:获取地铁客流数据,对地铁客流数据进行特征分析,得到影响地铁客流数据的影响因素;
步骤S2:对影响因素进行数字化处理,得到影响因素数据;
步骤S3:基于影响因素数据得到最终的地铁客流数据,将最终的地铁客流数据划分为训练数据集、测试集以及验证集;
步骤S4:基于门控循环单元GRU构建自动调优循环神经网络;
步骤S5:将训练数据集输入到自动调优循环神经网络中对自动调优循环神经网络进行训练,得到训练好的自动调优循环神经网络;
步骤S6:将测试集输入到训练好的自动调优循环神经网络中,得到地铁客流数据的预测结果;
步骤S7:使用随机搜索及贝叶斯优化方法,对训练好的自动调优循环神经网络进行优化,得到优化后的自动调优循环神经网络;
本发明选择随机搜索而不是网格搜索的原因是,在实际中适合的参数往往在一个完整分布中的一小块部分,使用网络搜索并不能保证直接搜索到合适的超参数中,而随机搜索则大大提高了找到合适参数的可能性。
图4表明重要参数和不重要的参数在不同方法下的搜索情况:给定两个超参数,网格搜索只能在设定的一小组范围内进行,而随机搜索中的每个超参数是独立的。也就是说网格搜索时,由于设定,超参数之间是有些许联系的,并不是独一无二。研究表明随机搜索能够更快地减少验证集的误差。
贝叶斯优化通过基于过去对目标的评估结果建立一个代理函数(概率模型)找到使得目标函数最小的值。代理函数比目标函数更易于优化,因此下一个待评估的输入值是通过对代理函数应用某种标准(通常为预期提升)来选择的。
在本发明中,贝叶斯优化问题有四个组成部分:
1.目标函数:本发明要最小化的对象,这里指带超参数的机器学习模型的验证误差
2.域空间:待搜索的超参数值
3.优化算法:构造代理模型和选择接下来要评估的超参数值的方法
4.结果的历史数据:存储下来的目标函数评估结果,包含超参数和验证损失对于本发明用到的网络模型,如表1所示,一共有四个超参数需要调整。
表1需要调整的超参数
Figure BDA0002273897230000061
其中节点数和学习率因取值范围太大,不能遍历,且其较好取值分布情况也未知,故不能平均划分组合值尝试,只能设定尝试次数进行调优。其中网络类型和数据特征类型是对比分析不同网络不同数据优劣程度的重要因子,需要控制变量进行对比分析,故每种情况都需要尝试。
如果对所有超参数进行全部组合搜索尝试,总尝试次数将达到几百甚至一千次,开销无法接受。考虑到需要尝试不同的网络类型以确定不同模型效果,以及尝试不同数据特征类型以确定客流量的影响因素,故这两个超参数应当控制变量分析。
对于每种数据特征类型而言,本发明选择SAE系统架构演进和GRU网络,使用贝叶斯优化节点数和学习率两个参数。这样能得到不同数据特征在SAE和GRU两种不同网络中的较佳参数。
对于每种网络类型而言,选择上一步得到效果最好的数据特征类型,使用贝叶斯优化节点数和学习率两个参数。这样能在较少的尝试次数下得到影响因素最鲜明的数据特征类型的情况下,各个网络的较佳的参数。
步骤S8:通过均方根误差公式以及平均绝对百分比误差公式对优化后的自动调优循环神经网络进行评价,并使用验证集验证优化后的自动调优循环神经网络的准确性。
优选的,在步骤S1中,经过特征性分析,造成地铁客流量波动的影响因素包括:工作日带来的固定上下班客流、非工作日出游客流、节假日带来的工作日调整以及归乡返程客流、天气因素导致出行方式的改变所带来的客流。
优选的,在步骤S2中,对影响因素进行数字化处理的具体步骤如下:节假日的取值范围为0-1,其中,0代表非节假日,1代表节假日;星期的取值范围为1-7,其中1-7分别代表星期一到星期天;小时的取值范围为0-23,分别代表一天中的24小时;天气的取值范围为0-1,其中0代表不下雨,1为代表下雨;客流量平均值的取值范围为0-20000,代表每小时平均客流量,最终将所有影响因素数据拼接组合在一起,得到最终的输入数据,该输入数据的位数是变长的,并且随着小时数增加而增加,所增加的数据为下一小时的实时客流量。
优选的,将影响因素数据拼接的具体过程如下:
假设节假日为F1、星期为F2、小时为F3、天气为F4,R1为第一个实时客流量,R2为第二个实时客流量,Rn为第n个实时客流量,D为地铁客流数据;
D=[F1,F2,F3,F4,R1,R2,...Rn]。
优选的,在所述的自动调优循环神经网络的工作原理如下:
所述的自动调优循环神经网络包括输入层,特征提取层以及输出层,
如图2所示,将训练数据集输入至自动调优循环神经网络的输入层后,输入层将训练数据集的数据发送到特征提取层中,在特征提取层中,输入层的数据被传送到由GRU单元连接而成的RNN网络中,在特征提取层中一共有n个GRU单元,在GRU单元中,RNN网络首先对训练数据集进行前向传播处理,之后再进行反向传播,更新RNN网络中每一层的参数,并输出最后的结果;
特征提取层的输出R为:
R=GRU(D) (1)
同时在特征提取层中对GRU的输出做一次丢失处理防止过拟合:
R'=dropout(R) (2)
输出层选取GRU最后一个节点作为输出:
Output=Last(R') (3)
优选的,在特征提取层中的GRU单元中,对训练数据集进行前向传播的具体过程如下:
首先,对训练数据集进行前向传播,具体的计算过程如下:
rt=σ(Wr·[ht-1,xt]) (4)
zt=σ(Wz·[ht-1,xt]) (5)
Figure BDA0002273897230000081
Figure BDA0002273897230000082
yt=σ(Wo·ht) (8)
其中,ht为t时刻的输出,xt为t时刻的输入,r代表重置门,z代表更新门,
Figure BDA0002273897230000083
代表候选信息,σ表示sigmod函数;
在遗忘门中,ft为遗忘门的输出,Wf和bf分别为遗忘门的权值和偏差;
在输入门中,it为输入门的输出,Wi和bi分别为遗忘门的权值和偏差,
Figure BDA0002273897230000084
为t时刻备选的用来更新的内容;
在输出门中,ot为输出门的输出,Wo和bo分别为遗忘门的权值和偏差;
候选信息梯度:
Figure BDA0002273897230000085
更新门梯度:
Figure BDA0002273897230000091
重置门梯度:
Figure BDA0002273897230000092
往前面步反传时间轴上的误差信号:
Figure BDA0002273897230000093
优选的,在特征提取层中的GRU单元中,对训练数据集进行反向传播的具体过程如下:
候选信息相关:
Figure BDA0002273897230000094
Figure BDA0002273897230000095
Figure BDA0002273897230000096
更新门相关:
Figure BDA0002273897230000097
Figure BDA0002273897230000098
Figure BDA0002273897230000099
重置门相关:
Figure BDA00022738972300000910
Figure BDA00022738972300000911
Figure BDA00022738972300000912
其中L为损失函数,Whr,Whz
Figure BDA00022738972300000913
为Wr,Wz,/>
Figure BDA00022738972300000914
的h部分,Wxr,Wxz,/>
Figure BDA0002273897230000101
为Wr,Wz,/>
Figure BDA0002273897230000102
的x部分。
实施例2
在本实施例中,选取了具体的站点对本发明进行验证,具体实施过程如下:
本发明使用广州地铁客流量数据进行实验。选择广州地铁站点中具有代表性的几座车站:体育西路站、客村站、科韵路站、大学城北站,用其进出站客流量数据来验证本发明所提出的网络。选取上述车站2017年6到9月间共计112天的客流量数据,同时按照每小时设置间隔,统计每小时的客流总量。将其中91天2184小时的数据作为训练数据集,其中21天504小时的数据作为验证集。用于进行验证实验的广州地铁客流量数据数据量足够大且真实有效。
将地铁客流量客流量可视化,经过特征性分析,可以得出造成客流量波动的因素有:1.工作日带来的固定上下班客流;2.非工作日出游客流;3.节假日带来的工作日调整,归乡返程客流等;4.天气等偶然隐私导致出行方式的改变。对所有的影响因素数字化,得到数据格式如表2。
表2数据格式及说明
Figure BDA0002273897230000103
最终将所有数据拼接组合在一起,得到最终的输入数据,该输入数据是变长的,随着小时数增加而增加,为增加的数据后一小时的实时客流量。输出数据只有一个,即下一小时的客流量。
步骤一:模型训练
使用Microsoft Cognitive Toolkit框架实现SAE(系统架构演进)、RNN(循环神经网络)、LSTM(长短期记忆网络)、GRU网络,并按照上述的参数自动调优方法训练。图5是GRU模型不同节点数最终的loss训练收敛情况。
在超参数搜索中,以搜索查找珠江新城出站模型rnn维度为例,第一轮搜索结果如图6所示。图6中横坐标的1~14对应着RNN节点数的100~1400,当RNN的节点数在100到300之间时,训练出来的预测结果的RSME值最小,第二轮搜索将重点寻找100-300的区间,如图7所示;
表3是最后一轮搜索值以及最终结果。可见很快的找到较佳的维度超参数110。
表3最后一轮搜索值
Figure BDA0002273897230000111
步骤二:不同数据特征类型对比
此处对比客村站,得到表4。
表4与客村站对比
Figure BDA0002273897230000112
/>
Figure BDA0002273897230000121
图8所示,三角为带天气数据,圆点为不带天气数据。
步骤三:不同模型效果对比
分别训练两个模型来预测进站客流量和出站客流量。同时设置不同的神经元个数,以寻求更好的效果。对于大学城北站出站客流量,各组参数的效果如表5所示。其中可以看到,R-NET在各种参数下均取得明显优于SAE的效果。
表5
Figure BDA0002273897230000122
步骤四:不同站点对比
对于3个站点的进出站客流量预测结果,如表6所示。
表6
Figure BDA0002273897230000123
步骤五:模型预测结果分析
总的来说,使用循环神经网络的R-NET在各个站点都取得非常好的效果,其平均绝对百分比误差均在10%以内,甚至有的能取得5%以内的效果,同时均方根误差也控制在一个很低的范围,相比预测的客流量都是在千和万的数量级。
如图9、10所示,图9为科韵路地铁站的出站客流量,图10为科韵路地铁站的进站客流量。本发明实现的R-NET模型很好的预测客流信息,其预测客流量基本吻合真实客流情况。
本发明在使用多种神经网络对广州地铁客流量进行预测之后,对结果进行了比较,发现采用的循环神经网络的变式GRU模型效果最好,平均绝对百分比误差均在10%以内,甚至有的能取得5%以内的效果,这种结果对于其他方法来说,有着很大的提升。另外,经实验发现,加入诸如天气之类的其他影响因素并不能有效的提高客流量预测准确性,分析应对是天气数据并非实时且不准确,故难以对出行客流构成较大影响。
在训练模型方面,本发明采用基于选择搜索的贝叶斯优化调参方法,能够让模型取得更好的预测结果,同时减少训练带来的开销。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (6)

1.一种地铁客流量预测方法,其特征在于,包括以下步骤:
步骤S1:获取地铁客流数据,对地铁客流数据进行特征分析,得到影响地铁客流数据的影响因素;
步骤S2:对影响因素进行数字化处理,得到影响因素数据;
步骤S3:基于影响因素数据得到最终的地铁客流数据,将最终的地铁客流数据划分为训练数据集、测试集以及验证集;
步骤S4:基于门控循环单元GRU构建自动调优循环神经网络;所述的自动调优循环神经网络中包括输入层,特征提取层以及输出层;所述特征提取层中一共有n个GRU单元,在GRU单元中,首先对训练数据集进行前向传播处理,之后再进行反向传播,更新网络中每一层的参数,并输出最后的结果;对训练数据集进行前向传播的具体过程如下:
首先,对训练数据集进行前向传播,具体的计算过程如下:
rt=σ(Wr·[ht-1,xt]) (4)
zt=σ(Wz·[ht-1,xt]) (5)
Figure FDA0004137404620000011
Figure FDA0004137404620000012
yt=σ(Wo·ht) (8)
其中,ht为t时刻的输出,xt为t时刻的输入,r代表重置门,z代表更新门,
Figure FDA0004137404620000013
代表候选信息,σ表示sigmod函数;
在重置门中,rt为重置门的输出,Wr为重置门的权值;
在更新门中,zt为更新门的输出,Wz为更新门的权值;
在候选信息中,
Figure FDA0004137404620000014
为候选信息的权值,Wo为输出的权值;
候选信息梯度:
Figure FDA0004137404620000015
更新门梯度:
Figure FDA0004137404620000021
重置门梯度:
Figure FDA0004137404620000022
往前面步反传时间轴上的误差信号:
Figure FDA0004137404620000023
其中,L为损失函数,Whz和Wxz分别为更新门的参数矩阵,
Figure FDA0004137404620000024
为t时刻备选的用来更新的内容,/>
Figure FDA0004137404620000025
和/>
Figure FDA0004137404620000026
为候选信息的参数矩阵,上标T代表矩阵的转置操作;/>
对训练数据集进行反向传播的具体过程如下:
候选信息相关:
Figure FDA0004137404620000027
Figure FDA0004137404620000028
Figure FDA0004137404620000029
更新门相关:
Figure FDA00041374046200000210
Figure FDA00041374046200000211
Figure FDA00041374046200000212
重置门相关:
Figure FDA00041374046200000213
Figure FDA00041374046200000214
Figure FDA0004137404620000031
其中L为损失函数,Whz和Wxz分别为更新门的参数矩阵,
Figure FDA0004137404620000032
和/>
Figure FDA0004137404620000033
分别为候选信息的参数矩阵,Whr和Wxr为别为遗忘门的参数矩阵,上标T代表矩阵的转置操作;
步骤S5:将训练数据集输入到自动调优循环神经网络中对自动调优循环神经网络进行训练,得到训练好的自动调优循环神经网络;
步骤S6:将测试集输入到训练好的自动调优循环神经网络中,得到地铁客流数据的预测结果;
步骤S7:使用随机搜索及贝叶斯优化方法,对训练好的自动调优循环神经网络进行优化,得到优化后的自动调优循环神经网络;
步骤S8:通过均方根误差公式以及平均绝对百分比误差公式对优化后的自动调优循环神经网络进行评价,并使用验证集验证优化后的自动调优循环神经网络的准确性。
2.根据权利要求1所述的一种地铁客流量预测方法,其特征在于,在步骤S1中,经过特征性分析,造成地铁客流量波动的影响因素包括:工作日带来的固定上下班客流、非工作日出游客流、节假日带来的工作日调整以及归乡返程客流、天气因素导致出行方式的改变所带来的客流。
3.根据权利要求1所述的一种地铁客流量预测方法,其特征在于,在步骤S2中,对影响因素进行数字化处理的具体步骤如下:节假日的取值范围为0-1,其中,0代表非节假日,1代表节假日;星期的取值范围为1-7,其中1-7分别代表星期一到星期天;小时的取值范围为0-23,分别代表一天中的24小时;天气的取值范围为0-1,其中0代表不下雨,1为代表下雨;客流量平均值的取值范围为0-20000,代表每小时平均客流量,最终将所有影响因素数据拼接组合在一起,得到最终的输入数据,该输入数据的位数是变长的,并且随着小时数增加而增加,所增加的数据为下一小时的实时客流量。
4.根据权利要求3所述的一种地铁客流量预测方法,其特征在于,将影响因素数据拼接的具体过程如下:
假设节假日为F1、星期为F2、小时为F3、天气为F4,R1为第一个实时客流量,R2为第二个实时客流量,Rn为第n个实时客流量,D为地铁客流数据;
D=[F1,F2,F3,F4,R1,R2,...Rn]。
5.根据权利要求4所述的一种地铁客流量预测方法,其特征在于,在所述的自动调优循环神经网络的工作原理如下:
将训练数据集输入至自动调优循环神经网络的输入层后,输入层将训练数据集的数据发送到特征提取层中,在特征提取层中,输入层的数据被传送到由GRU单元连接而成的循环神经网络,即RNN网络中,在特征提取层中一共有n个GRU单元,在GRU单元中,RNN网络首先对训练数据集进行前向传播处理,之后再进行反向传播,更新RNN网络中每一层的参数,并输出最后的结果;
特征提取层的输出R为:
R=GRU(D) (1)
同时在特征提取层中对GRU的输出做一次丢失处理防止过拟合:
R'=dropout(R) (2)
输出层选取GRU最后一个节点作为输出:
Output=Last(R') (3)
6.根据权利要求5所述的一种地铁客流量预测方法,其特征在于,所述的RNN网络使用tanh作为激活函数,ht=tanh(Wc·[ht-1,xt]+bc),其中Wc和bc分别为隐藏层的权值和偏差,ht为t时刻的输出,xt为t时刻的输入。
CN201911115405.9A 2019-11-14 2019-11-14 一种地铁客流量预测方法 Active CN111027673B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911115405.9A CN111027673B (zh) 2019-11-14 2019-11-14 一种地铁客流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911115405.9A CN111027673B (zh) 2019-11-14 2019-11-14 一种地铁客流量预测方法

Publications (2)

Publication Number Publication Date
CN111027673A CN111027673A (zh) 2020-04-17
CN111027673B true CN111027673B (zh) 2023-05-26

Family

ID=70205716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911115405.9A Active CN111027673B (zh) 2019-11-14 2019-11-14 一种地铁客流量预测方法

Country Status (1)

Country Link
CN (1) CN111027673B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112116070B (zh) * 2020-09-07 2024-04-05 北方工业大学 地铁车站环境参数监测方法及装置
CN112242060B (zh) * 2020-10-16 2022-06-21 深圳先进技术研究院 交通流量预测方法及装置、计算机设备及可读存储介质
CN112257614B (zh) * 2020-10-26 2022-05-17 中国民航大学 一种基于图卷积网络的航站楼客流量时空分布预测方法
CN112905659A (zh) * 2021-02-05 2021-06-04 希盟泰克(重庆)实业发展有限公司 一种基于bim与人工智能的城市轨道交通数据分析方法
CN113371037A (zh) * 2021-04-30 2021-09-10 北京城建智控科技有限公司 基于gru神经网络的运行图编制方法及系统
CN113837441A (zh) * 2021-08-24 2021-12-24 山东大学 考虑eemd分解后重构准确性的电力负荷预测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109816095A (zh) * 2019-01-14 2019-05-28 湖南大学 基于改进门控循环神经网络的网络流量预测方法
CN110322695A (zh) * 2019-07-23 2019-10-11 内蒙古工业大学 一种基于深度学习的短时交通流预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109816095A (zh) * 2019-01-14 2019-05-28 湖南大学 基于改进门控循环神经网络的网络流量预测方法
CN110322695A (zh) * 2019-07-23 2019-10-11 内蒙古工业大学 一种基于深度学习的短时交通流预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于循环神经网络的网络舆情趋势预测研究;孙靖超;周睿;李培岳;芦天亮;;情报科学(08);第120-124页 *

Also Published As

Publication number Publication date
CN111027673A (zh) 2020-04-17

Similar Documents

Publication Publication Date Title
CN111027673B (zh) 一种地铁客流量预测方法
Khosravi et al. A genetic algorithm-based method for improving quality of travel time prediction intervals
Mazloumi et al. Prediction intervals to account for uncertainties in neural network predictions: Methodology and application in bus travel time prediction
Stathopoulos et al. Fuzzy modeling approach for combined forecasting of urban traffic flow
CN109816095A (zh) 基于改进门控循环神经网络的网络流量预测方法
Yu et al. A special event-based K-nearest neighbor model for short-term traffic state prediction
Peeta et al. Adaptability of a hybrid route choice model to incorporating driver behavior dynamics under information provision
Lin et al. A spatial-temporal hybrid model for short-term traffic prediction
CN116721537A (zh) 基于gcn-ipso-lstm组合模型的城市短时交通流预测方法
Chen et al. A multiscale-grid-based stacked bidirectional GRU neural network model for predicting traffic speeds of urban expressways
CN115410372B (zh) 基于贝叶斯lstm的高速公路交通流量可靠预测方法
CN111553535A (zh) 一种基于ae-lstm-bo车流量预测的导航参考方法
CN110826244A (zh) 模拟轨道交通影响城市生长的共轭梯度元胞自动机方法
CN116311921A (zh) 一种基于多空间尺度时空Transformer的交通速度预测方法
Cui et al. Improved genetic algorithm to optimize the Wi-Fi indoor positioning based on artificial neural network
CN116153125A (zh) 一种基于ida-rnn模型的空间维度公交到达时间预测方法
CN112927507B (zh) 一种基于LSTM-Attention的交通流量预测方法
CN111524349B (zh) 一种语境特征注入的多尺度交通流预测模型建立方法及使用方法
Xiangdong et al. Prediction of short-term available parking space using LSTM model
CN116612633A (zh) 一种基于车路协同感知下的自适应动态路径规划方法
CN115730744A (zh) 基于用户模式与深度学习联合模型的用水量预测方法及系统
Zhu et al. Large-scale travel time prediction for urban arterial roads based on Kalman filter
CN116110219A (zh) 交通事故预测方法
CN112634620B (zh) 基于Encoder-Decoder深度神经网络的路网动态交通分配方法
Avşar et al. Parking lot occupancy prediction using long short-term memory and statistical methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant