CN113902011A - 基于循环神经网络的城市轨道交通短时客流预测方法 - Google Patents

基于循环神经网络的城市轨道交通短时客流预测方法 Download PDF

Info

Publication number
CN113902011A
CN113902011A CN202111170942.0A CN202111170942A CN113902011A CN 113902011 A CN113902011 A CN 113902011A CN 202111170942 A CN202111170942 A CN 202111170942A CN 113902011 A CN113902011 A CN 113902011A
Authority
CN
China
Prior art keywords
passenger flow
layer
model
clustering
site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111170942.0A
Other languages
English (en)
Inventor
吴志雄
张惠臻
高正凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Linewell Software Co Ltd
Original Assignee
Linewell Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Linewell Software Co Ltd filed Critical Linewell Software Co Ltd
Priority to CN202111170942.0A priority Critical patent/CN113902011A/zh
Priority to PCT/CN2021/134969 priority patent/WO2023056696A1/zh
Publication of CN113902011A publication Critical patent/CN113902011A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明实施例公开一种基于循环神经网络的城市轨道交通短时客流预测方法,包括:获取历史站点客流量数据集,根据站点聚类数目和客流量的最大值及最小值,计算每一个聚类的聚类中心点,然后采用聚类算法对站点客流量数据集进行聚类,实现对站点的聚类;根据输入变量将历史站点客流量数据集与天气数据进行整合得到模型数据集,基于LSTM模型与GRU模型搭建短时客流预测模型,然后训练直至收敛,得到优化的短时客流预测模型及其参数组合。本发明实施例还通过RMSE与MAE的模型评价方法对得到的短时客流预测模型进行评价,从而验证模型预测结果的准确性。本发明方法考虑因素全面,实用性强,可为轨道交通运营管理提供必要的参考数据,大大提高运营管理效率。

Description

基于循环神经网络的城市轨道交通短时客流预测方法
技术领域
本发明涉及智慧交通技术领域,特别涉及一种基于循环神经网络的城市 轨道交通短时客流预测方法。
背景技术
近年,我国经济快速发展,越来越多的中小型城市向大型城市转变,城 市化水平不断提高,居民的出行需求也随着城市规模的扩大而增长,进而交 通拥堵成为了许多城市面临的新问题。轨道交通凭借着其高效便捷、运输量 大等特点,成为了许多城市解决交通拥堵问题的重要方案之一。轨道交通系 统在各大城市得到蓬勃发展,相关统计显示,截至2020年底,中国大陆地 区先后有45个城市开通运营了城市轨道交通系统,线路合计244条,总里 程达7969.7千米;此外中国大陆地区2020年轨道交通总客运量达175.27 亿人次,受疫情影响,客运量较2019年下降26.40%。
从2016年到2020年的5年间,全国共新增运营线路长度为4263千米, 年均新增运营线路长度872千米,轨道交通运营里程处于世界前列,我国已 成为城市轨道交通大国。然而,城市轨道交通网络规模的不断扩大,也使得 城市轨道交通的运营管理问题接踵而来,如高峰时段运输组织难度大、高峰 运输存在安全隐患、应急预案可操作性不强等。
为有效解决城市轨道交通运营管理问题,进一步提高城市轨道交通的运 营组织水平,精细化、综合化、智能化已然成为城市轨道交通运营管理下一 阶段的发展方向。城市轨道交通在乘客出行交通方式选择中优先级的提高, 有赖于良好的运营管理,而运营管理工作的核心是掌握运输需求规律,首先 就要分析并掌握客流规律以设计良好的运行服务,所以,要提高轨道交通服 务水平与轨道交通在乘客出行交通方式选择中优先级,首要任务就是解决如 何准确的预测乘客出行客流规律的问题。
现有方法未对站点客流的时空特征进行分析,且因变量选择单一,大多 数方法只将历史客流量作为模型输入变量,而忽略了其他因素对客流的影 响,预测结果与实际客流的差距比较大。
发明内容
本发明要解决的技术问题,在于提供一种基于循环神经网络的城市轨道 交通短时客流预测方法,通过对站点进行聚类,然后根据聚类结果和相关性 分析构造模型数据集,从而实现快速且准确地对短时客流进行预测。
为了解决上述问题,本发明实施例提供了一种基于循环神经网络的城市 轨道交通短时客流预测方法,包括:站点聚类过程及预测模型构建训练过程;
所述站点聚类过程包括:
获取历史站点客流量数据集,根据站点聚类数目和客流量的最大值及最 小值,计算每一个聚类的聚类中心点,然后采用聚类算法基于站点客流量数 据集实现对站点的聚类;
所述预测模型构建训练过程包括:
设定输入变量,然后根据所述输入变量将历史站点客流量数据集与天气 数据进行整合得到模型数据集;所述输入变量包括站点历史客流量、天气条 件、是否为高峰时段以及是否为工作日;其中,所述站点历史客流量根据不 同时间粒度进行划分,所述天气条件通过对天气变量与客流量进行相关性分 析,将相关性大于设定条件的天气变量作为模型的天气条件输入变量,是否 为高峰时段根据站点的聚类结果进行对应设置;
基于LSTM模型与GRU模型搭建短时客流预测模型,然后划分所述模 型数据集得到训练集和测试集,将所述训练集输入所述短时客流预测模型, 通过训练迭代到规定的迭代次数直至收敛,得到优化的短时客流预测模型及 其参数组合。
进一步地,所述站点聚类过程具体包括:
步骤11、获取站点客流量数据集N,站点数目为n,站点聚类数目为k, 计算所有样本数据的最大值Max(N)与最小值Min(N),选取Max(N)与Min(N)间的k+1等分点作为初始每一个聚类c的聚类中心点 μc,c=1,2,…,k;
步骤12、计算所有样本点i,i=1,2,…,n到已经被选定的每一个聚类中心 μc的距离dis(i,μc),
Figure BDA0003293125820000036
将 样本点i分配给与其距离最近的聚类中心所代表的类c*中,
Figure BDA0003293125820000031
步骤13、计算每个聚类中样本点客流均值
Figure BDA0003293125820000032
其中,Ic表示聚类c中的所有项目;将Ac作为新的聚类中心,即μc=Ac,c=1,2,…,k;
步骤14、记录上轮聚类中的距离和lastSc=Sc,重复步骤12;
步骤15、如果lastSc与Sc相差大于0.0001,则返回步骤13,否则聚类结 束。
进一步地,所述预测模型构建训练过程中,利用Pearson相关系数对天 气变量与客流量进行相关性分析,Pearson相关系数如下式:
Figure BDA0003293125820000033
其中,X是客流量数据,Xi表示第i个时间段的客流量,
Figure BDA0003293125820000034
与SX分别是 客流量的平均数和方差;Y是影响因素相关的数据,Yi表示第i个时间段的 影响因素的值,
Figure BDA0003293125820000035
与SY分别是影响因素值的平均数和方差,n是数据量。
进一步地,所述预测模型构建训练过程中,短时客流预测模型具体包括: 输入层、至少一个隐藏层及输出层,其中,每一隐藏层由七层LSTM模型 或GRU模型及四层Dropout层组成。
进一步地,所述短时客流预测模型包括第一隐藏层和第二隐藏层;所述 第一隐藏层和第二隐藏层的输入端均分别与所述输入层连接,所述第一隐藏 层和第二隐藏层的输出端均分别与所述输出层连接;
所述第一隐藏层依次包括:第一LSTM层、第二LSTM层、第三LSTM 层、第一Dropout层、第四LSTM层、第二Dropout层、第五LSTM层、第 六LSTM层、第三Dropout层、第七LSTM层以及第三Dropout层;
所述第二隐藏层依次包括:第一GRU层、第二GRU层、第三GRU层、 第一Dropout层、第四GRU层、第二Dropout层、第五GRU层、第六GRU 层、第三Dropout层、第七GRU层以及第三Dropout层。
进一步地,所述方法还包括:模型评价过程;
所述模型评价过程包括:利用训练之后的模型取得预测结果,计算所述 预测结果和真实客流量的均方根误差以及平均绝对误差,根据计算结果得到 各类站点及不同时间粒度下的预测精度。
进一步地,所述模型评价过程中,计算均方根误差具体采用如下公式:
Figure BDA0003293125820000041
其中,n代表数据量,yi
Figure BDA0003293125820000042
分别代表真实值与预测值。
进一步地,所述模型评价过程中,计算平均绝对误差具体采用如下公式:
Figure BDA0003293125820000043
其中,n代表数据量,yi
Figure BDA0003293125820000044
分别代表真实值与预测值。
本发明实施例中提供的技术方案至少具有如下技术效果或优点:
1、针对站点客流的空间特征,使用聚类算法对站点进行聚类分析 (SK-means),将站点按照客流量进行分类,然后基于聚类分析结果,对 每类站点设定不同的高峰时段作为参数输入模型,使得模型更为精准;
2、除历史客流量外,还考虑了天气因素与客流特征时段(高峰时段与 平峰时段、工作日与非工作日)对客流的影响,利用Pearson相关系数对以 上因素与客流量的相关性进行分析,并将以上因素作为变量输入模型,提高 模型的预测精度;
3、使用聚类算法对站点进行聚类分析时,通过合理的初始点选取,使 得聚类算法运行更快。
4、本发明实施例方法可用于相关部门制定应急方案、制定动态运输策 略以及乘客出行规划,使相关部门掌握具体客流运输规律。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技 术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它 目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明实施例方法的流程示意图;
图2为本发明实施例一中基于SK-means聚类算法的轨道交通站点聚类 方法的技术路线图;
图3为本发明实施例一中基于SPFF的轨道交通短时客流预测模型的技 术路线图;
图4为本发明实施例一中SPFF的模型结构图;
图5为本发明实施例二中在厦门轨道交通客流数据集上通过SPFF预 测,高客流量站点(a为镇海路站、b为乌石浦站)在5分钟时间粒度下的 预测结果图;
图6为本发明实施例二中在厦门轨道交通客流数据集上通过SPFF预 测,高客流量站点(a为镇海路站、b为乌石浦站)在10分钟时间粒度下的 预测结果图;
图7为本发明实施例二中在厦门轨道交通客流数据集上通过SPFF预 测,高客流量站点(a为镇海路站、b为乌石浦站)在15分钟时间粒度下的 预测结果图;
图8为本发明实施例二中在厦门轨道交通客流数据集上通过SPFF预 测,中客流量站点(a为吕厝站、b为集美学村站)在5分钟时间粒度下的 预测结果图;
图9为本发明实施例二中在厦门轨道交通客流数据集上通过SPFF预 测,中客流量站点(a为吕厝站、b为集美学村站)在10分钟时间粒度下的 预测结果图;
图10为本发明实施例二中在厦门轨道交通客流数据集上通过SPFF预 测中客流量站点(a为吕厝站、b为集美学村站)在15分钟时间粒度下的预 测结果图;
图11为本发明实施例二中在厦门轨道交通客流数据集上通过SPFF预 测低客流量站点(a为官任站、b为集美大道站)在5分钟时间粒度下的预 测结果图;
图12为本发明实施例二中在厦门轨道交通客流数据集上通过SPFF预 测低客流量站点(a为官任站、b为集美大道站)在10分钟时间粒度下的预 测结果图;
图13为本发明实施例二中在厦门轨道交通客流数据集上通过SPFF预 测低客流量站点(a为官任站、b为集美大道站)在15分钟时间粒度下的预 测结果图。
具体实施方式
本发明要解决的技术问题,在于提供一种基于循环神经网络的城市轨道 交通短时客流预测方法,通过对站点进行聚类,然后根据聚类结果和相关性 分析构造模型数据集,从而实现快速且准确地对短时客流进行预测。
本发明的总体思路如下:
(1)本发明特别对站点的时空特征进行了分析,针对站点客流的空间特 征使用SK-means(Station K-means)聚类算法对站点进行聚类分析,将站 点按照客流量大小划分为若干类(比如,分为高客流量站点、中客流量站点、 低客流量站点三类),在传统K-means聚类方法的基础上,SK-means在初 始聚类中心选择时进行了改进,根据客流规律获取更为接近聚类结果的聚类 中心作为初始值。然后在后续预测模型训练过程中,可以针对站点客流的时 间特征,基于聚类分析结果,对每类站点分析它们的客流高峰,设定不同的 高峰时段。在实际预测中,客流高峰时间段将作为参数输入模型,对于不同 类别站点也会有不同的参数和模型选择(LSTM或GRU)。
(2)本发明除历史客流量外,还考虑了天气因素(温度、湿度、能见度、 降水量、云量)与客流特征时段(高峰时段与平峰时段、工作日与非工作日) 对客流的影响,利用Pearson相关系数对以上因素与客流量的相关性进行分 析,并将以上因素作为变量输入模型,提高模型的预测精度。由于传统的 RNN在训练过程中容易产生梯度爆炸和梯度消失等问题,产生了利用“门” 调整RNN隐藏层结构的LSTM模型及其变体GRU模型。基于LSTM与GRU模型搭建了一个七层的短时客流预测模型结构(Short-term Passenger FlowForecasting,SPFF)。对第一部分求得的不同类别站点采用不同的模型参数 使得预测结果更为精确。
(3)本发明中使用的预测时间粒度有5分钟、10分钟、15分钟三种,可 根据实际需求选择合适的时间粒度进行预测,或根据不同的站点类型分析更 合适的预测时间粒度。实例证明对于不同类别的站点,有不同的最优时间粒 度选择。
实施例一
本实施例提供了一种基于循环神经网络的城市轨道交通短时客流预测 方法,如图1所示,包括:站点聚类过程及预测模型构建训练过程;
所述站点聚类过程包括:
获取历史站点客流量数据集,根据站点聚类数目和客流量的最大值及最 小值,计算每一个聚类的聚类中心点,然后采用聚类算法基于站点客流量数 据集实现对站点的聚类;
所述预测模型构建训练过程包括:
设定输入变量,然后根据所述输入变量将历史站点客流量数据集与天气 数据进行整合得到模型数据集;所述输入变量包括站点历史客流量、天气条 件、是否为高峰时段以及是否为工作日;其中,所述站点历史客流量根据不 同时间粒度进行划分,所述天气条件通过对天气变量与客流量进行相关性分 析,将相关性大于设定条件的天气变量作为模型的天气条件输入变量,是否 为高峰时段根据站点的聚类结果进行对应设置;
基于LSTM模型与GRU模型搭建短时客流预测模型,然后划分所述模 型数据集得到训练集和测试集,将所述训练集输入所述短时客流预测模型, 通过训练迭代到规定的迭代次数直至收敛,得到优化的短时客流预测模型及 其参数组合。
作为本发明的一种具体实现方式:
如图2所示,所述站点聚类过程具体包括:
步骤11、获取站点客流量数据集N,站点数目为n,站点聚类数目为k, 计算所有样本数据的最大值Max(N)与最小值Min(N),选取Max(N)与 Min(N)间的k+1等分点作为初始每一个聚类c的聚类中心点 μc,c=1,2,…,k;
步骤12、计算所有样本点i,i=1,2,…,n到已经被选定的每一个聚类中心 μc的距离dis(i,μc),
Figure BDA0003293125820000086
将 样本点i分配给与其距离最近的聚类中心所代表的类c*中,
Figure BDA0003293125820000081
步骤13、计算每个聚类中样本点客流均值
Figure BDA0003293125820000082
其中,Ic表示聚类c中的所有项目;将Ac作为新的聚类中心,即μc=Ac,c=1,2,…,k;
步骤14、记录上轮聚类中的距离和lastSc=Sc,重复步骤12;
步骤15、如果lastSc与Sc相差大于0.0001,则返回步骤13,否则聚类结 束。
通过将新一轮聚类中的距离和Sc与上轮聚类中的距离和lastSc相比较, 直到差值小于等于一设定值后聚类结束。针对客流量分布的特性,通过将 k+1等分点作为初始每一个聚类c的聚类中心点,实现初始中心点的合理设 置,从而使得聚类速度更快。
所述预测模型构建训练过程中,利用Pearson相关系数对天气变量与客 流量进行相关性分析,Pearson相关系数如下式:
Figure BDA0003293125820000083
其中,X是客流量数据,Xi表示第i个时间段的客流量,
Figure BDA0003293125820000084
与SX分别是 客流量的平均数和方差;Y是影响因素相关的数据,Yi表示第i个时间段的 影响因素的值,
Figure BDA0003293125820000085
与SY分别是影响因素值的平均数和方差,n是计算pearson 相关系数的数据量。对于Pearson相关系数的评判标准,其取值范围是-1至 1,且越小说明两个数据的相关程度越弱,的正负则表示不同的相关关系, 为正值则说明量数据正相关,反之为负相关。
所述预测模型构建训练过程中,短时客流预测模型具体包括:输入层、 至少一个隐藏层及输出层,其中,每一隐藏层由七层LSTM模型或GRU模 型及四层Dropout层组成。
虽然一个隐藏层就可以满足预测需求,但由于LSTM模型与GRU模型 在不同情况下表现各有优势,因此,在一具体实施例中,如图3所示,所述 短时客流预测模型包括第一隐藏层和第二隐藏层;所述第一隐藏层和第二隐 藏层的输入端均分别与所述输入层连接,所述第一隐藏层和第二隐藏层的输 出端均分别与所述输出层连接;
所述第一隐藏层依次包括:第一LSTM层、第二LSTM层、第三LSTM 层、第一Dropout层、第四LSTM层、第二Dropout层、第五LSTM层、第 六LSTM层、第三Dropout层、第七LSTM层以及第三Dropout层;
所述第二隐藏层依次包括:第一GRU层、第二GRU层、第三GRU层、 第一Dropout层、第四GRU层、第二Dropout层、第五GRU层、第六GRU 层、第三Dropout层、第七GRU层以及第三Dropout层。
然后根据后续的模型预测准确度的验证结果,根据预测需求来选择表现 更好的隐藏层进行预测。
为了验证模型在各个时间粒度以及不同模型下的预测准确度,所述方法 还包括:模型评价过程;
所述模型评价过程包括:将测试集输入训练之后的模型取得预测结果, 计算所述预测结果和真实客流量的均方根误差(RMSE)以及平均绝对误差 (MAE)。
计算均方根误差具体采用如下公式:
Figure BDA0003293125820000091
其中,n代表数据量,yi
Figure BDA0003293125820000101
分别代表真实值与预测值。
计算平均绝对误差具体采用如下公式:
Figure BDA0003293125820000102
其中,n代表数据量,yi
Figure BDA0003293125820000103
分别代表真实值与预测值。
最后根据计算结果得到各类站点及不同时间粒度下的预测精度,一方面 可以验证模型的准确度,另一方面在后续的模型应用过程中,可以根据预测 需求来选择表现更好的隐藏层进行预测。
实施例二
请参考图4至图13,本实施例采用厦门市2019年9月至2019年12月 轨道一号线的站点客流进出站数据进行分析,步骤如下:
1)数据文件由厦门市交通局提供,采用csv文件进行存储,数据文件 由12个字段构成(如表1所示)
表1 客流量数据字段
Figure BDA0003293125820000104
Figure BDA0003293125820000111
将站点客流进出站数据按照日期划分,统计得到2019年12月轨道交通 一号线各站点的每日客流情况,再计算得各站点的日均客流量数据,如表2 所示。
表2 厦门轨道交通一号线各站点2019年12月日均客流量数据
Figure BDA0003293125820000112
2)根据步骤1的内容,将日均客流量数据集输入SK-means聚类算法 中,将站点聚类分为三类,聚类结果如表3所示
表3 厦门轨道交通一号线站点聚类分析结果
Figure BDA0003293125820000113
Figure BDA0003293125820000121
步骤2、基于SPFF的轨道交通短时客流预测模型实现的具体步骤:
步骤2同样采用厦门市2019年9月至2019年12月轨道一号线的站点 客流进出站数据进行分析,步骤如下:
1)首先,本示例使用的进出站数据文件字段如表1所示;同时本实例 融合了天气数据进行预测,数据来源为国家天气数据共享平台,采用csv文 件进行存储,数据文件由8个字段构成(如表4所示)。对客流和天气数据 集进行清洗后,分别按照5分钟、10分钟、15分钟时间粒度对以上数据进 行划分。
表4 天气数据字段描述
Figure BDA0003293125820000122
2)其次,利用Pearson相关系数对历史前三个时间段(即前15min至 当前时刻、前30min-前15min、前45min-前30min)的客流量与天气数据(温 度、湿度、风速、风级、能见度、降水量、云量)进行相关性分析,Pearson 相关系数如公式1所示,分析结果如表5所示
表5 客流量与天气数据的Pearson相关系数
Figure BDA0003293125820000131
由表5可知,温度、湿度、能见度、降水量、云量五个天气数据的Pearson 相关系数均在99%的置信区间内,即这五项天气数据与客流量数据相关性 高;而风速、风级数据与客流量数据并没有很强的相关性,故在进行短时客 流预测时,剔除这两项数据。历史客流量的数据中,前三个时间段客流量的 Pearson相关系数值均在99%的置信区间内。
同时,根据已有研究成果以及一般规律情况,将是否为高峰时间段纳入 客流影响因素考虑范围,用1表示高峰时间段,0表平峰时间段,用-1表示 轨道交通停运时间段。同时将是否为工作日纳入客流影响因素考虑范围,用 1表示非工作日,0表示工作日。
综上所述,在本实例中,共将8个指标纳入短时客流的影响因素的考虑 范畴,相关描述如表6所示。
表6 轨道交通短时客流影响因素
Figure BDA0003293125820000132
3)然后,根据步骤1站点聚类分析结果,为不同类站点设定不同的高 峰时间段。
高客流量站点有两个:镇海路站和乌石浦站,两站点位于厦门的商业中 心附近,故工作日有着明显的早晚高峰时间段,同时在非工作日有着较长的 高峰客流时间段,客流量大小与工作日高峰基本相同。因此对于高客流量站 点,本研究中设置其工作日高峰时间段为7:30~8:30与17:30~18:30,非工作 日高峰时间段为14:30~18:30。
客流量站点多与厦门市内居民区或景点临近,或本身为重要的交通枢纽 站,集美学村站半径一千米的范围内就包括了商业中心(集美万达广场)、 学校(集美大学、华侨大学华文学院)、景区(龙舟池景区、陈嘉庚故居景 区),是商业、文教和休闲娱乐的集散地。以集美学村站为代表的中客流量 站点,工作日高峰时间段也基本维持在7:30—8:30与17:30—18:30,但在周 末虽然也有赶超工作日的高峰客流,但相比于高客流量站点,前者非工作日 高峰时间段更短,设置为17:30~19:00。
低客流量站点多为厦门岛外站点,远离人口密集居住区级商业中心。以 集美大道站为代表的低客流量站点在工作日有着与高、中客流量站点相似的 高峰时间段,这些高峰时间段主要由乘客上下班通勤所带来。工作日早高峰 时间客流以进站客流为主,晚高峰时间客流以出站客流为主,有着明显的通 勤特征。而在非工作日,整体客流并无明显的高峰时间分布特征。因此对于 低客流量站点,本研究中设置其工作日高峰时间段为7:30~8:30与 17:30~18:30,非工作日不设置高峰时间段。
三类站点的高峰时段设置如表7所示
表7 高峰时段设置
Figure BDA0003293125820000141
4)基于以上步骤分析,将数据集进行整合,作为模型的输入变量,按 照训练集80%、预测集20%的比例来构造数据集。如表8所示。
表8 训练集及测试集构造情况
Figure BDA0003293125820000151
5)之后基于LSTM与GRU模型搭建短时客流预测模型结构(Short-term PassengerFlow Forecasting,SPFF),如图3所示。
模型在LSTM层与GRU层之间穿插着Dropout层,网络训练过程中的 神经元会被Dropout层按照设定的概率从网络中暂时移除,模型将使用剩余 的神经元及其权重参数进行下一层的预测。其余参数情况如表9所示
表9 SPFF参数设置
Figure BDA0003293125820000152
6)将客流量数据训练集及测试集输入SPFF模型,经过800轮训练之 后的模型,进行轨道交通短时客流预测测试。得到的结果如图所示。
本实施例模型的训练过程使用了计算机的GPU,相比于使用CPU的训 练时间大幅缩短。以GRU模型800轮的训练时间为例进行展示,如表10 所示。
表10 模型训练时间
Figure BDA0003293125820000153
Figure BDA0003293125820000161
步骤3、基于RMSE与MAE的模型评价方法实现的具体步骤:
1)RMSE与MAE可以很好的表示预测值与真实值之间的差距,故比 较模型预测结果的RMSE与MAE,性能越好的模型预测值与真实值的差距 越小,两个评价指标的值也越小。根据公式建立RMSE与MAE模型评价方 法。
2)表11、表12、表13展示了LSTM与GRU模型对各类型站点,以 不同时间粒度进行预测的结果的RMSE与MAE。由表可知,对于所有站点, 5分钟时间粒度的预测结果均优于10分钟和15分钟的预测结果。对于中高 客流量的站点(以镇海路、乌石浦、吕厝、集美学村为例),GRU模型性 能更好;对于低客流量的站点,GRU模型与LSTM模型的性能十分接近。
表11 模型预测结果比较分析——高客流量站点
Figure BDA0003293125820000162
表12 模型预测结果比较分析——中客流量站点
Figure BDA0003293125820000171
表13 模型预测结果比较分析——低客流量站点
Figure BDA0003293125820000172
根据表可以发现经过SPFF模型预测的短时客流量误差相对较小,在高、 中、低客流量站点的预测中,最好的时间粒度下误差基本在20人次以下, 这样的误差造成是因为真实客流量会受到票价变化、突发状况等多种因素的 影响,证明此方案配时在真实情况中具有较好效果。
本发明实施例针对站点客流的空间特征,使用聚类算法对站点进行聚类 分析(SK-means),将站点按照客流量进行分类,然后基于聚类分析结果, 对每类站点设定不同的高峰时段作为参数输入模型,使得模型更为精准;除 历史客流量外,还考虑了天气因素与客流特征时段(高峰时段与平峰时段、 工作日与非工作日)对客流的影响,利用Pearson相关系数对以上因素与客 流量的相关性进行分析,并将以上因素作为变量输入模型,提高模型的预测 精度;使用聚类算法对站点进行聚类分析时,通过合理的初始点选取,使得 聚类算法运行更快。本发明实施例方法可用于相关部门制定应急方案、制定 动态运输策略以及乘客出行规划,使相关部门掌握具体客流运输规律。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人 员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发 明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的 修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。

Claims (8)

1.一种基于循环神经网络的城市轨道交通短时客流预测方法,其特征在于,包括:站点聚类过程及预测模型构建训练过程;
所述站点聚类过程包括:
获取历史站点客流量数据集,根据站点聚类数目和客流量的最大值及最小值,计算每一个聚类的聚类中心点,然后采用聚类算法基于站点客流量数据集实现对站点的聚类;
所述预测模型构建训练过程包括:
设定输入变量,然后根据所述输入变量将历史站点客流量数据集与天气数据进行整合得到模型数据集;所述输入变量包括站点历史客流量、天气条件、是否为高峰时段以及是否为工作日;其中,所述站点历史客流量根据不同时间粒度进行划分,所述天气条件通过对天气变量与客流量进行相关性分析,将相关性大于设定条件的天气变量作为模型的天气条件输入变量,是否为高峰时段根据站点的聚类结果进行对应设置;
基于LSTM模型与GRU模型搭建短时客流预测模型,然后划分所述模型数据集得到训练集和测试集,将所述训练集输入所述短时客流预测模型,通过训练迭代到规定的迭代次数直至收敛,得到优化的短时客流预测模型及其参数组合。
2.根据权利要求1所述的方法,其特征在于,所述站点聚类过程具体包括:
步骤11、获取站点客流量数据集N,站点数目为n,站点聚类数目为k,计算所有样本数据的最大值Max(N)与最小值Min(N),选取Max(N)与Min(N)间的k+1等分点作为初始每一个聚类c的聚类中心点μc,c=1,2,…,k;
步骤12、计算所有样本点i,i=1,2,…,n到已经被选定的每一个聚类中心μc的距离dis(i,μc),
Figure FDA0003293125810000011
将样本点i分配给与其距离最近的聚类中心所代表的类c*中,
Figure FDA0003293125810000021
步骤13、计算每个聚类中样本点客流均值
Figure FDA0003293125810000022
其中,Ic表示聚类c中的所有项目;将Ac作为新的聚类中心,即μc=Ac,c=1,2,…,k;
步骤14、记录上轮聚类中的距离和lastSc=Sc,重复步骤12;
步骤15、如果lastSc与Sc相差大于0.0001,则返回步骤13,否则聚类结束。
3.根据权利要求1所述的方法,其特征在于,所述预测模型构建训练过程中,利用Pearson相关系数对天气变量与客流量进行相关性分析,Pearson相关系数如下式:
Figure FDA0003293125810000023
其中,X是客流量数据,Xi表示第i个时间段的客流量,
Figure FDA0003293125810000024
与SX分别是客流量的平均数和方差;Y是影响因素相关的数据,Yi表示第i个时间段的影响因素的值,
Figure FDA0003293125810000025
与SY分别是影响因素值的平均数和方差,n是数据量。
4.根据权利要求1所述的方法,其特征在于:所述预测模型构建训练过程中,短时客流预测模型具体包括:输入层、至少一个隐藏层及输出层,其中,每一隐藏层由七层LSTM模型或GRU模型及四层Dropout层组成。
5.根据权利要求4所述的方法,其特征在于:所述短时客流预测模型包括第一隐藏层和第二隐藏层;所述第一隐藏层和第二隐藏层的输入端均分别与所述输入层连接,所述第一隐藏层和第二隐藏层的输出端均分别与所述输出层连接;
所述第一隐藏层依次包括:第一LSTM层、第二LSTM层、第三LSTM层、第一Dropout层、第四LSTM层、第二Dropout层、第五LSTM层、第六LSTM层、第三Dropout层、第七LSTM层以及第三Dropout层;
所述第二隐藏层依次包括:第一GRU层、第二GRU层、第三GRU层、第一Dropout层、第四GRU层、第二Dropout层、第五GRU层、第六GRU层、第三Dropout层、第七GRU层以及第三Dropout层。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:模型评价过程;
所述模型评价过程包括:将测试集输入训练之后的模型取得预测结果,计算所述预测结果和真实客流量的均方根误差以及平均绝对误差,根据计算结果得到各类站点及不同时间粒度下的预测精度。
7.根据权利要求6所述的方法,其特征在于,所述模型评价过程中,计算均方根误差具体采用如下公式:
Figure FDA0003293125810000031
其中,n代表数据量,yi
Figure FDA0003293125810000032
分别代表真实值与预测值。
8.根据权利要求6所述的方法,其特征在于,所述模型评价过程中,计算平均绝对误差具体采用如下公式:
Figure FDA0003293125810000033
其中,n代表数据量,yi
Figure FDA0003293125810000034
分别代表真实值与预测值。
CN202111170942.0A 2021-10-08 2021-10-08 基于循环神经网络的城市轨道交通短时客流预测方法 Pending CN113902011A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111170942.0A CN113902011A (zh) 2021-10-08 2021-10-08 基于循环神经网络的城市轨道交通短时客流预测方法
PCT/CN2021/134969 WO2023056696A1 (zh) 2021-10-08 2021-12-02 基于循环神经网络的城市轨道交通短时客流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111170942.0A CN113902011A (zh) 2021-10-08 2021-10-08 基于循环神经网络的城市轨道交通短时客流预测方法

Publications (1)

Publication Number Publication Date
CN113902011A true CN113902011A (zh) 2022-01-07

Family

ID=79190317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111170942.0A Pending CN113902011A (zh) 2021-10-08 2021-10-08 基于循环神经网络的城市轨道交通短时客流预测方法

Country Status (2)

Country Link
CN (1) CN113902011A (zh)
WO (1) WO2023056696A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114819290A (zh) * 2022-04-04 2022-07-29 南京行者易智能交通科技有限公司 一种基于stacking的多环境下短时公交客流预测方法
CN115953186A (zh) * 2023-02-24 2023-04-11 北京化工大学 一种网约车需求模式识别与短时需求预测方法
WO2023056696A1 (zh) * 2021-10-08 2023-04-13 南威软件股份有限公司 基于循环神经网络的城市轨道交通短时客流预测方法
CN116778739A (zh) * 2023-06-20 2023-09-19 深圳市中车智联科技有限公司 一种基于需求响应的公共交通调度方法和系统
CN117132083A (zh) * 2023-10-20 2023-11-28 惠州市金雄城建筑科技有限公司 一种基于bim的城市轨道交通枢纽运维管理系统
CN117252311A (zh) * 2023-11-16 2023-12-19 华南理工大学 一种基于改进lstm网络的轨道交通客流预测方法
CN117591919A (zh) * 2024-01-17 2024-02-23 北京工业大学 客流预测方法、装置、电子设备和存储介质
CN118155423A (zh) * 2024-05-08 2024-06-07 四川智能交通系统管理有限责任公司 基于时间序列模型的节假日长期交通态势预测方法及设备

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116582468B (zh) * 2023-04-26 2024-01-16 杭州云之盟科技有限公司 互联网流量监测方法、装置、设备及存储介质
CN116311951B (zh) * 2023-05-25 2023-08-22 湖南工商大学 一种交通出行量数据处理方法、装置、设备及存储介质
CN116910588B (zh) * 2023-06-16 2024-04-05 上海工程技术大学 一种用于城市轨交列车乘降时间的估计方法
CN116777507B (zh) * 2023-06-23 2024-05-28 青岛中沃兴牧食品科技有限公司 一种基于lstm模型的猪肉专卖网点各类猪肉销售量的预测方法
CN116862071B (zh) * 2023-07-18 2024-02-13 杭州博晟科技有限公司 基于混频模型的城市运行指标数据预测方法
CN117273212A (zh) * 2023-09-17 2023-12-22 广州市交通规划研究院有限公司 一种基于客流效益和土地价值的站点功能级配优化方法
CN117585041B (zh) * 2023-11-14 2024-06-14 中交机电工程局有限公司 一种基于物联网的城市轨道交通综合监控系统
CN117408393B (zh) * 2023-12-06 2024-03-19 华中科技大学 一种异常事件下综合客运枢纽交通流量的预测方法及系统
CN117455553B (zh) * 2023-12-08 2024-04-30 青岛理工大学 一种地铁站客流量预测的方法
CN117407774B (zh) * 2023-12-15 2024-03-26 深圳市地铁集团有限公司 一种基于人工智能的交通数据处理方法及系统
CN117575684B (zh) * 2024-01-15 2024-04-05 杭州路过网络有限公司 一种客流量预测方法及系统
CN118195102B (zh) * 2024-05-15 2024-07-19 北京建筑大学 一种基于交通大数据的客流拥挤事件传播检测方法及系统
CN118332509B (zh) * 2024-06-13 2024-10-11 南京邮电大学 一种基于两阶段聚类的地铁站点特性挖掘方法
CN118396192B (zh) * 2024-06-27 2024-09-13 上海建工四建集团有限公司 公共建筑自校准客流仿真及空间优化方法及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007076426A1 (en) * 2005-12-21 2007-07-05 Tokman Michael G Method of identifying clusters and connectivity between clusters
CN110119884A (zh) * 2019-04-17 2019-08-13 五邑大学 一种基于近邻传播聚类的高速铁路客流时段划分方法
CN111768622A (zh) * 2020-06-23 2020-10-13 南通大学 一种基于改进灰狼算法的短时交通量预测方法
CN113177657A (zh) * 2021-04-20 2021-07-27 上海大学 轨道交通客流预测方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034449A (zh) * 2018-06-14 2018-12-18 华南理工大学 基于深度学习和乘客行为模式的短期公交客流预测方法
CN110276474A (zh) * 2019-05-22 2019-09-24 南京理工大学 一种城市轨道交通车站短时客流预测方法
CN113902011A (zh) * 2021-10-08 2022-01-07 南威软件股份有限公司 基于循环神经网络的城市轨道交通短时客流预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007076426A1 (en) * 2005-12-21 2007-07-05 Tokman Michael G Method of identifying clusters and connectivity between clusters
CN110119884A (zh) * 2019-04-17 2019-08-13 五邑大学 一种基于近邻传播聚类的高速铁路客流时段划分方法
CN111768622A (zh) * 2020-06-23 2020-10-13 南通大学 一种基于改进灰狼算法的短时交通量预测方法
CN113177657A (zh) * 2021-04-20 2021-07-27 上海大学 轨道交通客流预测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李梅;李静;魏子健;王思达;陈赖谨: "基于深度学习长短期记忆网络结构的地铁站短时客流量预测", 城市轨道交通研究, vol. 21, no. 11, 10 November 2018 (2018-11-10), pages 42 - 46 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023056696A1 (zh) * 2021-10-08 2023-04-13 南威软件股份有限公司 基于循环神经网络的城市轨道交通短时客流预测方法
CN114819290A (zh) * 2022-04-04 2022-07-29 南京行者易智能交通科技有限公司 一种基于stacking的多环境下短时公交客流预测方法
CN115953186A (zh) * 2023-02-24 2023-04-11 北京化工大学 一种网约车需求模式识别与短时需求预测方法
CN115953186B (zh) * 2023-02-24 2023-05-16 北京化工大学 一种网约车需求模式识别与短时需求预测方法
CN116778739A (zh) * 2023-06-20 2023-09-19 深圳市中车智联科技有限公司 一种基于需求响应的公共交通调度方法和系统
CN117132083A (zh) * 2023-10-20 2023-11-28 惠州市金雄城建筑科技有限公司 一种基于bim的城市轨道交通枢纽运维管理系统
CN117132083B (zh) * 2023-10-20 2024-01-30 惠州市金雄城建筑科技有限公司 一种基于bim的城市轨道交通枢纽运维管理系统
CN117252311A (zh) * 2023-11-16 2023-12-19 华南理工大学 一种基于改进lstm网络的轨道交通客流预测方法
CN117252311B (zh) * 2023-11-16 2024-03-15 华南理工大学 一种基于改进lstm网络的轨道交通客流预测方法
CN117591919A (zh) * 2024-01-17 2024-02-23 北京工业大学 客流预测方法、装置、电子设备和存储介质
CN118155423A (zh) * 2024-05-08 2024-06-07 四川智能交通系统管理有限责任公司 基于时间序列模型的节假日长期交通态势预测方法及设备

Also Published As

Publication number Publication date
WO2023056696A1 (zh) 2023-04-13

Similar Documents

Publication Publication Date Title
CN113902011A (zh) 基于循环神经网络的城市轨道交通短时客流预测方法
CN108596727B (zh) 一种共享单车的管理与决策方法
CN108133302B (zh) 一种基于大数据的公共自行车潜在需求预测方法
CN110390349A (zh) 基于XGBoost模型的公交车客流量预测建模方法
CN110836675B (zh) 一种基于决策树的自动驾驶搜索决策方法
CN107978153B (zh) 一种基于空间向量自回归模型的多模式交通需求影响分析方法
CN114969007A (zh) 一种基于功能混合度和集成学习的城市功能区识别方法
CN114048920A (zh) 充电设施建设的选址布局方法、装置、设备及存储介质
CN112784000B (zh) 基于出租车轨迹数据的寻客方法
CN113380071B (zh) 一种面向大型综合体的车位级停车需求状态评价方法
CN111291321A (zh) 基于大数据的城市交通模型构建方法
CN115809378A (zh) 一种基于手机信令数据的医疗短缺区识别及布局优化方法
CN117035185A (zh) 基于动态充电需求的电动汽车充电站布局优化方法及系统
CN113674524A (zh) 基于lstm-gasvr的多尺度短时交通流预测建模、预测方法及系统
CN115269758A (zh) 面向乘客诱导的路网客流状态推演方法及系统
Yu et al. A map matching-based method for electric vehicle charging station placement at directional road segment level
CN111723871B (zh) 一种公交车实时车厢满载率的估算方法
Hau Using a Hicksian approach to cost-benefit analysis in discrete choice: An empirical analysis of a transportation corridor simulation model
CN110309953B (zh) 采用目标流动性分布预测的城市安防监控布局系统及方法
CN109447352B (zh) 一种公交出行od矩阵反推的组合方法
CN111581318B (zh) 一种共享单车骑行目的推断方法、装置及存储介质
CN114254250A (zh) 一种考虑时空非平稳性的网约车出行需求预测方法
CN113268709A (zh) 基于智能体仿真的城市电动汽车充电需求预测方法及系统
CN113723761A (zh) 一种基于运行数据的多维度城市公交运行服务可靠度评价方法
CN111210067A (zh) 一种通勤视角都市圈空间半径测算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination