CN113177657A - 轨道交通客流预测方法及装置 - Google Patents
轨道交通客流预测方法及装置 Download PDFInfo
- Publication number
- CN113177657A CN113177657A CN202110423095.8A CN202110423095A CN113177657A CN 113177657 A CN113177657 A CN 113177657A CN 202110423095 A CN202110423095 A CN 202110423095A CN 113177657 A CN113177657 A CN 113177657A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- station
- time
- rail transit
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 238000012795 verification Methods 0.000 claims abstract description 12
- 239000011159 matrix material Substances 0.000 claims description 30
- 238000005070 sampling Methods 0.000 claims description 20
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 230000008859 change Effects 0.000 claims description 12
- 230000015654 memory Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 230000001568 sexual effect Effects 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 241000287196 Asthenes Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- General Business, Economics & Management (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Primary Health Care (AREA)
- Train Traffic Observation, Control, And Security (AREA)
Abstract
一种轨道交通客流预测方法及装置,所述轨道交通客流预测方法包括:获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;将所述训练数据集输入至预先构建的初始TPA‑LSTM模型,以对所述初始TPA‑LSTM模型进行训练,得到目标TPA‑LSTM模型;将所述测试数据集输入至所述目标TPA‑LSTM模型中,得到实时客流预测结果。
Description
技术领域
本发明涉及轨道交通技术领域,尤其涉及一种轨道交通客流预测方法及装置。
背景技术
随着经济的飞速发展和城市化进程的不断加快,人们对于出行的需求也在不断增长。因此,以地铁为代表的城市轨道交通系统得到了长足的发展。但随着交通量的增长,城市交通拥堵问题日益严重,特别是在北上广深为代表的一线城市,拥堵问题给市民出行带来诸多不便,也成为了城市发展的一大障碍。同时,随着地铁线路规模的扩大和运营方式的复杂化,地铁运营的安全和效率也面临着更加严峻的挑战。
在城市轨道交通相关的研究中,短时客流预测对提高城市轨道交通运行效率起着十分重要的作用。一方面短时客流预测可以为轨道交通管理者提供更具体的实时交通网络客流分布情况,及时的调整列车班次和线路调度,提升轨道交通运营能力和服务水平;另一方面,方便乘客出行前规划出行路径或计划出行时间,以及在出行中重新规划路线,避免拥堵。通过短时客流预测,可以降低路网的客流压力,减少和避免因拥堵导致的运能浪费。
目前通常使用的城市轨道交通客流预测方法主要包括:基于时间序列的方法、基于机器学习的方法等。
时间序列模型是利用时间序列相关理论及方法来进行分析预测的模型,包括自回归模型、移动平均模型、自回归移动平均模型、自回归求和移动平均模型等。这类模型一般通过曲线拟合和参数估计对系统观测得到的时间序列数据进行建模。通过对历史数据进行合理外推,从而得到预测结果。时间序列模型关注样本随时间的变化,大体分为长期趋势变化、周期变化(季节变化)、循环变动和随机变动四种。在短时客流预测领域,该方法存在一些弊端,比如实时性差,预测精度低等。
应用于轨道交通短时客流预测的包括多层感知机、支持向量机、决策树、随机森林等模型。这些方法被广泛用于短时客流预测问题,有些是单一模型,有些是包括一种或多种模型结合使用的黑拟合模型。相比于时间序列方法,机器学习模型具有更强自适应、自组织和自学习能力,预测精确度得到较大的提高,但是没有考虑到时空相关性等特征,预测精度仍然存在一定限制。
发明内容
本发明解决的技术问题是现有的轨道交通客流预测精度较差。
为解决上述技术问题,本发明实施例提供一种轨道交通客流预测方法,包括:获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;所述客流参数采用过程获取:采集轨道交通网络内每个站点在不同时间段内的交通卡数据以及对应时间段内的气象数据、车辆故障公告、站点POI数据;对所述轨道交通网络内的每个站点进行聚类,对每个聚类进行可预测性评估,确定客流采样时间;计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征;根据客流采样时间,获取每一采样时间对应的气象特征、站点客流受车辆故障影响特征以及站点POI特征;基于所述客流趋势特征、所述客流量级特征、所述气象特征、所述站点客流受车辆故障影响特征以及所述站点POI特征,得到所述客流参数;将所述训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练,得到目标TPA-LSTM模型;将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
可选的,在得到所述实时客流预测结果之后,还包括:采用预设的评价函数对所述目标TPA-LSTM模型进行评价,并使用所述验证数据集对所述目标TPA-LSTM模型进行验证。
可选的,所述对所述轨道交通网络内的每个站点进行聚类,包括:根据每个站点的客流指标,以预设时长对站台客流进行采样,得到客流序列矩阵;根据所述客流序列矩阵,计算所述预设时长内各个站点的客流率矩阵;根据站点的客流率矩阵,对所述每个站点进行聚类。
可选的,所述预设时长为1小时,所述客流序列矩阵为: 所述每个站点的客流率矩阵为:其中,Rd为第d天的客流序列矩阵,RId为每个站点的客流率矩阵,为站点s第d天第t个时间段的客流量,为站点s第d天第t个时间段的客流指标。
可选的,所述计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征,包括:根据当前时刻客流量相较前N个时间步的客流量变换趋势,确定所述客流趋势特征;根据当前时刻客流量与当前站点最大客流量、当前站点平均客流量的关系,确定所述客流量级特征。
可选的,所述根据客流采样时间,确定每一采样时间对应的站点客流受车辆故障影响特征,包括:根据客流是否为直接受影响站点,确定站点性影响特征;根据是否与受影响站点处于同一线路,确定线路性影响特征;根据是否在故障影响时间内,确定全局性影响特征。
可选的,所述初始TPA-LSTM模型采用如下步骤构建:所述初始TPA-LSTM模型由长短期记忆神经网络单元、卷积神经网络单元和全连接层依次连接构成,其中:所述长短期记忆神经网络单元用于捕捉轨道交通客流的长程依赖关系;所述卷积神经网络单元用于计算所述长短期记忆神经网络单元的每个时间步隐藏层的注意力分布,选择变量加权;所述全连接层用于捕捉隐藏层状态与客流预测结果之间的非线性关系。
可选的,所述长短期记忆神经网络单元使用隐藏层和细胞状态存储所述长程依赖关系,所述依赖关系为:ht,ct=F(ht-1,ct-1,xt),其中,ht为第t个时间步的隐藏层状态,ct为第t个时间步的细胞状态,xt为第t个时间步的输入数据。
为解决上述技术问题,本发明实施例还提供了一种轨道交通客流预测装置,包括:参数获取单元,用于获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;所述客流参数采用过程获取:采集轨道交通网络内每个站点在不同时间段内的交通卡数据以及对应时间段内的天气状况、车辆故障公告、站点POI数据;对所述轨道交通网络内的每个站点进行聚类,对每个聚类进行客流预测;计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征;根据客流采样时间,获取每一采样时间对应的气象特征、站点客流受车辆故障影响特征以及站点POI特征;基于所述客流趋势特征、所述客流量级特征、所述气象特征、所述站点客流受车辆故障影响特征以及所述站点POI特征,得到所述客流参数;训练单元,用于将所述训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练,得到目标TPA-LSTM模型;预测结果获取单元,用于将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
在获取客流参数时,在获取历史客流的基础之上,还额外增加气象数据因素、车辆故障因素、站点POI数据因素等外部数据,基于多种数据进行客流量预测,可以提高客流预测精度。并且,在获取客流参数时,以站点客流指标和站点周边对站点进行POI聚类,针对单一种类的聚类站点进行客流预测,更有针对性。
此外,采用TPA-LSTM网络,在传统的LSTM网络添加一层时间模式注意力机制,相较于传统的注意力机制选择相关的时间步加权,TPA能够选择相关变量加权,从而捕捉对客流影响更重要的外部特征,使原有的LSTM能有效利用多元化的数据,明显地提高了短时客流预测精度。
附图说明
图1是本发明实施例一种轨道交通客流预测方法的流程图;
图2是本发明实施例一种轨道交通客流预测装置的结构示意图。
具体实施方式
如上述背景技术中所述,现有的轨道交通客流预测精度较低。
在本发明实施例中,在获取客流参数时,在获取历史客流的基础之上,还额外增加气象数据因素、车辆故障因素、站点POI数据因素等外部数据,基于多种数据进行客流量预测,可以提高客流预测精度。并且,在获取客流参数时,以站点客流指标和站点周边对站点进行POI聚类,针对单一种类的聚类站点进行客流预测,更有针对性。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本发明实施例提供了一种轨道交通客流预测方法,参照图1,以下通过具体步骤进行详细说明。
步骤S101,获取客流参数。
在具体实施中,可以预先获取客流参数,客流参数可以由训练数据集、测试数据集以及验证数据集组成。
下面对本发明实施例中获取客流参数的具体过程进行详细说明。
在本发明实施例中,可以采集在某一时间区间内,轨道交通网络中每一个站点在不同时间段内的交通卡数据,以及不同时间段内对应的天气状况、车辆故障公告、站点POI数据等信息。采样时间粒度可以从如下集合中选择任一或者多个{1,2,3,4,5,6,8,9,10,12,15,20,30,60,120,180},该集合的单位为分钟(min)。
例如,采集在2015年4月份,以60min为采样时间粒度,则采集5:00~6:00、6:00~7:00、7:00~8:00、……、23:00~24:00内,上海地铁交通网络中每一个站点在上述时间段内的交通卡数据。
在本发明实施例中,交通卡数据可以包括交通卡号码、交易日期(即交通卡刷卡日期)、交易时间(即交通卡刷卡的具体时间)、乘车线路、起始与结束站点、交通工具类型、交易金额、交易性质等数据。交通卡数据能够表征某一公交卡的路线信息以及消费信息。
在具体应用中,起始与结束站点表征该交通卡刷卡的起始站点与结束站点,也即该交通卡的持有人在哪一站进站使用交通卡,以及在哪一站出站使用交通卡。交通工具类型可以包括公交、地铁、轮渡、出租车等交通工具类型。交易金额则为该交通卡在本次行程中的消费金额,交易性质可以表征本次使用公交卡是否有优惠。
通过获取交通卡数据,最终可以得到轨道交通网络内,每一个站点在每一天不同的时间段内的进站客流量以及出站客流量。
可以理解的是,上述的交通卡数据还可以包括其他能够表征交通卡相关的数据,并不仅限于上述示例说明。
在具体实施中,对应时间段内的气象数据可以包括站点外界环境的温度、湿度、风速以及天气状况等,气象数据还可以包括站点外界人体体感温度。
在具体实施中,车辆故障报告可以包括每次故障时间、被故障直接影响的站点以及故障持续时间。
在具体实施中,POI数据可以通过对公共交通站点附近一定距离范围内的用地POI信息获取。例如,POI数据通过对地铁站点附近800米的用地POI信息获取。
在具体实施中,在获取到每个站点交通卡数据以及站点POI数据之后,可以对轨道交通网络内的每个站点进行聚类,并对每个聚类进行客流预测。
在本发明实施例中,可以采用K-means聚类算法,根据每个站点的客流指标,以预设时长对站台客流进行采样,得到客流序列矩阵。之后,根据客流序列矩阵,计算预设时长内各个站点的客流率矩阵;根据客流率矩阵,对每个站点进行聚类。
在本发明一实施例中,设定以一天为标准,以60min为预设时长,对站台客流进行采样,得到客流序列矩阵Rd;根据客流序列矩阵Rd,计算各个站点的小时客流率矩阵RId。
客流序列矩阵表示为:
每个站点的客流率矩阵为:
在具体实施中,通过聚类算法,可以将各个站点划分为如下几类:居住类站点、就业类站点、偏远居住类站点、混合居住类站点和混合就业类站点。
在具体实施中,可以对每个聚类进行可预测性评估,以从上述的采样时间粒度集合中确定客流采样时间。
自相关系数的计算公式为:
其中,u为序列x的平均值,k为序列的滞后项,滞后项由时间粒度得到,为1天的总时间除以时间粒度,自相关性系数的值域为[-1,1],越接近1则越相关,反之则为负相关。
为所有站点、每个聚类的站点集合的工作日进站、出站客流序列求平均进行可预测性评估,设置自相关系数、p值的阈值分别为0.95、0.01。
以就业类站点的平均客流为例,根据判断标准,所确定的合适的客流采样时间为4~30min。
在具体实施中,可以计算每个站点可预测的客流时间序列,进而确定客流时间序列对应的客流趋势特征以及客流量级特征。
在本发明实施例中,可以根据当前时刻客流量相较前N个时间步的客流量变换趋势,确定所述客流趋势特征;根据当前时刻客流量与当前站点最大客流量、当前站点平均客流量的关系,确定所述客流量级特征。
进站客流趋势的取值可以由-1、0、1来表征。当进站客流趋势的取值为-1时,表征进站客流明显下降;当进站客流趋势的取值为1时,表征进站客流明显增加;当进站客流平稳变化时,进站客流趋势的取值为0。
相应地,出站客流趋势的取值可以由-1、0、1来表征。当出站客流趋势的取值为-1时,表征出站客流明显下降;当出站客流趋势的取值为1时,表征出站客流明显增加;当出站客流平稳变化时,出站客流趋势的取值为0。
进站客流量级的取值可以由0、1、2来表征。当进站客流量级的取值为0时,表征进站客流量级为小客流;当进站客流量级的取值为1时,表征进站客流量级为中客流;当进站客流量级的取值为2时,表征进站客流量级为大客流。
相应地,出站客流量级的取值可以由0、1、2来表征。当出站客流量级的取值为0时,表征出站客流量级为小客流;当出站客流量级的取值为1时,表征出站客流量级为中客流;当出站客流量级的取值为2时,表征出站客流量级为大客流。
在具体应用中,客流趋势的明显下降、明显上升、平稳变化的区间也可以根据具体的应用场景设备。例如,设定客流量在5分钟内的下降人次超过20人次为明显下降,设定客流量在5分钟内的上升人次超过40人次为明显上升,其他的情况设定为平稳变化。
在具体应用中,小客流、中客流、大客流的具体数据可以根据具体的应用场景设定。例如,设定客流量为每5分钟不大于50人次的客流为小客流,客流量为每5分钟在50人次~200人次的客流为中客流,客流量为每5分钟超过200人次的客流为大客流。
在具体实施中,可以将气象数据中外界环境的温度、风速、体感温度等保留小数形式,将湿度转换为0~1的小数,天气状况可以由晴天、少云、多云、阴天、小雨、大雨、薄雾、雾、霾等的one-hot形式。天气状况可以一共包括14项天气特征。
在具体实施中,可以根据站点客流是否直接受故障影响,确定站点性影响特征;根据站点是否与受影响站点处于同一条线路,确定线路性影响特征;根据当前时刻是否在故障时间内,确定全局性影响特征。由此,本发明实施例中所述的车辆故障影响特征包括站点性影响特征、线路性影响特征以及全局性影响特征。
站点性影响特征可以由0、1来表征。当站点性影响特征的取值为0时,表征该站点不受车辆故障影响;当站点性影响特征的取值为1时,表征该站点收到车辆故障影响。
线路性影响特征可以由0、1来表征。当线路性影响特征的取值为0时,表征该站点与受车辆故障影响的站点不处于同一条线路;当线路性影响特征的取值为1时,表征该站点与受车辆故障影响的站点处于同一条线路。
全局性影响提特征可以由0、1来表征。当全局性影响特征的取值为0时,表征该站点当前时刻的客流不受车辆故障影响;当全局性影响特征的取值为1时,表征该站点当前时刻的客流受到车辆故障的影响。
在具体实施中,POI数据可以通过统计各个站点周边的交通运输、休闲娱乐、公司企业等标签的用地数量分布,得到POI特征。
在本发明一实施例中,以上海地铁二号线南京西路地铁站为例,得到的POI标签、POI数量及POI特征如下表1所示:
表1
在具体实施中,上述得到的天气特征、POI特征、站点客流受车辆故障影响特征对应的特征变量集合可以表征为将上述特征变量集合与上述特征变量集合进行结合,得到最终的特征变量集合中,共包括41个特征变量。该41个变量特征即为客流参数。
其中,F代表短时客流预测模型,特征变量一共由w个时间步,w通过1小时除以时间粒度得到,本发明实施例中以时间粒度为5min为例,则w=12。
在具体实施中,在得到客流参数之后,可以对客流参数进行划分,将其划分为训练数据集、测试数据集以及验证数据集。
在本发明一实施例中,客流参数为2015年4月份的工作日客流参数,训练数据集为{1,2,3,7,8,9,10,13,14,15,16,17,20,21,22}日数据,测试数据集为{23,24,27}日数据,验证数据集为{28,29,30}日数据。
步骤S102,将训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练。
在具体实施中,可以预先构建初始TPA-LSTM模型,在完成初始TPA-LSTM模型的构建之后,通过训练迭代,将步骤S101中获取到的训练数据集输入至初始TPA-LSTM模型,以对初始TPA-LSTM模型进行训练,进而得到目标TPA-LSTM模型。
在本发明实施例中,初始TPA-LSTM模型可以由长短期记忆神经网络单元、卷积神经网络单元和全连接层依次连接构成,其中:所述长短期记忆神经网络单元用于捕捉轨道交通客流的长程依赖关系;所述卷积神经网络单元用于计算所述长短期记忆神经网络单元的每个时间步隐藏层的注意力分布,选择变量加权;所述全连接层用于捕捉隐藏层状态与客流预测结果之间的非线性关系。
在本发明实施例中,LSTM层中使用隐藏层和细胞状态存储长程依赖关系,其公式为:ht,ct=F(ht-1,ct-1,xt);其中,ht为第t个时间步的隐藏层状态,ct为第t个时间步的细胞状态,xt为第t个时间步的输入数据。
更具体地,隐藏层和细胞状态由LSTM单元中的输入门it、遗忘门ft、输出门ot控制,具体为:
it=sigmoid(Wixt+Uiht-1)
ft=sigmoid(Wfxt+Ufht-1)
ot=sigmoid(Woxt+Uoht-1)
ct=ft⊙ct-1+it⊙tanh(Wcxt+Ucht-1)
ht=ot ⊙tanh(ct)
其中,Wi,Ui,Wf,Uf,Wo,Uo,Wc,Uc为权重参数,⊙为点积乘法。
在具体实施中,用于时间检测的CNN滤波器可以为:
其中,Ht={ht-w,ht-w+1,…,ht-1}表示LSTM层每一个时间步训练的隐藏层状态矩阵,CNN层配置为k个滤波器Ct,卷积核的尺寸为1×T(T表示注意力机制所覆盖的范围,通常令T等于w),得到表示第i个行向量和第j个卷积核作用的结果值。
在时间模式注意力机制中,令query=ht,key=HC,则打分函数为:
在本发明实施例中,初始TPA-LSTM模型中各单元的超参数可以如下表2所示:
表2
步骤S103,将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
需要说明的是,在本发明实施例中,训练过程的学习率使用自适应调节,学习率在若干个训练迭代中会根据损失函数值是否下降进行调节。
在具体实施中,在得到实时客流预测结果之后,还可以采用预设的评价函数对目标TPA-LSTM模型进行评价,并使用验证数据集对目标TPA-LSTM模型进行验证。
在具体实施中,评价模型的评价指标可以为平均绝对误差(MAE,mean absoluteerror)和均方根误差(RMSE,the root-mean-squarederror),其中:
综上可见,在获取客流参数时,在获取历史客流的基础之上,还额外增加气象数据因素、车辆故障因素、站点POI数据因素等外部数据,基于多种数据进行客流量预测,可以提高客流预测精度。并且,在获取客流参数时,以站点客流指标和站点周边对站点进行POI聚类,针对单一种类的聚类站点进行客流预测,更有针对性。
参照图2,给出了本发明实施例中的一种轨道交通客流预测装置20,包括:参数获取单元201、训练单元202以及预测结果获取单元203,其中:
参数获取单元201,用于获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;所述客流参数采用过程获取:采集轨道交通网络内每个站点在不同时间段内的交通卡数据以及对应时间段内的天气状况、车辆故障公告、站点POI数据;对所述轨道交通网络内的每个站点进行聚类,对每个聚类进行客流预测;计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征;根据客流采样时间,获取每一采样时间对应的气象特征、站点客流受车辆故障影响特征以及站点POI特征;基于所述客流趋势特征、所述客流量级特征、所述气象特征、所述站点客流受车辆故障影响特征以及所述站点POI特征,得到所述客流参数;
训练单元202,用于将所述训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练,得到目标TPA-LSTM模型;
预测结果获取单元203,用于将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (10)
1.一种轨道交通客流预测方法,其特征在于,包括:
获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;所述客流参数采用过程获取:采集轨道交通网络内每个站点在不同时间段内的交通卡数据以及对应时间段内的气象数据、车辆故障公告、站点POI数据;对所述轨道交通网络内的每个站点进行聚类,对每个聚类进行可预测性评估,确定客流采样时间;计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征;根据客流采样时间,获取每一采样时间对应的气象特征、站点客流受车辆故障影响特征以及站点POI特征;基于所述客流趋势特征、所述客流量级特征、所述气象特征、所述站点客流受车辆故障影响特征以及所述站点POI特征,得到所述客流参数;
将所述训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练,得到目标TPA-LSTM模型;
将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
2.根据权利要求1所述的轨道交通客流预测方法,其特征在于,在得到所述实时客流预测结果之后,还包括:
采用预设的评价函数对所述目标TPA-LSTM模型进行评价,并使用所述验证数据集对所述目标TPA-LSTM模型进行验证。
3.根据权利要求1所述的轨道交通客流预测方法,其特征在于,所述对所述轨道交通网络内的每个站点进行聚类,包括:
根据每个站点的客流指标,以预设时长对站台客流进行采样,得到客流序列矩阵;
根据所述客流序列矩阵,计算所述预设时长内各个站点的客流率矩阵;
根据站点的客流率矩阵,对所述每个站点进行聚类。
6.根据权利要求5所述的轨道交通客流预测方法,其特征在于,所述计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征,包括:
根据当前时刻客流量相较前N个时间步的客流量变换趋势,确定所述客流趋势特征;
根据当前时刻客流量与当前站点最大客流量、当前站点平均客流量的关系,确定所述客流量级特征。
7.根据权利要求6所述的轨道交通客流预测方法,其特征在于,所述根据客流采样时间,确定每一采样时间对应的站点客流受车辆故障影响特征,包括:
根据客流是否为直接受影响站点,确定站点性影响特征;
根据是否与受影响站点处于同一线路,确定线路性影响特征;
根据是否在故障影响时间内,确定全局性影响特征。
8.根据权利要求1所述的轨道交通客流预测方法,其特征在于,所述初始TPA-LSTM模型采用如下步骤构建:
所述初始TPA-LSTM模型由长短期记忆神经网络单元、卷积神经网络单元和全连接层依次连接构成,其中:所述长短期记忆神经网络单元用于捕捉轨道交通客流的长程依赖关系;所述卷积神经网络单元用于计算所述长短期记忆神经网络单元的每个时间步隐藏层的注意力分布,选择变量加权;所述全连接层用于捕捉隐藏层状态与客流预测结果之间的非线性关系。
9.根据权利要求8所述的轨道交通客流预测方法,其特征在于,所述长短期记忆神经网络单元使用隐藏层和细胞状态存储所述长程依赖关系,所述依赖关系为:ht,ct=F(ht-1,ct-1,xt),其中,ht为第t个时间步的隐藏层状态,ct为第t个时间步的细胞状态,xt为第t个时间步的输入数据。
10.一种轨道交通客流预测装置,其特征在于,包括:
参数获取单元,用于获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;所述客流参数采用过程获取:采集轨道交通网络内每个站点在不同时间段内的交通卡数据以及对应时间段内的天气状况、车辆故障公告、站点POI数据;对所述轨道交通网络内的每个站点进行聚类,对每个聚类进行客流预测;计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征;根据客流采样时间,获取每一采样时间对应的气象特征、站点客流受车辆故障影响特征以及站点POI特征;基于所述客流趋势特征、所述客流量级特征、所述气象特征、所述站点客流受车辆故障影响特征以及所述站点POI特征,得到所述客流参数;
训练单元,用于将所述训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练,得到目标TPA-LSTM模型;
预测结果获取单元,用于将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110423095.8A CN113177657B (zh) | 2021-04-20 | 2021-04-20 | 轨道交通客流预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110423095.8A CN113177657B (zh) | 2021-04-20 | 2021-04-20 | 轨道交通客流预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113177657A true CN113177657A (zh) | 2021-07-27 |
CN113177657B CN113177657B (zh) | 2022-08-30 |
Family
ID=76923763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110423095.8A Active CN113177657B (zh) | 2021-04-20 | 2021-04-20 | 轨道交通客流预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113177657B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114066038A (zh) * | 2021-11-10 | 2022-02-18 | 上海市大数据股份有限公司 | 一种地铁客流的预测方法及系统 |
CN114091579A (zh) * | 2021-11-03 | 2022-02-25 | 深圳技术大学 | 城市轨道交通客流预警系统和方法 |
CN114282732A (zh) * | 2021-12-29 | 2022-04-05 | 重庆紫光华山智安科技有限公司 | 一种区域人流量的预测方法及装置 |
CN114881330A (zh) * | 2022-05-09 | 2022-08-09 | 华侨大学 | 一种基于神经网络的轨道交通客流预测方法及系统 |
WO2023056696A1 (zh) * | 2021-10-08 | 2023-04-13 | 南威软件股份有限公司 | 基于循环神经网络的城市轨道交通短时客流预测方法 |
CN117252311A (zh) * | 2023-11-16 | 2023-12-19 | 华南理工大学 | 一种基于改进lstm网络的轨道交通客流预测方法 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101571996A (zh) * | 2009-06-10 | 2009-11-04 | 上海理工大学 | 城市公交智能化应急管理方法 |
CN104408643A (zh) * | 2014-10-30 | 2015-03-11 | 西北大学 | 一种行为感知偏好获取系统及其获取方法 |
WO2017166370A1 (zh) * | 2016-03-29 | 2017-10-05 | 东南大学 | 一种基于区域城际流强度测算模型的划定大都市圈的方法 |
CN107316096A (zh) * | 2017-05-05 | 2017-11-03 | 北京市交通信息中心 | 一种轨道交通一票通乘客进站量预测方法 |
CN108537392A (zh) * | 2018-04-26 | 2018-09-14 | 重庆大学 | 一种基于时空特征预测轨道交通站点出站客流量的方法 |
CN108564228A (zh) * | 2018-04-26 | 2018-09-21 | 重庆大学 | 一种基于时序特征预测轨道交通od客流量的方法 |
CN109583656A (zh) * | 2018-12-06 | 2019-04-05 | 重庆邮电大学 | 基于a-lstm的城市轨道交通客流量预测方法 |
CN110570004A (zh) * | 2018-06-05 | 2019-12-13 | 上海申通地铁集团有限公司 | 地铁客流的预测方法及系统 |
WO2020010717A1 (zh) * | 2018-07-13 | 2020-01-16 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
CN110852476A (zh) * | 2019-09-29 | 2020-02-28 | 华东理工大学 | 客流预测方法、装置、计算机设备和存储介质 |
CN111178598A (zh) * | 2019-12-16 | 2020-05-19 | 中国铁道科学研究院集团有限公司 | 铁路客运站客流量预测方法、系统、电子设备及存储介质 |
CN111598333A (zh) * | 2020-05-14 | 2020-08-28 | 北京轨道交通路网管理有限公司 | 客流数据的预测方法及装置 |
CN111931978A (zh) * | 2020-06-29 | 2020-11-13 | 南京熊猫电子股份有限公司 | 一种基于时空特性的城市轨道交通客流状态预测方法 |
CN112418518A (zh) * | 2020-11-20 | 2021-02-26 | 佳都新太科技股份有限公司 | 基于时间特征权重和线网拓扑的客流预测方法及装置 |
-
2021
- 2021-04-20 CN CN202110423095.8A patent/CN113177657B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101571996A (zh) * | 2009-06-10 | 2009-11-04 | 上海理工大学 | 城市公交智能化应急管理方法 |
CN104408643A (zh) * | 2014-10-30 | 2015-03-11 | 西北大学 | 一种行为感知偏好获取系统及其获取方法 |
WO2017166370A1 (zh) * | 2016-03-29 | 2017-10-05 | 东南大学 | 一种基于区域城际流强度测算模型的划定大都市圈的方法 |
CN107316096A (zh) * | 2017-05-05 | 2017-11-03 | 北京市交通信息中心 | 一种轨道交通一票通乘客进站量预测方法 |
CN108537392A (zh) * | 2018-04-26 | 2018-09-14 | 重庆大学 | 一种基于时空特征预测轨道交通站点出站客流量的方法 |
CN108564228A (zh) * | 2018-04-26 | 2018-09-21 | 重庆大学 | 一种基于时序特征预测轨道交通od客流量的方法 |
CN110570004A (zh) * | 2018-06-05 | 2019-12-13 | 上海申通地铁集团有限公司 | 地铁客流的预测方法及系统 |
WO2020010717A1 (zh) * | 2018-07-13 | 2020-01-16 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
CN109583656A (zh) * | 2018-12-06 | 2019-04-05 | 重庆邮电大学 | 基于a-lstm的城市轨道交通客流量预测方法 |
CN110852476A (zh) * | 2019-09-29 | 2020-02-28 | 华东理工大学 | 客流预测方法、装置、计算机设备和存储介质 |
CN111178598A (zh) * | 2019-12-16 | 2020-05-19 | 中国铁道科学研究院集团有限公司 | 铁路客运站客流量预测方法、系统、电子设备及存储介质 |
CN111598333A (zh) * | 2020-05-14 | 2020-08-28 | 北京轨道交通路网管理有限公司 | 客流数据的预测方法及装置 |
CN111931978A (zh) * | 2020-06-29 | 2020-11-13 | 南京熊猫电子股份有限公司 | 一种基于时空特性的城市轨道交通客流状态预测方法 |
CN112418518A (zh) * | 2020-11-20 | 2021-02-26 | 佳都新太科技股份有限公司 | 基于时间特征权重和线网拓扑的客流预测方法及装置 |
Non-Patent Citations (2)
Title |
---|
JINLEI ZHANG,ET AL.: ""Cluster-Based LSTM Network for Short-TermPassenger Flow Forecasting in Urban Rail Transit"", 《IEEEXPLORE》 * |
谢贵才等: ""多尺度时序依赖的校园公共区域人流量预测"", 《软件学报》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023056696A1 (zh) * | 2021-10-08 | 2023-04-13 | 南威软件股份有限公司 | 基于循环神经网络的城市轨道交通短时客流预测方法 |
CN114091579A (zh) * | 2021-11-03 | 2022-02-25 | 深圳技术大学 | 城市轨道交通客流预警系统和方法 |
CN114066038A (zh) * | 2021-11-10 | 2022-02-18 | 上海市大数据股份有限公司 | 一种地铁客流的预测方法及系统 |
CN114282732A (zh) * | 2021-12-29 | 2022-04-05 | 重庆紫光华山智安科技有限公司 | 一种区域人流量的预测方法及装置 |
CN114881330A (zh) * | 2022-05-09 | 2022-08-09 | 华侨大学 | 一种基于神经网络的轨道交通客流预测方法及系统 |
CN117252311A (zh) * | 2023-11-16 | 2023-12-19 | 华南理工大学 | 一种基于改进lstm网络的轨道交通客流预测方法 |
CN117252311B (zh) * | 2023-11-16 | 2024-03-15 | 华南理工大学 | 一种基于改进lstm网络的轨道交通客流预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113177657B (zh) | 2022-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113177657B (zh) | 轨道交通客流预测方法及装置 | |
WO2021212866A1 (zh) | 一种车辆出行量预测模型构建方法及预测方法和系统 | |
CN111915059B (zh) | 基于注意力机制的Seq2seq泊位占有率预测方法 | |
CN107085943B (zh) | 一种道路旅行时间短期预测方法和系统 | |
CN106507315B (zh) | 基于网络社交媒体数据的城市交通事故预测方法和系统 | |
CN105513337B (zh) | 一种客流量的预测方法及装置 | |
CN109658695A (zh) | 一种多因素的短时交通流预测方法 | |
CN114783183B (zh) | 一种基于交通态势算法的监控方法与系统 | |
CN105493109A (zh) | 使用多个数据源的空气质量推断 | |
CN110956807B (zh) | 基于多源数据与滑动窗口组合的高速公路流量预测方法 | |
CN107194491A (zh) | 一种基于公交客流和站间行程时间预测的动态调度方法 | |
CN110299011A (zh) | 一种基于收费数据的高速公路任意断面的交通流预测方法 | |
CN110047291A (zh) | 一种考虑扩散过程的短时交通流预测方法 | |
CN115240431A (zh) | 高速公路收费站交通流量实时在线仿真系统及仿真方法 | |
CN109785618A (zh) | 一种基于组合逻辑的短时交通流预测方法 | |
CN109191845A (zh) | 一种公交车辆到站时间预测方法 | |
CN110400462B (zh) | 基于模糊理论的轨道交通客流监测预警方法及其系统 | |
CN110348601A (zh) | 一种基于双向长短期记忆网络的地铁短期客流量预测方法 | |
CN112149887A (zh) | 一种基于数据时空特征的pm2.5浓度预测方法 | |
Jonnalagadda et al. | Forecasting atmospheric visibility using auto regressive recurrent neural network | |
CN108596664B (zh) | 一种电子车票的单边交易费用确定方法、系统及装置 | |
CN103605908A (zh) | 基于卡尔曼滤波的风速序列预测方法 | |
CN103020733A (zh) | 一种基于权重的机场单航班噪声预测方法及其系统 | |
CN111985731B (zh) | 城市公共交通站点人数的预测方法及系统 | |
Fontes et al. | A deep learning approach for predicting bus passenger demand based on weather conditions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |