CN113177657A - 轨道交通客流预测方法及装置 - Google Patents

轨道交通客流预测方法及装置 Download PDF

Info

Publication number
CN113177657A
CN113177657A CN202110423095.8A CN202110423095A CN113177657A CN 113177657 A CN113177657 A CN 113177657A CN 202110423095 A CN202110423095 A CN 202110423095A CN 113177657 A CN113177657 A CN 113177657A
Authority
CN
China
Prior art keywords
passenger flow
station
time
rail transit
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110423095.8A
Other languages
English (en)
Other versions
CN113177657B (zh
Inventor
虞舜
支小莉
童维勤
艾文伟
赵时旻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN202110423095.8A priority Critical patent/CN113177657B/zh
Publication of CN113177657A publication Critical patent/CN113177657A/zh
Application granted granted Critical
Publication of CN113177657B publication Critical patent/CN113177657B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Biomedical Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

一种轨道交通客流预测方法及装置,所述轨道交通客流预测方法包括:获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;将所述训练数据集输入至预先构建的初始TPA‑LSTM模型,以对所述初始TPA‑LSTM模型进行训练,得到目标TPA‑LSTM模型;将所述测试数据集输入至所述目标TPA‑LSTM模型中,得到实时客流预测结果。

Description

轨道交通客流预测方法及装置
技术领域
本发明涉及轨道交通技术领域,尤其涉及一种轨道交通客流预测方法及装置。
背景技术
随着经济的飞速发展和城市化进程的不断加快,人们对于出行的需求也在不断增长。因此,以地铁为代表的城市轨道交通系统得到了长足的发展。但随着交通量的增长,城市交通拥堵问题日益严重,特别是在北上广深为代表的一线城市,拥堵问题给市民出行带来诸多不便,也成为了城市发展的一大障碍。同时,随着地铁线路规模的扩大和运营方式的复杂化,地铁运营的安全和效率也面临着更加严峻的挑战。
在城市轨道交通相关的研究中,短时客流预测对提高城市轨道交通运行效率起着十分重要的作用。一方面短时客流预测可以为轨道交通管理者提供更具体的实时交通网络客流分布情况,及时的调整列车班次和线路调度,提升轨道交通运营能力和服务水平;另一方面,方便乘客出行前规划出行路径或计划出行时间,以及在出行中重新规划路线,避免拥堵。通过短时客流预测,可以降低路网的客流压力,减少和避免因拥堵导致的运能浪费。
目前通常使用的城市轨道交通客流预测方法主要包括:基于时间序列的方法、基于机器学习的方法等。
时间序列模型是利用时间序列相关理论及方法来进行分析预测的模型,包括自回归模型、移动平均模型、自回归移动平均模型、自回归求和移动平均模型等。这类模型一般通过曲线拟合和参数估计对系统观测得到的时间序列数据进行建模。通过对历史数据进行合理外推,从而得到预测结果。时间序列模型关注样本随时间的变化,大体分为长期趋势变化、周期变化(季节变化)、循环变动和随机变动四种。在短时客流预测领域,该方法存在一些弊端,比如实时性差,预测精度低等。
应用于轨道交通短时客流预测的包括多层感知机、支持向量机、决策树、随机森林等模型。这些方法被广泛用于短时客流预测问题,有些是单一模型,有些是包括一种或多种模型结合使用的黑拟合模型。相比于时间序列方法,机器学习模型具有更强自适应、自组织和自学习能力,预测精确度得到较大的提高,但是没有考虑到时空相关性等特征,预测精度仍然存在一定限制。
发明内容
本发明解决的技术问题是现有的轨道交通客流预测精度较差。
为解决上述技术问题,本发明实施例提供一种轨道交通客流预测方法,包括:获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;所述客流参数采用过程获取:采集轨道交通网络内每个站点在不同时间段内的交通卡数据以及对应时间段内的气象数据、车辆故障公告、站点POI数据;对所述轨道交通网络内的每个站点进行聚类,对每个聚类进行可预测性评估,确定客流采样时间;计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征;根据客流采样时间,获取每一采样时间对应的气象特征、站点客流受车辆故障影响特征以及站点POI特征;基于所述客流趋势特征、所述客流量级特征、所述气象特征、所述站点客流受车辆故障影响特征以及所述站点POI特征,得到所述客流参数;将所述训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练,得到目标TPA-LSTM模型;将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
可选的,在得到所述实时客流预测结果之后,还包括:采用预设的评价函数对所述目标TPA-LSTM模型进行评价,并使用所述验证数据集对所述目标TPA-LSTM模型进行验证。
可选的,所述对所述轨道交通网络内的每个站点进行聚类,包括:根据每个站点的客流指标,以预设时长对站台客流进行采样,得到客流序列矩阵;根据所述客流序列矩阵,计算所述预设时长内各个站点的客流率矩阵;根据站点的客流率矩阵,对所述每个站点进行聚类。
可选的,所述预设时长为1小时,所述客流序列矩阵为:
Figure BDA0003028528510000021
Figure BDA0003028528510000031
所述每个站点的客流率矩阵为:
Figure BDA0003028528510000032
其中,
Figure BDA0003028528510000033
Rd为第d天的客流序列矩阵,RId为每个站点的客流率矩阵,
Figure BDA0003028528510000034
为站点s第d天第t个时间段的客流量,
Figure BDA0003028528510000035
为站点s第d天第t个时间段的客流指标。
可选的,所述对每个聚类进行可预测性评估,包括:对所述客流序列矩阵进行按站点进行计算算术平均值,得到
Figure BDA0003028528510000036
其中,
Figure BDA0003028528510000037
计算
Figure BDA0003028528510000038
的自相关性系数,并对
Figure BDA0003028528510000039
进行平稳性检测,得到所述每个站点可预测的客流时间序列。
可选的,所述计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征,包括:根据当前时刻客流量相较前N个时间步的客流量变换趋势,确定所述客流趋势特征;根据当前时刻客流量与当前站点最大客流量、当前站点平均客流量的关系,确定所述客流量级特征。
可选的,所述根据客流采样时间,确定每一采样时间对应的站点客流受车辆故障影响特征,包括:根据客流是否为直接受影响站点,确定站点性影响特征;根据是否与受影响站点处于同一线路,确定线路性影响特征;根据是否在故障影响时间内,确定全局性影响特征。
可选的,所述初始TPA-LSTM模型采用如下步骤构建:所述初始TPA-LSTM模型由长短期记忆神经网络单元、卷积神经网络单元和全连接层依次连接构成,其中:所述长短期记忆神经网络单元用于捕捉轨道交通客流的长程依赖关系;所述卷积神经网络单元用于计算所述长短期记忆神经网络单元的每个时间步隐藏层的注意力分布,选择变量加权;所述全连接层用于捕捉隐藏层状态与客流预测结果之间的非线性关系。
可选的,所述长短期记忆神经网络单元使用隐藏层和细胞状态存储所述长程依赖关系,所述依赖关系为:ht,ct=F(ht-1,ct-1,xt),其中,ht为第t个时间步的隐藏层状态,ct为第t个时间步的细胞状态,xt为第t个时间步的输入数据。
为解决上述技术问题,本发明实施例还提供了一种轨道交通客流预测装置,包括:参数获取单元,用于获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;所述客流参数采用过程获取:采集轨道交通网络内每个站点在不同时间段内的交通卡数据以及对应时间段内的天气状况、车辆故障公告、站点POI数据;对所述轨道交通网络内的每个站点进行聚类,对每个聚类进行客流预测;计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征;根据客流采样时间,获取每一采样时间对应的气象特征、站点客流受车辆故障影响特征以及站点POI特征;基于所述客流趋势特征、所述客流量级特征、所述气象特征、所述站点客流受车辆故障影响特征以及所述站点POI特征,得到所述客流参数;训练单元,用于将所述训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练,得到目标TPA-LSTM模型;预测结果获取单元,用于将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
在获取客流参数时,在获取历史客流的基础之上,还额外增加气象数据因素、车辆故障因素、站点POI数据因素等外部数据,基于多种数据进行客流量预测,可以提高客流预测精度。并且,在获取客流参数时,以站点客流指标和站点周边对站点进行POI聚类,针对单一种类的聚类站点进行客流预测,更有针对性。
此外,采用TPA-LSTM网络,在传统的LSTM网络添加一层时间模式注意力机制,相较于传统的注意力机制选择相关的时间步加权,TPA能够选择相关变量加权,从而捕捉对客流影响更重要的外部特征,使原有的LSTM能有效利用多元化的数据,明显地提高了短时客流预测精度。
附图说明
图1是本发明实施例一种轨道交通客流预测方法的流程图;
图2是本发明实施例一种轨道交通客流预测装置的结构示意图。
具体实施方式
如上述背景技术中所述,现有的轨道交通客流预测精度较低。
在本发明实施例中,在获取客流参数时,在获取历史客流的基础之上,还额外增加气象数据因素、车辆故障因素、站点POI数据因素等外部数据,基于多种数据进行客流量预测,可以提高客流预测精度。并且,在获取客流参数时,以站点客流指标和站点周边对站点进行POI聚类,针对单一种类的聚类站点进行客流预测,更有针对性。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本发明实施例提供了一种轨道交通客流预测方法,参照图1,以下通过具体步骤进行详细说明。
步骤S101,获取客流参数。
在具体实施中,可以预先获取客流参数,客流参数可以由训练数据集、测试数据集以及验证数据集组成。
下面对本发明实施例中获取客流参数的具体过程进行详细说明。
在本发明实施例中,可以采集在某一时间区间内,轨道交通网络中每一个站点在不同时间段内的交通卡数据,以及不同时间段内对应的天气状况、车辆故障公告、站点POI数据等信息。采样时间粒度可以从如下集合中选择任一或者多个{1,2,3,4,5,6,8,9,10,12,15,20,30,60,120,180},该集合的单位为分钟(min)。
例如,采集在2015年4月份,以60min为采样时间粒度,则采集5:00~6:00、6:00~7:00、7:00~8:00、……、23:00~24:00内,上海地铁交通网络中每一个站点在上述时间段内的交通卡数据。
在本发明实施例中,交通卡数据可以包括交通卡号码、交易日期(即交通卡刷卡日期)、交易时间(即交通卡刷卡的具体时间)、乘车线路、起始与结束站点、交通工具类型、交易金额、交易性质等数据。交通卡数据能够表征某一公交卡的路线信息以及消费信息。
在具体应用中,起始与结束站点表征该交通卡刷卡的起始站点与结束站点,也即该交通卡的持有人在哪一站进站使用交通卡,以及在哪一站出站使用交通卡。交通工具类型可以包括公交、地铁、轮渡、出租车等交通工具类型。交易金额则为该交通卡在本次行程中的消费金额,交易性质可以表征本次使用公交卡是否有优惠。
通过获取交通卡数据,最终可以得到轨道交通网络内,每一个站点在每一天不同的时间段内的进站客流量以及出站客流量。
可以理解的是,上述的交通卡数据还可以包括其他能够表征交通卡相关的数据,并不仅限于上述示例说明。
在具体实施中,对应时间段内的气象数据可以包括站点外界环境的温度、湿度、风速以及天气状况等,气象数据还可以包括站点外界人体体感温度。
在具体实施中,车辆故障报告可以包括每次故障时间、被故障直接影响的站点以及故障持续时间。
在具体实施中,POI数据可以通过对公共交通站点附近一定距离范围内的用地POI信息获取。例如,POI数据通过对地铁站点附近800米的用地POI信息获取。
在具体实施中,在获取到每个站点交通卡数据以及站点POI数据之后,可以对轨道交通网络内的每个站点进行聚类,并对每个聚类进行客流预测。
在本发明实施例中,可以采用K-means聚类算法,根据每个站点的客流指标,以预设时长对站台客流进行采样,得到客流序列矩阵。之后,根据客流序列矩阵,计算预设时长内各个站点的客流率矩阵;根据客流率矩阵,对每个站点进行聚类。
在本发明一实施例中,设定以一天为标准,以60min为预设时长,对站台客流进行采样,得到客流序列矩阵Rd;根据客流序列矩阵Rd,计算各个站点的小时客流率矩阵RId
客流序列矩阵表示为:
Figure BDA0003028528510000071
每个站点的客流率矩阵为:
Figure BDA0003028528510000072
其中,
Figure BDA0003028528510000073
Rd为第d天的客流序列矩阵,RId为每个站点的客流率矩阵,
Figure BDA0003028528510000074
为站点s第d天第t个时间段的客流量,
Figure BDA0003028528510000075
为站点s第d天第t个时间段的客流指标。
在具体实施中,通过聚类算法,可以将各个站点划分为如下几类:居住类站点、就业类站点、偏远居住类站点、混合居住类站点和混合就业类站点。
在具体实施中,可以对每个聚类进行可预测性评估,以从上述的采样时间粒度集合中确定客流采样时间。
在本发明实施例中,可预测性评估可以包括两个步骤:自相关性度量以及平稳性测量。自相关性度量与平稳性检测都在客流时间序列上进行计算,客流时间序列可以通过对客流序列矩阵按站点进行算术平均值计算得到,即:
Figure BDA0003028528510000076
自相关性度量可以通过计算
Figure BDA0003028528510000078
的自相关系数得到,其中,
Figure BDA0003028528510000077
自相关系数的计算公式为:
Figure BDA0003028528510000081
其中,u为序列x的平均值,k为序列的滞后项,滞后项由时间粒度得到,为1天的总时间除以时间粒度,自相关性系数的值域为[-1,1],越接近1则越相关,反之则为负相关。
平稳性检测通过对
Figure BDA0003028528510000082
进行ADF检验得到,以p值表示检测结果,p值小于某个阈值的序列是平稳的。
为所有站点、每个聚类的站点集合的工作日进站、出站客流序列求平均进行可预测性评估,设置自相关系数、p值的阈值分别为0.95、0.01。
以就业类站点的平均客流为例,根据判断标准,所确定的合适的客流采样时间为4~30min。
在具体实施中,可以计算每个站点可预测的客流时间序列,进而确定客流时间序列对应的客流趋势特征以及客流量级特征。
在本发明实施例中,可以根据当前时刻客流量相较前N个时间步的客流量变换趋势,确定所述客流趋势特征;根据当前时刻客流量与当前站点最大客流量、当前站点平均客流量的关系,确定所述客流量级特征。
在本发明一实施例中,得到如下特征变量集合:
Figure BDA0003028528510000083
其中
Figure BDA0003028528510000084
分别为站点s第t个时间段的进站、出站客流,
Figure BDA0003028528510000085
分别为站点s第t个时间段进站客流的客流趋势和客流量级,
Figure BDA0003028528510000086
为站点s第t个时间段出站客流的客流趋势和客流量级。
进站客流趋势的取值可以由-1、0、1来表征。当进站客流趋势的取值为-1时,表征进站客流明显下降;当进站客流趋势的取值为1时,表征进站客流明显增加;当进站客流平稳变化时,进站客流趋势的取值为0。
相应地,出站客流趋势的取值可以由-1、0、1来表征。当出站客流趋势的取值为-1时,表征出站客流明显下降;当出站客流趋势的取值为1时,表征出站客流明显增加;当出站客流平稳变化时,出站客流趋势的取值为0。
进站客流量级的取值可以由0、1、2来表征。当进站客流量级的取值为0时,表征进站客流量级为小客流;当进站客流量级的取值为1时,表征进站客流量级为中客流;当进站客流量级的取值为2时,表征进站客流量级为大客流。
相应地,出站客流量级的取值可以由0、1、2来表征。当出站客流量级的取值为0时,表征出站客流量级为小客流;当出站客流量级的取值为1时,表征出站客流量级为中客流;当出站客流量级的取值为2时,表征出站客流量级为大客流。
在具体应用中,客流趋势的明显下降、明显上升、平稳变化的区间也可以根据具体的应用场景设备。例如,设定客流量在5分钟内的下降人次超过20人次为明显下降,设定客流量在5分钟内的上升人次超过40人次为明显上升,其他的情况设定为平稳变化。
在具体应用中,小客流、中客流、大客流的具体数据可以根据具体的应用场景设定。例如,设定客流量为每5分钟不大于50人次的客流为小客流,客流量为每5分钟在50人次~200人次的客流为中客流,客流量为每5分钟超过200人次的客流为大客流。
在具体实施中,可以将气象数据中外界环境的温度、风速、体感温度等保留小数形式,将湿度转换为0~1的小数,天气状况可以由晴天、少云、多云、阴天、小雨、大雨、薄雾、雾、霾等的one-hot形式。天气状况可以一共包括14项天气特征。
在具体实施中,可以根据站点客流是否直接受故障影响,确定站点性影响特征;根据站点是否与受影响站点处于同一条线路,确定线路性影响特征;根据当前时刻是否在故障时间内,确定全局性影响特征。由此,本发明实施例中所述的车辆故障影响特征包括站点性影响特征、线路性影响特征以及全局性影响特征。
站点性影响特征可以由0、1来表征。当站点性影响特征的取值为0时,表征该站点不受车辆故障影响;当站点性影响特征的取值为1时,表征该站点收到车辆故障影响。
线路性影响特征可以由0、1来表征。当线路性影响特征的取值为0时,表征该站点与受车辆故障影响的站点不处于同一条线路;当线路性影响特征的取值为1时,表征该站点与受车辆故障影响的站点处于同一条线路。
全局性影响提特征可以由0、1来表征。当全局性影响特征的取值为0时,表征该站点当前时刻的客流不受车辆故障影响;当全局性影响特征的取值为1时,表征该站点当前时刻的客流受到车辆故障的影响。
在具体实施中,POI数据可以通过统计各个站点周边的交通运输、休闲娱乐、公司企业等标签的用地数量分布,得到POI特征。
在本发明一实施例中,以上海地铁二号线南京西路地铁站为例,得到的POI标签、POI数量及POI特征如下表1所示:
Figure BDA0003028528510000101
表1
在具体实施中,上述得到的天气特征、POI特征、站点客流受车辆故障影响特征对应的特征变量集合可以表征为
Figure BDA0003028528510000111
将上述特征变量集合与上述特征变量集合
Figure BDA0003028528510000112
进行结合,得到最终的特征变量集合中,共包括41个特征变量。该41个变量特征即为客流参数。
在特征变量集合
Figure BDA0003028528510000113
中,
Figure BDA0003028528510000114
表示第t个时间段的气象特征,
Figure BDA0003028528510000115
表示站点s的poi特征,SFs,t,LFs,t,GFs,t分别表示s站点第t个时间段受到列车故障的站点性影响特征、线路影响性特征以及全局性影响特征。
在具体实施中,若设预测时段进站客流为
Figure BDA0003028528510000116
则在工作日场景下,客流参数与应变量之间的映射关系如下方公式所示:
Figure BDA0003028528510000117
其中,F代表短时客流预测模型,特征变量一共由w个时间步,w通过1小时除以时间粒度得到,本发明实施例中以时间粒度为5min为例,则w=12。
在具体实施中,在得到客流参数之后,可以对客流参数进行划分,将其划分为训练数据集、测试数据集以及验证数据集。
在本发明一实施例中,客流参数为2015年4月份的工作日客流参数,训练数据集为{1,2,3,7,8,9,10,13,14,15,16,17,20,21,22}日数据,测试数据集为{23,24,27}日数据,验证数据集为{28,29,30}日数据。
步骤S102,将训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练。
在具体实施中,可以预先构建初始TPA-LSTM模型,在完成初始TPA-LSTM模型的构建之后,通过训练迭代,将步骤S101中获取到的训练数据集输入至初始TPA-LSTM模型,以对初始TPA-LSTM模型进行训练,进而得到目标TPA-LSTM模型。
在本发明实施例中,初始TPA-LSTM模型可以由长短期记忆神经网络单元、卷积神经网络单元和全连接层依次连接构成,其中:所述长短期记忆神经网络单元用于捕捉轨道交通客流的长程依赖关系;所述卷积神经网络单元用于计算所述长短期记忆神经网络单元的每个时间步隐藏层的注意力分布,选择变量加权;所述全连接层用于捕捉隐藏层状态与客流预测结果之间的非线性关系。
在本发明实施例中,LSTM层中使用隐藏层和细胞状态存储长程依赖关系,其公式为:ht,ct=F(ht-1,ct-1,xt);其中,ht为第t个时间步的隐藏层状态,ct为第t个时间步的细胞状态,xt为第t个时间步的输入数据。
更具体地,隐藏层和细胞状态由LSTM单元中的输入门it、遗忘门ft、输出门ot控制,具体为:
it=sigmoid(Wixt+Uiht-1)
ft=sigmoid(Wfxt+Ufht-1)
ot=sigmoid(Woxt+Uoht-1)
ct=ft⊙ct-1+it⊙tanh(Wcxt+Ucht-1)
ht=ot ⊙tanh(ct)
其中,Wi,Ui,Wf,Uf,Wo,Uo,Wc,Uc为权重参数,⊙为点积乘法。
在具体实施中,用于时间检测的CNN滤波器可以为:
Figure BDA0003028528510000121
其中,Ht={ht-w,ht-w+1,…,ht-1}表示LSTM层每一个时间步训练的隐藏层状态矩阵,CNN层配置为k个滤波器Ct,卷积核的尺寸为1×T(T表示注意力机制所覆盖的范围,通常令T等于w),得到
Figure BDA0003028528510000122
表示第i个行向量和第j个卷积核作用的结果值。
在时间模式注意力机制中,令query=ht,key=HC,则打分函数为:
Figure BDA0003028528510000123
其中,
Figure BDA0003028528510000124
表示HC第i个行向量,Wa为权重参数。
之后,利用sigmoid进行归一化,得到注意力权重矩阵αi,选择多变量中有用的变量,便于预测。注意力权重矩阵αi可以为如下式表示:
Figure BDA0003028528510000131
Figure BDA0003028528510000132
完成这个过程,HC的行向量通过αi加权得到上下文向量vt,为
Figure BDA0003028528510000133
最后,根据vt和ht使用全连接层降维用于计算最后的预测值为:h t=Whht+Wvvt
Figure BDA0003028528510000134
在本发明实施例中,初始TPA-LSTM模型中各单元的超参数可以如下表2所示:
Figure BDA0003028528510000135
表2
步骤S103,将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
在具体实施中,通过每次迭代训练,将训练数据集中的数据输入到初始TPA-LSTM模型中。在训练过程中,损失函数可以为均方误差函数(MSE):
Figure BDA0003028528510000136
其中,n是数据个数,yi是真实值,
Figure BDA0003028528510000137
是预测值。
需要说明的是,在本发明实施例中,训练过程的学习率使用自适应调节,学习率在若干个训练迭代中会根据损失函数值是否下降进行调节。
在具体实施中,在得到实时客流预测结果之后,还可以采用预设的评价函数对目标TPA-LSTM模型进行评价,并使用验证数据集对目标TPA-LSTM模型进行验证。
在具体实施中,评价模型的评价指标可以为平均绝对误差(MAE,mean absoluteerror)和均方根误差(RMSE,the root-mean-squarederror),其中:
Figure BDA0003028528510000141
Figure BDA0003028528510000142
综上可见,在获取客流参数时,在获取历史客流的基础之上,还额外增加气象数据因素、车辆故障因素、站点POI数据因素等外部数据,基于多种数据进行客流量预测,可以提高客流预测精度。并且,在获取客流参数时,以站点客流指标和站点周边对站点进行POI聚类,针对单一种类的聚类站点进行客流预测,更有针对性。
参照图2,给出了本发明实施例中的一种轨道交通客流预测装置20,包括:参数获取单元201、训练单元202以及预测结果获取单元203,其中:
参数获取单元201,用于获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;所述客流参数采用过程获取:采集轨道交通网络内每个站点在不同时间段内的交通卡数据以及对应时间段内的天气状况、车辆故障公告、站点POI数据;对所述轨道交通网络内的每个站点进行聚类,对每个聚类进行客流预测;计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征;根据客流采样时间,获取每一采样时间对应的气象特征、站点客流受车辆故障影响特征以及站点POI特征;基于所述客流趋势特征、所述客流量级特征、所述气象特征、所述站点客流受车辆故障影响特征以及所述站点POI特征,得到所述客流参数;
训练单元202,用于将所述训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练,得到目标TPA-LSTM模型;
预测结果获取单元203,用于将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (10)

1.一种轨道交通客流预测方法,其特征在于,包括:
获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;所述客流参数采用过程获取:采集轨道交通网络内每个站点在不同时间段内的交通卡数据以及对应时间段内的气象数据、车辆故障公告、站点POI数据;对所述轨道交通网络内的每个站点进行聚类,对每个聚类进行可预测性评估,确定客流采样时间;计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征;根据客流采样时间,获取每一采样时间对应的气象特征、站点客流受车辆故障影响特征以及站点POI特征;基于所述客流趋势特征、所述客流量级特征、所述气象特征、所述站点客流受车辆故障影响特征以及所述站点POI特征,得到所述客流参数;
将所述训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练,得到目标TPA-LSTM模型;
将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
2.根据权利要求1所述的轨道交通客流预测方法,其特征在于,在得到所述实时客流预测结果之后,还包括:
采用预设的评价函数对所述目标TPA-LSTM模型进行评价,并使用所述验证数据集对所述目标TPA-LSTM模型进行验证。
3.根据权利要求1所述的轨道交通客流预测方法,其特征在于,所述对所述轨道交通网络内的每个站点进行聚类,包括:
根据每个站点的客流指标,以预设时长对站台客流进行采样,得到客流序列矩阵;
根据所述客流序列矩阵,计算所述预设时长内各个站点的客流率矩阵;
根据站点的客流率矩阵,对所述每个站点进行聚类。
4.如权利要求3所述的轨道交通客流预测方法,其特征在于,所述预设时长为1小时,所述客流序列矩阵为:
Figure FDA0003028528500000021
所述每个站点的客流率矩阵为:
Figure FDA0003028528500000022
其中,
Figure FDA0003028528500000023
Rd为第d天的客流序列矩阵,RId为每个站点的客流率矩阵,
Figure FDA0003028528500000024
为站点s第d天第t个时间段的客流量,
Figure FDA0003028528500000025
为站点s第d天第t个时间段的客流指标。
5.根据权利要求4所述的轨道交通客流预测方法,其特征在于,所述对每个聚类进行可预测性评估,包括:
对所述客流序列矩阵进行按站点进行计算算术平均值,得到
Figure FDA0003028528500000026
其中,
Figure FDA0003028528500000027
计算
Figure FDA0003028528500000028
的自相关性系数,并对
Figure FDA0003028528500000029
进行平稳性检测,得到所述每个站点可预测的客流时间序列。
6.根据权利要求5所述的轨道交通客流预测方法,其特征在于,所述计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征,包括:
根据当前时刻客流量相较前N个时间步的客流量变换趋势,确定所述客流趋势特征;
根据当前时刻客流量与当前站点最大客流量、当前站点平均客流量的关系,确定所述客流量级特征。
7.根据权利要求6所述的轨道交通客流预测方法,其特征在于,所述根据客流采样时间,确定每一采样时间对应的站点客流受车辆故障影响特征,包括:
根据客流是否为直接受影响站点,确定站点性影响特征;
根据是否与受影响站点处于同一线路,确定线路性影响特征;
根据是否在故障影响时间内,确定全局性影响特征。
8.根据权利要求1所述的轨道交通客流预测方法,其特征在于,所述初始TPA-LSTM模型采用如下步骤构建:
所述初始TPA-LSTM模型由长短期记忆神经网络单元、卷积神经网络单元和全连接层依次连接构成,其中:所述长短期记忆神经网络单元用于捕捉轨道交通客流的长程依赖关系;所述卷积神经网络单元用于计算所述长短期记忆神经网络单元的每个时间步隐藏层的注意力分布,选择变量加权;所述全连接层用于捕捉隐藏层状态与客流预测结果之间的非线性关系。
9.根据权利要求8所述的轨道交通客流预测方法,其特征在于,所述长短期记忆神经网络单元使用隐藏层和细胞状态存储所述长程依赖关系,所述依赖关系为:ht,ct=F(ht-1,ct-1,xt),其中,ht为第t个时间步的隐藏层状态,ct为第t个时间步的细胞状态,xt为第t个时间步的输入数据。
10.一种轨道交通客流预测装置,其特征在于,包括:
参数获取单元,用于获取客流参数,所述客流参数包括训练数据集、测试数据集与验证数据集;所述客流参数采用过程获取:采集轨道交通网络内每个站点在不同时间段内的交通卡数据以及对应时间段内的天气状况、车辆故障公告、站点POI数据;对所述轨道交通网络内的每个站点进行聚类,对每个聚类进行客流预测;计算每个站点可预测的客流时间序列,确定所述客流时间序列的客流趋势特征和客流量级特征;根据客流采样时间,获取每一采样时间对应的气象特征、站点客流受车辆故障影响特征以及站点POI特征;基于所述客流趋势特征、所述客流量级特征、所述气象特征、所述站点客流受车辆故障影响特征以及所述站点POI特征,得到所述客流参数;
训练单元,用于将所述训练数据集输入至预先构建的初始TPA-LSTM模型,以对所述初始TPA-LSTM模型进行训练,得到目标TPA-LSTM模型;
预测结果获取单元,用于将所述测试数据集输入至所述目标TPA-LSTM模型中,得到实时客流预测结果。
CN202110423095.8A 2021-04-20 2021-04-20 轨道交通客流预测方法及装置 Active CN113177657B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110423095.8A CN113177657B (zh) 2021-04-20 2021-04-20 轨道交通客流预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110423095.8A CN113177657B (zh) 2021-04-20 2021-04-20 轨道交通客流预测方法及装置

Publications (2)

Publication Number Publication Date
CN113177657A true CN113177657A (zh) 2021-07-27
CN113177657B CN113177657B (zh) 2022-08-30

Family

ID=76923763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110423095.8A Active CN113177657B (zh) 2021-04-20 2021-04-20 轨道交通客流预测方法及装置

Country Status (1)

Country Link
CN (1) CN113177657B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114066038A (zh) * 2021-11-10 2022-02-18 上海市大数据股份有限公司 一种地铁客流的预测方法及系统
CN114091579A (zh) * 2021-11-03 2022-02-25 深圳技术大学 城市轨道交通客流预警系统和方法
CN114282732A (zh) * 2021-12-29 2022-04-05 重庆紫光华山智安科技有限公司 一种区域人流量的预测方法及装置
CN114881330A (zh) * 2022-05-09 2022-08-09 华侨大学 一种基于神经网络的轨道交通客流预测方法及系统
WO2023056696A1 (zh) * 2021-10-08 2023-04-13 南威软件股份有限公司 基于循环神经网络的城市轨道交通短时客流预测方法
CN117252311A (zh) * 2023-11-16 2023-12-19 华南理工大学 一种基于改进lstm网络的轨道交通客流预测方法

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101571996A (zh) * 2009-06-10 2009-11-04 上海理工大学 城市公交智能化应急管理方法
CN104408643A (zh) * 2014-10-30 2015-03-11 西北大学 一种行为感知偏好获取系统及其获取方法
WO2017166370A1 (zh) * 2016-03-29 2017-10-05 东南大学 一种基于区域城际流强度测算模型的划定大都市圈的方法
CN107316096A (zh) * 2017-05-05 2017-11-03 北京市交通信息中心 一种轨道交通一票通乘客进站量预测方法
CN108537392A (zh) * 2018-04-26 2018-09-14 重庆大学 一种基于时空特征预测轨道交通站点出站客流量的方法
CN108564228A (zh) * 2018-04-26 2018-09-21 重庆大学 一种基于时序特征预测轨道交通od客流量的方法
CN109583656A (zh) * 2018-12-06 2019-04-05 重庆邮电大学 基于a-lstm的城市轨道交通客流量预测方法
CN110570004A (zh) * 2018-06-05 2019-12-13 上海申通地铁集团有限公司 地铁客流的预测方法及系统
WO2020010717A1 (zh) * 2018-07-13 2020-01-16 南京理工大学 一种基于时空相关性的短时交通流预测方法
CN110852476A (zh) * 2019-09-29 2020-02-28 华东理工大学 客流预测方法、装置、计算机设备和存储介质
CN111178598A (zh) * 2019-12-16 2020-05-19 中国铁道科学研究院集团有限公司 铁路客运站客流量预测方法、系统、电子设备及存储介质
CN111598333A (zh) * 2020-05-14 2020-08-28 北京轨道交通路网管理有限公司 客流数据的预测方法及装置
CN111931978A (zh) * 2020-06-29 2020-11-13 南京熊猫电子股份有限公司 一种基于时空特性的城市轨道交通客流状态预测方法
CN112418518A (zh) * 2020-11-20 2021-02-26 佳都新太科技股份有限公司 基于时间特征权重和线网拓扑的客流预测方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101571996A (zh) * 2009-06-10 2009-11-04 上海理工大学 城市公交智能化应急管理方法
CN104408643A (zh) * 2014-10-30 2015-03-11 西北大学 一种行为感知偏好获取系统及其获取方法
WO2017166370A1 (zh) * 2016-03-29 2017-10-05 东南大学 一种基于区域城际流强度测算模型的划定大都市圈的方法
CN107316096A (zh) * 2017-05-05 2017-11-03 北京市交通信息中心 一种轨道交通一票通乘客进站量预测方法
CN108537392A (zh) * 2018-04-26 2018-09-14 重庆大学 一种基于时空特征预测轨道交通站点出站客流量的方法
CN108564228A (zh) * 2018-04-26 2018-09-21 重庆大学 一种基于时序特征预测轨道交通od客流量的方法
CN110570004A (zh) * 2018-06-05 2019-12-13 上海申通地铁集团有限公司 地铁客流的预测方法及系统
WO2020010717A1 (zh) * 2018-07-13 2020-01-16 南京理工大学 一种基于时空相关性的短时交通流预测方法
CN109583656A (zh) * 2018-12-06 2019-04-05 重庆邮电大学 基于a-lstm的城市轨道交通客流量预测方法
CN110852476A (zh) * 2019-09-29 2020-02-28 华东理工大学 客流预测方法、装置、计算机设备和存储介质
CN111178598A (zh) * 2019-12-16 2020-05-19 中国铁道科学研究院集团有限公司 铁路客运站客流量预测方法、系统、电子设备及存储介质
CN111598333A (zh) * 2020-05-14 2020-08-28 北京轨道交通路网管理有限公司 客流数据的预测方法及装置
CN111931978A (zh) * 2020-06-29 2020-11-13 南京熊猫电子股份有限公司 一种基于时空特性的城市轨道交通客流状态预测方法
CN112418518A (zh) * 2020-11-20 2021-02-26 佳都新太科技股份有限公司 基于时间特征权重和线网拓扑的客流预测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JINLEI ZHANG,ET AL.: ""Cluster-Based LSTM Network for Short-TermPassenger Flow Forecasting in Urban Rail Transit"", 《IEEEXPLORE》 *
谢贵才等: ""多尺度时序依赖的校园公共区域人流量预测"", 《软件学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023056696A1 (zh) * 2021-10-08 2023-04-13 南威软件股份有限公司 基于循环神经网络的城市轨道交通短时客流预测方法
CN114091579A (zh) * 2021-11-03 2022-02-25 深圳技术大学 城市轨道交通客流预警系统和方法
CN114066038A (zh) * 2021-11-10 2022-02-18 上海市大数据股份有限公司 一种地铁客流的预测方法及系统
CN114282732A (zh) * 2021-12-29 2022-04-05 重庆紫光华山智安科技有限公司 一种区域人流量的预测方法及装置
CN114881330A (zh) * 2022-05-09 2022-08-09 华侨大学 一种基于神经网络的轨道交通客流预测方法及系统
CN117252311A (zh) * 2023-11-16 2023-12-19 华南理工大学 一种基于改进lstm网络的轨道交通客流预测方法
CN117252311B (zh) * 2023-11-16 2024-03-15 华南理工大学 一种基于改进lstm网络的轨道交通客流预测方法

Also Published As

Publication number Publication date
CN113177657B (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CN113177657B (zh) 轨道交通客流预测方法及装置
WO2021212866A1 (zh) 一种车辆出行量预测模型构建方法及预测方法和系统
CN111915059B (zh) 基于注意力机制的Seq2seq泊位占有率预测方法
CN107085943B (zh) 一种道路旅行时间短期预测方法和系统
CN106507315B (zh) 基于网络社交媒体数据的城市交通事故预测方法和系统
CN105513337B (zh) 一种客流量的预测方法及装置
CN109658695A (zh) 一种多因素的短时交通流预测方法
CN114783183B (zh) 一种基于交通态势算法的监控方法与系统
CN105493109A (zh) 使用多个数据源的空气质量推断
CN110956807B (zh) 基于多源数据与滑动窗口组合的高速公路流量预测方法
CN107194491A (zh) 一种基于公交客流和站间行程时间预测的动态调度方法
CN110299011A (zh) 一种基于收费数据的高速公路任意断面的交通流预测方法
CN110047291A (zh) 一种考虑扩散过程的短时交通流预测方法
CN115240431A (zh) 高速公路收费站交通流量实时在线仿真系统及仿真方法
CN109785618A (zh) 一种基于组合逻辑的短时交通流预测方法
CN109191845A (zh) 一种公交车辆到站时间预测方法
CN110400462B (zh) 基于模糊理论的轨道交通客流监测预警方法及其系统
CN110348601A (zh) 一种基于双向长短期记忆网络的地铁短期客流量预测方法
CN112149887A (zh) 一种基于数据时空特征的pm2.5浓度预测方法
Jonnalagadda et al. Forecasting atmospheric visibility using auto regressive recurrent neural network
CN108596664B (zh) 一种电子车票的单边交易费用确定方法、系统及装置
CN103605908A (zh) 基于卡尔曼滤波的风速序列预测方法
CN103020733A (zh) 一种基于权重的机场单航班噪声预测方法及其系统
CN111985731B (zh) 城市公共交通站点人数的预测方法及系统
Fontes et al. A deep learning approach for predicting bus passenger demand based on weather conditions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant