CN116451867A - 一种基于时空出行路径标定的地铁短时客流预测方法 - Google Patents

一种基于时空出行路径标定的地铁短时客流预测方法 Download PDF

Info

Publication number
CN116451867A
CN116451867A CN202310462296.8A CN202310462296A CN116451867A CN 116451867 A CN116451867 A CN 116451867A CN 202310462296 A CN202310462296 A CN 202310462296A CN 116451867 A CN116451867 A CN 116451867A
Authority
CN
China
Prior art keywords
time
passenger flow
short
passenger
passengers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310462296.8A
Other languages
English (en)
Inventor
张柯军
毕秀霞
李青
王君兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Gemi Technology Co ltd
Original Assignee
Hangzhou Gemi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Gemi Technology Co ltd filed Critical Hangzhou Gemi Technology Co ltd
Priority to CN202310462296.8A priority Critical patent/CN116451867A/zh
Publication of CN116451867A publication Critical patent/CN116451867A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于时空出行路径标定的地铁短时客流预测方法,利用AFC数据与列车运行时刻表,基于计算图模型估计站点等车时间,进而标定常态客流的出行时空路径,以期能够刻画出每一个固定OD对乘客的出行画像,进而实现线网级的短时客流预测。本发明提出的技术方案充分利用AFC历史及列车运行时刻表数据,根据对乘客历史出行行为进行聚类分析,在更加精准确定两类乘客出行路径行为的基础上进行各自的客流预测,从而形成线网的客流预测。本发明在线网客流预测上以数据驱动为准,规避各种假设,遵照乘客出行行为的客观状态,为运营服务及客流突发情况下的应急提供了更加合理的决策依据。

Description

一种基于时空出行路径标定的地铁短时客流预测方法
技术领域
本发明涉及城市轨道交通运行控制技术领域,具体涉及一种基于时空出行路径标定的地铁短时客流预测方法。
背景技术
客流预测是指利用一定的方法和技术对未来一定时期内客流的需求、性质进行预先推测和判断。根据不同的预测需求,分别从宏观、中观和微观的角度可以划分为长期预测、中期预测和短期预测。中长期客流预测(通常指未来10~25年)是从整体上用来辅助轨道交通线网发展规划及车站设计等;短期客流预测(通常指未来1周/1个月内)则是为评估交通状态,其中以实时管理为目的的客流预测为短时客流预测(通常指未来5min或15min内),是提高城市轨道交通服务水平(如优化线网运力配置、制定车站客流组织与疏散方案、乘客出行路径诱导等)的关键因素。
短时客流预测的方法大致经历了三个阶段。第一个阶段为传统的基于数理统计的模型,第二个阶段为基于机器学习的模型,第三个阶段为基于深度学习的模型。传统的基于数理统计的模型一般假设客流服从某种数学分布,利用历史数据标定模型参数,代表方法有自回归差分平均(Autoregressive Integrated Moving Average,ARIMA)模型、贝叶斯法、灰色模型(Grey Model,GM)、灰色模型-求和自回归移动平均模型(GM-ARIMA)等。但是,参数模型的构建更多依赖于研究者对问题的先验认知,具有一定的主观性。而后,随着机器学习的发展,一些机器学习模型被逐渐应用到短时客流预测领域。
其中作为机器学习的一个分支,深度学习近十年来得到快速发展。在交通预测领域,基于循环神经网络(Recurrent Neural Network,RNN)、卷积神经网络(ConvolutionalNeural Networks,CNN)、图卷积神经网络(Graph Convolution Neural Networks,GCN)等的单一深度学习模型相继被应用到短时客流预测问题中。但是,由于单一深度学习模型存在一定的不足,为了更有效的捕捉客流的时空依赖关系,融合多种深度学习模型的框架逐渐被开发出来。例如,将残差网络(Residual Network,ResNet)、GCN、长短时记忆网络(LongShort-Term Memory,LSTM)与Attention机制组合进行短时进站流预测。大量研究已经表明,深度学习的组合框架比单一深度学习模型的表现能力更好,但同时复杂程度也较高,实用价值相对较弱。
其中,针对短时断面流预测问题,现有研究多数通过客流分配获取断面流量。客流分配理论从道路交通演化而来,经历了从静态客流分配至动态客流分配的过程。静态客流分配过程包括构建地铁网络、构建费用函数、K短路搜索与客流分配;动态客流分配过程包括构建时空地铁网络、构建时间依赖的效用函数、时间依赖的K短路搜索与客流分配。难点均在于效用函数构建与分配算法的求解。部分研究通过历史数据得到断面客流数据进行短时断面流预测。虽然现有成果中提出了识别乘客路径的方法,得到了可行的路径集合,并采用分配思路得到每条路径的客流。但是,获取到的断面流并非真实断面流数据,使用该数据进行预测存在误差累积现象,且上述方法一定程度上忽视了断面流和进站流、OD流的内在关联。
在实际线网运营过程中,大部分常态客流具有固定的OD对,其乘坐路线也很大可能是固定的,而非路径集合。基于该认识,本发明提出:在线网运营条件下,利用AFC数据与列车运行时刻表,基于计算图模型估计站点等车时间,进而标定常态客流的出行时空路径,以期能够刻画出每一个固定OD对乘客的出行画像,进而实现线网级的短时客流预测。
发明内容
本发明提供了一种基于时空出行路径标定的地铁短时客流预测方法,利用AFC数据与列车运行时刻表,基于计算图模型估计站点等车时间,进而标定常态客流的出行时空路径,以期能够刻画出每一个固定OD对乘客的出行画像,进而实现线网级的短时客流预测。
一种基于时空出行路径标定的地铁短时客流预测方法,包括以下步骤:
步骤1:利用K短路算法筛选出单一路径的OD(英文全称:Origin-Destination,中文注释:起讫点)对后,采用计算图框架计算走行时间、换乘时间及候车节点时间,确定每个站内付费区不同时间段行走、换乘时间及候车节点时间。
步骤1中,候车节点是指乘客候车时所在的节点;
进站边:刷卡进站闸机节点到站台节点的边,即乘车进站走行时间。
换乘边:乘客在换乘车站的两个站台节点之间行走的边,对应的换乘时间。
出站边:乘客在出站的站台与出站闸机之间行走的边,即乘车出站走行时间。
走行时间:乘车进站走行时间加上乘客出站走行时间。
步骤2:基于历史的自动售检票系统(Automatic Fare Collection,AFC)数据,利用DBSCAN聚类算法进行计算,根据领域半径R的大小,领域半径R小于等于δ的乘客为固定时空乘客,领域半径R大于δ的乘客为随机乘客,其中δ为一个阈值,该值大小通过AFC历史数据分析确定。
步骤3:基于时空出行路径标定的固定时空乘客短时客流预测,具体包括:
3.1)固定时空乘客的路径标定;
3.2)固定时空乘客的短时客流预测。
步骤4:基于计算图模型的随机乘客短时客流预测;
4.1)基于计算图模型估计随机乘客付费区内各段时间;
4.2)通过客流分配和智能体仿真进行随机客流的短时预测。
步骤5:线网的短时客流预测。
本发明中,首先利用K短路算法筛选出单一路径的OD对后,采用计算图框架计算各个走行边、换乘边及候车节点时间,确定每个站内付费区不同时间段行走、换乘及候车节点时间;其次对历史AFC数据中单一乘客的OD对进行采样,选取一个时间段内的数据,统计乘坐次数、乘坐时长、同一OD对出现频次等属性,应用DBSCAN聚类挖掘算法,定义邻域半径δ,邻域内乘客标记为固定时空乘客,噪声乘客标记为随机乘客;接着,针对固定时空乘客,结合列车运营时空网络,对其时空路径进行标定,精准捕捉固定乘客乘坐列车的时间、地点与路径,进而进行客流预测;针对随机乘客进出站客流,则在计算图框架下,通过乘客路径选择建模、K短路搜索以及有效路径选择、构建数学优化模型、优化模型向量化、计算图模型建模等步骤,进而通过客流分配和智能体仿真等步骤,获得随机乘客的短时断面流量。最后,在同一时间段内,线网测算出行客流等于固定时空乘客与随机乘客的预测客流之和;本发明提出的技术方案充分利用AFC历史及列车运行时刻表数据,根据对乘客历史出行行为进行聚类分析,在更加精准确定两类乘客出行路径行为的基础上进行各自的客流预测,从而形成线网的客流预测。本发明在线网客流预测上以数据驱动为准,规避各种假设,遵照乘客出行行为的客观状态,为运营服务及客流突发情况下的应急提供了更加合理的决策依据。
步骤1:利用K短路算法筛选出单一路径的OD对后,采用计算图框架计算走行时间、换乘时间及候车节点时间,确定每个站内付费区不同时间段行走、换乘时间及候车节点时间。
基于历史大数据的挖掘,计算出车站付费区走行边、换乘边及候车节点的时间,比目前主流的人工测量方式更加准确,误差更小。
步骤2:基于历史的自动售检票系统(Automatic Fare Collection,AFC)数据,利用DBSCAN聚类算法进行计算,根据领域半径R的大小,领域半径R小于等于δ的乘客为固定时空乘客,领域半径R大于δ的乘客为随机乘客,其中δ为一个阈值,该值大小通过AFC历史数据分析确定。
相比目前主流根据乘客属性进行分类的方式,利用DBSCAN聚类算法对乘客的出行行为进行聚类分析更加贴合乘客的出行实际过程及其出行特征。
步骤3中,基于时空出行路径标定的固定时空乘客短时客流预测,具体包括:
3.1)固定时空乘客的路径标定;
3.2)固定时空乘客的短时客流预测;
在完成对固定时空乘客路径标定的基础上,根据即时自动售检票系统刷卡数据,并结合步骤1中计算获得的每个站内付费区不同时间段行走时间、换乘时间及候车节点时间以及列车运行时刻表,计算求得线网中h时刻a边段上固定时空乘客客流分布,如公式所示:
其中,r是进站站点,s是出站站点,边段a是rs的有限次切割,表示h时段内流入a客流,/>表示h时段内流出a客流,/>是k时间段从r间出发选择rs作为路线的流量,/>的Oa是Origin of a的缩写,υ=Oa表示υ是边段a的起始站,/>如下面公式所示:
相比于现有OD间路径确定方法,该步骤同时利用AFC历史数据的时间差和从列车运行时刻表提取出对应路径上的列车运行时间差共同确定该类乘客的出行路径,比单独使用AFC历史数据的效果更明显,准确率更高。在精准确定固定时空乘客出行路径的基础上,根据即时的AFC刷卡数据,大幅度提升乘客的出行过程预测的准确性。
步骤4:基于计算图模型的随机乘客短时客流预测;
4.1)基于计算图模型估计随机乘客付费区内各段时间
其主要思路表示如下:通过乘客路径选择建模、k短路搜索以及有效路径选择、构建数学优化模型、优化模型向量化、计算图模型建模等步骤,估计走行时间、换乘时间和站点候车时间。
步骤4中的各段时间定义如下:为准确刻画乘客完成一个OD对乘车过程,将整个出行过程嵌入至城市轨道交通网络G=(V,E),其中V代表网络中所有的节点,包括闸机节点、站台节点,E为网络中的边,包括进出站边、换乘边及列车运行边。所有的边均为有向边,分为上行方向与下行方向,方向不同则属性不同。将出行过程中的边、节点进行如下定义:
闸机节点:乘客进出站刷卡的闸机;
站台节点:乘客候车时所在的节点;
进站边:刷卡进站闸机节点到站台节点的边,即乘车进站走行时间。
列车运行边:列车在两个车站间运行边,可通过实际运行时刻表获取;
换乘边:乘客在换乘车站的两个站台节点之间行走的边,对应的换乘时间。
出站边:乘客在出站的站台与出站闸机之间行走的边,即乘车出站走行时间。
走行时间:乘车进站走行时间加上乘客出站走行时间。
4.2)通过客流分配和智能体仿真进行随机客流的短时预测
根据步骤4.1)估计得到的候车节点时间和边段行程时间ta组成的t,并结合路径表示A,获取路径行程时间cpath,根据路径行程时间获取不同路径的选择概率p,基于已有的A、t、cpath和p,结合智能体仿真,将短时间内OD客流量Q分配至各条路径上,获取路径流量f,根据路径流量,结合仿真,最终获取实时的断面流量x。获取短时断面流量全过程如下面公式所示。
cpath=At
P=spftmax(-θcpath)
f=PQ
x=∑f
其中,h时间段内OD对rs之间第k条路径的流量h时间段内边段a的断面流/> 如下公式所示。
相比于根据整体数据特征预测随机乘客的客流分布,该步骤在进一步细化并计算出乘客出行过程中的时间分布基础上利用客流分配和智能体仿真进行随机客流的短时预测,过程更加的合理,预测结果的准确率大幅度提升。
步骤5:线网的短时客流预测。
线网中短时客流由固定时空乘客客流/>与随机乘客客流/>组成,其中固定时空乘客客流/>如步骤3获得,随机乘客客流/>由步骤4获得,因此,线网中的短时客流公式所:
其中表示固定时空乘客客流/>与随机乘客客流/>的一种函数关系,该函数则通过过去一段时期内AFC历史数据进行学习训练获得。
过去一段时期是指过去的3个月、6个月或1年,具体取值根据历史AFC数据的存储量与结构决定。
与现有技术相比,本发明具有如下优点:
本发明提出的技术方案充分利用AFC历史及列车运行时刻表数据,根据乘客历史出行行为进行分类,在更加精准确定两类乘客出行路径行为的基础上进行各自的客流预测,从而形成线网的客流预测。
本发明在线网客流预测上以数据驱动为准,规避各种假设,遵照乘客出行行为的客观状态,为运营服务及客流突发情况下的应急提供了更加合理的决策依据。
附图说明
图1本发明一种基于时空出行路径标定的地铁短时客流预测方法流程示意图。
图2为基于计算图模型计算走行边、换乘边及候车节点步骤;
图3为计算边与节点时间的计算图框架:正向传播-反向传播示意图;
图4为计算边与节点时间的变量正向传播-反向传播示意图;
图5为随机乘客计算边与节点时间的计算图框架:正向传播-反向传播示意图;
图6为随机乘客计算边与节点时间的变量正向传播-反向传播示意图。
具体实施方式
如图1所示,一种基于时空出行路径标定的地铁短时客流预测方法,包括以下步骤:
步骤1:利用K短路算法筛选出单一路径的OD对后,采用计算图框架计算走行时间、换乘时间及候车节点时间,确定每个站内付费区不同时间段行走、换乘时间及候车节点时间。
如图2所示,基于计算图模型的计算步骤主要包括:构建乘客出行成本数学优化模型;乘客出行成本数学优化模型向量化;利用计算图模型求解乘客出行成本数学优化模型;
1.1)构建乘客出行成本数学优化模型
在通过K短路算法完成OD对间单一路径乘客AFC数据提取的基础上,考虑到该类乘客不存在路径选择的问题,根据乘客实际出行过程,其广义出行成本可定义为完成OD对过程中所花费的时间,如公式(1)所示。
其中是乘客出行的广义费用,r表示进站,s表示出站,rs∈POD,POD为OD对集合,a∈E为地铁网络图G中的边集合,v∈V为地铁网络图G中的车站节点集合,h∈H=(h1,h2,h3…)为乘客进入地铁网络时所在的时间间隔区间,ta为乘客经过边段a时消耗的时间,/>为时间间隔h内乘客在该车站节点v的等车时间。α、β和γ是ta和/>的系数,其定义如公式(2)所示。
本步骤主要是利用AFC数据估计边段行程及节点候车时间。目标函数为最小化估计路径行程时间和真实路径行程时间之间的误差,决策变量为边段行程时间和车站等待时间,其中边段行程时间包括进站边、出站边、列车运行边和换乘边上的行程时间,节点等车时间包括起始车站和换乘车站处的等车时间。首先对真实路径行程时间和估计路径行程时间进行定义,其次构建优化模型形成最终的估计框架。
(1)真实路径行程时间
将路径行程时间分为乘客进出站行走时间、路径起始车站和换乘车站的等车时间、列车运行时间和换乘走行时间几部分,借助个体刷卡数据中记录的进站车站、进站时间、出站车站、出站时间,估计乘客进出站时间、路径起始车站和换乘车站的等车时间、列车运行时间和换乘走行时间,进而求得路径广义费用,用以客流分配。
对乘客i的每一次出行,其进站车站为r,进站时间为出站车站为s,出站时间为/>因此真实的行程时间如公式(3)所示。
同一OD对同一时间段内存在多条出行记录,由于不同出行记录的进站时刻、行走速度不同等原因,其通常具有不同的行程时间,为了降低计算量,选取该OD对该时间段内所有出行记录的平均行程时间作为该OD对在该时间段内的真实行程时间,如公式(4)所示
其中,为OD对rs在时间段h内的出行记录数目,N为地铁网络节点数目,h∈H为一天内划分的时间段,/>为特定OD对rs在时间段h内第i条出行记录的真实行程时间。
(2)估计路径行程时间
对于单一路径的OD对来说,不存在路径选择概率,估计的路径行程时间即为乘客完成一次OD出行的广义费用
(3)构建优化模型
目标函数即为最小化个体出行的真实行程时间与期望出行时间之间的误差,如公式(5)所示。
将公式(1)和公式(4)代入公式(5)中可得公式(6),该模型目标函数为最小化个体乘客实际路径行程时间与期望路径行程时间之间的误差,决策变量为乘客经过边段a时消耗的时间ta,乘客在该车站节点v的等车时间通过优化该目标函数,得到最终的ta,进而用于后续的路径标定和断面流量的获取。
1.2)乘客出行成本数学优化模型向量化
将上述优化模型置于计算图框架下,以获取目标函数最优时的ta在进行计算图模型建模之前,需将该优化模型中的所有变量进行向量化,然后嵌入计算图中,借助PyTorch等深度学习框架,构建计算图框架下的可监督学习任务。下面对公式(6)中涉及的变量进行一一解释。
(1)真实路径行程时间向量化表示
基于公式(4),真实路径行程时间的向量化表示如公式(7)所示。
其中,N为地铁网络节点数目,h∈H为一天内划分的时间段,为特定OD对rs在时间段h内的真实行程时间,/>为所有OD对在所有时间段内的真实行程时间,也是本节所需的向量化后的真实路径行程时间变量,Nrs为网络中所有OD对数目。
(2)边段向量化表示
本节中所有边段的行程时间与时间段无关,即假定所有边段在不同时间段内行程时间相同。网络中进站边、出站边、列车运行边和换乘边所有弧段的数目为Na,网络节点数目为N,则OD对之间路径的边段向量化表示如公式(8)、(9)所示。
其中,如公式(2)所示,/>为特定OD对rs之间的边段向量化表达,/>为所有OD对rs之间路径的边段向量化表示,Nrs为网络中所有OD对数目。
(3)节点向量化表示
所有节点的等车时间与时间段有关,即同一节点不同方向在不同时间段内等车时间不同,令网络中所有节点不同方向的等车节点数目为Nv,则OD对之间等车节点向量化表示如公式(10)、(11)所示。
其中,和/>如公式(2)所示,/>为h时间段内特定OD对rs之间路径上等车节点向量化表示,/>为h时间段内所有OD对rs之间路径上等车节点向量化表示,Nrs为网络中所有OD对数目,Nv为网络中所有节点不同方向的等车节点数目。
(4)边段与等车节点联合向量化表示
将B和不同时间段内的Mh进行联合向量化表示,如公式(12)所示。
其中,为边段与等车节点联合向量化表示,Nrs为网络中所有OD对数目。
(5)待估计边段行程时间ta的向量化表示
所有边段的行程时间向量化表示如公式(13)所示。
其中为决策变量之一,ta中a代表所有边段。
(6)待估计节点等车时间的向量化表示
所有节点的等车时间的向量化表示如公式(14)所示
其中为决策变量之一,等车节点的等车时间与所处的时间段h有关,/>中v代表所有节点。
(7)边段行程时间与节点等车时间的联合向量化表示:
将和不同时间段内的进行联合向量化表示,如公式(15)所示
其中,为边段行程时间与节点等车时间的联合向量化表示。
(8)向量化表示汇总
将以上所有标量的向量化表示进行总结,如表1所示:
表1变量向量化表示
(9)优化模型向量化表示
基于表1,公式(6)的向量化表示形式如公式(16)所示。
s.t.t≥0
上述优化模型的主要决策变量为t,包含所有边段的行程时间以及不同时间段内节点的等车时间,当矩阵A列满秩时,该优化问题存在唯一可行解。
1.3)利用计算图模型求解乘客出行成本数学优化模型;
利用计算图框架求解上述优化问题,通过将该优化问题看做机器学习任务并置于计算图框架下,借助正向传播-反向传播算法,求得优化问题的最优解,图3展示了该优化问题的计算图框架,该框架包含两部分,正向传播部分与反向传播部分。
正向传播部分如图中实线所示,该过程假定节点等车时间和弧段行程时间固定,通过计算路径行程时间,求得估计的OD行程时间,并将估计的OD行程时间与观察的OD行程时间进行对比,得到估计误差。反向传播部分将该误差按原路径进行反向传播,用以调整节点等车时间和弧段行程时间,至此完成一次迭代过程。如此反复迭代计算至迭代停止,得到最终估计的节点等车时间和弧段行程时间,用以后续的断面短时客流预测。
图4为该框架相应的变量传播过程,实线表示正向传播,虚线表示反向传播。通过不断迭代变量正向传播与误差反向传播的过程,获取最终的由节点等车时间和弧段行程时间组成的。下面对正向传播和反向传播过程进行详细介绍。
正向传播:以随机初始化的节点等车时间和边段行程时间ta组成的t作为模型输入,并结合路径表示A,估计的OD行程时间c,全过程如公式(17)所示。
c=At (17)
正向传播过程的最终目标为获取估计的OD行程时间c,将公式(16)中的目标函数看作机器学习任务中的损失函数L(Loss function),则其可分解为公式(18)。
c=At
其中,为从AFC数据中获取的观测平均OD行程时间,c为估计的OD行程时间。
反向传播:正向传播过程已根据初始化的节点等车时间和弧段行程时间组成获取路径估计时间,将目标函数写成公式(19),进而可求得目标函数的梯度,如公式(20)所示。
将公式(20)进行整合,可得目标函数对时间的梯度,如公式(21)所示。
求的目标函数的梯度后,可利用利用反向传播算法优化决策变量t。
正向传播与反向传播循环迭代,直至求得公式(16)所示优化问题的近似最优解。
步骤2:基于历史的自动售检票系统(Automatic Fare Collection,AFC)数据,利用DBSCAN聚类算法进行计算,根据领域半径R的大小,领域半径R小于等于δ的乘客为固定时空乘客,领域半径R大于δ的乘客为随机乘客,其中δ为一个阈值,该值大小通过AFC历史数据分析确定。
步骤3中,基于时空出行路径标定的固定时空乘客短时客流预测,具体包括:
3.1)固定时空乘客的路径标定;
针对固定时空乘客的路径选择,利用AFC历史数据及列车运营历史时刻表等,在生成通用路径集合、锁定可行路径集合、计算时空匹配度及标定乘客路径的步骤基础上进行路径标定。具体包括:
3.1.1)生成通用路径集合;
提取固定时空乘客i进站站点r与出站站点s,并记下刷卡进站时间与刷卡出站时间/>同时计算rs两站的刷卡时间差/>即/>根据地铁实际运营线网图,采用K短路算法生成OD对间通用路径集合Prs=(p1,p2,…pn)。
3.1.2)锁定可行路径集合
根据条件在列车历史时刻表中筛选接近乘客进出站时间点的列车,并计算在该OD对间列车运行边的时间/>即/>进行/>判断,生成可行路径集合,记为/>其中/>为列车到站时间,可通过运行时刻表直接准确获取。/>为列车离站时间,可通过运行时刻表直接准确获取。Lk为运营线路号,LN为车组号。
3.1.3)计算时空匹配度
计算一段周期T内(T的取值根据实际需求进行定义,如三个月,六个月、12个月均可),乘客i同OD对下同一个时间段实际进出站时间差值与OD对间相应路径上地铁运行时刻表的差值即/>并将可行集合中的路径按照差值/>与/>的接近程度进行排序,以接近程度最高的匹配路径标定为OD对下该乘客的时空出行路径,并进行标记配对。/>取值根据计算图模型对OD对间单一路径的AFC数据进行计算获得。
3.1.4)标定乘客路径
进一步,基于步骤3.1.3)标记配对的乘客与路径以及地铁运行时间表,其他非计算周期(若步骤3.1.3中计算周期T为2021年3月、4月、5月这三个月,其他非计算周期即为除去这三个月的其他时间)内,同一时间段下该乘客进站后使用该线路的出站时间,获得该出站时间落在实际差值范围的可能性,若可能性超过ξ,可认定该路线是该乘客在该OD对下的唯一路径;否则,选择步骤3.1.3)中差值第二小的路径进行检验。ξ的取值根据实际历史AFC数据计算求得。
3.2)固定时空乘客的短时客流预测
在完成对固定时空乘客路径标定的基础上,根据即时AFC刷卡数据,并结合步骤1中计算获得的走行与换乘时间分布和列车运行时刻表,计算求得线网中h时刻a边段上固定时空乘客客流分布,如公式所示。
其中h-1表示上一个时段,表示h时段内流入a客流,/>表示h时段内流出a客流,/>是k时间段从r间出发选择rs作为路线的流量,在上面公式中/>的υ是边段a的起始站,/>如下面公式所示
相比于现有OD间路径确定方法,该步骤同时利用AFC历史数据的时间差和从列车运行时刻表提取出对应路径上的列车运行时间差共同确定该类乘客的出行路径,比单独使用AFC历史数据的效果更明显,准确率更高。在精准确定固定时空乘客出行路径的基础上,根据即时的AFC刷卡数据,大幅度提升乘客的出行过程预测的准确性。
步骤4:基于计算图模型的随机乘客短时客流预测;
4.1)基于计算图模型估计随机乘客付费区内各段时间
其主要步骤包含:通过乘客路径选择建模、k短路搜索以及有效路径选择、构建数学优化模型、优化模型向量化、计算图模型建模等步骤,估计上述的边段行程时间和站点等车时间。
4.1.1)乘车路径建模
随机乘客出行行为的产生及路径选择行为受多种因素影响,包含确定性和随机性,确定性因素包括乘客进出站走行时间、在车时间、换乘走行时间、换乘次数、等车时间或拥堵时间票价等,随机因素包括乘客对路径的熟悉程度、拥挤程度、舒适度等。为简单起见,将随机乘客的广义出行成本可定义为完成OD对过程中所花费的时间,如公式(24)所示。
其中是随机乘客出行的广义费用,rs∈POD,POD为OD对集合,k∈Prs,Prs为起始车站r至终点车站s之间的路径集合,a∈E为地铁网络图G中的边集合,v∈V为地铁网络图G中的车站节点集合,h∈H=(h1,h2,h3…)为乘客进入地铁网络时所在的时间间隔区间,ta为乘客经过边段a时消耗的时间,/>为时间间隔h内乘客在该车站节点v的等车时间。α、β和γ是ta和/>的系数,其定义如公式(25)所示。
假定随机乘客的广义费用函数项服从独立同分布和Gumbel分布的随机变量,此时,随机乘客在起终点rs间选择该OD对路径集Prs中的第k条路径的概率可用离散选择模型logit模型描述,如公式(26)所示。
其中为乘客在时间区间h内进站时选择起终点rs间第k条路径的概率;/>为公式(24)中的广义费用;θ为logit模型参数,一般作为乘客对整个地铁网络熟悉程度的指标。
4.1.2)k短路搜索及有效路径选择
最短路问题是图论中较为经典的问题,Dijkstra算法、Floyd算法和A星算法是最短路算法中较为出名的三类算法,其算法特性和应用场景各有不同。Dijkstra算法出现较早,主要思想为广度优先搜索,重点关注源节点至所有节点的最短路径,连边的权重不可为负。Floyd算法主要思想为插点法,即每一步选择一个中介点,重点关注任意两点间的最短路,主要适用于稠密图,连边的权重可正可负,但不可存在负权回路。A星搜索算法主要思想为深度优先搜索,重点关注点到点之间的最短路,连边的权重不可为负。
路径搜索非本项目的重点,采用既有算法解决即可。但在有效路径选择上,本项目中在文献16的基础上将条件放宽如下:
以下2个条件的路径即为最终选用的三条k短路径:
(1)最短路、次短路、次次短路之间的绝对费用差不允许超过20%。
(2)路径换乘次数不允许超过路网最大换乘次数,本节最大换乘次数取3。
4.1.3)构建数学优化模型
本发明主要利用AFC数据估计边段行程时间和节点等车时间。目标函数为最小化估计路径行程时间和真实路径行程时间之间的误差,决策变量为边段行程时间和车站等待时间,其中边段行程时间包括进站边、出站边、列车运行边和换乘边上的行程时间,节点等车时间包括起始车站和换乘车站处的等车时间。本节将首先对真实路径行程时间和估计路径行程时间进行定义,其次构建优化模型形成最终的估计框架。
(1)真实路径行程时间
本节将路径行程时间分为乘客进出站行走时间、路径起始车站和换乘车站的等车时间、列车运行时间和换乘走行时间几部分,借助个体刷卡数据中记录的进站车站、进站时间、出站车站、出站时间,估计乘客进出站时间、路径起始车站和换乘车站的等车时间、列车运行时间和换乘走行时间,进而求得路径广义费用,用以客流分配。
对乘客i的每一次出行,其进站车站为r,进站时间为出站车站为s,出站时间为/>因此真实的行程时间如公式(27)所示。
同一OD对同一时间段内存在多条出行记录,由于不同出行记录的进站时刻、行走速度不同等原因,其通常具有不同的行程时间,为了降低计算量,选取该OD对该时间段内所有出行记录的平均行程时间作为该OD对在该时间段内的真实行程时间,如公式(28)所示
其中,为OD对rs在时间段h内的出行记录数目,N为网络节点数目,h∈H为一天内划分的时间段,/>为特定OD对rs在时间段h内第i条出行记录的真实行程时间。
(2)估计路径行程时间
对于给定的路径选择概率和k条路径的出行费用特定OD对rs之间期望路径行程时间如公式(29)所示。当估计期望路径行程时间时,需考虑特定OD对之间的k条最短路径,因此/>与k有关。
(3)构建优化模型
目标函数即为最小化个体出行的真实行程时间与期望出行时间之间的误差,如公式(30)所示。
将公式(24)和公式(28)代入公式(30)中可得公式(31),该模型目标函数为最小化个体乘客实际路径行程时间与期望路径行程时间之间的误差,决策变量为乘客经过弧a(即边段a)时消耗的时间ta,乘客在该车站节点v的等车时间通过优化该目标函数,得到最终的ta,进而用于后续的路径标定和断面流量的获取。
ta≥0,a∈E
公式(24)-公式(25)
4.1.4)优化模型向量化
将上述优化模型置于计算图框架下,以获取目标函数最优时的θ,ta在进行计算图模型建模之前,需将该优化模型中的所有变量进行向量化,然后嵌入计算图中,借助PyTorch等深度学习框架,构建计算图框架下的可监督学习任务。下面对公式(31)中涉及的变量进行一一解释。
(1)真实路径行程时间向量化表示
基于公式(28),真实路径行程时间的向量化表示如公式(32)所示。
其中,N为网络节点数目,h∈H为一天内划分的时间段,为特定OD对rs在时间段h内的真实行程时间,/>为所有OD对在所有时间段内的真实行程时间,也是本节所需的向量化后的真实路径行程时间变量,Nrs为网络中所有OD对数目。
(2)边段向量化表示
本节中所有边段的行程时间与时间段无关,即假定所有边段在不同时间段内行程时间相同。网络中进站边、出站边、列车运行边和换乘边所有弧段的数目为Na,网络节点数目为N,则OD对之间k路径的边段向量化表示如公式(33)、(34)和(35)所示。
其中,是公式(25)所示,/>是为特定OD对rs之间第k条路径的边段向量化表示,其元素为0或1,/>为特定OD对rs之间所有k条路径的边段向量化表达,为所有OD对rs之间所有k条路径的边段向量化表示,Nrs为网络中所有OD对数目。/>
(3)节点向量化表示
所有节点的等车时间与时间段有关,即同一节点不同方向在不同时间段内等车时间不同,令网络中所有节点不同方向的等车节点数目为Nv,则OD对之间等车节点向量化表示如公式(36)、(37)、(38)所示。
其中,和/>如公式(25)所示,/>为h时间段内特定OD对rs之间第k条路径上等车节点向量化表示,/>为h时间段内特定OD对rs之间所有k条路径的等车节点向量化表示,/>为h时间段内所有OD对rs之间所有k条路径上等车节点向量化表示,Nrs为网络中所有OD对数目,Nv为网络中所有节点不同方向的等车节点数目。
(4)边段与等车节点联合向量化表示
将B和不同时间段内的Mh进行联合向量化表示,如公式(39)所示。
其中,为边段与等车节点联合向量化表示,Nrs为网络中所有OD对数目。
(5)待估计边段行程时间ta的向量化表示
所有边段的行程时间向量化表示如公式(40)所示。
其中为决策变量之一,ta中a代表所有边段。
(6)待估计节点等车时间的向量化表示
所有节点的等车时间的向量化表示如公式(41)所示
其中为决策变量之一,等车节点的等车时间与所处的时间段h有关,/>中v代表所有节点。
(7)边段行程时间与节点等车时间的联合向量化表示
将和不同时间段内的进行联合向量化表示,如公式(42)所示
其中,为边段行程时间与节点等车时间的联合向量化表示。
(8)路径选择概率向量化表示
由于同一条路径不同时间间隔内等车时间不同,因此对于同一OD对rs之间的同一路径,乘客的路径选择概率也不同,因此与时间段h有关。相同时间段内,不同OD对不同路径的选择概率如公式(43)所示。
其中 如公式(26)所示,Nrs为网络中所有OD对数目。
所有时间段内,不同OD对不同路径的选择概率如公式(44)所示。
其中
(9)向量化表示汇总
将以上所有标量的向量化表示进行总结,如表2所示
表2变量向量化表示
(10)优化模型向量化表示
基于表2,公式(31)的向量化表示形式如公式(45)所示。
s.t.t≥0
P=logit(A;t;θ)
上述优化模型的主要决策变量为t,包含所有边段的行程时间以及不同时间段内节点的等车时间,当矩阵A列满秩时,该优化问题存在唯一可行解。目标函数中,路径选择概率P通过logit模型与时间t关联。
4.1.5)计算图模型建模与求解
利用计算图框架求解上述优化问题,通过将该优化问题看做机器学习任务并置于计算图框架下,借助正向传播-反向传播算法,求得优化问题的最优解,图5展示了该优化问题的计算图框架,该框架包含两部分,正向传播部分与反向传播部分。
正向传播部分如图中实线所示,该过程假定节点等车时间和弧段行程时间固定,通过计算路径行程时间,求得估计的OD行程时间,并将估计的OD行程时间与观察的OD行程时间进行对比,得到估计误差。反向传播部分将该误差按原路径进行反向传播,用以调整节点等车时间和弧段行程时间,至此完成一次迭代过程。如此反复迭代计算至迭代停止,得到最终估计的节点等车时间和弧段行程时间,用以后续的断面短时客流预测。
图6为该框架相应的变量传播过程,实线表示正向传播,虚线表示反向传播。通过不断迭代变量正向传播与误差反向传播的过程,获取最终的由节点等车时间和弧段行程时间组成的。下面对正向传播和反向传播过程进行详细介绍。
正向传播:以随机初始化的节点等车时间和边段行程时间ta组成的t作为模型输入,并结合路径表示A,获取路径行程时间,根据路径行程时间获取不同路径的选择概率,根据路径行程时间和路径选择概率获取估计的OD行程时间,全过程如公式(46)所示。
正向传播过程的最终目标为获取估计的OD行程时间c,将公式(45)中的目标函数看作机器学习任务中的损失函数L(Loss function),则其可分解为公式(47)。
其中,为从AFC数据中获取的观测平均OD行程时间,c为估计的OD行程时间。P为借助logit模型获取的路径选择概率。cpath为路径行程时间
反向传播:正向传播过程已根据初始化的节点等车时间和弧段行程时间组成t获取了路径选择概率p,反向传播过程将p作为已知量,公式(45)可简化为公式(48),即为已知量,进而可求得目标函数的梯度,如公式(49)所示。
将公式(49)进行整合,可得目标函数对时间的梯度,如公式(50)所示。
求的目标函数的梯度后,可利用利用反向传播算法优化决策变量t。
/>
正向传播与反向传播循环迭代,直至求得公式(45)所示优化问题的近似最优解。
4.2)通过客流分配和智能体仿真进行随机客流的短时预测
根据上述内容最终估计得到的节点等车时间和边段行程时间ta组成的t,并结合路径表示A,获取路径行程时间cpath,根据路径行程时间获取不同路径的选择概率p,基于已有的A、t、cpath和p,结合智能体仿真,将短时间内OD客流量Q分配至各条路径上,获取路径流量f,根据路径流量,结合仿真,最终获取实时的断面流量x。获取短时断面流量全过程如下面公式所示。
cpath=At
P=spftmax(-θcpath)
f=PQ
x=∑f
其中,h时间段内OD对rs之间第k条路径的流量h时间段内边段a的断面流/> 如下公式所示。
步骤5:线网的短时客流预测。
线网中短时客流由固定时空乘客客流/>与随机乘客客流/>组成,其中固定时空乘客客流/>如步骤3获得,随机乘客客流/>由步骤4获得,因此,线网中的短时客流公式所:
其中表示固定时空乘客客流/>与随机乘客客流/>的一种函数关系,该函数则通过过去一段时期内AFC历史数据进行学习训练获得。/>

Claims (5)

1.一种基于时空出行路径标定的地铁短时客流预测方法,包括以下步骤:
步骤1:利用K短路算法筛选出单一路径的OD对后,采用计算图框架计算走行时间、换乘时间及候车节点时间,确定每个站内付费区不同时间段行走时间、换乘时间及候车节点时间;
步骤2:基于历史的自动售检票系统数据,利用DBSCAN聚类算法进行计算,根据领域半径R的大小,领域半径R小于等于阈值δ的乘客为固定时空乘客,领域半径R大于阈值δ的乘客为随机乘客;
步骤3:根据步骤1得到的每个站内付费区不同时间段行走时间、换乘时间及候车节点时间,结合历史的自动售检票系统数据和历史的列车运行时刻表对固定时空乘客进行时空出行路径标定,然后进行短时客流预测,得到固定时空乘客的短时客流;
步骤4:基于计算图模型估计随机乘客付费区内各段时间,根据随机乘客付费区内各段时间采用客流分配和智能体仿真进行随机客流的短时预测,得到随机乘客的短时客流;
步骤5:固定时空乘客的短时客流与随机乘客的短时客流形成线网的短时客流预测。
2.根据权利要求1所述的基于时空出行路径标定的地铁短时客流预测方法,步骤2中,阈值δ通过历史的自动售检票系统数据分析确定。
3.根据权利要求1所述的基于时空出行路径标定的地铁短时客流预测方法,步骤3中,短时是指15min内。
4.根据权利要求1所述的基于时空出行路径标定的地铁短时客流预测方法,步骤3中,进行短时客流预测,具体包括:
在完成对固定时空乘客路径标定的基础上,根据即时自动售检票系统刷卡数据,并结合步骤1中计算获得的每个站内付费区不同时间段行走时间、换乘时间及候车节点时间以及列车运行时刻表,计算求得线网中h时刻a边段上固定时空乘客客流分布,如公式所示:
其中,表示h时段内流入边段a客流,/>表示h时段内流出边段a客流,/>是k时间段从r出发选择rs作为路线的流量,/>的υ是边段a的起始站,/>如下面公式所示:
5.根据权利要求1所述的基于时空出行路径标定的地铁短时客流预测方法,步骤5中,固定时空乘客的短时客流与随机乘客的短时客流形成线网的短时客流预测,具体包括:
线网中短时客流预测包括固定时空乘客的短时客流/>与随机乘客的短时客流/>组成,线网中的短时客流预测如下公式所示:
其中表示固定时空乘客的短时客流/>与随机乘客的短时客流/>的一种函数关系,函数关系通过过去一段时期内自动售检票系统历史数据进行学习训练获得。/>
CN202310462296.8A 2023-04-25 2023-04-25 一种基于时空出行路径标定的地铁短时客流预测方法 Pending CN116451867A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310462296.8A CN116451867A (zh) 2023-04-25 2023-04-25 一种基于时空出行路径标定的地铁短时客流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310462296.8A CN116451867A (zh) 2023-04-25 2023-04-25 一种基于时空出行路径标定的地铁短时客流预测方法

Publications (1)

Publication Number Publication Date
CN116451867A true CN116451867A (zh) 2023-07-18

Family

ID=87133632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310462296.8A Pending CN116451867A (zh) 2023-04-25 2023-04-25 一种基于时空出行路径标定的地铁短时客流预测方法

Country Status (1)

Country Link
CN (1) CN116451867A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117649034A (zh) * 2023-12-08 2024-03-05 北京城建设计发展集团股份有限公司 一种运营中断事件下多阶段路网乘客出行仿真方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117649034A (zh) * 2023-12-08 2024-03-05 北京城建设计发展集团股份有限公司 一种运营中断事件下多阶段路网乘客出行仿真方法及系统
CN117649034B (zh) * 2023-12-08 2024-04-30 北京城建设计发展集团股份有限公司 一种运营中断事件下多阶段路网乘客出行仿真方法及系统

Similar Documents

Publication Publication Date Title
CN108197739B (zh) 一种城市轨道交通乘客流量预测方法
CN110428096B (zh) 基于票务信息的城市轨道交通多交路运输组织优化方法
CN108009972B (zh) 一种基于多源数据校核的多方式出行o-d需求估计方法
CN103984994B (zh) 一种城市轨道交通客流高峰持续时间预测方法
CN112990648B (zh) 一种轨道交通网络运营稳定性评估方法
US20210354731A1 (en) Method and system for identifying traveling backward passengers and boarding trains in rail transit
CN111191816B (zh) 城市轨道交通乘客出行时间链辨识系统
CN111581538B (zh) 一种基于高速公路收费数据的高速交通流状态推断方法
Yu et al. Data-driven approach for solving the route choice problem with traveling backward behavior in congested metro systems
Yamamoto et al. Structured random walk parameter for heterogeneity in trip distance on modeling pedestrian route choice behavior at downtown area
CN114037158A (zh) 一种基于od路径的客流预测方法及应用方法
CN116451867A (zh) 一种基于时空出行路径标定的地铁短时客流预测方法
Zhu et al. Estimating train choices of rail transit passengers with real timetable and automatic fare collection data
CN116862325A (zh) 一种城市轨道交通乘客出行链推断方法及系统
Wu et al. Data-driven inverse learning of passenger preferences in urban public transits
CN113408833A (zh) 一种公共交通重点区域识别方法、装置及电子设备
CN116562574A (zh) 城际定制客运的协同优化方法、装置、设备和存储介质
Ásmundsdóttir Dynamic OD matrix estimation using floating car data
CN113536493A (zh) 基于聚类反推的有效路径生成方法及断面客流估算方法
Gaduh et al. Optimal Public Transportation Networks: Evidence from the World’s Largest Bus Rapid Transit System in Jakarta
CN112766950A (zh) 一种动态路径费用确定方法、装置、设备及介质
Wu et al. Extracting metro passengers' route choice via AFC data utilizing Gaussian mixture clustering
CN106127664A (zh) 城市轨道交通换乘站高峰期客流控制方法
CN107886190B (zh) 一种突发事件下乘客出行选择行为仿真方法及装置
Li et al. Ridesplitting demand prediction via spatiotemporal multi-graph convolutional network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination