CN113902180A - 一种地铁上下行客流预测方法及处理终端 - Google Patents

一种地铁上下行客流预测方法及处理终端 Download PDF

Info

Publication number
CN113902180A
CN113902180A CN202111139593.6A CN202111139593A CN113902180A CN 113902180 A CN113902180 A CN 113902180A CN 202111139593 A CN202111139593 A CN 202111139593A CN 113902180 A CN113902180 A CN 113902180A
Authority
CN
China
Prior art keywords
path
passenger
riding
current
station
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111139593.6A
Other languages
English (en)
Inventor
曾明
秦伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PCI Technology Group Co Ltd
PCI Technology and Service Co Ltd
Original Assignee
PCI Technology Group Co Ltd
PCI Technology and Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PCI Technology Group Co Ltd, PCI Technology and Service Co Ltd filed Critical PCI Technology Group Co Ltd
Priority to CN202111139593.6A priority Critical patent/CN113902180A/zh
Publication of CN113902180A publication Critical patent/CN113902180A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

本发明公开了一种地铁上下行客流预测方法及处理终端,所述方法包括,根据OD数据分别统计出乘客个体集合乘客的各个乘车路径的乘车概率,并先将乘客群体集合乘客转换为乘客个体,进而计算出乘客群体集合乘客的各个乘车路径的乘车概率,从而根据各个乘车路径的乘车概率确定出当前站点的上下行人数,完成客流预测。本发明相比于常规地铁客流预测方法,能够基于上下行的客流预测,预测每一个当前站点作为进站站点到达其他任意一个作为出站站点的客流强度,适应于换乘站点,减少了偶然行为,提高了上下行客流预测的准确性。

Description

一种地铁上下行客流预测方法及处理终端
技术领域
本发明涉及地铁客流预测技术领域,具体涉及一种地铁上下行客流预测方法及处理终端。
背景技术
地铁已经日益成为人们出行的一种重要交通方式,地铁在为社会带来巨大经济利益的同时,地铁的安全性也成为日常管理运营的重要一环。为了规避交通堵塞、站台拥挤、提前部署安保等地铁工作人员,就需要对地铁的客流能够做到提前预测,特别是能够做到实时预测,以便于随时更改部署,适应不同客流的地铁管理需求。
但现有地铁客流预测技术主要是以地铁站作为颗粒度来预测地铁客流,也即是预测一个地铁站的进出站客流强度情况。但是这样的客流预测由于颗粒度较为粗糙,存在较多的不足和缺陷,包括无法了解乘客从哪一个方向的进站和出站,进而无法预测哪个方向的列车客流较多、哪个方向的列车客流相对较少。例如,同一条线路,其上行方向和下行方向在同一个时间段(例如上下班高峰期)的客流强度是不同的,这样现有的地铁客流预测对于这样的上下行方向客流的管理几乎起不到帮助作用。还包括对于换乘站而言,其进站客流强度可能较弱,但站内却往往很拥堵,原因在于换乘客流强度太大,若基于以地铁站为颗粒度来预测的进出站客流是无法预测到这种情况的。此外,现有地铁客流预测往往不区分乘客个体行为和乘客群体行为,进而会导致地铁客流预测与真实的客流存在较大偏差,预测结果的真实性还有待提高。
发明内容
针对现有技术的不足,本发明的目的之一提供一种地铁上下行客流预测方法,其能够解决背景技术所提到的问题;
本发明的目的之二提供一种处理终端,其能够解决背景技术所提到的问题。
实现本发明的目的之一的技术方案为:一种地铁上下行客流预测方法,包括以下步骤:
步骤1:获取目标地铁线网在单位时间段内的历史乘客乘车记录,历史乘客乘车记录包括OD数据,将具有唯一乘客身份标识的乘客组成乘客个体集合,将剩余的乘客组成乘客群体集合;
步骤2:根据OD数据计算出乘客个体集合中每一个乘客选择任意一条真实乘车路径的乘车概率,真实乘车路径标准为乘客真实的乘车路径的可靠性;
步骤3:根据OD数据将乘客群体集合中的乘客转化为乘客个体,从而视为步骤2中乘客个体集合中乘客,从而计算出乘客群体集合中的乘客选择任意一条真实乘车路径的乘车概率;
步骤4:确定出以当前站点作为进站站点到其他站点作为出站站点的所有可能路径,将进入当前站点的乘客根据是否具有唯一身份标识分为当前乘客个体集合和当前乘客群体集合,
将当前乘客个体集合的乘客按照步骤2得到的乘车概率,计算得到进站时间的上下行人数,将各个进站时间的上行人数的平均值和下行人数的平均值作为与当前时间相同的当前站点的第一部分上下行人数,
将当前乘客群体集合的乘客按照步骤3得到的乘车概率,实时计算得到各个进站时间的第二部分的上下行人数,
将相同进站时间的第一部分的上行人数和第二部分的上行人数的总和作为当前站点的当前时间所预测的上行人数,将相同进站时间的第一部分的下行人数和第二部分的下行人数的总和作为当前站点的当前时间所预测的下行人数,从而完成对地铁客流上下行人数的预测。
进一步地,所述步骤2中,计算出乘客个体集合中每一个乘客的每一个OD数据所对应的所有可能路径,从所有可能路径中确定出每一个OD数据对应的真实乘车路径,一个OD数据对应若干个真实乘车路径,可能路径是指从进站站点能够到达出站站点的所有可搭乘站点所构成的乘车路线。
进一步地,从所有可能路径中确定出真实乘车路径,其具体实现包括以下步骤:
若当前可能路径未包含换乘站点,则当前可能路径作为当前OD数据的真实乘车路径,
若当前可能路径含有换乘站点,则将满足条件一的当前可能路径作为第一可能路径集合的一员,遍历OD数据对应的所有可能路径,从而得到第一可能路径集合,
条件一:当前可能路径的理论旅行时间T和OD数据对应的真实旅行时间L的误差在预设阈值时间t内,
若第一可能路径集合中只有1条可能路径,则将该条可能路径作为当前OD数据的真实乘车路径,若第一可能路径集合中有2条以上可能路径,则继续从第一可能路径集合中删除满足条件二中任意一种情况的可能路径后,得到第二可能路径集合,
条件二为根据进站时间和可能路径所覆盖周围地点所构成的条件,
若第二可能路径集合中只有1条可能路径,则该条可能路径作为当前OD数据对应的真实乘车路径;若第二可能路径集合中有0条可能路径,则根据条件二中对应情况优先级最高对应的当前可能路径作为当前OD数据对应的真实乘车路径;若第二可能路径集合中有2条以上可能路径,判断是否有满足条件三的可能路径,若有,则将满足条件三的可能路径作为当前OD数据对应的真实乘车路径,若没有,则从第二可能路径集合中随机选择一条路径作为当前OD数据对应的真实乘车路径,
条件三为根据可能路径的换乘站点和在换乘站点的时间与预设时间所构成的条件。
进一步地,所述预设阈值时间t的数值需使得至少有一条可能路径满足条件一。
进一步地,条件三具体为:当前可能路径包含换乘站点,且至少存在一个换乘站点的换乘时间均小于其他可能路径的理论旅行时间的q倍,0<q<1。
进一步地,条件二包括以下四种情况:
a.进站时间处于工作日的早高峰期、出站时间处于工作日的晚高峰期,且当前可能路径中的换乘站点为办公区或商业区所覆盖的站点;
b.进站时间的当天为节假日或周末,且当前可能路径中包含距离旅游景点或者商业中心在预设范围内的中间站点,中间站点是指当前可能路径中除去进站站点和出站站点之外的其他站点;
c.进站时间的当天处于节假日前n天或者节假日返程高峰期,n≥1,且当前可能路径中包含覆盖机场、火车站、客运站、码头中任一交通枢纽的中间站点;
d.进站时间的当天处于举办特殊活动或者大型活动,且当前可能路径中包含经过所述特殊活动或者大型活动举办地点的中间站点。
进一步地,每一个乘客选择任意一条真实乘车路径的乘车概率的具体实现,包括以下步骤:
将历史乘车记录中的所有OD数据进行分组,将相同OD数据分为同一组,不同OD数据分为不同组,
在同一组OD数据中,将当前乘客的各个相同真实乘车路径总和与该组OD数据下的所有真实乘车路径总和的比值作为当前真实乘车路径的概率,从而计算得到一组OD数据中选择任意一条真实乘车路径的乘车概率。
进一步地,所述步骤3中,根据OD数据将乘客群体集合中的乘客转化为乘客个体,其具体实现,包括:
将乘客群体集合中的乘客根据OD数据进行分组,相同OD数据的分为同一组,不同OD数据的分为不同组,对每一组OD数据内的乘客根据OD数据构建若干特征,
根据构建出的特征采用聚类算法对每一组OD数据进行聚类得到聚类结果,一个聚类结果对应若干个分类结果,一个分类结果包含一个聚类中心,一个分类结果对应若干乘客,
将每一个聚类中心下的所有乘客的理论旅行时间的平均值作为当前聚类中心的旅行时间,从而计算得到每一个聚类中心对应的旅行时间,将每一个聚类中心视为一个虚拟乘客,
从而将乘客群体集合中的乘客转化为乘客个体。
进一步地,所述步骤3中,计算出乘客群体集合中的乘客选择任意一条真实乘车路径的乘车概率,其具体实现包括:
在获得虚拟乘客后,虚拟乘客的理论旅行时间为聚类中心的旅行时间,得到虚拟乘客的各个OD数据的所有可能路径和每个可能路径对应的理论旅行时间,将虚拟乘客按步骤2处理,计算出每一个虚拟乘客的选择各个真实乘车路径的乘车概率和理论旅行时间,
按公式③计算出虚拟乘客以当前站点到达目标站点所构成的乘车路径和该真实乘车路径下的各个子路径的概率sub_path_probability:
Figure BDA0003281521730000061
式中,Q表示分组总数,J表示每个聚类中心对应的真实乘车路径中所包含的子路径总数,M表示每个聚类中心对应的所有真实乘车路径总数,prob表示根据步骤2计算出的各个真实乘车路径的乘车概率。
实现本发明的目的之二的技术方案为:一种处理终端,其包括:
存储器,用于存储程序指令;
处理器,用于运行所述程序指令,以执行所述的地铁上下行客流预测方法的步骤。
本发明的有益效果为:本发明相比于常规地铁客流预测方法,能够基于上下行的客流预测,预测每一个当前站点作为进站站点到达其他任意一个作为出站站点的客流强度,包括能够适应于换乘站点,能够为后续客流强度管理及引导起到数据支撑作用。另外,本发明考虑到乘客个体行为和乘客群体行为,对于乘客个体行为具有一定的规律性和稳定性,而对于乘客群体行为,通过聚类算法进行聚类也可以为这些没有唯一身份标识的乘客的可能路径进行预测,从而避免因不能定位到乘客群体行为造成的偶然性来干扰预测结果,减少了偶然行为,进而加大了地铁站的上下行客流预测准确性。最后,在确定乘客的乘车路径时,并不是单纯的给乘客指定一条路径,而是认为乘客有多条路径进行选择,每条路径选择的概率不一样,基于概率论去确定乘客的乘车路径,更加符合乘客的实际乘车行为,也可以避免因为单一路径选择的问题而降低模型的准确度。同时,在确定乘客具体的乘车路径的时候,还充分从日期类型(节假日前N天、节假日期间、节假日返程高峰期、工作日早晚高峰期)、特殊活动、站点类型等多因素的优先级进行考虑,使得乘客的路径更加贴近其实际的乘车路径。
附图说明
图1为实施例一的流程示意图;
图2为一个目标地铁线网的示意图;
图3为处理终端的示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
参考图1,一种地铁上下行客流预测方法,包括以下步骤:
步骤1:获取目标地铁线网在单位时间段内的历史乘客乘车记录,历史乘客乘车记录包括进站站点、出站站点、进站时间、出站时间和乘客身份标识,进站站点和出站站点构成一个OD数据。根据进出站时间计算出乘客的真实旅行时间,根据乘客身份标识将乘客分为乘客个体集合和乘客群体集合,乘客个体集合是指由具有唯一身份标识的乘客所组成的集合,乘客群体集合是指由不具有唯一身份标识的乘客所组成的集合。乘客身份标识根据乘客购买地铁车票的方式确定乘客是否具有唯一身份标识,例如采用经注册过的一卡通、微信支付、支付宝支付、银联卡支付等方式购票的乘客,其对应乘客具有唯一对应的身份标识,因此将这类乘客视为乘客个体;而对应采用现金或其他方式购买的单程票的乘客,其对应乘客不具有唯一对应的身份标识,因此将这类乘客视为是一个群体。
单位时间段可以根据实际情况进行选择,例如选择8月1日的上午10点至11点这个时间段。在单位时间段内,同一个乘客可能不止一条乘车记录,也即有搭乘多趟地铁的记录,每一条乘车记录对应一个OD数据,但一个OD数据可以对应多条乘车记录,OD数据是指由进站站点和出站站点构成并表征了乘车方向的进出站记录。例如,进站站点为a1,出站站点为b1,则构成一个OD数据(a1,b1),且乘车方向是从站点a1到站点b1,但OD数据(a1,b1)可以有多个乘车记录,包括不同时间或不同路径但进出站点相同的乘车记录。需要说明的是,两个同样的站点,由于乘车方向不同(上行和下行),其分别属于两个OD数据,例如,还是这两个站点a1和b1,OD数据(a1,b1)是指进站站点为a1、出站站点为b1,OD数据(b1,a1)则是指进站站点为b1、出站站点为a1。
另外,这里的上下行是指方向上的相对概念,并非特定限定某个具体方向为上行或下行。以当前某个站点为例,若离开当前站点的方向为上行,则返回当前站点的方向为下行;反之,若离开当前站点的方向为下行,则返回当前站点的方向为上行。
从目标地铁线网可获得线网站点信息和列车运行时间信息,线网站点信息包括所有站点、相邻两个站点之间的距离,列车运行时间包括列车运行线路图、到达每个站点的时间和在每个站点的停留时间。
步骤2:计算出乘客个体集合中每一个乘客的每一个OD数据所对应的所有可能路径和每一个可能路径对应的理论旅行时间。
参考图2,可能路径是指从进站站点能够到达出站站点的所有可搭乘站点所构成的乘车路线。图2是一个目标地铁线网的示意图,图中的圆点代表一个站点,从图2中的进站站点a1到达出站站点b1的可能路径至少包括[a1,M1,c1,b1]和[a1,M1,M2,b1]这两条乘车路线,因此,OD数据(a1,b1)的所有可能路径为{[a1,M1,c1,b1],[a1,M1,M2,b1]}。
其中,为OD数据找出在目标地铁线网的所有可能路径可通过Dijkstra算法、深度优先算法、广度优先算法等中的任意一种算法实现。在计算出所有可能路径后,对于其中某一个可能路径而言,结合列车运行时间信息,可计算出当前可能路径对应的理论旅行时间,遍历所有可能路径,进而计算出每一条可能路径的理论旅行时间。
具体的,对于没有换乘站点的路径,可按公式①计算出理论旅行时间path_consume_time:
Figure BDA0003281521730000101
式中,N表示当前可能路径的总站点数,例如,当前可能路径[a1,M1,c1,b1]的总站点数N=4,running_time表示相邻两个站点的运行时间,可从列车运行时间信息中直接计算得到,dwell_time表示列车在各个中间站点的停留时间,i表示第i组相邻两个站点。
对于有换乘站点的可能路径,可按公式②计算出理论旅行时间path_consume_time:
Figure BDA0003281521730000111
式中,M表示当前可能路径下的换乘站点总数,例如,当前可能路径[a1,M1,c1,b1]只有两个换乘站点M1和c1,因此M=2,sub_path_consume_time表示当前可能路径根据是否在同一条线路划分出来的子路径的理论旅行时间,子路径的理论旅行时间sub_path_consume_time根据公式①计算得到,trans_time表示乘客在换乘站点的理论换乘时间,理论换乘时间可以根据实际换乘距离人为预设,换乘距离远,理论换乘时间长,换乘距离近,理论换乘时间短,i表示子路径i,j表示换乘站点j。
同样的,以图2中的路径[a1,M1,c1,b1]为例,由于站点a1和M1在同一条线路上,站点M1和站点c1在同一条线路上,站点c1和站点b1在同一条线路上,因此,路径[a1,M1,c1,b1]根据是否在同一条线路划分出3个子路径,3个子路径为{[a1,M1],[M1,c1],[c1,b1]},其中,站点M1和站点c1均为换乘站点,故M=2。
需要说明的是,这里的换乘站点是指在当前可能路径下是否有经过从一条线路换乘到另一条线路的换乘站点。如图2中的路径[a1,M1,c1,b1],由于从站点a1换到另一条线路上的站点c1,故这里站点M1为换乘站点。同样的,路径[a1,M1,M2]中则没有换乘站点,虽然站点M1和站点M2均是实际意义上的换乘站点(可以从一条线路换乘到另一条线路的共有站点),但是对于当前可能路径[a1,M1,M2]而言,由于该条可能路径并不需要从一条线路换乘到另一条线路,因此站点M1和站点M2在这条路径下均不视为换乘站点。
在计算出每一个乘客的每一个OD数据所对应的所有可能路径和每一个可能路径对应的理论旅行时间后,从所有可能路径确定出每一个OD数据对应的真实乘车路径,一个OD数据对应若干个真实乘车路径,一个OD数据可能不止一条真实乘车路径,也即从OD数据对应的所有可能路径中筛选出的真实乘车路径是一个集合。
具体的,对于当前可能路径,若当前可能路径未包含换乘站点,则当前可能路径作为当前OD数据的真实乘车路径;若当前可能路径含有换乘站点,则将满足条件一的当前可能路径作为第一可能路径集合的一员,遍历OD数据对应的所有可能路径,从而得到第一可能路径集合。条件一如下:
条件一:当前可能路径的理论旅行时间T和OD数据对应的真实旅行时间L的误差在预设阈值时间t内,也即||L-T||≤t,t的大小可以根据实际需要调整,但需要注意的是,t的数值应该使得能够至少有一条可能路径满足条件一,否则,需要不断增大t的数值。OD数据对应的真实旅行时间L也即是前文所指在出站站点的出站时间与在进站站点的进站时间的差值。
若第一可能路径集合中只有1条可能路径,则将该条可能路径作为当前OD数据的真实乘车路径;若第一可能路径集合中有2条以上可能路径,则继续从第一可能路径集合中删除满足条件二中任意一种情况的可能路径后,得到第二可能路径集合。条件二如下:
a.进站时间处于工作日的早高峰期、出站时间处于工作日的晚高峰期,且当前可能路径中的换乘站点为办公区或商业区所覆盖的站点。其中,早晚高峰期可以根据实际需要自行预设,同样的,办公区和商业区也是根据需要自行定义。例如,将早上7点至9点设为早高峰期,晚上5点至7点设为晚高峰期,将CBD区域设为办公区,距离该CBD区域一定距离内的站点视为办公区所覆盖的站点,将某步行街的范围设为商业区。
b.进站时间的当天为节假日或周末,且当前可能路径中包含距离旅游景点或者商业中心很近的中间站点,中间站点是指当前可能路径中除去进站站点和出站站点之外的其他站点。距离旅游景点或者商业中心是否很近可以根据中间站点到旅游景点或商业中心的距离与预设距离阈值的比较判断是否很近,例如,若中间站点到旅游景点或商业中心的距离≤预设距离阈值,则可以视为很近,否则,不能视为很近。
c.进站时间的当天处于节假日前n天或者节假日返程高峰期,n≥1,且当前可能路径中包含覆盖机场、火车站、客运站、码头等交通枢纽的中间站点。也即某一个中间站点距离可覆盖机场、火车站、客运站、码头等交通枢纽的距离很近,即可视为覆盖,例如,现实生活中,常见的火车站大多数站内都设置有地铁站,该地铁站即视为可覆盖火车站的中间站点。
d.进站时间的当天处于举办特殊活动或者大型活动,且当前可能路径中包含经过所述特殊活动或者大型活动举办地点的中间站点。特殊活动或者大型活动可以根据实际情况自行定义,例如,一个城市举办的国家级或者国际的马拉松比赛可以视为大型活动,又例如,某一个城市举办了两个高级别官员会晤会议则可以视为特殊活动。
若第二可能路径集合中只有1条可能路径,则该条可能路径作为当前OD数据对应的真实乘车路径;若第二可能路径集合中有0条可能路径,则按优先级a-d从低到高排序,将优先级最高对应的当前可能路径保留在第二可能路径中,也即将符合a-d情况的按优先级高低进行筛选(优先级d>c>b>a),将满足条件二中最高优先级对应情况的可能路径保留在第二可能路径中,比如若第一可能路径集合中某一路径只满足条件二中的d,则将其保留在第二可能路径集合中,否则继续看第一可能路径集合中是否有路径只满足条件二中的c,若有则将其保留在第二可能路径集合中,以此类推,保证第二可能路径集合中至少有1条以上可能路径(若只有1条可能路径,则该条可能路径作为当前OD数据对应的真实乘车路径);若第二可能路径集合中有2条以上可能路径,判断是否有满足条件三的可能路径,若有,则将满足条件三的可能路径作为当前OD数据对应的真实乘车路径,若没有,则从第二可能路径集合中随机选择一条路径作为当前OD数据对应的真实乘车路径。其中,条件三如下:
条件三:当前可能路径包含换乘站点,且至少存在一个换乘站点的换乘时间均小于其他可能路径的理论旅行时间的q倍,0<q<1,本实施例中,q设为0.2。
通过以上步骤即可计算出每一个乘客的每一个OD数据的真实乘车路径,从而计算出每一个OD数据对应的所有真实乘车路径,进而计算出所有乘客的所有OD数据对应的所有真实乘车路径。
将历史乘车记录中的所有OD数据进行分组,将各个乘客的相同OD数据分为同一组,即是指进站站点和出站站点相同的OD数据构成的集合,不同OD数据分为不同组。由于OD数据代表了从进站站点到出站站点的乘车方向,也即表征了地铁客流的上下行,同一组的OD数据代表同一个地铁客流方向,不同组的OD数据代表不同的地铁客流方向,从而同一组的OD数据能够反映当前方向(上行或下行)的客流。在同一组OD数据中,每一个乘客的OD数据均包括了多个真实乘车路径,不同进站时间记录的OD数据的真实乘车路径可能会存在相同的真实乘车路径,也即同一组OD数据中,不同进站时间记录的OD数据中存在交叉的真实乘车路径。因此,同一组OD数据的真实乘车路径为该组OD数据对应的当前乘客下的所有OD数据的真实乘车路径的总和。
例如,某一组OD数据(a1,b1)中,对于当前乘客而言,其包括5个进站时间,分别为进站时间1、进站时间2、进站时间3、进站时间4和进站时间5,进站时间1在该条OD数据(a1,b1)中对应3个真实乘车路径,记为真实乘车路径a、真实乘车路径b、真实乘车路径c;进站时间2在该条OD数据(a1,b1)中对应4个真实乘车路径,记为真实乘车路径a、真实乘车路径d、真实乘车路径e、真实乘车路径f;进站时间3在该条OD数据(a1,b1)中对应4个真实乘车路径,记为真实乘车路径b、真实乘车路径c、真实乘车路径d、真实乘车路径e;进站时间4在该条OD数据(a1,b1)中对应5个真实乘车路径,记为真实乘车路径a、真实乘车路径b、真实乘车路径g、真实乘车路径h、真实乘车路径j;进站时间5在该条OD数据(a1,b1)中对应4个真实乘车路径,记为真实乘车路径a、真实乘车路径c、真实乘车路径d、真实乘车路径f。故而该组OD数据(a1,b1)所有真实乘车路径的总和为3+4+4+5+4=20,真实乘车路径a的总和为4,真实乘车路径b的总和为3,真实乘车路径c的总和为3,真实乘车路径d的总和为3,真实乘车路径e的总和为2,真实乘车路径f的总和为2,真实乘车路径g的总和为1,真实乘车路径h的总和为1,真实乘车路径j的总和为1。
在同一组OD数据中,将当前乘客各个的相同真实乘车路径总和与该组OD数据下的所有真实乘车路径总和的比值作为当前真实乘车路径的概率,从而计算得到一组OD数据中选择任意一条真实乘车路径的乘车概率。因此,上述5个进站时间中,在OD数据(a1,b1)中,选择真实乘车路径a的乘车概率为4/20,选择真实乘车路径b的乘车概率为3/20,选择真实乘车路径c的乘车概率为3/20,选择真实乘车路径d的乘车概率为3/20,选择真实乘车路径e的乘车概率为2/20,选择真实乘车路径f的乘车概率为2/20,选择真实乘车路径g的乘车概率为1/20,选择真实乘车路径h的乘车概率为1/20,选择真实乘车路径j的乘车概率为1/20。由于选择任意一条真实乘车路径的乘车概率均已计算出来,遍历所有乘客的所有OD数据,从而所有乘客的所有可能路径中选择某一个真实乘车路径的乘车概率都是已知的,因此,可以计算得到乘客的各个真实乘车路径的乘车概率和理论旅行时间。
步骤3:将乘客群体集合中的乘客根据OD数据进行分组,相同OD数据的分为同一组,不同OD数据的分为不同组。对每一组OD数据内的乘客构建以下5个特征:
特征1:真实旅行时间。根据乘客每次乘车的进站时间和出站时间,可以得到每一个乘车路径对应的真实旅行时间。
特征2:第一日期类型。根据进站时间的当天是否为节假日、周末、工作日中的任一种,若是,则确定乘车路径对应第一日期类型。
特征3:第二日期类型。根据进站时间的当天是否为周一至周日中的任一天,若是,则确定乘车路径对应第二日期类型。
特征4:乘车时间段。根据进站时间确定乘客每一个乘车路径对应的小时段,例如,进站实际为7:05,则乘车时间段为7点,又如进站时间为8:56,则乘车时间段为8点。
特征5:刷卡类型。根据乘客购票方式确定刷卡类型,例如采用一卡通(例如广州市地铁羊城通)、二维码(例如微信乘车码)或者现金购买的单程票。
根据上述5个特征采用聚类算法对每一组OD数据进行聚类,也即采用聚类算法对每一组OD数据根据这5个特征进行聚类处理,一组OD数据的乘客得到一个聚类结果,一个聚类结果对应若干个分类结果,也即是将同一组OD数据中的所有乘客分成若干类,一个分类结果包含一个聚类中心,一个分类结果对应若干乘客,所有分类结果对应的乘客的集合即是同一组OD数据中的所有乘客。
聚类算法可以采用现有的聚类算法,本实施例采用DBSCAN算法,以将乘客进行聚类。
将每一个聚类中心下的所有乘客的理论旅行时间的平均值作为当前聚类中心的旅行时间,从而计算得到每一个聚类中心对应的旅行时间。
将每一个聚类中心视为一个乘客,为此记为虚拟乘客,虚拟乘客的理论旅行时间即是该聚类中心的旅行时间,得到虚拟乘客各个OD数据(即是购买的单程票上的OD数据)的所有可能路径和每个可能路径对应的理论旅行时间,因此,可以将虚拟乘客按步骤2处理,计算出每一个虚拟乘客的选择各个真实乘车路径的乘车概率和理论旅行时间。
在计算出每个聚类中心对应的真实乘车路径的乘车概率和理论旅行时间后,将其合并即可计算出以当前站点到达目标站点所构成的乘车路径和该真实乘车路径下的各个子路径的概率,子路径的概率sub_path_probability按公式③计算得到:
Figure BDA0003281521730000181
式中,Q表示分组总数,也即是聚类总数,J表示每个聚类中心对应的真实乘车路径中所包含的子路径总数,M表示每个聚类中心对应的所有真实乘车路径总数,prob表示根据步骤2计算出的各个真实乘车路径的乘车概率。
步骤4:以当前站点作为进站站点,目标地铁线网中的其他站点作为出站站点,从而得到进站站点到出站站点的所有可能路径,将进入当前站点的乘客根据是否具有唯一身份标识分为乘客个体集合和乘客群体集合。
按步骤2的处理,统计出以当前站点为进站站点、目标地铁线网中的其他站点为出站站点所构成的所有可能路径中乘客个体集合的在各个进站时间的上下行人数,将各个进站时间的上行人数的平均值和下行人数的平均值作为与当前时间相同的当前站点的第一部分上下行人数。例如,统计当前站点a,根据步骤2的处理,统计出乘客个人集合中的乘客的进站时间包括上午8点、上午10点和下午5点共3个进站时间,这3个进站时间分别是1日、2日和3日共3天的对应时间段,这3天在各个进站时间的上下行人数总和的平均值作为当前相同进站时间的上下行人数。因此,将3天在上午8点的上行人数的平均值作为当前时间8点的上行人数,将3天在上午10点的行人数的平均值作为当前时间10点的上行人数,将3天在下午5点的行人数的平均值作为当前时间5点的上行人数。
按步骤3的处理,实时统计出当前时间不具有唯一身份标识的乘客,根据不具有唯一身份标识的乘客购票信息统计出第二部分的上下行人数。由于不具有唯一身份标识的乘客所购买的为单程票,单程票包含了进站站点和出站站点,从而能够实时统计出这一部分乘客的上下行人数。
将第一部分的上行人数和第二部分的上行人数的总和作为当前站点的当前时间所预测的上行人数,将第一部分的下行人数和第二部分的下行人数的总和作为当前站点的当前时间所预测的下行人数,从而完成对地铁客流上下行人数的预测。
本发明相比于常规地铁客流预测方法,能够基于上下行的客流预测,预测每一个当前站点作为进站站点到达其他任意一个作为出站站点的客流强度,包括能够适应于换乘站点,能够为后续客流强度管理及引导起到数据的支撑作用。另外,本发明考虑到乘客个体行为和乘客群体行为,对于乘客个体行为具有一定的规律性和稳定性,而对于乘客群体行为,通过聚类算法进行聚类也可以为这些没有唯一身份标识的乘客的可能路径进行预测,从而避免因不能定位到乘客群体行为造成的偶然性来干扰预测结果,减少了偶然行为,进而加大了地铁站的上下行客流预测准确性。最后,在确定乘客的乘车路径时,并不是单纯的给乘客指定一条路径,而是认为乘客有多条路径进行选择,每条路径选择的概率不一样,基于概率论去确定乘客的乘车路径,更加符合乘客的实际乘车行为,也可以避免因为单一路径选择的问题而降低模型的准确度。同时,在确定乘客具体的乘车路径的时候,还充分从日期类型(节假日前N天、节假日期间、节假日返程高峰期、工作日早晚高峰期)、特殊活动、站点类型等多因素的优先级进行考虑,使得乘客的路径更加贴近其实际的乘车路径。
实施例二
参考图3,本实施例还提供一种处理终端,其包括:
存储器101,用于存储程序指令;
处理器102,用于运行所述程序指令,以执行所述地铁上下行客流预测方法的步骤。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (10)

1.一种地铁上下行客流预测方法,其特征在于,包括以下步骤:
步骤1:获取目标地铁线网在单位时间段内的历史乘客乘车记录,历史乘客乘车记录包括OD数据,将具有唯一乘客身份标识的乘客组成乘客个体集合,将剩余的乘客组成乘客群体集合;
步骤2:根据OD数据计算出乘客个体集合中每一个乘客选择任意一条真实乘车路径的乘车概率,真实乘车路径标准为乘客真实的乘车路径的可靠性;
步骤3:根据OD数据将乘客群体集合中的乘客转化为乘客个体,从而视为步骤2中乘客个体集合中乘客,从而计算出乘客群体集合中的乘客选择任意一条真实乘车路径的乘车概率;
步骤4:确定出以当前站点作为进站站点到其他站点作为出站站点的所有可能路径,将进入当前站点的乘客根据是否具有唯一身份标识分为当前乘客个体集合和当前乘客群体集合,
将当前乘客个体集合的乘客按照步骤2得到的乘车概率,计算得到进站时间的上下行人数,将各个进站时间的上行人数的平均值和下行人数的平均值作为与当前时间相同的当前站点的第一部分上下行人数,
将当前乘客群体集合的乘客按照步骤3得到的乘车概率,实时计算得到各个进站时间的第二部分的上下行人数,
将相同进站时间的第一部分的上行人数和第二部分的上行人数的总和作为当前站点的当前时间所预测的上行人数,将相同进站时间的第一部分的下行人数和第二部分的下行人数的总和作为当前站点的当前时间所预测的下行人数,从而完成对地铁客流上下行人数的预测。
2.根据权利要求1所述的地铁上下行客流预测方法,其特征在于,所述步骤2中,计算出乘客个体集合中每一个乘客的每一个OD数据所对应的所有可能路径,从所有可能路径中确定出每一个OD数据对应的真实乘车路径,一个OD数据对应若干个真实乘车路径,可能路径是指从进站站点能够到达出站站点的所有可搭乘站点所构成的乘车路线。
3.根据权利要求2所述的地铁上下行客流预测方法,其特征在于,所述步骤2中,从所有可能路径中确定出真实乘车路径,其具体实现包括以下步骤:
若当前可能路径未包含换乘站点,则当前可能路径作为当前OD数据的真实乘车路径,
若当前可能路径含有换乘站点,则将满足条件一的当前可能路径作为第一可能路径集合的一员,遍历OD数据对应的所有可能路径,从而得到第一可能路径集合,
条件一:当前可能路径的理论旅行时间T和OD数据对应的真实旅行时间L的误差在预设阈值时间t内,
若第一可能路径集合中只有1条可能路径,则将该条可能路径作为当前OD数据的真实乘车路径,若第一可能路径集合中有2条以上可能路径,则继续从第一可能路径集合中删除满足条件二中任意一种情况的可能路径后,得到第二可能路径集合,
条件二为根据进站时间和可能路径所覆盖周围地点所构成的条件,若第二可能路径集合中只有1条可能路径,则该条可能路径作为当前OD数据对应的真实乘车路径;若第二可能路径集合中有0条可能路径,则根据条件二中对应情况优先级最高对应的当前可能路径作为当前OD数据对应的真实乘车路径;若第二可能路径集合中有2条以上可能路径,判断是否有满足条件三的可能路径,若有,则将满足条件三的可能路径作为当前OD数据对应的真实乘车路径,若没有,则从第二可能路径集合中随机选择一条路径作为当前OD数据对应的真实乘车路径,
条件三为根据可能路径的换乘站点和在换乘站点的时间与预设时间所构成的条件。
4.根据权利要求3所述的地铁上下行客流预测方法,其特征在于,所述步骤2中,所述预设阈值时间t的数值需使得至少有一条可能路径满足条件一。
5.根据权利要求3所述的地铁上下行客流预测方法,其特征在于,所述步骤2中,条件三具体为:当前可能路径包含换乘站点,且至少存在一个换乘站点的换乘时间均小于其他可能路径的理论旅行时间的q倍,0<q<1。
6.根据权利要求3所述的地铁上下行客流预测方法,其特征在于,所述步骤2中,条件二包括以下四种情况:
a.进站时间处于工作日的早高峰期、出站时间处于工作日的晚高峰期,且当前可能路径中的换乘站点为办公区或商业区所覆盖的站点;
b.进站时间的当天为节假日或周末,且当前可能路径中包含距离旅游景点或者商业中心在预设范围内的中间站点,中间站点是指当前可能路径中除去进站站点和出站站点之外的其他站点;
c.进站时间的当天处于节假日前n天或者节假日返程高峰期,n≥1,且当前可能路径中包含覆盖机场、火车站、客运站、码头中任一交通枢纽的中间站点;
d.进站时间的当天处于举办特殊活动或者大型活动,且当前可能路径中包含经过所述特殊活动或者大型活动举办地点的中间站点。
7.根据权利要求1所述的地铁上下行客流预测方法,其特征在于,所述步骤2中,每一个乘客选择任意一条真实乘车路径的乘车概率的具体实现,包括以下步骤:
将历史乘车记录中的所有OD数据进行分组,将相同OD数据分为同一组,不同OD数据分为不同组,
在同一组OD数据中,将当前乘客的各个相同真实乘车路径总和与该组OD数据下的所有真实乘车路径总和的比值作为当前真实乘车路径的概率,从而计算得到一组OD数据中选择任意一条真实乘车路径的乘车概率。
8.根据权利要求1所述的地铁上下行客流预测方法,其特征在于,所述步骤3中,根据OD数据将乘客群体集合中的乘客转化为乘客个体,其具体实现,包括:
将乘客群体集合中的乘客根据OD数据进行分组,相同OD数据的分为同一组,不同OD数据的分为不同组,对每一组OD数据内的乘客根据OD数据构建若干特征,
根据构建出的特征采用聚类算法对每一组OD数据进行聚类得到聚类结果,一个聚类结果对应若干个分类结果,一个分类结果包含一个聚类中心,一个分类结果对应若干乘客,
将每一个聚类中心下的所有乘客的理论旅行时间的平均值作为当前聚类中心的旅行时间,从而计算得到每一个聚类中心对应的旅行时间,将每一个聚类中心视为一个虚拟乘客,
从而将乘客群体集合中的乘客转化为乘客个体。
9.根据权利要求8所述的地铁上下行客流预测方法,其特征在于,所述步骤3中,计算出乘客群体集合中的乘客选择任意一条真实乘车路径的乘车概率,其具体实现包括:
在获得虚拟乘客后,虚拟乘客的理论旅行时间为聚类中心的旅行时间,得到虚拟乘客的各个OD数据的所有可能路径和每个可能路径对应的理论旅行时间,将虚拟乘客按步骤2处理,计算出每一个虚拟乘客的选择各个真实乘车路径的乘车概率和理论旅行时间,
按公式③计算出虚拟乘客以当前站点到达目标站点所构成的乘车路径和该真实乘车路径下的各个子路径的概率sub_path_probability:
Figure FDA0003281521720000051
式中,Q表示分组总数,J表示每个聚类中心对应的真实乘车路径中所包含的子路径总数,M表示每个聚类中心对应的所有真实乘车路径总数,prob表示根据步骤2计算出的各个真实乘车路径的乘车概率。
10.一种处理终端,其特征在于,其包括:
存储器,用于存储程序指令;
处理器,用于运行所述程序指令,以执行如权利要求1-9任一项所述的地铁上下行客流预测方法的步骤。
CN202111139593.6A 2021-09-27 2021-09-27 一种地铁上下行客流预测方法及处理终端 Pending CN113902180A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111139593.6A CN113902180A (zh) 2021-09-27 2021-09-27 一种地铁上下行客流预测方法及处理终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111139593.6A CN113902180A (zh) 2021-09-27 2021-09-27 一种地铁上下行客流预测方法及处理终端

Publications (1)

Publication Number Publication Date
CN113902180A true CN113902180A (zh) 2022-01-07

Family

ID=79029790

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111139593.6A Pending CN113902180A (zh) 2021-09-27 2021-09-27 一种地铁上下行客流预测方法及处理终端

Country Status (1)

Country Link
CN (1) CN113902180A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115689089A (zh) * 2022-10-25 2023-02-03 深圳市城市交通规划设计研究中心股份有限公司 城市轨道交通乘客乘车概率推算方法、设备及存储介质
CN116822762A (zh) * 2023-03-29 2023-09-29 北京交通大学 地铁网络系统稳定性监测控制方法、系统和设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115689089A (zh) * 2022-10-25 2023-02-03 深圳市城市交通规划设计研究中心股份有限公司 城市轨道交通乘客乘车概率推算方法、设备及存储介质
CN116822762A (zh) * 2023-03-29 2023-09-29 北京交通大学 地铁网络系统稳定性监测控制方法、系统和设备

Similar Documents

Publication Publication Date Title
Lin et al. Transit signal priority control at signalized intersections: a comprehensive review
Lu et al. A review of big data applications in urban transit systems
Geroliminis et al. Identification and analysis of queue spillovers in city street networks
CN109166337B (zh) 公交到站时间生成方法、装置及公交乘客出行od获取方法
Tang et al. A mixed path size logit-based taxi customer-search model considering spatio-temporal factors in route choice
CN107358319A (zh) 城市轨道交通客流预测方法、装置、存储介质和计算机设备
CN113902180A (zh) 一种地铁上下行客流预测方法及处理终端
CN104021667A (zh) 整合预约服务与实时打车的出租车合乘调度系统及调度方法
EP3583788B1 (en) Determining vehicle crowdedness using real-time location data
Gao et al. Analysis of travel time patterns in urban using taxi GPS data
CN110675646B (zh) 公交站点位置获取方法及装置
CN106295868A (zh) 交通出行数据处理方法及装置
Li et al. A platoon‐based adaptive signal control method with connected vehicle technology
Yi et al. Optimal limited-stop bus routes selection using a genetic algorithm and smart card data
KR20180048828A (ko) 셀룰라 데이터와 관련 이용에 의거하여 근본 혼잡 원인을 확인하고 그 완화책을 권고하는 방법과 시스템
Oskarbski et al. Reliability and safety as an objective of intelligent transport systems in urban areas
CN109215341B (zh) 一种包含下车信息的公交出行数据生成方法
Mashingaidze et al. The Search for Sustainable Transport Infrastructure in Harare: Integrating Intelligent Transport Systems
Li et al. Simulation of shared autonomous vehicles operations with relocation considering external traffic: Case study of brussels
Horažďovský et al. Dynamic service of public transport in smart city and region
CN112860766B (zh) 一种公交运行车次认定方法及装置
Sharma Revolutionizing Transportation: The Power of Artificial Intelligence
Barth et al. Passenger density and flow analysis and city zones and bus stops classification for public bus service management
Abdelghaffar et al. Developing a Connected Vehicle Transit Signal Priority System [Final Report-Part 1]
Sokulskyi et al. The Internet of Things Solutions in the Investigation of Urban Passenger Traffic and Passenger Service Quality

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination