CN112686417A - 一种地铁大客流预测方法、系统及电子设备 - Google Patents
一种地铁大客流预测方法、系统及电子设备 Download PDFInfo
- Publication number
- CN112686417A CN112686417A CN201910993773.7A CN201910993773A CN112686417A CN 112686417 A CN112686417 A CN 112686417A CN 201910993773 A CN201910993773 A CN 201910993773A CN 112686417 A CN112686417 A CN 112686417A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- station
- time period
- site
- event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000002776 aggregation Effects 0.000 claims abstract description 152
- 238000004220 aggregation Methods 0.000 claims abstract description 152
- 230000003068 static effect Effects 0.000 claims abstract description 60
- 238000004364 calculation method Methods 0.000 claims description 36
- 230000002159 abnormal effect Effects 0.000 claims description 16
- 238000009826 distribution Methods 0.000 claims description 16
- 230000015654 memory Effects 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 13
- 230000001186 cumulative effect Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 8
- 238000012417 linear regression Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000009827 uniform distribution Methods 0.000 claims description 6
- 241000084490 Esenbeckia delta Species 0.000 claims 2
- 230000007774 longterm Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000005206 flow analysis Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种地铁大客流预测方法、系统及电子设备。包括:步骤a:根据历史乘客出行数据提取地铁静态特征及动态特征;步骤b:基于地铁实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点;步骤c:根据所述会发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量。在大客流场景下,相比传统方法本申请具有较高的预测精度。
Description
技术领域
本申请属于智能公共交通技术领域,特别涉及一种地铁大客流预测方法、系统及电子设备。
背景技术
城市轨道交通以速度快、运量大、时间准、污染小、能耗低等优点,逐渐成为市民公共交通出行的主要方式。目前城市轨道交通已成为国内外大型城市发展公共交通、缓解道路交通压力的最佳解决方案之一。而对客流的实时预测尤其是对大客流的预测是客流疏散、动态列车调度、区间车调度等的基础。
目前,国内外研究学者已经在客流预测方面展开了大量的研究,比如轨道交通站点客流量、区间断面流量等的预测。但现有的预测方法主要针对通常情况下的客流做分析与预测,或者对已经发生大客流的站点做监测,无法适用于预测未来在短时间出现大客流的场景。相对于通常情况,对由大型活动等原因造成的在较短时间内在某站点汇聚大量客流的情况的预测具有更加重要的意义,例如维持公共交通安全等。
发明内容
本申请提供了一种地铁大客流预测方法、系统及电子设备,旨在至少在一定程度上解决现有技术中的上述技术问题之一。
为了解决上述问题,本申请提供了如下技术方案:
一种地铁大客流预测方法,包括以下步骤:
步骤a:根据历史乘客出行数据提取地铁静态特征及动态特征;
步骤b:基于地铁实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点;
步骤c:根据所述会发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量。
本申请实施例采取的技术方案还包括:在所述步骤a中,所述静态特征包括在线客流Ai,k,c、站点累计客流Acj,c、各时段历史平均客流、历史发生大客流事件的次数Fj、站点平均花费时间Cdj;其中,各时段历史平均客流包括在线历史平均客流量、累计客流量,分别使用表示Ai,k,c,Acj,k对应的历史平均值;所述动态特征包括两站之间花费时间csti,j、客流平均贡献率
本申请实施例采取的技术方案还包括:在所述步骤b中,所述基于实时在线客流与历史平均客流的偏移量实时估算各站点的客流聚集指数具体为:假设在过去时段Tk从站点si进站的乘客,在时间段Tc之后仍然在线的乘客数量相比历史平均值的偏移量大,则表示Ri,k,c这部分乘客会在未来时段Tc+m向别的站点聚集;如果地铁全网很多站点的客流都有在Tc+m时段向站点sj聚集的趋势,则认为在未来时段Tc+m的sj站会出现大客流事件;Ri,k,c可能去往的站点以及所影响的时段与两站之间花费时间有关系;偏移量Ri,k,c服从泊松分布Ri,k,c~P(λ),使用置信区间检验偏移量Ri,k,c>0是否异常,如果Ri,k,c异常,则将Ri,k,c>0称为关键客流;如果Ri,k,c是关键客流,假设Ri,k,c去往站点sj,那么Ri,k,c在未来时段Tc+m到达站点sj的客流量,或Ri,k,c对在未来时段Tc+m在sj站点的发生大客流事件的贡献率计算为:
未来时段Tc+m在sj站的客流聚集指数GSc,j,m定义为:在Tc+m-M~Tc时段范围从其它站点进站的关键客流对在未来时段Tc+m在站点sj的大客流贡献率之和,计算为:
本申请实施例采取的技术方案还包括:在所述步骤b中,所述结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点具体包括:
步骤b1:根据客流聚集指数筛选出可能发生大客流的潜在聚集站点集合;在当前时段Tc,为了判断未来时段Tc+m是否发生大客流事件,首先将客流聚集指数GSc,j,m大于阈值Gmax的前NB个站点作为可能发生大客流事件的站点,并添加到大客流聚集站点集合SB中;
步骤b2:根据所述潜在聚集站点集合中各个站点的静态特征及动态特征建立Logit模型,判断将要发生大客流事件的具体站点;首先,判断所述大客流聚集站点集合SB中各个站点在最近时段是否已经出现了客流聚集情况;如果是,则将该站点作为大客流事件发生站点;如果大客流聚集站点集合SB中各个站点在最近时段没有出现客流聚集情况,则计算SB中各站点发生大客流事件的概率,将概率最大的站点作为大客流发生的站点;对于sj∈SB中的每一个站点,客流聚集指数GSc,j,m可以反映其动态特征,结合站点sj的历史发生大客流事件的次数Fj以及站点平均花费时间Cdj,并基于多概率选择模型logit计算各站点发生大客流事件的概率。
本申请实施例采取的技术方案还包括:在所述步骤c中,所述根据发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量具体包括:假设在时段Tc时判定未来时段Tc+m在sj站点将发生大客流事件,客流聚集指数为GSc,j,m,预测在未来时段Tc+m流入站点sj的客流量Dj,c+m;Dj,c+m表示为平均客流量与偏移量Δ之和,即
Δ表示为Ic+m-N~Ic时段的贡献量Δp和Ic+1~Ic+m时段的贡献量Δf两部分,假设在每一次大客流事件中,参与大客流聚集的乘客进站时间服从均匀分布,则Δf/Δ的比值可以计算为:
上述公式中,PrΔ(to∈[Ic+m-N Ic])表示在Δ中,在过去时段进站的乘客比例;如果已知大客流贡献率,Δ计算为Δ=Δp×θ;
如果过去在站点sj发生过大客流事件,则所述大客流贡献率为历史平均大客流贡献率;如果过去在站点sj从来没有发生过大客流事件,则构建线性回归模型使用平均花费时间贡献率和客流平均贡献率估计站点si的大客流贡献率;其中所述时间贡献率计算方法为:
本申请实施例采取的另一技术方案为:一种地铁大客流预测系统,包括:
特征提取模块:用于根据历史乘客出行数据提取地铁静态特征及动态特征;
大客流聚集站点判断模块:用于基于地铁实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点;
大客流量预测模块:用于根据所述会发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量。
本申请实施例采取的技术方案还包括:所述静态特征包括在线客流Ai,k,c、站点累计客流Acj,c、各时段历史平均客流、历史发生大客流事件的次数Fj、站点平均花费时间Cdj;其中,各时段历史平均客流包括在线历史平均客流量、累计客流量,分别使用表示Ai,k,c,Acj,k对应的历史平均值;所述动态特征包括两站之间花费时间csti,j、客流平均贡献率
本申请实施例采取的技术方案还包括:所述大客流聚集站点判断模块包括:
客流聚集指数计算单元:用于基于实时在线客流与历史平均客流的偏移量实时估算各站点的客流聚集指数;假设在过去时段Tk从站点si进站的乘客,在时间段Tc之后仍然在线的乘客数量相比历史平均值的偏移量大,则表示Ri,k,c这部分乘客会在未来时段Tc+m向别的站点聚集;如果地铁全网很多站点的客流都有在Tc+m时段向站点sj聚集的趋势,则认为在未来时段Tc+m的sj站会出现大客流事件;Ri,k,c可能去往的站点以及所影响的时段与两站之间花费时间有关系;偏移量Ri,k,c服从泊松分布Ri,k,c~P(λ),使用置信区间检验偏移量Ri,k,c>0是否异常,如果Ri,k,c异常,则将Ri,k,c>0称为关键客流;如果Ri,k,c是关键客流,假设Ri,k,c去往站点sj,那么Ri,k,c在未来时段Tc+m到达站点sj的客流量,或Ri,k,c对在未来时段Tc+m在sj站点的发生大客流事件的贡献率计算为:
未来时段Tc+m在sj站的客流聚集指数GSc,j,m定义为:在Tc+m-M~Tc时段范围从其它站点进站的关键客流对在未来时段Tc+m在站点sj的大客流贡献率之和,计算为:
本申请实施例采取的技术方案还包括:所述大客流聚集站点判断模块还包括:
大客流聚集站点预测单元:用于根据客流聚集指数筛选出可能发生大客流的潜在聚集站点集合,然后根据潜在聚集站点集合中各个站点的静态特征以及动态特征建立Logit模型,判断将要发生大客流事件的具体站点;具体为:
在当前时段Tc,为了判断未来时段Tc+m是否发生大客流事件,首先将客流聚集指数GSc,j,m大于阈值Gmax的前NB个站点作为可能发生大客流事件的站点,并添加到大客流聚集站点集合SB中;判断所述大客流聚集站点集合SB中各个站点在最近时段是否已经出现了客流聚集情况;如果是,则将该站点作为大客流事件发生站点;如果大客流聚集站点集合SB中各个站点在最近时段没有出现客流聚集情况,则计算SB中各站点发生大客流事件的概率,将概率最大的站点作为大客流发生的站点;对于sj∈SB中的每一个站点,客流聚集指数GSc,j,m可以反映其动态特征,结合站点sj的历史发生大客流事件的次数Fj以及站点平均花费时间Cdj,并基于多概率选择模型logit计算各站点发生大客流事件的概率。
本申请实施例采取的技术方案还包括:所述大客流量预测模块根据发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量具体包括:假设在时段Tc时判定未来时段Tc+m在sj站点将发生大客流事件,客流聚集指数为GSc,j,m,预测在未来时段Tc+m流入站点sj的客流量Dj,c+m;Dj,c+m表示为平均客流量与偏移量Δ之和,即
Δ表示为Ic+m-N~Ic时段的贡献量Δp和Ic+1~Ic+m时段的贡献量Δf两部分,假设在每一次大客流事件中,参与大客流聚集的乘客进站时间服从均匀分布,则Δf/Δ的比值可以计算为:
上述公式中,PrΔ(to∈[Ic+m-N Ic])表示在Δ中,在过去时段进站的乘客比例;如果已知大客流贡献率,Δ计算为Δ=Δp×θ;
如果过去在站点sj发生过大客流事件,则所述大客流贡献率为历史平均大客流贡献率;如果过去在站点sj从来没有发生过大客流事件,则构建线性回归模型使用平均花费时间贡献率和客流平均贡献率估计站点si的大客流贡献率;其中所述时间贡献率计算方法为:
本申请实施例采取的又一技术方案为:一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的地铁大客流预测方法的以下操作:
步骤a:根据历史乘客出行数据提取地铁静态特征及动态特征;
步骤b:基于地铁实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点;
步骤c:根据所述会发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量。
相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的地铁大客流预测方法、系统及电子设备通过对历史长期的乘客出行数据做深入分析,基于各站点历史大客流发生次数、最近时段客流的变化量、以及站点相关特征判断未来短期将要发生大客流事件的具体站点,并结合历史是否发生过大客流事件,以及该站点其它的动态和静态特征预测未来短期的精确客流量。在大客流场景下,相比传统方法本申请具有较高的预测精度。
附图说明
图1是本申请实施例的地铁大客流预测方法的流程图;
图2为大客流聚集实例图;
图3是本申请实施例的地铁大客流预测系统的结构示意图;
图4是本申请实施例提供的地铁大客流预测方法的硬件设备结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
为了解决现有技术的不足,本申请通过对历史长期的乘客出行数据做深入分析,对未来短期内流入大量客流(出站客流)的站点和流入(出站)客流量进行实时预测。为了清楚描述及解释本申请的技术方案,首先给出本申请使用到的如下定义,然后对本申请的具体技术内容进行详细说明:
定义1(地铁系统):一个地铁系统由多条线路L={l1,l2,…,l|L|}和多个站点S={s1,s2,…,s|S|}组成,其中|L|和|S|分别表示线路条数和站点个数;本申请所指的线路是带有方向性的逻辑线路,例如深圳1号线从罗湖到机场东与从机场东到罗湖为两条不同的线路。
定义2(乘客出行):乘客的一次出行tr关联So,Sd,to,td四个属性,分别表示进站站点、出站站点、进站时间、出站时间。
定义3(时段集合):将一天按固定的间隔τ划分为多个时段T1,T2,…T|T|,第k时段Tk所包含的时间范围为{(k-1)τ,kτ}。
定义4(进站客流):使用Oi,k表示在Tk时间段从站点si进站的乘客数量,计算方法为:Oi,k=|{tr|tr∈Tr,tr.so=si,tr.to∈Tk}|,其中Tr表示预测当天的所有已产生的出行;.操作用于统计符合条件的出行数量。
定义5(出站客流):使用Di,k表示在在Tk时间段从站点si出站的乘客数量,计算方法为Di,k=|{tr|tr∈Tr,tr.sd=si,tr.td∈Tk}|。
定义6(OD客流):使用ODi,j,k,n表示在Tk时间段从si站点进站,在Tk+n时段从sj出站的乘客数量,计算方法为ODi,j,k,n=|{tr|tr∈Tr,tr.sb=si,tr.tb∈Tk,tr.se=sj,tr.te∈Tk+n}|.。
定义7(大客流事件):对于某站点sj,如果在时间段Tb出站的客流量与历史平均值的差大于某设定阈值Δmax,则表示站点sj在时间段Tb发生了大客流事件。
问题定义:给出历史长期和实时的地铁智能卡交易数据,每一条交易数据包含乘客进(出)站的刷卡时间和站点,本申请的目的是预测未来时段Tc+m(Tc为当前时段,m=1,2,3,…)地铁系统是否发生大客流事件,以及发生大客流事件的站点和具体客流量。例如图1展示了2014年9月28日深圳会展中心站点的出站客流和历史平均客流。如果将阈值Δmax设定为3000,将时间间隔τ设置为半小时,则判定会展中心站点在8:00~8:30发生了大客流事件。
请参阅图2,是本申请实施例的地铁大客流预测方法的流程图。本申请实施例的地铁大客流预测方法包括以下步骤:
步骤100:根据历史长期的乘客出行数据提取地铁静态特征及动态特征;
步骤100中,地铁静态特征及动态特征是大客流聚集站点判定和大客流量预测的基础。静态特征即与站点相关的特征,包括在线客流、站点累计客流、各时段历史平均客流、历史发生大客流事件的次数、站点平均花费时间等。具体如下:
(4)历史发生大客流事件的次数;某站点的历史大客流发生次数在一定程度上反应了此站点大客流发生的可能性。以下实施例使用Fj表示大客流事件在sj站点发生的次数。需要注明的是,大客流事件发生的次数按连续时间段统计。例如在某天的9:00~13:00之间站点sj发生了大客流,虽然中间跨越多个时间段,由于发生的是同一事件,所以只统计一次。
(5)站点平均花费时间;一般而言,一个城市的中心区域比郊区更容易发生大客流聚集事件。给定某站点sj,来自全网其它站点的乘客前往此站点的平均花费时间Cdj在一定程度上反应了此站点的区域特征。从其它各站点到此站点出行的平均时间越长在某种程度上说明此站点可能越偏远。平均花费时间小的站点可能处于中心区域,反之为郊区。以下使用Cdj表示站点sj的区域特征,用从站点sj出站的乘客的平均花费时间表示,Cdj计算公式为:
动态特征涉及多个站点,包括两站之间花费时间、客流平均贡献率等。具体的:
(1)两站之间时间花费;两站之间的花费时间是影响从各站点进站的客流到达其它站点时间的重要因素。乘客出行数据记录了每一位乘客完整的进出站时间,这为计算两站之间花费时间分布提供了充足的数据支撑。本申请实施例中,分别提取两类时间花费特征。第一类是两站之间的平均花费时间,表示两站之间花费时间的总体描述。以下使用csti,j标识站点si和站点sj之间的平均花费时间。计算方法为:
第二类是一天不同时间段的花费时间分布,描述时间的局部特征,这是由于列车调度时间,例如发车间隔等因素的影响,两站之间乘客所花费时间也会不同,所以针对不同的时间段对两站之间的时间花费分别做统计。将在Tk时间段从si进站前往sj的乘客中,在Tk,Tk+1,…Tk+M时间段从sj出站的比例记做:计算方法为:
公式(3)中,M为地铁系统任意两站之间花费时间最多的时间段的数量。
公式(4)中,Trall表示乘客的所有历史出行记录。
本申请实施例中,由于居民的出行受工作生活等因素影响呈现7天周期性,在工作日、周末、节假日三类情况下呈现出不同的特征,因此本申请针工作日、周末、节假日三类情况分别进行静态特征及动态特征的提取。
步骤200:基于实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及发生大客流事件的具体站点;
步骤200中,为了清楚描述大客流事件的预测方式,以下分两个步骤进行具体描述:
步骤201:基于实时在线客流与历史平均客流的偏移量实时估算各站点的客流聚集指数;
步骤201中,由于乘客的出站时间要晚于进站时间,在未来时段Tc+m从某站点sj出站的乘客中包含在前期时段Tc+m-M~Tc从其它站点进站的乘客。如果某站点在未来时段Tc+m内会发生大量客流流入,那么相比平常情况下,在前期时段Tc+m-M~Tc进站的乘客会存在往站点sj聚集的趋势,本申请实施例中将该趋势称之为客流聚集指数。
进一步地,未来时段Tc+m内各个站点的客流聚集指数计算方式具体包括:任意站点sj在未来时段Tc+m的聚集指数用于描述全网在线乘客在Tc+m时段内在站点sj异常聚集的趋势。根据分析,该异常聚集趋势包括以下两点规律:(1)通常情况下乘客出行呈现规律性,在线客流在时空分布上比较接近平均值,而在随机性强的大客流聚集情况下,其偏离平均值较大。(2)乘客的出行时间与乘客数量成反比。即出行时间越短,乘客数量越多,说明乘客更倾向于向附近区域聚集。
基于以上规律,如果在过去时段Tk从站点si进站的乘客,在时间段Tc之后仍然在线的乘客数量相比历史平均值的偏移量较大,那么Ri,k,c这部分客流很可能在未来时段Tc+m向别的站点聚集。Ri,k,c可能去往的站点以及所影响的时段与两站之间时间花费有关系。如果地铁全网很多站点的客流都有在Tc+m时段向站点sj聚集的趋势,那么在未来时段Tc+m的sj站很有可能出现大客流事件。
通过对历史数据分析,发现偏移量Ri,k,c服从泊松分布Ri,k,c~P(λ),其中参数λ可以通过使用极大似然估计得到。本申请使用95%作为置信区间来检验偏移量Ri,k,c>0是否异常,并使用N(Ri,k,c)标识Ri,k,c是否通过异常检验,如果通过检验值为0,否则为1。如果Ri,k,c异常,则将Ri,k,c>0称为关键客流。
如果Ri,k,c是关键客流,假设Ri,k,c去往站点sj,那么Ri,k,c在未来时段Tc+m到达站点sj的客流量,或Ri,k,c对在未来时段Tc+m在sj站点的发生大客流事件的贡献率可以计算为:
其中,未来时段Tc+m在sj站的客流聚集指数GSc,j,m定义为:在Tc+m-M~Tc时段范围从其它站点进站的关键客流对在未来时段Tc+m在站点sj的大客流贡献率之和,可以计算为:
步骤202:根据客流聚集指数筛选出可能发生大客流的潜在聚集站点集合,然后根据潜在聚集站点集合中各个站点的静态特征及动态特征建立Logit模型,判断将要发生大客流事件的具体站点;
步骤202中,根据以上客流聚集指数的定义,可以看到如果整个地铁网络的乘客有向站点sj聚集的趋势,那么也有可能向站点sj的邻居站点聚集,即sj与其邻居站点的客流聚集指数相差可能较小,因此其相邻站点也有可能被判断为大客流聚集的站点,为了防止误判断,本申请分以下两个步骤进行大客流事件发生站点的判断:
步骤2021:潜在大客流聚集站点选择;在当前时段Tc,为了判断未来时段Tc+m是否发生大客流事件,首先将客流聚集指数GSc,j,m大于阈值Gmax的前NB个站点作为可能发生大客流事件的站点,并添加到大客流聚集站点集合SB中;
步骤2021中,阈值Gmax的选择方式具体为:首先将历史数据按照是否发生大客流事件分为发生大客流数据DB和通常情况下数据DN两类。然后分别计算DB和DN中对应的客流聚集指数的分布fB和fn,并选择在DB中的分布密度远远大于在DN中的聚集指数的区域。正常情况下,该区域处于聚集指数值较大的部分,并设定阈值Gmax为满足条件fB(x>Gmax)>95%的最大值。
NB的选择方式具体为:针对每一次大客流事件,找到大客流聚集指数大于阈值Gmax的所有站点,并对这些站点按照客流聚集指数从大到小进行编号,编号中最大的值作为NB的值。
步骤2022:大客流聚集站点判定;大客流聚集站点判定的目的是从大客流聚集站点集合SB中选择出最可能发生大客流的站点sb。一般情况下,大客流事件是由于大型活动引起的,且大客流事件会延续一段时间,即某站点如果在当前时段出现了客流聚集,在下一个时段也有可能出现客流聚集。另外,各站点是否发生以及发生大客流事件的概率与各站点相关特征有关系,例如发生次数,区域特征等。
本申请实施例中,大客流聚集站点判定方式具体为:
首先,判断大客流聚集站点集合SB中各个站点在最近时段是否已经出现了客流聚集情况;各个站点sj∈SB的累计客流Acj,c可以反映客流的聚集趋势,因此计算SB中每个站点的累计客流,并判断是否出现了大客流事件,如果是,则将此站点作为大客流事件发生站点。如果大客流聚集站点集合SB中各个站点在最近时段没有出现客流聚集情况,则计算SB中各站点发生大客流事件的概率,将概率最大的站点作为大客流发生的站点。对于sj∈SB中的每一个站点,客流聚集指数GSc,j,m可以反映其动态特征,结合站点sj的历史发生大客流事件的次数Fj、站点平均花费时间Cdj等特征,并基于多概率选择模型logit计算各站点发生大客流事件的概率。Logit模型使用效用理论为:站点sj发生大客流事件的可能性与其效用值Uj=θ1×GSc,j,m+θ2×Fj+θ3×Cdj有关系,效用值越大,其发生的可能性越大。乘客前往站点sj的概率计算公式为:
公式(7)中,参数θ1,θ2,θ3可以通过历史大客流事件拟合得到。
步骤300:根据发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量;
步骤300中,假设在时段Tc时判定未来时段Tc+m在sj站点将发生大客流事件,客流聚集指数为GSc,j,m,本步骤的目的是预测在未来时段Tc+m流入站点sj的客流量Dj,c+m。Dj,c+m可以表示为平均客流量与偏移量Δ之和,即以下将客流量预测问题归结为对Δ的预测。
由于站点间所花费时间的不同,在未来时段Tc+m在站点sj出站的乘客进站时间段也会不同。一部分乘客在过去时段Ic+m-N~Ic已经进站,另一部分乘客将在未来时段Ic+1~Ic+m进站,所以Δ可以表示为Δp和Δf两部分,分别为Ic+m-N~Ic时段的贡献量和Ic+1~Ic+m时段的贡献量。其中客流聚集指数是在Ic+m-N~Ic时段内进站的关键客流对Δ的贡献,即Δp的值。
为了计算Δf的值,首先定义大客流贡献率。给定某次大客流事件发生的时段Tk和站点sj,使用R表示各个站点的客流对Δ的贡献比例。此次大客流量Dj,k与平均客流量的差值记为从任意其它站点si进站的乘客数量与平均客流量的差值记为各个站点对Δ的贡献比例称作大客流贡献率,用向量R={r1,r2,…,r|S|}表示,其中表示站点si对Δ的贡献比。
假设在每一次大客流事件中,参与大客流聚集的乘客进站时间服从均匀分布(在交通领域经常使用的假设,例如公交乘客到达站点的时间等),那么Δf/Δ的比值可以计算为:
公式(8)中,PrΔ(to∈[Ic+m-N Ic])表示在Δ中,在过去时段进站的乘客比例。如果已知大客流贡献率,Δ可以计算为Δ=Δp×θ。
为了估计大客流贡献率,首先介绍两点发现:
(1)通过对同一站点发生过两次以上大客流事件,或者持续多个时间段的同一件大客流事件进行分析,发现相同站点在不同大客流事件中对此站点的贡献率比例基本稳定。这是因为由于区域等因素的影响,往此站点聚集的客流的源站点分布比较规律。
基于上述两点,如果过去在站点sj发生过大客流事件,那么大客流贡献率估计为历史平均大客流贡献率。如果过去在此站点从来没有发生过大客流事件,构建线性回归模型使用平均花费时间贡献率和客流平均贡献率去估计站点si的大客流贡献比。其中时间贡献率计算方法为:
请参阅图3,是本申请实施例的地铁大客流预测系统的结构示意图。本申请实施例的地铁大客流预测系统包括特征提取模块、大客流聚集站点判断模块和大客流量预测模块。
特征提取模块:用于根据历史长期的乘客出行数据提取地铁静态特征和动态特征;具体的,特征提取模块包括:
用于提取站点静态特征的静态特征提取单元:静态特征即与站点相关的特征,包括在线客流、站点累计客流、各时段历史平均客流、历史发生大客流事件的次数、站点平均花费时间等。具体如下:
(4)历史发生大客流事件的次数;某站点的历史大客流发生次数在一定程度上反应了此站点大客流发生的可能性。以下实施例使用Fj表示大客流事件在sj站点发生的次数。需要注明的是,大客流事件发生的次数按连续时间段统计。例如在某天的9:00~13:00之间站点sj发生了大客流,虽然中间跨越多个时间段,由于发生的是同一事件,所以只统计一次。
(5)站点平均花费时间;一般而言,一个城市的中心区域比郊区更容易发生大客流聚集事件。给定某站点sj,来自全网其它站点的乘客前往此站点的平均花费时间Cdj在一定程度上反应了此站点的区域特征。从其它各站点到此站点出行的平均时间越长在某种程度上说明此站点可能越偏远。平均花费时间小的站点可能处于中心区域,反之为郊区。以下使用Cdj表示站点sj的区域特征,用从站点sj出站的乘客的平均花费时间表示,Cdj计算公式为:
用于提取地铁网络特征的动态特征提取单元:地铁网络特征涉及多个站点,包括两站之间花费时间、客流平均贡献率等。具体为:
(1)两站之间时间花费;两站之间的花费时间是影响从各站点进站的客流到达其它站点时间的重要因素。乘客出行数据记录了每一位乘客完整的进出站时间,这为计算两站之间花费时间分布提供了充足的数据支撑。本申请实施例中,分别提取两类时间花费特征。第一类是两站之间的平均花费时间,表示两站之间花费时间的总体描述。以下使用csti,j标识站点si和站点sj之间的平均花费时间。计算方法为:
第二类是一天不同时间段的花费时间分布,描述时间的局部特征,这是由于列车调度时间,例如发车间隔等因素的影响,两站之间乘客所花费时间也会不同,所以针对不同的时间段对两站之间的时间花费分别做统计。将在Tk时间段从si进站前往sj的乘客中,在Tk,Tk+1,…Tk+M时间段从sj出站的比例记做:计算方法为:
公式(3)中,M为地铁系统任意两站之间花费时间最多的时间段的数量。
公式(4)中,Trall表示乘客的所有历史出行记录。
本申请实施例中,由于居民的出行受工作生活等因素影响呈现7天周期性,在工作日、周末、节假日三类情况下呈现出不同的特征,因此本申请针工作日、周末、节假日三类情况分别进行静态特征及动态特征的提取。
大客流聚集站点判断模块:用于基于实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并根据各站点的客流聚集指数、站点静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及发生大客流事件的具体站点;具体的,大客流聚集站点判断模块包括:
客流聚集指数计算单元:用于基于实时在线客流与历史平均客流的偏移量实时估算各站点的客流聚集指数;由于乘客的出站时间要晚于进站时间,在未来时段Tc+m从某站点sj出站的乘客中包含在前期时段Tc+m-M~Tc从其它站点进站的乘客。如果某站点在未来时段Tc+m内会发生大量客流流入,那么相比平常情况下,在前期时段Tc+m-M~Tc进站的乘客会存在往站点sj聚集的趋势,本申请实施例中将该趋势称之为客流聚集指数。
进一步地,未来时段Tc+m内各个站点的客流聚集指数计算方式具体包括:任意站点sj在未来时段Tc+m的聚集指数用于描述全网在线乘客在Tc+m时段内在站点sj异常聚集的趋势。根据分析,该异常聚集趋势包括以下两点规律:(1)通常情况下乘客出行呈现规律性,在线客流在时空分布上比较接近平均值,而在随机性强的大客流聚集情况下,其偏离平均值较大。(2)乘客的出行时间与乘客数量成反比。即出行时间越短,乘客数量越多,说明乘客更倾向于向附近区域聚集。
基于以上规律,如果在过去时段Tk从站点si进站的乘客,在时间段Tc之后仍然在线的乘客数量相比历史平均值的偏移量较大,那么Ri,k,c这部分客流很可能在未来时段Tc+m向别的站点聚集。Ri,k,c可能去往的站点以及所影响的时段与两站之间时间花费有关系。如果地铁全网很多站点的客流都有在Tc+m时段向站点sj聚集的趋势,那么在未来时段Tc+m的sj站很有可能出现大客流事件。
通过对历史数据分析,发现偏移量Ri,k,c服从泊松分布Ri,k,c~P(λ),其中参数λ可以通过使用极大似然估计得到。本申请使用95%作为置信区间来检验偏移量Ri,k,c>0是否异常,并使用N(Ri,k,c)标识Ri,k,c是否通过异常检验,如果通过检验值为0,否则为1。如果Ri,k,c异常,则将Ri,k,c>0称为关键客流。
如果Ri,k,c是关键客流,假设Ri,k,c去往站点sj,那么Ri,k,c在未来时段Tc+m到达站点sj的客流量,或Ri,k,c对在未来时段Tc+m在sj站点的发生大客流事件的贡献率可以计算为:
其中,未来时段Tc+m在sj站的客流聚集指数GSc,j,m定义为:在Tc+m-M~Tc时段范围从其它站点进站的关键客流对在未来时段Tc+m在站点sj的大客流贡献率之和,可以计算为:
大客流聚集站点预测单元:用于根据客流聚集指数筛选出可能发生大客流的潜在聚集站点集合,然后根据潜在聚集站点集合中各个站点的静态特征以及动态特征建立Logit模型,判断将要发生大客流事件的具体站点;根据以上客流聚集指数的定义,可以看到如果整个地铁网络的乘客有向站点sj聚集的趋势,那么也有可能向站点sj的邻居站点聚集,即sj与其邻居站点的客流聚集指数相差可能较小,因此其相邻站点也有可能被判断为大客流聚集的站点,为了防止误判断,本申请分以下两个步骤进行大客流事件发生站点的判断:
一、潜在大客流聚集站点选择;在当前时段Tc,为了判断未来时段Tc+m是否发生大客流事件,首先将客流聚集指数GSc,j,m大于阈值Gmax的前NB个站点作为可能发生大客流事件的站点,并添加到大客流聚集站点集合SB中。
上述中,阈值Gmax的选择方式具体为:首先将历史数据按照是否发生大客流事件分为发生大客流数据DB和通常情况下数据DN两类。然后分别计算DB和DN中对应的客流聚集指数的分布fB和fn,并选择在DB中的分布密度远远大于在DN中的聚集指数的区域。正常情况下,该区域处于聚集指数值较大的部分,并设定阈值Gmax为满足条件fB(x>Gmax)>95%的最大值。
NB的选择方式具体为:针对每一次大客流事件,找到大客流聚集指数大于阈值Gmax的所有站点,并对这些站点按照客流聚集指数从大到小进行编号,编号中最大的值作为NB的值。
二、大客流聚集站点判定;大客流聚集站点判定的目的是从大客流聚集站点集合SB中选择出最可能发生大客流的站点sb。一般情况下,大客流事件是由于大型活动引起的,且大客流事件会延续一段时间,即某站点如果在当前时段出现了客流聚集,在下一个时段也有可能出现客流聚集。另外,各站点是否发生以及发生大客流事件的概率与各站点相关特征有关系,例如发生次数,区域特征等。
大客流聚集站点判定方式具体为:首先,判断大客流聚集站点集合SB中各个站点在最近时段是否已经出现了客流聚集情况;各个站点sj∈SB的累计客流Acj,c可以反映客流的聚集趋势,因此计算SB中每个站点的累计客流,并判断是否出现了大客流事件,如果是,则将此站点作为大客流事件发生站点。如果大客流聚集站点集合SB中各个站点在最近时段没有出现客流聚集情况,则计算SB中各站点发生大客流事件的概率,将概率最大的站点作为大客流发生的站点。对于sj∈SB中的每一个站点,客流聚集指数GSc,j,m可以反映其动态特征,结合站点sj的历史发生大客流事件的次数Fj、站点平均花费时间Cdj等特征,并基于多概率选择模型logit计算各站点发生大客流事件的概率。Logit模型使用效用理论为:站点sj发生大客流事件的可能性与其效用值Uj=θ1×GSc,j,m+θ2×Fj+θ3×Cdj有关系,效用值越大,其发生的可能性越大。乘客前往站点sj的概率计算公式为:
公式(7)中,参数θ1,θ2,θ3可以通过历史大客流事件拟合得到。
大客流量预测模块:用于根据发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量;假设在时段Tc时判定未来时段Tc+m在sj站点将发生大客流事件,客流聚集指数为GSc,j,m,本步骤的目的是预测在未来时段Tc+m流入站点sj的客流量Dj,c+m。Dj,c+m可以表示为平均客流量与偏移量Δ之和,即以下将客流量预测问题归结为对Δ的预测。
由于站点间所花费时间的不同,在未来时段Tc+m在站点sj出站的乘客进站时间段也会不同。一部分乘客在过去时段Ic+m-N~Ic已经进站,另一部分乘客将在未来时段Ic+1~Ic+m进站,所以Δ可以表示为Δp和Δf两部分,分别为Ic+m-N~Ic时段的贡献量和Ic+1~Ic+m时段的贡献量。其中客流聚集指数是在Ic+m-N~Ic时段内进站的关键客流对Δ的贡献,即Δp的值。
为了计算Δf的值,首先定义大客流贡献率。给定某次大客流事件发生的时段Tk和站点sj,使用R表示各个站点的客流对Δ的贡献比例。此次大客流量Dj,k与平均客流量的差值记为从任意其它站点si进站的乘客数量与平均客流量的差值记为各个站点对Δ的贡献比例称作大客流贡献率,用向量R={r1,r2,…,r|S|}表示,其中表示站点si对Δ的贡献比。
假设在每一次大客流事件中,参与大客流聚集的乘客进站时间服从均匀分布(在交通领域经常使用的假设,例如公交乘客到达站点的时间等),那么Δf/Δ的比值可以计算为:
公式(8)中,PrΔ(to∈[Ic+m-N Ic])表示在Δ中,在过去时段进站的乘客比例。如果已知大客流贡献率,Δ可以计算为Δ=Δp×θ。
为了估计大客流贡献率,首先介绍两点发现:
(1)通过对同一站点发生过两次以上大客流事件,或者持续多个时间段的同一件大客流事件进行分析,发现相同站点在不同大客流事件中对此站点的贡献率比例基本稳定。这是因为由于区域等因素的影响,往此站点聚集的客流的源站点分布比较规律。
基于上述两点,如果过去在站点sj发生过大客流事件,那么大客流贡献率估计为历史平均大客流贡献率。如果过去在此站点从来没有发生过大客流事件,构建线性回归模型使用平均花费时间贡献率和客流平均贡献率去估计站点si的大客流贡献比。其中时间贡献率计算方法为:
图4是本申请实施例提供的地铁大客流预测方法的硬件设备结构示意图。如图4所示,该设备包括一个或多个处理器以及存储器。以一个处理器为例,该设备还可以包括:输入系统和输出系统。
处理器、存储器、输入系统和输出系统可以通过总线或者其他方式连接,图4中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例的处理方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入系统可接收输入的数字或字符信息,以及产生信号输入。输出系统可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器中,当被所述一个或者多个处理器执行时,执行上述任一方法实施例的以下操作:
步骤a:根据历史乘客出行数据提取地铁静态特征及动态特征;
步骤b:基于地铁实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点;
步骤c:根据所述会发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例提供的方法。
本申请实施例提供了一种非暂态(非易失性)计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行以下操作:
步骤a:根据历史乘客出行数据提取地铁静态特征及动态特征;
步骤b:基于地铁实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点;
步骤c:根据所述会发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量。
本申请实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行以下操作:
步骤a:根据历史乘客出行数据提取地铁静态特征及动态特征;
步骤b:基于地铁实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点;
步骤c:根据所述会发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量。
本申请实施例的地铁大客流预测方法、系统及电子设备通过对历史长期的乘客出行数据做深入分析,基于各站点历史大客流发生次数、最近时段客流的变化量、以及站点相关特征判断未来短期将要发生大客流事件的具体站点,并结合历史是否发生过大客流事件,以及该站点其它的动态和静态特征预测未来短期的精确客流量。在大客流场景下,相比传统方法本申请具有较高的预测精度。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本申请中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本申请所示的这些实施例,而是要符合与本申请所公开的原理和新颖特点相一致的最宽的范围。
Claims (11)
1.一种地铁大客流预测方法,其特征在于,包括以下步骤:
步骤a:根据历史乘客出行数据提取地铁静态特征及动态特征;
步骤b:基于地铁实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点;
步骤c:根据所述会发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量。
3.根据权利要求2所述的地铁大客流预测方法,其特征在于,在所述步骤b中,所述基于实时在线客流与历史平均客流的偏移量实时估算各站点的客流聚集指数具体为:假设在过去时段Tk从站点si进站的乘客,在时间段Tc之后仍然在线的乘客数量相比历史平均值的偏移量大,则表示Ri,k,c这部分乘客会在未来时段Tc+m向别的站点聚集;如果地铁全网很多站点的客流都有在Tc+m时段向站点sj聚集的趋势,则认为在未来时段Tc+m的sj站会出现大客流事件;Ri,k,c可能去往的站点以及所影响的时段与两站之间花费时间有关系;偏移量Ri,k,c服从泊松分布Ri,k,c~P(λ),使用置信区间检验偏移量Ri,k,c>0是否异常,如果Ri,k,c异常,则将Ri,k,c>0称为关键客流;如果Ri,k,c是关键客流,假设Ri,k,c去往站点sj,那么Ri,k,c在未来时段Tc+m到达站点sj的客流量,或Ri,k,c对在未来时段Tc+m在sj站点的发生大客流事件的贡献率计算为:
未来时段Tc+m在sj站的客流聚集指数GSc,j,m定义为:在Tc+m-M~Tc时段范围从其它站点进站的关键客流对在未来时段Tc+m在站点sj的大客流贡献率之和,计算为:
4.根据权利要求3所述的地铁大客流预测方法,其特征在于,在所述步骤b中,所述结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点具体包括:
步骤b1:根据客流聚集指数筛选出可能发生大客流的潜在聚集站点集合;在当前时段Tc,为了判断未来时段Tc+m是否发生大客流事件,首先将客流聚集指数GSc,j,m大于阈值Gmax的前NB个站点作为可能发生大客流事件的站点,并添加到大客流聚集站点集合SB中;
步骤b2:根据所述潜在聚集站点集合中各个站点的静态特征及动态特征建立Logit模型,判断将要发生大客流事件的具体站点;首先,判断所述大客流聚集站点集合SB中各个站点在最近时段是否已经出现了客流聚集情况;如果是,则将该站点作为大客流事件发生站点;如果大客流聚集站点集合SB中各个站点在最近时段没有出现客流聚集情况,则计算SB中各站点发生大客流事件的概率,将概率最大的站点作为大客流发生的站点;对于sj∈SB中的每一个站点,客流聚集指数GSc,j,m可以反映其动态特征,结合站点sj的历史发生大客流事件的次数Fj以及站点平均花费时间Cdj,并基于多概率选择模型logit计算各站点发生大客流事件的概率。
5.根据权利要求4所述的地铁大客流预测方法,其特征在于,在所述步骤c中,所述根据发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量具体包括:假设在时段Tc时判定未来时段Tc+m在sj站点将发生大客流事件,客流聚集指数为GSc,j,m,预测在未来时段Tc+m流入站点sj的客流量Dj,c+m;Dj,c+m表示为平均客流量与偏移量Δ之和,即
Δ表示为Ic+m-N~Ic时段的贡献量Δp和Ic+1~Ic+m时段的贡献量Δf两部分,假设在每一次大客流事件中,参与大客流聚集的乘客进站时间服从均匀分布,则Δf/Δ的比值可以计算为:
上述公式中,PrΔ(to∈[Ic+m-N Ic])表示在Δ中,在过去时段进站的乘客比例;如果已知大客流贡献率,Δ计算为Δ=Δp×θ;
如果过去在站点sj发生过大客流事件,则所述大客流贡献率为历史平均大客流贡献率;如果过去在站点sj从来没有发生过大客流事件,则构建线性回归模型使用平均花费时间贡献率和客流平均贡献率估计站点si的大客流贡献率;其中所述时间贡献率计算方法为:
6.一种地铁大客流预测系统,其特征在于,包括:
特征提取模块:用于根据历史乘客出行数据提取地铁静态特征及动态特征;
大客流聚集站点判断模块:用于基于地铁实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点;
大客流量预测模块:用于根据所述会发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量。
8.根据权利要求7所述的地铁大客流预测系统,其特征在于,所述大客流聚集站点判断模块包括:
客流聚集指数计算单元:用于基于实时在线客流与历史平均客流的偏移量实时估算各站点的客流聚集指数;假设在过去时段Tk从站点si进站的乘客,在时间段Tc之后仍然在线的乘客数量相比历史平均值的偏移量大,则表示Ri,k,c这部分乘客会在未来时段Tc+m向别的站点聚集;如果地铁全网很多站点的客流都有在Tc+m时段向站点sj聚集的趋势,则认为在未来时段Tc+m的sj站会出现大客流事件;Ri,k,c可能去往的站点以及所影响的时段与两站之间花费时间有关系;偏移量Ri,k,c服从泊松分布Ri,k,c~P(λ),使用置信区间检验偏移量Ri,k,c>0是否异常,如果Ri,k,c异常,则将Ri,k,c>0称为关键客流;如果Ri,k,c是关键客流,假设Ri,k,c去往站点sj,那么Ri,k,c在未来时段Tc+m到达站点sj的客流量,或Ri,k,c对在未来时段Tc+m在sj站点的发生大客流事件的贡献率计算为:
未来时段Tc+m在sj站的客流聚集指数GSc,j,m定义为:在Tc+m-M~Tc时段范围从其它站点进站的关键客流对在未来时段Tc+m在站点sj的大客流贡献率之和,计算为:
9.根据权利要求8所述的地铁大客流预测系统,其特征在于,所述大客流聚集站点判断模块还包括:
大客流聚集站点预测单元:用于根据客流聚集指数筛选出可能发生大客流的潜在聚集站点集合,然后根据潜在聚集站点集合中各个站点的静态特征以及动态特征建立Logit模型,判断将要发生大客流事件的具体站点;具体为:
在当前时段Tc,为了判断未来时段Tc+m是否发生大客流事件,首先将客流聚集指数GSc,j,m大于阈值Gmax的前NB个站点作为可能发生大客流事件的站点,并添加到大客流聚集站点集合SB中;判断所述大客流聚集站点集合SB中各个站点在最近时段是否已经出现了客流聚集情况;如果是,则将该站点作为大客流事件发生站点;如果大客流聚集站点集合SB中各个站点在最近时段没有出现客流聚集情况,则计算SB中各站点发生大客流事件的概率,将概率最大的站点作为大客流发生的站点;对于sj∈SB中的每一个站点,客流聚集指数GSc,j,m可以反映其动态特征,结合站点sj的历史发生大客流事件的次数Fj以及站点平均花费时间Cdj,并基于多概率选择模型logit计算各站点发生大客流事件的概率。
10.根据权利要求9所述的地铁大客流预测系统,其特征在于,所述大客流量预测模块根据发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量具体包括:假设在时段Tc时判定未来时段Tc+m在sj站点将发生大客流事件,客流聚集指数为GSc,j,m,预测在未来时段Tc+m流入站点sj的客流量Dj,c+m;Dj,c+m表示为平均客流量与偏移量Δ之和,即
Δ表示为Ic+m-N~Ic时段的贡献量Δp和Ic+1~Ic+m时段的贡献量Δf两部分,假设在每一次大客流事件中,参与大客流聚集的乘客进站时间服从均匀分布,则Δf/Δ的比值可以计算为:
上述公式中,PrΔ(to∈[Ic+m-N Ic])表示在Δ中,在过去时段进站的乘客比例;如果已知大客流贡献率,Δ计算为Δ=Δp×θ;
如果过去在站点sj发生过大客流事件,则所述大客流贡献率为历史平均大客流贡献率;如果过去在站点sj从来没有发生过大客流事件,则构建线性回归模型使用平均花费时间贡献率和客流平均贡献率估计站点si的大客流贡献率;其中所述时间贡献率计算方法为:
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述1至5任一项所述的地铁大客流预测方法的以下操作:
步骤a:根据历史乘客出行数据提取地铁静态特征及动态特征;
步骤b:基于地铁实时在线客流与历史平均客流的偏移量计算各站点的客流聚集指数,并结合各站点的客流聚集指数、静态特征以及动态特征判断未来时段地铁网络是否会发生大客流事件,以及会发生大客流事件的具体站点;
步骤c:根据所述会发生大客流事件的具体站点对应的静态特征及动态特征预测该站点在未来时段的精确客流量。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910993773.7A CN112686417B (zh) | 2019-10-18 | 2019-10-18 | 一种地铁大客流预测方法、系统及电子设备 |
PCT/CN2019/125437 WO2021072959A1 (zh) | 2019-10-18 | 2019-12-14 | 一种地铁大客流预测方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910993773.7A CN112686417B (zh) | 2019-10-18 | 2019-10-18 | 一种地铁大客流预测方法、系统及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112686417A true CN112686417A (zh) | 2021-04-20 |
CN112686417B CN112686417B (zh) | 2024-03-19 |
Family
ID=75445108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910993773.7A Active CN112686417B (zh) | 2019-10-18 | 2019-10-18 | 一种地铁大客流预测方法、系统及电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112686417B (zh) |
WO (1) | WO2021072959A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113393029A (zh) * | 2021-06-11 | 2021-09-14 | 上海逸迅信息科技有限公司 | 一种轨交客流量的预测方法和设备 |
CN115564151A (zh) * | 2022-12-06 | 2023-01-03 | 成都智元汇信息技术股份有限公司 | 一种基于形态识别的突发大客流形态识别方法及系统 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536932A (zh) * | 2021-06-16 | 2021-10-22 | 中科曙光国际信息产业有限公司 | 人群聚集预测方法、装置、计算机设备和存储介质 |
CN118036868B (zh) * | 2024-01-17 | 2024-09-17 | 西藏沐风文化有限公司 | 智能化会展客流分析与调控方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105427594A (zh) * | 2015-11-23 | 2016-03-23 | 青岛海信网络科技股份有限公司 | 一种基于双向上车客流的公交断面客流量获取方法及系统 |
JP2018039441A (ja) * | 2016-09-09 | 2018-03-15 | 株式会社日立製作所 | 評価システム及び評価方法 |
CN108846514A (zh) * | 2018-06-07 | 2018-11-20 | 同济大学 | 一种突发事件下轨道交通客流疏散需求预测方法 |
CN109308543A (zh) * | 2018-08-20 | 2019-02-05 | 华南理工大学 | 基于ls-svm和实时大数据的地铁短期客流预测方法 |
CN109858681A (zh) * | 2019-01-04 | 2019-06-07 | 深圳北斗应用技术研究院有限公司 | 一种基于ic卡的交通短时客流预测方法和相关装置 |
-
2019
- 2019-10-18 CN CN201910993773.7A patent/CN112686417B/zh active Active
- 2019-12-14 WO PCT/CN2019/125437 patent/WO2021072959A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105427594A (zh) * | 2015-11-23 | 2016-03-23 | 青岛海信网络科技股份有限公司 | 一种基于双向上车客流的公交断面客流量获取方法及系统 |
JP2018039441A (ja) * | 2016-09-09 | 2018-03-15 | 株式会社日立製作所 | 評価システム及び評価方法 |
CN108846514A (zh) * | 2018-06-07 | 2018-11-20 | 同济大学 | 一种突发事件下轨道交通客流疏散需求预测方法 |
CN109308543A (zh) * | 2018-08-20 | 2019-02-05 | 华南理工大学 | 基于ls-svm和实时大数据的地铁短期客流预测方法 |
CN109858681A (zh) * | 2019-01-04 | 2019-06-07 | 深圳北斗应用技术研究院有限公司 | 一种基于ic卡的交通短时客流预测方法和相关装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113393029A (zh) * | 2021-06-11 | 2021-09-14 | 上海逸迅信息科技有限公司 | 一种轨交客流量的预测方法和设备 |
CN113393029B (zh) * | 2021-06-11 | 2023-11-17 | 上海逸迅信息科技有限公司 | 一种轨交客流量的预测方法和设备 |
CN115564151A (zh) * | 2022-12-06 | 2023-01-03 | 成都智元汇信息技术股份有限公司 | 一种基于形态识别的突发大客流形态识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2021072959A1 (zh) | 2021-04-22 |
CN112686417B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Toqué et al. | Short & long term forecasting of multimodal transport passenger flows with machine learning methods | |
CN112686417A (zh) | 一种地铁大客流预测方法、系统及电子设备 | |
US20200211374A1 (en) | System, method, and apparatus for analyzing a traffic road condition | |
US10963705B2 (en) | System and method for point-to-point traffic prediction | |
WO2020125716A1 (zh) | 一种实现网络优化的方法及相关设备 | |
CN103247177B (zh) | 大规模路网交通流实时动态预测系统 | |
CN103632212B (zh) | 一种时变用户均衡动态网络演化客流预测系统和方法 | |
Niu et al. | Optimizing urban rail timetable under time-dependent demand and oversaturated conditions | |
CN110874668B (zh) | 一种轨道交通od客流预测方法、系统及电子设备 | |
US8798897B2 (en) | Real-time traffic analysis through integration of road traffic prediction and traffic microsimulation models | |
CN106887137B (zh) | 拥堵事件提示方法及装置 | |
CN105427594B (zh) | 一种基于双向上车客流的公交断面客流量获取方法及系统 | |
CN105868861A (zh) | 一种基于时空数据融合的公交客流演化分析方法 | |
CN104751642A (zh) | 一种高等级道路交通流运行风险实时预估方法 | |
CN106887141B (zh) | 基于排队论的连续交通节点拥塞程度预测模型、系统及方法 | |
CN112185124B (zh) | 一种全路网交通状态预测方法及装置 | |
CN110246332B (zh) | 基于多源数据融合的轨道交通实时客流监察方法与系统 | |
CN105512741A (zh) | 一种公交客流组合预测方法 | |
Bucak et al. | Train timetabling for a double-track urban rail transit line under dynamic passenger demand | |
Vahedian et al. | Predicting urban dispersal events: A two-stage framework through deep survival analysis on mobility data | |
CN112990518B (zh) | 一种地铁个体乘客目的站点实时预测方法及装置 | |
CN111367900B (zh) | 基于afc数据的城市轨道交通网络常态限流强度的计算方法 | |
Yin et al. | Queue intensity adaptive signal control for isolated intersection based on vehicle trajectory data | |
CN114419894B (zh) | 一种路内停车泊位设置与使用监测的方法与系统 | |
CN110837903A (zh) | 一种轨道交通短期客流预测方法、系统及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |