CN110334435A - 城市轨道交通乘客出行路径选择估计方法 - Google Patents
城市轨道交通乘客出行路径选择估计方法 Download PDFInfo
- Publication number
- CN110334435A CN110334435A CN201910594844.6A CN201910594844A CN110334435A CN 110334435 A CN110334435 A CN 110334435A CN 201910594844 A CN201910594844 A CN 201910594844A CN 110334435 A CN110334435 A CN 110334435A
- Authority
- CN
- China
- Prior art keywords
- passenger
- path
- travel time
- travel
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000000203 mixture Substances 0.000 claims abstract description 21
- 238000005315 distribution function Methods 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000007476 Maximum Likelihood Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000011217 control strategy Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000009472 formulation Methods 0.000 abstract 1
- 230000002159 abnormal effect Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- Train Traffic Observation, Control, And Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供了一种城市轨道交通乘客出行路径选择估计方法,属于城市轨道交通运行控制技术领域。该方法基于AFC数据的分时OD时间带分析,确定乘客OD对的出行时间和出行路径间的关系;根据出行时间和出行路径间的关系,构建乘客路径选择高斯混合模型;基于EM算法对乘客路径选择高斯混合模型进行求解,获取乘客OD对的路径选择概率。本发明与SP方法进行对比分析,验证了本发明提出的基于AFC数据驱动的乘客路径估计方法可真实有效的计算出每条路径的时间带和乘客选择每条路径的选择概率。本发明为制定和估计客流控制策略提供了数据基础。
Description
技术领域
本发明涉及城市轨道交通运行控制技术领域,具体涉及一种城市轨道交通乘客出行路径选择估计方法。
背景技术
随着城市轨道交通的蓬勃发展和交联互通,轨道交通的结构和规模变的越来越复杂。一对OD间的路径往往由多条路径组成。此外,网络化的地铁线路使得乘客的出行行为更为复杂。分析乘客的路径选择行为,将对交通规划、运营和出行需求管理具有重要的意义。目前,传统的路径选择研究方法,如logit模型、问卷调查等忽略了出行时间数据本身具有的价值,舒适度等因素也很难得到准确的量化。。
发明内容
本发明的目的在于提供一种基于AFC数据驱动的,为制定和估计客流控制策略提供了数据基础的城市轨道交通乘客出行路径选择估计方法,以解决上述背景技术中存在的技术问题。
为了实现上述目的,本发明采取了如下技术方案:
本发明提供的一种城市轨道交通乘客出行路径选择估计方法,该方法包括如下流程步骤:
步骤S110:基于AFC数据的分时OD时间带分析,确定乘客OD对的出行时间和出行路径间的关系;
步骤S120:根据所述出行时间和出行路径间的关系,构建乘客路径选择高斯混合模型;
步骤S130:基于EM算法对所述乘客路径选择高斯混合模型进行求解,获取乘客OD对的路径选择概率。
优选的,所述步骤S110具体包括:
步骤S111:对一个OD对的所有出行时间由大到小进行排序,构建出行时间序列;
步骤S112:确定出行时间序列的上四分位数、下四分位数和分位差;
步骤S113:根据上四分位数、下四分位数和分位差确定基于AFC数据的OD出行时间范围;
步骤S114:对基于AFC数据的OD旅行时间范围进行修正,得到OD时间带,作为按照指定路径集出行的OD旅行时间范围;
步骤S115:对于有多条路径的OD对,根据OD时间带,结合贝叶斯定理计算乘客OD出行时间和路径选择的关系。
优选的,所述步骤S112中:上四分位数为出行时间序列排名25%的数,下四分位数为出行时间序列排名75%的数,分位差为上四分位数和下四分位数的差值;
IQR=U-L
其中,U表示上四分位数,L表示下四分位数,IQR表示分位差。
优选的,所述步骤S113中:
基于AFC数据的OD出行时间范围为:
其中,表示基于AFC数据的最短OD旅行时间;表示基于AFC数据的最长OD旅行时间。
优选的,所述步骤S114中:
按照指定路径集出行的OD旅行时间范围为:
式中:表示OD时间带下限;表示OD时间带上限;表示OD对理论最短出行时间;表示OD对理论最长出行时间。
优选的,所述步骤S115中,乘客OD出行时间和路径选择的关系为:
其中,r表示OD间的有效出行路径;q表示OD间的出行乘客;P(Aqr)表示乘客q选择路径r的概率;tq表示乘客q在OD间的出行时间;P(tq)表示出行时间的概率密度分布函数;表示乘客q选择路径r出行时,耗费出行时间为tq的概率。
优选的,所述步骤S120具体包括:
用随机变量δ表示所有乘客在OD间的出行时间分布,m(δ)表示概率密度函数;第r条路径的出行时间分布为δr,概率密度函数为cr(δ),第r条路径的概率权重,也即被选择的概率为ωr。ω=(ω1,ω2,...,ωNR),ω是一个向量,表示各条路径的混合权重;
乘客路径选择高斯混合模型为:
其中,0≤ωr≤1,∑r∈Rωr=1;
乘客通过任意路径的OD出行时间的概率密度函数符合高斯分布:
优选的,所述步骤S130具体包括:
根据乘客的OD出行时间得到乘客的路径选择后验概率为π(r(q)|δ):
对所有乘客,有
用表示Δ数据集的后验概率估计,有:
用l(ω,θ;Δ)来代表似然函数,其对应的对数似然函数为:
通过EM算法对ω、θ和Δ进行计算,步骤如下:
步骤S131:初始化ω、θ,标注为ω(0)、θ(0),设ω(E)=ω(0)、θ(E)=θ(0),E表示期望;
步骤S132:给出数据Δ,ω=ω(E),θ=θ(E),根据下式求得
计算结果为r(q)的条件分布;
最大似然函数的期望值,用下式计算:
步骤S133:找到参数ω、θ的最优值分别为ω(M)、θ(M),表示最大化期望,使用ω(M)、θ(M)分别代替ω(E)、θ(E),用下列公式更新ω、θ,
步骤S134:如果time>max_time,则迭代结束,输出参数;否则,用步骤step3得到的新的参数ω、θ替代原来的ω、θ,即:
继续迭代,并进入步骤S134。
本发明有益效果:该方法基于AFC数据,采用箱线图对数据进行清洗,识别OD出行时间中的异常值;并采用大数据分析方法对乘客的出行时间进行有限混合分布的建模,来刻画OD出行时间和路径选择间的关系,构建乘客OD出行时间时间带模型;然后,通过EM算法对有限混合模型各个分量的求解,给出各条路径的时间带。本发明基于大数据,结合EM算法对高斯混合模型的参数进行估计,提高了参数估计的精度。从乘客出行时间入手,建立给定时刻各OD的时间带,分析乘客路径选择行为及估计乘客的路径选择概率,为制定和评估客流控制策略提供了数据基础。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1所述的城市轨道交通乘客出行路径选择估计方法流程示意图。
图2为本发明实施例1所述的确定乘客OD对的出行时间和出行路径间的关系方法流程图。
图3为本发明实施例2所述的城市轨道交通乘客出行路径选择估计方法流程示意图。
图4为本发明实施例2中OD出行时间异常值捕获方法箱线图。
图5为本发明实施例2中某地铁线路乘客OD出行时间直方图。
图6为本发明实施例2中某地铁线路OD出行时间箱线图。
图7为本发明实施例2中某地铁线路乘客总体OD出行时间分布和各路径上乘客出行时间分布函数。
图8为本发明实施例2中某地铁线路各路径选择概率。
具体实施方式
下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或模块,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、模块和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以具体实施例为例做进一步的解释说明,且实施例并不构成对本发明实施例的限定。
本领域普通技术人员应当理解的是,附图只是一个实施例的示意图,附图中的部件或装置并不一定是实施本发明所必须的。
实施例1
如图1所示,本发明实施例1提供一种城市轨道交通乘客出行路径选择估计方法,包括如下流程步骤:
步骤S110:基于AFC数据的分时OD时间带分析,确定乘客OD对的出行时间和出行路径间的关系;
步骤S120:根据所述出行时间和出行路径间的关系,构建乘客路径选择高斯混合模型;
步骤S130:基于EM算法对所述乘客路径选择高斯混合模型进行求解,获取乘客OD对的路径选择概率。
如图2所示,在本发明实施例1中,所述步骤S110具体包括:
步骤S111:对一个OD对的所有出行时间由大到小进行排序,构建出行时间序列;
步骤S112:确定出行时间序列的上四分位数、下四分位数和分位差;
步骤S113:根据上四分位数、下四分位数和分位差确定基于AFC数据的OD出行时间范围;
步骤S114:对基于AFC数据的OD旅行时间范围进行修正,得到OD时间带,作为按照指定路径集出行的OD旅行时间范围;
步骤S115:对于有多条路径的OD对,根据OD时间带,结合贝叶斯定理计算乘客OD出行时间和路径选择的关系。
所述步骤S112中:上四分位数为出行时间序列排名25%的数,下四分位数为出行时间序列排名75%的数,分位差为上四分位数和下四分位数的差值;
IQR=U-L
其中,U表示上四分位数,L表示下四分位数,IQR表示分位差。
所述步骤S113中:
基于AFC数据的OD出行时间范围为:
其中,表示基于AFC数据的最短OD旅行时间;表示基于AFC数据的最长OD旅行时间。
所述步骤S114中:
按照指定路径集出行的OD旅行时间范围为:
式中:表示OD时间带下限;表示OD时间带上限;表示OD对理论最短出行时间;表示OD对理论最长出行时间。
所述步骤S115中,乘客OD出行时间和路径选择的关系为:
其中,r表示OD间的有效出行路径;q表示OD间的出行乘客;P(Aqr)表示乘客q选择路径r的概率;tq表示乘客q在OD间的出行时间;P(tq)表示出行时间的概率密度分布函数;表示乘客q选择路径r出行时,耗费出行时间为tq的概率。
所述步骤S120具体包括:
用随机变量δ表示所有乘客在OD间的出行时间分布,m(δ)表示概率密度函数;第r条路径的出行时间分布为δr,概率密度函数为cr(δ),第r条路径的概率权重,也即被选择的概率为ωr。ω是一个向量,表示各条路径的混合权重;
乘客路径选择高斯混合模型为:
其中,0≤ωr≤1,∑r∈Rωr=1;
乘客通过任意路径的OD出行时间的概率密度函数符合高斯分布:
所述步骤S130具体包括:
根据乘客的OD出行时间得到乘客的路径选择后验概率为π(r(q)|δ):
对所有乘客,有
用表示Δ数据集的后验概率估计,有:
用l(ω,θ;Δ)来代表似然函数,其对应的对数似然函数为:
通过EM算法对ω、θ和Δ进行计算,步骤如下:
步骤S131:初始化ω、θ,标注为ω(0)、θ(0),设ω(E)=ω(0)、θ(E)=θ(0),E表示期望;
步骤S132:给出数据Δ,ω=ω(E),θ=θ(E),根据下式求得
计算结果为r(q)的条件分布;
最大似然函数的期望值,用下式计算:
步骤S133:找到参数ω、θ的最优值分别为ω(M)、θ(M),表示最大化期望,使用ω(M)、θ(M)分别代替ω(E)、θ(E),用下列公式更新ω、θ,
步骤S134:如果time>max_time,则迭代结束,输出参数;否则,用步骤step3得到的新的参数ω、θ替代原来的ω、θ,即:
继续迭代,并进入步骤S134。
实施例2
如图3所示,本发明实施例2提供的一种城市轨道交通乘客出行路径选择估计方法,针对北京地铁西直门站到国贸站乘客OD出行时间数据进行研究,该方法包括如下步骤:
S1:基于AFC数据的分时OD时间带分析;
S11:OD出行时间分布特征和异常值的识别。
OD出行时间中异常值的识别过程分为两部分:
S111:OD出行时间分布特征:
部分AFC数据如表1所示。地铁西直门站到国贸站乘客OD出行时间直方图如图5所示,分析图5可知,乘客的OD出行时间符合高斯分布。
表1地铁西直门站到国贸站间部分乘客出行AFC数据
S112:OD出行时间中异常值的识别:
如图4所示,通过计算箱线图的上下限可以有效地找到数据集中的异常值,利用箱线图法的计算步骤如下:
Step1:对一个OD对的所有旅行时间数据由大到小进行排序;
Step2:确定该序列的上四分位数、下四分位数和分位差;其中,上四分位数为该序列排名25%的数,下四分位数为该序列排名75%的数,分位差即为两者的差值;
IQR=U-L
式中:U表示上四分位数;L表示下四分位数;IQR表示分位差;
Step3:得到正常数据范围的上下界,以此作为基于AFC数据的OD旅行时间范围:
式中:表示基于AFC数据的最短OD旅行时间;表示基于AFC数据的最长OD旅行时间;
将基于AFC数据的OD旅行时间范围对理论结果进行修正,得到OD时间带,为按照指定路径集出行的OD旅行时间范围;
式中:表示OD时间带下限;表示OD时间带上限;表示理论OD最短旅行时间;表示理论OD最长旅行时间。
地铁西直门站到国贸站乘客OD出行时间的箱线图如图6所示。由箱线图法,确定上限为42分钟,下限为28分钟,有效的数据在区间[28,42]分钟内。通过处理后,得到2695条有效数据。
S12:分析乘客路径选择和OD出行时间的关系。
有效路径是分析乘客路径选择和OD出行时间关系的前提,本发明关于乘客在轨道交通中进行一次出行选择有效路径的条件为:
(1)不会重复登上同一条线路;
(2)不会经历四五次换乘,而是会倾向于选择换乘次数少的线路;
(3)乘客一般不会反向乘车;
(4)不会重复经过相同的地铁站。
基于上述条件,地铁西直门站和地铁国贸站这对OD选择出两条有效路径:
路径1:4号线换乘1号线:地铁西直门站——乘坐地铁4号线——西单站站内换乘——乘坐地铁1号线——地铁国贸站。途径西直门——新街口——平安里——西四——灵境胡同——西单(换乘)——天安门西——天安门东——王府井——东单——建国门——永安里——国贸,共13个地铁站,需要在西单站进行一次换乘。
路径2:2号线换乘1号线:地铁西直门站——乘坐地铁2号线外环——复兴门站站内换乘——乘坐地铁1号线——地铁国贸站。途径西直门——车公庄——阜成门——复兴门(换乘)——西单——天安门西——天安门东——王府井——东单——建国门——永安里——国贸,共12个地铁站,需要在复兴门站进行一次换乘。
对于有多条路径的OD对,可通过乘客OD出行时间分布推测出乘客路径选择的概率;后验概率最大的一条路径为乘客最可能选择的路径,由贝叶斯定理推测出乘客OD出行时间和路径选择的关系:
式中:r表示OD间的有效出行路径;q表示OD间的出行乘客;P(Aqr)表示乘客q选择路径r的概率;tq表示乘客q在OD间的出行时间;P(tq)表示出行时间的概率密度分布函数;表示乘客q选择路径r出行,耗费出行时间为tq的概率。
S2:构建乘客路径选择的高斯混合模型。
用随机变量δ表示所有乘客在OD间的出行时间分布,m(δ)表示概率密度函数;第r条路径的出行时间分布为δr,概率密度函数为cr(δ),第r条路径的概率权重,也即被选择的概率为ωr。ω是一个向量,表示各条路径的混合权重;
乘客路径选择高斯混合模型为:
其中,0≤ωr≤1,∑r∈Rωr=1;
乘客通过任意路径的OD出行时间的概率密度函数符合高斯分布:
假设每个乘客的出行都是独立的,也就是每个样本都是独立的情况下,每一条路径被选择的概率为ωr,设根据乘客的OD出行时间得到乘客的路径选择后验概率为π(r(a)|δ):
对所有乘客,有
用表示Δ数据集的后验概率估计,有:
用l(ω,θ;Δ)来代表似然函数,其对应的对数似然函数为:
通过EM算法对ω、θ和Δ进行计算,步骤如下:
步骤S131:初始化ω、θ,标注为ω(0)、θ(0),设ω(E)=ω(0)、θ(E)=θ(0),E表示期望;
步骤S132:给出数据Δ,ω=ω(E),θ=θ(E),根据下式求得
计算结果为r(q)的条件分布;
最大似然函数的期望值,用下式计算:
步骤S133:找到参数ω、θ的最优值分别为ω(M)、θ(M),表示最大化期望,使用ω(M)、θ(M)分别代替ω(E)、θ(E),用下列公式更新ω、θ,
步骤S134:如果time>max_time,则迭代结束,输出参数;否则,用步骤S133得到的新的参数ω、θ替代原来的ω、θ,即:
继续迭代,并进入步骤S134。
根据上述高斯混合模型特点,可设第一条路径r1的OD出行时间概率密度分布函数为:
概率权重为ω1;
设第二条路径r2的出行时间概率密度分布函数为:
概率权重为ω2;
则总的出行时间概率密度分布函数为:
f(t)=ω1*f(t|μ1,σ1)+ω2*f(t|μ2,σ2);
通过EM算法计算步骤对该混合模型的参数(ω,μ,σ)进行估计,分析结果如表2所示:
表2地铁西直门站至国贸站AFC出行时间的高斯混合模型参数估计结果
参数估计结果表明,路径1的出行时间均值为37分钟,路径2的出行时间均值为33分钟。有约76.8%的乘客会选择可能会选择出行时间均值较小的路径2出行,约有23.2%的乘客会选择路径1出行。地铁西直门站到地铁国贸站这对OD之间,乘客总体的出行时间的高斯混合分布函数与各路径上乘客出行时间的高斯分布函数如图7所示。
因为可以通过EM算法估计高斯混合模型的参数,所以各条路径上乘客的出行时间的概率密度分布函数可知,每条路径的概率权重也可知,则由贝叶斯概率可以计算出给定乘客的出行时间,推断乘客选择某条路径的后验概率,各条路径的后验概率计算如下:
f(r=r1|t)+f(r=r2|t)=1
西直门到国贸站各路径选择概率如图8所示,在乘客出行时间为35分钟左右时,乘客选择路径1和路径2具有相同的概率。如果通过AFC数据获取到的乘客的出行时间较短,出行时间小于33分钟时那么有较高的概率估计乘客选择的是路径2出行;如果出行时间较长,大于38分钟时,那么有较高的可能性估计乘客选择的是路径1出行。
最后,为了验证上述利用EM算法进行高斯混合模型的参数结果是否准确,本发明通过实地调研的方法,采集了路径1和路径2在地铁西直门站到地铁国贸站这对OD间的出行时间数据。乘客实际选择的路径是已知的,以刷卡进站的时间为计时开始时刻,刷卡出站的时间为计时结束时刻,二者之差即为出行时间。部分记录数据如表3所示,各条路径的实际出行时间均值和方差如表4所示。
表3地铁西直门站至国贸站部分记录数据
表4各条路径的实际出行时间均值和方差
EM算法参数估计的模型参数值μ1为37.04,μ2为33.54,误差在1%以内;但参数值σ1为9.24,σ2为2.52,误差很大,这可能是因为实地调研的数据过少,没有广泛涉及各个群体。为了验证路径选择概率参数ω的估计值,本发明实施例采用SP调查法,通过在线问卷填写的方式,调查乘客的路径选择意向。路径选择概率问卷调查结果中有21%的乘客选择路径1出行,有79%的乘客选择路径2出行。
综上所述,本发明实施例提出的方法基于AFC数据,采用箱线图对数据进行清洗,识别OD出行时间中的异常值;并采用大数据分析方法对乘客的出行时间进行有限混合分布的建模,来刻画OD出行时间和路径选择间的关系,构建乘客OD出行时间时间带模型;然后,通过EM算法对有限混合模型各个分量的求解,给出各条路径的时间带。本发明基于大数据,结合EM算法对高斯混合模型的参数进行估计,提高了参数估计的精度。从乘客出行时间入手,建立给定时刻各OD的时间带,分析乘客路径选择行为及估计乘客的路径选择概率,为制定和估计客流控制策略提供了数据基础。
与SP方法进行对比分析,验证了本发明提出的基于AFC数据驱动的乘客路径估计方法可真实有效的计算出每条路径的时间带和乘客选择每条路径的选择概率。本发明为制定和估计客流控制策略提供了数据基础。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (8)
1.一种城市轨道交通乘客出行路径选择估计方法,其特征在于,包括如下流程步骤:
步骤S110:基于AFC数据的分时OD时间带分析,确定乘客OD对的出行时间和出行路径间的关系;
步骤S120:根据所述出行时间和出行路径间的关系,构建乘客路径选择高斯混合模型;
步骤S130:基于EM算法对所述乘客路径选择高斯混合模型进行求解,获取乘客OD对的路径选择概率。
2.根据权利要求1所述的城市轨道交通乘客出行路径选择估计方法,其特征在于,所述步骤S110具体包括:
步骤S111:对一个OD对的所有出行时间由大到小进行排序,构建出行时间序列;
步骤S112:确定出行时间序列的上四分位数、下四分位数和分位差;
步骤S113:根据上四分位数、下四分位数和分位差确定基于AFC数据的OD出行时间范围;
步骤S114:对基于AFC数据的OD旅行时间范围进行修正,得到OD时间带,作为按照指定路径集出行的OD旅行时间范围;
步骤S115:对于有多条路径的OD对,根据OD时间带,结合贝叶斯定理计算乘客OD出行时间和路径选择的关系。
3.根据权利要求2所述的城市轨道交通乘客出行路径选择估计方法,其特征在于,所述步骤S112中:上四分位数为出行时间序列排名25%的数,下四分位数为出行时间序列排名75%的数,分位差为上四分位数和下四分位数的差值:IQR=U-L
其中,U表示上四分位数,L表示下四分位数,IQR表示分位差。
4.根据权利要求3所述的城市轨道交通乘客出行路径选择估计方法,其特征在于,所述步骤S113中:
基于AFC数据的OD出行时间范围为:
其中,表示基于AFC数据的最短OD旅行时间;表示基于AFC数据的最长OD旅行时间。
5.根据权利要求4所述的城市轨道交通乘客出行路径选择估计方法,其特征在于,所述步骤S114中:
按照指定路径集出行的OD旅行时间范围为:
式中:表示OD时间带下限;表示OD时间带上限;表示OD对理论最短出行时间;表示OD对理论最长出行时间。
6.根据权利要求5所述的城市轨道交通乘客出行路径选择估计方法,其特征在于,所述步骤S115中,乘客OD出行时间和路径选择的关系为:
其中,r表示OD间的有效出行路径;q表示OD间的出行乘客;P(Aqr)表示乘客q选择路径r的概率;tq表示乘客q在OD间的出行时间;P(tq)表示出行时间的概率密度分布函数;表示乘客q选择路径r出行时,耗费出行时间为tq的概率。
7.根据权利要求6所述的城市轨道交通乘客出行路径选择估计方法,其特征在于,所述步骤S120具体包括:
用随机变量δ表示所有乘客在OD间的出行时间分布,m(δ)表示概率密度函数;第r条路径的出行时间分布为δr,概率密度函数为cr(δ),第r条路径的概率权重,也即被选择的概率为ωr。ω是一个向量,表示各条路径的混合权重;
乘客路径选择高斯混合模型为:
其中,0≤ωr≤1,∑r∈Rωr=1;
乘客通过任意路径的OD出行时间的概率密度函数符合高斯分布:
8.根据权利要求7所述的城市轨道交通乘客出行路径选择估计方法,其特征在于,所述步骤S130具体包括:
根据乘客的OD出行时间得到乘客的路径选择后验概率为π(r(q)|δ):
对所有乘客,有
用表示Δ数据集的后验概率估计,有:
用l(ω,θ;Δ)来代表似然函数,其对应的对数似然函数为:
通过EM算法对ω、θ和Δ进行计算,步骤如下:
步骤S131:初始化ω、θ,标注为ω(0)、θ(0),设ω(E)=ω(0)、θ(E)=θ(0),E表示期望;
步骤S132:给出数据Δ,ω=ω(E),θ=θ(E),根据下式求得
计算结果为r(q)的条件分布;
最大似然函数的期望值,用下式计算:
步骤S133:找到参数ω、θ的最优值分别为ω(M)、θ(M),表示最大化期望,使用ω(M)、θ(M)分别代替ω(E)、θ(E),用下列公式更新ω、θ,
步骤S134:如果time>max_time,则迭代结束,输出参数;否则,用步骤S133得到的新的参数ω、θ替代原来的ω、θ,即:
继续迭代,并进入步骤S134。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910594844.6A CN110334435B (zh) | 2019-07-03 | 2019-07-03 | 城市轨道交通乘客出行路径选择估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910594844.6A CN110334435B (zh) | 2019-07-03 | 2019-07-03 | 城市轨道交通乘客出行路径选择估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110334435A true CN110334435A (zh) | 2019-10-15 |
CN110334435B CN110334435B (zh) | 2021-06-15 |
Family
ID=68143107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910594844.6A Active CN110334435B (zh) | 2019-07-03 | 2019-07-03 | 城市轨道交通乘客出行路径选择估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110334435B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112633592A (zh) * | 2020-12-30 | 2021-04-09 | 鱼快创领智能科技(南京)有限公司 | 基于机器学习聚类算法的车辆常跑路线计算方法及系统 |
CN112966218A (zh) * | 2021-02-26 | 2021-06-15 | 佳都新太科技股份有限公司 | 一种车厢载客人数实时计算方法及装置 |
CN116257797A (zh) * | 2022-12-08 | 2023-06-13 | 江苏中路交通发展有限公司 | 一种基于高斯混合模型的机动车单次出行轨迹辨识方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090166035A1 (en) * | 2007-12-26 | 2009-07-02 | Almaguer James S | Borehole Imaging and Orientation of Downhole Tools |
CN102169524A (zh) * | 2010-02-26 | 2011-08-31 | 同济大学 | 城市轨道交通网络客流分布的分阶段多路径模型算法 |
CN105046350A (zh) * | 2015-06-30 | 2015-11-11 | 东南大学 | 基于afc数据的公交客流od实时估计方法 |
CN107301492A (zh) * | 2017-05-16 | 2017-10-27 | 华南理工大学 | 一种基于高斯混合模型的地铁票务清分方法 |
CN108665191A (zh) * | 2018-06-05 | 2018-10-16 | 北方工业大学 | 基于聚集效应的地铁站外关联区域计算方法 |
CN109308546A (zh) * | 2018-08-31 | 2019-02-05 | 江苏智通交通科技有限公司 | 乘客公交出行下车站点预测方法及系统 |
-
2019
- 2019-07-03 CN CN201910594844.6A patent/CN110334435B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090166035A1 (en) * | 2007-12-26 | 2009-07-02 | Almaguer James S | Borehole Imaging and Orientation of Downhole Tools |
CN102169524A (zh) * | 2010-02-26 | 2011-08-31 | 同济大学 | 城市轨道交通网络客流分布的分阶段多路径模型算法 |
CN105046350A (zh) * | 2015-06-30 | 2015-11-11 | 东南大学 | 基于afc数据的公交客流od实时估计方法 |
CN107301492A (zh) * | 2017-05-16 | 2017-10-27 | 华南理工大学 | 一种基于高斯混合模型的地铁票务清分方法 |
CN108665191A (zh) * | 2018-06-05 | 2018-10-16 | 北方工业大学 | 基于聚集效应的地铁站外关联区域计算方法 |
CN109308546A (zh) * | 2018-08-31 | 2019-02-05 | 江苏智通交通科技有限公司 | 乘客公交出行下车站点预测方法及系统 |
Non-Patent Citations (3)
Title |
---|
XINYUE XU: "Learning the Route Choice Behavior of Subway Passengers from AFC Data", 《EXPERT SYSTEMS WITH APPLICATIONS》 * |
吴丽娟: "基于AFC数据的城市轨道交通网络乘客出行路径匹配及突发事件影响研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 * |
陈蕴清: "城市轨道交通自动数据源下乘客路径选择行为的研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112633592A (zh) * | 2020-12-30 | 2021-04-09 | 鱼快创领智能科技(南京)有限公司 | 基于机器学习聚类算法的车辆常跑路线计算方法及系统 |
CN112633592B (zh) * | 2020-12-30 | 2023-07-18 | 鱼快创领智能科技(南京)有限公司 | 基于机器学习聚类算法的车辆常跑路线计算方法及系统 |
CN112966218A (zh) * | 2021-02-26 | 2021-06-15 | 佳都新太科技股份有限公司 | 一种车厢载客人数实时计算方法及装置 |
CN116257797A (zh) * | 2022-12-08 | 2023-06-13 | 江苏中路交通发展有限公司 | 一种基于高斯混合模型的机动车单次出行轨迹辨识方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110334435B (zh) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110334435B (zh) | 城市轨道交通乘客出行路径选择估计方法 | |
Ning et al. | Evaluating efficient performance estimators of neural architectures | |
CN108009972B (zh) | 一种基于多源数据校核的多方式出行o-d需求估计方法 | |
Li | Bayesian inference for origin-destination matrices of transport networks using the EM algorithm | |
CN101477172B (zh) | 一种基于神经网络的模拟电路故障诊断方法 | |
CN111582750B (zh) | 一种轨道交通反向乘客识别及乘车班次确定方法及系统 | |
González-Manteiga et al. | Bootstrap in functional linear regression | |
Golob et al. | A structural model of temporal change in multi-modal travel demand | |
CN103941270B (zh) | 一种多系统融合定位的方法及装置 | |
CN104021430A (zh) | 一种城市轨道交通站点客流不确定性分析方法 | |
CN110879981A (zh) | 人脸关键点质量评估方法、装置、计算机设备及存储介质 | |
CN111144462A (zh) | 一种雷达信号的未知个体识别方法及装置 | |
Van Oirbeek et al. | Assessing the predictive ability of a multilevel binary regression model | |
Jiang et al. | A battery capacity estimation method based on the equivalent circuit model and quantile regression using vehicle real-world operation data | |
CN106569981A (zh) | 一种适用于大规模数据集的统计参量确定方法及系统 | |
CN108459991A (zh) | 一种获得设备可靠性数据的方法 | |
Polyzos et al. | Determining the changes in commuting after the Ionian Motorway’s construction | |
CN112131752A (zh) | 一种基于拟准检定的超强崩溃污染率抗差估计算法 | |
CN112200370B (zh) | 一种针对不同车型的城市间货运碳排放强度估算方法 | |
CN105404973A (zh) | 输变电设备状态预测方法和系统 | |
CN115248993A (zh) | 一种仿真场景模型真实性检测方法、装置及存储介质 | |
CN112749998A (zh) | 收入信息输出方法、装置、电子设备及计算机存储介质 | |
Severn et al. | Assessing binary measurement systems: a cost-effective alternative to complete verification | |
CN114925515B (zh) | 一种面向新能源电动汽车的电池健康诊断方法及装置、寿命预测方法 | |
Nierwinski | Reliability sampling methodology using simulation and re-sampling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |