发明内容
本发明的目的在于提供一种能够更为方便而准确地获得轨道交通客流分配模型参数取值的技术。
为了达到上述目的,本发明的解决方案是:
一种轨道交通客流分配模型参数自动标定方法,该方法采用遗传算法,执行所述客流分配模型,采用非参数统计检验技术对所选的模型参数取值进行检验,选取通过所述检验的模型参数取值作为标定结果。
所述方法包括以下步骤:
(1)初始化所述遗传算法的参数值和所述非参数统计检验技术的显著性水平值,并生成初始父代染色体,所述染色体即所述客流分配模型的模型参数取值;转入步骤(2);
(2)选取进站数据和出站数据作为所述客流分配模型的输入,以所述步骤(1)中产生的初始父代染色体或者步骤(5)中产生的子代染色体作为所述客流分配模型的模型参数取值,由所述客流分配模型执行客流分配;转入步骤(3);
(3)基于所述步骤(2)中所述的进站数据和出站数据对应的实际客流行程时间分布数据,采用所述非参数统计检验技术评价所述客流分配模型的输出值,保留通过检验的染色体,并转入步骤(4);
(4)判断是否满足终止条件;如果满足终止条件,则终止标定;否则,转入步骤(5);
(5)对所述步骤(3)保留的染色体进行交叉和变异运算,产生子代染色体;转入所述步骤(2),并采用所述子代染色体作为所述步骤(2)中所述客流分配模型的模型参数取值。
所述步骤(1)中所述遗传算法的参数值包括最大迭代次数和最大染色体数;所述步骤(4)中的终止条件指的是迭代次数大于所述最大迭代次数或所述步骤(3)中通过检验的染色体数大于所述最大染色体数。
所述步骤(2)中进站数据和出站数据选自自动售检票系统。
所述非参数统计检验技术包括Moses变异度检验技术、Wilcoxon秩和检验技术以及Kolmogorov-Smirnov检验技术。
所述方法在所述步骤(1)之前还包括:采集轨道交通自动售检票系统的乘客进站刷卡数据和乘客出站刷卡数据,匹配同一张票卡同一次进站刷卡数据和出站刷卡数据,作为所述步骤(2)中客流分配模型的输入数据,即所述步骤(2)中的进站数据和出站数据。
所述方法在所述步骤(4)中终止标定后还包括:向外部系统提供标定后的模型参数值。
所述客流分配模型为中国城市轨道交通运营管理部门所实际使用的多路径概率分配模型。
一种实现上述轨道交通客流分配模型参数自动标定方法的装置,包括配流模型标定模块和与所述配流模型标定模块分别连接的路网数据管理模块、自动售检票数据存储模块、运营计划管理模块和网络客流分配模块;所述配流模型标定模块按照上述方法标定模型参数;所述路网数据管理模块包括轨道交通路网基础数据库,以对所述配流模型标定模块所需的基础数据进行管理、维护和更新并存储所述配流模型标定模块的标定结果;所述自动售检票数据存储模块包括所述配流模型标定模块所需的进站数据和出站数据;所述运营计划管理模块与轨道交通运营计划系统建有数据接口,以保存并为所述配流模型标定模块提供所需的轨道交通运营计划数据;所述网络客流分配模块基于网络客流分配模型建立,为所述配流模型标定模块提供客流分配计算的输出结果,并从所述配流模型标定模块获取模型参数值。
所述自动售检票数据存储模块还与轨道交通票务清分清算中心连接,以获取所述配流模型标定模块所需的进站数据和出站数据,并对历史数据进行清洗、整理和保存。
由于采用上述方案,本发明的有益效果是:本发明能够大大提高轨道交通客流分配模型的准确性。同时,本发明可以基于每日积累的城市轨道交通系统AFC数据进行模型参数的标定,避免了频繁应用人工客流调查的方法而造成大量人力、物力、财力上的耗费,并且也容易形成一个自动标定模块而整合进入城市轨道交通系统目前已有的运营管理平台之中,从而对提升我国城市轨道交通运营管理水平有所贡献。
具体实施方式
以下结合附图所示实施例对本发明作进一步的说明。
本发明提出了基于遗传算法的轨道交通客流分配模型参数标定方法和装置,本实施例中基于城市轨道交通客流分配模型和城市轨道交通AFC(Auto Fare Collection,自动售检票)系统数据对此进行阐述。
为了适应我国城市轨道交通网络化运营管理的要求,针对无障碍“一票换乘”的实际策略,我国城市轨道交通管理部门相应地成立了自动售检票系统清分清算管理中心(AFCClearing Center,简称ACC),根据AFC系统生成的大量分时起终点(Origin-Destination,简称为O-D)客流,进行轨道交通客流分布计算和统计以及票款收入的清分。上述AFC数据蕴含着大量的城市轨道交通乘客出行信息,为客流分配模型参数标定提供了另一种可能。
利用从海量AFC系统数据中分析得到的乘客实际O-D行程时间信息(即从O站刷卡进站到D站刷卡出站之间的行程时间长度)进行具体标定,并以Moses变异度检验技术、Wilcoxon秩和检验技术以及Kolmogorov-Smirnov检验技术等非参数统计检验技术对标定结果进行验证,以便最终获取较为准确合理的客流分配模型参数取值,从而提高城市轨道交通网络客流分布计算的精度。
本实施例基于遗传算法和AFC数据的城市轨道交通客流分配模型参数自动标定方法包括以下步骤:
(1)采集城市轨道交通AFC系统的起点(Origin,简称O)(即进站)刷卡数据和终点(Destination,简称D)(即出站)刷卡数据,通过对刷卡数据的匹配处理(即匹配同一张卡的同一次进站刷卡数据和出站刷卡数据)得到每个O-D记录的实际行程时间(即同一张卡同一次的进站和出站之间的行程时间长度);
(2)基于遗传算法(Genetic Algorithm,简称GA)构建参数标定方法,以O-D记录的实际行程时间数据为输入数据,对客流分配模型的参数进行具体标定,并以Moses变异度检验(Moses’distribution free rank-like test)技术、Wilcoxon秩和检验(Wilcoxon’s rank-sum test)技术以及Kolmogorov-Smirnov检验(Kolmogorov-Smirnov test)技术等非参数统计检验技术(Non-Parameter Statistical Techniques,简称NPSTs)验证标定结果。保留通过检验的模型参数取值,否则再次执行标定程序,直至满足既定的程序执行限制(即下文中的标定终止条件)。
(3)基于本发明实现的系统通过数据接口对外部系统提供准确标定了的合理模型参数值。
图1所述为该方法的流程图。
上述步骤(1)具体包括:在采集城市轨道交通AFC系统的乘客票卡进站刷卡数据和出站刷卡数据后,通过匹配比对同一张票卡(具有相同的卡号)的同一次进站刷卡时间和出站刷卡时间,经过简单的计算可得到每个O-D记录的实际行程时间长度数据,作为后续自动标定程序的输入数据和非参数统计检验的比对标准。
上述步骤(2)具体包括:
(21)初始化GA参数值及统计检验的显著性水平取值,并生成初始方案,即父代染色体值,转入步骤(22)。其中,GA参数包括种群规模、交叉及变异概率、可接受的最大染色体数、最大迭代次数等。
(22)基于AFC数据由客流分配模型执行客流分配,转入步骤(23)。该步骤中,客流分配模型参数取(21)中生成的初始父代染色体值或者步骤(25)选择保留的染色体值,这里采用的客流分配模型则为目前国内通用的多路径概率分配模型,该模型为北京、上海、广州等诸多城市轨道交通运营管理部门所实际使用,该模型取得了较好的效果。
(23)基于步骤(22)中所述的AFC数据中相应的实际客流行程时间分布数据,评价模型输出并选择参数取值。该步骤中,将应用Moses变异度检验技术、Wilcoxon秩和检验技术和Kolmogorov-Smirnov检验技术等非参数统计检验技术对基于每组参数取值的客流分配模型输出结果进行评价,判断其模型输出与实际数据是否来自相同或相等的总体,并保留通过检验的染色体(即模型参数取值),之后转入步骤(24)。
(24)进行标定终止条件判断,标定终止条件为可接受染色体数(即步骤(23)中通过检验的染色体数)超过最大的可接受染色体数或者迭代次数超过最大迭代次数。若满足终止条件,则标定终止;否则,转入步骤(25)。
(25)执行交叉与变异运算。即步骤(23)中被选择保留下来的父代染色体经交叉、变异算子的运算操作后产生子代染色体。之后,转入步骤(22),以新产生的子代染色体对应的参数取值再次执行城市轨道交通客流分配。
图2所示为步骤(2)的流程图。
本发明还提出了一种实现上述城市轨道交通客流分配模型参数自动标定方法的装置,该装置包括路网数据管理模块、AFC数据存储模块、运营计划管理模块、网络客流分配模块和配流模型标定模块,其结构示意图如图3所示。这些模块相互独立,可以根据实际情况安装在一台机器上,也可以安装在多台机器上。该装置可以作为城市轨道交通运营管理辅助决策支持系统的一个子系统整合进入城市轨道交通运营管理平台之中。
上述配流模型标定模块采用前述标定方法标定模型参数。
上述路网数据管理模块通过建立城市轨道交通路网基础数据库,对配流模型标定模块所需的各类基础数据进行管理、维护和更新并存储配流模型标定模块的执行结果,同时也可实现数字化城市轨道交通路网,对路网的各类基础信息实现统一、规范化管理。该模块采用图形化、可视化的方式对各种基础数据信息进行统一管理,基础数据包括:线路基础信息、车站基础信息、运营计划基础资料、客流信息、车站区间设施设备等现场基础设施的配置信息等。
上述AFC数据存储模块与城市轨道交通票务清分清算中心(Automated Clearing Centre,简称ACC)建有数据接口,获取ACC提供的AFC数据,并对原始的历史AFC数据进行清洗、整理与保存。表1所示为进站刷卡AFC数据的数据结构,表2所示为出站刷卡AFC数据的数据结构。
表1进站刷卡AFC数据结构
编号 |
字段名 |
字段类型 |
字段长度 |
说明 |
1 |
CARD_ID |
Int |
8 |
票卡编号 |
2 |
TICKET_TYPE |
Char |
4 |
票卡类型 |
3 |
ENTRANCE_STATION_ID |
Int |
4 |
进站编号 |
4 |
TIME_ENTRANCE |
Int |
8 |
进站时刻 |
表2出站刷卡AFC数据结构
编号 |
字段名 |
字段类型 |
字段长度 |
说明 |
1 |
CARD_ID |
Int |
8 |
票卡编号 |
2 |
TICKET_TYPE |
Char |
4 |
票卡类型 |
5 |
EXIT_STATION_ID |
Int |
4 |
出站编号 |
6 |
TIME_EXIT |
Int |
8 |
出站时刻 |
上述运营计划管理模块与城市轨道交通运营计划系统建有数据接口,用于保存配流模型标定模块所需的城市轨道交通运营计划数据,该数据包括:路网全日行车计划数据、线路间首/末班列车的衔接方案数据、换乘站运力衔接方案数据。
上述网络客流分配模块基于客流分配模型建立,为配流模型标定模块提供客流分配计算的输出结果,并从配流模型标定模块获取模型参数取值。客流分配模型是本发明的基础与前提,基于客流分配模型构建的网络客流分配模块将影响乘客出行的确定性因素和非确定性因素分成两阶段来对路径的客流分配比例进行计算和修正。以时间单位的综合出行阻抗为主确定客流在路径上的初始分配比例,再考虑路径上的换乘次数和拥挤程度对该比例进行修正;而后根据生成的全O-D客流分配路径集,基于时间窗约束对分时网络客流分布及各类客流指标进行计算。
上述配流模型标定模块是系统的核心模块,同时也是本发明成果的主要体现。该模块基于路网数据管理模块提供的城市轨道交通路网基础数据、运营计划管理模块提供的列车运营计划数据,利用AFC数据存储模块提供的海量AFC数据对网络客流分配模块中的客流分配模型参数进行具体标定,并将标定结果反馈给网络客流分配模块。
下文针对一个具体的算例对本发明进行验证。该算例的基础路网如图4所示,该路网包括4条轨道交通线路(分别为Line1、Line2、Line3和Line4)、15个轨道交通站点(每个圆圈代表一个轨道交通站点,圆圈中的数字代表该轨道交通站点的编号,即第一轨道交通站点、第二轨道交通站点到第十五轨道交通站点)、2个起点(分别为第一轨道交通站点和第二轨道交通站点)和2个终点(分别为第三轨道交通站点和第四轨道交通站点),以及4组起讫点O-D对,即第一轨道交通站点和第三轨道交通站点(表示为(1,3))、第二轨道交通站点和第三轨道交通站(表示为2,3)、第一轨道交通站点和第四轨道交通站点(1,4)以及第二轨道交通站点和第四轨道交通站点(2,4)。其中,箭头表示列车的运行方向。
列车在区间的行程时间以及在各站点的停站及换乘时间分别如表3、表4所示。表5表示出了四个O-D对的可能路径,从中可以发现,O-D对(1,3)和(2,4)分别对应4条可能路径,O-D对(1,4)和(2,3)则均只有1条可能路径。
表3列车路段行程时间(分钟)
表3中,表示路段的数字为轨道交通站点的编号。
表4列车停站及换乘时间(分钟)
车站 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
停车时间 |
0.5 |
0.5 |
0.5 |
0.5 |
0.5 |
0.5 |
0.5 |
0.5 |
0.5 |
0.5 |
0.5 |
换乘时间 |
- |
- |
- |
3.5 |
4.0 |
8.0 |
- |
- |
- |
- |
- |
表4中,表示车站的数字为轨道交通站点的编号。
表5 O-D对间可能路径列表(路径中括号内的数字表示线路编号)
表5中,表达路径的内容中,括号外的数字为其代表的轨道交通站点的编号,括号内的数字为该轨道交通站点所在线路(即Line1、Line2、Line3和Line4)的编号。
算例中,O-D对(1,3)、(1,4)、(2,3)和(2,4)的乘客出行量分别为500、600、700和800人次,且起点站乘客到达流量符合爱尔朗分布E(2,45)。此算例中客流分配模型如下:
上述公式中,为O-D对(rs)第k条路径的选择概率;为O-D对(rs)第k条路径的效用,且最短路径的效用为1;为O-D对(rs)第k条路径的综合出行成本;为O-D对(rs)最短路径的综合出行成本;为第k条路径与最短路径之间的综合出行成本差值;e为自然对数的底,取值约2.718。
上述公式中,实际上存在3个待标定的参数,分别为θ1、θ2和θ3。其中,θ1为正态分布的标准差,θ2和θ3分别表示一个比例系数和一个常数。从而,参数标定过程实际上可以表述为:寻找上述3项参数的合理取值,使得关于乘客行程时间的配流模型输出数据与实际观测数据尽可能一致。表6给出了上述三项待标定参数的定义、单位及其可能的取值范围(取值范围根据工程实际经验判断)。
表6待标定的模型参数及其可能取值范围
参数(θi) |
参数描述 |
单位 |
取值范围 |
θ1 |
正态分布标准差 |
无 |
0.10–0.50 |
θ2 |
出行阻抗差值的相对允许值 |
无 |
0.10–0.90 |
θ3 |
出行阻抗差值的绝对允许值 |
分钟 |
1–15 |
根据表6中(θ1,θ2,θ3)各参数的取值范围,可能的参数取值组合将超过48000(即40×80×15)种。显然,考虑到客流分配本身的计算量,如果直接以枚举方法来标定模型参数,找到最优的参数取值组合,将是一件非常耗时且低效的工作。为此,采用本发明提出的基于GA和非参数统计检验技术(Non-Parameter Statistics Techniques,简称为NPSTs)的参数标定方法进行参数的标定。
为说明本发明实施过程并验证标定结果的准确性,首先将前述配流模型参数θ1,θ2,θ3的取值分别预设为0.25、0.60和9,并将此组参数取值下的配流模型计算得到的乘客行程时间作为实际观测的乘客行程时间。如果在后续参数标定过程中某组参数取值下的配流模型计算结果与之接近(即通过了统计检验),则认为该组参数取值为一组可行的参数取值组合。
之后,采用本发明提出的参数标定方法执行参数标定过程,以获取关于配流模型参数θ1,θθ,θ3的可行取值组合,以及各种可行参数取值组合下计算的乘客行程时间数据。其中,GA算法的种群规模取30,变异概率取0.2,交叉概率取0.5,可接受的最大染色体数为90,最大迭代次数为100,显著性水平取0.05。
最后,在得到关于乘客行程时间的实际观测数据和模型计算数据的基础上,对本发明提出的参数标定方法的有效性进行分析与评价,即进行非参数统计检验。
通过执行参数标定程序,可以在0.05的显著性水平下得到47组满足Moses变异度检验和Wilcoxon秩和检验的参数取值组合,79组满足Kolmogorov-Smirnov检验的参数取值组合。表7中为上述满足统计检验的部分参数取值组合。
表7可行参数取值组合(部分)
表7显示编号为1到5的模型参数取值组合较好地满足三种检验,而编号为5的模型参数组合则非常好地满足了这三种检验。
经过测试案例的实际检验,当客流分配模型经过本发明方法进行参数标定后,其客流分配结果的准确程度提高20%以上。
综上所述,本发明提出的城市轨道交通客流分配模型参数自动标定方法和装置能够大大提高城市轨道交通客流分配模型的准确性;同时,本发明可以基于每日积累的城市轨道交通系统AFC数据进行模型参数的标定,避免了频繁应用人工客流调查的方法而造成大量人力、物力、财力上的耗费,并且也容易形成一个自动标定模块而整合进入城市轨道交通系统目前已有的运营管理平台之中,从而对提升我国城市轨道交通运营管理水平有所贡献。
上述的对实施例的描述是为便于该技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于这里的实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。