CN113095986B - 公共交通满载率计算方法、系统及计算机可读存储介质 - Google Patents
公共交通满载率计算方法、系统及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113095986B CN113095986B CN202110380551.5A CN202110380551A CN113095986B CN 113095986 B CN113095986 B CN 113095986B CN 202110380551 A CN202110380551 A CN 202110380551A CN 113095986 B CN113095986 B CN 113095986B
- Authority
- CN
- China
- Prior art keywords
- passenger
- data
- passengers
- transfer
- travel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 238000012546 transfer Methods 0.000 claims abstract description 120
- 238000004364 calculation method Methods 0.000 claims abstract description 26
- 239000000203 mixture Substances 0.000 claims description 29
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims 2
- 230000015654 memory Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 21
- 238000005516 engineering process Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000005303 weighing Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 206010011409 Cross infection Diseases 0.000 description 1
- 206010029803 Nosocomial infection Diseases 0.000 description 1
- 241000135164 Timea Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Train Traffic Observation, Control, And Security (AREA)
Abstract
本发明提供了公共交通满载率计算方法、系统及计算机可读存储介质,其中公共交通满载率计算方法,包括以下步骤:S1、获取乘客行程数据以及运行信息,将乘客分为直达乘客和换乘乘客;S2、根据所述乘客行程数据匹配所述外部特征得到数据集RN*d;S3、根据所述数据集RN*d计算直达乘客实际上车和下车的时间;S4、根据所述数据集RN*d计算换乘乘客在不同站台上的实际上车和下车的时间;S5、根据公共交通运行时间和额定总载客量计算在设定线路上不同时间段的满载率。本公共交通满载率计算方法、系统及计算机可读存储介质,能够客观准确的计算公共交通的满载率。
Description
技术领域
本发明涉及满载率计算技术领域,尤其涉及公共交通满载率计算方法、系统及计算机可读存储介质。
背景技术
近年来,随着人口的增长和我国城市化进程的加快,公共交通中的城市轨道交通如地铁因其速度快,高效率,承载客流数量大,准时等特点成为许多人出行的首选,成为缓解城市扩张过程中问题的强有力工具。特别地,由于客流具有时间、空间上的分布特性。在早高峰阶段地铁站台上的客流会由于拥挤产生留乘现象,从而导致乘客无法上车,行程效率低、客运风险大灯问题。因此,准确地估算列车满载率,可以为地铁乘客出行规划的移动应用、地铁运营商监控系统、线路建议和城市管理员应急管理系统提供数据支撑,特别是在防疫期间,在满足乘客出行需求的同时,可以严格控制列车满载率的上限,最大程度地防止交叉感染。
近年来,随着轨道交通系统信息化水平提高,为获得地铁列车满载率,AFC、视频、称重等自动客流检测技术在地铁列车上陆续投入使用,经调研分析,现有列车客流检测技术及其缺点如下:
(1)智能视频和称重分析技术:地铁列车行程过程中产升晃动影响图像识别精度,同时视频监测范围重复或存在盲区;利用称重和乘客AFC进出站刷卡数据,通过排除没有上车乘客的情况;一方面安装维护成本较高,另一方面基于某些假定未考虑实际站台上的留乘现象,导致其不适合应用于整列车全局范围的客流估计。
(2)AFC客流采集技术:利用乘客AFC进出站刷卡或二维码等数据,通过清分模型得到15min(最小时间粒度,还可以是1小时等)断面客流量,属于全样数据,能够对采样数据起到补充作用;但是乘客行程中选择的列车和路线是未知的,无法获得直观的列车满载率,需要人工标定模型参数进行统计处理得到不够精细的列车满载率。
发明内容
有鉴于此,本发明要解决的技术问题是提供公共交通满载率计算方法、系统及计算机可读存储介质,能够客观准确的计算公共交通的满载率。
本发明的技术方案是这样实现的:
一种公共交通满载率计算方法,包括以下步骤:
S1、获取公共交通设定线路上站点所有进出站的乘客行程数据以及在所述设定线路上的运行信息,根据乘客进出站为行程将乘客分为直达乘客和换乘乘客;
S2、获取与乘客出行时间相匹配的外部特征,根据所述乘客行程数据匹配所述外部特征得到数据集RN*d,N代表行程数据的个数,d代表的是行程数据中包含的特征维度,如进出站时间,天气特征,短时客流特征等,;
S3、获取相同OD的直达乘客行程数据,获取公共交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间,根据所述数据集RN*d计算直达乘客实际上车和下车的时间;
S4、获取相同OD的换乘乘客行程数据和公共交通设定线路上各换乘站点的换乘平均耗时,根据所述数据集RN*d计算换乘乘客在不同站台上的实际上车和下车的时间;
S5、获取公共交通上的额定总载客量,根据公共交通运行时间和额定总载客量计算在设定线路上不同时间段的满载率。
优选的,所述外部特征包括天气,节假日数据。
优选的,根据所述数据集RN*d,N代表行程数据的个数,d代表的是行程数据中包含的特征维度,如进出站时间,天气特征,短时客流特征等,计算直达乘客实际上车和下车的时间具体包括:
获取相同OD的直达乘客行程数据,选择用时最短的乘客行程数据作为观察点Y,计算每个行程数据与观察点的欧式距离,得到距离矢量数据集XN={x1,x2,…,xn};
为数据集XN构建高斯混合模型,XN包含N个不同的距离矢量,用P(x|θ)来表示不同班次的行程联合概率密度函数,θ代表模型密度函数的参数,包含均值与方差,通过最大化对数似然函数和EM算法来求解GMM的初始参数,GMM的混合模型均值αj为βj方差为s2,M代表不同班次的种类,直达客流不同班次有留乘与乘坐第一班次的混合比例,将混合比例πj的初始值设置为1/2,以及参数αj和βj的初始值和
在期望步骤中,给定在第n次迭代中估计的参数θn,对于N个不同的行程矢量数据集XN,设置XN对应的隐含数据Z={z1,z2,…,zn};(x,z)完全数据,样本的模型参数θ,则行程矢量数据xi的概率为P(x|θ),完全数据(xi,zi)的似然函数为P(xi|zi),计算XN中每个行程数据隶属权重P(zi=j|xi,θn),为第i个距离矢量对应的权重,其中πj是一类乘客j的混合比例权重;
计算XN的行程数据的权重之后,计算潜在隐含变量Z={zi}的对数似然函数的期望值;对数似然函数Q(θ|θn,X)的期望被最大化,以获得高斯混合模型中参数θn+1的新估计:
θn+1=argmaxQ(θ|θn,x)
重复进行上述两个步骤,直到满足停止标准(θn+1-θn)<Threshold,Q(θ|θn,X)隐含变量分布的条件概率期望的计算如下:
使用拉格朗日乘法器对参数均值αj和方差βj进行优化,给出对混合比例变量πj的约束,拉格朗日乘数λ的无约束函数写为:对于每个πj和λ取一阶导数并将它们设置为零;
获得GMM模型参数均值αj和方差βj对应局部最优的行程数据ID并匹配作为K-means的初始不同班次行程聚类中心,对相同OD的行程数据分为留乘与乘坐第一班行程;
获取轨道交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间匹配直达乘客实际上车和下车的时间。
优选的,所述获取相同OD的换乘乘客行程数据包括:
获取相同OD间的K短路径,K代表路径的数量,计算每条K短路径的理论出行总时长,根据换乘行程的耗时匹配得出乘客实际经过的路线和换乘次数,将乘客分为单次换乘乘客和多次换乘乘客。
优选的,根据所述数据集RN*d,N代表行程数据的个数,d代表的是行程数据中包含的特征维度,如进出站时间,天气特征,短时客流特征等,计算换乘乘客在不同站台上的实际上车和下车的时间包括:
获取相同OD且出行路线相同的单次换乘乘客数据;选择用时最短的乘客行程数据作为观察点Y,计算每个行程数据与观察点的欧式距离,并形成距离矢量集XN,为数据集XN构建高斯混合模型,通过最大化对数似然函数和EM算法来求解单次换乘GMM的初始参数,由于GMM的混合模型均值为方差为s2,考虑到单次换乘行程主要在不同站点分别留乘与不进行留乘,将M代表不同类别初始化为3,将混合比例πj的初始值设置为1/3,以及参数αj和βj的初始值和
获得单次换乘GMM模型参数局部最优的行程数据ID作为K-means的初始聚类中心,对相同单次换乘OD的行程数据进行聚类;获取轨道交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间匹配单次换乘乘客在不同站台上的实际上车和下车的时间。
优选的,根据所述数据集RN*d计算换乘乘客在不同站台上的实际上车和下车的时间包括:
获取相同OD且出行路线相同的多次换乘乘客,加入到外部特征的高维行程数据RN *(d+n),n是行程中换乘的次数,加入换乘站短时客流量的特征,d代表的是行程数据中包含的特征维度,如进出站时间,天气特征,短时客流特征等;通过分配观察点来识别数据空间中的簇数,为数据集XN构建高斯混合模型,通过最大化对数似然函数和EM算法来求解多次换乘GMM的初始参数,由于GMM的混合模型均值为方差为s2,考虑到多次换乘行程会在不同站点分别留乘与不进行留乘,将M代表不同类别初始化大于等于3,将混合比例πj的初始值设置为1/m,以及参数αj和βj的初始值和并通过BIC信息准则判断乘客在相同进出站多次换乘的不同类别数。
上述的式子其中是最大对数似然值,其中M实际含义是不同班次的数量和高斯模型的数量,N是模型中使用的观测数,通过对构建的高斯混合模型正太分布的数量M进行验证,然后选择BIC值最小的混合模型中M高斯分布个数,最佳拟合实际多次换乘行程集中实际不同班次的类别数,BIC模型选择标准在模型拟合不足与过度拟合之间以及模型的偏差与方差之间进行权衡。
获得多次换乘GMM模型参数局部最优的行程数据ID并匹配作为K-means的初始聚类中心,获取轨道交通设定线路上的运行信息并根据多次换乘乘客的类别和刷卡进出站时间匹配多次换乘乘客在不同站台上的实际上车和下车的时间。
本发明还提出了一种公共交通满载率计算系统,包括:
获取模块,用于获取公共交通设定线路上站点所有进出站的乘客行程数据以及在所述设定线路上的运行信息,根据乘客进出站为行程将乘客分为直达乘客和换乘乘客;
匹配模块,用于获取与乘客出行时间相匹配的外部特征,根据所述乘客行程数据匹配所述外部特征得到数据集RN*d,N代表行程数据的格式,d是行程中包含的数据维度,如行程包含进出站点、进出时间等;
第一计算模块,用于获取相同OD的直达乘客行程数据,OD分别代表出发站点与目的站点,获取公共交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间,根据所述数据集RN*d计算直达乘客实际上车和下车的时间,N代表行程数据的个数,d代表的是行程数据中包含的特征维度,如进出站时间,天气特征,短时客流特征等;;
第二计算模块,用于获取相同OD的换乘乘客行程数据和公共交通设定线路上各换乘站点的换乘平均耗时,根据所述数据集RN*d计算换乘乘客在不同站台上的实际上车和下车的时间;
满载率计算模块,用于获取公共交通上的额定总载客量,根据公共交通运行时间和额定总载客量计算在设定线路上不同时间段的满载率。
优选的,所述外部特征包括天气,节假日数据。
优选的,所述获取相同OD的换乘乘客行程数据包括:
获取相同OD间的K短路径,计算每条K短路径的理论出行总时长,根据换乘行程的耗时匹配得出乘客实际经过的路线和换乘次数,将乘客分为单次换乘乘客和多次换乘乘客。
本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现上述任一项所述的公共交通满载率计算方法。
本发明提出的公共交通满载率计算方法、系统及计算机可读存储介质,通过获取公共交通设定线路上站点所有进出站的乘客行程数据以及在所述设定线路上的运行信息,根据乘客进出站为行程将乘客分为直达乘客和换乘乘客;并获取与乘客出行时间相匹配的外部特征,可以将乘客行程数据与外部特征数据结合进行满载率的计算,能够客观准确的计算公共交通的满载率。
附图说明
图1为本发明实施例提出的公共交通满载率计算方法流程图;
图2为本发明又一实施例提出的公共交通满载率计算方法流程图;
图3是三种算法列车满载率估计误差人数结果图;
图4为本发明实施例提出的公共交通满载率预测系统的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提出了一种公共交通满载率计算方法,包括以下步骤:
一种公共交通满载率计算方法,包括以下步骤:
S101、获取公共交通设定线路上站点所有进出站的乘客行程数据以及在所述设定线路上的运行信息,根据乘客进出站为行程将乘客分为直达乘客和换乘乘客;
S102、获取与乘客出行时间相匹配的外部特征,根据所述乘客行程数据匹配所述外部特征得到数据集RN*d;
S103、获取相同OD的直达乘客行程数据,获取公共交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间,根据所述数据集RN*d计算直达乘客实际上车和下车的时间;
S104、获取相同OD的换乘乘客行程数据和公共交通设定线路上各换乘站点的换乘平均耗时,根据所述数据集RN*d计算换乘乘客在不同站台上的实际上车和下车的时间;
S105、获取公共交通上的额定总载客量,根据公共交通运行时间和额定总载客量计算在设定线路上不同时间段的满载率。
可见,本发明提出的公共交通满载率计算方法,通过获取公共交通设定线路上站点所有进出站的乘客行程数据以及在所述设定线路上的运行信息,根据乘客进出站为行程将乘客分为直达乘客和换乘乘客;并获取与乘客出行时间相匹配的外部特征,可以将乘客行程数据与外部特征数据结合进行满载率的计算,能够客观准确的计算公共交通的满载率。
本发明提出的公共交通满载率计算方法,可应用于多种公共交通如公交或轨道交通。下面以轨道交通为例,对本发明的技术方案进行进一步阐述。
如图2所示,,本发明实施例还提出了用于城市轨道交通列车满载率的计算方式,用于列车经过线路上不同站点的满载率估算,如获取以某号线列车经过不同站点的时间做为时间点,计算不同站点上列车满载率。
具体包括以下实施步骤:
步骤一、以某号线某一列车经过线路上所有站点的时间T={t1,t2,…,tn},记录下当前日期下某一列车经过不同站点的时间。获取轨道交通设定线路上站点所有进出站的乘客行程数据,获取与乘客出行时间相匹配的天气,节假日数据,基于轨道交通设定线路上的乘客行程数据匹配以上外部特征得到数据集RN*d,N代表行程数据的个数,d代表的是行程数据中包含的特征维度,如进出站时间,天气特征,短时客流特征等;;根据乘客进出站为行程的类别进行分类,直达乘客,换乘乘客。
步骤二、获取长周期一个月内相同OD的直达乘客行程数据,选择相同OD耗时用时最短的乘客行程数据作为观察点Y,计算每个行程数据与观察点的欧式距离,得到数据集XN={x1,x2,…,xn},XN包含N个不同的距离矢量;
出现乘坐来到的第一班车与留乘选择其他班次且距离值均不为负,为数据集XN构建高斯混合模型,用P(x|θ)来表示不同班次的行程联合概率密度函数,θ代表模型密度函数的参数,包含均值与方差,通过最大化对数似然函数和EM算法来求解GMM的初始参数,由于GMM的混合模型均值为方差为s2,M代表不同班次的种类,直达客流不同班次有留乘与乘坐第一班次的混合比例,将混合比例πj的初始值设置为1/2,以及参数αj和βj的初始任和
EM算法分两步进行迭代,即期望和最大化,直到满足停止标准为止。在期望步骤中,给定在第n次迭代中估计的参数θn,对于N个不同的行程矢量数据集XN,设置XN对应的隐含数据Z={z1,z2,…,zn};(x,z)完全数据,样本的模型参数θ,则行程矢量数据xi的概率为P(x|θ),完全数据(xi,zi)的似然函数为P(xi|zi),计算XN中每个行程数据隶属权重P(zi=j|xi,θn),为第i个距离矢量对应的权重,其中πj是一类乘客j的混合比例权重,它是在上一次迭代中估算的。
在计算了XN的行程数据的权重之后,计算潜在随机隐含变量Z={zi}的对数似然函数的期望值。在最大化步骤中,对数似然函数Q(θ|θn,X)的期望被最大化,以获得高斯混合模型中参数θn+1的新估计:
θn+1=argmaxQ(θ|θn,X)
这两个步骤重复进行,直到满足停止标准(θn+1-θn)<Threshold,在此阈值已预定义。Q(θ|θn,X)隐含变量分布的条件概率期望的计算如下:
由于参数均值αj和方差βj具有相同的符号,因此可以独立地最大化它们,可以使用拉格朗日乘法器对其进行优化。给出了对混合变量πj的约束。拉格朗日乘数λ的无约束函数写为:对于每个混合变量πj和乘数λ取一阶导数并将它们设置为零。在简化导数方程之后,找到了计算πj的公式:为了通过优化第二项来计算参数θj=(αj,βj),针对αj取第二项的一阶导数并将其设置为零。如下:通过等式αj的估计值,可以估计βj。从该方法获得的估计参数αj和βj是局部最优的。
获得GMM模型参数局部最优的行程数据ID并匹配作为K-means的初始聚类中心,对相同OD的行程数据分为留乘与乘坐第一班行程。
获取轨道交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间匹配直达乘客实际上车和下车的时间。
步骤三、获取长周期一个月内相同OD的换乘乘客行程数据和轨道交通设定线路上各换乘站点的换乘平均耗时,考虑到实际乘客无论是换乘路径的选择还是在站台上选择的班次都复杂化,获取相同OD间的K短路径,K代表出行路径的个数,计算每条K短路径的理论出行总时长,根据换乘行程的耗时匹配得出乘客实际经过的路线和换乘次数。
获取相同OD且出行路线相同的单次换乘乘客。考虑不同行程中换乘站点的短时进出站客流的影响,并加入到其它外部特征的高维行程数据RN*(d+2),N代表行程数据的个数,(d+2)代表的是行程数据中包含的特征维度,如进出站时间,天气特征,短时客流特征和换乘站短时客流量等;;选择用时最短的乘客行程数据作为观察点Y,计算每个行程数据与观察点的欧式距离,并形成距离矢量集XN,为数据集XN构建高斯混合模型,考虑到换乘乘客在进站或者换乘站都可以留乘,将M代表不同类别初始化为3,为数据集XN构建高斯混合模型,通过最大化对数似然函数和EM算法来求解单次换乘GMM的初始参数,由于GMM的混合模型均值为方差为s2将混合比例πj的初始值设置为1/3,以及参数αj和βj的初始值和
获得单次换乘GMM模型参数局部最优的行程数据ID作为K-means的初始聚类中心,对相同单次换乘OD的行程数据进行聚类。获取轨道交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间匹配单次换乘乘客在不同站台上的实际上车和下车的时间。
获取相同OD且出行路线相同的多次换乘乘客。考虑不同行程中换乘站点的短时进出站客流的影响,并加入到其它外部特征的高维行程数据RN*(d+n),N代表行程数据的个数,n是行程中换乘的次数,加入换乘站短时客流量的特征,d代表的是行程数据中包含的特征维度,如进出站时间,天气特征,短时客流特征等;;通过分配观察点来识别数据空间中的簇数,考虑到多次换乘乘客在进站或者换乘站都可以留乘,为数据集XN构建高斯混合模型,通过最大化对数似然函数和EM算法来求解多次换乘GMM的初始参数,由于GMM的混合模型均值为考虑到多次换乘行程会在不同站点分别留乘与不进行留乘,将M代表不同类别初始化大于等于3,方差为s2将混合比例πj的初始值设置为1/m,以及参数αj和βj的初始值和并通过BIC信息准则判断乘客在相同进出站多次换乘的不同类别数。
上述的式子其中是最大对数似然值,其中M实际含义是不同班次的数量和高斯模型的数量,N是模型中使用的观测数,通过对构建的高斯混合模型正太分布的数量M进行验证,然后选择BIC值最小的混合模型中M高斯分布个数,最佳拟合实际多次换乘行程集中实际不同班次的类别数,BIC模型选择标准在模型拟合不足与过度拟合之间以及模型的偏差与方差之间进行权衡。
获得多次换乘GMM模型参数局部最优的行程数据ID并匹配作为K-means的初始聚类中心,获取轨道交通设定线路上的运行信息并根据多次换乘乘客的类别和刷卡进出站时间匹配多次换乘乘客在不同站台上的实际上车和下车的时间。
步骤四、获取轨道交通工具在所述线路上的车次和到达每个站点的发车时间、到站时刻;
获取轨道交通工具上的总座位数和额定总载客量,并基于所述载客量、总座位数和所述额定总载客量计算轨道交通列车满载率p;
根据设定该线路各车次到达时间与乘客实际上车时间相符合的乘客人数叠加,计算轨道交通所述设定线路各时间点车次的满载率。
为了更清晰的阐述本发明的目的、技术方案和优点。本实施例通过实验与真实采集数据对比的方式进一步说明本发明实施的列车满载率估算方法的技术效果。
实验中参数的默认值设置如下。考虑短时间段同时进出站客流对乘客行程的影响,并将每个时间间隔设置为10分钟。在客流班次聚类算法模块中,就训练而言,使用的最大迭代次数为300。本实例采用作为比较标准的两个对比方法,求平均列车满载率和传统K-means,在平均列车满载率中,通过进出站AFC刷卡数据和半小时为一个时间,计算在地铁系统中运行的列车平均满载率;通过K均值进行传统聚类:无需额外考虑其他因素,即可对具有相同OD的乘客进行相似性聚类,计算实际的乘客列车。图3中本发明实施例的列车满载率挖掘方法简称为Our Method。
如图4所示,本发明实施例还提出了一种公共交通满载率计算系统,包括:
获取模块1,用于获取公共交通设定线路上站点所有进出站的乘客行程数据以及在所述设定线路上的运行信息,根据乘客进出站为行程将乘客分为直达乘客和换乘乘客;
匹配模块2,用于获取与乘客出行时间相匹配的外部特征,根据所述乘客行程数据匹配所述外部特征得到数据集RN*d;
第一计算模块3,用于获取相同OD的直达乘客行程数据,获取公共交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间,根据所述数据集RN*d计算直达乘客实际上车和下车的时间;
第二计算模块4,用于获取相同OD的换乘乘客行程数据和公共交通设定线路上各换乘站点的换乘平均耗时,根据所述数据集RN*d计算换乘乘客在不同站台上的实际上车和下车的时间;
满载率计算模块5,用于获取公共交通上的额定总载客量,根据公共交通运行时间和额定总载客量计算在设定线路上不同时间段的满载率。
在本发明实施例中,外部特征包括天气,节假日数据。
在本发明实施例中,所述获取相同OD的换乘乘客行程数据包括:
获取相同OD间的K短路径,计算每条K短路径的理论出行总时长,根据换乘行程的耗时匹配得出乘客实际经过的路线和换乘次数,将乘客分为单次换乘乘客和多次换乘乘客。
本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现上述所述的公共交通满载率计算方法。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solidstatedisk,SSD))等。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (9)
1.一种公共交通满载率计算方法,其特征在于,包括以下步骤:
S1、获取公共交通设定线路上站点所有进出站的乘客行程数据以及在所述设定线路上的运行信息,根据乘客进出站行程将乘客分为直达乘客和换乘乘客;
S2、获取与乘客出行时间相匹配的外部特征,根据所述乘客行程数据匹配所述外部特征得到数据集RN*d,N代表行程数据的个数,d代表的是行程数据中包含的特征维度;
S3、获取相同OD的直达乘客行程数据,O和D分别代表行程数据中的出发站点与目的站点,获取公共交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间,根据所述数据集RN*d计算直达乘客实际上车和下车的时间;
S4、获取相同OD的换乘乘客行程数据和公共交通设定线路上各换乘站点的换乘平均耗时,根据所述数据集RN*d计算换乘乘客在不同站台上的实际上车和下车的时间;
S5、获取公共交通上的额定总载客量,根据公共交通运行时间和额定总载客量计算在设定线路上不同时间段的满载率;
根据所述数据集RN*d计算直达乘客实际上车和下车的时间具体包括:获取相同OD的直达乘客行程数据,选择用时最短的乘客行程数据作为观察点Y,计算每个行程数据与观察点的欧式距离,得到数据集XN={x1,x2,…,xn};
为数据集XN构建高斯混合模型GMM,用P(x|θ)来表示不同班次的行程联合概率密度函数,M代表不同班次的种类,πj为直达客流不同班次有留乘与乘坐第一班次的混合比例,θ代表模型密度函数的参数,包含均值与方差,对联合密度函数P(x|θ)对数化得到log(θ|X),通过最大化对数似然函数和EM算法来求解GMM的初始参数,GMM的混合模型均值αj为βj方差为s2,将混合比例πj的初始值设置为1/2,以及参数αj和βj的初始值和
在期望步骤中,给定在第n次迭代中估计的参数θn,计算XN中每个行程数据隶属权重P(zi=j|xi,θn)
其中πj是一类乘客j的混合比例权重;
计算XN的行程数据的权重之后,计算潜在隐含变量Z={zi}的对数似然函数的期望值Q(θ|θn,X);
在最大化步骤,对数似然函数的期望Q(θ|θn,X)被最大化,以获得高斯混合模型中参数θn+1的新估计:
θn+1=argmaxQ(θ|θn,X)
重复进行上述两个步骤,直到满足停止标准(θn+1-θn)<Threshold,Q(θ|θn,X)隐含变量分布的条件概率期望的计算如下:
使用拉格朗日乘法器对参数均值αj和方差βj进行优化,给出对变量πj的约束,拉格朗日乘数λ的无约束函数写为:
对于每个πj和λ取一阶导数并将它们设置为零;
获得GMM模型参数均值αj和方差βj对应局部最优的行程数据ID并匹配作为K-means的初始聚类中心,对相同OD的行程数据分为留乘与乘坐第一班行程;
获取轨道交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间匹配直达乘客实际上车和下车的时间。
2.如权利要求1所述的公共交通满载率计算方法,其特征在于,所述外部特征包括天气,节假日数据。
3.如权利要求1所述的公共交通满载率计算方法,其特征在于,所述获取相同OD的换乘乘客行程数据包括:
获取相同OD间的K短路径,K代表路径的数目,计算每条K短路径的理论出行总时长,根据换乘行程的耗时匹配得出乘客实际经过的路线和换乘次数,将乘客分为单次换乘乘客和多次换乘乘客。
4.如权利要求3所述的公共交通满载率计算方法,其特征在于,根据所述数据集RN*d计算换乘乘客在不同站台上的实际上车和下车的时间包括:
获取相同OD且出行路线相同的单次换乘乘客数据;选择用时最短的乘客行程数据作为观察点Y,计算每个行程数据与观察点的欧式距离,并形成距离矢量集XN,为数据集XN构建高斯混合模型,通过最大化对数似然函数和EM算法来求解单次换乘GMM的初始参数,由于GMM的混合模型均值为方差为s2,考虑到单次换乘行程主要在不同站点分别留乘与不进行留乘,将M代表不同类别初始化为3,将混合比例πj的初始值设置为1/3,以及参数αj和βj的初始值和
获得单次换乘GMM模型参数局部最优的行程数据ID作为K-means的初始聚类中心,对相同单次换乘OD的行程数据进行聚类;获取轨道交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间匹配单次换乘乘客在不同站台上的实际上车和下车的时间。
5.如权利要求3所述的公共交通满载率计算方法,其特征在于,根据所述数据集RN*d计算多次换乘乘客在不同站台上的实际上车和下车的时间包括:
获取相同OD且出行路线相同的多次换乘乘客,加入到外部特征的高维行程数据RN*(d+n),n是行程中换乘的次数;通过分配观察点来识别数据空间中的簇数,为数据集XN构建高斯混合模型,通过最大化对数似然函数和EM算法来求解多次换乘GMM的初始参数,由于GMM的混合模型均值为方差为s2,考虑到多次换乘行程会在不同站点分别留乘与不进行留乘,将M代表不同类别初始化大于等于3,将混合比例πj的初始值设置为1/m,以及参数αj和βj的初始值和并通过BIC信息准则判断乘客在相同进出站多次换乘的不同类别数m;
获得多次换乘GMM模型参数局部最优的行程数据ID并匹配作为K-means的初始聚类中心,获取轨道交通设定线路上的运行信息并根据多次换乘乘客的类别和刷卡进出站时间匹配多次换乘乘客在不同站台上的实际上车和下车的时间。
6.一种公共交通满载率计算系统,其特征在于,包括:
获取模块,用于获取公共交通设定线路上站点所有进出站的乘客行程数据以及在所述设定线路上的运行信息,根据乘客进出站行程将乘客分为直达乘客和换乘乘客;
匹配模块,用于获取与乘客出行时间相匹配的外部特征,根据所述乘客行程数据匹配所述外部特征得到数据集RN*d,N代表行程数据的个数,d代表的是行程数据中包含的特征维度;
第一计算模块,用于获取相同OD的直达乘客行程数据,获取公共交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间,根据所述数据集RN*d计算直达乘客实际上车和下车的时间;
第二计算模块,用于获取相同OD的换乘乘客行程数据和公共交通设定线路上各换乘站点的换乘平均耗时,根据所述数据集RN*d计算换乘乘客在不同站台上的实际上车和下车的时间;
满载率计算模块,用于获取公共交通上的额定总载客量,根据公共交通运行时间和额定总载客量计算在设定线路上不同时间段的满载率;
根据所述数据集RN*d计算直达乘客实际上车和下车的时间具体包括:获取相同OD的直达乘客行程数据,选择用时最短的乘客行程数据作为观察点Y,计算每个行程数据与观察点的欧式距离,得到数据集XN={x1,x2,…,xn};
为数据集XN构建高斯混合模型GMM,用P(x|θ)来表示不同班次的行程联合概率密度函数,M代表不同班次的种类,πj为直达客流不同班次有留乘与乘坐第一班次的混合比例,θ代表模型密度函数的参数,包含均值与方差,对联合密度函数P(x|θ)对数化得到log(θ|X),通过最大化对数似然函数和EM算法来求解GMM的初始参数,GMM的混合模型均值αj为βj方差为s2,将混合比例πj的初始值设置为1/2,以及参数αj和βj的初始值和
其中πj是一类乘客j的混合比例权重;
计算XN的行程数据的权重之后,计算潜在隐含变量Z={zi}的对数似然函数的期望值Q(θ|θn,X);
在最大化步骤,对数似然函数的期望Q(θ|θn,X)被最大化,以获得高斯混合模型中参数θn+1的新估计:
θn+1=argmaxQ(θ|θn,X)
重复进行上述两个步骤,直到满足停止标准(θn+1-θn)<Threshold,Q(θ|θn,X)隐含变量分布的条件概率期望的计算如下:
使用拉格朗日乘法器对参数均值αj和方差βj进行优化,给出对变量πj的约束,拉格朗日乘数λ的无约束函数写为:
对于每个πj和λ取一阶导数并将它们设置为零;
获得GMM模型参数均值αj和方差βj对应局部最优的行程数据ID并匹配作为K-means的初始聚类中心,对相同OD的行程数据分为留乘与乘坐第一班行程;
获取轨道交通设定线路上的运行信息并根据直达乘客的类别和刷卡进出站时间匹配直达乘客实际上车和下车的时间。
7.如权利要求6所述的公共交通满载率计算系统,其特征在于,所述外部特征包括天气,节假日数据。
8.如权利要求6所述的公共交通满载率计算系统,其特征在于,所述获取相同OD的换乘乘客行程数据包括:
获取相同OD间的K短路径,计算每条K短路径的理论出行总时长,根据换乘行程的耗时匹配得出乘客实际经过的路线和换乘次数,将乘客分为单次换乘乘客和多次换乘乘客。
9.计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1-5任一项所述的公共交通满载率计算方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110380551.5A CN113095986B (zh) | 2021-04-09 | 2021-04-09 | 公共交通满载率计算方法、系统及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110380551.5A CN113095986B (zh) | 2021-04-09 | 2021-04-09 | 公共交通满载率计算方法、系统及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113095986A CN113095986A (zh) | 2021-07-09 |
CN113095986B true CN113095986B (zh) | 2022-09-09 |
Family
ID=76675354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110380551.5A Active CN113095986B (zh) | 2021-04-09 | 2021-04-09 | 公共交通满载率计算方法、系统及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113095986B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226860A (zh) * | 2013-04-12 | 2013-07-31 | 中国民航大学 | 一种通道客流密度估计方法 |
CN105844229A (zh) * | 2016-03-18 | 2016-08-10 | 深圳大学 | 一种乘客拥挤度的计算方法及其系统 |
CN110276255A (zh) * | 2019-05-17 | 2019-09-24 | 南京理工大学 | 基于gmm模型与bp神经网络的高速铁路异物识别与分类方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6307376B2 (ja) * | 2014-07-28 | 2018-04-04 | 株式会社日立製作所 | 交通分析システム、交通分析プログラムおよび交通分析方法 |
CN107301492A (zh) * | 2017-05-16 | 2017-10-27 | 华南理工大学 | 一种基于高斯混合模型的地铁票务清分方法 |
CN108388542B (zh) * | 2018-01-18 | 2021-04-13 | 中国科学院空天信息创新研究院 | 一种轨道交通拥挤度计算方法及系统 |
CN108681741B (zh) * | 2018-04-08 | 2021-11-12 | 东南大学 | 基于ic卡和居民调查数据的地铁通勤人群信息融合方法 |
US11195412B2 (en) * | 2019-07-16 | 2021-12-07 | Taiwo O Adetiloye | Predicting short-term traffic flow congestion on urban motorway networks |
CN110428096B (zh) * | 2019-07-26 | 2022-01-18 | 西南交通大学 | 基于票务信息的城市轨道交通多交路运输组织优化方法 |
CN111582750B (zh) * | 2020-05-18 | 2021-01-01 | 北京交通大学 | 一种轨道交通反向乘客识别及乘车班次确定方法及系统 |
CN112418562A (zh) * | 2020-12-15 | 2021-02-26 | 同济大学 | 一种城市轨道交通网络乘客出行方案推定方法 |
-
2021
- 2021-04-09 CN CN202110380551.5A patent/CN113095986B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226860A (zh) * | 2013-04-12 | 2013-07-31 | 中国民航大学 | 一种通道客流密度估计方法 |
CN105844229A (zh) * | 2016-03-18 | 2016-08-10 | 深圳大学 | 一种乘客拥挤度的计算方法及其系统 |
CN110276255A (zh) * | 2019-05-17 | 2019-09-24 | 南京理工大学 | 基于gmm模型与bp神经网络的高速铁路异物识别与分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113095986A (zh) | 2021-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bischoff et al. | City-wide shared taxis: A simulation study in Berlin | |
EP3258430A1 (en) | Transport capacity scheduling method and system | |
CN115186516B (zh) | 交通枢纽的行人仿真模型构建方法、电子设备及存储介质 | |
CN110472999B (zh) | 基于地铁和共享单车数据的客流模式分析方法及装置 | |
CN114331234B (zh) | 基于乘客出行信息的轨道交通客流预测方法和系统 | |
Cornet et al. | Methods for quantitative assessment of passenger flow influence on train dwell time in dense traffic areas | |
CN108364464B (zh) | 一种基于概率模型的公交车辆旅行时间建模方法 | |
CN115527369B (zh) | 一种空港枢纽大面积延误条件下的大客流预警与疏散方法 | |
CN114580751B (zh) | 空港到港旅客疏散时间预测方法、系统、存储介质及终端 | |
CN112204604A (zh) | 信息处理装置、信息处理方法以及程序 | |
CN108876064B (zh) | 基于客流量的城市轨道交通网络关键车站识别方法 | |
Li et al. | Using smart card data trimmed by train schedule to analyze metro passenger route choice with synchronous clustering | |
CN116013059A (zh) | 一种营运车辆的调度方法、装置、电子设备及存储介质 | |
Kamel et al. | A modelling platform for optimizing time-dependent transit fares in large-scale multimodal networks | |
CN113656746B (zh) | 一种动态结构下考虑群体异质性的出行方式链选择方法 | |
Li et al. | Passenger travel behavior in public transport corridor after the operation of urban rail transit: a random forest algorithm approach | |
CN113657681B (zh) | 联结智能公交站台和共享交通的方法、系统和存储介质 | |
CN110657817A (zh) | 行程路线的推荐方法及装置 | |
CN112669595B (zh) | 一种基于深度学习的网约车流量预测方法 | |
CN113095986B (zh) | 公共交通满载率计算方法、系统及计算机可读存储介质 | |
Wei et al. | Data-driven energy and population estimation for real-time city-wide energy footprinting | |
Gallo et al. | Network-wide public transport occupancy prediction framework with multiple line interactions | |
CN110046535B (zh) | 基于机器学习的智能出行时间预测系统、方法及存储介质 | |
CN116562574A (zh) | 城际定制客运的协同优化方法、装置、设备和存储介质 | |
Nasiboglu et al. | Origin-destination matrix generation using smart card data: Case study for Izmir |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |