CN105320997A - 一种基于大数据的公交客流轨迹实时跟踪方法 - Google Patents
一种基于大数据的公交客流轨迹实时跟踪方法 Download PDFInfo
- Publication number
- CN105320997A CN105320997A CN201510607088.8A CN201510607088A CN105320997A CN 105320997 A CN105320997 A CN 105320997A CN 201510607088 A CN201510607088 A CN 201510607088A CN 105320997 A CN105320997 A CN 105320997A
- Authority
- CN
- China
- Prior art keywords
- card
- bus
- data
- website
- public transport
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000011897 real-time detection Methods 0.000 claims abstract description 8
- 230000001680 brushing effect Effects 0.000 claims description 33
- 239000013598 vector Substances 0.000 claims description 25
- 238000012546 transfer Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 2
- 239000007787 solid Substances 0.000 abstract description 2
- 238000004458 analytical method Methods 0.000 abstract 1
- 238000007726 management method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Devices For Checking Fares Or Tickets At Control Points (AREA)
Abstract
本发明公开了一种基于大数据的公交客流轨迹实时跟踪方法。本发明的目的是提供一种面向公交系统的可以低成本、全路网、低误检、少延时、实时地检测公交刷卡乘客的移动轨迹的方法。为了达到上述目的,本发明的技术方案是提供了一种基于公交支付数据和GPS数据的实时检测公交客流拥挤水平信息的方法。近年来,公交车辆逐步普及了公交IC卡支付终端和GPS终端,并且经过较长时间的运营,积累了大量的数据。通过对包括公交支付数据(包括IC卡刷卡数据和投币数据,下同)、公交GPS数据等在内的大数据综合分析,建立交通模型,可以高效、准确、可靠地对公交车辆的刷卡乘客的乘车移动轨迹进行监控,及时对大客流进行预警。为提高公交运营管理的科学性,提升公共危机应对水平奠定坚实的数据基础。
Description
技术领域
本发明涉及一种基于公交支付数据和GPS数据的实时检测公交客流拥挤水平信息的方法。
背景技术
随着城市的发展,城市道路的交通压力与日俱增。优先发展公共交通,提高公交出行比例,已经成为缓解交通压力、促进城市交通可持续发展的基本共识。
当前,公交系统的信息化建设普遍滞后,公交的运营管理依然依靠传统的经验判断,不但造成公交的运营效率偏低,还直接影响了公交的服务水平,降低了公交的吸引力和出行比例。
要提高的公交的运营管理水平,对客流的监控和预警是基础和关键。传统的公交现状调查一般采用人工的方式,不但成本高昂,还无法快速反映公交客流的日常变化,更无法监测公交突发大客流对公共安全造成的隐患。
发明内容
本发明的目的是提供一种面向公交系统的可以低成本、全路网、低误检、少延时、实时地检测公交刷卡乘客的移动轨迹的方法。
为了达到上述目的,本发明的技术方案是提供了一种基于公交支付数据和GPS数据的实时检测公交客流拥挤水平信息的方法,其特征在于,包括以下步骤:
步骤1、每间隔一固定时间段收集一次最近一次该时间段长度内的各公交的历史IC卡刷卡数据,基于历史IC卡刷卡数据建立并每间隔一固定时间段更新公交常发上下客表和公交各线路各站点下客表,其中:
公交常发上下客表记载各张IC卡在各条公交线路上的常发上车站点和常发下车站点之间的对应关系,对于IC卡C,基于历史IC卡刷卡数据得到IC卡C在各条公交线路上的上车次数及下车次数,IC卡C在公交线路LCn上的上车次数及下车次数的总和为NCn,并IC卡C在站点SCi上车且在站点SCj下车的次数为NCij,若NCij/NCn>=设定阈值时,则认为站点SCi为IC卡C在公交线路LCm上的一个常发上车站点,站点SCj为IC卡C在公交线路LCn上的一个常发下车站点;
公交各线路各站点下客表记载各条公交线路在各公交站点的下车人数;
步骤2、获取实时的IC卡刷卡数据和公交GPS数据,建立IC卡刷卡数据与公交GPS数据之间的匹配关系,从而确定各IC卡在各条公交线路上的上车站点,得到各公交站点的上车人数,建立公交上车信息表,在公交上车信息表中记载有IC卡、公交线路及上车站点之间的对应关系;
步骤3、预测各IC卡在各条公交线路上的下车站点,从而得到各公交站点的下车人数,其中,对于任意一张IC卡而言,根据步骤2得到的公交上车信息表,得到当前IC卡对应的公交线路及上车站点,随后先根据当前IC卡、当前IC卡对应的公交线路及当前IC卡对应的上车站点在公交常发上下客表中查找是否有对应的常发下车站点,若有,则将该常发下车站点对应的公交站点的下车人数加一,若无,则根据公交各线路各站点下客表查找当前IC卡对应的上车站点的各下游公交站点的下车人数,以得到的各下游公交站点的下车人数为权重预测当前IC卡的下车站点,将该下车站点对应的公交站点的下车人数加一。
优选地,在所述步骤1中,所述NCm及所述NCij的计算步骤包括:
步骤1.1、设定换乘最远距离D_TRANSFERmax和换乘最长时间T_TRANSFERmax;
步骤1.2、IC卡C第N次刷卡的上车站点为SCn,对应公交线路LCn,第N+1次刷卡的上车站点为SCn+1,分别计算上车站点SCn的各下游站点与上车站点间SCn+1的距离,取其中的最小值,若该最小值不大于D_TRANSFERmax时,该最小值所对应的下游站点作为上车站点SCn的下车站点;
若第N次刷卡已经是IC卡C全天最后一次刷卡,则将第一次刷卡的上车站点作为第N+1次刷卡的上车站点;
步骤1.3、重复步骤1.2,直至遍历历史IC卡刷卡数据中IC卡C的所有刷卡记录,得到IC卡C在公交线路LCn上的上车次数及下车次数的总和NCn,以及IC卡C在站点SCi上车且在站点SCj下车的次数NCij。
优选地,通过IC卡刷卡数据获得各IC卡在各条公交线路上的上车站点的实现方法包括如下步骤:
步骤2.1、将支付时间从所述IC卡刷卡数据中划分出来并聚类,从而形成不同的支付数据集合;
步骤2.2、计算当前支付数据集合Cm中支付数据时间戳的均值Tm,若当前支付数据集合Cm对应的公交上的支付终端的支付终端号为Devm,则获得当前支付数据集合Cm的特征向量(Devm,Tm),公交到离站数据获取相应的支付终端号Devg,并计算到站时间和离站时间的中间值Tg,形成公交到离站数据的特征向量(Devg,Tg),两特征向量之间计算相似度,取具有最大相似度的对应向量(Devg,Tg)所对应的站点为当前支付数据集合Cm所对应的上车站点;
步骤2.3、重复步骤2.2,直至遍历步骤2.1中形成的所有支付数据集合。
优选地,在所述步骤3中还包括:
获取各条公交线路上各公交的GPS数据,将GPS数据逐条与步骤2中获取的IC卡刷卡数据比对,当满足以下条件时,则刷卡乘客的出行与公交的运行轨迹相同:1、公交GPS数据中的车辆编号CARgps与IC卡刷卡数据中的车辆编号CARic相同;2、公交GPS数据中的时间Tgps晚于IC卡刷卡数据中的刷卡时间Tup;3、公交GPS数据尚未输出预测下车站点的到达时间信息。
近年来,公交车辆逐步普及了公交IC卡支付终端和GPS终端,并且经过较长时间的运营,积累了大量的数据。通过对包括公交支付数据(包括IC卡刷卡数据和投币数据,下同)、公交GPS数据等在内的大数据综合分析,建立交通模型,可以高效、准确、可靠地对公交车辆的刷卡乘客的乘车移动轨迹进行监控,及时对大客流进行预警。为提高公交运营管理的科学性,提升公共危机应对水平奠定坚实的数据基础。
附图说明
图1为本发明提供的一种基于大数据的公交客流轨迹实时跟踪方法的流程图。
具体实施方式
为使本发明更明显易懂,兹以优选实施例作详细说明如下。
结合图1,本发明提供了一种基于公交支付数据和GPS数据的实时检测公交客流拥挤水平信息的方法,其步骤为:
步骤1、每月收集最近一个月的历史数据,综合判断并统计各刷卡数据的上下车站点,形成并每月更新公交常发上下客表和公交各线路各站点下客表。
步骤1.1、收集历史数据,判断上车站点,上车站点的判断方法可参考步骤2;
步骤1.2、调查城市当地的公交服务水平和居民出行期望程度,设定换乘最远距离D_TRANSFERmax和最长时间T_TRANSFERmax。
每张IC卡根据刷卡时间的前后顺序进行排序,其中,IC卡E第N次刷卡的上车站点为SEn,所乘线路为LEn,第N+1次刷卡的上车站点为SEn+1,将第N次刷卡站点SEn的下游各站点分别计算与第N+1次刷卡的上车站点SEn+1间的距离并取其中的最小值对比和D_TRANSFERmax,当时,所对应的站点(即下游站点中与第N+1次刷卡的上车站点SEn+1距离最近的站点)作为第N次刷卡的下车站点。
当第N次刷卡已经是IC卡全天最后一次刷卡,则将第一次刷卡的上车站点SN1作为参考站点(即类似于上文中的第N+1次刷卡的上车站点SEn+1)。
步骤1.3、通过步骤1.1和1.2,处理历史刷卡数据,获得历史刷卡数据中多次刷卡记录的上下站点信息。汇总并区分线路统计各张卡的上下站点,当卡C在线路LCm的上下车记录共有NCm条,其中,在站点SCi上车并在站点SCj下车的次数为NCij,当比例NCij/NCm>=50%时,认定站点SCi和SCj为卡C在线路LCm的常发上车站点和常发下车站点。将卡C、线路LCm、站点SCi和SCj等信息统一记录,形成公交出行的常发上下客表。
步骤1.4、训练各公交站点的下车人数,根据公交站点的重要程度分为两类:一类为枢纽类公交站点,一类为一般性公交站点。设定公交线路数阈值L,当站点P停靠的公交线路数LP>=L时,站点认定为枢纽类公交站点,反之则为一般性公交站点。枢纽类公交站点采用人工调查的方式获取站点的全天下车人数。一般性公交站点采用推导的方式估计站点的下车总人数。通过步骤2,可统计获得各线路在沿线各站点的总上车人数,假设得到线路BL上行停靠在站点SBLa,该站点的上车人数为NBLa,计算线路BL下行方向各站点与上行站点SBLa的距离,确定距离最近的下行站点SBLb(一般为站点SBLa的对向站点),则站点SBLb的下车人数与站点SBLa的上车人数相等,即站点SBLb的下车人数为NBLa。
步骤2、定期获得实时公交支付数据(包括IC卡刷卡数据和投币数据)和公交GPS数据,处理公交支付数据,建立聚类模型,与公交GPS数据建立对应匹配关系,确定公交刷卡人群的上车站点。
步骤2.1、定期获得公交支付数据,汇聚形成数据集合,各个数据对象用d维模式向量Xi=(Xi1,Xi2,...,Xid)来表示,各数据对象的相似性值用距离函数S(Xi,Xj)=S(Xi1,Xi2,...,Xid,Xj1,Xj2,...,Xjd)来表示,Xi和Xj越相似,S(Xi,Xj)越小。
从刷卡数据包含的信息来看,刷卡数据向量的各维度属性包括支付终端、支付时间、支付卡号、支付金额等,初始定期获得的公交支付数据都在同一个类,利用层次分裂法(divisivestrategy),自顶而下,逐步细分,其中第一层次为刷卡终端,第二层次为支付时间,第三层次为支付卡号(投币用统一用卡号X表示),第四层次为支付金额,最终实现每个支付数据对象自成一类。
步骤2.2、利用第二层次聚类后的支付数据集合Cm分别统计集合的特征向量,由于当前采用第二层次的聚类,所以各集合的特征向量取支付终端和支付时间的统计值,假设集合内各支付数据时间戳Tmi的均值Tm,支付终端号为Devm,获得各支付数据集合的特征向量(Devm,Tm);公交到离站数据获取相应的支付终端号Devg,并计算到站时间和离站时间的中间值Tg,形成公交到离站数据的特征向量(Devg,Tg)。两特征向量之间计算相似函数S(Devm,Tm,Devg,Tg),根据向量特点,相似函数公式为:
S(Devm,Tm,Devg,Tg)=Boolean(Devm=Devg)/|Tm-Tg|
获取相似函数大于0且数值最大的站点S,可认定支付数据集合Cm的上车站点为S。
步骤3、预测公交客流的下车地点,实时监控公交客流的移动轨迹。
步骤3.1、步骤2得到的公交上车信息表与步骤1.3得到的公交常发上下客表进行对比。通过公交上车信息表得知卡C在线路LCm的站点SCh上车,与公交常发上下客表对比发现,卡C在线路LCm有常发上下车站点信息SCi和SCj,对比站点SCh和SCi,如果站点SCh与站点SCi相同或者相邻,那么直接采用站点SCj作为卡C的预测下车站点。
步骤3.2、若通过步骤3.1无法预测下车站点,就利用下游各站点的下车人数作为权重进行分配。通过公交上车信息表得知卡CD(包括投币支付数据)在线路LCDn的站点SCDk上车,与公交常发上下客表对比未发现匹配数据。通过查询步骤1.4的各站点下车人数表,获得线路LCDn位于站点SCDk下游的各站点下车人数NCDi,以NCDi为权重,分配预测卡CD的下车站点。
步骤3.3、周期获取公交GPS数据。逐条与步骤2中获取的上车信息比对,当满足以下条件时,刷卡乘客的出行与公交的运行轨迹相同:(1)公交GPS数据中的车辆编号CARgps与上车信息中的车辆编号CARic相同;(2)公交GPS数据中的时间Tgps晚于上车信息中的刷卡时间Tup;(3)公交GPS数据尚未输出预测下车站点的到达时间信息。
步骤4、利用公交乘客的出行轨迹,能够实时监控公交线网的客流情况,及时预警公交大客流,杜绝可能存在的隐患;为日常的公交运营调度提供数据支撑,提高公交运营效率;同时对公交乘客出行轨迹的进一步统计,如公交客流OD统计、车辆载客人数统计、道路断面公交客流统计等等,能够为公交线网规划、线路运力配置等提供重要数据基础。
以下结合具体数据来进一步说明本发明。
步骤1、获取1个月的离线公交消费数据、公交GPS数据和其他基础数据,并分析公交的上下客信息。
步骤1.1、获取离线公交支付数据(BUSCONSUMINGDATA,简称BCD,下同),BCD的主要字段包括:支付卡号(PAIDCARDNO,简称PCN,下同)、支付时间(PAIDTIME,简称PT,下同)、支付金额(PAYMENTPRICE,简称PP,下同)和支付终端(PAIDTERMINALNO,简称PTN,下同)等信息。如获取的BCD为2015年7月的数据,离线BCD如下表所示。
表1:公交原始支付数据
数据编号 | 支付卡号 | 支付时间 | 支付金额 | 支付终端 |
…… | …… | …… | …… | …… |
1 | PAID IC CARD NO(1) | 2015/7/3 0:00 | 2.28 | PAID TERMINAL NO(1) |
2 | PAID IC CARD NO(2) | 2015/7/3 0:00 | 1.25 | PAID TERMINAL NO(2) |
3 | PAID IC CARD NO(3) | 2015/7/3 0:00 | 1.25 | PAID TERMINAL NO(3) |
4 | PAID IC CARD NO(4) | 2015/7/3 0:00 | 1.25 | PAID TERMINAL NO(4) |
5 | PAID COIN LABEL(X) | 2015/7/3 0:00 | 2 | PAID TERMINAL NO(5) |
6 | PAID COIN LABEL(X) | 2015/7/3 0:00 | 2 | PAID TERMINAL NO(6) |
7 | PAID IC CARD NO(5) | 2015/7/3 0:00 | 1.25 | PAID TERMINAL NO(7) |
8 | PAID COIN LABEL(X) | 2015/7/3 0:00 | 2 | PAID TERMINAL NO(8) |
9 | PAID IC CARD NO(6) | 2015/7/3 0:00 | 1.25 | PAID TERMINAL NO(9) |
10 | PAID COIN LABEL(X) | 2015/7/3 0:00 | 2 | PAID TERMINAL NO(10) |
11 | PAID IC CARD NO(7) | 2015/7/3 0:00 | 2.28 | PAID TERMINAL NO(11) |
12 | PAID IC CARD NO(8) | 2015/7/3 0:00 | 1.25 | PAID TERMINAL NO(12) |
13 | PAID IC CARD NO(9) | 2015/7/3 0:01 | 1.25 | PAID TERMINAL NO(13) |
14 | PAIDIC CARD NO(10) | 2015/7/3 0:01 | 1.25 | PAID TERMINAL NO(14) |
15 | PAID COIN LABEL(X) | 2015/7/3 0:01 | 2 | PAID TERMINAL NO(15) |
…… | …… | …… | …… | …… |
对BCD建立聚类模型,其中第一层次为PTN,第二层次为PT,第三层次为PCN,第四层次为PP,建立的模型如下所示。
表2:公交支付数据聚类结果
采用第二层次的聚类结果,统计各聚类的特征向量,特征向量包括了PTN和PT,如下表所示。
表3:公交支付数据聚类特征向量
获取对应日期(2015年7月)的公交GPS到离站数据,数据格式如下表所示。
表4:公交GPS到离站原始数据
同样统计公交到离站数据的特征向量,与支付数据的特征向量对应,公交到离站数据的特征向量包括了PTN和到站时间(ARRIVETIME,简称AT,下同),统计结果如下所示。
表5:公交GPS到离站特征向量
BCD聚类特征向量与公交GPS到离站特征向量间计算函数值,建立刷卡聚类结果与公交到离站结果的对应关系,如下表所示。
表6:公交GPS到离站特征向量
由此结果,获得各聚类BCD的对应上车站点(BUSSTATION,简称BS,下同)。
步骤1.2、确定BCD的上车BS后,分析多次刷卡数据的下车BS。将上车BS匹配完成的公交刷卡数据(即不包含投币数据)按照PT进行排序,如下表所示。
表7:匹配上车站点后的公交刷卡数据
数据编号 | 刷卡卡号 | 刷卡时间 | 刷卡线路 | 刷卡站点 |
…… | …… | …… | …… | …… |
1 | PAID IC CARD NO(1) | 2015/7/3 7:25:10 | BUS LINE NO(1) | BUS STATION NO(1) |
2 | PAID IC CARD NO(1) | 2015/7/3 11:30:02 | BUS LINE NO(2) | BUS STATION NO(2) |
3 | PAID IC CARD NO(1) | 2015/7/3 18:16:35 | BUS LINE NO(3) | BUS STATION NO(3) |
4 | PAID IC CARD NO(2) | 2015/7/3 7:51:03 | BUS LINE NO(4) | BUS STATION NO(4) |
5 | PAID IC CARD NO(2) | 2015/7/3 17:38:15 | BUS LINE NO(5) | BUS STATION NO(5) |
6 | PAID IC CARD NO(3) | 2015/7/3 7:25:10 | BUS LINE NO(6) | BUS STATION NO(6) |
7 | PAID IC CARD NO(3) | 2015/7/3 10:02:53 | BUS LINE NO(7) | BUS STATION NO(7) |
8 | PAID IC CARD NO(3) | 2015/7/3 12:12:30 | BUS LINE NO(8) | BUS STATION NO(8) |
9 | PAID IC CARD NO(3) | 2015/7/3 19:23:27 | BUS LINE NO(9) | BUS STATION NO(9) |
…… | ……… | …… | … | …… |
选出上车BS下游的的BS作为下车BS的备选BS,以下次刷卡BS作为参考BS,如为末次刷卡,则以第一次刷卡BS作为参考BS,如下表所示。
表8:下游站点匹配
分别计算备选BS和参考BS间的距离,并选取距离最近的备选BS,判断距离是否小于设定的距离阈值D_TRANSFERmax,如下表所示。
表9:下车站点筛选
选取最短距离小于D_TRANSFERmax的BS,作为对应刷卡客流的下车BS。
步骤1.3、选取并汇总全部离线数据(一个月)中通过步骤1.2中成功确定下车BS的刷卡数据,并分别统计每张卡的上下车BS频次分布,如下所示。
表10:刷卡数据上下车频次分布
选出上表中频次比例高于50%的结果,组成公交客流常发出行表,常发出行表结果如下表所示。
表11:公交刷卡客流常发出行表
步骤1.4、离线统计线路(BUSLINE,简称BL,下同)沿线各BS的下车人数。BS分为两类,一类为枢纽BS,采用实地人工调查的方法统计BS下客人数。另一类为非枢纽BS,采用客流推理的方式估计下车BS,将离线获取的数据日期分成8个日期类型:
1——工作日周一
2——工作日周二
3——工作日周三
4——工作日周四
5——工作日周五
6——周末周六
7——周末周日
8——其他节假日
通过步骤1.1进一步统计获得离线数据中各日期类型各BL沿线BS的平均上车人数,结果如下表所示。
表12:公交线路沿线站点上车人数
日期类型 | 线路编号 | 运行方向 | 站点顺序编号 | 平均上车人数 |
…… | …… | …… | …… | …… |
1 | BUS LINE NO(1) | BUS OPERATION DIRECTION(1) | 1 | NA1 |
1 | BUS LINE NO(1) | BUS OPERATION DIRECTION(1) | 2 | NA2 |
1 | BUS LINE NO(1) | BUS OPERATION DIRECTION(1) | …… | …… |
1 | BUS LINE NO(1) | BUS OPERATION DIRECTION(1) | m | NAm |
1 | BUS LINE NO(1) | BUS OPERATION DIRECTION(2) | 1 | NR1 |
1 | BUS LINE NO(1) | BUS OPERATION DIRECTION(2) | 2 | NB2 |
1 | BUS LINE NO(1) | BUS OPERATION DIRECTION(2) | …… | …… |
1 | BUS LINE NO(1) | BUS OPERATION DIRECTION(2) | m | NBm |
…… | …… | …… | …… | …… |
基于以上结果,分别匹配各BS对应的对向BS,并设定对向BS的下车人数与所选BS的上车人数相等,结果如下表所示。
表13:公交线路沿线站点匹配
与人工调查的各BS下车人数汇总,形成各BL各BS的下客平均下车人数表。
步骤2、根据指定的实时更新周期,定期获取对应时间段的BCD和GPS数据。如更新周期为5分钟,12:00:00时获取[11:55:00,12:00:00)这段时间的BCD和公交GPS数据,如下表所示;
表14:在线公交支付数据
支付卡号 | 支付时间 | 支付金额 | 支付终端 |
…… | …… | …… | …… |
PAID IC CARD NO(1) | 2015/8/2811:55:10 | 2.28 | PAID TERMINAL NO(1) |
PAID IC CARD NO(2) | 2015/8/2811:55:10 | 1.25 | PAID TERMINAL NO(2) |
PAID IC CARD NO(3) | 2015/8/2811:55:11 | 1.25 | PAID TERMINAL NO(3) |
PAID IC CARD NO(4) | 2015/8/2811:55:25 | 1.25 | PAID TERMINAL NO(4) |
PAID COIN LABEL(X) | 2015/8/2811:55:23 | 2 | PAID TERMINAL NO(5) |
PAID COIN LABEL(X) | 2015/8/2811:55:52 | 2 | PAID TERMINAL NO(6) |
PAID IC CARD NO(5) | 2015/8/2811:55:29 | 1.25 | PAID TERMINAL NO(7) |
PAID COIN LABEL(X) | 2015/8/2811:55:31 | 2 | PAID TERMINAL NO(8) |
PAID IC CARD NO(6) | 2015/8/2811:55:49 | 1.25 | PAID TERMINAL NO(9) |
PAID COIN LABEL(X) | 2015/8/2811:56:15 | 2 | PAID TERMINAL NO(10) |
PAID IC CARD NO(7) | 2015/8/2811:56:36 | 2.28 | PAID TERMINAL NO(11) |
PAID IC CARD NO(8) | 2015/8/2811:57:13 | 1.25 | PAID TERMINAL NO(12) |
PAID IC CARD NO(9) | 2015/8/2811:58:35 | 1.25 | PAID TERMINAL NO(13) |
PAID IC CARD NO(10) | 2015/8/2811:58:15 | 1.25 | PAID TERMINAL NO(14) |
PAID COIN LABEL(X) | 2015/8/2811:59:20 | 2 | PAID TERMINAL NO(15) |
…… | ……… | … | …… |
表15:在线公交GPS到离站原始数据
利用步骤1.1的方法确定所获得周期内BCD的上车BS,如下表所示。
表16:在线公交支付数据上车站点匹配结果
步骤3、对获取周期内的BCD分析确定下车BS及移动轨迹。
步骤3.1、将步骤2中得到的结果数据(即已确定上车BS的BCD)中选取出刷卡交易数据,并与步骤1.3中得到的公交刷卡客流常发出行表进行对比匹配,匹配的原则是:两者的乘坐BL相同,上车BS相同或相邻,匹配结果如下表所示。
表17:在线公交支付数据与常发出行表匹配结果
对于能够匹配上的刷卡数据,所对应的常发下车BS即作为预测的下车BS。
步骤3.2、对于获取的周期BCD中通过步骤3.1无法预测下车BS的数据,与步骤1.4中获取的各日期类型各BL沿线BS下车人数表进行关联,关联结果如下表所示。
表18:在线公交支付数据与站点下客表匹配结果
通过上表的关联,以BS下车人数为权重,预测各支付数据的下车BS。
步骤3.3、给予步骤3.1和3.2确定的下车BS,继续周期获取公交GPS数据,判断公交是否到达预测下车BS,若还未到达,此时乘客的出行轨迹与公交GPS轨迹是重合的,从而,确定了乘客的出行轨迹。
步骤4、将乘客的出行轨迹应用与具体的统计,如车辆载客人数、客流走廊等。通过乘客上下车信息的进一步统计,可获得车辆在每个BS的上下客人数,如下表所示。
表19:车辆各站点上下客结果表
据此,某一时间点T的公交载客人数,对T时刻公交在上游各BS的上下客客流进行统计就可确定车辆的载客人数。
如需统计客流走廊,根据乘客的出行轨迹,遍历统计周期内通过所选断面的乘客人数,即可获得各走廊的客流结果。
Claims (4)
1.一种基于公交支付数据和GPS数据的实时检测公交客流拥挤水平信息的方法,其特征在于,包括以下步骤:
步骤1、每间隔一固定时间段收集一次最近一次该时间段长度内的各公交的历史IC卡刷卡数据,基于历史IC卡刷卡数据建立并每间隔一固定时间段更新公交常发上下客表和公交各线路各站点下客表,其中:
公交常发上下客表记载各张IC卡在各条公交线路上的常发上车站点和常发下车站点之间的对应关系,对于IC卡C,基于历史IC卡刷卡数据得到IC卡C在各条公交线路上的上车次数及下车次数,IC卡C在公交线路LCn上的上车次数及下车次数的总和为NCn,并IC卡C在站点SCi上车且在站点SCj下车的次数为NCij,若NCij/NCn>=设定阈值时,则认为站点SCi为IC卡C在公交线路LCm上的一个常发上车站点,站点SCj为IC卡C在公交线路LCn上的一个常发下车站点;
公交各线路各站点下客表记载各条公交线路在各公交站点的下车人数;
步骤2、获取实时的IC卡刷卡数据和公交GPS数据,建立IC卡刷卡数据与公交GPS数据之间的匹配关系,从而确定各IC卡在各条公交线路上的上车站点,得到各公交站点的上车人数,建立公交上车信息表,在公交上车信息表中记载有IC卡、公交线路及上车站点之间的对应关系;
步骤3、预测各IC卡在各条公交线路上的下车站点,从而得到各公交站点的下车人数,其中,对于任意一张IC卡而言,根据步骤2得到的公交上车信息表,得到当前IC卡对应的公交线路及上车站点,随后先根据当前IC卡、当前IC卡对应的公交线路及当前IC卡对应的上车站点在公交常发上下客表中查找是否有对应的常发下车站点,若有,则将该常发下车站点对应的公交站点的下车人数加一,若无,则根据公交各线路各站点下客表查找当前IC卡对应的上车站点的各下游公交站点的下车人数,以得到的各下游公交站点的下车人数为权重预测当前IC卡的下车站点,将该下车站点对应的公交站点的下车人数加一。
2.如权利要求1所述的一种基于公交支付数据和GPS数据的实时检测公交客流拥挤水平信息的方法,其特征在于,在所述步骤1中,所述NCm及所述NCij的计算步骤包括:
步骤1.1、设定换乘最远距离D_TRANSFERmax和换乘最长时间T_TRANSFERmax;
步骤1.2、IC卡C第N次刷卡的上车站点为SCn,对应公交线路LCn,第N+1次刷卡的上车站点为SCn+1,分别计算上车站点SCn的各下游站点与上车站点间SCn+1的距离,取其中的最小值,若该最小值不大于D_TRANSFERmax时,该最小值所对应的下游站点作为上车站点SCn的下车站点;
若第N次刷卡已经是IC卡C全天最后一次刷卡,则将第一次刷卡的上车站点作为第N+1次刷卡的上车站点;
步骤1.3、重复步骤1.2,直至遍历历史IC卡刷卡数据中IC卡C的所有刷卡记录,得到IC卡C在公交线路LCn上的上车次数及下车次数的总和NCn,以及IC卡C在站点SCi上车且在站点SCj下车的次数NCij。
3.如权利要求1所述的一种基于公交支付数据和GPS数据的实时检测公交客流拥挤水平信息的方法,其特征在于,通过IC卡刷卡数据获得各IC卡在各条公交线路上的上车站点的实现方法包括如下步骤:
步骤2.1、将支付时间从所述IC卡刷卡数据中划分出来并聚类,从而形成不同的支付数据集合;
步骤2.2、计算当前支付数据集合Cm中支付数据时间戳的均值Tm,若当前支付数据集合Cm对应的公交上的支付终端的支付终端号为Devm,则获得当前支付数据集合Cm的特征向量(Devm,Tm),公交到离站数据获取相应的支付终端号Devg,并计算到站时间和离站时间的中间值Tg,形成公交到离站数据的特征向量(Devg,Tg),两特征向量之间计算相似度,取具有最大相似度的对应向量(Devg,Tg)所对应的站点为当前支付数据集合Cm所对应的上车站点;
步骤2.3、重复步骤2.2,直至遍历步骤2.1中形成的所有支付数据集合。
4.如权利要求1所述的一种基于公交支付数据和GPS数据的实时检测公交客流拥挤水平信息的方法,其特征在于,在所述步骤3中还包括:
获取各条公交线路上各公交的GPS数据,将GPS数据逐条与步骤2中获取的IC卡刷卡数据比对,当满足以下条件时,则刷卡乘客的出行与公交的运行轨迹相同:1、公交GPS数据中的车辆编号CARgps与IC卡刷卡数据中的车辆编号CARic相同;2、公交GPS数据中的时间Tgps晚于IC卡刷卡数据中的刷卡时间Tup;3、公交GPS数据尚未输出预测下车站点的到达时间信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510607088.8A CN105320997A (zh) | 2015-09-22 | 2015-09-22 | 一种基于大数据的公交客流轨迹实时跟踪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510607088.8A CN105320997A (zh) | 2015-09-22 | 2015-09-22 | 一种基于大数据的公交客流轨迹实时跟踪方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105320997A true CN105320997A (zh) | 2016-02-10 |
Family
ID=55248344
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510607088.8A Pending CN105320997A (zh) | 2015-09-22 | 2015-09-22 | 一种基于大数据的公交客流轨迹实时跟踪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105320997A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295868A (zh) * | 2016-08-03 | 2017-01-04 | 重庆市索美智能交通通讯服务有限公司 | 交通出行数据处理方法及装置 |
CN106570810A (zh) * | 2016-11-15 | 2017-04-19 | 中兴软创科技股份有限公司 | 基于ic卡的公交车辆当日下车站点识别方法与系统 |
CN106874432A (zh) * | 2017-01-24 | 2017-06-20 | 华南理工大学 | 一种公共交通乘客出行时空轨迹提取方法 |
CN107483741A (zh) * | 2017-08-30 | 2017-12-15 | 珠海市魅族科技有限公司 | 一种提醒方法及装置、终端和可读存储介质 |
CN107563651A (zh) * | 2017-09-07 | 2018-01-09 | 深圳市蓝泰源信息技术股份有限公司 | 一种公交系统的基于大数据客流分析方法 |
CN108288321A (zh) * | 2018-01-24 | 2018-07-17 | 哈尔滨工业大学 | 基于ic卡数据与车辆gps信息的公交站点上下客流量确定方法 |
CN109033964A (zh) * | 2018-06-22 | 2018-12-18 | 顺丰科技有限公司 | 一种判断车辆到离港事件的方法、系统及设备 |
CN109074706A (zh) * | 2016-12-24 | 2018-12-21 | 华为技术有限公司 | 一种确定用户乘车地理位置的方法及设备 |
CN111798356A (zh) * | 2020-07-09 | 2020-10-20 | 北京交通大学 | 一种基于大数据的轨道交通客流异常模式识别方法 |
CN111858806A (zh) * | 2020-07-09 | 2020-10-30 | 武汉译码当先科技有限公司 | 乘客出行轨迹检测方法、装置、设备及存储介质 |
US11176812B2 (en) | 2018-03-26 | 2021-11-16 | International Business Machines Corporation | Real-time service level monitor |
CN114202922A (zh) * | 2021-12-09 | 2022-03-18 | 贵阳移动金融发展有限公司 | 一种公共交通出行服务大数据采集分析平台 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809344A (zh) * | 2015-04-23 | 2015-07-29 | 中山大学 | 一种基于ic卡数据的公交站点区间客流估计方法 |
-
2015
- 2015-09-22 CN CN201510607088.8A patent/CN105320997A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809344A (zh) * | 2015-04-23 | 2015-07-29 | 中山大学 | 一种基于ic卡数据的公交站点区间客流估计方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295868A (zh) * | 2016-08-03 | 2017-01-04 | 重庆市索美智能交通通讯服务有限公司 | 交通出行数据处理方法及装置 |
CN106570810A (zh) * | 2016-11-15 | 2017-04-19 | 中兴软创科技股份有限公司 | 基于ic卡的公交车辆当日下车站点识别方法与系统 |
CN109074706A (zh) * | 2016-12-24 | 2018-12-21 | 华为技术有限公司 | 一种确定用户乘车地理位置的方法及设备 |
CN106874432A (zh) * | 2017-01-24 | 2017-06-20 | 华南理工大学 | 一种公共交通乘客出行时空轨迹提取方法 |
CN106874432B (zh) * | 2017-01-24 | 2019-08-20 | 华南理工大学 | 一种公共交通乘客出行时空轨迹提取方法 |
CN107483741A (zh) * | 2017-08-30 | 2017-12-15 | 珠海市魅族科技有限公司 | 一种提醒方法及装置、终端和可读存储介质 |
CN107563651A (zh) * | 2017-09-07 | 2018-01-09 | 深圳市蓝泰源信息技术股份有限公司 | 一种公交系统的基于大数据客流分析方法 |
CN108288321A (zh) * | 2018-01-24 | 2018-07-17 | 哈尔滨工业大学 | 基于ic卡数据与车辆gps信息的公交站点上下客流量确定方法 |
US11176812B2 (en) | 2018-03-26 | 2021-11-16 | International Business Machines Corporation | Real-time service level monitor |
CN109033964A (zh) * | 2018-06-22 | 2018-12-18 | 顺丰科技有限公司 | 一种判断车辆到离港事件的方法、系统及设备 |
CN111858806A (zh) * | 2020-07-09 | 2020-10-30 | 武汉译码当先科技有限公司 | 乘客出行轨迹检测方法、装置、设备及存储介质 |
CN111798356A (zh) * | 2020-07-09 | 2020-10-20 | 北京交通大学 | 一种基于大数据的轨道交通客流异常模式识别方法 |
CN111798356B (zh) * | 2020-07-09 | 2023-11-10 | 北京交通大学 | 一种基于大数据的轨道交通客流异常模式识别方法 |
CN114202922A (zh) * | 2021-12-09 | 2022-03-18 | 贵阳移动金融发展有限公司 | 一种公共交通出行服务大数据采集分析平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105320997A (zh) | 一种基于大数据的公交客流轨迹实时跟踪方法 | |
Tang et al. | Taxi trips distribution modeling based on Entropy-Maximizing theory: A case study in Harbin city—China | |
Downward et al. | Tourism transport and visitor spending: A study in the North York Moors National Park, UK | |
CN104157139B (zh) | 一种交通拥堵预测方法及可视化方法 | |
CN104217250B (zh) | 一种基于历史数据的城市轨道交通新线开通客流预测方法 | |
CN102592447B (zh) | 一种基于fcm的区域路网的道路交通状态判别方法 | |
Wang et al. | Inter-city connections in China: High-speed train vs. inter-city coach | |
CN103871246B (zh) | 基于路网空间关系约束Lasso的短时交通流预测方法 | |
CN102169630B (zh) | 一种道路连续交通流数据质量控制方法 | |
CN105469602B (zh) | 一种基于ic卡数据的公交乘客候车时间范围的预测方法 | |
CN102156732B (zh) | 基于特征站点的公交ic卡数据站点匹配方法 | |
CN106971534A (zh) | 基于号牌数据的通勤出行特征分析方法 | |
CN103440764A (zh) | 一种基于车辆自动识别数据的城市路网车辆出行路径重构方法 | |
CN104134349A (zh) | 一种基于交通多源数据融合的公交路况处理系统及方法 | |
CN104064028A (zh) | 基于多元信息数据的公交到站时间预测方法及系统 | |
CN101964085A (zh) | 一种基于Logit模型和贝叶斯决策的客流分配方法 | |
CN102136190A (zh) | 城市公交客运事件应急响应调度管理系统及方法 | |
CN104809112A (zh) | 一种基于多源数据的城市公交发展水平综合评价方法 | |
Li et al. | Improving service quality with the fuzzy TOPSIS method: a case study of the Beijing rail transit system | |
Nour et al. | Classification of automobile and transit trips from Smartphone data: Enhancing accuracy using spatial statistics and GIS | |
Wang et al. | Forecasting travel speed in the rainfall days to develop suitable variable speed limits control strategy for less driving risk | |
Jian Daniel et al. | Research and analysis on causality and spatial-temporal evolution of urban traffic congestions—a case study on Shenzhen of China | |
Fu et al. | Integration of dockless bike-sharing and metro: Prediction and explanation at origin-destination level | |
Lower et al. | Evaluation of the location of the P&R facilities using fuzzy logic rules | |
Li et al. | Route restoration method for sparse taxi GPS trajectory based on Bayesian network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160210 |