CN110751830B - 一种集计公交物理站点平均等车时间的方法及系统 - Google Patents
一种集计公交物理站点平均等车时间的方法及系统 Download PDFInfo
- Publication number
- CN110751830B CN110751830B CN201910943528.5A CN201910943528A CN110751830B CN 110751830 B CN110751830 B CN 110751830B CN 201910943528 A CN201910943528 A CN 201910943528A CN 110751830 B CN110751830 B CN 110751830B
- Authority
- CN
- China
- Prior art keywords
- data
- station
- physical
- bus
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种集计公交物理站点平均等车时间的方法及系统,数据采集模块接收5天的公交GPS历史数据,数据预处理模块将公交GPS历史数据集中前、后站的数据结构修改为单站结构,合并前站和后站数据集,对合并后的数据集GPS时间数据格式进行修改,生成集计物理站点模块能计算的时间变量;匹配线路站点和物理站点两数据集,将线路站点编号集计为物理站点编号;数据计算模块统计匹配成功的物理站点在各天、各个时段内到达的公交车数量,按天数对其取均值;根据各时间段间隔时间,计算早晚高峰、平峰时每个物理站点的平均等车时间。本发明可提高公交GPS数据的效用性、准确性,并能获得早晚高峰、平峰时各物理站点的平均等车时间。
Description
技术领域
本发明涉及公共交通信息处理技术领域,具体涉及一种集计公交物理站点平均等车时间的方法及系统。
背景技术
GPS(Global Position System,全球定位系统)技术已经被广泛地应用到公交车辆的车载导航系统中,其可以更好地实现公交车辆的实时调度,并为公交车辆的动态监控管理提供帮助。公交车辆轨迹遍布于整个城市路网,已经装载GPS的公交车辆在提供GPS系统本身的信息之外,也在一定程度上反映了道路网络的状态信息。从交通信息处理与大数据挖掘的角度出发,公交车辆的GPS数据可以为交通状态评估、交通行为分析、出行OD预测以及公交车辆运营管理等诸多方面提供数据支撑。但是由于GPS系统本身存在的误差问题,如GPS系统运行时的稳定性问题(如时间同步稳定性)、可靠性问题(如地形、地势、高楼等对GPS信号接收的干扰),导致公交车辆在行驶过程中的GPS数据瞬时丢失、数据重复等问题,并且由于公交服务系统输出的问题(如输出和GPS数据本身不大相关的数据信息、输出数据格式不统一等),这对进一步利用和开发公交GPS数据造成了困扰。在大数据时代,空有海量的数据,而无法让这些数据产生更多的价值,这无疑是一种浪费。现有的公交GPS到站时间(即物理站点等车时间)预测方法通常需要将公交车GPS数据和电子地图进行匹配,或者是提取公交车的轨迹信息然后进行数据处理,而电子地图存在精度不够的问题,从而导致预测结果不准确;而公交车轨迹信息的获取需要采集一段时间的数据,工作量大,浪费成本。
发明内容
本发明通过一种集计公交物理站点平均等车时间的方法,计算每个物理站点平均等车时间,以解决现有的预测方法精度不够、预测结果不准确的问题,使得公交GPS数据能被更精准地应用。相应的,本发明还提供了一种集计公交物理站点平均等车时间的系统,用以保证上述方法的实现及应用。
本发明是通过以下技术方案实现上述技术目的的。
一种集计公交物理站点平均等车时间的方法,数据采集模块采集公交GPS历史数据,发送给数据预处理模块;数据预处理模块将前站和后站的数据结构修改为单站结构,再将公交线路站点集计为公交物理站点,发送给结果计算模块;结果计算模块统计每天各时间段内每个物理站点到达的公交车数量的平均值,根据各时间段的时间间隔计算每个公交物理站点的平均等车时间。
进一步,所述将公交线路站点集计为公交物理站点之前,数据预处理模块对公交GPS历史数据进行过滤处理,删掉重复数据、修改时间变量的格式。
进一步,所述前站和后站的数据结构修改为单站结构,具体为:将公交车上游和下游站点的数据进行纵向合并。
更进一步,所述将公交车上游和下游站点的数据进行纵向合并,具体包括:删除不需使用的变量,根据历史数据的变量名称,对数据进行拆分,分离公交线路站点数据集中的上游站点和下游站点数据,分别保存为两个数据集,将两站点数据集进行纵向合并。
进一步,所述将公交线路站点集计为公交物理站点,具体为:将物理站点数据集导入集计物理站点模块中,集计物理站点模块将物理站点编码和线路站点编码匹配,集计公交物理站点。
一种集计公交物理站点平均等车时间的系统,包括依次信号连接的数据采集模块、数据预处理模块和结果计算模块;
所述数据采集模块采集公交GPS历史数据;
所述数据预处理模块,修改前后站数据结构、过滤处理公交GPS历史数据、集计物理站点编码;
所述结果计算模块,计算每个公交物理站点在各时段内的平均等车时间。
上述技术方案中,所述数据预处理模块包括依次信号连接的数据结构修改模块、数据过滤处理模块和集计物理站点模块。
上述技术方案中,所述数据结构修改模块将前站和后站的数据结构修改为单站结构;
所述数据过滤处理模块过滤处理异常数据、不需要的数据以及重复数据;
所述集计物理站点模块匹配公交线路站点编码和公交物理站点编码。
本发明的有益效果为:本发明通过数据采集模块采集海量的公交GPS历史数据,发送给数据预处理模块,数据预处理的过程包括:首先通过异常数据和重复数据筛选算法对公交GPS历史数据进行过滤处理,将前站和后站的数据结构修改为单站的结构,再根据物理站点信息,将公交线路站点集计为物理站点,数据预处理模块将物理站点发送给结果计算模块,统计各时间段内每个物理站点到达的公交车数量,按天数对其取均值,最后根据各时间段的时间间隔,计算早晚高峰、平峰时每个物理站点的平均等车时间。本发明对公交规划,利用公交GPS数据进行进一步的分析(如可达性分析)提供了较准确的数据参考。
附图说明
图1是本发明集计公交物理站点平均等车时间的系统结构图;
图2是本发明集计公交物理站点平均等车时间的方法流程图;
图3是本发明集计公交物理站点平均等车时间的方法中GPS时间标准化处理方法的流程图。
具体实施方式
以下结合本发明实施例中的附图及具体案例对本发明进行清楚、完整地详细说明。
图1为本发明集计公交物理站点平均等车时间的系统,包括依次信号连接的数据采集模块、数据预处理模块和结果计算模块;公交历史GPS数据采集模块,用于接收公交车辆GPS历史数据;数据预处理模块,用于过滤处理公交GPS历史数据以及修改前后站数据结构、集计物理站点编码;结果计算模块,用于计算每个公交物理站点在各时段内的平均等车时间。所述数据预处理模块包括:数据结构修改模块,用于将前站和后站的数据结构修改为单站的结构;异常数据和重复数据过滤处理模块,用于异常数据和本方法不需要的数据以及重复数据的过滤处理;集计物理站点模块,用于匹配公交线路站点编码和公交物理站点编码。
如图2所示,本发明集计公交物理站点平均等车时间的方法,该方法通过数据采集模块采集海量的公交GPS历史数据,数据预处理模块将前站和后站的数据结构修改为单站的结构,根据公交物理站点信息,将公交线路站点集计为公交物理站点,结果计算模块统计各时间段内每个物理站点到达的公交车数量,按5天取均值,最后根据各时间段的时间间隔计算早晚高峰、平峰时每个公交物理站点的平均等车时间(min)。具体详细的步骤如下:
步骤1:数据采集模块采集5天公交线路的GPS历史数据,发送给数据预处理模块;
采集的公交GPS历史数据,包括上海公交2019年6月17日-2019年6月21日GPS数据,共7175719条;表1为GPS数据变量说明。
表1上海公交2019年6月17日-2019年6月21日GPS数据变量说明
步骤2:在数据预处理之前,观察数据信息,确定公交GPS历史数据的种类(模型版本编码、数据采集日期、公交线路编码、公交线路版本号、公交车辆编号、公交线路方向、运单号、前站站序、后站站序、前站到站时刻、后站到站时刻、时间间隔、站间距、站间车速和时刻)。
步骤3:将公交GPS历史数据集中前站和后站的数据结构修改为单站结构,合并前站和后站的数据集;具体为:
步骤301:删除不需使用的变量,model_ver_code,cal_speed,cal_date;
步骤302:根据历史数据的变量名称,对数据进行拆分,删除station_sqn_end、gps_time_stop两个变量;将station_sqn_start重命名为station_sqn、gps_time_start重命名为gps_time,并保存成新的一组数据;重新对步骤301中得到的数据删除station_sqn_start和gps_time_start两个变量;将station_sqn_end重命名为station_sqn、gps_time_stop重命名为gps_time,并保存成另一组数据;对两组数据进行纵向合并,将前站和后站的数据结构修改为单站的结构,方法为append using gps20190617-21_end;
步骤303:对步骤302中得到的数据的重复部分进行删除,将数据集按照线路编码、线路方向、车辆编号、运单号、站序排序,方法为sort route_code route_trend vehicle_no waybill_no station_sqn;共删除数据6797796条,保存数据集文件,此时共有7553642条记录。
步骤4:对步骤3得到的数据集的GPS时间数据格式进行修改,生成数据过滤处理模块能够计算的时间变量;修改后的数据集为线路站点数据集;具体如下:
步骤401:对步骤303得到的数据集中gps_time的时间字符串的个数进行统计,存储进新生成的变量time_count中;
步骤402:通过首位添零的方式,将gps_time字符串补成六位,并按照时:分:秒的格式从首位开始依次取两位,并添加日期,从而将gps_time变为标准的时间字符串格式存储进新的变量ts中,进而转换为可以进行计算的Stata时间变量t,参见图3;
步骤403:数据过滤预处理模块生成变量t_mark用来标识路段上游站点到达时间段,用1、2、3、4分别代表早高峰(7:00~9:00)、白天平峰(9:00~17:00)、晚高峰(17:00~19:00)、夜间平峰(19:00~7:00);
步骤404:数据过滤预处理模块将数据采集日期生成新的日期变量date_id,将具体日期2019-06-17、2019-06-18、2019-06-19、2019-06-20、2019-06-21用数字1、2、3、4、5进行编码。
步骤5:使用公交物理站点数据集(相应变量说明见表2),匹配线路站点和物理站点两个数据集,将线路站点编号集计为物理站点编号;
表2上海公交物理站点对应表
具体过程为:
步骤501:将物理站点数据集导入集计物理站点模块中,对变量进行筛选,保留并重命名相关变量,变量LINE_STANDARD_CODE重命名为code、变量LINE_UPDOWN重命名为trend、变量STATION_ORDER重命名为sqn、变量STATION_VISUM_CODE重命名为physical_id,删除无需使用的变量;
步骤502:匹配线路站点编码和物理站点编码前,使两个数据集进行匹配的变量code、trend、sqn名称相同,将步骤303得到的数据集中的station_sqn重命名为sqn、route_trend重命名为trend、route_code重命名为code;
步骤503:依据线路编码(code)、线路方向(trend)、站序(sqn)匹配两个数据集,命令为merge m:1trend code sqn using physical.dta,匹配结果为6505386个线路站点匹配成功,1059541个线路站点没有匹配上,公交物理站点原始数据集共有物理站点13467个,匹配成功的物理站点8824个。
步骤6:统计匹配成功的物理站点在各天、各个时段内到达的公交车数量,按天数对其取均值;具体如下:
步骤601:统计匹配成功的物理站点在各天、各个时段到达的公交车数量,方法为collapse(count)freq=code if_merge==3,by(date_id t_mark physical_id);
步骤602:统计各物理站点到达的公交车数量是由几天的数据计算而来,根据日期(date_id)、时间段(t_mark)、物理站点编码(physical_id)进行分组,在每天、每个时间段、每个物理站点数据的最后一行标记数字1,方法为by date_id t_mark physical_id,sort:gen check=1if_n==_N;
步骤603:按天数对每个物理站点在每个时间段内到达的公交车辆数取均值,并合计结果是由几天的数据计算而来。
步骤7:根据各时间段间隔时间,计算早晚高峰、平峰时每个物理站点的平均等车时间。
步骤701:以分钟(min)为单位,生成新的变量minutes,分别赋值每个时间段的间隔时间,方法为recode t_mark(1=120)(2=480)(3=120)(4=720),gen(minutes);
步骤702:根据各时间段的时间间隔除以在每个时段内五天平均到达的公交车辆数量,计算早高峰、白天平峰、晚高峰和夜间平峰每个物理站点的平均等车时间,命令为genwait=minutes/freq_mean;
步骤703:保存数据集,导出Excel文件。
上述技术方案中,所述GPS数据为当天特定城市的真实公交车辆的车载GPS数据。
为了验证本发明提出的算法的可行性和准确性,以及补足效果的真实性,选取上海公交2019年6月17日至2019年6月21日每天00:00:00到24:00:00的GPS数据进行补足。
利用本发明的步骤,首先将当天的数据导入到数据预处理模块中,共计7175719条数据。将前站和后站的数据结构修改为单站的结构,实行前站和后站数据的纵向合并,并删除重复数据6797796条,此时数据集中共计7553642条数据。将公交线路站点集计为公交物理站点,匹配成功线路站点6505386个,没有匹配上线路站点1059541个。原始数据集共有物理站点13467个,匹配成功的物理站点8824个。对每个物理站点在每个时间段内到达的公交车辆数按天数取均值,将各时间段时间间隔以分钟(min)为单位,计算早晚高峰、平峰时每个物理站点的平均等车时间。如闽行28路(金辉路朱建路--甬虹路公交枢纽站)的金光路运乐路站的早高峰等车时间为8.12分钟,白天平峰等车时间为12.97分钟,晚高峰等车时间为12.24分钟,夜间平峰等车时间为30.25分钟。
综上所述,经理论以及实例展示,本发明提出的一种基于公交GPS数据集计物理站点平均等车时间方法,能够利用海量的公交GPS数据,通过数据过滤清洗、修改数据结构、集计公交物理站点的过程,计算出早晚高峰、平峰时每个物理站点的平均行程时间(min),能够克服现有的预测方法精度不够、预测结果不准确等问题,具有简便的操作性和可重复性以及普适性。本发明对利用公交GPS数据进行进一步的分析(如可达性分析)或进行公交规划提供了较准确的数据参考。
本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (5)
1.一种集计公交物理站点平均等车时间的方法,其特征在于:数据采集模块采集公交GPS历史数据,发送给数据预处理模块;数据预处理模块将前站和后站的数据结构修改为单站结构,再将公交线路站点集计为公交物理站点,发送给结果计算模块;结果计算模块统计每天各时间段内每个物理站点到达的公交车数量的平均值,根据各时间段的时间间隔计算每个公交物理站点的平均等车时间;
所述前站和后站的数据结构修改为单站结构,具体为:将公交车上游和下游站点的数据进行纵向合并,所述将公交车上游和下游站点的数据进行纵向合并,具体包括:删除不需使用的变量,根据历史数据的变量名称,对数据进行拆分,分离公交线路站点数据集中的上游站点和下游站点数据,分别保存为两个数据集,将两站点数据集进行纵向合并;
所述将公交线路站点集计为公交物理站点,具体为:将物理站点数据集导入集计物理站点模块中,集计物理站点模块将物理站点编码和线路站点编码匹配,集计公交物理站点;匹配线路站点编码和物理站点编码前,使两个数据集进行匹配的变量线路编码code、线路方向trend、站序sqn名称相同,依据线路编码code、线路方向trend、站序sqn匹配两个数据集。
2.根据权利要求1所述的集计公交物理站点平均等车时间的方法,其特征在于:所述将公交线路站点集计为公交物理站点之前,数据预处理模块对公交GPS历史数据进行过滤处理,删掉重复数据、修改时间变量的格式。
3.一种实现权利要求1-2任一项所述的集计公交物理站点平均等车时间的方法的系统,其特征在于:包括依次信号连接的数据采集模块、数据预处理模块和结果计算模块;
所述数据采集模块采集公交GPS历史数据;
所述数据预处理模块,修改前后站数据结构、过滤处理公交GPS历史数据、集计物理站点编码;
所述结果计算模块,计算每个公交物理站点在各时段内的平均等车时间。
4.根据权利要求3所述的系统,其特征在于:所述数据预处理模块包括依次信号连接的数据结构修改模块、数据过滤处理模块和集计物理站点模块。
5.根据权利要求4所述的系统,其特征在于:
所述数据结构修改模块将前站和后站的数据结构修改为单站结构;
所述数据过滤处理模块过滤处理异常数据、不需要的数据以及重复数据;
所述集计物理站点模块匹配公交线路站点编码和公交物理站点编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910943528.5A CN110751830B (zh) | 2019-09-30 | 2019-09-30 | 一种集计公交物理站点平均等车时间的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910943528.5A CN110751830B (zh) | 2019-09-30 | 2019-09-30 | 一种集计公交物理站点平均等车时间的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110751830A CN110751830A (zh) | 2020-02-04 |
CN110751830B true CN110751830B (zh) | 2021-11-23 |
Family
ID=69277635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910943528.5A Active CN110751830B (zh) | 2019-09-30 | 2019-09-30 | 一种集计公交物理站点平均等车时间的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110751830B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111340289B (zh) * | 2020-02-25 | 2022-06-14 | 杭州电子科技大学 | 一种基于遗传算法的公交发车与车速调整优化方法及系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101388143B (zh) * | 2007-09-14 | 2011-04-13 | 同济大学 | 基于浮动车数据的公交到站时间预测方法 |
CN102651172A (zh) * | 2011-02-24 | 2012-08-29 | 杜也兵 | 公交车站台电子候车时间计时显示方法 |
JP2013140498A (ja) * | 2012-01-05 | 2013-07-18 | Traffic Plus:Kk | バスプローブデータによる一般車の推定走行軌跡取得方法 |
CN104123841B (zh) * | 2014-08-14 | 2016-08-24 | 苏州大学 | 一种车辆到站时间的获取方法及系统 |
CN106448233B (zh) * | 2016-08-19 | 2017-12-05 | 大连理工大学 | 基于大数据的公交线路时刻表协同优化方法 |
CN107545730B (zh) * | 2017-09-08 | 2020-04-07 | 哈尔滨工业大学 | 一种基于公交ic卡数据的站点上下车乘客数估计方法 |
CN107564292B (zh) * | 2017-10-24 | 2020-03-31 | 东南大学 | 基于站点WiFi和车载移动终端的乘客等车时间规律估计方法 |
CN208384821U (zh) * | 2017-12-11 | 2019-01-15 | 北京万集科技股份有限公司 | 一种基于lte-v通讯技术的公交车实时查询系统 |
-
2019
- 2019-09-30 CN CN201910943528.5A patent/CN110751830B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110751830A (zh) | 2020-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110867090B (zh) | 一种基于公交车载gps数据的相邻公交物理站点间平均行程时间计算方法及系统 | |
CN100463009C (zh) | 一种交通信息融合处理方法和系统 | |
CN102855760B (zh) | 基于浮动车数据的在线排队长度检测方法 | |
CN103310651B (zh) | 一种基于实时路况信息的公交到站预测方法 | |
CN103454660B (zh) | 一种车辆定位方法及装置 | |
CN102324128A (zh) | 基于ic卡记录的公交站间od客流预测方法及装置 | |
CN103985247A (zh) | 基于城市叫车需求分布密度的出租车运力调度系统 | |
CN106898142B (zh) | 一种考虑路段相关性的路径行程时间可靠度计算方法 | |
CN104732765A (zh) | 基于卡口数据的城市道路饱和度实时监测方法 | |
CN1716335A (zh) | 道路交通实时信息调查系统 | |
CN109389243A (zh) | 结合联网收费数据的高速公路交通情况调查站点布设方法 | |
CN102568207A (zh) | 交通数据处理方法和装置 | |
CN110751830B (zh) | 一种集计公交物理站点平均等车时间的方法及系统 | |
CN105046959A (zh) | 基于双窗口滑动匹配机制的城市道路行程时间提取方法 | |
CN109493601B (zh) | 一种公交支线设置方法 | |
CN105185103A (zh) | 一种路段行程时间的管理控制方法 | |
CN114078322B (zh) | 一种公交运行状态评价方法、装置、设备及存储介质 | |
CN116204576B (zh) | 一种公共交通数据生成gtfs格式数据的生成方法及系统 | |
CN110223103A (zh) | 基于北斗组合导航的出租车计费系统及其工作方法 | |
CN106875321B (zh) | 一种列车线路空间数据实时自动生成方法 | |
CN113838282A (zh) | 基于北斗定位的车辆异常行为检测方法 | |
CN110879862B (zh) | 基于物联网的车辆信息查询系统 | |
CN203931199U (zh) | 一种智能交通道路容量短信播报系统 | |
CN113870559B (zh) | 一种基于大数据车联网的交通流量计算方法 | |
McCormack | Using a GIS to enhance the value of travel diaries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |