CN108389420A - 一种基于历史出行特征的公交乘客下车站点实时识别方法 - Google Patents

一种基于历史出行特征的公交乘客下车站点实时识别方法 Download PDF

Info

Publication number
CN108389420A
CN108389420A CN201810203079.6A CN201810203079A CN108389420A CN 108389420 A CN108389420 A CN 108389420A CN 201810203079 A CN201810203079 A CN 201810203079A CN 108389420 A CN108389420 A CN 108389420A
Authority
CN
China
Prior art keywords
bus
history
passenger
data
getting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810203079.6A
Other languages
English (en)
Inventor
王茜竹
江德潮
徐瑞
韦青霞
杨晓雅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201810203079.6A priority Critical patent/CN108389420A/zh
Publication of CN108389420A publication Critical patent/CN108389420A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/123Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams

Abstract

本发明涉及居民出行轨迹分析及计算机应用技术领域,提供了一种基于历史出行特征的公交乘客实时识别方法。首先融合公交车GPS数据和IC卡数据实现公交乘客的上车站点识别;然后通过对历史数据挖掘建立包含居民历史出行轨迹特征和站点历史上车率特征的历史出行特征库;最后根据将历史数据与历史出行特征库进行相似度匹配,完成乘客下车站点的实时识别;该方法成果可应用与居民出行轨迹分析、公交运营调度、城市建设规划等领域,提高准确地数据支撑。

Description

一种基于历史出行特征的公交乘客下车站点实时识别方法
技术领域
本发明涉及居民出行轨迹分析及计算机应用技术领域,特别是涉及一种基于的历史出行特征公交乘客下车站点识别方法。
背景技术
随着公共交通硬件设备升级更新,公共交通一卡通系统不断普及、IC卡使用率不断提升,积累的海量IC卡及GPS数据为公共交通大数据分析提供了可行性。以重庆市为例,主城区公共交通一卡通系统覆盖地面公交、轨道交通、出租车、索道和扶梯等,IC使用占比达到88%。但是目前各大城市普遍采用一票制IC卡系统,只记录乘客上车刷卡时间及乘坐的车辆编号等信息,公交乘客下车站点的识别成为难题。现有公交乘客下车站点识别算法主要有两种:出行链理论法和站点下车概率法。基于出行链理论的识别算法仅能识别具有完整闭合出行特征的乘客下车站点,需离线处理且识别率低;基于站点下车概率法需要考虑站点影响因素多,且没有考虑到乘客的个体特性,只能通过概率计算得到各站点的下车人数而无法得到每个乘客确切的下车位置,并且不能体现一天中不同时间段的乘客选择差异,此方法主观性强且精确度低。如何有效提高公交乘客下车站点识别算法的识别率和准确度,在智能公交调度等领域具有重要意义。
发明内容
针对上述问题,本发明提出一种基于历史出行特征的公交乘客下车站点实时识别方法,通过对历史数据的挖掘,识别居民历史出行轨迹特征和站点历史上车率特征,并建立相应的历史出行特征知识库,利用该知识库实现乘客下车站点的高准确率实时识别。本发明是通过以下技术方案来实现的:
一种基于历史出行特征的公交乘客下车站点实时识别方法,其包括以下步骤:
第一步:数据源获取。通过kafka集群获取IC卡刷卡数据和公交车GPS实时数据。
第二步:数据预处理。对IC卡刷卡数据和公交车GPS数据进行预处理,主要包括错误数据处理和有效字段筛选。
第三步:上车站点识别。利用基于时空匹配的公交乘客上车站点识别方法完成上车站点识别。
第四步:基于居民历史出行轨迹特征匹配。根据公交乘客本次刷卡的线路、上车站点、上车时间等信息与居民历史出行线路特征进行匹配,识别乘客下车站点。若不能识别乘客下车站点则进行第五步。
第五步:基于站点历史上车率特征判断。通过与站点历史上车特征对比,推算出乘客可能的下车站点。
第六步:历史出行特征库更新。缓存当日数据,根据居民历史出行线路特征、站点历史上车率特征的构建方法更新历史出行特征库。
本发明的优点及有益效果如下:
本发明所述基于历史出行特征的公交乘客下车站点实时识别方法,通过挖掘历史数据中历史数据中的出行轨迹特征,判断其换乘可能性,能够弥补出行链理论中链路断裂的缺陷,有效提高乘客下车站点的识别率且能完成实时识别,具有较高的实用价值。
附图说明
图1为基于历史出行特征的公交乘客下车站点实时识别方法流程图;
图2为居民历史出行轨迹示意图。
具体实施方式
为了说明本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图与具体实施例对本发明作进一步说明:
如图1所示为本发明的整体识别流程,一种基于历史出行特征的公交乘客下车站点实时识别方法,主要包含以下步骤:
S1:数据源获取。通过kafka集群获取IC卡刷卡数据和公交车GPS实时数据。
S2:数据预处理。对IC卡刷卡数据和公交车GPS数据进行预处理,主要包括错误数据处理和有效字段筛选。
IC卡不仅可以在公共交通领域使用,,用户可以在生活超市、饮食快餐、影院景区等签约商户进行消费。本研究仅针对乘客公交出行数据进行,所以需要根据消费类型对无关数据进行剔除。另外在设备采集和数据传输过程会造成极少量数据缺失或乱码,此部分数据也予以剔除。
公交车GPS数据中的噪声数据包括重复数据和异常数据。在公交车运行过程中,由于隧道等因素干扰有时候会造成数据传输中断,在信号恢复后的多次重传造成数据重复。本研究中只采用重复数据中的第一条记录,对其他记录予以剔除。根据经纬度范围,对于超出范围的数据进行剔除,其次对数据中经纬度值为0的予以剔除。
IC卡刷卡数据和公交车GPS数据中存在大量无用字段,针对乘客下车站点识别需要,本研究仅筛选出有效字段以减少数据量,提高分析效率。
S3:上车站点识别。利用现有的基于时空匹配的公交乘客上车站点识别方法完成上车站点识别。该方法已经应用较为成熟,所以不再赘述。
S4:基于居民历史出行轨迹特征匹配。根据公交乘客本次刷卡的线路、上车站点、上车时间等信息与居民历史出行线路特征进行匹配,识别乘客下车站点。若不能识别乘客下车站点则转到S5。居民历史出行轨迹特征的构建方法在后文进行描述。
S5:基于站点历史上车率特征判断。通过与站点历史上车率特征对比,推算出乘客可能的下车站点。站点历史上车率特征通过对完成历史数据的上车站点识别,并统计各线路站点的分时段上车率来构建。
S6:历史出行特征库更新。缓存当日数据,根据居民历史出行线路特征、站点历史上车率特征的构建方法更新历史出行特征库。
上述步骤S4历史出行轨迹特征构建方法主要包括以下2个步骤:
S41:居民历史公交出行轨迹刻画。识别历史数据中居民所有的上车站点,并提取相应的公交线路信息,以上车站点为节点,公交线路为链路,完成居民历史公交出行轨迹刻画。
S42:站点间换乘可能性判断。站点间换乘可能性主要可以通过换乘距离和换乘时间来判定。现实生活中公交车的行驶线路是不规则的曲线,这为计算站点间的路程带来了难度。为此借鉴GIS中道路线性分段处理,对公交线路进行线性化处理,用于后续的换乘距离和换乘时间估算。选取所研究公交线路上的公交站点、交叉路口等特殊位置做为公交线路的划分节点,节点间依次使用线段相连,完成公交线路的线性化。
在换乘距离估算过程主要存在以下3种情况:
第一种:乘客在线路A的上车站点与线路B上某站点重合,则此时换乘距离记为零。
第二种:乘客在线路A上车站点所在链路与线路B存在交叉,则此时站点间的换乘距离估算方式为以两条线路交叉点做为中间节点,分别计算各线路的链路距离,换乘距离近似等于线路A上的距离与线路B上的距离之和。
第三种:乘客在线路A的上车站点为线路起始站,线路B与其相近的站点也为线路的起始站或终点站,则换乘距离以站点间的直线距离代替,通过以下距离公式计算:
其中Lab为换乘距离,线路A上车站点的经纬度为(lons,lats),线路B相近站点的经纬度为(lonb,latb),R为地球半径。

Claims (7)

1.一种基于历史出行特征的公交乘客实时识别方法,其特征在于,按如下步骤进行:
(1)数据源获取,通过kafka集群获取IC卡刷卡数据和公交车GPS实时数据;
(2)数据预处理,对IC卡刷卡数据和公交车GPS数据进行预处理,主要包括错误数据处理和有效字段筛选;
(3)上车站点识别,利用基于时空匹配的公交乘客上车站点识别方法完成上车站点识别;
(4)基于居民历史出行轨迹特征匹配,根据公交乘客本次刷卡的线路、上车站点、上车时间等信息与居民历史出行轨迹特征进行匹配,识别乘客下车站点。若不能识别乘客下车站点则进行站点历史上车率特征判断;
(5)基于站点历史上车率特征判断,通过与站点历史上车特征对比,推算出乘客可能的下车站点;
(6)历史出行特征库更新,缓存当日数据,根据居民历史出行线路特征、站点历史上车率特征的构建方法更新历史出行特征库。
2.根据权利要求1所述基于历史出行特征的公交乘客实时识别方法,其特征在于,数据源获取,通过kafka集群获取IC卡刷卡数据和公交车GPS实时数据。
3.根据权利要求1所述基于历史出行特征的公交乘客实时识别方法,其特征在于,数据预处理,对IC卡刷卡数据和公交车GPS数据进行预处理,主要包括错误数据处理和有效字段筛选。
4.根据权利要求1所述基于历史出行特征的公交乘客实时识别方法,其特征在于,上车站点识别,利用基于时空匹配的公交乘客上车站点识别方法完成上车站点识别。
5.根据权利要求1所述基于历史出行特征的公交乘客实时识别方法,其特征在于,基于居民历史出行轨迹特征匹配,根据公交乘客本次刷卡的线路、上车站点、上车时间等信息与居民历史出行轨迹特征进行匹配,识别乘客下车站点。若不能识别乘客下车站点则进行站点历史上车率特征判断。
6.根据权利要求1所述基于历史出行特征的公交乘客实时识别方法,其特征在于,基于站点历史上车率特征判断,通过与站点历史上车特征对比,推算出乘客可能的下车站点。
7.根据权利要求1所述基于历史出行特征的公交乘客实时识别方法,其特征在于,历史出行特征库更新,缓存当日数据,根据居民历史出行线路特征、站点历史上车率特征的构建方法更新历史出行特征库。
CN201810203079.6A 2018-03-13 2018-03-13 一种基于历史出行特征的公交乘客下车站点实时识别方法 Pending CN108389420A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810203079.6A CN108389420A (zh) 2018-03-13 2018-03-13 一种基于历史出行特征的公交乘客下车站点实时识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810203079.6A CN108389420A (zh) 2018-03-13 2018-03-13 一种基于历史出行特征的公交乘客下车站点实时识别方法

Publications (1)

Publication Number Publication Date
CN108389420A true CN108389420A (zh) 2018-08-10

Family

ID=63066770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810203079.6A Pending CN108389420A (zh) 2018-03-13 2018-03-13 一种基于历史出行特征的公交乘客下车站点实时识别方法

Country Status (1)

Country Link
CN (1) CN108389420A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308546A (zh) * 2018-08-31 2019-02-05 江苏智通交通科技有限公司 乘客公交出行下车站点预测方法及系统
CN109885765A (zh) * 2019-01-31 2019-06-14 曾国进 一种适用于固定线路交通工具的乘客信息分析推送系统
CN110009124A (zh) * 2019-01-03 2019-07-12 阿里巴巴集团控股有限公司 一种确定公交站点的数据处理方法、服务器和系统
CN110085048A (zh) * 2019-06-04 2019-08-02 湖南智慧畅行交通科技有限公司 一种基于gps数据的公交车实时到离站点计算方法
CN110148225A (zh) * 2019-04-26 2019-08-20 阿里巴巴集团控股有限公司 交通站点确定方法及装置、设备及存储设备
CN110222892A (zh) * 2019-06-06 2019-09-10 武汉元光科技有限公司 乘客的下车站点预测方法及装置
CN111047858A (zh) * 2019-11-20 2020-04-21 青岛海信网络科技股份有限公司 一种融合算法的公交客流出行od确定方法及装置
CN111310994A (zh) * 2020-02-11 2020-06-19 罗普特科技集团股份有限公司 一种基于数据校准的公交路线预测方法及系统
CN111339159A (zh) * 2020-02-24 2020-06-26 交通运输部科学研究院 一种一票制公交数据的分析挖掘方法
CN111653099A (zh) * 2020-06-10 2020-09-11 南京瑞栖智能交通技术产业研究院有限公司 基于手机信令数据的公交客流od获取方法
CN111723871A (zh) * 2020-07-09 2020-09-29 广州市公共交通数据管理中心 一种公交车实时车厢满载率的估算方法
CN111754760A (zh) * 2019-03-28 2020-10-09 北京交研智慧科技有限公司 一种确定公交下车站点的方法、装置及上位机
CN112511982A (zh) * 2020-11-19 2021-03-16 同济大学 一种出行语义自动标注的地铁乘客轨迹实时追溯还原方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5214391B2 (ja) * 2008-10-06 2013-06-19 株式会社日本総合研究所 利用者情報送信装置および利用者情報送信システム
CN103714391A (zh) * 2012-09-29 2014-04-09 国际商业机器公司 用于推算公交系统中乘行路径的方法和装置
CN105447603A (zh) * 2016-01-06 2016-03-30 北京交通大学 一种轨道交通不确定客流需求下的车站限流方法
CN105788260A (zh) * 2016-04-13 2016-07-20 西南交通大学 一种基于智能公交系统数据的公交乘客od推算方法
CN106373391A (zh) * 2016-08-31 2017-02-01 中兴智能交通股份有限公司 一种服务于城市交通的多维度智能调度服务平台的使用方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5214391B2 (ja) * 2008-10-06 2013-06-19 株式会社日本総合研究所 利用者情報送信装置および利用者情報送信システム
CN103714391A (zh) * 2012-09-29 2014-04-09 国际商业机器公司 用于推算公交系统中乘行路径的方法和装置
CN105447603A (zh) * 2016-01-06 2016-03-30 北京交通大学 一种轨道交通不确定客流需求下的车站限流方法
CN105788260A (zh) * 2016-04-13 2016-07-20 西南交通大学 一种基于智能公交系统数据的公交乘客od推算方法
CN106373391A (zh) * 2016-08-31 2017-02-01 中兴智能交通股份有限公司 一种服务于城市交通的多维度智能调度服务平台的使用方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
章玉: ""基于数据挖掘的动态公交客流OD获取方法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308546B (zh) * 2018-08-31 2021-09-17 江苏智通交通科技有限公司 乘客公交出行下车站点预测方法及系统
CN109308546A (zh) * 2018-08-31 2019-02-05 江苏智通交通科技有限公司 乘客公交出行下车站点预测方法及系统
CN110009124A (zh) * 2019-01-03 2019-07-12 阿里巴巴集团控股有限公司 一种确定公交站点的数据处理方法、服务器和系统
CN109885765A (zh) * 2019-01-31 2019-06-14 曾国进 一种适用于固定线路交通工具的乘客信息分析推送系统
CN111754760B (zh) * 2019-03-28 2021-12-21 北京交研智慧科技有限公司 一种确定公交下车站点的方法、装置及上位机
CN111754760A (zh) * 2019-03-28 2020-10-09 北京交研智慧科技有限公司 一种确定公交下车站点的方法、装置及上位机
CN110148225B (zh) * 2019-04-26 2022-02-08 创新先进技术有限公司 交通站点确定方法及装置、设备及存储设备
CN110148225A (zh) * 2019-04-26 2019-08-20 阿里巴巴集团控股有限公司 交通站点确定方法及装置、设备及存储设备
CN110085048A (zh) * 2019-06-04 2019-08-02 湖南智慧畅行交通科技有限公司 一种基于gps数据的公交车实时到离站点计算方法
CN110222892A (zh) * 2019-06-06 2019-09-10 武汉元光科技有限公司 乘客的下车站点预测方法及装置
CN110222892B (zh) * 2019-06-06 2021-07-06 武汉元光科技有限公司 乘客的下车站点预测方法及装置
CN111047858A (zh) * 2019-11-20 2020-04-21 青岛海信网络科技股份有限公司 一种融合算法的公交客流出行od确定方法及装置
CN111310994B (zh) * 2020-02-11 2022-08-12 罗普特科技集团股份有限公司 一种基于数据校准的公交路线预测方法及系统
CN111310994A (zh) * 2020-02-11 2020-06-19 罗普特科技集团股份有限公司 一种基于数据校准的公交路线预测方法及系统
CN111339159A (zh) * 2020-02-24 2020-06-26 交通运输部科学研究院 一种一票制公交数据的分析挖掘方法
CN111653099A (zh) * 2020-06-10 2020-09-11 南京瑞栖智能交通技术产业研究院有限公司 基于手机信令数据的公交客流od获取方法
CN111653099B (zh) * 2020-06-10 2022-06-17 南京瑞栖智能交通技术产业研究院有限公司 基于手机信令数据的公交客流od获取方法
CN111723871A (zh) * 2020-07-09 2020-09-29 广州市公共交通数据管理中心 一种公交车实时车厢满载率的估算方法
CN111723871B (zh) * 2020-07-09 2022-05-27 广州市公共交通数据管理中心有限公司 一种公交车实时车厢满载率的估算方法
CN112511982B (zh) * 2020-11-19 2021-11-09 同济大学 一种出行语义自动标注的地铁乘客轨迹实时追溯还原方法
CN112511982A (zh) * 2020-11-19 2021-03-16 同济大学 一种出行语义自动标注的地铁乘客轨迹实时追溯还原方法

Similar Documents

Publication Publication Date Title
CN108389420A (zh) 一种基于历史出行特征的公交乘客下车站点实时识别方法
CN108242149A (zh) 一种基于交通数据的大数据分析方法
CN101197077B (zh) 一种汽车行驶路线分析、统计方法
CN108362293B (zh) 一种基于关键点技术的车辆轨迹匹配方法
CN109191845B (zh) 一种公交车辆到站时间预测方法
CN109285376A (zh) 一种基于深度学习的公交车客流统计分析系统
CN103310651A (zh) 一种基于实时路况信息的公交到站预测方法
CN104809344A (zh) 一种基于ic卡数据的公交站点区间客流估计方法
CN105096590B (zh) 交通信息生成方法和交通信息生成设备
CN103236166A (zh) 一种使用卫星定位技术进行车辆违章行为辨识的方法
CN109813327B (zh) 一种车辆行驶轨迹缺失补偿方法
CN108062857B (zh) 用于出租车乘客出行目的的预测方法
US20210407284A1 (en) Vehicle traffic flow prediction method with missing data
CN105868861A (zh) 一种基于时空数据融合的公交客流演化分析方法
CN106710208A (zh) 交通状态的获取方法及装置
CN105377664A (zh) 交通需要控制装置
US20150310356A1 (en) Facility and infrastructure utilization
CN110118567A (zh) 出行方式推荐方法及装置
CN107089209A (zh) 一种用于计算电动汽车续驶里程的方法和装置
CN106568456A (zh) 基于gps/北斗定位和云计算平台的不停车收费方法
CN107590999A (zh) 一种基于卡口数据的交通状态判别方法
CN108090722A (zh) 一种基于gps的物流网络站点识别设备与识别方法
CN105608528A (zh) 基于大数据分析的出租车驾驶员收入-压力评估方法和系统
CN109784416A (zh) 基于手机信令数据的半监督svm的交通方式判别方法
CN110969861B (zh) 一种车辆识别方法、装置、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180810