CN115376325A - 基于出行链的公共交通换乘数据筛选系统、方法及应用 - Google Patents

基于出行链的公共交通换乘数据筛选系统、方法及应用 Download PDF

Info

Publication number
CN115376325A
CN115376325A CN202211306253.2A CN202211306253A CN115376325A CN 115376325 A CN115376325 A CN 115376325A CN 202211306253 A CN202211306253 A CN 202211306253A CN 115376325 A CN115376325 A CN 115376325A
Authority
CN
China
Prior art keywords
data
passenger
trip
traffic
transfer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211306253.2A
Other languages
English (en)
Other versions
CN115376325B (zh
Inventor
李默雷
孙贤杰
陆篡民
侯芸
董元帅
史昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Highway Engineering Consultants Corp
CHECC Data Co Ltd
Original Assignee
China Highway Engineering Consultants Corp
CHECC Data Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Highway Engineering Consultants Corp, CHECC Data Co Ltd filed Critical China Highway Engineering Consultants Corp
Priority to CN202211306253.2A priority Critical patent/CN115376325B/zh
Publication of CN115376325A publication Critical patent/CN115376325A/zh
Application granted granted Critical
Publication of CN115376325B publication Critical patent/CN115376325B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/123Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于公共交通数据处理技术领域,公开了基于出行链的公共交通换乘数据筛选系统、方法及应用。该方法包括:对常规公交、BRT和轨道运营交易数据,先将各源数据单独定义为完整的乘客乘车记录并分隔出行链;再通过关联线路站点信息分别设置交通类型;通过对每个用户时间分组排序确定乘客出行集;再通过经纬度计算距离,在合理的时间间隔、距离下,根据类型不同,合并确定不同交通方式换乘数据。本发明能够直观看到全市公共交通换乘整体情况,换乘频繁的交通方式,换乘密集站点,有助于城市交通规划建设,优化换乘方式,从而提升公众出行服务质量,交通客流预测相关研究,对于普通用户来说可以对鼓励乘客的换乘行为,碳积分计算。

Description

基于出行链的公共交通换乘数据筛选系统、方法及应用
技术领域
本发明属于公共交通数据处理技术领域,尤其涉及基于出行链的公共交通换乘数据筛选系统、方法及应用。
背景技术
城市的快速发展带来了一个无限可变又极其复杂的多维城市交通系统,庞大立体的设施网络、多元综合的出行模式、时序关联的出行目的,城市个体日常出行特征越来越难以预测和捕捉。交通方式换乘信息是个体出行信息采集的重要内容,能够为客观把握不同交通方式出行需求、指导合理交通规划、优化交通基础设施等起到重要作用,也是城市智能交通信息系统构建的重要数据基础。
现有关于交通方式换乘信息采集主要有纸质问卷法以及互联网记录法:然而,现有技术中存在一定的技术缺陷,例如公交IC卡刷卡,只能够获取上车地点信息,却无法记录下车地点信息,换乘点存在遗漏现象;此外,小汽车、出租车、步行等作为重要的日常交通方式,互联网记录法目前还无法获取这些出行方式的换乘信息。
因此,从当前交通方式换乘信息识别困境来看,亟待寻求一种更加智能、普适、精确的技术手段作为现有技术的替代或提升。
为解决上述问题,现有技术提供一种基于支持向量机模型的交通方式换乘行为识别方法,首先,分析个体出行GNSS卫星定位数据时空特征,识别个体移动状态;其次,分析不同交通方式换乘行为规律,提炼交通方式换乘行为代表参数和指标值;最后,基于选择的输入参数,针对性构建支持向量机模型进行交通方式换乘点识别,并从原始数据库索引匹配提取换乘时间、换乘地点等详细信息。本方法优点在于:充分利用了GNSS卫星定位数据的高精度、可连续追踪出行轨迹的特征,并发挥支持向量机模型的优异学习和智能识别能力,实现利用卫星定位数据进行居民交通方式换乘行为智能识别。该发明可用于大样本、广区域、高精度、自动化的交通出行换乘信息采集。
但上述专利存在的技术缺陷在于:现有换乘分析均是基于公交公司、brt(快速公交)公司、轨道集团各子公司单独的乘客票务数据换乘,由于乘客出行购票采用刷卡、多种移动支付渠道等不同方式,缺乏规范统一的数据结构,乘客发生不同交通方式换乘行为,难以进行数据关联挖掘。
通过上述分析,现有技术存在的问题及缺陷为:
(1)现有技术中对采集的乘客出行链数据没有采用统一的标准化处理,使数据源头质量控制准确度低。
(2)现有技术对缺失的进出站数据由于没有采用乘客历史数据做预估,使得数据的真实性,可靠性差。
(3)现有技术中,直观展示公共交通换乘整体情况效果差,使得用户参考出行的依据受限。
发明内容
为克服相关技术中存在的问题,本发明公开实施例提供了基于出行链的公共交通换乘数据筛选系统、方法及应用。
所述技术方案如下:基于出行链的公共交通换乘数据筛选方法,应用于客户端,其特征在于,该方法包括以下步骤:
S1,对来自不同市场主体且没有统一的源数据格式标准的常规公交、BRT和轨道运营交易数据单独定义为完整的乘客乘车记录并分隔出行链;
S2,通过关联线路站点信息分别设置交通类型,由于乘客票务数据都是以公交刷卡器、站点刷卡桩为单位,只需要将所属不同的交通方式的票务数据关联站点数据然后分别设置为常规公交、快速公交(BRT)快速公交、轨道出行三种交通类型标识;
S3,基于所述交通类型通过对每个用户时间分组排序确定乘客出行集;
S4,通过经纬度计算距离,在时间间隔、计算距离下,根据不同的交通类型确定不同交通方式换乘数据。
在步骤S1进行前,分别加载公交、BRT、轨道的基础站点信息和公交换乘OD数据、BRT数据、轨道的基础票务数据。
在步骤S1中,对常规公交、BRT和轨道运营交易数据单独定义为完整的乘客乘车记录,具体包括:
分别对常规公交、BRT和轨道三种出行数据以乘客为单位划分数据集;
将公交OD换乘数据关联站点表拆分为两条乘客进站出站数据;
统一常规公交、BRT和轨道出行方式的进出站记录并保留交易时间、进出站类型、乘车卡号、站点编号、交通类型作为乘客出行链。
在一个实施例中,所述以乘客为单位划分数据集中进行异常乘客数据集的修正,具体包括:
对已规范的单趟乘客出行数据集按用户分区划分;
对该数据集以用户卡号字段进行去重操作;
将数据集按进出站刷卡时间降序排列;
将数据集相邻数据刷卡时间间隔小于阈值的数据判定为异常数据剔除;
将单趟出行只有进站或是出站的数据判定为不完整数据,取该乘客过去7天对应进站或出站的数据取出现最大次数的站点为填补站点。
在步骤S2中,交通类型包括:单交通方式出行链,以及常规公交、BRT和轨道交通方式交叉的用户进出站乘客出行链。
在步骤S3中,通过对每个用户时间分组排序确定乘客出行集包括:
(1)单交通方式出行链合并:
对常规公交、BRT和轨道出行方式分别以用户卡号为单位分区并以时间降序排列;
判断同一用户下出行记录的两个站点是否在同一线路下;
若在同一线路下每个分区每条刷卡记录将交易时间、站点编号分别传递给降序临近乘车记录,将乘客进出站的两条刷卡记录合并成一条完整的单交通方式出行链;
(2)合并分隔出行链:
将常规公交、BRT和轨道出行方式的单交通方式乘客链合并;
在以用户的公交卡号或手机设备码作为唯一用户标识分区并以进/出站时间降序排序得到同一乘客的多条多种出行方式的数据集,且每条数据集都是乘客单交通方式的完整乘车链;
在每个乘客分区每条完整的乘客单交通方式出行链将出站时间、出站站点经纬度、交通方式类型分别传递给降序临近出行链最终生成常规公交、BRT和轨道交通方式交叉的用户进出站乘客出行链。
在步骤S4中,经纬度计算距离包括:通过乘客按时间降序分组后的出行集,分别获取到临近两个交通类型的出站和进站经纬度,分别计算两个点的球面距离和曼哈顿距离,取最大距离为乘客的换乘步行距离;
确定不同交通方式换乘数据具体包括:
当乘客的任意交通方式下的任意两条出行链的出站/进站刷卡时间差<30分钟,且下车上车换乘站点距离差小于1公里则判定为换乘行为;
每条单交通出行方式出行链按照出站时间降序排序并判断临近的单交通方式出行链是否为相同的交通方式,并将换乘前的交通方式与换乘后的交通方式分别记录,通过筛选进、出站交通方式查询常规公交、BRT和轨道三种交通方式的换乘信息。
本发明的另一目的在于提供一种实现所述基于出行链的公共交通换乘数据筛选方法的系统,该基于出行链的公共交通换乘数据筛选系统包括:
加载数据模块,用于分别加载公交、BRT、轨道的基础站点信息和公交换乘OD数据、BRT、轨道的基础票务数据;
规范乘客出行链模块,用于对三种出行方式分别定义单趟乘客出行记录;
修正异常乘客数据集模块,用于对乘客出行记录不完整的数据集进行修正;
单交通方式出行链生成模块,用于将乘客进出站记录合并成完整的单交通方式出行链;
合并分隔出行链生成模块,用于生成多种交通方式交叉的用户进出站乘客出行链;
换乘统计分析模块,用于得到完整的交叉乘客出行链,以及通过筛选进、出站交通方式查询多种交通方式的换乘信息。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行根据所述的基于出行链的公共交通换乘数据筛选方法。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述的基于出行链的公共交通换乘数据筛选方法。
本发明的另一目的在于提供一种所述的基于出行链的公共交通换乘数据筛选方法在多元化低碳绿色出行数据分析网络平台上的应用。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:
第一、针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
本发明采用大数据技术,抽取全量常规公交OD换乘数据,BRT(快速公交)乘客票务数据,轨道地铁乘客票务数据,各交通方式的站点信息,将三种出行数据定义为统一的单趟乘客出行记录,以用户为单位在时空两个维度下统计分析常规公交-BRT-地铁三种交通方式的换乘行为,根据换乘分析可以有效对换乘站点流量,对换乘出行方式做精确把控。
第二、把技术方案看作一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:本发明通过规范乘客出行链,重新对数据格式进行封装,对接入的三种交通数据由于格式结构,标准各异采用统一的标准化处理,使数据源头得到了质量控制,避免了分析过程中可能出现的数据问题。本发明通过修正异常乘客数据集,进一步规范了数据质量,对缺失的进出站数据采用乘客历史数据做预估,提升了数据的真实性,可靠性。本发明通过生成单交通方式出行链并合并分隔出行链将同乘客的多种出行方式的出行链标准化,更加便于换乘标准的判定和不同交通方式出行链的整合。本发明通过将常规公交、BRT、轨道票务数据格式化并做换乘分析,宏观来说能够直观看到全市公共交通换乘整体情况,换乘频繁的交通方式,换乘密集站点,有助于城市交通规划建设,优化换乘方式,从而提升公众出行服务质量,交通客流预测相关研究,对于普通用户来说可以对鼓励乘客的换乘行为,碳积分计算等。
第三、作为本发明的权利要求的创造性辅助证据,还体现在以下几个重要方面:
(1)本发明的技术方案转化后的预期收益和商业价值为:
本发明通过换乘数据,可以合理规划市内公共交通线路,对换乘密集区域合理安排公交班次,提高不同交通方式之间进行协同安排开行班次,大大的缩短乘客的换乘时间,提高乘客的出行效率,提高公众对政府的满意度,还可对乘客换乘密集区域合理部署行政资源;
传统获取个体出行链信息只能通过人工问卷调查,不仅成本高、费时费力,获取的样本量还小,还可能因为调查者的忠诚性得到假数据,通过此项发明技术,可以获取到全量的、准确的个体出行链中关键的换行为,极大的降低了获取数据的成本,从几元钱/条的成本可以降为成本几乎忽略不计,有重大应用价值。
(2)本发明的技术方案填补了国内外业内技术空白:
本发明基于出行乘客个体公共交通换乘行为入手进行数据分析,进一步汇总为群体公共交通换乘行为,填补了国内基于多数据源并利用大数据技术来分析乘客个体公共交通换乘的技术空白。
(3)本发明的技术方案解决了人们一直渴望解决、但始终未能获得成功的技术难题:
基于大数据、信息技术分析个体的出行链分析一直是交通运输学界、业界所渴望解决的技术难题,传统获取个体出行链信息只能通过人工问卷调查,不仅成本高、费时费力,获取的样本量还小,还可能因为调查者的忠诚性得到假数据,通过此项发明技术,可以获取到全量的、准确的个体出行链中关键的换行为,有重大应用价值。
(4)本发明的技术方案克服了技术偏见:
以前利用票务数据、车辆轨迹数据对公交换乘数量进行分析的弊端是以点对点的方式分析出乘客的换乘信息,并且数据丢失无法有效弥补,缺乏对其他交通方式的有效连接。本发明采用搭建乘客出行链的方式,可以有效解决通过历史乘客链数据对当前交通方式数据丢失的问题,还能通过出行链的方式将乘客所有交通方式串联可溯源,提高了真实换乘的准确率,出行链还可以进行OD分析。公共交通数据对乘客换乘的分析,传统做法是对单一交通方式的每个站点进行流量统计,从中找到同一乘客的换乘线路信息,当数据丢失无法有效弥补,并且缺少对其他交通方式的有效连接。本模型采用搭建乘客出行链的方式,可以有效解决通过历史乘客链数据对当前交通方式数据丢失的问题,还能通过出行链将乘客一日内所有交通方式串联可溯源,且提高了精度水平。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本发明实施例提供的基于出行链的公共交通换乘数据筛选方法流程图;
图2是本发明实施例提供的基于出行链的公共交通换乘数据筛选方法原理图;
图3是本发明实施例提供的基于出行链的公共交通换乘数据筛选系统示意图;
图中:1、加载数据模块;2、规范乘客出行链模块;3、修正异常乘客数据集模块;4、单交通方式出行链生成模块;5、合并分隔出行链生成模块;6、换乘统计分析模块。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其他方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
一、解释说明实施例:
如图1所示,本发明实施例提供的基于出行链的公共交通换乘数据筛选方法,应用于客户端,包括:
S101,对来自不同市场主体且没有统一的源数据格式标准的常规公交、BRT和轨道运营交易数据,先将各源数据单独定义为完整的乘客乘车记录并分隔出行链;
S102,再通过关联线路站点信息等分别设置交通类型;示例性的,本领域技术人员可以理解,由于乘客票务数据都是以公交刷卡器、站点刷卡桩为单位,只需要将所属不同的交通方式的票务数据关联站点数据然后分别设置为常规公交、快速公交(BRT)快速公交、轨道出行三种交通类型标识;
S103,基于所述交通类型通过对每个用户时间分组排序确定乘客出行集;
S104,再通过经纬度计算距离,在合理的时间间隔、距离下,根据类型不同,合并确定不同交通方式换乘数据。
例性的,本领域技术人员可以理解,进一步的,在步骤S104中,经纬度计算距离包括:通过乘客按时间降序分组后的出行集,分别获取到临近两个交通类型的出站和进站经纬度,分别计算两个点的球面距离和曼哈顿距离,取最大距离为乘客的换乘步行距离。
实施例1
如图2所示,是本发明实施例提供的基于出行链的公共交通换乘数据筛选方法包括以下步骤:
步骤1,加载数据:分别加载公交、BRT、轨道的基础站点信息和公交换乘OD数据、BRT、轨道的基础票务数据;
步骤2,规范乘客出行链:对三种出行方式分别定义单趟乘客出行记录,包括:①分别对三种出行数据以乘客为单位划分数据集;
②将公交OD换乘数据关联站点表拆分为两条乘客进站出站数据;
③统一三种出行方式的进出站记录并保留交易时间、进出站类型、乘车卡号、站点编号、交通类型(其中由于常规公交数据是换乘OD数据,额外保留换乘上车时间、换乘上车的站点编号)作为乘客出行链;
步骤3,修正异常乘客数据集:由于各出行方式投币刷卡方式各异,存在人为失误或感应设备误差,部分数据集出现乘客上下车记录重复,上下车时间过短,乘客出行记录不完整的情况应当对这部分数据集进行修正包括:
① 对已规范的单趟乘客出行数据集按用户分区划分;
② 对该数据集以用户卡号字段进行去重操作;
③ 将数据集按进出站刷卡时间降序排列;
④ 将数据集相邻数据刷卡时间间隔小于阈值的数据判定为异常数据剔除;
⑤将单趟出行只有进站或是出站的数据判定为不完整数据,取该乘客过去7天对应进站或出站的数据取出现最大次数的站点为填补站点;
步骤4,单交通方式出行链包括:
① 对三种出行方式分别以用户卡号为单位分区并以时间降序排列;
② 判断同一用户下出行记录的两个站点是否在同一线路下;
③若在同一线路下每个分区每条刷卡记录将交易时间、站点编号分别传递给降序临近乘车记录,将乘客进出站的两条刷卡记录合并成一条完整的单交通方式出行链;
步骤5,合并分隔出行链包括:
①将三种出行方式的单交通方式乘客链合并;
②在以用户的公交卡号或手机设备码作为唯一用户标识分区并以进/出站时间降序排序得到同一乘客的多条多种出行方式的数据集,且每条数据集都是乘客单交通方式的完整乘车链;
③在每个乘客分区每条完整的乘客单交通方式出行链将出站时间、出站站点经纬度、交通方式类型分别传递给降序临近出行链最终生成三种交通方式交叉的用户进出站乘客出行链;
步骤6,换乘统计分析:得到完整的交叉乘客出行链包括:
①当乘客的任意交通方式下的任意两条出行链的出站/进站刷卡时间差<30分钟,且下车上车换乘站点距离差小于1公里则判定为换乘行为;
②每条单交通出行方式出行链按照出站时间降序排序并判断临近的单交通方式出行链是否为相同的交通方式,并将换乘前的交通方式与换乘后的交通方式分别记录,通过筛选进、出站交通方式可以灵活查询三种交通方式的换乘情况,如表1所示;
表1换乘分析结果
Figure 602047DEST_PATH_IMAGE001
实施例2
如图3所示,本发明实施例提供的基于出行链的公共交通换乘数据筛选系统包括:
加载数据模块1,用于分别加载公交、BRT、轨道的基础站点信息和公交换乘OD数据、BRT、轨道的基础票务数据;
规范乘客出行链模块2,用于对三种出行方式分别定义单趟乘客出行记录;
修正异常乘客数据集模块3,用于对乘客出行记录不完整的数据集进行修正;
单交通方式出行链生成模块4,用于将乘客进出站记录合并成完整的单交通方式出行链;
合并分隔出行链生成模块5,用于生成多种交通方式交叉的用户进出站乘客出行链;
换乘统计分析模块6,用于得到完整的交叉乘客出行链,以及通过筛选进、出站交通方式查询多种交通方式的换乘信息。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
上述装置/单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
二、应用实施例:
本发明实施例还提供了一种计算机设备,该计算机设备包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述各个方法实施例中的步骤。
本发明实施例还提供了一种信息数据处理终端,所述信息数据处理终端用于实现于电子装置上执行时,提供用户输入接口以实施如上述各方法实施例中的步骤,所述信息数据处理终端不限于手机、电脑、交换机。
本发明实施例还提供了一种服务器,所述服务器用于实现于电子装置上执行时,提供用户输入接口以实施如上述各方法实施例中的步骤。
本发明实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行时可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。
以上所述,仅为本发明较优的具体的实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于出行链的公共交通换乘数据筛选方法,应用于客户端,其特征在于,该方法包括以下步骤:
S1,对来自不同市场主体且没有统一的源数据格式标准的常规公交、BRT和轨道运营交易数据单独定义为完整的乘客乘车记录并分隔出行链;
S2,通过关联线路站点信息分别设置交通类型;
S3,基于所述交通类型通过对每个用户时间分组排序确定乘客出行集;
S4,通过经纬度计算距离,在时间间隔、计算距离下,根据不同的交通类型确定不同交通方式换乘数据。
2.根据权利要求1所述的基于出行链的公共交通换乘数据筛选方法,其特征在于,在步骤S1前,分别加载公交、BRT、轨道的基础站点信息和公交换乘OD数据、BRT数据、轨道的基础票务数据。
3.根据权利要求1所述的基于出行链的公共交通换乘数据筛选方法,其特征在于,在步骤S1中,所述常规公交、BRT和轨道运营交易数据单独定义为完整的乘客乘车记录具体包括:
分别对常规公交、BRT和轨道三种出行数据以乘客为单位划分数据集;
将公交OD换乘数据关联站点表拆分为两条乘客进站出站数据;
统一常规公交、BRT和轨道出行方式的进出站记录并保留交易时间、进出站类型、乘车卡号、站点编号、交通类型作为乘客出行链。
4.根据权利要求3所述的基于出行链的公共交通换乘数据筛选方法,其特征在于,所述以乘客为单位划分数据集具体包括:
对已规范的单趟乘客出行数据集按用户分区划分;
对该数据集以用户卡号字段进行去重操作;
将数据集按进出站刷卡时间降序排列;
将数据集相邻数据刷卡时间间隔小于阈值的数据判定为异常数据剔除;
将单趟出行只有进站或是出站的数据判定为不完整数据,取该乘客过去7天对应进站或出站的数据取出现最大次数的站点为填补站点。
5.根据权利要求1所述的基于出行链的公共交通换乘数据筛选方法,其特征在于,在步骤S2中,交通类型包括:单交通方式出行链,以及常规公交、BRT和轨道交通方式交叉的用户进出站乘客出行链。
6.根据权利要求1所述的基于出行链的公共交通换乘数据筛选方法,其特征在于,在步骤S3中,通过对每个用户时间分组排序确定乘客出行集包括:
(1)单交通方式出行链合并:
对常规公交、BRT和轨道出行方式分别以用户卡号为单位分区并以时间降序排列;
判断同一用户下出行记录的两个站点是否在同一线路下;
若在同一线路下每个分区每条刷卡记录将交易时间、站点编号分别传递给降序临近乘车记录,将乘客进出站的两条刷卡记录合并成一条完整的单交通方式出行链;
(2)合并分隔出行链:
将常规公交、BRT和轨道出行方式的单交通方式乘客链合并;
在以用户的公交卡号或手机设备码作为唯一用户标识分区并以进/出站时间降序排序得到同一乘客的多条多种出行方式的数据集,且每条数据集都是乘客单交通方式的完整乘车链;
在每个乘客分区每条完整的乘客单交通方式出行链将出站时间、出站站点经纬度、交通方式类型分别传递给降序临近出行链最终生成常规公交、BRT和轨道交通方式交叉的用户进出站乘客出行链。
7.根据权利要求1所述的基于出行链的公共交通换乘数据筛选方法,其特征在于,在步骤S4中,经纬度计算距离包括:通过乘客按时间降序分组后的出行集,分别获取到临近两个交通类型的出站和进站经纬度,分别计算两个点的球面距离和曼哈顿距离,取最大距离为乘客的换乘步行距离;
确定不同交通方式换乘数据具体包括:
当乘客的任意交通方式下的任意两条出行链的出站/进站刷卡时间差<30分钟,且下车上车换乘站点距离差小于1公里则判定为换乘行为;
每条单交通出行方式出行链按照出站时间降序排序并判断临近的单交通方式出行链是否为相同的交通方式,并将换乘前的交通方式与换乘后的交通方式分别记录,通过筛选进、出站交通方式查询常规公交、BRT和轨道三种交通方式的换乘信息。
8.一种实现权利要求1-7任意一项所述基于出行链的公共交通换乘数据筛选方法的系统,其特征在于,该基于出行链的公共交通换乘数据筛选系统包括:
加载数据模块(1),用于分别加载公交、BRT、轨道的基础站点信息和公交换乘OD数据、BRT、轨道的基础票务数据;
规范乘客出行链模块(2),用于对三种出行方式分别定义单趟乘客出行记录;
修正异常乘客数据集模块(3),用于对乘客出行记录不完整的数据集进行修正;
单交通方式出行链生成模块(4),用于将乘客进出站记录合并成完整的单交通方式出行链;
合并分隔出行链生成模块(5),用于生成多种交通方式交叉的用户进出站乘客出行链;
换乘统计分析模块(6),用于得到完整的交叉乘客出行链,以及通过筛选进、出站交通方式查询多种交通方式的换乘信息。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行根据权利要求1-7任意一项所述的基于出行链的公共交通换乘数据筛选方法。
10.一种如权利要求1-7任意一项所述的基于出行链的公共交通换乘数据筛选方法在多元化低碳绿色出行数据分析网络平台上的应用。
CN202211306253.2A 2022-10-25 2022-10-25 基于出行链的公共交通换乘数据筛选系统、方法及应用 Active CN115376325B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211306253.2A CN115376325B (zh) 2022-10-25 2022-10-25 基于出行链的公共交通换乘数据筛选系统、方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211306253.2A CN115376325B (zh) 2022-10-25 2022-10-25 基于出行链的公共交通换乘数据筛选系统、方法及应用

Publications (2)

Publication Number Publication Date
CN115376325A true CN115376325A (zh) 2022-11-22
CN115376325B CN115376325B (zh) 2023-01-17

Family

ID=84072607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211306253.2A Active CN115376325B (zh) 2022-10-25 2022-10-25 基于出行链的公共交通换乘数据筛选系统、方法及应用

Country Status (1)

Country Link
CN (1) CN115376325B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116611984A (zh) * 2023-07-11 2023-08-18 鹏城实验室 多模式下的出行数据处理方法、系统、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003331378A (ja) * 2002-05-10 2003-11-21 Hitachi Ltd 交通流シミュレータの経路情報編集装置及び方法
CN103280100A (zh) * 2013-05-31 2013-09-04 西安建筑科技大学 融合智能调度数据的公交ic卡乘客换乘站点判断方法
CN104766473A (zh) * 2015-02-09 2015-07-08 北京工业大学 基于多模式公交数据匹配的公共交通出行特征提取方法
CN105185105A (zh) * 2015-06-26 2015-12-23 东南大学 基于车辆gps和公交ic卡数据的公交换乘识别方法
CN105788260A (zh) * 2016-04-13 2016-07-20 西南交通大学 一种基于智能公交系统数据的公交乘客od推算方法
CN106897955A (zh) * 2017-01-24 2017-06-27 华南理工大学 一种基于公交od数据的公交换乘识别方法
CN109871874A (zh) * 2019-01-21 2019-06-11 华南理工大学 地铁换乘公交行为识别方法、系统、计算机设备及存储介质
CN111079875A (zh) * 2019-12-17 2020-04-28 广州交通信息化建设投资营运有限公司 基于多源数据的公共交通客流监测方法、装置和存储介质
CN112363999A (zh) * 2020-10-13 2021-02-12 厦门市交通研究中心 一种公共交通的客流分析方法、装置、设备、存储介质
CN114820264A (zh) * 2022-03-31 2022-07-29 支付宝(杭州)信息技术有限公司 公共交通工具换乘数据处理方法、装置、设备、存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003331378A (ja) * 2002-05-10 2003-11-21 Hitachi Ltd 交通流シミュレータの経路情報編集装置及び方法
CN103280100A (zh) * 2013-05-31 2013-09-04 西安建筑科技大学 融合智能调度数据的公交ic卡乘客换乘站点判断方法
CN104766473A (zh) * 2015-02-09 2015-07-08 北京工业大学 基于多模式公交数据匹配的公共交通出行特征提取方法
CN105185105A (zh) * 2015-06-26 2015-12-23 东南大学 基于车辆gps和公交ic卡数据的公交换乘识别方法
CN105788260A (zh) * 2016-04-13 2016-07-20 西南交通大学 一种基于智能公交系统数据的公交乘客od推算方法
CN106897955A (zh) * 2017-01-24 2017-06-27 华南理工大学 一种基于公交od数据的公交换乘识别方法
CN109871874A (zh) * 2019-01-21 2019-06-11 华南理工大学 地铁换乘公交行为识别方法、系统、计算机设备及存储介质
CN111079875A (zh) * 2019-12-17 2020-04-28 广州交通信息化建设投资营运有限公司 基于多源数据的公共交通客流监测方法、装置和存储介质
CN112363999A (zh) * 2020-10-13 2021-02-12 厦门市交通研究中心 一种公共交通的客流分析方法、装置、设备、存储介质
CN114820264A (zh) * 2022-03-31 2022-07-29 支付宝(杭州)信息技术有限公司 公共交通工具换乘数据处理方法、装置、设备、存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116611984A (zh) * 2023-07-11 2023-08-18 鹏城实验室 多模式下的出行数据处理方法、系统、设备及介质
CN116611984B (zh) * 2023-07-11 2024-02-02 鹏城实验室 多模式下的出行数据处理方法、系统、设备及介质

Also Published As

Publication number Publication date
CN115376325B (zh) 2023-01-17

Similar Documents

Publication Publication Date Title
CN109754594B (zh) 一种路况信息获取方法及其设备、存储介质、终端
Wang et al. A data-driven and optimal bus scheduling model with time-dependent traffic and demand
CN108242149A (zh) 一种基于交通数据的大数据分析方法
CN112590878B (zh) 一种基于列控工程数据表的线路拓扑生成方法
CN112447041B (zh) 识别车辆的营运行为的方法、装置及计算设备
CN111932925A (zh) 一种公共交通站点的出行客流的确定方法、装置及系统
CN115376325B (zh) 基于出行链的公共交通换乘数据筛选系统、方法及应用
CN114363842B (zh) 基于手机信令数据的公交乘客下车站点预测方法及装置
CN110969861B (zh) 一种车辆识别方法、装置、设备及计算机存储介质
CN108108897B (zh) 一种轨道交通客流清分方法、系统及电子设备
WO2011052473A1 (ja) 管理サーバ、人口情報算出管理サーバ、不在エリア管理方法および人口情報算出方法
CN110853156A (zh) 融合公交gps轨迹与ic卡数据的乘客od识别方法
Liu et al. Data analytics approach for train timetable performance measures using automatic train supervision data
CN114501336B (zh) 一种公路出行量测算方法、装置、电子设备及存储介质
Fourie et al. Using smartcard data for agent-based transport simulation
CN113438605B (zh) 轨道站点客流集散空间分布识别方法、装置及电子设备
CN105933463B (zh) 基于智能设备标识信息的城市人员进出城监测方法与系统
CN113344268B (zh) 一种城市交通出行数据分析方法
CN114820264A (zh) 公共交通工具换乘数据处理方法、装置、设备、存储介质
Cui et al. Design of highway intelligent transportation system based on the internet of things and artificial intelligence
Karlsen et al. Customer segmentation of wireless trajectory data
CN115587503B (zh) 基于多模式仿真的个体出行链还原方法
CN116611984B (zh) 多模式下的出行数据处理方法、系统、设备及介质
JP7365521B1 (ja) プログラム、方法、およびシステム
Jayabal et al. An Analysis of Bus Ticket Sales in East Bangalore

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant