CN111932925B - 一种公共交通站点的出行客流的确定方法、装置及系统 - Google Patents

一种公共交通站点的出行客流的确定方法、装置及系统 Download PDF

Info

Publication number
CN111932925B
CN111932925B CN202010659295.9A CN202010659295A CN111932925B CN 111932925 B CN111932925 B CN 111932925B CN 202010659295 A CN202010659295 A CN 202010659295A CN 111932925 B CN111932925 B CN 111932925B
Authority
CN
China
Prior art keywords
data
station
passenger
determining
boarding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010659295.9A
Other languages
English (en)
Other versions
CN111932925A (zh
Inventor
马伯浩
布少聪
夏非凡
崔艺馨
桑丽
陈宇毅
李伟
王欢
王文娜
朱静
郑鑫臻
李默雷
孙贤杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Highway Engineering Consultants Corp
CHECC Data Co Ltd
Original Assignee
China Highway Engineering Consultants Corp
CHECC Data Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Highway Engineering Consultants Corp, CHECC Data Co Ltd filed Critical China Highway Engineering Consultants Corp
Priority to CN202010659295.9A priority Critical patent/CN111932925B/zh
Publication of CN111932925A publication Critical patent/CN111932925A/zh
Application granted granted Critical
Publication of CN111932925B publication Critical patent/CN111932925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/123Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B15/00Arrangements or apparatus for collecting fares, tolls or entrance fees at one or more control points
    • G07B15/02Arrangements or apparatus for collecting fares, tolls or entrance fees at one or more control points taking into account a variable factor such as distance or time, e.g. for passenger transport, parking systems or car rental systems
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07FCOIN-FREED OR LIKE APPARATUS
    • G07F7/00Mechanisms actuated by objects other than coins to free or to actuate vending, hiring, coin or paper currency dispensing or refunding apparatus
    • G07F7/08Mechanisms actuated by objects other than coins to free or to actuate vending, hiring, coin or paper currency dispensing or refunding apparatus by coded identity card or credit card or other personal identification means
    • G07F7/10Mechanisms actuated by objects other than coins to free or to actuate vending, hiring, coin or paper currency dispensing or refunding apparatus by coded identity card or credit card or other personal identification means together with a coded signal, e.g. in the form of personal identification information, like personal identification number [PIN] or biometric data

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供的一种公共交通站点的出行客流的确定方法、装置及系统,其中,该方法包括:通过运行路单数据,将公共交通的GPS数据与乘客支付数据结合,进而为每条GPS轨迹匹配相应班次信息,结合GPS打点数据的打点时间,为支付数据匹配对应GPS轨迹数据及线路信息,进而确定乘客上车客流;获取符合预设条件的支付数据,继而同一乘客的上车站点及时间,确定乘客下车站点,确定目标站点第一类下车客流;获取不符合预设条件的乘客的支付数据,根据运行路单数据及乘客出行距离分布数据,确定乘客在各站点的下车概率,生成下车概率模型,通过模型确定站点的第二类下车客流;根据目标站点的上车客流以及两类下车客流,确定目标站点的出行客流。

Description

一种公共交通站点的出行客流的确定方法、装置及系统
技术领域
本发明涉及智能交通领域,具体涉及一种公共交通站点的出行客流的确定方法、装置及系统。
背景技术
我国很多城市普遍采用公共交通一票制刷卡方式,传统调查方法由于其自身高费用、高耗时、低精度等问题,难以获取有效的公交客流数据。
相关技术中,是在单一常规公交数据的基础上,采用下车概率模型或者出行链理论对站点上下车客流量进行统计;或者是采用是人工调查法,常用的方法多以调查问卷、家庭访问法、电话询问法、明信片调查法、工作出行调查法、职工询问法等需要依托人工调查的方式展开出行研究。一方面,基于单一数据源难以追踪旅客完整的出行信息;另一方面,采用人工调查方法存在高费用、小样本、精准度差等问题,且也不能保证采集的时空间信息的准确和完整性。基于上述方面,导致无法准确掌握乘客的出行行为。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中基于单一数据源难以追踪旅客完整的出行信息,及不能保证采集的时空间信息的准确和完整性,导致的无法掌握乘客的出行行为的缺陷,从而提供一种公共交通站点的出行客流的确定方法、装置及系统。
根据第一方面,本发明实施例提供了一种公共交通站点的出行客流的确定方法,包括:获取公共交通的运行路单数据以及GPS数据,所述GPS数据包括GPS设备编号数据、GPS轨迹数据;根据所述运行路单数据、所述GPS数据,确定静态线路信息表,将所述静态线路信息表进行网格划分,生成静态线路信息网格表,所述静态线路信息表用以表征显示所述GPS轨迹数据对应的线路信息及对应公交站点的地图;根据所述静态线路信息网格表中对应的公交站点,确定多个候选区域;根据所述GPS轨迹数据,筛选分别落在各所述候选区域内的GPS打点数据,并分别记录所述GPS打点数据的打点时间;获取乘客的支付数据,根据所述支付数据的支付时间,以及所述GPS打点数据的打点时间,确定目标站点的上车客流;获取符合预设条件的乘客的支付数据,根据所述符合预设条件的乘客的支付数据,确定同一乘客的连续两次的上车站点信息及上车时间信息,包括第一上车站点、第一上车时间、第二上车站点以及第二上车时间;获取所述第一上车站点对应线路上的站点信息;根据所述第一上车站点对应线路上的站点信息以及所述第二上车站点,将距离所述第二上车站点最近的公交站点确定为乘客的下车站点;根据乘客的下车站点,确定目标站点的第一类下车客流;获取不符合预设条件的乘客的支付数据,根据所述不符合预设条件的乘客的支付数据、所述运行路单数据以及乘客的出行距离分布数据,确定乘客在对应线路上的各站点的下车概率;根据乘客在对应线路上的各站点的下车概率,生成目标站点的下车概率模型;根据所述目标站点的下车概率模型,确定目标站点的第二类下车客流;根据所述目标站点的上车客流、第一类下车客流以及第二类下车客流,确定所述目标站点的客流。
结合第一方面,在第一方面第一实施方式中,所述根据所述运行路单数据、所述GPS数据,确定静态线路信息表,其中,所述运行路单数据包括:第一车牌信息、上下行数据信息,包括:根据所述GPS设备编号数据确定所述GPS轨迹数据对应的第二车牌信息;根据所述第一车牌信息、第二车牌信息以及上下行数据信息,确定所述GPS轨迹数据对应的班次信息,所述班次信息包括线路信息以及始末时间信息;根据所述GPS轨迹数据以及所述始末时间信息,确定所述GPS轨迹数据对应的线路信息;根据所述GPS轨迹数据对应的线路信息,确定静态线路信息表。
结合第一方面,在第一方面第二实施方式中,所述获取乘客的支付数据,根据所述支付数据的支付时间,以及所述GPS打点数据的打点时间,确定乘客的上车站点,具体包括:获取乘客的支付数据,确定所述支付数据的支付时间;根据第一预设时间间隔以及所述支付数据的支付时间,将支付时间间隔小于所述第一预设时间间隔的连续相邻的两条支付数据合并,生成聚类支付数据;根据所述聚类支付数据的支付时间,以及所述GPS打点数据的打点时间,确定乘客的上车站点。
结合第一方面第二实施方式,在第一方面第三实施方式中,所述根据所述聚类支付数据的支付时间,以及所述GPS打点数据的打点时间,确定乘客的上车站点,具体包括:根据所述GPS打点数据的打点时间,分别确定所述候选区域的打点时间范围;根据第一候选区域的第一打点时间范围,及与所述第一候选区域相邻的第二候选区域的第二打点时间范围,确定第一候选区域对应的第一公交站点的刷卡时间范围;当所述聚类支付数据的支付时间,符合所述第一公交站点的刷卡时间范围时,将所述第一公交站点确定为所述聚类支付数据的上车站点。
结合第一方面,在第一方面第四实施方式中,所述将距离所述第二上车站点最近的公交站点确定为乘客的下车站点,具体包括:将距离所述第二上车站点最近的公交站点确定为拟下车站点;当拟下车站点与第二上车站点的距离小于预设距离阈值时,将所述拟下车站点确定为乘客的下车站点。
结合第一方面,在第一方面第五实施方式中,所述根据所述不符合预设条件的乘客的支付数据、所述运行路单数据以及乘客的出行距离分布数据,确定乘客在对应线路上的各站点的下车概率,具体包括:
获取乘客在对应线路上的各站点的下车概率矩阵;
根据所述下车概率矩阵以及所述乘客的出行距离分布数据,确定乘客在对应线路上的各站点的下车概率;
其中,通过下述公式计算乘客在对应线路上的各站点的下车概率矩阵:
P=[Pij]m×m
其中,i、j表示各公交站点,m表示公交线路某个行驶方向的站点数量,pij表示乘客在公交站点i上车并在公交站点j下车的概率;
通过下述公式,计算乘客在对应线路上的各站点的下车概率:
Figure BDA0002577919370000051
其中,i、j表示各公交站点,λ可以表示公交出行途经站点数量的平均值,当站点i后的站点数量小于平均出行途经站点数时,令λ=m-i。
结合第一方面第五实施方式,在第一方面第六实施方式中,所述根据乘客在对应线路上的各站点的下车概率,生成目标站点的下车概率模型,具体包括:
通过下述公式,对下车概率公式中概率分布做归一化处理:
Figure BDA0002577919370000052
其中,i、j表示各公交站点,
Figure BDA0002577919370000053
表示归一化处理后的乘客在不同站点的下车概率;
通过下述公式,计算各站点的吸引权重,所述吸引权重用以表征在不同时段,在其对称时段中的站点上车人数占所属线路的总体上车人数的比例:
Figure BDA0002577919370000054
其中,
Figure BDA0002577919370000061
可以表示公交线路上各站点的吸引权重,/>
Figure BDA0002577919370000062
可以表示在预设时间段范围内,也就是k时段的对称时段k′中站点j的乘客上车的人数,k可以是早晚高峰和平峰三个时段;
通过下述公式,计算目标站点的下车概率模型:
Figure BDA0002577919370000063
结合第一方面,在第一方面第七实施方式中,该方法还包括:当所述拟下车站点的下车时间与所述第二上车时间的时间间隔小于第二预设时间阈值时,确定存在换乘行为;当所述拟下车站点的下车时间与所述第二上车时间的时间间隔大于或者等于所述第二预设时间阈值时,确定不存在换乘行为。
结合第一方面第七实施方式,在第一方面第八实施方式中,该方法还包括:获取乘客从所述第一上车站点到所述下车站点的第一线路信息以及乘客从所述第二上车站点到目的地的第二线路信息;合并所述第一线路信息以及所述第二线路信息,生成正向出行线路;根据所述正向出行线路,模拟生成正向返回线路;反向排列所述正向出行线路以及所述正向返回线路,生成反向出行线路以及反向返回线路;根据所述反向出行线路,确定所述反向出行线路的拟下车站点以及换乘站点;当所述反向出行线路的拟下车站点与所述反向出现线路的换乘站点的距离小于预设距离阈值时,生成所述乘客的出行链数据。
根据第二方面,本发明实施例提供了一种公共交通站点的出行客流的确定装置,包括:第一获取模块,用于获取公共交通的运行路单数据以及GPS数据,所述GPS数据包括GPS设备编号数据、GPS轨迹数据;第一确定模块,用于根据所述运行路单数据、所述GPS数据,确定静态线路信息表,将所述静态线路信息表进行网格划分,生成静态线路信息网格表,所述静态线路信息表用以表征显示所述GPS轨迹数据对应的线路信息及对应公交站点的地图;第二确定模块,用于根据所述静态线路信息网格表中对应的公交站点,确定多个候选区域;筛选模块,用于根据所述GPS轨迹数据,筛选分别落在各所述候选区域内的GPS打点数据,并分别记录所述GPS打点数据的打点时间;第三确定模块,用于获取乘客的支付数据,根据所述支付数据的支付时间,以及所述GPS打点数据的打点时间,确定目标站点的上车客流;第四确定模块,用于获取符合预设条件的乘客的支付数据,根据所述符合预设条件的乘客的支付数据,确定同一乘客的连续两次的上车站点信息及上车时间信息,包括第一上车站点、第一上车时间、第二上车站点以及第二上车时间;第二获取模块,用于获取所述第一上车站点对应线路上的站点信息;第五确定模块,用于根据所述第一上车站点对应线路上的站点信息以及所述第二上车站点,将距离所述第二上车站点最近的公交站点确定为乘客的下车站点;第六确定模块,用于根据乘客的下车站点,确定目标站点的第一类下车客流;第七确定模块,用于获取不符合预设条件的乘客的支付数据,根据所述不符合预设条件的乘客的支付数据、所述运行路单数据以及乘客的出行距离分布数据,确定乘客在对应线路上的各站点的下车概率;生成模块,用于根据乘客在对应线路上的各站点的下车概率,生成目标站点的下车概率模型;第八确定模块,用于根据所述目标站点的下车概率模型,确定目标站点的第二类下车客流;第九确定模块,用于根据所述目标站点的上车客流、第一类下车客流以及第二类下车客流,确定所述目标站点的客流。
根据第三方面,本发明实施例提供了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行第一方面或第一方面任一实施方式所述的公共交通站点的出行客流的确定方法的步骤。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第一方面任一实施方式中所述的公共交通站点的出行客流的确定方法的步骤。
本发明技术方案,具有如下优点:
本发明提供的一种公共交通站点的出行客流的确定方法、装置及系统,通过运行路单数据,将公共交通的GPS数据与乘客的支付数据结合起来,进而可以为每条GPS轨迹精准匹配到相应地班次信息,也就是线路信息,结合GPS轨迹上的GPS打点数据的打点时间,归类公共交通支付设备获取到的支付数据,也就是将支付数据匹配到对应的GPS轨迹数据以及线路信息上,进而确定乘客的上车客流,获取符合预设条件的乘客的支付数据,继而确定同一乘客的连续两次的上车站点信息及上车时间信息;将距离第二上车站点最近的公交站点确定为乘客的下车站点;根据乘客的下车站点,确定目标站点的第一类下车客流;获取不符合预设条件的乘客的支付数据,根据运行路单数据及乘客出行距离分布数据,确定乘客在对应线路上的各站点的下车概率,进而生成目标站点的下车概率模型,确定目标站点的第二类下车客流;根据目标站点的上车客流、第一类下车客流以及第二类下车客流,确定目标站点的客流。
通过实施本发明,解决了相关技术中基于单一数据源难以追踪旅客完整的出行信息,及不能保证采集的时空间信息的准确和完整性,导致的无法掌握乘客的出行行为的问题,结合公共交通的运行路单数据以及通过GPS设备获取到的GPS轨迹数据,快速,准确地实现对乘客上车站点的识别,也就是说,可以通过信息化手段,打通交通相关部门应用信息孤岛,接入常规公交、快速公交、轨道交通、移动支付等领域的数据,实现公共交通系统间数据的融合与应用。并通过技术手段实现多维数据间的关联匹配,为深入分析公共交通旅客出行行为提供基础支撑;基于多维数据的公共交通的乘客出行站点的方法,实现对站点旅客的上车、下车以及换乘客流量的统计,可以极大地利用采集到的数据,具有实际操作性强、精准度高、时效性强等特点。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中公共交通站点的出行客流的确定方法的一个具体示例的流程图;
图2为本发明实施例中公共交通站点的出行客流的确定方法中静态线路信息网格表的示意图;
图3为本发明实施例中公共交通站点的出行客流的确定方法的基于出行链的乘客出行的一个具体示例的示意图;
图4为本发明实施例中公共交通站点的出行客流的确定方法中基于出行链的乘客的出行往返线路的示意图;
图5为本发明实施例中公共交通站点的出行客流的确定方法中基于出行链的反向排列乘客的出行往返线路的示意图;
图6为本发明实施例中公共交通站点的出行客流的确定装置的一个具体示例的原理框图;
图7为本发明实施例中的计算机设备的结构框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
我国很多城市普遍采用常规公交一票制刷卡方式,乘客只有在上车时刷卡扣费,因此,常规公交中的支付设备只能获取到乘客客流的刷卡时间,无法与常规公交的行驶轨迹结合起来,也无法识别公交刷卡乘客的上车站点信息,基于此问题,本发明实施例提供了一种公共交通站点的出行客流的确定方法,可以应用于公共交通管理部门根据乘客客流,而对公共交通上的站点进行调整的具体应用场景中。
如图1所示,本发明实施例提供的一种公共交通站点的出行客流的确定方法,包括:
步骤S101:获取公共交通的运行路单数据以及GPS数据,所述GPS数据包括GPS设备编号数据、GPS轨迹数据;在本实施例中,运行路单数据可以包括计划路单数据与实际路单数据,计划路单数据可以是表示在公共交通运行规划,例如是公交车的运行规划中的规划线路信息,实际路单数据可以是表示公交车在实际运行过程中,实际行驶的线路信息;在本发明实施例中,我们可以认为该公交车的计划路单数据与实际路单数据相同,也就是说,公交车实际行驶的线路信即为预先为该公交车规划的线路。
示例性地,运行路单数据可以具体包括:该车辆的实际驾驶人身份信息、车牌信息、运行线路信息、运行站点信息、车辆行驶上下行信息等于公交车在实际行驶时有关的状态信息;GPS数据可以具体包括GPS设备编号数据、GPS轨迹数据,GPS设备编号数据表示车辆的编号;GPS轨迹数据实际上是由多个点组成的车辆的行驶轨迹信息,具体地,GPS设备可以是以20秒钟的时间间隔,打一次点,记录此时的车辆位置信息,此时,GPS轨迹数据中的GPS打点数据包括,打点时间信息以及打点时所处的位置,例如,经纬度信息。
步骤S102:根据运行路单数据、GPS数据,确定静态线路信息表,将静态线路信息表进行网格划分,生成静态线路信息网格表,静态线路信息表用以表征显示GPS轨迹数据对应的线路信息及对应公交站点的地图;在本实施例中,运行路单数据可以是包括第一车牌信息以及该车辆的上下行数据信息,GPS数据可以是有GPS打点数据,具体地,根据GPS数据中的GPS设备编号数据确定GPS轨迹数据对应的第二车牌信息,根据第一车牌信息、第二车牌信息以及上下行数据信息,确定GPS轨迹数据对应的班次信息,根据GPS轨迹数据以及始末时间信息,确定GPS轨迹数据对应的线路信息;根据GPS轨迹数据对应的线路站点信息,在该区域内的线路运行图,可以是该区域内的地图上,标注出对应线路的站点信息,可以称之为静态线路信息表;在此静态线路信息表上,通过简单的数学比较,将相应线路的公交站点设置网格的中心点,并标注于静态线路信息表中,生成静态线路信息网格表。
步骤S103:根据静态线路信息网格表中对应的公交站点,确定多个候选区域;在本实施例中,根据对应的公交站点,通过预设的候选区域确定距离,分别确定GPS轨迹数据对应的线路信息,映射于上述静态线路信息网格表内的候选区域,即认为进入此区域,即可以认为已经到达该公交站点。
示例性地,预设的候选区域确定距离可以为100m,具体地,如图2所示,可以以公交站点1为原点,那么,(50,50)、(50,-50)、(-50,-50)(-50,50)四个点所围成的区域即为公交站点1的候选区域,当GPS轨迹数据中的打点数据,也就是GPS点落入此区域内时,可以认为此时,已经到达公交站点1。
步骤S104:根据GPS轨迹数据,筛选分别落在各候选区域内的GPS打点数据,并分别记录GPS打点数据的打点时间;在本实施例中,根据GPS轨迹数据中的打点数据,筛选落在公交站点1候选区域内的GPS点,并记录对应GPS点的打点时间,例如,落在公交站点1候选区域内有四个GPS点,分别记录GPS点的打点时间,可以是8:10:00、8:10:20、8:10:40、8:11:00,可以确定,到达公交站点1候选区域的时间范围可以是8:10:00-8:11:00。
步骤S105:获取乘客的支付数据,根据所述支付数据的支付时间,以及所述GPS打点数据的打点时间,确定目标站点的上车客流。在本实施例中,通过公交车辆上的支付设备获取乘客的支付数据,具体地,支付设备可以是射频读码器,也可以是支付二维码;支付数据可以是乘客使用公交一卡通的刷卡数据,也可以是乘客使用电子一卡通的刷卡数据,还可以是智能移动终端的扫码支付数据,也可以是老年卡、公共交通系统的员工卡等的支付数据;公交车辆上的支付设备也可以设置有支付设备编号,此支付设备编号是与公交车辆一一对应的。
示例性地,根据乘客的支付数据获取乘客支付时间,例如,获取到的乘客的支付时间为8:10:03,而根据GPS打点数据而确定的公交站点1的到达时间范围8:10:00-8:11:00,判断此乘客的支付时间符合公交站点1的到达时间范围,那么,可以确定此乘客的上车站点为公交站点1;根据多个乘客的上车站点,进而确定各站点的上车客流。
步骤S106:获取符合预设条件的乘客的支付数据,根据符合预设条件的乘客的支付数据,确定同一乘客的连续两次的上车站点信息及上车时间信息,包括第一上车站点、第一上车时间、第二上车站点以及第二上车时间;在本实施例中,预设条件可以是能构成出行链的有接续公共交通的乘客的支付记录,例如,筛选隶属于同一乘客的、前一次为常规交通出行的、连续两次的支付数据对。通过上述实施例所述的方法确定此支付数据对的上车站点信息以及上车时间信息;例如,获取乘客小明在上车时间1,在线路1的S1站的上车信息,以及在上车时间2,在线路2的S2站的上车信息。
步骤S107:获取第一上车站点对应线路上的站点信息;在本实施例中,在本实施例中,根据第一上车站点,确定第一上车站点可以是线路1上的公交站点,此时,确定线路1上所有公交站点的经纬度信息以及名称信息;例如,如图3所示的,第一上车站点S1对应的线路1上所有的站点信息,如,E站、F站、A站、B站、C站、D站。
步骤S108:根据第一上车站点对应线路上的站点信息以及第二上车站点,将距离第二上车站点最近的公交站点确定为乘客的下车站点;在本实施例中,乘客小明的第二上车信息为:在上车时间2,在S2站上车;此时,获取S2站点的经纬度信息,也就是位置信息,判断线路1上距离S2站最近的公交站点,例如,可以是C站,此时,可以将C站确定为小明在线路1上的拟下车站点;根据拟下车站点的位置信息与第二上车站点S2的位置信息,确定拟下车站点是否为乘客的实际下车站点,具体地,计算S2站点与站点C的距离,比较此距离是否小于预设距离阈值,当小于时,可以将该拟下车站点确定为乘客的实际下车站点。具体地,预设距离阈值可以是1千米,该预设距离阈值可以是根据该区域内的多条公交线路的分布信息,提前计算出的站点间的平均距离。
步骤S109:根据乘客的下车站点,确定目标站点的第一类下车客流;在本实施例中,根据推断出来的多个乘客的下车站点,进而确定公共交通出行站点的第一类下车客流。
步骤S110:获取不符合预设条件的乘客的支付数据,根据不符合预设条件的乘客的支付数据、运行路单数据以及乘客的出行距离分布数据,确定乘客在对应线路上的各站点的下车概率;在本实施例中,不符合预设条件的乘客的支付数据,可以是通过上述实施例所述的方法,无法确定乘客的下车站点的所有支付数据;也可以是不存在连续两次的隶属于同一乘客的支付数据,或者可以是连续两次出行记录中,前一次支付数据不为公共交通出行的数据对,还可以是拟下车站点与第二上车站点之间的距离大于预设距离阈值所对应的数据对。
示例性地,可以建立乘客在每条线路各个站点的下车概率矩阵;通过下述公式计算,乘客在某线路上各站点的下车概率矩阵:
P=[Pij]m×m
其中,i、j表示各公交站点,m表示公交线路某个运营方向的站点数量,pij表示乘客在公交站点i上车并在公交站点j下车的概率。
具体地,可以确定每条线路上乘客出行距离的分布。可以将乘客的下车概率随公交车途经站点的数量假设服从泊松分布,根据上述任一实施例所述的方法确定每条线路乘客出行结果,由此得到乘客在不同站点的下车概率Fij为:
Figure BDA0002577919370000161
其中,i、j表示各公交站点,λ可以表示平均公交出行途经站点数量的平均值,当站点i后的站点数量小于平均出行途经站点数时,可以令λ=m-i。
结合各站点上车乘客必定在后续站点全部下车的实际情况,通过下述公式,对下车概率公式中概率分布做归一化处理:
Figure BDA0002577919370000162
其中,i、j表示各公交站点,
Figure BDA0002577919370000171
表示归一化处理后的乘客在不同站点的下车概率。
步骤S111:根据乘客在对应线路上的各站点的下车概率,生成目标站点的下车概率模型;
首先,由于每个站点的不同时间段客流吸引量不同,加之公交出行具备强往返性,因此,同一站点吸引的客流在总体上是基本保持平衡的,即站点发生量可以映射站点的吸引量。通过下述公式,计算任一公交线路上各站点吸引权重,具体地,吸引权重表示不同时段在其对称时段中的站点上车人数占所属线路的总体上车人数的比例:
Figure BDA0002577919370000172
其中,
Figure BDA0002577919370000173
可以表示公交线路上各站点的吸引权重,/>
Figure BDA0002577919370000174
可以表示在预设时间段范围内,也就是k时段的对称时段k′中站点j的乘客上车的人数,k可以是早晚高峰和平峰三个时段。
具体地,考虑线路的非对称性。非对称时,可以依据邻站分流原则分配上行各站点的上车流量给下行相应站点计算吸引强度,也就是下行相应站点的吸引乘客人数。
示例性地,综合考虑乘客出行距离分布、站点吸引特征两类影响因素,当两者对乘客下车概率的影响相互独立,并进行加权归一化处理,通过下述公式,确定分时段条件下的站点下车概率模型:
Figure BDA0002577919370000181
步骤S112:根据目标站点的下车概率模型,确定目标站点的第二类下车客流;在本实施例中,根据目标站点的下车概率模型,确定对应站点的第二类下车客流。
步骤S113:根据目标站点的上车客流、第一类下车客流以及第二类下车客流,确定目标站点的客流。在本实施例中,合并将基于乘客的出行链推测的第一类站点下车客流和基于概率模型的第二类站点下车客流,得出各站点的下车客流,综合各站点的上车客流以及计算出的下车客流,确定各站点的乘客出行客流。
本发明提供的一种公共交通站点的出行客流的确定方法,包括:通过运行路单数据,将公共交通的GPS数据与乘客的支付数据结合起来,进而可以为每条GPS轨迹精准匹配到相应地班次信息,也就是线路信息,结合GPS轨迹上的GPS打点数据的打点时间,归类公共交通支付设备获取到的支付数据,也就是将支付数据匹配到对应的GPS轨迹数据以及线路信息上,进而确定乘客的上车客流,获取符合预设条件的乘客的支付数据,继而确定同一乘客的连续两次的上车站点信息及上车时间信息;将距离第二上车站点最近的公交站点确定为乘客的下车站点;根据乘客的下车站点,确定目标站点的第一类下车客流;获取不符合预设条件的乘客的支付数据,根据运行路单数据及乘客出行距离分布数据,确定乘客在对应线路上的各站点的下车概率,进而生成目标站点的下车概率模型,确定目标站点的第二类下车客流;根据目标站点的上车客流、第一类下车客流以及第二类下车客流,确定目标站点的客流。
通过实施本发明,解决了相关技术中基于单一数据源难以追踪旅客完整的出行信息,及不能保证采集的时空间信息的准确和完整性,导致的无法掌握乘客的出行行为的问题,结合公共交通的运行路单数据以及通过GPS设备获取到的GPS轨迹数据,快速,准确地实现对乘客上车站点的识别,也就是说,可以通过信息化手段,打通交通相关部门应用信息孤岛,接入常规公交、快速公交、轨道交通、移动支付等领域的数据,实现公共交通系统间数据的融合与应用。并通过技术手段实现多维数据间的关联匹配,为深入分析公共交通旅客出行行为提供基础支撑;基于多维数据的公共交通的乘客出行站点的方法,实现对站点旅客的上车、下车以及换乘客流量的统计,可以极大地利用采集到的数据,具有实际操作性强、精准度高、时效性强等特点。
可选地,在本发明的一些实施例中,步骤S101:根据所述运行路单数据、所述GPS数据,确定静态线路信息表,具体包括:
步骤S12:首先,根据GPS设备编号数据确定GPS轨迹数据对应的第二车牌信息;在本实施例中,每一个GPS设备对应一辆公交车,也就是说,一个GPS设备可以只获取对应车辆的行驶轨迹信息,GPS设备的编号信息与车辆的车牌信息是一一对应的,因此,根据GPS设备的编号信息,在预设的设备编号-车牌信息数据库中,可以匹配对应地车牌信息。
步骤S13:其次,根据第一车牌信息、第二车牌信息以及上下行数据信息,确定GPS轨迹数据对应的班次信息,班次信息包括线路信息以及始末时间信息;在本实施例中,根据车辆的第一车牌信息、以及GPS轨迹的第二车牌信息,筛选出与第一车牌信息相同的第二车牌信息,也就是为GPS设备获取到的GPS轨迹匹配对应的行驶车辆信息,即经过的线路站点信息;根据上下行方向的数据,例如,该车辆是从始发站行驶到终点站,还是从终点站行驶到始发站,为GPS轨迹数据匹配对应的班次信息,例如,确定为从始发站到终点站的行驶方向,也就是为该GPS轨迹数据匹配对应地行驶方向的行驶站点信息,例如,各班次的编号信息以及各班次的首末时间信息;例如,确定该条轨迹对应的车牌信息,确定该车辆为923路公交车,确定923路公交车的班次信息,以及对应的班次的首末时间,例如,间隔一小时,923路公交车开始投入运营,行驶全部站点需要50分钟,因此,该923路公交车的首末时间分别为7:00-7:50;8:00-8:50,…,18:00-18:50。
步骤S14:再次,根据GPS轨迹数据以及始末时间信息,确定GPS轨迹数据对应的线路信息;在本实施例中,GPS设备记录轨迹信息可以包括:经纬度、时间等,因此,根据GPS轨迹的记录时间可以确定对应公交车的行驶班次,例如,GPS设备获取到的一条GPS轨迹数据,也就是GPS设备的打点数据,此条轨迹的第一个点的打点时间为8:01:45,最后一个点的打点时间为8:49:00,已经确定此条GPS轨迹数据确定为923路公交车,从始发站行驶到终点站的行驶方向的行驶信息,根据923路公交车班次的始末时间信息,确定此条GPS轨迹数据对应的班次为8:00-8:50。
在实际应用中,由于在预设时间段内,存在有海量乘客的支付数据,为了降低归类支付数据时的工作量,可选地,在本发明的一些实施例中,步骤S105:获取乘客的支付数据,根据所述支付数据的支付时间,以及所述GPS打点数据的打点时间,确定目标站点的上车客流,具体包括:
首先,获取乘客的支付数据,确定支付数据的支付时间;在本实施例中,根据支付设备上的编号,确定与支付数据相对应的公交车辆信息,也就是为支付数据匹配对应的车辆信息,根据获取到的支付数据信息,记录上述支付数据对应的支付时间数据。
其次,根据第一预设时间间隔以及支付数据的支付时间,将支付时间间隔小于第一预设时间间隔的连续相邻的两条支付数据合并,生成聚类支付数据;在本实施例中,在根据支付数据的支付时间与GPS轨迹数据的打点时间数据,归类刷卡数据时,可以将刷卡数据进行聚类,例如,第一预设时间间隔可以是10s,那么在进行支付数据的归类时,以10s为一聚类时间段,将在同一辆公交车辆,且连续相邻的、两次交易时间在10s内的支付数据进行聚类合并,生成聚类支付数据,例如,通过支付设备获取到的连续两次相邻的交易数据的时间分别为8:10:05、8:10:08,那么可以将8:10:05对应的支付数据以及8:10:08对应的支付数据进行合并,生成第一聚类支付数据。
再次,根据聚类支付数据的支付时间,以及GPS打点数据的打点时间,确定乘客的上车站点。在本实施例中,根据聚类支付数据的支付时间,以及GPS打点数据的打点时间,确定所述聚类支付数据中各个乘客的上车站点,例如,聚类支付数据的支付时间范围为8:10:05-8:10:08,根据公交站点1的GPS点的打点时间范围8:10:00-8:11:00,可以确定此聚类支付数据中的乘客的上车站点均为公交站点1;通过上述实施例所述的方法确定多个乘客的公交站点,进而,确定各站点的上车客流,也就是在该站点的上车的乘客数量。
本发明实施例提供的一种公共交通站点的出行客流的确定方法,结合连续两次获取到的相邻的支付数据,并将交易时间间隔小于第一预设时间间隔的支付数据进行合并,生成聚类支付数据,在根据聚类支付数据的支付时间以及对应的GPS轨迹的打点时间,确定聚类支付数据对应的乘客的上车站点,通过实施本发明,提前聚类支付数据可以减少后续匹配支付数据与候选区域时,需要的计算量,提高乘客的上车站点的效率,可以为公交线网调整、规划及有关政策制定起到辅助决策支撑的作用。
作为本申请一个可选的实施方式,在执行上述步骤:根据聚类支付数据的支付时间,以及GPS打点数据的打点时间,确定乘客的上车站点的过程中,具体包括:
首先,根据GPS打点数据的打点时间,分别确定候选区域的打点时间范围;在本实施例中,根据落在目标候选区域内的GPS点的打点时间,确定目标候选区域的内的GPS点的打点时间范围,也就是分别确定两个相邻的候选区域的打点时间范围,例如,第一候选区域的初始打点时间及结束打点时间,以及第二候选区域的初始打点时间及结束打点时间。
其次,根据第一候选区域的第一打点时间范围,及与第一候选区域相邻的第二候选区域的第二打点时间范围,确定第一候选区域对应的第一公交站点的刷卡时间范围;由于乘客在上车后由于上车人数较多,无法立即刷卡,此时公交车已经驶出一段距离后进行刷卡。此时在本实施例中,根据两个相邻的候选区域的打点时间范围,确定第一候选区域所对应的公交站点的刷卡时间范围;具体地,根据第一候选区域的初始打点时间,及与第一候选区域相邻的第二候选区域的初始打点时间,确定第一候选区域所对应的公交站点的刷卡时间范围。例如,公交站点1的GPS点的打点时间范围8:10:00-8:11:00,即第一候选区域的打点时间范围为8:10:00-8:11:00,初始打点时间为8:10:00,公交站点2的GPS点的打点时间范围8:12:00-8:13:00,即第二候选区域的打点时间范围为8:12:00-8:13:00,初始打点时间为8:12:00;此时,公交站点1的刷卡时间范围可以是8:10:00-8:12:00。
再次,当聚类支付数据的支付时间,符合第一公交站点的刷卡时间范围时,将第一公交站点确定为聚类支付数据的上车站点。在本实施例中,当聚类支付数据的支付时间范围为8:10:05-8:10:08,而公交站点1的刷卡时间范围可以是8:10:00-8:12:00,确定该聚类支付数据内的各支付数据,也就是各乘客均符合此候选区域的打点时间范围,那么,可以将此候选区域的中心点,也就是公交站点1确定为此聚类支付数据的乘客的上车站点。
本发明实施例提供的一种公共交通站点的出行客流的确定方法,结合实际情况,将不在候选区域的聚类支付数据,根据邻近原则,归到相应地站点上,避免了有效公交支付数据的丢失,保证了乘客的支付数据的完整性,可以更好、更完全的反映本区域内乘客的出行情况。
作为本申请一个可选的实施方式,步骤S108,将距离所述第二上车站点最近的公交站点确定为乘客的下车站点,具体包括:
首先,将距离所述第二上车站点最近的公交站点确定为拟下车站点;在本实施例中,乘客小明的第二上车信息为:在上车时间2,在S2站上车;此时,获取S2站点的经纬度信息,也就是位置信息,判断线路1上距离S2站最近的公交站点,例如,可以是C站,此时,可以将C站确定为小明在线路1上的拟下车站点。
其次,当拟下车站点与第二上车站点的距离小于预设距离阈值时,将所述拟下车站点确定为乘客的下车站点。在本实施例中,判断拟下车站点C与第二上车站点S2的距离是否小于预设距离阈值;当拟下车站点C与第二上车站点S2的距离小于预设距离阈值时,将拟下车站点确定为乘客的下车站点。在本实施例中,根据拟下车站点的位置信息与第二上车站点S2的位置信息,确定拟下车站点是否为乘客的实际下车站点,具体地,计算S2站点与站点C的距离,比较此距离是否小于预设距离阈值,当小于时,可以将该拟下车站点确定为乘客的实际下车站点。具体地,预设距离阈值可以是1千米,该预设距离阈值可以是根据该区域内的多条公交线路的分布信息,提前计算出的站点间的平均距离。
可选的,本发明实施例的一种公共交通站点的出行客流的确定方法,还包括:根据乘客一天内所有的公交出行是否能构成公交出行链,分为出行链出行和无接续公交出行。按是否构成公交出行链进行分类,对于满足出行链出行的乘客数据采用上述任一实施例所述的方法获取站点下车的客流,对于不满足出行链的乘客出行记录可以是通过预设的下车站点概率模型识别站点下车的客流。也就是说,预设条件可以是是否能够构成公交出行链。
常用的公共交通的支付方式通常为上车时支付,而地铁以及快速公交均为上下车刷卡,因此,根据上述任一实施例所述的出行站点的确定方法,确定乘客的下车站点时,根据仅获取连续两次出行,前一次为常规公交的支付数据的出行记录。剩余均为不能构成出行链的无接续公交出行,可以通过预设的下车站点概率模型识别站点下车的客流,具体地,基于公交出行链的下车站点判断方法己无法识别出单个乘客的下车站点,但是根据基于公交出行链的下车站点判断结果,已初步推测出该线路乘客的出行距离分布特征,此外根据上车站点判断,可统计出站点的上车人数,而站点全天中的客流发生强度与客流吸引强度基本平衡,为此可以考虑通过基于乘客出行距离分布与公交站点的吸引特征建立乘客站点下车概率模型。基于上述方法可充分利用乘客刷卡记录中潜在的关联信息,又能实现对无潜在关联信息的刷卡记录下车站点的有效估算。
作为本申请一个可选地实施方式,步骤S110:获取不符合预设条件的乘客的支付数据,根据不符合预设条件的乘客的支付数据、运行路单数据以及乘客的出行距离分布数据,确定乘客在对应线路上的各站点的下车概率,具体包括:支付数据也可以是刷卡数据,具体地,预设时间段范围内的常规公交IC卡刷卡数据、快速公交卡刷卡数据、地铁IC卡刷卡数据进行合并,并通过IC卡的身份信息以及刷卡时间信息进行排序等操作,因此得到出行记录信息可以是:连续两次相邻数据为同一IC卡的出行信息;根据刷卡数据的不同来源,例如,常规公交IC卡、快速公交卡、地铁IC卡,建立数据的来源标签,同时筛选出不符合两次连续记录中前一次为常规公交车刷卡的数据对。
示例性地,可以建立乘客在每条线路各个站点的下车概率矩阵;通过下述公式计算,乘客在某线路上各站点的下车概率矩阵:
P=[Pij]m×m
其中,i、j表示各公交站点,m表示公交线路某个运营方向的站点数量,pij表示乘客在公交站点i上车并在公交站点j下车的概率。
具体地,可以确定每条线路上乘客出行距离的分布。可以将乘客的下车概率随公交车途经站点的数量假设服从泊松分布,根据上述任一实施例所述的方法确定每条线路乘客出行结果,由此得到乘客在不同站点的下车概率Fij为:
Figure BDA0002577919370000261
其中,i、j表示各公交站点,λ可以表示平均公交出行途经站点数量的平均值,当站点i后的站点数量小于平均出行途经站点数时,可以令λ=m-i。
结合各站点上车乘客必定在后续站点全部下车的实际情况,通过下述公式,对下车概率公式中概率分布做归一化处理:
Figure BDA0002577919370000271
其中,i、j表示各公交站点,
Figure BDA0002577919370000272
表示归一化处理后的乘客在不同站点的下车概率。
示例性地,由于每个站点的不同时间段客流吸引量不同,加之公交出行具备强往返性,因此,同一站点吸引的客流在总体上是基本保持平衡的,即站点发生量可以映射站点的吸引量。通过下述公式,计算任一公交线路上各站点吸引权重,具体地,吸引权重表示不同时段在其对称时段中的站点上车人数占所属线路的总体上车人数的比例:
Figure BDA0002577919370000273
其中,
Figure BDA0002577919370000274
可以表示公交线路上各站点的吸引权重,/>
Figure BDA0002577919370000275
可以表示在预设时间段范围内,也就是k时段的对称时段k′中站点j的乘客上车的人数,k可以是早晚高峰和平峰三个时段。
具体地,考虑线路的非对称性。非对称时,可以依据邻站分流原则分配上行各站点的上车流量给下行相应站点计算吸引强度,也就是下行相应站点的吸引乘客人数。
示例性地,综合考虑乘客出行距离分布、站点吸引特征两类影响因素,当两者对乘客下车概率的影响相互独立,并进行加权归一化处理,通过下述公式,确定分时段条件下的站点下车概率模型:
Figure BDA0002577919370000281
由此,合并将基于乘客的出行链推测的站点下车客流,即第一类下车客流;和基于概率模型的站点下车客流,及第二类下车客流,得出各站点的下车客流。
作为本申请一个可选的实施方式,在将拟下车站点确定为乘客的下车站点之后,该确定方法还包括:
当拟下车站点的下车时间与第二上车时间的时间间隔小于第二预设时间阈值时,确定存在换乘行为;当拟下车站点的下车时间与第二上车时间的时间间隔大于或者等于第二预设时间阈值时,确定不存在换乘行为。在本实施例中,在确定拟下车站点即为乘客的实际下车后,获取乘客在下车站点的下车时间与乘客在第二上车站点的第二上车时间,判断下车时间与第二上车时间之间的时间差值是否小于预设时间阈值,当下车时间与第二上车时间之间的时间差值小于预设时间阈值时,可以确定乘客在出行时发生换乘行为,且换乘站点是乘客在线路1上的下车站点;当下车时间与第二上车时间之间的时间差值大于或者等于预设时间阈值时,可以确定此乘客在出行时没有发生换乘行为,只是在不同的时间在不同的地点乘车而已。
示例性地,预设时间阈值可以是30分钟,是根据此区域多条公交线路的分布信息,提前计算出的站点间换乘时所需的平均时长。
在本区域内的乘客的出行站点的乘客数据是以天为计量单位而记录的,因此数据量较大。针对存在稳定出行线路的乘客(例如通勤人群,通学人群),也就是说此乘客群的每天的出行线路固定且对称。为了全面考虑出行线路的重复问题,通过对出行记录的反向排列来模拟以天为周期的重复出行线路,进而可以出推测到更多出行记录的下车站点。
首先,获取乘客从第一上车站点到下车站点的第一线路信息以及从第二上车站点到目的地的第二线路信息;合并第一线路信息以及第二线路信息,生成正向出行线路;根据正向出行线路,模拟生成正向返回线路;
在本实施例中,如图4所示,乘客是从初始出发地行驶到初始目的地,去往线路可以是在线路1的S1站上车,在C站点,也就是E1站下车,然后行驶至S2站,在线路2上的S2站点上车,最终在E2站点下车,最终行驶至目的地;同样的,通过模拟乘客的出行行为,乘客可以是通过线路3,从初始目的地返回至初始出发地。正向方向可以是从初始出发地行驶至初始目的地的方向,反向方向可以是初始目的地行驶至初始出发地的方向。合并后,将乘客从初始出发地行驶至初始目的地的出行线路合并,生成正向出行线路,以及正向返回线路。
其次,反向排列正向出行线路以及正向返回线路,生成反向出行线路以及反向返回线路;如图5所示,通过模拟反向排列乘客的正向出行记录,模拟生成乘客的反向出行记录。
再次,根据反向出行线路,确定反向出行线路的拟下车站点以及换乘站点,当反向出行线路的拟下车站点与反向出现线路的换乘站点的距离小于预设距离阈值时,生成乘客的出行链数据。
可选地,如图6所示,本发明实施例还提供了一种公共交通站点的出行客流的确定装置,包括:
第一获取模块201,用于获取公共交通的运行路单数据以及GPS数据,所述GPS数据包括GPS设备编号数据、GPS轨迹数据;详细内容可参见上述方法实施例中步骤S101的描述。
第一确定模块202,用于根据所述运行路单数据、所述GPS数据,确定静态线路信息表,将所述静态线路信息表进行网格划分,生成静态线路信息网格表,所述静态线路信息表用以表征显示所述GPS轨迹数据对应的线路信息及对应公交站点的地图;详细内容可参见上述方法实施例中步骤S102的描述。
第二确定模块203,用于根据所述静态线路信息网格表中对应的公交站点,确定多个候选区域;详细内容可参见上述方法实施例中步骤S103的描述。
筛选模块204,用于根据所述GPS轨迹数据,筛选分别落在各所述候选区域内的GPS打点数据,并分别记录所述GPS打点数据的打点时间;详细内容可参见上述方法实施例中步骤S104的描述。
第三确定模块205,用于获取乘客的支付数据,根据所述支付数据的支付时间,以及所述GPS打点数据的打点时间,确定目标站点的上车客流;详细内容可参见上述方法实施例中步骤S105的描述。
第四确定模块206,用于获取符合预设条件的乘客的支付数据,根据所述符合预设条件的乘客的支付数据,确定同一乘客的连续两次的上车站点信息及上车时间信息,包括第一上车站点、第一上车时间、第二上车站点以及第二上车时间;详细内容可参见上述方法实施例中步骤S106的描述。
第二获取模块207,用于获取所述第一上车站点对应线路上的站点信息;详细内容可参见上述方法实施例中步骤S107的描述。
第五确定模块208,用于根据所述第一上车站点对应线路上的站点信息以及所述第二上车站点,将距离所述第二上车站点最近的公交站点确定为乘客的下车站点;详细内容可参见上述方法实施例中步骤S108的描述。
第六确定模块209,用于根据乘客的下车站点,确定目标站点的第一类下车客流;详细内容可参见上述方法实施例中步骤S109的描述。
第七确定模块210,用于获取不符合预设条件的乘客的支付数据,根据所述不符合预设条件的乘客的支付数据、所述运行路单数据以及乘客的出行距离分布数据,确定乘客在对应线路上的各站点的下车概率;详细内容可参见上述方法实施例中步骤S110的描述。
生成模块211,用于根据乘客在对应线路上的各站点的下车概率,生成目标站点的下车概率模型;详细内容可参见上述方法实施例中步骤S111的描述。
第八确定模块212,用于根据所述目标站点的下车概率模型,确定目标站点的第二类下车客流;详细内容可参见上述方法实施例中步骤S112的描述。
第九确定模块213,用于根据所述目标站点的上车客流、第一类下车客流以及第二类下车客流,确定所述目标站点的客流。详细内容可参见上述方法实施例中步骤S113的描述。
本发明提供的一种公共交通站点的出行客流的确定装置,包括:通过运行路单数据,将公共交通的GPS数据与乘客的支付数据结合起来,进而可以为每条GPS轨迹精准匹配到相应地班次信息,也就是线路信息,结合GPS轨迹上的GPS打点数据的打点时间,归类公共交通支付设备获取到的支付数据,也就是将支付数据匹配到对应的GPS轨迹数据以及线路信息上,进而确定乘客的上车客流,获取符合预设条件的乘客的支付数据,继而确定同一乘客的连续两次的上车站点信息及上车时间信息;将距离第二上车站点最近的公交站点确定为乘客的下车站点;根据乘客的下车站点,确定目标站点的第一类下车客流;获取不符合预设条件的乘客的支付数据,根据运行路单数据及乘客出行距离分布数据,确定乘客在对应线路上的各站点的下车概率,进而生成目标站点的下车概率模型,确定目标站点的第二类下车客流;根据目标站点的上车客流、第一类下车客流以及第二类下车客流,确定目标站点的客流。
通过实施本发明,解决了相关技术中基于单一数据源难以追踪旅客完整的出行信息,及不能保证采集的时空间信息的准确和完整性,导致的无法掌握乘客的出行行为的问题,结合公共交通的运行路单数据以及通过GPS设备获取到的GPS轨迹数据,快速,准确地实现对乘客上车站点的识别,也就是说,可以通过信息化手段,打通交通相关部门应用信息孤岛,接入常规公交、快速公交、轨道交通、移动支付等领域的数据,实现公共交通系统间数据的融合与应用。并通过技术手段实现多维数据间的关联匹配,为深入分析公共交通旅客出行行为提供基础支撑;基于多维数据的公共交通的乘客出行站点的方法,实现对站点旅客的上车、下车以及换乘客流量的统计,可以极大地利用采集到的数据,具有实际操作性强、精准度高、时效性强等特点。
可选地,本发明实施例还提供了一种计算机设备,如图7所示,该计算机设备可以包括处理器31和存储器32,其中处理器31和存储器32可以通过总线或者其他方式连接,图7中以通过总线连接为例。
处理器31可以为中央处理器(Central Processing Unit,CPU)。处理器31还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器32作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的公共交通站点的出行客流的确定方法对应的程序指令/模块(例如,图6所示的第一获取模块201、第一确定模块202、第二确定模块203、筛选模块204、第三确定模块205、第四确定模块206、第二获取模块207、第五确定模块208、第六确定模块209、第七确定模块210、生成模块211、第八确定模块212、第九确定模块213)。处理器31通过运行存储在存储器32中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的公共交通站点的出行客流的确定方法。
存储器32可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器31所创建的数据等。此外,存储器32可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器32可选包括相对于处理器31远程设置的存储器,这些远程存储器可以通过网络连接至处理器31。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器32中,当被所述处理器31执行时,执行如图1所示实施例中的公共交通站点的出行客流的确定方法。
上述计算机设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
可选地,本发明实施例还提供了一种非暂态计算机可读介质,非暂态计算机可读存储介质存储计算机指令,计算机指令用于使计算机执行如上述实施例中任意一项描述的公共交通站点的出行客流的确定方法,其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (9)

1.一种公共交通站点的出行客流的确定方法,其特征在于,包括:
获取公共交通的运行路单数据以及GPS数据,所述GPS数据包括GPS设备编号数据、GPS轨迹数据;
根据所述运行路单数据、所述GPS数据,确定静态线路信息表,将所述静态线路信息表进行网格划分,生成静态线路信息网格表,所述静态线路信息表用以表征显示所述GPS轨迹数据对应的线路信息及对应公交站点的地图;
根据所述静态线路信息网格表中对应的公交站点,确定多个候选区域;
根据所述GPS轨迹数据,筛选分别落在各所述候选区域内的GPS打点数据,并分别记录所述GPS打点数据的打点时间;
获取乘客的支付数据,根据所述支付数据的支付时间,以及所述GPS打点数据的打点时间,确定目标站点的上车客流;所述支付数据包括刷卡数据和扫码支付数据;
所述获取乘客的支付数据,根据所述支付数据的支付时间,以及所述GPS打点数据的打点时间,确定目标站点的上车客流,具体包括:
获取乘客的支付数据,确定所述支付数据的支付时间;
根据第一预设时间间隔以及所述支付数据的支付时间,将支付时间间隔小于所述第一预设时间间隔的连续相邻的两条支付数据合并,生成聚类支付数据;
根据所述聚类支付数据的支付时间,以及所述GPS打点数据的打点时间,确定乘客的上车站点;
根据多个乘客的上车站点,确定各公共站点的上车客流;
所述根据所述聚类支付数据的支付时间,以及所述GPS打点数据的打点时间,确定乘客的上车站点,具体包括:
根据所述GPS打点数据的打点时间,分别确定所述候选区域的打点时间范围;
根据第一候选区域的第一打点时间范围,及与所述第一候选区域相邻的第二候选区域的第二打点时间范围,确定第一候选区域对应的第一公交站点的刷卡时间范围;
当所述聚类支付数据的支付时间,符合所述第一公交站点的刷卡时间范围时,将所述第一公交站点确定为所述聚类支付数据的上车站点;
获取符合预设条件的乘客的支付数据,根据所述符合预设条件的乘客的支付数据,确定同一乘客的连续两次的上车站点信息及上车时间信息,包括第一上车站点、第一上车时间、第二上车站点以及第二上车时间;
获取所述第一上车站点对应线路上的站点信息;
根据所述第一上车站点对应线路上的站点信息以及所述第二上车站点,将距离所述第二上车站点最近的公交站点确定为乘客的下车站点;
根据乘客的下车站点,确定目标站点的第一类下车客流;
获取不符合预设条件的乘客的支付数据,根据所述不符合预设条件的乘客的支付数据、所述运行路单数据以及乘客的出行距离分布数据,确定乘客在对应线路上的各站点的下车概率;
根据乘客在对应线路上的各站点的下车概率,生成目标站点的下车概率模型;
根据所述目标站点的下车概率模型,确定目标站点的第二类下车客流;
根据所述目标站点的上车客流、第一类下车客流以及第二类下车客流,确定所述目标站点的客流;
所述根据所述运行路单数据、所述GPS数据,确定静态线路信息表,其中,所述运行路单数据包括:第一车牌信息、上下行数据信息,包括:
根据所述GPS设备编号数据确定所述GPS轨迹数据对应的第二车牌信息;
根据所述第一车牌信息、第二车牌信息以及上下行数据信息,确定所述GPS轨迹数据对应的班次信息,所述班次信息包括线路信息以及始末时间信息;
根据所述GPS轨迹数据以及所述始末时间信息,确定所述GPS轨迹数据对应的线路信息;
根据所述GPS轨迹数据对应的线路信息,确定静态线路信息表。
2.根据权利要求1所述的方法,其特征在于,所述将距离所述第二上车站点最近的公交站点确定为乘客的下车站点,具体包括:
将距离所述第二上车站点最近的公交站点确定为拟下车站点;
当拟下车站点与第二上车站点的距离小于预设距离阈值时,将所述拟下车站点确定为乘客的下车站点。
3.根据权利要求1所述的方法,其特征在于,所述根据所述不符合预设条件的乘客的支付数据、所述运行路单数据以及乘客的出行距离分布数据,确定乘客在对应线路上的各站点的下车概率,具体包括:
获取乘客在对应线路上的各站点的下车概率矩阵;
根据所述下车概率矩阵以及所述乘客的出行距离分布数据,确定乘客在对应线路上的各站点的下车概率;
其中,通过下述公式计算乘客在对应线路上的各站点的下车概率矩阵:
Figure QLYQS_1
其中,
Figure QLYQS_2
表示各公交站点,/>
Figure QLYQS_3
表示公交线路某个行驶方向的站点数量,/>
Figure QLYQS_4
表示乘客在公交站点/>
Figure QLYQS_5
上车并在公交站点/>
Figure QLYQS_6
下车的概率;
通过下述公式,计算乘客在对应线路上的各站点的下车概率:
Figure QLYQS_7
其中,
Figure QLYQS_8
表示各公交站点,/>
Figure QLYQS_9
表示公交出行途经站点数量的平均值,e为常数,当站点/>
Figure QLYQS_10
后的站点数量小于平均出行途经站点数时,令/>
Figure QLYQS_11
4.根据权利要求3所述的方法,其特征在于,所述根据乘客在对应线路上的各站点的下车概率,生成目标站点的下车概率模型,具体包括:
通过下述公式,对乘客在对应线路上的各站点的下车概率做归一化处理:
Figure QLYQS_12
其中,
Figure QLYQS_13
表示各公交站点,e为常数,/>
Figure QLYQS_14
表示归一化处理后的乘客在不同站点的下车概率;
通过下述公式,计算各站点的吸引权重,所述吸引权重用以表征在不同时段,在其对称时段中的站点上车人数占所属线路的总体上车人数的比例:
Figure QLYQS_15
其中,
Figure QLYQS_16
表示公交线路上各站点的吸引权重,/>
Figure QLYQS_17
表示在预设时间段范围内,也就是/>
Figure QLYQS_18
时段的对称时段/>
Figure QLYQS_19
中站点/>
Figure QLYQS_20
的乘客上车的人数,/>
Figure QLYQS_21
是早晚高峰和平峰三个时段;
通过下述公式,计算目标站点的下车概率模型:
Figure 10000152605259
5.根据权利要求2所述的方法,其特征在于,在将所述拟下车站点确定为乘客的下车站点之后,还包括:
当所述拟下车站点的下车时间与所述第二上车时间的时间间隔小于第二预设时间阈值时,确定存在换乘行为;
当所述拟下车站点的下车时间与所述第二上车时间的时间间隔大于或者等于所述第二预设时间阈值时,确定不存在换乘行为。
6.根据权利要求5所述的方法,其特征在于,还包括:
获取乘客从所述第一上车站点到所述下车站点的第一线路信息以及乘客从所述第二上车站点到目的地的第二线路信息;
合并所述第一线路信息以及所述第二线路信息,生成正向出行线路;
根据所述正向出行线路,模拟生成正向返回线路;
反向排列所述正向出行线路以及所述正向返回线路,生成反向出行线路以及反向返回线路;
根据所述反向出行线路,确定所述反向出行线路的拟下车站点以及换乘站点;
当所述反向出行线路的拟下车站点与所述反向出行线路的换乘站点的距离小于预设距离阈值时,生成所述乘客的出行链数据。
7.一种公共交通站点客流的确定装置,其特征在于,包括:
第一获取模块,用于获取公共交通的运行路单数据以及GPS数据,所述GPS数据包括GPS设备编号数据、GPS轨迹数据;
第一确定模块,用于根据所述运行路单数据、所述GPS数据,确定静态线路信息表,将所述静态线路信息表进行网格划分,生成静态线路信息网格表,所述静态线路信息表用以表征显示所述GPS轨迹数据对应的线路信息及对应公交站点的地图;
第二确定模块,用于根据所述静态线路信息网格表中对应的公交站点,确定多个候选区域;
筛选模块,用于根据所述GPS轨迹数据,筛选分别落在各所述候选区域内的GPS打点数据,并分别记录所述GPS打点数据的打点时间;
第三确定模块,用于获取乘客的支付数据,根据所述支付数据的支付时间,以及所述GPS打点数据的打点时间,确定目标站点的上车客流;所述支付数据包括刷卡数据和扫码支付数据;
所述第三确定模块具体用于获取乘客的支付数据,确定所述支付数据的支付时间;根据第一预设时间间隔以及所述支付数据的支付时间,将支付时间间隔小于所述第一预设时间间隔的连续相邻的两条支付数据合并,生成聚类支付数据;根据所述聚类支付数据的支付时间,以及所述GPS打点数据的打点时间,确定乘客的上车站点;根据多个乘客的上车站点,确定各公共站点的上车客流;
其中所述根据第一预设时间间隔以及所述支付数据的支付时间,将支付时间间隔小于所述第一预设时间间隔的连续相邻的两条支付数据合并,生成聚类支付数据,包括:
根据所述GPS打点数据的打点时间,分别确定所述候选区域的打点时间范围;
根据第一候选区域的第一打点时间范围,及与所述第一候选区域相邻的第二候选区域的第二打点时间范围,确定第一候选区域对应的第一公交站点的刷卡时间范围;
当所述聚类支付数据的支付时间,符合所述第一公交站点的刷卡时间范围时,将所述第一公交站点确定为所述聚类支付数据的上车站点;
第四确定模块,用于获取符合预设条件的乘客的支付数据,根据所述符合预设条件的乘客的支付数据,确定同一乘客的连续两次的上车站点信息及上车时间信息,包括第一上车站点、第一上车时间、第二上车站点以及第二上车时间;
第二获取模块,用于获取所述第一上车站点对应线路上的站点信息;
第五确定模块,用于根据所述第一上车站点对应线路上的站点信息以及所述第二上车站点,将距离所述第二上车站点最近的公交站点确定为乘客的下车站点;
第六确定模块,用于根据乘客的下车站点,确定目标站点的第一类下车客流;
第七确定模块,用于获取不符合预设条件的乘客的支付数据,根据所述不符合预设条件的乘客的支付数据、所述运行路单数据以及乘客的出行距离分布数据,确定乘客在对应线路上的各站点的下车概率;
生成模块,用于根据乘客在对应线路上的各站点的下车概率,生成目标站点的下车概率模型;
第八确定模块,用于根据所述目标站点的下车概率模型,确定目标站点的第二类下车客流;
第九确定模块,用于根据所述目标站点的上车客流、第一类下车客流以及第二类下车客流,确定所述目标站点的客流;
所述运行路单数据包括:第一车牌信息、上下行数据信息,所述第一确定模块还用于:
根据所述GPS设备编号数据确定所述GPS轨迹数据对应的第二车牌信息;
根据所述第一车牌信息、第二车牌信息以及上下行数据信息,确定所述GPS轨迹数据对应的班次信息,所述班次信息包括线路信息以及始末时间信息;
根据所述GPS轨迹数据以及所述始末时间信息,确定所述GPS轨迹数据对应的线路信息;
根据所述GPS轨迹数据对应的线路信息,确定静态线路信息表。
8.一种计算机设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-6中任一项所述的公共交通站点的出行客流的确定方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的公共交通站点的出行客流的确定方法的步骤。
CN202010659295.9A 2020-07-09 2020-07-09 一种公共交通站点的出行客流的确定方法、装置及系统 Active CN111932925B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010659295.9A CN111932925B (zh) 2020-07-09 2020-07-09 一种公共交通站点的出行客流的确定方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010659295.9A CN111932925B (zh) 2020-07-09 2020-07-09 一种公共交通站点的出行客流的确定方法、装置及系统

Publications (2)

Publication Number Publication Date
CN111932925A CN111932925A (zh) 2020-11-13
CN111932925B true CN111932925B (zh) 2023-06-09

Family

ID=73312799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010659295.9A Active CN111932925B (zh) 2020-07-09 2020-07-09 一种公共交通站点的出行客流的确定方法、装置及系统

Country Status (1)

Country Link
CN (1) CN111932925B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112562378B (zh) * 2020-12-01 2023-04-18 平安科技(深圳)有限公司 公交车调度方法、装置、计算机设备及介质
CN112783944B (zh) * 2021-01-21 2024-06-21 广州羊城通有限公司 下车公交站点的确定方法及装置
CN112927547A (zh) * 2021-01-21 2021-06-08 广州羊城通有限公司 下车时间的补充方法及装置
CN113096429B (zh) * 2021-03-09 2022-03-08 东南大学 基于公交调度站点集散的弹性公交区域灵活性线路生成方法
CN113053118A (zh) * 2021-03-18 2021-06-29 重庆交通开投科技发展有限公司 一种集中调度跨线运行圈次时间的预测方法
CN113112806A (zh) * 2021-04-19 2021-07-13 武汉元光科技有限公司 一种快速公交专用站台客流分析方法以及相关设备
CN114446039B (zh) * 2021-12-31 2023-05-19 深圳云天励飞技术股份有限公司 客流分析方法及相关设备
CN114724375B (zh) * 2022-05-05 2023-03-14 厦门理工学院 一种基于物联网的反向乘客识别系统
CN115983487B (zh) * 2023-01-10 2023-07-25 大连理工大学 一种基于卡方分布的机场航站楼旅客时空分布预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550789A (zh) * 2016-02-19 2016-05-04 上海果路交通科技有限公司 一种公交出行客流的预测方法
CN108288321A (zh) * 2018-01-24 2018-07-17 哈尔滨工业大学 基于ic卡数据与车辆gps信息的公交站点上下客流量确定方法
CN110197335A (zh) * 2019-06-04 2019-09-03 湖南智慧畅行交通科技有限公司 一种基于概率od分布模型的下车站点人数计算方法
CN111047858A (zh) * 2019-11-20 2020-04-21 青岛海信网络科技股份有限公司 一种融合算法的公交客流出行od确定方法及装置

Also Published As

Publication number Publication date
CN111932925A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN111932925B (zh) 一种公共交通站点的出行客流的确定方法、装置及系统
Kostakos et al. Wireless detection of end-to-end passenger trips on public transport buses
Zhang et al. Traveler information tool with integrated real-time transit information and multimodal trip planning: Design and implementation
Ma et al. Modeling bus travel time reliability with supply and demand data from automatic vehicle location and smart card systems
Chakirov et al. Use of public transport smart card fare payment data for travel behaviour analysis in Singapore
CN109903553B (zh) 多源数据挖掘的公交车上下车站点识别和检验方法
Chakrabarti The demand for reliable transit service: New evidence using stop level data from the Los Angeles Metro bus system
Yazici et al. Modeling taxi drivers’ decisions for improving airport ground access: John F. Kennedy airport case
CN110853156B (zh) 融合公交gps轨迹与ic卡数据的乘客od识别方法
CN115168529B (zh) 一种基于手机定位数据的枢纽客流溯源方法
Zhao et al. Isolating high-priority metro and feeder bus transfers using smart card data
Seya et al. Decisions on truck parking place and time on expressways: An analysis using digital tachograph data
Saputra et al. Accessibility model of BRT stop locations using Geographically Weighted regression (GWR): A case study in Banjarmasin, Indonesia
Cyril et al. Electronic ticket machine data analytics for public bus transport planning
CN108681741B (zh) 基于ic卡和居民调查数据的地铁通勤人群信息融合方法
CN110942158B (zh) 铁路列车添乘检查系统
CN113160542A (zh) 基于信息反馈的乘车方法及装置
CN116090785B (zh) 针对大型活动散场场景两阶段的定制公交规划方法
Kamga et al. Using advanced technologies to manage airport taxicab operations
Shi et al. Generating synthetic passenger data through joint traffic-passenger modeling and simulation
Fadeev et al. Using Automated Fare Collection System Data to Determine Transport Demand
Dinko et al. Data Sources Analysis for Sustainable Trip Planner Development for Riga City
CN111339159A (zh) 一种一票制公交数据的分析挖掘方法
Sokulskyi et al. The Internet of Things Solutions in the Investigation of Urban Passenger Traffic and Passenger Service Quality
Aslam et al. Evaluation of urban bus transport failure in Gujranwala City of Pakistan

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant