CN110276977A - 一种公交站点匹配方法、装置、设备及可读存储介质 - Google Patents

一种公交站点匹配方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN110276977A
CN110276977A CN201910691095.9A CN201910691095A CN110276977A CN 110276977 A CN110276977 A CN 110276977A CN 201910691095 A CN201910691095 A CN 201910691095A CN 110276977 A CN110276977 A CN 110276977A
Authority
CN
China
Prior art keywords
data
card
public transport
arrival time
brushing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910691095.9A
Other languages
English (en)
Other versions
CN110276977B (zh
Inventor
何仕晔
谢侃
谢胜利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201910691095.9A priority Critical patent/CN110276977B/zh
Publication of CN110276977A publication Critical patent/CN110276977A/zh
Application granted granted Critical
Publication of CN110276977B publication Critical patent/CN110276977B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/123Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams

Abstract

本发明公开了一种公交站点匹配方法,该方法包括:获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并利用第一GPS公交数据推导第一公交到站时间数据;对第一公交到站时间数据和第一IC卡刷卡数据进行统计,获得特征用户表;获取第二时段内的第二IC卡刷卡数据,对第二IC卡刷卡数据进行聚类,获得聚类结果;查询特征用户表对聚类结果进行投票,获得第二公交到站时间数据;利用第二IC卡刷卡数据和第二公交到站时间数据对特征用户表进行更新。该方法,摆脱站点匹配时对GPS公交数据依赖的情况下提高站点匹配准确率。本发明还公开了一种公交站点匹配装置、设备及可读存储介质,具有相应的技术效果。

Description

一种公交站点匹配方法、装置、设备及可读存储介质
技术领域
本发明涉及智能交通技术领域,特别是涉及一种公交站点匹配方法、装置、设备及可读存储介质。
背景技术
随着大数据、人工智能等技术的发展,各种拥有海量数据的领域开始了对数据更加深入的探索,公共交通领域便是其一。众多学者基于IC卡交易数据的研究包括:公交客流分析,公交到站时间预测,公交用户画像,公交od分析等。以上研究都需要得到公交站点匹配数据。对于公交站点匹配,目前的解决方案大概分为两类:
第一类、基于GPS与IC卡数据的公交站点匹配:该类使用GPS数据,结合公交站点经纬度,推导公交到达站点以及到站时间,再根据到站时间与IC卡刷卡时间来推导IC卡刷卡站点。
第二类、基于IC卡数据的公交站点匹配,该类别的研究包含:基于用户换乘数据(利用用户换乘数据:公交线间的正交和非正交换乘信息、地铁和公交线间的换乘信息等,推导用户刷卡站点,实现站点匹配),基于聚类分析(对某辆公交车的刷卡记录进行聚类,由于用户刷卡的时间是相对紧凑的,算法将会得到不同的聚类簇,通过聚类簇推导刷卡站点)等。
对于上述的第一类方案:该方案十分依赖GPS公交数据,而GPS公交数据仅掌握在公交公司,对于大部分研究者来说是较难获取的。
对于上述的第二类方案:该方案脱离GPS公交数据,仅以IC卡刷卡数据推导IC卡刷卡站点,这种方案虽然降低了数据需求,即无需GPS公交数据,但是同样的也降低了站点匹配的准确率,无法与第一类方案的准确率相比。
综上所述,如何有效地解决公交站点匹配准确率等问题,是目前本领域技术人员急需解决的技术问题。
发明内容
本发明的目的是提供一种公交站点匹配方法、装置、设备及可读存储介质,无需完全依赖GPS公交数据的基础上,提高公交站点匹配准确率。
为解决上述技术问题,本发明提供如下技术方案:
一种公交站点匹配方法,包括:
获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并利用所述第一GPS公交数据推导第一公交到站时间数据;所述第一GPS公交数据为真实数据;
对所述第一公交到站时间数据和所述第一IC卡刷卡数据进行统计,获得特征用户表;
获取第二时段内的第二IC卡刷卡数据,对所述第二IC卡刷卡数据进行聚类,获得聚类结果;
查询所述特征用户表对所述聚类结果进行投票,获得第二公交到站时间数据;
利用所述第二IC卡刷卡数据和所述第二公交到站时间数据对所述特征用户表进行更新。
优选地,所述获取第二时段内的第二IC卡刷卡数据,对所述第二IC卡刷卡数据进行聚类,获得聚类结果,包括:
获取所述第二IC卡刷卡数据,并按照公交车的PID号对所述第二IC卡刷卡数据进行分割,获得每一个所述PID号对应的刷卡数据;
对所述刷卡数据进行聚类,获得所述聚类结果。
优选地,查询所述特征用户表对所述聚类结果进行投票,获得第二公交到站时间数据,包括:
查询所述特征用户表,并对所述聚类结果中各个数据簇内每一条刷卡数据的卡号进行投票,获得第二公交到站时间数据。
优选地,对所述聚类结果中各个数据簇内每一条刷卡数据的IC卡号进行投票,获得第二公交到站时间数据,包括:
对所述IC卡号在各个站点进行投票,获得各个站点得分;
利用对所述各个站点得分进行处理,得到得分最高的目标站点;其中,T为所述数据簇对应的用户刷卡时间,n为所述数据簇对应的用户数量,tij为所述特征用户表中j时段用户在目标站点刷卡次数,α、β为参数值;
获取数据簇中最早的用户刷卡时间数据,将所述刷卡时间作为所述第二公交到站时间数据。
优选地,在查询所述特征用户表对所述聚类结果进行投票,获得第二公交到站时间数据之后,在对所述特征用户表进行更新之前,还包括:
利用历史公交到站时间间隔确定推导目标站点;
判断所述推导目标站点与所述目标站点是否相同;
如果否,则比较上下聚类簇并结合所述历史公交到站时间间隔确定站点,并对所述公交到站时间数据进行重新确认。
优选地,还包括:
利用所述特征用户表完成IC卡刷卡数据的站点匹配,对公共交通进行统计分析,并基于统计分析结果对公共交通进行优化。
优选地,利用所述特征用户表完成IC卡刷卡数据的站点匹配,对公共交通进行统计分析,包括:
利用所述特征用户表完成IC卡刷卡数据的站点匹配,利用匹配完成的IC卡刷卡数据对公交客流分析,公交到站时间预测,公交用户画像和公交od分析中的至少一种。
一种公交站点匹配装置,包括:
数据获取模块,用于获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并利用所述第一GPS公交数据推导第一公交到站时间数据;所述第一GPS公交数据为真实数据;
特征用户表获取模块,用于对所述第一公交到站时间数据和所述第一IC卡刷卡数据进行统计,获得特征用户表;
IC卡刷卡数据处理模块,用于获取第二时段内的第二IC卡刷卡数据,对所述第二IC卡刷卡数据进行聚类,获得聚类结果;
站点匹配模块,用于查询所述特征用户表对所述聚类结果进行投票,获得第二公交到站时间数据;
特征用户表更新模块,用于利用所述第二IC卡刷卡数据和所述第二公交到站时间数据对所述特征用户表进行更新。
一种公交站点匹配设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述公交站点匹配方法的步骤。
一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述公交站点匹配方法的步骤。
应用本发明实施例所提供的方法,获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并利用第一GPS公交数据推导第一公交到站时间数据;第一GPS公交数据为真实数据;对第一公交到站时间数据和第一IC卡刷卡数据进行统计,获得特征用户表;获取第二时段内的第二IC卡刷卡数据,对第二IC卡刷卡数据进行聚类,获得聚类结果;查询特征用户表对聚类结果进行投票,获得第二公交到站时间数据;利用第二IC卡刷卡数据和第二公交到站时间数据对特征用户表进行更新。
可见,在本方法中首先获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并对第一GPS公交数据进行分析,获得第一公交到站时间数据,结合第一IC卡刷卡数据进行统计,得到特征用户表。在得到特征用户表后,在第二时段可仅获取第二IC卡刷卡数据,并借助特征用户表对第二IC卡刷卡数据进行站点匹配,即可获得第二公交到站时间数据。而后在基于第二IC卡刷卡数据和第二公交到站时间数据完成第二IC卡刷卡数据的站点匹配,并对特征用户表进行更新,得到特征用户表。可见,在完成第二IC卡数据站点匹配的过程中,无需直接获取与第二IC卡刷卡数据匹配的GPS公交数据,而是基于特征用户表便可通过投票获取,摆脱了站点匹配时对GPS公交数据的依赖,同时又因特征用户表是基于真实的GPS公交数据和第一IC卡刷卡数据进行分析统计而得,因而基于该特征用户表所进行的站点匹配相对于仅基于IC卡刷卡数据进行站点匹配更为准确。
相应地,本发明实施例还提供了与上述公交站点匹配方法相对应的公交站点匹配装置、设备和可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种公交站点匹配方法的实施流程图;
图2为本发明实施例中一种聚类结果与车辆运行情况对应关系示意图;
图3为本发明实施例中另一种公交站点匹配方法的流程示意图;
图4为本发明实施例中一种数据簇与站点对应关系示意图;
图5为本发明实施例中一种公交站点匹配装置的结构示意图;
图6为本发明实施例中一种公交站点匹配设备的结构示意图;
图7为本发明实施例中一种公交站点匹配设备的具体结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
请参考图1,图1为本发明实施例中一种公交站点匹配方法的流程图,该方法包括以下步骤:
S101、获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并利用第一GPS公交数据推导第一公交到站时间数据。
其中,第一GPS公交数据为真实数据。
在本发明实施例中第一时段和第二时段指两个不同的时段,两个时段无先后时间限定,对于两个时段所对应的时长也不做限定(可优选设置为相同时长),例如当第一时段指2019年1月,第二时段可指2019年2月,即时段对应时长为1个月(当然也可设置为一周、一天等时长,考虑到用户乘坐公交在小于24小时时,重复行为较少,优选设置为一天及以上的时长)。
在实际应用中,为了保障站点匹配的可靠性,第一时段内的第一GPS公交数据可从公交公司获得,以保障其真实可靠。对于第一IC卡刷卡数据则可直接将公交交易数据作为第一IC卡刷卡数据。另外,在本申请中第一时段内对应的GPS公交数据则称之为第一GPS公交数据,分析得到的第一时段内对应的公交到站时间数据则称之为第一公交到站时间数据,第一时段内对应的IC卡刷卡数据则称之为第一IC卡刷卡数据。相应地,第二时段内分析得到的公交到站时间数据即为第二公交到站时间数据,第二时段内对应的IC卡刷卡数据则称之为第二IC卡刷卡数据。需要说明的是,对于第一IC卡刷卡数据与第二IC卡刷卡数据其区别仅在于其对应的不同时段的刷卡数据;而对于第一公交到站时间数据和第二公交到站时间数据而言,其区别包括:1、对应时段不同,2,第一公交到站时间数据直接由真实的GPS公交数据分析推导而来,而第二公交到站时间数据为基于本发明实施例所提供的站点匹配方法所预测或估计确定得到的公交到站时间数据。对于GPS公交数据即为具有GPS定位信息的公交车位置数据,而IC卡刷卡数据则可为包括公交车的PID号(即公交车刷卡机ID号),交易金额、上下车刷卡时间的数据。
S102、对第一公交到站时间数据和第一IC卡刷卡数据进行统计,获得特征用户表。
得到第一公交到站时间数据和第一IC卡刷卡数据之后,便可进行数据统计,得到特征用户表。
具体的,即基于第一GPS公交数据获得第一公交到站时间数据,结合第一IC卡刷卡数据推导得到IC卡刷卡站点数据。即确定每一次IC卡刷卡交易记录所对应的上车站点。以2019年1月为例,使用201901的GPS数据和IC卡刷卡数据,可以推导得到201901的IC卡刷卡站点数据。对于大部分用户来说,其某一时间段内的刷卡站点是相对固定的,基于此可建立如表1所示的特征用户表:
表1
该特征用户表包括201901所有持有各个卡号分别对应的用户在各个小时内的刷卡站点与刷卡次数。
S103、获取第二时段内的第二IC卡刷卡数据,对第二IC卡刷卡数据进行聚类,获得聚类结果。
在获取到且需要对第二IC卡刷卡数据进行站点匹配时,考虑到多个用户在同一个站点乘坐同一辆公交车时,这多个用户的上车刷卡时间相对集中,相应地对于下车刷卡时间也相对集中。基于此,可对第二IC卡刷卡数据进行聚类处理。具体的,聚类时重点参照其刷卡时间的间隔距离进行距离。由于IC卡刷卡数据会包括公交车的PID号,而不同的车辆在同一时段可能会在不同的站点产生刷卡行为,因而在进行聚类处理时,可针对每一辆公交车对应的IC卡刷卡数据进行聚类,以避免车辆之间相互产生混淆。具体的,可获取第二IC卡刷卡数据,并按照公交车的PID号对第二IC卡刷卡数据进行分割,获得每一个PID号对应的刷卡数据;对刷卡数据进行聚类,获得聚类结果。
请参考图2,图2为本发明实施例中一种聚类结果与车辆运行情况对应关系示意图。通常乘坐公交车时,用户都会在上车时或上车后较短时间便完成上车刷卡,在下车前较短时间内或在下车时完成下车刷卡,该情况也可从该图中体现,聚类所得到的数据簇主要集中在站点附近。
对第二IC卡刷卡数据进行聚类分析后,得到聚类结果即刷卡数据簇,而同一个数据簇代表刷卡数据属于同一站点。
S104、查询特征用户表对聚类结果进行投票,获得第二公交到站时间数据。
对于各个簇的数据,获取该簇内刷卡数据的卡号,查询特征用户表,进行投票。即,可查询特征用户表,并对聚类结果中各个数据簇内每一条刷卡数据的卡号进行投票,获得第二公交到站时间数据。
具体实现步骤,包括:
步骤一、对IC卡号在各个站点进行投票,获得各个站点得分;
步骤二、利用对各个站点得分进行处理,得到得分最高的目标站点;其中,T为数据簇对应的用户刷卡时间,n为数据簇对应的用户数量,tij为特征用户表中j时段用户在目标站点刷卡次数,α、β为参数值;
步骤三、获取数据簇中最早的用户刷卡时间数据,将刷卡时间作为第二公交到站时间数据。
为便于描述,下面将上述三个步骤结合起来进行说明。
各个卡号根据其各个时间段内的刷卡站点的次数进行投票,例如根据表1,若卡号1属于数据簇1,并且是在5点刷卡,则卡号1对刷卡站点投票结果为:
a站点得分:α*[(β-|5-6|)*8+(β-|5-7|)*16+...];
b站点得分:α*[(β-|5-7|)*2+...];
其中,α、β可为使用算法训练得到最优参数值,该算法可具体为线性回归算法。
数据簇1内所有卡分别对站点进行投票后,各个站点得分累加,得到最终的站点得分,分数最高的站点即刷卡站点。站点得分的公式模型如下:
其中,T表示该数据簇用户刷卡的小时,n表示该数据簇用户的数量,tij表示特种用户表中j小时用户在该站点刷卡次数,α、β需要使用算法训练得到最优参数值。
由于可以通过公交车的PID号得知该公交车所属线路,因此可以根据IC卡聚类分析以及历史公交车到站时间数据得到聚类簇所属站点。得到匹配的站点之后,获取数据簇中最早的用户刷卡时间数据,将该刷卡时间作为第二公交到站时间数据。
S105、利用第二IC卡刷卡数据和第二公交到站时间数据对特征用户表进行更新。
得到第二IC卡刷卡数据和第二公交到站时间数据之后,便可对特征用户表进行更新。更新后的特征用户表仍然可用于对IC卡刷卡数据进行站点匹配,具体实现过程,可参见上述步骤S103至S104。当然,完成站点匹配后,依然可跟据站点匹配后得到的公交到站时间数据对特征用户表进行更新。
应用本发明实施例所提供的方法,获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并利用第一GPS公交数据推导第一公交到站时间数据;第一GPS公交数据为真实数据;对第一公交到站时间数据和第一IC卡刷卡数据进行统计,获得特征用户表;获取第二时段内的第二IC卡刷卡数据,对第二IC卡刷卡数据进行聚类,获得聚类结果;查询特征用户表对聚类结果进行投票,获得第二公交到站时间数据;利用第二IC卡刷卡数据和第二公交到站时间数据对特征用户表进行更新。
可见,在本方法中首先获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并对第一GPS公交数据进行分析,获得第一公交到站时间数据,结合第一IC卡刷卡数据进行统计,得到特征用户表。在得到特征用户表后,在第二时段可仅获取第二IC卡刷卡数据,并借助特征用户表对第二IC卡刷卡数据进行站点匹配,即可获得第二公交到站时间数据。而后在基于第二IC卡刷卡数据和第二公交到站时间数据对特征用户表进行更新,得到特征用户表。可见,在获得特征用户表的过程中,无需直接获取与第二IC卡刷卡数据匹配的GPS公交数据,而是基于特征用户表便可通过投票获取,摆脱了站点匹配时对GPS公交数据的依赖,同时有因特征用户表是基于真实的GPS公交数据和第一IC卡刷卡数据进行分析统计而得,因而基于该特征用户表所进行的站点匹配相对于仅基于IC卡刷卡数据进行站点匹配更为准确。
需要说明的是,基于上述实施例,本发明实施例还提供了相应的改进方案。在优选/改进实施例中涉及与上述实施例中相同步骤或相应步骤之间可相互参考,相应的有益效果也可相互参照,在本文的优选/改进实施例中不再一一赘述。
优选地,为了提高站点匹配准确率,在查询特征用户表对聚类结果进行投票,获得第二公交到站时间数据之后,在对特征用户表进行更新之前,还可以执行以下步骤:
步骤一、利用历史公交到站时间间隔确定推导目标站点;
步骤二、判断推导目标站点与目标站点是否相同;
步骤三、如果否,则比较上下聚类簇并结合历史公交到站时间间隔确定站点,并对公交到站时间数据进行重新确认。
为便于理解,请参考图3,图3为本发明实施例中另一种公交站点匹配方法的流程示意图。在得到投票结果(即基于聚类投票得到匹配站点)后,站点匹配结果可先行待定。可将投票模型的得出的结果与现有的聚类模型(如背景技术所描述的第二类匹配确定方法,当然也可参考该匹配确定方法的具体实现过程)得出的结果相互比较,若结果相同则确认为刷卡站点,若不同则根据该聚类簇之前以及之后的聚类簇对应站点来推导该聚类簇对应站点,如图4;每一个椭圆代表一个站点(如B1为始发站,B2为终点站),椭圆下方簇1、簇2、簇3、簇4为聚类所得的数据簇。具体的,若簇3对应站点尚不确定,由于该公交车所属线路以及线路所有站点均为已知,若簇2簇4只相隔一个站,则簇3即为两站中间站,若相隔站点超过一个,则可根据三个簇之间的刷卡时间对比历史公交车到站时间间隔推导簇3对应站点。
优选地,在本发明实施例中,还可利用特征用户表完成IC卡刷卡数据的站点匹配,对公共交通进行统计分析,并基于统计分析结果对公共交通进行优化。具体的,可利用特征用户表完成IC卡刷卡数据的站点匹配,利用匹配完成的IC卡刷卡数据对公交客流分析,公交到站时间预测,公交用户画像和公交od分析中的至少一种。其中,关于如何基于特征用户表进行对公交客流分析,公交到站时间预测,公交用户画像和公交od分析,可具体参考现有的结合GPS公交数据和IC卡刷卡数据进行分析的具体过程相互参照,在此不再一一赘述。
实施例二:
相应于上面的方法实施例,本发明实施例还提供了一种公交站点匹配装置,下文描述的公交站点匹配装置与上文描述的公交站点匹配方法可相互对应参照。
参见图5所示,该装置包括以下模块:
数据获取模块101,用于获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并利用第一GPS公交数据推导第一公交到站时间数据;第一GPS公交数据为真实数据;
特征用户表获取模块102,用于对第一公交到站时间数据和第一IC卡刷卡数据进行统计,获得特征用户表;
IC卡刷卡数据处理模块103,用于获取第二时段内的第二IC卡刷卡数据,对第二IC卡刷卡数据进行聚类,获得聚类结果;
站点匹配模块104,用于查询特征用户表对聚类结果进行投票,获得第二公交到站时间数据;
特征用户表更新模块105,用于利用第二IC卡刷卡数据和第二公交到站时间数据对特征用户表进行更新。
应用本发明实施例所提供的装置,获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并利用第一GPS公交数据推导第一公交到站时间数据;第一GPS公交数据为真实数据;对第一公交到站时间数据和第一IC卡刷卡数据进行统计,获得特征用户表;获取第二时段内的第二IC卡刷卡数据,对第二IC卡刷卡数据进行聚类,获得聚类结果;查询特征用户表对聚类结果进行投票,获得第二公交到站时间数据;利用第二IC卡刷卡数据和第二公交到站时间数据对特征用户表进行更新。
可见,在本装置中首先获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并对第一GPS公交数据进行分析,获得第一公交到站时间数据,结合第一IC卡刷卡数据进行统计,得到特征用户表。在得到特征用户表后,在第二时段可仅获取第二IC卡刷卡数据,并借助特征用户表对第二IC卡刷卡数据进行站点匹配,即可获得第二公交到站时间数据。而后在基于第二IC卡刷卡数据和第二公交到站时间数据,完成第二IC卡刷卡数据的站点匹配并对特征用户表进行更新,得到特征用户表。可见,在IC卡刷卡数据站点匹配的过程中,无需直接获取与第二IC卡刷卡数据匹配的GPS公交数据,而是基于特征用户表便可通过投票获取,摆脱了站点匹配时对GPS公交数据的依赖,同时有因特征用户表是基于真实的GPS公交数据和第一IC卡刷卡数据进行分析统计而得,因而基于该特征用户表所进行的站点匹配相对于仅基于IC卡刷卡数据进行站点匹配更为准确。
在本发明的一种具体实施方式中,IC卡刷卡数据处理模块103,具体用于获取第二IC卡刷卡数据,并按照公交车的PID号对第二IC卡刷卡数据进行分割,获得每一个PID号对应的刷卡数据;对刷卡数据进行聚类,获得聚类结果。
在本发明的一种具体实施方式中,站点匹配模块104,具体用于查询特征用户表,并对聚类结果中各个数据簇内每一条刷卡数据的卡号进行投票,获得第二公交到站时间数据。
在本发明的一种具体实施方式中,站点匹配模块104,具体用于对IC卡号在各个站点进行投票,获得各个站点得分;利用对各个站点得分进行处理,得到得分最高的目标站点;其中,T为数据簇对应的用户刷卡时间,n为数据簇对应的用户数量,tij为特征用户表中j时段用户在目标站点刷卡次数,α、β为参数值;获取数据簇中最早的用户刷卡时间数据,将该刷卡时间作为第二公交到站时间数据。
在本发明的一种具体实施方式中,还包括:
站点修订模块,用于在查询特征用户表对聚类结果进行投票,获得第二公交到站时间数据之后,在对特征用户表进行更新之前,利用历史公交到站时间间隔确定推导目标站点;判断推导目标站点与目标站点是否相同;如果否,则比较上下聚类簇并结合历史公交到站时间间隔确定站点,并对公交到站时间数据进行重新确认。
在本发明的一种具体实施方式中,还包括:
交通优化模块,用于利用特征用户表完成IC卡刷卡数据的站点匹配对公共交通进行统计分析,并基于统计分析结果对公共交通进行优化。
在本发明的一种具体实施方式中,交通优化模块,具体用于利用特征用户表完成IC卡刷卡数据的站点匹配,利用匹配完成的IC卡刷卡数据对公交客流分析,公交到站时间预测,公交用户画像和公交od分析中的至少一种。
实施例三:
相应于上面的方法实施例,本发明实施例还提供了一种公交站点匹配设备,下文描述的一种公交站点匹配设备与上文描述的一种公交站点匹配方法可相互对应参照。
参见图6所示,该公交站点匹配设备包括:
存储器D1,用于存储计算机程序;
处理器D2,用于执行计算机程序时实现上述方法实施例的公交站点匹配方法的步骤。
具体的,请参考图7,图7为本实施例提供的一种公交站点匹配设备的具体结构示意图,该公交站点匹配设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)322(例如,一个或一个以上处理器)和存储器332,一个或一个以上存储应用程序342或数据344的存储介质330(例如一个或一个以上海量存储设备)。其中,存储器332和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对数据处理设备中的一系列指令操作。更进一步地,中央处理器322可以设置为与存储介质330通信,在公交站点匹配设备301上执行存储介质330中的一系列指令操作。
公交站点匹配设备301还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个以上操作系统341。例如,Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等。
上文所描述的公交站点匹配方法中的步骤可以由公交站点匹配设备的结构实现。
实施例四:
相应于上面的方法实施例,本发明实施例还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种公交站点匹配方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的公交站点匹配方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

Claims (10)

1.一种公交站点匹配方法,其特征在于,包括:
获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并利用所述第一GPS公交数据推导第一公交到站时间数据;所述第一GPS公交数据为真实数据;
对所述第一公交到站时间数据和所述第一IC卡刷卡数据进行统计,获得特征用户表;
获取第二时段内的第二IC卡刷卡数据,对所述第二IC卡刷卡数据进行聚类,获得聚类结果;
查询所述特征用户表对所述聚类结果进行投票,获得第二公交到站时间数据;
利用所述第二IC卡刷卡数据和所述第二公交到站时间数据对所述特征用户表进行更新。
2.根据权利要求1所述的公交站点匹配方法,其特征在于,所述获取第二时段内的第二IC卡刷卡数据,对所述第二IC卡刷卡数据进行聚类,获得聚类结果,包括:
获取所述第二IC卡刷卡数据,并按照公交车的PID号对所述第二IC卡刷卡数据进行分割,获得每一个所述PID号对应的刷卡数据;
对所述刷卡数据进行聚类,获得所述聚类结果。
3.根据权利要求1所述的公交站点匹配方法,其特征在于,查询所述特征用户表对所述聚类结果进行投票,获得第二公交到站时间数据,包括:
查询所述特征用户表,并对所述聚类结果中各个数据簇内每一条刷卡数据的卡号进行投票,获得第二公交到站时间数据。
4.根据权利要求3所述的公交站点匹配方法,其特征在于,对所述聚类结果中各个数据簇内每一条刷卡数据的IC卡号进行投票,获得第二公交到站时间数据,包括:
对所述IC卡号在各个站点进行投票,获得各个站点得分;
利用对所述各个站点得分进行处理,得到得分最高的目标站点;其中,T为所述数据簇对应的用户刷卡时间,n为所述数据簇对应的用户数量,tij为所述特征用户表中j时段用户在目标站点刷卡次数,α、β为参数值;
获取数据簇中最早的用户刷卡时间数据,将所述刷卡时间作为所述第二公交到站时间数据。
5.根据权利要求4所述的公交站点匹配方法,其特征在于,在查询所述特征用户表对所述聚类结果进行投票,获得第二公交到站时间数据之后,在对所述特征用户表进行更新之前,还包括:
利用历史公交到站时间间隔确定推导目标站点;
判断所述推导目标站点与所述目标站点是否相同;
如果否,则比较上下聚类簇并结合所述历史公交到站时间间隔确定站点,并对所述公交到站时间数据进行重新确认。
6.根据权利要求1至5任一项所述的公交站点匹配方法,其特征在于,还包括:
利用所述特征用户表完成IC卡刷卡数据的站点匹配,对公共交通进行统计分析,并基于统计分析结果对公共交通进行优化。
7.根据权利要求6所述的公交站点匹配方法,其特征在于,利用所述特征用户表完成IC卡刷卡数据的站点匹配,对公共交通进行统计分析,包括:
利用所述特征用户表完成IC卡刷卡数据的站点匹配,利用匹配完成的IC卡刷卡数据对公交客流分析,公交到站时间预测,公交用户画像和公交od分析中的至少一种。
8.一种公交站点匹配装置,其特征在于,包括:
数据获取模块,用于获取第一时段内具有匹配关系的第一GPS公交数据和第一IC卡刷卡数据,并利用所述第一GPS公交数据推导第一公交到站时间数据;所述第一GPS公交数据为真实数据;
特征用户表获取模块,用于对所述第一公交到站时间数据和所述第一IC卡刷卡数据进行统计,获得特征用户表;
IC卡刷卡数据处理模块,用于获取第二时段内的第二IC卡刷卡数据,对所述第二IC卡刷卡数据进行聚类,获得聚类结果;
站点匹配模块,用于查询所述特征用户表对所述聚类结果进行投票,获得第二公交到站时间数据;
特征用户表更新模块,用于利用所述第二IC卡刷卡数据和所述第二公交到站时间数据对所述特征用户表进行更新。
9.一种公交站点匹配设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述公交站点匹配方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述公交站点匹配方法的步骤。
CN201910691095.9A 2019-07-29 2019-07-29 一种公交站点匹配方法、装置、设备及可读存储介质 Active CN110276977B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910691095.9A CN110276977B (zh) 2019-07-29 2019-07-29 一种公交站点匹配方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910691095.9A CN110276977B (zh) 2019-07-29 2019-07-29 一种公交站点匹配方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN110276977A true CN110276977A (zh) 2019-09-24
CN110276977B CN110276977B (zh) 2021-01-26

Family

ID=67966050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910691095.9A Active CN110276977B (zh) 2019-07-29 2019-07-29 一种公交站点匹配方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110276977B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110706477A (zh) * 2019-10-12 2020-01-17 杭州律橙电子科技有限公司 一种公交站点匹配方法
CN111127284A (zh) * 2019-11-11 2020-05-08 阿里巴巴集团控股有限公司 交通停靠站点的选址方法、推荐方法、设备及存储介质
CN111599180A (zh) * 2020-06-02 2020-08-28 悉地(苏州)勘察设计顾问有限公司 城市公交线路韧性评估方法及系统
CN112819229A (zh) * 2021-02-04 2021-05-18 汉纳森(厦门)数据股份有限公司 一种基于分布式机器学习的行车站点优化更新方法和系统
CN114038225A (zh) * 2021-11-08 2022-02-11 深圳市雪球科技有限公司 一种公交线路的数据处理方法、装置与电子设备
CN111985710B (zh) * 2020-08-18 2023-08-25 深圳诺地思维数字科技有限公司 一种公交乘客出行站点预测方法、存储介质及服务器

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003187273A (ja) * 2001-12-21 2003-07-04 Tamura Electric Works Ltd 発券装置及び案内装置及び行き先案内方法
JP2005250952A (ja) * 2004-03-05 2005-09-15 Toshiba Corp バスの制御装置とバス運行管理装置とバス運行管理システム
CN105809292A (zh) * 2016-03-21 2016-07-27 广州地理研究所 公交ic卡乘客下车站点推算方法
CN109523819A (zh) * 2018-11-20 2019-03-26 湖南智慧畅行交通科技有限公司 一种基于公交到离站的乘客ic卡数据与站点匹配方法
CN109637134A (zh) * 2018-12-28 2019-04-16 青岛大学 一种公交设备匹配方法
CN109903553A (zh) * 2019-02-19 2019-06-18 华侨大学 多源数据挖掘的公交车上下车站点识别和检验方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003187273A (ja) * 2001-12-21 2003-07-04 Tamura Electric Works Ltd 発券装置及び案内装置及び行き先案内方法
JP2005250952A (ja) * 2004-03-05 2005-09-15 Toshiba Corp バスの制御装置とバス運行管理装置とバス運行管理システム
CN105809292A (zh) * 2016-03-21 2016-07-27 广州地理研究所 公交ic卡乘客下车站点推算方法
CN109523819A (zh) * 2018-11-20 2019-03-26 湖南智慧畅行交通科技有限公司 一种基于公交到离站的乘客ic卡数据与站点匹配方法
CN109637134A (zh) * 2018-12-28 2019-04-16 青岛大学 一种公交设备匹配方法
CN109903553A (zh) * 2019-02-19 2019-06-18 华侨大学 多源数据挖掘的公交车上下车站点识别和检验方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
张欣环 等: "基于IC卡和GPS信息的城市常规公交客流分析", 《浙江师范大学学报(自然科学版)》 *
李佳怡 等: "城市公交乘客下车站点推算方法和有效性评价", 《武汉大学学报·信息科学版》 *
杜行舟: "基于公交运营数据的复杂公交线网静态评价及优化研究", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 *
柳伍生 等: "基于IC卡数据的公交下车站点区间不确定性客流推导方法", 《铁道科学与工程学报》 *
邓红星 等: "基于公交IC卡和GPS数据的公交OD量推算研究", 《重庆理工大学学报(自然科学)》 *
魏硕 等: "Model Research on Passenger on and off Site Based on Bus IC Card and GPS Data", 《交通技术》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110706477A (zh) * 2019-10-12 2020-01-17 杭州律橙电子科技有限公司 一种公交站点匹配方法
CN110706477B (zh) * 2019-10-12 2021-07-20 杭州律橙电子科技有限公司 一种公交站点匹配方法
CN111127284A (zh) * 2019-11-11 2020-05-08 阿里巴巴集团控股有限公司 交通停靠站点的选址方法、推荐方法、设备及存储介质
CN111127284B (zh) * 2019-11-11 2023-06-20 阿里巴巴集团控股有限公司 交通停靠站点的选址方法、推荐方法、设备及存储介质
CN111599180A (zh) * 2020-06-02 2020-08-28 悉地(苏州)勘察设计顾问有限公司 城市公交线路韧性评估方法及系统
CN111985710B (zh) * 2020-08-18 2023-08-25 深圳诺地思维数字科技有限公司 一种公交乘客出行站点预测方法、存储介质及服务器
CN112819229A (zh) * 2021-02-04 2021-05-18 汉纳森(厦门)数据股份有限公司 一种基于分布式机器学习的行车站点优化更新方法和系统
CN112819229B (zh) * 2021-02-04 2022-10-28 汉纳森(厦门)数据股份有限公司 一种基于分布式机器学习的行车站点优化更新方法和系统
CN114038225A (zh) * 2021-11-08 2022-02-11 深圳市雪球科技有限公司 一种公交线路的数据处理方法、装置与电子设备
CN114038225B (zh) * 2021-11-08 2023-03-14 深圳市雪球科技有限公司 一种公交线路的数据处理方法、装置与电子设备

Also Published As

Publication number Publication date
CN110276977B (zh) 2021-01-26

Similar Documents

Publication Publication Date Title
CN110276977A (zh) 一种公交站点匹配方法、装置、设备及可读存储介质
CN109151168B (zh) 乘车码的切换方法、装置、移动终端及可读存储介质
CN107133318B (zh) 一种基于手机信令数据的人口识别方法
CN111985710A (zh) 一种公交乘客出行站点预测方法、存储介质及服务器
CN102156732B (zh) 基于特征站点的公交ic卡数据站点匹配方法
CN103150177A (zh) 一种更新公交线路数据的方法、装置和系统
CN105677793A (zh) 地点数据库的建立和候选乘车地点的推荐方法及装置
CN105894358A (zh) 通勤订单识别方法和装置
CN105701180A (zh) 一种基于公交ic卡数据的通勤乘客特征提取及判定方法
CN109145982A (zh) 驾驶员的身份识别方法及装置、存储介质、终端
CN108292308A (zh) 根据移动习惯为用户推荐车辆/乘客资源
CN109903553A (zh) 多源数据挖掘的公交车上下车站点识别和检验方法
CN111510368B (zh) 家庭群组识别方法、装置、设备及计算机可读存储介质
CN111414719B (zh) 地铁站周边特征提取、交通需求估计方法及装置
CN106504525A (zh) 基于ic卡数据的od矩阵生成技术及其应用研究
CN109041218A (zh) 一种预测用户位置的方法和智能硬件
Chen et al. An analysis of movement patterns between zones using taxi GPS data
CN101893960B (zh) 一种基于方向向量的文字识别方法和识别装置
Yan et al. An incentive mechanism for private parking-sharing programs in an imperfect information setting
CN112488388B (zh) 基于概率分布的出站客流预测方法及装置
US11756678B1 (en) Methods and systems for scheduling vaccines in smart cities based on internet of things (IoT)
CN107679635A (zh) 基于优先级的客户跟进方法、系统及可读存储介质
CN106781467A (zh) 一种基于协同过滤的公交乘客刷卡站点信息提取方法
Zhang et al. Two-phase multivariate time series clustering to classify urban rail transit stations
CN108564293A (zh) 社区矫正人员行为监管方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant