CN111402618A - 一种上车站点的确定方法、装置、存储介质和电子设备 - Google Patents

一种上车站点的确定方法、装置、存储介质和电子设备 Download PDF

Info

Publication number
CN111402618A
CN111402618A CN202010228121.7A CN202010228121A CN111402618A CN 111402618 A CN111402618 A CN 111402618A CN 202010228121 A CN202010228121 A CN 202010228121A CN 111402618 A CN111402618 A CN 111402618A
Authority
CN
China
Prior art keywords
bus
data
card swiping
arrival
stop
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010228121.7A
Other languages
English (en)
Inventor
沈诗语
刘志远
赵鹿芸
吕呈
龚诚
史云阳
陈梦珂
李喆康
吴国斌
俞俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN202010228121.7A priority Critical patent/CN111402618A/zh
Publication of CN111402618A publication Critical patent/CN111402618A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/123Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams

Landscapes

  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

本公开实施例提供一种上车站点的确定方法、装置、存储介质和电子设备,该确定方法包括以下步骤:获取公交线路站点数据,公交车载GPS到站数据以及公交IC刷卡数据;基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表;基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准;基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点。本公开能够提高不完备信息下算法的鲁棒性,解决了两类数据时间轴不统一,导致乘车上车站点匹配错误以及匹配准确率低的缺点,提高乘客上车站点匹配的准确率。此外,弥补了传统的乘客出行问卷调查方法的抽样率低、成本高昂的缺陷。

Description

一种上车站点的确定方法、装置、存储介质和电子设备
技术领域
本公开涉及车辆调度的技术领域,特别涉及一种上车站点的确定方法、装置、存储介质和电子设备。
背景技术
城市公共交通系统的运营情况,取决于其能否良好地适应城市公交出行客流量的时空分布。对于城市公共交通系统来说,公交出行的需求分析在线路与站点规划、车辆排班和定制公交服务等诸多场景中具有重要意义。在公交出行的需求分析中,首先需要对每个公交线路中乘客的上车站点进行精准识别。目前,采用的主流识别方法是基于乘客上车的IC刷卡数据与公交车载GPS数据的时空匹配法。但是,公交车载GPS数据中往往缺乏具体的公交站点信息,无法直接和IC刷卡数据进行空间层面的匹配,同时公交车载GPS数据和公交站点数据这两类数据的系统时间偏差给数据在时间层面的匹配带来较大的误差。
具体而言,公交车载GPS数据是一类时空数据源,尽管在其基础字段中包含在特定时刻公交车辆所处的经纬度坐标点,但往往不含有具体的公交站点信息,目前,这种识别算法没有考虑到在这种不完备信息情况下公交GPS数据与公交IC刷卡数据不能匹配的问题,导致算法鲁棒性较差。
公交车辆的IC刷卡系统与公交GPS车载终端系统是相互独立运行的,公交GPS车载终端的定位时间通过卫星导航电文读取卫星时间获取,公交IC刷卡系统的定位时间则通过其内置时钟模块获取,这两种方式获取的时间存在一定的系统时间偏差,由于基于时间匹配的识别方法会判定公交乘客的刷卡时间发生在公交车辆运行于乘客的上车站点与下一个站点之间,所以时间偏差会导致出现以下两类情况:
(1)如图1所示,公交IC刷卡数据系统时间早于公交车载GPS数据系统时间,产生部分公交IC刷卡数据刷卡时间早于公交车载GPS数据当前站点到站时间的现象,上车站点被误识别为当前上车站点的上一站点,造成当前站点上车乘客数量减少,上一站点上车乘客数量增多;
(2)如图2所示,公交IC刷卡数据系统时间晚于公交车载GPS数据系统时间,产生部分公交IC刷卡数据刷卡时间晚于公交车载GPS数据下一站点到站时间的现象,上车站点被误识别为当前上车站点的下一站点,造成当前站点上车乘客数量减少,下一站点上车乘客数量增多。
综上所述,这种识别方法在实际场景运用中具有较大的局限性。
发明内容
有鉴于此,本公开实施例提出了一种上车站点的确定方法、装置、存储介质和电子设备、装置、存储介质和电子设备,用以解决现有技术中现在的上述乘客上车的IC刷卡数据与公交车载GPS数据以及公交站点数据相互之间缺乏有效匹配的问题。
一方面,本公开实施例提出一种上车站点的确定方法,其包括以下步骤:获取公交线路站点数据,公交车载GPS到站数据以及公交IC刷卡数据;基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表;基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准;基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点。
在一些实施例中,所述基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表,包括:获取所有公交站点的聚类簇团数据集;基于所述公交车载GPS到站数据,通过所述聚类簇团数据集,确定对应的公交站点;通过所有所述对应的公交站点,生成所述公交车辆到站时刻表。
在一些实施例中,所述获取所有公交站点的聚类簇团数据集,包括:通过核心对象搜寻算法获取基于公交站点编号的核心对象集合;针对所述核心对象集合中的首要核心对象执行聚类簇生成算法,获取基于每个所述公交站点的聚类簇团;获取包含所有所述公交站点的聚类簇团数据集。
在一些实施例中,所述基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准,包括:在所述公交IC刷卡数据中基于每条公交线路筛选出每日首条刷卡数据,在所述公交车辆到站时刻表数据中基于每条所述公交线路筛选出每日首条到站数据;基于所述每日首条刷卡数据和所述每日首条到站数据,通过系统时间校正算法,确定经过时间误差校准的公交IC刷卡数据。
在一些实施例中,所述基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点,包括:在满足预定条件的情况下,将所述公交IC刷卡数据中的上车站点的公交站点编号确定为所述公交车辆到站时刻表中的公交站点编号;所述预定条件包括所述公交IC刷卡数据中的公交线路编号和公交车辆编号与所述公交车辆到站时刻表中的公交线路编号和公交车辆编号对应相同;所述公交IC刷卡数据中的刷卡时间大于所述公交车辆到站时刻表数据中的定位时间;所述公交IC刷卡数据中的刷卡时间小于所述公交车辆到站时刻表中的下一个定位时间。
一方面,本公开实施例提出一种上车站点的确定装置,其包括:获取模块,其用于获取公交线路站点数据,公交车载GPS到站数据以及公交IC刷卡数据;第一确定模块,其用于基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表;校准模块,其用于基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准;第二确定模块,其用于基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点。
在一些实施例中,所述第一确定模块包括:获取单元,其用于获取所有公交站点的聚类簇团数据集;第一确定单元,其用于基于所述公交车载GPS到站数据,通过所述聚类簇团数据集,确定对应的公交站点;生成单元,其用于通过所有所述对应的公交站点,生成所述公交车辆到站时刻表。
在一些实施例中,所述获取单元包括:第一获取子单元,其用于通过核心对象搜寻算法获取基于公交站点编号的核心对象集合;第二获取子单元,其用于针对所述核心对象集合中的首要核心对象执行聚类簇生成算法,获取基于每个所述公交站点的聚类簇团;第三获取子单元,其用于获取包含所有所述公交站点的聚类簇团数据集。
在一些实施例中,所述校准模块包括:筛选单元,其用于在所述公交IC刷卡数据中基于每条公交线路筛选出每日首条刷卡数据,在所述公交车辆到站时刻表数据中基于每条所述公交线路筛选出每日首条到站数据;第二确定单元,其用于基于所述每日首条刷卡数据和所述每日首条到站数据,通过系统时间校正算法,确定经过时间误差校准的公交IC刷卡数据。
在一些实施例中,所述第二确定模块还用于:在满足预定条件的情况下,将所述公交IC刷卡数据中的上车站点的公交站点编号确定为所述公交车辆到站时刻表中的公交站点编号;所述预定条件包括所述公交IC刷卡数据中的公交线路编号和公交车辆编号与所述公交车辆到站时刻表中的公交线路编号和公交车辆编号对应相同;所述公交IC刷卡数据中的刷卡时间大于所述公交车辆到站时刻表数据中的定位时间;所述公交IC刷卡数据中的刷卡时间小于所述公交车辆到站时刻表中的下一个定位时间。
再一方面,本公开实施例提出一种存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述任一项技术方案中所述方法的步骤。
再一方面,本公开实施例提出一种电子设备,至少包括存储器、处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器在执行所述存储器上的计算机程序时实现上述任一项技术方案中所述方法的步骤。
本公开基于城市居民的公交出行特征,选取公交车载GPS到站数据、公交线路站点数据和公交IC刷卡数据中所需的关键信息或关键字段,对公交系统基础数据源进行预处理;基于已处理的数据,采用密度聚类算法对公交车载GPS到站数据和公交线路站点数据进行基础地理定位坐标系的修正,并通过空间维度的数据融合,形成公交车辆到站时刻表;进而采用系统时间修正算法校准公交IC刷卡数据和公交车辆到站时刻表,进行公交上车站点的识别和确定,提高了不完备信息下算法的鲁棒性,解决了两类数据时间轴不统一,导致乘车上车站点匹配错误以及匹配准确率低的缺点,提高乘客上车站点匹配的准确率。此外,弥补了传统的乘客出行问卷调查方法的抽样率低、成本高昂的缺陷。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开中公交IC刷卡数据系统时间早于公交车载GPS数据系统时间的示意图;
图2为本公开中公交IC刷卡数据系统时间晚于公交车载GPS数据系统时间的示意图;
图3为本公开实施例涉及的上车站点的确定方法的示意图;
图4为本公开第一实施例提供的确定方法的流程图;
图5为本公开第一实施例提供的确定方法的流程图;
图6为本公开第一实施例提供的确定方法的流程图;
图7为本公开第一实施例提供的上车刷卡时间的示意图;
图8为本公开第一实施例提供的确定方法的流程图;
图9为本公开第二实施例提供的确定装置的结构框图;
图10为本公开第四实施例提供的电子设备的结构框图。
附图标记:
10-获取模块;20-第一确定模块;30-校准模块;40-第二确定模块。
具体实施方式
为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
为了保持本公开实施例的以下说明清楚且简明,本公开省略了已知功能和已知部件的详细说明。
本公开的第一方面提供一种公交上车站点的确定方法,图3示出了该确定方法的主要思路,如图4所示,其包括以下步骤:
S101,获取公交线路站点数据,公交车载GPS到站数据以及公交IC刷卡数据。
考虑到公交线路站点数据和公交车载GPS到站数据之间存在的偏差,为了能够尽量使得这两类数据在地理空间层面实现匹配,在本步骤中,首先获取公交线路站点数据,公交车载GPS到站数据以及公交刷卡数据。其中,公交线路站点数据包括每个公交站点的位置信息以及其所属的公交线路的信息,公交车载GPS到站数据包括公交车辆到达公交线路上的公交站点的时间、位置等信息,公交刷卡数据包括乘客在公交站点上车的刷卡数据。
从地理空间层面来说,一般而言,公交线路站点数据和公交车载GPS到站数据之间对于公交站点的空间位置差异或者偏移首先考虑到这两类数据在经纬度坐标之间存在的定常偏移,进一步还要考虑到在同一坐标系下,在该定常偏移的基础上增加的不定常的扰动项,具体地,公交车载GPS到站数据与公交线路站点数据之间的经纬度坐标偏移可表示为:
Figure BDA0002428342970000061
Figure BDA0002428342970000062
其中,
Figure BDA0002428342970000063
表示公交线路站点数据中第i条公交线路中第j个公交站点的经纬度坐标,
Figure BDA0002428342970000064
表示公交车载GPS到站数据中第i条公交线路第j个公交站点的第k个样本的经纬度坐标,Clng、Clat表示两类数据源的基础地理定位坐标系之间的经度误差和纬度误差,
Figure BDA0002428342970000065
Figure BDA0002428342970000066
表示公交车载GPS数据中第i条公交线路第j个公交站点的第k个样本的经度定位偏差和纬度定位偏差。
公交线路站点数据和公交车载GPS到站数据的两类数据对于相同公交站点的经纬度坐标之间的最大误差分别为
Figure BDA0002428342970000067
Figure BDA0002428342970000068
通常情况下,不同基础地理定位坐标系之间的定常偏差约为50至100米,公交车载GPS到站数据的定位偏差约为50米,因此,总的来说,公交线路站点数据和公交车载GPS到站数据之间针对相同公交站点的位置偏差大概100米左右,这相较于同一条公交线路相邻站点的平均站间距离500米而言较小。
进一步地,在所述获取公交线路站点数据,公交车载GPS到站数据以及公交刷卡数据之后,针对上述数据按照预定规则进行数据整理。其中,针对公交线路站点数据和公交车载GPS到站数据而言,将获取的公交线路站点数据的第一数据集合和公交车载GPS到站数据的第二数据集合进行混合,获取第三数据集合;在所述第三数据集合中按照密度聚类算法的输入要求提取特征或者字段并按照所述特征或者字段将第三数据集合中的数据进行整理和归类,这里需要提取的特征或者字段至少包括:(1)空间特征,例如公交站点的经纬度坐标;(2)线路特征,例如公交线路编号、公交站点编号、公交车辆编号等,其中,这里的公交车辆编号对于公交线路站点数据而言可以设置为空值(NULL)。
S102,基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表。
在通过上述步骤S101获取公交线路站点数据、公交车载GPS到站数据以及公交IC刷卡数据之后,需要针对所述公交线路站点数据和所述公交车载GPS到站数据通过密度聚类算法处理,以获取经过空间层面匹配的公交车辆到站时刻表。这里的匹配是将所述公交线路站点数据与所述公交车载GPS到站数据基于每个公交站点进行空间方面的匹配,从而实现基于每个公交站点的数据绑定,以消除由于地理空间等因素导致的偏差。
在本步骤中,如果公交车载GPS到站数据能够通过密度聚类算法,基于数据间可连接性的原则回溯至公交线路站点数据中每个公交站点的准确位置,则可认为完成一次基于该公交站点的数据绑定,并将公交线路站点数据中的公交站点编号增加至公交车载GPS到站数据的对应的公交站点中,实现基础地理定位坐标系的修正,并通过空间维度的数据融合,最终形成公交车辆到站时刻表。如图5所示,具体包括以下步骤:
S201,获取所有公交站点的聚类簇团数据集。
在本步骤中,通过DBSCAN密度聚类算法,获取所有公交站点的聚类簇团数据集。其中,DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法是基于密度的聚类算法,该算法与基于划分层次的聚类方法不同,该算法能够将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。如图6所示,具体通过以下步骤实现
S301,通过核心对象搜寻算法获取基于公交站点编号的核心对象集合。
在执行DBSCAN密度聚类算法的过程中,需要基于预先设定的邻域参数(∈,MinPts),从而执行核心对象搜寻过程,进而获取核心对象集合。在本步骤中,通过每个公交站点编号与核心对象集合中的每个核心对象相对应,从而确定每个所述核心对象的数据格式设置为[公交线路编号,公交车辆编号,定位经度,定位纬度,数据来源:公交车载GPS到站数据集/公交线路站点数据集,公交站点编号]。
S302,针对所述核心对象集合中的首要核心对象执行聚类簇生成算法,获取基于每个所述公交站点的聚类簇团。
在本步骤中,主要用于基于步骤S301获取的核心对象集合以及核心对象集合中每个核心对象对应的公交站点编号,从而执行聚类簇的生成过程,具体地,可以针对标准DBSCAN算法“任选数据集的一个核心对象作为种子”进行修改,在核心对象集合中选取类型特征为“来源自公交线路站点数据集”的一个核心对象作为首次输入的种子,定义首次输入的种子为首要核心对象,基于执行聚类簇生成算法对首次输入的种子进行延伸,最终生成基于每个公交站点的聚类簇团。
S303,获取包含所有所述公交站点的聚类簇团数据集。
由上可知,通过上述步骤S301能够通过核心对象搜寻算法获取基于公交站点编号的核心对象集合,通过上述步骤S302能够针对所述核心对象集合中的首要核心对象执行聚类簇生成算法,获取基于每个所述公交站点的聚类簇团,通过反复执行上述步骤S301和S302,可以获取基于每个所述公交站点的聚类簇团,最终得到包含所有所述公交站点的聚类簇团数据集,从而实现所有公交站点的数据绑定。
S202,基于所述公交车载GPS到站数据,通过所述聚类簇团数据集,确定对应的公交站点。
通过上述步骤S201获取所有公交站点的聚类簇团数据集之后,在本步骤中,对于新获取的公交车载GPS到站数据的数据样本,可以通过上述步骤S201确定的公交站点聚类簇团数据集,获取对应的公交站点。
具体地,首先,将公交车载GPS到站数据按照预定格式整理,例如可以按照[定位时间,公交线路编号,公交车辆编号,定位经度,定位纬度]的格式整理,然后,将整理好格式的公交车载GPS到站数据输入到上述步骤S201确定的公交站点聚类簇团数据集中,通过执行预设判断规则获取对应的公交站点以及公交站点编号:
(1)如果在基于公交站点编号的核心对象集合中存在首要核心对象,使得该数据样本与所述首要核心对象之间密度直达,则该数据样本为此首要核心对象所对应的公交站点聚类簇团的核心对象,并认为该数据样本所对应的公交站点为与其密度直达的首要核心对象对应的公交站点;
(2)若该数据样本与唯一一个首要核心对象密度可达,则认为该数据样本所对应的公交站点为与其密度直达的首要核心对象对应的公交站点;
(3)若该数据样本与多个首要核心对象密度可达,则考虑该样本∈-邻域内的多个核心对象作为备选集,取该备选集中各个核心对象∈-邻域内包含的密度相连样本个数最多的核心对象作为映射点,认为该样本所对应的公交站点为与该映射点密度直达的首要核心对象对应的公交站点。
S203,通过所有所述对应的公交站点,生成所述公交车辆到站时刻表。
通过上述步骤S202能够基于每个公交车载GPS到站数据,通过所述公交站点聚类簇团数据集,确定对应的公交站点,在本步骤中,在新获取的公交车载GPS到站数据样本中增加与其对应的首要核心对象对应的公交站点编号,生成数据格式:[定位时间,公交线路编号,公交站点编号,公交车辆编号,定位经度,定位纬度],从而生成所述公交车辆到站时刻表。
此外,对于在生成公交车辆到站时刻表的过程中出现缺失数据的情况下,按照下述方式补足。
在生成公交车辆到站时刻表的过程中,对于公交车载GPS数据的部分缺失现象导致的部分站点公交车辆到站时刻缺失现象,需要通过连接字段中原属于公交线路站点数据中的距前站距离字段进行补足:若为中间若干站点缺失,基于站间距离对前后站点到站时间差进行加权,获取中间若干站点到站时间;若为首(末)若干站点缺失,则基于最接近首(末)站点的两个站点,采用递归加权的方式不断进行延伸扩展,获取首(末)若干站点到站时间。
S103,基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准。
在步骤S103之前,需要对公交IC刷卡数据和公交车辆到站时刻表的数据格式进行输入整理,具体地,对于公交IC刷卡数据和公交车辆到站时刻表数据,按照如下输入特征格式进行整理:对于公交IC刷卡数据按照[IC卡编号、刷卡时间、公交线路编号和公交车辆编号]进行整理;对于公交车辆到站时刻表按照[定位时间、公交线路编号、公交站点编号、公交车辆编号、定位经度和定位纬度]进行整理。
对于特定城市的智能公交系统而言,图7示出了乘客上车刷卡的示意图,如上所述,公交IC刷卡系统时间与公交车载GPS系统时间之间的偏差通常可能出现在公交IC刷卡数据系统时间早于公交车载GPS数据系统时间,导致产生部分公交IC刷卡数据刷卡时间早于公交车载GPS数据当前站点到站时间的现象以及公交IC刷卡数据系统时间晚于公交车载GPS数据系统时间,导致产生部分公交IC刷卡数据刷卡时间晚于公交车载GPS数据下一站点到站时间的现象的这两类情况中的一类。为了对公交IC刷卡系统时间与公交车载GPS系统时间之间的偏差进行校准,如图8所示,本步骤通过以下方式实现:
S401,在所述公交IC刷卡数据中基于每条公交线路筛选出每日首条刷卡数据,在所述公交车辆到站时刻表数据中基于每条所述公交线路筛选出每日首条到站数据。
在本步骤中,假设公交IC刷卡系统时间与公交车载GPS系统时间之间的偏差为Δt,对于这两类数据源而言,该时间偏差为固有常量,即对于任意时间、任意线路和任意站点的数据,公交IC刷卡系统时间与公交车载GPS系统时间之间的偏差为恒定值。在所述公交IC刷卡数据中基于每条公交线路筛选出每日首条刷卡数据,在所述公交车辆到站时刻表数据中基于每条所述公交线路筛选出每日首条到站数据,通过每日首条刷卡数据和每日首条到站数据之间的对比,能够便于测算出这两类数据之间的时间偏差。
S402,基于所述每日首条刷卡数据和所述每日首条到站数据,通过系统时间校正算法,获取经过时间误差校准的公交IC刷卡数据。
如上所述,假定对于任意时间、任意线路和任意站点的数据,公交IC刷卡系统时间与公交车载GPS系统时间之间的偏差为恒定值,该系统时间偏差或者系统时间校正值Δt通过以下公式或者算法实现:
Figure BDA0002428342970000101
其中,
Figure BDA0002428342970000102
Figure BDA0002428342970000111
Δt(i,d)<ΔT (1.6)
其中,Δt(i,d)为第i条公交线路在第d日的系统时间偏差,
Figure BDA0002428342970000112
为第i条公交线路在第d日的首条公交IC刷卡数据的刷卡时间,
Figure BDA0002428342970000113
为第i条公交线路在第d日的首条公交车载GPS到站数据的定位时间,T为包含
Figure BDA0002428342970000114
的集合,ΔT为最大系统时差阈值,sign(·)函数为符号函数。
在上面的公式中,公式(1.3)的目的为将数据集中每日所有线路的首条公交IC刷卡数据的刷卡时间与首条公交车载GPS到站数据的定位时间差值的最大值作为系统时差值;公式(1.5)的目的为保证所有计算得到的时间差值取相同符号;公式(1.6)的目的为保证每日所有线路的首条公交IC刷卡数据与首条公交车载GPS到站数据对应于同一个站点。当Δt>0时,表明公交IC刷卡数据系统时间晚于公交车载GPS数据系统时间;当Δt<0时,表明公交IC刷卡数据系统时间早于公交车载GPS数据系统时间。
实际情况中,并非公交到站的瞬间首尾上车乘客就立刻执行刷卡行为,存在一定的刷卡滞后现象。对于上述现象,只需要在式(1.6)中增加刷卡滞后系数δ(i,d),系统时间校正算法修正为:
Figure BDA0002428342970000115
其中,δ(i,d)是一个满足特定概率分布的系数,可根据实际调查进行标定。
通过执行上述系统时间校正算法,基于公式(1.3)获取系统时间偏差Δt,对公交IC刷卡数据的刷卡时间进行修正:
Figure BDA0002428342970000116
其中,
Figure BDA0002428342970000117
为经过时间误差校准后的第i条公交线路在第d日的公交IC刷卡数据的刷卡时间。
S104,基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点。
在本步骤中,当针对校正后的公交IC刷卡数据和公交车辆到站时刻表数据,在满足预定条件的情况下,将所述公交IC刷卡数据中的上车站点的公交站点确定为所述公交车辆到站时刻表中的公交站点。
其中,该预定条件可以是公交IC刷卡数据中的公交线路编号与公交车辆到站时刻表中的公交线路编号相同;公交IC刷卡数据中的公交车辆编号与公交车辆到站时刻表中的公交车辆编号相同;公交IC刷卡数据中的刷卡时间大于公交车辆到站时刻表数据中的定位时间;公交IC刷卡数据中的刷卡时间小于公交车辆到站时刻表数据中的下一定位时间,其中,预定条件需要公交IC刷卡数据与公交车辆到站时刻表数据在匹配过程中,同时满足上述四个条件的。
本公开基于城市居民的公交出行特征,选取公交车载GPS到站数据、公交线路站点数据和公交IC刷卡数据中所需的关键信息或关键字段,对公交系统基础数据源进行预处理;基于已处理的数据,采用密度聚类算法对公交车载GPS到站数据和公交线路站点数据进行基础地理定位坐标系的修正,并通过空间维度的数据融合,形成公交车辆到站时刻表;进而采用系统时间修正算法校准公交IC刷卡数据和公交车辆到站时刻表,进行公交上车站点的识别和确定,提高乘客上车站点匹配的准确率。
本公开的第二方面提供一种公交上车站点的确定装置,如图9所示,其包括获取模块10、第一确定模块20、校准模块30以及第二确定模块40,上述模块相互耦合,其中:
获取模块10,其用于获取公交线路站点数据,公交车载GPS到站数据以及公交IC刷卡数据。
考虑到公交线路站点数据和公交车载GPS到站数据之间存在的偏差,为了能够尽量使得这两类数据在地理空间层面实现匹配,通过获取模块10,首先获取公交线路站点数据,公交车载GPS到站数据以及公交刷卡数据。其中,公交线路站点数据包括每个公交站点的位置信息以及其所属的公交线路的信息,公交车载GPS到站数据包括公交车辆到达公交线路上的公交站点的时间、位置等信息,公交刷卡数据包括乘客在公交站点上车的刷卡数据。
从地理空间层面来说,一般而言,公交线路站点数据和公交车载GPS到站数据之间对于公交站点的空间位置差异或者偏移首先考虑到这两类数据在经纬度坐标之间存在的定常偏移,进一步还要考虑到在同一坐标系下,在该定常偏移的基础上增加的不定常的扰动项,具体地,公交车载GPS到站数据与公交线路站点数据之间的经纬度坐标偏移可表示为:
Figure BDA0002428342970000131
Figure BDA0002428342970000132
其中,
Figure BDA0002428342970000133
表示公交线路站点数据中第i条公交线路中第j个公交站点的经纬度坐标,
Figure BDA0002428342970000134
表示公交车载GPS到站数据中第i条公交线路第j个公交站点的第k个样本的经纬度坐标,Clng、Clat表示两类数据源的基础地理定位坐标系之间的经度误差和纬度误差,
Figure BDA0002428342970000135
表示公交车载GPS数据中第i条公交线路第j个公交站点的第k个样本的经度定位偏差和纬度定位偏差。
公交线路站点数据和公交车载GPS到站数据的两类数据对于相同公交站点的经纬度坐标之间的最大误差分别为
Figure BDA0002428342970000137
Figure BDA0002428342970000138
通常情况下,不同基础地理定位坐标系之间的定常偏差约为50至100米,公交车载GPS到站数据的定位偏差约为50米,因此,总的来说,公交线路站点数据和公交车载GPS到站数据之间针对相同公交站点的位置偏差大概100米左右,这相较于同一条公交线路相邻站点的平均站间距离500米而言较小。
进一步地,在所述获取公交线路站点数据,公交车载GPS到站数据以及公交刷卡数据之后,针对上述数据按照预定规则进行数据整理。其中,针对公交线路站点数据和公交车载GPS到站数据而言,将获取的公交线路站点数据的第一数据集合和公交车载GPS到站数据的第二数据集合进行混合,获取第三数据集合;在所述第三数据集合中按照密度聚类算法的输入要求提取特征或者字段并按照所述特征或者字段将第三数据集合中的数据进行整理和归类,这里需要提取的特征或者字段至少包括:(1)空间特征,例如公交站点的经纬度坐标;(2)线路特征,例如公交线路编号、公交站点编号、公交车辆编号等,其中,这里的公交车辆编号对于公交线路站点数据而言可以设置为空值(NULL)。
第一确定模块20,其用于基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表。
在通过上述获取模块10获取公交线路站点数据、公交车载GPS到站数据以及公交IC刷卡数据之后,需要针对所述公交线路站点数据和所述公交车载GPS到站数据通过密度聚类算法处理,以获取经过空间层面匹配的公交车辆到站时刻表。这里的匹配是将所述公交线路站点数据与所述公交车载GPS到站数据基于每个公交站点进行空间方面的匹配,从而实现基于每个公交站点的数据绑定,以消除由于地理空间等因素导致的偏差。
通过第一确定模块20,如果公交车载GPS到站数据能够通过密度聚类算法,基于数据间可连接性的原则回溯至公交线路站点数据中每个公交站点的准确位置,则可认为完成一次基于该公交站点的数据绑定,并将公交线路站点数据中的公交站点编号增加至公交车载GPS到站数据的对应的公交站点中,实现基础地理定位坐标系的修正,并通过空间维度的数据融合,最终形成公交车辆到站时刻表。包括获取单元、第一确定单元以及生成单元,具体地:
获取单元,其用于获取所有公交站点的聚类簇团数据集。
通过获取单元,通过DBSCAN密度聚类算法,获取所有公交站点的聚类簇团数据集。其中,DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法是基于密度的聚类算法,该算法与基于划分层次的聚类方法不同,该算法能够将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。获取单元具体包括以下部分;
第一获取子单元,其用于通过核心对象搜寻算法获取基于公交站点编号的核心对象集合。
在执行DBSCAN密度聚类算法的过程中,需要基于预先设定的邻域参数(∈,MinPts),从而执行核心对象搜寻过程,进而获取核心对象集合。通过第一获取子单元,通过每个公交站点编号与核心对象集合中的每个核心对象相对应,从而确定每个所述核心对象的数据格式设置为[公交线路编号,公交车辆编号,定位经度,定位纬度,数据来源:公交车载GPS到站数据集/公交线路站点数据集,公交站点编号]。
第二获取子单元,其用于针对所述核心对象集合中的首要核心对象执行聚类簇生成算法,获取基于每个所述公交站点的聚类簇团。
通过第二获取子单元,主要用于通过第一获取子单元获取的核心对象集合以及核心对象集合中每个核心对象对应的公交站点编号,从而执行聚类簇的生成过程,具体地,可以针对标准DBSCAN算法“任选数据集的一个核心对象作为种子”进行修改,在核心对象集合中选取类型特征为“来源自公交线路站点数据集”的一个核心对象作为首次输入的种子,定义首次输入的种子为首要核心对象,基于执行聚类簇生成算法对首次输入的种子进行延伸,最终生成基于每个公交站点的聚类簇团。
第三获取子单元,其用于获取包含所有所述公交站点的聚类簇团数据集。
由上可知,通过上述第一获取子单元能够通过核心对象搜寻算法获取基于公交站点编号的核心对象集合,通过上述第二获取子单元能够针对所述核心对象集合中的首要核心对象执行聚类簇生成算法,获取基于每个所述公交站点的聚类簇团,通过上述第一获取子单元和第二获取子单元,可以获取基于每个所述公交站点的聚类簇团,最终得到包含所有所述公交站点的聚类簇团数据集,从而实现所有公交站点的数据绑定。
第一确定单元,其用于基于所述公交车载GPS到站数据,通过所述聚类簇团数据集,确定对应的公交站点。
通过上述获取单元获取所有公交站点的聚类簇团数据集之后,通过第一确定单元,对于新获取的公交车载GPS到站数据的数据样本,可以通过上述获取单元确定的公交站点聚类簇团数据集,获取对应的公交站点。
具体地,首先,将公交车载GPS到站数据按照预定格式整理,例如可以按照[定位时间,公交线路编号,公交车辆编号,定位经度,定位纬度]的格式整理,然后,将整理好格式的公交车载GPS到站数据输入到获取单元确定的公交站点聚类簇团数据集中,通过执行预设判断规则获取对应的公交站点以及公交站点编号:
(1)如果在基于公交站点编号的核心对象集合中存在首要核心对象,使得该数据样本与所述首要核心对象之间密度直达,则该数据样本为此首要核心对象所对应的公交站点聚类簇团的核心对象,并认为该数据样本所对应的公交站点为与其密度直达的首要核心对象对应的公交站点;
(2)若该数据样本与唯一一个首要核心对象密度可达,则认为该数据样本所对应的公交站点为与其密度直达的首要核心对象对应的公交站点;
(3)若该数据样本与多个首要核心对象密度可达,则考虑该样本∈-邻域内的多个核心对象作为备选集,取该备选集中各个核心对象∈-邻域内包含的密度相连样本个数最多的核心对象作为映射点,认为该样本所对应的公交站点为与该映射点密度直达的首要核心对象对应的公交站点。
生成单元,其用于通过所有所述对应的公交站点,生成所述公交车辆到站时刻表。
通过上述第一确定单元能够基于每个公交车载GPS到站数据,通过所述公交站点聚类簇团数据集,确定对应的公交站点,通过生成单元在新获取的公交车载GPS到站数据样本中增加与其对应的首要核心对象对应的公交站点编号,生成数据格式:[定位时间,公交线路编号,公交站点编号,公交车辆编号,定位经度,定位纬度],从而生成所述公交车辆到站时刻表。
此外,对于在生成公交车辆到站时刻表的过程中出现缺失数据的情况下,按照下述方式补足。
在生成公交车辆到站时刻表的过程中,对于公交车载GPS数据的部分缺失现象导致的部分站点公交车辆到站时刻缺失现象,需要通过连接字段中原属于公交线路站点数据中的距前站距离字段进行补足:若为中间若干站点缺失,基于站间距离对前后站点到站时间差进行加权,获取中间若干站点到站时间;若为首(末)若干站点缺失,则基于最接近首(末)站点的两个站点,采用递归加权的方式不断进行延伸扩展,获取首(末)若干站点到站时间。
校准模块30,其用于基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准。
在校准模块30执行之前,需要对公交IC刷卡数据和公交车辆到站时刻表的数据格式进行输入整理,具体地,对于公交IC刷卡数据和公交车辆到站时刻表数据,按照如下输入特征格式进行整理:对于公交IC刷卡数据按照[IC卡编号、刷卡时间、公交线路编号和公交车辆编号]进行整理;对于公交车辆到站时刻表按照[定位时间、公交线路编号、公交站点编号、公交车辆编号、定位经度和定位纬度]进行整理。
对于特定城市的智能公交系统而言,图7示出了乘客上车刷卡的示意图,如上所述,公交IC刷卡系统时间与公交车载GPS系统时间之间的偏差通常可能出现在公交IC刷卡数据系统时间早于公交车载GPS数据系统时间,导致产生部分公交IC刷卡数据刷卡时间早于公交车载GPS数据当前站点到站时间的现象以及公交IC刷卡数据系统时间晚于公交车载GPS数据系统时间,导致产生部分公交IC刷卡数据刷卡时间晚于公交车载GPS数据下一站点到站时间的现象的这两类情况中的一类。为了对公交IC刷卡系统时间与公交车载GPS系统时间之间的偏差进行校准,具体包括以下部分:
筛选单元,其用于在所述公交IC刷卡数据中基于每条公交线路筛选出每日首条刷卡数据,在所述公交车辆到站时刻表数据中基于每条所述公交线路筛选出每日首条到站数据。
通过筛选单元,假设公交IC刷卡系统时间与公交车载GPS系统时间之间的偏差为Δt,对于这两类数据源而言,该时间偏差为固有常量,即对于任意时间、任意线路和任意站点的数据,公交IC刷卡系统时间与公交车载GPS系统时间之间的偏差为恒定值。在所述公交IC刷卡数据中基于每条公交线路筛选出每日首条刷卡数据,在所述公交车辆到站时刻表数据中基于每条所述公交线路筛选出每日首条到站数据,通过每日首条刷卡数据和每日首条到站数据之间的对比,能够便于测算出这两类数据之间的时间偏差。
第二确定单元,其用于基于所述每日首条刷卡数据和所述每日首条到站数据,通过系统时间校正算法,获得经过时间误差校准的公交IC刷卡数据。
如上所述,假定对于任意时间、任意线路和任意站点的数据,公交IC刷卡系统时间与公交车载GPS系统时间之间的偏差为恒定值,该系统时间偏差或者系统时间校正值Δt通过以下公式或者算法实现:
Figure BDA0002428342970000171
其中,
Figure BDA0002428342970000172
Figure BDA0002428342970000173
Δt(i,d)<ΔT (1.6)
其中,Δt(i,d)为第i条公交线路在第d日的系统时间偏差,
Figure BDA0002428342970000174
为第i条公交线路在第d日的首条公交IC刷卡数据的刷卡时间,
Figure BDA0002428342970000175
为第i条公交线路在第d日的首条公交车载GPS到站数据的定位时间,T为包含
Figure BDA0002428342970000176
的集合,ΔT为最大系统时差阈值,sign(·)函数为符号函数。
在上面的公式中,公式(1.3)的目的为将数据集中每日所有线路的首条公交IC刷卡数据的刷卡时间与首条公交车载GPS到站数据的定位时间差值的最大值作为系统时差值;公式(1.5)的目的为保证所有计算得到的时间差值取相同符号;公式(1.6)的目的为保证每日所有线路的首条公交IC刷卡数据与首条公交车载GPS到站数据对应于同一个站点。当Δt>0时,表明公交IC刷卡数据系统时间晚于公交车载GPS数据系统时间;当Δt<0时,表明公交IC刷卡数据系统时间早于公交车载GPS数据系统时间。
实际情况中,并非公交到站的瞬间首尾上车乘客就立刻执行刷卡行为,存在一定的刷卡滞后现象。对于上述现象,只需要在式(1.6)中增加刷卡滞后系数δ(i,d),系统时间校正算法修正为:
Figure BDA0002428342970000181
其中,δ(i,d)是一个满足特定概率分布的系数,可根据实际调查进行标定。
通过执行上述系统时间校正算法,基于公式(1.3)获取系统时间偏差Δt,对公交IC刷卡数据的刷卡时间进行修正:
Figure BDA0002428342970000182
其中,
Figure BDA0002428342970000183
为经过时间误差校准后的第i条公交线路在第d日的公交IC刷卡数据的刷卡时间。
第二确定模块40,其用于基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点。
通过第二确定模块40,当针对校正后的公交IC刷卡数据和公交车辆到站时刻表数据,在满足预定条件的情况下,将所述公交IC刷卡数据中的上车站点的公交站点确定为所述公交车辆到站时刻表中的公交站点。
其中,该预定条件可以是公交IC刷卡数据中的公交线路编号与公交车辆到站时刻表中的公交线路编号相同;公交IC刷卡数据中的公交车辆编号与公交车辆到站时刻表中的公交车辆编号相同;公交IC刷卡数据中的刷卡时间大于公交车辆到站时刻表数据中的定位时间;公交IC刷卡数据中的刷卡时间小于公交车辆到站时刻表数据中的下一定位时间,其中,预定条件需要公交IC刷卡数据与公交车辆到站时刻表数据在匹配过程中,同时满足上述四个条件的。
本公开基于城市居民的公交出行特征,选取公交车载GPS到站数据、公交线路站点数据和公交IC刷卡数据中所需的关键信息或关键字段,对公交系统基础数据源进行预处理;基于已处理的数据,采用密度聚类算法对公交车载GPS到站数据和公交线路站点数据进行基础地理定位坐标系的修正,并通过空间维度的数据融合,形成公交车辆到站时刻表;进而采用系统时间修正算法校准公交IC刷卡数据和公交车辆到站时刻表,进行公交上车站点的识别和确定,提高乘客上车站点匹配的准确率。
本公开第三方面提供了一种存储介质,该存储介质为计算机可读介质,存储有计算机程序,该计算机程序被处理器执行时实现本公开任意实施例提供的方法,包括如下步骤S11至S14:
S11,获取公交线路站点数据,公交车载GPS到站数据以及公交IC刷卡数据;
S12,基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表;
S13,基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准;
S14,基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点。
计算机程序被处理器执行基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表时,具体被处理器执行如下步骤:获取所有公交站点的聚类簇团数据集;基于所述公交车载GPS到站数据,通过所述聚类簇团数据集,确定对应的公交站点;通过所有所述对应的公交站点,生成所述公交车辆到站时刻表。
计算机程序被处理器执行获取所有公交站点的聚类簇团数据集时,具体被处理器执行如下步骤:通过核心对象搜寻算法获取基于公交站点编号的核心对象集合;针对所述核心对象集合中的首要核心对象执行聚类簇生成算法,获取基于每个所述公交站点的聚类簇;获取包含所有所述公交站点的聚类簇团数据集。
计算机程序被处理器执行基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准时,具体被处理器执行如下步骤:在所述公交IC刷卡数据中基于每条公交线路筛选出每日首条刷卡数据,在所述公交车辆到站时刻表数据中基于每条所述公交线路筛选出每日首条到站数据;基于所述每日首条刷卡数据和所述每日首条到站数据,通过系统时间校正算法,确定经过时间误差校准的公交IC刷卡数据。
计算机程序被处理器执行基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点时,具体被处理器执行如下步骤:在满足预定条件的情况下,将所述公交IC刷卡数据中的上车站点的公交站点编号确定为所述公交车辆到站时刻表中的公交站点编号;所述预定条件包括所述公交IC刷卡数据中的公交线路编号和公交车辆编号与所述公交车辆到站时刻表中的公交线路编号和公交车辆编号对应相同;所述公交IC刷卡数据中的刷卡时间大于所述公交车辆到站时刻表数据中的定位时间;所述公交IC刷卡数据中的刷卡时间小于所述公交车辆到站时刻表中的下一个定位时间。
本公开基于城市居民的公交出行特征,选取公交车载GPS到站数据、公交线路站点数据和公交IC刷卡数据中所需的关键信息或关键字段,对公交系统基础数据源进行预处理;基于已处理的数据,采用密度聚类算法对公交车载GPS到站数据和公交线路站点数据进行基础地理定位坐标系的修正,并通过空间维度的数据融合,形成公交车辆到站时刻表;进而采用系统时间修正算法校准公交IC刷卡数据和公交车辆到站时刻表,进行公交上车站点的识别和确定,提高乘客上车站点匹配的准确率。
本公开第四方面提供了一种电子设备,该电子设备的结构示意图可以如图10所示,至少包括存储器901和处理器902,存储器901上存储有计算机程序,处理器902在执行存储器901上的计算机程序时实现本公开任意实施例提供的方法。示例性的,电子设备计算机程序步骤如下S21至S24:
S21,获取公交线路站点数据,公交车载GPS到站数据以及公交IC刷卡数据;
S22,基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表;
S23,基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准;
S24,基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点。
处理器在执行存储器上存储的基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表时,还执行如下计算机程序:获取所有公交站点的聚类簇团数据集;基于所述公交车载GPS到站数据,通过所述聚类簇团数据集,确定对应的公交站点;通过所有所述对应的公交站点,生成所述公交车辆到站时刻表。
处理器在执行存储器上存储的获取所有公交站点的聚类簇团数据集时,具体执行如下计算机程序:通过核心对象搜寻算法获取基于公交站点编号的核心对象集合;针对所述核心对象集合中的首要核心对象执行聚类簇生成算法,获取基于每个所述公交站点的聚类簇;获取包含所有所述公交站点的聚类簇团数据集。
处理器在执行存储器上存储的基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准时,具体执行如下计算机程序:在所述公交IC刷卡数据中基于每条公交线路筛选出每日首条刷卡数据,在所述公交车辆到站时刻表数据中基于每条所述公交线路筛选出每日首条到站数据;基于所述每日首条刷卡数据和所述每日首条到站数据,通过系统时间校正算法,确定经过时间误差校准的公交IC刷卡数据。
处理器在执行存储器上存储的基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点时,具体执行如下计算机程序:在满足预定条件的情况下,将所述公交IC刷卡数据中的上车站点的公交站点编号确定为所述公交车辆到站时刻表中的公交站点编号;所述预定条件包括所述公交IC刷卡数据中的公交线路编号和公交车辆编号与所述公交车辆到站时刻表中的公交线路编号和公交车辆编号对应相同;所述公交IC刷卡数据中的刷卡时间大于所述公交车辆到站时刻表数据中的定位时间;所述公交IC刷卡数据中的刷卡时间小于所述公交车辆到站时刻表中的下一个定位时间。
本公开基于城市居民的公交出行特征,选取公交车载GPS到站数据、公交线路站点数据和公交IC刷卡数据中所需的关键信息或关键字段,对公交系统基础数据源进行预处理;基于已处理的数据,采用密度聚类算法对公交车载GPS到站数据和公交线路站点数据进行基础地理定位坐标系的修正,并通过空间维度的数据融合,形成公交车辆到站时刻表;进而采用系统时间修正算法校准公交IC刷卡数据和公交车辆到站时刻表,进行公交上车站点的识别和确定,提高乘客上车站点匹配的准确率。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(LAN)、广域网(WAN)、网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述存储介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述存储介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括至少两个网际协议地址的节点评价请求,其中,节点评价设备从至少两个网际协议地址中,选取网际协议地址并返回;接收节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
或者,上述存储介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在乘客计算机上执行、部分地在乘客计算机上执行、作为一个独立的软件包执行、部分在乘客计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到乘客计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
需要说明的是,本公开上述的存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何存储介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
以上对本公开多个实施例进行了详细说明,但本公开不限于这些具体的实施例,本领域技术人员在本公开构思的基础上,能够做出多种变型和修改实施例,这些变型和修改都应落入本公开所要求保护的范围之内。

Claims (12)

1.一种上车站点的确定方法,其特征在于,包括以下步骤:
获取公交线路站点数据,公交车载GPS到站数据以及公交IC刷卡数据;
基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表;
基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准;
基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点。
2.根据权利要求1所述的确定方法,其特征在于,所述基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表,包括:
获取所有公交站点的聚类簇团数据集;
基于所述公交车载GPS到站数据,通过所述聚类簇团数据集,确定对应的公交站点;
通过所有所述对应的公交站点,生成所述公交车辆到站时刻表。
3.根据权利要求1所述的确定方法,其特征在于,所述获取所有公交站点的聚类簇团数据集,包括:
通过核心对象搜寻算法获取基于公交站点编号的核心对象集合;
针对所述核心对象集合中的首要核心对象执行聚类簇生成算法,获取基于每个所述公交站点的聚类簇团;
获取包含所有所述公交站点的聚类簇团数据集。
4.根据权利要求1所述的确定方法,其特征在于,所述基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准,包括:
在所述公交IC刷卡数据中基于每条公交线路筛选出每日首条刷卡数据,在所述公交车辆到站时刻表数据中基于每条所述公交线路筛选出每日首条到站数据;
基于所述每日首条刷卡数据和所述每日首条到站数据,通过系统时间校正算法,确定经过时间误差校准的公交IC刷卡数据。
5.根据权利要求1所述的确定方法,其特征在于,所述基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点,包括:
在满足预定条件的情况下,将所述公交IC刷卡数据中的上车站点的公交站点编号确定为所述公交车辆到站时刻表中的公交站点编号;
所述预定条件包括所述公交IC刷卡数据中的公交线路编号和公交车辆编号与所述公交车辆到站时刻表中的公交线路编号和公交车辆编号对应相同;所述公交IC刷卡数据中的刷卡时间大于所述公交车辆到站时刻表数据中的定位时间;所述公交IC刷卡数据中的刷卡时间小于所述公交车辆到站时刻表中的下一个定位时间。
6.一种上车站点的确定装置,其特征在于,包括:
获取模块,其用于获取公交线路站点数据,公交车载GPS到站数据以及公交IC刷卡数据;
第一确定模块,其用于基于所述公交线路站点数据和所述公交车载GPS到站数据,通过密度聚类算法确定公交车辆到站时刻表;
校准模块,其用于基于所述公交车辆到站时刻表对所述公交IC刷卡数据进行时间误差校准;
第二确定模块,其用于基于经过时间误差校准的公交IC刷卡数据和所述公交车辆到站时刻表,确定公交上车站点。
7.根据权利要求6所述的确定装置,其特征在于,所述第一确定模块包括:
获取单元,其用于获取所有公交站点的聚类簇团数据集;
第一确定单元,其用于基于所述公交车载GPS到站数据,通过所述聚类簇团数据集,确定对应的公交站点;
生成单元,其用于通过所有所述对应的公交站点,生成所述公交车辆到站时刻表。
8.根据权利要求7所述的确定装置,其特征在于,所述获取单元包括:
第一获取子单元,其用于通过核心对象搜寻算法获取基于公交站点编号的核心对象集合;
第二获取子单元,其用于针对所述核心对象集合中的首要核心对象执行聚类簇生成算法,获取基于每个所述公交站点的聚类簇团;
第三获取子单元,其用于获取包含所有所述公交站点的聚类簇团数据集。
9.根据权利要求6所述的确定装置,其特征在于,所述校准模块包括:
筛选单元,其用于在所述公交IC刷卡数据中基于每条公交线路筛选出每日首条刷卡数据,在所述公交车辆到站时刻表数据中基于每条所述公交线路筛选出每日首条到站数据;
第二确定单元,其用于基于所述每日首条刷卡数据和所述每日首条到站数据,通过系统时间校正算法,确定经过时间误差校准的公交IC刷卡数据。
10.根据权利要求6所述的确定装置,其特征在于,所述第二确定模块还用于:在满足预定条件的情况下,将所述公交IC刷卡数据中的上车站点的公交站点编号确定为所述公交车辆到站时刻表中的公交站点编号;
所述预定条件包括所述公交IC刷卡数据中的公交线路编号和公交车辆编号与所述公交车辆到站时刻表中的公交线路编号和公交车辆编号对应相同;所述公交IC刷卡数据中的刷卡时间大于所述公交车辆到站时刻表数据中的定位时间;所述公交IC刷卡数据中的刷卡时间小于所述公交车辆到站时刻表中的下一个定位时间。
11.一种存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述方法的步骤。
12.一种电子设备,至少包括存储器、处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器在执行所述存储器上的计算机程序时实现权利要求1至5中任一项所述方法的步骤。
CN202010228121.7A 2020-03-27 2020-03-27 一种上车站点的确定方法、装置、存储介质和电子设备 Pending CN111402618A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010228121.7A CN111402618A (zh) 2020-03-27 2020-03-27 一种上车站点的确定方法、装置、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010228121.7A CN111402618A (zh) 2020-03-27 2020-03-27 一种上车站点的确定方法、装置、存储介质和电子设备

Publications (1)

Publication Number Publication Date
CN111402618A true CN111402618A (zh) 2020-07-10

Family

ID=71429206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010228121.7A Pending CN111402618A (zh) 2020-03-27 2020-03-27 一种上车站点的确定方法、装置、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN111402618A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111882913A (zh) * 2020-07-28 2020-11-03 上海屹脉信息科技有限公司 一种自动生成公交车辆线路走向的方法
CN112559881A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 步行路线确定方法、装置、电子设备及存储介质
CN113010507A (zh) * 2021-03-23 2021-06-22 浩鲸云计算科技股份有限公司 基于时间校准和遗传算法的公交od计算方法及系统
CN113393079A (zh) * 2021-05-07 2021-09-14 杭州数知梦科技有限公司 一种基于公交数据的交通小区划分方法
CN115691128A (zh) * 2022-10-27 2023-02-03 大连海事大学 一种基于多源公交数据联合挖掘的公交站点客流推算方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593974A (zh) * 2013-11-06 2014-02-19 福建工程学院 一种基于定位信息的公交载客量采集方法
CN109035770A (zh) * 2018-07-31 2018-12-18 上海世脉信息科技有限公司 一种大数据环境下公交载客量实时分析预测方法
CN109756537A (zh) * 2017-11-03 2019-05-14 北京嘀嘀无限科技发展有限公司 信息传输方法及信息传输装置、存储介质和公交车
CN110135475A (zh) * 2019-04-26 2019-08-16 重庆大学 一种基于一票制公交车刷卡数据的上车站点推算方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593974A (zh) * 2013-11-06 2014-02-19 福建工程学院 一种基于定位信息的公交载客量采集方法
CN109756537A (zh) * 2017-11-03 2019-05-14 北京嘀嘀无限科技发展有限公司 信息传输方法及信息传输装置、存储介质和公交车
CN109035770A (zh) * 2018-07-31 2018-12-18 上海世脉信息科技有限公司 一种大数据环境下公交载客量实时分析预测方法
CN110135475A (zh) * 2019-04-26 2019-08-16 重庆大学 一种基于一票制公交车刷卡数据的上车站点推算方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘少韦华: "《基于多源数据融合的城市公交客流OD需求推断方法研究》", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111882913A (zh) * 2020-07-28 2020-11-03 上海屹脉信息科技有限公司 一种自动生成公交车辆线路走向的方法
CN111882913B (zh) * 2020-07-28 2022-04-29 上海屹脉信息科技有限公司 一种自动生成公交车辆线路走向的方法
CN112559881A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 步行路线确定方法、装置、电子设备及存储介质
CN112559881B (zh) * 2020-12-24 2024-05-28 北京百度网讯科技有限公司 步行路线确定方法、装置、电子设备及存储介质
CN113010507A (zh) * 2021-03-23 2021-06-22 浩鲸云计算科技股份有限公司 基于时间校准和遗传算法的公交od计算方法及系统
CN113393079A (zh) * 2021-05-07 2021-09-14 杭州数知梦科技有限公司 一种基于公交数据的交通小区划分方法
CN113393079B (zh) * 2021-05-07 2024-01-09 杭州数知梦科技有限公司 一种基于公交数据的交通小区划分方法
CN115691128A (zh) * 2022-10-27 2023-02-03 大连海事大学 一种基于多源公交数据联合挖掘的公交站点客流推算方法

Similar Documents

Publication Publication Date Title
CN111402618A (zh) 一种上车站点的确定方法、装置、存储介质和电子设备
CN110415545B (zh) 一种车道定位方法、装置、电子设备和存储介质
US10458804B2 (en) Methods of obtaining and using point of interest data
CN112598762A (zh) 三维车道线信息生成方法、装置、电子设备和介质
WO2015154438A1 (zh) 定位方法及装置
CN111078818B (zh) 地址分析方法、装置、电子设备及存储介质
CN112327340B (zh) 终端定位精度评估方法、装置、设备以及介质
CN102098388A (zh) 联系人排序方法及终端
CN104166645A (zh) 兴趣点及路径信息的获取方法和车载电子设备
CN112328731B (zh) 车辆车道级定位方法、装置、电子设备和计算机可读介质
CN103178998A (zh) 一种测控数据传输方法和装置
CN112461246B (zh) 融合多源异构定位路径数据的方法和系统
CN110049434B (zh) 一种定位方法、装置、设备及存储介质
CN106855878B (zh) 基于电子地图的历史行车轨迹显示方法和装置
US10397747B2 (en) Entity tracking
CN112988933A (zh) 地址信息管理的方法和装置
CN103533503A (zh) 一种基于拍照记录获取公交车时刻表的方法及系统
CN116226633A (zh) 一种船只数据实时融合识别的方法、系统、装置和介质
KR101448268B1 (ko) 물류 추적 장비의 gps 오차 보정 장치 및 방법
EP1388824A2 (en) Communication terminal and information processing apparatus of a payment system
Bharte et al. Bus Monitoring System Using Polyline Algorithm
CN110139211B (zh) 一种协同定位方法及系统
CN102110374B (zh) 交通信息提供系统及方法
KR102472406B1 (ko) Poi 정보 관리 장치 및 방법
CN113970767A (zh) 卫星定位方法、定位设备及用户终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200710