一种公交到站信息预测方法和装置
技术领域
本申请涉及智能交通技术领域,特别是涉及一种公交到站信息预测方法和一种公交到站信息预测装置。
背景技术
随着城市化、现代化、机动化程度的不断加深,机动车保有量快速增长,市民出行需求呈现多样化、个性化的特征,城市交通压力日益增大。国内外大城市发展经验表明,要解决城市交通问题,尤其是特大型国际城市的交通问题,必须充分发挥公共交通的重要作用。公交到站时间服务是提高公众交通吸引力的关键服务之一。通过提供实时车辆到站信息,能够使用户更好的安排自己的公共交通行程,减少等待时间。因此,实时公交到站时间预测技术在智能交通领域已经成为研究的热点。
公交车辆到站时间预测作为公交系统信息化的关键技术,受到了国内外研究人员的极大关注。在已知的现有技术中,公交车辆到达时间的预测技术主要包括历史数据模型预测模型、人工神经网络模型和卡尔曼滤波器模型等。一般是通过评价预测结果的准确性来评价各个模型的优缺点。目前的到站准确性评测方法,大都采用站点实地体验法,即通过路测采样的方式去测试公交到站的准确性,当系统预报车辆到站时,看车辆是否真正到站,这种方法只能评测近距离的公交到站预测,耗费的人力物力较大,采取的样本数量有限,准确性评测覆盖率较低,评测指标单一。具体哪些指标可以反映预测结果的准确性,怎么评测这些指标,亟需一个方法解决这些问题。
发明内容
本申请实施例所要解决的技术问题是提供一种公交到站信息预测方法,实现对各种公交预测模型的预测的到站信息的准确性的验证。
相应的,本申请实施例还提供了一种公交到站信息预测装置,用以保证上述方法的实现及应用。
为了解决上述问题,本申请公开了一种公交到站信息预测方法,所述方法包括:
获取预测到站信息以及实际到站信息;其中,所述预测信息包括:预测到站时间、预测到站站数、预测到站距离、预测经纬度信息,所述实际到站信息包括:实际到站时间、实际到站站数、实际到站距离、实际经纬度信息;
采用预测到站时间以及实际到站时间,计算公交到站时间准确率;
采用预测到站站数,预测到站距离,以及,预测车辆经纬度信息,计算公交空间维度评测指标,所述公交空间维度评测指标包括:公交到站站数增加出现率、公交到站距离增大出现率、车辆丢失率;
当所述公交到站时间准确率,以及,公交空间维度评测指标,满足预设条件时,将对应的预测到站信息作为需要发布的目标信息。
优选的,所述预测到站信息按指定时间间隔形成的时间点生成,所述采用预测到站时间以及实际到站时间计算公交到站时间准确率的步骤包括:
选取某个时间点的实际到站时间与预测到站时间的差值的绝对值作为时间样本;
选取绝对值低于预设时间误差的样本作为准确时间样本;
统计时间样本中的准确时间样本数,计算公交到站时间准确率。
优选的,所述采用所述公交空间维度数据计算公交空间维度评测指标的步骤包括:
选取某个时间点的预测到站信息作为空间样本;
统计空间样本中站数增大的空间样本数,计算公交到站站数增加出现率;
统计空间样本中距离增大的空间样本数,计算公交到站距离增大出现率;
统计空间样本中出现车辆丢失的空间样本数,计算车辆丢失率。
优选的,所述方法还包括:公交线路按、公交班次、车辆ID划分所述空间样本,统计线路中每辆车每班次的公交空间维度评测指标。
优选的,所述实际到站时间的测量方法包括:通过GPS轨迹数据计算,人工记录。
优选的,所述预设时间误差与所述预测到站时间的大小成正比。
同时,本申请还公开了一种公交到站信息预测装置,所述装置包括:
获取模块,用于获取预测到站信息以及实际到站信息;其中,所述预测信息包括:预测到站时间、预测到站站数、预测到站距离、预测经纬度信息,所述实际到站信息包括:实际到站时间、实际到站站数、实际到站距离、实际经纬度信息;
公交到站时间准确率计算模块,用于采用预测到站时间以及实际到站时间,计算公交到站时间准确率;
公交空间维度评测指标计算模块,用于采用预测到站站数,预测到站距离,以及,预测车辆经纬度信息,计算公交空间维度评测指标,所述公交空间维度评测指标包括:公交到站站数增加出现率、公交到站距离增大出现率、车辆丢失率;
发布模块,用于当所述公交到站时间准确率,以及,公交空间维度评测指标,满足预设条件时,将对应的预测到站信息作为需要发布的目标信息。
优选的,所述预测到站信息按指定时间间隔形成的时间点生成,所述公交到站时间准确率计算模块包括:
时间样本选取模块,用于选取某个时间点的实际到站时间与预测到站时间的差值的绝对值作为时间样本;
准确时间样本选取模块,用于选取绝对值低于预设时间误差的样本作为准确时间样本;
时间准确率计算模块,用于统计时间样本中的准确时间样本数,计算公交到站时间准确率。
优选的,所述公交空间维度评测指标计算模块包括:
空间样本选取模块,用于选取某个时间点的预测到站信息作为空间样本;
站数增加计算模块,用于统计空间样本中站数增大的空间样本数,计算公交到站站数增加出现率;
距离增大计算模块,用于统计空间样本中距离增大的空间样本数,计算公交到站距离增大出现率;
车辆丢失率计算模块,用于统计空间样本中出现车辆丢失的空间样本数,计算车辆丢失率。
优选的,所述装置还包括:
线路统计模块,按公交线路、公交班次、车辆ID划分所述空间样本,统计线路中每辆车每班次的公交空间维度评测指标。
优选的,所述实际到站时间的测量方法包括:通过GPS轨迹数据计算,人工记录。
优选的,所述预设时间误差与所述预测到站时间的大小成正比。
与现有技术相比,本申请实施例包括以下优点:
本申请通过利用公交预测到站信息以及实际公交预测到站信息,计算得出每条公交线路在高峰平峰的到站时间准确率,公交到站站数增加出现率、公交到站距离增大出现率、车辆丢失率,来验证各种模型系统预测结果的准确性,同时为模型改进提供参考依据,减少实测过程中浪费的大量时间和精力,最终使预测系统提供实时、准确的数据服务,提升公交出行吸引力。
附图说明
图1是本申请的一种公交到站信息预测方法实施例的步骤流程图;
图2是本申请实施例中选取时间样本的示意图;
图3是本申请实施例中获取公交到站时间的示意图;
图4是本申请实施例一种计算空间维度评测指标的步骤流程图;
图5是本申请一种公交到站信息预测装置实施例的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请实施例的核心构思之一在于,通过公交预测到站信息以及实际公交预测到站信息,计算得出每条公交线路在高峰平峰的到站时间准确率,公交到站站数增加出现率、公交到站距离增大出现率、车辆丢失率,将满足预设条件的预测到站信息作为需要发布的目标信息。
参照图1,示出了本申请的一种公交到站信息预测方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,获取预测到站信息以及实际到站信息;其中,所述预测信息包括:预测到站时间、预测到站站数、预测到站距离、预测经纬度信息,所述实际到站信息包括:实际到站时间、实际到站站数、实际到站距离、实际经纬度信息;
步骤102,采用预测到站时间以及实际到站时间,计算公交到站时间准确率;
步骤103,采用预测到站站数,预测到站距离,以及,预测车辆经纬度信息,计算公交空间维度评测指标,所述公交空间维度评测指标包括:公交到站站数增加出现率、公交到站距离增大出现率、车辆丢失率;
步骤104,当所述公交到站时间准确率,以及,公交空间维度评测指标,满足预设条件时,将对应的预测到站信息作为需要发布的目标信息。
公交到站服务可以从时间和空间两个维度进行描述,时间维度指公交到站时间,即公交车到达目标站点的时间预测;空间维度指公交车到达目标站点的途经站数和距离。从使用公交到站服务的场景来看,用户无法准确感知空间维度的描述,所以绝大多数到站预测模型处理完结果后,只从时间角度评测到站的准确性,采用在站台实地感受的方法,这种方法只能感受到即将进站的车辆的准确性,对于长时间、长距离到站的准确性是无法感知的。对测到站距离和站数的准确性,人们认为这些指标的计算是通过静态的线路站点数据得来的所以一定会准确,但是没有考虑到GPS的漂移和丢失的情况,造成车辆到站信息的回退和丢失现象。
车辆到站新的回退是指在车辆的GPS系统上传的GPS数据由于GPS漂移的原因,从车辆前进的方向看来,某一次GPS数据在之前的一次(或多次)的GPS数据的后方。车辆丢失是指GPS在预定的GPS数据上传时间没有上传到GPS数据。
本申请实施例中通过从时间和空间两个维度评测预测到站信息的准确性,从时间维度评测公交预测到站时间的准确性;从空间维度评测公交到站站数增加出现率、公交到站距离增大出现率以及车辆丢失率。
在本申请实施例中,所述预测到站信息按指定时间间隔形成的时间点生成,所述采用预测到站时间以及实际到站时间计算公交到站时间准确率的步骤可以包括:
选取某个时间点的实际到站时间与预测到站时间的差值的绝对值作为时间样本;
选取绝对值低于预设时间误差的样本作为准确时间样本;
统计时间样本中的准确时间样本数,计算公交到站时间准确率。
在本申请实施例中,预测到站信息按指定时间间隔形成的时间点生成,指定的时间间隔即预测到站信息的生成间隔TimeID。根据实际数据情况定义间隔大小,可以设置10秒或者其他的大小。
公交到站时间准确率=准确时间样本数/时间样本总数。
通过本申请实施例所述的方式,可以计算公交到第一站的时间准确率、到第二站的时间准确率、……、到第N站的时间准确率。还可以计算工作日中公交高峰和平峰时期的总体公交到站准确率。如:
高峰到站时间准确率=高峰准确时间样本数/高峰样本总数。
平峰到站时间准确率=平峰准确时间样本数/平峰样本总数。
早晚高峰的公交到站时间准确率是反映一个城市整体的公交到站服务性能的指标。但是用户更关心该城市哪些线路提供公交服务,提供服务的线路的准确率。同时服务提供商也可以根据每条线路的数据源情况和到站准确率的情况来决定是否发布该线路的公交到站服务。
线路的到站时间准确率=线路大的准确时间样本数/线路的时间样本总数。
参照图2是本申请实施例中选取时间样本的示意图,其中,时间样本Sample可以定义为:公交车i在第j个TimeID到达下游站点k的实际到站时间与预测到站时间的差值的绝对值。
可描述为:
Sample=(BusIDi,TimeIDj,StopIDk,δ)
其中,δ=|Tr-Ti|,Tr为实际到站时间,Ti为预测到站时间,BusID为车辆标识,StopID为站点标识。
在本申请实施例中,所述预设时间误差与所述预测到站时间的大小成正比。
由于不同线路的站间距或者同一线路的不同站点的站间距是不同的,公交车在站间的旅行时间也不一样。所以本文根据每辆车的实际到站时间t把到站预测又分为四个时间段:5分钟之内,5到10分钟之间,10分钟到30分钟之间和大于30分钟的,每个时间段,用户能接受的误差也不一样。公交到站时间准确性,主要看预测时间与实际公交到站时间对比,看在误差范围内的到站时间是否准确。评价标准如下:
在本申请实施例中,所述实际到站时间的测量方法可以包括:通过GPS轨迹数据计算,人工记录。
预测时间的准确性是通过实际到站时间来评估的。实际公交到站时间的获取有两种途径:
1、通过GPS轨迹数据算出实际的公交到站时间。受站内交通因素的的影响,公交车在站内停靠点位置有偏差,到站时间点的选取不同,造成实际到站时间有一定的误差。为了测试的公平,站点的范围与系统选取一致,我们也采用站点区域的概念来描述站点位置。把公交站点描述为一个以站点为圆心,半径为R的区域。公交车到站时间为公交车到达圆的边界时刻。
参照图3是本申请实施例中获取公交到站时间的示意图。其中,站点位置为圆心,R(根据不同站间距离设置不同大小,如设置为30米)为半径的区域为站点区域,公交车在进入区域边界点为到达站点位置,当前时刻T为到站时间点。
2、人工记录的公交车实际到站时间。由于人为的确认站点区域边界误差是非常大的,所以我们默认的是公交车开门上人的点为公交车实际到站时间点。
在本申请实施例中,所述采用所述公交空间维度数据计算公交空间维度评测指标的步骤可以包括:
选取某个时间点的预测到站信息作为空间样本;
统计空间样本中站数增大的空间样本数,计算公交到站站数增加出现率;
统计空间样本中距离增大的空间样本数,计算公交到站距离增大出现率;
统计空间样本中出现车辆丢失的空间样本数,计算车辆丢失率。
现有技术中,公交到站站数和到站距离是车辆定位到静态的线站数据推测出来的,只要是线路和站点数据准确,预测结果不会有差异。其中,线路数据是指每条线路采样点,线路的采样点组成的线路就是车辆实际行驶的道路。站点数据是指站点的经纬度坐标。但是在车辆定位到道路上时,由于GPS的漂移特性或者匹配算法的准确性,会造成车辆回退的现象,具体体现在随着时间的增加站数、距离增大;也有可能会造成车辆的丢失,这些都是影响预测结果不准确的原因,也会使用户体验很差。所以在本申请实施例中定义空间维度评测指标包括:公交到站站数增加出现率,公交到站距离增大出现率,车辆丢失率。
选取某个时间点的预测到站信息作为空间样本,即将某个TimeID对应预测到站信息作为空间样本。统计空间样本中站数增大的空间样本数,计算公交到站站数增加出现率;统计空间样本中距离增大的空间样本数,计算公交到站距离增大出现率;统计空间样本中出现车辆丢失的空间样本数,计算车辆丢失率。
公交到站站数增加出现率=站数增加的空间样本数/空间样本总数;
公交到站距离增大出现率=距离增大的空间样本数/空间样本总数;
车辆丢失率=出险车辆丢失的空间样本数/空间样本总数;
在本申请实施例中,所述方法还包括:公交线路按、公交班次、车辆ID划分所述空间样本,统计线路中每辆车每班次的公交空间维度评测指标。
参照图4示出了本申请实施例一种计算空间维度评测指标的步骤流程图,具体包括:
步骤401,读取一天的历史预测的到站数据,按照线路把每辆车在每个timeid的结果按时间顺序排列;
步骤402,以班次Trip为单位计算每辆车的空间维度评测指标;
按照线路读取一天的排好序的数据,以班次Trip为单位把每辆车在该天的数据做划分。统计每个Trip上,站数增大的timid个数及对应时间点;统计每个Trip上,距离增大的timid个数及对应时间点;统计每个Trip上,车辆丢失的timeid个数及对应时间点;以及每个Trip对应多少个Timid,最终获得每个Trip上的公交到站站数增加出现率,公交到站距离增大出现率,车辆丢失率。
步骤403,根据每个班次Trip的统计结果,分析各个车辆的预测质量;
每辆车一天正常运营轨迹是由多个Trip组成的,通过Trip的各个指标,计算出这辆车的空间维度的准确率。
步骤404,根据车辆的分析结果,统计线路的预测质量。
每条线路是由多辆车组成的,通过计算合格的车辆数得到该条线路的准确率
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
参照图5,示出了本申请一种公交到站信息预测装置实施例的结构框图,具体可以包括如下模块:
获取模块501,用于获取预测到站信息以及实际到站信息;其中,所述预测信息包括:预测到站时间、预测到站站数、预测到站距离、预测经纬度信息,所述实际到站信息包括:实际到站时间、实际到站站数、实际到站距离、实际经纬度信息;
公交到站时间准确率计算模块502,用于采用预测到站时间以及实际到站时间,计算公交到站时间准确率;
公交空间维度评测指标计算模块503,用于采用预测到站站数,预测到站距离,以及,预测车辆经纬度信息,计算公交空间维度评测指标,所述公交空间维度评测指标包括:公交到站站数增加出现率、公交到站距离增大出现率、车辆丢失率;
发布模块504,用于当所述公交到站时间准确率,以及,公交空间维度评测指标,满足预设条件时,将对应的预测到站信息作为需要发布的目标信息。
在本申请实施例中,所述预测到站信息按指定时间间隔形成的时间点生成,所述公交到站时间准确率计算模块包括:
时间样本选取模块,用于选取某个时间点的实际到站时间与预测到站时间的差值的绝对值作为时间样本;
准确时间样本选取模块,用于选取绝对值低于预设时间误差的样本作为准确时间样本;
时间准确率计算模块,用于统计时间样本中的准确时间样本数,计算公交到站时间准确率。
在本申请实施例中,所述公交空间维度评测指标计算模块包括:
空间样本选取模块,用于选取某个时间点的预测到站信息作为空间样本;
站数增加计算模块,用于统计空间样本中站数增大的空间样本数,计算公交到站站数增加出现率;
距离增大计算模块,用于统计空间样本中距离增大的空间样本数,计算公交到站距离增大出现率;
车辆丢失率计算模块,用于统计空间样本中出现车辆丢失的空间样本数,计算车辆丢失率。
在本申请实施例中,所述装置还包括:
线路统计模块,按公交线路、公交班次、车辆ID划分所述空间样本,统计线路中每辆车每班次的公交空间维度评测指标。
在本申请实施例中,所述实际到站时间的测量方法包括:通过GPS轨迹数据计算,人工记录。
在本申请实施例中,所述预设时间误差与所述预测到站时间的大小成正比。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种公交到站信息预测方法和一种公交到站信息预测装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。