基于出租车和公交GPS数据的公交运行状态判别方法及应用系统
技术领域
本发明涉及一种基于城市道路出租车GPS数据与公交车GPS数据的公交运行状态判别方法,属于智能交通技术领域。
背景技术
近年来,随着社会经济的迅速发展,城市机动车保有量快速增加,城市交通需求持续增长,中国很多城市交通拥堵日益突出。为缓解交通拥堵,倡导绿色出行,很多城市推出了“公交都市”的概念。“公交都市”与传统的公交出行的概念有很大的差异,“公交都市”通过引入ITS技术,逐步实现公交出行的数字化、网络化、集成化、智能化。然而,建设“公交都市”仍然存在很大的问题:现有的公共交通信息数据本身存在较大的缺陷,如数据质量的不稳定导致发布结果的不可靠性,定位数据发送周期的较大导致识别公交车到站与交叉口停靠信息较为困难;公交信息源单一,缺乏与道路实时信息的融合,导致计算得到的公交运行状态判别结果并不准确;现有的公交信息系统计算效率低,难以满足实时运行状态监测的需求等等。这些问题严重阻碍了“公交都市”的发展,给倡导“绿色公交出行”带来了极大的困难。
经过现有技术文献检索发现,利用出租车和公共汽(电)车全球卫星定位系统(Global Position System,GPS)数据的公交运行状态判别技术未见公开报道。
发明内容
本发明针对以上问题的思考与研究,产生了基于出租车与公交车GPS数据的公交运行状态判别的技术思路和实现方法,有较大推广前景。
本发明针对城市出租车与公交车实时数据融合分析技术的应用推广,结合中国城市公交运行的实际情况,提出了一种新的多源交通实时数据融合运用方法,以提供一种高效、可靠、精确、稳定的城市公交运行状态判别技术。
为达到以上目的,本发明是通过以下技术方案实现的:
一、系统技术方案:
一种基于出租车与公交GPS数据的公交运行状态判别系统,其特征在于,整个系统包括前端出租车与公共汽(电)车GPS实时数据采集系统和后台核心数据处理系统两个部分,所述前端出租车与公共汽(电)车GPS实时数据采集系统为所述后台核心数据采集系统提供实时的基础数据。
所述前端出租车与公交GPS数据实时采集系统包括车载出租车GPS设备、公共汽(电)车GPS数据两个终端设备,以及现有的线路站点信息表、路网GIS地图,它们提供的基础数据分别是:出租车GPS实时数据、公共汽(电)车实时数据、线路站点基础信息数据表、GIS空间数据库。
所述后台核心数据处理系统又包括有预处理模块、交通参数估计模块、公交运行状态判别模块和历史数据库,其中:
所述预处理模块,包括异常数据识别模块、数据地图匹配模块、路段数据修正模块、和公交数据补充模块,
所述异常数据识别模块以出租车GPS数据与公交GPS数据作为输入,根据两者在历史数据库中的历史数据特征与相关性来识别剔除掉其中的异常数据,
所述数据地图匹配模块对异常数据识别模块输出的出租车及公交车GPS数据,再结合线路站点信息表、路网GIS地图对其进一步进行路段和站点的匹配,从而剔除其中错误的数据,
所述路段数据修改模块对于数据地图匹配模块输出的速度正常但其它字段有异常的克服其存在的小问题,利用相邻数据完成数据的修正,
所述公交数据补充模块对路段数据修改模块输出的修正数据后,在实时数据输入样本量不足的情况下,则调取历史数据库中的历史数据进行补充,如此通过融合历史数据来提高数据质量,
该输出的高质量数据分别更新历史数据库和提供给交通参数估计模块加以提取其中有用的参数。
所述交通参数估计模块,包括交通参数提取模块和公交运行特征估计模块,所述的交通参数提取模块提取从预处理后输出的同一时刻对应该路段的公交车GPS数据和出租车GPS数据两种基础数据,从中分别提取出公交路段行程时间、公交数据样本量、出租车路段运行速度、出租车数据样本量这四项参数。
所述公交运行特征估计模块利用海量历史数据(至少一周)进行模型拟合,获取不同道路特征下对应的某公交路段运行速度估计模型,以此模型参数建立路段公交运行特征库,路段公交运行特征基础模型如下:
式中,Vbus是公交车的路段运行速度,tbus是采集到的数据样本公交车行程时间,qbus是公交车的样本数,Vc是出租车的路段运行速度,qc是出租车的样本数,α和β是路段权重系数,根据历史数据标定而得。
以交通参数提取模块提供的公交路段行程时间、公交数据样本量、出租车路段运行速度、出租车数据样本量作为模型的输入,所述公交运行特征估计模块并以公交路段运行速度作为输出,同时更新历史数据库。
所述公交运行状态判别模块,包括判别阈值确定模块和公交运行状态判定模块,所述判别阈值确定模块利用历史数据库进行分析给每个路段划定公交运行状态阈值,然后根据交通参数估计实时计算的路段公交运行速度判别公交运行状态,将状态分为畅通、缓行、拥挤三个等级。
二、方法技术方案
一种基于出租车与公共汽(电)车的全球定位系统获取数据的公交运行状态判别方法,其特征在于,依次包括如下步骤:
(1)数据采集:
通过接口服务器连接至城市的出租车数据中心、公交车数据中心的数据接口,获得路网上各个GPS终端的实时数据。
(2)数据预处理:
基于实时输入的出租车GPS数据、公交车GPS数据、静态的GIS路网数据、线路站点数据信息进行数据的预处理,通过数据筛选、修复、数据融合来提高数据质量,得到有效地高质量数据,
(21)首先对输入的出租车GPS数据、公交车GPS数据进行识别并剔除速度异常的数据,
(22)然后结合静态的GIS路网数据、线路站点数据信息对出租车及公交车GPS数据进行路段和站点的匹配,
(23)之后对于速度正常但其它字段有异常的数据进行修正处理,
(24)最后在实时数据输入样本量不足的情况下用历史数据进行补充,便终结数据预处理工作;
(3)交通参数估计:
(31)首先对预处理过输出的公交车GPS数据提取公交路段行程时间、公交数据样本量这两项参数,然后利用预处理过输出的出租车GPS数据估计同一时刻对应该路段的出租车路段运行速度、出租车数据样本量这两项参数。
(32)基于以上四个参数,以公交路段行程时间、公交数据样本量、出租车路段运行速度、出租车数据样本量作为模型的输入,公交路段运行速度作为输出,利用海量历史数据(至少一周)进行模型拟合,获取不同道路特征下对应的某公交路段运行速度估计模型,以此模型参数建立路段公交运行特征库。路段公交运行特征基础模型如下:
式中,Vbus是公交车的路段运行速度,tbus是采集到的数据样本公交车行程时间,qbus是公交车的样本数,Vc是出租车的路段运行速度,qc是出租车的样本数,α和β是路段权重系数,根据历史数据标定而得。
(4)公交运行状态判别:
利用历史数据库进行分析,给每个路段划定公交运行状态阈值,然后根据交通参数估计模型实时计算输出的路段公交运行速度判别公交运行状态,状态分为畅通、缓行、拥挤三个等级。
本发明为稳定可靠的实时处理系统,在对公交运行状态的判别上从基础数据的融合运用、数据预处理以及状态判别方法三个部分进行创新。本发明的交通参数估计模块中判别模块通过构建历史特征库,对路网交通特征与公交运行特征进行分析,然后根据估计模块实时计算的交通参数做出公交运行状态判别,状态分为畅通、缓行、拥挤三个等级。
区别于以路段整体交通运行状态来进行判别的传统技术,本发明技术方案采用单独的公交状态来进行判别,本发明基于出租车与公交GPS数据的公交运行状态判别方法及应用系统具有较高的技术可行性与工程实用性,能为公交都市建设提供有力支持。与单独使用公交GPS数据的公交运行状态判别技术相比,本发明能够通过数据融合提高错误数据的甄别能力与修复能力保证数据质量,并利用路段运行特征分析与公交运行状态分析结合,在提高判别结果精确性的同时保证了系统的可靠性与实用性。
附图说明
图1为本发明基于出租车与公交GPS数据的公交运行状态判别系统的结构示意图。
图2为本发明基于出租车与公交GPS数据的公交运行状态判别的系统流程图。
图3为本发明数据预处理流程示意图。
图4为本发明数据融合流程示意图。
图5为本发明交通状态判别流程示意图。
图6本发明基于出租车与公交GPS数据的公交参数估计技术与传统技术之间的对照比较。
图7本发明基于出租车与公交GPS数据的公交运行状态判别技术与传统技术的之间的对照比较。
具体实施方式
以下结合附图对本发明技术方案做进一步说明。
如图1所示,整个稳定可靠的实时处理系统,该应用系统的实现是基于C/S架构,包括数据接口服务器与后台运算服务器。
接口服务器通过与出租车数据中心、公交车数据中心的数据接口将各个GPS终端的数据结果实时写入到运算服务器的数据库中。
后台运算服务器,结合GIS空间数据库与公交线路站点信息数据表,负责将从接口服务器输入的数据依次进行实时的预处理、交通参数估计分析、构建路段历史特征分析库,以此将实时的公交运行参数转化为公交运行状态。
如图1所示,本发明基于出租车与公交GPS数据的公交运行状态判别系统,其特征在于,整个系统包括前端出租车与公共汽(电)车GPS实时数据采集系统和后台核心数据处理系统两个部分,所述前端出租车与公共汽(电)车GPS实时数据采集系统为所述后台核心数据采集系统提供实时的基础数据。
所述前端出租车与公交GPS数据实时采集系统包括车载出租车GPS设备、公共汽(电)车GPS数据两个终端设备,以及现有的线路站点信息表、路网GIS地图,它们提供的基础数据分别是:出租车GPS实时数据、公共汽(电)车实时数据、线路站点基础信息数据表、GIS空间数据库。
所述后台核心数据处理系统又包括有预处理模块、交通参数估计模块、公交运行状态判别模块和历史数据库,其中:
所述预处理模块,包括异常数据识别模块、数据地图匹配模块、路段数据修正模块、和公交数据补充模块,
所述异常数据识别模块以出租车GPS数据与公交GPS数据作为输入,根据两者在历史数据库中的历史数据特征与相关性来识别剔除掉其中的异常数据,
所述数据地图匹配模块对异常数据识别模块输出的出租车及公交车GPS数据,再结合线路站点信息表、路网GIS地图对其进一步进行路段和站点的匹配,从而剔除其中错误的数据,
所述路段数据修改模块对于数据地图匹配模块输出的速度正常但其它字段有异常的克服其存在的小问题,利用相邻数据完成数据的修正,
所述公交数据补充模块对路段数据修改模块输出的修正数据后,在实时数据输入样本量不足的情况下(具体实施方式以6作为例子),则调取历史数据库中的历史数据进行补充,如此通过融合历史数据来提高数据质量,
该输出的高质量数据分别更新历史数据库和提供给交通参数估计模块加以提取其中有用的参数。
所述交通参数估计模块,包括交通参数提取模块和公交运行特征估计模块,所述的交通参数提取模块提取从预处理后输出的同一时刻对应该路段的公交车GPS数据和出租车GPS数据两种基础数据,从中分别提取出公交路段行程时间、公交数据样本量、出租车路段运行速度、出租车数据样本量这四项参数。
所述公交运行特征估计模块利用海量历史数据(至少一周)进行模型拟合,获取不同道路特征下对应的某公交路段运行速度估计模型,以此模型参数建立路段公交运行特征库,路段公交运行特征基础模型如下:
式中,Vbus是公交车的路段运行速度,tbus是采集到的数据样本公交车行程时间,qbus是公交车的样本数,Vc是出租车的路段运行速度,qc是出租车的样本数,α和β是路段权重系数,根据历史数据标定而得。
以交通参数提取模块提供的公交路段行程时间、公交数据样本量、出租车路段运行速度、出租车数据样本量作为模型的输入,所述公交运行特征估计模块并以公交路段运行速度作为输出,同时更新历史数据库。
所述公交运行状态判别模块,包括判别阈值确定模块和公交运行状态判定模块,所述判别阈值确定模块利用历史数据库进行分析给每个路段划定公交运行状态阈值,然后根据交通参数估计实时计算的路段公交运行速度判别公交运行状态,将状态分为畅通、缓行、拥挤三个等级。
如图2所示,基于出租车与公共汽(电)车的全球定位系统获取数据的公交运行状态判别方法,其特征在于,依次包括如下步骤:
(1)数据采集:
通过接口服务器连接至城市的出租车数据中心、公交车数据中心的数据接口,获得路网上各个GPS终端的实时数据。
(2)数据预处理:
基于实时输入的出租车GPS数据、公交车GPS数据、静态的GIS路网数据、线路站点数据信息进行数据的预处理,通过数据筛选、修复、数据融合来提高数据质量,得到有效地高质量数据,如图3所示,
(21)首先对输入的出租车GPS数据、公交车GPS数据进行识别并剔除速度异常的数据,
(22)然后结合静态的GIS路网数据、线路站点数据信息对出租车及公交车GPS数据进行路段和站点的匹配,
(23)之后对于速度正常但其它字段有异常的数据进行修正处理,
(24)最后在实时数据输入样本量不足的情况下用历史数据进行补充,便终结数据预处理工作;
(3)交通参数估计(如图4所示):
(31)首先对预处理过输出的公交车GPS数据提取公交路段行程时间、公交数据样本量这两项参数,然后利用预处理过输出的出租车GPS数据估计同一时刻对应该路段的出租车路段运行速度、出租车数据样本量这两项参数。
(32)基于以上四个参数,以公交路段行程时间、公交数据样本量、出租车路段运行速度、出租车数据样本量作为模型的输入,公交路段运行速度作为输出,利用海量历史数据(至少一周)进行模型拟合,获取不同道路特征下对应的某公交路段运行速度估计模型,以此模型参数建立路段公交运行特征库。路段公交运行特征基础模型如下:
式中,Vbus是公交车的路段运行速度,tbus是采集到的数据样本公交车行程时间,qbus是公交车的样本数,Vc是出租车的路段运行速度,qc是出租车的样本数,α和β是路段权重系数,根据历史数据标定而得。
(4)公交运行状态判别:
利用历史数据库进行分析,给每个路段划定公交运行状态阈值,然后根据交通参数估计模型实时计算输出的路段公交运行速度判别公交运行状态,状态分为畅通、缓行、拥挤三个等级。如图5所示。
本发明技术方案采用了公交以及出租车终端GPS两种不同来源、结构类似的数据的融合处理,能够实现对实时数据每分钟进行一次运算,完成包括数据的预处理、交通参数估计、公交运行状态判别三个部分。本发明系统计算效率高,能够满足一个城市的数据计算需求,而对计算机硬件条件要求不高。
如图6所示,传统的交通状态判别技术中,以路段整体交通运行状态判别,较少有单独的公交状态判别;同时涉及到公交运行状态的研究大多因为算法效率与准确性的问题难以得到工程应用。
而本发明方法首先在交通状态判别的参数估计方法上有创新,从公交车GPS数据与出租车GPS数据提取交通参数,利用公交车GPS数据和出租车GPS数据融合获取路段公交运行特征、同时采取历史数据与实时数据的融合来提高状态判别效率与精确性,有效解决的传统方法中由于数据量不足所带来的问题。
如图7所示,本发明方法在公交运行状态的判别上,以公交路段运行速度这一参数代替GPS直接采集到的瞬时速度,使之更加符合出行者的感知特征(某一时刻的速度降低并不能代表整体行程的缓慢),由此针对不同路段划分不同的公交运行状态判别阈值,考虑了路段的静态特征对于公交车运行情况的客观影响,使最终的判别结果更为可靠。