CN104484996A

CN104484996A - 一种基于多源数据的路段交通状态判别方法

Info

Publication number: CN104484996A
Application number: CN201410790524.5A
Authority: CN
Inventors: 王维锋; 杨根成; 季锦章; 丁闪闪; 万剑; 党倩
Original assignee: Jiangsu Provincial Communication Planning and Design Institute Co Ltd
Priority date: 2014-12-18
Filing date: 2014-12-18
Publication date: 2015-04-01
Anticipated expiration: 2034-12-18
Also published as: CN104484996B

Abstract

本发明公开了一种基于多源数据的路段交通状态判别方法，以固定检测器、浮动车两类方式采集交通参数值为数据源；选取多个时段的历史交通参数值和历史交通状态等级构建样本数据库，计算路段交通畅通时段的固定检测器平均速度调整参数、各时段的路段历史空间平均速度；再训练得到支持向量机模型；并分别采用直接判断法、K近邻非参数回归法和数据状态关联分析法得到当前时段的路段空间平均速度；采用直接判断法以及支持向量机模型判别当前时段的路段交通状态等级。本发明以固定检测器和浮动车为数据源，在充分考虑数据特点和适用性的前提下，进行充分挖掘和互补利用，进一步提高路段交通状态判别精度。

Description

一种基于多源数据的路段交通状态判别方法

技术领域

本发明涉及一种基于固定检测器和浮动车两类数据源的路段交通状态判别方法，尤其涉及一种基于多源数据的路段交通状态判别方法，属于道路实时交通信息处理与应用技术领域。

背景技术

快速、准确识别路段交通状态有助于制定合理的路网交通控制和诱导策略；目前，主要通过各类检测器采集交通流参数，在此基础上计算路段交通状态。

发明专利CN103021176A提出一种基于断面检测器的城市道路交通状态判别方法，采用路段上某一个检测断面的交通流参数计算拥堵指数，并通过与阈值的比较得到交通状态；该发明仅采用了固定检测器数据，但是，在一般情况下，布设在路段上的固定检测器数量有限(通常为1-2组)，据此计算的结果只能反映路段有限范围内的交通状态，很难准确判断出全路段的交通状态。

发明专利CN102087789A、CN103942953A提出基于浮动车数据判别交通状态的方法；该发明中仅采用了浮动车数据，由于浮动车在路网上的分布具有不均衡性，当路段上的浮动车样本数较低或卫星信号受到路侧高大建筑物、隧道等基础设施遮挡时，则很难通过浮动车数据判别路段的交通状态。

固定检测器和浮动车采集到的数据有其各自不同的特点和适用性，文献《基于影响因素分类的路段行程时间融合研究》(公路交通科技，2010年第27卷第4期)中指出，在路段畅通的情况下，利用固定检测器数据计算的结果能较好的表征路段交通状态，而在路段拥堵的情况下，利用浮动车数据计算的结果能较好的表征路段交通状态。

目前，随着智能交通系统的广泛部署与深入应用，同一路段往往存在固定检测器和浮动车两种采集手段，若能在充分考虑数据特点和适用性的前提下，对不同数据源进行充分挖掘和互补利用，将有助于进一步提高路段交通状态判别精度。

发明内容

为解决现有技术的不足，本发明提供一种基于多源数据的路段交通状态判别方法。

本发明所采用的技术方案为：

一种基于多源数据的路段交通状态判别方法，其特征在于，包括以下步骤：

(1)以固定检测器、浮动车两类方式分别采集的交通参数值为数据源，选取多个时段的历史交通参数值和历史交通状态等级构建样本数据库，所述的历史交通参数值包括：固定检测器采集的车辆平均速度大车数量比例、大车平均速度、小车数量比例、小车平均速度、浮动车采集的平均速度和浮动车样本量n，将交通状态等级定义为c，且所述的历史交通状态等级包括：完全畅通c＝1、基本畅通c＝2、基本拥堵c＝3、完全拥堵c＝4，最后计算样本数据库中各时段的浮动车样本量是否满足最小样本量要求，用参数r表示浮动车样本量的可靠度，当n满足最小样本量要求时，r＝1，表示浮动车样本量可靠，当n不能满足最小样本量要求时，r＝0，表示浮动车样本量不可靠；

(2)基于数据—状态关联性，计算样本数据库中路段交通畅通时段的固定检测器平均速度调整参数；

(3)采用数据—状态关联分析法，计算样本数据库中各时段的路段的历史空间平均速度

(4)以各时段历史空间平均速度为输入，对应时段的交通状态等级为输出，训练得到支持向量机模型；

(5)基于当前时段所述固定检测器、浮动车两类方式采集的实时数据，并根据数据取值特点分别采用直接判断法、K近邻非参数回归法和数据状态关联分析法得到当前时段的路段空间平均速度；

(6)根据步骤(5)得到的当前时段的路段空间平均速度以及步骤(4)得到的支持向量机模型，采用直接判断法或所述的支持向量机模型判别当前时段的路段交通状态等级。

进一步，步骤(1)所述的固定检测器为微波检测器、视频检测器、线圈检测器中的任一种。

所述的浮动车为GPS浮动车、北斗浮动车、车载移动通信终端中的任一种。

更进一步，步骤(2)所述的固定检测器平均速度调整参数的具体计算方法为：根据样本数据库中的大车数量比例、小车数量比例以及大车平均速度和小车平均速度的分布，计算畅通时段的浮动车平均速度调整值，并与对应时段内固定检测器采集的车辆平均速度进行曲线拟合计算得出固定检测器平均速度调整参数。

而步骤(3)所述的数据—状态关联分析法是通过计算样本数据库中r＝1且交通状态等级c≥3的时段的浮动车平均速度最大值在此基础上计算得出所述样本数据库中处于各时段的路段历史空间平均速度

此外，获取当前时段的固定检测器采集的车辆平均速度和浮动车采集的平均速度若则结合固定检测器采集的占有率o，采用直接判断法得到步骤(5)所述的当前时段的路段空间平均速度，具体步骤为：

①若o＝0，则取当前时段的路段空间平均速度为限速值；

②若o≠0，则取当前时段的路段空间平均速度为0。

或者，获取当前时段的固定检测器采集的车辆平均速度和浮动车采集的平均速度若则采用K近邻非参数回归法得到步骤(5)所述的当前时段的路段空间平均速度，具体步骤为：

①选取当前时段的固定检测器采集的车辆平均速度与前一时段的空间平均速度组成状态向量；

②计算状态向量的欧氏距离，选择k个欧氏距离最小的近邻的空间平均速度；

③通过加权计算方法得到当前时段的路段空间平均速度。

又或者，获取当前时段的固定检测器采集的车辆平均速度和浮动车采集的平均速度若则采用数据—状态关联分析法得到步骤(5)所述的当前时段的路段空间平均速度。

而获取当前时段的固定检测器采集的车辆平均速度和浮动车采集的平均速度若则采用直接判断法得到步骤(6)所述的交通状态等级，具体步骤为：

①若路段空间平均速度为限速值，则交通状态等级为c＝1，路段完全畅通；

②若路段空间平均速度为0，则交通状态等级为c＝4，路段完全拥堵；

若或则采用支持向量机模型得到步骤(6)所述的交通状态等级，具体步骤为：将路段空间平均速度输入步骤(4)中得到的支持向量机模型，直接输出路段交通状态等级。

本发明的有益效果在于：针对单一数据源无法有效识别路段交通状态的缺陷，以固定检测器和浮动车采集的数据为数据源，在充分考虑数据特点和适用性的前提下，对不同数据源进行充分挖掘和互补利用，从而进一步提高路段交通状态判别精度。

附图说明：

图1为本发明的总体实施流程图；

图2为本发明固定检测器速度调整参数计算流程图；

图3为本发明样本数据库路段空间平均速度估计流程图；

具体实施方式：

下面结合附图对本发明做具体的介绍。

一种基于多源数据的路段交通状态判别方法，包括以下步骤：

一、上述步骤(1)中，为充分挖掘和互补利用不同数据源，首先采用数据—状态关联分析法分析固定检测器和浮动车采集到的平均速度在不同交通状态下与路段空间平均速度的关系：

(1)记固定检测器、浮动车未采集到数据时的检测值为0，则在设备和数据传输均正常的情况下，路段在一个时段内采集到的数据分为三种情况：①固定检测器和浮动车的检测值均为0，②固定检测器的检测值为非0，而浮动车的检测值为0，③固定检测器和浮动车的检测值均为非0；第一种情况意味着路段上或者没有车辆，或者完全堵塞；后两种情况则无法直接判断道路拥堵情况；

(2)固定检测器采集的是全样本的路段断面速度平均值，只能反应其周边有限范围内的道路交通状态，当交通拥堵时，固定检测器采集的车辆平均速度与路段空间平均速度会产生较大差异，差异程度与拥堵大小有关，因而不易估计；而当交通畅通时，与仍会有一定差异，这种差异主要受路段上固定点(如分合流处和交叉口处)的车辆交织或交通管控影响而产生，差异程度可以估计，此时需要通过数据拟合方法计算的调整参数，进而对进行调整；

(3)浮动车采集的是部分样本的路段行程速度平均值，当浮动车样本可靠性较高且交通拥堵时，车辆行驶自由度降低，道路上所有车辆行驶速度相当，浮动车采集的平均速度可以较好的表征路段空间平均速度当浮动车样本可靠性较高且交通畅通时，与有一定的差异，这主要是由于浮动车车辆构成(在城市道路上通常为出租车，在公路网上通常为“两客一危”车辆)与全样本车辆构成(正常情况下既包含大车，也包含小车)不同引起的，差异程度可以估计，此时需要通过大小车辆的构成比例和车速分布对进行调整；而当浮动车可靠性较低时，与关联性通常较差；

(4)综上，若浮动车样本可靠性较高且浮动车车速较低，则路段极有可能处于交通拥堵状态，可较好地表征；若浮动车样本可靠性较高且浮动车车速较高，则路段极有可能处于交通畅通状态，可结合车辆构成及其速度分别情况计算的调整值用来表征并且此时可以计算的调整参数；若浮动车样本可靠性较低，则只需采用调整参数修正并将修正后的作为

二、上述步骤(1)中，选取多个时段的历史交通参数值和历史交通状态等级构建历史样本数据库，并计算各时段的浮动车样本量是否满足最小样本量要求，具体如下：

(1)记历史样本数据库中固定检测器采集的全部车辆平均速度为(以下简称固定检测器平均速度)、大车比例为p^b、大车平均速度为小车比例为p_c、小车平均速度为浮动车采集的每一辆车的单车速度为v′_i、浮动车样本量为n、浮动车采集的平均速度为(以下简称浮动车平均速度)；要求所选取的样本中n≠0；

(2)历史样本数据库中的交通状态等级c分为4级：完全畅通(c＝1)、基本畅通(c＝2)、基本拥堵(c＝3)、完全拥堵(c＝4)，交通状态等级由道路的历史交通视频判断得到；

(3)计算各时段的浮动车样本量n是否满足下式规定的最小样本量要求：

n &GreaterEqual; {(\frac{t_{\frac{α}{2}} (n - 1) S}{ϵ})}^{2}

其中，为t分布中置信水平为1-α时对应的值，S为浮动车速度的均方差，ε为允许速度误差的绝对值；

若浮动车样本量满足上式，则浮动车平均速度的可靠性较高，为便于描述，用参数r表示浮动车样本量的可靠度，当n满足最小样本量要求时，r＝1，表示浮动车样本量可靠，否则，r＝0，表示浮动车样本量不可靠。

三、上述步骤(2)中，基于步骤1中的数据-状态关联性分析，计算交通畅通时段固定检测器采集的车辆平均速度的调整参数，步骤包括：

(1)对样本数据库中r＝1且交通状态等级c＜3的时段进行提取，根据交通流中大小车辆的构成比例和车速分布，计算对应各时段的浮动车平均速度调整值

{\hat{v}}_{f}^{'} = (p_{1} + p_{2} \times \frac{v_{2}}{v_{1}}) \times {\overset{&OverBar;}{v}}_{f}^{'}

当浮动车为小车时(主要指出租车，应用于城市路网中)，上式中各参数的取值分别为p₁＝p_c，p₂＝p_b，

v_{1} = {\overset{&OverBar;}{v}}_{c}, v_{2} = {\overset{&OverBar;}{v}}_{b};

当浮动车为大车时(主要指“两客一危”车辆，应用于公路网中)，上式中各参数的取值分别为：p₁＝p_b，p₂＝p_c，

(2)提取上一步中各时段的和采用数据拟合的方式得到中的参数a和b，即固定检测器的平均速度调整参数。

四、上述步骤(3)中，根据步骤(1)中的数据-状态关联性分析，计算样本数据库中r＝1且交通状态等级c≥3的时段的浮动车平均速度最大值在此基础上计算样本数据库中各类交通状态等级的路段历史空间平均速度步骤包括：

(1)若某时段r＝1且则该时段的路段空间平均速度估计值

(2)若某时段r＝1且则该时段的路段空间平均速度估计值为：

{\overset{&OverBar;}{v}}^{'} = (p_{1} + p_{2} \times \frac{v_{2}}{v_{1}}) \times {\overset{&OverBar;}{v}}_{f}^{'}

(3)若某时段r＝0，则该时段的路段空间平均速度估计值

五、上述步骤(4)中，以各时段历史空间平均速度估计值为输入，以对应对路段的历史交通状态等级c为输出，进行支持向量机模型训练。

六、上述步骤(5)中，获取当前时段固定检测器平均速度v_s和浮动车平均速度若则采用直接判断法得到路段空间平均速度估计值，步骤包括：

(1)对同时段固定检测器采集到的占有率o进行判断，若o＝0，则判断当前时段道路上没有车辆，取路段空间平均速度其中，v_l为路段限速值；

(2)若o≠0，则判断当前时段道路交通完全拥堵，取路段空间平均速度

七、上述步骤(5)中，获取当前时段固定检测器平均速度和浮动车平均速度若则难以直接判断道路是否畅通，如果直接采用固定检测器速度调整值估计路段空间平均速度将会产生较大误差，因此，采用K近邻非参数回归法得到路段空间平均速度估计值，步骤包括：

(1)选取状态向量，这里的状态向量是指与当前时段空间平均速度有关系的向量。由于交通状态的变化是一个连续的过程，相邻时段的空间平均速度通常存在一定的联系，因此，选取当前时段的固定检测器平均速度与前一时段的空间平均速度组成状态向量；

(2)计算状态向量的欧氏距离：

d (i) = \sqrt{Σ_{j = 1}^{2} {[x_{i} (j) - x (j)]}^{2}}, i = 1,2, . . ., m

其中，x(j)为当前时段固定检测器平均速度与前一时段空间平均速度所组成的状态向量中的第j个值；x_i(j)为第i个历史时段固定检测器平均速度与第i-1个历史时段空间平均速度所组成的状态向量中的第j个值；

(3)选择k个欧氏距离最小的近邻的空间平均速度v(i)，其中，k＜m,i＝1,2,...,k，采用加权方式得到当前时段的空间平均速度：

\overset{&OverBar;}{v} = Σ_{i = 1}^{k} ω_{i} v (i)

其中，

ω_{i} = \frac{1}{d (i)} / Σ_{i = 1}^{k} \frac{1}{d (i)} .

八、上述步骤(5)中，获取当前时段固定检测器平均速度和浮动车平均速度若则采用数据-状态关联分析法得到路段空间平均速度估计值，计算方法如步骤4所述。

九、上述步骤(6)中，若则采用直接判断法进行交通状态判别，步骤为：

(1)若路段空间平均速度为限速值，则交通状态等级为c＝1级，即完全畅通；

(2)若路段空间平均速度为0，则交通状态等级为c＝4级，即完全拥堵。

若或则基于支持向量机法判别路段交通状态，即，将空间平均速度输入步骤(4)中得到的支持向量机模型，直接输出交通状态的判别结果。

具体实施步骤如下：

如图1所示，本发明实施的具体步骤为：

步骤一、选取历史数据，构建样本数据库：

样本数据库中样本(即每一个时段，亦即每一个统计时间间隔)的组成如下表：

表中样本按时间先后顺序排列，要求固定检测器和浮动车采集的数据的统计时间间隔相同，且样本数据库中选择的每一条样本均要求固定检测器平均速度浮动车样本量n≠0，样本库中的数据获取方式如下：

(1)固定检测器采集的车辆平均速度大车平均速度大车比例p_b、小车平均速度小车比例p_c均从固定检测器获取；

(2)提取统计时间间隔内落到研究路段上的每一辆浮动车的速度v′_i、浮动车样本量n；

(3)浮动车平均速度的计算公式为：

{\overset{&OverBar;}{v}}_{f}^{'} = Σ_{i = 1}^{n} v_{i}^{'} / n

(4)交通状态等级c分为4级，通过路段的历史交通视频判断样本数据库中各时段的交通状态等级，判别依据如下表所示：

步骤二、按下式计算样本数据库中各时段的浮动车数量n是否满足最小样本量要求：

n &GreaterEqual; {(\frac{t_{\frac{α}{2}} (n - 1) S}{ϵ})}^{2}

其中，为t分布中置信水平为1-α时对应的值，S为浮动车速度的均方差，

ε为允许速度误差的绝对值，建议ε取1～10km/h。

步骤三、如图2所示，计算固定检测器的速度调整参数：

(1)提取样本数据库中r＝1且交通状态等级c＜3的时段，根据交通流中大小车辆的构成比例和车速分布，计算对应各时段的浮动车平均速度调整值

{\hat{v}}_{f}^{'} = (p_{1} + p_{2} \times \frac{v_{2}}{v_{1}}) \times {\overset{&OverBar;}{v}}_{f}^{'} .

步骤四、如图3所示，计算样本数据库中各时段的历史空间平均速度估计值

(1)提取样本数据库中r＝1且交通状态等级c≥3的时段，求出这些时段中的浮动车平均速度最大值

(2)若某时段r＝1且则该时段的空间平均速度估计值取

(3)若某时段r＝1且则该时段的空间平均速度估计值取:

{\overset{&OverBar;}{v}}^{'} = (p_{1} + p_{2} \times \frac{v_{2}}{v_{1}}) \times {\overset{&OverBar;}{v}}_{f}^{'}

(4)若某时段r＝0，则该时段的空间平均速度估计值取

(5)将加入样本数据库。

步骤五、以各时段的历史空间平均速度估计值为输入，以对应时段的交通状态等级c为输出，训练得到支持向量机模型，模型中的核函数可选用线性、多项式、径向基、Sigmoid等函数之一。

步骤六、计算当前时段的路段空间平均速度估计值：

(1)获取当前时段固定检测器平均速度和浮动车平均速度若则采用直接判断法得到路段空间平均速度估计值：对同时段固定检测器采集到的占有率o进行判断，若o＝0，则取路段空间平均速度若o≠0，则取路段空间平均速度

(2)若则采用K近邻非参数回归法得到路段空间平均速度估计值：

①选取当前时段的固定检测器平均速度与前一时段的空间平均速度组成状态向量；

③采用加权方式得到当前时段的空间平均速度。

(3)若则采用数据-状态关联分析法得到路段空间平均速度估计值，计算方法与步骤四相同。

步骤七、判断当前时段的路段交通状态：

(1)若步骤六中得到的路段空间平均速度则采用直接判断法得路段交通状态等级为c＝1级；

(2)若步骤六中得到的路段空间平均速度则采用直接判断法得路段交通状态等级为c＝4级；

(3)若步骤六中得到的路段空间平均速度既非0，也非限速值，则将路段空间平均速度输入步骤五中得到的支持向量机模型，由模型判别路段的交通状态等级.

本发明针对单一数据源无法有效识别路段交通状态的缺陷，以固定检测器和浮动车为数据源，在充分考虑数据特点和适用性的前提下，对不同数据源进行充分挖掘和互补利用，从而进一步提高路段交通状态判别精度。

上述实施例不以任何形式限制本发明，凡采用等同替换或等效变换的方式所获得的技术方案，均落在本发明的保护范围内。

Claims

1.一种基于多源数据的路段交通状态判别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于多源数据的路段交通状态判别方法，其特征在于，步骤(1)所述的固定检测器为微波检测器、视频检测器、线圈检测器中的任一种。

3.根据权利要求1所述的一种基于多源数据的路段交通状态判别方法，其特征在于，步骤(1)所述的浮动车为GPS浮动车、北斗浮动车、车载移动通信终端中的任一种。

4.根据权利要求1所述的一种基于多源数据的路段交通状态判别方法，其特征在于，步骤(2)所述的固定检测器平均速度调整参数的具体计算方法为：根据样本数据库中的大车数量比例、小车数量比例以及大车平均速度和小车平均速度的分布，计算畅通时段的浮动车平均速度调整值，并与对应时段内固定检测器采集的车辆平均速度进行曲线拟合计算得出固定检测器平均速度调整参数。

5.根据权利要求1所述的一种基于多源数据的路段交通状态判别方法，其特征在于，步骤(3)所述的数据—状态关联分析法是通过计算样本数据库中r＝1且交通状态等级c≥3的时段的浮动车平均速度最大值在此基础上计算得出所述样本数据库中处于各时段的路段历史空间平均速度

6.根据权利要求1所述的一种基于多源数据的路段交通状态判别方法，其特征在于，获取当前时段的固定检测器采集的车辆平均速度和浮动车采集的平均速度若则结合固定检测器采集的占有率o，采用直接判断法得到步骤(5)所述的当前时段的路段空间平均速度，具体步骤为：

①若o＝0，则取当前时段的路段空间平均速度为限速值；

②若o≠0，则取当前时段的路段空间平均速度为0。

7.根据权利要求1所述的一种基于多源数据的路段交通状态判别方法，其特征在于，获取当前时段的固定检测器采集的车辆平均速度和浮动车采集的平均速度若则采用K近邻非参数回归法得到步骤(5)所述的当前时段的路段空间平均速度，具体步骤为：

③通过加权计算方法得到当前时段的路段空间平均速度。

8.根据权利要求1所述的一种基于多源数据的路段交通状态判别方法，其特征在于，获取当前时段的固定检测器采集的车辆平均速度和浮动车采集的平均速度若则采用数据—状态关联分析法得到步骤(5)所述的当前时段的路段空间平均速度。

9.根据权利要求1所述的一种基于多源数据的路段交通状态判别方法，其特征在于，获取当前时段的固定检测器采集的车辆平均速度和浮动车采集的平均速度若则采用直接判断法得到步骤(6)所述的交通状态等级，具体步骤为：

②若路段空间平均速度为0，则交通状态等级为c＝4，路段完全拥堵。