CN102682601B - 基于优化svm的高速公路交通事件检测方法 - Google Patents

基于优化svm的高速公路交通事件检测方法 Download PDF

Info

Publication number
CN102682601B
CN102682601B CN201210137537.3A CN201210137537A CN102682601B CN 102682601 B CN102682601 B CN 102682601B CN 201210137537 A CN201210137537 A CN 201210137537A CN 102682601 B CN102682601 B CN 102682601B
Authority
CN
China
Prior art keywords
parameter
traffic
event
svm
alpha
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210137537.3A
Other languages
English (en)
Other versions
CN102682601A (zh
Inventor
吴聪
李勃
沈舒
王双
蒋士正
董蓉
阮雅端
陈启美
吴炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201210137537.3A priority Critical patent/CN102682601B/zh
Publication of CN102682601A publication Critical patent/CN102682601A/zh
Application granted granted Critical
Publication of CN102682601B publication Critical patent/CN102682601B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

基于优化SVM的高速公路交通事件检测方法,首先通过高速公路摄像机视频快速准确地获取交通流参数,并对这些数据进行预处理,分为训练数据集和测试数据集两部分;所用的支持向量机SVM模型选择径向基RBF核函数,并采用改进的网格搜索算法对SVM模型的惩罚参数C和核参数γ进行优化选择;利用训练数据集对SVM模型进行训练;使用测试数据集对训练好的SVM事件检测模型性能进行检验,然后将SVM模型用于高速公路的实时交通事件检测。测试表明,本发明具有90%以上的检测率和5%以下的误报警率,且优化时间短,满足了交通事件检测实时性的要求。

Description

基于优化SVM的高速公路交通事件检测方法
技术领域
本发明属于机器学习、数据挖掘领域,主要用于高速公路交通管理系统中,为一种基于优化SVM的高速公路交通事件检测方法。
背景技术
一直以来,高速公路交通拥堵使人们的出行时间和燃料消耗大大增加[1-2],给人们带来了巨大的损失。然而,大多数的交通拥堵是由于非经常性的交通事件引起的[3]。因此,如何快速准确地检测出交通事件,对减少交通事件的影响和持续时间、实施合理的路网优化有着重要的意义。
交通事件检测系统的性能主要取决于数据采集和数据处理两个方面。数据采集是指使用一些检测技术获取交通流参数。数据处理是指通过一些算法对获取的交通流参数进行分析,以判断是否有事件发生,并确定事件发生的位置。因此,为了提高事件检测系统的可靠性和有效性应从两个方面进行改善——数据采集技术和数据处理算法。
从国内外以往的论文来看,使用基于线圈检测器获取交通流参数[4-6]的文献占了很大一部分。这主要是由于线圈检测系统已得到广泛使用,且现有的基于线圈检测器获取的标准数据库已比较完善,如美国加州的I-880数据库。但是线圈检测器也存在一些缺点:每个车道下面都需要安装线圈检测器,成本较高,且不能覆盖很大的区域;当车流拥堵、车间距小于3m时,检测器精度大幅度降低,甚至无法检测;埋置线圈的切缝软化了路面,使路面易损,在路面出现问题时容易造成线圈损坏,维护时需要封闭车道、开挖路面,花费的人力物力较大,且对道路的通行能力有一定的影响[7]。与此相比,基于视频的交通流参数检测快速简便、处理智能、覆盖范围广,一个摄像头可覆盖4-6个车道,检测范围50-150米,同时不会破坏路面、安装和维护无须中断交通,具有广阔的应用前景。
通过摄像机视频获得了实时准确的交通流参数之后,使用事件检测算法即可判断是否有交通事件发生。在数据处理算法方面,当今主流的方法是基于人工神经网络的和基于支持向量机SVM(Support Vector Machines)的交通事件检测算法。基于人工神经网络的事件检测算法是一种智能化的交通事件检测算法,它具有检测率高、误报率低等优点,但神经网络结构的确定没有统一准则,需要大量的学习样本,容易出现过拟合现象,模型的泛化能力不佳;而支持向量机具有完备的统计学习理论和出色的学习性能,不需要大量的学习样本就可以达到很高的检测率,且具有良好的泛化性,是目前广泛采用的一种交通事件检测方法[13]
参考文献:
[1]Barria J A,Thajchayapong S.Detection and Classification of Traffic Anomalies UsingMicroscopic Traffic Variables[J].IEEE TRANSACTIONS ON INTELLIGENTTRANSPORTATION SYSTEMS,2011,12(3):695–704.
[2]Shah S A,Kim H,Baek S,et al.System architecture of a decision support system forfreeway incident management in Republic of Korea[J].Transportation Research Part A:Policy and Practice,2008,42(5):799–810.
[3]Williams B M,Guin A.Traffic management center use of incident detection algorithms:Findings of a nationwide survey[J].IEEE TRANSACTIONS ON INTELLIGENTTRANSPORTATION SYSTEMS,2007,8(2):351–358.
[4]Chen S Y,Wang W,Henk van Zuylen.Construct support vector machine ensemble todetect traffic incident[J].Expert Systems with Applications,2009,36(8):10976–10986.
[5]刘海松,吴杰长,陈国钧.克隆选择优化的SVM模拟电路故障诊断方法[J].电子测量与仪器学报,2010,24(12):1132-1136
[6]覃频频.事件检测支持向量机模型与神经网络模型比较[J].计算机工程与应用,2006,34:214-217.
[7]尤三伟.高速公路常用车辆检测器的性能比较[J].甘肃科技.2008,24(1):83-85.
[8]吴聪,李勃,董蓉等.基于车型聚类的交通流参数视频检测[J].自动化学报,2011,37(5):569-576.
[9]Huang X,Tan Y,He X G.An Intelligent Multifeature Statistical Approach for theDiscrimination of Driving Conditions of a Hybrid Electric Vehicle[J].IEEETRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS,2011,12(2):453–465.
[10]田有文,王立地,姜淑华.基于图像处理和支持向量机的玉米病害识别[J].仪器仪表学报,2007,27(6):2123-2124.
[11]尹玉梅,胡中华,湛金辉.基于支持向量机(SVM)的汽车车型识别[J].电子测量技术,2008,31(7):22-25.
[12]刘卫宁,曾恒,孙棣华等.基于视频检测技术的交通拥挤判别模型[J].计算机应用研究,2010,27(8):3006-3008.
[13]康海贵,李明伟,周鹏飞等.基于混沌高效遗传算法优化SVM的交通量预测[J].武汉理工大学学报:交通科学与工程版,2011,35(4):649-653.
[14]欧阳俊,陆锋,刘兴权等.基于多核混合支持向量机的城市短时交通预测[J].中国图象图形学报,2010,15(11):1688-1695.
[15]苗静,姚金杰,苏新彦.基于改进惯性权重PSO算法的目标位置测量技术[J].国外电子测量技术,2010,29(2):23-25.
发明内容
本发明要解决的问题是:现有交通事件检测系统的数据处理所采用的间接事件检测方法中,基于支持向量机SVM(Support Vector Machines)的交通事件检测方法具有广阔的应用前景,在此基础上提出一种基于改进的网格搜索算法优化的SVM高速公路交通事件检测方法。
本发明的技术方案为:基于优化SVM的高速公路交通事件检测方法,在待检测路段的上下游设置PTZ视频摄像机,通过摄像机视频获取交通流参数,采用基于支持向量机SVM的交通事件检测算法,根据待检测路段上下游交通流参数的变化判断是否有交通异常或交通事件发生,实时检测交通事件,包括以下步骤:
1)通过高速公路摄像机视频采集待检测路段的交通流参数,所述交通流参数为占有率和速度;
2)将获取的交通流参数与事件数据库融合,所述事件数据库为已有的交通事件历史数据,将融合后的数据按交通情况分组,每一组分为训练数据集和测试数据集两部分,训练数据集和测试数据集各自都包含事件状态和非事件状态数据;
3)根据步骤2)分组的数据,针对每一组分别建立支持向量机SVM事件检测模型,简称SVM模型,所用的SVM模型选择径向基RBF核函数,并采用改进的网格搜索算法对各SVM模型的惩罚参数C和核参数γ进行优化选择;
所述改进的网格搜索算法步骤如下:
31)粗估计SVM模型的惩罚参数C和核参数γ的范围,作为惩罚参数C和核参数γ的初始搜索范围,并根据搜索范围确定搜索步长L;
32)以惩罚参数和核参数为坐标系的坐标,根据步骤31)选定的C、γ初始搜索范围构成一个二维网格,以训练数据集为样本,按照交叉验证的方法计算样本预测准确率,即根据二维网格中的每一组惩罚参数和核参数的值,计算得到对应的预测准确率,预测准确率最高的那组惩罚参数和核参数的值作为当前最优参数组合(C1、γ1);
33)根据当前最优参数组合(C1、γ1),以其为中心,扩展±L范围,得到新的搜索范围,进行进一步网格搜索,根据新的搜索范围调整搜索步长;
34)以惩罚参数和核参数为坐标系的坐标,根据步骤33)确定新的搜索范围构成一个新的二维网格,对应新的二维网格上每一组的惩罚参数和核参数的值,以训练数据集为样本,按照交叉验证的方法计算样本预测准确率;
35)从步骤34)计算得到的结果中,选择一组使得预测准确率最高的惩罚参数和核参数值作为最优的C、γ;
4)用每一组的训练数据集对针对该组建立的SVM模型进行训练,得到确切的SVM模型的决策函数;使用训练好的各SVM模型对所对应组的测试数据集进行事件状态和非事件状态的分类,根据分类结果与测试数据集的实际数据检验SVM模型的性能,得到对应不同交通情况的SVM模型;
5)根据待检测路段的具体交通情况选择对应的SVM模型作为交通事件检测模型,对实时采集的待检测路段交通流参数进行检测判断。
步骤1)中,高速公路上每隔1km设置一个PTZ视频摄像机,通过高速公路摄像机视频采集交通流参数的时间间隔为1min。
步骤2)中,训练数据集和测试数据集中的每一个数据为一个15维的向量,包括待检测路段下游摄像机在t、t-1、t-2时刻检测到的速度、占有率参数,上游摄像机在t、t-1、t-2、t-3时刻检测到的速度、占有率参数,以及状态标志位,所述状态标志位中,1表示事件状态,-1表示非事件状态。
步骤3)选取的支持向量机SVM事件检测模型的输入为一个14维的向量,包括待检测路段下游摄像机在t、t-1、t-2时刻检测到的速度、占有率参数和上游摄像机在t、t-1、t-2、t-3时刻检测到的速度、占有率参数,输出为状态标志位。
步骤4)的训练为:根据步骤3)建立的基本SVM模型及其惩罚参数C和核参数γ,在训练样本集上采用SVM的方法构造分类器,得到确切的SVM模型的决策函数:
引入非线性映射函数φ(X),将输入的数据映射到高维属性空间,将原来的具有n个训练样本的训练数据集T={(X1,y1),(X2,y2),…,(Xn,yn)}转化成S={(φ(X1),y1),(φ(X2),y2),…,(φ(Xn),yn)},式中,Xi,i=1…n为SVM模型的输入向量,为d维向量,yn为状态标志位,1表示事件状态,-1表示非事件状态;
利用训练数据集对SVM模型进行训练的目标是寻找一个超平面,使得采用SVM模型对训练数据集中的事件状态和非事件状态两类样本进行判别时,两类样本完全分开,该超平面描述如式(1)所示:
w·X+b=0    (1)
式中,w∈Rd,为超平面的法向量,b∈R,为超平面的参数,R指实数集,Rd指d维的实数空间,X表示该超平面;
对于任意一个训练样本应满足式(2)的条件:
yi(w·φ(Xi)+b)≥1-ξi    (2)
式中,yi表示第i个训练样本的状态标志位,φ(Xi)表示转换后的输入向量,ξi≥0,表示第i个训练样本(φ(Xi),yi)的松弛变量,i=1,2,…,n;
根据结构风险最小化原则,将超平面的问题转化为式(3)的优化问题:
min 1 2 | | w | | 2 + C Σ i = 1 n ξ i s . t . y i ( w · φ ( X i ) + b ) ≥ 1 - ξ i , ξ i ≥ 0 , i = 1,2 , . . . , n - - - ( 3 )
式中,C为惩罚参数,表示对错分样本的惩罚程度,
采用拉格朗日乘子法将式(3)的优化问题转换为一个对偶问题,如式(4)所示,其中,αi是拉格朗日乘子,且αi≥0:
max L ( α ) = Σ i = 1 n α i - 1 2 Σ i = 1 n Σ j = 1 n α i α j y i y j ( φ ( X i ) φ ( X j ) ) s . t . 0 ≤ α i ≤ C , Σ i = 1 n α i y i = 0 , i = 1,2 , . . . , n - - - ( 4 )
引入径向基RBF核函数K(Xi,Xj)=exp(-γ||Xi-Xj||2),将式(4)转化为:
min L ( α ) = 1 2 Σ i = 1 n Σ j = 1 n α i α j y i y j K ( X i , X j ) - Σ i = 1 n α i s . t . 0 ≤ α i ≤ C , Σ i = 1 n α i y i = 0 , i = 1,2 , . . . , n - - - ( 5 )
式(5)得到最优解α*=(α1 *2 *,…,αn *)T,其中,拉格朗日乘子αi大于0的样本被称为支持向量,w表示为:
w = Σ ∀ i , α i * > 0 α i * y i φ ( X i ) - - - ( 6 )
式(1)的另外一个参数b的最优解b*通过式(7)求得:
w · φ ( X p ) + b p = 1 w · φ ( X q ) + b q = - 1 ⇒ b * = b p + b q 2 - - - ( 7 )
式中,φ(Xp)和φ(Xq)是训练数据集中任意一对事件状态数据和非事件状态数据的支持向量,bp是通过事件状态数据中的一个向量求得的参数b的值,bq是通过非事件状态数据中的一个向量求得的参数b的值,
综上可得,最优分类决策函数为:
f ( X ) = sgn [ Σ ∀ i , α i > 0 α i * y i K ( X i , X ) + b * ] - - - ( 8 )
所述最优分类决策函数即为SVM模型训练得到的结果,之后用它来进行步骤5)的实时的交通事件检测。
本发明提出了一种基于优化SVM的交通事件检测方法。通过高速公路摄像机视频获取交通流参数,解决了线圈检测器在车流拥堵、车间距小于3m时,检测器精度大幅度降低,甚至无法检测等问题,大大提高了交通流参数采集的准确率;利用支持向量机完备的统计学习理论和出色的学习性能,实现对高速公路全程无盲区的交通事件检测;采用改进的网格搜索算法对SVM事件检测模型的惩罚参数C和核参数γ进行优化选择,使得模型的检测率大于90%,误报警率不高于5%,且优化时间短,满足了交通事件检测实时性的要求。本发明针对不同的交通情况建立对应的SVM模型进行检测,检测正确率高,适应性好,且易于实现。
附图说明
图1为本发明方法的框架图。
图2为本发明中交通事件检测SVM模型的结构图。
具体实施方式
为使发明的目的、特征更明显易懂,下面结合附图与具体实施方式对本技术方案作进一步说明。
本发明的交通事件检测方法流程如图1所示,详细实施方式如下:
1)通过高速公路摄像机视频采集时间间隔为1min的交通流参数——占有率和速度;这里交通流参数的获取为现有技术,例如参考文件[8]吴聪,李勃,董蓉等.基于车型聚类的交通流参数视频检测[J].自动化学报,2011,37(5):569-576.所记载的方法,不再详述;
2)将获取的交通流参数与事件数据库融合,所述事件数据库为交通事件的历史数据,数据集的划分数量上一般训练数据集取大量,测试数据集取少量数据,例如本发明实施例所有数据来自于美国加州I-880数据库,划分为以下分组:从所有数据中每取一周(周一至周五)的数据作为训练数据集,包含事件和非事件状态,对应取下一周中的某两天(周一至周五中的某两天)的数据作为测试数据集,同样包含事件和非事件状态,按这样的方式共取三组数据;其中训练数据集取1000的数据量,测试数据集取200:
第一组中的训练数据来自I-880数据库中2月15日到19日的数据,包含事件状态231个,非事件状态769个,测试数据为2月24日和25日中的数据,包含事件状态48个,非事件状态152个;第二组中的数据来自3月1日到5日的数据,包含事件状态286个,非事件状态714个,测试数据为3月8日和10日中的数据,包含事件状态76个,非事件状态124个;第三组中的数据来自3月8日到12日的数据,包含事件状态255个,非事件状态745个,测试数据为3月18日和19日中的数据,包含事件状态53个,非事件状态147个。
训练数据集用于建立SVM模型,测试数据集用于检验建立的SVM模型,采集待检测路段的数据,再融合已有交通事件数据,并针对不同交通情况,可以确保后续建立的SVM模型对待检测路段的检测准确性。
3)根据步骤2)分组的数据,针对每一组分别建立支持向量机SVM事件检测模型,简称SVM模型,所用的SVM模型选择径向基RBF核函数,并采用改进的网格搜索算法对模型的惩罚参数C和核参数γ进行优化选择;不同组数据中的交通情况略有不同,因而为了预测的准确性,分别建立模型,其对应得到的优化参数也不尽相同;
4)用每一组的训练数据集对针对该组建立的SVM模型进行训练,得到确切的SVM模型的决策函数;使用训练好的各SVM模型对所对应组的测试数据集进行事件状态和非事件状态的分类,根据分类结果与测试数据集的实际数据检验SVM模型的性能,得到对应不同交通情况的SVM模型;
5)使用训练好的SVM模型对测试数据集进行事件状态和非事件状态的分类,检验模型的性能,模型的正确分类率越高,则在实时交通中正确检测到事件状态的概率越大,误报警率越小。实际检测应用时,选择待检测路段的部分历史数据进行SVM模型的训练,得到相应的事件检测模型,对实时采集的待检测路段交通流参数进行检测判断。
步骤2)中训练数据集和测试数据集中的每一个数据为一个15维的向量,包括待检测路段下游摄像机在t、t-1、t-2时刻检测到的速度、占有率参数,上游摄像机在t、t-1、t-2、t-3时刻检测到的速度、占有率参数,以及状态标志位,1表示事件状态,-1表示非事件状态。
SVM模型输入和分类器的构造过程如下:
模型输入:
由于高速公路上每隔1km有一个视频摄像机,所以车辆从上游视频摄像机到下游视频摄像机的平均行驶时间约为1min。如果下游摄像机在t、t-1、t-2时刻检测到的速度、占有率与上游摄像机在t-1、t-2、t-3时刻检测到的速度、占有率有较大的差别,那么这两个摄像机之间的路段上必有交通异常或者交通事件发生。因此,模型的输入定义为一个14维的向量,如表1所示。
表1模型输入
Figure BDA00001605077400081
这里按照高速公路上的最低时速为60km/h,则汽车从上游检测器行驶到下游检测器的时间约为1min,可以根据高速公路上检测器的间隔,对应换算采样的时间间隔。
步骤4)利用训练数据集对SVM模型进行训练,根据步骤3)建立的基本SVM模型及其惩罚参数C和核参数γ,在训练样本集上采用SVM的方法构造分类器,得到确切的SVM模型的决策函数。
确定了每一个训练样本的内容之后,也就是指15维的向量内容,就要在训练样本集上采用SVM的方法构造分类器,其模型结构如图2所示。
为了确保样本是线性可分的,需要引入非线性映射函数φ(X),将输入空间的数据映射到高维属性空间。因此,将原来的具有n个训练样本的数据集T={(X1,y1),(X2,y2),…,(Xn,yn)}转化成S={(φ(X1),y1),(φ(X2),y2),…,(φ(Xn),yn)}。式中,Xi是一个d维的输入向量,即SVM模型的输入向量,本发明中取d=14,yn为状态标志位。
由于目的是进行交通事件检测,即判断事件状态和非事件状态,故可将其视为一个二分类问题——事件状态标记为1,非事件状态标记为-1。因此,对训练样本进行学习的目标是寻找一个超平面,使得训练数据集中的两类样本完全分开。该超平面的描述如式(1)所示。
w·X+b=0    (1)
式中,w∈Rd,为分类面的法向量,b∈R,为分类面的参数,R指实数集,Rd指d维的实数空间,X表示该超平面。
对于任意一个训练样本应满足式(2)的条件:
yi(w·φ(Xi)+b)≥1-ξi    (2)
式中,yi表示第i个训练点的状态标志位,φ(Xi)表示转换后的输入向量,ξi≥0,表示第i个训练样本(φ(Xi),yi)的松弛变量,i=1,2,…,n。
根据结构风险最小化原则,将最优分类面的问题转化为式(3)的优化问题:
min 1 2 | | w | | 2 + C Σ i = 1 n ξ i s . t . y i ( w · φ ( X i ) + b ) ≥ 1 - ξ i , ξ i ≥ 0 , i = 1,2 , . . . , n - - - ( 3 )
式中,C是一个惩罚参数,表示对错分样本的惩罚程度。适当的C值可以使学习机器在推广能力和训练误差之间达到折衷,从而提高机器学习的性能,本发明通过改进的网格算法对惩罚参数C进行了优化选择。
采用拉格朗日乘子法将式(3)的优化问题转换为一个对偶问题,如式(4)所示。其中,αi是拉格朗日乘子,且αi≥0。
max L ( α ) = Σ i = 1 n α i - 1 2 Σ i = 1 n Σ j = 1 n α i α j y i y j ( φ ( X i ) φ ( X j ) ) s . t . 0 ≤ α i ≤ C , Σ i = 1 n α i y i = 0 , i = 1,2 , . . . , n - - - ( 4 )
径向基RBF(Radial Basic Function)核函数,又称高斯核函数,可以将样本映射到一个更高维的空间,可以处理类标签和特征之间是非线性关系时的样例,且在先验信息缺乏的情况下仍然具有良好的泛化能力。因此,引入RBF核函数K(Xi,Xj)=exp(-γ||Xi-Xj||2),将式(4)转化为:
min L ( α ) = 1 2 Σ i = 1 n Σ j = 1 n α i α j y i y j K ( X i , X j ) - Σ i = 1 n α i s . t . 0 ≤ α i ≤ C , Σ i = 1 n α i y i = 0 , i = 1,2 , . . . , n - - - ( 5 )
式(5)可以得到最优解α*=(α1 *2 *,…,αn *)T。其中,拉格朗日乘子αi大于0的样本被称为支持向量(Support Vectors),故w可以表示为:
w = Σ ∀ i , α i * > 0 α i * y i φ ( X i ) - - - ( 6 )
式(1)的另外一个参数b的最优解b*通过式(7)求得:
w · φ ( X p ) + b p = 1 w · φ ( X q ) + b q = - 1 ⇒ b * = b p + b q 2 - - - ( 7 )
式中,φ(Xp)和φ(Xq)是训练数据集中任意一对事件状态数据和非事件状态数据的支持向量,bp是通过事件状态数据中的一个向量求得的参数b的值,bq是通过非事件状态数据中的一个向量求得的参数b的值。
综上可得,最优分类决策函数为:
f ( X ) = sgn [ Σ ∀ i , α i > 0 α i * y i K ( X i , X ) + b * ] - - - ( 8 )
所述最优分类决策函数即为SVM模型训练得到的结果,之后用它来进行步骤5)的实时的交通事件检测。
本发明所用的支持向量机SVM模型选择径向基RBF核函数,并采用改进的网格搜索算法对SVM模型的惩罚参数C和核参数γ进行优化选择;
所述改进的网格搜索算法步骤如下:
31)粗估计SVM模型的惩罚参数C和核参数γ的范围,作为惩罚参数C和核参数γ的初始搜索范围,并根据搜索范围确定搜索步长L;如:C∈[2-8,28],γ∈[2-8,28],搜索步长L均为22
32)以惩罚参数和核参数为坐标系的坐标,根据步骤31)选定的C、γ初始搜索范围构成一个二维网格,以训练数据集为样本,按照交叉验证的方法计算样本预测准确率,即根据二维网格中的每一组惩罚参数和核参数的值,计算得到对应的预测准确率,预测准确率最高的那组惩罚参数和核参数的值作为当前最优参数组合(C1、γ1),设为(24,2-4);
交叉验证就是将训练数据集划分为大部分数据和一小部分,小部分的数据用来预测结果的正确分类率;对应网格中的每一对参数组合C、γ的值,可以计算得到对应的预测结果的正确分类率,也就是预测准确率;预测结果的正确分类率最高的那组对应的C、γ的值作为最优参数组合;如果有多组的C和γ对应于最高的验证分类准确率,就选取能够达到最高验证分类准确率的组合中参数C最小的那组C和γ作为最佳的参数,如果对应最小的C有多组γ,就选取搜索到的第一组C和γ作为最佳的参数。
33)根据当前最优参数组合(C1、γ1),以其为中心,扩展±L范围,得到新的搜索范围,进行进一步网格搜索,根据新的搜索范围调整搜索步长,此时搜索步长对应缩小,即在(24,2-4)附近正负22范围内进行更精细的网格搜索,新的搜索范围为:C∈[22,26],γ∈[2-6,2-2],搜索步长缩小为20.5
34)以惩罚参数和核参数为坐标系,根据步骤33)确定新的搜索范围构成一个新的二维网格,对应新的二维网格上每一组的惩罚参数和核参数的值,以训练数据集为样本,按照交叉验证的方法计算样本预测准确率;
35)从步骤34)计算得到的结果中,选择一组使得预测准确率最高的惩罚参数和核参数值作为最优的C、γ。
这里两次搜索基本可以确定参数的大小,而且已经能够达到很高的分类准确率。
下面通过具体实施例来说明本发明的实施。
实施例所用的数据来自江苏省宁通高速公路视频监控系统。测试平台为Inter(R)Core(TM)2 CPU 44002.00GHz、1G内存、Windows XP操作系统,使用Matlab2009a进行仿真模拟。
本实施例从系统数据库中选取了3组数据进行测试,仅提取与事件检测相关的流量、速度、占有率三类交通流参数,每组中有1000个训练样本和200个测试样本,详细情况见表2。
表2数据的构成情况
为了对事件检测算法进行更好地比较,使用以下3个评价指标:检测率DR(DetectionRate),误报警率FAR(False Alarm Rate)和正确分类率CR(Classification Rate)。
检测率DR是指在一定的时间段内,算法检测到的事件数占事件发生总数的比例:
DR = DN AN × 100 % - - - ( 9 )
式中,DN为时间T内算法检测到的事件数;AN为时间T内实际发生的事件总数。
误报警率FAR是指在一定的时间段内,算法检测误报警事件的次数与检测到的事件总数的比值:
FAR = FN DN × 100 % - - - ( 10 )
式中,FN为时间T内误报警事件的次数;DN为时间T内算法检测到的事件总数。
正确分类率CR是指在一组测试样本中,正确分类的样本所占的百分比。
CR = T true T total × 100 % - - - ( 11 )
式中,Ttrue为正确分类的样本总数,Ttotal为一组测试集的样本总数。
流量、速度、占有率三类交通流数据,若全部用于事件检测,则输入向量高达21维,导致训练时间较长,影响了事件检测的实时性。故本发明选取其中的两类数据作为输入,进行模型的训练和测试。此外,两类数据已能够很好地反映出交通事件对交通流参数变化的影响。
分别选取流量和占有率、速度和占有率作为事件检测模型的输入,并比较这两种方法的检测结果,如表3所示。
表3不同输入向量的检测结果
从表3可以看出,由于检测的路段有些位于高速公路的出入口附近,有些位于直道中间部分,车流量易发生突变,所以选取流量和占有率来检测高速公路交通事件的准确率较低;也正因为各路段情况有差异,所以普通阈值法的适用性不高,而选用支持向量机的方法能够很好地拟合出不同路段的历史数据情况,准确地判断出事件和非事件状态。
本发明采用SVM模型进行交通事件检测,对于SVM模型参数的优化方法主要有GA遗传算法[13]、PSO粒子群算法、Grid Search网格搜索算法等。网格搜索算法能同时搜索多个参数值,对相互独立的参数对进行并行搜索,故本发明采用此方法进行模型参数的优化选择。
基本的网格搜索算法是选定一组惩罚参数C和核参数γ的搜索范围,如C∈[2-8,28],γ∈[2-8,28],搜索步长均为20.5,对这1089组(33×33=1089)C、γ的值按照交叉验证的方法计算出样本预测准确率,最后从中选择出样本预测准确率最高的一组C、γ值作为最优参数。由此可见,完成一个完全的网格搜索算法所需的时间较长。
为了提高基于SVM的交通事件检测算法的检测率,本发明还提出一种改进的网格优化算法,对惩罚参数C和核参数γ进行优化,能够明显提高事件检测率,同时优化的时间很短,不影响事件检测的实时性,同时误报警率低。
在SVM事件检测模型中,RBF核函数的惩罚参数C和核参数γ会直接影响分类器的准确率和泛化性。下面采用本发明改进的网格搜索算法分别对4组训练数据集进行模型参数的优化选择,得到的C、γ值及对应的最优交叉验证率,参见表4。
表4本发明SVM参数优化值
Figure BDA00001605077400131
在本发明的SVM事件检测模型中,RBF核函数设定上表的C、γ值,然后进行模型训练与测试,检测结果如表5所示。
表5优化前后模型性能比较
Figure BDA00001605077400132
从表5可以看出,本发明优化后模型的检测率明显提高,同时误报警率不超过10%。
下面对不同优化算法进行对比。
选择第1组数据,分别使用遗传算法GA、粒子群算法PSO和现有技术的基本网格搜索算法Grid-Search对SVM模型的参数进行优化选择,并比较它们的检测结果,如表6所示。
表6不同优化算法性能对比
Figure BDA00001605077400133
从表6可以看出,本发明使用改进的网格搜索算法进行参数优化的时间比遗传算法和粒子群算法短很多,而且其检测效果也是最好的,检测率高的同时保证了较低的误报警率。因此,本发明提出的网格搜索算法不仅满足了实时性检测的要求,还大大提高了事件的检测率,具有很好的泛化性,能够适用于高速公路事件检测。
本发明提出了一种基于视频交通流参数的SVM交通事件检测方法。借助于先进的图像处理技术和模式识别技术,从高速公路摄像机视频中获取实时准确的交通流参数,具有快速简便、处理智能、覆盖范围广、获取信息全面等优点,克服了线圈检测器的不足。同时,采用改进的网格搜索算法对SVM事件检测模型进行参数优化选择,进一步提高了检测率和正确分类率。通过实验比较,提出的网格优化SVM算法具有最高的检测率和较低的误报警率,而且优化时间短,适用于高速公路交通事件检测。经过测试表明,本发明基于优化SVM的交通事件检测算法能够快速准确的判断出是否有交通异常或交通事件发生,检测率在90%以上,误报警率低于5%,同时检测时间短,能够很好地应用于高速公路交通管理系统中。

Claims (5)

1.基于优化SVM的高速公路交通事件检测方法,在待检测路段的上下游设置PTZ视频摄像机,通过摄像机视频获取交通流参数,采用基于支持向量机SVM的交通事件检测算法,根据待检测路段上下游交通流参数的变化判断是否有交通异常或交通事件发生,实时检测交通事件,其特征是包括以下步骤:
1)通过高速公路摄像机视频采集待检测路段的交通流参数,所述交通流参数为占有率和速度;
2)将获取的交通流参数与事件数据库融合,所述事件数据库为已有的交通事件历史数据,将融合后的数据按交通情况分组,每一组分为训练数据集和测试数据集两部分,训练数据集和测试数据集各自都包含事件状态和非事件状态数据;
3)根据步骤2)分组的数据,针对每一组分别建立支持向量机SVM事件检测模型,简称SVM模型,所用的SVM模型选择径向基RBF核函数,并采用改进的网格搜索算法对各SVM模型的惩罚参数C和核参数γ进行优化选择;
所述改进的网格搜索算法步骤如下:
31)粗估计SVM模型的惩罚参数C和核参数γ的范围,作为惩罚参数C和核参数γ的初始搜索范围,并根据搜索范围确定搜索步长L;
32)以惩罚参数和核参数为坐标系的坐标,根据步骤31)选定的C、γ初始搜索范围构成一个二维网格,以训练数据集为样本,按照交叉验证的方法计算样本预测准确率,即根据二维网格中的每一组惩罚参数和核参数的值,计算得到对应的预测准确率,预测准确率最高的那组惩罚参数和核参数的值作为当前最优参数组合(C1、γ1);
33)根据当前最优参数组合(C1、γ1),以其为中心,扩展±L范围,得到新的搜索范围,进行进一步网格搜索,根据新的搜索范围调整搜索步长;
34)以惩罚参数和核参数为坐标系的坐标,根据步骤33)确定新的搜索范围构成一个新的二维网格,对应新的二维网格上每一组的惩罚参数和核参数的值,以训练数据集为样本,按照交叉验证的方法计算样本预测准确率;
35)从步骤34)计算得到的结果中,选择一组使得预测准确率最高的惩罚参数和核参数值作为最优的C、γ;
4)用每一组的训练数据集对针对该组建立的SVM模型进行训练,得到确切的SVM模型的决策函数;使用训练好的各SVM模型对所对应组的测试数据集进行事件状态和非事件状态的分类,根据分类结果与测试数据集的实际数据检验SVM模型的性能,得到对应不同交通情况的SVM模型;
5)根据待检测路段的具体交通情况选择对应的SVM模型作为交通事件检测模型,对实时采集的待检测路段交通流参数进行检测判断。
2.根据权利要求1所述的基于优化SVM的高速公路交通事件检测方法,其特征是步骤1)中,高速公路上每隔1km设置一个PTZ视频摄像机,通过高速公路摄像机视频采集交通流参数的时间间隔为1min。
3.根据权利要求1所述的基于优化SVM的高速公路交通事件检测方法,其特征是步骤2)中,训练数据集和测试数据集中的每一个数据为一个15维的向量,包括待检测路段下游摄像机在t、t-1、t-2时刻检测到的速度、占有率参数,上游摄像机在t、t-1、t-2、t-3时刻检测到的速度、占有率参数,以及状态标志位,所述状态标志位中,1表示事件状态,-1表示非事件状态。
4.根据权利要求3所述的基于优化SVM的高速公路交通事件检测方法,其特征是步骤3)选取的支持向量机SVM事件检测模型的输入为一个14维的向量,包括待检测路段下游摄像机在t、t-1、t-2时刻检测到的速度、占有率参数和上游摄像机在t、t-1、t-2、t-3时刻检测到的速度、占有率参数,输出为状态标志位。
5.根据权利要求1-4任一项所述的基于优化SVM的高速公路交通事件检测方法,其特征是步骤4)的训练为:根据步骤3)建立的基本SVM模型及其惩罚参数C和核参数γ,在训练样本集上采用SVM的方法构造分类器,得到确切的SVM模型的决策函数:
引入非线性映射函数Ф(X),将输入的数据映射到高维属性空间,将原来的具有n个训练样本的训练数据集T={(X1,y1),(X2,y2),…,(Xn,yn)}转化成S={(Ф(X1),y1),(Ф(X2),y2),…,(Ф(Xn),yn)},式中,Xi,i=1…n为SVM模型的输入向量,为d维向量,yn为状态标志位,1表示事件状态,-1表示非事件状态;
利用训练数据集对SVM模型进行训练的目标是寻找一个超平面,使得采用SVM模型对训练数据集中的事件状态和非事件状态两类样本进行判别时,两类样本完全分开,该超平面描述如式(1)所示:
w·X+b=0       (1)
式中,w∈Rd,为超平面的法向量,b∈R,为超平面的参数,R指实数集,Rd指d维的实数空间,X表示该超平面;
对于任意一个训练样本应满足式(2)的条件:
yi(w·φ(Xi)+b)≥1-ξi                (2)
式中,yi表示第i个训练样本的状态标志位,Ф(Xi)表示转换后的输入向量,ξi≥0,表示第i个训练样本(Ф(Xi),yi)的松弛变量,i=1,2,…,n;
根据结构风险最小化原则,将超平面的问题转化为式(3)的优化问题:
min 1 2 | | w | | 2 + C Σ i = 1 n ξ i s . t . y i ( w · φ ( X i ) + b ) ≥ 1 - ξ i ξ i ≥ 0 . i = 1,2 , . . . , n - - - ( 3 )
式中,C为惩罚参数,表示对错分样本的惩罚程度,
采用拉格朗日乘子法将式(3)的优化问题转换为一个对偶问题,如式(4)所示,其中,αi是拉格朗日乘子,且αi≥0:
max L ( α ) = Σ i = 1 n α i - 1 2 Σ i = 1 n Σ j = 1 n α i α j y i y j ( φ ( X i ) φ ( X j ) ) s . t . 0 ≤ α i ≤ C , Σ i = 1 n α i y i = 0 , i = 1,2 , . . . n - - - ( 4 )
引入径向基RBF核函数K(Xi,Xj)=exp(-γ||Xi-Xj||2),将式(4)转化为:
min L ( α ) = 1 2 Σ i = 1 n Σ j = 1 n α i α j y i y j K ( X i , X j ) - Σ i = 1 n α i s . t 0 ≤ α i ≤ C , Σ i = 1 n α i y i = 0 , i = 12 , . . . , n - - - ( 5 )
式(5)得到最优解α*=(α1 *2 *,…,αn *)T,其中,拉格朗日乘子αi大于0的样本被称为支持向量,w表示为:
w = Σ ∀ i , α i * > 0 α i * y i φ ( X i ) - - - ( 6 )
式(1)的另外一个参数b的最优解b*通过式(7)求得:
w · φ ( X p ) + b p = 1 w · φ ( X q ) + b q = - 1 ⇒ b * = b p + b q 2 - - - ( 7 )
式中,Ф(Xp)和Ф(Xq)是训练数据集中任意一对事件状态数据和非事件状态数据的支持向量,bp是通过事件状态数据中的一个向量求得的参数b的值,bq是通过非事件状态数据中的一个向量求得的参数b的值,
综上可得,最优分类决策函数为:
f ( X ) = sgn [ Σ ∀ i , α i > 0 α i * y i K ( X i , X ) + b * ]
所述最优分类决策函数即为SVM模型训练得到的结果,之后用它来进行步骤5)的实时的交通事件检测。
CN201210137537.3A 2012-05-04 2012-05-04 基于优化svm的高速公路交通事件检测方法 Expired - Fee Related CN102682601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210137537.3A CN102682601B (zh) 2012-05-04 2012-05-04 基于优化svm的高速公路交通事件检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210137537.3A CN102682601B (zh) 2012-05-04 2012-05-04 基于优化svm的高速公路交通事件检测方法

Publications (2)

Publication Number Publication Date
CN102682601A CN102682601A (zh) 2012-09-19
CN102682601B true CN102682601B (zh) 2014-02-26

Family

ID=46814446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210137537.3A Expired - Fee Related CN102682601B (zh) 2012-05-04 2012-05-04 基于优化svm的高速公路交通事件检测方法

Country Status (1)

Country Link
CN (1) CN102682601B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880881A (zh) * 2012-09-25 2013-01-16 常州大学 一种基于二类支持向量机和遗传算法的轿车车型识别方法
CN102945603B (zh) * 2012-10-26 2015-06-03 青岛海信网络科技股份有限公司 检测交通事件的方法及电子警察装置
CN103745229A (zh) * 2013-12-31 2014-04-23 北京泰乐德信息技术有限公司 一种基于svm的轨道交通故障诊断方法及系统
CN103927874A (zh) * 2014-04-29 2014-07-16 东南大学 基于欠抽样面向不平衡数据集的交通事件自动检测方法
CN106100922B (zh) * 2016-06-12 2019-07-16 中车青岛四方机车车辆股份有限公司 列车通信网络的网络流量的预测方法和装置
CN108091132B (zh) * 2016-11-22 2021-08-06 中国移动通信有限公司研究院 一种交通流量预测方法及装置
CN107066953B (zh) * 2017-03-22 2019-06-07 北京邮电大学 一种面向监控视频的车型识别、跟踪及矫正方法和装置
CN107146415B (zh) * 2017-07-05 2020-03-10 廊坊师范学院 一种交通事件检测与定位方法
CN107833311A (zh) * 2017-11-15 2018-03-23 中国联合网络通信集团有限公司 一种共享单车的故障检测方法及平台
CN108280414A (zh) * 2018-01-17 2018-07-13 重庆大学 一种基于能量特征的运动想象脑电信号的识别方法
CN108197668A (zh) * 2018-01-31 2018-06-22 达闼科技(北京)有限公司 模型数据集的建立方法及云系统
CN108734959A (zh) * 2018-04-28 2018-11-02 扬州远铭光电有限公司 一种嵌入式视觉车流分析方法及系统
CN108765951B (zh) * 2018-06-11 2020-11-10 广东工业大学 基于蝙蝠算法支持向量机的高速公路交通状态识别方法
CN111145535B (zh) * 2019-11-28 2020-12-15 银江股份有限公司 一种复杂场景下的行程时间可靠性分布预测方法
CN110910641A (zh) * 2019-12-02 2020-03-24 北京航空航天大学 一种基于神经网络的高速公路交通运行实时风险评估方法
CN110969857B (zh) * 2019-12-27 2021-11-19 华为技术有限公司 一种交通信息处理方法及装置
CN111784679A (zh) * 2020-07-06 2020-10-16 金陵科技学院 一种基于cnn和svm的挡土墙裂缝识别方法
CN111862605B (zh) * 2020-07-20 2022-03-08 腾讯科技(深圳)有限公司 路况检测方法、装置、电子设备及可读存储介质
CN111856209A (zh) * 2020-07-23 2020-10-30 广东电网有限责任公司清远供电局 一种输电线路故障分类方法及装置
CN113192322B (zh) * 2021-03-19 2022-11-25 东北大学 一种基于云边协同的高速公路交通流量计数方法
CN113063314B (zh) * 2021-03-23 2022-03-22 哈尔滨工程大学 基于svm和ga-svm支持向量机的火炮发射系统故障诊断方法
CN113313145B (zh) * 2021-05-10 2024-03-15 东南大学 一种基于混合核相关向量机的快速道路交通事件检测方法
CN115457770A (zh) * 2022-09-01 2022-12-09 广东省路桥建设发展有限公司 一种基于模拟仿真和高低位融合布设的高速公路监控

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2231753A (en) * 1989-05-05 1990-11-21 Golden River Ltd Traffic incident monitoring with vido cameras
AU5385601A (en) * 2000-03-15 2001-09-24 Raytheon Co Predictive automatic incident detection using automatic vehicle identification
CN101706996A (zh) * 2009-11-12 2010-05-12 北京交通大学 一种基于信息融合的高速公路交通状态识别方法
CN102436740A (zh) * 2011-09-29 2012-05-02 东南大学 一种高速公路交通事件自动检测方法

Also Published As

Publication number Publication date
CN102682601A (zh) 2012-09-19

Similar Documents

Publication Publication Date Title
CN102682601B (zh) 基于优化svm的高速公路交通事件检测方法
CN103839409B (zh) 基于多断面视觉传感聚类分析的交通流状态判别方法
CN103258213B (zh) 一种用于智能交通系统中的动态车辆车型识别方法
CN101216998B (zh) 基于模糊粗糙集的证据理论城市交通流信息融合方法
CN103971523B (zh) 一种山区道路交通安全动态预警系统
CN110189317A (zh) 一种基于深度学习的道路影像智能采集和识别方法
CN107330217B (zh) 一种基于rbfnn的中观油耗预测方法
CN108509954A (zh) 一种实时交通场景的多车牌动态识别方法
CN103593976A (zh) 基于检测器确定道路交通状态的方法及系统
CN103559508B (zh) 一种基于连续型Adaboost视频车辆检测方法
CN104914467A (zh) 提取分类模型道的地震相聚类分析方法
CN104749334A (zh) 基于模式识别的生物式异常水质评价系统设计方法
CN109164450B (zh) 一种基于多普勒雷达数据的下击暴流预测方法
CN115691120A (zh) 一种基于高速公路流水数据的拥堵识别方法及系统
Shen et al. Identification of accident blackspots on rural roads using grid clustering and principal component clustering
CN110400462A (zh) 基于模糊理论的轨道交通客流监测预警方法及其系统
CN106384507A (zh) 基于稀疏检测器的行程时间实时估计方法
CN114267173B (zh) 高速公路时空特征的多源数据融合方法、装置及设备
CN117173913A (zh) 基于不同时段车流量分析的交通控制方法及系统
CN115170611A (zh) 一种复杂交叉路口车辆行驶轨迹分析方法、系统及应用
CN115311229A (zh) 基于激光雷达的路面病害检测分类方法、系统和存储介质
Bao A multi-index fusion clustering strategy for traffic flow state identification
CN108053646B (zh) 基于时间敏感特征的交通特征获取方法、预测方法及系统
CN103914984B (zh) 一种基于单元-区间协作的城市道路交通状态分析方法
Chen et al. Road Roughness Level Identification Based on BiGRU Network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140226

Termination date: 20190504

CF01 Termination of patent right due to non-payment of annual fee