CN112562320A - 一种基于改进随机森林的自适应交通事件检测方法 - Google Patents

一种基于改进随机森林的自适应交通事件检测方法 Download PDF

Info

Publication number
CN112562320A
CN112562320A CN202011302842.4A CN202011302842A CN112562320A CN 112562320 A CN112562320 A CN 112562320A CN 202011302842 A CN202011302842 A CN 202011302842A CN 112562320 A CN112562320 A CN 112562320A
Authority
CN
China
Prior art keywords
detection
event
data
random forest
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011302842.4A
Other languages
English (en)
Inventor
程小洋
郭建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202011302842.4A priority Critical patent/CN112562320A/zh
Publication of CN112562320A publication Critical patent/CN112562320A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/052Detecting movement of traffic to be counted or controlled with provision for determining speed or overspeed
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/065Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Probability & Statistics with Applications (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于改进随机森林的自适应交通事件检测方法,该方法包括:获取检测周期T内车辆出入相邻两个ETC门架的数据;计算交通参数;基于k‑means聚类生成平衡样本集;利用平衡样本集训练随机森林模型;将实时交通参数作为输入向量输入建立好的随机森林模型并输出事件检测结果;根据检测结果计算误检率,然后根据误检率进行模型自适应性调整。本发明通过引入k‑means聚类抽样产生平衡样本,根据平衡样本生成随机森林,并且考虑了速度离散特征,以检测周期内的流量、平均速度和速度离散度作为输入向量,输入所生成的随机森林模型,进行实时事件检测,最后根据历史误检率对算法进行自适应调整,从而实现了交通事件的实时准确检测。

Description

一种基于改进随机森林的自适应交通事件检测方法
技术领域
本发明涉及一种基于改进随机森林的自适应交通事件检测方法,属于路段交通事件检测领域。
背景技术
随着国民人均汽车保有量的上升,加上道路网越来越复杂,道路交通事件频发,如交通拥挤、交通事故和道路施工等,不仅降低了道路通行能力,也危害着出行者的交通安全。准确实时的交通事件检测不仅可以为出行者提供及时准确的道路事件信息,使出行者合理规划出行路线,从而保证道路通行能力,也可以使管理者及时获取事件信息,对道路交通事件进行迅速处理,从而减少交通延误,避免二次事故的发生,提升交通安全。因此,提升交通事件检测算法的准确性和实时性具有重要意义。
随着人工智能技术的飞速发展,人们开始将先进的人工智能算法应用到交通管理系统中来,有效地检测交通事件,并迅速响应和及时处置。代表算法有神经网络、模糊逻辑、随机森林、支持向量机和K近邻等,其中性能最好的是随机森林算法,具有训练速度快、不易过拟合、检测精度高的优点。但是对于不平衡样本集,随机森林算法的检测结果偏向于训练数据中数量较多的类别。由于交通事件数据属于不平衡样本,因此采用随机森林算法进行事件检测时必须对训练样本进行重抽样,产生平衡样本。
同时,以往采用人工智能算法进行的事件检测都没有考虑到算法随着时间改变发生的检测性能变化,这也是由人工智能算法训练时间过长这一缺点导致的。因此,虽然人工智能算法检测效率和检测精度高,但是很少应用于实际的道路交通事件检测系统中。基于此,研究人工智能算法的自适应性,对更加高效准确地检测交通事件以及提升事件检测算法在现实中的应用性具有重要意义。
发明内容
本发明所要解决的技术问题是:提供一种基于改进随机森林的自适应交通事件检测方法,针对传统基于随机森林的交通事件检测方法未考虑训练样本的数据平衡问题和算法的自适应调整问题,导致检测结果可靠度不高的缺点,提出了一种基于k-means聚类重抽样的改进随机森林交通事件检测算法,同时根据历史误检率对算法进行自适应调整,以提升事件检测的准确性和实时性。
本发明为解决上述技术问题采用以下技术方案:
一种基于改进随机森林的自适应交通事件检测方法,包括如下步骤:
步骤1,定义某相邻两个ETC门架之间的路段为检测路段,按车辆行驶方向将车辆先经过的ETC门架定义为上游门架,后经过的ETC门架定义为下游门架,获取检测周期T内进入上游门架的每辆车的车牌及对应的进入时间数据,获取检测周期T内离开下游门架的每辆车的车牌及对应的离开时间数据;
步骤2,根据步骤1获取的数据,计算检测周期T对应的交通参数,所述交通参数包括流量、路段平均速度和速度离散特征;
其中,速度离散特征的计算公式如下:
Figure BDA0002787448810000021
式中,cv表示速度离散特征,
Figure BDA0002787448810000022
表示路段平均速度,σv表示车速标准差,且
Figure BDA0002787448810000023
vi表示第i辆车的单车速度,n为在检测周期T内进入上游门架并离开下游门架的车辆总数即流量;
步骤3,针对上述检测路段,采用一周时间内以检测周期T为间隔所计算得到的交通参数以及每个检测周期T该检测路段的事件情况作为历史数据集,历史数据集中的每条数据包括:检测周期T的序号、流量、路段平均速度、速度离散特征和事件情况,事件情况为有事件或无事件;
步骤4,对历史数据集采用k-means聚类抽样生成平衡样本集,具体为:
步骤41,根据事件情况,将历史数据集分为两类:有事件数据集和无事件数据集;
步骤42,从有事件数据集中随机取出k条数据作为聚类中心,初始化聚类中心;
步骤43,利用欧式距离计算其他数据到聚类中心的距离,将有事件数据集中的其他数据分配到距离最近的类中,得到k个类别;
步骤44,重新计算各个聚类的中心,判断是否收敛,若否,则转入步骤43,若是,则进入步骤45;
步骤45,从无事件数据集中随机取出m条数据作为聚类中心,初始化为聚类中心,采用步骤43-44相同的方法对无事件数据集进行聚类,得到m个类别;
步骤46,使用过采样的方法对步骤43得到的k个类别进行过采样,得到正类过采样集合;
步骤47,根据正类过采样集合中正类的个数,计算负类的过采样个数,并从步骤45得到的m个类别中进行负类过采样,得到负类过采样集合,将正类过采样集合与负类过采样集合一起作为平衡样本集;
步骤5,对步骤4重复N次得到N个平衡样本集,用一个平衡样本集构建一个决策树,得到N个决策树,N个决策树的集合即为用于事件检测的随机森林模型;
步骤6,获取待检测的检测周期的交通参数,将交通参数输入用于事件检测的随机森林模型并输出事件检测结果;
步骤7,利用步骤5得到的模型对待检测的检测周期之前的第13个检测周期至第2028个检测周期进行事件检测,得到检测结果,与实际结果进行比较,计算误检率,根据误检率对模型进行自适应调整。
作为本发明的一种优选方案,步骤2所述路段平均速度的计算公式如下:
Figure BDA0002787448810000031
式中,
Figure BDA0002787448810000032
表示路段平均速度,n为在检测周期T内进入上游门架并离开下游门架的车辆总数即流量,vi表示第i辆车的单车速度,且
Figure BDA0002787448810000033
l表示检测路段的长度,t1表示第i辆车离开下游门架的时间,t2表示第i辆车进入上游门架的时间。
作为本发明的一种优选方案,步骤5所述用一个平衡样本集构建一个决策树,所采用的算法为决策树ID3算法。
作为本发明的一种优选方案,所述步骤7的具体过程如下:
步骤71,令待检测的检测周期为t,利用步骤5得到的模型对第t-13个检测周期至第t-2028个检测周期进行事件检测,得到检测结果;
步骤72,将检测结果与实际结果进行比较,计算误检率,误检率计算公式如下:
Figure BDA0002787448810000041
式中,FAR表示误检率,FA表示错误检测次数,Nt表示总检测次数;
步骤73,设定误检率阈值,若误检率未超过误检率阈值则进入下一检测周期进行事件检测,若超过误检率阈值则进入步骤74;
步骤74,对于第t-13个检测周期至第t-2028个检测周期,获取各检测周期的交通参数和事件情况,生成新的数据集;
步骤75,对新的数据集进行k-means聚类抽样生成新的平衡样本集,利用新的平衡样本集训练随机森林模型,得到新的用于事件检测的随机森林模型,用新的用于事件检测的随机森林模型进行下一检测周期的事件检测。
作为本发明的一种优选方案,所述误检率阈值的范围为0.87%-0.96%。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、在传统交通事件检测中,仅仅依靠宏观参数不能有效地描述车辆运行的个体差异性。速度离散特性作为交通流特性的基本特征,能够对交通状态的稳定性和差异性进行很好的描述,因此,本发明将速度离散指标引入交通事件检测有重要的意义。
2、传统的随机森林算法采用bootstrap抽样,但是本发明所采用的交通事件检测数据中有事件数据占极少数,而无事件数据占多数,存在明显的数据不均衡问题,因此通过bootstrap抽样会导致样本数据不均衡,从而会使算法检测结果偏向于占比多的样本。基于此,本发明针对交通事件数据采用k-means聚类抽样,生成平衡数据集。
3、传统的随机森林算法采用训练好的模型作为永久的检测算法,但是这样的模型难以适应复杂的交通环境,并且在交通模式与算法训练阶段的交通模式存在较大差异时,检测精度会明显降低。本发明通过提升算法的自适应性对提升检测率和降低误检率具有重要意义。
附图说明
图1是本发明一种基于改进随机森林的自适应交通事件检测方法的流程图。
图2是k-means聚类抽样流程图。
图3是随机森林训练流程图。
图4是算法自适应调整流程图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本发明针对传统基于随机森林的交通事件检测方法未考虑训练样本的数据平衡问题和算法的自适应调整问题,导致检测结果可靠度不高的缺点,提出了一种基于k-means聚类重抽样的随机森林时间检测算法,同时根据历史误检率对算法进行自适应调整,以提升事件检测的准确性和实时性。
本发明方法首先引入单车速度离散度指标。由于单车速度离散度指标的定义有多种,因此本发明将三种衡量单车速度离散度的指标均纳入考虑,全部作为输入变量进行事件检测。然后,采用k-means聚类抽样从原始数据集抽取平衡样本用于随机森林的训练,提高了检测精度。最后,采用历史误检率对随机森林模型进行实时调整,以增加随机森林算法自适应性,从而提高检测精度。如图1所示,包括如下步骤:
Step1:实时获取检测周期T内的车辆出入ETC门架数据,所述ETC门架数据为车辆经过检测路段上下游相邻两个ETC门架之间的交通数据,交通数据采集间隔为检测周期T,采集的数据包括车牌号和对应的进入检测路段上游ETC门架的时间、离开检测路段下游ETC门架的时间、检测路段长度。
Step2:计算交通参数,所述交通参数包括流量、路段平均速度和速度离散特征;计算方式如下:
流量n定义为在检测周期T内进入上游门架到离开下游门架的车辆总数;
路段平均速度
Figure BDA0002787448810000061
定义为在检测周期T内经过检测路段的所有车辆的单车速度的平均值,计算公式为:
Figure BDA0002787448810000062
式中,vi表示第i辆车的单车速度,n为在检测周期T内经过检测路段的车辆总数,第i辆车的单车速度vi的计算方式如下:
Figure BDA0002787448810000063
式中,vi表示第i辆车的速度;t1和t2分别表示汽车通过下游和上游相邻两个ETC门架的时间。
速度离散特征cv采用车速变异系数来衡量,计算公式如下:
Figure BDA0002787448810000064
式中,σv表示车速标准差;
Figure BDA0002787448810000065
表示交通流的平均速度。车速标准差σv的计算公式如下:
Figure BDA0002787448810000066
按照上述公式分别计算每个检测周期T内的交通参数,作为事件检测算法的输入变量,因此建立的用于交通事件检测的改进随机森林算法共有三个变量,共同形成输入向量
Figure BDA0002787448810000067
Step3:基于k-means聚类建立随机森林,主要包括K-means聚类抽样和随机森林建立两部分,具体如图2所示,主要步骤如下:
Step31:输入历史数据集。本发明所述历史数据集是由流量、路段平均速度和速度离散特征组成的。采用一周时间内以检测周期T为检测间隔所计算得到的交通参数数据集作为历史数据集。
Step32:采用k-means聚类抽样生成平衡样本集,用于随机森林的训练。具体如图2所示:
Step321:建立原始数据集。原始数据集包含的数据项有流量、路段平均速度、速度离散特征和事件情况inc。每个检测周期T设置为5min。所述事件情况inc,采用0-1进行表征,有事件为1,无事件为0。因此原始数据集是一个四维矩阵
Figure BDA0002787448810000071
Step322:根据有无事件,将原始数据集分为两组,有事件的一组数据记为数据集B1,无事件的一组数据记为数据集B2
Step323:从数据集B1中随机取出k个对象作为聚类中心。然后初始化聚类中心值。
Step324:分配各个数据对象到距离最近的类中。利用欧式距离公式计算每个对象到每个中心的距离,计算公式如下:
Figure BDA0002787448810000072
式中,O表示每个对象到每个中心的距离;J表示每个对象包含的元素数;xj和yj分别表示x和y这两个对象中的第j个元素。
Step325:重新计算各个聚类的中心。根据上一步的计算结果,可以得到每一组的元素,利用每一组元素的平均值计算新的聚类中心。
Step326:判断是否收敛,若否,转入Step323,若是,转入下一步。
Step327:从数据集B2中随机取出m个对象作为聚类中心,重复step325-step327。输出聚类后的结果。
Step328:使用过采样的方法分别对数据集B1聚类后的所有类别进行过采样得到正类过采样集合,然后根据正类的个数计算负类的过采样个数,并对数据集B2聚类后的所有类别进行负类过采样,从而得到负类过采样集合。
Step329:将正类和负类过采样集合的组合作为平衡样本集。
Step33:采用平衡样本集训练随机森林算法。采用S32所得到的均衡样本进行决策树构建,每个样本对应一个决策树。具体如图3所示:
Step331:对Step32重复N次,得到N个平衡样本集,将每个平衡样本集的80%作为训练数据,20%作为测试数据。并设置最大树深M和决策树数目N。
Step332:特征选取。随机抽取几个特征作为待选特征。
Step333:计算增益。根据下列熵值公式计算增益:
用D表示平衡样本集,整个平衡样本集的熵值计算公式如下:
Figure BDA0002787448810000081
式中,info(D)表示对于整个平衡样本集D的熵值;C表示有C个类别,对于整个平衡样本集D,该类别为事件是否发生,用1表示发生事件,用0表示未发生事件,因此此处C=2;pc表示第c类发生的概率,即有事件和无事件的概率。
条件熵值计算公式如下:
Figure BDA0002787448810000082
式中,infoA(D)表示将平衡样本集划分为X个独立的子数据集Dx时,整个平衡样本集D的熵值。对于流量特征,分为极高、高、中、低、极低5类,具体划分阈值对于不同路段取不同值;对于速度特征的划分,以120km/h作为最高速度,以20km/h为区间,划分为6类;对于单车速度离散特征,分为高、中、低三类,具体划分阈值对于不同路段取不同值。
增益计算公式如下:
Gain(A)=info(D)-infoA(D)
Step334:确定叶子节点和非叶子节点。优先选择增益最大的特征作为非叶子节点,其他特征作为叶子节点。
Step335:产生分支。对上一步确定的非叶子节点进一步划分产生分支。即进一步计算增益。
Step336:判断决策树是否停止生长。若达到最大深度,则停止生长,否则继续分支。
Step337:判断决策树数目是否达到要求。若达到要求,则停止建树,否则利用下一个平衡样本集继续建树。
Step338:采用测试集进行测试。以上步骤所产生的决策树的集合称为随机森林。
Step34:生成用于事件检测的随机森林模型。本发明采用所有决策树检测结果的众数作为事件检测的结果。
Step4:将实时检测到的交通参数输入Step3训练好的随机森林模型,然后输出事件检测结果。
Step5:根据检测结果计算历史误检率,然后根据历史误检率进行模型自适应性调整。具体如图4所示:
Step51:自动获取当前检测周期t之前的历史真实交通事件数据,由于无法获取前一检测周期的历史真实事件情况,但前一天的历史真实事件情况是可获取的,因此本发明获取的数据是检测周期t-13至t-2028之间的真实事件数据;
Step52:计算误检率FAR。误检率计算公式如下:
Figure BDA0002787448810000091
其中,FA表示错误检测次数,Nt表示总检测次数。
Step53:确定误检率阈值e。随机森林事件检测算法的误检率在0.87%-0.96%左右,因此本发明取误检率阈值e=0.96%。
Step54:判断误检率是否超过阈值。若误检率未超过阈值则进入下一周期的事件检测,若超过阈值则进行下一步操作。
Step55:获取t-13至t-2028之间各检测周期的交通参数和真实事件情况,生成新的数据集。
Step56:将新的数据集输入k-means聚类抽样模块,产生平衡数据集。将平衡数据集输入随机森林训练模块,生成新的随机森林。然后采用新生成的随机森林进行下一检测周期事件检测。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (5)

1.一种基于改进随机森林的自适应交通事件检测方法,其特征在于,包括如下步骤:
步骤1,定义某相邻两个ETC门架之间的路段为检测路段,按车辆行驶方向将车辆先经过的ETC门架定义为上游门架,后经过的ETC门架定义为下游门架,获取检测周期T内进入上游门架的每辆车的车牌及对应的进入时间数据,获取检测周期T内离开下游门架的每辆车的车牌及对应的离开时间数据;
步骤2,根据步骤1获取的数据,计算检测周期T对应的交通参数,所述交通参数包括流量、路段平均速度和速度离散特征;
其中,速度离散特征的计算公式如下:
Figure FDA0002787448800000011
式中,cv表示速度离散特征,
Figure FDA0002787448800000012
表示路段平均速度,σv表示车速标准差,且
Figure FDA0002787448800000013
vi表示第i辆车的单车速度,n为在检测周期T内进入上游门架并离开下游门架的车辆总数即流量;
步骤3,针对上述检测路段,采用一周时间内以检测周期T为间隔所计算得到的交通参数以及每个检测周期T该检测路段的事件情况作为历史数据集,历史数据集中的每条数据包括:检测周期T的序号、流量、路段平均速度、速度离散特征和事件情况,事件情况为有事件或无事件;
步骤4,对历史数据集采用k-means聚类抽样生成平衡样本集,具体为:
步骤41,根据事件情况,将历史数据集分为两类:有事件数据集和无事件数据集;
步骤42,从有事件数据集中随机取出k条数据作为聚类中心,初始化聚类中心;
步骤43,利用欧式距离计算其他数据到聚类中心的距离,将有事件数据集中的其他数据分配到距离最近的类中,得到k个类别;
步骤44,重新计算各个聚类的中心,判断是否收敛,若否,则转入步骤43,若是,则进入步骤45;
步骤45,从无事件数据集中随机取出m条数据作为聚类中心,初始化为聚类中心,采用步骤43-44相同的方法对无事件数据集进行聚类,得到m个类别;
步骤46,使用过采样的方法对步骤43得到的k个类别进行过采样,得到正类过采样集合;
步骤47,根据正类过采样集合中正类的个数,计算负类的过采样个数,并从步骤45得到的m个类别中进行负类过采样,得到负类过采样集合,将正类过采样集合与负类过采样集合一起作为平衡样本集;
步骤5,对步骤4重复N次得到N个平衡样本集,用一个平衡样本集构建一个决策树,得到N个决策树,N个决策树的集合即为用于事件检测的随机森林模型;
步骤6,获取待检测的检测周期的交通参数,将交通参数输入用于事件检测的随机森林模型并输出事件检测结果;
步骤7,利用步骤5得到的模型对待检测的检测周期之前的第13个检测周期至第2028个检测周期进行事件检测,得到检测结果,与实际结果进行比较,计算误检率,根据误检率对模型进行自适应调整。
2.根据权利要求1所述基于改进随机森林的自适应交通事件检测方法,其特征在于,步骤2所述路段平均速度的计算公式如下:
Figure FDA0002787448800000021
式中,
Figure FDA0002787448800000022
表示路段平均速度,n为在检测周期T内进入上游门架并离开下游门架的车辆总数即流量,vi表示第i辆车的单车速度,且
Figure FDA0002787448800000023
l表示检测路段的长度,t1表示第i辆车离开下游门架的时间,t2表示第i辆车进入上游门架的时间。
3.根据权利要求1所述基于改进随机森林的自适应交通事件检测方法,其特征在于,步骤5所述用一个平衡样本集构建一个决策树,所采用的算法为决策树ID3算法。
4.根据权利要求1所述基于改进随机森林的自适应交通事件检测方法,其特征在于,所述步骤7的具体过程如下:
步骤71,令待检测的检测周期为t,利用步骤5得到的模型对第t-13个检测周期至第t-2028个检测周期进行事件检测,得到检测结果;
步骤72,将检测结果与实际结果进行比较,计算误检率,误检率计算公式如下:
Figure FDA0002787448800000031
式中,FAR表示误检率,FA表示错误检测次数,Nt表示总检测次数;
步骤73,设定误检率阈值,若误检率未超过误检率阈值则进入下一检测周期进行事件检测,若超过误检率阈值则进入步骤74;
步骤74,对于第t-13个检测周期至第t-2028个检测周期,获取各检测周期的交通参数和事件情况,生成新的数据集;
步骤75,对新的数据集进行k-means聚类抽样生成新的平衡样本集,利用新的平衡样本集训练随机森林模型,得到新的用于事件检测的随机森林模型,用新的用于事件检测的随机森林模型进行下一检测周期的事件检测。
5.根据权利要求4所述基于改进随机森林的自适应交通事件检测方法,其特征在于,所述误检率阈值的范围为0.87%-0.96%。
CN202011302842.4A 2020-11-19 2020-11-19 一种基于改进随机森林的自适应交通事件检测方法 Pending CN112562320A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011302842.4A CN112562320A (zh) 2020-11-19 2020-11-19 一种基于改进随机森林的自适应交通事件检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011302842.4A CN112562320A (zh) 2020-11-19 2020-11-19 一种基于改进随机森林的自适应交通事件检测方法

Publications (1)

Publication Number Publication Date
CN112562320A true CN112562320A (zh) 2021-03-26

Family

ID=75044469

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011302842.4A Pending CN112562320A (zh) 2020-11-19 2020-11-19 一种基于改进随机森林的自适应交通事件检测方法

Country Status (1)

Country Link
CN (1) CN112562320A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114999181A (zh) * 2022-05-11 2022-09-02 山东高速建设管理集团有限公司 一种基于etc系统数据的高速公路车辆速度异常识别方法
CN115689040A (zh) * 2022-11-11 2023-02-03 浙江省交通运输科学研究院 基于卷积神经网络的交通事故严重程度预测方法及系统
CN115907567A (zh) * 2023-02-21 2023-04-04 浙江大学 基于鲁棒性随机分割森林算法的负荷事件检测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548196A (zh) * 2016-10-20 2017-03-29 中国科学院深圳先进技术研究院 一种针对非平衡数据的随机森林抽样方法及装置
CN109903554A (zh) * 2019-02-21 2019-06-18 长安大学 一种基于Spark的路网交通运行分析方法
CN111402583A (zh) * 2020-03-19 2020-07-10 阿里巴巴集团控股有限公司 一种交通事件的感知方法、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548196A (zh) * 2016-10-20 2017-03-29 中国科学院深圳先进技术研究院 一种针对非平衡数据的随机森林抽样方法及装置
CN109903554A (zh) * 2019-02-21 2019-06-18 长安大学 一种基于Spark的路网交通运行分析方法
CN111402583A (zh) * 2020-03-19 2020-07-10 阿里巴巴集团控股有限公司 一种交通事件的感知方法、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KAMEKIN: "不平衡数据集的处理", 《博客园》 *
刘擎超 等: "基于随机森林的交通事件检测方法设计与分析", 《JOURNAL OF SOUTHEAST UNIVERSITY(ENGLISH EDITION)》 *
杨霞霞 等: "基于改进随机森林算法的不平衡数据分类方法研究", 《网络安全技术与应用》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114999181A (zh) * 2022-05-11 2022-09-02 山东高速建设管理集团有限公司 一种基于etc系统数据的高速公路车辆速度异常识别方法
CN114999181B (zh) * 2022-05-11 2023-12-19 山东高速建设管理集团有限公司 一种基于etc系统数据的高速公路车辆速度异常识别方法
CN115689040A (zh) * 2022-11-11 2023-02-03 浙江省交通运输科学研究院 基于卷积神经网络的交通事故严重程度预测方法及系统
CN115907567A (zh) * 2023-02-21 2023-04-04 浙江大学 基于鲁棒性随机分割森林算法的负荷事件检测方法及系统
CN115907567B (zh) * 2023-02-21 2023-05-09 浙江大学 基于鲁棒性随机分割森林算法的负荷事件检测方法及系统

Similar Documents

Publication Publication Date Title
CN110728842B (zh) 基于路口车辆合理行驶范围的异常行驶预警方法
CN112562320A (zh) 一种基于改进随机森林的自适应交通事件检测方法
CN110097755B (zh) 基于深度神经网络的高速公路交通流量状态识别方法
CN111081016B (zh) 一种基于复杂网络理论的城市交通异常识别方法
CN109191922B (zh) 一种大规模四维航迹动态预测方法及装置
CN109218223B (zh) 一种基于主动学习的鲁棒性网络流量分类方法及系统
CN108985380B (zh) 一种基于聚类集成的转辙机故障识别方法
CN108597227B (zh) 高速公路收费站下道交通流量预测方法
CN109309382B (zh) 一种短期电力负荷预测方法
CN110070060B (zh) 一种轴承设备的故障诊断方法
CN109873779B (zh) 一种基于lstm的分级式无线信号调制类型识别方法
CN111582596A (zh) 融合交通状态信息的纯电动汽车续航里程风险预警方法
CN111598179B (zh) 电力监控系统用户异常行为分析方法、存储介质和设备
CN113378990B (zh) 基于深度学习的流量数据异常检测方法
CN111292534A (zh) 一种基于聚类与深度序列学习的交通状态估计方法
CN103345842A (zh) 一种道路车辆分型系统及方法
CN107025468A (zh) 基于pca‑ga‑svm算法的高速公路拥堵识别方法
CN112367303B (zh) 分布式自学习异常流量协同检测方法及系统
CN114299742B (zh) 一种高速公路的限速信息动态识别与更新推荐方法
CN112650204B (zh) 一种智慧轨道无人驾驶车辆故障基因识别方法及系统
CN112685459A (zh) 一种基于K-means集群算法的攻击源特征识别方法
CN115496163A (zh) 基于K-Means++、BP神经网络和孤立森林的建筑异常能耗检测方法
CN108681717B (zh) 城市级交通视频检测设备质量检测方法
CN116170208A (zh) 一种基于半监督isodata算法的网络入侵实时检测方法
CN109615027B (zh) 一种高速铁路沿线风速特征提取智能预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210326

RJ01 Rejection of invention patent application after publication