CN107392176A

CN107392176A - 一种基于kmeans的高效车辆检测方法

Info

Publication number: CN107392176A
Application number: CN201710679052.XA
Authority: CN
Inventors: 邝沛江; 李梦涵; 周智恒; 李波
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2017-08-10
Filing date: 2017-08-10
Publication date: 2017-11-24
Anticipated expiration: 2037-08-10
Also published as: CN107392176B

Abstract

本发明公开了一种基于kmeans的高效车辆检测方法，包括离线学习和实时检测的步骤，先利用离线学习过程得到的样本预处理的白化矩阵，用于在实时检测时样本的白化操作，避免不同分量的权重不一致带来的影响，然后利用训练样本训练K棵决策树，用于实时检测，得到检测目标；在实时检测中，利用简单特征挑选有可能是车辆的候选框，再进行kmeans特征提取，利用K棵决策树进行预测分类，得到检测目标。与现有技术相比，本发明具有提高了检测的精度，增强了实时性，降低误检，漏检的概率等优点。

Description

一种基于kmeans的高效车辆检测方法

技术领域

本发明涉及车辆检测技术，特别涉及一种基于kmeans的高效车辆检测方法，该检测方法是一种车辆候选物再验证的车辆检测方法。

背景技术

近年来，车辆增长的速度也已远远高于道路和其他交通设施的增长速度，交通事故频繁、人员伤亡与日俱增、财产损失巨大这都要求车辆不仅要具有良好的安全性而且要具备一定的智能性，随之智能车辆(Intelligent Vehicle)的概念应运而生。车辆检测是智能车辆研究领域中的重要组成部分,对于智能车辆的安全驾驶极为关键。目前国内外诞生的车辆检测器产品的种类很多，技术原理和实现方式各不相同，如有线圈检测、视频检测、微波检测、激光检测、声波检测、超声波检测、磁力检测、红外线检测等。其中的视频检测方法无需破坏路面，安装和维护比较方便，是目前车辆检测研究方向的热点。

视频检测技术是一种计算机视觉和图像处理技术，通过视频摄像机和计算机模仿人眼的功能，为实际应用提供实时交通信息的先进技术。在基于视频图像的检测技术中，机器学习方法由于识别性能高、鲁棒性好以及操作便捷而受到越来越多的关注。机器学习方法主要用于进行两类的分类识别：目标物或非目标物。将机器学习应用在车辆检测上一般采用的检测框架是滑动窗口法，即检验滑动窗口的位置是否是车辆。这样的方法耗时比较长，很难实现车辆的实时监测。因此，利用简单的特征先挑选出有可能是车辆的候选框，然后再进行深层次的特征提取再判断的检测框架被更多地运用在实时检测车辆的应用中。

在挑选车辆候选框的时候选用的特征都比较简单，因为简单的特征不需要太多的计算资源，因此能够从海量的位置中快速挑选出有可能是车辆的候选框。得到了一个包含很多车辆候选框的集合后，利用更加鲁棒和更加稠密的特征表示样本，再进行训练分类，就能够兼容实时性和精度两方面的要求。

特征提取是车辆检测中一个非常重要的环节，目的是为了降低车辆图像的维数，通过提取的特征在图像中检测车辆。特征提取的方法主要有：Haar小波特征提取、Haar-like特征提取、Gabor特征提取等等。一个鲁棒的图像特征能够很好的提升分类器的分类预测结果，然而传统的图像领域的车辆特征的设计需要图像专家丰富的经验，更新换代慢。因此利用无监督学习kmeans聚类的方法得到特征映射，能够从海量的无标签数据中得到鲁棒的特征提取方法。

发明内容

为了克服现有技术的上述缺点与不足，本发明的目的在于提供一种基于kmeans的高效车辆检测方法，该检测方法提高了检测的速度，降低误检，漏检的概率。

本发明的目的通过以下技术方案实现：

一种车辆候选物再验证的车辆检测方法，包括以下步骤：

S1、离线学习，具体包括以下步骤：

S1.1、从标记了车辆的自然图像中采集正负训练样本，并进行正负训练样本预处理，构成正样本集合P和负样本集合N；

S1.2、计算并记录正样本集合P中每个正样本的信息熵，形成正样本集合的信息熵分布；

S1.3、计算并记录负样本集合N中每个负样本的信息熵，形成负样本集合的信息熵分布；

S1.4、根据步骤S1.2和步骤S1.3得到的两个信息熵分布，确定信息熵阈值T；

S1.5、假设正样本集合P的大小为M_P，采取有放回的抽样方法从正样本集合P中抽取K个子集合P1,P2,...,PK，每个子集合的元素个数为M_P；

S1.6、假设负样本集合N的大小为M_N，采取有放回的抽样本法从负样本集合N中抽取K个子集合N1,N2,...,NK，每个子集合的元素个数为M_N；

S1.7、将步骤S1.5和步骤S1.6得到正样本集合P1,P2,...,PK和负样本N1,N2,...NK中每个样本进行kmeans特征提取，得到新的正样本集合P1’,P2’,...,PK’和新的负样本集合N1’,N2’,...,NK’，新的正样本集合和新的负样本集合形成K个包含正负训练样本的集合U＝{U1,U2,...,UK}，其中Ui＝{Pi’,Ni’}；

S1.8、利用步骤S1.7得到的集合U中的每个训练集Ui构建一棵决策树，并记录其准确率，最终得到K棵决策树F＝{f1,f2,...,fK}以及相应的准确率A＝{a1,a2,...,aK}；

S2、在线检测，具体包括以下步骤：

S2.1、假设候选物集合为S，将S初始化为空集；

S2.2、初始化滑动窗口的起点为图像左上顶点，滑动窗口的宽w为图像的宽的1/10，滑动窗口的高h为图像的高的1/10；

S2.3、计算滑动窗口对应的图像区域的信息熵H；

S2.4、将步骤S2.3得到信息熵H与步骤S1.4得到的信息熵阈值T做比较，若H>T，则记此滑动窗口为候选物，记为s＝(x,y,w,h)，其中x,y为滑动窗口的左上顶点的坐标，w,h分别为滑动窗口的宽和高，将候选物s＝(x,y,w,h)加入候选物集合S中；

S2.5、移动滑动窗口一个步长，重复步骤S2.3～S2.4直到滑动窗口完成遍历图像；

S2.6、调整滑动窗口的宽和高，重复步骤S2.2～S2.5直到完成遍历所有预设定的宽和高，预设定的宽为图像宽的9/10，预设定的高为图像高的9/10；

S2.7、经过步骤S2.1～S2.6后得到候选物集合S，利用步骤S1.8得到的K棵决策树F对候选物集合S中每一个候选物进行预测分类，若预测分类分类结果为车辆，则将此候选物s＝(x,y,w,h)在图像中进行画框标记。

步骤S1.1所述从标记了车辆的自然图像中采集正负训练样本的方法具体为：

自然图像I中标记了所有车辆的位置，每辆车辆记为vi＝(xi,yi,wi,hi)，其中xi,yi为车辆位置框的左上顶点，wi,hi为车辆位置框的宽和高，利用滑动窗口W＝(xj,yj,wj,hj)扫描自然图像I，如果滑动窗口与车辆位置框vi＝(xi,yi,wi,hi)重叠超过70％，则该滑动窗口对应的图像区域为正样本，否则为负样本。

步骤S1.1所述的正负训练样本图像预处理的具体方法为：

图像归一化处理：将每个样本图像其尺寸缩放之16×16×3，每个样本图像减去自身的均值并除以图像自身的标准差；

特征维度白化处理：每个样本图像进行完图像归一化处理之后，将每个样本图像拉成一行向量(1×768)，训练集中样本图像的每一个维度减去样本训练集中该维度的均值形成新的训练集，计算新的训练集的特征向量V和特征值D，得到白化矩阵

新的训练集(矩阵)右乘白化矩阵B完成特征维度白化处理。其中，ε＝0.05。

步骤S1.2和步骤S1.3所述的信息熵计算方法具体为：

将RGB图像进行灰度化，得到图像的灰度分布直方图，则图像的信息熵为：

其中，i表示灰度值，p(i)表示灰度分布直方图中灰度值的概率；

步骤S1.4所述的确定信息熵阈值T的方法具体为：

假设正样本集合P的信息熵分布包络线为Q_P，负样本集合N的信息熵分布包络线为Q_N，令Q_P＝Q_N，则可得信息熵阈值T；

步骤S1.7所述的kmeans特征提取的方法具体为：

从步骤S1.5的正样本集合P中利用Kmeans方法聚类形成800个类中心，记为c＝{c1,c2,...,c800}；对正样本集合Pi和负样本集合Ni中的每一个样本进行特征提取：

f_k(x)＝max{0,μ(z)-z_k}，

其中f_k(x)表示样本x的特征的第k维，z_k表示样本x到第k个聚类中心的欧式距离，μ(z)表示样本到各个聚类中心的平均距离；

步骤S2.6所述的移动一个步长的方法具体为：

假设滑动窗口W＝{xi,yi,wi,hi}，当滑动窗口向右移动时，步长取0.5×wi，当滑动窗口向下移动时，步长取0.5×hi；

步骤S2.7所述的调整滑动窗口的宽和高方法具体为：

第i次调整滑动窗口的宽为：

w_i＝(1+αⁱ)w_i-1，

第i次调整滑动窗口的高为：

h_i＝(1+βⁱ)h_i-1，

其中，

步骤S2.8所述的利用K棵决策树F对候选物进行预测分类的方法具体为：

取候选物集合中的一个候选物s＝{x,y,w,h}，将其对应的图像块缩放至16×16×3，然后拉成一行向量1×768，将此行向量右乘白化矩阵B，将候选物对应的图像块进行特征维度白化操作；每棵决策树fi对白化处理后的图像块进行分类，得到类标l_i∈{-1,1}，其中l_i＝-1表示负样本，l_i＝1表示正样本；最终图像块的类标：

l＝sgn(∑(1-a_i)l_i)

其中l∈{1,-1}。

附图说明

图1为本发明的车辆候选物再验证的车辆检测方法的流程图。

图2为本发明的实施例的图像进行预处理过程的流程图。

图3为本发明的实施例的kmeans特征提取过程的流程图。

具体实施方式

下面结合实施例及附图，对本发明作进一步地详细说明，但本发明的实施方式不限于此。

实施例

如图1所示，一种基于kmeans的高效车辆检测方法，具体包括以下步骤：

S1、离线学习，如图2所示，具体包括以下步骤：

S2、在线检测，如图3所示，具体包括以下步骤：

S2.1、假设候选物集合为S，将S初始化为空集；

S2.3、计算滑动窗口对应的图像区域的信息熵H；

步骤S1.1所述的正负训练样本图像预处理的具体方法为：

新的训练集(矩阵)右乘白化矩阵B完成特征维度白化处理。其中ε＝0.05。

步骤S1.2和步骤S1.3所述的信息熵计算方法具体为：

H＝-∑p(i)log p(i)，

其中i表示灰度值，p(i)表示灰度分布直方图中灰度值的概率；

步骤S1.4所述的确定信息熵阈值T的方法具体为：

步骤S1.7所述的kmeans特征提取的方法具体为：

f_k(x)＝max{0,μ(z)-z_k}，

步骤S1.8所述的构建决策树fi的方法具体为：

步骤S2.6所述的移动一个步长的方法具体为：

步骤S2.7所述的调整滑动窗口的宽和高方法具体为：

第i次调整滑动窗口的宽为：

w_i＝(1+αⁱ)w_i-1，

第i次调整滑动窗口的高为：

h_i＝(1+βⁱ)h_i-1，

其中

l＝sgn(∑(1-a_i)l_i)，

其中l∈{1,-1}。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受所述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于kmeans的高效车辆检测方法，其特征在于，包括以下步骤：

S1、离线学习；

S2、在线检测；

所述步骤S1包括以下步骤：

所述步骤S2包括以下步骤：

S2.1、假设候选物集合为S，将S初始化为空集；

S2.3、计算滑动窗口对应的图像区域的信息熵H；

S2.7、经过步骤S2.1～S2.6后得到候选物集合S，利用步骤S1.8得到的K棵决策树F对候选物集合S中每一个候选物进行预测分类，若预测分类分类结果为车辆，则将此候选物s＝(x,y,w,h)在图像中进行画框标记；

在步骤S1.1中，所述从标记了车辆的自然图像中采集正负训练样本的方法具体为：

自然图像I中标记了所有车辆的位置，每辆车辆记为vi＝(xi,yi,wi,hi)，其中，xi,yi为车辆位置框的左上顶点，wi,hi为车辆位置框的宽和高，利用滑动窗口W＝(xj,yj,wj,hj)扫描自然图像I，如果滑动窗口与车辆位置框vi＝(xi,yi,wi,hi)重叠超过70％，则该滑动窗口对应的图像区域为正样本，否则为负样本。

2.根据权利要求1所述的基于kmeans的高效车辆检测方法，其特征在于，步骤S1.1所述的正负训练样本图像预处理的具体方法为：

<mrow> <mi>B</mi> <mo>=</mo> <mi>V</mi> <mo>&CenterDot;</mo> <mi>d</mi> <mi>i</mi> <mi>a</mi> <mi>g</mi> <mrow> <mo>(</mo> <msqrt> <mfrac> <mn>1</mn> <mrow> <mi>d</mi> <mi>i</mi> <mi>a</mi> <mi>g</mi> <mrow> <mo>(</mo> <mi>D</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>&epsiv;</mi> </mrow> </mfrac> </msqrt> <mo>)</mo> </mrow> <mo>&CenterDot;</mo> <msup> <mi>V</mi> <mi>T</mi> </msup> <mo>,</mo> </mrow>

新的训练集即矩阵右乘白化矩阵B完成特征维度白化处理；其中，ε＝0.05；

步骤S1.2和步骤S1.3所述的信息熵计算方法具体为：

H＝-∑p(i)logp(i)，

步骤S1.4所述的确定信息熵阈值T的方法具体为：

步骤S1.7所述的kmeans特征提取的方法具体为：

f_k(x)＝max{0,μ(z)-z_k}，

其中f_k(x)，表示样本x的特征的第k维，z_k表示样本x到第k个聚类中心的欧式距离，μ(z)表示样本到各个聚类中心的平均距离；

步骤S1.8所述的构建决策树fi的方法具体为：

步骤S2.6所述的移动一个步长的方法具体为：

步骤S2.7所述的调整滑动窗口的宽和高方法具体为：

第i次调整滑动窗口的宽为：

w_i＝(1+αⁱ)w_i-1，

第i次调整滑动窗口的高为：

h_i＝(1+βⁱ)h_i-1，

其中

取候选物集合中的一个候选物s＝{x,y,w,h}，将其对应的图像块缩放至16×16×3，然后拉成一行向量1×768，将此行向量右乘白化矩阵B，将候选物对应的图像块进行特征维度白化操作；每棵决策树fi对白化处理后的图像块进行分类，得到类标l_i∈{-1,1}，其中l_i＝-1，表示负样本，l_i＝1表示正样本；最终图像块的类标：

l＝sgn(∑(1-a_i)l_i)，

其中l∈{1,-1}。