CN107392176B - 一种基于kmeans的高效车辆检测方法 - Google Patents
一种基于kmeans的高效车辆检测方法 Download PDFInfo
- Publication number
- CN107392176B CN107392176B CN201710679052.XA CN201710679052A CN107392176B CN 107392176 B CN107392176 B CN 107392176B CN 201710679052 A CN201710679052 A CN 201710679052A CN 107392176 B CN107392176 B CN 107392176B
- Authority
- CN
- China
- Prior art keywords
- image
- sliding window
- sample
- information entropy
- positive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000003066 decision tree Methods 0.000 claims abstract description 20
- 230000002087 whitening effect Effects 0.000 claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000009826 distribution Methods 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000011897 real-time detection Methods 0.000 abstract 4
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012419 revalidation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/584—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于kmeans的高效车辆检测方法,包括离线学习和实时检测的步骤,先利用离线学习过程得到的样本预处理的白化矩阵,用于在实时检测时样本的白化操作,避免不同分量的权重不一致带来的影响,然后利用训练样本训练K棵决策树,用于实时检测,得到检测目标;在实时检测中,利用简单特征挑选有可能是车辆的候选框,再进行kmeans特征提取,利用K棵决策树进行预测分类,得到检测目标。与现有技术相比,本发明具有提高了检测的精度,增强了实时性,降低误检,漏检的概率等优点。
Description
技术领域
本发明涉及车辆检测技术,特别涉及一种基于kmeans的高效车辆检测方法,该检测方法是一种车辆候选物再验证的车辆检测方法。
背景技术
近年来,车辆增长的速度也已远远高于道路和其他交通设施的增长速度,交通事故频繁、人员伤亡与日俱增、财产损失巨大这都要求车辆不仅要具有良好的安全性而且要具备一定的智能性,随之智能车辆(Intelligent Vehicle)的概念应运而生。车辆检测是智能车辆研究领域中的重要组成部分,对于智能车辆的安全驾驶极为关键。目前国内外诞生的车辆检测器产品的种类很多,技术原理和实现方式各不相同,如有线圈检测、视频检测、微波检测、激光检测、声波检测、超声波检测、磁力检测、红外线检测等。其中的视频检测方法无需破坏路面,安装和维护比较方便,是目前车辆检测研究方向的热点。
视频检测技术是一种计算机视觉和图像处理技术,通过视频摄像机和计算机模仿人眼的功能,为实际应用提供实时交通信息的先进技术。在基于视频图像的检测技术中,机器学习方法由于识别性能高、鲁棒性好以及操作便捷而受到越来越多的关注。机器学习方法主要用于进行两类的分类识别:目标物或非目标物。将机器学习应用在车辆检测上一般采用的检测框架是滑动窗口法,即检验滑动窗口的位置是否是车辆。这样的方法耗时比较长,很难实现车辆的实时监测。因此,利用简单的特征先挑选出有可能是车辆的候选框,然后再进行深层次的特征提取再判断的检测框架被更多地运用在实时检测车辆的应用中。
在挑选车辆候选框的时候选用的特征都比较简单,因为简单的特征不需要太多的计算资源,因此能够从海量的位置中快速挑选出有可能是车辆的候选框。得到了一个包含很多车辆候选框的集合后,利用更加鲁棒和更加稠密的特征表示样本,再进行训练分类,就能够兼容实时性和精度两方面的要求。
特征提取是车辆检测中一个非常重要的环节,目的是为了降低车辆图像的维数,通过提取的特征在图像中检测车辆。特征提取的方法主要有:Haar小波特征提取、Haar-like特征提取、Gabor特征提取等等。一个鲁棒的图像特征能够很好的提升分类器的分类预测结果,然而传统的图像领域的车辆特征的设计需要图像专家丰富的经验,更新换代慢。因此利用无监督学习kmeans聚类的方法得到特征映射,能够从海量的无标签数据中得到鲁棒的特征提取方法。
发明内容
为了克服现有技术的上述缺点与不足,本发明的目的在于提供一种基于kmeans的高效车辆检测方法,该检测方法提高了检测的速度,降低误检,漏检的概率。
本发明的目的通过以下技术方案实现:
一种车辆候选物再验证的车辆检测方法,包括以下步骤:
S1、离线学习,具体包括以下步骤:
S1.1、从标记了车辆的自然图像中采集正负训练样本,并进行正负训练样本预处理,构成正样本集合P和负样本集合N;
S1.2、计算并记录正样本集合P中每个正样本的信息熵,形成正样本集合的信息熵分布;
S1.3、计算并记录负样本集合N中每个负样本的信息熵,形成负样本集合的信息熵分布;
S1.4、根据步骤S1.2和步骤S1.3得到的两个信息熵分布,确定信息熵阈值T;
S1.5、假设正样本集合P的大小为MP,采取有放回的抽样方法从正样本集合P中抽取K个子集合P1,P2,...,PK,每个子集合的元素个数为MP;
S1.6、假设负样本集合N的大小为MN,采取有放回的抽样方法从负样本集合N中抽取K个子集合N1,N2,...,NK,每个子集合的元素个数为MN;
S1.7、将步骤S1.5和步骤S1.6得到正样本集合P1,P2,...,PK和负样本N1,N2,...NK中每个样本进行kmeans特征提取,得到新的正样本集合P1’,P2’,...,PK’和新的负样本集合N1’,N2’,...,NK’,新的正样本集合和新的负样本集合形成K个包含正负训练样本的集合U={U1,U2,...,UK},其中Ui={Pi’,Ni’};
S1.8、利用步骤S1.7得到的集合U中的每个训练集Ui构建一棵决策树,并记录其准确率,最终得到K棵决策树F={f1,f2,...,fK}以及相应的准确率A={a1,a2,...,aK};
S2、在线检测,具体包括以下步骤:
S2.1、假设候选物集合为S,将S初始化为空集;
S2.2、初始化滑动窗口的起点为图像左上顶点,滑动窗口的宽w为图像的宽的1/10,滑动窗口的高h为图像的高的1/10;
S2.3、计算滑动窗口对应的图像区域的信息熵H;
S2.4、将步骤S2.3得到信息熵H与步骤S1.4得到的信息熵阈值T做比较,若H>T,则记此滑动窗口为候选物,记为s=(x,y,w,h),其中x,y为滑动窗口的左上顶点的坐标,w,h分别为滑动窗口的宽和高,将候选物s=(x,y,w,h)加入候选物集合S中;
S2.5、移动滑动窗口一个步长,重复步骤S2.3~S2.4直到滑动窗口完成遍历图像;
S2.6、调整滑动窗口的宽和高,重复步骤S2.2~S2.5直到完成遍历所有预设定的宽和高,预设定的宽为图像宽的9/10,预设定的高为图像高的9/10;
S2.7、经过步骤S2.1~S2.6后得到候选物集合S,利用步骤S1.8得到的K棵决策树F对候选物集合S中每一个候选物进行预测分类,若预测分类分类结果为车辆,则将此候选物s=(x,y,w,h)在图像中进行画框标记。
步骤S1.1所述从标记了车辆的自然图像中采集正负训练样本的方法具体为:
自然图像I中标记了所有车辆的位置,每辆车辆记为vi=(xi,yi,wi,hi),其中xi,yi为车辆位置框的左上顶点,wi,hi为车辆位置框的宽和高,利用滑动窗口W=(xj,yj,wj,hj)扫描自然图像I,如果滑动窗口与车辆位置框vi=(xi,yi,wi,hi)重叠超过70%,则该滑动窗口对应的图像区域为正样本,否则为负样本。
步骤S1.1所述的正负训练样本图像预处理的具体方法为:
图像归一化处理:将每个样本图像其尺寸缩放之16×16×3,每个样本图像减去自身的均值并除以图像自身的标准差;
特征维度白化处理:每个样本图像进行完图像归一化处理之后,将每个样本图像拉成一行向量(1×768),训练集中样本图像的每一个维度减去样本训练集中该维度的均值形成新的训练集,计算新的训练集的特征向量V和特征值对角阵D,得到白化矩阵
新的训练集(矩阵)右乘白化矩阵B完成特征维度白化处理。其中,ε=0.05。
步骤S1.2和步骤S1.3所述的信息熵计算方法具体为:
将RGB图像进行灰度化,得到图像的灰度分布直方图,则图像的信息熵为:
其中,i表示灰度值,p(i)表示灰度分布直方图中灰度值的概率;
步骤S1.4所述的确定信息熵阈值T的方法具体为:
假设正样本集合P的信息熵分布包络线为QP,负样本集合N的信息熵分布包络线为QN,令QP=QN,则可得信息熵阈值T;
步骤S1.7所述的kmeans特征提取的方法具体为:
从步骤S1.5的正样本集合P中利用Kmeans方法聚类形成800个类中心,记为c={c1,c2,...,c800};对正样本集合Pi和负样本集合Ni中的每一个样本进行特征提取:
fk(x)=max{0,μ(z)-zk},
其中fk(x)表示样本x的特征的第k维,zk表示样本x到第k个聚类中心的欧式距离,μ(z)表示样本到各个聚类中心的平均距离;
步骤S2.6所述的移动一个步长的方法具体为:
假设滑动窗口W={xi,yi,wi,hi},当滑动窗口向右移动时,步长取0.5×wi,当滑动窗口向下移动时,步长取0.5×hi;
步骤S2.7所述的调整滑动窗口的宽和高方法具体为:
第i次调整滑动窗口的宽为:
wi=(1+αi)wi-1,
第i次调整滑动窗口的高为:
hi=(1+βi)hi-1,
步骤S2.8所述的利用K棵决策树F对候选物进行预测分类的方法具体为:
取候选物集合中的一个候选物s={x,y,w,h},将其对应的图像块缩放至16×16×3,然后拉成一行向量1×768,将此行向量右乘白化矩阵B,将候选物对应的图像块进行特征维度白化操作;每棵决策树fi对白化处理后的图像块进行分类,得到类标li∈{-1,1},其中li=-1表示负样本,li=1表示正样本;最终图像块的类标:
l=sgn(∑(1-ai)li)
其中l∈{1,-1}。
附图说明
图1为本发明的车辆候选物再验证的车辆检测方法的流程图。
图2为本发明的实施例的图像进行预处理过程的流程图。
图3为本发明的实施例的kmeans特征提取过程的流程图。
具体实施方式
下面结合实施例及附图,对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例
如图1所示,一种基于kmeans的高效车辆检测方法,具体包括以下步骤:
S1、离线学习,如图2所示,具体包括以下步骤:
S1.1、从标记了车辆的自然图像中采集正负训练样本,并进行正负训练样本预处理,构成正样本集合P和负样本集合N;
S1.2、计算并记录正样本集合P中每个正样本的信息熵,形成正样本集合的信息熵分布;
S1.3、计算并记录负样本集合N中每个负样本的信息熵,形成负样本集合的信息熵分布;
S1.4、根据步骤S1.2和步骤S1.3得到的两个信息熵分布,确定信息熵阈值T;
S1.5、假设正样本集合P的大小为MP,采取有放回的抽样方法从正样本集合P中抽取K个子集合P1,P2,...,PK,每个子集合的元素个数为MP;
S1.6、假设负样本集合N的大小为MN,采取有放回的抽样方法从负样本集合N中抽取K个子集合N1,N2,...,NK,每个子集合的元素个数为MN;
S1.7、将步骤S1.5和步骤S1.6得到正样本集合P1,P2,...,PK和负样本N1,N2,...NK中每个样本进行kmeans特征提取,得到新的正样本集合P1’,P2’,...,PK’和新的负样本集合N1’,N2’,...,NK’,新的正样本集合和新的负样本集合形成K个包含正负训练样本的集合U={U1,U2,...,UK},其中Ui={Pi’,Ni’};
S1.8、利用步骤S1.7得到的集合U中的每个训练集Ui构建一棵决策树,并记录其准确率,最终得到K棵决策树F={f1,f2,...,fK}以及相应的准确率A={a1,a2,...,aK};
S2、在线检测,如图3所示,具体包括以下步骤:
S2.1、假设候选物集合为S,将S初始化为空集;
S2.2、初始化滑动窗口的起点为图像左上顶点,滑动窗口的宽w为图像的宽的1/10,滑动窗口的高h为图像的高的1/10;
S2.3、计算滑动窗口对应的图像区域的信息熵H;
S2.4、将步骤S2.3得到信息熵H与步骤S1.4得到的信息熵阈值T做比较,若H>T,则记此滑动窗口为候选物,记为s=(x,y,w,h),其中x,y为滑动窗口的左上顶点的坐标,w,h分别为滑动窗口的宽和高,将候选物s=(x,y,w,h)加入候选物集合S中;
S2.5、移动滑动窗口一个步长,重复步骤S2.3~S2.4直到滑动窗口完成遍历图像;
S2.6、调整滑动窗口的宽和高,重复步骤S2.2~S2.5直到完成遍历所有预设定的宽和高,预设定的宽为图像宽的9/10,预设定的高为图像高的9/10;
S2.7、经过步骤S2.1~S2.6后得到候选物集合S,利用步骤S1.8得到的K棵决策树F对候选物集合S中每一个候选物进行预测分类,若预测分类分类结果为车辆,则将此候选物s=(x,y,w,h)在图像中进行画框标记。
步骤S1.1所述从标记了车辆的自然图像中采集正负训练样本的方法具体为:
自然图像I中标记了所有车辆的位置,每辆车辆记为vi=(xi,yi,wi,hi),其中xi,yi为车辆位置框的左上顶点,wi,hi为车辆位置框的宽和高,利用滑动窗口W=(xj,yj,wj,hj)扫描自然图像I,如果滑动窗口与车辆位置框vi=(xi,yi,wi,hi)重叠超过70%,则该滑动窗口对应的图像区域为正样本,否则为负样本。
步骤S1.1所述的正负训练样本图像预处理的具体方法为:
图像归一化处理:将每个样本图像其尺寸缩放之16×16×3,每个样本图像减去自身的均值并除以图像自身的标准差;
特征维度白化处理:每个样本图像进行完图像归一化处理之后,将每个样本图像拉成一行向量(1×768),训练集中样本图像的每一个维度减去样本训练集中该维度的均值形成新的训练集,计算新的训练集的特征向量V和特征值对角阵D,得到白化矩阵
新的训练集(矩阵)右乘白化矩阵B完成特征维度白化处理。其中ε=0.05。
步骤S1.2和步骤S1.3所述的信息熵计算方法具体为:
将RGB图像进行灰度化,得到图像的灰度分布直方图,则图像的信息熵为:
H=-∑p(i)logp(i),
其中i表示灰度值,p(i)表示灰度分布直方图中灰度值的概率;
步骤S1.4所述的确定信息熵阈值T的方法具体为:
假设正样本集合P的信息熵分布包络线为QP,负样本集合N的信息熵分布包络线为QN,令QP=QN,则可得信息熵阈值T;
步骤S1.7所述的kmeans特征提取的方法具体为:
从步骤S1.5的正样本集合P中利用Kmeans方法聚类形成800个类中心,记为c={c1,c2,...,c800};对正样本集合Pi和负样本集合Ni中的每一个样本进行特征提取:
fk(x)=max{0,μ(z)-zk},
其中fk(x)表示样本x的特征的第k维,zk表示样本x到第k个聚类中
心的欧式距离,μ(z)表示样本到各个聚类中心的平均距离;
步骤S2.6所述的移动一个步长的方法具体为:
假设滑动窗口W={xi,yi,wi,hi},当滑动窗口向右移动时,步长取0.5×wi,当滑动窗口向下移动时,步长取0.5×hi;
步骤S2.7所述的调整滑动窗口的宽和高方法具体为:
第i次调整滑动窗口的宽为:
wi=(1+αi)wi-1,
第i次调整滑动窗口的高为:
hi=(1+βi)hi-1,
步骤S2.8所述的利用K棵决策树F对候选物进行预测分类的方法具体为:
取候选物集合中的一个候选物s={x,y,w,h},将其对应的图像块缩放至16×16×3,然后拉成一行向量1×768,将此行向量右乘白化矩阵B,将候选物对应的图像块进行特征维度白化操作;每棵决策树fi对白化处理后的图像块进行分类,得到类标li∈{-1,1},其中li=-1表示负样本,li=1表示正样本;最终图像块的类标:
l=sgn(∑(1-ai)li),
其中l∈{1,-1}。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受所述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (2)
1.一种基于kmeans的高效车辆检测方法,其特征在于,包括以下步骤:
S1、离线学习;
S2、在线检测;
所述步骤S1包括以下步骤:
S1.1、从标记了车辆的自然图像中采集正负训练样本,并进行正负训练样本预处理,构成正样本集合P和负样本集合N;
S1.2、计算并记录正样本集合P中每个正样本的信息熵,形成正样本集合的信息熵分布;
S1.3、计算并记录负样本集合N中每个负样本的信息熵,形成负样本集合的信息熵分布;
S1.4、根据步骤S1.2和步骤S1.3得到的两个信息熵分布,确定信息熵阈值T;
S1.5、假设正样本集合P的大小为MP,采取有放回的抽样方法从正样本集合P中抽取K个子集合P1,P2,...,PK,每个子集合的元素个数为MP;
S1.6、假设负样本集合N的大小为MN,采取有放回的抽样方法从负样本集合N中抽取K个子集合N1,N2,...,NK,每个子集合的元素个数为MN;
S1.7、将步骤S1.5和步骤S1.6得到正样本集合P1,P2,...,PK和负样本N1,N2,...NK中每个样本进行kmeans特征提取,得到新的正样本集合P1’,P2’,...,PK’和新的负样本集合N1’,N2’,...,NK’,新的正样本集合和新的负样本集合形成K个包含正负训练样本的集合U={U1,U2,...,UK};
S1.8、利用步骤S1.7得到的集合U中的每个训练集构建一棵决策树,并记录其准确率,最终得到K棵决策树F={f1,f2,...,fK}以及相应的准确率A={a1,a2,...,aK};
所述步骤S2包括以下步骤:
S2.1、假设候选物集合为S,将S初始化为空集;
S2.2、初始化滑动窗口的起点为图像左上顶点,滑动窗口的宽w为图像的宽的1/10,滑动窗口的高h为图像的高的1/10;
S2.3、计算滑动窗口对应的图像区域的信息熵H;
S2.4、将步骤S2.3得到信息熵H与步骤S1.4得到的信息熵阈值T做比较,若H>T,则记此滑动窗口为候选物,记为s=(x,y,w,h),其中x,y为滑动窗口的左上顶点的坐标,w,h分别为滑动窗口的宽和高,将候选物s=(x,y,w,h)加入候选物集合S中;
S2.5、移动滑动窗口一个步长,重复步骤S2.3~S2.4直到滑动窗口完成遍历图像;
S2.6、调整滑动窗口的宽和高,重复步骤S2.2~S2.5直到完成遍历所有预设定的宽和高,预设定的宽为图像宽的9/10,预设定的高为图像高的9/10;
所述的移动一个步长的方法具体为:
假设滑动窗口W={xi,yi,wi,hi},当滑动窗口向右移动时,步长取0.5×wi,当滑动窗口向下移动时,步长取0.5×hi;
S2.7、经过步骤S2.1~S2.6后得到候选物集合S,利用步骤S1.8得到的K棵决策树F对候选物集合S中每一个候选物进行预测分类,若预测分类分类结果为车辆,则将此候选物s=(x,y,w,h)在图像中进行画框标记;
在步骤S1.1中,所述从标记了车辆的自然图像中采集正负训练样本的方法具体为:
自然图像I中标记了所有车辆的位置,每辆车辆记为vi=(xi,yi,wi,hi),其中,xi,yi为车辆位置框的左上顶点,wi,hi为车辆位置框的宽和高,利用滑动窗口W=(xj,yj,wj,hj)扫描自然图像I,如果滑动窗口与车辆位置框vi=(xi,yi,wi,hi)重叠超过70%,则该滑动窗口对应的图像区域为正样本,否则为负样本。
2.根据权利要求1所述的基于kmeans的高效车辆检测方法,其特征在于,步骤S1.1所述的正负训练样本图像预处理的具体方法为:
图像归一化处理:将每个样本图像其尺寸缩放之16×16×3,每个样本图像减去自身的均值并除以图像自身的标准差;
特征维度白化处理:每个样本图像进行完图像归一化处理之后,将每个样本图像拉成一行向量(1×768),训练集中样本图像的每一个维度减去样本训练集中该维度的均值形成新的训练集,计算新的训练集的特征向量V和特征值对角阵D,得到白化矩阵
新的训练集即矩阵右乘白化矩阵B完成特征维度白化处理;其中,ε=0.05;
步骤S1.2和步骤S1.3所述的信息熵计算方法具体为:
将RGB图像进行灰度化,得到图像的灰度分布直方图,则图像的信息熵为:
H=-∑p(i)logp(i),
其中,i表示灰度值,p(i)表示灰度分布直方图中灰度值的概率;
步骤S1.4所述的确定信息熵阈值T的方法具体为:
假设正样本集合P的信息熵分布包络线为QP,负样本集合N的信息熵分布包络线为QN,令QP=QN,则可得信息熵阈值T;
步骤S1.7所述的kmeans特征提取的方法具体为:
从步骤S1.5的正样本集合P中利用Kmeans方法聚类形成800个类中心,记为c={c1,c2,...,c800};对正样本集合Pi和负样本集合Ni中的每一个样本进行特征提取:
fk(x)=max{0,μ(z)-zk},
其中fk(x),表示样本x的特征的第k维,zk表示样本x到第k个聚类中心的欧式距离,μ(z)表示样本到各个聚类中心的平均距离;
步骤S2.7所述的调整滑动窗口的宽和高方法具体为:
第i次调整滑动窗口的宽为:
wi=(1+αi)wi-1,
第i次调整滑动窗口的高为:
hi=(1+βi)hi-1,
步骤S2.8所述的利用K棵决策树F对候选物进行预测分类的方法具体为:
取候选物集合中的一个候选物s={x,y,w,h},将其对应的图像块缩放至16×16×3,然后拉成一行向量1×768,将此行向量右乘白化矩阵B,将候选物对应的图像块进行特征维度白化操作;每棵决策树对白化处理后的图像块进行分类,得到类标li∈{-1,1},其中li=-1,表示负样本,li=1表示正样本;最终图像块的类标:
l=sgn(∑(1-ai)li),
其中l∈{1,-1}。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710679052.XA CN107392176B (zh) | 2017-08-10 | 2017-08-10 | 一种基于kmeans的高效车辆检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710679052.XA CN107392176B (zh) | 2017-08-10 | 2017-08-10 | 一种基于kmeans的高效车辆检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107392176A CN107392176A (zh) | 2017-11-24 |
CN107392176B true CN107392176B (zh) | 2020-05-22 |
Family
ID=60355297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710679052.XA Active CN107392176B (zh) | 2017-08-10 | 2017-08-10 | 一种基于kmeans的高效车辆检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107392176B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2874097A3 (en) * | 2013-11-19 | 2015-07-29 | Nokia Corporation | Automatic scene parsing |
CN105868773A (zh) * | 2016-03-23 | 2016-08-17 | 华南理工大学 | 一种基于层次随机森林的多标签分类方法 |
CN105975937A (zh) * | 2016-05-05 | 2016-09-28 | 南京学安网络科技有限公司 | 基于无监督学习的道路检测方法及系统 |
CN106096561A (zh) * | 2016-06-16 | 2016-11-09 | 重庆邮电大学 | 基于图像块深度学习特征的红外行人检测方法 |
CN106503627A (zh) * | 2016-09-30 | 2017-03-15 | 西安翔迅科技有限责任公司 | 一种基于视频分析的车辆避让行人检测方法 |
CN106548196A (zh) * | 2016-10-20 | 2017-03-29 | 中国科学院深圳先进技术研究院 | 一种针对非平衡数据的随机森林抽样方法及装置 |
CN106570439A (zh) * | 2015-10-09 | 2017-04-19 | 腾讯科技(深圳)有限公司 | 一种车辆检测方法及装置 |
-
2017
- 2017-08-10 CN CN201710679052.XA patent/CN107392176B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2874097A3 (en) * | 2013-11-19 | 2015-07-29 | Nokia Corporation | Automatic scene parsing |
CN106570439A (zh) * | 2015-10-09 | 2017-04-19 | 腾讯科技(深圳)有限公司 | 一种车辆检测方法及装置 |
CN105868773A (zh) * | 2016-03-23 | 2016-08-17 | 华南理工大学 | 一种基于层次随机森林的多标签分类方法 |
CN105975937A (zh) * | 2016-05-05 | 2016-09-28 | 南京学安网络科技有限公司 | 基于无监督学习的道路检测方法及系统 |
CN106096561A (zh) * | 2016-06-16 | 2016-11-09 | 重庆邮电大学 | 基于图像块深度学习特征的红外行人检测方法 |
CN106503627A (zh) * | 2016-09-30 | 2017-03-15 | 西安翔迅科技有限责任公司 | 一种基于视频分析的车辆避让行人检测方法 |
CN106548196A (zh) * | 2016-10-20 | 2017-03-29 | 中国科学院深圳先进技术研究院 | 一种针对非平衡数据的随机森林抽样方法及装置 |
Non-Patent Citations (2)
Title |
---|
Moving Vehicle Classification Using Cloud Model;Zhiyuan zeng 等;《Key Engineering Materials》;20111231;第2123-2128页 * |
基于深度自编码器的单样本人脸识别;张彦 等;《模式识别与人工智能》;20170430;第30卷(第4期);第343-352页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107392176A (zh) | 2017-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110414462B (zh) | 一种无监督的跨域行人重识别方法及系统 | |
CN109583482B (zh) | 一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法 | |
CN109101924B (zh) | 一种基于机器学习的路面交通标志识别方法 | |
Hussain et al. | Feature sets and dimensionality reduction for visual object detection | |
CN105046197B (zh) | 基于聚类的多模板行人检测方法 | |
CN102915453B (zh) | 一种实时反馈更新的车辆检测方法 | |
CN107729890B (zh) | 基于lbp和深度学习的人脸识别方法 | |
CN108898138A (zh) | 基于深度学习的场景文本识别方法 | |
CN103295009B (zh) | 基于笔画分解的车牌字符识别方法 | |
CN108345866B (zh) | 一种基于深度特征学习的行人再识别方法 | |
Ma et al. | Integrating orientation cue with EOH-OLBP-based multilevel features for human detection | |
Ren et al. | Parallel RCNN: A deep learning method for people detection using RGB-D images | |
CN108509861B (zh) | 一种基于样本学习和目标检测结合的目标跟踪方法和装置 | |
Ye et al. | Overhead ground wire detection by fusion global and local features and supervised learning method for a cable inspection robot | |
Chen et al. | Robust vehicle detection and viewpoint estimation with soft discriminative mixture model | |
CN113313684A (zh) | 一种暗光条件下基于视频的工业缺陷检测系统 | |
Shitole et al. | Recognition of handwritten Devanagari characters using linear discriminant analysis | |
Yu et al. | Pedestrian detection based on improved Faster RCNN algorithm | |
Fu et al. | Reseach and implementation of face detection, tracking and recognition based on video | |
CN111401434A (zh) | 一种基于无监督特征学习的图像分类方法 | |
Araar et al. | Traffic sign recognition using a synthetic data training approach | |
CN109255052B (zh) | 一种基于多特征的三阶段车辆检索方法 | |
CN104063682A (zh) | 一种基于边缘分级和centrist特征的行人检测方法 | |
Yuan et al. | Fast QR code detection based on BING and AdaBoost-SVM | |
CN103984965A (zh) | 基于多分辨率特征关联的行人检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |