CN107392176A - 一种基于kmeans的高效车辆检测方法 - Google Patents

一种基于kmeans的高效车辆检测方法 Download PDF

Info

Publication number
CN107392176A
CN107392176A CN201710679052.XA CN201710679052A CN107392176A CN 107392176 A CN107392176 A CN 107392176A CN 201710679052 A CN201710679052 A CN 201710679052A CN 107392176 A CN107392176 A CN 107392176A
Authority
CN
China
Prior art keywords
image
sample
sliding window
positive
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710679052.XA
Other languages
English (en)
Other versions
CN107392176B (zh
Inventor
邝沛江
李梦涵
周智恒
李波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201710679052.XA priority Critical patent/CN107392176B/zh
Publication of CN107392176A publication Critical patent/CN107392176A/zh
Application granted granted Critical
Publication of CN107392176B publication Critical patent/CN107392176B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/584Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于kmeans的高效车辆检测方法,包括离线学习和实时检测的步骤,先利用离线学习过程得到的样本预处理的白化矩阵,用于在实时检测时样本的白化操作,避免不同分量的权重不一致带来的影响,然后利用训练样本训练K棵决策树,用于实时检测,得到检测目标;在实时检测中,利用简单特征挑选有可能是车辆的候选框,再进行kmeans特征提取,利用K棵决策树进行预测分类,得到检测目标。与现有技术相比,本发明具有提高了检测的精度,增强了实时性,降低误检,漏检的概率等优点。

Description

一种基于kmeans的高效车辆检测方法
技术领域
本发明涉及车辆检测技术,特别涉及一种基于kmeans的高效车辆检测方法,该检测方法是一种车辆候选物再验证的车辆检测方法。
背景技术
近年来,车辆增长的速度也已远远高于道路和其他交通设施的增长速度,交通事故频繁、人员伤亡与日俱增、财产损失巨大这都要求车辆不仅要具有良好的安全性而且要具备一定的智能性,随之智能车辆(Intelligent Vehicle)的概念应运而生。车辆检测是智能车辆研究领域中的重要组成部分,对于智能车辆的安全驾驶极为关键。目前国内外诞生的车辆检测器产品的种类很多,技术原理和实现方式各不相同,如有线圈检测、视频检测、微波检测、激光检测、声波检测、超声波检测、磁力检测、红外线检测等。其中的视频检测方法无需破坏路面,安装和维护比较方便,是目前车辆检测研究方向的热点。
视频检测技术是一种计算机视觉和图像处理技术,通过视频摄像机和计算机模仿人眼的功能,为实际应用提供实时交通信息的先进技术。在基于视频图像的检测技术中,机器学习方法由于识别性能高、鲁棒性好以及操作便捷而受到越来越多的关注。机器学习方法主要用于进行两类的分类识别:目标物或非目标物。将机器学习应用在车辆检测上一般采用的检测框架是滑动窗口法,即检验滑动窗口的位置是否是车辆。这样的方法耗时比较长,很难实现车辆的实时监测。因此,利用简单的特征先挑选出有可能是车辆的候选框,然后再进行深层次的特征提取再判断的检测框架被更多地运用在实时检测车辆的应用中。
在挑选车辆候选框的时候选用的特征都比较简单,因为简单的特征不需要太多的计算资源,因此能够从海量的位置中快速挑选出有可能是车辆的候选框。得到了一个包含很多车辆候选框的集合后,利用更加鲁棒和更加稠密的特征表示样本,再进行训练分类,就能够兼容实时性和精度两方面的要求。
特征提取是车辆检测中一个非常重要的环节,目的是为了降低车辆图像的维数,通过提取的特征在图像中检测车辆。特征提取的方法主要有:Haar小波特征提取、Haar-like特征提取、Gabor特征提取等等。一个鲁棒的图像特征能够很好的提升分类器的分类预测结果,然而传统的图像领域的车辆特征的设计需要图像专家丰富的经验,更新换代慢。因此利用无监督学习kmeans聚类的方法得到特征映射,能够从海量的无标签数据中得到鲁棒的特征提取方法。
发明内容
为了克服现有技术的上述缺点与不足,本发明的目的在于提供一种基于kmeans的高效车辆检测方法,该检测方法提高了检测的速度,降低误检,漏检的概率。
本发明的目的通过以下技术方案实现:
一种车辆候选物再验证的车辆检测方法,包括以下步骤:
S1、离线学习,具体包括以下步骤:
S1.1、从标记了车辆的自然图像中采集正负训练样本,并进行正负训练样本预处理,构成正样本集合P和负样本集合N;
S1.2、计算并记录正样本集合P中每个正样本的信息熵,形成正样本集合的信息熵分布;
S1.3、计算并记录负样本集合N中每个负样本的信息熵,形成负样本集合的信息熵分布;
S1.4、根据步骤S1.2和步骤S1.3得到的两个信息熵分布,确定信息熵阈值T;
S1.5、假设正样本集合P的大小为MP,采取有放回的抽样方法从正样本集合P中抽取K个子集合P1,P2,...,PK,每个子集合的元素个数为MP
S1.6、假设负样本集合N的大小为MN,采取有放回的抽样本法从负样本集合N中抽取K个子集合N1,N2,...,NK,每个子集合的元素个数为MN
S1.7、将步骤S1.5和步骤S1.6得到正样本集合P1,P2,...,PK和负样本N1,N2,...NK中每个样本进行kmeans特征提取,得到新的正样本集合P1’,P2’,...,PK’和新的负样本集合N1’,N2’,...,NK’,新的正样本集合和新的负样本集合形成K个包含正负训练样本的集合U={U1,U2,...,UK},其中Ui={Pi’,Ni’};
S1.8、利用步骤S1.7得到的集合U中的每个训练集Ui构建一棵决策树,并记录其准确率,最终得到K棵决策树F={f1,f2,...,fK}以及相应的准确率A={a1,a2,...,aK};
S2、在线检测,具体包括以下步骤:
S2.1、假设候选物集合为S,将S初始化为空集;
S2.2、初始化滑动窗口的起点为图像左上顶点,滑动窗口的宽w为图像的宽的1/10,滑动窗口的高h为图像的高的1/10;
S2.3、计算滑动窗口对应的图像区域的信息熵H;
S2.4、将步骤S2.3得到信息熵H与步骤S1.4得到的信息熵阈值T做比较,若H>T,则记此滑动窗口为候选物,记为s=(x,y,w,h),其中x,y为滑动窗口的左上顶点的坐标,w,h分别为滑动窗口的宽和高,将候选物s=(x,y,w,h)加入候选物集合S中;
S2.5、移动滑动窗口一个步长,重复步骤S2.3~S2.4直到滑动窗口完成遍历图像;
S2.6、调整滑动窗口的宽和高,重复步骤S2.2~S2.5直到完成遍历所有预设定的宽和高,预设定的宽为图像宽的9/10,预设定的高为图像高的9/10;
S2.7、经过步骤S2.1~S2.6后得到候选物集合S,利用步骤S1.8得到的K棵决策树F对候选物集合S中每一个候选物进行预测分类,若预测分类分类结果为车辆,则将此候选物s=(x,y,w,h)在图像中进行画框标记。
步骤S1.1所述从标记了车辆的自然图像中采集正负训练样本的方法具体为:
自然图像I中标记了所有车辆的位置,每辆车辆记为vi=(xi,yi,wi,hi),其中xi,yi为车辆位置框的左上顶点,wi,hi为车辆位置框的宽和高,利用滑动窗口W=(xj,yj,wj,hj)扫描自然图像I,如果滑动窗口与车辆位置框vi=(xi,yi,wi,hi)重叠超过70%,则该滑动窗口对应的图像区域为正样本,否则为负样本。
步骤S1.1所述的正负训练样本图像预处理的具体方法为:
图像归一化处理:将每个样本图像其尺寸缩放之16×16×3,每个样本图像减去自身的均值并除以图像自身的标准差;
特征维度白化处理:每个样本图像进行完图像归一化处理之后,将每个样本图像拉成一行向量(1×768),训练集中样本图像的每一个维度减去样本训练集中该维度的均值形成新的训练集,计算新的训练集的特征向量V和特征值D,得到白化矩阵
新的训练集(矩阵)右乘白化矩阵B完成特征维度白化处理。其中,ε=0.05。
步骤S1.2和步骤S1.3所述的信息熵计算方法具体为:
将RGB图像进行灰度化,得到图像的灰度分布直方图,则图像的信息熵为:
其中,i表示灰度值,p(i)表示灰度分布直方图中灰度值的概率;
步骤S1.4所述的确定信息熵阈值T的方法具体为:
假设正样本集合P的信息熵分布包络线为QP,负样本集合N的信息熵分布包络线为QN,令QP=QN,则可得信息熵阈值T;
步骤S1.7所述的kmeans特征提取的方法具体为:
从步骤S1.5的正样本集合P中利用Kmeans方法聚类形成800个类中心,记为c={c1,c2,...,c800};对正样本集合Pi和负样本集合Ni中的每一个样本进行特征提取:
fk(x)=max{0,μ(z)-zk},
其中fk(x)表示样本x的特征的第k维,zk表示样本x到第k个聚类中心的欧式距离,μ(z)表示样本到各个聚类中心的平均距离;
步骤S2.6所述的移动一个步长的方法具体为:
假设滑动窗口W={xi,yi,wi,hi},当滑动窗口向右移动时,步长取0.5×wi,当滑动窗口向下移动时,步长取0.5×hi;
步骤S2.7所述的调整滑动窗口的宽和高方法具体为:
第i次调整滑动窗口的宽为:
wi=(1+αi)wi-1
第i次调整滑动窗口的高为:
hi=(1+βi)hi-1
其中,
步骤S2.8所述的利用K棵决策树F对候选物进行预测分类的方法具体为:
取候选物集合中的一个候选物s={x,y,w,h},将其对应的图像块缩放至16×16×3,然后拉成一行向量1×768,将此行向量右乘白化矩阵B,将候选物对应的图像块进行特征维度白化操作;每棵决策树fi对白化处理后的图像块进行分类,得到类标li∈{-1,1},其中li=-1表示负样本,li=1表示正样本;最终图像块的类标:
l=sgn(∑(1-ai)li)
其中l∈{1,-1}。
附图说明
图1为本发明的车辆候选物再验证的车辆检测方法的流程图。
图2为本发明的实施例的图像进行预处理过程的流程图。
图3为本发明的实施例的kmeans特征提取过程的流程图。
具体实施方式
下面结合实施例及附图,对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例
如图1所示,一种基于kmeans的高效车辆检测方法,具体包括以下步骤:
S1、离线学习,如图2所示,具体包括以下步骤:
S1.1、从标记了车辆的自然图像中采集正负训练样本,并进行正负训练样本预处理,构成正样本集合P和负样本集合N;
S1.2、计算并记录正样本集合P中每个正样本的信息熵,形成正样本集合的信息熵分布;
S1.3、计算并记录负样本集合N中每个负样本的信息熵,形成负样本集合的信息熵分布;
S1.4、根据步骤S1.2和步骤S1.3得到的两个信息熵分布,确定信息熵阈值T;
S1.5、假设正样本集合P的大小为MP,采取有放回的抽样方法从正样本集合P中抽取K个子集合P1,P2,...,PK,每个子集合的元素个数为MP
S1.6、假设负样本集合N的大小为MN,采取有放回的抽样本法从负样本集合N中抽取K个子集合N1,N2,...,NK,每个子集合的元素个数为MN
S1.7、将步骤S1.5和步骤S1.6得到正样本集合P1,P2,...,PK和负样本N1,N2,...NK中每个样本进行kmeans特征提取,得到新的正样本集合P1’,P2’,...,PK’和新的负样本集合N1’,N2’,...,NK’,新的正样本集合和新的负样本集合形成K个包含正负训练样本的集合U={U1,U2,...,UK},其中Ui={Pi’,Ni’};
S1.8、利用步骤S1.7得到的集合U中的每个训练集Ui构建一棵决策树,并记录其准确率,最终得到K棵决策树F={f1,f2,...,fK}以及相应的准确率A={a1,a2,...,aK};
S2、在线检测,如图3所示,具体包括以下步骤:
S2.1、假设候选物集合为S,将S初始化为空集;
S2.2、初始化滑动窗口的起点为图像左上顶点,滑动窗口的宽w为图像的宽的1/10,滑动窗口的高h为图像的高的1/10;
S2.3、计算滑动窗口对应的图像区域的信息熵H;
S2.4、将步骤S2.3得到信息熵H与步骤S1.4得到的信息熵阈值T做比较,若H>T,则记此滑动窗口为候选物,记为s=(x,y,w,h),其中x,y为滑动窗口的左上顶点的坐标,w,h分别为滑动窗口的宽和高,将候选物s=(x,y,w,h)加入候选物集合S中;
S2.5、移动滑动窗口一个步长,重复步骤S2.3~S2.4直到滑动窗口完成遍历图像;
S2.6、调整滑动窗口的宽和高,重复步骤S2.2~S2.5直到完成遍历所有预设定的宽和高,预设定的宽为图像宽的9/10,预设定的高为图像高的9/10;
S2.7、经过步骤S2.1~S2.6后得到候选物集合S,利用步骤S1.8得到的K棵决策树F对候选物集合S中每一个候选物进行预测分类,若预测分类分类结果为车辆,则将此候选物s=(x,y,w,h)在图像中进行画框标记。
步骤S1.1所述从标记了车辆的自然图像中采集正负训练样本的方法具体为:
自然图像I中标记了所有车辆的位置,每辆车辆记为vi=(xi,yi,wi,hi),其中xi,yi为车辆位置框的左上顶点,wi,hi为车辆位置框的宽和高,利用滑动窗口W=(xj,yj,wj,hj)扫描自然图像I,如果滑动窗口与车辆位置框vi=(xi,yi,wi,hi)重叠超过70%,则该滑动窗口对应的图像区域为正样本,否则为负样本。
步骤S1.1所述的正负训练样本图像预处理的具体方法为:
图像归一化处理:将每个样本图像其尺寸缩放之16×16×3,每个样本图像减去自身的均值并除以图像自身的标准差;
特征维度白化处理:每个样本图像进行完图像归一化处理之后,将每个样本图像拉成一行向量(1×768),训练集中样本图像的每一个维度减去样本训练集中该维度的均值形成新的训练集,计算新的训练集的特征向量V和特征值D,得到白化矩阵
新的训练集(矩阵)右乘白化矩阵B完成特征维度白化处理。其中ε=0.05。
步骤S1.2和步骤S1.3所述的信息熵计算方法具体为:
将RGB图像进行灰度化,得到图像的灰度分布直方图,则图像的信息熵为:
H=-∑p(i)log p(i),
其中i表示灰度值,p(i)表示灰度分布直方图中灰度值的概率;
步骤S1.4所述的确定信息熵阈值T的方法具体为:
假设正样本集合P的信息熵分布包络线为QP,负样本集合N的信息熵分布包络线为QN,令QP=QN,则可得信息熵阈值T;
步骤S1.7所述的kmeans特征提取的方法具体为:
从步骤S1.5的正样本集合P中利用Kmeans方法聚类形成800个类中心,记为c={c1,c2,...,c800};对正样本集合Pi和负样本集合Ni中的每一个样本进行特征提取:
fk(x)=max{0,μ(z)-zk},
其中fk(x)表示样本x的特征的第k维,zk表示样本x到第k个聚类中心的欧式距离,μ(z)表示样本到各个聚类中心的平均距离;
步骤S1.8所述的构建决策树fi的方法具体为:
步骤S2.6所述的移动一个步长的方法具体为:
假设滑动窗口W={xi,yi,wi,hi},当滑动窗口向右移动时,步长取0.5×wi,当滑动窗口向下移动时,步长取0.5×hi;
步骤S2.7所述的调整滑动窗口的宽和高方法具体为:
第i次调整滑动窗口的宽为:
wi=(1+αi)wi-1
第i次调整滑动窗口的高为:
hi=(1+βi)hi-1
其中
步骤S2.8所述的利用K棵决策树F对候选物进行预测分类的方法具体为:
取候选物集合中的一个候选物s={x,y,w,h},将其对应的图像块缩放至16×16×3,然后拉成一行向量1×768,将此行向量右乘白化矩阵B,将候选物对应的图像块进行特征维度白化操作;每棵决策树fi对白化处理后的图像块进行分类,得到类标li∈{-1,1},其中li=-1表示负样本,li=1表示正样本;最终图像块的类标:
l=sgn(∑(1-ai)li),
其中l∈{1,-1}。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受所述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (2)

1.一种基于kmeans的高效车辆检测方法,其特征在于,包括以下步骤:
S1、离线学习;
S2、在线检测;
所述步骤S1包括以下步骤:
S1.1、从标记了车辆的自然图像中采集正负训练样本,并进行正负训练样本预处理,构成正样本集合P和负样本集合N;
S1.2、计算并记录正样本集合P中每个正样本的信息熵,形成正样本集合的信息熵分布;
S1.3、计算并记录负样本集合N中每个负样本的信息熵,形成负样本集合的信息熵分布;
S1.4、根据步骤S1.2和步骤S1.3得到的两个信息熵分布,确定信息熵阈值T;
S1.5、假设正样本集合P的大小为MP,采取有放回的抽样方法从正样本集合P中抽取K个子集合P1,P2,...,PK,每个子集合的元素个数为MP
S1.6、假设负样本集合N的大小为MN,采取有放回的抽样本法从负样本集合N中抽取K个子集合N1,N2,...,NK,每个子集合的元素个数为MN
S1.7、将步骤S1.5和步骤S1.6得到正样本集合P1,P2,...,PK和负样本N1,N2,...NK中每个样本进行kmeans特征提取,得到新的正样本集合P1’,P2’,...,PK’和新的负样本集合N1’,N2’,...,NK’,新的正样本集合和新的负样本集合形成K个包含正负训练样本的集合U={U1,U2,...,UK},其中Ui={Pi’,Ni’};
S1.8、利用步骤S1.7得到的集合U中的每个训练集Ui构建一棵决策树,并记录其准确率,最终得到K棵决策树F={f1,f2,...,fK}以及相应的准确率A={a1,a2,...,aK};
所述步骤S2包括以下步骤:
S2.1、假设候选物集合为S,将S初始化为空集;
S2.2、初始化滑动窗口的起点为图像左上顶点,滑动窗口的宽w为图像的宽的1/10,滑动窗口的高h为图像的高的1/10;
S2.3、计算滑动窗口对应的图像区域的信息熵H;
S2.4、将步骤S2.3得到信息熵H与步骤S1.4得到的信息熵阈值T做比较,若H>T,则记此滑动窗口为候选物,记为s=(x,y,w,h),其中x,y为滑动窗口的左上顶点的坐标,w,h分别为滑动窗口的宽和高,将候选物s=(x,y,w,h)加入候选物集合S中;
S2.5、移动滑动窗口一个步长,重复步骤S2.3~S2.4直到滑动窗口完成遍历图像;
S2.6、调整滑动窗口的宽和高,重复步骤S2.2~S2.5直到完成遍历所有预设定的宽和高,预设定的宽为图像宽的9/10,预设定的高为图像高的9/10;
S2.7、经过步骤S2.1~S2.6后得到候选物集合S,利用步骤S1.8得到的K棵决策树F对候选物集合S中每一个候选物进行预测分类,若预测分类分类结果为车辆,则将此候选物s=(x,y,w,h)在图像中进行画框标记;
在步骤S1.1中,所述从标记了车辆的自然图像中采集正负训练样本的方法具体为:
自然图像I中标记了所有车辆的位置,每辆车辆记为vi=(xi,yi,wi,hi),其中,xi,yi为车辆位置框的左上顶点,wi,hi为车辆位置框的宽和高,利用滑动窗口W=(xj,yj,wj,hj)扫描自然图像I,如果滑动窗口与车辆位置框vi=(xi,yi,wi,hi)重叠超过70%,则该滑动窗口对应的图像区域为正样本,否则为负样本。
2.根据权利要求1所述的基于kmeans的高效车辆检测方法,其特征在于,步骤S1.1所述的正负训练样本图像预处理的具体方法为:
图像归一化处理:将每个样本图像其尺寸缩放之16×16×3,每个样本图像减去自身的均值并除以图像自身的标准差;
特征维度白化处理:每个样本图像进行完图像归一化处理之后,将每个样本图像拉成一行向量(1×768),训练集中样本图像的每一个维度减去样本训练集中该维度的均值形成新的训练集,计算新的训练集的特征向量V和特征值D,得到白化矩阵
<mrow> <mi>B</mi> <mo>=</mo> <mi>V</mi> <mo>&amp;CenterDot;</mo> <mi>d</mi> <mi>i</mi> <mi>a</mi> <mi>g</mi> <mrow> <mo>(</mo> <msqrt> <mfrac> <mn>1</mn> <mrow> <mi>d</mi> <mi>i</mi> <mi>a</mi> <mi>g</mi> <mrow> <mo>(</mo> <mi>D</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>&amp;epsiv;</mi> </mrow> </mfrac> </msqrt> <mo>)</mo> </mrow> <mo>&amp;CenterDot;</mo> <msup> <mi>V</mi> <mi>T</mi> </msup> <mo>,</mo> </mrow>
新的训练集即矩阵右乘白化矩阵B完成特征维度白化处理;其中,ε=0.05;
步骤S1.2和步骤S1.3所述的信息熵计算方法具体为:
将RGB图像进行灰度化,得到图像的灰度分布直方图,则图像的信息熵为:
H=-∑p(i)logp(i),
其中,i表示灰度值,p(i)表示灰度分布直方图中灰度值的概率;
步骤S1.4所述的确定信息熵阈值T的方法具体为:
假设正样本集合P的信息熵分布包络线为QP,负样本集合N的信息熵分布包络线为QN,令QP=QN,则可得信息熵阈值T;
步骤S1.7所述的kmeans特征提取的方法具体为:
从步骤S1.5的正样本集合P中利用Kmeans方法聚类形成800个类中心,记为c={c1,c2,...,c800};对正样本集合Pi和负样本集合Ni中的每一个样本进行特征提取:
fk(x)=max{0,μ(z)-zk},
其中fk(x),表示样本x的特征的第k维,zk表示样本x到第k个聚类中心的欧式距离,μ(z)表示样本到各个聚类中心的平均距离;
步骤S1.8所述的构建决策树fi的方法具体为:
步骤S2.6所述的移动一个步长的方法具体为:
假设滑动窗口W={xi,yi,wi,hi},当滑动窗口向右移动时,步长取0.5×wi,当滑动窗口向下移动时,步长取0.5×hi;
步骤S2.7所述的调整滑动窗口的宽和高方法具体为:
第i次调整滑动窗口的宽为:
wi=(1+αi)wi-1
第i次调整滑动窗口的高为:
hi=(1+βi)hi-1
其中
步骤S2.8所述的利用K棵决策树F对候选物进行预测分类的方法具体为:
取候选物集合中的一个候选物s={x,y,w,h},将其对应的图像块缩放至16×16×3,然后拉成一行向量1×768,将此行向量右乘白化矩阵B,将候选物对应的图像块进行特征维度白化操作;每棵决策树fi对白化处理后的图像块进行分类,得到类标li∈{-1,1},其中li=-1,表示负样本,li=1表示正样本;最终图像块的类标:
l=sgn(∑(1-ai)li),
其中l∈{1,-1}。
CN201710679052.XA 2017-08-10 2017-08-10 一种基于kmeans的高效车辆检测方法 Active CN107392176B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710679052.XA CN107392176B (zh) 2017-08-10 2017-08-10 一种基于kmeans的高效车辆检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710679052.XA CN107392176B (zh) 2017-08-10 2017-08-10 一种基于kmeans的高效车辆检测方法

Publications (2)

Publication Number Publication Date
CN107392176A true CN107392176A (zh) 2017-11-24
CN107392176B CN107392176B (zh) 2020-05-22

Family

ID=60355297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710679052.XA Active CN107392176B (zh) 2017-08-10 2017-08-10 一种基于kmeans的高效车辆检测方法

Country Status (1)

Country Link
CN (1) CN107392176B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2874097A2 (en) * 2013-11-19 2015-05-20 Nokia Corporation Automatic scene parsing
CN105868773A (zh) * 2016-03-23 2016-08-17 华南理工大学 一种基于层次随机森林的多标签分类方法
CN105975937A (zh) * 2016-05-05 2016-09-28 南京学安网络科技有限公司 基于无监督学习的道路检测方法及系统
CN106096561A (zh) * 2016-06-16 2016-11-09 重庆邮电大学 基于图像块深度学习特征的红外行人检测方法
CN106503627A (zh) * 2016-09-30 2017-03-15 西安翔迅科技有限责任公司 一种基于视频分析的车辆避让行人检测方法
CN106548196A (zh) * 2016-10-20 2017-03-29 中国科学院深圳先进技术研究院 一种针对非平衡数据的随机森林抽样方法及装置
CN106570439A (zh) * 2015-10-09 2017-04-19 腾讯科技(深圳)有限公司 一种车辆检测方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2874097A2 (en) * 2013-11-19 2015-05-20 Nokia Corporation Automatic scene parsing
CN106570439A (zh) * 2015-10-09 2017-04-19 腾讯科技(深圳)有限公司 一种车辆检测方法及装置
CN105868773A (zh) * 2016-03-23 2016-08-17 华南理工大学 一种基于层次随机森林的多标签分类方法
CN105975937A (zh) * 2016-05-05 2016-09-28 南京学安网络科技有限公司 基于无监督学习的道路检测方法及系统
CN106096561A (zh) * 2016-06-16 2016-11-09 重庆邮电大学 基于图像块深度学习特征的红外行人检测方法
CN106503627A (zh) * 2016-09-30 2017-03-15 西安翔迅科技有限责任公司 一种基于视频分析的车辆避让行人检测方法
CN106548196A (zh) * 2016-10-20 2017-03-29 中国科学院深圳先进技术研究院 一种针对非平衡数据的随机森林抽样方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHIYUAN ZENG 等: "Moving Vehicle Classification Using Cloud Model", 《KEY ENGINEERING MATERIALS》 *
张彦 等: "基于深度自编码器的单样本人脸识别", 《模式识别与人工智能》 *

Also Published As

Publication number Publication date
CN107392176B (zh) 2020-05-22

Similar Documents

Publication Publication Date Title
CN106548182B (zh) 基于深度学习和主成因分析的路面裂纹检测方法及装置
CN109583482B (zh) 一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法
CN102194114B (zh) 一种基于边缘梯度方向金字塔直方图的虹膜识别方法
WO2019000653A1 (zh) 一种图像目标识别方法及装置
Kukreja et al. GAN-based synthetic data augmentation for increased CNN performance in Vehicle Number Plate Recognition
CN102521561B (zh) 基于多尺度韦伯局部特征和分层决策融合的人脸识别方法
CN102915453B (zh) 一种实时反馈更新的车辆检测方法
CN107392112A (zh) 一种人脸表情识别方法及其应用的智能锁系统
CN109522853A (zh) 面向监控视频的人脸检测与搜索方法
CN105760858A (zh) 一种基于类Haar中间层滤波特征的行人检测方法及装置
CN103295009B (zh) 基于笔画分解的车牌字符识别方法
CN110555382A (zh) 一种基于深度学习和Wasserstein距离度量的指静脉识别方法
CN105678341A (zh) 一种基于Gabor小波分析的羊毛羊绒识别算法
Kushal et al. Id card detection with facial recognition using tensorflow and opencv
CN105320948A (zh) 一种基于图像的性别识别方法、装置及系统
CN108509861B (zh) 一种基于样本学习和目标检测结合的目标跟踪方法和装置
CN114029943A (zh) 一种基于图像数据处理的目标抓取定位方法及系统
CN104463104A (zh) 一种静态车辆目标快速检测方法及装置
CN104268587B (zh) 一种基于指波变换和svm的假指纹检测方法
CN105354547A (zh) 一种结合纹理和彩色特征的行人检测方法
CN104063682A (zh) 一种基于边缘分级和centrist特征的行人检测方法
Thumthong et al. Automatic detection and recognition of Thai vehicle license plate from CCTV images
CN103984965A (zh) 基于多分辨率特征关联的行人检测方法
CN115797970B (zh) 基于YOLOv5模型的密集行人目标检测方法及系统
CN107679467A (zh) 一种基于hsv和sdalf的行人重识别算法实现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant