CN105205493A - 一种基于视频流的车标分类方法 - Google Patents
一种基于视频流的车标分类方法 Download PDFInfo
- Publication number
- CN105205493A CN105205493A CN201510542986.XA CN201510542986A CN105205493A CN 105205493 A CN105205493 A CN 105205493A CN 201510542986 A CN201510542986 A CN 201510542986A CN 105205493 A CN105205493 A CN 105205493A
- Authority
- CN
- China
- Prior art keywords
- car
- car mark
- mark
- class
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于视频流的车标分类方法。由于Grassmann流形的核函数矩阵能够表示Grassmann流形上两点间的相似性度量,相对于现有技术中使用欧几里得空间的距离进行图像集合之间的分类,本发明基于Grassmann空间的距离实现图像集与图像集之间的分类,能更好突出对象在不同环境下的特征,能在保留特征的前提下减少计算量,提高识别效率,使分类更加准确。
Description
技术领域
本发明属于数字图像处理技术领域,涉及车标识别技术。
技术背景
在许多计算机视觉的应用中,一个对象的特征是由一组图片表征的,在这组图片中每一幅图片都会突出该对象的一个或多个不同的特征例如视角和光照的不同或者是由于刚性或非刚性导致对象的变形等,使一些特征更明显或发生变化。特别是对于对象识别而言,人们普遍认为考虑整体对象集之间的相似关系有利于单个对象之间的相似关系。传统的基于单幅图像的鉴别分析方法由于表现场景中表现不够稳定,算法性能往往受图像质量、光照、姿态等因素的影响。随着实际应用的提高,以及视频采集技术的发展和互联网的普及,基于图像集的鉴别分析得到了越来越多的关注。基于图像识别以单幅图像表示一个个体,而基于图像集的识别可通过视频采集或不同时期、场景下得到的多幅图像组成的集合作为个体进行训练和识别。由于图像集本保函有更多的动态信息,通过提取动态特征,可以更有效地反应对象的本质,易于消除各种干扰因素的影响,使识别更具有稳定性,得到更准确的分类效果。车标识别则是车辆识别系统的重要一项,车标由于种类多、面积小、所在位置不固定等特征对于识别有相当大的难度,当前对于车标还没有非常有效的方法,识别技术主要有以下方法:
1、基于模板匹配的识别方法。基于模板匹配的识别方法易受图像旋转、变形、尺度变换影响,匹配方法基于二值化结果,图像二值化的准确度决定了识别率的高低,同时二值化后的图像轨迹的粗细也是影响识别结果的一个因素。为了提高识别准确率,往往需要使用更多的二值模板进行匹配,即同一类图像制作多个模板,这样导致处理时间大大的增加。详见:邢向华,顾国华.基于模板匹配和特征点匹配相结合的快速车牌识别方法.光电子技术,2003,23(4):268-270
2、基于PCA和边缘不变矩的车标识别新方法。由于基于PCA算法首先需要计算投影矩阵,由于车标的种类比较多、在车辆图片中的比例比较小、噪声比较多,从而导致不同车标在投影矩阵中的投影较相似难以区分,识别率较低。详见:WANGMei,WANGGuo-hong,GAOXiao-lin,eta1.Newmethodofvehicle-logorecognitionbaseonPCAandEdgeinvariantmoment.ComputerEngineeringandApplications,2008,44(4):224—226.
3、基于HOG特征的识别算法。该方法对车标图像提取HOG特征,将特征转换为“01”二进制码,表征该字符图像的“指纹”信息,通过与字符模板库中的“指纹”信息进行汉明距离比较,找出该图像对应的类别。详见:李驰.智能交通中的车牌识别算法研究.华中科技大学.硕士学位论文,2012.2
发明内容
本发明所要解决的技术问题是,提供一种基于格拉斯曼Grassmann流形的视频流的车标识别算法。
本发明为解决上述技术问题所采样的技术方案是,一种基于视频流的车标分类方法,包括以下步骤:
1训练阶段
1.1预处理
建立训练集{x1,x2…xn},n表示训练集中车标图片总数,确定样本车标类总数为C,车标类集合为{1,2,…C,unlabelled},unlabelled表示未标记的类;
对每一个样本车标类下的图片进行分组,每一组包含该车标类下的k幅图片;每一个样本车标类包含多种光照与角度下的该车标类下的车标图片;训练集中所有车标类下的图片共分为N组;
将每一幅图片的像素值拉成一维的列向量,一组图片形成列数为k的图形矩阵Mi;
对图形矩阵Mi进行奇异值分解SVD得到D个特征值对应的特征向量组成的特征矩阵Xi,从而得到所有已标记车标类下训练样本yi表示第i组图片对应的车标类;
1.2训练
将训练样本X输入最近邻分类器进行训练,根据输入的训练样本X计算Grassmann流形的核函数矩阵Ki,并构建领域图计算出投影矩阵A,得到训练样本在特征空间上的投影向量Vi=ATKi;
2识别阶段
2.1车标定位:
对输入图片进行车标定位,确定车标区域得到车标图片;
2.2车标识别:
对车标图片进行奇异值分解SVD得到D个特征值对应的特征向量组成的特征矩阵Xq作为测试样本,再根据测试样本计算核函数矩阵Kq,最终得到测试样本在特征空间上的投影向量Vq=ATKq,A为投影矩阵,iT表示矩阵转置,
将测试样本投影向量Vq输入最近邻分类器,最近邻分类器根据测试样本投影向量Vq与各训练样本投影向量的欧式距离进行车标分类。
本发明的有益效果是,由于Grassmann流形的核函数矩阵能够表示Grassmann流形上两点间的相似性度量,相对于现有技术中使用欧几里得空间的距离进行图像集合之间的分类,本发明基于Grassmann空间的距离实现图像集与图像集之间的分类,能更好突出对象在不同环境下的特征,能在保留特征的前提下减少计算量,提高识别效率,使分类更加准确。
具体实施方式
为了方便地描述本发明内容,首先对一些现有术语进行定义。
定义1、Grassmann流形G(m,D)是D维欧几里得空间RD的m维线性子空间的集合。即:G(m,D)=Ο(D)/Ο(m)×Ο(D-m)其中O(m)表示m×m维的单位正交矩阵。一个线性子空间可看作Grassmann流形上的一个点,G(m,D)上的元素可以由一个D×m正交矩阵YD×m表示。YTY=Im为m×m的单位矩阵。
定义2、Grassmann流形上的主角。线性子空间之间的距离通常是基于主角(principalangle)的。
假设P1和P2为任意两个D×m维正交矩阵,即P1∈RD×m,P2∈RD×m,其生成的子空间L1=span(p1)和L2=span(p2)之间的主角0≤θ1≤θ2≤…≤θm≤π/2定义:
约束条件为:
主角可以通过(SVD)矩阵的奇异值分解得到
正交矩阵Y1和Y2即:span(p1)和span(p2),且特征值为λi=cosθi。
定义3、Grassmann流形上的距离。假设χ为任意图像集,作为一种距离度量d:对于任意的X1,X2,X3∈χ,首先要满足以下四个条件:
1.d(X1,X2)≥0
2.d(X1,X2)=0当且仅当X1=X2
3.d(X1,X2)=d(X2,X1)
4.d(X1,X2)+d(X2,X3)≥d(X1,X3)
Grassmann流形G(m,D)是RD中所有m维线性子空间的合集,若图像集X1、X2用线性子空间描述,则他们之间的Grassmann距离可以用两个子空间之间的主角来表示,如:
测地距离(弧长):
投影距离:
主角本身就是一种直观且计算简便的定义Grassmann流形上两个子空间距离的方法。主角可以认为是Grassmann距离的简单形式,其反映的是子空间每一维数上的相似度量,而Grassmann距离更能反映子空间沿流形表面的几何结构上的差异。
定义4、Grassmann上的核函数
Grassmann流形上两点间的相似性度量可以由Grassmann核来表示,下面给出相应的Grassmann流形上的核函数定义。
假设χ为任意图像集,对任意的Xi,Xj∈χ,定义对乘实值函数k:k(Xi,Xj)=k(Xj,Xi)。若对于所有X1,…,Xn(Xi∈χ),满足则k给正定核函数。Grassman核函数为G上的正定核函数。
投影核projectionkernel。投影距离可以理解为Grassmann流形上的一个样本点span(X)到投影矩阵XXT的映射:span(X)→XXT,投影Ψp(G(m,D))为一组秩为m的正交投影矩阵,对应的空间上的内积为因此,投影核可定义为:
通过Grassmann核可以将Grassmann空间看作是欧几里得(Euclidean)向量空间来处理,因此向量空间中的方法可以很容易移植到Grassmann流行上。
实施例技术方案如下:
车标定位
样本图片与测试图片均可以通过以下车标定位的方法来确定车标位置。
步骤1-1:车牌定位
按照人的视觉感受,车牌、车标及车辆的具体类型是车头图像中最有价值的特征信息。车牌是整个车辆信息中最重要的特征,他相当于车辆的“身份证”。车牌区域具有边缘丰富,背景与颜色特征固定等特征。因此本文采用车牌的空间边缘信息和颜色信息对车牌进行定位,再利用车牌图像的特征进行伪车牌图像的多重判断,得出更为可靠的定位结果。
步骤1-2:车标粗定位
根据车辆的车头部分的拓扑结构关系,车标处于车牌区域的正上方中间位置,周围是本车型特有的横条花纹,从而可以在定位车牌的基础上去寻找车标的位置。取车牌定位矩形区域(x1,y1,height1,width1),x1为矩形区域左上角点的横坐标,y1为矩形区域左上角点的纵坐标,height1为矩形区域的高,width1为矩形区域的宽。车标的大体区域可以定位为:(x1,y1-5*height1,5*height1,width1)即牌上方5倍车牌高度的区域。
步骤1-3:车标精定位
车标具有复杂的纹理信息,车标种类和车标背景区域(散热片)纹理也有许多种,根据纹理信息和位置信息,首先对粗定位区域进行灰度图像的边缘检测,得到边缘信息,再对图像进行形态学处理进行闭运算,使车标区域整体显现,由于车标背景具有对称性,以矩形区域中间位置为起点对左右对称的疑似车标背景区域进行去除,根据位置信息和纹理信息最终确定车标区域。
车标识别
采用最近邻分类器进行分类
原理:给定Grassmann流形G上N个数据点其中yi∈{1,2,…C,unlabelled}为样本标记,C为样本类别总数,未标记为unlabelled。Grassmann流形的局部几何结构可以由邻域图W来描述。W由公式定义为:
XjGrassmann流形G上某个数据点,0≤γ≤1,0≤β≤1,knn(Xi)为Xi的邻域距离即Grassmann流形核距离大小。我们的目标是将数据点X投影到新的流形X'之后,在保持数据几何结构的同时最大化模型的鉴别能力。投影记作α:G→G`,Xi→Yi,定义目标函数:假设流形上的点并没有显示表示,而是仅知道点之间的相似度量,用Grassmann核函数表示,即kij=<Xi,Xj>
类似KPCA,考虑线性变换,高维空间中的特征向量αi可由Xi的线性组合表示,即有Yi=[<α1,Xi>,<α2,Xi>,…<αd,Xi>]T,其中d为G`上子空间的维数,即G`为上d维子空间所在的Grassmann流形,特征向量αi构成投影矩阵α=[α1,…,αd]。
记Al=(αl1,…αlN)T,Ki=(k1i,…kNi)T,则
代入目标函数,可得:
其中,A=[A1|A2|…|Ad],K=[K1|K2|…|KN]。加入约束条件ATKDKTA=1,且将目标函数转化为最大化问题,有:
min{ATKDKTA-ATKWKTA}
=min{1-ATKWKTA}约束条件:ATKDKTA=1
=max{ATKWKTA}
最大化准则函数可以转换为特征值求解问题:KWKTA=λKDKTA保留d个最大的特征值对应的特征向量,得到投影A=[A1|A2|…|Ad]。
一旦得到了投影A,Grassmann上的分类问题将转化为向量空间的分类。对于一个输入的图像Xq,将其投影到特征空间,在第k个特征向量上的投影为:
其中kq=[<X1,Xq>,…,<XN,Xq>]T,最后特征空间上的投影向量为Vq=ATKq。对于训练集中的样本,同样做投影Vi=ATKi,最后根据最近邻分类器进行分类。
一、训练阶段
1.1训练集的预处理
假设训练集{x1,x2…xn}中有n幅图片,分别属于C个不同的类,即标记为{y1,y2…yn}且yi∈{1,2,…C,unlabelled},对每个图集类中的每k个图片分为一组,每一个样本车标类包含多种光照与角度下的该车标类下的车标图片,把每一幅图片xi=Mp×q拉成一维的列向量ui=M1×pq从而k幅图片组成为k×m(m=pq)的矩阵在对Mi进行奇异值分解取SVD最大的D个特征值对应的特征向量组成的特征矩阵从而得到训练样本其中为训练样本中任意两个特征矩阵,yi∈{1,2,…C,unlabelled}为样本标记,C为样本类别总数,未标记记为unlabelled。
1.2输入最近邻分类器
1、训练样本其中为子空间的正交基,由图像集上的SVD分解得到。yi∈{1,2,…C,unlabelled}为样本标记,训练集中所有车标类下的图片共分为N组;
1.3最近邻分类器训练过程
1、对所有的Xi和Xj,Xi和Xj表示训练样本中任意两个计算核函数矩阵[K]ij;
2、选取近邻,构建邻域图,并计算权值矩阵W以及对角阵D
3、计算投影矩阵A,求解下式特征值分解问题:
KWKTA=λKDKTA保留d个最大的特征值对应的特征向量,得到投影矩阵A=[A1|A2…|Ad]
二、识别阶段,车标位置的确定见上述的车标定位;
1、对车标图片进行奇异值分解SVD得到D个特征值对应的特征向量组成的特征矩阵Xq作为测试样本,将测试样本Xq输入最近邻分类器;
2、根据测试样本计算核函数矩阵Kq;
3、计算测试样本在特征空间上的投影向量Vq=ATKq;
4、最近邻分类器根据测试样本投影向量Vq与各训练样本投影向量的欧式距离进行车标分类;
5、输出:Xq的类别标记yq。
Claims (2)
1.一种基于视频流的车标分类方法,其特征在于,包括以下步骤:
1训练阶段
1.1预处理
建立训练集{x1,x2…xn},n表示训练集中车标图片总数,确定样本车标类总数为C,车标类集合为{1,2,…C,unlabelled},unlabelled表示未标记的类;
对每一个样本车标类下的图片进行分组,每一组包含该车标类下的k幅图片;每一个样本车标类包含多种光照与角度下的该车标类下的车标图片;训练集中所有车标类下的图片共分为N组;
将每一幅图片的像素值拉成一维的列向量,一组图片形成列数为k的图形矩阵Mi;
对图形矩阵Mi进行奇异值分解SVD得到D个特征值对应的特征向量组成的特征矩阵Xi,从而得到所有已标记车标类下训练样本yi表示第i组图片对应的车标类;
1.2训练
将训练样本X输入最近邻分类器进行训练,根据输入的训练样本X计算Grassmann流形的核函数矩阵Ki,并构建领域图计算出投影矩阵A,得到训练样本在特征空间上的投影向量Vi=ATKi;
2识别阶段
2.1车标定位:
对输入图片进行车标定位,确定车标区域得到车标图片;
2.2车标识别:
对车标图片进行奇异值分解SVD得到D个特征值对应的特征向量组成的特征矩阵Xq作为测试样本,再根据测试样本计算核函数矩阵Kq,最终得到测试样本在特征空间上的投影向量Vq=ATKq,A为投影矩阵,·T表示矩阵转置,
将测试样本投影向量Vq输入最近邻分类器,最近邻分类器根据测试样本投影向量Vq与各训练样本投影向量的欧式距离进行车标分类。
2.如权利要求1所述一种基于视频流的车标分类方法,其特征在于,车标定位中车标区域的确定方法为:
先确定车牌所在的矩形区域(x1,y1,height1,width1),x1为矩形区域左上角点的横坐标,y1为矩形区域左上角点的纵坐标,height1为矩形区域的高,width1为矩形区域的宽,再将车牌上方5倍车牌高度的区域作为车标粗定位区域(x1,y1-5*height1,5*height1,width1);
在车标粗定位区域内根据纹理信息从车标粗定位区域的中间位置为起点去除具有左右对称性的粗车标背景区域后得到车标精定位区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510542986.XA CN105205493A (zh) | 2015-08-29 | 2015-08-29 | 一种基于视频流的车标分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510542986.XA CN105205493A (zh) | 2015-08-29 | 2015-08-29 | 一种基于视频流的车标分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105205493A true CN105205493A (zh) | 2015-12-30 |
Family
ID=54953165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510542986.XA Pending CN105205493A (zh) | 2015-08-29 | 2015-08-29 | 一种基于视频流的车标分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105205493A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503750A (zh) * | 2016-11-02 | 2017-03-15 | 广州大学 | 一种融合差分子空间与正交子空间的图像集分类方法 |
CN108694411A (zh) * | 2018-04-03 | 2018-10-23 | 南昌奇眸科技有限公司 | 一种识别相似图像的方法 |
CN109509169A (zh) * | 2018-09-05 | 2019-03-22 | 广东电网有限责任公司 | 基于近邻分类的距离度量学习的压板状态检测装置与方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070041638A1 (en) * | 2005-04-28 | 2007-02-22 | Xiuwen Liu | Systems and methods for real-time object recognition |
CN103412003A (zh) * | 2013-08-21 | 2013-11-27 | 电子科技大学 | 基于半监督领域自适应的气体检测方法 |
-
2015
- 2015-08-29 CN CN201510542986.XA patent/CN105205493A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070041638A1 (en) * | 2005-04-28 | 2007-02-22 | Xiuwen Liu | Systems and methods for real-time object recognition |
CN103412003A (zh) * | 2013-08-21 | 2013-11-27 | 电子科技大学 | 基于半监督领域自适应的气体检测方法 |
Non-Patent Citations (1)
Title |
---|
肖睿 等: "基于 Grassmann 流形的半监督图像集鉴别分析", 《微型电脑应用》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503750A (zh) * | 2016-11-02 | 2017-03-15 | 广州大学 | 一种融合差分子空间与正交子空间的图像集分类方法 |
CN106503750B (zh) * | 2016-11-02 | 2019-07-23 | 广州大学 | 一种融合差分子空间与正交子空间的图像集分类方法 |
CN108694411A (zh) * | 2018-04-03 | 2018-10-23 | 南昌奇眸科技有限公司 | 一种识别相似图像的方法 |
CN108694411B (zh) * | 2018-04-03 | 2022-02-25 | 南昌奇眸科技有限公司 | 一种识别相似图像的方法 |
CN109509169A (zh) * | 2018-09-05 | 2019-03-22 | 广东电网有限责任公司 | 基于近邻分类的距离度量学习的压板状态检测装置与方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liao et al. | Rotation-sensitive regression for oriented scene text detection | |
CN106650731B (zh) | 一种鲁棒的车牌、车标识别方法 | |
Tuzel et al. | Human detection via classification on riemannian manifolds | |
CN108171136B (zh) | 一种多任务卡口车辆以图搜图的系统及方法 | |
Gonzalez et al. | Text detection and recognition on traffic panels from street-level imagery using visual appearance | |
Zhou et al. | Principal visual word discovery for automatic license plate detection | |
Payet et al. | From contours to 3d object detection and pose estimation | |
Shahab et al. | ICDAR 2011 robust reading competition challenge 2: Reading text in scene images | |
Biglari et al. | A cascaded part-based system for fine-grained vehicle classification | |
CN105335702B (zh) | 一种基于统计学习的卡口车型识别方法 | |
CN101140623A (zh) | 一种基于支持向量机的视频对象识别方法及系统 | |
Rothacker et al. | Bag-of-features representations for offline handwriting recognition applied to Arabic script | |
Wang et al. | License plate segmentation and recognition of Chinese vehicle based on BPNN | |
CN103310195A (zh) | 车辆高分遥感图像的基于llc特征的弱监督识别方法 | |
Garz et al. | Layout analysis for historical manuscripts using sift features | |
CN106485253B (zh) | 一种最大粒度结构描述符的行人再辨识方法 | |
Ye et al. | Pedestrian detection in video images via error correcting output code classification of manifold subclasses | |
Amores et al. | Boosting contextual information in content-based image retrieval | |
CN115205570A (zh) | 一种基于对比学习的无监督跨域目标重识别方法 | |
Richarz et al. | Towards semi-supervised transcription of handwritten historical weather reports | |
Zhang et al. | Vehicle license plate detection and recognition using deep neural networks and generative adversarial networks | |
CN105205493A (zh) | 一种基于视频流的车标分类方法 | |
CN106529391B (zh) | 一种鲁棒的限速交通标志检测与识别方法 | |
Lin et al. | Learning contour-fragment-based shape model with and-or tree representation | |
Zhang et al. | All-content text recognition method for financial ticket images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151230 |