CN105224951B - 一种车型分类方法及分类装置 - Google Patents
一种车型分类方法及分类装置 Download PDFInfo
- Publication number
- CN105224951B CN105224951B CN201510642355.5A CN201510642355A CN105224951B CN 105224951 B CN105224951 B CN 105224951B CN 201510642355 A CN201510642355 A CN 201510642355A CN 105224951 B CN105224951 B CN 105224951B
- Authority
- CN
- China
- Prior art keywords
- vehicle
- target area
- picture
- characteristic pattern
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种车型分类方法,所述方法包括:获取含有车辆的待分类图片;提取所述待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域;采用第一预设分类器对所述目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数;对所述N个特征图进行特征提取,以得到M个特征值,所述M为大于1的整数;采用第二预设分类器对所述M个特征值进行分类;根据所述分类的结果确定所述目标区域包含的车辆的车型。本发明实施例还提供了一种分类装置,用于对车型进行分类。通过本发明实施例可对待分类图片进行两次分类,再确定车型,从而,可提高车型分类的识别精度和缩短识别时间。
Description
技术领域
本发明实施例涉及智能监控技术领域,具体涉及一种车型分类方法及分类装置。
背景技术
在智能视频监控中,车型分类技术是公安图像侦查和交通状态分析的一个前期处理中的重要分体。随着信息技术的发展,车型分类技术也得到了进一步的发展,目前的车型分类技术而非传统意义上的车型分类,其中,传统意义上的车型分类仅能分辨出车辆的大致类型,如小型车辆、中型车辆和大型车辆。而目前意义上的车型分类技术就是对从车辆的车脸区域图像中提取出的车型特征进行分类,以确定该车辆所属的品牌型号。随着计算机技术的进步,基于车脸特征的车型分类技术逐渐走向实用,不但可以识别车辆品牌,甚至可以识别该车辆品牌旗下的系列和年款,从而大大扩展了该技术在相关领域的应用。
目前,虽然基于车型特征的识别技术已经取得了不少研究成果,但是由于车辆种类繁多且车辆外形更新快,同时部分车型间前脸差别小,从而,降低了车型分类的精确。
发明内容
本发明实施例提供了一种车型分类方法及分类装置,以期提高车型分类的识别精度和缩短识别时间。
本发明实施例第一方面提供了一种车型分类方法,包括:
获取含有车辆的待分类图片;
提取所述待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域;
采用第一预设分类器对所述目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数;
对所述N个特征图进行特征提取,以得到M个特征值,所述M为大于1的整数;
采用第二预设分类器对所述M个特征值进行分类;
根据所述分类的结果确定所述目标区域包含的车辆的车型。
结合本发明实施例的第一方面,在第一方面的第一种可能的实施方式中,所述采用第一预设分类器对所述目标区域进行训练,得到N个特征图,包括:
采用预设的卷积神经网络中的卷积稀疏编码和max-pooling操作对所述目标区域进行K次迭次操作,得到N个特征图,其中,所述K为大于1的整数。
结合本发明实施例的第一方面,在第一方面的第二种可能的实施方式中,所述对所述N个特征图进行特征提取,以得到M个特征,包括:
按照如下公式构造损失函数:
其中,cl(y)表示第l层的特征值,y表示待检测图片,表示第l层的重构图片,|zk,l|l表示第l层的特征图,λl为第l层的平衡因子,所述λl大于0,k表示颜色通道,所述为所述N个特征图中的任一特征图;
对所述损失函数进行求解,以得到M个特征值。
结合本发明实施例的第一方面,在第三方面的第一种可能的实施方式中,所述根据所述分类的结果确定所述目标区域包含的车辆的车型包括:
将所述分类的结果与预设的结果进行比对以确定所述目标区域包含的车辆的车型和款式。
结合本发明实施例的第一方面,在第一方面的第四种可能的实施方式中,所述提取所述待分类图片中的目标区域包括:
对所述待分类图片进行图像分割,以得到所述待分类图片中的目标区域。
本发明实施例第二方面提供了一种分类装置,包括:
获取单元,用于获取含有车辆的待分类图片;
第一提取单元,用于提取所述获取单元获取到的待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域;
训练单元,用于采用第一预设分类器对所述第一提取单元提取的目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数;
第二提取单元,用于对所述训练单元训练得到的N个特征图进行特征提取,以得到M个特征值,所述M为大于1的整数;
分类单元,用于采用第二预设分类器对所述第二提取单元提取的M个特征值进行分类;
确定单元,用于根据所述分类单元的分类的结果确定所述目标区域包含的车辆的车型。
结合本发明实施例的第二方面,在第二方面的第一种可能的实施方式中,所述训练单元具体用于:
采用预设的卷积神经网络中的卷积稀疏编码和max-pooling操作对所述目标区域进行K次迭次操作,得到N个特征图,其中,所述K为大于1的整数。
结合本发明实施例的第二方面,在第二方面的第二种可能的实施方式中,所述第二提取单元包括:
构造单元,用于按照如下公式构造损失函数:
其中,cl(y)表示第l层的特征值,y表示待检测图片,表示第l层的重构图片,|zk,l|l表示第l层的特征图,λl为第l层的平衡因子,所述λl大于0,k表示颜色通道,所述为所述N个特征图中的任一特征图;
计算单元,用于对所述构造单元构造的损失函数进行求解,以得到M个特征值。
结合本发明实施例的第二方面,在第二方面的第三种可能的实施方式中,所述确定单元具体用于:
将所述分类的结果与预设的结果进行比对以确定所述目标区域包含的车辆的车型和款式。
结合本发明实施例的第二方面,在第二方面的第四种可能的实施方式中,所述第一提取单元具体用于:
对所述待分类图片进行图像分割,以得到所述待分类图片中的目标区域。
采用本发明实施例,具有如下有益效果:
通过本发明实施例获取含有车辆的待分类图片;提取所述待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域;采用第一预设分类器对所述目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数;对所述N个特征图进行特征提取,以得到M个特征值,所述M为大于1的整数;采用第二预设分类器对所述M个特征值进行分类;根据所述分类的结果确定所述目标区域包含的车辆的车型。本发明实施例中对待分类图片进行两次分类,再确定车型,从而,可提高车型分类的识别精度和缩短识别时间。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种车型分类方法的第一实施例流程示意图;
图2是本发明实施例提供的一种车型分类方法的第二实施例流程示意图;
图3a是本发明实施例提供的一种分类装置的第一实施例结构示意图;
图3b是本发明实施例提供的一种分类装置的第一实施例又一结构示意图;
图4是本发明实施例提供的一种分类装置的第二实施例结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下分别进行详细说明。
本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例所描述车型分类的分类装置可以包括视频矩阵、监控设备等等,上述装置仅是举例,而非穷举,包含但不限于上述分类装置。
请参阅图1,为本发明实施例提供的一种车型分类方法的第一实施例流程示意图。本实施例中所描的车型分类方法,包括以下步骤:
S101、获取含有车辆的待分类图片。
具体实现中,待分类图片可为一张单独图片,或者,待分类图片可为视频的一帧或者多帧图片,其中,待分类图片中可包含一个或者多个车辆。根据不同的分类方式,可将车辆分为不同的类。该车辆可包括但不仅限于:小型车、微车型、紧凑车型、中等车型、高级车型、豪华车型、三厢车型、CDV车型、MPV车型、SUV等等。该车辆还可为:奥迪Q7,宝马X3、奥迪A8、奥迪A4、奥迪A4L等等。又例如,比如东风类的小汽车就有25类:如东风小康-K07-2006、东风小康-K17-2009、东风小康-V07S-2011、东风小康-V29-2012、东风小康-风光-2014、东风风度-奥丁-2007、东风风度-帅客-2010、东风风度-御轩-2007、东风风度-御轩-2009、东风风度-锐骐皮卡-2007、东风风度-锐骐皮卡-2013、东风风神-A60-2012等等。
S102、提取所述待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域。
具体实现中,分类装置可对待分类图片进行图像分割,以得到待分类图片中的目标区域,例如,分类装置可采用最大类间方差法OTSU对待分类图片进行图像分割,从而,可得到车辆的轮廓,然后提取包含该轮廓的指定尺寸范围大小的区域,作为目标区域。该目标区域包含图像分割得到的车辆。
可选地,分类装置可利用该上述分类器对待分类图片进行识别,从而,可得到目标区域。该分类器可为卷积神经网络分类器。
S103、采用第一预设分类器对所述目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数。
具体实现中,第一预设分类器可为多个分类器进行级联的级联分类器,可选地,第一预设分类器可为方向梯度直方图(英文:Histogram of Gradient,缩写:HOG)和支持向量机(英文:Support Vector Machine,缩写:SVM)组成的级联分类器。优选地,第一预设分类器可为卷积神经网络。分类装置可采用卷积神经网络对目标区域进行训练,从而,得到N个特征图。
可选地,分类装置可采用预设的卷积神经网络中的卷积稀疏编码和max-pooling操作对目标区域进行K次迭次操作,得到N个特征图,其中,K为大于1的整数。分类装置在每次迭代过程中可先进行卷积层操作、再pooling层操作。使用卷积操作对目标区域进行特征提取,同时,在特征提取的过程中,该卷积操作的卷积核是通过对数据集进行学习得到的,其中,该数据集为图片库中的样本,因此,对于车型分类系统来说,特征是通过数据集进行自适应学习得到的;使用Pooling操作增加对于上一步卷积操作得到的特征的旋转不变性和扭曲不变性,可使得从数据集中进行自适应得到的特征能够有足够的不变性和鲁棒性。优选地,在权衡识别时间和准确率时,可针对硬件设备要求在调试出两个不同版本的网络。如果是借助CPU进行识别,则可采用6层的网络结构,进行训练。主要考虑单张识别时间。如果用GPU进行识别。则优选地,采用8层网络结构进行训练,因为准确率是首要考虑的问题。第一层卷积层的大小:卷积核可为7*7,滑动步长为4。卷积后的特征进行下采样,在pooling层中每3*3的区域进行采样一个最大值,采样的滑动步长为2,降维后的图片特征进行稀疏编码,可用relu函数,把像素中负的值强制转变成0值,以增加特征的稀疏性。再进行局部响应归一化,可得到的特征图是13*13。然后,再将得到的特征图进行第二次的卷积操作,首先在原来的特征图上加了1*1的边,卷积核的大小为:3*3,滑动步长为1*1,再经过relu函数把负值强制转为0。再对3*3的区域进行降采样,滑动步长是2。可将得到的特征图进行连接,形成全连接层。可选地,GPU实施本实施例的过程中,可在CPU实现方法的网络结构上加了两层网络结构,每一层网络结构包括一个卷积层、一个pooling层和激活层。进一步地,本实施例中可对pooling操作采用max-pooling函数,max-pooling函数在深度学习里的有两点重要的作用,第一,减少了上层特征的复杂度。第二,max-pooling函数具有平移不变性,如果图片有小的位移改变,提取的特征会保持不变。可选地,还可以采用mean-pooling函数进行pooling操作,因为经过大量实验证明中max-pooling函数和mean-pooling函数对车型分类影响不同。
可选地,分类装置在采用第一预设分类器对所述目标区域进行训练的过程中,可将图片库中的一部分图片作为训练样本,另一部分图片作为测试样本。训练样本跟测试样本的比例可为2:1。
S104、对所述N个特征图进行特征提取,以得到M个特征值,所述M为大于1的整数。
具体实现中,分类装置可对分别特征图i进行多尺度分解,得到多个层次的图片,对该多个层次的图片分别进行特征提取,得到多个特征值,其中,特征图i为该N个特征图中的一个。通过该方法,可得到M个特征值,其中,M为大于1的整数。
可选地,分类装置可提取N个特征图中的HOG特征或者SIFT特征,从而,得到M个特征值,该M为大于1的整数。进一步地,N个特征图都进行进行尺寸修改为128*128的图片,在训练过程每一迭代每张图片可再进行一个随机裁剪成111*111的区域。
S105、采用第二预设分类器对所述M个特征值进行分类。
具体实现中,第二预设分类器可为级联分类器或者单独的一个分类器,第二预设分类器可包括但不仅限于:支持向量机、adaboost分类器、HOG和SVM级联的分类器、线性支持向量机(英文:liblinear SVM)等等。优选地,第二预设分类器为联合贝叶斯分类器。
S106、根据所述分类的结果确定所述目标区域包含的车辆的车型。
具体实现中,即分类的结果可以看出目标车辆为哪一个车型的概率,在分类的结果确定了多个车型的概率的情况下,可将概率最大的值对应的车型确定为目标车辆的车型。可选地,车型的大类可分为货车、轿车、巴士、面包车,分类装置可先确定车辆的车型为轿车,然后确定该轿车的品牌,最后确定该品牌下面的型号。
可选地,分类装置可将分类的结果与预设的结果进行比对以确定目标区域包含的车辆的车型和款式。通过分类装置进行分类可得到车辆的车型对应的属于那种车型的概率,则预设的结果包含分类的结果,将分类的结果与预设的结果中概率最大的车型对应的车型确定为目标区域中的车辆的车型。
通过本发明实施例获取含有车辆的待分类图片;提取所述待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域;采用第一预设分类器对所述目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数;对所述N个特征图进行特征提取,以得到M个特征值,所述M为大于1的整数;采用第二预设分类器对所述M个特征值进行分类;根据所述分类的结果确定所述目标区域包含的车辆的车型。本发明实施例中对待分类图片进行两次分类,再确定车型,从而,可提高车型分类的识别精度和缩短识别时间。
请参阅图2,为本发明实施例提供的一种车型分类方法的第二实施例流程示意图。本实施例中所描述的车型分类方法,包括以下步骤:
S201、获取含有车辆的待分类图片。
具体实现中,待分类图片可为一张单独图片,或者,待分类图片可为视频的一帧或者多帧图片,其中,待分类图片中可包含一个或者多个车辆。根据不同的分类方式,可将车辆分为不同的类。该车辆可包括但不仅限于:小型车、微车型、紧凑车型、中等车型、高级车型、豪华车型、三厢车型、CDV车型、MPV车型、SUV等等。该车辆还可为:奥迪Q7,宝马X3、奥迪A8、奥迪A4、奥迪A4L等等。又例如,比如东风类的小汽车就有25类:如东风小康-K07-2006、东风小康-K17-2009、东风小康-V07S-2011、东风小康-V29-2012、东风小康-风光-2014、东风风度-奥丁-2007、东风风度-帅客-2010、东风风度-御轩-2007、东风风度-御轩-2009、东风风度-锐骐皮卡-2007、东风风度-锐骐皮卡-2013、东风风神-A60-2012等。
S202、提取所述待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域。
具体实现中,分类装置可对待分类图片进行图像分割,以得到待分类图片中的目标区域,例如,分类装置可采用最大类间方差法OTSU对待分类图片进行图像分割,从而,可得到车辆的轮廓,然后提取包含该轮廓的指定尺寸范围大小的区域,作为目标区域。该目标区域包含图像分割得到的车辆。
可选地,分类装置可利用该上述分类器对待分类图片进行识别,从而,可得到目标区域。该分类器可为卷积神经网络分类器。
S203、采用第一预设分类器对所述目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数。
具体实现中,第一预设分类器可为多个分类器进行级联的级联分类器,可选地,第一预设分类器可为方向梯度直方图(英文:Histogram of Gradient,缩写:HOG)和支持向量机(英文:Support Vector Machine,缩写:SVM)组成的级联分类器。优选地,第一预设分类器可为卷积神经网络。分类装置可采用卷积神经网络对目标区域进行训练,从而,得到N个特征图。
可选地,分类装置可采用预设的卷积神经网络中的卷积稀疏编码和max-pooling操作对目标区域进行K次迭次操作,得到N个特征图,其中,K为大于1的整数。分类装置在每次迭代过程中可先进行卷积层操作、再pooling层操作。使用卷积操作对目标区域进行特征提取,同时,在特征提取的过程中,该卷积操作的卷积核是通过对数据集进行学习得到的,其中,该数据集为图片库中的样本,因此,对于车型分类系统来说,特征是通过数据集进行自适应学习得到的;使用Pooling操作增加对于上一步卷积操作得到的特征的旋转不变性和扭曲不变性,可使得从数据集中进行自适应得到的特征能够有足够的不变性和鲁棒性。优选地,在权衡识别时间和准确率时,可针对硬件设备要求在调试出两个不同版本的网络。如果是借助CPU进行识别,则可采用6层的网络结构,进行训练。主要考虑单张识别时间。如果用GPU进行识别。则优选地,采用8层网络结构进行训练,因为准确率是首要考虑的问题。第一层卷积层的大小:卷积核可为7*7,滑动步长为4。卷积后的特征进行下采样,在pooling层中每3*3的区域进行采样一个最大值,采样的滑动步长为2,降维后的图片特征进行稀疏编码,可用relu函数,把像素中负的值强制转变成0值,以增加特征的稀疏性。再进行局部响应归一化,可得到的特征图是13*13。然后,再将得到的特征图进行第二次的卷积操作,首先在原来的特征图上加了1*1的边,卷积核的大小为:3*3,滑动步长为1*1,再经过relu函数把负值强制转为0。再对3*3的区域进行降采样,滑动步长是2。可将得到的特征图进行连接,形成全连接层。可选地,GPU实施本实施例的过程中,可在CPU实现方法的网络结构上加了两层网络结构,每一层网络结构包括一个卷积层、一个pooling层和激活层。进一步地,本实施例中可对pooling操作采用max-pooling函数,max-pooling函数在深度学习里的有两点重要的作用,第一,减少了上层特征的复杂度。第二,max-pooling函数单元具有平移不变性,如果图片有小的位移改变,提取的特征会保持不变。可选地,还可以采用mean-pooling函数函数进行pooling操作,因为经过大量实验证明中max-pooling函数和mean-pooling函数对车型分类影响不同。
可选地,分类装置在采用第一预设分类器对所述目标区域进行训练的过程中,可将图片库中的一部分图片作为训练样本,另一部分图片作为测试样本。训练样本跟测试样本的比例可为2:1。
S204、分别针对所述N个特征图构造损失函数得到N个损失函数。
具体地,可按照如下公式对N个特征图构造损失函数。
其中,cl(y)表示第l层的特征值,y表示待检测图片,表示第l层的重构图片,|zk,l|l表示第l层的特征图,λl为第l层的平衡因子,λl大于0,k表示颜色通道,所述为所述N个特征图中的任一特征图。该损失函数包括两部分,一、似然函数项,主要是输入的与y初始图片差值最小。二、正则项|zk,l|l,l1正则,其中|zk,l|1表示第l层的特征图,正则项是为了保证方程有唯一解。λl是平衡第l层重构图片和特征图|zk,l|1的贡献。
具体实现中,由于是针对彩色图片,彩色图片有多个通道组成,图片有k0个颜色通道,该k0个颜色通道分别为:图片的每一颜色通道表示为kl隐藏特征图和滤波器fk,c做卷积线性求和,即:
优选地,滤波器f对所有特征图均为共享参数。为了标记简单,将第一层卷积核求和操作放在一个卷积矩阵Fl中,二维特征图zk,1卷积后的放在向量zl中。
S205、分别对所述N个损失函数进行求解,以得到M个特征值,所述M为大于1的整数。
S206、采用第二预设分类器对所述M个特征值进行分类。
具体实现中,第二预设分类器可为级联分类器或者单独的一个分类器,第二预设分类器可包括但不仅限于:支持向量机、adaboost分类器、HOG和SVM级联的分类器、线性支持向量机(英文:liblinear SVM)等等。优选地,第二预设分类器为联合贝叶斯分类器。
S207、根据所述分类的结果确定所述目标区域包含的车辆的车型。
具体实现中,即分类的结果可以看出目标车辆为哪一个车型的概率,在分类的结果确定了多个车型的概率的情况下,可将概率最大的值对应的车型确定为目标车辆的车型。可选地,车型的大类可分为货车、轿车、巴士、面包车,分类装置可先确定车辆的车型为轿车,然后确定该轿车的品牌,最后确定该品牌下面的型号。
可选地,分类装置可将分类的结果与预设的结果进行比对以确定目标区域包含的车辆的车型和款式。通过分类装置进行分类可得到车辆的车型对应的属于那种车型的概率,则预设的结果包含分类的结果,将分类的结果与预设的结果中概率最大的车型对应的车型确定为目标区域中的车辆的车型。
通过本发明实施例获取含有车辆的待分类图片;提取所述待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域;采用第一预设分类器对所述目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数;分别针对所述N个特征图构造损失函数得到N个损失函数,分别对所述N个损失函数进行求解,以得到M个特征值,所述M为大于1的整数;采用第二预设分类器对所述M个特征值进行分类;根据所述分类的结果确定所述目标区域包含的车辆的车型。本发明实施例中对待分类图片进行两次分类,再确定车型,从而,可提高车型分类的识别精度和缩短识别时间。
请参阅图3a-图3b,其中,图3a为本发明实施例提供的一种分类装置的第一实施例结构示意图。图3a中本实施例中所描述的分类装置,包括:获取单元301、第一提取单元302、训练单元303、第二提取单元304、分类单元305和确定单元306,具体如下:
获取单元301,用于获取含有车辆的待分类图片。
第一提取单元302,用于提取所述获取单元301获取到的待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域。
作为一种可能的实施方式,第一提取单元302具体用于:
对所述待分类图片进行图像分割,以得到所述待分类图片中的目标区域。
训练单元303,用于采用第一预设分类器对所述第一提取单元302提取的目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数。
作为一种可能的实施方式,训练单元303具体用于:
采用预设的卷积神经网络中的卷积稀疏编码和max-pooling操作对所述目标区域进行K次迭次操作,得到N个特征图,其中,所述K为大于1的整数。
第二提取单元304,用于对所述训练单元303训练得到的N个特征图进行特征提取,以得到M个特征值,所述M为大于1的整数。
分类单元305,用于采用第二预设分类器对所述第二提取单元提取的M个特征值进行分类。
确定单元306,用于根据所述分类单元的分类的结果确定所述目标区域包含的车辆的车型。
作为一种可能的实施方式,确定单元306具体用于:
将所述分类的结果与预设的结果进行比对以确定所述目标区域包含的车辆的车型和款式。
作为一种可能的实施方式,如图3b所示,图3a中所描述的识别装置的第二提取单元304可包括:构造单元3041和计算单元3042,具体如下:
构造单元3041,用于按照如下公式构造损失函数:
其中,cl(y)表示第l层的特征值,y表示待检测图片,表示第l层的重构图片,|zk,l|l表示第l层的特征图,λl为第l层的平衡因子,λl大于0,k表示颜色通道,所述为所述N个特征图中的任一特征图;
计算单元3042,用于对所述构造单元3041构造的损失函数进行求解,以得到M个特征值。
通过本发明实施例所描述的识别装置可获取含有车辆的待分类图片;提取所述待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域;采用第一预设分类器对所述目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数;对所述N个特征图进行特征提取,以得到M个特征值,所述M为大于1的整数;采用第二预设分类器对所述M个特征值进行分类;根据所述分类的结果确定所述目标区域包含的车辆的车型。本发明实施例中对待分类图片进行两次分类,再确定车型,从而,可提高车型分类的识别精度和缩短识别时间。
请参阅图4,为本发明实施例提供的一种分类装置的第二实施例结构示意图。本实施例中所描述的分类装置,包括:至少一个输入设备1000;至少一个输出设备2000;至少一个处理器3000,例如CPU;和存储器4000,上述输入设备1000、输出设备2000、处理器3000和存储器4000通过总线5000连接。
其中,上述输入设备1000具体可为触摸屏、物理按键或者触控面板。
上述输出设备2000具体可为显示屏。
上述存储器4000可以是高速RAM存储器,也可为非不稳定的存储器(non-volatilememory),例如磁盘存储器。上述存储器4000用于存储一组程序代码,上述输入设备1000、输出设备2000和处理器3000用于调用存储器4000中存储的程序代码,执行如下操作:
上述处理器3000,用于
获取含有车辆的待分类图片;
提取所述待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域;
采用第一预设分类器对所述目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数;
对所述N个特征图进行特征提取,以得到M个特征值,所述M为大于1的整数;
采用第二预设分类器对所述M个特征值进行分类;
根据所述分类的结果确定所述目标区域包含的车辆的车型。
作为一种可能的实施方式,上述处理器3000采用第一预设分类器对所述目标区域进行训练,得到N个特征图,包括:
采用预设的卷积神经网络中的卷积稀疏编码和max-pooling操作对所述目标区域进行K次迭次操作,得到N个特征图,其中,所述K为大于1的整数。
作为一种可能的实施方式,上述处理器3000对所述N个特征图进行特征提取,以得到M个特征,包括:
按照如下公式构造损失函数:
其中,cl(y)表示第l层的特征值,y表示待检测图片,表示第l层的重构图片,|zk,l|l表示第l层的特征图,λl为第l层的平衡因子,λl大于0,k表示颜色通道,所述为所述N个特征图中的任一特征图;
对所述损失函数进行求解,以得到M个特征值。
作为一种可能的实施方式,上述处理器3000根据所述分类的结果确定所述目标区域包含的车辆的车型包括:
将所述分类的结果与预设的结果进行比对以确定所述目标区域包含的车辆的车型和款式。
作为一种可能的实施方式,上述处理器3000提取所述待分类图片中的目标区域包括:
对所述待分类图片进行图像分割,以得到所述待分类图片中的目标区域。
具体实现中,本发明实施例中所描述的输入设备1000、输出设备2000和处理器3000可执行本发明实施例提供的一种车型分类方法的第一实施例和第二实施例中所描述的实现方式,也可执行本发明实施例提供的一种分类装置的第一实施例中所描述的分类装置的实现方式,在此不再赘述。
通过本发明实施例所描述的识别装置可获取含有车辆的待分类图片;提取所述待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域;采用第一预设分类器对所述目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数;对所述N个特征图进行特征提取,以得到M个特征值,所述M为大于1的整数;采用第二预设分类器对所述M个特征值进行分类;根据所述分类的结果确定所述目标区域包含的车辆的车型。本发明实施例中对待分类图片进行两次分类,再确定车型,从而,可提高车型分类的识别精度和缩短识别时间。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任意一种信号处理方法的部分或全部步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可能可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明各个实施例上述方法的全部或部分步骤。其中,而前述的存储介质可包括:U盘、移动硬盘、磁碟、光盘、只读存储器(英文:Read-Only Memory,缩写:ROM)或者随机存取存储器(英文:Random Access Memory,缩写:RAM)等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种车型分类方法,其特征在于,包括:
获取含有车辆的待分类图片;
提取所述待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域;
在借助GPU的情况下,采用第一预设分类器对所述目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数,所述第一预设分类器为多个分类器进行级联的级联分类器,所述第一预设分类器采用8层网络结构进行训练,其中,第一层卷积层的大小:卷积核可为7*7,滑动步长为4,对卷积后的特征进行下采样,在pooling层中每3*3的区域进行采样一个最大值,采样的滑动步长为2,采用relu 函数对降维后的图片特征进行稀疏编码,以将像素中负的值强制转变成0值,再进行局部响应归一化,得到的特征图是13*13,将得到的特征图进行第二次的卷积操作,具体为:在所述特征图上加了1*1的边,卷积核的大小为:3*3,滑动步长为1*1,经过所述relu函数把负值强制转为0,对3*3的区域进行降采样,滑动步长是2,将得到的特征图进行连接,形成全连接层;
对所述N个特征图行特征提取,以得到M个特征值,所述M为大于1的整数;
采用第二预设分类器对所述M个特征值进行分类;
根据所述分类的结果确定所述目标区域包含的车辆的车型;
其中,所述根据所述分类的结果确定所述目标区域包含的车辆的车型包括:
将所述分类的结果与预设的结果进行比对以确定所述目标区域包含的车辆的车型和款式。
2.如权利要求1所述的方法,其特征在于,所述采用第一预设分类器对所述目标区域进行训练,得到N个特征图,包括:
采用预设的卷积神经网络中的卷积稀疏编码和max-pooling操作对所述目标区域进行K次迭次操作,得到N个特征图,其中,所述K为大于1的整数。
3.如权利要求1所述的方法,其特征在于,所述对所述N个特征图进行特征提取,以得到M个特征,包括:
按照如下公式构造损失函数:
其中,cl(y)表示第l层的特征值,y表示待检测图片,表示第l层的重构图片,|zk,l|l表示第l层的特征图,λl为第l层的平衡因子,所述λl大于0,k表示颜色通道,所述为所述N个特征图中的任一特征图;
对所述损失函数进行求解,以得到M个特征值。
4.如权利要求1所述的方法,其特征在于,所述提取所述待分类图片中的目标区域包括:
对所述待分类图片进行图像分割,以得到所述待分类图片中的目标区域。
5.一种分类装置,其特征在于,包括:
获取单元,用于获取含有车辆的待分类图片;
第一提取单元,用于提取所述获取单元获取到的待分类图片中的目标区域,其中,所述目标区域为包含车辆的区域;
训练单元,用于在借助GPU的情况下,采用第一预设分类器对所述第一提取单元提取的目标区域进行训练,得到N个特征图,其中,所述N为大于1的整数,所述第一预设分类器为多个分类器进行级联的级联分类器,,所述第一预设分类器采用8层网络结构进行训练,其中,第一层卷积层的大小:卷积核可为7*7,滑动步长为4,对卷积后的特征进行下采样,在pooling层中每3*3的区域进行采样一个最大值,采样的滑动步长为2,采用rule函数对降维后的图片特征进行稀疏编码,以将像素中负的值强制转变成0值,再进行局部响应归一化,得到的特征图是13*13,将得到的特征图进行第二次的卷积操作,具体为:在所述特征图上加了1*1的边,卷积核的大小为:3*3,滑动步长为1*1,经过所述relu函数把负值强制转为0,对3*3的区域进行降采样,滑动步长是2,将得到的特征图进行连接,形成全连接层;
第二提取单元,用于对所述训练单元训练得到的N个特征图进行特征提取,以得到M个特征值,所述M为大于1的整数;
分类单元,用于采用第二预设分类器对所述第二提取单元提取的M个特征值进行分类;
确定单元,用于根据所述分类单元的分类的结果确定所述目标区域包含的车辆的车型;
其中,所述确定单元具体用于:
将所述分类的结果与预设的结果进行比对以确定所述目标区域包含的车辆的车型和款式。
6.如权利要求5所述的分类装置,其特征在于,所述训练单元具体用于:
采用预设的卷积神经网络中的卷积稀疏编码和max-pooling操作对所述目标区域进行K次迭次操作,得到N个特征图,其中,所述K为大于1的整数。
7.如权利要求5所述的分类装置,其特征在于,所述第二提取单元包括:
构造单元,用于按照如下公式构造损失函数:
其中,cl(y)表示第l层的特征值,y表示待检测图片,表示第l层的重构图片,|zk,l|l表示第l层的特征图,λl为第l层的平衡因子,所述λl大于0,k表示颜色通道,所述为所述N个特征图中的任一特征图;
计算单元,用于对所述构造单元构造的损失函数进行求解,以得到M个特征值。
8.如权利要求5所述的分类装置,其特征在于,所述第一提取单元具体用于:
对所述待分类图片进行图像分割,以得到所述待分类图片中的目标区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510642355.5A CN105224951B (zh) | 2015-09-30 | 2015-09-30 | 一种车型分类方法及分类装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510642355.5A CN105224951B (zh) | 2015-09-30 | 2015-09-30 | 一种车型分类方法及分类装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105224951A CN105224951A (zh) | 2016-01-06 |
CN105224951B true CN105224951B (zh) | 2019-05-03 |
Family
ID=54993911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510642355.5A Active CN105224951B (zh) | 2015-09-30 | 2015-09-30 | 一种车型分类方法及分类装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105224951B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107025459A (zh) * | 2016-01-29 | 2017-08-08 | 中兴通讯股份有限公司 | 一种车型识别方法及装置 |
CN106096584A (zh) * | 2016-06-29 | 2016-11-09 | 深圳市格视智能科技有限公司 | 可拓展的基于深度卷积神经网络的间隔棒识别方法 |
CN106203330A (zh) * | 2016-07-08 | 2016-12-07 | 西安理工大学 | 一种基于卷积神经网络的车辆分类方法 |
CN106778583B (zh) * | 2016-12-07 | 2019-12-17 | 北京理工大学 | 基于卷积神经网络的车辆属性识别方法与装置 |
US10157441B2 (en) | 2016-12-27 | 2018-12-18 | Automotive Research & Testing Center | Hierarchical system for detecting object with parallel architecture and hierarchical method thereof |
CN106874940B (zh) * | 2017-01-19 | 2019-08-27 | 博康智能信息技术有限公司北京海淀分公司 | 一种建立识别车辆信息的模型的方法及装置 |
CN108446694B (zh) * | 2017-02-16 | 2020-11-27 | 杭州海康威视数字技术股份有限公司 | 一种目标检测方法及装置 |
CN107256394A (zh) * | 2017-06-09 | 2017-10-17 | 北京深瞐科技有限公司 | 驾驶员信息与车辆信息核验方法、装置以及系统 |
CN108021909A (zh) * | 2017-12-28 | 2018-05-11 | 北京悦畅科技有限公司 | 一种停车场车型预测方法及装置 |
US10467486B2 (en) | 2017-12-29 | 2019-11-05 | Automotive Research & Testing Center | Method for evaluating credibility of obstacle detection |
CN108492575A (zh) * | 2018-04-11 | 2018-09-04 | 济南浪潮高新科技投资发展有限公司 | 一种智能车辆型号识别方法 |
CN108664939A (zh) * | 2018-05-16 | 2018-10-16 | 东南大学 | 一种基于hog特征与深度学习的遥感图像飞机识别方法 |
CN109165675A (zh) * | 2018-07-26 | 2019-01-08 | 西安电子科技大学 | 基于周期性局部连接卷积神经网络的图像分类方法 |
CN109766775A (zh) * | 2018-12-18 | 2019-05-17 | 四川大学 | 一种基于深度卷积神经网络的车辆检测系统 |
CN110781849A (zh) * | 2019-10-30 | 2020-02-11 | 北京锐安科技有限公司 | 一种图像处理方法、装置、设备及存储介质 |
CN111104945B (zh) * | 2019-12-17 | 2024-08-02 | 博泰车联网科技(上海)股份有限公司 | 物体识别方法及相关产品 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8483490B2 (en) * | 2008-08-28 | 2013-07-09 | International Business Machines Corporation | Calibration of video object classification |
CN103794056B (zh) * | 2014-03-06 | 2015-09-30 | 北京卓视智通科技有限责任公司 | 基于实时双路视频流的车型精确分类系统及方法 |
CN104299008B (zh) * | 2014-09-23 | 2017-10-31 | 同济大学 | 基于多特征融合的车型分类方法 |
-
2015
- 2015-09-30 CN CN201510642355.5A patent/CN105224951B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN105224951A (zh) | 2016-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105224951B (zh) | 一种车型分类方法及分类装置 | |
Afzal et al. | Cutting the error by half: Investigation of very deep cnn and advanced training strategies for document image classification | |
Zhou et al. | Classification of histology sections via multispectral convolutional sparse coding | |
Mao et al. | Deep residual pooling network for texture recognition | |
CN102982349B (zh) | 一种图像识别方法及装置 | |
Zamberletti et al. | Text localization based on fast feature pyramids and multi-resolution maximally stable extremal regions | |
CN107545271B (zh) | 图像识别方法、装置和系统 | |
CN109409384A (zh) | 基于细粒度图像的图像识别方法、装置、介质及设备 | |
CN104376326A (zh) | 一种用于图像场景识别的特征提取方法 | |
Safdar et al. | Intelligent microscopic approach for identification and recognition of citrus deformities | |
Maire et al. | Reconstructive sparse code transfer for contour detection and semantic labeling | |
CN117015796A (zh) | 处理组织图像的方法和用于处理组织图像的系统 | |
Nanni et al. | How could a subcellular image, or a painting by Van Gogh, be similar to a great white shark or to a pizza? | |
CN105718937A (zh) | 多类别对象分类方法及系统 | |
Rashmi et al. | A comparative evaluation of texture features for semantic segmentation of breast histopathological images | |
CN109472733A (zh) | 基于卷积神经网络的图像隐写分析方法 | |
Nanni et al. | Improving the descriptors extracted from the co-occurrence matrix using preprocessing approaches | |
Naqvi et al. | Feature quality-based dynamic feature selection for improving salient object detection | |
CN112580480A (zh) | 一种高光谱遥感影像分类方法及装置 | |
CN111639697A (zh) | 基于非重复采样与原型网络的高光谱图像分类方法 | |
CN108876776A (zh) | 一种分类模型生成方法、眼底图像分类方法及装置 | |
Chen et al. | Image classification based on convolutional denoising sparse autoencoder | |
CN110956157A (zh) | 基于候选框选择的深度学习遥感影像目标检测方法及装置 | |
CN110659631A (zh) | 车牌识别方法和终端设备 | |
Chaturvedi et al. | Automatic license plate recognition system using surf features and rbf neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |