CN110533034A - 一种汽车前脸品牌分类方法 - Google Patents
一种汽车前脸品牌分类方法 Download PDFInfo
- Publication number
- CN110533034A CN110533034A CN201910786822.XA CN201910786822A CN110533034A CN 110533034 A CN110533034 A CN 110533034A CN 201910786822 A CN201910786822 A CN 201910786822A CN 110533034 A CN110533034 A CN 110533034A
- Authority
- CN
- China
- Prior art keywords
- brand
- front face
- classification
- automobile front
- automobile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/09—Recognition of logos
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种汽车前脸品牌分类方法,1)创建用于汽车品牌分类的前视图初始训练图像库。2)提取影响汽车前脸品牌分类的图像最显著区域。3)创建车标移除的汽车前脸品牌分类数据集。4)检测品牌分类遮挡不变性的敏感区域尺寸及位置,并创建相应数据集。5)合并步骤1)、3)、4)创建的三个数据集,定义为汽车前脸遮挡不变性数据集。6)采用深度学习分类器进行训练,得到汽车前脸品牌分类器。本发明的优点:1)针对汽车前脸品牌识别问题,本发明可有效识别无遮挡、部分遮挡、无车标、假车标等多个复杂工况。2)基于大规模数据的遮挡不变性识别模型库,结合深度学习分类器,方法鲁棒性高、精度高、可移植性强。
Description
技术领域
本发明涉及一种由汽车正前视图图片识别出汽车品牌,涉及一种汽车前脸图片的部分遮挡、无车标、假车标等情况的高精度汽车品牌识别方法。
背景技术
随着车辆数量的飞速增长,智能交通系统的研究领域不断扩大,车辆品牌识别(Vehicle Model Recognition,VMR)在道路交通监控与管理、驾驶员辅助驾驶等领域具有广泛的应用前景,是一个具有吸引力和重要意义的问题。VMR作为一种细粒度的识别任务,由于类间的细微差异,在计算机视觉中也是一个非常具有挑战性的问题。研究人员设计了各种方法从汽车正面视图图像中提取特征进行分类,考虑到汽车正面造型包含某些识别身份识别的信息。然而,除了较小的类间方差外,在视点、光照、遮挡、造假等方面的变化也很容易影响细粒度识别精度。
汽车车标作为不同品牌之间最显著的特征之一,对VMR具有重要意义。有大量方法通过车标识别来解决VMR问题,这要求车标必须在捕获的图像中,并且必须精确地定位并识别。然而,在真实的交通场景中,不同的视角、灯光和遮挡并不能保证这一点。品牌标识容易修改,在某些情况下,车主可能会装饰汽车标识,甚至用其他品牌的标识代替,增加了汽车品牌识别的难度。为了避免车辆被识别,一些犯罪分子在犯罪行为中篡改标志,造成巨大的安全风险和经济损失。因此,面对上述问题,一个更好的解决方案是从汽车正面实现品牌识别,学习更多的品牌特征,避免过度依赖标志。
虽然一些研究人员已经提出通过从车辆正面视图或ROI中提取特征来实现VMR,但没有研究车辆识别中是否存在关键区域或特征,也没有探讨遮挡对识别的影响。对于这些通过增加随机掩模或增加数据库大小来解决分类和检测中的遮挡或伪标志问题的工作,这些工作并没有考虑数据与识别精度在特定问题下的内在联系,因此,本发明提出了一种新的解决方法。通过对识别中敏感区域的精确定位,可以进一步提高这些方法的有效性和效率。
发明内容
针对现有问题,本发明提出了一种汽车前脸图片的部分遮挡、无车标、假车标等情况的高精度汽车品牌识别方法。
本发明的技术方案:
一种汽车前脸品牌分类方法,步骤如下:
(1)创建用于汽车前脸品牌分类的前视图初始训练图像库:整理不同品牌及其不同型号的汽车前脸图像,总样本数目不少于5000,涵盖汽车品牌数目不少于20,单一品牌图像数目不低于150;将背景信息与汽车分离并舍弃,背景色设置为白色;按照宽高比为5:2截取感兴趣区域ROI并存储新图像,尺寸统一化,根据品牌进行标注,将数据集分为60%训练集、20%校验集、20%测试集;
(2)提取影响汽车品牌分类的最显著区域:利用步骤(1)创建的初始训练库,采用深度学习分类器进行初始分类,通过可视化权重分析得车标及周围区域对品牌识别影响极大;
(3)创建车标移除的汽车前脸品牌分类数据集:根据步骤(2)得出的结论,对步骤(1)得到的初始训练图像库中的图像逐一进行后处理,去除车标,生成无车标的汽车前脸品牌分类数据集,该数据集规模与步骤(1)的初始训练图像库相同且图片一一对应,并按汽车品牌标注;
(4)检测品牌分类遮挡不变性的敏感区域尺寸及位置,并创建相应数据集:采用方形随机色彩块进行图像的部分遮挡;首先根据图像尺寸测定方形尺寸大小,进而确定该尺寸下遮挡块的确切位置;针对步骤(1)创建的数据集,创建新的随机遮挡数据集并做训练分类测试;最终确定遮挡块的高度与原始图像高度比例为1:2.8~3.2之间;进而根据识别率高低,确定影响识别率最高的十个遮挡块位置;根据上述位置,创建相应的遮挡数据集,并做标注;
(5)合并步骤1、步骤3、步骤4创建的三个数据集,定义为汽车前脸遮挡不变性数据集,并按照3:1分为训练集、验证集;
(6)采用深度学习分类器,进行训练得到分类器,然后用于汽车前脸图像的品牌识别测试。
本发明的有益效果:
1)对汽车前视图图像进行精确品牌分类。
2)对汽车前视图部分遮挡图像可实现精确品牌分类。
3)对汽车前视图无车标图像可实现精确品牌分类。
4)对汽车前视图车标造假图像可实现精确品牌分类。
本发明对比已有技术具有以下显著优点:
1)针对汽车前脸品牌识别问题,本发明可有效识别无遮挡、部分遮挡、无车标、假车标等多个复杂工况。
2)基于大规模数据的遮挡不变性识别模型库,结合深度学习分类器,方法鲁棒性高、精度高、可移植性强。
附图说明
图1为本发明的流程图。
图2(a)为汽车前视图图像。
图2(b)为图2(a)的ROI区域处理图。
图3为汽车前视图图像车标移除示意图。
图4为汽车前视图图像显著区域遮挡示意图。
图5为汽车前视图遮挡不变数据库示意图。
图6为汽车前视图遮挡不变性品牌分类器。
具体实施方式
以下结合附图和技术方案,进一步说明本发明的具体实施方式。
一种汽车前脸参数化模型全自动生成方法,步骤如下:
(1)创建用于汽车前脸品牌分类的前视图初始训练图像库:整理不同品牌及其不同型号的汽车前脸图像,总样本数目不少于5000,涵盖汽车品牌数目不少于20,单一品牌图像数目不低于150;将背景信息与汽车分离并舍弃,背景色设置为白色;按照宽高比为5:2截取感兴趣区域(ROI,参见图2(a)和图2(a)),并存储新图像,尺寸统一化,如144*360像素,根据品牌进行标注,将数据集分为60%训练集、20%校验集、20%测试集;
(2)提取影响汽车品牌分类的最显著区域。利用步骤(1)创建的初始训练库,采用深度学习分类器,如可选用VGG19、ResNet50等网络结构进行初始分类,通过可视化权重分析可得车标及周围区域对品牌识别影响极大;
(3)创建车标移除的汽车前脸品牌分类数据集。根据(2)结论,对数据集(1)中图像逐一进行后处理,去除车标,并根据车标周围细节进行填充抠除部分,生成无车标的汽车前脸品牌分类数据集,参见图3,该数据集规模与(1)相同且图片一一对应,并按汽车品牌标注;
(4)检测品牌分类遮挡不变性的敏感区域尺寸及位置,并创建相应数据集。本方法采用方形随机色彩块进行图像的部分遮挡。首先根据图像尺寸测定方形尺寸大小,进而确定该尺寸下遮挡块的确切位置。针对步骤(1)创建的数据集,创建新的随机遮挡数据集并做训练分类测试。最终确定遮挡块的高度与原始图像高度比例为1:2.8~3.2之间较为合理。进而根据识别率高低,确定影响识别率最高的十个遮挡块位置。根据上述位置,创建相应的遮挡数据集,并做标注。
参见图4。具体实施如下:
该部分由两个模块组成,即敏感区域检测模块和敏感区域移除模块。
给定训练集首先针对汽车品牌识别训练一个CNN模型。将CNN模型定义为一个从N个图像到C个类别的置信向量的映射函数置信向量y=[y1,y2,......,yc]T,其中yj(j=1,2,......,C)代表第j个类别的置信度。因此分类结果可以表述为寻找拥有最大置信度的类别。为找到分类中的敏感区域,图像中的矩形区域r=[rx,ry,w,h]被随机遮挡块p遮挡,其中rx与ry为区域左上顶点坐标,w与h分别代表矩形宽度与长度。给定验证集通过逐渐积累正确样本,可以获得最终的准确率,即g(f(Val))。将带有遮挡的验证集上的准确率定义为g(f(Val,r))。因此敏感区域定位函数可以表达为:
rΦ=max(Φf(Val,r))
Φf(Val,r)=g(f(Val))-g(f(Val,r))
其中函数Φf(Val,r)比较原验证集和被遮挡的验证集上的准确率。通过利用图像中最敏感区域被遮挡造成的准确率下降最大这一事实,可以定位汽车品牌识别中的敏感区域。本发明选择了前十个最大精度损失的区域,并将之定义为敏感区域。
以144×360像素的图像为例,确定最终遮挡块尺寸的原则如下:
·遮挡框应足够大,从而可以对识别精度造成影响。
·为避免损失过多特征并保证后续识别效果,遮挡块尺寸应有上限。
·遮挡块的尺寸应保证消除当前敏感区域后,无新的敏感区域生成。
考虑综上因素,通过实验确定遮挡块尺寸为48×48,并通过16个像素的步幅密集的生成了遮挡块,通过以上方法,每张图像可生成约140张被遮挡图像。
敏感区域定位后,采用向敏感区域添加噪声的方式以减轻模型对该区域的局部依赖程度。敏感区域消除模块将采用两种方式进行数据增强。一种为添加随机遮挡,另一种为填充纹理信息。两种方法均基于原训练集,增强后的训练集为随之CNN模型将在全新的数据集上进行二次训练,映射函数也更新为为检验其有效性,定义了一个精度损失阈值ε以限制本发明取ε设置为0.05。特别指出的是,上述精度损失阈值并不作为反馈来调节训练过程。
同时,在少数敏感区域中,精度损失可能并不满足阈值要求。这种情况下,训练集将会在这些区域上再次进行敏感区域消除并重新训练CNN模型。
与随机擦除的方法不同,本方法主要贡献在于敏感区域的精确定位,该方法不仅可以用来进行特征理解,还可以需要提供遮挡块的具体位置,减少了数据扩增中大量冗余的遮挡。
(5)合并步骤1、步骤3、步骤4创建的三个数据集,定义为汽车前脸遮挡不变性数据集,并按照3:1分为训练集、验证集,参见图5。
6)采用深度学习分类器,如ResNet50等网络结构进行训练得到分类器,然后可用于汽车前脸图像的品牌识别测试。
Claims (2)
1.一种汽车前脸品牌分类方法,其特征在于,步骤如下:
(1)创建用于汽车前脸品牌分类的前视图初始训练图像库:整理不同品牌及其不同型号的汽车前脸图像,总样本数目不少于5000,涵盖汽车品牌数目不少于20,单一品牌图像数目不低于150;将背景信息与汽车分离并舍弃,背景色设置为白色;按照宽高比为5:2截取感兴趣区域ROI并存储新图像,尺寸统一化,根据品牌进行标注,将数据集分为60%训练集、20%校验集、20%测试集;
(2)提取影响汽车品牌分类的最显著区域:利用步骤(1)创建的初始训练库,采用深度学习分类器进行初始分类,通过可视化权重分析得车标及周围区域对品牌识别影响极大;
(3)创建车标移除的汽车前脸品牌分类数据集:根据步骤(2)得出的结论,对步骤(1)得到的初始训练图像库中的图像逐一进行后处理,去除车标,生成无车标的汽车前脸品牌分类数据集,该数据集规模与步骤(1)的初始训练图像库相同且图片一一对应,并按汽车品牌标注;
(4)检测品牌分类遮挡不变性的敏感区域尺寸及位置,并创建相应数据集:采用方形随机色彩块进行图像的部分遮挡;首先根据图像尺寸测定方形尺寸大小,进而确定该尺寸下遮挡块的确切位置;针对步骤(1)创建的数据集,创建新的随机遮挡数据集并做训练分类测试;最终确定遮挡块的高度与原始图像高度比例为1:2.8~3.2之间;进而根据识别率高低,确定影响识别率最高的十个遮挡块位置;根据上述位置,创建相应的遮挡数据集,并做标注;
(5)合并步骤1、步骤3、步骤4创建的三个数据集,定义为汽车前脸遮挡不变性数据集,并按照3:1分为训练集、验证集;
(6)采用深度学习分类器,进行训练得到分类器,然后用于汽车前脸图像的品牌识别测试。
2.根据权利要求1所述的汽车前脸品牌分类方法,其特征在于,步骤(4)的具体实施如下:
该部分由两个模块组成,即敏感区域检测模块和敏感区域移除模块;
敏感区域检测模块:给定训练集首先针对汽车品牌识别目标训练一个卷积神经网络CNN模型;将CNN模型定义为一个从N个图像到C个类别的置信向量的映射函数f:记置信向量y=[y1,y2,......,yc]T,其中yj(j=1,2,......,C)代表第j个类别的置信度;因此分类结果表述为寻找拥有最大置信度的类别;为找到分类结果中的敏感区域,图像中的矩形区域r=[rx,ry,w,h]被随机遮挡块p遮挡,其中rx与ry为区域左上顶点坐标,w与h分别代表矩形宽度与长度;给定验证集通过逐渐积累正确样本,获得最终的准确率,即g(f(Val));将带有遮挡的验证集上的准确率定义为g(f(Val,r));因此敏感区域定位函数表达为:
rΦ=max(Φf(Val,r))
Φf(Val,r)=g(f(Val))-g(f(Val,r))
其中,函数Φf(Val,r)比较原验证集和被遮挡的验证集上的准确率;选择前十个最大精度损失的区域,并将之定义为敏感区域;
敏感区域移除模块:敏感区域定位后,采用向敏感区域添加噪声的方式以减轻CNN模型对该敏感区域的局部依赖程度;敏感区域移除模块将采用两种方式进行数据增强:一种为添加随机遮挡,另一种为填充纹理信息;两种方法均基于原训练集,增强后的训练集为随之CNN模型将在全新的数据集上进行二次训练,映射函数也更新为为检验其有效性,定义一个精度损失阈值ε以限制取ε设置为0.05;
同时,在少数敏感区域中,精度损失可能并不满足阈值要求;这种情况下,训练集将在这些区域上再次进行敏感区域消除并重新训练CNN模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910786822.XA CN110533034B (zh) | 2019-08-24 | 2019-08-24 | 一种汽车前脸品牌分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910786822.XA CN110533034B (zh) | 2019-08-24 | 2019-08-24 | 一种汽车前脸品牌分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110533034A true CN110533034A (zh) | 2019-12-03 |
CN110533034B CN110533034B (zh) | 2023-03-17 |
Family
ID=68662756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910786822.XA Active CN110533034B (zh) | 2019-08-24 | 2019-08-24 | 一种汽车前脸品牌分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110533034B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111982016A (zh) * | 2020-08-27 | 2020-11-24 | 科锐特(辽宁)智能装备有限责任公司 | 一种二维三维一体化视觉检测传感器及其图像处理算法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120246082A1 (en) * | 2011-03-17 | 2012-09-27 | Extraction Zones LLC | Passenger Extraction Program and a Method of Extraction |
CN103390166A (zh) * | 2013-07-17 | 2013-11-13 | 中科联合自动化科技无锡有限公司 | 基于车前脸特征的车辆型号一致性判别方法 |
CN103745598A (zh) * | 2014-01-09 | 2014-04-23 | 中科联合自动化科技无锡有限公司 | 基于前脸特征的车型识别方法 |
CN105930812A (zh) * | 2016-04-27 | 2016-09-07 | 东南大学 | 一种基于融合特征稀疏编码模型的车辆品牌类型识别方法 |
CN105975949A (zh) * | 2016-05-26 | 2016-09-28 | 大连理工大学 | 一种基于视觉信息的汽车识别方法 |
-
2019
- 2019-08-24 CN CN201910786822.XA patent/CN110533034B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120246082A1 (en) * | 2011-03-17 | 2012-09-27 | Extraction Zones LLC | Passenger Extraction Program and a Method of Extraction |
CN103390166A (zh) * | 2013-07-17 | 2013-11-13 | 中科联合自动化科技无锡有限公司 | 基于车前脸特征的车辆型号一致性判别方法 |
CN103745598A (zh) * | 2014-01-09 | 2014-04-23 | 中科联合自动化科技无锡有限公司 | 基于前脸特征的车型识别方法 |
CN105930812A (zh) * | 2016-04-27 | 2016-09-07 | 东南大学 | 一种基于融合特征稀疏编码模型的车辆品牌类型识别方法 |
CN105975949A (zh) * | 2016-05-26 | 2016-09-28 | 大连理工大学 | 一种基于视觉信息的汽车识别方法 |
Non-Patent Citations (1)
Title |
---|
李宝军等: "基于细粒度分类的汽车家族化计算分析方法", 《汽车工程学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111982016A (zh) * | 2020-08-27 | 2020-11-24 | 科锐特(辽宁)智能装备有限责任公司 | 一种二维三维一体化视觉检测传感器及其图像处理算法 |
CN111982016B (zh) * | 2020-08-27 | 2022-04-01 | 科锐特(辽宁)智能装备有限责任公司 | 一种二维三维一体化视觉检测传感器及其图像处理算法 |
Also Published As
Publication number | Publication date |
---|---|
CN110533034B (zh) | 2023-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112200161B (zh) | 一种基于混合注意力机制的人脸识别检测方法 | |
CN105160309B (zh) | 基于图像形态学分割及区域生长的三车道检测方法 | |
Zou et al. | A robust license plate recognition model based on bi-lstm | |
Gavrila et al. | Vision-based pedestrian detection: The protector system | |
CN103310194B (zh) | 视频中基于头顶像素点梯度方向的行人头肩部检测方法 | |
CN109284669A (zh) | 基于Mask RCNN的行人检测方法 | |
CN110033002A (zh) | 基于多任务级联卷积神经网络的车牌检测方法 | |
CN106529424A (zh) | 一种基于选择性搜索算法的车标检测识别方法及系统 | |
CN105354568A (zh) | 基于卷积神经网络的车标识别方法 | |
CN102609720B (zh) | 一种基于位置校正模型的行人检测方法 | |
CN108491797A (zh) | 一种基于大数据的车辆图像精确检索方法 | |
CN105404857A (zh) | 一种基于红外的夜间智能车前方行人检测方法 | |
CN105404886A (zh) | 特征模型生成方法和特征模型生成装置 | |
CN112825192B (zh) | 基于机器学习的对象辨识系统及其方法 | |
CN106557740B (zh) | 一种遥感图像中油库目标的识别方法 | |
CN110516633A (zh) | 一种基于深度学习的车道线检测方法及系统 | |
CN107480585A (zh) | 基于dpm算法的目标检测方法 | |
CN106980855A (zh) | 交通标志快速识别定位系统及方法 | |
CN108256462A (zh) | 一种商场监控视频中的人数统计方法 | |
CN105894037A (zh) | 一种基于sift训练样本提取的遥感图像全监督分类方法 | |
CN106845458A (zh) | 一种基于核超限学习机的快速交通标识检测方法 | |
CN112329559A (zh) | 一种基于深度卷积神经网络的宅基地目标检测方法 | |
CN105404858A (zh) | 一种基于深度费舍尔网络的车型识别方法 | |
Song et al. | A three-stage real-time detector for traffic signs in large panoramas | |
CN113673618A (zh) | 一种融合注意力模型的烟虫目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |