CN106650660A - 一种车型识别方法及终端 - Google Patents
一种车型识别方法及终端 Download PDFInfo
- Publication number
- CN106650660A CN106650660A CN201611178196.9A CN201611178196A CN106650660A CN 106650660 A CN106650660 A CN 106650660A CN 201611178196 A CN201611178196 A CN 201611178196A CN 106650660 A CN106650660 A CN 106650660A
- Authority
- CN
- China
- Prior art keywords
- image
- vehicle
- target
- features
- classifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012549 training Methods 0.000 claims description 44
- 238000012545 processing Methods 0.000 claims description 20
- 238000000513 principal component analysis Methods 0.000 claims description 17
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 14
- 238000004590 computer program Methods 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/584—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种车型识别方法及终端,所述方法包括:获取第一目标图像,所述第一目标图像中包含第一车辆;获取第二目标图像,所述第二目标图像中包含第二车辆;确定出所述第一目标图像的第一车辆区域和所述第二目标图像的第二车辆区域;分别将所述第一车辆区域和所述第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像;采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离;在所述余弦距离小于预设阈值时,确定所述第一车辆和所述第二车辆为同一车型;在所述余弦距离大于或等于所述预设阈值时,确定所述第一车辆和所述第二车辆为不同车型。通过本发明实施例可识别出同一车型的车辆。
Description
技术领域
本发明涉及视频监控技术领域,具体涉及一种车型识别方法及终端。
背景技术
随着交通运输业的快速发展,人们的出行日益便捷,但与此同时也伴随着频繁发生的交通事故、交通拥堵等现象,使得交通安全问题越来越成为人们重点关注的问题。在现代的科技背景下,人们引入了智能交通运输系统(Intelligent Transportation System,ITS)。
目前来看,车型识别及时作为智能交通运输系统的一个重要应用,虽然车型识别技术已经取得了非常大的进步,识别率非常高,速度也很快。但是,该技术目前还存在很多未被解决的难题,比如光照、角度等问题带来的识别上的干扰,因而,如何识别出两辆车是否为同一车型的问题有待解决。
发明内容
本发明实施例提供了一种车型识别方法及终端,以期可识别出同一车型的车辆。
本发明实施例第一方面提供了一种车型识别方法,包括:
获取第一目标图像,所述第一目标图像中包含第一车辆;
获取第二目标图像,所述第二目标图像中包含第二车辆;
确定出所述第一目标图像的第一车辆区域和所述第二目标图像的第二车辆区域;
分别将所述第一车辆区域和所述第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像;
采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离;
在所述余弦距离小于预设阈值时,确定所述第一车辆和所述第二车辆为同一车型;
在所述余弦距离大于或等于所述预设阈值时,确定所述第一车辆和所述第二车辆为不同车型。
可选地,所述采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离,包括:
采用所述目标分类器对所述第一图像进行训练,得到P个特征,所述P为大于1的整数;
采用所述目标分类器对所述第二图像进行训练,得到Q个特征,所述Q为大于1的整数;
分别对所述P个特征和所述Q个特征进行主成分分析PCA处理,得到所述P个目标特征和所述Q个目标特征;
根据所述P个目标特征和所述Q个目标特征确定所述第一图像和所述第二图像之间的余弦距离。
可选地,所述目标分类器为神经网络分类器,所述神经网络分类器的softmax工具箱中加入了center loss函数。
可选地,所述center loss函数如下:
其中,表示第yi类的中心深层特征,m表示批量处理图像的数据量大小,xi表示第i张图像的深层特征,Lc为center loss函数。
可选地,在所述获取第一目标图像之前,所述方法还包括:
获取所述第一车辆的车型的正样本集和负样本集;
对所述正样本集合所述负样本集进行特征提取,得到多个特征;
对所述多个特征进行训练,得到所述目标分类器。
本发明实施例第二方面提供了一种终端,包括:
第一获取单元,用于获取第一目标图像,所述第一目标图像中包含第一车辆;
第二获取单元,用于获取第二目标图像,所述第二目标图像中包含第二车辆;
第一确定单元,用于确定出所述第一目标图像的第一车辆区域和所述第二目标图像的第二车辆区域;
处理单元,用于分别将所述第一车辆区域和所述第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像;
计算单元,用于采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离;
第二确定单元,用于在所述余弦距离小于预设阈值时,确定所述第一车辆和所述第二车辆为同一车型;
所述第二确定单元,还具体用于:
在所述余弦距离大于或等于所述预设阈值时,确定所述第一车辆和所述第二车辆为不同车型。
可选地,所述计算单元包括:
训练模块,用于采用所述目标分类器对所述第一图像进行训练,得到P个特征,所述P为大于1的整数;
所述训练模块,还具体用于:
采用所述目标分类器对所述第二图像进行训练,得到Q个特征,所述Q为大于1的整数;
处理模块,用于分别对所述P个特征和所述Q个特征进行主成分分析PCA处理,得到所述P个目标特征和所述Q个目标特征;
确定模块,用于根据所述P个目标特征和所述Q个目标特征确定所述第一图像和所述第二图像之间的余弦距离。
可选地,所述目标分类器为神经网络分类器,所述神经网络分类器的softmax工具箱中加入了center loss函数。
可选地,所述center loss函数如下:
其中,表示第yi类的中心深层特征,m表示批量处理图像的数据量大小,xi表示第i张图像的深层特征,Lc为center loss函数。
可选地,所述终端还包括:
第三获取单元,用于在所述第一获取单元获取第一目标图像之前,获取所述第一车辆的车型的正样本集和负样本集;
提取单元,用于对所述正样本集合所述负样本集进行特征提取,得到多个特征;
训练单元,用于对所述多个特征进行训练,得到所述目标分类器。
实施本发明实施例,具有如下有益效果:
通过本发明实施例,获取第一目标图像,第一目标图像中包含第一车辆,获取第二目标图像,第二目标图像中包含第二车辆,确定出,第一目标图像的第一车辆区域和第二目标图像的第二车辆区域,分别将,第一车辆区域和,第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像,采用目标分类器计算出第一图像和第二图像之间的余弦距离,在余弦距离小于预设阈值时,确定第一车辆和所述第二车辆为同一车型,在余弦距离大于或等于预设阈值时,确定第一车辆和所述第二车辆为不同车型。如此,可识别出同一车型的车辆。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种车型识别方法的第一实施例流程示意图;
图2是本发明实施例提供的一种车型识别方法的第二实施例流程示意图;
图3a是本发明实施例提供的一种终端的第一实施例结构示意图;
图3b是本发明实施例提供的图3a所描述的终端的计算单元的结构示意图;
图3c是本发明实施例提供的图3a所描述的终端的又一结构示意图;
图4是本发明实施例提供的一种终端的第二实施例结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明实施例所描述终端可以包括智能手机(如Android手机、iOS手机、WindowsPhone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备(MID,Mobile InternetDevices)或穿戴式设备等,上述仅是举例,而非穷举,包含但不限于上述终端。
深度学习作为机器学习研究中的一个新领域,这两年在图像识别、语音识别以及自然语言处理方面取得了巨大的成功。深度学习是通过构建多层神经网络模型来训练数据,可以学习出有用的特征,通过对大量样本学习可以得到很高的识别正确率。但是在同时需要识别多个属性时,已有的深度学习方法往往是通过将各个属性独立出来,为每一个属性训练一个模型,这无疑大大增加了复杂度。因此,如何将各个属性联系起来,通过设计一个模型即可对多个属性进行识别成为当下继续解决的问题。
本发明实施例公开一种基于深度学习的车型识别方法。该方法在训练过程中基于softmax loss的基础上引入center loss,提高了准确率。主要包括以下3个步骤:获取第一目标图像,所述第一目标图像中包含第一车辆;
获取第二目标图像,所述第二目标图像中包含第二车辆;
确定出所述第一目标图像的第一车辆区域和所述第二目标图像的第二车辆区域;
分别将所述第一车辆区域和所述第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像;
采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离;
在所述余弦距离小于预设阈值时,确定所述第一车辆和所述第二车辆为同一车型;
在所述余弦距离大于或等于所述预设阈值时,确定所述第一车辆和所述第二车辆为不同车型。
上述步骤可归纳为下述三个步骤:
1)、首先,将从输入的图像中检测到车型区域并截取车型区域图像,然后将车型图像对齐,缩放到特定尺寸。
2)、其次,所有训练图像均由上述预处理后作为输入,通过CNN训练得到车型的特征,并在softmax的基础上加入center loss,使学到的特征具有更加好的泛化能力和辨别能力。通过惩罚每个种类的样本与该种类样本中心的偏移,使得同一种类的样本尽量聚合在一起。相对于triplet和contrastive来说,这个目标相对清晰,而且不需要像前两者那样构造大量的训练对。
3)、最后,两张车型图像均经过步骤(1)和(2),获取到相应的特征,作为本步的输入,通过训练好的模型,计算出两张车型图像进过PCA后的余弦距离,并与先验的阈值进行对比,如距离大于预设阈值,则认为这两张车型图像非同一辆车,否则为同一辆车。
请参阅图1,为本发明实施例提供的一种车型识别方法的第一实施例流程示意图。本实施例中所描述的车型识别方法,包括以下步骤:
101、获取第一目标图像,所述第一目标图像中包含第一车辆。
可选地,第一目标图像中可包含第一车辆。
102、获取第二目标图像,所述第二目标图像中包含第二车辆。
103、确定出所述第一目标图像的第一车辆区域和所述第二目标图像的第二车辆区域。
其中,第一车辆区域为包含第一车辆的区域,第二车辆区域未包含第二车辆的区域。
104、分别将所述第一车辆区域和所述第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像。
其中,第一车辆区域在进行对齐及缩放到指定尺寸后,得到第一图像,第二车辆区域在进行对齐及缩放到指定尺寸后,得到第二图像。上述指定尺寸可由系统默认或者用户自行设置。在数据预处理阶段,通过对数据的增强来提高CNN模型的识别能力和泛化能力。本发明将使用以下方法对预处理阶段所得到的车型图像进行数据增强。首先,对颜色的数据增强,主要包括对色彩的饱和度、亮度以及对比度等方面。其次,对CNN网络的输入数据进行规范化,计算车型图像的RBG颜色通道的均值和标准差,并在整个训练集上计算了协方差矩阵,最后进行特征分解得到特征向量和特征值,并做PCA Jittering处理。最后,在训练的时候采用随机的图像差值方式对车型图像进行裁剪和缩放。
105、采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离。
可选地,上述步骤105中,采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离,可包括如下步骤:
51)、采用所述目标分类器对所述第一图像进行训练,得到P个特征,所述P为大于1的整数;
52)、采用所述目标分类器对所述第二图像进行训练,得到Q个特征,所述Q为大于1的整数;
53)、分别对所述P个特征和所述Q个特征进行主成分分析PCA处理,得到所述P个目标特征和所述Q个目标特征;
54)、根据所述P个目标特征和所述Q个目标特征确定所述第一图像和所述第二图像之间的余弦距离。
可选地,整个网络结构包括3个卷积层和3个局部卷积层以及一个全连接层。
卷积神经网络(CNN)已经广泛应用于计算机视觉领域,显著提高现有计算机视觉水平。在大多数可用的CNN中,softmax损失函数被用作训练深度模型的监视信号。为了增强深度学习特征的识别能力,本发明实施例为车型识别任务提出一种新的监视信号,称作为中心损失函数(center loss)。center loss的原理主要是在softmax loss的基础上,通过对训练集的每个类别在特征空间分别维护一个类中心,在训练过程,增加样本经过网络映射后在特征空间与类中心的距离约束,从而兼顾了类内聚合与类间分离。同样是作为训练阶段的辅助loss,center loss相对于contrastive loss和triplet loss的优点显然省去了复杂并且含糊的样本对构造过程,只需要在特征输出层中引入即可。通过softmax和center loss的联合监视,我们可以训练出足够强大的CNN,得到两个关键学习目标的深层特征以及尽可能高的类间分散性和类内紧密性,有利于提高准确性。
可选地,上述目标分类器为神经网络分类器,该神经网络分类器的softmax工具箱中加入了center loss函数。
进一步可选地,所述center loss函数如下:
其中,表示第yi类的中心深层特征,m表示批量处理图像的数据量大小,xi表示第i张图像的深层特征,Lc为center loss函数。
具体地,为了开发有效的损失函数来提高辨别力的深层特征学习,其关键在于最小化类内变化同时保持不同类的特征可分离,因此,本发明实施例中提出了中心损失函数。中心损失函数定义如下:
其中表示第yi类的中心深层特征,m表示批量处理图像的数据量大小,xi表示第i张图像的深层特征,Lc为center loss函数,该公式有效地说明了类内变化。并采取mini-batch的方式批量更新训练集的中心,在每次迭代过程中,中心由对应类的特征所计算的均值产生。
其联合损失函数定义如下:
其中,公式左边是softmax损失函数,而右边属于center loss,λ参数用来协调两个损失函数之间的平衡。
106、在所述余弦距离小于预设阈值时,确定所述第一车辆和所述第二车辆为同一车型。
107、在所述余弦距离大于或等于所述预设阈值时,确定所述第一车辆和所述第二车辆为不同车型。
其中,上述预设阈值可由系统默认或者用户自行设置。在上述余弦距离小于预设阈值时,确定第一车辆和第二车辆为同一车型。在余弦距离大于或等于预设阈值时,确定第一车辆和所述第二车辆为不同车型。上述车型可为:车的样式或者型号。例如,轿车和卡车是不同的车型,或者,奔驰轿车与林肯轿车的车型也不一样。
在实际应用中,上述本发明实施例不仅可用于识别两辆车的车型是否相同,还可以进行如下操作,例如,可获取多张图像,每一图像中包含一个车辆,可通过本发明实施例识别出属于同一车型的图像,也可以将多张图像中的车辆进行分类,例如,从大量车的图像中找出同款车型。当然,还可以从一类车中找出不属于该类车的车型。上述车型可包括但不仅限于:巴士、卡车、摩托车、面包车等等。
可以看出,通过本发明实施例,获取第一车辆的车型的正样本集和负样本集,对正样本集合负样本集进行特征提取,得到多个特征,对多个特征进行训练,得到目标分类器,获取第一目标图像,第一目标图像中包含第一车辆,获取第二目标图像,第二目标图像中包含第二车辆,确定出,第一目标图像的第一车辆区域和第二目标图像的第二车辆区域,分别将,第一车辆区域和,第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像,采用目标分类器计算出第一图像和第二图像之间的余弦距离,在余弦距离小于预设阈值时,确定第一车辆和所述第二车辆为同一车型,在余弦距离大于或等于预设阈值时,确定第一车辆和所述第二车辆为不同车型。如此,可识别出同一车型的车辆。
与上述一致地,请参阅图2,为本发明实施例提供的一种车型识别方法的第二实施例流程示意图。本实施例中所描述的车型识别方法,包括以下步骤:
201、获取第一车辆的车型的正样本集和负样本集。
202、对所述正样本集合所述负样本集进行特征提取,得到多个特征。
203、对所述多个特征进行训练,得到目标分类器。
其中,步骤201中的正样本集可为第一车辆,例如,第一车辆的车型特征等等,正样本集中包含多个正样本。负样本集则为用户想检索的目标之外的景物,负样本集中包含多个负样本。上述正样本集和负样本集的包含的样本数量当然越多,训练出来的模型越准确,但是,正样本和负样本的数量越多,也会增加训练时候的计算成本。采用分类器对正样本集和负样本集进行训练,就可以得到一个训练模型。其中,上述分类器可为神经网络分类器,支持向量基(Support Vector Machine,SVM)分类器、遗传算法分类器、CNN分类器等等。
204、获取第一目标图像,所述第一目标图像中包含第一车辆。
205、获取第二目标图像,所述第二目标图像中包含第二车辆。
206、确定出所述第一目标图像的第一车辆区域和所述第二目标图像的第二车辆区域。
207、分别将所述第一车辆区域和所述第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像。
208、采用所述目标分类器计算出所述第一图像和所述第二图像之间的余弦距离。
209、在所述余弦距离小于预设阈值时,确定所述第一车辆和所述第二车辆为同一车型。
210、在所述余弦距离大于或等于所述预设阈值时,确定所述第一车辆和所述第二车辆为不同车型。
其中,上述步骤204-步骤210可参照图1所描述的车型识别方法的对应步骤。
可以看出,通过本发明实施例,获取第一目标图像,第一目标图像中包含第一车辆,获取第二目标图像,第二目标图像中包含第二车辆,确定出,第一目标图像的第一车辆区域和第二目标图像的第二车辆区域,分别将,第一车辆区域和,第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像,采用目标分类器计算出第一图像和第二图像之间的余弦距离,在余弦距离小于预设阈值时,确定第一车辆和所述第二车辆为同一车型,在余弦距离大于或等于预设阈值时,确定第一车辆和所述第二车辆为不同车型。如此,可识别出同一车型的车辆。
与上述一致地,以下为实施上述车型识别方法的装置,具体如下:
请参阅图3a,为本发明实施例提供的一种终端的第一实施例结构示意图。本实施例中所描述的终端,包括:第一获取单元301、第二获取单元302、第一确定单元303、处理单元304、计算单元305和第二确定单元306,具体如下:
第一获取单元301,用于获取第一目标图像,所述第一目标图像中包含第一车辆;
第二获取单元302,用于获取第二目标图像,所述第二目标图像中包含第二车辆;
第一确定单元303,用于确定出所述第一目标图像的第一车辆区域和所述第二目标图像的第二车辆区域;
处理单元304,用于分别将所述第一车辆区域和所述第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像;
计算单元305,用于采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离;
第二确定单元306,用于在所述余弦距离小于预设阈值时,确定所述第一车辆和所述第二车辆为同一车型;
所述第二确定单元306,还具体用于:
在所述余弦距离大于或等于所述预设阈值时,确定所述第一车辆和所述第二车辆为不同车型。
可选地,如图3b,图3b为图3a所描述的终端的计算单元305的具体细化结构,所述计算单元305可包括:训练模块3051、处理模块3052和确定模块3053
训练模块3051,用于采用所述目标分类器对所述第一图像进行训练,得到P个特征,所述P为大于1的整数;
所述训练模块3051,还具体用于:
采用所述目标分类器对所述第二图像进行训练,得到Q个特征,所述Q为大于1的整数;
处理模块3052,用于分别对所述P个特征和所述Q个特征进行主成分分析PCA处理,得到所述P个目标特征和所述Q个目标特征;
确定模块3053,用于根据所述P个目标特征和所述Q个目标特征确定所述第一图像和所述第二图像之间的余弦距离。
可选地,所述目标分类器为神经网络分类器,所述神经网络分类器的softmax工具箱中加入了center loss函数。
可选地,所述center loss函数如下:
其中,表示第yi类的中心深层特征,m表示批量处理图像的数据量大小,xi表示第i张图像的深层特征,Lc为center loss函数。
可选地,如图3c,图3c为图3a所描述的终端的变型结构,与图3a所描述的终端相比较,其还包括:第三获取单元307、提取单元308和训练单元309,具体如下:
第三获取单元307,用于在所述第一获取单元获取第一目标图像之前,获取所述第一车辆的车型的正样本集和负样本集;
提取单元308,用于对所述正样本集合所述负样本集进行特征提取,得到多个特征;
训练单元309,用于对所述多个特征进行训练,得到所述目标分类器。
可以看出,通过本发明实施例所描述的终端,可获取第一目标图像,第一目标图像中包含第一车辆,获取第二目标图像,第二目标图像中包含第二车辆,确定出,第一目标图像的第一车辆区域和第二目标图像的第二车辆区域,分别将,第一车辆区域和,第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像,采用目标分类器计算出第一图像和第二图像之间的余弦距离,在余弦距离小于预设阈值时,确定第一车辆和所述第二车辆为同一车型,在余弦距离大于或等于预设阈值时,确定第一车辆和所述第二车辆为不同车型。如此,可识别出同一车型的车辆。
与上述一致地,请参阅图4,为本发明实施例提供的一种终端的第二实施例结构示意图。本实施例中所描述的终端,包括:至少一个输入设备1000;至少一个输出设备2000;至少一个处理器3000,例如CPU;和存储器4000,上述输入设备1000、输出设备2000、处理器3000和存储器4000通过总线5000连接。
其中,上述输入设备1000具体可为触控面板、物理按键或者鼠标。
上述输出设备2000具体可为显示屏。
上述存储器4000可以是高速RAM存储器,也可为非易失存储器(non-volatilememory),例如磁盘存储器。上述存储器4000用于存储一组程序代码,上述输入设备1000、输出设备2000和处理器3000用于调用存储器4000中存储的程序代码,执行如下操作:
上述处理器3000,用于:
获取第一目标图像,所述第一目标图像中包含第一车辆;
获取第二目标图像,所述第二目标图像中包含第二车辆;
确定出所述第一目标图像的第一车辆区域和所述第二目标图像的第二车辆区域;
分别将所述第一车辆区域和所述第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像;
采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离;
在所述余弦距离小于预设阈值时,确定所述第一车辆和所述第二车辆为同一车型;
在所述余弦距离大于或等于所述预设阈值时,确定所述第一车辆和所述第二车辆为不同车型。
可选地,上述处理器3000采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离,包括:
采用所述目标分类器对所述第一图像进行训练,得到P个特征,所述P为大于1的整数;
采用所述目标分类器对所述第二图像进行训练,得到Q个特征,所述Q为大于1的整数;
分别对所述P个特征和所述Q个特征进行主成分分析PCA处理,得到所述P个目标特征和所述Q个目标特征;
根据所述P个目标特征和所述Q个目标特征确定所述第一图像和所述第二图像之间的余弦距离。
可选地,所述目标分类器为神经网络分类器,所述神经网络分类器的softmax工具箱中加入了center loss函数。
可选地,所述center loss函数如下:
其中,表示第yi类的中心深层特征,m表示批量处理图像的数据量大小,xi表示第i张图像的深层特征,Lc为center loss函数。
可选地,上述处理器3000在所述获取第一目标图像之前,还具体用于:
获取所述第一车辆的车型的正样本集和负样本集;
对所述正样本集合所述负样本集进行特征提取,得到多个特征;
对所述多个特征进行训练,得到所述目标分类器。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何一种车型识别方法的部分或全部步骤。
尽管在此结合各实施例对本发明进行了描述,然而,在实施所要求保护的本发明过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实现所述公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
本领域技术人员应明白,本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机程序存储/分布在合适的介质中,与其它硬件一起提供或作为硬件的一部分,也可以采用其他分布形式,如通过Internet或其它有线或无线电信系统。
本发明是参照本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管结合具体特征及其实施例对本发明进行了描述,显而易见的,在不脱离本发明的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本发明的示例性说明,且视为已覆盖本发明范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种车型识别方法,其特征在于,包括:
获取第一目标图像,所述第一目标图像中包含第一车辆;
获取第二目标图像,所述第二目标图像中包含第二车辆;
确定出所述第一目标图像的第一车辆区域和所述第二目标图像的第二车辆区域;
分别将所述第一车辆区域和所述第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像;
采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离;
在所述余弦距离小于预设阈值时,确定所述第一车辆和所述第二车辆为同一车型;
在所述余弦距离大于或等于所述预设阈值时,确定所述第一车辆和所述第二车辆为不同车型。
2.根据权利要求1所述的方法,其特征在于,所述采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离,包括:
采用所述目标分类器对所述第一图像进行训练,得到P个特征,所述P为大于1的整数;
采用所述目标分类器对所述第二图像进行训练,得到Q个特征,所述Q为大于1的整数;
分别对所述P个特征和所述Q个特征进行主成分分析PCA处理,得到所述P个目标特征和所述Q个目标特征;
根据所述P个目标特征和所述Q个目标特征确定所述第一图像和所述第二图像之间的余弦距离。
3.根据权利要求1或2任一项所述的方法,其特征在于,所述目标分类器为神经网络分类器,所述神经网络分类器的softmax工具箱中加入了center loss函数。
4.根据权利要求3所述的方法,其特征在于,所述center loss函数如下:
其中,表示第yi类的中心深层特征,m表示批量处理图像的数据量大小,xi表示第i张图像的深层特征,Lc为center loss函数。
5.根据权利要求1或2任一项所述的方法,其特征在于,在所述获取第一目标图像之前,所述方法还包括:
获取所述第一车辆的车型的正样本集和负样本集;
对所述正样本集合所述负样本集进行特征提取,得到多个特征;
对所述多个特征进行训练,得到所述目标分类器。
6.一种终端,其特征在于,包括:
第一获取单元,用于获取第一目标图像,所述第一目标图像中包含第一车辆;
第二获取单元,用于获取第二目标图像,所述第二目标图像中包含第二车辆;
第一确定单元,用于确定出所述第一目标图像的第一车辆区域和所述第二目标图像的第二车辆区域;
处理单元,用于分别将所述第一车辆区域和所述第二目标图像进行对齐,并缩放到指定尺寸,得到第一图像和第二图像;
计算单元,用于采用目标分类器计算出所述第一图像和所述第二图像之间的余弦距离;
第二确定单元,用于在所述余弦距离小于预设阈值时,确定所述第一车辆和所述第二车辆为同一车型;
所述第二确定单元,还具体用于:
在所述余弦距离大于或等于所述预设阈值时,确定所述第一车辆和所述第二车辆为不同车型。
7.根据权利要求6所述的终端,其特征在于,所述计算单元包括:
训练模块,用于采用所述目标分类器对所述第一图像进行训练,得到P个特征,所述P为大于1的整数;
所述训练模块,还具体用于:
采用所述目标分类器对所述第二图像进行训练,得到Q个特征,所述Q为大于1的整数;
处理模块,用于分别对所述P个特征和所述Q个特征进行主成分分析PCA处理,得到所述P个目标特征和所述Q个目标特征;
确定模块,用于根据所述P个目标特征和所述Q个目标特征确定所述第一图像和所述第二图像之间的余弦距离。
8.根据权利要求6或7任一项所述的终端,其特征在于,所述目标分类器为神经网络分类器,所述神经网络分类器的softmax工具箱中加入了center loss函数。
9.根据权利要求8所述的终端,其特征在于,所述center loss函数如下:
其中,表示第yi类的中心深层特征,m表示批量处理图像的数据量大小,xi表示第i张图像的深层特征,Lc为center loss函数。
10.根据权利要求6或7任一项所述的终端,其特征在于,所述终端还包括:
第三获取单元,用于在所述第一获取单元获取第一目标图像之前,获取所述第一车辆的车型的正样本集和负样本集;
提取单元,用于对所述正样本集合所述负样本集进行特征提取,得到多个特征;
训练单元,用于对所述多个特征进行训练,得到所述目标分类器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611178196.9A CN106650660A (zh) | 2016-12-19 | 2016-12-19 | 一种车型识别方法及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611178196.9A CN106650660A (zh) | 2016-12-19 | 2016-12-19 | 一种车型识别方法及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106650660A true CN106650660A (zh) | 2017-05-10 |
Family
ID=58833302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611178196.9A Pending CN106650660A (zh) | 2016-12-19 | 2016-12-19 | 一种车型识别方法及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106650660A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038491A (zh) * | 2017-11-16 | 2018-05-15 | 深圳市华尊科技股份有限公司 | 一种图像分类方法及装置 |
CN108446729A (zh) * | 2018-03-13 | 2018-08-24 | 天津工业大学 | 基于卷积神经网络的鸡蛋胚胎分类方法 |
WO2019020103A1 (zh) * | 2017-07-28 | 2019-01-31 | 北京市商汤科技开发有限公司 | 目标识别方法、装置、存储介质和电子设备 |
CN109344805A (zh) * | 2018-10-29 | 2019-02-15 | 北京深瞐科技有限公司 | 交通违法图片智能预审方法及装置 |
CN109460777A (zh) * | 2018-10-11 | 2019-03-12 | 北京朗镜科技有限责任公司 | 图片分类方法、装置及计算机可读存储介质 |
CN110009015A (zh) * | 2019-03-25 | 2019-07-12 | 西北工业大学 | 基于轻量化网络和半监督聚类的高光谱小样本分类方法 |
CN110555125A (zh) * | 2018-05-14 | 2019-12-10 | 桂林远望智能通信科技有限公司 | 一种基于局部特征的车辆检索方法 |
CN110738071A (zh) * | 2018-07-18 | 2020-01-31 | 浙江中正智能科技有限公司 | 一种基于深度学习和迁移学习的人脸算法模型训练方法 |
CN110806894A (zh) * | 2019-10-31 | 2020-02-18 | 安徽江淮汽车集团股份有限公司 | 汽车零部件软件版本管理方法、设备、存储介质及装置 |
CN112101238A (zh) * | 2020-09-17 | 2020-12-18 | 浙江商汤科技开发有限公司 | 聚类方法及装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101447021A (zh) * | 2008-12-30 | 2009-06-03 | 爱德威软件开发(上海)有限公司 | 人脸快速识别系统及其识别方法 |
CN104361343A (zh) * | 2014-10-30 | 2015-02-18 | 深圳市中盟科技股份有限公司 | 车辆类型识别方法及其装置 |
CN104809443A (zh) * | 2015-05-05 | 2015-07-29 | 上海交通大学 | 基于卷积神经网络的车牌检测方法及系统 |
CN105808732A (zh) * | 2016-03-10 | 2016-07-27 | 北京大学 | 一种基于深度度量学习的一体化目标属性识别与精确检索方法 |
-
2016
- 2016-12-19 CN CN201611178196.9A patent/CN106650660A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101447021A (zh) * | 2008-12-30 | 2009-06-03 | 爱德威软件开发(上海)有限公司 | 人脸快速识别系统及其识别方法 |
CN104361343A (zh) * | 2014-10-30 | 2015-02-18 | 深圳市中盟科技股份有限公司 | 车辆类型识别方法及其装置 |
CN104809443A (zh) * | 2015-05-05 | 2015-07-29 | 上海交通大学 | 基于卷积神经网络的车牌检测方法及系统 |
CN105808732A (zh) * | 2016-03-10 | 2016-07-27 | 北京大学 | 一种基于深度度量学习的一体化目标属性识别与精确检索方法 |
Non-Patent Citations (3)
Title |
---|
KRIZHEVSKY A 等: "ImageNet classification with deep convolutional neural networks", 《INTERNATIONAL CONFERENCE ON NEURAL INFORMATION PROCESSING SYSTEMS》 * |
YANGDONG WEN 等: "A Discriminative Feature Learning Approach for Deep Face Recognition", 《COMPUTER VISION-ECCV 2016》 * |
程丽霞: "监控视频中的车型识别技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11200682B2 (en) | 2017-07-28 | 2021-12-14 | Beijing Sensetime Technology Development Co., Ltd. | Target recognition method and apparatus, storage medium, and electronic device |
WO2019020103A1 (zh) * | 2017-07-28 | 2019-01-31 | 北京市商汤科技开发有限公司 | 目标识别方法、装置、存储介质和电子设备 |
KR102339323B1 (ko) * | 2017-07-28 | 2021-12-14 | 베이징 센스타임 테크놀로지 디벨롭먼트 컴퍼니 리미티드 | 타겟 인식 방법, 장치, 저장 매체 및 전자 기기 |
KR20190128724A (ko) * | 2017-07-28 | 2019-11-18 | 베이징 센스타임 테크놀로지 디벨롭먼트 컴퍼니 리미티드 | 타겟 인식 방법, 장치, 저장 매체 및 전자 기기 |
CN108038491A (zh) * | 2017-11-16 | 2018-05-15 | 深圳市华尊科技股份有限公司 | 一种图像分类方法及装置 |
CN108446729A (zh) * | 2018-03-13 | 2018-08-24 | 天津工业大学 | 基于卷积神经网络的鸡蛋胚胎分类方法 |
CN110555125A (zh) * | 2018-05-14 | 2019-12-10 | 桂林远望智能通信科技有限公司 | 一种基于局部特征的车辆检索方法 |
CN110738071A (zh) * | 2018-07-18 | 2020-01-31 | 浙江中正智能科技有限公司 | 一种基于深度学习和迁移学习的人脸算法模型训练方法 |
CN109460777A (zh) * | 2018-10-11 | 2019-03-12 | 北京朗镜科技有限责任公司 | 图片分类方法、装置及计算机可读存储介质 |
CN109344805A (zh) * | 2018-10-29 | 2019-02-15 | 北京深瞐科技有限公司 | 交通违法图片智能预审方法及装置 |
CN110009015A (zh) * | 2019-03-25 | 2019-07-12 | 西北工业大学 | 基于轻量化网络和半监督聚类的高光谱小样本分类方法 |
CN110806894A (zh) * | 2019-10-31 | 2020-02-18 | 安徽江淮汽车集团股份有限公司 | 汽车零部件软件版本管理方法、设备、存储介质及装置 |
CN112101238A (zh) * | 2020-09-17 | 2020-12-18 | 浙江商汤科技开发有限公司 | 聚类方法及装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106650660A (zh) | 一种车型识别方法及终端 | |
CN106682602B (zh) | 一种驾驶员行为识别方法及终端 | |
CN111126258B (zh) | 图像识别方法及相关装置 | |
CN108121986B (zh) | 目标检测方法及装置、计算机装置和计算机可读存储介质 | |
CN110738101B (zh) | 行为识别方法、装置及计算机可读存储介质 | |
CN109740415B (zh) | 车辆属性识别方法及相关产品 | |
US10445602B2 (en) | Apparatus and method for recognizing traffic signs | |
CN107992819B (zh) | 一种车辆属性结构化特征的确定方法与装置 | |
CN108256454B (zh) | 一种基于cnn模型的训练方法、人脸姿态估测方法及装置 | |
CN111401282B (zh) | 目标检测方法、装置、计算机设备和存储介质 | |
CN109034136A (zh) | 图像处理方法、装置、摄像设备及存储介质 | |
US8953852B2 (en) | Method for face recognition | |
CN205230272U (zh) | 汽车司机驾驶状态监测系统 | |
CN105740751A (zh) | 一种目标检测与识别的方法和系统 | |
CN109117746A (zh) | 手部检测方法及机器可读存储介质 | |
CN112052782A (zh) | 基于环视的停车位识别方法、装置、设备及存储介质 | |
CN110555339A (zh) | 一种目标检测方法、系统、装置及存储介质 | |
CN111444850A (zh) | 一种图片检测的方法和相关装置 | |
CN112560584A (zh) | 一种人脸检测方法及装置、存储介质、终端 | |
CN114783021A (zh) | 一种口罩佩戴智能检测方法、装置、设备及介质 | |
CN114723945A (zh) | 车损检测方法和装置、电子设备及存储介质 | |
CN112381034A (zh) | 一种车道线检测方法、装置、设备及存储介质 | |
CN117649621A (zh) | 一种伪造视频检测方法、装置及设备 | |
US20220245829A1 (en) | Movement status learning apparatus, movement status recognition apparatus, model learning method, movement status recognition method and program | |
CN111178181A (zh) | 交通场景分割方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170510 |