CN108304754A - 车型的识别方法和装置 - Google Patents
车型的识别方法和装置 Download PDFInfo
- Publication number
- CN108304754A CN108304754A CN201710121609.8A CN201710121609A CN108304754A CN 108304754 A CN108304754 A CN 108304754A CN 201710121609 A CN201710121609 A CN 201710121609A CN 108304754 A CN108304754 A CN 108304754A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- picture
- neural network
- network model
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000003062 neural network model Methods 0.000 claims abstract description 68
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 60
- 238000012549 training Methods 0.000 claims abstract description 60
- 230000004044 response Effects 0.000 claims abstract description 18
- 230000002708 enhancing effect Effects 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims description 56
- 238000009499 grossing Methods 0.000 claims description 9
- 230000002087 whitening effect Effects 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 20
- 230000015654 memory Effects 0.000 description 17
- 238000000605 extraction Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000005286 illumination Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000003860 storage Methods 0.000 description 11
- 210000002569 neuron Anatomy 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000013507 mapping Methods 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 210000005036 nerve Anatomy 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000001737 promoting effect Effects 0.000 description 3
- 235000007926 Craterellus fallax Nutrition 0.000 description 2
- 240000007175 Datura inoxia Species 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000003475 lamination Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000004992 fission Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/584—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Abstract
本发明公开了一种车型的识别方法和装置。其中,该方法包括:获取到对目标图片中的车辆进行车型识别的请求;使用预设神经网络模型识别出目标图片中的车辆为目标车型,预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的,训练集合是对多个车型的图片进行第一预处理得到的图片集合,第一预处理用于增强预设神经网络模型的鲁棒性,多个车型包括目标车型;响应于请求,返回包括目标车型的识别结果。本发明解决了相关技术中进行车型识别的准确率较低的技术问题。
Description
技术领域
本发明涉及监控领域,具体而言,涉及一种车型的识别方法和装置。
背景技术
在智能视频监控中,车型识别技术是公安图像侦查和交通状态分析的一个前期处理中的重要分体。随着信息技术的发展,车型识别技术也得到了进一步的发展,当前的车型识别技术与传统意义上的车型识别存在着较大的区别,传统意义上的车型识别仅能分辨出车辆的大致类型,如小型车辆、中型车辆和大型车辆。而当前意义上的车型识别技术就是对从车辆的车脸区域图像中提取出的车型特征进行分类,以确定该车辆所属的品牌型号。随着计算机技术的进步,基于车脸特征的车型识别技术逐渐走向实用,不但可以识别车辆品牌,甚至可以识别该车辆品牌旗下的系列和年款,从而大大扩展了该技术在相关领域的应用。
目前的车型识别算法主要包括以下两种:基于模版匹配的方法和基于统计模式识别的方法,这两种方法对图像的要求高(如对光照、角度、清晰度、是否有遮挡等),且识别率较低、缺乏鲁棒性。
针对相关技术中进行车型识别的准确率较低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种车型的识别方法和装置,以至少解决相关技术中进行车型识别的准确率较低的技术问题。
根据本发明实施例的一个方面,提供了一种车型的识别方法,包括:获取到对目标图片中的车辆进行车型识别的请求;使用预设神经网络模型识别出目标图片中的车辆为目标车型,其中,预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的,训练集合是对多个车型的图片进行第一预处理得到的图片集合,第一预处理用于增强预设神经网络模型的鲁棒性,多个车型包括目标车型;响应于请求,返回包括目标车型的识别结果。
根据本发明实施例的另一方面,还提供了一种车型的识别装置,包括:获取单元,用于获取到对目标图片中的车辆进行车型识别的请求;识别单元,用于使用预设神经网络模型识别出目标图片中的车辆为目标车型,其中,预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的,训练集合是对多个车型的图片进行第一预处理得到的图片集合,第一预处理用于增强预设神经网络模型的鲁棒性,多个车型包括目标车型;响应单元,用于响应于请求,返回包括目标车型的识别结果。
在本发明实施例中,通过使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到预设神经网络模型,在获取到对目标图片中的车辆进行车型识别的请求时即可通过预设神经网络模型,由于训练集合是对多个车型的图片进行第一预处理得到的图片集合,而第一预处理可增强预设神经网络模型的鲁棒性,也即可以消除环境、拍摄角度对车型识别的影响,可以解决了相关技术中进行车型识别的准确率较低的技术问题,进而达到提升车型识别的准确率的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的车型的识别方法的硬件环境的示意图;
图2是根据本发明实施例的一种可选的车型的识别方法的流程图;
图3是根据本发明实施例的一种可选的车型的识别方法的流程图;
图4是根据本发明实施例的一种可选的车型的识别方法的流程图;
图5是根据本发明实施例的一种可选的车型的识别方法的流程图;
图6是根据本发明实施例的一种可选的车型的识别方法的流程图;
图7是根据本发明实施例的一种可选的车型的识别装置的示意图;
图8是根据本发明实施例的一种可选的车型的识别装置的示意图;以及
图9是根据本发明实施例的一种终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本发明实施例进行描述的过程中出现的部分名词或者术语适用于如下解释:
鲁棒性:是Robust的音译,也就是健壮和强壮的意思。它是在异常和危险情况下系统生存的关键。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不崩溃,就是该软件的鲁棒性。所谓“鲁棒性”,是指控制系统在一定(结构,大小)的参数摄动下,维持其它某些性能的特性。根据对性能的不同定义,可分为稳定鲁棒性和性能鲁棒性。以闭环系统的鲁棒性作为目标设计得到的固定控制器称为鲁棒控制器。
人工神经网络:Artificial Neural Networks,简写为ANN,也简称为神经网络(NNs)或称作连接模型(Connection Model),它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。
实施例1
根据本发明实施例,提供了一种车型的识别方法的方法实施例。
可选地,在本实施例中,上述车型的识别方法可以应用于如图1所示的由服务器102和终端104所构成的硬件环境中。如图1所示,服务器102通过网络与终端104进行连接,上述网络包括但不限于:广域网、城域网或局域网,终端104并不限定于PC、手机、平板电脑等。本发明实施例的车型的识别方法可以由服务器102来执行,也可以由终端104来执行,还可以是由服务器102和终端104共同执行。其中,终端104执行本发明实施例的车型的识别方法也可以是由安装在其上的客户端来执行。
图2是根据本发明实施例的一种可选的车型的识别方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,获取到对目标图片中的车辆进行车型识别的请求;
步骤S204,使用预设神经网络模型识别出目标图片中的车辆为目标车型,预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的,训练集合是对多个车型的图片进行第一预处理得到的图片集合,第一预处理用于增强预设神经网络模型的鲁棒性,多个车型包括目标车型;
步骤S206,响应于请求,返回包括目标车型的识别结果。
通过上述步骤S202至步骤S206,通过使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到预设神经网络模型,在获取到对目标图片中的车辆进行车型识别的请求时即可通过预设神经网络模型,由于训练集合是对多个车型的图片进行第一预处理得到的图片集合,而第一预处理可增强预设神经网络模型的鲁棒性,也即可以消除环境、拍摄角度对车型识别的影响,可以解决了相关技术中进行车型识别的准确率较低的技术问题,进而达到提升车型识别的准确率的技术效果。
上述的目标图片为用户任意拍摄的汽车的图片;多个车型的图片是指预先采集好的知道车型的图片,为了提高识别的效率和准确率,可以针对每个车型从不同角度拍摄到多张图片,然后通过预处理即可得到上述的训练集。
可选地,上述的鲁棒性包括性能鲁棒性和稳定鲁棒性。
上述的神经网络模型是指深度卷积神经网络模型,该神经网络模型包括多个隐层(即卷积层)和特征提取层。
需要说明的是,对于普通的神经网络DNN,其下层神经元和所有上层神经元都能够形成连接,带来的潜在问题是参数数量的膨胀,在训练时不仅容易过拟合,而且极容易陷入局部最优,在图像中有固有的局部模式(比如轮廓、边界等)可以利用,显然应该将图像处理中的概念和神经网络技术相结合,而利用本申请的深度卷积神经网络模型恰恰可以实现上述目的。
在深度卷积神经网络模型中,并不是所有上下层神经元都能直接相连,而是通过“卷积核”(即卷积层)作为中介,同一个卷积核在所有图像内是共享的,图像通过卷积操作后仍然保留原先的位置关系,正是由于深度卷积神经网络模型限制了参数的个数并挖掘了局部结构的这个特点,从而可以减少参数量,并提高网络的鲁棒性。
例如,需要识别一幅彩色图像,这幅图像具有四个通道ARGB(即透明度和红绿蓝,对应了四幅相同大小的图像),假设卷积核大小为2*2,共使用10个卷积核(w1到w10,每个卷积核用于学习不同的结构特征),用w1在ARGB图像上进行卷积操作,可以得到隐含层的第一幅图像;这幅隐含层图像左上角第一个像素是四幅输入图像左上角2*2区域内像素的加权求和,以此类推,得到对应该卷积核的其它图像。同理,算上其他卷积核,隐含层对应10幅“图像”。每幅图像对是对原始图像中不同特征的响应,按照这样的结构继续传递下去,另外,在深度卷积神经网络模型中还有max-pooling(特征分类)等操作进一步提高鲁棒性。
深度卷积神经网络DCNN(Deep Convolutional Neural Network)包括卷积层、池化层(即特征分类层),多个卷积-池化单元构成特征表达,可应用于二维图像识别。可将DCNN看做是带有二维离散卷积操作的DNN。
DCNN的结构包括多个特征提取层(即卷积层)和特征映射层(即特征分类层),在卷积层中,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征,一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等,特征映射结构可采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数,可在卷积神经网络中的每一个卷积层后跟着设置一个用来求局部平均与二次提取的计算层,这种特有的两次特征提取结构减小了特征分辨率。
在进行车型识别时,可使用基于模版匹配的方法,该方法的缺点是模版很难建立,汽车在图像中发生旋转或者尺度反生变化时则无法识别车型,即使发生较小范围的遮挡也无法正常识别车型;还可以使用基于统计模式识别的方法,该方法要求各个类别总体的概率分布是已知的,决策分类的类别数是一致的,该方法对光照、遮挡等因素不具有鲁棒性,即容易受到光照、遮挡等因素的影响。
相对于上述的车型识别方法,使用本申请的深度卷积网络模型,对图片识别具有更好的效果,利用深度卷积神经网络可解决传统车型识别算法遇到的问题,解决上述车型识别方案中对图像的要求高(如对光照、角度、清晰度、是否有遮挡)、识别率较低、鲁棒性不好等技术难题,避免光照、遮挡等因素对车型识别造成的影响,提高识别的鲁棒性。
在上述实施例中,在获取到对目标图片中的车辆进行车型识别的请求之前,可按照如下方式进行训练得到预设神经网络模型:对多个车型的图片进行第一预处理,得到训练集合;使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练,得到预设神经网络模型。
可选地,对多个车型的图片进行第一预处理包括:对多个车型的图片中的每个图片进行如下处理,其中,每个图片被视为当前图片:对当前图片进行第一处理操作和第二处理操作,得到第一图片,其中,第一图片被视为训练集合中的图片,第一处理操作包括随机旋转和随机裁剪的操作,随机旋转和随机裁剪的操作用于消除图像采集角度对车型识别的影响,第二处理操作用于消除图像采集环境对车型识别的影响。
具体地,对当前图片进行第一处理操作和第二处理操作包括:对当前图片进行尺寸调整、随机旋转、随机裁剪、高斯平滑处理、亮度调整以及饱和度调整(即第一处理操作),得到第二图片;对第二图片进行直方图均衡化处理,得到第三图片;对第三图片进行白化处理(均衡化处理和白热化处理即第二处理操作),得到第一图片。
可选地,使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练,得到预设神经网络模型包括:通过深度卷积神经网络模型的多个卷积层识别出训练集合中属于每个车型的所有图片的多个第一特征信息;通过深度卷积神经网络模型的特征分类层从每个车型的所有第一特征信息中提取出每个车型的特征集合之后,得到预设神经网络模型,其中,特征集合包括所有第一特征信息中用于指示车型的第二特征信息,特征集合保存在预设神经网络模型中。
在上述的随机旋转、随机裁剪中,可进行多次随机旋转,每次随机旋转得到一张图片,也即进行多次随机旋转可以得到多张图片;同理,在随机裁剪时,也可进行多次随机裁剪得到多张图片。通过使用多次随机旋转和随机裁剪之后的图片进行训练,由于包括了更为丰富的拍摄环境(拍摄角度、拍摄到的内容等),因而可以提取到更为丰富的特征,进而可以学习到更多的特征,以学习到不同车型间的区别,也能更为准确的识别不同角度拍摄到的车辆的车型。
在步骤S202提供的技术方案中,获取到对目标图片中的车辆进行车型识别的请求包括:接收第一客户端向服务器发送的用于进行车型识别的请求,其中,第一客户端通过互联网与服务器连接。
在服务器上提供用于进行车型识别的函数接口(即预设接口),这样,服务器就可以在预设接口上接收客户端发送的用于进行车型识别的请求。
需要说明的是,该函数接口为一个通用的接口,任意的客户端或者网页均可以调用该接口进行车型识别,例如,在即使通讯应用中,利用该函数接口将拍摄到的图片发送给服务器,由服务器识别出结果之后通过预设接口返回包括目标车型的识别结果至调用预设接口的对象。
在步骤S204提供的技术方案中,在使用预设神经网络模型识别出目标图片中的车辆为目标车型之前,对目标图片进行第二预处理。在使用预设神经网络模型识别出目标图片中的车辆为目标车型时,将经过第二预处理的目标图片的图片数据作为预设神经网络模型的输入,以识别出目标图片中的车辆为目标车型。
可选地,对目标图片进行第二预处理包括:对目标图片进行如下处理:按照汽车框架进行裁剪、尺寸调整、高斯平滑处理、亮度调整以及饱和度调整,得到第四图片;将第四图片的进行直方图均衡化处理,得到第五图片;将第五图片进行白化处理,得到待输入预设神经网络模型的图片数据。
可选地,将经过第二预处理的目标图片的图片数据作为预设神经网络模型的输入,以识别出目标图片中的车辆为目标车型包括:通过预设神经网络模型的多个卷积层识别出目标图片的第三特征信息;获取目标图片的第三特征信息与每个车型的特征集合中的特征信息的匹配度,例如,确定目标图片的第三特征信息中与每个车型的特征集合中的特征信息相同的数量,将该数量与每个车型的特征集合中的所有特征信息的数量的比值作为匹配度;确定与多个车型的多个匹配度中的目标匹配度对应的车型为目标车型,目标匹配度包括多个匹配度中数值从大到小的排列中的前N个匹配度,N为正整数。
上述的N为小于车型数量的正整数,上述的目标匹配度为所有匹配度从大到小排列时靠前的N个。
在步骤S206提供的技术方案中,响应于请求,返回包括目标车型的识别结果包括:在得到了上述的目标匹配度(即N个较大的匹配度)之后,将N个匹配度通过函数接口返回给客户端,有客户端展示给用户。
本申请提供的方法中,针对车型识别问题,提出了一种基于深度卷积神经网络的车型识别框架,结合传统的数字图像处理技术做图像预处理,解决了传统方法识别车型时对输入图片要求高,同时识别率较低的问题。本方案在识别车型时具有很好的鲁棒性,对光照、噪声、旋转、部分遮挡等因素不敏感,并且识别率有大幅度提升,与现有方法的区别是不需要手工设计、提取车型图像特征,采用CNN自动设计、提取、优化特征。不仅减少工作量,并且提升了识别率。
作为一种可选的实施例,在用本申请提供的方法进行图片识别时,将训练图片(即当前图片)预处理之后作为深度卷积神经网络的输入,开始训练,得到网络参数并保存;线上运营时,重新加载网络参数;用户输入图片,做预处理,将该图片作为网络输入;得到各类的概率分布,将前N个最大的概率的类别作为输出返回。下面结合图3至图6详述本申请的实施例。
步骤S302,获取训练数据集合。
收集训练图片到数据集合,数据集合的收集非常重要,数据集合质量将直接决定模型参数的优劣,实际操作中可以采取人工采集以及与汽车专业网站合作的方式获取各个车型的训练图片。
步骤S304,对数据集合中的数据进行预处理。
在将训练图片输入深度卷积神经网络,先要对训练图片进行预处理,预处理流程是非常重要的,当前的研究证明,不同的预处理流程对预测结果有显著的影响,同时,本方案设计的预处理流程也是本方案具有很好的鲁棒性以及其他优点的重要来源。
步骤S306,将预处理后的数据输入深度卷积神经网络。
深度卷积神经网络在选择时需要注意选择能够适应类别数量多、能辨识细节特征的网络,因为车型的类别数据较大,同时汽车、特别是同一品牌不同系列的车型在外观上面的差异非常小。
预先选择一个深度卷积神经网络,如google的InceptionV3。Inception-V3网络一个重要的特点是将大卷积核分解为小卷积核,如将7*7的卷积分解成两个一维卷积(1*7和7*1),从而可以加快计算速度,同时增加了网络的深度以及网络的非线性,从而增强了网络的特征提取以及表示能力。
在深度卷积神经网络中,其卷积层可以看作是一个特征提取器,为了实现特征提取的尺度不变性、旋转不变性、光照等,在图像特征提取器在应用时可采用如图像金字塔、白化等技术。对于深度卷积神经网络,可以通过数据的预处理以及合适的网络结构来解决这些问题,如对于尺度不变性,Inception-V3通过不同大小的卷积核栈来适应不同尺度的物体图像。
在本方案中,可利用深度卷积神经网络作为车型图像特征提取器,使用softmax作为分类器。在训练时,使用较为丰富的预处理技术,解决诸如旋转不变性、光照等问题。
步骤S308,得到深度卷积神经网络。
进行训练流程的预处理方法如图4所示:
步骤S402,调整待输入图片的尺寸。
为了适应深度卷积网络的输入层,比如其输入层要求为299*299,那么就可以将图片的尺寸调整为299*299。
步骤S404,为了增强网络对于物体被旋转之后的图像的适应性,需要对图片进行随机旋转。
步骤S406,为增强网络对于物体被部分遮挡时的适应性,可对图片进行随机裁剪。
步骤S408,为了去除高斯噪声,增强网络对于输入图像含有较多噪声的适应性,可对图片进行高斯平滑处理。
步骤S410,为了增强对于较暗图像的适应性,可对图片的亮度进行随机处理。
步骤S412,为了增强网络对于不同饱和度图像的适应性,可调整图片的饱和度。
步骤S414,在调整饱和度之后,进行直方图均衡化处理,使用直方图均衡化,增强图像的对比度,同时使得输入像素值更为均匀。
直方图(Histogram)又称质量分布图,如果一副图像的像素占有很多的灰度级而且分布均匀,那么这样的图像往往有高对比度和多变的灰度色调。直方图均衡化就是一种能仅靠输入图像直方图信息自动达到这种效果的变换函数。它的基本思想是对图像中像素个数多的灰度级进行展宽,而对图像中像素个数少的灰度进行压缩,从而扩展像原取值的动态范围,提高了对比度和灰度色调的变化,使图像更加清晰。
步骤S416,进行白化处理,即将图像数据取中心化,同时归一化输入,作为网络的输入。
进行预测的流程如图5所示:
步骤S502,获取深度卷积神经网络的参数。
步骤S504,获取汽车图片。
步骤S506,对获取到的汽车图片进行预处理。
步骤S508,将预处理之后的汽车图片输入深度卷积神经网络。
步骤S510,得到深度卷积神经网络输出的结果。
需要说明的是,模型参数采用高斯分布,如对于卷积核,使用二维高斯分布去初始化相应位置的卷积核参数;预处理过程各种技术的参数,比如随机提升亮度,这里的随机可使用高斯分布,对应的参数即为高斯分布的参数
进行预测的预处理如图6所示:
步骤S602,调整待输入图片的尺寸。
步骤S604,检测图片中汽车的粗略框架。
步骤S606,对图片进行随机裁剪。
步骤S608,对图片进行高斯平滑处理。
步骤S610,对图片的亮度进行随机处理。
步骤S612,调整图片的饱和度。
步骤S614,直方图均衡化处理。
步骤S616,进行白化处理。
需要说明的是,预测流程中的预处理不需要旋转以及随机裁剪,而是用一个简单的汽车检测器,将汽车的大概位置取出来。这么做的原因是如果用户拍照时,汽车并不处于前景中,网络很可能造成误分类。
在本申请提供的方法中,针对车型识别问题,提出了一种基于深度卷积神经网络的车型识别框架,结合传统的数字图像处理技术做图像预处理,解决了传统方法识别车型时对输入图片要求高,同时识别率较低的问题。本方案在识别车型时具有很好的鲁棒性,对光照、噪声、旋转、部分遮挡等因素不敏感,并且识别率有大幅度提升,与现有方法的区别是不需要手工设计、提取车型图像特征,采用CNN自动设计、提取、优化特征。不仅减少工作量,并且提升了识别率。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述车型的识别方法的车型的识别装置。图7是根据本发明实施例的一种可选的车型的识别装置的示意图,如图7所示,该装置可以包括:获取单元72、识别单元74以及响应单元76。
获取单元72,用于获取到对目标图片中的车辆进行车型识别的请求;
识别单元74,用于使用预设神经网络模型识别出目标图片中的车辆为目标车型,预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的,训练集合是对多个车型的图片进行第一预处理得到的图片集合,第一预处理用于增强预设神经网络模型的鲁棒性,多个车型包括目标车型;
响应单元76,用于响应于请求,返回包括目标车型的识别结果。
需要说明的是,该实施例中的获取单元72可以用于执行本申请实施例1中的步骤S202,该实施例中的识别单元74可以用于执行本申请实施例1中的步骤S204,该实施例中的响应单元76可以用于执行本申请实施例1中的步骤S206。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
通过上述模块,通过使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到预设神经网络模型,在获取到对目标图片中的车辆进行车型识别的请求时即可通过预设神经网络模型,由于训练集合是对多个车型的图片进行第一预处理得到的图片集合,而第一预处理可增强预设神经网络模型的鲁棒性,也即可以消除环境、拍摄角度对车型识别的影响,可以解决了相关技术中进行车型识别的准确率较低的技术问题,进而达到提升车型识别的准确率的技术效果。
上述的目标图片为用户任意拍摄的汽车的图片;多个车型的图片是指预先采集好的知道车型的图片,为了提高识别的效率和准确率,可以针对每个车型从不同角度拍摄到多张图片,然后通过预处理即可得到上述的训练集。
可选地,上述的鲁棒性包括性能鲁棒性和稳定鲁棒性。
上述的神经网络模型是指深度卷积神经网络模型,该神经网络模型包括多个隐层(即卷积层)和特征提取层。
需要说明的是,对于普通的神经网络DNN,其下层神经元和所有上层神经元都能够形成连接,带来的潜在问题是参数数量的膨胀,在训练时不仅容易过拟合,而且极容易陷入局部最优,在图像中有固有的局部模式(比如轮廓、边界等)可以利用,显然应该将图像处理中的概念和神经网络技术相结合,而利用本申请的深度卷积神经网络模型恰恰可以实现上述目的。
在深度卷积神经网络模型中,并不是所有上下层神经元都能直接相连,而是通过“卷积核”(即卷积层)作为中介,同一个卷积核在所有图像内是共享的,图像通过卷积操作后仍然保留原先的位置关系,正是由于深度卷积神经网络模型限制了参数的个数并挖掘了局部结构的这个特点,从而可以减少参数量,并提高网络的鲁棒性。
深度卷积神经网络DCNN(Deep Convolutional Neural Network)包括卷积层、池化层(即特征分类层),多个卷积-池化单元构成特征表达,可应用于二维图像识别。可将DCNN看做是带有二维离散卷积操作的DNN。
相对于相关的车型识别方法,使用本申请的深度卷积网络模型,对图片识别具有更好的效果,利用深度卷积神经网络可解决传统车型识别算法遇到的问题,解决上述车型识别方案中对图像的要求高(如对光照、角度、清晰度、是否有遮挡)、识别率较低、鲁棒性不好等技术难题,避免光照、遮挡等因素对车型识别造成的影响,提高识别的鲁棒性。
可选地,如图8所示,本申请的装置还包括:处理单元82,用于在获取到对目标图片中的车辆进行车型识别的请求之前,对多个车型的图片进行第一预处理,得到训练集合;训练单元84,用于使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练,得到预设神经网络模型。
上述的处理单元还用于对多个车型的图片中的每个图片进行如下处理,其中,每个图片被视为当前图片:对当前图片进行第一处理操作和第二处理操作,得到第一图片,其中,第一图片被视为训练集合中的图片,第一处理操作包括随机旋转和随机裁剪的操作,随机旋转和随机裁剪的操作用于消除图像采集角度对车型识别的影响,第二处理操作用于消除图像采集环境对车型识别的影响。
可选地,处理单元包括:第一处理模块,用于对当前图片进行尺寸调整、随机旋转、随机裁剪、高斯平滑处理、亮度调整以及饱和度调整,得到第二图片;第二处理模块,用于对第二图片进行直方图均衡化处理,得到第三图片;第三处理模块,用于对第三图片进行白化处理,得到第一图片。
可选地,训练单元包括:识别模块,用于通过深度卷积神经网络模型的多个卷积层识别出训练集合中属于每个车型的所有图片的多个第一特征信息;训练模块,用于通过深度卷积神经网络模型的特征分类层从每个车型的所有第一特征信息中提取出每个车型的特征集合之后,得到预设神经网络模型,其中,特征集合包括所有第一特征信息中用于指示车型的第二特征信息,特征集合保存在预设神经网络模型中。
可选地,识别单元还用于在使用预设神经网络模型识别出目标图片中的车辆为目标车型之前,对目标图片进行第二预处理;在使用预设神经网络模型识别出目标图片中的车辆为目标车型时,将经过第二预处理的目标图片的图片数据作为预设神经网络模型的输入,以识别出目标图片中的车辆为目标车型。
可选地,识别单元包括预处理模块,预处理模块用于对目标图片进行如下处理:按照汽车框架进行裁剪、尺寸调整、高斯平滑处理、亮度调整以及饱和度调整,得到第四图片;将第四图片的进行直方图均衡化处理,得到第五图片;将第五图片进行白化处理,得到待输入预设神经网络模型的图片数据。
可选地,识别单元包括识别模块,识别模块用于通过预设神经网络模型的多个卷积层识别出目标图片的第三特征信息;获取目标图片的第三特征信息与每个车型的特征集合中的特征信息的匹配度;确定与多个车型的多个匹配度中的目标匹配度对应的车型为目标车型,其中,目标匹配度包括多个匹配度中数值从大到小的排列中的前N个匹配度,N为正整数。
上述的获取单元还用于接收第一客户端向服务器发送的用于进行车型识别的请求,其中,第一客户端通过互联网与服务器连接。
在服务器上提供用于进行车型识别的函数接口(即预设接口),这样,服务器就可以在预设接口上接收客户端发送的用于进行车型识别的请求。
需要说明的是,该函数接口为一个通用的接口,任意的客户端或者网页均可以调用该接口进行车型识别,例如,在即使通讯应用中,利用该函数接口将拍摄到的图片发送给服务器,由服务器识别出结果之后通过预设接口返回包括目标车型的识别结果至调用预设接口的对象。
在本申请提供的方法中,针对车型识别问题,提出了一种基于深度卷积神经网络的车型识别框架,结合传统的数字图像处理技术做图像预处理,解决了传统方法识别车型时对输入图片要求高,同时识别率较低的问题。本方案在识别车型时具有很好的鲁棒性,对光照、噪声、旋转、部分遮挡等因素不敏感,并且识别率有大幅度提升,与现有方法的区别是不需要手工设计、提取车型图像特征,采用CNN自动设计、提取、优化特征。不仅减少工作量,并且提升了识别率。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
实施例3
根据本发明实施例,还提供了一种用于实施上述车型的识别方法的服务器或终端。
图9是根据本发明实施例的一种终端的结构框图,如图9所示,该终端可以包括:一个或多个(图中仅示出一个)处理器901、存储器903、以及传输装置905(如上述实施例中的发送装置),如图9所示,该终端还可以包括输入输出设备907。
其中,存储器903可用于存储软件程序以及模块,如本发明实施例中的车型的识别方法和装置对应的程序指令/模块,处理器901通过运行存储在存储器903内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的车型的识别方法。存储器903可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器903可进一步包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置905用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置905包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置905为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器903用于存储应用程序。
处理器901可以通过传输装置905调用存储器903存储的应用程序,以执行下述步骤:获取到对目标图片中的车辆进行车型识别的请求;使用预设神经网络模型识别出目标图片中的车辆为目标车型,其中,预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的,训练集合是对多个车型的图片进行第一预处理得到的图片集合,第一预处理用于增强预设神经网络模型的鲁棒性,多个车型包括目标车型;响应于请求,返回包括目标车型的识别结果。
处理器901还用于执行下述步骤:对多个车型的图片进行第一预处理,得到训练集合;使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练,得到预设神经网络模型。
采用本发明实施例,通过使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到预设神经网络模型,在获取到对目标图片中的车辆进行车型识别的请求时即可通过预设神经网络模型,由于训练集合是对多个车型的图片进行第一预处理得到的图片集合,而第一预处理可增强预设神经网络模型的鲁棒性,也即可以消除环境、拍摄角度对车型识别的影响,可以解决了相关技术中进行车型识别的准确率较低的技术问题,进而达到提升车型识别的准确率的技术效果。
可选地,本实施例中的具体示例可以参考上述实施例1和实施例2中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图9所示的结构仅为示意,终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile InternetDevices,MID)、PAD等终端设备。图9其并不对上述电子装置的结构造成限定。例如,终端还可包括比图9中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图9所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例4
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行车型的识别方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,获取到对目标图片中的车辆进行车型识别的请求;
S2,使用预设神经网络模型识别出目标图片中的车辆为目标车型,其中,预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的,训练集合是对多个车型的图片进行第一预处理得到的图片集合,第一预处理用于增强预设神经网络模型的鲁棒性,多个车型包括目标车型;
S3,响应于请求,返回包括目标车型的识别结果。
可选地,本实施例中的具体示例可以参考上述实施例1和实施例2中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (15)
1.一种车型的识别方法,其特征在于,包括:
获取到对目标图片中的车辆进行车型识别的请求;
使用预设神经网络模型识别出所述目标图片中的车辆为目标车型,其中,所述预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的,所述训练集合是对多个车型的图片进行第一预处理得到的图片集合,所述第一预处理用于增强所述预设神经网络模型的鲁棒性,多个所述车型包括所述目标车型;
响应于所述请求,返回包括所述目标车型的识别结果。
2.根据权利要求1所述的方法,其特征在于,在获取到对目标图片中的车辆进行车型识别的请求之前,所述方法还包括:
对多个所述车型的图片进行所述第一预处理,得到所述训练集合;
使用所述训练集合对用于进行车型识别的所述深度卷积神经网络模型进行训练,得到所述预设神经网络模型。
3.根据权利要求2所述的方法,其特征在于,对多个所述车型的图片进行所述第一预处理包括:
对多个所述车型的图片中的每个图片进行如下处理,其中,所述每个图片被视为当前图片:
对所述当前图片进行第一处理操作和第二处理操作,得到第一图片,其中,所述第一图片被视为所述训练集合中的图片,所述第一处理操作包括随机旋转和随机裁剪的操作,所述随机旋转和所述随机裁剪的操作用于消除图像采集角度对车型识别的影响,所述第二处理操作用于消除图像采集环境对车型识别的影响。
4.根据权利要求3所述的方法,其特征在于,对所述当前图片进行第一处理操作和第二处理操作包括:
对所述当前图片进行尺寸调整、随机旋转、随机裁剪、高斯平滑处理、亮度调整以及饱和度调整,得到第二图片;
对所述第二图片进行直方图均衡化处理,得到第三图片;
对所述第三图片进行白化处理,得到所述第一图片。
5.根据权利要求2所述的方法,其特征在于,使用所述训练集合对用于进行车型识别的所述深度卷积神经网络模型进行训练,得到所述预设神经网络模型包括:
通过所述深度卷积神经网络模型的多个卷积层识别出所述训练集合中属于每个所述车型的所有图片的多个第一特征信息;
通过所述深度卷积神经网络模型的特征分类层从每个所述车型的所有所述第一特征信息中提取出每个所述车型的特征集合之后,得到所述预设神经网络模型,其中,所述特征集合包括所有所述第一特征信息中用于指示所述车型的第二特征信息,所述特征集合保存在所述预设神经网络模型中。
6.根据权利要求1所述的方法,其特征在于,
在使用预设神经网络模型识别出所述目标图片中的车辆为目标车型之前,所述方法还包括:对所述目标图片进行第二预处理;
使用预设神经网络模型识别出所述目标图片中的车辆为目标车型包括:将经过所述第二预处理的所述目标图片的图片数据作为所述预设神经网络模型的输入,以识别出所述目标图片中的车辆为所述目标车型。
7.根据权利要求6所述的方法,其特征在于,对所述目标图片进行第二预处理包括:
对所述目标图片进行如下处理:按照汽车框架进行裁剪、尺寸调整、高斯平滑处理、亮度调整以及饱和度调整,得到第四图片;
将所述第四图片的进行直方图均衡化处理,得到第五图片;
将所述第五图片进行白化处理,得到待输入所述预设神经网络模型的图片数据。
8.根据权利要求6所述的方法,其特征在于,将经过所述第二预处理的所述目标图片的图片数据作为所述预设神经网络模型的输入,以识别出所述目标图片中的车辆为所述目标车型包括:
通过所述预设神经网络模型的多个卷积层识别出所述目标图片的第三特征信息;
获取所述目标图片的第三特征信息与每个所述车型的特征集合中的特征信息的匹配度;
确定与多个所述车型的多个所述匹配度中的目标匹配度对应的所述车型为所述目标车型,其中,所述目标匹配度包括多个所述匹配度中数值从大到小的排列中的前N个所述匹配度,N为正整数。
9.根据权利要求1至8中任意一项所述的方法,其特征在于,获取到对目标图片中的车辆进行车型识别的请求包括:
接收第一客户端向服务器发送的用于进行车型识别的所述请求,其中,所述第一客户端通过互联网与所述服务器连接。
10.根据权利要求1至8中任意一项所述的方法,其特征在于,
获取到对目标图片中的车辆进行车型识别的请求包括:在预设接口上接收向服务器发送的用于进行车型识别的所述请求,其中,所述预设接口为所述服务器提供的用于进行车型识别的函数接口;
响应于所述请求,返回包括所述目标车型的识别结果包括:响应于所述请求,通过所述预设接口返回包括所述目标车型的识别结果至调用所述预设接口的对象。
11.一种车型的识别装置,其特征在于,包括:
获取单元,用于获取到对目标图片中的车辆进行车型识别的请求;
识别单元,用于使用预设神经网络模型识别出所述目标图片中的车辆为目标车型,其中,所述预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的,所述训练集合是对多个车型的图片进行第一预处理得到的图片集合,所述第一预处理用于增强所述预设神经网络模型的鲁棒性,多个所述车型包括所述目标车型;
响应单元,用于响应于所述请求,返回包括所述目标车型的识别结果。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
处理单元,用于在获取到对目标图片中的车辆进行车型识别的请求之前,对多个所述车型的图片进行所述第一预处理,得到所述训练集合;
训练单元,用于使用所述训练集合对用于进行车型识别的所述深度卷积神经网络模型进行训练,得到所述预设神经网络模型。
13.根据权利要求12所述的装置,其特征在于,所述处理单元还用于对多个所述车型的图片中的每个图片进行如下处理,其中,所述每个图片被视为当前图片:对所述当前图片进行第一处理操作和第二处理操作,得到第一图片,其中,所述第一图片被视为所述训练集合中的图片,所述第一处理操作包括随机旋转和随机裁剪的操作,所述随机旋转和所述随机裁剪的操作用于消除图像采集角度对车型识别的影响,所述第二处理操作用于消除图像采集环境对车型识别的影响。
14.根据权利要求13所述的装置,其特征在于,所述处理单元包括:
第一处理模块,用于对所述当前图片进行尺寸调整、随机旋转、随机裁剪、高斯平滑处理、亮度调整以及饱和度调整,得到第二图片;
第二处理模块,用于对所述第二图片进行直方图均衡化处理,得到第三图片;
第三处理模块,用于对所述第三图片进行白化处理,得到所述第一图片。
15.根据权利要求12所述的装置,其特征在于,所述训练单元包括:
识别模块,用于通过所述深度卷积神经网络模型的多个卷积层识别出所述训练集合中属于每个所述车型的所有图片的多个第一特征信息;
训练模块,用于通过所述深度卷积神经网络模型的特征分类层从每个所述车型的所有所述第一特征信息中提取出每个所述车型的特征集合之后,得到所述预设神经网络模型,其中,所述特征集合包括所有所述第一特征信息中用于指示所述车型的第二特征信息,所述特征集合保存在所述预设神经网络模型中。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710121609.8A CN108304754A (zh) | 2017-03-02 | 2017-03-02 | 车型的识别方法和装置 |
PCT/CN2018/077898 WO2018157862A1 (zh) | 2017-03-02 | 2018-03-02 | 车型的识别方法和装置、存储介质、电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710121609.8A CN108304754A (zh) | 2017-03-02 | 2017-03-02 | 车型的识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108304754A true CN108304754A (zh) | 2018-07-20 |
Family
ID=62872501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710121609.8A Pending CN108304754A (zh) | 2017-03-02 | 2017-03-02 | 车型的识别方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108304754A (zh) |
WO (1) | WO2018157862A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766915A (zh) * | 2018-12-14 | 2019-05-17 | 深圳壹账通智能科技有限公司 | 基于图像识别的测试方法、装置、计算机设备及存储介质 |
CN110348398A (zh) * | 2019-07-15 | 2019-10-18 | 上海点积实业有限公司 | 一种神经网络模型确定方法和系统 |
CN111104523A (zh) * | 2019-12-20 | 2020-05-05 | 西南交通大学 | 基于语音辅助的视听协同学习机器人及学习方法 |
CN111126224A (zh) * | 2019-12-17 | 2020-05-08 | 成都通甲优博科技有限责任公司 | 车辆检测方法及分类识别模型训练方法 |
CN114419856A (zh) * | 2021-11-25 | 2022-04-29 | 珠海格力电器股份有限公司 | 一种踢被检测预警系统及其控制方法和空调器 |
CN115761659A (zh) * | 2023-01-09 | 2023-03-07 | 南京隼眼电子科技有限公司 | 识别模型构建方法、车型识别方法、电子设备及存储介质 |
CN116342676A (zh) * | 2023-05-31 | 2023-06-27 | 广州市杜格科技有限公司 | 一种交通的全息车辆外廓尺寸测量方法、设备及存储介质 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111127541B (zh) * | 2018-10-12 | 2024-02-27 | 杭州海康威视数字技术股份有限公司 | 车辆尺寸的确定方法、装置及存储介质 |
CN109543526B (zh) * | 2018-10-19 | 2022-11-08 | 谢飞 | 基于深度差异性特征的真假面瘫识别系统 |
CN109635627A (zh) * | 2018-10-23 | 2019-04-16 | 中国平安财产保险股份有限公司 | 图片信息提取方法、装置、计算机设备及存储介质 |
CN111104952A (zh) * | 2018-10-25 | 2020-05-05 | 珠海格力电器股份有限公司 | 识别食物种类的方法、系统及装置、冰箱 |
CN109726712A (zh) * | 2018-11-13 | 2019-05-07 | 平安科技(深圳)有限公司 | 文字识别方法、装置及存储介质、服务器 |
CN109508672A (zh) * | 2018-11-13 | 2019-03-22 | 云南大学 | 一种实时的视频目标检测方法 |
CN109670532B (zh) * | 2018-11-23 | 2022-12-09 | 腾讯医疗健康(深圳)有限公司 | 生物体器官组织图像的异常识别方法、装置及系统 |
CN111310516B (zh) * | 2018-12-11 | 2023-08-29 | 杭州海康威视数字技术股份有限公司 | 一种行为识别方法和装置 |
CN111383325B (zh) * | 2018-12-29 | 2023-06-30 | 深圳市丰驰顺行信息技术有限公司 | 车厢三维图像生成方法及装置 |
CN109800796A (zh) * | 2018-12-29 | 2019-05-24 | 上海交通大学 | 基于迁移学习的船舶目标识别方法 |
CN111401396B (zh) * | 2019-01-03 | 2023-04-18 | 阿里巴巴集团控股有限公司 | 图像识别方法及装置 |
CN111507141B (zh) * | 2019-01-31 | 2023-04-18 | 阿里巴巴集团控股有限公司 | 图片识别方法、服务界面显示方法、系统及设备 |
CN109948610B (zh) * | 2019-03-14 | 2022-11-18 | 西南交通大学 | 一种基于深度学习的视频中车辆细粒度分类方法 |
CN111860077A (zh) * | 2019-04-30 | 2020-10-30 | 北京眼神智能科技有限公司 | 人脸检测方法、装置、计算机可读存储介质及设备 |
CN110705847A (zh) * | 2019-09-18 | 2020-01-17 | 中国南方电网有限责任公司超高压输电公司广州局 | 一种基于图像识别技术的变电站智能巡检方法及系统 |
CN112541564B (zh) * | 2019-09-20 | 2024-02-20 | 腾讯科技(深圳)有限公司 | 降低贝叶斯深度神经网络计算复杂度的方法和装置 |
CN110807123A (zh) * | 2019-10-29 | 2020-02-18 | 中国科学院上海微系统与信息技术研究所 | 车辆长度计算方法、装置、系统、计算机设备及存储介质 |
CN111241953B (zh) * | 2020-01-03 | 2023-11-10 | 河北太行农牧供应链有限公司 | 洗消验证方法和装置、存储介质及电子装置 |
CN113159081A (zh) * | 2020-01-23 | 2021-07-23 | 华为技术有限公司 | 一种图像处理方法以及相关设备 |
CN111291812B (zh) * | 2020-02-11 | 2023-10-17 | 浙江大华技术股份有限公司 | 属性类别的获取方法及装置、存储介质、电子装置 |
CN113807133B (zh) * | 2020-06-12 | 2023-09-01 | 广州极飞科技股份有限公司 | 植物生长区域的灌水状态的识别方法、装置和存储介质 |
CN112101246A (zh) * | 2020-09-18 | 2020-12-18 | 济南博观智能科技有限公司 | 一种车辆识别方法、装置、设备及介质 |
CN112329772B (zh) * | 2020-11-06 | 2024-03-05 | 浙江大搜车软件技术有限公司 | 车辆部件识别方法、装置、电子装置和存储介质 |
CN113076983A (zh) * | 2021-03-26 | 2021-07-06 | 北京明略软件系统有限公司 | 一种图像的识别方法和装置 |
CN113283466A (zh) * | 2021-04-12 | 2021-08-20 | 开放智能机器(上海)有限公司 | 一种仪表读数识别方法及装置、可读存储介质 |
CN114943868B (zh) * | 2021-05-31 | 2023-11-14 | 阿里巴巴新加坡控股有限公司 | 图像处理方法、装置、存储介质及处理器 |
CN113392739B (zh) * | 2021-06-02 | 2022-09-30 | 中南民族大学 | 滚动轴承状态的监测方法、装置、设备及存储介质 |
CN113837272B (zh) * | 2021-09-23 | 2024-03-26 | 中汽创智科技有限公司 | 一种自动驾驶长尾数据增强方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100278436A1 (en) * | 2009-04-30 | 2010-11-04 | Industrial Technology Research Institute | Method and system for image identification and identification result output |
CN104463241A (zh) * | 2014-10-31 | 2015-03-25 | 北京理工大学 | 一种智能交通监控系统中的车辆类型识别方法 |
CN105389593A (zh) * | 2015-11-16 | 2016-03-09 | 上海交通大学 | 基于surf特征的图像物体识别方法 |
CN105894045A (zh) * | 2016-05-06 | 2016-08-24 | 电子科技大学 | 一种基于空间金字塔池化的深度网络模型的车型识别方法 |
CN106295541A (zh) * | 2016-08-03 | 2017-01-04 | 乐视控股(北京)有限公司 | 车辆类型识别方法及系统 |
CN106446834A (zh) * | 2016-09-27 | 2017-02-22 | 东软集团股份有限公司 | 一种基于图像的车型识别方法及装置 |
-
2017
- 2017-03-02 CN CN201710121609.8A patent/CN108304754A/zh active Pending
-
2018
- 2018-03-02 WO PCT/CN2018/077898 patent/WO2018157862A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100278436A1 (en) * | 2009-04-30 | 2010-11-04 | Industrial Technology Research Institute | Method and system for image identification and identification result output |
CN104463241A (zh) * | 2014-10-31 | 2015-03-25 | 北京理工大学 | 一种智能交通监控系统中的车辆类型识别方法 |
CN105389593A (zh) * | 2015-11-16 | 2016-03-09 | 上海交通大学 | 基于surf特征的图像物体识别方法 |
CN105894045A (zh) * | 2016-05-06 | 2016-08-24 | 电子科技大学 | 一种基于空间金字塔池化的深度网络模型的车型识别方法 |
CN106295541A (zh) * | 2016-08-03 | 2017-01-04 | 乐视控股(北京)有限公司 | 车辆类型识别方法及系统 |
CN106446834A (zh) * | 2016-09-27 | 2017-02-22 | 东软集团股份有限公司 | 一种基于图像的车型识别方法及装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766915A (zh) * | 2018-12-14 | 2019-05-17 | 深圳壹账通智能科技有限公司 | 基于图像识别的测试方法、装置、计算机设备及存储介质 |
WO2020119419A1 (zh) * | 2018-12-14 | 2020-06-18 | 深圳壹账通智能科技有限公司 | 基于图像识别的测试方法、装置、计算机设备及存储介质 |
CN110348398A (zh) * | 2019-07-15 | 2019-10-18 | 上海点积实业有限公司 | 一种神经网络模型确定方法和系统 |
CN110348398B (zh) * | 2019-07-15 | 2022-12-13 | 上海点积实业有限公司 | 一种神经网络模型确定方法和系统 |
CN111126224A (zh) * | 2019-12-17 | 2020-05-08 | 成都通甲优博科技有限责任公司 | 车辆检测方法及分类识别模型训练方法 |
CN111104523A (zh) * | 2019-12-20 | 2020-05-05 | 西南交通大学 | 基于语音辅助的视听协同学习机器人及学习方法 |
CN114419856A (zh) * | 2021-11-25 | 2022-04-29 | 珠海格力电器股份有限公司 | 一种踢被检测预警系统及其控制方法和空调器 |
CN115761659A (zh) * | 2023-01-09 | 2023-03-07 | 南京隼眼电子科技有限公司 | 识别模型构建方法、车型识别方法、电子设备及存储介质 |
CN115761659B (zh) * | 2023-01-09 | 2023-04-11 | 南京隼眼电子科技有限公司 | 识别模型构建方法、车型识别方法、电子设备及存储介质 |
CN116342676A (zh) * | 2023-05-31 | 2023-06-27 | 广州市杜格科技有限公司 | 一种交通的全息车辆外廓尺寸测量方法、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2018157862A1 (zh) | 2018-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304754A (zh) | 车型的识别方法和装置 | |
CN111368342A (zh) | 图像篡改识别模型训练方法、图像篡改识别方法及装置 | |
CN112241679B (zh) | 一种垃圾自动分类的方法 | |
CN111209858B (zh) | 一种基于深度卷积神经网络的实时车牌检测方法 | |
CN111178121B (zh) | 基于空间特征和深度特征强化技术的害虫图像定位识别方法 | |
CN112560831A (zh) | 一种基于多尺度空间校正的行人属性识别方法 | |
CN104063686A (zh) | 作物叶部病害图像交互式诊断系统与方法 | |
CN111967319B (zh) | 基于红外和可见光的活体检测方法、装置、设备和存储介质 | |
CN112464766A (zh) | 一种农田地头自动识别方法及系统 | |
JP2021531571A (ja) | 証明書画像抽出方法及び端末機器 | |
CN115359353A (zh) | 一种花卉识别分类方法及装置 | |
CN111079511A (zh) | 基于深度学习的文档自动归类及光学字符识别方法及系统 | |
CN109977941A (zh) | 车牌识别方法及装置 | |
CN111833360A (zh) | 一种图像处理方法、装置、设备以及计算机可读存储介质 | |
CN110751225A (zh) | 图像分类方法、装置及存储介质 | |
CN112766232A (zh) | 一种基于可重构卷积神经网络的道路风险目标识别方法 | |
CN110766001B (zh) | 基于cnn和rnn的银行卡卡号定位与端到端识别方法 | |
CN115035313B (zh) | 黑颈鹤识别方法、装置、设备及存储介质 | |
CN116977683A (zh) | 对象识别方法、装置、计算机设备、存储介质和程序产品 | |
CN115661803A (zh) | 图像清晰度检测方法、电子设备以及计算机可读存储介质 | |
CN113298102B (zh) | 一种目标分类模型的训练方法及装置 | |
CN114897214A (zh) | 一种基于图形化处理的金属增材制造时间预测系统和方法 | |
CN114723953A (zh) | 一种面向图像来源检测的深度神经网络 | |
Lo et al. | A statistic approach for photo quality assessment | |
CN113505780A (zh) | 一种基于二维码的智能检测维保的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180720 |