CN110689481A - 车辆种类识别方法及装置 - Google Patents
车辆种类识别方法及装置 Download PDFInfo
- Publication number
- CN110689481A CN110689481A CN201910045817.3A CN201910045817A CN110689481A CN 110689481 A CN110689481 A CN 110689481A CN 201910045817 A CN201910045817 A CN 201910045817A CN 110689481 A CN110689481 A CN 110689481A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- picture
- neural network
- network model
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000003062 neural network model Methods 0.000 claims abstract description 63
- 238000011176 pooling Methods 0.000 claims description 53
- 238000012545 processing Methods 0.000 claims description 45
- 238000012549 training Methods 0.000 claims description 30
- 238000000605 extraction Methods 0.000 claims description 20
- 238000004422 calculation algorithm Methods 0.000 claims description 18
- 230000011218 segmentation Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 9
- 239000003086 colorant Substances 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000003137 locomotive effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000000746 body region Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/32—Indexing scheme for image data processing or generation, in general involving image mosaicing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请提供的车辆种类识别方法及装置,通过获取车辆整体图片,并对车辆进行分割获得多个不同部位的局部图片。将该车辆不同部位的局部图片,按照不同部位对应的位置拼接成一幅大图。将拼接成的大图送入神经网络模型提取特征,并根据提取获得的特征对车辆进行分类。因此,本申请提供的车辆种类识别方法及装置提高不同拍摄角度下车辆种类识别率;相较于现有技术中通过多个卷积网络分别提取车辆全局图像特征和局部图像特征后再进行融合,减少了计算步骤和计算量。
Description
技术领域
本申请涉及图像识别领域,具体而言,涉及一种车辆种类识别方法及装置。
背景技术
目前,在对车辆种类的进行识别,主要针对车辆的某一特定角度的图片。如果角度发生变化,识别准确率急剧下降。同时,对车辆的种类进行识别,传统的方法是设计多个卷积网络,一个卷积网络提取全局图片特征,其他网络提取局部图像特征,再将全局图片特征和局部图片特征融合。传统的方法步骤繁琐,计算量大,不能满足需要快速识别出车辆类型的应用场景。
发明内容
为了克服现有技术中的上述不足,本申请的目的在于提供一种车辆种类识别方法,应用于数据处理设备,所述数据处理设备预设有神经网络模型,所述神经网络模型包括多个卷积层、第一池化层和全连接层,所述方法的步骤包括:
获取车辆整体图片;
对所述车辆整体图片进行分割,获得车辆多个不同部位的局部图片;
按照预设区域划分将所述车辆多个不同部位的局部图片和所述车辆整体图片进行拼接获得拼接图片;
依次通过所述神经网络模型的多个卷积层对所述拼接图片进行特征学习获得第一特征;
通过所述神经网络模型的第一池化层对所述第一特征的预设划分区域分别做全局平均池化处理获得第二特征;
通过所述全连接层对所述第二特征进行车辆种类分类。
可选地,所述对所述车辆整体图片进行分割,获得车辆多个不同部位的局部图片的步骤包括:
识别出所述车辆整体图片中的关键点,所述关键点用于区分车辆的不同部位;
根据所述关键点,将所述车辆整体图片分割成多个不同部位的局部图片。
可选地,所述按照预设区域划分将所述车辆多个不同部位的局部图片和所述车辆整体图片进行拼接获得拼接图片的步骤包括:
将所述多个不同部位的局部图片分别拼接至相应的所述预设区域;针对没有对应的局部图片的预设区域,使用预设颜色的图片进行填充。
可选地,所述方法的步骤还包括:
获得待识别图片;
识别并提取所述待识别图片中的车辆整体图片。
可选地,所述方法还包括对所述神经网络模型的训练步骤:
获取标识有样本车辆种类的训练样本图片;
对所述训练样本图片进行分割,获得样本车辆多个不同部位的局部图片;
按照预设区域划分将所述样本车辆多个不同部位的局部图片和所述样本车辆整体图片进行拼接获得样本拼接图片;
将所述拼接图片送入所述神经网络模型,根据预设损失函数,通过反向传播算法调整所述神经网络模型的权值,直到所述神经网络模型的输出误差低于预设阈值。
可选地,所述卷积层包括通用卷积层、批归一化层和第二池化层;
通过所述通用卷积层的多个卷积核对所述拼接图片做特征提取获得多个第一样本特征;
通过所述批归一化层对所述多个第一样本特征做归一化后的第一样本特征;
通过所述第二池化层对所述归一化后的第一样本特征做池化处理。
可选地,所述将所述拼接图片送入所述神经网络模型的步骤包括:
通过所述第一池化层获得第二样本特征,所述第二样本特征包括车辆局部池化图片和整车池化图片;
先通过所述车辆局部池化图片训练所述神经网络模型,其中,所述整车池化图片通过预设颜色的图片进行替换;
再通过所述整车池化图片训练所述神经网络模型。
本申请的另一目的在于提供一种车辆种类识别装置,应用于数据处理设备,所述数据处理设备预设有神经网络模型,所述神经网络模型包括多个卷积层、第一池化层和全连接层;所述装置包括图片获取模块、图片分割模块、图片拼接模块、特征提取模块、池化模块和种类识别模块;
所述图片获取模块用于获取车辆整体图片;
所述图片分割模块用于对所述车辆整体图片进行分割,获得车辆多个不同部位的局部图片;
所述图片拼接模块用于按照预设区域划分将所述车辆多个不同部位的局部图片和所述车辆整体图片进行拼接获得拼接图片;
所述特征提取模块用于依次通过所述神经网络模型的多个卷积层对所述拼接图片进行特征学习获得第一特征;
所述池化模块用于通过所述神经网络模型的第一池化层对所述第一特征的预设划分区域分别做全局平均池化处理获得第二特征;
所述种类识别模块用于通过所述全连接层对所述第二特征进行车辆种类分类。
可选地,所述图片分割模块通过以下方式获得多个车辆局部图片:
识别出所述车辆整体图片中的关键点,所述关键点用于区分车辆的不同部位;
根据所述关键点,将所述车辆整体图片分割成不同车辆局部图片。
可选地,所述车辆种类识别装置还包括学习训练模块,所述车辆种类识别装置通过以下方式对所述神经网络模型进行训练:
所述图片获取模块还用于获取标识有样本车辆种类的训练样本图片;
所述图片分割模块还用于对所述训练样本图片进行分割,获得样本车辆多个不同部位的局部图片;
所述图片拼接模块还用于按照预设区域划分将所述样本车辆多个不同部位的局部图片和所述样本车辆整体图片进行拼接获得样本拼接图片;
所述学习训练模块将所述拼接图片送入所述神经网络模型,根据预设损失函数,通过反向传播算法调整所述神经网络模型的权值,直到所述神经网络模型的输出误差低于预设阈值。
相对于现有技术而言,本申请具有以下有益效果:
本申请提供的车辆种类识别方法及装置,通过获取车辆整体图片,并对车辆进行分割获得多个不同部位的局部图片。将该车辆不同部位的局部图片,按照不同部位对应的位置拼接成一幅大图。将拼接成的大图送入神经网络模型提取特征,并根据提取获得的特征对车辆进行分类。因此,本申请提供的车辆种类识别方法及装置提高不同拍摄角度下车辆种类识别率;相较于现有技术中通过多个卷积网络分别提取车辆全局图像特征和局部图像特征后再进行融合,减少了计算步骤和计算量。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的数据处理设备的硬件结构图;
图2为本申请实施例提供的车辆种类识别方法的步骤流程图;
图3为本申请实施例提供的拼接图的结构框图;
图4为本申请实施例提供的车辆种类识别装置的结构图。
图标:100-数据处理设备;130-处理器;110-车辆种类识别装置;120-存储器;71-车尾区域;72-车顶区域;73-车侧身区域;74-车头区域;75-整车区域;1101-图片获取模块;1102-图片分割模块;1103-图片拼接模块;1104-特征提取模块;1105-池化模块;1106-种类识别模块;1107-学习训练模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
为了解决传统的车辆种类识别方法数据计算量大,并且只能对车辆特定部位进行识别的问题,本实施例提供一种车辆种类识别方法,应用于数据处理设备100,其中,所述数据处理设备100预设有神经网络模型。
请参照图1所示的数据处理设备100的硬件结构图,所述数据处理设备100包括车辆种类识别装置110、存储器120和处理器130。
所述数据处理设备100可以是,但不限于,智能手机、个人电脑(personalcomputer,PC)、平板电脑、个人数字助理(personal digital assistant,PDA)、移动上网设备(mobile Internet device,MID)等。所述数据处理设备100的操作系统可以是,但不限于,安卓(Android)系统、IOS(iPhone operating system)系统、Windows phone系统、Windows系统等。
所述存储器120和处理器130各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
其中,所述存储器120可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,存储器120用于存储程序,所述处理器130在接收到执行指令后,执行所述程序。
所述处理器130可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参照图2所示的车辆种类识别方法的步骤流程图,应用于图1所示的数据处理设备100,以下将对所述方法包括各个步骤进行详细阐述。
步骤S100,获取车辆整体图片。
可选地,所述数据处理设备100通过网络或者本地长效存储介质获取待识别图像,通过目标检测算法识别出该待识别图像中的目标,并确定该目标在该待识别图像中的位置和大小。所述图像处理设备根据该位置和大小截取出该待识别图像中的车辆整体图片,其中,所述目标检车算法包括传统的目标检测算法,例如,DPM(DPM,Deformable PartsModel)算法或者HOG(HOG,Histogram of Oriented Gradient)+SVM(SVM,Support VectorMachine);以及基于深度学习的目标检测算法,例如,RCNN算法或者RFCN算法。
步骤S200,对所述车辆整体图片进行分割,获得车辆多个不同部位的局部图片。
可选地,所述数据处理设备100根据关键点检测算法,确定出车辆整体图片中预设数量的关键点。所述数据处理设备100根据该关键点将车辆分割成不同部位的局部图片。其中,所述关键点检测算法可以是ASM(ASM,Active Shape Model)算法、AAM(AAM,ActiveAppearance Model)算法或者CLM(CLM,Constrained Local Model)算法。例如,在一种可能的示例中,所述关键点总共12个,包括车顶4个关键点、车头4个关键点以及车尾4个关键点。所述数据处理设备100通过这12个关键点将车辆整体图片分割成车尾、车顶、车头和车侧身4个部位。
步骤S300,按照预设区域划分将所述车辆多个不同部位的局部图片和所述车辆整体图片进行拼接获得拼接图片。
可选地,请参照图3所示的拼接图的结构框图,所述拼接图包括5个区域,分别为车尾区域71、车顶区域72、车头区域74、车侧身区域73和整车区域75。将不同部位的车辆图片放置到对应的位置获得拼接图像。比如,将车尾放置到车尾区域71;将车顶放置到车顶区域72;将车头放置到车头区域74;将车侧身放置到车侧身区域73;将整车放置到整车区域75。
由于拍摄视角的原因,在对整车图片进行分割的时候,并不能得到全部的局部图片。针对不能获得的局部图片,使用预设颜色进行填充,比如白色。
值得说明的是,所述拼接图可以是如图3所示的结构,但不仅限于此结构图,只要能将不同部位的局部图片按照预设区域划分将不同部位的局部图进行拼接获得拼接图片即可。
步骤S400,依次通过所述神经网络模型的多个卷积层对所述拼接图片进行特征学习获得第一特征。
可选地,将所述拼接图像送入所述多个卷积层进行特征提取,获得所述整车图片的局部特征和全局特征。
步骤S500,通过所述神经网络模型的第一池化层对所述第一特征的预设划分区域分别做全局平均池化处理获得第二特征。
所述数据处理设备100分别对所述局部特征和全局特征做池化处理,获得池化后的特征数据;进一步的将该池化后的特征数据送入全连接层实现对所述整车图片的分类。
例如,在一种可能的示例中,所述拼接图片为224*448大小RGB图像。所述数据处理设备100通过第一特征提取层提取所述拼接图片的特征信息获得第一特征图,所述第一特征提取层依次包括卷积核大小为3×3,通道数为64的第一卷积层,第一批归一化层和第一池最大化层。进一步地,所述数据处理设备100通过第二特征提取层提取所述第一特征图的特征信息获得第二特征图。其中所述第二特征提取层依次包括卷积核大小为3×3,通道数为128的第二卷积层,第二批归一化层和第二最大池化层。进一步地,所述数据处理设备100通过第三特征提取层提取所述第二特征图的特征信息,获得第三特征图,其中,所述第三特征提取层依次包括卷积核大小为3×3,通道数为256的第三卷积层,第三批归一化层和第三最大池化层。进一步地,所述数据处理设备100通过第四特征提取层提取所述第三特征图的特征信息,获得第四特征图。其中,所述第四特征提取层依次包括卷积核大小为3×3,通道数为512的第四卷积层,第四批归一下层和第一平均池化层。进一步的,所述数据处理设备100通过一个卷积核大小为1×1,通道数为128的卷积层对所述第四特征图进行降低维处理,然后将降维处理后的特征图送入全连接层进行分类,并获得拼接图的分类结果。值得说明的是,批归一化层用于训练该神经网络模型时,缓解了深层网络中梯度弥散的问题,从而使得训练深层网络模型更加容易和稳定。
可选地,所述数据处理设备100还包括对所述神经网络模型的训练步骤,所述步骤包括:
所述数据处理设备100对所述神经网络模型的权值参数进行初始化后。所述数据处理设备100获取标识有样本车辆种类的训练样本图片;并对所述训练样本图片进行分割,获得样本车辆多个不同部位的局部图片。其中,所述样本车辆种类包括SUV、小轿车、货车和面包车。所述数据处理设备100按照预设区域划分将所述样本车辆多个不同部位的局部图片和所述样本车辆整体图片进行拼接获得样本拼接图片。
所述数据处理设备100将所述拼接图片送入所述神经网络模型,其中,所述神经网络模型可是常见的卷积神经网络模型,但不限于此神经网络模型,还可以是Resnet卷积网络或者Inception卷积网络,只要能够提取拼接图片的特征信息,并识别出图片中车辆的种类即可。所述电子设备依次通过所述多个卷积层对所述样本拼接图片进行特征学习获得第一样本特征。进一步地,通过所述第一池化层对所述第一样本特征的预设划分区域分别做全局平均池化处理获得第二样本特征。进一步地,将所述第二样本特征送入所述全连接层。值得说明是,由于所述拼接图片由局部图片和所述样本车辆整体图片拼接而成,该局部图片和该样本车辆整体图片存在信息重合的部分,为了使该神经网络模型更加关注局部特征,所述数据处理设备100先通过车辆局部池化图片训练所述神经网络模型,其中,整车池化图片通过预设颜色的图片进行替换;再通过所述车辆全局池化图片训练所述神经网络模型。所述神经网络模型根据Softmax损失函数,通过反向传播算法重复调整所述神经网络模型的权值,直到训练误差小于预设阈值。
如图4所示的车辆种类识别装置110结构图,本实施例的另一目的在于提供一种车辆种类识别装置110,所述车辆种类识别装置110包括至少一个可以软件或固件(firmware)的形式存储于所述存储器120中或固化在所述数据处理设备100的操作系统(operatingsystem,OS)中的软件功能模块。所述处理器130用于执行所述存储器120中存储的可执行模块,例如所述车辆种类识别装置110所包括的软件功能模块及计算机程序等。
所述车辆种类识别装置110应用于数据处理设备100,所述数据处理设备100预设有神经网络模型,所述神经网络模型包括多个卷积层、第一池化层和全连接层;所述装置包括图片获取模块1101、图片分割模块1102、图片拼接模块1103、特征提取模块1104、池化模块1105和种类识别模块1106;
所述图片获取模块1101用于获取车辆整体图片;
在本实施例中,所述图片获取模块1101用于执行图2中的步骤S100,关于所述图片获取模块1101的详细步骤请参考步骤S100的详细描述。
所述图片分割模块1102用于对所述车辆整体图片进行分割,获得车辆多个不同部位的局部图片。
在本实施例中,所述图片分割模块1102用于执行图2中的步骤S200,关于所述图片分割模块1102的详细描述请参考步骤S200的详细描述。
所述图片拼接模块1103用于按照预设区域划分将所述车辆多个不同部位的局部图片和所述车辆整体图片进行拼接获得拼接图片。
在本实施例中,所述图片拼接模块1103用于执行图2中的步骤S300,关于所述图片拼接模块1103的详细描述请参考步骤S300的详细描述。
所述特征提取模块1104用于依次通过所述神经网络模型的多个卷积层对所述拼接图片进行特征学习获得第一特征。
在本实施例中,所述特征提取模块1104用于执行图2中的步骤S400,关于所述特征提取模块1104的详细描述可以参考步骤S400的详细描述。
所述池化模块1105用于通过所述神经网络模型的第一池化层对所述第一特征的预设划分区域分别做全局平均池化处理获得第二特征。
在本实施例中,所述池化模块1105用于执行图2中的步骤S500,关于所述池化模块1105的详细描述可以参考步骤S500的详细描述。
所述种类识别模块1106用于通过所述全连接层对所述第二特征进行车辆种类分类。
在本实施例中,所述种类识别模块1106用于执行图2中的步骤S600,关于所述种类识别模块1106的详细描述可以参考步骤S600的详细描述。
可选地,所述图片分割模块1102通过以下方式获得多个车辆局部图片:
识别出所述车辆整体图片中的关键点,所述关键点用于区分车辆的不同部位;
根据所述关键点,将所述车辆整体图片分割成不同车辆局部图片。
可选地,所述车辆种类识别装置110还包括学习训练模块1107,所述车辆种类识别装置110通过以下方式对所述神经网络模型进行训练:
所述图片获取模块1101还用于获取标识有样本车辆种类的训练样本图片;
所述图片分割模块1102还用于对所述训练样本图片进行分割,获得样本车辆多个不同部位的局部图片;
所述图片拼接模块1103还用于按照预设区域划分将所述样本车辆多个不同部位的局部图片和所述样本车辆整体图片进行拼接获得样本拼接图片;
将所述拼接图片送入所述神经网络模型,根据预设损失函数,通过反向传播算法调整所述神经网络模型的权值,直到所述神经网络模型的输出误差低于预设阈值。
综上所述,本申请提供的车辆种类识别方法及装置,通过获取车辆整体图片,并对车辆进行分割获得多个不同部位的局部图片。将该车辆不同部位的图片,按照不同部位对应的位置拼接成一幅大图。将拼接成的大图送入神经网络模型训练。本申请提供的技术方案在降低数据计算量的同时,提高了车辆种类的识别率。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种车辆种类识别方法,其特征在于,应用于数据处理设备,所述数据处理设备预设有神经网络模型,所述神经网络模型包括多个卷积层、第一池化层和全连接层,所述方法的步骤包括:
获取车辆整体图片;
对所述车辆整体图片进行分割,获得车辆多个不同部位的局部图片;
按照预设区域划分将所述车辆多个不同部位的局部图片和所述车辆整体图片进行拼接获得拼接图片;
依次通过所述神经网络模型的多个卷积层对所述拼接图片进行特征学习获得第一特征;
通过所述神经网络模型的第一池化层对所述第一特征的预设划分区域分别做全局平均池化处理获得第二特征;
通过所述全连接层对所述第二特征进行车辆种类分类。
2.根据权利要求1所述的车辆种类识别方法,其特征在于,所述对所述车辆整体图片进行分割,获得车辆多个不同部位的局部图片的步骤包括:
识别出所述车辆整体图片中的关键点,所述关键点用于区分车辆的不同部位;
根据所述关键点,将所述车辆整体图片分割成多个不同部位的局部图片。
3.根据权利要求1所述的车辆种类识别方法,其特征在于,所述按照预设区域划分将所述车辆多个不同部位的局部图片和所述车辆整体图片进行拼接获得拼接图片的步骤包括:
将所述多个不同部位的局部图片分别拼接至相应的所述预设区域;针对没有对应的局部图片的预设区域,使用预设颜色的图片进行填充。
4.根据权利要求1所述的车辆种类识别方法,其特征在于,所述方法的步骤还包括:
获得待识别图片;
识别并提取所述待识别图片中的车辆整体图片。
5.根据权利要求1所述的车辆种类识别方法,其特征在于,所述方法还包括对所述神经网络模型的训练步骤:
获取标识有样本车辆种类的训练样本图片;
对所述训练样本图片进行分割,获得样本车辆多个不同部位的局部图片;
按照预设区域划分将所述样本车辆多个不同部位的局部图片和所述样本车辆整体图片进行拼接获得样本拼接图片;
将所述拼接图片送入所述神经网络模型,根据预设损失函数,通过反向传播算法调整所述神经网络模型的权值,直到所述神经网络模型的输出误差低于预设阈值。
6.根据权利要求5所述的车辆种类识别方法,其特征在于,所述卷积层包括通用卷积层、批归一化层和第二池化层;
通过所述通用卷积层的多个卷积核对所述拼接图片做特征提取获得多个第一样本特征;
通过所述批归一化层对所述多个第一样本特征做归一化后的第一样本特征;
通过所述第二池化层对所述归一化后的第一样本特征做池化处理。
7.根据权利要求5所述的车辆种类识别方法,其特征在于,所述将所述拼接图片送入所述神经网络模型的步骤包括:
通过所述第一池化层获得第二样本特征,所述第二样本特征包括车辆局部池化图片和整车池化图片;
先通过所述车辆局部池化图片训练所述神经网络模型,其中,所述整车池化图片通过预设颜色的图片进行替换;
再通过所述整车池化图片训练所述神经网络模型。
8.一种车辆种类识别装置,其特征在于,应用于数据处理设备,所述数据处理设备预设有神经网络模型,所述神经网络模型包括多个卷积层、第一池化层和全连接层;所述装置包括图片获取模块、图片分割模块、图片拼接模块、特征提取模块、池化模块和种类识别模块;
所述图片获取模块用于获取车辆整体图片;
所述图片分割模块用于对所述车辆整体图片进行分割,获得车辆多个不同部位的局部图片;
所述图片拼接模块用于按照预设区域划分将所述车辆多个不同部位的局部图片和所述车辆整体图片进行拼接获得拼接图片;
所述特征提取模块用于依次通过所述神经网络模型的多个卷积层对所述拼接图片进行特征学习获得第一特征;
所述池化模块用于通过所述神经网络模型的第一池化层对所述第一特征的预设划分区域分别做全局平均池化处理获得第二特征;
所述种类识别模块用于通过所述全连接层对所述第二特征进行车辆种类分类。
9.根据权利要求8所述的车辆种类识别装置,其特征在于,所述图片分割模块通过以下方式获得多个车辆局部图片:
识别出所述车辆整体图片中的关键点,所述关键点用于区分车辆的不同部位;
根据所述关键点,将所述车辆整体图片分割成不同车辆局部图片。
10.根据权利要求8所述的车辆种类识别装置,其特征在于,所述车辆种类识别装置还包括学习训练模块,所述车辆种类识别装置通过以下方式对所述神经网络模型进行训练:
所述图片获取模块还用于获取标识有样本车辆种类的训练样本图片;
所述图片分割模块还用于对所述训练样本图片进行分割,获得样本车辆多个不同部位的局部图片;
所述图片拼接模块还用于按照预设区域划分将所述样本车辆多个不同部位的局部图片和所述样本车辆整体图片进行拼接获得样本拼接图片;
所述学习训练模块将所述拼接图片送入所述神经网络模型,根据预设损失函数,通过反向传播算法调整所述神经网络模型的权值,直到所述神经网络模型的输出误差低于预设阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910045817.3A CN110689481A (zh) | 2019-01-17 | 2019-01-17 | 车辆种类识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910045817.3A CN110689481A (zh) | 2019-01-17 | 2019-01-17 | 车辆种类识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110689481A true CN110689481A (zh) | 2020-01-14 |
Family
ID=69107538
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910045817.3A Pending CN110689481A (zh) | 2019-01-17 | 2019-01-17 | 车辆种类识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110689481A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488930A (zh) * | 2020-04-09 | 2020-08-04 | 北京市商汤科技开发有限公司 | 分类网络的训练方法、目标检测方法、装置和电子设备 |
CN112101183A (zh) * | 2020-09-10 | 2020-12-18 | 深圳市商汤科技有限公司 | 车辆识别方法及装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120133639A1 (en) * | 2010-11-30 | 2012-05-31 | Microsoft Corporation | Strip panorama |
CN105574550A (zh) * | 2016-02-02 | 2016-05-11 | 北京格灵深瞳信息技术有限公司 | 一种车辆识别方法及装置 |
CN106845338A (zh) * | 2016-12-13 | 2017-06-13 | 深圳市智美达科技股份有限公司 | 视频流中行人检测方法与系统 |
CN108288073A (zh) * | 2018-01-30 | 2018-07-17 | 北京小米移动软件有限公司 | 图片真伪识别方法及装置、计算机可读存储介质 |
CN108334892A (zh) * | 2017-12-26 | 2018-07-27 | 新智数字科技有限公司 | 一种基于卷积神经网络的车型识别方法、装置及设备 |
CN108681707A (zh) * | 2018-05-15 | 2018-10-19 | 桂林电子科技大学 | 基于全局和局部特征融合的大角度车型识别方法和系统 |
-
2019
- 2019-01-17 CN CN201910045817.3A patent/CN110689481A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120133639A1 (en) * | 2010-11-30 | 2012-05-31 | Microsoft Corporation | Strip panorama |
CN105574550A (zh) * | 2016-02-02 | 2016-05-11 | 北京格灵深瞳信息技术有限公司 | 一种车辆识别方法及装置 |
CN106845338A (zh) * | 2016-12-13 | 2017-06-13 | 深圳市智美达科技股份有限公司 | 视频流中行人检测方法与系统 |
CN108334892A (zh) * | 2017-12-26 | 2018-07-27 | 新智数字科技有限公司 | 一种基于卷积神经网络的车型识别方法、装置及设备 |
CN108288073A (zh) * | 2018-01-30 | 2018-07-17 | 北京小米移动软件有限公司 | 图片真伪识别方法及装置、计算机可读存储介质 |
CN108681707A (zh) * | 2018-05-15 | 2018-10-19 | 桂林电子科技大学 | 基于全局和局部特征融合的大角度车型识别方法和系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488930A (zh) * | 2020-04-09 | 2020-08-04 | 北京市商汤科技开发有限公司 | 分类网络的训练方法、目标检测方法、装置和电子设备 |
CN111488930B (zh) * | 2020-04-09 | 2024-05-24 | 北京市商汤科技开发有限公司 | 分类网络的训练方法、目标检测方法、装置和电子设备 |
CN112101183A (zh) * | 2020-09-10 | 2020-12-18 | 深圳市商汤科技有限公司 | 车辆识别方法及装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112528878B (zh) | 检测车道线的方法、装置、终端设备及可读存储介质 | |
CN109002820B (zh) | 一种车牌识别方法、装置及相关设备 | |
US10223614B1 (en) | Learning method, learning device for detecting lane through classification of lane candidate pixels and testing method, testing device using the same | |
CN110414507B (zh) | 车牌识别方法、装置、计算机设备和存储介质 | |
WO2022126377A1 (zh) | 检测车道线的方法、装置、终端设备及可读存储介质 | |
CN109886928B (zh) | 一种目标细胞标记方法、装置、存储介质及终端设备 | |
US11455831B2 (en) | Method and apparatus for face classification | |
CN112381775A (zh) | 一种图像篡改检测方法、终端设备及存储介质 | |
CN112926531A (zh) | 特征信息提取方法、模型训练方法、装置及电子设备 | |
CN110956081B (zh) | 车辆与交通标线位置关系的识别方法、装置及存储介质 | |
CN111931764A (zh) | 一种目标检测方法、目标检测框架及相关设备 | |
CN112036400B (zh) | 构建用于目标检测的网络的方法和目标检测方法及系统 | |
CN113222055B (zh) | 一种图像分类方法、装置、电子设备及存储介质 | |
CN110909618A (zh) | 一种宠物身份的识别方法及装置 | |
CN111160395A (zh) | 图像识别方法、装置、电子设备和存储介质 | |
CN107464245B (zh) | 一种图像结构边缘的定位方法及装置 | |
CN111709377B (zh) | 特征提取方法、目标重识别方法、装置及电子设备 | |
CN113111880B (zh) | 证件图像校正方法、装置、电子设备及存储介质 | |
CN114663871A (zh) | 图像识别方法、训练方法、装置、系统及存储介质 | |
CN111898540A (zh) | 车道线检测方法、装置、计算机设备及计算机可读存储介质 | |
CN112785595B (zh) | 目标属性检测、神经网络训练及智能行驶方法、装置 | |
CN110689481A (zh) | 车辆种类识别方法及装置 | |
CN112784675A (zh) | 目标检测方法及装置、存储介质、终端 | |
CN108960246B (zh) | 一种用于图像识别的二值化处理装置及方法 | |
CN117612128A (zh) | 车道线生成方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200114 |
|
RJ01 | Rejection of invention patent application after publication |