CN111695587A - 一种车辆品牌型号识别方法及装置 - Google Patents

一种车辆品牌型号识别方法及装置 Download PDF

Info

Publication number
CN111695587A
CN111695587A CN202010246688.7A CN202010246688A CN111695587A CN 111695587 A CN111695587 A CN 111695587A CN 202010246688 A CN202010246688 A CN 202010246688A CN 111695587 A CN111695587 A CN 111695587A
Authority
CN
China
Prior art keywords
vehicle
layer
convolution
size
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010246688.7A
Other languages
English (en)
Other versions
CN111695587B (zh
Inventor
程博锋
唐侃毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN202010246688.7A priority Critical patent/CN111695587B/zh
Publication of CN111695587A publication Critical patent/CN111695587A/zh
Application granted granted Critical
Publication of CN111695587B publication Critical patent/CN111695587B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了一种车辆品牌型号识别方法及装置,该方法包括:获取待识别的车辆图像;将车辆图像输入训练好的深度学习网络模型中,得到车辆图像的车辆部位,该深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到;针对每个车辆部位,将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中,得到该车辆部位对应的车辆图像的车辆品牌型号,该Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。本申请可提高识别车辆品牌型号的准确率。

Description

一种车辆品牌型号识别方法及装置
技术领域
本申请涉及车辆识别领域,特别涉及一种车辆品牌型号识别方法及装置。
背景技术
目前,汽车已成为人们出行的首选交通工具,随着车辆数目的不断增加,车辆属性识别技术正受到越来越多开发人员的关注,例如,识别车辆的颜色、车辆类型、品牌型号等属性。
在一种车辆属性识别方法中,开发人员为样本车辆图像设置车辆属性标签,然后采用基于神经网络的深度学习算法,训练出多个用于识别不同车辆属性的车辆属性识别模型,比如分别训练出车辆颜色识别模型、车辆类型识别模型以及车辆品牌型号识别模型等等。后续进行车辆属性识别时,将车辆图像输入各个车辆属性识别模型后即可得到相应的车辆属性信息。
然而,采用上述方法识别车辆属性时,对于品牌型号这类复杂的车辆属性,仅使用单一车辆属性识别模型进行识别,识别的准确率较低。
发明内容
本申请提供一种车辆品牌型号识别方法及装置,可以提高识别车辆品牌型号的准确率。
本申请提供的技术方案如下:
本申请提供一种车辆品牌型号识别方法,所述方法包括:
获取待识别的车辆图像;
将所述车辆图像输入训练好的深度学习网络模型中,得到所述车辆图像的车辆部位,所述深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到;
针对每个车辆部位,将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中,得到该车辆部位对应的车辆图像的车辆品牌型号,所述Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。
本申请还提供一种车辆品牌型号识别装置,所述装置包括:
获取模块,用于获取待识别的车辆图像;
第一识别模块,用于将所述车辆图像输入训练好的深度学习网络模型中,得到所述车辆图像的车辆部位,所述深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到;
第二识别模块,用于针对每个车辆部位,将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中,得到该车辆部位对应的车辆图像的车辆品牌型号,所述Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。
由以上技术方案可以看出,在本申请中,先通过训练好的深度学习网络模型,识别待识别的车辆图像的车辆部位;之后,利用针对不同的车辆部位训练好的Resnet50残差网络模型,进一步识别针对不同的车辆部位的车辆图像的车辆品牌型号。可见,这种识别方式,可以提高图像特征的提取精度,降低了相似车型之间的误识别率,进而提高了识别车辆品牌型号的准确率。
附图说明
图1为本申请实施例提供的一种车辆品牌型号识别方法的流程示意图;
图2为本申请实施例提供的利用初始深度学习网络模型对样本车辆图像进行处理的流程示意图;
图3为本申请实施例提供的利用初始Resnet50残差网络模型对车辆部位的样本车辆图像进行处理的流程示意图;
图4为本申请实施例提供的车辆品牌型号识别装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种车辆品牌型号识别方法,如图1所示,该方法可以包括以下步骤:
S11、获取待识别的车辆图像。
S12、将车辆图像输入训练好的深度学习网络模型中,得到车辆图像的车辆部位,其中,深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到。
S13、针对每个车辆部位,将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中,得到该车辆部位对应的车辆图像的车辆品牌型号,其中,Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。
需要说明的是,在本申请实施例中,对于车辆品牌型号这类复杂的车辆属性,在获取到待识别的车辆图像之后,增加了一个识别车辆图像代表的哪个车辆部位的识别环节,即,通过训练好的深度学习网络模型,识别待识别的车辆图像的车辆部位;并且,针对不同的车辆部位的车辆图像训练不同的识别车辆品牌型号的模型,以提高图像特征的提取精度,降低相似车型之间的误识别率,进而提高了识别车辆品牌型号的准确率。
具体地,在本申请实施例中,车辆部位可以是正车脸、侧车脸、车门、正车尾或者侧车尾,后续会依据不同的车辆部位的车辆图像分别训练针对不同的车辆部位的Resnet50残差网络模型。
优选地,在上述步骤S12中,可以通过以下方式训练深度学习网络模型:
将标记有真实车辆部位的样本车辆图像输入初始深度学习网络模型,得到样本车辆图像的预测车辆部位;
根据预测车辆部位与真实车辆部位的之间的差异,调整初始深度学习网络模型的参数,直到收敛,得到训练好的深度学习网络模型;
其中,初始深度学习网络模型包括第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层和第六卷积层;
第一卷积层,用于对输入的经过预处理的标记有真实车辆部位的样本车辆图像进行卷积操作,输出第一样本车辆特征图像;
第二卷积层,用于对第一卷积层输出的第一样本车辆特征图像进行卷积操作,输出第二样本车辆特征图像;
第三卷积层,用于对第一卷积层输出的第一样本车辆特征图像进行卷积操作,输出第三样本车辆特征图像;
第四卷积层,用于对第二卷积层输出的第二样本车辆特征图像与第三卷积层输出第三样本车辆特征图像进行叠加后,再进行卷积操作,输出第四样本车辆特征图像;
第五卷积层,用于对第二卷积层输出的第二样本车辆特征图像进行卷积操作,输出第五样本车辆特征图像;
第六卷积层,用于对第四卷积层输出的第四样本车辆特征图像与第五卷积层输出的第五样本车辆特征图像进行叠加后,再进行卷积操作,输出样本车辆图像的预测车辆部位。
在具体训练时,各卷积层的卷积核(kernel)大小、步长(seride)大小以及填充(padding)大小如下:第一卷积层的卷积核大小为3*3,步长大小为1,填充大小为1;
第二卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
第三卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
第四卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
第五卷积层的卷积核大小为3*3,步长大小为1,填充大小为0;
第六卷积层的卷积核大小为1*1,步长大小为1,填充大小为0。
例如,如图2所示,假设输入第一卷积层N张大小为7*7*4096的样本车辆图像,按照以上卷积层进行卷积处理之后,得到2*2的矩阵,此矩阵的具体组合方式代表一种车辆部位,可以事先设定,例如,0100代表车门等。
优选地,在上述步骤S13中,可以通过以下方式训练针对该车辆部位的Resnet50残差网络模型:
将标记有真实车辆品牌型号的针对该车辆部位的样本车辆图像输入初始Resnet50残差网络模型,得到针对该车辆部位的样本车辆图像的预测车辆品牌型号;
根据预测车辆品牌型号与真实车辆品牌型号的之间的差异,调整初始Resnet50残差网络模型的参数,直到收敛,得到训练好的Resnet50残差网络模型;
其中,初始Resnet50残差网络模型依次包括第一残差块(Resnet50_Conv1)、最大池化层(Maxpool2d)、第二残差块(Resnet50_Conv2)、第三残差块(Resnet50_Conv3)、第四残差块(Resnet50_Conv3)、第五残差块(Resnet50_Conv5)、二元自适应均值汇聚层(AdaptiveAvgPool2d)、Reshape层、Dropput层和全连接层(Fully Connected layers,FC);
每个残差块均包括卷积层、归一化层和激活层,且均用于对输入该残差块的图像进行特征提取;
最大池化层,用于对第一残差块输出的样本车辆特征图像进行卷积操作;
二元自适应均值汇聚层,用于对第五残差块输出的样本车辆特征图像进行处理,输出指定大小的样本车辆特征图像;
Reshape层,用于对二元自适应均值汇聚层输出的指定大小的样本车辆特征图像的维度进行更改,输出一维向量;
Dropput层,用于按照预设丢弃概率,对初始Resnet50残差网络模型中的神经元进行丢弃;
全连接层,用于将输入的一维向量映射为指定一维向量,得到预测车辆品牌型号。
在具体训练时,第一残差块包括的卷积层的卷积核大小为7*7,步长大小为2,填充大小为3;
最大池化层的卷积核大小为3*3,步长大小为2,填充大小为1;
第二残差块包括的卷积层的卷积核大小为1*1,步长大小为1,填充大小为0;
第三残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
第四残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
第五残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1。
在训练过程中,对于每个残差块所包括的卷积层、归一化层和激活层的具体处理过程均以及二元自适应均值汇聚层的具体处理过程均为现有技术,在此不再赘述。
例如,如图3所示,假设输入第一残差块N张经过预处理的大小为7*7*2048的针对车门的样本车辆图像,经过上述一系列处理之后,得到代表品牌型号的一维向量,车辆品牌型号可达3000多种。
需要说明的是,在实际应用时,本申请可以与现有的车辆颜色识别模型和车辆类型识别模型一起使用,最终输出包括车辆颜色、车辆类型和车辆品牌型号的车辆属性。
基于同一发明构思,本申请还提供了一种车辆品牌型号识别装置,如图4所示,该装置包括:
获取模块41,用于获取待识别的车辆图像;
第一识别模块42,用于将所述车辆图像输入训练好的深度学习网络模型中,得到所述车辆图像的车辆部位,所述深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到;
第二识别模块43,用于针对每个车辆部位,将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中,得到该车辆部位对应的车辆图像的车辆品牌型号,所述Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。
优选地,该装置还包括:
第一训练模块(图4中未示出),用于通过以下方式训练深度学习网络模型:
将标记有真实车辆部位的样本车辆图像输入初始深度学习网络模型,得到所述样本车辆图像的预测车辆部位;
根据所述预测车辆部位与所述真实车辆部位的之间的差异,调整所述初始深度学习网络模型的参数,直到收敛,得到训练好的深度学习网络模型;
其中,所述初始深度学习网络模型包括第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层和第六卷积层;
所述第一卷积层,用于对输入的经过预处理的标记有真实车辆部位的样本车辆图像进行卷积操作,输出第一样本车辆特征图像;
所述第二卷积层,用于对所述第一卷积层输出的第一样本车辆特征图像进行卷积操作,输出第二样本车辆特征图像;
所述第三卷积层,用于对所述第一卷积层输出的第一样本车辆特征图像进行卷积操作,输出第三样本车辆特征图像;
所述第四卷积层,用于对所述第二卷积层输出的第二样本车辆特征图像与所述第三卷积层输出第三样本车辆特征图像进行叠加后,再进行卷积操作,输出第四样本车辆特征图像;
所述第五卷积层,用于对所述第二卷积层输出的第二样本车辆特征图像进行卷积操作,输出第五样本车辆特征图像;
所述第六卷积层,用于对所述第四卷积层输出的第四样本车辆特征图像与所述第五卷积层输出的第五样本车辆特征图像进行叠加后,再进行卷积操作,输出所述样本车辆图像的预测车辆部位。
优选地,所述第一卷积层的卷积核大小为3*3,步长大小为1,填充大小为1;
所述第二卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第三卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第四卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第五卷积层的卷积核大小为3*3,步长大小为1,填充大小为0;
所述第六卷积层的卷积核大小为1*1,步长大小为1,填充大小为0。
优选地,该装置还包括:
第二训练模块(图4中未示出),用于通过以下方式训练针对该车辆部位的Resnet50残差网络模型:
将标记有真实车辆品牌型号的针对该车辆部位的样本车辆图像输入初始Resnet50残差网络模型,得到所述针对该车辆部位的样本车辆图像的预测车辆品牌型号;
根据所述预测车辆品牌型号与所述真实车辆品牌型号的之间的差异,调整所述初始Resnet50残差网络模型的参数,直到收敛,得到训练好的Resnet50残差网络模型;
其中,所述初始Resnet50残差网络模型依次包括第一残差块、最大池化层、第二残差块、第三残差块、第四残差块、第五残差块、二元自适应均值汇聚层、Reshape层、Dropput层和全连接层;
每个残差块均包括卷积层、归一化层和激活层,且均用于对输入该残差块的图像进行特征提取;
所述最大池化层,用于对所述第一残差块输出的样本车辆特征图像进行卷积操作;
所述二元自适应均值汇聚层,用于对所述第五残差块输出的样本车辆特征图像进行处理,输出指定大小的样本车辆特征图像;
所述Reshape层,用于对所述二元自适应均值汇聚层输出的指定大小的样本车辆特征图像的维度进行更改,输出一维向量;
所述Dropput层,用于按照预设丢弃概率,对所述初始Resnet50残差网络模型中的神经元进行丢弃;
所述全连接层,用于将输入的所述一维向量映射为指定一维向量,得到预测车辆品牌型号。
优选地,所述第一残差块包括的卷积层的卷积核大小为7*7,步长大小为2,填充大小为3;
所述最大池化层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第二残差块包括的卷积层的卷积核大小为1*1,步长大小为1,填充大小为0;
所述第三残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第四残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第五残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1。
由以上技术方案可以看出,在本申请中,先通过训练好的深度学习网络模型,识别待识别的车辆图像的车辆部位;之后,利用针对不同的车辆部位训练好的Resnet50残差网络模型,进一步识别针对不同的车辆部位的车辆图像的车辆品牌型号。可见,这种识别方式,可以提高图像特征的提取精度,降低了相似车型之间的误识别率,进而提高了识别车辆品牌型号的准确率。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种车辆品牌型号识别方法,其特征在于,所述方法包括:
获取待识别的车辆图像;
将所述车辆图像输入训练好的深度学习网络模型中,得到所述车辆图像的车辆部位,所述深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到;
针对每个车辆部位,将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中,得到该车辆部位对应的车辆图像的车辆品牌型号,所述Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。
2.根据权利要求1所述的方法,其特征在于,通过以下方式训练深度学习网络模型:
将标记有真实车辆部位的样本车辆图像输入初始深度学习网络模型,得到所述样本车辆图像的预测车辆部位;
根据所述预测车辆部位与所述真实车辆部位的之间的差异,调整所述初始深度学习网络模型的参数,直到收敛,得到训练好的深度学习网络模型;
其中,所述初始深度学习网络模型包括第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层和第六卷积层;
所述第一卷积层,用于对输入的经过预处理的标记有真实车辆部位的样本车辆图像进行卷积操作,输出第一样本车辆特征图像;
所述第二卷积层,用于对所述第一卷积层输出的第一样本车辆特征图像进行卷积操作,输出第二样本车辆特征图像;
所述第三卷积层,用于对所述第一卷积层输出的第一样本车辆特征图像进行卷积操作,输出第三样本车辆特征图像;
所述第四卷积层,用于对所述第二卷积层输出的第二样本车辆特征图像与所述第三卷积层输出第三样本车辆特征图像进行叠加后,再进行卷积操作,输出第四样本车辆特征图像;
所述第五卷积层,用于对所述第二卷积层输出的第二样本车辆特征图像进行卷积操作,输出第五样本车辆特征图像;
所述第六卷积层,用于对所述第四卷积层输出的第四样本车辆特征图像与所述第五卷积层输出的第五样本车辆特征图像进行叠加后,再进行卷积操作,输出所述样本车辆图像的预测车辆部位。
3.根据权利要求2所述的方法,其特征在于,
所述第一卷积层的卷积核大小为3*3,步长大小为1,填充大小为1;
所述第二卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第三卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第四卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第五卷积层的卷积核大小为3*3,步长大小为1,填充大小为0;
所述第六卷积层的卷积核大小为1*1,步长大小为1,填充大小为0。
4.根据权利要求1所述的方法,其特征在于,通过以下方式训练针对该车辆部位的Resnet50残差网络模型:
将标记有真实车辆品牌型号的针对该车辆部位的样本车辆图像输入初始Resnet50残差网络模型,得到所述针对该车辆部位的样本车辆图像的预测车辆品牌型号;
根据所述预测车辆品牌型号与所述真实车辆品牌型号的之间的差异,调整所述初始Resnet50残差网络模型的参数,直到收敛,得到训练好的Resnet50残差网络模型;
其中,所述初始Resnet50残差网络模型依次包括第一残差块、最大池化层、第二残差块、第三残差块、第四残差块、第五残差块、二元自适应均值汇聚层、Reshape层、Dropput层和全连接层;
每个残差块均包括卷积层、归一化层和激活层,且均用于对输入该残差块的图像进行特征提取;
所述最大池化层,用于对所述第一残差块输出的样本车辆特征图像进行卷积操作;
所述二元自适应均值汇聚层,用于对所述第五残差块输出的样本车辆特征图像进行处理,输出指定大小的样本车辆特征图像;
所述Reshape层,用于对所述二元自适应均值汇聚层输出的指定大小的样本车辆特征图像的维度进行更改,输出一维向量;
所述Dropput层,用于按照预设丢弃概率,对所述初始Resnet50残差网络模型中的神经元进行丢弃;
所述全连接层,用于将输入的所述一维向量映射为指定一维向量,得到所述针对该车辆部位的样本车辆图像的预测车辆品牌型号。
5.根据权利要求4所述的方法,其特征在于,
所述第一残差块包括的卷积层的卷积核大小为7*7,步长大小为2,填充大小为3;
所述最大池化层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第二残差块包括的卷积层的卷积核大小为1*1,步长大小为1,填充大小为0;
所述第三残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第四残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第五残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1。
6.一种车辆品牌型号识别装置,其特征在于,所述装置包括:
获取模块,用于获取待识别的车辆图像;
第一识别模块,用于将所述车辆图像输入训练好的深度学习网络模型中,得到所述车辆图像的车辆部位,所述深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到;
第二识别模块,用于针对每个车辆部位,将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中,得到该车辆部位对应的车辆图像的车辆品牌型号,所述Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第一训练模块,用于通过以下方式训练深度学习网络模型:
将标记有真实车辆部位的样本车辆图像输入初始深度学习网络模型,得到所述样本车辆图像的预测车辆部位;
根据所述预测车辆部位与所述真实车辆部位的之间的差异,调整所述初始深度学习网络模型的参数,直到收敛,得到训练好的深度学习网络模型;
其中,所述初始深度学习网络模型包括第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层和第六卷积层;
所述第一卷积层,用于对输入的经过预处理的标记有真实车辆部位的样本车辆图像进行卷积操作,输出第一样本车辆特征图像;
所述第二卷积层,用于对所述第一卷积层输出的第一样本车辆特征图像进行卷积操作,输出第二样本车辆特征图像;
所述第三卷积层,用于对所述第一卷积层输出的第一样本车辆特征图像进行卷积操作,输出第三样本车辆特征图像;
所述第四卷积层,用于对所述第二卷积层输出的第二样本车辆特征图像与所述第三卷积层输出第三样本车辆特征图像进行叠加后,再进行卷积操作,输出第四样本车辆特征图像;
所述第五卷积层,用于对所述第二卷积层输出的第二样本车辆特征图像进行卷积操作,输出第五样本车辆特征图像;
所述第六卷积层,用于对所述第四卷积层输出的第四样本车辆特征图像与所述第五卷积层输出的第五样本车辆特征图像进行叠加后,再进行卷积操作,输出所述样本车辆图像的预测车辆部位。
8.根据权利要求7所述的装置,其特征在于,
所述第一卷积层的卷积核大小为3*3,步长大小为1,填充大小为1;
所述第二卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第三卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第四卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第五卷积层的卷积核大小为3*3,步长大小为1,填充大小为0;
所述第六卷积层的卷积核大小为1*1,步长大小为1,填充大小为0。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二训练模块,用于通过以下方式训练针对该车辆部位的Resnet50残差网络模型:
将标记有真实车辆品牌型号的针对该车辆部位的样本车辆图像输入初始Resnet50残差网络模型,得到所述针对该车辆部位的样本车辆图像的预测车辆品牌型号;
根据所述预测车辆品牌型号与所述真实车辆品牌型号的之间的差异,调整所述初始Resnet50残差网络模型的参数,直到收敛,得到训练好的Resnet50残差网络模型;
其中,所述初始Resnet50残差网络模型依次包括第一残差块、最大池化层、第二残差块、第三残差块、第四残差块、第五残差块、二元自适应均值汇聚层、Reshape层、Dropput层和全连接层;
每个残差块均包括卷积层、归一化层和激活层,且均用于对输入该残差块的图像进行特征提取;
所述最大池化层,用于对所述第一残差块输出的样本车辆特征图像进行卷积操作;
所述二元自适应均值汇聚层,用于对所述第五残差块输出的样本车辆特征图像进行处理,输出指定大小的样本车辆特征图像;
所述Reshape层,用于对所述二元自适应均值汇聚层输出的指定大小的样本车辆特征图像的维度进行更改,输出一维向量;
所述Dropput层,用于按照预设丢弃概率,对所述初始Resnet50残差网络模型中的神经元进行丢弃;
所述全连接层,用于将输入的所述一维向量映射为指定一维向量,得到预测车辆品牌型号。
10.根据权利要求9所述的装置,其特征在于,
所述第一残差块包括的卷积层的卷积核大小为7*7,步长大小为2,填充大小为3;
所述最大池化层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第二残差块包括的卷积层的卷积核大小为1*1,步长大小为1,填充大小为0;
所述第三残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第四残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1;
所述第五残差块包括的卷积层的卷积核大小为3*3,步长大小为2,填充大小为1。
CN202010246688.7A 2020-04-01 2020-04-01 一种车辆品牌型号识别方法及装置 Active CN111695587B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010246688.7A CN111695587B (zh) 2020-04-01 2020-04-01 一种车辆品牌型号识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010246688.7A CN111695587B (zh) 2020-04-01 2020-04-01 一种车辆品牌型号识别方法及装置

Publications (2)

Publication Number Publication Date
CN111695587A true CN111695587A (zh) 2020-09-22
CN111695587B CN111695587B (zh) 2024-04-16

Family

ID=72476318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010246688.7A Active CN111695587B (zh) 2020-04-01 2020-04-01 一种车辆品牌型号识别方法及装置

Country Status (1)

Country Link
CN (1) CN111695587B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688822A (zh) * 2021-09-07 2021-11-23 河南工业大学 一种时序注意力机制场景图像识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108629267B (zh) * 2018-03-01 2021-05-25 南京航空航天大学 一种基于深度残差网络的车型识别方法
CN108549926A (zh) * 2018-03-09 2018-09-18 中山大学 一种用于精细化识别车辆属性的深度神经网络及训练方法
CN110688880A (zh) * 2018-07-06 2020-01-14 山东华软金盾软件股份有限公司 一种基于精简ResNet残差网络的车牌识别方法
CN109145759B (zh) * 2018-07-25 2023-04-18 腾讯科技(深圳)有限公司 车辆属性识别方法、装置、服务器及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688822A (zh) * 2021-09-07 2021-11-23 河南工业大学 一种时序注意力机制场景图像识别方法

Also Published As

Publication number Publication date
CN111695587B (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
CN111062396B (zh) 车牌号码识别方法、装置、电子设备及存储介质
CN111815605B (zh) 基于分步深度学习的轨枕缺陷检测方法及存储介质
CN111598089B (zh) 一种基于深度学习的车牌矫正与识别方法
CN109840523B (zh) 一种基于图像处理的城轨列车车号识别方法
CN111291812B (zh) 属性类别的获取方法及装置、存储介质、电子装置
CN109086765B (zh) 车牌识别方法、装置、介质、服务器和行车记录仪
CN110348448A (zh) 一种基于卷积神经网络的车牌字符识别方法
CN111368648B (zh) 雷达辐射源个体识别方法、装置、电子设备及其存储介质
CN116071817A (zh) 一种汽车座舱用手势识别系统的网络架构及训练方法
CN111091131A (zh) 基于多任务学习的自适应车牌字符识别系统及识别方法
CN111695587A (zh) 一种车辆品牌型号识别方法及装置
CN111523483A (zh) 中餐菜品图像识别方法及装置
CN112052829B (zh) 一种基于深度学习的飞行员行为监控方法
CN114328880A (zh) 一种用于汽车领域的智能问答方法及系统
CN113052071B (zh) 危化品运输车驾驶员分心行为快速检测方法及系统
CN113902753A (zh) 基于双通道和自注意力机制的图像语义分割方法及系统
CN114782936B (zh) 一种基于改进yolov5s网络的行为检测方法
CN116168443B (zh) 一种基于信息差知识蒸馏的遮挡面部情绪识别方法
CN115565146A (zh) 基于自编码器获取鸟瞰图特征的感知模型训练方法及系统
CN109743382B (zh) 车辆的云服务系统及其交互方法
CN114299486B (zh) 嵌入式端实时高效的车牌识别方法、设备及介质
CN112699928B (zh) 基于深度卷积网络的非机动车检测和识别方法
CN118036693A (zh) 一种远程模型训练系统
CN113313079B (zh) 一种车辆属性识别模型的训练方法、系统及相关设备
CN116645727B (zh) 一种基于Openpose模型算法的行为捕捉识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant