CN111695587A

CN111695587A - 一种车辆品牌型号识别方法及装置

Info

Publication number: CN111695587A
Application number: CN202010246688.7A
Authority: CN
Inventors: 程博锋; 唐侃毅
Original assignee: Hangzhou H3C Technologies Co Ltd
Current assignee: Hangzhou H3C Technologies Co Ltd
Priority date: 2020-04-01
Filing date: 2020-04-01
Publication date: 2020-09-22
Anticipated expiration: 2040-04-01
Also published as: CN111695587B

Abstract

本申请提供了一种车辆品牌型号识别方法及装置，该方法包括：获取待识别的车辆图像；将车辆图像输入训练好的深度学习网络模型中，得到车辆图像的车辆部位，该深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到；针对每个车辆部位，将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中，得到该车辆部位对应的车辆图像的车辆品牌型号，该Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。本申请可提高识别车辆品牌型号的准确率。

Description

一种车辆品牌型号识别方法及装置

技术领域

本申请涉及车辆识别领域，特别涉及一种车辆品牌型号识别方法及装置。

背景技术

目前，汽车已成为人们出行的首选交通工具，随着车辆数目的不断增加,车辆属性识别技术正受到越来越多开发人员的关注，例如，识别车辆的颜色、车辆类型、品牌型号等属性。

在一种车辆属性识别方法中，开发人员为样本车辆图像设置车辆属性标签，然后采用基于神经网络的深度学习算法，训练出多个用于识别不同车辆属性的车辆属性识别模型，比如分别训练出车辆颜色识别模型、车辆类型识别模型以及车辆品牌型号识别模型等等。后续进行车辆属性识别时，将车辆图像输入各个车辆属性识别模型后即可得到相应的车辆属性信息。

然而，采用上述方法识别车辆属性时，对于品牌型号这类复杂的车辆属性，仅使用单一车辆属性识别模型进行识别，识别的准确率较低。

发明内容

本申请提供一种车辆品牌型号识别方法及装置，可以提高识别车辆品牌型号的准确率。

本申请提供的技术方案如下：

本申请提供一种车辆品牌型号识别方法，所述方法包括：

获取待识别的车辆图像；

将所述车辆图像输入训练好的深度学习网络模型中，得到所述车辆图像的车辆部位，所述深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到；

针对每个车辆部位，将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中，得到该车辆部位对应的车辆图像的车辆品牌型号，所述Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。

本申请还提供一种车辆品牌型号识别装置，所述装置包括：

获取模块，用于获取待识别的车辆图像；

第一识别模块，用于将所述车辆图像输入训练好的深度学习网络模型中，得到所述车辆图像的车辆部位，所述深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到；

第二识别模块，用于针对每个车辆部位，将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中，得到该车辆部位对应的车辆图像的车辆品牌型号，所述Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。

由以上技术方案可以看出，在本申请中，先通过训练好的深度学习网络模型，识别待识别的车辆图像的车辆部位；之后，利用针对不同的车辆部位训练好的Resnet50残差网络模型，进一步识别针对不同的车辆部位的车辆图像的车辆品牌型号。可见，这种识别方式，可以提高图像特征的提取精度，降低了相似车型之间的误识别率，进而提高了识别车辆品牌型号的准确率。

附图说明

图1为本申请实施例提供的一种车辆品牌型号识别方法的流程示意图；

图2为本申请实施例提供的利用初始深度学习网络模型对样本车辆图像进行处理的流程示意图；

图3为本申请实施例提供的利用初始Resnet50残差网络模型对车辆部位的样本车辆图像进行处理的流程示意图；

图4为本申请实施例提供的车辆品牌型号识别装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种车辆品牌型号识别方法，如图1所示，该方法可以包括以下步骤：

S11、获取待识别的车辆图像。

S12、将车辆图像输入训练好的深度学习网络模型中，得到车辆图像的车辆部位，其中，深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到。

S13、针对每个车辆部位，将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中，得到该车辆部位对应的车辆图像的车辆品牌型号，其中，Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。

需要说明的是，在本申请实施例中，对于车辆品牌型号这类复杂的车辆属性，在获取到待识别的车辆图像之后，增加了一个识别车辆图像代表的哪个车辆部位的识别环节，即，通过训练好的深度学习网络模型，识别待识别的车辆图像的车辆部位；并且，针对不同的车辆部位的车辆图像训练不同的识别车辆品牌型号的模型，以提高图像特征的提取精度，降低相似车型之间的误识别率，进而提高了识别车辆品牌型号的准确率。

具体地，在本申请实施例中，车辆部位可以是正车脸、侧车脸、车门、正车尾或者侧车尾，后续会依据不同的车辆部位的车辆图像分别训练针对不同的车辆部位的Resnet50残差网络模型。

优选地，在上述步骤S12中，可以通过以下方式训练深度学习网络模型：

将标记有真实车辆部位的样本车辆图像输入初始深度学习网络模型，得到样本车辆图像的预测车辆部位；

根据预测车辆部位与真实车辆部位的之间的差异，调整初始深度学习网络模型的参数，直到收敛，得到训练好的深度学习网络模型；

其中，初始深度学习网络模型包括第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层和第六卷积层；

第一卷积层，用于对输入的经过预处理的标记有真实车辆部位的样本车辆图像进行卷积操作，输出第一样本车辆特征图像；

第二卷积层，用于对第一卷积层输出的第一样本车辆特征图像进行卷积操作，输出第二样本车辆特征图像；

第三卷积层，用于对第一卷积层输出的第一样本车辆特征图像进行卷积操作，输出第三样本车辆特征图像；

第四卷积层，用于对第二卷积层输出的第二样本车辆特征图像与第三卷积层输出第三样本车辆特征图像进行叠加后，再进行卷积操作，输出第四样本车辆特征图像；

第五卷积层，用于对第二卷积层输出的第二样本车辆特征图像进行卷积操作，输出第五样本车辆特征图像；

第六卷积层，用于对第四卷积层输出的第四样本车辆特征图像与第五卷积层输出的第五样本车辆特征图像进行叠加后，再进行卷积操作，输出样本车辆图像的预测车辆部位。

在具体训练时，各卷积层的卷积核(kernel)大小、步长(seride)大小以及填充(padding)大小如下：第一卷积层的卷积核大小为3*3，步长大小为1，填充大小为1；

第二卷积层的卷积核大小为3*3，步长大小为2，填充大小为1；

第三卷积层的卷积核大小为3*3，步长大小为2，填充大小为1；

第四卷积层的卷积核大小为3*3，步长大小为2，填充大小为1；

第五卷积层的卷积核大小为3*3，步长大小为1，填充大小为0；

第六卷积层的卷积核大小为1*1，步长大小为1，填充大小为0。

例如，如图2所示，假设输入第一卷积层N张大小为7*7*4096的样本车辆图像，按照以上卷积层进行卷积处理之后，得到2*2的矩阵，此矩阵的具体组合方式代表一种车辆部位，可以事先设定，例如，0100代表车门等。

优选地，在上述步骤S13中，可以通过以下方式训练针对该车辆部位的Resnet50残差网络模型：

将标记有真实车辆品牌型号的针对该车辆部位的样本车辆图像输入初始Resnet50残差网络模型，得到针对该车辆部位的样本车辆图像的预测车辆品牌型号；

根据预测车辆品牌型号与真实车辆品牌型号的之间的差异，调整初始Resnet50残差网络模型的参数，直到收敛，得到训练好的Resnet50残差网络模型；

其中，初始Resnet50残差网络模型依次包括第一残差块(Resnet50_Conv1)、最大池化层(Maxpool2d)、第二残差块(Resnet50_Conv2)、第三残差块(Resnet50_Conv3)、第四残差块(Resnet50_Conv3)、第五残差块(Resnet50_Conv5)、二元自适应均值汇聚层(AdaptiveAvgPool2d)、Reshape层、Dropput层和全连接层(Fully Connected layers，FC)；

每个残差块均包括卷积层、归一化层和激活层，且均用于对输入该残差块的图像进行特征提取；

最大池化层，用于对第一残差块输出的样本车辆特征图像进行卷积操作；

二元自适应均值汇聚层，用于对第五残差块输出的样本车辆特征图像进行处理，输出指定大小的样本车辆特征图像；

Reshape层，用于对二元自适应均值汇聚层输出的指定大小的样本车辆特征图像的维度进行更改，输出一维向量；

Dropput层，用于按照预设丢弃概率，对初始Resnet50残差网络模型中的神经元进行丢弃；

全连接层，用于将输入的一维向量映射为指定一维向量，得到预测车辆品牌型号。

在具体训练时，第一残差块包括的卷积层的卷积核大小为7*7，步长大小为2，填充大小为3；

最大池化层的卷积核大小为3*3，步长大小为2，填充大小为1；

第二残差块包括的卷积层的卷积核大小为1*1，步长大小为1，填充大小为0；

第三残差块包括的卷积层的卷积核大小为3*3，步长大小为2，填充大小为1；

第四残差块包括的卷积层的卷积核大小为3*3，步长大小为2，填充大小为1；

第五残差块包括的卷积层的卷积核大小为3*3，步长大小为2，填充大小为1。

在训练过程中，对于每个残差块所包括的卷积层、归一化层和激活层的具体处理过程均以及二元自适应均值汇聚层的具体处理过程均为现有技术，在此不再赘述。

例如，如图3所示，假设输入第一残差块N张经过预处理的大小为7*7*2048的针对车门的样本车辆图像，经过上述一系列处理之后，得到代表品牌型号的一维向量，车辆品牌型号可达3000多种。

需要说明的是，在实际应用时，本申请可以与现有的车辆颜色识别模型和车辆类型识别模型一起使用，最终输出包括车辆颜色、车辆类型和车辆品牌型号的车辆属性。

基于同一发明构思，本申请还提供了一种车辆品牌型号识别装置，如图4所示，该装置包括：

获取模块41，用于获取待识别的车辆图像；

第一识别模块42，用于将所述车辆图像输入训练好的深度学习网络模型中，得到所述车辆图像的车辆部位，所述深度学习网络模型根据标记有车辆部位的样本车辆图像训练得到；

第二识别模块43，用于针对每个车辆部位，将该车辆部位对应的车辆图像输入针对该车辆部位训练好的Resnet50残差网络模型中，得到该车辆部位对应的车辆图像的车辆品牌型号，所述Resnet50残差网络模型根据标记有品牌型号的针对车辆部位的样本车辆图像训练得到。

优选地，该装置还包括：

第一训练模块(图4中未示出)，用于通过以下方式训练深度学习网络模型：

将标记有真实车辆部位的样本车辆图像输入初始深度学习网络模型，得到所述样本车辆图像的预测车辆部位；

根据所述预测车辆部位与所述真实车辆部位的之间的差异，调整所述初始深度学习网络模型的参数，直到收敛，得到训练好的深度学习网络模型；

其中，所述初始深度学习网络模型包括第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层和第六卷积层；

所述第一卷积层，用于对输入的经过预处理的标记有真实车辆部位的样本车辆图像进行卷积操作，输出第一样本车辆特征图像；

所述第二卷积层，用于对所述第一卷积层输出的第一样本车辆特征图像进行卷积操作，输出第二样本车辆特征图像；

所述第三卷积层，用于对所述第一卷积层输出的第一样本车辆特征图像进行卷积操作，输出第三样本车辆特征图像；

所述第四卷积层，用于对所述第二卷积层输出的第二样本车辆特征图像与所述第三卷积层输出第三样本车辆特征图像进行叠加后，再进行卷积操作，输出第四样本车辆特征图像；

所述第五卷积层，用于对所述第二卷积层输出的第二样本车辆特征图像进行卷积操作，输出第五样本车辆特征图像；

所述第六卷积层，用于对所述第四卷积层输出的第四样本车辆特征图像与所述第五卷积层输出的第五样本车辆特征图像进行叠加后，再进行卷积操作，输出所述样本车辆图像的预测车辆部位。

优选地，所述第一卷积层的卷积核大小为3*3，步长大小为1，填充大小为1；

所述第二卷积层的卷积核大小为3*3，步长大小为2，填充大小为1；

所述第三卷积层的卷积核大小为3*3，步长大小为2，填充大小为1；

所述第四卷积层的卷积核大小为3*3，步长大小为2，填充大小为1；

所述第五卷积层的卷积核大小为3*3，步长大小为1，填充大小为0；

所述第六卷积层的卷积核大小为1*1，步长大小为1，填充大小为0。

优选地，该装置还包括：

第二训练模块(图4中未示出)，用于通过以下方式训练针对该车辆部位的Resnet50残差网络模型：

将标记有真实车辆品牌型号的针对该车辆部位的样本车辆图像输入初始Resnet50残差网络模型，得到所述针对该车辆部位的样本车辆图像的预测车辆品牌型号；

根据所述预测车辆品牌型号与所述真实车辆品牌型号的之间的差异，调整所述初始Resnet50残差网络模型的参数，直到收敛，得到训练好的Resnet50残差网络模型；

其中，所述初始Resnet50残差网络模型依次包括第一残差块、最大池化层、第二残差块、第三残差块、第四残差块、第五残差块、二元自适应均值汇聚层、Reshape层、Dropput层和全连接层；

所述最大池化层，用于对所述第一残差块输出的样本车辆特征图像进行卷积操作；

所述二元自适应均值汇聚层，用于对所述第五残差块输出的样本车辆特征图像进行处理，输出指定大小的样本车辆特征图像；

所述Reshape层，用于对所述二元自适应均值汇聚层输出的指定大小的样本车辆特征图像的维度进行更改，输出一维向量；

所述Dropput层，用于按照预设丢弃概率，对所述初始Resnet50残差网络模型中的神经元进行丢弃；

所述全连接层，用于将输入的所述一维向量映射为指定一维向量，得到预测车辆品牌型号。

优选地，所述第一残差块包括的卷积层的卷积核大小为7*7，步长大小为2，填充大小为3；

所述最大池化层的卷积核大小为3*3，步长大小为2，填充大小为1；

所述第二残差块包括的卷积层的卷积核大小为1*1，步长大小为1，填充大小为0；

所述第三残差块包括的卷积层的卷积核大小为3*3，步长大小为2，填充大小为1；

所述第四残差块包括的卷积层的卷积核大小为3*3，步长大小为2，填充大小为1；

所述第五残差块包括的卷积层的卷积核大小为3*3，步长大小为2，填充大小为1。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

1.一种车辆品牌型号识别方法，其特征在于，所述方法包括：

获取待识别的车辆图像；

2.根据权利要求1所述的方法，其特征在于，通过以下方式训练深度学习网络模型：

3.根据权利要求2所述的方法，其特征在于，

所述第一卷积层的卷积核大小为3*3，步长大小为1，填充大小为1；

4.根据权利要求1所述的方法，其特征在于，通过以下方式训练针对该车辆部位的Resnet50残差网络模型：

所述全连接层，用于将输入的所述一维向量映射为指定一维向量，得到所述针对该车辆部位的样本车辆图像的预测车辆品牌型号。

5.根据权利要求4所述的方法，其特征在于，

所述第一残差块包括的卷积层的卷积核大小为7*7，步长大小为2，填充大小为3；

6.一种车辆品牌型号识别装置，其特征在于，所述装置包括：

获取模块，用于获取待识别的车辆图像；

7.根据权利要求6所述的装置，其特征在于，所述装置还包括：

第一训练模块，用于通过以下方式训练深度学习网络模型：

8.根据权利要求7所述的装置，其特征在于，

9.根据权利要求6所述的装置，其特征在于，所述装置还包括：

第二训练模块，用于通过以下方式训练针对该车辆部位的Resnet50残差网络模型：

10.根据权利要求9所述的装置，其特征在于，