CN112257601B

CN112257601B - 基于弱监督学习的数据增强网络的细粒度车辆识别方法

Info

Publication number: CN112257601B
Application number: CN202011142413.5A
Authority: CN
Inventors: 柯逍; 蔡宇航
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2020-10-22
Filing date: 2020-10-22
Publication date: 2023-02-21
Anticipated expiration: 2040-10-22
Also published as: CN112257601A

Abstract

本发明提出基于弱监督学习的数据增强网络的细粒度车辆识别方法，包括以下步骤；步骤S1：把细粒度车型数据集将其输入数据增强网络的主干网络，以获得车辆注意力图并计算部分注意力特征；步骤S2：进行图片数据增强，生成增强图像以扩充训练样本；步骤S3：计算原始图像和增强图像损失以及特征中心损失，以得到网络整体损失函数；步骤S4：过滤背景噪声，生成定位图输入数据增强网络，与原始图像获得的概率求均值得到最终细粒度车型预测结果；步骤S5：构建与颜色、角度、粗粒度车型相关的的多标签向量，将图片输入网络训练获得多标签分类器。输入汽车定位图得到汽车多标签预测结果；本发明能够准确有效地经图像识别来获取图片中的多种车辆信息。

Description

基于弱监督学习的数据增强网络的细粒度车辆识别方法

技术领域

本发明涉及图像识别处理技术领域，尤其是基于弱监督学习的数据增强网络的细粒度车辆识别方法。

背景技术

随着社会现代化发展，生产力稳步提升，汽车已然成为了最普遍的代步工具之一。

但是汽车拥有量的逐年升高带来了交通的拥堵、车辆管理等方面的许多难题。针对上述问题，快速识别车辆信息的智能算法提供了一种辅助解决手段。近年来细粒度图像分类算法快速发展，由于类内差异大，类间差异小，细粒度车辆识别往往需要大量数据标注信息。如何利用较少的标注信息完成大量相似车型类别的准确识别也成为了当前的一个研究热点，基于弱监督学习的算法的出现，减少了对额外人工标注信息的依赖性。

弱监督学习下的细粒度车型识别的目标是希望在仅使用类别标注信息而不使用额外标注信息的前提下，通过网络挖掘区分不同车型的判别性信息。同时多标签分类可以获得车辆多样化的信息。但车辆图像的采集质量受限于应用场景中摄像机的像素、拍摄时间、拍摄角度、天气等诸多因素，故实际应用场景中对车辆信息的识别算法的性能要求更加严格。

发明内容

本发明提出基于弱监督学习的数据增强网络的细粒度车辆识别方法，能够准确有效地经图像识别来获取图片中的多种车辆信息。

本发明采用以下技术方案。

基于弱监督学习的数据增强网络的细粒度车辆识别方法，可对细粒度的车辆信息进行识别，所述识别方法包括以下步骤；

步骤S1：获取需进行识别的细粒度车型数据集，将其输入数据增强网络的主干网络，以获得车辆注意力图并计算部分注意力特征；

步骤S2：进行注意力引导下的车辆图片数据增强，生成增强图像以扩充训练样本；

步骤S3：计算原始图像和增强图像损失以及特征中心损失，以得到网络整体损失函数；

步骤S4：定位车辆以过滤背景噪声，生成车辆定位图输入数据增强网络，与原始图像获得的概率求均值得到最终细粒度车型预测结果。

步骤S5：构建与颜色、角度、粗粒度车型相关的的多标签向量，将图片输入网络训练获得多标签分类器。输入汽车定位图得到汽车多标签预测结果。

所述步骤S1包括以下步骤；

步骤S11：采用公开的细粒度车型分类数据集，进行标签提取完成数据预处理；

步骤S12：把完成数据预处理的数据集输入基于GoogleNet的InceptionV3网络结构的主干网络；

步骤S13：主干网络用以对车辆图片提取特征图F，注意力机制通过卷积函数对特征图进行降维，从而生成若干个注意力图A_k，所述注意力图关注于车辆图片的不同区域；设令f(·)表示卷积函数，则对于主干网络提取的特征图F，注意力图的获取方式可以表示为

其中m为生成注意力图的数量；

步骤S14：为了得到输入图像的局部细节特征，对降维得到的注意力图A_k与特征图F按元素相乘后输入全局平均池化GAP中对结果进行池化操作，从而降维生成各个部分的注意力特征f_k，所述各个部分的注意力特征能帮助网络对目标对象类别进行判别，具体计算方式如下

其中g(·)表示全局平均池化函数GAP，⊙表示矩阵按元素相乘。

所述步骤S2包括以下步骤；

步骤S21：对生成的若干张注意力图进行选择，采用随机选择一张注意力图A_k来指导车辆图片数据增强过程的选择方式，以使得任一张注意力图都有概率指导之后的增强过程，也就是说注意力机制生成的目标对象的各个部分影响增强过程的概率是相同的，增加了网络的鲁棒性；

对随机选择的注意力图进行标准化，计算过程如下

其中A_k表示随机选中的注意力图；

步骤S22：在训练阶段，通过注意力图引导数据增强过程来节约标注成本，从而扩充细粒度数据集的训练样本以提高模型准确率；将所采用的注意力图中像素点值大小与设定的阈值大小进行比较以构造裁切掩码，具体计算方式如下：

其中C_k表示裁切掩码，θ_c表示阈值，在0.4和0.6之间随机生成。

将所采用的注意力图中像素点值大小与设定的阈值大小进行比较以构造丢弃掩码，具体计算方式如下：

其中D_k表示丢弃掩码，θ_d表示阈值，在0.2到0.5之间随机生成；

步骤S23：将输入的测试图像分别与裁切掩码和丢弃掩码相乘，以分别生成注意力裁切后的图像和注意力丢弃后的图像，将原始图像和两种注意力不同引导下生成的数据增强图像共同输入数据增强网络进行训练。

所述步骤S3包括以下步骤；

步骤S31：通过损失函数计算原始图像的训练损失和注意力裁切后的图像以及注意力丢弃后的图像的训练损失，所述损失函数采用交叉熵损失；

步骤S32：为了加强同一分类类别的注意力图所表示的目标对象的部分的相似度，引入特征中心损失作为惩罚项；计算加强同一分类类别相似度的中心特征损失，计算方式如下：

其中f_k表示部分注意力特征，c_k表示部分特征中心；加强同一分类类别相似度的中心特征损失的计算结果呈现部分特征f_k更加接近部分特征中心c_k的特点，以使得整个注意力学习过程基于弱监督的形式进行；

步骤S33：迭代更新部分特征中心c_k，使部分特征中心c_k以预设的方式进行更新,在网络首次迭代时将c_k的值设置为0；此步骤中更新的过程与每次网络学习得到的部分特征f_k相关以进行反馈；计算方式如下：

c_k+β(f_k-c_k)→c_k 公式七；

其中β为超参数，其作用是控制部分特征中心c_k的更新的速率；

步骤S34：计算包含四个部分的网络整体损失函数，并更新梯度以进行下一轮训练；整体损失函数计算方式如下：

其中loss₁、loss₂、loss₃分别为网络输入原始图像、注意力裁切后的图像、注意力丢弃后的图像得到输出的交叉熵损失，L_A为特征中心正则化项。

所述步骤S4包括以下步骤；

步骤S41：通过同一分类类别注意力图生成对象图A_M，计算同一分类类别注意力图的均值，计算方式如下：

其中A_k为注意力图；

步骤S42：通过对象图预测边界框，以在没有标注信息的情况下，获得目标对象在输入图像中的位置，生成车辆定位图；使强化网络模型观察输入图像中的目标对象的细致度，同时在观察中过滤掉无关的背景信息，以提高网络模型的性能；

步骤S43：将车辆定位图输入网络获得细粒度预测概率，并将原始图像输入网络中获得粗粒度预测概率；

步骤S44：把细粒度预测概率、粗粒度预测概率相加求均值，获得最终细粒度车型预测概率，计算方式如下：

p＝(p₁+p₂)/2 公式十；

其中p₁为细粒度预测概率，p₂为粗粒度预测概率。

所述步骤S5包括以下步骤；

步骤S51：使用细粒度车型数据集构建车辆图片的多标签向量；所述多标签向量与车型的颜色、角度、粗粒度车型相关；

步骤S52：将车辆图片输入基于InceptionV3网络结构的主干网络，获得多标签预测向量；

步骤S53：分段计算颜色、角度、粗粒度车型的交叉熵损失，并计算网络整体损失函数，训练多标签分类器。网络整体损失函数计算方式如下：

loss＝loss_color+loss_viewpoint+2loss_type 公式十一；

其中loss_color表示车辆颜色的交叉熵损失，loss_viewpoint表示车辆角度的交叉熵损失，loss_type表示粗粒度车型的交叉熵损失；

步骤S54：将车辆定位图输入训练好的多标签分类器获得多标签预测向量，分段解析即得到车辆颜色、角度、粗粒度车型的预测结果。

与现有技术相比，本发明有以下有益效果：

1、本发明构建的基于弱监督学习下的数据增强网络的细粒度车辆识别方法能够准确有效地对车辆的细粒度车型、颜色、角度、粗粒度车型等多种信息进行提取识别。

2、本发明仅使用类别标注，无需诸如标注框在内的一系列额外人工标注。

3、针对车辆细粒度车型标注成本高导致的细粒度数据集规模往往较小等问题，本发明提出了一种基于弱监督学习下数据增强网络的方法，通过注意力机制生成注意力图引导数据增强以扩充汽车图片训练数据样本。

4、针对一张车辆图片包含多种信息同时也包含一定背景噪声等问题，本发明提出了采用训练多标签分类器，并利用基于弱监督学习下生成的车辆定位图输入多标签分类器进行信息提取和识别。

附图说明

下面结合附图和具体实施方式对本发明进一步详细的说明：

附图1是本发明的原理示意图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图所示，基于弱监督学习的数据增强网络的细粒度车辆识别方法，可对细粒度的车辆信息进行识别，所述识别方法包括以下步骤；