CN111814584A

CN111814584A - 基于多中心度量损失的多视角环境下车辆重识别方法

Info

Publication number: CN111814584A
Application number: CN202010560236.6A
Authority: CN
Inventors: 金�一; 李晨宁; 李璇; 李浥东; 郎丛妍; 冯松鹤
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2020-06-18
Filing date: 2020-06-18
Publication date: 2020-10-23
Anticipated expiration: 2040-06-18
Also published as: CN111814584B

Abstract

本发明提供了一种基于多中心度量损失的多视角环境下车辆重识别方法。该方法包括：获取包含车辆身份标签的车辆样本图像，经过空间变换网络对图像进行仿射变换后，将图像经过深度卷积神经网络进行特征提取，得到图像的特征向量；根据图像的特征向量分别计算出分类任务损失和多中心度量学习损失并相加，得到综合损失的值；根据综合损失的值计算深度卷积神经网络的参数和视角中心向量的梯度，得到训练好的深度卷积神经网络模型；利用训练好的深度卷积神经网络模型对车辆图像进行特征提取和身份识别处理。本发明使用空间变换网络对图像进行仿射变换，采用K‑means聚类的方法的估计视角信息，可以增加车辆视角估计的准确性，提高车辆重识别的准确率。

Description

基于多中心度量损失的多视角环境下车辆重识别方法

技术领域

本发明涉及图像处理技术领域，尤其涉及一种基于多中心度量损失的多视角环境下车辆重识别方法。

背景技术

由于机器学习尤其是深度学习方法在计算机视觉问题上取得巨大的成功，越来越多的基于深度学习的视觉方法应用于智能交通系统上，车辆作为交通系统中的一个重要的目标已经成为计算机视觉和智能交通领域中一个重要的研究对象。车辆重识别问题目的是从由多个摄像头捕捉到的车辆样本图像中检索出全部属于目标车辆的图像，当前的车辆重识别模型大体上可以分为两个组成部分：特征提取器和分类算法。

近年来多数的车辆重识别系统使用常用的深度卷积神经网络直接从车辆的视觉外观提取特征向量。常用的特征提取器有ResNet，DenseNet等或者通过将注意力机制，局部特征提取等技术引入到这些标准的深度卷积神经网络网络中而衍生出来的其他变种。对特征进行分类的算法主要分为两类，基于分类损失函数的算法和基于度量损失函数的算法，基于分类损失函数的算法目的是学习一个不同的类别之间的决策超平面以此区分不同的车辆，基于度量损失函数的算法通过模型学习出两张图片的相似度，具体表现为同一车辆的不同图像的相似度大于不同车辆的不同图片。最后度量学习的损失函数使得相同车辆的图像(正样本对)的距离尽可能小，不同车辆样本图像(负样本对)的距离尽可能大。实验表明，将基于分类损失函数和基于度量损失函数以一定的比例结合起来会取得更好的识别结果，因此，近年来多数的车辆重识别模型均采用将两种损失函数结合起来作为模型的损失函数。

但是车辆重识别通常采用的是从视频监控中取得的图像，而监控之间的视野往往互不重叠，因此车辆样本图像往往是从不同的角度观察到的，而车辆的视觉外观往往在不同的视角的下有着很大的差异和形变，因此导致车辆重识别问题有着极大的类内差异性。同时当不同的车辆具有相同的车型和颜色时从视觉外观上往往难以区分，因此，车辆重识别问题的同有着极大的类间相似性。因此，在视角的变化导致的车辆重识别有着极大的类内差异性和极大的类间相似性的问题背景下，找到通过将视角信息引入度量方法中以判断多视角下的车辆样本图像是否属于同一车辆是本发明需要解决的主要问题。

现有技术中的一种车辆重识别方案的模型框架示意图如图1所示，该方案通过诸如聚类等方法估计视角信息，在每一次迭代中，对输入的图像进行特征提取得到特征向量，然后对每一个车辆的所有特征向量进行聚类，预先定义的聚类的数目为视角的数目，根据聚类的类别结果，将特征分配到不同的视角组上，之后分别针对相同的视角内和视角间使用度量损失函数。

上述现有技术中的一种车辆重识别方案的缺点为：

1.在对图像进行预处理时，没有对图像进行自适应性的仿射变换，从道路监控中获取的图像往往有比较大的旋转和形变，因此直接将原始图像输入到网络中进行特征提取会影响视角信息的建模和识别准确率。

2.直接获取标注好的视角或者关键点标签会增加极大的数据标注成本。而在每一个视角内部对不同的车辆进行分类，需要得到十分准确的视觉信息，这不适用于通过聚类估计得到的视角信息。使用估计的视角标签时，需要多次进行聚类估计会增加训练的时间。

3.交叉熵损失函数可以有效地提高准确率，但没有考虑样本之间的距离，仍有一定的缺陷。并且因此每一次迭代特征都会发生变化，因此每一次迭代都需要重新的聚类，这影响着算法训练的效率。

发明内容

本发明的实施例提供了一种基于多中心度量损失的多视角环境下车辆重识别方法，以克服现有技术的问题。

为了实现上述目的，本发明采取了如下技术方案。

一种基于多中心度量损失的多视角环境下车辆重识别方法，包括：

获取包含车辆身份标签的车辆样本图像，对所述车辆样本图像进行预处理，得到预处理后的图像；将经过预处理的图像经过空间变换网络对图像进行仿射变换；

将经过仿射变换后的图像经过深度卷积神经网络进行特征提取，得到图像的特征向量；

根据所述图像的特征向量分别计算分类任务损失和多中心度量学习损失，将所述分类任务损失和多中心度量学习损失相加得到综合损失的值；

根据所述综合损失的值计算所述深度卷积神经网络的参数和视角中心向量的梯度，根据所述视角中心向量的梯度更新所述深度卷积神经网络中的参数和视角中心向量；当所述深度卷积神经网络收敛后，得到训练好的深度卷积神经网络模型；

利用所述训练好的深度卷积神经网络模型对不同车辆的图像进行特征提取和身份识别处理。

优选地，所述的获取包含车辆身份标签的车辆样本图像，对所述车辆样本图像进行预处理，得到预处理后的图像，包括：

从车辆数据集中读取包含车辆身份标签的车辆样本图像，将车辆样本图像大小调整为(225×225)；根据预设的翻转概率、裁剪和擦除比例对所述车辆样本图像进行随机翻转、随机裁剪和随机擦除，并对擦除的部分添加上高斯白噪声，之后将车辆样本图像中每一个通道的全部像素值减去该通道预设的平均值，并除以预设的方差进行均值方差归一化；

将归一化后的图像送入空间变换网络，根据公式1进行仿射变换；

空间变换网络中的参数预测网络使用四个卷积层提取特征并通过全局平均池化操作得到32维的特征向量，通过一个全连接层得到六个仿射变换所需的参数，得到预处理后的图像。

优选地，所述的将经过仿射变换后的图像经过深度卷积神经网络进行特征提取，得到图像的特征向量，包括：

将经过仿射变换后的图像I_i输入到ResNet-50深度卷积神经网络中，在ResNet-50深度卷积神经网络的最后一个卷积层之后得到图像的特征映射，如公式2所示；

M_i＝a_n(..(a₁(I_i·W¹)·W²)·Wⁿ) (2)

将得到的特征映射M_i根据公式3进行全局最大池化操作得到2048维的图像的特征向量f_i；

。

优选地，所述的根据所述图像的特征向量分别计算分类任务损失和多中心度量学习损失，将所述分类任务损失和多中心度量学习损失相加得到综合损失的值，包括：

步骤3-1：计算分类任务损失

将所述特征向量f_i输入到单层全联接神经网络中，并根据公式4进行Softmax激活得到类别预测概率；

将车辆身份标签y_i转换为one-hot向量，将预测的概率与车辆身份标签一起送入交叉熵损失函数，根据公式5计算交叉熵损失的值L_{cross-entropy}，将所述交叉熵损失的值L_{cross-entropy}作为分类任务损失；

步骤3-2：计算多中心度量学习损失

多中心度量学习损失的框架由视角中心初始化模块、视角信息建模模块和多中心度量损失函数模块三个部分组成。该模块输入经过特征提取器得到特征向量，并通过视角信息的建模得到视角标签，之后将视角标签，特征向量和车辆身份标签一起输入到多中心度量损失函数中用以训练类内的视角中心向量和卷积神经网络的参数。

1.初始化

在第一个训练迭代中，第一次使用多中心度量损失时对每个车辆的所有视角中心向量进行初始化，在进行初始化时提取每一个车辆的所有的图像的特征，之后对分别对每一个车辆的全部特征进行K-means聚类得到视角预测的结果，对属于同一个的聚类中心的全部特征向量的平均值作为该视角的特征向量的初始化值。

2.视角信息建模

对于每一个输入的特征向量，根据车辆的身份标签找到该车辆内全部视角中心，并计算该车辆的中心和该特征向量之间的距离，以距离该特征向量最近的视角中心的视角标签作为该车辆的视角标签，并将视角标签和特征向量送入多中心度量损失函数模块；

3.多中心度量损失函数

根据车辆的特征向量f_i和车辆身份车辆身份标签y_i在该车辆内部找到距离最近的视角中心依此分配视角标签v_i，如公式6所示；

根据视角标签v_i和公式7在车辆内部计算类内跨视角度量损失的值，

该函数目的在于使特征向量满足

其中，d(·)是两个向量之间的平方欧几里得距离，f是特征向量，y_i是车辆的身份标签，v_i是视角建模模块分配的视角标签，

是该车辆的视角中心向量，m_c是不同视角之间的间隙；

计算一个训练批次内的特征向量之间的距离，并根据车辆身份车辆身份标签y_i找到距离最大的同一车辆样本图像对和距离最小的不同车辆样本图像对，并根据公式8计算类间度量损失的值；

该函数目的在于使特征向量满足

其中，

是同一车辆内部距离最大的特征向量对，

是不同车辆之间距离最小的向量对，m_t是不同车辆之间的间隙；

根据公式9计算视角中心限制损失的值：

该函数目的在于使中心向量满足d(c_j，c_k)≥m_t，

将上述三个部分按照一定的权重相加得到多中心度量学习损失的值；

L_MCRL＝λ_LICRL+μL_CRL+ηL_constraint (10)

步骤3-3：将所述分类任务损失和多中心度量学习损失相加得到综合损失的值L_total：

L_total＝L_{cross-entropy}+L_MCRL (11)。

优选地，所述的根据所述综合损失的值计算所述深度卷积神经网络的参数和视角中心向量的梯度，根据所述视角中心向量的梯度更新所述深度卷积神经网络中的参数和视角中心向量；当所述深度卷积神经网络收敛后，得到训练好的深度卷积神经网络模型，包括：

利用PyTorch框架的自动求导机制，根据所述综合损失的值L_total计算神经网络中参数和视角中心向量的梯度；

根据所述梯度利用Adam优化算法更新神经网络中的参数和视角中心向量；

当判断深度卷积神经网络已经收敛或者达到预先设置的迭代次数，则停止训练，得到训练好的深度卷积神经网络模型。

优选地，所述的利用所述训练好的深度卷积神经网络模型对不同车辆的图像进行特征提取和身份识别处理，包括：

读取待识别的多个车辆的图像，对图像进行翻转、归一化和空间变换网络的仿射变换后，得到预处理后的图像，使用所述训练好的深度卷积神经网络模型对每一个车辆的图像以及其水平翻转后的车辆图像分别进行特征提取，得到两个特征向量，将两个特征向量相加得到车辆的图像的综合特征向量；

根据每个车辆的图像的综合特征向量，计算每两张车辆的图像之间的欧几里得距离，若欧几里得距离小于给定阈值，则判断该两张车辆的图像相似，属于同一个体；否则，判断该两张车辆的图像不相似，属于不同个体。

优选地，所述的方法还包括：对所述训练好的深度卷积神经网络模型进行测试，具体包括：

读取测试车辆样本图像集中的多个图像，对每个图像进行翻转、归一化和空间变换网络的仿射变换后，得到预处理后的图像，使用所述训练好的深度卷积神经网络模型对每一个图像以及其水平翻转后的图像分别进行特征提取，得到两个特征向量，将两个特征向量相加得到图像的综合特征向量；

根据每个图像的综合特征向量，计算每两张图像之间的欧几里得距离，若欧几里得距离小于给定阈值，则判断该两张车辆的图像相似，属于同一个体；否则，判断该两张图像不相似，属于不同个体；

根据所有相似的车辆样本图像构成相似度矩阵，根据所述相似度矩阵和图像之间的实际相似度情况计算图像身份识别准确率；

若图像身份识别准确率满足预期要求，则保存训练好的深度学习卷积网络模型，否则，修改重识别模型的超参数，对修改后的重识别模型重新进行训练。由上述本发明的实施例提供的技术方案可以看出，本发明首先使用空间变换网络对图像进行仿射变换，以纠正摄像头采集过程中产生的形变，这样可以增加车辆视角估计的准确性以及模型的鲁棒性。本发明采用多中心度量学习方法估计隐含的视角信息，这样可以避免采用视角标签所产生的巨大的数据标注成本，同时能够解决聚类造成的标签数值不稳定的问题，同时更适用于估计得到的相对不准确的视角标签，进而提高车辆重识别的准确率。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为现有技术中的一种车辆重识别方案的模型框架示意图；

图2为本发明实施例提供的一种基于多中心度量损失的多视角环境下车辆重识别方法的整体框架结构图；

图3为本发明实施例提供的一种基于多中心度量损失的多视角环境下车辆重识别方法的处理流程图；

图4为本发明实施例提供的一种预处理模块的结构示意图；

图5为本发明实施例提供的一种空间变换网络中的参数预测网络的框架示意图。

图6为本发明实施例提供的一种多中心度量学习损失计算的框架示意图。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解，下面将结合附图以几个具体实施例为例做进一步的解释说明，且各个实施例并不构成对本发明实施例的限定。

本发明实施例提供了基于多中心度量损失的多视角环境下车辆重识别方法，该方法的整体框架结构如图2所示，多中心度量学习损失的框架由图像预处理模块，特征提取模块，分类任务模块，多中心度量学习模块和测试模块五个部分组成。模型输入一组不同车辆的图像，分别经过预处理和特征提取得到特征向量，训练时分别将特征向量送入分类任务模块和多中心度量学习模块，结合两种损失函数对模型进行训练，测试时使用测试模块计算特征向量之间的距离并依此判断图像是否属于同一车辆。

上述基于多中心度量损失的多视角环境下车辆重识别方法的算法输入包括：

1.车辆样本图像数据：包含训练集与测试集，其中车辆样本图像均需标注车辆身份标签，测试图像还需包含摄像头标签；

2.超参数：车辆的视角数目；类内跨视角度量损失函数的间隙宽度m_c；类间度量损失函数的间隙宽度m_t；视角中心限制函数的距离限制γ,δ；损失函数的权重λ,μ,η；

3.神经网络参数和视角中心向量的学习率；

4.一个训练批次的大小(每个批次p个车辆，每一车辆k张图像)；

5.训练过程迭代的次数；

算法输出：训练好的神经网络结构与权重；

本发明实施例的基于多中心度量损失的多视角环境下车辆重识别方法的处理流程图如图3所示，包括如下的处理步骤：

步骤S1：图像预处理阶段，将车辆样本图像经过数据增强和归一化处理之后，输入到空间变换网络进行自适应的仿射变换，得到预处理后的图像。本发明实施例提供的一种预处理模块的结构如图4所示。

步骤1-1：图像输入到模型中，首先经过预处理模块，从车辆数据集中读取车辆样本图像，将车辆样本图像大小调整为(225×225)；在预处理模块中首先对车辆样本图像进行数据增强操作以增加模型的鲁棒性同时扩充训练数据。

步骤1-2：将车辆样本图像根据预设的概率，裁剪和擦除比例进行随机翻转、随机裁剪和随机擦除，并对擦除的部分添加上高斯白噪声，之后将车辆样本图像中每一个通道的全部像素值减去该通道预设的平均值，并除以预设的方差进行均值方差归一化；

步骤1-3：将归一化后的图像送入空间变换网络，根据所得的参数和公式1进行仿射变换，预测仿射变换的参数，公式1中的变换参数θ通过STN网络学习得到，以纠正摄像头捕捉过程中产生的形变以提高视角预测的准确度和车辆重识别的鲁棒性。

其中，

a,b,c,d,e,f是网络学习到的仿射变换的六个参数。

空间变换网络中的参数预测网络如图5所示，参数预测网络首先使用四个卷积层提取特征并通过全局平均池化操作(GAP)得到32维的特征向量，通过一个全连接层得到六个仿射变换所需的参数。将预处理后的图像输入到特征提取阶段。

步骤S2、特征提取阶段，将经过预处理的图像经过ResNet-50深度卷积神经网络提取特征。

步骤2-1：该阶段可以使用通用的移除原始分类层的卷积神经网络结构例如ResNet-50。将经过预处理的图像I_i输入到ResNet-50深度卷积神经网络中，在ResNet-50深度卷积神经网络的最后一个卷积层之后得到图像的特征映射，如公式2所示；

M_i＝a_n(..(a₁(I_i·W¹)·W²)·Wⁿ) (2)

其中a₁到a_n是ReLU激活函数，w₁到W_n是各个卷积层的卷积核

步骤2-2：将得到的特征映射M_i根据公式3进行全局最大池化操作得到2048维的图像的特征向量f_i；

f_i是第i个样本的特征向量，M_i是第i个样本经由卷积神经网络提取到的特征映射。

在训练阶段，将得到的图像的特征向量f_i分别送入分类任务损失计算阶段和多中心度量学习损失计算阶段。在测试阶段，将特征向量f_i送入测试模块用于图像验证。

步骤S3、损失计算阶段，根据特征向量分别计算分类任务损失和多中心度量学习损失。

步骤3-1：计算分类任务损失

步骤3-1-1：将步骤2-2中图像经卷积神经网络提取到的特征向量f_i输入到单层全联接神经网络中，并根据公式4进行Softmax激活得到类别预测概率；

a_i是第i个类别的激活值，p_i是样本属于第i个类别的概率。

步骤3-1-2：将车辆身份标签y_i转换为one-hot向量，one-hot的基本思想：将离散型特征的每一种取值都看成一种状态，one-hot编码保证了每一个取值只会使得一种状态处于“激活态”，多种状态中只有一个状态位值为1，其他状态位都是0。之后将预测的概率与车辆身份标签一起送入交叉熵损失函数，根据公式5计算交叉熵损失的值，用以学习不同的车辆之间的决策超平面。

p_i是样本属于第i个类别的概率，y_i在样本属于第i个类别时为0，不属于第i个类别时为0。

步骤3-2：计算多中心度量学习损失。

多中心度量学习损失计算的整体框架如图6所示，多中心度量学习损失的框架由视角中心初始化模块、视角信息建模模块和多中心度量损失函数模块三个部分组成。该模块输入经过特征提取器得到特征向量，并通过视角信息的建模得到视角标签，之后将视角标签，特征向量和车辆身份标签一起输入到多中心度量损失函数中用以训练类内的视角中心向量和卷积神经网络的参数。

1.初始化模块

该模块仅在第一次使用多中心度量损失函数时使用。在第一个训练迭代中，第一次使用多中心度量损失时需要对每个车辆的所有视角中心向量进行初始化，在进行初始化时首先提取每一个车辆的所有的图像的特征，之后对分别对每一个车辆的全部特征进行K-means聚类得到视角预测的结果，对属于同一个的聚类中心的全部特征向量的平均值作为该视角的特征向量的初始化值。

2.视角信息建模模块

对于每一个输入的特征向量，根据车辆的身份标签找到该车辆内全部视角中心，并计算该车辆的中心和该特征向量之间的距离，以距离该特征向量最近的视角中心的视角标签作为该车辆的视角标签，并将视角标签和特征向量送入多中心度量损失函数模块。

3.多中心度量损失函数模块

多中心度量损失函数由类内跨视角度量损失函数，类间度量损失函数和视角中心向量限制函数三部分组成。

首先根据步骤2-2中得到的特征向量f_i和车辆身份车辆身份标签y_i在该车辆内部找到距离最近的视角中心依此分配视角标签v_i，如公式6所示；

类内跨视角度量损失函数(公式7)目的在于在一个车辆内部区分不同的视角，根据视角标签v_i和公式7在车辆内部计算类内跨视角度量损失的值。该函数使特征到根据视角信息建模模块为其分配的视角中心向量的距离小于其他中心的距离，即

其中，f是特征向量，y_i是车辆的身份标签，v_i是视角建模模块分配的视角标签，

是该车辆的视角中心向量，m_c是不同视角之间的间隙。

类间度量损失函数(公式8)采用了三元组损失的形式，计算一个训练批次内的特征向量之间的距离，并根据车辆身份车辆身份标签y_i找到距离最大的同一车辆样本图像对和距离最小的不同车辆样本图像对，并根据公式8计算类间度量损失的值。该函数的目的在于区分不同的车辆，使不同的车辆之间的特征向量之间存在一定的间隙，即

其中，

是同一车辆内部距离最大的特征向量对，

是不同车辆之间距离最小的向量对，m_t是不同车辆之间的间隙。

视角中心向量限制函数(公式9)直接对中心向量之间的距离关系进行限制，根据公式9计算视角中心限制损失的值。在不同车辆之间该函数通过限制不同车辆的视角中心向量之间的距离大于等于类间损失定义的间隙的宽度，即d(c_j，c_k)≥m_t来保证不同车辆之间的区分性。在同一车辆内部该函数通过限制视角中心向量之间的距离保持视角之间有一定的区分性同时又保持车辆内部中心之间的紧致性，即

将上述三个部分按照一定的权重相加就组成多中心度量损失函数(公式10)整个多中心度量学习模块的框架。

L_MCRL＝λL_ICRL+μL_CRL+ηL_constraint (10)

其中，B是一个训练批次内的样本数目，f是特征向量，d(·)是两个向量之间的平方欧几里得距离，y_i是车辆的身份标签，v_i是视角建模模块分配的视角标签，

是该车辆的视角中心向量，m_c是不同视角之间的间隙，m_t是不同车辆之间的间隙，γ和δ是视角中心的距离限制，λ,μ和η是损失函数的权重。

多中心度量学习损失是在车辆的内部处理视角问题，这样视角仅在车辆内部出现而且在训练的过程中，并不需要语义意义上的视角(例如车头，车侧，车尾等)并且聚类导致的视角标签不稳定的问题也就得到了解决。

步骤3-3：计算综合损失的值，如公式11；

L_total＝L_{cross-entropy}+L_MCRL (11)

步骤S4、模型优化阶段，根据损失函数计算梯度并对深度卷积神经网络模型进行优化。

步骤4-1：利用PyTorch框架的自动求导机制，根据步骤3-3中得到的综合损失的值计算神经网络中参数和视角中心向量的梯度；

步骤4-2：根据步骤4-1中得到的视角中心向量的梯度，利用Adam优化算法更新神经网络中的参数和视角中心向量；

步骤4-3：若模型已经收敛或者达到预先设置的迭代次数则停止训练，得到训练好的深度卷积神经网络模型，执行步骤S5，否则返回执行阶段步骤S1；判断模型收敛的条件是模型的损失和测试的结果趋于稳定。

步骤S5、测试评估阶段，对训练完成的深度卷积神经网络模型进行测试，并根据测试结果调整超参数。

步骤5-1：读取测试车辆样本图像集，对图像进行归一化和空间变换网络的仿射变换后，使用上述训练好的深度卷积神经网络模型对每一个车辆样本图像以及其水平翻转后的车辆样本图像分别进行特征提取，得到两个特征向量，将两个特征向量相加得到车辆样本图像的综合特征向量。

步骤5-2：根据5-1中的每个车辆样本图像的综合特征向量，计算每两张车辆样本图像之间的欧几里得距离，该距离表示图像的相似度，若相似度小于给定阈值则认为两张车辆样本图像相似，属于同一个体，否则属于不同个体。根据所有相似的车辆样本图像构成相似度矩阵。

步骤5-3：根据步骤5-2得到的相似度矩阵计算识别准确率和平均查准率；

步骤5-4：若识别结果满足预期要求，则保存深度卷积神经网络模型与权重，否则修改超参数，重新从阶段一执行训练过程；

之后，就可以保存的深度卷积神经网络对车辆样本图像进行特征提取，并进行后续的车辆样本图像的相似度判断。

综上所述，本发明首先使用空间变换网络对图像进行仿射变换，以纠正摄像头采集过程中产生的形变，这样可以增加车辆视角估计的准确性以及模型的鲁棒性。本发明采用多视角度量学习的估计视角信息，这样可以避免采用视角标签所产生的巨大的数据标注成本。相比于在视角内处理不同的车辆的方法本发明所提出的方法，由于是在车辆内部处理视角问题，不同车辆之间的视角编号可以不同，因此能够解决聚类造成的标签数值不稳定的问题，同时更适用于估计得到的相对不准确的视角标签。多中心度量学习损失结合交叉熵损失也能够更好的建模多视角环境下的车辆外观特征，进而提高车辆重识别的准确率。

本发明实施例解决多视角环境下的车辆重识别问题，提供了一种基于多中心度量学习损失的车辆重识别的深度学习模型，该模型首先使用空间变化网络对图像进行仿射变换以纠正图像在监控视频中发生的形变，然后输入到深度卷积神经网络中提取视觉特征，之后使用多中心损失度量函数建模车辆的视角信息，从而提高网络对多视角环境下的车辆样本图像的特征表示能力和判别能力，提高车辆重识别准确率。本发明实施例提出了将图像经过STN变换后输入到深度网络中并使用类内多中心度量损失函数的方法，从而提高车辆重识别的准确率。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。