CN113033697A

CN113033697A - 一种基于批量归一化层的模型自动评估方法及装置

Info

Publication number: CN113033697A
Application number: CN202110403483.XA
Authority: CN
Inventors: 解皓楠; 罗浩; 姜伟
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2021-04-15
Filing date: 2021-04-15
Publication date: 2021-06-25
Anticipated expiration: 2041-04-15
Also published as: CN113033697B

Abstract

本发明一种基于批量归一化层的模型自动评估方法及装置，首先在第一次训练完成后提取模型第四个模块的批量归一化层参数作为衡量的基准；之后将模型在需要评估的无标签的测试数据集上进行第二次训练，第二次训练过程中非批量归一化层的参数无需更新，不需要梯度反传，只需更新批量归一化层的均值和方差这两个参数；第二次训练完成后，同样提取第二次训练后的模型第四个模块的批量归一化层参数；将第一次训练得到的基准的参数和在新的测试集上第二次训练后提取的参数分别作高斯归一化，再计算两组参数的欧氏距离，将该距离用来评估无标签测试集在原模型上的精度。

Description

一种基于批量归一化层的模型自动评估方法及装置

技术领域

本发明属于计算机视觉领域，尤其涉及一种基于批量归一化层的模型自动评估方法及装置。

背景技术

目标重识别包括行人重识别和车辆重识别，旨在一系列跨摄像头的监控视频中，检索到用户指定的行人或车辆，该技术广泛应用于智慧城市，安防监控等领域。

为了解决目标重识别任务，基于深度学习的方法通常需要数据集来对模型进行训练和测试。用于训练模型的称为训练集，用于测试模型准确性的称为测试集。为了计算模型的准确性，通常需要一个由测试样本图像及其真实标签组成的测试集。尽管使用标准的测试用例可以满足此要求，但是在实际应用场景中，测试数据的样本容量非常大，如果由人工标记数据需要消耗大量的人力物力。所以许多实际场景都包含未标记的测试数据，从而使通用的模型评估方法不可行，因此引发了模型自动评估方法的研究。

附图说明

图1是本发明流程示意图。

发明内容

本发明的目的在于针对现有技术的不足，提供一种基于批量归一化层的模型自动评估方法及装置。

本发明的目的是通过以下技术方案来实现的：一种基于批量归一化层的模型自动评估方法，包括以下步骤：

(1)在带标签的第一数据集上训练待评估模型，训练完成后提取待评估模型第四个模块的批量归一化层参数，并做高斯归一化。

(2)利用多个带标签的第二数据集，测试步骤(1)训练好的待评估模型的精度，得到多个第二数据集对应的模型精度。

(3)再次利用步骤(2)的多个第二数据集，分别对步骤(1)训练好的待评估模型进行虚拟训练，其中网络只进行前向传播，无需利用标签计算梯度的反向传播，且虚拟训练过程中非批量归一化层的参数无需更新，只需更新批量归一化层的均值和方差；虚拟训练完成后，保存模型第四个模块的批量归一化层参数，并做高斯归一化。

(4)计算步骤(3)和(1)高斯归一化后参数的欧氏距离。

(5)采用神经网络拟合，多个第二数据集对应的，步骤(4)得到的欧氏距离和步骤(2)得到的模型精度之间的关系。欧氏距离为网络输入，模型精度为网络输出，进行训练。

(6)将用于评估模型的无标签数据集根据步骤(3)对步骤(1)中训练好的待评估模型进行虚拟训练，训练完成后，保存模型第四个模块的批量归一化层参数并做高斯归一化，再与步骤(1)高斯归一化后的参数计算欧氏距离。

(7)将步骤(6)计算的欧氏距离，输入步骤(5)训练好的神经网络，输出为无标签数据集在步骤(1)中训练好的待评估模型上的估计精度。

进一步地，所述待评估模型具体为：以ResNet50为骨干网络；将ResNet50最后一次降采样的步长设置为1；在ResNet50最后一个平均池化层和全连接层之间加入批量归一化层。

进一步地，训练待评估模型的损失函数具体为：用全连接层之后的特征计算交叉熵分类损失L_ID；用最后一个批量归一化层之后的特征计算基于难样本挖掘的三元组损失L_t；最终总的损失函数L＝L_ID+L_t。

进一步地，多个第二数据集由两个初始数据集经过如下变换生成：

(2.1)两个初始数据集都分为训练集和测试集。

(2.2)对两个初始数据集的测试集分别做多次不同的线性变换得到多个新测试集。

(2.3)将一个初始数据集的训练集作为源域，另一个初始数据集的训练集作为目标域，分别训练一个cycleGAN网络和一个SPGAN网络；再将两个初始数据集的测试集分别输入训练好的两个GAN网络，对应生成四个新测试集。

(2.4)对步骤(2.3)中生成的四个新测试集分别做多次不同的线性变换得到多个新测试集。

(2.5)步骤(2.2)、(2.3)和(2.4)生成的新测试集，作为所需的多个第二数据集。

进一步地，所述线性变换由高斯噪声、椒盐噪声、仿射变换、随机擦除等中的一个或多个组成。

进一步地，步骤(3)中虚拟训练的训练次数为5个epoch。

进一步地，步骤(5)中的神经网络为BP神经网络。

进一步地，所述BP神经网络具体为：由两个全连接层构成，隐层有10个节点，输出层有1个节点；隐层和输出层之间加入ReLU激活函数。

进一步地，带标签的数据集均由图像及图像的标签构成。

一种基于批量归一化层的模型自动评估装置，具体为：

数据接收与存储模块：用户通过该模块上传数据集、待评估模型和拟合用的神经网络，并存储。

待评估模型训练模块：用户从数据接收与存储模块调用带标签的第一数据集和待评估模型，在带标签的第一数据集上训练待评估模型，训练完成后提取待评估模型第四个模块的批量归一化层参数，并做高斯归一化。

神经网络拟合模块：首先，从数据接收与存储模块调用带标签的第二数据集，利用多个带标签的第二数据集，测试待评估模型训练模块训练好的待评估模型的精度，得到多个第二数据集对应的模型精度。然后，再次利用多个第二数据集，分别对待评估模型训练模块训练好的待评估模型进行虚拟训练，其中网络只进行前向传播，无需利用标签计算梯度的反向传播，且虚拟训练过程中非批量归一化层的参数无需更新，只需更新批量归一化层的均值和方差；虚拟训练完成后，保存模型第四个模块的批量归一化层参数，并做高斯归一化。接着，计算待评估模型训练模块高斯归一化后参数和虚拟训练后模型对应的高斯归一化后参数的欧氏距离。最后，从数据接收与存储模块调用拟合用的神经网络，采用神经网络拟合欧氏距离和模型精度之间的关系。欧氏距离为网络输入，模型精度为网络输出，进行训练。

模型精度评估模块：从数据接收与存储模块调用无标签数据集，用无标签数据集对待评估模型训练模块训练好的待评估模型进行和神经网络拟合模块中一样的虚拟训练，训练完成后，保存模型第四个模块的批量归一化层参数并做高斯归一化，再与待评估模型训练模块高斯归一化后参数计算欧氏距离；再将计算的欧氏距离，输入神经网络拟合模块训练好的神经网络，输出为无标签数据集在待评估模型训练模块训练好的待评估模型上的估计精度，用户获得输出。

本发明的有益效果是：本发明利用模型之间批量归一化层参数的差异来估计模型精度，可以根据没有标签的测试数据集直接估计模型的准确性，从而判断该测试集适不适合采用这个模型，节省数据标注的人力物力时间等。

具体实施方式

本发明的实施例中，market1501数据集是行人重识别领域最常用的数据集，该数据集共有32668张行人图片，分别属于1501个行人ID，并同时包括了训练集和测试集。DukeMTMC-reID是DukeMTMC数据集的行人重识别子集，包含36411张图像，一共有1404个行人。数据集market1501、DukeMTMC-reID、msmt17同属行人重识别领域，数据集veri776属于车辆重识别领域。

如图1所示，本发明一种基于批量归一化层的模型自动评估方法，具体包括以下步骤：

步骤一、搭建用于训练的神经网络，具体为：

(11)将ResNet50作为骨干网络。

(12)将ResNet50最后一次降采样的步长设置为1。

(13)在ResNet50最后一个平均池化层和全连接层之间加入批量归一化层。

步骤二、在market1501数据集上训练步骤一搭建的神经网络，在第一次训练完成后提取模型第四个模块的批量归一化层参数作为衡量的基准参数，并将第一次训练得到的基准参数做高斯归一化；具体为：

(21)将market1501训练集分为若干个batch，在每一个batch里随机挑选K张图像输入步骤一搭建的神经网络，训练标签为行人的ID。

(22)用全连接层之后的特征计算交叉熵分类损失L_ID。

(23)用最后一个批量归一化层之后的特征计算基于难样本挖掘的三元组损失L_t。

(24)最终总的损失函数L＝L_ID+L_t。

(25)在模型训练完成后，保存模型第四个模块layer4中的批量归一化层参数，并做高斯归一化。

步骤三、生成多个测试集，得到不同测试集对应的模型精度和高斯归一化后的批量归一化层参数，计算第二次训练提取的参数和第一次训练的基准参数高斯归一化后的欧氏距离；具体为：

(31)对market1501和DukeMTMC-reID的测试集做变换，生成多个新测试集，具体为：

(311)对原测试集(market1501和DukeMTMC-reID的测试集)分别做多次不同的线性变换得到多个新测试集，所述线性变换选择高斯噪声、椒盐噪声、仿射变换、随机擦除中的一个或多个。

(312)将DukeMTMC-reID的训练集作为源域，market1501的训练集作为目标域，训练一个cycleGAN循环生成对抗网络和SPGAN网络(similarity preserving GAN)；将原测试集(market1501和DukeMTMC-reID的测试集)分别输入训练好的这两个GAN网络，对应生成四个新测试集。使用GAN的目的是对测试集做非线性变换，以增加测试集的多样性。

(313)分别对(312)中生成的四个新测试集做多次不同的线性变换得到多个新测试集，所述线性变换选择高斯噪声、椒盐噪声、仿射变换、随机擦除中的一个或多个。

(32)利用步骤(31)中生成的多个新测试集(不包含原始测试集)分别测试步骤二中训练好的模型的精度，得到不同新测试集对应的模型精度。

(33)利用步骤(31)中生成的多个新测试集(不包含原始测试集)分别对步骤二中训练好的模型进行虚拟的第二次训练，网络只进行前向传播，无需利用标签计算梯度的反向传播，第二次训练过程中非批量归一化层的参数无需更新，只需更新批量归一化层的均值和方差这两个参数，训练次数为5个epoch。训练完成后，保存模型第四个模块layer4中的批量归一化层参数并做高斯归一化。

(34)计算步骤(33)高斯归一化后的模型批量归一化层参数，与步骤(25)高斯归一化后的模型批量归一化层参数的欧氏距离；该距离用来评估无标签测试集在原模型上的精度。

步骤四、对步骤三中两模型批量归一化层的欧氏距离，和测试集对应的模型精度之间的关系做神经网络回归拟合，具体为：

(41)搭建一个由两个全连接层构成的BP(back propagation)神经网络，隐层有10个节点，输出层有1个节点；隐层和输出层之间加入ReLU激活函数。

(42)将步骤(34)中计算的两模型批量归一化层的欧氏距离作为输入，步骤(32)得到的不同新测试集对应的模型精度作为输出，训练步骤(41)搭建的BP神经网络，拟合欧氏距离和模型精度之间的关系。

步骤五，应用阶段具体为：

(51)将数据集market1501、DukeMTMC-reID、msmt17、veri776中的测试集(需要评估的无标签的测试数据集)，输入步骤二中训练好的模型进行虚拟的第二次训练，网络只进行前向传播，无需利用标签计算梯度的反向传播，只需更新批量归一化层的均值和方差这两个参数，训练次数为5个epoch。训练完成后，保存模型第四个模块layer4中的批量归一化层参数并做高斯归一化，之后与步骤(25)高斯归一化后的模型批量归一化层参数，计算欧氏距离。

(52)将步骤(51)计算的欧氏距离，输入步骤四训练好的BP神经网络，输出为待测无标签测试集在步骤二第一次训练后的模型上的估计精度。

真实的rank-1、mAP和自动评估的rank-1、mAP精度如表1所示。由表1可以看到，模型自动评估的精度与真实精度之间的差异在1％-5％之间，说明本发明的模型自动评估方法可以对测试集的精度做出比较准确的评估。

表1：真实精度和模型自动评估精度对比

测试集	Market1501	DukeMTMC-reID	Msmt17	Veri776
					真实rank-1(％)	93.7	35.6	12.4	31.0
评估rank-1(％)	96.4	33.1	13.8	29.8
					真实mAP(％)	84.5	21.6	4.3	10.9
评估mAP(％)	83.9	17.9	5.0	9.9

本发明一种基于批量归一化层的模型自动评估装置，具体为：

以上所述仅是本发明的优选实施方式，应当指出：对于本领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于批量归一化层的模型自动评估方法，其特征在于，包括以下步骤：

(4)计算步骤(3)和(1)高斯归一化后参数的欧氏距离。

2.如权利要求1所述基于批量归一化层的模型自动评估方法，其特征在于，所述待评估模型具体为：以ResNet50为骨干网络；将ResNet50最后一次降采样的步长设置为1；在ResNet50最后一个平均池化层和全连接层之间加入批量归一化层。

3.如权利要求2所述基于批量归一化层的模型自动评估方法，其特征在于，训练待评估模型的损失函数具体为：用全连接层之后的特征计算交叉熵分类损失L_ID；用最后一个批量归一化层之后的特征计算基于难样本挖掘的三元组损失L_t；最终总的损失函数L＝L_ID+L_t。

4.如权利要求1所述基于批量归一化层的模型自动评估方法，其特征在于，多个第二数据集由两个初始数据集经过如下变换生成：

(2.1)两个初始数据集都分为训练集和测试集。

5.如权利要求4所述基于批量归一化层的模型自动评估方法，其特征在于，所述线性变换由高斯噪声、椒盐噪声、仿射变换、随机擦除等中的一个或多个组成。

6.如权利要求1所述基于批量归一化层的模型自动评估方法，其特征在于，步骤(3)中虚拟训练的训练次数为5个epoch。

7.如权利要求1所述基于批量归一化层的模型自动评估方法，其特征在于，步骤(5)中的神经网络为BP神经网络。

8.如权利要求7所述基于批量归一化层的模型自动评估方法，其特征在于，所述BP神经网络具体为：由两个全连接层构成，隐层有10个节点，输出层有1个节点；隐层和输出层之间加入ReLU激活函数。

9.如权利要求1所述基于批量归一化层的模型自动评估方法，其特征在于，带标签的数据集均由图像及图像的标签构成。

10.一种基于权利要求1-9任一项所述方法的模型自动评估装置，其特征在于，具体为：

待评估模型训练模块：从数据接收与存储模块调用带标签的第一数据集和待评估模型，在带标签的第一数据集上训练待评估模型，训练完成后提取待评估模型第四个模块的批量归一化层参数，并做高斯归一化。