CN113095304B

CN113095304B - 减弱重采样对行人重识别的影响的方法

Info

Publication number: CN113095304B
Application number: CN202110634357.5A
Authority: CN
Inventors: 沈复民; 徐行; 范峻植; 邵杰; 申恒涛
Original assignee: Chengdu Koala Youran Technology Co ltd
Current assignee: Chengdu Koala Youran Technology Co ltd
Priority date: 2021-06-08
Filing date: 2021-06-08
Publication date: 2021-09-03
Anticipated expiration: 2041-06-08
Also published as: CN113095304A

Abstract

本发明提出一种减弱重采样对行人重识别的影响的方法，属于计算机视觉领域。本发明方法包括：对训练数据集进行预处理，并通过重采样策略，计算出每张图片的采样概率；构建特征提取网络，通过该特征提取网络提取出输入的行人的图片的特征表示；计算所述特征提取网络的损失函数，并调节该损失函数中类间损失和类内损失的权重比例，使得所述特征提取网络的损失函数最小；迭代训练行人重识别模型，直至行人重识别模型达到收敛状态。本发明能够通过减弱长尾分布和重采样使行人重识别的特征点在特征空间更加分散而带来的影响。

Description

减弱重采样对行人重识别的影响的方法

技术领域

本发明涉及计算机视觉领域，具体涉及一种减弱重采样对行人重识别的影响的方法。

背景技术

行人重识别作为一种辅助人脸识别的行人识别方法，在行人侧身、背对、脸部有遮挡物等情况下充分发挥出优异的效果，因而行人重识别在学术界和工业界受到了越来越多的人的关注。行人重识别的通用方法是通过使用训练数据集，设计合理的算法使算法收敛并且达到足够好的识别分类效果。但是现有数据集大部分都会存在长尾分布的现象。

长尾分布是指每个类别下的图片数量不相同，并且有可能比例相差会很大。现有的处理长尾分布的方法包含重采样和重权重，重采样就是改变每个人的图片的采样概率，如果属于这个人的图片数量越多，则赋予每张图的采样概率就越低，相反的情况下，对应的采样概率就越高。重权重是在计算最后损失函数的时候给予不同的人不同的权重。

现有的重采样方法就是通过修改每张图片的采样概率，使每个人的采样概是相同的，通过这种方法来减弱长尾分布带来的影响。总体来说，现有的方法具有以下缺陷：

1.当不对长尾分布问题采取任何措施的时候，长尾分布就会表现出对头部（每个类别有充足数量的图片）的行人的识别分类效果很好，而对尾部（每个类别有少量的图片）的行人的识别分类效果较差。如果训练数据集中尾部行人的数量占比很大，那么这个网络的识别分类效果就会很差。

2.当对长尾分布使用重采样策略，就是降低头部行人图片的采样概率，增加尾部行人图片的概率。这样就会带来一个问题，尾部行人图片的采样概率比较高，就会改变特征空间数据的分布，影响模型的鲁棒性。

发明内容

本发明的目的是提供一种减弱重采样对行人重识别的影响的方法，能够通过减弱长尾分布和重采样使行人重识别的特征点在特征空间更加分散而带来的影响。

本发明解决其技术问题，采用的技术方案是：

减弱重采样对行人重识别的影响的方法，包括如下步骤：

步骤1.对训练数据集进行预处理，并通过重采样策略，计算出每张图片的采样概率；

步骤2.构建特征提取网络，通过该特征提取网络提取出输入的行人的图片的特征表示；

步骤3.计算所述特征提取网络的损失函数，并调节该损失函数中类间损失和类内损失的权重比例，使得所述特征提取网络的损失函数最小；

步骤4.迭代训练行人重识别模型，直至行人重识别模型达到收敛状态。

具体的是，步骤1中，所述对训练数据集进行预处理，具体是指：

在通过重采样策略，计算出每张图片的采样概率之前，对训练数据集进行统计，计算出每个行人所对应的图片数量；

通过重采样策略，计算出每张图片的采样概率，并使每个行人的采样概率相同；

然后对图片进行数据增强。

具体的是，步骤1中，所述对图片进行数据增强时，对图片进行左右翻转和/或随机裁剪和/或随机填充策略操作。

具体的是，步骤2中，所述通过该特征提取网络提取出输入的行人的图片的特征表示，具体包括：

使用ResNet-50提取图片的高维特征表示；以及，

使用全连接层将高维特征表示处理为低维特征表示。

具体的是，所述高维特征表示的维度为4096，所述低维特征表示的维度为2048。

具体的是，步骤3中，所述计算所述特征提取网络的损失函数，具体为：

将所述低维特征表示通过Cross Entropy损失函数和Triplet损失函数，计算出所述特征提取网络的损失函数。

具体的是，步骤3中，计算出所述特征提取网络的损失函数后，进行反向传播，并调节该损失函数中类间损失和类内损失的权重比例，使得所述特征提取网络的损失函数最小。

本发明的有益效果是，通过上述减弱重采样对行人重识别的影响的方法，首先使用重采样策略保证了网络能通过使用重采样策略来减弱长尾分布对模型的影响，然后通过调节类内损失函数和类间损失函数的比例，来减弱重采样对行人重识别的影响。当使用重采样策略后，数据在特征空间的分布就会发生改变，特征点就会更加的分散。当我们把类内损失函数的比重提高，网络就会花更多注意力在类内的优化，从而减少了重采样对特征空间的分布的影响，增强了模型的鲁棒性。

附图说明

图1为本发明减弱重采样对行人重识别的影响的方法的流程图；

图2为重采样前特征空间的分布图；

图3为重采样后特征空间的分布图；

图4为发明减弱重采样影响后的特征空间分布图；

图5为本发明实施例中ResNet-50卷积层和全连接训练行人重识别框架结构图。

具体实施方式

下面结合附图及实施例，详细描述本发明的技术方案。

本发明提出了一种减弱重采样对行人重识别的影响的方法，其流程图见图1，其中，该方法包括如下步骤：

步骤1.对训练数据集进行预处理，并通过重采样策略，计算出每张图片的采样概率。

步骤2.构建特征提取网络，通过该特征提取网络提取出输入的行人的图片的特征表示。

步骤3.计算所述特征提取网络的损失函数，并调节该损失函数中类间损失和类内损失的权重比例，使得所述特征提取网络的损失函数最小。

本发明展示了重采样对行人重识别特征空间会产生影响，具体见图2、图3、图4，其中包括三个部分，重采样前特征空间、重采样后特征空间、本发明减弱重采样的影响的特征空间。

在重采样前，特征空间的分类面能很好的区分头部类，但是不能很好的区分尾部类。因为头部类具有足够数量的样本，具有丰富的特征分布，因此头部类能有很好的分类效果。而尾部类由于图片数量较少，不能完全代表该类的特征分布，因此分类效果较差，容易产生误分类的情况。

在重采样后，头部类和尾部类都有了足够量的图片来让模型学习特征分布，因此模型能对头部类和尾部类拥有很好的分类效果。但是重采样会改变原来的特征空间分布，使头部类和尾部类在各自的特征空间更加分散。

使用本发明减弱重采样的影响后，头部类和尾部类被重采样影响而更加分散的影响得到了缓解，头部类和尾部类在其特征空间相对于不使用本发明的情况下特征点会更加聚集，这样让模型拥有了更强的鲁棒性。

实施例

本实施例提供了一种减弱重采样对行人重识别的影响的方法，包括如下步骤：

S1.对训练数据集进行预处理，并通过重采样策略，计算出每张图片的采样概率。

这里，对训练数据集进行预处理，具体是指：

在通过重采样策略，计算出每张图片的采样概率之前，首先需要对训练数据集进行统计，计算出每个行人所对应的图片数量，这里，第i个人拥有的图片数量为

；然后，通过重采样策略，计算出每张图片的采样概率

，并使每个行人的采样概率相同；最后，对图片进行数据增强，其中，对图片进行数据增强时，对图片进行左右翻转和/或随机裁剪和/或随机填充策略操作。

S2.构建特征提取网络，通过该特征提取网络提取出输入的行人的图片的特征表示。

本实施例中，将输入的图片

通过ResNet-50卷积层得到一个4096维的一个特征表示，其中，ResNet-50卷积层和全连接训练行人重识别框架结构图见图5，图5中，行人特征通过一个全连接层得到一个2048维的特征表示

。

S3.计算所述特征提取网络的损失函数，并调节该损失函数中类间损失和类内损失的权重比例，使得所述特征提取网络的损失函数最小。

这里，计算所述特征提取网络的损失函数，具体为：

将低维特征表示通过Cross Entropy损失函数和Triplet损失函数，计算出特征提取网络的损失函数，计算出所述特征提取网络的损失函数后，进行反向传播，并调节该损失函数中类间损失和类内损失的权重比例，使得特征提取网络的损失函数最小。

本实施例中，将步骤S2中得到的2048维特征表示通过Cross Entropy损失函数和Triplet损失函数，计算出损失函数后再进行反向传播。

其中，Cross Entropy损失函数的公式为：

其中，m表示总的行人类别数，

表示当前图片属于第i类的概率，

表示模型预测出当前图片属于第i类的概率。

Triplet损失函数：

对于一个输入三元组（a, p, n）,a表示当前计算图片，p代表与a属于同一类的图片，n代表和a属于不同类别的样本。

类内损失函数为：

其中，d(a,b)表示a和b两张图片的距离，可以是欧式距离，也可以是余弦相似度距离，

表示和a属于同一类别的第i张图片。

类间的损失函数为：

表示和a不属于同一类别的第i张图片。

最终，特征提取网络的损失函数即Triplet损失函数表达式为：

其中，weight表示为调节类内损失和内间损失的权重比例。

S4.迭代训练行人重识别模型，直至行人重识别模型达到收敛状态。

这里，不断的迭代网络训练，直到网络具有较好的特征提取能力，模型对行人图片具有较好的分类识别能力。

本实施例中，训练好的模型在market1501数据集上的测试结果如下表：

从表格中我们可以看出当网络结构使用resnet50的时候比resnet18的时候识别效果要好。同一个网络结构中，使用了重采样策略的效果比未使用重采样策略的效果要好。当使用重采样策略后，通过本方法调整类内损失和类间损失的比重，能找到合适的权重能让重采样的识别效果更好。

因此，本实施例展示了重采样能提升长尾训练数据集带来的影响，并且能让网络的识别效果得到提升，通过本方法的调节类内损失和类间损失的比例，能够改善重采样带来的行人数据分布被改变导致的类中心被影响的问题，能进一步提升模型的识别效果，比单纯的使用重采样策略的效果更好，通过让头部类的特征点更加聚集，增加了模型的鲁棒性。

Claims

1.减弱重采样对行人重识别的影响的方法，其特征在于，包括如下步骤：

步骤2.构建特征提取网络，通过该特征提取网络提取出输入的行人的图片的特征表示，所述通过该特征提取网络提取出输入的行人的图片的特征表示，具体包括：

使用ResNet-50提取图片的高维特征表示；以及，

使用全连接层将高维特征表示处理为低维特征表示；

步骤3.计算所述特征提取网络的损失函数，并调节该损失函数中类间损失和类内损失的权重比例，使得所述特征提取网络的损失函数最小，计算所述特征提取网络的损失函数，具体为：将所述低维特征表示通过Cross Entropy损失函数和Triplet损失函数，计算出所述特征提取网络的损失函数；

2.根据权利要求1所述的减弱重采样对行人重识别的影响的方法，其特征在于，步骤1中，所述对训练数据集进行预处理，具体是指：在通过重采样策略，计算出每张图片的采样概率之前，对训练数据集进行统计，计算出每个行人所对应的图片数量；

然后对图片进行数据增强。

3.根据权利要求2所述的减弱重采样对行人重识别的影响的方法，其特征在于，对图片进行数据增强时，具体包括对图片进行左右翻转和/或随机裁剪和/或随机填充策略操作。

4.根据权利要求1所述的减弱重采样对行人重识别的影响的方法，其特征在于，所述高维特征表示的维度为4096，所述低维特征表示的维度为2048。

5.根据权利要求1所述的减弱重采样对行人重识别的影响的方法，其特征在于，步骤3中，计算出所述特征提取网络的损失函数后，进行反向传播，并调节该损失函数中类间损失和类内损失的权重比例，使得所述特征提取网络的损失函数最小。