CN111461061A

CN111461061A - 一种基于相机风格适应的行人重识别方法

Info

Publication number: CN111461061A
Application number: CN202010325367.6A
Authority: CN
Inventors: 熊才权; 张童; 常思远
Original assignee: Hubei University of Technology
Current assignee: Hubei University of Technology
Priority date: 2020-04-23
Filing date: 2020-04-23
Publication date: 2020-07-28

Abstract

本发明提出了一种基于相机风格适应的行人重识别方法。分别构建原行人图像训练集、测试集，将原行人图像训练集通过生成对抗网络得到风格转换后的行人图像训练集；风格转换后的训练集与原训练集通过批处理得到批次样本，进一步构建训练集；对批次样本中每幅图像依次进行预处理；构建待训练的残差网络，将预处理后批次样本输入至残差网络，提取图像特征向量，构建损失模型，使用梯度下降优化训练；通过训练好的残差网络预测得到感兴趣行人图像的特征向量、测试集中行人图像的特征向量，进行距离度量并在测试集中行人图像匹配与感兴趣行人图像属同一行人的图像集合。本发明减少了图像的相机风格差异，增加了训练样本，提升了特征提取的性能。

Description

一种基于相机风格适应的行人重识别方法

技术领域

本发明属于计算机视觉领域，具体涉及一种基于相机风格适应的行人重识别方法。

背景技术

行人重识别通常被认为是一个图像检索的问题，是利用计算机视觉技术在图像或视频中检索特定行人的技术，即给定一个感兴趣的行人图像，在多个摄像机收集的图库中找出同一个人。行人重识别是许多监控和安防应用中的主要任务。由于人体姿态，背景，环境光照，遮挡以及摄像头的差异性等诸多因素，这给行人重识别研究带来巨大的困难，因此学习到更有效的特征成为了行人重识别的研究热点。

传统的行人重识别方法是利用手工设计图像特征，然而手工特征描述能力有限，难以适应复杂场景下的任务。近年来随着深度学习算法在行人重识别领域的应用，行人重识别的准确率得到极大的提升。与传统方法不同，深度学习可以自动较好的提取图像特征，但是深度学习往往需要大量标注好的行人图像，尽管目前已经发布了一些较大的行人重识别训练集，但是相对其他领域，训练集的大小任然远远不够。

发明内容

本发明的目的是：针对数据缺乏和提取行人特征存在信息缺失导致鲁棒性不足的问题，提出了一种基于相机风格适应的行人重识别方法。该方法改进了CamStyle的行人重识别网络，在ResNet后额外增加了一个批量归一化层。在一组摄像头收集的图像样本中，每个摄像头收集的图像样本都可以通过CamStyle网络转换成其他摄像头风格的图像。在Market1501数据集中，图像的收集是由6个不同位置的摄像头完成的，1个摄像头拍摄的图像通过CamStyle网络可以被转换为其他5个摄像头的风格，转换后的图像使用其原图像的标签，真实的图像和转换风格后的图像组合成新的训练集。

本发明所采用的技术方案是：一种基于相机风格适应的行人重识别方法，其特征在于，包括以下步骤：

步骤1：分别构建原行人图像训练集、测试集，将原行人图像训练集通过生成对抗网络的生成器得到风格转换后的行人图像训练集；

步骤2：将风格转换后的行人图像训练集与原行人图像训练集通过批处理得到批次样本，进一步构建训练集；

步骤3：将批次样本中每幅图像依次通过随机擦除、水平翻转，得到预处理后批次样本；

步骤4：构建待训练的残差网络，将预处理后批次样本输入至残差网络，提取图像特征向量，构建行人的正样本以及负样本，通过三元组损失模型、中心损失模型、身份分类损失模型构建残差网络损失模型，进一步使用梯度下降法优化训练，得到训练后残差网络；

步骤5：重复执行步骤3至步骤4，直至达到iter即最大参数迭代更新次数，则完成一代训练；

步骤6：重复执行步骤2至步骤5共epoch次，即共训练epoch代，得到训练好的残差网络。

步骤7：将感兴趣行人图像通过训练好的残差网络预测得到感兴趣行人图像的特征向量，将测试集中行人图像依次通过训练好的残差网络预测得到测试集中行人图像的特征向量，将感兴趣行人图像的特征向量与测试集中行人图像的特征向量进行距离度量，在测试集中行人图像匹配与感兴趣行人图像属同一行人的图像集合；

作为优选，步骤1所述原行人图像训练集为：

I_before＝{p₁，p₂，...，p_A}

a∈[1，A]

其中，I_before为原行人图像训练集，A为训练集中行人的数量，p_a为第a个行人图像训练集，p_a，i为第a个行人图像训练集中第i幅图像，n_a为第a个行人图像训练集中图像的数量，i∈[1，n_a]；

步骤1所述测试集为：

其中，G为测试集中行人图像的数量，

为测试集中第g幅行人图像，g∈[1，G]；

步骤1所述风格转换后的行人图像训练集为：

a∈[1，A]

其中，I_S为转换后图像训练集，

为第a个转换后行人图像训练集，

为转换后第a个行人图像训练集中第i幅图像，

为转换后第a个行人图像训练集中图像的数量，

作为优选，步骤2所述通过批处理构建训练集为：

在A个行人中随机选择P个行人，在随机选择的每个行人中在其行人图像训练集中随机选择M幅图像，在其风格转换后的行人图像训练集中随机选择N幅图像，令K＝M+N，K为第i个批次样本中每个行人所有图像的数量；

P*K为第j个批次样本中图像的数量，将其定义为S，即S＝P*K，并将第j个批次样本中图像训练集定义为data_j；

所述训练集为：

train＝{data₁，data₂，...，data_iter}

data_j＝{data_j，1，data_j，2，...，data_j，s}

j∈[1，iter]

其中，data_j为第j个批次样本，train为步骤1所述训练集，data_j，q为第j个批次样本中第q幅图像，q∈[1，S]，iter为批次的数量即最大参数迭代更新次数，S为每个批次样本中图像的数量；

H_j，l＝{data_{j，(l-1)*K+1}，...，data_j，l*K}，l∈[1，P]

1≤(l-1)*K+1＜l*K≤S

其中，H_j，l为第j个批次样本中第l个行人所有图像，l∈[1，P]，K为第j个批次样本中第l个行人所有图像的数量，且K＝M+N，P为第i个批次样本中行人的数量；

作为优选，步骤3所述批次样本中每幅图像为：

data_j，q，即第j个批次样本中第q幅图像，j∈[1，iter]，q∈[1，S]，iter为批次的数量即最大参数迭代更新次数，S为每个批次样本中图像的数量；

步骤3所述随机擦除为：

在data_j，q上随机选择一个矩形块定义为I_e，将矩形块内的像素值随机化；

具体过程为：

所述矩形块的选择过程为：

data_j，q的面积是S_data＝W×H，I_e的面积是

W为data_j，q的长，H为data_j，q的宽，W_e为的I_e长，H_e为I_e的宽；

设定

为擦除矩形块的长宽比，r_e在(r₁，r₂)范围内随机初始化；

在data_j，q上随机选择一个初始点P＝(x_e，y_e)，x_e∈[1，W]，y_e∈[1，H]；

并在

取值范围内随机初始化W_e，H_e；

若满足约束条件：

x_e+W_e≤W

y_e+H_e≤H

则擦除矩形块I_e左上角坐标为(x_e，y_e)，右下角坐标为(x_e+W_e，y_e+H_e)；

否则继续随机选择初始点P直至满足约束条件；

矩形块选取完成后并使用随机值替代I_e范围内的像素值，随机值的范围为[0，255]；

随机擦除后图像为：

步骤3所述水平翻转为：

以P的概率水平翻转随机擦除后的图像

得到图像

步骤3所述预处理后批次样本为：

其中，

为第j个预处理后批次样本，

为第j个预处理后批次样本中第q幅图像，j∈[1，iter]，q∈[1，S]，iter为批次的数量即最大参数迭代更新次数，S为第j个预处理后批次样本中图像的数量；

预处理后批次样本中行人所有图像为：

l∈[1，P]

1≤(l-1)*K+1＜l*K≤S

其中，H_j，l为第j个预处理后批次样本中第l个行人所有图像，K为第j个预处理后批次样本中第l个行人所有图像的数量，P为第j个预处理后批次样本中行人的数量，S＝P*K；

作为优选，步骤4所述构建待训练的残差网络为：

所述残差网络为ResNet50残差网络；

所述ResNet50残差网络由多层卷积层、多层池化层以及全连接层构成；

将所述全连接层的输出维度设置为A，A即为训练集中行人的数量；

在所述ResNet50残差网络中，最后一个平均池化层和全连接层之间添加批量归一化层；

ResNet50残差网络中待学习优化的卷积核参数参数为：

其中，

为第i个卷积层的参数，i∈[1，n]，n为卷积层的个数。

为第i个卷积层的第c个卷积核的参数，c∈[1，i_m]，i_m为第i个卷积层的卷积核数量；

ResNet50残差网络中待学习优化的全连接层参数为：W^F，W^F为列向量；

所述批量归一化层为：

μ＝E(X)，σ²＝D(X)

X为批量归一化层的输入，即通过最后一个平均池化层得到行人身份特征向量，Y为批量归一化层的输出，γ和β为批量归一化层的参数，ε为防止分母为0的微小正数，E(X)为平均值，D(X)为方差；

步骤4所述将预处理后批次样本输入至残差网络，提取行人身份特征向量为：

将步骤3预处理后批次样本

输入到待训练的残差网络中，通过最后一个平均池化层得到行人身份特征向量为：

f_j＝{f_j，1，f_j，2，...，f_j，s}

其中，f_j，q(q∈[1，S])为第j个预处理后批次样本中第q幅图像的特征向量，j∈[1，iter]，q∈[1，S]，iter为批次的数量即最大参数迭代更新次数，S为第j个预处理后批次样本中图像的数量；

并得到

依次属于A个行人中每个行人的概率，A为训练集中行人的数量；

步骤4所述构建行人的正样本以及负样本为：

在

中，

为第j个预处理后批次样本，

为第j个预处理后批次样本中第q幅图像，j∈[1，iter]，q∈[1，S]，iter为批次的数量即最大参数迭代更新次数，S为每个预处理后批次样本中图像的数量；

依次将第j个预处理后批次样本中每幅图像即

作为锚样本；

计算锚样本与第j个预处理后批次样本中每幅图像的欧氏距离为：

其中，

为锚样本与第e个图像的欧氏距离，e∈[1，S]，G(f_j，q，f_j，e)为计算欧氏距离函数，f_j，q为锚样本的特征向量，f_j，e为第e个图像的特征向量；

作为锚样本时，根据步骤2中定义H_j，l＝{data_{j，(l-1)*K+1}，...，data_j，l*K}，H_j，l为第j个批次样本中第l个行人所有图像，可以根据(l-1)*K+1≤q≤l*K，计算出l的取值，得出

属于第l个行人的图像，K为第j个预处理后批次样本中第l个行人所有图像的数量；

并定义

为锚样本与其所属第l行人的所有图像的欧氏距离；

在同一行人H_j，l中根据同一行人距离集合D_j，l选择与锚样本距离最大的作为正样本，不同行人即data_j中除了H_j，l的其他行人，

中根据不同行人距离集合即D_j中除了D_j，l的其他距离集合，

选择与锚样本距离最小的作为负样本；

步骤4所述构建三元组损失模型为：

其中，

为第j个批次的三元组损失模型，

为第j个批次第q张图像的三元组损失模型，

为计算欧氏距离函数，

分别为第j个批次第q张图像的锚样本的特征向量，正样本的特征向量、负样本的特征向量，α为三元组损失的边距，[X]₊等同于max(0，X)，即0、X两数之间的最大值。

三元组损失函数可以使模型得到的相同行人的特征向量距离更近，不同行人的特征向量距离更远；

步骤4所述构建中心损失模型为：

为了降低三元组损失函数只考虑样本对间的相对距离，没考虑正样本对间的绝对距离的缺陷，在训练阶段加入了中心损失函数，中心损失函数如下所示：

c_j＝{c_j，1，...，c_j，A}

其中，f_j，e为批次data_j中第e张图片的特征向量，可以根据(l-1)*K+1≤e≤l*K，计算出l的取值，得出f_j，e是属于第l个行人的特征向量，

为计算欧氏距离函数，S为第j批次样本中图像的数量，

为第j个批次时所有行人特征中心的集合，

的值为随机初始化得到，l为data_j中第e张图片的标签，l∈[1，A]，根据(l-1)*K+1≤e≤l*K，可以计算出l的取值，得出该图像的标签即该图像属于第l个行人，c_j，l为第j个批次中第l个行人的特征中心，H_j，l中所有图像共享同一个特征中心c_j，l，α为人工设置的权值，K＝M+N；

步骤4所述构建身份分类损失模型为：

对于有标签的训练样本，IDE是一种有效的训练方法，可以利用ID损失函数将训练过程转化为一个分类问题；

全连接层之后得到的特征向量为：

其中，A为训练集中行人的数量，将z_j，q通过softmax函数进行运算，得到第j个批次中第q张图像属于A个行人中身份为第a个行人的预测概率：

将预测概率p与其对应的标签进行交叉熵运算；

身份为第a个行人的损失函数如下所示：

其中，S为第j个批次样本中图像的数量，A为训练集中行人的数量。

步骤4所述构建残差网络损失模型为：

步骤4所述使用梯度下降法优化训练为：

根据损失函数使用梯度下降进行训练，将通过第j个批次样本训练得到的卷积核参数W_j ^K′，以及通过第j个批次样本训练得到的全连接层参数W_j ^F′；

将W_j ^K′替代第j-1个批次样本训练得到的卷积核参数

将W_j ^F′替代第j-1个批次样本训练得到的全连接层参数

若j＝1，表示待训练的残差网络为第一次参数更新，j-1表示残差网络初始化的参数。

作为优选，步骤7所述感兴趣行人图像为人工选择的行人图像；

步骤7所述预测得到感兴趣行人图像的特征向量为：

将感兴趣行人图像输入到训练好的残差网络，通过最后一个平均池化层的输出得到感兴趣行人图像的特征向量

步骤7所述测试集中行人图像的构建方法为：

步骤7所述预测得到测试集中行人图像的特征向量为：

将测试集中每幅行人图像也输入到训练好的残差网络，得到特征向量为：

其中，G为测试集中行人图像的数量；

步骤7所述将感兴趣行人图像的特征向量与测试集中行人图像的特征向量进行距离度量为：

依次计算感兴趣行人图像的特征向量

与测试集中每个行人图像的特征向量f^*的欧氏距离：G_p＝{G_p，1，...，G_p，G}；

将欧式距离G_p中每个元素依次与距离阈值比较，若小于距离阈值则判定测试集中对应的行人图像与感兴趣行人图像属于同一行人的图像。

本发明的有益效果是：本发明的基于相机风格适应的行人重识别方法，减少了摄像机的风格差异，同时增加了训练样本数量，减少神经网络的过拟合影响。同时引入批量归一化层，提升了特征提取的性能，同时有效的解决了类内紧凑性和类间可分离性。

附图说明

图1：是风格转换图像样例。

图2：是随即擦除图像样例。

图3：是行人重识别模型图。

图4：是行人重识别流程图。

具体实施方式

为了更好地理解本发明，下面结合实施例进一步阐明本发明的内容，但本发明的内容不仅仅局限于下面的实施例。本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样在本申请所列权利要求书限定范围之内。

不同相机风格的图像被认为是不同的域，用Market1501数据集训练好的CycleGAN可以将一种相机风格的图像转化为另一种相机风格；因为每个风格转换后的图像保留了原始图像的内容，所以新生成的图像与原图像是同一个标签。Market1501分为原行人图像训练集、测试集。

本发明具体实施方式为一种基于相机风格适应的行人重识别方法，其特征在于，包括以下步骤：

步骤1：分别构建原行人图像训练集、测试集，将原行人图像训练集通过生成对抗网络的生成器得到风格转换后的行人图像训练集，如图1所示；

步骤1所述原行人图像训练集为：

I_before＝{p₁，p₂，...，p_A}

a∈[1，A]

其中，I_before为原行人图像训练集，A为训练集中行人的数量A＝751，p_a为第a个行人图像训练集，p_a，i为第a个行人图像训练集中第i幅图像，n_a为第a个行人图像训练集中图像的数量，i∈[1，n_a]；

步骤1所述测试集为：

其中，G为测试集中行人图像的数量G＝19732，

为测试集中第g幅行人图像，g∈[1，G]；

步骤1所述风格转换后的行人图像训练集为：

a∈[1，A]

其中，I_S为转换后图像训练集，

为第a个转换后行人图像训练集，

为转换后第a个行人图像训练集中第i幅图像，

为转换后第a个行人图像训练集中图像的数量，

步骤2所述通过批处理构建训练集为：

在A个行人中随机选择P＝16个行人，在随机选择的每个行人中在其行人图像训练集中随机选择M＝3幅图像，在其风格转换后的行人图像训练集中随机选择N＝1幅图像，K＝M+N＝4；

P*K为第i个批次样本中图像的数量，将其定义为S，即S＝P*K，并将第j个批次样本中图像训练集定义为data_j；

所述训练集为：

train＝{data₁，data₂，...，data_iter}

data_j＝{data_j，1，data_j，2，...，data_j，S}

j∈[1，iter]

其中，data_j为第j个批次样本，train为步骤1所述训练集，data_j，q为第j个批次样本中第q幅图像，q∈[1，S]，iter＝202为批次的数量即最大参数迭代更新次数，S＝64为每个批次样本中图像的数量；

H_j，l＝{data_{j，(l-1)*K+1}，...，data_j，l*K}，l∈[1，P]

1≤(l-1)*K+1＜l*K≤S

其中，H_j，l为第j个批次样本中第l个行人所有图像，l∈[1，P]，K为第j个批次样本中第l个行人所有图像的数量，且K＝M+N，P为第j个批次样本中行人的数量；

步骤3：将批次样本data_j中每幅图像依次通过随机擦除、水平翻转，得到预处理后批次样本；

步骤3所述批次样本中每幅图像为：

data_j，q，即第j个批次样本中第q幅图像，j∈[1，iter|，q∈[1，S]，iter为批次的数量即最大参数迭代更新次数，S为每个批次样本中图像的数量；

步骤3所述随机擦除为：

具体过程为：

所述矩形块的选择过程为：

data_j，q的面积是S_data＝W×H＝128*256，I_e的面积是

设定

为擦除矩形块的长宽比，r_e在(r₁，r₂)范围内随机初始化，r₁＝0.3，r₂＝3.33；

并在

取值范围内随机初始化W_e，H_e；

若满足约束条件：

x_e+W_e≤W

y_e+H_e≤H

否则继续随机选择初始点P直至满足约束条件；

随机擦除后图像为：

部分样例如图2所示。

步骤3所述水平翻转为：

以P＝0.5的概率水平翻转随机擦除后的图像

得到图像

步骤3所述预处理后批次样本为：

其中，

为第j个预处理后批次样本，

预处理后批次样本中行人所有图像为：

l∈[1，P]

1≤(l-1)*K+1＜l*K≤S

步骤4：构建待训练的残差网络，将预处理后批次样本输入至残差网络，提取行人身份特征向量，构建行人的正样本以及负样本，通过三元组损失模型、中心损失模型、身份分类损失模型构建残差网络损失模型，进一步使用梯度下降法优化训练，得到训练后残差网络；

步骤4所述构建待训练的残差网络为：

所述残差网络为ResNet50残差网络；

将所述全连接层的输出维度设置为A＝751，A即为训练集中行人的数量；

在所述ResNet50残差网络中，最后一个平均池化层和全连接层之间添加批量归一化层，网络模型结构如图3所示；

ResNet50残差网络中待学习优化的卷积核参数参数为：

其中，

为第i个卷积层的参数，i∈[1，n]，n＝49为卷积层的个数。

所述批量归一化层为：

μ＝E(X)，σ²＝D(X)

X为批量归一化层的输入，即通过最后一个平均池化层得到行人身份特征向量，Y为批量归一化层的输出，γ和β为批量归一化层的参数，ε＝1×10^-12为防止分母为0的微小正数，E(X)为平均值，D(X)为方差；

将步骤3预处理后批次样本

f_j＝{f_j，1，f_j，2，...，f_j，S}

并得到

步骤4所述构建行人的正样本以及负样本为：

在

中，

为第j个预处理后批次样本，

依次将第j个预处理后批次样本中每幅图像即

作为锚样本；

其中，

并定义

为锚样本与其所属第l行人的所有图像的欧氏距离；

中根据不同行人距离集合即D_j中除了D_j，l的其他距离集合，

选择与锚样本距离最小的作为负样本；

步骤4所述构建三元组损失模型为：

其中，

为第j个批次的三元组损失模型，

为第j个批次第q张图像的三元组损失模型，

为计算欧氏距离函数，

分别为第j个批次第q张图像的锚样本的特征向量，正样本的特征向量、负样本的特征向量，α＝0.3为三元组损失的边距，[X]₊等同于max(0，X)，即0、X两数之间的最大值。

步骤4所述构建中心损失模型为：

c_j＝{c_j，1，...，c_j，A}

为计算欧氏距离函数，S为第j批次样本中图像的数量，

为第j个批次时所有行人特征中心的集合，

的值为随机初始化得到，l为data_j中第e张图片的标签，l∈[1，A]，根据(l-1)*K+1≤e≤l*K，可以计算出l的取值，得出该图像的标签即该图像属于第l个行人，c_j，l为第j个批次中第l个行人的特征中心，H_j，l中所有图像共享同一个特征中心c_j，l，α＝0.1为人工设置的权值，K＝M+N；

步骤4所述构建身份分类损失模型为：

全连接层之后得到的特征向量为：

将预测概率p与其对应的标签进行交叉熵运算；

身份为第a个行人的损失函数如下所示：

步骤4所述构建残差网络损失模型为：

步骤4所述使用梯度下降法优化训练为：

将W_j ^K′替代第j-1个批次样本训练得到的卷积核参数

将W_j ^F′替代第j-1个批次样本训练得到的全连接层参数

步骤5：重复执行步骤3至步骤4，直至达到iter＝202即最大参数迭代更新次数，则完成一代训练；

步骤6：重复执行步骤2至步骤5共epoch＝120次，即共训练120代，得到训练好的残差网络。

步骤7：将感兴趣行人图像通过训练好的残差网络预测得到感兴趣行人图像的特征向量，将测试集中行人图像依次通过训练好的残差网络预测得到测试集中行人图像的特征向量，将感兴趣行人图像的特征向量与测试集中行人图像的特征向量进行距离度量，在测试集中行人图像匹配与感兴趣行人图像属同一行人的图像集合，流程如图4所示；

步骤7所述感兴趣行人图像为人工选择的行人图像；

步骤7所述预测得到感兴趣行人图像的特征向量为：

步骤7所述测试集中行人图像的构建方法为：

步骤7所述预测得到测试集中行人图像的特征向量为：

其中，G为测试集中行人图像的数量；

依次计算感兴趣行人图像的特征向量

本发明方法在Market1501数据集上进行了验证，实验结果表明该方法具有良好的性能。

最后应当说明的是，以上内容仅用以说明本发明的技术方案，而非对本发明保护范围的限制，本领域的普通技术人员对本发明的技术方案进行的简单修改或者等同替换，均不脱离本发明技术方案的实质和范围。

Claims

1.一种基于相机风格适应的行人重识别方法，其特征在于，包括以下步骤：

步骤6：重复执行步骤2至步骤5共epoch次，即共训练epoch代，得到训练好的残差网络；

步骤7：将感兴趣行人图像通过训练好的残差网络预测得到感兴趣行人图像的特征向量，将测试集中行人图像依次通过训练好的残差网络预测得到测试集中行人图像的特征向量，将感兴趣行人图像的特征向量与测试集中行人图像的特征向量进行距离度量，在测试集中行人图像匹配与感兴趣行人图像属同一行人的图像集合。

2.根据权利要求1所述的基于相机风格适应的行人重识别方法，其特征在于：

步骤1所述原行人图像训练集为：

I_before＝{p₁，p₂，...，p_A}

a∈[1，A]

步骤1所述测试集为：

其中，G为测试集中行人图像的数量，

为测试集中第g幅行人图像，g∈[1，G]；

步骤1所述风格转换后的行人图像训练集为：

a∈[1，A]

其中，I_S为转换后图像训练集，

为第a个转换后行人图像训练集，

为转换后第a个行人图像训练集中第i幅图像，

为转换后第a个行人图像训练集中图像的数量，

3.根据权利要求1所述的基于相机风格适应的行人重识别方法，其特征在于：

步骤2所述通过批处理构建训练集为：

在A个行人中随机选择P个行人，在随机选择的每个行人中在其行人图像训练集中随机选择M幅图像，在其风格转换后的行人图像训练集中随机选择N幅图像，令K＝M+N，K为第j个批次样本中每个行人所有图像的数量；

所述训练集为：

train＝{data₁，data₂，...，data_iter}

data_j＝{data_j，1，data_j，2，...，data_j，s}

j∈[1，iter]

H_j，l＝{data_{j，(l-1)*K+1}，...，data_j，l*K}，l∈[1，P]

1≤(l-1)*K+1＜l*K≤S

其中，H_j，l为第j个批次样本中第l个行人所有图像，l∈[1，P]，K为第j个批次样本中第l个行人所有图像的数量，且K＝M+N，P为第i个批次样本中行人的数量。

4.根据权利要求1所述的基于相机风格适应的行人重识别方法，其特征在于：

步骤3所述批次样本中每幅图像为：

步骤3所述随机擦除为：

具体过程为：

所述矩形块的选择过程为：

data_j，q的面积是S_data＝W×H，I_e的面积是

设定

为擦除矩形块的长宽比，r_e在(r₁，r₂)范围内随机初始化；

并在

取值范围内随机初始化W_e，H_e；

若满足约束条件：

x_e+W_e≤W

y_e+H_e≤H

否则继续随机选择初始点P直至满足约束条件；

随机擦除后图像为：

步骤3所述水平翻转为：

以P的概率水平翻转随机擦除后的图像

得到图像

步骤3所述预处理后批次样本为：

其中，

为第j个预处理后批次样本，

预处理后批次样本中行人所有图像为：

l∈[1，P]

1≤(l-1)*K+1＜l*K≤S

其中，H_j，l为第j个预处理后批次样本中第l个行人所有图像，K为第j个预处理后批次样本中第l个行人所有图像的数量，P为第j个预处理后批次样本中行人的数量，S＝P*K。

5.根据权利要求1所述的基于相机风格适应的行人重识别方法，其特征在于：

步骤4所述构建待训练的残差网络为：

所述残差网络为ResNet50残差网络；

ResNet50残差网络中待学习优化的卷积核参数参数为：

其中，W_i ^K为第i个卷积层的参数，i∈[1，n]，n为卷积层的个数；

所述批量归一化层为：

μ＝E(X)，σ²＝D(X)

将步骤3预处理后批次样本

f_j＝{f_j，1，f_j，2，...，f_j，s}

并得到

步骤4所述构建行人的正样本以及负样本为：

在

中，

为第j个预处理后批次样本，

依次将第j个预处理后批次样本中每幅图像即

作为锚样本；

其中，

并定义

为锚样本与其所属第l行人的所有图像的欧氏距离；

中根据不同行人距离集合即D_j中除了D_j，l的其他距离集合，

选择与锚样本距离最小的作为负样本；

步骤4所述构建三元组损失模型为：

其中，

为第j个批次的三元组损失模型，

为第j个批次第q张图像的三元组损失模型，

为计算欧氏距离函数，

分别为第j个批次第q张图像的锚样本的特征向量，正样本的特征向量、负样本的特征向量，α为三元组损失的边距，[X]₊等同于max(0，X)，即0、X两数之间的最大值；

步骤4所述构建中心损失模型为：

c_j＝{c_j，1，...，c_j，A}

为计算欧氏距离函数，S为第j批次样本中图像的数量，

为第j个批次时所有行人特征中心的集合，

步骤4所述构建身份分类损失模型为：

全连接层之后得到的特征向量为：

将预测概率p与其对应的标签进行交叉熵运算；

身份为第a个行人的损失函数如下所示：

其中，S为第j个批次样本中图像的数量，A为训练集中行人的数量；

步骤4所述构建残差网络损失模型为：

步骤4所述使用梯度下降法优化训练为：

将W_j ^K′替代第j-1个批次样本训练得到的卷积核参数

将W_j ^F′替代第j-1个批次样本训练得到的全连接层参数

6.根据权利要求1所述的基于相机风格适应的行人重识别方法，其特征在于：

步骤7所述感兴趣行人图像为人工选择的行人图像；

步骤7所述预测得到感兴趣行人图像的特征向量为：

步骤7所述测试集中行人图像的构建方法为：

步骤7所述预测得到测试集中行人图像的特征向量为：

其中，G为测试集中行人图像的数量；

依次计算感兴趣行人图像的特征向量