WO2022236668A1

WO2022236668A1 - 行人重识别方法、系统、电子装置及存储介质

Info

Publication number: WO2022236668A1
Application number: PCT/CN2021/093029
Authority: WO
Inventors: 裴继红; 倪子阳; 赵阳; 杨烜
Original assignee: 深圳大学
Priority date: 2021-05-11
Filing date: 2021-05-11
Publication date: 2022-11-17

Abstract

本发明公开了一种行人重识别方法、系统、电子装置及存储介质，方法包括：数据准备，数据包括用于特征提取网络的训练数据集和测试数据集，训练数据集和测试数据集具有不同的查询集及候选集，查询集包括查询行人序列，候选集包括候选行人序列；利用训练数据集对特征提取网络进行预训练及微调；利用特征提取网络对测试数据集内的测试数据进行特征提取，并对提取的特征进行维数简约，得到图像特征；对测试数据的图像特征进行相似性度量，得到最匹配的候选行人；输出最匹配的候选行人。本申请能够充分利用序列中所有的图像信息，避免特征融合带来的问题，在行人序列重识别任务中性能取得显著的提升。

Description

行人重识别方法、系统、电子装置及存储介质

技术领域

本发明涉及图像处理技术领域，尤其涉及一种行人重识别方法、系统、电子装置及存储介质。

背景技术

行人重识别是多摄像机智能视频监控中非常重要的一部分，常需要将在某一视场中已经出现过的行人在其他视场中再次识别出来，解决跨摄像机和跨场景下行人的匹配关联问题。行人重识别与摄像机监控设备有着密切的关系，由于监控设备所部署的位置不同，不同摄像机的拍摄环境存在一定差异，如行人目标在不同的摄像机中姿态、角度、光线以及遮挡等因素都会发生不同的变化，这些变化都会对行人重识别结果造成影响。因此，准确和高效是行人重识别领域非常重要的目标。

目前基于单帧图像的行人重识别方法取得了较好的效果，但是单帧图像提供的信息是十分有限的，并且该类方法对行人图像的质量要求较高，如当图像中行人遇到遮挡、光照和姿态变化等情况时，则会对行人重识别造成很大的误差。在实际的监控环境中，难以保证摄像机所拍摄到的行人图像都是清晰且无干扰的图像，因此，基于单帧图像的行人重识别存在一定的局限性。

考虑到以上问题，很多工作开始利用行人的视频序列进行行人重识别方法研究，该类方法以行人视频序列为单位进行重识别，因此，如何充分利用视频序列信息是其中的关键部分，也是目前没有很好解决的问题。相比于基于单帧图像的行人重识别方法，基于视频序列的方法能够通过利用多帧行人图像来获得更多的行人信息，目前大部分方法的主要思想是先利用卷积神经网络(Convolutional Neural Networks,CNN)提取单帧行人图像的特征，然后再通过最大值池化、均值池化、3D卷积、循环神经网络(Recurrent neural networks,RNN)或注意力机制等方法将得到的单帧图像特征进行特征融合，从而获得行人序列特征，并且以此来表征整个行人序列，进行距离度量，最终获得重识别结果。但是，通过特征融合方式得到的行人序列特征容易忽略和丢失序列中部分图像的细节信息，没有充分利用序列中所有的图像信息，这会对重识别结果造成一定的影响。

发明内容

本发明的主要目的在于提供一种行人重识别方法、系统、电子装置及存储介质，能够充分利用序列中所有的图像信息，避免特征融合带来的问题，在行人序列重识别任务中性能取得显著的提升。

为实现上述目的，本发明第一方面提供一种行人重识别方法，包括：数据准备，所述数据包括用于特征提取网络的训练数据集和测试数据集，所述训练数据集和所述测试数据集具有不同的查询集及候选集，所述查询集包括查询行人序列，所述候选集包括候选行人序列；利用所述训练数据集对特征提取网络进行预训练及微调；利用所述特征提取网络对所述测试数据集内的测试数据进行特征提取，并对提取的特征进行维数简约，得到图像特征；对所述测试数据的图像特征进行相似性度量，得到最匹配的候选行人；输出所述最匹配的候选行人。

进一步地，所述利用所述训练数据集对特征提取网络进行预训练及微调，包括：构建特征提取网络，所述特征提取网络为MGN；确定所述特征提取网络的训练参数；对训练数据集进行预处理；将预处理后的训练数据集中的训练数据输入所述特征提取网络，计算损失值，并利用所述损失值进行在所述特征提取网络上进行反向传播，更新所述训练参数，实现所述特征提取网络的预训练及微调。

进一步地，所述对所述测试数据的特征进行相似性度量，得到最匹配的候选行人，包括：将每个测试数据代表的行人序列都根据其所有的图像特征构建出描述对应序列特征空间的概率分布函数；对查询行人序列的图像特征点进行概率估计；度量查询行人序列和候选行人序列的概率分布函数之间的相似性；重复相似性度量的步骤，直至完成所有查询行人序列与候选行人序列的相似性度量；根据相似性大小进行排序并找出与查询行人序列最匹配的候选行人。

进一步地，所述对查询行人序列的图像特征点进行概率估计，包括：将查询行人序列特征中的图像特征样本点输入其构建的RBFNN概率函数估计器进行计算并得出对应的概率估计值；将查询行人序列特征的图像特征样本点输入候选行人序列特征所构建的RBFNN概率函数估计器并得到对应的概率估计值；重复上述步骤，直至完成查询行人序列特征的图像特征样本点在候选集中所有行人序列的概率估计。

进一步地，所述度量查询行人序列和候选行人序列的概率分布函数之间的相似性，包括：将所有查询行人序列特征的图像特征样本点在自身特征分布的概率估计值和在候选行人序列特征分布的概率估计值进行KL散度计算，完成查询行人序列特征与候选集中所有候选行人序列特征构建的概率分布函数相似性度量。

进一步地，所述对训练数据集进行预处理，包括：将所述训练数据集内的训练图像的大小调整至m×n；对所述训练图像进行随机水平翻转、裁剪，完成预处理。

进一步地，所述特征提取网络包括Resnet50框架和三个不同、相互独立的分支，三个不同的分支分别为全局分支、粗粒度分支及细粒度分支，全局分支用于提取全局特征，粗粒度分支用于提取粗粒度局部特征，细粒度分支用于提取细粒度局部特征。

本申请第二方面提供一种行人重识别系统，包括：数据准备模块，用于数据准备，所述数据包括用于特征提取网络的训练数据集和测试数据集，所述训练数据集和所述测试数据集具有不同的查询集及候选集，所述查询集包括查询行人序列，所述候选集包括候选行人序列；网络处理模块，用于利用所述训练数据集对特征提取网络进行预训练及微调；特征提取模块，用于利用所述特征提取网络对所述测试数据集内的测试数据进行特征提取，并对提取的特征进行维数简约，得到图像特征；相似性度量模块，用于对所述测试数据的图像特征进行相似性度量，得到最匹配的候选行人；结果输出模块，用于输出所述最匹配的候选行人。

本申请第三方面提供一种电子装置，包括：存储器、处理器，所述存储器上存储有可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时，实现上述中的任意一项所述的行人重识别方法。

本申请第四方面提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现上述中的任意一项所述的行人重识别方法。

本申请提供的行人重识别方法、系统、电子装置及存储介质，有益效果在于：通过采用序列特征分布之间的相似性度量代替了两个序列特征点之间度量，这样能够充分利用行人序列中每幅图像的信息，同时避免特征融合带来的部分图像细节信息丢失问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的行人重识别方法的流程图；

图2是本发明实施例训练用到的Market1501、DukeMTMC-reID数据集；

图3是本发明实施例微调和测试的用到的本实验室制作的ATR行人序列数据集；

图4是用于图像特征提取的MGN的训练流程图；

图5是MGN的结构示意图；

图6从前至后的三幅图依次为查询序列的特征点分布图、构建的概率分布函数图和特征点的概率分布图；

图7从前至后的三幅图依次为候选序列的特征点分布图、构建的概率分布函数图和特征点的概率分布图；

图8从前至后的三幅图依次为查询序列和候选序列的特征点分布图、构建的查询序列和候选序列概率分布函数的对比图和公共样本点在两个特征空间的概率分布对比图；

图9从前至后的三幅图依次为查询序列概率分布等高线图、候选序列概率分布等高线图和两者的概率分布等高线对比图；

图10是行人序列特征分布相似性度量流程图；

图11是行人序列特征分布相似性度量的框架结构图；

图12是用来实现行人序列概率分布函数构建的RBFNN结构图；

图13是对查询行人序列的图像特征点进行概率估计的流程图；

图14是度量查询行人序列和候选行人序列的概率分布函数之间的相似性的流程图；

图15是本发明的实验结果，其中包括mAP、Rank-1和Rank-5值；

图16是本发明提供的行人重识别方法的系统结构框图；

图17为本发明电子装置的结构示意框图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而非全部实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

针对单帧图像信息的有限性和目前行人序列重识别方法中特征融合带来的部分图像细节信息丢失问题，本发明提出了行人重识别方法。不同于目前的行人序列重识别方法，该方法的主要思想是通过构建行人序列的概率分布函数，并度量行人序列特征分布的相似性来获得重识别的结果。经过特征提取网络获取行人序列中所有的图像特征后，各行人序列都可以获得对应的特征点集合。对于测试样本中的任意一个查询序列和一个候选序列，该方法通过对该序列中的图像特征点集合构建出相应的概率分布函数，该函数描述了行人序列的特征分布情况，用来表征对应的行人序列。

当需要对查询序列和候选序列进行相似性度量时，只需要通过度量这两个行人序列对应的特征分布相似性即可。将查询序列的特征点集作为公共特征点集，分别计算出公共特征点集在查询序列和候选序列特征空间的概率分布情况，并比较这两个概率分布情况的匹配程度，即可完成两个行人序列的特征分布相似性度量，并选择相似性最大的行人序列作为重识别结果。该方法用序列特征分布之间的相似性度量代替了目前行人序列重识别方法中常采用的两个序列特征点之间度量来获得重识别结果，充分利用行人序列中每幅图像的信息，避免了特征融合的带来的问题。

图1展示了本发明实施例提供的行人重识别方法的流程，具体包括S1-S5，其中，

S1:数据准备；

数据包括用于特征提取网络的训练数据集和测试数据集，训练数据集和测试数据集具有不同的查询集及候选集，查询集包括查询行人序列，候选集包括候选行人序列。

在本实施例中，数据包括Market1501、DukeMTMC-reID数据集，以及本实验室制作的ATR行人序列数据集。

图2展示了Market1501、DukeMTMC-reID数据集的部分图像，图3展示了由本实验室制作的ATR行人序列数据集，本发明需要采用以上数据集进行预训练和微调，并且最终将在ATR行人序列数据集进行测试。其中，Market1501数据集包含1501个行人，其中训练集含有751个行人，共12936幅行人图像，测试集则包含750个行人，共19732幅图像，其中查询集有3368幅行人图像，候选集有16364幅行人图像；DukeMTMC-reID数据集包含1404个行人，其中训练集含有702个行人，共16522幅图像，测试集包含702人，共19889幅行人图像，其中查询集有2228幅图像，候选集有176661幅图像；ATR行人序列数据集由本实验室制作，包含300个行人，754个行人序列，共152951幅行人图像，其中，查询集有241个行人序列，共52483幅图像，平均每个行人序列有217幅图像；候选集有513个行人序列，共100468幅图像，平均每个行人序列有195幅图像。

S2:利用训练数据集对特征提取网络进行预训练及微调。

进一步地，MGN的训练流程如图4所示，因此S2包括以下步骤：

S21：构建特征提取网络，特征提取网络为MGN。

图5展示了MGN结构的示意图，该结构包括Resnet50框架和三个不同的分支，分别为全局分支、粗粒度分支和细粒度分支，且各分支相互独立。全局分支负责提取全局特征

粗粒度分支提取粗粒度局部特征

细粒度分支提取细粒度局部特征

此外，粗粒度分支和细粒度分支都会生成对应的全局特征

最终将上述的局部特征

与全局特征

进行拼接作为最终行人的特征表示f＝(x ₁,x ₂,...,x ₂₀₄₈)。

S22：确定特征提取网络的训练参数。

MGN将在Market1501、DukeMTMC-reID和ATR行人序列数据集上进行训练与微调，本发明每次训练都从训练集选取P×K幅行人图像形成一个训练批次输入网络，其中每个批次包含P个不同的行人，每个行人随机选取K幅图像，并且采用ADAM作为参数训练的优化器，同时设置L2正则化的衰减因子β，和初始学习率lr，总共训练M次，期间学习率会根据次数进行衰减。

S23：训练数据的预处理。

在训练数据输入MGN之前，需要对其进行预处理，首先需要训练图像的尺寸大小调整至m×n，随后采用随机水平翻转、裁剪两种方式增强训练数据，防止训练时网络出现过拟合。水平翻转是将图像沿水平方向进行180度翻转，类似于镜面对折。裁剪是从图像中随机选择部分区域进行裁剪，裁剪后的图像区域一般小于网络输入图像尺度，因此需要将裁剪后的图像尺寸大小重新调整至m×n。

S24：将预处理后的训练数据集中的训练数据输入特征提取网络，计算损失值，并利用损失值进行在特征提取网络上进行反向传播，更新训练参数，实现特征提取网络的预训练及微调。

将S23得到的数据输入MGN，并将其输出的全局特征

用于计算Softmax交叉熵损失与三元组损失，而粗粒度分支与细粒度分支输出的局部特征

则用于计算Softmax交叉熵损失值，并且最小化上述损失值，反向传播更新网络参数，不断重复，直至达到训练次数，完成训练和微调。Softmax交叉熵损失函数与三元组损失函数如公式(1)和(2)所示，

其中P和K表示训练批次中的行人类别数和各类别选取的行人图像数量，α表示批次中最远同类样本距离与最近异类样本距离的容忍值，

表示第i类中的第a幅图像的特征，

表示与

相同行人类别的第p幅图像特征，

表示与

不同行人类别的第n幅图像特征，p _i,a表示样本特征的行人类别，q _i,a表示网络对样本特征的预测值。

S3：利用特征提取网络对测试数据集内的测试数据进行特征提取，并对提取的特征进行维数简约，得到图像特征。

经过S2对MGN进行预训练和微调后，则需要对测试集的行人序列进行特征提取，MGN网络对单幅行人图像的输出特征f＝(x ₁,x ₂,...,x _d)维数较高，一个含有k幅图像的行人序列，其序列特征可表示为

由于高维特征会对算法的计算带来巨大的负担，因此采用PCA对已获得的所有特征进行降维处理，其中能量值设为α，可得降维后的特征

其中d'<d，则含有k幅图像的行人序列特征可表示为

因此，即可即可获得查询集的行人序列特征集合Q和候选集的行人序列特征集合G，如公式(3)和(4)所示，

Q＝{ω _q1,ω _q2,...,ω _qi,...,ω _qm} (3)

G＝{ω _g1,ω _g2,...,ω _gi,...,ω _gn} (4)

其中ω _qi表示查询集中第i个行人序列的特征，m表示查询集中的行人序列个数，ω _gi表示候选集中的第i个行人序列的特征，n表示候选集中的行人序列个数。

S4：对测试数据的图像特征进行相似性度量，得到最匹配的候选行人。

由于目前行人序列重识别方法中的特征融合方式存在局限性，因此，本发明并没有通过序列的融合特征来表征对应的行人序列，而是根据行人序列中所有的图像特征构建出描述该序列特征空间的概率分布函数，如图6和图7所示，并通过度量行人序列特征分布的相似性来获得重识别结果，如图8和图9所示，进一步地，图10展示了行人序列特征分布相似性度量流程图，图11展示了行人序列特征分布相似性度量的框架结构，步骤S4包括以下步骤：

S41：将给每个测试数据代表的行人序列都根据其所有的图像特征构建出描述对应序列特征空间的概率分布函数。

本发明将行人序列中的每个图像特征样本作为核心构建对应的高斯函数，并通过这些高斯函数来拟合该行人序列的概率分布函数，高斯函数的表示如公式(5)所示。此外，构建的行人序列概率分布函数可对任意的特征样本进行概率估计，并以此来描述特征样本在该行人序列的特征空间的概率分布情况，当输入的特征样本靠近核心时，高斯函数会表现出较高的活性，相反，当输入的特征样本远离核心时，高斯函数则会表现出较低的活性，高斯函数随着距离的增加，其表现活性会越来越低。对于任意的查询序列特征ω _q和候选序列特征ω _g，其构建的概率分布函数分别如公式(6)和(7)所示，

其中，x表示输入的特征样本，x _i表示作为高斯核心的特征样本，σ表示高斯函数的核宽，核宽将通过实验选取最优值，N _q和N _g分别表示查询序列特征ω _q中的图像特征数量和候选序列特征ω _g中的图像特征数量。

本发明采用RBFNN结构来实现行人序列的概率分布函数构建，RBFNN是一种三层的前馈型神经网络，其结构如图12所示。因此，由S3得到的查询集的行人序列特征集合Q和候选集的行人序列特征集合G基于RBFNN结构都构建出对应的概率分布函数，也称为RBFNN概率函数估计器，以此描述对应的行人序列特征分布，即可得到查询集的RBFNN概率函数估计器集合Q _RBF和候选集的RBFNN概率函数估计器集合G _RBF，如公式(8)和(9)所示，

其中

和

分别表示根据查询集中的第i个行人序列特征和候选集中第j个行人序列特征构建的RBFNN概率函数估计器。

S42：对查询行人序列的图像特征点进行概率估计。

进一步地，图13展示了对查询行人序列的图像特征点进行概率估计的流程，具体步骤S42包括以下步骤：

S421：将查询行人序列特征ω _q∈Q中的图像特征样本点x _k输入其构建的 RBFNN概率函数估计器进行计算并得出对应的概率估计值P _q，其定义见公式(10)。

P _q＝{p(x _k|ω _q)|x _k∈ω _q} (10)

S422：同样地将查询行人序列特征ω _q∈Q的图像特征样本点x _k输入候选行人序列特征ω _g∈G所构建的RBFNN概率函数估计器并得到对应的概率估计值P _g，其定义见公式(11)。

P _g＝{p(x _k|ω _g)|x _k∈ω _q} (11)

S423：重复步骤S422，直至完成查询行人序列特征ω _q∈Q的图像特征样本点x _k在候选集G中所有行人序列的概率估计。

经过上述的计算后，即可得到查询行人序列特征ω _q∈Q的图像特征样本点x _k在不同行人序列特征空间的概率估计值，这些概率估计值分别描述了查询序列特征ω _q∈Q的图像特征样本点x _k在自身特征空间和所有候选行人序列特征空间中的分布情况；

S43：度量查询行人序列和候选行人序列的概率分布函数之间的相似性。

进一步地，图14展示了度量查询行人序列和候选行人序列的概率分布函数之间的相似性的流程，具体步骤S43包括以下步骤：

S431：将查询行人序列特征ω _q∈Q的图像特征样本点x _k在自身特征分布的概率估计值P _q和在候选行人序列ω _g∈G特征分布的概率估计值P _g进行KL散度计算，如公式(12)所示。

S432：重复S431，直至完成查询行人序列特征ω _q∈Q与候选集G中所有候选行人序列特征构建的概率分布函数相似性度量。

S44：重复S42和S43，直至完成所有查询行人序列与候选行人序列的相似性度量。

S45：根据相似性大小进行排序并找出与查询行人序列最匹配的候选行人。

由S44计算得出了各查询行人序列与所有候选行人序列的散度值，根据散度值对所有候选行人序列进行升序排序，散度值越小表示两个特征分布越相似，散度值越大表示两个特征分布的差异越大，将最小散度值对应的候选行人作为重识别结果，如公式(13)，

S5：输出结果。

每个查询行人序列在候选集中的识别结果会按照相似度进行排序，这里采用平均精度均值(mean average precision,mAP)和前k位准确率(Rank-k)作为衡量行人重识别算法的性能指标。

mAP是查询集中行人序列的查准率(average precision,AP)的平均值，用来描述在候选集的查询结果中，与查询序列相同类别的结果的排序占比，当mAP越高，表示算法的性能越好。在ATR行人序列数据集中，查询集Q有241个行人序列，候选集G共有513个行人序列。假设任意查询行人序列q _i与候选集中所有行人序列进行相似度计算后，排序后的候选集表示为

命中的行人序列组成集合表示为

如公式(14)和(15)，则可计算出查询序列q _i的AP，如公式(16)所示，因此，对查询集中所有行人序列的AP取平均值，即可得到mAP，如公式(17)所示，

其中，

表示候选集中与查询序列q _i的行人类别相同的序列数量，r _j表示命中的第j个候选行人序列在

的排序名次，而

表示在

的排序名次。

Rank-k表示在相似度排序后候选集中前k个中含有正确行人的概率，该值越大，则表示准确率越高，常采用Rank-1，Rank-5作为评估指标，分别表示首次命中的概率和前5个命中的概率。

图15是本发明的实验结果，展示了本发明在ATR行人序列数据集的mAP、Rank-1和Rank-5值，“Ours”表示本发明提出的行人重识别方法。

图16展示出了本发明提供的行人重识别方法的系统结构框图，为了便于说明，仅示出了与本发明相关的部分。具体地，行人重识别系统包括：数据准备模块1、网络处理模块2、特征提取模块3、相似性度量模块4及结果输出模块5；数据准备模块1用于数据准备，数据包括用于特征提取网络的训练数据集和测试数据集，训练数据集和测试数据集具有不同的查询集及候选集，查询集包括查询行人序列，候选集包括候选行人序列；网络处理模块2用于利用训练数据集对特征提取网络进行预训练及微调；特征提取模块3用于利用特征提取网络对测试数据集内的测试数据进行特征提取，并对提取的特征进行维数简约，得到图像特征；相似性度量模块4用于对测试数据的图像特征进行相似性度量，得到最匹配的候选行人；结果输出模块5用于输出最匹配的候选行人。

本申请实施例提供一种电子装置，请参阅图17，该电子装置包括：存储器601、处理器602及存储在存储器601上并可在处理器602上运行的计算机程序，处理器602执行该计算机程序时，实现前述中描述的行人重识别方法。

进一步的，该电子装置还包括：至少一个输入设备603以及至少一个输出设备604。

上述存储器601、处理器602、输入设备603以及输出设备604，通过总线605连接。

其中，输入设备603具体可为摄像头、触控面板、物理按键或者鼠标等等。输出设备604具体可为显示屏。

存储器601可以是高速随机存取记忆体(RAM，Random Access Memory)存储器，也可为非不稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器601用于存储一组可执行程序代码，处理器602与存储器601耦合。

进一步的，本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质可以是设置于上述各实施例中的电子装置中，该计算机可读存储介质可以是前述中的存储器601。该计算机可读存储介质上存储有计算机程序，该程序被处理器602执行时实现前述实施例中描述的行人重识别方法。

进一步的，该计算机可存储介质还可以是U盘、移动硬盘、只读存储器601(ROM，Read-Only Memory)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上为对本发明所提供的一种行人重识别方法、系统、电子装置及存储介质的描述，对于本领域的技术人员，依据本发明实施例的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本发明的限制。

Claims

一种行人重识别方法，其特征在于，包括：

数据准备，所述数据包括用于特征提取网络的训练数据集和测试数据集，所述训练数据集和所述测试数据集具有不同的查询集及候选集，所述查询集包括查询行人序列，所述候选集包括候选行人序列；

利用所述训练数据集对特征提取网络进行预训练及微调；

利用所述特征提取网络对所述测试数据集内的测试数据进行特征提取，并对提取的特征进行维数简约，得到图像特征；

对所述测试数据的图像特征进行相似性度量，得到最匹配的候选行人；

输出所述最匹配的候选行人。
根据权利要求1所述的行人重识别方法，其特征在于，

所述利用所述训练数据集对特征提取网络进行预训练及微调，包括：

构建特征提取网络，所述特征提取网络为MGN；

确定所述特征提取网络的训练参数；

对训练数据集进行预处理；

将预处理后的训练数据集中的训练数据输入所述特征提取网络，计算损失值，并利用所述损失值进行在所述特征提取网络上进行反向传播，更新所述训练参数，实现所述特征提取网络的预训练及微调。
根据权利要求1所述的行人重识别方法，其特征在于，

所述对所述测试数据的特征进行相似性度量，得到最匹配的候选行人，包括：

将每个测试数据代表的行人序列都根据其所有的图像特征构建出描述对应序列特征空间的概率分布函数；

对查询行人序列的图像特征点进行概率估计；

度量查询行人序列和候选行人序列的概率分布函数之间的相似性；

重复相似性度量的步骤，直至完成所有查询行人序列与候选行人序列的相似性度量；

根据相似性大小进行排序并找出与查询行人序列最匹配的候选行人。
根据权利要求3所述的行人重识别方法，其特征在于，

所述对查询行人序列的图像特征点进行概率估计，包括：

将查询行人序列特征中的图像特征样本点输入其构建的RBFNN概率函数估计器进行计算并得出对应的概率估计值；

将查询行人序列特征的图像特征样本点输入候选行人序列特征所构建的RBFNN概率函数估计器并得到对应的概率估计值；

重复上述步骤，直至完成查询行人序列特征的图像特征样本点在候选集中所有行人序列的概率估计。
根据权利要求3所述的行人重识别方法，其特征在于，

所述度量查询行人序列和候选行人序列的概率分布函数之间的相似性，包括：将所有查询行人序列特征的图像特征样本点在自身特征分布的概率估计值和在候选行人序列特征分布的概率估计值进行KL散度计算，完成查询行人序列特征与候选集中所有候选行人序列特征构建的概率分布函数相似性度量。
根据权利要求2所述的行人重识别方法，其特征在于，

所述对训练数据集进行预处理，包括：

将所述训练数据集内的训练图像的大小调整至m×n；

对所述训练图像进行随机水平翻转、裁剪，完成预处理。
根据权利要求2所述的行人重识别方法，其特征在于，

所述特征提取网络包括Resnet50框架和三个不同、相互独立的分支，三个不同的分支分别为全局分支、粗粒度分支及细粒度分支，全局分支用于提取全局特征，粗粒度分支用于提取粗粒度局部特征，细粒度分支用于提取细粒度局部特征。
一种行人重识别系统，其特征在于，包括：

数据准备模块，用于数据准备，所述数据包括用于特征提取网络的训练数据集和测试数据集，所述训练数据集和所述测试数据集具有不同的查询集及候选集，所述查询集包括查询行人序列，所述候选集包括候选行人序列；

网络处理模块，用于利用所述训练数据集对特征提取网络进行预训练及微调；

特征提取模块，用于利用所述特征提取网络对所述测试数据集内的测试数据进行特征提取，并对提取的特征进行维数简约，得到图像特征；

相似性度量模块，用于对所述测试数据的图像特征进行相似性度量，得到最匹配的候选行人；

结果输出模块，用于输出所述最匹配的候选行人。
一种电子装置，包括：存储器、处理器，所述存储器上存储有可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时，实现权利要求1至7中的任意一项所述的行人重识别方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现权利要求1至7中的任意一项所述的行人重识别方法。