WO2023272801A1

WO2023272801A1 - 一种融合上下文信息的行人重识别方法及系统

Info

Publication number: WO2023272801A1
Application number: PCT/CN2021/106989
Authority: WO
Inventors: 曹敏; 丁聪; 张民
Original assignee: 苏州大学
Priority date: 2021-06-28
Filing date: 2021-07-19
Publication date: 2023-01-05
Also published as: CN113283394B; CN113283394A

Abstract

本发明公开了一种融合上下文信息的行人重识别方法及系统，包括以下步骤：选取行人重识别数据集，提取数据集中所有行人特征；选取每个行人的上下文信息，构造图结构；对构造好的图结构进行结点信息更新；将更新后的图结构经过带权重的池化操作后得到结合上下文信息的行人特征；将池化后的行人特征与相应的原始行人特征进行拼接，构建行人重识别模型；将待识别的行人图片输入行人重识别模型，并与所有最终行人分类特征进行相似度比较，得到行人重识别的匹配结果。本发明解决现有特征学习方法在信息上的不足和获取辅助信息的成本过大问题，使得行人重识别模型在不增加额外信息情况下提高模型的准确率。

Description

一种融合上下文信息的行人重识别方法及系统

技术领域

本发明涉及计算机视觉技术领域，具体涉及一种融合上下文信息的行人重识别方法及系统。

背景技术

行人重识别是一项跨不同摄像头的图像检索技术，即对于给定监控下的行人图像，要求检索出该行人在其余摄像头中的全部图像。这项技术广泛应用于智能视频监控、安保、刑侦等领域，是当前计算机视觉的研究热点。

现有的基于特征学习的行人重识别方法主要可以分为基于全局特征的行人重识别和基于局部特征的行人重识别，以及基于辅助信息的行人重识别。基于全局和基于局部特征的行人重识别都仅从单个行人图像学习到行人图像的特征，一定程度上限制该特征的表达力。基于辅助信息的行人重识别方法需要额外的信息，如对该行人的文本描述，或利用GAN(生成对抗网络)生成一些伪数据等作为辅助信息，来提高行人重识别模型的鲁棒性，而这些信息的产生往往成本较大。

即，基于全局特征的方法，简单的将一个完整的行人图像做为模型的输入，对于一些遮挡、光线问题的行人图像由于信息减少，无法有效解决。基于局部特征的方法，将一个行人图像水平划分为多份，提取到多个局部特征，然后进行局部特征之间的对比，一定程度上可以提高模型准确率，然而，和基于全局特征类似，单张行人图像信息过少，对于遮挡等问题难以解决。基于辅助信息的行人重识别方法，利用了一些额外的信息来作为行人图像信息的补充，不仅增加了模型的计算成本，同时对于辅助信息也往往难以获取，不符合实际中解决的问题。

发明内容

本发明的目的是提供一种融合上下文信息的行人重识别方法及系统，解决现有特征学习方法在信息上的不足和获取辅助信息的成本过大问题，使得行人重识别模型在不增加额外信息情况下提高模型的准确率。

为了解决上述技术问题，本发明提供了一种融合上下文信息的行人重识别方法，包括以下步骤：

S1：选取行人重识别数据集，提取数据集中所有行人特征；

S2：选取每个行人的上下文信息，构造每个行人特征与其对应的上下文信息组成的图结构；

S3：对S2中构造好的图结构进行结点信息更新；

S4：将更新后的图结构经过带权重的池化操作后得到结合上下文信息的行人特征；

S5：将池化后的行人特征与步骤S1中的相应的原始行人特征进行拼接，得到最终行人分类特征，构建行人重识别模型；

S6：将待识别的行人图片输入行人重识别模型，并与所有最终行人分类特征进行相似度比较，得到行人重识别的匹配结果。

作为本发明的进一步改进，所述S1中提取行人特征通过训练好的卷积神经网络进行提取。

作为本发明的进一步改进，所述S2中对于单个行人特征构造与其对应的上下文信息组成的图结构的方法，具体包括以下步骤：

S21：对于行人特征P，基于近邻算法在数据集中选取k个行人特征作为行人特征P的上下文信息，得到k+1个行人特征作为构造图的结点X；

S22：基于行人特征P与其余k个行人特征相连，k个行人特征之间余弦距离越大越可能相连的原则构造图的边，特征之间的相似度作为边的权重，得到图的邻接矩阵A。

作为本发明的进一步改进，所述S22中构造图的边的方法，具体包括以下步骤：

S221：对于单个行人的特征P，通过采用余弦距离的方式计算特征P和其余特征的相似程度，相似程度最大值记为σ _p；

S222：结点X与其余k个上下文结点相连，k个上下文结点之间相似程度大于σ _p，则结点相连构造图的边，结点与结点之间的相似程度作为边的权重。

作为本发明的进一步改进，所述S3中，对S2中构造好的图结构进行结点信息更新，具体包括以下步骤：

S31:采用消息传递过程对结点进行第一次信息更新；

S32：采用自注意力机制对结点进行第二次信息更新；

S33：采用非线性函数对结点进行第三次信息更新。

作为本发明的进一步改进，所述S31中对结点进行第一次信息更新后，拼接原来的结点进行下一次更新。

作为本发明的进一步改进，所述数据集包括训练集和测试集，利用训练集不断训练行人重识别模型，将测试集中待识别的行人图片输入行人重识别模型，并与训练集中所有最终行人分类特征进行相似度比较，选择相似程度最大的图片，被认为和待识别的行人图片中是同一行人。

一种融合上下文信息的行人重识别系统，包括：

提取模块，用于选取行人重识别数据集，提取数据集中所有行人特征；

构造图结构模块，用于选取每个行人的上下文信息，构造每个行人特征与其对应的上下文信息组成的图结构；

更新模块，用于对构造好的图结构进行结点信息更新；

池化模块，用于将更新后的图结构经过带权重的池化操作后得到结合上下文信息的行人特征；

模型构建模块，用于将池化后的行人特征与相应的原始行人特征进行拼接，得到最终行人分类特征，构建行人重识别模型；

识别模块，用于将待识别的行人图片输入行人重识别模型，并与所有最终行人分类特征进行相似度比较，得到行人重识别的匹配结果。

一种计算机设备，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述的融合上下文信息的行人重识别方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述的融合上下文信息的行人重识别方法的步骤。

本发明的有益效果：本发明相较于基于全局和基于局部的行人重识别方法，不仅只利用到单独的一张行人图片信息，同时利用到来自其它图片的信息，统一提高该行人的特征鲁棒性；相较于基于辅助信息的行人重识别方法，本发明中未增加额外的信息，可以减少在信息获取及计算成本上的消耗，解决以往特征学习方法在信息上的不足和获取辅助信息的成本过大问题，使的行人重识别模型在不增加额外信息情况下提高模型的准确率。

附图说明

图1是本发明方法流程示意图；

图2是本发明具体实施流程示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明，以使本领域的技术人员可以更好地理解本发明并能予以实施，但所举实施例不作为对本发明的限定。

实施例一

参考图1，本发明实施例提供了一种融合上下文信息的行人重识别方法，包括以下步骤：

S1：选取行人重识别数据集，提取数据集中所有行人特征；

S3：对S2中构造好的图结构进行结点信息更新；

具体的，选取行人重识别数据集，数据集中包含有训练集和测试集；利用训练好的卷积神经网络，提取数据集中所有行人图片(包括训练集和测试集)的特征；对于提取到的每个行人特征，以行人特征P为例，基于近邻算法在数据集中(训练的时候为训练集，测试的时候为测试集)选取k个行人特征作为该行人特征P的上下文信息，这k+1个行人特征作为构造图的结点X，然后基于特征P与其余k个行人特征相连，k个行人特征之间余弦距离越大越可能相连的原则构造边,特征之间的相似度作为边的权重，得到图的邻接矩阵A。这样即构造好了行人特征P与它的上下文信息组成的图结构，其他行人特征类似；对S3构造好的图结构进行结点信息更新，采用消息传递过程对结点进行第一次信息更新。为了防止过平滑问题，采用自注意力机制对结点进行第二次信息更新，紧接着进行采用非线性函数对结点进行第三次信息更新；将更新后的图结构，经过带权重的池化操作后即得到了结合了上下文信息的行人特征，为了防止经过图更新后丢失一些信息，将池化后的特征与S2步骤中的原始特征进行拼接(concat)，得到一个行人的最终特征表示，该特征用于行人分类，利用训练集不断训练这个行人重识别模型。最后，将测试集中待识别的行人图片输入S5构建好的行人重识别模型，并与候选行人库中的行人属性特征进行相似度比较，得到行人重识别的匹配结果。相较于基于全局和基于局部的行人重识别方法，本方法不仅仅只利用到单独的一张行人图片信息，还利用到来自其它图片的信息，使得行人重识别模型的输入不仅仅局限于一张行人图像，而是使用多个行人图像统一提高该行人的特征鲁棒性；相较于基于辅助信息的行人重识别方法，本方法中未增加额外的信息，即行人重识别模型在不增加额外信息情况下提高模型的准确率。

实施例二

参考图1和图2，本发明实施例提供了一种融合上下文信息的行人重识别方法，基于实施例一，以行人重识别数据集DukeMTMC为例，具体包括以下步骤：

步骤(1)：DukeMTMC数据集包含训练集和测试集，假定训练集一共有N张图片，通过一个训练好的卷积神经网络(CNN)提取这N张行人图片的特征

每个特征维度为d维，d的具体数值取决于CNN的具体结构；

步骤(2)：对于单个行人的特征f _p,通过采用余弦距离的方式计算特征f _p和其余特征的相似程度，再从大到小排序(最大值记为σ _p)，取前k个特征作为特征f _p的上下文信息，接着将这k+1个特征

作为构建图的结点X _p＝{x ₀,x ₁,x ₂,…,x _k}，根据分析和实验验证，k＝3是一个最优的选择；

余弦距离公式如下：

进一步的按照x ₀(f _p)与其余k个上下文结点相连，而k个上下文结点之间若相似程度大于σ _p，则结点相连的原则构建图的边。结点与结点之间相似程度作为边上的权重，从而得到构建的图的邻接矩阵A _p；

步骤(4)：为了结合上下文信息，对步骤(3)构建的图的结点进行多次更新：

第一次结点更新：采用消息传递机制(A _pX _p),其中，为了使特征具有更好的表达能力，在消息传递机制后，采用了拼接操作(concat)拼接原来特征：

第二次结点更新：由于结点相似程度较高，为避免过平滑问题，采用经典的多头自注意力机制进行结点的更新：

第三次结点更新：采用两次非线性投影：

其中

d表示特征的维度；

步骤(5)：利用带权重的池化操作获得表示该图的特征x _g，该特征即表示结合了上下文信息的特征f _p，最后将图片P的原始特征x ₀和结合了上下文信息的特征x _g进行拼接(concat)，得到图片P的最终特征f _p，该特征用于行人重识别的分类，用训练集来按上述方法训练模型；

步骤(6)：为了验证方法准确率，在测试集上测试，测试集包含query图片集，和gallery图片集，目标是给定一张query图片，在gallery图片集中找出与query图片为同一个行人的图片。测试方法为将query图片和所有gallery图片都通过上述训练好的模型，提取得到每一个行人的特征，然后比较query图片的特征和所有gallery图片特征之间的相似程度，选择返回相似程度最大的前几张gallery图片，这些图片被认为和query图片是同一个行人。

实施例三

基于同一发明构思，本实施例提供了一种融合上下文信息的行人重识别系统，其解决问题的原理与所述融合上下文信息的行人重识别方法类似，重复之处不再赘述。

一种融合上下文信息的行人重识别系统，包括：

更新模块，用于对构造好的图结构进行结点信息更新；

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述实施例仅是为充分说明本发明而所举的较佳的实施例，本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换，均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

Claims

一种融合上下文信息的行人重识别方法，其特征在于：包括以下步骤：

S1：选取行人重识别数据集，提取数据集中所有行人特征；

S2：选取每个行人的上下文信息，构造每个行人特征与其对应的上下文信息组成的图结构；

S3：对S2中构造好的图结构进行结点信息更新；

S4：将更新后的图结构经过带权重的池化操作后得到结合上下文信息的行人特征；

S5：将池化后的行人特征与步骤S1中的相应的原始行人特征进行拼接，得到最终行人分类特征，构建行人重识别模型；

S6：将待识别的行人图片输入行人重识别模型，并与所有最终行人分类特征进行相似度比较，得到行人重识别的匹配结果。
如权利要求1所述的一种融合上下文信息的行人重识别方法，其特征在于：所述S1中提取行人特征通过训练好的卷积神经网络进行提取。
如权利要求1所述的一种融合上下文信息的行人重识别方法，其特征在于：所述S2中对于单个行人特征构造与其对应的上下文信息组成的图结构的方法，具体包括以下步骤：

S21：对于行人特征P，基于近邻算法在数据集中选取k个行人特征作为行人特征P的上下文信息，得到k+1个行人特征作为构造图的结点X；

S22：基于行人特征P与其余k个行人特征相连，k个行人特征之间余弦距离越大越可能相连的原则构造图的边，特征之间的相似度作为边的权重，得到图的邻接矩阵A。
如权利要求3所述的一种融合上下文信息的行人重识别方法，其特征在于：所述S22中构造图的边的方法，具体包括以下步骤：

S221：对于单个行人的特征P，通过采用余弦距离的方式计算特征P和其余特征的相似程度，相似程度最大值记为σ _p；

S222：结点X与其余k个上下文结点相连，k个上下文结点之间相似程度大于σ _p，则结点相连构造图的边，结点与结点之间的相似程度作为边的权重。
如权利要求1所述的一种融合上下文信息的行人重识别方法，其特征在于：所述S3中，对S2中构造好的图结构进行结点信息更新，具体包括以下步骤：

S31：采用消息传递过程对结点进行第一次信息更新；

S32：采用自注意力机制对结点进行第二次信息更新；

S33：采用非线性函数对结点进行第三次信息更新。
如权利要求5所述的一种融合上下文信息的行人重识别方法，其特征在于：所述S31中对结点进行第一次信息更新后，拼接原来的结点进行下一次更新。
如权利要求1所述的一种融合上下文信息的行人重识别方法，其特征在于：所述数据集包括训练集和测试集，利用训练集不断训练行人重识别模型，将测试集中待识别的行人图片输入行人重识别模型，并与训练集中所有最终行人分类特征进行相似度比较，选择相似程度最大的图片，被认为和待识别的行人图片中是同一行人。
一种融合上下文信息的行人重识别系统，其特征在于：包括：

提取模块，用于选取行人重识别数据集，提取数据集中所有行人特征；

构造图结构模块，用于选取每个行人的上下文信息，构造每个行人特征与其对应的上下文信息组成的图结构；

更新模块，用于对构造好的图结构进行结点信息更新；

池化模块，用于将更新后的图结构经过带权重的池化操作后得到结合上下文信息的行人特征；

模型构建模块，用于将池化后的行人特征与相应的原始行人特征进行拼接，得到最终行人分类特征，构建行人重识别模型；

识别模块，用于将待识别的行人图片输入行人重识别模型，并与所有最终行人分类特征进行相似度比较，得到行人重识别的匹配结果。
一种计算机设备，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的融合上下文信息的行人重识别方法的步骤。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1到7任一项所述的融合上下文信息的行人重识别方法的步骤。