CN110688897A

CN110688897A - 一种基于联合判断与生成学习的行人重识别方法及装置

Info

Publication number: CN110688897A
Application number: CN201910783694.3A
Authority: CN
Inventors: 张斯尧; 谢喜林; 王思远; 黄晋; 文戎; 张�诚
Original assignee: Shenzhen Jiu Ling Software Engineering Co Ltd
Current assignee: Shenzhen Jiu Ling Software Engineering Co Ltd
Priority date: 2019-08-23
Filing date: 2019-08-23
Publication date: 2020-01-14

Abstract

本发明实施例提供了基于联合判断与生成学习的行人重识别方法及装置，所述方法包括：基于给定的行人图像搭建生成学习卷积神经网络模块；基于所述生成学习卷积神经网络模块，搭建联合判别模块；所述联合判别模块用于学习所述重建图像和合成图像的初步特征，以及用于挖掘所述重建图像和合成图像的细粒度特征；基于所述生成学习卷积神经网络模块的损失函数和所述联合判别模块的损失函数，确定所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数，根据所述整体网络的损失函数确定行人重识别系统模型；所述行人重识别系统模型用于基于行人图像对行人进行重识别。通过本发明实施例，能够提高行人识别的效率、准确性。

Description

一种基于联合判断与生成学习的行人重识别方法及装置

技术领域

本发明属于计算机视觉与智慧交通技术领域，具体是涉及到一种基于联合判断与生成学习的行人重识别方法、装置、终端设备及计算机可读介质。

背景技术

目前，图像处理与分析技术发展得越来越快。在行人重识别算法中，人们对使用生成模型来增强训练数据和增强输入变量中的不变性越来越感兴趣。但是，目前的大多数方法中的生成方法与重识别(Re-ID)特征学习阶段相对独立。通常，Re-ID模型通常以直接的方式对给定的数据进行训练，数据集往往性能不佳，训练效率不高。

发明内容

有鉴于此，本发明实施例提供一种基于联合判断与生成学习的行人重识别方法、装置、终端设备及计算机可读介质，能够提高行人识别的效率、准确性。

本发明实施例的第一方面提供了一种基于联合判断与生成学习的行人重识别方法，包括：

基于给定的行人图像搭建生成学习卷积神经网络模块；所述生成学习卷积神经网络模块包括自我生成网络和交叉生成网络；所述自我生成网络用于对给定的行人图像进行重建，生成重建图像，所述交叉生成网络用于对具有不同身份特征的行人图像进行合成，生成合成图像；

基于所述生成学习卷积神经网络模块，搭建联合判别模块；所述联合判别模块用于学习所述重建图像和合成图像的初步特征，以及用于挖掘所述重建图像和合成图像的细粒度特征；

基于所述生成学习卷积神经网络模块的损失函数和所述联合判别模块的损失函数，确定所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数，并根据所述整体网络的损失函数确定行人重识别系统模型；所述行人重识别系统模型用于基于行人图像对行人进行重识别。

本发明实施例的第二方面提供了一种基于联合判断与生成学习的行人重识别装置，包括：

学习网络搭建模块，用于基于给定的行人图像搭建生成学习卷积神经网络模块；所述生成学习卷积神经网络模块包括自我生成网络和交叉生成网络；所述自我生成网络用于对给定的行人图像进行重建，生成重建图像，所述交叉生成网络用于对具有不同身份特征的行人图像进行合成，生成合成图像；

判别搭建模块，用于基于所述生成学习卷积神经网络模块，搭建联合判别模块；所述联合判别模块用于学习所述重建图像和合成图像的初步特征，以及用于挖掘所述重建图像和合成图像的细粒度特征；

重识别模型确定模块，用于基于所述生成学习卷积神经网络模块的损失函数和所述联合判别模块的损失函数，确定所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数，并根据所述整体网络的损失函数确定行人重识别系统模型；所述行人重识别系统模型用于基于行人图像对行人进行重识别。

本发明实施例的第三方面提供了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述基于联合判断与生成学习的行人重识别方法的步骤。

本发明实施例的第六方面提供了一种计算机可读介质，所述计算机可读介质存储有计算机程序，所述计算机程序被处理执行时实现上述基于联合判断与生成学习的行人重识别方法的步骤。

本发明实施例提供的基于联合判断与生成学习的行人重识别方法中，可基于卷积神经网络搭建生成学习卷积神经网络模块，基于所述生成学习卷积神经网络模块，搭建联合判别模块，并基于所述生成学习卷积神经网络模块的损失函数和所述联合判别模块的损失函数，确定所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数，根据所述整体网络的损失函数确定行人重识别系统模型，从而可根据所述行人重识别系统模型对行人进行重识别，提高行人识别的效率、准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于联合判断与生成学习的行人重识别方法的流程图；

图2是本发明实施例提供的基于联合判断与生成学习的行人重识别方法中对给定的行人图像进行重构的示意图；

图3是本发明实施例提供的基于联合判断与生成学习的行人重识别方法中对给定的具有不同身份的行人图像进行交叉合成的示意图；

图4是本发明实施例提供的一种基于联合判断与生成学习的行人重识别装置的结构示意图；

图5图4中的学习网络搭建模块的细化结构示意图；

图6图4中的判别搭建模块的细化结构示意图；

图7图4中的重识别模型确定模块的细化结构示意图；

图8是本发明实施例提供的终端设备的示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本发明实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本发明的描述。

为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。

请参阅图1，图1是本发明实施例提供的一种基于联合判断与生成学习的行人重识别方法。如图1所示，本实施例的基于联合判断与生成学习的行人重识别方法包括以下步骤：

S101：基于给定的行人图像搭建生成学习卷积神经网络模块搭建生成学习卷积神经网络模块。

在本发明实施例中，通常可先定义一张行人图像

其身份标签为其中N为图像数量，y_i∈[1,K]，K为在数据集中的种类或者身份信息数量。在训练集中给定两张现实中的行人图像x_i和x_j，本发明实施例提供的生成学习卷积神经网络模块将会通过清除给定图像的表层结构信息代码重构生成一张新的行人图像。生成学习卷积神经网络模块由一个表层解码器E_a:x_i→a_i，一个结构解码器E_s∶x_j→s_j和一个表层和结构编码器

组成。为了使生成图像更加可控同时为了更加匹配真实数据集的数据分配，本发明实施例提供的算法强化了生成学习卷积神经网络模块所包含的两个方面：1、自我生成网络；2、交叉生成网络。

关于自身生成网络，给定任意一张行人图像x_i，生成学习卷积神经网络模块首先学习的是怎么从这张图像本身重建这张图像。大致方法如图2所示，给定两张行人图像x_i和x_t，其中，这两张行人图像的身份特征相同(即为同一个人)，所以这两张行人图像的结构信息代码相同(即y_i等于y_t)。对于行人图像x_i，基于其表层信息代码a_i和结构信息代码s_i可重构生成图像

对于行人图像x_t，利用其表层信息代码a_t，并结合行人图像x_i的结构信息代码s_i可重构生成图像

这类简单的自我重建任务为整个生成学习提供了一个重要的正则化。本发明中用于重构行人图像的图像重构损失函数为：

其中，G(a_i,s_i)表示基于行人图像x_i重构的图像，a_i表示行人图像x_i中的表层信息代码，s_i表示行人图像x_i中的结构信息代码，E为期望运算符(下同)。同时，为了强化区分不同图像的表层信息代码，本发明实施例构建了一种述自我生成网络中的身份损失函数去区分不同图像的不同身份特征，其公式如下所示：

其中，p(y_i|x_i)是基于图像本身的表层信息代码中图像x_i隶属于数据集y_i的可能性预测。

关于交叉身份生成网络，与自身生成网络不同的是，交叉身份生成网络主要针对图像的不同身份特征进行生成学习。更具体地，交叉生成网络用于对具有不同身份特征的行人图像进行合成，生成合成图像。本发明使用了基于表层信息代码和结构信息代码的潜码重构技术来控制图像的生成。整体如图3所示，给定两张行人图像x_i和x_j，这两张行人图像的身份特征不同(即不是同一个人)，所以这两张行人图像的结构信息代码不同(即y_i不等于y_j)，而且这两张行人图像种的行人的衣服、裤子和鞋子等也不同，所以两张行人图像的表层信息代码也不同。基于图像x_i的表层信息代码a_i和图像x_j的结构信息代码s_j可重构生成图像

基于图像x_j的表层信息代码a_j和图像x_i的结构信息代码s_i可重构生成图像

更具体地，给定两张现实中的不同身份的行人图像x_i和x_j，x_i不等于y_j，则生成的图像为

生成图像需要保持图像x_i中的表层信息代码a_i的信息，和保持行人图像x_j中的结构信息代码s_j的信息。然后我们可在生成图像后以重建两个潜码信息。具体公式如下：

其中，

为用于重建行人图像中的表层信息代码的表层信息代码重建损失函数，

为用于重建行人图像中的结构信息代码的结构信息代码重建损失函数；

类似的，在交叉身份生成网络中的用于区分不同图像的不同身份特征的损失函数为：：

其中，

是合成的图像

中身份标签y_i对于行人图像x_i的真实的有效值的重叠概率。另外，本发明实施例为真实数据(例如，所述行人图像x_i)分配的生成图像匹配的对抗损失函数如下：

L_adv＝E[logD(x_i)]+log(1-D(G(a_j,s_j))) (5)

其中，D(·)为判别器，D(x_i)代表判别所述行人图像x_i中的像素点之间的区别，D(G(a_j,s_j))代表判别所述基于行人图像x_i重构的图像中的像素点之间的区别。

基于上述损失函数和图片处理方法，结合现有的残差网络50(Res-net50)模型，可搭建生成学习卷积神经网络模块。

S102：基于所述生成学习卷积神经网络模块，搭建联合判别模块。

在本发明实施例中，联合判别模块主要分为两大部分：主要特征学习和细粒度特征挖掘。通过先验的经验，基于这两部分可以更好的利用线上的生成图像(例如，S101中通过所述生成学习卷积神经网络模块生成的所述重建图像和合成图像)。因为通常这两部分聚焦了生成图像的不同方面，本发明实施例提供的算法可在外观编码器的顶部分支出两个轻量头部权重，用于这两大部分的特征学习。

关于主要特征(还可称为初步特征)的学习，可以将在S101中生成的图像视为类似于现有模型中的训练样本。但是，跨类别的跨ID组合的行人图像的变化使得本发明实施例采用了动态软标签的师生型监督方法。师生型监督方法中的教学模型只是一个基线CNN(卷积神经网络)训练与识别损失的原始训练集。为了训练主要特征的判别模型，本发明实施例提供的算法将所述联合判别模块预测的概率分布p与教学模型预测的概率分布q之间的Kullback-Leibler divergence(称为KL散度)最小化，使用如下损失函数：

其中，K是身份信息数量，

是所述联合判别模块预测的合成的图像

中第k个身份标签对于行人图像x_i的真实的有效值的重叠概率，是所述教学模型预测的合成的图像

中第k个身份标签对于行人图像x_i的真实的有效值的重叠概率。换而言之，该损失函数可用于学习所述重建图像和合成图像的初步特征。相比于其他特征标签，本发明所用的动态特征标签对于联合判别模型来说更加适合，能够增强提升主要特征的判别模型的可靠性。

关于细粒度特征的挖掘，不同于主要特征学习的对于生成数据的获取的直接作用，细粒度特征的挖掘主要体现在普通行人图像上兴趣点的转移。细粒度特征挖掘主要是对训练库中的行人图像或在S101中生成的图像进行训练时，联合判别模块会被迫学习与衣服无关的细粒度ID相关属性(如头发、帽子、包、体型等)。在该部分的细粒度特征的判别模型中，本发明实施例提供的算法将一个结构信息代码与不同的表观信息代码组合生成的图像视为提供结构代码的真实图像同一类。为了实现上面的功能，训练得到所述联合判别模块中的细粒度特的征判别模型，本发明在这个特定的分类上强化的损失函数如下所示：

这种损失函数以多任务的方式对识别判别模块可以施加额外的身份监督。相比于现有的挖掘细粒度特征样本的方法，本发明算法不需要显式地搜索通常具有细粒度的硬训练样本，因为本发明算法的识别模块通过本发明方法的细粒度特征挖掘关注的是行人图像细微的身份特征属性本身。

通常可以认为高质量合成图像在本质上可以被视为“入口”(与“异常值”相反)，因为生成学习模型生成的图像保持和重新组合来自真实数据的视觉内容。通过以上两个特征学习任务，本发明方法的联合判别模块根据对表观信息代码和结构信息代码的操作，能够使整体搭建的模型网络对生成的数据进行特定的使用。

本发明方法不再像以前所有的方法那样使用单一的监督，而是通过初级特征(还可称为主要特征)的学习和细粒度特征挖掘，从两个不同的角度来处理生成的图像，前者关注的是结构信息不变的服饰外在信息，后者关注的是表观信息不变的结构线索。

S103：基于所述生成学习卷积神经网络模块的损失函数和所述联合判别模块的损失函数，确定所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数，并根据所述整体网络的损失函数确定行人重识别系统模型。

本发明实施例共同训练表层解码器、结构解码器、表层和结构编码器以及联合判别器(对应联合判别模块)，以优化总目标，也就是说，基于图像重构损失函数、所述自我生成网络中的用于区分不同图像的不同身份特征的损失函数、所述表层信息代码重建损失函数、所述结构信息代码重建损失函数、所述交叉生成网络中的用于区分不同图像的不同身份特征的损失函数以及所述对抗损失函数，可构建所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数：

其中，

和

分别为对不同行人图像进行重构的图像重建损失函数，是跨身份生成学习中的潜在信息代码重建损失函数。λ_img、λ_id、λ_prim,和λ_fine是各部分控制相关损失项重要性的权重，在实际对图像到图像转换过程中，通常使用大权重λ_img＝5来计算图像重建损失。由于交叉ID生成图像在开始时质量不高，识别损失函数

可能使训练不稳定，因此需要设置了一个较小的权重λ_id＝0.5。同时在生成质量稳定之前，本发明方法不涉及识别特征学习损失函数L_prim和L_fine。

整体模型函数确定后，可通过所述整体网络的损失函数对所述生成学习卷积神经网络模块和所述联合判别模块的整体网络进行训练，得到并输出行人重识别系统模型。所述行人重识别系统模型可用于基于行人图像对行人进行重识别。

在图1提供的基于联合判断与生成学习的行人重识别方法中，可基于卷积神经网络搭建生成学习卷积神经网络模块，基于所述生成学习卷积神经网络模块，搭建联合判别模块，并基于所述生成学习卷积神经网络模块的损失函数和所述联合判别模块的损失函数，确定所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数，根据所述整体网络的损失函数确定行人重识别系统模型，从而可根据所述行人重识别系统模型对行人进行重识别，提高行人识别的效率、准确性。更具体地，本发明实时提供的方法中提出了一个联合判断与生成学习的总体框架，将RE-ID学习和数据生成端到端的结合起来。通过切换外观或结构编码，生成模块能够生成高质量的交叉ID(身份)的合成图像，在线反馈给外观编码器，可用于改进联合判别模块。在本发明方法中的联合判断与生成学习的总体框架在不直接使用给定数据的情况下可显著改善深度学习网络图像训练的基准线，从而在多个常用数据集上实现了最好的性能。

请参阅图4，图4是本发明实施例提供的一种基于联合判断与生成学习的行人重识别装置的结构框图。如图4所示，本实施例的基于联合判断与生成学习的行人重识别装置40包括学习网络搭建模块401、判别搭建模块402和重识别模型确定模块403。学习网络搭建模块401、判别搭建模块402和重识别模型确定模块403分别用于执行图1中的S101、S102和S103中的具体方法，详情可参见图1的相关介绍，在此仅作简单描述：

学习网络搭建模块401，用于基于给定的行人图像搭建生成学习卷积神经网络模块；所述生成学习卷积神经网络模块包括自我生成网络和交叉生成网络；所述自我生成网络用于对给定的行人图像进行重建，生成重建图像，所述交叉生成网络用于对具有不同身份特征的行人图像进行合成，生成合成图像。

判别搭建模块402，用于基于所述生成学习卷积神经网络模块，搭建联合判别模块；所述联合判别模块用于学习所述重建图像和合成图像的初步特征，以及用于挖掘所述重建图像和合成图像的细粒度特征。

重识别模型确定模块403，用于基于所述生成学习卷积神经网络模块的损失函数和所述联合判别模块的损失函数，确定所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数，并根据所述整体网络的损失函数确定行人重识别系统模型；所述行人重识别系统模型用于基于行人图像对行人进行重识别。

进一步地，可参见图5，学习网络搭建模块401可具体包括第一构建单元4011、第二构建单元4012、第三构建单元4013、第四构建单元4014、第五构建单元4015和学习网络搭建单元4016：

第一构建单元4011，用于构建自我生成网络中的用于重构行人图像的图像重构损失函数为：

其中，G(a_i,s_i)表示基于行人图像x_i重构的图像，a_i表示行人图像x_i中的表层信息代码，s_i表示行人图像x_i中的结构信息代码。

第二构建单元4012，用于构建所述自我生成网络中的用于区分不同图像的不同身份特征的损失函数为：

其中，p(y_i|x_i)是基于图像本身的表层信息代码中行人图像x_i隶属于身份标签y_i的可能性预测。

第三构建单元4013，用于构建交叉生成网络中合成行人图像时用于重建行人图像中的表层信息代码的表层信息代码重建损失函数及用于重建行人图像中的结构信息代码的结构信息代码重建损失函数：

其中，

为用于重建行人图像中的表层信息代码的表层信息代码重建损失函数，为用于重建行人图像中的结构信息代码的结构信息代码重建损失函数。

第四构建单元4013，用于构建所述交叉生成网络中的用于区分不同图像的不同身份特征的损失函数为：

其中，

是合成的图像

中身份标签y_i对于行人图像x_i的真实的有效值的重叠概率；

第五构建单元4014，用于构建为真实数据分配的生成图像匹配的对抗损失函数：

L_adv＝E[logD(x_i)]+log(1-D(G(a_j,s_j))) (5)

学习网络搭建单元4015，用于基于所述图像重构损失函数、所述自我生成网络中的用于区分不同图像的不同身份特征的损失函数、所述表层信息代码重建损失函数、所述结构信息代码重建损失函数、所述交叉生成网络中的用于区分不同图像的不同身份特征的损失函数以及所述对抗损失函数，并根据图片处理方法和Res-net50模型，搭建生成学习卷积神经网络模块。

进一步地，可参见图6，判别搭建模块402可具体包括第一损失构建单元4021、第一训练单元4022、第二损失构建单元4023和第二训练单元：

第一损失构建单元，用于构建联合判别模块中的用于学习所述重建图像和合成图像的初步特征的损失函数：

其中，K是身份信息数量，

是所述联合判别模块预测的合成的图像中第k个身份标签对于行人图像x_i的真实的有效值的重叠概率，

是所述教学模型预测的合成的图像

中第k个身份标签对于行人图像x_i的真实的有效值的重叠概率。

第一训练单元，用于通过所述用于学习所述重建图像和合成图像的初步特征的损失函数，训练得到所述联合判别模块中的初步特征的判别模型。

第二损失构建单元，用于构建联合判别模块中的用于挖掘所述重建图像和合成图对象的细粒度特征的损失函数：

第二训练单元，用于通过所述用于挖掘所述重建图像和合成图对象的细粒度特征的损失函数，训练得到所述联合判别模块中的细粒度特的征判别模型。

进一步地，可参见图7，重识别模型确定模块403可具体包括整体损失构建单元4031和系统模型获取单元4032：

整体损失构建单元4031，用于基于图像重构损失函数、所述自我生成网络中的用于区分不同图像的不同身份特征的损失函数、所述表层信息代码重建损失函数、所述结构信息代码重建损失函数、所述交叉生成网络中的用于区分不同图像的不同身份特征的损失函数以及所述对抗损失函数，构建所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数：

其中，

和

分别为对不同行人图像进行重构的图像重建损失函数，λ_img、λ_id、λ_prim和λ_fine为权重。

系统模型获取单元4032，用于通过所述整体网络的损失函数对所述生成学习卷积神经网络模块和所述联合判别模块的整体网络进行训练，得到行人重识别系统模型。

图4提供的基于联合判断与生成学习的行人重识别装置，可基于卷积神经网络搭建生成学习卷积神经网络模块，基于所述生成学习卷积神经网络模块，搭建联合判别模块，并基于所述生成学习卷积神经网络模块的损失函数和所述联合判别模块的损失函数，确定所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数，根据所述整体网络的损失函数确定行人重识别系统模型，从而可根据所述行人重识别系统模型对行人进行重识别，提高行人识别的效率、准确性。

图8是本发明一实施例提供的终端设备的示意图。如图8所示，该实施例的终端设备8包括：处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82，例如进行基于联合判断与生成学习的行人重识别的程序。所述处理器80执行所述计算机程序82时实现上述方法实施例中的步骤，例如，图1所示的S101至S103。或者，所述处理器80执行所述计算机程序82时实现上述各装置实施例中各模块/单元的功能，例如图4所示模块401至403的功能。

示例性的，所述计算机程序82可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器81中，并由所述处理器80执行，以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序82在终端设备8中的执行过程。例如，所述计算机程序82可以被分割成学习网络搭建模块401、判别搭建模块402和重识别模型确定模块403。(虚拟装置中的模块)，各模块具体功能如下：

重识别模型确定模块403，用于基于所述生成学习卷积神经网络模块的损失函数和所述联合判别模块的损失函数，确定所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数，根据所述整体网络的损失函数确定行人重识别系统模型；所述行人重识别系统模型用于基于行人图像对行人进行重识别。

所述终端设备8可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端设备8可包括，但不仅限于，处理器80、存储器81。本领域技术人员可以理解，图8仅仅是终端设备8的示例，并不构成对终端设备8的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。

所述处理器80可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器81可以是终端设备8的内部存储单元，例如终端设备8的硬盘或内存。所述存储器81也可以是终端设备8的外部存储设备，例如所述终端设备8上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器81还可以既包括终端设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及终端设备8所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种基于联合判断与生成学习的行人重识别方法，其特征在于，包括：

2.根据权利要求1所述的基于联合判断与生成学习的行人重识别方法，其特征在于，所述基于卷积神经网络搭建生成学习卷积神经网络模块，包括：

构建自我生成网络中的用于重构行人图像的图像重构损失函数为：

其中，G(a_i，s_i)表示基于行人图像x_i重构的图像，a_i表示行人图像x_i中的表层信息代码，s_i表示行人图像x_i中的结构信息代码；

构建所述自我生成网络中的用于区分不同图像的不同身份特征的损失函数为：

其中，p(y_i|x_i)是基于图像本身的表层信息代码中行人图像x_i隶属于身份标签y_i的可能性预测；对于给定的行人图像

其身份标签为

其中N为图像数量，y_i∈[1，K]，K为在数据集中的种类或者身份信息数量；

构建交叉生成网络中合成行人图像时用于重建行人图像中的表层信息代码的表层信息代码重建损失函数及用于重建行人图像中的结构信息代码的结构信息代码重建损失函数：

其中，为用于重建行人图像中的表层信息代码的表层信息代码重建损失函数，

构建所述交叉生成网络中的用于区分不同图像的不同身份特征的损失函数为：

其中，

是合成的图像

中身份标签y_i对于行人图像x_i的真实的有效值的重叠概率；

构建为真实数据分配的生成图像匹配的对抗损失函数：

L_adv＝E[log D(x_i)+log(1-D(G(a_j，s_j)))]

其中，D(·)为判别器，D(x_i)代表判别所述行人图像x_i中的像素点之间的区别，D(G(a_j，s_j))代表判别所述基于行人图像x_i重构的图像中的像素点之间的区别；

基于所述图像重构损失函数、所述自我生成网络中的用于区分不同图像的不同身份特征的损失函数、所述表层信息代码重建损失函数、所述结构信息代码重建损失函数、所述交叉生成网络中的用于区分不同图像的不同身份特征的损失函数以及所述对抗损失函数，并根据图片处理方法和残差网络50模型，搭建生成学习卷积神经网络模块。

3.根据权利要求2所述的基于联合判断与生成学习的行人重识别方法，其特征在于，所述基于所述生成学习卷积神经网络模块，搭建联合判别模块，包括：

构建联合判别模块中的用于学习所述重建图像和合成图像的初步特征的损失函数：

其中，K是身份信息数量，

是所述联合判别模块预测的合成的图像

中第k个身份标签对于行人图像x_i的真实的有效值的重叠概率，

是所述教学模型预测的合成的图像

中第k个身份标签对于行人图像x_i的真实的有效值的重叠概率；

通过所述用于学习所述重建图像和合成图像的初步特征的损失函数，训练得到所述联合判别模块中的初步特征的判别模型；

构建联合判别模块中的用于挖掘所述重建图像和合成图对象的细粒度特征的损失函数：

通过所述用于挖掘所述重建图像和合成图对象的细粒度特征的损失函数，训练得到所述联合判别模块中的细粒度特的征判别模型。

4.根据权利要求3所述的基于联合判断与生成学习的行人重识别方法，其特征在于，所述基于所述生成学习卷积神经网络模块的损失函数和所述联合判别模块的损失函数，确定所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数，并根据所述整体网络的损失函数确定行人重识别系统模型，包括：

基于图像重构损失函数、所述自我生成网络中的用于区分不同图像的不同身份特征的损失函数、所述表层信息代码重建损失函数、所述结构信息代码重建损失函数、所述交叉生成网络中的用于区分不同图像的不同身份特征的损失函数以及所述对抗损失函数，构建所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数：

其中，

和

分别为对不同行人图像进行重构的图像重建损失函数，

λ_img、λ_id、λ_prim和λ_fine为权重；

通过所述整体网络的损失函数对所述生成学习卷积神经网络模块和所述联合判别模块的整体网络进行训练，得到行人重识别系统模型。

5.一种基于联合判断与生成学习的行人重识别装置，其特征在于，包括：

重识别模型确定模块，用于基于所述生成学习卷积神经网络模块的损失函数和所述联合判别模块的损失函数，确定所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数，根据所述整体网络的损失函数确定行人重识别系统模型；所述行人重识别系统模型用于基于行人图像对行人进行重识别。

6.根据权利要求5所述的一种基于联合判断与生成学习的行人重识别装置，其特征在于，所述学习网络搭建模块包括：

第一构建单元，用于构建自我生成网络中的用于重构行人图像的图像重构损失函数为：

第二构建单元，用于构建所述自我生成网络中的用于区分不同图像的不同身份特征的损失函数为：

其中，p(y_i|x_i)是基于图像本身的表层信息代码中行人图像x_i隶属于数据集y_i的可能性预测；

第三构建单元，用于构建交叉生成网络中合成行人图像时用于重建行人图像中的表层信息代码的表层信息代码重建损失函数及用于重建行人图像中的结构信息代码的结构信息代码重建损失函数：

其中，

第四构建单元，用于构建所述交叉生成网络中的用于区分不同图像的不同身份特征的损失函数为：

其中，

是合成的图像中身份标签y_i对于行人图像x_i的真实的有效值的重叠概率；对于给定的行人图像

其身份标签为

第五构建单元，用于构建为真实数据分配的生成图像匹配的对抗损失函数：

L_adv＝E[log D(x_i)]+log(1-D(G(a_j，s_j)))

学习网络搭建单元，用于基于所述图像重构损失函数、所述自我生成网络中的用于区分不同图像的不同身份特征的损失函数、所述表层信息代码重建损失函数、所述结构信息代码重建损失函数、所述交叉生成网络中的用于区分不同图像的不同身份特征的损失函数以及所述对抗损失函数，并根据图片处理方法和残差网络50模型，搭建生成学习卷积神经网络模块。

7.根据权利要求6所述的一种基于联合判断与生成学习的行人重识别装置，其特征在于，所述判别搭建模块包括：

其中，K是身份信息数量，

是所述联合判别模块预测的合成的图像

是所述教学模型预测的合成的图像

第一训练单元，用于通过所述用于学习所述重建图像和合成图像的初步特征的损失函数，训练得到所述联合判别模块中的初步特征的判别模型；

8.根据权利要求7所述的一种基于联合判断与生成学习的行人重识别装置，其特征在于，所述重识别模型确定模块包括：

整体损失构建单元，用于基于图像重构损失函数、所述自我生成网络中的用于区分不同图像的不同身份特征的损失函数、所述表层信息代码重建损失函数、所述结构信息代码重建损失函数、所述交叉生成网络中的用于区分不同图像的不同身份特征的损失函数以及所述对抗损失函数，构建所述生成学习卷积神经网络模块和所述联合判别模块的整体网络的损失函数：

其中，

和

分别为对不同行人图像进行重构的图像重建损失函数，

λ_img、λ_id、λ_prim和λ_fine为权重；

系统模型获取单元，用于通过所述整体网络的损失函数对所述生成学习卷积神经网络模块和所述联合判别模块的整体网络进行训练，得到行人重识别系统模型。

9.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-4中任一项所述方法的步骤。

10.一种计算机可读介质，所述计算机可读介质存储有计算机程序，其特征在于，所述计算机程序被处理执行时实现如权利要求1-4中任一项所述方法的步骤。