WO2022001489A1

WO2022001489A1 - 一种无监督域适应的目标重识别方法

Info

Publication number: WO2022001489A1
Application number: PCT/CN2021/095647
Authority: WO
Inventors: 金�一; 高雅君; 李浥东; 王涛; 郎丛妍; 冯松鹤
Original assignee: 北京交通大学
Priority date: 2020-06-28
Filing date: 2021-05-25
Publication date: 2022-01-06
Also published as: CN111814854B; CN111814854A

Abstract

一种无监督域适应的目标重识别方法，该方法包括：构建多尺度域适应注意力学习网络；利用源域数据集和目标域数据集对多尺度域适应注意力学习网络进行训练，计算多尺度域适应注意力学习网络的多任务损失，在多任务损失的值收敛后，得到训练好的多尺度域适应注意力学习网络；利用训练好的多尺度域适应注意力学习网络构建无监督域适应的目标重识别模型，利用无监督域适应的目标重识别模型对输入的图像进行目标重识别处理。上述方法通过将特征图分割成与目标相关的特征图和与域相关特征图来减少域差异，将特征图映射在不同尺度下，在多个尺度下进行分割，可以学习到仅仅与域相关的、多尺度的特征表示，从而达到了最优的性能。

Description

一种无监督域适应的目标重识别方法

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种无监督域适应的目标重识别方法。

背景技术

目标重识别主要解决目标的跨镜追踪，指用一个摄像头下的图像去判断其他摄像头下是否再次出现了这个目标。目标重识别的任务是在不重叠的摄像机图像中匹配目标。由于在安全和安全管理应用方面有着极大的潜力，目标重识别已成为视频监控领域研究的热点之一。然而，这是一个具有挑战性的任务，因为视角、遮挡和光照条件的变化，所识别目标的外观往往会在摄像机图像中发生巨大的变化。为了解决这些问题，现有的目标重识别方法大多是监督学习上，通过深度学习，取得了显著的性能提升。然而，这些方法需要大量的标记数据来训练重识别模型，在实际应用是很难实现的。

为了使目标重识别方法更具可扩展性，一种解决方案是将目标重识别任务表示为一个无监督域适应问题(Unsupervised Domain Adaptation，UDA)，其中现有的已标记数据集和当前的未标记数据集分别建模为源域和目标域。源域和目标域包含具有相同维度但身份完全不同的特征空间，即相关但不相同。将一个目标重识别模型从源域转移到目标域是具有挑战性的任务，其中有两个原因:首先，由于源数据集和目标数据集往往来自于完全不同的环境，其中包含不同的光照、背景和图像质量，因此源数据和目标数据的数据分布具有很大的概率差异，这样的域差异可能会导致负迁移，以往的实验结果也可证明，从源数据集训练的模型在应用于目标数据时，其性能往往急剧下降。其次，目标数据集是未标记的，而现有的大部分目标重识别损失函数都是针对监督学习设计的，不能直接使用。

为解决域差异的问题，现有技术已经提出了许多解决方案，大多数方法通常将全局特征用于身份分类，这部分全局特征包括了与域无关的噪声部分，使模型在训练过程中容易受到背景杂波的影响，并且只使用了深层的单层特征。然而，最近一项对CNN(Convolutional Neural Networks，卷积神经网络)每一层实际学习内容的可视化研究表明，更高层次的特征通常在全局尺度上包含更抽象的语义概念，空间信息更少，而较低层次的网络总是专注于细微的局部差异，这意味着在不同的空间尺度和位置都存在可转移的表示。因此，如何准确剔除与域无关的噪声部分，充分考虑不同的空间尺度，成为特征学习的关键。

对于实际应用中数据集缺少标注的问题，常见的解决方案是对未标记的数据使用伪标签。通常使用聚类方法将未标记的训练数据分割成几个独立的集群，并假设同一集群中的数据具有相同的聚类身份。但是，与人工标注不同，伪标签是近似的和不准确的。因此，如何合理利用伪标签也是我们要解决的一个主要问题。

对于目标重识别的无监督域适应问题，早期方法是基于手工特征提出的，如基于手工特征的行人重识别方法，但在训练样本数量较大的情况下，其有效性不如深度模型。最近，人们提出了几种基于深度学习的方法，主要可以分为两类:

有方案提出了一组方法来估计未标记目标数据的伪标签。这些方法采用伪标签作为硬约束，忽略了伪标签的不准确性。放宽了标签的约束，以避免过拟合。然而，该方案用于监督学习，并对所有样本分配一个统一的标签分布。也有方案使用软标签来表示未标记的数据，但其使用的软标签是为了模拟未标记的目标样本和标记的源样本。

还有方案提出了减少公共标签空间中源目标差异的另一组方法。如在目标重识别的目标行人再识别的过程中，提出了可转移的联合属性和身份的深度学习，利用额外的位姿分割信息进行对齐。它们都需要附加注释，在许多情况下无法获得。

上述现有技术中的目标重识别方法的缺点为：

(1)现有的方法通常将全局特征用于目标的分类，而这部分特征包括了与域无关的噪声部分，使模型在训练过程中容易受到背景杂波的影响；并且只使用了深层的单层特征，包含的空间信息少。

(2)现有的方法大多数需要附加注释，在许多情况下无法获得，而本方法不需要任何额外的标注，目的是实现无监督的域适应。

(3)现有的无监督方法是对未标记的数据使用聚类模型生成伪标签，但是，与人工标注不同，伪标签是近似的和不准确的。

发明内容

本发明的实施例提供了一种无监督域适应的目标重识别方法，以克服现有技术的问题。

为了实现上述目的，本发明采取了如下技术方案。

一种无监督域适应的目标重识别方法，包括：

构建多尺度域适应注意力学习网络；

利用源域数据集和目标域数据集对所述多尺度域适应注意力学习网络进行训练，计算多尺度域适应注意力学习网络的多任务损失，在所述多任务损失的值收敛后，得到训练好的多尺度域适应注意力学习网络；

利用训练好的多尺度域适应注意力学习网络构建无监督域适应的目标重识别模型，利用所述无监督域适应的目标重识别模型对输入的图像进行目标重识别处理。

优选地，所述的构建多尺度域适应注意力学习网络，包括：

构建多尺度域适应注意力学习网络，该多尺度域适应注意力学习网络包括：域适应注意力模块、目标相关特征的处理分支和域相关特征的处理分支三个组成部分，所述多尺度域适应注意力学习网络自适应地将全局特征划分为不同尺度下的目标特征和域特征，目标特征用来进行判别性学习，域特征被建模出来减弱负迁移。

优选地，所述的利用源域数据集和目标域数据集对所述多尺度域适应注意力学习网络进行训练，包括：

在任意目标重识别任务中，带有标签的数据集都为源域数据集，而没有标签的数据集都为目标域数据集，利用源域数据集和目标域数据集对多尺度域适应注意力学习网络进行训练，在训练过程中，输入为源域数据集和目标域数据集，在域适应注意力模块中，骨干网络为ResNet50，在ResNet50的每一个残差块后嵌入一个DAAM，再通过依次学习空间注意S(·)和通道注意C(·)两种互补注意机制，得到目标相关的特征表示，用1减去目标特征表示，得到域特征表示，用当前残差块输出的特征表示与目标特征表示、域特征表示按元素相乘，分别得到目标特征图和域特征图；

以此类推，对于目标特征和域特征都分别有四个不同层次的特征图，分别为：目标特征1、目标特征2、目标特征3、目标特征4及域特征1、域特征2、域特征3、域特征4，将所有层次的目标特征映射在空间降维后进行拼接，形成多尺度的目标特征和域特征；

在目标特征的处理分支中，目标特征依次经过1*1滤波的卷积层、全局平均池化层、批处理归一化层和最后的全连接层，得到目标特征向量；

在域相关特征的处理分支中，域相关特征依次经过1*1滤波的卷积层、全局平均池化层、批处理归一化层和最后的全连接层(FC)，得到域特征向量。

优选地，所述的计算多尺度域适应注意力学习网络的多任务损失，包括：

对于任意一个域适应的目标重识别任务，设带有标记的源域数据集为

而未标记的目标域数据集为

其中

代表来自源域数据集的图像，

是

对应的身份标签，

代表来自目标域数据集的图像，

与

完全不重叠；

对于来自源域数据集的图像

其带有硬标签

则计算基于硬标签的交叉熵损失如下：

其中

是输入图像

对应身份是

的概率。

对于目标域的图像，先计算其软标签，再计算基于软标签的交叉熵损失如下：

对于域特征向量，设计跨数据集与域相关的损失函数如下：

其中，

是输入图像

属于源域D _s的概率，

是输入图像

属于目标域D _t的概率。

按照如下函数计算多尺度域适应注意力学习网络的多任务损失：

优选地，计算目标域的图像的软标签的过程包括：

采用k-相互近邻编码的方法得到图像的目标特征向量的距离矩阵，其中，目标特征向量记为

再采用基于密度的聚类方法DBSCAN将目标域分割成K簇，记为

在迭代过程中，聚类方法DBSCAN更新

其中K是自动计算的，当

属于簇C _k时，

对聚类得到的标签

分配权重

其中w _i,k的计算公式如下：

优选地，所述的在所述多任务损失的值收敛后，得到训练好的多尺度域适应注意力学习网络，包括：

判断所述多任务损失的值是否收敛，如果是，得到训练好的多尺度域适应注意力学习网络；否则，利用梯度反向传播更新多尺度域适应注意力学习网络的参数，利用源域数据集和目标域数据集对更新后的多尺度域适应注意力学习网络进行训练，计算多尺度域适应注意力学习网络的多任务损失，直到所述多任务损失的值收敛。

优选地，所述的利用训练好的多尺度域适应注意力学习网络构建无监督域适应的目标重识别模型，利用所述无监督域适应的目标重识别模型对输入的图像进行目标重识别处理，包括：

利用测试数据集对训练好的多尺度域适应注意力学习网络进行测试，判断测试结果是否达标，如果是，根据训练好的多尺度域适应注意力学习网络中的神经网络的各层的权值和偏置参数，以及多尺度域适应注意力学习网络的结构构建无监督域适应的目标重识别模型；否则，利用梯度反向传播更新多尺度域适应注意力学习网络的参数，对更新后的多尺度域适应注意力学习网络进行训练和测试，直到测试结果达标；

将待识别的图像输入到无监督域适应的目标重识别模型，该目标重识别模型根据图像的目标特征向量和域特征向量判断不同摄像头下所获取的图像是否属于同一个目标物体或同一个身份的人。

由上述本发明的实施例提供的技术方案可以看出，本发明实施例提出的多尺度域适应注意力学习模块，不需要任何额外的标注，就可以通过将特征图分割成与目标相关的特征图和与域相关特征图来减少域差异。同时将特征图映射在不同尺度下，在多个尺度下进行分割，故而学习到更为准确的、仅仅与域相关的、多尺度的特征表示，从而达到了最优的性能。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种无监督域适应的目标重识别方法的具体处理流程图；

图2为本发明实施例提供的一种多尺度域适应注意力学习网络框架示意图；

图3为本发明实施例提供的一种是域适应注意力模块DAAM的结构示意图。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解，下面将结合附图以几个具体实施例为例做进一步的解释说明，且各个实施例并不构成对本发明实施例的限定。

注意力模型：深度学习中的注意力模型从本质上讲和人类的选择性视觉注意力机制类似，核心目标是从众多信息中选择出对当前任务目标更关键的信息，而抑制其他无用信息，提高信息处理的效率和准确性。

域适应：在某一个数据集上训练的模型，可以应用到另一个相关但不相同的数据集上。其中前者带标签的数据集称为源域，后者不带标签的数据集称为目标域。这里特意补充目标和目标域的区别，目标为任务要识别分类的主体，如在行人重识别任务中，目标就是行人；而目标域指的是模型要应用的数据集。

监督学习：对于数据集中的每个样本，都给定属性值等类别标签，则可通过回归或分类模型对数据进行建模，得到输入数据与输出数据之间的映射关系。

无监督学习：数据集中的每个样本都无标签，直接通过聚类模型对数据进行建模。

ResNet50：是深度学习中的一种神经网络结构。也叫深度残差网络，可以解决随着网络深度增加而出现的退化问题。其中的网络结构称为残差块。

负迁移：一般是指一种学习对另一种学习起干扰或抑制作用，通常表现为一种学习使另一种学习所需的学习时间增加或阻碍另一种学习的顺利进行，以及知识的正确掌握。

聚类：将集合分成由类似的对象组成的多个类的过程被称为聚类。

本发明合理使用伪标签，将伪标签视为软约束，分配为概率分布，避免了模型对不准确的伪标签的过拟合，并根据训练数据与各聚类中心之间的关系建立合理的损失函数。本发明可以学习到更准确的仅仅与域相关的多尺度的特征表示，包括准确剔除与域无关的噪声部分，充分考虑不同的尺度空间。

本发明提供了一种基于多尺度和注意力机制的无监督域适应的目标重识别方法，用于判断不同摄像头下所获取的图像是否属于同一个目标物体或同一个身份的人。本发明的方法通过多尺度的域适应注意力学习模块，分别得到与目标本身相关的特征表达和与域相关的特征表达，同时使用多任务损失函数，拉近属于相同目标的特征之间的距离和属于相同域的特征之间的距离，并且在无监督情况下采用了一种基于软标签的身份损失模型，有效避免了过拟合。

本发明实施例提供的一种无监督域适应的目标重识别方法的具体处理流程如图1所示，包括如下的处理步骤：

步骤S21、构建多尺度域适应注意力学习网络。

构建多尺度域适应注意力学习网络，该网络能够自适应的将全局特征划分为不同尺度下与目标识别相关的特征(简称目标特征)和与域相关的特征(简称域特征)。其中，目标特征用来进行判别性学习，域特征被专门建模出来是为了减弱负迁移。

图2为本发明实施例提供的一种多尺度域适应注意力学习网络的框架示意图，如图2所示，多尺度域适应注意力学习网络包括三个组成部分，一个是域适应注意力模块(domain adaptive attention module,DAAM)，其结构如图3所示；另外两个部分分别是目标相关特征的处理分支和域相关特征的处理分支。

步骤S22、利用源域数据集和目标域数据集对多尺度域适应注意力学习网络进行训练。

本发明提出了一种在无监督情况下基于软标签的目标身份损失模型，通过挖掘各伪标签和聚类中心之间的关系，赋予每个伪标签一组属于各簇的概率值，而不是绝对的标签值。

在任意目标重识别任务中，带有标签的数据集都为源域数据集，而没有标签的数据集都为目标域数据集，利用源域数据集和目标域数据集对多尺度域适应注意力学习网络进行训练，具体训练过程包括：

在训练过程中，输入为源域数据集和目标域数据集，域适应注意力模块的骨干网络为ResNet50。然后，在ResNet50的每一个残差块后嵌入一个DAAM，再通过依次学习空间注意S(·)和通道注意C(·)两种互补注意机制，可以得到目标相关的特征表示，用1减去目标特征表示，得到域特征表示，用当前残差块输出的特征表示与目标特征表示、域特征表示按元素相乘，分别得到目标特征图和域特征图。

以此类推，最终对于目标特征和域特征都分别有四个不同层次的特征图，如图2所示，分别为：目标特征1、目标特征2、目标特征3、目标特征4及域特征1、域特征2、域特征3、域特征4。然后将所有层次的目标特征映射在空间降维后进行拼接，形成多尺度的目标特征和域特征。其中降维子模块由stride＝2的3*3滤波的卷积(Conv)层、批处理归一化层(BN)和ReLU非线性层组成。同理，可以得到多尺度域特征。

接下来，在目标特征的处理分支中，目标特征依次经过一个1*1滤波的卷积层，全局平均池化(GlobalAverage Pooling，GAP)层、一个批处理归一化层(BN)和最后的全连接层(FC)，最终得到目标特征向量。

同理，在域相关特征的处理分支中，域相关特征依次经过一个1*1滤波的卷积层，一个全局平均池化层(GAP)、一个批处理归一化层(BN)和最后的全连接层(FC)，最终得到域特征向量。

最后，计算多任务损失结果。对于任意一个域适应的目标重识别任务，设带有标记的源域数据集为

而未标记的目标域数据集为

其中

代表来自源域数据集的图像，

是

对应的身份标签，

代表来自目标域数据集的图像，

与

完全不重叠。对于目标特征向量，根据图像的来源构造两种损失函数，对于来自源域数据集的图像

其带有硬标签

则计算基于硬标签的交叉熵损失如下：

其中

是输入图像

对应身份是

的概率。

没有标签的数据集称为目标域数据集，来自目标域数据集的图像可能以不同的概率属于多个身份，各个概率和为1，其标签称为软标签。对于目标域的图像，先计算其软标签，其中，软标签的学习过程为：首先采用k-相互近邻编码的方法(k-reciprocal Encoding)得到目标特征向量的距离矩阵，其中，目标特征向量记为

其次采用基于密度的聚类方法DBSCAN，将目标域的分割成K簇，记为

在迭代过程中，聚类方法DBSCAN更新

其中K是自动计算的。当

属于簇C _k时，

接下来，对聚类得到的标签

分配权重

一般来说，靠近组中心C _k的样本置信度较大，其中w _i,k的计算公式如下：

最后计算基于软标签的交叉熵损失如下：

对于域特征向量，设计跨数据集与域相关的损失函数如下：

其中，

是输入图像

属于源域D _s的概率，

是输入图像

属于目标域D _t的概率。

步骤S23、按照如下函数计算多尺度域适应注意力学习网络的多任务损失：

步骤S24、判断上述多任务损失的值是否收敛，如果是，得到训练好的多尺度域适应注意力学习网络，执行步骤S25；否则，执行步骤S26。

在迭代n次之后，多任务损失的值变化幅度小于设定的阈值，则判断多任务损失的值达到收敛。

判断多损失是否收敛的做法有设置阈值、输出损失值的变化图像查看震荡等。

步骤S25：利用测试数据集对上述训练好的多尺度域适应注意力学习网络进行测试，判断测试结果是否较好，如果是，生成无监督域适应的目标重识别模型；否则，执行步骤S27。

训练好多尺度域适应注意力学习网络后，根据训练好的多尺度域适应注意力学习网络中的神经网络的各层的权值w和偏置b等参数，以及多尺度域适应注意力学习网络的结构构建无监督域适应的目标重识别模型。

无监督域适应的目标重识别模型的结果特征是：输入的图片经过模型后输到目标特征向量和域特征向量。最后，利用目标重识别模型判断不同摄像头下所获取的图像是否属于同一个目标物体或同一个身份的人。

步骤S26：利用梯度反向传播更新多尺度域适应注意力学习网络的参数，执行步骤S22。

利用梯度反向传播更新网络的权重w和偏置b，首先根据链式求导法则计算损失函数L _total对w和b的偏导，然后采用梯度下降算法更新w和b。

步骤S27：调整目标重识别模型的学习率等参数，执行步骤S22。

综上所述，本发明实施例通过将伪标签分配为概率分布，避免了模型对不准确的伪标签的过拟合，根据训练数据和集群之间的关系分配一个标签分布，利用了聚类方法，利用软标签对未标记样本与聚类之间的关系进行建模。由于聚类是在目标数据中计算的，因此聚类可以更好地对目标样本之间的关系进行建模。

本发明实施例提出的多尺度域适应注意力学习模块，不需要任何额外的标注，就可以通过将特征图分割成与目标相关的特征图和与域相关特征图来减少域差异。同时将特征图映射在不同尺度下，在多个尺度下进行分割，故而学习到更为准确的、仅仅与域相关的、多尺度的特征表示，从而达到了最优的性能。针对未标记的目标数据集，设计了一种基于软标签的目标身份损失模型。该模型将伪标签分配为概率分布，降低了估计所得的伪标签的可信度，所以避免了模型对不准确的伪标签的过拟合，并有效地挖掘了训练数据和各聚类中心之间的潜在关系。

本发明实施例提出了一种新的多尺度域适应注意力学习网络，提出一种在无监督情况下基于软标签的目标身份损失模型，通过挖掘各伪标签和聚类中心之间的关系，赋予每个伪标签一组属于各簇的概率值，而不是绝对的标签值。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

一种无监督域适应的目标重识别方法，其特征在于，包括：

构建多尺度域适应注意力学习网络；

利用源域数据集和目标域数据集对所述多尺度域适应注意力学习网络进行训练，计算多尺度域适应注意力学习网络的多任务损失，在所述多任务损失的值收敛后，得到训练好的多尺度域适应注意力学习网络；

利用训练好的多尺度域适应注意力学习网络构建无监督域适应的目标重识别模型，利用所述无监督域适应的目标重识别模型对输入的图像进行目标重识别处理。
根据权利要求1所述的方法，其特征在于，所述的构建多尺度域适应注意力学习网络，包括：

构建多尺度域适应注意力学习网络，该多尺度域适应注意力学习网络包括：域适应注意力模块、目标相关特征的处理分支和域相关特征的处理分支三个组成部分，所述多尺度域适应注意力学习网络自适应地将全局特征划分为不同尺度下的目标特征和域特征，目标特征用来进行判别性学习，域特征被建模出来减弱负迁移。
根据权利要求1所述的方法，其特征在于，所述的利用源域数据集和目标域数据集对所述多尺度域适应注意力学习网络进行训练，包括：

在任意目标重识别任务中，带有标签的数据集都为源域数据集，而没有标签的数据集都为目标域数据集，利用源域数据集和目标域数据集对多尺度域适应注意力学习网络进行训练，在训练过程中，输入为源域数据集和目标域数据集，在域适应注意力模块中，骨干网络为ResNet50，在ResNet50的每一个残差块后嵌入一个DAAM，再通过依次学习空间注意S(·)和通道注意C(·)两种互补注意机制，得到目标相关的特征表示，用1减去目标特征表示，得到域特征表示，用当前残差块输出的特征表示与目标特征表示、域特征表示按元素相乘，分别得到目标特征图和域特征图；

以此类推，对于目标特征和域特征都分别有四个不同层次的特征图，分别为：目标特征1、目标特征2、目标特征3、目标特征4及域特征1、域特征2、域特征3、域特征4，将所有层次的目标特征映射在空间降维后进行拼接，形成多尺度的目标特征和域特征；

在目标特征的处理分支中，目标特征依次经过1*1滤波的卷积层、全局平均池化层、批处理归一化层和最后的全连接层，得到目标特征向量；

在域相关特征的处理分支中，域相关特征依次经过1*1滤波的卷积层、全局平均池化层、批处理归一化层和最后的全连接层(FC)，得到域特征向量。
根据权利要求3所述的方法，其特征在于，所述的计算多尺度域适应注意力学习网络的多任务损失，包括：

对于任意一个域适应的目标重识别任务，设带有标记的源域数据集为
而未标记的目标域数据集为
其中
代表来自源域数据集的图像，
是
对应的身份标签，
代表来自目标域数据集的图像，
与
完全不重叠；

对于来自源域数据集的图像
其带有硬标签
则计算基于硬标签的交叉熵损失如下：

其中
是输入图像
对应身份是
的概率。

对于目标域的图像，先计算其软标签，再计算基于软标签的交叉熵损失如下：

对于域特征向量，设计跨数据集与域相关的损失函数如下：

其中，
是输入图像
属于源域D _s的概率，
是输入图像
属于目标域D _t的概率。

按照如下函数计算多尺度域适应注意力学习网络的多任务损失：
根据权利要求4所述的方法，其特征在于，计算目标域的图像的软标签的过程包括：

采用k-相互近邻编码的方法得到图像的目标特征向量的距离矩阵，其中，目标特征向量记为
再采用基于密度的聚类方法DBSCAN将目标域分割成K簇，记为
在迭代过程中，聚类方法DBSCAN更新
其中K是自动计算的，当
属于簇C _k时，
对聚类得到的标签
分配权重
其中w _i,k的计算公式如下：
根据权利要求1至5任一项所述的方法，其特征在于，所述的在所述多任务损失的值收敛后，得到训练好的多尺度域适应注意力学习网络，包括：

判断所述多任务损失的值是否收敛，如果是，得到训练好的多尺度域适应注意力学习网络；否则，利用梯度反向传播更新多尺度域适应注意力学习网络的参数，利用源域数据集和目标域数据集对更新后的多尺度域适应注意力学习网络进行训练，计算多尺度域适应注意力学习网络的多任务损失，直到所述多任务损失的值收敛。
根据权利要求6所述的方法，其特征在于，所述的利用训练好的多尺度域适应注意力学习网络构建无监督域适应的目标重识别模型，利用所述无监督域适应的目标重识别模型对输入的图像进行目标重识别处理，包括：

利用测试数据集对训练好的多尺度域适应注意力学习网络进行测试，判断测试结果是否达标，如果是，根据训练好的多尺度域适应注意力学习网络中的神经网络的各层的权值和偏置参数，以及多尺度域适应注意力学习网络的结构构建无监督域适应的目标重识别模型；否则，利用梯度反向传播更新多尺度域适应注意力学习网络的参数，对更新后的多尺度域适应注意力学习网络进行训练和测试，直到测试结果达标；

将待识别的图像输入到无监督域适应的目标重识别模型，该目标重识别模型根据图像的目标特征向量和域特征向量判断不同摄像头下所获取的图像是否属于同一个目标物体或同一个身份的人。