CN114693972B

CN114693972B - 一种基于重建的中间域领域自适应方法

Info

Publication number: CN114693972B
Application number: CN202210324083.4A
Authority: CN
Inventors: 张可; 吴圣娜; 刘杰彦; 黄乐天; 贾宇明
Original assignee: University of Electronic Science and Technology of China; Yangtze River Delta Research Institute of UESTC Huzhou
Current assignee: University of Electronic Science and Technology of China; Yangtze River Delta Research Institute of UESTC Huzhou
Priority date: 2022-03-29
Filing date: 2022-03-29
Publication date: 2023-08-29
Anticipated expiration: 2042-03-29
Also published as: CN114693972A

Abstract

本发明公开了一种基于重建的中间域领域自适应方法，属于计算机视觉、智能频谱数据分析等领域自适应技术领域，具体涉及一种基于重建的中间域领域自适应方法。本发明针对现有领域自适应方法领域特征对齐困难等不足之处，提出一种基于重建的中间域领域自适应方法，并且能够实现更好的分类性能。本发明使用重建的方法对源域数据和目标域数据的特征进行提取，这样提取到特征将包含更多的数据信息，具有更强的可辨别性。同时，针对实际场景中两域之间直接对域差异最小化实现困难的问题，本发明通过在中间域对两域特征进行对齐，从而达到减轻特征对齐难度的目的，最终实现目标域数据的有效分类。

Description

一种基于重建的中间域领域自适应方法

技术领域

本发明属于计算机视觉、智能频谱数据分析等领域自适应技术领域，具体涉及一种基于重建的中间域领域自适应方法。

背景技术

在计算机视觉等领域广泛使用的深度学习模型要求训练集和测试集的数据分布相同，但是在军事测控，遥感成像，医疗健康等数据差异大，视觉技术要求高的领域使用的训练集和测试集的数据分布经常存在较大偏差，这对于深度学习模型的训练和更新是一个巨大的挑战。领域自适应问题是迁移学习的研究内容之一，它侧重于解决特征空间一致、类别空间一致，仅特征分布不一致的问题，其目的就是利用有标签的领域知识来辅助目标领域的知识获取和学习。

领域自适应的基本方法可以分为数据分布自适应法，特征选择法和子空间学习法三大类，而随着深度学习方法的广泛应用，出现了更多基于深度神经网络进行领域自适应的方法，比如通过增加自适应层，选择不同的度量准则实现领域对齐，或者通过深度对抗，在博弈对抗中实现领域对齐。

目前大量领域自适应方法通过对域差异进行直接最小化实现领域对齐，使用增加自适应层或者深度对抗的方法，提取两域中的域不变特征，将两域特征进行直接对齐，这往往忽略了在实际场景中两域之间的差异可能过大，进而导致域差异最小化的实现很困难，另外深度神经网络提取的领域不变特征中可能仍然存在残留的领域特有特征，这将对特征对齐带来影响。

因此，针对领域自适应问题，有必要提出一种能够有效提取领域不变特征，实现领域特征对齐的领域自适应方法，利用源域知识在目标域获得更好的识别结果。

发明内容

本发明要解决的技术问题是：针对现有领域自适应方法领域特征对齐困难等不足之处，提出一种基于重建的中间域领域自适应方法，并且能够实现更好的数据分类性能。

本发明提供的一种基于重建的中间域领域自适应方法，包括下列步骤：

步骤S1：获取有标签的源域数据集D_s和无标签的目标域数据集D_t，其中，有标签源域数据集D_s的数据数量为n，每个数据定义为数据/>的类别标签定义为/>目标域数据集D_t的数据数量为m，且n、m为正整数；

步骤S2：构建深度网络模型，所述深度网络模型包括重建特征提取模块，中间域特征提取模块F，中间域分类模块C，中间域对抗模块AD和中间域特征对齐模块D；

所述重建特征提取模块包括源域重建特征提取模块和目标域重建特征提取模块，且源域重建特征提取模块和目标域重建特征提取模块的损失分别为源域重建特征损失L_s-recon和目标域重建特征损失L_t-recon；

所述源域重建特征提取模块包括源域特征编码器E^s和源域特征解码器D^s，其输入数据为源域数据；

所述目标域重建特征提取模块包括目标域特征编码器E^t和目标域特征解码器D^t，其输入数据为目标域数据；

其中，源域特征编码器E^s包括多个交替的卷积层与最大池化层，且源域特征解码器D^s的网络结构与源域特征编码器Es镜像对称，即网络结构设置完全相反；标域特征编码器E^t与源域特征编码器E^s的网络结构相同，目标域特征解码器D^t与源域特征解码器D^s的网络结构相同；

且所述源域特征编码器E^s和目标域特征编码器E^t的输入还输入中间域特征对齐模块D；

所述中间域特征提取模块F的输入为源域数据和目标域数据，中间域特征提取模块F用于提取两域数据的数据特征，得到源域特征和目标域特征，并将两域特征同时输入中间域对抗模块AD和中间域特征对齐模块D，以及将源域特征输入中间域分类模块C，通过与中间域分类模块C，中间域对抗模块AD和中间域特征对齐模块D的配合，完成中间域特征对齐；

所述中间域分类模块C根据源域数据标签对输入的源域特征进行分类处理，中间域分类模块C的损失为中间域分类损失L_C；

所述中间域对抗模块AD，用于对中间域特征提取模块F混淆的两域特征(源域特征和目标域特征)进行辨别，且所述中间域对抗模块AD的训练目的为：中间域对抗模块AD不能区分两域特征，并在反向传播时对梯度进行翻转，反向更新中间域对抗模块AD的网络参数；其中，中间域对抗模块AD的损失为中间域域对抗损失L_AD；

所述中间域特征对齐模块D为一个域分类器，用于对输入数据(中间域特征提取模块F输出的源域特征和目标域特征，以及源域特征编码器E^s和目标域特征编码器E^t的输出)进行域分类，所包括的域类别有：源域，中间域和目标域；从而实现源域特征和目标域特征在中间域进行对齐；其中，中间域特征对齐模块D的损失为中间域域判别损失L_D；

步骤S3：将源域数据和目标域数据分别输入源域重建特征提取模块和目标域重建特征提取模块，以及将源域数据和目标域数据同时输入中间域特征提取模块F；

并通过迭代训练使得源域重建特征损失L_s-recon，目标域重建特征损失L_t-recon收敛，中间域分类损失L_C，中间域域对抗损失L_AD和中间域域判别损失L_D收敛，得到训练好的深度网络模型；

步骤S4：基于训练好的深度网络模型的中间域特征提取模块F和中间域分类模块C组成分类网络；将目标域的待分类数据输入所述分类网络，基于其前向传播的输出得到分类结果。

进一步的，所述源域特征编码器E^s的依次包括：卷积层1、最大池化层1、卷积层2、最大池化层2、卷积层3和最大池化层3。

进一步的，所述中间域特征提取模块F包括至少三层卷积层，且每层卷积层后依次设置有批归一化层与最大池化层，每层卷积层采用非线性激活函数，并在第二层卷积层之后采用dropout防止过拟合。

进一步的，所述中间域分类模块C包括多层全连接层，在倒数第二层的全连接层后加入批归一化层，并通过dropout防止过拟合，最后一层全连接层采用Softmax函数进行分类输出。

进一步的，所述中间域对抗模块AD包括两层全连接层，在每一层全连接层后加入批归一化层，采用非线性激活函数作为激活函数，最后一层全连接层采用Softmax函数进行判别输出。

进一步的，所述中间域特征对齐模块D的网络结构与中间域分类模块C的网络结构相同。

本发明提供的技术方案至少带来如下有益效果：

(1)本发明提出了一种基于重建的中间域领域自适应方法，使用重建的方法对源域数据和目标域数据的特征进行提取，这样提取到的特征将包含更多的数据信息，具有更强的可辨别性。

(2)针对实际场景中两域之间直接对域差异最小化实现困难的问题，本发明通过在中间域对两域特征进行对齐，从而达到减轻特征对齐难度的目的，最终实现目标域数据的有效分类。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例提供的一种基于重建的中间域领域自适应方法的实现流程图。

图2是本发明实施例提供的一种基于重建的中间域领域自适应方法采用的深度网络模型的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

本发明实施例通过重建和对抗的方法将源域数据和目标域数据在中间域进行特征对齐，实现分类器对两域数据的准确分类。

参见图1，以处理图像分类为例，本发明实施例提供的一种基于重建的中间域领域自适应方法的具体处理过程包括：

步骤1：获得n个有标签源域数据集和m个无标签目标域数据集

即获取n个有标签的源域图像数据，m个无标签目标域数据，其中，定义表示源域的第i个数据(图像)，/>表示/>的图像分类标签，/>表示第j个目标域图像数据。

步骤2：构建深度网络模型，所述深度网络模型包括重建特征提取模块，中间域特征提取模块F，中间域分类模块C，中间域对抗模块AD和中间域特征对齐模块D，如图2所示；

步骤3：将源域数据和目标域数据分别输入源域重建特征提取模块和目标域重建特征提取模块，提取到源域数据和目标域数据的可辨别特征作为基准特征(即基准图像特征)，并且将源域数据和目标域数据同时输入中间域特征提取模块F，与中间域分类模块C，中间域对抗模块AD和中间域特征对齐模块D配合，提取到中间域特征(即中间域图像特征)；

步骤4：通过迭代训练使得源域重建特征损失L_s-recon，目标域重建特征损失L_t-recon收敛，中间域分类损失L_C，中间域域对抗损失L_AD和中间域域判别损失L_D收敛，从而在能对源域数据进行准确分类(图像分类)的前提下在中间域对齐领域特征；

步骤5：经过训练之后，将目标域数据输入由中间域特征提取模块F和中间域分类模块C组成的分类网络得到分类结果，以验证方法的有效性。

即，基于训练后的深度网络模型的中间域特征提取模块F和中间域分类模块C组成分类网络，对目标域的待分类的图像(无标签的图像数据)，将其输入到所述分类网络，基于其前向传播的输出得到分类结果。

本发明实施例中，所述深度网络模型包括重建特征提取模块，中间域特征提取模块F，中间域分类模块C，中间域对抗模块AD和中间域特征对齐模块D具有对应的损失函数，其中重建特征提取模块包括源域重建特征损失L_s-recon和目标域重建特征损失L_t-recon，通过重建特征提取模块可以提取到源域数据和目标域数据的可辨别信息，中间域分类模块C具有中间域分类损失L_C，通过中间域分类模块C可以对转移到中间域的源域数据进行分类，中间域对抗模块AD具有中间域域对抗损失L_AD，通过梯度翻转层与中间域特征提取模块F进行对抗训练，对两域数据进行混淆，而中间域特征对齐模块D具有中间域域判别损失L_D，通过中间域特征对齐模块D对源域数据，中间域数据和目标域数据进行判别实现中间域特征的对齐。而对于获取的源域D_s和目标域D_t，签源域数据目标域数据/>源域和目标域具有相同的特征空间，即X^s＝X^t，并且具有相同的类别空间，即Y^s＝Y^t，但是两域的边缘分布不同，即P^s(x^s)≠P^t(x^t)，方法训练分类器将利用源域数据知识对目标域数据进行有效分类。其中，X^s、X^t分别表示源域和目标域的图像特征空间，Y^s、Y^t分别表示源域和目标域的图像类别空间，P^s(x^s)、P^t(x^t)分别表示源域和目标域的边缘分布。

作为一种可能的实现方式，本发明实施例的深度网络模型的各部分具体设置为：

(1)重建特征提取模块。重建特征提取模块包括源域重建特征提取模块和目标域重建特征提取模块，而二者分别由源域特征编码器E^s，源域特征解码器D^s和目标域特征编码器E^t，目标域特征解码器D^t组成。

例如对应于手写数字数据集(图像类别取决于对应的数字，比如0～9分别作为一个识别类别)，网络结构设置选择使用浅层网络，当数据集更加复杂，可以选择使用深层网络。以源域特征编码器E^s为例具体网络结构为：卷积层1-最大池化层1-卷积层2-最大池化层2-卷积层3-最大池化层3，而源域特征解码器D^s与源域特征编码器E^s的网络结构设置完全相反，目标域部分则与源域部分完全相同。源域重建特征提取模块和目标域重建特征提取模块将维护源域重建特征损失L_s-recon和目标域重建特征损失L_t-recon，通过降低重建损失，即提取特征能尽可能重现输入数据特征，进而提取到源域数据和目标域数据的可辨别特征，本发明实施例将提取特征作为源域和目标域的基准特征。源域重建特征损失L_s-recon和目标域重建特征损失L_t-recon表达式分别为公式(1)和公式(2)。

其中，x^s、x^t分别表示源域数据和目标域数据，分别表示源域特征编码器E^s和源域特征解码器D^s的网络参数，/>分别表示目标域特征编码器E^t和目标域特征解码器D^t的网络参数，l_r()代表平方损失函数，f^s()和f^t()分别代表源域特征解码器D^s和目标域特征解码器D^t的输出。

(2)中间域特征提取模块F。中间域特征提取模块F负责将源域数据特征和目标域数据特征进行提取，得到源域特征F(X^s)和目标域特征F(X^t)，由于源域数据分布和目标域数据分布可能差别很大，直接对齐两域特征难度较大，本发明实施例选择将两域数据特征在中间域进行对齐，减小对齐的难度。将源域数据和目标域数据输入中间域特征提取模块F，模块在提取两域特征的同时将对两域特征进行混淆，与中间域分类模块C，中间域对抗模块AD和中间域特征对齐模块D配合，进而达到中间域特征对齐的目的。中间域特征提取模块F的深度网络结构采用三层卷积，三层卷积的卷积核尺寸分别为5×5，3×3，3×3，通道数分别为64，64，50，同时为了加快训练速度，在每层卷积之后使用Batch Normalization与最大池化层MaxPool进行归一化和特征提取，这样也能有效的减少参数量，并且在第二层卷积之后使用dropout以防止过拟合，使用ReLU函数作为激活函数进行非线性激活。

(3)中间域分类模块C。将中间域特征提取模块F提取到转移到中间域的源域特征输入中间域分类模块C，根据源域数据标签对转移到中间域的源域数据进行分类。中间域分类模块C的深度网络结构使用了三层全连接层，每层的通道数分别为100，100，10，即最后一层全连接层的通道数与预置的图像类别数对应，同样的在前两层全连接层之后加入BatchNormalization和dropout加快训练速度和防止过拟合，使用ReLU函数作为激活函数，最后使用Softmax函数进行分类，在使用Pytorch编程时直接使用CrossEntropyLoss损失，则可以不用显式调用Softmax函数。中间域分类损失L_C表达式为公式(3)。

其中，θ_F、θ_C分别表示中间域特征提取模块F和中间域分类模块C的网络参数，l_c()代表交叉熵损失函数，f^c()代表中间域分类模块C的输出，即属于各类别的概率，本实施中，具体指分类器Softmax输出。

(4)中间域对抗模块AD。中间域对抗模块AD与中间域特征提取模块F相配合，对中间域特征提取模块F混淆的两域特征进行辨别，而训练的目的就是使得中间域对抗模块AD不能区分两域特征，通过梯度翻转层，可以在反向传播时对(深度学习的)梯度进行翻转，进而反向更新对抗参数。中间域对抗模块AD的深度网络结构使用了两层全连接层，每层的通道数分别为100和2，并且在每层全连接层之后加入Batch Normalization，使用ReLU函数作为激活函数，同样使用交叉熵损失函数(CrossEntropyLoss)，最后使用Softmax函数进行判别。中间域域对抗损失L_AD表达式为公式(4)。

其中，x表示中间域对抗模块AD的输入数据，θ_F、θ_AD分别表示中间域特征提取模块F和中间域对抗模块AD的网络参数，f^ad()代表中间域对抗模块AD域判别器Softmax输出，和/>分别代表两域数据的领域标签，即源域和目标域。

(5)中间域特征对齐模块D。中间域特征对齐模块D负责把源域数据和目标域数据在中间域进行对齐，其本质上是一个域分类器。将源域重建特征E^s(x^s)，转移到中间域的源域特征F(x^s)，转移到中间域的目标域特征F(x^t)和目标域重建特征E^t(x^t)四类特征输入中间域特征对齐模块D，而该模块会将四类特征分为三个领域，即源域，中间域和目标域，通过中间域特征提取模块F对F(x^s)和F(x^t)进行混淆，中间域特征对齐模块D对领域进行判别，从而实现源域数据特征和目标域数据特征在中间域进行对齐。中间域特征对齐模块D的深度网络结构和中间域分类模块C的结构相似，只需把最后一层的输出种类改为3即可。中间域域判别损失L_D表达式为公式(5)。

其中，x表示中间域特征对齐模块D的输入数据，θ_F、θ_D分别表示中间域特征提取模块F和中间域特征对齐模块D的网络参数，f^d()代表中间域特征对齐模块D分类器Softmax输出，表示第个i数据x_i(图像)的数据标签，一共是k类，即三类，即用于输出当前数据的领域标签。

总体损失L_RMDAN表达式为公式(6)：

L_RMDAN＝L_s-recon+L_t-recon+L_C-L_AD+L_D (6)

作为一种可能的实现方式，本发明实施例将训练的迭代次数设为200，学习率μ＝1e3，学习率的衰减系数设为0.90，每两个epoch衰减一次，使用Adam优化器对模型进行更新训练。当满足预置的收敛条件时，得到训练好的深度网络模型，再基于此时的中间域特征提取模块F和中间域分类模块C组成分类网络，用于目标图像的图像分类处理。

本发明实施例提供的一种基于重建的中间域领域自适应方法，能用于计算机视觉、智能频谱数据分析等领域自适应领域。即本发明实施例提供的深度网络模型的输入数据除了图像数据，还可以是频谱数据，可以实现对频谱数据的分类处理。其处理过程与图像分类的处理过程相同，源域数据与目标数据均为采集的频谱数据，训练时，将对应的源域数据和频谱数据输入即可，再基于训练后的中间域特征提取模块F和中间域分类模块C构成频谱数据分类的分类网络，以便于将目标域的频谱数据输入该分类网络获取分类结果。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

以上所述的仅是本发明的一些实施方式。对于本领域的普通技术人员来说，在不脱离本发明创造构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

Claims

1.一种处理图像分类的基于重建的中间域领域自适应方法，其特征在于，包括下列步骤：

步骤S1：获取有标签的源域图像数据集D_s和无标签的目标域图像数据集D_t，其中，有标签源域图像数据集D_s的数据数量为n，每个图像数据定义为图像数据/>的图像类别标签定义为/>目标域数据集D_t的数据数量为m，且n、m为正整数；

所述目标域重建特征提取模块包括目标域特征编码器E^t和目标域特征解码器D^t，其输入数据为目标域图像数据；

其中，源域特征编码器E^s包括多个交替的卷积层与最大池化层，且源域特征解码器D^s的网络结构与源域特征编码器E^s镜像对称；标域特征编码器E^t与源域特征编码器E^s的网络结构相同，目标域特征解码器D^t与源域特征解码器D^s的网络结构相同；

所述中间域特征提取模块F的输入为源域图像数据和目标域图像数据，中间域特征提取模块F用于提取两域图像数据的数据特征，得到源域特征和目标域特征，并将两域特征同时输入中间域对抗模块AD和中间域特征对齐模块D，以及将源域特征输入中间域分类模块C，通过与中间域分类模块C，中间域对抗模块AD和中间域特征对齐模块D的配合，完成中间域特征对齐；

所述中间域分类模块C根据源域图像数据标签对输入的源域特征进行分类处理，中间域分类模块C的损失为中间域分类损失L_C；

所述中间域对抗模块AD，用于对中间域特征提取模块F混淆的两域特征进行辨别，且所述中间域对抗模块AD的训练目的为：中间域对抗模块AD不能区分两域特征，并在反向传播时对梯度进行翻转，反向更新中间域对抗模块AD的网络参数；其中，中间域对抗模块AD的损失为中间域域对抗损失L_AD；

所述中间域特征对齐模块D为一个域分类器，用于对输入数据进行域分类，中间域特征对齐模块D所包括的领域类别有：源域，中间域和目标域；其中，中间域特征对齐模块D的损失为中间域域判别损失L_D；

步骤S3：将源域图像数据和目标域图像数据分别输入源域重建特征提取模块和目标域重建特征提取模块，以及将源域图像数据和目标域图像数据同时输入中间域特征提取模块F；

步骤S4：基于训练好的深度网络模型的中间域特征提取模块F和中间域分类模块C组成分类网络，用于目标图像的图像分类处理；将目标域的待分类数据输入所述分类网络，基于其前向传播的输出得到分类结果。

2.如权利要求1所述的方法，其特征在于，所述源域重建特征损失L_s-recon和目标域重建特征损失L_t-recon的表达式分别为：

其中，x^s、x^t分别表示源域和目标域图像数据，分别表示源域特征编码器E^s和源域特征解码器D^s的网络参数，/>分别表示目标域特征编码器E^t和目标域特征解码器D^t的网络参数，l_r()表示平方损失函数，f^s()和f^t()分别表示源域特征解码器D^s和目标域特征解码器D^t的输出。

3.如权利要求1或2所述的方法，其特征在于，所述源域特征编码器E^s的依次包括：卷积层1、最大池化层1、卷积层2、最大池化层2、卷积层3和最大池化层3。

4.如权利要求1所述的方法，其特征在于，所述中间域特征提取模块F包括至少三层卷积层，且每层卷积层后依次设置有批归一化层与最大池化层，每层卷积层采用非线性激活函数，并在第二层卷积层之后采用dropout防止过拟合。

5.如权利要求1所述的方法，其特征在于，所述中间域分类损失L_C的表达式为：

其中，x^s表示源域图像数据，θ_F、θ_C分别表示中间域特征提取模块F和中间域分类模块C的网络参数，l_c()表示交叉熵损失函数，f^c()表示中间域分类模块C的输出。

6.如权利要求1或5所述的方法，其特征在于，所述中间域分类模块C包括多层全连接层，在倒数第二层的全连接层后加入批归一化层，并通过dropout防止过拟合，最后一层全连接层采用Softmax函数进行分类输出。

7.如权利要求1所述的方法，其特征在于，所述中间域域对抗损失L_AD的表达式为：

其中，x表示中间域对抗模块AD的输入数据，θ_F、θ_AD分别表示中间域特征提取模块F和中间域对抗模块AD的网络参数，l_c()表示交叉熵损失函数，f^ad()表示中间域对抗模块AD的输出，和/>分别源域和目标域图像数据的领域标签。

8.如权利要求1或7所述的方法，其特征在于，所述中间域对抗模块AD包括两层全连接层，在每一层全连接层后加入批归一化层，采用非线性激活函数作为激活函数，最后一层全连接层采用Softmax函数进行判别输出。

9.如权利要求1所述的方法，其特征在于，所述中间域域判别损失L_D的表达式为：

其中，x表示中间域特征对齐模块D的输入数据，θ_F、θ_D分别表示中间域特征提取模块F和中间域特征对齐模块D的网络参数，l_c()表示交叉熵损失函数，f^d()表示中间域特征对齐模块D的输出，表示第i个图像数据x_i的领域标签。

10.如权利要求1或9所述的方法，其特征在于，所述中间域特征对齐模块D的网络结构与中间域分类模块C的网络结构相同。