CN114494804A

CN114494804A - 一种基于域特有信息获取的无监督领域适应图像分类方法

Info

Publication number: CN114494804A
Application number: CN202210404117.0A
Authority: CN
Inventors: 斯小明
Original assignee: Wuhan Mingjie Technology Co ltd
Current assignee: Wuhan Mingjie Technology Co ltd
Priority date: 2022-04-18
Filing date: 2022-04-18
Publication date: 2022-05-13
Anticipated expiration: 2042-04-18
Also published as: CN114494804B

Abstract

本发明提供一种基于域特有信息获取的无监督领域适应图像分类方法，包括如下步骤，源域特有特征提取，域共享特征的提取，目标域特有特征提取，源域特征分离函数计算，目标域特征分离函数计算，源域分类损失函数计算，源域图像重建损失函数计算，源域鉴别器损失函数计算，目标域鉴别器损失函数计算，目标域图像重建损失函数计算，该基于域特有信息获取的无监督领域适应图像分类方法，能够分离域特有信息和域共享特征，并利用域共享特征实现信息迁移，能够降低域特有信息对图像分类结果的干扰。

Description

一种基于域特有信息获取的无监督领域适应图像分类方法

技术领域

本发明属于图像分类技术领域，特别涉及一种基于域特有信息获取的无监督领域适应图像分类方法。

背景技术

随着各种图像采集技术的发展，互联网上存在有大量的图像数据。然而，对这样大规模的数据进行标注代价十分昂贵，需要大量的人力物力。因此启发我们利用现有的标注数据，去辅助处理未标注数据的信息。无监督领域自适应图像分类方法，利用源域（有标注）数据训练网络模型，进而实现目标域（无标注）数据的无监督图像分类。例如利用打印数字，实现手写数字的识别，或者利用有标注的卡通画图像，实现无监督的真实图像分类等等。当然，无监督领域自适应方法不限于图像分类任务，其他计算机视觉任务，如目标分割，行人重识别等也可以作为无监督领域自适应学习的一个分支，为此，本发明提出一种基于域特有信息获取的无监督领域适应图像分类方法。

发明内容

为了解决现有技术存在的问题，本发明提供了一种基于域特有信息获取的无监督领域适应图像分类方法，该基于域特有信息获取的无监督领域适应图像分类方法，能够分离域特有信息和域共享特征，并利用域共享特征实现信息迁移，能够降低域特有信息对图像分类结果的干扰。

为了实现上述目的，本发明是通过如下的技术方案来实现：一种基于域特有信息获取的无监督领域适应图像分类方法，具体步骤如下：

步骤一：源域特有特征提取，对于源域特有分支，使用带标注的源域数据作为该分支的输入，使用ResNet-50网络作为该分支的特征提取网络，直接将最后一个卷积层的输出作为源域特征，以获得源域特有特征表示

；

步骤二：域共享特征的提取，对于共享网络分支，同时使用带标注的源域数据和无标注的目标域数据作为该分支的输入，用ResNet-50网络作为该分支的特征提取网络，直接将最后一个卷积层的输出作为源域和目标域特征，以获得源域和目标域的公共特征表示

和

；

步骤三：目标域特有特征提取，对于目标域特有分支，使用无标注的目标域数据作为该分支的输入，使用ResNet-50网络作为该分支的特征提取网络，直接将最后一个卷积层的输出作为目标域特征，以获得目标域特有特征表示

；

步骤四：源域特征分离函数计算，对于源域特有特征

和公共特征表示

，计算损失函数

，以确保共享网络和源域特有网络提取到的特征是不一致的；

步骤五：目标域特征分离函数计算，对于目标域特有特征

和公共特征表示

，计算损失函数

，以确保共享网络和目标域特有网络提取到的特征是不一致的；

步骤六：源域分类损失函数计算，对于源域特有特征表示

和公共特征

，进行名为A的融合，并将结果输入到分类器中，依赖源域数据标注，计算损失函数；

步骤七：源域图像重建损失函数计算，对于源域特有特征表示

和公共特征

，进行名为B的融合，并将结果输入到共享解码器中，解码出源域图像，利用图像重建损失进行监督；

步骤八：源域鉴别器损失函数计算，对于源域特有特征表示

和公共特征

，进行名为C的融合，并借助于鉴别器，鉴定特征融合后的结果是真还是假；

步骤九：目标域鉴别器损失函数计算，对于目标域特有特征表示

和公共特征

，进行名为D的融合，并借助于鉴别器，鉴定特征融合后的结果是真还是假；

步骤十：目标域图像重建损失函数计算，对于目标特有特征表示

和公共特征

，进行名为E的融合，并将结果输入到共享解码器中，解码出目标域图像，利用图像重建损失进行监督。

进一步的，所述步骤一至三采用ResNet-50作为源域和目标域的特征提取网络，但不局限于此，源域和目标域的特征提取网络并不需要完全一致，如可选用LeNet和AlexNet作为源域和目标域的特征提取网络。

进一步的，特征提取时，图像的输入维度为N*N，ResNet-50网络包括conv1_x、conv2_x、conv3_x、conv4_x和conv5_x五个卷积模块，其中conv2_x由3组相同的卷积结构构成，每组卷积结构为：1*1*64、3*3*64、1*1*256；conv3_x由4组相同的卷积结构构成，每组卷积结构为：1*1*128、3*3*128、1*1*512；conv4_x由6组相同的卷积结构构成，每组卷积结构为：1*1*256、3*3*256、1*1*1024；conv5_x由3组相同的卷积结构构成，每组卷积结构为：1*1*512、3*3*512、1*1*2048。

进一步的，所述步骤四和步骤五中的特征分离损失函数

的计算采用相似性度量，也可以利用F范数进行约束，即定义共享网络在源域和目标域上提取到的特征为

和

，每一行表示一个样本的特征，私有网络提取到的特征为

和

，则计算方式为：

通过这样的方式，函数取得最小值时，每一项为0，即两个网络提取到的特征不一致。

进一步的，所述步骤六中的源域分类损失函数的计算采用交叉熵损失函数，具体计算方式如下：

其中，m表示源域样本数量；

表示真实标签，

表示网络输出的预测标签分布，

表示融合A的输出。

进一步的，所述步骤七和步骤十中的图像重建损失函数的计算采用平均绝对误差（MAE）作为损失函数，具体计算方式如下：

其中

表示原图像，

表示重建图像，

表示图像中像素点个数。

进一步的，所述步骤八和步骤九中的对抗损失函数的计算采用传统生成对抗网络的优化目标函数，具体计算方式如下：

其中

表示分布函数的期望值，

表示域分类器，即鉴别器，G表示生成器，即特征提取器。

本发明的有益效果：

1、此基于域特有信息获取的无监督领域适应图像分类方法能够分离域特有信息和域共享特征，并利用域共享特征实现信息迁移，能够降低域特有信息对图像分类结果的干扰。

2、此基于域特有信息获取的无监督领域适应图像分类方法能够使用不同的源域和目标域特征提取网络，分别提取源域和目标域特征，能够实现更好地特征表示及提取。

3、此基于域特有信息获取的无监督领域适应图像分类方法通过引入重建损失和相似度损失，能够在保证提取到的特征有效性的基础上，有效分类域共有特征和域私有特征，从而将源域和目标域特征分布进行更好地对齐，实现更加鲁棒的特征迁移。

附图说明

图1为一种基于域特有信息获取的无监督领域适应图像分类方法的框架示意图；

图2为一种基于域特有信息获取的无监督领域适应图像分类方法的流程示意图。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体实施方式，进一步阐述本发明。

请参阅图1至图2，本发明提供一种技术方案：一种基于域特有信息获取的无监督领域适应图像分类方法，具体步骤如下：

步骤一：源域特有特征提取，对于源域特有分支，输入为有标注的源域数据，遵循常用的空间学习方法来提取图像特征，源域和目标域标签空间是一致的，形式上，给定带标注数据，即源域

，其中

分别表示源域中的数据和标签。其中，为方便计算，图像的维度放缩成N*N；

首先，将源域数据输入源域特有特征提取网络，为方便说明，采用ResNet-50作为源域和目标域的特征提取网络，但不局限于此，并且基于本发明的优势，源域和目标域的特征提取网络并不需要完全一致，如可选用LeNet、AlexNet等作为源域和目标域的特征提取网络，分别提取源域和目标域特征，可以实现更好地特征表示及提取；

图像的输入维度为N*N，本发明中，ResNet-50网络包括conv1_x、conv2_x、conv3_x、conv4_x和conv5_x五个卷积模块，其中conv2_x由3组相同的卷积结构构成，每组卷积结构为：1*1*64、3*3*64、1*1*256；conv3_x由4组相同的卷积结构构成，每组卷积结构为：1*1*128、3*3*128、1*1*512；conv4_x由6组相同的卷积结构构成，每组卷积结构为：1*1*256、3*3*256、1*1*1024；conv5_x由3组相同的卷积结构构成，每组卷积结构为：1*1*512、3*3*512、1*1*2048；

最终，得到维度为2048的源域特有特征

；

步骤二：域共享特征的提取，对于共享网络分支，输入为源域和目标域数据，遵循常用的空间学习方法来提取图像特征，形式上，给定带标注数据，即源域

，其中

分别表示源域中的数据和标签，给定无标注数据，即目标域

。其中，为方便计算，图像的维度放缩成N*N；

为方便说明，仍使用ResNet-50作为源域及目标域共享特征提取网络。最终，得到维度为2048的源域和目标域公共特征表示

和

；

步骤三：目标域特有特征提取，对于目标域特有分支，输入为无标注的目标域数据，遵循常用的空间学习方法来提取图像特征，给定无标注数据，即目标域

。其中，为方便计算，图像的维度放缩成N*N；

为方便说明，仍使用ResNet-50作为目标域特有特征提取网络。最终，本部分得到维度为2048的目标域特有特征表示

；

通过分离域特有信息和域共享特征，并利用域共享特征实现信息迁移，能够降低域特有信息对图像分类结果的干扰；

步骤四：源域特征分离函数计算，对于源域特有特征

和公共特征表示

，计算损失函数

步骤五：目标域特征分离函数计算，对于目标域特有特征

和公共特征表示

，计算损失函数

源域和目标域特征分离损失函数

和

，每一行表示一个样本的特征，私有网络提取到的特征为

和

，则计算方式为：

通过这样的方式，函数取得最小值时，每一项为0，即两个网络提取到的特征不一致；

步骤六：源域分类损失函数计算，对于源域特有特征表示

和公共特征

，进行名为A的融合，并将结果输入到分类器中，依赖源域数据标注，计算损失函数，源域分类损失函数的计算采用交叉熵损失函数，具体计算方式如下：

其中，m表示源域样本数量；

表示真实标签，

表示网络输出的预测标签分布，

表示融合A的输出；

和公共特征

，进行名为B的融合，并将结果输入到共享解码器中，解码出源域图像，利用图像重建损失进行监督，图像重建损失函数的计算采用平均绝对误差（MAE）作为损失函数，具体计算方式如下：

其中

表示原图像，

表示重建图像，

表示图像中像素点个数；

以融合B为例，融合后，得到维度为4096的特征，经过一层全卷积层，得到维度为2048维的融合特征，然后经过五个卷积模块，conv5_y、conv4_y、conv3_y 、conv2_y和conv1_y。其中conv5_y由3组相同的卷积结构构成，每组卷积结构为：1*1*2048、3*3*512、1*1*512；conv4_y由6组相同的卷积结构构成，每组卷积结构为：1*1*1024、3*3*256、1*1*256；conv3_y由4组相同的卷积结构构成，每组卷积结构为：1*1*512、3*3*128、1*1*128；conv2_x由3组相同的卷积结构构成，每组卷积结构为：1*1*256、1*1*64、3*3*64。再经过conv1_y后，得到维度为N*N的图像；

步骤八：源域鉴别器损失函数计算，对于源域特有特征表示

和公共特征

和公共特征

对于融合C、D，采用传统生成对抗网络的优化目标函数，具体计算方式如下：

其中

表示分布函数的期望值，

表示域分类器，即鉴别器，G表示生成器，即特征提取器；

在训练过程中，域分类器

试图去在类级别中分辨不同的域，生成器G，即特征提取器，试图去产生域不变的特征来迷惑判别器

，最终生成器G和判别器

会达到一个平衡，从而可以从G中获得更好的域不变特征；

和公共特征

，进行名为E的融合，并将结果输入到共享解码器中，解码出目标域图像，利用图像重建损失进行监督，图像重建损失函数的计算采用平均绝对误差（MAE）作为损失函数，具体计算方式如下：

其中

表示原图像，

表示重建图像，

表示图像中像素点个数；

通过引入重建损失和相似度损失，能够在保证提取到的特征有效性的基础上，有效分类域共有特征和域私有特征，从而将源域和目标域特征分布进行更好地对齐，实现更加鲁棒的特征迁移。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点，对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种基于域特有信息获取的无监督领域适应图像分类方法，其特征在于，具体步骤如下：

；

和

；

；

步骤四：源域特征分离函数计算，对于源域特有特征

和公共特征表示

，计算损失函数

步骤五：目标域特征分离函数计算，对于目标域特有特征

和公共特征表示

，计算损失函数

步骤六：源域分类损失函数计算，对于源域特有特征表示

和公共特征

和公共特征

步骤八：源域鉴别器损失函数计算，对于源域特有特征表示

和公共特征

和公共特征

和公共特征

2.根据权利要求1所述的一种基于域特有信息获取的无监督领域适应图像分类方法，其特征在于：所述步骤一至三采用ResNet-50作为源域和目标域的特征提取网络，但不局限于此，源域和目标域的特征提取网络并不需要完全一致，如可选用LeNet和AlexNet作为源域和目标域的特征提取网络。

3.根据权利要求2所述的一种基于域特有信息获取的无监督领域适应图像分类方法，其特征在于：特征提取时，图像的输入维度为N*N，ResNet-50网络包括conv1_x、conv2_x、conv3_x、conv4_x和conv5_x五个卷积模块，其中conv2_x由3组相同的卷积结构构成，每组卷积结构为：1*1*64、3*3*64、1*1*256；conv3_x由4组相同的卷积结构构成，每组卷积结构为：1*1*128、3*3*128、1*1*512；conv4_x由6组相同的卷积结构构成，每组卷积结构为：1*1*256、3*3*256、1*1*1024；conv5_x由3组相同的卷积结构构成，每组卷积结构为：1*1*512、3*3*512、1*1*2048。

4.根据权利要求1所述的一种基于域特有信息获取的无监督领域适应图像分类方法，其特征在于：所述步骤四和步骤五中的特征分离损失函数