CN111275092B

CN111275092B - 一种基于无监督域适应的图像分类方法

Info

Publication number: CN111275092B
Application number: CN202010051470.6A
Authority: CN
Inventors: 徐增林; 陈迪
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2020-01-17
Filing date: 2020-01-17
Publication date: 2022-05-13
Anticipated expiration: 2040-01-17
Also published as: CN111275092A

Abstract

本发明公开一种基于无监督域适应的图像分类方法，包括：选取有标签的源域图像数据集和无标签的目标域图像数据集，并进行数据增广；构造对抗迁移网络减少源域图像数据集和目标域图像数据集条件分布的差异性；构造时序集成网络正则化目标域图像数据集中图像标签的预测结果；将对抗迁移网络、时序集成网络进行联合，构造图像分类模型；将增广后的图像数据集做为训练集，采用元学习的方式对图像分类模型进行训练；用训练后的图像分类模型对待分类的目标图像进行识别，完成目标图像分类。本发明在面向网络上海量图像数据分类的过程中，极大减少了人力标注数据，且不影响图像分类的准确率，用户能快速准确地从海量图像数据中搜索到所需要的图像。

Description

一种基于无监督域适应的图像分类方法

技术领域

本发明涉及图像识别技术领域，特别是涉及一种基于无监督域适应的图像分类方法。

背景技术

随着数码产品极易智能移动终端设备的普及，存储设备以及计算机网络的发展，每天网络上面新增数以亿计的海量图像数据，这些图像数据中蕴含着大量宝贵的信息，不加以合理地利用明显是一种极大的浪费。然而面对浩瀚庞大的图像数据库，如何将图像进行快速准确地分类，得到用户要搜索的图像结果，成为了科研以及商业领域迫切需要解决的问题。当今许多人工智能技术在网络图像的分类识别领域取得了巨大成就，但是这些人工智能技术均依赖于大量的标注，而标注大量数据的过程对劳动者来说非常艰辛，且成本极为昂贵，甚至是不可行的。

鉴于以上原因，在面向海量网络图像数据的分类过程中，如何减少标注量，且在减少标注量的同时又不影响模型的分类准确率成为当下急需解决的一个问题。

发明内容

本发明的目的是提供一种基于无监督域适应的图像分类方法，以解决上述现有技术存在的问题，能够有效减少数据的标注量且不影响图像分类的准确率。

为实现上述目的，本发明提供了如下方案：本发明提供一种基于无监督域适应的图像分类方法，包括如下步骤：

S1、选取源域图像数据集和目标域图像数据集；所述源域图像数据集中的图像数据有标签，所述目标域图像数据集中的图像数据无标签；

S2、对所选取的源域图像数据集和目标域图像数据集进行数据增广；

S3、构造对抗迁移网络，通过对抗迁移网络减少源域图像数据集和目标域图像数据集条件分布的差异性；

S4、构造时序集成网络，通过时序集成网络来正则化目标域图像数据集中图像标签的预测结果；来正则化目标域图像数据集中图像标签的预测结果；

S5、将步骤S3所构造的对抗迁移网络、步骤S4所构造的时序集成网络进行联合，构造图像分类模型；将步骤S2增广后的图像数据集做为训练集，采用元学习的方式对图像分类模型进行训练；

S6、采用步骤S5训练后的图像分类模型对待分类的目标图像进行识别，完成目标图像的分类。

优选地，步骤S2中数据增广方式采用随机增广，包括：随机旋转、随机水平翻转、随机竖直翻转、随机仿射变换、高斯噪声。

优选地，步骤S3中，对抗迁移网络的损失函数

如式1所示：

其中，N_s表示源域图像数量，N_t表示目标域图像数量；

表示源域的域标签，设为0；

表示目标域的域标签，设为1；G_d(·)表示判别器网络；g(·)表示梯度反转层；G_f(·)表示生成器网络，生成器网络为普通的卷积神经网络CNN；h(·)为数据增广操作；θ_m为生成器网络的参数，并将G_f(·；θ_m)定义为学生网络；

为源域图像的真实标签，

为目标域图像的伪标签，

表示克罗内克积。

优选地，步骤S4中，时序集成网络正则化项

如式2所示：

其中，M表示时序集成网络包括M组神经网络，即M个子任务；G_f(·)表示生成器网络，

表示第m组神经网络的参数，并将

定义为老师网络。

优选地，步骤S4中，在神经网络的训练过程中，θ_m通过标准地反向传播进行更新，

通过式3进行更新：

其中，α表示平滑系数，t表示第t个训练步骤。

优选地，步骤S5中，学生网络参数的更新方法如式4所示：

其中，

和

分别表示源域图像和目标域图像经过随机增广后得到的特征值；Y^s表示源域图像的标签集；β表示元学习元训练过程学习率；λ表示可调节的超参数；

表示对抗损失函数；

表示源域图像的标签损失函数，

具体表达方式如式5所示：

优选地，更新后的神经网络参数均采用时序集成网络正则化项

来进行约束，优化后元学习的损失函数

如式6所示：

其中，η表示可调节的超参数。

本发明公开了以下技术效果：

(1)本发明通过域适应技术能够减少有标签的源域数据和无标签的目标域数据之间数据分布的差异，从而能够将借助于源域数据训练的模型应用在无标注信息的目标域上，因此，在面向网络上海量图像数据的分类过程中，极大减少了人力标注数据；

(2)本发明包含了两个主要的子网络：一个子网络在基于标注的条件分布特征上引入了对抗训练的过程；另一个子网络用一个时序集成网络作为正则项来约束不含标注信息的目标域图像数据集上标注信息的预测结果；因此，本发明一方面可以学习到源域图像数据集与目标域图像数据集之间数据分布的差异性，另一方面能够从有标签信息的源域图像数据集到无标签信息的目标域图像数据集，正则化约束标注信息预测结果的一致性；同时，本发明提出了一种基于元学习的训练方法来避免负迁移，从而能使图像分类模型朝着域迁移和标签映射的方向上进行稳定地训练，能够有效保证网络上海量图像数据分类的准确性，从而用户能够快速搜索到所需要的图像。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明基于无监督域适应的图像分类模型结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图1所示，本实施例提供一种基于无监督域适应的图像分类方法，包括如下步骤：

S1、从网络搜索引擎中选取源域图像数据集X^s和目标域图像数据集X^t；所述源域图像数据集X^s中的图像数据有标签，所述目标域图像数据集X^t中的图像数据无标签。

S2、对源域图像数据集X^s和目标域图像数据集X^t分别进行M组数据增广，得到增广后的图像数据集

其中，

和

是由X^s和X^t经过相同的数据增广操作得到的，

和

是由X^t经过不同的数据增广操作得到的。

数据增广方式采用随机增广h(·)，包括：随机旋转、随机水平翻转、随机竖直翻转、随机仿射变换、高斯噪声。

S3、构造对抗迁移网络，通过对抗迁移网络减少源域图像数据集和目标域图像数据集条件分布的差异性；对抗迁移网络的损失函数

如式(1)所示：

其中，N_s表示源域图像数量，N_t表示目标域图像数量；

表示源域的域标签，设为0；

为源域图像的真实标签，

为目标域图像的伪标签，

表示克罗内克积。

S4、构造一组时序集成网络，通过时序集成网络来正则化目标域图像数据集中图像标签的预测结果；时序集成网络正则化项

如式(2)所示：

表示第m组神经网络的参数，并将

定义为老师网络。

在神经网络的训练过程中，θ_m通过标准地反向传播进行更新，

通过式(3)进行更新：

其中，α表示平滑系数，t表示第t个训练步骤。

学生网络参数的更新方法如式(4)所示：

其中，

和

分别表示源域图像和目标域图像经过随机增广后得到的特征值；Y^s表示源域图像的标签集；β表示元学习元训练过程学习率；γ表示可调节的超参数；

表示对抗损失函数；

表示源域图像的标签损失函数，

具体表达方式如式(5)所示：

为了使图像标签的预测信息从源域到目标域传递地更为稳定，保证每一个更新后的学生模型和时序集成后的老师模型预测结果一致，本发明对每一个更新后的神经网络参数θ′_m都采用

来作为正则项约束，优化后元学习的损失函数

如式(6)所示：

其中，η表示可调节的超参数。

在本发明的描述中，需要理解的是，术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

以上所述的实施例仅是对本发明的优选方式进行描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案做出的各种变形和改进，均应落入本发明权利要求书确定的保护范围内。