CN116128047A

CN116128047A - 一种基于对抗网络的迁移学习方法

Info

Publication number: CN116128047A
Application number: CN202211579284.5A
Authority: CN
Inventors: 柴松; 靳婷; 黄宏杨; 田涛领; 白智元; 汪立伟
Original assignee: Southwest Minzu University
Current assignee: Southwest Minzu University
Priority date: 2022-12-08
Filing date: 2022-12-08
Publication date: 2023-05-16
Anticipated expiration: 2042-12-08
Also published as: CN116128047B

Abstract

本发明公开了一种基于对抗网络的迁移学习方法，属于机器学习技术领域，包括获取源域数据集和目标域数据集；分别利用标签1和标签0对应预标记源域数据集和目标域数据集中的样本图像；基于预标记后的样本图像，构建对抗迁移学习框架；基于对抗迁移学习框架，完成迁移学习；本发明通过引入对抗性学习从而实现对过拟合的抑制，解决了免由于目标任务的数据集不足而导致的过拟合问题的问题。

Description

一种基于对抗网络的迁移学习方法

技术领域

本发明属于机器学习技术领域，尤其涉及一种基于对抗网络的迁移学习方法。

背景技术

迁移学习是机器学习中的一个重要研究问题。它的目标是将源任务中学到的知识或模式应用到不同但相关的目标任务中。迁移学习的好处在于它可以将在大规模数据上训练的模型中学到的知识迁移到不同的任务场景中，以适应不同情况的需要。更重要的是，传统的模型训练依赖于大量的数据，但在某些情况下，数据不足是不可避免的，而迁移学习可以解决这个问题。鉴于迁移学习的诸多优点，它已广泛应用于文本分类、图像分类、语音识别和故障诊断等多个领域。

然而，迁移学习也面临一些问题，如灾难性遗忘和负迁移等等。针对灾难性遗忘，现有技术提出了DELTA和L2-SP等正则化方法，也有现有技术对负迁移进行了处理和解决，但当目标任务数据集极小时还面临严重的过拟合问题，且当前还缺少专门的研究。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于对抗网络的迁移学习方法，通过引入对抗性学习从而实现对过拟合的抑制，解决了由于目标任务的数据集不足而导致的过拟合问题。

为了达到上述发明目的，本发明采用的技术方案为：

本发明提供一种基于对抗网络的迁移学习方法，包括如下步骤：

S1、获取源域数据集和目标域数据集；

S2、分别利用标签1和标签0对应预标记源域数据集和目标域数据集中的样本图像；

S3、基于预标记后的样本图像，构建对抗迁移学习框架；

S4、基于对抗迁移学习框架，完成迁移学习。

本发明的有益效果为：本发明提供的一种基于对抗网络的迁移学习方法，提出了一种在目标任务数据集不足情况下的对抗迁移学习框架，由一个特征提取器、一个鉴别器和两个分类器组成，通过提取器和鉴别器之间的对抗性训练，取出更多的域不变特征，从而抑制了过拟合问题。

进一步地，所述步骤S3包括如下步骤：

S31、利用特征提取器提取源域数据集和目标域数据集中预标记后的各样本图像的图像特征；

S32、将各图像特征均分别传输至标签0分类器、标签1分类器和鉴别器；

S33、利用标签1分类器根据图像特征，得到源域分类损失；

S34、利用标签0分类器根据图像特征，得到目标域分类损失；

S35、利用鉴别器根据图像特征，得到判别损失，完成构建对抗迁移学习框架。

采用上述进一步方案的有益效果为：通过据样本的预标记标签，将提取出的图像特征发送到相应的分类器进行分类，得到最终的图像识别结果，实现对抗迁移学习框架的构建。

进一步地，所述鉴别器的计算表达式如下：

其中，||f||_L≤1表示鉴别器满足1-Lipschitz条件限制，

表示真实样本x在源域的边缘概率分布，

表示真实样本x在目标域的边缘概率分布，f(x)表示真实样本x的目标预测值。

采用上述进一步方案的有益效果为：提供鉴别器的计算表达式，相较于传统生成对抗网络更能精确计算距离，避免梯度消失和模式坍塌的问题。

进一步地，所述步骤S4包括如下步骤：

S41、将学习问题进行风险值最小化，并基于对抗迁移学习框架，得到源任务和目标任务的风险值；

S42、分别定义源任务和目标任务的损失为源任务经验风险值和目标任务经验风险值；

S43、基于源任务和目标任务的风险值，得到组合风险值；

S44、基于源任务经验风险值和目标任务经验风险值，得到组合风险的经验风险值；

S45、基于组合风险值和组合风险的经验风险值，完成迁移学习。

采用上述进一步方案的有益效果为：基于对抗学习框架通过加权分类代价值，计算得到组合风险值和组合风险的经验风险值，实现迁移学习。

进一步地，所述步骤S41中源任务和目标任务的风险值的计算表达式分别如下：

其中，x′表示特征空间X的样本图像，y′表示样本空间Y的样本图像，

和

分别表示源任务f^s和目标任务f^t的风险值，f^s和f^t分别表示源任务和目标任务的目标预测函数，

表示源任务在联合分布P_r(x′,y′)上的预测损失，

表示目标任务在联合分布P_r(x′,y′)上的预测损失，L(·)表示负对数似然损失函数。

进一步地，所述步骤S42中源任务经验风险值和目标任务经验风险值的计算表达式分别如下：

其中，loss_s和loss_t分别表示源任务经验风险值和目标任务经验风险值，

表示定义，

和

分别表示源任务和目标任务的损失，

和

分别表示源域数据集和目标域数据集的训练样本树，x′_i表示第i个特征空间X的样本图像输入，

和

分别表示源域数据集的第i个样本图像和目标域数据集的第i个样本图像。

进一步地，所述步骤S43中组合风险值的计算表达式如下：

其中，R_combined表示组合风险值，p((x′,y′)∈(X×Y^s))表示样本图像组(x′,y′)来自于特征空间X和源域数据集Y^s的概率，p((x′,y′)∈(X×Y^t))表示样本图像组(x′,y′)来自于特征空间X和目标域数据集Y^s的概率，w_s表示样本来自源域数据集的概率系数，w_t表示样本来自目标域数据集的概率系数。

进一步地，所述步骤S44中组合风险的经验风险值的计算表达式如下：

其中，loss_total表示组合风险的经验风险值，

表示总分类损失。

附图说明

图1为本发明实施例中基于对抗网络的迁移学习方法的步骤流程图。

图2为本发明实施例中对抗迁移学习框架的示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，在本发明的一个实施例中，本发明提供一种基于对抗网络的迁移学习方法，包括如下步骤：

S1、获取源域数据集和目标域数据集；

所述源域数据集中的样本图像采用标签1预标记，目标域数据集中的样本图像采用标签0预标记；

S3、基于预标记后的样本图像，构建对抗迁移学习框架；

如图2所示，所述步骤S3包括如下步骤：

S33、利用标签1分类器根据图像特征，得到源域分类损失；

S34、利用标签0分类器根据图像特征，得到目标域分类损失；

S35、利用鉴别器根据图像特征，得到判别损失，完成构建对抗迁移学习框架；

所述鉴别器的计算表达式如下：

其中，||f||_L≤1表示鉴别器满足1-Lipschitz条件限制，

表示真实样本x在源域的边缘概率分布，

表示真实样本x在目标域的边缘概率分布，f(x)表示真实样本x的目标预测值；

S4、基于对抗迁移学习框架，完成迁移学习；

所述步骤S4包括如下步骤：

所述步骤S41中源任务和目标任务的风险值的计算表达式分别如下：

和

表示源任务在联合分布P_r(x′,y′)上的预测损失，

表示目标任务在联合分布P_r(x′,y′)上的预测损失，L(·)表示负对数似然损失函数；

所述步骤S42中源任务经验风险值和目标任务经验风险值的计算表达式分别如下：

表示定义，

和

分别表示源任务和目标任务的损失，

和

分别表示源域数据集和目标域数据集的训练样本树，x_i′表示第i个特征空间X的样本图像输入，y_i′^s和y_i′^t分别表示源域数据集的第i个样本图像和目标域数据集的第i个样本图像；

S43、基于源任务和目标任务的风险值，得到组合风险值；

所述步骤S43中组合风险值的计算表达式如下：

其中，R_co_mbined表示组合风险值，p((x′,y′)∈(X×Y^s))表示样本图像组(x′,y′)来自于特征空间X和源域数据集Y^s的概率，p((x′,y′)∈(X×Y^t))表示样本图像组(x′,y′)来自于特征空间X和目标域数据集Y^s的概率，w_s表示样本来自源域数据集的概率系数，w_t表示样本来自目标域数据集的概率系数；

所述步骤S44中组合风险的经验风险值的计算表达式如下：

其中，loss_to_tal表示组合风险的经验风险值，

表示总分类损失；

本实施例中使用EMNIST数字数据集作为源域，并使用EMNIST字母数据集作为目标域，数字数据集中每个类的样本数固定在1000，在字母数据集中，每个类的样本数量取值有5种情况，分别为20、50、100、150和200；

本实施例中对抗迁移学习框架的目标是通过大量的手写数字样本来提高少样本情况下的手写字母识别性能；为了评估本方法的性能，本实施例中将试验结果与几种流行的算法进行了比较，包括基线、微调、普通的对抗网络以及BSS；本实施例中采用的基线模型是直接在手写字母数据集上进行训练的；

不同模型在字母数据集样本量不同情况下的训练结果如表1所示：

表1

根据表1能够得到，在不同的样本量下，本发明所提出的对抗迁移学习框架的性能都优于其他四种比较模型，这表明，当目标任务的数据集非常小时，本发明所提出的对抗迁移学习框架能够抑制过拟合问题；此外，随着字母数据集样本量的减小，本方案的优势变得越来越明显。特别是当每个类的样本数为20时，本方案提出的迁移学习框架与其他比较模型的准确率差异最大。

Claims

1.一种基于对抗网络的迁移学习方法，其特征在于，包括如下步骤：

S1、获取源域数据集和目标域数据集；

S3、基于预标记后的样本图像，构建对抗迁移学习框架；

S4、基于对抗迁移学习框架，完成迁移学习。

2.根据权利要求1所述的一种基于对抗网络的迁移学习方法，其特征在于，所述步骤S3包括如下步骤：

S33、利用标签1分类器根据图像特征，得到源域分类损失；

S34、利用标签0分类器根据图像特征，得到目标域分类损失；

3.根据权利要求2所述的一种基于对抗网络的迁移学习方法，其特征在于，所述鉴别器的计算表达式如下：

其中，||f||_L≤1表示鉴别器满足1-Lipschitz条件限制，

表示真实样本x在源域的边缘概率分布，

4.根据权利要求3所述的一种基于对抗网络的迁移学习方法，其特征在于，所述步骤S4包括如下步骤：

S43、基于源任务和目标任务的风险值，得到组合风险值；

5.根据权利要求4所述的一种基于对抗网络的迁移学习方法，其特征在于，所述步骤S41中源任务和目标任务的风险值的计算表达式分别如下：

和

表示源任务在联合分布P_r(x′,y′)上的预测损失，

6.根据权利要求5所述的一种基于对抗网络的迁移学习方法，其特征在于，所述步骤S42中源任务经验风险值和目标任务经验风险值的计算表达式分别如下：

表示定义，

和

分别表示源任务和目标任务的损失，

和

分别表示源域数据集和目标域数据集的训练样本树，x_i′表示第i个特征空间X的样本图像输入，y_i′^s和y_i′^t分别表示源域数据集的第i个样本图像和目标域数据集的第i个样本图像。

7.根据权利要求6所述的一种基于对抗网络的迁移学习方法，其特征在于，所述步骤S43中组合风险值的计算表达式如下：

其中，R_co_mbined表示组合风险值，p((x′,y′)∈(X×Y^s))表示样本图像组(x′,y′)来自于特征空间X和源域数据集Y^s的概率，p((x′,y′)∈(X×Y^t))表示样本图像组(x′,y′)来自于特征空间X和目标域数据集Y^s的概率，w_s表示样本来自源域数据集的概率系数，w_t表示样本来自目标域数据集的概率系数。

8.根据权利要求7所述的一种基于对抗网络的迁移学习方法，其特征在于，所述步骤S44中组合风险的经验风险值的计算表达式如下：

其中，loss_total表示组合风险的经验风险值，

表示总分类损失。