CN113420775B

CN113420775B - 基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法

Info

Publication number: CN113420775B
Application number: CN202110346275.0A
Authority: CN
Inventors: 潘杰; 陈宁宁; 邹筱瑜
Original assignee: China University of Mining and Technology CUMT
Current assignee: China University of Mining and Technology CUMT
Priority date: 2021-03-31
Filing date: 2021-03-31
Publication date: 2024-03-29
Anticipated expiration: 2041-03-31
Also published as: CN113420775A

Abstract

本发明公开了一种基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法，该方法从其它相关领域迁移知识到目标域，解决深度学习图片分类可训练标签样本少的问题。该方法综合考虑同类别分布差异和不同类别分布差异，领域适应过程中在减小同类别分布差异的基础上增大不同类别分布差异，既增加了源域和目标域同类别的可迁移性，又增加了源域和目标域不同类别间的可辨别性，并且应用最大均值差异缩小源域和目标域的边缘概率分布差异。该方法通过神经元非线性度可变的自适应寻找更适合任务的网络结构，优化了网络结构，提高领域适应能力和泛化能力，从而保证了最终的图片识别的分类精度。

Description

基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法

技术领域

本发明属于深度学习图片分类领域，特别是涉及了基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法。

背景技术

随着移动设备和计算机硬件的大幅度提升，以及互联网的普及。每天都有大量数据被收集。在利用大数据面前，机器学习取得很大进展，成为大数据挖掘信息的主要技术手段。在处理文本、图像、视频等非结构数据方面，一个至关重要的问题就是如何有效的利用来自不同领域的数据，对相关领域的数据迁移和复用。例如，人学会骑自行车之后，对于电动车和摩托车很容易掌握。如何迁移骑自行车的技术知识到电动车和摩托车上，以及如何学习到三种工具的不同之处，更快地掌握新工具。在互联网领域可以很容易得到大量有类别标签的高分辨率图像，但是在实际生活中所产生的图像像素低并且很难获取所有图像的类别，现有的机器学习方法很难取得很好的分类精度。将互联网领域所产生的大数据迁移到实际生活中的小领域数据，解决实际生活中数据标签获取难的问题，迁移学习为利用大数据解决小数据问题提供有效方法。

目前，依靠大规模训练样本和高性能硬件资源，卷积神经网络(ConvolutionalNeural Networks,CNN)在物体的识别与检测方面取得巨大成功。在机器学习的基本假设下，样本被用来训练分类器，以便对未知类别的样本进行分类，只有当测试样本与训练样本的分布相同时，学习器才能很好地工作。而在现实世界中，并不能保证语义相似的数据具有相同的特征分布。不同的采样环境，如分辨率、光照、背景等，会导致不同的分布，进而造成数据偏差与领域漂移。在训练和测试数据分布不同的情况下学习一个判别模型成为迁移学习。为了解决样本空间的特定分布，至少需要获取一些信息。通常可以从待分类目标域收集未标记数据，但是标签很难获得，或者仅有少量标签。但是，目标域数据可以学习到源域和目标域之间的不同之处，可以利用这些信息使分类器适应目标域，避免受域分布不同造成对结果的影响，以便更好的预测目标域标签。

基于以上理论，领域适应已经被广泛应用于很多现实问题中。在自然语言处理方面例如，由长文本数据学习处理短文本数据；由中文文档到英文文档等。在计算机视觉方面学习从公共数据集(Amazon、Dslr等)学习分类模型，并且迁移到生活中手机所拍摄的照片分类上。在医疗领域对，对数据的标记代价极其高，并且数据十分宝贵，例如应用多源医疗信息给出全面诊断等。

领域自适应分为浅层领域自适应和深度领域自适应。根据迁移学习的方法可以分为以下几种：基于实例的迁移是把源域中的有用样本挑选到目标域训练集中扩大样本训练集。基于特征表示迁移学习方法是把源域的实例通过特征变换映射到目标域，或者将源域和目标域的实例映射到一个子空间，目的是让源域和目标域之间的特征正分布尽量减少从而达到扩增目标域数据量的目的。基于参数的迁移学习方法是把源域模型训练的参数作为目标域模型训练的初始值从而可以训练出更好的模型。另外还有关系型知识的迁移学习方法和混合迁移学习方法等。

本专利中所提出的方法具体应用背景为存在其它领域标签图片辅助目标域少量训练样本下的图片分类问题，解决使用少量样本在避免网络过拟合的情况下学习图片分类网络。可训练样本的稀疏性，会导致传统的机器学习方法出现严重过的拟合过拟合问题，换而言之，就是学习到的分类网络只是在训练集上表现很好在测试集上结果很差。虽然一些传统的半监督学习、主动学习等也为数据的稀缺性提供了有效方法，但是他们都需要目标域有一定程度的标记数据。如果标记数据的获取代价太大，如何从不同领域中迁移知识将变得不可避免。

以前的深度领域自适应方法主要学习全局域偏移，比如DDC和D-CORAL通过在Alexnet网络的基础上加领域适应层和领域混淆损失，DAN在全连接层上使用MK-MMD减小领域分布差异，DANN通过加入域分类器增强网络的领域适应能力。MADA通过在每种类别上加入域分类器更好的提高领域适应能力。DSAN通过利用每次训练输出的伪标签减小源域和目标域每种类别的MMD损失提高领域适应效果。

但是上述方法没有综合考虑可迁移性与可辨别性以及全局和子域的互补来提高领域适应网络的能力，以及网络结构对结果的影响。目前的深度领域适应方法主要学习全局领域偏移，即对齐源域和目标域的全局分布，没有考虑领域间同一类别分布差异，无法捕获到类别信息。本发明解决了全局领域适应造成子域分布过于相近无法准确分类的问题。并且网络能够自适应调整选择更优的领域适应网络结构，从而直接或间接影响模型的分类精度和泛化能力。深入考虑子域领域适应的迁移性与可辨别性，以及领域适应网络结构的自适应变化。提出了一种新的基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法。

发明内容

本发明的目的在于解决图片标签获取难，待分类目标域仅存在极少量的带标签图片的图片分类问题，提供一种基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法，能从其它相关领域的对应图片类别学习知识。

本发明通过以下技术方案来实现：一种基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法，包括以下步骤：

(1)获取数据：读取源域和目标域图片，将图片分为源域样本、有标签目标域样本、待分类目标域样本；

(2)提取并处理步骤(1)所获取的图片样本的特征，得到源域图片特征和目标域图片特征X；有标签数据的标签信息Y；

(3)非线性度自适应子域领域适应网络搭建；包括神经元非线性度可变层和神经元非线性度固定层；其中，前三层为神经元非线性度可变层，第四层为神经元非线性度固定层，第五层为类别输出层；

(4)对步骤(3)搭建的非线性度自适应子域领域适应网络进行训练：

(4.1)初始化网络参数，输入步骤(2)处理所得的源域图片特征和目标域图片特征X和有标签数据的标签信息Y，通过领域适应网络数据的前向传播计算源域和目标域图片同类别和不同类别间的特征分布差异、源域和目标域图片特征的边缘概率分布差异以及有标签数据的交叉熵损失；

(4.2)根据领域适应网络神经元非线性度计算所有非线性可变神经元参数的和；

(4.3)计算领域适应网络的总损失函数；根据步骤(4.1)所得源域和目标域之间的特征分布差异以及步骤(4.2)所得神经元非线性度，对领域适应网络的第四层输出的图片特征计算最大均值差异，通过减小最大均值差异来减小源域和目标域之间的特征分布差异；

(4.4)领域适应网络的参数更新；

(4.5)重复步骤(4.1)、(4.2)、(4.3)、(4.4)直到网络迭代次数达到设定迭代次数，取最后一次迭代的网络参数θ(ω,b,g)；

(4.6)训练结束，网络参数θ(ω,b,g)固定不再更新；

(5)在训练好的非线性度自适应子域领域适应网络中输入待分类目标域图片样本的特征矩阵X_Tn，用该网络的第五层输出，利用softmax计算样本所属概率最大的类别即为图片的预测类别。

进一步的，所述步骤(1)包括以下步骤：

(1.1)将所有图片都转换为224×224尺寸；每张图片转换为RGB三通道，转换为v×h×o的三维矩阵，v和h分别为图像的宽和高，o为通道数；

(1.2)源域图片转换成n_S×v×h×o的四维矩阵数据，n_S表示源域样本数；目标域少量带标签数据转换成n_Tl×v×h×o的四维矩阵数据，n_Tl表示有标签目标域样本数；待分类目标域图片转换成n_Tn×v×h×o的四维矩阵数据，n_Tn表示目标域待分类样本数；

(1.3)图片类别用one-hot编码，图片共有N类，则第一类的标签表示[1,0,0,...,0]_1×N,第二类的标签表示为[0,1,0,...,0]_1×N，…，第N类图片的标签表示为[0,0,0,...,1]_1×N。

进一步的，所述步骤(2)包括以下步骤：

(2.1)特征提取网络的训练：采用ImageNet对ResNet网络进行预训练，获得ResNet残差网络模型，再用步骤(1)所得源域数据训练ResNet残差网络模型，ResNet网络的输入为batch_size×v×h×o的矩阵，batch_size的大小取决于计算机内存；

(2.2)图片特征提取：ResNet残差网络训练完成后保留第一层全连接层和卷积层的所有参数，ResNet网络的第一层全连接层作为特征输出层，然后使用该网络提取源域和目标域的图片特征；提取的源域图片特征为少量带标签目标域图片特征为待分类目标域图片特征为/>

(2.3)图片特征标准化处理：在(2.2)步骤之后对提取的源域图片特征和目标域图片特征进行标准化处理：

设矩阵X内任意一点的变量为X_ij，对该变量进行减均值除标准差处理，标准化的处理计算公式如下：

其中，是矩阵X第j列的均值，σ_j是矩阵第j列的标准差，X_ij'表示标准化处理后的特征矩阵；

其中，

其中，I表示矩阵总行数；

将特征矩阵X标准化之后，得到每列均值是0，方差为1的源域数据矩阵少量带标签目标域数据矩阵为/>待分类目标域数据矩阵为/>分别把标准化后的有标签图片特征处理为/>图片标签处理为其中，上标1～N代表类别，下标S、Tl、Tn分别表示源域图片、目标域有标签图片、目标域待分类图片；然后将源域图片特征和目标域图片特征处理为有标签数据标签为/>

进一步的，步骤(3)所述神经元非线性度可变层中，固定每层神经元个数为2048，为了使前三层网络能够自适应改变神经元非线性度寻找在当前任务下最优网络，为领域适应网络每个神经元设定一个参数g∈[0,1]，这个参数决定了这个神经元作非线性程度，以及它在不进行任何变换的情况下将输入直接作为输出的程度；前三层每层之间的计算公式为：

y(x)＝g*σ(ω^Tx+b)+(1-g)*x (4)

g作为一个权重参数表示神经元在恒等变换和非线性变换的选择；如果g＝0表示这个神经元完全复制输入到输出，如果g＝1表示这个神经元利用权重ω偏置b和激活函数σ对输入进行非线性变换；g初始化为0，如果在网络的学习过程中它的值变大则表示非线性单元发挥作用，网络也更加复杂，为避免网络过于复杂给g加一个正则化项；

第三层到第四层的计算公式为：

y(x)＝σ(ω^Tx+b) (5)

所述领域适应网络的第四层为神经元非线性度固定层，固定神经元个数为1000，第四层转换后每张图片的特征维度为1000，在第四层计算源域图片特征分布和目标域图片特征分布是否相同；在该层用MK-MMD计算源域图片特征分布和目标域图片同类别分布差异，以及源域图片特征分布和目标域图片特征分布不同类别间的差异，并且计算源域图片特征和目标域图片特征的边缘概率分布差异；第四层到第五层的计算公式为：

y(x)＝ω^Tx+b (6)

所述领域适应网络的第五层为类别输出层，神经元个数等于图片类别数，训练阶段用第五层输出，用softmax函数计算图片属于每种类别的概率，然后计算交叉熵分类损失；预测待分类样本阶段则用softmax函数计算所属类别。

进一步的，所述步骤(4.1)包括以下步骤：

网络参数初始化，将步骤(2)处理所得的源域图片特征和目标域图片特征X和有标签数据的标签信息Y输入网络，设第四层的网络输出为Z；

(4.1.1)计算源域和目标域图片同类别图片特征分布差异：对网络的第四层输出Z，选取源域的第c类和有标签目标域的第c类计算MK-MMD，计算完所有类别相加然后除以类别数C；具体计算公式为：

式中C表示类别数，表示源域c类别样本数目，/>表示有标签目标域c类别样本数；H表示希尔伯特空间，/>表示源域特征经网络变换后第四层输出的c类第i个样本特征，表示有标签目标域特征经网络变换后第四层输出的c类第j个样本特征，/>表示第四层输出的源域的c类别样本特征，/>表示第四层输出的有标签目标域的c类别样本特征；

第四层的输出为1000维，前四层对图片特征总体而言为特征降维操作，目标是通过减小同类图片的特征分布差异，学习源域和目标域同类图片的域不变特征；

(4.1.2)计算源域和目标域图片不同类别间的特征分布差异：对网络的第四层输出Z，选取源域的第c类和有标签目标域除第c类以外的其它类别计算MK-MMD，计算完所有类别求和然后除以MK-MMD的计算次数，具体计算公式为：

其中式中C表示类别数，表示源域/>类别样本数目，/>表示有标签目标域c类别样本数；H表示希尔伯特空间，/>表示源域特征经网络变换后第四层输出的/>类第i个样本特征，/>表示有标签目标域特征经网络变换后第四层输出的c类第j个样本特征，/>表示第四层输出的源域的/>类别样本特征，/>表示第四层输出的有标签目标域的c类别样本特征；

在保证步骤(4.1.1)源域和目标域同类别图片特征分布差异较小的前提下，尽量增大源域和目标域图片不同类别间的特征分布差异，以保证在前四层学习同类域不变特征的同时不会丢失图片类别信息；

(4.1.3)计算源域和目标域图片特征的边缘概率分布差异：利用有标签目标域和待分类目标域分布相同的条件，通过步骤(4.1.1)和(4.1.2)学习到源域和目标域的域不变特征以及类别信息；因为最终是进行待分类目标域的标签预测，所以最大限度利用所有目标域信息非常重要，因此减小源域和目标域的边缘概率分布差异，具体计算公式为：

其中n_s表示源域样本数，n_t表示目标域样本数；H表示希尔伯特空间，表示源域特征经网络变换后第四层输出的第i个样本特征，/>表示目标域特征经网络变换后第四层输出的第j个样本特征；

(4.1.4)计算有标签数据的交叉熵损失：领域适应网络最终输出为该图片的属于每种类别概率，网络学习的目的就是让正确类别的概率最大；前四层的仅能学习到源域和目标域的域不变特征以及域类别信息，因此第五层网络的输出的经softmax函数计算出每种类别概率和真实标签one-hot编码的交叉熵损失尤为重要，具体计算公式为：

其中，y表示图片的真实类别one-hot编码，表示网络预测图片属于每种类别的概率，S∪Tl表示源域和有标签目标域，/>表示源域和有标签目标域第i个样本，/>表示源域和有标签目标域第i个样本的标签，通过减小交叉熵损失让网络输出类别概率最大标签对应图片的真实标签。

进一步的，所述步骤(4.2)中神经元非线性度的取值为[0,1],计算所有非线性可变神经元参数的和，具体计算公式为：

其中m表示神经元可变层，k表示第m层的可变神经元，g_k表示该神经元的非线性度，L表示神经元非线性度可变层层数，l表示第m层的神经元个数。

在完成领域适应任务的同时减小网络的非线性度防止过拟合，实现领域适应网络结构自适应，解决手动调节领域适应网络结构的问题。

进一步的，所述步骤(4.3)包括以下步骤：

(4.3.1)源域和有标签目标域样本之间的子域类内分布差异MK-MMD损失L_inter不断减小；

(4.3.2)源域和有标签目标域的子域类间差异MK-MMD损失L_intra尽量增大；

(4.3.3)源域和待分类目标域样本之间的边缘概率分布MK-MMD损失L_mar差异不断减小；

非线性度参数实现网络结构自适应，也避免了领域适应网络过拟合；领域适应损失函数如下：

其中，S∪Tl表示源域和有标签目标域，表示源域和有标签目标域第i个样本，/>表示源域和有标签目标域第i个样本的标签；

其中，p和q表示两种不同的特征分布，f表示标签预测函数；λ、μ、γ、w都表示权重。

进一步的，所述步骤(4.4)中领域适应网络参数θ(ω,b,g)更新如下：

其中lr为学习率；由于网格搜索的计算成本高，所以学习率lr不是由网格搜索来选择的，而是设置学习率其中E是随着整个过程从0到1的线性变换,设定参数η₀＝0.01，α＝10以及β＝0.75。

与现有技术相比，本发明的有益效果是：本发明为待分类任务标签样本图片少，但是相关领域存在大量带标签图片提供了新的研究思路。所提出的非线性度自适应子域领域适应方法联合整体和局部子域领域适应网络，能够同时考虑领域的子域的迁移性与可判别性，在减小同类分布差异的前提下，尽量增大不同类别间的分布差异，而且考虑待分类目标域和源域的边缘分布差异，最大程度上挖掘目标域信息，进一步减小了源域和目标域分布差异。同时网络是在保证分类损失权重最大的前提下减小源域和目标域的差异，保证了不同类别间的可辨别性。并且使领域适应网络结构实现自适应，找到最适合当前任务领域适应网络结构，提高了模型分类精度，避免网络过拟合。提高源域知识的利用率，辅助目标域更好的训练分类网络，以便能够更准确地预测目标域待分类图片的所属类别。

附图说明

图1是本发明所述非线性度自适应子域领域适应网络结构图。

图2是本发明所述领域适应前后Office31数据集6个任务上的t-SNE可视化对比。

图3几种领域适应方法的A-distance对比。

图4领域适应网络神经元非线性度变化图。

具体实施方式

下面结合附图及具体实验，对本发明做进一步说明。

可训练图片少的深度学习图片分类问题是典型的领域适应问题，一般源域存在大量标记图片，但是源域和目标域存在分布差异。具体说就是图片的拍射角度、光照、遮挡以及模糊条件不同造成用于模型训练的源域标注数据和目标域数据的数据属性和分布截然不同。根本动机就是：待分类的目标域可用于训练的图片稀缺。

本发明的一种基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法包括以下步骤：

(1)获取数据：读取源域和目标域图片；源域和目标域图片分别是不同领域的图片，例如，不同相机在不同环境下拍摄的同类别物体图片，由于光照、拍射角度等不同；或者源域图片是来自于互联网的高清图片，而目标域是实际生活中手机拍摄照片，导致源域图片特征和目标域图片特征分布不同；由于图片特征提取网络需要固定输入图片大小，所以所有数据都转换为224×224尺寸；每张图片转换为RGB三通道，转换为v×h×o的三维矩阵，w和h分别为图像的宽和高，c为通道数；这样，源域图片就可以转换成n_S×v×h×o的四维矩阵数据，n_S表示源域样本数，目标域少量带标签数据转换成n_Tl×v×h×o的四维矩阵数据，n_Tl表示有标签目标域样本数，待分类目标域图片转换成n_Tn×v×h×o的四维矩阵数据，n_Tn表示目标域待分类样本数；图片类别则用one-hot编码，图片共有N类，则第一类的标签表示[1,0,0,...,0]_1×N,第二类的标签表示为[0,1,0,...,0]_1×N，…，第N类图片的标签表示为[0,0,0,...,1]_1×N；

(2)提取并处理步骤(1)所获取的图片样本的特征，包括以下步骤：

其中，

其中，I表示矩阵总行数；

(3)非线性度自适应子域领域适应网络搭建；该网络包括神经元非线性度可变层和神经元非线性度固定层；其中，前三层为神经元非线性度可变层，第四层为神经元非线性度固定层，第五层为类别输出层；

所述神经元非线性度可变层中，固定每层神经元个数为2048，为了使前三层网络能够自适应改变神经元非线性度寻找在当前任务下最优网络，为领域适应网络每个神经元设定一个参数g∈[0,1]，这个参数决定了这个神经元作非线性程度，以及它在不进行任何变换的情况下将输入直接作为输出的程度；

y(x)＝g*σ(ω^Tx+b)+(1-g)*x (4)

第三层到第四层的计算公式为：

y(x)＝σ(ω^Tx+b) (5)

所述神经元非线性度固定层中，领域适应网络的第四层固定神经元个数为1000，第四层转换后每张图片的特征维度为1000，在第四层计算源域图片特征分布和目标域图片特征分布是否相同；在该层用MK-MMD计算源域图片特征分布和目标域图片同类别分布差异，以及源域图片特征分布和目标域图片特征分布不同类别间的差异，并且计算源域图片特征和目标域图片特征的边缘概率分布差异；第四层到第五层的计算公式为：

y(x)＝ω^Tx+b (6)

(4.1)网络参数初始化，将步骤(2)处理所得的源域图片特征和目标域图片特征X和有标签数据的标签信息Y输入网络，设第四层的网络输出为Z；

(4.2)神经元非线性度的取值为[0,1],计算所有非线性可变神经元参数的和，具体计算公式为：

(4.3)计算领域适应网络的总损失函数；对网络的第四层输出计算最大均值差异，通过减小最大均值差异减小源域和目标域之间的特征分布差异；

(4.4)领域适应网络参数θ(ω,b,g)更新如下：

其中lr为学习率；由于网格搜索的计算成本高，所以学习率lr不是由网格搜索来选择的，而是设置学习率其中E是随着整个过程从0到1的线性变换，设定参数η₀＝0.01，α＝10以及β＝0.75，这能在源域上加速收敛并减小误差。

(4.6)训练结束，网络参数θ(ω,b,g)固定不再更新；

本发明可通过以下实验进一步说明：

为了验证本发明的有效性，分别在Office31，ImageCLEF-DA，VisDA-2017上做了实验。

在Office31数据集上，Amazon作为源域时，每种类别选择20个样本，其它域作为源域每种类别选择8个样本作为源域。目标域每种类别随机选择3个样本作为目标域有标签样本，其余样本作为测试集。

在ImageCLEF-DA数据集上，每个域作为源域时每个类别选择8个样本作为源域，目标域每种类别选取3个样本作为目标域有标签样本，其余样本作为测试集。

在VisDA-2017数据集上，由于VisDA-2017较大，源域每种类别选取200个样本，同样目标域每种类别选取3个样本作为目标域有标签样本，其余样本作为测试集。

为了领域适应效果更加直观，我们在Office31数据集上6个任务，利用t-SNE嵌入技术特征提取网络提取的2048维特征领域适应前和领域适应后进行降维可视化。如图2所示左边是领域适应前，右边是领域适应后，领域适应之前样本的类别可辨别性较低，并且目标域和源域样本完全处于不同的分布。领域适应之后特征降到1000维，用t-SNE可视化可以看出同一类的不同域中分布非常接近，并且不同类的子域分布间距较大，在子空间中不同类别的区分度很明显。这一结果表明了我们所提方法能够学习到更多域不变信息和类别信息。通过所提方法较好的可视化结果表明，该方法能够学到样本整体和局部的可迁移特征。

用A-distance衡量跨领域间的差异，A-distance能够联合源域风险限制和目标域风险，A-distance定义为d_A＝2(1-2ε)其中ε是分类器(如核方法SVM)在识别源域和目标域的双任务上的泛化误差。图3展示了在office31数据集上6个任务的ResNet，DAN，RevGrad和所提方法的d_A。可以看出使用所提方法特征的d_A比使用ResNet，DAN，RevGrad特征的d_A要小得多，其中A→D和A→W的d_A要比其它方法低很多，也和后面表格我们所的准确度相对应，很大的提高了这两个任务的准确性，这表明所提方法可以更有效地减少跨域差距。

如图4所示，在Office31数据集A→D任务上g1，g2，g3分别表示前三层领域适应网络的非线性度，从图中可以看出三层的变化曲线几乎一致，神经元非线性度的变化开始以很快的速度增加对特征做非线性变化达到领域分布对齐的目的，然后随着迭代次数的增加，在保证领域分布对齐的情况下网络非线性度开始降低；网络复杂度的降低也避免了网络过拟合，最后达到稳定状态。

为表明测试结果性能，我们选择高水准的领域适应方法进行对比，分类结果如表1，表2，表3所示。基于ResNet50在数据集Office-31上的分类结果如表1所示。虽然我们只是在A→D任务比CRTL提高了14.1％，但是我们在所有任务平均精度上高于最新方法。从所有子域领域适应方法MADA、CDAN和CRTL都在此任务上相对于全局领域适应方法有很大提高。

基于ResNet-50在数据集ImageCLEF-DA上的领域适应精度结果如表2所示。该数据集作为Office-31的补充与扩展，任务量和Office-31相当。该数据集实验可以看做在另一种环境下进行与表1同等难度的领域适应任务。从表2可以看出本文所提方法在6个领域适应任务中5个结果达到最优，在任务P→I上仅比最优方法低0.2％，但平均精度领先于其它方法。尤其对比DDC、DAN、D-CORAL这些只匹配整体数据特征分布距离，忽视子域类别间差异的方法，造成的子域领域混淆使其准确率不高。对比MADA子域对抗领域适应，本文所提方法加入子域间的可判别性，以及目标域和源域整体特征分布对齐，在一定程度上提高了分类精度。

基于ResNet-50和ResNet101在数据集VisDA-2017上的领域适应结果如表3所示，VisDA-2017非常具有挑战性的数据集，包含两个差距较大的领域。从结果可以看出基于ResNet101提取的图片特征比ResNet50提取的图片特征的结果在9个类别上更好，并且平均结果最优。验证更深度神经网络可以学习到更多的域不变特征。基于ResNet50上，本文所提方法在平均精度上达到了最优，验证了针对大数据且领域差异较大的领域适应任务本文所提方法表现很好。

表1：office31数据集上的识别精度

表2：ImageCLEF-DA上的识别精度

表3：VisDA-2017上的识别精度

/>

本发明基于非线性度自适应子域领域适应方法。一方面通过衡量子域分布差异将源域和目标域的同类别分布对齐，学习到源域图片特征分布和目标域图片特征分布同类别间的域不变特征。另一方面扩大不同子域间的分布差异，学习到源域图片特征分布和目标域图片特征分布不同类别间的差异性。同时利用目标域待分类图片减小源域和目标域整体分布差异，使源域数据和目标域数据的边缘概率分布整体对齐。这种结构同时兼顾整体与子域的分布，能够实现更好的分类效果。同时领域适应网络加入了网络结构自适应参数能够寻找更适用于目标任务的网络非线性度，并且避免领域适应图片分类网络的过拟合问题，很大程度上提高了图像数据集的分类准确度。

应该理解，本发明并不局限于上述具体实例，在本发明开的基础上，凡是熟悉本领域的技术人员在不违背本发明精神的前提下还可做出等同变形或替换，这些等同的变型或替换均包含在本申请权利要求所限定的范围。

Claims

1.一种基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法，其特征在于，包括以下步骤：

(4.4)领域适应网络的参数更新；

(4.6)训练结束，网络参数θ(ω,b,g)固定不再更新；

(5)在训练好的非线性度自适应子域领域适应网络中输入待分类目标域图片样本的特征矩阵X_Tn，用该网络的第五层输出，利用softmax计算样本所属概率最大的类别即为图片的预测类别；

步骤(3)所述神经元非线性度可变层中，固定每层神经元个数为2048，为了使前三层网络能够自适应改变神经元非线性度寻找在当前任务下最优网络，为领域适应网络每个神经元设定一个参数g∈[0,1]，这个参数决定了这个神经元作非线性程度，以及它在不进行任何变换的情况下将输入直接作为输出的程度；前三层每层之间的计算公式为：

y(x)＝g*σ(ω^Tx+b)+(1-g)*x (4)

第三层到第四层的计算公式为：

y(x)＝σ(ω^Tx+b) (5)

y(x)＝ω^Tx+b (6)

所述领域适应网络的第五层为类别输出层，神经元个数等于图片类别数，训练阶段用第五层输出，用softmax函数计算图片属于每种类别的概率，然后计算交叉熵分类损失；预测待分类样本阶段则用softmax函数计算所属类别；

所述步骤(4.1)包括以下步骤：

式中C表示类别数，表示源域c类别样本数目，/>表示有标签目标域c类别样本数；/>表示希尔伯特空间，/>表示源域特征经网络变换后第四层输出的c类第i个样本特征，/>表示有标签目标域特征经网络变换后第四层输出的c类第j个样本特征，/>表示第四层输出的源域的c类别样本特征，/>表示第四层输出的有标签目标域的c类别样本特征；

其中式中C表示类别数，表示源域/>类别样本数目，/>表示有标签目标域c类别样本数；/>表示希尔伯特空间，/>表示源域特征经网络变换后第四层输出的/>类第i个样本特征，/>表示有标签目标域特征经网络变换后第四层输出的c类第j个样本特征，/>表示第四层输出的源域的/>类别样本特征，/>表示第四层输出的有标签目标域的c类别样本特征；

其中n_s表示源域样本数，n_t表示目标域样本数；表示希尔伯特空间，/>表示源域特征经网络变换后第四层输出的第i个样本特征，/>表示目标域特征经网络变换后第四层输出的第j个样本特征；

(4.1.4)计算有标签数据的交叉熵损失：领域适应网络最终输出为该目标域图片的属于每种类别概率，网络学习的目的就是让正确类别的概率最大；前四层的仅能学习到源域和目标域的域不变特征以及域类别信息，因此第五层网络的输出的经softmax函数计算出每种类别概率和真实标签one-hot编码的交叉熵损失尤为重要，具体计算公式为：

其中，y表示图片的真实类别one-hot编码，表示网络预测图片属于每种类别的概率，S∪Tl表示源域和有标签目标域，/>表示源域和有标签目标域第i个样本，/>表示源域和有标签目标域第i个样本的标签，通过减小交叉熵损失让网络输出类别概率最大标签对应图片的真实标签；

所述步骤(4.3)中总损失函数的计算方法为：

其中，S∪Tl表示源域和有标签目标域，表示源域和有标签目标域第i个样本，表示源域和有标签目标域第i个样本的标签；

2.根据权利要求1所述一种基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法，其特征在于，所述步骤(1)包括以下步骤：

3.根据权利要求1所述一种基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法，其特征在于，所述步骤(2)包括以下步骤：

(2.1)特征提取网络的训练：采用ImageNet对ResNet网络进行预训练，获得ResNet残差网络模型，再用步骤(1)所得源域数据训练ResNet残差网络模型，ResNet残差网络的输入为batch_size×v×h×o的矩阵，batch_size的大小取决于计算机内存；

其中，

其中，I表示矩阵总行数；

4.根据权利要求1所述一种基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法，其特征在于，所述步骤(4.2)中神经元非线性度的取值为[0,1],计算所有非线性可变神经元参数的和，具体计算公式为：

5.根据权利要求1所述一种基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法，其特征在于，所述步骤(4.4)中领域适应网络参数θ(ω,b,g)更新如下：

其中lr为学习率；由于网格搜索的计算成本高，所以学习率lr不是由网格搜索来选择的，而是设置学习率

其中E是随着整个过程从0到1的线性变换，设定参数η₀＝0.01，α＝10以及β＝0.75。