CN116246126A

CN116246126A - 迭代无监督域自适应方法和装置

Info

Publication number: CN116246126A
Application number: CN202310142742.7A
Authority: CN
Inventors: 请求不公布姓名
Original assignee: Shanghai Biren Intelligent Technology Co Ltd
Current assignee: Shanghai Biren Intelligent Technology Co Ltd
Priority date: 2023-02-20
Filing date: 2023-02-20
Publication date: 2023-06-09

Abstract

本发明提供一种迭代无监督域自适应方法和装置，属于迁移学习领域，方法包括：从域迁移测试集中抽取预设数量的图像样本；将图像样本输入预设的迭代优化算法，根据迭代优化算法的计算结果调整预训练的模型的参数，以使得调整后的模型适应域迁移测试集；其中，预设的迭代优化算法包括：对每个图像样本进行数据增强处理，得到目标大小的批图像；根据批图像，确定模型的参数值；根据域迁移测试集对确定参数值后的模型进行测试，得到分类误差；遍历所有图像样本后，根据分类误差得到图像样本的平均分类误差。本发明基于预设的迭代优化算法对图像样本进行处理，可以用少量的图像样本的数量，无需重训练即可满足实际应用场景需求及开发需求。

Description

迭代无监督域自适应方法和装置

技术领域

本发明涉及迁移学习技术领域，尤其涉及一种迭代无监督域自适应方法和装置。

背景技术

迁移学习是一种机器学习方法，指的是一个预训练的模型被重新用在另一个任务中。当目标域产生迁移或测试集因无标签数据的加入导致源域与目标域的分布不一致时，预训练的模型的性能都将明显下降，且泛化能力变差。

为解决模型性能下降的问题，一种最简单直接的方法是从域迁移目标域中获取标签数据并重新训练模型。另一种是无监督域自适应(UDA，Dynamic Unsupervised DomainAdaptation)方法，获得带标记的训练数据和大量无标签的迁移样本重新训练网络，使模型能够以无监督学习的方式适应新分布数据。

现有的无监督域自适应方法需要较多数量测试数据才能达到稳定的且最优的结果，无法满足实际应用场景需求及开发需求。

发明内容

本发明提供一种迭代无监督域自适应方法和装置，用以解决现有技术中无监督域自适应方法需要较多数量测试数据才能达到稳定的且最优的结果，无法满足实际应用场景需求及开发需求的缺陷。

本发明提供一种迭代无监督域自适应方法，包括：

从域迁移测试集中抽取预设数量的图像样本；

将所述图像样本输入预设的迭代优化算法，根据所述迭代优化算法的计算结果调整预训练的模型的参数，以使得调整后的所述模型适应所述域迁移测试集；

其中，预设的所述迭代优化算法包括：

对每个所述图像样本进行数据增强处理，得到目标大小的批图像；

根据所述批图像，确定所述模型的参数值；

根据所述域迁移测试集对确定参数值后的所述模型进行测试，得到分类误差；

遍历所有所述图像样本后，根据所述分类误差得到所述图像样本的平均分类误差。

根据本发明提供的一种迭代无监督域自适应方法，所述根据所述批图像，确定所述模型的参数值，包括：

对所述批图像的特征进行归一化处理，得到归一化特征数据；

根据所述归一化特征数据，得到所述批图像的特征的均值和方差；

根据所述批图像的特征的均值和方差，得到所述模型的参数值。

根据本发明提供的一种迭代无监督域自适应方法，所述根据所述归一化特征数据，得到所述批图像的特征的均值和方差，包括：

根据所述归一化特征数据和动态衰减动量，得到所述批图像的特征的均值和方差；

其中，所述动态衰减动量基于动态衰减系数得到，所述动态衰减系统与迭代数相关。

根据本发明提供的一种迭代无监督域自适应方法，还包括：

根据所述动态衰减系数更新所述动态衰减动量；

若所述平均分类误差符合设定条件，则结束迭代。

根据本发明提供的一种迭代无监督域自适应方法，所述对所述批图像的特征进行归一化处理，得到归一化特征数据，包括：

将所述批图像划分为多个子批次图像，对所述子批次图像的特征进行归一化处理，得到归一化特征数据。

根据本发明提供的一种迭代无监督域自适应方法，还包括：

基于第一预设增强算法对每个所述图像样本进行数据增强处理，得到目标大小的批图像；

基于第二预设增强算法对所述批图像进行数据增强处理，得到数据增强后的所述批图像。

本发明还提供一种迭代无监督域自适应装置，包括：

获取模块，用于从域迁移测试集中抽取预设数量的图像样本；

调整模块，用于将所述图像样本输入预设的迭代优化算法，根据所述迭代优化算法的计算结果调整预训练的模型的参数，以使得调整后的所述模型适应所述域迁移测试集；

其中，预设的所述迭代优化算法包括：

根据所述批图像，确定所述模型的参数值；

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述迭代无监督域自适应方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述迭代无监督域自适应方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述迭代无监督域自适应方法。

本发明提供的迭代无监督域自适应方法和装置，基于预设的迭代优化算法对图像样本进行处理，可以用少量的图像样本的数量，满足实际应用场景需求及开发需求，无需重训练，解决了现有技术中无监督域自适应方法需要较多数量测试数据才能达到稳定的且最优的结果的缺陷。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的迭代无监督域自适应方法的流程示意图；

图2是本发明提供的预设的迭代优化算法的流程示意图；

图3是本发明提供的图2中步骤S122的流程示意图；

图4是本发明提供的迭代无监督域自适应装置的结构示意图；

图5是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本申请实施例的描述中，需要说明的是，术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请实施例和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请实施例的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

在本申请实施例的描述中，需要说明的是，除非另有明确的规定和限定，术语“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本申请实施例中的具体含义。

在本申请实施例中，除非另有明确的规定和限定，第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触，或第一和第二特征通过中间媒介间接接触。而且，第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方，或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请实施例的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

图1是本发明提供的迭代无监督域自适应方法的流程示意图，如图1所示，本发明提供一种迭代无监督域自适应方法，包括：

S110，从域迁移测试集中抽取预设数量的图像样本；

S120，将所述图像样本输入预设的迭代优化算法，根据所述迭代优化算法的计算结果调整预训练的模型的参数，以使得调整后的所述模型适应所述域迁移测试集；

图2是本发明提供的预设的迭代优化算法的流程示意图，如图2所示，预设的所述迭代优化算法包括：

S121，对每个所述图像样本进行数据增强处理，得到目标大小的批图像；

S122，根据所述批图像，确定所述模型的参数值；

S123，根据所述域迁移测试集对确定参数值后的所述模型进行测试，得到分类误差；

S124，遍历所有所述图像样本后，根据所述分类误差得到所述图像样本的平均分类误差。

可选的，在步骤S110中，从域迁移测试集X_tar中随机抽取0.5％～0.8％的图像样本N＝(n₁,n₂,…,n_n)，n为图样样本的总数；域迁移测试集中的图像均是未标记的测试数据。抽取比例越小，抽取的图像样本数越少，越符合现实应用程序的需求，实现整个过程所消耗的时间和计算量越小。

可选的，在步骤S120中，预训练的模型可以是由CIFAR-10数据集对Resnet分类网络训练得到的Resnet-26分类模型，可以应用于医疗影像领域、自动驾驶领域等。

本发明中，模型的参数具体指的是BN层统计参数，即本发明实施例对模型的BN层统计参数进行调整，具体的，若模型还未经过迭代，则将模型的初始BN层统计参数作为先验信息，经过迭代后，则将迭代后的模型权重对应的BN层统计参数作为先验信息。

在步骤S121中，对每个所述图像样本进行数据增强处理，得到64*64像素的批图像。

在步骤S122中，根据所述批图像的特征的期望和方差，确定所述模型的参数值，以使得批图像能够逐渐接近域迁移分布。

其中，批图像的特征指的是批图像的feature map，网络的中间层，下同。

在步骤S123中，每得到一次模型的参数值，计算一次模型在域迁移测试集中的分类误差，遍历完所有图像样本后，模型的所有BN层统计参数更新了n次，产生了n个分类误差，计算n个分类误差的平均值，得到当前迭代循环的平均分类误差。平均分类误差用于确定迭代结束的条件。

可以理解的是，本发明基于预设的迭代优化算法对图像样本进行处理，能够减少所需的图像样本的数量，满足实际应用场景需求及开发需求，无需重新训练，解决了现有技术中无监督域自适应方法需要较多数量测试数据才能达到稳定的且最优的结果的缺陷。

图3是本发明提供的图2中步骤S122的流程示意图，如图3所示，在上述实施例的基础上，作为一个可选的实施例，所述根据所述批图像，确定所述模型的参数值，包括：

S310，对所述批图像的特征进行归一化处理，得到归一化特征数据；

S320，根据所述归一化特征数据，得到所述批图像的特征的均值和方差；

S330，根据所述批图像的特征的均值和方差，得到所述模型的参数值。

可选的，对所述批图像的特征进行归一化处理，得到的归一化特征数据相当于模型BN层的输出特征数据。计算批图像的特征的均值和方差相当于计算模型的BN层的参数值，模型的BN层参数包括滑动平均值(running mean)和滑动方差(running variance)。

归一化处理的公式如下：

其中，

为归一化特征数据，γ和β分别是比例系数和放缩系数，∈为稳定数值，防止分母为0，x为图像样本的特征，μ_pop为滑动平均值，σ_pop为滑动方差。

可以理解的是，本发明实施例提供了一种根据批图像确定模型的参数值的技术方案，能够用少量的图像样本，计算得到模型的参数值，使得模型适应于域迁移测试集，满足实际应用场景需求及开发需求。

在上述实施例的基础上，作为一个可选的实施例，所述根据所述归一化特征数据，得到所述批图像的特征的均值和方差，包括：

可选的，当前批次批图像的特征的期望

的计算公式如下：

当前批次批图像的特征的方差Var[X]的计算公式如下：

其中，

和/>

是从当前批次批图像的特征估计的均值和方差，μ_k和σ_k表示传入批次批图像的特征的均值和方差，即μ_pop和σ_pop，k表示输入批次，ρ是动量，决定了现有的统计估计受传入批次批图像的统计信息影响的承度，较大的动量值本质上会给传入批次批图像的计算统计数据赋予更大的权重。

可选的，基于动态衰减动量计算批图像的特征的期望

和方差Var[X]的计算公式如下：

ρ_k＝ρ_k-1·ω·(1-τ·m)；

其中，ρ_k＝0.2，

动量的动态衰减系数为ω·(1-τ·m)，其中τ的范围在(2×10^-5，5×10^-5)，/>

定义动量下限，ω的范围在(0.9，0.99)。m是Step6中迭代数M∈(0，1，...，m-1)。

可以理解的是，本发明通过设置动态衰减动量，可以使用更少的迭代次数使得滑动平均值(running mean)和滑动方差(running variance)稳定且达到最优，且保证平均分类误差能下降到最低值。

在上述实施例的基础上，作为一个可选的实施例，本发明提供的一种迭代无监督域自适应方法，还包括：

根据所述动态衰减系数更新所述动态衰减动量；

若所述平均分类误差符合设定条件，则结束迭代。

可选的，若相邻两次迭代的平均分类误差小于5*10^-4，则结束迭代。上述数值可在实施例中进行自定义设置，本发明对此不作限定。

可以理解的是，本发明在每次迭代后，更新当前模型的BN参数，可以减少迭代次数，提高效率。

在上述实施例的基础上，作为一个可选的实施例，所述对所述批图像进行归一化处理，得到归一化特征数据，包括：

可选的，传入批次批图像的特征的期望

和方差Var[X]通过数量为的B的sub-batch对传入的batch进行Precise BN统计量计算，需要计算/>

次(B应被64整除，可取1，2，4)。

传入批次批图像的特征的统计量聚合公式如下：

其中，μ_B为子批次图像的期望值。

可以理解的是，本发明通过将批图像划分为多个子批次图像，子批次图像作为一个batch的输入，网络的中间层的输出，能够减少所需的图像样本数量，提高训练效率。

具体的，对每个图像样本进行下述数据增强：随机裁剪-＞随机垂直翻转-＞随机水平翻转-＞仿射变换等，扩充单个图像到目标大小的批图像。

可选的，第二预设增强算法为随机Cutout增强算法。

在每个批次中采用Cutout增强的比例p_C(0≤p_C≤1)是随机的。这样处理的目的是增强迁移数据的模型分类表现和泛化能力。每个批次进行Cutout的样本个数是随机的。

第二预设增强算法的公式如下：

N_C＝p_C×N；

其中，N_C为增强后的批图像。

可以理解的是，通过对图像样本进行增强处理，能够提高训练的准确率。

下面结合一个具体实施例对本发明的技术效果进行详细说明。

数据集：CIFAR-10五级破坏数据集

模型：Resnet-26分类模型

域迁移测试集：CIFAR-10-C包括Gaussian Noise，Shot Noise，Impulse Noise，Defocus Blur，Glass Blur，Motion Blur，Zoom Blur，Snow。每个子测试集样本量均为10000。前7个域迁移测试集是由传感器引入的噪声导致的；后4个域迁移测试集是由天气因素导致的。

本发明提出的方法，不需要重新训练模型，仅应用不到0.5％未标记的域迁移测试数据，在实际迭代次数几乎不超过3次条件下，在线更新BN层的统计参数来适应测试集，并改善模型在测试集上的性能。如下表所示，本发明提出的方法在上述子测试集上均获得最小Top-1分类误差，并且在表1的8种域迁移数据集中获得最小的平均误差。

表1比较TTT、PTBN、DUA和IUDA在8个CIFAR-10-C测试集上的Top-1平均分类误差和四个方法的平均误差

其中，TTT：Test Time Training，在测试之前通过对每个(分布外)数据样本使用辅助任务来调整网络参数。PTBN：Prediction-Time Batch Normalization，基于测试集统计信息方法，忽略训练样本的统计信息，并重新更新在大batch下整个测试集的Batchnorm统计信息。DUA：Dynamic Unsupervised Domain Adaptation，动态无监督域自适应方法。

下面对本发明提供的迭代无监督域自适应装置进行描述，下文描述的迭代无监督域自适应装置与上文描述的迭代无监督域自适应方法可相互对应参照。

图4是本发明提供的迭代无监督域自适应装置的结构示意图，如图4所示，本发明还提供一种迭代无监督域自适应装置，包括：

获取模块410，用于从域迁移测试集中抽取预设数量的图像样本；

调整模块420，用于将所述图像样本输入预设的迭代优化算法，根据所述迭代优化算法的计算结果调整预训练的模型的参数，以使得调整后的所述模型适应所述域迁移测试集；

其中，预设的所述迭代优化算法包括：

根据所述批图像，确定所述模型的参数值；

作为一个实施例，所述调整模块420还用于：

根据所述动态衰减系数更新所述动态衰减动量，

若所述平均分类误差符合设定条件，则结束迭代。

作为一个实施例，所述调整模块420还用于：

图5示例了一种电子设备的实体结构示意图，如图5所示，该电子设备可以包括：处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540，其中，处理器510，通信接口520，存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令，以执行迭代无监督域自适应方法，该方法包括：

从域迁移测试集中抽取预设数量的图像样本；

其中，预设的所述迭代优化算法包括：

根据所述批图像，确定所述模型的参数值；

此外，上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的迭代无监督域自适应方法，该方法包括：

从域迁移测试集中抽取预设数量的图像样本；

其中，预设的所述迭代优化算法包括：

根据所述批图像，确定所述模型的参数值；

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的迭代无监督域自适应方法，该方法包括：

从域迁移测试集中抽取预设数量的图像样本；

其中，预设的所述迭代优化算法包括：

根据所述批图像，确定所述模型的参数值；

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种迭代无监督域自适应方法，其特征在于，包括：

从域迁移测试集中抽取预设数量的图像样本；

其中，预设的所述迭代优化算法包括：

根据所述批图像，确定所述模型的参数值；

2.根据权利要求1所述的迭代无监督域自适应方法，其特征在于，所述根据所述批图像，确定所述模型的参数值，包括：

3.根据权利要求2所述的迭代无监督域自适应方法，其特征在于，所述根据所述归一化特征数据，得到所述批图像的特征的均值和方差，包括：

4.根据权利要求3所述的迭代无监督域自适应方法，其特征在于，还包括：

根据所述动态衰减系数更新所述动态衰减动量；

若所述平均分类误差符合设定条件，则结束迭代。

5.根据权利要求2所述的迭代无监督域自适应方法，其特征在于，所述对所述批图像的特征进行归一化处理，得到归一化特征数据，包括：

6.根据权利要求1所述的迭代无监督域自适应方法，其特征在于，还包括：

7.一种迭代无监督域自适应装置，其特征在于，包括：

其中，预设的所述迭代优化算法包括：

根据所述批图像，确定所述模型的参数值；

8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述迭代无监督域自适应方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述迭代无监督域自适应方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述迭代无监督域自适应方法。