CN117115447A

CN117115447A - 基于元迁移学习的前视声呐图像分割方法和装置

Info

Publication number: CN117115447A
Application number: CN202311240290.2A
Authority: CN
Inventors: 赵冬冬; 王宇行; 陈朋; 王海霞
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2023-09-25
Filing date: 2023-09-25
Publication date: 2023-11-24

Abstract

一种基于元迁移学习的前视声呐图像分割方法和装置，其方法包括：S1、构建基于元迁移的声呐图像分割模型，模型中的特征提取器为卷积神经网络，在卷积神经网络中采用注意力机制；S2、采用预训练数据集对网络模型参数进行预训练，获取初始化参数；S3、使用预训练模型利用元学习策略训练网络模型，训练中采用自适应因子进行模型收敛；S4、将待分割图像输入训练好的网络模型，获得分割结果。本发明的注意力机制能合并不同维度特征图，提高模型的分割精度；元学习策略能支持小样本声纳图像分割，快速适应和学习小样本的分割任务，并保持较高的分割精准度，解决了声纳图像样本小难获取的难题，在以小样本声纳图像作为数据集上分割精度差的问题。

Description

基于元迁移学习的前视声呐图像分割方法和装置

技术领域

本发明属于图像处理与水下探测领域，涉及一种基于元迁移学习的前视声呐图像分割方法和装置。

背景技术

声呐是一种用于海底调查和地形探测的声学成像技术。由于光波容易被海水吸收，很难在海水中传播，声波在水中衰减慢，传播距离远，因此在水下目标成像上主要采用声呐设备。它利用声波在水中传播并与海底或水下物体交互的原理，通过接收返回的回波信号来生成海底地形或水下物体的图像。由于声呐受到海水影响导致的姿态和速度的变化，采集到的数据往往不是真实的海底地貌回波强度，解析数据后往往会形成各种畸变，这严重影响到了声呐图像后续处理效果。

图像分割在声呐图像分析中具有至关重要的作用。它可以有效地将声呐图像中的目标物体与背景区分开来，并准确地确定它们的位置和形状。这为后续的任务，如目标识别、分类、形状分析和运动分析，提供了必要的基础。然而，声纳图像数据的采集相对复杂，受到环境条件的限制，因此获取这些数据通常具有挑战性。此外，由于声纳图像数据可能包含敏感信息，数据的采集和共享受到限制。这种数据稀缺性问题引发了另一个广泛存在的挑战，即小样本学习。在面对有限的声纳图像数据时，不得不从仅有的小部分标注样本中学习出有效的模型，以便在面对新的任务和样本时能够适应。

元学习是一种机器学习方法，旨在使机器学习算法能够学习如何学习，元学习的目标是通过从多个任务中学习到的经验和知识，使学习算法能够更加高效、灵活地适应新任务。在元学习中，我们将任务看作是学习算法的输入，而不仅仅是训练数据。通过在多个任务上进行学习，元学习算法可以学习到一般化的模式、策略和参数初始化，以便在新任务上快速适应和学习。

发明内容

本发明的目的是为了降低由于声纳图像采集困难导致样本量小对神经网络分割声纳图像的影响，提供一种基于元迁移学习的前视声呐图像分割方法和装置。

本发明可以在给定声呐任务和数据集上自动学习最优的参数配置和模型选择策略，从而提高声呐图像数据分割的效果。

为解决上述技术问题，本发明所提供的技术方案为：一种基于元迁移学习的前视声呐图像分割方法，具体过程如下：

S1、构建基于元迁移学习的声呐图像分割模型，所述模型中的特征提取器为卷积神经网络，所述模型在卷积神经网络的上采样和下采样中采用注意力机制，所述注意力机制设置如下：

S11、下采样中序列化的在通道和空间两个维度上产生特征图信息，然后将两种特征图在与输入特征图进行自适应修正特征产生最后的特征图。

S12、对于输入特征图F∈I^C×H×W将其输入通道注意力机制模块得到特征图F′，再将其输入空间注意力机制模块得到特征图F″完成下采样操作，计算式如下：

其中M_channel和M_space分别表示通道注意力和空间注意力

S13、通道产生的特征图由输入的特征图F得到F′：

M_channel(F)＝σ(MLP(AvgPool(F))+MLP(MaxPool(F))) (2)

其中σ表示Sigmon函数，AvgPool表示平均池化，MaxPool表示最大池化，MLP表示多层感知网络。

S14、空间产生的特征图由输入的特征图F′得到F″：

M_space(F′)＝σConvNd((cat(AvgPool(F′)；MaxPool(F′)))) (3)

其中σ表示Sigmon函数，ConvNd表示卷积层，cat表示拼接函数，AvgPool表示平均池化，MaxPool表示最大池化。

S15、上采样中通过上层x和对应下采样中x′得到输出，计算公式如下：

其中表示哈达玛积，σ表示Sigmon函数，δ表示卷积操作，R表示ReLU函数。

S2、对网络模型参数进行预训练，得到初始化分割模型

S21、通过大规模的预训练保证分割效果，在大规模数据集上进行训练，计算式如下：

其中Θ为特征提取器，θ为分类器，为损失函数，α为优化学习率。

S3、利用元学习策略训练网络模型，训练中采用声纳小样本图像作为数据集，训练中采用自适应因子模块使模型收敛，所述元学习策略和自适应因子设置如下：

S31、元学习分为两个阶段，外循环和内循环。

S32、外循环阶段设置可以学习的参数ΦS_1，2、一个baseline分类器θ′：

其中θ′为baseline分类器，θ为目前训练得到的分类器，β表示外循环的学习率。

S33、ΦS_1，2表示第二个阶段的网络模型参数，使用数据集中的训练任务损失优化baseline分类器θ′，baseline分类器θ′更新网络模型参数和自适应因子μ_{1，2}：

其中为卷积或偏置中的可学习参数，γ为内循环学习率，/>表示在测试任务上通过分类器θ′计算的标准交叉熵损失。/>表示Focal Loss损失函数。

S34、在内循环中利用与自适应因子进行乘和加操作，再对卷积核和偏置进行调整，原有卷积核与ΦS₁进行哈达玛积操作，原有偏置与ΦS₂进行相加：

其中X为输入的特征图，W为卷积核，b为偏置

S35、得到最后分类器θ：

S4、将待分割图像输入训练好的网络模型，获得分割结果。

本发明的第二个方面涉及一种基于元迁移学习的前视声呐图像分割装置，包括存储器和一个或多个处理器，所述存储器中存储有可执行代码，所述一个或多个处理器执行所述可执行代码时，用于实现本发明的基于元迁移学习的前视声呐图像分割方法

本发明的第三个方面涉及一种计算机可读存储介质，其特征在于，其上存储有程序，该程序被处理器执行时，实现本发明的基于元迁移学习的前视声呐图像分割方法。

本发明的工作原理是：

在预训练阶段中不考虑目标域数据集的数据，只在容易获得的数据上进行预训练，使模型具有良好的特征提取能力。在元训练阶段，考虑到现有分割模型对声纳图像不具备精准分割的效果，通过缩放和移动的方式调整特征提取器的参数模型对于目标域的特征提取能力，从而快速适应声纳图像的分割任务。在元测试阶段评估模型在小样本学习问题上的性能，验证它是否能够快速适应新任务并做出准确的预测。

本发明的创新点是：

提出元学习应用于前视声纳图像的分割方法；提出自适应因子应用于声纳小样本图像分割的网络模型训练方法。

本发明具有以下有益效果：

1.解决声纳图像样本少的问题，本发明提出了一种基于元迁移学习的前视声呐图像分割方法，根据不同任务和目标自适应学习网络参数，学习策略更合理，通过让网络自行学习的方式，从而在小样本数据集的前提下，大幅提升图像分割的性能，解决了声纳图像难采集的问题。

2.解决声纳图像特殊性导致神经网络对声纳图像识别精准度低的问题，本发明提出一种基于元迁移学习的前视声呐图像分割方法，注意力机制通过拼接多个卷积层的输出特征图，实现了使模型能够聚焦目标出现的位置，减少大范围背景对目标分割的影响，解决了噪声等问题导致声纳图像分割精度低的问题。

附图说明

图1为基于元迁移学习的前视声呐图像分割方法流程图。

图2为基于自适应因子的网络参数学习流程图。

具体实施方式

为了更好的理解上述技术方案，下面将结合说明书附图以及具体实施方式来详细阐述技术方案。

实施例1

如图1所示，一种基于元迁移学习的前视声呐图像分割方法，实施过程具体包括以下步骤：

S11、下采样中能够序列化的在通道和空间两个维度上产生注意力特征图信息，然后将两种特征图在与输入特征图进行相乘进行自适应修正特征产生最后的特征图。

S12、对于输入特征图F∈I^C×H×W将其输入通道注意力机制模块得到特征图，再将其输入空间注意力机制模块得到特征图完成下采样操作。计算式如下：

其中M_channel为通道产生的特征图，M_space为空间产生的特征图。

S13、通道产生的特征图由输入的特征图通过平均池化和最大池化后得到：

M_channel(F)＝σ(MLP(AvgPool(F))+MLP(MaxPool(F))) (2)

S14、空间产生的特征图由输入的特征图通过平均池化和最大池化后得到：

M_space(F′)＝σConvNd((cat(AvgPool(F′)；MaxPool(F′)))) (3)

S15、上采样中通过第i层网络结构的跳跃连接输出和模型上一层的输出x和x_i得到输出x^u：

其中σ表示Sigmon函数，δ表示卷积操作，R表示ReLU函数，表示哈达玛积。

S2、采用预训练数据集对网络模型参数进行预训练，获取初始化参数，所述预训练设置如下：

S21、通过大规模的预训练保证分割效果，在大规模的数据集上进行训练：

S22、损失函数为交叉熵损失函数：

其中x表示给定的图片，y表示对应图片的标签，f_[Θ；θ]为分割函数，对应的输出为输入图片x的分割结果，L为交叉熵损失计算函数。

S3、利用元学习策略训练网络模型，训练中采用声纳小样本图像作为数据集，训练中采用自适应因子进行模型收敛，所述元学习策略和自适应因子设置如下：

S31、元学习分为两个阶段，外循环对分类器进行微调，内循环学习超参数的移动和缩放。

S32、外循环阶段设置可以学习的参数ΦS_1，2、一个基础分类器θ′：

其中θ′为基础分类器，θ为目前训练得到的分类器，β表示外循环的学习率，的表达式如下：

如图2所示，一种基于自适应缩放的学习方法实施过程具体包括以下步骤，其中Standard CE Loss表示标准交叉熵损失函数，Focal CE Loss表示复合交叉熵损失函数：

S33、ΦS_1，2表示内循环超参数，使用训练任务的损失优化当前分类器θ′，基础分类器θ′更新超参数和自适应因子μ_{1，2}：

其中为卷积或偏置中的可学习参数，γ为内循环学习率，/>表示在测试任务上通过分类器θ′计算的标准交叉熵损失。/>表示Focal Loss损失函数：

其中N为样本数量，p为模型预测准确的概率，γ＞0为可调节因子。

其中X为输入的特征图，W为卷积核，b为偏置

S35、得到最后分类器θ：

S4、将待分割图像输入训练好的网络模型，获得分割结果。

本发明的注意力机制能合并不同维度特征图，提高模型的分割精度；元学习策略能支持小样本声纳图像分割，能够快速适应和学习小样本的分割任务，并保持较高的分割精准度，解决了声纳图像样本小难获取的难题和传统神经网络在以小样本声纳图像作为数据集上分割精度差的问题。

实施例2

本实施例涉及一种基于元迁移学习的前视声呐图像分割装置，包括存储器和一个或多个处理器，所述存储器中存储有可执行代码，所述一个或多个处理器执行所述可执行代码时，用于实现实施例1的基于元迁移学习的前视声呐图像分割方法。

实施例3

本实施例涉及一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时，实现本发明的基于元迁移学习的前视声呐图像分割方法。

最后需说明的是，以上结合图例所述的具体方案与实施例仅是本发明的一个较佳实施方式，本专业的技术人员，在不脱离本发明技术范围内可以对阐述的技术内容进行些许的更改与变动，但不背离本发明精神实质与原理的情况下进行的修改与变形都应属于本发明技术方案的范围内。

Claims

1.一种基于元迁移学习的前视声呐图像分割方法，其特征在于：包括如下步骤：

S1、构建基于元迁移学习的声呐图像分割模型，所述的声呐图像分割模型中的特征提取器为卷积神经网络，所述的声呐图像分割模型在卷积神经网络的上采样和下采样中采用注意力机制，所述注意力机制设置如下：

S11、下采样中序列化的在通道和空间两个维度上产生特征图信息，然后将两种特征图在与输入特征图进行自适应修正特征产生最后的特征图；

S12、对于输入特征图F将其输入通道模块得到特征图F^′，再将其输入空间模块得到特征图F″完成下采样操作；

S13、通道产生的特征图由输入的特征图F得到F^′；

S14、空间产生的特征图由输入的特征图F^′得到F″；

S15、上采样中通过上层x和对应下采样中x^′得到输出；

S2、对网络模型参数进行预训练，得到初始化分割模型，所述预训练设置如下：

S21、通过光学数据集预训练保证分割效果；

S22、损失函数为交叉熵损失函数；

S31、元学习分为两个阶段，第一个阶段对分类器进行梯度下降，第二个阶段学习网络模型移动和缩放；

S32、外循环阶段设置可以学习的参数ΦS_1,2、一个baseline分类器θ^′；

S33、ΦS_1,2表示第二个阶段的网络模型参数，使用数据集中的训练任务损失优化baseline分类器θ^′，baseline分类器θ^′更新网络模型参数和自适应因子μ_{1,2}；

S34、在内循环中利用与μ_i进行加权操作，得到的结果与网络模型中的卷积核和偏置进行加权操作；

S35、得到最后分类器θ；

S4、将待分割图像输入训练好的网络模型，获得分割结果。

2.如权利要求1所述的一种基于元迁移学习的前视声呐图像分割方法，其特征在于：步骤S3中的利用元学习策略训练的初始网络模型是经过S2步骤预训练得到的。

3.如权利要求1所述的一种基于元迁移学习的前视声呐图像分割方法，其特征在于：步骤S33的元学习两个阶段，其特征在于：第一个阶段对网络模型进行梯度下降法收敛，第二个阶段网络模型通过更新网络模型参数和自适应因子μ_{1,2}收敛。

4.如权利要求1所述的一种基于元迁移学习的前视声呐图像分割方法，其特征在于：步骤S33中，对于超参数用交叉熵损失更新其值，对于自适应因子μ_{1,2}用Focal损失更新其值。

5.如权利要求1所述的一种基于元迁移学习的前视声呐图像分割方法，其特征在于：步骤S4中，获得分割结果的要求是：经过元训练的模型在新的、未见过的任务上进行测试，这些新任务也只有少量的样本可用，模型通过之前学到的元学习策略和通用特征来进行预测。

6.一种基于元迁移学习的前视声呐图像分割装置，其特征在于，包括存储器和一个或多个处理器，所述存储器中存储有可执行代码，所述一个或多个处理器执行所述可执行代码时，用于实现权利要求1-5中任一项所述的基于元迁移学习的前视声呐图像分割方法。

7.一种计算机可读存储介质，其特征在于，其上存储有程序，该程序被处理器执行时，实现权利要求1-5中任一项所述的基于元迁移学习的前视声呐图像分割方法。