CN117115447A - 基于元迁移学习的前视声呐图像分割方法和装置 - Google Patents
基于元迁移学习的前视声呐图像分割方法和装置 Download PDFInfo
- Publication number
- CN117115447A CN117115447A CN202311240290.2A CN202311240290A CN117115447A CN 117115447 A CN117115447 A CN 117115447A CN 202311240290 A CN202311240290 A CN 202311240290A CN 117115447 A CN117115447 A CN 117115447A
- Authority
- CN
- China
- Prior art keywords
- meta
- learning
- sonar image
- training
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000003709 image segmentation Methods 0.000 title claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 36
- 230000011218 segmentation Effects 0.000 claims abstract description 27
- 230000003044 adaptive effect Effects 0.000 claims abstract description 13
- 230000007246 mechanism Effects 0.000 claims abstract description 13
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 22
- 238000010586 diagram Methods 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 238000013526 transfer learning Methods 0.000 claims description 3
- 230000006978 adaptation Effects 0.000 claims 1
- 238000011478 gradient descent method Methods 0.000 claims 1
- 230000003287 optical effect Effects 0.000 claims 1
- 238000013508 migration Methods 0.000 abstract 1
- 230000005012 migration Effects 0.000 abstract 1
- 238000011176 pooling Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 5
- 241000282326 Felis catus Species 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000013535 sea water Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012876 topography Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
一种基于元迁移学习的前视声呐图像分割方法和装置,其方法包括:S1、构建基于元迁移的声呐图像分割模型,模型中的特征提取器为卷积神经网络,在卷积神经网络中采用注意力机制;S2、采用预训练数据集对网络模型参数进行预训练,获取初始化参数;S3、使用预训练模型利用元学习策略训练网络模型,训练中采用自适应因子进行模型收敛;S4、将待分割图像输入训练好的网络模型,获得分割结果。本发明的注意力机制能合并不同维度特征图,提高模型的分割精度;元学习策略能支持小样本声纳图像分割,快速适应和学习小样本的分割任务,并保持较高的分割精准度,解决了声纳图像样本小难获取的难题,在以小样本声纳图像作为数据集上分割精度差的问题。
Description
技术领域
本发明属于图像处理与水下探测领域,涉及一种基于元迁移学习的前视声呐图像分割方法和装置。
背景技术
声呐是一种用于海底调查和地形探测的声学成像技术。由于光波容易被海水吸收,很难在海水中传播,声波在水中衰减慢,传播距离远,因此在水下目标成像上主要采用声呐设备。它利用声波在水中传播并与海底或水下物体交互的原理,通过接收返回的回波信号来生成海底地形或水下物体的图像。由于声呐受到海水影响导致的姿态和速度的变化,采集到的数据往往不是真实的海底地貌回波强度,解析数据后往往会形成各种畸变,这严重影响到了声呐图像后续处理效果。
图像分割在声呐图像分析中具有至关重要的作用。它可以有效地将声呐图像中的目标物体与背景区分开来,并准确地确定它们的位置和形状。这为后续的任务,如目标识别、分类、形状分析和运动分析,提供了必要的基础。然而,声纳图像数据的采集相对复杂,受到环境条件的限制,因此获取这些数据通常具有挑战性。此外,由于声纳图像数据可能包含敏感信息,数据的采集和共享受到限制。这种数据稀缺性问题引发了另一个广泛存在的挑战,即小样本学习。在面对有限的声纳图像数据时,不得不从仅有的小部分标注样本中学习出有效的模型,以便在面对新的任务和样本时能够适应。
元学习是一种机器学习方法,旨在使机器学习算法能够学习如何学习,元学习的目标是通过从多个任务中学习到的经验和知识,使学习算法能够更加高效、灵活地适应新任务。在元学习中,我们将任务看作是学习算法的输入,而不仅仅是训练数据。通过在多个任务上进行学习,元学习算法可以学习到一般化的模式、策略和参数初始化,以便在新任务上快速适应和学习。
发明内容
本发明的目的是为了降低由于声纳图像采集困难导致样本量小对神经网络分割声纳图像的影响,提供一种基于元迁移学习的前视声呐图像分割方法和装置。
本发明可以在给定声呐任务和数据集上自动学习最优的参数配置和模型选择策略,从而提高声呐图像数据分割的效果。
为解决上述技术问题,本发明所提供的技术方案为:一种基于元迁移学习的前视声呐图像分割方法,具体过程如下:
S1、构建基于元迁移学习的声呐图像分割模型,所述模型中的特征提取器为卷积神经网络,所述模型在卷积神经网络的上采样和下采样中采用注意力机制,所述注意力机制设置如下:
S11、下采样中序列化的在通道和空间两个维度上产生特征图信息,然后将两种特征图在与输入特征图进行自适应修正特征产生最后的特征图。
S12、对于输入特征图F∈IC×H×W将其输入通道注意力机制模块得到特征图F′,再将其输入空间注意力机制模块得到特征图F″完成下采样操作,计算式如下:
其中Mchannel和Mspace分别表示通道注意力和空间注意力
S13、通道产生的特征图由输入的特征图F得到F′:
Mchannel(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F))) (2)
其中σ表示Sigmon函数,AvgPool表示平均池化,MaxPool表示最大池化,MLP表示多层感知网络。
S14、空间产生的特征图由输入的特征图F′得到F″:
Mspace(F′)=σConvNd((cat(AvgPool(F′);MaxPool(F′)))) (3)
其中σ表示Sigmon函数,ConvNd表示卷积层,cat表示拼接函数,AvgPool表示平均池化,MaxPool表示最大池化。
S15、上采样中通过上层x和对应下采样中x′得到输出,计算公式如下:
其中表示哈达玛积,σ表示Sigmon函数,δ表示卷积操作,R表示ReLU函数。
S2、对网络模型参数进行预训练,得到初始化分割模型
S21、通过大规模的预训练保证分割效果,在大规模数据集上进行训练,计算式如下:
其中Θ为特征提取器,θ为分类器,为损失函数,α为优化学习率。
S3、利用元学习策略训练网络模型,训练中采用声纳小样本图像作为数据集,训练中采用自适应因子模块使模型收敛,所述元学习策略和自适应因子设置如下:
S31、元学习分为两个阶段,外循环和内循环。
S32、外循环阶段设置可以学习的参数ΦS1,2、一个baseline分类器θ′:
其中θ′为baseline分类器,θ为目前训练得到的分类器,β表示外循环的学习率。
S33、ΦS1,2表示第二个阶段的网络模型参数,使用数据集中的训练任务损失优化baseline分类器θ′,baseline分类器θ′更新网络模型参数和自适应因子μ{1,2}:
其中为卷积或偏置中的可学习参数,γ为内循环学习率,/>表示在测试任务上通过分类器θ′计算的标准交叉熵损失。/>表示Focal Loss损失函数。
S34、在内循环中利用与自适应因子进行乘和加操作,再对卷积核和偏置进行调整,原有卷积核与ΦS1进行哈达玛积操作,原有偏置与ΦS2进行相加:
其中X为输入的特征图,W为卷积核,b为偏置
S35、得到最后分类器θ:
S4、将待分割图像输入训练好的网络模型,获得分割结果。
本发明的第二个方面涉及一种基于元迁移学习的前视声呐图像分割装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现本发明的基于元迁移学习的前视声呐图像分割方法
本发明的第三个方面涉及一种计算机可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时,实现本发明的基于元迁移学习的前视声呐图像分割方法。
本发明的工作原理是:
在预训练阶段中不考虑目标域数据集的数据,只在容易获得的数据上进行预训练,使模型具有良好的特征提取能力。在元训练阶段,考虑到现有分割模型对声纳图像不具备精准分割的效果,通过缩放和移动的方式调整特征提取器的参数模型对于目标域的特征提取能力,从而快速适应声纳图像的分割任务。在元测试阶段评估模型在小样本学习问题上的性能,验证它是否能够快速适应新任务并做出准确的预测。
本发明的创新点是:
提出元学习应用于前视声纳图像的分割方法;提出自适应因子应用于声纳小样本图像分割的网络模型训练方法。
本发明具有以下有益效果:
1.解决声纳图像样本少的问题,本发明提出了一种基于元迁移学习的前视声呐图像分割方法,根据不同任务和目标自适应学习网络参数,学习策略更合理,通过让网络自行学习的方式,从而在小样本数据集的前提下,大幅提升图像分割的性能,解决了声纳图像难采集的问题。
2.解决声纳图像特殊性导致神经网络对声纳图像识别精准度低的问题,本发明提出一种基于元迁移学习的前视声呐图像分割方法,注意力机制通过拼接多个卷积层的输出特征图,实现了使模型能够聚焦目标出现的位置,减少大范围背景对目标分割的影响,解决了噪声等问题导致声纳图像分割精度低的问题。
附图说明
图1为基于元迁移学习的前视声呐图像分割方法流程图。
图2为基于自适应因子的网络参数学习流程图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体实施方式来详细阐述技术方案。
实施例1
如图1所示,一种基于元迁移学习的前视声呐图像分割方法,实施过程具体包括以下步骤:
S1、构建基于元迁移学习的声呐图像分割模型,所述模型中的特征提取器为卷积神经网络,所述模型在卷积神经网络的上采样和下采样中采用注意力机制,所述注意力机制设置如下:
S11、下采样中能够序列化的在通道和空间两个维度上产生注意力特征图信息,然后将两种特征图在与输入特征图进行相乘进行自适应修正特征产生最后的特征图。
S12、对于输入特征图F∈IC×H×W将其输入通道注意力机制模块得到特征图,再将其输入空间注意力机制模块得到特征图完成下采样操作。计算式如下:
其中Mchannel为通道产生的特征图,Mspace为空间产生的特征图。
S13、通道产生的特征图由输入的特征图通过平均池化和最大池化后得到:
Mchannel(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F))) (2)
其中σ表示Sigmon函数,AvgPool表示平均池化,MaxPool表示最大池化,MLP表示多层感知网络。
S14、空间产生的特征图由输入的特征图通过平均池化和最大池化后得到:
Mspace(F′)=σConvNd((cat(AvgPool(F′);MaxPool(F′)))) (3)
其中σ表示Sigmon函数,ConvNd表示卷积层,cat表示拼接函数,AvgPool表示平均池化,MaxPool表示最大池化。
S15、上采样中通过第i层网络结构的跳跃连接输出和模型上一层的输出x和xi得到输出xu:
其中σ表示Sigmon函数,δ表示卷积操作,R表示ReLU函数,表示哈达玛积。
S2、采用预训练数据集对网络模型参数进行预训练,获取初始化参数,所述预训练设置如下:
S21、通过大规模的预训练保证分割效果,在大规模的数据集上进行训练:
其中Θ为特征提取器,θ为分类器,为损失函数,α为优化学习率。
S22、损失函数为交叉熵损失函数:
其中x表示给定的图片,y表示对应图片的标签,f[Θ;θ]为分割函数,对应的输出为输入图片x的分割结果,L为交叉熵损失计算函数。
S3、利用元学习策略训练网络模型,训练中采用声纳小样本图像作为数据集,训练中采用自适应因子进行模型收敛,所述元学习策略和自适应因子设置如下:
S31、元学习分为两个阶段,外循环对分类器进行微调,内循环学习超参数的移动和缩放。
S32、外循环阶段设置可以学习的参数ΦS1,2、一个基础分类器θ′:
其中θ′为基础分类器,θ为目前训练得到的分类器,β表示外循环的学习率,的表达式如下:
如图2所示,一种基于自适应缩放的学习方法实施过程具体包括以下步骤,其中Standard CE Loss表示标准交叉熵损失函数,Focal CE Loss表示复合交叉熵损失函数:
S33、ΦS1,2表示内循环超参数,使用训练任务的损失优化当前分类器θ′,基础分类器θ′更新超参数和自适应因子μ{1,2}:
其中为卷积或偏置中的可学习参数,γ为内循环学习率,/>表示在测试任务上通过分类器θ′计算的标准交叉熵损失。/>表示Focal Loss损失函数:
其中N为样本数量,p为模型预测准确的概率,γ>0为可调节因子。
S34、在内循环中利用与自适应因子进行乘和加操作,再对卷积核和偏置进行调整,原有卷积核与ΦS1进行哈达玛积操作,原有偏置与ΦS2进行相加:
其中X为输入的特征图,W为卷积核,b为偏置
S35、得到最后分类器θ:
S4、将待分割图像输入训练好的网络模型,获得分割结果。
本发明的注意力机制能合并不同维度特征图,提高模型的分割精度;元学习策略能支持小样本声纳图像分割,能够快速适应和学习小样本的分割任务,并保持较高的分割精准度,解决了声纳图像样本小难获取的难题和传统神经网络在以小样本声纳图像作为数据集上分割精度差的问题。
实施例2
本实施例涉及一种基于元迁移学习的前视声呐图像分割装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现实施例1的基于元迁移学习的前视声呐图像分割方法。
实施例3
本实施例涉及一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现本发明的基于元迁移学习的前视声呐图像分割方法。
最后需说明的是,以上结合图例所述的具体方案与实施例仅是本发明的一个较佳实施方式,本专业的技术人员,在不脱离本发明技术范围内可以对阐述的技术内容进行些许的更改与变动,但不背离本发明精神实质与原理的情况下进行的修改与变形都应属于本发明技术方案的范围内。
Claims (7)
1.一种基于元迁移学习的前视声呐图像分割方法,其特征在于:包括如下步骤:
S1、构建基于元迁移学习的声呐图像分割模型,所述的声呐图像分割模型中的特征提取器为卷积神经网络,所述的声呐图像分割模型在卷积神经网络的上采样和下采样中采用注意力机制,所述注意力机制设置如下:
S11、下采样中序列化的在通道和空间两个维度上产生特征图信息,然后将两种特征图在与输入特征图进行自适应修正特征产生最后的特征图;
S12、对于输入特征图F将其输入通道模块得到特征图F′,再将其输入空间模块得到特征图F″完成下采样操作;
S13、通道产生的特征图由输入的特征图F得到F′;
S14、空间产生的特征图由输入的特征图F′得到F″;
S15、上采样中通过上层x和对应下采样中x′得到输出;
S2、对网络模型参数进行预训练,得到初始化分割模型,所述预训练设置如下:
S21、通过光学数据集预训练保证分割效果;
S22、损失函数为交叉熵损失函数;
S3、利用元学习策略训练网络模型,训练中采用声纳小样本图像作为数据集,训练中采用自适应因子模块使模型收敛,所述元学习策略和自适应因子设置如下:
S31、元学习分为两个阶段,第一个阶段对分类器进行梯度下降,第二个阶段学习网络模型移动和缩放;
S32、外循环阶段设置可以学习的参数ΦS1,2、一个baseline分类器θ′;
S33、ΦS1,2表示第二个阶段的网络模型参数,使用数据集中的训练任务损失优化baseline分类器θ′,baseline分类器θ′更新网络模型参数和自适应因子μ{1,2};
S34、在内循环中利用与μi进行加权操作,得到的结果与网络模型中的卷积核和偏置进行加权操作;
S35、得到最后分类器θ;
S4、将待分割图像输入训练好的网络模型,获得分割结果。
2.如权利要求1所述的一种基于元迁移学习的前视声呐图像分割方法,其特征在于:步骤S3中的利用元学习策略训练的初始网络模型是经过S2步骤预训练得到的。
3.如权利要求1所述的一种基于元迁移学习的前视声呐图像分割方法,其特征在于:步骤S33的元学习两个阶段,其特征在于:第一个阶段对网络模型进行梯度下降法收敛,第二个阶段网络模型通过更新网络模型参数和自适应因子μ{1,2}收敛。
4.如权利要求1所述的一种基于元迁移学习的前视声呐图像分割方法,其特征在于:步骤S33中,对于超参数用交叉熵损失更新其值,对于自适应因子μ{1,2}用Focal损失更新其值。
5.如权利要求1所述的一种基于元迁移学习的前视声呐图像分割方法,其特征在于:步骤S4中,获得分割结果的要求是:经过元训练的模型在新的、未见过的任务上进行测试,这些新任务也只有少量的样本可用,模型通过之前学到的元学习策略和通用特征来进行预测。
6.一种基于元迁移学习的前视声呐图像分割装置,其特征在于,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现权利要求1-5中任一项所述的基于元迁移学习的前视声呐图像分割方法。
7.一种计算机可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时,实现权利要求1-5中任一项所述的基于元迁移学习的前视声呐图像分割方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311240290.2A CN117115447A (zh) | 2023-09-25 | 2023-09-25 | 基于元迁移学习的前视声呐图像分割方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311240290.2A CN117115447A (zh) | 2023-09-25 | 2023-09-25 | 基于元迁移学习的前视声呐图像分割方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117115447A true CN117115447A (zh) | 2023-11-24 |
Family
ID=88796564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311240290.2A Pending CN117115447A (zh) | 2023-09-25 | 2023-09-25 | 基于元迁移学习的前视声呐图像分割方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117115447A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117809169A (zh) * | 2024-03-01 | 2024-04-02 | 中国海洋大学 | 一种小样本水下声呐图像分类方法及其模型搭建方法 |
-
2023
- 2023-09-25 CN CN202311240290.2A patent/CN117115447A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117809169A (zh) * | 2024-03-01 | 2024-04-02 | 中国海洋大学 | 一种小样本水下声呐图像分类方法及其模型搭建方法 |
CN117809169B (zh) * | 2024-03-01 | 2024-04-30 | 中国海洋大学 | 一种小样本水下声呐图像分类方法及其模型搭建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110335290B (zh) | 基于注意力机制的孪生候选区域生成网络目标跟踪方法 | |
CN109949255B (zh) | 图像重建方法及设备 | |
US11386293B2 (en) | Training image signal processors using intermediate loss functions | |
CN113326930B (zh) | 数据处理方法、神经网络的训练方法及相关装置、设备 | |
CN111507993A (zh) | 一种基于生成对抗网络的图像分割方法、装置及存储介质 | |
CN113065645B (zh) | 孪生注意力网络、图像处理方法和装置 | |
CN113705769A (zh) | 一种神经网络训练方法以及装置 | |
Zong et al. | Local-CycleGAN: a general end-to-end network for visual enhancement in complex deep-water environment | |
WO2020061884A1 (en) | Composite binary decomposition network | |
CN117115447A (zh) | 基于元迁移学习的前视声呐图像分割方法和装置 | |
TWI831016B (zh) | 機器學習方法、機器學習系統以及非暫態電腦可讀取媒體 | |
Cap et al. | Super-resolution for practical automated plant disease diagnosis system | |
CN107798329B (zh) | 基于cnn的自适应粒子滤波目标跟踪方法 | |
CN116468995A (zh) | 一种联合slic超像素和图注意力网络的声呐图像分类方法 | |
CN110135435B (zh) | 一种基于广度学习系统的显著性检测方法及装置 | |
CN113205102B (zh) | 一种基于忆阻神经网络的车辆标志识别方法 | |
Dharejo et al. | SwinWave-SR: Multi-scale lightweight underwater image super-resolution | |
Byun et al. | Low-complexity dynamic channel scaling of noise-resilient CNN for intelligent edge devices | |
CN110717402B (zh) | 一种基于层级优化度量学习的行人再识别方法 | |
Tang et al. | Side-scan sonar underwater target segmentation using the BHP-UNet | |
CN116888621A (zh) | 图像检测方法、装置和电子设备 | |
Ge et al. | Shuffle-RDSNet: a method for side-scan sonar image classification with residual dual-path shrinkage network | |
Pal et al. | MAML-SR: Self-adaptive super-resolution networks via multi-scale optimized attention-aware meta-learning | |
CN116486203B (zh) | 一种基于孪生网络和在线模板更新的单目标跟踪方法 | |
US20230111937A1 (en) | Image artifact reduction using filter data based on deep image prior operations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |