CN115375922A - 一种基于多尺度空间注意力的轻量化显著性检测方法 - Google Patents

一种基于多尺度空间注意力的轻量化显著性检测方法 Download PDF

Info

Publication number
CN115375922A
CN115375922A CN202211098512.7A CN202211098512A CN115375922A CN 115375922 A CN115375922 A CN 115375922A CN 202211098512 A CN202211098512 A CN 202211098512A CN 115375922 A CN115375922 A CN 115375922A
Authority
CN
China
Prior art keywords
scale
convolution
layer
lightweight
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211098512.7A
Other languages
English (en)
Other versions
CN115375922B (zh
Inventor
沈坤烨
张翥佳
周晓飞
张继勇
李世锋
周振
何帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Power Data Service Co ltd
Hangzhou Dianzi University
Original Assignee
China Power Data Service Co ltd
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Power Data Service Co ltd, Hangzhou Dianzi University filed Critical China Power Data Service Co ltd
Priority to CN202211098512.7A priority Critical patent/CN115375922B/zh
Publication of CN115375922A publication Critical patent/CN115375922A/zh
Application granted granted Critical
Publication of CN115375922B publication Critical patent/CN115375922B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/52Scale-space analysis, e.g. wavelet analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/34Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于多尺度空间注意力的轻量化显著性检测方法,包括以下步骤:步骤一、构建多尺度特征提取模块,并对输入信息进行处理;步骤二、依据深度可分离卷积及多尺度特征提取模块构建编码器,用于获取多级语义特征;步骤三、构建多尺度空间注意力模块;步骤四、依据深度可分离卷积与多尺度空间注意力模块构建解码器;步骤五、以编码器、解码器为基础,建立轻量化显著性检测模型;步骤六、对所建立轻量化显著性检测模型进行训练,并保存训练所得最终模型参数;本发明通过对图像中多尺度特征的充分挖掘以及图像全局特征的提取与利用,强化了轻量化模型的检测能力,在保持轻量化模型自身优势的同时,提升了模型的检测精度。

Description

一种基于多尺度空间注意力的轻量化显著性检测方法
技术领域
本发明涉及一种基于多尺度空间注意力的轻量化显著性检测方法,属于计算机视觉技术领域。
背景技术
随着计算机视觉领域的发展,显著性检测因其自身特性被广泛地应用于图像/视频压缩,视频质量评价以及目标检测等领域中,在学术上已取得了丰硕的研究成果。此外,为了将显著性检测技术应用于实际生产生活中,需要考虑模型的处理速度以及模型参数量,于是轻量化显著性检测在近年受到研究者的广泛关注。
显著性检测的目的在于找到图像当中最吸引人眼注意力关注的一个或多个目标,在实际生产生活中能帮助系统优先处理重要区域的图像信息,加快系统任务处理速度。在显著性检测的理论研究过程中,科研人员依据卷积神经网络构建了众多性能优秀的模型,能有效地解决现有图像中显著性检测的基本问题。然而,在实际应用的过程中,基于传统卷积神经网络的显著性检测模型因其庞大的参数量,导致系统处理速度过慢,从而降低整体性能。
为了解决显著性检测模型的实际应用问题,研究者们开始探索轻量化显著性检测模型,通过以深度可分离卷积为基础结构的方式,大幅度减小了模型参数量,有效地提升了模型的处理速度。另一方面,现有轻量化显著性检测模型在追求轻和快的过程中,降低了模型对于图像全局的关注能力,从而导致检测性能相比于现有模型仍有一定差距。
发明内容
本发明的目的是针对现有方法存在的不足,提供一种基于多尺度空间注意力的轻量化显著性检测方法。
为实现上述目的,本发明的技术方案是:
一种基于多尺度空间注意力的轻量化显著性检测方法,包括以下步骤:
步骤一、构建多尺度特征提取模块,并对输入信息进行处理;
步骤二、依据深度可分离卷积及多尺度特征提取模块构建编码器,用于获取多级语义特征;
步骤三、构建多尺度空间注意力模块;
步骤四、依据深度可分离卷积与多尺度空间注意力模块构建解码器;
步骤五、以编码器、解码器为基础,建立轻量化显著性检测模型;
步骤六、对所建立轻量化显著性检测模型进行训练,并保存训练所得最终模型参数。
所述步骤一具体包括:
首先将输入多尺度特征提取模块的信息分别通过不同膨胀率的深度可分离卷积,获得4种感受野下的多尺度特征;再利用深度可分离卷积融合多尺度特征作为模块输出;其过程可表示为:
Figure BDA0003830984700000021
其中,
Figure BDA0003830984700000022
表示多尺度特征,
Figure BDA0003830984700000023
表示卷积核尺寸为3×3,膨胀率为2i的深度可分离卷积,IFeature表示模块输入信息,OFeature表示模块输出信息。
所述步骤二具体包括:
利用卷积,批量归一化操作和Relu激活函数及步骤一构建的多尺度特征提取模块构成编码器的第一层;其次,利用步长为2的深度可分离卷积与多尺度特征提取模块分别构成编码器的第二层至第五层,其过程可表示为:
Figure BDA0003830984700000024
其中,
Figure BDA0003830984700000025
表示编码器提取获得的多级语义特征,MSFAi表示i个连续的多尺度特征提取模块,Conv表示卷积,批量归一化操作和Relu激活函数,Input表示模型输入图像,DSConv2表示步长为2的深度可分离卷积。
所述步骤三具体包括:
利用三种不同膨胀率的深度可分离卷积对输入信息进行处理;经过卷积核尺寸为1×1的卷积层和sigmoid激活函数,得到空间注意力图;后将空间注意力图与输入信息进行点乘操作,得到加权强化后的信息;将加权强化后的信息作为多尺度空间注意力模块输出;其过程可表示:
Figure BDA0003830984700000031
OFeature=SWeight*IFeature
其中,SWeight表示空间注意力图,Sigmoid表示sigmoid激活函数,Conv1×1表示卷积核尺寸为1×1的卷积层,
Figure BDA0003830984700000032
表示膨胀率为i的深度可分离卷积,IFeature表示输入信息,OFeature表示输出信息,*表示点乘操作。
所述步骤四具体包括:
利用卷积核尺寸分别为3×3和5×5的深度可分离卷积以及步骤三构建的多尺度空间注意力模块组成解码器各层;其次,将编码器对应层特征与解码器上一层特征通过相加操作融合,送入解码器相应层中;最后,依次通过卷积核尺寸为3×3的深度可分离卷积,多尺度空间注意力模块以及卷积核尺寸为5×5的深度可分离卷积,得到解码器各层输出;其过程可表示为:
Figure BDA0003830984700000033
其中,
Figure BDA0003830984700000034
表示解码器各层对应的输出,
Figure BDA0003830984700000035
表示卷积核尺寸为3×3膨胀率为2的深度可分离卷积,MSSA表示多尺度空间注意力模块,
Figure BDA0003830984700000036
表示卷积核尺寸为5×5的深度可分离卷积,
Figure BDA0003830984700000037
表示编码器对应层的输出,Up表示双线性插值的上采样操作,+表示相加操作。
所述步骤五具体包括:
依据编码器从输入图像提取多级语义特征
Figure BDA0003830984700000038
通过解码器融合来自编码器对应层的特征以及解码器上一层的特征,得到解码器各层输出
Figure BDA0003830984700000039
后将解码器最后一层输出
Figure BDA00038309847000000310
经过Dropout层,卷积核尺寸为1×1的卷积层以及Sigmoid函数得到最终显著性预测图,构建完整的轻量化显著性检测模型;其过程可表示为:
Figure BDA00038309847000000311
其中,Sal表示模型最终预测图,Sigmoid表示sigmoid函数,Conv1×1表示卷积核尺寸为1×1的卷积层,Dropout表示概率为0.1的Dropout层,
Figure BDA0003830984700000041
表示解码器最后一层输出特征。
所述步骤六具体包括:
将图像尺寸统一调整为368×368;然后随机裁剪为336×336,批处理大小设置为12;利用Pytorch框架进行训练部署;采用交叉熵损失函数计算预测图与真值图之间的差异,利用Adam优化器进行参数更新操作,初始学习率设置为1.5×10-3
与现有技术相比,本发明的有益效果在于:
本发明构建多尺度特征提取模块,用于提取输入图像的多尺度特征,并依此构建多级编码结构;此外,多尺度空间注意力模块,有助于提高轻量化模型对于全局特征的关注能力;最后,以深度可分离卷积为基础,结合多尺度特征提取模块与多尺度空间注意力模块,构建轻量化显著性检测模型。通过对图像中多尺度特征的充分挖掘以及图像全局特征的提取与利用,强化了轻量化模型的检测能力,在保持轻量化模型自身优势的同时,提升了模型的检测精度。
本发明中编码器通过采用以深度可分离卷积为基础的多尺度特征提取模块,有效地提高了编码器对于图像多尺度特征的挖掘。另一方面,解码器部分多尺度空间注意力模块的引入,能很好地帮助模型提升对于全局信息的关注能力。本发明方法通过利用多尺度特征及空间注意力,强化了轻量化模型对于全局特征的提取及利用能力,从而较好地实现了检测性能与模型大小之间的平衡。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于多尺度空间注意力的轻量化显著性检测方法的多尺度特征提取模块结构图;
图2为本发明基于多尺度空间注意力的轻量化显著性检测方法的多尺度空间注意力模块结构图;
图3为本发明基于多尺度空间注意力的轻量化显著性检测方法的模型结构图;
图4为本发明基于多尺度空间注意力的轻量化显著性检测方法的结果对比图,第一列为原图像,第二列为真值图,第三列为本发明方法实施例的结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于多尺度空间注意力的轻量化显著性检测方法,包括以下步骤:
步骤一、构建多尺度特征提取模块,并对输入信息进行处理;
如图1所示,首先将输入多尺度特征提取模块的信息分别通过膨胀率为1、2、4、8的3×3深度可分离卷积,获得4种感受野下的多尺度特征
Figure BDA0003830984700000051
并再次利用卷积核尺寸为3×3的深度可分离卷积融合多尺度特征作为模块输出;其过程可表示为:
Figure BDA0003830984700000052
其中,
Figure BDA0003830984700000053
表示多尺度特征,
Figure BDA0003830984700000054
表示卷积核尺寸为3×3,膨胀率为2i的深度可分离卷积,IFeature表示模块输入信息,OFeature表示模块输出信息。
步骤二、依据深度可分离卷积及多尺度特征提取模块构建编码器,用于获取多级语义特征;
如图3左侧结构所示,首先,利用卷积,批量归一化操作和Relu激活函数组成的卷积块及步骤一构建的多尺度特征提取模块构成编码器的第一层;其次,利用步长为2的3×3深度可分离卷积与块数为1,4,6,3的多尺度特征提取模块分别构成编码器的第二层至第五层,用于提取多级语义特征
Figure BDA0003830984700000055
其通道数分别为16,32,64,96,128;其过程可表示为:
Figure BDA0003830984700000061
其中,
Figure BDA0003830984700000062
表示编码器提取获得的多级语义特征,MSFAi表示i个连续的多尺度特征提取模块,Conv表示卷积,批量归一化操作和Relu激活函数,Input表示模型输入图像,DSConv2表示步长为2的深度可分离卷积。
步骤三、构建多尺度空间注意力模块;
如图2所示,首先,利用膨胀率为6,4,2的3×3深度可分离卷积对输入信息进行处理;其次,经过卷积核尺寸为1×1的卷积层和sigmoid激活函数,得到空间注意力图SWeight;然后将空间注意力图与输入特征进行点乘操作,得到加权强化后的信息OFeature;最后,将加权强化后的信息作为多尺度空间注意力模块输出,输出信息尺寸与输入信息尺寸保持一致;其过程可表示:
Figure BDA0003830984700000063
OFeature=SWeight*IFeature
其中,SWeight表示空间注意力图,Sigmoid表示sigmoid激活函数,Conv1×1表示卷积核尺寸为1×1的卷积层,
Figure BDA0003830984700000064
表示膨胀率为i的深度可分离卷积,IFeature表示输入信息,OFeature表示输出信息,*表示点乘操作。
步骤四、依据深度可分离卷积与多尺度空间注意力模块构建解码器;
如图3右侧结构所示,首先,利用卷积核尺寸分别为3×3和5×5的深度可分离卷积以及步骤(3)构建的多尺度空间注意力模块组成解码器各层;其次,将编码器对应层特征与解码器上一层特征通过相加操作融合,送入解码器相应层中;最后,依次通过卷积核尺寸为3×3的深度可分离卷积,多尺度空间注意力模块以及卷积核尺寸为5×5的深度可分离卷积,得到解码器各层输出
Figure BDA0003830984700000065
其通道数分别为96,64,32,16,16;其过程可表示为:
Figure BDA0003830984700000066
其中,
Figure BDA0003830984700000071
表示解码器各层对应的输出,
Figure BDA0003830984700000072
表示卷积核尺寸为3×3膨胀率为2的深度可分离卷积,MSSA表示多尺度空间注意力模块,
Figure BDA0003830984700000073
表示卷积核尺寸为5×5的深度可分离卷积,
Figure BDA0003830984700000074
表示编码器对应层的输出,Up表示双线性插值的上采样操作,+表示相加操作。
步骤五、以编码器、解码器为基础,建立轻量化显著性检测模型;
如图3所示,首先,我们依据编码器从输入图像提取多级语义特征;其次,我们通过解码器融合来自编码器对应层的特征以及解码器上一层的特征,得到解码器各层输出;最后,我们将解码器最后一层输出经过Dropout层,卷积核尺寸为的卷积层以及Sigmoid函数组成的输出层得到最终显著性预测图,预测图尺寸与输入图像尺寸大小一致,从而构建完整的轻量化显著性检测模型;其过程可表示为:
Figure BDA0003830984700000075
其中,Sal表示模型最终预测图,Sigmoid表示sigmoid函数,Conv1×1表示卷积核尺寸为1×1的卷积层,Dropout表示概率为0.1的Dropout层,
Figure BDA0003830984700000076
表示解码器最后一层输出特征。
步骤六、对所建立轻量化显著性检测模型进行训练,并保存训练所得最终模型参数。
首先,将图像尺寸统一调整为368×368;然后随机裁剪为336×336,批处理大小设置为12;其次,利用Pytorch框架进行训练部署;最后,采用交叉熵损失函数计算预测图与真值图之间的差异,并利用Adam优化器进行参数更新操作,初始学习率设置为1.5×10-3
图4为本发明方法结果对比图,第一列为原图像,第二列为真值图,第三列为本发明方法的结果图。
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。

Claims (7)

1.一种基于多尺度空间注意力的轻量化显著性检测方法,其特征在于:包括以下步骤:
步骤一、构建多尺度特征提取模块,并对输入信息进行处理;
步骤二、依据深度可分离卷积及多尺度特征提取模块构建编码器,用于获取多级语义特征;
步骤三、构建多尺度空间注意力模块;
步骤四、依据深度可分离卷积与多尺度空间注意力模块构建解码器;
步骤五、以编码器、解码器为基础,建立轻量化显著性检测模型;
步骤六、对所建立轻量化显著性检测模型进行训练,并保存训练所得最终模型参数。
2.根据权利要求1所述的一种基于多尺度空间注意力的轻量化显著性检测方法,其特征在于:所述步骤一具体包括:
将输入多尺度特征提取模块的信息分别通过不同膨胀率的深度可分离卷积,获得4种感受野下的多尺度特征;再利用深度可分离卷积融合多尺度特征作为模块输出;其过程可表示为:
Figure FDA0003830984690000011
其中,
Figure FDA0003830984690000012
表示多尺度特征,
Figure FDA0003830984690000013
表示卷积核尺寸为3×3,膨胀率为2i的深度可分离卷积,IFeature表示模块输入信息,OFeature表示模块输出信息。
3.根据权利要求1所述的一种基于多尺度空间注意力的轻量化显著性检测方法,其特征在于:所述步骤二具体包括:
利用卷积,批量归一化操作和Relu激活函数及步骤一构建的多尺度特征提取模块构成编码器的第一层;其次,利用步长为2的深度可分离卷积与多尺度特征提取模块分别构成编码器的第二层至第五层,其过程可表示为:
Figure FDA0003830984690000021
其中,
Figure FDA0003830984690000022
表示编码器提取获得的多级语义特征,MSFAi表示i个连续的多尺度特征提取模块,Conv表示卷积,批量归一化操作和Relu激活函数,Input表示模型输入图像,DSConv2表示步长为2的深度可分离卷积。
4.根据权利要求1所述的一种基于多尺度空间注意力的轻量化显著性检测方法,其特征在于:所述步骤三具体包括:
利用三种不同膨胀率的深度可分离卷积对输入信息进行处理;经过卷积核尺寸为1×1的卷积层和sigmoid激活函数,得到空间注意力图;后将空间注意力图与输入信息进行点乘操作,得到加权强化后的信息;将加权强化后的信息作为多尺度空间注意力模块输出;其过程可表示:
Figure FDA0003830984690000023
OFeature=SWeight*IFeature
其中,SWeight表示空间注意力图,Sigmoid表示sigmoid激活函数,Conv1×1表示卷积核尺寸为1×1的卷积层,
Figure FDA0003830984690000024
表示膨胀率为i的深度可分离卷积,IFeature表示输入信息,OFeature表示输出信息,*表示点乘操作。
5.根据权利要求1所述的一种基于多尺度空间注意力的轻量化显著性检测方法,其特征在于:所述步骤四具体包括:
利用卷积核尺寸分别为3×3和5×5的深度可分离卷积以及步骤三构建的多尺度空间注意力模块组成解码器各层;其次,将编码器对应层特征与解码器上一层特征通过相加操作融合,送入解码器相应层中;最后,依次通过卷积核尺寸为3×3的深度可分离卷积,多尺度空间注意力模块以及卷积核尺寸为5×5的深度可分离卷积,得到解码器各层输出;其过程可表示为:
Figure FDA0003830984690000025
其中,
Figure FDA0003830984690000031
表示解码器各层对应的输出,
Figure FDA0003830984690000032
表示卷积核尺寸为3×3膨胀率为2的深度可分离卷积,MSSA表示多尺度空间注意力模块,
Figure FDA0003830984690000033
表示卷积核尺寸为5×5的深度可分离卷积,
Figure FDA0003830984690000034
表示编码器对应层的输出,Up表示双线性插值的上采样操作,+表示相加操作。
6.根据权利要求1所述的一种基于多尺度空间注意力的轻量化显著性检测方法,其特征在于:所述步骤五具体包括:
依据编码器从输入图像提取多级语义特征
Figure FDA0003830984690000035
通过解码器融合来自编码器对应层的特征以及解码器上一层的特征,得到解码器各层输出
Figure FDA0003830984690000036
后将解码器最后一层输出
Figure FDA0003830984690000037
经过Dropout层,卷积核尺寸为1×1的卷积层以及Sigmoid函数得到最终显著性预测图,构建完整的轻量化显著性检测模型;其过程可表示为:
Figure FDA0003830984690000038
其中,Sal表示模型最终预测图,Sigmoid表示sigmoid函数,Conv1×1表示卷积核尺寸为1×1的卷积层,Dropout表示概率为0.1的Dropout层,
Figure FDA0003830984690000039
表示解码器最后一层输出特征。
7.根据权利要求1所述的一种基于多尺度空间注意力的轻量化显著性检测方法,其特征在于:所述步骤六具体包括:
将图像尺寸统一调整为368×368;然后随机裁剪为336×336,批处理大小设置为12;利用Pytorch框架进行训练部署;采用交叉熵损失函数计算预测图与真值图之间的差异,利用Adam优化器进行参数更新操作,初始学习率设置为1.5×10-3
CN202211098512.7A 2022-09-03 2022-09-03 一种基于多尺度空间注意力的轻量化显著性检测方法 Active CN115375922B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211098512.7A CN115375922B (zh) 2022-09-03 2022-09-03 一种基于多尺度空间注意力的轻量化显著性检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211098512.7A CN115375922B (zh) 2022-09-03 2022-09-03 一种基于多尺度空间注意力的轻量化显著性检测方法

Publications (2)

Publication Number Publication Date
CN115375922A true CN115375922A (zh) 2022-11-22
CN115375922B CN115375922B (zh) 2023-08-25

Family

ID=84070716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211098512.7A Active CN115375922B (zh) 2022-09-03 2022-09-03 一种基于多尺度空间注意力的轻量化显著性检测方法

Country Status (1)

Country Link
CN (1) CN115375922B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132606A (zh) * 2023-10-24 2023-11-28 四川大学 用于肺部病变图像的分割方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183360A (zh) * 2020-09-29 2021-01-05 上海交通大学 高分辨率遥感影像的轻量化语义分割方法
CN114241308A (zh) * 2021-12-17 2022-03-25 杭州电子科技大学 一种基于压缩模块的轻量化遥感图像显著性检测方法
KR20220050758A (ko) * 2020-10-16 2022-04-25 현대자동차주식회사 다차원 어텐션 메커니즘에 기반한 다방향 장면 텍스트 인식 방법 및 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183360A (zh) * 2020-09-29 2021-01-05 上海交通大学 高分辨率遥感影像的轻量化语义分割方法
KR20220050758A (ko) * 2020-10-16 2022-04-25 현대자동차주식회사 다차원 어텐션 메커니즘에 기반한 다방향 장면 텍스트 인식 방법 및 시스템
CN114241308A (zh) * 2021-12-17 2022-03-25 杭州电子科技大学 一种基于压缩模块的轻量化遥感图像显著性检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
申凯;王晓峰;杨亚东;: "基于双向消息链路卷积网络的显著性物体检测", 智能系统学报, no. 06 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132606A (zh) * 2023-10-24 2023-11-28 四川大学 用于肺部病变图像的分割方法
CN117132606B (zh) * 2023-10-24 2024-01-09 四川大学 用于肺部病变图像的分割方法

Also Published As

Publication number Publication date
CN115375922B (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
LU503090B1 (en) A semantic segmentation system and method based on dual feature fusion for iot sensing
CN113033570B (zh) 一种改进空洞卷积和多层次特征信息融合的图像语义分割方法
CN112699937B (zh) 基于特征引导网络的图像分类与分割的装置、方法、设备及介质
US20190087713A1 (en) Compression of sparse deep convolutional network weights
CN111091045A (zh) 一种基于时空注意力机制的手语识别方法
CN109671026B (zh) 基于空洞卷积及自动编解码神经网络的灰度图像降噪方法
CN112435282B (zh) 一种基于自适应候选视差预测网络的实时双目立体匹配方法
CN109886391B (zh) 一种基于空间正反对角卷积的神经网络压缩方法
CN113870335A (zh) 一种基于多尺度特征融合的单目深度估计方法
CN113362242B (zh) 基于多特征融合网络的图像修复方法
WO2021042857A1 (zh) 图像分割模型的处理方法和处理装置
CN115620010A (zh) 一种rgb-t双模态特征融合的语义分割方法
CN113222998B (zh) 基于自监督低秩网络的半监督图像语义分割方法及装置
CN110543895A (zh) 一种基于VGGNet和ResNet的图像分类方法
CN113076947A (zh) 一种交叉引导融合的rgb-t图像显著性检测系统
CN116863194A (zh) 一种足溃疡图像分类方法、系统、设备及介质
CN116109920A (zh) 一种基于Transformer的遥感图像建筑物提取方法
CN113971735A (zh) 一种深度图像聚类方法、系统、设备、介质及终端
CN115375922B (zh) 一种基于多尺度空间注意力的轻量化显著性检测方法
CN116703947A (zh) 一种基于注意力机制和知识蒸馏的图像语义分割方法
CN114241308B (zh) 一种基于压缩模块的轻量化遥感图像显著性检测方法
CN113378938B (zh) 一种基于边Transformer图神经网络的小样本图像分类方法及系统
US20220301106A1 (en) Training method and apparatus for image processing model, and image processing method and apparatus
CN111667401A (zh) 多层次渐变图像风格迁移方法及系统
CN114494284B (zh) 一种基于显式监督区域关系的场景解析模型及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant