CN115375922A - 一种基于多尺度空间注意力的轻量化显著性检测方法 - Google Patents
一种基于多尺度空间注意力的轻量化显著性检测方法 Download PDFInfo
- Publication number
- CN115375922A CN115375922A CN202211098512.7A CN202211098512A CN115375922A CN 115375922 A CN115375922 A CN 115375922A CN 202211098512 A CN202211098512 A CN 202211098512A CN 115375922 A CN115375922 A CN 115375922A
- Authority
- CN
- China
- Prior art keywords
- scale
- convolution
- layer
- lightweight
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 44
- 238000000605 extraction Methods 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 claims description 29
- 230000006870 function Effects 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 19
- 230000004913 activation Effects 0.000 claims description 12
- 238000010586 diagram Methods 0.000 claims description 8
- 230000010339 dilation Effects 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/32—Normalisation of the pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/34—Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于多尺度空间注意力的轻量化显著性检测方法,包括以下步骤:步骤一、构建多尺度特征提取模块,并对输入信息进行处理;步骤二、依据深度可分离卷积及多尺度特征提取模块构建编码器,用于获取多级语义特征;步骤三、构建多尺度空间注意力模块;步骤四、依据深度可分离卷积与多尺度空间注意力模块构建解码器;步骤五、以编码器、解码器为基础,建立轻量化显著性检测模型;步骤六、对所建立轻量化显著性检测模型进行训练,并保存训练所得最终模型参数;本发明通过对图像中多尺度特征的充分挖掘以及图像全局特征的提取与利用,强化了轻量化模型的检测能力,在保持轻量化模型自身优势的同时,提升了模型的检测精度。
Description
技术领域
本发明涉及一种基于多尺度空间注意力的轻量化显著性检测方法,属于计算机视觉技术领域。
背景技术
随着计算机视觉领域的发展,显著性检测因其自身特性被广泛地应用于图像/视频压缩,视频质量评价以及目标检测等领域中,在学术上已取得了丰硕的研究成果。此外,为了将显著性检测技术应用于实际生产生活中,需要考虑模型的处理速度以及模型参数量,于是轻量化显著性检测在近年受到研究者的广泛关注。
显著性检测的目的在于找到图像当中最吸引人眼注意力关注的一个或多个目标,在实际生产生活中能帮助系统优先处理重要区域的图像信息,加快系统任务处理速度。在显著性检测的理论研究过程中,科研人员依据卷积神经网络构建了众多性能优秀的模型,能有效地解决现有图像中显著性检测的基本问题。然而,在实际应用的过程中,基于传统卷积神经网络的显著性检测模型因其庞大的参数量,导致系统处理速度过慢,从而降低整体性能。
为了解决显著性检测模型的实际应用问题,研究者们开始探索轻量化显著性检测模型,通过以深度可分离卷积为基础结构的方式,大幅度减小了模型参数量,有效地提升了模型的处理速度。另一方面,现有轻量化显著性检测模型在追求轻和快的过程中,降低了模型对于图像全局的关注能力,从而导致检测性能相比于现有模型仍有一定差距。
发明内容
本发明的目的是针对现有方法存在的不足,提供一种基于多尺度空间注意力的轻量化显著性检测方法。
为实现上述目的,本发明的技术方案是:
一种基于多尺度空间注意力的轻量化显著性检测方法,包括以下步骤:
步骤一、构建多尺度特征提取模块,并对输入信息进行处理;
步骤二、依据深度可分离卷积及多尺度特征提取模块构建编码器,用于获取多级语义特征;
步骤三、构建多尺度空间注意力模块;
步骤四、依据深度可分离卷积与多尺度空间注意力模块构建解码器;
步骤五、以编码器、解码器为基础,建立轻量化显著性检测模型;
步骤六、对所建立轻量化显著性检测模型进行训练,并保存训练所得最终模型参数。
所述步骤一具体包括:
首先将输入多尺度特征提取模块的信息分别通过不同膨胀率的深度可分离卷积,获得4种感受野下的多尺度特征;再利用深度可分离卷积融合多尺度特征作为模块输出;其过程可表示为:
所述步骤二具体包括:
利用卷积,批量归一化操作和Relu激活函数及步骤一构建的多尺度特征提取模块构成编码器的第一层;其次,利用步长为2的深度可分离卷积与多尺度特征提取模块分别构成编码器的第二层至第五层,其过程可表示为:
其中,表示编码器提取获得的多级语义特征,MSFAi表示i个连续的多尺度特征提取模块,Conv表示卷积,批量归一化操作和Relu激活函数,Input表示模型输入图像,DSConv2表示步长为2的深度可分离卷积。
所述步骤三具体包括:
利用三种不同膨胀率的深度可分离卷积对输入信息进行处理;经过卷积核尺寸为1×1的卷积层和sigmoid激活函数,得到空间注意力图;后将空间注意力图与输入信息进行点乘操作,得到加权强化后的信息;将加权强化后的信息作为多尺度空间注意力模块输出;其过程可表示:
OFeature=SWeight*IFeature
其中,SWeight表示空间注意力图,Sigmoid表示sigmoid激活函数,Conv1×1表示卷积核尺寸为1×1的卷积层,表示膨胀率为i的深度可分离卷积,IFeature表示输入信息,OFeature表示输出信息,*表示点乘操作。
所述步骤四具体包括:
利用卷积核尺寸分别为3×3和5×5的深度可分离卷积以及步骤三构建的多尺度空间注意力模块组成解码器各层;其次,将编码器对应层特征与解码器上一层特征通过相加操作融合,送入解码器相应层中;最后,依次通过卷积核尺寸为3×3的深度可分离卷积,多尺度空间注意力模块以及卷积核尺寸为5×5的深度可分离卷积,得到解码器各层输出;其过程可表示为:
其中,表示解码器各层对应的输出,表示卷积核尺寸为3×3膨胀率为2的深度可分离卷积,MSSA表示多尺度空间注意力模块,表示卷积核尺寸为5×5的深度可分离卷积,表示编码器对应层的输出,Up表示双线性插值的上采样操作,+表示相加操作。
所述步骤五具体包括:
依据编码器从输入图像提取多级语义特征通过解码器融合来自编码器对应层的特征以及解码器上一层的特征,得到解码器各层输出后将解码器最后一层输出经过Dropout层,卷积核尺寸为1×1的卷积层以及Sigmoid函数得到最终显著性预测图,构建完整的轻量化显著性检测模型;其过程可表示为:
所述步骤六具体包括:
将图像尺寸统一调整为368×368;然后随机裁剪为336×336,批处理大小设置为12;利用Pytorch框架进行训练部署;采用交叉熵损失函数计算预测图与真值图之间的差异,利用Adam优化器进行参数更新操作,初始学习率设置为1.5×10-3
与现有技术相比,本发明的有益效果在于:
本发明构建多尺度特征提取模块,用于提取输入图像的多尺度特征,并依此构建多级编码结构;此外,多尺度空间注意力模块,有助于提高轻量化模型对于全局特征的关注能力;最后,以深度可分离卷积为基础,结合多尺度特征提取模块与多尺度空间注意力模块,构建轻量化显著性检测模型。通过对图像中多尺度特征的充分挖掘以及图像全局特征的提取与利用,强化了轻量化模型的检测能力,在保持轻量化模型自身优势的同时,提升了模型的检测精度。
本发明中编码器通过采用以深度可分离卷积为基础的多尺度特征提取模块,有效地提高了编码器对于图像多尺度特征的挖掘。另一方面,解码器部分多尺度空间注意力模块的引入,能很好地帮助模型提升对于全局信息的关注能力。本发明方法通过利用多尺度特征及空间注意力,强化了轻量化模型对于全局特征的提取及利用能力,从而较好地实现了检测性能与模型大小之间的平衡。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于多尺度空间注意力的轻量化显著性检测方法的多尺度特征提取模块结构图;
图2为本发明基于多尺度空间注意力的轻量化显著性检测方法的多尺度空间注意力模块结构图;
图3为本发明基于多尺度空间注意力的轻量化显著性检测方法的模型结构图;
图4为本发明基于多尺度空间注意力的轻量化显著性检测方法的结果对比图,第一列为原图像,第二列为真值图,第三列为本发明方法实施例的结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于多尺度空间注意力的轻量化显著性检测方法,包括以下步骤:
步骤一、构建多尺度特征提取模块,并对输入信息进行处理;
如图1所示,首先将输入多尺度特征提取模块的信息分别通过膨胀率为1、2、4、8的3×3深度可分离卷积,获得4种感受野下的多尺度特征并再次利用卷积核尺寸为3×3的深度可分离卷积融合多尺度特征作为模块输出;其过程可表示为:
步骤二、依据深度可分离卷积及多尺度特征提取模块构建编码器,用于获取多级语义特征;
如图3左侧结构所示,首先,利用卷积,批量归一化操作和Relu激活函数组成的卷积块及步骤一构建的多尺度特征提取模块构成编码器的第一层;其次,利用步长为2的3×3深度可分离卷积与块数为1,4,6,3的多尺度特征提取模块分别构成编码器的第二层至第五层,用于提取多级语义特征其通道数分别为16,32,64,96,128;其过程可表示为:
其中,表示编码器提取获得的多级语义特征,MSFAi表示i个连续的多尺度特征提取模块,Conv表示卷积,批量归一化操作和Relu激活函数,Input表示模型输入图像,DSConv2表示步长为2的深度可分离卷积。
步骤三、构建多尺度空间注意力模块;
如图2所示,首先,利用膨胀率为6,4,2的3×3深度可分离卷积对输入信息进行处理;其次,经过卷积核尺寸为1×1的卷积层和sigmoid激活函数,得到空间注意力图SWeight;然后将空间注意力图与输入特征进行点乘操作,得到加权强化后的信息OFeature;最后,将加权强化后的信息作为多尺度空间注意力模块输出,输出信息尺寸与输入信息尺寸保持一致;其过程可表示:
OFeature=SWeight*IFeature
其中,SWeight表示空间注意力图,Sigmoid表示sigmoid激活函数,Conv1×1表示卷积核尺寸为1×1的卷积层,表示膨胀率为i的深度可分离卷积,IFeature表示输入信息,OFeature表示输出信息,*表示点乘操作。
步骤四、依据深度可分离卷积与多尺度空间注意力模块构建解码器;
如图3右侧结构所示,首先,利用卷积核尺寸分别为3×3和5×5的深度可分离卷积以及步骤(3)构建的多尺度空间注意力模块组成解码器各层;其次,将编码器对应层特征与解码器上一层特征通过相加操作融合,送入解码器相应层中;最后,依次通过卷积核尺寸为3×3的深度可分离卷积,多尺度空间注意力模块以及卷积核尺寸为5×5的深度可分离卷积,得到解码器各层输出其通道数分别为96,64,32,16,16;其过程可表示为:
其中,表示解码器各层对应的输出,表示卷积核尺寸为3×3膨胀率为2的深度可分离卷积,MSSA表示多尺度空间注意力模块,表示卷积核尺寸为5×5的深度可分离卷积,表示编码器对应层的输出,Up表示双线性插值的上采样操作,+表示相加操作。
步骤五、以编码器、解码器为基础,建立轻量化显著性检测模型;
如图3所示,首先,我们依据编码器从输入图像提取多级语义特征;其次,我们通过解码器融合来自编码器对应层的特征以及解码器上一层的特征,得到解码器各层输出;最后,我们将解码器最后一层输出经过Dropout层,卷积核尺寸为的卷积层以及Sigmoid函数组成的输出层得到最终显著性预测图,预测图尺寸与输入图像尺寸大小一致,从而构建完整的轻量化显著性检测模型;其过程可表示为:
步骤六、对所建立轻量化显著性检测模型进行训练,并保存训练所得最终模型参数。
首先,将图像尺寸统一调整为368×368;然后随机裁剪为336×336,批处理大小设置为12;其次,利用Pytorch框架进行训练部署;最后,采用交叉熵损失函数计算预测图与真值图之间的差异,并利用Adam优化器进行参数更新操作,初始学习率设置为1.5×10-3。
图4为本发明方法结果对比图,第一列为原图像,第二列为真值图,第三列为本发明方法的结果图。
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。
Claims (7)
1.一种基于多尺度空间注意力的轻量化显著性检测方法,其特征在于:包括以下步骤:
步骤一、构建多尺度特征提取模块,并对输入信息进行处理;
步骤二、依据深度可分离卷积及多尺度特征提取模块构建编码器,用于获取多级语义特征;
步骤三、构建多尺度空间注意力模块;
步骤四、依据深度可分离卷积与多尺度空间注意力模块构建解码器;
步骤五、以编码器、解码器为基础,建立轻量化显著性检测模型;
步骤六、对所建立轻量化显著性检测模型进行训练,并保存训练所得最终模型参数。
4.根据权利要求1所述的一种基于多尺度空间注意力的轻量化显著性检测方法,其特征在于:所述步骤三具体包括:
利用三种不同膨胀率的深度可分离卷积对输入信息进行处理;经过卷积核尺寸为1×1的卷积层和sigmoid激活函数,得到空间注意力图;后将空间注意力图与输入信息进行点乘操作,得到加权强化后的信息;将加权强化后的信息作为多尺度空间注意力模块输出;其过程可表示:
OFeature=SWeight*IFeature
5.根据权利要求1所述的一种基于多尺度空间注意力的轻量化显著性检测方法,其特征在于:所述步骤四具体包括:
利用卷积核尺寸分别为3×3和5×5的深度可分离卷积以及步骤三构建的多尺度空间注意力模块组成解码器各层;其次,将编码器对应层特征与解码器上一层特征通过相加操作融合,送入解码器相应层中;最后,依次通过卷积核尺寸为3×3的深度可分离卷积,多尺度空间注意力模块以及卷积核尺寸为5×5的深度可分离卷积,得到解码器各层输出;其过程可表示为:
7.根据权利要求1所述的一种基于多尺度空间注意力的轻量化显著性检测方法,其特征在于:所述步骤六具体包括:
将图像尺寸统一调整为368×368;然后随机裁剪为336×336,批处理大小设置为12;利用Pytorch框架进行训练部署;采用交叉熵损失函数计算预测图与真值图之间的差异,利用Adam优化器进行参数更新操作,初始学习率设置为1.5×10-3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211098512.7A CN115375922B (zh) | 2022-09-03 | 2022-09-03 | 一种基于多尺度空间注意力的轻量化显著性检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211098512.7A CN115375922B (zh) | 2022-09-03 | 2022-09-03 | 一种基于多尺度空间注意力的轻量化显著性检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115375922A true CN115375922A (zh) | 2022-11-22 |
CN115375922B CN115375922B (zh) | 2023-08-25 |
Family
ID=84070716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211098512.7A Active CN115375922B (zh) | 2022-09-03 | 2022-09-03 | 一种基于多尺度空间注意力的轻量化显著性检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115375922B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117132606A (zh) * | 2023-10-24 | 2023-11-28 | 四川大学 | 用于肺部病变图像的分割方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183360A (zh) * | 2020-09-29 | 2021-01-05 | 上海交通大学 | 高分辨率遥感影像的轻量化语义分割方法 |
CN114241308A (zh) * | 2021-12-17 | 2022-03-25 | 杭州电子科技大学 | 一种基于压缩模块的轻量化遥感图像显著性检测方法 |
KR20220050758A (ko) * | 2020-10-16 | 2022-04-25 | 현대자동차주식회사 | 다차원 어텐션 메커니즘에 기반한 다방향 장면 텍스트 인식 방법 및 시스템 |
-
2022
- 2022-09-03 CN CN202211098512.7A patent/CN115375922B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183360A (zh) * | 2020-09-29 | 2021-01-05 | 上海交通大学 | 高分辨率遥感影像的轻量化语义分割方法 |
KR20220050758A (ko) * | 2020-10-16 | 2022-04-25 | 현대자동차주식회사 | 다차원 어텐션 메커니즘에 기반한 다방향 장면 텍스트 인식 방법 및 시스템 |
CN114241308A (zh) * | 2021-12-17 | 2022-03-25 | 杭州电子科技大学 | 一种基于压缩模块的轻量化遥感图像显著性检测方法 |
Non-Patent Citations (1)
Title |
---|
申凯;王晓峰;杨亚东;: "基于双向消息链路卷积网络的显著性物体检测", 智能系统学报, no. 06 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117132606A (zh) * | 2023-10-24 | 2023-11-28 | 四川大学 | 用于肺部病变图像的分割方法 |
CN117132606B (zh) * | 2023-10-24 | 2024-01-09 | 四川大学 | 用于肺部病变图像的分割方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115375922B (zh) | 2023-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
LU503090B1 (en) | A semantic segmentation system and method based on dual feature fusion for iot sensing | |
CN113033570B (zh) | 一种改进空洞卷积和多层次特征信息融合的图像语义分割方法 | |
CN112699937B (zh) | 基于特征引导网络的图像分类与分割的装置、方法、设备及介质 | |
US20190087713A1 (en) | Compression of sparse deep convolutional network weights | |
CN111091045A (zh) | 一种基于时空注意力机制的手语识别方法 | |
CN109671026B (zh) | 基于空洞卷积及自动编解码神经网络的灰度图像降噪方法 | |
CN112435282B (zh) | 一种基于自适应候选视差预测网络的实时双目立体匹配方法 | |
CN109886391B (zh) | 一种基于空间正反对角卷积的神经网络压缩方法 | |
CN113870335A (zh) | 一种基于多尺度特征融合的单目深度估计方法 | |
CN113362242B (zh) | 基于多特征融合网络的图像修复方法 | |
WO2021042857A1 (zh) | 图像分割模型的处理方法和处理装置 | |
CN115620010A (zh) | 一种rgb-t双模态特征融合的语义分割方法 | |
CN113222998B (zh) | 基于自监督低秩网络的半监督图像语义分割方法及装置 | |
CN110543895A (zh) | 一种基于VGGNet和ResNet的图像分类方法 | |
CN113076947A (zh) | 一种交叉引导融合的rgb-t图像显著性检测系统 | |
CN116863194A (zh) | 一种足溃疡图像分类方法、系统、设备及介质 | |
CN116109920A (zh) | 一种基于Transformer的遥感图像建筑物提取方法 | |
CN113971735A (zh) | 一种深度图像聚类方法、系统、设备、介质及终端 | |
CN115375922B (zh) | 一种基于多尺度空间注意力的轻量化显著性检测方法 | |
CN116703947A (zh) | 一种基于注意力机制和知识蒸馏的图像语义分割方法 | |
CN114241308B (zh) | 一种基于压缩模块的轻量化遥感图像显著性检测方法 | |
CN113378938B (zh) | 一种基于边Transformer图神经网络的小样本图像分类方法及系统 | |
US20220301106A1 (en) | Training method and apparatus for image processing model, and image processing method and apparatus | |
CN111667401A (zh) | 多层次渐变图像风格迁移方法及系统 | |
CN114494284B (zh) | 一种基于显式监督区域关系的场景解析模型及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |