CN112330681B - 一种基于注意力机制的轻量级网络实时语义分割方法 - Google Patents

一种基于注意力机制的轻量级网络实时语义分割方法 Download PDF

Info

Publication number
CN112330681B
CN112330681B CN202011235609.9A CN202011235609A CN112330681B CN 112330681 B CN112330681 B CN 112330681B CN 202011235609 A CN202011235609 A CN 202011235609A CN 112330681 B CN112330681 B CN 112330681B
Authority
CN
China
Prior art keywords
stage
feature
image
convolution
semantic segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011235609.9A
Other languages
English (en)
Other versions
CN112330681A (zh
Inventor
杨金福
王康
李明爱
袁帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202011235609.9A priority Critical patent/CN112330681B/zh
Publication of CN112330681A publication Critical patent/CN112330681A/zh
Application granted granted Critical
Publication of CN112330681B publication Critical patent/CN112330681B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于注意力机制的轻量级网络实时语义分割方法,用以解决分割精度与分割效率难以达到平衡,不能满足实际应用的问题。包括:图像数据准备;构建基于注意力机制的轻量级实时语义分割网络,提出一种新的非对称编码‑解码网络结构,在编码器中,使用了轻量化模块‑可分离非对称模块,该模块结合了深度可分离非对称卷积和空洞卷积的优点,在保持精度的同时大大降低了计算量;在解码器中设计了一个注意力特征融合模块,将编码器中的特征与解码器中的特征进行融合,将其融合后的的特征经过注意力机制的选择和组合,增强对恢复图像信息有用的特征,有效提高了网络分割的精度;最终利用训练完成的分割网络实现语义分割。

Description

一种基于注意力机制的轻量级网络实时语义分割方法
技术领域:
本发明属于图像语义分割技术领域,涉及一种基于注意力机制的轻量级网络实时语义分割方法。
背景技术:
近年来,随着计算机技术和传感器技术的飞速发展,机器人研究取得了巨大的进步,越来越多的服务机器人被广泛地应用于社会生产生活中。机器人服务人类时,首先需要建立对周围环境的认知和理解,然后完成一系列其他任务,如机器人定位、导航、路径规划等,因此对环境的认知和理解能力直接影响着机器人性能的优劣。语义分割是场景理解的基石性技术,它将图像中的每个像素按照语义含义的不同进行分组,也就是对图像中的每个像素进行分类。图像经过语义分割后,通过将低层图像特征映射为高层语义特征,可以帮助机器人更好地理解图像中的高层信息,为后续的分析决策提供参考依据。目前,利用语义分割技术构建语义地图,能够帮助机器人更好地理解周围场景,已经成为机器人地图构建的主要趋势。然而语义分割需要大量的计算,机器人不能实时进行环境感知。针对上述问题,有学者提出利用轻量化模型,以减少网络的参数量,提高实时性,但轻量化模型为了减少网络层数,简化了解码器中的操作,忽视了解码器恢复信息的能力,导致准确性大大降低。因此,面向机器人环境感知的实时语义分割是一个具有挑战性的问题。
当前,基于深度神经网络的语义分割的研究主要集中在两个方向:(1)通过增加网络深度来提高分割精度;(2)通过降低网络层数,构建轻量级模型,提高分割效率。在提高网络分割精度方面,2017年Zhao,H.,Shi,J.,Qi,X.,Wang,X.,Jia,J.:Pyramid sceneparsing network.In:2017 IEEE Conference on Computer Vision and PatternRecognition(CVPR)(2017)提出利用金字塔池化模块来聚合不同区域的上下文信息,进而提高获取全局信息的能力;2017年Lin,G.,Milan,A.,Shen,C.,Reid,I.D.:RefineNet:Multi-path refinement networks for high-resolution semantic segmentation In:2017 IEEE Conference on Computer Vision and Pattern Recognition(CVPR)(2017)引入长距离残差连接融合不同尺度特征,通过递归方法提取低分辨率特征信息来生成高分辨率特征。上述语义分割算法在分割精度方面有了很大的提高,但网络结构过于复杂,无法满足实际应用的实时性要求。在提升网络效率方面,2016年Paszke A,Chaurasia A,Kim S,etal.ENet:A Deep Neural Network Architecture for Real-Time SemanticSegmentation[J].2016.(2016)设计了具有瓶颈模块的非对称编解码器结构,在网络前端不断向下采样以降低特征图的分辨率,并将瓶颈模块与非对称卷积结合以进一步提高分割效率,2018年Zhao,H.,Qi,X.,Shen,X.,Shi,J.,Jia,J.:ICNet for Real-Time SemanticSegmentation on High-Resolution images:15th European Conference,Munich,Germany,September 8–14,2018,Proceedings,Part III edn,pp.418–434(2018)设计了一种将特征融合单元与标签引导相结合的图像级联网络,可以在较低计算量下逐步细化分割预测。虽然这些工作在降低计算成本和模型参数方面取得了很大进展,但由于没有有效联合编解码的信息,导致分割精度降低,难以满足实际应用中的可靠性要求。
发明内容:
本发明的目的在于提供了一种基于注意力机制的轻量级网络实时语义分割方法,更好地解决现有技术中的图像语义分割难以达到分割精度与分割效率平衡的问题,以满足机器人对现实环境实时分割的需求。
为了达到上述目的,本发明的技术方案是提供一种基于注意力机制的轻量级网络实时语义分割方法,通过在编码器中利用轻量化模块-可分离非对称模块(SAM),降低模型参数,在解码器中利用注意力机制联合编码器信息,恢复图像丢失的细节信息,提高分割精度,包括以下步骤:
步骤1:准备图像数据集用于训练和测试;
步骤2:构建基于注意力机制的轻量级实时语义分割网络;
步骤3:将训练集图像输入到轻量级实时语义分割网络中,得到预测图像,将其与数据集中的语义标签图像进行对比,计算出交叉熵函数作为损失函数,利用随机梯度下降法作为参数优化算法更新模型参数,获得训练好的轻量级实时语义分割模型;
步骤4:将测试集图像输入到训练好的轻量级实时语义分割模型中,得到图像语义分割结果。
步骤2中,所述的基于注意力机制的轻量级实时语义分割网络采用非对称编码-解码结构。不同于以往语义分割方法所用的非对称结构,本发明没有在解码器中直接使用简单的双线性插值进行上采样,而是利用注意力机制联合编解码信息,恢复编码器中丢失的信息。因为,利用插值法扩大图像尺寸会增加无用信息,并且会造成图像位置信息损失,影响分割精度。注意力机制可以有选择性地关注重要信息,其核心思想是对编码器的所有输出进行加权组合后,将原始数据的上下文信息,输入到当前位置的解码器中来影响解码器的输出。具体来说,编码器中除了使用3个3×3的标准卷积外,还包含9个可分离非对称模块(SAM)和2个平行下采样模块(PDM),其中可分离非对称模块包含两个分支,左分支包含一个3×1和一个1×3的非对称深度卷积来提取图像特征,右分支包含一个3×1和一个1×3的深度空洞卷积,可以有效增加特征图感受野,两个分支经过相加(Add)之后再经过一个1×1卷积来恢复通道数,最后将相加后的结果与输入相加(Add)组成残差连接。平行下采样模块由一个2×2的最大池化和一个3×3卷积Concat后形成,其中3×3卷积可以增加感受野,最大池化操作可以提高分割效率。解码器包括顺次连接的1个1×1卷积、1个2倍双线性上采样单元、1个注意力特征融合模块(AFFM)、1个1×1卷积、1个4倍双线性上采样单元。注意力特征融合模块的具体操作为:首先将低级特征与高级特征通道连接,然后利用全局池化将连接后的特征转化为特征向量,并计算权重向量。权值向量V被定义为:
V=σ[W2δ[W1(GFn)]]
其中Fn为连接后的特征图,G是全局池化操作,W1和W2为全连接操作,σ为Sigmoid激活函数,δ为Relu激活函数;
最后将权值向量V与原始特征相乘得到更新后的特征图,逐点求和后与原始特征图相加。最终输出的特征图F根据下式得到:
F=V·Fn+Fn
所述步骤3中的网络训练过程包括:
步骤3.1:将训练集中的图像进行预处理和数据增强,具体来说,对训练集中的图像进行水平翻转、随机裁剪、随机缩放尺度来扩充数据集,其中随机缩放尺度范围为0.5到2倍之间。
步骤3.2:初始化参数,将一次训练样本数量设为8,权重衰减值设为0.0001,初始学习率设为0.045,动量系数设为0.9。
步骤3.3:将训练集中经过预处理和数据增强处理后的的图像输入到设计的轻量级实时语义分割模型中,得到预测结果,然后,计算预测结果与训练集中图像标签值的交叉熵损失函数值:
其中为模型预测值,y为预测特征图对应的语义标签值;
步骤3.4:使用随机梯度下降法和多项式学习策略优化损失函数,其中多项式学习策略中的学习率lr被设置为:
其中baselr为初始学习率,iter为当前迭代次数,total_iter为总迭代次数,power为多项式的幂。
本发明的有益效果为:
(1)本发明在编码器中使用了一个可分离非对称模块和平行下采样模块,能够在显著减少模型参数量的情况下,有效提取图像特征信息。
(2)本发明在解码器中设计了一个注意力特征融合模块,将编码器中的特征与解码器中的特征进行融合,将其融合后的特征经过注意力机制的选择和组合,增强对恢复图像信息有用的特征,有效提高了网络分割的精度。
附图说明
图1为本发明的实现流程图;
图2为本发明提出的基于注意力机制的轻量级实时语义分割网络结构图;
图3为本发明的平行下采样模块PDM结构图;
图4为本发明的可分离非对称模块SAM结构图;
图5为本发明的注意力特征融合模块AFFM结构图;
图6为本发明在Cityscapes数据集上的分割结果图,(a1-a2)表示输入图像,(b1-b2)表示对应的标注图像,(c1-c2)表示本发明的预测结果图。
具体实施方式
下面结合具体实施例与附图对本发明进行详细描述。
如图1所示,一种基于注意力机制的轻量级网络实时语义分割方法包括以下步骤:
步骤1:准备图像数据集用于训练和测试;
本实施例中以Cityscapes数据集中的类别为基准,该数据集包含来自50个不同城市的街道场景的5000幅精细标注图像,其中训练集有2975幅图像,验证集有500幅图像,测试集有1525幅图像,以及带有粗标注的19998幅图像。本实施例仅使用经过精细标注的图像进行训练,图像分辨率为1024×2048。数据集中的所有像素可以被标记为30个类别,其中选择19个类别进行训练和测试。
步骤2:构建基于注意力机制的轻量级实时语义分割网络;
如图2所示,所述基于注意力机制的轻量级实时语义分割网络采用非对称编码-解码结构,将网络分为4个阶段,其中前三个阶段为编码器,第四个阶段为解码器。阶段1负责提取低级特征,阶段2和阶段3负责提取更大范围的上下文信息,阶段4负责恢复图像信息和尺寸。具体来说,先将图像输入到阶段1中,网络前三层使用标准3×3卷积进行特征提取,随后经过平行下采样模块PDM将特征图尺寸缩小为原来的1/4,平行下采样模块PDM结构如图3所示,它由一个2×2的最大池化和一个3×3卷积Concat后形成,其中3×3卷积可以增加感受野,最大池化操作可以提高分割效率。将阶段1得到的特征图输入到阶段2中,经过3个带有空洞率为2的可分离非对称模块SAM,提取到特征的上下文信息,然后将阶段1的输出和第三个SAM的输出进行连接操作C,接下来,利用平行下采样模块PDM降低特征图尺寸,减少参数量。可分离非对称模块SAM结构如图4所示,首先将输入进行3×3卷积,然后将得到的特征图分为两部分,左分支包含一个3×1和一个1×3的非对称深度卷积来提取图像特征,右分支包含一个3×1和一个1×3的深度空洞卷积,可以有效增加特征图感受野,两个分支经过相加(Add)之后再经过一个1×1卷积来恢复通道数,最后将相加后的结果与输入相加(Add)组成残差连接。阶段3包含6个可分离非对称模块SAM,空洞率分别为4,4,8,8,16,16,可以有效提取特征图不同尺度的上下文信息。最后将阶段2的输出和第6个SAM的输出进行连接操作C,得到编码后的特征图。图像经过编码后特征图尺寸变为原来的1/8,因此需要经过解码器恢复到原始图像尺寸。在阶段4中,将第三阶段得到的编码后的特征图首先经过1×1卷积减少通道数,然后经过2倍上采样得到图像的高级特征,接下来与第一阶段得到的低级特征进行连接操作C得到原始特征Fn,利用注意力特征融合模块AFFM完成对原始特征Fn的重新选择和组合,最后利用1×1卷积和4倍上采样,恢复到图像原始尺寸。
其中,注意力特征融合模块AFFM的工作过程具体为:利用全局池化将原始特征Fn转化为特征向量,并依次经过1×1卷积、Relu激活函数、1×1卷积、Sigmoid激活函数,得到权重向量V,接下来,将权值向量V与原始特征Fn相乘得到更新后的特征图,最后,更新后的特征图与原始特征图Fn逐点相加,完成对特征的重新选择和组合,其中,权值向量V的计算公式如下:
V=σ[W2δ[W1(GFn)]]
其中Fn为连接后的特征图,G是全局池化操作,W1和W2为全连接操作,σ为Sigmoid激活函数,δ为Relu激活函数;
基于注意力机制的轻量级实时语义分割网络具体结构如表1所示:
表1网络的详细结构
步骤3:将Cityscapes训练集图像输入到轻量级实时语义分割网络中,得到预测图像,将其与数据集中的语义标签图像进行对比,计算出交叉熵函数作为损失函数,利用随机梯度下降法作为参数优化算法更新模型参数,获得训练好的轻量级实时语义分割模型;
具体的网络训练过程包括:
步骤3.1:首先将Cityscapes训练集中的图像进行归一化处理,然后将其随机裁剪为512×1024尺寸大小,再对训练集中的图像进行数据增强处理,具体增强方式包括:水平翻转、随机裁剪、随机缩放尺度;
步骤3.2:初始化参数,将一次训练样本数量设为8,权重衰减值设为0.0001,初始学习率设为0.045,动量系数设为0.9;
步骤3.3:将数据集中预处理后的图像输入到设计的轻量级实时语义分割模型中,得到预测结果,然后,计算预测结果与训练集中图像标签值的交叉熵损失函数值:
其中为模型预测值,y为预测特征图对应的语义标签值;
步骤3.4:使用随机梯度下降法和多项式学习策略优化损失函数,完成对轻量级实时语义分割网络的训练,其中多项式学习策略中的学习率lr被设置为:
其中baselr为初始学习率,iter为当前迭代次数,total_iter为总迭代次数,power为多项式的幂;
步骤4:将Cityscapes测试集图像输入到训练好的轻量级语义分割模型中,得到图像语义分割结果;
本发明在Cityscapes数据集上的分割结果图如图6所示,其中(a1-a2)表示输入图像,(b1-b2)表示对应的标注图像,(c1-c2)表示本发明的预测结果图。
表2展示了本发明在Cityscapes数据集上与其他最先进方法在分割精度(mIoU)与分割速度(FPS)上的比较,本发明的模型参数为0.9M,与LEDNet非常接近,但精度比LEDNet有1.9%的改进。此外,ENet是目前最小的语义分割模型,比本发明少了3倍的参数,但是精度远低于本发明取得的72.5%mIoU。为了公平地比较速度,所有的速度比较实验都在一个980Ti GPU上进行。对于512×1024的输入,本发明能够取得46.7FPS的速度,满足了实时性要求。综上可知,本发明取得了分割精度与分割效率的平衡,满足了实际应用的需求。
表2本发明在测试集上与其他最先进方法对比

Claims (2)

1.一种基于注意力机制的轻量级网络实时语义分割方法,其特征在于,通过在编码器中利用轻量化模块-可分离非对称模块,降低模型参数,在解码器中利用注意力机制联合编码器信息,恢复图像丢失的细节信息,提高分割精度,具体包括以下步骤:
步骤1:准备图像数据集用于训练和测试;
步骤2:构建基于注意力机制的轻量级实时语义分割网络;
步骤3:训练轻量级实时语义分割网络:将训练集图像输入到轻量级实时语义分割网络中,得到预测图像,将其与数据集中的语义标签图像进行对比,计算出交叉熵函数作为损失函数,利用随机梯度下降法作为参数优化算法更新模型参数,获得训练好的轻量级实时语义分割模型;
步骤4:将测试集图像输入到训练好的轻量级实时语义分割模型中,得到图像语义分割结果;
步骤2中,所述基于注意力机制的轻量级实时语义分割网络采用非对称编码-解码结构,将网络分为4个阶段,其中前三个阶段为编码器,第四个阶段为解码器;阶段1负责提取低级特征,阶段2和阶段3负责提取更大范围的上下文信息,阶段4负责将编码后的特征图恢复到原始图像尺寸;
具体来说,阶段1的工作过程具体为:先将图像输入到阶段1中,阶段1所述网络的前三层使用标准3×3卷积进行特征提取,随后经过平行下采样模块PDM将特征图尺寸缩小为原来的1/4,其中,所述平行下采样模块PDM结构由一个2×2的最大池化和一个3×3卷积Concat后形成,其中3×3卷积用于增加感受野,最大池化操作用于提高分割效率;
阶段2的工作过程具体为:阶段1得到的特征图依次经过3个带有空洞率为2的可分离非对称模块SAM,提取到特征的上下文信息,然后将阶段1的输出和第三个SAM的输出进行连接操作C,接下来,利用平行下采样模块PDM降低连接操作后的特征图尺寸,减少参数量,其中,所述可分离非对称模块SAM结构工作过程为,首先将输入进行3×3卷积,然后将得到的特征图分别输入左、右分支,其中,左分支依次包含一个3×1和一个1×3的非对称深度卷积,用于提取图像特征,右分支依次包含一个3×1和一个1×3的深度空洞卷积,用于增加特征图感受野,两路分支经过相加Add之后再经过一个1×1卷积来恢复通道数,最后将相加后的结果与可分离非对称模块SAM对应的输入相加Add组成残差连接;
阶段3的工作过程具体为:将阶段2得到的特征图输入到阶段3中,阶段3依次包含6个可分离非对称模块SAM,空洞率分别为4,4,8,8,16,16,用于提取特征图不同尺度的上下文信息,最后将阶段2的输出和第6个SAM的输出进行连接操作C,得到编码后的特征图;
阶段4工作过程具体为:第三阶段得到的编码后的特征图首先经过1×1卷积减少通道数,然后经过2倍上采样得到图像的高级特征,接下来与第一阶段得到的低级特征进行连接操作C得到原始特征Fn,利用注意力特征融合模块AFFM完成对原始特征Fn的重新选择和组合,最后利用1×1卷积和4倍上采样,恢复到图像原始尺寸;
其中,注意力特征融合模块AFFM的工作过程具体为:利用全局池化将原始特征Fn转化为特征向量,并依次经过1×1卷积、Relu激活函数、1×1卷积、Sigmoid激活函数,得到权重向量V,接下来,将权值向量V与原始特征Fn相乘得到更新后的特征图,最后,更新后的特征图与原始特征Fn逐点相加,完成对特征的重新选择和组合,其中,权值向量V的计算公式如下:
V=σ[W2δ[W1(GFn)]]
其中Fn为原始特征,G是全局池化操作,W1和W2为全连接操作,σ为Sigmoid激活函数,δ为Relu激活函数。
2.根据权利要求1所述的一种基于注意力机制的轻量级网络实时语义分割方法,其特征在于,所述步骤3中的网络训练过程具体包括:
步骤3.1:将训练集中的图像进行预处理和数据增强,具体来说,对训练集中的图像进行水平翻转、随机裁剪、随机缩放尺度来扩充数据集,其中随机缩放尺度范围为0.5到2倍之间;
步骤3.2:初始化参数,将一次训练样本数量设为8,权重衰减值设为0.0001,初始学习率设为0.045,动量系数设为0.9;
步骤3.3:将训练集中经过预处理和数据增强处理后的的图像输入到轻量级实时语义分割网络中,得到预测结果,然后,计算预测结果与训练集中图像标签值的交叉熵损失函数值:
其中为模型预测值,y为预测特征图对应的语义标签值;
步骤3.4:使用随机梯度下降法和多项式学习策略优化损失函数,其中多项式学习策略中的学习率lr被设置为:
其中baselr为初始学习率,iter为当前迭代次数,total_iter为总迭代次数,power为多项式的幂。
CN202011235609.9A 2020-11-06 2020-11-06 一种基于注意力机制的轻量级网络实时语义分割方法 Active CN112330681B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011235609.9A CN112330681B (zh) 2020-11-06 2020-11-06 一种基于注意力机制的轻量级网络实时语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011235609.9A CN112330681B (zh) 2020-11-06 2020-11-06 一种基于注意力机制的轻量级网络实时语义分割方法

Publications (2)

Publication Number Publication Date
CN112330681A CN112330681A (zh) 2021-02-05
CN112330681B true CN112330681B (zh) 2024-05-28

Family

ID=74315538

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011235609.9A Active CN112330681B (zh) 2020-11-06 2020-11-06 一种基于注意力机制的轻量级网络实时语义分割方法

Country Status (1)

Country Link
CN (1) CN112330681B (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112494063B (zh) * 2021-02-08 2021-06-01 四川大学 一种基于注意力机制神经网络的腹部淋巴结分区方法
CN112861978B (zh) * 2021-02-20 2022-09-02 齐齐哈尔大学 一种基于注意力机制的多分支特征融合遥感场景图像分类方法
CN113065578B (zh) * 2021-03-10 2022-09-23 合肥市正茂科技有限公司 一种基于双路区域注意力编解码的图像视觉语义分割方法
CN113011336B (zh) * 2021-03-19 2022-05-27 厦门大学 一种基于深度多分支聚合的实时街景图像语义分割方法
CN113158802A (zh) * 2021-03-22 2021-07-23 安徽理工大学 智慧场景分割技术
CN113096016A (zh) * 2021-04-12 2021-07-09 广东省智能机器人研究院 一种低空航拍图像拼接方法和系统
CN113159051B (zh) * 2021-04-27 2022-11-25 长春理工大学 一种基于边缘解耦的遥感图像轻量化语义分割方法
CN113240683B (zh) * 2021-06-08 2022-09-20 北京航空航天大学 基于注意力机制的轻量化语义分割模型构建方法
CN113642390B (zh) * 2021-07-06 2024-02-13 西安理工大学 一种基于局部注意力网络的街景图像语义分割方法
CN113496228B (zh) * 2021-07-30 2024-03-26 大连海事大学 一种基于Res2Net、TransUNet和协同注意力的人体语义分割方法
CN113657392B (zh) * 2021-08-16 2022-09-23 山东建筑大学 基于低秩混合注意力机制的小目标语义分割方法及系统
CN113706546B (zh) * 2021-08-23 2024-03-19 浙江工业大学 一种基于轻量级孪生网络的医学图像分割方法及装置
CN113792744B (zh) * 2021-09-14 2023-09-05 东北农业大学 一种低功耗广域网内农作物生长数据传输系统及方法
CN113888523B (zh) * 2021-10-20 2024-05-28 山西省机电设计研究院有限公司 一种强化x射线不锈钢焊缝缺陷实时语义分割方法
CN114119635B (zh) * 2021-11-23 2024-05-24 电子科技大学成都学院 一种基于空洞卷积的脂肪肝ct图像分割方法
CN114067116B (zh) * 2021-11-25 2024-05-17 天津理工大学 一种基于深度学习和权重分配的实时语义分割系统及方法
CN114332535B (zh) * 2021-12-30 2022-07-15 宁波大学 基于高分辨率的互补注意力UNet分类器的sMRI图像分类方法
CN114445442B (zh) * 2022-01-28 2022-12-02 杭州电子科技大学 基于非对称交叉融合的多光谱图像语义分割方法
CN114913325B (zh) * 2022-03-24 2024-05-10 北京百度网讯科技有限公司 语义分割方法、装置及计算机程序产品
CN114445430B (zh) * 2022-04-08 2022-06-21 暨南大学 轻量级多尺度特征融合的实时图像语义分割方法及系统
CN114494703B (zh) * 2022-04-18 2022-06-28 成都理工大学 一种智能车间场景目标轻量级语义分割方法
CN114842029A (zh) * 2022-05-09 2022-08-02 江苏科技大学 一种融合通道和空间注意力的卷积神经网络息肉分割方法
CN114723760B (zh) * 2022-05-19 2022-08-23 北京世纪好未来教育科技有限公司 人像分割模型的训练方法、装置及人像分割方法、装置
CN115272369B (zh) * 2022-07-29 2023-07-11 苏州大学 动态聚合变换器网络及视网膜血管分割方法
CN115731243B (zh) * 2022-11-29 2024-02-09 北京长木谷医疗科技股份有限公司 基于人工智能及注意力机制的脊柱图像分割方法及装置
CN116229065B (zh) * 2023-02-14 2023-12-01 湖南大学 一种基于多分支融合的机器人手术器械分割方法
CN116612288B (zh) * 2023-07-19 2023-11-07 南京信息工程大学 一种多尺度轻量级实时语义分割方法、系统
CN116740362B (zh) * 2023-08-14 2023-11-21 南京信息工程大学 一种基于注意力的轻量化非对称场景语义分割方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188817A (zh) * 2019-05-28 2019-08-30 厦门大学 一种基于深度学习的实时高性能街景图像语义分割方法
CN110490884A (zh) * 2019-08-23 2019-11-22 北京工业大学 一种基于对抗的轻量级网络语义分割方法
CN111462126A (zh) * 2020-04-08 2020-07-28 武汉大学 一种基于边缘增强的语义图像分割方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188817A (zh) * 2019-05-28 2019-08-30 厦门大学 一种基于深度学习的实时高性能街景图像语义分割方法
CN110490884A (zh) * 2019-08-23 2019-11-22 北京工业大学 一种基于对抗的轻量级网络语义分割方法
CN111462126A (zh) * 2020-04-08 2020-07-28 武汉大学 一种基于边缘增强的语义图像分割方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Depth-Wise Asymmetric Bottleneck With Point-Wise Aggregation Decoder for Real-Time Semantic Segmentation in Urban Scenes;Gen Li等;《IEEE Access》;20200205;第27495-27506页 *

Also Published As

Publication number Publication date
CN112330681A (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
CN112330681B (zh) 一种基于注意力机制的轻量级网络实时语义分割方法
CN110490884B (zh) 一种基于对抗的轻量级网络语义分割方法
CN112634276B (zh) 一种基于多尺度视觉特征提取的轻量级语义分割方法
CN111563508B (zh) 一种基于空间信息融合的语义分割方法
CN110111366B (zh) 一种基于多级损失量的端到端光流估计方法
CN113888744A (zh) 一种基于Transformer视觉上采样模块的图像语义分割方法
CN112258526B (zh) 一种基于对偶注意力机制的ct肾脏区域级联分割方法
CN113657388B (zh) 一种融合图像超分辨率重建的图像语义分割方法
CN113240683B (zh) 基于注意力机制的轻量化语义分割模型构建方法
CN110825829A (zh) 一种基于自然语言和语义地图实现机器人自主导航的方法
CN115393396B (zh) 一种基于掩码预训练的无人机目标跟踪方法
CN111476133A (zh) 面向无人驾驶的前背景编解码器网络目标提取方法
CN114821050A (zh) 一种基于transformer的指称图像分割方法
CN116071715A (zh) 一种自动驾驶汽车实时语义分割模型构建方法
CN116630704A (zh) 一种基于注意力增强和密集多尺度的地物分类网络模型
Cheng et al. A survey on image semantic segmentation using deep learning techniques
CN110633706A (zh) 一种基于金字塔网络的语义分割方法
CN114463340A (zh) 一种边缘信息引导的敏捷型遥感图像语义分割方法
CN117036699A (zh) 一种基于Transformer神经网络的点云分割方法
CN116977631A (zh) 一种基于DeepLabV3+的街景语义分割方法
CN111126451A (zh) 一种对偶式语义分割方法
Liu et al. ConvMLP-mixer based real-time stereo matching network towards autonomous driving
CN113223006A (zh) 一种基于深度学习的轻量级目标语义分割方法
CN113298174B (zh) 一种基于渐进特征融合的语义分割模型的改进方法
Zhou et al. Lightweight Self-Attention Network for Semantic Segmentation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant