CN112529064B - 一种高效的实时语义分割方法 - Google Patents

一种高效的实时语义分割方法 Download PDF

Info

Publication number
CN112529064B
CN112529064B CN202011408821.0A CN202011408821A CN112529064B CN 112529064 B CN112529064 B CN 112529064B CN 202011408821 A CN202011408821 A CN 202011408821A CN 112529064 B CN112529064 B CN 112529064B
Authority
CN
China
Prior art keywords
convolution
feature map
output
information
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011408821.0A
Other languages
English (en)
Other versions
CN112529064A (zh
Inventor
郝晓辰
郝兴军
李媛媛
张亚茹
吴超
刘彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yanshan University
Original Assignee
Yanshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yanshan University filed Critical Yanshan University
Priority to CN202011408821.0A priority Critical patent/CN112529064B/zh
Publication of CN112529064A publication Critical patent/CN112529064A/zh
Application granted granted Critical
Publication of CN112529064B publication Critical patent/CN112529064B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种高效的实时语义分割方法。本发明首先利用因式分解卷积、深度可分离卷积以及短连接设计了一个能够提取双尺度信息的残差单元,并且基于残差单元组建了三个特征提取块;然后再利用特征图相加和拼接的计算方法在特征提取块的相应位置引入长连接,进而加强了同级别特征图间的交流,提高提取信息的能力;最后利用因式分解卷积、深度可分离卷积以及1×1卷积设计了一个用于融合三种不同尺寸、两种不同层次输入的高‑低层特征图融合模块,然后对其输出进行快速上采样。本发明中的残差单元和高‑低层特征图融合模块的参数量和运算量都很小,计算速度快,分别有很强的提取和融合特征的能力,并且均可随时迁移到其他任何网络中。

Description

一种高效的实时语义分割方法
技术领域
本发明涉及属于计算机视觉领域,涉及图像语义分割技术,尤其涉及一种高效的实时语义分割方法。
背景技术
图像语义分割是计算机视觉领域一项基本的任务,也是最具挑战性的任务之一。它的目的是为输入图像中的每一个像素分配一个标签,使不同的类的像素呈现出不同的颜色,在自动驾驶、文字翻译、机器人识别等领域有很大的应用空间。近年来,随着卷积神经网络的发展以及计算机硬件条件的提升,图像语义分割技术得到了很大的发展,一些方法比如ResNet、PSPNet、BiseNet等在一些公共的挑战数据集上取得了很好的预测结果。
但是大部分先进的语义分割方法都依靠加深卷积神经网络的深度和复杂度来提高精度。通常它们的参数量和计算量是巨大的,计算速度慢,并且对运行设备的性能有着极高的要求。在一些硬件条件有限的移动设备上和一些要求快速运算的任务中,这些方法很难发挥作用。为了解决这个问题,实时语义分割成为人们关注的焦点。实时语义分割要求既有较高的精度又有较快的推理速度。目前对于实时语义分割的研究主要分为两种:第一种是对现有的复杂网络进行简化,降低精度,提高推理速度。第二种是设计全新的网络结构,重新考量精度和速度之间的平衡性。尽管实时语义分割的研究有了一些进展,但是现存的方法仍然不能很好地同时兼顾精度和速度这两个性能指标。
发明内容
根据上述提出的现有方法存在的精度低、推理速度慢、占用内存多、计算量大等缺点,而提供一种高效的实时语义分割方法。本发明通过设计轻量级的新型残差单元、特征提取块和特征图融合模块进而提出一种新的实时语义分割方法。本发明采用的技术手段如下:
一种高效的实时语义分割方法,包括如下步骤:
信息提取阶段:将下采样后的特征图输送到残差单元中,所述残差单元由因式分解卷积和深度可分离卷积的组合卷积、1×1卷积以及短连接组成;
采用串联的方式连接所述残差单元中无扩张率和有扩张率的组合卷积,同时在有扩张率的组合卷积中用短连接的方式引入无扩张率组合卷积的输出;
用不同数量的残差单元和不同的扩张率组建多个特征提取块并且在特征提取块中加入不同数量的长连接,将其中2种特征图融合在一起;
信息融合阶段:将其中预设的采样点以及组件的特征提取块的输出作为输入,通过高-低层特征图融合模块融合两种不同层次的特征图,输出最终特征图,所述高-低层特征图融合模块由因式分解卷积和深度可分离卷积的组合卷积以及1×1卷积构成。
进一步地,信息提取阶段的下采样过程中,利用步长为2的3×3标准卷积,用不同数量的残差单元和不同的扩张率组建三个特征提取块并且在特征提取块中加入不同数量的长连接,在信息融合阶段,取第一个下采样、第二个下采样和第三个特征提取块的输出作为输入。
进一步地,融合模块包括三个输入和一个输出,取第一个下采样和第二个下采样的输出作为待处理的低层特征图,取第三个特征提取块的输出作为待处理的高层特征图,两个低层特征图经过处理融合成一个具有细节和边界信息的低层特征图,高层特征图经过优化处理,得到一个富有语义信息的高层特征图。两种特征图最后通过计算融合在一起作为模块的最终输出。
进一步地,低层特征图用组合卷积做去噪处理,高层特征图用组合卷积和1×1卷积构成的并联结构做去奇异值处理。
与现有技术相比,本发明的优点:
本发明重新设计了一种能够提取双尺度信息的残差单元以及一个计算简单、高效的高-低层特征图融合模块,并且利用残差单元组建了带有长连接的特征提取块,基于以上设计,提出一种新型实时语义分割方法,以仅有的0.53M参数量在精度和速度方面分别达到了72.9%mIoU和105.6FPS,超过了现有的发明,并且满足实际应用限定的要求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的实时语义分割网络结构图。
图2是本发明的能够提取双尺度信息的残差单元图。
图3是本发明的带有长连接结构的特征提取块的示意图。
图4是本发明的高-低层特征图融合模块图。
图5是本发明在Cityscapes数据集上的分割效果图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本实施例公开了一种高效的实时语义分割方法,包括如下步骤:
信息提取阶段:将下采样后的特征图输送到残差单元中,所述残差单元由因式分解卷积和深度可分离卷积的组合卷积、1×1卷积以及短连接组成;
采用串联的方式连接所述残差单元中无扩张率和有扩张率的组合卷积来增大网络深度和感受野,同时在有扩张率的组合卷积中用短连接的方式引入无扩张率组合卷积的输出,有效提取和利用来自不同感受野的两种尺度的信息;
用不同数量的残差单元和不同的扩张率组建多个特征提取块并且在特征提取块中加入不同数量的长连接,并且根据需要选择不同的计算方式将2种特征图融合在一起;本实施例中,组建3个特征提取块。
下采样操作利用步长为2的3×3标准卷积,设计的提取双尺度信息的残差单元使用了大卷积核分解为多个连续的小卷积核的策略以及不同感受野提取不同尺度信息的原理。残差单元以串联的方式组建特征提取块,并且每个特征提取块的残差单元数量均不同。在特征提取块中每间隔三个残差单元加一个长连接,并且根据其所在的位置和对计算速度产生的影响确定合适的融合方法。
信息融合阶段:将其中预设的采样点以及组件的特征提取块的输出作为输入,通过高-低层特征图融合模块融合两种不同层次的特征图,输出最终特征图,所述高-低层特征图融合模块由因式分解卷积和深度可分离卷积的组合卷积以及1×1卷积构成。具体地,取第一个下采样、第二个下采样和第三个特征提取块的输出作为输入,通过本发明中的高-低层特征图融合模块融合两种不同层次的特征图,该模块由因式分解卷积和深度可分离卷积的组合卷积以及1×1卷积构成,低层特征图用组合卷积做去噪处理,高层特征图用组合卷积和1×1卷积构成的并联结构做去奇异值处理,然后根据需要选择不同的计算方式逐级融合三个输入,输出一个富含多种信息的特征图,最后进行快速上采样,在公共数据集上进行评估。
融合模块包括三个输入和一个输出,取第一个下采样和第二个下采样的输出作为待处理的低层特征图,取第三个特征提取块的输出作为待处理的高层特征图,两个低层特征图经过处理融合成一个具有细节和边界信息的低层特征图,高层特征图经过优化处理,得到一个富有语义信息的高层特征图。两种特征图最后通过计算融合在一起作为模块的最终输出。
实施例1
本发明首先设计了一种能够提取双尺度信息的残差单元。图2给出了具体的结构图。该残差单元由因式分解卷积和深度分离卷积组成的组合卷积、1×1卷积以及两个短连接构成。首先,残块单元中的第一个1×1卷积将输入的通道进行压缩,其目的是为了减少后面卷积操作时的计算量,提高运算速度。然后一个因式分解卷积和深度可分离卷积的组合卷积对输入进行卷积操作,首先采用一个3×1卷积对空间维度上的高度进行卷积,其中每个通道单独运算,互不影响,然后再采用一个1×3卷积对空间维度上的宽度进行卷积,同样每个通道单独运算,最后采用一个1×1卷积实现通道维度的信息交流。这样将标准3×3卷积分成三部分操作,计算量和参数量都大大减少,并且参数量由之前的3×3×CI×CO变成了2×3×CI+CI×CO(其中CI表示输入的通道数量,CO表示输出的通道数量),通道数量越多,优势越明显。然后用同样的方式进行第二次卷积,此时3×1卷积和1×3卷积均具有扩张率,且扩张率相同。当输入经过第一个组合卷积之后,由于网络层数较少以及感受野较小等因素,输出的特征图中包含的局部信息会比较多。
随着网络深度的增加以及扩张率的介入,第二个组合卷积能够提取更多的非局部信息。这两种信息都能对预测结果产生较大的影响,为了同时利用这两种信息,本发明采用了一个短连接的结构,在第二个组合卷积中的通道信息交流之前引入第一个组合卷积的输出,两种含有不同信息的特征图按通道拼接在一起,这样得到的具有双尺度信息的特征图的大小与模块的输入一致,在不改变尺寸的情况下提取特征图中的丰富信息。最后,在模块的末端以快捷连接的方式引入输入,构成一个残差结构。
为了更好地进行特征提取,本发明基于提取双尺度信息的残差单元设计了三个特征提取块,如图3所示。三个特征提取块分别由{2,3,6}个不同数量的残差单元组成,并且提取信息的能力依次增强,这是由网络深度的特性和残差单元的数量决定的。此外,每个特征提取块均有着不同的扩张率,分别是{1,1}、{2,2,2},{3,7,11,13,17,19}。随着扩张率的不断增大,特征提取块能够提取的信息的尺度也越来越大。
本发明在第二个和第三个特征提取块上加入了长连接。目的是为了实现网络中同一尺寸大小且不同深度的特征图的融合,以便后边网络更好地提取信息。如图3所示,第二个特征提取块的末尾有一个长连接,并且采用拼接的计算方式将两个特征图融合在一起。在第三个特征提取块中有两个长连接,中间部位一个,尾部一个。中间部分的长连接采用相加的计算方式进行融合,而尾部采用拼接的方式。通常来讲,对于特征图融合来说拼接比相加的方式更简单、快捷,计算量更小。但是在本设计中,如果第三个特征提取块中间部位的长连接采用拼接的方式,则会使后面的特征图通道数量加倍,会来带双倍的计算量,进而会对推理速度产生极大的损害。图中,括号里数字代表扩张率,且(a)、(b)、(c)分别为第一、第二、和第三个带有连接结构的特征提取块。
对于一个网络来说,网络的低层部分输出的特征图中包含更多的边界信息和细节信息,而网络的高层部分输出的特征图中包含详细的语义信息。语义信息有利于像素的分类,而边界和细节信息能使类的边界分的更加细腻和准确,因此同时利用高层和低层的特征图对于轻量级的实时语义分割网络来说是至关重要的。为此,本发明利用因式分解卷积和深度可分离卷积构建的组合卷积设计了一个能够融合三种不同尺寸、两种不同层次特征图的高-低层特征图融合模块,其结构细节如图4所示。
融合模块分为两步操作,第一步是处理低层特征图。对于取自第一个下采样后的特征图X1/2,如公式(1)所示,首先用组合卷积进行处理,得到一个空间维度的高和宽缩小一半,通道加倍的特征图X1/2。这样操作是为了去除粗糙特征图特有的噪声及其他干扰,提取细腻的信息,同时方便与下一个不同尺寸的特征图融合。对于取自第二个下采样的特征图X1/4,同样用组合卷积对其进行处理得到输出特征图X1/4,但这时不改变其尺寸,仅仅细化它含有的信息,如公式(2)所示。然后利用公式(3)对这两种低层特征图进行融合。由于两种特征图空间维度的高度和宽度以及通道的数量都比较小,因此在此处利用相加的计算方式进行融合,融合以后再次利用组合卷积进行处理,将空间维度的尺寸再次缩小一半。虽然通道数量越多,特征图的表征性越强,但是考虑到后面计算量的问题,此处不再改变通道的数量,将处理好的低层特征图outL的通道数量控制在64。
X′1/2=Φ(X1/2│S=2,γ=2) (1)
X′1/4=Φ(X1/4│S=1,γ=1) (2)
outL=Φ(X′1/2+X′1/4│S=2,γ=1) (3)
其中Φ表示因式分解卷积和深度可分离卷积的组合卷积操作,S表示3×1和1×3卷积的步长,γ表示卷积的输出通道与输入通道之比。
第二步是处理高层特征图。高层特征图经过不断卷积和下采样后,某些值会变的异常大或者异常小,从而影响分类效果。为此本发明通过因式分解卷积和深度可分离卷积设计了一个去奇异值结构。去奇异值结构包含两个并联分支,对于取自第三个特征提取块后的高层特征图X1/8,首先经过一个1×1卷积实现各通道的信息交流,然后利用组合卷积对其进行处理,通道数量缩小一半。同时另一个分支利用1×1卷积处理X1/8,在实现通道信息交流的同时将通道数量缩小一半。最后两个分支的输出通过相加的方式融合在一起,整个操作如公式(4)所示。
Figure BDA0002815102790000071
out=Cat(outL,outH) (5)
其中P表是1×1卷积操作,Cat表示按通道拼接,out表示高-低层特征图融合模块的输出。
经过处理后的高层特征图outH和低层特征图outL分别拥有丰富的语义信息和细节、边界信息,最后利用公式(5)融合在一起。
语义分割任务常用的数据集有Cityscapes、Camvid、Pascal VOC、Microsoft COCO等,其中Cityscapes是最具挑战性的数据集之一,本发明就是在这个数据集上进行实验,并且利用Cityscapes的测试集对本发明的预测能力、泛化性进行评估,同时计算推理速度指标FPS(每秒传输帧数)。
考虑到计算量和推理速度的问题,本发明没有采用逐级解码的结构,而是在高-低层特征图融合模块后利用一个1×1卷积将特征图通道降到预测类的数量,然后对特征图进行8倍上采样,得到空间维度的高和宽与原输入图像一致的特征图,进而对其进行预测,实现语义分割。为了验证高效性,本发明在公共的挑战性数据集Cityscapes上进行了实验。首先利用训练集对网络的参数进行训练,为了方便训练将图片随机裁剪成512×1024大小,并且只利用数据集30个类别中的19个进行训练,同时每训练一定的周期就进行一次验证,时刻监测训练的效果,然后在测试集上对网络的性能进行测试,其实例化效果如图5所示。本发明的预测精度在Cityscapes的测试集上高达72.9%mIoU,并且以512×1024像素的图像为输入时,推理速度达到了105.6FPS,超过了大部分先进的实时语义分割方法的性能,在精度和速度之间达到了一个很好的平衡。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (1)

1.一种高效的实时语义分割方法,其特征在于,包括如下步骤:
信息提取阶段:将下采样后的特征图输送到残差单元中,所述残差单元由因式分解卷积和深度可分离卷积的组合卷积、1×1卷积以及短连接组成;
采用串联的方式连接所述残差单元中无扩张率和有扩张率的组合卷积,同时在有扩张率的组合卷积中用短连接的方式引入无扩张率组合卷积的输出;
用不同数量的残差单元和不同的扩张率组建多个特征提取块并且在特征提取块中加入不同数量的长连接,将其中2种特征图融合在一起;
信息融合阶段:将其中预设的采样点以及组件的特征提取块的输出作为输入,通过高-低层特征图融合模块融合两种不同层次的特征图,输出最终特征图,所述高-低层特征图融合模块由因式分解卷积和深度可分离卷积的组合卷积以及1×1卷积构成;
信息提取阶段的下采样过程中,利用步长为2的3×3标准卷积,用不同数量的残差单元和不同的扩张率组建三个特征提取块并且在特征提取块中加入不同数量的长连接,在信息融合阶段,取第一个下采样、第二个下采样和第三个特征提取块的输出作为输入;
融合模块包括三个输入和一个输出,取第一个下采样和第二个下采样的输出作为待处理的低层特征图,取第三个特征提取块的输出作为待处理的高层特征图,两个低层特征图经过处理融合成一个具有细节和边界信息的低层特征图,高层特征图经过优化处理,得到一个富有语义信息的高层特征图, 两种特征图最后通过计算融合在一起作为模块的最终输出;
低层特征图用组合卷积做去噪处理,高层特征图用组合卷积和1×1卷积构成的并联结构做去奇异值处理。
CN202011408821.0A 2020-12-03 2020-12-03 一种高效的实时语义分割方法 Active CN112529064B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011408821.0A CN112529064B (zh) 2020-12-03 2020-12-03 一种高效的实时语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011408821.0A CN112529064B (zh) 2020-12-03 2020-12-03 一种高效的实时语义分割方法

Publications (2)

Publication Number Publication Date
CN112529064A CN112529064A (zh) 2021-03-19
CN112529064B true CN112529064B (zh) 2022-09-02

Family

ID=74997660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011408821.0A Active CN112529064B (zh) 2020-12-03 2020-12-03 一种高效的实时语义分割方法

Country Status (1)

Country Link
CN (1) CN112529064B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113920099B (zh) * 2021-10-15 2022-08-30 深圳大学 一种基于非局部信息提取的息肉分割方法及相关组件

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111489305A (zh) * 2020-03-31 2020-08-04 天津大学 基于强化学习的图像增强方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108961253A (zh) * 2018-06-19 2018-12-07 深动科技(北京)有限公司 一种图像分割方法和装置
CN109635642A (zh) * 2018-11-01 2019-04-16 浙江科技学院 一种基于残差网络和扩张卷积的道路场景分割方法
CN111091130A (zh) * 2019-12-13 2020-05-01 南京邮电大学 基于轻量级卷积神经网络的实时图像语义分割方法及系统
CN111192245B (zh) * 2019-12-26 2023-04-07 河南工业大学 一种基于U-Net网络的脑肿瘤分割网络及分割方法
CN111488884A (zh) * 2020-04-28 2020-08-04 东南大学 低计算量及高度特征融合的实时语义分割方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111489305A (zh) * 2020-03-31 2020-08-04 天津大学 基于强化学习的图像增强方法

Also Published As

Publication number Publication date
CN112529064A (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
CN111325751B (zh) 基于注意力卷积神经网络的ct图像分割系统
US11328392B2 (en) Inpainting via an encoding and decoding network
CN111091130A (zh) 基于轻量级卷积神经网络的实时图像语义分割方法及系统
CN110569851B (zh) 门控多层融合的实时语义分割方法
CN110223304B (zh) 一种基于多路径聚合的图像分割方法、装置和计算机可读存储介质
CN112927209B (zh) 一种基于cnn的显著性检测系统和方法
CN111915660A (zh) 基于共享特征和注意力上采样的双目视差匹配方法及系统
CN110189260B (zh) 一种基于多尺度并行门控神经网络的图像降噪方法
CN116309648A (zh) 一种基于多注意力融合的医学图像分割模型构建方法
CN113066089B (zh) 一种基于注意力引导机制的实时图像语义分割方法
CN110866938B (zh) 一种全自动视频运动目标分割方法
CN110852199A (zh) 一种基于双帧编码解码模型的前景提取方法
CN113327254A (zh) 一种基于u型网络的图像分割方法和系统
CN115953386A (zh) 一种基于MSTA-YOLOv5的轻量化齿轮表面缺陷检测方法
CN112529064B (zh) 一种高效的实时语义分割方法
CN116363361A (zh) 基于实时语义分割网络的自动驾驶方法
Wang et al. Image super-resolution via lightweight attention-directed feature aggregation network
CN114494006A (zh) 图像重建模型的训练方法、装置、电子设备及存储介质
CN116524180A (zh) 基于轻量级主干结构的戏曲舞台场景分割方法
CN116485654A (zh) 卷积神经网络与Transformer相结合的轻量级单图像超分辨率重建方法
CN116543155A (zh) 基于上下文级联和多尺度特征细化的语义分割方法及装置
CN116246109A (zh) 一种多尺度孔洞邻域注意力计算骨干网络模型及其应用
CN116029905A (zh) 一种基于渐进差值互补的人脸超分辨率重构方法及系统
CN111899161A (zh) 一种超分辨率重建方法
CN112215848B (zh) 一种基于空间信息引导的实时语义分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant