CN108062754A - 基于密集网络图像的分割、识别方法和装置 - Google Patents

基于密集网络图像的分割、识别方法和装置 Download PDF

Info

Publication number
CN108062754A
CN108062754A CN201810058722.0A CN201810058722A CN108062754A CN 108062754 A CN108062754 A CN 108062754A CN 201810058722 A CN201810058722 A CN 201810058722A CN 108062754 A CN108062754 A CN 108062754A
Authority
CN
China
Prior art keywords
characteristic
characteristic pattern
dense
network image
scale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810058722.0A
Other languages
English (en)
Other versions
CN108062754B (zh
Inventor
雷柏英
汪天富
秦璟
李航
何鑫子
倪东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201810058722.0A priority Critical patent/CN108062754B/zh
Publication of CN108062754A publication Critical patent/CN108062754A/zh
Application granted granted Critical
Publication of CN108062754B publication Critical patent/CN108062754B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Abstract

本发明提供了基于密集网络图像的分割、识别方法和装置,涉及神经网络技术领域,其中,该基于密集网络图像的分割、识别方法包括:首先,使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接,运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图,接着,对稠密反卷积操作得到的输出特征图进行链式残差池化操作,这样,提高了对边界分割的准确性,捕获局部上下文信息,在编码模块中的三个边界细化块加入深度监督,通过上述处理,提高了医学图像分割的精准性。

Description

基于密集网络图像的分割、识别方法和装置
技术领域
本发明涉及神经网络技术领域,尤其涉及基于密集网络图像的分割、识别方法和装置。
背景技术
深度学习是一种基于对数据进行表征学习的机器学习方法,其动机在于建立、模拟人脑进行分析学习的神经网络,即模仿人脑的机制来解释数据,例如,图像、声音和文本等。在实际运用过程中,深度学习通过组合低层特征形成更加抽象的高层特征来表示属性类别或特征,以发现数据的分布式特征。
近年来,随着深度学习在物体识别领域取得的惊人表现,越来越多的研究者也将深度学习应用于医学图像分割领域中来。传统的多层非线性卷积神经网络在分类问题上有很好的泛化性能,如果把它应用在图像分割任务中,由于其特有的滑动步长和池化层,会使得图像的分辨率减小,输出的分割结果粗糙。随着技术的发展,用于物体分割的经典网络结构为全卷积神经网络(Fully Convolutional Networks,FCN),此后很多网络都是在它的基础上进行改进,全卷积神经网络分为解码和编码两部分,解码用于提取卷积特征,编码用于恢复原始图像的尺寸大小,从而很大程度上避免了常规卷积神经网络在分辨率问题上的限制,但是它的输出分割结果图只能恢复到原始图像的1/32,结果分辨率仍然较低,得不到高分辨率的分割结果图。为了解决这个问题,发展出了一种叫做DeepLab的基于膨胀卷积用于图像分割的网络,不同于前两种结构,它没有池化操作,这就使得原始图像尺寸不会减小,分辨率不会降低,但是,由于要在高分辨率和高维度的特征图上进行卷积操作,需要很大的计算内存,对GPU性能要求很高。
综上,目前关于医学图像分割过程中运用深度学习存在很多局限性的问题,尚无有效的解决办法。
发明内容
有鉴于此,本发明实施例的目的在于提供了基于密集网络图像的分割、识别方法和装置,通过稠密反卷积操作、跳跃连接等操作,提高了医学图像分割的边界特征提取的效率以及分割结果图的分辨率。
第一方面,本发明实施例提供了基于密集网络图像的分割、识别方法,包括:使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接;
运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图;
对稠密反卷积操作得到的输出特征图进行链式残差池化操作,其中,输出特征图是对多尺度特征图进行稠密反卷积操作后得到的;
利用深度分级监督在得到的三个边界细化块上捕获局部上下文信息。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接,包括:
使用卷积层作为特征提取器来捕获密集网络图像的多个分层特征图;
将多个分层特征图逐一进行自适应卷积操作,得到多个卷积层;
利用残差网络提取卷积特征得到多尺度特征图,将多个不同尺度的特征图利用跳跃连接,与编码模块中对应尺度的边界细化块连接。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图,包括:
运用编码模块对多个特征图进行下采样和语义特征提取,得到基于密集网络图像的多层次多尺度的特征;
运用解码模块对多个特征图进行上采样并恢复详细信息,获得特征响应信息;
将多层次多尺度的特征和特征响应信息合成为多尺度特征图。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,对稠密反卷积操作得到的输出特征图进行链式残差池化操作,其中,输出特征图是对多尺度特征图进行稠密反卷积操作后得到的,包括:
对多尺度特征图进行稠密反卷积操作得到输出特征图;
对输出特征图进行链式残差池化操作,且,应用修正线性激活函数操作提高输出特征图的池化效率。
结合第一方面的第三种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,利用深度分级监督在得到的三个边界细化块上捕获局部上下文信息,包括:
将获取到的所有边界细化块按照时序进行位置排序;
对最后三个边界细化块进行深度分级监督,以捕获基于密集网络图像的局部上下文信息。
第二方面,本发明实施例提供了基于密集网络图像的分割、识别装置,包括:
卷积模块,用于使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接;
多尺度特征图获取模块,用于运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图;
池化操作模块,用于对稠密反卷积操作得到的输出特征图进行链式残差池化操作,其中,输出特征图是对多尺度特征图进行稠密反卷积操作后得到的;
监督模块,用于利用深度分级监督在得到的三个边界细化块上捕获局部上下文信息。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,卷积模块包括:
捕获单元,用于使用卷积层作为特征提取器来捕获密集网络图像的多个分层特征图;
卷积层操作单元,用于将多个分层特征图逐一进行自适应卷积操作,得到多个卷积层;
跳跃连接单元,用于利用残差网络提取卷积特征得到多尺度特征图,将多个不同尺度的特征图利用跳跃连接,与编码模块中对应尺度的边界细化块连接。
结合第二方面的第一种可能的实施方式,本发明实施例提供了第二方面的第二种可能的实施方式,其中,多尺度特征图获取模块包括:
编码单元,用于运用编码模块对多个特征图进行下采样和语义特征提取,得到基于密集网络图像的多层次多尺度的特征;
解码单元,用于运用解码模块对多个特征图进行上采样并恢复详细信息,获得特征响应信息;
多尺度特征图合成单元,用于将多层次多尺度的特征和特征响应信息合成为多尺度特征图。
第三方面,本发明实施例还提供一种终端,包括存储器以及处理器,存储器用于存储支持处理器执行上述方面提供的基于密集网络图像的分割、识别方法的程序,处理器被配置为用于执行存储器中存储的程序。
第四方面,本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述任一项的方法的步骤。
本发明实施例提供的基于密集网络图像的分割、识别方法和装置,其中,该基于密集网络图像的分割、识别方法包括:首先,使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接,具体的,通过跳转连接以求和的方式形成一个链,进而得到多个特征图,之后,运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图,接着,对稠密反卷积操作得到的输出特征图进行链式残差池化操作,需要进行说明的是,输出特征图是对多尺度特征图进行稠密反卷积操作后得到的,这样,利用深度分级监督在得到的三个边界细化块上捕获局部上下文信息,以获取医学图像的边界特征,通过上述处理过程,实现了在维持医学图像分割的分辨率的基础上,保证了医学图像边界特征信息的提取效率,通过端到端的处理过程能够方便快捷的获取到高分辨率的输出结果图。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例所提供的基于密集网络图像的分割、识别方法的流程图;
图2示出了本发明实施例所提供的基于密集网络图像的分割、识别方法的示意图;
图3示出了本发明实施例所提供的基于密集网络图像的分割、识别装置的连接图;
图4示出了本发明实施例所提供的基于密集网络图像的分割、识别装置的结构框架图;
图5示出了本发明实施例所提供的基于密集网络图像的分割、识别装置的结构连接图。
图标:1-卷积模块;2-多尺度特征图获取模块;3-池化操作模块;4-监督模块;11-捕获单元;12-卷积层操作单元;13-跳跃连接单元;21-编码单元;22-解码单元;23-多尺度特征图合成单元。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,在医学图像分割领域中,由于其特有的滑动步长和池化层,会使得图像的分辨率减小,输出的分割结果粗糙。而全卷积神经网络在很大程度上避免了常规卷积神经网络在分辨率问题上的限制,但输出分割结果图只能恢复到原始图像的1/32,结果分辨率仍然较低,得不到高分辨率的分割结果图。此外,还有一种叫做DeepLab的基于膨胀卷积用于图像分割的网络,不同于前两种结构,它没有池化操作,这就使得原始图像尺寸不会减小,分辨率不会降低,但是,由于要在高分辨率和高维度的特征图上进行卷积操作,需要很大的计算内存。可见,目前关于医学图像分割过程中存在很多局限性。
基于此,本发明实施例提供了基于密集网络图像的分割、识别方法和装置,下面通过实施例进行描述。
实施例1
参见图1和图2,本实施例提出的基于密集网络图像的分割、识别方法具体包括以下步骤:
步骤S101:使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接,得到多个特征图。
步骤S102:运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图。
步骤S103:对稠密反卷积操作得到的输出特征图进行链式残差池化操作,其中,输出特征图是对多尺度特征图进行稠密反卷积操作后得到的。
步骤S104:利用深度分级监督在得到的三个边界细化块上捕获局部上下文信息。
在这里需要进行说明的是,传统机器学习方法的输入不是直接的原始数据,而是根据原始数据提取到的特征,最终结果的好坏取决于提取到的特征的好坏,因此,传统机器学习为了要实现更好的结果需要花费大量的时间,同时需要有大量丰富经验的专业领域人士进行特征设计,如果数据量很大,想要提取到好的特征也会越来越困难。而在本基于密集网络图像的分割、识别方法中,对于端到端的网络来说,神经网络可以自行学习特征,不需要人为干预,从而缩减了人工预处理和后处理步骤,可以从原始输入后直接获取到最后的输出,方便快捷。
下面对上述各个步骤进行详细阐述,使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接,得到多个特征图,包括:
(1)使用卷积层作为特征提取器来捕获密集网络图像的多个分层特征图,由于,密集网络图像的特征比较复杂,在本实施例中采用多层处理,即使用卷积层作为特征提取器来捕获密集网络图像的多个分层特征图。
(2)将多个分层特征图逐一进行自适应卷积操作,得到多个卷积层,如图2中的分别标注有不同数字的处理块。
(3)利用残差网络提取卷积特征得到多尺度特征图,将多个不同尺度的特征图利用跳跃连接,与编码模块中对应尺度的边界细化块连接。这里需要进行说明的是,残差单元的输入为上一个卷积层的输出,将第一特征图分别和第三特征图、第四特征图进行跳跃连接,将第二特征图分别和第三特征图、第四特征图进行跳跃连接,得到多个特征图。
上述步骤运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图,包括:
(1)运用编码模块对多个特征图进行下采样和语义特征提取,得到基于密集网络图像的多层次多尺度的特征,在编码阶段,通过深度残差网络ResNet融合下采样过程中产生的不同分辨率的特征图,将多尺度、多等级特征传递给相应的边界细化块。
(2)运用解码模块对多个特征图进行上采样并恢复详细信息,获得特征响应信息,解码阶段恢复特征图的大小,重建空间维度信息,重新获得在下采样过程中丢失的精细的结构信息。
(3)将多层次多尺度的特征和特征响应信息合成为多尺度特征图。
上述步骤中对稠密反卷积操作得到的输出特征图进行链式残差池化操作,其中,输出特征图是对多尺度特征图进行稠密反卷积操作后得到的,包括:
(1)对多尺度特征图进行稠密反卷积操作得到输出特征图,稠密反卷积网络通过残差跳跃连接将低层边界特征与高层语义信息相结合,确保梯度有效传播和端到端训练。稠密反卷积层的核心是每一层都直接与其他层相连,在前一层和后一层之间添加跳跃连接直接连接所有层,中间特征图中的直接连接建立了像素间的依赖关系,使得训练过程快速收敛,同时也改善了信息传播。
(2)对输出特征图进行链式残差池化操作,并且,应用修正线性激活函数操作提高输出特征图的池化效率。这里需要进行说明的是,链式残差池化层的结构由最大池化层和卷积层组成。卷积运算在训练过程中产生加权参数,池化操作整合全局上下文信息并改变特征图尺寸,捕获丰富的背景信息,增强特征表达能力。
上述步骤利用深度分级监督在得到的三个边界细化块上捕获局部上下文信息,包括:
(1)将获取到的所有边界细化块按照时序进行位置排序。
(2)对最后三个边界细化块进行深度分级监督,以捕获基于密集网络图像的局部上下文信息。利用深层分级监督(Hierarchical Supervision)恢复低级特征,对最后三个边界细化块利用分级监督细化边界特征。然而在四个细化块都采用深度监督,然而,输出的分割图分辨率低、结果差,原因主要是因为预测输出和真实标签之间没有直接关系,不能捕捉到低分辨率的的特征表达。因此,本方法中在最后三个边界细化块上进行深度监督。
综上所述,本实施例提供的基于密集网络图像的分割、识别方法包括:首先,使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接,得到多个特征图,之后,运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图,接着,对稠密反卷积操作得到的输出特征图进行链式残差池化操作,其中,输出特征图是对多尺度特征图进行稠密反卷积操作后得到的,这样,利用深度分级监督在得到的三个边界细化块上捕获局部上下文信息,实现了在维持医学图像分割的分辨率的基础上,保证了医学图像边界特征信息的提取效率,通过端到端的处理过程能够方便快捷的获取到高分辨率的输出结果图。
实施例2
参见图3、图4和图5,本实施例提供了基于密集网络图像的分割、识别装置包括:卷积模块1用于使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接,得到多个特征图,多尺度特征图获取模块2用于运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图,池化操作模块3用于对稠密反卷积操作得到的输出特征图进行链式残差池化操作,其中,输出特征图是对多尺度特征图进行稠密反卷积操作后得到的,监督模块4用于利用深度分级监督在得到的三个边界细化块上捕获局部上下文信息。
其中,卷积模块包括:捕获单元11用于使用卷积层作为特征提取器来捕获密集网络图像的多个分层特征图,卷积层操作单元12用于将多个分层特征图逐一进行自适应卷积操作,得到多个卷积层,跳跃连接单元13用于利用残差网络提取卷积特征得到多尺度特征图,将多个不同尺度的特征图利用跳跃连接,与编码模块中对应尺度的边界细化块连接。
其中,多尺度特征图获取模块包括:编码单元21用于运用编码模块对多个特征图进行下采样和语义特征提取,得到基于密集网络图像的多层次多尺度的特征,解码单元22用于运用解码模块对多个特征图进行上采样并恢复详细信息,获得特征响应信息,多尺度特征图合成单元23用于将多层次多尺度的特征和特征响应信息合成为多尺度特征图。
本发明实施例提供的基于密集网络图像的分割、识别装置,与上述实施例提供的基于密集网络图像的分割、识别方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
本发明实施例还提供了一种终端,包括存储器以及处理器,存储器用于存储支持处理器执行上述实施例方法的程序,处理器被配置为用于执行存储器中存储的程序。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述任一项的方法的步骤。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。本发明实施例所提供的基于密集网络图像的分割、识别方法和装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块或单元可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,也不能理解为指示或暗示相对重要性。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.基于密集网络图像的分割、识别方法,其特征在于,包括:
使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接;
运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图;
对稠密反卷积操作得到的输出特征图进行链式残差池化操作,其中,所述输出特征图是对所述多尺度特征图进行稠密反卷积操作后得到的;
利用深度分级监督在得到的三个边界细化块上捕获局部上下文信息。
2.根据权利要求1所述的基于密集网络图像的分割、识别方法,其特征在于,所述使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接,包括:
使用卷积层作为特征提取器来捕获密集网络图像的多个分层特征图;
将所述多个分层特征图逐一进行自适应卷积操作,得到多个卷积层;
利用残差网络提取卷积特征得到多尺度特征图,将所述多个不同尺度的特征图利用跳跃连接,与编码模块中对应尺度的边界细化块连接。
3.根据权利要求2所述的基于密集网络图像的分割、识别方法,其特征在于,所述运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图,包括:
运用编码模块对所述多个特征图进行下采样和语义特征提取,得到基于密集网络图像的多层次多尺度的特征;
运用解码模块对所述多个特征图进行上采样并恢复详细信息,获得特征响应信息;
将所述多层次多尺度的特征和所述特征响应信息合成为所述多尺度特征图。
4.根据权利要求3所述的基于密集网络图像的分割、识别方法,其特征在于,所述对稠密反卷积操作得到的输出特征图进行链式残差池化操作,其中,所述输出特征图是对所述多尺度特征图进行稠密反卷积操作后得到的,包括:
对所述多尺度特征图进行稠密反卷积操作得到所述输出特征图;
对所述输出特征图进行链式残差池化操作,且,应用修正线性激活函数操作提高所述输出特征图的池化效率。
5.根据权利要求4所述的基于密集网络图像的分割、识别方法,其特征在于,所述利用深度分级监督在得到的三个边界细化块上捕获局部上下文信息,包括:
将获取到的所有边界细化块按照时序进行位置排序;
对最后三个所述边界细化块进行深度分级监督,以捕获基于密集网络图像的局部上下文信息。
6.基于密集网络图像的分割、识别装置,其特征在于,包括:
卷积模块,用于使用卷积层作为特征提取器来捕获密集网络图像的分层特征,将得到的多尺度的特征图输入到编码模块,同时,利用跳跃连接,将不同尺度的特征图与编码模块中对应尺度的特征图连接;
多尺度特征图获取模块,用于运用编码模块对特征图进行下采样和语义特征提取,运用解码模块对特征图进行上采样并恢复详细信息,获得多尺度特征图;
池化操作模块,用于对稠密反卷积操作得到的输出特征图进行链式残差池化操作,其中,所述输出特征图是对所述多尺度特征图进行稠密反卷积操作后得到的;
监督模块,用于利用深度分级监督在得到的三个边界细化块上捕获局部上下文信息。
7.根据权利要求6所述的基于密集网络图像的分割、识别装置,其特征在于,所述卷积模块,包括:
捕获单元,用于使用卷积层作为特征提取器来捕获密集网络图像的多个分层特征图;
卷积层操作单元,用于将所述多个分层特征图逐一进行自适应卷积操作,得到多个卷积层;
跳跃连接单元,用于利用残差网络提取卷积特征得到多尺度特征图,将多个不同尺度的特征图利用跳跃连接,与编码模块中对应尺度的边界细化块连接。
8.根据权利要求7所述的基于密集网络图像的分割、识别装置,其特征在于,所述多尺度特征图获取模块,包括:
编码单元,用于运用编码模块对所述多个特征图进行下采样和语义特征提取,得到基于密集网络图像的多层次多尺度的特征;
解码单元,用于运用解码模块对所述多个特征图进行上采样并恢复详细信息,获得特征响应信息;
多尺度特征图合成单元,用于将所述多层次多尺度的特征和所述特征响应信息合成为所述多尺度特征图。
9.一种终端,其特征在于,包括存储器以及处理器,所述存储器用于存储支持处理器执行权利要求1至5任一项所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
10.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,计算机程序被处理器运行时执行上述权利要求1至5任一项所述方法的步骤。
CN201810058722.0A 2018-01-19 2018-01-19 基于密集网络图像的分割、识别方法和装置 Active CN108062754B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810058722.0A CN108062754B (zh) 2018-01-19 2018-01-19 基于密集网络图像的分割、识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810058722.0A CN108062754B (zh) 2018-01-19 2018-01-19 基于密集网络图像的分割、识别方法和装置

Publications (2)

Publication Number Publication Date
CN108062754A true CN108062754A (zh) 2018-05-22
CN108062754B CN108062754B (zh) 2020-08-25

Family

ID=62141392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810058722.0A Active CN108062754B (zh) 2018-01-19 2018-01-19 基于密集网络图像的分割、识别方法和装置

Country Status (1)

Country Link
CN (1) CN108062754B (zh)

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109375186A (zh) * 2018-11-22 2019-02-22 中国人民解放军海军航空大学 基于深度残差多尺度一维卷积神经网络的雷达目标识别方法
CN109447976A (zh) * 2018-11-01 2019-03-08 电子科技大学 一种基于人工智能的医学图像分割方法及系统
CN109447990A (zh) * 2018-10-22 2019-03-08 北京旷视科技有限公司 图像语义分割方法、装置、电子设备和计算机可读介质
CN109658330A (zh) * 2018-12-10 2019-04-19 广州市久邦数码科技有限公司 一种发色调整方法及装置
CN109670516A (zh) * 2018-12-19 2019-04-23 广东工业大学 一种图像特征提取方法、装置、设备及可读存储介质
CN109829855A (zh) * 2019-01-23 2019-05-31 南京航空航天大学 一种基于融合多层次特征图的超分辨率重建方法
CN109829501A (zh) * 2019-02-01 2019-05-31 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN109993735A (zh) * 2019-03-29 2019-07-09 成都信息工程大学 基于级联卷积的图像分割方法
CN110074804A (zh) * 2019-04-12 2019-08-02 浙江工业大学 基于新型Faster R-CNN的胰腺CT图像中的囊性肿瘤检测方法
CN110188598A (zh) * 2019-04-13 2019-08-30 大连理工大学 一种基于MobileNet-v2的实时手部姿态估计方法
CN110263833A (zh) * 2019-06-03 2019-09-20 韩慧慧 基于编码-解码结构的图像语义分割方法
CN110322529A (zh) * 2019-07-12 2019-10-11 电子科技大学 一种基于深度学习辅助艺术绘画的方法
CN110428432A (zh) * 2019-08-08 2019-11-08 梅礼晔 结肠腺体图像自动分割的深度神经网络算法
CN110602526A (zh) * 2019-09-11 2019-12-20 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机设备及存储介质
CN110689083A (zh) * 2019-09-30 2020-01-14 苏州大学 一种上下文金字塔融合网络及图像分割方法
CN110853011A (zh) * 2019-11-11 2020-02-28 河北工业大学 用于肺结节检测的卷积神经网络模型的构建方法
WO2020048359A1 (en) * 2018-09-06 2020-03-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method, system, and computer-readable medium for improving quality of low-light images
WO2020063426A1 (zh) * 2018-09-30 2020-04-02 京东方科技集团股份有限公司 图像分割装置、方法及相关的计算设备
CN111126242A (zh) * 2018-10-16 2020-05-08 腾讯科技(深圳)有限公司 肺部图像的语义分割方法、装置、设备及存储介质
CN111127472A (zh) * 2019-10-30 2020-05-08 武汉大学 一种基于权重学习的多尺度图像分割方法
CN111160378A (zh) * 2018-11-07 2020-05-15 电子科技大学 基于单张图像的多任务增强的深度估计系统
CN111507950A (zh) * 2020-04-08 2020-08-07 北京推想科技有限公司 图像分割的方法和装置、电子设备及计算机可读存储介质
CN111507983A (zh) * 2019-01-31 2020-08-07 斯特拉德视觉公司 利用周边汽车的图像自动标注基础汽车的图像的方法及装置
CN111815731A (zh) * 2020-07-15 2020-10-23 山东省眼科研究所 图像处理方法、装置及计算机可读存储介质
CN112508924A (zh) * 2020-12-15 2021-03-16 桂林电子科技大学 一种小目标检测识别方法、装置、系统和存储介质
CN112529930A (zh) * 2020-12-18 2021-03-19 深圳先进技术研究院 一种基于聚焦融合的上下文学习医学图像分割方法
CN112790782A (zh) * 2021-02-02 2021-05-14 广州柏视医疗科技有限公司 基于深度学习的盆腔肿瘤ctv的自动勾画方法
CN112800691A (zh) * 2021-04-15 2021-05-14 中国气象局公共气象服务中心(国家预警信息发布中心) 一种构建降水等级预测模型的方法及装置
CN112861774A (zh) * 2021-03-04 2021-05-28 山东产研卫星信息技术产业研究院有限公司 一种使用遥感图像识别舰船目标的方法及系统
CN112997479A (zh) * 2018-11-15 2021-06-18 Oppo广东移动通信有限公司 跨阶段跳跃连接处理图像的方法、系统和计算机可读介质
CN113554058A (zh) * 2021-06-23 2021-10-26 广东奥普特科技股份有限公司 视觉目标图像分辨率增强的方法、系统、装置及存储介质
CN113689435A (zh) * 2021-09-28 2021-11-23 平安科技(深圳)有限公司 图像分割方法、装置、电子设备及存储介质
CN113920099A (zh) * 2021-10-15 2022-01-11 深圳大学 一种息肉分割方法、装置、计算机设备及存储介质
WO2023005740A1 (zh) * 2021-07-28 2023-02-02 阿里巴巴(中国)有限公司 图像编码、解码、重建、分析方法、系统及电子设备
CN116883669A (zh) * 2023-08-03 2023-10-13 深圳扬奇医芯智能科技有限公司 一种基于动态注意力联邦框架的多目标分割技术
CN111815731B (zh) * 2020-07-15 2024-04-26 山东省眼科研究所 图像处理方法、装置及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956560A (zh) * 2016-05-06 2016-09-21 电子科技大学 一种基于池化多尺度深度卷积特征的车型识别方法
CN106971155A (zh) * 2017-03-21 2017-07-21 电子科技大学 一种基于高度信息的无人车车道场景分割方法
CN106991386A (zh) * 2017-02-27 2017-07-28 杭州电子科技大学 一种基于深度残差网络的手势识别方法
CN107038448A (zh) * 2017-03-01 2017-08-11 中国科学院自动化研究所 目标检测模型构建方法
CN107346436A (zh) * 2017-06-29 2017-11-14 北京以萨技术股份有限公司 一种融合图像分类的视觉显著性检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956560A (zh) * 2016-05-06 2016-09-21 电子科技大学 一种基于池化多尺度深度卷积特征的车型识别方法
CN106991386A (zh) * 2017-02-27 2017-07-28 杭州电子科技大学 一种基于深度残差网络的手势识别方法
CN107038448A (zh) * 2017-03-01 2017-08-11 中国科学院自动化研究所 目标检测模型构建方法
CN106971155A (zh) * 2017-03-21 2017-07-21 电子科技大学 一种基于高度信息的无人车车道场景分割方法
CN107346436A (zh) * 2017-06-29 2017-11-14 北京以萨技术股份有限公司 一种融合图像分类的视觉显著性检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIAO-JIAO MAO.ETC: "Image Restoration Using Very Deep Convolutional Encoder-Decoder Networks with Symmetric Skip Connections", 《30TH CONFERENCE ON NEURAL INFORMATION PROCESSING SYSTEMS (NIPS 2016)》 *
王禹嫣: "深度学习在图像识别中的应用与发展", 《中国战略新兴产业》 *

Cited By (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020048359A1 (en) * 2018-09-06 2020-03-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method, system, and computer-readable medium for improving quality of low-light images
US11398016B2 (en) 2018-09-06 2022-07-26 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method, system, and computer-readable medium for improving quality of low-light images
US11113816B2 (en) 2018-09-30 2021-09-07 Boe Technology Group Co., Ltd. Image segmentation apparatus, method and relevant computing device
WO2020063426A1 (zh) * 2018-09-30 2020-04-02 京东方科技集团股份有限公司 图像分割装置、方法及相关的计算设备
CN111126242A (zh) * 2018-10-16 2020-05-08 腾讯科技(深圳)有限公司 肺部图像的语义分割方法、装置、设备及存储介质
CN109447990B (zh) * 2018-10-22 2021-06-22 北京旷视科技有限公司 图像语义分割方法、装置、电子设备和计算机可读介质
CN109447990A (zh) * 2018-10-22 2019-03-08 北京旷视科技有限公司 图像语义分割方法、装置、电子设备和计算机可读介质
CN109447976A (zh) * 2018-11-01 2019-03-08 电子科技大学 一种基于人工智能的医学图像分割方法及系统
CN109447976B (zh) * 2018-11-01 2020-07-07 电子科技大学 一种基于人工智能的医学图像分割方法及系统
CN111160378A (zh) * 2018-11-07 2020-05-15 电子科技大学 基于单张图像的多任务增强的深度估计系统
US20210279509A1 (en) * 2018-11-15 2021-09-09 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method and System For Processing Images Using Cross-Stage Skip Connections
CN112997479A (zh) * 2018-11-15 2021-06-18 Oppo广东移动通信有限公司 跨阶段跳跃连接处理图像的方法、系统和计算机可读介质
CN112997479B (zh) * 2018-11-15 2022-11-11 Oppo广东移动通信有限公司 跨阶段跳跃连接处理图像的方法、系统和计算机可读介质
CN109375186A (zh) * 2018-11-22 2019-02-22 中国人民解放军海军航空大学 基于深度残差多尺度一维卷积神经网络的雷达目标识别方法
CN109658330A (zh) * 2018-12-10 2019-04-19 广州市久邦数码科技有限公司 一种发色调整方法及装置
CN109658330B (zh) * 2018-12-10 2023-12-26 广州市久邦数码科技有限公司 一种发色调整方法及装置
CN109670516A (zh) * 2018-12-19 2019-04-23 广东工业大学 一种图像特征提取方法、装置、设备及可读存储介质
CN109829855A (zh) * 2019-01-23 2019-05-31 南京航空航天大学 一种基于融合多层次特征图的超分辨率重建方法
CN109829855B (zh) * 2019-01-23 2023-07-25 南京航空航天大学 一种基于融合多层次特征图的超分辨率重建方法
CN111507983B (zh) * 2019-01-31 2023-11-24 斯特拉德视觉公司 利用周边汽车的图像自动标注基础汽车的图像的方法及装置
CN111507983A (zh) * 2019-01-31 2020-08-07 斯特拉德视觉公司 利用周边汽车的图像自动标注基础汽车的图像的方法及装置
CN109829501A (zh) * 2019-02-01 2019-05-31 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN109993735A (zh) * 2019-03-29 2019-07-09 成都信息工程大学 基于级联卷积的图像分割方法
CN110074804A (zh) * 2019-04-12 2019-08-02 浙江工业大学 基于新型Faster R-CNN的胰腺CT图像中的囊性肿瘤检测方法
CN110188598A (zh) * 2019-04-13 2019-08-30 大连理工大学 一种基于MobileNet-v2的实时手部姿态估计方法
CN110188598B (zh) * 2019-04-13 2022-07-05 大连理工大学 一种基于MobileNet-v2的实时手部姿态估计方法
CN110263833A (zh) * 2019-06-03 2019-09-20 韩慧慧 基于编码-解码结构的图像语义分割方法
CN110322529B (zh) * 2019-07-12 2023-04-18 电子科技大学 一种基于深度学习辅助艺术绘画的方法
CN110322529A (zh) * 2019-07-12 2019-10-11 电子科技大学 一种基于深度学习辅助艺术绘画的方法
CN110428432B (zh) * 2019-08-08 2022-02-01 梅礼晔 结肠腺体图像自动分割的深度神经网络算法
CN110428432A (zh) * 2019-08-08 2019-11-08 梅礼晔 结肠腺体图像自动分割的深度神经网络算法
CN110602526A (zh) * 2019-09-11 2019-12-20 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机设备及存储介质
CN110602526B (zh) * 2019-09-11 2021-09-21 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机设备及存储介质
CN110689083A (zh) * 2019-09-30 2020-01-14 苏州大学 一种上下文金字塔融合网络及图像分割方法
CN110689083B (zh) * 2019-09-30 2022-04-12 苏州大学 一种上下文金字塔融合网络及图像分割方法
CN111127472A (zh) * 2019-10-30 2020-05-08 武汉大学 一种基于权重学习的多尺度图像分割方法
CN111127472B (zh) * 2019-10-30 2021-09-14 武汉大学 一种基于权重学习的多尺度图像分割方法
CN110853011B (zh) * 2019-11-11 2022-05-27 河北工业大学 用于肺结节检测的卷积神经网络模型的构建方法
CN110853011A (zh) * 2019-11-11 2020-02-28 河北工业大学 用于肺结节检测的卷积神经网络模型的构建方法
CN111507950A (zh) * 2020-04-08 2020-08-07 北京推想科技有限公司 图像分割的方法和装置、电子设备及计算机可读存储介质
CN111507950B (zh) * 2020-04-08 2021-08-31 推想医疗科技股份有限公司 图像分割的方法和装置、电子设备及计算机可读存储介质
CN111815731B (zh) * 2020-07-15 2024-04-26 山东省眼科研究所 图像处理方法、装置及计算机可读存储介质
CN111815731A (zh) * 2020-07-15 2020-10-23 山东省眼科研究所 图像处理方法、装置及计算机可读存储介质
CN112508924A (zh) * 2020-12-15 2021-03-16 桂林电子科技大学 一种小目标检测识别方法、装置、系统和存储介质
CN112529930A (zh) * 2020-12-18 2021-03-19 深圳先进技术研究院 一种基于聚焦融合的上下文学习医学图像分割方法
CN112790782A (zh) * 2021-02-02 2021-05-14 广州柏视医疗科技有限公司 基于深度学习的盆腔肿瘤ctv的自动勾画方法
CN112790782B (zh) * 2021-02-02 2022-06-24 广州柏视医疗科技有限公司 基于深度学习的盆腔肿瘤ctv的自动勾画系统
CN112861774A (zh) * 2021-03-04 2021-05-28 山东产研卫星信息技术产业研究院有限公司 一种使用遥感图像识别舰船目标的方法及系统
CN112800691A (zh) * 2021-04-15 2021-05-14 中国气象局公共气象服务中心(国家预警信息发布中心) 一种构建降水等级预测模型的方法及装置
CN113554058A (zh) * 2021-06-23 2021-10-26 广东奥普特科技股份有限公司 视觉目标图像分辨率增强的方法、系统、装置及存储介质
WO2023005740A1 (zh) * 2021-07-28 2023-02-02 阿里巴巴(中国)有限公司 图像编码、解码、重建、分析方法、系统及电子设备
CN113689435B (zh) * 2021-09-28 2023-06-20 平安科技(深圳)有限公司 图像分割方法、装置、电子设备及存储介质
CN113689435A (zh) * 2021-09-28 2021-11-23 平安科技(深圳)有限公司 图像分割方法、装置、电子设备及存储介质
CN113920099B (zh) * 2021-10-15 2022-08-30 深圳大学 一种基于非局部信息提取的息肉分割方法及相关组件
CN113920099A (zh) * 2021-10-15 2022-01-11 深圳大学 一种息肉分割方法、装置、计算机设备及存储介质
CN116883669A (zh) * 2023-08-03 2023-10-13 深圳扬奇医芯智能科技有限公司 一种基于动态注意力联邦框架的多目标分割技术

Also Published As

Publication number Publication date
CN108062754B (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
CN108062754A (zh) 基于密集网络图像的分割、识别方法和装置
Castillo Camacho et al. A comprehensive review of deep-learning-based methods for image forensics
CN110287962A (zh) 基于超对象信息的遥感图像目标提取方法、装置及介质
Abdollahi et al. Improving road semantic segmentation using generative adversarial network
CN106709532A (zh) 图像处理方法和装置
CN112541501B (zh) 一种基于视觉语言建模网络的场景文字识别方法
CN111860138B (zh) 基于全融合网络的三维点云语义分割方法及系统
CN106204449A (zh) 一种基于对称深度网络的单幅图像超分辨率重建方法
CN109859091A (zh) 基于Gabor滤波和卷积神经网络的图像隐写检测方法
CN106469314A (zh) 一种基于时空共生双流网络的视频图像分类方法
CN106887183A (zh) 一种bim增强现实在建筑沙盘中的互动演示方法及系统
CN112651360B (zh) 一种小样本下骨架动作识别方法
Li et al. Hst: Hierarchical swin transformer for compressed image super-resolution
Couturier et al. Image denoising using a deep encoder-decoder network with skip connections
CN109472021A (zh) 基于深度学习的医学文献中关键句筛选方法及装置
CN108171654A (zh) 带干扰抑制的汉字图像超分辨率重建方法
CN110517270A (zh) 一种基于超像素深度网络的室内场景语义分割方法
CN109726671A (zh) 从全局到类别特征表达学习的动作识别方法和系统
CN104992407B (zh) 一种图像超分辨方法
Li et al. Lightweight single image super-resolution with dense connection distillation network
Chen et al. Laplacian pyramid neural network for dense continuous-value regression for complex scenes
CN113763385A (zh) 视频目标分割方法、装置、设备及介质
CN112580381A (zh) 一种基于深度学习的二维码超辨率重构增强方法及系统
Liu et al. A new resolution enhancement method for sandstone thin-section images using perceptual GAN
Chan et al. Asymmetric cascade fusion network for building extraction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant