CN111507950B - 图像分割的方法和装置、电子设备及计算机可读存储介质 - Google Patents

图像分割的方法和装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111507950B
CN111507950B CN202010277699.1A CN202010277699A CN111507950B CN 111507950 B CN111507950 B CN 111507950B CN 202010277699 A CN202010277699 A CN 202010277699A CN 111507950 B CN111507950 B CN 111507950B
Authority
CN
China
Prior art keywords
layer
feature layer
feature
obtaining
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010277699.1A
Other languages
English (en)
Other versions
CN111507950A (zh
Inventor
陈伟导
吴双
宋晓媛
于荣震
李萌
王丹
赵朝炜
夏晨
张荣国
李新阳
王少康
陈宽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Infervision Medical Technology Co Ltd
Original Assignee
Infervision Medical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Infervision Medical Technology Co Ltd filed Critical Infervision Medical Technology Co Ltd
Priority to CN202010277699.1A priority Critical patent/CN111507950B/zh
Publication of CN111507950A publication Critical patent/CN111507950A/zh
Application granted granted Critical
Publication of CN111507950B publication Critical patent/CN111507950B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30016Brain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像分割的方法和装置、电子设备及计算机可读存储介质,该图像分割的方法包括:基于所述图像获取第一特征层;根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层;根据所述第二特征层,获取所述图像的分割结果。本申请的技术方案即使在受到图像质量的影响的情况下,也能够提高图像的分割结果的准确度。

Description

图像分割的方法和装置、电子设备及计算机可读存储介质
技术领域
本申请涉及深度学习技术领域,具体涉及一种图像分割的方法和装置、电子设备及计算机可读存储介质。
背景技术
图像分割技术可以将图像划分成若干个特定的、具有独特性质的区域,从而可以将用户感兴趣的目标从背景中分割出来,因此该技术在驾驶、行人检测、医疗等各个领域具有广泛的应用前景。现有的图像分割方法准确度低,尤其在受到图像质量的影响时,图像分割的鲁棒性难以保证。
发明内容
有鉴于此,本申请的实施例致力于提供一种图像分割的方法和装置、电子设备及计算机可读存储介质,即使在受到图像质量的影响的情况下,也能够提高图像的分割结果的准确度。
根据本申请实施例的第一方面,提供了一种图像分割的方法,包括:基于所述图像获取第一特征层;根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层;根据所述第二特征层,获取所述图像的分割结果。
在一个实施例中,所述根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层,包括:根据所述第一特征层,通过第一神经网络,获得第三特征层;根据所述第一特征层,通过第二神经网络,获得第四特征层;根据所述第一特征层、所述第三特征层和所述第四特征层,获取所述第二特征层。
在一个实施例中,所述根据所述第一特征层、所述第三特征层和所述第四特征层,获取所述第二特征层,包括:对所述第一特征层、所述第三特征层和所述第四特征层进行特征融合,得到所述第二特征层。
在一个实施例中,所述基于所述图像获取第一特征层,包括:根据所述图像,通过密集卷积网络,得到所述第一特征层。
在一个实施例中,所述根据所述第二特征层,获取所述图像的分割结果,包括:对所述第二特征层进行卷积操作,得到所述图像的分割结果。
在一个实施例中,所述根据所述第二特征层,获取所述图像的分割结果,包括:根据所述第二特征层,通过第三神经网络,得到边缘细化特征层;对所述边缘细化特征层进行卷积操作,得到所述图像的分割结果。
在一个实施例中,所述方法还包括:根据所述第一特征层,通过编码操作,得到第五特征层;根据所述第五特征层,通过所述基于残差结构的神经网络,得到第六特征层;根据所述第六特征层,通过解码操作,得到第七特征层。
在一个实施例中,所述根据所述第一特征层,通过编码操作,得到第五特征层,包括:根据所述第一特征层,通过密集卷积网络,得到第九特征层;对所述第九特征层进行卷积操作和下采样操作,得到所述第五特征层。
在一个实施例中,在根据所述第六特征层,通过解码操作,得到第七特征层之前,所述方法还包括:根据所述第六特征层,通过第三神经网络,得到边缘细化后的第六特征层。
在一个实施例中,根据所述第六特征层,通过解码操作,得到第七特征层,包括:根据所述边缘细化后的第六特征层,通过所述解码操作,得到所述第七特征层。
在一个实施例中,所述根据所述第六特征层,通过解码操作,得到第七特征层,包括:根据所述第六特征层,通过上采样操作,得到所述第七特征层。
在一个实施例中,所述根据所述第二特征层,获取所述图像的分割结果,包括:根据所述第七特征层和所述第二特征层,通过拼接操作,得到整合后的特征层;对所述整合后的特征层进行卷积操作,得到所述图像的分割结果。
在一个实施例中,所述根据所述第六特征层,通过解码操作,得到第七特征层,包括:根据所述第六特征层和所述第二特征层,通过特征融合,得到融合特征层;根据所述第六特征层,通过上采样操作,得到第八特征层;基于所述融合特征层和所述第八特征层确定所述第七特征层。
在一个实施例中,所述根据所述第二特征层,获取所述图像的分割结果,包括:根据所述第八特征层和所述融合特征层,通过拼接操作,得到整合后的特征层;对所述整合后的特征层进行卷积操作,得到所述图像的分割结果。
在一个实施例中,所述图像为脑部医学图像,所述图像的分割结果为背景、左脑室和右脑室的多类别分割结果。
根据本申请实施例的第二方面,提供了一种图像分割的装置,包括:获取模块,配置为基于所述图像获取第一特征层;信息融合模块,配置为根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层;分割模块,配置为根据所述第二特征层,获取所述图像的分割结果。
在一个实施例中,所述图像分割的装置还包括:用于执行上述实施例提及的图像分割的方法中的各个步骤的模块。
根据本申请实施例的第三方面,提供了一种电子设备,包括:处理器,用于执行上述实施例所提及的图像分割的方法;用于存储所述处理器可执行指令的存储器。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述实施例所提及的图像分割的方法。
本申请的实施例所提供的一种图像分割的方法,首先基于所述图像获取第一特征层,然后根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层,最后根据所述第二特征层,获取所述图像的分割结果,这样即使在受到图像质量的影响的情况下,也能够提高图像的分割结果的准确度。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本申请实施例所提供的一种实施环境的示意图。
图2是本申请一个实施例提供的图像分割的系统的框图。
图3是本申请一个实施例提供的图像分割的方法的流程示意图。
图4是本申请一个实施例提供的残差结构的神经网络的图像处理过程的示意图。
图5是本申请一个实施例提供的第一神经网络的图像处理过程的示意图。
图6是本申请一个实施例提供的第二神经网络的图像处理过程的示意图。
图7是本申请一个实施例提供的密集卷积网络中的dense block的图像处理过程的示意图。
图8是本申请一个实施例提供的第三神经网络的图像处理过程的示意图。
图9是本申请另一个实施例提供的图像分割的方法的流程示意图。
图10是本申请又一个实施例提供的图像分割的方法的流程示意图。
图11是本申请再一个实施例提供的图像分割的方法的流程示意图。
图12a至12c是本申请一个实施例提供的图像分割的方法的分割过程的示意图。
图13所示为本申请一个实施例提供的图像分割的装置的框图。
图14所示为本申请一个实施例提供的电子设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
申请概述
医学图像是反映解剖区域内部结构或内部功能的图像,它是由一组图像元素—像素(2D)或立体像素(3D)组成的。医学图像是由采样或重建产生的离散性图像表征,它能将数值映射到不同的空间位置上。医学图像大多数是放射成像,功能性成像,磁共振成像,超声成像这几种方式。医学图像多是单通道灰度图像,尽管大量医学图像是3D的,但是医学图像中没有景深这种概念。目前医学上的数字影像设备包括CT、MTI、CR、DR等,它们通常以DICOM3.0作为标准的文件格式。医学图像的显示系统通常配置为高性能的PC,并配以高分辨率的显示器,医学图像以直观的形式给医生提供辅助诊断和治疗的信息,特别是对于有经验的放射专家和临床医生能从这些图像中得到很多有用的信息。所以对医学图像而言,其对图像中的细节要求严格,单一图像包含大量数据。然而,在图像采集过程中往往会由于采集方法、设备、随机干扰等各种因素的影响造成图像质量下降,从而导致图像的分割结果不准确。
深度学习通过建立具有阶层结构的人工神经网络,在计算系统中实现人工智能。由于阶层结构的人工神经网络能够对输入信息进行逐层提取和筛选,因此深度学习具有表征学习能力,可以实现端到端的监督学习和非监督学习。深度学习所使用的阶层结构的人工神经网络具有多种形态,其阶层的复杂度被通称为“深度”,按构筑类型,深度学习的形式包括多层感知器、卷积神经网络、循环神经网络、深度置信网络和其它混合构筑。深度学习使用数据对其构筑中的参数进行更新以达成训练目标,该过程被通称为“学习”,深度学习提出了一种让计算机自动学习出模式特征的方法,并将特征学习融入到了建立模型的过程中,从而减少了人为设计特征造成的不完备性。
神经网络是一种运算模型,由大量的节点(或称神经元)之间相互连接构成,每个节点对应一个策略函数,每两个节点间的连接代表一个对于通过该连接信号的加权值,称之为权重。神经网络一般包括多个神经网络层,上下网络层之间相互级联,第i个神经网络层的输出与第i+1个神经网络层的输入相连,第i+1个神经网络层的输出与第i+2个神经网络层的输入相连,以此类推。训练样本输入级联的神经网络层后,通过每个神经网络层输出一个输出结果,该输出结果作为下一个神经网络层的输入,由此,通过多个神经网络层计算获得输出,比较输出层的输出的预测结果与真正的目标值,再根据预测结果与目标值之间的差异情况来调整每一层的权重矩阵和策略函数,神经网络利用训练样本不断地经过上述调整过程,使得神经网络的权重等参数得到调整,直到神经网络输出的预测结果与真正的目标结果相符,该过程就被称为神经网络的训练过程。神经网络经过训练后,可得到神经网络模型。
针对如前所述的技术问题,本申请的基本构思是提出一种图像分割的方法,主要是基于所述图像获取第一特征层,然后根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层,最后根据所述第二特征层,获取所述图像的分割结果,这样即使在受到图像质量的影响的情况下,也能够提高图像的分割结果的准确度。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图1是本申请实施例所提供的一种实施环境的示意图。以脑部医学图像为例,该实施环境包括CT扫描仪130、服务器120和计算机设备110。计算机设备110可以从CT扫描仪130处获取脑部医学图像,同时,计算机设备110还可以与服务器120之间通过通信网络相连。可选的,通信网络是有线网络或无线网络。
CT扫描仪130用于对人体组织进行X线扫描,得到人体组织的CT图像。在一实施例中,通过CT扫描仪130对脑部进行扫描,可以得到脑部医学图像。
计算机设备110可以是通用型计算机或者由专用的集成电路组成的计算机装置等,本申请实施例对此不做限定。例如,计算机设备110可以是平板电脑等移动终端设备,或者也可以是个人计算机(Personal Computer,PC),比如膝上型便携计算机和台式计算机等等。本领域技术人员可以知晓,上述计算机设备110的数量可以一个或多个,其类型可以相同或者不同。比如上述计算机设备110可以为一个,或者上述计算机设备110为几十个或几百个,或者更多数量。本申请实施例对计算机设备110的数量和设备类型不加以限定。
计算机设备110中可以部署有训练好的图像分割模型,该图像分割模型用于对脑部医学图像进行分割,且该图像分割模型是由多层级的网络(例如,基于残差结构的神经网络、密集卷积网络、语义分割网络或全局卷积网络等)构成,通过具有多层级的网络的图像分割模型可以在受到图像质量的影响的情况下,也能够提高图像的分割结果的准确度。在一些可选的实施例中,计算机设备110可以利用其上部署的图像分割模型将其从CT扫描仪130获取的脑部医学图像进行分割,以分割出背景、左脑室和右脑室的多类别分割结果。
服务器120是一台服务器,或者由若干台服务器组成,或者是一个虚拟化平台,或者是一个云计算服务中心。在一些可选的实施例中,服务器120根据经过人工标记的脑部医学图像,获取脑部的样本图像,以训练图像分割模型,且训练好的图像分割模型是由多层级的网络(例如,基于残差结构的神经网络、密集卷积网络、语义分割网络或全局卷积网络等)构成,通过具有多层级的网络的图像分割模型可以在受到图像质量的影响的情况下,也能够提高图像的分割结果的准确度。计算机设备110可以将其从CT扫描仪130获取到的脑部医学图像发送给服务器120,服务器120利用其上训练出的图像分割模型对脑部医学图像进行分割,以分割出背景、左脑室和右脑室的多类别分割结果。
图2是本申请一个实施例提供的图像分割的系统的框图。如图2所示,该系统包括:
预处理模块21,用于对原始脑部医学影像A进行归一化、去燥处理和/或图像增强处理,获得脑部医学图像B;
图像分割模型22,用于根据脑部医学图像B,得到图像的分割结果C。
参照图2中带箭头实线所示的数据流向,以此方式来实现本申请中的图像分割的方法。
示例性方法
图3是本申请一个实施例提供的图像分割的方法的流程示意图。图3所述的方法由计算设备(例如,服务器)来执行,但本申请实施例不以此为限。服务器可以是一台服务器,或者由若干台服务器组成,或者是一个虚拟化平台,或者是一个云计算服务中心,本申请实施例对此不作限定。如图3所示,该方法包括:
S301:基于所述图像获取第一特征层。
在一实施例中,该图像可以是医学图像,具体可以是脑部医学图像。当然,该图像也可以是通过其他医学设备获取的医学图像,或者是驾驶领域等其他领域的图像,本发明实施例对图像的类型不做具体限定,即本申请实施例的图像分割的方法可以用于多种类型的图像分割。
下面为了描述的方便,以脑部医学图像为例,对本申请实施例提供的图像分割的方法进行详细的描述。
在另一实施例中,脑部医学图像可以是对原始脑部医学影像进行归一化、去燥处理和/或图像增强处理所获得的脑部医学图像,原始脑部医学影像可以是通过计算机断层扫描摄影(Computed Tomography,CT)、计算机X线摄影(Computed Radiography,CR)、数字化X线摄影(Digital Radiography,DR)、核磁共振或超声等技术直接获得的影像。但是在拍摄原始脑部医学影像的过程中,可能会引入噪声,影响图像的清楚准确的显示,所以可以对原始脑部医学影像进行预处理,例如,可以利用高斯滤波器或中值滤波器去除原始脑部医学影像中的噪声。图像增强处理可以包括大小调整、裁剪、旋转、归一化以及标准化等,以提高待脑部医学图像的分割区域的信噪比。在预处理过程中,可以采用其中一种或多种对原始脑部医学影像进行增强处理,以便于后续的图像分割的过程。图像增强处理可以在去噪处理之前或之后进行。原始脑部医学影像在经历一些处理或攻击后,例如图像增强和/或去噪处理,可以得到多种副本图像,这些副本图像在经过相同参数的图像归一化处理后能够得到相同形式的标准图像,即脑部医学图像。
在另一实施例中,可以通过神经网络对该脑部医学图像进行特征提取,以获得第一特征层,但是本申请实施例并不限定神经网络的具体类型,可以为resnet、resnext或densenent等。
S302:根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层。
在一实施例中,将该第一特征层输入到基于残差结构的神经网络中,可以得到第二特征层。在训练基于残差结构的神经网络时,基于残差结构的神经网络具有更好的收敛性,降低了基于残差结构的神经网络学习的复杂度,同时,通过训练好的基于残差结构的神经网络,可以提高分割的准确度。
但是,需要说明的是,本申请实施例并不限定基于残差结构的神经网络的具体类型,可以由卷积神经网络、循环神经网络、深度神经网络等网络结构中的至少一个构成。
S303:根据所述第二特征层,获取所述图像的分割结果。
在一实施例中,可以将第二特征层输入到3×3卷积核的卷积神经网络中,以获得图像的分割结果,但是本申请实施例并不限定获得图像的分割结果的具体实施方式,还可以通过其他的方式来获得图像的分割结果,例如,可以将第二特征层输入到其他卷积核大小的卷积神经网络中,也可以将第二特征层输入到其他类型的神经网络中,还可以先对第二特征层进行后处理(例如,边缘细化等操作),然后再将后处理的第二特征层输入到相应的神经网络中。
在另一实施例中,图像的分割结果可以是分割图,或者是对分割图进一步调整获得的二值图像,即0表示背景区域,1表示目标区域(即左脑室和右脑室等目标区域),本申请实施例对此并不作具体限定。
由此可见,首先基于图像获取第一特征层,然后将第一特征层输入到基于残差结构的神经网络,以得到第二特征层,最后根据第二特征层,就可以获取图像的分割结果,这样即使在受到图像质量的影响的情况下,也能够提高图像的分割结果的准确度。
在本申请另一实施例中,所述根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层,包括:根据所述第一特征层,通过第一神经网络,获得第三特征层;根据所述第一特征层,通过第二神经网络,获得第四特征层;根据所述第一特征层、所述第三特征层和所述第四特征层,获取所述第二特征层。
在一实施例中,如图4所示,基于残差结构的神经网络由第一神经网络和第二神经网络构成,将第一特征层分别输入到第一神经网络和第二神经网络中,经第一神经网络后输出第三特征层,经第二神经网络后输出第四特征层,最后通过第一特征层、第三特征层和第四特征层,可以得到第二特征层。
在另一实施例中,第一神经网络可以为全局卷积网络GCN(Global ConvolutionNetwork),其将核大小增加到第一特征层的空间大小,从而可以获取全局信息(GlobalConvolution)。这里的全局卷积网络没有直接使用特别大的卷积核,而是基于GoogleNet的原理,将大卷积核拆分为卷积组合。如图5所示,第一神经网络的图像处理过程为:第一特征层(图像尺寸为W×H×C)经1×k+k×1的卷积和k×1+1×k的卷积后,输出两个待合并特征层(各个待合并特征层层的shape保持一致),然后将两个待合并特征层进行求和(Sum)操作后,可以得到第三特征层(图像尺寸为W×H×t)。通过1×k+k×1的卷积和k×1+1×k的卷积后,可以实现稠密连接,不同于单独使用k×k卷积,其在特征映射上有一个大的k×k区域。但是,GCN的卷积核相比卷积核小的神经网络来说,还是比较大的,这会导致参数增加,且容易过拟合,从而导致效果下降。
在另一实施例中,第二神经网络可以为语义分割网络,语义分割网络可以由全卷积网络(Fully Convolutional Networks,FCN)、SegNet和Deeplab等网络结构中的任一种构成。如图6所示,第二神经网络的图像处理过程为:对第一特征层进行1×1卷积操作,得到浅层特征层,再对第一特征层进行编码操作(即对第一特征层进行不同采样率的空洞卷积和下采样操作,输出下采样特征层),然后将下采样特征层进行解码操作(即对下采样特征层进行全局池化上采样操作,输出上采样特征层),最后将浅层特征层和上采样特征层进行concat操作,可以得到第四特征层。通过第二神经网络可以提取更密集的特征,不同采样率的空洞卷积可以有效捕获多尺度信息,相比于卷积和池化会减少信息丢失;但随着采样率的增加,滤波器有效权重逐渐变小,同时,与具有相同感受野的传统卷积操作相比是非常稀疏的,即使得到了很大的感受野,仍然丢失了很多信息。
因此,将第一神经网络与第二神经网络相结合,第二神经网络可以以更少的参数量来防止过拟合,第一神经网络可以获取全局信息,这使得第一神经网络和第二神经网络达到互补的作用,且这是一个残差结构,有更好的收敛性和精度。
在本申请另一实施例中,所述根据所述第一特征层、所述第三特征层和所述第四特征层,获取所述第二特征层,包括:对所述第一特征层、所述第三特征层和所述第四特征层进行特征融合,得到所述第二特征层。
具体地,将第一特征层、第三特征层和第四特征层进行特征融合,可以得到第二特征层。特征融合可以包括add操作和concat操作,通过add操作,第二特征层的每一特征下的信息量增多了,但是第二特征层的维度(特征)本身并没有增加;通过concat操作,第二特征层的通道数为第一特征层、第三特征层和第四特征层的通道数的合并,也就是说第二特征层的特征增加了,而每一特征下的信息是没有增加。但是本申请实施例并不限定特征融合的具体实现方式。
在本申请另一实施例中,所述基于所述图像获取第一特征层,包括:根据所述图像,通过密集卷积网络,得到所述第一特征层。
在一实施例中,将该图像输入到密集卷积网络中进行特征提取,可以得到第一特征层。密集卷积网络可以包括至少一个dense block,dense block的图像处理过程如图7所示,每个层从前面的所有层获得额外的输入,例如,特征层3通过在通道层使用“concat”的合并方式(即在通道层累叠起来进行特征复用),并将自己的特征映射传递到后续的所有层(特征层4和特征层5)。这样通过使用级联方式,每一层都在接受来自前几层的“集体知识(Collective Knowledge)”,即每一层学到的特征都能被之后所有层直接使用,这使得特征可以在整个密集卷积网络中重用,从而可以起到抗过拟合的作用。由于其他网络中的浅层特征层与损失函数中间隔着若干层特征层,在反向传播中梯度会逐渐减少,层数太深的时候梯度会趋于0,这时梯度回传到浅层特征层时会导致梯度消失,因此,会导致网络无法收敛进行学习,而密集卷积网络中的每一层可以直接接受原始网络中来自loss的监督,从而可以缓解梯度消失,节省参数和计算量。
在本申请另一实施例中,所述根据所述第二特征层,获取所述图像的分割结果,包括:对所述第二特征层进行卷积操作,得到所述图像的分割结果。
在一实施例中,可以将第二特征层输入到3×3卷积核的卷积神经网络中,以获得图像的分割结果,但是本申请实施例并不限定获得图像的分割结果的具体实施方式,还可以通过其他的方式来获得图像的分割结果,例如,可以将第二特征层输入到其他卷积核大小的卷积神经网络中,或者输入到其他类型的神经网络中。
在本申请另一实施例中,所述根据所述第二特征层,获取所述图像的分割结果,包括:根据所述第二特征层,通过第三神经网络,得到边缘细化特征层;对所述边缘细化特征层进行卷积操作,得到所述图像的分割结果。
在一实施例中,可以将第二特征层输入到第三神经网络中,以得到边缘细化特征层,然后将边缘细化特征层输入到3×3卷积核的卷积神经网络,以得到图像的分割结果。
在另一实施例中,第三神经网络可以为类似于残差结构的网络,用于学习边界信息,以对第二特征层进行边缘细化,获得边缘细化特征层。如图8所示,第二特征层经过3×3卷积操作和激活函数后,输出一个特征层,该特征层再经过3×3卷积后,输出另外一个特征层,另外一个特征层再与第二特征层进行求和(Sum)操作,可以输出边缘细化特征层。第三神经网络借助残差结构卷积来学习边界信息,从而实现细化边缘分割。
在本申请另一实施例中,所述方法还包括:根据所述第一特征层,通过编码操作,得到第五特征层;根据所述第五特征层,通过所述基于残差结构的神经网络,得到第六特征层;根据所述第六特征层,通过解码操作,得到第七特征层。
在一实施例中,第一特征层经过编码操作后可以输出第五特征层,本申请实施例对编码操作的具体实施方式并不作具体限定。第一特征层经过编码操作后,可以输出至少一个特征层,也就是说,第五特征层的个数可以为一个,也可以为多个,本申请实施例对第五特征层的具体个数不作限定。
在另一实施例中,将第五特征层输入到上述实施例提及的基于残差结构的神经网络中,可以得到第六特征层,本申请实施例在此不再赘述基于残差结构的神经网络的具体网络构成,本申请实施例在此也不再赘述通过该基于残差结构的神经网络是如何获取第六特征层的具体过程,详见上述实施例的描述。当第五特征层的个数为多个时,一个第五特征层对应一个基于残差结构的神经网络,也就是说,每一个第五特征层可以分别输入到与之对应的基于残差结构的神经网络中,这样就可以获得多个第六特征层。
在另一实施例中,第六特征层经过解码操作后可以输出第七特征层,本申请实施例对解码操作的具体实施方式并不作具体限定,解码操作与编码操作相互对应。第六特征层经过解码操作后,可以输出第七特征层,但是本申请实施例并不限定第七特征层的具体个数,可以为一个,也可以为多个,第七特征层的个数可以依据具体的应用需求来确定,第七特征层的个数越多,越能够提高语义信息与空间位置信息之间的融合程度,从而提高图像的分割结果的准确性。
在本申请另一实施例中,所述根据所述第一特征层,通过编码操作,得到第五特征层,包括:根据所述第一特征层,通过密集卷积网络,得到第九特征层;对所述第九特征层进行卷积操作和下采样操作,得到所述第五特征层。
在一实施例中,将第一特征层输入到密集卷积网络中,可以得到第九特征层,本申请实施例在此不再赘述密集卷积网络,本申请实施例在此也不再赘述通过该密集卷积网络是如何获取第九特征层的具体过程,详见上述实施例的描述。
在另一实施例中,对第九特征层进行卷积操作和下采样操作,可以得到第五特征层。例如,下采样操作可以为一个池化层,也就是说,将经过卷积操作后的第九特征层输入到池化层中,以使其保持平移(Translation),旋转(Rotation),尺度(Scale)的不变性,在保留主要特征的同时,减少参数(即,降维,效果类似PCA)和计算量,以防止过拟合,提高模型泛化能力,但是池化层会导致丢失图片信息,如空间位置信息。需要说明的是,本申请实施例并不限定下采样的倍数,可以为4倍,也可以为2倍,还可以为8倍等等。
在另一实施例中,可以迭代执行上述两个步骤:1)根据所述第一特征层,通过密集卷积网络,得到第九特征层;2)对所述第九特征层进行卷积操作和下采样操作,得到所述第五特征层;这样可以得到多个第五特征层,即,在通过上述两个步骤得到第一个第五特征层后,将该第一个第五特征层输入到密集卷积网络中,可以得到第二个第九特征层,再对第二个第九特征层进行卷积操作和下采样操作,可以得到第二个第五特征层,以此类推,可以得到多个第五特征层。
需要说明的是,每获取一个第九特征层,使用至少一个dense block,至少一个dense block的跨层连接的组合使用,使得通过池化层有效地抽取了语义信息(有助于提高分类性能),同时还保留了空间位置信息(用于像素分类标签对应的种类对齐),另外还提高模型的收敛能力。
在本申请另一实施例中,在根据所述第六特征层,通过解码操作,得到第七特征层之前,所述方法还包括:根据所述第六特征层,通过第三神经网络,得到边缘细化后的第六特征层。
在一实施例中,在通过基于残差结构的神经网络得到第六特征层后,可以将该第六特征层直接输入到第三神经网络中,以得到边缘细化后的第六特征层。当第六特征层的个数为多个时,一个第六特征层对应一个第三神经网络,也就是说,每一个第六特征层可以分别输入到与之对应的第三神经网络中,这样就可以获得多个边缘细化后的第六特征层。本申请实施例在此不再赘述第三神经网络,本申请实施例在此也不再赘述通过该第三神经网络是如何获取边缘细化后的第六特征层的具体过程,详见上述实施例的描述。
在本申请另一实施例中,根据所述第六特征层,通过解码操作,得到第七特征层,包括:根据所述边缘细化后的第六特征层,通过所述解码操作,得到所述第七特征层。
在一实施例中,在通过第三神经网络得到边缘细化后的第六特征层后,对边缘细化后的第六特征层进行解码操作,以得到第七特征层。本申请实施例在此不再详细描述解码操作,本申请实施例在此也不再详细描述通过解码操作是如何获取第七特征层的具体过程,详见下述实施例的描述。
在本申请另一实施例中,所述根据所述第六特征层,通过解码操作,得到第七特征层,包括:根据所述第六特征层,通过上采样操作,得到所述第七特征层。
在一实施例中,对第六特征层进行上采样操作,可以得到第七特征层。但是本申请实施例并不限定第七特征层的具体个数,通过上采样操作可以得到一个第七特征层,也可以得到多个第七特征层,第七特征层的个数可以依据具体的应用需求来确定,通过上采样操作所获得的第七特征层的个数越多,越能够提高语义信息与空间位置信息之间的融合程度,从而提高图像的分割结果的准确性。需要说明的是,本申请实施例并不限定上采样的倍数,可以为4倍,也可以为2倍,还可以为8倍等等。
例如,当第六特征层的个数为一个时,且第五特征层是经过2倍的下采样后所获得的,可以对第六特征层进行2倍的上采样,以得到一个第七特征层。当第六特征层的个数为多个时,具体地,第六特征层包括第六特征层1,第六特征层2和第六特征层3,多个第五特征层分别为2倍、4倍和8倍下采样所获得的。可以对第六特征层3进行8倍的上采样后,以得到第一个第七特征层,还可以对第六特征层2进行4倍的上采样后,以得到第二个第七特征层,还可以对第六特征层1进行2倍的上采样后,以得到第三个第七特征层。
在另一实施例中,由于在编码操作过程中,池化层会导致丢失空间位置信息,因此可以采用上采样操作来弥补这一缺陷。具体地,上采样操作可以将池化层中所丢失的最大激化值的真实空间位置恢复,并在上采样操作的过程中将其放在正确的位置。且上采样操作对于分割比较小的皮下组织是非常有意义的。上采样操作常用的方式有两种:反卷积和插值,其中,插值包括双线性插值(bilinear)。
在本申请另一实施例中,所述根据所述第二特征层,获取所述图像的分割结果,包括:根据所述第七特征层和所述第二特征层,通过拼接操作,得到整合后的特征层;对所述整合后的特征层进行卷积操作,得到所述图像的分割结果。
在一实施例中,当第五特征层是经过2倍的下采样后所获得的,可以对第六特征层进行2倍的上采样,以得到与第二特征层的尺度相一致的第七特征层,然后将第七特征层与第二特征层进行拼接操作(即,concat操作,本申请实施例在此不再赘述concat操作,具体细节可以参见上述实施例),可以得到整合后的特征层,然后对整合后的特征层进行卷积操作,可以得到图像的分割结果。
在另一实施例中,在得到了整合后的特征层后,还可以将该整合后的特征层输入到第三神经网络中,以对整合后的特征层进行边缘细化,然后再对边缘细化的整合后的特征层进行卷积操作,就可以获得图像的分割结果,此时所获得图像的分割结果更加的准确。本申请实施例在此不再赘述第三神经网络,以及通过第三神经网络进行边缘细化的具体过程,详见上述实施例的描述。
需要说明的是,本申请实施例并不限限定卷积操作的具体实施方式,可以参见上述实施例的描述。
在本申请另一实施例中,所述根据所述第六特征层,通过解码操作,得到第七特征层,包括:根据所述第六特征层和所述第二特征层,通过特征融合,得到融合特征层;根据所述第六特征层,通过上采样操作,得到第八特征层;基于所述融合特征层和所述第八特征层确定所述第七特征层。
在一实施例中,可以先对第六特征层进行上采样操作,使上采样的第六特征层的尺度与第二特征层的尺度一致,以便于上采样的第六特征层与第二特征层的特征融合,本申请实施例在此不再赘述特征融合,详见上述实施例的描述。需要说明的是,本申请实施例并不限定上采样的倍数,可以为4倍,也可以为2倍,还可以为8倍等等。
例如,当第六特征层的个数为一个时,且第五特征层是经过2倍的下采样所获得的,可以对第六特征层进行2倍的上采样,以得到与第二特征层的尺度相一致的上采样的第六特征层,然后第二特征层与上采样的第六特征层进行特征融合,这样就得到了融合特征层。当第六特征层的个数为多个时,具体地,第六特征层包括第六特征层1,第六特征层2和第六特征层3,多个第五特征层分别为第五特征层1,第五特征层2和第五特征层3。第五特征层1是经过2倍下采样所获得的,第五特征层2是经过4倍下采样所获得的,第五特征层3是经过8倍下采样所获得的。可以先对第六特征层3进行2倍的上采样后与第六特征层2进行特征融合,以得到特征融合特征层1。然后再对特征融合特征层1进行2倍上采样后与第六特征层1进行特征融合,以得到特征融合特征层2。最后对特征融合特征层2进行2倍上采样后与第二特征层进行特征融合,这样就得到了融合特征层。
在另一实施例中,对第六特征层进行上采样操作,可以得到第八特征层。但是本申请实施例并不限定第八特征层的具体个数,通过上采样操作可以得到一个第八特征层,也可以得到多个第八特征层,第八特征层的个数可以依据具体的应用需求来确定,通过上采样操作所获得的第八特征层的个数越多,越能够提高语义信息与空间位置信息之间的融合程度,从而提高图像的分割结果的准确性。需要说明的是,本申请实施例并不限定上采样的倍数,可以为4倍,也可以为2倍,还可以为8倍等等。
例如,当第六特征层的个数为一个时,且第五特征层是经过2倍的下采样所获得的,可以对第六特征层进行2倍的上采样,以得到与第二特征层的尺度相一致的第八特征层。当第六特征层的个数为多个时,具体地,第六特征层包括第六特征层1,第六特征层2和第六特征层3,多个第五特征层分别为第五特征层1,第五特征层2和第五特征层3。第五特征层1是经过2倍下采样所获得的,第五特征层2是经过4倍下采样所获得的,第五特征层3是经过8倍下采样所获得的,可以对第六特征层3进行8倍的上采样,以得到第一个第八特征层,还可以对第六特征层2进行4倍的上采样,以得到第二个第八特征层,还可以对第六特征层1进行2倍的上采样,以得到第三个第八特征层。
在另一实施例中,融合特征层和第八特征层的组合共同构成了第七特征层,也就是说,本实施例中的第七特征层的个数为至少两个。
在本申请另一实施例中,所述根据所述第二特征层,获取所述图像的分割结果,包括:根据所述第八特征层和所述融合特征层,通过拼接操作,得到整合后的特征层;对所述整合后的特征层进行卷积操作,得到所述图像的分割结果。
在一实施例中,由于通过上述实施例所获得的第八特征层与融合特征层的尺度是相一致的,所以可以直接将第八特征层与融合特征层进行拼接操作(即,concat操作,本申请实施例在此不再赘述concat操作,具体细节可以参见上述实施例),可以得到整合后的特征层,然后对整合后的特征层进行卷积操作,可以得到图像的分割结果。
在另一实施例中,在得到了整合后的特征层后,还可以将该整合后的特征层输入到第三神经网络中,以对整合后的特征层进行边缘细化,然后再对边缘细化的整合后的特征层进行卷积操作,就可以获得图像的分割结果,此时所获得图像的分割结果更加的准确。本申请实施例在此不再赘述第三神经网络,和通过第三神经网络进行边缘细化的具体过程,详见上述实施例的描述。
需要说明的是,本申请实施例并不限限定卷积操作的具体实施方式,可以参见上述实施例的描述。
在本申请另一实施例中,所述图像为脑部医学图像,所述图像的分割结果为背景、左脑室和右脑室的多类别分割结果。
需要说明的是,本申请实施例并不限定分割结果的具体类型,分割结果还可以为其他目标区域的多类别分割结果。
图9是本申请另一个实施例提供的图像分割的方法的流程示意图。图9所示的实施例为本申请的一个较佳实施例,如图9所示,该方法包括:
S901:基于所述图像获取第一特征层;
S902:根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层;
S903:根据所述第二特征层,通过第三神经网络,得到边缘细化特征层;
S904:对所述边缘细化特征层进行卷积操作,得到所述图像的分割结果。
本申请实施例中的S901至S904在上述实施例中均有具体的解释说明,对于本申请图9所示的方法中未披露的细节,请参照本申请上述实施例。
图10是本申请又一个实施例提供的图像分割的方法的流程示意图。图10所示的实施例为本申请的一个较佳实施例,如图10所示,该方法包括:
S1001:基于所述图像获取第一特征层;
S1002:根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层;
S1003:根据所述第一特征层,通过编码操作,得到第五特征层;
S1004:根据所述第五特征层,通过所述基于残差结构的神经网络,得到第六特征层;
S1005:根据所述第六特征层,通过第三神经网络,得到边缘细化后的第六特征层;
S1006:根据所述边缘细化后的第六特征层,通过解码操作,得到第七特征层;
S1007:根据所述第七特征层和所述第二特征层,通过拼接操作,得到整合后的特征层;
S1008:根据所述整合后的特征层,通过第三神经网络,得到边缘细化的整合后的特征层;
S1009:对所述边缘细化的整合后的特征层进行卷积操作,得到所述图像的分割结果。
本申请实施例中的S1001至S1009在上述实施例中均有具体的解释说明,对于本申请图10所示的方法中未披露的细节,请参照本申请上述实施例。
图11是本申请再一个实施例提供的图像分割的方法的流程示意图。图11所示的实施例为本申请的一个较佳实施例,如图11所示,该方法包括:
S1101:基于所述图像获取第一特征层;
S1102:根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层;
S1103:根据所述第一特征层,通过编码操作,得到第五特征层;
S1104:根据所述第五特征层,通过所述基于残差结构的神经网络,得到第六特征层;
S1105:根据所述第六特征层,通过第三神经网络,得到边缘细化后的第六特征层;
S1106:根据所述边缘细化后的第六特征层和所述第二特征层,通过特征融合,得到融合特征层;
S1107:根据所述边缘细化后的第六特征层,通过上采样操作,得到第八特征层;
S1108:根据所述第八特征层和所述融合特征层,通过拼接操作,得到整合后的特征层;
S1109:根据所述整合后的特征层,通过第三神经网络,得到边缘细化的整合后的特征层;
S1110:对所述边缘细化的整合后的特征层进行卷积操作,得到所述图像的分割结果。
本申请实施例中的S1101至S1110在上述实施例中均有具体的解释说明,对于本申请图11所示的方法中未披露的细节,请参照本申请上述实施例。
图12a至12c是本申请一个实施例提供的图像分割的方法的分割过程的示意图。如图12a所示,A为第一特征层,B为第二特征层,C为第九特征层,D为第五特征层,E为第六特征层,F为边缘细化后的第六特征层,G为融合特征层,H为第八特征层,J为第七特征层,I为整合后的特征层。
在一实施例中,第九特征层C经过2倍下采样后,输出第五特征层D;第五特征层D经过密集卷积网络后,再输出第九特征层C;第九特征层C经过4倍下采样后,再输出第五特征层D;第五特征层D经过密集卷积网络后,再输出第九特征层C;第九特征层C经过8倍下采样后,再输出第五特征层D。
在另一实施例中,每个第五特征层D经基于残差结构的神经网络后,输出第六特征层E;每个第六特征层E经用于边缘细化的第三神经网络后,输出边缘细化后的第六特征层F。
在另一实施例中,边缘细化后的第六特征层F经过2倍上采样后,与另外一个边缘细化后的第六特征层F进行特征融合,输出融合特征层G;融合特征层G经过2倍上采样后,与另外一个边缘细化后的第六特征层F进行特征融合,输出另外一个融合特征层G;融合特征层G经过2倍上采样后,与第二特征层B进行特征融合,输出最终的融合特征层G。
在另一实施例中,边缘细化后的第六特征层F经过8倍上采样后,输出一个第八特征层H;一个融合特征层G经过4倍上采样后,输出另一个第八特征层H;另一个融合特征层G经过2倍上采样后,输出又一个第八特征层H。
在另一实施例中,最终的融合特征层G和三个第八特征层H组合共同构成了第七特征层J。
在另一实施例中,将第八特征层H和融合特征层G进行拼接操作,得到整合后的特征层I,对整合后的特征层I进行卷积操作,得到图像的分割结果。
如图12b所示,A为第一特征层,B为第二特征层,C为第九特征层,D为第五特征层,E为第六特征层,F为边缘细化后的第六特征层,I为整合后的特征层,J为第七特征层。下面只描述与图12a所示实施例不同之处,相同之处不再赘述。
在一实施例中,一个边缘细化后的第六特征层F经过8倍上采样后,输出一个第七特征层J;另一个边缘细化后的第六特征层F经过4倍上采样后,输出另一个第七特征层J;又一个边缘细化后的第六特征层F经过2倍上采样后,输出又一个第七特征层J。
在另一实施例中,将多个第七特征层J和第二特征层B进行拼接操作,得到整合后的特征层I,对整合后的特征层I进行卷积操作,得到图像的分割结果。
如图12c所示,A为第一特征层,B为第二特征层,L为边缘细化特征层。
在一实施例中,第一特征层A经基于残差结构的神经网络后,输出第二特征层B;第二特征层B经用于边缘细化的第三神经网络后,输出边缘细化特征层L;对边缘细化特征层L进行卷积操作,得到图像的分割结果。
示例性装置
本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图13所示为本申请一个实施例提供的图像分割的装置的框图。如图13所示,该图像分割的装置1300包括:
获取模块1310,配置为基于所述图像获取第一特征层;
信息融合模块1320,配置为根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层;
分割模块1330,配置为根据所述第二特征层,获取所述图像的分割结果。
在一个实施例中,所述图像分割的装置1300还包括:用于执行上述实施例提及的图像分割的方法中的各个步骤的模块。
示例性电子设备
下面,参考图14来描述根据本申请实施例的电子设备。图14图示了根据本申请实施例的电子设备的框图。
如图14所示,电子设备1400包括一个或多个处理器1410和存储器1420。
处理器1410可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备1400中的其他组件以执行期望的功能。
存储器1420可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器1410可以运行所述程序指令,以实现上文所述的本申请的各个实施例的图像分割的方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备1400还可以包括:输入装置1430和输出装置1440,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
例如,该输入装置1430可以是上述的麦克风或麦克风阵列,用于捕捉声源的输入信号。在该电子设备是单机设备时,该输入装置1430可以是通信网络连接器。
此外,该输入设备1430还可以包括例如键盘、鼠标等等。
该输出装置1440可以向外部输出各种信息,包括确定出的征象类别信息等。该输出设备1440可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图14中仅示出了该电子设备1400中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备1400还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的图像分割的方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的图像分割的方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (12)

1.一种图像分割的方法,其特征在于,包括:
基于所述图像获取第一特征层;
根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层;
根据所述第二特征层,获取所述图像的分割结果,
其中,所述根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层,包括:
根据所述第一特征层,通过第一神经网络,获得第三特征层;
根据所述第一特征层,通过第二神经网络,获得第四特征层;
根据所述第一特征层、所述第三特征层和所述第四特征层,获取所述第二特征层,
其中,所述方法还包括:
根据所述第一特征层,通过编码操作,得到第五特征层;
根据所述第五特征层,通过所述基于残差结构的神经网络,得到第六特征层;
根据所述第六特征层,通过解码操作,得到第七特征层,
其中,所述根据所述第六特征层,通过解码操作,得到第七特征层,包括:
根据所述第六特征层和所述第二特征层,通过特征融合,得到融合特征层;
根据所述第六特征层,通过上采样操作,得到第八特征层;
确定所述融合特征层和所述第八特征层为所述第七特征层,
其中,所述根据所述第二特征层,获取所述图像的分割结果,包括:
根据所述第七特征层中的所述第八特征层和所述融合特征层,通过拼接操作,得到整合后的特征层;
对所述整合后的特征层进行卷积操作,得到所述图像的分割结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征层、所述第三特征层和所述第四特征层,获取所述第二特征层,包括:
对所述第一特征层、所述第三特征层和所述第四特征层进行特征融合,得到所述第二特征层。
3.根据权利要求1所述的方法,其特征在于,所述基于所述图像获取第一特征层,包括:
根据所述图像,通过密集卷积网络,得到所述第一特征层。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述第二特征层,获取所述图像的分割结果,包括:
对所述第二特征层进行卷积操作,得到所述图像的分割结果。
5.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述第二特征层,获取所述图像的分割结果,包括:
根据所述第二特征层,通过第三神经网络,得到边缘细化特征层;
对所述边缘细化特征层进行卷积操作,得到所述图像的分割结果。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征层,通过编码操作,得到第五特征层,包括:
根据所述第一特征层,通过密集卷积网络,得到第九特征层;
对所述第九特征层进行卷积操作和下采样操作,得到所述第五特征层。
7.根据权利要求1所述的方法,其特征在于,在根据所述第六特征层,通过解码操作,得到第七特征层之前,所述方法还包括:
根据所述第六特征层,通过第三神经网络,得到边缘细化后的第六特征层,
其中,根据所述第六特征层,通过解码操作,得到第七特征层,包括:
根据所述边缘细化后的第六特征层,通过所述解码操作,得到所述第七特征层。
8.根据权利要求1所述的方法,其特征在于,所述根据所述第六特征层,通过解码操作,得到第七特征层,包括:
根据所述第六特征层,通过上采样操作,得到所述第七特征层,
其中,所述根据所述第二特征层,获取所述图像的分割结果,包括:
根据所述第七特征层和所述第二特征层,通过拼接操作,得到整合后的特征层;
对所述整合后的特征层进行卷积操作,得到所述图像的分割结果。
9.根据权利要求1至3中任一项所述的方法,其特征在于,所述图像为脑部医学图像,所述图像的分割结果为背景、左脑室和右脑室的多类别分割结果。
10.一种图像分割的装置,其特征在于,包括:
获取模块,配置为基于所述图像获取第一特征层;
信息融合模块,配置为根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层;
分割模块,配置为根据所述第二特征层,获取所述图像的分割结果,
其中,所述信息融合模块在根据所述第一特征层,通过基于残差结构的神经网络,得到第二特征层时,进一步配置为:
根据所述第一特征层,通过第一神经网络,获得第三特征层;
根据所述第一特征层,通过第二神经网络,获得第四特征层;
根据所述第一特征层、所述第三特征层和所述第四特征层,获取所述第二特征层,
其中,所述信息融合模块进一步配置为:
根据所述第一特征层,通过编码操作,得到第五特征层;
根据所述第五特征层,通过所述基于残差结构的神经网络,得到第六特征层;
根据所述第六特征层,通过解码操作,得到第七特征层,
其中,所述信息融合模块在根据所述第六特征层,通过解码操作,得到第七特征层时,进一步配置为:
根据所述第六特征层和所述第二特征层,通过特征融合,得到融合特征层;
根据所述第六特征层,通过上采样操作,得到第八特征层;
确定所述融合特征层和所述第八特征层为所述第七特征层,
其中,分割模块进一步配置为:
根据所述第七特征层中的所述第八特征层和所述融合特征层,通过拼接操作,得到整合后的特征层;
对所述整合后的特征层进行卷积操作,得到所述图像的分割结果。
11.一种电子设备,包括:
处理器,用于执行上述权利要求1至9中任一项所述的图像分割的方法;
用于存储所述处理器可执行指令的存储器。
12.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1至9中任一项所述的图像分割的方法。
CN202010277699.1A 2020-04-08 2020-04-08 图像分割的方法和装置、电子设备及计算机可读存储介质 Active CN111507950B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010277699.1A CN111507950B (zh) 2020-04-08 2020-04-08 图像分割的方法和装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010277699.1A CN111507950B (zh) 2020-04-08 2020-04-08 图像分割的方法和装置、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111507950A CN111507950A (zh) 2020-08-07
CN111507950B true CN111507950B (zh) 2021-08-31

Family

ID=71864061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010277699.1A Active CN111507950B (zh) 2020-04-08 2020-04-08 图像分割的方法和装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111507950B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837192B (zh) * 2021-09-22 2024-04-19 推想医疗科技股份有限公司 图像分割方法及装置,神经网络的训练方法及装置
CN113570612B (zh) * 2021-09-23 2021-12-17 苏州浪潮智能科技有限公司 一种图像处理方法、装置及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062754A (zh) * 2018-01-19 2018-05-22 深圳大学 基于密集网络图像的分割、识别方法和装置
CN109447976A (zh) * 2018-11-01 2019-03-08 电子科技大学 一种基于人工智能的医学图像分割方法及系统
CN109872306A (zh) * 2019-01-28 2019-06-11 腾讯科技(深圳)有限公司 医学图像分割方法、装置和存储介质
CN110188768A (zh) * 2019-05-09 2019-08-30 南京邮电大学 实时图像语义分割方法及系统
CN110415284A (zh) * 2019-07-31 2019-11-05 中国科学技术大学 一种单视彩色图像深度图获得方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109934153B (zh) * 2019-03-07 2023-06-20 张新长 基于门控深度残差优化网络的建筑物提取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062754A (zh) * 2018-01-19 2018-05-22 深圳大学 基于密集网络图像的分割、识别方法和装置
CN109447976A (zh) * 2018-11-01 2019-03-08 电子科技大学 一种基于人工智能的医学图像分割方法及系统
CN109872306A (zh) * 2019-01-28 2019-06-11 腾讯科技(深圳)有限公司 医学图像分割方法、装置和存储介质
CN110188768A (zh) * 2019-05-09 2019-08-30 南京邮电大学 实时图像语义分割方法及系统
CN110415284A (zh) * 2019-07-31 2019-11-05 中国科学技术大学 一种单视彩色图像深度图获得方法及装置

Also Published As

Publication number Publication date
CN111507950A (zh) 2020-08-07

Similar Documents

Publication Publication Date Title
EP3961500B1 (en) Medical image detection method based on deep learning, and related device
CN112132959B (zh) 数字岩心图像处理方法、装置、计算机设备及存储介质
CN111784671B (zh) 基于多尺度深度学习的病理图像病灶区域检测方法
AU2019200270A1 (en) Concept mask: large-scale segmentation from semantic concepts
CN111429421A (zh) 模型生成方法、医学图像分割方法、装置、设备及介质
CN111445457B (zh) 网络模型的训练方法及装置、识别方法及装置、电子设备
CN111091521A (zh) 图像处理方法及装置、电子设备和计算机可读存储介质
CN112396605B (zh) 网络训练方法及装置、图像识别方法和电子设备
CN111524109B (zh) 头部医学影像的评分方法和装置、电子设备及存储介质
CN117078930A (zh) 基于边界感知和注意力机制的医学图像分割方法
CN111507950B (zh) 图像分割的方法和装置、电子设备及计算机可读存储介质
CN112700460A (zh) 图像分割方法及系统
CN112101456A (zh) 注意力特征图获取方法及装置、目标检测的方法及装置
CN117576405A (zh) 舌象语义分割方法、装置、设备及介质
Umer et al. Breast cancer classification and segmentation framework using multiscale CNN and U‐shaped dual decoded attention network
Isar et al. Hyperanalytic wavelet-based robust edge detection
US20230052145A1 (en) Explaining a model output of a trained model
CN113850796A (zh) 基于ct数据的肺部疾病识别方法及装置、介质和电子设备
CN114240930A (zh) 基于深度学习的腰椎识别定位装置及方法和电子设备
CN111445456B (zh) 分类模型、网络模型的训练方法及装置、识别方法及装置
Sabnam et al. Application of generative adversarial networks in image, face reconstruction and medical imaging: challenges and the current progress
KR101948701B1 (ko) 피검체의 뇌 구조를 기술하는 잠재 변수에 기반하여 상기 피검체의 뇌질환을 판정하는 방법 및 이를 이용한 장치
CN116935182A (zh) 基于RepCSC-Net的乳腺肿瘤良恶性识别方法
CN113837192B (zh) 图像分割方法及装置,神经网络的训练方法及装置
Huang et al. Deep Multimodal Fusion Autoencoder for Saliency Prediction of RGB‐D Images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room B401, floor 4, building 1, No. 12, Shangdi Information Road, Haidian District, Beijing 100085

Applicant after: Tuxiang Medical Technology Co., Ltd

Address before: Room B401, floor 4, building 1, No. 12, Shangdi Information Road, Haidian District, Beijing 100085

Applicant before: Beijing Tuoxiang Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant