CN113538530B - 一种耳部医学图像分割方法、装置、电子设备及存储介质 - Google Patents

一种耳部医学图像分割方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113538530B
CN113538530B CN202110779179.5A CN202110779179A CN113538530B CN 113538530 B CN113538530 B CN 113538530B CN 202110779179 A CN202110779179 A CN 202110779179A CN 113538530 B CN113538530 B CN 113538530B
Authority
CN
China
Prior art keywords
image
segmentation
ear
medical image
net
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110779179.5A
Other languages
English (en)
Other versions
CN113538530A (zh
Inventor
周凌霄
袁懿伦
刘安然
夏羽
李光
袁小聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shenguangsu Technology Co ltd
Original Assignee
Shenzhen Shenguangsu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shenguangsu Technology Co ltd filed Critical Shenzhen Shenguangsu Technology Co ltd
Priority to CN202110779179.5A priority Critical patent/CN113538530B/zh
Publication of CN113538530A publication Critical patent/CN113538530A/zh
Application granted granted Critical
Publication of CN113538530B publication Critical patent/CN113538530B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明公开了一种耳部医学图像分割方法、装置、电子设备及存储介质,该方法包括:获取待分割的原始耳部医学图像,根据原始耳部医学图像生成耳部各个部位对应的多个训练数据集;构建基于端到端的U‑NET++图像分割网络,根据多个训练数据集分别对U‑NET++图像分割网络进行训练,生成各个部位对应的多个图像分割模型;根据多个图像分割模型分别对原始耳部医学图像进行分割,生成各个部位的分割结果;将各个部位的分割结果进行图像融合,生成目标分割图像。本发明实施例可实现借助U‑NET++网络,可实现使用更少的数据集进行训练模型来达到分割效果,在一张图像上展示医学影像中各个耳部部位的相互影响关系,方便观看。

Description

一种耳部医学图像分割方法、装置、电子设备及存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种耳部医学图像分割方法、装置、电子设备及存储介质。
背景技术
近年来,深度学习在计算机视觉领域取得了巨大的成功,深度学习可用于图像识别、目标检测、语义分割等基础任务,同时可以用于姿态识别,人脸识别等高级别任务。在许多任务中,深度学习的效果已经超出人工手动能达到的效果,极大的解放了人力。在医疗领域中,最常见的应用场景是医学图像处理。图像分割是医学图像处理任务中一个重要的研究方向。虽然目前已经出现了很多图像分割方法,其中包含传统的分割方法和基于深度学习模型的分割方法。其中深度学习是指学习样本数据的内在规律和表示层次。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
目前的耳部医疗图像分割技术通常是语义分割,也就是按照图像中物体的类别将感兴趣的区域(ROI,region of interest)以前景和背景像素的模式分割。但这带来了两类问题,一是当多个同类别的物体挨着,或者说互相重叠的时候,无法将单个物体分割出来;二是在人体实际情况中,医学扫描形成的图像并不仅仅包含所需要的部分,比如说拍摄扫描肺部图像,在图片中显示的可能不只有想要进行观察的肺结节,还有其他器官以及肺部的其他部分,这些都会影响分割效果。并且医生在使用分割图像不仅仅依靠观察一个部位的图像,通常需要观察相邻的,相关的一系列图像这一类单一类型分割方法不能够很好的处理这类问题。
因此现有技术中的耳部医学图像分割方法,由于耳部各个部位互相交叉堆叠又互相关联,使用单一语义分割方法很难够获取准确的分割结果。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种耳部医学图像分割方法、装置、电子设备及存储介质,旨在解决现有技术中耳部医学图像分割方法,由于耳部各个部位互相交叉堆叠又互相关联,使用单一语义分割方法很难够获取准确的分割结果的问题。
本发明的技术方案如下:
本发明第一实施例提供了一种耳部医学图像分割方法,方法包括:
获取待分割的原始耳部医学图像,根据原始耳部医学图像生成耳部各个部位对应的多个训练数据集,所述训练数据集的个数与所述耳部的部位的个数相同;
构建基于端到端的U-NET++图像分割网络,根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,生成各个部位对应的多个图像分割模型,所述U-NET++图像分割网络由不同深度的U-NET网络组成;
根据所述多个图像分割模型分别对所述原始耳部医学图像进行分割,生成各个部位的分割结果;
将各个部位的分割结果进行图像融合,生成目标分割图像,所述目标分割图像为显示耳部各个部位分割结果的图像。
进一步地,所述获取待分割的原始耳部医学图像,根据原始耳部医学图像生成耳部各个部位对应的多个训练数据集,包括:
获取待分割的原始耳部医学图像,对原始耳部医学图像进行预处理后,生成目标耳部医学图像;
根据每一个耳部部位单独分割后的医学图像标签,对所述目标耳部医学图像中进行标记,根据标记结果构建多个训练数据集。
进一步地,所述获取待分割的原始耳部医学图像,对原始耳部医学图像进行预处理后,生成目标耳部医学图像,包括:
获取待分割的原始耳部医学图像,对原始耳部图像转化为固定尺寸的第一耳部医学图像;
将所述第一耳部医学图像进行对比度增强处理,生成第二耳部医学图像;
将所述第二耳部医学图像进行灰度化处理后,进行灰度归一化处理,生成目标耳部医学图像。
进一步地,所述构建基于端到端的U-NET++图像分割网络,根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,生成各个部位对应的多个图像分割模型,包括:
构建基于端到端的U-NET++图像分割网络,所述U-NET++图像分割网络包括上采样层、下采样层、跳跃连接结构;
将所述多个训练数据集输入对U-NET++图像分割网络,根据U-NET++图像分割网络进行特征融合,并进行剪枝操作;
训练完成后,生成各个部位对应的多个图像分割模型。
进一步地,所述将各个部位的分割结果进行图像融合,生成目标分割图像,包括:
将各个部位的分割结果进行配准,获取各个部位对应的加权权重;
对所述各个部位的分割结果进行加权处理,并按照对应的加权权重对将各个部位的分割结果进行灰度化处理,生成各个部位的灰度图像;
根据所述灰度图像进行图像融合,生成目标分割图像。
进一步地,所述根据所述灰度图像进行图像融合,生成目标分割图像后,还包括:
根据阈值分割算法对所述目标分割图像中各个部位的边界进行再分割,生成耳部各个部位的图像。
进一步地,所述根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,还包括:
根据交叉熵损失函数、二分类前景和后景损失函数对U-NET++图像分割网络进行校准;
其中交叉熵损失函数的计算公式如下:
其中y是标签0或1,a是网络经过sigmoid函数后的输出,a的取值范围为(0,1),n是样本数量;
二分类前景和后景损失函数的计算公式如下:
L(n)=max(0,1-t*n) (公式2)
其中,n是预测值,n的取值在-1到1之间,t为目标值,t的值为1或-1。
本发明的另一实施例提供了一种耳部医学图像分割装置,装置包括:
训练集构建模块,用于获取待分割的原始耳部医学图像,根据原始耳部医学图像生成耳部各个部位对应的多个训练数据集,所述训练数据集的个数与所述耳部的部位的个数相同;
图像分割模型训练模块,用于构建基于端到端的U-NET++图像分割网络,根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,生成各个部位对应的多个图像分割模型,所述述U-NET++图像分割网络由不同深度的U-NET网络组成;
图像分割模块,用于根据所述多个图像分割模型分别对所述原始耳部医学图像进行分割,生成各个部位的分割结果;
图像融合模块,用于将各个部位的分割结果进行图像融合,生成目标分割图像,所述目标分割图像为显示耳部各个部位分割结果的图像。
本发明的另一实施例提供了一种电子设备,所述电子设备包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的耳部医学图像分割方法。
本发明的另一实施例还提供了一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述的耳部医学图像分割方法。
有益效果:本发明实施例可实现借助U-NET++网络,更好的融合高层特征和低层特征,这种高效的特征提取方式可以使用更少的数据集进行训练模型来达到最终效果;多个语义分割结果相融合的方法,能够获取更加精准的分割结果,在一张图像上展示医学影像中各个部位的相互影响关系,方便观看。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明一种耳部医学图像分割方法较佳实施例的流程图;
图2为本发明一种耳部医学图像分割方法的具体应用实施例的训练数据集扩增示意图;
图3为本发明一种耳部医学图像分割方法的具体应用实施例的U-NET++网络架构示意图;
图4为本发明一种耳部医学图像分割方法的具体应用实施例的图像融合过程结构示意图;
图5为本发明一种耳部医学图像分割装置的较佳实施例的功能模块示意图;
图6为本发明一种电子设备的较佳实施例的硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合附图对本发明实施例进行介绍。
本发明实施例提供了一种耳部医学图像分割方法,请参阅图1,图1为本发明一种耳部医学图像分割方法较佳实施例的流程图。如图1所示,其包括步骤:
步骤S100、获取待分割的原始耳部医学图像,根据原始耳部医学图像生成耳部各个部位对应的多个训练数据集,所述训练数据集的个数与所述耳部的部位的个数相同;
步骤S200、构建基于端到端的U-NET++图像分割网络,根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,生成各个部位对应的多个图像分割模型,所述U-NET++图像分割网络由不同深度的U-NET网络组成;
步骤S300、根据所述多个图像分割模型分别对所述原始耳部医学图像进行分割,生成各个部位的分割结果;
步骤S400、将各个部位的分割结果进行图像融合,生成目标分割图像,所述目标分割图像为显示耳部各个部位分割结果的图像。
具体实施时,本发明实施例的耳部医学图像分割方法通过获取待处理的耳部医学图像,耳部图学图像记为医学影像数据,对影像数据进行预处理并整合得到耳朵各个部位分割训练数据集;构建端到端的U-NET++语义分割网络;利用训练数据集训练对应特定部位的特定分割模型;使用得到的特定分割模型对各个部位在同一张医学影像上进行单独分割,获得耳部同一基础医学影像的多种不同部位分割结果;将获得的多个分割结果进行配准融合到一张影像数据上,获得类似于实例分割且精度大于实例分割的结果。U-NET++图像分割网络也是一种卷经神经网络,卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。卷积神经网络由卷积层、池化层和全连接层组成,卷积层:卷积层主要由卷积计算和激活函数组成,目的是提取输入的不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网路能从低级特征中迭代提取更复杂的特征。池化层:降低卷积层输出的特征向量,同时改善结果,使结构不容易出现过拟合。全连接层:全连接层的每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综合起来,即把学习到的特征映射到样本标记空间的作用。
图像分割是指将图像分成若干具有相似性质的区域的过程。为了增加神经网络模型的非线性,从而引入了激活函数。这样使得神经网络可以任意逼近任何非线性函数。编码-解码模型:又叫做Encoder-Decoder模型,其中编码指将输入序列转化成一个固定长度的向量;解码指将之前生成的固定向量再转化成输出序列。前向传播:输入在神经网络中的顺序传递过程。反向传播算法:反向传播算法(Back Propagation,BP)是目前用来训练人工神经网络的最常用且最有效的算法。通过计算网络预测值与实际值之间的误差,并将该误差从神经网络末端进行反向传播。在反向传播的过程中,根据误差调整各种参数的值,不断迭代上述过程,直至收敛。
在一个实施例中,获取待分割的原始耳部医学图像,根据原始耳部医学图像生成耳部各个部位对应的多个训练数据集,包括:
获取待分割的原始耳部医学图像,对原始耳部医学图像进行预处理后,生成目标耳部医学图像;
根据每一个耳部部位单独分割后的医学图像标签,对所述目标耳部医学图像中进行标记,根据标记结果构建多个训练数据集。
具体实施时,获取待分割的原始医学图像,对其进行预处理,并以在同一张原始医学图像上对每一个部位单独分割后的医学图像标签作为标记,构建得到多个训练数据集(数据集A、数据集B、数据集C、数据集D…)。例如耳部部位包括但不限于耳蜗、鼓膜、上半规管、后骨半规管,则将耳蜗生成的训练数据集记为数据集A,将鼓膜生成的训练数据集记为数据集B,将上半规管生成的训练数据集记为数据集C,将后骨半规管生成的训练数据集记为数据集D。
在一个实施例中,获取待分割的原始耳部医学图像,对原始耳部医学图像进行预处理后,生成目标耳部医学图像,包括:
获取待分割的原始耳部医学图像,对原始耳部图像转化为固定尺寸的第一耳部医学图像;
将所述第一耳部医学图像进行对比度增强处理,生成第二耳部医学图像;
将所述第二耳部医学图像进行灰度化处理后,进行灰度归一化处理,生成目标耳部医学图像。
具体实施时,使用同一张原始医学图像进行标记分割的不同部位需要进行配准处理,以便于之后的图像融合,所述预处理是将原始医学图像转换为512*512大小的固定尺寸,并进行增强对比度处理,灰度化彩色图片后将灰度像素转化为0-1之间,减小输入特征的尺度。
数据预处理获得训练数据集的方法,包括对图像进行缩放,尺寸转换,增强对比度,灰度化彩色图片后进行二值化处理等一系列预处理,同时对数据进行缩放,旋转等操作,实现数据集的扩增。
其中使用双线性插值法公式如下:
当R1=(x,y2),
当R2=(x,y2),
就可推出在y方向的插值
其中字母表示如图2所示。
进行二值化处理方法如下:求出图像最大灰度值与最小灰度值,分别记为Rmax和Rmin,令阈值T=(Rmax+Rmin)/2;根据阈值T将图象的平均灰度值分成两组R1和R2;分别求出两组的平均灰度值μ1和μ2;求出新阈值T=(μ12)/2;根据新阈值,将大于阈值T的设为255,小于阈值T的设为0。
在一个实施例中,构建基于端到端的U-NET++图像分割网络,根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,生成各个部位对应的多个图像分割模型,包括:
构建基于端到端的U-NET++图像分割网络,所述U-NET++图像分割网络包括上采样层、下采样层、跳跃连接结构;
将所述多个训练数据集输入对U-NET++图像分割网络,根据U-NET++图像分割网络进行特征融合,并进行剪枝操作;
训练完成后,生成各个部位对应的多个图像分割模型。
具体实施时,构建基于端到端的U-NET++图像分割网络,U-NET++网络由不同深度的U-NET组成,其解码器通过重新设计的跳跃连接以相同的分辨率密集连接,使用上述训练数据集A、B、C、D…在U-NET++进行训练,获得多个训练模型(A、B、C、D…)。
UNet++网络模型包括上采样层、下采样层、跳越连接结构以及层与层之间的特征融合并且加入剪枝操作,利用UNet++网络端对端的特点对信号不同层次的特征进行像素级的提取。
如图3所示,所用的U-NET++网络结构图。
本实例所述的UNet++网络模型采用了UNet的经典编码解码结构,包括下采样(Down-sampling)、上采样(Up-sampling)和跳跃连接(skip connection),其中跳跃连接可以把编码器部分每一次下采样得到的特征通过级联(Concatenation)和卷积与解码器部分上采样结果融合,使得到的语义分割结果更加精准。下采样主要是为了增加模型鲁棒性,轻微的旋转不变性,减少训练参数以及增加网络感受野等。上采样则是将提取到的特征逐步恢复到和原图像大小一致的标签预测中。这里主要是对像素点的类别预测所以需要输入图像和其对应标签具有相同的大小。
其主要特点是解决了UNet网络结构层数选择问题,同时在跳层路径上添加了密集的跳层连接,以及采用深监督的训练方式可以对训练好的模型进行剪枝操作。
具体来说,参见图3,图中实线框圆部分为原始的UNet结构,虚线框圆部分为添加的卷积层,虚线段连接部分代表改进的跳跃连接。其中X0,0、X1,0、X2,0、X3,0、X4,0为网络的主干结构,主要进行的是卷积和下采样操作。在节点X0,0和节点X0,4之间的跳层路径由三个卷积层X0,1、X0,2、X0,3组成,同样在节点X1,0和节点X1,3之间的跳层路径由两个卷积层X1,1,X1,2组成,在节点X2,0和节点X2,2之间的跳层路径由一个卷积层X2,1组成。其中每个卷积层之前还包含一个连接层,该连接层融合来自先前卷积层的输出和相应的解码器部分上采样输出。
UNet++在X0,1、X0,2、X0,3、X0,4均使用了深度监督的训练方式。因此当网络训练好后,在测试阶段如果子网络掌纹识别的效果已经足够好,就可以进行剪枝操作剪掉剩余的网络部分。这里可以进行剪枝操作的主要原因是在测试阶段由于输入待识别的图像经过网络进行前向传播操作,如果子网络效果足够好,剪掉的剩余网络部分对该子网络的预测输出是没有影响的。
在数据预处理后的各个部位对应的分割标签图片与原始图片做训练集的情况下,通过网络前向传播得到的输出为每个像素点所属类别的概率,进行处理得到分割模型。
然后利用得到的分割模型进行耳蜗、鼓膜、上半规管、后骨半规管等部位的分割,为了让最后预测结果边界更加平滑、同时消除细小预测噪声的影响,因此可以考虑对最后预测结果进行先腐蚀后膨胀的形态学操作。形态学处理中的形态学表示数学形态学的内容,将数学形态学作为工具从图像中提取表达和描绘区域形状的有用图像分量,如边界、骨架和凸壳等。
腐蚀:集合A和集合B,表示为的B对A的腐蚀为/> 该式指出B对A的腐蚀是一个用z平移的B包含在A中的所有的点z的集合。
膨胀:集合A和集合B,表示为的B对A的膨胀定义为/> 这个公式是以B关于它的原点的映像,并且以z对映像进行平移为基础的。B对A的膨胀是所有位移z的集合。
在一个实施例中,根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,还包括:
根据交叉熵损失函数、二分类前景和后景损失函数对U-NET++图像分割网络进行校准;
其中交叉熵损失函数的计算公式如下:
其中y是标签0或1,a是网络经过sigmoid函数后的输出,a的取值范围为(0,1),n是样本数量;
二分类前景和后景损失函数的计算公式如下:
L(n)=max(0,1-t*n) (公式5)
其中,n是预测值,n的取值在-1到1之间,t为目标值,t的值为1或-1。
具体实施时,在训练分割网络的过程中引入下述BCEDiceloss(sigmoid与log损失)交叉熵损失函数:
其中y是标签0或1,a是网络经过sigmoid函数后的输出,范围为(0,1),n是样本数量,网络每输出一个值,BCE根据该数值与对应标签的情况给出一个损失。当y取0时,ylna消除,剩下-ln(1-a),a需要接近0才可降低loss,y取1时,(1-y)ln(1-a)消除,剩下-lna,此时需要a接近1才可降低loss,该loss考虑了0和1的情况,通常用于二分类情况。
同时引入Lovasz hinge loss的二分类前景和后景损失函数:
L(n)=max(0,1-t*n)
其中,n是预测值(-1到1之间),t为目标值(1或-1)。其含义为,n的值在-1到1之间即可,并不鼓励|y|>1,即让某个样本能够正确分类就可以了,不鼓励分类器过度自信,当样本与分割线的距离超过1时并不会有任何奖励。目的在于使分类器更专注于整体的分类误差。
在一个实施例中,将各个部位的分割结果进行图像融合,生成目标分割图像,包括:
将各个部位的分割结果进行配准,获取各个部位对应的加权权重;
对所述各个部位的分割结果进行加权处理,并按照对应的加权权重对将各个部位的分割结果进行灰度化处理,生成各个部位的灰度图像;
根据所述灰度图像进行图像融合,生成目标分割图像。
具体实施时,各模型分割使用的医学图像为同一张,以获得同样的输出图像大小,此处在融合时需要先将各个分割结果的输出进行配准,并且按照各个部位的在医学上的重要程度进行权重的分配,这一权重分配由医生决定后,采用归一化获得具体数值,将之直接应用到我们的融合步骤。此处进行这一灰度化处理的原因是,在图像融合后,某些部位会产生叠加效果,若采用原来的二值化图像融合,会导致某些分割边界丢失。按照医学上的重要程度以及医生的常用程度计算权重,并且对各个部位的分割结果进行加权,并且按照对应权重进行灰度化处理,使其在后续的图像融合过程不会导致分割结果的边界消失。
在一个实施例中,根据所述灰度图像进行图像融合,生成目标分割图像后,还包括:
根据阈值分割算法对所述目标分割图像中各个部位的边界进行再分割,生成耳部各个部位的图像。
具体实施时,在融合图像后,可以使用阈值分割方法对相应的边界进行再次校准加深。最后将各个对应特定模型的分割结果,进行图像输出融合的过程,这一过程中,需要对图像进行配准,以获得正确的整体分割结果,并且需要对各个分割结果进行颜色处理,标注处理等,以便在后续使用中能够清晰分辨各个部位的分割结果。
这一过程中使用从医生处得到的各部位重要程度,对其进行归一化处理后得到各部位所占权重w1,w2,w3,…,wn,并且按照权重对分割结果进行灰度处理,以免后续图像融合过程产生重叠。
图像灰度处理:按照所占权重比将各个分割结果设置不同的灰度值,越重要的部分,设定的灰度值越大。
同时在进行图像融合获得灰度图像后,可以优化的使用阈值分割方法或者边缘检测分割方法对融合后的图像进行再次分割,以校准分割边界,获得更精确的结果正是医学图像所要求的。
灰度阈值分割方法:首先需要确定一个基础阈值,然后通过对每一个像素点进行判断,阈值化处理公式为
f(i,j)代表横坐标为i,纵坐标为j的像素,g(i,j)表示阈值分割后的每一个像素。将大于阈值的部分设为1(白色),小于阈值的部分设为0(黑色),从而将图像根据阈值分割为不同区域。与之相似的还有区域分割法,比如区域生长法,利用区域内像素的灰度值相似性,将相似区域合并,不相似区域分割开来。其具体步骤是:首先在每个需要分割的区域内找到一个像素点作为该区域的种子点;然后按照一定的连通规则将种子点周围与其有相似性质的像素,按照一定准则合并到种子点的区域中;最后将这些新像素当作新的种子点继续以上步骤,直到整幅图像分割结束。
达到最大值的条件为边缘检测分割法:物体的边缘是图像局部亮度变化最显著的部分,基于这点,先检测边缘点,再按照一定方法将边缘点连接成边缘线,从而分割图像区域。由于图像上边缘线邻域是图像中一个灰度级变化比较剧烈的地带,衡量这种变化最有效的两个特征就是变化率和变化方向。从数学上来讲就是梯度向量的幅值和方向。因此对于一幅图像f(x,y)来说,求其梯度的局部最大值和方向即为边缘检测。已知f(x,y)在q方向沿着r的梯度定义如下:
达到最大值的条件为/>即-fx sinθg+fy cosθg=0得到/>
梯度最大值(梯度模)的定义如下:
梯度模算子具有各向同性和位移不变性,适用于边缘检测,而灰度变化的方向,即边界方向则可由θg=arctanθfy/fx计算得到。
经过以上步骤,就可以通过多个训练模型进行语义分割,获得多个语义分割结果,再将之融合回到一张图像上,获得与实例分割相似的结果。
本发明实施例提供了一种耳部医学图像分割方法,相对于现有技术,本发明实施例至少有以下技术效果:
能够在一张图像上展示医学影像中各个部位的相互影响关系,方便医生查看;
借助U-NET++网络的独特编解码结构和跳跃连接特点,更好的融合高层特征和低层特征,这种高效的特征提取方式可以使用更少的数据集进行训练模型来达到最终效果;
现有的实例分割方法的分割效果弱于现有的语义分割结果,使用将多个语义分割结果相融合的方法,能够获取更加精准的分割结果。
需要说明的是,上述各步骤之间并不必然存在一定的先后顺序,本领域普通技术人员,根据本发明实施例的描述可以理解,不同实施例中,上述各步骤可以有不同的执行顺序,亦即,可以并行执行,亦可以交换执行等等。
本发明另一实施例提供一种耳部医学图像分割装置,如图5所示,装置1包括:
训练集构建模块11,用于获取待分割的原始耳部医学图像,根据原始耳部医学图像生成耳部各个部位对应的多个训练数据集,所述训练数据集的个数与所述耳部的部位的个数相同;
图像分割模型训练模块12,用于构建基于端到端的U-NET++图像分割网络,根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,生成各个部位对应的多个图像分割模型,所述述U-NET++图像分割网络由不同深度的U-NET网络组成;
图像分割模块13,用于根据所述多个图像分割模型分别对所述原始耳部医学图像进行分割,生成各个部位的分割结果;
图像融合模块14,用于将各个部位的分割结果进行图像融合,生成目标分割图像,所述目标分割图像为显示耳部各个部位分割结果的图像。
具体实施方式见方法实施例,此处不再赘述。
本发明另一实施例提供一种电子设备,如图6所示,电子设备10包括:
一个或多个处理器110以及存储器120,图6中以一个处理器110为例进行介绍,处理器110和存储器120可以通过总线或者其他方式连接,图6中以通过总线连接为例。
处理器110用于完成电子设备10的各种控件逻辑,其可以为通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、单片机、ARM(Acorn RISCMachine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件控件或者这些部件的任何组合。还有,处理器110还可以是任何传统处理器、微处理器或状态机。处理器110也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP核、或任何其它这种配置。
存储器120作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的耳部医学图像分割方法对应的程序指令。处理器110通过运行存储在存储器120中的非易失性软件程序、指令以及单元,从而执行设备10的各种功能应用以及数据处理,即实现上述方法实施例中的耳部医学图像分割方法。
存储器120可以包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需要的应用程序;存储数据区可存储根据设备10使用所创建的数据等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器120可选包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个单元存储在存储器120中,当被一个或者多个处理器110执行时,执行上述任意方法实施例中的耳部医学图像分割方法,例如,执行以上描述的图1中的方法步骤S100至步骤S400。
本发明实施例提供了一种非易失性计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如,执行以上描述的图1中的方法步骤S100至步骤S400。
作为示例,非易失性存储介质能够包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦ROM(EEPROM)或闪速存储器。易失性存储器能够包括作为外部高速缓存存储器的随机存取存储器(RAM)。通过说明并非限制,RAM可以以诸如同步RAM(SRAM)、动态RAM、(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、Synchlink DRAM(SLDRAM)以及直接Rambus(兰巴斯)RAM(DRRAM)之类的许多形式得到。本文中所描述的操作环境的所公开的存储器控件或存储器旨在包括这些和/或任何其他适合类型的存储器中的一个或多个。
本发明的另一种实施例提供了一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被处理器执行时,使处理器执行上述方法实施例的耳部医学图像分割方法。例如,执行以上描述的图1中的方法步骤S100至步骤S400。
以上所描述的实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施例的描述,本领域的技术人员可以清楚地了解到各实施例可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存在于计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)执行各个实施例或者实施例的某些部分的方法。
除了其他之外,诸如"能够'、"能"、"可能"或"可以"之类的条件语言除非另外具体地陈述或者在如所使用的上下文内以其他方式理解,否则一般地旨在传达特定实施方式能包括(然而其他实施方式不包括)特定特征、元件和/或操作。因此,这样的条件语言一般地还旨在暗示特征、元件和/或操作对于一个或多个实施方式无论如何都是需要的或者一个或多个实施方式必须包括用于在有或没有输入或提示的情况下判定这些特征、元件和/或操作是否被包括或者将在任何特定实施方式中被执行的逻辑。
已经在本文中在本说明书和附图中描述的内容包括能够提供耳部医学图像分割方法及装置的示例。当然,不能够出于描述本公开的各种特征的目的来描述元件和/或方法的每个可以想象的组合,但是可以认识到,所公开的特征的许多另外的组合和置换是可能的。因此,显而易见的是,在不脱离本公开的范围或精神的情况下能够对本公开做出各种修改。此外,或在替代方案中,本公开的其他实施例从对本说明书和附图的考虑以及如本文中所呈现的本公开的实践中可能是显而易见的。意图是,本说明书和附图中所提出的示例在所有方面被认为是说明性的而非限制性的。尽管在本文中采用了特定术语,但是它们在通用和描述性意义上被使用并且不用于限制的目的。

Claims (8)

1.一种耳部医学图像分割方法,其特征在于,所述方法包括:
获取待分割的原始耳部医学图像,根据原始耳部医学图像生成耳部各个部位对应的多个训练数据集,所述训练数据集的个数与所述耳部的部位的个数相同;
构建基于端到端的U-NET++图像分割网络,根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,生成各个部位对应的多个图像分割模型,所述U-NET++图像分割网络由不同深度的U-NET网络组成;
根据所述多个图像分割模型分别对所述原始耳部医学图像进行分割,生成各个部位的分割结果;
将各个部位的分割结果进行图像融合,生成目标分割图像,所述目标分割图像为显示耳部各个部位分割结果的图像;
所述将各个部位的分割结果进行图像融合,生成目标分割图像,包括:
将各个部位的分割结果进行配准,获取各个部位对应的加权权重;
对所述各个部位的分割结果进行加权处理,并按照对应的加权权重对将各个部位的分割结果进行灰度化处理,生成各个部位的灰度图像;
根据所述灰度图像进行图像融合,生成目标分割图像;
所述根据所述灰度图像进行图像融合,生成目标分割图像后,还包括:
根据阈值分割算法对所述目标分割图像中各个部位的边界进行再分割,生成耳部各个部位的图像。
2.根据权利要求1所述的方法,其特征在于,所述获取待分割的原始耳部医学图像,根据原始耳部医学图像生成耳部各个部位对应的多个训练数据集,包括:
获取待分割的原始耳部医学图像,对原始耳部医学图像进行预处理后,生成目标耳部医学图像;
根据每一个耳部部位单独分割后的医学图像标签,对所述目标耳部医学图像中进行标记,根据标记结果构建多个训练数据集。
3.根据权利要求2所述的方法,其特征在于,所述获取待分割的原始耳部医学图像,对原始耳部医学图像进行预处理后,生成目标耳部医学图像,包括:
获取待分割的原始耳部医学图像,对原始耳部图像转化为固定尺寸的第一耳部医学图像;
将所述第一耳部医学图像进行对比度增强处理,生成第二耳部医学图像;
将所述第二耳部医学图像进行灰度化处理后,进行灰度归一化处理,生成目标耳部医学图像。
4.根据权利要求3所述的方法,其特征在于,所述构建基于端到端的U-NET++图像分割网络,根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,生成各个部位对应的多个图像分割模型,包括:
构建基于端到端的U-NET++图像分割网络,所述U-NET++图像分割网络包括上采样层、下采样层、跳跃连接结构;
将所述多个训练数据集输入对U-NET++图像分割网络,根据U-NET++图像分割网络进行特征融合,并进行剪枝操作;
训练完成后,生成各个部位对应的多个图像分割模型。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,还包括:
根据交叉熵损失函数、二分类前景和后景损失函数对U-NET++图像分割网络进行校准;
其中交叉熵损失函数的计算公式如下:
其中y是标签0或1,a是网络经过sigmoid函数后的输出,a的取值范围为(0,1),n是样本数量;
二分类前景和后景损失函数的计算公式如下:
L(p)=max(0,1-t*p) (公式2)
其中,p是预测值,p的取值在-1到1之间,t为目标值,t的值为1或-1。
6.一种耳部医学图像分割装置,其特征在于,所述装置包括:
训练集构建模块,用于获取待分割的原始耳部医学图像,根据原始耳部医学图像生成耳部各个部位对应的多个训练数据集,所述训练数据集的个数与所述耳部的部位的个数相同;
图像分割模型训练模块,用于构建基于端到端的U-NET++图像分割网络,根据所述多个训练数据集分别对U-NET++图像分割网络进行训练,生成各个部位对应的多个图像分割模型,所述U-NET++图像分割网络由不同深度的U-NET网络组成;
图像分割模块,用于根据所述多个图像分割模型分别对所述原始耳部医学图像进行分割,生成各个部位的分割结果;
图像融合模块,用于将各个部位的分割结果进行图像融合,生成目标分割图像,所述目标分割图像为显示耳部各个部位分割结果的图像;
所述将各个部位的分割结果进行图像融合,生成目标分割图像,包括:
将各个部位的分割结果进行配准,获取各个部位对应的加权权重;
对所述各个部位的分割结果进行加权处理,并按照对应的加权权重对将各个部位的分割结果进行灰度化处理,生成各个部位的灰度图像;
根据所述灰度图像进行图像融合,生成目标分割图像;
所述根据所述灰度图像进行图像融合,生成目标分割图像后,还包括:
根据阈值分割算法对所述目标分割图像中各个部位的边界进行再分割,生成耳部各个部位的图像。
7.一种电子设备,其特征在于,所述电子设备包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5任一项所述的耳部医学图像分割方法。
8.一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行权利要求1-5任一项所述的耳部医学图像分割方法。
CN202110779179.5A 2021-07-09 2021-07-09 一种耳部医学图像分割方法、装置、电子设备及存储介质 Active CN113538530B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110779179.5A CN113538530B (zh) 2021-07-09 2021-07-09 一种耳部医学图像分割方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110779179.5A CN113538530B (zh) 2021-07-09 2021-07-09 一种耳部医学图像分割方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113538530A CN113538530A (zh) 2021-10-22
CN113538530B true CN113538530B (zh) 2024-03-01

Family

ID=78098278

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110779179.5A Active CN113538530B (zh) 2021-07-09 2021-07-09 一种耳部医学图像分割方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113538530B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114419067A (zh) * 2022-01-19 2022-04-29 支付宝(杭州)信息技术有限公司 基于隐私保护的图像处理方法及装置
CN116258725B (zh) * 2023-05-16 2023-08-22 福建自贸试验区厦门片区Manteia数据科技有限公司 基于特征影像的医学图像处理方法、装置以及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111429421A (zh) * 2020-03-19 2020-07-17 北京推想科技有限公司 模型生成方法、医学图像分割方法、装置、设备及介质
CN111815735A (zh) * 2020-09-09 2020-10-23 南京安科医疗科技有限公司 一种人体组织自适应的ct重建方法及重建系统
CN112215847A (zh) * 2020-09-30 2021-01-12 武汉大学 基于对抗学习多尺度特征的重叠染色体自动分割方法
CN112435213A (zh) * 2020-10-21 2021-03-02 深圳大学 一种头颈部结构图像分割与分类方法及系统
WO2021056916A1 (zh) * 2019-09-29 2021-04-01 浪潮电子信息产业股份有限公司 一种医学图像分割方法、装置、设备及可读存储介质
US10984530B1 (en) * 2019-12-11 2021-04-20 Ping An Technology (Shenzhen) Co., Ltd. Enhanced medical images processing method and computing device
CN113012164A (zh) * 2021-03-12 2021-06-22 山东大学 基于聚合层间信息的U-Net肾脏肿瘤图像分割方法、设备及存储介质
WO2021126370A1 (en) * 2019-12-20 2021-06-24 Genentech, Inc. Automated tumor identification and segmentation with medical images

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11741365B2 (en) * 2018-05-14 2023-08-29 Tempus Labs, Inc. Generalizable and interpretable deep learning framework for predicting MSI from histopathology slide images
US11328430B2 (en) * 2019-05-28 2022-05-10 Arizona Board Of Regents On Behalf Of Arizona State University Methods, systems, and media for segmenting images

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021056916A1 (zh) * 2019-09-29 2021-04-01 浪潮电子信息产业股份有限公司 一种医学图像分割方法、装置、设备及可读存储介质
US10984530B1 (en) * 2019-12-11 2021-04-20 Ping An Technology (Shenzhen) Co., Ltd. Enhanced medical images processing method and computing device
WO2021126370A1 (en) * 2019-12-20 2021-06-24 Genentech, Inc. Automated tumor identification and segmentation with medical images
CN111429421A (zh) * 2020-03-19 2020-07-17 北京推想科技有限公司 模型生成方法、医学图像分割方法、装置、设备及介质
CN111815735A (zh) * 2020-09-09 2020-10-23 南京安科医疗科技有限公司 一种人体组织自适应的ct重建方法及重建系统
CN112215847A (zh) * 2020-09-30 2021-01-12 武汉大学 基于对抗学习多尺度特征的重叠染色体自动分割方法
CN112435213A (zh) * 2020-10-21 2021-03-02 深圳大学 一种头颈部结构图像分割与分类方法及系统
CN113012164A (zh) * 2021-03-12 2021-06-22 山东大学 基于聚合层间信息的U-Net肾脏肿瘤图像分割方法、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
UNet++: A Nested U-Net Architecture for Medical Image Segmentation;Zongwei Zhou, Md Mahfuzur Rahman Siddiquee, Nima Tajbakhsh & Jianming Liang;《DLMIA MLCDS 2018 Lecture Notes in Computer Science》;第第11045卷卷;第1-8页 *

Also Published As

Publication number Publication date
CN113538530A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN108154192B (zh) 基于多尺度卷积与特征融合的高分辨sar地物分类方法
CN108805828B (zh) 图像处理方法、装置、计算机设备和存储介质
CN110516541B (zh) 文本定位方法、装置、计算机可读存储介质和计算机设备
CN113538530B (zh) 一种耳部医学图像分割方法、装置、电子设备及存储介质
JP4232804B2 (ja) 画像濃度変換方法、画像強調処理装置、およびそのプログラム
KR102289045B1 (ko) 멀티 스케일 객체 이미지 복원 방법 및 장치
CN111127472B (zh) 一种基于权重学习的多尺度图像分割方法
CN112308866A (zh) 图像处理方法、装置、电子设备及存储介质
EP3965052A1 (en) Device and method of training a generative neural network
CN112734748B (zh) 一种肝胆管及胆道结石的图像分割系统
CN114092439A (zh) 一种多器官实例分割方法及系统
CN110674824A (zh) 基于R2U-Net的手指静脉分割方法、装置和存储介质
CN114037640A (zh) 图像生成方法及装置
JP2024026745A (ja) 人工知能ニューラルネットワークの推論または訓練に対する、故意に歪みを制御する撮像装置の利用
CN111325766A (zh) 三维边缘检测方法、装置、存储介质和计算机设备
CN113610087A (zh) 一种基于先验超分辨率的图像小目标检测方法及存储介质
CN115578589A (zh) 一种无监督超声心动图切面识别方法
CN115731282A (zh) 基于深度学习的水下鱼类重量估计方法、系统及电子设备
CN116645592A (zh) 一种基于图像处理的裂缝检测方法和存储介质
CN117253044A (zh) 一种基于半监督交互学习的农田遥感图像分割方法
CN111861878A (zh) 通过潜在空间正则化对监督式生成对抗网络进行优化
CN112801994B (zh) 骨龄评估方法和系统
CN115359005A (zh) 图像预测模型生成方法、装置、计算机设备和存储介质
CN114359739A (zh) 目标识别方法及装置
CN115861150A (zh) 分割模型训练方法、医学图像分割方法、电子设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant