CN111080660A - 一种图像分割方法、装置、终端设备及存储介质 - Google Patents

一种图像分割方法、装置、终端设备及存储介质 Download PDF

Info

Publication number
CN111080660A
CN111080660A CN201911111243.1A CN201911111243A CN111080660A CN 111080660 A CN111080660 A CN 111080660A CN 201911111243 A CN201911111243 A CN 201911111243A CN 111080660 A CN111080660 A CN 111080660A
Authority
CN
China
Prior art keywords
image
pixel
identified
recognized
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911111243.1A
Other languages
English (en)
Other versions
CN111080660B (zh
Inventor
乔宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201911111243.1A priority Critical patent/CN111080660B/zh
Publication of CN111080660A publication Critical patent/CN111080660A/zh
Application granted granted Critical
Publication of CN111080660B publication Critical patent/CN111080660B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本申请适用于图像处理技术领域,提供了图像分割方法、装置、终端设备及存储介质,方法包括:获取待识别图像,采用图像分割模型对待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到待识别图像的图像特征;采用图像分割模型对图像特征进行处理,得到待识别图像中每个像素对应的图像类别;根据待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。本申请实施例提供的图像分割方法可以防止在图像特征提取过程中丢失图像的边缘特征信息和与语义特征对应的二维图像之间的层间信息,保证分割图像边缘的分辨率,提升待识别图像中小目标的分割精度。

Description

一种图像分割方法、装置、终端设备及存储介质
技术领域
本申请属于图像处理技术领域,尤其涉及一种图像分割方法、装置、终端设备及存储介质。
背景技术
三维图像的分割方法多应用于医学领域中对器官的解剖,要求有较高的分割精度。现有的对三维图像的分割方法,分割出的图像的边缘的分辨率不高,分割精度不高。
发明内容
有鉴于此,本申请实施例提供了图像分割方法、装置、终端设备及存储介质,以解决现有技术中三维图像的分割方法中分割精度不高的问题。
本申请实施例的第一方面提供了一种图像分割方法,包括:
获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别;
采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的;
采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;
根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
在一种可能的实现方式中,所述图像分割模型包括二维操作模块、三维操作模块和高分辨率操作模块,所述二维操作模块包括第一编码器,所述三维操作模块包括第二编码器,所述高分辨率操作模块包括第三编码器;所述采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征,具体包括:
采用所述第一编码器对所述三维图像数据进行第一卷积运算,得到第一下采样数据,所述第一下采样数据包括边缘特征;
采用所述第二编码器对所述第一下采样数据进行第二卷积运算和第一残差压缩提取运算,得到第二下采样数据,所述第二下采样数据包括语义特征;
采用所述第三编码器对所述第二下采样数据进行空洞卷积运算和第二残差压缩提取运算,得到所述待识别图像的图像特征。
在一种可能的实现方式中,所述二维操作模块还包括与所述第一编码器对应的第一解码器,所述三维操作模块还包括与所述第二编码器对应的第二解码器,所述高分辨率操作模块还包括与所述第三编码器对应的第三解码器;所述采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别,具体包括:
采用所述第三解码器对所述图像特征进行处理,得到第一上采样数据;
采用所述第二解码器对所述第一上采用数据进行处理,输出第二上采样数据;
采用所述第一解码器对所述第二上采样数据进行处理,得到所述待识别图像中每个像素对应的概率;
根据所述待识别图像中每个像素对应的概率计算所述待识别图像中每个像素对应的图像类别。
在一种可能的实现方式中,所述采用所述第三编码器对所述第二下采样数据进行空洞卷积运算,具体包括:
采用所述第三编码器对所述第二下采样数据进行至少一次空洞卷积运算,其中,各空洞卷积运算的空洞率不同。
在一种可能的实现方式中,所述采用机器学习算法对分类模型进行训练,具体包括:
根据损失函数计算所述分类模型的最优参数,其中,所述损失函数为:
LTotal=LFocal+λLAverageDice
其中,
Figure BDA0002272769430000031
C表示图像类别的数量,N表示训练批次中的像素数量,
Figure BDA0002272769430000032
表示训练批次中第n个像素分类为c类的概率,
Figure BDA0002272769430000033
表示第n个像素的实际概率,αc表示固定权重,λ表示可调超参数;
根据所述分类模型的最优参数生成所述图像分割模型。
在一种可能的实现方式中,所述获取待识别图像之前,所述方法还包括:
获取输入图像,通过预设步长的滑动窗从所述输入图像中截取至少一个所述待识别图像;
对应地,所述根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像之后,所述方法还包括:
将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像。
在一种可能的实现方式中,所述将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像之后,所述方法还包括:
从所述输入图像中提取出所述融合图像的边界对应的像素。
本申请实施例的第二方面提供了一种图像分割装置,包括:
获取模块,用于获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别;
特征提取模块,用于采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的;
分类模块,用于采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;
分割模块,用于根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
在一种可能的实现方式中,所述图像分割模型包括二维操作模块、三维操作模块和高分辨率操作模块,所述二维操作模块包括第一编码器,所述三维操作模块包括第二编码器,所述高分辨率操作模块包括第三编码器;所述特征提取模块具体包括:
第一计算单元,用于采用所述第一编码器对所述三维图像数据进行第一卷积运算,得到第一下采样数据,所述第一下采样数据包括边缘特征;
第二计算单元,用于采用所述第二编码器对所述第一下采样数据进行第二卷积运算和第一残差压缩提取运算,得到第二下采样数据,所述第二下采样数据包括语义特征;
第三计算单元,用于采用所述第三编码器对所述第二下采样数据进行空洞卷积运算和第二残差压缩提取运算,得到所述待识别图像的图像特征。
在一种可能的实现方式中,所述二维操作模块还包括与所述第一编码器对应的第一解码器,所述三维操作模块还包括与所述第二编码器对应的第二解码器,所述高分辨率操作模块还包括与所述第三编码器对应的第三解码器;所述分类模块具体包括:
第四计算单元,用于采用所述第三解码器对所述图像特征进行处理,得到第一上采样数据;
第五计算单元,用于采用所述第二解码器对所述第一上采用数据进行处理,输出第二上采样数据;
第六计算单元,用于采用所述第一解码器对所述第二上采样数据进行处理,得到所述待识别图像中每个像素对应的概率;
第七计算单元,用于根据所述待识别图像中每个像素对应的概率计算所述待识别图像中每个像素对应的图像类别。
在一种可能的实现方式中,所述第三计算单元具体用于:
采用所述第三编码器对所述第二下采样数据进行至少一次空洞卷积运算,其中,各空洞卷积运算的空洞率不同。
在一种可能的实现方式中,所述特征提取模块还用于:
根据损失函数计算所述分类模型的最优参数,其中,所述损失函数为:
LTotal=LFocal+λLAverageDice
其中,
Figure BDA0002272769430000051
C表示图像类别的数量,N表示训练批次中的像素数量,
Figure BDA0002272769430000052
表示训练批次中第n个像素分类为c类的概率,
Figure BDA0002272769430000053
表示第n个像素的实际概率,αc表示固定权重,λ表示可调超参数;
根据所述分类模型的最优参数生成所述图像分割模型。
在一种可能的实现方式中,所述图像分割模型还包括预处理模块和融合模块,所述预处理模块用于:获取输入图像,通过预设步长的滑动窗从所述输入图像中截取至少一个所述待识别图像;
所述融合模块用于:在根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像之后,将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像。
在一种可能的实现方式中,所述图像分割模型还包括提取模块,用于:
从所述输入图像中提取出所述融合图像的边界对应的像素。
本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述图像分割方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述图像分割方法的步骤。
本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述图像分割方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:通过获取待识别图像,采用图像分割模型对待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到待识别图像的图像特征;采用图像分割模型对图像特征进行处理,得到待识别图像中每个像素对应的图像类别;根据待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。由于图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的,具有较高的计算精度。采用图像分割模型对待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,从而可以防止在图像特征提取过程中丢失图像的边缘特征信息和与语义特征对应的二维图像之间的层间信息,且增加图像的感受野,从而保证待识别图像中小目标边缘的分辨率,提高待识别图像的分割精度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1是本申请实施例提供的图像分割方法的实现流程示意图;
图2是本申请实施例提供的图像分割模型的结构图;
图3是本申请实施例提供的图像分割方法的子步骤的流程图;
图4是本申请实施例提供的图像分割装置的示意图;
图5是本申请实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
下面对本申请实施例提供的图像分割方法进行描述,本申请实施例提供的图像分割方法应用于终端设备,请参阅附图1,本申请实施例提供的图像分割方法包括:
S101:获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别。
其中,所述待识别图像为三维图像数据,例如,三维医学图像数据。三维图像数据由多个子图像组成,例如,三维医学图像数据中每个子图像对应一个器官,每个子图像对应一个图像类别,图像类别包括各器官名称和背景。
S102:采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征。
具体地,待识别图像由多个二维切片叠加组成,每个二维切片对应一个二维图像。边缘特征提取运算为提取每个二维图像的边缘特征的卷积运算,语义特征提取运算为利用二维图像之间的层间信息提取待识别图像的语义特征的卷积运算,感受野增加运算为在特征提取过程中增加感受野的运算。图像分割模型对输入的待识别图像进行上述卷积运算,得到待识别图像的图像特征。
在一种可能的实现方式中,如图2所示,图像分割模型包括二维操作模块21、三维操作模块22和高分辨率操作模块23,所述二维操作模块21包括第一编码器,所述三维操作模块22包括第二编码器,所述高分辨率操作模块23包括第三编码器。对应地,如图3所示,S102具体包括S201-S203。
S201:采用所述第一编码器对所述三维图像数据进行第一卷积运算,得到第一下采样数据,所述第一下采样数据包括边缘特征。
在一种可能的实现方式中,第一编码器包括两个输出通道为16、卷积核为1×3×3的卷积层和一个步长为1×2×2、卷积核为1×2×2的最大池化层。将三维图像数据依次经过上述卷积层和最大池化层进行第一卷积运算,得到第一下采样数据。对三维图像数据进行第一卷积运算,可以提取二维图像的边缘特征,防止在后续特征提取过程中丢失边缘特征信息。
S202:采用所述第二编码器对所述第一下采样数据进行第二卷积运算和第一残差压缩提取运算,得到第二下采样数据,所述第二下采样数据包括语义特征。
在一种可能的实现方式中,第二编码器包括依次连接的两个输出通道为32、卷积核为3×3×3的卷积层,第一残差压缩提取块,步长为2×2×2、卷积核为2×2×2的最大池化层,两个输出通道为32、卷积核为3×3×3的卷积层和第二残差压缩提取块。其中,残差压缩提取块是将输入残差网络的数据和残差网络输出的数据进行运算后作为新的数据输出的运算,残差压缩网络的运算过程为现有技术,在此不再赘述。本实施例中,将第一下采样数据依次经过上述卷积层、第一残差压缩提取块、最大池化层、卷积层和第二残差压缩提取块,可以利用二维图像之间的层间信息提取出待识别图像语义特征,即对层间信息进行有效的特征提取,保证图像分割的精度。
S203:采用所述第三编码器对所述第二下采样数据进行空洞卷积运算和第二残差压缩提取运算,得到所述待识别图像的图像特征。
在一种可能的实现方式中,第三编码器包括输出通道为128的第一空洞卷积层、第三残差压缩提取块、输出通道为256的第二空洞卷积层和第四残差压缩提取块。其中,第一空洞卷积层和第二空洞卷积层均包括空洞率不同的多个卷积层。将第二下采样数据输入第一空洞卷积层,依次进行空洞率分别为1、2、3的卷积运算,将经过第一空洞卷积层运算的结果输入第三残差压缩提取块,将第三残差压缩提取块的输出输入第二空洞卷积层,依次进行空洞率分别为3、4、5的卷积运算,其中,空洞卷积运算为现有技术,在此不再赘述。本申请实施例将第二下采样数据依次经过上述第一空洞卷积层、第三残差压缩提取块、第二空洞卷积层和第四残差压缩提取块,相对于通过减少池化层以提高分割精度的方法,本申请实施例的方法在保证图像分割精度的情况下,可以增大感受野。
S103:采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的。
具体地,图像分割模型对待识别图像的图像特征进行卷积运算,得到每个像素对应的概率,根据预先设定的概率与图像类别的对应关系,得到每个像素对应的图像类别。
在一种可能的实现方式中,如图2所示,所述二维操作模块21还包括与所述第一编码器对应的第一解码器,所述三维操作模块22还包括与所述第二编码器对应的第二解码器,所述高分辨率操作模块23还包括与所述第三编码器对应的第三解码器。第三解码器包括依次连接的输出通道为128、卷积核为1×1×1的卷积层,输出通道为128、空洞率依次为1、2、3的卷积层,第五残差压缩提取块,和输出通道为64、卷积核为1×1×1的卷积层,将待识别图像的图像特征经过第三解码器进行处理,得到第一上采样数据;第二解码器包括依次连接的两个输出通道为32、卷积核为3×3×3的卷积层,第六残差压缩提取块,步长为2×2×2、卷积核为2×2×2的反卷积层,两个输出通道为32、卷积核为3×3×3的卷积层和第七残差压缩提取块,将第一上采样数据经过第二解码器进行处理,得到第二上采样数据;第一编码器包括输出通道为32、步长为1×2×2、卷积核为1×2×2的反卷积层,两个输出通道为32、卷积核为1×3×3的卷积层,和卷积核为1×1×1的卷积层,将第二上采样数据经过第一解码器进行处理,得到每个像素对应的概率,根据各个图像类别对应的概率得到每个像素对应的图像类别。
本申请实施例中,图像分割模型是对分类模型进行训练得到的。分类模型与图像分割模型的结构相同,将训练样本中的三维图像数据输入分类模型,得到每个像素对应的概率,根据每个像素对应的概率与该像素对应的图像类别的差异优化分类模型的参数,每个像素对应的概率与该像素对应的图像类别的差异用损失函数表示,当损失函数达到预设值时,得到分类模型的最优参数,即图像分割模型的参数,从而得到图像分割模型。
其中,损失函数为LTotal=LFocal+λLAverageDice
其中,
Figure BDA0002272769430000111
C表示图像类别的数量,N表示训练批次中的像素数量,
Figure BDA0002272769430000112
表示训练批次中第n个像素分类为c类的概率,
Figure BDA0002272769430000113
表示第n个像素的实际概率,αc表示固定权重,λ表示可调超参数。
损失函数中,
Figure BDA0002272769430000114
用于解决目标检测中的前景类与背景类不平衡引起识别精度较低的问题,
Figure BDA0002272769430000115
通过将像素级的标记问题转换为最小化类级分布距离来缓解类不平衡问题,通过将两部分结合,保证图像分割模型中的参数的精度。
S104:根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
具体地,根据每个像素对应的图像类别,将相同的图像类别进行相同的标记,例如,每个图像类别对应一个颜色,得到分割图像。在医学图像中,将目标器官对应的像素进行标记,以分割出目标器官对应的像素。
在一种可能的实现方式中,训练样本中的三维图像和待识别图像为相同大小的图像块。三维图像数据输入分类模型前,首先进行预处理。具体为:对三维图像数据中的像素进行标准化,对每个标准化后的图像使用随机旋转、随机平移、弹性形变的方法进行数据增强,以扩充训练样本的规模,对所有三维图像数据进行重采样,使得重采样后的图像的像素间距变得一致,在重采样后的图像中随机截取256×256×48×1的图像块作为网络的输入,其中1是通道数,48是层数,256×256是分辨率。对应地,输入图像分类模型的待识别图像为经过预处理后的输入图像。具体为:对输入图像进行重采样,使得重采样后的图像的像素间距变得一致,通过步长为128×128×24的滑动窗从重采样后的图像中截取大小为256×256×48的图像块,即待识别图像。
在一种可能的实现方式中,每个待识别图像输入图像分割模型后得到一个对应的分割图像,将每个分割图像的重叠的区域进行融合,得到每个图像类别对应的融合图像。然后使用最近邻插值法将融合图像的分辨率还原为输入图像的分辨率。根据每个图像类别对应的融合图像,得到每个图像类别对应的像素,根据每个图像类别对应的像素可以得出每个图像类别对应的边界的像素,从输入图像中提取出目标图像类别的边界对应的像素,即可根据目标图像类别的边界的像素分割出目标图像类别对应的图像。
上述实施例中,通过获取待识别图像,采用图像分割模型对待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到待识别图像的图像特征;采用图像分割模型对图像特征进行处理,得到待识别图像中每个像素对应的图像类别;根据待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。对待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,可以防止在图像特征提取过程中丢失图像的边缘特征信息和与语义特征对应的二维图像之间的层间信息,且增加图像的感受野,防止待识别图像中小目标对应的图像特征丢失,从而保证待识别图像中小目标边缘的分辨率,提高图像分割精度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的图像分割方法,图4示出了本申请实施例提供的装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
如图4所示,本申请实施例提供的图像分割装置包括,
获取模块10,用于获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别;
特征提取模块20,用于采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的;
分类模块30,用于采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;
分割模块40,用于根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
在一种可能的实现方式中,所述图像分割模型包括二维操作模块、三维操作模块和高分辨率操作模块,所述二维操作模块包括第一编码器,所述三维操作模块包括第二编码器,所述高分辨率操作模块包括第三编码器;所述特征提取模块20具体包括:
第一计算单元,用于采用所述第一编码器对所述三维图像数据进行第一卷积运算,得到第一下采样数据,所述第一下采样数据包括边缘特征;
第二计算单元,用于采用所述第二编码器对所述第一下采样数据进行第二卷积运算和第一残差压缩提取运算,得到第二下采样数据,所述第二下采样数据包括语义特征;
第三计算单元,用于采用所述第三编码器对所述第二下采样数据进行空洞卷积运算和第二残差压缩提取运算,得到所述待识别图像的图像特征。
在一种可能的实现方式中,所述二维操作模块还包括与所述第一编码器对应的第一解码器,所述三维操作模块还包括与所述第二编码器对应的第二解码器,所述高分辨率操作模块还包括与所述第三编码器对应的第三解码器;所述分类模块30具体包括:
第四计算单元,用于采用所述第三解码器对所述图像特征进行处理,得到第一上采样数据;
第五计算单元,用于采用所述第二解码器对所述第一上采用数据进行处理,输出第二上采样数据;
第六计算单元,用于采用所述第一解码器对所述第二上采样数据进行处理,得到所述待识别图像中每个像素对应的概率;
第七计算单元,用于根据所述待识别图像中每个像素对应的概率计算所述待识别图像中每个像素对应的图像类别。
在一种可能的实现方式中,所述第三计算单元具体用于:
采用所述第三编码器对所述第二下采样数据进行至少一次空洞卷积运算,其中,各空洞卷积运算的空洞率不同。
在一种可能的实现方式中,所述特征提取模块20还用于:
根据损失函数计算所述分类模型的最优参数,其中,所述损失函数为:
LTotal=LFocal+λLAverageDice
其中,
Figure BDA0002272769430000141
C表示图像类别的数量,N表示训练批次中的像素数量,
Figure BDA0002272769430000142
表示训练批次中第n个像素分类为c类的概率,
Figure BDA0002272769430000143
表示第n个像素的实际概率,αc表示固定权重,λ表示可调超参数。
根据所述分类模型的最优参数生成所述图像分割模型。
在一种可能的实现方式中,所述图像分割模型还包括预处理模块和融合模块,所述预处理模块用于:获取输入图像,通过预设步长的滑动窗从所述输入图像中截取至少一个所述待识别图像;
所述融合模块用于:在根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像之后,将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像。
在一种可能的实现方式中,所述图像分割模型还包括提取模块,用于:
从所述输入图像中提取出所述融合图像的边界对应的像素。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图5是本申请实施例提供的终端设备的示意图。如图5所示,该实施例的终端设备包括:处理器11、存储器12以及存储在所述存储器12中并可在所述处理器11上运行的计算机程序13。所述处理器11执行所述计算机程序13时实现上述图像分割方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器11执行所述计算机程序13时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块10至40的功能。
示例性的,所述计算机程序13可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器11执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序13在所述终端设备中的执行过程。
所述终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器11、存储器12。本领域技术人员可以理解,图5仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所述处理器11可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器12可以是所述终端设备的内部存储单元,例如终端设备的硬盘或内存。所述存储器12也可以是所述终端设备的外部存储设备,例如所述终端设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器12还可以既包括所述终端设备的内部存储单元也包括外部存储设备。所述存储器12用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器12还可以用于暂时地存储已经输出或者将要输出的数据。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种图像分割方法,其特征在于,包括:
获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别;
采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的;
采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;
根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
2.如权利要求1所述的图像分割方法,其特征在于,所述图像分割模型包括二维操作模块、三维操作模块和高分辨率操作模块,所述二维操作模块包括第一编码器,所述三维操作模块包括第二编码器,所述高分辨率操作模块包括第三编码器;所述采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征,具体包括:
采用所述第一编码器对所述三维图像数据进行第一卷积运算,得到第一下采样数据,所述第一下采样数据包括边缘特征;
采用所述第二编码器对所述第一下采样数据进行第二卷积运算和第一残差压缩提取运算,得到第二下采样数据,所述第二下采样数据包括语义特征;
采用所述第三编码器对所述第二下采样数据进行空洞卷积运算和第二残差压缩提取运算,得到所述待识别图像的图像特征。
3.如权利要求2所述的图像分割方法,其特征在于,所述二维操作模块还包括与所述第一编码器对应的第一解码器,所述三维操作模块还包括与所述第二编码器对应的第二解码器,所述高分辨率操作模块还包括与所述第三编码器对应的第三解码器;所述采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别,具体包括:
采用所述第三解码器对所述图像特征进行处理,得到第一上采样数据;
采用所述第二解码器对所述第一上采用数据进行处理,输出第二上采样数据;
采用所述第一解码器对所述第二上采样数据进行处理,得到所述待识别图像中每个像素对应的概率;
根据所述待识别图像中每个像素对应的概率计算所述待识别图像中每个像素对应的图像类别。
4.如权利要求2所述的图像分割方法,其特征在于,所述采用所述第三编码器对所述第二下采样数据进行空洞卷积运算,具体包括:
采用所述第三编码器对所述第二下采样数据进行至少一次空洞卷积运算,其中,各空洞卷积运算的空洞率不同。
5.如权利要求1所述的图像分割方法,其特征在于,所述采用机器学习算法对分类模型进行训练,具体包括:
根据损失函数计算所述分类模型的最优参数,其中,所述损失函数为:
LTotal=LFocal+λLAverageDice
其中,
Figure FDA0002272769420000021
C表示图像类别的数量,N表示训练批次中的像素数量,
Figure FDA0002272769420000022
表示训练批次中第n个像素分类为c类的概率,
Figure FDA0002272769420000023
表示第n个像素的实际概率,αc表示固定权重,λ表示可调超参数;
根据所述分类模型的最优参数生成所述图像分割模型。
6.如权利要求1所述的图像分割方法,其特征在于,所述获取待识别图像之前,所述方法还包括:
获取输入图像,通过预设步长的滑动窗从所述输入图像中截取至少一个所述待识别图像;
对应地,所述根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像之后,所述方法还包括:
将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像。
7.如权利要求6所述的图像分割方法,其特征在于,所述将每个所述待识别图像对应的分割图像进行融合,得到每个图像类别对应的融合图像之后,所述方法还包括:
从所述输入图像中提取出所述融合图像的边界对应的像素。
8.一种图像分割装置,其特征在于,包括:
获取模块,用于获取待识别图像,所述待识别图像包括至少一个子图像,每个子图像对应一个图像类别;
特征提取模块,用于采用图像分割模型对所述待识别图像进行边缘特征提取运算、语义特征提取运算和感受野增加运算,得到所述待识别图像的图像特征;其中,所述图像分割模型是以三维图像数据以及所述三维图像数据中每个像素对应的图像类别为训练样本,采用机器学习算法对分类模型进行训练得到的;
分类模块,用于采用所述图像分割模型对所述图像特征进行处理,得到所述待识别图像中每个像素对应的图像类别;
分割模块,用于根据所述待识别图像中每个像素对应的图像类别,标记出每个图像类别对应的像素,得到分割图像。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
CN201911111243.1A 2019-11-14 2019-11-14 一种图像分割方法、装置、终端设备及存储介质 Active CN111080660B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911111243.1A CN111080660B (zh) 2019-11-14 2019-11-14 一种图像分割方法、装置、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911111243.1A CN111080660B (zh) 2019-11-14 2019-11-14 一种图像分割方法、装置、终端设备及存储介质

Publications (2)

Publication Number Publication Date
CN111080660A true CN111080660A (zh) 2020-04-28
CN111080660B CN111080660B (zh) 2023-08-08

Family

ID=70310895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911111243.1A Active CN111080660B (zh) 2019-11-14 2019-11-14 一种图像分割方法、装置、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN111080660B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111696094A (zh) * 2020-06-12 2020-09-22 杭州迪英加科技有限公司 免疫组化pd-l1膜染色病理切片图像处理方法、装置和设备
CN111863204A (zh) * 2020-07-22 2020-10-30 北京青燕祥云科技有限公司 基于钼靶x线摄影检查的乳腺疾病ai辅助诊断方法及系统
CN112164074A (zh) * 2020-09-22 2021-01-01 江南大学 一种基于深度学习的3d ct床快速分割方法
CN112183359A (zh) * 2020-09-29 2021-01-05 中国科学院深圳先进技术研究院 视频中的暴力内容检测方法、装置及设备
CN112435266A (zh) * 2020-11-10 2021-03-02 中国科学院深圳先进技术研究院 一种图像分割方法、终端设备及计算机可读存储介质
CN112508924A (zh) * 2020-12-15 2021-03-16 桂林电子科技大学 一种小目标检测识别方法、装置、系统和存储介质
CN112802034A (zh) * 2021-02-04 2021-05-14 精英数智科技股份有限公司 图像分割、识别方法、模型构建方法、装置及电子设备
CN112950652A (zh) * 2021-02-08 2021-06-11 深圳市优必选科技股份有限公司 机器人及其手部图像分割方法和装置
WO2022099454A1 (zh) * 2020-11-10 2022-05-19 中国科学院深圳先进技术研究院 一种图像分割方法、终端设备及计算机可读存储介质
CN116206331A (zh) * 2023-01-29 2023-06-02 阿里巴巴(中国)有限公司 图像处理方法、计算机可读存储介质以及计算机设备
WO2023179095A1 (zh) * 2022-03-24 2023-09-28 中国科学院深圳理工大学(筹) 一种图像分割方法、装置、终端设备及存储介质
CN112183359B (zh) * 2020-09-29 2024-05-14 中国科学院深圳先进技术研究院 视频中的暴力内容检测方法、装置及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537292A (zh) * 2018-04-10 2018-09-14 上海白泽网络科技有限公司 语义分割网络训练方法、图像语义分割方法及装置
CN109410185A (zh) * 2018-10-10 2019-03-01 腾讯科技(深圳)有限公司 一种图像分割方法、装置和存储介质
CN110163121A (zh) * 2019-04-30 2019-08-23 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537292A (zh) * 2018-04-10 2018-09-14 上海白泽网络科技有限公司 语义分割网络训练方法、图像语义分割方法及装置
CN109410185A (zh) * 2018-10-10 2019-03-01 腾讯科技(深圳)有限公司 一种图像分割方法、装置和存储介质
CN110163121A (zh) * 2019-04-30 2019-08-23 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备及存储介质

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111696094B (zh) * 2020-06-12 2021-06-08 杭州迪英加科技有限公司 免疫组化pd-l1膜染色病理切片图像处理方法、装置和设备
CN111696094A (zh) * 2020-06-12 2020-09-22 杭州迪英加科技有限公司 免疫组化pd-l1膜染色病理切片图像处理方法、装置和设备
CN111863204A (zh) * 2020-07-22 2020-10-30 北京青燕祥云科技有限公司 基于钼靶x线摄影检查的乳腺疾病ai辅助诊断方法及系统
CN112164074A (zh) * 2020-09-22 2021-01-01 江南大学 一种基于深度学习的3d ct床快速分割方法
CN112183359A (zh) * 2020-09-29 2021-01-05 中国科学院深圳先进技术研究院 视频中的暴力内容检测方法、装置及设备
CN112183359B (zh) * 2020-09-29 2024-05-14 中国科学院深圳先进技术研究院 视频中的暴力内容检测方法、装置及设备
WO2022099454A1 (zh) * 2020-11-10 2022-05-19 中国科学院深圳先进技术研究院 一种图像分割方法、终端设备及计算机可读存储介质
CN112435266A (zh) * 2020-11-10 2021-03-02 中国科学院深圳先进技术研究院 一种图像分割方法、终端设备及计算机可读存储介质
CN112508924A (zh) * 2020-12-15 2021-03-16 桂林电子科技大学 一种小目标检测识别方法、装置、系统和存储介质
CN112802034A (zh) * 2021-02-04 2021-05-14 精英数智科技股份有限公司 图像分割、识别方法、模型构建方法、装置及电子设备
CN112802034B (zh) * 2021-02-04 2024-04-12 精英数智科技股份有限公司 图像分割、识别方法、模型构建方法、装置及电子设备
CN112950652A (zh) * 2021-02-08 2021-06-11 深圳市优必选科技股份有限公司 机器人及其手部图像分割方法和装置
CN112950652B (zh) * 2021-02-08 2024-01-19 深圳市优必选科技股份有限公司 机器人及其手部图像分割方法和装置
WO2023179095A1 (zh) * 2022-03-24 2023-09-28 中国科学院深圳理工大学(筹) 一种图像分割方法、装置、终端设备及存储介质
CN116206331A (zh) * 2023-01-29 2023-06-02 阿里巴巴(中国)有限公司 图像处理方法、计算机可读存储介质以及计算机设备

Also Published As

Publication number Publication date
CN111080660B (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
CN111080660B (zh) 一种图像分割方法、装置、终端设备及存储介质
CN108229299B (zh) 证件的识别方法和装置、电子设备、计算机存储介质
CN110659647B (zh) 印章图像识别方法及装置、智能发票识别设备和存储介质
CN111681273B (zh) 图像分割方法、装置、电子设备及可读存储介质
CN112308866B (zh) 图像处理方法、装置、电子设备及存储介质
CN111028246A (zh) 一种医学图像分割方法、装置、存储介质及电子设备
CN112348765A (zh) 数据增强方法、装置、计算机可读存储介质及终端设备
CN111192678B (zh) 病理显微图像诊断、模型训练方法、装置、设备及介质
CN111340796A (zh) 一种缺陷检测方法、装置、电子设备及存储介质
CN111191582A (zh) 三维目标检测方法、检测装置、终端设备及计算机可读存储介质
CN111882565B (zh) 一种图像二值化方法、装置、设备及存储介质
CN110781856A (zh) 异质人脸识别模型训练方法、人脸识别方法及相关装置
CN112700460A (zh) 图像分割方法及系统
CN114359048A (zh) 图像的数据增强方法、装置、终端设备及存储介质
CN112966687B (zh) 图像分割模型训练方法、装置及通信设备
WO2019109410A1 (zh) 用于分割 mri 图像中异常信号区的全卷积网络模型训练方法
CN112884702A (zh) 一种基于内窥镜图像的息肉识别系统和方法
CN115908363B (zh) 肿瘤细胞统计方法、装置、设备和存储介质
CN108629219B (zh) 一种识别一维码的方法及装置
CN113139617B (zh) 一种输电线路自主定位方法、装置及终端设备
CN115456988A (zh) 一种缺陷检测方法、终端设备及存储介质
CN116266406A (zh) 字符的坐标提取方法、装置、设备和存储介质
CN114373078A (zh) 目标检测方法、装置、终端设备及存储介质
CN112613498A (zh) 一种指针识别方法、装置、电子设备及存储介质
CN113255674A (zh) 字符识别方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Chen Zijie

Inventor after: Qiao Yu

Inventor before: Qiao Yu

GR01 Patent grant
GR01 Patent grant