CN115018805A - 分割模型训练方法、图像分割方法、装置、设备及介质 - Google Patents
分割模型训练方法、图像分割方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN115018805A CN115018805A CN202210707648.7A CN202210707648A CN115018805A CN 115018805 A CN115018805 A CN 115018805A CN 202210707648 A CN202210707648 A CN 202210707648A CN 115018805 A CN115018805 A CN 115018805A
- Authority
- CN
- China
- Prior art keywords
- sample
- loss function
- segmentation
- image
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种分割模型训练方法、图像分割方法、装置、设备及介质。该方法包括获取用于模型训练的样本图像以及样本图像中各像素点的像素点标签;像素点包括目标像素点和背景像素点;迭代执行如下训练过程,直至满足训练完成条件得到目标分割模型:将样本图像输入至待训练的分割模型,得到样本图像中各像素点的样本分割结果;基于各像素点标签以及样本预测结果计算模型损失函数;其中,模型损失函数包括基于目标像素点的标签生成的第一损失函数以及基于背景像素点的标签生成的第二损失函数;基于模型损失函数对分割模型进行模型参数的调节。通过本发明公开的技术方案,以解决现有技术中图像分割不准确的问题,提高了图像分割结果的准确性。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种分割模型训练方法、图像分割方法、装置、设备及介质。
背景技术
随着计算机断层扫描CT和核磁共振成像MRI等无创影像诊断技术的进步,也对临床医生提出了越来越高的要求。为了减轻医生的劳动强度,并且避免个人主观性的影响,基于图像处理和人工智能的计算机辅助诊断技术日益成为全世界研究的热点。
现有技术一般都是先提取图像的统计特征、纹理特征等一系列特征,之后再利用诸如人工神经网络、随机森林及支持向量机等来分割。但是现有技术在实施过程中,发现存在如下问题:计算效率低、人工成本高且鲁棒性差,极易出现目标过度分割的情况。
发明内容
本发明提供了一种分割模型训练方法、图像分割方法、装置、设备及介质,以解决现有技术中图像分割不准确的问题,提高了图像分割结果的准确性。
第一方面,本发明实施例提供了一种分割模型训练方法,该方法包括:
获取用于模型训练的样本图像以及所述样本图像中各像素点的像素点标签;其中,所述像素点包括目标像素点和背景像素点;
迭代执行如下训练过程,直至满足训练完成条件得到目标分割模型:将所述样本图像输入至待训练的分割模型,得到所述样本图像中各像素点的样本预测结果;
基于各所述像素点标签以及所述样本预测结果计算模型损失函数;其中,所述模型损失函数包括基于所述目标像素点的标签生成的第一损失函数以及基于所述背景像素点的标签生成的第二损失函数;
基于所述模型损失函数对所述分割模型进行模型参数的调节。
可选的,所述分割模型包括至少一层级联的编码模块和与所述编码模块层级相同层级的解码模块;所述解码模块包括残差注意力组件;
相应的,所述将所述样本图像输入至待训练的分割模型,得到所述样本图像中各像素点的样本预测结果,包括:
对于任一层级编码模块,基于第一预设卷积参数对所述样本图像/对上一层级编码模块进行下采样处理后输出的编码特征进行卷积操作,得到所述当前层级编码模块进行特征提取后的编码特征;
对于任一层级解码模块,基于第二预设卷积参数对上一层级编码模块进行下采样处理后输出的编码,或者对所述当前层级编码模块进行输出的编码特征与上一层级解码模块上采样处理后输出的图像特征进行拼接后的拼接特征进行卷积操作,并基于残差注意力组件对卷积操作后的图像特征进行特征提取,得到当前层级解码模块进行特征提取后的图像特征。
可选的,所述基于各所述像素点标签以及所述样本预测结果计算模型损失函数,包括:
获取所述样本预测结果中目标像素点对应的第一样本预测结果,基于所述第一样本预测结果以及所述目标像素点的标签生成所述分割模型的第一损失函数;
获取所述样本预测结果中背景像素点对应的第二样本预测结果,基于所述第二样本预测结果以及所述背景像素点的标签生成所述分割模型的第二损失函数;
基于所述第一损失函数、所述第二损失函数、预设的第一损失函数权重以及预设的第二损失函数权重确定所述分割模型的模型损失函数。
可选的,所述基于所述第二样本预测结果以及所述背景像素点的标签生成所述分割模型的第二损失函数,包括:
基于所述背景像素点的标签与所述第二样本预测结果的比对结果确定所述背景像素点中的候选背景像素点,并基于预设的筛选条件确定所述候选背景像素点中的目标背景像素点;
基于所述目标背景点的标签以及所述第二样本预测结果中目标背景点对应的样本预测结果,生成所述分割模型的第二损失函数。
可选的,在所述将所述样本图像输入至待训练的分割模型之前,还包括:
对所述样本进行预设尺寸的裁剪,得到至少两张裁剪后的样本图像;
相应的,所述得到所述样本图像中各像素点的样本预测结果,还包括:
基于重叠滑窗方式输出所述裁剪后的样本图像的初始样本预测结果;
基于裁剪后的样本图像的数量对各所述初始样本预测结果进行均值处理,得到所述样本图像的样本预测结果。
第二方面,本发明实施例还提供了一种图像分割方法,该方法包括:
获取待分割图像;
将所述待分割图像输入至预先训练完成的分割模型中,得到所述分割模型输出的分割结果;其中,所述分割模型基于上述任一实施例所述的分割模型训练方法进行训练得到。
第三方面,本发明实施例还提供了一种分割模型训练装置,该装置包括:
样本图像获取模块,用于获取用于模型训练的样本图像以及所述样本图像中各像素点的像素点标签;其中,所述像素点包括目标像素点和背景像素点;
目标分割模型获得模块,用于迭代执行如下训练过程,直至满足训练完成条件得到目标分割模型:将所述样本图像输入至待训练的分割模型,得到所述样本图像中各像素点的样本预测结果;
基于各所述像素点标签以及所述样本预测结果计算模型损失函数;其中,所述模型损失函数包括基于所述目标像素点的标签生成的第一损失函数以及基于所述背景像素点的标签生成的第二损失函数;
基于所述模型损失函数对所述分割模型进行模型参数的调节。
第四方面,本发明实施例还提供了一种图像分割装置,该装置包括:
图像获取模块,用于获取待分割图像;
分割结果获得模块,用于将所述待分割图像输入至预先训练完成的分割模型中,得到所述分割模型输出的分割结果;其中,所述分割模型基于上述任一实施例所述的分割模型训练方法进行训练得到。
第五方面,本发明实施例还提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的分割模型训练方法和/或图像分割方法。
第六方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的分割模型训练方法和/或图像分割方法。
本发明实施例的技术方案具体包括:获取用于模型训练的样本图像以及样本图像中各像素点的像素点标签;其中,像素点包括目标像素点和背景像素点;迭代执行如下训练过程,直至满足训练完成条件得到目标分割模型:将样本图像输入至待训练的分割模型,得到样本图像中各像素点的样本预测结果;基于各像素点标签以及样本预测结果计算模型损失函数;其中,模型损失函数包括基于目标像素点的标签生成的第一损失函数以及基于背景像素点的标签生成的第二损失函数;基于模型损失函数对分割模型进行模型参数的调节。上述方案通过分别基于训练样本中正样本所生成的第一损失函数以及基于负样本生成的第二损失函数调整模型参数,以得到训练完成的分割模型,使得模型在学习识别正样本的过程中,能够分一部分注意力到负样本特征提取中,从而进一步提升模型分割的准确性。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种分割模型训练方法的流程图;
图2是本发明实施例提通过的一种分割模型的模型结构图;
图3是本发明实施例提供的一种损失函数的原理示意图;
图4是本发明实施例提供的一种图像分割方法的流程图;
图5是本发明实施例三提供的一种分割模型训练装置的结构示意图;
图6是本发明实施例三提供的一种图像分割装置的结构示意图
图7是实现本发明实施例提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
作为一种可选的但非限定性的实现方式,响应于接收到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本公开的实现方式构成限定,其它满足相关法律法规的方式也可应用于本公开的实现方式中。
可以理解的是,本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。
图1为本发明实施例提供了一种分割模型训练方法的流程图,本实施例可适用于对模型进行训练的情况,该方法可以由分割模型训练装置来执行,该分割模型训练装置可以采用硬件和/或软件的形式实现,该分割模型训练装置可配置于智能终端以及云端服务器中。如图1所示,该方法包括:
S110、获取用于模型训练的样本图像以及样本图像中各像素点的像素点标签;其中,像素点包括目标像素点和背景像素点。
S120、迭代执行如下训练过程,直至满足训练完成条件得到目标分割模型:将样本图像输入至待训练的分割模型,得到样本图像中各像素点的样本预测结果;基于各像素点标签以及样本预测结果计算模型损失函数;其中,模型损失函数包括基于目标像素点的标签生成的第一损失函数以及基于背景像素点的标签生成的第二损失函数;基于模型损失函数对分割模型进行模型参数的调节。
为了提高在基于分割模型对图像进行分割过程中分割结果的准确性,本发明实施例通过在现有分割模型中添加残差注意力组件,以提高对于待分割图像的图像特征细节的提取能力,从而提高基于该分割模型得到的分割结果的准确性。进一步的,本实施例的技术方案还在对加入残差注意力组件的分割模型进行训练的过程中,通过分别基于训练样本中正样本所生成的第一损失函数以及基于负样本生成的第二损失函数调整模型参数,以得到训练完成的分割模型,使得模型在学习识别正样本的过程中,能够分一部分注意力到负样本特征提取中,从而进一步提升模型分割的准确性。
本发明实施例的技术方案,在对分割模型进行训练之前,预先获取用于模型训练的样本图像。可选的,若样本图像为二维图像,则获取组成样本图像的各像素点,以及对各像素点进行标注,得到样本图像中各像素点的像素点标签。其中,其中,像素点包括目标像素点和背景像素点。对于样本图像进行标注的过程中,示例性的,若样本图像中包括人像所在的目标区域以及其他内容所在的背景区域,则将组成目标区域的各像素点标注为目标像素点,即正样本像素点,将组成背景区域的各像素点标注为背景像素点,即背景像素点。
需要说明的是,样本图像还可以包括三维图像;相应的,获取组成样本图像的各体素点,并基于对各体素点进行标注,得到样本图像中各体素点的体素点标签。本实施例对于样本图像的图像维度不作限定。
在获取到样本图像的情况下,获取待训练的分割模型,并基于样本图像以及样本图像中各像素点的像素点标签对该模型进行迭代训练,,直至满足训练完成条件得到目标分割模型。
在上述实施方式的基础上,本实施例的技术方案还包括在获取到样本图像之后,对各样本图像的图像处理进行归一化处理,以及对样本图像进行数据增强处理,以增强模型的泛化能力,使得模型能够对不同的图像数据都能进行处理。可选的,数据增强处理的方式包括但不限于:随机旋转、随机平移、随机亮度变化、局部亮度变换等处理方式。
具体的,对于任一迭代轮次的训练过程包括:将样本图像输入至待训练的分割模型,得到样本图像中各像素点的样本预测结果;基于各像素点标签以及样本预测结果计算模型损失函数;其中,模型损失函数包括基于目标像素点的标签生成的第一损失函数以及基于背景像素点的标签生成的第二损失函数;基于模型损失函数对分割模型进行模型参数的调节。
本实施例中,分割模型包括至少一层级联的编码模块和与编码模块层级相同层级的解码模块;解码模块包括残差注意力组件;相应的,将样本图像输入至待训练的分割模型,得到样本图像中各像素点的样本预测结果,包括:对于任一层级编码模块,基于第一预设卷积参数对样本图像/对上一层级编码模块进行下采样处理后输出的编码特征进行卷积操作,得到当前层级编码模块进行特征提取后的编码特征;对于任一层级解码模块,基于第二预设卷积参数对上一层级编码模块进行下采样处理后输出的编码,或者对当前层级编码模块进行输出的编码特征与上一层级解码模块上采样处理后输出的图像特征进行拼接后的拼接特征进行卷积操作,并基于残差注意力组件对卷积操作后的图像特征进行特征提取,得到当前层级解码模块进行特征提取后的图像特征。
具体的参加图2,获取样本图像,基于分割模型中第一层级的编码模块对输入的样本图像进行卷积处理,并对卷积后的图像特征进行下采样处理,得到当前层级的编码模块输出的编码特征;进而将该编码特征输入至后续层级的编码模块,直至得到最后一层级的编码模块进行下采样后输出的编码特征。将该编码特征作为最后一层级的解码模块的输入特征,基于当前层级的解码模块中的残差注意力组件对该编码特征进行自适应特征细化,并对自适应特征细化后的图像特征进行上采样,得到当前层级的解码模块输出图像特征
具体的,将该图像特征作为上一层级的解码模块的第一输入特征,将上一层级的解码模块相同层级的编码模块未经下采样之前的编码模块作为上一层级的解码模块的第二输入特征,将第一输入特征和第二输入特征进行特征拼接,基于当前层级的解码模块中的残差注意力组件对特征拼接后的图像特征进行自适应特征细化,并对自适应特征细化后的图像特征进行上采样,得到当前层级的解码模块输出图像特征;进而将该图像特征作为再上一层级的解码模块的第一输入特征,直至得到最后层级的解码模块输出的图像特征,并基于该图像特征得到该样本图像对应的样本预测结果。
需要说明的是,该样本预测结果包括样本图像中各像素点的样本预测结果,具体包括目标像素点对应的第一样本预测结果以及背景像素点对应的第二样本预测结果。
可选的,获取样本预测结果中目标像素点对应的第一样本预测结果,基于第一样本预测结果以及目标像素点的标签生成分割模型的第一损失函数;获取样本预测结果中背景像素点对应的第二样本预测结果,基于第二样本预测结果以及背景像素点的标签生成分割模型的第二损失函数;基于第一损失函数、第二损失函数、预设的第一损失函数权重以及预设的第二损失函数权重确定分割模型的模型损失函数。
可选的,对于第一损失函数可以基于下述表达式进行生成,示例性的,表达式包括:
其中,P-Dice表示第一损失函数;X+表示目标像素点的像素点标签;Y+表示第一样本预测结果。
可选的,基于第二样本预测结果以及背景像素点的标签生成分割模型的第二损失函数,包括:基于背景像素点的标签与第二样本预测结果的比对结果确定背景像素点中的候选背景像素点,并基于预设的筛选条件确定候选背景像素点中的目标背景像素点;基于目标背景点的标签以及第二样本预测结果中目标背景点对应的样本预测结果,生成分割模型的第二损失函数。
具体的参见图3,确定第二损失函数的方式可以包括:获取样本图像中各像素点的像素点标签,即label;以及获取样本图像中各像素点的样本预测结果,即logits;分别用1减去预测logits和label,以及将目标像素点以及背景像素点的标签互换得到logits-和label-,由于一般情况下都是目标像素点数量远小于背景像素点数量,所以需要对损失部分进行筛选,筛选出一部分难预测样本像素点,即,容易预测错的样本像素点。基于筛选之后的logits-和label-计算其第二损失函数。
可选的,对于第二损失函数可以基于下述表达式进行生成,示例性的,表达式包括:
其中,N-Dice表示第二损失函数;X-表示背景像素点的像素点标签;Y-表示第二样本预测结果。
可选的,获取第一损失函数的第一损失函数权重,获取第二损失函数的第二损失函数权重,基于第一损失函数、第二损失函数、第一损失函数权重以及第二损失函数权重确定分割模型的模型损失函数。
具体的,对于模型损失函数可以基于下述表达式进行生成,示例性的,表达式包括:
其中,PNDice表示模型损失函数;α表示第一损失函数权重;1-α表示第二损失函数权重。
在上述实施方式的基础上,本发明实施例的技术方案还包括:在将样本图像输入至待训练的分割模型之前,还包括:对样本进行预设尺寸的裁剪,得到至少两张裁剪后的样本图像;相应的,得到样本图像中各像素点的样本预测结果,还包括:基于重叠滑窗方式输出裁剪后的样本图像的初始样本预测结果;基于裁剪后的样本图像的数量对各初始样本预测结果进行均值处理,得到样本图像的样本预测结果。
具体的,采用1/2重叠滑窗的方式对整个样本图像依次进行预测,最后对每个预测的像素取均值,然后选取固定阈值得到样本预测结果;上述实施方式中采用1/2重叠滑块是为了解决切块预测带来的边缘效应,当然也可以采用其他长度的重叠滑窗,本实施例对此不作限定。
可选的,本实施例的技术方案还包括:采用连通域后处理的方式去除样本预测结果中像素值小于某一阈值的假阳,将结果重采样都原始大小并且映射到原始样本图像坐标中得到最终的预测结果,进一步提高了模型的学习能力,以及提高分割模型在后续分割处理过程中的结果准确性。
本发明实施例的技术方案具体包括:获取用于模型训练的样本图像以及样本图像中各像素点的像素点标签;其中,像素点包括目标像素点和背景像素点;迭代执行如下训练过程,直至满足训练完成条件得到目标分割模型:将样本图像输入至待训练的分割模型,得到样本图像中各像素点的样本预测结果;基于各像素点标签以及样本预测结果计算模型损失函数;其中,模型损失函数包括基于目标像素点的标签生成的第一损失函数以及基于背景像素点的标签生成的第二损失函数;基于模型损失函数对分割模型进行模型参数的调节。上述方案通过分别基于训练样本中正样本所生成的第一损失函数以及基于负样本生成的第二损失函数调整模型参数,以得到训练完成的分割模型,使得模型在学习识别正样本的过程中,能够分一部分注意力到负样本特征提取中,从而进一步提升模型分割的准确性。
图4为本发明实施例提供的一种图像分割方法的流程图,本实施例可适用于对图像进行分割的情况,该方法可以由图像分割装置来执行,该图像分割装置可以采用硬件和/或软件的形式实现,该图像分割装置可配置于智能终端以及云端服务器中。如图4所示,该方法包括:
S210、获取待分割图像。
S220、将待分割图像输入至预先训练完成的分割模型中,得到分割模型输出的分割结果;其中,分割模型包括至少一层级联的编码模块和与编码模块层级相同层级的解码模块;解码模块包括残差注意力组件。
本发明实施例的技术方案具体包括:获取待分割图像将待分割图像输入至预先训练完成的分割模型中,得到分割模型输出的分割结果;其中,分割模型包括至少一层级联的编码模块和与编码模块层级相同层级的解码模块;解码模块包括残差注意力组件。上述技术方案通过在现有分割模型中添加残差注意力组件,以提高对于待分割图像的图像特征细节的提取能力,从而提高基于该分割模型得到的分割结果的准确性。
图5为本发明实施例提供的一种分割模型训练装置的结构示意图。如图5所示,该装置包括:样本图像获取模块310和目标分割模型获得模块320;其中,
样本图像获取模块310,用于获取用于模型训练的样本图像以及样本图像中各像素点的像素点标签;其中,像素点包括目标像素点和背景像素点;
目标分割模型获得模块320,用于迭代执行训练过程,直至满足训练完成条件得到目标分割模型。
可选的,目标分割模型获得模块320,包括:
样本预测结果获得单元,用于将样本图像输入至待训练的分割模型,得到样本图像中各像素点的样本预测结果;
模型损失函数生成单元,用于基于各像素点标签以及样本预测结果计算模型损失函数;其中,模型损失函数包括基于目标像素点的标签生成的第一损失函数以及基于背景像素点的标签生成的第二损失函数;
目标分割模型获得单元,用于基于模型损失函数对分割模型进行模型参数的调节。
在上述实施方式的基础上,可选的,分割模型包括至少一层级联的编码模块和与编码模块层级相同层级的解码模块;解码模块包括残差注意力组件;
相应的,样本预测结果获得单元,包括:
编码特征获取子单元,用于对于任一层级编码模块,基于第一预设卷积参数对样本图像/对上一层级编码模块进行下采样处理后输出的编码特征进行卷积操作,得到当前层级编码模块进行特征提取后的编码特征;
图像特征获取子单元,用于对于任一层级解码模块,基于第二预设卷积参数对上一层级编码模块进行下采样处理后输出的编码,或者对当前层级编码模块进行输出的编码特征与上一层级解码模块上采样处理后输出的图像特征进行拼接后的拼接特征进行卷积操作,并基于残差注意力组件对卷积操作后的图像特征进行特征提取,得到当前层级解码模块进行特征提取后的图像特征。
在上述实施方式的基础上,可选的,模型损失函数生成单元,包括:
第一损失函数生成子单元,用于获取样本预测结果中目标像素点对应的第一样本预测结果,基于第一样本预测结果以及目标像素点的标签生成分割模型的第一损失函数;
第二损失函数生成子单元,用于获取样本预测结果中背景像素点对应的第二样本预测结果,基于第二样本预测结果以及背景像素点的标签生成分割模型的第二损失函数;
模型损失函数生成子单元,用于基于第一损失函数、第二损失函数、预设的第一损失函数权重以及预设的第二损失函数权重确定分割模型的模型损失函数。
在上述实施方式的基础上,可选的,第二损失函数生成子单元,包括:
目标背景像素点生成组件,用于基于背景像素点的标签与第二样本预测结果的比对结果确定背景像素点中的候选背景像素点,并基于预设的筛选条件确定候选背景像素点中的目标背景像素点;
第二损失函数生成组件,用于基于目标背景点的标签以及第二样本预测结果中目标背景点对应的样本预测结果,生成分割模型的第二损失函数。
在上述实施方式的基础上,可选的,目标分割模型获得模块320,还包括:
样本图像裁剪单元,用于在将样本图像输入至待训练的分割模型之前,对样本进行预设尺寸的裁剪,得到至少两张裁剪后的样本图像;
相应的,样本预测结果获得单元,还包括:
初始样本预测结果获得子单元,用于基于重叠滑窗方式输出裁剪后的样本图像的初始样本预测结果;
样本预测结果获得单元,用于基于裁剪后的样本图像的数量对各初始样本预测结果进行均值处理,得到样本图像的样本预测结果。
本发明实施例所提供的分割模型训练装置可执行本发明任意实施例所提供的分割模型训练方法,具备执行方法相应的功能模块和有益效果。
图6为本发明实施例提供的一种图像分割装置的结构示意图。如图6所示,该装置包括:图像获取模块410和分割结果获得模块420;其中,
图像获取模块410,用于获取待分割图像;
分割结果获得模块420,用于将待分割图像输入至预先训练完成的分割模型中,得到分割模型输出的分割结果;其中,分割模型包括至少一层级联的编码模块和与编码模块层级相同层级的解码模块;解码模块包括残差注意力组件。
本发明实施例所提供的图像分割装置可执行本发明任意实施例所提供的图像分割方法,具备执行方法相应的功能模块和有益效果。
图7示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图7所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如分割模型训练方法和/或图像分割方法。
在一些实施例中,分割模型训练方法和/或图像分割方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的分割模型训练方法和/或图像分割方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行分割模型训练方法和/或图像分割方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种分割模型训练方法,其特征在于,包括:
获取用于模型训练的样本图像以及所述样本图像中各像素点的像素点标签;其中,所述像素点包括目标像素点和背景像素点;
迭代执行如下训练过程,直至满足训练完成条件得到目标分割模型:将所述样本图像输入至待训练的分割模型,得到所述样本图像中各像素点的样本分割结果;
基于各所述像素点标签以及所述样本预测结果计算模型损失函数;其中,所述模型损失函数包括基于所述目标像素点的标签生成的第一损失函数以及基于所述背景像素点的标签生成的第二损失函数;
基于所述模型损失函数对所述分割模型进行模型参数的调节。
2.根据权利要求1所述的方法,其特征在于,所述分割模型包括至少一层级联的编码模块和与所述编码模块层级相同层级的解码模块;所述解码模块包括残差注意力组件;
相应的,所述将所述样本图像输入至待训练的分割模型,得到所述样本图像中各像素点的样本预测结果,包括:
对于任一层级编码模块,基于第一预设卷积参数对所述样本图像/对上一层级编码模块进行下采样处理后输出的编码特征进行卷积操作,得到所述当前层级编码模块进行特征提取后的编码特征;
对于任一层级解码模块,基于第二预设卷积参数对上一层级编码模块进行下采样处理后输出的编码,或者对所述当前层级编码模块进行输出的编码特征与上一层级解码模块上采样处理后输出的图像特征进行拼接后的拼接特征进行卷积操作,并基于残差注意力组件对卷积操作后的图像特征进行特征提取,得到当前层级解码模块进行特征提取后的图像特征。
3.根据权利要求1所述的方法,其特征在于,所述基于各所述像素点标签以及所述样本预测结果计算模型损失函数,包括:
获取所述样本预测结果中目标像素点对应的第一样本预测结果,基于所述第一样本预测结果以及所述目标像素点的标签生成所述分割模型的第一损失函数;
获取所述样本预测结果中背景像素点对应的第二样本预测结果,基于所述第二样本预测结果以及所述背景像素点的标签生成所述分割模型的第二损失函数;
基于所述第一损失函数、所述第二损失函数、预设的第一损失函数权重以及预设的第二损失函数权重确定所述分割模型的模型损失函数。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第二样本预测结果以及所述背景像素点的标签生成所述分割模型的第二损失函数,包括:
基于所述背景像素点的标签与所述第二样本预测结果的比对结果确定所述背景像素点中的候选背景像素点,并基于预设的筛选条件确定所述候选背景像素点中的目标背景像素点;
基于所述目标背景点的标签以及所述第二样本预测结果中目标背景点对应的样本预测结果,生成所述分割模型的第二损失函数。
5.根据权利要求1所述的方法,其特征在于,在所述将所述样本图像输入至待训练的分割模型之前,还包括:
对所述样本进行预设尺寸的裁剪,得到至少两张裁剪后的样本图像;
相应的,所述得到所述样本图像中各像素点的样本预测结果,还包括:
基于重叠滑窗方式输出所述裁剪后的样本图像的初始样本预测结果;
基于裁剪后的样本图像的数量对各所述初始样本预测结果进行均值处理,得到所述样本图像的样本预测结果。
6.一种图像分割方法,其特征在于,包括:
获取待分割图像;
将所述待分割图像输入至预先训练完成的分割模型中,得到所述分割模型输出的分割结果;其中,所述分割模型基于上述权利要求1-5中任一项所述的分割模型训练方法进行训练得到。
7.一种分割模型训练装置,其特征在于,包括:
样本图像获取模块,用于获取用于模型训练的样本图像以及所述样本图像中各像素点的像素点标签;其中,所述像素点包括目标像素点和背景像素点;
目标分割模型获得模块,用于迭代执行如下训练过程,直至满足训练完成条件得到目标分割模型:将所述样本图像输入至待训练的分割模型,得到所述样本图像中各像素点的样本预测结果;
基于各所述像素点标签以及所述样本预测结果计算模型损失函数;其中,所述模型损失函数包括基于所述目标像素点的标签生成的第一损失函数以及基于所述背景像素点的标签生成的第二损失函数;
基于所述模型损失函数对所述分割模型进行模型参数的调节。
8.一种图像分割装置,其特征在于,包括:
图像获取模块,用于获取待分割图像;
分割结果获得模块,用于将所述待分割图像输入至预先训练完成的分割模型中,得到所述分割模型输出的分割结果;其中,所述分割模型基于上述权利要求1-5中任一项所述的分割模型训练方法进行训练得到。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的分割模型训练方法和/或权利要求6所述的图像分割方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-5中任一项所述的分割模型训练方法和/或权利要求6所述的图像分割方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210707648.7A CN115018805A (zh) | 2022-06-21 | 2022-06-21 | 分割模型训练方法、图像分割方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210707648.7A CN115018805A (zh) | 2022-06-21 | 2022-06-21 | 分割模型训练方法、图像分割方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115018805A true CN115018805A (zh) | 2022-09-06 |
Family
ID=83077830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210707648.7A Pending CN115018805A (zh) | 2022-06-21 | 2022-06-21 | 分割模型训练方法、图像分割方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115018805A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115512116A (zh) * | 2022-11-01 | 2022-12-23 | 北京安德医智科技有限公司 | 图像分割模型优化方法、装置、电子设备及可读存储介质 |
CN115661449A (zh) * | 2022-09-22 | 2023-01-31 | 北京百度网讯科技有限公司 | 图像分割与图像分割模型的训练方法、装置 |
CN115690143A (zh) * | 2022-09-26 | 2023-02-03 | 推想医疗科技股份有限公司 | 图像分割方法、装置、电子设备及存储介质 |
-
2022
- 2022-06-21 CN CN202210707648.7A patent/CN115018805A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115661449A (zh) * | 2022-09-22 | 2023-01-31 | 北京百度网讯科技有限公司 | 图像分割与图像分割模型的训练方法、装置 |
CN115661449B (zh) * | 2022-09-22 | 2023-11-21 | 北京百度网讯科技有限公司 | 图像分割与图像分割模型的训练方法、装置 |
CN115690143A (zh) * | 2022-09-26 | 2023-02-03 | 推想医疗科技股份有限公司 | 图像分割方法、装置、电子设备及存储介质 |
CN115690143B (zh) * | 2022-09-26 | 2023-07-11 | 推想医疗科技股份有限公司 | 图像分割方法、装置、电子设备及存储介质 |
CN115512116A (zh) * | 2022-11-01 | 2022-12-23 | 北京安德医智科技有限公司 | 图像分割模型优化方法、装置、电子设备及可读存储介质 |
CN115512116B (zh) * | 2022-11-01 | 2023-06-30 | 北京安德医智科技有限公司 | 图像分割模型优化方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115018805A (zh) | 分割模型训练方法、图像分割方法、装置、设备及介质 | |
CN115294332B (zh) | 一种图像处理方法、装置、设备和存储介质 | |
CN115409990B (zh) | 一种医学图像分割方法、装置、设备及存储介质 | |
CN115170510B (zh) | 一种病灶检测方法、装置、电子设备及可读存储介质 | |
CN115861462A (zh) | 图像生成模型的训练方法、装置、电子设备及存储介质 | |
CN113971728B (zh) | 图像识别方法、模型的训练方法、装置、设备及介质 | |
CN114708374A (zh) | 虚拟形象生成方法、装置、电子设备和存储介质 | |
CN114972361B (zh) | 一种血流分割方法、装置、设备及存储介质 | |
CN116245832B (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN114882313B (zh) | 生成图像标注信息的方法、装置、电子设备及存储介质 | |
CN114937149A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN115482248A (zh) | 图像分割方法、装置、电子设备及存储介质 | |
CN115861255A (zh) | 用于图像处理的模型训练方法、装置、设备、介质及产品 | |
CN115409856A (zh) | 一种肺部医学图像处理方法、装置、设备及存储介质 | |
CN115131390A (zh) | 图像分割方法、装置、电子设备以及存储介质 | |
CN112861940A (zh) | 双目视差估计方法、模型训练方法以及相关设备 | |
CN115546239B (zh) | 基于边界注意力与距离变换的目标分割方法和装置 | |
CN115690143B (zh) | 图像分割方法、装置、电子设备及存储介质 | |
CN113793290B (zh) | 一种视差确定方法、装置、设备、介质 | |
CN114998273A (zh) | 血管图像处理方法、装置、电子设备及存储介质 | |
CN115661449B (zh) | 图像分割与图像分割模型的训练方法、装置 | |
CN114820686B (zh) | 抠图的方法、装置、电子设备及存储介质 | |
CN115690411A (zh) | 一种肝段分割方法、装置、电子设备及存储介质 | |
CN116664951A (zh) | 一种图像分类模型的训练方法、图像分类方法和装置 | |
CN116580050A (zh) | 医疗图像分割模型的确定方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |