CN113610855B - 图像分割模型训练方法、分割方法、系统、装置及介质 - Google Patents
图像分割模型训练方法、分割方法、系统、装置及介质 Download PDFInfo
- Publication number
- CN113610855B CN113610855B CN202110788201.2A CN202110788201A CN113610855B CN 113610855 B CN113610855 B CN 113610855B CN 202110788201 A CN202110788201 A CN 202110788201A CN 113610855 B CN113610855 B CN 113610855B
- Authority
- CN
- China
- Prior art keywords
- image
- target
- segmentation
- segmentation model
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像分割模型训练方法、识别方法、系统、装置及介质,训练方法包括:根据先验知识确定卷积核;获取预设的第一目标图像,将卷积核旋转预设的多个角度后对第一目标图像进行卷积操作,得到第一目标图像中前景目标特征的预分割图像;构建卷积神经网络,将预分割图像输入到卷积神经网络中进行训练,得到目标概率图像,进而根据目标概率图像和第一目标图像对卷积神经网络的参数进行优化,得到训练好的图像分割模型。本发明利用先验知识对图像进行了预分割,使得后续的卷积神经网络得到大大简化,降低了对运算资源的依赖,提高了图像分割的速度;在预分割过程中引入了旋转卷积核,提高了图像分割的精度,可广泛应用于图像处理技术领域。
Description
技术领域
本发明涉及图像处理技术领域,尤其是一种图像分割模型训练、分割方法、系统、装置及介质。
背景技术
图像分割是计算机视觉领域的一个重要研究方向,已经成为图像理解领域内的关键一环。图像分割是指将输入图像细分为构成它的子区域或物体,在实际应用中根据要解决的问题,将感兴趣的物体或区域检测出来。分割技术已广泛应用于医学影像、人脸识别、自动驾驶等领域,构成人工智能领域的重要环节。
目前用于图像分割的方法可分为基于传统方式的分割与基于深度学习的分割。传统分割方式大体可分为基于阈值、基于边缘、基于区域三种分割方法,深度学习的分割主要采用卷积神经网络做分割,其中具有代表性的有FCN、DeepLab、U-net等网络结构以及变种结构。
传统分割与深度学习分割都存在一定的优缺点。传统分割方式计算简单、速度快且占用资源少,但易受噪声影响,鲁棒性不高。深度学习分割有更好的精度,并且由于卷积神经网络可以使用新的数据重新训练,因此具有更好的灵活性,而传统分割需要对具体的分割目标重新调试,耗费人力和时间。深度学习方法需要大量的数据作为训练样本,加大了计算的复杂度,并且需要占用更多的计算资源。另外,图像在成像过程中常常受到诸如电子设备等的影响,因此带有噪声干扰。传统分割在处理噪声污染的图像时会产生不必要的轮廓或区域,传统方法中常采用滤波处理。但滤波过程需要针对不同的期望效果设计滤波器,增加了图像处理的复杂性。目前,深度学习分割都是以常规图像作为数据集,实验中没有考虑噪声污染的图像,处理过程中能做到去噪,但需要标签数据和Ground Truth,导致增加内存占用量,真实无噪图像也难以获得。
发明内容
本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
为此,本发明实施例的一个目的在于提供一种图像分割模型训练方法,该方法可以提高得到的图像分割模型的图像分割精度。
本发明实施例的另一个目的在于提供一种高精度的图像分割方法。
为了达到上述技术目的,本发明实施例所采取的技术方案包括:
第一方面,本发明实施例提供了一种图像分割模型训练方法,包括以下步骤:
根据先验知识确定卷积核;
获取预设的第一目标图像,将所述卷积核旋转预设的多个角度后对所述第一目标图像进行卷积操作,得到所述第一目标图像中前景目标特征的预分割图像;
构建卷积神经网络,将所述预分割图像输入到所述卷积神经网络中进行训练,得到目标概率图像,进而根据所述目标概率图像和所述第一目标图像对所述卷积神经网络的参数进行优化,得到训练好的图像分割模型。
进一步地,在本发明的一个实施例中,所述获取预设的第一目标图像,将所述卷积核旋转预设的多个角度后对所述第一目标图像进行卷积操作,得到所述第一目标图像中前景目标特征的预分割图像这一步骤,其具体包括:
获取预设的第一目标图像,通过所述卷积核对所述第一目标图像进行卷积操作,提取出第一方向上的前景目标特征;
将所述卷积核以预设的角度步长进行旋转后对所述第一目标图像进行卷积操作,提取出第二方向上的前景目标特征;
重复上一步骤直至旋转角度达到180度;
根据提取的前景目标特征确定所述预分割图像。
进一步地,在本发明的一个实施例中,所述根据提取的前景目标特征确定所述预分割图像这一步骤之前,还包括以下步骤:
根据所述第一目标图像建立图像金字塔,将所述卷积核旋转预设的多个角度后对所述图像金字塔进行卷积操作,提取出前景目标特征。
进一步地,在本发明的一个实施例中,所述将所述预分割图像输入到所述卷积神经网络中进行训练,得到目标概率图像,进而根据所述目标概率图像和所述第一目标图像对所述卷积神经网络的参数进行优化,得到训练好的图像分割模型这一步骤,其具体包括:
通过所述卷积神经网络对所述预分割图像进行逐层提取,进而通过卷积和池化操作得到目标概率图像;
根据所述目标概率图像和所述第一目标图像的真实概率图确定训练的损失值;
通过反向传播算法逐层更新所述卷积神经网络的参数;
当损失值达到预设的第一阈值或迭代次数达到预设的第二阈值,停止训练,得到所述图像分割模型。
进一步地,在本发明的一个实施例中,所述图像分割模型训练方法还包括对所述图像分割模型还包括以下步骤:
获取预设的测试图像集,根据所述测试图像集对所述图像分割模型进行测试,得到所述图像分割模型的重叠度、精密度、查全率以及加权调和均值。
第二方面,本发明实施例提供了一种图像分割方法,包括以下步骤:
获取待分割的第二目标图像;
将所述第二目标图像输入到如第一方面所述的图像分割模型训练方法所得到的图像分割模型中,得到图像分割结果。
第三方面,本发明实施例提供了一种图像分割模型训练系统,包括:
卷积核确定模块,用于根据先验知识确定卷积核;
预分割模块,用于获取预设的第一目标图像,将所述卷积核旋转预设的多个角度后对所述第一目标图像进行卷积操作,得到所述第一目标图像中前景目标特征的预分割图像;
训练模块,用于构建卷积神经网络,将所述预分割图像输入到所述卷积神经网络中进行训练,得到目标概率图像,进而根据所述目标概率图像和所述第一目标图像对所述卷积神经网络的参数进行优化,得到训练好的图像分割模型。
第四方面,本发明实施例提供了一种图像分割系统,包括:
第二目标图像获取模块,用于获取待分割的第二目标图像;
分割模块,用于将所述第二目标图像输入到如第一方面所述的图像分割模型训练方法所得到的图像分割模型中,得到图像分割结果。
第五方面,本发明实施例提供了一种图像分割模型训练装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现第一方面所述的图像分割模型训练方法。
第六方面,本发明实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行第一方面所述的图像分割模型训练方法或者第二方面所述的图像分割方法。
本发明的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到:
本发明实施例根据先验知识确定卷积核,并通过旋转卷积核对第一目标图像做预分割处理,再通过卷积神经网络对预分割后的图像进行学习,由于利用先验知识对图像进行了预分割,避免了用卷积神经网络提取目标的复杂性,也无需考虑目标提取的网络层数,使得后续的卷积神经网络得到了简化,从而大大降低了计算机的资源占用,也使得图像分割模型更加轻量化,提高了分割速度;在预分割过程中引入了旋转卷积核,按角度捕获目标图像在不同角度上的特征,对各个角度的局部特征进行筛选,从而可以舍弃不必要的噪声特征,在保持原有分割的基础上降低噪声带来的影响,提高了图像分割的质量和精度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面对本发明实施例中所需要使用的附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员来说,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1为本发明实施例提供的一种图像分割模型训练方法的步骤流程图;
图2为本发明实施例提供的一种图像分割方法的步骤流程图;
图3为本发明实施例提供的图像分割模型的结构示意图;
图4为本发明实施例提供的一种图像分割模型训练系统的结构框图;
图5为本发明实施例提供的一种图像分割系统的结构框图;
图6为本发明实施例提供的一种图像分割模型训练装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
在本发明的描述中,多个的含义是两个或两个以上,如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。此外,除非另有定义,本文所使用的所有的技术和科学术语与本技术领域的技术人员通常理解的含义相同。
参照图1,本发明实施例提供了一种图像分割模型训练方法,具体包括以下步骤:
S101、根据先验知识确定卷积核。
具体地,获得原始目标的目标图像集,根据先验知识自定义卷积核参数,规定水平方向为初始方向,卷积核角度为s,初始角度设为0,即此时s=0。
S102、获取预设的第一目标图像,将卷积核旋转预设的多个角度后对第一目标图像进行卷积操作,得到第一目标图像中前景目标特征的预分割图像。
具体地,对目标图像进行卷积,提取某一特定方向上的目标特征,不在该方向上的目标特征及噪声将显示为离散像素点而不被选取,从而可以减弱噪声影响。步骤S102具体包括以下步骤:
S1021、获取预设的第一目标图像,通过卷积核对第一目标图像进行卷积操作,提取出第一方向上的前景目标特征;
S1022、将卷积核以预设的角度步长进行旋转后对第一目标图像进行卷积操作,提取出第二方向上的前景目标特征;
S1023、重复上一步骤直至旋转角度达到180度;
S1025、根据提取的前景目标特征确定预分割图像。
具体地,卷积核以s角度对图像进行卷积,在s角度上的目标特征将会得到增强从而被后续卷积网络选取,不在s角度上的其余特征以及噪声将会在卷积的处理下形成离散像素点,从而被后续卷积网络舍弃;得到该角度上的目标特征后,将卷积核旋转x角度,x即为预设的角度步长,此时角度为s+x,再次对图像进行卷积,得到旋转后s+x角度上的目标特征;当旋转次数达到π/x时,不再进行旋转卷积操作。
进一步作为可选的实施方式,根据提取的前景目标特征确定预分割图像这一步骤S1025之前,还包括以下步骤:
S1024、根据第一目标图像建立图像金字塔,将卷积核旋转预设的多个角度后对图像金字塔进行卷积操作,提取出前景目标特征。
具体地,卷积核旋转次数达到π/x时,将s重置为0。通过建立图像金字塔适当缩小数据集图像,可以在固定卷积核大小的情况下获得更大的感受野,捕获局部特征的上下文信息,以便实现更好的分割效果,同时也能达到数据扩充解决样本不足的问题。
本发明实施例中,对图像金字塔采取类似S1021和S1022的旋转卷积操作,最终得到图像中前景目标特征的预分割图像,同时卷积核的旋转次数以及卷积操作次数具有高度可控性的优点,可根据实际需要或计算机硬件条件来定义,从而大大降低对系统算力的要求。
S103、构建卷积神经网络,将预分割图像输入到卷积神经网络中进行训练,得到目标概率图像,进而根据目标概率图像和第一目标图像对卷积神经网络的参数进行优化,得到训练好的图像分割模型。
具体地,构建卷积神经网络,并利用步骤S102得到的预分割图像对卷积神经网络进行训练,得到训练好的图像分割模型。如图3所示为本发明实施例提供的图像分割模型的结构示意图,其中深度学习部分由四层卷积神经网络构成,每层结构均由一个卷积层和一个池化层构成,前三层通道数依次为128、64、32,并在每层卷积层后执行批量归一化操作以及ReLu激活函数。最大池化层的结果作为该层网络的输出结果;第四层为1×1卷积层,将前面网络层的结果进行融合得到最终的输出特征图。
可以理解的是,本发明实施例的图像分割模型为混合方式分割模型,下面对其具体工作原理进行说明。
混合方式分割模型总共分为两部分,具体如图3所示。首先,选取步长为1,大小为3×3的预分割卷积核,卷积核参数由实际需要设定,并规定水平方向为初始方向,设卷积核角度为s,初始s=0。
第一部分结构由基于先验知识的卷积核组成,通过卷积操作增强目标特征,每进行一次卷积操作后得到目标的预分割图,然后将卷积核以固定方向旋转x角度,再次对原始图像数据集进行卷积操作,直到达到最大旋转次数π/x时,不再对卷积核进行旋转。此时将目标图像数据集进行缩小处理(建立金字塔),卷积核大小不变,重复上述操作,该方法可实现在卷积核大小固定的情况下增大感受野,适应多尺度的特征,增强模型的鲁棒性,捕获更多的局部特征上下文信息,同时也能弥补数据集数量不足的问题。
第二部分结构由四层卷积神经网络构成,输入为第一部分得到的一系列目标的预分割图像,最终输出为目标分割且降噪后的图像。前三层均由一个卷积模块和最大池化模块组成,卷积层通道数依次为128、64、32,池化部分采用的是步长为2,大小为2×2的卷积核。
第一部分的输出进入第二部分的第一层卷积网络层后,首先将128通道的输出特征图分成128个单通道特征图,然后对这些单通道的特征图依次进行卷积,得到每个角度下的目标特征图像,最后将特征图像进行融合得到最终特征图。由于输入卷积网络层的数据经过旋转卷积处理,使得原始图像中目标在各个角度的信息保留较为完整,大部分噪声干扰减少,进而提高对目标成像的质量。最后通过1×1的卷积与激活函数处理后,融合得到了最终的输出结果。
进一步作为可选的实施方式,将预分割图像输入到卷积神经网络中进行训练,得到目标概率图像,进而根据目标概率图像和第一目标图像对卷积神经网络的参数进行优化,得到训练好的图像分割模型这一步骤,其具体包括:
A1、通过卷积神经网络对预分割图像进行逐层提取,进而通过卷积和池化操作得到目标概率图像;
A2、根据目标概率图像和第一目标图像的真实概率图确定训练的损失值;
A3、通过反向传播算法逐层更新卷积神经网络的参数;
A4、当损失值达到预设的第一阈值或迭代次数达到预设的第二阈值,停止训练,得到图像分割模型。
具体地,建立好卷积神经网络后,进行图像分割模型的训练。模型训练的过程是前向传播与反向传播的交替循环,前向传播将输入的特征图像进行逐层提取,经过一系列卷积和池化操作输出前景目标的概率图,与真实的概率图进行损失计算。通过损失函数计算得到损失值后通过反向传播算法逐层更新卷积网络参数,这样便完成一次迭代训练。当损失函数值达到给定值或迭代次数达到规定的最大值时,停止训练并保存图像分割模型。
本发明实施例中,将预分割图像输入到初始化后的卷积神经网络后,可以得到模型预测的目标概率图像,可以根据目标概率图像和真实概率图像来评估模型预测的准确性,从而对模型的参数进行更新。对于图像分割模型来说,模型预测结果的准确性可以通过损失函数(Loss Function)来衡量,损失函数是定义在单个训练数据上的,用于衡量一个训练数据的预测误差,具体是通过单个训练数据的标签和模型对该训练数据的预测结果确定该训练数据的损失值。而实际训练时,一个训练数据集有很多训练数据,因此一般采用代价函数(Cost Function)来衡量训练数据集的整体误差,代价函数是定义在整个训练数据集上的,用于计算所有训练数据的预测误差的平均值,能够更好地衡量出模型的预测效果。对于一般的机器学习模型来说,基于前述的代价函数,再加上衡量模型复杂度的正则项即可作为训练的目标函数,基于该目标函数便能求出整个训练数据集的损失值。常用的损失函数种类有很多,例如0-1损失函数、平方损失函数、绝对损失函数、对数损失函数、交叉熵损失函数等均可以作为机器学习模型的损失函数,在此不再一一阐述。本发明实施例中,可以从中任选一种损失函数来确定训练的损失值。基于训练的损失值,采用反向传播算法对模型的参数进行更新,迭代几轮即可得到训练好的图像分割模型。具体地迭代轮数可以预先设定,或者在测试集达到精度要求时认为训练完成。
进一步作为可选的实施方式,图像分割模型训练方法还包括对图像分割模型还包括以下步骤:
S104、获取预设的测试图像集,根据测试图像集对图像分割模型进行测试,得到图像分割模型的重叠度、精密度、查全率以及加权调和均值。
具体地,目标分割模型训练完成后,根据评价指标对目标分割结果进行评价。评价指标包括重叠度(IOU)、精密度(Precision)、查全率(Recall)和加权调和均值(F-Measure)。相关公式如下:
其中,Target是测试图像集中样本图像的目标对象的像素点,Prediction是样本图像对应预测分割图像的目标对象的像素点。
其中,TP是预测分割图像预测正确的目标对象的像素点,FP是预测分割图像中存在但真实目标图像不存在的目标对象的像素点。
其中,TP是预测分割图像预测正确的目标对象的像素点,FN是预测分割图像中不存在但真实目标图像存在的目标对象的像素点。
其中,是权重。
可以理解的是,本发明实施例提出了一种传统分割结合深度学习分割的方法,通过传统方式对目标图像做预分割处理,即利用先验知识,采用设计好的旋转卷积核对图像进行处理,再利用卷积神经网络对预分割后的图像进行学习。由于该方法利用先验知识对图像进行了预分割,使得后续的卷积神经网络得到大大简化,因此,该方法不仅可以实现对目标的有效分割,而且能大大提高分割速度,降低对运算资源的依赖。与现有技术相比,本发明实施例具有以下优点:
1)本发明实施例基于先验知识的方法直接提取原始图像的目标特征,避免了用卷积神经网络提取目标的复杂性,也无需考虑目标提取的网络层数,即可得到预分割图像。后续只需用较浅的卷积网络层进行训练,预测各个像素点属于前景目标的概率,具有高度可控性,从而大大降低了计算机的资源占用,也使整个分割模型更加轻量化。
2)本发明实施例的图像分割模型,充分利用先验知识与深度学习的优点,结合优化网络结构的方式,有效提高图像分割的速度和减少噪声对原始图像带来的影响。
3)本发明实施例在预分割过程中引入了旋转卷积核,按角度捕获图像不同角度上的特征,对该角度的局部特征进行筛选,从而舍弃不必要的噪声特征,在保持原有分割的基础上降低噪声带来的影响,提高图像分割的质量和精度。在卷积步骤中,对图像进行金字塔处理增大感受野,捕获局部特征的上下文关系,进一步提高分割的精度。
参照图2,本发明实施例提供了一种图像分割方法,具体包括以下步骤:
S201、获取待分割的第二目标图像;
S202、将第二目标图像输入到如前述的图像分割模型训练方法所得到的图像分割模型中,得到图像分割结果。
可以理解的是,上述图像分割模型训练方法实施例中的内容均适用于本图像分割方法实施例中,本图像分割方法实施例所具体实现的功能与上述图像分割模型训练方法实施例相同,并且达到的有益效果与上述图像分割模型训练方法实施例所达到的有益效果也相同。
参照图4,本发明实施例提供了一种图像分割模型训练系统,包括:
卷积核确定模块,用于根据先验知识确定卷积核;
预分割模块,用于获取预设的第一目标图像,将卷积核旋转预设的多个角度后对第一目标图像进行卷积操作,得到第一目标图像中前景目标特征的预分割图像;
训练模块,用于构建卷积神经网络,将预分割图像输入到卷积神经网络中进行训练,得到目标概率图像,进而根据目标概率图像和第一目标图像对卷积神经网络的参数进行优化,得到训练好的图像分割模型。
可以理解的是,上述图像分割模型训练方法实施例中的内容均适用于本图像分割模型训练系统实施例中,本图像分割模型训练系统实施例所具体实现的功能与上述图像分割模型训练方法实施例相同,并且达到的有益效果与上述图像分割模型训练方法实施例所达到的有益效果也相同。
参照图5,本发明实施例提供了一种图像分割系统,包括:
第二目标图像获取模块,用于获取待分割的第二目标图像;
分割模块,用于将第二目标图像输入到如前述的图像分割模型训练方法所得到的图像分割模型中,得到图像分割结果。
可以理解的是,上述图像分割模型训练方法实施例中的内容均适用于本图像分割系统实施例中,本图像分割系统实施例所具体实现的功能与上述图像分割模型训练方法实施例相同,并且达到的有益效果与上述图像分割模型训练方法实施例所达到的有益效果也相同。
参照图6,本发明实施例提供了一种图像分割模型训练装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当上述至少一个程序被上述至少一个处理器执行时,使得上述至少一个处理器实现如前述的一种图像分割模型训练方法。
可以理解的是,上述图像分割模型训练方法实施例中的内容均适用于本图像分割模型训练装置实施例中,本图像分割模型训练装置实施例所具体实现的功能与上述图像分割模型训练方法实施例相同,并且达到的有益效果与上述图像分割模型训练方法实施例所达到的有益效果也相同。
本发明实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,该处理器可执行的程序在由处理器执行时用于执行上述的图像分割模型训练方法或者上述的图像分割方法。
本发明实施例的一种计算机可读存储介质,可执行本发明方法实施例所提供的图像分割模型训练方法或者图像分割方法,可执行本发明方法实施例的任意组合实施步骤,具备本发明方法实施例相应的功能和有益效果。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1或图2所示的方法。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或上述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,上述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印上述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得上述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (9)
1.一种图像分割模型训练方法,其特征在于,包括以下步骤:
根据先验知识确定卷积核;
获取预设的第一目标图像,将所述卷积核旋转预设的多个角度后对所述第一目标图像进行卷积操作,得到所述第一目标图像中前景目标特征的预分割图像;
构建卷积神经网络,将所述预分割图像输入到所述卷积神经网络中进行训练,得到目标概率图像,进而根据所述目标概率图像和所述第一目标图像对所述卷积神经网络的参数进行优化,得到训练好的图像分割模型;
获取预设的测试图像集,根据所述测试图像集对所述图像分割模型进行测试,得到所述图像分割模型的重叠度、精密度、查全率以及加权调和均值;
所述重叠度通过下式计算得到:
其中,IOU表示重叠度,Target表示测试图像集中样本图像的目标对象的像素点,
Prediction表示测试图像集中样本图像对应预测分割图像的目标对象的像素点;
所述精密度通过下式计算得到:
其中,Precision表示精密度,TP表示预测分割图像中预测正确的目标对象的像素点,
FP表示预测分割图像中存在但真实目标图像不存在的目标对象的像素点;
所述查全率通过下式计算得到:
其中,Recall表示查全率,FN表示预测分割图像中不存在但真实目标图像存在的目标对象的像素点;
所述加权调和均值通过下式计算得到:
其中,F-Measure表示加权调和均值,表示预设的权重参数。
2.根据权利要求1所述的一种图像分割模型训练方法,其特征在于,所述获取预设的第一目标图像,将所述卷积核旋转预设的多个角度后对所述第一目标图像进行卷积操作,得到所述第一目标图像中前景目标特征的预分割图像这一步骤,其具体包括:
获取预设的第一目标图像,通过所述卷积核对所述第一目标图像进行卷积操作,提取出第一方向上的前景目标特征;
将所述卷积核以预设的角度步长进行旋转后对所述第一目标图像进行卷积操作,提取出第二方向上的前景目标特征;
重复上一步骤直至旋转角度达到180度;
根据提取的前景目标特征确定所述预分割图像。
3.根据权利要求2所述的一种图像分割模型训练方法,其特征在于,所述根据提取的前景目标特征确定所述预分割图像这一步骤之前,还包括以下步骤:
根据所述第一目标图像建立图像金字塔,将所述卷积核旋转预设的多个角度后对所述图像金字塔进行卷积操作,提取出前景目标特征。
4.根据权利要求1所述的一种图像分割模型训练方法,其特征在于,所述将所述预分割图像输入到所述卷积神经网络中进行训练,得到目标概率图像,进而根据所述目标概率图像和所述第一目标图像对所述卷积神经网络的参数进行优化,得到训练好的图像分割模型这一步骤,其具体包括:
通过所述卷积神经网络对所述预分割图像进行逐层提取,进而通过卷积和池化操作得到目标概率图像;
根据所述目标概率图像和所述第一目标图像的真实概率图确定训练的损失值;
通过反向传播算法逐层更新所述卷积神经网络的参数;
当损失值达到预设的第一阈值或迭代次数达到预设的第二阈值,停止训练,得到所述图像分割模型。
5.一种图像分割方法,其特征在于,包括以下步骤:
获取待分割的第二目标图像;
将所述第二目标图像输入到如权利要求1至4中任一项所述的图像分割模型训练方法所得到的图像分割模型中,得到图像分割结果。
6.一种图像分割模型训练系统,其特征在于,包括:
卷积核确定模块,用于根据先验知识确定卷积核;
预分割模块,用于获取预设的第一目标图像,将所述卷积核旋转预设的多个角度后对所述第一目标图像进行卷积操作,得到所述第一目标图像中前景目标特征的预分割图像;
训练模块,用于构建卷积神经网络,将所述预分割图像输入到所述卷积神经网络中进行训练,得到目标概率图像,进而根据所述目标概率图像和所述第一目标图像对所述卷积神经网络的参数进行优化,得到训练好的图像分割模型;
测试模块,用于获取预设的测试图像集,根据所述测试图像集对所述图像分割模型进行测试,得到所述图像分割模型的重叠度、精密度、查全率以及加权调和均值;
所述重叠度通过下式计算得到:
其中,IOU表示重叠度,Target表示测试图像集中样本图像的目标对象的像素点,
Prediction表示测试图像集中样本图像对应预测分割图像的目标对象的像素点;
所述精密度通过下式计算得到:
其中,Precision表示精密度,TP表示预测分割图像中预测正确的目标对象的像素点,
FP表示预测分割图像中存在但真实目标图像不存在的目标对象的像素点;
所述查全率通过下式计算得到:
其中,Recall表示查全率,FN表示预测分割图像中不存在但真实目标图像存在的目标对象的像素点;
所述加权调和均值通过下式计算得到:
其中,F-Measure表示加权调和均值,表示预设的权重参数。
7.一种图像分割系统,其特征在于,包括:
第二目标图像获取模块,用于获取待分割的第二目标图像;
分割模块,用于将所述第二目标图像输入到如权利要求1至4中任一项所述的图像分割模型训练方法所得到的图像分割模型中,得到图像分割结果。
8.一种图像分割模型训练装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1至4中任一项所述的一种图像分割模型训练方法。
9.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行如权利要求1至5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110788201.2A CN113610855B (zh) | 2021-07-13 | 2021-07-13 | 图像分割模型训练方法、分割方法、系统、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110788201.2A CN113610855B (zh) | 2021-07-13 | 2021-07-13 | 图像分割模型训练方法、分割方法、系统、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113610855A CN113610855A (zh) | 2021-11-05 |
CN113610855B true CN113610855B (zh) | 2023-09-26 |
Family
ID=78304495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110788201.2A Active CN113610855B (zh) | 2021-07-13 | 2021-07-13 | 图像分割模型训练方法、分割方法、系统、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113610855B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111507993A (zh) * | 2020-03-18 | 2020-08-07 | 南方电网科学研究院有限责任公司 | 一种基于生成对抗网络的图像分割方法、装置及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10579897B2 (en) * | 2017-10-02 | 2020-03-03 | Xnor.ai Inc. | Image based object detection |
US10878569B2 (en) * | 2018-03-28 | 2020-12-29 | International Business Machines Corporation | Systems and methods for automatic detection of an indication of abnormality in an anatomical image |
US20210174214A1 (en) * | 2019-12-10 | 2021-06-10 | The Mathworks, Inc. | Systems and methods for quantizing a neural network |
-
2021
- 2021-07-13 CN CN202110788201.2A patent/CN113610855B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111507993A (zh) * | 2020-03-18 | 2020-08-07 | 南方电网科学研究院有限责任公司 | 一种基于生成对抗网络的图像分割方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
结合卷积神经网络和超像素聚类的细胞图像分割方法;杨金鑫;杨辉华;李灵巧;潘细朋;刘振丙;周洁茜;;计算机应用研究(05);第295-298页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113610855A (zh) | 2021-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108388896B (zh) | 一种基于动态时序卷积神经网络的车牌识别方法 | |
CN110992354B (zh) | 基于引入自动记忆机制对抗自编码器的异常区域检测方法 | |
CN109635744B (zh) | 一种基于深度分割网络的车道线检测方法 | |
CN109118473B (zh) | 基于神经网络的角点检测方法、存储介质与图像处理系统 | |
CN111145209A (zh) | 一种医学图像分割方法、装置、设备及存储介质 | |
CN115661144A (zh) | 基于可变形U-Net的自适应医学图像分割方法 | |
CN111598871B (zh) | 多特征融合辅助检测肺部磨玻璃影结节系统及介质 | |
CN110930378B (zh) | 基于低数据需求的肺气肿影像处理方法及系统 | |
CN110070548B (zh) | 一种深度学习训练样本优化方法 | |
CN114283329A (zh) | 一种基于强变换下的半监督遥感图像语义分割方法及设备 | |
Zhao et al. | A deep cascade of neural networks for image inpainting, deblurring and denoising | |
CN113065525A (zh) | 年龄识别模型训练方法、人脸年龄识别方法及相关装置 | |
CN112102259A (zh) | 一种基于边界引导深度学习的图像分割算法 | |
CN110570394A (zh) | 医学图像分割方法、装置、设备及存储介质 | |
CN110516731B (zh) | 一种基于深度学习的视觉里程计特征点检测方法及系统 | |
CN113421210B (zh) | 一种基于双目立体视觉的表面点云重建方法 | |
CN111210398A (zh) | 基于多尺度池化的白细胞识别系统 | |
CN113610855B (zh) | 图像分割模型训练方法、分割方法、系统、装置及介质 | |
CN112950685A (zh) | 一种红外与可见光图像配准方法、系统及存储介质 | |
CN113051901B (zh) | 一种身份证文本识别方法、系统、介质及电子终端 | |
CN113160146B (zh) | 一种基于图神经网络的变化检测方法 | |
CN115512203A (zh) | 信息检测方法、装置、设备及存储介质 | |
Khan et al. | Deriving scale normalisation factors for a GLoG detector | |
CN113793343A (zh) | 基于图像的缺陷定位分割方法、系统、终端及存储介质 | |
Yang et al. | Edge detection in Cassini astronomy image using Extreme Learning Machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |