CN111666949A

CN111666949A - 一种基于迭代分割的图像语义分割方法

Info

Publication number: CN111666949A
Application number: CN202010546056.2A
Authority: CN
Inventors: 俞扬; 詹德川; 周志华; 陈骏
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2020-06-16
Filing date: 2020-06-16
Publication date: 2020-09-15
Anticipated expiration: 2040-06-16
Also published as: CN111666949B

Abstract

本发明公开一种基于迭代分割的图像语义分割方法，包括：图像预处理，通过图像增强模型对输入的样本图像进行增强，得到增强样本图像，然后对所述增强样本图像进行若干次分割，如此反复得到最终的卷积神经网络，根据最终的卷积神经网络对图像进行语义分割，输出语义分割结果；本发明后续的样本图像是由最初的增强样本图像分割而成的，由于其经过多次分割，数量会逐渐庞大，并且先训练后验证，再训练再验证，如此反复得到最终的卷积神经网络，训练数据和验证数据之间相当于存在母体和子体关系，既不会产生因训练数据差异较大导致的精度降低问题，而且还由于训练数据之间的漂移较小，有助于提升精度。

Description

一种基于迭代分割的图像语义分割方法

技术领域

本发明涉及一种基于迭代分割的图像语义分割方法，应用于静态2D图像、视频甚至3D数据、体数据的图像语义分割，属于图像处理技术领域。

背景技术

图像语义分割是从像素水平上，理解、识别图片的内容，其目的是建立每个像素和语义类别之间的一一映射关系，根据语义信息进行分割，其被广泛应用于场景理解、自动驾驶、医学影像分析、机器人视觉等领域。图像语义分割是图像理解的基石，其分割结果的好坏将直接影响对后续图像内容的处理，因此，对图像语义分割技术的研究具有非常重要的现实意义。

现有技术中，利用卷积神经网络进行语义分割是常用的技术手段，而卷积神经网络的建立在整个过程中非常重要。语义分割(应用于静态2D图像、视频甚至3D数据、体数据)是计算机视觉的关键问题之一。在宏观意义上来说，语义分割是为场景理解铺平了道路的一种高层任务。作为计算机视觉的核心问题，场景理解的重要性越来越突出，因为现实中越来越多的应用场景需要从影像中推理出相关的知识或语义(即由具体到抽象的过程)。这些应用包括自动驾驶，人机交互，计算摄影学，图像搜索引擎，增强现实等。应用各种传统的计算机视觉和机器学习技术，这些问题已经得到了解决。虽然这些方法很流行，但深度学习革命让相关领域发生了翻天覆地的变化，因此，包括语义分割在内的许多计算机视觉问题都开始使用深度架构来解决，通常是卷积神经网络CNN，而CNN在准确率甚至效率上都远远超过了传统方法。

但是现有技术训练卷积神经网络的进行图像语义分割的手段较为单一，由于图像样本数据之间关联性不强，漂移量大，导致最终的卷积神经网络进行图像语义分割的精度不高，误差较大。

发明内容

发明目的：针对现有技术中存在的问题与不足，本发明提供一种基于迭代分割的图像语义分割方法。

技术方案：一种基于迭代分割的图像语义分割方法，包括如下内容：

图像预处理，通过图像增强模型对输入的样本图像进行增强，得到增强样本图像，然后对所述增强样本图像进行若干次分割，每次分割后的数量均为前一次分割的倍数，以N₁、N₂，…，N_i表示，其中，N_i代表经过第i-1次分割后的增强样本图像数量；

卷积神经网络的训练，以分割后数量为N₁的增强样本图像作为初始训练样本训练卷积神经网络，以N₂为初始验证样本对卷积神经网络进行验证，对卷积神经网络的参数进行更新，再以N₃对卷积神经网络进行再次训练，以N₄对卷积神经网络进行验证，对卷积神经网络的参数进行更新，如此反复得到最终的卷积神经网络；

根据最终的卷积神经网络对图像进行语义分割，输出语义分割结果。

对样本图像的图像预处理包括图像尺寸变换、图像质量检测和图像颜色校正，其中，所述图像尺寸变换用于改变图像尺寸，将样本图像修改成设定尺寸；所述图像质量检测用于判定图像质量是否满足训练需求，且在图像质量不满足训练需求时重新更换样本图像；所述图像颜色校正用于还原样本图像在标准光源下的真实色彩。

图像质量是否满足训练需求，指的是图像的像素、边缘轮廓模糊等是否满足训练需求。例如在图像的像素较低时，需要重新更换样本图像。

所述图像预处理中，输入的样本图像为图片或视频。

关于增强样本图像分割所得的数量为N₁、N₂，…的增强样本图像，数量为N_i的增强样本图像中，对仅包含背景的增强样本图像进行剔除。

所述卷积神经网络，包括5层卷积层、5层最大池化层和2层全连层。

所述卷积神经网络的训练中，选定其中一个增强样本图像，分别输入至以当前增强样本图像训练所得的当前卷积神经网络模型和前一次卷积神经网络模型中，以两者输出的结果确定损失函数，当损失函数的值超出预设阈值时，更新当前卷积神经网络模型的模型参数。

卷积神经网络的训练中，当选择的增强样本图像数量为多个时，通过加权的方式来确定最终的损失函数。图像中需要标注特征来进行图像分类和识别时，选择样本数量不足且样本识别效率较低，会选择多个增强样本进行训练。

本发明还提供一种计算机设备，包括存储器和处理器，所述存储器中存储有实现基于迭代分割的图像语义分割方法的计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行所述基于迭代分割的图像语义分割方法的步骤。

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有实现基于迭代分割的基于迭代分割的图像语义分割方法的计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行所述语义分割方法的步骤。

有益效果：与现有技术相比，本发明提供的基于迭代分割的图像语义分割方法中，后续的样本图像是由最初的增强样本图像分割而成的，由于其经过多次分割，数量会逐渐庞大，并且先训练后验证，再训练再验证，如此反复得到最终的卷积神经网络，训练数据和验证数据之间相当于存在母体和子体关系，既不会产生因训练数据差异较大导致的精度降低问题，而且还由于训练数据之间的漂移较小，有助于提升精度。

附图说明

图1是本发明实施例方法的流程图；

图2是本发明实施例方法中卷积神经网络模型的示意图。

具体实施方式

下面结合具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

如图1所示，基于迭代分割的图像语义分割方法，包括以下内容：

本实施例中，N₁、N₂，…，N_i所代表的不同数量的增强样本图像是由最初的增强样本图像分割而成的，由于其经过多次分割，数量会逐渐庞大，卷积神经网络在训练时以N₁作为初始训练样本训练卷积神经网络，以N₂为初始验证样本对卷积神经网络进行验证，对卷积神经网络的参数进行更新，再以N₃对卷积神经网络进行再次训练，以N₄对卷积神经网络进行验证，如此反复得到最终的卷积神经网络，N₁和N₂、N₃和N₄之间相当于存在母体和子体关系，既不会产生因训练数据差异较大导致的精度降低问题，而且还由于训练数据之间的漂移较小，有助于提升精度。

本实施例中，所谓图像增强是指有目的地强调图像的整体或局部特性，将原来不清晰的图像变得清晰或强调某些感兴趣的特征，扩大图像中不同物体特征之间的差别，抑制不感兴趣的特征，使之改善图像质量、丰富信息量，加强图像判读和识别效果，满足某些特殊分析的需要。

本实施例的一种情况中，图像增强模型可以依据下述方法进行建立：

对于图像每个颜色通道，根据目标图像中各个像素的颜色通道的灰度值确定出取值不同的第一灰度值和第二灰度值；利用第一灰度值和第二灰度值设置与颜色通道对应的映射函数；利用映射函数对目标图像中各个像素的颜色通道的灰度值进行调整，调整后的目标图像的颜色通道的灰度值的方差大于调整前的目标图像的颜色通道的灰度值的方差；通过对每个颜色通道进行单独处理，生成与每个颜色通道所对应的映射函数，利用该映射函数对目标图像中各个像素的该颜色通道的灰度值进行调整，使得调整后的该颜色通道的灰度值的方差大于调整前的该颜色通道的灰度值的方差，增强了目标图像的对比度，解决了相关技术中图像增强效果差的技术问题，提高了图像增强效果。此处，图像增强模型的建立方法属于现有技术，其已经在CN105957037B一种图像增强方法及装置中公开，本实施例不对其进行具体的叙述。

对样本图像的图像预处理还包括图像尺寸变换、图像质量检测和图像颜色校正。

本实施例中，图像尺寸变换用于改变图像尺寸，具体可以为裁剪、缩放和填充，例如为了便于后续样本图像的分割，将样本图像裁修改成设定尺寸，具体采用裁剪、缩放和填充哪种手段，本实施例不进行具体的限定。

图像质量检测用于判定图像的质量，如像素等是否满足训练需求，例如在图像的像素较低不满足设定值时，需要重新更换样本图像。

图像颜色校正用于还原样本图像在标准光源下的真实色彩，减小拍摄或截取时环境光的不利影响。色彩还原的技术手段可以有多种：如基于线性回归的算法、基于统计学的算法、基于神经网络的图像转换算法；也可以从以上算法中选择一种或多种按一定组合顺序使用，具体方式可以根据实际情况进行设计，本实施例不加以限制。

图像预处理中，输入的样本图像为图片或视频。

样本图像的获取可以为图片形式，也可以从视频中进行截取，在本实施例中不进行具体的限制。

关于增强样本图像分割所得的数量为N₁、N₂，…的增强样本图像，数量为N_i的增强样本图像中，对仅包含背景的增强样本图像进行剔除，由于将样本图像分割成小块后，部分样本图像中可能仅仅包含有背景，虽然背景中也具有像素，但是该像素的对应关系单一，因此，本实施例中对仅包含背景的增强样本图像进行剔除。

如图2所示，卷积神经网络模型包括5层卷积层、5层最大池化层和2层全连层。其依次为：第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第三最大池化层、第四卷积层、第四最大池化层、第五卷积层、第五最大池化层、第一全连层、第二全连层。

卷积层中卷积核的大小为3×3，步长为1。第一层的卷积核数量为64，其余卷积层的卷积核数量为128。最大池化层均采用max-pooling，大小为2×2，每次池化以2为步长，以减少对较低维度的响应，在卷积层和全连接层中都用ReLU来加快收敛速度。

卷积神经网络的训练中，选定其中一个增强样本图像，分别并输入至以当前增强样本图像训练所得的当前卷积神经网络模型和前一次卷积神经网络模型中，以两者输出的结果确定损失函数，当损失函数的值超出预设阈值时，更新当前卷积神经网络模型的模型参数。

假设增强样本图像从数量为N₂的增强样本图像中获取，则以数量为N₂的增强样本图像训练得到的卷积神经网络模型为M₂，前一次所得的卷积神经网络模型为M₁，即数量为N₂的增强样本图像未分割前训练的卷积神经网络模型，将从数量为N₂的增强样本图像中获取的增强样本图像分别输入值卷积神经网络模型M₁和M₂中，分别得到R₁和R₂，根据R₁和R₂的差异，定义损失函数Loss₁，当损失函数的值超出预设阈值时，更新当前卷积神经网络模型的模型参数。由于增强样本图像为多个，当选择确定的增强样本图像数量为多个时，通过加权的方式来确定最终的损失函数。

即Loss＝x₁Loss₁+x₂Loss₂+…+x_nLoss_n，式中x₁，x₂，…，x_n为系数，可以依据经验确定，且x₁，x₂，…，x_n之和为1，Loss₁，Loss₂，...，Loss_n分为每次所得的损失函数。

本发明实施例还提供了一种计算机设备，包括存储器和处理器，存储器中存储有实现基于迭代分割的图像语义分割方法的计算机程序，计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：

本发明实施例还提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时，使得处理器执行以下步骤：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

本发明上述实施例提供了基于迭代分割的图像语义分割方法，并基于该语义分割方法提出了一种计算机设备和计算机可读存储介质，后续的样本图像是由最初的增强样本图像分割而成的，由于其经过多次分割，数量会逐渐庞大，并且先训练后验证，再训练再验证，如此反复得到最终的卷积神经网络，训练数据和验证数据之间相当于存在母体和子体关系，既不会产生因训练数据差异较大导致的精度降低问题，而且还由于训练数据之间的漂移较小，有助于提升精度。

Claims

1.一种基于迭代分割的图像语义分割方法，其特征在于，包括如下内容：

2.根据权利要求1所述的基于迭代分割的图像语义分割方法，其特征在于，对样本图像的图像预处理包括图像尺寸变换、图像质量检测和图像颜色校正，其中，所述图像尺寸变换用于改变图像尺寸，将样本图像修改成设定尺寸；所述图像质量检测用于判定图像质量是否满足训练需求，且在图像质量不满足训练需求时重新更换样本图像；所述图像颜色校正用于还原样本图像在标准光源下的真实色彩。

3.根据权利要求1所述的基于迭代分割的图像语义分割方法，其特征在于，所述图像预处理中，输入的样本图像为图片或视频。

4.根据权利要求1所述的基于迭代分割的图像语义分割方法，其特征在于，关于增强样本图像分割所得的数量为N₁、N₂，…的增强样本图像，数量为N_i的增强样本图像中，对仅包含背景的增强样本图像进行剔除。

5.根据权利要求1所述的基于迭代分割的图像语义分割方法，其特征在于，所述卷积神经网络，包括5层卷积层、5层最大池化层和2层全连层。

6.根据权利要求1所述的基于迭代分割的图像语义分割方法，其特征在于，所述卷积神经网络的训练中，选定其中一个增强样本图像，分别输入至以当前增强样本图像训练所得的当前卷积神经网络模型和前一次卷积神经网络模型中，以两者输出的结果确定损失函数，当损失函数的值超出预设阈值时，更新当前卷积神经网络模型的模型参数。

7.根据权利要求6所述的基于迭代分割的图像语义分割方法，其特征在于，卷积神经网络的训练中，当选择的增强样本图像数量为多个时，通过加权的方式来确定最终的损失函数。

8.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有实现基于迭代分割的图像语义分割方法的计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行所述基于迭代分割的图像语义分割方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有实现基于迭代分割的基于迭代分割的图像语义分割方法的计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行所述语义分割方法的步骤。