CN109145918B

CN109145918B - 图像分割标注方法及设备

Info

Publication number: CN109145918B
Application number: CN201810943160.8A
Authority: CN
Inventors: 卢策吾; 马家旭
Original assignee: Flexiv Robotics Ltd
Current assignee: Flexiv Robotics Ltd
Priority date: 2018-08-17
Filing date: 2018-08-17
Publication date: 2021-09-10
Anticipated expiration: 2038-08-17
Also published as: CN109145918A

Abstract

本发明的目的是提供一种图像分割标注方法及设备，通过将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除，将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集，实现只选择少量的具有代表性的数据进行标注，目标在于从根本上减少人工标注数据量，即使在处理与训练数据差别较大的数据时，也只需要少量标注。本发明的针对神经网络模型的迭代训练方法，可以最有效的增加训练数据集的信息量，从而减少需要标注的数据量。

Description

图像分割标注方法及设备

技术领域

本发明涉及计算机领域，尤其涉及一种图像分割标注方法及设备。

背景技术

图像分割指的是将数字图像细分为多个图像子区域(像素的集合)的过程。更精确的，图像分割是对图像中的每个像素加标签的一个过程，这一过程使得具有相同标签的像素具有某种共同视觉特性。

深度学习方法是一种基于神经网络模型的机器学习方法，全监督的深度学习方法在图像分割领域有着出色的效果，其模型的训练过程中需要大量的人工标注数据，这些标注的数据对深度学习方法的表现有着十分重要的作用，但是标注数据需要大量的人力和时间。

目前减少标注量方法是利用半监督或者无监督的算法对图像数据直接进行深度学习，这种方法一般只适用于比较简单的标注，对图像分割这种复杂的标注效果比较差。

现有技术仍然是在全监督深度学习方法的框架下，因此仍然需要大量的训练数据，而且在处理与训练数据差别较大的数据时，需要重新标注所有数据，重新训练模型，仍然需要很多时间和人力，很难达到通用的水平。

发明内容

本发明的一个目的是提供一种图像分割标注方法及设备。

根据本发明的一个方面，提供了一种图像分割标注方法，该方法包括：

步骤S1，初始化数据池、训练数据集和初代的神经网络模型，并通过初代的神经网络模型，得到所述数据池中和训练数据集中的每张图像数据对应的多边形的图片分割标注结果；

步骤S2，在上一代的神经网络模型的基础上，利用所述训练数据集中的图像数据对上一代神经网络进行优化训练，得到新一代的神经网络模型；

步骤S3，通过新一代的神经网络模型，得到所述训练数据集中的每张图像数据对应的多边形的图片分割标注结果，并进行记录，将通过新一代的神经网络模型得到的训练数据集中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中的图像数据的多边形的图片分割标注结果，通过预设的比较算法进行量化比较，得到第一变化量，将所述第一变化量作相对于所述训练数据集中的图像数据的数量的平均，得到平均变化量A；

步骤S4，通过新一代的神经网络模型，得到所述数据池中的每张图像数据对应的多边形的图片分割标注结果，并记录下来，将通过新一代的神经网络模型得到的数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的数据池中的图像数据的多边形的图片分割标注结果，通过预设的比较算法进行量化比较，得到第二变化量B；

步骤S5，判断是否有大于所述平均变化量A的超过预设阈值的所述第二变化量B，若是，进入步骤S6，若否，进入步骤S7；

步骤S6，将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除，将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集后，重新进入步骤S2；

步骤S7，结束训练过程，得到最终的神经网络模型。

进一步的，上述方法中，步骤S1中，初始化数据池、训练数据集，包括：

从全部图像数据中随机选择一部分图像数据作为初始的训练数据集，将所述全部图像数据中剩下的图像数据放入入数据池作为初始的数据池。

进一步的，上述方法中，所述神经网络模型包括Polygon-RNN模型或Deep ExtremeCut模型。

进一步的，上述方法中，步骤S1或步骤S3或步骤S4中，通过初代的或新一代的神经网络模型，得到所述数据池中或训练数据集中的每张图像数据对应的多边形的图片分割标注结果，包括：

步骤S11，从所述数据池或训练数据集中获取图像数据；

步骤S12，利用当前代的神经网络模型提取得到从所述数据池中获取到的每张图像数据的各种层次的特征信息；

步骤S13，基于所述特征信息，并通过当前代的神经网络模型，得到图像分割结果或者多边形的图片分割标注结果，其中，若得到的是所述图像分割结果，将所述图像分割结果转化成多边形的图片分割标注结果。

进一步的，上述方法中，所述特征信息反映每张图像数据在空间上的分布情况、色彩变化情况以及纹理信息。

进一步的，上述方法中，步骤S13中的，将所述图像分割结果转化成多边形的图片分割标注结果，包括：

步骤S131，根据所述图像分割结果进行优化调整，得到比较平滑完整的子区域；

步骤S132，获得每个子区域的边缘信息；

步骤S133，基于每个子区域的边缘信息，对每个子区域的边缘用多边形在满足预设精度内进行拟合，将拟合得到的多边形作为所述多边形的图片分割标注结果。

进一步的，上述方法中，步骤S3或步骤S4中，将通过新一代的神经网络模型得到的训练数据集或数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中或数据池中的图像数据的多边形的图片分割标注结果，通过预设的比较算法进行量化比较，得到第一变化量或第二变化量B，包括：

步骤S31/步骤S41，获取通过新一代的神经网络模型得到的训练数据集中或数据池中的图像数据多边形的图片分割标注结果，作为后一代的多边形的图片分割标注结果；及获取通过上一代的神经网络模型得到的训练数据集中或数据池中的图像数据的多边形的图片分割标注结果，作为前一代的多边形的图片分割标注结果；

步骤S32/步骤S42，使所述后一代的多边形的图片分割标注结果保持不变，在所述前一代的多边形的图片分割标注结果中找到一个最长的与后一代的多边形的图片分割标注结果中的多边形顺序相同的点序列组成一个新的多边形，记录所述组成一个新的多边形的过程中的变化的点数目；

步骤S33/步骤S43，通过移动点和添加点，把新的多边形转化为所述后一代的多边形的图片分割标注结果，记录转化过程中的变化的点的数目；

步骤S34/步骤S44，将所述组成一个新的多边形的过程中的变化的点数目与转化过程中的变化的点的数目相加求和，作为所述第一变化量或第二变化量B。

根据本发明的另一面，还提供一种基于计算的设备，其中，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器：

步骤S7，结束训练过程，得到最终的神经网络模型。

根据本发明的另一面，还提供一种计算机可读存储介质，其上存储有计算机可执行指令，其中，该计算机可执行指令被处理器执行时使得该处理器：

步骤S7，结束训练过程，得到最终的神经网络模型。

与现有技术相比，在利用深度学习方法对图像进行分割的过程中，需要大量的人工标注数据用来进行神经网络模型的训练，本申请提供了一种新的针对神经网络模型的迭代训练方法，本发明通过将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除，将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集，实现只选择少量的具有代表性的数据进行标注，目标在于从根本上减少人工标注数据量，即使在处理与训练数据差别较大的数据时，也只需要少量标注。另外，本发明的针对神经网络模型的迭代训练方法，可以最有效的增加训练数据集的信息量，从而减少需要标注的数据

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1示出本发明一实施例的图像分割标注方法的流程图；

图2示出本发明一实施例的获得标注结果的流程图；

图3示出本发明一实施例的比较算法的示意图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

在本申请一个典型的配置中，终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

如图1所示，本发明提供一种图像分割标注方法，所述方法包括：

在一实施例中，可以从全部图像数据中随机选择一部分图像数据作为初始的训练数据集，将所述全部图像数据中剩下的图像数据放入入数据池作为初始的数据池，所述神经网络模型可以选择适用于图像分割问题的任何神经网络模型，比如Polygon-RNN模型或Deep Extreme Cut模型；

步骤S2，利用训练数据集训练下一代的神经网络模型，即所述神经网络模型的代数加一：

在上一代的神经网络模型的基础上，利用所述训练数据集中的图像数据对上一代神经网络进行优化训练，得到新一代的神经网络模型；

步骤S3，记录训练数据集中数据的标注结果，与上一代得到的标注结果量化比较，得到平均变化量A：

通过新一代的神经网络模型，得到所述训练数据集中的每张图像数据对应的多边形的图片分割标注结果，并进行记录，将通过新一代的神经网络模型得到的训练数据集中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中的图像数据的多边形的图片分割标注结果，通过预设的比较算法进行量化比较，得到第一变化量，将所述第一变化量作相对于所述训练数据集中的图像数据的数量的平均，得到平均变化量A；

步骤S4，记录数据池中的数据的标注结果，与上一代得到的标注结果量化比较：

通过新一代的神经网络模型，得到所述数据池中的每张图像数据对应的多边形的图片分割标注结果，并记录下来，将通过新一代的神经网络模型得到的数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的数据池中的图像数据的多边形的图片分割标注结果，通过预设的比较算法进行量化比较，得到第二变化量B；

步骤S5，判断是否有明显变化量明显大于A的数据：

判断是否有大于所述平均变化量A的超过预设阈值的所述第二变化量B，若是，进入步骤S6，若不是，进入步骤S7；

在此，可以从数据池中挑出明显小于A的图像数据，这些图像数据被认为对模型的改变不敏感且没有被训练过，因此将其加入训练数据集；同样的，从数据池中挑出明显大于A的图像数据，这些数据被认为对模型的改变敏感，已经不再进一步训练，因此将其从数据池中剔除；

步骤S7，结束迭代过程，得到最终模型：

结束整个迭代训练的过程，得到最终的神经网络模型。

在此，在利用深度学习方法对图像进行分割的过程中，需要大量的人工标注数据用来进行神经网络模型的训练，本申请提供了一种新的针对神经网络模型的迭代训练方法，本发明通过将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除，将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集，实现只选择少量的具有代表性的数据进行标注，目标在于从根本上减少人工标注数据量，即使在处理与训练数据差别较大的数据时，也只需要少量标注。另外，本发明的针对神经网络模型的迭代训练方法，可以最有效的增加训练数据集的信息量，从而减少需要标注的数据。

本发明的图像分割标注方法一实施例中，获得标注结果的过程如图2所示。步骤S1或步骤S3或步骤S4中，通过初代的或新一代的神经网络模型，得到所述数据池中或训练数据集中的每张图像数据对应的多边形的图片分割标注结果，包括：

步骤S11，首先从所述数据池或训练数据集中获取图像数据；

步骤S12，其次利用当前代的神经网络模型提取得到从所述数据池中获取到的每张图像数据的各种层次的特征信息，所述特征信息反映每张图像数据在空间上的分布情况，色彩变化情况以及纹理信息等等；

步骤S13，最后基于所述特征信息，并通过当前代的神经网络模型，得到图像分割结果或者多边形的图片分割标注结果，其中，若得到的是所述图像分割结果，还需要将所述图像分割结果转化成多边形的图片分割标注结果。

本发明的图像分割标注方法一实施例中，步骤S13中的，将所述图像分割结果转化成多边形的图片分割标注结果的转化的步骤如下：

步骤S131，首先根据所述图像分割结果进行优化调整，得到比较平滑完整的子区域；

步骤S132，然后获得每个子区域的边缘信息；

步骤S133，其次基于每个子区域的边缘信息，对每个子区域的边缘用多边形在满足预设精度内进行拟合，将拟合得到的多边形作为所述多边形的图片分割标注结果。

本发明的图像分割标注方法一实施例中，具体的比较算法如图3所示，步骤S3或步骤S4中，将通过新一代的神经网络模型得到的训练数据集或数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中或数据池中的图像数据的多边形的图片分割标注结果，通过预设的比较算法进行量化比较，得到第一变化量或第二变化量B，包括：

步骤S31/步骤S41，获取前后两代多边形的图像分割标注结果:

获取通过新一代的神经网络模型得到的训练数据集中或数据池中的图像数据多边形的图片分割标注结果，作为后一代的多边形的图片分割标注结果；及获取通过上一代的神经网络模型得到的训练数据集中或数据池中的图像数据的多边形的图片分割标注结果，作为前一代的多边形的图片分割标注结果；

步骤S32/步骤S42，其次使所述后一代的多边形的图片分割标注结果保持不变(即：固定后一代标注结果)，在所述前一代的多边形的图片分割标注结果中找到一个最长的与后一代的多边形的图片分割标注结果中的多边形顺序相同的点序列组成一个新的多边形，记录所述组成一个新的多边形的过程中的变化的点数目；

步骤S33/步骤S43，然后通过移动点和添加点，把新的多边形转化为所述后一代的多边形的图片分割标注结果，记录转化过程中的变化的点的数目；

步骤S34/步骤S44，最后，将所述组成一个新的多边形的过程中的变化的点数目与转化过程中的变化的点的数目相加求和，作为所述第一变化量或第二变化量B。

处理器；以及

步骤S7，结束训练过程，得到最终的神经网络模型。

上述设备和计算机可读存储介质各实施例的详细内容，具体可参见各方法实施例的对应部分，在此，不再赘述。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

需要注意的是，本发明可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中，本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本发明的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

另外，本发明的一部分可被应用为计算机程序产品，例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令，可能被存储在固定的或可移动的记录介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输，和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此，根据本发明的一个实施例包括一个装置，该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种图像分割标注方法，其中，该方法包括：

步骤S7，结束训练过程，得到最终的神经网络模型。

2.根据权利要求1所述的方法，其中，步骤S1中，初始化数据池、训练数据集，包括：

3.根据权利要求1所述的方法，其中，所述神经网络模型包括Polygon-RNN模型或DeepExtreme Cut模型。

4.根据权利要求1所述的方法，其中，步骤S1或步骤S3或步骤S4中，通过初代的或新一代的神经网络模型，得到所述数据池中或训练数据集中的每张图像数据对应的多边形的图片分割标注结果，包括：

步骤S11，从所述数据池或训练数据集中获取图像数据；

5.根据权利要求4所述的方法，其中，所述特征信息反映每张图像数据在空间上的分布情况、色彩变化情况以及纹理信息。

6.根据权利要求4所述的方法，其中，步骤S13中的，将所述图像分割结果转化成多边形的图片分割标注结果，包括：

步骤S132，获得每个子区域的边缘信息；

7.根据权利要求1至6任一项所述的方法，其中，步骤S3或步骤S4中，将通过新一代的神经网络模型得到的训练数据集或数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中或数据池中的图像数据的多边形的图片分割标注结果，通过预设的比较算法进行量化比较，得到第一变化量或第二变化量B，包括：

8.一种基于计算的设备，其中，包括：

处理器；以及

步骤S7，结束训练过程，得到最终的神经网络模型。

9.一种计算机可读存储介质，其上存储有计算机可执行指令，其中，该计算机可执行指令被处理器执行时使得该处理器：

步骤S7，结束训练过程，得到最终的神经网络模型。