CN109145918B - 图像分割标注方法及设备 - Google Patents

图像分割标注方法及设备 Download PDF

Info

Publication number
CN109145918B
CN109145918B CN201810943160.8A CN201810943160A CN109145918B CN 109145918 B CN109145918 B CN 109145918B CN 201810943160 A CN201810943160 A CN 201810943160A CN 109145918 B CN109145918 B CN 109145918B
Authority
CN
China
Prior art keywords
neural network
network model
image data
variation
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810943160.8A
Other languages
English (en)
Other versions
CN109145918A (zh
Inventor
卢策吾
马家旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Flexiv Robotics Ltd
Original Assignee
Flexiv Robotics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Flexiv Robotics Ltd filed Critical Flexiv Robotics Ltd
Priority to CN201810943160.8A priority Critical patent/CN109145918B/zh
Publication of CN109145918A publication Critical patent/CN109145918A/zh
Application granted granted Critical
Publication of CN109145918B publication Critical patent/CN109145918B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明的目的是提供一种图像分割标注方法及设备,通过将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集,实现只选择少量的具有代表性的数据进行标注,目标在于从根本上减少人工标注数据量,即使在处理与训练数据差别较大的数据时,也只需要少量标注。本发明的针对神经网络模型的迭代训练方法,可以最有效的增加训练数据集的信息量,从而减少需要标注的数据量。

Description

图像分割标注方法及设备
技术领域
本发明涉及计算机领域,尤其涉及一种图像分割标注方法及设备。
背景技术
图像分割指的是将数字图像细分为多个图像子区域(像素的集合)的过程。更精确的,图像分割是对图像中的每个像素加标签的一个过程,这一过程使得具有相同标签的像素具有某种共同视觉特性。
深度学习方法是一种基于神经网络模型的机器学习方法,全监督的深度学习方法在图像分割领域有着出色的效果,其模型的训练过程中需要大量的人工标注数据,这些标注的数据对深度学习方法的表现有着十分重要的作用,但是标注数据需要大量的人力和时间。
目前减少标注量方法是利用半监督或者无监督的算法对图像数据直接进行深度学习,这种方法一般只适用于比较简单的标注,对图像分割这种复杂的标注效果比较差。
现有技术仍然是在全监督深度学习方法的框架下,因此仍然需要大量的训练数据,而且在处理与训练数据差别较大的数据时,需要重新标注所有数据,重新训练模型,仍然需要很多时间和人力,很难达到通用的水平。
发明内容
本发明的一个目的是提供一种图像分割标注方法及设备。
根据本发明的一个方面,提供了一种图像分割标注方法,该方法包括:
步骤S1,初始化数据池、训练数据集和初代的神经网络模型,并通过初代的神经网络模型,得到所述数据池中和训练数据集中的每张图像数据对应的多边形的图片分割标注结果;
步骤S2,在上一代的神经网络模型的基础上,利用所述训练数据集中的图像数据对上一代神经网络进行优化训练,得到新一代的神经网络模型;
步骤S3,通过新一代的神经网络模型,得到所述训练数据集中的每张图像数据对应的多边形的图片分割标注结果,并进行记录,将通过新一代的神经网络模型得到的训练数据集中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量,将所述第一变化量作相对于所述训练数据集中的图像数据的数量的平均,得到平均变化量A;
步骤S4,通过新一代的神经网络模型,得到所述数据池中的每张图像数据对应的多边形的图片分割标注结果,并记录下来,将通过新一代的神经网络模型得到的数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第二变化量B;
步骤S5,判断是否有大于所述平均变化量A的超过预设阈值的所述第二变化量B,若是,进入步骤S6,若否,进入步骤S7;
步骤S6,将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集后,重新进入步骤S2;
步骤S7,结束训练过程,得到最终的神经网络模型。
进一步的,上述方法中,步骤S1中,初始化数据池、训练数据集,包括:
从全部图像数据中随机选择一部分图像数据作为初始的训练数据集,将所述全部图像数据中剩下的图像数据放入入数据池作为初始的数据池。
进一步的,上述方法中,所述神经网络模型包括Polygon-RNN模型或Deep ExtremeCut模型。
进一步的,上述方法中,步骤S1或步骤S3或步骤S4中,通过初代的或新一代的神经网络模型,得到所述数据池中或训练数据集中的每张图像数据对应的多边形的图片分割标注结果,包括:
步骤S11,从所述数据池或训练数据集中获取图像数据;
步骤S12,利用当前代的神经网络模型提取得到从所述数据池中获取到的每张图像数据的各种层次的特征信息;
步骤S13,基于所述特征信息,并通过当前代的神经网络模型,得到图像分割结果或者多边形的图片分割标注结果,其中,若得到的是所述图像分割结果,将所述图像分割结果转化成多边形的图片分割标注结果。
进一步的,上述方法中,所述特征信息反映每张图像数据在空间上的分布情况、色彩变化情况以及纹理信息。
进一步的,上述方法中,步骤S13中的,将所述图像分割结果转化成多边形的图片分割标注结果,包括:
步骤S131,根据所述图像分割结果进行优化调整,得到比较平滑完整的子区域;
步骤S132,获得每个子区域的边缘信息;
步骤S133,基于每个子区域的边缘信息,对每个子区域的边缘用多边形在满足预设精度内进行拟合,将拟合得到的多边形作为所述多边形的图片分割标注结果。
进一步的,上述方法中,步骤S3或步骤S4中,将通过新一代的神经网络模型得到的训练数据集或数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中或数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量或第二变化量B,包括:
步骤S31/步骤S41,获取通过新一代的神经网络模型得到的训练数据集中或数据池中的图像数据多边形的图片分割标注结果,作为后一代的多边形的图片分割标注结果;及获取通过上一代的神经网络模型得到的训练数据集中或数据池中的图像数据的多边形的图片分割标注结果,作为前一代的多边形的图片分割标注结果;
步骤S32/步骤S42,使所述后一代的多边形的图片分割标注结果保持不变,在所述前一代的多边形的图片分割标注结果中找到一个最长的与后一代的多边形的图片分割标注结果中的多边形顺序相同的点序列组成一个新的多边形,记录所述组成一个新的多边形的过程中的变化的点数目;
步骤S33/步骤S43,通过移动点和添加点,把新的多边形转化为所述后一代的多边形的图片分割标注结果,记录转化过程中的变化的点的数目;
步骤S34/步骤S44,将所述组成一个新的多边形的过程中的变化的点数目与转化过程中的变化的点的数目相加求和,作为所述第一变化量或第二变化量B。
根据本发明的另一面,还提供一种基于计算的设备,其中,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
步骤S1,初始化数据池、训练数据集和初代的神经网络模型,并通过初代的神经网络模型,得到所述数据池中和训练数据集中的每张图像数据对应的多边形的图片分割标注结果;
步骤S2,在上一代的神经网络模型的基础上,利用所述训练数据集中的图像数据对上一代神经网络进行优化训练,得到新一代的神经网络模型;
步骤S3,通过新一代的神经网络模型,得到所述训练数据集中的每张图像数据对应的多边形的图片分割标注结果,并进行记录,将通过新一代的神经网络模型得到的训练数据集中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量,将所述第一变化量作相对于所述训练数据集中的图像数据的数量的平均,得到平均变化量A;
步骤S4,通过新一代的神经网络模型,得到所述数据池中的每张图像数据对应的多边形的图片分割标注结果,并记录下来,将通过新一代的神经网络模型得到的数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第二变化量B;
步骤S5,判断是否有大于所述平均变化量A的超过预设阈值的所述第二变化量B,若是,进入步骤S6,若否,进入步骤S7;
步骤S6,将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集后,重新进入步骤S2;
步骤S7,结束训练过程,得到最终的神经网络模型。
根据本发明的另一面,还提供一种计算机可读存储介质,其上存储有计算机可执行指令,其中,该计算机可执行指令被处理器执行时使得该处理器:
步骤S1,初始化数据池、训练数据集和初代的神经网络模型,并通过初代的神经网络模型,得到所述数据池中和训练数据集中的每张图像数据对应的多边形的图片分割标注结果;
步骤S2,在上一代的神经网络模型的基础上,利用所述训练数据集中的图像数据对上一代神经网络进行优化训练,得到新一代的神经网络模型;
步骤S3,通过新一代的神经网络模型,得到所述训练数据集中的每张图像数据对应的多边形的图片分割标注结果,并进行记录,将通过新一代的神经网络模型得到的训练数据集中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量,将所述第一变化量作相对于所述训练数据集中的图像数据的数量的平均,得到平均变化量A;
步骤S4,通过新一代的神经网络模型,得到所述数据池中的每张图像数据对应的多边形的图片分割标注结果,并记录下来,将通过新一代的神经网络模型得到的数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第二变化量B;
步骤S5,判断是否有大于所述平均变化量A的超过预设阈值的所述第二变化量B,若是,进入步骤S6,若否,进入步骤S7;
步骤S6,将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集后,重新进入步骤S2;
步骤S7,结束训练过程,得到最终的神经网络模型。
与现有技术相比,在利用深度学习方法对图像进行分割的过程中,需要大量的人工标注数据用来进行神经网络模型的训练,本申请提供了一种新的针对神经网络模型的迭代训练方法,本发明通过将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集,实现只选择少量的具有代表性的数据进行标注,目标在于从根本上减少人工标注数据量,即使在处理与训练数据差别较大的数据时,也只需要少量标注。另外,本发明的针对神经网络模型的迭代训练方法,可以最有效的增加训练数据集的信息量,从而减少需要标注的数据
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出本发明一实施例的图像分割标注方法的流程图;
图2示出本发明一实施例的获得标注结果的流程图;
图3示出本发明一实施例的比较算法的示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
如图1所示,本发明提供一种图像分割标注方法,所述方法包括:
步骤S1,初始化数据池、训练数据集和初代的神经网络模型,并通过初代的神经网络模型,得到所述数据池中和训练数据集中的每张图像数据对应的多边形的图片分割标注结果;
在一实施例中,可以从全部图像数据中随机选择一部分图像数据作为初始的训练数据集,将所述全部图像数据中剩下的图像数据放入入数据池作为初始的数据池,所述神经网络模型可以选择适用于图像分割问题的任何神经网络模型,比如Polygon-RNN模型或Deep Extreme Cut模型;
步骤S2,利用训练数据集训练下一代的神经网络模型,即所述神经网络模型的代数加一:
在上一代的神经网络模型的基础上,利用所述训练数据集中的图像数据对上一代神经网络进行优化训练,得到新一代的神经网络模型;
步骤S3,记录训练数据集中数据的标注结果,与上一代得到的标注结果量化比较,得到平均变化量A:
通过新一代的神经网络模型,得到所述训练数据集中的每张图像数据对应的多边形的图片分割标注结果,并进行记录,将通过新一代的神经网络模型得到的训练数据集中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量,将所述第一变化量作相对于所述训练数据集中的图像数据的数量的平均,得到平均变化量A;
步骤S4,记录数据池中的数据的标注结果,与上一代得到的标注结果量化比较:
通过新一代的神经网络模型,得到所述数据池中的每张图像数据对应的多边形的图片分割标注结果,并记录下来,将通过新一代的神经网络模型得到的数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第二变化量B;
步骤S5,判断是否有明显变化量明显大于A的数据:
判断是否有大于所述平均变化量A的超过预设阈值的所述第二变化量B,若是,进入步骤S6,若不是,进入步骤S7;
步骤S6,将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集后,重新进入步骤S2;
在此,可以从数据池中挑出明显小于A的图像数据,这些图像数据被认为对模型的改变不敏感且没有被训练过,因此将其加入训练数据集;同样的,从数据池中挑出明显大于A的图像数据,这些数据被认为对模型的改变敏感,已经不再进一步训练,因此将其从数据池中剔除;
步骤S7,结束迭代过程,得到最终模型:
结束整个迭代训练的过程,得到最终的神经网络模型。
在此,在利用深度学习方法对图像进行分割的过程中,需要大量的人工标注数据用来进行神经网络模型的训练,本申请提供了一种新的针对神经网络模型的迭代训练方法,本发明通过将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集,实现只选择少量的具有代表性的数据进行标注,目标在于从根本上减少人工标注数据量,即使在处理与训练数据差别较大的数据时,也只需要少量标注。另外,本发明的针对神经网络模型的迭代训练方法,可以最有效的增加训练数据集的信息量,从而减少需要标注的数据。
本发明的图像分割标注方法一实施例中,获得标注结果的过程如图2所示。步骤S1或步骤S3或步骤S4中,通过初代的或新一代的神经网络模型,得到所述数据池中或训练数据集中的每张图像数据对应的多边形的图片分割标注结果,包括:
步骤S11,首先从所述数据池或训练数据集中获取图像数据;
步骤S12,其次利用当前代的神经网络模型提取得到从所述数据池中获取到的每张图像数据的各种层次的特征信息,所述特征信息反映每张图像数据在空间上的分布情况,色彩变化情况以及纹理信息等等;
步骤S13,最后基于所述特征信息,并通过当前代的神经网络模型,得到图像分割结果或者多边形的图片分割标注结果,其中,若得到的是所述图像分割结果,还需要将所述图像分割结果转化成多边形的图片分割标注结果。
本发明的图像分割标注方法一实施例中,步骤S13中的,将所述图像分割结果转化成多边形的图片分割标注结果的转化的步骤如下:
步骤S131,首先根据所述图像分割结果进行优化调整,得到比较平滑完整的子区域;
步骤S132,然后获得每个子区域的边缘信息;
步骤S133,其次基于每个子区域的边缘信息,对每个子区域的边缘用多边形在满足预设精度内进行拟合,将拟合得到的多边形作为所述多边形的图片分割标注结果。
本发明的图像分割标注方法一实施例中,具体的比较算法如图3所示,步骤S3或步骤S4中,将通过新一代的神经网络模型得到的训练数据集或数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中或数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量或第二变化量B,包括:
步骤S31/步骤S41,获取前后两代多边形的图像分割标注结果:
获取通过新一代的神经网络模型得到的训练数据集中或数据池中的图像数据多边形的图片分割标注结果,作为后一代的多边形的图片分割标注结果;及获取通过上一代的神经网络模型得到的训练数据集中或数据池中的图像数据的多边形的图片分割标注结果,作为前一代的多边形的图片分割标注结果;
步骤S32/步骤S42,其次使所述后一代的多边形的图片分割标注结果保持不变(即:固定后一代标注结果),在所述前一代的多边形的图片分割标注结果中找到一个最长的与后一代的多边形的图片分割标注结果中的多边形顺序相同的点序列组成一个新的多边形,记录所述组成一个新的多边形的过程中的变化的点数目;
步骤S33/步骤S43,然后通过移动点和添加点,把新的多边形转化为所述后一代的多边形的图片分割标注结果,记录转化过程中的变化的点的数目;
步骤S34/步骤S44,最后,将所述组成一个新的多边形的过程中的变化的点数目与转化过程中的变化的点的数目相加求和,作为所述第一变化量或第二变化量B。
根据本发明的另一面,还提供一种基于计算的设备,其中,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
步骤S1,初始化数据池、训练数据集和初代的神经网络模型,并通过初代的神经网络模型,得到所述数据池中和训练数据集中的每张图像数据对应的多边形的图片分割标注结果;
步骤S2,在上一代的神经网络模型的基础上,利用所述训练数据集中的图像数据对上一代神经网络进行优化训练,得到新一代的神经网络模型;
步骤S3,通过新一代的神经网络模型,得到所述训练数据集中的每张图像数据对应的多边形的图片分割标注结果,并进行记录,将通过新一代的神经网络模型得到的训练数据集中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量,将所述第一变化量作相对于所述训练数据集中的图像数据的数量的平均,得到平均变化量A;
步骤S4,通过新一代的神经网络模型,得到所述数据池中的每张图像数据对应的多边形的图片分割标注结果,并记录下来,将通过新一代的神经网络模型得到的数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第二变化量B;
步骤S5,判断是否有大于所述平均变化量A的超过预设阈值的所述第二变化量B,若是,进入步骤S6,若否,进入步骤S7;
步骤S6,将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集后,重新进入步骤S2;
步骤S7,结束训练过程,得到最终的神经网络模型。
根据本发明的另一面,还提供一种计算机可读存储介质,其上存储有计算机可执行指令,其中,该计算机可执行指令被处理器执行时使得该处理器:
步骤S1,初始化数据池、训练数据集和初代的神经网络模型,并通过初代的神经网络模型,得到所述数据池中和训练数据集中的每张图像数据对应的多边形的图片分割标注结果;
步骤S2,在上一代的神经网络模型的基础上,利用所述训练数据集中的图像数据对上一代神经网络进行优化训练,得到新一代的神经网络模型;
步骤S3,通过新一代的神经网络模型,得到所述训练数据集中的每张图像数据对应的多边形的图片分割标注结果,并进行记录,将通过新一代的神经网络模型得到的训练数据集中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量,将所述第一变化量作相对于所述训练数据集中的图像数据的数量的平均,得到平均变化量A;
步骤S4,通过新一代的神经网络模型,得到所述数据池中的每张图像数据对应的多边形的图片分割标注结果,并记录下来,将通过新一代的神经网络模型得到的数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第二变化量B;
步骤S5,判断是否有大于所述平均变化量A的超过预设阈值的所述第二变化量B,若是,进入步骤S6,若否,进入步骤S7;
步骤S6,将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集后,重新进入步骤S2;
步骤S7,结束训练过程,得到最终的神经网络模型。
上述设备和计算机可读存储介质各实施例的详细内容,具体可参见各方法实施例的对应部分,在此,不再赘述。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (9)

1.一种图像分割标注方法,其中,该方法包括:
步骤S1,初始化数据池、训练数据集和初代的神经网络模型,并通过初代的神经网络模型,得到所述数据池中和训练数据集中的每张图像数据对应的多边形的图片分割标注结果;
步骤S2,在上一代的神经网络模型的基础上,利用所述训练数据集中的图像数据对上一代神经网络进行优化训练,得到新一代的神经网络模型;
步骤S3,通过新一代的神经网络模型,得到所述训练数据集中的每张图像数据对应的多边形的图片分割标注结果,并进行记录,将通过新一代的神经网络模型得到的训练数据集中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量,将所述第一变化量作相对于所述训练数据集中的图像数据的数量的平均,得到平均变化量A;
步骤S4,通过新一代的神经网络模型,得到所述数据池中的每张图像数据对应的多边形的图片分割标注结果,并记录下来,将通过新一代的神经网络模型得到的数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第二变化量B;
步骤S5,判断是否有大于所述平均变化量A的超过预设阈值的所述第二变化量B,若是,进入步骤S6,若否,进入步骤S7;
步骤S6,将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集后,重新进入步骤S2;
步骤S7,结束训练过程,得到最终的神经网络模型。
2.根据权利要求1所述的方法,其中,步骤S1中,初始化数据池、训练数据集,包括:
从全部图像数据中随机选择一部分图像数据作为初始的训练数据集,将所述全部图像数据中剩下的图像数据放入入数据池作为初始的数据池。
3.根据权利要求1所述的方法,其中,所述神经网络模型包括Polygon-RNN模型或DeepExtreme Cut模型。
4.根据权利要求1所述的方法,其中,步骤S1或步骤S3或步骤S4中,通过初代的或新一代的神经网络模型,得到所述数据池中或训练数据集中的每张图像数据对应的多边形的图片分割标注结果,包括:
步骤S11,从所述数据池或训练数据集中获取图像数据;
步骤S12,利用当前代的神经网络模型提取得到从所述数据池中获取到的每张图像数据的各种层次的特征信息;
步骤S13,基于所述特征信息,并通过当前代的神经网络模型,得到图像分割结果或者多边形的图片分割标注结果,其中,若得到的是所述图像分割结果,将所述图像分割结果转化成多边形的图片分割标注结果。
5.根据权利要求4所述的方法,其中,所述特征信息反映每张图像数据在空间上的分布情况、色彩变化情况以及纹理信息。
6.根据权利要求4所述的方法,其中,步骤S13中的,将所述图像分割结果转化成多边形的图片分割标注结果,包括:
步骤S131,根据所述图像分割结果进行优化调整,得到比较平滑完整的子区域;
步骤S132,获得每个子区域的边缘信息;
步骤S133,基于每个子区域的边缘信息,对每个子区域的边缘用多边形在满足预设精度内进行拟合,将拟合得到的多边形作为所述多边形的图片分割标注结果。
7.根据权利要求1至6任一项所述的方法,其中,步骤S3或步骤S4中,将通过新一代的神经网络模型得到的训练数据集或数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中或数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量或第二变化量B,包括:
步骤S31/步骤S41,获取通过新一代的神经网络模型得到的训练数据集中或数据池中的图像数据多边形的图片分割标注结果,作为后一代的多边形的图片分割标注结果;及获取通过上一代的神经网络模型得到的训练数据集中或数据池中的图像数据的多边形的图片分割标注结果,作为前一代的多边形的图片分割标注结果;
步骤S32/步骤S42,使所述后一代的多边形的图片分割标注结果保持不变,在所述前一代的多边形的图片分割标注结果中找到一个最长的与后一代的多边形的图片分割标注结果中的多边形顺序相同的点序列组成一个新的多边形,记录所述组成一个新的多边形的过程中的变化的点数目;
步骤S33/步骤S43,通过移动点和添加点,把新的多边形转化为所述后一代的多边形的图片分割标注结果,记录转化过程中的变化的点的数目;
步骤S34/步骤S44,将所述组成一个新的多边形的过程中的变化的点数目与转化过程中的变化的点的数目相加求和,作为所述第一变化量或第二变化量B。
8.一种基于计算的设备,其中,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
步骤S1,初始化数据池、训练数据集和初代的神经网络模型,并通过初代的神经网络模型,得到所述数据池中和训练数据集中的每张图像数据对应的多边形的图片分割标注结果;
步骤S2,在上一代的神经网络模型的基础上,利用所述训练数据集中的图像数据对上一代神经网络进行优化训练,得到新一代的神经网络模型;
步骤S3,通过新一代的神经网络模型,得到所述训练数据集中的每张图像数据对应的多边形的图片分割标注结果,并进行记录,将通过新一代的神经网络模型得到的训练数据集中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量,将所述第一变化量作相对于所述训练数据集中的图像数据的数量的平均,得到平均变化量A;
步骤S4,通过新一代的神经网络模型,得到所述数据池中的每张图像数据对应的多边形的图片分割标注结果,并记录下来,将通过新一代的神经网络模型得到的数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第二变化量B;
步骤S5,判断是否有大于所述平均变化量A的超过预设阈值的所述第二变化量B,若是,进入步骤S6,若否,进入步骤S7;
步骤S6,将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集后,重新进入步骤S2;
步骤S7,结束训练过程,得到最终的神经网络模型。
9.一种计算机可读存储介质,其上存储有计算机可执行指令,其中,该计算机可执行指令被处理器执行时使得该处理器:
步骤S1,初始化数据池、训练数据集和初代的神经网络模型,并通过初代的神经网络模型,得到所述数据池中和训练数据集中的每张图像数据对应的多边形的图片分割标注结果;
步骤S2,在上一代的神经网络模型的基础上,利用所述训练数据集中的图像数据对上一代神经网络进行优化训练,得到新一代的神经网络模型;
步骤S3,通过新一代的神经网络模型,得到所述训练数据集中的每张图像数据对应的多边形的图片分割标注结果,并进行记录,将通过新一代的神经网络模型得到的训练数据集中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的训练数据集中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第一变化量,将所述第一变化量作相对于所述训练数据集中的图像数据的数量的平均,得到平均变化量A;
步骤S4,通过新一代的神经网络模型,得到所述数据池中的每张图像数据对应的多边形的图片分割标注结果,并记录下来,将通过新一代的神经网络模型得到的数据池中的图像数据多边形的图片分割标注结果与通过上一代的神经网络模型得到的数据池中的图像数据的多边形的图片分割标注结果,通过预设的比较算法进行量化比较,得到第二变化量B;
步骤S5,判断是否有大于所述平均变化量A的超过预设阈值的所述第二变化量B,若是,进入步骤S6,若否,进入步骤S7;
步骤S6,将大于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据从所述数据池中剔除,将小于所述平均变化量A的超过预设阈值的所述第二变化量B对应的图像数据加入训练数据集后,重新进入步骤S2;
步骤S7,结束训练过程,得到最终的神经网络模型。
CN201810943160.8A 2018-08-17 2018-08-17 图像分割标注方法及设备 Active CN109145918B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810943160.8A CN109145918B (zh) 2018-08-17 2018-08-17 图像分割标注方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810943160.8A CN109145918B (zh) 2018-08-17 2018-08-17 图像分割标注方法及设备

Publications (2)

Publication Number Publication Date
CN109145918A CN109145918A (zh) 2019-01-04
CN109145918B true CN109145918B (zh) 2021-09-10

Family

ID=64789940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810943160.8A Active CN109145918B (zh) 2018-08-17 2018-08-17 图像分割标注方法及设备

Country Status (1)

Country Link
CN (1) CN109145918B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674669B (zh) * 2019-03-12 2021-09-03 浙江大学 一种复杂背景下的特定圆识别方法
CN110060247B (zh) * 2019-04-18 2022-11-25 深圳市深视创新科技有限公司 应对样本标注错误的鲁棒深度神经网络学习方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104318242A (zh) * 2014-10-08 2015-01-28 中国人民解放军空军工程大学 一种高效的svm主动半监督学习算法
CN106803256A (zh) * 2017-01-13 2017-06-06 深圳市唯特视科技有限公司 一种基于投影卷积网络的三维形状分割及语义标记方法
CN108052937A (zh) * 2017-12-28 2018-05-18 百度在线网络技术(北京)有限公司 基于弱监督的字符检测器训练方法、装置、系统及介质
WO2018139468A1 (ja) * 2017-01-25 2018-08-02 HoloEyes株式会社 医療情報仮想現実サーバシステム、医療情報仮想現実プログラム、医療情報仮想現実システム、医療情報仮想現実用データの作成方法、および医療情報仮想現実用データ

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100254607A1 (en) * 2009-04-02 2010-10-07 Kamal Patel System and method for image mapping and integration
TWI797699B (zh) * 2015-12-22 2023-04-01 以色列商應用材料以色列公司 半導體試樣的基於深度學習之檢查的方法及其系統

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104318242A (zh) * 2014-10-08 2015-01-28 中国人民解放军空军工程大学 一种高效的svm主动半监督学习算法
CN106803256A (zh) * 2017-01-13 2017-06-06 深圳市唯特视科技有限公司 一种基于投影卷积网络的三维形状分割及语义标记方法
WO2018139468A1 (ja) * 2017-01-25 2018-08-02 HoloEyes株式会社 医療情報仮想現実サーバシステム、医療情報仮想現実プログラム、医療情報仮想現実システム、医療情報仮想現実用データの作成方法、および医療情報仮想現実用データ
CN108052937A (zh) * 2017-12-28 2018-05-18 百度在线网络技术(北京)有限公司 基于弱监督的字符检测器训练方法、装置、系统及介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ByLabel:A Boundary Based Semi-Automatic Image Annotation Tool;Xuebin Qin 等;《2018 IEEE Winter Conference on Applications of Computer》;20180507;第1804-1813页 *
Efficient Interactive Annotation of Segmentation Datasets with Polygon-RNN++;David Acuna 等;《2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition》;20180623;第859-868页 *
Video object segmentation via global consistency aware query strategy;Bing Luo 等;《IEEE Transactions on Multimedia》;20170217;第19卷(第7期);第1-12页 *
基于Voronoi K阶邻近图的半监督学习自动图像标注;吴寿昆 等;《计算机应用与软件》;20161231;第33卷(第12期);第183-187、242页 *

Also Published As

Publication number Publication date
CN109145918A (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
Köhler et al. Mask-specific inpainting with deep neural networks
US9852353B2 (en) Structure aware image denoising and noise variance estimation
US10169549B2 (en) Digital image processing including refinement layer, search context data, or DRM
EP2899671A1 (en) Identification method and device for target object in image
US20180286023A1 (en) Digital Image Processing through use of an Image Repository
US9025889B2 (en) Method, apparatus and computer program product for providing pattern detection with unknown noise levels
JP2006260401A (ja) 画像処理装置、方法、およびプログラム
US9122960B2 (en) Patch size adaptation for image enhancement
CN114998595B (zh) 弱监督语义分割方法、语义分割方法及可读存储介质
JP2013016168A (ja) 画像におけるテキスト領域を位置決めする方法及び装置
CN109145918B (zh) 图像分割标注方法及设备
CN114241388A (zh) 基于时空记忆信息的视频实例分割方法和分割装置
CN110363837B (zh) 游戏中纹理图像的处理方法及装置、电子设备、存储介质
CN114155285B (zh) 基于灰度直方图的图像配准方法
CN114596440A (zh) 语义分割模型的生成方法、装置、电子设备及存储介质
Frantc et al. Machine learning approach for objective inpainting quality assessment
US20140072234A1 (en) Method and apparatus for estimating position of head, computer readable storage medium thereof
CN113516697A (zh) 图像配准的方法、装置、电子设备及计算机可读存储介质
CN116152079A (zh) 图像处理方法及图像处理模型训练方法
CN113807354B (zh) 图像语义分割方法、装置、设备和存储介质
US8526724B2 (en) In-image accessibility indication
CN114463764A (zh) 表格线检测方法、装置、计算机设备和存储介质
CN114648751A (zh) 一种处理视频字幕的方法、装置、终端及存储介质
CN112861874A (zh) 一种基于多滤波器去噪结果的专家场去噪方法及系统
CN112183563A (zh) 一种图像识别模型的生成方法、存储介质及应用服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant