CN109492686A

CN109492686A - 一种图片标注方法与系统

Info

Publication number: CN109492686A
Application number: CN201811293215.1A
Authority: CN
Inventors: 谢迎; 张清
Original assignee: Zhengzhou Yunhai Information Technology Co Ltd
Current assignee: Zhengzhou Yunhai Information Technology Co Ltd
Priority date: 2018-11-01
Filing date: 2018-11-01
Publication date: 2019-03-19

Abstract

本发明公开了一种图片标注方法与系统包括：获取与数据标注任务相对应的数据集和标注规则；从数据集中载入并显示数据图片；根据标注规则使用标注模型标注或人工标注数据图片获得标注数据，并按需迭代更新标注模型；保存标注数据。本发明能够针对不同数据图片或不同类型的数据图片自动进行逐像素标注，使得多边形标注规则可以自动执行，进而提高图片标注的精确性和效率，解放人工。

Description

一种图片标注方法与系统

技术领域

本发明涉及计算机领域，更具体地，特别是指一种图片标注方法与系统。

背景技术

近年来随着图像处理与计算机视觉领域相关技术的快速发展，多媒体信息已成为了人们日常生活中不可分割的一部分。比如数码相机中的笑脸快门、应用于安全领域的目标跟踪与人脸识别等等，这些都是依靠计算机视觉领域的相关算法实现的。

随着计算机视觉技术的发展，其对多媒体数据的需求也越来越大，同时也促进了图像标注技术的发展。为了能够满足计算机视觉、图像检索和其他相关热点领域的图像标注需求，申请人提出了开发适用于不同研究领域的图像标注工具以满足用户对于多个应用领域的图像标注需求。

目前计算机视觉领域不乏标注工具，虽然这些标注工具在一定程度上提高了目标识别、分类和目标跟踪领域图像标注的精确性和效率，但是功能相对单一，可标注样本数据有限，因为使用监督学习算法前期需要大量的已标注样本进行训练，这意味着受限于样本数量以及算法，模型可检测和分割类别较少，缺乏普适性，难以满足用户对于多个应用领域的图像标注需求。除此之外，标注工具在标注不同类型样本时，标注精度浮动较大，直接导致图像检测和分割领域标注图像噪声较高，进而影响了用户任务的快速执行。

当前常见的标注工具其核心算法大多依赖于OpenCV算法库，采用矩形框对数据图像进行标注，其中部分支持矩形框倾斜，最后将图像标注信息输出到xml文件、VOC数据格式或者PASCAL等数据标注格式。

目前的图像标注工具只能适用于目标检测、定位等仅需矩形框定位的方法，在深度学习技术中，通过人工矩形框的标注格式对模型进行练，最终将训练完成的模型对待测试图像进行推理，输出结果也为矩形框的形式锁定目标。

另外的标注方法还有通过多边形圈定目标的方法，通过多次点击鼠标左键，选择目标边缘点，点与点之间通过线段连接，最后构成围绕目标的多边形。这种方法在矩形框标注方法的基础上功能添加了多边形标注功能，而对于图像分割逐像素点标注的要求，目前的标注方法无法提供自动标注方案。

针对现有技术中多边形标注规则不能兼容对各类别标签自动进行逐像素标注的问题，目前尚未有有效的解决方案。

发明内容

有鉴于此，本发明实施例的目的在于提出一种图片标注方法与系统，能够针对不同数据图片或不同类型的数据图片自动进行逐像素标注，使得多边形标注规则可以自动执行，进而提高图片标注的精确性和效率，解放人工。

基于上述目的，本发明的一方面提供了一种图片标注方法，包括以下步骤：

获取与数据标注任务相对应的数据集和标注规则；

从数据集中载入并显示数据图片；

根据标注规则使用标注模型标注或人工标注数据图片获得标注数据，并按需迭代更新标注模型；

保存标注数据。

在一些实施方式中，根据标注规则使用标注模型标注或人工标注数据图片获得标注数据，包括以下步骤：

使用主动学习算法判断标注模型能否正确标注数据图片；

当标注模型能正确标注数据图片时，直接使用标注模型标注数据图片，获得标注数据；

当标注模型不能正确标注数据图片时，人工标注数据图片，获得标注数据。

在一些实施方式中，按需迭代更新所述标注模型包括：当人工标注数据图片时，使用由人工标注的标注数据迭代更新标注模型。

在一些实施方式中，直接使用标注模型标注数据图片获得标注数据，包括以下步骤：

使用ResNext对数据图片进行分类；

使用Yolo v2对数据图片进行检测；

使用Grab Cut对数据图片进行分割；

将分类、检测、分割的结果相叠加，生成标注数据。

在一些实施方式中，使用ResNext对数据图片进行分类包括：

进入图像分类模式，读取数据图片；

使用在图像网络数据集上已完成训练的神经网络模型ResNext直接对数据图片进行推理分类。

在一些实施方式中，使用Yolo v2对数据图片进行检测包括：

进入目标检测模式，读取数据图片；

确定待检测目标；

使用在图像网络数据集上已完成训练的神经网络模型Yolo v3直接对数据图片进行目标检测，并根据所选待检测目标进行反馈。

在一些实施方式中，使用Grab Cut对数据图片进行分割包括：

进入目标分割模式，读取数据图片；

待分割区域内点击确定保留区域或删除区域；

使用Grab Cut模型检测点击位置像素点的颜色，当点击位置像素点的颜色不是边界颜色和填充颜色时，使用填充颜色填充点击位置像素点；

将点击位置像素点的相邻像素点作为点击位置像素点重复进行上一步骤，直到检测区域边界范围内的所有像素都被Grab Cut模型处理过；

根据处理结果分割数据图片。

在一些实施方式中，使用由人工标注的标注数据迭代更新标注模型，包括以下步骤：

读取数据图片；

直接使用标注模型标注数据图片获得模拟标注数据；

使用QBC算法在模拟标注数据中确定差异最大的待校正标注数据；

使用由人工标注的标注数据校正待校正标注数据；

使用待校正标注数据迭代更新标注模型。

在一些实施方式中，使用由人工标注的标注数据迭代更新标注模型，还包括以下步骤：

设定迭代终止条件；

当满足迭代终止条件时，停止迭代更新标注模型。

本发明实施例的另一方面，还提供了一种图片标注系统，包括：

获取模块，用于获取与数据标注任务相对应的数据集和标注规则；

载入模块，用于从数据集中载入并显示图片；

标注与迭代模块，用于根据标注规则使用标注模型标注或人工标注数据图片获得标注数据，并按需迭代更新标注模型；和

保存模块，用于保存标注数据。

本发明具有以下有益技术效果：本发明实施例提供的图片标注方法与系统，通过获取与数据标注任务相对应的数据集和标注规则，从数据集中载入并显示数据图片，根据标注规则使用标注模型标注或人工标注数据图片获得标注数据，并按需迭代更新标注模型，和保存标注数据的技术方案，能够针对不同数据图片或不同类型的数据图片自动进行逐像素标注，使得多边形标注规则可以自动执行，进而提高图片标注的精确性和效率，解放人工。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的实施例。

图1为本发明提供的图片标注方法的流程示意图；

图2为本发明提供的图片标注方法的详细流程图；

图3为本发明提供的使用ResNext网络进行图像分类的示意图；

图4为本发明提供的使用Yolo v3网络进行目标检测的示意图；

图5为本发明提供的使用Grab Cut进行图像分割的示意图；

图6为本发明提供的主动学习算法的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明实施例进一步详细说明。需要说明的是，本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量，可见“第一”“第二”仅为了表述的方便，不应理解为对本发明实施例的限定，后续实施例对此不再一一说明。

基于上述目的，本发明实施例的第一个方面，提出了一种能够针对不同数据图片或不同类型的数据图片自动进行逐像素标注的方法的实施例。图1示出的是本发明提供的图片标注方法的实施例的流程示意图。

所述图片标注方法，如图1所示，包括以下步骤：

步骤S101，获取与数据标注任务相对应的数据集和标注规则；

步骤S103，从数据集中载入并显示数据图片；

步骤S105，根据标注规则使用标注模型标注或人工标注数据图片获得标注数据，并按需迭代更新标注模型；

步骤S107，保存标注数据。

使用主动学习算法判断标注模型能否正确标注数据图片；

使用ResNext对数据图片进行分类；

使用Yolo v2对数据图片进行检测；

使用Grab Cut对数据图片进行分割；

将分类、检测、分割的结果相叠加，生成标注数据。

在一些实施方式中，使用ResNext对数据图片进行分类包括：

进入图像分类模式，读取数据图片；

在一些实施方式中，使用Yolo v2对数据图片进行检测包括：

进入目标检测模式，读取数据图片；

确定待检测目标；

在一些实施方式中，使用Grab Cut对数据图片进行分割包括：

进入目标分割模式，读取数据图片；

待分割区域内点击确定保留区域或删除区域；

根据处理结果分割数据图片。

读取数据图片；

直接使用标注模型标注数据图片获得模拟标注数据；

使用由人工标注的标注数据校正待校正标注数据；

使用待校正标注数据迭代更新标注模型。

设定迭代终止条件；

当满足迭代终止条件时，停止迭代更新标注模型。

下面如图2所示根据具体实施例进一步描述本发明的实施方式。

获取与数据标注任务对应的数据集；载入用户选择图像数据集；获取与数据标注任务相对应的标注规则；使用ResNext网络进行图像分类；使用Yolo v3进行目标检测；使用Grab Cut进行图像分割；模型支持用户使用个人数据采用active learning方式完成对模型的重新训练；对标注数据类别标签进行保存，存储到json格式。由此在数字图像分割标注过程中，简化标注方式，提高标注效率。

获取与数据标注任务对应的数据集可以包含多种数字图像格式。在本实施例中可以展示用户操作方法及效果的动图或者视频教程。在第一次使用时对用户进行指引，有效帮助用户使用和正确的标注图像。

在图像显示区域显示用户选择图片时，数据集将按照数据名称形成队列。在本实施例中可以添加图片翻页功能，上下页选取的规则可以按照该步骤的队列顺序。

获取与数据标注任务相对应的标注规则，在进行图像标注时，用户可以选择对于图像使用的具体标注方法，包含分类、检测和分割。

图3为使用ResNext网络进行图像分类的示意图。如图3所示，使用ResNext模型进行分类的基本思想是ResNext结构采用VGG堆叠的思想以提高可扩展性，在不增加参数复杂度的前提下提高准确率，同时还减少了超参数的数量，在标注的同时节约计算资源。具体来说包括：

当识别到用户点击分类按钮时，进入图像分类模式；

输入待分类文件所在目录；

模型ResNext为在ImageNet数据集上已完成训练的神经网络模型，输入数据将由网络直接进行推理分类。

图4为使用Yolo v3网络进行目标检测的示意图。如图4所示，使用Yolo v3模型进行目标检测的基本思想是快速检测，并且对于图像中距离很近的目标或者小目标有很好的鲁棒性。具体来说包括：

当识别到用户点击检测按钮时，进入目标检测模式；

输入待检测文件所在目录；

选择待检测目标；

模型Yolo v3为在ImageNet数据集上已完成训练的神经网络模型，输入数据将由网络直接进行目标检测，依据所选检测目标进行对应输出

图5为使用Grab Cut进行图像分割的示意图。如图5所示，使用Grab Cut模型进行分割的基本思想利用了图像中的纹理(颜色)信息和边界(反差)信息，只要少量的用户交互操作即可得到比较好的分割结果。如果前景和背景之间的颜色反差不大，分割的效果不好；不过，这种情况下允许手工标记一些前景或背景区域，这样能得到较好的结果。具体来说包括：

当识别到用户点击分割按钮时，进入目标分割模式；

输入待分割文件所在目录；

用户在图像待分割区域内中点击，左键选择待保留区域，右键选择待删除区域；

模型将根据标记位置标记(x,y)的像素点，检测该点的颜色，若他与边界色和填充色均不同，就用填充色填充该点，否则不填充；

检测相邻位置，继续c,这个过程延续到已经检测区域边界范围内的所有像素为止；

经过若干次迭代，最终完成分割并保存。

图6为主动学习算法的示意图。用户如果需要进一步提高标注结果精度，可使用个人数据对分类网络模型或者目标检测网络模型如图6所示地进行再次训练。具体来说包括：

用户选择自主训练模型时，手动输入未标注图像路径，设置终止条件迭代次数；

将未标注数据放到预训练的网络ResNext中测试一遍，得到预测值，然后使用QBC算法，在未标注样本中选出分歧最大的样本，用户对于所选出样本进行标注。

用这些新标注的带有标签的样本训练深度网络；

将剩余没有标签的图像用深度网络测试，得到预测值，之后选出分歧最大的样本，再次进行标注；

刚刚进行标注的样本和上一次进行标注的样本组成新的训练集，继续用它们来训练深度网络；

重复上述步骤直到达到分类或检测精度满足要求为止。

最后对数据标注信息进行保存，存储为json格式。

从上述实施例可以看出，本发明实施例提供的图片标注方法，通过获取与数据标注任务相对应的数据集和标注规则，从数据集中载入并显示数据图片，根据标注规则使用标注模型标注或人工标注数据图片获得标注数据，并按需迭代更新标注模型，和保存标注数据的技术方案，能够针对不同数据图片或不同类型的数据图片自动进行逐像素标注，使得多边形标注规则可以自动执行，进而提高图片标注的精确性和效率，解放人工。

需要特别指出的是，上述图片标注方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减，因此，这些合理的排列组合变换之于图片标注方法也应当属于本发明的保护范围，并且不应将本发明的保护范围局限在所述实施例之上。

基于上述目的，本发明实施例的第二个方面，提出了一种图片标注系统的一个实施例。所述图片标注系统包括：

载入模块，用于从数据集中载入并显示图片；

保存模块，用于保存标注数据。

本发明实施例公开所述的装置、设备等可为各种电子终端设备，例如手机、个人数字助理(PDA)、平板电脑(PAD)、智能电视等，也可以是大型终端设备，如服务器等，因此本发明实施例公开的保护范围不应限定为某种特定类型的装置、设备。本发明实施例公开所述的客户端可以是以电子硬件、计算机软件或两者的组合形式应用于上述任意一种电子终端设备中。

结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里所述功能的下列部件来实现或执行：通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器，但是可替换地，处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合，例如，DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP和/或任何其它这种配置。

从上述实施例可以看出，本发明实施例提供的图片标注系统，通过获取与数据标注任务相对应的数据集和标注规则，从数据集中载入并显示数据图片，根据标注规则使用标注模型标注或人工标注数据图片获得标注数据，并按需迭代更新标注模型，和保存标注数据的技术方案，能够针对不同数据图片或不同类型的数据图片自动进行逐像素标注，使得多边形标注规则可以自动执行，进而提高图片标注的精确性和效率，解放人工。

基于上述目的，本发明实施例的第三个方面，提出了一种计算机的一个实施例。计算机包括输入部分、输出部分、通信总线、CPU、存储部分以及驱动器。

输入部分可以包括具有触控功能的显示屏，以及键盘、鼠标，用于输入待标注图像，以及用户标记操作。输出部分可以是显示屏，用于显示标注后数字图像。通信总线主要用于各模块间通信，包括SPI通信总线、I2C通信总线。CPU为中央处理器，用于核心算法程序运行与逻辑处理，对输入图像数据以及用户输入操作进行识别，根据程序逻辑算法进行相关运算，完成对输入图像的标准功能，并将处理后图像传输至存储模块进行存储，通过通信总线发送至输出部门进行显示。存储部分指磁盘存储器，用来对标注后的数字图像进行存储。驱动器用来提供底层驱动功能，保障上层应用程序的顺利运行。

以上是本发明公开的示例性实施例，但是应当注意，在不背离权利要求限定的本发明实施例公开的范围的前提下，可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外，尽管本发明实施例公开的元素可以以个体形式描述或要求，但除非明确限制为单数，也可以理解为多个。

应当理解的是，在本文中使用的，除非上下文清楚地支持例外情况，单数形式“一个”旨在也包括复数形式。还应当理解的是，在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。上述本发明实施例公开实施例序号仅仅为了描述，不代表实施例的优劣。

所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子；在本发明实施例的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，并存在如上所述的本发明实施例的不同方面的许多其它变化，为了简明它们没有在细节中提供。因此，凡在本发明实施例的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本发明实施例的保护范围之内。

Claims

1.一种图片标注方法，其特征在于，包括以下步骤：

获取与数据标注任务相对应的数据集和标注规则；

从所述数据集中载入并显示数据图片；

根据所述标注规则使用标注模型标注或人工标注所述数据图片获得标注数据，并按需迭代更新所述标注模型；

保存所述标注数据。

2.根据权利要求1所述的方法，其特征在于，根据所述标注规则使用所述标注模型标注或人工标注所述数据图片获得所述标注数据，包括以下步骤：

使用主动学习算法判断所述标注模型能否正确标注所述数据图片；

当所述标注模型能正确标注所述数据图片时，直接使用所述标注模型标注所述数据图片，获得所述标注数据；

当所述标注模型不能正确标注所述数据图片时，人工标注所述数据图片，获得所述标注数据。

3.根据权利要求2所述的方法，其特征在于，按需迭代更新所述标注模型包括：当人工标注所述数据图片时，使用由人工标注的所述标注数据迭代更新所述标注模型。

4.根据权利要求1所述的方法，其特征在于，直接使用所述标注模型标注所述数据图片获得所述标注数据，包括以下步骤：

使用ResNext对所述数据图片进行分类；

使用Yolo v2对所述数据图片进行检测；

使用Grab Cut对所述数据图片进行分割；

将分类、检测、分割的结果相叠加，生成所述标注数据。

5.根据权利要求4所述的方法，其特征在于，使用ResNext对所述数据图片进行分类包括：

进入图像分类模式，读取所述数据图片；

使用在图像网络数据集上已完成训练的神经网络模型ResNext直接对所述数据图片进行推理分类。

6.根据权利要求4所述的方法，其特征在于，使用Yolo v2对所述数据图片进行检测包括：

进入目标检测模式，读取所述数据图片；

确定待检测目标；

使用在图像网络数据集上已完成训练的神经网络模型Yolo v3直接对所述数据图片进行目标检测，并根据所选待检测目标进行反馈。

7.根据权利要求4所述的方法，其特征在于，使用Grab Cut对所述数据图片进行分割包括：

进入目标分割模式，读取所述数据图片；

待分割区域内点击确定保留区域或删除区域；

使用Grab Cut模型检测点击位置像素点的颜色，当所述点击位置像素点的颜色不是边界颜色和填充颜色时，使用填充颜色填充所述点击位置像素点；

将所述点击位置像素点的相邻像素点作为所述点击位置像素点重复进行上一步骤，直到检测区域边界范围内的所有像素都被Grab Cut模型处理过；

根据处理结果分割所述数据图片。

8.根据权利要求3所述的方法，其特征在于，使用由人工标注的所述标注数据迭代更新所述标注模型，包括以下步骤：

读取所述数据图片；

直接使用所述标注模型标注所述数据图片获得模拟标注数据；

使用QBC算法在所述模拟标注数据中确定差异最大的待校正标注数据；

使用由人工标注的所述标注数据校正所述待校正标注数据；

使用所述待校正标注数据迭代更新所述标注模型。

9.根据权利要求8所述的方法，其特征在于，使用由人工标注的所述标注数据迭代更新所述标注模型，还包括以下步骤：

设定迭代终止条件；

当满足迭代终止条件时，停止迭代更新所述标注模型。

10.一种图片标注系统，其特征在于，包括：

载入模块，用于从所述数据集中载入并显示图片；

标注与迭代模块，用于根据所述标注规则使用标注模型标注或人工标注所述数据图片获得标注数据，并按需迭代更新所述标注模型；和

保存模块，用于保存所述标注数据。