CN115908977A

CN115908977A - 一种图像数据标注方法、装置、电子设备及存储介质

Info

Publication number: CN115908977A
Application number: CN202211459061.5A
Authority: CN
Inventors: 郭斌; 李晓波; 祁恒
Original assignee: Beijing Yuanshan Intelligent Technology Co Ltd
Current assignee: Beijing Yuanshan Intelligent Technology Co Ltd
Priority date: 2022-11-17
Filing date: 2022-11-17
Publication date: 2023-04-04

Abstract

本申请涉及图像处理技术领域，具体提供一种图像数据标注方法、装置、电子设备及存储介质，获取无标注图像数据集，并将其划分为训练样本和校验样本，且根据预标注目标对所述训练样本中的图像数据进行标注；先基于训练样本中的标注图像数据对原始标注模型进行训练，生成初版标注模型；再基于校验样本中的未标注图像数据对初版标注模型进行进一步训练，生成终版标注模型，以利用所述终版标注模型对批量待标注图像数据集进行自动标注；其中，基于改进的Yolov5网络结构构建原始标注模型，相比现有技术中，通过人工对图像数据进行标注的方式，准确率和效率都得以提升。

Description

一种图像数据标注方法、装置、电子设备及存储介质

技术领域

本申请涉及图像处理技术领域，具体而言，涉及一种图像数据标注方法、装置、电子设备及存储介质。

背景技术

随着人工智能行业的发展，由此而产生出的数据需求量十分庞大。数据能够助力人工智能发展，同时，AI技术也能够反哺数据行业。并且随着人工智能模型精度不断提升，大规模AI训练及应用成为新趋势，可靠的低成本的数据生产是实现AI高效训练和应用的前提，优质标注数据是支撑AI训练的基础要素。

其中，AI在数据标注领域主要应用于数据采集后的处理环节，在数据采集中无论是图像数据还是语音数据，都会出现重复样本或不合格的样本。而目前，主要是依靠人工进行抽查或是遍历每一个样本进行校验、标注，使得准确率和时效性较低。

发明内容

有鉴于此，本申请的目的在于提供一种图像数据标注方法、装置、电子设备及存储介质，能够用少量样本训练出标注模型，对批量的图像数据集进行自动标注，从而提升图像数据的标注效率和准确率。

本申请实施例提供的一种图像数据标注方法，包括以下步骤：

获取无标注图像数据集；

将所述无标注图像数据集划分为训练样本和校验样本，并且根据预标注目标对所述训练样本中的图像数据进行标注；

先基于所述训练样本中的标注图像数据对原始标注模型进行训练，生成初版标注模型；再基于所述校验样本中的未标注图像数据对所述初版标注模型进行进一步训练，生成终版标注模型；

基于所述终版标注模型对批量待标注图像数据集进行自动标注。

在一些实施例中，按照设定的比例将所述无标注图像数据集划分为训练样本和校验样本，其中，所述训练样本的数据量小于所述校验样本的数据量。

在一些实施例中，基于改进的Yolov5网络结构构建所述原始标注模型；所述改进的Yolov5网络结构包括：

输入端，用于输入图像数据，并对所述图像数据进行Mosaic数据增强、自适应锚框计算、自适应图片缩放；

主干网络层，包括Focus结构和CSP简化结构，用于对所述图像数据进行特征提取；

NECK层，包括FPN结构和PAN结构，用于对所述图像数据提取的特征进行融合；

输出端，包括GIOU_Loss函数，用于通过检测框对所述图像数据中的预标注目标进行标注。

在一些实施例中，所述CSP简化结构包括依次设置于两个CBL组件之间的残差结构、卷积层、归一化层和激活层；所述CBL组件由依次设置的卷积层、归一化层和激活层组成。

在一些实施例中，所述基于所述校验样本中的未标注图像数据对所述初版标注模型进行进一步训练，生成终版标注模型，包括以下步骤：

利用所述初版标注模型对所述校验样本中的未标注图像数进行自动化标注，并获取所述初版标注模型对所述校验样本中未标注图像数据的标注结果；

判断所述标注结果的正确率是否达到设定的阈值，若否，将标注结果正确的图像数据与训练样本合并作为当前训练样本，以及将标注结果错误的图像数据作为当前校验样本；

基于当前待训练样本中的标注图像数据对上一版标注模型进行训练，生成当前版标注模型；

利用所述当前版标注模型对当前校验样本中的图像数据进行重新标注，并获取当前版标注模型对当前校验样本中图像数据的标注结果，直至所述标注结果的正确率达到设定的阈值，将所述当前版标注模型作为终版标注模型。

在一些实施例中，通过如下方式判断所述标注结果的正确率是否达到设定的阈值：

计算当前校验样本中图像数据的第一数据量；

获取当前版标注模型对当前校验样本标注结果正确的图像数据，并计算其第二数据量；

基于所述第一数据量和所述第二数据量得到标注结果的正确率，并将所述标注结果的正确率与设定的阈值进行比较，以判断所述标注结果的正确率是否达到设定的阈值。

在一些实施例中，所述预标注目标为图像数据中的缺陷区域。

本申请实施例提供的一种图像数据标注装置，所述装置包括：

获取模块，用于获取无标注图像数据集；

划分模块，用于将所述无标注图像数据集划分为训练样本和校验样本，并且根据预标注目标对所述训练样本中的图像数据进行标注；

训练模块，用于先基于所述训练样本中的标注图像数据对原始标注模型进行训练，生成初版标注模型；再基于所述校验样本中的未标注图像数据对所述初版标注模型进行进一步训练，生成终版标注模型；

标注模块，用于基于所述终版标注模型对批量待标注图像数据集进行自动标注。

本申请实施例提供的一种电子设备，包括处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行上述任一项所述的图像数据标注方法的步骤。

本申请实施例提供的一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述任一项所述的图像数据标注方法的步骤。

本申请所述的一种图像数据标注方法、装置、电子设备及存储介质，获取无标注图像数据集；并将所述无标注图像数据集划分为训练样本和校验样本，且根据预标注目标对所述训练样本中的图像数据进行标注；先基于所述训练样本中的标注图像数据对原始标注模型进行训练，生成初版标注模型；再基于所述校验样本中的未标注图像数据对所述初版标注模型进行进一步训练，生成终版标注模型，以利用所述终版标注模型对批量待标注图像数据集进行自动标注；相比现有技术中，通过人工对图像数据进行标注的方式，准确率和效率都得以提升。

在某些实施例中，基于改进的Yolov5网络结构构建原始标注模型，尤其是简化CSP结构，进而在保证标注模型检测准确率的前提下，大大缩短对图像数据的检测和标注时间。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例提供的所述图像数据标注方法的流程图；

图2示出了本申请实施例提供的改进的Yolov5网络结构以及CSP简化结构的示意图；

图3示出了本申请实施例提供的现有技术中Yolov5网络结构以及CSP结构的示意图；

图4示出了本申请实施例提供的基于所述校验样本中的未标注图像数据对所述初版标注模型进行进一步训练，生成终版标注模型的流程图；

图5示出了本申请实施例提供的人工标注和基于终版标注模型标注的第一对比示意图；

图6示出了本申请实施例提供的人工标注和基于终版标注模型标注的第二对比示意图；

图7示出了本申请实施例提供的图像数据标注装置的结构框图；

图8示出了本申请实施例提供的电子设备的结构框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和标出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请实施例中将会用到术语“包括”，用于指出其后所声明的特征的存在，但并不排除增加其它的特征。

随着AI智能的发展，采用自学习或神经网络算法能够进行自然图像处理与识别，但是在构建图像识别模块时，需要配置大量的标注图像数据用于模型的训练。而有些训练数据的数据量往往是以万计的，如果采用人工标注的方法，会耗费大量的时间和人力成本。基于此，本申请提出了一种图像数据标注方法、装置、电子设备及存储介质，能够用少量样本训练出标注模型，对批量的图像数据集进行自动标注，从而提升图像数据的标注效率和准确率。

参见说明书附图1，本申请实施例提供一种图像数据标注方法，所述方法包括以下步骤：

S1、获取无标注图像数据集；

步骤S1中，为了更优的训练标注模型，所获取的无标注图像数据集，优选采用的是通过拍照方式实际获取应用场景中的相关图像，而非网上爬取得到的图像数据集。例如，要识别加工的包装盒是否有瑕疵，就需要实际获取在现场环境中拍摄的包装盒图片；要识别X射线图像中的缺陷，就需要实际获取X射线成像仪所拍摄的图像。并且步骤S1中，所获取的无标注图像数据集数据量并不要求太大。在一实施例中，获取的无标注图像为2000张。

S2、将所述无标注图像数据集划分为训练样本和校验样本，并且根据预标注目标对所述训练样本中的图像数据进行标注；

步骤S2中，在获取无标注图像数据集之后，先从该无标注图像数据集中选取部分图片，并按照预标注目标对该部分图片进行标注，且将标注后的该部分图像称之为训练样本，而该无标注图像数据集中剩余的未标注的图片称之为校验样本。其中，所述预标注目标可以是包装盒中的瑕疵区域，也可以是X射线图像中的缺陷区域。

进一步的，为了降低人工标注的劳力，所述划分的训练样本的数据量远小于校验样本的数据量。并且，在步骤S2中，可以按照设定的比例将无标注图像数据集划分为训练样本和校验样本。在一实施例中，从获取的2000张无标注图像中选择5％，由标注工程师进行人工标注，并将标注的100张图像作为训练样本，而剩余的1900张图像作为校验样本，并不进行人工标注。

S3、先基于所述训练样本中的标注图像数据对原始标注模型进行训练，生成初版标注模型；再基于所述校验样本中的未标注图像数据对所述初版标注模型进行进一步训练，生成终版标注模型；

步骤S3中，所述原始标注模型是基于改进的Yolov5网络结构构建，参见说明书附图2，所述改进的Yolov5网络结构包括：输入端，用于输入图像数据，并对所述图像数据进行Mosaic数据增强、自适应锚框计算、自适应图片缩放；主干网络层，包括Focus结构和CSP简化结构，用于对所述图像数据进行特征提取；NECK层，包括FPN结构和PAN结构，用于对所述图像数据提取的特征进行融合；输出端，包括GIOU_Loss函数，用于通过检测框对所述图像数据中的预标注目标进行标注。

其中，参见说明书附图3，在现有的Yolov5网络结构中，主干网络层Backbone、Neck层中，采用借鉴CSPnet设计的CSPX结构，以加强网络特征融合的能力。而在本申请中，针对标注模型本着又快又准的目标，经过不同场景多次试验验证，对Yolov5网络结构中的CSP结构部分进行精简，优化其网络结果，其中，CSP简化结构包括依次设置于两个CBL组件之间的残差结构、卷积层、归一化层和激活层；所述CBL组件由依次设置的卷积层、归一化层和激活层组成，从而保证标注模型检测准确率的前提下，大大缩短对图像数据的检测和标注时间。

参见说明书附图4，在对原始标注模型进行训练，生成初版标注模型之后，再基于所述校验样本中的未标注图像数据对所述初版标注模型进行进一步训练，生成终版标注模型，包括以下步骤：

S301、利用所述初版标注模型对所述校验样本中的未标注图像数进行自动化标注，并获取所述初版标注模型对所述校验样本中未标注图像数据的标注结果；

S302、判断所述标注结果的正确率是否达到设定的阈值，若否，将标注结果正确的图像数据与训练样本合并作为当前训练样本，以及将标注结果错误的图像数据作为当前校验样本；

S303、基于当前待训练样本中的标注图像数据对上一版标注模型进行训练，生成当前版标注模型；

S304、利用所述当前版标注模型对当前校验样本中的图像数据进行重新标注，并获取当前版标注模型对当前校验样本中图像数据的标注结果，直至所述标注结果的正确率达到设定的阈值，将所述当前版标注模型作为终版标注模型。

在一实施例中，利用初版标注模型对1900张图像的校验样本进行自动标注之后，通过筛选能够得出标注结果正确的图像数据1000张和标注错误的图像数据900张，显然的，该初版标注模型自动标注的准确率较低，需要进一步优化；进而将标注结果正确的图像数据1000张和之前训练样本100张合并作为当前训练样本，即1100张标注正确的图像，相比对原始标注模型进行训练生成初版标注模型时所采用的100张图片训练样本，当前训练样本的数据集量大大提升，从而能够进一步优化初版标注模型，以得到下一版标注模型。依此，直至得到的当前版标注模型的准确率达到设定的阈值，将其作为终版标注模型。

可见，虽然通过初版标注模型进行自动标注的准确较低，但是通过初版标注模型就能够得到1000张标注结果正确的图像数据，如果要人工标注该1000张图片，势必会耗费很大劳力和时长，而通过初版标注模型进行自动标注，只需要完成筛选工作即可；并且通过每一次对上一版标注模型的优化，进行自动标注的准确也会越来越高，人工筛选的工作也会越来越小。

在一实施例中，当前版标注模型的标注准确率可以通过以下方式获取：首先计算当前校验样本中图像数据的第一数据量，再计算当前版标注模型对当前校验样本标注结果正确的图像数据的第二数据量，最后基于所述第一数据量和所述第二数据量得到标注结果的正确率，并与设定的阈值进行比较判断是否达标；例如，设定的阈值为98％，输入当前版标注模型的校验样本的数据量为900张，标注正确的图像数据集为800张，则标注结果的正确率为88.88％，未超过设定的阈值为98％，则将标注错误的100张图像作为下一轮校验样本，其余标注正确的1900张图像作为下一轮训练样本，对当前版标注模型继续进行训练、优化，直至标注结果的正确率达到98％将其作为终版标注模型。

S4、基于所述终版标注模型对批量待标注图像数据集进行自动标注。

在得到终版标注模型之后，对批量的大数据量待标注图像数据集进行自动标注，从而保证对图像数据标注结果的正确率下，相比人工标注的方式大大提升标注效率。在一实施例中，参见说明书附图5和说明附图6，为人工标注和基于终版标注模型标注的第一对比示意图和第二对比示意图，在说明书附图5中，左侧为人工标注的包装盒图像中的瑕疵区域，右侧为终版标注模型自动标注的包装盒图像中的瑕疵区域；在说明书附图6中，左侧为人工标注的X射线图像中的缺陷区域，右侧为终版标注模型自动标注的X射线图像中的缺陷区域。可见，两者并不存在误差，反而终版标注模型自动标注的包装盒图像中的瑕疵区域和X射线图像中的缺陷区域更为精细。

本申请提供的一种图像数据标注方法，通过少量的人工标注的图像数据作为训练样本对基于深度学习的改进网络结构Yolov5进行训练，得到终版标注模型，相比现有技术中，通过人工对图像数据进行标注的方式，准确率和效率都得以提升。

基于同一发明构思，本申请实施例中还提供了一种图像数据标注装置，由于本申请实施例中的装置解决问题的原理与本申请实施例上述一种图像数据标注方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

如说明书附图7所示，本申请还提供了一种图像数据标注装置，所述装置包括：

获取模块701，用于获取无标注图像数据集；

划分模块702，用于将所述无标注图像数据集划分为训练样本和校验样本，并且根据预标注目标对所述训练样本中的图像数据进行标注；

训练模块703，用于先基于所述训练样本中的标注图像数据对原始标注模型进行训练，生成初版标注模型；再基于所述校验样本中的未标注图像数据对所述初版标注模型进行进一步训练，生成终版标注模型；

标注模块704，用于基于所述终版标注模型对批量待标注图像数据集进行自动标注。

在一些实施方式中，所述划分模块702按照设定的比例将所述无标注图像数据集划分为训练样本和校验样本，其中，所述训练样本的数据量小于所述校验样本的数据量。

在一些实施方式中，所述训练模块703基于改进的Yolov5网络结构构建所述原始标注模型；所述改进的Yolov5网络结构包括：

输出端，包括GIOU_Loss函数，用于通过检测框对所述图像数据中的预标注目标进行标注；

其中，所述CSP简化结构包括依次设置于两个CBL组件之间的残差结构、卷积层、归一化层和激活层；所述CBL组件由依次设置的卷积层、归一化层和激活层组成。

在一些实施方式中，所述训练模块703基于所述校验样本中的未标注图像数据对所述初版标注模型进行进一步训练，生成终版标注模型，包括：

判断所述标注结果的正确率是否达到设定的阈值，若否，将标注结果正确的图像数据与初始训练样本合并作为当前训练样本，以及将标注结果错误的图像数据作为当前校验样本；

在一些实施方式中，所述训练模块703通过如下方式判断所述标注结果的正确率是否达到设定的阈值：

计算当前校验样本中图像数据的第一数据量；

本申请所提供的一种图像数据标注装置，通过获取模块获取无标注图像数据集；通过划分模块将所述无标注图像数据集划分为训练样本和校验样本，且根据预标注目标对所述训练样本中的图像数据进行标注；通过训练模块先基于所述训练样本中的标注图像数据对原始标注模型进行训练，生成初版标注模型；再基于所述校验样本中的未标注图像数据对所述初版标注模型进行进一步训练，生成终版标注模型，通过标注模块利用所述终版标注模型对批量待标注图像数据集进行自动标注；相比现有技术中，通过人工对图像数据进行标注的方式，准确率和效率都得以提升。

基于本发明的同一构思，说明书附图8所示，本申请实施例提供的一种电子设备800的结构，该电子设备800包括：至少一个处理器801，至少一个网络接口804或者其他用户接口803，存储器805，至少一个通信总线802。通信总线802用于实现这些组件之间的连接通信。该电子设备800可选的包含用户接口803，包括显示器(例如，触摸屏、LCD、CRT、全息成像(Holographic)或者投影(Projector)等)，键盘或者点击设备(例如，鼠标，轨迹球(trackball)，触感板或者触摸屏等)。

存储器805可以包括只读存储器和随机存取存储器，并向处理器801提供指令和数据。存储器805的一部分还可以包括非易失性随机存取存储器(NVRAM)。

在一些实施方式中，存储器805存储了如下的元素，可保护模块或者数据结构，或者他们的子集，或者他们的扩展集：

操作系统8051，包含各种系统程序，用于实现各种基础业务以及处理基于硬件的任务；

应用程序模块8052，包含各种应用程序，例如桌面(launcher)、媒体播放器(MediaPlayer)、浏览器(Browser)等，用于实现各种应用业务。

在本申请实施例中，通过调用存储器805存储的程序或指令，处理器801用于执行如一种图像数据标注方法中的步骤，能够用少量样本训练出标注模型，对批量的图像数据集进行自动标注，从而提升图像数据的标注效率和准确率。

本申请还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如图像数据标注方法中的步骤。

具体地，该存储介质能够为通用的存储介质，如移动磁盘、硬盘等，该存储介质上的计算机程序被运行时，能够执行上述图像数据标注方法。

在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请提供的实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种图像数据标注方法，其特征在于，所述方法包括以下步骤：

获取无标注图像数据集；

2.根据权利要求1所述一种图像数据标注方法，其特征在于，按照设定的比例将所述无标注图像数据集划分为训练样本和校验样本，其中，所述训练样本的数据量小于所述校验样本的数据量。

3.根据权利要求2所述一种图像数据标注方法，其特征在于，基于改进的Yolov5网络结构构建所述原始标注模型；所述改进的Yolov5网络结构包括：

4.根据权利要求3所述一种图像数据标注方法，其特征在于，所述CSP简化结构包括依次设置于两个CBL组件之间的残差结构、卷积层、归一化层和激活层；所述CBL组件由依次设置的卷积层、归一化层和激活层组成。

5.根据权利要求4所述一种图像数据标注方法，其特征在于，所述基于所述校验样本中的未标注图像数据对所述初版标注模型进行进一步训练，生成终版标注模型，包括以下步骤：

6.根据权利要求5所述一种图像数据标注方法，其特征在于，通过如下方式判断所述标注结果的正确率是否达到设定的阈值：

计算当前校验样本中图像数据的第一数据量；

7.根据权利要求1所述一种图像数据标注方法，其特征在于，所述预标注目标为图像数据中的缺陷区域。

8.一种图像数据标注装置，其特征在于，所述装置包括：

获取模块，用于获取无标注图像数据集；

9.一种电子设备，其特征在于，包括处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行权利要求1至7任一项所述的图像数据标注方法的步骤。

10.一种计算机可读存储介质，其特征在于：该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行权利要求1至7任一项所述的图像数据标注方法的步骤。