CN115984796A

CN115984796A - 一种图像标注方法及系统

Info

Publication number: CN115984796A
Application number: CN202211739952.6A
Authority: CN
Inventors: 周风明; 郝江波; 邹元杰; 聂杰
Original assignee: Wuhan Kotei Informatics Co Ltd
Current assignee: Wuhan Kotei Informatics Co Ltd
Priority date: 2022-12-31
Filing date: 2022-12-31
Publication date: 2023-04-18

Abstract

本发明提供一种图像标注方法及系统，基于目标检测模型对当前帧待标注图片进行识别，获取至少一个目标物标注框信息；基于上一帧目标物标注框信息，确定当前目标物标注框；基于实例分割、目标轮廓识别获取目标物轮廓、外接矩形、前景矩形以及角点检测，并基于角点与外接矩形下边线的距离调整目标物的外接矩形，精确获取目标物的标注框。本发明针对预标注精度较低，所提出方法结合目标检测、实例分割、轮廓识别等技术并利用了上一帧图像标注信息，实现对标注框与目标物的精准贴合，尤其是大幅提升了车辆与地面接触位置标注的准确率，减少了人工标注时间。

Description

一种图像标注方法及系统

技术领域

本发明涉及图像标注领域，更具体地，涉及一种图像标注方法及系统。

背景技术

随着自动驾驶技术的发展，深度学习在自动驾驶技术链起着越来越重要的作用，由于大多数深度学习技术依赖海量图像标注数据进行训练，对图像的标注主要依靠人工完成，效率较为低下。目标检测任务为自动驾驶感知环节的重要任务之一，目前越来越多半自动标注工具和技术开始应用于目标检测的标注任务，图像半自动标注多是先利用目标检测模型对待标注图像进行预标注，再人工对预标注结果进行调整，由于模型所输出的预标注结果精度不理想，尤其是车辆与地面的接触位置往往存在较大的误差，需要大量的人工调整。

发明内容

本发明针对现有技术中存在的技术问题，提供一种图像标注方法及系统。

根据本发明的第一方面，提供了一种图像标注方法，包括：

基于目标检测模型对当前帧待标注图片进行识别，获取至少一个目标物标注框信息；

基于上一帧目标物标注框信息，从所述当前帧待标注图片识别出的至少一个目标物标注框中确定所述当前帧待标注图片的目标物标注框；

基于实例分割算法对所述当前帧待标注图片中的目标物标注框区域进行目标物分割，生成目标物的掩码图片mask；

获取所述目标物的掩码图片mask的轮廓点为目标物轮廓，并生成目标物轮廓的外接矩形；

基于所述目标物轮廓的外接矩形，设置对应的前景矩形，并生成当前帧待标注图片中前景矩形的掩码图片mask；

检测所述前景矩形的掩码图片mask中的多个角点，并基于角点与所述目标物轮廓的外接矩形下边线的距离，对所述目标物轮廓的外接矩形下边线位置进行调整，获取所述当前帧待标注图片的目标物的标注框。

根据本发明的第二方面，提供一种图像标注系统，包括：

识别模块，用于基于目标检测模型对当前帧待标注图片进行识别，获取至少一个目标物标注框信息；

确定模块，用于基于上一帧目标物标注框信息，从所述当前帧待标注图片识别出的至少一个目标物标注框中确定所述当前帧待标注图片的目标物标注框；

分割模块，用于基于实例分割算法对所述当前帧待标注图片中的目标物标注框区域进行目标物分割，生成目标物的掩码图片mask；

生成模块，用于获取所述目标物的掩码图片mask的轮廓点为目标物轮廓，并生成目标物轮廓的外接矩形；以及基于所述目标物轮廓的外接矩形，设置对应的前景矩形，并生成当前帧待标注图片中前景矩形的掩码图片mask；

获取模块，用于检测所述前景矩形的掩码图片mask中的多个角点，并基于角点与所述目标物轮廓的外接矩形下边线的距离，对所述目标物轮廓的外接矩形下边线位置进行调整，获取所述当前帧待标注图片的目标物的标注框。

根据本发明的第三方面，提供了一种电子设备，包括存储器、处理器，所述处理器用于执行存储器中存储的计算机管理类程序时实现图像标注方法的步骤。

根据本发明的第四方面，提供了一种计算机可读存储介质，其上存储有计算机管理类程序，所述计算机管理类程序被处理器执行时实现图像标注方法的步骤。

本发明提供的一种图像标注方法及系统，基于目标检测模型对当前帧待标注图片进行识别，获取至少一个目标物标注框信息；基于上一帧目标物标注框信息，确定当前目标物标注框；基于实例分割、目标轮廓识别获取目标物轮廓、外接矩形、前景矩形以及角点检测，并基于角点与外接矩形下边线的距离调整目标物的外接矩形，精确获取目标物的标注框。本发明针对预标注精度较低，所提出方法结合目标检测、实例分割、轮廓识别等技术并利用了上一帧图像标注信息，实现对标注框与目标物的精准贴合，尤其是大幅提升了车辆与地面接触位置标注的准确率，减少了人工标注时间。

附图说明

图1为本发明提供的一种图像标注方法流程图；

图2为当前帧待标注图片示意图；

图3为标注结果示意图；

图4为对标注框区域进行目标物分割的示意图；

图5为目标物的掩码图片mask的示意图；

图6为前景矩形的掩码图片mask的示意图；

图7为提取的前景矩形的掩码图片mask中的角点示意图；

图8为最终的目标物标注框示意图；

图9为本发明提供的一种图像标注系统的结构示意图；

图10为本发明提供的一种可能的电子设备的硬件结构示意图；

图11为本发明提供的一种可能的计算机可读存储介质的硬件结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。另外，本发明提供的各个实施例或单个实施例中的技术特征可以相互任意结合，以形成可行的技术方案，这种结合不受步骤先后次序和/或结构组成模式的约束，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时，应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

图1为本发明提供的一种图像标注方法流程图，如图1所示，方法包括：

S1，基于目标检测模型对当前帧待标注图片进行识别，获取至少一个目标物标注框信息。

可理解的是，首先获取当前帧待标注图片并命名为图片1，图片1可参见图2，以及获取上一帧目标物标注框信息，其中，上一帧目标物标注框信息为基于目标检测模型识别的上一帧图片中各个类型的目标物的目标标注框信息。

对于当前帧待标注图片，选择一种目标检测模型，可选的有mask-rcnn、yolo、faster-rcnn等模型，利用该模型对当前帧待标注图片进行识别预测，得到每个不同类型的目标物的目标标注框，可参见图3，并基于目标物的类型，对识别出的所有的目标物标注框进行过滤，保留指定标注类型(可选的有车辆、行人、交通标识、红绿灯等)的目物标注框，对过滤后的目标物标注框信息进行保存。

S2，基于上一帧目标物标注框信息，从所述当前帧待标注图片识别出的至少一个目标物标注框中确定所述当前帧待标注图片的目标物标注框。

其中，需要说明的是，基于目标检测模型识别当前帧待标注图片中各种类型的目标物标注框后，得到的每一种类型的目标物标注框可能有多个，比如，对当前帧待标注图片中的车辆进行识别，可能待标注图片中的车辆有很多辆，那么会将每一辆车均识别出来，也有可能会将其它类型的目标物识别为车辆，识别错误。此时，需要从多个目标物标注框中确定正确的一个目标物标注框。

作为实施例，所述基于上一帧目标物标注框信息，从所述当前帧待标注图片识别出的至少一个目标物标注框中确定所述当前帧待标注图片的目标物标注框，包括：计算上一帧图片中指定类型的目标物标注框与当前帧待标注图片中识别的相同类型的每一个目标物标注框之间的交并比；删除交并比小于设定阈值的目标物标注框，且将交并比最大的目标物标注框作为当前帧待标注图片的指定类型的目标物标注框。

具体的，将上一帧目标物标注框与当前帧待标注图片中统一类型的所有目标物标注框逐一计算交并比(Intersection-over-Union,IoU)，剔除交并比小于0.5的标注框后选择交并比最大的标注框为当前帧目标物的标注框。以上一帧其中一个目标物标注框为标注框1，以当前帧预标注结果的其中一个目标物标注框为标注框2，以标注框1的面积为s1，以标注框2的面积为s2，标注框1与标注框2的交集面积为s3，则IoU计算公式为：

IoU＝s3/(s1+s2-s3)。

S3，基于实例分割算法对所述当前帧待标注图片中的目标物标注框区域进行目标物分割，生成目标物的掩码图片mask。

作为实施例，所述基于实例分割算法对所述当前帧待标注图片中的目标物标注框区域进行目标物分割，生成目标物的掩码图片mask，包括：基于实例分割算法对所述当前帧待标注图片中的目标物标注框区域进行目标物分割，所述目标物标注框区域内的每一个像素点均输出是否是指定类型的概率值；将所述当前帧待标注图片中的目标物标注框区域生成目标物的掩码图片mask；其中，对于概率值大于0.85的像素点的坐标，将目标物的掩码图片mask中相应的坐标点的像素值设置为1；对于概率值大于0.2且小于0.85的像素点的坐标，将目标物的掩码图片mask中相应坐标点的像素值设置为2；将目标物的掩码图片mask剩余坐标点的像素值设置为0；基于grabcut算法对当前帧待标注图片进行图像分割，将所述目标物的掩码图片mask中像素值为0或2的值设置为0，其它像素值设置为255。

可理解的是，选择一种实例分割算法，可选的为mask-rcnn算法，利用该算法对步骤S2所得到的目标物标注框区域进行目标物分割，可参见图4，目标物标注框区域内的每个像素点均输出是否是指定类型的概率值，比如，需要识别是否是车辆类型，那么基于实例分割模型，可输出每个像素点是车辆的概率点。

以图片1高度为h，宽度为w，设置一个尺寸为(h,w)的掩码图片mask。记录步骤S3中概率值大于0.85的像素点的坐标，将mask中这些坐标点的像素值设置为1；记录步骤S3中概率值大于0.2且小于0.85的像素点的坐标，将mask中这些坐标点的像素值设置为2；将mask剩余坐标点像素值设置为0。

利用grabcut算法对图片1进行图像分割，其中掩码图片设置为mask，模式设置为GC_INIT_WITH_MASK，保存该算法输出的掩码图片mask，将mask像素值为0或2的值设置为0，其他像素值设置为255，可参见图5，得到目标物的掩码图片mask。

S4，获取所述目标物的掩码图片mask的轮廓点为目标物轮廓，并生成目标物轮廓的外接矩形。

作为实施例，所述获取所述目标物的掩码图片mask的轮廓点为目标物轮廓，并求取目标物轮廓的外接矩形，其特征在于，包括：基于opencv中findContours算法识别目标物的掩码图片mask中的轮廓点，并基于识别的轮廓点识别至少一个闭环轮廓，选取面积最大闭环轮廓为目标物轮廓；利用opencv中boundingRect算法求取目标物轮廓的外接矩形box，表示为[x1,y1,w1,h1]，其中x1为box左上顶点x轴坐标，y1为box左上顶点y轴坐标，w1为box宽度,h1为box高度。

可理解的是，利用opencv中findContours算法识别目标物的掩码图片mask中的轮廓点，根据识别的轮廓点，形成一个个闭环轮廓。由于形成的有些轮廓可能不是目标物轮廓，因此选择面积最大的轮廓为目标物轮廓，再利用opencv中boundingRect算法求取目标轮廓的外接矩形box表示为[x1,y1,w1,h1]，其中x1为box左上顶点x轴坐标，y1为box左上顶点y轴坐标，w1为box宽度，h1为box高度。

S5，基于所述目标物轮廓的外接矩形，设置对应的前景矩形，并生成当前帧待标注图片中前景矩形的掩码图片mask。

可理解的是，根据目标物外接矩形box设置对应的前景矩形rect，可参见图6，前景矩形rect表示为[x2,y2,w2,h2]，具体为：

offset＝h1//10；

x2＝x1；

y2＝y1+h1-offset；

w2＝w1；

h2＝y1+h2-offset×2。

作为实施例，所述检测所述前景矩形的掩码图片mask中的多个角点，包括：当目标物类型为车辆类型时，调用opencv中goodFeaturesToTrack(maxCorners，qualityLevel，minDistance)识别所述前景矩形的掩码图片mask中的多个角点，其中，maxCorners为识别角点的个数，qualityLevel为质量水平参数，minDistance为最小距离参数。

可以理解的是，利用opencv中grabcut算法识别图片1的轮廓，其中前景矩形设置为rect，模式设置为GC_INIT_WITH_RECT，保存该算法输出的前景矩形的掩码图片mask，将前景矩形的掩码图片mask像素值为0或2的值设置为0，其他像素值设置为255，可参见图7。

S6，检测所述前景矩形的掩码图片mask中的多个角点，并基于角点与所述目标物轮廓的外接矩形下边线的距离，对所述目标物轮廓的外接矩形下边线位置进行调整，获取所述当前帧待标注图片的目标物的标注框。

作为实施例，所述基于角点与所述目标物轮廓的外接矩形下边线的距离，对所述目标物轮廓的外接矩形下边线位置进行调整，得到所述当前帧待标注图片的目标物的标注框，包括：从多个角点中选取与所述目标物轮廓的外接矩形下边线的最近角点P并表示为[x3,y3]；计算角点P与所述目标物轮廓的外接矩形下边线的距离，若距离小于10，则所述角点为车辆与地面接触点并将所述目标物轮廓的外接矩形更新为[x1,y1,w1,y3-y1]；将所述目标物轮廓的外接矩形转换为标注框格式进行输出，并基于标注框对当前帧待标注图片中对应的目标物进行标注。

可理解的是，若通过目标检测模型识别的当前帧待标注图片中的目标物为车辆，利用opencv中goodFeaturesToTrack算法识别前景矩形的掩码图片mask的角点，可参见图7，其中，goodFeaturesToTrack算法中包括三个参数，maxCorners为识别的角点的数量，本发明中，maxCorners设置为3，qualityLevel为质量水平，设置为0.01，也即对于识别出的每一个角点，只有当角点的质量水平大于0.01，才为有效角点，minDistance为最小距离，设置为10。若存在识别的角点，则从识别的角点中选取目标物轮廓的外接矩形box下边界的最近角点P并表示为[x3,y3]，计算角点P与目标物轮廓的外接矩形box下边线的距离，若距离小于10则认为该角点为车辆与地面接触点，并将目标物轮廓的外接矩形box的坐标更新为[x1,y1,w1,y3-y1]。将更新后的目标物轮廓的外接矩形box转换为标注框格式进行输出，并对当前帧待标注图片中对应的目标物进行标注，得到目标物标注框，可参见图8。

图9为本发明实施例提供的一种图像标注系统结构图，如图9所示，一种图像标注系统，包括识别模块901、确定模块902、分割模块903、生成模块904和获取模块905，其中：

识别模块901，用于基于目标检测模型对当前帧待标注图片进行识别，获取至少一个目标物标注框信息；

确定模块902，用于基于上一帧目标物标注框信息，从所述当前帧待标注图片识别出的至少一个目标物标注框中确定所述当前帧待标注图片的目标物标注框；

分割模块903，用于基于实例分割算法对所述当前帧待标注图片中的目标物标注框区域进行目标物分割，生成目标物的掩码图片mask；

生成模块904，用于获取所述目标物的掩码图片mask的轮廓点为目标物轮廓，并生成目标物轮廓的外接矩形；以及基于所述目标物轮廓的外接矩形，设置对应的前景矩形，并生成当前帧待标注图片中前景矩形的掩码图片mask；

获取模块905，用于检测所述前景矩形的掩码图片mask中的多个角点，并基于角点与所述目标物轮廓的外接矩形下边线的距离，对所述目标物轮廓的外接矩形下边线位置进行调整，获取所述当前帧待标注图片的目标物的标注框。

可以理解的是，本发明提供的一种图像标注系统与前述各实施例提供的图像标注方法相对应，图像标注系统的相关技术特征可参考图像标注方法的相关技术特征，在此不再赘述。

请参阅图10，图10为本发明实施例提供的电子设备的实施例示意图。如图10所示，本发明实施例提了一种电子设备，包括存储器1010、处理器1020及存储在存储器1010上并可在处理器1020上运行的计算机程序1011，处理器1020执行计算机程序1011时实现图像标注方法的步骤。

请参阅图11，图11为本发明提供的一种计算机可读存储介质的实施例示意图。如图11所示，本实施例提供了一种计算机可读存储介质1100，其上存储有计算机程序1111，该计算机程序1111被处理器执行时实现图像标注方法的步骤。

本发明实施例提供的一种图像标注方法及系统，基于目标检测模型对当前帧待标注图片进行识别，获取至少一个目标物标注框信息；基于上一帧目标物标注框信息，确定当前目标物标注框；基于实例分割、目标轮廓识别获取目标物轮廓、外接矩形、前景矩形以及角点检测，并基于角点与外接矩形下边线的距离调整目标物的外接矩形，精确获取目标物的标注框。本发明针对预标注精度较低，所提出方法结合目标检测、实例分割、轮廓识别等技术并利用了上一帧图像标注信息，实现对标注框与目标物的精准贴合，尤其是大幅提升了车辆与地面接触位置标注的准确率，减少了人工标注时间。

需要说明的是，在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述的部分，可以参见其它实施例的相关描述。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包括这些改动和变型在内。

Claims

1.一种图像标注方法，其特征在于，包括：

2.根据权利要求1所述的图像标注方法，其特征在于，所述基于目标检测模型对当前帧待标注图片进行识别，获取至少一个目标物标注框信息，包括：

基于目标检测模型对当前帧待标注图片进行识别，获取每一类型目标物的至少一个目标物标注框信息。

3.根据权利要求2所述的图像标注方法，其特征在于，所述基于上一帧目标物标注框信息，从所述当前帧待标注图片识别出的至少一个目标物标注框中确定所述当前帧待标注图片的目标物标注框，包括：

计算上一帧图片中指定类型的目标物标注框与当前帧待标注图片中识别的相同类型的每一个目标物标注框之间的交并比；

删除交并比小于设定阈值的目标物标注框，且将交并比最大的目标物标注框作为当前帧待标注图片的指定类型的目标物标注框；

其中：

上一帧指定类型的目标物标注框的面积为s1，当前帧待标注图片识别的相同类型的目标物标注框的面积为s2，上一帧指定类型的目标物标注框与当前帧待标注图片识别的相同类型的目标物标注框的交集面积为s3，则交并比IoU计算公式为：

IoU＝s3/(s1+s2-s3)。

4.根据权利要求1所述的图像标注方法，其特征在于，所述基于实例分割算法对所述当前帧待标注图片中的目标物标注框区域进行目标物分割，生成目标物的掩码图片mask，包括：

基于实例分割算法对所述当前帧待标注图片中的目标物标注框区域进行目标物分割，所述目标物标注框区域内的每一个像素点均输出是否是指定类型的概率值；

将所述当前帧待标注图片中的目标物标注框区域生成目标物的掩码图片mask；

其中，对于概率值大于0.85的像素点的坐标，将目标物的掩码图片mask中相应的坐标点的像素值设置为1；对于概率值大于0.2且小于0.85的像素点的坐标，将目标物的掩码图片mask中相应坐标点的像素值设置为2；将目标物的掩码图片mask剩余坐标点的像素值设置为0；

基于grabcut算法对当前帧待标注图片进行图像分割，将所述目标物的掩码图片mask中像素值为0或2的值设置为0，其它像素值设置为255。

5.根据权利要求4所述的图像标注方法，其特征在于，所述获取所述目标物的掩码图片mask的轮廓点为目标物轮廓，并求取目标物轮廓的外接矩形，其特征在于，包括：

基于opencv中findContours算法识别目标物的掩码图片mask中的轮廓点，并基于识别的轮廓点识别至少一个闭环轮廓，选取面积最大闭环轮廓为目标物轮廓；

利用opencv中boundingRect算法求取目标物轮廓的外接矩形box，表示为[x1,y1,w1,h1]，其中x1为box左上顶点x轴坐标，y1为box左上顶点y轴坐标，w1为box宽度,h1为box高度。

6.根据权利要求5所述的图像标注方法，其特征在于，所述基于所述目标物轮廓的外接矩形，设置对应的前景矩形，并生成当前帧待标注图片中前景矩形的掩码图片mask，包括：

根据目标物轮廓的外接矩形box设置前景矩形rect并表示为[x2，y2，w2，h2]，其中：

offset＝h1//10；

x2＝x1；

y2＝y1+h1-offset；

w2＝w1；

h2＝y1+h2-offset×2。

7.根据权利要求1所述的图像标注方法，其特征在于，所述检测所述前景矩形的掩码图片mask中的多个角点，包括：

当目标物类型为车辆类型时，调用opencv中goodFeaturesToTrack(maxCorners，qualityLevel，minDistance)识别所述前景矩形的掩码图片mask中的多个角点，其中，maxCorners为识别角点的个数，qualityLevel为质量水平参数，minDistance为最小距离参数。

8.根据权利要求7所述的图像标注方法，其特征在于，所述基于角点与所述目标物轮廓的外接矩形下边线的距离，对所述目标物轮廓的外接矩形下边线位置进行调整，得到所述当前帧待标注图片的目标物的标注框，包括：

从多个角点中选取与所述目标物轮廓的外接矩形下边线的最近角点P并表示为[x3,y3]；

计算角点P与所述目标物轮廓的外接矩形下边线的距离，若距离小于10，则所述角点为车辆与地面接触点并将所述目标物轮廓的外接矩形更新为[x1,y1,w1,y3-y1]；

将所述目标物轮廓的外接矩形转换为标注框格式进行输出，并基于标注框对当前帧待标注图片中对应的目标物进行标注。

9.一种图像标注系统，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，其上存储有计算机管理类程序，所述计算机管理类程序被处理器执行时实现如权利要求1-8任一项所述的图像标注方法的步骤。