CN117197514A

CN117197514A - 图像标注方法、装置、电子设备及存储介质

Info

Publication number: CN117197514A
Application number: CN202210606851.5A
Authority: CN
Inventors: 黄琴
Original assignee: Zero Beam Technology Co ltd
Current assignee: Zero Beam Technology Co ltd
Priority date: 2022-05-31
Filing date: 2022-05-31
Publication date: 2023-12-08

Abstract

本申请实施例提供了一种图像标注方法、装置、电子设备及存储介质，所述方法包括：获取待标注图像；通过预先确定的交互策略对所述待标注图像进行处理，获得交互信息，其中，所述交互信息用于指示目标对象在所述待标注图像中的位置；将所述交互信息和所述待标注图像输入到预先训练的标注模型，获得所述标注模型输出的标注文件，其中，所述标注模型输出的标注文件用于指示所述待标注图像中目标对象的类型。应用本申请方案，可以解决人工标注道路数据需要耗费较长时长，导致对道路数据进行标注的效率较低的问题，提高了图像标注的效率。

Description

图像标注方法、装置、电子设备及存储介质

技术领域

本申请实施例涉及图像处理技术领域，尤其涉及一种图像标注方法、装置、电子设备及存储介质。

背景技术

随着科技的发展，自动驾驶越来越普及，为了使自动驾驶算法能处理更多、更复杂的场景，需要海量的真实道路数据进行支撑，因此对道路数据标注需求越来越高，而海量且高质量、精细化的道路标注数据可以在很大程度上提升汽车自动驾驶的安全性与实用性。

目前，采用人工标注的方式对道路数据进行标注，比如通过人工标注的方式标注图像中汽车、道路、人、建筑物和植被等。然而人工标注道路数据需要耗费较长时长，导致对道路数据进行标注的效率较低。

因此如何实现高效的对海量道路数据进行标注成为了急需解决的问题。

发明内容

有鉴于此，本申请实施例提供一种图像标注方法、装置、电子设备和存储介质，以至少部分解决上述问题。

根据本申请实施例的第一方面，提供了一种图像标注方法，所述方法包括：获取待标注图像；通过预先确定的交互策略对所述待标注图像进行处理，获得交互信息，其中，所述交互信息用于指示目标对象在所述待标注图像中的位置；将所述交互信息和所述待标注图像输入到预先训练的标注模型，获得所述标注模型输出的标注文件，其中，所述标注模型输出的标注文件用于指示所述待标注图像中目标对象的类型。

根据本申请实施例的第二方面，提供了一种图像标注装置，所述装置包括：获取模块，用于获取待标注图像；图像处理模块，用于通过预先确定的交互策略对所述待标注图像进行处理，获得交互信息，其中，所述交互信息用于指示目标对象在所述待标注图像中的位置；标注模块，用于将所述交互信息和所述待标注图像输入到预先训练的标注模型，获得所述标注模型输出的标注文件，其中，所述标注模型输出的标注文件用于指示所述待标注图像中目标对象的类型。

根据本申请实施例的第三方面，提供了一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如第一方面所述的方法对应的操作。

根据本申请实施例的第四方面，提供了一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面所述的方法。

基于上述方案提供的标注方法，通过预先确定的交互策略对待标注图像进行处理，获得交互信息，将交互信息与待标注图像输入到预先训练好的标注模型中，通过标注模型推理即可获得可以指示待标注图像中目标对象类型的待标注文件。可见，通过交互策略可以获得交互信息，交互信息用于指示物体在图像中的位置，标注模型基于交互信息快速识别待识别图像中目标对象所处的位置，进而识别目标对象的类型，并生成可以指示目标对象类型的标注文件，标注过程无需人工参与，解决了人工标注耗时长、效率低的问题，实现了高效的对海量道路数据进行标注。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本申请一个实施例提供的图像标注方法的流程图；

图2为本申请一个实施例提供的街景数据标注方法的流程图；

图3为本申请一个实施例提供的标注模型训练方法的流程图；

图4为本申请一个实施例提供的图像标注装置的示意图；

图5为本申请一个实施例提供的电子设备的结构示意图。

具体实施方式

为了使本领域的人员更好地理解本申请实施例中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请实施例一部分实施例，而不是全部的实施例。基于本申请实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本申请实施例保护的范围。

在本申请使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

如图1所示，图1是本申请实施例提供的一种图像标注方法的流程图，该方法包括如下步骤101至步骤103：

步骤101、获取待标注图像。

从本地数据库或云端数据库中获取待标注图像，待标注图像为图片或视频帧，待标注图像可以是任意类型，例如：风景图片、人物图片、道路视频等等。

步骤102、通过预先确定的交互策略对待标注图像进行处理，获得交互信息，其中，交互信息用于指示目标对象在待标注图像中的位置。

在获取待标注图像之后，通过预先确定的交互策略对待标注图像进行处理，处理完成后可以获得交互信息，其中交互信息包括标注对象的位置、边缘以及标注结果的正负点等等。

步骤103、将交互信息和待标注图像输入到预先训练的标注模型，获得标注模型输出的标注文件，其中，标注模型输出的标注文件用于指示待标注图像中目标对象的类型。

预先训练标注模型，标注模型可以对输入图像中目标对象的类型进行标注，生成用于指示目标对象类型的标注文件。标注模型可以识别一个类型的目标对象，也可以识别多个类型的目标对象。当标注模型识别一个类型的目标对象时，标注模型输出的标注文件可以指示待标注图像是否包括相应类型的目标对象。当标注模型识别多个类型的目标对象时，标注模型输出的标注文件可以指示待标注图像中每个目标对象的类型。

在获取交互信息之后，将交互信息和待标注图像，输入到预先训练的标注模型中，标注模型经过推理可以获得标注文件，标注文件可以指示待标注图像中的目标对象的类型，其中，目标对象可以是花、人、车、路灯等等。

在本申请实施例中，通过预先确定的交互策略对待标注图像进行处理，获得交互信息，将交互信息与待标注图像输入到预先训练好的标注模型中，通过标注模型推理即可获得可以指示待标注图像中目标对象类型的待标注文件。可见，通过交互策略可以获得交互信息，交互信息用于指示物体在图像中的位置，标注模型基于交互信息快速识别待识别图像中目标对象所处的位置，进而识别目标对象的类型，并生成可以指示目标对象类型的标注文件，标注过程无需人工参与，解决了人工标注耗时长、效率低的问题，实现了高效的对海量道路数据进行标注。

在一种可能的实现方式中，通过预先确定的交互策略对待标注图像进行处理之前还可以获取图像标注任务，进而根据图像标注任务确定交互策略和标注模型，其中，不同的图像标注任务对应不同的交互策略和标注模型的组合。

在不同的应用场景下具有不同的标注任务，比如：在人物图像中只标注出人、在人物图像中标注出除了人以外的生物、或者只标注植物等等。不同的标注任务对应不同的标注策略和标注模型组合，比如：若目标对象是人，则可通过第一种交互策略和第一种标注模型，若目标对象是植物，则可通过第二交互策略与和第二标注模型。

应理解，预先创建有多种交互策略和多种标注模型，根据标注任务的不同，可以对交互策略和标注模型进行自由组合，以组合出适用于相应标注任务的交互策略和标注模型。

在本申请实施例中，在确定标注任务后，可以根据标注任务确定相应的交互策略和标注模型，不同的交互策略适用于识别不同类型目标对象在待识别图像中所处的区域，不同的标注模型适用于识别不同类型的目标对象，根据标注任务确定交互策略和标注模型，可以对不同类型的目标对象进行标注，保证了该图像标注方法的适用性。

在一种可能的实现方式中，在根据图像标注任务确定交互策略时，可以根据图像标注任务，确定待标注的至少一个目标对象，进而根据目标对象的类型，从预设的至少两个个交互策略中确定与目标对象的类型相匹配的交互策略。

针对不同的交互任务预先创建有多个交互策略，不同的交互任务对应不同的交互策略，交互策略定义了对图像中目标对象所处区域进行识别的方法。在获取到标注任务后，可以从预先创建的多个交互策略中确定与标注任务相对应的交互策略。例如：当交互任务为对目标对象进行高精度识别，则交互策略为基于点(seed based)的识别方法，当交互任务为识别和检测目标种类时，则交互策略为基于感兴趣区域(ROI based)的识别方法。

在本申请实施例中，通过针对不同的交互任务，选定与交互任务相对应的交互策略，可以快速准确的识别不同类型的目标对象在待识别图像中所处的区域，并生成包含目标对象位置信息的交互信息，进而标注模型可以基于交互信息快速识别待识别图像中目标对象所处的位置，提高了标注的效率。

可选的，基于点的识别方法包括边界种子(Boundary seed)识别方法和区域种子(region seed)识别方法，边界种子识别方法用于对有明确边界的目标对象进行识别，区域种子识别方法用于对边界不明确的目标对象进行识别。

可选的，基于感兴趣区域的识别方法包括绘画的感兴趣区域(ROI drawn)识别方法，紧致的感兴趣区域(ROI tight BB)识别方法和宽松的感兴趣区域(ROI loose BB)识别方法，绘画的感兴趣区域识别方法用于对有明确边界的目标对象进行识别，紧致的感兴趣区域识别方法用于对边界不明确且拥有多个目标的目标对象进行识别，宽松的感兴趣区域识别方法用于对边界不明确且只拥有一个目标的目标对象进行识别。

在一种可能的实现方式中，在将交互信息和待标注图像输入到预先训练的标注模型之前，可以获取包括街景数据的街景数据集，然后使用街景数据集对预先构建的模型进行训练，进而获得标注模型，将注模型部署到云端，然后对部署在云端的标注模型进行封装，可以获得用于对标注模型进行调用的Web接口。

数据集可以为公开的街景数据集，也可以为数据采集车采集的私有街景数据集，用获取到的数据集对预先构建的标注模型进行训练，训练好的模型具有识别目标对象类型的能力，将训练好的模型部署到云端，并在云端对模型进行封装，封装为可在web端输入输出的接口形式为后续策略交互和模型推理做准备。

在本申请实施例中，训练标注模型，然后将训练好的标注模型部署到云端并封装，通过对标注模型的训练，可以提高标注模型识别目标对象的能力，提高了标注的准确度，将标注模型部署到云端可以不受使用地和使用设备的限制，支持多人协作工作，从原数据到标注结果整体管控，提高了标注效率。

在一种可能的实现方式中，在获得标注模型输出的标注文件后，可以检验标注文件中用于指示目标对象类型的第一标注标签是否与预设的至少一个第二标注标签相匹配；如果第一标注标签与至少一个第二标注标签相匹配，则输出标注文件。

第一标签为标注模型赋予标注文件的标注标签，第二标签为提前预设的标注标签。不同的标注任务对应不同的预设标签，例如：如果标注任务为检测目标类型，则需要提前预设目标对应的类别，如果任务为识别目标颜色，则需要提前预设不同的颜色类别等等。在标注模型对待标注图像进行标注的过程中，标注模型会根据标注结果赋予标注文件一个标注标签，该标注标签根据标注任务的不同可能包括目标的类型、颜色和大小等等，用标注模型赋予的标注标签与预先配置好的标注标签进行匹配，如果相匹配就说明标注结果是可靠的，然后将标注文件输出。

在一种可能的实现方式中，如果第一标注标签与至少一个第二标注标签不匹配，则将待标注图像、交互信息和标注文件输入到标注模型，重新对待标注图像中目标对象的类型进行标注。

如果标注模型赋予标注文件的标注标签与提前配置好的标注标签不匹配，说明标注结果是错误的，则将交互信息、待标注图像和错误的标注结果重新输入到标注模型中，标注模型会根据输入的信息重新进行标注，进而获得新的标注文件，然后继续对模型赋予标注文件的标注标签与预设的标注标签进行匹配，直到模型赋予标注文件的标注标签与预设的标注标签相匹配。

经过检验标注模型赋予标注文件的标注标签是否与预设的标注标签相匹配，可以快速地筛选出正确的标注结果，并及时的将错误的标注结果输入到标注模型中重新进行标注，有效的提高了标注的准确率，从而提高了标注的效率。

在一种可能的实现方式中，如果第一标注标签与至少一个第二标注标签相匹配，则输出标注文件之后对输出的标注文件进行修正，直至标注文件的标注误差率、标注类别覆盖率和像素偏差满足预设条件，然后将修正后的标注文件存储到数据库中。

在进行标注前，可以预先制定需要满足的标注误差率、标注类别覆盖率和像素偏差。根据预先制定标注误差率、标注类别覆盖率和像素偏差对输出的标注文件进行修正，修正方法包括人工修正、系统自动修正等等，如果标注任务简易，识别目标对象单一，则可以系统自动修正方法，如果标注图像十分复杂，且系统无法进行自动修正，则采用人工修正方法，修正完成后，检测修正后的文件是否满足预先制定的标注误差率、标注类别覆盖率和像素偏差，如果满足则将标注文件输出后存入云端数据库，如果不满足则对不合格的标注文件继续进行修正，直至满足预先制定的标注误差率、标注类别覆盖率和像素偏差。

根据预先制定的标注误差率、标注类别覆盖率和像素偏差进行修正可以获得更加准确的标注结果，并对标注不准确的结果重新进行修正，避免由于标注模型的标注误差而产生不准确的标注结果，提升了标注的准确率，进而提升了标注的效率。

为了更好理解本申请所公开的图像标注方法，下面以图像为街景数据为例，对本申请实施例提供的图像标注方法进行详细说明。

相关技术中，主要采用人工标注的方式对街景数据进行标注，比如通过人工标注的方式标注图像中汽车、道路、人、建筑物和植被等，可见由于人工标注道路数据，需要耗费较长时长，导致对道路数据进行标注的效率较低。

为了解决上述问题，本申请提供一种图像标注方法。本申请提供的方案可以用于上述街景数据标注中，当然可以理解，本申请提供的方案还可用于标注人物图像、建筑图像中的特殊物品标注等等，此处不再一一赘述。

如图2所示，图2是本申请实施例一提供的一种图像标注方法的流程图，该方法包括步骤201-204：

步骤201、获取待标注图像。

待标注图像为街景图片或街景视频帧。

步骤202、通过预先确定的交互策略对待标注图像进行处理，获得交互信息。

在一种可能的实现方式中，在通过预先确定的交互策略对待标注图像进行处理前，可以根据图像标注任务，确定交互策略和标注模型，其中，不同的图像标注任务对应不同的交互策略和标注模型的组合。

根据街景标注任务选定对应的交互策略和标注模型组合。

在另一种可能的实现方式中，根据图像标注任务，确定待标注的至少一个目标对象，根据目标对象的类型，从预设的至少两个交互策略中确定与目标对象的类型相匹配的交互策略。

根据街景标注任务，确定需要标注的目标对象，并根据确定的目标对象选择类型相匹配的交互策略，不同的交互策略适用于识别不同类型目标对象在待识别图像中所处的区域。

步骤203、将交互信息和待标注图像输入到预先训练的标注模型，获得标注模型输出的标注文件。

将交互信息和待标注图像输入到提前训练好的标注模型中，标注模型可以对输入图像中目标对象的类型进行标注，生成用于指示目标对象类型的标注文件。

在一种可能的实现方式中，如图3所示，图3是生成标注模型的流程图，包括：

301、获取街景数据集。

街景数据集可以是公开的数据集也可以是采集车采集的私有数据集。

302、使用街景数据集对预先构建的模型进行训练，获得标注模型。

通过训练获得标注模型，标注模型可以获得用于指示目标对象类型的标注文件。

303、将标注模型部署到云端。

将标注模型部署到云端可以不受使用地和使用设备的限制，并支持多人协作工作，从原数据到标注结果整体管控，提高了标注效率

304、对部署在云端的标注模型进行封装。

封装为可在web端输入输出的接口形式为后续策略交互和模型推理做准备。

步骤204、检验标注文件中用于指示目标对象类型的第一标注标签是否与预设的至少一个第二标注标签相匹配；如果第一标注标签与至少一个第二标注标签相匹配，则输出标注文件。

检验标注文件是否正确的标注了目标对象的类型，是否与预设的标注标签相匹配，如果相匹配说明标注结果是正确的，则输出标注文件。

如果第一标注标签与至少一个第二标注标签不匹配，说明标注结果错误，则将交互信息、待标注图像和错误的标注结果输入到标注模型中，标注模型根据输入的信息重新进行标注，获得新的标注文件，然后继续进行检验，直到第一标注标签与至少一个第二标注标签相匹配。

步骤205、对输出的标注文件进行修正，直至满足预设的标注误差率、标注类别覆盖率和像素偏差，将修正后的标注文件存储到数据库中。

预设标注误差率、标注类别覆盖率和像素偏差，如果修正之后的标注文件满足预设的标注误差率、标注类别覆盖率和像素偏差，则将修正之后的标注文件输出存入云端数据库，若不满足预设的标注准则，则继续进行修正，直至满足预设的标注误差率、标注类别覆盖率和像素偏差。

如图4所示，图4是本申请实施例提供的一种图像标注装置的示意图，该装置包括：

获取模块401，用于获取待标注图像；

图像处理模块402，用于通过预先确定的交互策略对待标注图像进行处理，获得交互信息，其中，交互信息用于指示目标对象在所述待标注图像中的位置；

标注模块403，用于将交互信息和待标注图像输入到预先训练的标注模型，获得标注模型输出的标注文件，其中，标注模型输出的标注文件用于指示待标注图像中目标对象的类型。

在一种可能的实现方式中，图像处理模块402还可以获取图像标注任务，进而根据图像标注任务确定交互策略和标注模型，其中，不同的图像标注任务对应不同的交互策略和标注模型的组合。

在一种可能的实现方式中，图像处理模块402可以根据图像标注任务，确定待标注的至少一个目标对象，进而根据目标对象的类型，从预设的至少两个交互策略中确定与目标对象的类型相匹配的交互策略。

在一种可能的实现方式中，该图像标注装置还可以包括：封装模块；

封装模块可以获取包括街景数据的街景数据集，并使用街景数据集对预先构建的模型进行训练，进而获得标注模型，将注模型部署到云端，并对部署在云端的标注模型进行封装，以获得用于对标注模型进行调用的Web接口。

在一种可能的实现方式中，该图像标注装置还包括：检验模块：

检验模块可以检验标注文件中用于指示目标对象类型的第一标注标签是否与预设的至少一个第二标注标签相匹配；如果第一标注标签与至少一个第二标注标签相匹配，则输出标注文件。

在一种可能的实现方式中，如果第一标注标签与至少一个第二标注标签不匹配，检验模块可以将待标注图像、交互信息和标注文件输入到标注模型，重新对待标注图像中目标对象的类型进行标注。

在一种可能的实现方式中，该图像标注装置还可以包括：修正模块；

修正模块，用于在第一标注标签与至少一个第二标注标签相匹配时，对输出的标注文件进行修正，直至标注文件的标注误差率、标注类别覆盖率和像素偏差满足预设条件，然后将修正后的标注文件存储到数据库中。

需要说明的是，上述图像标注装置内的各模块之间的信息交互、执行过程等内容，由于与前述仿真模型校准方法实施例基于同一构思，具体内容可参见前述图像标注方法实施例中的叙述，此处不再赘述。

参照图5，示出了根据本申请实施例的一种电子设备的结构示意图，本申请具体实施例并不对电子设备的具体实现做限定。

如图5所示，该电子设备可以包括：处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。

其中：

处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。

通信接口504，用于与其它电子设备或服务器进行通信。

处理器502，用于执行程序510，具体可以执行上述图像标注方法实施例中的相关步骤。

具体地，程序510可以包括程序代码，该程序代码包括计算机操作指令。

处理器502可能是中央处理器CPU，或者是图形处理器GPU(Graphics ProcessingUnit)，或者是特定集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本申请实施例的一个或多个集成电路。智能设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；一个或多个GPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个GPU以及一个或多个ASIC。

存储器506，用于存放程序510。存储器506可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序510具体可以用于使得处理器502执行前述任一实施例中的图像标注方法。

程序510中各步骤的具体实现可以参见前述任一图像标注方法实施例中的相应步骤和单元中对应的描述，在此不赘述。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备和模块的具体工作过程，可以参考前述方法实施例中的对应过程描述，在此不再赘述。

通过本实施例的电子设备，通过预先确定的交互策略对待标注图像进行处理，获得交互信息，将交互信息与待标注图像输入到预先训练好的标注模型中，通过标注模型推理即可获得可以指示待标注图像中目标对象类型的待标注文件。可见，通过交互策略可以获得交互信息，交互信息用于指示物体在图像中的位置，标注模型基于交互信息快速识别待识别图像中目标对象所处的位置，进而识别目标对象的类型，并生成可以指示目标对象类型的标注文件，标注过程无需人工参与，解决了人工标注耗时长、效率低的问题，实现了高效的对海量道路数据进行标注。

本申请实施例还提供了一种计算机程序产品，包括计算机指令，该计算机指令指示计算设备执行上述多个方法实施例中的任一方法对应的操作。

需要指出，根据实施的需要，可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤，也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤，以实现本申请实施例的目的。

上述根据本申请实施例的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，RAM、ROM、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的图像标注方法。此外，当通用计算机访问用于实现在此示出的图像标注方法的代码时，代码的执行将通用计算机转换为用于执行在此示出的图像标注方法的专用计算机。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请实施例的范围。

以上实施方式仅用于说明本申请实施例，而并非对本申请实施例的限制，有关技术领域的普通技术人员，在不脱离本申请实施例的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本申请实施例的范畴，本申请实施例的专利保护范围应由权利要求限定。

Claims

1.一种图像标注方法，其特征在于，包括：

获取待标注图像；

通过预先确定的交互策略对所述待标注图像进行处理，获得交互信息，其中，所述交互信息用于指示目标对象在所述待标注图像中的位置；

将所述交互信息和所述待标注图像输入到预先训练的标注模型，获得所述标注模型输出的标注文件，其中，所述标注模型输出的标注文件用于指示所述待标注图像中目标对象的类型。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取图像标注任务；

根据所述图像标注任务，确定所述交互策略和所述标注模型，其中，不同的图像标注任务对应不同的交互策略和标注模型的组合。

3.根据权利要求2所述的方法，其特征在于，所述根据所述图像标注任务，确定所述交互策略，包括：

根据所述图像标注任务，确定待标注的至少一个目标对象；

根据所述目标对象的类型，从预设的至少两个交互策略中确定与所述目标对象的类型相匹配的交互策略。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取包括街景数据的街景数据集；

使用所述街景数据集对预先构建的模型进行训练，获得所述标注模型；

将所述标注模型部署到云端，并对部署在云端的所述标注模型进行封装，以获得用于对所述标注模型进行调用的Web接口。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

检验所述标注文件中用于指示目标对象类型的第一标注标签是否与预设的至少一个第二标注标签相匹配；若所述第一标注标签与所述至少一个第二标注标签相匹配，则输出所述标注文件。

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

若所述第一标注标签与所述至少一个第二标注标签不匹配，则将所述待标注图像、所述交互信息和所述标注文件输入到所述标注模型，以重新对所述待标注图像中目标对象的类型进行标注。

7.根据权利要求5所述的方法，其特征在于，在所述输出所述标注文件后，所述方法还包括：

对输出的所述标注文件进行修正，直至所述标注文件的标注误差率、标注类别覆盖率和像素偏差满足预设条件，将修正后的所述标注文件存储到数据库中。

8.一种图像标注装置，其特征在于，所述装置包括：

获取模块，用于获取待标注图像；

图像处理模块，用于通过预先确定的交互策略对所述待标注图像进行处理，获得交互信息，其中，所述交互信息用于指示目标对象在所述待标注图像中的位置；

标注模块，用于将所述交互信息和所述待标注图像输入到预先训练的标注模型，获得所述标注模型输出的标注文件，其中，所述标注模型输出的标注文件用于指示所述待标注图像中目标对象的类型。

9.一种电子设备，其特征在于，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的方法对应的操作。

10.一种计算机存储介质，其特征在于，其上存储有计算机程序，该程序被处理器执行时实现如权利要求1-7中任一所述方法。