CN113723616A

CN113723616A - 一种多传感器信息半自动标注方法、系统及存储介质

Info

Publication number: CN113723616A
Application number: CN202110940701.3A
Authority: CN
Inventors: 张宇超; 秦超
Original assignee: Shanghai Intelligent and Connected Vehicle R&D Center Co Ltd
Current assignee: Shanghai Intelligent and Connected Vehicle R&D Center Co Ltd
Priority date: 2021-08-17
Filing date: 2021-08-17
Publication date: 2021-11-30

Abstract

本发明公开了一种多传感器信息半自动标注方法、系统及存储介质，该方法包括：采用待训练模型对感知数据进行预标注，得到对应的预标注信息；采用伴生模型对感知数据进行参照标注，得到对应的参照标注信息，并计算各条预标注信息与对应参照标注信息之间的损失值以及批次平均损失；对大于批次平均损失且大于预定阈值的损失值所对应的感知数据进行人工标注；采用人工标注结果对待训练模型以及伴生模型进行再训练。本发明采用的标注过程使得标注结果更加准确全面，得到的标注结果可以直接用于模型的训练且训练效果好。该系统中标注过程与训练过程交替进行，可快速实现反馈闭环优化，不断提高标注正确率以及待训练模型的准确率。

Description

一种多传感器信息半自动标注方法、系统及存储介质

技术领域

本发明涉及自动驾驶领域，尤其涉及一种多传感器信息半自动标注方法、系统及存储介质。

背景技术

在自动驾驶领域，通常采用多种传感器获取车辆周边的感知信息。现有的传感器包括激光雷达、摄像头、微波雷达、GPS，这些传感器检测到的信息形式不同，在标注过程中也需要采取不同的形式，例如包括2D框、3D框、深度图、语义分割、实例分割信息。

为了降低标注的过程量，需要采用半自动标注技术，然而现有的半自动标注技术的标注类别不全，不能同时标注出数据集的所有标注信息。很难快速将2D框、3D框、深度图、语义分割、实例分割信息的全部标注。现有的模型标注效果不好，标注后的数据的检测识别准确率低，需要大量的人工修正，人力成本高。目前，现有的半自动标注模型优化难度大，模型的泛化能力差。

发明内容

有鉴于现有技术的上述缺陷，本发明的目的是提供一种多传感器信息半自动标注方法、系统及存储介质，以解决现有技术中存在的上述问题。

本发明的上述技术目的通过以下技术方案得以实现：

为实现上述目的本发明提供了一种多传感器信息半自动标注方法，其包括：

采用待训练模型对感知数据进行预标注，得到对应的预标注信息；

采用伴生模型对感知数据进行参照标注，得到对应的参照标注信息；并计算各条预标注信息与对应参照标注信息之间的损失值以及批次平均损失；

对大于批次平均损失且大于预定阈值的损失值所对应的感知数据进行人工标注；

采用人工标注结果对待训练模型以及伴生模型进行再训练。

本发明的进一步改进在于，感知数据包括道路交通图像以及激光雷达点云数据。

本发明的进一步改进在于，预标注信息以及所述参照标注信息均包括2D框、3D框、深度图、语义分割和实例分割信息。

本发明的进一步改进在于，3D框信息包括目标中心点位置、物体长宽高、航向角和类别信息。

本发明还包括一种多传感器信息半自动标注系统，用于执行上述的多传感器信息半自动标注方法，其特征在于包括：

感知系统，用于获取感知数据；

数据中心，与所述感知系统通信连接，从所述感知系统获取感知数据并存储；

服务器Ⅰ，与所述数据中心通信连接，用于运行待训练模型；

服务器Ⅱ，与所述数据中心通信连接，用于运行伴生模型并计算损失值以及批次平均损失，并筛选出大于批次平均损失且大于预定阈值的损失值所对应的感知数据；

服务器Ⅲ，分别与所述服务器Ⅰ以及所述服务器Ⅱ通信连接，用于接收感知数据进行人工标注，并将感知数据以及人工标注结果发送至所述服务器Ⅰ以及所述服务器Ⅱ，以便所述服务器Ⅰ以及所述服务器Ⅱ对其运行的模型进行再训练。

本发明的进一步改进在于，感知系统包括摄像头以及激光雷达。

本发明的进一步改进在于，感知系统通过5G将感知数据上传至数据中心。

本发明还包括一种存储有计算机程序的计算机可读存储介质，该计算机程序被处理器执行时实现上述多传感器信息半自动标注方法的步骤。

本发明的有益技术效果为：本发明的标注过程使得标注结果更加准确全面，得到的标注结果可以直接用于模型的训练且训练效果好。该系统中标注过程与训练过程交替进行，可快速实现反馈闭环优化，不断提高标注正确率以及待训练模型的准确率。随着模型的性能逐渐提升，需要人工标注的感知数据越来越少，大大降低了数据标注成本。

附图说明

图1是本发明的多传感器信息半自动标注系统的硬件架构图；

图2是本发明的多传感器信息半自动标注系统的软件架构图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

如图1、2所示，本发明的实施例包括一种多传感器信息半自动标注系统，该系统包括：感知系统、数据中心、服务器Ⅰ、服务器Ⅱ以及服务器Ⅲ。

感知系统用于获取感知数据，其包括摄像头以及激光雷达。感知数据包括道路交通数据、路口道路交通图像以及激光雷达点云数据。数据中心与感知系统通信连接，从感知系统获取感知数据并存储，可实时获取道路交通信息以及感知信息。在一个具体实施例中，感知系统通过5G将感知数据上传至数据中心。

服务器Ⅰ以及服务器Ⅱ均与数据中心通信连接，以便从述数据中心获取感知数据。具体的：

服务器Ⅰ用于运行待训练模型。获得感知数据后，服务器Ⅰ采用待训练模型对感知数据进行预标注，得到对应的预标注信息。

服务器Ⅱ用于运行伴生模型，根据感知数据得到对应的参照标注信息，并计算参照标注信息与预标注信息之间的损失值以及批次平均损失，并筛选出大于批次平均损失且大于预定阈值的损失值所对应的感知数据。损失值大于批次平均损失，表示模型针对该感知数据需要进一步完善修正。

服务器Ⅲ分别与服务器Ⅰ以及服务器Ⅱ双向通信连接。服务器Ⅲ用于接收服务器Ⅱ筛选出的感知数据，并通过与标注员交互的方式对该感知数据进行人工标注，得到人工标注结果。标注完成后，服务器Ⅲ用于将感知数据以及人工标注结果发送至服务器Ⅰ以及服务器Ⅱ，以便服务器Ⅰ以及服务器Ⅱ对其运行的模型进行再训练，以提升待训练模型以及伴生模型的准确率。

待训练模型以及伴生模型均为基于神经网络的机器学习模型。二者具有相同形式的输入和输出，二者可采用现有的模型，也可采用定制的模型。计算损失过程中，可采用现有的损失函数计算预标注信息以及参照标注信息之间的损失。

模型的训练过程按照批次进行，在训练的初始阶段，批次平均损失值通常远大于预定阈值，随着模型不断拟合贴近理想模型，批次平均损失逐渐降低至预定阈值，此时仅对损失大于预设阈值的损失值对应的感知数据进行人工标注，大大降低了后期的标注总量以及标注成本。

为了确保待训练模型以及伴生模型的差异，在分批次训练过程中，当前批次的人工标注结果立即用于待训练模型再训练，而伴生模型延后一次批次，在下一批次的再训练过程中采用当前批次的人工标注结果进行再训练。此外，在两个模型的训练过程中，还可采用drop-out等训练方式增强训练过程的随机性。

人工标注过程中，标注员在服务器Ⅰ的预标注信息活服务器Ⅱ的参照标注信息的基础上进行修正，标注过程中仅需修改现有标注信息中的错误内容，降低了工作量，提高了标注效率。该标注过程使得标注结果更加准确全面，得到的标注结果可以直接用于模型的训练且训练效果好。该系统中标注过程与训练过程交替进行，可快速实现反馈闭环优化，不断提高标注正确率以及待训练模型的准确率。随着模型的性能逐渐提升，需要人工标注的感知数据越来越少，大大降低了数据标注成本。

如图1、2所示，本发明的实施例还包括一种多传感器信息半自动标注方法，该方法在上述的多传感器信息半自动标注系统运行，该方法包括：

采用人工标注结果对待训练模型以及伴生模型进行再训练。

本实施例中，感知数据包括道路交通图像以及激光雷达点云数据。预标注信息以及所述参照标注信息均包括2D框、3D框、深度图、语义分割和实例分割信息。3D框信息包括目标中心点位置、物体长宽高、航向角和类别信息。

本发明的实施例还包括一种存储有计算机程序的计算机可读存储介质，该计算机程序被处理器执行时实现上述方法的步骤。其中，处理器不限于典型的通用CPU，还包括CPU、DSP、FPGA、GPU以及专用处理器中的任意一种或若干种组合形成的电子系统。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

Claims

1.一种多传感器信息半自动标注方法，其特征在于包括：

采用人工标注结果对待训练模型以及伴生模型进行再训练。

2.根据权利要求1所述的一种多传感器信息半自动标注方法，其特征在于，所述感知数据包括道路交通图像以及激光雷达点云数据。

3.根据权利要求2所述的一种多传感器信息半自动标注方法，其特征在于，所述预标注信息以及所述参照标注信息均包括2D框、3D框、深度图、语义分割和实例分割信息。

4.根据权利要求3所述的一种多传感器信息半自动标注方法，其特征在于，所述3D框信息包括目标中心点位置、物体长宽高、航向角和类别信息。

5.一种多传感器信息半自动标注系统，用于执行权利要求1至4中任一所述的多传感器信息半自动标注方法，其特征在于包括：

感知系统，用于获取感知数据；

6.根据权利要求5所述的一种多传感器信息半自动标注系统，其特征在于，所述感知系统包括摄像头以及激光雷达。

7.根据权利要求5所述的一种多传感器信息半自动标注系统，其特征在于，所述感知系统通过5G将感知数据上传至数据中心。

8.一种存储有计算机程序的计算机可读存储介质，其特征在于，所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。