CN113326825A

CN113326825A - 伪标签生成方法、装置、电子设备及存储介质

Info

Publication number: CN113326825A
Application number: CN202110883881.6A
Authority: CN
Inventors: 王力超
Original assignee: Neolix Technologies Co Ltd
Current assignee: Neolix Technologies Co Ltd
Priority date: 2021-08-03
Filing date: 2021-08-03
Publication date: 2021-08-31

Abstract

本公开涉及人工智能技术领域，提供了一种伪标签生成方法、装置、电子设备及存储介质。该方法应用于无人车，即无人驾驶设备或自动驾驶设备，包括：利用点云数据集中的有标签数据对网络模型进行训练；执行推理步骤，以利用训练得到的网络模型对点云数据集中的无标签数据进行推理，得到无标签数据的置信度和置信度的不确定性估计；基于置信度和置信度的不确定性估计计算新的置信度；基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据；执行第二训练步骤，以利用伪标签数据和有标签数据对网络模型进行训练；交替执行推理和第二训练步骤，直至满足网络模型的训练结束条件。本公开提升了网络模型的泛化性能。

Description

伪标签生成方法、装置、电子设备及存储介质

技术领域

本公开涉及人工智能技术领域，尤其涉及一种伪标签生成方法、装置、电子设备及计算机可读存储介质。

背景技术

伪标签是监督机器学习一种常见技术，是指使用标签数据训练模型，然后再使用训练的模型为不加标签的数据预测标签，该预测标签即伪标签。生成伪标签可以将一些未加标签的数据加入到有标签的数据中，以此来共同训练模型，以提高模型的质量。

目前，监督机器学习算法大都最大后验来训练，产生的往往是一个点估计而不是不确定值，具体来说，Softmax层（神经网络中的一种激活函数）之后的概率向量可以用来解释模型的置信度。但是实际上模型依然会对具有很大Softmax输出的预测表明较大的不确定性。因此，无论样本被贴上的伪标签正确与否，这些标签都有很高的置信度。如果大量的无标注样本被贴上错的标签并用作训练，将导致训练集中存在大量的噪声样本，从而严重影响模型的性能。

发明内容

有鉴于此，本公开实施例提供了一种伪标签生成方法、装置、电子设备及计算机可读存储介质，以解决现有技术中大量的无标注样本被贴上错的标签并用作训练，导致训练集中存在大量的噪声样本，从而严重影响模型的性能的问题。

本公开实施例的第一方面，提供了一种伪标签生成方法，包括：执行第一训练步骤，以利用点云数据集中的有标签数据对网络模型进行训练；执行推理步骤，以利用训练得到的网络模型对点云数据集中的无标签数据进行推理，得到无标签数据的置信度和置信度的不确定性估计；执行计算步骤，以基于置信度和置信度的不确定性估计计算新的置信度；执行处理步骤，以基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据；执行第二训练步骤，以利用伪标签数据和有标签数据对网络模型进行训练；交替执行推理步骤和第二训练步骤，直至满足网络模型的训练结束条件。

本公开实施例的第二方面，提供了一种伪标签生成装置，包括：第一训练模块，被配置为执行第一训练步骤，以利用点云数据集中的有标签数据对网络模型进行训练；推理模块，被配置为执行推理步骤，以利用训练得到的网络模型对点云数据集中的无标签数据进行推理，得到无标签数据的置信度和置信度的不确定性估计；计算模块，被配置为执行计算步骤，以基于置信度和置信度的不确定性估计计算新的置信度；处理模块，被配置为执行处理步骤，以基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据；第二训练模块，被配置为执行第二训练步骤，以利用伪标签数据和有标签数据对网络模型进行训练；交替模块，被配置为交替执行推理步骤和第二训练步骤，直至满足伪标签生成结束条件。

本公开实施例的第三方面，提供了一种电子设备，包括存储器、处理器以及存储在存储器中并且可以在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。

本公开实施例的第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

本公开实施例与现有技术相比存在的有益效果是：通过执行第一训练步骤，以利用点云数据集中的有标签数据对网络模型进行训练；执行推理步骤，以利用训练得到的网络模型对点云数据集中的无标签数据进行推理，得到无标签数据的置信度和置信度的不确定性估计；执行计算步骤，以基于置信度和置信度的不确定性估计计算新的置信度；执行处理步骤，以基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据；执行第二训练步骤，以利用伪标签数据和有标签数据对网络模型进行训练；交替执行推理步骤和第二训练步骤，直至满足网络模型的训练结束条件，能够基于置信度和置信度的不确定性估计计算新的置信度，并基于新的置信度生成无标签数据的伪标签数据，进而利用所生成的更准确的伪标签数据和有标签数据对网络模型进行训练，因此，提升了网络模型的性能，并提高了网络模型的预测准确率。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本公开实施例提供的一种伪标签生成方法的流程图；

图2是本公开实施例提供的另一种伪标签生成方法的流程图；

图3是本公开实施例提供的一种伪标签生成装置的框图；

图4是本公开实施例提供的电子设备的示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本公开实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本公开的描述。

下面将结合附图详细说明根据本公开实施例的一种伪标签生成方法和装置。

图1是本公开实施例提供的一种伪标签生成方法的流程图。如图1所示，该伪标签生成方法包括：

S101，执行第一训练步骤，以利用点云数据集中的有标签数据对网络模型进行训练；

S102，执行推理步骤，以利用训练得到的网络模型对点云数据集中的无标签数据进行推理，得到无标签数据的置信度和置信度的不确定性估计；

S103，执行计算步骤，以基于置信度和置信度的不确定性估计计算新的置信度；

S104，执行处理步骤，以基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据；

S105，执行第二训练步骤，以利用伪标签数据和有标签数据对网络模型进行训练；

S106，交替执行推理步骤和第二训练步骤，直至满足网络模型的训练结束条件。

具体地，在利用点云数据集中的有标签数据对网络模型进行训练时，可以将有标签数据输入至网络模型，以通过对网络模型进行训练来得到训练好的网络模型；在生成无标签数据的伪标签数据时，可以利用训练得到的网络模型对点云数据集中的无标签数据进行推理，得到无标签数据的置信度和置信度的不确定性估计，基于置信度和置信度的不确定性估计来计算新的置信度，并基于新的置信度对无标签数据进行打上伪标签的处理以生成伪标签数据；进一步地，将所生成的伪标签数据和有标签数据输入至网络模型，以通过对网络模型进行训练来得到训练好的网络模型；交替执行推理步骤和第二训练步骤，直至网络模型饱和，即，循环所达到的最大迭代次数。

这里，点云数据是指在一个三维坐标系统中的一组向量的集合。点云数据除了具有几何位置以外，有的还有颜色信息，颜色信息通常是通过相机获取彩色影像，再将对应位置的像素的颜色信息（RGB）赋予点云中对应的点。大多数点云数据是由三维（3D）扫描设备产生的，例如，激光雷达（2D/3D）、立体摄像头（stereo camera）、越渡时间相机（time-of-flight camera）等。这些设备用自动化的方式测量在物体表面的大量的点的信息，再用某种数据文件输出点云数据。在本公开实施例中，点云数据也可以理解为训练数据，是数据挖掘过程中用于训练网络模型的数据。各个点云数据可以构成点云数据集，该点云数据集可以包括有标签数据和无标签数据。有标签数据是指通过人工借助标记工具对人工智能学习数据进行标注加工后得到的数据，例如，对上述点云数据进行标注后得到的数据即为有标签数据。无标签数据是指未进行标注加工的数据。

机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。机器学习可以分为监督学习、无监督学习和半监督学习，这里，监督学习的所有数据都是有标签数据，无监督学习的所有数据都是无标签数据，半监督学习的部分数据是有标签数据，但大部分数据是无标签数据。

网络模型本质是一种机器学习算法，具体为一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科，专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。网络模型可以具有半监督学习模型的网络结构，包括但不限于点体素集成网络（PointVoxel-RCNN，PV-RCNN）、VAT、LPDSSL、TNAR、pseudo-label、DCT、mean teacher模型中的任一种。优选地，在本公开实施例中，网络模型为PV-RCNN。

训练（Training）和（Inference）推理是一个完整的深度架构中应该包含的两个主要部分。训练是指一个初始神经网络通过不断的优化自身参数来让自己变得准确的过程，训练数据集是有标签的。推理是指将现场数据（即，无标签数据）输入至训练完成的网络模型进行预测的过程。

置信度也称为可靠度，或置信水平、置信系数，是指特定个体对待特定命题真实性相信的程度，也就是概率是对个人信念合理性的量度。在本公开实施例中，置信度是指使用训练得到的网络模型推理得到目标的概率。

置信度的不确定性估计是指模型自身对输入数据的估计因为训练不佳、训练数据不够等原因而不准确的概率估计。以人脸识别为例，假设将一张图像输入至网络模型，得到该图像为与某一个ID相似度的概率（即，置信度）为95%；接着，将另外一张模糊的图像输入至该网络模型，此时，该网络模型给出的结果可能同样是95%，但两张图像的ID实际上并不一样，也就是说，相似度得分无法反映出两张图片属于同一ID，即，该相似度结果是不可信的。此时，需要一个能判断此相似度是否可信的得分，即，置信度的不确定性估计。

伪标签技术是利用在已标注数据所训练的模型在未标注的数据上进行预测，根据预测结果对样本进行筛选，再次输入模型中进行训练的一个过程。伪标签数据也称为软伪标签数据，表示伪标签数据中的标签数据是根据已有标签预测出来的，也就是说，伪标签数据中的标签数据并非真实的标签数据，而是基于已有标签近似得到的标签数据。由于伪标签数据的标签并非是真实标签，为了提高网络模型的准确率，可选地，在生成训练好的网络模型之前，可以根据有标签数据中的标签数据对网络模型进行训练，并调整网络模型的参数。

进一步地，由于伪标签数据的标签并不是完全准确的，为了避免因标签不准确而对网络模型的训练性能造成影响，可选地，在利用伪标签数据对网络模型进行训练时，可以通过置信学习等方法确定伪标签数据中各标签的标签置信度，并根据标签置信度对伪标签数据进行筛选，以得到标签置信度较高的数据。这里，标签置信度也称为标签可靠度，或者标签置信水平、置信系数、置信值等，可以用于衡量标签的真实值有一定概率落在测量结果周围的程度。

迭代是指程序中对一组指令（或一定步骤）的重复。迭代可以被用作通用的术语（与“重复”同义），也可以用来描述一种特定形式的具有可变状态的重复。由于数值迭代是逐步逼近最优点而获得近似解的，其无限地接近于最优点却又不是理论上的最优点，因此，需要考虑在什么样的条件下才终止迭代，获得一个足够精度的近似极小点，这一条件就是迭代计算的终止准则。对于最优化问题，常用的迭代过程终止准则可以包括但不限于点距准则、函数下降量准则、梯度准则等。

最大迭代次数可以是用户根据经验数据预先设置的阈值，也可以是用户根据所传输的视频图像的清晰度对已设置的间隔进行调整后得到的阈值，本公开实施例对此不作限制。在本公开实施例中，最大迭代次数可以根据实际需要设置，例如，可以为2次、5次、8次、10次、15次、20次、30次等。

需要说明的是，由于迭代计算是一个推算过程，逐渐产生最接近真实结果的解，因此，其得到的解有可能正确，也有可能错误，但误差会相当小。在选项中设置的误差值和迭代计算次数直接影响所得到的解的正确性，次数越大越接近真实的解，但也会耗费更长的时间。

根据本公开实施例提供的技术方案，通过执行第一训练步骤，以利用点云数据集中的有标签数据对网络模型进行训练；执行推理步骤，以利用训练得到的网络模型对点云数据集中的无标签数据进行推理，得到无标签数据的置信度和置信度的不确定性估计；执行计算步骤，以基于置信度和置信度的不确定性估计计算新的置信度；执行处理步骤，以基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据；执行第二训练步骤，以利用伪标签数据和有标签数据对网络模型进行训练；交替执行推理步骤和第二训练步骤，直至满足网络模型的训练结束条件，能够基于置信度和置信度的不确定性估计计算新的置信度，并基于新的置信度生成无标签数据的伪标签数据，进而利用所生成的更准确的伪标签数据和有标签数据对网络模型进行训练，因此，提升了网络模型的性能，并提高了网络模型的预测准确率。

在一些实施例中，执行推理步骤，以利用训练得到的网络模型对点云数据集中的无标签数据进行推理，得到无标签数据的置信度和置信度的不确定性估计，包括：利用训练得到的网络模型对无标签数据进行N次前向推理，得到无标签数据的N个置信度；计算N个置信度的第一置信度均值，并基于N个置信度和第一置信度均值计算无标签数据的标准差；将标准差与标准差阈值进行比较，并基于比较结果得到无标签数据的置信度和置信度的不确定性估计。

具体地，搜索的目的是找到通过问题空间的路径。通常，有两种方法可以进行这种前后推理的搜索，而两者之间的显著差异在于前向推理始于朝向目标的初始数据；后向推理以与前向推理相反的方式工作，目的是在给定结果的帮助下确定初始事实和信息。在本公开实施例中，前向推理是指使用无标签数据在网络模型中沿网络结构向前推理来得到无标签数据的置信度的过程。

均值也称为平均数，是指在一组数据中所有数据之和再除以这组数据的个数，均值是反映数据集中趋势的一项指标。在本公开实施例中，通过将一个无标签数据进行一次前向推理，能够得到一个对应的置信度，计算所有无标签数据进行N次向前推理得到的N个置信度之和，再除以个数N，便可以得到N个置信度的均值，即，第一置信度均值。

标准差（Standard Deviation）是离均差平方的算术平均数（即，方差）的算术平方根，一般用σ表示。简单来说，标准差是一组数据平均值分散程度的一种度量。以无标签数据的标准差为例，较大的标准差表征N个置信度中大部分置信度和第一置信度均值之间差异较大；相反，较小的标准差表征N个置信度接近第一置信度均值。

标准差阈值可以是用户根据经验数据预先设置的标准差阈值，也可以是用户根据实际需要对已设置的标准差阈值进行调整后得到的标准差阈值，本公开实施例对此不作限制。

在一些实施例中，基于比较结果得到无标签数据的置信度和置信度的不确定性估计，包括：在标准差小于标准差阈值的情况下，计算N个置信度中小于标准差阈值的M个置信度的第二置信度均值，并将第二置信度均值作为无标签数据的新的置信度，其中，N为大于或等于2的正整数，且N大于M。

具体地，在标准差小于标准差阈值的情况下，计算N个置信度中小于标准差阈值的M个置信度的第二置信度均值，并将该第二置信度均值作为无标签数据的新的置信度；在标准差大于或等于标准差阈值的情况下，放弃无标签数据，这里，N为大于或等于2的正整数，且N大于M。

在一些实施例中，基于N个置信度和第一置信度均值计算无标签数据的标准差，包括：基于N个置信度和第一置信度均值，并通过如下公式计算无标签数据的标准差：

，其中，σ表示标准差，

表示无标签数据的第

个置信度，

表示第一置信度均值。

在一些实施例中，执行处理步骤，以基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据，包括：在新的置信度大于置信度阈值的情况下，基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据。

具体地，在新的置信度大于置信度阈值的情况下，基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据；在新的置信度小于或等于置信度阈值的情况下，放弃无标签数据。

这里，置信度阈值可以是用户根据经验数据预先设置的置信度阈值，也可以是用户根据实际需要对已设置的置信度阈值进行调整后得到的置信度阈值，本公开实施例对此不作限制。

放弃无标签数据是指放弃对无标签数据进行打上伪标签的处理，即，放弃对无标签数据进行标注，因此，通过将生成的伪标签数据与之前的有标签数据一起重新对网络模型进行训练，能够进一步优化网络模型的参数。在得到参数优化后的新的网络模型的情况下，可以使用新的网络模型对无标签数据进行推理来生成新的置信度，并根据新的置信度重新对无标签数据进行打上伪标签的处理，以生成伪标签数据，如此循环来增加生成伪标签数据的有标签数据的数量。

图2是本公开实施例提供的另一种伪标签生成方法的流程图。如图2所示，该伪标签生成方法包括：

S201，利用点云数据集中的有标签数据对网络模型进行训练；

S202，利用训练得到的网络模型对无标签数据进行N次前向推理，得到无标签数据的N个置信度；

S203，计算N个置信度的第一置信度均值，并基于N个置信度和第一置信度均值计算无标签数据的标准差；

S204，在标准差小于标准差阈值的情况下，计算N个置信度中小于标准差阈值的M个置信度的第二置信度均值作为无标签数据的新的置信度；

S205，基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据；

S206，利用伪标签数据和有标签数据对网络模型进行训练；

S207，确定是否满足网络模型的训练结束条件，如果是，则执行S208；否则，执行S202；

S208，将训练得到的网络模型部署到车辆中，其中，车辆包括自动驾驶车辆或无人驾驶车辆。

根据本公开实施例提供的技术方案，通过利用点云数据集中的有标签数据对网络模型进行训练；利用训练得到的网络模型对无标签数据进行N次前向推理，得到无标签数据的N个置信度；计算N个置信度的第一置信度均值，并基于N个置信度和第一置信度均值计算无标签数据的标准差；在标准差小于标准差阈值的情况下，计算N个置信度中小于标准差阈值的M个置信度的第二置信度均值作为无标签数据的新的置信度；基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据；利用伪标签数据和有标签数据对网络模型进行训练；在确定满足网络模型的训练结束条件的情况下，将训练得到的网络模型部署到车辆中；在确定不满足网络模型的训练结束条件的情况下，返回执行利用训练得到的网络模型对无标签数据进行N次前向推理，得到无标签数据的N个置信度的步骤，能够基于置信度和置信度的不确定性估计计算新的置信度，并基于新的置信度生成无标签数据的伪标签数据，进而利用所生成的更准确的伪标签数据和有标签数据对网络模型进行训练，因此，提升了网络模型的性能，并提高了网络模型的预测准确率。

上述所有可选技术方案，可以采用任意结合形成本申请的可选实施例，在此不再一一赘述。

下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开方法实施例。

图3是本公开实施例提供的一种伪标签生成装置的示意图。如图3所示，该伪标签生成装置包括：

第一训练模块301，被配置为执行第一训练步骤，以利用点云数据集中的有标签数据对网络模型进行训练；

推理模块302，被配置为执行推理步骤，以利用训练得到的网络模型对点云数据集中的无标签数据进行推理，得到无标签数据的置信度和置信度的不确定性估计；

计算模块303，被配置为执行计算步骤，以基于置信度和置信度的不确定性估计计算新的置信度；

处理模块304，被配置为执行处理步骤，以基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据；

第二训练模块305，被配置为执行第二训练步骤，以利用伪标签数据和有标签数据对网络模型进行训练；

交替模块306，被配置为交替执行推理步骤和第二训练步骤，直至满足网络模型的训练结束条件。

在一些实施例中，图3的推理模块302利用训练得到的网络模型对无标签数据进行N次前向推理，得到无标签数据的N个置信度；计算N个置信度的第一置信度均值，并基于N个置信度和第一置信度均值计算无标签数据的标准差；将标准差与标准差阈值进行比较，并基于比较结果得到无标签数据的置信度和置信度的不确定性估计。

在一些实施例中，在标准差小于标准差阈值的情况下，图3的计算模块303计算N个置信度中小于标准差阈值的M个置信度的第二置信度均值，并将第二置信度均值作为无标签数据的新的置信度，其中，N为大于或等于2的正整数，且N大于M。

在一些实施例中，图3的推理模块302基于N个置信度和第一置信度均值，并通过如下公式计算无标签数据的标准差：

，其中，σ表示标准差，

表示无标签数据的第

个置信度，

表示第一置信度均值。

在一些实施例中，在新的置信度大于置信度阈值的情况下，图3的处理模块304基于新的置信度对无标签数据进行打上伪标签的处理，生成无标签数据的伪标签数据。

在一些实施例中，该伪标签生成装置还包括：部署模块307，被配置为将训练得到的网络模型部署到车辆中，其中，车辆包括自动驾驶车辆或无人驾驶车辆。

在一些实施例中，网络模型为点体素集成网络。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本公开实施例的实施过程构成任何限定。

图4是本公开实施例提供的电子设备4的示意图。如图4所示，该实施例的电子设备4包括：处理器401、存储器402以及存储在该存储器402中并且可以在处理器401上运行的计算机程序403。处理器401执行计算机程序403时实现上述各个方法实施例中的步骤。或者，处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元的功能。

示例性地，计算机程序403可以被分割成一个或多个模块/单元，一个或多个模块/单元被存储在存储器402中，并由处理器401执行，以完成本公开。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序403在电子设备4中的执行过程。

电子设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算机设备。电子设备4可以包括但不仅限于处理器401和存储器402。本领域技术人员可以理解，图4仅仅是电子设备4的示例，并不构成对电子设备4的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如，电子设备还可以包括输入输出设备、网络接入设备、总线等。

处理器401可以是中央处理单元（Central Processing Unit，CPU），也可以是其它通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器402可以是电子设备4的内部存储单元，例如，电子设备4的硬盘或内存。存储器402也可以是电子设备4的外部存储设备，例如，电子设备4上配备的插接式硬盘，智能存储卡（Smart Media Card，SMC），安全数字（Secure Digital，SD）卡，闪存卡（Flash Card）等。进一步地，存储器402还可以既包括电子设备4的内部存储单元也包括外部存储设备。存储器402用于存储计算机程序以及电子设备所需的其它程序和数据。存储器402还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。

在本公开所提供的实施例中，应该理解到，所揭露的装置/电子设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/电子设备实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本公开实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可以存储在计算机可读存储介质中，该计算机程序在被处理器执行时，可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random Access Memory，RAM）、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如，在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

以上实施例仅用以说明本公开的技术方案，而非对其限制；尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围，均应包含在本公开的保护范围之内。

Claims

1.一种伪标签生成方法，其特征在于，包括：

执行第一训练步骤，以利用点云数据集中的有标签数据对网络模型进行训练；

执行推理步骤，以利用训练得到的网络模型对所述点云数据集中的无标签数据进行推理，得到所述无标签数据的置信度和所述置信度的不确定性估计；

执行计算步骤，以基于所述置信度和所述置信度的不确定性估计计算新的置信度；

执行处理步骤，以基于所述新的置信度对所述无标签数据进行打上伪标签的处理，生成所述无标签数据的伪标签数据；

执行第二训练步骤，以利用所述伪标签数据和所述有标签数据对所述网络模型进行训练；

交替执行所述推理步骤和所述第二训练步骤，直至满足所述网络模型的训练结束条件。

2.根据权利要求1所述的方法，其特征在于，所述执行推理步骤，以利用训练得到的网络模型对所述点云数据集中的无标签数据进行推理，得到所述无标签数据的置信度和所述置信度的不确定性估计，包括：

利用所述训练得到的网络模型对所述无标签数据进行N次前向推理，得到所述无标签数据的N个置信度；

计算所述N个置信度的第一置信度均值，并基于所述N个置信度和所述第一置信度均值计算所述无标签数据的标准差；

将所述标准差与标准差阈值进行比较，并基于比较结果得到所述无标签数据的置信度和所述置信度的不确定性估计。

3.根据权利要求2所述的方法，其特征在于，所述执行计算步骤，以基于所述置信度和所述置信度的不确定性估计计算新的置信度，包括：

在所述标准差小于所述标准差阈值的情况下，计算所述N个置信度中小于所述标准差阈值的M个置信度的第二置信度均值，并将所述第二置信度均值作为所述无标签数据的所述新的置信度，其中，N为大于或等于2的正整数，且N大于M。

4.根据权利要求2所述的方法，其特征在于，所述基于所述N个置信度和所述第一置信度均值计算所述无标签数据的标准差，包括：

基于所述N个置信度和所述第一置信度均值，并通过如下公式计算所述无标签数据的标准差：

，

其中，σ表示所述标准差，

表示所述无标签数据的第

个置信度，

表示所述第一置信度均值。

5.根据权利要求1所述的方法，其特征在于，所述执行处理步骤，以基于所述新的置信度对所述无标签数据进行打上伪标签的处理，生成所述无标签数据的伪标签数据，包括：

在所述新的置信度大于置信度阈值的情况下，基于所述新的置信度对所述无标签数据进行打上伪标签的处理，生成所述无标签数据的伪标签数据。

6.根据权利要求1至5中任一项所述的方法，其特征在于，所述方法还包括：

将训练得到的网络模型部署到车辆中，其中，所述车辆包括自动驾驶车辆或无人驾驶车辆。

7.根据权利要求1至5中任一项所述的方法，其特征在于，所述网络模型为点体素集成网络。

8.一种伪标签生成装置，其特征在于，包括：

第一训练模块，被配置为执行第一训练步骤，以利用点云数据集中的有标签数据对网络模型进行训练；

推理模块，被配置为执行推理步骤，以利用训练得到的网络模型对所述点云数据集中的无标签数据进行推理，得到所述无标签数据的置信度和所述置信度的不确定性估计；

计算模块，被配置为执行计算步骤，以基于所述置信度和所述置信度的不确定性估计计算新的置信度；

处理模块，被配置为执行处理步骤，以基于所述新的置信度对所述无标签数据进行打上伪标签的处理，生成所述无标签数据的伪标签数据；

第二训练模块，被配置为执行第二训练步骤，以利用所述伪标签数据和所述有标签数据对所述网络模型进行训练；

交替模块，被配置为交替执行所述推理步骤和所述第二训练步骤，直至满足所述网络模型的训练结束条件。

9.一种电子设备，包括存储器、处理器以及存储在所述存储器中并且可以在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。