CN113128550A

CN113128550A - 用于数据有效的主动机器学习的设备和计算机实现的方法

Info

Publication number: CN113128550A
Application number: CN202110039638.6A
Authority: CN
Inventors: C·哈塞-许茨; P·莫勒
Original assignee: Robert Bosch GmbH
Current assignee: Robert Bosch GmbH
Priority date: 2020-01-14
Filing date: 2021-01-13
Publication date: 2021-07-16
Also published as: US20210216912A1; DE102020200340A1

Abstract

用于主动机器学习的设备和计算机实现的方法，其中提供（206）带注释数据，其中根据所述带注释数据对模型进行训练（208）以对所述数据进行分类，其中根据所述带注释数据，就通过所述模型对所述带注释数据进行分类的正确性的置信度而言对这样训练的模型进行校准（210），其中利用这样校准的模型为未注释数据确定（212）对所述未注释数据进行分类的正确性的置信度，以及其中从所述未注释数据中为所述主动机器学习采集置信度满足标准的未注释数据。

Description

用于数据有效的主动机器学习的设备和计算机实现的方法

背景技术

受监视的学习用作许多应用的基础。尤其是用在相机图像的分类、传感器测量中的对象探测或用于语音到文本的转换。

受监视的学习大多需要大量的所谓训练数据，包括标记，即注释。获得这些训练数据可能是非常费事的。

发明内容

一种用于主动机器学习的计算机实现的方法规定，提供带注释数据，其中根据所述带注释数据对模型进行训练以对所述数据进行分类，其中根据所述带注释数据，就通过所述模型对所述带注释数据进行分类的正确性的置信度而言对这样训练的模型进行校准，其中利用这样校准的模型为未注释数据确定对所述未注释数据进行分类的正确性的置信度，以及其中从所述未注释数据中为所述主动机器学习采集其置信度满足标准的未注释数据。由此减少了总共需要的注释耗费。

优选地提供未注释数据的集合，其中从未注释数据的所述集合中选择子集合，其中通过特别是手动地、半自动地或自动地注释来自所述子集合的未注释数据来确定所述带注释数据。如果给定最初未标记的、即未注释的样本，则在第一步骤中仅标记、即注释一小部分数据。例如可以随机选择所述子集合。

优选地，所述子集合包括为所述主动机器学习采集的未注释数据。由此借助于合适的采集函数来选择要注释的下一部分。

所述置信度可以根据通过所述模型的分类是否正确的至少一个概率来定义所述置信度。由此选择了特别适合于所述训练的数据。

优选地，所述标准为来自所述未注释数据的模式定义了两个类别，与可以由所述模型将所述模式分类到的其他类别相比，这两个类别具有最大的概率，其中从所述未注释数据中采集以下模式，即，针对这些模式所述两个类别的概率之差超过阈值。特别是对于深度神经网络而言，这代表了更快且更好的采集函数。例如，首先借助于温度缩放对经过训练的深度神经网络进行校准，然后将置信度差用作采集函数。

优选地对所述模型进行迭代地训练和校准，其中检查是否满足终止标准，并且其中当满足所述终止标准时结束所述主动机器学习。这逐渐改善了准确性。

所述终止标准可以为通过所述模型对带注释数据或未注释数据进行分类的准确性定义基准，其中当所述分类的准确性达到或超过所述基准时，所述终止标准得以满足。由此一直迭代地训练到期望的准确性为止。

优选地，根据所述带注释数据的正确分类的预期比例和所述带注释数据的正确分类的经验比例来校准所述模型的至少一个参数。

优选地，为了在所述方法的第一次迭代中确定所述带注释数据，随机地选择未注释数据。

优选地，为所述子集合从所述未注释数据中仅选择尚未为所述子集合采集的数据。

用于主动机器学习的设备被构造为执行所述方法。

附图说明

从下面的描述和附图中得出其他有利的实施方式。在附图中：

图1示出了用于主动机器学习的设备的示意图，

图2示出了用于主动机器学习的方法中的步骤。

具体实施方式

图1中示出的用于主动机器学习的设备100被构造为执行以下描述的方法。

设备100包括计算装置102和至少一个用于数据的存储器，所述计算装置特别是一个或多个处理器。设备100包括模型104。

设备100可以被构造为用于数字图像处理，在所述数字图像处理中通过模型104对数字图像进行分类。以下使用基于模型104的采集函数。在该示例中，模型104是单个深度神经网络。模型104也可以由多个特别是深度神经网络形成或具有其他体系架构。

用于机器学习的系统106可以包括设备100、用于检测数字图像的检测装置108以及用于机器的操控装置110。系统106可以被构造为根据将检测到的数字图像分类到多个类别中的一个类别中来操控所述机器。所述机器可以是车辆或机器人。代替对数字图像的分类，可以规定用于在传感器测量中探测对象或用于语音到文本转换的分类。代替检测数字图像，可以使用常用传感器测量，诸如例如来自雷达或激光雷达传感器的3D传感器测量。

基于图2描述用于主动机器学习的计算机实现的方法。使用所述方法来训练模型104，然后可以在系统106中使用该模型。所述方法假设已经设定了模型104的体系架构，并且已经初始化了模型104的参数。在该示例中，模型104是深度神经网络，其超参数定义了输入层、输出层以及输入层和输出层之间的大量隐藏层。所述深度神经网络的参数被如下确定。

尤其是深度神经网络可能具有不佳的校准。为了确定合适的校准，将基于置信度的正确预测的预期比例与正确预测的经验比例进行比较。从所述深度神经网络输出的置信度与测试样本上的经验准确性不一致。

为了所述校准在该示例中使用温度缩放方法。该方法被描述在Guo，C., Pleiss，G., Sun，Y., &Weinberger，K.Q.（2017年8月）.On calibration of modern neuralnetworks. In Proceedings of the 34th International Conference on MachineLearning-Volume 70(1321-1330页). JMLR. org中。

这意味着在训练了模型104之后执行所述校准。在所述校准之后，网络的置信度与经验准确性的一致性比校准前更好。

在该示例中，如在Luo, Tong等人的“Active learning to recognize multipletypes of plankton”，Journal of Machine Learning Research，2005年4月6日：589-613中所描述的那样形成具有最高概率的两个类别之差。

两个类别之差在所述方法中用作采集函数。该采集函数比形成例如整体平均值更好且更快。因此，经过校准的差提供更好的结果。

所述方法基于受监视的学习。对于受监视的学习，需要包括标记（即注释）的训练数据。这些注释用作目标输出，以便能够应用优化算法。取决于应用，创建这样的训练数据集是非常费事的。3D传感器测量（即例如点云，如可以由雷达或激光雷达传感器提供的点云）的标记非常费事并且需要专业知识。在医学成像领域，从数字图像中获得训练数据也可能是非常费事的。

可以随机地初始化模型104的参数，所述模型在该示例中即是深度人工神经网络。

在步骤202中提供未注释数据的集合。所述未注释数据包括模式，在该示例中是数字图像或数字图像的表示。然后执行步骤204。

在步骤204中，从未注释数据的集合中选择用于确定带注释数据的子集合。所述子集合包括为所述主动机器学习采集的未注释数据。

在所述方法的第一次迭代中，在步骤204中从未注释数据的集合中随机选择所述子集合。

优选地，在步骤204中为所述子集合从所述未注释数据中仅选择尚未在先前迭代中为所述子集合采集的数据。

然后执行步骤206。

在步骤206中提供带注释数据。可以通过对来自所述子集合的未注释数据进行手动、半自动或自动注释来确定所述带注释数据。为此，例如显示数字图像并由人设置标记。也可以使用自动化的标记方法。

然后执行步骤208。

在步骤208中根据所述带注释数据对模型104（在该示例中为深度神经网络）进行训练，以对所述数据进行分类。例如，借助于梯度下降方法（例如ADAM）通过利用来自所述子集合的带注释数据进行受监视的学习来进行所述训练。

然后执行步骤210。

在步骤210中，根据所述带注释数据就通过所述模型对所述带注释数据进行分类的正确性的置信度而言来校准这样训练的模型104。在该示例中，根据通过所述模型的分类是否正确的至少一个概率来定义所述置信度。

例如，根据所述带注释数据的正确分类的预期比例和所述带注释数据的正确分类的经验比例，对模型104的至少一个参数进行校准。

在该示例中使用了温度缩放，其中将输入X和标记Y的完美校准指定为

，

其中

是分类，

是与该分类关联的置信度。

正确分类的预期比例通过正确分类的预期值指定。正确分类的经验比例根据所述带注释数据以及通过模型104对所述带注释数据的分类来确定。为了进行所述校准，确定模型104（即深度神经网络）的以下参数，所述参数将以下指定的预期校准误差最小化：

。

然后执行步骤212。

在步骤212中，利用这样校准的模型对所述未注释数据确定所述未注释数据的分类正确性的置信度。

从所述未注释数据中为主动机器学习采集其置信度满足标准的未注释数据。

在该示例中，使用根据“决胜法”（breaking ties）方案的主动学习，以改善多类别分类的置信度。因此，将argmax_pP(p)分配给类别表示x，使得P(a)给定类别a的最大概率，而P(b)给定类别b的第二最大概率。在这种情况下，从所述未注释数据中消除使得P(a)和P(b)之间的差最小的数据。

该标准为来自所述未注释数据的模式定义了两个类别，这里为类别a和类别b，与可以由所述模型将所述模式分类到的其他类别相比，这两个类别具有最大概率，这里是P(a)和P(b)。采集来自所述未注释数据的以下模式，对于这些模式所述两个类别的概率之差（这里为差P(a)-P(b)）超过阈值。可以根据所述其他类别的概率来定义所述阈值。例如，通过与瞬时最大概率P(a)和瞬时第二最大概率P(b)之间的差P(a)- P(b)相比较的两个类别的概率之差来定义所述阈值。

优选地，迭代地对模型104进行训练和校准。

在此，可以在步骤214中检查是否满足终止标准，并且当满足所述终止标准时结束所述主动机器学习。

在该示例中，这意味着以该顺序或其他顺序重复执行步骤202至214。

所述终止标准可以为通过所述模型对带数据注释或未注释数据进行分类的准确性定义基准。例如，如果所述分类的准确性达到或超过所述基准，则满足所述终止标准。

例如，当存在高质量的带注释数据时，可以检查对所述深度神经网络的校准。例如，将所述深度神经网络的置信度（例如0.8）与经验准确性进行比较。在校准正确的情况下那将是例如80％正确的预测。

可以将不同的采集函数用于给定的网络体系架构。可以通过比较达到特定的准确性所需的训练数据量来对所述不同的采集函数进行比较。

Claims

1.一种用于主动机器学习的计算机实现的方法，其特征在于，提供（206）带注释数据，其中根据所述带注释数据对模型进行训练（208）以对所述数据进行分类，其中根据所述带注释数据，就通过所述模型对所述带注释数据进行分类的正确性的置信度而言对这样训练的模型进行校准（210），其中利用这样校准的模型为未注释数据确定（212）对所述未注释数据进行分类的正确性的置信度，以及其中从所述未注释数据中为所述主动机器学习采集置信度满足标准的未注释数据。

2.根据权利要求1所述的方法，其特征在于，提供（202）未注释数据的集合，其中从未注释数据的所述集合中选择（204）子集合，其中通过特别是手动地、半自动地或自动地注释来自所述子集合的未注释数据来确定（206）所述带注释数据。

3.根据权利要求2所述的方法，其特征在于，所述子集合包括为所述主动机器学习采集的未注释数据。

4.根据前述权利要求中任一项所述的方法，其特征在于，根据通过所述模型的分类是否正确的至少一个概率来定义所述置信度。

5.根据权利要求4所述的方法，其特征在于，所述标准为来自所述未注释数据的模式定义了两个类别，与能够由所述模型将所述模式分类到的其他类别相比，所述两个类别具有最大的概率，其中从所述未注释数据中采集以下模式，即，针对这些模式所述两个类别的概率之差超过阈值。

6.根据前述权利要求中任一项所述的方法，其特征在于，对所述模型进行迭代地训练和校准，其中检查（214）是否满足终止标准，并且其中当满足所述终止标准时结束所述主动机器学习。

7.根据权利要求6所述的方法，其特征在于，所述终止标准为通过所述模型对带注释数据或未注释数据进行分类的准确性定义基准，其中当所述分类的准确性达到或超过所述基准时，所述终止标准得以满足。

8.根据前述权利要求中任一项所述的方法，其特征在于，根据所述带注释数据的正确分类的预期比例和所述带注释数据的正确分类的经验比例来校准（210）所述模型的至少一个参数。

9.根据前述权利要求中任一项所述的方法，其特征在于，为了在所述方法的第一次迭代中确定所述带注释数据，随机地选择（204）未注释数据。

10.根据前述权利要求中任一项所述的方法，其特征在于，为所述子集合从所述未注释数据中仅选择（204）尚未为所述子集合采集的数据。

11.一种用于主动机器学习的设备（100），其特征在于，所述设备（100）被构造为执行根据权利要求1至10中任一项所述的方法。

12.一种计算机程序，其特征在于，所述计算机程序包括计算机可读指令，在由计算机执行所述计算机可读指令时运行根据权利要求1至10中任一项所述的方法。