CN109086785A

CN109086785A - 一种图像标定模型的训练方法和装置

Info

Publication number: CN109086785A
Application number: CN201711265897.0A
Authority: CN
Inventors: 阎志鹏; 黄泽铧; 陈鹏飞; 王泮渠
Original assignee: Beijing Tusimple Future Technology Co Ltd; Tusimple Inc
Current assignee: Beijing Original Generation Interactive Technology Co.,Ltd.; Tusimple Inc
Priority date: 2017-06-14
Filing date: 2017-12-05
Publication date: 2018-12-25
Anticipated expiration: 2037-12-05
Also published as: CN110753934A; CN109086785B; US20180365835A1; CN110753934B; WO2018232187A1; US10762635B2; CN119579882A

Abstract

本发明公开一种图像标定模型的训练方法和装置，以解决现有图像分类标定技术中存在的人工标定分类的开销大、自动标定分类的准确率低的问题。该方法包括：在当前的迭代处理中，图像标定模型对接收到的图像数据进行自动图像标定处理；评估模块对自动标定图像数据中多个区域的图像数据进行评估，确定各区域的输出评估值；在判断一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域；从自动标定图像数据中抽取出低确定性区域的数据，并将抽取出来的区域的数据发送给一个人工标定处理，将人工标定图像数据作为训练数据发送给图像标定模型；图像标定模型根据训练数据进行再次训练得到更新的图像标定模型，用于下一次迭代处理。

Description

一种图像标定模型的训练方法和装置

技术领域

本发明涉及计算机视觉领域，特别涉及一种图像标定模型的训练方法和装置。

背景技术

在计算机视觉技术中，通常会采用图像语义分割来识别出图像中的物体。图像语义分割技术通过给图像中的每个像素标定一种语义类别，来标识出图像中与物体直接对应的图像区域。不同于仅仅识别出图像中物体的物体识别技术，语义分割给每个像素分配一个类别标签以标明像素所属的物体。语义分割技术在图像分析和自动驾驶系统中起到重要作用。

研究人员研发出了一系列的弱监督分割算法。弱监督分割算法的主要思想在于，获取一个已知包含同类物体类别的图像池，挖掘得到重复的模式以联合分割出每个图像的前景。在一方面，该模式由于只需要较少的人工参与而具有吸引性，尤其是这种弱标定图像可以很容易地通过关键词搜索从网络上获取得到。在另一方面，分割结果是不理想的。

从而，现有的图像标定技术依赖于人工提供的分类或者自动分类，人工分类是准确的、但是人工消耗很大，自动分类的人工开销小、但是非常不准确。

可见，在现有的图像分类标定技术中存在人工标定分类的开销大、自动标定分类的准确率低的问题。

发明内容

有鉴于此，本发明提供了一种图像标定模型的训练方法和装置，用以解决现有图像分类标定技术中存在的人工标定分类的开销大、自动标定分类的准确率低的问题。

根据本申请的一个方面，提供了一种图像标定模型的训练方法，包括：

在当前的迭代处理中，图像标定模型对接收到的图像数据进行自动图像标定处理，得到自动标定图像数据和自动标定图像数据中各像素的预测输出；

评估模块根据自动标定图像中各像素的预测输出，对自动标定图像数据中多个区域的图像数据进行评估，确定各区域的输出评估值；

在判断一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域；

从自动标定图像数据中抽取出低确定性区域的数据，并将抽取出来的区域的数据发送给一个人工标定处理；

接收来自人工标定处理的人工标定图像数据，人工标定图像数据与抽取出来的区域相对应，将人工标定图像数据作为训练数据发送给图像标定模型；

图像标定模型根据训练数据，对低确定性区域的图像数据进行再次训练，得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。

在多个实施例中，确定区域的输出评估值，包括：根据一个区域中一个像素的预测输出和该像素的相邻像素的预测输出，确定该像素的输出评估值；其中，预测输出包括：预测值或者预测方差；根据该区域中的各像素的输出评估值，确定该区域的输出评估值。

在多个实施例中，确定像素的输出评估值，包括：对于一个像素，确定该像素的相邻像素的预测值均值；将该像素的预测值和该像素的相邻像素的预测值均值作为决策树的输入，确定该像素的输出评估值；或者，对于一个像素，将该像素的预测方差和该像素的相邻像素的预测方差作为决策树的输入，确定该像素的输出评估值。

在多个实施例中，确定像素的输出评估值，还包括：该像素的相邻像素中不包括物体边缘像素。

在多个实施例中，确定区域的输出评估值，包括：根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值；或者，根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值。

在多个实施例中，根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值，包括：将一个区域中的全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中不包括物体边界像素的其它全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中的全部像素的输出评估值的第三四分位数确定为该区域的输出评估值。

在多个实施例中，根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值，包括：根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用高斯函数或者朴素贝叶斯函数确定该区域的输出评估值。

在多个实施例中，所述区域为预定区域、使用滑动窗口获得的区域或者是随机生成的区域。

在多个实施例中，所述预定评估阈值是预先根据区域的大小尺寸来预先确定的一个归一化值。

在多个实施例中，自动图像标定处理包括语义分割处理，自动标定图像数据包括语义标签图像数据。

根据本申请的另一个方面，提供了一种图像标定模型的训练装置，包括：图像标定模型模块和评估模块；其中，

图像标定模型模块，用于在当前的迭代处理中，对接收到的图像数据进行自动图像标定处理，得到自动标定图像数据和自动标定图像数据中各像素的预测输出；

评估模块，用于根据自动标定图像中各像素的预测输出，对自动标定图像数据中多个区域的图像数据进行评估，确定各区域的输出评估值在判断一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域；从自动标定图像数据中抽取出低确定性区域的数据，并将抽取出来的区域的数据发送给一个人工标定处理；接收来自人工标定处理的人工标定图像数据，人工标定图像数据与抽取出来的区域相对应，将人工标定图像数据作为训练数据发送给图像标定模型模块；

图像标定模型模块，还用于根据来自接收模块的训练数据，对低确定性区域的图像数据进行再次训练，得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。

在多个实施例中，评估模块确定区域的输出评估值，包括：根据一个区域中一个像素的预测输出和该像素的相邻像素的预测输出，确定该像素的输出评估值；其中，预测输出包括：预测值或者预测方差；根据该区域中的各像素的输出评估值，确定该区域的输出评估值。

在多个实施例中，评估模块确定像素的输出评估值，包括：对于一个像素，确定该像素的相邻像素的预测值均值；将该像素的预测值和该像素的相邻像素的预测值均值作为决策树的输入，确定该像素的输出评估值；或者，对于一个像素，将该像素的预测方差和该像素的相邻像素的预测方差作为决策树的输入，确定该像素的输出评估值。

在多个实施例中，评估模块确定像素的输出评估值，还包括：该像素的相邻像素中不包括物体边缘像素。

在多个实施例中，评估模块确定区域的输出评估值，包括：根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值；或者，根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值。

在多个实施例中，评估模块根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值，包括：将一个区域中的全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中不包括物体边界像素的其它全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中的全部像素的输出评估值的第三四分位数确定为该区域的输出评估值。

在多个实施例中，评估模块根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值，包括：根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用高斯函数或者朴素贝叶斯函数确定该区域的输出评估值。

根据本申请的另一个方面，提供了一种图像标定模型的训练装置，包括一个处理器和至少一个存储器，至少一个存储器用于存储至少一条机器可执行指令，处理器执行至少一条机器可执行指令以实现图像标定模型和评估模块：

在多个实施例中，处理器执行至少一条机器可执行指令以实现确定区域的输出评估值，包括：根据一个区域中一个像素的预测输出和该像素的相邻像素的预测输出，确定该像素的输出评估值；其中，预测输出包括预测值或者预测方差；根据该区域中的各像素的输出评估值，确定该区域的输出评估值。

在多个实施例中，处理器执行至少一条机器可执行指令以实现确定像素的输出评估值，包括：对于一个像素，确定该像素的相邻像素的预测值均值；将该像素的预测值和该像素的相邻像素的预测值均值作为决策树的输入，确定该像素的输出评估值；或者，对于一个像素，将该像素的预测方差和该像素的相邻像素的预测方差作为决策树的输入，确定该像素的输出评估值。

在多个实施例中，处理器执行至少一条机器可执行指令以实现确定像素的输出评估值，还包括：该像素的相邻像素中不包括物体边缘像素。

在多个实施例中，处理器执行至少一条机器可执行指令以实现确定区域的输出评估值，包括：根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值；或者，根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值。

在多个实施例中，处理器执行至少一条机器可执行指令以实现根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值，包括：将一个区域中的全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中不包括物体边界像素的其它全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中的全部像素的输出评估值的第三四分位数确定为该区域的输出评估值。

在多个实施例中，处理器执行至少一条机器可执行指令以实现根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值，包括：根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用高斯函数或者朴素贝叶斯函数确定该区域的输出评估值。

根据本申请提供的技术方案，图像标定模型先对接收到的图像数据进行自动图像标定处理得自动标定图像数据，对自动标定图像数据进行评估，确定自动标定图像数据中每个区域的输出评估值，在一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域，将该低确定性区域的数据发送给一个人工分类标定处理，并接收来自人工分类标定处理的人工标定数据，将该人工标定数据作为训练图像标定模型的训练数据，再次训练图像标定模型得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。从而能结合自动标定和人工标定，对自动标定图像数据中的低确定性区域进行重新训练，能够不断地对图像标定模型进行改进，不断地提高图像标定模型的自动处理的确定性，也即准确性，从而应用图像标定模型进行自动图像标定处理，能够在保证处理效率的同时提高标定的准确率，能够解决现有技术中存在的人工标定分类的开销大、自动标定分类的准确率低的问题。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

图1a为本申请实施例提供的图像标定模型的训练方法的处理流程图；

图1b为图1a中步骤12的处理流程图；

图2a为本申请实施例提供的图像标定模型的训练装置的结构框图；

图2b为本申请实施例提供的图像标定模型的训练装置的另一种结构框图；

图3为本发明实施例具体应用中的原始图像数据；

图4为与图3相对应的真实数据；

图5为对图3进行第一次迭代处理中的语义标签分割处理得到的语义标签图像数据；

图6为图5中每个像素的预测方差的视觉显示；

图7为图5中每个区域的输出评估值的视觉显示；

图8为第二次迭代处理中的语义标签分割处理得到的语义标签图像数据；

图9为图8中每个像素的预测方差的视觉显示；

图10为图8中每个区域的输出评估值的视觉显示。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

针对现有图像分类标定技术中存在的人工标定分类的开销大、自动标定分类的准确率低的问题，本申请提供了一种图像标定模型的训练方法，该方法中在当前迭代处理中，图像标定模型先对图像数据进行自动图像标定处理(例如语义标签分割处理)，对自动标定的结果自动标定图像数据(例如语义标签图像数据)中的多个区域进行评估，确定自动标定图像数据中多个区域的输出评估值，输出评估值代表了自动分类标定图像的质量，在区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域，将该区域的数据抽取出来发送给一个人工分类标定处理，并接收来自人工分类标定处理的人工标定图像数据，将该人工标定图像数据作为训练图像标定模型的训练数据，图像标定模型根据训练数据再次训练得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。从而本申请提供的技术方案能够结合自动标定和人工标定，对自动标定图像数据中的低确定性区域进行重新训练，能够不断地对图像标定模型进行改进，不断地提高图像标定模型的自动处理的确定性，也即准确性，从而应用图像标定模型进行自动图像标定处理，能够在保证处理效率的同时提高标定的准确率。

以上是本发明的核心思想，为了使本技术领域的人员更好地理解本发明实施例中的技术方案，并使本发明实施例的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明实施例中技术方案作进一步详细的说明。

图1a中示出了本申请实施例提供的图像标定模型的训练方法的处理流程图，该方法包括如下处理过程：

步骤11、在当前的迭代处理中，图像标定模型对接收到的数据进行自动图像标定处理，得到自动标定图像数据和自动标定图像数据中各像素的预测输出。

其中，对于第一次迭代处理，接收到的数据是原始图像数据，对于后续的迭代处理，接收到的数据是上一次迭代处理输出的数据。

自动图像标定处理可以是现有的处理方法，例如可以是语义分割处理，自动标定图像数据可以是语义标签图像数据，也可以是在本申请之后提供的方法，本申请不对自动图像标定处理进行限制。

步骤12、评估模块根据自动标定图像中各像素的预测输出，对自动标定图像数据中多个区域的图像数据进行评估，确定各区域的输出评估值。

其中，区域可以是图像数据中的预定区域、可以是使用滑动窗口获得的区域、或者也可以随机生成的区域。

自动标定图像数据中的多个区域可以是预先选定的多个区域，例如语义标签图像数据中的全部区域，或者是跟图像有关的多个指定的区域。

具体地，图1b中示出了步骤12的处理过程，该过程包括如下处理。

步骤121、根据一个区域中一个像素的预测输出和该像素的相邻像素的预测输出，确定该像素的输出评估值。

其中，预测输出包括：预测值或者预测方差。在使用模型或者算法对原始图像数据进行语义标签分割时，一些图像部分会包括无法被语义分割处理立即识别出来的物体、边界或者其它区域，例如较差的光线条件、遮挡、摄像头运动、焦点问题、传感器错误或者环境条件等等原因造成的无法识别的区域。模型或者算法通常会对输出结果进行评估得到一个预测值，该预测值表示对语义标签分割结果的信任度(Confidence)，是对语义标签分割结果的质量衡量。本申请中还可以基于预测值进一步确定得到预测方差，通过方差能够更加显著地考察语义标签分割结果的质量。从而本申请通过预测值或者预测方差来表达对像素语义标签分类结果的信任情况。

在一个实施例中，对于一个像素，确定该像素的相邻像素的预测值均值；将该像素的预测值和该像素的相邻像素的预测值均值作为决策树的输入，确定该像素的输出评估值；或者，对于一个像素，将该像素的预测方差和该像素的相邻像素的预测方差作为决策树的输入，确定该像素的输出评估值。

在另一个实施例中，由于图像语义分割处理中对物体边界的识别会存在不确定性，在确定一个像素的输出评估值时，物体边界像素会对评测结果产生干扰。相应地，在确定一个像素的输出评估值时，不考虑像素的相邻像素中物体边界的像素，能够更加准确地确定得到像素的输出评估值。也即，在确定相邻像素的预测值均值或者预测方差时，相邻像素中不包括物体边缘像素。

步骤122、根据该区域中的各像素的输出评估值，确定该区域的输出评估值。

输出评估值能够表示一个区域的图像质量，当输出评估值较高时，表示该区域的图像质量的较高，也即该区域的自动分类标定结果的质量较高、确定性较高，当输出评估值较低时，表示该区域的自动分类标定结果的质量较低、自动分类标定处理的确定性较低。

在一个实施例中，可以根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值。

例如，可以将一个区域中的全部像素的输出评估值的均值确定为该区域的输出评估值；或者，

可以将一个区域中去除了不包括物体边界像素后的其它全部像素的输出评估值的均值确定为该区域的输出评估值；或者，

可以将一个区域中的全部像素的输出评估值的第三四分位数确定为该区域的输出评估值。

在另一个实施例中，可以根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值。

例如，可以根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用高斯函数或者朴素贝叶斯函数确定该区域的输出评估值。

步骤13、在判断一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域。

其中，该预定的评估阈值可以是预先根据区域的大小尺寸确定得到的一个归一化值。

步骤14、从自动标定图像数据中抽取出低确定性区域数据，并将抽取出来的区域的数据发送给一个人工标定处理。

步骤15、接收来自人工标定处理的人工标定图像数据，人工标定图像数据与抽取出来的区域相对应，将人工标定图像数据作为训练数据发送给图像标定模型。

步骤16、图像标定模型根据训练数据，对低确定性区域的图像数据进行再次训练，得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。

通过本申请提供的图像标定模型的训练方法，图像标定模型先对接收到的图像数据进行自动图像标定处理得自动标定图像数据，对自动标定图像数据进行评估，确定自动标定图像数据中每个区域的输出评估值，在一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域，将该低确定性区域的数据发送给一个人工分类标定处理，并接收来自人工分类标定处理的人工标定数据，将该人工标定数据作为训练图像标定模型的训练数据，再次训练图像标定模型得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。从而能结合自动标定和人工标定，对自动标定图像数据中的低确定性区域进行重新训练，能够不断地对图像标定模型进行改进，不断地提高图像标定模型的自动处理的确定性，也即准确性，从而应用图像标定模型进行自动图像标定处理，能够在保证处理效率的同时提高标定的准确率，能够解决现有技术中存在的人工标定分类的开销大、自动标定分类的准确率低的问题。

基于相同的发明构思，本申请实施例还提供了一种图像标定模型的训练装置。

图2a中示出了本申请实施例提供的图像标定模型的训练装置的结构框图，该装置包括：

图像标定模型模块201，用于在当前的迭代处理中，对接收到的图像数据进行自动图像标定处理，得到自动标定图像数据和自动标定图像数据中各像素的预测输出。

评估模块202，用于根据自动标定图像中各像素的预测输出，对自动标定图像数据中多个区域的图像数据进行评估，确定各区域的输出评估值。

在一个实施例中，评估模块202确定区域的输出评估值的处理包括：

为一个区域中的各个像素确定预测输出；其中，预测输出包括：预测值和预测方差。

根据一个像素的预测输出和该像素的相邻像素的预测输出，确定该像素的输出评估值；具体地，对于一个像素，确定该像素的相邻像素的预测值均值；将该像素的预测值和该像素的相邻像素的预测值均值作为决策树的输入，确定该像素的输出评估值；或者，对于一个像素，将该像素的预测方差和该像素的相邻像素的预测方差作为决策树的输入，确定该像素的输出评估值；在另一个实施例中，确定像素的输出评估值时，像素的相邻像素中不包括物体边缘像素；

根据该区域中的各像素的输出评估值，确定该区域的输出评估值。在一个实施例中，可以根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值；例如，将一个区域中的全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中不包括物体边界像素的其它全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中的全部像素的输出评估值的第三四分位数确定为该区域的输出评估值。或者，在另一个实施例中，根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值。例如，根据一个区域中的像素的输出评估值以及历史标定数据，使用高斯函数或者朴素贝叶斯函数确定该区域的输出评估值。

评估模块202，还用于在判断一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域从语义标签图像数据中抽取出低确定性区域的数据，并将抽取出来的区域的数据发送给一个人工标定处理；并接收来自人工标定处理的人工标定数据，人工标定数据与抽取出来的区域相对应，将人工标定图像数据作为训练数据发送给图像标定模型模块。

图像标定模型模块201，还用于根据来自接收模块的训练数据，对低确定性区域的图像数据进行再次训练，得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。

通过本申请提供的图像标定模型的训练装置，图像标定模型模块先对接收到的图像数据进行自动图像标定处理得自动标定图像数据，评估模块对自动标定图像数据进行评估，确定自动标定图像数据中每个区域的输出评估值，在一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域，将该低确定性区域的数据发送给一个人工分类标定处理，并接收来自人工分类标定处理的人工标定数据，将该人工标定数据作为训练图像标定模型的训练数据，再次训练图像标定模型得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。从而能结合自动标定和人工标定，对自动标定图像数据中的低确定性区域进行重新训练，能够不断地对图像标定模型进行改进，不断地提高图像标定模型的自动处理的确定性，也即准确性，从而应用图像标定模型进行自动图像标定处理，能够在保证处理效率的同时提高标定的准确率，能够解决现有技术中存在的人工标定分类的开销大、自动标定分类的准确率低的问题。

图2b中示出了本申请实施例提供的图像标定模型的训练装置的结构框图，该装置包括：

一个处理器21和至少一个存储器23，至少一个存储器23用于存储至少一条机器可执行指令，处理器21执行至少一条机器可执行指令以实现图像标定模型和评估模块；其中，

从自动标定图像数据中抽取出低确定性区域的数据，并抽取出来的区域的数据发送给一个人工标定处理；

其中，预测输出包括：预测值和预测方差。

在一个实施例中，处理器21执行至少一条机器可执行指令以实现确定区域的输出评估值，包括：根据一个区域中一个像素的预测输出和该像素的相邻像素的预测输出，确定该像素的输出评估值；根据该区域中的各像素的输出评估值，确定该区域的输出评估值。

在一个实施例中，处理器21执行至少一条机器可执行指令以实现确定像素的输出评估值，包括：对于一个像素，确定该像素的相邻像素的预测值均值；将该像素的预测值和该像素的相邻像素的预测值均值作为决策树的输入，确定该像素的输出评估值；或者，对于一个像素，将该像素的预测方差和该像素的相邻像素的预测方差作为决策树的输入，确定该像素的输出评估值。在另一个实施例中，该像素的相邻像素中不包括物体边缘像素。

在一个实施例中，处理器21执行至少一条机器可执行指令以实现根据确定区域的输出评估值，包括：根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值；或者，根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值。

其中，处理器21执行至少一条机器可执行指令以实现根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值，包括：将一个区域中的全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中不包括物体边界像素的其它全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中的全部像素的输出评估值的第三四分位数确定为该区域的输出评估值。

其中，处理器21执行至少一条机器可执行指令以实现根据一个区域中的像素的输出评估值以及该区域历史标定数据，使用基于学习的方法确定该区域的输出评估值，包括：根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用高斯函数或者朴素贝叶斯函数确定每个区域的输出评估值。

通过本申请提供的图像标定模型的训练装置，图像标定模型先对接收到的图像数据进行自动图像标定处理得自动标定图像数据，对自动标定图像数据进行评估，确定自动标定图像数据中每个区域的输出评估值，在一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域，将该低确定性区域的数据发送给一个人工分类标定处理，并接收来自人工分类标定处理的人工标定数据，将该人工标定数据作为训练图像标定模型的训练数据，再次训练图像标定模型得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。从而能结合自动标定和人工标定，对自动标定图像数据中的低确定性区域进行重新训练，能够不断地对图像标定模型进行改进，不断地提高图像标定模型的自动处理的确定性，也即准确性，从而应用图像标定模型进行自动图像标定处理，能够在保证处理效率的同时提高标定处理的准确率，能够解决现有技术中存在的人工标定分类的开销大、自动标定分类的准确率低的问题。

下面对本申请具体应用的场景进行说明。

图3至图10示出了对一个原始图像数据实施本申请提供的图像标定模型的训练方法的处理过程图像。

图3是一个原始的图像数据。图4是与图3对应的标准语义分割数据，又称为真实数据(ground truth)，是一个人工分类标定的结果。图4可以作为参考图像，起到与人工分类标定结果进行对比参考的作用。

在实施本申请提供的方法，进行第一次迭代处理的过程中，图5是对图3进行第一次迭代处理中的自动语义标签分割处理后得到的语义标签图像数据(即自动分类标定处理的结果)。

图6是为图5中每个像素确定的预测方差的视觉显示，其中，热区域(深色或者暗色部分)表示自动分类标定结果的信任度较高，冷区域(白色或者浅灰色部分)表示自动分类标定结果的信任度较低。

图7是为图5中的每个区域确定的输出评估值的视觉显示。图7中深色或者黑色部分表示输出评估值小于预定评估阈值，该部分图像质量较低，也即自动分类标定处理的确定性较低。当区域的输出评估值小于预定评估阈值的情况下，该区域的数据将被发送给一个人工分类标定处理，由人工分类标定处理对该区域中的像素进行分类标定处理。

将图5所示的语义标签图像数据和图4所示的真实数据进行对比可以看出，通过自动的语义分割处理得到的图5缺失了一些物体细节，特别是在图像的背景部分缺失了一些物体细节。这些缺失的物体细节与图6所示的信任度较低和图7所示的确定性较低的部分是一致的。

在具体应用中，还将人工标定处理的结果替换原输出评估值小于预定评估阈值的区域的数据，并将替换后的图像数据作为第一次迭代处理的结果。

在第二次迭代处理中，将第一次迭代处理的结果作为输入数据，对输入数据进行自动的语义分割处理，得到如图8所示的语义标签图像数据。对比图8和图5可知，图8相比图5增加了一些物体细节，尤其是在图像的背景部分。

针对图8的语义标签图像数据进行评估，图9中示出了为图8中每个像素确定的预测方差的视觉显示，与图6相类似，热区域(深色或者暗色部分)表示自动分类标定结果具有较高的信任度，冷区域(白色或者浅灰色部分)表示自动分类标定结果的信任度较低。

对比图9和图6可知，在第二次迭代处理中，图9中所示的信任度较低的部分相比于图6有所减少。

图10是为图8中的每个区域确定的输出评估值的视觉显示。与图7相类似，深色或者黑色部分表示输出评估值小于预定评估阈值，该部分图像质量较低，自动分类标定处理的确定性较低。

通过对比图10和图7可以看出，在第二次迭代处理中，图10所示的确定性较低的部分相比于图7有所减少。

并且，进一步对比图8、图9与图10，图8相比图5中增加的物体细节，与图9和图10中不确定性较高的部分是一致的。

从而可以看出，通过本申请提供的图像标定模型的训练方法，能够有效地提高图像标定的准确率，以及有效地保证处理效率。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种图像标定模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，确定区域的输出评估值，包括：

根据一个区域中一个像素的预测输出和该像素的相邻像素的预测输出，确定该像素的输出评估值；其中，预测输出包括：预测值或者预测方差；

根据该区域中的各像素的输出评估值，确定该区域的输出评估值。

3.根据权利要求2所述的方法，其特征在于，确定像素的输出评估值，包括：

对于一个像素，确定该像素的相邻像素的预测值均值；将该像素的预测值和该像素的相邻像素的预测值均值作为决策树的输入，确定该像素的输出评估值；或者，

对于一个像素，将该像素的预测方差和该像素的相邻像素的预测方差作为决策树的输入，确定该像素的输出评估值。

4.根据权利要求3所述的方法，其特征在于，确定像素的输出评估值，还包括：

该像素的相邻像素中不包括物体边缘像素。

5.根据权利要求2所述的方法，其特征在于，确定区域的输出评估值，包括：

根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值；或者，

根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值。

6.根据权利要求5所述的方法，其特征在于，根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值，包括：

将一个区域中的全部像素的输出评估值的均值确定为该区域的输出评估值；或者，

将一个区域中不包括物体边界像素的其它全部像素的输出评估值的均值确定为该区域的输出评估值；或者，

将一个区域中的全部像素的输出评估值的第三四分位数确定为该区域的输出评估值。

7.根据权利要求5所述的方法，其特征在于，根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值，包括：

根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用高斯函数或者朴素贝叶斯函数确定该区域的输出评估值。

8.根据权利要求1所述的方法，其特征在于，所述区域为预定区域、使用滑动窗口获得的区域或者是随机生成的区域。

9.根据权利要求1所述的方法，其特征在于，所述预定评估阈值是预先根据区域的大小尺寸预先确定的一个归一化值。

10.根据权利要求1所述的方法，其特征在于，自动图像标定处理包括语义分割处理，自动标定图像数据包括语义标签图像数据。

11.一种图像标定模型的训练装置，其特征在于，包括：图像标定模型模块和评估模块；其中，

评估模块，用于根据自动标定图像中各像素的预测输出，对自动标定图像数据中多个区域的图像数据进行评估，确定各区域的输出评估值；在判断一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域；从自动标定图像数据中抽取出低确定性区域的数据，并将抽取出来的区域的数据发送给一个人工标定处理；接收来自人工标定处理的人工标定图像数据，人工标定图像数据与抽取出来的区域相对应，将人工标定图像数据作为训练数据发送给图像标定模型模块；

12.根据权利要求11所述的装置，其特征在于，评估模块确定区域的输出评估值，包括：

13.根据权利要求12所述的装置，其特征在于，评估模块确定像素的输出评估值，包括：

14.根据权利要求13所述的装置，其特征在于，评估模块确定像素的输出评估值，还包括：

该像素的相邻像素中不包括物体边缘像素。

15.根据权利要求12所述的装置，其特征在于，评估模块确定区域的输出评估值，包括：

16.根据权利要求15所述的装置，其特征在于，评估模块根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值，包括：

17.根据权利要求15所述的装置，其特征在于，评估模块根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值，包括：

18.一种图像标定模型的训练装置，其特征在于，包括一个处理器和至少一个存储器，至少一个存储器用于存储至少一条机器可执行指令，处理器执行至少一条机器可执行指令以实现图像标定模型和评估模块；其中，

19.根据权利要求18所述的装置，其特征在于，处理器执行至少一条机器可执行指令以实现确定区域的输出评估值，包括：

根据一个区域中一个像素的预测输出和该像素的相邻像素的预测输出，确定该像素的输出评估值；其中，预测输出包括预测值或者预测方差；

20.根据权利要求19所述的装置，其特征在于，处理器执行至少一条机器可执行指令以实现确定像素的输出评估值，包括：

21.根据权利要求20所述的装置，其特征在于，处理器执行至少一条机器可执行指令以实现确定像素的输出评估值，还包括：

该像素的相邻像素中不包括物体边缘像素。

22.根据权利要求19所述的装置，其特征在于，处理器执行至少一条机器可执行指令以实现确定区域的输出评估值，包括：

23.根据权利要求22所述的装置，其特征在于，处理器执行至少一条机器可执行指令以实现根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值，包括：

24.根据权利要求22所述的装置，其特征在于，处理器执行至少一条机器可执行指令以实现根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值，包括：