WO2022213846A1

WO2022213846A1 - 识别模型的训练

Info

Publication number: WO2022213846A1
Application number: PCT/CN2022/083705
Authority: WO
Inventors: 夏华夏; 乔健
Original assignee: 北京三快在线科技有限公司
Priority date: 2021-04-07
Filing date: 2022-03-29
Publication date: 2022-10-13
Also published as: CN112801229A; CN112801229B

Abstract

本说明书公开了一种识别模型的训练方法及装置，通过对获取到的无标注的目标物图像进行模糊化处理，确定第一模糊图像和第二模糊图像，通过待训练的识别模型，确定第二模糊图像的识别结果，并根据第二模糊图像的识别结果，确定第一模糊图像的标注，以第一模糊图像为第一训练样本，根据第一模糊图像的标注，对待训练的识别模型进行训练。不需要人工对样本进行标注，减少了训练样本的生成时间与成本，提高了识别模型的训练效率。

Description

识别模型的训练

技术领域

本说明书涉及无人驾驶技术领域，尤其涉及一种识别模型的训练方法及装置。

背景技术

无人驾驶设备行驶过程中，通常会对周围环境中的目标物进行识别，以基于目标物的检测结果，确定无人驾驶设备的运动策略以不违反交通法规。其中，目标物通常可为障碍物、指示牌、信号灯等会影响无人驾驶设备行驶的对象。

以信号灯为例进行说明，一种对信号灯进行识别的方法是基于检测模型和识别模型确定信号灯所在位置和信号灯类型。具体的，首先将当前图像输入检测模型，得到当前图像中各信号灯的位置，根据当前图像中各信号灯的位置对当前图像进行截取，得到各信号灯图像，将信号灯图像输入到识别模型中，确定出各信号灯的类型。后续则可基于各信号灯的位置和类型确定无人驾驶设备的运动策略。

但是，在实现对目标物的检测和识别的过程中，需要人工对训练样本进行标注。而人工标注成本高、时间长，这使得训练模型的周期过长，降低了模型训练的效率。

发明内容

本说明书提供一种识别模型的训练方法及装置，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案。

第一方面，本说明书提供了一种识别模型的训练方法，包括：获取无标注的目标物图像；对所述无标注的目标物图像进行模糊化处理，获得所述无标注的目标物图像的第一模糊图像和第二模糊图像，所述第一模糊图像的模糊强度高于所述第二模糊图像；将所述第二模糊图像输入到待训练的识别模型中，确定所述第二模糊图像的识别结果；根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注；以所述第一模糊图像为第一训练样本，根据所述第一模糊图像的标注，对待训练的识别模型进行训练。

在一些实施例中，对所述无标注的目标物图像进行模糊化处理，获得所述无标注的目标物图像的第二模糊图像，包括：对所述无标注的目标物图像进行多种模糊化处理，获得所述无标注的目标物图像的多个第二模糊图像；将所述第二模糊图像输入到所述待训练的识别模型中，确定所述第二模糊图像的识别结果，包括：将所述多个第二模糊图像输入到所述待训练的识别模型中，确定所述多个第二模糊图像各自的识别结果；根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注，包括：根据所述多个第二模糊图像各自的识别结果及其权重，对所述多个第二模糊图像各自的识别结果进行加权平均，确定加权识别结果；根据所述加权识别结果，确定所述第一模糊图像的标注。

在一些实施例中，所述方法还包括：采用迭代训练的方法训练所述待训练的识别模型，一次迭代训练所述待训练的识别模型的方法包括：获取有标注的目标物图像，作为第二训练样本；将所述第一训练样本和所述第二训练样本输入到所述待训练的识别模型中，确定所述第一训练样本的识别结果和所述第二训练样本的识别结果；根据所述第一训练样本的识别结果及其标注，确定第一损失，以及根据所述第二训练样本的识别结果及其标注，确定第二损失，根据所述第一损失与所述第二损失，调整所述待训练的识别模型的模型参数值。

在一些实施例中，根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注，包括：获取有标注的目标物图像，作为第二训练样本；将所述无标注的目标物图像的所述第二模糊图像输入到基于所述第二训练样本确定的预识别模块中，确定所述第二模糊图像的预识别结果；根据所述第二模糊图像的识别结果和所述预识别结果，确定所述第一模糊图像的标注。

在一些实施例中，所述方法还包括：将所述第二训练样本输入到待训练的预识别模块中，确定所述第二训练样本的预识别结果，以所述第二训练样本的预识别结果和所述第二训练样本的标注之间的差异最小化为训练目标，调整所述预识别模块的模型参数值。

在一些实施例中，根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注，包括：根据所述第二模糊图像的识别结果及其置信度，确定所述第二模糊图像的分类结果；根据所述第二模糊图像的分类结果，确定所述第一模糊图像的标注。

在一些实施例中，采用迭代训练的方法训练所述待训练的识别模型，包括：针对一次迭代，根据该次迭代的所述第一训练样本的识别结果及其标注，确定所述第一模糊图像的样本权重；当下一次迭代训练所述识别模型时，响应于所述第一模糊图像的样本权重大于等于预设阈值，将所述第一模糊图像确定为所述下一次迭代的第一训练样本。

第二方面，本说明书提供了一种识别模型的训练装置，包括：获取模块，用于获取无标注的目标物图像；处理模块，对所述无标注的目标物图像进行模糊化处理，获得所述无标注的目标物图像的第一模糊图像和第二模糊图像，所述第一模糊图像的模糊强度高于所述第二模糊图像；识别模块，用于将所述第二模糊图像输入到待训练的识别模型中，确定所述第二模糊图像的识别结果；标注模块，用于根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注；训练模块，用于以所述第一模糊图像为第一训练样本，根据所述第一模糊图像的标注，对待训练的识别模型进行训练。

第三方面，本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述识别模型的训练方法。

第四方面，本说明书提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述识别模型的训练方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果：在本说明书提供的识别模型的训练方法中，通过对获取到的目标物图像进行模糊化处理，确定第一模糊图像和第二模糊图像，通过待训练的识别模型，确定第二模糊图像的识别结果，并根据第二模糊图像的识别结果，确定第一模糊图像的标注，以第一模糊图像为第一训练样本，根据第一模糊图像的标注，对待训练的识别模型进行训练。

从上述方法中可以看出，本方法不需要人工对样本进行标注，减少了训练样本的生成时间与成本，提高了识别模型的训练效率。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附图中：

图1为本说明书提供的识别模型的训练方法的流程示意图；

图2为本说明书提供的对目标物图像进行模糊处理的示意图；

图3为本说明书提供的识别模型的示意图；

图4为本说明书提供的预识别模块的示意图；

图5为本说明书提供的确定损失函数的结构图；

图6为本说明书提供的识别模型的训练装置；

图7为本说明书提供的对应于图1的电子设备示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书提供的识别模型的训练方法的流程示意图，具体包括以下步骤：

S100：获取若干无标注的目标物图像；

一般的，在无人驾驶技术领域，可通过检测模型和识别模型对无人驾驶设备周围的环境图像进行检测，确定目标物的位置及目标物的类型，以根据确定出的目标物的位置及类型，确定无人驾驶设备的运动策略。

通常，识别模型是由用于训练模型的服务器，基于训练样本预先训练得到的。而本说明书提供了一种识别模型的训练方法，同样的，可由用于训练模型的服务器执行该训练识别模型的过程。

训练模型可以分为样本生成阶段以及训练模型阶段，在样本生成阶段可根据模型需要以及训练需要，确定用于训练模型的训练样本。在本说明书中，首先可确定用于训练识别模型的训练样本，并且由于通常识别模型是基于目标物图像对目标物进行识别的，因此，可首先确定各目标物图像，以确定训练样本。其中，该目标物图像可为信号灯图像，也可为无人驾驶设备行驶过程中的交通指示标志等，为了方便描述，后续以信号灯为例进行说明。

由于通常该识别模型可基于将无人驾驶设备采集到的周围图像输入检测模型得到的目标物图像，对目标物进行识别，因此，该识别模型的目标物图像可基于检测模型确定。具体的，可首先获取若干无人驾驶设备采集到的图像(该图像中可以包括采集该图像的无人驾驶设备周围的物体)，并将获取到的各无人驾驶设备采集到的图像输入该检测模型，确定各无人驾驶设备采集到的图像中的各目标物(如，信号灯)的位置，于是，可基于确定出的各目标物的位置对各图像进行裁剪，确定出各包含目标物的目标物图像。

在本说明书中，无人驾驶设备可以是指无人车、机器人、自动配送设备等能够实现自动驾驶的设备，也可以是半自动驾驶设备或辅助驾驶设备等，在本文不做限定。基于此，应用本说明书提供的训练方法训练完成的识别模型的无人驾驶设备可以用于执行配送任务，如，使用无人驾驶设备进行快递、物流、外卖等配送任务。为了保证无人驾驶设备在配送任务中的安全行驶，无人驾驶设备需要通过采集到的图像，对道路中设置的交通灯、交通指示牌等具体交通指示功能的静态目标物进行识别。

S102：针对每个目标物图像，对该目标物图像进行模糊化处理，确定该目标物图像的第一模糊图像和第二模糊图像，所述第一模糊图像的模糊强度高于所述第二模糊图像；

在本说明书提供的一个或多个实施例中，在确定出各目标物图像后，可针对每个目标物图像，对该目标物图像进行模糊化处理，确定该目标物图像的第一模糊图像和第二模糊图像。以便后续可基于各目标物图像的第一模糊图像和第二模糊图像，对该识别模型进行训练。

具体的，针对每个无标注的目标物图像，该目标物图像的模糊图像的模糊强度越低，则该模糊图像与该目标物的差距越小，该模糊图像的识别结果与该目标物图像的识别结果差距也越小。而该目标物图像的模糊图像的模糊强度越高，则该模糊图像与该目标物的差距越大，该模糊图像的识别结果与该目标物图像的识别结果差距也越大。因此，在实施例中，可预设至少两种处理强度的模糊处理模型，在确定出各目标物图像后，可针对每个目标物图像，根据预设的具有至少两种处理强度的模糊处理模型，对该目标物图像进行模糊处理，得到模糊强度不同的第一模糊图像和第二模糊图像。如图2所示，左边部分为目标物图像，该目标物图像可以为信号灯图像，对该目标物图像分别进行第一模糊处理和第二模糊处理，可得到右边部分的该目标物图像的第一模糊图像和第二模糊图像。显然，第一模糊图像的模糊强度高于第二模糊图像。

S104：将所述第二模糊图像输入到待训练的识别模型中，确定所述第二模糊图像的识别结果。

在本说明书提供的一个或多个实施例中，在确定出各目标物图像的第二模糊图像后，还可将第二模糊图像输入到待训练的识别模型中，确定该第二模糊图像的识别结果。

具体的，在本说明书中，针对每个无标注的目标物图像，该目标物图像的第二模糊图像的识别结果更接近于该目标物图像的识别结果，于是，可采用根据该目标物图像的第二模糊图像的识别结果，确定该第一模糊图像的标注，在后续步骤中对该识别模型进行训练，使该识别模型可对于同一目标物图像的不同模糊图像，确定同一识别结果。因此，可针对每个无标注的目标物图像，将该目标物图像的第二模糊图像输入到待训练的识别模型中，确定该第二模糊图像的识别结果。如图3所示，左边部分为第二模糊图像，假设从上向下的信号灯分别为红灯、黄灯、绿灯，黑色代表亮灯，白色代表熄灭，则第二模糊图像对应的目标物图像对应的信号灯状态为绿色，中间部分为待训练的识别模型，而右边部分为第二模糊图像的识别结果。其中，识别结果为目标物分别属于各预设分类的概率，即，第二模糊图像分别对应的信号灯状态为熄灭、信号灯状态为红色、信号灯状态为黄色、信号灯状态为绿色分别对应的概率。于是，可确定该第二模糊图像的识别结果中，信号灯状态为绿色的概率较高。

S106：根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注。

在本说明书提供的一个或多个实施例中，在确定出第二模糊图像的识别结果后，还可根据第二模糊图像的识别结果，确定第一模糊图像的标注。

具体的，如前所述的，在本说明书中，针对每个目标物图像，可基于该目标物图像的第二模糊图像的识别结果，确定第一模糊图像的标注，并在后续步骤中，基于各第一模糊图像的识别结果与第一模糊图像的标注对识别模型进行训练。在一个例子中，在确定出第二模糊图像的识别结果后，可将该第二模糊图像的识别结果，作为该第一模糊图像的标注。

因为确定出的第二模糊图像的识别结果为目标物分别属于各预设分类的概率，而通常目标物属于预设的某一分类，如，信号灯状态为绿色，或信号灯状态为熄灭等。于是，可根据该第二模糊图像的识别结果及其置信度，确定该第二模糊图像的分类结果；根据该第二模糊图像的分类结果，确定该第一模糊图像的标注。例如，从该第二模糊图像的识别结果中，确定概率最高对应的状态，作为该第一模糊图像的标注。如，信号灯对应的状态为熄灭、红色、黄色、绿色的概率分别为10％、80％、2％、8％，则可确定该第一模糊图像的标注为红色。

S108：以所述第一模糊图像为第一训练样本，根据所述第一模糊图像的标注，对待训练的识别模型进行训练。

在本说明书提供的一个或多个实施例中，在确定出各目标物图像的第一模糊图像及第一模糊图像的标注后，针对每个目标物图像，可以该第一模糊图像为第一训练样本，根据该第一模糊图像的标注，对待训练的识别模型进行训练。

具体的，可将第一模糊图像作为第一训练样本，输入到待训练的识别模型中，确定第一训练样本的识别结果。根据第一训练样本的识别结果及其标注，确定第一损失，并根据第一损失调整该识别模型的模型参数值，以完成对该识别模型的训练。

基于图1的识别模型的训练方法，通过对获取到的目标物图像进行模糊化处理，获得第一模糊图像和第二模糊图像，通过待训练的识别模型，确定第二模糊图像的识别结果，并根据第二模糊图像的识别结果，确定第一模糊图像的标注，以第一模糊图像为第一训练样本，根据第一模糊图像的标注，对待训练的识别模型进行训练。此方法不需要人工对样本进行标注，减少了训练样本的生成时间与成本，提高了识别模型的训练效率。

在步骤S102中，在确定该目标物图像的第二模糊图像时，还可对该目标物图像进行多种模糊化处理，获得该目标物图像的多个第二模糊图像。于是，在步骤S104中，确定第二模糊图像时，可将多个第二模糊图像输入待训练的识别模型中，确定多个第二模糊图像各自的识别结果。然后，在步骤S106中，可将多个第二模糊图像各自的识别结果及预设的各第二模糊图像的权重，输入加权函数

其中，X _i为各第二模糊图像的识别结果，a _i为各第二模糊图像的识别结果对应的权重，k为各第二模糊图像的个数。可得到这些第二模糊图像的加权识别结果，作为该第一模糊图像的标注。在一个例子中，可以直接将该加权识别结果作为该第一模糊图像的标注。在另一个例子中，可将该加权识别结果中最高概率对应的状态作为该第一模糊图像的标注。其中所述加权识别结果为各第二模糊图像的识别结果经过加权平均计算后得到的结果，即在本实施例中，各第二模糊图像的识别结果对应的权重之和为1。最后，在步骤S108中，可基于步骤S106中确定出的标注，以该第一模糊图像的识别结果与其标注，对该模型进行训练。

在本说明书，为了使训练得到的识别模型对目标物图像的识别更准确，在步骤S106中，还可基于有标注的训练样本，辅助获得模糊图像的标注。于是，可基于有标注的训练样本，训练得到预识别模块，并针对每个无标注的目标物图像，将该目标物图像的第二模糊图像输入到预识别模块中，确定第二模糊图像的预识别结果，进而确定该第一模糊图像的标注。

具体的，可首先获取若干有标注的目标物图像，作为第二训练样本，然后，将各第二训练样本输入到待训练的预识别模块中，确定各第二训练样本的预识别结果，根据各第二训练样本的预识别结果和其标注之间的差异最小化为训练目标，调整预识别模块的模型参数值，以得到预识别模块。并在确定出该预识别模块后，将各第二模糊图像输入到该预识别模块中，得到各第二模糊图像的识别结果，如图4所示。

图4为本说明书提供的预识别模块的示意图，左边部分为第二模糊图像，中间部分为基于各有标注的目标物图像预先训练得到的预识别模块，右边部分为第二模糊图像的识别结果，与图3类似，第二模糊图像对应的信号灯状态为绿色，预识别结果为目标物分别属于各预设分类的概率，即，第二模糊图像分别对应的信号灯状态为熄灭、信号灯状态为红色、信号灯状态为黄色、信号灯状态为绿色分别对应的概率。于是，步骤S106中，在确定出第二模糊图像的预识别结果后，可根据该第二模糊图像的识别结果及其权重，以及该第二模糊图像的预识别结果及其权重(这两个权重之和为1)，确定该第二模糊图像的加权识别结果，作为第一模糊图像的标注。最后，在步骤S108中，可基于步骤S106中确定出的标注，以该第一模糊图像的识别结果与其标注，对该模型进行训练。

在本说明书提供的一个或多个实施例中，为了得到更加准确的识别模型，本说明书可使用有标注的样本与无标注的样本一起对识别模型进行训练，于是，还可获取若干有标注的目标物图像，作为第二训练样本。将第一训练样本和第二训练样本作为输入，输入到待训练的识别模型中，确定第一训练样本的识别结果和第二训练样本的识别结果。根据该训练样本对的第一训练样本的识别结果及其标注，确定第一损失，以及根据第二训练样本的识别结果及其标注，确定第二损失，根据第一损失与第二损失，调整识别模型的模型参数，以完成对该识别模型的训练，如图5所示。

图5为本说明书提供的确定损失函数的结构图，与图3、图4类似，无标注的目标物图像、无标注的目标物图像的第一模糊图像、第二模糊图像对应的信号灯状态均为绿色，第二训练样本对应的信号灯状态为黄色。各识别结果为目标物分别属于各预设分类的概率，即，第二模糊图像分别对应的信号灯状态为熄灭、信号灯状态为红色、信号灯状态为黄色、信号灯状态为绿色分别对应的概率。于是，可以根据各第一训练样本和各第二训练样本确定各训练样本对，针对每个训练样本对，将该训练样本对中的所述第一训练样本和所述第二训练样本作为输入，输入到所述待训练的识别模型中，确定所述第一训练样本的识别结果和所述第二训练样本的识别结果，可根据第一训练样本的识别结果及其标注，确定第一损失，根据第二训练样本的识别结果及其标注，确定第二损失。并以第一损失与第二损失之和最小为优化目标，对该识别模型进行训练。

当然，在步骤S106中确定第一模糊图像的标注时，还可根据各第二模糊图像的识别结果及其权重，以及至少一个第二模糊图像的预识别结果及权重，确定加权识别结果，作为该第一模糊图像的第一标注(例如，第一标注可以是0到1的一个概率值)，以及根据该加权识别结果，确定最高概率对应的状态，作为该第一模糊图像的第二标注(例如，以信号灯为例，如果根据加权识别结果确定的最高概率对应的状态为红色，则红色的标注为1，其他颜色的标注为0)。于是，在步骤S108中对识别模型进行训练时，可根据第一训练样本的识别结果及第一标注，确定第一损失，根据第二训练样本的识别结果及其标注，确定第二损失，以及根据第一训练样本的识别结果及第二标注，确定第三损失。并以第一损失、第二损失、与第三损失之和最小为优化目标，对该识别模型进行训练。

在训练模型的过程中，可采用迭代训练的方法训练识别模型，一次迭代训练识别模型的方法包括，确定第一训练样本，并基于各第一训练样本对识别模型进行训练。而针对一次迭代，可根据该次迭代的第一训练样本的识别结果及其标注，确定第一模糊图像的样本权重。当下一次迭代训练识别模型时，根据第一模糊图像的样本权重，确定该第一模糊图像是否可以用作下一次迭代的第一训练样本，该样本权重与第一模糊图像用于作为第一训练样本的概率正相关。响应于第一模糊图像的样本权重大于等于预设阈值，将该第一模糊图像确定为下一次迭代的第一训练样本。

具体的，可根据第一训练样本的当前权重(可预设为100％)，以及该第一模糊图像对应的第二模糊图像的识别结果确定该第一模糊图像的标注是否满足第一降权条件，所述第一降权条件可以是，该第一模糊图像的标注中，各类型的概率均小于30％，如，可认为标注中各类型的概率均小于30％的训练样本为背景，若满足第一降权条件，则降低第一模糊图像的当前权重；或确定该第一模糊图像的识别结果是否满足第二降权条件，所述第二降权条件可以是，该第一模糊图像的识别结果中，存在概率不小于70％的类型，如，可认为识别结果中存在概率不小于70％的类型的训练样本为简单样本，若满足第二降权条件，则降低第一模糊图像的当前权重。将第一模糊图像的降低后的当前权重确定为该第一模糊图像的样本权重，如果第一模糊图像的样本权重大于或等于概率阈值，则将该第一模糊图像确定为第一训练样本。

在本说明书提供的一个或多个实施例中，在训练好该识别模型后，可将检测模型与识别模型进行组合，并将该识别模型应用于确定无人驾驶设备环境图像中的各目标物类型的场景中，以使无人驾驶设备能够基于确定出的目标物类型，确定下一时刻该无人驾驶设备的运动策略，并通过采取相应的策略，以使下一时刻无人驾驶设备正常行驶而不发生交通事故。具体的根据目标物类型与位置等确定无人驾驶设备运动策略的方法已较为成熟，本说明书对此不再赘述。

需要说明的是，在本说明书中，第一训练样本的数量可能少于第二训练样本，因此，在确定训练样本对时，可重复对第一训练样本进行选择，当然，为了得到更多的训练样本，还可重复对第二训练样本对进行选择，具体的确定训练样本的方法可根据需要进行设置，本说明书对此不做限制。

另外，在本说明书的步骤S108中，基于各第一模糊图像及其标注训练得到的识别模型，可对同一目标物图像的不同模糊强度的模糊图像，输出同一识别结果。于是，基于大量训练样本训练得到的识别模型，可对各输入的目标物图像输出较为准确的识别结果，但是该识别结果的准确性是相对于模型来说的，即，目标物通过识别模型得到的识别结果与该目标物本身所属类型可能是错位的。如，若干信号灯状态为红色的目标物图像，经该识别模型得到的识别结果的信号灯状态都为绿色。因此，训练完成的识别模型在实际使用中，可对其识别结果进行映射，以输出正确的识别结果。

需要说明的是，对目标物图像的模糊处理不限于使目标物图像变得模糊，只要目标物图像经模糊处理后，得到与目标物图像的相似度为第一相似度的第一模糊图像和与目标物图像的相似度为第二相似度的第二模糊图像，所述第一相似度小于所述第二相似度即可。在实际使用中，对图像进行的模糊处理还可以包括腐蚀处理，即，确定目标物图像的第一腐蚀图像与第二腐蚀图像，第一腐蚀图像的腐蚀强度高于第二腐蚀图像，基于第二腐蚀图像确定第一腐蚀图像的标注，并以第一腐蚀图像的识别结果与标注对该识别模型进行训练等。同样，对目标物图像进行的模糊处理还可以包括仿射变换处理。在本说明书中，将以上模糊处理、腐蚀处理、仿射变换处理等统称为模糊处理。当然，目标物图像的模糊图像还可为各模糊处理叠加的结果，具体如何确定模糊图像可根据需要进行设置，本说明书对此不做限制。

需要说明的是，具体的加权条件和降权条件等可根据需要进行设置，本说明书对此不做限制。

以上为本说明书的一个或多个实施例提供的识别模型的训练方法基于同样的思路，本说明书还提供了相应的识别模型的训练装置，如图6所示。

图6为本说明书提供的识别模型的训练装置，包括：

获取模块200，用于获取无标注的目标物图像。

处理模块202，用于对所述无标注的目标物图像进行模糊化处理，获得所述无标注的目标物图像的第一模糊图像和第二模糊图像，所述第一模糊图像的模糊强度高于所述第二模糊图像。

识别模块204，用于将所述第二模糊图像输入到待训练的识别模型中，确定所述第二模糊图像的识别结果。

标注模块206，用于根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注。

训练模块208，用于以所述第一模糊图像为第一训练样本，根据所述第一模糊图像的标注，对待训练的识别模型进行训练。

可选地，所述处理模块202，具体用于对所述无标注的目标物图像进行多种模糊化处理，获得所述无标注的目标物图像的多个第二模糊图像；

可选的，所述识别模块204，具体用于将所述多个第二模糊图像输入到所述待训练的识别模型中，确定所述多个第二模糊图像各自的识别结果；

可选地，所述标注模块206，具体用于根据所述多个第二模糊图像各自的识别结果及其权重，对所述多个第二模糊图像各自的识别结果进行加权平均，确定加权识别结果，根据所述加权识别结果，确定所述第一模糊图像的标注。

可选地，所述训练模块208，具体用于采用迭代训练的方法训练所述待训练的识别模型，一次迭代训练所述待训练的识别模型的方法包括：获取有标注的目标物图像，作为第二训练样本，将所述第一训练样本和所述第二训练样本输入到所述待训练的识别模型中，确定所述第一训练样本的识别结果和所述第二训练样本的识别结果，根据所述第一训练样本的识别结果及其标注，确定第一损失，以及根据所述第二训练样本的识别结果及其标注，确定第二损失，根据所述第一损失与所述第二损失，调整所述待训练的识别模型的模型参数值。

可选地，所述标注模块206，具体用于获取有标注的目标物图像，作为第二训练样本，将所述无标注的目标物图像的所述第二模糊图像输入到基于所述第二训练样本确定的预识别模块中，确定所述第二模糊图像的预识别结果，根据所述第二模糊图像的识别结果和所述预识别结果，确定该第一模糊图像的标注。

可选地，所述训练模块208，还用于将所述第二训练样本输入到待训练的预识别模块中，确定所述第二训练样本的预识别结果，以所述第二训练样本的预识别结果和所述第二训练样本的标注之间的差异最小化为训练目标，调整所述预识别模块的模型参数值。

可选地，所述标注模块206，具体用于根据所述第二模糊图像的识别结果及其置信度，确定所述第二模糊图像的分类结果，根据所述第二模糊图像的分类结果，确定所述第一模糊图像的标注。

可选地，所述训练模块208，还用于针对一次迭代，根据该次迭代的所述第一训练样本的识别结果及其标注，确定所述第一模糊图像的样本权重，当下一次迭代训练所述识别模型时，响应于所述第一模糊图像的样本权重大于等于预设阈值，将所述第一模糊图像确定为所述下一次迭代的第一训练样本。

本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1提供的识别模型的训练方法。

本说明书还提供了图7所示的电子设备的示意结构图。如图7所述，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1所述的识别模型的训练方法。当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable Gate Array，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等，目前最普遍使用的是VHDL(Very-High-Speed Integrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

一种识别模型的训练方法，其特征在于，所述方法包括：

获取无标注的目标物图像；

对所述无标注的目标物图像进行模糊化处理，获得所述无标注的目标物图像的第一模糊图像和第二模糊图像，所述第一模糊图像的模糊强度高于所述第二模糊图像；

将所述第二模糊图像输入到待训练的识别模型中，确定所述第二模糊图像的识别结果；

根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注；

以所述第一模糊图像为第一训练样本，根据所述第一模糊图像的标注，对待训练的识别模型进行训练。
如权利要求1所述的方法，其特征在于，对所述无标注的目标物图像进行模糊化处理，获得所述无标注的目标物图像的第二模糊图像，包括：

对所述无标注的目标物图像进行多种模糊化处理，获得所述无标注的目标物图像的多个第二模糊图像；

将所述第二模糊图像输入到所述待训练的识别模型中，确定所述第二模糊图像的识别结果，包括：

将所述多个第二模糊图像输入到所述待训练的识别模型中，确定所述多个第二模糊图像各自的识别结果；

根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注，包括：

根据所述多个第二模糊图像各自的识别结果及其权重，对所述多个第二模糊图像各自的识别结果进行加权平均，确定加权识别结果；

根据所述加权识别结果，确定所述第一模糊图像的标注。
如权利要求1所述的方法，其特征在于，所述方法还包括：

采用迭代训练的方法训练所述待训练的识别模型，一次迭代训练所述待训练的识别模型的方法包括：

获取有标注的目标物图像，作为第二训练样本；

将所述第一训练样本和所述第二训练样本输入到所述待训练的识别模型中，确定所述第一训练样本的识别结果和所述第二训练样本的识别结果；

根据所述第一训练样本的识别结果及其标注，确定第一损失，以及根据所述第二训练样本的识别结果及其标注，确定第二损失，根据所述第一损失与所述第二损失，调整所述待训练的识别模型的模型参数值。
如权利要求1所述的方法，其特征在于，根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注，包括：

获取有标注的目标物图像，作为第二训练样本；

将所述无标注的目标物图像的所述第二模糊图像输入到基于所述第二训练样本确定的预识别模块中，确定所述第二模糊图像的预识别结果；

根据所述第二模糊图像的识别结果和所述预识别结果，确定所述第一模糊图像的标注。
如权利要求4所述的方法，其特征在于，所述方法还包括：

将所述第二训练样本输入到待训练的预识别模块中，确定所述第二训练样本的预识别结果，以所述第二训练样本的预识别结果和所述第二训练样本的标注之间的差异最小化为训练目标，调整所述预识别模块的模型参数值。
如权利要求1所述的方法，其特征在于，根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注，包括：

根据所述第二模糊图像的识别结果及其置信度，确定所述第二模糊图像的分类结果；

根据所述第二模糊图像的分类结果，确定所述第一模糊图像的标注。
如权利要求3所述的方法，其特征在于，采用迭代训练的方法训练所述待训练的识别模型，包括：

针对一次迭代，根据该次迭代的所述第一训练样本的识别结果及其标注，确定所述第一模糊图像的样本权重；

当下一次迭代训练所述识别模型时，响应于所述第一模糊图像的样本权重大于等于预设阈值，将所述第一模糊图像确定为所述下一次迭代的第一训练样本。
一种识别模型的训练装置，其特征在于，所述装置包括：

获取模块，用于获取无标注的目标物图像；

处理模块，对所述无标注的目标物图像进行模糊化处理，获得所述无标注的目标物图像的第一模糊图像和第二模糊图像，所述第一模糊图像的模糊强度高于所述第二模糊图像；

识别模块，用于将所述第二模糊图像输入到待训练的识别模型中，确定所述第二模糊图像的识别结果；

标注模块，用于根据所述第二模糊图像的识别结果，确定所述第一模糊图像的标注；

训练模块，用于以所述第一模糊图像为第一训练样本，根据所述第一模糊图像的标注，对待训练的识别模型进行训练。
一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1～7任一项所述的方法。
一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1～7任一项所述的方法。