WO2022193731A1

WO2022193731A1 - 对象识别模型的训练方法、装置及存储介质

Info

Publication number: WO2022193731A1
Application number: PCT/CN2021/134345
Authority: WO
Inventors: 黄国雄; 唐槐; 余子君
Original assignee: 杭州海康威视系统技术有限公司
Priority date: 2021-03-18
Filing date: 2021-11-30
Publication date: 2022-09-22
Also published as: CN115147671A

Abstract

本申请提供了一种对象识别模型的训练方法、装置及存储介质，涉及智能视频监控技术领域，有助于更高效率提升训练的对象识别模型的适应性。该方法包括：获取同一监测点位在不同时间的第一监测图像、包括有目标对象的参考图像以及标注信息；根据获取到的第一监测图像和参考图像，生成同一监测点位在不同时间的融合图像，融合图像包括目标对象以及第一监测图像的背景；将标注信息确定为融合图像的标注结果；根据融合图像和标注结果,对当前的对象识别模型进行迭代训练，直到模型收敛，得到第一目标对象识别模型；第一目标对象识别模型用于识别同一监测点位的第一监测图像中的目标对象。

Description

对象识别模型的训练方法、装置及存储介质

本申请要求于2021年3月18日提交中国专利局、申请号为202110290714.0发明名称为“对象识别模型的训练方法、装置及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及视频监控技术领域，尤其涉及对象识别模型的训练方法、装置及存储介质。

背景技术

在视频监控领域中，对象识别是比较重要的一个研究方向。目前的对象识别技术通常是使用样本图像预先训练好一个对象识别模型，根据该对象识别模型，对以目标场景为背景的目标对象的图像进行目标对象的识别。但是，在实际应用中，参与对象识别模型训练的样本图像可能并非是以目标场景为背景的图像。这样，基于这些样本图像预先训练好的对象识别模型对目标场景为背景的图像进行目标对象的识别，所得到的识别结果可能不准确。

为了解决上述问题，可针对目标场景重新训练适用该目标场景的对象识别模型。但是，为了重新训练对象识别模型需要提取以目标场景为背景的样本图像，例如，逐帧的手工裁切出样本图像。这需要花费大量的人工成本。

发明内容

本申请实施例提供一种对象识别模型的训练方法、装置及存储介质，有助于更高效率提升训练的对象识别模型的适应性。

为达到上述目的，本申请实施例采用如下技术方案：

第一方面，本申请实施例提供一种图像处理方法，该方法包括：获取同一监测点位在不同时间的第一监测图像、包括有目标对象的参考图像以及标注信息，该标注信息用于表征参考图像中目标对象的识别结果，且标注信息的准确度大于准确度阈值；根据获取到的第一监测图像和参考图像，生成同一监测点位在不同时间的融合图像，该融合图像包括目标对象以及第一监测图像的背景；将标注信息确定为融合图像的标注结果；根据该融合图像和标注结果，对当前的对象识别模型进行迭代训练，直到模型收敛，得到第一目标对象识别模型，该第一目标对象识别模型用于识别同一监测点位的监测图像中的目标对象。

为了使当前的对象识别模型适用于上述监测点位获取的图像中目标对象的识别，本申请实施例中，根据获取到的该监测点位的第一监测图像和参考图像，生成该监测点位在不同时间的融合图像，融合图像包括了目标对象以及第一监测图像的背景，第一监测图像可以为该特定监测点位采集得到的仅包括背景的图像，也可以为该特定监测点位采集得到的包括背景以及前景的图像，将参考图像的标注信息确定为融合图像的标注结果，参考图像的标注信息表征参考图像中目标对象的识别结果。这样，根据融合图像及融合图像的标注结果，训练当前的对象识别模型，得到的第一目标对象识别模型即可用于识别该监测点位获取的图像中的目标对象，而无需人工获取该监测点位获取的包括目标对象的样本图像，节省了人工成本，进而可以更高效率提升训练的对象识别模型的适应性。

在一种可能的实现方式中，上述“根据获取到的第一监测图像和参考图像，生成同一监测点位在不同时间的融合图像”包括：获取参考图像中目标对象的图像；根据预设的图像融合算法，融合同一监测点位在不同时间的第一监测图像和目标对象的图像，得到同一监测点位在不同时间的融合图像。

这样，根据图像融合算法，可以将目标对象的图像融合进第一监测图像的背景图像中的不同位置，得到同一监测点位在不同时间的多个不同的融合图像，进一步丰富了参与训练的样本图像，从而提高了训练得到的第一目标对象识别模型的适应性。

在另一种可能的实现方式中，上述“根据预设的图像融合算法，融合同一监测点位在不同时间的第一监测图像和目标对象的图像，得到同一监测点位在不同时间的融合图像”包括：根据预设的图像融合算法，融合同一监测点位在不同时间的第一监测图像和目标对象的图像，得到同一监测点位在不同时间的中间图像；对同一监测点位在不同时间的中间图像进行数据增强处理，得到同一监测点位在不同时间的融合图像。

这样，对通过预设的图像融合算法融合得到的中间图像进行数据增强，例如：对融合图像添加噪声、调整融合图像的对比度、调整融合图像的饱和度、对融合图像进行裁剪或者缩放等，得到更多的融合图像，进一步丰富了参与训练的样本图像，从而进一步提高了训练得到的第一目标对象识别模型的适应性。

在另一种可能的实现方式中，上述“获取包括有目标对象的参考图像以及标注信息”包括：将包括有目标对象的测试图像输入到当前的对象识别模型，得到每一测试图像的识别结果；将目标识别结果以及准确度大于准确度阈值的识别结果对应的测试图像作为参考图像；目标识别结果为响应于对准确度小于等于所述准确度阈值的识别结果的调整操作，所得到的调整后的识别结果；将目标识别结果以及准确度大于准确度阈值的识别结果作为标注信息。

这样，将目标识别结果以及准确度大于准确度阈值的识别结果作为标注信息，节省了人工标注的成本，更高效率提升了训练的对象识别模型的适应性。

在另一种可能的实现方式中，该方法还包括：获取同一监测点位包括待识别对象的第二监测图像；将第二监测图像输入第一目标对象识别模型，得到第二监测图像中待识别对象的中间识别结果；响应于对中间识别结果的调整操作，获取调整后的中间识别结果，调整后的中间识别结果用于表征待识别对象是否为目标对象；将调整后的中间识别结果确定为第二监测图像的标注结果；根据第二监测图像以及第二监测图像的标注结果，对第一目标对象识别模型进行迭代训练，得到第二目标对象识别模型。

这样，在将第一目标对象识别模型应用于特定监测点位的第二监测图像的识别的过程中，对得到的中间识别结果进行调整操作，得到调整后的中间识别结果，相当于对第二监测图像中的待识别对象进行了界定，从而使得训练得到的第二目标对象识别模型在识别待识别对象时更准确。

在另一种可能的实现方式中，该方法还包括：获取所述同一监测点位包括待识别对象的第三监测图像，所述第三监测图像的标注结果用于表征所述待识别对象是否候选对象；将所述第三监测图像输入所述第一目标对象识别模型，得到所述第三监测图像中所述待识别对象的中间识别结果；响应于所述中间识别结果表征所述待识别对象为所述目标对象，以及对所述第一目标对象识别模型的调整操作，获取调整后的第一目标对象识别模型；所述调整后的第一目标对象识别模型用于输出所述待识别对象是否为所述候选对象的识别结果；根据所述第三监测图像以及所述第三监测图像的标注结果，对调整后的第一目标对象识别模型进行迭代训练，得到第三目标对象识别模型。

第二方面，本申请实施例提供一种对象识别模型的训练装置。该训练装置包括：获取模块、生成模块、确定模块以及训练模块。上述获取模块，用于获取同一监测点位在不同时间的第一监测图像、包括有目标对象的参考图像以及标注信息；标注信息用于表征参考图像中目标对象的识别结果，且标注信息的准确度大于准确度阈值。上述生成模块，用于根据获取模块获取到的第一监测图像和参考图像，生成同一监测点位在不同时间的融合图像，融合图像包括目标对象以及第一监测图像的背景。上述确定模块，用于将获取模块获取到的标注信息确定为生成模块生成的融合图像的标注结果。上述训练模块，用于根据生成模块生成的融合图像和确定模块确定的标注结果，对当前的对象识别模型进行迭代训练，直到模型收敛，得到第一目标对象识别模型；第一目标对象识别模型用于识别同一监测点位的第一监测图像中的目标对象。

可选的，上述生成模块，具体用于获取参考图像中目标对象的图像；根据预设的图像融合算法，融合同一监测点位在不同时间的第一监测图像和目标对象的图像，得到同一监测点位在不同时间的融合图像。

可选的，上述生成模块具体用于：根据预设的图像融合算法，融合同一监测点位在不同时间的第一监测图像和目标对象的图像，得到同一监测点位在不同时间的中间图像；对同一监测点位在不同时间的中间图像进行数据增强处理，得到同一监测点位在不同时间的融合图像。

可选的，上述获取模块具体用于：将包括有目标对象的测试图像输入到当前的对象识别模型，得到每一测试图像的识别结果；将目标识别结果以及准确度大于准确度阈值的识别结果对应的测试图像作为参考图像；目标识别结果为响应于对准确度小于等于所述准确度阈值的识别结果的调整操作，所得到的调整后的识别结果；将目标识别结果以及准确度大于准确度阈值的识别结果作为标注信息。

可选的，上述获取模块还用于：获取同一监测点位在不同时间包括待识别对象的第二监测图像；将第二监测图像输入第一目标对象识别模型，得到第二监测图像中待识别对象的中间识别结果；响应于对中间识别结果的调整操作，获取调整后的中间识别结果，调整后的中间识别结果用于表征待识别对象是否为目标对象；确定模块还用于：将调整后的中间识别结果确定为第二监测图像的标注结果；训练模块还用于：根据第二监测图像以及第二监测图像的标注结果对第一目标对象识别模型进行迭代训练，得到第二目标对象识别模型。

可选的，所述获取模块还用于：获取所述同一监测点位包括待识别对象的第三监测图像，所述第三监测图像的标注结果用于表征所述待识别对象是否候选对象；将所述第三监测图像输入所述第一目标对象识别模型，得到所述第三监测图像中所述待识别对象的中间识别结果；响应于所述中间识别结果表征所述待识别对象为所述目标对象，以及对所述第一目标对象识别模型的调整操作，获取调整后的第一目标对象识别模型；所述调整后的第一目标对象识别模型用于输出所述待识别对象是否为所述候选对象的识别结果；

所述训练模块还用于：根据所述第三监测图像以及所述第三监测图像的标注结果，对调整后的第一目标对象识别模型进行迭代训练，得到第三目标对象识别模型。

第三方面，本申请提供一种对象识别模型的训练装置，包括：存储器和处理器；存储器和处理器耦合；存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令；当所述处理器执行所述计算机指令时，所述对象识别模型的训练装置执行上述第一方面及其任一种可能的实现方式提供的对象识别模型的训练方法。

第四方面，本申请提供一种计算机可读存储介质，存储有指令。当所述指令在对象识别模型的训练装置上运行时，使得对象识别模型的训练装置执行如上述第一方面及其任一种可能的实现方式提供的对象识别模型的训练方法。

第五方面，本申请提供一种计算机程序产品，当所述计算机程序产品在对象识别模型的训练装置上运行时，使得所述对象识别模型的训练装置执行如第一方面及其任一种可能的实现方式提供的对象识别模型的训练方法。

需要说明的是，上述计算机指令可以全部或者部分存储在第一计算机可读存储介质上。其中，第一计算机可读存储介质可以与对象识别模块的训练装置的处理器封装在一起的，也可以与对象识别模型的训练装置的处理器单独封装，本申请对此不作限定。

本申请中第二方面、第三方面、第四方面以及第五方面的描述，可以参考第一方面的详细描述；并且，第二方面、第三方面、第四方面以及第五方面的描述的有益效果，可以参考第一方面的有益效果分析，此处不再赘述。

在本申请中，上述对象识别模型的训练装置的名字对设备或功能模块本身不构成限定，在实际实现中，这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本申请类似，属于本申请权利要求及其等同技术的范围之内。

本申请的这些方面或其他方面在以下的描述中会更加简明易懂。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的背景和目标对象的一种示意图；

图2为本申请实施例提供的一种训练系统的一种结构示意图；

图3为本申请实施例提供的一种对象识别模型的训练方法的一种流程示意图；

图4为本申请实施例提供的一种测试图像的示意图；

图5为本申请实施例提供的一种获取目标对象的图像的示意图；

图6为本申请实施例提供的一种根据预设的图像融合算法，融合第一监测图像和目标对象的图像以得到融合图像的一种示意图；

图7为本申请实施例提供的一种对第一目标对象识别模型进行优化得到第二目标对象识别模型的方法的一种流程示意图；

图8为本申请实施例提供的一种第二监测图像的示意图；

图9为本申请实施例提供的一种对象识别模型的训练装置30的第一种结构示意图；

图10为本申请实施例提供的一种对象识别模型的训练装置30的第二种结构示意图；

图11为本申请实施例提供的对象识别模型的训练方法的计算机程序产品的一种结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于清楚描述本申请实施例的技术方案，在本申请的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分，本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。

为了便于理解本申请，下面先对本申请的实施例涉及到的相关术语进行解释。

背景：指图像采集装置在较长的时间尺度下采集的图像中不会变化的区域。如图1中的a所示，背景可以为无任何前景对象的房间。

目标对象：指图像采集装置在较长的时间尺度下采集的图像中会变化的区域，也可以称为前景对象。如图1中的b所示，目标对象可以为摔倒在地的人体。

下面对本申请实施例提供的对象识别模型的训练方法所适用的训练系统的结构进行描述。

图2为本申请实施例提供的一种训练系统的一种结构示意图。如图2所示，该训练系统可以包括：至少一个图像采集装置10(图2中以图像采集装置为摄像头10-1至摄像头10-3为例进行示意，并不起限定作用)和服务器20。

其中，图像采集装置10，可以用于采集指定区域(如被监控房间)的图像，并将采集的图像发送至服务器20。示例性的，当指定区域为老年公寓房间内部特定区域，并且图像采集装置10为摄像头时，图像采集装置10采集的该指定区域的图像如图1中a和b所示。

在实际的应用中，摄像头的安装位置(又称监测点位)固定时其采集区域也是固定的。示例性的，摄像头的种类为枪机、小半球摄像头或者大半球摄像头时，其采集图像的角度也是唯一的。

服务器20，存储有训练好的对象识别模型，该对象识别模型是基于多个标注样本图像训练得到的。其中，标注样本图像为带有标注结果的样本图像，样本图像包括的对象可以为目标对象，也可以为其他对象。样本图像的标注结果可以为用于指示该样本图像包括的对象是否为目标对象，也可以用于指示该样本图像包括的对象为哪个对象。

服务器20可以将包括有目标对象的参考图像输入该对象识别模型，得到预测结果，根据预测结果得到该包括有目标对象的参考图像的识别结果。

服务器20可以用于接收至少一个图像采集装置10采集的指定区域的图像，并根据该指定区域的图像以及包括有目标对象的参考图像，生成融合图像。服务器20可以根据融合图像以及参考图像的识别结果，按照本申请实施例提供的对象识别模型的训练方法，训练当前的对象识别模型，从而得到能够识别出以指定区域为背景的图像中的目标对象的对象识别模型。

本申请实施例提供的服务器20可以为个人计算机、笔记本电脑、智能手机、平板电脑、服务器或服务器集群等计算机设备。图像采集装置10可以为用于采集图像的设备，例如：相机、抓拍机或摄像机等。

本申请实施例中的对象识别模型的训练装置可以是图2中示出的服务器20，也可以是服务器20中的一部分装置。例如，服务器20中的芯片系统。该芯片系统包括芯片，也可以包括其他分立器件或电路结构。

以下结合图2示出的训练系统架构，以对象识别模型的训练装置为服务器20为例，对本申请实施例所提供的对象识别模型的训练方法进行介绍。

在进行适用于目标场景的对象识别模型的训练之前，服务器20可以获取多个带标注结果的样本图像，并根据获取的带标注结果的样本图像训练得到当前的对象识别模型。当前的对象识别模型可以用于识别图像中的目标对象。示例性的，服务器20根据通用背景下目标对象的多个图像训练得到当前的对象识别模型。本申请实施例对通用背景不进行限定，示例性的通用背景可以是绿幕、街边场景或室内场景等场景。

如图3所示，为本申请实施例提供的对象识别模型的训练方法的一种流程示意图，该训练方法包括：

S11、服务器20获取同一监测点位在不同时间的第一监测图像、包括有目标对象的参考图像以及标注信息。

其中，标注信息用于表征参考图像中目标对象的识别结果，且标注信息的准确度大于准确度阈值。监测点位在不同时间的图像可以理解为：监测点位的图像采集装置10在不同时间所采集的图像。

服务器20获取同一监测点位在不同时间的第一监测图像可以包括如下实现方式：

在一种可能的实现方式中，服务器20接收图像采集装置10发送的第一监测图像。例如，待监控现场中图像采集装置10的监测点位确定之后，该图像采集装置10的采集区域即为固定区域，可以称为第一场景。图像采集装置10采集第一场景的图像，从采集得到的第一场景的图像中，确定以第一场景为背景区域、且在不同时间所采集的没有任何前景对象的图像为第一监测图像。其中，第一监测图像指图像采集装置10在预设时间段内采集得到的第一场景的图像中不会变化的区域的图像。

本申请实施例中，图像采集装置10从采集得到的第一场景的图像中，确定在不同时间所采集的第一监测图像，并将第一监测图像发送给服务器20。第一监测图像以第一场景为背景区域，且第一监测图像中没有任何前景对象。可以理解的，第一监测图像即为背景图像，即为第一监测图像指的是：图像采集装置10在预设时间段内采集的第一场景的图像中的背景图像。

预设时间段可以为根据实际需求进行设定，例如，预设时间段可以为一天、两天或一个星期等。

示例性的，图像采集装置10架设于待监控现场的监测点位之后，该图像采集装置10对预设时间段内(例如：一天内)采集得到的第一场景的图像进行筛选，得到不同时间或不同光照条件下第一场景的第一监测图像。

预设时间段内，时间不同，光照条件不同。图像采集装置10获得不同时间的第一场景的第一监测图像，即为获得不同光照条件下第一场景的第一监测图像。

在另一种可能的实现方式中，服务器20从架设于待监控现场的监测点位的图像采集装置10发送的第一场景的图像中，确定第一场景的第一监测图像。

本申请实施例中。图像采集装置10将采集得到的第一场景的图像发送给服务器20。服务器20从接收的第一场景的图像中，确定在不同时间所采集的第一监测图像。第一监测图像以第一场景为背景区域，且第一监测图像中没有任何前景对象。

示例性的，图像采集装置10架设于待监控现场的监测点位之后，图像采集装置10向服务器20发送预设时间段内采集得到的第一场景的图像。服务器20可以对第一场景的图像进行筛选处理，得到第一场景的第一监测图像。或者，服务器20也可以根据抠图算法，获取第一场景的图像中的背景图像，将获取的背景图像作为第一监测图像。

在再一种可能的实现方式中，第一监测图像也可以为图像采集装置10采集的任一图像，即第一监测图像可以包括前景对象，也可以不包括前景对象。

在一种可能的实现方式中，服务器20通过如下步骤，获取包括有目标对象的参考图像以及标注信息：

步骤一：服务器20获取包括有目标对象的测试图像。

测试图像的数量可以为一个或多个。

在一种可能的实现方式中，服务器20接收其他装置(例如：图像采集装置10)发送的包括有目标对象的测试图像。

在另一种可能的实现方式中，服务器20读取服务器20本地存储的包括有目标对象的测试图像。

步骤二：服务器20将包括有目标对象的测试图像输入当前的对象识别模型，得到每一测试图像的识别结果。

步骤三：服务器20将目标识别结果以及准确度大于准确度阈值的识别结果对应的测试图像作为参考图像。其中，目标识别结果为响应于对准确度小于等于准确度阈值的识别结果的调整操作，所得到的调整后的识别结果。

准确度阈值可以根据实际需求进行设定。例如，准确度阈值可以为85％、90％、95％或97％等。

本申请实施例中，服务器20将测试图像中准确度大于准确度阈值的识别结果对应的测试图像作为参考图像；针对准确度小于或者等于准确度阈值的识别结果，响应于对该识别结果的调整操作，获取调整后的识别结果作为目标识别结果，并将目标识别结果对应的测试图像也作为参考图像。

本申请实施例中，以准确度大于准确度阈值的识别结果为第一识别结果，对准确度小于或者等于准确度阈值的识别结果为第二识别结果为例。服务器20将第一识别结果对应的测试图像作为参考图像；另外，服务器20响应于对第二识别结果的调整操作，获取调整后的第二识别结果作为目标识别结果，将目标识别结果对应的测试图像也作为参考图像。

可以理解的，本申请实施例中，第一识别结果与第二识别结果为结果相反的两个识别结果，例如，第一识别结果指示目标对象为A，则第二识别结果指示目标对象不是A，基于此，可以以有限的资源，丰富训练数据，提高了训练得到的对象识别模型的准确度。

本申请实施例中，服务器20将所有的测试图像均作为参考图像。若一个测试图像的识别结果的准确度大于准确度阈值，则将该识别结果作为相应的参考图像的识别结果；若测试图像的识别结果的准确度小于或者等于准确度阈值，则对该识别结果进行调整，得到调整后的识别结果，即目标识别结果，将该目标识别结果作为相应的参考图像的识别结果。

在一个例子中，如图4所示的测试图像为：包括目标对象为做瑜伽的人体的测试图像。服务器20将该测试图像输入当前的对象识别模型，得到该测试图像的识别结果为：目标对象为摔倒在地的人体，且该识别结果的准确度为75％。该准确度75％低于准确度阈值85％。人工审核该识别结果的过程中，服务器20响应于输入的对该识别结果的调整操作，得到调整后的识别结果为目标对象为非摔倒在地的人体。因此，服务器20获取的目标识别结果为：目标对象为非摔倒在地的人体。图4所示的测试图像为该目标识别结果对应的测试图像。服务器20将图4所示的测试图像作为参考图像，该参考图像的识别结果为：目标对象为非摔倒在地的人体。

步骤四：服务器20将目标识别结果以及准确度大于准确度阈值的识别结果作为每个识别结果对应的参考图像的标注信息。

对于每个目标识别结果，服务器20将该目标识别结果作为该目标识别结果对应的参考图像的标注信息；对于准确度大于准确度阈值的每个识别结果，服务器20将该识别结果作为该识别结果对应的参考图像的标注信息。

基于步骤三中的示例，服务器20将目标对象为非摔倒在地的人体作为图4所示参考图像的标注信息。

S12、服务器20根据获取到的第一监测图像和参考图像，生成同一监测点位在不同时间的融合图像。其中，融合图像包括目标对象以及第一监测图像的背景。

本申请实施例中，对于一个监测点位，第一监测图像可以理解为背景图像。服务器20将参考图像分别与该监测点位在不同时间的第一监测图像融合，得到该监测点位在不同时间的融合图像。

在一种可能的实现方式中，服务器20获取参考图像中目标对象的图像，并根据预设的图像融合算法，融合同一监测点位在不同时间的第一监测图像和目标对象的图像，得到同一监测点位在不同时间的融合图像。

在一个例子中，服务器20对如图5中a所示的包括有目标对象的图像使用抠图算法，得到图5中b所示的目标对象的图像。如图6所示，服务器20根据预设的图像融合算法，融合第一监测图像a和目标对象的图像b，得到融合图像c的示意图。

可选的，服务器20根据预设的图像融合算法，融合同一监测点位在不同时间的第一监测图像和目标对象的图像，得到同一监测点位在不同时间的中间图像，对同一监测点位在不同时间的中间图像进行数据增强处理，得到更多的融合图像。

示例性的，数据增强处理可以包括但不限于添加噪声、调整对比度、调整饱和度、裁剪和缩放等处理。基于此，服务器20可以为得到的中间图像添加噪声、调整融合图像的对比度、调整融合图像的饱和度、对融合图像进行裁剪或者对融合图像进行缩放等数据增强处理，得到更多的融合图像。

S13、服务器20将标注信息确定为融合图像的标注结果。

对于每一参考图像，服务器20将该参考图像与第一监测图像融合，得到融合图像后，将该参考图像的标注信息作为该融合图像的标注结果。

基于图5中a所示的参考图像的标注信息为：目标对象为摔倒在地的人体，因此，图6所示的融合图像的标注结果为：目标对象为摔倒在地的人体。

可以理解的是，服务器20执行上述S11～S13可以自动生成多个融合图像以及融合图像的标注结果，这多个融合图像可以作为样本图像，融合图像的标注结果可以作为样本图像的标注结果，进而基于这多个样本图像以及样本图像的标注结果，训练当前的对象识别模型，降低了获取样本图像以及样本图像的标注结果的人工成本。

S14、服务器20根据融合图像和标注结果，对当前的对象识别模型进行迭代训练，直到模型收敛，得到第一目标对象识别模型。第一目标对象识别模型用于识别同一监测点位的监测图像中的目标对象。监测图像指的是位于同一监测点的图像采集装置10采集的任一图像。

可以理解的是，服务器20还可以将第一目标对象识别模型作为新的当前的对象识别模型，重新执行上述S11～S14对当前的对象识别模型进行迭代训练，从而得到新的第一目标对象识别模型。新的第一目标对象识别模型在对该监测点位获取的包括目标对象的图像进行目标对象识别时更准确。

为了使当前的对象识别模型适用于特定监测点位获取的图像中目标对象的识别，本申请实施例中，根据获取到的该特定监测点位的第一监测图像和参考图像，生成该特定监测点位在不同时间的融合图像，融合图像包括了目标对象以及第一监测图像的背景，第一监测图像可以为该特定监测点位采集得到的仅包括背景的图像，也可以为该特定监测点位采集得到的包括背景以及前景的图像。将参考图像的标注信息确定为融合图像的标注结果，参考图像的标注信息表征参考图像中目标对象的识别结果。这样，根据融合图像及融合图像的标注结果，训练当前的对象识别模型，得到的第一目标对象识别模型即可用于识别该特定监测点位获取的图像中的目标对象，而无需人工获取该特定监测点位获取的包括目标对象的样本图像，节省了人工成本，进而可以更高效率提升训练的对象识别模型的适应性。

在一种可能的实现方式中，在获得第一目标对象识别模型之后，服务器20还可以获取该同一监测点位采集的包括待识别对象的第二监测图像，并将第二监测图像输入第一目标对象识别模型，得到第二监测图像中待识别对象的中间识别结果；响应于对中间识别结果的调整操作，获取调整后的中间识别结果，并根据调整后的中间识别结果以及第二监测图像，对第一目标对象识别模型进行优化，得到第二目标对象识别模型。

如图7所示，图7为对第一目标对象识别模型进行优化得到第二目标对象识别模型的方法的一种流程示意图，该方法可以包括：

S21、服务器20获取同一监测点位包括待识别对象的第二监测图像。

本申请实施例中，服务器20接收图像采集装置10发送的以第一场景为背景区域、且包括待识别对象的第二监测图像。

S21可以为：图像采集装置10向服务器20发送第二监测图像，该第二监测图像以第一场景为背景区域，且该第二监测图像包括待识别对象。

示例性的，服务器20获取的第二监测图像包括如图8中a和b所示的监测图像。图8中a所示的对象80为待识别对象的图像，图8中b所示的对象81为待识别对象的图像。

待识别对象与上述目标对象可以为相同的对象，也可以为不同的对象，本申请实施例对此不进行限定。

S22、服务器20将第二监测图像输入第一目标对象识别模型，得到第二监测图像中待识别对象的中间识别结果。

基于S21中的示例，图8中a所示待识别对象的中间识别结果为：待识别对象为非摔倒在地的人体，图8中b所示待识别对象的中间识别结果为：待识别对象为摔倒在地的人体。

S23、服务器20响应于对中间识别结果的调整操作，获取调整后的中间识别结果。调整后的中间识别结果用于表征待识别对象是否为目标对象。调整后的中间识别结果为待识别对象的正确识别结果。

以目标对象为非摔倒在地的人体为例。基于S22中的示例，图8中a所示待识别对象的调整后的中间识别结果为：待识别对象为摔倒在地的人体，图8中b所示待识别对象的调整后的中间识别结果为：待识别对象为非摔倒在地的人体。

可以理解的是，上述第二监测图像可以是多个第二监测图像，每个第二监测图像分别包括待识别对象。对于每个第二监测图像均可以执行上述S22～S23，进而得到每个第二监测图像的中间识别结果。在中间识别结果错误的情况下，获取调整后的中间识别结果。

示例性的，假设，第一目标对象识别模型可以用于识别对象A、对象B和对象C。将多个第二监测图像输入第一目标对象识别模型，得到的第二监测图像中待识别对象的中间识别结果，以及获取的调整后的中间识别结果如下表1所示。

表1

中间识别结果	调整后的中间识别结果
A	Aˊ
Aˊ	A
Bˊ	B
B	Bˊ
C	Cˊ
Cˊ	C

表1中的A用于表征对象A，Aˊ用于表征非对象A。B用于表征对象B，Bˊ用于表征非对象B，C用于表征对象C，Cˊ用于表征非对象C。

S24、服务器20将调整后的中间识别结果确定为第二监测图像的标注结果。

可以理解的是，服务器20可以通过执行上述S21～S24，得到多个第二监测图像以及每个第二监测图像的标注结果。

S25、服务器20根据第二监测图像以及第二监测图像的标注结果，对第一目标对象识别模型进行迭代训练，得到第二目标对象识别模型。

本申请实施例中，服务器20可以在得到多个第二监测图像以及每个第二监测图像的标注结果之后，根据该多个第二监测图像以及与每个第二监测图像的标注结果，对第一目标对象识别模型进行迭代训练，得到第二目标对象识别模型。服务器20也可以在每得到一个第二监测图像及该第二监测图像的标注结果之后，根据该第二监测图像及该第二监测图像的标注结果，对第一目标对象识别模型进行迭代训练，得到第二目标对象识别模型。本申请实施例对此不进行限定。

可以理解的是，在得到多个第二监测图像以及每个第二监测图像的标注结果之后，根据该多个第二监测图像以及与每个第二监测图像的标注结果，对第一目标对象识别模型进行迭代训练，得到的第二目标对象识别模型更加稳定。

本申请实施例中，在将第一目标对象识别模型应用于第一场景中目标对象的识别的过程中，人为对识别错误的识别结果进行调整(即上述响应于对中间识别结果的调整操作，获取调整后的中间识别结果)，并将调整后的识别结果作为对应的第二监测图像的标注结果，来对第一目标对象识别模型进行迭代训练，得到第二目标对象识别模型。由于第二目标对象识别模型学习了调整后的中间识别结果，因此，得到的第二目标对象识别模型识别第一场景中目标对象的准确度高于第一目标对象识别模型识别第一场景中目标对象的准确度，即第二准确度高于第一准确度，第一准确度为第一目标对象识别模型识别第一场景中目标对象的准确度，第二准确度为第二目标对象识别模型识别第一场景中目标对象的准确度。

本申请实施例还提供了一种对象识别模型的训练方法，该方法中，服务器获取同一监测点位包括待识别对象的第三监测图像，第三监测图像的标注结果用于表征待识别对象是否候选对象；将第三监测图像输入第一目标对象识别模型，得到第三监测图像中待识别对象的中间识别结果；响应于中间识别结果表征待识别对象为目标对象，以及对第一目标对象识别模型的调整操作，获取调整后的第一目标对象识别模型；调整后的第一目标对象识别模型用于输出待识别对象是否为候选对象的识别结果；根据第三监测图像以及第三监测图像的标注结果，对调整后的第一目标对象识别模型进行迭代训练，得到第三目标对象识别模型。

例如，服务器获取的监测图像a中包括待识别对象为梨子，第一目标对象识别模型对该监测图像a进行识别，得到中间识别结果为该监测图像a中待识别对象为苹果，则第一目标对象识别模型进行调整，获取调整后的第一目标对象识别模型，该调整后的第一目标对象识别模型用于输出待识别对象是否为梨子的识别结果。服务器根据该监测图像a以及该监测图像a的标注结果，对调整后的第一目标对象识别模型进行迭代训练，得到第三目标对象识别模型。

本申请实施例中，根据实时获取的监测图像对目标对象识别模型进行调整以及训练，进一步提高了目标对象识别模型识别的准确性。

上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例，对对象识别模型的训练装置进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

如图9所示，为本申请实施例提供的一种对象识别模型的训练装置30的第一种结构示意图。对象识别模型的训练装置30包括获取模块301、生成模块302、确定模块303以及训练模块304。

其中，获取模块301，用于获取同一监测点位在不同时间的第一监测图像、包括有目标对象的参考图像以及标注信息；所述标注信息用于表征所述参考图像中目标对象的识别结果，且所述标注信息的准确度大于准确度阈值。

例如：结合图3所示的流程，获取模块301可以用于执行S11；结合图7所示的流程，获取模块301还可以用于执行S21～S23。

生成模块302，用于根据获取模块301获取到的第一监测图像和参考图像，生成同一监测点位在不同时间的融合图像，融合图像包括目标对象以及第一监测图像的背景。例如：结合图3所示的流程，生成模块302可以用于执行S12。

确定模块303，用于将获取模块301获取到的标注信息确定为生成模块302生成的融合图像的标注结果。例如：结合图3所示的流程，确定模块303可以用于执行S13；结合图7所示的流程，确定模块303还可以用于执行S24。

训练模块304，用于根据生成模块302生成的融合图像和确定模块303确定的标注结果，对当前的对象识别模型进行迭代训练，直到模型收敛，得到第一目标对象识别模型；第一目标对象识别模型用于识别同一监测点位的监测图像中的目标对象。

例如：结合图3所示的流程，训练模块304可以用于执行S14，结合图7训练模块304还可以用于执行S25。

可选的，生成模块302，具体可以用于：获取参考图像中目标对象的图像；根据预设的图像融合算法，融合同一监测点位在不同时间的第一监测图像和目标对象的图像，得到同一监测点位在不同时间的融合图像。

可选的，生成模块302，具体可以用于：根据预设的图像融合算法，融合同一监测点位在不同时间的第一监测图像和目标对象的图像，得到同一监测点位在不同时间的中间图像；对同一监测点位在不同时间的中间图像进行数据增强处理，得到同一监测点位在不同时间的融合图像。

可选的，获取模块301，具体可以用于：将包括有目标对象的测试图像输入到当前的对象识别模型，得到每一测试图像的识别结果；将目标识别结果以及准确度大于准确度阈值的识别结果对应的测试图像作为参考图像；目标识别结果为响应于对准确度小于等于准确度阈值的识别结果的调整操作，所得到的调整后的识别结果；将目标识别结果以及准确度大于准确度阈值的识别结果作为标注信息。

可选的，获取模块301还可以用于：获取同一监测点位包括待识别对象的第二监测图像；将第二监测图像输入第一目标对象识别模型，得到第二监测图像中待识别对象的中间识别结果；响应于对中间识别结果的调整操作，获取调整后的中间识别结果，调整后的中间识别结果用于表征待识别对象是否为目标对象；

确定模块303，还可以用于将调整后的中间识别结果确定为第二监测图像的标注结果。

训练模块304还可以用于：根据第二监测图像以及第二监测图像的标注结果，对第一目标对象识别模型进行迭代训练，得到第二目标对象识别模型。

其中，上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述，其作用在此不再赘述。

可选的，获取模块301还可以用于：获取同一监测点位包括待识别对象的第三监测图像，第三监测图像的标注结果用于表征待识别对象是否候选对象；将第三监测图像输入第一目标对象识别模型，得到第三监测图像中待识别对象的中间识别结果；响应于中间识别结果表征待识别对象为目标对象，以及对第一目标对象识别模型的调整操作，获取调整后的第一目标对象识别模型；调整后的第一目标对象识别模型用于输出待识别对象是否为候选对象的识别结果；

训练模块304还可以用于：根据第三监测图像以及第三监测图像的标注结果，对调整后的第一目标对象识别模型进行迭代训练，得到第三目标对象识别模型。

图10为本申请实施例提供的一种对象识别模型的训练装置30的第二种结构示意图，如图10所示，该对象识别模型的训练装置30可以包括：至少一个处理器51、存储器52、通信接口53和通信总线54。

下面结合图10对对象识别模块的训练装置的各个构成部件进行具体的介绍：

其中，处理器51是对象识别模块的训练装置的控制中心，可以是一个处理器，也可以是多个处理元件的统称。例如，处理器51是一个中央处理器(Central Processing Unit，CPU)，也可以是特定集成电路(Application Specific Integrated Circuit，ASIC)，或者是被配置成实施本申请实施例的一个或多个集成电路，例如：一个或多个DSP，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array，FPGA)。

作为一种实施例，处理器51可以包括一个或多个CPU，例如图10中所示的CPU0和CPU1。且，作为一种实施例，对象识别模块的训练装置可以包括多个处理器，例如图10 中所示的两个处理器51。这些处理器中的每一个可以是一个单核处理器(Single-CPU)，也可以是一个多核处理器(Multi-CPU)。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

存储器52可以是只读存储器(Read-Only Memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(Random Access Memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器52可以是独立存在，通过通信总线54与处理器51相连接。存储器52也可以和处理器51集成在一起。

其中，存储器52，用于存储本申请实施例中的数据和执行本申请实施例的软件程序。处理器51可以通过运行或执行存储在存储器52内的软件程序，以及调用存储在存储器52内的数据，执行对象识别模型的训练装置的各种功能。

通信接口53，使用任何收发器一类的装置，用于与其他设备或通信网络通信，如无线接入网(Radio Access Network，RAN)，无线局域网(Wireless Local Area Networks，WLAN)、终端、云端等。通信接口53可以包括实现接收功能的接收单元，以及实现发送功能的发送单元。

通信总线54，可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral Component Interconnect，PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture，EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，图10中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

作为一个示例，结合图9所示，对象识别模块的训练装置30中的获取模块301的接收功能可以由图10中的通信接口53实现，获取模块301中的处理功能、生成模块302、确定模块303以及训练模块304的功能均可以由处理器51调用存储器52中的软件程序实现。

本申请另一实施例还提供一种对象识别模型的训练装置，该对象识别模型的训练装置包括：存储器和处理器；存储器和处理器耦合；存储器用于存储计算机程序代码，计算机程序代码包括计算机指令；当处理器执行计算机指令时，对象识别模型的训练装置执行任一的对象识别模型的训练方法。

本申请另一实施例还提供一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当指令在对象识别模型的训练装置上运行时，使得对象识别模型的训练装置执行上述方法实施例所示的方法。

本申请另一实施例还提供一种计算机程序，当处理器执行计算机程序时，对象识别模型的训练装置执行任一的对象识别模型的训练方法。

在一些实施例中，所公开的方法可以实施为以机器可读格式被编码在计算机可读存储介质上的或者被编码在其它非瞬时性介质或者制品上的计算机程序指令。

图11示意性地示出本申请实施例提供的计算机程序产品的概念性局部视图，所述计算机程序产品包括用于在对象识别模型的训练装置上执行计算机进程的计算机程序。

在一个实施例中，计算机程序产品是使用信号承载介质410来实现的。信号承载介质410可以包括一个或多个程序指令，当其被一个或多个处理器运行时，可以提供以上针对图3和图7描述的功能或者部分功能。

例如，参考图3中所示的实施例，S11-S14的一个或多个特征可以由与信号承载介质410相关联的一个或多个程序指令来承担。再例如，参考图7中所示的实施例，S21-S24的一个或多个特征可以由与信号承载介质410相关联的一个或多个程序指令来承担。此外，图11中的程序指令也描述示例指令。

在一些示例中，信号承载介质410可以包含计算机可读介质411，诸如但不限于，硬盘驱动器、紧密盘(CD)、数字视频光盘(DVD)、数字磁带、存储器、只读存储记忆体(read-only memory，ROM)或随机存储记忆体(random access memory，RAM)等等。

在一些实施方式中，信号承载介质410还可以包含计算机可记录介质412，诸如但不限于，存储器、读/写(R/W)CD、R/W DVD等等。

在一些实施方式中，信号承载介质410还可以包含通信介质413，诸如但不限于，数字和/或模拟通信介质(例如，光纤电缆、波导、有线通信链路、无线通信链路、等等)。

信号承载介质410可以由无线形式的通信介质413(例如，遵守IEEE 802.41标准或者其它传输协议的无线通信介质)来传达。一个或多个程序指令可以是计算机可执行指令或者逻辑实施指令等。

在一些示例中，诸如针对图3描述的服务器20可以被配置为，响应于计算机可读介质411、计算机可记录介质412、和/或通信介质413中的一个或多个程序指令，提供各种操作、功能、或者动作。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个装置，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为单元显示的部件可以是一个物理单元或多个物理单元，即可以位于一个地方，或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何在本申请揭露的技术范围内的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种对象识别模型的训练方法，所述训练方法包括：

获取同一监测点位在不同时间的第一监测图像、包括有目标对象的参考图像以及标注信息；所述标注信息用于表征所述参考图像中目标对象的识别结果，且所述标注信息的准确度大于准确度阈值；

根据获取到的第一监测图像和参考图像，生成所述同一监测点位在不同时间的融合图像，所述融合图像包括所述目标对象以及所述第一监测图像的背景；

将所述标注信息确定为所述融合图像的标注结果；

根据所述融合图像和所述标注结果，对当前的对象识别模型进行迭代训练，直到模型收敛，得到第一目标对象识别模型；所述第一目标对象识别模型用于识别所述同一监测点位的监测图像中的所述目标对象。
根据权利要求1所述的训练方法，其中，所述根据获取到的第一监测图像和参考图像，生成所述同一监测点位在不同时间的融合图像，包括：

获取所述参考图像中所述目标对象的图像；

根据预设的图像融合算法，融合所述同一监测点位在不同时间的第一监测图像和所述目标对象的图像，得到所述同一监测点位在不同时间的融合图像。
根据权利要求2所述的训练方法，其中，所述根据预设的图像融合算法，融合所述同一监测点位在不同时间的第一监测图像和所述目标对象的图像，得到所述同一监测点位在不同时间的融合图像，包括：

根据预设的图像融合算法，融合所述同一监测点位在不同时间的第一监测图像和所述目标对象的图像，得到所述同一监测点位在不同时间的中间图像；

对所述同一监测点位在不同时间的中间图像进行数据增强处理，得到所述同一监测点位在不同时间的融合图像。
根据权利要求1-3任一项所述的训练方法，其中，获取包括有目标对象的参考图像以及标注信息，包括：

将包括有目标对象的测试图像输入到所述当前的对象识别模型，得到每一测试图像的识别结果；

将目标识别结果以及准确度大于所述准确度阈值的识别结果对应的测试图像作为参考图像；所述目标识别结果为响应于对准确度小于等于所述准确度阈值的识别结果的调整操作，所得到的调整后的识别结果；

将所述目标识别结果以及所述准确度大于所述准确度阈值的识别结果作为标注信息。
根据权利要求1-3任一项所述的训练方法，其中，所述方法还包括：

获取所述同一监测点位包括待识别对象的第二监测图像；

将所述第二监测图像输入所述第一目标对象识别模型，得到所述第二监测图像中所述待识别对象的中间识别结果；

响应于对所述中间识别结果的调整操作，获取调整后的中间识别结果；所述调整后的中间识别结果用于表征所述待识别对象是否为所述目标对象；

将所述调整后的中间识别结果确定为所述第二监测图像的标注结果；

根据所述第二监测图像以及所述第二监测图像的标注结果，对所述第一目标对象识别模型进行迭代训练，得到第二目标对象识别模型。
根据权利要求1-3任一项所述的训练方法，其中，所述方法还包括：

获取所述同一监测点位包括待识别对象的第三监测图像，所述第三监测图像的标注结果用于表征所述待识别对象是否候选对象；

将所述第三监测图像输入所述第一目标对象识别模型，得到所述第三监测图像中所述待识别对象的中间识别结果；

响应于所述中间识别结果表征所述待识别对象为所述目标对象，以及对所述第一目标对象识别模型的调整操作，获取调整后的第一目标对象识别模型；所述调整后的第一目标对象识别模型用于输出所述待识别对象是否为所述候选对象的识别结果；

根据所述第三监测图像以及所述第三监测图像的标注结果，对调整后的第一目标对象识别模型进行迭代训练，得到第三目标对象识别模型。
一种对象识别模型的训练装置，包括：

获取模块，用于获取同一监测点位在不同时间的第一监测图像、包括有目标对象的参考图像以及标注信息；所述标注信息用于表征所述参考图像中目标对象的识别结果，且所述标注信息的准确度大于准确度阈值；

生成模块，用于根据所述获取模块获取到的第一监测图像和参考图像，生成所述同一监测点位在不同时间的融合图像，所述融合图像包括所述目标对象以及所述第一监测图像的背景；

确定模块，用于将所述获取模块获取到的所述标注信息确定为所述生成模块生成的所述融合图像的标注结果；

训练模块，用于根据所述生成模块生成的所述融合图像和所述确定模块确定的所述标注结果，对当前的对象识别模型进行迭代训练，直到模型收敛，得到第一目标对象识别模型；所述第一目标对象识别模型用于识别所述同一监测点位的第一监测图像中的所述目标对象。
根据权利要求7所述的训练装置，其中，所述生成模块，具体用于

获取所述参考图像中所述目标对象的图像；

根据预设的图像融合算法，融合所述同一监测点位在不同时间的第一监测图像和所述目标对象的图像，得到所述同一监测点位在不同时间的融合图像。
根据权利要求7所述的训练装置，其中，所述生成模块具体用于：

根据预设的图像融合算法，融合所述同一监测点位在不同时间的第一监测图像和所述目标对象的图像，得到所述同一监测点位在不同时间的中间图像；

对所述同一监测点位在不同时间的中间图像进行数据增强处理，得到所述同一监测点位在不同时间的融合图像。
根据权利要求7-9任一项所述的训练装置，其中，所述获取模块具体用于：

将包括有目标对象的测试图像输入到所述当前的对象识别模型，得到每一测试图像的识别结果；

将目标识别结果以及准确度大于所述准确度阈值的识别结果对应的测试图像作为参考图像；所述目标识别结果为响应于对准确度小于等于所述准确度阈值的识别结果的调整操作，所得到的调整后的识别结果；

将所述目标识别结果以及所述准确度大于所述准确度阈值的识别结果作为标注信息。
根据权利要求7-9任一项所述的训练装置，其中，

所述获取模块还用于：获取所述同一监测点位包括待识别对象的第二监测图像；将所述第二监测图像输入所述第一目标对象识别模型，得到所述第二监测图像中所述待识别对象的中间识别结果；响应于对所述中间识别结果的调整操作，获取调整后的中间识别结果；所述调整后的中间识别结果用于表征所述待识别对象是否为所述目标对象；

所述确定模块还用于：将所述调整后的中间识别结果确定为所述第二监测图像的标注结果；

所述训练模块还用于：根据所述第二监测图像以及所述第二监测图像的标注结果，对所述第一目标对象识别模型进行迭代训练，得到第二目标对象识别模型。
根据权利要求7-9任一项所述的训练装置，其中，

所述获取模块还用于：获取所述同一监测点位包括待识别对象的第三监测图像，所述第三监测图像的标注结果用于表征所述待识别对象是否候选对象；将所述第三监测图像输入所述第一目标对象识别模型，得到所述第三监测图像中所述待识别对象的中间识别结果；响应于所述中间识别结果表征所述待识别对象为所述目标对象，以及对所述第一目标对象识别模型的调整操作，获取调整后的第一目标对象识别模型；所述调整后的第一目标对象识别模型用于输出所述待识别对象是否为所述候选对象的识别结果；

所述训练模块还用于：根据所述第三监测图像以及所述第三监测图像的标注结果，对调整后的第一目标对象识别模型进行迭代训练，得到第三目标对象识别模型。
一种计算机可读存储介质，其中，存储有指令，当所述指令在对象识别模型的训练装置上运行时，使得对象识别模型的训练装置执行如上述权利要求1-6任一项所述的训练方法。
一种对象识别模型的训练装置，其中，包括：

存储器和处理器；所述存储器和所述处理器耦合；所述存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令；当所述处理器执行所述计算机指令时，所述对象识别模型的训练装置执行如权利要求1-6中任意一项所述的对象识别模型的训练方法。
一种计算机程序产品，其中，当所述计算机程序产品在对象识别模型的训练装置上运行时，使得所述对象识别模型的训练装置执行如权利要求1-6中任意一项所述的对象识别模型的训练方法。