CN117237755A

CN117237755A - 目标检测模型训练方法及装置、图像检测方法及装置

Info

Publication number: CN117237755A
Application number: CN202311144306.XA
Authority: CN
Inventors: 李林超; 温婷; 周凯; 权家新
Original assignee: Zhejiang Zhuoyun Intelligent Technology Co ltd
Current assignee: Zhejiang Zhuoyun Intelligent Technology Co ltd
Priority date: 2023-09-05
Filing date: 2023-09-05
Publication date: 2023-12-15

Abstract

本申请公开了一种目标检测模型训练方法及装置、图像检测方法及装置。其中，模型训练方法包括：获取第一训练样本集合，每个第一训练样本为至少一张前景图像和至少一张背景图像拼接成的第一图像；利用第一训练样本集合对第一目标检测模型进行训练，并依据第一损失函数调整第一目标检测模型的模型参数，得到第二目标检测模型；获取第二训练样本集合，每个第二训练样本中包括：前景图像、背景图像、前景图像和背景图像混合成的第二图像；利用第二训练样本集合对第二目标检测模型进行蒸馏学习，并依据第四损失函数调整第二目标检测模型的模型参数，得到第三目标检测模型。本申请解决了相关技术中目标检测模型存在误检率高的技术问题。

Description

目标检测模型训练方法及装置、图像检测方法及装置

技术领域

本申请涉及机器学习技术领域，具体而言，涉及一种目标检测模型训练方法及装置、图像检测方法及装置。

背景技术

随着深度学习目标检测方法在各个工业领域被广泛应用，目标检测网络得到了相对迅速的发展，目标检测模型的准确率也越来越高，但在X光图像检测场景中，依旧存在以下问题：目前，X光图像检测模型通常采用一阶段目标检测模型，但由于一阶段目标检测模型对候选框不进行筛选，而是将候选框通过正负样本采样方法进行候选框采样，使得一阶段目标检测模型对目标特征特别敏感，其忽略了对背景特征的学习，导致一阶段目标检测模型检出率很高，但误检率也偏高；二阶段目标检测模型虽然在一定程度上能够减少误检率，但二阶段目标检测模型耗时严重，且对硬件需求较高，无法满足工业大范围需求。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种目标检测模型训练方法及装置、图像检测方法及装置，以至少解决相关技术中目标检测模型存在误检率高的技术问题。

根据本申请实施例的一个方面，提供了一种目标检测模型训练方法，包括：获取第一训练样本集合，其中，每个第一训练样本为由至少一张前景图像和至少一张背景图像拼接成的第一图像，前景图像中包含检测目标，背景图像中不包含检测目标；利用第一训练样本集合对第一目标检测模型进行训练，并依据第一损失函数调整第一目标检测模型的模型参数，得到第二目标检测模型，其中，第一损失函数中至少包括：反映前景图像预测结果与前景图像真实结果差异的第二损失函数和反映背景图像预测结果与背景图像真实结果差异的第三损失函数；获取第二训练样本集合，其中，每个第二训练样本中包括：前景图像、背景图像、前景图像和背景图像混合成的第二图像；利用第二训练样本集合对第二目标检测模型进行蒸馏学习，并依据第四损失函数调整第二目标检测模型的模型参数，得到第三目标检测模型，其中，第四损失函数中至少包括：反映前景图像预测结果与第二图像预测结果差异的第五损失函数。

可选地，获取第一训练样本集合，包括：获取包括有多张前景图像和多张背景图像的图像集合；从图像集合中选取相同数量的前景图像和背景图像进行拼接，得到一张第一图像，将第一图像作为一个第一训练样本；依次确定多个第一训练样本，得到第一训练样本集合。

可选地，第一损失函数的确定过程包括：对于每个第一训练样本，将第一训练样本输入第一目标检测模型，得到第一目标检测模型输出的第一预测结果，其中，第一预测结果中至少包括：前景预测目标框、前景预测目标类别、背景预测目标框、背景预测目标类别；依据前景预测目标框与前景标注目标框的差异构建第六损失函数，并依据前景预测目标类别与前景标注目标类别的差异构建第七损失函数，将第六损失函数和第七损失函数之和作为第二损失函数；依据背景预测目标类别与背景标注目标类别的差异构建第三损失函数；分别确定第二损失函数和第三损失函数对应的第一权重和第二权重，并依据第一权重、第二损失函数、第二权重和第三损失函数确定第一损失函数。

可选地，分别确定第二损失函数和第三损失函数对应的第一权重和第二权重，包括：确定前景预测目标框与前景标注目标框的平滑均绝对误差损失函数的第一sigmoid值，并确定前景预测目标框与前景标注目标框的第一完全交并比损失函数值，依据第一sigmoid值和第一完全交并比损失函数值确定第三权重；利用预设的目标检测方法确定第一图像中的最优预测目标框，确定前景预测目标框与最优预测目标框的第二完全交并比损失函数值，确定第二完全交并比损失函数值与前景预测目标类别的第二sigmoid值为第四权重；确定第三权重与第四权重之积为第一权重；依据各个背景预测目标框的损失函数值的平均值及各个背景预测目标框的损失函数值确定第二权重。

可选地，获取第二训练样本集合，包括：获取前景图像集合和背景图像集合；从前景图像集合中选取一张前景图像，从背景图像集合中选取一张背景图像，对前景图像和背景图像进行混合，得到一张第二图像，将前景图像、背景图像和第二图像共同作为一个第二训练样本；依次确定多个第二训练样本，得到第二训练样本集合。

可选地，第四损失函数的确定过程包括：对于每个第二训练样本，将第二训练样本中的图像依次输入第二目标检测模型，得到第二目标检测模型输出的第二预测结果，其中，第二预测结果中至少包括：前景图像预测结果、背景图像预测结果、第二图像预测结果；依据前景图像预测结果和第二图像预测结果的差异构建第五损失函数；依据前景图像预测结果与前景图像真实结果的差异构建第八损失函数；依据背景图像预测结果与背景图像真实结果的差异构建第九损失函数；依据第五损失函数、第八损失函数和第九损失函数确定第四损失函数。

可选地，将第二训练样本中的图像依次输入第二目标检测模型，包括：对前景图像和第二图像进行数据弱处理，其中，数据弱处理包括以下至少之一：旋转、亮度调整；将数据弱处理后的前景图像和第二图像以及背景图像依次输入第二目标检测模型。

可选地，第二目标检测模型的瓶颈层采用全局注意力机制，依据前景图像预测结果和第二图像预测结果的差异构建第五损失函数，包括：获取前景图像在瓶颈层的各个特征的第一上下文关系和第二图像在瓶颈层的各个特征的第二上下文关系，依据第一上下文关系和第二上下文关系的差异构建第十损失函数；依据前景图像的预测目标类别与第二图像的预测目标类别的差异构建第十一损失函数；依据前景图像的预测目标框与第二图像的预测目标框的差异构建完全交并比损失函数，并将前景图像的预测结果得分与完全交并比损失函数之积作为第十二损失函数；依据第十损失函数、第十一损失函数和第十二损失函数确定第五损失函数。

根据本申请实施例的一个方面，提供了一种图像检测方法，包括：获取待检测图像；将待检测图像输入目标检测模型，得到目标检测模型输出的检测结果，其中，目标检测模型是通过上述的目标检测模型训练方法训练得到的；在检测结果指示待检测图像中存在目标物体时，发出告警信息。

根据本申请实施例的另一方面，还提供了一种目标检测模型训练装置，包括：第一获取模块，用于获取第一训练样本集合，其中，每个第一训练样本为由至少一张前景图像和至少一张背景图像拼接成的第一图像，前景图像中包含检测目标，背景图像中不包含检测目标；第一训练模块，用于利用第一训练样本集合对第一目标检测模型进行训练，并依据第一损失函数调整第一目标检测模型的模型参数，得到第二目标检测模型，其中，第一损失函数中至少包括：反映前景图像预测结果与前景图像真实结果差异的第二损失函数和反映背景图像预测结果与背景图像真实结果差异的第三损失函数；第二获取模块，用于获取第二训练样本集合，其中，每个第二训练样本中包括：一张前景图像、一张背景图像、前景图像和背景图像混合成的第二图像；第二训练模块，用于利用第二训练样本集合对第二目标检测模型进行蒸馏学习，并依据第四损失函数调整第二目标检测模型的模型参数，得到第三目标检测模型，其中，第四损失函数中至少包括：反映前景图像预测结果与第二图像预测结果差异的第五损失函数。

根据本申请实施例的另一方面，还提供了一种图像检测装置，包括：第三获取模块，用于获取待检测图像；检测模块，用于将待检测图像输入目标检测模型，得到目标检测模型输出的检测结果，其中，目标检测模型是通过上述的目标检测模型训练方法训练得到的；告警模块，用于在检测结果指示待检测图像中存在目标物体时，发出告警信息。

根据本申请实施例的另一方面，还提供了一种非易失性存储介质，该非易失性存储介质包括存储的计算机程序，其中，非易失性存储介质所在设备通过运行该计算机程序执行上述的目标检测模型训练方法或图像检测方法。

根据本申请实施例的另一方面，还提供了一种电子设备，该电子设备包括：存储器和处理器，其中，存储器中存储有计算机程序，处理器被配置为通过计算机程序执行上述的目标检测模型训练方法或图像检测方法。

本申请实施例训练的目标检测模型为一阶段目标检测模型，但模型训练过程分为两个阶段：第一阶段对前景图像和背景图像进行拼接，通过修改损失函数，加大对特征图背景部分的损失权重，提高模型对背景特征的关注力；第二阶段将前景图像、背景图像以及前景、背景混合成的图像同时输入模型进行训练，利用前景图像和混合图像进行蒸馏学习，提取二者目标特征中的共同特征，减少目标信息中的无效信息，提高模型对有效特征的提取能力，从而提高模型检测准确率，降低误检率。本申请方案有效解决了相关技术中目标检测模型存在误检率高的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种可选的计算机终端的结构示意图；

图2是根据本申请实施例的一种可选的目标检测模型训练方法的流程示意图；

图3是根据本申请实施例的一种可选的图像检测方法的流程示意图；

图4是根据本申请实施例的一种可选的目标检测模型训练装置的结构示意图；

图5是根据本申请实施例的一种可选的图像检测装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了更好地理解本申请实施例，首先对本申请实施例描述过程中出现的部分名词或术语翻译解释如下：

一阶段目标检测模型：直接在输入图像上进行目标检测和定位的模型。它通过在图像上滑动固定大小的窗口，并使用分类器或回归器来判断窗口内是否包含目标，并估计目标的位置。一阶段检测模型通常采用单个网络，可以实时地进行目标检测，但其准确度相对较低。

二阶段目标检测模型：将目标检测任务分为两个阶段进行处理的模型，第一阶段是进行候选区域提取，通过使用区域生成网络或其他方法，生成一些可能包含目标的候选框；第二阶段是对这些候选框进行分类和位置回归，以确定目标的类别和精确位置。二阶段检测模型通常使用两个网络或模块，具有更高的准确度，但速度较慢。

mosaic数据增强方法：mosaic是YOLOV4中提出的新方法，适用于目标检测，主要思想是将四张图片进行拼接到一张图上作为训练样本，拼接时目标框的坐标也要做相应的变化。其主要操作如下：1)对每一张图进行随机裁剪得到A；2)将A进行resize到输出图大小得到B；3)将B随机裁剪一块指定大小的区域C；4)将C粘贴到输出图相应的位置。

mixup数据增强方法：mixup就是将样本以及标签以相同的方式进行融合，得到一个新的训练样本。

匈牙利方法(Hungarian Algorithm)：一种在多项式时间内求解任务分配问题的组合优化算法，广泛应用在运筹学领域，用来解决多目标跟踪中的数据关联问题。

实施例1

根据本申请实施例，首先提供了一种目标检测模型训练方法，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现目标检测模型训练方法的计算机终端(或移动设备)的硬件结构框图。如图1所示，计算机终端10(或移动设备)可以包括一个或多个(图中采用102a、102b，……，102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器104可用于存储应用软件的软件程序以及模块，如本申请实施例中的目标检测模型训练方法对应的程序指令/数据存储装置，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。

在上述运行环境下，本申请实施例提供了一种目标检测模型训练方法，如图2所示，该方法至少包括步骤S202-S208，其中：

步骤S202，获取第一训练样本集合，其中，每个第一训练样本为由至少一张前景图像和至少一张背景图像拼接成的第一图像，前景图像中包含检测目标，背景图像中不包含检测目标。

作为一种可选的实施方式，在获取第一训练样本集合时，可以先获取包括有多张前景图像和多张背景图像的图像集合；然后从图像集合中选取相同数量的前景图像和背景图像进行拼接，得到一张第一图像，将第一图像作为一个第一训练样本；依次确定多个第一训练样本，得到第一训练样本集合。

以拼接四张图像作为第一训练样本为例，首先从图像集合中任选一张图像，确定该图像的类型；若该图像为前景图像，继续从图像集合中获取一张前景图像和两张背景图像；若该图像为背景图像，继续从图像集合中获取一张背景图像和两张前景图像；利用mosaic数据增强方法对获取的四张图像进行拼接，得到一张第一图像作为第一训练样本。

为了加快图像处理效率，减少显存占用以及训练耗时，在进行图像拼接之前，可以先对图像的方向进行适应性调整。例如，第一张图像宽>高，则后面获取的三张图像应与其保持一致，均为宽>高，否则将图像旋转90°。

步骤S204，利用第一训练样本集合对第一目标检测模型进行训练，并依据第一损失函数调整第一目标检测模型的模型参数，得到第二目标检测模型，其中，第一损失函数中至少包括：反映前景图像预测结果与前景图像真实结果差异的第二损失函数和反映背景图像预测结果与背景图像真实结果差异的第三损失函数。

作为一种可选的实施方式，可以通过如下方式确定第一损失函数：

对于每个第一训练样本，将第一训练样本输入第一目标检测模型，得到第一目标检测模型输出的第一预测结果，其中，第一预测结果中至少包括：前景预测目标框、前景预测目标类别、背景预测目标框、背景预测目标类别；

依据前景预测目标框与前景标注目标框的差异构建第六损失函数Loss_{fg_bbox}，并依据前景预测目标类别与前景标注目标类别的差异构建第七损失函数Loss_{fg_cls}，将第六损失函数和第七损失函数之和作为第二损失函数Loss_fg；

依据背景预测目标类别与背景标注目标类别的差异构建第三损失函数Loss_{bg_cls}；

分别确定第二损失函数Loss_fg和第三损失函数Loss_{bg_cls}对应的第一权重weight_fg和第二权重weight_bg，并依据第一权重weight_fg、第二损失函数Loss_fg、第二权重weight_bg和第三损失函数Loss_{bg_cls}确定第一损失函数如下：

Loss_one＝weight_fg×(Loss_{fg_cls}+Loss_{fg_bbox})+weight_bg×Loss_{bg_cls}

可选地，在确定第一权重weight_fg时，为保持目标框得分和类别得分具有线性关系，可以将目标框权重weight_bbox和类别权重weight_cls进行结合，具体计算方式如下：

由于目标框是由目标面积和目标距离组成，考虑平滑均绝对误差(smooth L1)损失函数缺少对面积的约束，容易受到目标大小影响，而完全交并比(CompleteIntersection over Union，ciou)损失函数对目标坐标没有约束，导致位置不同时，可能ciou值相同。因此，可以确定前景预测目标框与前景标注目标框的平滑均绝对误差损失函数smooth L1 Loss的第一sigmoid值sigmoid(smooth L1 Loss)，并确定前景预测目标框与前景标注目标框的第一完全交并比损失函数值ciou，依据第一sigmoid值sigmoid(smoothL1 Loss)和第一完全交并比损失函数值ciou确定第三权重，即目标框权重为

weight_bbox＝sigmoid(smoothL1 Loss)+ciou

计算类别权重weight_cls时，为防止人工目标产生的负面作用，本申请实施例首先利用预设的目标检测方法确定第一图像中的最优预测目标框，该目标检测方法可以选用匈牙利方法；之后，确定前景预测目标框与最优预测目标框的第二完全交并比损失函数值ciou，记为GT_soft，确定第二完全交并比损失函数值GT_soft与前景预测目标类别P的第二sigmoid值为第四权重，即类别权重为

weight_cls＝sigmoid(P,GT_soft)

确定第三权重weight_bbox与第四权重weight_cls之积为第一权重

weight_fg＝weight_cls×weight_bbox

可选地，在确定第二权重weight_bg时，可以依据各个背景预测目标框的损失函数值Loss_bg的平均值avg(Loss_{sum_bg})及各个背景预测目标框的损失函数值Loss_bg确定第二权重为

第一阶段训练过程中，采用图片拼接方法，对前景和背景目标框分配不同权重，加强模型在拼接的前景图片上对难例目标的学习，也加强了模型在背景图片上对易误检目标的学习。

步骤S206，获取第二训练样本集合，其中，每个第二训练样本中包括：前景图像、背景图像、前景图像和背景图像混合成的第二图像。

作为一种可选的实施方式，在获取第二训练样本集合时，可以先获取前景图像集合和背景图像集合；然后从前景图像集合中选取一张前景图像，从背景图像集合中选取一张背景图像，利用mixup等数据增强方法对前景图像和背景图像进行混合，得到一张第二图像，将前景图像、背景图像和第二图像共同作为一个第二训练样本；依次确定多个第二训练样本，得到第二训练样本集合。

步骤S208，利用第二训练样本集合对第二目标检测模型进行蒸馏学习，并依据第四损失函数调整第二目标检测模型的模型参数，得到第三目标检测模型，其中，第四损失函数中至少包括：反映前景图像预测结果与第二图像预测结果差异的第五损失函数。

作为一种可选的实施方式，可以通过如下方式确定第四损失函数：

对于每个第二训练样本，将第二训练样本中的图像依次输入第二目标检测模型，得到第二目标检测模型输出的第二预测结果，其中，第二预测结果中至少包括：前景图像预测结果、背景图像预测结果、第二图像预测结果；

依据前景图像预测结果和第二图像预测结果的差异构建第五损失函数Loss_{two_dil}；

依据前景图像预测结果与前景图像真实结果的差异构建第八损失函数Loss_{two_fg}；

依据背景图像预测结果与背景图像真实结果的差异构建第九损失函数Loss_{two_bg}；

依据第五损失函数Loss_{two_dil}、第八损失函数Loss_{two_fg}和第九损失函数Loss_{two_bg}确定第四损失函数为

Loss_two＝Loss_{two_dil}+Loss_{two_fg}+Loss_{two_bg}

可选地，在将第二训练样本中的图像依次输入第二目标检测模型时，可以先对前景图像和第二图像进行数据弱处理，例如旋转、亮度调整等操作；将数据弱处理后的前景图像和第二图像以及背景图像依次输入第二目标检测模型。

其中，第二目标检测模型的瓶颈层采用全局注意力机制，在依据前景图像预测结果和第二图像预测结果的差异构建第五损失函数时，可以通过如下方式进行：

获取前景图像在瓶颈层的各个特征的第一上下文关系和第二图像在瓶颈层的各个特征的第二上下文关系GC(feature_map_mixup)，依据第一上下文关系和第二上下文关系GC(feature_map_mixup)的差异构建第十损失函数，该第十损失函数可以为均绝对误差损失函数，具体为

之后，可以依据前景图像的预测目标类别P_fg与第二图像的预测目标类别P_mixup的差异构建第十一损失函数，该第十一损失函数可以为交叉熵损失函数，具体为

Loss_{cls_dil}＝CE(P_mixup,P_fg)

依据前景图像的预测目标框bboxs_fg与第二图像的预测目标框bboxs_mixup的差异构建完全交并比损失函数ciou(bboxs_mixup,bboxs_fg)，为降低误检的影响，可以将前景图像的预测结果得分P_fg作为其权重，即将前景图像的预测结果得分P_fg与完全交并比损失函数ciou(bboxs_mixup,bboxs_fg)之积作为第十二损失函数，具体为

Loss_{bbox_dil}＝ciou(bboxs_mixup,bboxs_fg)×P_fg

最后，依据第十损失函数Loss_{fpm_distil}、第十一损失函数Loss_{cls_dil}和第十二损失函数Loss_{bbox_dil}确定第五损失函数为

Loss_{two_dil}＝Loss_{fpm_distil}+Loss_{cls_dil}+Loss_{bbox_dil}

可选地，为进一步提高模型检测准确率，第八损失函数和第九损失函数也可以添加对应的权重，权重值的确定过程可以参考第一训练阶段中第一权重weight_fg和第二权重weight_bg的确定过程，此处不再过多赘述。

第二阶段训练过程中，采用图像混合方法和蒸馏方法，使模型对目标共同特征进行有效特征提取，可以提高模型的鲁棒性和准确率。

本申请实施例训练的目标检测模型为一阶段目标检测模型，但模型训练过程分为两个阶段：第一阶段对前景图像和背景图像进行拼接，通过修改损失函数，加大对特征图背景部分的损失权重，提高模型对背景特征的关注力；第二阶段将前景图像、背景图像以及前景、背景混合的图像同时输入模型进行训练，利用前景图像和混合图像进行蒸馏学习，提取二者目标特征中的共同特征，减少目标信息中的无效信息，提高模型对有效特征的提取能力，从而提高模型检测准确率，降低误检率。本申请方案有效解决了相关技术中目标检测模型存在误检率高的技术问题。

实施例2

在实施例1提供的目标检测模型训练方法的基础上，本申请实施例还提供了一种图像检测方法，该方法实施例同样可以在图1所示的计算机终端10(或移动设备等类似的运算装置)中执行。需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图3是根据本申请实施例的一种可选的图像检测方法的流程示意图，如图3所示，该方法至少包括步骤S302-S306，其中：

步骤S302，获取待检测图像。

本申请方案主要用于X光图像检测危险品场景，因此待检测图像可以是实时采集的X光图像。

步骤S304，将待检测图像输入目标检测模型，得到目标检测模型输出的检测结果，其中，目标检测模型是通过实施例1中的目标检测模型训练方法训练得到的。

由于目标检测模型训练方法在实施例1已进行了详细的描述，此处不再过多赘述。

步骤S306，在检测结果指示待检测图像中存在目标物体时，发出告警信息。

可选地，当检测结果指示待检测X光图像中存在危险品时，可向工作人员发出告警信息，由工作人员对对应物品进行检查。

在本申请实施例中，由于目标检测模型为一阶段目标检测模型，检测时间较短；且模型检测准确率高，误检率低，在工业应用场景中，能够极大提高目标检测效率，适用性较强。

实施例3

根据本申请实施例，还提供了一种用于实现实施例1中的目标检测模型训练方法的目标检测模型训练装置，如图4所示，该目标检测模型训练装置中至少包括第一获取模块41、第一训练模块42、第二获取模块43和第二训练模块44，其中：

第一获取模块41，用于获取第一训练样本集合，其中，每个第一训练样本为由至少一张前景图像和至少一张背景图像拼接成的第一图像，前景图像中包含检测目标，背景图像中不包含检测目标。

作为一种可选的实施方式，第一获取模块在获取第一训练样本集合时，可以先获取包括有多张前景图像和多张背景图像的图像集合；然后从图像集合中选取相同数量的前景图像和背景图像进行拼接，得到一张第一图像，将第一图像作为一个第一训练样本；依次确定多个第一训练样本，得到第一训练样本集合。

第一训练模块42，用于利用第一训练样本集合对第一目标检测模型进行训练，并依据第一损失函数调整第一目标检测模型的模型参数，得到第二目标检测模型，其中，第一损失函数中至少包括：反映前景图像预测结果与前景图像真实结果差异的第二损失函数和反映背景图像预测结果与背景图像真实结果差异的第三损失函数。

可选地，第一训练模块确定第二损失函数和第三损失函数对应的第一权重和第二权重时，确定前景预测目标框与前景标注目标框的平滑均绝对误差损失函数的第一sigmoid值，并确定前景预测目标框与前景标注目标框的第一完全交并比损失函数值，依据第一sigmoid值和第一完全交并比损失函数值确定第三权重；利用预设的目标检测方法确定第一图像中的最优预测目标框，确定前景预测目标框与最优预测目标框的第二完全交并比损失函数值，确定第二完全交并比损失函数值与前景预测目标类别的第二sigmoid值为第四权重；确定第三权重与第四权重之积为第一权重；依据各个背景预测目标框的损失函数值的平均值及各个背景预测目标框的损失函数值确定第二权重。

第二获取模块43，用于获取第二训练样本集合，其中，每个第二训练样本中包括：一张前景图像、一张背景图像、前景图像和背景图像混合成的第二图像。

作为一种可选的实施方式，第二获取模块在获取第二训练样本集合时，可以先获取前景图像集合和背景图像集合；从前景图像集合中选取一张前景图像，从背景图像集合中选取一张背景图像，对前景图像和背景图像进行拼接，得到一张第二图像，将前景图像、背景图像和第二图像共同作为一个第二训练样本；依次确定多个第二训练样本，得到第二训练样本集合。

第二训练模块44，用于利用第二训练样本集合对第二目标检测模型进行蒸馏学习，并依据第四损失函数调整第二目标检测模型的模型参数，得到第三目标检测模型，其中，第四损失函数中至少包括：反映前景图像预测结果与第二图像预测结果差异的第五损失函数。

可选地，第二损失函数的确定过程包括：对于每个第二训练样本，将第二训练样本中的图像依次输入第二目标检测模型，得到第二目标检测模型输出的第二预测结果，其中，第二预测结果中至少包括：前景图像预测结果、背景图像预测结果、第二图像预测结果；依据前景图像预测结果和第二图像预测结果的差异构建第五损失函数；依据前景图像预测结果与前景图像真实结果的差异构建第八损失函数；依据背景图像预测结果与背景图像真实结果的差异构建第九损失函数；依据第五损失函数、第八损失函数和第九损失函数确定第四损失函数。

可选地，第二训练模块将第二训练样本中的图像依次输入第二目标检测模型时，先对前景图像和第二图像进行数据弱处理，其中，数据弱处理包括以下至少之一：旋转、亮度调整；然后将数据弱处理后的前景图像和第二图像以及背景图像依次输入第二目标检测模型。

可选地，第二目标检测模型的瓶颈层采用全局注意力机制，第二训练模块构建第五损失函数时，获取前景图像在瓶颈层的各个特征的第一上下文关系和第二图像在瓶颈层的各个特征的第二上下文关系，依据第一上下文关系和第二上下文关系的差异构建第十损失函数；依据前景图像的预测目标类别与第二图像的预测目标类别的差异构建第十一损失函数；依据前景图像的预测目标框与第二图像的预测目标框的差异构建完全交并比损失函数，并将前景图像的预测结果得分与完全交并比损失函数之积作为第十二损失函数；依据第十损失函数、第十一损失函数和第十二损失函数确定第五损失函数。

需要说明的是，本申请实施例中的目标检测模型训练装置中的各模块与实施例1中的目标检测模型训练方法的各实施步骤一一对应，由于实施例1中已经进行了详尽的描述，本实施例中部分未体现的细节可以参考实施例1，在此不再过多赘述。

实施例4

根据本申请实施例，还提供了一种用于实现实施例2中的图像检测方法的图像检测装置，如图5所示，该图像检测装置中至少包括第三获取模块51，检测模块52和告警模块53，其中：

第三获取模块51，用于获取待检测图像。

检测模块52，用于将待检测图像输入目标检测模型，得到目标检测模型输出的检测结果，其中，目标检测模型是通过实施例1中的目标检测模型训练方法训练得到的。

告警模块53，用于在检测结果指示待检测图像中存在目标物体时，发出告警信息。

可选地，当检测结果指示待检测X光图像中存在危险品时，告警模块可向工作人员发出告警信息，由工作人员对对应物品进行检查。

需要说明的是，本申请实施例中的图像检测装置中的各模块与实施例2中的图像检测方法的各实施步骤一一对应，由于实施例2中已经进行了详尽的描述，本实施例中部分未体现的细节可以参考实施例2，在此不再过多赘述。

实施例5

根据本申请实施例，还提供了一种非易失性存储介质，该非易失性存储介质包括存储的计算机程序，其中，非易失性存储介质所在设备通过运行该计算机程序执行实施例1中的目标检测模型训练方法。

根据本申请实施例，还提供了一种处理器，该处理器用于运行计算机程序，其中，计算机程序运行时执行实施例1中的目标检测模型训练方法。

根据本申请实施例，还提供了一种电子设备，该电子设备包括：存储器和处理器，其中，存储器中存储有计算机程序，处理器被配置为通过计算机程序执行实施例1中的目标检测模型训练方法。

具体地，计算机程序执行实现以下步骤：获取第一训练样本集合，其中，每个第一训练样本为由至少一张前景图像和至少一张背景图像拼接成的第一图像，前景图像中包含检测目标，背景图像中不包含检测目标；利用第一训练样本集合对第一目标检测模型进行训练，并依据第一损失函数调整第一目标检测模型的模型参数，得到第二目标检测模型，其中，第一损失函数中至少包括：反映前景图像预测结果与前景图像真实结果差异的第二损失函数和反映背景图像预测结果与背景图像真实结果差异的第三损失函数；获取第二训练样本集合，其中，每个第二训练样本中包括：前景图像、背景图像、前景图像和背景图像混合成的第二图像；利用第二训练样本集合对第二目标检测模型进行蒸馏学习，并依据第四损失函数调整第二目标检测模型的模型参数，得到第三目标检测模型，其中，第四损失函数中至少包括：反映前景图像预测结果与第二图像预测结果差异的第五损失函数。

可选地，计算机程序还会执行实现以下步骤：获取待检测图像；将待检测图像输入目标检测模型，得到目标检测模型输出的检测结果，其中，目标检测模型是通过实施例1中的目标检测模型训练方法训练得到的；在检测结果指示待检测图像中存在目标物体时，发出告警信息。

上述实施例序号仅仅为了描述，不代表实施例的优劣。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种目标检测模型训练方法，其特征在于，包括：

获取第一训练样本集合，其中，每个第一训练样本为由至少一张前景图像和至少一张背景图像拼接成的第一图像，所述前景图像中包含检测目标，所述背景图像中不包含检测目标；

利用所述第一训练样本集合对第一目标检测模型进行训练，并依据第一损失函数调整所述第一目标检测模型的模型参数，得到第二目标检测模型，其中，所述第一损失函数中至少包括：反映前景图像预测结果与前景图像真实结果差异的第二损失函数和反映背景图像预测结果与背景图像真实结果差异的第三损失函数；

获取第二训练样本集合，其中，每个第二训练样本中包括：前景图像、背景图像、所述前景图像和所述背景图像混合成的第二图像；

利用所述第二训练样本集合对所述第二目标检测模型进行蒸馏学习，并依据第四损失函数调整所述第二目标检测模型的模型参数，得到第三目标检测模型，其中，所述第四损失函数中至少包括：反映前景图像预测结果与第二图像预测结果差异的第五损失函数。

2.根据权利要求1所述的方法，其特征在于，获取第一训练样本集合，包括：

获取包括有多张前景图像和多张背景图像的图像集合；

从所述图像集合中选取相同数量的前景图像和背景图像进行拼接，得到一张所述第一图像，将所述第一图像作为一个第一训练样本；

依次确定多个第一训练样本，得到所述第一训练样本集合。

3.根据权利要求1所述的方法，其特征在于，所述第一损失函数的确定过程包括：

对于每个所述第一训练样本，将所述第一训练样本输入所述第一目标检测模型，得到所述第一目标检测模型输出的第一预测结果，其中，所述第一预测结果中至少包括：前景预测目标框、前景预测目标类别、背景预测目标框、背景预测目标类别；

依据所述前景预测目标框与前景标注目标框的差异构建第六损失函数，并依据所述前景预测目标类别与前景标注目标类别的差异构建第七损失函数，将所述第六损失函数和所述第七损失函数之和作为所述第二损失函数；

依据所述背景预测目标类别与背景标注目标类别的差异构建所述第三损失函数；

分别确定所述第二损失函数和所述第三损失函数对应的第一权重和第二权重，并依据所述第一权重、所述第二损失函数、所述第二权重和所述第三损失函数确定所述第一损失函数。

4.根据权利要求3所述的方法，其特征在于，分别确定所述第二损失函数和所述第三损失函数对应的第一权重和第二权重，包括：

确定所述前景预测目标框与前景标注目标框的平滑均绝对误差损失函数的第一sigmoid值，并确定所述前景预测目标框与前景标注目标框的第一完全交并比损失函数值，依据所述第一sigmoid值和所述第一完全交并比损失函数值确定第三权重；

利用预设的目标检测方法确定所述第一图像中的最优预测目标框，确定所述前景预测目标框与所述最优预测目标框的第二完全交并比损失函数值，确定所述第二完全交并比损失函数值与所述前景预测目标类别的第二sigmoid值为第四权重；

确定所述第三权重与所述第四权重之积为所述第一权重；

依据各个所述背景预测目标框的损失函数值的平均值及各个所述背景预测目标框的损失函数值确定所述第二权重。

5.根据权利要求1所述的方法，其特征在于，获取第二训练样本集合，包括：

获取前景图像集合和背景图像集合；

从所述前景图像集合中选取一张前景图像，从所述背景图像集合中选取一张背景图像，对所述前景图像和所述背景图像进行混合，得到一张所述第二图像，将所述前景图像、所述背景图像和所述第二图像共同作为一个第二训练样本；

依次确定多个第二训练样本，得到所述第二训练样本集合。

6.根据权利要求1所述的方法，其特征在于，所述第四损失函数的确定过程包括：

对于每个所述第二训练样本，将所述第二训练样本中的图像依次输入所述第二目标检测模型，得到所述第二目标检测模型输出的第二预测结果，其中，所述第二预测结果中至少包括：前景图像预测结果、背景图像预测结果、第二图像预测结果；

依据所述前景图像预测结果和所述第二图像预测结果的差异构建所述第五损失函数；

依据所述前景图像预测结果与前景图像真实结果的差异构建第八损失函数；

依据所述背景图像预测结果与背景图像真实结果的差异构建第九损失函数；

依据所述第五损失函数、所述第八损失函数和所述第九损失函数确定所述第四损失函数。

7.根据权利要求6所述的方法，其特征在于，将所述第二训练样本中的图像依次输入所述第二目标检测模型，包括：

对所述前景图像和所述第二图像进行数据弱处理，其中，所述数据弱处理包括以下至少之一：旋转、亮度调整；

将数据弱处理后的前景图像和第二图像以及所述背景图像依次输入所述第二目标检测模型。

8.根据权利要求6所述的方法，其特征在于，所述第二目标检测模型的瓶颈层采用全局注意力机制，依据所述前景图像预测结果和所述第二图像预测结果的差异构建所述第五损失函数，包括：

获取所述前景图像在瓶颈层的各个特征的第一上下文关系和所述第二图像在瓶颈层的各个特征的第二上下文关系，依据所述第一上下文关系和所述第二上下文关系的差异构建第十损失函数；

依据所述前景图像的预测目标类别与所述第二图像的预测目标类别的差异构建第十一损失函数；

依据所述前景图像的预测目标框与所述第二图像的预测目标框的差异构建完全交并比损失函数，并将所述前景图像的预测结果得分与所述完全交并比损失函数之积作为第十二损失函数；

依据所述第十损失函数、所述第十一损失函数和所述第十二损失函数确定所述第五损失函数。

9.一种图像检测方法，其特征在于，包括：

获取待检测图像；

将所述待检测图像输入目标检测模型，得到所述目标检测模型输出的检测结果，其中，所述目标检测模型是通过权利要求1至8中任意一项所述的目标检测模型训练方法训练得到的；

在所述检测结果指示所述待检测图像中存在目标物体时，发出告警信息。

10.一种目标检测模型训练装置，其特征在于，包括：

第一获取模块，用于获取第一训练样本集合，其中，每个第一训练样本为由至少一张前景图像和至少一张背景图像拼接成的第一图像，所述前景图像中包含检测目标，所述背景图像中不包含检测目标；

第一训练模块，用于利用所述第一训练样本集合对第一目标检测模型进行训练，并依据第一损失函数调整所述第一目标检测模型的模型参数，得到第二目标检测模型，其中，所述第一损失函数中至少包括：反映前景图像预测结果与前景图像真实结果差异的第二损失函数和反映背景图像预测结果与背景图像真实结果差异的第三损失函数；

第二获取模块，用于获取第二训练样本集合，其中，每个第二训练样本中包括：一张前景图像、一张背景图像、所述前景图像和所述背景图像混合成的第二图像；

第二训练模块，用于利用所述第二训练样本集合对所述第二目标检测模型进行蒸馏学习，并依据第四损失函数调整所述第二目标检测模型的模型参数，得到第三目标检测模型，其中，所述第四损失函数中至少包括：反映前景图像预测结果与第二图像预测结果差异的第五损失函数。

11.一种图像检测装置，其特征在于，包括：

第三获取模块，用于获取待检测图像；

检测模块，用于将所述待检测图像输入目标检测模型，得到所述目标检测模型输出的检测结果，其中，所述目标检测模型是通过权利要求1至8中任意一项所述的目标检测模型训练方法训练得到的；

告警模块，用于在所述检测结果指示所述待检测图像中存在目标物体时，发出告警信息。

12.一种非易失性存储介质，其特征在于，所述非易失性存储介质包括存储的计算机程序，其中，所述非易失性存储介质所在设备通过运行所述计算机程序执行权利要求1至8中任意一项所述的目标检测模型训练方法或权利要求9所述的图像检测方法。

13.一种电子设备，其特征在于，包括：存储器和处理器，其中，所述存储器中存储有计算机程序，所述处理器被配置为通过所述计算机程序执行权利要求1至8中任意一项所述的目标检测模型训练方法或权利要求9所述的图像检测方法。