CN112633496B

CN112633496B - 一种检测模型的处理方法及装置

Info

Publication number: CN112633496B
Application number: CN202011506742.3A
Authority: CN
Inventors: 陈伟杰; 马振鑫; 陈斌斌; 过一路; 赵龙; 杨世才; 谢迪; 浦世亮
Original assignee: Hangzhou Hikvision Digital Technology Co Ltd
Current assignee: Hangzhou Hikvision Digital Technology Co Ltd
Priority date: 2020-12-18
Filing date: 2020-12-18
Publication date: 2023-08-08
Anticipated expiration: 2040-12-18
Also published as: CN112633496A

Abstract

本申请提供一种检测模型的处理方法及装置，涉及机器学习技术领域，可以提高检测模型的检测准确率。该处理方法包括：获取N帧图片；将N帧图片输入到第一检测模型，进行对象检测处理，得到每帧图片中检测框的置信度；根据第一置信度阈值和获取到的检测框的置信度，确定正样本和负样本；正样本包括第一检测框和N帧图片中包括第一检测框的图片，负样本包括第二检测框和N帧图片中包括第二检测框的图片；第一检测框为置信度高于第一置信度阈值的检测框，第二检测框为置信度低于第一置信度阈值的检测框；第一置信度阈值大于第一检测模型对应的置信度阈值；根据正样本和负样本对第一检测模型进行训练，得到第二检测模型。

Description

一种检测模型的处理方法及装置

技术领域

本申请涉及机器学习技术领域，尤其涉及一种检测模型的处理方法及装置。

背景技术

基于深度学习技术的检测模型已广泛应用于各种检测场景中，如视频监控、文字识别、数据走势预测等场景中。目前，大部分检测模型是根据预先采集的训练数据通过监督学习训练得到的。而由于环境等因素的影响，训练数据和上述检查场景中的数据之间可能存在一定的偏差。该偏差可能会导致检测模型的检测准确率较低。

发明内容

本申请提供一种检测模型的处理方法及装置，可以提高检测模型的检测准确率。

为实现上述技术目的，本申请采用如下技术方案：

第一方面，本申请实施例提供了一种检测模型的处理方法，该方法包括：先获取N帧图片；再将N帧图片输入到第一检测模型，进行对象检测处理，得到每帧图片中检测框的置信度；然后，根据第一置信度阈值和获取到的检测框的置信度，确定正样本和负样本；最后，根据正样本和负样本对第一检测模型进行训练，得到第二检测模型。

其中，N帧图片为在线采集的图片，N为正整数。检测框用于表征图片中对象的位置；第一检测模型为初始检测模型或者为当前的检测模型。正样本包括第一检测框和N帧图片中包括第一检测框的图片，负样本包括第二检测框和N帧图片中包括第二检测框的图片。第一检测框为置信度高于第一置信度阈值的检测框，第二检测框为置信度低于第一置信度阈值的检测框。第一置信度阈值大于第一检测模型对应的置信度阈值；

可以理解的是，本申请实施例的技术方案中，利用第一检测模型检测出N帧图片的检测框，则对于第一检测模型来说，置信度大于第一检测模型对应的置信度阈值的检测框就是对象检测正确的检测框。利用大于第一检测模型对应的置信度阈值的第一置信度阈值，选择置信度大于该第一置信度阈值的检测框为正样本，置信度小于该第一置信度阈值的检测框为负样本。其中，正样本表示对象检测正确的检测框，负样本表示对象检测错误的检测框。这样就可以将第一检测模型检测出的对象检测正确的检测框中的置信度低于第一置信度阈值的检测框划分到负样本中，而该对象检测正确的检测框中的置信度低于第一置信度阈值的检测框是第一检测模型检测出的所有对象检测正确的检测框中的准确度较低的，即该对象检测正确的检测框中的置信度低于第一置信度阈值的检测框是所有对象检测正确的检测框中误检可能性最大的。因此，这样确定出的正样本中的误检可能性较大的对象检测正确的检测框(可以称为不确定正样本)被减少，则正样本的准确度高于利用第一检测模型对应的置信度阈值确定出的对象检测正确的检测框的准确度。进而，利用准确度高于第一检测模型检测出的对象检测正确的检测框的准确度的正样本，训练第一检测模型得到的第二检测模型的正确检测数量更高，即提高了检测模型的正确检测数量。

其次，正样本和负样本还是利用N帧图片生成的，而N帧图片是在线采集的图片，则正样本和负样本就是当前的检测场景中的数据。进而，利用该正样本和该负样本训练得到的第二检测模型在当前的检测场景中的检测准确率更高，即提高了检测模型在当前的检测场景中的检测准确率。

另外，利用第一检测模型检测出N帧图片中的检测框、检测框的对象信息，无需人工标记N帧图片，就可得到用于训练第一检测模型的正样本和负样本。如此，实现了无监督的训练检测模型。

在一种可能的实施方式中，该方法在得到第二检测模型之后，还包括：确定第一检测模型的检测能力和第二检测模型的检测能力；在确定第二检测模型的检测能力优于第一检测模型的检测能力的情况下，确定第二检测模型对应的置信度阈值，第二检测模型用于对后续采集到的图片的检测；在确定第一检测模型的检测能力优于第二检测模型的检测能力的情况下，重新确定正样本和负样本；根据重新确定的正样本和负样本，对第一检测模型进行训练。

另一种可能的实施方式中，上述确定第一检测模型的检测能力和第二检测模型的检测能力，包括：获取M帧图片；M帧图片为在线采集的图片，M帧图片与N帧图片不同，M为正整数；将M帧图片输入到第一检测模型，进行对象检测处理，得到每帧图片中检测框的第一置信度；将M帧图片输入到第二检测模型，进行对象检测处理，得到每帧图片中检测框的第二置信度；确定第一数量和第二数量。其中，第一数量为第一置信度高于第一检测模型对应的置信度阈值的检测框的数量；第二数量为第二置信度高于第一检测模型对应的置信度阈值的检测框的数量；第一数量用于表征第一检测模型的检测能力，第二数量用于表征第二检测模型的检测能力。

其中，上述确定第一检测模型的检测能力优于第二检测模型的检测能力，包括：若第一数量大于第二数量，则确定第一检测模型的检测能力优于第二检测模型的检测能力。

可以理解的是，服务器分别用第一检测模型和第二检测模型，对M帧图片进行对象检测处理，得到第一数量、第二数量。由于第一检测模型和第二检测模型是对相同的图片(即M帧图片)进行对象测量处理，并且，第一检测模型对应的第一数量和第二检测模型对应的第二数量都是指置信度大于第一检测模型对应的置信度阈值的检测框的数量。那么，在处理对象相同、且用于统计检测框数量的置信度阈值相同的情况下，通过比较第一检测模型对应的第一数量和第二检测模型对应的第二数量的关系，就可以确定第一检测模型和第二检测模型中哪一个检测模型对相同的图片，检测出的置信度大于同一个置信度阈值(即第一检测模型对应的置信度阈值)的检测框的数量更多。而对相同的图片，检测出的置信度大于同一个置信度阈值(即第一检测模型对应的置信度阈值)的检测框的数量更多，则表示了该检测模型的检测能力更优。

另一种可能的实施方式中，上述在确定第一检测模型的检测能力优于第二检测模型的检测能力的情况下，重新确定正样本和负样本，包括：确定重新确定的正样本包括负样本中满足预设条件的样本和正样本；确定重新确定的负样本包括负样本中除满足预设条件的样本以外的其他样本。

其中，预设条件可以是按照检测框的置信度降序排列后的负样本中的前P个样本。P是第二预设阈值。或者，预设条件可以是第二置信度阈值。第二置信度阈值可以是根据第一置信度阈值和/或第一检测模型对应的置信度阈值设置的。

另一种可能的实施方式中，该方法还包括：获取在线采集到的初始图片；对初始图片去冗余处理，得到目标图片；目标图片包括N帧图片和M帧图片。

另一种可能的实施方式中，上述对初始图片去冗余处理，得到目标图片，包括：将初始图片输入到当前的检测模型，进行对象检测处理，得到每帧初始图片中检测框；对每帧初始图片执行第一操作，以得到目标图片。其中，第一操作包括：若第i帧初始图片中检测框与对应的第i-1帧初始图片中检测框之间的重叠度大于预设重叠度阈值，则删除第i帧初始图片；i∈[1，K]，K等于初始图片的数量。

可以理解的是，通过删除与第i-1帧初始图片重叠度高的第i帧初始图片，即减少了目标图片所需的存储空间大小，又保证目标图片的数据多样性。

另一种可能的实施方式中，上述对初始图片去冗余处理，得到目标图片，包括：将初始图片输入到当前的检测模型，进行对象检测处理，得到每帧初始图片中检测框、以及每帧初始图片对应的中间特征图；对每帧初始图片执行第一操作，以得到待选图片。在待选图片的数量大于第一预设阈值的情况下，根据待选图片和待选图片对应的中间特征图确定待选图片中检测框的特征，并根据待选图片中检测框的特征，对待选图片去冗余处理，得到目标图片。

其中，第一操作包括：若第i帧初始图片中检测框与对应的第i-1帧初始图片中检测框之间的重叠度大于预设重叠度阈值，则删除第i帧初始图片；i∈[1，K]，K等于初始图片的数量。

可以理解的是，一个检测框与所属的第一检测框集合的类中心之间的距离越远，表示该检测框与所属的第一检测框集合中的类中心之间的特征差异越大；因此，若某一帧待选图片中的所有检测框与所属的第一检测框集合的类中心之间的距离的平均值越大，表示该帧待选图片的检测框与所属的第一检测框集合中的类中心之间的特征差异较大，则保留该帧待选图片可以提高目标图片的多样性。

另一种可能的实施方式中，上述根据待选图片和待选图片对应的中间特征图确定待选图片中检测框的特征，包括：针对每帧待选图片执行以下步骤，以确定待选图片中检测框的特征：按照所述待选图片和所述待选图片对应的中间特征图之间的尺寸比值，对所述待选图片和所述待选图片中检测框进行缩放，得到缩放后的待选图片和缩放后的检测框；确定所述缩放后的检测框在所述待选图片对应的中间特征图中的位置是所述缩放后的检测框在所述缩放后的待选图片中的位置；对所述待选图片对应的中间特征图池化处理，得到所述待选图片对应的中间特征图的特征向量；根据所述缩放后的检测框在所述待选图片对应的中间特征图中的位置，从所述待选图片对应的中间特征图的特征向量中确定所述待选图片中检测框的特征。

另一种可能的实施方式中，上述根据待选图片中检测框的特征，对待选图片去冗余处理，得到目标图片，包括：对待选图片中检测框的特征进行聚类，得到至少一个第一检测框集合；根据待选图片中检测框的特征、以及至少一个第一检测框集合，计算每一帧待选图片中检测框与所属的第一检测框集合的类中心之间的距离的平均值；按照平均值，从待选图片进行删除，得到目标图片；其中，目标图片的平均值大于待选图片中除目标图片以外的其他图片的平均值；目标图片的数量等于第一预设阈值。

第二方面，本申请提供一种检测模型的处理装置。该检测模型的处理装置包括用于执行第一方面或第一方面中任一种可能的设计方式所述的方法的各个模块。

第三方面，本申请提供一种检测模型的处理装置，该检测模型的处理装置包括存储器和处理器。上述存储器和处理器耦合。该存储器用于存储计算机程序代码，该计算机程序代码包括计算机指令。当处理器执行该计算机指令时，检测模型的处理装置执行如第一方面及其任一种可能的设计方式所述的检测模型的处理方法。

第四方面，本申请提供一种芯片系统，该芯片系统应用于检测模型的处理装置；芯片系统包括一个或多个接口电路，以及一个或多个处理器。接口电路和处理器通过线路互联；接口电路用于从检测模型的处理装置的存储器接收信号，并向处理器发送信号，信号包括存储器中存储的计算机指令。当处理器执行计算机指令时，检测模型的处理装置执行如第一方面及其任一种可能的设计方式所述的检测模型的处理方法。

第五方面，本申请提供一种计算机可读存储介质，该计算机可读存储介质包括计算机指令，当所述计算机指令在检测模型的处理装置上运行时，使得检测模型的处理装置执行如第一方面及其任一种可能的设计方式所述的检测模型的处理方法。

第六方面，本申请提供一种计算机程序产品，该计算机程序产品包括计算机指令，当计算机指令在检测模型的处理装置上运行时，使得检测模型的处理装置执行如第一方面及其任一种可能的设计方式所述的检测模型的处理方法。

本申请中第二方面到第六方面及其各种实现方式的具体描述，可以参考第一方面及其各种实现方式中的详细描述；并且，第二方面到第六方面及其各种实现方式的有益效果，可以参考第一方面及其各种实现方式中的有益效果分析，此处不再赘述。

本申请的这些方面或其他方面在以下的描述中会更加简明易懂。

附图说明

图1为本申请实施例提供的一种检测模型的处理方法所涉及的实施环境示意图一；

图2为本申请实施例提供的一种检测模型的处理方法所涉及的实施环境示意图二；

图3为本申请实施例提供的一种检测模型的处理方法所涉及的实施环境示意图三；

图4为本申请实施例提供的一种检测模型的处理方法的流程图一；

图5为本申请实施例提供的一种检测模型的处理方法的流程图二；

图6为本申请实施例提供的一种检测模型的处理方法的流程图三；

图7为本申请实施例提供的一种获取检测框的特征的示意图；

图8为本申请实施例提供的一种服务器中的图片获取模型的结构示意图；

图9为本申请实施例提供的一种检测模型的处理方法的流程图四；

图10为本申请实施例提供的一种检测模型的处理方法的流程图五；

图11为本申请实施例提供的一种检测模型的处理方法的流程图六；

图12为本申请实施例提供的一种检测模型的处理装置的结构示意图一；

图13为本申请实施例提供的一种检测模型的处理装置的结构示意图二。

具体实施方式

以下，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中，除非另有说明，“多个”的含义是两个或两个以上。

基于深度学习技术的检测模型已广泛应用于各种检测场景中，如，视频监控、智能识别对象等。其中，该检测模型是对预先采集训练数据人工标记，再对标记后的训练数据进行监督学习训练得到的。由于使用该检测模型的检测场景是多样的、且动态变化的；因此，预先采集该训练数据的场景无法涵盖所有使用该检测模型的检测场景，即预先采集该训练数据的场景和使用该检测模型的检测场景可能存在一些差异，如，光照差异、气候差异、场景结构差异、场景内的物体的增减等。这些场景差异导致该训练数据和该检测场景中的数据存在一定的偏差，该偏差可进一步导致检测模型在该检测场景中的正确检测数量较低、检测准确率较低。

本申请实施例提供一种检测模型的处理方法，通过该方法可以提高检测模型的正确检测数量，进而提高检测模型的检测准确率。

本申请实施例提供的检测模型的处理方法可以适用于检测模型的处理系统。图1示出了该检测模型的处理系统的一种可能的结构。如图1所示，本申请实施例提供的检测模型的处理系统包括：图像采集设备11、终端12和服务器13。图像采集设备11与终端12连接，图像采集设备11还可与服务器13连接。终端12与服务器13连接。其中，图像采集设备13可以为用于采集图像或视频的设备，例如：摄像机等。终端12可以为手机、个人计算机、笔记本电脑虚拟现实终端、增强现实终端、无人驾驶中的无线终端等电子设备。图1中以终端12为笔记本电脑为例。

在实际应用中，服务器13可以集成在终端12中；也可以服务器13和终端12独立设置。如无明确说明，本申请实施例下述内容均以服务器13和终端12为相互独立的设备为例进行说明。

现结合图1对本申请实施例提供的检测模型的处理方法的原理进行说明。

如图2所示，在一种可能的实现方式中，本申请实施例提供的检测模型的处理系统中的图像采集设备11连接终端12和服务器13。图像采集设备11在线采集图片后，向与图像采集设备11连接的终端12发送在线采集的图片，还向与图像采集设备11连接的服务器13发送在线采集的图片。终端12在接收到该图片后，可以显示该图片；还可以利用预先设置的初始检测模型对该图片检测对象，得到并显示图片中的检测框和对应的对象信息。服务器13在接收到该图片后，可以存储该图片；还可以按照预设训练周期或者在存储的图片数量超过预设存储阈值时，利用存储的图片训练上述初始检测模型，得到训练后的检测模型。然后，服务器13可将训练后的检测模型发送至终端12，终端12利用训练后的检测模型对后续在线采集到的图片检测对象。

其中，对象信息可以是表示对象身份的信息，例如，人、动物、植物等；又例如，带眼镜的人、不带眼镜的人、猫、狗、花等。检测框可以表征对应的对象在图片中的位置或区域。

本申请实施例中，在终端12和服务器13获取上述初始检测模型之前，通过图像采集设备11或其他图像采集设备采集训练图片，再由人工标记训练图片中的检测框和对应的对象信息；然后，服务器13或其他服务器利用训练图片、以及训练图片中的检测框和对应的对象信息，训练神经网络模型得到初始检测模型。最后，服务器13将初始检测模型发送至终端12，或者，其他服务器将初始检测模型发送至终端12和服务器13。其中，其他图像采集设备与图像采集设备11不同；其他服务器与服务器13不同。

在另一种可能的实现方式中，本申请实施例提供的检测模型的处理系统中图像采集设备11连接终端12。如图3所示，图像采集设备11在线采集图片后，向终端12发送在线采集的图片。终端在接收到图片后，可以显示该图片，并利用预先设置的初始检测模型对该图片检测对象，得到并显示图片中的检测框和对应的对象信息。终端12还可以存储该图片；然后，按照预设训练周期或者在存储的图片数量超过预设采集阈值时，利用存储的图片训练上述初始检测模型，得到训练后的检测模型。终端12利用训练后的检测模型对后续在线采集到的图片检测对象。

本申请实施例提供的检测模型的处理方法的执行主体为检测模型的处理装置。该检测模型的处理装置可以是上述检测模型的处理系统中的终端12，还可以是上述检测模型的处理系统中的服务器13。当服务器13集成在终端12中时，本申请实施例提供的检测模型的处理方法的执行主体还可以为集成有服务器13的终端12。本申请实施例以服务器13执行检测模型的处理方法为例，对本申请提供的检测模型的处理方法进行说明。

需要说明的是，图1-图3中任一附图中的设备(如，图像采集设备、终端、服务器)的数目仅仅是示意性的，本申请实施例不对检测模型的处理系统中的设备的数目进行限制。

下面结合图1提供的检测模型的处理系统的结构示意图、图2提供的检测模型的处理方法的原理示意图以及图3提供的检测模型的处理方法的原理示意图对本申请实施例提供的检测模型的处理方法进行描述。

本申请实施例中，由于用于训练初始检测模型的训练数据和实际的检测场景中的数据存在的偏差，导致初始检测模型在实际的检测场景中的检测准确率较低、误检率较高。因此，服务器可利用在线采集到的图片对初始检测模型进行训练。训练后的检测模型用于对后续在线采集到的图片检测对象。

如图4所示，本申请实施例提供的检测模型的处理方法包括S201-S204。

S201、服务器获取N帧图片；N帧图片为在线采集的图片，N为正整数。

服务器可从图像采集设备接收在线采集到的图片，并对在线采集到的图片进行存储。然后，服务器可按照预设训练周期，定时利用存储的图片获取N帧图片；或者，服务器可在存储的图片数量大于或等于预设存储阈值的情况下，利用存储的图片获取N帧图片。

其中，预设训练周期可以是一个月、一个季度或一年等。

本申请实施例中，服务器获取在线采集到的初始图片；对初始图片去冗余处理，得到目标图片；目标图片包括N帧图片。

其中，服务器可接收来自图像采集设备的在线采集到的初始图片；该在线采集到的初始图片是上述在线采集到的图片。服务器可将目标图片确定为N帧图片，或者，将目标图片中的部分图片确定为N帧图片。

S202、服务器将N帧图片输入到第一检测模型，进行对象检测处理，得到每帧图片中检测框的置信度；检测框用于表征图片中对象的位置；第一检测模型为初始检测模型或者为当前的检测模型。

服务器用第一检测模型对N帧图片进行前向推理，得到N帧图片中每帧图片中检测框、每帧图片中检测框的置信度和对象信息。其中，服务器用第一检测模型对N帧图片进行前向推理的过程可以包括：服务器向第一检测模型分别输入N帧图片，运行第一检测模型，第一检测模型输出每帧图片中检测框、每帧图片中检测框的置信度和对象信息。

其中，初始检测模型是利用带有标记的训练图片训练得到的；该标记包括训练图片中检测框、检测框的对象信息。检测框可以包含对象在图片中的完整区域。

本申请实施例中，服务器可利用N帧图片训练初始检测模型，得到训练后的检测模型。该训练后的检测模型用于对后续在线采集到的图片检测对象，即该训练后的检测模型为当前的检测模型。

或者，服务器可利用N帧图片训练当前的检测模型，得到训练后的检测模型。该训练后的检测模型用于对后续在线采集到的图片检测对象，即该训练后的检测模型为当前的检测模型。

其中，当前的检测模型是初始检测模型或训练后的检测模型。

可以理解的是，服务器对初始检测模型训练得到的训练后的检测模型，相较于对训练后的检测模型训练得到的训练后的检测模型，可以避免深度学习中的灾难性遗忘问题，或者说，避免出现训练后的检测模型的检测性能差于初始检测模型的检测性能的情况下，继续对该训练后的检测模型训练导致检测性能降低的问题累积。其中，灾难性遗忘问题是指利用N帧图片训练初始检测模型得到的训练后的检测模型，丢失了初始检测模型具有的一些较好的检测性能。

S203、服务器根据第一置信度阈值和获取到的检测框的置信度，确定正样本和负样本。

其中，正样本包括第一检测框和N帧图片中包括第一检测框的图片，负样本包括第二检测框和N帧图片中包括第二检测框的图片；第一检测框为置信度高于第一置信度阈值的检测框，第二检测框为置信度低于第一置信度阈值的检测框；第一置信度阈值大于第一检测模型对应的置信度阈值。

本申请实施例中，服务器可获取第一置信度阈值。服务器再针对获取到的N帧图片的所有检测框，可将N帧图片的所有检测框中置信度大于或等于第一置信度阈值的检测框、及其所属的图片和其对应的对象信息确定为正样本；将N帧图片的所有检测框中置信度小于第一置信度阈值的检测框、及其所属的图片和其对应的对象信息确定为负样本。其中，第一置信度阈值大于第一检测模型对应的置信度阈值。

需要说明的是，N帧图片中的某一帧图片可能被划分到正样本和负样本，作为正样本的该帧图片的检测框和作为负样本的该帧图片的检测框不同。

本申请实施例中，正样本和负样本均包括检测框、检测框所属的图片和检测框的对象信息。

S204、服务器根据正样本和负样本对第一检测模型进行训练，得到第二检测模型。

服务器可确定正样本中的图片为正样本的输入、确定正样本中的检测框和检测框的对象信息为正样本的输出、确定负样本中的图片为负样本的输入、确定负样本中的检测框和检测框的对象信息为负样本的输出。然后，利用正样本的输入和输出、以及负样本的输入和输出，对第一检测模型进行训练，得到第二检测模型。

示例性地，服务器将第二检测模型发送给与服务器连接的终端。

可以理解的是，服务器利用第一检测模型检测出N帧图片的检测框，则对于第一检测模型来说，置信度大于第一检测模型对应的置信度阈值的检测框就是对象检测正确的检测框。服务器利用大于第一检测模型对应的置信度阈值的第一置信度阈值，选择置信度大于该第一置信度阈值的检测框为正样本，置信度小于该第一置信度阈值的检测框为负样本。其中，正样本表示对象检测正确的检测框，负样本表示对象检测错误的检测框。这样就可以将第一检测模型检测出的对象检测正确的检测框中的置信度低于第一置信度阈值的检测框划分到负样本中，而该对象检测正确的检测框中的置信度低于第一置信度阈值的检测框是第一检测模型检测出的所有对象检测正确的检测框中的准确度较低的，即该对象检测正确的检测框中的置信度低于第一置信度阈值的检测框是所有对象检测正确的检测框中误检可能性最大的。因此，这样确定出的正样本中的误检可能性较大的对象检测正确的检测框(可以称为不确定正样本)被减少，则正样本的准确度高于利用第一检测模型对应的置信度阈值确定出的对象检测正确的检测框的准确度。进而，利用准确度高于第一检测模型检测出的对象检测正确的检测框的准确度的正样本，训练第一检测模型得到的第二检测模型的正确检测数量更高，即提高了检测模型的正确检测数量。

另外，服务器利用第一检测模型检测出N帧图片中的检测框、检测框的对象信息，无需人工标记N帧图片，就可得到用于训练第一检测模型的正样本和负样本。如此，实现了无监督的训练检测模型。

如图5所示，本申请实施例提供的检测模型的处理方法中S201可以包括S301-S303。

S301、服务器获取在线采集到的初始图片。

服务器可对接收到的每帧初始图片执行S302-S303，以确定是否保存每帧初始图片。

或者，服务器可先保存接收到的每帧初始图片；再对存储的初始图片执行S302-S303。

S302、服务器将初始图片输入到当前的检测模型，进行对象检测处理，得到每帧初始图片中检测框。

服务器用当前的检测模型对初始图片进行前向推理，得到初始图片中每帧初始图片中检测框中检测框，还得到每帧初始图片中检测框的置信度和对象信息。

其中，服务器用当前的检测模型对初始图片进行前向推理的过程可以包括：服务器可将从图像采集设备接收到的每帧初始图片输入到当前的检测模型，输出每帧初始图片中检测框；或者，将存储的每帧初始图片输入到当前的检测模型，输出每帧初始图片中检测框。

S303、服务器对每帧初始图片执行第一操作，以得到目标图片。

服务器针对第i帧初始图片中的每个检测框，计算检测框与对应的第i-1帧初始图片中检测框之间的重叠度(Intersection of Union，IoU)。若第i帧初始图片中的所有检测框的重叠度都大于预设重叠度阈值，表示第i帧初始图片是第i-1帧初始图片的重复帧，则服务器删除第i帧初始图片。若第i帧初始图片中的至少一个检测框的重叠度小于或等于预设重叠度阈值，则服务器保存第i帧初始图片或不删除已经保存的第i帧初始图片。最后，服务器将保存的初始图片确定为目标图片。

其中，第i帧初始图片中的每个检测框与对应的第i-1帧初始图片中的检测框之间的重叠度，大于第i帧初始图片中的每个检测框与第i-1帧初始图片中的其他检测框之间的重叠度。第i-1帧初始图片中的其他检测框是除与第i帧初始图片中的每个检测框对应的检测框之外的检测框。

其中，重叠度是指两个检测框之间的重叠比例，即两个检测框的交集面积与两个检测框的并集面积的比值。

其中，第0帧初始图片可以是预先存储在服务器中的图片。或者，第1帧初始图片中检测框与对应的第0帧初始图片中检测框之间的重叠度等于0。

本申请实施例中，服务器确定第i帧初始图片中的所有检测框与一一对应的第i-1帧初始图片中检测框之间的重叠度大于预设重叠度阈值，则删除第i帧初始图片。

可以理解的是，服务器通过删除与第i-1帧初始图片重叠度高的第i帧初始图片，即减少了目标图片所需的存储空间大小，又保证目标图片的数据多样性。

如图6所示，本申请实施例提供的检测模型的处理方法中的S201可以包括S401-S404。

S401、服务器获取在线采集到的初始图片。

需要说明的是，S401的详情可参见上述S301的详细介绍，本申请实施例这里不予赘述。

S402、服务器将初始图片输入到当前的检测模型，进行对象检测处理，得到每帧初始图片中检测框、以及每帧初始图片对应的中间特征图。

服务器用当前的检测模型对初始图片进行前向推理，得到每帧初始图片中检测框、以及每帧初始图片对应的中间特征图。

其中，服务器用当前的检测模型对初始图片进行前向推理的过程可以包括：服务器可将从图像采集设备接收到的每帧初始图片输入到当前的检测模型，输出每帧初始图片中检测框和每帧初始图片对应的中间特征图。或者，将存储的每帧初始图片输入到当前的检测模型，输出每帧初始图片中检测框和每帧初始图片对应的中间特征图。

其中，每帧初始图片对应的中间特征图是当前的检测模型的一个中间网络层输出的，每帧初始图片中检测框是当前的检测模型的输出层输出的。其中，当前的检测模型的这个中间网络层可以是与当前的检测模型的输出层最接近的网络层。

可以理解的是，与当前的检测模型的输出层越接近的网络层输出的中间特征图所记录的特征越抽象，则该特征受采集光线、对象姿态等的影响越小，该特征能反映出的对象信息更准确。因此，可以选择与当前的检测模型的输出层最接近的网络层输出的中间特征层作为每帧初始图片对应的中间特征图。

S403、服务器对每帧初始图片执行第一操作，以得到待选图片。

需要说明的是，S403得到待选图片的具体过程可参见上述S303得到目标图片的详细介绍，本申请实施例这里不予赘述。

S404、服务器在待选图片的数量大于第一预设阈值的情况下，根据待选图片和待选图片对应的中间特征图确定待选图片中检测框的特征，并根据待选图片中检测框的特征，对待选图片去冗余处理，得到目标图片。

本申请实施例中，服务器针对每帧待选图片执行以下步骤，以确定待选图片中检测框的特征：按照待选图片和待选图片对应的中间特征图之间的尺寸比值，对待选图片和待选图片中检测框进行缩放，得到缩放后的待选图片和缩放后的检测框；对待选图片对应的中间特征图池化处理，得到待选图片对应的中间特征图的特征向量；确定缩放后的检测框在待选图片对应的中间特征图中的位置是缩放后的检测框在缩放后的待选图片中的位置；根据缩放后的检测框在待选图片对应的中间特征图中的位置，从待选图片对应的中间特征图的特征向量中确定待选图片中检测框的特征。

其中，待选图片中检测框的特征可以是待选图片中检测框的特征向量。

示例性地，服务器可包括图片获取模型，图片获取模型包括特征提取模块。如图7所示，该特征提取模块利用第一检测模型对某一帧待选图片进行对象检测处理(或者说前向推理)后，得到该帧待选图片中的检测框51和检测框52、以及某一帧待选图片对应的中间特征图53；然后，该特征提取模块按照该帧待选图片和该帧待选图片对应的中间特征图之间的尺寸比值，对包括检测框51和检测框52的该帧待选图片进行缩放，得到缩放后的待选图片、以及缩放后的检测框54和检测框55；然后，确定缩放后的检测框54和检测框55在该帧待选图片对应的中间特征图中的位置是缩放后的检测框54和检测框55在缩放后的待选图片中的位置；对该帧待选图片对应的中间特征图池化处理(pooling)，得到该帧待选图片对应的中间特征图的特征向量；最后，根据缩放后的检测框54在该帧待选图片对应的中间特征图中的位置，从将该帧待选图片对应的中间特征图的特征向量中确定检测框51的特征向量；根据缩放后的检测框55在该帧待选图片对应的中间特征图中的位置，从将该帧待选图片对应的中间特征图的特征向量中确定检测框52的特征向量。

本申请实施例中，服务器得到待选图片中检测框的特征后，对待选图片中检测框的特征进行聚类，得到至少一个第一检测框集合；根据待选图片中检测框的特征、以及至少一个第一检测框集合，计算每一帧待选图片中检测框与所属的第一检测框集合的类中心之间的距离的平均值；按照平均值，从待选图片进行删除，得到目标图片。其中，目标图片的平均值大于待选图片中除目标图片以外的其他图片的平均值；目标图片的数量等于第一预设阈值。

本申请实施例中，服务器可以按照平均值，对待选图片进行升序排列；然后，对排列后的待选图片依次删除平均值最小的图片，直至排列后的待选图片的数量等于第一预设阈值，则确定排列后的待选图片为目标图片。

或者，服务器可从待选图片中删除平均值小于预设平均值阈值的图片，得到目标图片。

本申请实施例中，服务器可采用k均值聚类算法(k-means clusteringalgorithm，k-means)对待选图片中检测框的特征进行聚类。

需要说明的是，服务器对初始图片可以基于两个检测框之间的重叠度去冗余(如，S302-S303所记录的处理过程或S402-S403所记录的处理过程)，或者基于检测框的特征聚类结果去冗余(如，S402和S404所记录的处理过程)，又或者先基于两个检测框之间的重叠度去冗余再基于检测框的特征聚类结果去冗余，本申请实施例不作限制。

示例性地，以服务器针对初始图片，先基于两个检测框之间的重叠度去冗余，再基于检测框的特征聚类结果去冗余为例，服务器可包括图片获取模型60，图片获取模型60包括：基于重叠度的去冗余模块61和基于特征聚类的去冗余模块62；基于特征聚类的去冗余模块62包括特征提取模块63。如图8所示，服务器向图片获取模型60输入初始图片和当前的检测模型；基于重叠度的去冗余模块61执行上述S402-S403，实现对初始图片基于两个检测框之间的重叠度去冗余，以得到待选图片；基于特征聚类的去冗余模块62执行上述S404，实现对待选图片基于检测框的特征聚类结果去冗余，以得到目标图片。

本申请实施例中，服务器训练第一检测模型得到第二检测模型之后，还可以判断第二检测模型是否优于第一检测模型，并根据判断结果确定是否对第二检测模型继续训练。

如图9所示，本申请实施例提供的检测模型的处理方法在S204之后，可以包括S701-S703。

S701、服务器确定第一检测模型的检测能力和第二检测模型的检测能力。

服务器可以将上述目标图片划分为上述N帧图片和M帧图片，如图8所示。服务器利用M帧图片确定第一检测模型的检测能力和第二检测模型的检测能力。其中，M帧图片为在线采集的图片，M帧图片与N帧图片不同。N帧图片用于训练第一检测模型；M帧图片用于确定检测模型的检测能力，M为正整数。

其中，服务器可以对目标图片随机划分成N帧图片和M帧图片。

本申请实施例中，服务器可先获取M帧图片；再将M帧图片输入到第一检测模型，进行对象检测处理，得到每帧图片中检测框的第一置信度；还将M帧图片输入到第二检测模型，进行对象检测处理，得到每帧图片中检测框的第二置信度；然后，确定第一数量和第二数量。其中，第一数量为第一置信度高于第一检测模型对应的置信度阈值的检测框的数量。第二数量为第二置信度高于第一检测模型对应的置信度阈值的检测框的数量。第一数量用于表征第一检测模型的检测能力，第二数量用于表征第二检测模型的检测能力。

服务器先用第一检测模型对M帧图片进行前向推理，得到M帧图片中每帧图片中检测框(可以称为第一检测框)、每帧图片中检测框的置信度(可以称为第一置信度)。其中，服务器用第一检测模型对M帧图片进行前向推理的过程可以包括：服务器分别将M帧图片输入到第一检测模型，第一检测模型输出M帧图片中每帧图片中检测框(可以称为第一检测框)、以及M帧图片中每帧图片中检测框的置信度(可以称为第一置信度)等。然后，服务器统计第一置信度高于第一检测模型对应的置信度阈值的检测框的数量，得到第一数量HC。

其次，服务器还用第二检测模型对M帧图片进行前向推理，得到M帧图片中每帧图片中检测框(可以称为第二检测框)、每帧图片中检测框的置信度(可以称为第二置信度)。其中，服务器用第二检测模型对M帧图片进行前向推理的过程可以包括：服务器还分别将M帧图片输入到第二检测模型，第二检测模型输出M帧图片中每帧图片中检测框(可以称为第二检测框)、以及M帧图片中每帧图片中检测框的置信度(可以称为第二置信度)。然后，服务器统计第二置信度高于第一检测模型对应的置信度阈值的检测框的数量，得到第二数量UC。

进一步地，服务器若确定第一数量HC大于第二数量UC，则确定第一检测模型的检测能力优于第二检测模型的检测能力。服务器若确定第一数量HC小于第二数量UC，则确定第一检测模型的检测能力差于第二检测模型的检测能力，即第二检测模型的检测能力优于第一检测模型的检测能力。服务器若确定第一数量HC等于第二数量UC，则确定第一检测模型的检测能力与第二检测模型的检测能力相同。

可以理解的是，服务器分别用第一检测模型和第二检测模型，对M帧图片进行对象检测处理(或者说前向推理)，得到第一数量HC、第二数量UC。由于第一检测模型和第二检测模型是对相同的图片(即M帧图片)进行对象测量处理，并且，第一检测模型对应的第一数量HC和第二检测模型对应的第二数量UC都是指置信度大于第一检测模型对应的置信度阈值的检测框的数量。那么，在处理对象相同、且用于统计检测框数量的置信度阈值相同的情况下，通过比较第一检测模型对应的第一数量HC和第二检测模型对应的第二数量UC的关系，就可以确定第一检测模型和第二检测模型中哪一个检测模型对相同的图片，检测出的置信度大于同一个置信度阈值(即第一检测模型对应的置信度阈值)的检测框的数量更多。而对相同的图片，检测出的置信度大于同一个置信度阈值(即第一检测模型对应的置信度阈值)的检测框的数量更多，则表示了该检测模型的检测能力更优。

本申请实施例中，上述第二数量可以是第二置信度高于第三置信度阈值的检测框的数量，第三置信度阈值小于第一检测模型对应的置信度阈值。

需要说明的是，服务器设置的第三置信度阈值越小，生成第二检测模型的迭代次数越少。

S702、服务器在确定第二检测模型的检测能力优于第一检测模型的检测能力的情况下，确定第二检测模型对应的置信度阈值，第二检测模型用于对后续采集到的图片的检测。

服务器在第一数量HC小于第二数量UC时，确定第二检测模型的检测能力优于第一检测模型的检测能力。服务器确定第二检测模型对应的置信度阈值，并将第二检测模型及其对应的置信度阈值用于对后续采集到的图片的检测。服务器可将第二检测模型及其对应的置信度阈值发送给与服务器连接的终端。

其中，第一数量HC小于第二数量UC，表示第二检测模型相较于第一检测模型，能够对相同的图片(即M帧图片)，检测出的置信度大于同一个置信度阈值(即第一检测模型对应的置信度阈值)的检测框的数量更多。

需要说明的是，检测模型的检测准确率等于该检测模型的正确检出数量除以总出框数量，该总出框数量是该检测模型检测出的置信度大于该检测模型对应的置信度阈值的检测框的数量。因此，如果第二检测模型相较于第一检测模型，能够对相同的图片，检测出的置信度大于第一检测模型对应的置信度阈值的检测框的数量更多，则表示在采用第一检测模型对应的置信度阈值的情况下，第二检测模型的总出框数量大于第一检测模型的总出框数量。再结合前面上述分析到的“训练第一检测模型得到的第二检测模型的正确检测数量更高”可知，第二检测模型的正确检测数量大于第一检测模型的正确检测数量；那么，为了提高第二检测模型的检测准确率，则可以为第二检测模型设置第二检测模型对应的置信度阈值，以使得第二检测模型的总出框数量等于第一检测模型的总出框数量。

本申请实施例中，服务器可以在确定第二检测模型的检测能力优于第一检测模型的检测能力的情况下，对上述第二检测模型输出的M帧图片中每帧图片中检测框(可以称为第二检测框)，按照第二检测模型输出M帧图片中每帧图片中检测框的置信度(可以称为第二置信度)，对所有的第二检测框进行降序排列；然后，将排列后的第二检测框中的排序序号等于第一数量的检测框的置信度，作为第二检测模型对应的置信度阈值。

可以理解的是，第二检测模型对M帧图片检测出的置信度大于第二检测模型对应的置信度阈值的检测框的数量，就等于第一检测模型对M帧图片检测出的置信度大于第一检测模型对应的置信度阈值的检测框的数量，即第二检测模型的总出框数量等于第一检测模型的总出框数量。进而，由于第二检测模型的正确检测数量大于第一检测模型的正确检测数量，则可知确定第二检测模型的检测准确率大于第一检测模型的检测准确率。

S703、服务器在确定第一检测模型的检测能力优于第二检测模型的检测能力的情况下，重新确定正样本和负样本；根据重新确定的正样本和负样本，对第一检测模型进行训练。

本申请实施例中，服务器可确定重新确定的正样本包括负样本中满足预设条件的样本和正样本；确定重新确定的负样本包括负样本中除满足预设条件的样本以外的其他样本。

需要说明的是，由于第二检测模型对负样本中的上述误检可能性较大的对象检测正确的检测框(可以称为不确定正样本)具有吸引作用，对负样本中的真正的负样本具有排斥作用，则服务器根据负样本中的每帧图片中检测框的置信度，从负样本中确定满足预设条件的样本为正样本。

其中，预设条件可以是按照检测框的置信度降序排列后的负样本中的前P个样本。P是第二预设阈值。

或者，预设条件可以是第二置信度阈值。第二置信度阈值可以是根据第一置信度阈值和/或第一检测模型对应的置信度阈值设置的。

示例性地，第二置信度阈值大于第一检测模型对应的置信度阈值；或者，第二置信度阈值等于第一置信度阈值；又或者，第二置信度阈值大于第一检测模型对应的置信度阈值、且小于第一置信度阈值。

需要说明的是，第二预设阈值设置的越小，则训练第二检测模型的迭代次数越多，训练第二检测模型的训练效果越好，如，对检测错误的检测框抑制能力越高。

如图9所示，本申请实施例提供的检测模型的处理方法在S701之后，还可以包括S704。

S704、服务器在确定第二检测模型的检测能力等于第一检测模型的检测能力的情况下，确定第二检测模型对应的置信度阈值是第一检测模型对应的置信度阈值，第二检测模型用于对后续采集到的图片的检测。

服务器在第一数量HC等于第二数量UC时，确定第二检测模型的检测能力等于第一检测模型的检测能力。服务器将第一检测模型对应的置信度阈值作为第二检测模型对应的置信度阈值，并将第二检测模型及其对应的置信度阈值用于对后续采集到的图片的检测。服务器可将第二检测模型及其对应的置信度阈值发送给与服务器连接的终端。

可以理解的是，服务器在对训练第一检测模型得到第二检测模型，提高了第二检测模型的正确检测数量之后，还可以为第二检测模型设置第二检测模型对应的置信度阈值，以使得第二检测模型的总出框数量等于第一检测模型的总出框数量。那么，由于第二检测模型的正确检测数量大于第一检测模型的正确检测数量，则可知确定第二检测模型的检测准确率大于第一检测模型的检测准确率。

示例性地，以上述第一检测模型为初始检测模型M₀为例。服务器可包括图片获取模型和训练模块。如图10所示，本申请实施例提供的检测模型的处理方法可以包括S801-S812。

S801、图片获取模型获取在线采集到的初始图片。

S802、图片获取模型对初始图片去冗余处理得到目标图片，并对将目标图片划分为N帧图片和M帧图片。

其中，N帧图片用于训练第一检测模型；M帧图片用于确定检测模型的检测能力。

S803、训练模块将M帧图片输入到初始检测模型M₀，初始检测模型M₀输出M帧图片中每帧图片中检测框的置信度(可以称为第一置信度)；再统计第一置信度高于初始检测模型M₀对应的置信度阈值的检测框的数量，得到第一数量HC。

S804、训练模块将N帧图片输入到初始检测模型M₀，进行对象检测处理，得到每帧图片中检测框的置信度。

本申请实施例中，训练模块用初始检测模型M₀对N帧图片进行前向推理，得到N帧图片中每帧图片中检测框、每帧图片中检测框的置信度和对象信息、以及每帧图片对应的中间特征图。其中，服务器用初始检测模型M₀对N帧图片进行前向推理的过程可以包括：训练模块向初始检测模型M₀(或第一检测模型)分别输入N帧图片，运行第一检测模型，初始检测模型M₀(或第一检测模型)输出每帧图片中检测框、每帧图片中检测框的置信度和对象信息、以及每帧图片对应的中间特征图。

需要说明的是，这里的N帧图片中每帧图片对应的中间特征图的详细，可参见上述S402中的关于每帧初始图片对应的中间特征图的详细介绍，本申请实施例这里不予赘述。

S805、训练模块根据第一置信度阈值和获取到的检测框的置信度，确定正样本和负样本；第一置信度阈值大于第一检测模型对应的置信度阈值。

本申请实施例中，服务器在以一个样本是一个检测框及其所属的图片和其对应的对象信息的情况下，可获取第一置信度阈值。服务器再针对获取到的N帧图片的所有检测框，可将N帧图片的所有检测框中置信度大于或等于第一置信度阈值的检测框、及其所属的图片和其对应的对象信息确定为正样本；将N帧图片的所有检测框中置信度小于第一置信度阈值的检测框、及其所属的图片和其对应的对象信息确定为负样本。其中，第一置信度阈值大于第一检测模型对应的置信度阈值。

本申请实施例中，服务器在以一个样本是一个第一检测框集合，一个第一检测框集合包括至少一个检测框及其所属的图片和其对应的对象信息的情况下，可获取第一置信度阈值、并根据N帧图片和N帧图片对应的中间特征图确定N帧图片中检测框的特征；对N帧图片中检测框的特征进行聚类，得到至少一个第二检测框集合；对每一个第二检测框集合中的所有检测框的置信度求平均，得到每一个第二检测框集合的置信度；再将至少一个第二检测框集合中置信度大于或等于第一置信度阈值的第二检测框集合、及其所属的图片和其对应的对象信息确定为正样本；将至少一个第二检测框集合中置信度小于第一置信度阈值的第二检测框集合、及其所属的图片和其对应的对象信息确定为负样本。

其中，服务器可采用k-means对N帧图片中检测框的特征进行聚类。

需要说明的是，训练模块确定N帧图片中检测框的特征的详细，可参见上述S404中的确定待选图片中检测框的特征的详细介绍，本申请实施例这里不予赘述。

S806、训练模块根据正样本和负样本对初始检测模型M₀进行训练，得到第二检测模型。

需要说明的是，S806的详细可参见上述S204的详细介绍，本申请实施例这里不予赘述。

S807、训练模块将M帧图片输入到第二检测模型，第二检测模型输出M帧图片中每帧图片中检测框的置信度(可以称为第二置信度)；再统计第二置信度高于初始检测模型M₀对应的置信度阈值的检测框的数量，得到第二数量UC。

S808、训练模块判断第二数量UC是否大于第一数量HC。

训练模块确定第二数量UC大于第一数量HC，执行S809。确定第二数量UC不大于第一数量HC，执行S810。

S809、训练模块确定第二检测模型对应的置信度阈值，并将第二检测模型及其对应的置信度阈值用于对后续采集到的图片的检测。

训练模块可对上述第二检测模型输出的M帧图片中每帧图片中检测框(可以称为第二检测框)，按照第二检测模型输出M帧图片中每帧图片中检测框的置信度(可以称为第二置信度)，对所有的第二检测框进行降序排列；然后，将排列后的第二检测框中的排序序号等于第一数量的检测框的置信度，作为第二检测模型对应的置信度阈值。

S810、训练模块判断第二数量UC是否等于第一数量HC。

训练模块确定第二数量UC等于第一数量HC，执行S811。确定第二数量UC不等于第一数量HC(即第二数量UC小于第一数量HC)，执行S812。

S811、训练模块将第一检测模型对应的置信度阈值作为第二检测模型对应的置信度阈值，并将第二检测模型及其对应的置信度阈值用于对后续采集到的图片的检测。

S812、训练模块按照检测框的置信度对负样本进行降序排列，将降序排列后的负样本中的前P个样本确定为正样本，得到重新确定的正样本和重新确定的负样本。

本申请实施例中，训练模块可根据重新确定的正样本和重新确定的负样本，继续对初始检测模型M₀进行训练，即执行S806。其中，重新确定的正样本包括该前P个样本和正样本；重新确定的负样本包括负样本中除该前P个样本以外的其他样本。

需要说明的是，训练模型得到重新确定的正样本和重新确定的负样本之后，可用重新确定的正样本和重新确定的负样本对第二检测模型进行训练，然后，不执行S806，执行S807。

需要说明的是，训练模块根据重新确定的正样本和重新确定的负样本继续对初始检测模型M₀进行训练的具体过程，与根据正样本和负样本对第一检测模型进行训练的具体过程同理；训练模块根据重新确定的正样本和重新确定的负样本对第二检测模型进行训练的具体过程，与根据正样本和负样本对第一检测模型进行训练的具体过程同理，本申请实施例这里均不予赘述。

示例性地，以上述第一检测模型为初始检测模型M₀为例。如图11所示，服务器可包括图片获取模型91和训练模块92。其中，服务器获取当前的检测模型，向图片获取模块91输入当前的检测模型和在线采集到的初始图片。服务器向训练模块92输入初始检测模型M₀。图片获取模型91执行S801-S802，训练模块92执行S803-S812。训练模块92输出第二检测模型M_k及其对应的置信度阈值，并将第二检测模型M_k及其对应的置信度阈值用于对后续采集到的图片的检测。训练模块92可将第二检测模型M_k及其对应的置信度阈值发送给与服务器连接的终端。

上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例还提供一种检测模型的处理装置。如图12所示，为本申请实施例提供的一种检测模型的处理装置100的结构示意图。检测模型的处理装置100用于执行图4-图6和图9-图10中任一附图所示的检测模型的处理方法。检测模型的处理装置100可以包括：图片处理模块101和训练模块102。其中，图片处理模块101，用于获取N帧图片；N帧图片为在线采集的图片，N为正整数。训练模块102，用于：将N帧图片输入到第一检测模型，进行对象检测处理(或者说前向推理)，得到每帧图片中检测框的置信度；根据第一置信度阈值和获取到的检测框的置信度，确定正样本和负样本；根据正样本和负样本对第一检测模型进行训练，得到第二检测模型。

其中，检测框用于表征图片中对象的位置。第一检测模型为初始检测模型或者为当前的检测模型。正样本包括第一检测框和N帧图片中包括第一检测框的图片，负样本包括第二检测框和N帧图片中包括第二检测框的图片。第一检测框为置信度高于第一置信度阈值的检测框，第二检测框为置信度低于第一置信度阈值的检测框；第一置信度阈值大于第一检测模型对应的置信度阈值。

在一种实施方式中，训练模块102，还用于：确定第一检测模型的检测能力和第二检测模型的检测能力；在确定第二检测模型的检测能力优于第一检测模型的检测能力的情况下，确定第二检测模型对应的置信度阈值，第二检测模型用于对后续采集到的图片的检测；在确定第一检测模型的检测能力优于第二检测模型的检测能力的情况下，重新确定正样本和负样本；根据重新确定的正样本和负样本，对第一检测模型进行训练。

另一种实施方式中，训练模块102，具体用于：获取M帧图片；将M帧图片输入到第一检测模型，进行对象检测处理，得到每帧图片中检测框的第一置信度；将M帧图片输入到第二检测模型，进行对象检测处理，得到每帧图片中检测框的第二置信度；确定第一数量和第二数量。其中，M帧图片为在线采集的图片，M帧图片与N帧图片不同，M为正整数。第一数量为第一置信度高于第一检测模型对应的置信度阈值的检测框的数量。第二数量为第二置信度高于第一检测模型对应的置信度阈值的检测框的数量。第一数量用于表征第一检测模型的检测能力，第二数量用于表征第二检测模型的检测能力。

其中，确定第一检测模型的检测能力优于第二检测模型的检测能力，包括：若第一数量大于第二数量，则确定第一检测模型的检测能力优于第二检测模型的检测能力。

另一种实施方式中，训练模块102，具体用于：确定重新确定的正样本包括负样本中满足预设条件的样本和正样本；确定重新确定的负样本包括负样本中除满足预设条件的样本以外的其他样本。

另一种实施方式中，图片处理模块101，具体用于：获取在线采集到的初始图片；对初始图片去冗余处理，得到目标图片；目标图片包括N帧图片和M帧图片。

另一种实施方式中，图片处理模块101，具体用于：将初始图片输入到当前的检测模型，进行对象检测处理，得到每帧初始图片中检测框；对每帧初始图片执行第一操作，以得到目标图片。其中，第一操作包括：若第i帧初始图片中检测框与对应的第i-1帧初始图片中检测框之间的重叠度大于预设重叠度阈值，则删除第i帧初始图片。i∈[1，K]，K等于初始图片的数量。

另一种实施方式中，图片处理模块101，具体用于：将初始图片输入到当前的检测模型，进行对象检测处理，得到每帧初始图片中检测框、以及每帧初始图片对应的中间特征图；对每帧初始图片执行第一操作，以得到待选图片；在待选图片的数量大于第一预设阈值的情况下，根据待选图片和待选图片对应的中间特征图确定待选图片中检测框的特征，并根据待选图片中检测框的特征，对待选图片去冗余处理，得到目标图片。

其中，第一操作包括：若第i帧初始图片中检测框与对应的第i-1帧初始图片中检测框之间的重叠度大于预设重叠度阈值，则删除第i帧初始图片。i∈[1，K]，K等于初始图片的数量。

另一种实施方式中，图片处理模块101，具体用于：针对每帧待选图片执行以下步骤，以确定待选图片中检测框的特征：按照待选图片和待选图片对应的中间特征图之间的尺寸比值，对待选图片和待选图片中检测框进行缩放，得到缩放后的待选图片和缩放后的检测框；确定缩放后的检测框在待选图片对应的中间特征图中的位置是缩放后的检测框在缩放后的待选图片中的位置；对待选图片对应的中间特征图池化处理，得到待选图片对应的中间特征图的特征向量；根据缩放后的检测框在待选图片对应的中间特征图中的位置，从待选图片对应的中间特征图的特征向量中确定待选图片中检测框的特征。

另一种实施方式中，图片处理模块101，具体用于：对待选图片中检测框的特征进行聚类，得到至少一个第一检测框集合；根据待选图片中检测框的特征、以及至少一个第一检测框集合，计算每一帧待选图片中检测框与所属的第一检测框集合的类中心之间的距离的平均值；按照平均值，从待选图片进行删除，得到目标图片；其中，目标图片的平均值大于待选图片中除目标图片以外的其他图片的平均值；目标图片的数量等于第一预设阈值。

当然，本申请实施例提供的检测模型的处理装置100包括但不限于上述模块。

本申请另一实施例还提供一种检测模型的处理装置。如图13所示，检测模型的处理装置110包括存储器111和处理器112；存储器111和处理器112耦合；存储器111用于存储计算机程序代码，计算机程序代码包括计算机指令。其中，当处理器112执行计算机指令时，使得检测模型的处理装置110执行上述方法实施例所示的方法流程中检测模型的处理装置执行的各个步骤。

在实际实现时，图片处理模块101和训练模块102可以由图13所示的处理器112调用存储器111中的计算机程序代码来实现。其具体的执行过程可参考图4-图6和图9-图10中任一附图所示的检测模型的处理方法部分的描述，这里不再赘述。

本申请另一实施例还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机指令，当计算机指令在检测模型的处理装置上运行时，使得检测模型的处理装置执行上述方法实施例所示的方法流程中检测模型的处理装置执行的各个步骤。

本申请另一实施例还提供一种芯片系统，该芯片系统应用于检测模型的处理装置。所述芯片系统包括一个或多个接口电路，以及一个或多个处理器。接口电路和处理器通过线路互联。接口电路用于从检测模型的处理装置的存储器接收信号，并向处理器发送所述信号，所述信号包括所述存储器中存储的计算机指令。当处理器执行计算机指令时，检测模型的处理装置执行上述方法实施例所示的方法流程中检测模型的处理装置执行的各个步骤。

在本申请另一实施例中，还提供一种计算机程序产品，该计算机程序产品包括指令，当指令在检测模型的处理装置上运行时，使得检测模型的处理装置执行上述方法实施例所示的方法流程中检测模型的处理装置执行的各个步骤。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时，可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时，全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如，软盘、硬盘、磁带)，光介质(例如，DVD)、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

以上所述，仅为本申请的具体实施方式。熟悉本技术领域的技术人员根据本申请提供的具体实施方式，可想到变化或替换，都应涵盖在本申请的保护范围之内。

Claims

1.一种检测模型的处理方法，其特征在于，所述方法包括：

获取N帧图片；所述N帧图片为在线采集的图片，N为正整数；

将所述N帧图片输入到第一检测模型，进行对象检测处理，得到每帧图片中检测框的置信度；所述检测框用于表征图片中对象的位置；第一检测模型为初始检测模型或者为当前的检测模型；

根据第一置信度阈值和获取到的检测框的置信度，确定正样本和负样本；所述正样本包括第一检测框和所述N帧图片中包括所述第一检测框的图片，所述负样本包括第二检测框和所述N帧图片中包括所述第二检测框的图片；所述第一检测框为置信度高于所述第一置信度阈值的检测框，所述第二检测框为置信度低于所述第一置信度阈值的检测框；所述第一置信度阈值大于所述第一检测模型对应的置信度阈值；

根据所述正样本和所述负样本对所述第一检测模型进行训练，得到第二检测模型；

获取M帧图片；所述M帧图片为在线采集的图片，所述M帧图片与所述N帧图片不同，M为正整数；

将所述M帧图片输入到所述第一检测模型，进行对象检测处理，得到每帧图片中检测框的第一置信度；

将所述M帧图片输入到所述第二检测模型，进行对象检测处理，得到每帧图片中检测框的第二置信度；

确定第一数量和第二数量；所述第一数量为第一置信度高于所述第一检测模型对应的置信度阈值的检测框的数量；所述第二数量为第二置信度高于所述第一检测模型对应的置信度阈值的检测框的数量；所述第一数量用于表征所述第一检测模型的检测能力，所述第二数量用于表征所述第二检测模型的检测能力；

若所述第一数量大于所述第二数量，则确定所述第一检测模型的检测能力优于所述第二检测模型的检测能力；

在确定所述第二检测模型的检测能力优于所述第一检测模型的检测能力的情况下，确定所述第二检测模型对应的置信度阈值，所述第二检测模型用于对后续采集到的图片的检测；

在确定所述第一检测模型的检测能力优于所述第二检测模型的检测能力的情况下，重新确定正样本和负样本；根据重新确定的正样本和负样本，对所述第一检测模型进行训练。

2.根据权利要求1所述的方法，其特征在于，所述在确定所述第一检测模型的检测能力优于所述第二检测模型的检测能力的情况下，重新确定正样本和负样本，包括：

确定所述重新确定的正样本包括所述负样本中满足预设条件的样本和所述正样本；

确定所述重新确定的负样本包括所述负样本中除满足所述预设条件的样本以外的其他样本。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取在线采集到的初始图片；

对所述初始图片去冗余处理，得到目标图片；所述目标图片包括所述N帧图片和所述M帧图片。

4.根据权利要求3所述的方法，其特征在于，所述对所述初始图片去冗余处理，得到目标图片，包括：

将所述初始图片输入到所述当前的检测模型，进行对象检测处理，得到每帧所述初始图片中检测框；

对每帧所述初始图片执行第一操作，以得到目标图片；其中，所述第一操作包括：若第i帧初始图片中检测框与对应的第i-1帧初始图片中检测框之间的重叠度大于预设重叠度阈值，则删除所述第i帧初始图片；i∈[1，K]，K等于所述初始图片的数量。

5.根据权利要求3所述的方法，其特征在于，所述对所述初始图片去冗余处理，得到目标图片，包括：

将所述初始图片输入到所述当前的检测模型，进行对象检测处理，得到每帧所述初始图片中检测框、以及每帧所述初始图片对应的中间特征图；

对每帧所述初始图片执行第一操作，以得到待选图片；其中，所述第一操作包括：若第i帧初始图片中检测框与对应的第i-1帧初始图片中检测框之间的重叠度大于预设重叠度阈值，则删除所述第i帧初始图片；i∈[1，K]，K等于所述初始图片的数量；

在所述待选图片的数量大于第一预设阈值的情况下，根据所述待选图片和所述待选图片对应的中间特征图确定所述待选图片中检测框的特征，并根据所述待选图片中检测框的特征，对所述待选图片去冗余处理，得到所述目标图片。

6.根据权利要求5所述的方法，其特征在于，所述根据所述待选图片和所述待选图片对应的中间特征图确定所述待选图片中检测框的特征，包括：

针对每帧所述待选图片执行以下步骤，以确定所述待选图片中检测框的特征：

按照所述待选图片和所述待选图片对应的中间特征图之间的尺寸比值，对所述待选图片和所述待选图片中检测框进行缩放，得到缩放后的待选图片和缩放后的检测框；

确定所述缩放后的检测框在所述待选图片对应的中间特征图中的位置是所述缩放后的检测框在所述缩放后的待选图片中的位置；

对所述待选图片对应的中间特征图池化处理，得到所述待选图片对应的中间特征图的特征向量；

根据所述缩放后的检测框在所述待选图片对应的中间特征图中的位置，从所述待选图片对应的中间特征图的特征向量中确定所述待选图片中检测框的特征。

7.根据权利要求5所述的方法，其特征在于，所述根据所述待选图片中检测框的特征，对所述待选图片去冗余处理，得到所述目标图片，包括：

对所述待选图片中检测框的特征进行聚类，得到至少一个第一检测框集合；

根据所述待选图片中检测框的特征、以及所述至少一个第一检测框集合，计算每一帧所述待选图片中检测框与所属的第一检测框集合的类中心之间的距离的平均值；

按照所述平均值，从所述待选图片进行删除，得到所述目标图片；其中，所述目标图片的所述平均值大于所述待选图片中除所述目标图片以外的其他图片的所述平均值；所述目标图片的数量等于所述第一预设阈值。

8.一种检测模型的处理装置，其特征在于，所述装置包括：

图片处理模块，用于获取N帧图片；所述N帧图片为在线采集的图片，N为正整数；

训练模块，用于将所述N帧图片输入到第一检测模型，进行对象检测处理，得到每帧图片中检测框的置信度；根据第一置信度阈值和获取到的检测框的置信度，确定正样本和负样本；根据所述正样本和所述负样本对所述第一检测模型进行训练，得到第二检测模型；

所述图片处理模块，还用于获取M帧图片；所述M帧图片为在线采集的图片，所述M帧图片与所述N帧图片不同，M为正整数；

所述训练模块，还用于将所述M帧图片输入到所述第一检测模型，进行对象检测处理，得到每帧图片中检测框的第一置信度；将所述M帧图片输入到所述第二检测模型，进行对象检测处理，得到每帧图片中检测框的第二置信度；确定第一数量和第二数量；若所述第一数量大于所述第二数量，则确定所述第一检测模型的检测能力优于所述第二检测模型的检测能力；在确定所述第二检测模型的检测能力优于所述第一检测模型的检测能力的情况下，确定所述第二检测模型对应的置信度阈值，所述第二检测模型用于对后续采集到的图片的检测；在确定所述第一检测模型的检测能力优于所述第二检测模型的检测能力的情况下，重新确定正样本和负样本；根据重新确定的正样本和负样本，对所述第一检测模型进行训练；

其中，所述检测框用于表征图片中对象的位置；第一检测模型为初始检测模型或者为当前的检测模型；所述正样本包括第一检测框和所述N帧图片中包括所述第一检测框的图片，所述负样本包括第二检测框和所述N帧图片中包括所述第二检测框的图片；所述第一检测框为置信度高于所述第一置信度阈值的检测框，所述第二检测框为置信度低于所述第一置信度阈值的检测框；所述第一置信度阈值大于所述第一检测模型对应的置信度阈值；所述第一数量为第一置信度高于所述第一检测模型对应的置信度阈值的检测框的数量；所述第二数量为第二置信度高于所述第一检测模型对应的置信度阈值的检测框的数量；所述第一数量用于表征所述第一检测模型的检测能力，所述第二数量用于表征所述第二检测模型的检测能力。

9.一种检测模型的处理装置，其特征在于，所述装置包括存储器和处理器；所述存储器和所述处理器耦合；所述存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令；

其中，当所述处理器执行所述计算机指令时，使得所述装置执行如权利要求1-7中任意一项所述的检测模型的处理方法。