CN112801934A

CN112801934A - 一种基于图像序列上下文信息的候选框选择方法

Info

Publication number: CN112801934A
Application number: CN202011391596.4A
Authority: CN
Inventors: 袁夏; 王亚宁; 赵春霞
Original assignee: Nanjing University of Science and Technology
Current assignee: Nanjing University of Science and Technology
Priority date: 2020-12-02
Filing date: 2020-12-02
Publication date: 2021-05-14

Abstract

本发明公开了一种基于图像序列上下文信息的候选框选择方法，包括以下步骤：首先对于当前帧及其相邻的前后帧得到的所有候选框按类别标签进行分类，然后遍历当前帧中的每一个候选框，对当前帧的每一个候选框分别在其前一帧和后一帧中找到所有与其类别相同的候选框，计算它与这些候选框的交并比，并根据交并比的结果对其置信度进行重新评分，如果交并比大于预设阈值，则相应提高其置信度得分。反之，则降低其置信度评分。最后根据新的置信度得分来选择候选框。通过这种基于图像序列上下文信息对当前帧候选框重新打分的方法选择候选框，可以有效地降低目标检测过程中漏检和错检的发生，提高了检测的准确率。

Description

一种基于图像序列上下文信息的候选框选择方法

技术领域

本发明属于图像目标检测领域，特别是一种基于图像序列上下文信息的候选框选择方法。

背景技术

基于深度学习方法的图像目标检测方法通过对单张图像进行检测时会产生很多候选框，这些候选框通过网络预测得到的置信度进行筛选，大于置信度阈值的保留，小于置信度阈值的则删除，最终得到目标候选框。但是对于图像序列而言，相邻帧之间存在时空上下文关系，如果对于图像序列进行逐帧的检测，则没有用到这种丰富的上下文信息，容易造成漏检和错检。

发明内容

本发明的目的在于提供一种基于图像序列上下文信息的候选框选择方法，能够较好的利用图像序列之间的时空关系解决目标检测过程中预测候选框的选择问题。

实现本发明目的的技术解决方案为：

一种基于图像序列上下文信息的候选框选择方法，包括以下步骤：

1、对当前帧及其相邻的前一帧、后一帧检测得到的候选框分别按类别进行分类；

2、遍历当前帧中的每一个候选框，对当前帧的每一个候选框与前一帧和后一帧中同类别的候选框匹配，计算交并比；

3、根据当前帧候选框与前后帧候选框的匹配情况，对当前帧的候选框的置信度进行重打分；

4、对重新评分后的当前帧的候选框按置信度选择保留或去除，输出当前帧的所有的保留下来的候选框。

本发明与现有技术相比，其显著优点为：

1、利用了图像序列的上下文信息，基于相邻帧间的时空关系，对当前帧图像的候选框置信度进行更为合理的重新评分。

2、计算量少，不需要引入额外的信息，仅需要计算当前帧候选框与前一帧和后一帧候选框的交并比，就可以根据公式转换得到新的置信度评分。

附图说明

图1为本发明一种基于图像序列上下文信息的候选框选择方法流程图。

具体实施方式

本发明的主要过程是，在图像序列目标检测的候选框选择过程中，根据图像序列中当前帧与邻近的前后帧之间预测候选框的交并比，对当前候选框的置信度进行重新评分并对根据得分对候选框进行选择。

下面结合说明书附图对本发明作进一步说明。

如图1所示，本发明一种基于图像序列上下文信息的候选框选择方法，包括以下步骤：

步骤1、对当前帧及其相邻的前一帧、后一帧检测得到的候选框分别按类别进行分类。设图像序列每一帧检测的所有候选框的集合对应一个特征矩阵，

设特征矩阵的形式为

其大小为 N*(C+4)，N为特征图包含的候选框个数，C为检测的类别总数，特征矩阵每一行对应一个候选框，每个候选框形式为：

W＝[x₁，y₁，x₂，y₂，s₁，s₂，…s_C]因为候选框为矩形框，左上角顶点和右下角顶点对应的直角坐标分别为(x₁，y₁)，(x₂，y₂)，s₁，s₂，s₃，...s_C为该候选框对应的C个类别的置信度得分，大小范围[0，1]。从C个类别中选择置信度得分最高的类别作为其对应的预测类别，则每个候选框对应的形式为 [x₁，y₁，x₂，y₂，i，s_i]，1≤i≤C，然后将这一帧的所有候选框按照预测类别进行分类，并按照类别顺序排列。

步骤2、设候选框w1对应的坐标为(a₁.b₁)和(a₂，b₂)，候选框w₂对应的坐标为 (a₃，b₃)和(a₄，b₄)，则两个框的交并比IoU计算公式如下：

对当前帧的每一个候选框，分别根据公式计算它与前一帧及后一帧每一个同类别候选框的交并比，并记录与前一帧及后帧候选框交并比的最大值，记为μ₁，μ₂；

步骤3、根据当前帧候选框与前后帧候选框的匹配情况，对当前帧的所有候选框的置信度进行重打分。设当前帧候选框对应的置信度为conf₁，重新评分后的置信度为conf₂，计算公式如下

conf₂＝conf₁*(1+max(0，u₁)*max(0，u₂))

步骤4、设置信度阈值为λ(0.4≤λ≤0.6)，若当前帧候选框的置信度 conf₂≥λ，则将候选框保留；反之，将候选框删除。最后输出当前帧所有保留下来的候选框集合对应的特征矩阵。

Claims

1.一种基于图像序列上下文信息的候选框选择方法，其特征在于，包括以下步骤：

2、遍历当前帧中的每一个候选框，将当前帧的每一个候选框与前一帧和后一帧中同类别的候选框匹配，计算交并比；

2.根据权利要求1所述的基于图像序列上下文信息的候选框选择方法，其特征在于，步骤1中，设图像序列每一帧检测的所有候选框的集合对应一个特征矩阵，设特征矩阵的形式为

其大小为N*(C+4)，N为特征图包含的候选框个数，C为检测的类别总数，特征矩阵每一行对应一个候选框，每个候选框形式为：

W＝[x₁,y₁,x₂,y₂,s₁,s₂,…s_C]，候选框为矩形框，左上角顶点和右下角顶点对应的直角坐标分别为(x₁,y₁),(x₂,y₂),s₁,s_2,s_3,…s_C为该候选框对应的C个类别的置信度得分，大小范围[0,1]；从C个类别中选择置信度得分最高的类别作为其对应的预测类别,则每个候选框对应的形式为[x₁,y₁,x₂,y₂,i,s_i],1≤i≤C,然后将这一帧的所有候选框按照预测类别进行分类，并按照类别顺序排列。

3.根据权利要求1所述的基于图像序列上下文信息的候选框选择方法，其特征在于，步骤2中，设候选框w₁对应的坐标为(a₁,b₁)和(a₂,b₂)，候选框w₂对应的坐标为(a₃,b₃)和(a₄,b₄)，则两个框的交并比IoU计算公式如下：

根据计算公式，对当前帧的每一个候选框，分别计算它与前一帧及后一帧每一个同类别候选框的交并比，并记录与前一帧及后一帧候选框交并比的最大值，记为μ₁，μ₂。

4.根据权利要求1所述的基于图像序列上下文信息的候选框选择方法，其特征在于，步骤3中，根据当前帧候选框与前后帧候选框的匹配情况，对当前帧的候选框的置信度进行重打分：设当前帧候选框对应的置信度为conf₁，重新评分后的置信度为conf₂，计算公式如下

conf₂＝conf₁*(1+max(0,u₁)*max(0,u₂))。

5.根据权利要求1所述的基于图像序列上下文信息的候选框选择方法，其特征在于：步骤4中，设置信度阈值为λ(0.4≤λ≤0.6)，若当前帧候选框的置信度conf₂≥λ,则将候选框保留；反之，将候选框删除；最后输出当前帧所有保留下来的候选框。