CN110472640B

CN110472640B - 一种目标检测模型预测框处理方法及装置

Info

Publication number: CN110472640B
Application number: CN201910753422.9A
Authority: CN
Inventors: 王子彤; 姜凯; 秦刚
Original assignee: Shandong Inspur Scientific Research Institute Co Ltd
Current assignee: Shandong Inspur Scientific Research Institute Co Ltd
Priority date: 2019-08-15
Filing date: 2019-08-15
Publication date: 2022-03-15
Anticipated expiration: 2039-08-15
Also published as: CN110472640A

Abstract

本发明公开了一种目标检测模型预测框处理方法及装置，属于图像识别目标检测领域，本发明要解决的技术问题为如何消除由于预测框遮挡造成的同一种类不同个体的预测框被错误剔除现象，提高目标检测算法结果的精确度，技术方案为：该方法步骤如下：S1、经过多层卷积神经网络，目标检测模型给出待预测所有种类的全部预测框坐标及置信度；S2、选择属于同一种类的预测框，对置信度进行由大到小排序，暂存于临时输出框集合；S3、选取置信度最大的框，保存至最终输出框集合；S4、判断同一种类是否完成；S5、选取下一排序置信度的框，计算当前框与上一框的坐标位置交并比IOU，将坐标位置交并比IOU与阀值相比较。本发明还公开了目标检测模型预测框处理装置。

Description

一种目标检测模型预测框处理方法及装置

技术领域

本发明涉及图像识别目标检测领域，具体地说是一种目标检测模型预测框处理方法及装置。

背景技术

基于卷积神经网络与回归方法的深度学习目标检测方法，如YOLO，SSD等，目前已广泛应用于图像、视频数据的特定目标检测任务中。给定输入图像后，模型直接在图像的多个位置上回归出这个位置的目标边框以及目标类别，极大的加快了检测的速度。

非极大值抑制(Non-maximum suppression，NMS)是一种去除非极大值的算法，常用于计算机视觉中的边缘检测、物体识别等。在目标检测算法中，对于同一种类物体的预测框进行NMS，去除多余预测框，得出置信度最大的框坐标。然而在此类目标检测算法中，当同一种类物体的不同个体之间出现遮挡，且遮挡超过NMS阈值时，其中一个预测框会被剔除，使得检测结果精确度大大降低。

数字图像的边缘，通常都是像素值变化剧烈的高频区域，如深度的不连续、表面方向的不连续、物体材料不同、场景中光照不同等都会形成较明显的边缘特征。相对熵(relative entropy)，又被称为Kullback-Leibler散度(Kullback-Leibler divergence)或信息散度(information divergence)，是两个概率分布(probability distribution)间差异的非对称性度量，在信息理论中，相对熵等价于两个概率分布的信息熵(Shannonentropy)的差值。

故如何消除由于预测框遮挡造成的同一种类不同个体的预测框被错误剔除现象，提高目标检测算法结果的精确度是目前现有技术中急需解决的技术问题。

专利号为CN109685152A的专利文献公开了一种基于DC-SPP-YOLO的图像目标检测方法，首先利用数据增强方法对训练图像样本进行预处理并构建训练样本集，采用k-means聚类算法选取用于目标边界框预测的先验候选框；然后将YOLOv2模型的卷积层连接方式由逐层连接改进为密集连接，同时在卷积模块与目标检测层之间引入空间金字塔池化，建立DC-SPP-YOLO目标检测模型；最后以预测值与真实值之间的误差平方和构建损失函数，迭代更新模型权重参数使得损失函数收敛，获得DC-SPP-YOLO模型并用于目标检测。但是该技术方案不能消除由于预测框遮挡造成的同一种类不同个体的预测框被错误剔除现象，提高目标检测算法结果的精确度。

专利号为CN109784349A的专利文献公开了一种图像目标检测模型的建立方法及装置，利用遮挡图像样本进行特征遮挡对抗网络模型的训练，通过特征遮挡对抗网络模型来获得图像样本的遮挡掩码，这样，在进行检测网络模型的训练时，将训练用的图像样本的特征图添加遮挡掩码，该遮挡掩码利用训练好的特征遮挡对抗网络模型获得。但是该技术方案不能消除由于预测框遮挡造成的同一种类不同个体的预测框被错误剔除现象，提高目标检测算法结果的精确度。

发明内容

本发明的技术任务是提供一种目标检测模型预测框处理方法及装置，来解决如何消除由于预测框遮挡造成的同一种类不同个体的预测框被错误剔除现象，提高目标检测算法结果的精确度的问题。

本发明的技术任务是按以下方式实现的，一种目标检测模型预测框处理方法，该方法步骤如下：

S1、经过多层卷积神经网络，目标检测模型给出待预测所有种类的全部预测框坐标及置信度；

S2、选择属于同一种类的预测框，对置信度进行由大到小排序，暂存于临时输出框集合；

S3、选取置信度最大的框，保存至最终输出框集合；

S4、判断同一种类是否完成：

①、若是，则结束当前种类判定；

②、若否，则执行步骤S5；

S5、选取下一排序置信度的框，计算当前框与上一框的坐标位置交并比IOU，将坐标位置交并比IOU与阀值相比较；

S6、遍历完同一种类预测框，得到属于当前种类的全部预测框位置及置信度；

S7、遍历所有种类，得到所有种类的全部预测框位置及置信度。

作为优选，所述步骤S5中将坐标位置交并比IOU与阀值相比较具体步骤如下：

S501、判断坐标位置交并比IOU是否小于阀值一：

①、若是，则认定为同一种类的不同个体，将当前框保存至最终输出框集合，下一步跳转至步骤S3继续选取；

②、若否，则说明二者存在遮挡或者属于同一个体，下一步执行步骤S502；

S502、求得二者重叠区域的边界(直线)表达式，将每个边界的结果进行加权求和，并判断加权和是否大于阀值二：

①、若是，则认定两个预测框属于同一个体，将当前预测框丢弃，下一步跳转至步骤S3继续选取；

②、若否，则说明两个预测框之间有明显边界，属于不同个体或同一个体的不同位置，下一步执行步骤S503；

S503、将大预测框减去小预测框得到二者分布相似度，判断相似度是否大于阀值三：

①、若是，则认定两个预测框属于同一种类的不同个体，将当前框保存至最终输出框集合，下一步跳转至步骤S3继续选取；

②、若否，则认定两个预测框为同一个体的不同位置，将当前预测框丢弃，下一步跳转至步骤S3继续选取；

更优地，所述步骤S502中求得二者重叠区域的边界(直线)表达式，将每个边界的结果进行加权求和的具体如下：

对于每个边界上的点，在两个预测框中沿法线方向取若干像素点进行像素均值计算，得到边界两侧的平均像素值，作差得到边界两侧像素值差值，对每个边界所有点的差值求平方和，即对差值进行距离计算，将每个边界的结果进行加权求和并与阀值二进行比较。

更优地，所述像素点选取3-5个。

更优地，所述步骤S503中将大预测框减去小预测框得到二者分布相似度具体如下：

将大预测框减去小预测框得到预测框差一，将预测框差一缩放至与小预测框同一尺度，以此为蒙板与小预测框进行与操作，得到预测框差二，对预测框差一和预测框差二的像素点进行相对熵KL散度计算，得到二者分布相似度并与阀值三进行比较。

更优地，所述对差值进行距离计算是采用欧式距离计算或余弦距离计算，根据不同的输入图像选取欧式距离计算或余弦距离计算。

更优地，所述阀值一、阀值二、阀值三的选取是根据图像内容的不同进行先验得出。

一种目标检测模型预测框处理装置，该装置包括，

预测框坐标及置信度计算单元，用于经过多层卷积神经网络，目标检测模型给出待预测所有种类的全部预测框坐标及置信度；

置信度排序单元，用于选择属于同一种类的预测框，对置信度进行由大到小排序，暂存于临时输出框集合；

置信度选取单元，用于选取置信度最大的框，保存至最终输出框集合；

同一种类完成度判断，用于判断同一种类是否完成：

坐标位置交并比IOU计算单元，用于选取下一排序置信度的框，计算当前框与上一框的坐标位置交并比IOU，将坐标位置交并比IOU与阀值相比较；

同一种类预测框位置及置信度计算单元，用于遍历完同一种类预测框，得到属于当前种类的全部预测框位置及置信度；

所有种类预测框位置及置信度计算单元，用于遍历所有种类，得到所有种类的全部预测框位置及置信度。

作为优选，所述坐标位置交并比IOU计算单元包括阀值一比较模块，阀值二比较模块以及阀值三比较模块；

其中，阀值一比较模块，用于判断坐标位置交并比IOU是否小于阀值一；

阀值二比较模块，用于将每个边界的结果进行加权求和，并判断加权和是否大于阀值二；

阀值三比较模块，用于将大预测框减去小预测框得到二者分布相似度，判断相似度是否大于阀值三；

更优地，所述将每个边界的结果进行加权求和的具体步骤如下：

求得二者重叠区域的边界(直线)表达式，对于每个边界上的点，在两个预测框中沿法线方向取3-5个像素点进行像素均值计算，得到边界两侧的平均像素值，作差得到边界两侧像素值差值，对每个边界所有点的差值求平方和，即对差值进行欧式距离计算，将每个边界的结果进行加权求和并与阀值二进行比较；

所述将大预测框减去小预测框得到二者分布相似度的具体步骤如下：将大预测框减去小预测框得到预测框差一，将预测框差一缩放至与小预测框同一尺度，以此为蒙板与小预测框进行与操作，得到预测框差二，对预测框差一和预测框差二的像素点进行相对熵KL散度计算，得到二者分布相似度并与阀值三进行比较。

本发明的目标检测模型预测框处理方法及装置具有以下优点：

(一)、本发明通过在目标检测算法中添加边缘提取对比，能够有效消除由于预测框遮挡造成的同一种类不同个体的预测框被错误剔除现象，极大提高了目标检测算法结果的精确度，在强精度需求场景中，极大提升系统稳定性与可靠性；同时通过相对熵KL散度计算，可消除由于同一种类的同一个体在不同位置由于存在较明显边缘而被误判成不同个体的可能；

(二)、本发明通过在目标检测算法中添加边缘提取对比，能够有效消除由于预测框遮挡造成的同一种类不同个体的预测框被错误剔除现象，极大提高了目标检测算法结果的精确度，在强精度需求场景中，极大提升系统稳定性与可靠性，可满足人工智能发展自主研发改进算法的需求，将算法嵌入至其他产品中，提升产品竞争力，提高享誉度。

附图说明

下面结合附图对本发明进一步说明。

附图1为目标检测模型预测框处理方法流程框图；

附图2为预测框遮挡边界示意图；

附图3为预测框相对熵计算预处理示意图。

具体实施方式

参照说明书附图和具体实施例对本发明的一种目标检测模型预测框处理方法及装置作以下详细地说明。

实施例：

如附图1所示，本发明的目标检测模型预测框处理方法,该方法步骤如下：

S3、选取置信度最大的框，保存至最终输出框集合；

S4、判断同一种类是否完成：

①、若是，则结束当前种类判定；

②、若否，则执行步骤S5；

S5、选取下一排序置信度的框，计算当前框与上一框的坐标位置交并比IOU，将坐标位置交并比IOU与阀值相比较；具体如下：

S501、判断坐标位置交并比IOU是否小于阀值一：

S502、求得二者重叠区域的边界(直线)表达式，如附图2所示，对于每个边界上的点，在两个预测框中沿法线方向取3-5个像素点进行像素均值计算，得到边界两侧的平均像素值，作差得到边界两侧像素值差值，对每个边界所有点的差值求平方和，即对差值进行欧式距离计算，根据不同的输入图像还可以选取余弦距离计算，将每个边界的结果进行加权求和，并判断加权和是否大于阀值二：

S503、如附图3所示，将大预测框减去小预测框得到预测框差一，将预测框差一缩放至与小预测框同一尺度，以此为蒙板与小预测框进行与操作，得到预测框差二，对预测框差一和预测框差二的像素点进行相对熵KL散度计算，得到二者分布相似度并判断相似度是否大于阀值三：

其中，阀值一、阀值二、阀值三的选取是根据图像内容的不同进行先验得出。

实施例2：

本发明的目标检测模型预测框处理装置，该装置包括，

同一种类完成度判断，用于判断同一种类是否完成：

坐标位置交并比IOU计算单元，用于选取下一排序置信度的框，计算当前框与上一框的坐标位置交并比IOU，将坐标位置交并比IOU与阀值相比较；坐标位置交并比IOU计算单元包括阀值一比较模块，阀值二比较模块以及阀值三比较模块；

阀值二比较模块，用于将每个边界的结果进行加权求和，并判断加权和是否大于阀值二；具体步骤如下：

阀值三比较模块，用于将大预测框减去小预测框得到二者分布相似度，判断相似度是否大于阀值三；具体步骤如下：将大预测框减去小预测框得到预测框差一，将预测框差一缩放至与小预测框同一尺度，以此为蒙板与小预测框进行与操作，得到预测框差二，对预测框差一和预测框差二的像素点进行相对熵KL散度计算，得到二者分布相似度并与阀值三进行比较。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种目标检测模型预测框处理方法，其特征在于，该方法步骤如下：

S3、选取置信度最大的框，保存至最终输出框集合；

S4、判断同一种类是否完成：

①、若是，则结束当前种类判定；

②、若否，则执行步骤S5；

S5、选取下一排序置信度的框，计算当前框与上一框的坐标位置交并比IOU，将坐标位置交并比IOU与阀值相比较；具体步骤如下：

S501、判断坐标位置交并比IOU是否小于阀值一：

S502、求得二者重叠区域的边界表达式，将每个边界的结果进行加权求和，

并判断加权和是否大于阀值二：

其中，步骤S502中求得二者重叠区域的边界表达式，将每个边界的结果进行加权求和的具体如下：

对于每个边界上的点，在两个预测框中沿法线方向取若干像素点进行像素均值计算，得到边界两侧的平均像素值，作差得到边界两侧像素值差值，对每个边界所有点的差值求平方和，即对边界两侧像素值差值进行距离计算，将每个边界的结果进行加权求和并与阀值二进行比较；

2.根据权利要求1所述的目标检测模型预测框处理方法，其特征在于，所述像素点选取3-5个。

3.根据权利要求2所述的目标检测模型预测框处理方法，其特征在于，所述步骤S503中将大预测框减去小预测框得到二者分布相似度具体如下：

4.根据权利要求3所述的目标检测模型预测框处理方法，其特征在于，所述对差值进行距离计算是采用欧式距离计算或余弦距离计算，根据不同的输入图像选取欧式距离计算或余弦距离计算。

5.根据权利要求4所述的目标检测模型预测框处理方法，其特征在于，所述阀值一、阀值二、阀值三的选取是根据图像内容的不同进行先验得出。

6.一种目标检测模型预测框处理装置，其特征在于，该装置包括，

同一种类完成度判断，用于判断同一种类是否完成：

阀值二比较模块，用于将每个边界的结果进行加权求和，并判断加权和是否大于阀值二；将每个边界的结果进行加权求和的具体步骤如下：

求得二者重叠区域的边界表达式，对于每个边界上的点，在两个预测框中沿法线方向取3-5个像素点进行像素均值计算，得到边界两侧的平均像素值，作差得到边界两侧像素值差值，对每个边界所有点的差值求平方和，即对边界两侧像素值差值进行欧式距离计算，将每个边界的结果进行加权求和并与阀值二进行比较；

7.根据权利要求6所述的目标检测模型预测框处理装置，其特征在于，所述将大预测框减去小预测框得到二者分布相似度的具体步骤如下：将大预测框减去小预测框得到预测框差一，将预测框差一缩放至与小预测框同一尺度，以此为蒙板与小预测框进行与操作，得到预测框差二，对预测框差一和预测框差二的像素点进行相对熵KL散度计算，得到二者分布相似度并与阀值三进行比较。