CN116229191A

CN116229191A - 一种基于归一化角点距离和目标前景信息的目标检测方法

Info

Publication number: CN116229191A
Application number: CN202310241880.0A
Authority: CN
Inventors: 张兆云; 蔡德隆; 赵洋
Original assignee: Dongguan University of Technology
Current assignee: Dongguan University of Technology
Priority date: 2023-03-13
Filing date: 2023-03-13
Publication date: 2023-06-06
Anticipated expiration: 2043-03-13
Also published as: CN116229191B

Abstract

本发明提出一种基于归一化角点距离和目标前景信息的目标检测方法，包括：一、获取训练图像样本和待测图像样本，在训练图像中标注边界框；二、获取边界框的位置及信息；三、计算预测框和目标框的中心点之间的欧氏距离；四、计算预测框和目标框的重叠区域面积；五、计算预测框的面积；六、计算目标框的面积；七、计算预测框和目标框的合并区域面积；八、计算预测框和目标框四个角点之间对应的欧氏距离；九、预测框和目标框的最小闭包矩形区域；十、计算预测框和目标框的交并比；十一、计算归一化角点距离和目标前景信息的边界框损失函数，十二、基于边界框损失函数进行目标检测，本发明能较佳地进行目标检测。

Description

一种基于归一化角点距离和目标前景信息的目标检测方法

技术领域

本发明涉及目标检测技术领域，涉及一种基于归一化角点距离和目标前景信息的目标检测方法。

背景技术

边界框回归是目标检测中的重点，是直接决定目标定位性能的关键一环。特别的是，性能良好的边界框回归损失函数对缓解目标漏检问题起到很大作用。CFIoU损失是一种衡量预测边界框与真实边界框拟合程度的损失函数，相比于传统的IoU损失函数及其衍生版本，CFIoU损失的作用范围更加全面，其可以解决已有的IoU损失函数在中心点重合、两边框的宽高比相同、前景与背景信息判断模式等方面表现出的拟合效果差的问题。该损失可以广泛应用于目标检测算法(如YOLO系列算法和RCNN系列算法等)中的边框回归问题，以提高模型的精度和鲁棒性，从而在实际应用中取得更好的效果。

目前，在目标检测方法中，基于IoU(Intersection over Union)及其衍生版本的边界框回归损失函数应用较为广泛，主要包含IoU损失、GIoU损失、DIoU损失、CIoU损失和EIoU损失。随着不断的改进，这几类损失函数的应用场景越来越广泛。但是，通过研究发现，这几类边界框回归损失函数存在以下两个主要的问题：

(1)基于IoU的衍生版本过度依赖于两框归一化中心点距离从而产生退化问题：

当预测框与目标框存在包含关系时，GIoU会退化为IoU；当预测框与目标框存在包含关系且两边框的中心点重合时，GIoU和DIoU退化为IoU；当预测框与目标框存在包含关系且两边框中心点重合，同时两边框的宽高比相同时，GIoU、DIoU和CIoU退化为IoU。

(2)基于IoU及其衍生版本的边界框损失函数在回归过程中无法区分不同预测框与目标框的相对位置，无法对包含更多背景信息的预测框作出更大力度的惩罚，这也导致损失函数(IoU损失、GIoU损失、DIoU损失、CIoU损失和EIoU损失)忽略了目标前景信息的利用。

发明内容

本发明的内容是提供一种基于归一化角点距离和目标前景信息的目标检测方法，其能够避免两边框中心点重合时所造成的IoU衍生版本的退化问题。

根据本发明的一种边界框回归损失函数的计算方法，其包括以下步骤：

一、获取训练图像样本和待测图像样本，在训练图像中标注边界框；

二、获取边界框的位置及信息：预测框P＝(x^p,y^p,w^p,h^p)，目标框T＝(x^t,y^t,w^t,h^t)；其中，(x^p,y^p)表示预测框P的中心点坐标，w^p,h^p分别表示预测框P的宽、高；(x^t,y^t)表示目标框T的中心点坐标，w^t,h^t分别表示目标框T的宽、高；

三、计算预测框P和目标框T的中心点之间的欧氏距离d；

四、计算预测框P和目标框T的重叠区域面积A_Inter；

五、计算预测框P的面积A_p；

六、计算目标框T的面积A_t；

七、计算预测框P和目标框T的合并区域面积A_Union；

八、计算预测框P和目标框T四个角点之间对应的欧氏距离；

九、预测框P和目标框T的最小闭包矩形区域C；

十、计算预测框P和目标框T的交并比；

十一、计算归一化角点距离和目标前景信息的边界框损失函数；

十二、基于边界框损失函数进行目标检测得到待测图像中每个目标的边界框四个顶点坐标。

作为优选，步骤三中，中心点之间的欧氏距离d的计算方法为：

作为优选，步骤四中，重叠区域面积A_Inter的计算方法为：

A_Inter＝(x₂-x₁)×(y₂-y₁)

其中，

分别表示预测框P宽的1/2和高的1/2；

分别表示目标框T宽的1/2和高的1/2；

表示预测框P的左上角顶点坐标，

表示预测框P的右下角顶点坐标；

表示目标框T的左上角顶点坐标，

表示目标框T的右下角顶点坐标；(x₁,y₁)和(x₂,y₂)分别表示预测框P与目标框T相交框的左上角顶点坐标和右下角顶点坐标。

作为优选，步骤五中，面积A_p的计算方法为：

A_p＝w^p×h^p。

作为优选，步骤六中，面积A_t的计算方法为：

A_t＝w^t×h^t。

作为优选，步骤七中，合并区域面积A_Union的计算方法为：

A_Union＝A_p+A_t-A_Inter。

作为优选，步骤八中，四个角点之间对应的欧氏距离d₁、d₂、d₃、d₄的计算方法为：

作为优选，步骤九中，最小闭包矩形区域C的计算方法为：

(1)计算区域C的宽度w^C：

(2)计算区域C的高度h^C：

(3)计算区域C的对角线距离l^C：

(4)计算最小闭包区域C的面积A_C：A_C＝w^C×h^C。

作为优选，步骤十中，交并比IoU的计算方法为：

作为优选，步骤十一中，边界框损失函数L_CFIoU的计算方法为：

其中，CFIoU是基于归一化角点距离和目标前景信息的IoU度量指标；μ是控制因子。

本发明提出了一种基于归一化角点距离和目标前景信息的边界框回归损失函数用于目标检测，该损失函数利用两个边界框的归一化角点距离取代两边框的中心点距离，可以避免两边框中心点重合时所造成的IoU衍生版本的退化问题；针对基于IoU及其衍生版本的边界框损失函数对于前景区域信息不敏感而导致其无法判断各类预测框好坏的问题，本发明在损失函数中加入了用于挖掘目标前景信息的惩罚项，以此来提高边界框回归损失函数对于目标前景区域信息的关注度。

附图说明

图1为实施例中一种基于归一化角点距离和目标前景信息的目标检测方法的流程图。

具体实施方式

为进一步了解本发明的内容，结合附图和实施例对本发明作详细描述。应当理解的是，实施例仅仅是对本发明进行解释而并非限定。

实施例

如图1所示，本实施例提供了一种基于归一化角点距离和目标前景信息的目标检测方法，其包括以下步骤：

一、获取训练图像样本和待测图像样本，在训练图像中标注边界框，待测图像由已经训练好的模型来预测出边界框信息，是不需要进行人为标注的；

二、获取边框的位置及其相关信息：预测框P＝(x^p,y^p,w^p,h^p)，目标框T＝(x^t,y^t,w^t,h^t)；

其中，(x^p,y^p)表示预测框P的中心点坐标，w^p,h^p分别表示预测框P的宽、高；(x^t,y^t)表示目标框T的中心点坐标，w^t,h^t分别表示目标框T的宽、高；

三、计算预测框P和目标框T的中心点之间的欧氏距离d：

四、计算预测框P和目标框T的重叠区域面积A_Inter：

A_Inter＝(x₂-x₁)×(y₂-y₁)

其中，

分别表示预测框P宽的1/2和高的1/2；

分别表示目标框T宽的1/2和高的1/2；

表示预测框P的左上角顶点坐标，

表示预测框P的右下角顶点坐标；

表示目标框T的左上角顶点坐标，

五、计算预测框P的面积A_p：

A_p＝w^p×h^p

六、计算目标框T的面积A_t：

A_t＝w^t×h^t

七、计算预测框P和目标框T的合并区域面积A_Union：

A_Union＝A_p+A_t-A_Inter

八、计算预测框P和目标框T四个角点之间对应的欧氏距离：

九、预测框P和目标框T的最小闭包矩形区域C：

(1)计算区域C的宽度：

(2)计算区域C的高度：

(3)计算区域C的对角线距离：

(4)计算最小闭包区域C的面积：A_C＝w^C×h^C

十、计算预测框P和目标框T的交并比：

十一、计算归一化角点距离和目标前景信息的边界框损失函数：

其中，CFIoU是基于归一化角点距离和目标前景信息的IoU度量指标；μ是控制因子；

十二、基于边界框损失函数进行目标检测，得到待测图像中每个目标的边界框四个顶点坐标。

本实施例提出了一种基于归一化角点距离和目标前景信息的边界框回归损失函数用于目标检测，该损失函数利用两个边界框的归一化角点距离取代两边框的中心点距离，可以避免两边框中心点重合时所造成的IoU衍生版本的退化问题；针对基于IoU及其衍生版本的边界框损失函数对于前景区域信息不敏感而导致其无法判断各类预测框好坏的问题，本实施例在损失函数中加入了用于挖掘目标前景信息的惩罚项，以此来提高边界框回归损失函数对于目标前景区域信息的关注度。

本实施例所提出的损失可以应用于自动驾驶、智能交通等领域。例如，在自动驾驶领域中，车辆需要精确检测路面上的行人、车辆、路标等障碍物，以保证行车安全。在智能交通领域中，需要对车辆和行人等目标进行快速、准确的识别和跟踪，以实现智能交通系统的高效运行。

以上示意性的对本发明及其实施方式进行了描述，该描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。所以，如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。