CN115082855A

CN115082855A - 基于改进yolox算法的行人遮挡检测方法

Info

Publication number: CN115082855A
Application number: CN202210696966.8A
Authority: CN
Inventors: 韩超; 宣勇
Original assignee: Anhui Polytechnic University
Current assignee: Anhui Polytechnic University
Priority date: 2022-06-20
Filing date: 2022-06-20
Publication date: 2022-09-20

Abstract

本发明涉及一种基于改进YOLOX算法的行人遮挡检测方法，包括：获取行人遮挡数据集，分为训练集、验证集和测试集；构建YOLOX网络模型；将YOLOX网络模型的主干特征网络融合改进的CBAM模块，加入ASFF自适应特征融合机制模块，得到改进后的YOLOX网络模型；将融合后的特征图通过不同尺寸的YOLO检测头对训练集图像中目标的位置和类别进行预测，得到预测结果，利用损失函数训练改进后的YOLOX网络模型；将验证集输入改进后的YOLOX网络模型中，通过实验训练得到最优权重，对测试集中的图片进行测试，获得最终的检测结果。本发明将YOLOX算法应用到行人遮挡检测中，在原来的特征提取网络上，增加改进的CBAM模块，来增强特征图中的特征，从而得到更有用的特征，能够更好的识别出行人。

Description

基于改进YOLOX算法的行人遮挡检测方法

技术领域

本发明涉及行人检测技术领域，尤其是一种基于改进YOLOX算法的行人遮挡检测方法。

背景技术

随着科技不断的发展，计算机视觉成为国内外学者研究的热点之一。行人检测作为计算机视觉中的一个重要分支，在智能视频监控、无人驾驶以及智能机器人等领域得到广泛的应用。行人检测是通过在图片和视频中检测出行人并得到行人具体位置信息的一种目标检测，与普通的目标检测相比较为复杂。对于普通目标检测而言，物体的形态固定，而行人检测中，行人的形态随时可能会发生变化，增加检测的复杂性。此外，行人检测容易受到环境的影响，如行人被车辆或其他物体遮挡上半身或下半身而使行人结构不完整时，容易产生漏检。

目前，深度学习的行人检测方法已慢慢取代了传统的行人检测方法。深度学习的网络模型可以提取图像中更深层次的特征，并且表示的特征具有较强的表达能力和更好的鲁棒性，可以更好地去解决行人检测问题。芮挺等人在2018年提出一种基于深度卷积神经网络的行人检测方法，该方法利用深度卷积网络模型，对使用现场图像进行行人检测，通过连续dropout策略，在保持网络训练精度的同时，获得更好的泛化能力，从而在行人检测中获得更高的正确率。然而，针对遮挡的行人检测效果不佳。王亚茹等人在2022年提出一种基于注意力机制的遮挡行人检测方法，通过构建新的行人检测器SKGNet，将轻量级的卷积核与注意力模块SKG嵌入到ResNet-101网络中，构建出特征提取网络SKGNet-101，使网络可提取到更关键的特征信息，针对行人遮挡情况，提出掩膜调制模块，来提高遮挡行人的检测精度。此方法只是以交通场景中的行人为例提出的检测方法，数据集较为单一，此外，其使用的注意力机制不太便捷、参数多、计算量大。

由于深度神经卷积在行人检测中可以得到较好的检测效果，越来越多的学者对深度神经网络加以改进，并应用在行人检测中。为了使改进的模型能更好地关注到行人，通常在网络中增加空间注意力机制和通道注意力机制，计算的复杂度也在不断攀升；然而针对行人之间的相互遮挡，行人检测较为困难，同时，行人检测的漏检问题也较为严重。

发明内容

本发明的目的在于提供一种解决被遮挡行人检测精度低且存在漏检问题，能够更好地检测出行人的基于改进YOLOX算法的行人遮挡检测方法。

为实现上述目的，本发明采用了以下技术方案：一种基于改进YOLOX算法的行人遮挡检测方法，该方法包括下列顺序的步骤：

(1)获取行人遮挡数据集，对获取的行人遮挡数据集中的数据进行数据增强处理，再将行人遮挡数据集分为训练集、验证集和测试集；

(2)构建YOLOX网络模型；

(3)将YOLOX网络模型的主干特征网络融合改进的CBAM模块，得到融合后的YOLOX网络模型，将训练集输入融合后的YOLOX网络模型进行特征提取，得到提取的特征，在融合后的YOLOX网络模型的基础上加入ASFF自适应特征融合机制模块，得到改进后的YOLOX网络模型，将提取的特征的权重参数输入改进后的YOLOX网络模型，改进后的YOLOX网络模型对提取的特征进行学习，得到融合后的特征图，将训练集输入改进后的YOLOX网络模型中训练；

(4)将融合后的特征图通过不同尺寸的YOLO检测头来对训练集图像中目标位置和类别进行预测，得到预测结果，利用损失函数训练改进后的YOLOX网络模型；

(5)将验证集输入改进后的YOLOX网络模型中，通过实验训练得到最优权重，对测试集中的图片进行测试，获得最终的检测结果。

在步骤(2)中，所述YOLOX网络模型包括：

特征提取网络Backbone，用于进行特征提取，提取到的特征称作特征层；

加强特征网络Neck，用于对获得的有效特征层采用FPN进行特征融合；

预测网络YOLO Head，用于对特征进行分类和定位，得到最终的预测结果。

在所述步骤(3)中，改进的CBAM模块是一种结合空间注意力和通道注意力的模块，通道域注意力机制中的方程如下：

式中，M_C(F)表示通道注意力特征，F表示原始图像特征；MLP表示为多层感知器，W₁和W₀为MLP的权重，AvgPool表示平均池化，MaxPool表示最大池化，σ表示sigmoid激活函数，

和

分别表示平均池化和最大池化运算；

空间域注意力机制的方程为：

式中，M_S(F)表示空间注意力特征，Conv表示卷积运算，Cat为连接操作；f^7×7表示大小为7×7的卷积运算；

和

分别表示平均池化和最大池化运算；

融合后的YOLOX网络模型进行特征提取，得到的提取特征是通道域注意力机制特征、空间域注意力机制特征和原特征相叠加的特征，叠加的方程为：

式中，F'表示提取特征，M_C(F)表示通道注意力特征，M_S(F)表示空间注意力特征，F表示原始图像特征；

将提取的特征的权重参数输入改进后的YOLOX网络模型，改进后的YOLOX网络模型对提取特征进行学习，得到融合后的特征图，如方程(4)所示：

其中，

为来自不同层的权重参数，

为来自不同特征图的输出，通过融入自适应特征融合机制，对图像高层的语义信息以及对底层的轮廓、边缘、颜色、形状信息进行利用，利用不同尺度的特征进行特征提取。

在步骤(4)中，所述不同尺寸的YOLO检测头的个数为三个，分别用于检测大目标、中目标和小目标，每个检测头拥有一个由解耦头和签分配策略组成的高性能的Anchorfree检测器，输入Anchor free检测器的图片尺寸为N*N，通道数为3，检测输出预测结果(M*M*(4+1+C))，其中，M为不同尺度的特征层预测的结果，4和1分别是预测框的坐标和置信度，C为检测类别。

在步骤(4)中，所述损失函数采用Focal loss损失函数，在Focal loss损失函数中引入α₁平衡因子，平衡正负样本的数量比，如方程(5)所示：

其中，α₁为平衡因子，γ₁为调节因子，加入γ₁减少易分类样本的损失，y是真实样本，Focal loss损失函数使用α₁和γ₁进行综合调控，得到最优权重。

在步骤(5)中，将测试集图片输入训练好的改进后的YOLOX网络模型中，获得最终的检测结果。

由上述技术方案可知，本发明的有益效果为：本发明主要解决的是行人被遮挡情况下的检测精度低且存在漏检的问题，将YOLOX算法应用到行人遮挡检测中，在原来的特征提取网络上，增加改进的CBAM模块，来增强特征图中的特征，从而得到更有用的特征，能够更好的检测出行人。

附图说明

图1为本发明的方法流程图。

具体实施方式

如图1所示，一种基于改进YOLOX算法的行人遮挡检测方法，该方法包括下列顺序的步骤：

(2)构建YOLOX网络模型；

在步骤(2)中，所述YOLOX网络模型包括：

和

分别表示平均池化和最大池化运算；

空间域注意力机制的方程为：

和

分别表示平均池化和最大池化运算；

其中，

为来自不同层的权重参数，

综上所述，本发明主要解决的是行人被遮挡情况下的精度低且存在漏检的问题，将YOLOX算法应用到行人遮挡检测中，在原来的特征提取网络上，增加改进的CBAM模块，来增强特征图中的特征，从而得到更有用的特征，能够更好的识别出行人。

Claims

1.一种基于改进YOLOX算法的行人遮挡检测方法，其特征在于：该方法包括下列顺序的步骤：

(2)构建YOLOX网络模型；

2.根据权利要求1所述的基于改进YOLOX算法的行人遮挡检测方法，其特征在于：在步骤(2)中，所述YOLOX网络模型包括：

3.根据权利要求1所述的基于改进YOLOX算法的行人遮挡检测方法，其特征在于：在所述步骤(3)中，改进的CBAM模块是一种结合空间注意力和通道注意力的模块，通道域注意力机制中的方程如下：

和

分别表示平均池化和最大池化运算；

空间域注意力机制的方程为：

和

分别表示平均池化和最大池化运算；

式中，F′表示提取特征，M_C(F)表示通道注意力特征，M_S(F)表示空间注意力特征，F表示原始图像特征；

其中，

为来自不同层的权重参数，

4.根据权利要求1所述的基于改进YOLOX算法的行人遮挡检测方法，其特征在于：在步骤(4)中，所述不同尺寸的YOLO检测头的个数为三个，分别用于检测大目标、中目标和小目标，每个检测头拥有一个由解耦头和签分配策略组成的高性能的Anchor free检测器，输入Anchor free检测器的图片尺寸为N*N，通道数为3，检测输出预测结果(M*M*(4+1+C))，其中，M为不同尺度的特征层预测的结果，4和1分别是预测框的坐标和置信度，C为检测类别。

5.根据权利要求1所述的基于改进YOLOX算法的行人遮挡检测方法，其特征在于：在步骤(4)中，所述损失函数采用Focal loss损失函数，在Focal loss损失函数中引入α₁平衡因子，平衡正负样本的数量比，如方程(5)所示：

6.根据权利要求1所述的基于改进YOLOX算法的行人遮挡检测方法，其特征在于：在步骤(5)中，将测试集图片输入训练好的改进后的YOLOX网络模型中，获得最终的检测结果。