CN115641469A

CN115641469A - 一种基于GYOLOv5的X光危险物品检测与识别方法

Info

Publication number: CN115641469A
Application number: CN202211261135.4A
Authority: CN
Inventors: 张玲; 徐成武; 李钢; 侯惠超; 续强; 陈太兵; 杨之博
Original assignee: Taiyuan University of Technology
Current assignee: Taiyuan University of Technology
Priority date: 2022-10-14
Filing date: 2022-10-14
Publication date: 2023-01-24

Abstract

本发明提供了一种基于GYOLOv5的X光危险物品检测与识别方法，属于目标检测技术领域；解决了现有X光危险物品检测在复杂背景下检测准确率低、漏检、误检等问题；包括以下步骤：使用人工标注的X光危险物品图像数据作为原始数据进行预处理；设计网络模型参数；加深网络深度，在网络的backbone层，采用连续的几个3×3卷积核替代backbone中较大的卷积核；对构建的基础YOLOv5网络进行改进，改变网络上、下采样层的卷积操作，利用多通道融合卷积块代替传统卷积结构；使用跳跃连接部分低级与高级特征的特征融合方案，对特征重新学习；调整网络参数，生成并保存训练好的危险物品检测模型，将数据输入至训练好的检测模型，输出检测结果；本发明应用于X光危险物品检测。

Description

一种基于GYOLOv5的X光危险物品检测与识别方法

技术领域

本发明提供了一种基于GYOLOv5的X光危险物品检测与识别方法，属于目标检测技术领域。

背景技术

X射线安检技术的非接触式安检设备是应用最广泛的工具，被大量应用于物流领域，以及交通枢纽和一些人员较为密集的公共场所。精准的管制物品自动检测技术是安检领域一个主要的研究方向。由于待检测物品种类繁多，摆放位置可能出现遮挡，因此对检测人员能力要求较高，并且由于检查过程单调、乏味，容易产生人力疲劳，存在误检和漏检的情况，具有较大的安全隐患。目标检测算法主要分为传统的目标检测算法和基于深度学习的目标检测算法。传统方法泛化能力与鲁棒性都较差；深度学习方法目前已有不错的检测效果，比如Faster R-CNN、YOLO v3、YOLO v4、YOLO v5等目标检测网络，有不错的泛化能力，是研究目标检测的主要方向，但仍对复杂背景下的危险物品的检测能力不足，易忽略有效信息，检测精度有待提高。

发明内容

本发明为了解决现有X光危险物品检测在复杂背景下检测准确率低、漏检、误检等问题，提出了一种基于GYOLOv5的X光危险物品检测与识别方法。

为了解决上述技术问题，本发明采用的技术方案为：一种基于GYOLOv5的X光危险物品检测与识别方法，包括以下步骤：

步骤S1：使用人工标注的X光危险物品图像数据作为原始数据进行预处理，得到预处理图片，并将数据集划分为训练集和测试集；

步骤S2：设计网络模型参数：在YOLOv5网络模型的配置文件yaml中，根据计算机内存、显存的大小，用户所需的识别效果和训练速度，设置卷积神经网络输入图像的尺寸、识别种类的数量、迭代次数；且用户需使用支持CUDA加速的显卡类型；

步骤S3：加深网络深度，在网络的backbone层，采用15个连续的3×3卷积核替代backbone中32*32的卷积核；

步骤S4：对构建的基础YOLOv5网络进行改进，改变网络上、下采样层的卷积操作，利用多通道融合卷积块代替传统卷积结构；

其中多通道融合卷积块对特征图分离后分为三个分支S1、S2、S3，分支S1和S2保持特征图与通道数不变，对分支S3进行卷积；之后，对经过卷积操作的特征图与分支S1和分支S2的特征图进行融合；最后，采取多通道融合操作交换特征图各个通道之间的信息，获得的特征图与上层特征图大小相同，对获取的特征图再次进行通道分离、分支卷积、通道拼接与融合操作；

步骤S5：使用跳跃连接将Focus结构的低级与高级特征的特征融合方案，对特征重新学习；

步骤S6：定义检测模型的超参数，利用S1处理后的数据集进行训练，得到损失函数的损失值和检测结果；

步骤S7：根据结果调整网络参数，生成并保存训练好的危险物品检测模型，将测试集数据输入至训练好的危险物品检测模型，对X光安检图像进行检测，输出检测结果。

优选的，步骤S1所述的数据集是阿里云天池危险物品数据集，该数据集中存在5种不同类别的危险品：剪刀、刀具、电池和电源、铁壳打火机、黑钉打火机；数据集中总共有8000张图像，其中包含危险品的图像有3000张，在测试网络模型的有效性的时候，是通过含有危险品的图像进行测试的。

优选的，步骤S1所述的预处理是将数据通过随机缩放、随机裁剪、随机排布的方式进行拼接，之后通过自适应锚框计算以及自适应图片缩放对数据集进行处理和扩充。

优选的，步骤S2所述的设计网络模型参数为：当选择输入网络的图像尺寸为608*608，batch参数为30，迭代次数epoch为1000，检测物体种类为5时，用户使用三GPU训练模型，至少需要24GB的显存；当选择输入网络的图像尺寸为640*640，batch参数为30，迭代次数epoch为1000，检测物体种类为5时，用户使用三GPU训练模型，至少需要30GB的显存。

优选的，步骤S4所述的多通道融合卷积块用于提取图像的高层特征与低层特征信息，多通道融合卷积块包含2个卷积层、批归一化层和修正线性单元ReLU，该卷积块提取的特征图包含三个通路，第一条通路接CBAM注意力机制对特征图进行特征提取传入下一个卷积块；第二条通路接Transformer注意力机制对特征图进行特征提取传入下一个卷积块；第三条通路进入跳跃连接路径。

优选的，步骤S5所述的使用跳跃连接部分低级与高级特征的特征融合方案：将多通道融合卷积块的第三条通路与网络Neck层UpSample模块的特征图按通道维度进行拼接操作，生成包含局部和高层次阶段的全局上下文信息的特征图。

本发明相对于现有技术具备的有益效果为：本发明基于深度学习技术，提出了一种结合多通道融合卷积块、加深网络深度和跳远连接网络结构的X光安检图像检测模型，有效增强了对X光危险品全局信息和边缘特征的表达，对输入的图像进行自适应特征细化，提升了对危险物品的检测准确率，在与目前深度学习方法的比较中，总体性能更强，具有更高的检测准确率。

附图说明

下面结合附图对本发明做进一步说明。

图1是本发明实施例基于GYOLOv5网络的危险物品检测方法的流程图。

图2是本发明多通道融合卷积块在上采样阶段的结构示意图。

图3为本发明实施例基于GYOLOv5网络的危险物品检测方法的网络结构示意图。

具体实施方式

如图1至图3所示，参照图1，本发明提出了一种基于GYOLOv5的危险物品检测方法，具体按照以下步骤进行：

步骤S5：使用跳跃连接部分低级与高级特征的特征融合方案，对特征重新学习；

下面依次介绍本发明改进的网络部分。

多通道融合卷积块：在目前的主流检测模型中，许多网络使用高层通道卷积提取图像深层的抽象特征，以获取更好的检测结果。但大量的卷积层堆叠会增加模型的计算量，尤其通道数的增加会导致参数量过大。因此，本发明提出了新的多通道融合卷积块，其结构如图2所示。该模块在对特征图分离后分为三个分支S1、S2、S3，分支S1和S2保持特征图与通道数不变，对分支S3进行卷积；之后，对经过卷积操作的特征图与分支S1和分支S2的特征图进行融合；最后，采取多通道融合操作交换特征图各个通道之间的信息，获得的特征图与上层特征图大小相同，对获取的特征图再次进行通道分离、分支卷积、通道拼接与融合操作；之后，对经过卷积操作的特征图与分支S1与分支S2的特征图进行融合；最后，对其采取通道融合操作交换特征图各个通道之间的信息，增强特征图不同组之间信息的交互。此时，获得的特征图与上层特征图大小相同，对获取的特征图再次进行通道分离、分支卷积、通道拼接与融合操作。通道融合与通道spilt操作不但能够有效减少卷积过程中的计算量，还可以增加不同信道之间信息的交互，有效地提取危险物品的局部特征信息，防止特征冗余造成计算资源的浪费。

加深网络深度：采用连续的几个3×3的卷积核替代backbone中较大的卷积核，对于给定的感受野（与输出有关的输入图片的局部大小），采用堆积的小卷积核是优于采用大的卷积核，因为多层非线性层可以增加网络深度来保证学习更复杂的模式，而且代价还比较小（参数更少）。这样做的主要目的是在保证具有相同感知野的条件下，提升了网络的深度，在一定程度上提升了神经网络的效果。比如，3个步长为1的3×3卷积核的一层层叠加作用可看成一个大小为7的感受野，其参数总量为3×(9×C²)，如果直接使用7×7卷积核，其参数总量为49×C²，这里C指的是输入和输出的通道数。而且3×3卷积核有利于更好地保持图像性质。

本发明提出了的X光危险物品检测与识别方法结合多通道融合卷积块、加深网络深度和跳远连接网络结构的X光安检图像检测模型，有效增强对X光危险品全局信息和边缘特征的表达，对输入的图像进行自适应特征融合和细化，提升对危险物品的检测准确率，建立高效率、高准确率的X光危险物品检测模型，实现对危险物品的实时性有效检测与识别。通过在X光安检图像数据集上进行消融实验，与目前主流的网络进行对比，GYOLOv5在精确率、召回率和mAP等评价指标上均可以达到较优的效果。

关于本发明具体结构需要说明的是，本发明采用的各部件模块相互之间的连接关系是确定的、可实现的，除实施例中特殊说明的以外，其特定的连接关系可以带来相应的技术效果，并基于不依赖相应软件程序执行的前提下，解决本发明提出的技术问题，本发明中出现的部件、模块、具体元器件的型号、相互间连接方式以及，由上述技术特征带来的常规使用方法、可预期技术效果，除具体说明的以外，均属于本领域技术人员在申请日前可以获取到的专利、期刊论文、技术手册、技术词典、教科书中已公开内容，或属于本领域常规技术、公知常识等现有技术，无需赘述，使得本案提供的技术方案是清楚、完整、可实现的，并能根据该技术手段重现或获得相应的实体产品。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于GYOLOv5的X光危险物品检测与识别方法，其特征在于：包括如下步骤：

步骤S1：使用人工标注的X光危险物品图像数据作为原始数据进行预处理，得到数据集，并将数据集划分为训练集和测试集；

步骤S2：构建基础YOLOv5网络模型并配置网络模型参数；

步骤S3：加深网络深度，在基础YOLOv5网络的backbone层，采用多个连续的3×3卷积核替代backbone中的卷积核；

步骤S4：对构建的基础YOLOv5网络进行改进，改变网络上采样层、下采样层的卷积操作，利用多通道融合卷积块代替传统卷积结构；

步骤S5：使用跳跃连接低级与高级特征的特征融合方案，对特征重新学习；

步骤S6：定义检测模型的超参数，利用步骤S1处理后的数据集进行训练，得到损失函数的损失值和检测结果；

步骤S7：根据检测结果调整网络参数，生成并保存训练好的危险物品检测模型，将测试集数据输入至训练好的危险物品检测模型，对X光安检图像进行检测，输出检测结果。

2.根据权利要求1所述的一种基于GYOLOv5的X光危险物品检测与识别方法，其特征在于：所述步骤S1中的数据集采用阿里云天池危险物品数据集，包括5种不同类别的危险品：剪刀、刀具、电池和电源、铁壳打火机、黑钉打火机。

3.根据权利要求1所述的一种基于GYOLOv5的X光危险物品检测与识别方法，其特征在于：步骤S1所述的预处理是将数据通过随机缩放、随机裁剪、随机排布的方式进行拼接，之后通过自适应锚框计算以及自适应图片缩放对数据集进行处理和扩充。

4.根据权利要求1所述的一种基于GYOLOv5的X光危险物品检测与识别方法，其特征在于：所述步骤S2中网络模型参数是通过在YOLOv5网络模型的配置文件中，根据计算机内存、显存的大小，用户所需的识别效果和训练速度，设置卷积神经网络输入图像的尺寸、识别种类的数量、迭代次数；且用户需使用支持CUDA加速的显卡类型。

5.根据权利要求4所述的一种基于GYOLOv5的X光危险物品检测与识别方法，其特征在于：所述步骤S2中的网络模型参数具体为：当选择输入网络的图像尺寸为608*608，batch参数为30，迭代次数epoch为1000，检测物体种类为5时，用户使用三GPU训练模型，至少需要24GB显存；

当选择输入网络的图像尺寸为640*640，batch参数为30，迭代次数epoch为1000，检测物体种类为5时，用户使用三GPU训练模型，至少需要30GB显存。

6.根据权利要求1所述的一种基于GYOLOv5的X光危险物品检测与识别方法，其特征在于：步骤S4所述的多通道融合卷积块用于提取图像的高层特征与低层特征信息，多通道融合卷积块包含2个卷积层、批归一化层和修正线性单元ReLU，多通道融合卷积块提取的特征图包含三个通路，第一条通路接CBAM注意力机制对特征图进行特征提取传入下一个卷积块；第二条通路接Transformer注意力机制对特征图进行特征提取传入下一个卷积块；第三条通路进入跳跃连接路径。

7.根据权利要求1所述的一种基于GYOLOv5的X光危险物品检测与识别方法，其特征在于：步骤S5所述的使用跳跃连接将Focus结构的低级与高级特征的特征融合方案：将多通道融合卷积块的第三条通路与网络Neck层卷积块的特征图按通道维度进行拼接操作，生成包含局部和高层次阶段的全局上下文信息的特征图。