CN115049611A

CN115049611A - 一种基于改进yolov5的连铸坯裂纹缺陷识别方法

Info

Publication number: CN115049611A
Application number: CN202210665574.5A
Authority: CN
Inventors: 孟祥宁; 刘玉峰
Original assignee: Northeastern University China
Current assignee: Northeastern University China
Priority date: 2022-06-14
Filing date: 2022-06-14
Publication date: 2022-09-13

Abstract

本发明提供一种基于改进yolov5的连铸坯裂纹缺陷识别方法，涉及冶金和图像识别技术领域。该方法首先构建连铸坯裂纹缺陷数据集，并进行标注，得到连铸坯裂纹缺陷数据训练集；再将CBAM模块和yolov5网络模型结合，构建CBAMC3‑yolov5网络模型；然后利用连铸坯裂纹缺陷数据训练集对CBAMC3‑yolov5网络模型进行训练；最后使用训练好的CBAMC3‑yolov5网络模型对待识别的连铸坯裂纹缺陷图像进行裂纹缺陷识别。该方法通过改进yolov5算法并结合连铸坯裂纹缺陷图像数据集，成功识别连铸坯裂纹缺陷图像，得到裂纹缺陷的位置信息与分类信息。解决了人工识别主观性强、工作强度大等明显缺点。

Description

一种基于改进yolov5的连铸坯裂纹缺陷识别方法

技术领域

本发明涉及冶金和图像识别技术领域，尤其涉及一种基于改进yolov5的连铸坯裂纹缺陷识别方法。

背景技术

连铸是炼钢过程中极为重要的一部分。连铸坯裂纹缺陷影响铸坯质量，进而影响钢材质量，造成能源损失与经济损失。目前连铸坯裂纹缺陷识别以人工识别为主，人工识别具有主观性强、效率低、精度低、重复性过高、需要忍受高温恶劣工作环境等明显缺点。

随着基于深度学习目标识别技术的发展，智能识别连铸坯裂纹缺陷满足高效、准确技术要求。基于深度学习目标识别技术目前主要应用于车辆识别、物品识别等领域，极少应用于连铸坯裂纹缺陷识别领域。基于深度学习目标识别算法主要分为基于候选区域的目标识别算法和基于回归的目标识别算法两类。基于候选区域的目标识别算法主要有R-CNN、Fast R-CNN以及Faster R-CNN等。这类方法需要先对感兴趣部分进行标框，导致步骤繁琐、计算量大，不满足高效、准确识别的技术要求。基于候选区域的目标识别算法主要有SSD以及yolo系列等。这类方法同时进行物体的分类与定位，所以计算量减少，准确率提高，满足高效、准确识别的技术要求。其中，yolo系列中，yolov5识别算法方法是最新的识别算法，但是直接使用在连铸坯裂纹缺陷识别中，对于小目标识别效果较差，且背景等因素对识别效果有所干扰。

发明内容

本发明要解决的技术问题是针对上述现有技术的不足，提供一种基于改进yolov5的连铸坯裂纹缺陷识别方法，实现对连铸坯裂纹缺陷的识别。

为解决上述技术问题，本发明所采取的技术方案是：一种基于改进yolov5的连铸坯裂纹缺陷识别方法，包括以下步骤：

步骤1、获取若干连铸坯裂纹缺陷图像；

步骤2、对连铸坯裂纹缺陷图像进行预处理，并构建连铸坯裂纹缺陷数据集；

步骤3、利用图像标注工具的矩形框对连铸坯裂纹缺陷数据集进行标注，将标注后的连铸坯裂纹缺陷数据集随机划分为连铸坯裂纹缺陷数据训练集、连铸坯裂纹缺陷数据测试集和连铸坯裂纹缺陷数据验证集；

对预处理后的每一张图片中裂纹缺陷利用LabelImg进行标注，制作连铸坯裂纹缺陷数据集，并将数据集以7：2：1划分为训练集、测试集与验证集；

步骤4、将CBAM模块和yolov5网络模型结合，对yolov5网络模型进行改进，构建CBAMC3-yolov5网络模型；

步骤4.1、获取yolov5网络模型的原始权重文件，设置CBAMC3-yolov5网络模型需要的迭代次数、学习率和超参数；

步骤4.2、将CBAM模块和yolov5网络模型结合，构建CBAMC3-yolov5网络模型；

选定yolov5网络模型为基础网络，在yolov5网络模型骨干网络中C3模块中最后的标准卷积模块中的向量卷积运算前添加CBAM模块，得到CBAMC3模块，进而得到改进的yolov5网络模型，即CBAMC3-yolov5网络模型；

步骤5、利用连铸坯裂纹缺陷数据训练集对CBAMC3-yolov5网络模型进行训练；

利用训练集训练CBAMC3-yolov5网络模型，通过裂纹图片测试集计算识别准确率，得到最优模型权重；

步骤6、使用训练好的CBAMC3-yolov5网络模型对待识别的连铸坯裂纹缺陷图像进行裂纹缺陷识别，当CBAMC3-yolov5网络模型识别到裂纹缺陷时，用矩形框将其标出，并计算裂纹缺陷置信度；

利用训练后的CBAMC3-yolov5网络模型，识别验证集中连铸坯裂纹缺陷图片，得到连铸坯裂纹缺陷的分类信息与位置信息；当CBAMC3-yolov5网络模型识别出裂纹缺陷时，使用矩形框将其标出。

采用上述技术方案所产生的有益效果在于：本发明提供的一种基于改进yolov5的连铸坯裂纹缺陷识别方法，通过改进yolov5算法并结合连铸坯裂纹缺陷图像数据集，训练算法后成功识别连铸坯裂纹缺陷图像，得到裂纹缺陷的位置信息与分类信息。高效、准确的智能化识别解决了人工识别主观性强、工作强度大等明显缺点。缓解对于大量人力的依赖，提高了连铸坯裂纹缺陷的识别效果。

附图说明

图1为本发明实施例提供的一种基于改进yolov5的连铸坯裂纹缺陷识别方法的流程图；

图2为本发明实施例提供的CBAMC3模块的结构框图；

图3为本发明实施例提供的CBAMC3-yolov5网络模型与yolov5的训练结果对比图；

图4为本发明实施例提供的CBAMC3-yolov5网络模型识别裂纹的结果图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

本实施例中，一种基于改进yolov5的连铸坯裂纹缺陷识别方法，如图1所示，包括以下步骤：

步骤1、获取若干连铸坯裂纹缺陷图像；

本实施例通过照相机拍摄获取连铸坯裂纹缺陷图像，对图像进行随机旋转，随机改变亮度、对比度及锐度扩展图像数量，收集3000张连铸坯裂纹缺陷图像；

本实施例利用python对连铸坯裂纹缺陷数据集进行预处理；通过图片灰度化，数据归一化及图片去噪提升图像整体质量；

步骤4、对yolov5网络模型进行改进，构建CBAMC3-yolov5网络模型；

CBAM(Convolutional Block Attention Module)模块是一种结合了空间(spatial)和通道(channel)的注意力模块，包括通道注意力模块和空间注意力模块。CBAM模块将更多注意力分配给需要关注的地方，从而增加识别准确度；

通道注意力模块定义如下：

其中，M_c(F)是通道注意图，F为输入的特征图，AvgPool(F)为平均池化特征操作，MaxPool(F)为最大池化特征操作，

为平均池化特征和

为最大池化特征，MLP为隐层的多层感知器，σ为Sigmoid激活函数，W₀和W₁分别为MLP的共享权重；

通道注意图M_c(F)是由平均池化特征操作AvgPool(F)和最大池化特征操作MaxPool(F)，生成平均池化特征

和最大池化特征

分别经过隐层的多层感知器MLP变化后的特征逐元素相加后经过一个Sigmoid激活函数σ得到。

最后，将M_c(F)和输入特征图F做Element-wise乘法操作，生成空间注意力模块需要的输入特征F'。

空间注意力模块定义如下：

将通道注意力模块输出的特征图F'作为本模块的输入特征图；空间注意图M_s(F')是由平均池化特征操作AvgPool(F')和最大池化特征操作MaxPool(F')，生成平均池化特征

和最大池化特征

按照通道维度连接起来，通过卷积核大小为7×7的卷积运算后经过一个Sigmoid激活函数σ得到。最后将该空间注意力图M_s(F')和输入特征图F'做Element-wise乘法操作，得到最终生成的特征。

表示将

和

按照通道维度连接起来。

步骤4.2、构建CBAMC3-yolov5网络模型；

yolov5网络模型可以分为四部分，第一部分为输入端，使用Mosaic数据增强、自适应锚框计算、自适应图片缩放等先进技术，增加图片输入质量。第二部分为主干网络(Backbone)，负责目标的特征提取，由Focus模块、CBS模块、C3模块、SPP模块组成。第三部分为颈部(Neck)网络，主要是对主干网络所提取的特征进行多尺度融合，采用的是PAN模块与FPN模块。第四部分为输出端，使用GIOU做边界框的损失函数同时使用nms非极大值抑制实现识别目标定位，同时实现识别目标分类。

选定yolov5网络模型为基础网络，在yolov5网络模型骨干网络中C3模块中最后的标准卷积模块中的向量卷积运算前添加CBAM模块，得到CBAMC3模块，如图2所示，CBAMC3模块融合了CBAM模块与C3模块，使原有的C3模块中最后的标准卷积模块结合了注意力机制，进而得到改进的yolov5网络模型，即CBAMC3-yolov5网络模型；

在CBAMC3-yolov5网络模型中，将CBAMC3模块替换掉C3模块，充分利用CBAM模块的图像高维特征提取功能，并且通过CBAMC3模块的结构可以使得整个yolov5网络模型更加丰满，显著提升了识别精度；

本实施例中，利用训练集分别训练yolov5网络模型和与CBAMC3-yolov5网络模型，训练结果如图3所示，由图3可以看出，CBAMC3-yolov5网络模型相较于yolov5网络模型，显著提升了裂纹缺陷识别精度。

本实施例，首先搭建深度学习环境：Windows8操作系统，选用Pytorch架构，Pycharm作为编程平台，CPU为Intel(R)Core(TM)i7-6700，Python3.8语言；然后使用训练集对CBAMC3-yolov5网络模型进行训练，并利用训练后的CBAMC3-yolov5网络模型，对待识别连铸坯裂纹缺陷图片进行裂纹识别，得到连铸坯裂纹缺陷的分类信息(裂纹缺陷类型和概率)与位置信息，并用矩形框将裂纹缺陷标出，如图4所示。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims

1.一种基于改进yolov5的连铸坯裂纹缺陷识别方法，其特征在于：

构建连铸坯裂纹缺陷数据集；

对连铸坯裂纹缺陷数据集进行标注，得到连铸坯裂纹缺陷数据训练集；

将CBAM模块和yolov5网络模型结合，构建CBAMC3-yolov5网络模型；

利用连铸坯裂纹缺陷数据训练集对CBAMC3-yolov5网络模型进行训练；

使用训练好的CBAMC3-yolov5网络模型对待识别的连铸坯裂纹缺陷图像进行裂纹缺陷识别。

2.根据权利要求1所述的一种基于改进yolov5的连铸坯裂纹缺陷识别方法，其特征在于：所述方法具体包括以下步骤：

步骤1、获取若干连铸坯裂纹缺陷图像；

步骤5、利用连铸坯裂纹缺陷数据训练集对CBAMC3-yolov5网络模型进行训练；通过裂纹图片测试集计算识别准确率，得到最优模型权重；

步骤6、使用训练好的CBAMC3-yolov5网络模型对待识别的连铸坯裂纹缺陷图像进行裂纹缺陷识别。

3.根据权利要求2所述的一种基于改进yolov5的连铸坯裂纹缺陷识别方法，其特征在于：所述步骤3对预处理后的每一张图片中裂纹缺陷利用LabelImg进行标注，制作连铸坯裂纹缺陷数据集，并将数据集以7：2：1划分为训练集、测试集与验证集。

4.根据权利要求3所述的一种基于改进yolov5的连铸坯裂纹缺陷识别方法，其特征在于：所述步骤4的具体方法为：

步骤4.2、将CBAM模块和yolov5网络模型结合，构建CBAMC3-yolov5网络模型。

5.根据权利要求4所述的一种基于改进yolov5的连铸坯裂纹缺陷识别方法，其特征在于：所述步骤4.2的具体方法为：

选定yolov5网络模型为基础网络，在yolov5网络模型骨干网络中C3模块中最后的标准卷积模块中的向量卷积运算前添加CBAM模块，得到CBAMC3模块，进而得到改进的yolov5网络模型，即CBAMC3-yolov5网络模型。

6.根据权利要求5所述的一种基于改进yolov5的连铸坯裂纹缺陷识别方法，其特征在于：所述CBAM模块是一种结合了空间和通道的注意力模块，包括通道注意力模块和空间注意力模块。

7.根据权利要求6所述的一种基于改进yolov5的连铸坯裂纹缺陷识别方法，其特征在于：所述步骤6利用训练后的CBAMC3-yolov5网络模型，识别验证集中连铸坯裂纹缺陷图片，得到连铸坯裂纹缺陷的分类信息与位置信息；当CBAMC3-yolov5网络模型识别出裂纹缺陷时，用矩形框将其标出，并计算裂纹缺陷的置信度。