CN116630950A

CN116630950A - 一种高精度识别轮辋焊缝的方法

Info

Publication number: CN116630950A
Application number: CN202310912754.3A
Authority: CN
Inventors: 李忠涛; 李雅其; 郭庆北; 张玉璘
Original assignee: University of Jinan
Current assignee: University of Jinan
Priority date: 2023-07-25
Filing date: 2023-07-25
Publication date: 2023-08-22

Abstract

本发明提出了一种高精度识别轮辋焊缝的方法，涉及轮辋焊缝定位技术领域。本发明提出L1_SelfAttention模块，该模块是基于L1范数的自注意力机制，将该模块引入到基于Transformer的目标检测算法中，提高轮辋焊缝的识别效率。使用工业摄像头采集轮辋数据集，并标注数据集，将数据集分为训练集和预测集。使用改进的基于Transformer的目标检测算法DETR进行模型训练，通过多轮训练提高模型的效果，并进行模型转化，将模型部署到具有开发功能的开发板上，开发板连接摄像头，实时对轮辋焊缝进行识别和定位，相较人工识别定位轮辋焊缝，算法识别能达到较高的准确率和效率，并缩短检测时间，节省人力资源。

Description

一种高精度识别轮辋焊缝的方法

技术领域

本发明涉及轮辋焊缝定位技术领域，具体为一种高精度识别轮辋焊缝的方法。

背景技术

在车轮生产线中，传统的轮辋缺陷由人工进行筛选，这就导致了筛选效率低和出错率高的问题。随着计算机视觉技术的不断更迭，目标检测在工业领域应用的方面也越来越广，使用目标检测方法能够对轮辋焊缝进行高效的定位，以便后续对焊缝进行气密性检测，节省人力资源的同时提高了焊缝识别效率。

Transformer的引入为目标检测带来了新的思路。传统的目标检测算法侧重于从图像中提取局部特征，Transformer则凭借其出色的自注意力机制可以捕捉图像像素的全局上下文信息，且不需要使用滑动窗口或选择性搜索，这使得Transformer在目标检测任务中具有更好的感知能力和语义理解能力，而自注意力机制使用到了大量的乘法，这就导致处理图像时需要耗费大量的内存与时间。

发明内容

本发明提供一种高精度识别轮辋焊缝的方法，采用基于Transformer的目标检测算法进行识别，优化Transformer自注意力机制，高效识别轮辋焊缝，以便完成后续轮辋的气密性检测工作，为实现上述目的，本发明提供如下技术方案：一种高精度识别轮辋焊缝的方法，包括以下步骤：

S1、使用工业摄像头采集轮辋图像数据集，对数据集进行标注，将数据集划分为训练集和预测集；

S2、设计高效的L1_SelfAttention模块，将该模块引入到基于Transformer的目标检测算法中，提高识别效率。该模块是基于L1范数的自注意力机制，使用加法替换自注意力机制中大量的乘法；

S3、将数据集输入到改进的基于Transformer的目标检测算法中进行训练，通过多轮训练优化模型的效果；

S4、进行模型转化，并将其部署到具有开发功能的开发板上，开发板连接摄像头，实时对轮辋焊缝进行识别和定位。

优选的，步骤S1中使用工业摄像头采集轮辋图像数据集，对数据集进行标注，将数据集划分为训练集和预测集，其特征在于，包括将轮辋放置于可旋转的转台上，工业摄像头置于转台上方采集视频，后期对视频进行抽帧操作，抽取不同位置焊缝的轮辋图片组成数据集，随后使用python程序按照比例将数据集随机划分到训练集和预测集中，为保证检测的精确度和鲁棒性，要在不同光照下采集多种类型的轮辋图片。

优选的，步骤S2中设计高效的L1_SelfAttention模块，将该模块引入到基于Transformer的目标检测算法中，提高识别效率。该模块是基于L1范数的自注意力机制，使用加法替换自注意力机制中大量的乘法，其特征在于，包括：

S21、输入图像序列经过线性变换得到查询矩阵（Query）、键矩阵（Key）和值矩阵（Value），三者维度都是[B，N，C]；

S22、在传统的Transformer中，查询矩阵（Query）、键矩阵（Key）通过矩阵乘法进行计算，在L1_SelfAttention模块，使用加法运算，作替换掉自注意力机制中大量复杂的乘法操作；

S23、查询向量，计算其与对应键向量的L1范数距离。使用L1范数距离计算两者的相似度分数：，表示Query与Key之间的L1范数运算。使用L1范数来度量查询向量与键向量之间的距离（自注意力分数），L1范数是指两个向量中对应元素差值的绝对值之和；

S24、查询向量在维度上，依次求与键向量在维度上向量的L1距离，即对两个向量的对应元素差值取绝对值后求和；

S25、对应注意力机制公式为；

S26、上式中表示使用L1距离来近似表示查询矩阵(Query)与键矩阵 (Key)之间的相似程度，L1距离越小说明两个矩阵越相似，而相似度分数越大表示两个矩阵越相似，则对求得的L1距离进行求反操作。

优选的，步骤S3中将数据集输入到改进的目标检测算法中进行训练，通过多轮训练提高模型的识别准确性，其特征在于，包括根据在验证集上的表现和调优结果，不断迭代训练过程，直到模型在验证集上达到满意的性能水平，通过多轮训练，可以逐步提高改进的目标检测算法的识别准确性，并得到一个在目标检测任务上表现较好的模型。

优选的，步骤S4中进行模型转化，并将其部署到具有开发功能的开发板上，开发板连接摄像头，实时对轮辋焊缝进行识别和定位。其特征在于，包括将训练好的目标检测模型转化为适合部署在开发板上的ONNX（通用的开放式神经网络交换格式）格式，开发相应应用程序，使其能够从摄像头获取视频流，并将视频流输入目标检测模型进行实时目标检测和定位。根据模型的输出结果，在视频流中绘制边界框（Bounding Box）来标识出焊缝的位置。对部署在开发板上的应用程序进行测试和验证，确保目标检测和定位的准确性和稳定性。

与现有技术相比，本发明的有益效果如下：

一种高精度识别轮辋焊缝的方法，本方法提出L1_SelfAttention模块，基于L1范数的自注意力机制，并将其引入到基于Transformer的目标检测算法中，提高了对轮辋焊缝的检测效率和准确率。本方法为保证检测的精确度和鲁棒性，在不同光照下采集了多种类型的轮辋图片。本方法改进的目标检测算法中的自注意力机制去除了大量的乘法操作，因为与廉价的加法运算相比，乘法运算的计算复杂度要高得多。通过多轮的训练，可以逐步提高改进的目标检测算法的识别准确性，并得到一个在目标检测任务上表现较好的模型，相比于人工识别定位轮辋焊缝，算法识别可以达到较高的准确率和效率，并缩短检测时间，节省人力资源。

附图说明

图1为本发明实施例提供的一种高精度识别轮辋焊缝流程图；

图2为本申请实施例提供的L1_SelfAttention模块中Query与Key计算规则；

图3为本发明实施例提供的轮辋焊缝的识别的系统硬件结构图；

图4、图5为本申请实施例提供的改进后的算法模型对轮辋焊缝的识别效果示意图；

具体实施方式

下面将结合本发明的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种高精度识别轮辋焊缝的方法方案：一种高精度识别轮辋焊缝的方法，本方法实施场景描述如下，将轮辋放置于可旋转转台上，工业摄像头置于轮辋正上方，并俯拍轮辋，通过转台旋转多次采集数据集视频得到不同位置焊缝的轮辋图片，图3为本发明实施例提供的轮辋焊缝的识别的系统硬件结构图，只有对焊缝进行精准的定位并控制转台旋转将焊缝转动至指定位置才可进行后续检查轮辋气密性，识别焊缝位置流程如图1所示，包括以下步骤：

S1、使用工业摄像头采集轮辋图像数据集，对数据集进行标注，将数据集划分为训练集和预测集；将轮辋放置于可旋转的转台上，工业摄像头置于转台上方采集视频，后期对视频进行抽帧操作，抽取不同位置焊缝的轮辋图片组成数据集，随后使用python程序按照7:3的比例将数据集随机分到训练集和预测集中，为保证检测的精确度和鲁棒性，要在不同光照下采集多种类型的轮辋图片。采集视频尺寸为1080×960，对其抽帧筛选出其中存在焊缝的轮辋图像，共得到5300张图片，并对筛选出的图像进行人工标记划分，使用标注工具Labelimg将焊缝标注出来；

S2、设计高效的L1_SelfAttention模块，将该模块引入到基于Transformer的目标检测算法DETR中，提高识别效率。该模块是基于L1范数的自注意力机制，使用加法替换自注意力机制中大量的乘法；

S22、对于查询向量，计算其与对应键向量的L1范数距离。使用L1距离计算两者的相似度分数：，表示Query与Key之间的L1范数运算。使用L1范数来度量查询向量与键向量之间的距离。L1范数是指两个向量中对应元素差值的绝对值之和，负号用于将距离转换为相似度分数，score维度与Q和K保持一致；

S23、查询向量在维度上，依次求与K在维度上向量的L1范数距离，即对两个向量的对应元素差值取绝对值后求和，具体运算规则如图2所示，，

S24、对应注意力机制公式为；

S25、上式中表示使用L1范数距离来近似表示查询矩阵(Query)与键矩阵(Key)之间的相似程度，L1距离越小说明两个矩阵越相似，而相似度分数越大表示两个矩阵越相似，则对求得的L1距离进行求反操作；

S3、将数据集输入到改进的目标检测算法中进行训练，通过多轮训练提高模型的识别准确性，其特征在于，包括根据在验证集上的表现和调优结果，不断迭代训练过程，直到模型在验证集上达到满意的性能水平，通过多轮训练，可以逐步提高改进的目标检测算法的识别准确性，并得到一个在目标检测任务上表现较好的模型；

S4、进行模型转化，并将其部署到具有开发功能的开发板上，开发板连接摄像头，实时对轮辋焊缝进行识别和定位。其特征在于，包括将训练好的目标检测模型转化为适合部署在RK3568开发板上的ONNX格式，摄像头连接RK3568开发板并置于轮辋上方俯拍轮辋，开发相应应用程序，使其能够从摄像头获取视频流，并将视频流输入目标检测模型进行实时目标检测和定位。根据模型的输出结果，实时在视频流中显示焊缝位置，请参照图4、图5，本申请实施例提供的改进后的算法模型对轮辋焊缝的识别效果示意图。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种高精度识别轮辋焊缝的方法，应用于轮辋焊缝定位技术领域，其特征在于，包括：S1、使用工业摄像头采集轮辋图像数据集，对数据集进行标注，将数据集分为训练集和预测集；S2、设计高效的L1_SelfAttention模块，将该模块引入到基于Transformer的目标检测算法中，提高识别效率，该模块是基于L1范数的自注意力机制，使用加法替换自注意力机制中大量的乘法；S3、将数据集输入到改进的基于Transformer的目标检测算法中进行训练，通过多轮训练优化模型的效果；S4、进行模型转化，并将其部署到具有开发功能的开发板上，开发板连接摄像头，实时对轮辋焊缝进行识别和定位；步骤S2中所述的设计高效的L1_SelfAttention模块，将该模块引入到基于Transformer的目标检测算法DETR中，提高识别效率，该模块是基于L1范数的自注意力机制，使用加法替换自注意力机制中大量的乘法，对应注意力机制公式为，上式中/>表示使用L1范数距离来近似表示查询矩阵(Query)与键矩阵(Key)之间的相似程度，L1距离越小说明两个矩阵越相似，而相似度分数越大表示两个矩阵越相似，则对求得的L1距离进行求反操作。

2.根据权利要求1所述的一种高精度识别轮辋焊缝的方法，步骤S1中所述使用工业摄像头采集轮辋图像数据集，对数据集进行标注，将数据集分为训练集和预测集，具体为将轮辋放置于可旋转的转台上，工业摄像头置于转台上方采集视频，后期对视频进行抽帧操作，抽取不同位置焊缝的轮辋图片组成数据集，使用python程序按照比例将数据集随机分到训练集和预测集中，为保证检测的精确度和鲁棒性，要在不同光照下采集多种类型的轮辋图片；步骤S3所述将数据集输入到改进的目标检测算法中进行训练，通过多轮训练提高模型的识别准确性，主要根据在验证集上的表现和调优结果，不断迭代训练过程，直到模型在验证集上达到满意的性能水平，通过多轮训练，可以逐步提高改进的目标检测算法的识别准确性，并得到一个在目标检测任务上表现较好的模型；部署S4所述进行模型转化，并将其部署到具有开发功能的开发板上，开发板连接摄像头，实时对轮辋焊缝进行识别和定位，将训练好的目标检测模型转化为适合部署在开发板上的格式，开发相应应用程序，使其能够从摄像头获取视频流，并将视频流输入目标检测模型进行实时目标检测和定位，根据模型的输出结果，实时在视频流中显示焊缝位置。