CN114861801A

CN114861801A - 基于ai识别的汽车零件检测方法、系统、设备及存储介质

Info

Publication number: CN114861801A
Application number: CN202210520782.6A
Authority: CN
Inventors: 邱芬鹏; 吴先巧; 甘海华
Original assignee: China Unicom Guangdong Industrial Internet Co Ltd
Current assignee: China Unicom Guangdong Industrial Internet Co Ltd
Priority date: 2022-05-12
Filing date: 2022-05-12
Publication date: 2022-08-05

Abstract

本发明提供基于AI识别的汽车零件检测方法、系统、设备及存储介质，方法包括：获取汽车零件的零件号信息；获取汽车零件的图像；根据汽车零件的图像和零件号信息进行分类标注；将分类标注的汽车零件图像划分训练和测试样本数据集；基于EfficientNetV2构建网络模型，将MBConv模块中的SE注意力机制替换为CA注意力机制；对样本数据集进行预处理；将预处理的训练样本数据集输入网络模型，对网络模型进行训练，得到收敛的网络模型；将预处理的测试样本数据集输入收敛的网络模型进行验证，得到识别结果；将待测的汽车零件图像输入收敛的网络模型进行识别得到待测的汽车零件图像的识别结果。本发明将通道注意力与空间注意力联合了起来，更能准确地提取汽车零件的有效特征。

Description

基于AI识别的汽车零件检测方法、系统、设备及存储介质

技术领域

本发明涉及AI技术在工业质检技术领域的应用，尤其是一种基于EfficientNetV2的汽车零件检测方法、系统、设备及存储介质。

背景技术

随着中国汽车行业的高速发展、汽车产量的增加以及汽车零部件市场的扩大，我国汽车零部件行业得到了迅速发展，增长速度整体高于我国整车行业。数据显示，我国汽车零部件的销售收入从2016年3.46万亿元增长至2020年的4.57万亿元，年均复合增长率是7.2％，2021年我国汽车零部件销售收入达4.9万亿元。

由此可见，汽车零件出库入库量数据庞大，汽车零件外形相似且复杂，市面上90％的企业都依靠于人工检查识别入库，花费大量人力物力查验收货效率依旧低下。

面对外形复杂且相似件众多的汽车零件，收货人员都是经过经验识别查验收货入库。极易发生判别错误的情况，比如左右件混淆、零件形状各异难以记忆判别。收货人员的经验技能和工作状态都会很大程度影响零件检查识别的正确率，每次产生新的零件都要花费大量时间组织收货人员培训，费时费力，企业人工成本也会增加。而传统人工智能受到汽车零件外形制约，很少能够有成熟的AI算法应用于此行业中。

在上述的AI识别中，所用到的技术是图像分类，目前常用的图像分类算法有EfficientNet-B7、RegNet和ResNeSt等，但在同等精度的要求下，这些算法训练时间过长，推理速度过慢。面对复杂庞大的汽车零件时，这些算法应用率并不高。

发明内容

本发明旨在克服上述现有技术的至少一种缺陷，提供基于AI识别的汽车零件检测方法、系统、设备及存储介质，用于解决现有技术无法准确识别汽车零件的问题。

第一方面，本发明提供一种基于AI识别的汽车零件检测方法，包括：

获取汽车零件的零件号信息；

获取汽车零件的图像；

根据所获取的汽车零件的图像和零件号进行分类标注；

将分类标注的汽车零件图像划分训练样本数据集和测试样本数据集；

基于EfficientNetV2构建网络模型，将MBConv模块中的SE注意力机制替换为CA注意力机制；

对训练样本数据集和测试样本数据集进行预处理；

将预处理的训练样本数据集输入网络模型，对网络模型进行训练，得到收敛的网络模型；

将预处理的测试样本数据集输入收敛的网络模型进行验证，得到识别结果；

将待测的汽车零件图像输入收敛后的网络模型进行识别得到待测的汽车零件图像的识别结果。

本发明提供的基于AI识别的汽车零件检测方法在获取汽车零件的零件号和图像后，根据所获取的汽车零件号进行分类标注，随后将分类标注的汽车零件图像划分为训练样本数据集和测试样本数据集以待后续的训练和测试操作。基于EfficientNetV2算法针对汽车零件特性进行改进以构建AI算法模型，在不影响训练速度的前提下，提升识别准确率。其中，在EfficientNetV2使用坐标注意力(Coordinate attention，CA)机制代替通道注意力机制。在原MBConv模块中，使用了通道注意力模块，但是通道注意力机制只关注通道信息而忽略了位置信息，汽车零件颜色较为单一但结构复杂繁多，为提取有效特征，需要同时关注位置信息和通道信息，所以本发明使用了坐标注意力代替原有的通道注意力，坐标注意力机制将位置信息嵌入到通道注意力中，将通道注意力与空间注意力联合了起来，更能准确地提取汽车零件的有效特征。网络模型构建完成后，对前述训练样本数据集和测试样本数据集进行预处理，随后将预处理的训练样本数据集输入网络模型，对网络模型进行训练，进而得到收敛的网络模型；再将预处理的测试样本数据集输入收敛的网络模型进行验证，得到识别结果；至此网络模型训练与验证均已完成，将待测的汽车零件图像输入收敛的网络模型进行识别，得到待测的汽车零件图像的识别结果。

其中，CA模块包括残差模块(Residual)、宽度方向全局平均池化模块(X AvgPool)、高度方向全局平均池化模块(Y Avg Pool)、张量拼接和卷积模块(Concat+Conv2d)、批量归一化模块(BatchNorm)、非线性模块(Non-linear)、卷积模块(Conv2d)、激活模块(sigmoid)、重加权模块(Re-weight)。对于输入的特征图，先输入残差模块进行处理后，再分别输入到宽度方向全局平均池化模块(X Avg Pool)、高度方向全局平均池化模块(Y AvgPool)中，分别在宽度和高度这两个方向上进行全局平均池化，接着将这两个特征图通过张量拼接和卷积模块(Concat+Conv2d)拼接起来，并进行卷积，再利用批量归一化模块(BatchNorm)、非线性模块(Non-linear)进行批量归一化、非线性等操作，然后再分别使用卷积模块(Conv2d)对处理后的特征图进行卷积操作，分别得到宽度和高度方向的特征图，接着同时利用sigmoid模块进行sigmoid激活，得到了宽度和高度方向的注意力权重，并将这两个方向的注意力权重与通过残差模块处理后的原特征图输入到重加权模块(Re-weight)进行乘法加权，得到带有宽度和高度两个方向的注意力权重的特征图。

进一步，考虑到汽车零件训练样本数据集存在类别不平衡的问题，本发明使用类平衡损失(ClassBalancedLoss，CBLoss)来构建损失函数。

假设类y有n_y个有效训练样本，类别y的类平衡(CB)softmax交叉熵损失表示为：

其中，z为模型的输出向量，表示为[z₁,z₂,…,z_C]^T，C为类别数，n_y表示类别为y的有效训练样本数量，超参数β为权重调整系数，当为0时，表示没有重新加权，当趋向于1时，表示按照反向频率进行加权。因此，通过构建上述损失函数，利用了每个类别的有效样本数来重新平衡损失，使网络模型的训练过程更有效，更能提高模型的泛化能力和识别准确率。

进一步，将扫描得到的图像进行预处理，为了增加模型的鲁棒性，提高泛化能力，在模型训练之前，需要进行预处理，依次进行水平翻转、镜像翻转、旋转、加入高斯噪声、HSV色彩增强。常规预处理的流程为：依次进行灰度化操作、几何变换操作、图像增强操作，而本申请针对汽车零件图像颜色较为单调的特性，省去了灰度化操作，以此在减少图像数据的损失同时提高了效率。本申请进行了水平翻转、镜像翻转和旋转三个几何变换操作，纠正图像在采集步骤中的系统误差和仪器位置的随机误差；加入高斯噪声、HSV色彩增强两个数据增强操作，提高模型的泛化能力和容错率。

进一步，将预处理的训练样本数据集输入网络模型训练时，采用的是渐进的学习方法，所述渐进的学习方法包括：先使用分辨率较小的汽车零件图像和弱正则化训练网络，逐渐增加图像的分辨率，同时自适应添加更强的正则化使网络模型学习更困难，提高模型泛化能力。

进一步，划分训练样本数据集和测试样本数据集的步骤可以分别使用留出法、k折交叉验证法和自助法。分别进行三种训练样本数据集和测试样本数据集的划分方法，可以对三种方法优劣进行比较，针对不同的数据集选择最佳的方法，可以在避免数据浪费的同时减少性能开销，

进一步，将测试样本数据集输入网络模型后输出的识别结果进行人工复核，所述复核为判断识别结果是否符合零件特性，符合则人工在PDA上确认结果符合，不符合则选择结果不符。后台系统会将该数据记录，后续再针对识别结果是否准确进行模型优化，人工复核可提高识别准确率。

进一步，本发明提供一种基于AI识别的汽车零件检测系统，包括：零件号获取模块，用于获取汽车零件号；图像获取模块，用于获取汽车零件图像；分类标注模块，用于对汽车零件图像进行分类标注；训练样本数据集和测试样本数据集划分模块，用于划分训练样本数据集和测试样本数据集；AI模型构建模块，用于构建AI模型；预处理模块，用于对汽车零件图像进行预处理；图像识别模块，用于对待测汽车零件图像进行识别。

进一步，本发明提供一种基于AI识别的汽车零件检测系统，还包括：后台管理模块，通过图形化界面显示零件识别效率，图片识别速度，识别通过率。

进一步，本发明提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现前述的基于AI识别的汽车零件检测方法。

进一步，本发明提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现前述的基于AI识别的汽车零件检测方法。

与现有技术相比，本发明的有益效果为：

本发明提供的基于AI识别的汽车零件检测方法、系统、设备及存储介质，在复杂仓库收货环境中获取汽车零件的零件号和图像，结合AI智能识别技术实现复杂零件高效识别收货，基于改进EfficientNetV2的汽车零件识别中，使用CA模块代替SE注意力模块，提取出更加有用的特征，并抑制了无效特征，提高识别准确率。引入了CBLoss来构建损失函数，使得模型更具有泛化能力，解决车辆零件外形复杂，且存在较多易混件，现场大件零件堆叠，容易出现识别错误的问题，从而逐步取代人工识别达到AI自动化收货的目的，争取达到收零件像收快递一样简单，实现零件自动化分类识别收货。减低企业综合人力成本，提升收货效率。

附图说明

图1为本发明实施的方法流程图。

图2为本发明实施的改进的EfficientNetV2网络结构图。

图3为本发明实施的Fused-MBConv模块图。

图4为本发明实施的改进的MBConv模块图。

图5为本发明实施的CA模块图。

具体实施方式

本发明附图仅用于示例性说明，不能理解为对本发明的限制。为了更好说明以下实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

实施例1

本实施例提供一种基于AI识别的汽车零件检测方法，应用于汽车零部件仓库复杂的收货环境中，利用便携手持PDA，结合AI智能识别技术实现复杂零件高效识别收货。该方法能够解决汽车零部件外形复杂，且存在较多易混件，现场大件零件堆叠，容易出现识别错误的情况，从而逐步取代人工识别达到AI自动化收货的目的，争取达到收零件像收快递一样简单。

如图1所示，本具体实施例的方法包括以下步骤：

S1.获取汽车零件的零件号信息；

零件号信息可以用PDA扫描汽车零件二维码来获取，现场收货人员利用便携PDA安装识别软件，扫码识别零件号，得出零件基本信息。

S2.获取汽车零件的图像；

所述汽车零件的图像可以用PDA拍摄汽车零件图像；扫码之后进行零件拍照识别，零件需要拍全，如果拍摄图片不满意或达不到识别要求可以点击重拍按钮进行重新拍摄。

S3.根据所获取的汽车零件的图像和零件号进行分类标注；

S4.将分类标注的汽车零件图像划分训练样本数据集和测试样本数据集；

S5.基于EfficientNetV2构建网络模型，将MBConv模块中的SE注意力机制替换为CA注意力机制；

具体的，如图2所示，用于AI识别的网络模型是基于EfficientNetV2算法针对汽车零件特性进行改进以构建的，在不影响训练速度的前提下，能够提升识别准确率。

如图4所示，在EfficientNetV2使用坐标注意力(Coordinate attention，CA)机制代替通道注意力机制。在原MBConv模块中，使用了通道注意力模块，但是通道注意力机制只关注通道信息而忽略了位置信息，汽车零件颜色较为单一但结构复杂繁多，为提取有效特征，应当同时关注位置信息和通道信息，所以本发明使用了坐标注意力代替原有的通道注意力，坐标注意力机制将位置信息嵌入到通道注意力中，将通道注意力与空间注意力联合了起来，更能准确地提取汽车零件的有效特征。

具体的，如图5所示，CA模块包括残差模块(Residual)、宽度方向全局平均池化模块(X Avg Pool)、高度方向全局平均池化模块(Y Avg Pool)、张量拼接和卷积模块(Concat+Conv2d)、批量归一化模块(BatchNorm)、非线性模块(Non-linear)、卷积模块(Conv2d)、激活模块(sigmoid)、重加权模块(Re-weight)。对于输入的特征图，先输入残差模块进行处理后，再分别输入到宽度方向全局平均池化模块(X Avg Pool)、高度方向全局平均池化模块(Y Avg Pool)中，分别在宽度和高度这两个方向上进行全局平均池化，接着将这两个特征图通过张量拼接和卷积模块(Concat+Conv2d)拼接起来，并进行卷积，再利用批量归一化模块(BatchNorm)、非线性模块(Non-linear)进行批量归一化、非线性等操作，然后再分别使用卷积模块(Conv2d)对处理后的特征图进行卷积操作，分别得到宽度和高度方向的特征图，接着同时利用sigmoid模块进行sigmoid激活，得到了宽度和高度方向的注意力权重，并将这两个方向的注意力权重与通过残差模块处理后的原特征图输入到重加权模块(Re-weight)进行乘法加权，得到带有宽度和高度两个方向的注意力权重的特征图。

网络模型还引入了CBLoss来构建损失函数，使得网络模型更具有泛化能力。在一次实际收货场景中，经常会出现某一类别汽车零件占比大，导致数据分布不平衡，因此引入了CBLoss来构建损失函数，假设类y有n_y个训练样本，类别y的类平衡(CB)softmax交叉熵损失表示为：

其中，z为模型的输出向量，表示为[z₁,z₂,…,z_C]^T，C为类别数，n_y表示类别为y的有效训练样本数量，超参数β为权重调整系数，当为0时，表示没有重新加权，当趋向于1时，表示按照反向频率进行加权。

该损失函数利用了每个类别的有效样本数来重新平衡损失，当某一类别的有效样本数越大，那该类别的损失所占的权重就越小，反之则越大，这样便可以重新平衡不同类别的损失，使网络模型的训练过程更有效，更能提高模型的泛化能力和识别准确率。

S6.对训练样本数据集和测试样本数据集进行预处理；

预处理包括依次进行水平翻转、镜像翻转、旋转、加入高斯噪声、HSV色彩增强。常规预处理的流程为：依次进行灰度化操作、几何变换操作、图像增强操作，而本申请针对汽车零件图像颜色较为单调的特性，省去了灰度化操作，以此在减少图像数据的损失同时提高了效率。本申请进行了水平翻转、镜像翻转和旋转三个几何变换操作，纠正图像在采集步骤中的系统误差和仪器位置的随机误差；加入高斯噪声、HSV色彩增强两个数据增强操作，提高模型的泛化能力和容错率。

S7.将预处理的训练样本数据集输入网络模型，对网络模型进行训练，得到收敛的网络模型；将预处理的测试样本数据集输入收敛的网络模型进行验证，得到识别结果；

S8.将待测的汽车零件图像输入收敛的网络模型进行识别得到待测的汽车零件图像的识别结果。

实施例2

基于与实施例1相同的构思，本实施例提供一种基于AI识别的汽车零件检测系统，应用于汽车加工厂中复杂汽车零件的识别。

该系统包括：

零件号获取模块，用于通过移动设备获取汽车零件的零件号信息。

图像获取模块，用于通过移动设备获取汽车零件的图像。

零件号信息获取模块和图像获取模块构架在移动端上，收货人员利用移动PDA扫描识别零件进行收货，后台给管理人员提供收货记录和收货概况分析。

分类标注模块，用于根据所获取的汽车零件的图像和零件号信息进行分类标注。

划分模块，用于将分类标注的汽车零件图像划分训练样本数据集和测试样本数据集。

具体的，可以采用留出法、k折交叉验证法和自助法。留出法相对简单，但容易浪费数据，容易过拟合，且矫正方式不方便；k折交叉验证法多次对训练数据集进行划分，在不同的数据集上进行训练、测试评估，从而得出一个评价结果，例如5折交叉验证，在原始数据集上，进行5次划分，每次划分进行一次训练、评估，最后得到5次划分后的评估结果，一般在这几次评估结果上取平均得到最后的评分。k折交叉验证法经过多次划分，多次训练，模型能遇到各种各样的数据，从而提高其泛化能力，因此数据量越大，模型准确率越高。可以对三种方法优劣进行评估比较，针对不同的数据集选择最佳的方法，可以在避免数据浪费的同时减少性能开销。

AI模型构建模块，用于基于EfficientNetV2构建网络模型，将MBConv模块中的SE注意力机制替换为CA注意力机制。

预处理模块，用于对汽车零件图像进行预处理。

图像识别模块，用于将预处理的训练样本数据集输入网络模型，对网络模型进行训练，得到收敛的网络模型、将预处理的测试样本数据集输入收敛的网络模型进行验证，得到识别结果，将识别结果进行人工复核、将待测的汽车零件图像输入收敛的网络模型进行识别得到待测的汽车零件图像的识别结果。

具体的，所述人工复核为判断识别结果是否符合零件特性，人工复核，符合则人工在PDA上确认结果符合，不符合则选择结果不符。后台系统会将该数据记录，后续再针对识别结果是否准确进行模型优化，人工复核可提高识别准确率。

显然，本发明的上述实施例仅仅是为清楚地说明本发明技术方案所作的举例，而并非是对本发明的具体实施方式的限定。凡在本发明权利要求书的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种基于AI识别的汽车零件检测方法，其特征在于，包括：

获取汽车零件的零件号信息；

获取汽车零件的图像；

根据所获取的汽车零件的图像和零件号信息进行分类标注；

对训练样本数据集和测试样本数据集进行预处理；

将待测的汽车零件图像输入收敛的网络模型进行识别得到待测的汽车零件图像的识别结果。

2.根据权利要求1所述的基于AI识别的汽车零件检测方法，其特征在于：

所述网络模型引入类平衡损失来构建汽车零件识别的损失函数，利用每个汽车零件类的有效样本数来重新平衡损失，假设类y有n_y个有效训练样本，类别y的类平衡softmax交叉熵损失表示为：

3.根据权利要求2所述的基于AI识别的汽车零件检测方法，其特征在于：

所述预处理为依次进行水平翻转、镜像翻转、旋转、加入高斯噪声、HSV色彩增强。

4.根据权利要求3所述的基于AI识别的汽车零件检测方法，其特征在于：

将预处理后的训练样本数据集输入网络模型训练时，采用的是渐进的学习方法，所述的渐进的学习方法包括：先使用分辨率较小的汽车零件图像和弱正则化训练所述网络模型，逐渐增加汽车零件图像的分辨率，同时自适应添加更强的正则化使网络学习更困难。

5.根据权利要求1～4任一项所述的基于AI识别的汽车零件检测方法，其特征在于：

所述划分训练样本数据集和测试样本数据集使用留出法。

6.根据权利要求1～4任一项所述的基于AI识别的汽车零件检测方法，其特征在于：

所述划分训练样本数据集和测试样本数据集使用k折交叉验证法或自助法。

7.根据权利要求1～4任一项所述的基于AI识别的汽车零件检测方法，其特征在于：

还包括：将测试样本数据集输入网络模型后输出的识别结果进行人工复核，所述人工复核为识别结果是否符合零件特性。

8.一种基于AI识别的汽车零件检测系统，其特征在于，包括：

零件号获取模块，用于获取汽车零件的零件号信息；

图像获取模块，用于获取汽车零件的图像；

分类标注模块，用于根据所获取的汽车零件的图像和零件号信息进行分类标注；

划分模块，用于将分类标注的汽车零件图像划分训练样本数据集和测试样本数据集；

AI模型构建模块，用于基于EfficientNetV2构建网络模型，将MBConv模块中的SE注意力机制替换为CA注意力机制；

预处理模块，用于对训练样本数据集和测试样本数据集进行预处理；

图像识别模块，用于将预处理的训练样本数据集输入网络模型，对网络模型进行训练，得到收敛的网络模型、将预处理的测试样本数据集输入收敛的网络模型进行验证，得到识别结果、将待测的汽车零件图像输入收敛的网络模型进行识别得到待测的汽车零件图像的识别结果。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1～7任一项所述的基于AI识别的汽车零件检测方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1～7任一项所述的基于AI识别的汽车零件检测方法。