CN114820558A - 汽车零件检测方法、装置、电子设备和计算机可读介质 - Google Patents

汽车零件检测方法、装置、电子设备和计算机可读介质 Download PDF

Info

Publication number
CN114820558A
CN114820558A CN202210523203.3A CN202210523203A CN114820558A CN 114820558 A CN114820558 A CN 114820558A CN 202210523203 A CN202210523203 A CN 202210523203A CN 114820558 A CN114820558 A CN 114820558A
Authority
CN
China
Prior art keywords
network
automobile part
data set
detection
automobile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210523203.3A
Other languages
English (en)
Inventor
张哲彬
陈特欢
唐金亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo University
Original Assignee
Ningbo University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo University filed Critical Ningbo University
Priority to CN202210523203.3A priority Critical patent/CN114820558A/zh
Publication of CN114820558A publication Critical patent/CN114820558A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30164Workpiece; Machine component

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本发明的公开了汽车零件检测方法、装置、电子设备和计算机可读介质。所述方法包括:获取汽车零件表面缺陷图片建立数据集,并对样本数据集进行数据增强预处理;使用K‑Means聚类算法,重新设定anchor框大小,并增加anchor框个数;构建汽车零件表面缺陷检测的网络结构,主要包括主干网络结构设计、网络结构优化以及多尺度特征融合;根据预设汽车零件表面缺陷检测网络对待检测汽车零件表面照片进行检测输入,输出汽车零件表面缺陷检测网络检测结果。本发明提高了汽车零件表面缺陷的检测效率和准确率。

Description

汽车零件检测方法、装置、电子设备和计算机可读介质
技术领域
本发明的实施例涉及计算机技术领域,具体涉及汽车零件检测方法、装置、电子设备和计算机可读介质。
背景技术
近几年来,汽车行业发展迅速,汽车走进了千家万户,汽车拥有品类繁多的钣金件、轴类零件。在这些零件加工完以后,需要对其表面进行缺陷检测,保证其表面质量,确保在工作过程中的稳定性和可靠性。
汽车零件缺陷检测在汽车制造业中是必不可少的一环,是保证汽车零件是否合格的关键步骤。传统汽车零件检测由工人进行人工识别,这种检测方式效率低下,抗干扰性,鲁棒性差,有很多情况不能够适用。在这种情况下,引入神经网络来提高流水线检测效率成为亟须解决的问题。
发明内容
本发明的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本发明的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本发明的一些实施例提出了汽车零件检测方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本发明的一些实施例提供了一种汽车零件检测方法,该方法包括:
获取汽车零件表面缺陷图片,建立数据集,并对样本数据集进行数据增强预处理;
使用K-Means聚类算法,重新设定anchor框大小,并增加anchor框个数;
构建汽车零件表面缺陷检测的网络结构,主要包括主干网络结构设计、网络结构优化以及多尺度特征融合;
根据预设汽车零件表面缺陷检测网络对待检测汽车零件表面照片进行检测输入,输出汽车零件表面缺陷检测网络检测结果。
进一步的,所述数据增强预处理包含如下步骤:
使用镜像、平移、反转等方式对汽车零件表面缺陷的拍摄图片进行处理,从而在原有拍摄的图片量基础上获取更多的样本数据量;
将所述数据集内的样本数据进行Mosaic数据增强:对所述样本数据进行随机裁剪、随机缩放、随机裁剪、色调改变、随机排布等一种或多种方式将任意四张图片进行拼接;
对所述数据集的样本数据进行标注,并将标注后的数据集进行随机划分为训练数据集及测试数据集,所述训练数据集用于网络模型的训练,测试数据集用于网络模型的测试。
进一步的,所述主干网络结构设计的方法包含将YOLOV3网络模型原有的DarkNet53基础骨干网络替换成轻量级网络MobileNet V1。
进一步的,所述网络结构优化的方法包含嵌入一个改进的SE-block结构。
进一步的,所述的多尺度特征融合是使用多尺度特征融合模块将主干网络中输出的不同尺度特征图进行融合,将多尺度特征的输出预测进行融合可以选择性地强调信息特征,增强网络的表征能力。
进一步的,所述构建汽车零件表面缺陷检测的网络结构后,还包含网络模型训练过程:
将训练数据集的图片用固定的大小和格式封装后传入构造好的主干网络和特征融合网络中,得出轻量化神经网络模型的预测结果;
计算网络模型的输出与真实值的损失,计算损失值的梯度,最后用梯度下降算法更新网络模型参数,通过寻找损失函数的最优解来调整模型参数。
第二方面,本发明的一些实施例提供了一种汽车零件检测装置,装置包括:数据增强预处理单元、anchor框设定单元、检测网络构建单元、检测结果输出单元。所述数据增强预处理单元被配置成获取汽车零件表面缺陷图片,建立数据集,并对样本数据集进行数据增强预处理;所述anchor框设定单元被配置成使用K-Means聚类算法,重新设定anchor框大小,并增加anchor框个数;所述检测网络构建单元被配置成构建汽车零件表面缺陷检测的网络结构,主要包括主干网络结构设计、网络结构优化以及多尺度特征融合;所述检测结果输出单元被配置成根据预设汽车零件表面缺陷检测网络对待检测汽车零件表面照片进行检测输入,输出汽车零件表面缺陷检测结果。所述该装置的诸单元与汽车零件检测方法中的各个步骤相对应。
第三方面,本发明的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
第四方面,本发明的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
本发明的上述各个实施例具有如下有益效果:1、本发明提供了一种基于神经网络的汽车零件表面缺陷检测方法,能够智能的、高效、准确地检测出汽车零件表面的缺陷;2、本发明的汽车零件缺陷检测方法所采用的网络架构相比于现有技术的检测架构而言具有更高的检测速度、准确度和效率。
附图说明
结合附图并参考以下具体实施方式,本发明各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是根据本发明的汽车零件检测方法的一些实施例的流程图;
图2是根据本发明实施例的改进SE-block结构图;
图3是根据本发明实施例的多尺度特征融合结构图;
图4是根据本发明的汽车零件检测装置的一些实施例的结构示意图;
图5是适于用来实现本发明的一些实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的实施例。虽然附图中显示了本发明的某些实施例,然而应当理解的是,本发明可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本发明。应当理解的是,本发明的附图及实施例仅用于示例性作用,并非用于限制本发明的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
需要注意,本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本发明中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本发明实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本发明。
参考图1,示出了根据本发明的汽车零件检测方法的一些实施例的流程100。汽车零件检测方法,包括以下步骤:
步骤110,获取汽车零件表面缺陷图片,建立数据集,并对样本数据集进行数据增强预处理。
具体而言,由于在工业场景中,数据种类单一、数据量少,往往并不能满足网络模型训练的要求,在这种情况下,网络模型可能会出现过拟合情况,训练后模型出现泛化能力差等问题。为了使模型能够更有鲁棒性,本发明的一个实施例通过使用多种数据增强结合方式增强数据集,即本实施例中所述数据增强预处理进一步包含如下步骤:
1、使用镜像、平移、反转等方式对汽车零件表面缺陷的拍摄图片进行处理,从而在原有拍摄的图片量基础上获取更多的样本数据量;
2、将所述数据集内的样本数据进行Mosaic数据增强:对所述样本数据进行随机裁剪、随机缩放、随机裁剪、、色调改变、随机排布等一种或多种方式将任意四张图片进行拼接,从而进一步实现了BATCH_SIZE(即一次训练所抓取的数据样本数量)的适当增加,从而提高训练效率,提升模型的训练梯度更加准确,分类能力;
3、对所述数据集的样本数据进行标注,并将标注后的数据集进行随机划分为训练数据集及测试数据集,所述训练数据集用于网络模型的训练,测试数据集用于网络模型的测试。
步骤120,使用K-Means聚类算法,重新设定anchor框大小,并增加anchor框个数。
具体而言,K-means聚类算法是无监督学习也是基于划分的聚类算法,与随机森林算法、逻辑回归算法、支持向量机等的分类监督学习算法有所区别,K-means聚类算法处理数据速度快、伸缩性好,而且在处理数据过程中仅需要变量X就能进行后续的分类工作,Y变量对其没有影响,该算法也是各类数据处理中最为流行的算法之一。K-means聚类算法是基于欧氏距离针对距离较近的对象进行划分,结合阈值分割和标记过程,通过比较相似对象划分到同一聚簇,是一种常用的基于全局的聚类划分方法。
在一些实施例中,首先对三种不同尺度(大,中,小)目标,均分别设置K个anchor先验框,并对其宽高进行随机初始化。然后对训练集的目标框标签进行聚类,经过多次迭代后,最终得到3K个簇,分别代表不同宽高的先验框,对这些先验框尺寸评估与排序,将它们分别划分为不同尺度目标的anchor框,对于每种尺度都赋予K个框。网络在预测目标框大小时,仅估计相对这些anchor框尺寸的偏移量。这将极大的提升汽车零件检测网络对目标框形状大小预测的准确度。
进一步的,在YOLOV3的anchor框中,由于训练数据过多并庞杂,所以anchor设定的较为平均,但是在不同场景下的anchor框并不符合原始版本的anchor框,所以这边使用了K-means聚类算法将所有标签中的数据做了聚类。新的聚类框能够满足实际情况,使得模型能够更快的收敛,提高训练模型的效率。
步骤130,构建汽车零件表面缺陷检测的网络结构,主要包括主干网络结构设计、网络结构优化以及多尺度特征融合。
在一些实施例中,步骤130所述主干网络结构设计的方法包含将YOLOV3网络模型原有的DarkNet53基础骨干网络替换成轻量级网络MobileNet V1。现有技术中,虽然YOLOV3算法通过使用DarkNet53网络进行特征提取以及多尺度预测,获得了不错的检测精度和速度。但是,YOLOV3算法是在DarkNet53网络的较深网络层进行的特征提取,虽然能够获得更丰富的语义信息,但也忽略了遮挡相邻的目标特征;其次,YOLOV3算法虽然在小目标的检测效果上有了进一步提升,但是很多情况下,对小目标的检测还是会出现特征信息丢失,产生漏检、误检、重复检测的问题。
MobileNet V1的基本单元是深度可分离卷积,这种方式把一个卷积操作分解成两个,深度卷积和逐点卷积,深度卷积使用3×3卷积核的深层卷积层,而逐点卷积使用1×1卷积核的普通卷积层。模型参数计算对比如下:
假设用DK×DK表示卷积核尺寸,用DF×DF表示输入的特征图尺寸,分别用M、N表示输入和输出的通道数。
传统卷积的计算总量是:
DK×DK×M×N×DF×DF (1)
深度可分离卷积:
DK×DK×1×M×DF×DF+1×1×M×N×DF×DF (2)
计算量缩减了:
Figure BDA0003642815810000071
一般情况下N会比较大,对于传统3×3的卷积核来说,深度可分离卷积的计算力会提升9倍左右。其中深度卷积是针对每一个输入通道采用不同的卷积,逐点卷积是把深度卷积后的数据通过一个1×1的卷积核整合起来。这两个卷积把原来3×3×N的卷积核转变成一个3×3的卷积核和一个1×1×N的卷积核,把一个三维计算转变成2个二维的计算。深度可分离卷积在保持精度的基础上减少了计算量,降低了资源消耗,缩短了训练时间,改善了模型性能。
MobileNetV1由输入层,13层深度可分离卷积层,以及平均池化层、全连接层和softmax层组成,整个网络有30层。第一层之后的26层都为深度可分离卷积的重复卷积操作,且每一层卷积层后都加入了ReLU非线性激活单元和BatchNorm层。其中Stride为2的卷积层在卷积的同时还充当下采样的功能。
在一些实施例中,步骤130所述网络结构优化的方法包含嵌入一个改进的SE-block结构,通过显式地建模网络演化特征通道之间的相互依赖关系来提高网络生成的表示的质量。具体的,如图2所示,原有的网络结构在特征提取时将每一层提取的特征图的特征通道视为同等重要,并没有考虑到不同特征通道对待检测目标的重要程度不同,因此本申请嵌入了改进的SE-Block结构。其目的是通过学习一组权重值来表示每个特征通道的重要程度,并按照权重值的大小将特征通道进行重新排列,从而突出了那些有用的特征通道,并削弱用处不大的特征通道。另外设定一个阈值T,将特征通道中权重小于T的值都归0,以达到参数利用最大化的效果。
所述SE-block结构,即Squeeze-and-Excitation网络结构,其第一个模块为压缩(Squeeze)模块,该模块在特征图上顺着空间维度来进行特征压缩,将每个维度大小为w×h的二维特征通道转换成一个实数c,如公式4所示,这个实数在某种程度上具有尺度为w×h大小的全局感受野,然后再将所有实数组合得到了一个1×1×c的特征向量。
Figure BDA0003642815810000091
第二个模块是激励(Excitation)模块,该映射过程中,先通过全连接的方式进行一个c/r的降维操作,再通过ReLu函数进行特征映射,然后通过全连接的方式从c/r恢复成c大小,最后使用sigmoid激活函数来得到其重要性权重值。
进一步的,通过乘法将Excitation模块确定的每个通道的重要性权值分别加权到每个通道中,并判断权值大小是否在阈值范围,这样能够对影响检测多的权重赋予较高的权重,对检测影响较小的权重减小甚至删除权重,以减少模型计算量:
Figure BDA0003642815810000092
在一些实施例中,步骤130所述的多尺度特征融合是使用多尺度特征融合模块将主干网络中输出的不同尺度特征图进行融合,将多尺度特征的输出预测进行融合可以选择性地强调信息特征,增强网络的表征能力。如图3所示,在一些实施例中,所述多尺度特征融合模块中将原有的Neck组件中的Bneck模块后增加了SE-block模块,使得整体Neck部分参数减少,在多尺度特征融合中,通过多增添一个尺度以参与最后的预测,这是因为对位相加的融合方式可以增加每一维的信息量,同时使网络加强了对检测任务有用特征通道的利用,这样提升了网络整体的感受野。在汽车零件表面缺陷检测中,缺陷往往在图像中表现形式与周围背景不同,所以在输出前的增加了SE-block模块,从而突出了特征明显的特征通道,并削弱特征不明显的特征通道。
在一些实施例中,在步骤130构建汽车零件表面缺陷检测的网络结构后,还包含网络模型训练过程:
1、将训练数据集的图片用固定的大小和格式封装后传入构造好的主干网络和特征融合网络中,得出轻量化神经网络模型的预测结果;
2、计算网络模型的输出与真实值的损失,计算损失值的梯度,最后用梯度下降算法更新网络模型参数,通过寻找损失函数的最优解来调整模型参数。
3、根据预设汽车零件表面缺陷检测网络对待检测汽车零件表面照片进行检测输入,输出汽车零件表面缺陷检测结果。
本发明的一个实施例中,分别采用本发明的以YOLOV3_MobileNetV1为骨干架构的改进检测模型与以原始YOLOV3_DarkNet53为骨干架构的检测模型对相同的待检测汽车零件表面图片样本集进行检测,并对检测效果进行了比较。如表1所示,可知,本发明实施例网络模型大小远低于YOLOV3_DarkNet53,并且的检测速度明显优于YOLOV3_DarkNet53。
表1
Figure BDA0003642815810000101
此外,采用本发明的汽车零件检测方法后,汽车零件表面缺陷的检测成功率都在98%以上,所耗时间基本都是10ms左右,FPS能够达到92左右,能够在消耗较少的时间下,精度仍不会下降,具有较高的检测精度和效率。
本发明的上述各个实施例具有如下有益效果:1、本发明的提供了一种基于神经网络的汽车零件表面缺陷检测方法,能够智能的、高效、准确地检测出汽车零件表面的缺陷;2、本发明的汽车零件缺陷检测方法所采用的网络架构相比于现有技术的检测架构而言具有更高的检测速度、准确度和效率。
进一步参考图4,作为对上述各图所示方法的实现,本发明提供了一种汽车零件检测装置的一些实施例,这些装置实施例与图1所示的那些方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,一些实施例的汽车零件检测装置200包括:数据增强预处理单元210、anchor框设定单元220、检测网络构建单元230、检测结果输出单元240。其中数据增强预处理单元210被配置成获取汽车零件表面缺陷图片,建立数据集,并对样本数据集进行数据增强预处理;anchor框设定单元220被配置成使用K-Means聚类算法,重新设定anchor框大小,并增加anchor框个数;检测网络构建单元230被配置成构建汽车零件表面缺陷检测的网络结构,主要包括主干网络结构设计、网络结构优化以及多尺度特征融合;检测结果输出单元240被配置成根据预设汽车零件表面缺陷检测网络对待检测汽车零件表面照片进行检测输入,输出汽车零件表面缺陷检测结果。
可以理解的是,该装置200中记载的诸单元与参考图1描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置200及其中包含的单元,在此不再赘述。
下面参考图5,其示出了适于用来实现本发明的一些实施例的电子设备300的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本发明的实施例的功能和使用范围带来任何限制。
如图5所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图5中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本发明的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本发明的一些实施例的方法中限定的上述功能。
需要说明的是,本发明的一些实施例中记载的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备
可以以一种或多种程序设计语言或其组合来编写用于执行本发明的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括数据增强预处理单元210、anchor框设定单元220、检测网络构建单元230、检测结果输出单元240。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本发明的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本发明的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种汽车零件检测方法,其特征在于,所述方法的步骤包括:
获取汽车零件表面缺陷图片,建立数据集,并对样本数据集进行数据增强预处理;
使用K-Means聚类算法,重新设定anchor框大小,并增加anchor框个数;
构建汽车零件表面缺陷检测的网络结构,主要包括主干网络结构设计、网络结构优化以及多尺度特征融合;
根据预设汽车零件表面缺陷检测网络对待检测汽车零件表面照片进行检测输入,输出汽车零件表面缺陷检测网络检测结果。
2.根据权利要求1所述的方法,其特征在于,所述数据增强预处理包含如下步骤:
使用镜像、平移、反转等方式对汽车零件表面缺陷的拍摄图片进行处理,从而在原有拍摄的图片量基础上获取更多的样本数据量;
将所述数据集内的样本数据进行Mosaic数据增强:对所述样本数据进行随机裁剪、随机缩放、随机裁剪、色调改变、随机排布等一种或多种方式将任意四张图片进行拼接;
对所述数据集的样本数据进行标注,并将标注后的数据集进行随机划分为训练数据集及测试数据集,所述训练数据集用于网络模型的训练,测试数据集用于网络模型的测试。
3.根据权利要求1所述的方法,其特征在于,所述主干网络结构设计的方法包含将YOLOV3网络模型原有的DarkNet53基础骨干网络替换成轻量级网络MobileNet V1。
4.根据权利要求1所述的方法,其特征在于,所述网络结构优化的方法包含嵌入一个改进的SE-block结构。
5.根据权利要求1所述的方法,其特征在于,所述的多尺度特征融合包括使用多尺度特征融合模块将主干网络中输出的不同尺度特征图进行融合,将多尺度特征的输出预测进行融合可以选择性地强调信息特征,增强网络的表征能力。
6.根据权利要求5所述的方法,其特征在于,所述多尺度特征融合模块中将原有的Neck组件中的Bneck模块后增加了SE-block模块。
7.根据权利要求1所述的方法,其特征在于,所述构建汽车零件表面缺陷检测的网络结构后,还包含网络模型训练过程:
将训练数据集的图片用固定的大小和格式封装后传入构造好的主干网络和特征融合网络中,得出轻量化神经网络模型的预测结果;
计算网络模型的输出与真实值的损失,计算损失值的梯度,最后用梯度下降算法更新网络模型参数,通过寻找损失函数的最优解来调整模型参数。
8.一种物品运输装置,其特征在于,包括:
数据增强预处理单元、anchor框设定单元、检测网络构建单元、检测结果输出单元,
所述数据增强预处理单元被配置成获取汽车零件表面缺陷图片,建立数据集,并对样本数据集进行数据增强预处理;
所述anchor框设定单元被配置成使用K-Means聚类算法计算大小,替换默认anchor框大小,并增加anchor框个数;
所述检测网络构建单元被配置成构建汽车零件表面缺陷检测的网络结构,主要包括主干网络结构设计、网络结构优化以及多尺度特征融合;
所述检测结果输出单元被配置成根据预设汽车零件表面缺陷检测网络对待检测汽车零件表面照片进行检测输入,输出汽车零件表面缺陷检测结果。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN202210523203.3A 2022-05-13 2022-05-13 汽车零件检测方法、装置、电子设备和计算机可读介质 Pending CN114820558A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210523203.3A CN114820558A (zh) 2022-05-13 2022-05-13 汽车零件检测方法、装置、电子设备和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210523203.3A CN114820558A (zh) 2022-05-13 2022-05-13 汽车零件检测方法、装置、电子设备和计算机可读介质

Publications (1)

Publication Number Publication Date
CN114820558A true CN114820558A (zh) 2022-07-29

Family

ID=82516253

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210523203.3A Pending CN114820558A (zh) 2022-05-13 2022-05-13 汽车零件检测方法、装置、电子设备和计算机可读介质

Country Status (1)

Country Link
CN (1) CN114820558A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117274253A (zh) * 2023-11-20 2023-12-22 华侨大学 基于多模态Transformer的零配件检测方法、装置及可读介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111275684A (zh) * 2020-01-20 2020-06-12 东华大学 一种基于多尺度特征提取的带钢表面缺陷检测方法
CN113822185A (zh) * 2021-09-09 2021-12-21 安徽农业大学 一种群养生猪日常行为检测方法
CN114220035A (zh) * 2021-12-23 2022-03-22 中科合肥智慧农业协同创新研究院 一种基于改进yolo v4的快速害虫检测方法
CN114387520A (zh) * 2022-01-14 2022-04-22 华南农业大学 一种用于机器人采摘的密集李子精准检测方法及其系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111275684A (zh) * 2020-01-20 2020-06-12 东华大学 一种基于多尺度特征提取的带钢表面缺陷检测方法
CN113822185A (zh) * 2021-09-09 2021-12-21 安徽农业大学 一种群养生猪日常行为检测方法
CN114220035A (zh) * 2021-12-23 2022-03-22 中科合肥智慧农业协同创新研究院 一种基于改进yolo v4的快速害虫检测方法
CN114387520A (zh) * 2022-01-14 2022-04-22 华南农业大学 一种用于机器人采摘的密集李子精准检测方法及其系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴之昊 等: ""基于 Attention-YOLOv3 的锈蚀区域检测与识别"", 《计算机技术与发展》, 30 November 2020 (2020-11-30), pages 1 - 2 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117274253A (zh) * 2023-11-20 2023-12-22 华侨大学 基于多模态Transformer的零配件检测方法、装置及可读介质
CN117274253B (zh) * 2023-11-20 2024-02-27 华侨大学 基于多模态Transformer的零配件检测方法、装置及可读介质

Similar Documents

Publication Publication Date Title
CN110188765B (zh) 图像语义分割模型生成方法、装置、设备及存储介质
CN109816589B (zh) 用于生成漫画风格转换模型的方法和装置
CN108520220B (zh) 模型生成方法和装置
CN108710885B (zh) 目标对象的检测方法和装置
CN110288082B (zh) 卷积神经网络模型训练方法、装置和计算机可读存储介质
CN108154222B (zh) 深度神经网络训练方法和系统、电子设备
CN109145828B (zh) 用于生成视频类别检测模型的方法和装置
CN108235116B (zh) 特征传播方法和装置、电子设备和介质
CN114282581B (zh) 基于数据增强的训练样本获取方法、装置和电子设备
CN112258512A (zh) 点云分割方法、装置、设备和存储介质
CN110516678B (zh) 图像处理方法和装置
CN112183627B (zh) 生成预测密度图网络的方法和车辆年检标数量检测方法
CN115601692A (zh) 数据处理方法、神经网络模型的训练方法及装置
CN114359289A (zh) 一种图像处理方法及相关装置
CN114565092A (zh) 一种神经网络结构确定方法及其装置
CN114820558A (zh) 汽车零件检测方法、装置、电子设备和计算机可读介质
CN118097157A (zh) 基于模糊聚类算法的图像分割方法及系统
JP2022537542A (ja) 動的な画像解像度評価
CN111914920A (zh) 一种基于稀疏编码的相似性图像检索方法及系统
CN111539524A (zh) 轻量级自注意力模块、神经网络模型和神经网络构架的搜索方法
CN116977195A (zh) 复原模型的调整方法、装置、设备及存储介质
CN111968030A (zh) 信息生成方法、装置、电子设备和计算机可读介质
CN112528970A (zh) 路牌检测方法、装置、设备和计算机可读介质
CN112069981A (zh) 图像分类方法、装置、电子设备及存储介质
CN118229781B (zh) 显示屏异物检测方法、模型训练方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination