CN116664576A - 一种电池外壳焊道的异常检测方法、装置以及设备 - Google Patents
一种电池外壳焊道的异常检测方法、装置以及设备 Download PDFInfo
- Publication number
- CN116664576A CN116664576A CN202310946961.0A CN202310946961A CN116664576A CN 116664576 A CN116664576 A CN 116664576A CN 202310946961 A CN202310946961 A CN 202310946961A CN 116664576 A CN116664576 A CN 116664576A
- Authority
- CN
- China
- Prior art keywords
- image
- model
- output
- layer
- loss function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011324 bead Substances 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000005856 abnormality Effects 0.000 title claims abstract description 30
- 238000003466 welding Methods 0.000 title claims abstract description 28
- 238000001514 detection method Methods 0.000 claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 37
- 230000002159 abnormal effect Effects 0.000 claims abstract description 28
- 238000010586 diagram Methods 0.000 claims abstract description 23
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 claims abstract description 21
- 229910052744 lithium Inorganic materials 0.000 claims abstract description 21
- 238000001914 filtration Methods 0.000 claims abstract description 16
- 238000013507 mapping Methods 0.000 claims abstract description 16
- 238000012360 testing method Methods 0.000 claims abstract description 10
- 230000002950 deficient Effects 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 44
- 238000004821 distillation Methods 0.000 claims description 23
- 238000011176 pooling Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 13
- 210000002569 neuron Anatomy 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000004069 differentiation Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 abstract description 6
- 230000004044 response Effects 0.000 abstract description 3
- 230000007547 defect Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000002893 slag Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000013140 knowledge distillation Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
- -1 winding Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/8851—Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/091—Active learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/8851—Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges
- G01N2021/8887—Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges based on image processing techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30152—Solder
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/06—Recognition of objects for industrial automation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E60/00—Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
- Y02E60/10—Energy storage using batteries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Secondary Cells (AREA)
Abstract
本发明公开了一种电池外壳焊道的异常检测方法、装置、设备及存储介质,其包括:获取锂电池外壳焊道的图像,对图像进行预处理后,将有缺陷的异常图像作为测试集图像以及将正常图像作为训练集图像;构建教师模型以及学生模型;将所述训练集图像输入所述教师模型以及所述学生模型并基于预设损失函数进行训练,得到训练完成的所述学生模型;将所述测试集图像输入所述教师模型以及训练完成的所述学生模型,得到两个模型的输出,通过计算两个模型的输出所对应的损失以进行反向传播,计算得到梯度信息;将所述梯度信息进行映射,生成热力图,根据检测阈值对所述热力图进行过滤,得到异常检测结果。能够根据两个模型的不同响应,有效的实现异常检测定位。
Description
技术领域
本发明涉及锂电池技术领域,尤其涉及一种电池外壳焊道的异常检测方法、装置以及设备。
背景技术
锂电池是目前电动汽车领域的主流电池类型之一,具有能量密度较高、充电快速、寿命较长的优点。锂电池的生产流程长,需要经过涂布、卷绕、入壳、注液等多种不同的工序,每道工序又涉及到不同的工艺。其中的入壳流程是锂电池成形的最后一道流程,对锂电池的稳定性和安全性起了极为关键的作用。入壳需要对锂电池外壳进行焊接,焊接的过程会在电池外壳留下焊道。然而,由于焊接工艺不稳定的问题,焊道上可能存在多种缺陷,例如针孔、凹坑、爆点、凸起等。电池外壳焊道的质量会影响电池外壳的密封性和机械强度,因为电池外壳是保护电池内部结构的壳体,如果外壳焊道存在缺陷或者焊接不牢固,就会导致电池内部物质泄漏或者外部物质进入,影响电池的正常工作并且存在安全隐患。因此,对电池外壳焊道进行质量检测,对于保障电池的性能和安全至关重要。在电池外壳检测领域中,目前主流的异常检测方法大多数是基于有监督的深度学习方法实现的,该方法的缺点是对数据集的要求较高,需要训练集包含各种类别的缺陷信息,不利于模型建模和泛化,导致不能有效对缺陷进行检测。
发明内容
有鉴于此,本发明的目的在于提出一种电池外壳焊道的异常检测方法、装置以及设备,旨在解决上述问题。
为实现上述目的,本发明提供一种电池外壳焊道的异常检测方法,所述方法包括:
获取锂电池外壳焊道的图像,对图像进行预处理后,将有缺陷的异常图像作为测试集图像以及将正常图像作为训练集图像;
构建教师模型以及学生模型,其中,所述教师模型基于目标数据集进行预训练得到;
将所述训练集图像输入所述教师模型以及所述学生模型并基于预设损失函数进行训练,将所述教师模型以及所述学生模型输出的损失更新所述学生模型的梯度,得到训练完成的所述学生模型;
将所述测试集图像输入所述教师模型以及训练完成的所述学生模型,得到两个模型的输出,通过计算两个模型的输出所对应的损失以进行反向传播,计算得到梯度信息;
将所述梯度信息进行映射,生成热力图,根据检测阈值对所述热力图进行过滤,得到异常检测结果。
优选的,所述获取锂电池外壳焊道的图像,对图像进行预处理,包括:
对所获取的所述锂电池外壳焊道的图像进行分割和归一化处理,并对归一化后的图像进行所述异常图像以及所述正常图像的分类处理;其中,将所述锂电池外壳焊道的图像分割至224×224的大小。
优选的,所述教师模型基于目标数据集进行预训练得到,包括:
所述教师模型与加载的ResNet-18网络的预训练模型基于所述目标数据集并根据蒸馏损失函数进行迭代训练,得到预训练完成的所述教师模型。
优选的,所述学生模型与所述教师模型的网络结构相同;所述教师模型或所述学生模型的网络架构基于自定义的卷积神经网络进行构建;所述教师模型或所述学生模型的网络架构包括第一个网络层、第二个网络层、第三个网络层、第四个网络层以及第五个网络层;其中,
所述第一个网络层的输入层包括3个3*3的卷积核,输出层包括64个3*3的卷积核以及1个2*2的最大值池化层;
所述第二网络层的输入层包括64个3*3的卷积核,输出层包括64个3*3的卷积核以及1个2*2的最大值池化层;
所述第三网络层的输入层包括64个3*3的卷积核,输出层包括128个3*3的卷积核以及1个2*2的最大值池化层;
所述第四网络层的输入层包括128个3*3的卷积核,输出层包括256个3*3的卷积核以及1个2*2的最大值池化层;
所述第五网络层的输入层包括256个3*3的卷积核,输出层包括512个3*3的卷积核以及1个2*2的最大值池化层。
优选的,所述预设损失函数为,式中,为L1损失函数,/>为蒸馏损失函数,/>和/>分别表示所述L1损失函数和所述蒸馏损失函数的系数;其中,
所述L1损失函数为,
其中,表示每个输出层C中神经元的数量,a表示输出层中每个神经元的激活值,表示输出层的总数,/>表示第i个输出层,t和s分别指代教师模型和学生模型;
所述蒸馏损失函数为
其中,表示每个输出层C中神经元的数量,a表示输出层中每个神经元的激活值,表示输出层的总数,/>表示第i个输出层,/>表示对内部的值进行开方计算,t和s分别指代教师模型和学生模型。
优选的,所述通过计算两个模型的输出所对应的损失以进行反向传播,计算得到梯度信息,包括:
通过计算所述预设损失函数的偏微分,得到所述梯度信息,其中,x表示输入的值,/>表示所述预设损失函数。
优选的,所述将所述梯度信息进行映射,生成热力图,根据检测阈值对所述热力图进行过滤,得到异常检测结果,包括:
通过对所述梯度信息进行归一化,得到映射信息;其中,map表示映射之后的信息,/>和/>分别表示梯度的最大值和最小值,grad表示需要转换的梯度信息;
通过对归一化后的map进行高斯处理,得到/>,其中,g表示对map进行高斯处理;
根据对所述热力图中小于所述检测阈值的区域进行过滤,得到异常区域的所述异常检测结果,其中,所述检测阈值为0.5。
为了实现上述目的,本发明还提出一种电池外壳焊道的异常检测设备,包括处理器、存储器以及存储在所述存储器内的计算机程序,所述计算机程序被所述处理器执行以实现如上述实施例所述的一种电池外壳焊道的异常检测方法的步骤。
有益效果:
以上方案,在训练阶段,通过使用了两个相同网络的模型分别作为教师模型和学生模型,其中,教师模型在目标数据集中进行预训练,以教师模型为参照,在正常图像的数据中训练学生模型,获取训练好的学生模型。由于学生模型仅在正常图像中训练过,因此在输入同一张异常图像时能够获得两个模型的不同响应,进而可根据这个原理进行准确有效的实现异常检测和区域定位。
以上方案,在推理阶段,通过将异常图像同时输入教师模型和训练好的学生模型中,得到两个模型的输出;计算两者的L1损失和蒸馏损失的总和,之后进行反向传播,计算得到梯度信息;将梯度信息进行映射,生成热力图,根据检测阈值过滤掉弱区域之后,剩余的强区域即为异常区域。若过滤之后的热力图没有异常区域,则说明该图热力图对应的图像是正常图像。提高异常检测的检测精度和检测效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种电池外壳焊道的异常检测方法的流程示意图。
图2为本发明一实施例提供的一种电池外壳焊道的异常检测的整体流程图。
图3为本发明一实施例提供的教师模型的预训练的流程图。
图4为本发明一实施例提供的学生模型或教师模型的网络结构示意图。
发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
由于锂电池外壳焊道缺陷会严重影响到整个电池外壳的气密性,因此对锂电池外壳焊道的检测尤为重要。此前,针对铝壳外壳焊道的图像,一般使用有监督缺陷检测的方法进行缺陷检出和定位,不同的缺陷对应不同的标签。因此,需要训练集中包含各种缺陷的图片,一旦遇到新的缺陷类型,模型就有可能出现检测不出的情况。同时,有监督的缺陷检测模型需要对大量的数据进行标注,费时费力,不利于模型建模和泛化。此外,焊道在焊接的过程中会有产生很多形态各异的焊刺焊渣,很难收集全所有类型的缺陷数据,也进一步加剧了焊道缺陷漏检的可能性。基于此,本发明针对电池外壳焊道成像的特点,结合蒸馏学习方法,一方面可以避免由于焊渣、焊刺导致的漏检问题,另一方面也能够对电池外壳焊道的异常检测和区域的准确定位。
以下结合实施例详细阐述本发明的内容。
参照图1所示为本发明一实施例提供的一种电池外壳焊道的异常检测方法的流程示意图。
本实施例中,该方法包括:
S11,获取锂电池外壳焊道的图像,对图像进行预处理后,将有缺陷的异常图像作为测试集图像以及将正常图像作为训练集图像;
S12,构建教师模型以及学生模型,其中,所述教师模型基于目标数据集进行预训练得到;
进一步的,对所获取的所述锂电池外壳焊道的图像进行分割和归一化处理,并对归一化后的图像进行所述异常图像以及所述正常图像的分类处理;其中,将所述锂电池外壳焊道的图像分割至224×224的大小。
S13,将所述训练集图像输入所述教师模型以及所述学生模型并基于预设损失函数进行训练,将所述教师模型以及所述学生模型输出的损失更新所述学生模型的梯度,得到训练完成的所述学生模型;
S14,将所述测试集图像输入所述教师模型以及训练完成的所述学生模型,得到两个模型的输出,通过计算两个模型的输出所对应的损失以进行反向传播,计算得到梯度信息;
S15,将所述梯度信息进行映射,生成热力图,根据检测阈值对所述热力图进行过滤,得到异常检测结果。
在本实施例中,通过使用蒸馏学习的方法训练一个学生模型,并且使用教师模型和学生模型对同一张图像的不同响应以判断是否有异常以及异常区域的定位。本实施例使用的教师模型是在目标数据集(包括缺陷的异常图像以及正常图像的所有图像数据集)中预训练过的自定义模型,即教师模型需要在目标数据集中进行训练得到预训练权重;学生模型的网络结构使用相同的模型,区别是学生模型仅在正常图像的数据集中训练并进行随机初始化。在知识蒸馏的过程中,教师模型充当对照作用,其本身并不更新权重,仅学生模型需要更新权重。
参照图2所示。电池外壳焊道的异常检测的步骤包括:
1)对锂电池外壳焊道的图像进行分割和归一化处理,将图像分割至224×224的大小;
2)对归一化后的图像进行分类处理,将有缺陷的异常图像作为测试集,将正常图像作为训练集;
3)构建L1损失函数和蒸馏损失函数;
4)构建教师模型和学生模型,其中教师模型在目标数据集中进行预训练;
5)在正常图像中训练,使用教师模型和学生模型输出的L1损失和蒸馏损失更新学生模型的梯度,得到训练好的学生模型;
6)选择一张异常图像,同时输入教师模型和训练好的学生模型;
7)得到两个模型的输出,计算两者的L1损失和蒸馏损失,并将两个损失加权相加;
8)进行反向传播,计算图像张量的梯度,得到梯度信息;
9)将梯度信息进行映射,生成热力图;
10)对热力图中小于0.5的区域进行过滤,消除弱区域,剩余的强区域即为异常区域。
进一步的,所述教师模型基于目标数据集进行预训练得到,包括:
所述教师模型与加载的ResNet-18网络的预训练模型基于所述目标数据集并根据蒸馏损失函数进行迭代训练,得到预训练完成的所述教师模型。
在本实施例中,教师模型与加载预训练模型的ResNet-18网络在所有的子图像进行蒸馏训练,其训练流程参照图3所示。首先需要将所有图像进行分割并归一化,得到尺寸大小均相等的所有子图像;其次获取加载预训练模型的ResNet-18网络,结合蒸馏损失的方法进行迭代训练,得到预训练完成的教师模型。
参照图4所示。教师模型和学生模型的网络结构相同,其网络的主体架构是自定义的卷积神经网络,包括5个子网络层,每个网络层都有各自的输出。其中第一个网络层的输入由3个3*3的卷积核组成,输出由64个3*3的卷积核以及1个2*2的最大值池化层组成;第二网络层的输入由64个3*3的卷积核组成,输出由64个3*3的卷积核以及1个2*2的最大值池化层组成;第三网络层的输入由64个3*3的卷积核组成,输出由128个3*3的卷积核以及1个2*2的最大值池化层组成;第四网络层的输入由128个3*3的卷积核组成,输出由256个3*3的卷积核以及1个2*2的最大值池化层组成;第五网络层的输入由256个3*3的卷积核组成,输出由512个3*3的卷积核以及1个2*2的最大值池化层组成。本实施例使用了网络层的输出2、输出3、输出4和输出5,用于函数损失的计算。
进一步的,所述预设损失函数为,式中,/>为L1损失函数,/>为蒸馏损失函数,/>和/>分别表示所述L1损失函数和所述蒸馏损失函数的系数,一般情况下,/>设置为1,/>设置为0.5。
具体的,本实施例使用的损失函数包括L1损失和蒸馏损失;其中,蒸馏损失用于训练教师模型,L1损失和蒸馏损失用于计算教师模型和学生模型的输出。
L1损失的公式如下所示:
其中,表示每个输出层C中神经元的数量,a表示输出层中每个神经元的激活值,表示输出层的总数,/>表示第i个输出层。t和s分别指代教师模型和学生模型。
蒸馏损失公式如下所示:
其中,表示每个输出层C中神经元的数量,a表示输出层中每个神经元的激活值,表示输出层的总数,当进行教师网络的预训练时,/>,/>表示第i个输出层,/>表示对内部的值进行开方计算。t和s分别指代教师模型和学生模型。
进一步的,所述通过计算两个模型的输出所对应的损失以进行反向传播,计算得到梯度信息,包括:
通过计算所述预设损失函数的偏微分,得到所述梯度信息,其中,x表示输入的值,/>表示所述预设损失函数。
进一步的,所述将所述梯度信息进行映射,生成热力图,根据检测阈值对所述热力图进行过滤,得到异常检测结果,包括:
通过对所述梯度信息进行归一化,得到映射信息;其中,map表示映射之后的信息,/>和/>分别表示梯度的最大值和最小值,grad表示需要转换的梯度信息;
通过对归一化后的map进行高斯处理,得到/>,其中,g表示对map进行高斯处理;
根据对所述热力图中小于所述检测阈值的区域进行过滤,得到异常区域的所述异常检测结果,其中,所述检测阈值为0.5。
在本实施例的异常检测和定位中,每个测试的输出都被输入到教师模型和学生模型中。由于学生模型只在正常模型中训练过,因此当检测到异常的数据时,学生模型输出层的激活值会相对更高。相较而言,教师模型在更大的数据集中训练过,对异常数据不敏感,因此教师模型输出层的激活值会相对较低。根据公式计算可以得到,在输入异常数据时总的损失值更高,而损失函数的导数表示了教师模型和学生模型差值的变化程度。本实施例通过/>的梯度寻找差值变化较大的区域,梯度越高,表示两者之间差异越大,是异常的可能性越高。通过计算损失函数的偏微分得到梯度信息,公式如下所示:
其中,grad表示通过计算损失函数的偏微分得到梯度信息,x表示输入的值。对于得到的梯度信息,还需要将其转换为热度图。由于梯度可能是负数形式且离散存在,因此需要将其归一化到[0,1]区间内。公式如下:
其中,和/>分别表示梯度的最大值和最小值,grad表示需要转换的梯度,map表示映射之后的信息。之后,还需要进行高斯处理以及阈值过滤,得到最后的热度图。
高斯处理的公式如下:
,/>
其中,和/>是热力图map中某一个点的坐标值,x和y表示非/>和/>的任意一点的坐标值,/>和/>分别表示x和y上的标准差,g(x,y)即表示该点关于/>和/>的高斯值。将归一化后的map输入高斯图之后,得到/>。公式如下所示,其中g表示对map进行高斯处理。
阈值过滤公式如下:
其中,heatmap是过滤之后的热度图,x是属于中的元素,仅当该元素的值大于0.5时才保留,否则直接置为0。经过过滤之后,在热度图中剩下的就是差异值较大的区域,即可能出现异常的区域。同时,若热度图中没有异常区域,即结果全为0,则表示该输入图像数据为正常数据,没有缺陷。
本发明实施例还提供一种设备,其对应地,可以执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,详细可以参见上述实施例中的相关记载,此处不再赘述。
所述设备包括:手机、数码相机或平板电脑等具有拍照功能的设备,或者具有图像处理功能的设备,或者具有图像显示功能的设备。所述设备可包括存储器、处理器、输入单元、显示单元、电源等部件。
其中,存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(例如图像播放功能等)等;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器和输入单元对存储器的访问。
输入单元可用于接收输入的数字或字符或图像信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,本实施例的输入单元除了包括摄像头,还可包括触敏表面(例如触摸显示屏)以及其他输入设备。
显示单元可用于显示由用户输入的信息或提供给用户的信息以及设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元可包括显示面板,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器以确定触摸事件的类型,随后处理器根据触摸事件的类型在显示面板上提供相应的视觉输出。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例、设备实施例及存储介质实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
并且,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (7)
1.一种电池外壳焊道的异常检测方法,其特征在于,所述方法包括:
获取锂电池外壳焊道的图像,对图像进行预处理后,将有缺陷的异常图像作为测试集图像以及将正常图像作为训练集图像;
构建教师模型以及学生模型,其中,所述教师模型基于目标数据集进行预训练得到;
将所述训练集图像输入所述教师模型以及所述学生模型并基于预设损失函数进行训练,将所述教师模型以及所述学生模型输出的损失更新所述学生模型的梯度,得到训练完成的所述学生模型;其中,所述预设损失函数为,式中,/>为L1损失函数,/>为蒸馏损失函数,/>和/>分别表示所述L1损失函数和所述蒸馏损失函数的系数;其中,
所述L1损失函数为,
其中,表示每个输出层C中神经元的数量,a表示输出层中每个神经元的激活值,/>表示输出层的总数,/>表示第i个输出层,t和s分别指代教师模型和学生模型;
所述蒸馏损失函数为
其中,表示每个输出层C中神经元的数量,a表示输出层中每个神经元的激活值,/>表示输出层的总数,/>表示第i个输出层,/>表示对内部的值进行开方计算,t和s分别指代教师模型和学生模型;
将所述测试集图像输入所述教师模型以及训练完成的所述学生模型,得到两个模型的输出,通过计算两个模型的输出所对应的损失以进行反向传播,计算得到梯度信息;
将所述梯度信息进行映射,生成热力图,根据检测阈值对所述热力图进行过滤,得到异常检测结果。
2.根据权利要求1所述的一种电池外壳焊道的异常检测方法,其特征在于,所述获取锂电池外壳焊道的图像,对图像进行预处理,包括:
对所获取的所述锂电池外壳焊道的图像进行分割和归一化处理,并对归一化后的图像进行所述异常图像以及所述正常图像的分类处理;其中,将所述锂电池外壳焊道的图像分割至224×224的大小。
3.根据权利要求1所述的一种电池外壳焊道的异常检测方法,其特征在于,所述教师模型基于目标数据集进行预训练得到,包括:
所述教师模型与加载的ResNet-18网络的预训练模型基于所述目标数据集并根据蒸馏损失函数进行迭代训练,得到预训练完成的所述教师模型。
4.根据权利要求1所述的一种电池外壳焊道的异常检测方法,其特征在于,所述学生模型与所述教师模型的网络结构相同;所述教师模型或所述学生模型的网络架构基于自定义的卷积神经网络进行构建;所述教师模型或所述学生模型的网络架构包括第一个网络层、第二个网络层、第三个网络层、第四个网络层以及第五个网络层;其中,
所述第一个网络层的输入层包括3个3*3的卷积核,输出层包括64个3*3的卷积核以及1个2*2的最大值池化层;
所述第二网络层的输入层包括64个3*3的卷积核,输出层包括64个3*3的卷积核以及1个2*2的最大值池化层;
所述第三网络层的输入层包括64个3*3的卷积核,输出层包括128个3*3的卷积核以及1个2*2的最大值池化层;
所述第四网络层的输入层包括128个3*3的卷积核,输出层包括256个3*3的卷积核以及1个2*2的最大值池化层;
所述第五网络层的输入层包括256个3*3的卷积核,输出层包括512个3*3的卷积核以及1个2*2的最大值池化层。
5.根据权利要求1所述的一种电池外壳焊道的异常检测方法,其特征在于,所述通过计算两个模型的输出所对应的损失以进行反向传播,计算得到梯度信息,包括:
通过计算所述预设损失函数的偏微分,得到所述梯度信息,其中,x表示输入的值,/>表示所述预设损失函数。
6.根据权利要求5所述的一种电池外壳焊道的异常检测方法,其特征在于,所述将所述梯度信息进行映射,生成热力图,根据检测阈值对所述热力图进行过滤,得到异常检测结果,包括:
通过对所述梯度信息进行归一化,得到映射信息;其中,map表示映射之后的信息,/>和/>分别表示梯度的最大值和最小值,grad表示需要转换的梯度信息;
通过对归一化后的map进行高斯处理,得到/>,其中,g表示对map进行高斯处理;
根据对所述热力图中小于所述检测阈值的区域进行过滤,得到异常区域的所述异常检测结果,其中,所述检测阈值为0.5。
7.一种电池外壳焊道的异常检测设备,其特征在于,包括处理器、存储器以及存储在所述存储器内的计算机程序,所述计算机程序被所述处理器执行以实现如权利要求1至6任意一项所述的一种电池外壳焊道的异常检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310946961.0A CN116664576B (zh) | 2023-07-31 | 2023-07-31 | 一种电池外壳焊道的异常检测方法、装置以及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310946961.0A CN116664576B (zh) | 2023-07-31 | 2023-07-31 | 一种电池外壳焊道的异常检测方法、装置以及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116664576A true CN116664576A (zh) | 2023-08-29 |
CN116664576B CN116664576B (zh) | 2023-11-03 |
Family
ID=87712191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310946961.0A Active CN116664576B (zh) | 2023-07-31 | 2023-07-31 | 一种电池外壳焊道的异常检测方法、装置以及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116664576B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112990296A (zh) * | 2021-03-10 | 2021-06-18 | 中科人工智能创新技术研究院(青岛)有限公司 | 基于正交相似度蒸馏的图文匹配模型压缩与加速方法及系统 |
CN114170478A (zh) * | 2021-12-09 | 2022-03-11 | 中山大学 | 基于跨图像局部特征对齐的缺陷检测、定位的方法及系统 |
CN114511532A (zh) * | 2022-01-28 | 2022-05-17 | 河北工业大学 | 基于特征引导的通道蒸馏的太阳能电池表面缺陷检测方法 |
US20220383072A1 (en) * | 2021-05-28 | 2022-12-01 | Samsung Sds Co., Ltd. | Knowledge distillation method based on regression task and computing device for executing the method |
CN115422518A (zh) * | 2022-08-19 | 2022-12-02 | 河北师范大学 | 基于无数据知识蒸馏的文本验证码识别方法 |
CN115731237A (zh) * | 2022-12-23 | 2023-03-03 | 西京学院 | 一种基于半监督迁移学习的热轧钢带表面缺陷检测方法 |
CN115797736A (zh) * | 2023-01-19 | 2023-03-14 | 北京百度网讯科技有限公司 | 目标检测模型的训练和目标检测方法、装置、设备和介质 |
CN115984213A (zh) * | 2022-12-29 | 2023-04-18 | 西安电子科技大学广州研究院 | 基于深度聚类的工业产品外观缺陷检测方法 |
US20230154167A1 (en) * | 2021-11-15 | 2023-05-18 | Nec Laboratories America, Inc. | Source-free cross domain detection method with strong data augmentation and self-trained mean teacher modeling |
CN116151335A (zh) * | 2023-03-20 | 2023-05-23 | 电子科技大学 | 一种适用于嵌入式设备的脉冲神经网络轻量化方法及系统 |
CN116168443A (zh) * | 2023-04-25 | 2023-05-26 | 安徽大学 | 一种基于信息差知识蒸馏的遮挡面部情绪识别方法 |
CN116245826A (zh) * | 2023-02-09 | 2023-06-09 | 中国矿业大学 | 一种基于dcgan的零件表面缺陷检测方法 |
CN116362325A (zh) * | 2023-03-28 | 2023-06-30 | 南京大学 | 一种基于模型压缩的电力图像识别模型轻量化应用方法 |
CN116453096A (zh) * | 2023-03-10 | 2023-07-18 | 维森视觉丹阳有限公司北京分公司 | 图像异物检测方法、装置、电子设备和存储介质 |
-
2023
- 2023-07-31 CN CN202310946961.0A patent/CN116664576B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112990296A (zh) * | 2021-03-10 | 2021-06-18 | 中科人工智能创新技术研究院(青岛)有限公司 | 基于正交相似度蒸馏的图文匹配模型压缩与加速方法及系统 |
US20220383072A1 (en) * | 2021-05-28 | 2022-12-01 | Samsung Sds Co., Ltd. | Knowledge distillation method based on regression task and computing device for executing the method |
US20230154167A1 (en) * | 2021-11-15 | 2023-05-18 | Nec Laboratories America, Inc. | Source-free cross domain detection method with strong data augmentation and self-trained mean teacher modeling |
CN114170478A (zh) * | 2021-12-09 | 2022-03-11 | 中山大学 | 基于跨图像局部特征对齐的缺陷检测、定位的方法及系统 |
CN114511532A (zh) * | 2022-01-28 | 2022-05-17 | 河北工业大学 | 基于特征引导的通道蒸馏的太阳能电池表面缺陷检测方法 |
CN115422518A (zh) * | 2022-08-19 | 2022-12-02 | 河北师范大学 | 基于无数据知识蒸馏的文本验证码识别方法 |
CN115731237A (zh) * | 2022-12-23 | 2023-03-03 | 西京学院 | 一种基于半监督迁移学习的热轧钢带表面缺陷检测方法 |
CN115984213A (zh) * | 2022-12-29 | 2023-04-18 | 西安电子科技大学广州研究院 | 基于深度聚类的工业产品外观缺陷检测方法 |
CN115797736A (zh) * | 2023-01-19 | 2023-03-14 | 北京百度网讯科技有限公司 | 目标检测模型的训练和目标检测方法、装置、设备和介质 |
CN116245826A (zh) * | 2023-02-09 | 2023-06-09 | 中国矿业大学 | 一种基于dcgan的零件表面缺陷检测方法 |
CN116453096A (zh) * | 2023-03-10 | 2023-07-18 | 维森视觉丹阳有限公司北京分公司 | 图像异物检测方法、装置、电子设备和存储介质 |
CN116151335A (zh) * | 2023-03-20 | 2023-05-23 | 电子科技大学 | 一种适用于嵌入式设备的脉冲神经网络轻量化方法及系统 |
CN116362325A (zh) * | 2023-03-28 | 2023-06-30 | 南京大学 | 一种基于模型压缩的电力图像识别模型轻量化应用方法 |
CN116168443A (zh) * | 2023-04-25 | 2023-05-26 | 安徽大学 | 一种基于信息差知识蒸馏的遮挡面部情绪识别方法 |
Non-Patent Citations (1)
Title |
---|
葛仕明;赵胜伟;刘文瑜;李晨钰;: "基于深度特征蒸馏的人脸识别", 北京交通大学学报, no. 06 * |
Also Published As
Publication number | Publication date |
---|---|
CN116664576B (zh) | 2023-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Duan et al. | Curriculum deepsdf | |
Xu et al. | Surface fatigue crack identification in steel box girder of bridges by a deep fusion convolutional neural network based on consumer-grade camera images | |
CN111275660B (zh) | 一种平板显示器缺陷检测方法及装置 | |
CN111626295B (zh) | 车牌检测模型的训练方法和装置 | |
CN113936004B (zh) | 一种锂电池焊接质量检测方法、装置及系统 | |
CN111932510A (zh) | 一种图像清晰度的确定方法及装置 | |
CN113570007A (zh) | 零件缺陷识别模型构建优化方法、装置、设备及存储介质 | |
CN109242029A (zh) | 识别分类模型训练方法和系统 | |
CN113221731B (zh) | 一种多尺度遥感图像目标检测方法及系统 | |
WO2020097461A1 (en) | Convolutional neural networks with reduced attention overlap | |
Liu et al. | Cognitive cloud framework for waste dumping analysis using deep learning vision computing in healthy environment | |
Lin | Design of urban road fault detection system based on artificial neural network and deep learning | |
Choudhary et al. | Autonomous visual detection of defects from battery electrode manufacturing | |
CN116664576B (zh) | 一种电池外壳焊道的异常检测方法、装置以及设备 | |
CN116883390B (zh) | 模糊抵抗性半监督缺陷检测方法、装置及存储介质 | |
CN107729078A (zh) | 后台应用程序管控方法、装置、存储介质及电子设备 | |
CN116051959A (zh) | 一种目标检测方法、装置 | |
Saha et al. | A newly proposed object detection method using faster R-CNN inception with ResNet based on Tensorflow | |
CN111915621B (zh) | 一种融合深度神经网络与cv模型的污损图像分割方法 | |
CN115222691A (zh) | 图像缺陷检测方法、系统及相关装置 | |
CN111881833B (zh) | 一种车辆检测方法、装置、设备及存储介质 | |
Zhang et al. | A lightweight YOLOv7 insulator defect detection algorithm based on DSC-SE | |
KR102483080B1 (ko) | 인공지능을 활용한 항공기 소음 분류 및 추출 방법 | |
Lin et al. | Electrode tab deflection detection for pouch lithium-ion battery using mask r-cnn | |
KR102640081B1 (ko) | 시선 예측 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |