CN117132564A - 基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统 - Google Patents

基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统 Download PDF

Info

Publication number
CN117132564A
CN117132564A CN202311079642.0A CN202311079642A CN117132564A CN 117132564 A CN117132564 A CN 117132564A CN 202311079642 A CN202311079642 A CN 202311079642A CN 117132564 A CN117132564 A CN 117132564A
Authority
CN
China
Prior art keywords
sapphire substrate
network
defect
image
yolov3
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311079642.0A
Other languages
English (en)
Inventor
訾梦超
张敏
吴琼
廖金湘
张宇豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Polytechnic College
Original Assignee
Guangdong Polytechnic College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Polytechnic College filed Critical Guangdong Polytechnic College
Priority to CN202311079642.0A priority Critical patent/CN117132564A/zh
Publication of CN117132564A publication Critical patent/CN117132564A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0475Generative networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/094Adversarial learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/766Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Quality & Reliability (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)

Abstract

本发明提供了一种基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统,所述方法包括:获取待测量的蓝宝石衬底表面图像;将所述待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,输出表面缺陷检测结果;所述YOLOv3网络检测模型包括特征提取网络和边框回归网络;本发明在进行蓝宝石衬底表面缺陷检测与分类时,通过采用YOLOv3网络检测模型进行识别,与传统的自动化光学检测或人工经验检测相比,具有检测速度快、准确度高和智能化程度高的优点。

Description

基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统
技术领域
本发明属于衬底表面缺陷检测技术领域,具体涉及一种基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统。
背景技术
商用的GaN薄膜通常使用蓝宝石、碳化硅以及硅衬底作为衬底异质外延生长GaN薄膜。其中,蓝宝石晶体因其独特的晶格结构、优异的力学性能、良好的热学性能而成为LED领域重要的衬底材料,在市场中占据重要地位。
在蓝宝石衬底的制作过程中,一系列机械和化学过程,不可避免的会产生一些表面缺陷,如划痕、裂纹、气泡、崩角等。这些不同类型缺陷的存在,势必影响到后续外延层生长以及相关器件的成品率。因此,对蓝宝石衬底的质检工作十分重要。然而,目前行业中对于衬底表面质量缺陷的检测更多依靠人工检测、自动化光学检测(AOI)或者结合破坏性手段和测量仪器进行抽检。对于细小缺陷或者特征不明显的缺陷,需要在强光条件下进行,加剧人的疲劳,检测结果受到人工干预,对检测结果带来不稳定因素,存在主体差异大、检测表征不统一、人力成本高和稳定性差等缺点。此外,尽管AOI检测技术也被引入到衬底表面质量检测中,但对于存在的表面缺陷具体情况,还是主要依靠人工进一步判断,因此仍然面临人工干预检测存在的缺点。
发明内容
为了克服现有技术的不足,本发明提供一种基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统,以解决现有的依赖人工检测方式存在的准确度低、稳定性差的问题。
第一方面,本发明提供了一种基于YOLOv3的蓝宝石衬底表面缺陷检测方法,所述方法包括:
获取待测量的蓝宝石衬底表面图像;
将所述待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,输出表面缺陷检测结果;所述YOLOv3网络检测模型包括特征提取网络和边框回归网络。
在一个可能实施的方式中,将所述待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,输出表面缺陷检测结果,包括:
将所述待测量的蓝宝石衬底表面图像输入至所述特征提取网络,生成不同尺度的缺陷融合特征图;
利用所述边框回归网络对所述缺陷融合特征图的类别和位置进行预测,输出多维张量;
利用非极大值抑制算法从所述多维张量中筛选出具有最高置信度分数的边界框,作为表面缺陷检测结果并输出。
在一个可能实施的方式中,将所述待测量的蓝宝石衬底表面图像输入至所述特征提取网络,生成不同尺度的缺陷融合特征图,包括:
将所述待测量的蓝宝石衬底表面图像至所述特征提取网络,依次经过卷积模块和残差模块进行特征提取,输出不同尺度的表面缺陷特征图;
采用上采样技术扩大所述表面缺陷特征图的尺寸;
采用特征融合技术对扩大尺寸后的表面缺陷特征图进行融合,生成所述缺陷融合特征图。
在一个可能实施的方式中,所述卷积模块包括若干个卷积层,所述残差模块包括两个卷积层、特征融合函数及激活函数;所述卷积层采用1*1、3*3系列卷积层。
在一个可能实施的方式中,利用所述边框回归网络对所述缺陷融合特征图的类别和位置进行预测,包括:
采用K-means聚类算为不同尺度的所述缺陷融合特征图设定不同的锚框;
确定所述锚框与缺陷真实的位置之间的IOU值,筛选出最大IOU值对应的锚框,以对所述缺陷融合特征图的类别和位置进行预测。
在一个可能实施的方式中,所述的基于YOLOv3的蓝宝石衬底表面缺陷检测方法,还包括训练所述YOLOv3网络检测模型,包括:
采集若干张蓝宝石衬底的表面缺陷图像,利用LableImg标注工具对所述表面缺陷图像进行标注,生成训练样本;
将所述训练样本按照预设比例划分为训练集和验证集;
建立YOLOv3网络,并设置YOLOv3网络的参数;所述参数包括初始学习率、学习动量、训练步数、IOU阈值及NMS阈值;
利用所述训练集对所述YOLOv3网络进行训练,在所述验证集上进行所述YOLOv3网络的参数调节优化,直至网络误差损失函数收敛时,生成所述YOLOv3网络检测模型。
在一个可能实施的方式中,在所述利用LableImg标注工具对所述表面缺陷图像进行标注之前,还包括:
采用图像翻转,和/或图像平移,和/或生成对抗网络GAN的方式对所述表面缺陷图像进行数据扩充。
第二方面,本发明提供了一种基于YOLOv3的蓝宝石衬底表面缺陷检测系统,所述系统包括:
图像获取单元,用于获取待测量的蓝宝石衬底表面图像;
缺陷检测单元,用于将所述待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,输出表面缺陷检测结果;所述YOLOv3网络检测模型包括特征提取网络和边框回归网络。
第三方面,本发明还提供了一种电子设备,包括显示器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时实现第一方面任一项所述的基于YOLOv3的蓝宝石衬底表面缺陷检测方法的步骤。
第四方面,本发明还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行的至少一个程序,所述至少一个程序被所述计算机执行时,使所述计算机执行上述任一项所述的基于YOLOv3的蓝宝石衬底表面缺陷检测方法中的步骤。
与现有技术相比,本发明至少包括有益效果:
本发明提供了一种基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统,所述方法包括:获取待测量的蓝宝石衬底表面图像;将所述待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,输出表面缺陷检测结果;所述YOLOv3网络检测模型包括特征提取网络和边框回归网络;本发明在进行蓝宝石衬底表面缺陷检测与分类时,通过采用YOLOv3网络检测模型进行识别,与传统的自动化光学检测或人工经验检测相比,具有检测速度快、准确度高和智能化程度高的优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明其中一实施例提供的基于YOLOv3的蓝宝石衬底表面缺陷检测方法的流程示意图;
图2为本发明其中一实施例提供的DarkNet-53卷积神经网络的结构示意图;
图3为本发明其中一实施例提供的YOLOv3网络检测模型的整体结构示意图;
图4为本发明其中一实施例提供的边界框回归的原理示意图;
图5为本发明其中一实施例提供的3个尺寸anchor box的结构示意图;
图6为本发明其中一实施例提供的基于YOLOv3的蓝宝石衬底表面缺陷检测系统的结构示意图;
图7为本发明其中一实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,若全文中出现的“和/或”或者“及/或”,其含义包括三个并列的方案,以“A和/或B”为例,包括A方案、或B方案、或A和B同时满足的方案。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
目前,针对蓝宝石衬底表面质量缺陷的检测更多依靠人工检测、自动化光学检测(AOI)或者结合破坏性手段和测量仪器进行抽检,检测效率低且检测结果的准确度往往无法保证。为此,本发明提供了一种基于YOLOv3的蓝宝石衬底表面缺陷检测方法,能够通过训练好的YOLOv3网络检测模型识别蓝宝石衬底表面质量缺陷,具有检测速度快、准确度高和智能化程度高的优点。
请参阅图1,本发明其中一个实施例提供了一种基于YOLOv3的蓝宝石衬底表面缺陷检测方法,包括:
S10、获取待测量的蓝宝石衬底表面图像;
S20、将待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,输出表面缺陷检测结果;YOLOv3网络检测模型包括特征提取网络和边框回归网络。
高质量的GaN薄膜是影响LED发展的核心技术,但单晶GaN的制备非常困难,难以大规模进行商业化的生产。目前商用的GaN薄膜通常使用蓝宝石、碳化硅以及硅衬底作为衬底异质外延生长GaN薄膜。其中,蓝宝石晶体因其独特的晶格结构、优异的力学性能、良好的热学性能而成为LED领域重要的衬底材料,使用相对广泛。
在蓝宝石衬底的制作过程中,一系列机械和化学过程,不可避免的会产生一些表面缺陷,如划痕、裂纹、气泡、崩角等。这些不同类型缺陷的存在,势必影响到后续外延层生长以及相关器件的成品率。因此需要对蓝宝石衬底表面缺陷进行检测。
本实施例中,首先获取待测量的蓝宝石衬底表面图像,可以采用自动化光学图像采集设备采集,要保证把蓝宝石衬底完整扫描一遍。
可选地,为了提高后续识别结果的准确性,可以对待测量的蓝宝石衬底表面图像进行图像增强,包括对图像进行对比度增强,色彩校正、去噪、缩放和插值等。
进一步地,在步骤S20中,将待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,即可输出蓝宝石衬底的表面缺陷检测结果;通常,YOLOv3网络检测模型是提前根据大量的蓝宝石衬底表面缺陷图像的样本训练得到的,只要实现训练好该模型,在使用时直接调用即可。
其中,YOLOv3网络检测模型包括特征提取网络和边框回归网络。特征提取网络主要用于缺陷特征提取,而边框回归网络用于修正检测时的偏移情况。
综上,本发明实施例在进行蓝宝石衬底表面缺陷检测与分类时,通过采用YOLOv3网络检测模型进行识别,与传统的自动化光学检测或人工经验检测相比,具有检测速度快、准确度高和智能化程度高的优点
在一个实施例中,步骤S20、将待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,输出表面缺陷检测结果,具体包括以下子步骤:
2.1)将待测量的蓝宝石衬底表面图像输入至特征提取网络,生成不同尺度的缺陷融合特征图;
YOLOv3网络检测模型主要分为特征提取网络和边框回归两部分;
本实施例中,特征提取网络的主体为DarkNet-53卷积神经网络,DarkNet-53网络框架主要由卷积模块和残差模块两部分,该网络由于使用了残差模块,可以避免梯度消失或者爆炸等训练问题,使得深层网络训练难度大大降低。
在一个实施例中,步骤2.1)又具体包括以下子步骤:
2.11)将待测量的蓝宝石衬底表面图像至特征提取网络,依次经过卷积模块和残差模块进行特征提取,输出不同尺度的表面缺陷特征图;
2.12)采用上采样技术扩大表面缺陷特征图的尺寸;
2.13)采用特征融合技术对扩大尺寸后的表面缺陷特征图进行融合,生成缺陷融合特征图。
本实施例中,卷积模块包括若干个卷积层,残差模块包括两个卷积层、特征融合函数及激活函数;卷积层采用1*1、3*3系列卷积层。
参见图2,图2提供了一种DarkNet-53卷积神经网络的结构示意图。根据图2可知,残差模块Res-Unit包括依次连接的两个卷积层、特征融合函数add,以及激活函数,激活函数主要是增加神经网络模型的非线性,进而提高神经网络模型的表达能力,帮助网络模型在训练时更快收敛。
参见图3,图3提供了为YOLOv3检测网络模型的整体结构图。具体地,网络模型的输入为416*416,当缺陷图像尺寸较大时,YOLOv3网络检测模型会对其进行预处理,在经过多个卷积层和残差模块后分别在3个不同尺度上获取缺陷特征图,3个尺度的缺陷特征图大小分别为13*13、26*26和52*52,如图3所示。需要说明的是,特征图的大小主要取决于DarkNet-53卷积神经网络结构,选择3个不同尺寸的特征图,能够使得YOLOv3网络模型对大、中、小类型的缺陷都有较好的检测效果。
进一步地,采用上采样技术(Up-sample)扩大表面缺陷特征图的尺寸,然后利用特征融合技术(Concat)将上述3个尺度的特征图进行融合,通过多尺度特征融合的方式来提高YOLOv3网络检测模型对蓝宝石衬底表面的斑点、气泡等小目标缺陷的检测精度。
在一个实施例中,特征融合包括add特征融合与concat特征融合:
对于有通道数相同且后面带卷积运算的两路输入来说,add等价于concat之后对应通道共享同一个卷积核,由于每个输出通道的卷积核是独立的,以单输出通道为例,假设输入通道1分别为(x1,x2,x3,......,xc),输入通道2为(y1,y2,y3,......,yc),则add与concat的单个输出通道分别为(*表示卷积,ki表示比例系数):
通过融合之后的结果来看,concat是增加了图像本身通道数(维度),每一维度下的信息没有增加,add是特征图相加,图像本身的通道数(维度)保持不变,每一维度下的信息量得到增加。
2.2)利用边框回归网络对缺陷融合特征图的类别和位置进行预测,输出多维张量。
参见图4,图4提供了边界框回归的原理示意。
可选地,在一个实施例中,步骤2.2)又包括以下步骤:
2.21)采用K-means聚类算为不同尺度的所述缺陷融合特征图设定不同的锚框;
2.22)确定所述锚框与缺陷真实的位置之间的IOU值,筛选出最大IOU值对应的锚框,以对所述缺陷融合特征图的类别和位置进行预测。
边框回归时,首先采用K-means聚类算法给上面所述的3种尺度的融合特征图分别设定3种不同大小的anchor box(锚框),如图5所示。然后对缺陷进行边界框回归,具体是哪一个anchor box进行预测,取决于哪个anchor box与object ground truth之间的IOU(Intersection over Union)值,IOU值最大的anchor box负责预测,而剩余的2个anchorbox不进行预测;
2.3)利用非极大值抑制算法从多维张量中筛选出具有最高置信度分数的边界框,作为表面缺陷检测结果并输出。
在边框回归的过程中,会对缺陷类别和缺陷的位置进行预测,最终网络模型输出一个多维的张量,再通过非极大值抑制算法NMS(Non-Maximum Suppression)筛选出具有最高置信度分数的边界框,作为最终的预测结果。
在一个实施例中,在边框回归的过程中,通过学习边界框的中心点相对于该点所在单元格grid左上角的偏移量(tx,ty)以及边界框的宽度tw、高度th。为确保缺陷中心处于执行预测的单元格grid中,防止偏移过多,还需用sigmoid函数将(tx,ty)压缩到[0,1]区间内。在预测时通过使用tx、ty、tw、th这4个偏移量offsets,得到目标的实际中心点位置(bx,by)以及其宽度(bw)、高度(bh),计算公式如下所示:
bx=δ(tx)+cx
by=δ(ty)+cy
bw=pwexp(tw)
bh=phexp(th)
其中,cx,cy表示单元格grid的宽度和高度。
在一个可能实施的方式中,基于YOLOv3的蓝宝石衬底表面缺陷检测方法,还包括训练YOLOv3网络检测模型,包括:
1)采集若干张蓝宝石衬底的表面缺陷图像,利用LableImg标注工具对表面缺陷图像进行标注,生成训练样本;
首先采用自动化光学图像采集设备采集蓝宝石衬底表面缺陷图像,图像采集设备可以用面阵相机或者线阵相机,要保证把蓝宝石衬底完整扫描一遍,图像采集的数量根据实际情况而定,例如可以采集几百上千张。
获取到若干张蓝宝石衬底的表面缺陷图像后,利用LableImg标注工具对表面缺陷图像进行标注,生成训练样本。
需要说明的是LableImg标注工具可以进行保存图片处理标注,保存处理完毕文件后会自动重新生成与这张图片标注相应的xml文件,该图片标注后的文件与这张任意图片文件中的标注文件名相同,以防止出现标注格式的错误。获得的数据集经过LableImg处理可以得到xml文件,xml文件里存放的是标注框的各种信息(图片的大小以及每个标注框的位置参数)
可选地,在一个实施例中,在利用LableImg标注工具对表面缺陷图像进行标注之前,还包括:
采用图像翻转,和/或图像平移,和/或生成对抗网络GAN的方式对所述表面缺陷图像进行数据扩充。
图像采集之后还可以通过采用数据增强技术,包括图像翻转、图像平移、生成对抗网络GAN等对缺陷图像进行大量扩充,通过大量的训练样本能够进一步提高模型的识别精度。
图像翻转:图像翻转是一种简单且常用的数据增强方法,它通过将图像沿水平或垂直方向进行翻转,从而生成新的图像样本。对于缺陷图像,可以尝试水平翻转、垂直翻转或同时进行水平和垂直翻转来创建更多的样本。
图像平移:图像平移是指将图像在水平和垂直方向上进行平移操作,从而创建新的图像样本。对于缺陷图像,可以通过随机平移图像的位置来生成更多的变体。这可以通过在图像的像素值上进行平移操作来实现。
生成对抗网络(GAN):生成对抗网络是一种强大的深度学习模型,可以用于生成逼真的图像样本。GAN包含一个生成器和一个判别器网络。生成器网络负责生成与原始图像相似但具有一定缺陷特征的新图像样本,而判别器则负责区分生成的图像样本和真实的缺陷图像。通过不断迭代训练生成器和判别器,可以产生更多逼真的缺陷图像样本。
2)将训练样本按照预设比例划分为训练集和验证集。
优选地,可以按照7:3的比例划分训练样本,以得到训练集和验证集。
3)建立YOLOv3网络,并设置YOLOv3网络的参数;参数包括初始学习率、学习动量、训练步数、IOU阈值及NMS阈值。
具体地,YOLOv3缺陷检测网络模型的参数设置和训练:初始学习率α一般由用户自行设定,非常依赖用户的调参经验,通常设置范围为0.001-0.1,YOLOv3网络模型采用Adam优化器,在训练时学习率一般设定为0.001,学习动量为0.9、训练步数由用户自行设定、IOU阈值为0.5、NMS阈值的设置范围为0.4-0.7,
4)利用训练集对YOLOv3网络进行训练,在验证集上进行YOLOv3网络的参数调节优化,直至网络误差损失函数收敛时,生成YOLOv3网络检测模型。
等训练参数设置好后,将步骤1)中的缺陷图像训练集输入至YOLOv3检测网络模型中进行训练,并在验证集上进行网络模型的训练效果进行验证,直到网络误差损失函数Lossfunction的值不变化时,YOLOv3缺陷检测网络模型收敛,训练结束。
在一个可能实施的方式中,YOLOV3网络算法模型在进行误差损失计算时,回归损失采用误差平方和函数,分类损失采用二值交叉熵函数。损失函数主要对缺陷预测框的中心坐标、宽高、缺陷的置信度、缺陷类别四个部分进行计算,其表达式如下:
其中,表示第i个网格的第j个anchor box是否负责检测缺陷,如果负责检测缺陷,则/>反之,/>也就是说当第i个网格的第j个anchor box与缺陷的ground truth box的IOU在所有的anchor boxes与ground truth box的IOU中最大,那它就负责预测该缺陷。/>表示第i个网格的第j个anchor box不负责检测该缺陷。/>是置信度参数,它的取值是由grid cell的anchor box有没有负责预测缺陷决定的,wi和hi分别表示anchor box所对的宽和高,pi表示目标物体属于某种缺陷类型的概率值大小。在所有anchor boxes中与ground truth box的IOU最大的那个anchor box对应的anchor box负责预测该缺陷,/>反之,/>
公式中的第一行,表示中心坐标误差函数,(xi,yi)表示缺陷ground truth box的中心坐标值,而表示预测的anchor box的中心坐标。当第i个网格的第j个anchorbox负责检测该缺陷,那么这个anchor box所产生的bounding box就应该去和groundtruth box去比较,计算得到中心坐标误差。第二行表示宽高坐标误差,当第i个网格的第j个anchor box负责检测该缺陷,那么这个anchor box所预测的bounding box就应该去和ground truth box去比较,计算得到边界框的宽高坐标误差。第三行和第四行表示置信度误差,用交叉熵函数来表示,第三行表示anchor box中存在缺陷时边界框的置信度误差,相对应的第四行表示anchor box中不存在缺陷时边界框的置信度误差。最后一行表示分类误差,当第i个网格的第j个anchor box负责检测缺陷时,那么YOLOV3模型才会对其进行计算其分类损失。
最后,将训练完成的YOLOv3网络检测模型的网络参数进行保存,并可以通过测试集,即待测量的蓝宝石衬底表面图像完成蓝宝石衬底表面缺陷的检测分类测试。
基于与上述方法相同的发明构思,在本发明公开的另一实施例中,还公开了一种基于YOLOv3的蓝宝石衬底表面缺陷检测系统。请参阅图6,本发明实施例提供的一种基于YOLOv3的蓝宝石衬底表面缺陷检测系统,包括:
图像获取单元10,用于获取待测量的蓝宝石衬底表面图像;
缺陷检测单元20,用于将待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,输出表面缺陷检测结果;YOLOv3网络检测模型包括特征提取网络和边框回归网络。
在该实施例公开的系统中,各个模块的具体实现还可以对应参照上述实施例所示的方法实施例的相应描述,为了简便,在此不再赘述。
在一个实施例中,本发明还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序包括程序指令,程序指令当被电子设备的处理器执行时,使处理器执行如上述任意一种可能实现的方式的方法。
在一个实施例中,本发明还提供了一种电子设备,包括:处理器、发送装置、输入装置、输出装置和存储器,存储器用于存储计算机程序代码,计算机程序代码包括计算机指令,当处理器执行所述计算机指令时,电子设备执行如上述任意一种可能实现的方式的方法。
请参阅图7,图7为本发明实施例提供的一种电子设备的硬件结构示意图。
该电子设备2包括处理器21,存储器22,输入装置23,输出装置24。该处理器21、存储器22、输入装置23和输出装置24通过连接器相耦合,该连接器包括各类接口、传输线或总线等等,本发明实施例对此不作限定。应当理解,本发明的各个实施例中,耦合是指通过特定方式的相互联系,包括直接相连或者通过其他设备间接相连,例如可以通过各类接口、传输线、总线等相连。
处理器21可以是一个或多个图形处理器(graphics processing unit,GPU),在处理器21是一个GPU的情况下,该GPU可以是单核GPU,也可以是多核GPU。可选的,处理器21可以是多个GPU构成的处理器组,多个处理器之间通过一个或多个总线彼此耦合。可选的,该处理器还可以为其他类型的处理器等等,本发明实施例不作限定。
存储器22可用于存储计算机程序指令,以及用于执行本发明方案的程序代码在内的各类计算机程序代码。可选地,存储器包括但不限于是随机存储记忆体(random accessmemory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasableprogrammable read only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器用于相关指令及数据。
输入装置23用于输入数据和/或信号,以及输出装置24用于输出数据和/或信号。输出装置23和输入装置24可以是独立的器件,也可以是一个整体的器件。
可理解,本发明实施例中,存储器22不仅可用于存储相关指令,本发明实施例对于该存储器中具体所存储的数据不作限定。
可以理解的是,图7仅仅示出了一种电子设备的简化设计。在实际应用中,电子设备还可以分别包含必要的其他元件,包含但不限于任意数量的输入/输出装置、处理器、存储器等,而所有可以实现本发明实施例的视频解析装置都在本发明的保护范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。所属领域的技术人员还可以清楚地了解到,本发明各个实施例描述各有侧重,为描述的方便和简洁,相同或类似的部分在不同实施例中可能没有赘述,因此,在某一实施例未描述或未详细描述的部分可以参见其他实施例的记载。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriberline,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字通用光盘(digitalversatiledisc,DVD))、或者半导体介质(例如固态硬盘SSD)等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:只读存储器(read-only memory,ROM)或随机存储存储器(random access memory,RAM)、磁碟或者光盘等各种可存储程序代码的介质。

Claims (10)

1.一种基于YOLOv3的蓝宝石衬底表面缺陷检测方法,其特征在于,所述方法包括:
获取待测量的蓝宝石衬底表面图像;
将所述待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,输出表面缺陷检测结果;所述YOLOv3网络检测模型包括特征提取网络和边框回归网络。
2.如权利要求1所述的基于YOLOv3的蓝宝石衬底表面缺陷检测方法,其特征在于,将所述待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,输出表面缺陷检测结果,包括:
将所述待测量的蓝宝石衬底表面图像输入至所述特征提取网络,生成不同尺度的缺陷融合特征图;
利用所述边框回归网络对所述缺陷融合特征图的类别和位置进行预测,输出多维张量;
利用非极大值抑制算法从所述多维张量中筛选出具有最高置信度分数的边界框,作为表面缺陷检测结果并输出。
3.如权利要求2所述的基于YOLOv3的蓝宝石衬底表面缺陷检测方法,其特征在于,将所述待测量的蓝宝石衬底表面图像输入至所述特征提取网络,生成不同尺度的缺陷融合特征图,包括:
将所述待测量的蓝宝石衬底表面图像至所述特征提取网络,依次经过卷积模块和残差模块进行特征提取,输出不同尺度的表面缺陷特征图;
采用上采样技术扩大所述表面缺陷特征图的尺寸;
采用特征融合技术对扩大尺寸后的表面缺陷特征图进行融合,生成所述缺陷融合特征图。
4.如权利要求3所述的基于YOLOv3的蓝宝石衬底表面缺陷检测方法,其特征在于,所述卷积模块包括若干个卷积层,所述残差模块包括两个卷积层、特征融合函数及激活函数;所述卷积层采用1*1、3*3系列卷积层。
5.如权利要求2所述的基于YOLOv3的蓝宝石衬底表面缺陷检测方法,其特征在于,利用所述边框回归网络对所述缺陷融合特征图的类别和位置进行预测,包括:
采用K-means聚类算为不同尺度的所述缺陷融合特征图设定不同的锚框;
确定所述锚框与缺陷真实的位置之间的IOU值,筛选出最大IOU值对应的锚框,以对所述缺陷融合特征图的类别和位置进行预测。
6.如权利要求1所述的基于YOLOv3的蓝宝石衬底表面缺陷检测方法,其特征在于,还包括训练所述YOLOv3网络检测模型,包括:
采集若干张蓝宝石衬底的表面缺陷图像,利用LableImg标注工具对所述表面缺陷图像进行标注,生成训练样本;
将所述训练样本按照预设比例划分为训练集和验证集;
建立YOLOv3网络,并设置YOLOv3网络的参数;所述参数包括初始学习率、学习动量、训练步数、IOU阈值及NMS阈值;
利用所述训练集对所述YOLOv3网络进行训练,在所述验证集上进行所述YOLOv3网络的参数调节优化,直至网络误差损失函数收敛时,生成所述YOLOv3网络检测模型。
7.如权利要求6所述的基于YOLOv3的蓝宝石衬底表面缺陷检测方法,其特征在于,在所述利用LableImg标注工具对所述表面缺陷图像进行标注之前,还包括:
采用图像翻转,和/或图像平移,和/或生成对抗网络GAN的方式对所述表面缺陷图像进行数据扩充。
8.一种基于YOLOv3的蓝宝石衬底表面缺陷检测系统,其特征在于,所述系统包括:
图像获取单元,用于获取待测量的蓝宝石衬底表面图像;
缺陷检测单元,用于将所述待测量的蓝宝石衬底表面图像输入至YOLOv3网络检测模型,输出表面缺陷检测结果;所述YOLOv3网络检测模型包括特征提取网络和边框回归网络。
9.一种电子设备,其特征在于,包括显示器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1~7任一项所述基于YOLOv3的蓝宝石衬底表面缺陷检测方法的步骤。
10.一种计算机存储介质,所述计算机存储介质存储有计算机可执行的至少一个程序,其特征在于,所述至少一个程序被所述计算机执行时,使所述计算机执行上述权利要求1~7任一项所述基于YOLOv3的蓝宝石衬底表面缺陷检测方法中的步骤。
CN202311079642.0A 2023-08-25 2023-08-25 基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统 Pending CN117132564A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311079642.0A CN117132564A (zh) 2023-08-25 2023-08-25 基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311079642.0A CN117132564A (zh) 2023-08-25 2023-08-25 基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统

Publications (1)

Publication Number Publication Date
CN117132564A true CN117132564A (zh) 2023-11-28

Family

ID=88852198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311079642.0A Pending CN117132564A (zh) 2023-08-25 2023-08-25 基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统

Country Status (1)

Country Link
CN (1) CN117132564A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117456292A (zh) * 2023-12-26 2024-01-26 浙江晶盛机电股份有限公司 蓝宝石缺陷检测方法、装置、电子装置和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117456292A (zh) * 2023-12-26 2024-01-26 浙江晶盛机电股份有限公司 蓝宝石缺陷检测方法、装置、电子装置和存储介质
CN117456292B (zh) * 2023-12-26 2024-04-19 浙江晶盛机电股份有限公司 蓝宝石缺陷检测方法、装置、电子装置和存储介质

Similar Documents

Publication Publication Date Title
CN109919934B (zh) 一种基于多源域深度迁移学习的液晶面板缺陷检测方法
CN109683360B (zh) 液晶面板缺陷检测方法及装置
JP6669453B2 (ja) 画像分類装置および画像分類方法
CN108960135B (zh) 基于高分辨遥感图像的密集舰船目标精确检测方法
CN109977191B (zh) 问题地图检测方法、装置、电子设备和介质
CN114140679A (zh) 一种缺陷融合方法、装置、识别系统及存储介质
CN113920107A (zh) 一种基于改进yolov5算法的绝缘子破损检测方法
CN111932511B (zh) 一种基于深度学习的电子元器件质量检测方法与系统
CN117132564A (zh) 基于YOLOv3的蓝宝石衬底表面缺陷检测方法及系统
CN117152484B (zh) 基于改进的YOLOv5s的小目标布匹瑕疵检测方法
CN113393438B (zh) 一种基于卷积神经网络的树脂镜片缺陷检测方法
CN112132012A (zh) 基于生成对抗网络的高分辨率sar船舶图像生成方法
US20220076404A1 (en) Defect management apparatus, method and non-transitory computer readable medium
CN115829995A (zh) 基于像素级的多尺度特征融合的布匹瑕疵检测方法及系统
CN114255212A (zh) 一种基于cnn的fpc表面缺陷检测方法及其系统
JP2014137284A (ja) 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法
CN113506281B (zh) 一种基于深度学习框架的桥梁裂缝检测方法
WO2020087434A1 (zh) 一种人脸图像清晰度评价方法及装置
CN116363136A (zh) 一种机动车部件自动化生产在线筛选方法及系统
CN113469984B (zh) 一种基于yolo结构的显示面板外观检测方法
CN115546141A (zh) 一种基于多维度度量的小样本Mini LED缺陷检测方法及系统
CN115082444A (zh) 一种基于图像处理的铜管焊缝缺陷检测方法及系统
JP2020071716A (ja) 異常判定方法、特徴量算出方法、外観検査装置
CN114882298B (zh) 一种对抗互补学习模型的优化方法及装置
CN116030038B (zh) 基于缺陷生成的无监督oled缺陷检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination