CN115409824A - 一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法 - Google Patents

一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法 Download PDF

Info

Publication number
CN115409824A
CN115409824A CN202211084418.6A CN202211084418A CN115409824A CN 115409824 A CN115409824 A CN 115409824A CN 202211084418 A CN202211084418 A CN 202211084418A CN 115409824 A CN115409824 A CN 115409824A
Authority
CN
China
Prior art keywords
silicon wafer
adopting
image
convolution
surface defect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211084418.6A
Other languages
English (en)
Inventor
唐昆
彭琳和
潘淼
蔡文浩
李佳旺
唐伟东
罗源嫱
程波
张航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha University of Science and Technology
Original Assignee
Changsha University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changsha University of Science and Technology filed Critical Changsha University of Science and Technology
Priority to CN202211084418.6A priority Critical patent/CN115409824A/zh
Publication of CN115409824A publication Critical patent/CN115409824A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L22/00Testing or measuring during manufacture or treatment; Reliability measurements, i.e. testing of parts without further processing to modify the parts as such; Structural arrangements therefor
    • H01L22/10Measuring as part of the manufacturing process
    • H01L22/12Measuring as part of the manufacturing process for structural parameters, e.g. thickness, line width, refractive index, temperature, warp, bond strength, defects, optical inspection, electrical measurement of structural dimensions, metallurgic measurement of diffusions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • G06T2207/20032Median filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Manufacturing & Machinery (AREA)
  • Databases & Information Systems (AREA)
  • Power Engineering (AREA)
  • Quality & Reliability (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computer Hardware Design (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Testing Or Measuring Of Semiconductors Or The Like (AREA)

Abstract

本发明公开了一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法,检测方法包括:采集硅晶圆图像,采用图像处理方法提取硅晶圆区域,消除背景图像因素的影响,对每张纯硅晶圆图像采用改进的中值滤波进行滤波处理,采用经过滤波处理后的图像构建硅晶圆表面缺陷数据集,对硅晶圆表面缺陷数据集进行数据增强,采用改进的注意力机制并构建CNN模型,训练并评估CNN模型,通过评估结果对CNN模型进行参数微调,最后将CNN模型应用于硅晶圆表面缺陷检测。本发明所提出的CNN模型,能够有效提取缺陷特征,提高硅晶圆表面缺陷检测的准确率,降低漏检率,同时确保检测效率。

Description

一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法
技术领域
本发明属于硅晶圆表面缺陷检测领域,尤其是涉及一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法。
背景技术
近年来,以硅基芯片为代表的各类半导体器件在电子、通信、汽车、医疗、航空航天、军事等领域的应用日益广泛。硅晶圆是制备硅基芯片的原材料,其主要采用经提拉法制成的硅锭,通过切割与减薄,再经研磨与抛光生产而成,其质量直接决定了所制备芯片的良品率与生产成本。减少硅晶圆表面缺陷,提高其表面质量与精度,对于提高芯片制备的良品率和生产效率、降低生产成本,具有重要意义。
硅晶圆在生产过程中,易产生多种表面缺陷,包括:缺角、切割不良、划痕、材料剥落、裂纹、杂物、表面污染等。对于上述缺陷的检测,目前多采用人工抽检和基于机器视觉的光学检测;其中,前者多依赖检测者个人经验,且效率相对较低;而后者虽检测速度快且成本相对较低,但具有检测环境单一、误检率与漏检率较高的缺点。因此,有必要开发高效、高准确率的硅晶圆表面缺陷检测方法,以提升硅晶圆表面质量与精度,从而降低生产成本。
发明内容
针对硅晶圆表面缺陷复杂性高、传统硅晶圆表面缺陷检测方法检测精度低的问题,本发明旨在提供一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法。
结合图1至图3,本发明为解决上述技术问题采取的技术方案是:
一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法,所述方法包括以下步骤:
步骤1、使用图像采集装置依次对每张硅晶圆样本的全部区域进行拍摄,单次采集的图像为一张完整的硅晶圆图像,相机每次采集固定分辨率大小的图像。
步骤2、采用图像处理方法提取硅晶圆区域,消除背景图像因素的影响。
进一步的,所述步骤2的具体流程为:
步骤2.1、将步骤1中所采集的硅晶圆图像转化为灰度图像。
步骤2.2、采用二值化处理,选择硅晶圆所在的阈值区域。
步骤2.3、采用膨胀和腐蚀操作,平滑阈值区域的边缘。
步骤2.4、采用圆拟合,将所选择的区域拟合为标准的硅晶圆形状。
步骤2.5、提取出硅晶圆区域,获得不含背景图像的纯硅晶圆图像。
进一步的,本步骤中提取的纯硅晶圆图像为后续模型训练阶段使用,实际表面缺陷检测过程中采用的图像为图像采集装置实时采集的硅晶圆图像。
步骤3、采用改进的中值滤波方法,对步骤2所述的纯硅晶圆图像进行滤波处理,平滑图像中的噪声,保留图像的边缘部分。
进一步的,所述步骤3的中值滤波处理图像的表达式为:
Figure 188152DEST_PATH_IMAGE001
Figure 890528DEST_PATH_IMAGE002
(1)
公式(1)中,f(x, y)和g(x, y)分别表示同一位置像素点中值滤波前、后的灰度值;xy分别表示距离中心像素的水平、垂直偏移量;W表示以(x, y)为中心的邻域窗口像素点集合。
步骤4、构建硅晶圆表面缺陷数据集,并定义硅晶圆表面缺陷的类别。
进一步的,所述硅晶圆表面缺陷数据集按照比例7:1.5:1.5划分为训练集、验证集、测试集。
进一步的,所述硅晶圆表面缺陷数据集中所定义的每种缺陷类别的数量为1000至1100个。
进一步的,上述定义的每个缺陷对应1个包含缺陷类别与缺陷区域的标签,并采用随机旋转、水平翻转、宽度平移、高度平移以及通道平移方式进行数据增强。
步骤5、采用所述步骤4中构建的构建硅晶圆表面缺陷数据集,训练卷积神经网络模型,降低损失函数值;并通过不断微调相关参数对模型进行评估,直至满足要求。
进一步的,所述步骤5的具体流程为:
步骤5.1、采用所述步骤4中构建的构建硅晶圆表面缺陷数据集训练深度卷积神经网络(CNN)模型,该模型包含一个输入层、4个注意力卷积对、1个丢弃层、2个全连接层和1个输出层,模型结构如图2所示。
进一步的,所述每个注意力卷积对包含1个卷积层、1个通道注意力模块、1个空间注意力模块和1个空洞卷积层;其中,卷积与空洞卷积层采用归一化处理和非线性激活函数Swish激活,模型的输出层应用Softmax激活函数。
进一步的,所述通道注意力模块对输入特征分别采用最大池化与平均池化处理,输出的两种特征分别经过由2个卷积核大小为3×3的卷积层与1个卷积核1×1大小的卷积层组成的残差结构,经过残差结构输出的两种特征相加并采用Sigmoid函数激活,最后获得通道注意力特征Fc
进一步的,所述残差结构替代了常见的MLP层,小尺寸卷积核的卷积层能够更好的提取小尺度特征,且降低参数计算量。
进一步的,所述空间注意力模块将输入特征分别经过最大池化与平均池化处理,输出后的特征相加,再使用卷积核大小为5×5的卷积层提取特征,最后经过Sigmoid函数获得空间注意力特征Fs
进一步的,所述每个注意力卷积对的前后两个卷积层分别由大小为7×7和5×5的大卷积核提取特征,且后者采用空洞率为2的空洞卷积,以此扩大感受野并减小计算量。
进一步的,采用SpatialDropout丢弃层进行所述CNN模型的正则化处理。所述SpatialDropout丢弃层根据设置的参数随机独立删除部分特征元素,这些特征元素随后不再被后续操作使用,以减少模型训练的过拟合现象。所述SpatialDropout丢弃层应用于CNN模型中最后一个卷积层C8和第一个全连接层FC1之间,正则率为固定值。
进一步的,所述通道注意力模块与空间注意力模块能够使模型更加关注所需要的特征,且不会改变输入特征的维度与尺寸。
步骤5.2、采用交叉熵损失函数来度量输出概率分布和实际类别概率分布之间的损失函数,应用反向传播算法计算损失函数的梯度,并采用Adam随机优化器使损失最小化。
进一步的,对所述CNN模型参数采用自适应学习率算法AdaGrad,当参数损失偏导值较大时,应用一个较大的学习率;而当参数的损失偏导值较小时,应用一个较小的学习率。
步骤5.3、采用验证数据集微调相关参数对模型进行评估,直至满足要求。
进一步的,所述步骤5.3中CNN模型采用的性能指标包括:准确率、精确率、召回率、
Figure 783398DEST_PATH_IMAGE003
来进行评估。
步骤6、将训练好的模型应用于硅晶圆表面缺陷检测。
本发明的有益效果与特点在于:
(1)本发明所提出的注意力卷积对结构,由注意力模块、大卷积核的卷积层与空洞卷积层组成,空洞卷积层代替了传统CNN模型中的池化层,同时大卷积核的卷积层与空洞卷积层能够有效扩大提取特征的感受野,有效降低CNN模型缺陷漏检率;
(2)本发明所提出改进的注意力模块为将通道注意力模块中的MLP层,替换为由两个卷积核为3×3、一个卷积核为1×1的卷积层组成的残差结构,该结构提高了模型对小尺度特征的提取与网络的深度,在提高CNN模型缺陷检测精度的同时确保其检测效率;
(3)本发明将深度卷积神经网络与机器视觉相结合,提出了高精度的硅晶圆表面缺陷检测方法,该方法可有效解决人工抽检效率低与传统机器视觉方法中检测环境单一、漏检率高等问题,提高了缺陷检测效率,降低漏检率,从而保证硅晶圆的生产质量并降低生产成本。
附图说明
图1为本发明所述一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法的步骤;
图2为本发明所述用于硅晶圆表面缺陷检测的深度卷积神经网络模型结构;
图3为本发明所述深度卷积神经网络模型中的通道注意力模块与空间注意力模块结构;
具体实施方式
参见附图1~3,一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法,包括以下步骤:
步骤1、使用图像采集装置依次对每张硅晶圆样本的全部区域进行拍摄,单次采集的图像为一张完整的硅晶圆图像,相机每次采集1024x1024分辨率大小的图像。
步骤2、采用图像处理方法提取硅晶圆区域,消除背景图像因素的影响。
进一步的,所述步骤2的具体流程为:
步骤2.1、将步骤1中所采集的硅晶圆图像转化为灰度图像。
步骤2.2、采用二值化处理,选择硅晶圆所在的阈值区域。
步骤2.3、采用膨胀和腐蚀操作,平滑阈值区域的边缘。
步骤2.4、采用圆拟合,将所选择的区域拟合为标准的硅晶圆形状。
步骤2.5、提取出硅晶圆区域,获得不含背景图像的纯硅晶圆图像。
进一步的,本步骤中提取的纯硅晶圆图像为后续模型训练阶段使用,实际表面缺陷检测过程中采用的图像为图像采集装置实时采集的硅晶圆图像。
步骤3、采用改进的中值滤波方法,对步骤2所述的纯硅晶圆图像进行滤波处理,平滑图像中的噪声,保留图像的边缘部分。
进一步的,所述步骤3的中值滤波处理图像的表达式为:
Figure 557319DEST_PATH_IMAGE001
Figure 791815DEST_PATH_IMAGE004
(1)
公式(1)中,f(x, y)和g(x, y)分别表示同一位置像素点中值滤波前、后的灰度值;xy分别表示距离中心像素的水平、垂直偏移量;W表示以(x, y)为中心的邻域窗口像素点集合。
步骤4、构建硅晶圆表面缺陷数据集,并定义硅晶圆表面缺陷的类别为缺角、切割不良、划痕、材料剥落、裂纹、杂物、污染。
进一步的,所述硅晶圆表面缺陷数据集按照比例7:1.5:1.5划分为训练集、验证集、测试集。
进一步的,所述硅晶圆表面缺陷数据集中所定义的每种缺陷类别的数量为1000至1100个。
进一步的,上述定义的每个缺陷对应1个包含缺陷类别与缺陷区域的标签,标签文件以txt的格式保存,并采用随机旋转、水平翻转、宽度平移、高度平移以及通道平移方式进行数据增强。
步骤5、采用所述步骤4中构建的构建硅晶圆表面缺陷数据集,训练卷积神经网络模型,降低损失函数值;并通过不断微调相关参数对模型进行评估,直至满足要求。
进一步的,所述步骤5的具体流程为:
步骤5.1、采用所述步骤4中构建的构建硅晶圆表面缺陷数据集训练深度卷积神经网络(CNN)模型,该模型包含一个输入层、4个注意力卷积对、1个丢弃层、2个全连接层和1个输出层,模型结构如图2所示。
进一步的,所述每个注意力卷积对包含1个卷积层、1个通道注意力模块、1个空间注意力模块和1个空洞卷积层;其中,卷积与空洞卷积层采用归一化处理和非线性激活函数Swish激活,模型的输出层应用Softmax激活函数。
进一步的,所述通道注意力模块对输入特征分别采用最大池化与平均池化处理,输出的两种特征分别经过由2个卷积核大小为3×3的卷积层与1个卷积核1×1大小的卷积层组成的残差结构,经过残差结构输出的两种特征相加并采用Sigmoid函数激活,最后获得通道注意力特征Fc
进一步的,所述残差结构替代了常见的MLP层,小尺寸卷积核的卷积层能够更好的提取小尺度特征,且降低参数计算量。
进一步的,所述空间注意力模块将输入特征分别经过最大池化与平均池化处理,输出后的特征相加,再使用卷积核大小为5×5的卷积层提取特征,最后经过Sigmoid函数获得空间注意力特征Fs
进一步的,所述每个注意力卷积对的前后两个卷积层分别由大小为7×7和5×5的大卷积核提取特征,且后者采用空洞率为2的空洞卷积,以此扩大感受野并减小计算量。
进一步的,采用SpatialDropout丢弃层进行所述CNN模型的正则化处理。所述SpatialDropout丢弃层根据设置的参数随机独立删除部分特征元素,这些特征元素随后不再被后续操作使用,以减少模型训练的过拟合现象。所述SpatialDropout丢弃层应用于CNN模型中最后一个卷积层C8和第一个全连接层FC1之间,正则率为0.2。
进一步的,模型中的通道注意力模块与空间注意力模块能够使模型更加关注所需要的特征,且不会改变输入特征的维度与尺寸。
步骤5.2、使用交叉熵损失函数来度量输出概率分布和实际类别概率分布之间的损失函数,应用反向传播算法计算损失函数的梯度,采用Adam随机优化器使损失最小化;其中,交叉熵损失函数如公式(2)所示:
Figure 727410DEST_PATH_IMAGE005
(2)
式中,c为类别标签,
Figure 45259DEST_PATH_IMAGE006
为样本属于类别c的预测概率,
Figure 91712DEST_PATH_IMAGE007
为真实值,若样本的类别等于c则
Figure 936041DEST_PATH_IMAGE007
取1,否则为0。
进一步的,对所述CNN模型参数采用自适应学习率算法AdaGrad,当参数损失偏导值比较大时,有一个较大的学习率,当参数的损失偏导值较小时,有一个较小的学习率;对于小批量数据
Figure 544002DEST_PATH_IMAGE008
,AdaGrad算法的计算过程如公式(3)、(4)、(5)、(6)所示:
Figure 349147DEST_PATH_IMAGE009
(3)
Figure 199291DEST_PATH_IMAGE010
(4)
Figure 898126DEST_PATH_IMAGE011
(5)
Figure 441102DEST_PATH_IMAGE012
(6)
其中,r为全局学习率,
Figure 202385DEST_PATH_IMAGE013
为初始参数,
Figure 620335DEST_PATH_IMAGE014
为目标函数,
Figure 111359DEST_PATH_IMAGE015
为计算的梯度,
Figure 621975DEST_PATH_IMAGE016
为累计平方梯度。
步骤5.3、利用验证数据集微调相关参数对模型进行评估,直至满足要求;
具体的,进一步的,所述步骤5.3中CNN模型采用的性能指标包括:准确率、精确率、召回率、来进行评估,分类器的准确率定义了它从整个数据中正确预测的次数,定义为方程(7):
Figure 464029DEST_PATH_IMAGE017
(7)
其中TP、FP、FN和TN分别表示真阳性、假阳性、假阴性和真阴性,精确率和召回率的定义如下:
Figure 423020DEST_PATH_IMAGE018
(8)
Figure 706233DEST_PATH_IMAGE019
(9)
方程(8)和(9)表明,两种性能测度是成反比的,它们具有不同的分类测度质量。而
Figure 591013DEST_PATH_IMAGE003
计算了精确率和召回率的调和均值,定义如下:
Figure 717101DEST_PATH_IMAGE020
(10)
方程(10)表明
Figure 712739DEST_PATH_IMAGE003
是实际概率与预测概率之间的关系。如果这些概率彼此接近,
Figure 850459DEST_PATH_IMAGE003
将显示出更高的结果,反之亦然。
步骤6、将训练好的模型应用于硅晶圆表面缺陷检测。
上述具体实施方式阐明的内容应当理解为该具体实施方式仅用于更清楚地说明本发明,而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

Claims (5)

1.一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法,其特征在于:
所述方法包括以下步骤:
步骤1、使用图像采集装置依次对每张硅晶圆样本的全部区域进行拍摄,单次采集的图像为一张完整的硅晶圆图像,相机每次采集固定分辨率大小的图像;
步骤2、采用图像处理方法提取硅晶圆区域,消除背景图像因素的影响;
本步骤中提取的纯硅晶圆图像为后续模型训练阶段使用,实际表面缺陷检测过程中采用的图像为图像采集装置实时采集的硅晶圆图像;
步骤3、采用改进的中值滤波方法,对步骤2所述的纯硅晶圆图像进行滤波处理,平滑图像中的噪声,保留图像的边缘部分;
步骤4、构建硅晶圆表面缺陷数据集,并定义硅晶圆表面缺陷的类别;
所述硅晶圆表面缺陷数据集按照比例7:1.5:1.5划分为训练集、验证集、测试集;
所述硅晶圆表面缺陷数据集中所定义的每种缺陷类别的数量为1000至1100个;
上述定义的每个缺陷对应1个包含缺陷类别与缺陷区域的标签,并采用随机旋转、水平翻转、宽度平移、高度平移以及通道平移方式进行数据增强;
步骤5、采用所述步骤4中构建的构建硅晶圆表面缺陷数据集,训练卷积神经网络模型,降低损失函数值;并通过不断微调相关参数对模型进行评估,直至满足要求;
步骤6、将训练好的模型应用于硅晶圆表面缺陷检测。
2.根据权利要求1所述的一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法,其特征在于:
所述步骤2的具体流程为:
步骤2.1、将步骤1中所采集的硅晶圆图像转化为灰度图像;
步骤2.2、采用二值化处理,选择硅晶圆所在的阈值区域;
步骤2.3、采用膨胀和腐蚀操作,平滑阈值区域的边缘;
步骤2.4、采用圆拟合,将所选择的区域拟合为标准的硅晶圆形状;
步骤2.5、提取出硅晶圆区域,获得不含背景图像的纯硅晶圆图像。
3.根据权利要求1所述的一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法,其特征在于:
所述步骤3的中值滤波处理图像的表达式为:
Figure 658061DEST_PATH_IMAGE002
Figure 159450DEST_PATH_IMAGE004
(1)
公式(1)中,f(x, y)和g(x, y)分别表示同一位置像素点中值滤波前、后的灰度值;xy分别表示距离中心像素的水平、垂直偏移量;W表示以(x, y)为中心的邻域窗口像素点集合。
4.根据权利要求1所述的一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法,其特征在于:
步骤4中,所述硅晶圆表面缺陷数据集按照比例7:1.5:1.5划分为训练集、验证集、测试集;
所述硅晶圆表面缺陷数据集中所定义的每种缺陷类别的数量为1000至1100个;
上述定义的每个缺陷对应1个包含缺陷类别与缺陷区域的标签,并采用随机旋转、水平翻转、宽度平移、高度平移以及通道平移方式进行数据增强。
5.根据权利要求1所述的一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法,其特征在于:
所述步骤5的具体流程为:
步骤5.1、采用所述步骤4中构建的构建硅晶圆表面缺陷数据集训练深度卷积神经网络(CNN)模型,该模型包含一个输入层、4个注意力卷积对、1个丢弃层、2个全连接层和1个输出层;
所述每个注意力卷积对包含1个卷积层、1个通道注意力模块、1个空间注意力模块和1个空洞卷积层;其中,卷积与空洞卷积层采用归一化处理和非线性激活函数Swish激活,模型的输出层应用Softmax激活函数;
所述通道注意力模块对输入特征分别采用最大池化与平均池化处理,输出的两种特征分别经过由2个卷积核大小为3×3的卷积层与1个卷积核1×1大小的卷积层组成的残差结构,经过残差结构输出的两种特征相加并采用Sigmoid函数激活,最后获得通道注意力特征Fc
所述残差结构替代了常见的MLP层,小尺寸卷积核的卷积层能够更好的提取小尺度特征,且降低参数计算量;
所述空间注意力模块将输入特征分别经过最大池化与平均池化处理,输出后的特征相加,再使用卷积核大小为5×5的卷积层提取特征,最后经过Sigmoid函数获得空间注意力特征Fs
所述每个注意力卷积对的前后两个卷积层分别由大小为7×7和5×5的大卷积核提取特征,且后者采用空洞率为2的空洞卷积,以此扩大感受野并减小计算量;
采用SpatialDropout丢弃层进行所述CNN模型的正则化处理;所述SpatialDropout丢弃层根据设置的参数随机独立删除部分特征元素,这些特征元素随后不再被后续操作使用,以减少模型训练的过拟合现象;所述SpatialDropout丢弃层应用于CNN模型中最后一个卷积层C8和第一个全连接层FC1之间,正则率为固定值;
所述通道注意力模块与空间注意力模块能够使模型更加关注所需要的特征,且不会改变输入特征的维度与尺寸;
步骤5.2、采用交叉熵损失函数来度量输出概率分布和实际类别概率分布之间的损失函数,应用反向传播算法计算损失函数的梯度,并采用Adam随机优化器使损失最小化;
对所述CNN模型参数采用自适应学习率算法AdaGrad,当参数损失偏导值较大时,应用一个较大的学习率;而当参数的损失偏导值较小时,应用一个较小的学习率;
步骤5.3、采用验证数据集微调相关参数对模型进行评估,直至满足要求;
所述步骤5.3中CNN模型采用的性能指标包括:准确率、精确率、召回率、
Figure DEST_PATH_IMAGE005
来进行评估。
CN202211084418.6A 2022-09-06 2022-09-06 一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法 Pending CN115409824A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211084418.6A CN115409824A (zh) 2022-09-06 2022-09-06 一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211084418.6A CN115409824A (zh) 2022-09-06 2022-09-06 一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法

Publications (1)

Publication Number Publication Date
CN115409824A true CN115409824A (zh) 2022-11-29

Family

ID=84162782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211084418.6A Pending CN115409824A (zh) 2022-09-06 2022-09-06 一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法

Country Status (1)

Country Link
CN (1) CN115409824A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116228749A (zh) * 2023-05-04 2023-06-06 昆山润石智能科技有限公司 一种基于反事实解释的晶圆缺陷检测方法及系统
CN116540076A (zh) * 2023-07-06 2023-08-04 湖北芯研投资合伙企业(有限合伙) 一种基于平面表征的tsv内部空洞缺陷检测方法及系统
CN116740058A (zh) * 2023-08-11 2023-09-12 深圳市金胜电子科技有限公司 一种固态硬盘配套晶圆的质量检测方法
CN116843680A (zh) * 2023-08-29 2023-10-03 深圳市华盛源机电有限公司 Igbt功率模块散热器表面缺陷识别方法
CN117250208A (zh) * 2023-11-20 2023-12-19 青岛天仁微纳科技有限责任公司 基于机器视觉的纳米压印晶圆缺陷精准检测系统及方法
CN117522871A (zh) * 2024-01-04 2024-02-06 深圳市华拓半导体技术有限公司 基于视觉图像交互的半导体晶圆检测方法及系统
CN117710378A (zh) * 2024-02-06 2024-03-15 常熟理工学院 基于深度学习的晶圆表面缺陷检测方法、系统及存储介质

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116228749B (zh) * 2023-05-04 2023-10-27 昆山润石智能科技有限公司 一种基于反事实解释的晶圆缺陷检测方法及系统
CN116228749A (zh) * 2023-05-04 2023-06-06 昆山润石智能科技有限公司 一种基于反事实解释的晶圆缺陷检测方法及系统
CN116540076A (zh) * 2023-07-06 2023-08-04 湖北芯研投资合伙企业(有限合伙) 一种基于平面表征的tsv内部空洞缺陷检测方法及系统
CN116540076B (zh) * 2023-07-06 2023-09-12 湖北芯研投资合伙企业(有限合伙) 一种基于平面表征的tsv内部空洞缺陷检测方法及系统
CN116740058B (zh) * 2023-08-11 2023-12-01 深圳市金胜电子科技有限公司 一种固态硬盘配套晶圆的质量检测方法
CN116740058A (zh) * 2023-08-11 2023-09-12 深圳市金胜电子科技有限公司 一种固态硬盘配套晶圆的质量检测方法
CN116843680A (zh) * 2023-08-29 2023-10-03 深圳市华盛源机电有限公司 Igbt功率模块散热器表面缺陷识别方法
CN116843680B (zh) * 2023-08-29 2023-12-15 深圳市华盛源机电有限公司 Igbt功率模块散热器表面缺陷识别方法
CN117250208A (zh) * 2023-11-20 2023-12-19 青岛天仁微纳科技有限责任公司 基于机器视觉的纳米压印晶圆缺陷精准检测系统及方法
CN117250208B (zh) * 2023-11-20 2024-02-06 青岛天仁微纳科技有限责任公司 基于机器视觉的纳米压印晶圆缺陷精准检测系统及方法
CN117522871A (zh) * 2024-01-04 2024-02-06 深圳市华拓半导体技术有限公司 基于视觉图像交互的半导体晶圆检测方法及系统
CN117522871B (zh) * 2024-01-04 2024-04-16 深圳市华拓半导体技术有限公司 基于视觉图像交互的半导体晶圆检测方法及系统
CN117710378A (zh) * 2024-02-06 2024-03-15 常熟理工学院 基于深度学习的晶圆表面缺陷检测方法、系统及存储介质
CN117710378B (zh) * 2024-02-06 2024-04-30 常熟理工学院 基于深度学习的晶圆表面缺陷检测方法、系统及存储介质

Similar Documents

Publication Publication Date Title
CN115409824A (zh) 一种基于深度卷积神经网络的硅晶圆表面缺陷检测方法
CN109035149B (zh) 一种基于深度学习的车牌图像去运动模糊方法
CN111462012A (zh) 一种基于条件生成对抗网络的sar图像仿真方法
CN112184577A (zh) 基于多尺度自注意生成对抗网络的单幅图像去雾方法
CN110675411A (zh) 基于深度学习的宫颈鳞状上皮内病变识别算法
CN112634159B (zh) 基于盲噪声估计的高光谱图像去噪方法
CN113450269A (zh) 一种基于3d视觉的点云关键点提取方法
CN116563146A (zh) 基于可学习曲率图的图像增强方法与系统
CN116258664A (zh) 一种基于深度学习的光伏电池片智能缺陷检测方法
CN117291913B (zh) 一种水工混凝土结构表观裂缝测量方法
Chen et al. Robust dislocation defects region segmentation for polysilicon wafer image with random texture background
CN111612803B (zh) 一种基于图像清晰度的车辆图像语义分割方法
CN113112482A (zh) 一种基于注意力机制网络的pcb缺陷检测方法
CN116579985A (zh) 一种基于RefineDet模型的晶圆缺陷检测方法
CN111768420A (zh) 一种细胞图像分割模型
CN116071268A (zh) 基于对比学习的图像去光照模型及其训练方法
CN114092441A (zh) 一种基于双重神经网络的产品表面缺陷检测方法及系统
CN116977188A (zh) 一种基于深度全卷积神经网络的红外图像增强方法
CN111079715B (zh) 一种基于双字典学习的遮挡鲁棒性人脸对齐方法
CN112927169A (zh) 一种基于小波变换和改进的加权核范数最小化的遥感影像去噪方法
CN113192076A (zh) 联合分类预测和多尺度特征提取的mri脑肿瘤图像分割方法
CN112991257A (zh) 基于半监督孪生网络的异质遥感图像变化快速检测方法
CN112487947A (zh) 基于图像融合与目标检测网络的低照度图像目标检测方法
CN112085702A (zh) 一种基于关键区域稀疏深度的单目深度估计方法
CN112907475B (zh) 一种冰晶图片的自动分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination