CN115423737A - 基于多块主成分分析网络的晶圆图缺陷检测方法 - Google Patents

基于多块主成分分析网络的晶圆图缺陷检测方法 Download PDF

Info

Publication number
CN115423737A
CN115423737A CN202210424283.7A CN202210424283A CN115423737A CN 115423737 A CN115423737 A CN 115423737A CN 202210424283 A CN202210424283 A CN 202210424283A CN 115423737 A CN115423737 A CN 115423737A
Authority
CN
China
Prior art keywords
wafer map
training data
block
feature
wafer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210424283.7A
Other languages
English (en)
Inventor
邓晓刚
周奉玄
刘晓月
肖林勃
谭海燕
雷其昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202210424283.7A priority Critical patent/CN115423737A/zh
Publication of CN115423737A publication Critical patent/CN115423737A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • G06T2207/20032Median filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30148Semiconductor; IC; Wafer

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Testing Or Measuring Of Semiconductors Or The Like (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)

Abstract

本发明涉及一种基于多块主成分分析网络的晶圆图缺陷检测方法,其步骤为:首先对晶圆图进行尺寸统一化和滤噪的预处理;然后通过K均值聚类技术将PCANet模型提取的高维晶圆图特征分为不同的特征子块,然后对每个特征子块分别应用支持向量数据描述法建立监控子模型;最后使用贝叶斯融合策略将不同子块的监控模型融合为整体监控模型,并根据整体监控模型进行晶圆图缺陷的检测。本发明能提取到晶圆图中有助于缺陷检测的深层特征,并使用分块策略降低了特征差异性对晶圆图缺陷检测的影响,能够有效地提高晶圆图缺陷检测的性能。

Description

基于多块主成分分析网络的晶圆图缺陷检测方法
技术领域
本发明属于工业过程中的晶圆图缺陷检测领域,特别涉及一种利用基于多块主成分分析网络(简称:MBPCANet)对工业过程中的缺陷晶圆图进行检测的方法。
背景技术
在这个高速发展的信息化时代,半导体元件作为现代信息技术产业的基础和核心,已经应用在社会生产和生活的各个方面。晶圆作为制造半导体元件的基础性原材料,其重要性不言而喻。在制造晶圆的工艺过程中,包括离子注入、抛光、刻蚀等工艺操作,在这些工艺操作中几乎任意一个环节都会由于技术不精确或外在环境污染等而造成晶圆的缺陷。为了保证制造出的晶圆质量,需要对晶圆进行缺陷检测,并对有缺陷的晶圆进行相应的处理。
早期的晶圆图缺陷以人工检测为主,但是人工检测存在效率低下并且效果不佳的问题。随着人工智能技术的发展,以及人工检测遇到越来越多的困难,基于机器学习和深度学习的方法在晶圆图缺陷检测中得到了广泛的应用,并且取得了较好的效果。但是传统的机器学习方法不能很好的提取晶圆图中更深层的特征,并且存在计算扩展性差以及维数灾难等问题。传统的深度学习方法虽能提取到晶圆图深层的特征,但是存在需要大量的训练数据和参数训练时间过长等问题。
主成分分析网络(简称:PCANet)模型是一种轻量级的深度学习模型,既是深度学习方法,同时又融合传统的机器学习模型,能很好地提取到晶圆图中的深层特征,并且使用的参数较少,能有效的缩短模型训练的时间。但是如果将PCANet提取的晶圆图特征同等的输入进检测器进行检测,会导致没有区分力的特征掩盖有区分力的特征对检测的影响,从而影响检测的效果。因此,如何降低晶圆图特征间差异性对检测效果的影响需要进一步研究。
发明内容
本发明针对PCANet晶圆图缺陷检测模型忽视了特征差异性的问题,提出了一种基于多块主成分分析网络的晶圆图缺陷检测方法。该方法能够有效的提取到晶圆图数据中有助于晶圆图缺陷检测的重要特征,并降低特征差异性对晶圆图缺陷检测的影响,提高晶圆图缺陷检测的准确度。
为了达到上述目的,本发明提供了一种基于多块主成分分析网络的晶圆图缺陷检测方法,含有以下步骤:
(一)采集工业过程中的正常晶圆图样本作为训练数据集I,并对训练数据集I中的晶圆图样本进行预处理,预处理过程包括图像的尺寸统一化和中值滤波,经过预处理后的训练数据集表示为Ip
(二)使用预处理后的训练数据集Ip训练PCANet模型并提取训练数据特征集F,利用训练数据特征集F的均值mF和方差sF对训练数据特征集F进行标准化处理,经过标准化处理后的训练数据特征集表示为
Figure RE-GDA0003925894000000021
然后使用K均值聚类算法将标准化的训练数据特征集
Figure RE-GDA0003925894000000022
分为k个特征子块
Figure RE-GDA0003925894000000023
(三)对k个特征子块
Figure RE-GDA0003925894000000024
中的每个特征子块
Figure RE-GDA0003925894000000025
应用支持向量描述 (简称:SVDD)法建立基本的监控子模型,并将标准化的训练数据特征集
Figure RE-GDA0003925894000000026
投影到相应的 SVDD模型上计算监控变量Db(1≤b≤k),使用核密度估计方法根据置信水平β确定每个特征子块的置信极限
Figure RE-GDA0003925894000000027
然后使用贝叶斯融合策略构建整体统计量BD,并使用核密度估计方法根据置信水平β计算整体检测阈值BDlim
(四)采集包含正常晶圆图样本和缺陷晶圆图样本的测试数据集It,并对测试数据集It中的晶圆图样本进行预处理,预处理过程包括图像的尺寸统一化和中值滤波,经过预处理后的测试数据集表示为
Figure RE-GDA0003925894000000028
(五)使用训练好的PCANet模型提取预处理后的测试数据集
Figure RE-GDA0003925894000000029
的晶圆图特征集Ft,并利用训练数据特征集F的均值mF和方差sF对测试数据特征集Ft进行标准化处理,经过标准化处理后的测试数据特征集表示为
Figure RE-GDA00039258940000000210
(六)将标准化的测试数据特征
Figure RE-GDA00039258940000000211
投影到相应的SVDD模型上计算监控变量
Figure RE-GDA00039258940000000212
并通过贝叶斯融合策略计算测试样本的整体监控变量BDt,将测试样本的整体监控变量BDt与检测阈值BDlim进行比较,如果BDt>BDlim,则表示测试样本是缺陷晶圆图,否则是正常晶圆图。
进一步的,步骤(一)中,对包含N张正常晶圆图样本的训练数据集I=[I1,I2,...,IN]进行预处理,首先使用双三次插值算法对晶圆图进行缩放处理,将晶圆图的尺寸统一化为(28,28),然后对经过尺寸统一化处理后的训练数据集使用(3,3)的滤波核进行中值滤波处理,经过预处理后的训练数据集表示为
Figure RE-GDA0003925894000000031
进一步的,步骤(二)中,首先通过预处理后的训练数据集Ip训练PCANet模型并提取训练数据特征集F,训练PCANet模型并提取特征主要包括第一阶段主成分分析、第二阶段主成分分析、二进制哈希编码和块直方图三个阶段,具体步骤如下:
(1)第一阶段主成分分析
首先对训练数据集
Figure RE-GDA0003925894000000032
中的晶圆图按照逐个像素进行大小为k1×k2的块采样,然后对全部采样块进行级联学习,第
Figure RE-GDA0003925894000000033
张晶圆图表示为:
Figure RE-GDA0003925894000000034
其中,
Figure RE-GDA0003925894000000035
[k1/2]表示取整运算;然后对上述采集到的块进行零均值化处理,处理后的晶圆图块表示为:
Figure RE-GDA0003925894000000036
同样的,对训练数据集中的每张晶圆图都做相似的处理,经过处理后的训练集矩阵为:
Figure RE-GDA0003925894000000037
假设第一层的PCA滤波器数量为L1,那么PCANet模型的第一层PCA滤波器表示如下:
Figure RE-GDA0003925894000000038
其中,
Figure RE-GDA0003925894000000039
表示将X映射到矩阵大小为k1×k2的矩阵Wl 1,ql(XXT)表示XXT的第l个主要特征向量;
(2)第二阶段主成分分析
第二阶段PCA与第一阶段PCA相似,首先对第一阶段PCA产生的映射输出进行计算:
Figure RE-GDA00039258940000000310
Ii与Wl 1做卷积运算,并且做卷积运算之前,为了保证映射结果与原始晶圆图的尺寸相同,使用零值填充图像的边界,与第一阶段相似,在第二阶段同样对输入矩阵(PCANet第一阶段 PCA的输出矩阵)进行块采样、级联和零均值化处理:
Figure RE-GDA00039258940000000311
Figure RE-GDA0003925894000000041
然后对每一个矩阵都做相似的处理,得到第二层输入矩阵的块采样形式:
Figure RE-GDA0003925894000000042
同样的,第二层PCA滤波器也由相应的主特征向量组成,假设第二层的PCA滤波器数量为L2,则第二层PCA滤波器表示为:
Figure RE-GDA0003925894000000043
最终,通过PCANet模型的前两个阶段,每个晶圆图都会产生L1×L2个输出特征矩阵:
Figure RE-GDA0003925894000000044
(3)哈希编码和块直方图
首先对第二阶段的输出矩阵进行二值处理,处理后的输出矩阵数据只包含整数和零,接着对这些输出矩阵再通过公式(11)进行二进制哈希编码:
Figure RE-GDA0003925894000000045
其中H(·)是一个单位阶跃函数,经过以上处理,第二阶段输出矩阵数据中的每个像素值都被编码为
Figure RE-GDA0003925894000000046
之间的整数,第i张晶圆图共有L1个输出Ti l(l=1,2,...,L1),将每个输出Ti l划分为B个块,然后对每个块进行直方图统计再进行级联后得到的输出为:
Figure RE-GDA0003925894000000047
通过PCANet提取出的训练数据特征集表示为F=[f1,f2,...,fN],接着利用训练数据特征集F的均值mF和方差sF通过公式(13)对训练数据特征集F进行标准化处理,公式(13)的表达式为:
Figure RE-GDA0003925894000000048
经标准化处理后的训练数据特征集表示为
Figure RE-GDA0003925894000000049
然后使用K均值聚类算法将标准化的训练数据特征集
Figure RE-GDA00039258940000000410
分为k个特征子块
Figure RE-GDA00039258940000000411
进一步的,在步骤(三)中,对训练数据特征集中每个特征子块
Figure RE-GDA00039258940000000412
应用SVDD建立基本的监控子模型,SVDD的优化过程为寻找以c为中心,半径为R的最小超球体,使用
Figure RE-GDA0003925894000000051
中每个晶圆图样本的块特征向量
Figure RE-GDA0003925894000000052
建立每个特征子块的最小超球体,其最小超球体的目标函数为:
Figure RE-GDA0003925894000000053
其中,ζi为松弛变量,γ为惩罚系数,然后引入拉格朗日函数优化上述问题,得到超球中心c 的表达式为:
Figure RE-GDA0003925894000000054
其中,ai表示拉格朗日系数,将标准化的训练数据特征投影到相应的SVDD模型上,根据公式(16)计算晶圆图样本的块特征向量
Figure RE-GDA0003925894000000055
与超球中心c的距离作为每个特征子块的监控变量Db
Figure RE-GDA0003925894000000056
其中,
Figure RE-GDA0003925894000000057
表示高斯核函数,接着使用核密度估计方法根据置信水平β确定出每个特征子块的置信极限
Figure RE-GDA0003925894000000058
使用贝叶斯融合策略构建整体监控指标BD,通过公式(17)计算出标准化的训练数据特征集
Figure RE-GDA0003925894000000059
中晶圆图样本的块特征向量
Figure RE-GDA00039258940000000510
在第b个特征块中产生缺陷的概率
Figure RE-GDA00039258940000000511
Figure RE-GDA00039258940000000512
其中Pb(M)和Pb(N)分别表示晶圆图样本的块特征向量
Figure RE-GDA00039258940000000513
在第b个块中产生缺陷和正常的先验概率,如果将正常样本的置信水平设置为β,那么Pb(M)=1-β和Pb(N)=β,
Figure RE-GDA00039258940000000514
Figure RE-GDA00039258940000000515
分别表示晶圆图样本的块特征向量
Figure RE-GDA00039258940000000516
在第b个块中产生缺陷和正常的后验概率,他们的求解如公式(18)和公式(19)所示:
Figure RE-GDA00039258940000000517
Figure RE-GDA0003925894000000061
然后将不同子特征空间产生的缺陷概率结合起来以获得整体监控指标,使用缺陷概率来加权方程,从而获得的整体监控指标BD如公式(20)所示:
Figure RE-GDA0003925894000000062
其中
Figure RE-GDA0003925894000000063
是融合权重,能通过公式(21)计算得到:
Figure RE-GDA0003925894000000064
最后,使用核密度估计方法根据置信水平β计算整体检测阈值BDlim
进一步的,在步骤(四)中,对包含正常晶圆图和缺陷晶圆图的测试数据集It进行尺寸统一化和中值滤波处理,与步骤(一)相同,采用双三次插值算法将晶圆图尺寸统一化为(28, 28),使用滤波核为(3,3)的中值滤波算法进行滤波处理,经处理后的测试数据集表示为
Figure RE-GDA0003925894000000065
进一步的,在步骤(五)中,使用在步骤(二)中训练好的PCANet模型提取预处理后的测试数据集
Figure RE-GDA0003925894000000066
的晶圆图特征集Ft,并利用训练数据特征集F的均值mF和方差sF通过公式(22)对测试数据特征集Ft进行标准化处理,公式(22)的表达式为:
Figure RE-GDA0003925894000000067
经过标准化处理后的测试数据特征集表示为
Figure RE-GDA0003925894000000068
进一步的,在步骤(六)中,将标准化的测试数据特征
Figure RE-GDA0003925894000000069
投影到步骤(三)中训练好的相应SVDD模型上,并计算每个特征子块的监控变量
Figure RE-GDA00039258940000000610
然后根据步骤(三)中的贝叶斯融合策略计算测试晶圆图样本的整体监控变量BDt,将测试晶圆图样本的的整体监控变量BDt与步骤(三)中计算得到的检测阈值BDlim进行比较,如果BDt>BDlim,则表示测试晶圆图样本为缺陷晶圆图,否则是正常晶圆图。
与现有技术相比,本发明的有益效果在于:
本发明提供的基于多块主成分分析网络的晶圆图缺陷检测方法,首先对晶圆图进行预处理,然后使用K均值聚类算法对PCANet提取的特征进行分块处理,将晶圆图特征分为多个子特征块,接着对每个特征子块训练一个SVDD模型计算监控子模型,再使用贝叶斯融合策略将不同子块的监控模型融合为整体监控模型,最后根据整体监控模型进行晶圆图缺陷的检测。本发明能提取到晶圆图中有助于缺陷检测的深层特征,并使用分块策略降低了特征差异性对晶圆图缺陷检测的影响,能够有效地提高晶圆图缺陷检测的性能。
附图说明
图1为本发明实施例所述基于多块主成分分析网络的晶圆图缺陷检测方法的流程图;
图2为本发明实施例所述晶圆图经尺寸归一化处理后的效果图;
图3为本发明实施例所述晶圆图经中值滤波处理后的效果图;
图4为本发明实施例所述PCANet模型的结构图;
图5为本发明实施例所述WM-811K数据集中九种晶圆图类型;
具体实施方式
下面结合具体实施例对本发明进行详细的说明。然而应当理解,在没有进一步叙述的情况下,一个实施方式中的元件、结构和特征也可以有益地结合到其他实施方式中。
图1为本发明实施例中基于多块主成分分析网络的晶圆图缺陷检测方法的流程图,如图 1所示,本发明提供的基于多块主成分分析网络的晶圆图缺陷检测方法包括如下步骤:
(一)对包含N张正常晶圆图样本的训练数据集I=[I1,I2,...,IN]进行预处理,首先使用双三次插值算法对晶圆图进行缩放处理,将晶圆图的尺寸统一化为(28,28)(如图2所示),然后对经过尺寸统一化处理后的训练数据集使用(3,3)的滤波核进行中值滤波处理(如图 3所示),经过预处理后的训练数据集表示为
Figure RE-GDA0003925894000000071
(二)首先通过预处理后的训练数据集Ip训练PCANet模型并提取训练数据特征集F,训练PCANet模型并提取特征主要包括第一阶段主成分分析、第二阶段主成分分析、二进制哈希编码和块直方图三个阶段(PCANet模型结构如图4所示),具体步骤如下:
(1)第一阶段主成分分析
首先对训练数据集
Figure RE-GDA0003925894000000072
中的晶圆图按照逐个像素进行大小为k1×k2的块采样,然后对全部采样块进行级联学习,第
Figure RE-GDA0003925894000000073
张晶圆图的表示为:
Figure RE-GDA0003925894000000074
其中,
Figure RE-GDA0003925894000000081
[k1/2]表示取整运算;然后对上述采集到的块进行零均值化处理,处理后的晶圆图块表示为:
Figure RE-GDA0003925894000000082
同样的,对训练数据集中的每张晶圆图都做相似的处理,经过处理后的训练集矩阵为:
Figure RE-GDA0003925894000000083
假设第一层的PCA滤波器数量为L1,那么PCANet模型的第一层PCA滤波器表示如下:
Figure RE-GDA0003925894000000084
其中,
Figure RE-GDA0003925894000000085
表示将X映射到矩阵大小为k1×k2的矩阵Wl 1,ql(XXT)表示XXT的第l个主要特征向量;
(2)第二阶段主成分分析
第二阶段PCA与第一阶段PCA相似,首先对第一阶段PCA产生的映射输出进行计算:
Figure RE-GDA0003925894000000086
Ii与Wl 1做卷积运算,并且做卷积运算之前,为了保证映射结果与原始晶圆图的尺寸相同,使用零值填充图像的边界,与第一阶段相似,在第二阶段同样对输入矩阵(PCANet第一阶段 PCA的输出矩阵)进行块采样、级联和零均值化处理:
Figure RE-GDA0003925894000000087
Figure RE-GDA0003925894000000088
然后对每一个矩阵都做相似的处理,得到第二层输入矩阵的块采样形式:
Figure RE-GDA0003925894000000089
同样的,第二层PCA滤波器也由相应的主特征向量组成,假设第二层的PCA滤波器数量为L2,则第二层PCA滤波器表示为:
Figure RE-GDA00039258940000000810
最终,通过PCANet模型的前两个阶段,每个晶圆图都会产生L1×L2个输出特征矩阵:
Figure RE-GDA00039258940000000811
(3)哈希编码和块直方图
首先对第二阶段的输出矩阵进行二值处理,处理后的输出矩阵数据只包含整数和零,接着对这些输出矩阵再通过公式(11)进行二进制哈希编码:
Figure RE-GDA0003925894000000091
其中H(·)是一个单位阶跃函数,经过以上处理,第二阶段输出矩阵数据中的每个像素值都被编码为
Figure RE-GDA0003925894000000092
之间的整数,第i张晶圆图共有L1个输出Ti l(l=1,2,...,L1),将每个输出Ti l划分为B个块,然后对每个块进行直方图统计再进行级联后得到的输出为:
Figure RE-GDA0003925894000000093
通过PCANet提取出的训练数据特征集表示为F=[f1,f2,...,fN],接着利用训练数据特征集F的均值mF和方差sF通过公式(13)对训练数据特征集F进行标准化处理,公式(13)的表达式为:
Figure RE-GDA0003925894000000094
经标准化处理后的训练数据特征集表示为
Figure RE-GDA0003925894000000095
然后使用K均值聚类算法将标准化的训练数据特征集
Figure RE-GDA0003925894000000096
分为k个特征子块
Figure RE-GDA0003925894000000097
(三)对训练数据特征集中每个特征子块
Figure RE-GDA0003925894000000098
应用SVDD建立基本的监控子模型, SVDD的优化过程为寻找以c为中心,半径为R的最小超球体,使用
Figure RE-GDA0003925894000000099
中每个晶圆图样本的块特征向量
Figure RE-GDA00039258940000000910
建立每个特征子块的最小超球体,其最小超球体的目标函数为:
Figure RE-GDA00039258940000000911
其中,ζi为松弛变量,γ为惩罚系数,然后引入拉格朗日函数来优化上述问题,得到超球中心 c的表达式为:
Figure RE-GDA00039258940000000912
其中,ai表示拉格朗日系数,将标准化的训练数据特征投影到相应的SVDD模型上,根据公式(16)计算晶圆图样本的块特征向量
Figure RE-GDA0003925894000000101
与超球中心c的距离作为每个特征子块的监控变量Db
Figure RE-GDA0003925894000000102
其中,
Figure RE-GDA0003925894000000103
表示高斯核函数,接着使用核密度估计方法根据置信水平β确定出每个特征子块的置信极限
Figure RE-GDA0003925894000000104
使用贝叶斯融合策略构建整体监控指标BD,通过公式(17)计算出标准化的训练数据特征集
Figure RE-GDA0003925894000000105
中晶圆图样本的块特征向量
Figure RE-GDA0003925894000000106
在第b个特征块中产生缺陷的概率
Figure RE-GDA0003925894000000107
Figure RE-GDA0003925894000000108
其中Pb(M)和Pb(N)分别表示晶圆图样本的块特征向量
Figure RE-GDA0003925894000000109
在第b个块中产生缺陷和正常的先验概率,如果将正常样本的置信水平设置为β,那么Pb(M)=1-β和Pb(N)=β,
Figure RE-GDA00039258940000001010
Figure RE-GDA00039258940000001011
分别表示晶圆图样本的块特征向量
Figure RE-GDA00039258940000001012
在第b个块中产生缺陷和正常的后验概率,他们的求解如公式(18)和公式(19)所示:
Figure RE-GDA00039258940000001013
Figure RE-GDA00039258940000001014
然后将不同子特征空间产生的缺陷概率结合起来以获得整体监控指标,使用缺陷概率来加权方程,从而获得的整体监控指标BD如公式(20)所示:
Figure RE-GDA00039258940000001015
其中
Figure RE-GDA00039258940000001016
是融合权重,能通过公式(21)计算得到:
Figure RE-GDA00039258940000001017
最后,使用核密度估计方法根据置信水平β计算整体检测阈值BDlim
(四)对包含正常晶圆图和缺陷晶圆图的测试数据集It进行尺寸统一化和中值滤波处理,与步骤(一)相同,采用双三次插值算法将晶圆图尺寸统一化为(28,28),使用滤波核为(3, 3)的中值滤波算法进行滤波处理,经处理后的测试数据集表示为
Figure RE-GDA0003925894000000111
(五)使用在步骤(二)中训练好的PCANet模型提取预处理后的测试数据集
Figure RE-GDA0003925894000000112
的晶圆图特征集Ft,并利用训练数据特征集F的均值mF和方差sF通过公式(22)对测试数据特征集Ft进行标准化处理,公式(22)的表达式为:
Figure RE-GDA0003925894000000113
经过标准化处理后的测试数据特征集表示为
Figure RE-GDA0003925894000000114
(六)将标准化的测试数据特征
Figure RE-GDA0003925894000000115
投影到步骤(三)中训练好的相应SVDD模型上,并计算每个特征子块的监控变量
Figure RE-GDA0003925894000000116
然后根据步骤(三)中的贝叶斯融合策略计算测试晶圆图样本的整体监控变量BDt,将测试晶圆图样本的的整体监控变量BDt与步骤(三)中计算得到的检测阈值BDlim进行比较,如果BDt>BDlim,则表示测试晶圆图样本为缺陷晶圆图,否则是正常晶圆图。
上述方法中,步骤(一)至(三)为离线建模阶段,步骤(四)至(六)为在线测试阶段。
本发明上述基于多块主成分分析网络的晶圆图缺陷检测方法首先对晶圆图进行尺寸统一化和滤噪的预处理;然后通过K均值聚类技术将PCANet模型提取的高维晶圆图特征分为不同的特征子块,然后对每个特征子块分别应用支持向量数据描述法建立监控子模型;最后使用贝叶斯融合策略将不同子块的监控模型融合为整体监控模型,并根据整体监控模型进行晶圆图缺陷的检测。本发明能提取到晶圆图中有助于缺陷检测的深层特征,并使用分块策略降低了特征差异性对晶圆图缺陷检测的影响,能够有效地提高晶圆图缺陷检测的性能。
为了能更清楚地说明本发明上述晶圆图检测方法的有益效果,以下结合具体实施例对本发明上述晶圆图检测方法做出进一步说明。
实施例:WM-811K晶圆图数据集是目前已知公开的最大规模的晶圆图数据集。数据集包括八种缺陷晶圆图类型(Center,Donut,Edge-local,Edge-ring,Local,Random,Scratch,Near-full)和一种正常晶圆图类型(Nonpattern),晶圆图的九种类型如图5所示。
在本实施中,主要对五种晶圆图缺陷类型(Center、Donut、Edge-ring、Random和Scratch) 进行检测。从WM-811K数据集中在随机选取1400张晶圆图,其中训练数据集和验证数据集分别随机选取150个正常晶圆图样本,测试数据集随机选取300个正常晶圆图样本和800个缺陷晶圆图样本,做5次仿真实验,通过主成分分析网络与本发明基于多块主成分分析网络的晶圆图缺陷检测方法作对比,使用准确率、检出率和误报率指标来评价方法性能。
两种方法进行五次实验的准确率如表1所示:
表1
Figure RE-GDA0003925894000000121
由上述表1可知,本发明提出的基于多块主成分分析网络的晶圆图缺陷检测方法能够有效提高晶圆图缺陷检测的准确率。但准确率只能说明检测正确的整体情况,无法判断出检测模型对缺陷晶圆图和正常晶圆图的检测情况,因此在本实施例中增加检出率和误报率指标来更进一步衡量检测模型的性能。两种方法进行五次实验的检出率如表2所示,误报率如表3 所示。
表2
Figure RE-GDA0003925894000000122
表3
Figure RE-GDA0003925894000000123
Figure RE-GDA0003925894000000131
由上述表2和表3可知,本发明提出的基于多块主成分分析网络的晶圆图缺陷检测方法在保证误报率基本相同的情况下,对缺陷晶圆图的检出率明显提升。
在本实施例中,综合上述两种方法进行五次实验的准确率,检出率和误报率指标可知,本发明提出的基于多块主成分分析网络的晶圆图缺陷检测方法明显提升了晶圆图缺陷检测的性能。
以上所举实施例仅用为方便举例说明本发明,并非对本发明保护范围的限制,在本发明所述技术方案范畴,所属技术领域的技术人员所作各种简单变形与修饰,均应包含在以上申请专利范围中。

Claims (7)

1.一种基于多块主成分分析网络的晶圆图缺陷检测方法,含有以下步骤:
(一)采集工业过程中的正常晶圆图样本作为训练数据集I,并对训练数据集I中的晶圆图样本进行预处理,预处理过程包括图像的尺寸统一化和中值滤波,经过预处理后的训练数据集表示为Ip
(二)使用预处理后的训练数据集Ip训练多块主成分分析网络(简称:PCANet)模型并提取训练数据特征集F,利用训练数据特征集F的均值mF和方差sF对训练数据特征集F进行标准化处理,经过标准化处理后的训练数据特征集表示为
Figure FDA0003609088710000011
然后使用K均值聚类算法将标准化的训练数据特征集
Figure FDA0003609088710000012
分为k个特征子块
Figure FDA0003609088710000013
(三)对k个特征子块
Figure FDA0003609088710000014
中的每个特征子块
Figure FDA0003609088710000015
应用支持向量描述(简称:SVDD)法建立基本的监控子模型,并将标准化的训练数据特征集
Figure FDA0003609088710000016
投影到相应的SVDD模型上计算监控变量Db(1≤b≤k),使用核密度估计方法根据置信水平β确定每个特征子块的置信极限
Figure FDA0003609088710000017
然后使用贝叶斯融合策略构建整体统计量BD,并使用核密度估计方法根据置信水平β计算整体检测阈值BDlim
(四)采集包含正常晶圆图样本和缺陷晶圆图样本的测试数据集It,并对测试数据集It中的晶圆图样本进行预处理,预处理过程包括图像的尺寸统一化和中值滤波,经过预处理后的测试数据集表示为
Figure FDA0003609088710000018
(五)使用训练好的PCANet模型提取预处理后的测试数据集
Figure FDA0003609088710000019
的晶圆图特征集Ft,并利用训练数据特征集F的均值mF和方差sF对测试数据特征集Ft进行标准化处理,经过标准化处理后的测试数据特征集表示为
Figure FDA00036090887100000110
(六)将标准化的测试数据特征
Figure FDA00036090887100000111
投影到相应的SVDD模型上计算监控变量
Figure FDA00036090887100000112
并通过贝叶斯融合策略计算测试样本的整体监控变量BDt,将测试样本的整体监控变量BDt与检测阈值BDlim进行比较,如果BDt>BDlim,则表示测试样本是缺陷晶圆图,否则是正常晶圆图。
2.如权利要求1所述的基于多块主成分分析网络的晶圆图缺陷检测方法,其特征在于,所述步骤(一)中,对包含N张正常晶圆图样本的训练数据集I=[I1,I2,...,IN]进行预处理,首先使用双三次插值算法对晶圆图进行缩放处理,将晶圆图的尺寸统一化为(28,28),然后对经过尺寸统一化处理后的训练数据集使用(3,3)的滤波核进行中值滤波处理,经过预处理后的训练数据集表示为
Figure FDA0003609088710000021
3.如权利要求2所述的基于多块主成分分析网络的晶圆图缺陷检测方法,其特征在于,所述步骤(二)中,首先通过预处理后的训练数据集Ip训练PCANet模型并提取训练数据特征集F,训练PCANet模型并提取特征主要包括第一阶段主成分分析、第二阶段主成分分析、二进制哈希编码和块直方图三个阶段,具体步骤如下:
(1)第一阶段主成分分析
首先对训练数据集
Figure FDA0003609088710000022
中的晶圆图按照逐个像素进行大小为k1×k2的块采样,然后对全部采样块进行级联学习,第
Figure FDA0003609088710000023
张晶圆图的表示为:
Figure FDA0003609088710000024
其中,
Figure FDA0003609088710000025
[k1/2]表示取整运算;然后对上述采集到的块进行零均值化处理,处理后的晶圆图块表示为:
Figure FDA0003609088710000026
同样的,对训练数据集中的每张晶圆图都做相似的处理,经过处理后的训练集矩阵为:
Figure FDA0003609088710000027
假设第一层的PCA滤波器数量为L1,那么PCANet模型的第一层PCA滤波器表示如下:
Figure FDA0003609088710000028
其中,
Figure FDA0003609088710000029
表示将X映射到矩阵大小为k1×k2的矩阵
Figure FDA00036090887100000210
ql(XXT)表示XXT的第l个主要特征向量;
(2)第二阶段主成分分析
第二阶段PCA与第一阶段PCA相似,首先对第一阶段PCA产生的映射输出进行计算:
Figure FDA00036090887100000211
Ii与Wl 1做卷积运算,并且做卷积运算之前,为了保证映射结果与原始晶圆图的尺寸相同,使用零值填充图像的边界,与第一阶段相似,在第二阶段同样对输入矩阵(PCANet第一阶段PCA的输出矩阵)进行块采样、级联和零均值化处理:
Figure FDA0003609088710000031
Figure FDA0003609088710000032
然后对每一个矩阵都做相似的处理,得到第二层输入矩阵的块采样形式:
Figure FDA0003609088710000033
同样的,第二层PCA滤波器也由相应的主特征向量组成,假设第二层的PCA滤波器数量为L2,则第二层PCA滤波器表示为:
Figure FDA0003609088710000034
最终,通过PCANet模型的前两个阶段,每个晶圆图都会产生L1×L2个输出特征矩阵:
Figure FDA0003609088710000035
(3)哈希编码和块直方图
首先对第二阶段的输出矩阵进行二值处理,处理后的输出矩阵数据只包含整数和零,接着对这些输出矩阵再通过公式(11)进行二进制哈希编码:
Figure FDA0003609088710000036
其中H(·)是一个单位阶跃函数,经过以上处理,第二阶段输出矩阵数据中的每个像素值都被编码为
Figure FDA0003609088710000037
之间的整数,第i张晶圆图共有L1个输出
Figure FDA0003609088710000038
将每个输出
Figure FDA0003609088710000039
划分为B个块,然后对每个块进行直方图统计再进行级联后得到的输出为:
Figure FDA00036090887100000310
通过PCANet提取出的训练数据特征集表示为F=[f1,f2,...,fN],接着利用训练数据特征集F的均值mF和方差sF通过公式(13)对训练数据特征集F进行标准化处理,公式(13)的表达式为:
Figure FDA00036090887100000311
经标准化处理后的训练数据特征集表示为
Figure FDA00036090887100000312
然后使用K均值聚类算法将标准化的训练数据特征集
Figure FDA00036090887100000313
分为k个特征子块
Figure FDA00036090887100000314
4.如权利要求3所述的基于多块主成分分析网络的晶圆图缺陷检测方法,其特征在于,所述步骤(三)中,对训练数据特征集中每个特征子块
Figure FDA0003609088710000041
应用SVDD建立基本的监控子模型,SVDD的优化过程为寻找以c为中心,半径为R的最小超球体,使用
Figure FDA0003609088710000042
中每个晶圆图样本的块特征向量
Figure FDA0003609088710000043
建立每个特征子块的最小超球体,其最小超球体的目标函数为:
Figure FDA0003609088710000044
其中,ζi为松弛变量,γ为惩罚系数,然后引入拉格朗日函数来优化上述问题,得到超球中心c的表达式为:
Figure FDA0003609088710000045
其中,ai表示拉格朗日系数,将标准化的训练数据特征投影到相应的SVDD模型上,根据公式(16)计算晶圆图样本的块特征向量
Figure FDA0003609088710000046
与超球中心c的距离作为每个特征子块的监控变量Db
Figure FDA0003609088710000047
其中,
Figure FDA0003609088710000048
表示高斯核函数,接着使用核密度估计方法根据置信水平β确定出每个特征子块的置信极限
Figure FDA0003609088710000049
使用贝叶斯融合策略构建整体监控指标BD,通过公式(17)计算出标准化的训练数据特征集
Figure FDA00036090887100000410
中晶圆图样本的块特征向量
Figure FDA00036090887100000411
在第b个特征块中产生缺陷的概率
Figure FDA00036090887100000412
Figure FDA00036090887100000413
其中Pb(M)和Pb(N)分别表示晶圆图样本的块特征向量
Figure FDA00036090887100000414
在第b个块中产生缺陷和正常的先验概率,如果将正常样本的置信水平设置为β,那么Pb(M)=1-β和
Figure FDA00036090887100000415
Figure FDA0003609088710000051
分别表示晶圆图样本的块特征向量
Figure FDA0003609088710000052
在第b个块中产生缺陷和正常的后验概率,他们的求解如公式(18)和公式(19)所示:
Figure FDA0003609088710000053
Figure FDA0003609088710000054
然后将不同子特征空间产生的缺陷概率结合起来以获得整体监控指标,使用缺陷概率来加权方程,从而获得的整体监控指标BD如公式(20)所示:
Figure FDA0003609088710000055
其中
Figure FDA0003609088710000056
是融合权重,能通过公式(21)计算得到:
Figure FDA0003609088710000057
最后,使用核密度估计方法根据置信水平β计算整体检测阈值BDlim
5.如权利要求4所述的基于多块主成分分析网络的晶圆图缺陷检测方法,其特征在于,所述步骤(四)中,对包含正常晶圆图和缺陷晶圆图的测试数据集It进行尺寸统一化和中值滤波处理,与步骤(一)相同,采用双三次插值算法将晶圆图尺寸统一化为(28,28),使用滤波核为(3,3)的中值滤波算法进行滤波处理,经处理后的测试数据集表示为
Figure FDA0003609088710000058
6.如权利要求5所述的基于多块主成分分析网络的晶圆图缺陷检测方法,其特征在于,所述步骤(五)中,使用在步骤(二)中训练好的PCANet模型提取预处理后的测试数据集
Figure FDA0003609088710000059
的晶圆图特征集Ft,并利用训练数据特征集F的均值mF和方差sF通过公式(22)对测试数据特征集Ft进行标准化处理,公式(22)的表达式为:
Figure FDA00036090887100000510
经过标准化处理后的测试数据特征集表示为
Figure FDA00036090887100000511
7.如权利要求6所述的基于多块主成分分析网络的晶圆图缺陷检测方法,其特征在于,所述步骤(六)中,将标准化的测试数据特征
Figure FDA0003609088710000061
投影到步骤(三)中训练好的相应SVDD模型上,并计算每个特征子块的监控变量
Figure FDA0003609088710000062
然后根据步骤(三)中的贝叶斯融合策略计算测试晶圆图样本的整体监控变量BDt,将测试晶圆图样本的的整体监控变量BDt与步骤(三)中计算得到的检测阈值BDlim进行比较,如果BDt>BDlim,则表示测试晶圆图样本为缺陷晶圆图,否则是正常晶圆图。
CN202210424283.7A 2022-04-22 2022-04-22 基于多块主成分分析网络的晶圆图缺陷检测方法 Pending CN115423737A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210424283.7A CN115423737A (zh) 2022-04-22 2022-04-22 基于多块主成分分析网络的晶圆图缺陷检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210424283.7A CN115423737A (zh) 2022-04-22 2022-04-22 基于多块主成分分析网络的晶圆图缺陷检测方法

Publications (1)

Publication Number Publication Date
CN115423737A true CN115423737A (zh) 2022-12-02

Family

ID=84195782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210424283.7A Pending CN115423737A (zh) 2022-04-22 2022-04-22 基于多块主成分分析网络的晶圆图缺陷检测方法

Country Status (1)

Country Link
CN (1) CN115423737A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155186A (zh) * 2021-10-08 2022-03-08 四川大学 基于无监督学习的缺陷检测系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155186A (zh) * 2021-10-08 2022-03-08 四川大学 基于无监督学习的缺陷检测系统及方法

Similar Documents

Publication Publication Date Title
CN110992354A (zh) 基于引入自动记忆机制对抗自编码器的异常区域检测方法
CN115115921B (zh) 基于残差网路的晶圆缺陷模式识别方法
CN112381790A (zh) 一种基于深度自编码的异常图像检测方法
CN111079539A (zh) 一种基于异常追踪的视频异常行为检测方法
CN104978569B (zh) 一种基于稀疏表示的增量人脸识别方法
CN115021679B (zh) 一种基于多维离群点检测的光伏设备故障检测方法
WO2024021461A1 (zh) 缺陷检测方法及装置、设备、存储介质
CN114332008A (zh) 一种基于多层次特征重构的无监督缺陷检测与定位方法
CN108537133A (zh) 一种基于监督学习深度自编码器的人脸重构方法
CN116400168A (zh) 一种基于深度特征聚类的电网故障诊断方法及系统
CN117911792B (zh) 一种电压基准源芯片生产用引脚检测系统
CN113435321A (zh) 一种主轴轴承状态评估方法、系统、设备及可读存储介质
CN115423737A (zh) 基于多块主成分分析网络的晶圆图缺陷检测方法
CN112884721A (zh) 一种异常检测方法、系统及计算机可读存储介质
CN114970750A (zh) 一种对时间序列进行异常检测的方法、系统、设备及介质
CN113689383B (zh) 一种图像处理方法、装置、设备及存储介质
CN116823627A (zh) 一种基于图像复杂度评价的超大尺寸图像快速去噪方法
CN117274682B (zh) 一种基于异步co-teaching的含标签噪声数据分类方法
CN114003900A (zh) 变电站二次系统网络入侵检测方法、装置及系统
CN117372413A (zh) 一种基于生成对抗网络的晶圆缺陷检测方法
CN116127398B (zh) 一种基于机理模型与多源数据融合的液压泵故障诊断方法
CN109741313B (zh) 独立成分分析和卷积神经网络的无参考图像质量评价方法
CN116304721A (zh) 基于数据类别的大数据治理中数据标准制定方法及系统
CN115544811A (zh) 应用于数字孪生模型的数据管理方法
CN111666819B (zh) 一种融合多元信息的高精度视频异常事件检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination