CN110782546A - 基于组合树模型的半导体pvd制程的电阻率虚拟量测方法 - Google Patents
基于组合树模型的半导体pvd制程的电阻率虚拟量测方法 Download PDFInfo
- Publication number
- CN110782546A CN110782546A CN201910910087.9A CN201910910087A CN110782546A CN 110782546 A CN110782546 A CN 110782546A CN 201910910087 A CN201910910087 A CN 201910910087A CN 110782546 A CN110782546 A CN 110782546A
- Authority
- CN
- China
- Prior art keywords
- model
- virtual measurement
- data
- tree
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000005240 physical vapour deposition Methods 0.000 title claims abstract description 25
- 239000004065 semiconductor Substances 0.000 title claims abstract description 18
- 239000013598 vector Substances 0.000 claims abstract description 15
- 238000005457 optimization Methods 0.000 claims description 23
- 238000004519 manufacturing process Methods 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000007637 random forest analysis Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims 1
- 238000011160 research Methods 0.000 claims 1
- 235000012431 wafers Nutrition 0.000 description 28
- 238000002474 experimental method Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 6
- 238000000053 physical method Methods 0.000 description 6
- 238000010238 partial least squares regression Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000005530 etching Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001312 dry etching Methods 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 238000000623 plasma-assisted chemical vapour deposition Methods 0.000 description 1
- 238000005498 polishing Methods 0.000 description 1
- 238000000275 quality assurance Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C3/00—Registering or indicating the condition or the working of machines or other apparatus, other than vehicles
- G07C3/14—Quality control systems
- G07C3/146—Quality control systems during manufacturing process
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C3/00—Registering or indicating the condition or the working of machines or other apparatus, other than vehicles
- G07C3/005—Registering or indicating the condition or the working of machines or other apparatus, other than vehicles during manufacturing process
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Manufacturing & Machinery (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Testing Or Measuring Of Semiconductors Or The Like (AREA)
Abstract
本发明公开了一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法,包括以下步骤:一、将基于组合预测方法[7]构建集成树组合模型,对WAT的电气参数进行在线虚拟量测;二、该集成树组合模型将4种集成树作为基学习器对晶圆制程状态信息进行初步虚拟量测,并将4个基学习器的预测结果转换为元特征向量,作为集成树元学习器的输入,进行进一步的虚拟量测,集成树模型相对于常见的虚拟量测模型LASSO、PLSR、SVR、GPR、ANN模型更加适用于PVD制程上的虚拟量测,而集成树组合模型比单一集成树虚拟量测模型具有更高的预测精度,可以做到实时监控和预警,将预警时间大大提前。
Description
技术领域
本发明涉及电阻率虚拟量测技术领域,具体是一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法。
背景技术
在半导体制造企业,晶圆制程主要包括光刻(Photo)、蚀刻(Etch)、扩散(Diffusion,Diff)、化学-机械抛光(Chemical-Mechanical Polish,CMP)等制程,制程的控制是晶圆生产非常重要的环节。现阶段晶圆可接受性测试(Wafer Acceptance Test, WAT)作为晶圆产出的首要的品质保障,是一种非生产性的电气测试技术,用来监测晶圆制程状态,包括设备特性和电阻器、电容器、联通性、连续性、间隔、绝缘性、渗漏性。在现有的半导体制造过程中,晶圆可接受性测试是对已经完成的300-400道制程工艺的状态信息进行检测。WAT的事后检测的性质使得制程中晶圆品质变化不能被及时侦测。为了解决这种问题,基于机台参数和传感器数据的预测晶圆品质的虚拟量测(Virtual Metrology, VM)方法,被用来侦测制程中每片晶圆的品质,辅助物理量测,避免了高成本的物理量测。通过虚拟量测方法对WAT量测参数和生产过程数据的分析,可以发现半导体制程工艺中的问题,有助于制程工艺的调整;并通过研究WAT各量测参数与生产机台参数的相关性,提前预测晶圆制程工艺的状态信息,对提升产品质量和缩减生产周期产生非常重要的意义。
虚拟量测解决方法通常基于机器学习方法,常用的虚拟量测模型有多元线性回归、偏最小二乘回归(Partial least Squares Regression,PLSR)、支持量机回归(SupportVector Regression,SVR)、高斯进程回归(Gaussian Process Regression,GPR)以及神经网络模型(Artificial Neural Network,ANN)。Park C等通过对光谱信号的虚拟量测实验,验证了基于fused-LASSO的虚拟量测模型对光谱信号识别的有效性,发现fused-LASSO算法所选取的特征构成的VM模型比基于LASSO和弹性网络的VM模型具有更高的预测精度和健壮性[1]。Kang P等提出了一种于自训练的半监督支持向量回归方法用于半导体虚拟量测,该方法解决了传统模型对新数据的预测的不确定性,通过实验对比,发现其比传统的有监督SVR方法更准确,并且训练时间更快[2]。Abdullah M等基于多层感知器 (MultilayerPerceptron,MLP)模型对半导体氧化物蚀刻腔体内的颗粒污染水平进行虚拟量测,并认为该方法可以取代原有的Surf-scan方法[3]。Hirai T等利用基于局部加权 PLS的实时VM方法预测实际干法刻蚀过程的刻蚀转换差异,预测结果优于基于序列更新模型和ANN的虚拟量测,并且验证了其对于机台维护影响的健壮性[4]。Darwin T等采用GPR 方法对于等离子体增强化学气相沉积制程相关的晶片平均膜厚度进行虚拟量测,发现基于 GPR的VM方法比基于PLSR的方法获得更高的平均精度[5]。Kang S等则采用集成ANN作为VM模型,将预测结果、可靠性估计和模型更新整合到所提出的VM系统中,并通过实验证明了该方法的有效性[6]。
上述虚拟量测方法大多采用单一模型或方法进行预测,模型达到一定的预测精度,但是存在模型学习的信息角度单一的问题,预测精度具有进一步提升的空间。原因是,在复杂的半导体晶圆制造工序条件下,存在诸多随机或模糊等不确定性因素,如果模型能够捕获更多的不确定性因素,模型的预测精度则会进一步提升,因此,本领域技术人员提供了一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法,以解决上述背景技术中提出的问题。
发明内容
本发明的目的在于提供一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法,包括以下步骤:
一、将基于组合预测方法[7]构建集成树组合模型,对WAT的电气参数进行在线虚拟量测;
二、该集成树组合模型将4种集成树作为基学习器对晶圆制程状态信息进行初步虚拟量测,并将4个基学习器的预测结果转换为元特征向量,作为集成树元学习器的输入,进行进一步的虚拟量测,并利用序列模型优化(Sequential Model-Based Optimization,SMBO)算法[20]对组合预测模型进行了超参优化;
三、该集成树组合模型结合Bagging、Boosting和Stacking技术,首先基于RandomForest、Extra-Trees、XGBoost、lightGBM 4种基学习器(Base learner)对晶圆物理气相沉淀制程进行初步虚拟量测,然后将4个基学习器的预测结果转换为元特征向量,作为元学习器(Meta learner)lightGBM的输入,进行进一步的虚拟量测;
四、为提升虚拟量测精度,采用序列模型优化算法对组合预测模型进行超参优化,序列模型优化是先利用随机抽样初始化起始超参,再基于树形结构Parzen估计器代理模型逼近组合模型,并采用期望提升度函数推荐超参,进而获得优化的组合模型;
五、最后通过与常用的虚拟量测方法在物理气相沉淀电阻率上的虚拟量测表现进行对比研究,验证了本文所提方法的优异性,集成树组合模型有更准确的预测精度。
所述集成树组合模型需要实现集成树组合预测系统,其实现步骤如下:
第一步:连接半导体制造厂数据库,将虚拟量测所需数据相关的数据库信息整理出来,并进行连接;
第二步:就虚拟量测所需数据从数据库中进行抽取,并存放到本地数据库或者存储为本地数据文件;
第三步:对所抽取的数据进行预处理,包括数据空值处理、异常值处理、数据标准化等;
第四步:就预处理后的数据进行特征筛选,特征筛选模型选为XGBoost,根据xgboost 模型对每个特征的打分进行特征排序,筛除排名靠后的特征,剩余特征作为所选特征输入集成树组合模型。
第五步:首先基于RandomForest、Extra-Trees、XGBoost、lightGBM 4种基学习器(Base learner)进行初步模型训练(并采用SMBO优化方法对模型进行优化)/预测,然后将4个基学习器的拟合/预测结果转换为元特征向量,作为元学习器(Meta learner) lightGBM的输入,进行进一步的模型训练(采用SMBO对元学习器进行优化)/预测。
第六步:对组合模型的拟合/预测结果进行评价。
与现有技术相比,本发明的有益效果是:
1、集成树模型相对于常见的虚拟量测模型LASSO、PLSR、SVR、GPR、ANN模型更加适用于PVD制程上的虚拟量测,而集成树组合模型比单一集成树虚拟量测模型具有更高的预测精度;
2、可以做到实时监控和预警,将预警时间大大提前;
3、可以更早的发现制程上的缺陷,并作出处置;
4、进一步提高良品率。
附图说明
图1为一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法中集成树组合预测系统工作流程示意图;
图2为TSNE降维散点图;
图3为部分非关键性的噪声特征图;
图4为展示试验的预测结构数据图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中,结合图1所示,一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法,包括以下步骤:
一、将基于组合预测方法[7]构建集成树组合模型,对WAT的电气参数进行在线虚拟量测;
二、该集成树组合模型将4种集成树作为基学习器对晶圆制程状态信息进行初步虚拟量测,并将4个基学习器的预测结果转换为元特征向量,作为集成树元学习器的输入,进行进一步的虚拟量测,并利用序列模型优化(Sequential Model-Based Optimization,SMBO)算法[20]对组合预测模型进行了超参优化;
三、该集成树组合模型结合Bagging、Boosting和Stacking技术,首先基于RandomForest、Extra-Trees、XGBoost、lightGBM 4种基学习器(Base learner)对晶圆物理气相沉淀制程进行初步虚拟量测,然后将4个基学习器的预测结果转换为元特征向量,作为元学习器(Meta learner)lightGBM的输入,进行进一步的虚拟量测;
四、为提升虚拟量测精度,采用序列模型优化算法对组合预测模型进行超参优化,序列模型优化是先利用随机抽样初始化起始超参,再基于树形结构Parzen估计器代理模型逼近组合模型,并采用期望提升度函数推荐超参,进而获得优化的组合模型;
五、最后通过与常用的虚拟量测方法在物理气相沉淀电阻率上的虚拟量测表现进行对比研究,验证了本文所提方法的优异性,集成树组合模型有更准确的预测精度。
组合预测是由两个阶段组成的。首先,在数据集的基础上学习不同的模型。然后,收集每个模型的输出以创建一个新的数据集。在新的数据集中,每个实例都与它预测的实际值相关。其次,该数据集根据组合规则进行组合,以便提供最终输出。组合预测常见的一种形式是集成学习模型,集成学习作为机器学习的一大分支,有许多分类,包括 Bagging[9-11]、Boosting[12-17]、Stacking[18,19]。
表1不同树模型的一般比较
Table 1 General comparison of different tree models
决策树[8]常被应用于集成学习算法中。由于多个单决策树组合而成的集成树模型从有监督学习模型中脱颖而出,展示出非常优异的模型表现[23,24]。常见的Bagging集成树有BaggingTree[9]、RandomForest[10]、Extra-Trees[11]。常见的Boosting集成树有AdaBoost[12]、GBDT[13,14]、XGBoost[15]、lightGBM[16]以及CatBoost[17]。表1列出了对单个决策树、几种基本集成方法的一般比较。组合预测成功的取决于如何进行数据准备、选择基学习器、选择组合规则、以及选择模型优化方法。为此,我们构建了一个集成树组合预测系统。其中,组合模型选择预测精度高和运算速度快的RandomForest、 Extra-Trees、XGBoost、lightGBM四种学习器作为基学习器,lightGBM作为元学习器,构建Stacking集成树组合预测模型。为了进一步增加算法在每个不同数据上的性能,我们使用数据预处理模块和特征选择模块保证数据质量,并用SMBO方法分别优化集成树组合模型的基学习器和元学习器的超参数。原因是,SMBO是一种通用的适用于分类和连续超参数的随机优化算法,相对于手工调整、随机搜索方法,SMBO具有更优的表现。
为衡量虚拟量测模型的效果,虚拟量测误差常使用均方根误差(Root MeanSquare Error,RMSE)与平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)来量化虚拟量测与物理量测之间偏差。均方根误差是衡量虚拟量测与物理量测的之间的均方误差的平方根大小,是一种绝对误差;平均绝对百分比误差则是衡量虚拟量测与物理量测的误差相对于物理量测的比值的绝对值的平均水平,是一种相对误差。RMSE和MAPE公式如下:
其中,为物理量测值,为虚拟量测值,为样本数量。考虑到设备或零件的老化或者维护的影响,若虚拟量测模型的效果的评估变得低于预测精度的容忍度,需基于近期一段时间的数据,对集成树组合预测系统的特征选择模块和组合预测模块进行更新。
集成树组合预测系统实现步骤如下:
第一步:连接半导体制造厂数据库,将虚拟量测所需数据相关的数据库信息整理出来,并进行连接;
第二步:就虚拟量测所需数据从数据库中进行抽取,并存放到本地数据库或者存储为本地数据文件;
第三步:对所抽取的数据进行预处理,包括数据空值处理、异常值处理、数据标准化等;
第四步:就预处理后的数据进行特征筛选,特征筛选模型选为XGBoost,根据xgboost 模型对每个特征的打分进行特征排序,筛除排名靠后的特征,剩余特征作为所选特征输入集成树组合模型。
第五步:首先基于RandomForest、Extra-Trees、XGBoost、lightGBM 4种基学习器(Base learner)进行初步模型训练(并采用SMBO优化方法对模型进行优化)/预测,然后将4个基学习器的拟合/预测结果转换为元特征向量,作为元学习器(Meta learner) lightGBM的输入,进行进一步的模型训练(采用SMBO对元学习器进行优化)/预测。
第六步:对组合模型的拟合/预测结果进行评价。
实施例1
虚拟量测所需的数据包括两大部分,一部分是大量的机台传感器数据,另一部分是晶圆验收测试的各种物理量测数据。本案例主要对与一个机台上的三道PVD制程相关的晶圆电阻率进行虚拟量测,机台参数包括机台的温度、空气湿度、电压、电流,腔内气体,压力等。数据准备过程如下:a.根据工程师经验选择与目标变量晶圆电阻率相关的制程传感器数据;b.根据晶圆标识,将传感器数据与物理量测数据进行数据整合;c.对整合后的数据删除包含大量空值的机台参数;d.删除含有空值的样本;e.删除为常量的机台参数;f. 标准化样本数据;
表2晶圆电阻率量测和机台参数样本
Table 2 Samples of wafer resistivity metrology and tool parameter
lot | wafer | label | f1 | f2 | ... | f38 | f39 | f40 | f41 | 142 | ... | f69 | f70 |
DA3549 | 7 | 3.5208 | 1204 | 1001 | ... | 300 | 301 | 300 | 300 | 300 | ... | 8 | 3 |
DA2846 | 9 | 3.4934 | 1213 | 1011 | ... | 301 | 301 | 301 | 300 | 301 | ... | 9 | 6 |
DA3548 | 10 | 3.935 | 1205 | 1007 | ... | 300 | 300 | 300 | 300 | 300 | ... | 8 | 4 |
DA3235 | 19 | 3.4718 | 1202 | 1004 | ... | 300 | 300 | 300 | 300 | 300 | ... | 10 | 10 |
DA4122 | 15 | 3.4998 | 1205 | 1004 | ... | 300 | 300 | 300 | 300 | 300 | ... | 10 | 10 |
DA4967 | 13 | 3.534 | 1205 | 1002 | ... | 300 | 300 | 300 | 300 | 300 | ... | 10 | 10 |
DA3550 | 22 | 3.622 | 1201 | 1001 | ... | 300 | 300 | 300 | 300 | 300 | ... | 9 | 9 |
DA3552 | 24 | 3.6752 | 1201 | 1001 | ... | 300 | 300 | 300 | 299 | 300 | ... | 9 | 8 |
DA4120 | 17 | 3.2564 | 1201 | 998 | ... | 300 | 300 | 300 | 300 | 300 | ... | 10 | 10 |
DA3962 | 25 | 3.4004 | 1201 | 1001 | ... | 300 | 300 | 300 | 300 | 300 | ... | 10 | 10 |
经过上述数据准备阶段,我们得到22327片晶圆,70个机台参数,表2展示了晶圆电阻率量测数据和机台参数数据,其中lot和wafer两列是晶圆信息标识,label列为晶圆电阻率物理量测值,f1-f70为制程机台参数。为分析样本点的离群性,我们使用TSNE降维方法对全部特征进行两维降维处理。如图2所示,样本点呈椭圆形分布,并没有发现异常点,表明样本数据的分布比较均匀。
为了排除一部分非关键性的噪声特征,缩小优化特征子集搜索范围,本文使用XGBoost 变量筛选方法对影响WAT值的机台传感器变量进行筛选,特征部分见图3,筛除排名较后的9个特征。
为了验证文中提出的虚拟量测方法,将分别应用SMBO和随机搜索方法对基学习器RandomForest、Extra-Trees、XGBoost、lightGBM算法进行优化,以及对元学习器lightGBM算法优化。模型超参数空间配置见表3。本文通过30次实验验证所提方法的稳定性,每次实验将数据按照80%、20%的比例随机抽样成训练数据集、测试数据集,并进行50次超参优化迭代,其中,前20次迭代为起始随机超参组合。
表3模型超参配置空间
Table 3.Configuration space of model hyperparameter
为验证组合模型性能的优异性,表4给出了基于SMBO的超参数优化方法的RandomForest、Extra-Trees、XGBoost、lightGBM,以及集成树组合模型,30次实验的最优模型表现汇总比较,包括RMSE与MAPE的最大值(Max)、最小值(Min)、平均值(Mean) 与变异系数(C·V)四个评价指标。表4中,五种模型30次试验的最优模型表现的变异系数均在1%水平左右,模型的波动均比较小,表明各个预测模型的性能具有可靠的稳定程度。而组合预测RMSE均值则相对于RandomForest、Extra-Trees、XGBoost、lightGBM分别改进了0.953%、1.041%、0.938%、1.543%,最大值分别改进了1.150%、0.823%、0.863%、 1.489%,最小值分别改进了0.768%、1.031%、0.781%、1.344%;组合预测MAPE均值则相对于RandomForest、Extra-Trees、XGBoost、lightGBM分别改进了1.064%、0.986%、 0.860%、1.692%,最大值分别改进了1.181%、0.778%、1.653%、0.573%,最小值分别改进了1.089%、1.177%、0.842%、1.709%。综上,集成树组合预测模型在模型表现总体上优于单一集成树模型。
表4多次实验最优模型表现汇总比较
Table 4.Summary and comparison of the optimal model performance ofmultiple experiments
表5分别给出了常见的虚拟量测模型LASSO、PLSR、SVR、GPR、ANN和集成树组合模型的模型表现,组合模型在RMSE和MAPE两个平均指标上明显均优于其他5种模型。图4展示该次实验的预测结果,上图中上部分展示的是测试数据集实际值与预测值之间的回归,显示预测结果是否与实际值吻合,点越接近拟合线表示组合模型虚拟量测效果越好,其中X轴是预测结果,Y轴是目标实际值。中图展示的是部分测试实际值与预测值的拟合图,虚拟量测模型可以提供精确的预测。虚拟测量的精度不可避免的会受到随机噪声的影响。噪声越大,预测精度越差。下图中展示了虚拟量测模型预测的相对误差百分比。
表5单次实验模型虚拟量测表现
Table 5.Virtual metrology performance of single experiment
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (6)
1.一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法,其特征在于,包括以下步骤:
一、将基于组合预测方法[7]构建集成树组合模型,对WAT的电气参数进行在线虚拟量测;
二、该集成树组合模型将4种集成树作为基学习器对晶圆制程状态信息进行初步虚拟量测,并将4个基学习器的预测结果转换为元特征向量,作为集成树元学习器的输入,
进行进一步的虚拟量测;
三、该集成树组合模型结合Bagging、Boosting和Stacking技术,首先基于RandomForest、Extra-Trees、XGBoost、lightGBM 4种基学习器(Base learner)对晶圆物理气相沉淀制程进行初步虚拟量测,然后将4个基学习器的预测结果转换为元特征向量,作为元学习器(Metalearner)lightGBM的输入,进行进一步的虚拟量测;
四、为提升虚拟量测精度,采用序列模型优化算法对组合预测模型进行超参优化;
五、最后通过与常用的虚拟量测方法在物理气相沉淀电阻率上的虚拟量测表现进行对比研究。
2.根据权利要求1所述的一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法,其特征在于,所述组合预测模型利用序列模型优化(Sequential Model-BasedOptimization,SMBO)算法[20]进行超参优化。
3.根据权利要求1所述的一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法,其特征在于,所述序列模型优化是先利用随机抽样初始化起始超参,再基于树形结构Parzen估计器代理模型逼近组合模型,并采用期望提升度函数推荐超参,进而获得优化的组合模型。
4.根据权利要求1-3所述的一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法,其特征在于,所述集成树组合模型需要实现集成树组合预测系统,其实现步骤如下:
第一步:连接半导体制造厂数据库,将虚拟量测所需数据相关的数据库信息整理出来,并进行连接;
第二步:就虚拟量测所需数据从数据库中进行抽取,并存放到本地数据库或者存储为本地数据文件;
第三步:对所抽取的数据进行预处理;
第四步:就预处理后的数据进行特征筛选;
第五步:首先基于RandomForest、Extra-Trees、XGBoost、lightGBM 4种基学习器(Baselearner)进行初步模型训练(并采用SMBO优化方法对模型进行优化)/预测,然后将4个基学习器的拟合/预测结果转换为元特征向量,作为元学习器(Meta learner)lightGBM的输入,进行进一步的模型训练(采用SMBO对元学习器进行优化)/预测;
第六步:对组合模型的拟合/预测结果进行评价。
5.根据权利要求4所述的一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法,其特征在于,所述预处理包括数据空值处理、异常值处理、数据标准化等。
6.根据权利要求4所述的一种基于组合树模型的半导体PVD制程的电阻率虚拟量测方法,其特征在于,所述特征筛选模型选为XGBoost,根据xgboost模型对每个特征的打分进行特征排序,筛除排名靠后的特征,剩余特征作为所选特征输入集成树组合模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910910087.9A CN110782546A (zh) | 2019-09-25 | 2019-09-25 | 基于组合树模型的半导体pvd制程的电阻率虚拟量测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910910087.9A CN110782546A (zh) | 2019-09-25 | 2019-09-25 | 基于组合树模型的半导体pvd制程的电阻率虚拟量测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110782546A true CN110782546A (zh) | 2020-02-11 |
Family
ID=69384533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910910087.9A Withdrawn CN110782546A (zh) | 2019-09-25 | 2019-09-25 | 基于组合树模型的半导体pvd制程的电阻率虚拟量测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110782546A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111221881A (zh) * | 2020-04-24 | 2020-06-02 | 北京淇瑀信息科技有限公司 | 用户特征数据合成方法、装置及电子设备 |
CN112257868A (zh) * | 2020-09-25 | 2021-01-22 | 建信金融科技有限责任公司 | 构建和训练用于预测客流量的集成预测模型的方法及装置 |
CN113191017A (zh) * | 2021-05-21 | 2021-07-30 | 成都数之联科技有限公司 | 虚拟量测模型构建方法、虚拟量测方法、系统、电子设备及计算机可读存储介质 |
CN114841378A (zh) * | 2022-07-04 | 2022-08-02 | 埃克斯工业(广东)有限公司 | 晶圆特征参数预测方法、装置、电子设备及可读存储介质 |
CN116739127A (zh) * | 2023-01-12 | 2023-09-12 | 鸿密智能科技(浙江)有限公司 | 一种基于pvd工艺的汽车内外饰件表面处理方法及系统 |
-
2019
- 2019-09-25 CN CN201910910087.9A patent/CN110782546A/zh not_active Withdrawn
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111221881A (zh) * | 2020-04-24 | 2020-06-02 | 北京淇瑀信息科技有限公司 | 用户特征数据合成方法、装置及电子设备 |
CN111221881B (zh) * | 2020-04-24 | 2020-08-28 | 北京淇瑀信息科技有限公司 | 用户特征数据合成方法、装置及电子设备 |
CN112257868A (zh) * | 2020-09-25 | 2021-01-22 | 建信金融科技有限责任公司 | 构建和训练用于预测客流量的集成预测模型的方法及装置 |
CN113191017A (zh) * | 2021-05-21 | 2021-07-30 | 成都数之联科技有限公司 | 虚拟量测模型构建方法、虚拟量测方法、系统、电子设备及计算机可读存储介质 |
CN114841378A (zh) * | 2022-07-04 | 2022-08-02 | 埃克斯工业(广东)有限公司 | 晶圆特征参数预测方法、装置、电子设备及可读存储介质 |
CN116739127A (zh) * | 2023-01-12 | 2023-09-12 | 鸿密智能科技(浙江)有限公司 | 一种基于pvd工艺的汽车内外饰件表面处理方法及系统 |
CN116739127B (zh) * | 2023-01-12 | 2023-11-24 | 鸿密智能科技(浙江)有限公司 | 一种基于pvd工艺的汽车内外饰件表面处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110782546A (zh) | 基于组合树模型的半导体pvd制程的电阻率虚拟量测方法 | |
US7894926B2 (en) | Global predictive monitoring system for a manufacturing facility | |
CN109116834B (zh) | 一种基于深度学习的间歇过程故障检测方法 | |
CN109460574A (zh) | 一种航空发动机剩余寿命的预测方法 | |
KR20190035511A (ko) | 웨이퍼 맵 분석 시스템 및 방법 | |
CN105572572B (zh) | 基于wknn-lssvm的模拟电路故障诊断方法 | |
CN109409425B (zh) | 一种基于近邻成分分析的故障类型识别方法 | |
CN111638707B (zh) | 基于som聚类和mpca的间歇过程故障监测方法 | |
CN107403196B (zh) | 基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法 | |
CN109030790A (zh) | 一种电力变压器故障诊断方法和装置 | |
CN112596016A (zh) | 基于多个一维卷积神经网络集成的互感器故障诊断方法 | |
Tin et al. | Virtual metrology in semiconductor fabrication foundry using deep learning neural networks | |
CN110033175B (zh) | 一种基于集成多核偏最小二乘回归模型的软测量方法 | |
Lenz et al. | Virtual metrology in semiconductor manufacturing by means of predictive machine learning models | |
CN114219157A (zh) | 一种基于最优决策和动态分析的烷烃气体红外光谱测量方法 | |
JP7430271B2 (ja) | エラー要因の推定装置及び推定方法 | |
CN109389313B (zh) | 一种基于加权近邻决策的故障分类诊断方法 | |
CN112183569A (zh) | 基于fda与som的间歇工业过程反应阶段聚类以及故障分类可视化 | |
CN109214268B (zh) | 一种基于集成流形学习的填料塔液泛状态在线监测方法 | |
CN113496255B (zh) | 基于深度学习与决策树驱动的配电网混合观测布点方法 | |
CN114137915A (zh) | 一种工业设备的故障诊断方法 | |
Ukil et al. | Neural network-based active learning in multivariate calibration | |
CN107884362B (zh) | 棉、聚酯及氨纶混纺织物中氨纶含量的快速检测方法 | |
CN112329805A (zh) | 基于异方差噪声孪生lssvr的风速预报装置及方法 | |
Annas et al. | Improving the accuracy of rainfall forecasting using multivariate transfer function and resilient backpropagation neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200211 |
|
WW01 | Invention patent application withdrawn after publication |