CN113191399A - 一种基于机器学习分类器提高半导体芯片良品率的方法 - Google Patents

一种基于机器学习分类器提高半导体芯片良品率的方法 Download PDF

Info

Publication number
CN113191399A
CN113191399A CN202110389361.XA CN202110389361A CN113191399A CN 113191399 A CN113191399 A CN 113191399A CN 202110389361 A CN202110389361 A CN 202110389361A CN 113191399 A CN113191399 A CN 113191399A
Authority
CN
China
Prior art keywords
data
qualified
classifier
training
unqualified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110389361.XA
Other languages
English (en)
Other versions
CN113191399B (zh
Inventor
刘瑞盛
蒋信
喻涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pusaiwei Technology Hangzhou Co ltd
Original Assignee
Pusaiwei Technology Hangzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pusaiwei Technology Hangzhou Co ltd filed Critical Pusaiwei Technology Hangzhou Co ltd
Priority to CN202110389361.XA priority Critical patent/CN113191399B/zh
Publication of CN113191399A publication Critical patent/CN113191399A/zh
Application granted granted Critical
Publication of CN113191399B publication Critical patent/CN113191399B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/28Testing of electronic circuits, e.g. by signal tracer
    • G01R31/2851Testing of integrated circuits [IC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Testing Or Measuring Of Semiconductors Or The Like (AREA)

Abstract

本发明公开了一种基于机器学习分类器提高半导体芯片良品率的方法,至少包括如下步骤:采集晶圆裸片出厂后进行测试得到的前期测试数据,所述前期测试数据至少包括WAT数据和CP数据;训练分类器,分类器训练过程中采用数据降采样和基于增量学习的集成算法;成品测试预测,基于预测结果进行分类。本发明通过机器学习分类器来分析晶圆裸片的非平稳环境下的非平衡的前期测试数据,分类器训练过程中采用数据降采样和基于增量学习的集成算法,实现了最终测试结果FT的预测,提高了晶圆裸片在封装前品质分类的准确性,从而提高了封装芯片的良品率。

Description

一种基于机器学习分类器提高半导体芯片良品率的方法
技术领域
本发明涉及半导体芯片技术领域,具体涉及一种基于机器学习分类器提高半导体芯片良品率的方法。
背景技术
半导体芯片产品(例如存储芯片、SOC芯片等)的晶圆从开始制造到向客户发货的过程中需要经过一系列的各类测试,如图1所示,测试步骤主要包括:(1)步骤102,在制造完成后进行的晶圆接受测试(Wafer Acceptance Test,WAT),主要对专门的测试图形(TestKey)的测试,通过电参数来检验各步制造工艺是否正常和稳定;(2)步骤104,封装前对芯片进行的性能及功能测试(Circuit Probe,CP),主要是按品质分类进行不同级别的测试,划片封装前把坏的祼片(die)挑出来,以减少封装和芯片成品测试成本;(3)步骤106,封装后的成品测试(Final Test,FT),主要是进一步对芯片的各项性能/功能/可靠性进行全面的测试,确保芯片的出货品质。尽管封装时会根据CP测试结果将裸片按品质规格封装在一起,但部分CP测试合格的裸片可能在封装后会出现FT测试结果不合格,从而造成封装后的芯片不合格或品质降级,不仅浪费同一芯片中其他的合格裸片而且同时降低芯片良品率。裸片的失效几率与封装芯片失效几率之间的相互关系可以表示为:P芯片失效=1-(1-P裸片失效)S≈SP裸片失效,其中,S表示每颗封装芯片中的裸片数目。由此可见,随着封装芯片中裸片数目的增多(例如使用先进的堆叠封装等技术),每颗裸片的失效几率对于整个封装芯片的失效几率正变得越来越重要。
如果在晶圆裸片封装前添加品质分类器(如图2所示),通过使用裸片的前期数据(包括WAT数据、CP数据和其他数据)对其成品测试(FT)的结果进行预测,并根据FT预测结果对其进行更准确的品质分类,然后再将合格的裸片进行封装,这样可以提高封装芯片的良品率。目前存在的预测方法一般基于单变量分析,例如利用马可夫模型,根据测试过程中发现的缺陷来预测裸片的失效几率;但随着测试变量的增多,多变量分析对于裸片的失效几率分析显得十分必要,例如常见的判别分析等方法,但这类分析方法对于各变量之间的关联缺乏足够的考虑,所以使用这些方法对于预测裸片的失效几率具有一定的局限性。此外,芯片在制造/测试过程中,存在工艺菜单的调整、设备状况的漂移以及环境变化等因素,因而不同批次芯片的相关数据分布会存在变化,而目前的预测方法尚缺乏对这类随时间而发生的概念性漂移加以考虑。
发明内容
本发明为了克服以上技术的不足,提供了一种基于机器学习分类器提高半导体芯片良品率的方法。
机器学习分类器采用机器学习算法,由于机器学习算法可以寻找多变量之间的关联,在半导体领域已经引起越来越多的重视,例如可以运用于快速寻找前期测试数据与产品良率之间的关联,从而进行有效的良品率预测等。一般来讲,机器学习针对已有的数据进行训练,根据机器学习算法自动学习规则,构建出相应的机器学习模型,并利用模型对新的输入数据进行运算,得到输出结果。已知的机器学习模型包括但不限于:(i)稳健线性回归算法,例如随机抽样一致算法、哈勃回归、泰尔-森估算等;(ii)树形算法,例如分类与回归树、随机森林、极限随机树、梯度提升树、交替模型树等;(iii)各类神经网络,例如人工神经网络、受限玻尔兹曼机、深度学习网络等;(iv)基于内核的方法,例如支持向量机和核岭回归等;(v)基于邻域的方法,例如K最近邻等。
本发明利用机器学习分类算法通过分析裸片封装前的前期测试数据(例如WAT、CP等数据)来进行FT数据的预测,从而提高裸片在封装前的品质分类准确性,进而提高芯片的良品率。但利用机器学习分类器来预测芯片成品测试(FT)结果会遇到以下两个问题:(1)由于不同批次的晶圆裸片在制造过程中可能会遇到工艺菜单的不断优化、设备条件的改变(例如设备维护等)和工艺材料(例如气体、化学原料等)的变化等,所以测试数据的分布可能会随时间发生一定的变化(概念性漂移),造成原有的分类器在分析当前数据时会出现不准确;(2)晶圆裸片的前期数据通常在出厂的晶圆上不合格裸片所占的比例比较小,所以不合格与合格裸片的数据集存在极大的不平衡性,使用这样的数据集会对机器学习模型训练的准确性带来很大影响。本发明在分类器训练过程中采用数据降采样和基于增量学习的集成算法等来解决以上问题。
本发明克服其技术问题所采用的技术方案是:
一种基于机器学习分类器提高半导体芯片良品率的方法,至少包括如下步骤:
采集晶圆裸片出厂后进行测试得到的前期测试数据,所述前期测试数据至少包括WAT数据和CP数据;
训练分类器,分类器训练过程中采用数据降采样和基于增量学习的集成算法;
成品测试预测,基于预测结果进行分类。
进一步地,所述训练分类器具体包括如下步骤:
将预设时间范围内晶圆裸片的测试数据按时间顺序分成若干个模块,模块的划分数量根据分类器预测的具体需要来确定,所述测试数据至少包括CP数据和FT数据;
在每个模块的训练晶圆上挑选所有不合格样品数据组成不合格样本集Smin,并通过数据降采样方法挑选合格样本集SMAJ-i,其中,不合格样本是指CP数据合格但FT数据不合格的样本,合格样本是指CP和FT数据都合格的样本,每次合格样本的采样数量与不合格样本的采样数量基本一致,对于本发明来说,每次合格样本的采样数量与不合格样本的采样数量偏差在20%范围以内都算作基本一致;
将不合格样本集和合格样本集组成新的数据集进行机器学习训练,训练出基分类器,综合所有的基分类器,得到模块集成分类器;
对各模块集成分类器进行评估并根据评估结果赋予不同的权重,组成集成分类器。
进一步地,在得到不合格样本集之后,再通过采用随机或拉丁超立方抽样方法在训练晶圆上选取n个不同区域采集合格裸片的样本,其中,n≥2。
进一步地,所述数据降采样方法采用随机降采样方法、有放回降采样方法或随机递减降采样方法。
作为其中优选的一种方案,将合格样本集和不合格样本集组成新的数据集时,若所述数据降采样方法采用随机降采样方法,其具体为:
将训练晶圆每一个区域的合格样本集SMAJ_i与不合格样本集Smin共组成n个新的数据集,其中,i=1,2,...,n。
作为其中优选的第二种方案,将合格样本集和不合格样本集组成新的数据集时,若所述数据降采样方法采用有放回降采样方法,其具体为:
从训练晶圆n个区域的所有合格样本集∑i=nSMAJ_i中有放回的随机采样n次,每次选取与不合格样本集Smin数量基本一致的样本,得到共n个新合格样本集,其中,i=1,2,...,n;
再分别将每一个新合格样本数据集与不合格样本集Smin共组成n个新的数据集。
作为其中优选的第三种方案,将合格样本集和不合格样本集组成新的数据集时,若所述数据降采样方法采用随机递减降采样方法,其具体为:
从训练晶圆n个区域的所有合格样本集∑i=nSMAJ_i中随机抽取一个与不合格样本集Smin数量基本一致的子集,其中,i=1,2,...,n;
再将上述子集与不合格样本集Smin合并组成一个新的数据集。
进一步地,在得到新的数据集后,对新的数据集进行特征提取和特征工程。
进一步地,所述成品测试预测具体包括如下步骤:
对当前需要进行成品预测的晶圆裸片的前期测试数据进行数据预处理,所述预处理至少包括异常数据去除以及特征提取和特征工程;
然后将预处理后的数据输入训练好的集成分类器进行成品测试预测,根据预测结果将不同规格的合格裸片封装形成不同规格的芯片产品。
进一步地,特征提取和特征工程至少包括对数据中影响FT结果的主要参数进行识别,影响FT结果的主要参数至少包括性能参数、功能参数,但不同芯片产品其影响FT结果的主要参数也有所不同;采用包括但不限于稳健线性回归、随机森林算法来确定这些参数对FT结果的影响程度。
本发明的方法适用于包括但不限于各类芯片,例如存储芯片、SOC数字芯片、模拟芯片、混合信号芯片、逻辑芯片、射频芯片。
本发明的有益效果是:
本发明通过机器学习分类器来分析晶圆裸片的非平稳环境下的非平衡的前期测试数据,分类器训练过程中采用数据降采样和基于增量学习的集成算法,实现了最终测试结果FT的预测,提高了晶圆裸片在封装前品质分类的准确性,从而提高了封装芯片的良品率。
附图说明
图1为芯片产品测试流程示意图。
图2为本发明利用机器学习分类器来对封装前的晶圆裸片进行品质分类的示意图。
图3a为本发明中根据时间顺序对晶圆数据进行分组并建立相应模块分类器的示意图。
图3b为本发明中在晶圆上进行合格裸片样本采样的示意图。
图4为本发明实施例1采用随机降采样方法和基于增量学习的集成算法建立机器学习分类器的流程示意图。
图5为本发明实施例2采用有放回降采样方法和基于增量学习的集成算法建立机器学习分类器的流程示意图。
图6为本发明实施例3采用随机递减降采样方法和基于增量学习的集成算法建立机器学习分类器的流程示意图。
具体实施方式
为了便于本领域人员更好的理解本发明,下面结合附图和具体实施例对本发明做进一步详细说明,下述仅是示例性的不限定本发明的保护范围。
实施例1、
半导体芯片在晶圆制造完成之后会进行晶圆接受测试(WAT),然后晶圆会被送往封装厂进行分类测试和封装。封装厂会根据晶圆的WAT数据结果将其按品质分类,从而进行下一步的裸片CP测试,不同品质的裸片将会进行不同的CP测试流程。裸片的这些前期测试数据将会被用来预测裸片的最终测试(FT)结果。本发明的其中一个实施例是通过随机降采样方法和基于增量学习的集成算法来预测晶圆裸片FT结果,主要包括以下两个部分:
一、训练分类器。
如图4所示为采用随机降采样方法和基于增量学习的集成算法建立机器学习分类器的流程示意图。
步骤402:首先将预设时间范围内晶圆裸片的测试数据按时间顺序分成若干个模块,如图3a所示,模块的划分数量根据分类器预测的具体需要来确定,其中,Dt表示当前需要进行预测的数据,所述测试数据至少包括CP数据和FT数据;
然后,在每个模块选取一定数量的晶圆用作模块基分类器训练(具体晶圆的数量以及挑选方式可以根据分类器训练的需求来确定),在每个模块的训练晶圆上挑选出所有不合格样品数据组成不合格样本集Smin,不合格样本是指CP数据合格但FT数据不合格的样本;再采用随机或拉丁超立方抽样方法在训练晶圆上选取5个不同区域(如图3b所示)采集合格裸片的样本(具体的区域采样位置与数量可以根据预测的需要来确定),合格样本是指CP和FT数据都合格的样本,每个区域的合格裸片累计总采样数量SMAJ_i与训练晶圆上所有不合格样本集Smin的数量基本一致;
接下来,将训练晶圆每一个区域的合格样本集SMAJ_i与不合格样本集Smin共组成5个新的数据集(包括WAT和CP数据)。
步骤404:对上述5个新的数据集进行特征提取和特征工程,即对数据中影响FT结果的主要参数进行识别,采用包括但不限于稳健线性回归、随机森林算法来确定这些参数对FT结果的影响程度;此外,还可以通过统计算法得出这些数据(影响FT结果的主要参数)的统计值,例如,平均值、均方差等作为额外的特征值。
步骤406:使用5个新的数据集分别进行机器学习训练,例如采用提升、二元决策树、支持向量机等算法作为基学习器,训练出5个模块基分类器h_i。
步骤408:综合每个模块所有训练晶圆的基分类器h_i并确定模块分类器,例如包括使用其中分类效果最好(比如接收者操作曲线ROC评估最佳)的基分类器h_i来作为模块分类器H_i;或者使用所有的模块基分类器h_i,但遵循少数服从多数的投票原则来确定最终FT预测结果等。
步骤410:将各个模块分类器H_i根据不同权重组成最终的集成分类器H_f,例如可以运用Sigmoidal误差加权等方式来对近期的模块分类器有所强调。二、成品测试预测。
对当前需要进行成品预测的晶圆裸片的前期测试数据进行数据预处理,所述预处理至少包括异常数据去除以及特征提取和特征工程,所述特征提取和特征工程,对数据中影响FT结果的主要参数进行识别,采用包括但不限于稳健线性回归、随机森林算法来确定这些参数对FT结果的影响程度;此外,还可以通过统计算法得出这些数据(影响FT结果的主要参数)的统计值,例如,平均值、均方差等作为额外的特征值。
然后将预处理后的数据输入训练好的集成分类器进行成品测试预测,根据预测结果将不同规格的合格裸片封装形成不同规格的芯片产品。
实施例2、
与实施例1的区别在于,本实施例是通过有放回降采样方法和基于增量学习的集成算法来预测晶圆裸片FT结果。本实施例主要包括以下两个部分:
一、训练分类器。
如图5所示为采用有放回降采样方法和基于增量学习的集成算法建立机器学习分类器的流程示意图。
步骤502:首先将预设时间范围内晶圆裸片的测试数据按时间顺序分成若干个模块,如图3a所示,模块的划分数量根据分类器预测的具体需要来确定,其中,Dt表示当前需要进行预测的数据,所述测试数据至少包括CP数据和FT数据;
然后,在每个模块选取一定数量的晶圆用作模块基分类器训练(具体晶圆的数量以及挑选方式可以根据分类器训练的需求来确定),在每个模块的训练晶圆上挑选出所有不合格样品数据组成不合格样本集Smin,不合格样本是指CP数据合格但FT数据不合格的样本;再采用随机或拉丁超立方抽样方法在训练晶圆上选取5个不同区域(如图3b所示)采集合格裸片的样本(具体的区域采样位置与数量可以根据预测的需要来确定),合格样本是指CP和FT数据都合格的样本,每个区域的合格裸片累计总采样数量SMAJ_i与训练晶圆上所有不合格样本集Smin的数量基本一致;
接下来,从训练晶圆这5个区域的所有合格样本集∑i=5SMAJ_i中有放回的随机采样5次,每次选取与不合格样本集Smin数量基本一致的样本,得到共5个新合格样本集(包括WAT和CP数据),其中,i=1,2,...,5;
再分别将每一个新合格样本数据集与不合格样本集Smin共组成5个新的数据集(包括WAT和CP数据)。
步骤504:对步骤502得到的5个新的数据集进行特征提取和特征工程,即对数据中影响FT结果的主要参数进行识别,采用包括但不限于稳健线性回归、随机森林算法来确定这些参数对FT结果的影响程度;此外,还可以通过统计算法得出这些数据(影响FT结果的主要参数)的统计值,例如,平均值、均方差等作为额外的特征值。
步骤506:使用5个新的数据集分别进行机器学习训练,例如采用提升、二元决策树、支持向量机等算法作为基学习器,训练出5个模块基分类器h_i。
步骤508:综合每个模块所有训练晶圆的基分类器h_i并确定模块分类器,例如包括使用其中分类效果最好(比如接收者操作曲线ROC评估最佳)的基分类器h_i来作为模块分类器H_i;或者使用所有的模块基分类器h_i,但遵循少数服从多数的投票原则来确定最终FT预测结果等。
步骤510:将各个模块分类器H_i根据不同权重组成最终的集成分类器H_f,例如可以运用Sigmoidal误差加权等方式来对近期的模块分类器有所强调。
二、成品测试预测。
本实施例的成品测试预测步骤与实施例1的成品测试预测步骤相同。
实施例3、
与实施例1的区别在于,本实施例是通过随机递减降采样方法和基于增量学习的集成算法来预测晶圆裸片FT结果。本实施例主要包括以下两个部分:
一、训练分类器。
如图6所示为采用随机递减降采样方法和基于增量学习的集成算法建立机器学习分类器的流程示意图。
步骤602:首先将预设时间范围内晶圆裸片的测试数据按时间顺序分成若干个模块,如图3a所示,模块的划分数量根据分类器预测的具体需要来确定,其中,Dt表示当前需要进行预测的数据,所述测试数据至少包括CP数据和FT数据;
然后,在每个模块选取一定数量的晶圆用作模块基分类器训练(具体晶圆的数量以及挑选方式可以根据分类器训练的需求来确定),在每个模块的训练晶圆上挑选出所有不合格样品数据组成不合格样本集Smin,不合格样本是指CP数据合格但FT数据不合格的样本;再采用随机或拉丁超立方抽样方法在训练晶圆上选取5个不同区域(如图3b所示)采集合格裸片的样本(具体的区域采样位置与数量可以根据预测的需要来确定),合格样本是指CP和FT数据都合格的样本,每个区域的合格裸片累计总采样数量SMAJ_i与训练晶圆上所有不合格样本集Smin的数量基本一致;
接下来,从训练晶圆这5个区域的所有合格样本集∑i=5SMAJ_i中随机抽取一个与不合格样本集Smin数量基本一致的子集,其中,i=1,2,...,5;
再将上述子集与不合格样本集Smin合并组成一个新的数据集。
步骤604:对步骤602得到的新的数据集进行特征提取和特征工程,即对数据中影响FT结果的主要参数进行识别,采用包括但不限于稳健线性回归、随机森林算法来确定这些参数对FT结果的影响程度;此外,还可以通过统计算法得出这些数据(影响FT结果的主要参数)的统计值,例如,平均值、均方差等作为额外的特征值。
步骤606:使用这个新的数据集进行机器学习训练,例如采用提升、二元决策树、支持向量机等算法作为基学习器,训练出一个模块基分类器h_i。
步骤608:从所有训练晶圆5个区域的所有合格样本集∑i=5SMAJ_i中删除已被h_i正确分类的合格裸片样品;重复该步骤,直到达到最大迭代次数。综合所有训练晶圆的基分类器h_i并确定模块分类器H_i,例如包括使用其中分类效果最好(比如接收者操作曲线ROC评估最佳)的基分类器h_i来作为模块分类器H_i;或者使用所有训练晶圆的基分类器,但遵循少数服从多数的投票原则来确定最终FT预测结果等。
步骤610:将各个模块分类器H_i根据不同权重组成最终的集成分类器H_f,例如可以运用Sigmoidal误差加权等方式来对近期的模块分类器有所强调。
二、成品测试预测。
本实施例的成品测试预测步骤与实施例1的成品测试预测步骤相同。
以上仅描述了本发明的基本原理和优选实施方式,本领域人员可以根据上述描述做出许多变化和改进,这些变化和改进应该属于本发明的保护范围。

Claims (10)

1.一种基于机器学习分类器提高半导体芯片良品率的方法,其特征在于,至少包括如下步骤:
采集晶圆裸片出厂后进行测试得到的前期测试数据,所述前期测试数据至少包括WAT数据和CP数据;
训练分类器,分类器训练过程中采用数据降采样和基于增量学习的集成算法;
成品测试预测,基于预测结果进行分类。
2.根据权利要求1所述的方法,其特征在于,所述训练分类器具体包括如下步骤:
将预设时间范围内晶圆裸片的测试数据按时间顺序分成若干个模块,所述测试数据至少包括CP数据和FT数据;
在每个模块的训练晶圆上挑选所有不合格样品数据组成不合格样本集,并通过数据降采样方法挑选合格样本集,其中,不合格样本是指CP数据合格但FT数据不合格的样本,合格样本是指CP和FT数据都合格的样本,每次合格样本的采样数量与不合格样本的采样数量基本一致;
将不合格样本集和合格样本集组成新的数据集进行机器学习训练,训练出基分类器,综合所有的基分类器,得到模块集成分类器;
对各模块集成分类器进行评估并根据评估结果赋予不同的权重,组成集成分类器。
3.根据权利要求2所述的方法,其特征在于,在得到不合格样本集之后,再通过采用随机或拉丁超立方抽样方法在训练晶圆上选取n个不同区域采集合格裸片的样本,其中,n≥2。
4.根据权利要求3所述的方法,其特征在于,所述数据降采样方法采用随机降采样方法、有放回降采样方法或随机递减降采样方法。
5.根据权利要求4所述的方法,其特征在于,将合格样本集和不合格样本集组成新的数据集时,若所述数据降采样方法采用随机降采样方法,其具体为:
将训练晶圆每一个区域的合格样本集SMAJ_i与不合格样本集Smin共组成n个新的数据集,其中,i=1,2,...,n。
6.根据权利要求4所述的方法,其特征在于,将合格样本集和不合格样本集组成新的数据集时,若所述数据降采样方法采用有放回降采样方法,其具体为:
从训练晶圆n个区域的所有合格样本集∑i=nSMAJ_i中有放回的随机采样n次,每次选取与不合格样本集Smin数量基本一致的样本,得到共n个新合格样本集,其中,i=1,2,...,n;
再分别将每一个新合格样本数据集与不合格样本集Smin共组成n个新的数据集。
7.根据权利要求4所述的方法,其特征在于,将合格样本集和不合格样本集组成新的数据集时,若所述数据降采样方法采用随机递减降采样方法,其具体为:
从训练晶圆n个区域的所有合格样本集∑i=nSMAJ_i中随机抽取一个与不合格样本集Smin数量基本一致的子集,其中,i=1,2,...,n;
再将上述子集与不合格样本集Smin合并组成一个新的数据集。
8.根据权利要求2-7任一项所述的方法,其特征在于,在得到新的数据集后,对新的数据集进行特征提取和特征工程。
9.根据权利要求8所述的方法,其特征在于,所述成品测试预测具体包括如下步骤:
对当前需要进行成品预测的晶圆裸片的前期测试数据进行数据预处理,所述预处理至少包括异常数据去除以及特征提取和特征工程;
然后将预处理后的数据输入训练好的集成分类器进行成品测试预测,根据预测结果将不同规格的合格裸片封装形成不同规格的芯片产品。
10.根据权利要求9所述的方法,其特征在于,特征提取和特征工程至少包括对数据中影响FT结果的主要参数进行识别;采用包括但不限于稳健线性回归、随机森林算法来确定这些参数对FT结果的影响程度。
CN202110389361.XA 2021-04-12 2021-04-12 一种基于机器学习分类器提高半导体芯片良品率的方法 Active CN113191399B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110389361.XA CN113191399B (zh) 2021-04-12 2021-04-12 一种基于机器学习分类器提高半导体芯片良品率的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110389361.XA CN113191399B (zh) 2021-04-12 2021-04-12 一种基于机器学习分类器提高半导体芯片良品率的方法

Publications (2)

Publication Number Publication Date
CN113191399A true CN113191399A (zh) 2021-07-30
CN113191399B CN113191399B (zh) 2022-05-27

Family

ID=76975414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110389361.XA Active CN113191399B (zh) 2021-04-12 2021-04-12 一种基于机器学习分类器提高半导体芯片良品率的方法

Country Status (1)

Country Link
CN (1) CN113191399B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113687995A (zh) * 2021-10-27 2021-11-23 成都嘉纳海威科技有限责任公司 一种基于神经网络的芯片筛测方法
CN114660443A (zh) * 2022-05-24 2022-06-24 南京宏泰半导体科技有限公司 一种基于机器学习的集成电路ate自动复测系统及方法
WO2024000731A1 (zh) * 2022-06-27 2024-01-04 长鑫存储技术有限公司 晶圆缺陷评估方法、装置、存储器芯片和可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004104A (zh) * 2009-08-28 2011-04-06 中芯国际集成电路制造(上海)有限公司 晶片采样检测系统及其检测方法
US20130038336A1 (en) * 2011-08-12 2013-02-14 United Microelectronics Corporation Probe Calibration Device and Calibration Method
CN103632168A (zh) * 2013-12-09 2014-03-12 天津工业大学 一种机器学习中的分类器集成方法
US20190259145A1 (en) * 2018-02-19 2019-08-22 International Business Machines Corporation Measuring Defectivity by Equipping Model-Less Scatterometry with Cognitive Machine Learning
CN110910021A (zh) * 2019-11-26 2020-03-24 上海华力集成电路制造有限公司 一种基于支持向量机监控在线缺陷的方法
CN111105160A (zh) * 2019-12-20 2020-05-05 北京工商大学 一种基于倾向性异质装袋算法的钢材质量预测方法
CN111184508A (zh) * 2020-01-19 2020-05-22 武汉大学 一种基于联合神经网络的心电信号检测装置及分析方法
CN111539521A (zh) * 2020-05-25 2020-08-14 上海华力集成电路制造有限公司 神经网络误差-反向传播算法预测半导体产品良率的方法
CN111584397A (zh) * 2016-12-12 2020-08-25 应用材料公司 半导体元件的制造过程中进行自动缺陷筛选的系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004104A (zh) * 2009-08-28 2011-04-06 中芯国际集成电路制造(上海)有限公司 晶片采样检测系统及其检测方法
US20130038336A1 (en) * 2011-08-12 2013-02-14 United Microelectronics Corporation Probe Calibration Device and Calibration Method
CN103632168A (zh) * 2013-12-09 2014-03-12 天津工业大学 一种机器学习中的分类器集成方法
CN111584397A (zh) * 2016-12-12 2020-08-25 应用材料公司 半导体元件的制造过程中进行自动缺陷筛选的系统
US20190259145A1 (en) * 2018-02-19 2019-08-22 International Business Machines Corporation Measuring Defectivity by Equipping Model-Less Scatterometry with Cognitive Machine Learning
CN110910021A (zh) * 2019-11-26 2020-03-24 上海华力集成电路制造有限公司 一种基于支持向量机监控在线缺陷的方法
CN111105160A (zh) * 2019-12-20 2020-05-05 北京工商大学 一种基于倾向性异质装袋算法的钢材质量预测方法
CN111184508A (zh) * 2020-01-19 2020-05-22 武汉大学 一种基于联合神经网络的心电信号检测装置及分析方法
CN111539521A (zh) * 2020-05-25 2020-08-14 上海华力集成电路制造有限公司 神经网络误差-反向传播算法预测半导体产品良率的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113687995A (zh) * 2021-10-27 2021-11-23 成都嘉纳海威科技有限责任公司 一种基于神经网络的芯片筛测方法
CN113687995B (zh) * 2021-10-27 2022-01-04 成都嘉纳海威科技有限责任公司 一种基于神经网络的芯片筛测方法
CN114660443A (zh) * 2022-05-24 2022-06-24 南京宏泰半导体科技有限公司 一种基于机器学习的集成电路ate自动复测系统及方法
WO2024000731A1 (zh) * 2022-06-27 2024-01-04 长鑫存储技术有限公司 晶圆缺陷评估方法、装置、存储器芯片和可读存储介质

Also Published As

Publication number Publication date
CN113191399B (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
CN113191399B (zh) 一种基于机器学习分类器提高半导体芯片良品率的方法
US11853899B2 (en) Methods and apparatus for data analysis
JP5624660B2 (ja) 検査レシピ作成システムおよびその方法
US7356430B2 (en) Methods and apparatus for data analysis
JP3834008B2 (ja) 不良解析装置、不良解析方法および不良解析プログラム
US8009895B2 (en) Semiconductor wafer analysis system
US20110178967A1 (en) Methods and apparatus for data analysis
TWI631351B (zh) 用於線內良率監控的關鍵參數之電測試參數的自動化判定之系統及方法
US20080189575A1 (en) Methods and apparatus for data analysis
KR20060026072A (ko) 데이터 분석 방법 및 장치
CN112990479B (zh) 利用机器学习分类器提高半导体芯片良品率的方法
Huang et al. Improving diagnosis efficiency via machine learning
CN105702595B (zh) 晶圆的良率判断方法以及晶圆合格测试的多变量检测方法
CN113092981A (zh) 晶圆数据检测方法及系统、存储介质及测试参数调整方法
CN116825169B (zh) 一种基于测试设备的异常存储芯片检测方法
CN101871994A (zh) 多分数阶信息融合的模拟电路故障诊断方法
CN109657718A (zh) 一种数据驱动的smt生产线上spi缺陷类别智能识别方法
Park et al. Data mining approaches for packaging yield prediction in the post-fabrication process
CN110910021A (zh) 一种基于支持向量机监控在线缺陷的方法
US9904660B1 (en) Nonparametric method for measuring clustered level of time rank in binary data
CN112397404B (zh) 半导体制程检测方法及检测系统
KR20070018880A (ko) 데이터 분석을 위한 방법 및 장치
US8160830B2 (en) Method of yield management for semiconductor manufacture and apparatus thereof
US20220122864A1 (en) Smart skip testing method for semiconductor manufacturing
Aye et al. Data driven framework for degraded pogo pin detection in semiconductor manufacturing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant