CN112990479A - 利用机器学习分类器提高半导体芯片良品率的方法 - Google Patents

利用机器学习分类器提高半导体芯片良品率的方法 Download PDF

Info

Publication number
CN112990479A
CN112990479A CN202110223090.0A CN202110223090A CN112990479A CN 112990479 A CN112990479 A CN 112990479A CN 202110223090 A CN202110223090 A CN 202110223090A CN 112990479 A CN112990479 A CN 112990479A
Authority
CN
China
Prior art keywords
training
qualified
test
classifier
wafer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110223090.0A
Other languages
English (en)
Other versions
CN112990479B (zh
Inventor
刘瑞盛
蒋信
喻涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pusaiwei Technology Hangzhou Co ltd
Original Assignee
Pusaiwei Technology Hangzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pusaiwei Technology Hangzhou Co ltd filed Critical Pusaiwei Technology Hangzhou Co ltd
Priority to CN202110223090.0A priority Critical patent/CN112990479B/zh
Publication of CN112990479A publication Critical patent/CN112990479A/zh
Application granted granted Critical
Publication of CN112990479B publication Critical patent/CN112990479B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L22/00Testing or measuring during manufacture or treatment; Reliability measurements, i.e. testing of parts without further processing to modify the parts as such; Structural arrangements therefor
    • H01L22/20Sequence of activities consisting of a plurality of measurements, corrections, marking or sorting steps

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Manufacturing & Machinery (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Power Engineering (AREA)
  • Testing Or Measuring Of Semiconductors Or The Like (AREA)

Abstract

本发明公开一种利用机器学习分类器提高半导体芯片良品率的方法,利用机器学习分类器,通过对封装前晶圆裸片(die)的前期数据进行分析来预测封装后晶圆裸片的成品测试(Final Test,FT)结果,然后根据预测的FT结果对晶圆裸片进行品质分类,最后按裸片品质分类进行封装。该方法能够有效提高晶圆裸片封装前品质分类的准确性,从而提高封装后半导体芯片的良品率。

Description

利用机器学习分类器提高半导体芯片良品率的方法
技术领域
本发明涉及半导体芯片产品开发/制造领域,尤其涉及一种利用机器学习算法提高晶圆裸片在品质分类阶段的准确性,从而提高封装后芯片良品率的方法。
背景技术
半导体芯片产品(例如存储芯片、SOC芯片等)的晶圆从开始制造到向客户发货的过程中需要经过一系列的各类测试,如图1(100)所示主要包括:(1)步骤102,在制造完成后进行的晶圆接受测试(Wafer Acceptance Test,WAT),主要对专门的测试图形(Test Key)的测试,通过电参数来检验各步制造工艺是否正常和稳定;(2)步骤104,封装前对芯片进行的性能及功能测试(Circuit Probe, CP),主要是按品质分类进行不同级别的测试,划片封装前把不合格的祼片(die)挑出来,以减少封装和芯片成品测试成本;(3)步骤106,封装后的成品测试(Final Test,FT),主要是进一步对芯片的各项性能/功能/可靠性进行全面的测试,确保芯片的出货品质。
尽管封装时会根据CP测试结果将裸片按品质规格封装在一起,但部分CP 测试合格的裸片可能在封装后会出现FT测试结果不合格,从而造成封装后的芯片不合格或品质降级,不仅浪费同一芯片中其他的合格裸片而且同时降低芯片良品率。裸片的失效几率与封装芯片失效几率之间的相互关系可以表示为: P芯片失效=1-(1-P裸片失效)S≈SP裸片失效,其中S表示每颗封装芯片中的裸片数目。由此可见,随着封装芯片中裸片数目的增多,每颗裸片的失效几率对于整个封装芯片的失效几率有重要的影响作用。
机器学习算法由于可以寻找多变量之间的关联,在半导体领域正在引起越来越多的重视,例如可以运用于快速寻找前期测试数据与产品良率之间的关联,从而进行有效的良品率预测等。一般来讲,机器学习针对已有的数据进行训练,根据机器学习算法自动学习规则,构建出相应的机器学习模型,并利用模型对新的输入数据进行运算,得到输出结果。已知的机器学习模型包括但不限于:(i)稳健线性回归算法,例如随机抽样一致算法,哈勃回归,或者泰尔-森估算等;(ii)树形算法,例如分类与回归树,随机森林,极限随机树,梯度提升树,或者交替模型树等;(iii)各类神经网络,例如人工神经网络,受限玻尔兹曼机,深度学习网络等;(iv)基于内核的方法,例如支持向量机和核岭回归等;(v)基于邻域的方法,例如K最近邻等。
如果在晶圆裸片封装前添加品质分类器(如图2所示),通过使用裸片的前期数据(包括WAT、CP等测试数据和其它数据)对其成品测试(FT)的结果进行预测,并根据FT预测结果对其进行更准确的品质分类,然后再将合格的裸片进行封装,这样可以提高封装芯片的良品率。目前存在的预测方法一般基于单变量分析,例如利用马可夫模型,根据测试过程中发现的缺陷来预测裸片的失效几率。随着测试变量的增多,多变量分析对于裸片的失效几率分析显得十分必要,例如常见的判别分析等方法,但这类分析方法对于各变量之间的关联缺乏足够的考虑。所以使用这些方法对于预测裸片的失效几率具有一定的局限性。另一方面,通常在出厂的晶圆上不合格裸片所占的比例比较小,所以不合格与合格裸片的数据集存在极大的不平衡性,使用这样的数据集会对机器学习模型训练的准确性带来很大影响。
发明内容
基于上述背景,本发明提出了一种利用机器学习分类器提高半导体芯片良品率的方法,在分类器训练过程中采用数据降采样和集成方法来解决前述问题。集成方法主要有两层算法层次架构。底层的算法叫做基学习器(base learner),例如提升、二元决策树、支持向量机等。上层算法主要通过对这些基学习器做巧妙的处理,使其模型近似相对独立。目前广泛使用的上层算法主要有:投票(bagging)、提升(boosting)和随机森林(randomforest)等。
本发明解决其技术问题采用的技术方案为:
一种利用机器学习分类器提高半导体芯片良品率的方法,包括如下步骤:
S1、基于预设算法建立机器学习分类器;
S2、基于晶圆裸片的前期数据,建立训练数据集;
S3、使用所述训练数据集训练所述机器学习分类器,并使用训练后的机器学习分类器预测晶圆裸片的成品测试结果;
S4、基于所述成品测试结果对裸片进行品质分类,并按品质分类对裸片进行封装。
作为优选实施方案,步骤S1中,所述预设算法为随机降采样和集成算法;步骤S2具体包括:
S21a、选取预设数量的晶圆作为训练晶圆,从每片训练晶圆上选出所有CP 测试合格但FT测试不合格的裸片组成不合格裸片样本集SMIN
S22a、在每片训练晶圆上采用随机或拉丁超立方等抽样方法选取n个不同区域采集CP测试和FT测试均合格的裸片组成样合格裸片本集
Figure BDA0002954569270000031
其中n 可以根据预测的需要来确定,一个可选范围为1<n<100;每个区域的合格裸片采样数目和该训练晶圆上所有不合格裸片的样本数目基本保持一致;
S23a、使用每个区域的合格裸片样本集SMAJ_i和不合格裸片样本集SMIN组成n个合成数据集。
作为优选实施方案,步骤S1中,所述预设算法为随机有放回降采样和集成算法;步骤S2具体包括:
S21b、选取预设数量的晶圆作为训练晶圆,从每片训练晶圆上选出所有CP 测试合格但FT测试不合格的裸片组成不合格裸片样本集SMIN;
S22b、在每片训练晶圆上采用随机或拉丁超立方等抽样方法选取n个不同区域采集CP测试和FT测试均合格的裸片组成样合格裸片本集
Figure BDA0002954569270000032
其中n 可以根据预测的需要来确定,一个可选范围为1<n<100;每个区域的合格裸片采样数目和该训练晶圆上所有不合格裸片的样本数目基本保持一致;
S23b、从合格裸片本集
Figure BDA0002954569270000033
中有放回的随机采样n次,每次选取与不合格裸片样本集SMIN中近似的样本,得到共n个新合格样本数据集;
S24b、分别使用每一个合格裸片的新合格样本数据集与不合格裸片的不合格裸片样本集SMIN组成n个合成数据集。
作为优选实施方案,步骤S3具体包括:
S31a、对n个合成数据集进行进行特征提取和特征工程,识别数据中影响 FT测试结果的主要参数;
S32a、使用n个合成数据集分别进行机器学习训练,训练得到n个基分类器H_i;
S33a、综合所有基分类器H_i得到每片训练晶圆的集成分类器,并基于所有训练晶圆的集成分类器确定最终的集成分类器或获取最终的测试结果。
作为优选实施方案,步骤S1中,所述预设算法为随机递减降采样和集成算法;步骤S2具体包括:
S21c、选取预设数量的晶圆作为训练晶圆,从每片训练晶圆上选出所有CP 测试合格但FT测试不合格的裸片组成不合格裸片样本集SMIN
S22c、在每片训练晶圆上采用随机或拉丁超立方等抽样方法选取n个不同区域采集CP测试和FT测试均合格的裸片组成样合格裸片本集
Figure BDA0002954569270000041
其中n 可以根据预测的需要来确定,一个可选范围为1<n<100;每个区域的合格裸片采样数目和该训练晶圆上所有不合格裸片的样本数目基本保持一致;
S23c、从n个区域的合格裸片本集
Figure BDA0002954569270000042
中随机抽取一个与不合格裸片样本集SMIN数目近似的子集,然后将该子集与不合格裸片样本集SMIN合并组成一个合成数据集。
作为优选实施方案,步骤S3具体包括:
S31b、对合成数据集进行进行特征提取和特征工程,识别数据中影响FT测试结果的主要参数;
S32b、使用合成新数据集进行机器学习训练,训练得到一个基分类器H_i;
S33b、从n个区域的合格裸片本集
Figure BDA0002954569270000043
中删除掉已被H_i正确分类的合格裸片样本;重复以上步骤,直到达到最大迭代次数,最终输出一个集成分类器;
S34b、基于所有训练晶圆的集成分类器确定最终的集成分类器或获取最终的测试结果。
作为优选实施方案,步骤S31a和S31b中,识别数据中影响FT测试结果的主要参数具体包括:使用稳健线性回归或随机森林算法确定参数对FT结果的影响程度。
作为优选实施方案,步骤S31a和S31b还包括:通过统计算法获取识别的主要参数的统计值作为额外的特征值。
作为优选实施方案,S32a和S32b中,使用提升、二元决策树或支持向量机算法作为基学习器训练得到基分类器。
作为优选实施方案,步骤S33a中,综合所有基分类器H_i采用投票方式得到每片训练晶圆的集成分类器。
作为优选实施方案,步骤S33a和S34b中,使用所有集成分类器中分类效果最好的分类器做为最终的集成分类器。
作为优选实施方案,步骤S33a和S34b中,使用所有训练晶圆的集成分类器,遵循少数服从多数的投票原则确定最终的测试结果。
本发明的方法适用于包括但不限于各类存储芯片,例如固态存储器(NAND or NORFLASH)、静态随机存储器(SRAM)、动态随机存储器(DRAM)、铁电随机存储器(FeRAM)、自旋转移磁矩磁性随机存储器(STT-MRAM)、阻变随机存储器(RRAM)、相变随机存储器(PCRAM)和3DXpoint存储器等,以及 SOC数字芯片,模拟芯片,逻辑芯片,射频芯片等。
本发明的有益效果:
本发明的方法,通过机器学习分类器实现对晶圆裸片(die)最终测试结果(FT)的预测,提高晶圆裸片在封装前品质分类的准确性,从而提高封装芯片的良品率。
附图说明
图1是芯片产品测试流程示意图。
图2是本发明中利用机器学习分类器来对封装前的晶圆裸片进行品质分类的示意图。
图3是本发明中在晶圆上进行合格裸片样本采样的示意图。
图4是本发明中利用随机降采样和集成算法建立机器学习分类器的流程示意图。
图5是本发明中利用随机有放回降采样和集成算法(Easy Ensemble算法)建立机器学习分类器的流程示意图。
图6是本发明中利用随机递减降采样和集成算法(Balance Cascade算法)建立机器学习分类器的流程示意图。
具体实施方式
为了进一步理解本发明,下面结合实施例对本发明优选实施方案进行描述,但是应当理解,这些描述只是为进一步说明本发明的特征和优点,而不是对本发明权利要求的限制。
实施例1:半导体芯片晶圆在制造完成之后会进行晶圆接受测试(WAT),然后晶圆会被送往封装厂进行分类测试和封装。封装厂会根据晶圆的WAT数据结果将其按品质分类,从而进行下一步的裸片CP测试,不同品质的裸片将会进行不同的CP测试流程。裸片的这些前期测试数据将会被用来预测裸片的最终测试(FT)结果。利用机器学习算法预测晶圆裸片FT结果主要包括以下两个部分:
(1)分类器的训练。通常在出厂的晶圆上不合格裸片所占的比例比较小,所以不合格与合格裸片的数据集存在极大的不平衡性,使用这样的数据集会对机器学习模型训练的准确性带来很大影响。本发明的其中一个实施例是在分类器训练过程中采用随机降采样和集成算法来解决这个问题。图4是这一方法的步骤示意图(400)。在步骤402中,选取一定数目的晶圆用作分类器训练(具体晶圆数目以及挑选方式可以根据分类器训练的需求来确定),从每片训练晶圆上选出所有不合格(CP测试合格但FT测试不合格)的裸片样本SMIN,然后采用随机或拉丁超立方等抽样方法在每片晶圆上选取5个不同区域(如图3所示)采集合格裸片(CP和FT测试都合格)的样本
Figure BDA0002954569270000061
(具体的区域采样位置与数目可以根据预测的需要来确定),每个区域的合格裸片采样数目和晶圆上所有不合格裸片的样本数目基本保持一致。接下来分别使用每一个区域的合格裸片数据集SMAJ_i与不合格裸片的数据集SMIN共组成5个合成数据集(包括WAT、 CP等测试数据);在步骤404中,对这五个合成数据集进行特征提取和特征工程,即对数据中影响最终测试(FT)结果的主要参数进行识别,使用包括但不限于稳健线性回归,随机森林等算法来确定这些参数对FT结果的影响程度;此外还可以通过统计算法得出这些数据的统计值,例如平均值,均方差等作为额外的特征值。在步骤406中,使用5个合成数据集分别进行机器学习训练,例如使用提升、二元决策树、支持向量机等算法作为基学习器,训练出5个基分类器H_i。在步骤408中,综合所有基分类器H_i,例如采用投票(bagging)等方式得到每片训练晶圆的集成分类器。综合所有训练晶圆的集成分类器并确定最终的集成分类器。例如包括使用其中分类效果最好(例如接收者操作曲线ROC评估最佳)的分类器来做为最终集成分类器;或者使用所有训练晶圆的集成分类器,但遵循少数服从多数的投票原则来确定最终的FT预测结果的方法等。
(2)成品测试(FT)预测。将其它晶圆上裸片的前期测试数据(例如WAT, CP等数据)进行数据预处理,其中包括异常数据去除,特征提取与数据特征工程等,然后将数据输入训练好的集成分类器进行裸片的成品测试(FT)结果预测,并按预测结果将不同规格的合格裸片封装形成不同规格的芯片产品。
实施例2:半导体芯片晶圆在制造完成之后会进行晶圆接受测试(WAT),然后晶圆会被送往封装厂进行分类测试和封装。封装厂会根据晶圆的WAT数据结果将裸片(die)按品质分类,从而进行下一步的裸片CP测试,不同品质的裸片将会进行不同的CP测试流程。裸片的这些前期测试数据将会被用来预测裸片的最终测试(FT)结果。利用机器学习算法预测晶圆裸片FT结果主要包括以下两个部分:
(1)分类器的训练。通常在出厂的晶圆上不合格裸片所占的比例比较小,所以不合格与合格裸片的数据集存在极大的不平衡性,使用这样的数据集会对机器学习模型训练的准确性带来很大影响。本发明的其中一个实施例是在分类器训练过程中采用随机有放回降采样和集成算法(Easy Ensemble算法)来解决这个问题。图5是这一方法的步骤示意图(500)。在步骤502中,选取一定数目的晶圆用作分类器训练(具体晶圆数目以及挑选方式可以根据分类器训练的需求来确定),从每片训练晶圆上选出所有不合格(CP测试合格但FT测试不合格)的裸片样本SMIN,然后采用随机或拉丁超立方等抽样方法在每片晶圆上选取5个不同区域(如图3所示)采集合格裸片(CP和FT测试都合格)的样本
Figure BDA0002954569270000081
(具体的区域采样位置与数目可以根据预测的需要来确定),每个区域的合格裸片采样数目和晶圆上所有不合格裸片的样本数目基本保持一致。接下来从这5个区域的所有合格芯片样本数据集
Figure BDA0002954569270000082
中有放回的随机采样 5次,每次选取与不合格芯片样本数目SMIN近似的样本,得到共5个新合格样本数据集(包括WAT、CP等测试数据)。分别使用每一个合格芯片的新数据集与不合格芯片的数据集组成一个合成数据集,共组成5个合成数据集。在步骤 504中,对这五个合成数据集进行特征提取和特征工程,即对数据中影响最终测试(FT)结果的主要参数进行识别,使用包括但不限于稳健线性回归,随机森林等算法来确定这些参数对FT结果的影响程度;此外还可以通过统计算法得出这些数据的统计值,例如平均值,均方差等作为额外的特征值。在步骤506中,使用这5个合成数据集分别进行机器学习训练,可以使用提升、二元决策树、支持向量机等算法作为基学习器,训练出5个基分类器H_i;在步骤508中,综合所有基分类器H_i,例如采用投票(bagging)等方法得到每片训练晶圆的集成分类器。综合所有训练晶圆的集成分类器并确定最终的集成分类器。例如包括使用其中分类效果最好(例如接收者操作曲线ROC评估最佳)的分类器来做为最终集成分类器;或者使用所有训练晶圆的集成分类器,但遵循少数服从多数的投票原则来确定最终的FT预测结果的方法等。
(2)成品测试(FT)预测。将其它晶圆上裸片的前期测试数据(例如WAT, CP等数据)进行数据预处理,其中包括异常数据去除,数据特征工程等,然后将数据输入训练好的集成分类器进行裸片的成品测试结果(FT)预测并分类,并按预测结果将不同规格的合格裸片封装形成不同规格的芯片产品。
实施例3:半导体芯片晶圆在制造完成之后会进行晶圆接受测试(WAT),然后晶圆会被送往封装厂进行分类测试和封装。封装厂会根据晶圆的WAT数据结果将裸片(die)按品质分类,从而进行下一步的已知合格裸片(CP)测试,不同品质的裸片将会进行不同的CP测试流程。裸片的这些前期测试数据将会被用来预测裸片的成品测试(FT)结果。利用机器学习算法预测晶圆裸片FT结果主要包括以下两个部分:
(1)分类器的训练。通常在出厂的晶圆上不合格裸片所占的比例比较小,所以不合格与合格裸片的数据集存在极大的不平衡性,使用这样的数据集会对机器学习模型训练的准确性带来很大影响。本发明的其中一个实施例是在分类器训练过程中采用随机递减降采样和集成算法(BalanceCascade算法)来预测裸片的最终测试(FT)结果。图6是这一方法的步骤示意图(600)。在步骤602 中,选取一定数目的晶圆用作分类器训练(具体晶圆数目以及挑选方式可以根据分类器训练的需求来确定),从每片训练晶圆上选出所有不合格(CP测试合格但FT测试不合格)的裸片样本SMIN,然后采用随机或拉丁超立方等抽样方法在每片晶圆上选取5个不同区域(如图3所示)采集合格裸片(CP和FT测试都合格)的样本
Figure BDA0002954569270000091
(具体的区域采样位置与数目可以根据预测的需要来确定),每个区域的合格裸片采样数目和晶圆上所有不合格裸片的样本数目基本保持一致。接下来从这5个区域的所有合格裸片数据样本
Figure BDA0002954569270000092
中随机抽取一个与不合格裸片样本SMIN数目近似的子集,然后将这个子集与不合格裸片样本集合并组成一个合成数据集;在步骤604中,对这个合成数据集进行特征提取和特征工程,即对数据中影响成品测试(FT)结果的主要参数进行识别,使用包括但不限于稳健线性回归,随机森林等算法来确定这些参数对FT结果的影响程度;此外还可以通过统计算法得出这些数据的统计值,例如平均值,均方差等作为额外的特征值。在步骤606中,使用这合成数据集进行机器学习训练,使用提升、二元决策树、支持向量机等算法作为基学习器,训练出一个基分类器 H_i;在步骤608中,从5个区域的所有合格裸片数据样本
Figure BDA0002954569270000101
中删除掉已被H_i正确分类的合格裸片样本;重复以上步骤,直到达到最大迭代次数,最终输出一个集成分类器。综合所有训练晶圆的集成分类器并确定最终的集成分类器。例如包括使用其中分类效果最好(例如接收者操作曲线ROC评估最佳)的分类器来做为最终集成分类器;或者使用所有训练晶圆的集成分类器,但遵循少数服从多数的投票原则来确定最终的FT预测结果的方法等。
(2)成品测试(FT)预测。将其它晶圆上裸片的前期测试数据(例如WAT, CP等数据)进行数据预处理,其中包括异常数据去除,数据特征工程等,然后将数据输入训练好的集成分类器进行裸片的成品测试结果(FT)预测并分类,并按预测结果将不同规格的合格裸片封装形成不同规格的芯片产品。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种利用机器学习分类器提高半导体芯片良品率的方法,其特征在于,包括如下步骤:
S1、基于预设算法建立机器学习分类器;
S2、基于晶圆裸片的前期数据,建立训练数据集;
S3、使用所述训练数据集训练所述机器学习分类器,并使用训练后的机器学习分类器预测晶圆裸片的成品测试结果;
S4、基于所述成品测试结果对裸片进行品质分类,并按品质分类对裸片进行封装。
2.根据权利要求1所述的方法,其特征在于,步骤S1中,所述预设算法为随机降采样和集成算法;步骤S2具体包括:
S21a、选取预设数量的晶圆作为训练晶圆,从每片训练晶圆上选出所有CP测试合格但FT测试不合格的裸片组成不合格裸片样本集SMIN
S22a、在每片训练晶圆上选取n个不同区域采集CP测试和FT测试均合格的裸片组成合格裸片样本集
Figure FDA0002954569260000011
其中1<n<100,每个区域的合格裸片采样数目和该训练晶圆上所有不合格裸片的样本数目基本保持一致;
S23a、使用每个区域的合格裸片样本集SMAJ_i和不合格裸片样本集SMIN组成n个合成数据集。
3.根据权利要求1所述的方法,其特征在于,步骤S1中,所述预设算法为随机有放回降采样和集成算法;步骤S2具体包括:
S21b、选取预设数量的晶圆作为训练晶圆,从每片训练晶圆上选出所有CP测试合格但FT测试不合格的裸片组成不合格裸片样本集SMIN
S22b、在每片训练晶圆上选取n个不同区域采集CP测试和FT测试均合格的裸片组成样合格裸片本集
Figure FDA0002954569260000012
其中1<n<100,每个区域的合格裸片采样数目和该训练晶圆上所有不合格裸片的样本数目基本保持一致;
S23b、从合格裸片样本集
Figure FDA0002954569260000013
中有放回的随机采样n次,每次选取与不合格裸片样本集SMIN中近似的样本,得到共n个新合格样本数据集;
S24b、分别使用每一个新合格样本数据集与不合格裸片样本集SMIN组成n个合成数据集。
4.根据权利要求2或3所述的方法,其特征在于,步骤S3具体包括:
S31a、对n个合成数据集进行特征提取和特征工程,识别数据中影响FT测试结果的主要参数;
S32a、使用n个合成数据集分别进行机器学习训练,训练得到n个基分类器H_i;
S33a、综合所有基分类器H_i,得到每片训练晶圆的集成分类器,并基于所有训练晶圆的集成分类器确定最终的集成分类器或确定最终的FT预测结果。
5.根据权利要求1所述的方法,其特征在于,步骤S1中,所述预设算法为随机递减降采样和集成算法;步骤S2具体包括:
S21c、选取预设数量的晶圆作为训练晶圆,从每片训练晶圆上选出所有CP测试合格但FT测试不合格的裸片组成不合格裸片样本集SMIN
S22c、在每片训练晶圆上选取n个不同区域采集CP测试和FT测试均合格的裸片组成样合格裸片本集
Figure FDA0002954569260000021
其中1<n<100,每个区域的合格裸片采样数目和该训练晶圆上所有不合格裸片的样本数目基本保持一致;
S23c、从n个区域的合格裸片样本集
Figure FDA0002954569260000022
中随机抽取一个与不合格裸片样本集SMIN数目近似的子集,然后将该子集与不合格裸片样本集SMIN合并组成一个合成数据集。
6.根据权利要求5所述的方法,其特征在于,步骤S3具体包括:
S31b、对合成数据集进行进行特征提取和特征工程,识别数据中影响FT测试结果的主要参数;
S32b、使用合成数据集进行机器学习训练,训练得到一个基分类器H_i;
S33b、从n个区域的合格裸片样本集
Figure FDA0002954569260000023
中删除掉已被H_i正确分类的合格裸片样本;重复以上步骤,直到达到最大迭代次数,最终输出一个集成分类器;
S34b、基于所有训练晶圆的集成分类器确定最终的集成分类器或获取最终的测试结果。
7.根据权利要求4或6所述的方法,其特征在于,步骤S31a和S31b中,识别数据中影响FT测试结果的主要参数具体包括:使用稳健线性回归或随机森林算法确定参数对FT结果的影响程度,并通过统计算法获取识别的主要参数的统计值作为额外的特征值;S32a和S32b中,使用提升、二元决策树或支持向量机算法作为基学习器训练得到基分类器。
8.根据权利要求4或6所述的方法,其特征在于,步骤S33a中,综合所有基分类器H_i采用投票方式得到每片训练晶圆的集成分类器。
9.根据权利要求4或6所述的方法,其特征在于,步骤S33a和S34b中,使用所有集成分类器中分类效果最好的分类器做为最终的集成分类器,或者遵循少数服从多数的投票原则确定最终的集成分类器。
10.根据权利要求1所述的方法,其特征在于,所述半导体芯片包括但不限于存储芯片、静态随机存储器、动态随机存储器、铁电随机存储器、自旋转移磁矩磁性随机存储器、阻变随机存储器、相变随机存储器或3D Xpoint存储器,以及SOC数字芯片、模拟芯片、逻辑芯片或射频芯片。
CN202110223090.0A 2021-02-26 2021-02-26 利用机器学习分类器提高半导体芯片良品率的方法 Active CN112990479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110223090.0A CN112990479B (zh) 2021-02-26 2021-02-26 利用机器学习分类器提高半导体芯片良品率的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110223090.0A CN112990479B (zh) 2021-02-26 2021-02-26 利用机器学习分类器提高半导体芯片良品率的方法

Publications (2)

Publication Number Publication Date
CN112990479A true CN112990479A (zh) 2021-06-18
CN112990479B CN112990479B (zh) 2022-02-11

Family

ID=76351421

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110223090.0A Active CN112990479B (zh) 2021-02-26 2021-02-26 利用机器学习分类器提高半导体芯片良品率的方法

Country Status (1)

Country Link
CN (1) CN112990479B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114264930A (zh) * 2021-12-13 2022-04-01 上海华岭集成电路技术股份有限公司 一种芯片筛选测试的方法
CN115144735A (zh) * 2022-08-30 2022-10-04 北京象帝先计算技术有限公司 测试程序确定方法、装置、电子设备及可读存储介质
CN116774017A (zh) * 2023-08-22 2023-09-19 南京宏泰半导体科技股份有限公司 一种基于机器学习的芯片测试效率提升系统及方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090210201A1 (en) * 2008-02-14 2009-08-20 Bickford Jeanne P Spence System and method to predict chip iddq and control leakage components
CN102262207A (zh) * 2010-05-27 2011-11-30 上海华虹Nec电子有限公司 一种soc芯片测试结果快速判断方法
CN103632168A (zh) * 2013-12-09 2014-03-12 天津工业大学 一种机器学习中的分类器集成方法
CN105225979A (zh) * 2014-06-19 2016-01-06 中芯国际集成电路制造(上海)有限公司 一种半导体器件制程预测系统和方法
CN105990170A (zh) * 2015-01-28 2016-10-05 中芯国际集成电路制造(上海)有限公司 晶圆良率分析方法和装置
CN106409714A (zh) * 2016-10-10 2017-02-15 江苏纳沛斯半导体有限公司 裸片测试方法及晶圆
CN108108848A (zh) * 2017-12-29 2018-06-01 英特尔产品(成都)有限公司 缺陷率预测模型的训练方法、装置及系统
CN109814025A (zh) * 2019-03-18 2019-05-28 烟台睿创微纳技术股份有限公司 一种对晶圆进行测试的设备、方法和系统
CN110929844A (zh) * 2019-10-31 2020-03-27 南方科技大学 芯片成品率预测方法、装置、设备及存储介质
CN112017986A (zh) * 2020-10-21 2020-12-01 季华实验室 半导体产品缺陷检测方法、装置、电子设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090210201A1 (en) * 2008-02-14 2009-08-20 Bickford Jeanne P Spence System and method to predict chip iddq and control leakage components
CN102262207A (zh) * 2010-05-27 2011-11-30 上海华虹Nec电子有限公司 一种soc芯片测试结果快速判断方法
CN103632168A (zh) * 2013-12-09 2014-03-12 天津工业大学 一种机器学习中的分类器集成方法
CN105225979A (zh) * 2014-06-19 2016-01-06 中芯国际集成电路制造(上海)有限公司 一种半导体器件制程预测系统和方法
CN105990170A (zh) * 2015-01-28 2016-10-05 中芯国际集成电路制造(上海)有限公司 晶圆良率分析方法和装置
CN106409714A (zh) * 2016-10-10 2017-02-15 江苏纳沛斯半导体有限公司 裸片测试方法及晶圆
CN108108848A (zh) * 2017-12-29 2018-06-01 英特尔产品(成都)有限公司 缺陷率预测模型的训练方法、装置及系统
CN109814025A (zh) * 2019-03-18 2019-05-28 烟台睿创微纳技术股份有限公司 一种对晶圆进行测试的设备、方法和系统
CN110929844A (zh) * 2019-10-31 2020-03-27 南方科技大学 芯片成品率预测方法、装置、设备及存储介质
CN112017986A (zh) * 2020-10-21 2020-12-01 季华实验室 半导体产品缺陷检测方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ABHILASH GOYAL等: "RF substrates yield improvement using package-chip codesign and on-chip calibration", 《2010 IEEE ELECTRICAL DESIGN OF ADVANCED PACKAGE & SYSTEMS SYMPOSIUM》 *
程立勇: "PCU03-ABS芯片提高最终测试良品率的研究", 《万方数据》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114264930A (zh) * 2021-12-13 2022-04-01 上海华岭集成电路技术股份有限公司 一种芯片筛选测试的方法
CN115144735A (zh) * 2022-08-30 2022-10-04 北京象帝先计算技术有限公司 测试程序确定方法、装置、电子设备及可读存储介质
CN116774017A (zh) * 2023-08-22 2023-09-19 南京宏泰半导体科技股份有限公司 一种基于机器学习的芯片测试效率提升系统及方法

Also Published As

Publication number Publication date
CN112990479B (zh) 2022-02-11

Similar Documents

Publication Publication Date Title
CN112990479B (zh) 利用机器学习分类器提高半导体芯片良品率的方法
CN109636026B (zh) 一种基于深度学习模型的晶圆良率预测方法
CN113191399B (zh) 一种基于机器学习分类器提高半导体芯片良品率的方法
CN112465040B (zh) 一种基于类不平衡学习算法的软件缺陷预测方法
CN109543720B (zh) 一种基于对抗生成网络的晶圆图缺陷模式识别方法
WO2012094156A2 (en) Methods and apparatus for data analysis
US12027396B2 (en) Systems and methods for systematic physical failure analysis (PFA) fault localization
Huang et al. Improving diagnosis efficiency via machine learning
CN104899327A (zh) 一种无类别标签的时间序列异常检测方法
CN110751186A (zh) 一种基于监督式表示学习的跨项目软件缺陷预测方法
JP3007055B2 (ja) ドットパターンの検出および評価装置および方法
WO2014168883A1 (en) System and method for the automatic determination of critical parametric electrical test parameters for inline yield monitoring
Jiang et al. A Gaussian mixture model clustering ensemble regressor for semiconductor manufacturing final test yield prediction
Gao et al. A process fault diagnosis method using multi‐time scale dynamic feature extraction based on convolutional neural network
JP2024075727A (ja) 画像検査装置、画像検査方法及びプログラム
Kim et al. Fault detection prediction using a deep belief network-based multi-classifier in the semiconductor manufacturing process
CN111223799B (zh) 工艺控制方法、装置、系统及存储介质
CN115798559A (zh) 失效单元预测方法、装置、设备及存储介质
CN115269247A (zh) 基于深度森林的闪存坏块预测方法、系统、介质及设备
CN114169460A (zh) 样本筛选方法、装置、计算机设备和存储介质
US20230377132A1 (en) Wafer Bin Map Based Root Cause Analysis
CN112966827B (zh) 一种存储器开发过程中的良品率预测方法
CN115979643A (zh) 一种滚动轴承故障诊断方法及系统
JP2000298595A (ja) データ処理方法および装置、情報記憶媒体
Kim et al. Detection of field failure chips by ensemble learned from different chip areas

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant