不良分类方法及装置
技术领域
本发明涉及半导体技术领域,特别是指一种不良分类方法及装置。
背景技术
随着高科技半导体技术不断的发展,半导体产业被誉为科技业的命脉,中国半导体市场急剧扩张,终将成为中国经济的支柱。
在摩尔定律的推动下,半导体制程持续微缩。成熟的量产技术已达14纳米,半导体大厂更朝10纳米、7纳米迈进,连5纳米也在规划中。随着技术节点的推进,随之而来的是器件结构、材料、图案形成与制程技术、晶圆尺寸等都发生了转变。更小的关键尺寸(7纳米或更低)和高集成度带来许多物理缺陷,致使晶圆代工厂面临产量低产品功能性失效的问题。在这种情况下,量测和检测分析等制程控制技术对半导体行业的发展愈发的重要。
制程控制中的检测、量测与数据分析等方法广泛地运用在整个半导体制造周期中。从前端的半导体材料硅片制造,到晶圆制造,中测,封装到成测。每一步都会对良率产生影响,并且最终良率是由每一步的良率的积组成。
从产线中通过检测设备获取不良数据,将不良数据分类成不同的类,以供良率工程师分析使用,有助于良率的提升,但现有的不良分类方法的分类结果不够精确。
发明内容
本发明要解决的技术问题是提供一种不良分类方法及装置,能够实现晶圆制程中对不良样本的精确分类。
为解决上述技术问题,本发明的实施例提供技术方案如下:
一方面,本发明实施例提供一种不良分类方法,包括:
利用不良特征信息与生产执行系统MES信息组成原始数据集;
利用所述原始数据集构造多个子数据集,每一子数据集包括多个数据样本;
对每一子数据集生成一决策树,并得到每一决策树的分类结果;
利用随机森林选择算法选择票数最多的分类结果,作为最终的分类结果。
可选地,还包括:
获取检测设备测量得到的不良特征信息。
可选地,所述利用所述原始数据集构造多个子数据集包括:
从所述原始数据集中随机采样出N个数据样本构造所述子数据集,N为大于1的整数。
本发明的实施例还提供了一种不良分类装置,包括:
原始数据集构建模块,用于利用不良特征信息与生产执行系统MES信息组成原始数据集;
子数据集构造模块,用于利用所述原始数据集构造多个子数据集,每一子数据集包括多个数据样本;
决策树生成模块,用于对每一子数据集生成一决策树,并得到每一决策树的分类结果;
处理模块,用于利用随机森林选择算法选择票数最多的分类结果,作为最终的分类结果。
可选地,还包括:
获取模块,用于获取检测设备测量得到的不良特征信息。
可选地,所述子数据集构造模块具体用于从所述原始数据集中随机采样出N个数据样本构造所述子数据集,N为大于1的整数。
本发明的实施例还提供了一种不良分类装置,所述不良分类装置包括处理器、存储器以及存储于所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的不良分类方法的步骤。
本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的不良分类方法的步骤。
本发明的实施例具有以下有益效果:
上述方案中,利用不良特征信息与生产执行系统MES信息组成原始数据集,通过从MES获取全面的制程因子参数,引入到不良的分类过程中,使分类结果更加可信;另外,本发明采用随机森林算法,能够处理特征数量巨大的数据,并且不用做特征选择;通过随机森林算法对不良数据样本进行训练,可以实现精准预测和分类,随着工厂不良数据不断积累,分类结果会更加精准。
附图说明
图1为对不良进行特征分析的示意图;
图2为利用决策树进行不良分类的示意图;
图3为制造过程中各种因子对不良产生影响的示意图;
图4为本发明实施例不良分类方法的流程示意图;
图5为本发明具体实施例对不良进行分类的示意图;
图6为本发明实施例不良分类装置的结构框图。
具体实施方式
为使本发明的实施例要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
在硅片制造和晶圆制造厂中,有专门从事良率提升(YE)的部门。良率工程师对制造工艺十分精通,通过公司的良率管理系统(YMS)对一些数据进行良率分析,现在主流的分析方法是:从产线中通过检测设备获取不良数据并结合工艺监控数据找到不良发生的工艺,并将其改善。而晶圆生产过程中的人员、机器、材料、环境都有可能引入灰尘、颗粒等肉眼看不见的不良。设备会将扫描到的不良进行特征分析如图1所示,并将不良分类:如划伤(Scratch)、颗粒(Particle)、深坑(PIT)、残留物(Recidue)等。
目前最主要的分类方法是采用决策树的算法,如图2所示,这个算法支持分类问题,如图2所示,可以看到该算法根据不良的特征属性将扫描到的不良分类成不同的类,以供良率工程师分析使用。
但该方法的缺点是分析孤立,只关注于不良的几何特征,没有引入不良产生的环境、设备、人员、材料等因子。如图3所示,在制造过程中,不同工序的环境(温湿度、洁净度)、设备(类型、结构)、人员(熟练度、规范性)、材料(纯度、型号)等都会有差异。所有因子的叠加,最终会导致不良的发生。
所以一种包含尽可能全面的制程因子的不良分类方法是很有必要的。
本发明实施例提供一种不良分类方法及装置,能够实现晶圆制程中对不良样本的精确分类。
本发明实施例提供一种不良分类方法,如图4所示,包括:
步骤101:利用不良特征信息与生产执行系统MES信息组成原始数据集;
步骤102:利用所述原始数据集构造多个子数据集,每一子数据集包括多个数据样本;
步骤103:对每一子数据集生成一决策树,并得到每一决策树的分类结果;
步骤104:利用随机森林选择算法选择票数最多的分类结果,作为最终的分类结果。
本实施例中,利用不良特征信息与生产执行系统MES信息组成原始数据集,通过从MES获取全面的制程因子参数,引入到不良的分类过程中,使分类结果更加可信;另外,本发明采用随机森林算法,能够处理特征数量巨大的数据,并且不用做特征选择;通过随机森林算法对不良数据样本进行训练,可以实现精准预测和分类,随着工厂不良数据不断积累,分类结果会更加精准。
可选地,不良分类方法还包括:
获取检测设备测量得到的不良特征信息。
可选地,所述利用所述原始数据集构造多个子数据集包括:
从所述原始数据集中随机采样出N个数据样本构造所述子数据集,N为大于1的整数。由于随机选择数据样本可以使得每次学习决策树使用不同训练集,所以能够在一定程度上避免过拟合。
一具体实施例中,如图5所示,首先从工厂MES系统中获取硅片(或晶圆)的完整制程信息,将检测设备测算的不良特征信息(图1中所示)与MES信息共同组成原始数据集。
从原始数据集中有放回地随机采样出N个样本,构造出M个子数据集,M为大于1的整数。每个子数据集都可生成各自的决策树,每棵决策树都会给出一个分类结果,并且该树会给该分类结果“投票”,通过随机森林算法选择票数最多的分类结果,即为最终的分类结果,如图5所示,最终分类结果为:不良类型为A。
本发明的实施例还提供了一种不良分类装置,如图6所示,包括:
原始数据集构建模块21,用于利用不良特征信息与生产执行系统MES信息组成原始数据集;
子数据集构造模块22,用于利用所述原始数据集构造多个子数据集,每一子数据集包括多个数据样本;
决策树生成模块23,用于对每一子数据集生成一决策树,并得到每一决策树的分类结果;
处理模块24,用于利用随机森林选择算法选择票数最多的分类结果,作为最终的分类结果。
本实施例中,利用不良特征信息与生产执行系统MES信息组成原始数据集,通过从MES获取全面的制程因子参数,引入到不良的分类过程中,使分类结果更加可信;另外,本发明采用随机森林算法,能够处理特征数量巨大的数据,并且不用做特征选择;通过随机森林算法对不良数据样本进行训练,可以实现精准预测和分类,随着工厂不良数据不断积累,分类结果会更加精准。
可选地,不良分类装置还包括:
获取模块,用于获取检测设备测量得到的不良特征信息。
可选地,所述子数据集构造模块具体用于从所述原始数据集中随机采样出N个数据样本构造所述子数据集,N为大于1的整数。由于随机选择数据样本可以使得每次学习决策树使用不同训练集,所以能够在一定程度上避免过拟合。
一具体实施例中,如图5所示,首先从工厂MES系统中获取硅片(或晶圆)的完整制程信息,将检测设备测算的不良特征信息(图1中所示)与MES信息共同组成原始数据集。
从原始数据集中有放回地随机采样出N个样本,构造出M个子数据集,M为大于1的整数。每个子数据集都可生成各自的决策树,每棵决策树都会给出一个分类结果,并且该树会给该分类结果“投票”,通过随机森林算法选择票数最多的分类结果,即为最终的分类结果,如图5所示,最终分类结果为:不良类型为A。
本发明的实施例还提供了一种不良分类装置,所述不良分类装置包括处理器、存储器以及存储于所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的不良分类方法的步骤。
本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的不良分类方法的步骤。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。