WO2022266890A1

WO2022266890A1 - 一种确定失效原因的方法及装置

Info

Publication number: WO2022266890A1
Application number: PCT/CN2021/101866
Authority: WO
Inventors: 黄鑫; 秦旻; 黄宇; 许若圣; 丁智浩
Original assignee: 华为技术有限公司
Priority date: 2021-06-23
Filing date: 2021-06-23
Publication date: 2022-12-29
Also published as: CN117561502A

Abstract

本申请涉及用于确定失效原因的方法、装置、设备、存储介质和程序产品。在确定失效原因的方法中，获得根因分析模型。该根因分析模型被配置为基于分别与待分析元件的多个部分的失效有关的多个量化表示，来标识待分析元件失效的根本原因。如果接收到一组输入样本，获取与根因分析模型的历史训练有关的一组特征样本。每个样本包括分别与参考元件的多个参考部分的失效有关的多个参考量化表示和参考元件失效的根本原因。接下来，基于参考元件失效的根本原因和多个参考量化表示，更新根因分析模型。以此方式，可以实现根因分析模型的持续学习，使根因分析模型对不同设计和工艺具有稳定表现，提供高准确性的根因确定结果。

Description

一种确定失效原因的方法及装置

技术领域

本申请主要涉及失效分析领域。更具体地，涉及用于一种确定失效原因的方法、装置、设备、计算机可读存储介质以及计算机程序产品。

背景技术

在半导体制造过程中，保证集成电路芯片的稳定高产能对于质量、可靠性和利润来说都是至关重要的。随着摩尔定律的演进，半导体工艺关键尺寸不断缩小，新设计和新工艺中存在的问题越来越难以定位和分析。针对出现的问题，可以基于布局感知分析技术分析得到可能导致问题在物理上的根本原因(也简称为“根因”)。但布局感知分析技术得到的分析结果存在较大的噪声，例如某个分析结果可能会指向多个疑似区域，一个疑似区域可能包含多个根因等。这给进一步分析以确定真正的根因带来了困难。在这种情况下，通过使用根因分析(RCA)技术进行进一步筛查。

发明内容

本申请公开的实施例提供了一种确定失效原因的方案。

在本申请公开的第一方面，提供了一种用于确定失效原因的装置。该装置包括：推理模块，被配置为基于分别与待分析元件的多个部分的失效有关的多个量化表示，根据根因分析模型，来标识待分析元件失效的根本原因。该装置还包括与推理模块耦合的学习模块。学习模块包括：输入样本接收单元，被配置为接收针对根因分析模型的一组输入样本；特征样本获取单元，被配置为获取与根因分析模型的历史训练有关的一组特征样本，一组输入样本和一组特征样本中的每个样本包括参考元件失效的根本原因、和分别与参考元件的多个参考部分的失效有关的多个参考量化表示；以及模型更新单元，被配置为基于参考元件失效的根本原因和多个参考量化表示，训练根因分析模型。

推理模块可以利用根因分析模型来快速确定被分析元件失效的根因。学习模块可以利用新工艺或新设计的新增样本和与历史训练有关的特征样本，来更新根因分析模型。以此方式，可以使根因分析模型针对不同设计和工艺进行适应性调整。这可以提升根因分析模型对新工艺和新设计的识别精度，同时保证对历史全任务的稳定表现，从而提供更高精度的根因确定结果。此外，根因分析模型的更新可以自动完成，从而节约人力、物料和时间成本并提升效率。

在第一方面的一些实施例中，特征样本获取单元进一步被配置为：根据样本生成器，生成一组特征样本，样本生成器被配置为再现用于训练根因分析模型的历史样本的特征，并且一组特征样本反映历史样本的特征。在这种实施例中，利用样本生成器，可以减小存储历史样本所消耗的存储空间。以此方式，可以以节省资源的方式实现根因分析模型的更新。

在第一方面的一些实施例中，学习模块还包括：生成器更新单元，被配置为基于一组输入样本，更新样本生成器的网络参数。以此方式，经更新的样本生成器能够再现一组输入样本的特征。可以使经更新的样本生成器用于根因分析模型的下一次更新，从而实现根因分析模型稳定的持续学习和更新。

在第一方面的一些实施例中，模型更新单元进一步被配置为：通过将多个参考量化表示应用于根因分析模型，确定由根因分析模型标识的、参考元件失效的潜在原因；以及通过最小化参考元件失效的根本原因与潜在原因之间的差异，更新根因分析模型的网络参数。以此方式，可以利用监督训练过程来重新确定根因分析模型的参数，以保证根因分析模型对历史全任务的稳定表现。

在第一方面的一些实施例中，推理模块包括：诊断报告接收单元，被配置为接收关于待分析元件的多个诊断报告，每个诊断报告对应于待分析元件的多个部分中的一个部分，并且指示一个部分失效的潜在根本原因、物理缺陷和逻辑错误；量化表示生成单元，被配置为从多个诊断报告，生成分别与多个部分的失效有关的多个量化表示；以及根本原因标识单元，被配置为通过将多个量化表示应用于根因分析模型，标识待分析元件失效的根本原因。以此方式，利用端到端的根因分析模型可以快速确定待分析元件失效的根本原因。

在第一方面的一些实施例中，根本原因标识单元进一步被配置为：通过将多个量化表示应用于根因分析模型中的特征提取器，从多个量化表示生成多个局部失效特征，每个局部失效特征与多个部分中的一个部分相对应；将多个局部失效特征组合为针对待分析元件的全局失效特征；以及通过将全局失效特征应用于根因分析模型中的分类器，确定不同的根本原因引起待分析元件失效的概率。以此方式，实现了从局部到全局的整合，这有利于更准确地确定待分析元件失效的根本原因。

在第一方面的一些实施例中，量化表示生成单元进一步被配置为：针对多个诊断报告中的给定诊断报告，将给定诊断报告中指示的多个潜在根本原因的量化表示组合成与多个潜在根本原因相关联的第一物理缺陷的量化表示；将第一物理缺陷的量化表示和至少第二物理缺陷的量化表示组合成与第一物理缺陷和第二物理缺陷相关联的第一逻辑错误的量化表示；以及至少基于第一逻辑错误的量化表示，生成与一个部分的失效有关的量化表示。在这种实施例中，以从底向上的方式来构建与失效有关的量化表示，使得所构建的量化表示能够反映待分析元件的局部失效。

在第一方面的一些实施例中，推理模块还包括：量化表示调整单元，被配置为在将多个量化表示应用于根因分析模型之前，基于与多个诊断报告分别指示的潜在根本原因有关的面积，来调整多个量化表示。以此方式，可以减小或甚至消除不同的根因所对应的元件面积的影响，这有助于进一步提高根因确定的准确性。

在第一方面的一些实施例中，一组输入样本中的至少一个输入样本所包括的根本原因是根据根因分析模型确定并且经由测试验证的。以此方式，可以利用新设计或新工艺中的真实样本来更新根因分析模型。这使得经更新的根因分析模型更好地适应新设计或新工艺。

在第一方面的一些实施例中，待分析元件包括待分析晶圆，并且多个部分包括待分析晶圆的多个裸片。半导体工艺的发展迅速，新设计和新工艺不断出现。将可持续学习的根因分析模型应用于晶圆，能够有效节约资源和成本，提高效率。

在本申请公开的第二方面，提供了一种确定失效原因的方法。该方法包括：接收针对根因分析模型的一组输入样本，根因分析模型被配置为基于分别与待分析元件的多个部分的失效有关的多个量化表示，来标识待分析元件失效的根本原因；获取与根因分析模型的历史训练有关的一组特征样本，一组输入样本和一组特征样本中的每个样本包括参考元件失效的根本原因、和分别与参考元件的多个参考部分的失效有关的多个参考量化表示；以及基于参考元件失效的根本原因和多个参考量化表示，训练根因分析模型。

利用根因分析模型可以快速确定被分析元件失效的根因。利用新工艺或新设计的新增样本和与历史训练有关的特征样本来更新根因分析模型，可以使根因分析模型针对不同设计和工艺进行适应性调整。这可以提升根因分析模型对新工艺和新设计的识别精度，同时保证对历史全任务的稳定表现，从而提供更高准确性的根因确定结果。此外，根因分析模型的更新可以自动完成，从而节约人力、物料和时间成本并提升效率。

在第二方面的一些实施例中，获取一组特征样本包括：根据样本生成器，生成一组特征样本，样本生成器被配置为再现用于训练根因分析模型的历史样本的特征，并且一组特征样本反映历史样本的特征。在这种实施例中，利用样本生成器，可以减小存储历史样本所消耗的存储空间。以此方式，可以以节省资源的方式实现根因分析模型的更新。

在第二方面的一些实施例中，该方法还包括：基于一组输入样本，更新样本生成器的网络参数。以此方式，经更新的样本生成器能够再现一组输入样本的特征。可以使经更新的样本生成器用于根因分析模型的下一次更新，从而实现根因分析模型稳定的持续学习和更新。

在第二方面的一些实施例中，训练根因分析模型包括：通过将多个参考量化表示应用于根因分析模型，确定由根因分析模型标识的、参考元件失效的潜在原因；以及通过最小化参考元件失效的根本原因与潜在原因之间的差异，更新根因分析模型的网络参数。以此方式，可以利用监督训练过程来重新确定根因分析模型的参数，以保证根因分析模型对历史全任务的稳定表现。

在第二方面的一些实施例中，该方法还包括：接收关于待分析元件的多个诊断报告，每个诊断报告对应于待分析元件的多个部分中的一个部分，并且指示一个部分失效的潜在根本原因、物理缺陷和逻辑错误；从多个诊断报告，生成分别与多个部分的失效有关的多个量化表示；以及通过将多个量化表示应用于根因分析模型，标识待分析元件失效的根本原因。以此方式，利用端到端的根因分析模型可以快速确定待分析元件失效的根本原因。

在第二方面的一些实施例中，标识待分析元件失效的根本原因包括：通过将多个量化表示应用于根因分析模型中的特征提取器，从多个量化表示生成多个局部失效特征，每个局部失效特征与多个部分中的一个部分相对应；将多个局部失效特征组合为针对待分析元件的全局失效特征；以及通过将全局失效特征应用于根因分析模型中的分类器，确定不同的根本原因引起待分析元件失效的概率。以此方式，实现了从局部到全局的整合，这有利于更准确地确定待分析元件失效的根本原因。

在第二方面的一些实施例中，生成多个量化表示包括：针对多个诊断报告中的给定诊断报告，将给定诊断报告中指示的多个潜在根本原因的量化表示组合成与多个潜在根本原因相关联的第一物理缺陷的量化表示；将第一物理缺陷的量化表示和至少第二物理缺陷的量化表示组合成与第一物理缺陷和第二物理缺陷相关联的第一逻辑错误的量化表示；以及至少基于第一逻辑错误的量化表示，生成与一个部分的失效有关的量化表示。在这种实施例中，以从底向上的方式来构建与失效有关的量化表示，使得所构建的量化表示能够反映待分析元件的局部失效。

在第二方面的一些实施例中，该方法还包括：在将多个量化表示应用于根因分析模型之前，基于与多个诊断报告分别指示的潜在根本原因有关的面积，来调整多个量化表示。以此方式，可以减小或甚至消除不同的根因所对应的元件面积的影响，这有助于进一步提高根因确定的准确性。

在第二方面的一些实施例中，一组输入样本中的至少一个输入样本所包括的根本原因是根据根因分析模型确定并且经由测试验证的。以此方式，可以利用新设计或新工艺中的真实样本来更新根因分析模型。这使得经更新的根因分析模型更好地适应新设计或新工艺。

在第二方面的一些实施例中，待分析元件包括待分析晶圆，并且多个部分包括待分析晶圆的多个裸片。半导体工艺的发展迅速，新设计和新工艺不断出现。将可持续学习的根因分析模型应用于晶圆，能够有效节约资源和成本，提高效率。

在本申请公开的第三方面，提供了一种电子设备，包括：至少一个处理器；至少一个存储器，至少一个存储器被耦合到至少一个处理器并且存储用于由至少一个处理器执行的指令，指令当由至少一个处理器执行时，使得设备实现第二方面中的任意一种实现方式中的方法。

在本申请公开的第四方面，提供了一种计算机可读存储介质，其上存储有一条或多条计算机指令，其中一条或多条计算机指令被处理器执行实现第二方面中的任意一种实现方式中的方法。

在本申请公开的第五方面，提供一种计算机程序产品，当计算机程序产品在计算机上运行时，使得计算机执行第二方面中的任意一种实现方式中的方法的部分或全部步骤的指令。

可以理解地，上述提供的第三方面的电子设备、第四方面的计算机存储介质或者第五方面的计算机程序产品均用于执行第二方面所提供的方法。因此，关于第二方面的解释或者说明同样适用于第三方面、第四方面和第五方面。此外，第三方面、第四方面和第五方面所能达到的有益效果可参考对应方法中的有益效果，此处不再赘述。

应当理解，发明内容部分中所描述的内容并非旨在限定本申请的实施例的关键或重要特征，亦非用于限制本申请的范围。本申请的其它特征将通过以下的描述变得容易理解。

附图说明

结合附图并参考以下详细说明，本申请的上述和其他特征、优点及方面将变得更加明显。在附图中，相同或相似的附图标记表示相同或相似的元素，其中：

图1示出了本申请的多个实施例能够在其中实现的示例环境的示意图；

图2示出了根据本申请的一些实施例的从诊断报告构建量化表示的示意图；

图3示出了根据本申请的一些实施例的根因分析模型的架构的示意图；

图4示出了根据本申请的一些实施例的更新根因分析模型的示意图；

图5示出了根据本申请的一些实施例的扩展特征库的示意图；

图6示出了根据本申请的一些实施例的确定失效原因的过程的流程图；

图7示出了根据本申请的一些实施例的用于确定失效原因的装置的示意性框图；以及

图8示出了能够实施本申请的多个实施例的计算设备的示意性框图。

具体实施方式

下面将参照附图更详细地描述本申请的实施例。虽然附图中显示了本申请的某些实施例，然而应当理解的是，本申请可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本申请。应当理解的是，本申请的附图及实施例仅用于示例性作用，并非用于限制本申请的保护范围。

在本申请的实施例的描述中，术语“包括”及其类似用语应当理解为开放性包含，即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。术语“和 /或”表示由其关联的两项的至少一项。例如“A和/或B”表示A、B、或者A和B。下文还可能包括其他明确的和隐含的定义。

如本文所使用的，“神经网络”能够处理输入并且提供相应输出，其通常包括输入层和输出层以及在输入层与输出层之间的一个或多个隐藏层。在深度学习应用中使用的神经网络通常包括许多隐藏层，从而延长网络的深度。神经网络的各个层按顺序相连，从而前一层的输出被提供作为后一层的输入，其中输入层接收神经网络的输入，而输出层的输出作为神经网络的最终输出。在本文中，术语“神经网络”、“网络”、“神经网络模型”和“模型”可替换地使用。

如上文所简要提及的，需要使用根因分析技术来确定问题的根本原因。广义上，根因分析是指标识问题或故障的根本原因的过程。具体到半导体领域，根因分析可以用于发现导致芯片失效的根本原因，从而有效保证芯片在量产过程中的高产能。

在半导体领域中，为了定位新设计或新工艺中的问题，通常首先进行芯片测试。芯片测试的主要流程为：首先根据自动化测试设备(ATE)产生的测试向量对芯片或芯片的一部分进行测试，根据逻辑电路输出结果从错误词典中找到产生的错误类型，从而获得ATE失效数据；结合网表图案布局，对ATE失效数据中失效的引脚进行布局感知诊断，并结合先验知识，生成诊断报告。诊断报告主要包括关键面积、疑似区域等。根因分析主要针对生成的诊断报告进行分析，得到导致芯片失效的根因。具体地，利用根因分析，可以从诊断报告中推断出各种根因发生的概率分布，从而定位主要根因，以解决芯片失效问题。

在常规的RCA方案中，使用贝叶斯模型计算各个根因的概率分布。基于真实物理关系分析，可在根因、物理缺陷和逻辑错误之间建立相应的概率联系。在该RCA方案中，可以从失效产生的诊断报告中提取相应数据并计算相应的转移概率。使用基于非监督学习的期望最大(EM)算法进行求解，从而得到最能够解释一系列诊断报告的根因分布。EM算法的求解过程包括迭代进行的期望步骤和最大化步骤。在迭代的期望步骤中，使用当前迭代中第k个根因c _k的概率分布P(c _k)′来估计第n个诊断报告r _n的后验概率P(c _k|r _n)′。在迭代的最大化步骤中，通过最大化N个诊断报告的后验概率P(c _k|r _n)′之和来更新根因的概率分布P(c _k)′。

这种常规方法存在很大不足，因为不同工艺对根因分析准确性影响较大。特别是随着技术的不断演进，工艺尺寸越来越小，中段工艺层(即较底层的金属层)的根因更加难以区分。每次工艺更新需要依赖各个相关方的合作交流进行提升，耗费较大的人力和时间成本。

上文以芯片失效中的根因分析为例，描述了常规RCA方案的问题。在其他一些系统性体系的失效分析中，也存在类似问题。例如，航天器是由各种复杂且精细的部件构成的体系。在航天器的失效分析中，也需要使用RCA确定失效的根因。

为了至少部分地解决上述问题以及其他潜在问题，本申请的各种实施例提供了一种用于确定失效原因的方案。总体而言，根据在此描述的各种实施例，首先获得根因分析模型。该根因分析模型被配置为基于分别与待分析元件的多个部分的失效有关的多个量化表示，来标识待分析元件失效的根本原因。如果接收到针对根因分析模型的一组输入样本，获取与根因分析模型的历史训练有关的一组特征样本。每个样本包括分别参考元件失效的根本原因、和与参考元件的多个参考部分的失效有关的多个参考量化表示。换言之，输入样本和特征样本是带标记样本。接下来，基于输入样本和特征样本所包括的多个参考量化表示和参考元件失效的根本原因，再次训练根因分析模型以更新根因分析模型的网络参数。

在本申请的实施例中，利用根因分析模型可以快速确定被分析元件失效的根因。利用新工艺或新设计的新增样本和与历史训练有关的特征样本来更新根因分析模型，可以实现根因分析模型的持续学习，使根因分析模型针对不同设计和工艺进行适应性调整。这可以提升根因分析模型对新工艺和新设计的识别准确性，同时保证对历史全任务的稳定表现，从而提供更高准确性的根因确定结果。此外，根因分析模型的更新可以自动完成，从而节约人力、物料和时间成本并提升效率。

以下参考附图来描述本申请的各种示例实施例。

示例环境

图1示出了本申请的多个实施例能够在其中实现的示例环境100的示意图。总体上，示例环境100包括根因分析引擎105和关于待分析元件101的多个诊断报告120-1、120-2、……、120-N，其也统称为多个诊断报告120或单独称为诊断报告120，其中N为大于等于1的整数。应当理解，图1所示的环境100仅是示例性的，而无意限制本申请的范围。

如图1所示，待分析元件101包括N个部分102-1、102-2、……、102-N，其也统称为多个部分102或单独称为部分102。在图1的示例中，待分析元件101是晶圆(wafer)，而多个部分102是该晶圆所包括的多个裸片(die)。在另一示例中，待分析元件101可以是航天器，而多个部分可以是该航天器所包括的多个部件。

每个诊断报告120对应于待分析元件101的一个部分，并且指示与该部分失效有关的诊断信息，例如失效的潜在根因、物理缺陷和逻辑错误等。作为示例，诊断报告120-2指示与部分102-2失效有关的诊断信息，例如部分102-2失效的潜在根因、物理缺陷和逻辑错误等。诊断报告120可以是以任何合适的方式生成的，本申请的实施例在此方面不受限制。

根因分析引擎105包括推理模块110和持续学习模块160(也可以简称为“学习模块”)。推理模块110用于根据关于待分析元件101的多个诊断报告120，来标识待分析元件101失效的根因。如图1所示，推理模块110接收多个诊断报告120，并且将诊断报告中关于失效的诊断信息转换为量化表示。具体地，推理模块110从多个诊断报告120，生成分别与多个部分102的失效有关的N个量化表示130-1、130-2、……、130-N，其也统称为多个量化表示130或单独称为量化表示130。每个量化表示130从一个诊断报告120得出。从诊断报告120得出的这种量化表示130可以视为待分析元件101失效的局部原始特征。在一些实施例中，推理模块110还可以包括调整操作140。调整操作140利用权重对每个量化表示130进行调整，以消除不同的根因所对应于的器件面积的影响。

量化表示130或经调整的量化表示130被应用到根因分析模型150。根因分析模型150基于接收到的量化表示130，生成分析结果155，分析结果155标识待分析元件101失效的根因。例如，分析结果155可以包括针对不同根因的概率。又如，分析结果可以包括最可能的预定数目个(例如，一个)根因。在本申请的实施例应用于芯片失效分析的情况下，不同根因可以包括但不限于，金属层断路(诸如M1断路、M2断路等)，金属层短路(诸如M1短路、M2短路等)，过孔(VIA)短路(例如VIA1短路、VIA2短路等)，较大的器件出现问题(在本文中称为“器件问题”)，例如与周围部分发生短路等。

持续学习模块160用于训练根因分析模型150，以更新根因分析模型150的网络参数。具体地，持续学习模块160接收一组输入样本180。输入样本180可以是或可以包括尚未用于训练根因分析模型150的样本。例如，输入样本180可以是新工艺或新设计中产生的新增样本。输入样本180是带标记样本，包括：参考元件失效的根因，以及分别与参考元件的多个参考部分的失效有关的多个参考量化表示。

在一些实施例中，输入样本180可以是应用根因分析模型150被分析的样本。具体地，输入样本180所包括的标记(即，参考元件失效的根因)是根据根因分析模型150确定，并经过测试验证的，如虚线箭头所示。例如，在芯片失效的应用场景中，推理模块110基于失效晶圆的多个裸片的诊断报告，标识该晶圆失效的主要根因。然后，可以在实验上针对该主要根因进行物理验证分析(PFA)。如果由根因分析模型150标识的主要根因通过了PFA验证，则与该晶圆有关的数据可以作为输入样本180由持续学习模块160使用。

备选地或附加地，在一些实施例中，输入样本180可以是通过注错仿真生成的样本。例如，在发展了根因分析模型150的历史训练中未学习过的新工艺或新设计后，可以通过注错仿真生成针对新工艺或新设计的新增样本，以作为用于更新根因分析模型150的输入样本180。以此方式，可以在新工艺或新设计出现后，快速生成新增样本，使经更新的根因分析模型150迅速适用于新工艺或新设计。

持续学习模块160包括特征库190。特征库190用于再现(例如，存储或生成)与根因分析模型150的历史训练有关的样本，其也称为“特征样本”。来自特征库190的特征样本与输入样本180一起组成全样本集合。持续学习模块160进而利用持续学习算法170，基于全样本集合来再次训练根因分析模型150。附加地，输入样本180可以用于扩展特征库190，以使经扩展的特征库190在后续更新中再现输入样本180。

在一些实施例中，特征库190可以包括存储装置，用于存储历史训练任务中用于训练根因分析模型150的历史样本。例如，在历史样本的数量较小的情况下，可以在训练任务结束后，将历史样本存储在特征库190中。在这种实施例中，在接收到输入样本180后，可以从特征库190中直接取回历史样本作为特征样本，并与输入样本一起组成全样本集合。如果输入样本180的数量较少，可以直接将输入样本180存储在特征库190中，以扩展特征库190。

备选地或附加地，在一些实施例中，特征库190可以包括样本生成器。样本生成器被配置为再现在历史训练任务中用于训练根因分析模型的历史样本的特征。在这种实施例中，在接收到输入样本180后，可以根据样本生成器，生成能够反映历史样本的特征的特征样本，并与输入样本一起组成全样本集合。可以基于输入样本180重新训练样本生成器，以扩展特征库190。下文将参考图4和图5来详细描述这种实施例。

应当理解，图1所示的环境100仅是示例性的，而无意限制本申请的范围。可以以任何合适的方式对根因分析引擎105的各个功能进行划分。例如，从诊断报告120得到量化表示130的功能可以独立于推理模块110而实现。也即，在一些实施例中，推理模块110可以接收量化表示130，并将量化表示130或经调整的量化表示130应用于根因分析模型150。在一些实施例中，推理模块110和持续学习模块160可以实现在相同的计算设备或计算系统上。在另一些实施例中，推理模块110和持续学习模块160可以实现不同但彼此通信的计算设备或计算系统上。

推理模块的示例实现

如图1所示，可以从诊断报告120构建待分析元件101的一部分102失效的量化表示130。现在参考图2，图2示出了根据本申请的一些实施例的从诊断报告120构建量化表示130的示意图。诊断报告120可以是图1所示的多个诊断报告120-1、120-2、……、120-N中的任一个。可以按如图2所示的递归树结构200来组织诊断报告120中与失效有关的信息。

递归树包括自底向上的多个层级，例如根因层级、物理缺陷层级和逻辑缺陷层级。根因层级包括由诊断报告120指示的引起对应的部分102失效的潜在的多个根因210-1、210-2、210-3，也统称为多个根因210或单独称为根因210。与根因210有关的信息可以包括根因的名称和关键面积。关键面积是指对应的根因所涉及的器件的面积。

根因层级之上的物理缺陷层级包括多个子疑似区域220-1、220-2、220-3，其也统称为多个子疑似区域220或单独称为疑似区域220。每个子疑似区域220可以是一个物理缺陷，并与根因层级的至少一个根因相关联。例如，子疑似区域220-1与根因210-1、210-2、210-3等相关联。与子疑似区域220有关的信息可以包括缺陷的类型和由诊断报告120给出的得分。该得分可以表示缺陷的发生概率。

在物理缺陷层级之上是逻辑错误层级，其又可以划分为两个子层级。较低的子层级包括多个疑似区域230-1、230-2、230-3，其统称为多个疑似区域230或单独称为疑似区域230。每个疑似区域230与多个子疑似区域相关联，例如可以包括多个子疑似区域。在图2的示例中，疑似区域230-1与子疑似区域220-1、220-2、220-3等相关联。

较高的子层级包括多个症状240-1、240-2、240-3，其也统称为多个症状240或单独地称为症状240。症状240可以是指在测试中直接表现出的错误。每个症状240与多个疑似区域相关联。例如，症状240-1与疑似区域230-1、230-2、230-3相关联。

推理模块110可以基于递归树结构200，通过自底向上递归的方式来构建量化表示130。具体地，针对每个根因210，推理模块110可以从诊断报告120中提取与该根因有关的信息，例如根因的名称(诸如，M1断路、VIA2短路等)和关键面积。然后，将所提取的信息量化，以生成该根因的量化表示(例如，向量)。该根因的量化表示和其他根因的量化表示被组合成上一层级的相关联的子疑似区域220的量化表示。在图2的示例中，根因210-1、210-2、210-3等的量化表示被组合成子疑似区域220-1的量化表示。

针对每个子疑似区域220，推理模块110可以从诊断报告120中提取与相应子疑似区域220有关的信息，例如类型和得分。基于所提取的信息，该子疑似区域的量化表示和其他子疑似区域的量化表示被组合成上一层级的相关联的疑似区域230的量化表示。在图2的示例中，子疑似区域220-1、220-2、220-3的量化表示被组合成疑似区域230-1的量化表示。

类似地，每个疑似区域230的量化表示和其他的疑似区域的量化表示被组合成上一层级的相关联的症状240的量化表示。在图2的示例中，疑似区域230-1、230-2、230-3的量化表示被组合成症状240-1的量化表示。最终，多个症状240-1、240-2、240-3的量化表示被组合成与诊断报告120相对应的量化表示130。量化表示130可以被实现为一维向量，但不限于此。每个量化表示130对应于待分析元件101的一个部分102，并且是待分析元件101失效的局部原始特征。

在本申请的实施例中，可以通过任何合适的方式将下一层级的多个量化表示组合成上一层级的量化表示。在一个示例中，可以对下一层级的多个量化表示进行平均或取最大值，以生成上一层级的量化表示。例如，可以通过对根因210-1、210-2、210-3的量化表示进行平均，来生成子疑似区域220-1的量化表示。在另一示例中，可以将下一层级的多个量化表示作为不同的通道进行联接(concatenate)，将联接在一起的多个量化表示作为上一层级的量化表示。例如，作为不同通道而联接的根因210-1、210-2、210-3的量化表示可以用作子疑似区域220-1的量化表示。

返回参考图1。在一些实施例中，推理模块110还可以包括调整操作140。调整操作140 可以根据下式对每个量化表示130进行调整：

其中ReportFeat _i表示从第i个诊断报告提取的量化表示，w _i表示针对第i个诊断报告的调整权重，i的取值为1至N。

权重w _i用于减小或甚至消除不同的根因所对应的器件面积的影响。因此，权重w _i可以是基于诊断报告120所指示的不同根因的关键面积(如上文参考图2所描述的)而确定的。在一个示例中，可以从关于待分析元件101的多个诊断报告120提取的RCA常数作为权重w _i。在这种情况下，权重w _i对于所有诊断报告是相同的。可以理解的是，权重w _i具有与ReportFeat _i相同的维度，式(1)的计算是逐元素的。在这种实施例中，通过减小与不同根因有关的面积的影响，可以使根因分析模型150最终标识的根因更为准确。

在获得量化表示130之后，根因分析模型150基于量化表示130，标识待分析元件101失效的根因。参考图3，图3示出了根据本申请的一些实施例的根因分析模型150的架构的示意图。在图3的示例中，根因分析模型150总体上包括特征提取器310和分类器320。

特征提取器310基于N个量化表示130-1、130-2、……、130-N，生成对应的N个局部失效特征301-1、301-2、……、301-N，其也统称为多个局部失效特征301或单独称为局部失效特征301。由于每个量化表示130对应于待分析元件101的一个部分102，因此每个局部失效特征301表征相应的部分102的失效。在芯片失效分析的场景中，每个局部失效特征301对应于晶圆的一个裸片，并且表征该裸片的失效。在这种情况下，局部失效特征301可以视为裸片特征嵌入。

接下来，多个局部失效特征301被组合成针对待分析元件101的全局失效特征302。换言之，多个局部失效特征301被聚合成全局失效特征302。在芯片失效分析的场景中，全局失效特征302可以视为晶圆特征嵌入。在本申请的实施例中，可以通过任何合适的方式来组合多个局部失效特征301。例如，可以通过对多个局部失效特征301进行平均，来生成全局失效特征302。又如，可以将多个局部失效特征301联接在一起，作为全局失效特征302。

全局失效特征302被应用于分类器320。分类器320基于全局失效特征302确定不同的根因引起待分析元件101失效的概率。换言之，分类器320基于全局失效特征302生成根因概率分布。

以芯片失效分析为例，不同的根因或分类器320所划分的类别可以包括金属层断路、金属层短路、过孔短路、器件问题等。作为示例，金属层断路可以包括M0断路、M1断路、M2断路、M3断路、M4断路、M5断路、M6断路、M7断路、M8断路、M9断路等十个不同的根因。金属层短路可以包括M0短路、M1短路、M2短路、M3短路、M4短路、M5短路、M6短路、M7短路、M8短路、M9短路等十个不同的根因。过孔短路可以包括VIA0短路、VIA1短路、VIA2短路、VIA3短路、VIA4短路、VIA5短路、VIA6短路、VIA7短路、VIA8短路、VIA9短路等十个不同的根因。应当理解，以上所列举的类别及其数目以及类别下的具体根因及其数目仅是示例性的，而无意限制本申请的范围。在本申请的各种实施例中，可以针对分类器320设置任何合适类型和数目的根因来生成根因概率分布。

与金属层断路、金属层短路、过孔短路不同，器件问题是难以枚举的类型。为此，在本申请的一些实施例中，针对分类器320引入计数型器件(Count Cell)类别。计数型器件类别的意义在于，某个器件在诊断报告120中出现的次数越多，该器件的短路是真正根因的概率越大。在输出各个计数型器件类别(例如，计数型器件0至计数型器件9)之后，计数型器件推断器330可以对每个计数型器件类别进行映射和召回。例如，计数型器件0对应于通过递归树结构200得到的值最大的器件，计数型器件1对应于通过递归树结构200得到的值第二大的器件，以此类推。然后，可以从诊断报告120中提取值最大的器件的器件名称、值第二大的器件的器件名称，以此类推。将计数型器件名称及对应的概率作为分析结果155的一部分输出。

从以上描述中可以看出，根因分析模型150是一种端到端的架构。因此，在应用阶段，利用根因分析模型150可以快速确定待分析元件失效的根因。

应当理解，以上参考图3描述的根因分析模型150的架构仅是示例性的，而无意限制本申请的范围。也可以利用其他架构来实现根因分析模型150，例如特征提取器和分类器的作业可以整体实现，即由同一个网络来实现。

在训练阶段，可以通过注错仿真的方式生成带标记的训练样本，以对根因分析模型150进行训练。训练样本对应于参考元件(例如，注错仿真中的晶圆)，并且包括与参考元件的多个部分(例如，多个裸片)的失效有关的量化表示以及参考元件失效的根因(例如，注错仿真所注入的根因)。

在训练阶段，在一些实施例中，还可以实现迁移能力增强操作340，其用于消除训练中涉及的不同工艺或设计之间的差异。以芯片失效为例，如果训练中既涉及a纳米工艺也涉及b纳米工艺(其中，a不等于b)，考虑到这两种不同工艺中相同类型的器件的面积不同，因此为了提高根因分析模型的准确性，需要进行迁移能力增强。例如，迁移能力增强操作340可以对训练中涉及的每个参考元件(例如，训练样本对应的晶圆)的特征做归一化处理，从而消除不同工艺或设计之间的差异。

在本申请的实施例中，特征提取器310和分类器320可以基于任何合适的神经网络结构来实现。在一些实施例中，可以基于深度神经网络(DNN)来构建特征提取器310和分类器320。在另一些实施例中，可以基于其他类型的神经网络来构建特征提取器310和分类器320，例如卷积神经网络、循环神经网络、变换器(Transformer)等。应当理解，本申请的范围在此方面不受限制。

持续学习模块的示例实现

返回参考图1，如上文参考图1所描述的，持续学习模块160用于更新经训练的根因分析模型150。具体地，尚未用于训练根因分析模型150的输入样本180可以与来自特征库190的特征样本组成全样本集合。持续学习模块160进而可以利用全样本集合来再次训练根因分析模型150。输入样本180和来自特征库190的特征样本是带标记样本，包括参考元件失效的根因、以及分别与参考元件的多个参考部分的失效有关的多个参考量化表示。相应地，利用全样本集合对根因分析模型150的训练是监督学习过程。例如，持续学习模块160可以将多个参考量化表示应用于根因分析模型150，以确定由根因分析模型150标识的、参考元件失效的潜在原因。通过最小化参考元件失效的根本原因(即，真值)与所标识的潜在原因(即，预测值)之间的差异，可以更新根因分析模型150的网络参数。例如，可以基于该差异来计算损失函数，并通过最小化损失函数来更新根因分析模型150的网络参数。

鉴于直接存储历史训练中使用的历史样本占用大量的存储空间，在一些实施例中，特征库190可以包括样本生成器。现在参考图4，图4示出了根据本申请的一些实施例的利用样本生成器410来更新根因分析模型150的示意图。

样本生成器410被配置为再现在历史训练任务中用于训练根因分析模型的历史样本的特征。换言之，由样本生成器410生成的针对每次历史训练任务的特征样本与该次历史训练任务中的历史样本具有相同的分布特性。为此，需要用历史训练任务中的历史样本来训练样本生成器410。

在下文中，用t来表示与输入样本180相对应的当前训练任务，并且用1～t-1来表示历史训练任务。相应地，当前训练任务的输入样本180可以表示为D _t，而与历史训练任务有关的特征样本可以表示为D _1～t-1。例如，样本生成器410可以针对每次历史训练任务，利用随机数z来生成特征样本，从而获得与历史训练任务1～t-1有关的特征样本D _1～t-1。可以理解的是，特征样本D _1～t-1并非是原始的诊断报告，而是带标记数据，包括多个量化表示和对应的失效根因。特征样本D _1～t-1进而与当前任务的样本D _t组成全样本集合401，即D _1～t。持续学习算法170进而基于全样本集合401来再次训练根因分析模型150，以更新模型的网络参数。

可以利用任何合适的神经网络来实现样本生成器410。在一些实施例中，可以利用条件生成式对抗网络(GAN)来实现样本生成器410。备选地，在一些实施例中，也可以基于其他神经网络来实现样本生成器410，例如可以利用变分自编码器(VAE)或条件VAE等来实现样本生成器410。

返回参考图1。当前的特征库190仅能再现1～t-1次历史训练任务的样本特征。为了应对第t+1次训练任务，可以基于当前任务t的输入样本D _t来扩展特征库190。例如，可以利用全样本集合D _1～t来再次训练样本生成器410以更新样本生成器410的网络参数，使得经更新的样本生成器410能够再现1～t训练任务中的样本的特征。

现在参考图5，图5示出了根据本申请的一些实施例的扩展特征库的示意图。在图5的示例中，样本生成器410是利用条件GAN来实现的。相应地，样本生成器410的训练需要借助于样本判别器520。具体来说，针对第1至t次训练任务中的每次训练任务，样本生成器410生成该次训练任务的样本，并输入到样本判别器520。全样本集合401中的该次训练任务的样本也被输入到样本判别器520作为真值。

基于此，样本判别器520判断来自样本生成器410的样本是真样本还是假样本，并得到生成式对抗网络损失函数L _GAN和交叉熵损失函数L _CE。损失函数L _GAN和L _CE用于训练样本生成器410和样本判别器520两者，直到样本判别器520无法判断来自样本生成器410的样本是真样本还是假样本。以此方式，样本生成器410被更新，更新后的样本生成器410能够再现第1至t次训练任务中的样本的特征。也即，特征库190被扩展。

在这种实施例中，样本生成器410是基于记忆回放(Memory Replay)GAN来实现的，并且可以实现生成式特征回放。以此方式，可以在节省存储空间的情况下实现根因分析模型的持续学习，而不遗忘历史任务。

示例过程、装置和设备

图6示出了根据本申请的一些实施例的确定失效原因的过程600的流程图。过程600例如可以由图1中的根因分析引擎105来实施。为了方便描述，以下参考图1-5来描述过程600。

在框610，根因分析引擎105接收针对根因分析模型150的一组输入样本。一组输入样本例如可以是尚未用于训练根因分析模型150的样本。根因分析模型150被配置为基于分别与待分析元件101的多个部分的失效有关的多个量化表示130，来标识待分析元件101失效的根本原因。

在一些实施例中，一组输入样本中的至少一个输入样本所包括的根本原因是根据根因分析模型150确定并且经由测试验证的。在一些实施例中，待分析元件101包括待分析晶圆，并且多个部分包括待分析晶圆的多个裸片。

在框620，根因分析引擎105获取与根因分析模型150的历史训练有关的一组特征样本。一组输入样本和一组特征样本中的每个样本包括参考元件失效的根本原因、和分别与参考元件的多个参考部分的失效有关的多个参考量化表示。

在一些实施例中，根因分析引擎105根据样本生成器，生成一组特征样本。样本生成器410被配置为再现用于训练根因分析模型150的历史样本的特征。该组特征样本反映历史样本的特征。

在一些实施例中，根因分析引擎105基于一组输入样本，更新样本生成器410的网络参数。以此方式，经更新的样本生成器410能够再现一组输入样本的特征。

在框630，根因分析引擎105基于参考元件失效的根本原因和多个参考量化表示，训练根因分析模型150。换言之，根因分析模型150基于一组输入样本和一组特征样本被再次训练。

在一些实施例中，为了训练所述根因分析模型，根因分析引擎105通过将多个参考量化表示应用于根因分析模型150，确定由根因分析模型150标识的、参考元件失效的潜在原因；以及通过最小化参考元件失效的根本原因与潜在原因之间的差异，更新根因分析模型150的网络参数。

在一些实施例中，过程600还包括：根因分析引擎105接收关于待分析元件101的多个诊断报告120，每个诊断报告对应于待分析元件101的多个部分中的一个部分，并且指示该部分失效的潜在根本原因、物理缺陷和逻辑错误；根因分析引擎105从多个诊断报告120，生成分别与多个部分的失效有关的多个量化表示130；以及根因分析引擎105通过将多个量化表示130应用于根因分析模型150，标识待分析元件101失效的根本原因。

在一些实施例中，为了标识待分析元件101失效的根本原因，根因分析引擎105通过将多个量化表示130应用于根因分析模型150中的特征提取器310，从多个量化表示130生成多个局部失效特征301，每个局部失效特征与多个部分中的一个部分相对应；根因分析引擎105将多个局部失效特征301组合为针对待分析元件101的全局失效特征302；以及根因分析引擎105通过将全局失效特征302应用于根因分析模型150中的分类器320，确定不同的根本原因引起待分析元件失效的概率。

在一些实施例中，为了生成多个量化表示130，针对多个诊断报告120中的给定诊断报告，根因分析引擎105将给定诊断报告中指示的多个潜在根本原因的量化表示组合成与多个潜在根本原因相关联的第一物理缺陷的量化表示；根因分析引擎105将第一物理缺陷的量化表示和至少第二物理缺陷的量化表示组合成与第一物理缺陷和第二物理缺陷相关联的第一逻辑错误的量化表示；以及根因分析引擎105至少基于第一逻辑错误的量化表示，生成与一个部分的失效有关的量化表示。

在一些实施例中，过程600还包括：在将多个量化表示130应用于根因分析模型150之前，根因分析引擎105基于与多个诊断报告分别指示的潜在根本原因有关的面积，来调整多个量化表示130。

图7示出了根据本申请的一些实施例的用于确定失效原因的装置700的示意性框图。装置700可以用于实现图1中所示的根因分析引擎105。如图7所示，装置700包括推理模块 701，例如图1中所示的推理模块110。推理模块701被配置为基于分别与待分析元件的多个部分的失效有关的多个量化表示，根据根因分析模型，来标识所述待分析元件失效的根本原因。装置700还包括学习模块702，例如图1中所示的持续学习模块160。学习模块702包括输入样本接收单元710，其被配置为接收针对根因分析模型的一组输入样本。学习模块702还包括特征样本获取单元720，其被配置为获取与根因分析模型的历史训练有关的一组特征样本，一组输入样本和一组特征样本中的每个样本包括参考元件失效的根本原因、和分别与参考元件的多个参考部分的失效有关的多个参考量化表示。学习模块702进一步包括模型更新单元730，其被配置为基于参考元件失效的根本原因和多个参考量化表示，训练根因分析模型。

在一些实施例中，特征样本获取单元720进一步被配置为：根据样本生成器，生成一组特征样本。样本生成器被配置为再现用于训练根因分析模型的历史样本的特征，并且一组特征样本反映历史样本的特征。

在一些实施例中，学习模块702还包括：生成器更新单元，被配置为基于一组输入样本，更新样本生成器的网络参数。经更新的样本生成器能够再现一组输入样本的特征。

在一些实施例中，模型更新单元730进一步被配置为：通过将多个参考量化表示应用于根因分析模型，确定由根因分析模型标识的、参考元件失效的潜在原因；以及通过最小化参考元件失效的根本原因与潜在原因之间的差异，更新根因分析模型的网络参数。

在一些实施例中，推理模块701包括：诊断报告接收单元，其被配置为接收关于待分析元件的多个诊断报告，每个诊断报告对应于待分析元件的多个部分中的一个部分，并且指示一个部分失效的潜在根本原因、物理缺陷和逻辑错误；量化表示生成单元，其被配置为从多个诊断报告，生成分别与多个部分的失效有关的多个量化表示；以及根本原因标识单元，其被配置为通过将多个量化表示应用于根因分析模型，标识待分析元件失效的根本原因。

在一些实施例中，根本原因标识单元进一步被配置为：通过将多个量化表示应用于根因分析模型中的特征提取器，从多个量化表示生成多个局部失效特征，每个局部失效特征与多个部分中的一个部分相对应；将多个局部失效特征组合为针对待分析元件的全局失效特征；以及通过将全局失效特征应用于根因分析模型中的分类器，确定不同的根本原因引起待分析元件失效的概率。

在一些实施例中，量化表示生成单元进一步被配置为：针对多个诊断报告中的给定诊断报告，将给定诊断报告中指示的多个潜在根本原因的量化表示组合成与多个潜在根本原因相关联的第一物理缺陷的量化表示；将第一物理缺陷的量化表示和至少第二物理缺陷的量化表示组合成与第一物理缺陷和第二物理缺陷相关联的第一逻辑错误的量化表示；以及至少基于第一逻辑错误的量化表示，生成与一个部分的失效有关的量化表示。

在一些实施例中，推理模块701还包括：量化表示调整单元，其被配置为在将多个量化表示应用于根因分析模型之前，基于与多个诊断报告分别指示的潜在根本原因有关的面积，来调整多个量化表示。

在一些实施例中，一组输入样本中的至少一个输入样本所包括的根本原因是根据根因分析模型确定并且经由测试验证的。

在一些实施例中，待分析元件包括待分析晶圆，并且多个部分包括待分析晶圆的多个裸片。

图8示出了能够实施本申请的多个实施例的计算设备800的示意性框图。设备800可以用于实现根因分析引擎105或其至少一部分，例如推理模块110或持续学习模块160。如图所示，设备800包括计算单元801，其可以根据存储在随机存取存储器(RAM)和/或只读存储器(ROM)802的计算机程序指令或者从存储单元807加载到RAM和/或ROM 802中的计算机程序指令，来执行各种适当的动作和处理。在RAM和/或ROM 802中，还可存储设备800操作所需的各种程序和数据。计算单元801和RAM和/或ROM 802通过总线803彼此相连。输入/输出(I/O)接口804也连接至总线803。

设备800中的多个部件连接至I/O接口804，包括：输入单元805，例如键盘、鼠标等；输出单元806，例如各种类型的显示器、扬声器等；存储单元807，例如磁盘、光盘等；以及通信单元808，例如网卡、调制解调器、无线通信收发机等。通信单元808允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如过程600。例如，在一些实施例中，过程600可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元807。在一些实施例中，计算机程序的部分或者全部可以经由RAM和/或ROM和/或通信单元808而被载入和/或安装到设备800上。当计算机程序加载到RAM和/或ROM并由计算单元801执行时，可以执行上文描述的过程600的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行过程600。

用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本申请的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

此外，虽然采用特定次序描绘了各操作，但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行，或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本申请的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地，在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

一种确定失效原因的装置，其特征在于，包括：

推理模块，被配置为基于分别与待分析元件的多个部分的失效有关的多个量化表示，根据根因分析模型，来标识所述待分析元件失效的根本原因；以及

学习模块，与所述推理模块耦合，并且包括：

输入样本接收单元，被配置为接收针对所述根因分析模型的一组输入样本；

特征样本获取单元，被配置为获取与所述根因分析模型的历史训练有关的一组特征样本，所述一组输入样本和所述一组特征样本中的每个样本包括参考元件失效的根本原因、和分别与所述参考元件的多个参考部分的失效有关的多个参考量化表示；以及

模型更新单元，被配置为基于所述参考元件失效的根本原因和所述多个参考量化表示，训练所述根因分析模型。
根据权利要求1所述的装置，其特征在于，所述特征样本获取单元进一步被配置为：

根据样本生成器，生成所述一组特征样本，所述样本生成器被配置为再现用于训练所述根因分析模型的历史样本的特征，并且所述一组特征样本反映所述历史样本的特征。
根据权利要求2所述的装置，其特征在于，所述学习模块还包括：

生成器更新单元，被配置为基于所述一组输入样本，更新所述样本生成器的网络参数。
根据权利要求1至3任一所述的装置，其特征在于，所述模型更新单元进一步被配置为：

通过将所述多个参考量化表示应用于所述根因分析模型，确定由所述根因分析模型标识的、所述参考元件失效的潜在原因；以及

通过最小化所述参考元件失效的根本原因与所述潜在原因之间的差异，更新所述根因分析模型的网络参数。
根据权利要求1至4任一所述的装置，其特征在于，所述推理模块包括：

诊断报告接收单元，被配置为接收关于所述待分析元件的多个诊断报告，每个诊断报告对应于所述待分析元件的所述多个部分中的一个部分，并且指示所述一个部分失效的潜在根本原因、物理缺陷和逻辑错误；

量化表示生成单元，被配置为从所述多个诊断报告，生成分别与所述多个部分的失效有关的所述多个量化表示；以及

根本原因标识单元，被配置为通过将所述多个量化表示应用于所述根因分析模型，标识所述待分析元件失效的根本原因。
根据权利要求5所述的装置，其特征在于，所述根本原因标识单元进一步被配置为：

通过将所述多个量化表示应用于所述根因分析模型中的特征提取器，从所述多个量化表示生成多个局部失效特征，每个局部失效特征与所述多个部分中的一个部分相对应；

将所述多个局部失效特征组合为针对所述待分析元件的全局失效特征；以及

通过将所述全局失效特征应用于所述根因分析模型中的分类器，确定不同的根本原因引起所述待分析元件失效的概率。
根据权利要求5所述的装置，其特征在于，所述量化表示生成单元进一步被配置为：

针对所述多个诊断报告中的给定诊断报告，

将所述给定诊断报告中指示的多个潜在根本原因的量化表示组合成与所述多个潜在根本原因相关联的第一物理缺陷的量化表示；

将所述第一物理缺陷的量化表示和至少第二物理缺陷的量化表示组合成与所述第一物理缺陷和所述第二物理缺陷相关联的第一逻辑错误的量化表示；以及

至少基于所述第一逻辑错误的量化表示，生成与所述一个部分的失效有关的量化表示。
根据权利要求5所述的装置，其特征在于，所述推理模块还包括：

量化表示调整单元，被配置为在将所述多个量化表示应用于所述根因分析模型之前，基于与所述多个诊断报告分别指示的潜在根本原因有关的面积，来调整所述多个量化表示。
根据权利要求1至8任一所述的装置，其特征在于，所述一组输入样本中的至少一个输入样本所包括的根本原因是根据所述根因分析模型确定并且经由测试验证的。
根据权利要求1至9任一所述的装置，其特征在于，所述待分析元件包括待分析晶圆，并且所述多个部分包括所述待分析晶圆的多个裸片。
一种确定失效原因的方法，其特征在于，包括：

接收针对根因分析模型的一组输入样本，所述根因分析模型被配置为基于分别与待分析元件的多个部分的失效有关的多个量化表示，来标识所述待分析元件失效的根本原因；

获取与所述根因分析模型的历史训练有关的一组特征样本，所述一组输入样本和所述一组特征样本中的每个样本包括参考元件失效的根本原因、和分别与所述参考元件的多个参考部分的失效有关的多个参考量化表示；以及

基于所述参考元件失效的根本原因和所述多个参考量化表示，训练所述根因分析模型。
根据权利要求11所述的方法，其特征在于，获取所述一组特征样本包括：

根据样本生成器，生成所述一组特征样本，所述样本生成器被配置为再现用于训练所述根因分析模型的历史样本的特征，并且所述一组特征样本反映所述历史样本的特征。
根据权利要求12所述的方法，其特征在于，还包括：

基于所述一组输入样本，更新所述样本生成器的网络参数。
根据权利要求11至13任一项所述的方法，其特征在于，训练所述根因分析模型包括：

通过将所述多个参考量化表示应用于所述根因分析模型，确定由所述根因分析模型标识的、所述参考元件失效的潜在原因；以及

通过最小化所述参考元件失效的根本原因与所述潜在原因之间的差异，更新所述根因分析模型的网络参数。
根据权利要求11至14任一所述的方法，其特征在于，还包括：

接收关于所述待分析元件的多个诊断报告，每个诊断报告对应于所述待分析元件的所述多个部分中的一个部分，并且指示所述一个部分失效的潜在根本原因、物理缺陷和逻辑错误；

从所述多个诊断报告，生成分别与所述多个部分的失效有关的所述多个量化表示；以及

通过将所述多个量化表示应用于所述根因分析模型，标识所述待分析元件失效的根本原因。
根据权利要求15所述的方法，其特征在于，标识所述待分析元件失效的根本原因包括：

通过将所述多个量化表示应用于所述根因分析模型中的特征提取器，从所述多个量化表示生成多个局部失效特征，每个局部失效特征与所述多个部分中的一个部分相对应；

将所述多个局部失效特征组合为针对所述待分析元件的全局失效特征；以及

通过将所述全局失效特征应用于所述根因分析模型中的分类器，确定不同的根本原因引起所述待分析元件失效的概率。
根据权利要求15所述的方法，其特征在于，生成所述多个量化表示包括：

针对所述多个诊断报告中的给定诊断报告，

将所述给定诊断报告中指示的多个潜在根本原因的量化表示组合成与所述多个潜在根本原因相关联的第一物理缺陷的量化表示；

将所述第一物理缺陷的量化表示和至少第二物理缺陷的量化表示组合成与所述第一物理缺陷和所述第二物理缺陷相关联的第一逻辑错误的量化表示；以及

至少基于所述第一逻辑错误的量化表示，生成与所述一个部分的失效有关的量化表示。
根据权利要求15所述的方法，其特征在于，还包括：

在将所述多个量化表示应用于所述根因分析模型之前，基于与所述多个诊断报告分别指示的潜在根本原因有关的面积，来调整所述多个量化表示。
根据权利要求11至18任一所述的方法，其特征在于，所述一组输入样本中的至少一个输入样本所包括的根本原因是根据所述根因分析模型确定并且经由测试验证的。
根据权利要求11至19任一所述的方法，其特征在于，所述待分析元件包括待分析晶圆，并且所述多个部分包括所述待分析晶圆的多个裸片。
一种电子设备，其特征在于，包括：

至少一个处理器；

至少一个存储器，所述至少一个存储器被耦合到所述至少一个处理器并且存储用于由所述至少一个处理器执行的指令，所述指令当由所述至少一个处理器执行时，使所述电子设备执行根据权利要求11-20中任一项所述的方法。
一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述程序被处理器执行时实现根据权利要求11-20中任一项所述的方法。
一种计算机程序产品，其特征在于，包括计算机可执行指令，其中所述计算机可执行指令在被处理器执行时实现根据权利要求11-20中任一项所述的方法。