CN116583938A - 多步骤半导体制造工艺中的机器学习 - Google Patents

多步骤半导体制造工艺中的机器学习 Download PDF

Info

Publication number
CN116583938A
CN116583938A CN202180084154.1A CN202180084154A CN116583938A CN 116583938 A CN116583938 A CN 116583938A CN 202180084154 A CN202180084154 A CN 202180084154A CN 116583938 A CN116583938 A CN 116583938A
Authority
CN
China
Prior art keywords
substrate
spectral data
training
situ
etching process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180084154.1A
Other languages
English (en)
Inventor
张岩
冯烨
迪庞加·塔洛克德尔
杰弗里·D·邦德
吴翁风
卡西克·蒂姆玛瓦尤拉
乔治·鲁克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lam Research Corp
Original Assignee
Lam Research Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lam Research Corp filed Critical Lam Research Corp
Priority claimed from PCT/US2021/063222 external-priority patent/WO2022132704A1/en
Publication of CN116583938A publication Critical patent/CN116583938A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Drying Of Semiconductors (AREA)

Abstract

使用时间序列频谱以辨识如多步骤沉积及多步骤蚀刻工艺的多步骤半导体制造工艺的端点的方法及系统。一种方法包含存取虚拟地毯(例如,机器学习模型),该虚拟地毯从在训练操作期间收集的多步骤工艺的时间序列频谱形成。在生产期间,时间序列频谱原位地与虚拟地毯进行比较,作为多步骤制造工艺的部分端点指定。

Description

多步骤半导体制造工艺中的机器学习
通过引用并入
PCT申请表作为本申请的一部分与本说明书同时提交。在同时提交的PCT申请表中所标识的本申请要求享有其权益或优先权的每个申请均通过引用全文并入本文且用于所有目的。
背景技术
较小的科技节点及更复杂的设备设计自然而然地在晶片间导入电设备特性的变化。在不补偿的情况下,先进蚀刻及沉积工艺时常产生晶片与晶片间(W2W)的变化。举例而言,蚀刻和/或沉积特征的临界尺寸(CD)、蚀刻深度等可能在晶片与晶片间变化。尽管计量学可以识别不均匀性且因此允许工艺工程师调制在制造期间的处理操作,但识别问题及决定适当修正所花费的时间需要额外的时间和资源。
这里提供的背景描述是为了总体呈现本公开的背景的目的。当前指定的发明人的工作在其在此背景技术部分以及在提交申请时不能确定为现有技术的说明书的各方面中描述的范围内既不明确也不暗示地承认是针对本公开的现有技术。
发明内容
在一方面,提供了一种产生机器学习模型的方法,该机器学习模型被配置成预测在处理处理室中的衬底期间或之后在该衬底上的衬底参数值,其中该方法包含:接收训练数据,其包含,针对多个训练衬底中的每一者:(a)在训练衬底上执行的多步骤蚀刻工艺的多步骤期间,从该训练衬底原位收集的时变频谱数据,以及(b)表征该训练衬底的至少一种物理性质的参数值,其中该物理性质由该多步骤蚀刻工艺调整,且其中该多步骤蚀刻工艺包含至少两个不相连蚀刻或沉积步骤;从该时变频谱数据提取特征,以提供这些训练衬底中的每一者的该时变频谱数据的独立虚拟表示;以及针对该多个训练衬底中的每一者,通过使用该时变频谱数据的该虚拟表示、以及表征该训练衬底的至少一种物理性质的该参数值,而产生该机器学习模型,其中该机器学习模型被配置成使用从测试衬底原位收集的时变频谱数据作为输入,预测经受该多步骤蚀刻工艺的该测试衬底的该衬底参数值。
在另一方面,该方法还包含基于该机器学习模型以及从该测试衬底原位收集的该时变频谱数据,改变该多步骤蚀刻工艺的中间步骤的持续期间。在另一方面,该时变频谱数据包含从这些训练晶片原位收集的至少两种类型的频谱。在另一方面,该时变频谱数据包含从这些训练晶片原位收集的反射频谱。在另一方面,该时变频谱数据包含从这些训练晶片原位收集的放射频谱。在另一方面,从该时变频谱数据提取特征的步骤包含以多项式拟合该时变频谱数据。在另一方面,该多步骤蚀刻工艺是原子层蚀刻工艺。在另一方面,该多步骤蚀刻工艺是具有至少两个不相连蚀刻步骤的等离子体蚀刻工艺。在另一方面,表征该训练衬底的至少一种物理性质的该参数值是蚀刻深度。在另一方面,表征该训练衬底的至少一种物理性质的该参数值是临界尺寸。在另一方面,表征该训练衬底的至少一种物理性质的该参数值是侧壁角度。在另一方面,表征该训练衬底的至少一种物理性质的该参数值是覆盖度(overlay)。在另一方面,表征该训练衬底的至少一种物理性质的该参数值是在所述衬底上的凹入特征的临界尺寸。
在某些实施方案中,针对该多个训练衬底中的每一者,该训练数据步骤进一步包含处理室的至少一个前馈参数,并且产生该机器学习模型的操作使用该至少一个前馈参数。在一些实施方案中,该至少一个前馈参数是:在该处理室中的温度、在该处理室中的等离子体条件、在该处理室中的压力、在该处理室中的流率、一个以上工艺步骤的持续时间、或在该处理室中的部件的设计和/或配置。在一些实施方案中,该至少一个前馈参数来自:(a)该多步骤蚀刻工艺或该多步骤沉积工艺的当前步骤、(b)在该多步骤蚀刻工艺或该多步骤沉积工艺的该当前步骤之前的先前步骤、或者(c)在完成该多步骤蚀刻工艺或该多步骤沉积工艺的该当前步骤之后的后续条件。
在另一方面,一种产生机器训练模型的方法,该机器学习模型被配置成预测在提供对在处理室中的衬底的处理期间或之后该衬底上的多个衬底参数值,其中该方法包含:接收训练数据,针对多个训练衬底中的每一者,其包含:(a)在训练衬底上实施的多步骤蚀刻工艺的多步骤期间,从该训练衬底原位收集的时变频谱数据,以及(b)表征该训练衬底的多个物理性质的多个参数值,其中这些物理性质中的每一者是通过该多步骤蚀刻工艺来调整;从该时变频谱数据提取特征,以提供这些训练衬底中的每一者的该时变频谱数据的独立虚拟表示;以及针对该多个训练衬底中的每一者,通过使用该时变频谱数据的该虚拟表示、以及表征该训练衬底的该多个物理性质的该多个参数值,而产生该机器学习模型,其中该机器学习模型被配置成使用从测试衬底原位收集的该时变频谱数据作为输入,预测经受该多步骤蚀刻工艺的该测试衬底的该多个衬底参数值。
在另一方面,该多步骤蚀刻工艺包含至少两个不相连的蚀刻步骤。在另一方面,该多步骤蚀刻工艺包含至少两个相连蚀刻步骤。
在另一方面,一种对在所提供的衬底上执行的多步骤蚀刻工艺进行控制的方法,其包含:(a)接收时变频谱数据,该时变频谱数据是在处理室中执行的该蚀刻工艺的多步骤期间该衬底被蚀刻的同时原位收集;(b)从该衬底的该时变频谱数据提取特征,以提供该时变频谱数据的虚拟表示;(c)使用机器学习模型处理提取的该虚拟表示,该机器学习模型使用多个训练衬底的虚拟表示进行训练;以及(d)通过使用该机器学习模型的输出而在该处理室中控制和/或调整工艺条件。
在另一方面,该控制和/或调整该工艺条件包含在该多步骤蚀刻工艺的最终步骤期间控制和/或调整时间长度。在另一方面,该控制和/或调整该工艺条件包含在该多步骤蚀刻工艺的中间步骤期间控制或调整时间长度,该中间步骤在该多步骤蚀刻工艺的最终步骤之前。
在另一方面,控制和/或调整该工艺条件包含控制或调整温度(例如,晶片支撑件温度)、室压力、等离子体参数(例如,等离子体功率、频率、脉冲特性等等)、和/或工艺的持续时间或工艺的一个以上步骤的持续时间。
在一些实施方案中,该机器学习模型不仅处理来自时变频率信息的特征,且还处理关于其中该衬底目前被处理的该处理室的“前馈”信息、上游处理室、或下游处理室。前馈信息的示例包含:在处理室中的一个以上部件的温度、在处理室中的等离子体条件(例如,等离子体功率、频率、电压、电流、和/或脉冲特性)、在处理室中的压力、在处理室中的一个以上位置的流率、以及关于处理室的一个以上部件的设计和/或配置特性。
在另一方面,一种对在所提供的衬底上执行的多步骤沉积工艺进行控制的方法,其中该方法包含:(a)接收时变频谱数据,该时变频谱数据是在处理室中执行该沉积工艺的多步骤期间材料被沉积至该衬底上的同时原位收集;(b)从该衬底的该时变频谱数据提取特征,以提供该时变频谱数据的虚拟表示;(c)使用机器学习模型处理提取的该虚拟表示,该机器学习模型使用多个训练衬底的虚拟表示进行训练;以及(d)通过使用该机器学习模型的输出而在该处理室中控制和/或调整工艺条件。
在另一方面,该控制和/或调整该工艺条件包含在该多步骤沉积工艺的最终步骤期间控制或调整时间长度。在另一方面,该控制和/或调整该工艺条件包含在该多步骤沉积工艺的中间步骤期间控制或调整时间长度,该中间步骤在该多步骤沉积工艺的最终步骤之前。
在另一方面,一种装置,其包含:处理室,其被配置成保持衬底,以及在该衬底上执行多步骤蚀刻工艺或多步骤沉积工艺;至少一个计量模块,其被配置以在于该衬底上执行该多步骤蚀刻工艺或该多步骤沉积工艺的多步骤期间,在多个时间点从该衬底原位产生频谱数据;以及控制系统。在若干实例中,该控制系统被配置为:(a)接收频谱数据,该频谱数据是在该多步骤沉积工艺的多步骤期间材料被沉积至该衬底上的同时、或在该多步骤蚀刻工艺的多步骤期间材料从该衬底移除的同时,使用该至少一个计量模块进行原位收集;(b)从该衬底的该频谱数据提取特征,以提供该频谱数据的虚拟表示;(c)使用以多个训练衬底的虚拟表示训练的机器学习模型处理该虚拟表示;以及(d)通过使用该机器学习模型的输出而控制和/或调整在该处理室中与该多步骤蚀刻工艺或该多步骤沉积工艺相关的工艺条件。
在一些实施方案中,该控制系统被配置成控制或调整在该多步骤沉积工艺或该多步骤蚀刻工艺的最终步骤期间的时间长度。在一些实施方案中,该控制系统被配置成控制和/或调整在该多步骤沉积工艺或该多步骤蚀刻工艺的中间步骤期间的时间长度,该中间步骤是在该多步骤沉积工艺或该多步骤蚀刻工艺的最终步骤之前。
在一些实施方案中,该控制系统被进一步配置成接收至少一个前馈参数,以及使用该机器学习模型处理该至少一个前馈参数与该虚拟表示。在一些实施方案中,该至少一个前馈参数选自由以下项组成的群组:在该处理室中的温度、在该处理室中的等离子体条件、在该处理室中的压力、在该处理室中的流率、一个以上工艺步骤的持续时间、及在该处理室中的部件的设计和/或配置。在一些实施方案中,该至少一个前馈参数选自由来自以下项的参数所组成的群组:(a)该多步骤蚀刻工艺或该多步骤沉积工艺的当前步骤、(b)在该多步骤蚀刻工艺或该多步骤沉积工艺的该当前步骤之前的先前步骤、或(c)在完成该多步骤蚀刻工艺或该多步骤沉积工艺的该当前步骤之后的后续条件。
本公开的某些方面属于在经受多步骤蚀刻工艺或多步骤沉积工艺的衬底上执行计量的方法。这样的方法可通过以下操作来表征:(a)接收频谱数据,该频谱数据是在处理室之中执行的该沉积工艺的多步骤期间或在该蚀刻工艺的多步骤期间材料被沉积至该衬底或从该衬底被蚀刻的同时被原位收集;(b)从该衬底的该频谱数据提取特征,以提供该频谱数据的虚拟表示;(c)使用以多个训练衬底的计量数据训练的机器学习模型处理该虚拟表示;以及(d)使用该机器学习模型的输出提供该衬底的原位计量值。
本公开的某些方面属于包含以下项的装置:(i)处理室,其被配置成保持衬底并且在该衬底上实施多步骤蚀刻工艺或多步骤沉积工艺;(ii)至少一个传感器,其被配置成在于该衬底上执行该多步骤蚀刻工艺或该多步骤沉积工艺的多步骤期间,在多个时间点从该衬底原位产生频谱数据;以及(iii)计量模块。在一些实施方案中,该计量模块被配置为:(a)接收频谱数据,该频谱数据是在该多步骤沉积工艺的多步骤期间材料被沉积至该衬底上的同时或在该多步骤蚀刻工艺的多步骤期间从该衬底移除材料的同时,使用该至少一个计量模块进行原位收集;(b)从该衬底的该频谱数据提取特征,以提供该频谱数据的虚拟表示;(c)使用以多个训练衬底的计量数据训练的机器学习模型处理该虚拟表示;以及(d)使用该机器学习模型的输出提供该衬底的原位计量值。
除非另外说明,否则本文描述的所有工艺及装置可适用于减材工艺(如,蚀刻)与增材工艺(如,沉积)二者之一或两者。此外,本文描述的全部工艺及装置可适用于多步骤工艺中,例如原子层沉积及原子层蚀刻。
附图说明
图1示意地示出了根据某些公开的实施方案的制造工具的示例。
图2是根据某些实施方案的频谱反射仪系统的示意图。
图3示出了根据某些公开实施方案的地毯的示例。
图4示出了根据某些公开实施方案的蚀刻到理想深度的特征的示例性剖面图。
图5示出了根据某些公开实施方案的关于训练生成器的使用的更多细节,该训练生成器包含对训练晶片中的每一者生成地毯。
图6示出了根据某些公开的实施方案的当晶片在训练期间被蚀刻时产生其对应多项式的地毯的示例。
图7示出了虚拟地毯的示例,其对应多项式是从训练操作期间产生的全部多项式导出。
图8示出了根据一实施方案的对于在产生各种地毯的训练期间所实施的蚀刻操作的在虚拟地毯的虚拟帧数与测量深度之间的映像图的示例。
图9示出了根据一实施方案的从多个晶片生成训练数据以产生接着被拟合至虚拟地毯的多个地毯的示例性工艺。
图10示出了根据一实施方案的从多个晶片生成训练数据以产生接着被拟合至虚拟地毯的多个地毯的另一示例性工艺。
图11示出了根据一实施方案的在操作中执行晶片的实时处理的示例性工艺。
图12是根据某些公开实施方案的用于控制衬底处理系统的示例性控制模块的示意图。
图13是产生并且使用原位计量值的系统的示意图。
具体实施方式
在以下的描述中,阐明了若干特定细节以提供对所呈现的实施方案的完整理解。所公开的实施方案可在不具备这些特定细节中的一些或全部的情况下实施。在其他示例中,公知的工艺操作未详细描述,以免不必要地模糊所公开实施方案。尽管所公开实施方案将与特定实施方案结合加以描述,但应理解该特定实施方案不旨在限制所公开的实施方案。
术语
本说明书通篇使用以下术语:
术语“半导体晶片”、“晶片”、“衬底”、“晶片衬底”以及“部分制造集成电路”可以可互换地使用。在本领域中普通技术人员理解术语“部分制造集成电路”可指在半导体晶片上的集成电路制造的许多阶段中的任何一者期间的半导体晶片。使用于半导体设备工业中的晶片或衬底通常具有200mm、或300mm、或450mm的直径。该具体公开显示了在晶片上实现的实施方案。然而,本公开并不限于此。工件可能有各种不同的形状、尺寸及材料。除了半导体晶片之外,可以利用所公开的实施方案中的其他工件包含各种物品,例如印刷电路板、磁性记录介质、磁性记录传感器、镜子、光学元件、微机械设备以及类似物。
如在本文中使用的,“半导体设备制造操作”或“制造操作”是在半导体设备的制造期间实施的操作。通常而言,整体制造工艺包含多个半导体设备制造操作,每一者实施于其自身半导体制造工具中,如等离子体反应器、电镀单元、化学机械平面化工具、湿式蚀刻工具以及类似物。半导体设备制造操作的类别包含减材工艺(如蚀刻工艺及平坦化工艺)以及增材工艺(如沉积工艺(例如,物理气相沉积、化学气相沉积、原子层沉积、电化学沉积、无电镀沉积))。在蚀刻工艺的背景中,衬底蚀刻工艺包含蚀刻掩模层的工艺,或更普遍而言蚀刻先前沉积和/或以其他方式残留在衬底表面上的任何材料层。如此的蚀刻工艺可能蚀刻在该衬底中的堆叠层。
“制造设备”或“制造工具”指其中进行制造工艺的设备。制造设备可包含在处理期间工件驻留于其中的处理室。通常而言,当在使用时,制造设备实施一个以上半导体设备制造操作。用于半导体设备制造的制造设备的示例包含减材工艺反应器以及增材工艺反应器。减材工艺反应器的示例包含干式蚀刻反应器(例如,化学和/或物理蚀刻反应器)、湿式蚀刻反应器、以及灰化器。增材工艺反应器的示例包含化学气相沉积反应器、以及原子层沉积反应器、物理气相沉积反应器、以及电镀单元。
在多种实施方案中,工艺反应器或其他制造设备包含用于在处理期间保持衬底的工具。这样的工具通常是基座或卡盘,并且这些术语在本文中有时用作对于包含在制造设备中的所有类型的衬底保持或支撑工具的简称。
“计量数据”在本文用于指至少部分通过测量经处理或部分经处理的衬底(如包含部分制造集成电路的半导体晶片)的特征而产生的数据。该测量可能实施于在处理室中执行半导体制造操作之前、期间、或之后。在某些实施方案中,计量数据是由在经蚀刻衬底上实施光学计量(例如,散射测量、椭圆偏振测量、干涉测量、和/或反射测量)的计量系统所产生。在某些实施方案中,该计量数据是通过在经处理或部分经处理的衬底上执行以下项来产生:反射测量、圆顶散射测量、角分解散射测量、和/或椭圆偏振测量。
光学信号类型的示例包含与衬底表面交互作用的光的光强度值。这样的光可能被衬底表面反射(例如,通过镜面反射)、散射、衍射、折射等。该光强度值可被提供作为与该衬底和/或入射光相对的位置、光波长(例如用于频谱数据)、光极化态以及类似物的函数。光学计量信号包含关于衬底特征组成和/或几何的信息。几何信息的示例包含特征的位置、形状、和/或尺寸。这样的信息通常是通过复杂的计算(例如,广泛使用的光学临界尺寸(OCD)技术)而从测得光学计量信号获得。在本文的一些实施方案中,计量系统并未使用用于判定该衬底特征的组成和/或几何信息的整合计算处理能力。相反,这样的计量系统可能仅产生未处理或仅最小处理的光学信号。举例而言,若干如此的实施方案将光学信号直接馈送至一个以上机器学习模型,这些机器学习模型分析该信号以决定后续制造操作的处理参数。
光学计量信号类型的额外示例包含等离子体密度以及气体浓度(例如,工艺气体、副产物、及可能出现于处理室中的其他气体)的原位计量值。在一种情况中,等离子体功率可以通过一个以上电压、电流传感器(例如VI探针)加以监测。在另一种情况下,等离子体密度、工艺气体浓度、以及副产物和其他气体浓度可以通过一个或多个光放射频谱仪(OES)传感器来测量。OES传感器可测量来自出现于处理室中的等离子体和/或气体的放射频谱。如有需要,合适的传感器可用于测量出现于处理室中的等离子体和/或气体的吸收频谱。
如在本文其他处更详细解释的,若干计量系统可采用相对大的光束点,其可在相对大的晶片表面面积捕捉信息。作为示例,该光束点尺寸可以具有约5mm以上的直径,或者约10mm以上的直径。其他计量系统采用小光束点,例如点尺寸为约2mm以下或约500μm以下。
在一些实施方案中,计量数据包括与计量系统或用于获得计量数据的条件有关的“元数据”。元数据可以被视为描述和/或表征数据的一组标签。元数据属性的非排他性列表包括:
工艺工具设计和操作信息,如预处理平台或工具设计信息、工艺配方信息等;
探测器捕捉细节,例如对比度、放大率、模糊、噪声、亮度等。
尚未在处理室或所考虑的其他制造设备中处理的晶片或其他工件可称为“预处理”晶片。先在处理室或所考虑的其他制造设备中处理的晶片或其他工件可称为“后处理”晶片。预处理晶片通过在制造设备中进行处理而变成后处理晶片。在一些实施方案中,在预处理的晶片上获得的计量信息(包括空间分布的计量信息)被用于确定所考虑的制造设备上的工艺控制设置,该设置将产生在得到的后处理晶片(先前为预处理晶片)的表面上的结构参数值(例如,特征CD、节距和深度)的目标空间分布。在一些实施方案中,预处理信息包括关于较早工艺(或当前工艺中的较早阶段)或较晚工艺的信息(如果该信息在当前阶段可取得),例如工艺温度、压力、等离子体条件等。基于预处理晶片选择工艺设置的步骤可以被认为是制造设备的前馈控制。可基于来自预处理晶片的信息调整的制造设备的工艺设置包括温度(例如,晶片支撑件温度)、室压力、等离子体参数(例如,等离子体功率、频率、脉冲特性等)、以及工艺或工艺的一个以上步骤的持续时间。工艺设置可以手动或自动地设置(例如,作为正常工艺控制的一部分)。
晶片结构参数指用于控制特定工艺或处理室的感兴趣的参数。它们是可以使用计量学评估的参数。在晶片结构参数值中的感兴趣的空间变化可用于调整、调谐或优化工艺以实现在后处理晶片中的晶片结构参数值的目标分布。在一些实施方案中,晶片结构参数是可以指示预处理和/或后处理的晶片在其表面上是否表现出空间均匀性的参数,包括晶片间的均匀性(包括晶片间的平均偏移)和/或晶片内的均匀性。晶片结构参数的示例包括几何特征参数,例如特征深度、宽度、侧壁角度和重叠率,以及表征重复结构的参数,例如临界尺寸和节距。晶片结构参数的示例包括物理性质参数,例如晶片上的一层或多层的厚度和色散性质,例如晶片上的一层或多层的折射率和消光系数。
“机器学习模型”是经过训练的计算模型,在本文的一些实施方案中,在设备制造工具中处理之前在衬底上接收作为反映特征特性(特别是特征几何形状、衬底材料性质等)的输入光学计量数据,该设备制造工具将使用通过机器学习模型计算的信息进行控制。机器学习模型的示例包括神经网络(包括递归类神经网络和卷积类神经网络)、自动编码器(包括变分自动编码器)、随机森林模型、受限玻尔兹曼机、递归张量网络、以及梯度提升树。机器学习模型使用训练集进行训练,该训练集反映了模型应该能够准确预测设备制造工具的适当设置的条件范围。在本文的一些实施方案中,机器学习模型使用以下项进行训练:(i)来自要使用特定设备制造工具处理的衬底的特征的原始或去噪声光学计量信号,(ii)用于处理在设备制造工具中的衬底的一个以上处理参数值,以及(iii)在该衬底于设备制造工具中使用一个以上处理参数值进行处理之后的特征的特性。
通常,尽管不是必须的,但是神经网络或自动编码器包括一层或多层。每个如此的层包括多个处理节点,并且这些层被顺序处理,其中较靠近模型输入层的层节点在较靠近模型输出的层节点之前处理。在多种实施方案中,一层馈送到下一层,等等。输出层可以包括一个以上节点,该节点被配置为输出以下信息:(a)表示后处理晶片上的晶片结构性质和/或(b)处理室设置,例如在基座上的温度分布,这些处理室设置预计在晶片处理期间实现目标晶片结构参数值。在一些实施方案中,机器学习模型是获取计量数据并且输出以下项的模型:在处理之后的晶片结构参数值分布;用于在晶片处理期间应用于基座、卡盘或其他晶片夹持工具的温度分布;或在晶片处理期间的其他处理室参数值。
在一些实施方案中,模型具有多于两层(或多于三层或多于四层或多于五层)的处理节点,这些节点从前面的层接收值(或作为直接输入)并将值输出到后续层(或最终输出)。内部节点通常是“隐藏的”,因为它们的输入和输出值在模型之外不可见。在各种实施方案中,隐藏节点的操作不需要在操作期间被监测或记录。机器学习模型的节点和连接可以在不重新设计它们的数量、排列、与图像输入的接口等的情况下进行训练和再训练,并且还为质量测量提供校正。
通常,在本文中以信号处理领域中通常理解的方式使用“噪声”。在本公开的背景中,噪声可以包括被机器学习模型去除的计量信号的一部分。模式混合是可以通过使用机器学习模型减少或消除的噪声类型的一个示例。仪表误差是可以通过机器学习模型减少或消除的另一个噪声源。
蚀刻深度是指蚀刻特征的底部与诸如场区之类的衬底顶表面平面之间的距离。具有一定深度的蚀刻特征的示例包括沟槽和孔洞,例如圆筒体。在一些实施方式中,蚀刻深度实时地与被监测的蚀刻工艺的终点深度比较。作为示例,在蚀刻工艺结束时,被蚀刻的特征具有大约10nm和1μm之间的深度。作为具体示例,在蚀刻工艺结束时,被蚀刻的特征可以具有大约10μm的深度。在一些实施方案中,被蚀刻的特征包括竖直堆叠的特征,其也可以称为3D结构。3D NAND闪存是可以包括竖直堆叠和蚀刻特征的设备的一个示例。
临界尺寸是指在相邻蚀刻特征的侧壁之间的未蚀刻部分的宽度。通常,临界尺寸是衬底顶面平面下方深度的函数。作为示例,在蚀刻工艺结束时,被蚀刻的特征可以具有大约10nm到100μm之间的临界尺寸。
线宽是指在两个以上蚀刻区域之间的凸起特征的宽度。通常,线宽由相应的掩模特征宽度定义,且与临界尺寸不同,它不随深度变化。
节距是指在相邻平行线的中心点之间的距离。
空间临界尺寸是指在节距和线宽之间的差异。它可以看作是蚀刻开口的宽度。
深宽比是指蚀刻深度与空间临界尺寸的比率。它可以被视为蚀刻特征的薄度的测量。例如,具有2μm深度和50nm空间临界尺寸的圆柱体的深宽比为40:1,通常更简单地表示为40。浅特征具有相对较小的深宽比,而深特征具有相对较大的深宽比。通过与所公开的实施方案相关的蚀刻工艺形成的特征可以是高深宽比特征。在一些应用中,高深宽比特征是具有以下深宽比的一者的特征:至少约5、至少约10、至少约20、至少约30、至少约40、至少约50、至少约60、至少约80、或至少约100。通过所公开的方法形成的特征的空间临界尺寸可以是约200nm或更小,例如约100nm或更小、约50nm或更小、或约20nm或更少。
介绍和背景
尽管通常希望晶片处理操作在晶片之间以均匀的效果一致地应用,但是如此的均匀性当然是不现实的。先进科技节点需要减少晶片间(W2W)变化以及其他形式的不均匀性,例如晶片内不均匀性(WiWNU)。导致传入变化的上游变化是整个晶片和晶片运行之间的不均匀性和产量损失的主要因素。在某些情况下,不均匀性可能被预期为由后续(下游)处理操作引起。因此,工艺工程师的任务是设计有效的策略来解决处理不均匀性——首先,通过防止或使其最小化,或者在发生后进行补偿,在某些情况下,在处理工作流程的多个阶段。此外,并且可能独立于W2W变化和WiWNU,先进工艺需要将晶片特征控制到纳米级尺寸。这又取决于纳米尺度的计量。
一种减少变化和/或满足具有严格容差的规格的方法是获得晶片的光学计量数据,从光学计量数据中导出几何特征或层成分,并使用导出的特征和成分来确定处理参数。然而,导出的特征和成分可能是不准确的近似值。此外,即使有着高准确计量,数据的收集和分析也会降低产量。在典型的工艺流程中,处理一个以上晶片,然后使用光束或电子束进行测量。可以计算处理得到的信号以产生纳米级计量结果。然后使用该信息来确定该批次或后续批次中接续晶片的最佳蚀刻条件。异地计量数据的收集和分析非常耗时;它需要晶片运输和异地计量本身。整体工艺产量受到影响。
此外,在一些实施方案中,需要将导出的特征信息转换为有效减少变化的工艺调整。这可能需要训练有素的工艺工程师的经验、技术专长和/或直觉。即使有这样的工程师,他们也可能需要时间来设计适当的工艺调整。在某些情况下,即使是最好的工程师在提出工艺调整时也会犯错误。
另一种减少变化或满足上述严格规格的方法是利用通过光学计量和前馈(FF)模型获得的传入晶片信息来直接预测处理参数行为并提供每个晶片的建议。这种模型采用来自预处理衬底或当前处理的衬底(原位信息)的光学计量信号(例如,空间分布的计量信息)作为输入。这样的模型可以另外采用一条以上其他信息作为输入。这样的其他信息的示例包括取自当前、先前、上游或下游工艺的信息,例如温度(例如,晶片支撑件温度)、室压力、气体流率、等离子体参数(例如,等离子体功率、频率、脉冲特性等)、工艺的持续时间或工艺的一个以上步骤、以及处理室的一个以上部件的设计或配置参数。通过机器学习预测,模型可以推荐特定晶片的处理参数,然后由处理室应用以减少不均匀性,例如WiWNU,或以其他方式在后处理晶片中实现目标指标。在一些实施方案中,机器学习模型直接或间接提供工艺参数值,例如基座上位置的温度值、等离子体条件、室压力、气体流率、和/或一个以上工艺步骤(或整个工艺)的持续时间,其促进处理以实现特征特性的某些目标水平,例如临界尺寸、蚀刻深度、节距等。设置此目标水平的步骤(对晶片上所有特征都有效)本质上促进了均匀性。
带有可选原位计量部件的制造工具
图1示意性地示出了制造工具100(例如,等离子体处理系统)的示例。制造工具100包括其中具有等离子体处理约束室104的等离子体反应器102。由匹配网络108调谐的等离子体电源106向位于功率窗112附近的变压器耦合等离子体(TCP)线圈110供电,以通过提供电感耦合功率而在等离子体处理约束室104中产生等离子体114。TCP线圈(上功率源)110可以被配置为在等离子体处理约束室104内产生均匀的扩散分布。例如,TCP线圈110可以被配置为在等离子体114中产生环形功率分布。功率窗112被提供以将TCP线圈110与等离子体处理约束室104分开,同时允许能量从TCP线圈110传递到等离子体处理约束室104。由匹配网络118调谐的晶片偏置电压电源116向衬底支撑件120形式的电极提供功率,以设置由衬底支撑件120支撑的衬底132上的偏置电压。控制器124为等离子体电源106、气体源/气体源130、和晶片偏置电压电源116设置位点。
等离子体电源106和晶片偏置电压电源116可以被配置为在特定射频下操作,例如13.56MHz、27MHz、2MHz、60MHz、100kHz、2.54GHz或它们的组合。等离子体电源106和晶片偏置电压电源116可以适当地调整尺寸以提供一定范围的功率,从而实现期望的工艺性能。此外,TCP线圈110和/或衬底支撑件120可以由两个以上子线圈或子电极形成,其可以由单个电源供电或由多个电源供电。
气体源130经由喷头142中的进气口182而与等离子体处理约束室104呈流体连接。进气口182可以位于等离子体处理约束室104中的任何有利位置并且可以采取用于注入气体的任何形式。然而,优选地,进气口可以被配置为产生“可调”气体注入分布,这允许对朝向等离子体处理约束室104中的多个区域的个别气体流的独立调整。工艺气体和副产物通过压力控制阀143和泵144而从等离子体处理约束室104被移除,压力控制阀143和泵144也用于在等离子体处理约束室104内保持特定压力。气体源/气体供给机构130由控制器124控制。准直器外壳184连接到至少一个进气口182。
在一个实施方案中,控制器124被配置为执行处理操作,该处理操作利用由频谱反射仪200收集的频谱数据和/或反映由传感器(例如原位监测传感器136)收集的工艺条件或关于晶片132的信息的其他数据,以便处理地毯(carpet)信息。如上所述,地毯被定义为帧的集合,其以时间序列表示捕获的频谱数据、和/或诸如由传感器136收集的其他数据的实例。设备200收集的频谱数据可以按预定间隔收集,例如每一预定数量的毫秒、秒或一些自定义时间设置。
制造工具100包括一个以上原位计量设备。计量设备可以包括例如频谱反射仪设备200和传感器136。传感器136可以包括例如一个以上电压和/或电流传感器(例如VI探针)、一个以上光发射频谱传感器(OES)、用于测量在室104中存在的等离子体和/或气体的吸收频谱的一个以上传感器、用于测量等离子体密度的一个以上传感器、用于测量在室104中的工艺气体、副产品和/或其他气体的浓度的一个以上传感器,以及用于监测工艺条件和/或晶片性质的各种标记的其他合适的传感器。
作为示例,频谱反射仪设备200可以包括安装在室104内的部件和安装在室104外部的部件。在一些实施方案中,频谱反射仪设备200包括室104内部的光学头、一个以上光源和室104外部的光检测器、和光缆140或将光学头光学连接到光源和检测器的其他部件。在一方面,频谱反射仪设备200具有连接到至少一个进气口182的准直器外壳184。另外,准直器外壳可以通过光缆140光学耦合到光源和/或频谱反射仪设备200的检测器。在此方面中,光缆140可以包括传输光纤和接收光纤。在其他方面中,光缆140可以包括至少一根光纤,该光纤传输来自频谱反射仪设备200中的光源的光并且还传输从衬底132反射的光。在一个具体示例中,频谱反射仪设备200被配置为产生投射到晶片132表面上的宽带光,而设备200中的检测器收集与来自衬底表面的反射光相关联的频谱数据。
原位反射仪
图2是频谱反射仪系统200的示意图。频谱反射仪设备200包括光源208和光学检测器212。光学检测器212可以包括一个以上光检测器214。光纤光缆140连接到频谱反射仪设备。在此示例中,光缆140包括传输光纤220和接收光纤224。在该示例中,每个接收光纤224连接到单独的光检测器214。在其他实施方案中,多个接收光纤224可以连接到相同的光检测器214。在此示例中,光学检测器212是二维电荷耦合设备(2-D CCD)阵列,其中来自每个接收光纤224的输出由2-D CCD的不同区域检测。对于频谱反射仪系统,光学检测器212提供呈波长函数的强度输出。这可以通过使用能够从反射光中分离出一个以上波长的棱镜或滤光片来实现。光可通过光纤264从光源208引导至光学检测器212,以允许监测光源208随时间的变化以校正信号并提高信噪比(SNR)。
作为示例,光源208可以包括氙弧灯。这样的氙弧灯可以提供脉冲非均匀光束。氙弧灯208可以耦合到传输光纤以向准直器外壳184提供光。光检测器214被耦合到接收光纤以接收反射的,其接收从衬底132反射的光。
多步骤制造工艺中的工艺控制
提供了用于多步骤制造工艺中的工艺控制、终点预测、或其他参数预测的系统和技术。作为第一个示例,多步骤制造工艺可以包括原子层沉积工艺(ALD)、原子层蚀刻工艺(ALE)、以及涉及在步骤(诸如自限制步骤)之间交替的其他类似工艺。作为第二示例,多步骤制造工艺可以包括沉积和蚀刻工艺,包括可能不是自限的等离子体基础的蚀刻工艺,其中给定的工艺步骤被分成多个离散步骤。作为特定示例,可以在多个离散步骤中进行蚀刻或沉积特定特征,在这些步骤之间具有暂停,并且在这些离散步骤之间具有其他相关和不相关制造工艺的可选执行。涉及多个非连续步骤的工艺可能在步骤之间有暂停,而涉及多个连续步骤的工艺可能在步骤之间没有暂停。Bailey,III等人的美国专利No.10,032,681和Feng等人的美国专利No.10,262,910描述了半导体制造工艺中的终点预测的示例,其每一者都通过引用整体并入本文并用于所有目的。
在一些实施方案中,可以利用在多步骤处理操作的处理期间提取的频谱信息的时间序列来控制终点操作(例如,调整给定多步骤处理操作的一个以上中间和/或最终步骤的时间)。该方法和系统利用训练工艺来生成数据表示或模型,在本文中有时称为“地毯(carpet)”。地毯指的是从频谱信息的多个采样帧所建构的表示,使得不仅对当前帧的时间信息而且对一个以上先前帧的时间信息进行采样。结果,地毯定义了一系列时间(t)样本的表示,并且每个时间样本有其相关的频谱信息(λ,即波长)。因此,地毯不仅提供在一个特定时间点的频谱信息,而且还提供频谱信息在频谱信息的一个以上先前样本上的变化历史。在一些示例中,地毯可以是三维表面轮廓。
在一个实施方案中,在训练期间生成地毯以产生虚拟地毯。在一个实施方案中,虚拟地毯是通过多项式回归或时间和频谱维度上的其他拟合而从地毯轮廓产生的宽带原位反射频谱响应的表示。所得拟合可以产生表征地毯或虚拟地毯的一个以上多项式参数(例如,系数)。使用这样的频谱生成的示例虚拟地毯本质上是多个时间片/帧的表示,其中为每一帧捕获呈波长函数的强度。因此,对于每个时间样本,捕获一帧,这也使得在产生虚拟地毯时能够使用捕获的一个以上先前帧。实时处理期间的地毯处理具有以下的额外好处:将晶片级变化引起的频谱变化解耦从多步骤制造工艺(包括例如蚀刻和/或沉积)引起的频谱的时间演变。
在一个实施方案中,可以实施机器学习以使用频谱的时间序列来提取晶片的关键条件。在一个实施方案中,使用训练阶段,其中使用目标工艺配方在多步骤制造工艺中处理数个晶片。训练阶段可以使用一个以上处理室来实施,这些处理室实施目标工艺配方。晶片级变化可能以多种方式引入,例如由于晶片处理的先前步骤中的变化、室或其中的工艺条件的变化、晶片性质的变化、晶片批次的变化、可能的晶片倾斜或旋转的变化、以及其他晶片级变化。结果是,即使在同一台机器上使用相同的目标配方,制造工艺也会有所不同。然而,根据一个实施方案,在每个晶片的处理期间,频谱数据在多个晶片的多步骤制造工艺的一段时间内被采样。因此,采样产生了频谱信息的多个采样帧,定义为与λ为函数关系的强度。
因此,帧的时间序列定义了表示强度的三维(3D)表面的数据。在该实施方案中,地毯因此提供频谱强度变化的历史信息,而不仅仅是单个强度频谱图。对于用于训练的每个晶片或相关联的地毯,对感兴趣的晶片参数进行测量,包括例如蚀刻深度、CD等。测量可以使用任何数量的计量工具进行。一种示例方式是使用频谱仪来测量晶片的频谱反射率。另一种示例方式是使用光学CD(OCD)计量,其可以包括反射和/或椭圆频谱。OCD计量和频谱反射计量可用于确定各种指标,包括蚀刻深度、沉积厚度、特征特性、蚀刻前CD、沉积后CD、特征或蚀刻或沉积轮廓等。
在涉及多步骤蚀刻工艺的一个实施方案中,测量的蚀刻深度与地毯的最后一帧相关,其包括在蚀刻深度被测量的状态下的频谱强度。在涉及多步骤沉积工艺的一个实施方案中,测量的沉积量可以与地毯的最后一帧相关联,其包括在测量沉积量的状态下的频谱强度。因为地毯还包含有关先前帧的信息,所以了解导致最后帧的频谱条件是何者是有用的。在一个实施方案中,每个地毯具有通过以下者所提取的相关数据,例如用m*n阶或多项式拟合实验频谱,其具有唯一系数(C0、……、Cmn),其中m表示时间维度的阶并且n表示波长维度的阶。更一般地,拟合算法可以是用于最小化质量因子的回归方法,质量因子被定义为多项式估计和实验频谱的差。
在一个实施方案中,引入了一种操作来减少多项式系数的维数。这样的降维可以通过逐步回归、多地毯耦合回归或主成分分析来实现。降维的目的是使用相对较少的维度来解释地毯之间的变化,并且按照这些超维度中的浮动参数和表示蚀刻、沉积或其他处理时间影响的虚拟帧数而成功地与蚀刻深度测量、沉积量测量、或其他类似测量相关联。
在一个实施方案中,通过执行多地毯耦合回归来执行回归。负责的逻辑被配置为获取测量的蚀刻深度(或其他晶片结构参数值),将测量的结构参数值与训练期间生成的地毯的多项式相关联,然后通过例如使用包括所有地毯的组合均方误差(MSE)将它们拟合成具有定义虚拟地毯的降维参数(C0、……Cp)的多项式。
在一个实施方案中,一些多项式系数在整个地毯上加以耦合,由线性关系定义,以表示地毯之间的恒定性,而其余的保持浮动。关于耦合哪些参数和浮动哪些参数的选择取决于对地毯和实验频谱之间的均方误差的影响。
在另一个实施方案中,降维是通过逐步参数缩减来实现的。
评估减小的参数空间与蚀刻深度或其他晶片结构参数测量的相关性(按照R平方和经调整的R平方),而调整参数空间以使用最少的参数找到良好相关性。并非所有参数都需要与蚀刻深度测量相关联。这是训练模型以从虚拟地毯预测蚀刻深度或其他晶片参数的示例。
在又一个示例实施方案中,使用主成分分析(PCA)来找到主成分的分数、虚拟帧数、和测量的蚀刻深度的相关性。可以增加主成分的数量以达到更好的相关性。一旦达到令人满意的相关性以从上方减少的超维度和虚拟帧数来解释测量的蚀刻深度,训练就完成了。
在训练地毯的多项式参数的差很小并且虚拟地毯帧数本身足以说明蚀刻深度、沉积量(其可能是沉积材料的深度)、或其他有着理想准确度的计量测量的测量值的情况下,虚拟地毯的多项式参数可以通过多项式拟合系数的平均值来获得。
在另一个实施方案中,参考晶片的频谱响应可用于与其他晶片进行比较。此外,还有其他几种方法可以将多项式系数和虚拟帧数连接至蚀刻深度、沉积量、或其他晶片结构参数。这样的连接是一种训练形式。一种这样的方法是偏最小平方法,并且在另一个实施方案中,使用神经网络处理来建立参数与测量的蚀刻深度的关系。
一旦训练工艺完成,虚拟地毯可以在生产晶片的实时处理期间使用,以确定多步骤制造工艺中的终点(例如,调整多制造工艺的中间步骤和/或最终步骤的时间)。在一个实施方案中,虚拟地毯信息与实时频谱结合使用,以预测有效蚀刻深度、沉积量、或呈频谱历史函数的其他计量测量值。将参考附图描述关于使用虚拟地毯的更多信息。
在多种实施方案中,虚拟地毯是机器学习模型的一种形式,其将晶片特征和/或晶片处理条件与从晶片处理环境原位收集的时变频谱数据相关联。机器学习模型可以被配置为接收从时变频谱数据提取的特征作为输入。
如图所示,虚拟地毯(机器学习模型)可以链接至临界尺寸(CD)测量、线宽、节距、间距、弯曲检测指标、侧壁角度、和其他可测量指标,而不是测量蚀刻深度或沉积量。也就是说,对于在训练期间处理的每个晶片,所得地毯可以与一个以上测量的指标相关联,这些指标可以包括但不限于蚀刻深度。通常,所得地毯可以与具有频谱灵敏度的任何指标相关联(例如,该指标的变化将影响频谱测量的任何指标)。作为示例,Lam Research Corporation的美国专利No.9,123,582中描述了晶片弯曲,通过引用将其并入本文。
在一个实施方案中,在实时处理期间(即,运行时),虚拟地毯(机器学习模型)可用于预测一种以上预期的晶片性质(例如,蚀刻深度、沉积量等)。因此,该工艺能够准确预测晶片级的多步骤工艺速率,以及停止多步骤工艺的时间。通过将光束聚焦在晶片上的一个点上并测量多个波长的反射光强度,宽带原位反射术或干涉仪在蚀刻、沉积或其他多步骤工艺期间测量晶片表面的反射率。宽带原位反射术的一个示例是闪光灯/连续波反射仪(例如,其有时称为Lam频谱反射仪(LSR))。有关原位干涉仪系统的更多相关信息,可参考LamResearch Corporation的美国专利No.6,400,458和No.6,160,621,通过引用将其并入本文。
在另一种实施方案中,动态时间规整(dynamic time warping,DTW)算法可用于计算频谱与参考频谱的匹配,然后可直接用于计算蚀刻速率和理想蚀刻停止、沉积速率和理想沉积停止,或在其他多步骤制造工艺中的相似者。
使用频谱的时间序列有几个优点。一个优点是它确保了频谱因果关系的模型依赖性。这起到了约束建模参数的作用,并且还提供了额外的准确性。例如,两个不同时间序列的相同频谱可以分辨晶片的不同条件,因为偏差可能来自传入的变化。另一个优点是频谱和时间协方差在虚拟地毯(机器学习模型)中明确地模型化以保留信息内容。因此,不会丢失实验信息。更进一步,可确保处理大量实验频谱的可扩展性优势,因为每个地毯都是单独拟合的。
主动控制的算法的训练比许多需要大量物理模型化的其他物理基础模型更快。此外,对于这样的来自混合阵列的复杂反射率而言,运行时间执行速度也比物理基础模型更快。
应当理解,本文所述的方法不限于光强度频谱。这些方法可以应用于在适当比例的时间中的任何信号组,其中在每个时间帧内,相关信号可以用“x”表示,具有特定的相关性特征,即沿x的主成分作为时间上的“频谱”,并且可以采用相同的降维和训练策略。例如,可以以类似的方式分析来自与静电卡盘(ESC)相关的多个传感器的时间轨迹,以预测CD(临界尺寸)或CD均匀性,类似于来自晶片的波长时间轨迹,以预测局部深度、沉积量、或与多步骤制造工艺相关的其他性质。这些非频谱信号的协方差可以通过例如主成分分析来处理,以提取给定时间帧的必要信息,从而实现更高准确度的终点控制。
显然,可以在没有这些具体细节中的一些或全部的情况下实践本实施方案。例如,应用不限于那些与蚀刻率、沉积率等相关的应用。为了避免不必要地混淆本实施方案,未详细描述公知的工艺操作。
此外,用于预测蚀刻深度或其他晶片参数的模型可以采用一个以上非频谱和/或非时变频谱参数作为输入。这种参数的示例包括制造设备的一个以上部件的温度(例如,晶片基座温度)、处理室的压力、装置中的等离子体性质(例如,等离子体功率、频率、电压、电流、脉冲特性等)、设备中一个以上位置处的气体流率、和/或工艺中一个以上先前步骤的持续时间。非频谱输入参数可以是时变的(多次提供的值)或非时变的(一次提供的值)。任何这样的参数可以从以下项提供:当前工艺(被控制的工艺)、先前工艺(例如,不同制造设备中的上游工艺)、或后续者(例如,下游工艺,其中在当前工艺的时间下控制参数为已知)。共同地,时变频谱信息(例如,地毯)和可选的一个以上非频谱或非时变参数值被提供作为模型的输入。根据这些输入,该模型输出可以用于前馈控制(例如,多步骤工艺中一个以上步骤的终点预测)的信息,例如预测的晶片表面特性。
例如,考虑一个多步骤工艺,其中考虑的步骤称为“当前步骤”。模型或其他控制逻辑(例如,使用在地毯多项式参数和工艺终点之间的相关性的逻辑)被配置为提供关于当前步骤的信息。然而,对逻辑的输入可能来自多步骤工艺中的任何不同时间阶段或步骤。例如,当前步骤可以是20步骤工艺中的步骤10。步骤1-9是上游步骤,而步骤11-20是下游步骤。输入参数可以从任何一个以上上游步骤、任何一个以上下游步骤、当前步骤、或其任何组合获得。
多步骤工艺的多个步骤可以具有各种要求和功能中的任何一者。例如,室或制造设备可以支持从一个步骤到下一个步骤采用不同工艺条件的多步骤工艺。在一些实施方案中,不同的工艺条件可以从多循环工艺(例如ALE或ALD)的一个循环到下一个循环存在。例如,一个循环的投配、清扫、或等离子体阶段的持续时间可以在循环之间变化。在其他情况下,工艺条件可以从非循环工艺的一个步骤到另一个步骤而变化。例如,可以设计或调整多步骤工艺的一个步骤以控制蚀刻深度,而后续步骤可以被设计或调整以控制蚀刻特征的CD。因此,多步骤工艺的当前步骤可以具有一组工艺参数,而上游或下游步骤可以具有不同组的工艺参数,或者这些参数中的至少一个可以与当前步骤及上游或下游步骤不同。
在一些实施方案中,多步骤工艺的所有步骤在相同的制造设备或室中执行,该制造设备或室被配置为逐步调整至少一个工艺条件。例如,衬底基座温度分布、等离子体条件、压力、或蚀刻剂或沉积前体气体的流率可以从一个步骤到下一步骤改变。在一些实施方案中,当前步骤(以上示例中的步骤10)在第一制造设备或室中进行,而上游或下游步骤中的一个以上在第二制造设备或室中进行。第一和第二设备或室均单独配置并且可以具有单独的工艺条件,例如温度、压力、等离子体条件或流率。
虽然当模型正在处理当前步骤的信息时下游步骤尚未发生(例如,模型正在确定一终点),但下游步骤的已知或预期的工艺参数值可以被包括作为模型的输入。因此,即使在执行模型和执行当前步骤时尚未执行下游工艺,但下游工艺的温度或其他参数的预期值也可以用作对当前工艺步骤的模型的输入。
输入到模型的工艺条件可以在设备层级(例如,通过配方或预编码反馈或前馈工艺控制)或在制造设施级别(例如,通过操作员根据计量或其他后处理信息进行决定)自动设置或调整。在设施级别设置的条件组可能会与随设备提供的配方或其他工艺设置重叠。
总的来说,用于当前步骤的模型的输入参数可以被称为前馈参数,而不管这些参数是表征当前步骤、上游步骤、下游步骤、或其若干组合。
图3示出了地毯300的示例,其是由帧的时间序列捕获生成的表面的三维抽象,其中每个帧表示将强度分类为波长的函数的时间实例。如图所示,帧0是为地毯300捕获的第一帧,并且直到帧n的每个后续帧都表示用于蚀刻操作的地毯(例如图4所示),表示用于沉积操作的地毯,和/或表示用于另一制造操作的地毯。帧1-n中的每一者在特定时间t0-tn被捕获,该时间t0-tn可以在多循环制造工艺的多个循环中延伸。因此,每一帧都有其各自的频谱,以波长来描述强度。随着每一帧被捕获,地毯300被构建,因此暴露了随时间进展在波长方面关于强度变化的信息。
因此,不仅收集强度作为波长的函数的单个时间帧的信息,而且针对多个时间点收集强度作为波长的函数的连续变化的信息。因此,在任何一个时间点,都可以确定导致当前时间状态发生的变化。因此,在涉及多步骤蚀刻工艺的实施方案中,该信息将公开当衬底132被蚀刻以限定蚀刻特征400时发生什么强度变化。类似地,在涉及多步骤沉积工艺(或其他制造工艺)的实施方案中,该信息将公开当材料被沉积在衬底132上时(或当其他制造工艺在某些方面修改衬底132时)发生什么强度变化。
在图4中所示的示例示出了单个蚀刻特征,但应当理解,对于可能小于光波长并且可能对应于分布在整个半导体晶片上的光刻曝光的单个场或更多场的任何数量的特征,通常基本上同时执行蚀刻操作。类似的情况发生在沉积和其他制造工艺中,其中与其他制造工艺相关的沉积和修改可以分布在整个半导体晶片上。在使用单个反射仪传感器的一些实施方案中,仅收集照射点下的频谱时间序列,但是这样的频谱时间序列用于控制整个晶片的终点。在涉及可从半导体晶片内的多个位置收集信息的多个反射仪传感器或一个以上反射仪传感器的其他实施方案中,频谱时间序列的组合可用于控制整个晶片的终点。当特征临界尺寸和深度随着蚀刻的进行而变化时,入射光束的衍射将在远场中产生与波长呈函数关系的强度变化,并导致频谱仪的强度变化。类似地,当半导体晶片的方面随着沉积或其他制造工艺的进行而变化时,入射光束的衍射将在远场中产生与波长呈函数关系的强度变化,并导致频谱仪处的强度变化。
因此,图4的说明被提供以示出随着蚀刻的进行,与波长呈函数关系的频谱强度的帧将继续被捕获,从而构建和限定地毯300。在一个实施方案中,对于特定的晶片处理操作,例如蚀刻操作,被蚀刻的特征将达到特定深度,其在图4中以测得深度(dm)显示。至此,蚀刻操作完成,并且图3的地毯300完成。这导致最后一帧(例如,帧n)是对应于在时间tn处测量的深度dm的帧。请注意,可以以类似的方式评估沉积操作。
图3的地毯300的图示以及图4中的蚀刻操作被显示以说明频谱数据的多帧的捕获。应该理解的是,基于期望的采样频率,将捕获更多的帧,这可以为更密集的地毯300提供与特征CD、深度、或晶片级的轮廓信息的变化相关联的丰富信息。在一个实施方案中,地毯300被认为随时间而变化,这被作为波长的函数捕获的多个帧而公开。在一个实施方案中,地毯300可以使用具有相关系数的数学多项式针对一定范围的波长来表征。因此,多项式的系数将以时间和波长定义表面,其将随着如下所述而更加理解。
如上所述,本文所述的一个实施方案利用了一种训练工艺,该工艺要求针对特定的多步骤蚀刻配方和多步骤蚀刻工艺和/或针对特定的多步骤沉积配方和多步骤沉积工艺处理多个晶片。在一些实施方案中,相同的室104将用于各种晶片。在其他实施方案中,不同的室可以用于每个晶片。在训练操作期间处理的每个晶片将产生相应的地毯300。基于采样频率,根据在每个帧处捕获的频谱和其他数据,每个地毯将定义由包括频谱反射仪200和/或传感器136的原位监测设备所看到的特性。一旦定义了多个地毯,就可以使用例如多项式拟合算法来拟合这些地毯,以生成具有浮动、固定、和/或耦合系数参数的地毯,这在本文中称为虚拟地毯(机器学习模型)。
图5示出了根据一个实施方案的关于使用训练生成器500的更多细节,该训练生成器500包括为每个训练晶片生成地毯。如图所示,训练生成器500包括地毯300a-300n的生成,其中每个地毯与相应的多项式(例如,诸如系数的多项式参数)相关联,并且每个地毯具有最后帧,其待相关联至测量的蚀刻深度或至测量的沉积深度或其他晶片参数。由于在工艺条件、室配置、和其他因素之间将存在差异,因此生成每个地毯时的蚀刻或沉积终止可能会有所不同。该影响将通过例如经由逐步回归、多地毯耦合回归、或主成分分析而加载多项式系数加以模型化,其中不同地毯的参数差异将公开其对终点估计的影响,并且随后通过线性回归针对测量蚀刻深度来决定。在一些实施方案中,地毯被提供有关于工艺条件的其他信息,例如温度、压力、等离子体条件、气体流率、工艺持续时间、室部件配置等。该附加信息可以至少部分地解释在工艺条件、室配置等之间的变化。
在一些实施方案中,可以有意地将各种晶片蚀刻到不同深度(或具有不同深度的沉积材料),以产生各种尺寸的地毯300。在一些实施方案中,可以使用不同数量的蚀刻步骤来蚀刻(或沉积到)各种训练晶片,并且可以提取反映不同数量的蚀刻(或沉积或其他多步骤工艺)步骤的一个以上参数(例如,蚀刻深度、临界尺寸等)。这样的实施方案可以促进多步骤制造工艺的虚拟地毯(机器学习模型)的产生。在任一情况下,根据它们的多项式和相关系数,捕获每个地毯300。如上所述,多项式的各种系数将描述地毯的三维轮廓形状,其由针对该蚀刻或沉积操作随时间推移捕获的多个帧所定义。在此示例中,多项式拟合处理器504被配置为从地毯300a-300n中的每一者接收频谱帧,并且,作为示例,输出多项式系数。此外,与地毯300a-300n中的每一者相关联的每个晶片的测量深度也将由测量仪器502捕获。测量仪器502可以采取各种形式,并且广义而言为半导体计量工具,其能够测量晶片的特定参数或指标以及晶片上的特征。示例包括横剖面SEM、TEM和散射仪。
多项式拟合处理器504被配置为与虚拟地毯生成器506(例如,包括机器学习系统)通信。虚拟地毯生成器506是降维和线性回归程序,通过其生成虚拟地毯(机器学习模型)300。就频谱数据的帧而言,虚拟地毯300被配置为具有预定大小,其是呈波长函数的频谱强度。如上所述,多项式拟合处理器504被配置为接收各种地毯300a-300n的频谱帧,并因此根据由虚拟地毯生成器506定义的限制来拟合它们。在一个实施方案中,虚拟地毯生成器506被配置以生成虚拟地毯(机器学习模型)508,其可以通过上述各种技术生成。
虚拟地毯508因此生成,且虚拟地毯508以及测量仪器502的输出在510中相关联以将虚拟地毯(机器学习模型)的虚拟帧数关联至由测量仪器502测量的特定深度或指标。因此,在实时处理和端点操作512期间,室的控制器可以存取虚拟地毯(机器学习模型)508和/或深度相关器510的虚拟帧数,以识别多步骤蚀刻或多步骤沉积工艺何时达到其终点。在一些实施方案中,除了频谱/地毯信息之外的信息与蚀刻深度或其他晶片参数一起相关联。因此,例如,相关器510可以被配置为不仅考虑虚拟地毯信息而且考虑可能在前馈处理中使用的其他信息。这样的其他信息可以包括其中发生蚀刻或沉积的设备中的操作条件。示例包括温度、流率、压力、等离子体条件、步骤或子步骤的持续时间以及室部件配置。可以在设备级别(通过预编码反馈或前馈工艺控制)或在制造设施级别(例如,通过操作员根据计量或其他后处理信息做出决定)自动设置或调整操作条件。在设施级别设置的条件可能会与设备提供的配方或其他工艺设置重叠。
当蚀刻或沉积工艺已达到正在制造的特定特征的预期蚀刻或沉积深度时,到达终点,并且通过使用虚拟地毯,可以通过将当前处理的地毯的一部分(即,对于当前的制造操作)关联于虚拟地毯508而达到该终点。在一些实施方案中,终点可涉及改变多步骤制造工艺中的中间步骤的长度,而不是仅仅改变最终步骤的长度。
举例来说,实际制造晶片的实时处理可以利用该算法,其中控制器为当前的蚀刻或沉积操作生成地毯。在处理过程中,为地毯产生帧,这些帧被添加到已经产生的先前帧。在一个实施方案中,在蚀刻或沉积的实时处理期间可以从当前生成的地毯使用当前帧和一个以上先前帧(即,补丁),以执行对虚拟地毯的拟合。通过以动态和实时的方式拟合至虚拟地毯,实时识别预测的蚀刻或沉积深度是可能的。如上所述,虚拟地毯将保存关于虚拟帧数的信息,这些信息预先相关至蚀刻深度、沉积深度、或相似者。
如下文将描述的,各种蚀刻深度或沉积量可以从训练期间处理的各种晶片加以近似。并且,先前的训练期间产生了虚拟地毯,因此,有关当前捕获的频谱数据帧(或帧补丁)的预测蚀刻深度或沉积量的信息将产生对实际蚀刻深度或沉积量的紧密相关的估计或预测。因此,通过在实时处理期间继续处理地毯,将到达一个点,在该点上,拟合及映像到虚拟地毯的帧将指示用于特定蚀刻操作的所需深度或用于特定沉积操作的所需沉积量。此时,室的控制器可以向系统指示已经到达终点,并且蚀刻操作或沉积操作将停止。
图6示出了根据一个实施方案的地毯300a的示例,当在晶片(W0)训练期间受到蚀刻(或沉积在其上)时产生其对应的多项式。在该示例中,示出了地毯300a作为真实帧样本230的结果产生,其包括帧数231和时间232。在完成用于生成地毯300a的蚀刻(或沉积)操作工艺时,到达来自各种样本帧的最后帧。在此示例中,最后一帧是帧467。帧467仅显示为示例编号,并且捕获的帧将取决于采样频率和蚀刻(或沉积)操作的持续时间。
继续该示例,帧467将与测量的蚀刻深度(或测量的沉积深度)或正在由测量设备或系统检查或测量的一些其他参数或指标相关联。如上所述,对于不同的指标,也可能测量或相关联频谱强度帧作为波长的函数。这样的指标可能包括临界尺寸检查、晶片中的弯曲特性、以及通常测量或可测量的其他指标。
图7示出了具有其对应多项式的虚拟地毯(机器学习模型)508的示例,该多项式是从训练操作期间生成的所有多项式导出的。如图所示,对于该虚拟地毯,虚拟帧样本720也是可识别的,其中虚拟帧数与不同时间相关联,这些时间源自多个真实帧样本230,这些真实帧样本230对应于从在训练期间产生自不同晶片的各种地毯产生的所有多项式。虚拟帧样本720还将包括虚拟帧数721和对应的时间722。
在本示例中,由于虚拟帧数已经标准化,虚拟帧数将从虚拟帧数0扩展到虚拟帧数300。可以理解,所有各种训练地毯的虚拟帧数将具有不同的帧数,并且导出各种帧及其相关的多项式系数,使得将它们标准化为对于虚拟地毯508定义的该组虚拟帧数。通过生成虚拟地毯508,可以提取出从各种训练地毯中发生的变化,并且因此生成和消除可能在每个单独的地毯中发生的异常或误报。此外,通过生成虚拟地毯508,可以使用虚拟地毯508以供运行生产晶片的工艺稍后参考,并且这样的生产晶片可以利用识别终点的虚拟地毯508。
图8示出了根据一个实施方案的在虚拟地毯(机器学习模型)508的虚拟帧数与在产生各种地毯的训练期间执行的蚀刻操作的测量深度804(或沉积操作的测量沉积量)之间的映射图800的示例。在制造晶片的处理期间,控制器可以生成其自己的地毯,该地毯由具有作为波长的函数的强度的多个帧所定义。在生成地毯时,可以周期性地捕获两个或更多帧、或地毯的补丁,并将其拟合到虚拟地毯508。通过拟合到虚拟地毯508中,可以识别由在晶片上执行蚀刻的室正在处理的最当前帧的虚拟帧数802。
如810所示,当前帧数(VFNc)可以从虚拟帧数802中识别出来,并且取相关性而从映像图800的蚀刻深度804(或对应映射图800的沉积深度)来预测当前深度(dc)。如映射图800所示,训练期间使用的各种测试晶片也可以映像到图表,这将产生基本上线性的近似。线性近似将显示为每个测试晶片测量的深度,因为它们被相关于在相应地毯300中的最后帧。这说明晶片0被蚀刻到深度d1,晶片3被蚀刻到深度d2,晶片1被蚀刻到深度d3,并且晶片Wn被蚀刻到深度dn。
这些步骤可以显示为基本上沿着基本上直线而发生,因为虚拟帧数是从每个地毯300收集的帧的拟合表示。因此,预计由虚拟地毯提供的标准化将产生这样的基本线性的响应或表示。因此,在处理期间,当前虚拟帧数VFNc可以沿着线性近似映像到点806,然后在处理期间可以将其相关联至预测的当前深度dc(或与预测的沉积深度相关联)。基于线性近似和识别的虚拟帧数,深度dc被进一步近似为位于深度d2和d3之间。在一个实施方案中,当前深度dc可以使用从一个以上先前的深度预测的外推来识别。在一些实施方案中,目标值可能不会完全在新的帧中达到。如果实时处理要求达到d3的深度,则系统将继续处理当前制造操作的地毯,并在将当前补丁或帧拟合至虚拟地毯之后,将继续对晶片的当前正在生成的地毯的两个以上帧或一补丁与虚拟地毯进行比较。当在下一帧之前达到目标值时,可以通过从先前帧外推预测的值来计算终点时间。结果,可以以子帧准确度控制实时处理。
因此,该工艺可以继续检查当前虚拟帧数是否对应于期望的深度d3。例如,一旦处理生产晶片的系统达到VFN5,将达到深度d3,并且控制器将指示蚀刻工艺停止。
图9示出了根据一个实施方案的从多个晶片生成训练数据以产生接着将拟合至虚拟地毯(机器学习模型)的多个地毯的示例工艺。虽然图9是在蚀刻操作的背景中呈现,但应该理解到图9同样适用于沉积和其他制造操作,包括多步骤操作,例如ALD和ALE。在操作402中,从多个晶片的多个蚀刻工艺产生训练数据。如上所述,相同的蚀刻系统或类似配置的各种蚀刻系统可以处理多个晶片,并且在处理期间,可以捕获作为波长的函数的强度。在操作404中,产生针对每个晶片进行的每个工艺的地毯。
地毯将包含作为波长的函数的强度的多个采样帧。当训练晶片的工艺蚀刻完成时,操作406将测量每个晶片的结果深度,使得每个地毯中的最后帧将对应于所测量的结果深度。在一个示例中,可以使用计量系统来进行测量。在操作408中,多项式拟合是针对所生产的地毯中的每一者进行处理以产生虚拟地毯(机器学习模型)。虚拟地毯的多项式系数中的一些可能是浮动的,且其他是固定的或耦合到浮动参数,使得多个地毯的每一个的相应系数的所有多项式都是虚拟地毯的那些的子集合。因此,虚拟地毯是训练期间晶片处理期间产生的多个地毯的超集。在操作410中,在虚拟地毯的虚拟帧数和对预测的蚀刻深度的测量之间产生相关性。这包括对蚀刻深度或指标执行虚拟地毯的虚拟帧数的监督训练。可选地,操作410不仅将晶片参数信息(例如,蚀刻深度)相关联至来自虚拟地毯的信息,而且还相关联至关于工艺条件(例如温度、压力、气体流率、等离子体条件、室部件配置等)的其他信息。这些其他特征有时称为前馈参数。
作为示例,通过映射图800,在图8中显示相关性。在操作412中,虚拟地毯和相关性被储存到数据库中以在晶片的实时处理期间使用。在一些实施方案中,虚拟地毯和相关性被储存为二进制模型以在晶片的实时处理期间使用。
图10是图9的工艺的另一个示例,具有关于操作410和412提供的额外细节。在该示例中,操作410'描述了蚀刻深度的加载可以根据地毯多项式参数(以及可选的一个以上前馈参数)来定义。地毯参数可以包括虚拟地毯帧数和地毯的其他浮动多项式参数。在操作412'中,虚拟地毯的多项式(以及可选的一个以上前馈参数)被储存。多项式可以作为浮动、固定、和/或耦合参数和相关常数储存在数据库中。在该示例中,回归的系数(以及可选的一个以上前馈参数)在410'中获得。
如本文所使用的,晶片的实时处理意味着生产晶片正在被处理,并且所使用的终点机制实现了将生成的地毯补丁拟合至虚拟地毯的使用,该虚拟地毯是在先前的训练操作期间生成的。在一些实施方案中,室的控制器可以处理正在生成的地毯与虚拟地毯的相关性。在其他实施方案中,单独的计算机或甚至网络计算机可以存取虚拟地毯并从比较、拟合操作、和所造成的终点确定中产生结果。
在进一步的实施方案中,该工艺可以由一台以上计算机或一个以上工艺以真实计算机或虚拟计算机的形式共享。在一些实施方案中,处理可以分布在多个虚拟机之间。在任一方式中,制造晶片的处理可以实现虚拟地毯(机器学习模型),使得可以将制造期间生产的地毯与虚拟地毯进行比较,以确定终点或验证与蚀刻工艺相关的指标。如上所述,可以对蚀刻深度进行测量。然而,可以对任何数量的特征指标(例如晶片特性、临界尺寸、晶片弯曲以及类似物)进行测量。
图11示出了根据一个实施方案的示例性工艺,其中在操作602中进行晶片的实时处理。如图所示,实时晶片处理可以由制造室(例如室102)执行,其耦合或连接到原位监测设备105(例如图1的传感器136和/或反射仪200)。在一些实施方案中,室102可以与许多其他室一起安装在制造设施中。每个室本身可以连接到原位监测设备105,从而可以在时间序列上为多个帧收集频谱数据。
在操作604中,从在当前蚀刻操作的处理期间捕获的多个帧生成部分地毯。如上所述,在制造处理期间,通过以预定义的采样率添加越来越多的帧,地毯被连续地生成,以定义当前的地毯。按照操作606,在可以以程序方式设置的周期性时间点,系统或单独的工艺的控制器可以触发对虚拟地毯进行部分地毯的多项式拟合(即,虚拟地毯在先前已经在训练期间生成)来表征与当前蚀刻操作相关联的工艺。在操作608中,从与虚拟地毯相关联的数据中识别虚拟帧数和地毯多项式系数。在操作608中,还识别一个以上前馈参数(例如,设备部件细节、压力、温度、等离子体参数等)。
在操作610中,基于所识别的虚拟帧数来识别预测的蚀刻深度,如参考图8的示例所示。在一个实施方案中,蚀刻深度的预测将使用虚拟帧数以及其他地毯多项式系数。例如,至少部分预测来自虚拟帧数,但在运行时工艺中浮动的多项式系数捕获了部分地毯的差并提供了对预测的校正(通过预定的加载参数)。在操作612中,通过从先前帧外推预测指标来确定是否将在下一帧中到达终点。如果在下一帧中无法到达终点,则系统将继续处理部分地毯的另一部分,包括最后或最近处理的帧,并将继续进行到操作606、608和610。如果终点将在下一帧到达,蚀刻操作将在预测的终点时间停止。一旦已经达到工艺终点,意味着期望的蚀刻深度已经达到并且对应于操作610中的预测深度蚀刻,蚀刻操作将停止。
尽管提供了关于使用测量的宽带原位反射仪频谱生成地毯的具体示例,但仍可以使用其他测量方法。此外,可以使用激光方法,如激光吸收频谱。在一个示例中,可以使用具有在整合带上的地毯的激光吸收或具有全频谱的激光吸收频谱。在其他实施方案中,还具有已知显示与晶片上指标变化、室部件、等离子体阻抗(化学)变化两者相关的类似复杂地毯行为的频谱的RF信号也可以经受所公开的分析。关于RF信号,据信获得的指标将较少与终点有关,而更多地与室匹配/指标化有关或有用。
在一些实施方案中,所收集的频谱数据与光或激光干涉测量法、或反射测量法和吸收法、或OES、或RF电压和电流迹线本身相关,或在数学上转换为RF频谱振幅。在一个实施方案中,从用于蚀刻的室收集频谱数据,同时在晶片上蚀刻特征。
在其他实施方案中,可以将更多数据流放在一起以形成具有似地毯行为的合成“频谱”。如本文所述,使用地毯的一个用途是任何频谱元素与其近频谱维度邻居及其近时间维度邻居之间的物理约束强相关性和连续性关系。如果将不同的工具数据与收集的频谱结合使用,则“频谱”和“时间”空间中由自然法则施加的相关连续性可能会降低。这是因为由于物理原因,工具数据变量不一定彼此“接近”。在一个实施方案中,可以对工具数据进行分类以找到物理性质以将工具数据变量彼此“相邻”放置。在一些实施方案中,对于“良好的操作工具”,变量可以“通过发现”在数学上进行选择和排序,使得变量被排列在已知具有“频谱-时间”相关性和连续性的“伪频谱”中。
以这样的方式,可能使用地毯处理来调用控制动作并检测工具之间的差异。在一个实施方案中,以上参照图1描述的控制器124可包括处理器、存储器、软件逻辑、硬件逻辑以及与等离子体处理系统通信、监测和控制的输入和输出子系统。在各种实施方案中,图9、10、和11中显示的工艺可由控制器124执行。控制器124还可以处理一个以上配方的处理,包括用于各种操作参数(例如,电压、电流、频率、压力、流率、功率、温度等)的多个设置点等,例如,用于操作等离子体处理系统。此外,虽然参考蚀刻操作(例如,蚀刻工具)提供了更详细的示例,但应当理解,这些操作同样可以用于沉积操作(例如,沉积工具)。例如,在验证操作中,验证可以是沉积性能,而不是验证蚀刻性能。可以以各种方式量化沉积性能,并且不限于此,可以使用各种类型的计量方法和/或工具。此外,沉积性能可以原位或脱机测量、感测、近似和/或测试。
在一些实施方案中,控制器124是系统的一部分,该系统可以是上述示例的一部分。这样的系统包括半导体处理装置,半导体处理设备包括一个或多个处理工具、一个或多个室、用于处理的一个或多个平台、和/或特定的处理部件(晶片基座、气体流系统等)。这些系统可以与电子器件集成,以便在半导体晶片或衬底的处理之前、期间或之后控制这些系统的操作。电子器件可以被称为“控制器”,其可以控制一个或多个系统的各种组件或子部分。根据处理要求和/或系统的类型的不同,控制器124可以被编程,以控制本发明所公开的工艺中的任何一些,包括控制处理气体的输送、温度设置(例如,加热和/或冷却)、压强设置、真空设置、功率设置、射频(RF)发生器设置、RF匹配电路设置、频率设置、流率设置、流体输送设置、位置和操作设置、晶片的进出工具和其他传送工具和/或连接到特定系统的或与该系统接口的装载锁的传送。
从广义上讲,控制器124可以被定义为接收指令、发出指令、控制操作、使能清洁操作、使能终点测量等的具有各种集成电路、逻辑、存储器、和/或软件的电子器件。该集成电路可以包括固件形式的存储程序指令的芯片、数字信号处理器(DSP)、定义为专用集成电路(ASIC)的芯片、和/或执行程序指令(例如,软件)的一个或多个微处理器或微控制器。程序指令可以是以各种不同的设置(或程序文件)形式输送到控制器124的指令,不同的设置(或程序文件)定义用于在半导体晶片上或针对系统进行特定工艺的操作参数。在一些实施方案中,所述操作参数可以是由工艺定义的被设计成完成在晶片的一个或多个(种)层、材料、金属、氧化物、硅、二氧化硅、表面、电路和/或裸芯片的制造过程中的一个或多个处理步骤的配方的一部分。
在一些实施方案中,控制器124可以是与系统集成、耦接或者说是通过网络连接系统或它们的组合的计算机的一部分或者与该计算机耦接。例如,控制器124可以在“云端”或者是晶片厂(fab)主计算机系统的全部或一部分,它们可以允许远程访问晶片处理。计算机可以启用对系统的远程访问以监测制造操作的当前进程,检查过去的制造操作的历史,检查多个制造操作的趋势或性能指标,以改变当前处理的参数,设置处理步骤以跟随当前的处理或者开始新的工艺。在一些实施例中,远程计算机(例如,服务器)可以通过网络给系统提供工艺配方,网络可以包括本地网络或互联网。远程计算机可以包括允许输入或编程参数和/或设置的用户界面,这些参数和/或设置然后从远程计算机传输到系统。
在一些示例中,控制器124接收数据形式的指令,这些指令指明在一个或多个操作期间将要执行的每个处理步骤的参数。应当注意,这些参数可以针对将要执行的工艺类型以及工具类型,控制器124被配置成连接或控制该工具类型。因此,如上所述,控制器124可以例如通过包括一个或多个分立的控制器124而分布,这些分立的控制器通过网络连接在一起并且朝着共同的目标(例如,本文所述的工艺和控制)工作。用于这些目的的分布式控制器124的示例将是与一个或多个远程集成电路(例如,在平台水平或作为远程计算机的一部分)通信的在室内的一个或多个集成电路,它们结合以控制室内的工艺。
示例系统可以包括但不限于等离子体蚀刻室或模块、沉积室或模块、旋转漂洗室或模块、金属电镀室或模块、清洁室或模块、倒角边缘蚀刻室或模块、物理气相沉积(PVD)室或模块、化学气相沉积(CVD)室或模块、原子层沉积(ALD)室或模块、原子层蚀刻(ALE)室或模块、离子注入室或模块、轨道室或模块、以及可以与半导体晶片的制造和/或制备相关联或用于半导体晶片的制造和/或制备的任何其它半导体处理系统。
如上所述,根据工具将要执行的一个或多个工艺步骤,控制器124可以与一个或多个其他的工具电路或模块、其他工具组件、组合工具、其他工具界面、相邻的工具、邻接工具、位于整个工厂中的工具、主机、另一个控制器124、或者将晶片的容器往来于半导体制造工厂中的工具位置和/或装载口搬运的材料搬运中使用的工具通信。
原位计量
在一些工作流程中,在电子设备制造工艺期间由传感器捕获的数据用于推断多步骤工艺的一个以上阶段的晶片结构参数值。这些结果或推论可以称为原位计量值。推断的原位计量值可以提供给单独的系统,该系统可以使用该信息来做出关于在多步骤工艺的任何一个以上步骤调整工艺控制值的工艺控制决策。在一些实施方案中,工艺控制系统由负责操作IC制造设施或生产特定IC或其他电子设备的实体进行控制。如此实体做出的工艺控制决策有时被实施为先进工艺控制(APC)。
使用原位计量值的工艺控制可以使用逐次运行或“R2R”概念来实现。通常,R2R控制涉及在制造工具的运行之间修改或选择配方或控制参数。目标是以某种方式提高处理性能,例如通过提高均匀性或满足设备/制造规范。
一次运行可以是批量、批次、或单个晶片。在某些实施方案中,R2R控制使用原位计量,可选地连同工艺、设备、和计量数据一起使用。在某些情况下,R2R控制使用晶片特征或其他参数的历史知识来建议在每次运行后更改配方或其他设置。R2R的一种用途是捕获和纠正工艺偏移和飘移,并减少运行之间的工艺可变性。一些好处包括改进的工艺能力(提高目标的准确性和减少可变性)、早期检测工艺飘移、减少工艺停机时间、更好的工艺控制、和废料减少。R2R控制可以利用前馈和反馈信息中的一或两者。该信息可能分别来自处理前和处理后的计量。不幸的是,因为大多数计量(且特别是纳米级计量)成本很高,所以测量的晶片相对较少。因此,控制器必须在不采样许多晶片的情况下运行,从而限制了控制器的有效性。如本文所述,原位计量可以在处理期间实现基本上100%的采样。
在某些实施方案中,原位计量值由机器学习模型确定和输出。这样的机器学习模型从原位收集的感测信息生成原位计量值,同时在制造工具中处理一个以上晶片。感测到的信息可以是随时间变化的频谱数据或从中提取的参数,例如本文别处描述的地毯。
由机器学习模型所输出的原位计量值可以表示在多步骤工艺的任何一个以上步骤中晶片上特征的结构参数值。如本公开的其他地方所提到的,一些晶片结构参数表示特征的几何性质。示例包括特征深度、宽度、侧壁角度、覆盖、以及表征重复结构的参数,例如临界尺寸和节距。如前所述,一些晶片结构参数代表晶片上结构的物理性质。示例包括晶片上一层或多层的厚度和色散性质,例如晶片上一层或多层的折射率和消光系数。
请注意,可以为多步骤工艺的任何一个以上步骤获得原位计量值。然而,并非所有工艺或系统都需要配置为获得所有步骤的所有原位计量值,即使感兴趣的参数(例如,多步骤蚀刻工艺结束时的特征的CD)以及工艺中的所有步骤之间存在因果关系。这可能适用于一些多步骤工艺,其中只有一个或几个步骤对感兴趣的晶片参数(例如,总蚀刻深度)具有显著影响。由于这个原因,原位计量系统可以被配置为仅为一个或几个步骤提供晶片参数值。例如,如果四步骤工艺的步骤C对整个工艺的影响最大,则可能没有必要获得步骤A、B和/或D的原位计量值。在其他示例中,可能有用的是获得步骤D(最后步骤)的原位计量值,因为最终特征特可能较为明显。
请注意,原位计量值反映了晶片的状况、晶片特征、或在处理晶片时进行制造的环境。它们可以作为可用于任何其他目的的中间结果。换言之,可以在不考虑工艺控制或任何特定应用的情况下生成原位计量结果。在一些实施方案中,第一系统或方法产生原位计量值,并且单独的系统或方法解释或以其他方式将这些值用于任何各种目的,例如调整工艺条件(反馈或前馈),确定新配方,以及/或者修改装置设置,例如等离子体源、基座加热器、或其他部件的硬件或软件设置。在某些情况下,第一系统与制造工具整合或包裹在一起,而第二系统由IC制造设施或负责生产集成电路或其他电子设备的实体所控制。如所指示的,第一系统可以被实现为机器学习模型,该机器学习模型被设计或配置为接收原位收集的、时变的频谱数据或从中提取的参数。
图13描绘了一种工作流程,其中一个以上传感器1303被配置为从处理室1307和/或在处理室中进行处理的一个以上晶片1309收集原位、时变的频谱数据。相关联的机器学习模型1305被配置为接受原位时变频谱数据并生成推断的原位计量值。单独的系统、团队、和/或个人1311可以接收推断的原位计量值并将它们用于专用目的,例如以反馈或前馈方式调整工艺条件。有关提供控制指令,请参见数据路径1313。图13示出了等待在室1307中处理的预处理晶片1315。晶片1315可以在将更新的工艺控制指令应用到室1307之后或期间进行处理。系统、团队、和/或个人1311可以独立于机器学习模型1305操作。例如,机器学习模型1305可以专用于处理室1307和/或由室1307的供货商提供,而系统、团队、和/或个人1311可以由IC制造设施或由负责生产集成电路的实体进行维护或控制。
在某些实施方案中,产生原位计量值的机器学习模型和可选的关联计算模块被配置为执行以下操作中的一个以上:从原位时变、频谱数据的特征提取,用于分析从原位数据中提取的特征的先前选择的超参数的应用,及从提取的特征中推断原位计量值。特征提取可以降低原位、时变、频谱数据的维数。当在长时间、多步骤工艺的多个步骤、从多个传感器和/或在很宽的波长范围内收集原位数据时,这可以促进原位计量值的计算。可以采用各种技术进行特征提取。如所提到的,这样的技术包括将时变的频谱数据拟合为多项式。其他技术包括快速傅里叶转换、小波方法和主成分分析。
用于生成原位计量值的机器学习模型可以采用任何一个以上超参数。如此超参数的示例包括时变数据的开始和结束时间、频谱数据的波长边界、特征提取中使用的多项式的阶数等。
如上所述,原位计量值可以由机器学习模型产生。合适的机器学习模型可以采用各种形式中的任何一种。示例包括正则化线性模型、支持向量机、判定树、随机森林模型、梯度提升树、神经网络、自动编码器、及其任何组合。在某些情况下,机器学习模型与一个以上其他计算模块协同工作,以执行支持机器学习模型进行的推论的操作。这样的其他模块可以被配置为例如在将数据提供给机器学习模型之前对原位、时变、频谱数据进行预处理。可以由这样的模块执行的操作的示例包括从原位、时变、频谱数据提取特征,以及应用超参数以例如划分或分割原位数据。在一些实施方案中,单个机器学习模型被配置为为多步骤工艺的多个步骤中的每一个提供原位计量值。然而,在某些情况下,可以采用不同的机器学习模型来为多步骤工艺的不同步骤生成原位计量值。在一些实施方案中,单个机器学习模型被配置为为给定的一个以上步骤提供多种不同类型的原位计量值(例如,CD、蚀刻深度、侧壁角度)。在其他实施方案中,采用单独的机器学习模型来提供单独类型的原位计量值。
根据某些实施方案,通过使用原位计量和相关联的机器学习模型评估样本晶片来调整未来晶片的工艺条件,该机器学习模型是使用许多先前晶片建构的。该方法可以减少在获取计量数据和调整后续晶片的工艺条件之间的时间。
当使用原位计量进行工艺控制时(例如,确定工艺设置调整),所得调整可应用于(a)从中获得原位计量值的工艺装置(对于当前和/或后续晶片)、(b)下游工艺装置(用于当前和/或后续晶片)、和/或(c)上游工艺装置(用于后续晶片或采用相同工艺的另一件制造设备的参考)。因此,原位计量值可用于反馈和/或前馈工艺控制。在某些实施方案中,原位计量值用于确定对未来晶片的工艺条件或设置的调整,即,在获得原位计量值时在获得原位计量值的处理室中尚未处理的晶片。在某些情况下,在调整条件下进行处理的未来晶片与获得原位计量值的晶片在同一批次中。在某些情况下,未来的晶片来自不同的批次。在某些情况下,未来晶片来自用于制造一个以上不同半导体产品的一组晶片,其中一些未来晶片具有不同的图案(不同于用于获取原位计量值的晶片)。
通常,工艺控制可以在设备级别(例如,通过配方或预编码反馈或前馈工艺控制)或在制造设施级别(例如,通过系统或操作员根据原位计量做出决策)而自动实施。在设施级别设置的条件可能会与装置提供的配方或其他工艺设置重迭。
如所解释的,生成原位计量值的步骤可能涉及为多步骤工艺中的多个步骤中的每一个捕获传感器值的频谱时间序列。它可能涉及从一个以上传感器捕获该信息。换言之,原位计量系统可以被配置为用于多个处理步骤并且可能使用多个传感器的普遍传感器捕获和特征提取。通过捕获所有可用的原位数据,原位计量系统具有在多步骤工艺的任何一个以上步骤期间利用来自任何一个以上传感器的数据的灵活性。
跨多个步骤中的每一个和可选地多个传感器中的每一个采集原位数据允许为多步骤工艺中的任何一个以上工艺步骤确定任何一个以上晶片级特征特性提供最大的灵活性。然而,处理所有这些感测数据可能在计算上不必要地昂贵。如果事实证明只有一小部分特征(例如临界尺寸和蚀刻深度)是重要的,并且这些特征仅在一个或两个步骤中(如步骤A-E中的步骤A和步骤D)是重要的,那么机器学习模型只需要对原位数据的子集进行操作。例如,模型可能只需要为步骤A和D采集的数据,并且也只需要对于确定所考虑的特定计量值所需的数据(例如,特征A和D中的临界尺寸和蚀刻深度)。
无论在推论阶段期间使用哪种数据(来自哪个(些)传感器和/或来自哪些步骤),在将提取的特征输入到机器学习模型之前,所有感测数据可能经受相同的一般特征提取和/或降维处理。此外,可以为每个步骤和/或每个特征类型采用相同的超参数。超参数可以通过对单个机器学习模型的优化来确定。在某些实施方案中,不同的特征提取技术用于不同的步骤。这可以允许使用不同的机器学习模型,这些模型可以专用于或定制化用于不同的步骤和/或不同的晶片特征类型。
跨多个步骤及可选的多个传感器的原位数据采集可以应用于学习阶段和推论阶段。一旦通过训练创建并部署机器学习模型,它就会使用从生产晶片捕获的原位传感器数据,这些传感器数据已经过相同的特征提取和/或降维处理。
可以使用计量数据作为监督或半监督学习的标签或参考来训练机器学习模型。参考计量数据可以来自训练数据的各种来源中的任何一者,包括来自多个训练衬底的物理计量数据,以及在一些实施方案中,虚拟计量数据。物理计量可以是常规计量,例如在后处理晶片上执行的反射计量。参考计量包括光学计量(反射法、椭偏法)、TEM、SEM等。虚拟计量数据来自间接信息(例如处理衬底的室中的发射频谱)。]
在某些情况下,基于例如制造设施的要求,可用的数据量是有限的。例如,一些训练数据必须从使用特殊工艺条件生产的晶片中获得,这些条件不用于制造生产晶片。使用生产设备生成训练数据对制造设施来说是一项巨大的成本。结果,制造设施可能愿意仅将几个晶片(例如,大约十个或十五个晶片)用于生成训练用数据。
传统上,训练晶片是使用广泛范围内的工艺变化组合来制备的,以通过训练或机器学习建立因果关系。这些晶片可称为实验设计晶片。例如,如果一个工艺中有五个步骤,并且每个步骤可以使用一系列的工艺条件执行(以产生一系列的工艺参数值,例如多个临界尺寸值、多个特征深度值、多个侧壁值角度等),需要大量可能的数据点来详尽定义训练适当的原位计量模型所需的计量空间。通过适当选择这些参数组合,仅使用相对较少的晶片即可生成用于训练的相关数据。
DOE方法可以采用对工艺空间中自变量(例如,处理室压力)和因变量(例如,特征CD)之间的相关性的理解。一些因变量对特定自变量的敏感性可能会告知选择要收集哪些数据点以生成训练集。例如,如果诸如蚀刻深度之类的计量值对晶片温度的变化非常敏感,则可以在至少两个温度下进行实验。
在某些情况下,不同变量之间的相关性和/或一些变量对其他变量的敏感性可以使用诸如有向非循环图(directed-acyclic-graph,DAG)的图结构来表示。在一些实施方案中,DAG用于描述最终计量指标(例如,在多步骤蚀刻工艺结束时的蚀刻深度)对关于工艺中的步骤以及可选地关于传入晶片的变化的信息的相关性。可以根据DAG中所示的相关性和敏感性来指定一组训练实验。
在原位计量方法或算法的开发期间,可以采用迭代方法来确定特征提取工艺和机器学习工艺的细节。在一些机器学习工艺期间使用的正则化工艺可以帮助确定特征提取工艺的方面。此外,可以部署评估数据特征重要性的方法来识别在每个步骤中要从原位传感器数据中捕获的关键维度。一些这样的方法依赖于过滤器,这些过滤器指定了一些指标来删除一些维度。如此指标的一个示例可以是相关性/卡方。评估数据特征重要性的另一类型方法是包装器基础方法,它可以将一组特征的选择视为搜寻问题。包装器方法的一个示例是递归特征消除。用于评估数据特征重要性的另一类型方法是具有内置特征选择方法的嵌入方法。示例包括Lasso和随机森林,它们有自己的特征选择方法。
因为在生产期间会为每个晶片生成原位计量值而不会影响产量,所以生成的信息及其使用的成本很低。并且原位计量值可用于半导体器件工艺控制的许多方面。所得计量值可用于各种目的,包括前馈调整、反馈调整、停止制造工具的警告信号、触发更详细的计量采样动作以供进一步调查等等。并且计量值可以在运行时使用,例如,在多步骤工艺的结束或中间阶段。
控制模块
图12示出了用于控制上述系统的控制模块1200。在一个实施方案中,图1的控制模块124可以包括一些示例性部件。例如,控制模块1200可以包括处理器、内存和一个以上接口。控制模块1200可用于部分地基于感测值来控制系统中的设备。仅举例来说,控制模块1200可以基于感测值和其他控制参数来控制阀1202、过滤加热器1204、泵1205、和其他设备1208中的一者以上。控制模块1200仅举例而言接收来自压力计1210、流量计1212、温度传感器1214、和/或其他传感器1206的感测值。控制模块1200还可用于控制前体输送和膜沉积期间的工艺条件。控制模块1200通常将包括一个以上内存设备和一个以上处理器。
控制模块1200可以控制前体输送系统和沉积装置的活动。控制模块1200执行计算机程序,包括用于控制以下者的指令集:工艺时间、输送系统温度、跨过滤器的压力差、阀位置、气体混合物、室压力、室温度、晶片温度、RF功率电平、晶片卡盘或基座位置、以及特定工艺的其他参数。控制模块1200还可监测压力差并自动将蒸气前体输送从一条以上路径切换到一条以上其他路径。在一些实施方案中可以采用储存在与控制模块1200相连的内存设备上的其他计算机程序。作为示例和在各种实施方案中,图9、10和11所示的工艺可以由控制模块1200执行。
通常会有与控制模块1200相连的用户接口。用户接口可以包括显示器1218(例如,装置和/或工艺条件的显示屏幕和/或图形软件显示器),及用户输入装置1220,如指向设备、键盘、触控屏幕、麦克风等。
用于控制工艺序列中的前体输送、沉积和其他工艺的计算机程序可以任何常规的计算机可读取程序语言编写,例如:汇编语言、C、C++、Pascal、Fortran或其他。编译的目标码或脚本通过处理器执行以实施程序中指定的任务。
控制模块参数与工艺条件有关,例如过滤器压力差、工艺气体成分和流率、温度、压力、等离子体条件(例如RF功率水平和低频RF频率)、冷却气体压力、和室壁温度。
系统软件可以以许多不同的方式设计或配置。例如,可以编写各种室部件子程序或控制对象以控制执行本发明的沉积工艺所需的室部件的操作。用于此目的的程序或程序的部分的示例包括衬底定位代码、工艺气体控制代码、压力控制代码、加热器控制代码和等离子体控制代码。
衬底定位程序可包括用于控制室部件的程序代码,该室部件用于将衬底装载到基座或卡盘上并控制在衬底与室的其他部分(例如进气口和/或目标)之间的间距。工艺气体控制程序可以包括用于控制气体成分和流率并且可选地用于在沉积之前使气体流入室以稳定室中的压力的代码。过滤器监测程序包括将测量的差值与预定值进行比较的代码和/或用于切换路径的代码。压力控制程序可以包括用于通过调节例如室的排气系统中的节流阀来控制室中压力的代码。加热器控制程序可以包括用于控制通向加热单元的电流的代码,该加热单元用于加热在前体输送系统中的部件、衬底和/或系统的其他部分。替代地,加热器控制程序可以控制诸如氦之类的热传气体向晶片卡盘的输送。
可以在沉积期间监测的传感器的示例包括但不限于质量流控制模块、压力传感器(例如压力计1210)、和位于输送系统、基座或卡盘中的热电耦(例如温度传感器1214)。适当程序设计的反馈和控制算法可以与来自这些传感器的数据一起使用,以维持所需的工艺条件。前文描述了本发明的实施方案在单室或多室半导体处理工具中的实施。
在一些实施方案中,可以通过一个以上等离子体监测器原位监测等离子体。在一种情况下,等离子体功率可以由一个以上电压、电流传感器(例如,VI探针)监测。在另一种情况下,等离子体密度和/或工艺气体浓度可以通过一个以上光学发射频谱传感器(OES)来测量。在一些实施方案中,一个以上等离子体参数可以基于来自这样的原位等离子体监测器的测量而通过编程方式调整。例如,OES传感器可用于反馈循环中,以提供对等离子体功率的编程控制。应当理解,在一些实施方案中,可以使用其他监测器来监测等离子体和其他工艺特性。这样的监测器可以包括但不限于红外(IR)监测器、声学监测器和压力传感器。
可以使用任何合适的室来实施所公开的实施方案。示例性的沉积装置包括但不限于来自系列产品、/>系列产品和/或/>系列产品的装置(每一者都可从加州弗蒙特的Lam Research Corp.获得)、或任何各种其他市售处理系统。两个以上站可以执行相同的功能。类似地,两个或更多站可以执行不同的功能。每个站都可以设计/配置为根据需要执行特定的功能/方法。
系统控制逻辑可以任何合适的方式进行配置。一般情况下,所述逻辑可被设计或配置在硬件和/或软件中。用于控制驱动电路的指令可被硬编码或作为软件提供。所述指令可通过“编程”提供。这样的编程被理解为包括任何形式的逻辑,该逻辑包括数字信号处理器、专用集成电路以及具有作为硬件实施的具体算法的其他装置中的硬编码逻辑。编程也被理解为包括可在通用处理器上执行的软件或固件指令。系统控制软件可以以任何合适的计算机可读编程语言编码。
用于控制工艺序列中的工艺的计算机程序代码可以任何常规的计算机可读编程语言:例如,汇编语言、C、C++、Pascal、Fortran或其它写入。由处理器执行编译后的目标代码或脚本以进行程序中识别的任务。还如所指示的,程序代码可以是硬编码的。
控制器参数涉及工艺条件,诸如例如工艺气体组成和流率、温度、压力、冷却气体压强、衬底温度和室壁温度。这些参数以配方的形式提供给用户,并且可利用用户界面输入。用于监控工艺的信号可以通过系统控制器的模拟和/或数字输入连接来提供。用于控制工艺的信号通过沉积装置的模拟和数字输出连接件输出。
所述系统软件可以许多不同的方式进行设计或配置。例如,可以写入多个室组件子程序或控制目标以控制根据公开的实施方式执行沉积工艺(以及在某些情况下,其他工艺)所需要的室部件的操作。用于此目的的程序或程序段的示例包括衬底定位代码、工艺气体控制代码、压力控制代码、以及加热器控制代码。
在一些实施方案中,控制器是系统的一部分,该系统可以是上述实施例的一部分。这样的系统包括半导体处理装置,半导体处理装置包括一个或多个处理工具、一个或多个室、用于处理的一个或多个平台、和/或特定的处理部件(晶片基座、气体流系统等)。这些系统可以与电子器件集成,以便在半导体晶片或衬底的处理之前、期间或之后控制这些系统的操作。电子器件可以被称为“控制器”,其可以控制一个或多个系统的各种组件或子部分。根据处理要求和/或系统的类型的不同,控制器可以被编程,以控制本发明所公开的工艺中的任何一些,包括控制处理气体的输送、温度设置(例如,加热和/或冷却)、压强设置、真空设置、功率设置、在一些系统中的射频(RF)发生器设置、RF匹配电路设置、频率设置、流率设置、流体输送设置、位置和操作设置、晶片的进出工具和其他传送工具和/或连接到特定系统的或与该系统接口的装载锁的传送。
从广义上讲,控制器可以被定义为接收指令、发出指令、控制操作、使能清洁操作、使能终点测量等的具有各种集成电路、逻辑、存储器、和/或软件的电子器件。该集成电路可以包括固件形式的存储程序指令的芯片、数字信号处理器(DSP)、定义为专用集成电路(ASIC)的芯片、和/或执行程序指令(例如,软件)的一个或多个微处理器或微控制器。程序指令可以是以各种不同的设置(或程序文件)形式输送到控制器的指令,不同的设置(或程序文件)定义用于在半导体晶片上或针对系统进行特定工艺的操作参数。在一些实施方案中,所述操作参数可以是由工艺工程师定义的用以完成在晶片的一个或多个(种)层、材料、金属、氧化物、硅、二氧化硅、表面、电路和/或裸芯片的制造过程中的一个或多个处理步骤的配方的一部分。
在一些实施方案中,控制器可以是与系统集成、耦接或者说是通过网络连接系统或它们的组合的计算机的一部分或者与该计算机耦接。例如,控制器可以在“云端”或者是晶片厂(fab)主计算机系统的全部或一部分,它们可以允许远程访问晶片处理。计算机可以启用对系统的远程访问以监测制造操作的当前进程,检查过去的制造操作的历史,检查多个制造操作的趋势或性能指标,以改变当前处理的参数,设置处理步骤以跟随当前的处理或者开始新的工艺。在一些实施例中,远程计算机(例如,服务器)可以通过网络给系统提供工艺配方,网络可以包括本地网络或互联网。远程计算机可以包括允许输入或编程参数和/或设置的用户界面,这些参数和/或设置然后从远程计算机传输到系统。在一些示例中,控制器接收数据形式的指令,这些指令指明在一个或多个操作期间将要执行的每个处理步骤的参数。应当理解这些参数可以针对将要执行的工艺类型以及工具类型,控制器被配置成连接或控制该工具类型。因此,如上所述,控制器可以例如通过包括一个或多个分立的控制器而分布,这些分立的控制器通过网络连接在一起并且朝着共同的目标(例如,本文所述的工艺和控制)工作。用于这些目的的分布式控制器的实例将是与一个或多个远程集成电路(例如,在平台水平或作为远程计算机的一部分)通信的在室内的一个或多个集成电路,它们结合以控制室内的工艺。
其他注意事项
示例性系统可以包括但不限于等离子体蚀刻室或模块、沉积室或模块、旋转冲洗室或模块、金属电镀室或模块、清洁室或模块、倒角边缘蚀刻室或模块、物理气相沉积(PVD)室或模块、化学气相沉积(CVD)室或模块、原子层沉积(ALD)室或模块、原子层蚀刻(ALE)室或模块、离子注入室或模块、轨道室或模块、以及在半导体晶片的制备和/或制造中可以关联的或使用的任何其他的半导体处理系统。
在本申请中,“半导体晶片”、“晶片”、“衬底”、“晶片衬底”、及“部分制造集成电路”的术语可互换地使用。本领域技术人员应理解“部分制造集成电路”的术语可指在其上制造集成电路的许多阶段中的任何一者期间的硅晶片。半导体设备产业中使用的晶片或衬底通常具有200或300mm的直径,尽管该产业正在朝着采用450mm直径的衬底的方向发展。本文的描述使用术语“前”和“后”来描述晶片衬底的不同侧。可以理解,前侧是大多数沉积和处理发生的地方,并且也是制造半导体设备本身的地方。后侧是晶片的相反侧,通常在制造期间经历最少的处理或不进行处理。
除非另有说明,否则此处提供的流率和功率电平适用于在300mm衬底上进行处理。本领域普通技术人员应理解,这些流和功率电平可以根据需要而针对其他尺寸的衬底进行调整。以下的详细描述假设本发明在晶片上实施。然而,本发明不限于此。工件可以具有各种形状、尺寸和材料。除了半导体晶片外,可以利用本发明的其他工件包括各种制品,例如印刷电路板及相似者。
本文描述的装置/工艺可以与光刻图案化工具或工艺结合使用,例如,用于制备或制造半导体器件、显示器、LED、光伏电池板等。通常,虽然不是必要地,这些工具/工艺将在共同的制造设施中一起使用或操作。膜的光刻图案化通常包括以下操作中的一些或所有,每个操作启用多个可行的工具:(1)使用旋涂或喷涂工具在工件,即,衬底上涂覆光致抗蚀剂;(2)使用热板或加热炉或紫外线固化工具固化光致抗蚀剂;(3)使用例如晶片步进器之类的工具使光致抗蚀剂暴露于可见光或紫外线或X射线;(4)使抗蚀剂显影以便选择性地去除抗蚀剂并且从而使用例如湿式清洗台之类的工具将其图案化;(5)通过使用干式或等离子体辅助蚀刻工具将抗蚀剂图案转印到下方的膜或工件上;并且(6)使用例如射频或微波等离子体抗蚀剂剥离器之类的工具去除抗蚀剂。
结论
虽然为了清楚理解的目的,已经在一定程度上详细描述了上述实施方案,但显而易见的是,某些变化和修改可在所附权利要求的范围内实施。应当注意,有实现本发明的实施方案的工艺、系统和设备的许多替代方式。因此,本发明的实施方案应被认为是说明性的而不是限制性的,并且这些实施方案并不受限于这里给出的细节。

Claims (47)

1.一种产生机器学习模型的方法,所述机器学习模型被配置成预测在处理处理室中的衬底期间或之后在所述衬底上的衬底参数值,所述方法包含:
接收训练数据,其包含,针对多个训练衬底中的每一者:(a)在训练衬底上执行的多步骤蚀刻工艺或多步骤沉积工艺的多步骤期间,从所述训练衬底在多个时间点原位收集的频谱数据,以及(b)表征所述训练衬底的至少一种物理性质的参数值,其中所述物理性质通过所述多步骤蚀刻工艺或通过所述多步骤沉积工艺修改;
从所述频谱数据提取特征,以提供所述训练衬底中的每一者的所述频谱数据的独立虚拟表示;以及
针对所述多个训练衬底中的每一者,通过使用所述频谱数据的所述独立虚拟表示以及表征所述训练衬底的至少一种物理性质的所述参数值来产生所述机器学习模型,
其中所述机器学习模型被配置成使用从测试衬底原位收集的频谱数据作为输入,预测经受所述多步骤蚀刻工艺或所述多步骤沉积工艺的所述测试衬底的所述衬底参数值。
2.根据权利要求1所述的方法,其中所述多步骤蚀刻工艺或所述多步骤沉积工艺包含至少两个不相连蚀刻步骤或至少两个不相连沉积步骤。
3.根据权利要求1所述的方法,其中所述多步骤蚀刻工艺或所述多步骤沉积工艺包含至少两个相连蚀刻步骤或至少两个相连沉积步骤。
4.根据权利要求1所述的方法,其还包含:
基于所述机器学习模型以及从所述测试衬底原位收集的所述频谱数据,改变所述多步骤蚀刻工艺或所述多步骤沉积工艺的中间步骤的持续期间。
5.根据权利要求1所述的方法,其中所述频谱数据包含自所述训练衬底原位收集的至少两类型的频谱。
6.根据权利要求1所述的方法,其中所述频谱数据包含从所述训练衬底原位收集的反射频谱。
7.根据权利要求1所述的方法,其中所述频谱数据包含从所述训练衬底原位收集的放射频谱。
8.根据权利要求1所述的方法,其中从所述频谱数据提取特征包含:以多项式拟合所述频谱数据。
9.根据权利要求1所述的方法,其中所述多步骤蚀刻工艺或所述多步骤沉积工艺是原子层蚀刻工艺。
10.根据权利要求1所述的方法,其中所述多步骤蚀刻工艺或所述多步骤沉积工艺是具有至少两个不相连的蚀刻步骤的等离子体蚀刻工艺。
11.根据权利要求1所述的方法,其中表征所述训练衬底的至少一种物理性质的所述参数值是蚀刻深度或沉积深度。
12.根据权利要求1所述的方法,其中表征所述训练衬底的至少一种物理性质的所述参数值是临界尺寸。
13.根据权利要求1所述的方法,其中表征所述训练衬底的至少一种物理性质的所述参数值是侧壁角度。
14.根据权利要求1所述的方法,其中表征所述训练衬底的至少一种物理性质的所述参数值是覆盖度。
15.根据权利要求1所述的方法,其中表征所述训练衬底的至少一种物理性质的所述参数值是在所述衬底上的凹入特征的临界尺寸。
16.根据权利要求1所述的方法,其中接收所述训练数据包含:针对所述多个训练衬底的每个训练衬底,接收表征所述训练衬底的多个物理性质的多个多个参数值,其中,产生所述机器学习模型包含:针对所述多个训练衬底中的每一者,使用表征所述训练衬底的所述多个物理性质的所述多个参数值,并且其中,所述机器学习模型被配置成预测经受所述多步骤蚀刻工艺的所述测试衬底的所述多个参数值。
17.根据权利要求1所述的方法,其中针对所述多个训练衬底中的每一者,所述训练数据还包含处理室的至少一个前馈参数,并且其中产生所述机器学习模型使用所述至少一个前馈参数。
18.根据权利要求17所述的方法,其中所述至少一个前馈参数选自由以下项组成的群组:在所述处理室中的温度、在所述处理室中的等离子体条件、在所述处理室中的压力、在所述处理室中的流率、一个或多个工艺步骤的持续时间、以及在所述处理室中的部件的设计和/或配置。
19.根据权利要求17所述的方法,其中所述至少一个前馈参数选自由来自以下参数组成的群组:(a)所述多步骤蚀刻工艺或所述多步骤沉积工艺的当前步骤、(b)在所述多步骤蚀刻工艺或所述多步骤沉积工艺的所述当前步骤之前的先前步骤、或者(c)在完成所述多步骤蚀刻工艺或所述多步骤沉积工艺的所述当前步骤之后的后续条件。
20.一种对在衬底上执行的多步骤蚀刻工艺或多步骤沉积工艺进行控制的方法,该方法包含:
(a)接收频谱数据,在处理室中执行的所述多步骤沉积工艺的多步骤期间或执行的所述多步骤蚀刻工艺的多步骤期间材料被沉积至所述衬底上或从所述衬底被蚀刻的同时,原位收集所述频谱数据;
(b)从所述衬底的所述频谱数据提取特征,以提供所述频谱数据的虚拟表示;
(c)使用机器学习模型处理所述虚拟表示,所述机器学习模型使用多个训练衬底的虚拟表示进行训练;以及
(d)通过使用所述机器学习模型的输出而在所述处理室中控制和/或调整工艺条件。
21.根据权利要求20所述的方法,其中所述控制和/或调整所述工艺条件包含:在所述多步骤沉积工艺或所述多步骤蚀刻工艺的最终步骤期间控制或调整时间长度。
22.根据权利要求20所述的方法,其中所述控制和/或调整所述工艺条件包含:在所述多步骤沉积工艺或所述多步骤蚀刻工艺的中间步骤期间控制或调整时间长度,所述中间步骤在所述多步骤沉积工艺或所述多步骤蚀刻工艺的最终步骤之前。
23.一种装置,其包含:
处理室,其被配置成保持衬底并且在所述衬底上执行多步骤蚀刻工艺或多步骤沉积工艺;
至少一个计量模块,其被配置成在所述衬底上执行的所述多步骤蚀刻工艺或所述多步骤沉积工艺的多个步骤期间在多个时间点从所述衬底原位产生频谱数据;以及
控制系统,其被配置为:
(a)接收频谱数据,在所述多步骤沉积工艺的多步骤期间将材料沉积于所述衬底上的同时、或者在所述多步骤蚀刻工艺的多步骤期间将材料从所述衬底移除的同时,使用所述至少一个计量模块原位收集所述频谱数据;
(b)从所述衬底的所述频谱数据提取特征,以提供所述频谱数据的虚拟表示;
(c)使用机器学习模型处理所述虚拟表示,所述机器学习模型使用多个训练衬底的虚拟表示进行训练;以及
(d)通过使用所述机器学习模型的输出而控制和/或调整所述处理室中的与所述多步骤蚀刻工艺或所述多步骤沉积工艺相关的工艺条件。
24.根据权利要求23所述的装置,其中所述控制系统被配置成在所述多步骤沉积工艺或所述多步骤蚀刻工艺的最终步骤期间控制或调整时间长度。
25.根据权利要求23所述的装置,其中所述控制系统被配置成控制和/或调整在所述多步骤沉积工艺或所述多步骤蚀刻工艺的中间步骤期间的时间长度,所述中间步骤是在所述多步骤沉积工艺或所述多步骤蚀刻工艺的最终步骤之前。
26.根据权利要求23所述的装置,其中所述控制系统还被配置为接收至少一个前馈参数,并且使用所述机器学习模型处理所述至少一个前馈参数、以及所述虚拟表示。
27.根据权利要求26所述的装置,其中所述至少一个前馈参数选自由以下项组成的群组:在所述处理室中的温度、在所述处理室中的等离子体条件、在所述处理室中的压力、在所述处理室中的流率、一个或多个工艺步骤的持续时间、以及在所述处理室中的部件的设计和/或配置。
28.根据权利要求26所述的装置,其中所述至少一个前馈参数选自由来自以下参数组成的群组:(a)所述多步骤蚀刻工艺或所述多步骤沉积工艺的当前步骤、(b)在所述多步骤蚀刻工艺或所述多步骤沉积工艺的所述当前步骤之前的先前步骤、或者(c)在完成所述多步骤蚀刻工艺或所述多步骤沉积工艺的所述当前步骤之后的后续条件。
29.一种在经受多步骤蚀刻工艺或多步骤沉积工艺的衬底上执行计量的方法,该方法包含:
(a)接收频谱数据,在处理室中执行的所述多步骤沉积工艺的多步骤期间或执行的所述多步骤蚀刻工艺的多步骤期间材料被沉积至所述衬底上或从所述衬底被蚀刻的同时,原位收集所述频谱数据;
(b)从所述衬底的所述频谱数据提取特征,以提供所述频谱数据的虚拟表示;
(c)使用机器学习模型处理所述虚拟表示,所述机器学习模型使用多个训练衬底的计量数据进行训练;以及
(d)使用所述机器学习模型的输出而提供所述衬底的原位计量值。
30.根据权利要求29所述的方法,其还包含:至少部分基于所述原位计量值,调整所述处理室的工艺设置。
31.根据权利要求30所述的方法,其中所述工艺设置是在所述处理室中的温度、在所述处理室中的等离子体条件、在所述处理室中的压力、在所述处理室中的流率、一个或多个工艺步骤的持续时间、在所述处理室中的部件的设计和/或配置、或其任何组合。
32.根据权利要求30所述的方法,其中所述工艺设置是用于(a)所述多步骤蚀刻工艺或所述多步骤沉积工艺的当前步骤、(b)在所述多步骤蚀刻工艺或所述多步骤沉积工艺的所述当前步骤之前的先前步骤、或者(c)在完成所述多步骤蚀刻工艺或所述多步骤沉积工艺的所述当前步骤之后的后续条件。
33.根据权利要求29所述的方法,其还包含:至少部分基于所述原位计量值,改变所述多步骤蚀刻工艺或所述多步骤沉积工艺的中间步骤的持续时间。
34.根据权利要求29所述的方法,其中所述频谱数据包含从所述处理室原位收集的至少两种类型的频谱。
35.根据权利要求29所述的方法,其中所述频谱数据包含从所述衬底原位收集的反射频谱。
36.根据权利要求29所述的方法,其中所述频谱数据包含从所述处理室原位收集的放射频谱。
37.根据权利要求29所述的方法,其中从所述频谱数据提取特征包含:以多项式拟合所述频谱数据、执行所述频谱数据的傅立叶变换、执行所述频谱数据的小波转换、对所述频谱数据使用峰谷算法、以及前述项的任何组合。
38.根据权利要求29所述的方法,其中所述多步骤蚀刻工艺或所述多步骤沉积工艺是原子层蚀刻工艺或原子层沉积工艺。
39.根据权利要求29所述的方法,其中所述多步骤蚀刻工艺或所述多步骤沉积工艺是具有至少两个非相连蚀刻步骤的等离子体蚀刻工艺。
40.根据权利要求29所述的方法,其中所述衬底的所述原位计量值包含所述衬底的蚀刻深度或沉积厚度。
41.根据权利要求29所述的方法,其中所述衬底的所述原位计量值包含在所述衬底上的特征的临界尺寸。
42.根据权利要求29所述的方法,其中所述衬底的所述原位计量值包含在所述衬底上的特征的侧壁角度。
43.根据权利要求29所述的方法,其中所述衬底的所述原位计量值包含在所述衬底上的特征的覆盖度。
44.一种装置,其包含:
处理室,其被配置成保持衬底并且在所述衬底上执行多步骤蚀刻工艺或多步骤沉积工艺;
至少一个传感器,其被配置成在所述衬底上执行的所述多步骤蚀刻工艺或所述多步骤沉积工艺的多个步骤期间在多个时间点从所述衬底原位产生频谱数据;以及
计量模块,其被配置为:
(a)接收频谱数据,在所述多步骤沉积工艺的多步骤期间将材料沉积于所述衬底上的同时、或者在所述多步骤蚀刻工艺的多步骤期间将材料从所述衬底移除的同时,使用所述至少一个计量模块原位收集所述频谱数据;
(b)从所述衬底的所述频谱数据提取特征,以提供所述频谱数据的虚拟表示;
(c)使用机器学习模型处理所述虚拟表示,所述机器学习模型使用多个训练衬底的计量数据进行训练;以及
(d)使用所述机器学习模型的输出,提供所述衬底的原位计量值。
45.根据权利要求44所述的装置,其还包含控制系统,该控制系统被配置成接收所述原位计量值,并且确定所述处理室的一个或多个工艺控制设置。
46.根据权利要求45所述的装置,其中所述一个或多个工艺控制设置包含:在所述处理室中的温度、在所述处理室中的等离子体条件、在所述处理室中的压力、在所述处理室中的流率、一个或多个工艺步骤的持续时间、或前述项的任何组合。
47.根据权利要求45所述的装置,其中所述一个或多个工艺控制设置包含用于以下项的工艺控制设置:(a)所述多步骤蚀刻工艺或所述多步骤沉积工艺的当前步骤、(b)在所述多步骤蚀刻工艺或所述多步骤沉积工艺的所述当前步骤之前的先前步骤、(c)在完成所述多步骤蚀刻工艺或所述多步骤沉积工艺的所述当前步骤之后的后续条件、或者(d)(a)-(c)的任何组合。
CN202180084154.1A 2020-12-15 2021-12-14 多步骤半导体制造工艺中的机器学习 Pending CN116583938A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US63/199,237 2020-12-15
US63/201,642 2021-05-06
US202163260532P 2021-08-24 2021-08-24
US63/260,532 2021-08-24
PCT/US2021/063222 WO2022132704A1 (en) 2020-12-15 2021-12-14 Machine-learning in multi-step semiconductor fabrication processes

Publications (1)

Publication Number Publication Date
CN116583938A true CN116583938A (zh) 2023-08-11

Family

ID=87545781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180084154.1A Pending CN116583938A (zh) 2020-12-15 2021-12-14 多步骤半导体制造工艺中的机器学习

Country Status (1)

Country Link
CN (1) CN116583938A (zh)

Similar Documents

Publication Publication Date Title
CN108281346B (zh) 从光谱的时间序列进行特征提取以控制工艺结束点的方法
KR102448687B1 (ko) 플라즈마 프로세싱 시스템들 및 진보된 프로세스 및 툴 제어를 모니터링하기 위한 방법들 및 시스템들
JP7269296B2 (ja) 方法およびエッチングシステム
EP3512977B1 (en) Method and process of implementing machine learning in complex multivariate wafer processing equipment
US20240096713A1 (en) Machine-learning in multi-step semiconductor fabrication processes
KR100904110B1 (ko) 기판 처리를 모니터링하기 위한 신경망 방법들 및 장치들
US20190049937A1 (en) Methods and apparatuses for etch profile optimization by reflectance spectra matching and surface kinetic model optimization
KR20220066367A (ko) 광 간섭계 및 반사계를 사용하여 반도체 장비의 자율적 (autonomous) 프로세스 제어 및 최적화를 위한 시스템들 및 방법들
JP7391859B2 (ja) プラズマチャンバ壁の状態のリアルタイム監視のための方法および装置
KR20170094094A (ko) 반사율 스펙트럼 매칭 및 표면 운동 모델 최적화에 의한 에칭 프로파일 최적화를 위한 방법들 및 장치들
JPWO2004019396A1 (ja) プラズマ処理方法及びプラズマ処理装置
US20240055282A1 (en) Systems and techniques for optical measurement of thin films
KR101475967B1 (ko) 인라인 리소그래피 및 에칭 시스템에서의 복수의 웨이퍼 처리 방법 및 웨이퍼 처리 플랫폼
US20220334554A1 (en) Large spot spectral sensing to control spatial setpoints
CN116583938A (zh) 多步骤半导体制造工艺中的机器学习
US20240255858A1 (en) In situ sensor and logic for process control
WO2024124053A1 (en) Processing tool with hyperspectral camera for metrology-based analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination