CN116057547A

CN116057547A - 用于概念漂移减轻的方法和设备

Info

Publication number: CN116057547A
Application number: CN202180058140.2A
Authority: CN
Inventors: E·库利拉吉斯; C·兰吉亚; J·M·冈萨雷斯韦斯卡; A·尤普马
Original assignee: ASML Holding NV
Current assignee: ASML Holding NV
Priority date: 2020-08-06
Filing date: 2021-07-07
Publication date: 2023-05-02
Also published as: US20230252347A1; TWI777678B; TW202209009A; WO2022028805A1

Abstract

用于调适机器学习架构的分布模型的方法和设备。所述分布模型用于减轻概念漂移的影响，并且被配置成提供输出以作为至所述机器学习架构的功能模型的输入。所述功能模型用于执行机器学习任务。所述方法包括：获得第一数据点；和提供所述第一数据点作为至所述分布模型的一个或更多个分布监测组元的输入。已经基于多个另外的数据点来训练所述一个或更多个分布监测组元。通过所述一个或更多个分布监测组元中的至少一个分布监测组元来确定表示所述第一数据点与所述多个另外的数据点之间的对应性的指标。基于所述误差指标，调适所述分布模型的所述输出。

Description

用于概念漂移减轻的方法和设备

相关专利申请的交叉引用

本申请要求于2020年8月06日递交的欧洲申请20189744.4和于2020年8月25日递交的欧洲申请20192534.4的优先权，并且这些欧洲申请的全部内容通过引用并入本文中。

技术领域

本发明涉及用于检测和/或减轻机器学习模型的概念漂移的影响的方法和设备。特别地，本发明涉及调适被配置成提供输出至用于执行机器学习任务的功能模型的分布模型。

背景技术

光刻设备是被构造成将期望的图案施加至衬底上的机器。光刻设备可以用于(例如)集成电路(IC)的制造中。光刻设备可以例如将图案形成装置(例如，掩模)处的图案(常常也称为“设计布局”或“设计”)投影至被设置在衬底(例如，晶片)上的辐射敏感材料(抗蚀剂)层上。

为了将图案投影于衬底上，光刻设备可以使用电磁辐射。这种辐射的波长确定可以形成在衬底上的特征的最小大小。当前在使用中的典型波长是365nm(i线)、248nm、193nm和13.5nm。相比于使用例如具有193nm的波长的辐射的光刻设备，使用具有在4nm至20nm的范围内的波长(例如，6.7nm或13.5nm)的极紫外(EUV)辐射的光刻设备可以用于在衬底上形成较小的特征。

低k1光刻可以用于处理尺寸小于光刻设备的经典分辨率极限的特征。在这样的过程中，可以将分辨率公式表达为CD＝k1×λ/NA，其中，λ是所使用的辐射的波长，NA是光刻设备中的投影光学器件的数值孔径，CD是“临界尺寸”(通常是所印制的最小特征尺寸，但在这种情况下是半节距)且k1是经验分辨率因子。通常，k1越小，则在衬底上再现类似于由电路设计者规划的形状和尺寸以便实现特定电功能性和性能的图案变得越困难。为了克服这些困难，可以将复杂的微调步骤应用于光刻投影设备和/或设计布局。这些步骤包括(例如，)但不限于NA的优化、定制照射方案、使用相移图案形成装置、诸如设计布局中的光学邻近效应校正(OPC，有时也被称为“光学和过程校正”)的设计布局的各种优化，或通常被定义为“分辨率增强技术”(RET)的其它方法。或者，用于控制光刻设备的稳定性的严格控制回路可以用于改善在低k1下的图案的再现。

光刻设备可以具有量测工具，诸如量测设备和与其相关联的检查设备以用于测量光刻设备和由所述光刻设备图案化的衬底的特性。量测和检查设备可以测量并获得关于光刻设备、衬底和/或图案的数据。

众所周知，光刻设备和/或量测设备的性质和行为可以随时间变化。这可以产生被称为用于光刻设备和/或量测工具的预测性分析和/或监测的机器学习系统中的概念漂移的现象。概念漂移可以由于光刻设备自身的变化而发生，和/或可以由量测工具的变化而引起。

概念漂移提出对与光刻系统相关的机器学习模型的挑战。这样的模型可以与光刻图案化过程相关，并且常常基于与光刻设备相关的数据(包括通过量测工具获得的数据)来训练。概念漂移可能降低模型的性能且可能使模型成为过时的，这是因为系统的特性和性质远离对模型进行训练时所基于的那些特性和性质。

发明内容

本发明的目标是提供一种用于调适机器学习架构的分布模型的方法。分布模型可以用于减轻概念漂移的影响。分布模型可以被配置成提供输出作为至机器学习架构的功能模型的输入。功能模型可以用于执行机器学习任务。所述方法包括：获得第一数据点；提供所述第一数据点作为至所述分布模型的一个或更多个分布监测组元的输入。已经基于多个另外的数据点来训练所述一个或更多个分布监测组元。通过所述一个或更多个分布监测组元中的至少一个分布监测组元来确定表示所述第一数据点与所述多个另外的数据点之间的对应性的指标。基于所述误差指标，调适所述分布模型的所述输出。

可选地，调适分布模型的输出可以包括：如果通过至少一个分布监测组元所确定的指标超过漂移阈值，则产生与数据点相关联的训练分布监测组元。

可选地，所述方法还可以包括：基于后续数据点来训练所述训练分布监测组元，所述后续数据点是通过至少一个分布监测组元针对所述后续数据点所确定的指标超过漂移阈值的数据点。

可选地，训练分布监测组元可以被配置成确定另外的指标。当另外的指标低于训练阈值时可以完成训练分布监测组元的训练。

可选地，所述方法还可以包括：在训练完成之后将训练分布监测组元增加至机器学习架构的一个或更多个分布监测组元。

可选地，调适分布模型的输出可以包括输出两个或更多个分布监测组元的加权组合。

可选地，加权组合可以包括与所述两个或更多个分布监测组元的指标成反比的加权平均值。

可选地，分布模型的输出可以考虑所述多个数据点的一个或更多个先前的数据点的分布模型输出。

可选地，分布监测组元可以包括输出反映数据点匹配与分布监测组元相关联的已知数据分布的良好程度的指标的机器学习算法。

可选地，指标可以包括第一数据点与通过一个或更多个分布监测组元所产生的第一数据点的重构之间的相关度的量度。

可选地，一个或更多个分布监测组元可以包括自动编码器、变分自动编码器、孤立森林、一类支持向量机中的一个或更多个，并且其中，指标包括重构误差。

可选地，功能模型可以包括配置成进行机器学习任务的一个或更多个功能组元。

可选地，一个或更多个功能组元可以被链接至一个或更多个分布监测组元。分布模型的输出可以包括待在进行机器学习任务时使用的一个或更多个功能组元的指令。

可选地，分布模型的输出可以指示功能模型使用两个或更多个功能组元的加权组合。

可选地，所述方法还可以包括基于增加的分布监测组元来产生机器学习架构的新的功能组元。

可选地，第一数据点和/或多个另外的数据点可以与光刻过程相关联。

可选地，机器学习任务可以包括执行与光刻过程相关联的预测性维护。

可选地，机器学习任务可以包括性能分类。

可选地，数据点可以具有缺失值。所述方法还可以包括：基于指标来确定填充缺失值的值；和将所确定的值增加至数据点。

根据本公开的另一方面，提供一种包括一个或更多个处理器和非暂时性储存介质的设备，所述非暂时性储存介质储存使所述一个或更多个处理器控制设备以执行如上文所阐述的方法的指令。

根据本公开的另一方面，提供一种包括上文所描述的设备的检查设备。

根据本公开的另一方面，提供一种包括上文所描述的设备的量测设备。

根据本公开的另一方面，提供一种包括上文所描述的设备的光刻设备。

根据本公开的另一方面，提供一种光刻单元，包括上文所描述的光刻设备。

附图说明

现在将参考随附附图，仅通过示例来描述本发明的实施例，在所述附图中：

-图1描绘光刻设备的示意图概略图；

-图2描绘光刻单元的示意图概略图；

-图3描绘整体光刻的示意性表示，该示意性表示描述用于优化半导体制造的三种关键技术之间的协作；

-图4描绘示出概念漂移的示例类型的图表；

-图5描绘用于调适机器学习架构的分布模型的方法中的步骤的流程图；

-图6描绘根据示例性实现方式的分布模型接收并处理数据点的方法中的步骤的流程图；

-图7描绘用于执行机器学习任务从而减轻概念漂移的影响的方法中的步骤的流程图；以及

-图8描绘数据集中的随时间变化的概念漂移的示意性示例的图表。

具体实施方式

在本文献中，术语“辐射”和“束”用于涵盖所有类型的电磁辐射，包括紫外幅射(例如，具有为365nm、248nm、193nm、157nm或126nm的波长)和EUV(极紫外辐射，例如具有在约5nm至100nm的范围内的波长)。

如本文中所采用的术语“掩模”、“掩模版”或“图案形成装置”可以广义地解释为是指可以用于向入射辐射束赋予图案化横截面的通用图案形成装置，所述图案化横截面对应于待在衬底的目标部分中产生的图案。在这样的情境下，也可以使用术语“光阀”。除典型掩模(透射式或反射式，二元、相移、混合式等)以外，其它这样的图案形成装置的示例包括可编程反射镜阵列和可编程LCD阵列。

图1示意性地描绘光刻设备LA。光刻设备LA包括：照射系统(也称为照射器)IL，所述照射系统被配置成调节辐射束B(例如，UV辐射、DUV辐射或EUV辐射)；掩模支撑件(例如，掩模台)MT，所述掩模支撑件被构造成支撑图案形成装置(例如，掩模)MA且连接至被配置成根据某些参数来准确地定位所述图案形成装置MA的第一定位器PM；衬底支撑件(例如，晶片台)WT，所述衬底支撑件被构造成保持衬底(例如，涂覆有抗蚀剂的晶片)W且连接至被配置成根据某些参数来准确地定位所述衬底支撑件的第二定位器PW；和投影系统(例如，折射型投影透镜系统)PS，所述投影系统被配置成将由图案形成装置MA赋予至辐射束B的图案投影至衬底W的目标部分C(例如，包括一个或更多个管芯)上。

在操作中，照射系统IL例如经由束传递系统BD从辐射源SO接收辐射束。照射系统IL可以包括用于引导、成形和/或控制辐射的各种类型的光学部件，诸如折射型、反射型、磁性型、电磁型、静电型和/或其它类型的光学部件，或其任何组合。照射器IL可以用于调节辐射束B，以在图案形成装置MA的平面处在其横截面中具有期望的空间和角强度分布。

本文中所使用的术语“投影系统”PS应被广义地解释为涵盖适于所使用的曝光辐射和/或适于诸如浸没液体的使用或真空的使用之类的其它因素的各种类型的投影系统，包括折射型、反射型、反射折射型、变形型、磁性型、电磁型和/或静电型光学系统或其任何组合。可以认为本文中对术语“投影透镜”的任何使用与更上位的术语“投影系统”PS同义。

光刻设备LA可以属于这样一种类型：其中，衬底的至少一部分可以由具有相对高折射率的液体(例如，水)覆盖，以便填充投影系统PS与衬底W之间的空间一这也称为浸没光刻术。在以引用方式并入本文中的US6952253中给出关于浸没技术的更多信息、。

光刻设备LA也可以属于具有两个或更多个衬底支撑件WT(又称为“双平台”)的类型。在这样的“多平台”机器中，可以并行地使用衬底支撑件WT，和/或可以对位于衬底支撑件WT中的一个衬底支撑件上的衬底W进行准备衬底W的后续曝光的步骤的同时将另一衬底支撑件WT上的另一衬底W用于在另一衬底W上曝光图案。

除了衬底支撑件WT以外，光刻设备LA也可以包括测量平台。测量平台被布置成保持传感器和/或清洁装置。传感器可以被布置成测量投影系统PS的性质或辐射束B的性质。测量平台可以保持多个传感器。清洁装置可以被布置成清洁光刻设备的部分，例如，投影系统PS的部分或提供浸没液体的系统的部分。测量平台可以在衬底支撑器WT远离投影系统PS时在投影系统PS下方移动。

在操作中，辐射束B入射至保持在掩模支撑件MT上的图案形成装置MA(例如，掩模)，并且通过呈现于图案形成装置MA上的图案(设计布局)进行图案化。在已横穿掩模MA的情况下，辐射束B穿过投影系统PS，所述投影系统PS将所述束聚焦至衬底W的目标部分C上。借助于第二定位器PW和位置测量系统IF，可以准确地移动衬底支撑件WT，例如以便在聚焦且对准的位置处在辐射束B的路径中定位不同的目标部分C。类似地，第一定位器PM和可能地另一位置传感器(另一位置传感器未在图1中明确地描绘)可以用于相对于辐射束B的路径来准确地定位图案形成装置MA。可以使用掩模对准标记M1、M2和衬底对准标记P1、P2来对准图案形成装置MA与衬底W。虽然如所图示的衬底对准标记P1、P2占据专用目标部分，但衬底对准标记P1、P2可以位于目标部分之间的空间中。在衬底对准标记P1、P2位于目标部分C之间时，这些衬底对准标记称为划线对准标记。

如图2中示出的，光刻设备LA可以形成光刻单元LC(有时也称为光刻元或(光刻)簇)的部分，所述光刻单元LC通常也包括用于对衬底W进行曝光前过程和曝光后过程的设备。常规地，这些设备包括用于沉积抗蚀剂层的旋涂器SC、用于显影经曝光的抗蚀剂的显影器DE、例如用于调节衬底W的温度(例如，用于调节抗蚀剂层中的溶剂)的激冷板CH和焙烤板BK。衬底输送装置或机器人RO从输入/输出端口I/O1、I/O2拾取衬底W、在不同过程设备之间移动衬底W且将衬底W传递至光刻设备LA的进料台LB。光刻单元中常常也统称为轨道或涂覆显影系统的装置通常处于轨道或涂覆显影系统控制单元TCU的控制下，所述轨道或涂覆显影系统控制单元自身可以通过管理控制系统SCS而被控制，所述管理控制系统也可以例如经由光刻控制单元LACU控制光刻设备LA。

为了正确且一致地曝光由光刻设备LA曝光的衬底W，期望检查衬底以测量经图案化的结构的性质，诸如后续层之间的重叠误差、线厚度、临界尺寸(CD)等等。出于这种目的，可以在光刻单元LC中包括检查工具(未示出)。如果检测到误差，则可以对后续衬底的曝光或对待对衬底W执行的其它处理步骤进行例如调整，在同一批量或批次的其它衬底W仍待曝光或处理之前进行检查的情况下尤其如此。

也可以被称为量测设备的检查设备用于确定衬底W的性质，并且具体地，确定不同衬底W的性质如何变化或与同一衬底W的不同层相关联的性质在层与层间如何变化。检查设备可以替代地构造成识别衬底W上的缺陷，并且可以例如为光刻单元LC的一部分，或可以集成至光刻设备LA中，或甚至可以是独立的装置。检查设备可以测量潜像(在曝光之后在抗蚀剂层中的图像)上的性质，或半潜像(在曝光后焙烤步骤PEB之后在抗蚀剂层中的图像)上的性质，或经显影的抗蚀剂图像(其中，抗蚀剂的曝光部分或未曝光部分已被移除)上的性质，或甚至经蚀刻的图像(在诸如蚀刻的图案转印步骤之后)上的性质。

通常光刻设备LA中的图案化过程是在处理中的最关键的步骤之一，该最关键的步骤之一需要衬底W上的结构的尺寸标定和放置的高准确度。为了确保这种高准确度，可以将三个系统组合于所谓的“整体”控制环境中，如图3中示意性地描绘的。这些系统中的一个系统是光刻设备LA，所述光刻设备(实际上)连接至量测工具MT(第二系统)且连接至计算机系统CL(第三系统)。这种“整体”环境的关键在于优化这三个系统之间的协作以增强总体过程窗口且提供严格控制回路，从而确保由光刻设备LA执行的图案化保持在过程窗口内。过程窗口定义一系列过程参数(例如，剂量、焦距、重叠)，特定制造过程在所述一系列过程参数内产生所定义的结果(例如，功能性半导体器件)，--光刻过程或图案化过程中的过程参数通常被允许在所述一系列过程参数内变化。

计算机系统CL可以使用待图案化的设计布局(的部分)以预测使用哪些分辨率增强技术且执行计算光刻模拟和计算以确定哪种掩模布局和光刻设备设置实现图案化过程的最大总体过程窗口(在图3中由第一刻度SC1中的双箭头描绘)。通常，分辨率增强技术被布置成匹配光刻设备LA的图案化可能性。计算机系统CL也可以用于检测光刻设备LA当前正在过程窗口内的何处操作(例如，使用来自量测工具MT的输入)以预测缺陷是否归因于例如次优处理而可以存在(在图3中由第二刻度SC2中的指向“0”的箭头描绘)。

量测工具MT可以将输入提供至计算机系统CL以实现准确的模拟和预测，并且可以将反馈提供至光刻设备LA以识别例如光刻设备LA的校准状态中的可能漂移(在图3中由第三刻度SC3中的多个箭头描绘)。

光刻设备LA用于图案化衬底。量测工具MT可以用于监测图案化过程，并检查经图案化的衬底。例如机器学习模型的模型可以用于处理与光刻过程相关联的数据，例如与光刻设备和/或相关量测工具MT相关的数据，该数据可以被称为光刻数据。例如，所述模型可以用于对设备进行分析、图案化过程选配方案设置、检查使用光刻设备LA制作的经图案化的衬底等等。通过处理光刻数据，模型可以执行包括以下各项的功能：提示更新过程设置；预测过程的整体或部分的未来行为(例如，用于预测性维护)；监测设备性能；等等。为了提供这些功能，模型可以基于关于光刻过程的知识来建立。例如，模型可以使用光刻数据来训练，光刻数据可以包括来自量测工具的数据和/或来自光刻设备LA的数据。光刻数据可以通过与光刻过程、衬底和经沉积图案相关的光刻设备LA和量测工具MT收集。

与光刻数据有关的一个挑战是概念漂移。在这样的情境下的概念漂移可以理解为包括由于光刻过程的一部分的变化而引起的光刻数据的逐渐和/或突然的变化。概念漂移可能起源于光刻设备LA自身，例如归因于内部部件的磨损，或设备内部的条件(例如，温度压力)的变化。概念漂移也可能由于衬底之间的差异，例如不同晶片批次之间的差异、用于曝光的沉积层的差异而发生。光刻数据变化的其它示例性原因可以包括量测工具MT的磨损或条件变化、误差、硬件变化(例如，替换部件)、软件和设置变化(例如，图案化选配方案更新/调整等)。概念漂移可能导致所获得的光刻数据偏离建立模型所基于的数据和信息。当概念漂移发生时，模型的性能可能降低，这是因为数据的结构不同于训练和/或设计模型所基于的数据的结构。这意味着模型性能可能随时间变化而降低且模型可能变得过时。

应注意，本文中提供的特定示例是在监测光刻过程中使用的机器学习系统。然而，这仅是一个特定布置且本发明不必限于这种示例。在一些布置中，本发明可以在其它情境下用于监测其它系统。

图4描绘数据中的概念漂移的示例类型的示意性表示。x轴示出时间且y轴示出四个图表402、404、406和408中的概念漂移的不同类型的以任意单位(a.u.)表示的数据点。

图表402示出突然漂移，在突然漂移中，存在从由前六个数据点表示的第一分布至由后六个数据点表示的第二分布的数据突变。顾名思义，变化是突然的且可能发生在单个时间点。第一分布和第二分布可以清楚地彼此分隔且在两个分布之间很少或可能不存在混合或叠置。

图表404示出逐渐漂移，在逐渐漂移中，可以存在两个清楚分开的分布。数据可以通过具有其中两个分开的分布的数据点都出现的一段时间而经历从第一分布至第二分布的逐渐移动。随着时间过去，当第一分布数据点的比例降低时第二分布数据点的比例增加。

在图表406中图示递增漂移。在这种类型的概念漂移中，分布之间的移位不是离散的，并且数据可以朝向不同的第二分布递增地演变。

图表408示出反复漂移(recurring drift)，在反复漂移中，数据可以多次在两个(或多于两个的)分布之间移动。例如，数据点可以在第一时间点从第一分布移动至第二分布。数据点可以在第二时间点从第二分布移动回至第一分布。应理解，可以出现图表402至图表408中示出的示例的组合和变化。概念漂移不限于两个分布，并且也可以出现第三、第四、第五等分布。

图4中所图示的示例性分布可以表示可能发生在系统(诸如光刻设备LA)中的概念漂移的不同类型。例如，递增漂移406可以表示例如设备中的一个或更多个部件随时间变化的逐渐磨损，或操作条件(例如，温度、压力)的变化。如402中所图示的突然漂移可以表示有意或无意的突然变化。例如，突然漂移可以是晶片批次变化、掩模版设计变化、选配方案设置变化、在光刻曝光步骤外部的图案化过程的变化、机器中的新的/替代的部件的引入或机器的突然损坏的结果。逐渐漂移404可以例如是部件的故障的指示，其中，一些数据点对应于表示部件的故障状态的分布，并且一些数据点对应于表示名义状态的分布。

已建议通过定期使用设置时间窗口来训练和重新训练模型而隐含地处理概念漂移。然而，这可能是时间和/或计算密集型的。这种方法可以具有依赖于独立于概念漂移自身的任何出现的设置时间窗口的另外的缺点。因为概念漂移是非预期现象，因此可能难以预测概念漂移将在何时和/或如何发生。如果用于更新模型的时间窗口集合与概念漂移变化相比太大，则更新将不准确地捕获数据漂移，并且模型性能将不可靠且被概念漂移不利地影响。

本文中所描述的是用于检测数据集中的概念漂移的方法和设备。方法和设备可以被布置成调适机器学习架构的模型。模型可以被称为分布模型。分布模型还可以用于通知和引导一个或更多个其它功能模型，该一个或更多个其它功能模型使用数据集用于执行任务或功能。任务可以是机器学习任务。特别地，分布模型可以向一个或更多个功能模型提供关于如何处理所检测的概念漂移的信息和引导。机器学习架构因此包括一个或更多个分布模型和一个或更多个功能模型。一个或更多个功能模型可以被配置成接收并处理形成数据集的多个数据点。机器学习架构可以被配置成在将数据点传递至功能模型之前使用分布模型处理所接收的数据点。使用分布模型处理数据点可以允许机器学习架构将关于概念漂移的信息与数据点一起提供至功能模型。

图5描绘用于调适机器学习架构的分布模型的方法的流程图。机器学习架构可以被理解为软件和(可选地)硬件的系统，该系统包括至少一个机器学习模型。在本文中所公开的示例性布置中，机器学习架构包括分布模型和功能模型。分布模型可以用于减轻概念漂移的影响。分布模型被配置成向功能模型提供输出。被提供为至功能模型的输入的输出可以辅助功能模型减轻概念漂移的影响。所述功能模型用于执行机器学习任务。在步骤502中获得第一数据点。在步骤504中，第一数据点可以作为输入提供至分布模型的一个或更多个分布监测组元。已经基于多个另外的数据点来训练所述一个或更多个分布监测组元。在步骤506中，一个或更多个分布监测组元中的至少一个分布监测组元确定表示第一数据点与已经训练分布监测组元所基于的多个另外的数据点之间的对应性的指标。在步骤508中，基于指标来调适分布的输出。调适分布模型的输出可以涉及调适分布模型自身，例如分布模型的架构。调适分布模型的输出可以涉及调适通过分布模型输出的值。

上文所描述的方法的优点为分布模型可以用于检测并监测概念漂移，并且可以将这种信息馈入至功能模型以使得步骤可以被采取用于功能模型以减轻概念漂移的影响。当概念漂移发生时，方法允许分布模型调适自身以处理概念漂移。例如，分布模型可以产生可能基于后续数据点来训练的另外的分布监测组元。

机器学习架构可以包括另外的元件，例如模型、数据库、表等中的一个或更多个。机器学习架构可以是意图执行与光刻设备LA或整体光刻系统相关的机器学习任务的系统。

如上文关于图4所描述的，概念漂移可以表示在不同分布之间移动的数据点及其相关联的系统。分布模型可以通过接收数据点和比较该数据点与可能先前已获得的另外的数据点来检测概念漂移。多个先前的另外的数据点可以在没有呈现概念漂移时用于构建用于数据点的预期行为的图像(分布)。在系统己获得预期数据点行为的想法后，系统可以使用新的数据点与这种预期行为的比较以确定概念漂移是否已经发生。预期行为可以与数据点分布相关联。可能将不同的预期行为识别为不同的分布。

为了实现数据点与预期数据行为的比较，分布模型可以包括一个或更多个分布监测组元。每个组元可以被配置成识别与预期行为相关联的先前识别的分布。数据点可以被提供至分布模型的一个或更多个分布监测组元中的每个分布监测组元。每个分布监测组元可以提供指示数据点是否良好地匹配分布和/或数据点匹配分布的良好程度的输出。在一个示例实现方式中，如果分布监测组元中的一个分布监测组元发现所接收的数据点匹配先前识别的分布，则所述一个分布监测组元可以将所述数据点分类为属于匹配分布。如果一个或更多个分布监测组元中没有一个分布监测组元将所接收的数据点识别为形成其分布的部分，则这可以向新的分布指示数据的概念漂移。在另一示例性实现方式中，一个或更多个分布监测组元中的每个分布监测组元可以提供包括数据点与其分布的类似度的指示的输出。

来自分布监测组元的关于与先前识别的分布的数据点比较的输出可以通过分布模型来输出并提供至功能模型。替代地，分布模型组元的输出可以在通过分布模型自身输出之前被处理。在输出已经被分布模型提供之后，该处理可以另外或替代地通过机器学习架构中的元件来执行。处理可以例如包括确定数据点与一个或更多个分布的类似度的表示。这种表示可以用作概念漂移的量度。分布模型的输出(可选地，呈经处理的形式)可以被提供至功能模型。输出可以与数据点自身在一起被提供，以使得功能模型接收数据点和数据点的概念漂移的指示。

用于数据点并通过一个或更多个分布模型确定的指标可以包括多个指标组元。例如，每个分布监测组元可以具有相关联的指标组元。指标组元可以表示数据点匹配与对应分布监测组元相关联的先前识别的数据分布的良好程度的量度。可以针对分布监测组元中的每个分布监测组元来确定指标组元。可以针对漂移阈值来评估指标组元。漂移阈值可以通过系统的用户设置和/或可以由分布监测组元例如基于所确定的分布来确定。对于每个指标组元，漂移阈值可以是相同的。替代地，可以针对一个或更多个单独的分布监测组元独立地设置不同的漂移阈值。如果指标超过阈值，例如如果每个指标组元超过其相关联的漂移阈值，则这可以被视为概念漂移的指示。如果数据点不匹配所识别的分布中的任一个，则这种数据点可以被视为变化点。响应于变化点的检测，可以产生与数据点相关联的训练分布监测组元。

可以在训练分布监测组元可以被增加至分布模型之前训练所述训练分布监测组元。可以通过处理另外的数据点，和选择所述另外的数据点中的指标超过漂移阈值的数据点而获得训练数据。不匹配现有分布中的任一个分布的数据点可以被增加至训练分布监测组元的训练集。这种训练集可以用于训练所述训练分布监测组元。训练分布监测组元可以具有与已经形成分布模型的部分的一个或更多个分布监测组元相同的形式。训练分布监测组元可以被配置成确定指标组元。训练可以被确定为在训练分布监测组元的输出降至低于训练阈值之后完成。在示例性布置中，训练可以被确定为在训练分布监测组元的输出降至低于训练阈值至少某些倍数和/或至少某些百分比的倍数时完成。在训练分布监测组元的训练已经完成之后，训练分布监测组元可以作为分布监测组元增加至分布模型。后续数据点可以被提供为至所增加的分布监测组元的输入。识别、训练和增加新的分布监测组元的这种过程可以形成调适分布模型的输出的方法的一部分。

在概念漂移的初始检测与向分布模型增加新的分布监测组元之间，分布模型可以使用现有的分布监测组元的加权平均值来分类数据点。数据点以这种方式的分类可以是从分布模型至功能模型以用于进行机器学习任务的输出。替代地或另外，训练分布监测组元甚至可以在训练完成之前用于确定输出。如果训练分布监测组元的输出比从已经形成分布模型的部分的分布监测组元获得的结果更好，则除了来自分布监测组元的输出之外或作为来自分布监测组元的输出的替代方案，可以使用来自训练分布监测组元的输出。

如上文所描述的，通过分布模型确定的指标可以包括用于分布模型的一个或更多个分布监测组元中的每个分布监测组元的指标组元。指标和/或指标组元可以表示数据点和与分布监测组元相关联的数据分布的类似度的量度。指标组元可以例如包括误差指标，该误差指标表示所接收的数据点和与分布监测组元相关联的分布的预期行为之间的误差，或类似度的缺乏。

分布模型的输出可以包括数据点与一个或更多个分布监测组元中的每个分布监测组元的类似度的指示。输出可以例如包括一个或更多个分布监测组元的加权组合。权重可以表示数据点与相关联的分布的类似度。组合可以是与指标组元相关的加权平均值。例如，加权平均值可以与通过分布监测组元确定的误差指标成反比。

分布监测组元可以被配置成产生所接收的数据点的重构。指标和/或指标组元可以包括数据点与所产生的重构之间的相关度的量度。分布监测组元可以例如包括自动编码器(AE)。分布监测组元可以替代地或另外地包括变分自动编码器、孤立森林、一类支持向量机，或输出反映所接收的数据点匹配相关联的数据分布的良好程度的指标组元的任何其它算法。自动编码器或其上的变化可以被配置成确定所接收的数据点的重构。自动编码器接着可以确定指示数据点与数据点的重构之间的差异的重构误差。这种重构误差可以是通过自动编码器确定的指标组元。自动编码器可以被训练以重构特定分布的数据点，即，可以具有一些相似度或共享结构的数据点。对于(例如，由于概念漂移而)远离这些相似度和结构的数据点，重构将不是有效的且重构误差可能较大。因此，重构误差越大，从相关联的分布更大程度地移除数据点。

分布模型可以单独地、与另外的数据点分开地处理每个数据点。替代地，分布模型可以考虑一个或更多个(紧接地)先前的数据点，例如以检测趋势或识别概念漂移的类型，例如逐渐概念漂移、递增概念漂移。

图6描绘分布模型接收并处理数据点的示例性实施方法中的步骤的流程图。流程图图示可以依赖于通过分布模型对数据点的分析来调适分布模型的输出的不同方式。在步骤602中，数据点可以作为至分布模型的输入而被接收。在步骤604中，数据点可以由分布模型处理。作为处理的一部分，一个或更多个分布监测组元中的每个分布监测组元可以确定数据点是否匹配与分布监测组元相关联的数据分布。在步骤606中，方法可以确定是否检测到变化点，变化点不匹配现有数据分布中的任一个。如果情况是这样，则方法可以移动至步骤608，在步骤608中产生新的训练分布监测组元。训练分布监测组元可以在步骤610中被训练，如上文更详细地描述的。在被训练之后，新的分布监测组元可以在步骤612中被增加至分布模型的分布监测组元。

然而，如果在步骤606中，分布模型推断没有检测到变化点，则方法可以移动至步骤614中的监测阶段。在这样的情况下调适输出不涉及增加新的分布监测组元。替代地，在步骤616中可以通过确定用于表示数据点匹配相关联的分布的良好程度的分布监测组元中的一些或所有分布监测组元的加权组合和/或选择来调适输出。

直到新的分布监测组元的训练610和增加612已经完成，分布模式也可以将步骤614和616应用于被识别为变化点的数据点。替代地或另外地，可以由训练分布监测组元在训练完成之前确定输出。这种输出可以被增加至在步骤616中确定的加权组合。

在分布模型已经确定指标之后，可以通过产生和创建新的分布监测组元和/或通过确定分布监测组元中的两个或更多个分布监测组元的加权组合而调适所述模型的输出。这种输出可以被提供至功能模型。图7描绘其中步骤702至708对应于图5的步骤502至508的方法的流程图，所述方法导致调适分布模型的输出。在已经基于数据点的概念漂移的评估来调适分布模型输出之后，在步骤710中经调适的输出可以被提供至功能模型。在步骤710中，数据点也可以被提供至功能模型。在步骤712中，功能模型可以使用所接收的数据点和分布模型输出以执行机器学习任务。

功能模型可以包括一个或更多个功能组元。功能组元可以被配置成进行机器学习任务。功能组元可以链接至分布监测组元中的一个或更多个分布监测组元。在示例性实施例中，功能组元中的每个功能组元可以具有对应的分布监测组元。功能组元可能已被配置(例如，被训练)成处理匹配对应的分布监测组元的数据分布的数据点。功能模型可以包括一个或更多个随机森林。例如，每个功能组元可以包括基于不同的数据分布训练的随机森林。

如果产生新的训练分布监测组元，则可以经由分布模型的输出将这种新的训练分布监测组元通知功能模型。作为响应，功能模型可以产生对应的新的训练功能组元。可能基于通过分布模型收集的训练数据集来训练新的训练功能组元。可以使用本领域中已知的一种或更多种训练方法来执行训练。训练功能组元可以被产生并被训练以被配置成使用新识别的数据分布的数据来执行机器学习任务。在训练已经完成之后，训练功能组元可以作为新的功能组元增加至功能模型。

功能模型可以使用一个或更多个功能组元执行机器学习任务。如上文所描述的，分布模型可以提供两个或更多个分布监测组元的加权组合以作为输出。功能模型可以在同一加权组合中使用对应的功能组元的组合来确定机器学习任务。在另一示例性实现方式中，功能模型可以基于所接收的加权组合进行功能组元的选择。功能模型可以例如丢弃具有低于预定相关性阈值的权重的组元。功能模型可以例如选择具有高于预定相关性阈值的权重的功能组元。在另一示例中，功能模型可以在一些情况下选择单个功能组元。例如，这可以通过确定具有最大权重的功能组元的优势的范围(例如，通过确定与组合中的其它权重相比最大的权重的大小)来进行。如果优势的范围高于预定优势阈值，则功能模型可以确定使用与优势权重相对应的功能组元执行机器学习任务。限制所使用的功能组元的量可以具有减少用于执行机器学习任务的计算成本和/或时间成本的优点。上文提及的阈值可以例如通过机器学习架构的用户设置。

本文中所描述的方法和系统的优点可以是机器学习架构是自适应的。换句话说，机器学习架构可以能够检测概念漂移并调适机器学习架构的功能以减轻所检测的漂移的影响。分布模型和功能模型的调适由本文中所描述的机器学习架构的常规操作引起，并且没有其它干扰需要系统调适以减轻不同类型的所检测的概念漂移的影响。系统的自我调适可以允许机器学习架构处理数据点中的未预期的和/或先前未见过的行为。

本文中所描述的方法和系统的另外的优点可以是建模任务的智能型分配。机器学习模型的性能可以依赖于所述机器学习模型已经被训练和测试所基于的数据集。诸如功能模型的机器学习模型可以在接收与所述功能模型已经被训练所基于的数据点类似的数据点作为输入时更好地执行。类似的数据点在这种情况下可以理解为属于同一分布。

本文中所公开的机器学习架构可以用于数据预处理步骤。数据预处理的一个部分涉及解决数据集中具有缺失值的问题。例如，数据点可以包括与过程(诸如光刻过程)相关的多个数据值。分布模型和/或功能模型可以预期每个值存在于每个数据点中。机器学习模型可以不能够处理其中所述值中的一些值缺失的数据点。处理缺失值的示例性方式可以是利用等于用于所述值的数据集的均值、众数或中位值的值填充缺失值。该解决方案不考虑概念漂移，或不考虑可能存在多个不同的数据分布。机器学习架构可以用于基于数据点属于的分布的数据集来替换数据点的一个或更多个缺失值。可以基于不同的数据分布的加权组合来估算均值、众数或中位值，而不是估算整个数据集的均值、众数或中位值。可以通过机器学习架构的分布模型来执行一个或更多个缺失数据值的这种确定。

上文所描述的方法和系统可以与使用其中可能发生概念漂移的数据集执行的机器学习任务相关。数据可以涉及过程或设备。现在将更详细地描述与光刻图案化过程相关的示例。每个数据点可以包括与光刻过程相关的多个数据值。数据值的示例可以包括重叠、对准、调平、剂量、焦距、临界尺寸、温度、压力等的测量值。数据点中的所有值可以例如与相同衬底、在衬底上执行的相同曝光等相关。不同的数据点可以与不同的衬底、曝光层等相关。

图8是描绘数据集中的随时间变化的概念漂移的示意性示例的图表，所述图表图示机器学习架构的方法和功能。在时间t0处拾取数据集。在t0处，如本文中所描述的机器学习架构准备好使用。分布模型包括用于确定与数据分布A的相关度的一个经训练的分布监测组元A。分布A也具有功能模型的相关联的经训练的功能组元A。分布监测组元A可以被配置成识别属于数据分布A的数据点。可能已经基于仅包括属于数据分布A的数据点的训练数据集来训练功能组元A。

从时间t₀直到t₁，全部所接收的数据点被识别为属于分布A。在时间t₁处，归因于突然概念漂移而接收不属于数据分布A的数据点。数据点与分布A的失配是通过分布模型来识别的。例如，分布监测组元可以是当重构所接收的数据点时产生较大误差的自动编码器。识别新的数据分布B。产生训练分布监测组元B。来自分布B的另外的数据点被识别(例如，不适于分布A的数据点)并被增加至训练集以用于训练所述训练分布监测组元B。在被训练之后，分布监测组元B可以被增加至分布模型，所述分布模型现在包括两个分布监测组元A和B。另外，新的功能组元B可以被产生、基于属于数据分布B的数据点来训练，并被增加至功能模型。在被训练之后，分布监测组元B可以在t₁与t₂之间的时间段中识别属于数据分布B的数据点。

在t₂与t₃之间的时间段中，属于数据分布A的数据点可以通过分布监测组元A来识别。在时间t₃处，新的突然概念漂移发生。这种突然概念漂移可以被识别，这是因为自动编码器A和B都不能准确地重构数据点。类似于上述分布监测组元B，新的分布监测组元C被产生并被训练。相关联的功能组元C也可以被产生、被训练并被增加至功能模型。

在t₄与t₅之间的时间段中，发生从数据分布A至B的递增概念漂移。分布A和B两者可能已被发现。对应的分布监测组元A和B可能已完成其训练。用于A和B的分布监测组元可以提供指示每个数据点的数据分布如何从A递增地改变至B的输出。在全部时间段t₀至t₅期间，现有功能性模型的加权组合可以用于执行机器学习任务。功能组元的加权可以与对应的自动编码器的重构误差成反比。如果在递增漂移期间，数据点收敛至不匹配现有已知分布的分布，则这可以指示数据点已经递增地漂移至新的分布。这可以通过与所有现有数据分布具有不良匹配指标的数据点指示，并且其中，指标可以随时间变化而稳定。这可以引导分布模型训练并增加新的分布监测组元。

方法和机器学习架构可以用于受概念漂移影响的任何类型的任务。任务可以是与光刻过程相关的机器学习任务。示例过程可以与衬底检查和/或设备监测相关。第一示例性任务可以与经光刻图案化的衬底的品质评估相关。任务可以例如包括基于图案化品质来分类衬底。功能模型可以被配置成执行用于在光刻制造过程内进行决策的方法。决策可以例如为批准或丢弃衬底、改变未来的图案化设置等。可以已经使用机器学习(例如，神经网络、随机森林、深度学习)、优化、回归或统计技术中的一个或更多个来训练功能模型。数据点可以包括与重叠、焦距、临界尺寸、临界尺寸均匀性、热数据、压力数据和/或在衬底图案化期间光刻设备LA的其它环境数据等中的一个或更多个相关的值。

另一示例性任务可以与预测性维护相关，在预测性维护中可以监测设备的状态。监测状态可以用于尝试预测应执行何种类型维护和何时例如减少设备停工时间、设备故障和/或减少图案化品质。可以使用与设备自身相关的量测数据和/或由设备图案化的衬底的量测数据监测设备的状态。

在以下经编号的方面的列表中公开另外的实施例：

1.一种用于调适机器学习架构的分布模型的方法，所述分布模型用于减轻概念漂移的影响，所述分布模型被配置成提供输出以作为至所述机器学习架构的功能模型的输入，所述功能模型用于执行机器学习任务，所述方法包括：

获得第一数据点；

提供所述第一数据点作为至所述分布模型的一个或更多个分布监测组元的输入，其中，已经基于多个另外的数据点来训练所述一个或更多个分布监测组元；

通过所述一个或更多个分布监测组元中的至少一个分布监测组元来确定表示所述第一数据点与所述多个另外的数据点之间的对应性的指标；以及

基于所述误差指标，调适所述分布模型的所述输出。

2.根据方面1所述的方法，其中，调适所述分布模型的所述输出包括，如果通过所述至少一个分布监测组元所确定的所述指标超过漂移阈值，则产生与所述数据点相关联的训练分布监测组元。

3.根据方面2所述的方法，还包括：基于后续数据点来训练所述训练分布监测组元，所述后续数据点是由所述至少一个分布监测组元针对所述后续数据点所确定的所述指标超过所述漂移阈值的数据点。

4.根据方面3所述的方法，其中，所述训练分布监测组元被配置成确定另外的指标，并且其中，当所述另外的指标低于训练阈值时完成所述训练分布监测组元的所述训练。

5.根据方面3或4所述的方法，还包括：在所述训练完成之后将所述训练分布监测组元增加至所述机器学习架构的所述一个或更多个分布监测组元。

6.根据任一前述方面所述的方法，其中，调适所述分布模型的所述输出包括输出两个或更多个分布监测组元的加权组合。

7.根据方面6所述的方法，其中，所述加权组合包括与所述两个或更多个分布监测组元的所述指标成反比的加权平均值。

8.根据任一前述方面所述的方法，其中，所述分布模型的所述输出将所述多个数据点中的一个或更多个先前的数据点的所述分布模型输出考虑在内。

9.根据任一前述方面所述的方法，其中，所述分布监测组元包括机器学习算法，所述机器学习算法输出反映数据点匹配与所述分布监测组元相关联的已知数据分布的良好程度的指标。

10.根据任一前述方面所述的方法，其中，所述指标包括所述第一数据点与通过所述一个或更多个分布监测组元产生的所述第一数据点的重构之间的相关度的量度。

11.根据方面9或10所述的方法，其中，所述一个或更多个分布监测组元包括自动编码器、变分自动编码器、孤立森林、一类支持向量机中的一个或更多个，并且其中，所述指标包括重构误差。

12.根据任一前述方面所述的方法，其中，所述功能模型包括配置成执行所述机器学习任务的一个或更多个功能组元。

13.根据方面12所述的方法，其中，所述一个或更多个功能组元被链接至所述一个或更多个分布监测组元，并且其中，所述分布模型的所述输出包括待在执行所述机器学习任务时使用的一个或更多个功能组元的指令。

14.根据方面12至13中任一项所述的方法，其中，所述分布模型的所述输出指示所述功能模型使用两个或更多个功能组元的加权组合。

15.根据当从属于方面5时方面12至14中任一项所述的方法，还包括基于所述增加的分布监测组元来产生所述机器学习架构的新的功能组元。

16.根据任一前述方面所述的方法，其中，所述第一数据点和/或所述多个另外的数据点与光刻过程相关联。

17.根据任一前述方面所述的方法，其中，所述机器学习任务包括执行与光刻过程相关联的预测性维护。

18.根据任一前述方面所述的方法，其中，所述机器学习任务包括性能分类。

19.根据任一前述方面所述的方法，其中，所述数据点具有缺失值，并且其中，所述方法还包括：

基于所述指标确定填充所述缺失值的值；以及

将所确定的值增加至所述数据点。

20.一种包括一个或更多个处理器和储存指令的非暂时性储存介质的设备，所述指令使所述一个或更多个处理器控制所述设备以执行根据方面1至19中任一项所述的方法。

21.一种检查设备，包括根据方面20所述的设备。

22.一种量测设备，包括根据方面20所述的设备。

23.一种光刻设备，包括根据方面20所述的设备。

24.一种光刻单元，包括根据方面23所述的光刻设备。

25.一种包括指令的计算机程序产品，所述指令被配置成当在合适的设备上被执行时调适机器学习架构的分布模型，所述分布模型用于减轻概念漂移的影响，所述分布模型被配置成提供输出以作为至所述机器学习架构的功能模型的输入，所述功能模型用于执行机器学习任务，所述计算机程序被配置成：

获得第一数据点；

基于所述误差指标来调适所述分布模型的所述输出。

本文中所描述的方法和系统是在光刻过程的情境下设置的。然而，本领域技术人员将理解，用于检测数据集中的概念漂移和通知一个或更多个另外的模型使用数据集作为输入以处理概念漂移的系统适于其它类型的过程和应用。

虽然可以在本文中具体地参考在IC制造中光刻设备的使用，但应理解，本文中所描述的光刻设备可以具有其它应用。可能的其它应用包括制造集成光学系统、用于磁畴存储器的引导和检测图案、平板显示器、液晶显示器(LCD)、薄膜磁头，等等。

虽然可以在本文中具体地参考在光刻设备的情境下的本发明的实施例，但本发明的实施例可以用于其它设备中。本发明的实施例可以形成掩模检查设备、量测设备或测量或处理诸如晶片(或其它衬底)或掩模(或其它图案形成装置)的对象的任何设备的部件或一部分。这些设备一般可以被称为光刻工具。这种光刻工具可以使用真空条件或周围(非真空)条件。

虽然上文可能已经具体地参考在光学光刻术的情境下对本发明的实施例的使用，但应了解，在情境允许的情况下，本发明不限于光学光刻术，并且可以用于其它应用(例如，压印光刻术)中。

虽然上文已描述本发明的具体实施例，但将了解，可以以与所描述的方式不同的其它方式来实践本发明。以上描述意图是说明性的，而不是限制性的。由此，本领域技术人员将明白，可以在不背离下文所阐述的权利要求的范围的情况下对所描述的本发明进行修改。

虽然具体提及“量测设备/工具/系统”或“检查设备/工具/系统”，但这些术语可以指相同或类似类型的工具、设备或系统。例如，包括本发明的实施例的检查或量测设备可以用于确定在衬底上或在晶片上的结构的特性。例如，包括本发明的实施例的检查设备或量测设备可以用于检测衬底的缺陷或在衬底上或在晶片上的结构的缺陷。在这样的实施例中，衬底上的结构的所关注的特性可能涉及结构中的缺陷、结构的特定部分的不存在、或衬底上或晶片上的不想要的结构的存在。

Claims

获得第一数据点；

基于所述误差指标，调适所述分布模型的所述输出。

2.根据权利要求1所述的方法，其中，调适所述分布模型的所述输出包括：如果通过所述至少一个分布监测组元所确定的所述指标超过漂移阈值，则产生与所述数据点相关联的训练分布监测组元。

3.根据权利要求2所述的方法，还包括：基于后续数据点来训练所述训练分布监测组元，所述后续数据点是由所述至少一个分布监测组元针对所述后续数据点所确定的所述指标超过所述漂移阈值的数据点。

4.根据权利要求3所述的方法，还包括：在所述训练完成之后，将所述训练分布监测组元增加至所述机器学习架构的所述一个或更多个分布监测组元。

5.根据权利要求1所述的方法，其中，调适所述分布模型的所述输出包括输出两个或更多个分布监测组元的加权组合。

6.根据权利要求5所述的方法，其中，所述加权组合包括与所述两个或更多个分布监测组元的所述指标成反比的加权平均值。

7.根据权利要求1所述的方法，其中，所述分布模型的所述输出将所述多个数据点中的一个或更多个先前的数据点的分布模型输出考虑在内。

8.根据权利要求1所述的方法，其中，所述分布监测组元包括机器学习算法，所述机器学习算法输出反映数据点匹配与所述分布监测组元相关联的已知数据分布的良好程度的指标。

9.根据权利要求1所述的方法，其中，所述指标包括所述第一数据点与通过所述一个或更多个分布监测组元产生的所述第一数据点的重构之间的相关度的量度。

10.根据权利要求8或9所述的方法，其中，所述一个或更多个分布监测组元包括自动编码器、变分自动编码器、孤立森林、一类支持向量机中的一个或更多个，并且其中，所述指标包括重构误差。

11.根据权利要求1所述的方法，其中，所述功能模型包括配置成执行所述机器学习任务的一个或更多个功能组元。

12.根据权利要求11所述的方法，其中，所述一个或更多个功能组元被链接至所述一个或更多个分布监测组元，并且其中，所述分布模型的所述输出包括待在执行所述机器学习任务时使用的一个或更多个功能组元的指令。

13.根据权利要求11或12所述的方法，其中，所述分布模型的所述输出指示所述功能模型使用两个或更多个功能组元的加权组合。

14.根据权利要求4所述的方法，还包括基于增加的分布监测组元来产生所述机器学习架构的新的功能组元。

15.一种包括指令的计算机程序产品，所述指令被配置成当在合适的设备上被执行时调适机器学习架构的分布模型，所述分布模型用于减轻概念漂移的影响，所述分布模型被配置成提供输出以作为至所述机器学习架构的功能模型的输入，所述功能模型用于执行机器学习任务，所述计算机程序被配置成：

获得第一数据点；

基于所述误差指标来调适所述分布模型的所述输出。