KR20220038501A - 매개변수화된 모델 예측에서의 확실성을 증가시키는 방법 - Google Patents

매개변수화된 모델 예측에서의 확실성을 증가시키는 방법 Download PDF

Info

Publication number
KR20220038501A
KR20220038501A KR1020227007614A KR20227007614A KR20220038501A KR 20220038501 A KR20220038501 A KR 20220038501A KR 1020227007614 A KR1020227007614 A KR 1020227007614A KR 20227007614 A KR20227007614 A KR 20227007614A KR 20220038501 A KR20220038501 A KR 20220038501A
Authority
KR
South Korea
Prior art keywords
parameterized model
latent space
dimensional data
training
clusters
Prior art date
Application number
KR1020227007614A
Other languages
English (en)
Inventor
맥심 피사렌코
스콧 앤더슨 미들브룩스
코엔 아드리아누스 베르슈렌
Original Assignee
에이에스엠엘 네델란즈 비.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP19195954.3A external-priority patent/EP3789923A1/en
Application filed by 에이에스엠엘 네델란즈 비.브이. filed Critical 에이에스엠엘 네델란즈 비.브이.
Publication of KR20220038501A publication Critical patent/KR20220038501A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • G03F7/70483Information management; Active and passive control; Testing; Wafer monitoring, e.g. pattern monitoring
    • G03F7/70491Information management, e.g. software; Active and passive control, e.g. details of controlling exposure processes or exposure tool monitoring processes
    • G03F7/705Modelling or simulating from physical phenomena up to complete wafer processes or whole workflow in wafer productions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0454
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • G06N3/0472

Abstract

매개변수화된 모델 예측의 확실성을 증가시키는 방법이 설명된다. 본 방법은 매개변수화된 모델과 연관된 잠재 공간 내의 차원 데이터를 클러스터로 클러스터링하는 것을 포함한다. 상이한 클러스터들은 주어진 입력의 상이한 부분들에 대응한다. 본 방법은 매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 기반으로 출력을 예측하는 것을 포함한다. 본 방법은 매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 클러스터들 중 하나 이상에 대응하는 주어진 입력의 복구된 버전으로 변환하는 것을 포함한다. 일부 실시예에서, 본 방법은 어느 클러스터가 더 높은 분산을 갖는 예측된 출력과 대응하는지를 결정하는 것, 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것, 및/또는 매개변수화된 모델을 더 높은 분산과 연관된 결정된 클러스터들 또는 클러스터들의 부분들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 트레이닝하는 것을 더 포함한다.

Description

매개변수화된 모델 예측에서의 확실성을 증가시키는 방법
관련 출원에 대한 상호 참조
본 출원은 2019년 9월 6일에 출원된 EP 출원 19195954.3, 2019년 11월 19일에 출원된 EP 출원 19210026.1 및 2020년 7월 29일에 출원된 EP 출원 20188310.5의 우선권을 주장하며, 이들의 내용은 원용에 의해 전체적으로 본 명세서 내에 포함된다.
본 설명은 매개변수화된 모델 예측에서 확실성을 증가시키기 위한 장치 및 방법에 관한 것이다.
리소그래피 투영 장치는, 예를 들어 집적 회로(IC)의 제조에 사용될 수 있다. 이러한 경우에, 패터닝 디바이스 (예를 들어, 마스크)는 IC의 개별 층에 대응하는 패턴 ("디자인 레이아웃")을 포함하거나 제공할 수 있으며, 이 패턴은 패터닝 디바이스 상의 패턴을 통하여 타겟 부분을 조사하는 것과 같은 방법에 의하여, 방사선-민감성 재료("레지스트")의 층으로 코팅되어 있는 기판 (예를 들어, 실리콘 웨이퍼) 상의 (예를 들어, 하나 이상의 다이를 포함하는) 타겟 부분 상으로 전사될 수 있다. 일반적으로, 단일 기판은 복수의 인접한 타겟 부분을 포함하고 있으며, 패턴은 리소그래피 투영 장치에 의해 한 번에 하나의 타겟 부분씩 타겟 부분들로 연속적으로 전사된다. 한 유형의 리소그래피 투영 장치에서, 전체 패터닝 디바이스 상의 패턴은 한 번의 작동으로 하나의 타겟 부분 상으로 전사된다. 이러한 장치는 일반적으로 스테퍼로 지칭된다. 통상적으로 스텝-앤드-스캔(step-and-scan) 장치로 지칭되는 대안적인 장치에서, 투영 빔은 주어진 기준 방향 ("스캐닝" 방향)으로 패터닝 디바이스를 스캐닝하는 한편, 동시에 이 기준 방향과 평행하게 또는 역-평행하게(anti-parallel) 기판이 이동된다. 패터닝 디바이스 상의 패턴의 상이한 부분들이 점진적으로 한 타겟 부분으로 전사된다. 일반적으로, 리소그래피 투영 장치가 저감비(reduction ratio)(M)(예를 들어, 4)를 갖고 있을 것이기 때문에, 기판이 이동되는 속도(F)는 투영 빔이 패터닝 디바이스를 스캐닝하는 속도의 1/M 배일 것이다. 본 명세서에서 설명된 바와 같은 리소그래피 장치에 관한 더 많은 정보는, 예를 들어 원용에 의해 본 명세서 내에 포함된 US6,046,792로부터 얻어질 수 있다.
패턴을 패터닝 디바이스로부터 기판으로 전사하기 전에, 기판은 프라이밍(priming), 레지스트 코팅, 및 소프트 베이크와 같은 다양한 절차를 거칠 수 있다. 노광 후, 기판은 노광 후 베이크(PEB), 현상, 하드 베이크, 및 전사된 패턴의 측정/검사와 같은 다른 절차 ("노광 후 절차")을 거칠 수 있다. 이 일련의 절차는 디바이스, 예를 들면 IC의 개별 층을 만들기 위한 기초로 이용된다. 기판은 그후 에칭, 이온 주입(도핑), 금속화, 산화, 화학-기계적 연마 등과 같은 다양한 공정을 거칠 수 있으며, 이 모두는 디바이스의 개별 층을 마무리하도록 의도된 것이다. 디바이스에 여러 층이 필요한 경우, 그러면 전체 절차 또는 그 변형이 각 층에 대해 반복된다. 최종적으로, 기판 상의 각 타겟 부분에 디바이스가 존재할 것이다. 이 디바이스들은 그후 다이싱(dicing) 또는 소잉(sawing)과 같은 기술에 의하여 서로 분리되며, 그 곳에서 개별 디바이스들은 캐리어에 장착될 수 있거나, 핀에 연결될 수 있다.
따라서, 반도체 디바이스와 같은 디바이스를 제조하는 것은 전형적으로 디바이스의 다양한 피처(features) 및 복수의 층을 형성하기 위해 다수의 제조 공정을 이용하여 기판 (예를 들어, 반도체 웨이퍼)을 처리하는 것을 포함한다. 이러한 층 및 피처는 전형적으로, 예를 들어 적층, 리소그래피, 에칭, 화학-기계적 연마, 및 이온 주입을 이용하여 제조되고 처리된다. 복수의 디바이스가 기판 상의 복수의 다이 상에서 제조될 수 있으며, 그후 개별 디바이스들로 분리될 수 있다. 이 디바이스 제조 공정은 패터닝 공정으로 간주될 수 있다. 패터닝 공정은 패터닝 디바이스 상의 패턴을 기판으로 전사하기 위해, 리소그래피 장치 내의 패터닝 디바이스를 이용하는 광학 및/또는 나노임프린트 리소그래피와 같은 패터닝 단계를 포함하며, 또한 전형적으로, 하지만 선택적으로, 현상 장치에 의한 레지스트 현상, 베이크 툴을 사용한 기판의 베이킹, 에칭 장치를 사용한 패턴의 에칭 등과 같은 하나 이상의 관련 패턴 처리 단계를 포함한다. 하나 이상이 계측 공정이 전형적으로 패터닝 공정에 포함된다.
언급된 바와 같이, 리소그래피는 IC와 같은 디바이스의 제조에서 중심 단계이며, 여기서 기판에 형성된 패턴은 마이크로프로세서, 메모리 칩 등과 같은 디바이스의 기능 요소를 규정한다. 유사한 리소그래피 기술은 플랫 패널 디스플레이, 마이크로 전자 기계 시스템(MEMS) 및 기타 디바이스의 형성에도 사용된다.
반도체 제조 공정이 계속 발전함에 따라, 통상적으로 "무어(Moore)의 법칙"으로 지칭되는 추세에 따라 기능 요소의 치수는 지속적으로 감소되고 있는 반면, 디바이스마다 기능적 요소, 예를 들어 트랜지스터의 수는 수십 년 동안 꾸준히 증가하고 있다. 현재 기술 상태에서, 디바이스의 층은 심자외 조명 소스로부터의 조명을 이용하여 디자인 레이아웃을 기판 상으로 투영시키는 리소그래피 투영 장치를 사용하여 제조되어, 100㎚보다 훨씬 낮은, 즉 조명 소스 (예를 들어, 193㎚ 조명 소스)로부터의 방사선의 파장의 1/2보다 작은 치수를 갖는 개별적인 기능 요소를 생성한다.
리소그래피 투영 장치의 고전적인 분해능 한계보다 작은 치수를 가진 피처가 프린트되는 이 공정은 일반적으로 분해능 공식
Figure pct00001
에 따라 저-k1 리소그래피로 알려져 있으며, 여기서 λ는 사용되는 방사선의 파장 (현재 대부분의 경우에 248㎚ 또는 193㎚), NA는 리소그래피 투영 장치 내의 투영 광학계의 개구수, CD는 "임계 치수"-일반적으로, 프린트되는 가장 작은 피처 크기- 그리고 k1은 경험적인 분해능 인자이다. 일반적으로, k1이 작을수록, 특정한 전기적 기능 및 성능을 달성하기 위하여 회로 설계자에 의하여 계획된 형상 및 치수와 유사한 패턴을 기판 상에 재현하는 것이 더 어려워진다. 이 어려움을 극복하기 위하여 정교한 미세 조정(fine-tuning) 단계가 리소그래피 투영 장치, 디자인 레이아웃 또는 패터닝 디바이스에 적용된다. 이는, 예를 들어 NA와 광학 간섭성 설정의 최적화, 맞춤형 조명 스킴(customized illumination schemes), 위상 시프팅 패터닝 디바이스의 사용, 디자인 레이아웃에서의 광학 근접 보정(OPC, 때로는 "광학 및 공정 보정"으로도 지칭됨), 또는 일반적으로 "분해능 향상 기술"(RET)로서 규정된 다른 방법을 포함하지만, 이에 제한되지는 않는다. 본 명세서에 사용된 바와 같은 용어 "투영 광학계"는 예를 들어 굴절식 광학계, 반사식 광학계, 개구 및 반사굴절 광학계를 포함하는, 다양한 유형의 광학 시스템을 포함하는 것으로 광범위하게 해석되어야 한다. 용어 "투영 광학계"는 또한 방사선의 투영 빔을 집합적으로 또는 단독으로 지향시키고, 성형하고 또는 제어하기 위하여 이 디자인 유형들 중 임의의 것에 따라 작동하는 구성 요소를 포함할 수 있다. 용어 "투영 광학계"는 광학 구성 요소가 리소그래피 투영 장치의 광학 경로 상의 어디에 위치하는지에 상관없이 리소그래피 투영 장치 내의 임의의 광학 구성 요소를 포함할 수 있다. 투영 광학계는 방사선이 패터닝 디바이스를 통과하기 전에 소스로부터의 방사선을 성형, 조정, 및/또는 투영하기 위한 광학 구성 요소, 및/또는 방사선이 패터닝 디바이스를 통과한 후에 방사선을 성형, 조정, 및/또는 투영하기 위한 광학 구성 요소를 포함할 수 있다. 투영 광학계는 일반적으로 소스와 패터닝 디바이스는 배제한다.
실시예에 따르면, 매개변수화된 모델 예측을 하기 위한 방법이 제공된다. 본 방법은 매개변수화된 모델로, 매개변수화된 모델과 연관된 잠재 공간 내의 차원 데이터를 클러스터로 클러스터링하는 것을 포함한다. 상이한 클러스터들은 주어진 입력의 상이한 부분들에 대응한다. 본 방법은 매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 기반으로 출력을 예측하는 것을 포함한다. 본 방법은 매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 클러스터들 중 하나 이상에 대응하는 주어진 입력의 복구된 버전으로 변환하는 것을 포함한다.
일부 실시예에서, 예측하는 것과 변환하는 것은 동시적이다.
일부 실시예에서, 잠재 공간 내의 차원 데이터는 주어진 입력의 복구된 버전으로 변환되어 잠재 공간의 관심 대상 지점의 시각화를 용이하게 한다.
일부 실시예에서, 본 방법은 잠재 공간 내의 관심 대상 지점을 식별하는 것을 더 포함한다.
일부 실시예에서, 관심 대상 지점은 잠재 공간 내의 다른 지점, 클러스터 내부에 위치하지 않는 지점, 또는 잠재 공간 내의 다른 지점들 및/또는 다른 클러스터들 간의 직교 거리(cartesian distance)와 비교하여 잠재 공간 내의 하나 이상의 다른 지점 및/또는 클러스터에서 비교적 멀리 있는 직교 거리에 위치된 지점과 비교하여, 상대적으로 높은 분산 또는 불확실성을 갖는 지점들 중 하나 이상을 포함한다.
일부 실시예에서, 본 방법은 매개변수화된 모델의 성능을 평가하기 위해 관심 대상 지점, 클러스터, 주어진 입력의 복구된 버전, 및/또는 출력을 사용하는 것을 더 포함한다.
일부 실시예에서, 본 방법은 매개변수화된 모델로, 주어진 입력과 연관된 더 높은 차원 데이터를 잠재 공간 내의 차원 데이터로 변환하는 것을 더 포함한다.
일부 실시예에서, 매개변수화된 모델은 기계 학습 모델이다. 일부 실시예에서, 매개변수화된 모델은 인코더-디코더 아키텍처를 포함한다. 일부 실시예에서, 인코더-디코더 아키텍처는 변분 인코더-디코더 아키텍처를 포함하며, 본 방법은 출력 공간의 구현을 생성하는 확률적 잠재 공간으로 변분 인코더-디코더 아키텍처를 트레이닝하는 것을 포함한다.
일부 실시예에서, 잠재 공간은 저차원 인코딩을 포함한다.
일부 실시예에서, 잠재 공간 내의 차원 데이터는 인코더-디코더 아키텍처의 인코더에 의하여 인코딩된다.
일부 실시예에서, 출력은 인코더-디코더 아키텍처의 제1 부분으로, 잠재 공간 내의 차원 데이터를 기반으로 예측된다. 일부 실시예에서, 인코더-디코더 아키텍처의 제1 부분은 제1 디코더이다. 일부 실시예에서, 잠재 공간 내의 차원 데이터는 인코더-디코더 아키텍처의 제2 디코더에 의하여, 주어진 입력의 복구된 버전으로 변환된다.
일부 실시예에서, 주어진 입력은 이미지, 클립, 인코딩된 이미지, 인코딩된 클립, 또는 반도체 제조 공정과 연관된 매개변수화된 모델의 이전 층으로부터의 데이터 중 하나 이상을 포함한다. 일부 실시예에서, 주어진 입력은 타겟 패턴 디자인, 결함, 또는 반도체 제조 공정을 위한 공정 매개변수와 연관된다. 일부 실시예에서, 출력은 예측된 마스크 이미지, 결함의 확률, 또는 반도체 제조 공정에 대한 예측된 공정 매개변수를 포함한다.
일부 실시예에서, 본 방법은 클러스터, 출력, 및/또는 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 포함한다. 일부 실시예에서, 조정하는 것은 출력의 하나 이상의 부분과 그라운드 스루(ground truth)의 하나 이상의 부분 간의 일치를 향상시키도록 구성될 수 있다.
일부 실시예에서, 매개변수화된 모델을 조정하는 것은 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것 및/또는 클러스터들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 매개변수화된 모델을 트레이닝하는 것을 포함한다.
일부 실시예에서, 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것 또는 클러스터들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 매개변수화된 모델을 트레이닝하는 것은 매개변수화된 모델을 트레이닝하기 위한 입력으로서 이전 트레이닝 자료에 대하여 클러스터들 중 하나 이상과 관련된 더 다양한 이미지, 더 다양한 데이터 및 부가적인 클립을 이용하는 것; 및/또는 벡터를 인코딩하기 위한 더 많은 차원과 매개변수화된 모델 내의 더 많은 인코딩 계층을 이용하는 것을 포함한다.
일부 실시예에서, 더 다양한 트레이닝 샘플은 이전 트레이닝 자료에 대해 부가적인 및/또는 더 다양한 이미지, 부가적인 및/또는 더 다양한 데이터, 및 부가적인 및/또는 더 다양한 클립을 포함한다.
일부 실시예에서, 본 방법은 잠재 공간 내의 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 차원 데이터의 다른 클러스터 또는 클러스터의 다른 부분과 비교하여 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것을 더 포함한다.
일부 실시예에서, 잠재 공간 내의 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것은 부가적인 트레이닝 데이터의 선택을 용이하게 한다.
일부 실시예에서, 본 방법은 잠재 공간의 차원(dimensionality)에 추가함으로써 매개변수화된 모델을 보다 서술적으로 만드는 것 및/또는 매개변수화된 모델을 더 높은 분산과 연관된 결정된 클러스터들 또는 클러스터들의 부분들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 트레이닝하는 것을 더 포함한다.
일부 실시예에서, 본 방법은 클러스터, 출력, 및/또는 주어진 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 더 포함하여 반도체 제조 공정의 일부로서 기판의 기하학적 구조를 예측하기 위한 매개변수화된 모델의 확실성을 증가시킨다.
일부 실시예에서, 본 방법은 클러스터, 출력, 및/또는 주어진 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 포함하여 반도체 제조 공정의 일부로서 연속 톤 마스크(CTM)를 예측하기 위한 매개변수화된 모델의 확실성을 증가시킨다.
일부 실시예에서, 본 방법은 매개변수화된 모델을 트레이닝하는 것을 더 포함한다. 트레이닝하는 것은 잠재 공간 내의 각 샘플에 대해 잠재 공간 내의 차원 데이터를 샘플링하는 것; 잠재 공간 내의 주어진 차원 데이터에 대해 출력 구현의 분포를 생성하기 위해 다수의 출력 구현을 예측하는 것; 및 다수의 출력 구현의 분포와 연관된 불확실성을 결정하는 것을 포함한다. 매개변수화된 모델은 주어진 차원 데이터 및 결정된 불확실성을 기반으로 트레이닝된다 (예를 들어, 별도의 매개변수화된 모델은 주어진 차원 데이터 및 결정된 불확실성을 이용하여 트레이닝될 수 있으며, 제2 모델로부터의 출력은 제1 매개변수화된 모델의 트레이닝을 안내하기 위해 사용될 수 있다).
일부 실시예에서, 주어진 차원 데이터와 대응 불확실성은 입력 출력 트레이닝 쌍을 형성한다. 일부 실시예에서, 매개변수화된 모델은 신경망을 포함하며, 주어진 차원 데이터 그리고 대응하는 불확실성으로 매개변수화된 모델을 트레이닝하는 것은 신경망이 새로운 출력 구현을 예측하는 것을 학습할 수 있도록 입력 출력 트레이닝 쌍을 신경망에 제공하는 것을 포함한다.
일부 실시예에서, 본 방법은 반도체 제조 공정의 일부로서 마스크 또는 레티클의 기하학적 구조를 예측하기 위하여 트레이닝된 매개변수화된 모델을 이용하는 것을 포함한다.
또 다른 실시예에 따르면, 매개변수화된 모델을 트레이닝하기 위한 방법이 제공된다. 본 방법은 잠재 공간 내의 각 샘플에 대해 잠재 공간 내의 차원 데이터를 샘플링하는 것; 잠재 공간 내의 주어진 차원 데이터에 대해 출력 구현의 분포를 생성하기 위해 다수의 출력 구현을 예측하는 것; 및 다수의 출력 구현의 분포와 연관된 불확실성을 결정하는 것을 포함한다. 매개변수화된 모델은 주어진 차원 데이터 및 결정된 불확실성으로 트레이닝된다 (예를 들어, 이는 위에서 논의된 제2 매개변수화된 모델 및/또는 다른 모델일 수 있다).
일부 실시예에서, 매개변수화된 모델은 기계 학습 모델이다.
일부 실시예에서, 매개변수화된 모델은 신경망을 포함한다.
일부 실시예에서, 매개변수화된 모델은 인코더-디코더 아키텍처를 포함한다.
일부 실시예에서, 인코더 아키텍처는 모델 입력을 잠재 공간 내의 차원 데이터로 변환시키도록 구성된 매개변수화된 모델의 일부분을 포함하며, 디코더 아키텍처는 잠재 공간 내의 차원 데이터를 출력 구현으로 변환시키도록 구성된 매개변수화된 모델의 상이한 부분을 포함한다.
일부 실시예에서, 인코더 아키텍처 및 디코더 아키텍처는 하나 이상의 노드를 갖는 하나 이상의 계층을 갖는 하나 이상의 신경망을 포함한다.
일부 실시예에서, 본 방법은 매개변수화된 모델의 일부분으로, 모델 입력과 연관된 더 높은 차원 데이터를 잠재 공간 내의 차원 데이터로 변환하는 것을 더 포함하며, 잠재 공간 내의 차원 데이터는 모델 입력과 연관된 더 높은 차원 데이터와 비교하여 더 낮은 차원 데이터를 포함한다.
모델 입력은 이미지, 클립, 인코딩된 이미지, 인코딩된 클립, 또는 반도체 제조 공정과 연관된 매개변수화된 모델의 이전 층으로부터의 데이터 중 하나 이상을 포함한다.
일부 실시예에서, 모델 입력은 타겟 패턴 디자인, 결함, 또는 반도체 제조 공정을 위한 공정 매개변수와 연관된다.
일부 실시예에서, 잠재 공간 내의 차원 데이터는 모델 입력과 연관된 다차원 벡터를 포함한다.
일부 실시예에서, 다수의 출력 구현은 예측된 마스크 이미지, 결함 확률, 또는 반도체 제조 공정에 대한 예측된 공정 매개변수를 포함할 수 있다.
일부 실시예에서, 예측하는 것은 신경망의 하나 이상의 계층 및/또는 하나 이상의 노드(node)로, 차원 데이터의 다차원 벡터를 출력 구현으로 디코딩하는 것을 포함한다.
일부 실시예에서, 불확실성을 결정하는 것은 예측된 다수의 출력 구현의 분산을 결정하는 것을 포함한다.
일부 실시예에서, 분산을 결정하는 것은 예측된 다수의 출력 구현의 범위, 표준 편차, 최대값, 최소값, 평균, 중간값 및/또는 모드를 결정하는 것을 포함한다.
일부 실시예에서, 예측된 다수의 출력 구현은 이미지를 포함하며, 불확실성을 결정하는 것은 이미지들 간의 차이를 나타내는 메트릭을 결정하는 것을 포함한다.
일부 실시예에서, 주어진 차원 데이터와 대응 불확실성은 입력 출력 트레이닝 쌍을 형성한다.
일부 실시예에서, 매개변수화된 모델은 신경망을 포함하며, 주어진 차원 데이터 그리고 대응하는 불확실성으로 매개변수화된 모델을 트레이닝하는 것은 신경망이 새로운 출력 구현을 예측하는 것을 학습할 수 있도록 입력 출력 트레이닝 쌍을 신경망에 제공하는 것을 포함한다.
일부 실시예에서, 본 방법은 잠재 공간 내의 차원 데이터의 어느 부분이 차원 데이터의 다른 부분과 비교하여 더 높은 분산을 갖는 예측된 출력 구현에 대응하는지를 결정하는 것, 및 더 높은 분산에 대응하는 부분으로부터 샘플링하는 것을 더 포함한다.
일부 실시예에서, 잠재 공간 내의 차원 데이터의 어느 부분이 더 높은 분산을 갖는 예측된 출력 구현에 대응하는지를 결정하는 것은 부가적인 트레이닝 데이터의 선택을 용이하게 한다.
일부 실시예에서, 본 방법은 반도체 제조 공정의 일부로서 마스크 또는 레티클 기하학적 구조를 예측하기 위하여 트레이닝된 매개변수화된 모델을 이용하는 것을 더 포함한다.
일부 실시예에서, 본 방법은 반도체 제조 공정의 일부로서 연속 톤 마스크(continuous tone mask)(CTM)를 예측하기 위하여 트레이닝된 매개변수화된 모델을 이용하는 것을 더 포함한다.
또 다른 실시예에 따르면, 반도체 제조 공정 매개변수에 대한 조정을 결정하기 위한 방법이 제공된다. 본 방법은 매개변수화된 모델로, 매개변수화된 모델과 연관된 잠재 공간 내의 차원 데이터를 클러스터들로 클러스터링하는 것을 포함한다. 상이한 클러스터들은 주어진 입력의 상이한 부분들에 대응한다. 본 방법은 매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 기반으로 출력을 예측하는 것을 포함한다. 본 방법은 매개변수화된 모델로, 잠재 공간의 차원 데이터를 클러스터들 중 하나 이상에 대응하는 주어진 입력의 복구된 버전으로 변환하는 것을 포함한다. 본 방법은 클러스터, 출력 및/또는 주어진 입력의 복구된 버전에 기초하여, 매개변수화된 모델의 하나 이상의 매개변수를 조정하는 것을 포함하여 매개변수화된 모델 예측의 확실성을 증가시킨다. 본 방법은 조정된 매개변수화된 모델로부터의 예측을 기반으로 하나 이상의 반도체 제조 공정 매개변수에 대한 조정을 결정하는 것을 포함한다.
일부 실시예에서, 본 방법은 클러스터, 출력, 및/또는 주어진 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 포함하여 반도체 제조 공정의 일부로서 연속 톤 마스크(CTM)를 예측하기 위한 매개변수화된 모델의 확실성을 증가시킨다.
일부 실시예에서, 하나 이상의 결정된 반도체 제조 공정 매개변수는 마스크 디자인, 퓨필 형상, 선량, 또는 초점 중 하나 이상을 포함한다.
일부 실시예에서, 하나 이상의 결정된 반도체 제조 공정 매개변수는 마스크 디자인을 포함한다. 일부 실시예에서, 하나 이상의 반도체 제조 공정 매개변수에 대한 조정을 결정하는 것은 마스크 디자인을 제1 마스크 디자인에서 제2 마스크 디자인으로 변경하는 것을 포함한다.
일부 실시예에서, 일부 실시예에서, 주어진 입력은 이미지, 클립, 인코딩된 이미지, 인코딩된 클립, 또는 매개변수화된 모델의 이전 계층으로부터의 데이터 중 하나 이상을 포함한다.
또 다른 실시예에 따르면, 컴퓨터에 의해 실행될 때 위에 설명된 방법들 중 임의의 것을 구현하는 명령어를 갖는 비일시적 컴퓨터 판독 가능한 매체가 제공된다.
또 다른 실시예에 따르면, 매개변수화된 모델 예측의 확실성을 증가시키기 위한 방법이 제공된다. 본 방법은 매개변수화된 모델로, 매개변수화된 모델과 연관된 잠재 공간 내의 차원 데이터를 클러스터들로 클러스터링하는 것 -상이한 클러스터들은 주어진 입력의 상이한 부분들에 대응함-; 매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 기반으로 출력을 예측하는 것; 매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 클러스트들 중 하나 이상에 대응하는 주어진 입력의 복구된 버전으로 변환시키는 것; 및 클러스터, 출력 및/또는 주어진 입력의 복구된 버전을 기반으로, 매개변수화된 모델 예측의 확실성을 증가시키기 위해 매개변수화된 모델의 하나 이상의 매개변수를 조정하는 것을 포함한다.
일부 실시예에서, 본 방법은 잠재 공간 내의 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 차원 데이터의 다른 클러스터 또는 클러스터의 다른 부분과 비교하여 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것을 더 포함한다.
일부 실시예에서, 잠재 공간 내의 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것은 부가적인 트레이닝 데이터의 선택을 용이하게 한다.
일부 실시예에서, 조정하는 것은 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것, 및/또는 더 높은 분산과 연관된 결정된 클러스터들 또는 클러스터들의 부분들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 매개변수화된 모델을 트레이닝하는 것을 포함한다.
일부 실시예에서, 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것 및/또는 더 높은 분산과 연관된 결정된 클러스터들 또는 클러스터의 부분들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 매개변수화된 모델을 트레이닝하는 것은, 매개변수화된 모델을 트레이닝하기 위한 입력으로서 이전 트레이닝 자료에 대하여 클러스터들 중 하나 이상과 관련된 더 다양한 이미지 및 더 다양한 데이터를 이용하는 것; 및/또는 벡터를 인코딩하기 위한 더 많은 차원과 매개변수화된 모델 내의 더 많은 인코딩 계층을 이용하는 것을 포함한다.
일부 실시예에서, 본 방법은 매개변수화된 모델을 트레이닝하는 것을 더 포함한다. 트레이닝하는 것은 잠재 공간 내의 각 샘플에 대해 잠재 공간 내의 차원 데이터를 샘플링하는 것; 잠재 공간 내의 주어진 차원 데이터에 대해 출력 구현의 분포를 생성하기 위해 다수의 출력 구현을 예측하는 것; 및 다수의 출력 구현의 분포와 연관된 불확실성을 결정하는 것을 포함한다. 매개변수화된 모델은 주어진 차원 데이터 및 결정된 불확실성을 기반으로 트레이닝된다.
일부 실시예에서, 본 방법은 잠재 공간 내의 차원 데이터의 어느 클러스터가 차원 데이터의 다른 클러스터와 비교하여 더 높은 분산을 갖는 예측된 출력 구현에 대응하는지를 결정하는 것, 및 더 높은 분산에 대응하는 클러스터로부터 샘플링하는 것을 더 포함한다.
일부 실시예에서, 잠재 공간 내의 개별 클러스터는 차원 데이터 내의 상이한 인코딩된 패턴에 대응한다.
일부 실시예에서, 매개변수화된 모델의 하나 이상의 매개변수를 조정하는 것은 어떠한 패턴 유형이 매개변수화된 모델에 대해 잘 알려져 있고 비교적 일관된 예측을 초래하는지 그리고 어떠한 패턴 유형이 매개변수화된 모델에 대해 잘 알려지지 않고 비교적 가변적인 예측을 초래하는지를 나타내는 별도의 패턴별 정보를 결정하는 것을 포함한다.
일부 실시예에서, 별도의 패턴별 정보는 분산, 잠재 공간 커버리지, 및/또는 분포를 포함한다.
일부 실시예에서, 매개변수화된 모델의 하나 이상의 매개변수를 조정하는 것은 매개변수화된 모델의 차원 및/또는 매개변수화된 모델의 하나 이상의 계층의 가중치를 조정하는 것을 포함한다.
일부 실시예에서, 본 방법은 클러스터, 출력, 및/또는 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 더 포함하여 매개변수화된 모델 예측의 분산을 감소시키고 및/또는 새로운 패턴에 대해 매개변수화된 모델 예측을 향상시킨다.
일부 실시예에서, 본 방법은 잠재 공간 내의 관심 대상 지점을 식별하는 것 - 여기서 관심 대상 지점은 잠재 공간 내의 다른 지점, 클러스터 내부에 위치하지 않는 지점, 또는 잠재 공간 내의 다른 지점들 및/또는 다른 클러스터들 간의 직교 거리(cartesian distance)와 비교하여 잠재 공간 내의 하나 이상의 다른 지점 및/또는 클러스터에서 비교적 멀리 있는 직교 거리에 위치된 지점과 비교하여, 상대적으로 높은 분산 또는 불확실성을 갖는 지점들 중 하나 이상을 포함함-; 및 매개변수화된 모델의 성능을 평가하기 위해 관심 대상 지점, 클러스터, 주어진 입력의 복구된 버전 및/또는 출력을 사용하는 것을 더 포함한다.
일부 실시예에서, 매개변수화된 모델은 변분 인코더-디코더 아키텍처를 포함한다. 잠재 공간 내의 차원 데이터는 인코더-디코더 아키텍처의 인코더에 의하여 인코딩된다. 출력은 인코더-디코더 아키텍처의 디코더로 잠재 공간 내의 차원 데이터를 기반으로 예측되며, 잠재 공간 내의 차원 데이터는 인코더-디코더 아키텍처의 제2 디코더에 의하여, 주어진 입력의 복구된 버전으로 변환된다. 본 방법은 확률적 잠재 공간으로 변분 인코더-디코더 아키텍처를 트레이닝하는 단계를 더 포함하며, 이는 출력 공간의 구현을 생성한다.
또 다른 실시예에 따르면, 컴퓨터에 의해 실행될 때 본 명세서에서 설명된 방법들 중 임의의 것을 구현하는 명령어를 갖는 비일시적 컴퓨터 판독 가능한 매체가 제공된다.
본 명세서에 통합되고 본 명세서의 일부를 구성하는 첨부 도면은 하나 이상의 실시예를 도시하며, 상세한 설명과 함께 이 실시예를 설명한다. 본 발명의 실시예가 이제 대응하는 참조 부호가 대응하는 부분을 나타내는 첨부된 개략적인 도면을 참조하여 단지 예로서 설명될 것이다:
도 1은 실시예에 따른, 리소그래피 시스템의 다양한 서브시스템의 블록도를 보여주고 있다.
도 2는 실시예에 따른, 리소그래피 투영 장치에서 리소그래피를 시뮬레이션하기 위한 예시적인 흐름도를 도시하고 있다.
도 3은 실시예에 따른, 매개변수화된 모델 예측에서 확실성을 증가시키기 위한 본 방법의 작동의 요약을 도시하고 있다.
도 4는 실시예에 따른, 변분 오토인코더를 포함하는 매개변수화된 모델의 예를 도시하고 있다.
도 5는 실시예에 따른, 주어진 입력의 상이한 부분에 대응하는 상이한 클러스터로, 잠재 공간 내의 차원 데이터를 클러스터로 클러스터링하는 것을 도시하고 있다.
도 6은 실시예에 따른, 분산을 최대화하는 예시적인 경사 상승 알고리즘에 의해 취해진 가능한 경로 및 대응하는 분산 함수를 갖는 잠재 공간의 시각화를 도시하고 있다.
도 7은 실시예에 따른, 예시적인 컴퓨터 시스템의 블록도이다.
도 8은 실시예에 따른, 리소그래피 투영 장치의 개략도이다.
도 9는 실시예에 따른, 또 다른 리소그래피 투영 장치의 개략도이다.
도 10은 실시예에 따른, 도 9의 장치의 더 상세한 도면이다.
도 11은 실시예에 따른, 도 9 및 도 10의 장치의 소스 컬렉터 모듈(SO)의 더 상세한 도면이다.
매개변수화된 모델 (예를 들어, 변분 오토 인코더와 같은 기계 학습 모델 및/또는 기타 매개변수화된 모델)은 트레이닝에 의존한다. 트레이닝 시간 및 연관된 비용을 제한하기 위하여, 이러한 모델을 트레이닝하기 위해 사용되는 데이터 세트는 최소의 크기로 최대의 데이터 다양성을 가져야 한다. 지금까지 트레이닝을 위해 선택한 데이터를 최적화하는 좋은 방법이 없었다. 대신, 사전 규정된 비용 함수 메트릭에 도달될 때까지 더 큰 데이터 세트로부터 트레이닝 데이터가 무작위로 샘플링되었다. 전자 모델 예측은 전형적으로 고가의 물리적 모델과 비교되었다. 예를 들어, (단지 일 예로서) 이전 서브 분해능 어시스트 피처(sub resolution assist feature)(SRAF) 모델은 전형적으로 트레이닝되어 이 고가의 물리적 모델을 이용하여 타겟 디자인으로부터 연속 투과 마스크(CMT)를 예측한다. 이전 모델의 성능은 흔히 타겟/물리적 기판 (예를 들어, 물리적 CTM 마스크) 이미지 쌍을 포함하는 검증 데이터 세트를 사용하여 평가된다. 이와 같은 검증 절차는 트레이닝된 매개변수화된 모델의 성능에 대한 전역적 표시를 제공하지만, 트레이닝 중에 직면하는 패턴 유형에 따른 모델 예측 정확도의 분석(breakdown)은 제공하지 않는다.
본 시스템(들) 및 방법(들)은, 예를 들어 모델 예측에서 더 높은 불확실성과 연관된 패턴을 포함하는 트레이닝 데이터를 탐색함으로써 매개변수화된 모델의 트레이닝을 개선하도록 구성된다. 본 시스템(들) 및 방법은 무작위 또는 다른 트레이닝 데이터 선택 방법에 의존하는 대신에, 모델의 예측 성능을 개선하도록 모델을 트레이닝하기 위한 향상된 입력 (예를 들어, 패턴) 세트를 결정하도록 구성된다. 본 시스템(들) 및 방법(들)은 설명된 트레이닝 데이터 선택 작동을 이용하여 매개변수화된 모델 예측에서의 확실성을 증가시키도록 구성된다.
본 시스템(들) 및 방법(들)은 매개변수화된 모델 (예를 들어, 변분 인코더-디코더)의 잠재 공간의 낮은 차원 및 압축성을 활용하여 잠재 공간에서 (예를 들어, 인코딩된 패턴에 대한) (예를 들어, 패턴) 클러스터링을 직접 수행한다. 이는 패턴별 (또는 클러스터별) 정보의 결정을 용이하게 한다. 유리하게는, 콤팩트하고 엉키지 않은(disentangled) 잠재 공간은 패턴 클러스터들의 자연스러운 격리로 이어진다. 별도의 패턴별 정보 (예를 들어, 분산, 잠재 공간 커버리지, 클러스터별 분포 등과 같은 통계)를 결정함으로써, 본 시스템(들) 및 방법(들)은 매개변수화된 모델에 대해 잘 알려진 (예를 들어, 일관된 예측을 초래하는) 패턴 유형 및 비교적 잘 알려지지 않은 (예를 들어, 대단히 가변적인 예측을 야기하는) 패턴 유형에 관한 정보를 제공한다. 또한, 이 패턴 클러스터링은 매개변수화된 모델에 대한 전형적인 트레이닝 공정보다 훨씬 저렴하기 때문에 사실상 부가적인 계산 리소스를 필요로 하지 않는다.
일부 실시예에서, 모델을 트레이닝하는 것은 잠재 공간 내의 각 샘플에 대하여 잠재 공간 내의 차원 데이터를 샘플링하는 것: 잠재 공간 내의 주어진 차원 데이터에 대한 출력 구현의 분포를 생성하기 위해 다수의 출력 구현을 예측하는 것; 및 다수의 출력 구현의 분포와 연관된 불확실성을 결정하는 것을 포함할 수 있다. 불확실성의 이 샘플링 및 예측은 완전히 별개의 매개변수화된 모델, 예를 들어 (예를 들어, 인코더/디코더 아키텍처를 포함할 수 있는 또는 포함하지 않을 수 있는) 위에서 설명된 인코더/디코더 모델의 서브 부분, 및/또는 다른 모델로 수행될 수 있다. 별도의 매개변수화된 모델은 그후 주어진 차원 데이터 및 결정된 불확실성으로 트레이닝 (또는 재트레이닝)될 수 있다. 예를 들어, 별도의 매개변수화된 모델로부터의 출력은 (제1) 모델의 트레이닝을 안내하기 위해 데 사용될 수 있다. 이는 아래에서 추가로 설명된다.
본 명세서에서 반도체 및/또는 IC의 제조에 있어서 특정 참조가 이루어질 수 있지만, 본 명세서 내의 설명은 많은 다른 가능한 적용을 갖는다는 점이 명확하게 이해되어야 한다. 예를 들어, 예측 매개변수화된 모델이 사용되는 곳이면 어디서든지, 본 발명은 반도체 제조 분야 이외에서 사용될 수 있다. 예를 들어, 이는 집적 광학 시스템, 자기 도메인 메모리용 안내 및 검출 패턴, 액정 디스플레이 패널, 박막 자기 헤드 등의 제조에 채택될 수 있다. 이 대안적인 적용의 일부에서, 숙련된 자들은 이러한 대안적인 적용의 맥락에서, 본 명세서 내의 용어 "레티클", "웨이퍼" 또는 "다이"의 임의의 사용이 보다 일반적인 용어 "마스크", "기판" 및 "타겟 부분"과 각각 교환 가능한 것으로 간주되어야 한다는 것을 인식할 것이다. 또한, 본 명세서에서 설명된 방법은 언어 처리 시스템, 자율 주행 자동차, 의료 영상 및 진단, 시맨틱 분할(semantic segmentation), 잡음 제거, 칩 디자인, 전자 설계 자동화 등과 같은 다양한 분야에서 다른 많은 가능한 응용을 가질 수 있다는 점이 주목되어야 한다. 본 방법은 기계 학습 모델 예측에서 불확실성을 정량화하는 것이 유리한 임의의 분야에 적용될 수 있다.
본 문헌에서, 용어 "방사선" 및 "빔"은 (예를 들어, 365, 248, 193, 157 또는 126㎚의 파장을 갖는) 자외 방사선 및 EUV (예를 들어 약 5 내지 100㎚ 범위의 파장을 갖는, 극자외 방사선)를 포함하는 모든 유형의 전자기 방사선을 포함시키기 위하여 사용된다.
패터닝 디바이스는 하나 이상의 디자인 레이아웃을 포함할 수 있거나 형성할 수 있다. 디자인 레이아웃은 CAD (컴퓨터 이용 설계) 프로그램을 이용하여 생성될 수 있다. 이 공정은 흔히 EDA (전자 설계 자동화)로 지칭된다. 대부분의 CAD 프로그램은 기능적인 디자인 레이아웃/패터닝 디바이스를 생성하기 위하여 한 세트의 예정된 디자인 규칙을 따른다. 이 규칙은 처리 및 디자인 제한을 기반으로 설정된다. 예를 들어, 디자인 규칙은 디바이스들 또는 라인들이 바람직하지 않은 방식으로 서로 상호작용하지 않는다는 것을 보장하기 위하여, (게이트, 커패시터 등과 같은) 디바이스들 또는 상호 연결 라인들 간의 간격 공차(space tolerance)를 규정한다. 디자인 규칙 제한들 중 하나 이상은 "임계 치수"(CD)로 지칭될 수 있다. 디바이스의 임계 치수는 라인 또는 홀의 최소 폭, 또는 2개의 라인 또는 2개의 홀 간의 가장 작은 간격으로 규정될 수 있다. 따라서, CD는 디자인된 디바이스의 전체 크기 및 밀도를 규제한다. 디바이스 제조의 목표들 중 하나는 원래 디자인 의도를 (패터닝 디바이스를 통해) 기판 상에 충실하게 재현(reproduce)하는 것이다.
본 명세서에서 사용되는 바와 같은 용어 "마스크" 또는 "패터닝 디바이스"는 용어는 기판의 타겟 부분에 생성될 패턴에 대응하는 패터닝된 횡단면을 입사하는 방사선 빔에 부여하기 위해 사용될 수 있는 일반적인 패터닝 디바이스를 지칭하는 것으로 폭넓게 해석될 수 있다. 용어 "광 밸브(light valve)" 또한 이 맥락에서 사용될 수 있다. 전형적인 마스크 (투과형 또는 반사형; 바이너리(binary), 위상-시프팅, 하이브리드(hybrid) 등) 이외에, 다른 이러한 패터닝 디바이스의 예는 프로그램 가능한 미러 어레이를 포함한다. 이러한 디바이스의 예는 점탄성 제어 층과 반사 표면을 갖는 매트릭스-어드레스 가능한(matrix-addressable) 표면이다. 이러한 장치 뒤에 숨겨진 기본 원리는 (예를 들어) 반사 표면의 어드레스 영역이 입사 방사선을 회절 방사선으로 반사하는 반면, 어드레스되지 않은(unaddressed) 영역은 입사 방사선을 비회절 방사선으로 반사한다는 것이다. 적절한 필터를 사용하여, 상기 비회절 방사선은 반사 빔에서 필터링되어 뒤에 회절 방사선만을 남길 수 있다; 이러한 방식으로 빔은 매트릭스-어드레스 가능한 어드레싱 패턴(addressing pattern)에 따라 패터닝된다. 필요한 매트릭스 어드레싱은 적절한 전자 수단을 이용하여 수행될 수 있다. 다른 이러한 패터닝 디바이스의 예는 또한 프로그램 가능한 LCD 어레이를 포함한다. 이러한 구성의 예는 미국 특허 제5,229,872호에 제공되며, 이는 본 명세서에서 인용 참조된다.
간략한 소개로서, 도 1은 예시적인 리소그래피 투영 장치(10A)를 도시하고 있다. 주요 구성 요소는 심자외(DUV) 엑시머 레이저 소스, 또는 극자외(EUV) 소스를 포함한 다른 유형의 소스일 수 있는 방사선 소스(12A) (위에서 논의된 바와 같이, 리소그래피 투영 장치 자체가 방사선 소스를 가질 필요가 없다); 예를 들어 (시그마로서 표시된) 부분 간섭성 (partial coherence)을 규정하고 소스(12A)로부터의 방사선을 성형하는 광학 구성 요소(14A, 16Aa 및 16Ab)를 포함할 수 있는 조명 광학계; 패터닝 디바이스(18A); 및 및 패터닝 디바이스 패턴의 이미지를 기판 평면(22A) 상으로 투영하는 투과 광학계(16Ac)이다. 투영 광학계의 퓨필 평면에서의 조정 가능한 필터 또는 어퍼처(aperture)(20A)는 기판 평면(22A) 상에 부딪히는 빔 각도의 범위를 제한할 수 있으며, 여기서 가장 큰 가능한 각도는 투영 광학계의 개구수(numerical aperture) NA=n sin(Θmax)를 규정하며, 여기서 n은 투영 광학계의 최종 요소와 기판 사이의 매질의 굴절률이고, Θmax는 기판 평면(22A) 상에 여전히 부딪힐 수 있는, 투영 광학계로부터 나가는 빔의 가장 큰 각도이다.
리소그래피 투영 장치에서, 소스는 패터닝 디바이스에 조명 (즉, 방사선)을 제공하며, 투영 광학계는 패터닝 디바이스를 통해 기판 상으로 조명을 지향시키고 성형시킨다. 투영 광학계는 구성 요소(14A, 16Aa, 16Ab 및 16Ac) 중 적어도 일부를 포함할 수 있다. 에어리얼 이미지(AI)는 기판 레벨에서의 방사선 세기 분포이다. 레지스트 모델은 에어리얼 이미지로부터 레지스트 이미지를 계산하기 위하여 이용될 수 있으며, 그 예는 미국 특허 출원 공개 번호 US2009-0157630에서 찾을 수 있고, 이의 내용은 원용에 의해 전체적으로 본 명세서 내에 포함된다. 레지스트 모델은 레지스트 층의 특성 (예를 들어, 노광, 노광 후 베이크(PEB) 및 현상 중에 발생하는 화학 공정의 효과)에만 관련된다. 리소그래피 투영 장치의 광학 특성 (예를 들어, 조명, 패터닝 디바이스 및 투영 광학계의 특성)은 에어리얼 이미지에 영향을 주며, 광학 모델에서 규정될 수 있다. 리소그래피 투영 장치에서 사용되는 패터닝 디바이스는 변경될 수 있기 때문에, 적어도 소스 및 투영 광학계를 포함하는 리소그래피 투영 장치의 나머지의 광학 특성으로부터 패터닝 디바이스의 광학 특성을 분리하는 것이 바람직하다. 디자인 레이아웃을 다양한 리소그래피 이미지 (예를 들어, 에어리얼 이미지, 레지스트 이미지 등)로 변환시키고 이 기술과 모델을 사용하여 OPC를 적용하고, (예를 들어, 공정 윈도우 면에서의) 성능을 평가하기 위하여 사용되는 기술 및 모델의 세부 사항이 미국 특허 출원 공개 번호 US2008-0301620, 2007-0050749, 2007-0031745, 2008-0309897, 2010-0162197 및 2010-0180251에 설명되어 있으며, 이들 각각의 내용은 원용에 의해 전체적으로 본 명세서 내에 포함된다.
리소그래피 공정을 이해하는 한 양태는 방사선과 패터닝 디바이스의 상호작용을 이해하는 것이다. 방사선이 패터닝 디바이스를 통과한 후의 방사선의 전자기장은 방사선이 패터닝 디바이스에 도달하기 전의 방사선의 전자기장 및 상호작용을 특징짓는 함수로부터 결정될 수 있다. 이 함수는 (이는 투과형 패터닝 디바이스 및/또는 반사형 패터닝 디바이스에 의한 상호작용을 설명하기 위해 사용될 수 있는) 마스크 투과 함수로 지칭될 수 있다.
마스크 투과 함수는 여러 가지 상이한 형태를 가질 수 있다. 한 형태는 바이너리(binary)이다. 바이너리 마스크 투과 함수는 패터닝 디바이스 상의 임의의 주어진 위치에서 2개의 값 (예를 들어, 0 및 양의 상수) 중 어느 하나를 갖는다. 바이너리 형태의 마스크 투과 함수는 바이너리 마스크라고 지칭될 수 있다. 또 다른 형태는 연속적이다. 즉, 패터닝 디바이스의 투과율 (또는 반사율)의 모듈러스(modulus)는 패터닝 디바이스 상의 위치의 연속 함수이다. 투과율 (또는 반사율)의 위상은 또한 패터닝 디바이스 상의 위치의 연속 함수일 수 있다. 연속적인 형태의 마스크 투과 함수는 연속 톤 마스크(continuous tone mask) 또는 연속 투과 마스크(CTM)로 지칭될 수 있다. 예를 들어, CTM은 픽셀화된 이미지(pixelated image)로서 표현될 수 있으며, 여기서 각 픽셀에는 0 또는 1 중 어느 하나의 이진값 대신에 0과 1 사이의 값 (예를 들어, 0.1, 0.2, 0.3 등)이 할당될 수 있다. 일부 실시예에서, CTM은 각 픽셀이 값들 (예를 들어, 범위 [-255, 255] 내의 값들, 범위 [0, 1] 또는 [-1, 1] 내의 정규화된 값들, 또는 다른 적절한 범위들 내의 값들)을 갖는, 픽셀화된 그레이 스케일 이미지(gray scale image)일 수 있다.
키르히호프(Kirchhoff) 경계 조건이라고도 불리는 얇은-마스크 근사가 방사선과 패터닝 디바이스의 상호작용의 결정을 단순화하기 위해 널리 사용된다. 얇은-마스크 근사는 패터닝 디바이스 상의 구조체의 두께가 파장과 비교하여 매우 작다는 점 그리고 마스크 상의 구조체의 폭이 파장과 비교하여 매우 크다는 점을 가정한다. 따라서, 얇은-마스크 근사는 패터닝 디바이스 후의 전자기장이 마스크 투과 함수와 입사 전자기장의 곱(multiplication)인 것을 가정한다. 그러나 리소그래피 공정이 점점 더 짧은 파장의 방사선을 이용하고, 패터닝 디바이스 상의 구조체가 더 작아짐에 따라, 얇은-마스크 근사의 가정은 붕괴될 수 있다. 예를 들어, 구조체의 유한한 두께 때문에 ("마스크 3D 효과" 또는 "M3D") 구조체 (예를 들어, 최상부 표면과 측벽 사이의 에지)와의 방사선의 상호작용이 중요해질 수 있다. 이 산란을 마스크 투과 함수에 포함시키는 것은 마스크 투과 함수가 패터닝 디바이스와의 방사선의 상호작용을 더 잘 캡처하는 것을 가능하게 할 수 있다. 얇은-마스크 근사 하에서의 마스크 투과 함수는 얇은-마스크 투과 함수로 지칭될 수 있다. M3D를 포함하는 마스크 투과 함수는 M3D 마스크 투과 함수로 지칭될 수 있다.
어떻게 패터닝 공정이 기판에 원하는 패턴을 생성하는지를 계산적으로 결정할 수 있는 것이 보통 바람직하다. 따라서, 공정의 하나 이상의 부분을 시뮬레이션하기 위해 시뮬레이션이 제공될 수 있다. 예를 들어, 패터닝 디바이스 패턴을 기판의 레지스트 층으로 전사하는 리소그래피 공정은 물론 레지스트의 현상 후 그 레지스트 층 내의 생성된 패턴을 시뮬레이션할 수 있는 것이 바람직하다.
리소그래피 투영 장치에서 리소그래피를 시뮬레이션하기 위한 예시적인 흐름도가 도 2에 도시되어 있다. 조명 모델(31)은 조명의 (방사선 세기 분포 및/또는 위상 분포를 포함하는) 광학 특성을 나타낸다. 투영 광학계 모델(32)은 투영 광학계의 (투영 광학계에 의하여 야기되는 방사선 세기 분포 및/또는 위상 분포의 변화를 포함하는) 광학 특성을 나타낸다. 디자인 레이아웃 모델(35)은 디자인 레이아웃의 (주어진 디자인 레이아웃에 의해 야기된 방사선 세기 분포 및/또는 위상 분포에 대한 변화를 포함하는) 광학 특성을 나타내며, 이 디자인 레이아웃은 패터닝 디바이스 상의 또는 패터닝 디바이스에 의하여 형성된 피처의 배열체의 표현이다. 에어리얼 이미지(aerial image)(36)는 조명 모델(31), 투영 광학계 모델(32) 및 디자인 레이아웃 모델(35)을 이용하여 시뮬레이션될 수 있다. 레지스트 이미지(38)는 레지스트 모델(37)을 이용하여 에어리얼 이미지(36)로부터 시뮬레이션될 수 있다. 예를 들어, CTM 마스크 및/또는 다른 마스크와 같은 마스크 이미지는 또한 (예를 들어, 디자인 레이아웃 모델(35) 및/또는 다른 모델에 의하여) 시뮬레이션될 수 있다. 예를 들어, 리소그래피의 시뮬레이션은 레지스트 이미지의 윤곽 및/또는 CD를 예측할 수 있다.
보다 구체적으로, 조명 모델(31)은 NA-시그마(σ) 설정뿐만 아니라 임의의 특정 조명 형상 (예를 들어, 환형, 사중극자, 쌍극자 등과 같은 축외 조명)을 포함하지만 이에 제한되지 않는 조명의 광학적 특성을 나타낼 수 있다. 투영 광학계 모델(32)은, 예를 들어 수차, 왜곡, 굴절률, 물리적 크기 또는 치수 등을 포함하는, 투영 광학계의 광학 특성을 나타낼 수 있다. 디자인 레이아웃 모델(35)은 또한, 예를 들어 원용에 의해 전체적으로 본 명세서 내에 포함되는 미국 특허 제7,587,704호 설명된 바와 같이, 물리적 패터닝 디바이스의 하나 이상의 물리적 특성을 나타낼 수 있다. 리소그래피 투영 장치와 연관된 광학 특성 (예를 들어, 조명, 패터닝 디바이스 및 투영 광학계의 특성)은 에어리얼 이미지에 영향을 준다. 리소그래피 투영 장치에 사용되는 패터닝 디바이스는 변경될 수 있기 때문에, 적어도 조명 및 투영 광학계를 포함하는 리소그래피 투영 장치의 나머지의 광학 특성으로부터 패터닝 디바이스의 광학 특성을 분리하는 것이 바람직하다 (이런 이유로 디자인 레이아웃 모델(35)).
레지스트 모델(37)은 에어리얼 이미지로부터 레지스트 이미지를 계산하기 위해 이용될 수 있으며, 이것의 예는 원용에 의해 전체적으로 본 명세서 내에 포함되는 미국 특허 제8,200,468호에서 찾을 수 있다. 레지스트 모델은 전형적으로 레지스트 층의 특성 (예를 들어, 노광, 노광 후 베이크 및/또는 현상 중에 발생하는 화학 공정의 효과)과 관련된다.
시뮬레이션의 목적은, 예를 들어 에지 배치, 에어리얼 이미지 세기 기울기, 서브 분해능 어시스트 피처(sub resolution assist features)(SRAF) 및/또는 CD를 정확히 예측하는 것이며, 이는 그 후 의도된 또는 목표 디자인과 비교될 수 있다. 의도된 디자인은 일반적으로, GDSII, OASIS 또는 또 다른 파일 포맷과 같은 표준화된 디지털 파일 포맷으로 제공될 수 있는 사전-OPC (pre-OPC) 디자인 레이아웃으로서 규정된다.
디자인 레이아웃으로부터, "클립(clip)"으로 지칭되는 하나 이상의 부분이 식별될 수 있다. 실시예에서, 디자인 레이아웃의 복잡한 패턴을 나타내는 클립 세트가 추출된다 (임의의 수의 클립이 이용될 수 있지만, 전형적으로, 약 50 내지 1,000개의 클립). 본 기술 분야의 숙련된 자에 의해 인식될 바와 같이, 이 패턴 또는 클립은 디자인의 작은 부분 (예를 들어, 회로, 셀 등)을 나타내며, 특히 클립은 특별한 주의 및/또는 검증이 필요한 작은 부분을 나타낸다. 즉, 클립은 디자인 레이아웃의 일부일 수 있거나, (고객에 의하여 제공된 클립을 포함하는) 경험에 의하여, 시행착오에 의하여, 또는 풀-칩(full-chip) 시뮬레이션을 실행함으로써 중요한 피처들이 식별되는 디자인 레이아웃의 일부와 유사할 수 있거나 유사한 거동을 가질 수 있다. 클립은 흔히 하나 이상의 테스트 패턴 또는 게이지 패턴을 포함한다. 특정 이미지 최적화가 필요한 디자인 레이아웃의 공지된 중요 피처 영역을 기반으로 초기의 더 큰 클립 세트가 고객에 의하여 선험적으로 제공될 수 있다. 대안적으로, 또 다른 실시예에서, 초기의 더 큰 클립 세트는 중요한 피처 영역을 식별하는 일부 종류의 자동화된 (예를 들어, 머신 비전) 또는 수동 알고리즘을 이용함으로써 전체 디자인 레이아웃으로부터 추출될 수 있다.
예를 들어, 시뮬레이션 및 모델링은 (예를 들어, 광학 근접 보정을 수행하는) 패터닝 디바이스 패턴의 하나 이상의 피처, (예를 들어, 형상 변경과 같은, 조명의 공간/각도 세기 분포의 하나 이상의 특성을 변경시키는) 조명의 하나 이상의 피처 및/또는 투영 광학계의 하나 이상의 피처 (예를 들어, 개구수 등)를 구성하기 위해 이용될 수 있다. 이러한 구성은 일반적으로 마스크 최적화, 소스 최적화 및 투영 최적화로 각각 지칭될 수 있다. 이러한 최적화는 자체적으로 수행될 수 있거나, 다른 조합으로 조합될 수 있다. 하나의 이러한 예는 소스-마스크 최적화(SMO)이며, 이는 조명의 하나 이상의 피처와 함께 패터닝 디바이스 패턴의 하나 이상의 피처의 구성을 포함한다. 최적화 기술은 클립들 중 하나 이상에 중점을 둘 수 있다. 최적화는 (이미지 등을 포함하는) 다양한 매개변수의 값을 예측하기 위해 본 명세서에서 설명된 기계 학습 모델을 이용할 수 있다.
일부 실시예에서, 시스템의 최적화 공정은 비용 함수로 표현될 수 있다. 최적화 공정은 비용 함수를 최소화하는 시스템의 매개변수 세트 (디자인 변수, 공정 변수 등)를 찾는 것을 포함할 수 있다. 비용 함수는 최적화의 목표에 따라 임의의 적절한 형식을 가질 수 있다. 예를 들어, 비용 함수는 이 특성의 의도된 값 (예를 들어, 이상적인 값)에 대하여 시스템의 특정 특성 (평가 지점)의 편차의 가중된 제곱 평균 제곱근(RMS)일 수 있다. 비용 함수는 또한 이 편차 중 최대값 (즉, 최악의 편차)일 수도 있다. 용어 "평가 지점"은 시스템 또는 제조 방법의 임의의 특성을 포함하도록 넓게 해석되어야 한다. 시스템의 설계 및/또는 공정 변수는 한정된 범위에 제한될 수 있으며 및/또는 시스템 및/또는 방법의 구현예의 실현 가능성으로 인하여 상호 의존적일 수 있다. 리소그래피 투영 장치의 경우에, 이 제약은 흔히, 조정 가능한 범위, 및/또는 패터닝 디바이스 제조성(manufacturability) 디자인 규칙과 같은 하드웨어의 물리적 속성 및 특성과 연관된다. 평가 지점은, 예를 들어 기판 상의 레지스트 상의 물리적 지점뿐만 아니라 선량 및 초점과 같은 비-물리적 특성을 포함할 수 있다.
일부 실시예에서, 조명 모델(31), 투영 광학계 모델(32), 디자인 레이아웃 모델(35), 레지스트 모델(37), SMO 모델, 및/또는 집적 회로 제조 공정과 연관된 및/또는 이에 포함된 다른 모델은 본 명세서에서 설명된 방법의 작동을 수행하는 경험적 모델일 수 있다. 경험적 모델은 다양한 입력들 (예를 들어, 마스크 또는 웨이퍼 이미지의 하나 이상의 특성, 디자인 레이아웃의 하나 이상의 특성, 패터닝 디바이스의 하나 이상의 특성, 파장과 같은, 리소그래피 공정에 사용되는 조명의 하나 이상의 특성 등) 간의 상관관계를 기반으로 출력을 예측할 수 있다.
예로서, 경험적 모델은 기계 학습 모델 및/또는 임의의 다른 매개변수화된 모델일 수 있다. 일부 실시예에서, (예를 들어) 기계 학습 모델은 수학적 방정식, 알고리즘, 플롯(plot), 차트, 네트워크 (예를 들어, 신경망), 및/또는 기타 툴 및 기계 학습 모델 성분일 수 있으며 및/또는 이를 포함할 수 있다. 예를 들어, 기계 학습 모델은 입력 계층, 출력 계층, 및 하나 이상의 중간 또는 은닉 계층을 갖는 하나 이상의 신경망일 수 있으며 및/또는 이 신경망을 포함할 수 있다. 일부 실시예에서, 하나 이상의 신경망은 심층 신경망 (예를 들어, 입력 계층과 출력 계층 사이에 하나 이상의 중간 또는 은닉 계층을 갖는 신경망)일 수 있으며 및/또는 이 심층 신경망을 포함할 수 있다.
예로써, 하나 이상의 신경망은 큰 신경 유닛 집합체 (또는 인공 뉴런)를 기반으로 할 수 있다. 하나 이상의 신경망은 생물학적 뇌가 (예를 들어, 축삭 돌기(axon)에 의해 연결된 생물학적 뉴런들의 큰 클러스터를 통해) 작동하는 방식을 대략적으로 모방할 수 있다. 신경망의 각 신경 유닛은 신경망의 많은 다른 신경 유닛과 연결될 수 있다. 이러한 연결은 연결된 신경 유닛들의 활성화 상태에 미치는 그들의 영향을 시행하거나 억제할 수 있다. 일부 실시예에서, 각 개별 신경 유닛은 그들의 모든 입력 값을 함께 조합하는 합산 함수를 가질 수 있다. 일부 실시예에서, 각 연결부 (또는 신경 유닛 자체)는 신호가 다른 신경 유닛으로 전파되도록 허용되기 전에 임계값을 초과해야만 하도록 임계값 함수를 가질 수 있다. 이 신경망 시스템은 명확하게 프로그램되기보다는 자율 학습적이고 트레이닝될 수 있으며, 전형적인 컴퓨터 프로그램과 비교하여 문제 해결의 특정 영역에서 훨씬 더 잘 수행할 수 있다. 일부 실시예에서, 하나 이상의 신경망은 다중 계층 (예를 들어, 신호 경로가 전면 계층에서 후면 계층으로 가로지르는 경우)을 포함할 수 있다. 일부 실시예에서, 역전파 기술은 신경망에 의해 이용될 수 있으며, 여기서 순방향 자극은 "전면" 신경 유닛에 대한 가중치를 재설정하기 위해 사용된다. 일부 실시예에서, 하나 이상의 신경망에 대한 자극 및 억제는 더 자유롭게 유동적일 수 있으면서, 연결부들은 더 무질서하고 복잡한 방식으로 상호 작용한다. 일부 실시예에서, 하나 이상의 신경망의 중간 계층은 하나 이상의 컨볼루션(convolutional) 계층, 하나 이상의 회귀(recurrent) 계층, 및/또는 다른 계층을 포함한다.
하나 이상의 신경망은 트레이닝 데이터 세트 (예를 들어, 그라운드 스루(ground truths))를 이용하여 트레이닝될 수 있다 (즉, 그의 매개변수가 결정된다). 트레이닝 데이터는 트레이닝 샘플 세트를 포함할 수 있다. 각 샘플은 입력 객체 (전형적으로, 피처 벡터로 불릴 수 있는 벡터) 및 원하는 출력 값 (또한 감시 신호(supervisory signal)로 불림)을 포함하는 쌍일 수 있다. 트레이닝 알고리즘은 트레이닝 데이터를 기반으로 신경망의 매개변수 (예를 들어, 하나 이상의 계층의 가중치)를 조정함으로써 트레이닝 데이터를 분석하고 신경망의 거동을 조정한다. 예를 들어, xi는 i 번째 예의 피처 벡터이고 yi는 그의 감시 신호이도록
Figure pct00002
형태의 N 개의 트레이닝 샘플 세트를 고려해볼 때, 트레이닝 알고리즘은 신경망 g:X→Y를 찾으며, 여기서 X는 입력 공간이고 Y는 출력 공간이다. 피처 벡터는 일부 객체 (예를 들어, 위의 예에서와 같은 웨이퍼 디자인, 클립 등)를 나타내는 수치상 피처(numerical features)의 n-차원 벡터이다. 이 벡터와 관련된 벡터 공간은 흔히 피처 또는 잠재 공간(latent space)으로 불린다. 트레이닝 후에, 신경망은 새로운 샘플을 이용하여 예측을 수행하기 위해 이용될 수 있다.
위에서 설명된 바와 같이, 본 방법(들) 및 시스템(들)은 변분 인코더-디코더 아키텍처를 이용하는 매개변수화된 모델 (예를 들어, 신경망과 같은 기계 학습 모델)을 포함한다. 모델 (예를 들어, 신경망)의 중간 (예를 들어 중간, 계층)에서, 본 모델은 모델에 대한 입력 (예를 들어, 이미지, 텐서(tensor) 및/또는 반도체 제조 공정의 패턴 또는 다른 피처와 연관된 다른 입력)의 정보를 캡슐화하는 저차원 인코딩 (예를 들어, 잠재 공간)을 공식화한다. 본 시스템(들) 및 방법(들)은 잠재 공간에서 패턴 클러스터링을 직접적으로 수행하기 위해 잠재 공간의 저차원 및 압축성(compactness)을 활용한다. 이는 패턴 정보에 의한 패턴(클러스터)의 결정을 용이하게 한다. 유리하게는, 콤팩트하고 엉키지 않은(disentangled) 잠재 공간은 패턴 클러스터들의 자연스러운 격리로 이어진다. 별도의 패턴별 정보(예를 들어, 분산, 잠재 공간 커버리지, 클러스터별 분포 등과 같은 통계)를 결정함으로써, 본 시스템(들) 및 방법(들)은 매개변수화된 모델에 대해 잘 알려진 (예를 들어, 일관된 예측을 초래하는) 패턴 유형 및 비교적 잘 알려지지 않은 (예를 들어, 대단히 가변적인 예측을 야기하는) 패턴 유형에 관한 정보를 제공한다.
본 시스템(들) 및 방법(들)은 (예를 들어) 모델 예측에서 더 높은 불확실성과 연관된 패턴을 포함하는 트레이닝 데이터를 능동적으로 탐색함으로써 매개변수화된 모델의 트레이닝을 개선하도록 구성된다. 본 시스템(들) 및 방법은 더 높은 불확실성을 유발하는 입력(패턴)을 기반으로 트레이닝을 위하여 이용하기 위해 향상된 입력 (예를 들어, 패턴) 세트를 결정하도록 구성된다. 이 향상된 입력 패턴 세트로 모델을 재트레이닝하거나 추가 트레이닝하는 것은 모델의 예측 성능을 향상시킨다. 모델은 트레이닝 데이터에 대해 무작위 또는 기타 데이터 선택 방법에 의존할 필요가 없다.
본 시스템(들) 및 방법(들)은 설명된 트레이닝 데이터 선택 작동을 이용하여 매개변수화된 모델 예측에서의 확실성을 증가시키도록 구성된다. 잠재 공간 클러스터링 공정을 반복하고, 더 높은 예측 불확실성과 연관된 클러스터 및/또는 패턴을 식별하고, 이러한 또는 관련된 패턴으로 모델을 재트레이닝함으로써, 예를 들어 트레이닝 샘플이 무작위로 선택될 때보다 트레이닝이 훨씬 더 효과적일 것이다.
본 명세서 전반에 걸쳐 기계 학습 모델, 신경망 및/또는 인코더-디코더 아키텍처가 언급되지만, 기계 학습 모델, 신경망 및 인코더-디코더 아키텍처는 단지 예일 뿐이며 본 명세서에서 설명된 작동은 상이한 매개변수화된 모델에 적용될 수 있다는 점이 주목되어야 한다.
도 3은 매개변수화된 모델 예측에서 확실성을 증가시키기 위한 본 방법의 일 실시예의 작동의 개요(300)를 도시하고 있다. 작동 40에서, 주어진 입력과 연관이 있는 더 높은 차원 데이터는 매개변수화된 모델을 갖는 잠재 공간에서 더 낮은 차원 데이터로 변환될 수 있다. 작동 42에서, 잠재 공간 내의 차원 데이터는 모델에 의해 클러스터로 클러스터링된다. 상이한 클러스터들은 주어진 입력의 상이한 부분들에 대응한다. 작동 44에서, 모델은 잠재 공간 내의 차원 데이터를 기반으로 출력을 예측한다. 작동 46에서, 잠재 공간 내의 차원 데이터는 모델에 의하여, 클러스터들 중 하나 이상에 대응하는 주어진 입력의 복구된 버전으로 변환된다. 일부 실시예에서, 변환하는 것은 인코딩 또는 디코딩, 투영(projecting), 맵핑(mapping), 및/또는 다른 변환 작동을 포함할 수 있다. 일부 실시예에서, 예측하는 것(작동 44)과 변환하는 것(작동 46)은 동시적이거나 거의 동시적이다. 작동 48에서, 모델은 매개변수화된 모델의 예측의 확실성을 증가시키기 위해 클러스터, 출력, 및/또는 주어진 입력의 복구된 버전을 기반으로 재트레이닝, 추가 트레이닝 및/또는 그렇지 않으면 조정된다.
일부 실시예에서, 본 명세서에 기술된 바와 같이, 매개변수화된 모델은 기계 학습 모델이다. 일부 실시예에서, 매개변수화된 모델은 인코더-디코더 아키텍처를 포함하고 있다. 실시예에서, 인코더-디코더 아키텍처는 변분 인코더-디코더 아키텍처를 포함하며, 작동 40 및/또는 다른 작동은 확률적 잠재 공간으로 변분 인코더-디코더 아키텍처를 트레이닝하는 것을 포함하며, 이는 출력 공간의 구현(realizations)을 생성한다. 잠재 공간은 저차원 인코딩 및/또는 (본 명세서에서 설명된 바와 같은) 다른 정보를 포함한다. 인코더에 의해 계산된 (뮤(mu)와 시그마(sigma)와 같은) 분포의 매개변수를 주어진 (가우시안(Gaussian)과 같은) 분포로부터 샘플링함으로써 잠재 공간이 형성된다면, 잠재 공간은 확률적이다.
도 4는 매개변수화된 모델(400)의 예를 도시하고 있다. 모델(400)은, 예를 들어 변분 오토인코더(variational autoencoder)일 수 있다. 변분 오토인코더는 인코더 또는 인코더 네트워크(402)를 이용하여 입력(403) (패턴 및/또는 다른 입력과 연관된 이미지, 텍스트, 신호 등)을 잠재 공간(404)이라고도 불리는 연속 표현으로 인코딩할 수 있으며, 또한 디코더 또는 디코더 네트워크(406)를 이용하여 대응하는 출력(405) (패턴 및/또는 다른 피처를 나타내는 예측된 이미지, 텍스트, 신호, 수치 등)을 생성할 수 있다. 양 네트워크(402, 406)의 트레이닝은 (예를 들어, 위에서 설명된 바와 같이) 입력 객체/출력 값 쌍을 이용하여 수행된다. 일부 실시예에서, 모델(400)은 완전히 트레이닝될 수 있다. 이 실시예에서, 도 3에서 설명된 작동(40 내지 48)은 어떤 유형의 패턴이 모델(400)에 의해 만들어진 예측에서 더 많은 불확실성을 야기하는지 결정함으로써 모델(400)을 개선하도록 구성될 수 있다. 일부 실시예에서, 모델(400)은 부분적으로 트레이닝될 수 있다. 이 실시예에서, 작동 40 내지 48은 잠재 공간(404)을 형성하는 것을 포함하는, 모델(400)의 적어도 부분적인 트레이닝을 용이하게 할 수 있다. 도 4에서 보여지는 바와 같이, 모델(400)은 2개의 상이한 디코더(408 및 410), 또는 디코더 네트워크(406) 내에서 (아래에서 설명되는 바와 같이) 디코더와 유사하게 기능하는 디코더 네트워크(406)의 부분들을 포함하고 있다. 일부 실시예에서, 디코더(410)는 출력 (예를 들어, 아래에서 설명되는 복구된 버전(411))이 입력(403)과 유사하도록 인코더 또는 인코더 네트워크(402)의 인코딩(맵핑)을 반전시키도록 구성된다.
도 3으로 돌아가서, 작동 40에서, 예를 들어, 변환하는 것 (예를 들어, 인코딩, 프로젝팅, 맵핑 등)은 기계 학습 (매개변수화된) 모델 인코더-디코더 아키텍처의 인코더 (예를 들어, 도 4에서 보여지는 인코더 또는 인코더 네트워크(402))에 의해 수행될 수 있다. 주어진 입력은, 예를 들어 이미지, 클립, 인코딩된 이미지, 인코딩된 클립, 벡터, 기계 학습 모델의 이전 계층으로부터의 데이터, 텍스트, 신호, 반도체 제조 공정과 연관된 기타 데이터, 및/또는 인코딩될 수 있는 임의의 다른 데이터 및/또는 객체를 포함할 수 있다. 일부 실시예에서, 주어진 입력은, 예를 들어 타겟 패턴 디자인, 결함, 또는 반도체 제조 공정을 위한 공정 매개변수와 연관된다.
일부 실시예에서, 저차원 인코딩은 입력(예를 들어, 이미지)의 하나 이상의 피처를 나타낸다. 입력의 하나 이상의 피처는 입력의 핵심적인 또는 중요한 피처로 간주될 수 있다. 예를 들어 피처는 원하는 출력의 다른 피처보다 상대적으로 더 예측적이며 및/또는 다른 특성을 갖기 때문에 입력의 핵심적인 또는 중요한 피처로 간주될 수 있다. 저차원 인코딩에서 표현되는 하나 이상의 피처(치수(dimensions))는 (예를 들어, 현재의 기계 학습 모델의 생성 시 프로그래머에 의하여) 예정될 수 있으며, 신경망의 이전 계층에 의해 결정될 수 있고, 본 명세서에서 설명된 시스템과 연관된 사용자 인터페이스를 통하여 사용자에 의해 조정될 수 있으며, 및/또는 다른 방법에 의하여 결정될 수 있다. 일부 실시예에서, 저차원 인코딩에 의해 표현되는 다량의 피처(치수)는 (예를 들어, 현재의 기계 학습 모델의 생성 시 프로그래머에 의하여) 예정될 수 있으며, 신경망의 이전 계층으로부터의 출력을 기반으로 결정될 수 있고, 본 명세서에서 설명된 시스템과 연관된 사용자 인터페이스를 통하여 사용자에 의해 조정될 수 있으며, 및/또는 다른 방법에 의하여 결정될 수 있다.
치수(피처)는 팩트(fact), 변수, 속성, 자유도, 유형 및/또는 입력의 기타 피처를 분류하기 위해 이용될 수 있다. 차원 데이터는 다수의 팩트, 변수, 다수의 자유도, 다수의 유형 및/또는 기타 기능을 갖는 데이터일 수 있다. 데이터의 팩트(facts), 변수, 자유도, 유형 등은 데이터의 "치수(dimensions)"일 수 있다. 차원 데이터는 벡터 형태 (예를 들어, 다차원 벡터)를 포함하는, 다양한 형태를 가질 수 있다. 일부 실시예에서, 잠재 공간 내의 차원 데이터는 모델 입력 및/또는 다른 정보와 연관된 다차원 벡터를 포함한다. 비제한적인 예로서, 모델 입력은 이미지를 포함할 수 있다. 이미지는 상대적으로 많은 수의 치수(피처)를 가질 수 있다. 예를 들어, 이미지는 크기, 상이한 색상의 및/또는 상이한 위치에서의 다량의 픽셀, 및/또는 다른 치수를 가질 수 있다. 잠재 공간 내의 차원 데이터는 상대적으로 더 낮은 수의 치수(피처)를 가질 수 있다. 예를 들어, 잠재 공간 내의 차원 데이터는 입력 이미지의 핵심적인 피처를 나타내는 다차원 벡터를 포함할 수 있다.
위에서 설명된 바와 같이, 작동 42에서, 잠재 공간 내의 차원 데이터는 모델에 의해 클러스터로 클러스터링되면서, 상이한 클러스터들은 주어진 입력의 상이한 부분들에 대응한다. 도 5는 잠재 공간(404) 내의 차원 데이터(502)를 클러스터(504)들로 클러스터링하는 것(500)을 도시하고 있으며, 상이한 클러스터(504)들은 주어진 입력(403)의 상이한 부분(506 내지 514)들에 대응한다. 도 5에서 보여지는 예에서, 입력(403)은 타겟 마스크 디자인의 이미지(520)이다. 상이한 부분(506 내지 514)들은 타겟 마스크 디자인의 상이한 패턴들과 연관되어 있다. 도 5에서 보여지는 바와 같이, 인코더 또는 인코더 네트워크(402)는 타겟 디자인의 이미지(520) 내의 고차원 데이터를 저차원 잠재 공간(404)에 맵핑(map)한다.
작동 42(도 3)는 잠재 공간(404) 내의 차원 데이터(502)의 (타겟 마스크 디자인의 상이한 패턴과 연관된) 어느 클러스터(504) 또는 클러스터(504)의 일부가 차원 데이터(502)의 다른 클러스터(504) 또는 클러스터(504)의 다른 부분과 비교하여 더 높은 분산을 갖는 예측된 출력(405)에 대응하는지를 결정하는 것을 포함한다. 잠재 공간(404) 내의 차원 데이터(502)의 어느 클러스터(504) 또는 클러스터(504)의 일부가 더 높은 분산을 갖는 예측된 출력(405)에 대응하는지를 결정하는 것은 부가적인 트레이닝 데이터의 선택을 용이하게 한다. 예를 들어, 더 높은 분산을 갖는 출력에 대응하는 클러스터 (예를 들어, 하나 이상의 클러스터(504))와 연관된 패턴 (예를 들어, 506 내지 514 중 하나 이상)을 포함하는 트레이닝 데이터는 트레이닝을 위해 선택될 수 있다.
유리하게는, 잠재 공간(404)은 (예를 들어, 이미지 공간과 비교하여) 저차원이다. 이는 클러스터링 알고리즘의 적용을 용이하게 한다. 적용될 수 있는 클러스터링 알고리즘의 예는 K-평균 클러스터링, 평균 이동 클러스터링, DBSCAN (노이즈가 있는 애플리케이션의 밀도 기반 공간적 클러스터링; Density-Based Spatial Clustering of Applications with Noise), 기대 최대화 클러스터링, 응집형 계층적 클러스터링 및/또는 기타 클러스터링 알고리즘을 포함한다. 일부 실시예에서 클러스터링은 잠재 공간(404) 대신 이미지 공간에서 직접 수행될 수 있다는 점이 주목되어야 한다. 이는 적어도 이미지 공간의 고차원 값으로 인해 계산적으로 더 비쌀 수 있지만 그럼에도 불구하고 가능하다.
클러스터링 후, 디코더(408) (또는 디코더와 유사하게 기능하는 도 4에서 보여지는 디코더 네트워크(406)의 일부분)는 잠재 공간(404) 내의 저차원 인코딩을 출력(405)으로 맵핑, 투영, 디코딩 또는 그렇지 않으면 변환시킨다. 이 예에서 출력(405)은 예측된 CTM 이미지(530)이다. 제2 디코더(410)는 잠재 공간(404) 내의 저차원 인코딩을 클러스터(504)들 중 하나 이상에 대응하는 주어진 입력(403)의 복구된 버전(411)으로 맵핑, 투영, 디코딩 또는 그렇지 않으면 변환시킨다. 도 5에서 보여지는 예에서, 주어진 입력의 복구된 버전은 타겟 마스크 디자인의 이미지(520)의 복구된 이미지(532)이다. 따라서, 제2 디코더(410)와 조합된 인코더 또는 인코더 네트워크(402)는 식별 연산자(identity operator)의 근사치를 구현한다. 식별 연산자는 입력을 수정하지 않고 출력에 맵핑하는 연산자이다. 따라서 이상적으로는 출력은 입력과 같다. 오토-인코더(402+410)의 경우에, 더 작은 잠재 공간(404)으로의 압축으로 인하여, 압축으로 인한 일부 정보가 손실되기 때문에 대략적인 식별 연산자가 있다. 이는 잠재 공간(404)에서 클러스터링된 및/또는 식별된 패턴을 시각화하기 위해 유용하다. 일부 실시예에서, 모델(400)은 잠재 공간(404)으로부터 결함의 확률, 공정 윈도우 매개변수, 및/또는 다른 속성과 같은 속성으로의 (도 5에 도시되지 않은) 맵핑을 제공하도록 구성될 수 있다.
클러스터링에 응답하여, 개별 클러스터(504)에 대응하는 패턴 형상(506 내지 514)은 제2 디코더(410)를 이용하여 시각화될 수 있다. 또한, (개별 클러스터(504)에 대응하는) 개별 패턴(506 내지 514)은 패턴 가변성(가변성), 패턴 빈도, 및/또는 기타 지표와 같은 지표를 이용한 패턴을 이용하여 특징지어질 수 있다. 모델(400)의 성능에 관한 결정은 이 지표 및/또는 기타 정보를 기반으로 이루어질 수 있다. 특정 패턴(506 내지 514) 및/또는 기타 유사한 패턴의 더 많은 예가 특정 패턴의 높은 출력 예측 가변성을 기반으로 트레이닝 데이터 세트에 추가될 수 있다. 부가적인 세부 사항은 아래의 작동 44, 46 및 48 (도 3)의 계속적인 논의에 제공되어 있다.
일부 실시예에서, 작동 42 (도 3)는 클러스터링, 경사 기반 방법, 및/또는 다른 방법을 이용하여, 잠재 공간(404)의 다른 위치와 비교하여 (더 많은 모델 예측 불확실성을 초래하는) 더 높은 분산을 갖는 예측된 출력 (예를 들어, 패턴)에 대응하는 잠재 공간(404) 내의 위치들을 결정하는 것을 포함한다. 다시 말해서, 작동 42는 모델(400)이 최악을 캡처하는 잠재 공간(404) 내의 (패턴에 대응하는) 위치를 식별하기 위해 잠재 공간(404)을 탐색하는 것을 포함할 수 있다. 잠재 공간(404) 내의 이 위치에 대응하는 입력 (예를 들어, 패턴의 이미지)은 부가적인 트레이닝 입력으로서 선택될 수 있다.
(본 명세서에서 설명된 바와 같이) 모델(400)이 트레이닝될 때, (예를 들어) 잠재 공간(404)은 인코딩된 패턴의 압축되고 연속적인 표현을 형성하며, 이는 잠재 공간(404) 내에서의 탐색 및 최적화 작업의 수행을 용이하게 한다. 탐색 및 최적화 작동은, 예를 들어 클러스터링, 경사 기반 방법(예를 들어, 경사 상승(gradient ascent)), 및/또는 기타 방법을 포함할 수 있다.
도 6은 대응하는 분산 함수(602), 및 (예를 들어, 가장 높은 예측 불확실성과 연관된 입력 패턴에 대응하는 잠재 공간(404) 내의 위치를 결정하는) 분산을 최대화하는 예시적인 경사 상승 알고리즘에 의해 취해진 가능한 경로(604)를 갖는 잠재 공간(404)의 시각화(600)를 도시하고 있다. 가장 높은 분산 (또는 예측 불확실성)에 대응하는 잠재 공간(404) 내에서의 위치를 결정하기 위한 방법은 달라질 수 있다. 최대화를 위해 다양한 분산 측정이 이용될 수 있다. 예를 들어, 최대 분산 값은 이미지 내의 작은 영역이 중요할 때 관련이 있을 수 있는 반면, 제곱 평균 제곱근 분산 값(root-mean-square variance value)은 전체 적합을 설명하기 위해 더 잘 운용될 수 있다. 이미지를 이용한 계측 적용을 위하여, 피처 에지를 향하여 강하게 가중된 RMS와 같은 방법이 이용할 수 있다. 탐색 방법 또한 다양할 수 있으며 경사 탐색은 단지 하나의 예이다.
일부 실시예에서, 이러한 탐색을 위한 시작 지점은 잠재 공간(404) 내의 무작위 위치일 수 있다. 일부 실시예에서, 가능한 입력 (예를 들어, 패턴의 이미지)의 그룹으로부터 결정된, 가장 높은 분산을 갖는 출력 (예를 들어, 패턴)에 대응하는 시작 위치가 대신 이용될 수 있다. 일부 실시예에서, 작동 42(도 3)는 예를 들어 규칙적으로 또는 무작위로 잠재 공간(404)을 개략적으로 샘플링하는 것, 및 그후 가장 높은 출력 분산을 갖는 위치를 시작 지점으로서 선택하는 것을 포함할 수 있다. 이 접근은 또한 최적화 중에 국부 최적에서 끝나는 것을 방지하기 위해 이용될 수 있다. 시작 지점으로부터, 작동 42는 잠재 공간(404)에 걸쳐 (일 예로서) 경사 탐색을 수행하여 최대 출력 분산에 대응하는 위치를 결정할 수 있다.
출력 (예를 들어, 패턴)은 특정 사용 사례와 관련되어야 한다 (예를 들어, 관련 없는 난해한 패턴을 설명하기 위해 추정(extrapolate)할 필요가 없다)는 점이 주목되어야 한다. 이는 (모델(400)이 합리적으로 트레이닝된 경우) 잠재 공간(404)의 경계를 따라 또는 그것을 지나 탐색할 필요가 없을 가능성이 있다는 것을 의미한다. 경사 탐색이 (예를 들어) 최대 출력 분산에 대응하는 위치가 잠재 공간 경계를 향하여 위치한다는 것을 결정하면, 모델(400) 출력(405)은 관련성에 대해 검사될 필요가 있을 수 있고, 잠재 공간(404)은 (예를 들어, 차원, 부가적인 트레이닝 데이터 등을 추가함으로써) 대응하는 방향으로 확장될 필요가 있을 수 있으며 및/또는 새로운 시작 위치가 결정될 필요가 있을 수 있다. 잠재 공간(404)의 원점에 가까운 시작 위치는 이것이 특이점(singularity)일 수 있거나 특이점과 유사할 수 있고 결국 관련 디코딩된 이미지를 생성하지 않을 수 있기 때문에 회피될 필요가 있을 수 있다.
도 3 및 도 5를 다시 참조하면, 작동 44(도 3)에서, 출력(405)(도 5)은 예측된 마스크 이미지 (예를 들어, 도 5에서 보여지는 530), 결함의 확률, 반도체 제조 공정을 위한 예측된 공정 매개변수 및/또는 기타 예측을 포함하고 있다. 출력(405)은 잠재 공간(404) 내의 차원 데이터 및/또는 다른 정보를 기반으로 예측된다. 출력(405)은 인코더-디코더 아키텍처의 제1 부분으로 예측된다. 일부 실시예에서, 인코더-디코더 아키텍처의 제1 부분은 제1 디코더(408)이다. 그러나 인코더-디코더 아키텍처의 디코더(408)는 전형적인 디코더가 아닐 수 있다. 예를 들어, 인코더-디코더 아키텍처의 디코더(408)는 잠재 공간(404)을 통과하지 않는 인코더 또는 인코더 네트워크(402)에서 생겨나는 스킵 연결부(skip connection)(550)를 포함할 수 있다. 예를 들어, 완전한 인코더-디코더 아키텍처에는 전형적으로 스킵 연결부를 포함하지 않는다. 입력에서 출력으로 고해상도 정보를 전송하기 위하여 스킵 연결부가 사용된다. 이는 출력의 품질을 향상시킨다. 잠재 공간(404)은 출력(405)을 생성하기 위하여 완전한 정보를 반드시 포함할 필요는 없으며, 이러한 정보는 필요하지 않기 때문이다. (그러나 (아래에 설명되는) 복구된 버전(411)은 잠재 공간(404)에서 완전하게 생성될 필요가 있다. 따라서 402와 410 사이에는 스킵 연결부가 없다.)
작동 46(도 3)에서, 잠재 공간(404)(도 5) 내의 차원 데이터는 인코더-디코더 아키텍처의 제2 부분에 의하여, 주어진 입력(403)의 복구된 버전(411)으로 변환 (예를 들어, 디코딩, 투영, 맵핑 등)된다. 예를 들어, 인코더-디코더 아키텍처의 제2 부분은 제2 디코더(410)일 수 있다. 제2 디코더(410)는 인코더-디코더 아키텍처의 제1 부분 (예를 들어, 제1 디코더(408))에 포함된 스킵 연결부(550)를 포함하지 않는다는 점이 주목되어야 한다. 잠재 공간(404) 내의 차원 데이터는 주어진 입력(403)의 복구된 버전(411)으로 변환되어 잠재 공간(404)의 관심 지점의 시각화를 용이하게 한다. 관심 대상 지점은 (예를 들어, 도 6과 관련하여 설명된 바와 같이) 높은 분산 또는 불확실성을 갖는 지점을 포함한다. 일부 실시예에서, 관심 대상 지점은 잠재 공간 내의 다른 지점, 클러스터 내부에 위치하지 않는 지점, 또는 잠재 공간 내의 다른 지점들 및/또는 다른 클러스터들 간의 직교 거리(cartesian distance)와 비교하여 잠재 공간 내의 하나 이상의 다른 지점 및/또는 클러스터에서 비교적 멀리 있는 직교 거리에 위치된 지점과 비교하여 상대적으로 높은 분산 또는 불확실성을 갖는 지점들, 및/또는 다른 관심 대상 지점 중 하나 이상을 포함한다. 예를 들어, 임의의 클러스터의 부분으로 보이지 않는 지점은 관심 대상 지점일 수 있다. 또 다른 지점 및/또는 또 다른 클러스터로부터의 임계 직교 거리인 지점은 관심 대상 지점일 수 있다. 이 예는 제한하려는 것이 아니다.
작동 48 (도 3)에서, 관심 대상 지점, 클러스터, 출력, 주어진 입력의 복구된 버전, 및/또는 다른 정보는 매개변수화된 모델(400)(도 5)의 성능을 평가하기 위해 사용될 수 있다. 예를 들어, 관심 대상 지점 및/또는 출력은 주어진 입력에 대한 예측 일관성 (또는 분산)을 결정하기 위해 사용될 수 있다. 일부 실시예에서, 작동 48은 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것, 및/또는 더 높은 분산과 연관된 결정된 클러스터들 또는 클러스터들의 부분들 중 하나 이상, 또는 잠재 공간(404)(도 5 및 도 6) 내의 위치 (예를 들어, 더 높은 예측 불확실성과 연관된 패턴들)와 연관된 더 다양한 트레이닝 데이터로 매개변수화된 모델을 트레이닝하는 것을 포함한다. 일부 실시예에서, 잠재 공간의 차원에 추가하는 것은 입력의 더 많은 치수 또는 피처를 설명하거나 나타내도록 잠재 공간을 구성하는 것을 포함한다 (위에서 설명된 이미지의 치수 또는 피처의 예 참조). 비제한적인 예로서, 잠재 공간의 차원에 추가하는 것은 주어진 입력 (예를 들어, 이미지) 및/또는 다른 작동에 대해 원래 또는 이전에 인코딩된 피처 벡터에 관하여 더 많은 피처로 잠재 공간 내의 피처 벡터를 인코딩하는 것을 포함할 수 있다. 일부 실시예에서, 잠재 공간의 차원에 추가하는 것은 잠재 공간 (예를 들어, 인코더와 디코더 사이의 계층) 내의 치수의 증가를 야기하는 인코더-디코더 네트워크 아키텍처의 임의의 변화를 포함한다.
일부 실시예에서, 별도의 패턴별 정보(예를 들어, 분산, 잠재 공간 커버리지, 클러스터별 분포 등과 같은 통계)를 결정하는 것, 가장 높은 예측 불확실성과 연관된 잠재 공간(404) 내의 위치를 결정하는 것, 및/또는 위에서 설명된 바와 같은 다른 작동은 매개변수화된 모델(400)에 대해 잘 알려진 (예를 들어, 그리고 일관된 예측과 연관된) 패턴 유형 및 비교적 잘 알려지지 않은 (예를 들어, 그리고 대단히 가변적인 예측과 연관된) 패턴 유형의 결정을 용이하게 한다. 작동 48은 모델(400) 예측에서 더 높은 불확실성과 연관된 패턴을 포함하는 트레이닝 데이터로 모델(400)을 트레이닝함으로써 매개변수화된 모델(400)의 트레이닝을 개선하는 것을 포함할 수 있다. 이 향상된 입력 세트 (예를 들어, 패턴)로 모델(400)을 재트레이닝 또는 추가 트레이닝하는 것은 모델의 예측 성능을 향상시킨다.
일부 실시예에서, 작동 48은 클러스터, 관심 대상 지점 (예를 들어, 가장 높은 분산을 갖는 지점), 출력, 및/또는 입력의 복구된 버전을 기반으로 매개변수화된 모델을 재트레이닝, 추가 트레이닝 및/또는 그렇지 않으면 조정하는 것을 포함하여 출력의 하나 이상의 부분 (예를 들어, 특정 패턴의 치수, 특정 유형의 결함, 제조 공정 매개변수 윈도우 등)과 그라운드 스루의 하나 이상의 부분 간의 일치를 향상시킨다. 그라운드 스루는 매개변수화된 모델 (예를 들어, 물리적 마스크의 패턴 치수, 특정 유형의 결함의 위치, 실제 제조 공정에서 사용되는 공정 매개변수, 등.)에 의해 모델링된 사물의 물리적 버전의 공지된 또는 측정된 속성일 수 있다
일부 실시예에서, 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것 또는 가장 큰 예측 불확실성과 연관된 클러스터들 또는 지점들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 매개변수화된 모델을 트레이닝하는 것은 매개변수화된 모델을 트레이닝하기 위한 입력으로서 이전 트레이닝 자료에 대하여 클러스터들 중 하나 이상과 관련된 더 다양한 이미지, 더 다양한 데이터 및 부가적인 클립을 사용하는 것; 및/또는 벡터를 인코딩하기 위한 더 많은 차원과 매개변수화된 모델 내의 더 많은 인코딩 계층을 이용하는 것을 포함한다. 이것들 중 임의의 것 또는 전부는 클러스터 및 대응하는 패턴 및/또는 더 높은 예측 불확실성 및/또는 다른 정보와 연관된 잠재 공간(404) 내의 지점을 기반으로 결정될 수 있다. 위에서 논의된 바와 같이, 이 정보를 트레이닝 데이터로서 사용하는 것은 매개변수화된 모델이 이 패턴 및 기타 유사한 패턴에 대해 더 정확한 예측을 하는 것을 허용한다.
일부 실시예에서, 가장 높은 예측 불확실성과 연관된 하나 이상의 클러스터 또는 지점과 연관된 데이터는 잠재 공간 내의 다른 지점과 비교하여 상대적으로 높은 분산 또는 불확실성을 갖는 잠재 공간 내의 지점들 중 하나 이상에 대응하는 데이터, 특정 클러스터 내에 위치된 지점에 대응하는 데이터, 클러스터 내에 위치되지 않은 지점에 대응하는 데이터, 잠재 공간의 다른 지점들 사이의 직교 거리와 비교하여 잠재 공간의 하나 이상의 다른 지점에서 상대적으로 먼 직교 거리에 위치한 지점에 대응하는 데이터, 및/또는 다른 데이터를 포함할 수 있다. 다시 말해, 예를 들어, 모델을 조정하기 위해 사용되는 트레이닝 데이터의 다양성은 잠재 공간 내의 주어진 클러스터 또는 지점과 연관된 데이터로 제한될 필요가 없다. 잠재 공간 내의 특정 클러스터 또는 지점과 관련이 없는 데이터는 모델을 조정 (예를 들어, 재트레이닝)하기 위해 사용될 수 있으며 및/또는 다른 목적을 위하여 사용될 수 있다. 예를 들어, 완전히 새롭거나 상이한 트레이닝 데이터가 사용될 수 있다. 더 다양한 이미지 및/또는 더 다양한 데이터는 새로운 피처 및/또는 이전 트레이닝을 위하여 사용된 것과 상이한 피처를 설명하는 이미지 및/또는 데이터, 이전 트레이닝에서 사용된 것과는 상이한 타겟 디자인 또는 패턴의 부분을 설명하는 이미지 및/또는 데이터, 이전 트레이닝에서 사용된 것과 상이한 처리 조건에 대한 이미지 및/또는 데이터, 및/또는 기타 정보를 지칭할 수 있다.
일부 실시예에서, 작동 48은 트레이닝, 재트레이닝 추가 트레이닝 및/또는 그렇지 않으면 잠재 공간 내의 차원 데이터로부터 취해진 샘플을 기반으로, 매개변수화된 모델을 조정하는 것을 포함한다. 이 트레이닝 (재트레이닝 등)은 잠재 공간으로부터의 각 샘플에 대해 잠재 공간 내의 차원 데이터를 샘플링하는 것; 잠재 공간 내의 주어진 차원 데이터에 대해 출력 구현의 분포를 생성하기 위해 다수의 출력 구현을 예측하는 것; 및 다수의 출력 구현의 분포와 연관된 불확실성 (또는 분산)을 결정하는 것을 포함한다. 불확실성 예측을 위한 별도의 매개변수화된 모델이 그후 주어진 차원 데이터 및 대응하는 결정된 불확실성으로 트레이닝 (재트레이닝 등)될 수 있다. 예를 들어, 이 별도의 매개변수화된 모델로부터의 출력은 (제1) 매개변수화된 모델의 트레이닝을 안내하기 위해 (예를 들어, 가장 높은 불확실성과 연관된 잠재 공간의 영역을 찾기 위해) 사용될 수 있다.
일부 실시예에서, 샘플링하는 것은 잠재 공간 내의 차원 데이터의 어느 부분이 차원 데이터의 다른 부분과 비교하여 더 높은 분산을 갖는 예측된 출력 구현에 대응하는지를 결정하는 것, 및 더 높은 분산에 대응하는 부분으로부터 샘플링하는 것을 포함한다. 일부 실시예에서, 샘플링하는 것은 도 6과 관련하여 위에서 설명된 불확실성 예측을 위하여 별도의 매개변수화된 모델에 적용된 경사 상승 알고리즘으로부터의 출력, 및/또는 다른 정보를 기반으로 수행될 수 있다. 위에서 설명되고 도 6에서 보여지는 바와 같이, 경사 상승 알고리즘은 잠재 공간 내의 분산을 최대화한다 (예를 들어, 가장 높은 예측 불확실성과 연관된 입력 패턴에 대응하는 잠재 공간(404)(도 4) 내의 위치를 결정한다). 잠재 공간(예를 들어, 404) 내의 데이터의 샘플은 경사 상승 알고리즘에 의해 출력된 위치 또는 위치들에 또는 그 근처에서 취해질 수 있다. 이 잠재 공간 차원 데이터가 매개변수화된 모델이 처리하기 위해 (예를 들어, 가장 높은 예측 불확실성을 생성하기 위해) 가장 적게 트레이닝되는 하나 이상의 패턴을 나타내기 때문에 경사 상승 알고리즘에 의해 출력된 위치에서 또는 그 근처에서 샘플이 취해질 수 있다.
가장 높은 분산 (또는 예측 불확실성)에 대응하는 잠재 공간(404)(도 4) 내의 위치를 결정하기 위한 방법이 달라질 수 있다는 점이 주목되어야 한다. 위에서 설명된 바와 같이, 분산 (또는 예측 불확실성)의 다른 측정이 최대화를 위해 사용될 수 있다. 예를 들어, 최대 분산 값은 이미지의 작은 영역이 중요할 때 관련이 있을 수 있는 반면, 제곱 평균 제곱근 분산 값은 전체 적합을 설명하기 위해 더 잘 운용될 수 있다. 이미지를 이용한 계측 적용을 위하여, 피처 에지를 향하여 강하게 가중된 RMS와 같은 방법이 이용할 수 있다. 탐색 방법 또한 다양할 수 있으면서 경사 상승 탐색 알고리즘은 하나의 예일뿐이다.
일부 실시예에서, 주어진 차원 데이터 및 대응하는 불확실성은 입력 출력 트레이닝 쌍들을 형성한다. 일부 실시예에서, 별도의 매개변수화된 모델은 (예를 들어, 본 명세서에서 설명된 바와 같은 노드(node) 등을 갖는) 적어도 하나의 신경망을 포함하는 (예를 들어, 인코딩 및 디코딩 아키텍처를 갖는) 변분 오토-인코더(variational auto-encoder)를 포함하는 기계 학습 모델을 포함한다. 주어진 차원 데이터 그리고 대응하는 불확실성으로 별도의 매개변수화된 모델을 트레이닝하는 것은 변분 오토-인코더가 새로운 출력 구현을 예측하는 것을 학습할 수 있도록 입력 출력 트레이닝 쌍을 신경망에 제공하는 것을 포함한다.
본 명세서에서 설명된 바와 같이, 인코더 아키텍처는 모델 입력을 잠재 공간 내의 차원 데이터로 변환시키도록 구성된 매개변수화된 모델의 일부분을 포함하며, 디코더 아키텍처는 잠재 공간 내의 차원 데이터를 출력 구현으로 변환시키도록 구성된 매개변수화된 모델의 상이한 부분을 포함한다.
비제한적인 실제 예로서, 일부 실시예에서, 모델 입력은 타겟 패턴 디자인, 결함, 또는 반도체 제조 공정을 위한 공정 매개변수와 연관될 수 있다. 잠재 공간 내의 차원 데이터는 모델 입력과 연관된 다차원 벡터를 포함할 수 있다. 다수의 출력 구현은 예측된 마스크 이미지, 결함 확률, 반도체 제조 공정에 대한 예측된 공정 매개변수, 및/또는 기타 정보를 포함할 수 있다. 일부 실시예에서, 예측하는 것은 신경망의 하나 이상의 계층 및/또는 하나 이상의 노드(node)로, 차원 데이터의 다차원 벡터를 출력 구현으로 디코딩하는 것을 포함한다.
불확실성을 결정하는 것은 예측된 다수의 출력 구현 및/또는 다른 정보의 분산을 결정하는 것을 포함할 수 있다. 일부 실시예에서, 분산을 결정하는 것은 예측된 다수의 출력 구현의 범위, 표준 편차, 최대값, 최소값, 평균, 중간값, 모드, 및/또는 다른 특성을 결정하는 것을 포함한다. 예를 들어, 예측된 다수의 출력 구현은 이미지를 포함할 수 있으며, 불확실성을 결정하는 것은 이미지들 간의 차이를 나타내는 메트릭(metric)을 결정하는 것을 포함할 수 있다. 이러한 차이를 나타내는 메트릭은 시각적 표시기, 주어진 이미지 속성의 범위, 주어진 이미지 속성의 표준 편차, 최대 및/또는 최소 이미지 속성, 중간 이미지, 모드 이미지 및/또는 기타 메트릭을 포함할 수 있다.
바꿔 말하면, 불확실성 예측을 위하여 별도의 매개변수화된 모델을 트레이닝하는 것은 잠재 공간(z) 내의 차원 데이터를 샘플링하는 것 (예를 들어, 입력 데이터 생성하는 것)을 포함할 수 있으며, 여기서 z는, 예를 들어 잠재 공간 내의 (저)차원 인코딩(벡터)일 수 있는 잠재 공간 내의 차원 데이터를 나타낸다. 잠재 공간(z) 내의 차원 데이터의 샘플링은, 예를 들어 매개변수화된 모델 (예를 들어, 변분 오토-인코더)의 초기 트레이닝 동안 사용된 (예를 들어, 저차원 인코딩의) 사전 분포(p(z))로부터 수행될 수 있다. z의 각 샘플에 대해, 동일 샘플이 변분-오토 인코더의 디코더 부분을 여러 번 통과하여 그 샘플 (예를 들어, 출력 데이터)에 대한 다수의 출력 구현(예측)을 생성한다. 이 출력 구현은 집계될 수 있고 그의 분산(v(z))이 결정될 수 있다. z의 샘플 그리고 대응하는 분산(v(z))은, 예를 들어 입력 출력 트레이닝 쌍(z, v(z))을 형성할 수 있다. 불확실성 예측을 위하여 매개변수화된 모델을 트레이닝하는 것은 변분 오토-인코더가 (예를 들어 동일한 또는 상이한 모델 입력에 대해) 새로운 출력 구현을 (더 잘) 예측하는 것을 학습할 수 있도록 입력 출력 트레이닝 쌍을 (적어도 하나의) 신경망에 제공하는 것을 포함할 수 있다. 이 작동은 z의 여러 상이한 샘플에 대해 여러 번 반복될 수 있다.
일부 실시예에서, 작동 48은 클러스터, 관심 대상 지점, 출력, 및/또는 주어진 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 포함하여 매개변수화된 모델의 확실성을 증가시킨다. 조정하는 것은 매개변수화된 모델 예측의 분산을 감소시키도록 그리고 새로운 패턴에 대한 매개변수화된 모델 예측을 향상시키도록 구성될 수 있으며, 및/또는 다른 목적을 위하여 구성될 수 있다. 일부 실시예에서, 작동 48은 클러스터, 관심 대상 지점, 출력, 및/또는 주어진 입력의 복구된 버전을 기반으로, 매개변수화된 모델의 하나 이상의 매개변수 (예를 들어, 가중치, 다수의 계층, 잠재 공간 내의 차원 등)를 조정하는 것을 포함하여 매개변수화된 모델 예측의 확실성을 증가시킨다. 일부 실시예에서, 매개변수화된 모델을 조정하는 것은 (예를 들어, 더 높은 예측 불확실성과 연관된 패턴을 기반으로) 본 명세서에 설명된 바와 같이 모델을 트레이닝 또는 재트레이닝하는 것을 포함할 수 있다. 일부 실시예에서, 매개변수화된 모델을 조정하는 것은 가중치, 계층의 수, 잠재 공간 내의 차원 등을 수동으로 변경시키는 것을 포함할 수 있다.
일부 실시예에서, 조정하는 것은 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것, 및/또는 더 높은 분산과 연관된 결정된 클러스터들 또는 클러스터들의 부분들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 매개변수화된 모델을 트레이닝하는 것을 포함한다 (여기서 잠재 공간 내의 개별 클러스터는 본 명세서에서 설명된 바와 같은 차원 데이터의 상이한 인코딩된 패턴에 대응한다). 조정하는 것은 잠재 공간 내의 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 (예를 들어, 본 명세서에 설명된 바와 같이) 차원 데이터의 다른 클러스터 또는 클러스터의 다른 부분과 비교하여 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것을 포함할 수 있다. 잠재 공간 내의 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것은 부가적인 트레이닝 데이터의 선택을 용이하게 한다. 매개변수화된 모델을 더 설명적으로 만드는 것은 매개변수화된 모델을 트레이닝하기 위한 입력으로서 이전 트레이닝 자료에 대하여 클러스터들 중 하나 이상과 관련된 더 다양한 이미지 및 더 다양한 데이터를 이용하는 것; 벡터를 인코딩하기 위한 더 많은 차원과 매개변수화된 모델 내의 더 많은 인코딩 계층을 이용하는 것; 및/또는 기타 작동을 포함한다.
일부 실시예에서, 매개변수화된 모델의 하나 이상의 매개변수를 조정하는 것은 어떠한 패턴 유형이 매개변수화된 모델에 대해 잘 알려져 있고 비교적 일관된 예측을 초래하는지 그리고 어떠한 패턴 유형이 매개변수화된 모델에 대해 잘 알려지지 않고 (예를 들어, 본 명세서에서 설명된 작동들 중 하나 이상을 이용하여) 비교적 가변적인 예측을 초래하는지를 나타내는 별도의 패턴별 (예를 들어, 또는 클러스터별) 정보를 결정하는 것을 포함한다. 별도의 패턴별 정보는 분산, 잠재 공간 커버리지, 분포 및/또는 기타 정보를 포함한다.
비제한적인 예로서, 조정하는 것은 반도체 제조 공정의 일부로서 기판, 마스크, 레티클, 및/또는 다른 기하학적 구조를 예측하기 위하여 이루어질 수 있다. 또 다른 예로서, 작동 48은 클러스터, 출력, 관심 대상 지점, 및/또는 주어진 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 포함하여 연속 투과 마스크(continuous transmission mask)(CTM)를 예측하기 위하여 매개변수화된 모델의 확실성을 증가시킬 수 있다. 예들은 제한하도록 의도된 것이 아니다. 조정하는 것은 매개변수화된 모델 예측의 확실성을 증가시키는 것이 유리한 임의의 매개변수화된 모델에 대해 이루어질 수 있다.
일부 실시예에서, 작동 48은 조정된 매개변수화된 모델로부터의 예측을 기반으로 하나 이상의 반도체 제조 공정 매개변수에 대한 조정을 결정하는 것을 포함하고 있다. 일부 실시예에서, 하나 이상의 결정된 반도체 제조 공정 매개변수는 마스크 디자인, 퓨필 형상, 선량, 초점, 및/또는 다른 매개변수 중 하나 이상을 포함한다. 일부 실시예에서, 하나 이상의 결정된 반도체 제조 공정 매개변수는 마스크 디자인이 제1 마스크 디자인에서 제2 마스크 디자인으로 변경되도록 마스크 디자인을 포함한다. 집적 회로 제조 공정 및/또는 다른 공정의 여러 상이한 양태와 관련된 다른 예가 고려된다.
도 7은 본 명세서에 개시되는 방법, 흐름 또는 장치를 구현하는 것을 도울 수 있는 컴퓨터 시스템(100)을 도시하는 블록도이다. 컴퓨터 시스템(100)은 정보를 전달하기 위한 버스(102) 또는 다른 통신 메커니즘, 및 정보를 처리하기 위하여 버스(102)에 연결되어 있는 프로세서(104) (또는 다수의 프로세서(104, 105))를 포함하고 있다. 컴퓨터 시스템(100)은 또한 프로세서(104)에 의해 실행될 명령어 및 정보를 저장하기 위하여 버스(102)에 연결되어 있는, 랜덤 액세스 메모리(RAM) 또는 기타 동적 저장 디바이스와 같은 메인 메모리(106)를 포함하고 있다. 메인 메모리(106)는 또한 프로세서(104)에 의해 실행될 명령어의 실행 동안 임시 변수들 또는 다른 중간 정보를 저장하기 위하여 사용될 수 있다. 컴퓨터 시스템(100)은 프로세서(104)에 대한 정적 정보 및 명령어를 저장하기 위하여 버스(102)에 연결된 판독 전용 메모리(ROM)(108) 또는 기타 정적 저장 디바이스를 더 포함하고 있다. 자기 디스크 또는 광학 디스크와 같은 저장 디바이스(110)가 정보 및 명령어를 저장하기 위하여 제공되고 버스(102)에 연결되어 있다.
컴퓨터 시스템(100)은 정보를 컴퓨터 사용자에게 디스플레이하기 위하여, 음극선관(CRT) 또는 플랫 패널 또는 터치 패널 디스플레이와 같은 디스플레이(112)에 버스(102)를 통해 연결될 수 있다. 영 숫자 및 다른 키를 포함하는 입력 디바이스(114)가 정보 및 명령 선택을 프로세서(104)에 전달하기 위하여 버스(102)에 연결되어 있다. 또 다른 유형의 사용자 입력 디바이스는 방향 정보 및 명령 선택을 프로세서(104)에 전달하기 위한 그리고 디스플레이(112) 상에서의 커서 이동을 제어하기 위한 마우스, 트랙볼 또는 커서 방향 키와 같은 커서 제어부(116)이다. 이 입력 디바이스는 전형적으로 디바이스가 평면 내의 위치를 특정하는 것을 허용하는 2개의 축, 즉 제1 축 (예를 들어, x)과 제2 축(예를 들어, y)에서의 2개의 자유도를 갖는다. 터치 패널 (스크린) 디스플레이 또한 입력 디바이스로서 사용될 수 있다.
실시예에 따르면, 본 명세서에 설명된 하나 이상의 방법의 공정의 부분들은 메인 메모리(106)에 포함된 하나 이상의 명령어의 하나 이상의 시퀀스를 실행하는 프로세서(104)에 응답하여 컴퓨터 시스템(100)에 의해 수행될 수 있다. 이러한 명령어는 저장 디바이스(110)와 같은 또 다른 컴퓨터 판독 가능 매체로부터 메인 메모리(106)로 판독될 수 있다. 메인 메모리(106)에 포함된 명령어의 시퀀스의 실행은 프로세서(104)가 명세서에 설명된 공정 단계를 수행하게 한다. 다중 처리 배열체 내의 하나 이상의 프로세서는 또한 메인 메모리(106)에 포함된 명령어의 시퀀스를 실행하기 위해 이용될 수 있다. 대안적인 실시예에서, 하드-와이어드(hard-wired) 회로가 소프트웨어 명령어 대신에 또는 그와 조합하여 사용될 수 있다. 따라서, 본 명세서 내의 설명은 하드웨어 회로와 소프트웨어의 임의의 특정 조합으로 제한되지 않는다.
본 명세서에서 사용되는 바와 같은 용어 "컴퓨터 판독-가능한 매체"는 실행을 위하여 프로세서(104)에 명령어를 제공하는 것에 참여하는 임의의 매체를 지칭한다. 이러한 매체는, 비휘발성 매체, 휘발성 매체 및 전송 매체를 포함하는, 그러나 이에 제한되지 않는 많은 형태를 취할 수 있다. 비휘발성 매체는, 예를 들어 저장 디바이스(110)와 같은 광학 또는 자기 디스크를 포함한다. 휘발성 매체는 메인 메모리(106)와 같은 동적 메모리를 포함한다. 전송 매체는 버스(102)를 포함하는 와이어를 포함하는 동축 케이블, 구리 와이어 및 광섬유를 포함한다. 전송 매체는 또한 무선 주파수(RF) 및 적외선(IR) 데이터 통신 동안 생성되는 것과 같은 음향파 또는 광파의 형태를 취할 수 있다. 컴퓨터 판독-가능한 매체의 일반적인 형태는, 예를 들어 플로피 디스크, 플렉시블 디스크, 하드 디스크, 자기 테이프, 임의의 다른 자기 매체, CD-ROM, DVD, 임의의 다른 광학 매체, 펀치 카드, 종이 테이프, 구멍의 패턴을 갖는 임의의 다른 물리적 매체, 램(RAM), 피롬(PROM) 및 이피롬(EPROM), 플래시-이피롬(FLASH-EPROM), 임의의 다른 메모리 칩 또는 카트리지, 이하 설명되는 바와 같은 반송파, 또는 컴퓨터가 판독할 수 있는 임의의 다른 매체를 포함한다.
다양한 형태의 컴퓨터 판독 가능한 매체가 실행을 위하여 하나 이상의 명령어의 하나 이상의 시퀀스를 프로세서(104)로 운반하는데 관련될 수 있다. 예를 들어, 명령어는 초기에 원격 컴퓨터의 자기 디스크에 저장(borne)될 수 있다. 원격 컴퓨터는 명령어를 그의 동적 메모리 내로 로딩하고, 모뎀을 사용하여 전화선을 통해 명령어를 보낼 수 있다. 컴퓨터 시스템(100)에 로컬인 모뎀은 전화선으로 데이터를 수신할 수 있으며 적외선 송신기를 사용하여 데이터를 적외선 신호로 변환시킬 수 있다. 버스(102)에 연결된 적외선 검출기는 적외선 신호로 운반된 데이터를 수신할 수 있으며 데이터를 버스(102)에 배치할 수 있다. 버스(102)는 데이터를 메인 메모리(106)로 운반하며, 프로세서(104)는 메인 메모리로부터 명령어를 검색하고 실행한다. 메인 메모리(106)에 의해 수신된 명령어는 프로세서(104)에 의한 실행 전 또는 실행 후에 저장 디바이스(110)에 선택적으로 저장될 수 있다
컴퓨터 시스템(100)은 또한 버스(102)에 연결되어 있는 통신 인터페이스(118)를 포함할 수 있다. 통신 인터페이스(118)는 로컬 네트워크(122)에 연결되어 있는 네트워크 링크(120)에 대한 양방향 데이터 통신 커플링을 제공한다. 예를 들어, 통신 인터페이스(118)는 대응하는 유형의 전화선에 데이터 통신 연결을 제공하기 위한 통합 서비스 디지털 네트워크(ISDN) 카드 또는 모뎀일 수 있다. 또 다른 예로서, 통신 인터페이스(118)는 호환 가능한 LAN에 대한 데이터 통신 연결을 제공하기 위하여 근거리 통신 네트워크(LAN) 카드일 수 있다. 무선 링크 또한 구현될 수 있다. 임의의 이러한 구현 형태에서, 통신 인터페이스(118)는 다양한 유형의 정보를 나타내는 디지털 데이터 스트림을 운반하는 전기, 전자기 또는 광학 신호를 송신하고 수신한다.
네트워크 링크(120)는 전형적으로 하나 이상의 네트워크를 통해 다른 데이터 디바이스로의 데이터 통신을 제공한다. 예를 들어, 네트워크 링크(120)는 로컬 네트워크(122)를 통해 호스트 컴퓨터(124)로의 또는 인터넷 서비스 제공자(ISP)(126)에 의해 운영되는 데이터 장비로의 연결을 제공할 수 있다. ISP(126)는 결과적으로 현재 흔히 "인터넷"(128)으로 지칭되는 월드와이드 패킷 데이터 통신 네트워크를 통해 데이터 통신 서비스를 제공한다. 로컬 네트워크(122)와 인터넷(128)은 모두 디지털 데이터 스트림을 운반하는 전기, 전자기 또는 광학 신호를 사용한다. 컴퓨터 시스템(100)으로 그리고 컴퓨터 시스템으로부터 디지털 데이터를 운반하는, 다양한 네트워크를 통한 신호 및 네트워크 링크(120) 상의 그리고 통신 인터페이스(118)를 통한 신호는 정보를 전달하는 반송파의 예시적인 형태이다.
컴퓨터 시스템(100)은 네트워크(들), 네트워크 링크(120), 및 통신 인터페이스(118)를 통하여 메시지를 보낼 수 있으며 또한 프로그램 코드를 포함하는 데이터를 수신할 수 있다. 인터넷 예에서, 서버(130)는 인터넷(128), ISP(126), 로컬 네트워크(122) 및 통신 인터페이스(118)를 통하여 응용 프로그램에 대한 요청된 코드를 전송할 수 있다. 예를 들어, 하나의 이러한 다운로드된 애플리케이션은 본 명세서에서 설명된 방법의 전부 또는 일부를 제공할 수 있다. 수신된 코드는 수신될 때 프로세서(104)에 의해 실행될 수 있으며 및/또는 추후 실행을 위하여 저장 디바이스(110) 또는 다른 비휘발성 저장부에 저장될 수 있다. 이러한 방식으로, 컴퓨터 시스템(100)은 반송파의 형태의 애플리케이션 코드를 획득할 수 있다.
도 8은 실시예에 따른 리소그래피 투영 장치의 개략도이다. 리소그래피 투영 장치는 조명 시스템(IL), 제1 대상물 테이블(MT), 제2 대상물 테이블(WT), 및 투영 시스템(PS)을 포함할 수 있다. 조명 시스템(IL)은 방사선의 빔(B)을 조절할 수 있다. 이 예에서, 조명 시스템은 또한 방사선 소스(SO)를 포함하고 있다. 제1 대상물 테이블 (예를 들어, 패터닝 디바이스 테이블)(MT)은 패터닝 디바이스(MA) (예를 들어, 레티클)를 유지시키기 위한 패터닝 디바이스 홀더를 구비할 수 있으며, 아이템(item)(PS)에 대해 패터닝 디바이스를 정확하게 위치시키기 위해 제1 포지셔너에 연결될 수 있다. 제2 대상물 테이블 (예를 들어, 기판 테이블)(WT)은 기판(W) (예를 들어, 레지스트 코팅된 실리콘 웨이퍼)을 유지시키기 위한 기판 홀더를 구비할 수 있으며, 아이템(PS)에 대해 기판을 정확하게 위치시키기 위해 제2 포지셔너에 연결될 수 있다. (예를 들어, 렌즈를 포함하는) 투영 시스템(PS) (예를 들어, 굴절형, 반사형 또는 반사굴절형 광학 시스템)은 패터닝 디바이스(MA)의 조사된 부분을 기판(W)의 (예를 들어, 하나 이상의 다이를 포함하는) 타겟 부분(C) 상으로 이미징할 수 있다.
도시된 바와 같이, 장치는 투과 유형일 수 있다 (즉, 투과형 패터닝 디바이스를 갖는다). 그러나, 일반적으로 이는 또한 예를 들어 (반사형 패터닝 디바이스를 갖는) 반사 유형일 수 있다. 장치는 전형적인 마스크에 대해 상이한 종류의 패터닝 디바이스를 사용할 수 있다; 예를 들어 프로그램 가능한 미러 어레이 또는 LCD 매트릭스를 포함할 수 있다.
소스 SO (예를 들어, 수은 램프 또는 엑시머 레이저, LPP(레이저 생성 플라즈마) EUV 소스)는 방사선의 빔을 생성한다. 이 빔은 직접적으로 또는, 예를 들어 빔 익스팬더(beam expander)와 같은 조절 수단을 가로지른 후 조명 시스템(일루미네이터)(IL)으로 공급된다. 일루미네이터(IL)는 빔 내의 세기 분포의 (통상적으로, 외측-σ 및 내측-σ로 각각 지칭되는) 외부 및/또는 내부 반경 방향 크기를 설정하는 조정 수단(AD)을 포함할 수 있다. 또한, 이는 일반적으로 집속기(IN) 및 집광기(CO)와 같은 다양한 다른 구성 요소를 포함할 것이다. 이렇게 하여, 패터닝 디바이스(MA)에 충돌하는 빔(B)은 그 단면에 원하는 균일성 및 세기 분포를 갖는다.
일부 실시예에서, 소스(SO)는 (흔히 소스(SO)가, 예를 들어 수은 램프인 경우에서와 같이) 리소그래피 투영 장치의 하우징 내에 있을 수 있지만, 이는 또한 리소그래피 투영 장치로부터 멀리 떨어져 있을 수 있다. 이것이 생성하는 방사선 빔은 (예를 들어, 적절한 지향 미러의 도움으로) 장치 내로 안내될 수 있다. 이 후자의 시나리오는 소스(SO)가 (예를 들어, KrF, ArF 또는 F2 레이징(lasing)을 기반으로 하는) 엑시머 레이저인 경우일 수 있다.
빔(B)은 그후 패터닝 디바이스 테이블(MT) 상에 유지되어 있는 패터닝 디바이스(MA)를 통과(intercept)할 수 있다. 패터닝 디바이스(MA)를 가로지른 빔(B)은 렌즈를 통과할 수 있으며, 렌즈는 빔(B)을 기판(W)의 타겟 부분(C) 상으로 집속시킨다. 제2 위치 설정 수단 (및 간섭 측정 수단(IF))의 도움으로, 기판 테이블(WT)은 정확하게 이동되어, 예를 들어 상이한 타겟 부분(C)들을 빔(B)의 경로 내에 위치시킬 수 있다. 이와 유사하게, 제1 위치 설정 수단이 사용되어, 예를 들어 패터닝 디바이스 라이브러리로부터의 패터닝 디바이스(MA)의 기계적 검색(retrieval) 후 또는 스캔 동안에 패터닝 디바이스(MA)를 빔(B)의 경로에 대해 정확히 위치시킬 수 있다. 일반적으로, 대상물 테이블(WT, MT)의 이동은 장-스트로크 모듈 (개략적인 위치 설정) 및 단-스트로크 모듈 (미세한 위치 설정)의 도움으로 실현될 수 있다. 그러나 스테퍼의 경우(스텝-앤-스캔 툴과는 대조적으로), 패터닝 디바이스 테이블(MT)은 단 스트로크 액추에이터에 연결될 수 있거나, 고정될 수 있다.
도시된 툴은 2개의 상이한 모드; 스텝 모드와 스캔 모드에서 사용될 수 있다. 스텝 모드에서, 패터닝 디바이스 테이블(MT)은 본질적으로 정지 상태로 유지되며, 전체 패터닝 디바이스 이미지는 한 번의 작동 (즉, 단일 "플래시(flash)")으로 타겟 부분(C) 상으로 투영된다. 기판 테이블(WT)은 상이한 타겟 부분(C)이 빔(B)에 의해 조사될 수 있도록 x 및/또는 y 방향으로 시프트될 수 있다. 스캔 모드에서, 주어진 타겟 부분(C)이 단일 "플래시"에 노광되지 않는다는 점을 제외하고 본질적으로 동일한 시나리오가 적용된다. 대신에, 패터닝 디바이스 테이블(MT)은 속도 v로 주어진 방향 (예를 들어, "스캔 방향" 또는 "y" 방향)으로 이동 가능하며, 따라서 투영 빔(B)은 패터닝 디바이스 이미지를 스캔하게 된다. 동시에, 기판 테이블(WT)은 속도 V=Mv로 동일 또는 반대 방향으로 동시에 이동하게 되며, 여기서 M은 렌즈의 배율 (전형적으로, M=1/4 또는 1/5)이다. 이러한 방식으로, 분해능에 대해 타협하지 않고 비교적 큰 타겟 부분(C)이 노광될 수 있다
도 9는 또 다른 리소그래피 투영장치(LA)의 개략도이다. LA는 소스 컬렉터 모듈(SO), 방사선 빔(B) (예를 들어, EUV 방사선)을 조절하도록 구성된 조명 시스템(일루미네이터)(IL), 지지 구조체(MT), 기판 테이블(WT), 및 투영 시스템(PS)을 포함할 수 있다. 지지 구조체 (예를 들어, 패터닝 디바이스 테이블)(MT)는 패터닝 디바이스 (예를 들어, 마스크 또는 레티클)(MA)를 지지하도록 구성될 수 있으며 패터닝 디바이스를 정확하게 위치시키도록 구성된 제1 포지셔너(PM)에 연결될 수 있다. 기판 테이블 (예를 들어, 웨이퍼 테이블)(WT)은 기판(예를 들어, 레지스트 코팅된 웨이퍼)(W)을 유지시키도록 구성될 수 있으며 기판을 정확하게 위치시키도록 구성된 제2 포지셔너(PW)에 연결될 수 있다. 투영 시스템(예를 들어, 반사형 투영 시스템)(PS)은 패터닝 디바이스(MA)에 의해 방사선 빔(B)에 부여된 패턴을 기판(W)의 (예를 들어, 하나 이상의 다이를 포함하는) 타겟 부분(C) 상으로 투영하도록 구성될 수 있다.
이 예에서 보여지는 바와 같이, LA는 (예를 들어, 반사형 패터닝 디바이스를 사용하는) 반사 유형일 수 있다. 대부분의 재료가 EUV 파장 범위 내에서 흡수성이기 때문에 패터닝 디바이스는 예를 들어 몰리브덴 및 실리콘의 다중-스택을 포함하는 다층 리플렉터를 가질 수 있다는 점이 주목되어야 한다. 일 예에서, 다중-스택 리플렉터는 40개 층의 몰리브덴 및 실리콘 쌍들을 갖고 있으며 여기서 각 층의 두께는 1/4 파장(quarter wavelength)이다. 훨씬 더 작은 파장들이 X-선 리소그래피로 생성될 수 있다. 대부분의 재료가 EUV 및 x-선 파장에서 흡수성이기 때문에, 패터닝 디바이스 토포그래피 상의 패터닝된 흡수성 재료의 박편(thin piece) (예를 들어, 다중-층 리플렉터의 최상부 상의 TaN 흡수재)은 피처가 프린트될 (포지티브 레지스트) 프린트되지 않을(네거티브 레지스트) 위치를 규정한다.
일루미네이터(IL)는 소스 컬렉터 모듈(SO)로부터 극자외 방사선 빔을 받아들인다. EUV 방사선을 생성하는 방법은 EUV 범위 내의 하나 이상의 방출 라인을 갖는 적어도 하나의 원소, 예를 들어 크세논, 리튬 또는 주석을 갖는 재료를 플라즈마 상태로 전환하는 것을 포함하지만, 반드시 이에 제한되는 것은 아니다. 흔히 레이저 생성 플라즈마("LPP")로 지칭되는 이러한 한 방법에서, 플라즈마는 라인-방출 원소를 갖는 재료의 액적(droplet), 스트림 또는 클러스터와 같은 연료를 레이저 빔으로 조사함으로써 생성될 수 있다. 소스 컬렉터 모듈(SO)은 연료를 여기시키는 레이저 빔을 제공하기 위한, (도 10에서는 보이지 않는) 레이저를 포함한 EUV 방사선 시스템의 일부일 수 있다. 결과적인 플라즈마는 출력 방사선, 예를 들어 EUV 방사선을 방출하며, 이는 소스 컬렉터 모듈 내에 배치된 방사선 컬렉터를 이용하여 수집된다. 예를 들어, CO2 레이저가 연료 여기를 위한 레이저 빔을 제공하기 위해 사용될 때, 레이저 및 소스 컬렉터 모듈은 별도의 개체일 수 있다. 이 예에서, 레이저는 리소그래피 장치의 일부를 형성하는 것으로 간주되지 않을 수 있으며, 방사선 빔은 예를 들어, 적절한 지향 미러 및/또는 빔 익스팬더(beam expander)를 포함하는 빔 전달 시스템의 도움으로 레이저로부터 소스 컬렉터 모듈로 나아갈 수 있다. 다른 예에서, 예를 들어 소스가 흔히 DPP 소스로 지칭되는 방전 생성 플라즈마 EUV생성기일 때, 소스는 소스 컬렉터 모듈의 통합된 부분일 수 있다.
일루미네이터(IL)는 방사선 빔의 각도 세기 분포를 조정하기 위한 조정기를 포함할 수 있다. 일반적으로, 일루미네이터의 퓨필 평면 내의 세기 분포의 (통상적으로, 외측-σ 및 내측-σ로 각각 지칭되는) 적어도 외부 및/또는 내부 반경 크기가 조정될 수 있다. 또한, 일루미네이터(IL)는 패싯 필드(facetted field) 및 퓨필 미러(pupil mirror) 디바이스와 같은, 다양한 다른 구성 요소를 포함할 수 있다. 일루미네이터는 방사선 빔의 횡단면에 원하는 균일성 및 세기 분포를 갖기 위해, 방사선 빔을 조정하는 데 사용될 수 있다.
방사선 빔(B)은 지지 구조체 (예를 들어, 패터닝 디바이스 테이블)(MT) 상에 유지되어 있는 패터닝 디바이스 (예를 들어, 마스크)(MA)에 입사되며, 패터닝 디바이스에 의해 패터닝된다. 패터닝 디바이스 (예를 들어, 마스크)(MA)에서 반사된 후, 방사선 빔(B)은 투영 시스템(PS)을 통과하며, 투영 시스템은 기판(W)의 타겟 부분(C) 상으로 빔을 집속한다. 제2 포지셔너(PW) 및 위치 센서(PS2) (예를 들어, 간섭계 디바이스, 선형 인코더, 인코더, 또는 용량성 센서)의 도움으로, 기판 테이블(WT)은 (예를 들어, 방사선 빔(B)의 경로 내에 상이한 타겟 부분(C)들을 위치시키기 위하여) 정확하게 이동될 수 있다. 이와 유사하게, 제1 포지셔너(PM) 및 또 다른 위치 센서(PS1)는 방사선 빔(B)의 경로에 대해 패터닝 디바이스 (예를 들어, 마스크)(MA)를 정확히 위치시키기 위해 사용될 수 있다. 패터닝 디바이스 (예를 들어, 마스크)(MA) 및 기판(W)은 패터닝 디바이스 정렬 마크(M1, M2) 및 기판 정렬 마크(P1, P2)를 이용하여 정렬될 수 있다.
도시된 장치(LA)는 다음 모드, 스텝 모드, 스캔 모드 및 정지 모드 중 적어도 하나의 모드에서 사용될 수 있다. 스텝 모드에서, 지지 구조체 (예를 들어, 패터닝 디바이스 테이블)(MT) 및 기판 테이블(WT)은 기본적으로 정지 상태로 유지되는 반면, 방사선 빔에 부여되는 전체 패턴은 한 번에 타겟 부분(C) 상으로 투영된다 (즉, 단일 정적 노광). 그후 기판 테이블(WT)은 상이한 타겟 부분(C)이 노광될 수 있도록 X 및/또는 Y 방향으로 시프트된다. 스캔 모드에서, 방사선 빔에 부여된 패턴이 타겟 부분(C) 상으로 투영되는 동안에 지지 구조체 (예를 들어, 패터닝 디바이스 테이블)(MT) 및 기판 테이블(WT)은 동시에 스캐닝된다 (즉, 단일 동적 노광). 지지 구조체 (예를 들어, 패터닝 디바이스 테이블)(MT)에 대한 기판 테이블(WT)의 속도 및 방향은 투영 시스템(PS)의 확대/축소율 및 이미지 반전 특성에 의해 결정될 수 있다. 정지 상태 모드에서, 프로그램 가능한 패터닝 디바이스를 유지하면서 지지 구조체 (예를 들어, 마스크 테이블)(MT)는 실질적으로 정지 상태로 유지되며, 방사선 빔(B)에 부여된 패턴이 타겟 부분(C) 상으로 투영되는 동안에 기판 테이블(WT)은 이동되거나 스캐닝된다. 이 모드에서는, 일반적으로 펄스형 방사선 소스가 이용되며, 프로그램 가능한 패터닝 디바이스는 기판 테이블(WT)의 각 이동 후, 또는 스캔 중에 연속적인 방사선 펄스들 사이에서 필요에 따라 업데이트된다. 이 작동 모드는 앞서 언급된 바와 같은 유형의 프로그램 가능한 미러 어레이와 같은 프로그램 가능한 패터닝 디바이스를 이용하는 마스크없는(maskless) 리소그래피에 용이하게 적용될 수 있다.
도 10은 도 9 (및 도 8)에서 보여지는 LA와 유사한 또는 동일한 리소그래피 투영 장치(1000)의 상세도이다. 도 10에서 보여지는 바와 같이, 리소그래피 투영 장치는 소스 컬렉터 모듈(SO), 조명 시스템(IL), 및 투영 시스템(PS)을 포함하고 있다. 소스 컬렉터 모듈(SO)은 진공 환경이 소스 컬렉터 모듈(SO)의 외함 구조체(enclosing structure)(220) 내에 유지될 수 있도록 구성되어 있다. EUV 방사선 방출 플라즈마(210)는 방전 생성 플라즈마 소스에 의해 형성될 수 있다. EUV 방사선은, 전자기 스펙트럼의 EUV 범위 내의 방사선을 방출하기 위해 고온의 플라즈마(210)가 생성되는 가스 또는 증기, 예를 들어 Xe 가스, Li 증기 또는 Sn 증기에 의해 생성될 수 있다. 고온의 플라즈마(210)는, 예를 들어 적어도 부분적으로 이온화된 플라즈마를 유발하는 전기 방전에 의해 생성된다. 방사선의 효율적인 생성을 위하여 Xe, Li, Sn 증기 또는 임의의 다른 적절한 가스 또는 증기의, 예를 들어 10Pa의 부분 압력이 요구될 수 있다. 일부 실시예에서, 여기된 주석(Sn)의 플라즈마가 제공? EUV 방사선을 생성한다.
고온의 플라즈마(210)에 의해 방출된 방사선은, 소스 챔버(211)의 개구 내에 또는 그 뒤에 위치되는 선택적인 가스 배리어 또는 오염물 트랩(230) (일부 경우에, 오염물 배리어 또는 포일 트랩(foil trap)으로 지칭됨)을 통하여 소스 챔버(211)에서 컬렉터 챔버(212) 내로 나아간다. 오염물 트랩(230)은 채널 구조체를 포함할 수 있다. 컬렉터 챔버(212)는 그레이징 입사 컬렉터(grazing incidence collector)일 수 있는 방사선 컬렉터(CO)를 포함할 수 있다. 방사선 컬렉터(CO)는 상류 방사선 컬렉터 측(251) 및 하류 방사선 컬렉터 측(252)을 갖고 있다. 컬렉터(CO)를 가로지르는 방사선은 격자 스펙트럼 필터(240)에서 반사되어, 점선 "O"로 나타낸 광학 축을 따라 가상 소스 포인트(virtual source point)(IF)에 집속될 수 있다. 가상 소스 포인트(IF)는 흔히 중간 초점으로서 지칭되며, 소스 컬렉터 모듈은 중간 초점(IF)이 외함 구조체(220)의 개구(221)에, 또는 그 근처에 위치되도록 배열된다. 가상 소스 포인트(IF)는 방사선 방출 플라즈마(210)의 이미지이다.
그 후에, 방사선은 조명 시스템(IL)을 가로지르며, 이 조명 시스템은 패터닝 디바이스(MA)에서 방사선 세기의 원하는 균일성뿐만 아니라 패터닝 디바이스(MA)에서 방사선 빔(21)의 원하는 각도 분포를 제공하도록 배열된 패싯 필드 미러 디바이스(22)와 패싯 퓨필 미러 디바이스(24)를 포함할 수 있다. 지지 구조체(MT)에 의해 유지되는 패터닝 디바이스(MA)에서의 방사선의 빔(21)의 반사 시에, 패터닝된 빔(26)이 형성되며 패터닝된 빔(26)은 기판 테이블(WT)에 의해 유지되고 있는 기판(W) 상으로 반사 요소(28, 30)를 통해 투영 시스템(PS)에 의해 이미지화된다. 일반적으로, 보여지는 것보다 더 많은 요소가 조명 광학계 유닛(IL) 및 투영 시스템(PS) 내에 존재할 수 있다. 격자 스펙트럼 필터(240)는, 예를 들어 리소그래피 장치의 유형에 따라 선택적으로 존재할 수 있다. 또한, 도면에서 보여지는 것보다 더 많은 미러가 있을 수 있으며, 예를 들어, 도 10에서 보여지는 것보다 1 내지 6개의 부가적인 반사 요소가 투영 시스템(PS) 내에 존재할 수 있다.
도 10에 도시된 바와 같이, 컬렉터 광학계(CO)는 단지 컬렉터 (또는 컬렉터 미러)의 예로서, 그레징 입사 반사기(253, 254 및 255)를 갖는 네스티드 컬렉터(nested collector)로서 도시되어 있다. 그레이징 입사 반사기(253, 254 및 255)는 광학 축(O) 주위에 축대칭적으로 배치되어 있으며, 이 유형의 컬렉터 광학계(CO)는 흔히 DPP 소스로 불리는 방전 생성 플라즈마 소스와 조합하여 사용될 수 있다
도 11은 이전 도면에서 보여지는 리소그래피 투영 장치의 소스 컬렉터 모듈(SO)의 상세도이다. 소스 컬렉터 모듈(SO)은 리소그래피 투영 장치 방사선 시스템의 일부일 수 있다. 레이저(LAS)는 크세논(Xe), 주석(Sn) 또는 리튬(Li)과 같은 연료에 레이저 에너지를 증착하도록 배열될 수 있어 수십 eV의 전자 온도를 갖는 고도로 이온화된 플라즈마(210)를 생성한다. 이 이온들의 탈여기 및 재결합 동안 생성된 에너지 방사선은 플라즈마로부터 방출되고, 근수직 입사 컬렉터 광학계(CO)에 의하여 수집되며, 외함 구조체(220)의 개구(221) 상으로 집속된다.
본 명세서에 개시된 개념은 서브 파장 피처를 이미징하기 위하여 임의의 일반적인 이미징 시스템을 시뮬레이션하거나 수학적으로 모델링할 수 있으며, 또한 점점 더 짧은 파장을 생성할 수 있는 최근의 이미징 기술에 특히 유용할 수 있다. 이미 사용 중인 새로운 기술은 EUV (극자외), ArF 레이저를 사용하여 193㎚ 파장, 및 심지어 불소 레이저를 사용하여 157㎚ 파장을 생성할 수 있는 DUV 리소그래피를 포함한다. 더욱이, 5 내지 20㎚ 범위 내의 광자를 생성하기 위하여, EUV 리소그래피는 싱크로트론(synchrotron)을 사용함으로써 또는 고에너지 전자로 재료 (고체 또는 플라즈마)를 타격함으로써 이 범위 내의 파장을 생성할 수 있다.
실시예는 다음 조항을 이용하여 추가로 설명될 수 있다:
1. 반도체 제조 공정 매개변수에 대한 조정을 결정하기 위한 방법은;
매개변수화된 모델로, 매개변수화된 모델과 연관된 잠재 공간 내의 차원 데이터를 클러스터들로 클러스터링하는 것 -상이한 클러스터들은 주어진 입력의 상이한 부분들에 대응함 -;
매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 기반으로 출력을 예측하는 것;
매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 클러스터들 중 하나 이상에 대응하는 주어진 입력의 복구된 버전으로 변환하는 것;
클러스터, 출력 및/또는 주어진 입력의 복구된 버전을 기반으로, 매개변수화된 모델 예측의 확실성을 증가시키기 위해 매개변수화된 모델의 하나 이상의 매개변수를 조정하는 것; 및
조정된 매개변수화된 모델로부터의 예측을 기반으로 하나 이상의 반도체 제조 공정 매개변수에 대한 조정을 결정하는 것을 포함한다.
2. 조항 1의 방법은 클러스터, 출력, 및/또는 주어진 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 더 포함하여 반도체 제조 공정의 일부로서 연속 톤 마스크(CTM)를 예측하기 위한 매개변수화된 모델의 확실성을 증가시킨다.
3. 조항 1 및 2 중 어느 한 조항의 방법에서, 하나 이상의 결정된 반도체 제조 공정 매개변수는 마스크 디자인, 퓨필 형상, 선량 또는 초점 중 하나 이상을 포함한다.
4. 조항 3의 방법에서, 하나 이상의 결정된 반도체 제조 공정 매개변수는 마스크 디자인을 포함하며, 하나 이상의 반도체 제조 공정 매개변수에 대한 조정을 결정하는 것은 마스크 디자인을 제1 마스크 디자인에서 제2 마스크 디자인으로 변경하는 것을 포함한다.
5. 조항 1 내지 4 중 어느 조항의 방법에서, 주어진 입력은 이미지, 클립(clip), 인코딩된 이미지, 인코딩된 클립, 또는 매개변수화된 모델의 이전 층으로부터의 데이터 중 하나 이상을 포함한다.
6. 매개변수화된 모델 예측을 이루는 방법은,
매개변수화된 모델로, 매개변수화된 모델과 연관된 잠재 공간 내의 차원 데이터를 클러스터들로 클러스터링하는 것-상이한 클러스터들은 주어진 입력의 상이한 부분들에 대응함-;
매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 기반으로 출력을 예측하는 것; 및
매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 하나 이상의 클러스터에 해당하는 주어진 입력의 복구된 버전으로 변환하는 것을 포함한다.
7. 조항 6의 방법에서, 예측하는 것과 변환하는 것은 동시적이다.
8. 조항 6 또는 7의 방법에서, 잠재 공간 내의 차원 데이터는 주어진 입력의 복구된 버전으로 변환되어 잠재 공간 내의 관심 대상 지점의 시각화를 용이하게 한다.
9. 조항 6 내지 8 중 어느 한 조항의 방법은 잠재 공간 내의 관심 대상 지점을 식별하는 것을 더 포함한다.
10. 조항 9의 방법에서, 관심 대상 지점은 잠재 공간 내의 다른 지점, 클러스터 내부에 위치하지 않는 지점, 또는 잠재 공간 내의 다른 지점들 및/또는 다른 클러스터들 간의 직교 거리(cartesian distance)와 비교하여 잠재 공간 내의 하나 이상의 다른 지점 및/또는 클러스터에서 비교적 멀리 있는 직교 거리에 위치된 지점과 비교하여, 상대적으로 높은 분산 또는 불확실성을 갖는 지점들 중 하나 이상을 포함한다.
11. 조항 8항 내지 10 중 어느 한 조항의 방법은 매개변수화된 모델의 성능을 평가하기 위해 관심 대상 지점, 클러스터, 주어진 입력의 복구된 버전, 및/또는 출력을 사용하는 것을 더 포함한다.
12. 조항 6 내지 11 중 어느 한 조항의 방법은 매개변수화된 모델로, 주어진 입력과 연관된 더 높은 차원 데이터를 잠재 공간 내의 차원 데이터로 변환하는 것을 더 포함한다.
13. 조항 6 내지 12 중 어느 한 조항의 방법에서, 매개변수화된 모델은 기계 학습 모델이다.
14. 조항 6 내지 13 중 어느 한 조항의 방법에서, 매개변수화된 모델은 인코더-디코더 아키텍처를 포함한다.
15. 조항 14항의 방법에서, 인코더-디코더 아키텍처는 변분 인코더-디코더 아키텍처를 포함하며, 본 방법은 출력 공간의 구현을 생성하는 확률적 잠재 공간으로 변분 인코더-디코더 아키텍처를 트레이닝하는 것을 더 포함한다.
16. 조항 15의 방법에서, 잠재 공간은 저차원 인코딩을 포함한다.
17. 조항 14 내지 16 중 어느 한 조항의 방법에서, 잠재 공간 내의 차원 데이터는 인코더-디코더 아키텍처의 인코더에 의하여 인코딩된다.
18. 조항 14 내지 17 중 어느 조항의 방법에서, 출력은 인코더-디코더 아키텍처의 제1 부분으로, 잠재 공간 내의 차원 데이터를 기반으로 예측된다.
19. 조항 18의 방법에서, 인코더-디코더 아키텍처의 제1 부분은 제1 디코더이다.
20. 조항 14 내지 19 중 어느 한 조항의 방법에서, 잠재 공간 내의 차원 데이터는 인코더-디코더 아키텍처의 제2 디코더에 의하여, 주어진 입력의 복구된 버전으로 변환된다.
21. 조항 6항 내지 20 중 어느 한 조항의 방법에서, 주어진 입력은 이미지, 클립, 인코딩된 이미지, 인코딩된 클립, 또는 반도체 제조 공정과 연관된 매개변수화된 모델의 이전 층으로부터의 데이터 중 하나 이상을 포함한다.
22. 조항 21의 방법에서, 주어진 입력은 타겟 패턴 디자인, 결함, 또는 반도체 제조 공정을 위한 공정 매개변수와 연관된다.
23. 조항 6항 내지 22 중 어느 한 조항의 방법에서, 출력은 예측된 마스크 이미지, 결함의 확률, 또는 반도체 제조 공정에 대한 예측된 공정 매개변수를 포함한다.
24. 조항 6항 내지 23 중 어느 한 조항의 방법은 클러스터, 출력, 및/또는 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 더 포함한다.
25. 조항 24의 방법에서, 조정하는 것은 출력의 하나 이상의 부분과 그라운드 스루(ground truth)의 하나 이상의 부분 간의 일치를 향상시키도록 구성된다.
26. 조항 24 또는 25 중 어느 한 조항의 방법에서, 매개변수화된 모델을 조정하는 것은 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것 및/또는 클러스터들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 매개변수화된 모델을 트레이닝하는 것을 포함한다.
27. 조항 26의 방법에서, 잠재 공간 내의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것, 또는 클러스터들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 매개변수화된 모델을 트레이닝하는 것은,
매개변수화된 모델을 트레이닝하기 위한 입력으로서 이전 트레이닝 자료에 대하여 클러스터들 중 하나 이상과 관련된 더 다양한 이미지, 더 다양한 데이터 및 부가적인 클립을 사용하는 것; 및/또는
벡터를 인코딩하기 위한 더 많은 차원과 매개변수화된 모델 내의 더 많은 인코딩 계층을 이용하는 것을 포함한다.
28. 조항 26 또는 27 중 어느 한 조항의 방법에서, 더 다양한 트레이닝 샘플은 이전 트레이닝 자료에 대해 부가적인 및/또는 더 다양한 이미지, 부가적인 및/또는 더 다양한 데이터, 및 부가적인 및/또는 더 다양한 클립을 포함한다.
29. 조항 6 내지 28 중 어느 한 조항의 방법은 잠재 공간 내의 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 차원 데이터의 다른 클러스터 또는 클러스터의 다른 부분과 비교하여 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것을 더 포함한다.
30. 조항 29의 방법에서, 잠재 공간 내의 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것은 부가적인 트레이닝 데이터의 선택을 용이하게 한다.
31. 조항 30의 방법은 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 보다 서술적으로 만드는 것 및/또는 매개변수화된 모델을 더 높은 분산과 연관된 결정된 클러스터들 또는 클러스터들의 부분들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 트레이닝하는 것을 더 포함한다.
32. 조항 6 내지 31 중 어느 한 조항의 방법은 클러스터, 출력, 및/또는 주어진 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 더 포함하여 반도체 제조 공정의 일부로서 기판 기하학적 구조를 예측하기 위한 매개변수화된 모델의 확실성을 증가시킨다.
33. 조항 6항 내지 32 중 어느 한 조항의 방법은 클러스터, 출력, 및/또는 주어진 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 더 포함하여 반도체 제조 공정의 일부로서 연속 톤 마스크(CTM)를 예측하기 위한 매개변수화된 모델의 확실성을 증가시킨다.
34. 조항 6항 내지 33 중 어느 한 조항의 방법은 매개변수화된 모델을 트레이닝하는 것을 더 포함하며, 트레이닝하는 것은;
잠재 공간 내의 각 샘플에 대해 잠재 공간 내의 차원 데이터를 샘플링하는 것;
잠재 공간 내의 주어진 차원 데이터에 대해 출력 구현의 분포를 생성하기 위해 다수의 출력 구현을 예측하는 것;
다수의 출력 구현의 분포와 연관된 불확실성을 결정하는 것; 및
주어진 차원 데이터 및 결정된 불확실성을 기반으로 매개변수화된 모델을 트레이닝하는 것을 포함한다.
35. 조항 34의 방법에서, 매개변수화된 모델은 기계 학습 모델이다.
36. 조항 34와 35의 방법에서, 매개변수화된 모델은 신경망을 포함한다.
37. 조항 34 내지 36 중 어느 한 조항의 방법에서, 매개변수화된 모델은 인코더-디코더 아키텍처를 포함한다.
38. 조항 34 내지 37 중 어느 한 조항의 방법에서, 인코더 아키텍처는 모델 입력을 잠재 공간 내의 차원 데이터로 변환시키도록 구성된 매개변수화된 모델의 일부분을 포함하며, 디코더 아키텍처는 잠재 공간 내의 차원 데이터를 출력 구현으로 변환시키도록 구성된 매개변수화된 모델의 상이한 부분을 포함한다.
39. 조항 38의 방법에서, 인코더 아키텍처와 디코더 아키텍처는 하나 이상의 노드를 갖는 하나 이상의 계층을 갖는 하나 이상의 신경망을 포함한다.
40. 조항 38과 39 중 어느 한 조항의 방법은 매개변수화된 모델의 일부분으로, 모델 입력과 연관된 더 높은 차원 데이터를 잠재 공간 내의 차원 데이터로 변환하는 것을 더 포함하며, 잠재 공간 내의 차원 데이터는 모델 입력과 연관된 더 높은 차원 데이터와 비교하여 더 낮은 차원 데이터를 포함한다.
41. 조항 38 내지 40 중 어느 한 조항의 방법에서, 모델 입력은 이미지, 클립, 인코딩된 이미지, 인코딩된 클립, 또는 반도체 제조 공정과 연관된 매개변수화된 모델의 이전 층으로부터의 데이터 중 하나 이상을 포함한다.
42. 조항 38 내지 41 중 어느 한 조항의 방법에서, 모델 입력은 타겟 패턴 디자인, 결함, 또는 반도체 제조 공정을 위한 공정 매개변수와 연관된다.
43. 조항 34 내지 42 중 어느 한 조항의 방법에서, 잠재 공간 내의 차원 데이터는 모델 입력과 연관된 다차원 벡터를 포함한다.
44. 조항 34 내지 43 중 어느 한 조항의 방법에서, 다수의 출력 구현은 예측된 마스크 이미지, 결함 확률, 또는 반도체 제조 공정에 대한 예측된 공정 매개변수를 포함한다.
45. 조항 34 내지 44 중 어느 한 조항의 방법에서, 예측하는 것은 신경망의 하나 이상의 계층 및/또는 하나 이상의 노드(node)로, 차원 데이터의 다차원 벡터를 출력 구현으로 디코딩하는 것을 포함한다.
46. 조항 34 내지 45 중 어느 한 조항의 방법에서, 불확실성을 결정하는 것은 예측된 다수의 출력 구현의 분산을 결정하는 것을 포함한다.
47. 조항 46의 방법에서, 분산을 결정하는 것은 예측된 다수의 출력 구현의 범위, 표준 편차, 최대값, 최소값, 평균, 중간값 및/또는 모드를 결정하는 것을 포함한다.
48. 조항 34 내지 47 중 어느 한 조항의 방법에서, 예측된 다수의 출력 구현은 이미지를 포함하며, 불확실성을 결정하는 것은 이미지들 간의 차이를 나타내는 메트릭을 결정하는 것을 포함한다.
49. 조항 34 내지 48 중 어느 한 조항의 방법에서, 주어진 차원 데이터 그리고 대응하는 불확실성은 입력 출력 트레이닝 쌍을 형성한다.
50. 조항 49의 방법에서, 매개변수화된 모델은 신경망을 포함하며, 주어진 차원 데이터 그리고 대응하는 불확실성으로 매개변수화된 모델을 트레이닝하는 것은 신경망이 새로운 출력 구현을 예측하는 것을 학습할 수 있도록 입력 출력 트레이닝 쌍을 신경망에 제공하는 것을 포함한다.
51. 조항 34 내지 50 중 어느 한 조항의 방법은 잠재 공간 내의 차원 데이터의 어느 부분이 차원 데이터의 다른 부분과 비교하여 더 높은 분산을 갖는 예측된 출력 구현에 대응하는지를 결정하는 것, 및 더 높은 분산에 대응하는 부분으로부터 샘플링하는 것을 더 포함한다.
52. 조항 51의 방법에서, 잠재 공간 내의 차원 데이터의 어느 부분이 더 높은 분산을 갖는 예측된 출력 구현에 대응하는지를 결정하는 것은 부가적인 트레이닝 데이터의 선택을 용이하게 한다.
53. 조항 34 내지 52 중 어느 한 조항의 방법은 반도체 제조 공정의 일부로서 마스크 또는 레티클 기하학적 구조를 예측하기 위하여 트레이닝된 매개변수화된 모델을 이용하는 것을 더 포함한다.
54. 조항 34 내지 53 중 어느 한 조항의 방법은 반도체 제조 공정의 일부로서 연속 톤 마스크(CTM)를 예측하기 위하여 트레이닝된 매개변수화된 모델을 이용하는 것을 더 포함한다.
55. 매개변수화된 모델을 트레이닝하는 방법은,
잠재 공간 내의 각 샘플에 대해 잠재 공간 내의 차원 데이터를 샘플링하는 것;
잠재 공간 내의 주어진 차원 데이터에 대해 출력 구현의 분포를 생성하기 위해 다수의 출력 구현을 예측하는 것;
다수의 출력 구현의 분포와 연관된 불확실성을 결정하는 것; 및
주어진 차원 데이터 및 결정된 불확실성을 기반으로 매개변수화된 모델을 트레이닝하는 것을 포함한다.
56. 조항 55의 방법에서, 매개변수화된 모델은 기계 학습 모델이다.
57. 조항 55와 56의 방법에서, 매개변수화된 모델은 신경망을 포함한다.
58. 조항 55 내지 57 중 어느 한 조항의 방법에서, 매개변수화된 모델은 인코더-디코더 아키텍처를 포함한다.
59. 조항 55 내지 58 중 어느 한 조항의 방법에서, 인코더 아키텍처는 모델 입력을 잠재 공간 내의 차원 데이터로 변환시키도록 구성된 매개변수화된 모델의 일부분을 포함하며, 디코더 아키텍처는 잠재 공간 내의 차원 데이터를 출력 구현으로 변환시키도록 구성된 매개변수화된 모델의 상이한 부분을 포함한다.
60. 조항 59의 방법에서, 인코더 아키텍처 및 디코더 아키텍처는 하나 이상의 노드를 갖는 하나 이상의 계층을 갖는 하나 이상의 신경망을 포함한다.
61. 조항 59와 60 중 어느 한 조항의 방법은 매개변수화된 모델의 일부분으로, 모델 입력과 연관된 더 높은 차원 데이터를 잠재 공간 내의 차원 데이터로 변환하는 것을 더 포함하며, 잠재 공간 내의 차원 데이터는 모델 입력과 연관된 더 높은 차원 데이터와 비교하여 더 낮은 차원 데이터를 포함한다.
62. 조항 59 내지 61 중 어느 한 조항의 방법에서, 모델 입력은 이미지, 클립, 인코딩된 이미지, 인코딩된 클립, 또는 반도체 제조 공정과 연관된 매개변수화된 모델의 이전 계층으로부터의 데이터 중 하나 이상을 포함한다.
63. 조항 59 내지 62 중 어느 한 조항의 방법에서, 모델 입력은 타겟 패턴 디자인, 결함, 또는 반도체 제조 공정을 위한 공정 매개변수와 연관된다.
64. 조항 55 내지 63 중 어느 한 조항의 방법에서, 잠재 공간 내의 차원 데이터는 모델 입력과 연관된 다차원 벡터를 포함한다.
65. 조항 55 내지 64 중 어느 한 조항의 방법에서, 다수의 출력 구현은 예측된 마스크 이미지, 결함 확률, 또는 반도체 제조 공정에 대한 예측된 공정 매개변수를 포함한다.
66. 조항 55 내지 65 중 어느 한 조항의 방법에서, 예측하는 것은 신경망의 하나 이상의 계층 및/또는 하나 이상의 노드로, 차원 데이터의 다차원 벡터를 출력 구현으로 디코딩하는 것을 포함한다.
67. 조항 55 내지 66 중 어느 한 조항의 방법에서, 불확실성을 결정하는 것은 예측된 다수의 출력 구현의 분산을 결정하는 것을 포함한다.
68. 조항 67의 방법에서, 분산을 결정하는 것은 예측된 다수의 출력 구현의 범위, 표준 편차, 최대값, 최소값, 평균, 중간값 및/또는 모드를 결정하는 것을 포함한다.
69. 조항 55 내지 68 중 어느 한 조항의 방법에서, 예측된 다수의 출력 구현은 이미지를 포함하며, 불확실성을 결정하는 것은 이미지들 간의 차이를 나타내는 메트릭을 결정하는 것을 포함한다.
70. 조항 55 내지 69 중 어느 한 조항의 방법에서, 주어진 차원 데이터와 대응 불확실성은 입력 출력 트레이닝 쌍을 형성한다.
71. 조항 70의 방법에서, 매개변수화된 모델은 신경망을 포함하며, 주어진 차원 데이터 그리고 대응하는 불확실성으로 매개변수화된 모델을 트레이닝하는 것은 신경망이 새로운 출력 구현을 예측하는 것을 학습할 수 있도록 입력 출력 트레이닝 쌍을 신경망에 제공하는 것을 포함한다.
72. 조항 55 내지 71 중 어느 한 조항의 방법은 잠재 공간 내의 차원 데이터의 어느 부분이 차원 데이터의 다른 부분과 비교하여 더 높은 분산을 갖는 예측된 출력 구현에 대응하는지를 결정하는 것, 및 더 높은 분산에 대응하는 부분으로부터 샘플링하는 것을 더 포함한다.
73. 조항 72의 방법에서, 잠재 공간 내의 차원 데이터의 어느 부분이 더 높은 분산을 갖는 예측된 출력 구현에 대응하는지를 결정하는 것은 부가적인 트레이닝 데이터의 선택을 용이하게 한다.
74. 조항 55 내지 73 중 어느 한 조항의 방법은 반도체 제조 공정의 일부로서 마스크 또는 레티클 기하학적 구조를 예측하기 위하여 트레이닝된 매개변수화된 모델을 이용하는 것을 더 포함한다.
75. 조항 55 내지 74 중 어느 한 조항의 방법은 반도체 제조 공정의 일부로서 연속 톤 마스크(CTM)를 예측하기 위하여 트레이닝된 매개변수화된 모델을 이용하는 것을 더 포함한다.
76. 비일시적 컴퓨터 판독 가능한 매체는 컴퓨터에 의하여 실행될 때 조항 1 내지 75 중 어느 한 조항의 방법을 구현하는 명령어를 갖는다.
77. 매개변수화된 모델 예측의 확실성을 증가시키기 위한 방법은,
매개변수화된 모델로, 매개변수화된 모델과 연관된 잠재 공간 내의 차원 데이터를 클러스터들로 클러스터링하는 것 -상이한 클러스터들은 주어진 입력의 상이한 부분들에 대응함-;
매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 기반으로 출력을 예측하는 것;
매개변수화된 모델로, 잠재 공간 내의 차원 데이터를 클러스트들 중 하나 이상에 대응하는 주어진 입력의 복구된 버전으로 변환하는 것; 및
클러스터, 출력 및/또는 주어진 입력의 복구된 버전을 기반으로, 매개변수화된 모델 예측의 확실성을 증가시키기 위해 매개변수화된 모델의 하나 이상의 매개변수를 조정하는 것을 포함한다.
78. 조항 77의 방법은 잠재 공간 내의 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 차원 데이터의 다른 클러스터 또는 클러스터의 다른 부분과 비교하여 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것을 더 포함한다.
79. 조항 78의 방법에서, 잠재 공간 내의 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것은 부가적인 트레이닝 데이터의 선택을 용이하게 한다.
80. 조항 78 또는 79의 방법에서, 조정하는 것은 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것, 및/또는 더 높은 분산과 연관된 결정된 클러스터들 또는 클러스터들의 부분들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 매개변수화된 모델을 트레이닝하는 것을 포함한다
81. 조항 80의 방법에서, 잠재 공간의 차원에 추가함으로써 매개변수화된 모델을 더 서술적으로 만드는 것 및/또는 더 높은 분산과 연관된 결정된 클러스터들 또는 클러스터의 부분들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 매개변수화된 모델을 트레이닝하는 것은,
매개변수화된 모델을 트레이닝하기 위한 입력으로서 이전 트레이닝 자료에 대하여 클러스터들 중 하나 이상과 관련된 더 다양한 이미지 및 더 다양한 데이터를 이용하는 것; 및/또는
벡터를 인코딩하기 위한 더 많은 차원과 매개변수화된 모델 내의 더 많은 인코딩 계층을 이용하는 것을 포함한다.
82. 조항 77 내지 81 중 어느 한 조항의 방법은 매개변수화된 모델을 트레이닝하는 것을 더 포함하며, 트레이닝하는 것은;
잠재 공간 내의 각 샘플에 대해 잠재 공간 내의 차원 데이터를 샘플링하는 것;
잠재 공간 내의 주어진 차원 데이터에 대해 출력 구현의 분포를 생성하기 위해 다수의 출력 구현을 예측하는 것;
다수의 출력 구현의 분포와 연관된 불확실성을 결정하는 것; 및
주어진 차원 데이터 및 결정된 불확실성을 기반으로 매개변수화된 모델을 트레이닝하는 것을 포함한다.
83. 조항 82의 방법은 잠재 공간 내의 차원 데이터의 어느 클러스터가 차원 데이터의 다른 클러스터와 비교하여 더 높은 분산을 갖는 예측된 출력 구현에 대응하는지를 결정하는 것, 및 더 높은 분산에 대응하는 클러스터로부터 샘플링하는 것을 더 포함한다.
84. 조항 77 내지 83 중 어느 한 조항의 방법에서, 잠재 공간 내의 개별 클러스터는 차원 데이터 내의 상이한 인코딩된 패턴에 대응한다.
85. 조항 84의 방법에서, 매개변수화된 모델의 하나 이상의 매개변수를 조정하는 것은 어떠한 패턴 유형이 매개변수화된 모델에 대해 잘 알려져 있고 비교적 일관된 예측을 초래하는지 그리고 어떠한 패턴 유형이 매개변수화된 모델에 대해 잘 알려지지 않고 비교적 가변적인 예측을 초래하는지를 나타내는 별도의 패턴별 정보를 결정하는 것을 포함한다.
86. 조항 85의 방법에서, 별도의 패턴별 정보는 분산, 잠재 공간 커버리지, 및/또는 분포를 포함한다.
87. 조항 77 내지 86 중 어느 한 조항의 방법에서, 매개변수화된 모델의 하나 이상의 매개변수를 조정하는 것은 매개변수화된 모델의 차원 및/또는 매개변수화된 모델의 하나 이상의 계층의 가중치를 조정하는 것을 포함한다.
88. 조항 77 내지 87 중 어느 한 조항의 방법은, 매개변수화된 모델 예측의 분산을 감소시키고 및/또는 새로운 패턴에 대해 매개변수화된 모델 예측을 향상시키기 위하여 클러스터, 출력, 및/또는 입력의 복구된 버전을 기반으로 매개변수화된 모델을 조정하는 것을 더 포함한다.
89. 조항 77 내지 88 중 어느 한 조항의 방법은:
잠재 공간 내의 관심 대상 지점을 식별하는 것 - 여기서 관심 대상 지점은 잠재 공간 내의 다른 지점, 클러스터 내부에 위치하지 않는 지점, 또는 잠재 공간 내의 다른 지점들 및/또는 다른 클러스터들 간의 직교 거리(cartesian distance)와 비교하여 잠재 공간 내의 하나 이상의 다른 지점 및/또는 클러스터에서 비교적 멀리 있는 직교 거리에 위치된 지점과 비교하여, 상대적으로 높은 분산 또는 불확실성을 갖는 지점들 중 하나 이상을 포함함-; 및
매개변수화된 모델의 성능을 평가하기 위해 관심 대상 지점, 클러스터, 주어진 입력의 복구된 버전 및/또는 출력을 사용하는 것을 더 포함한다.
90. 조항 77 내지 89 중 어느 한 조항의 방법에서, 매개변수화된 모델은 변분 인코더-디코더 아키텍처를 포함하며;
잠재 공간 내의 차원 데이터는 인코더-디코더 아키텍처의 인코더에 의하여 인코딩되고, 출력은 인코더-디코더 아키텍처의 디코더로 잠재 공간 내의 차원 데이터를 기반으로 예측되며, 잠재 공간 내의 차원 데이터는 인코더-디코더 아키텍처의 제2 디코더에 의하여, 주어진 입력의 복구된 버전으로 변환되며; 그리고
본 방법은 확률적 잠재 공간으로 변분 인코더-디코더 아키텍처를 트레이닝하는 단계를 더 포함하며, 이는 출력 공간의 구현을 생성한다.
91. 비일시적 컴퓨터 판독 가능한 매체는 컴퓨터에 의하여 실행될 때 조항 77 내지 90 중 어느 한 조항의 방법을 구현하는 명령어를 갖는다.
본 명세서에 개시된 개념은 실리콘 웨이퍼와 같은 기판 상의 이미징을 위하여 사용될 수 있는 반면에, 개시된 개념은 임의의 유형의 리소그래피 이미징 시스템, 예를 들어 실리콘 웨이퍼 이외의 기판 상의 이미징을 위하여 사용되는 시스템들과 함께 사용될 수 있다는 점이 이해되어야 한다. 또한, 개시된 요소들의 조합 및 하위 조합은 별도의 실시예를 포함할 수 있다. 예를 들어, 기계 학습 모델의 가변성을 결정하는 것은 모델에 의해 생성된 개별 예측의 가변성, 및/또는 모델에 의해 생성된 샘플링된 사후 분포 세트의 가변성을 결정하는 것을 포함할 수 있다. 이 특징들은 별개의 실시예를 포함할 수 있으며 및/또는 이 특징들은 동일한 실시예에서 함께 사용될 수 있다.
위의 설명은 제한이 아니라 예시적인 것으로 의도된다. 따라서, 아래에 제시된 청구범위의 범위를 벗어나지 않고 설명된 바와 같이 수정이 이루어질 수 있다는 것이 당 업자에게 명백할 것이다.

Claims (15)

  1. 매개변수화된 모델 예측의 확실성을 증가시키는 방법에 있어서,
    매개변수화된 모델로, 상기 매개변수화된 모델과 연관된 잠재 공간 내의 차원 데이터를 클러스터들로 클러스터링하는 것 -상이한 클러스터들은 주어진 입력의 상이한 부분들에 대응함-;
    상기 매개변수화된 모델로, 상기 잠재 공간 내의 상기 차원 데이터를 기반으로 출력을 예측하는 것;
    상기 매개변수화된 모델로, 상기 잠재 공간 내의 상기 차원 데이터를 상기 클러스트들 중 하나 이상에 대응하는 주어진 입력의 복구된 버전으로 변환하는 것; 및
    상기 클러스터, 상기 출력 및/또는 상기 주어진 입력의 상기 복구된 버전을 기반으로, 상기 매개변수화된 모델 예측의 확실성을 증가시키기 위해 상기 매개변수화된 모델의 하나 이상의 매개변수를 조정하는 것을 포함하는 방법.
  2. 제1항에 있어서, 상기 잠재 공간 내의 상기 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 상기 차원 데이터의 다른 클러스터 또는 클러스터의 다른 부분과 비교하여 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것을 더 포함하는 방법.
  3. 제2항에 있어서, 상기 잠재 공간 내의 상기 차원 데이터의 어느 클러스터 또는 클러스터의 부분이 더 높은 분산을 갖는 예측된 출력에 대응하는지를 결정하는 것은 부가적인 트레이닝 데이터의 선택을 용이하게 하는 방법.
  4. 제2항 또는 제3항에 있어서, 조정하는 것은 상기 잠재 공간의 차원에 추가함으로써 상기 매개변수화된 모델을 더 서술적으로 만드는 것, 및/또는 상기 더 높은 분산과 연관된 결정된 클러스터들 또는 클러스터들의 부분들 중 하나 이상과 연관된 더 다양한 트레이닝 데이터로 상기 매개변수화된 모델을 트레이닝하는 것을 포함하는 방법.
  5. 제4항에 있어서, 상기 잠재 공간의 차원에 추가함으로써 상기 매개변수화된 모델을 더 서술적으로 만드는 것 및/또는 더 높은 분산과 연관된 상기 결정된 클러스터들 또는 클러스터들의 부분들의 하나 이상과 연관된 더 다양한 트레이닝 데이터로 상기 매개변수화된 모델을 트레이닝하는 것은,
    상기 매개변수화된 모델을 트레이닝하기 위한 입력으로서 이전 트레이닝 자료에 대하여 상기 클러스터들 중 하나 이상과 관련된 더 다양한 이미지 및 더 다양한 데이터를 이용하는 것; 및/또는
    벡터를 인코딩하기 위한 더 많은 차원과 상기 매개변수화된 모델 내의 더 많은 인코딩 계층을 이용하는 것을 포함하는 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 매개변수화된 모델을 트레이닝하는 것을 더 포함하며, 상기 트레이닝하는 것은;
    상기 잠재 공간 내의 각 샘플에 대해 상기 잠재 공간 내의 상기 차원 데이터를 샘플링하는 것;
    상기 잠재 공간 내의 주어진 차원 데이터에 대해 출력 구현의 분포를 생성하기 위해 다수의 출력 구현을 예측하는 것;
    상기 다수의 출력 구현의 분포와 연관된 불확실성을 결정하는 것; 및
    상기 주어진 차원 데이터 및 상기 결정된 불확실성을 기반으로 상기 매개변수화된 모델을 트레이닝하는 것을 포함하는 방법.
  7. 제6항에 있어서, 상기 잠재 공간 내의 상기 차원 데이터의 어느 클러스터가 상기 차원 데이터의 다른 클러스터와 비교하여 더 높은 분산을 갖는 예측된 출력 구현에 대응하는지를 결정하는 것, 및 더 높은 분산에 대응하는 상기 클러스터로부터 샘플링하는 것을 더 포함하는 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 잠재 공간 내의 개별 클러스터는 상기 차원 데이터 내의 상이한 인코딩된 패턴에 대응하는 방법.
  9. 제8항에 있어서, 상기 매개변수화된 모델의 상기 하나 이상의 매개변수를 조정하는 것은 어떠한 패턴 유형이 상기 매개변수화된 모델에 대해 잘 알려져 있고 비교적 일관된 예측을 초래하는지 그리고 어떠한 패턴 유형이 상기 매개변수화된 모델에 대해 잘 알려지지 않고 비교적 가변적인 예측을 초래하는지를 나타내는 별도의 패턴별 정보를 결정하는 것을 포함하는 방법.
  10. 제9항에 있어서, 상기 별도의 패턴별 정보는 분산, 잠재 공간 커버리지, 및/또는 분포를 포함하는 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 매개변수화된 모델의 상기 하나 이상의 매개변수를 조정하는 것은 상기 매개변수화된 모델의 차원 및/또는 상기 매개변수화된 모델의 하나 이상의 계층의 가중치를 조정하는 것을 포함하는 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 매개변수화된 모델 예측의 분산을 감소시키고 및/또는 새로운 패턴에 대해 상기 매개변수화된 모델 예측을 향상시키기 위하여 상기 클러스터, 상기 출력, 및/또는 상기 입력의 상기 복구된 버전을 기반으로 상기 매개변수화된 모델을 조정하는 것을 더 포함하는 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서,
    상기 잠재 공간 내의 관심 대상 지점을 식별하는 것 - 여기서 상기 관심 대상 지점은 상기 잠재 공간 내의 다른 지점, 클러스터 내부에 위치하지 않는 지점, 또는 상기 잠재 공간 내의 다른 지점들 및/또는 다른 클러스터들 간의 직교 거리(cartesian distance)와 비교하여 상기 잠재 공간 내의 하나 이상의 다른 지점 및/또는 클러스터에서 비교적 멀리 있는 직교 거리에 위치된 지점과 비교하여, 상대적으로 높은 분산 또는 불확실성을 갖는 지점들 중 하나 이상을 포함함-; 및
    상기 매개변수화된 모델의 성능을 평가하기 위해 상기 관심 대상 지점, 클러스터, 주어진 입력의 복구된 버전 및/또는 출력을 사용하는 것을 더 포함하는 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서,
    상기 매개변수화된 모델은 변분 인코더-디코더 아키텍처를 포함하며;
    상기 잠재 공간 내의 상기 차원 데이터는 상기 인코더-디코더 아키텍처의 인코더에 의하여 인코딩되고, 출력은 상기 인코더-디코더 아키텍처의 디코더로 상기 잠재 공간 내의 상기 차원 데이터를 기반으로 예측되며, 상기 잠재 공간 내의 상기 차원 데이터는 상기 인코더-디코더 아키텍처의 제2 디코더에 의하여, 상기 주어진 입력의 상기 복구된 버전으로 변환되며; 그리고
    본 방법은 확률적 잠재 공간으로 상기 변분 인코더-디코더 아키텍처를 트레이닝하는 단계를 더 포함하며, 이는 출력 공간의 구현을 생성하는 방법.
  15. 컴퓨터에 의하여 실행될 때 제1항 내지 제14항 중 어느 한 항의 방법을 구현하는 명령어를 갖는 비일시적 컴퓨터 판독 가능한 매체.
KR1020227007614A 2019-09-06 2020-08-12 매개변수화된 모델 예측에서의 확실성을 증가시키는 방법 KR20220038501A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP19195954.3 2019-09-06
EP19195954.3A EP3789923A1 (en) 2019-09-06 2019-09-06 Method for increasing certainty in parameterized model predictions
EP19210026 2019-11-19
EP19210026.1 2019-11-19
EP20188310 2020-07-29
EP20188310.5 2020-07-29
PCT/EP2020/072593 WO2021043551A1 (en) 2019-09-06 2020-08-12 Method for increasing certainty in parameterized model predictions

Publications (1)

Publication Number Publication Date
KR20220038501A true KR20220038501A (ko) 2022-03-28

Family

ID=71994524

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227007614A KR20220038501A (ko) 2019-09-06 2020-08-12 매개변수화된 모델 예측에서의 확실성을 증가시키는 방법

Country Status (5)

Country Link
US (1) US20220335290A1 (ko)
KR (1) KR20220038501A (ko)
CN (1) CN114341885A (ko)
TW (1) TWI757855B (ko)
WO (1) WO2021043551A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4075341A1 (en) * 2021-04-18 2022-10-19 ASML Netherlands B.V. Modular autoencoder model for manufacturing process parameter estimation
EP4075340A1 (en) * 2021-04-15 2022-10-19 ASML Netherlands B.V. Modular autoencoder model for manufacturing process parameter estimation
EP4075339A1 (en) * 2021-04-15 2022-10-19 ASML Netherlands B.V. Modular autoencoder model for manufacturing process parameter estimation
EP4060408A1 (en) * 2021-03-16 2022-09-21 ASML Netherlands B.V. Method and system for predicting process information with a parameterized model
WO2023030807A1 (en) * 2021-09-02 2023-03-09 Asml Netherlands B.V. Method of evaluating selected set of patterns
CN116670710A (zh) * 2021-09-10 2023-08-29 弗拉蒂利亚有限责任公司 概率性工艺窗口的检测

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5229872A (en) 1992-01-21 1993-07-20 Hughes Aircraft Company Exposure device including an electrically aligned electronic mask for micropatterning
JP4075966B2 (ja) 1996-03-06 2008-04-16 エーエスエムエル ネザーランズ ビー.ブイ. 差分干渉計システム及びこのシステムを具えたリソグラフステップアンドスキャン装置
US7055126B2 (en) * 2003-10-27 2006-05-30 International Business Machines Corporation Renesting interaction map into design for efficient long range calculations
KR100958714B1 (ko) * 2005-08-08 2010-05-18 브라이언 테크놀로지스, 인코포레이티드 리소그래피 공정의 포커스-노광 모델을 생성하는 시스템 및방법
US7695876B2 (en) 2005-08-31 2010-04-13 Brion Technologies, Inc. Method for identifying and using process window signature patterns for lithography process control
JP4954211B2 (ja) 2005-09-09 2012-06-13 エーエスエムエル ネザーランズ ビー.ブイ. 個別マスクエラーモデルを使用するマスク検証を行うシステムおよび方法
US7694267B1 (en) 2006-02-03 2010-04-06 Brion Technologies, Inc. Method for process window optimized optical proximity correction
US7882480B2 (en) 2007-06-04 2011-02-01 Asml Netherlands B.V. System and method for model-based sub-resolution assist feature generation
US7707538B2 (en) 2007-06-15 2010-04-27 Brion Technologies, Inc. Multivariable solver for optical proximity correction
US20090157630A1 (en) 2007-10-26 2009-06-18 Max Yuan Method of extracting data and recommending and generating visual displays
NL1036189A1 (nl) 2007-12-05 2009-06-08 Brion Tech Inc Methods and System for Lithography Process Window Simulation.
NL2003702A (en) * 2008-11-10 2010-05-11 Brion Tech Inc Pattern selection for lithographic model calibration.
NL2003699A (en) 2008-12-18 2010-06-21 Brion Tech Inc Method and system for lithography process-window-maximixing optical proximity correction.
US9588439B1 (en) * 2010-12-21 2017-03-07 Asml Netherlands B.V. Information matrix creation and calibration test pattern selection based on computational lithography model parameters
CN103106331B (zh) * 2012-12-17 2015-08-05 清华大学 基于降维和增量式极限学习机的光刻线宽智能预测方法
US9255877B2 (en) * 2013-05-21 2016-02-09 Kla-Tencor Corporation Metrology system optimization for parameter tracking
NL2017074A (en) * 2015-07-17 2017-01-19 Asml Netherlands Bv Methods and apparatus for simulating interaction of radiation with structures, metrology methods and apparatus, device manufacturing method
US10599046B2 (en) * 2017-06-02 2020-03-24 Samsung Electronics Co., Ltd. Method, a non-transitory computer-readable medium, and/or an apparatus for determining whether to order a mask structure

Also Published As

Publication number Publication date
CN114341885A (zh) 2022-04-12
US20220335290A1 (en) 2022-10-20
WO2021043551A1 (en) 2021-03-11
TW202117575A (zh) 2021-05-01
TWI757855B (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
TWI757663B (zh) 降低於機器學習模型預測中之不確定性之方法
US20210271172A1 (en) Methods of determining process models by machine learning
US11029605B2 (en) Optimization based on machine learning
TWI757855B (zh) 用於在參數化模型預測中提高確定性的方法
CN114096917B (zh) 用于减小模型预测不确定性的模型校准的预测数据选择
CN113678064B (zh) 用于在设施位置之间调整预测模型的系统和方法
KR20210057807A (ko) 특성 패턴을 생성하고 기계 학습 모델을 트레이닝하는 방법들
EP3789923A1 (en) Method for increasing certainty in parameterized model predictions
KR20220130784A (ko) 프로세스 메트릭 인식 프로세스 제어를 위한 시스템 및 방법
KR20230035384A (ko) 기계 학습 모델을 트레이닝시키기 위한 정보성 패턴을 선택하는 장치 및 방법.
EP3742229A1 (en) Systems and methods for adjusting prediction models between facility locations
WO2022268434A1 (en) Etch simulation model including a correlation between etch biases and curvatures of contours
EP3660744A1 (en) Method for decreasing uncertainty in machine learning model predictions
US20230205096A1 (en) Aberration impact systems, models, and manufacturing processes
WO2023088649A1 (en) Determining an etch effect based on an etch bias direction
WO2023084063A1 (en) Generating augmented data to train machine learning models to preserve physical trends
WO2022189180A1 (en) Method of pattern selection for a semiconductor manufacturing related process
EP3492983A1 (en) Systems and methods for predicting layer deformation
WO2023046385A1 (en) Pattern selection systems and methods