KR20210128490A - 기계 학습을 사용하는 반도체 제조 데이터 획득 기구의 향상된 해상도 - Google Patents

기계 학습을 사용하는 반도체 제조 데이터 획득 기구의 향상된 해상도 Download PDF

Info

Publication number
KR20210128490A
KR20210128490A KR1020217032176A KR20217032176A KR20210128490A KR 20210128490 A KR20210128490 A KR 20210128490A KR 1020217032176 A KR1020217032176 A KR 1020217032176A KR 20217032176 A KR20217032176 A KR 20217032176A KR 20210128490 A KR20210128490 A KR 20210128490A
Authority
KR
South Korea
Prior art keywords
data set
data
resolution
training
semiconductor manufacturing
Prior art date
Application number
KR1020217032176A
Other languages
English (en)
Inventor
얀 첸
신캉 티안
젱 얀
Original Assignee
도쿄엘렉트론가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 도쿄엘렉트론가부시키가이샤 filed Critical 도쿄엘렉트론가부시키가이샤
Publication of KR20210128490A publication Critical patent/KR20210128490A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/02Details
    • G01J3/0275Details making use of sensor-related data, e.g. for identification of sensor parts or optical elements
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/2823Imaging spectrometer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L22/00Testing or measuring during manufacture or treatment; Reliability measurements, i.e. testing of parts without further processing to modify the parts as such; Structural arrangements therefor
    • H01L22/10Measuring as part of the manufacturing process
    • H01L22/12Measuring as part of the manufacturing process for structural parameters, e.g. thickness, line width, refractive index, temperature, warp, bond strength, defects, optical inspection, electrical measurement of structural dimensions, metallurgic measurement of diffusions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/12Generating the spectrum; Monochromators
    • G01J3/18Generating the spectrum; Monochromators using diffraction elements, e.g. grating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30148Semiconductor; IC; Wafer

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Manufacturing & Machinery (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Power Engineering (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Drying Of Semiconductors (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Image Analysis (AREA)

Abstract

반도체 제조 공정 또는 이에 의해 제조된 반도체 구조의 상태를 나타내는 데이터 세트가 메모리 회로망에 저장된다. 데이터 세트의 특징은 데이터 해상도에 의해 제한된 정도로 식별 가능하다. 모델 훈련 과정에 의해 제한된 바와 같이 각각의 값이 할당된 매개변수를 포함하는 기계-학습 모델이 또한 메모리 회로망에 저장된다. 메모리 회로망에 통신 가능하게 결합된 프로세서 회로망은 기계-학습 모델에 따라서 데이터 세트로부터 출력 데이터 세트를 생성하여 출력 데이터 세트의 특징이 데이터 세트의 데이터 해상도보다 더 높은 출력 데이터 해상도에 의해 제한되는 정도로 식별 가능하게 한다.

Description

기계 학습을 사용하는 반도체 제조 데이터 획득 기구의 향상된 해상도
관련된 출원 데이터
본 출원은 미국 특허 가출원 제62/819,115호(발명의 명칭: "Deep-learning Enhanced Spectrometer Resolution Techniques", 출원일: 2019년 3월 15일)의 우선권의 이득을 35 U.S.C. §119(e)하에서 주장하고, 상기 기초출원의 전체 개시내용은 참조에 의해 본 명세서에 원용된다.
개시내용의 분야
본 개시내용은 반도체 처리 과정 또는 반도체 기판에 형성된 특징부를 모니터링하기 위해 사용되는 이미지 및 스펙트럼 데이터에 대한 이미징 및 스펙트럼 해상도 개선을 위한 기법에 관한 것이다. 특히, 본 개시내용은 저해상도 이미지 또는 스펙트럼 데이터를 훈련된 인공 신경망에 적용하여 고해상도 이미지 또는 스펙트럼 데이터를 생성하는 새로운 기법을 제공한다.
광대역 소형 분광계는 반도체 플라즈마 에칭 공정에서 폭넓게 사용되어 엔드포인트 검출과 같은 다양한 공정 제어 목적을 위해 광학 방출 스펙트럼을 수집한다. 분광계 시스템의 신호 대 잡음비(signal-to-noise ratio: SNR)는 제어 신호가 생성되는 정보의 품질을 규정한다. SNR은 일반적으로 분광계의 처리량에 매우 비례한다. 일반적으로, 분광계의 성능은 스펙트럼 대역폭, 즉, 검출 가능한 파장 범위; 스펙트럼 해상도, 즉, 분해 가능한 가장 미세한 스펙트럼 특징부; 광학 처리량, 즉, 검출기에 의해 수집된 광의 비율을 포함하는 몇몇의 중요한 매개변수에 의해 정량화된다.
더 높은 해상도의 분광계는 일반적으로 고해상도 결과를 획득하기 위해 처리량과 스펙트럼(파장) 범위를 희생할 것이다. 마찬가지로, 더 높은 처리량 및 더 넓은 스펙트럼 범위로 설계된 분광계는 일반적으로 더 낮은 해상도를 가질 것이다. 저해상도 분광계의 처리량과 스펙트럼 범위를 유지하면서 스펙트럼 데이터 내에서 더 미세한 상세사항을 해결하는 능력은 대부분의 고해상도 분광계에서는 현재 사용할 수 없고, 특히 기구의 비용이 제한된 설계 요인인 경우에는 더욱 그렇다. 오늘날 이용 가능한 많은 분광계 설계는 설계 중요 매개변수 간의 절충을 포함한다. 스펙트럼 해상도를 개선하는 간단하고 효과적인 방법은 분광기 입구로서 더 좁은 슬릿을 사용하는 것이고, 이는 전하-결합 디바이스(charge-coupled device: CCD) 검출기에서 회절된 스펙트럼의 각각의 파장의 "이미지"를 효과적으로 좁혀주지만; 슬릿을 통과하는, 감소된 광 및 대응하는 정보의 대가를 치른다. 해상도와 처리량 간의 절충은 물리적 분광계 설계만으로는 극복하기가 매우 어렵다.
본 개시내용의 하나의 목적은 종래의 분광계와 연관된 물리적 설계 매개변수와의 전술된 절충을 완화하는 것이다.
본 개시내용의 또 다른 목적은 저해상도 분광계를 사용하여 스펙트럼 데이터를 수집하고 처리량 또는 스펙트럼 범위를 희생하지 않는 일 없이 스펙트럼 데이터 또는 이미지 내에서 더 세밀한 상세사항을 해결할 수 있도록 하는 것이다.
본 발명의 개념의 하나의 양상에서, 반도체 제조 공정 또는 이에 의해 제조된 반도체 구조체의 상태를 나타내는 데이터 세트를 저장하는 메모리 회로망을 포함하는 장치가 제공된다. 데이터 세트의 특징부는 데이터 해상도에 의해 제한된 범위에서 식별 가능하다. 메모리 회로망은 또한 모델 훈련 과정에 의해 제한되는 바와 같이 할당된 각각의 값을 갖는 매개변수를 포함하는 기계-학습 모델을 저장한다. 프로세서 회로망은 메모리 회로망과 통신 가능하게 결합되고 기계-학습 모델에 따라서 데이터 세트로부터 출력 데이터 세트를 생성하여 출력 데이터 세트의 특징부가 데이터 세트의 데이터 해상도보다 더 미세한 출력 데이터 해상도에 의해 제한되는 범위에서 식별 가능하게 한다.
도 1은 본 발명의 개념이 구현될 수 있는 예시적인 시스템의 개략적인 블록도이다.
도 2는 본 발명이 구현될 수 있는 인공 신경망(artificial neural network: ANN)의 개략도이다.
도 3은 본 발명이 구현될 수 있는 예시적인 분광계의 개략도이다.
도 4는 본 발명의 실시형태에서 데이터를 시뮬레이션하기 위한 분광계 입구 슬릿 및 슬릿의 이미지(420)의 개략도이다.
도 5는 본 발명의 실시형태에서 사용되는 저해상도 분광계의 언더필(underfill) 및 오버필(overfill) 구현예에 대한 저해상도 스펙트럼 데이터의 그래프이다.
도 6은 본 발명의 실시형태에서 사용되는 고해상도 분광계의 언더필 및 오버필 구현예에 대한 고해상도 스펙트럼 데이터의 그래프이다.
도 7은 본 발명이 구현될 수 있는 예시적인 훈련 과정을 예시하는 흐름도이다.
도 8은 본 발명이 구현될 수 있는 예시적인 생산 과정을 예시하는 흐름도이다.
본 발명의 개념은 유사한 참조 부호가 전체에 걸쳐 유사한 특징부를 나타내는 첨부 도면을 참조하여 본 명세서에서 상세히 설명되는 본 발명의 특정한 실시형태를 통해 가장 잘 설명된다. 본 명세서에서 사용될 때, 용어 "발명"은 단지 실시형태 자체만이 아니라 아래에서 설명된 실시형태의 기초가 되는 본 발명의 개념을 함축하는 것으로 의도된다는 것을 이해한다. 일반적인 본 발명의 개념은 아래에서 설명된 예시적인 실시형태로 제한되지 않고 다음의 설명은 이러한 관점에서 읽혀져야 한다는 것을 더 이해한다.
단어 "예시적인"은 "예, 경우 또는 예시로서 제공"을 의미하는 것으로 본 명세서에서 사용된다. 본 명세서에서 예시적인 것으로 지정된 구성, 과정, 설계, 기법 등의 임의의 실시형태가 반드시 이러한 다른 실시형태보다 선호되거나 또는 유리한 것으로 해석될 필요는 없다. 예시적인 것으로 본 명세서에서 나타낸 예의 특정한 품질이나 적합성은 의도된 것도 아니고 추론되어서도 안 된다.
부가적으로, 수학적 표현이 본 명세서에 포함되고 이에 의해 전달되는 원리는 이를 통해 충분히 기술된 것으로 간주된다. 수학이 사용되는 경우에, 설명되는 기본 원리의 간결한 설명을 위한 것이며, 달리 표현되지 않는 한, 다른 목적이 암시되거나 또는 추론되어서는 안 된다는 것을 이해한다. 본 명세서의 수학이 본 발명과 어떻게 관련되어 있는지, 그리고 수학 표현의 기초가 되는 원리의 실시형태가 의도된 경우에, 당업자가 수학적으로 표현되는 원리의 물리적인 표시를 실시하기 위한 수많은 기법을 인식할 것임이 본 개시내용 전체로부터 분명해질 것이다.
본 개시내용은 저해상도(low resolution: LR) 분광계 또는 이미지 캡처링 디바이스에 의해 수집된 데이터로부터 고해상도(high-resolution: HR) 데이터 세트를 "구축하거나" 또는 생성하는 것과 관련된다. 즉, 본 명세서에서 개시된 기법은 HR 분광계가 확장된 파장 범위 및 LR 분광계의 높은 광 처리량으로 작동하게 한다. 게다가, 유사한 기법의 변형은 더 낮은 해상도 이미지로부터 더 높은 해상도 이미지 데이터를 생성하도록 사용될 수 있다.
본 명세서에서 설명된 발명은 예를 들어, 종래의 광학 분광계 설계에 의해 수집된 비교적 저해상도의 스펙트럼 데이터에 딥러닝 기법을 도입하여, 반도체 기판의 특징부 또는 반도체 공정과 연관된 쌍으로 구성된 저해상도 및 고해상도 데이터 세트(예를 들어, 경험적 또는 시뮬레이션됨)의 분석에 기초한 예측 모델을 사용하여 더 높은 해상도의 데이터를 획득한다. 이 방식으로, 반도체 공정 또는 기판 특징부의 고해상도 데이터는 기존의 비교적 더 높은 해상도의 분광계 또는 이미징 시스템 및 기법을 사용하는 것보다 더 저렴한 하드웨어와 더 빠른 사이클 시간으로 획득될 수 있다. 예를 들어, 스펙트럼 실시형태에서, 스펙트럼 데이터 세트의 품질을 규정하기 위한 중요한 기준은 대역폭(즉, 검출 가능한 파장 범위), 해상도(즉, 분해 가능한 가장 미세한 스펙트럼 특징부), 및 광학 처리량(즉, 검출기에 의해 수집된 광의 비율)을 포함한다. 대부분의 경우에, 전술된 구성요소는 가능한 한 가장 짧은 시간량 내에 반도체 제작에 대한 예측 가능하고 의미 있는 결과(예를 들어, 패턴, 특징부 또는 공정 조건)를 달성하기 위해 분광계의 물리적 설계 절충에 의해 서로 균형을 이룬다. 예를 들어, 더 높은 해상도의 분광계 데이터 세트를 획득하는 것은 더 높은 처리량과 파장 범위를 희생하여 달성된다. 따라서, 이러한 희생을 감수하지 않고 더 높은 해상도의 데이터를 획득하는 것이 유리할 것이다. 스펙트럼 실시형태 외에도, 딥러닝 기법이 다른 저해상도 데이터(예를 들어, 이미지)에 적용되어 분석되는 반도체 공정 또는 기판 특징부의 더 높은 해상도 정보 또는 특성을 해독할 수 있다.
이 유리한 능력을 달성하기 위한 하나의 방식은 더 낮은 해상도의 데이터 세트로부터 고해상도 데이터 세트를 생성할 수 있는 기계-학습(machine-learning: ML) 모델을 구성하는 것이다. 이상적으로, 모델-생성 고해상도 데이터는 이러한 저해상도 데이터가 ML 모델에 의해 처리되지 않는 한 저해상도 데이터와 손쉽게 구별할 수 없는 정보를 제공할 수 있다. ML 모델은 인공 신경망(ANN), 예컨대, 컨볼루션 신경망(convolutional neural network: CNN)을 훈련하도록 사용될 수 있는 통계적 변환 또는 관계를 결정하기 위해, 실험적으로 또는 시뮬레이션에 의해 수집되는 저해상도 및 고해상도 훈련 데이터를 분석함으로써 준비될 수 있다. 예를 들어, 수개의 층의 CNN은 저해상도 데이터를 공정 또는 특징부에 대한 고해상도 데이터와 통계적으로 관련시키도록 훈련될 수 있다. 저해상도 및 고해상도 데이터는 데이터 세트 간의 통계적 관계의 견고성을 개선하기 위해 유사하거나 또는 약간 상이한 공정 또는 특징부에서 수집될 수 있다. 이 방식으로, ML 모델은 고해상도 결과를 정확하게 예측하기 위해 개발되고 모델링된 결과를 실제 고해상도 데이터와 비교함으로써 최적화될 수 있다. 모델의 정확성과 정밀도를 검증한 후, 훈련된 네트워크가 저해상도 데이터에 적용되어 반도체 공정이나 특징부와 관련된 대응하는 고해상도 데이터 또는 결과를 생성할 수 있다. 2개의 분광계가 공정 또는 기판 특징부를 나타내는 대응하는 저해상도 및 고해상도 데이터 세트를 생성하기 위해 사용될 수 있다. 그러나, 다른 실시형태에서, 저해상도 및 고해상도 데이터 세트가 측정된 스펙트럼의 시뮬레이션에 의해 실제 공정 조건에 근접하도록 생성될 수 있다. 이 방식으로, 시뮬레이션된 스펙트럼 데이터는 알려지거나 또는 관찰된 현상에 기초하여 스펙트럼의 특정한 특성을 시뮬레이션하도록 최적화될 수 있어서, 훈련 데이터 세트는 완전히 시뮬레이션된 저 데이터 세트와 고 데이터 세트, 시뮬레이션된 훈련 쌍과 실험 훈련 쌍의 조합, 또는 시뮬레이션된 데이터 및 실험 데이터를 포함하는 훈련 쌍을 포함할 수 있다.
도 1은 본 발명의 개념이 구현될 수 있는 예시적인 시스템(100)의 개략적인 블록도이다. 제한이 아닌 설명의 목적을 위해, 시스템(100)은 반도체 제조를 위해 구축되거나 또는 구성될 수 있으며, 제조 처리의 대부분은 챔버(5)로 대표적으로 예시된 하나 이상의 밀봉된 챔버에서 발생한다. 챔버(5)는 포트(7)로 대표적으로 예시된 하나 이상의 포트를 포함할 수 있고, 포트에 의해 분광학, 광학 이미징 또는 숙련된 장인에게 알려진 다른 기법을 포함하여 챔버(5) 내부에서 발생하는 공정이 모니터링될 수 있다. 이러한 내부 공정은 물질 증착 및 에칭을 포함할 수 있고, 이 둘 다는 공정-의존적인 구성을 가진 플라즈마를 활용할 수 있다. 챔버(5) 내의 구성 성분은 예를 들어, 분광학에 의해 평가될 수 있다. 다른 공정은 광학 또는 전자 이미징에 의해 모니터링될 수 있거나 또는 점검될 수 있다. 본 개시내용의 검토 시 숙련된 기술자가 인지할 바와 같이, 본 발명의 개념의 실시형태는 분광학적, 광학적으로 획득된 이미지 및 다른 획득된 이미지에 적용 가능한 기법을 구현한다.
시스템(100)은 데이터 및 프로세서 명령어 코드가 저장되는 메모리 회로망(120), 데이터 및 제어 공정이 실행되는 프로세서 회로망(130) 및 인간 사용자가 특히, 데이터 분석 및 제어의 목적을 위해 시스템(100)을 인터페이싱하는 사용자 인터페이스 회로망(140)을 포함하는 프로세서(150)를 포함할 수 있다. 도 1에 예시된 바와 같이, 메모리 회로망(120)은 데이터 세트를 예컨대, 데이터 저장 위치(122)에, 기계 학습 모델을 예컨대, 모델 저장 위치(124)에, 그리고 프로세서 명령어 코드를 예컨대, 코드 저장 위치(126)에 저장하도록 구축되거나 구성될 수 있다. 프로세서 명령어 코드는 예컨대, ML 엔진 코드 저장 위치(127)에 ML 엔진 코드(ML 엔진이 전용 회로망에 하드와이어링되지 않는 경우) 및 예컨대, 공정 제어기 코드 저장 위치(129)에 공정 제어 코드를 포함할 수 있다. 프로세서 회로망(130)은 ML 엔진(132) 및 공정 제어기(134)에 예시된 바와 같이, 메모리 회로망(120)에 저장된 프로세서 명령어 코드를 실행시키도록 구축되거나 구성될 수 있다.
시스템(100)은 데이터 획득 기구(105l 및 105h)로 대표적으로 예시된 데이터 획득 기구를 더 포함할 수 있다. 위에서 나타낸 바와 같이, 본 발명은 다양한 상이한 데이터 유형의 해상도를 증가시키도록 구현될 수 있고, 이와 같이, 저해상도 데이터(110l)를 생성하는 저해상도 데이터 획득 기구를 나타내는 기구(105l) 및 고해상도 데이터(110h)를 생성하는 고해상도 데이터 획득 기구를 나타내는 기구(105h)는 적용-특정한 데이터, 예를 들어, 이미지 데이터, 스펙트럼 데이터 등을 수집하도록 사용될 수 있는 임의의 수의 디바이스를 나타낸다. 다음의 설명이 주로 스펙트럼 데이터 세트에 관한 것이지만, 다른 데이터가 본 발명의 실시형태에서 사용될 수 있다는 것을 이해한다.
실험 또는 시뮬레이션된 데이터는 저해상도 데이터 세트와 고해상도 데이터 세트(110l 및 110h) 간의 예측 가능한 관계를 설정하거나 또는 규정하기 위해 다양한 조건 또는 변수 하에서 수집될 수 있거나 또는 생성될 수 있다. 이 관계는 프로세스 조건, 특징부 유형 또는 검출 기법 간의 공통 구성요소에 기초할 수 있다. 그러나, 관계는 또한 데이터 세트(110l 및 110h)(예를 들어, 디바이스 설정/구성(슬릿 크기, 시야, 구멍 크기)) 간의 차이 또는 다른 구성요소에 기초하여 지정될 수 있다. 실제로, 데이터 세트(110l 및 110h)는 관찰된 공정 조건 또는 특징부에 대한 해상도 분포를 획득하기 위해 다양한 디바이스 설정/구성 옵션을 따라 수집될 수 있거나 또는 생성될 수 있다. 훈련 관계는 하나 이상의 저해상도 데이터 세트(110l)를 화학 성분, 온도, 밀도 및/또는 공정과 연관된 에너지 또는 신호를 포함할 수 있지만 이들로 제한되지 않는 공정 조건 특성과 관련된 하나 이상의 고해상도 데이터 세트(110h)로 그룹화할 수 있다. 부가적으로, 관계는 온도, 압력, 기체 흐름 속도, 인가된 전력, 인가된 전압, 회전 속도, 병진 속도, 액체 분사 속도, 액체 분사 용적을 포함할 수 있지만 이들로 제한되지 않는 챔버(5)에서 구현되는 공정 조건(예를 들어, 설정점)까지 확장될 수 있다. 게다가, 공정 조건은 각각의 특성에 대한 분포 또는 프로파일로서 정렬된 결과의 범위를 포함할 수 있다. 공정 조건 외에도, 스펙트럼 데이터는 기판의 하나 이상의 특징부를 대표할 수 있다. 이 경우에, 특징부 특성은 특징부의 두께, 폭, 높이, 방향, 거칠기, 평탄도, 각, 커버리지, 정렬 및/또는 기하학적 프로파일을 포함할 수 있지만 이들로 제한되지 않는다. 부가적으로, 특징부 특성은 면적, 특징부 사이의 거리, 또는 서로에 대한 특징부의 방향(예를 들어, 특징부의 중복, 노출 면적, 정렬)을 지칭할 수 있다. 실험 또는 시뮬레이션된 LR 및 HR 데이터 세트가 생성되는 위의 적용 중 임의의 적용은 본 명세서에서 설명된 기법을 사용하여 인공 신경망을 훈련시키도록 사용될 수 있다.
시스템(100)은 두가지(2) 작동 모드, 즉, 기계-학습 모델이 데이터 해상도를 증가시키기 위해 구성되는 훈련 모드, 및 데이터 해상도가 구성된(훈련된) 모델에 기초하여 증가되는 생산 모드로 작동될 수 있다. 생산 모드에서, LR 데이터 세트(110l)(이미지, 스펙트럼)는 LR 데이터 획득 기구(105l)(영상기, 분광계)를 통해 획득되고 프로세서(150)에 제공된다. 프로세서(150)는 LR 데이터 세트(110l)를 ML 엔진(132)으로 전달할 수 있고, 이는 아래에서 설명된 바와 같이 데이터의 해상도를 증가시키기 위해 이전에 훈련된 ML 모델에 따라서 데이터를 처리할 수 있다. 해상도 증가된 데이터 세트는 사용자 인터페이스(140)에 제시되어 생산 담당자에 의해 분석될 수 있다. 하나의 실시형태에서, 해상도 증가된 데이터 세트는 공정 제어기(134)에 제공되며, 공정 제어기에 의해 데이터는 특정한 타깃 공정 상태가 달성되었는지를 결정하도록 분석된다. 예를 들어, 해상도 증가된 데이터 세트의 분석은 공정 엔드포인트를 나타내는 챔버(5)의 특정한 기체 성분을 나타낼 수 있다. 이러한 엔드포인트에서, 공정 제어기(134)는 공정 전이 또는 챔버(5)에서 발생하는 모든 공정의 중단을 지시하거나 또는 명령할 수 있다.
도 2는 본 발명이 구현될 수 있는 인공 신경망(ANN)(200)의 개략도이다. 본 발명은 출력 데이터의 데이터 해상도를 증가시키는 목적에 도달하는 한 특정한 ANN 구현예로 제한되지 않는다. 예시된 예에서, ANN(200)은 입력 컨볼루션 층(210), 잔여 블록(220 및 230)으로 대표적으로 예시된 다수의 잔류 블록(B1-BK), 및 출력 컨볼루션 층(240)을 포함하는 피라미드형 잔류 신경망으로서 구축되거나 구성된다. ANN(200)에서, 1) 내부 특징부 맵의 크기 또는 특징부 맵 채널의 수가 ANN 입력으로부터 출력으로 점진적으로 증가하고, 2) 신원 매핑이 구배 소멸/폭발 문제를 해결하는 지름길 경로에서 실현된다.
도 2의 예시적인 실시형태에서, LR 데이터 세트(들)(205)로서 본 명세서에서 대표적으로 지칭되는 LR 데이터 세트(205a 내지 205m)는 다른 가능한 작동 중에서도 특히, 특징부 맵(들)(215)으로서 본 명세서에서 대표적으로 지칭되는 대응하는 특징부 맵(215a 내지 215m)에 각각의 데이터 세트(205)를 매핑하는 입력 컨볼루션 층(210)에 제공될 수 있다. 특징부 맵(215)은 ANN(200)의 모든 K개의 잔여 블록과 같이, 제1 컨볼루션 층(260a), 제1 활성화 층(265a), 제2 컨볼루션 층(260b) 및 제2 활성화 층(265b)을 포함할 수 있는 잔여 블록(220)에 제공될 수 있다. 부가적으로, 각각의 특징부 맵(215)은 지름길 경로(들)(217)로서 본 명세서에서 대표적으로 지칭되는 각각의 지름길 경로(217a 내지 217n) 내, 합산 노드(들)(225)로서 본 명세서에서 대표적으로 지칭되는 합산 노드(225a 내지 225n)에 제공될 수 있다. 따라서, 각각의 합산 노드의 출력은 다음과 같이 제공될 수 있다.
Figure pct00001
X k k번째 잔여 블록에 대한 입력이고 X k +1은 이의 출력이고,
Figure pct00002
는 활성화 함수(예를 들어, 정류된 선형 단위(rectified linear unit: ReLU))이고, *는 컨볼루션 연산자이고
Figure pct00003
Figure pct00004
k번째 블록의 훈련 가능한 컨볼루션 커널이다. 바이어싱 항이 위의 식에서 생략되었다는 것에 유의해야 한다. 각각의 컨볼루션 층에 의해 생성된 특징부 맵은 다음과 같이 제공될 수 있다.
Figure pct00005
Figure pct00006
k번째 잔여 블록의 j번째 컨볼루션 층의 출력 특징부 맵이고,
Figure pct00007
k번째 잔여 블록의 i번째 컨볼루션 층의 입력 특징부 맵이고,
Figure pct00008
Figure pct00009
i번째 커널이고,
Figure pct00010
는 훈련 가능한 바이어스 항이고
Figure pct00011
는 모든 항목이 하나로 설정된 특징부 맵 크기 설정된 행렬이다.
특징부 맵(215)은 잔여 블록(220)에 의해 처리되고 다음의 잔여 블록, 즉, 잔여 블록(230)으로 전달되며, 여기서 특징부 맵은 유사하게 처리된다. 그러나, 각각의 잔여 블록은 이전의 잔여 블록에 의해 생성된 것보다 더 큰 치수의 특징부 맵(및/또는 연관된 특징부 맵 채널)을 생성할 수 있다. 예를 들어, 잔여 블록(220)에 대한 입력은 N개의 채널(227a 내지 227n)을 포함할 수 있고 잔여 블록(220)의 출력은 P개의 채널(232a 내지 232p)을 포함할 수 있고, 여기서 P>N이다. 이 치수 불일치는 예를 들어, 잔여 블록(230)을 우회하는 지름길 연결부, 예를 들어, 지름길 연결부(227a 내지 227n)을 제로-패딩함으로써 극복될 수 있다.
데이터 세트가 ANN(200)을 통해 진행되고 그 치수가 점진적으로 증가함에 따라, 잔여 블록들 간에 훨씬 더 미세한 특징부가 식별되어 원본 데이터 세트(205)보다 해상도를 증가시킬 수 있다. 처리된 특징부 맵은 출력 컨볼루션 층(240)으로 진행되고, 다른 선택적 처리 작동 중에서도 특히, 이들은 출력 데이터 세트(들)(245)로서 본 명세서에서 대표적으로 지칭되는 출력 데이터 세트(245a 내지 245m)로 변형된다. ANN(200)이 훈련되었다면, 출력 데이터 세트(245)는 예컨대, 데이터 분석 또는 공정 제어를 위해 ANN 외부 기구에 제공된다. 그러나, ANN(200)이 훈련을 진행 중인 경우에, 출력 데이터 세트(245)는 LR 원본 데이터 세트(205)에 포함된 데이터에 대응하도록 선택된 HR 훈련 데이터 세트(들)(250)로서 본 명세서에서 대표적으로 지칭되는 각각의 고해상도 훈련 데이터 세트(250a 내지 250m)와 비교된다. 즉, 각각의 LR 원본 데이터 세트(205)가 HR 훈련 데이터 세트(250)에 매칭되어 비록 해상도는 상이하지만 둘 다에서 동일한 특징이 존재한다. 훈련 시, LR 원본 데이터 세트(205)는 무작위로 초기화된 함수에 따라 HR 데이터 세트로 변형된다. 변형된 HR 데이터 세트는 오류 측정을 결정하기 위해 대응하는 HR 훈련 데이터 세트와 예컨대, 차별화에 의해 적절하게 비교된다. 이러한 오류 측정을 사용하여, ANN 매개변수, 예컨대, 위에서 설명된
Figure pct00012
Figure pct00013
는 목적 함수, 예컨대, 훈련 손실 함수를 최소화(또는 최대화)하도록 수정된다. 수정된 매개변수는 역전파 채널(257)로 대표적으로 예시된 ANN(300)을 통해 역전파될 수 있고, 공정은 다른 HR 출력 데이터 세트를 생성하기 위해 새로운 매개변수를 사용하여 반복될 수 있다. 이 공정은 훈련 목표에 도달할 때까지, 예컨대, 훈련 가능한 네트워크 매개변수가 수렴될 때까지 또는 해상도의 개선이 달성되지 않을 때까지 반복된다.
LR 데이터 세트(205)는 LR 분광기 데이터를 포함할 수 있고 HR 데이터 세트(250)는 HR 분광기 데이터를 포함할 수 있다. 스펙트럼 데이터 자체 외에도, HR 및 LR 데이터 세트에는 스펙트럼 데이터와 연관된 관찰된 공정 또는 특징부와 관련된 정보가 라벨로 표시될 수 있다. 이러한 라벨링은, 무작위적이지만 유사한 LR 데이터 세트의 입력에 기초하여 예측 가능한 HR 결과를 생성하는 데 필요한 모델 최적화의 유형에 따라, HR/LR 데이터 세트의 특정한 양상을 분리하거나 또는 HR/LR 데이터 세트의 특정한 양상을 중첩하는 데 사용될 수 있다. HR/LR 데이터 세트는 HR/LR 데이터 세트의 하나 이상의 조합을 포함할 수 있는 훈련 쌍으로 분류될 수 있고, HR/LR 훈련 쌍 간의 관계를 식별하는 것에 기초하여 ANN(200)을 훈련하는 데 사용된다. 높은 수준에서, 훈련은 ML 모델에 따라서 생성된 HR 데이터가 ML 기법을 사용하여 데이터 세트 간의 통계적 관계를 최적화하기 위해 HR 데이터 세트와 비교되는 반복 공정이다.
또 다른 실시형태에서, LR 데이터 세트(205)는 ML 모델을 훈련하는 데 사용될 수 있는 이미지 데이터를 포함한다. 이 경우에, LR 데이터 세트(205)는 LR 이미지로 표시되고 HR 데이터 세트(250)는 HR 이미지로 표시된다. 이들 2개의 이미지는 위에서 설명된 바와 같이 저해상도 및 고해상도 데이터 획득 기구(105l 및 105h)에 의해 수집된 입력 데이터를 나타낼 수 있다. 이미지 데이터 외에도, HR 및 LR 데이터 세트에는 이미지 데이터와 연관된 관찰된 공정 또는 특징부와 관련된 정보가 라벨로 표시될 수 있어서, 라벨 정보는 데이터 세트 간의 차이 또는 유사성을 강조하도록 사용될 수 있다. 라벨 정보는, 무작위적이지만 유사한 LR 데이터 세트의 입력에 기초하여 예측 가능한 HR 결과를 생성하는 데 필요한 모델 최적화의 유형에 따라, HR/LR 데이터 세트의 특정한 양상을 분리하거나 또는 HR/LR 데이터 세트의 특정한 양상을 중첩하는 데 사용될 수 있다. HR/LR 데이터 세트는 HR/LR 데이터 세트의 하나 이상의 조합을 포함할 수 있는 훈련 쌍으로 분류될 수 있고, HR/LR 훈련 쌍 간의 관계를 식별하는 것에 기초하여 ML 기술을 사용하여 ANN(200)을 훈련하는 데 사용되어, 따라서 ML 모델이 LR 데이터 세트(205)를 사용하여 HR 데이터 세트(245)를 예측하거나 또는 생성하게 한다.
위에서 제공된 훈련 예가 본 발명의 실시형태의 ANN을 훈련시키기 위한 많은 가능성 중 하나에 불과하다는 것을 이해한다. 하나의 실시형태에서, 데이터 획득 기구에 의해 또는 데이터 생성기에 의해 생성된 데이터 세트는 예를 들어, 학습 기법을 훈련하기 위해 사용되는 훈련 세트, 모델 아키텍처를 평가하기 위해 사용되는 검증 세트, 및 모델이 단지 훈련을 위해 사용되는 데이터 세트를 넘어 적합하게 일반화되는지를 결정하는 데 사용되는 테스트 세트로 분할될 수 있다. 기계 학습 기술을 가진 사람은 본 명세서에 제시된 특정한 상세사항 없이 이러한 분할된 데이터 세트를 사용하는 방법뿐만 아니라 본 발명의 정신 및 의도된 범위로부터 벗어나는 일 없이 본 발명을 구현하기 위한 다른 기계-학습 기법을 인식할 것이다.
또 다시 도 1을 참조하면, 시스템(100)은 시뮬레이션된 데이터 세트가 모델 훈련을 위해 생성되는 고해상도 데이터 생성기(115)를 포함할 수 있다. 이미지 및 스펙트럼 데이터 외에도, 시뮬레이션된 스펙트럼 모델 데이터는 ANN(200)을 훈련하기 위해 사용될 수 있다. 그러나, 훈련 쌍은 아래의 도 3에 예시된 설계와 유사한 분광계로부터 LR 및 HR 분광기 데이터의 추정인 저해상도 및 고해상도 시뮬레이션으로부터 도출될 수 있다.
도 3은 본 발명이 구현될 수 있는 예시적인 분광계(300)의 개략도이다. 분광계(300)는 체르니-터너(Czerny-Turner) 설계를 따를 수 있고 입구 슬릿(310), 시준 거울(320), 회절 격자(330), 접이식 거울(340) 및 어레이 검출기(350)를 포함한다. 도 1의 챔버(5)에서 발생하는 전기화학 공정에서 생성된 광을 포함하는 광은 입구 슬릿(310)을 통해 분광계(300)에 진입하고 시준 거울(320)로부터 회절 격자(330) 상으로 반사되며, 여기서 충돌하는 광은 스펙트럼 성분으로 분해된다. 이 성분은 접이식 거울(340)로부터 그리고 어레이 검출기(350) 상에 반사되고, 이는 분석 중인 광의 스펙트럼 함량을 나타내는 전기 신호를 생성한다. 본질적으로, 입구 슬릿(310)의 분광 분해 이미지는 어레이 검출기(350)에서 생성되고 이러한 이미징은 도 1의 HR 데이터 생성기(115)에 의해 구현된 다양한 광학 시스템 설계/분석 기법을 사용하여 시뮬레이션될 수 있다.
도 4는 입구 슬릿(310) 및 분광계(300)의 광학 시스템에 의해 생성된 바와 같은 입구 슬릿의 이미지(420)의 개략도이다. 예시된 실시형태에서, 입구 슬릿(310) 상의, 이미징 포인트(412)로서 본 명세서에서 대표적으로 지칭되는, 열두개(12)의 이미징 포인트(412a 내지 412l)가 이미징을 위해 선택된다. 광학 설계/분석 기법을 통해, 이미징 포인트(412)는 복수의 선택된 파장의 각각에 대해, 이미지 구역(425)에 대표적으로 예시된, 어레이 검출기(350) 상에 생성된 이미지(420)에 전달된다. 고정된 크기의 슬릿에 대해, 이미지화된 포인트(412)의 선명도는 파장 의존 회절의 영향을 받는다는 것에 유의한다.
모델 데이터는 스펙트럼에 걸쳐 유사한 강도를 갖는 300 ㎚ 내지 900 ㎚ 스펙트럼에 걸쳐 캘리브레이션 램프로부터의 광을 시뮬레이션하는 LR 및 HR 분광기에 대해 생성될 수 있다. 설명 목적으로, 2개의 상이한 분광계 설계가 훈련 쌍의 2개의 세트를 형성하도록 LR 및 HR 구현예에 대해 모델링되었다. 훈련 쌍의 LR 데이터 세트는 23 um 슬릿 및 1024 CCD를 사용하여 모델링되었고 2개의 부가적인 LR 데이터 세트는 슬릿에 대한 격자 배치를 변경함으로써 생성되었다. 언더필 실시형태는 오버필 실시형태보다 슬릿에 더 가깝게 위치된 격자를 가진 분광계 설계를 대표한다. 이 방식으로, LR 훈련 데이터 세트는 광범위한 LR 분광계 설계 및/또는 능력을 포함하고 2개의 상이한 LR 설계 간의 성능(예를 들어, SNR) 차를 나타낸다. 예를 들어, 도 5는 LR 분광계 설계 간의 강도 차를 예시하고, 언더필 실시형태는 오버필 실시형태보다 더 높고 더 날카로운 프로파일을 갖는다.
오버필 및 언더필 LR 데이터 세트는 대응하는 오버필 및 언더필 HR 데이터 세트와 쌍을 이룰 수 있다. 예시적인 HR 데이터 세트는 언더필 데이터 세트와 오버필 데이터 세트 사이에서 상이한 격자 거리로 10 um 슬릿 및 2048×256 픽셀 CCD를 사용하여 생성되었다. 도 6은 강도차를 강조함으로써 HR 분광계 설계 간의 차이를 예시한다. LR 데이터 세트와는 대조적으로, 오버필 데이터 세트는 언더필 데이터 세트와 비교하여 더 높은 강도 신호를 발생시켰다.
일단 ANN(200)이 훈련되고 검증되면, 모델은 적용 가능한 저해상도 데이터 세트에 적용되어 저해상도 입력에 대응하는 추정된 고해상도 데이터를 출력할 수 있다. 훈련 방법과 대조적으로, 훈련된 모델은 고해상도 상대 없이, 저해상도 데이터를 수신할 것이고, 대응하는 고해상도 출력을 생성하기 위해 모델에 데이터를 적용할 것이다. 저해상도 데이터는 반도체 처리 공정 또는 반도체 기판의 특징부와 관련된 이미지 또는 스펙트럼 데이터를 포함할 수 있지만 이들로 제한되지 않는다.
반도체 공간 내에서, 딥러닝 기법은 관찰되는 특징부의 크기에 따라 매크로 적용과 마이크로 적용 간의 범위의 이미지에 적용될 수 있다. 매크로 적용에서, 관찰된 특징부는 매크로 수준에서 공정 추세를 관찰하고 모니터링하기 위해 전체 기판 표면적 구역 내지는 비교적 큰 표면적의 구역의 범위일 수 있다. 예를 들어, 큰 표면적의 구역은 기판의 주변 둘레로 확장되는 기판 베벨 또는 에지 제외 영역(<5 ㎜)을 포함할 수 있다. 마찬가지로, 기판의 중심을 향해 최대 20 ㎜까지 확장되는 에지 제외 영역에 인접한 구역은 기판 에지에 근접한 공정 성능을 모니터링하기 위해 관찰될 수 있으며, 이 구역은 기판의 중심에 대한 공정 균일성 문제로 알려져 있다. 따라서, 기판의 중심 및 에지의 이미지를 비교하는 것은 공정 행정을 관찰하거나 또는 검출하거나 또는 현장 공정의 불균일성 또는 유입 공정의 불균일성을 고려하도록 공정을 조정하는 데 유익할 것이다. 일부 경우에, 중심-대-에지 관계는 적용에 따라 낮은 모델 내지 높은 모델을 훈련시키는 데 사용될 수 있다. 매크로 적용에서, 이미지 캡처 디바이스는 분석을 위해 픽셀화된 이미지를 생성하는 디지털 또는 아날로그-대-디지털 시스템일 수 있다. 하나의 실시형태에서, 이미지 캡처 디바이스는 CCD 카메라일 수 있다. 대조적으로, 마이크로-적용 실시형태는 매크로-적용과 비교할 때 다이 또는 다이 내 더 작은 영역에 걸쳐 상대적으로 더 작은 특징부를 관찰하기 위한 것이다. 예를 들어, 마이크로-적용 이미지는 원자층 정밀도로 공정을 제어하고 모니터링하는 규모일 수 있다. 트랜지스터 게이트 구조(예를 들어, FinFET), 트랜지스터의 구성요소(예를 들어, 접촉부, 격리부) 또는 백 엔드-오브-라인(back end-of-line: BEOL) 특징부(예를 들어, 금속 라인 피치, 비아)의 원자층 제어가 필수적이다. 하나의 실시형태에서, 마이크로-적용 이미지는 기판의 지형 및 구성 정보를 제공하는 집속된 전자 빔으로 기판 표면/특징부를 스캔하는 주사 전자 현미경(scanning electron microscope: SEM)에 의해 생성될 수 있다. 대안적으로, 이미지는 플라즈마 처리를 포함하지만 이로 제한되지 않는 반도체 공정을 모니터링하기 위해 광학 방출 분광학을 사용하여 생성될 수 있다.
도 7은 본 발명이 구현될 수 있는 예시적인 훈련 과정(700)을 예시하는 흐름도이다. 과정(700)이 LR 및 HR 데이터 세트의 매칭된 쌍을 포함하는 데이터, 예를 들어, 본 명세서에서 설명된 LR 및 HR 분광계로부터 획득된 스펙트럼 데이터의 훈련 코퍼스에 접근한다고 가정한다. 훈련 코퍼스는 훈련 용적(705a), 검증 용적(705b) 및 테스트 용적(705c)으로 적절하게 세분화되거나 분할될 수 있다. 코퍼스를 훈련, 검증 및 테스트 용적으로 분할하는 것은 기계-학습 기술의 알려진 이러한 기법을 따를 수 있다. 실제로, 과정(700)은 본 발명의 실시형태에서 사용될 수 있는 많은 모델 구축/훈련 패러다임 중 하나의 흐름 개략 형태를 나타낸다. 다음의 설명에서, 모델 패러다임은 도 2를 참조하여 위에서 설명된 것을 나타낸다. 도 7의 작동 및 데이터 흐름의 순서가 간결한 설명을 위한 것이고; 다른 작동 및 데이터 흐름이 또한 모델 구축/훈련을 구현하기 위해 사용될 수 있다는 것을 이해한다.
도 7에서 예시된 바와 같이, 훈련 용적(705a)은 저해상도 데이터 획득 기구에 의해 획득될 수 있는 LR 원본 데이터 세트(707a)를 포함할 수 있다. 작동(710)에서 LR 데이터 세트(707a)는 ANN에 따라 처리되어 HR 출력 데이터 세트(715)를 생성한다. 작동(720)에서, 고해상도 데이터 획득 기구에 의해 획득되거나 또는 고해상도 데이터 생성기에 의해 시뮬레이션된 HR 출력 데이터 세트(715)와 훈련 데이터 세트(709a) 간의 차이가 결정된다. 작동(725)에서, ANN 매개변수(가중치, 바이어스)는 목적 함수를 최대화하거나 또는 최소화하도록 결정된다. 작동(730)에서, 결정된 ANN 매개변수는 ANN을 통해 역전파된다.
훈련 용적이 소진되면, 과정(700)은 모델이 데이터에 과적합(overfitting)하는지 또는 주어진 사양으로 일반화하는지를 결정하는 작동(735)으로 전이될 수 있다. 이를 위해, 원본 LR 데이터 세트(707b) 및 HR 검증 세트(709b)를 포함하는 검증 용적(705b)은 훈련 용적(705a)에 대해 위에서 설명된 방식과 유사한 방식으로 훈련된 모델에 적용될 수 있다. 그러나, 이때 예측 효율성보다는 소위 하이퍼 매개변수를 통해 표현되는 바와 같은, 모델의 아키텍처에 집중한다. 따라서, 작동(735)에서 모델이 잘 일반화되지 않는 경우에, 작동(740)에 의해 하나 이상의 하이퍼 매개변수가 변경될 수 있다. 예를 들어, 도 2를 참조하여 위에서 설명된 모델의 잔여 블록이 제거될 수 있거나 또는 각각의 잔여 블록 내의 작동 블록의 순서가 수정될 수 있는 등이다. 숙련된 장인은 본 발명의 실시형태에서 과적합을 교정하기 위해 적용될 수 있는 많은 기법을 인식할 것이다.
작동(735)에서 모형이 잘 일반화된다고 결정되면, 과정(700)은 훈련된 모델이 성능 기준을 충족하는지를 결정하는 작동(750)으로 전이될 수 있다. 이러한 목적을 위해, 원본 LR 데이터 세트(707c) 및 HR 테스트 세트(709c)를 포함하는 테스트 용적(705c)은 훈련 용적(705a) 및 검증 용적(705b)에 대해 위에서 설명된 방식과 유사한 방식으로 훈련된 모델에 적용될 수 있다. 그러나, 이때 정확도, 즉, 모델로부터 예측된 HR 데이터 세트가 실제 관찰 측정에 의해 생성될 진짜의 HR 데이터 세트에 얼마나 가까운지, 그리고 민감도, 즉, 이와 같이 정확하게 식별되는 HR 예측(모델을 통함)의 특징부의 비율에 대해 특정한 성능 기준에 의해 측정되는 바와 같은, 모델의 성능에 집중된다. 이러한 기준이 충족된다면, 과정(700)은 종료될 수 있다. 그렇지 않으면, 과정(700)은 ANN 하이퍼 매개변수가 다시 한번 수정되는 작동(740)으로 전이될 수 있다. 이어서 과정(700)은 작동(710)으로 전이될 수 있고 그 시점부터 계속된다.
도 8은 본 발명이 구현될 수 있는 예시적인 생산 과정(800)을 예시하는 흐름도이다. 생산 과정(800)은 시스템이 생산 모드로 있을 때 실행될 수 있다. 작동(810)에서, LR 데이터 세트(805)는 위에서 설명된 ANN의 출력인, 대응하는 HR 출력 데이터 세트(815)를 예측하도록 사용된다. 이어서 과정(800)은 과정 상태가 HR 출력 데이터 세트(815)로부터 결정되는 작동(820)으로 전이될 수 있다. 타깃 과정 상태가 작동(825)에서 결정된 바와 같이, 도달되었다면, 생산 과정(800)은 종료된다. 타깃 과정 상태가 도달되지 않았다면, 과정(800)은 새로 획득된 LR 데이터에 대한 작동(810)으로 전이될 수 있고 그 시점부터 계속된다.
하나의 실시형태는 측정된 저해상도 데이터로부터 고해상도 데이터를 제공하도록 신경망을 훈련시키기 위한 방법을 포함한다. 훈련 방법은 유형의 컴퓨터-판독 가능한 메모리에 반도체 공정 또는 처리 챔버 내의 반도체 기판의 특징부와 관련된 데이터 세트를 저장하는 단계를 포함할 수 있다. 데이터 세트는 공정 또는 특징부를 나타내는 러프한(rough)(저해상도) 데이터 세트 및 공정 또는 특징부를 나타내는 디테일한(고해상도) 데이터 세트를 포함할 수 있고, 디테일한 데이터 세트는 러프한 데이터 세트와 상이하다. 하나의 예에서, 러프한 데이터 세트와 디테일한 데이터 세트 간의 차이는 공정 또는 특징부의 적어도 하나의 특성에 대한 더 넓거나 또는 더 좁은 범위의 정보를 포함한다. 컴퓨터 처리 디바이스는 러프한 데이터 세트와 디테일한 데이터 세트의 경우 간의 훈련 관계를 할당하기 위해 사용되고, 신경 네트워크 기법은 적어도 부분적으로, 훈련 관계 및 러프한 데이터 세트와 디테일한 데이터 세트 간의 차이에 기초하여, 러프한 데이터 세트를 디테일한 데이터 세트에 연관시키는 모델을 생성하기 위해 사용된다. 하나의 예에서, 디테일한 데이터 세트는 적어도 하나의 특성에 대해, 러프한 데이터 세트와 비교하여 더 높은 해상도의 데이터를 포함한다. 공정의 특성은 공정의 화학 성분, 공정의 온도, 공정의 밀도, 및/또는 공정과 연관된 전기 에너지일 수 있다. 공정의 특성은 화학 성분, 온도, 밀도, 및/또는 전기 에너지의 분포 또는 프로필을 포함할 수 있다. 특징부의 특성은 특징부의 두께, 폭, 높이, 방향, 거칠기, 평탄도, 각도, 커버리지, 정렬 및/또는 기하학적 프로필과 같은 측정된 물리적 형상이 포함될 수 있다.
데이터 세트는 공정 또는 특징부의 이미지, 스펙트럼 표현 또는 모듈 시뮬레이션을 포함할 수 있다. 하나의 실시형태에서, 데이터 세트는 적어도 부분적으로 공정 또는 특징부의 이미지, 스펙트럼 표현 및/또는 시뮬레이션에 기초한다. 신경망 기법은 적어도 부분적으로 컨볼루션 신경망 기법에 기초할 수 있고, 데이터 세트는 분광계에 의해 생성될 수 있다. 일부 실시형태에서, 러프한 데이터 세트는 광 또는 에너지를 러프한 분광계로 허용하는 러프한 슬릿을 가진 러프한 분광계에 의해 생성되며, 디테일한 데이터 세트는 광 또는 에너지를 디테일한 분광계로 허용하는, 디테일한 슬릿을 포함하는 디테일한 분광계에 의해 생성되고, 디테일한 슬릿은 러프한 슬릿의 대응하는 개구 또는 갭보다 더 작은 개구 또는 갭을 포함한다. 데이터 세트는 또한 이미지 캡처 디바이스, 예컨대, 전하 결합 디바이스 카메라에 의해 생성될 수 있다. 대안적으로, 이미지 캡처 디바이스는 현미경 및 카메라를 포함할 수 있다.
훈련 관계 할당은 적어도 부분적으로 러프한 데이터 세트 및 디테일한 데이터 세트의 수집 동안 존재하는 공통 구성요소에 기초한다. 공통 구성요소는 반도체 공정의 공정 조건 또는 반도체 기판의 특징부의 특징부 유형이다. 공정 조건은 온도, 압력, 화학 성분, 기체 흐름 속도, 인가된 전력, 인가된 전압, 회전 속도, 병진 속도, 액체 분사 속도, 액체 분사 용적을 포함할 수 있다. 특징부 유형은 기판 내 패턴 또는 기판 상의 패턴을 포함할 수 있다. 일부 예에서, 특징부 유형은 특징부의 두께, 폭, 높이, 길이, 방향, 거칠기, 평탄도, 각, 커버리지, 정렬 및/또는 기하학적 프로파일을 포함한다. 특징부 유형은 또한 특징부의 임계 치수, 특징부의 표면적, 특징부의 노출된 표면적, 특징부 간의 중첩, 특징부 간의 거리, 특징부 간의 방향 및/또는 특징부 간의 정렬을 포함할 수 있다. 방법의 훈련 관계 할당은 공정 동안 또는 특징부 상에서 수집된 단일의 러프한 데이터 세트와 단일의 디테일한 데이터 세트의 쌍을 이루는 것을 포함할 수 있다.
하나의 실시형태는 반도체 공정 또는 반도체 기판의 특징부와 관련된 데이터 세트가 유형의 컴퓨터-판독 가능한 메모리에 저장되는 방법을 포함한다. 데이터 세트는 공정 또는 특징부를 나타내는 러프한(저해상도) 데이터 세트를 포함할 수 있다. 러프한 데이터 세트는 적어도 부분적으로 공정 또는 특징부와 관련된 저해상도 데이터 세트와 고해상도 데이터 세트 간의 차에 적어도 부분적으로 기초하여 디테일한 해상도 모델에 적용된다. 공정 또는 특징부를 나타내는 디테일한(고해상도) 데이터 세트는 신경망 기법을 사용하여 생성되고 디테일한 데이터 세트는 러프한 데이터 세트와는 상이하고, 차이는 적어도 부분적으로 공정 또는 특징부의 적어도 하나의 특성에 대한 더 많은 양의 정보에 기초한다. 신경망 기법은 적어도 부분적으로 컨볼루션 신경망 기법에 기초할 수 있다. 디테일한 데이터 세트는 공정의 화학 성분, 공정의 온도, 공정의 밀도 및/또는 공정과 연관된 전기 에너지, 화학 성분의 분포, 균일성 또는 프로파일, 특징부의 온도, 밀도 및/또는 전기 에너지, 두께, 폭, 높이, 방향, 거칠기, 평탄도, 각, 커버리지, 정렬 및/또는 기하학적 프로파일을 포함할 수 있는, 적어도 하나의 특성에 대한, 러프한 데이터 세트와 비교하여 더 높은 해상도의 데이터를 포함할 수 있다.
데이터 세트는 공정 또는 특징부의 이미지 또는 스펙트럼 표현을 포함할 수 있고 적어도 부분적으로 특징부 또는 공정의 이미지 또는 스펙트럼 표현에 기초할 수 있다. 데이터 세트는 분광계에 의해 생성될 수 있고, 특정한 실시형태에서, 러프한 데이터 세트는 광 또는 에너지를 러프한 분광계로 허용하는 러프한 슬릿을 포함하는 러프한 분광계에 의해 생성되고 디테일한 데이터 세트는 광 또는 에너지를 디테일한 분광계로 허용하는, 디테일한 슬릿을 포함하는 디테일한 분광계에 의해 생성된다. 디테일한 슬릿은 러프한 슬릿의 대응하는 개구 또는 갭보다 더 큰 개구 또는 갭을 가질 수 있다.
데이터 세트는 또한 이미지 캡처 디바이스, 예컨대, 현미경이 있거나 또는 없는 전하 결합 디바이스 카메라를 포함하는 것에 의해 생성될 수 있다.
훈련 관계 할당은 적어도 부분적으로 러프한 데이터 세트 및 디테일한 데이터 세트의 수집 동안 존재하는 공통 구성요소에 기초할 수 있고, 공통 구성요소는 반도체 공정의 공정 조건, 반도체 기판의 특징부의 특징부 유형, 온도, 압력, 화학 성분, 기체 흐름 속도, 인가된 전력, 인가된 전압, 회전 속도, 병진 속도, 액체 분사 속도, 액체 분사 용적일 수 있고, 매칭 공정 챔버에 대한 조정을 전송하는 것을 더 포함한다.
특징부 유형은 기판 내 패턴, 기판 상의 패턴, 특징부의 두께, 폭, 높이, 길이, 방향, 거칠기, 평탄도, 각, 커버리지, 정렬, 기하학적 프로파일, 특징부의 임계 치수, 특징부의 표면적, 특징부의 노출된 표면적, 특징부 간의 중첩, 특징부 간의 거리, 특징부 간의 방향 및/또는 특징부 간의 정렬일 수 있다.
메모리 회로망(120)은 임의의 수량의 임의의 유형의 종래의 또는 다른 메모리 또는 저장 디바이스에 의해 구현될 수 있고 휘발성(예를 들어, RAM, 캐시, 플래시 등) 또는 비휘발성(예를 들어, ROM, 하드-디스크, 광학 저장소 등)일 수 있고, 임의의 적합한 저장 용량을 포함할 수 있다. 시스템의 데이터(예를 들어, 이미지, 스펙트럼, 모델 매개변수 등)는 메모리 회로망(120)의 저장 영역에 저장된다.
프로세서 회로망(130)은 예를 들어, 하나 이상의 데이터 처리 디바이스, 예컨대, 마이크로프로세서, 마이크로제어기, 시스템 온 칩(system on a chip: SOC) 또는 메모리에 저장된 프로세스 로직에 대한 명령어를 실행하는, 다른 고정되거나 또는 프로그래밍 가능한 로직일 수 있다. 프로세서 자체는 멀티-프로세서일 수 있고, 다수의 CPU, 다수의 코어, 다수의 프로세서를 포함하는 다수의 다이 등을 갖는다. 부가적으로, 프로세서 회로망(130)은 전용 기계-학습 회로를 포함할 수 있다. 디스플레이 렌더링 하드웨어는 프로세서 회로망의 일부일 수 있거나 또는 예를 들어, 별개의 그래픽 프로세서 장치(Graphics Processor Unit: GPU)일 수 있다.
사용자 인터페이스 회로망(140)은 정보를 사용자, 예를 들어, 태블릿의 스크린 또는 컴퓨터 워크스테이션에 부착된 모니터에 표시할 수 있는 임의의 적합한 디스플레이, 스크린 또는 모니터를 포함할 수 있다. 사용자 인터페이스 회로망(140)은 임의의 적합한 입력 디바이스, 예를 들어, 키보드, 마우스, 트랙패드, 터치 입력 태블릿, 터치 스크린, 카메라, 마이크, 리모컨, 음성 합성기 등을 포함할 수 있는, 입력 디바이스(들)를 포함할 수 있다. 출력 디바이스(들), 예를 들어, 스피커, 헤드폰, 사운드 출력 포트 등이 포함될 수 있다.
당업자라면 이해할 바와 같이, 본 발명의 양상은 시스템, 방법 또는 컴퓨터 프로그램 제품으로서 구현될 수 있다. 따라서, 본 발명의 양상은 완전히 하드웨어 실시형태, 완전히 소프트웨어 실시형태(펌웨어, 상주 소프트웨어, 마이크로 코드 등을 포함함) 또는 본 명세서에서 일반적으로 "회로", "모듈" 또는 "시스템"으로서 전부 지칭될 수 있는 소프트웨어와 하드웨어 양상을 결합한 실시형태의 형태를 취할 수 있다. 게다가, 본 발명의 양상은 컴퓨터 판독 가능한 프로그램 코드가 구현되는 하나 이상의 컴퓨터 판독 가능한 매체(들)에서 구현되는 컴퓨터 프로그램 제품의 형태를 취할 수 있다.
하나 이상의 컴퓨터 판독 가능한 매체(들)의 임의의 조합이 활용될 수 있다. 컴퓨터 판독 가능한 매체는 컴퓨터 판독 가능한 신호 매체 또는 컴퓨터 판독 가능한 저장 매체일 수 있다. 컴퓨터 판독 가능한 매체는 예를 들어, 전자, 자기, 광학, 전자기, 적외선 또는 반도체 시스템, 장치 또는 디바이스 또는 전술한 것의 임의의 적합한 조합일 수 있지만 이들로 제한되지 않는다. 컴퓨터 판독 가능한 저장 매체의 더 구체적인 예(비완전한 목록)는 다음을 포함할 것이다: 하나 이상의 와이어를 가진 전기 연결부, 휴대용 컴퓨터 디스켓, 하드 디스크, 솔리드 스테이트 디스크, 랜덤 액세스 메모리(random access memory: RAM), 판독-전용 메모리(read-only memory: ROM), 소거 가능한 프로그램 가능한 판독-전용 메모리(EPROM 또는 플래시 메모리), 광섬유, 휴대용 콤팩트 디스크 판독-전용 메모리(CD-ROM), 광학 저장 디바이스, 자기 저장 디바이스, 상변화 메모리 저장 디바이스 또는 전술한 것의 임의의 적합한 조합. 이 문서의 맥락에서, 컴퓨터 판독 가능한 저장 매체는 명령어 실행 시스템, 장치 또는 디바이스에 의해 또는 이와 관련하여 사용되는 프로그램을 포함하거나 또는 저장할 수 있는 임의의 유형의 매체일 수 있다.
컴퓨터 판독 가능한 신호 매체는 예를 들어, 베이스밴드에서 또는 반송파의 일부로서 컴퓨터 판독 가능한 프로그램 코드가 내장된 전파 데이터 신호를 포함할 수 있다. 이러한 전파 신호는 전자기, 광학 또는 이들의 임의의 적합한 조합을 포함하지만 이들로 제한되지 않는 임의의 다양한 형태를 취할 수 있다. 컴퓨터 판독 가능한 신호 매체는 컴퓨터 판독 가능한 저장 매체가 아니며 명령어 실행 시스템, 장치 또는 디바이스에 의해 사용되거나 또는 연결되는 프로그램을 통신, 전파 또는 전송할 수 있는 임의의 컴퓨터 판독 가능한 매체일 수 있다. 컴퓨터 판독 가능한 매체에 내장된 프로그램 코드는 무선, 유선, 광섬유 케이블, RF 등 또는 전술한 것의 임의의 적합한 조합을 포함하지만 이들로 제한되지 않는 임의의 적절한 매체를 사용하여 전송될 수 있다.
본 발명의 양상에 대한 작동을 수행하기 위한 컴퓨터 프로그램 코드는 하나 이상의 프로그래밍 언어, 예를 들어, 객체 지향 프로그래밍 언어, 예컨대, 자바(Java), 파이썬(Python), 스몰토크(Smalltalk), C++ 등 또는 종래의 절차적 프로그래밍 언어, 예컨대, "C" 프로그래밍 언어 또는 유사한 프로그래밍 언어의 임의의 조합으로 작성될 수 있다. 프로그램 코드는 전적으로 사용자의 컴퓨터, 부분적으로 사용자 컴퓨터, 독립 소프트웨어 패키지로서, 부분적으로 사용자의 컴퓨터 그리고 부분적으로 원격 컴퓨터 또는 전적으로 원격 컴퓨터 또는 서버에서 실행될 수 있다. 후자의 시나리오에서, 원격 컴퓨터는 근거리 통신망(local area network: LAN) 또는 광역 통신망(wide area network: WAN)을 포함하는 임의의 유형의 네트워크를 통해 사용자의 컴퓨터에 연결될 수 있거나 또는 외부 컴퓨터에 (예를 들어, 인터넷 서비스 공급자를 사용하여 인터넷을 통해) 연결될 수 있다.
시스템(100)의 다양한 기능은 임의의 수량의 소프트웨어 모듈 또는 장치, 처리 또는 컴퓨터 시스템 및/또는 회로망 간에 임의의 방식으로 분포될 수 있고, 컴퓨터 또는 처리 시스템은 서로 국부적으로 또는 원격으로 배치될 수 있고 임의의 적합한 통신 매체(예를 들어, LAN, WAN, 인트라넷, 인터넷, 하드와이어, 모뎀 연결, 무선 등)를 통해 통신할 수 있다.
본 발명의 양상은 본 발명의 실시형태에 따른 방법, 장치(시스템) 및 컴퓨터 프로그램 제품의 흐름도 및/또는 블록도를 참조하여 설명된다. 흐름도 및/또는 블록도의 각각의 블록, 및 흐름도 및/또는 블록도의 블록의 조합이 컴퓨터 프로그램 명령어에 의해 구현될 수 있고 프로세서 회로망(130)에 의해 실행되어 기계를 생성할 수 있어서, 명령어가 흐름도 및/또는 블록도의 블록 또는 블록들에 명시된 기능/작동을 구현하기 위한 수단을 생성한다는 것을 이해할 것이다.
도면의 흐름도와 블록도는 본 발명의 다양한 실시형태에 따른 시스템, 방법 및 컴퓨터 프로그램 제품의 가능한 구현예의 아키텍처, 기능성 및 작동을 예시한다. 이와 관련하여, 흐름도 또는 블록도의 각각의 블록은 명시된 논리 기능(들)을 구현하기 위한 하나 이상의 실행 가능한 명령어를 포함하는, 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또한 일부 대안적인 구현예에서, 블록에 명시된 기능이 도면에 명시된 순서에 따라 발생할 수 있다는 점에 유의해야 한다. 예를 들어, 연속해서 도시된 2개의 블록은 실제로 실질적으로 동시에 실행될 수 있거나, 또는 블록은 때때로 수반된 기능에 따라 역순으로 실행될 수 있다. 블록도 및/또는 흐름도의 각각의 블록, 및 블록도 및/또는 흐름도의 블록의 조합이 명시된 기능이나 작동, 또는 특수 목적 하드웨어와 컴퓨터 명령어의 조합을 수행하는 특수 목적 하드웨어 기반 시스템에 의해 구현될 수 있다는 점에 또한 유의해야 할 것이다.
본 명세서에서 사용되는 용어는 특정한 실시형태만을 설명하기 위한 것이며 본 발명을 제한하는 것으로 의도되지 않는다. 본 명세서에서 사용될 때, 단수형 "a", "an" 및 "the"는 문맥이 명확하게 다르게 표시하지 않는 한 복수형도 포함하는 것으로 의도된다. 본 명세서에 사용될 때 용어 "포함하다" 및/또는 "포함하는"이 명시된 특징, 정수, 단계, 작동, 구성요소 및/또는 컴포넌트의 존재를 명시하지만, 하나 이상의 특징, 정수, 단계, 작동, 구성요소, 컴포넌트 및/또는 이들의 군의 존재 또는 추가를 배제하지 않는다는 것을 더 이해할 것이다.
아래의 청구범위에 있는 임의의 그리고 모든 수단 또는 단계 더하기 기능 구성요소의 대응하는 구조, 물질, 작동 및 등가물은 구체적으로 청구된 바와 같은 다른 청구된 구성요소와 결합하여 기능을 수행하기 위한 임의의 구조, 물질 또는 작동을 포함하는 것으로 의도된다.
위의 설명이 본 발명의 개념의 가능한 구현예를 예시하는 것으로 의도되고 제한적이지 않다. 많은 변형, 수정 및 대안이 본 개시내용의 검토 시 숙련된 기술자에게 명백해질 것이다. 예를 들어, 도시되고 설명된 컴포넌트와 동등한 컴포넌트가 따라서 치환될 수 있고, 개별적으로 설명된 구성요소 및 방법이 결합될 수 있고, 이산형으로 설명된 구성요소가 많은 컴포넌트에 걸쳐 분산될 수 있다. 따라서, 본 발명의 범위는 위의 설명을 참조하여 결정되는 것이 아니라 등가의 전체 범위와 함께 첨부된 청구범위를 참조하여 결정되어야 한다.

Claims (20)

  1. 장치로서,
    메모리 회로망으로서,
    반도체 제조 공정 또는 이에 의해 제조된 반도체 구조의 상태를 나타내는 데이터 세트로서, 상기 데이터 세트의 특징이 데이터 해상도에 의해 제한된 정도로 식별 가능한, 상기 데이터 세트; 및
    모델 훈련 과정에 의해 제한된 바와 같이 각각의 값이 할당된 매개변수를 포함하는 기계-학습 모델
    을 저장하는, 상기 메모리 회로망; 및
    상기 메모리 회로망에 통신 가능하게 결합된 프로세서 회로망으로서,
    상기 기계-학습 모델에 따라서 상기 데이터 세트로부터 출력 데이터 세트를 생성하여 상기 출력 데이터 세트의 특징이 상기 데이터 세트의 데이터 해상도보다 더 높은 출력 데이터 해상도에 의해 제한되는 정도로 식별 가능하게 하는, 상기 프로세서 회로망
    을 포함하는, 장치.
  2. 제1항에 있어서, 상기 기계-학습 모델은 상기 데이터 세트가 상기 프로세서 회로망에 의해 순차적으로 적용되는 기능 블록을 포함하고, 상기 기능 블록의 각각은 이전의 기능 블록에 비해 상기 데이터 세트의 차원수를 증가시키는, 장치.
  3. 제2항에 있어서, 상기 기계-학습 모델은 피라미드형 잔류 컨볼루션 신경망인, 장치.
  4. 제3항에 있어서, 각각의 기능 블록은 상기 데이터 세트에 기초하여 특징부 맵과 상기 매개변수 중 대응하는 매개변수를 컨볼빙하는 복수의 컨볼루션 층을 포함하는, 장치.
  5. 제4항에 있어서, 각각의 기능 블록은 활성화 함수에 따라 상기 기능 블록의 후속 층으로의 컨볼빙된 특징부 맵의 통과를 제한하는 복수의 활성화 층을 포함하는, 장치.
  6. 제5항에 있어서, 상기 활성화 함수는 정류된 선형 단위 활성화 함수인, 장치.
  7. 제1항에 있어서,
    반도체 제조 공정의 상태를 관찰하고 이에 따라 상기 데이터 세트를 생성하는 데이터 획득 기구를 더 포함하는, 장치.
  8. 제7항에 있어서, 상기 데이터 획득 기구는 상기 데이터 세트로서 전자기 스펙트럼 데이터를 생성하는 분광계인, 장치.
  9. 제7항에 있어서, 상기 프로세서 회로망은 상기 반도체 제조 공정을 상기 출력 데이터 세트에 기초하여 제어하는 공정 제어기를 구현하는, 장치.
  10. 제1항에 있어서,
    상기 메모리 회로망은 상기 데이터 해상도보다 더 큰 훈련 해상도에 의해 제한되는 정도로 식별 가능한 특징을 포함하는 훈련 데이터 세트를 저장하고; 그리고
    상기 프로세서 회로망은, 훈련 과정의 개시에 응답하여, 상기 훈련 데이터 세트로부터 상기 출력 데이터 세트를 구별하고, 상기 구별에 기초하여 목적 함수를 최소화하거나 또는 최대화하도록 상기 매개변수를 변경하는, 장치.
  11. 제10항에 있어서, 상기 프로세서 회로망은 상기 반도체 제조 공정의 상기 상태를 관찰하고 이에 따라 상기 데이터 세트를 생성하는 데이터 획득 기구의 광학적 특성에 따라 상기 훈련 데이터 세트를 생성하는 데이터 생성기를 구현하는, 장치.
  12. 제10항에 있어서, 상기 훈련 데이터 세트는 상기 반도체 제조 공정의 상기 상태를 관찰하고 이에 따라 상기 데이터 세트를 생성하는 분광계로부터 획득된 스펙트럼 데이터를 포함하는, 장치.
  13. 제12항에 있어서, 상기 분광계는 입구 슬릿 및 검출기 어레이를 포함하고, 상기 훈련 데이터는 상기 입구 슬릿과 상기 검출기 어레이 사이의 거리가 변경되는 동안 획득된 상기 스펙트럼 데이터를 포함하는, 장치.
  14. 반도체 제조를 위한 물질을 처리하기 위한 시스템으로서,
    상기 물질을 포함하는 챔버로서, 반도체 제조 처리를 모니터링하는 포트를 포함하는, 상기 챔버;
    상기 챔버의 상기 포트에 통신 가능하게 결합되고 반도체 제조 공정의 상태를 나타내는 데이터 세트를 생성하는 데이터 획득 기구로서, 상기 데이터 세트의 특징은 상기 데이터 획득 기구의 데이터 해상도에 의해 제한되는 정도로 식별 가능한, 상기 데이터 획득 기구; 및
    상기 데이터 획득 기구에 통신 가능하게 결합되고, 기계-학습 모델에 따라서 상기 데이터 세트로부터 출력 데이터 세트를 생성하여 상기 출력 데이터 세트의 특징이 상기 데이터 세트의 데이터 해상도보다 더 높은 출력 데이터 해상도에 의해 제한되는 정도로 식별 가능하게 하는 프로세서 회로망으로서, 상기 기계-학습 모델은 모델 훈련 과정에 의해 제한된 바와 같이 각각의 값이 할당된 매개변수를 포함하는, 상기 프로세서 회로망
    을 포함하는, 시스템.
  15. 제14항에 있어서, 상기 기계-학습 모델은 상기 데이터 세트가 상기 프로세서 회로망에 의해 순차적으로 적용되는 기능 블록을 포함하고, 상기 기능 블록의 각각은 이전의 기능 블록에 비해 상기 데이터 세트의 차원수를 증가시키는, 시스템.
  16. 제15항에 있어서, 상기 기계-학습 모델은 피라미드형 잔류 컨볼루션 신경망인, 시스템.
  17. 제14항에 있어서, 상기 데이터 획득 기구는 상기 챔버의 상기 포트에 광학적으로 결합된 분광계이고 상기 데이터 세트로서 스펙트럼을 생성하고, 다른 데이터 세트는 상기 분광계에 의해 생성되는 해상도보다 더 높은 해상도를 가진 고해상도 스펙트럼이고, 상기 분광계는 상기 기계-학습 모델에 의해 상기 스펙트럼을 처리하는 방식에 의해 감소되지 않는 광처리량 및 대역폭을 특징으로 하는 물리적 설계를 갖는, 시스템.
  18. 제17항에 있어서, 상기 분광계는 상기 대역폭 및 상기 광처리량을 규정하는 입구 슬릿 및 검출기 어레이를 포함하는, 시스템.
  19. 제14항에 있어서, 상기 프로세서 회로망은 상기 반도체 제조 공정을 상기 출력 데이터 세트에 기초하여 제어하는 공정 제어기를 구현하는, 시스템.
  20. 제14항에 있어서, 상기 공정 제어기는 상기 반도체 제조 공정의 상태를 결정하기 위해 고해상도 스펙트럼을 분석하고 상기 반도체 제조 공정의 상이한 상태를 강요하기 위해 상기 반도체 제조 공정을 변경하는 제어 신호를 생성하는, 시스템.
KR1020217032176A 2019-03-15 2020-03-13 기계 학습을 사용하는 반도체 제조 데이터 획득 기구의 향상된 해상도 KR20210128490A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962819115P 2019-03-15 2019-03-15
US62/819,115 2019-03-15
PCT/US2020/022746 WO2020190766A1 (en) 2019-03-15 2020-03-13 Enhanced resolution in semiconductor fabrication data acquisition instruments using machine learning

Publications (1)

Publication Number Publication Date
KR20210128490A true KR20210128490A (ko) 2021-10-26

Family

ID=72424185

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217032176A KR20210128490A (ko) 2019-03-15 2020-03-13 기계 학습을 사용하는 반도체 제조 데이터 획득 기구의 향상된 해상도

Country Status (7)

Country Link
US (1) US11763161B2 (ko)
JP (1) JP2022525197A (ko)
KR (1) KR20210128490A (ko)
CN (1) CN113574561A (ko)
SG (1) SG11202108898WA (ko)
TW (1) TW202105494A (ko)
WO (1) WO2020190766A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210061597A (ko) * 2019-11-20 2021-05-28 삼성전자주식회사 참조 데이터를 이용한 레이더 데이터 처리 장치 및 방법
US20230053776A1 (en) * 2021-08-19 2023-02-23 Mediatek Singapore Pte. Ltd. Region-of-interest (roi) guided sampling for ai super resolution transfer learning feature adaptation
JP2024047495A (ja) * 2022-09-26 2024-04-05 株式会社Screenホールディングス 学習装置、情報処理装置、基板処理装置、基板処理システム、学習方法および処理条件決定方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450205A (en) 1993-05-28 1995-09-12 Massachusetts Institute Of Technology Apparatus and method for real-time measurement of thin film layer thickness and changes thereof
US7149262B1 (en) * 2000-07-06 2006-12-12 The Trustees Of Columbia University In The City Of New York Method and apparatus for enhancing data resolution
US6885467B2 (en) * 2002-10-28 2005-04-26 Tevet Process Control Technologies Ltd. Method and apparatus for thickness decomposition of complicated layer structures
US8108328B2 (en) * 2008-07-17 2012-01-31 Tokyo Electron Limited Neural network based hermite interpolator for scatterometry parameter estimation
US9151670B1 (en) * 2013-03-15 2015-10-06 Wavefront Research, Inc. Dynamic system resolution
US9798751B2 (en) * 2013-10-16 2017-10-24 University Of Tennessee Research Foundation Method and apparatus for constructing a neuroscience-inspired artificial neural network
US9784619B2 (en) * 2015-10-13 2017-10-10 Beijing Information Science & Technology University Fiber grating demodulation system for enhancing spectral resolution of detector array
US10438825B2 (en) 2016-08-29 2019-10-08 Kla-Tencor Corporation Spectral reflectometry for in-situ process monitoring and control
US10365212B2 (en) * 2016-11-14 2019-07-30 Verity Instruments, Inc. System and method for calibration of optical signals in semiconductor process systems
KR101879207B1 (ko) 2016-11-22 2018-07-17 주식회사 루닛 약한 지도 학습 방식의 객체 인식 방법 및 장치
US10386232B2 (en) * 2017-12-15 2019-08-20 Horiba Instruments Incorporated Compact spectroscopic optical instrument
KR20200030806A (ko) * 2018-09-13 2020-03-23 삼성전자주식회사 반도체 제조 공정을 모니터링하기 위해 인공 신경망에 기초하는 이미지 변환 모델을 포함하는 비일시적 컴퓨터 판독가능 매체 그리고 반도체 웨이퍼의 이미지를 변환하는 방법
KR20200072302A (ko) * 2018-12-12 2020-06-22 삼성전자주식회사 두께 예측 네트워크 학습 방법, 반도체 소자 제조 방법 및 반도체 물질 퇴적 장비

Also Published As

Publication number Publication date
US20200292388A1 (en) 2020-09-17
CN113574561A (zh) 2021-10-29
SG11202108898WA (en) 2021-09-29
US11763161B2 (en) 2023-09-19
WO2020190766A1 (en) 2020-09-24
JP2022525197A (ja) 2022-05-11
TW202105494A (zh) 2021-02-01

Similar Documents

Publication Publication Date Title
US10062157B2 (en) Compressive sensing for metrology
JP6035772B2 (ja) 開口符号化多重画像化システムのためのフィルタ・モジュールの設計
KR20210128490A (ko) 기계 학습을 사용하는 반도체 제조 데이터 획득 기구의 향상된 해상도
KR102235581B1 (ko) 이미지 합성을 위한 컨볼루션 신경망 기반의 모드 선택 및 결함 분류
CN107851589B (zh) 在激光暗场系统中用于斑点抑制的方法及装置
CN109642875B (zh) 用于原位工艺监测和控制的光谱反射测量法
TW201833819A (zh) 用於以迴旋神經網路為基礎之缺陷檢測之資料擴增
JP2022547528A (ja) モアレ要素及び回転対称配列を用いるイメージングオーバレイターゲット
CN106463430A (zh) 用于测量半导体参数的设备、技术和目标设计
CN111164646A (zh) 用于大型偏移裸片对裸片检验的多步骤图像对准方法
CN113933286A (zh) 图案化结构中的基于拉曼光谱法的测量
TWI580924B (zh) 用以縮減一光譜光學計量裝置之有效光斑尺寸之反摺積技術
JP6758309B2 (ja) フォーカスエラー感応性が減少した光学的計測
US20230023634A1 (en) Combining physical modeling and macine learning
TW202120915A (zh) 用於在計量量測中減少錯誤之系統及方法
US11815819B2 (en) Machine and deep learning methods for spectra-based metrology and process control
CN104977084B (zh) 一种提高aotf成像空间分辨率和光谱分辨率的方法
CN113348358A (zh) 用于大量生产过程监视的宽松耦合检验及计量系统
TWI831744B (zh) 在圖案化結構中基於x射線的測量
WO2021140515A1 (en) Detecting outliers and anomalies for ocd metrology machine learning
CN114930153B (zh) 用于ocd数据解释的自我监督表征学习
US11676263B2 (en) Extreme ultraviolet (EUV) collector inspection apparatus and method
KR102267996B1 (ko) 제품 제조 중의 프로세스 변동들의 식별
TW202405371A (zh) 用於光學臨界尺寸量測的方法、用於光學臨界尺寸量測的系統以及非暫時性機器可存取儲存媒體
RU2560245C1 (ru) Способ мультиспектральной визуализации и устройство для измерения критического размера наноструктур

Legal Events

Date Code Title Description
E902 Notification of reason for refusal