KR20130071369A - 예측 모델을 생성하기 위해 샘플들을 선별하는 방법 및 이의 컴퓨터 프로그램 프로덕트 - Google Patents

예측 모델을 생성하기 위해 샘플들을 선별하는 방법 및 이의 컴퓨터 프로그램 프로덕트 Download PDF

Info

Publication number
KR20130071369A
KR20130071369A KR1020120143563A KR20120143563A KR20130071369A KR 20130071369 A KR20130071369 A KR 20130071369A KR 1020120143563 A KR1020120143563 A KR 1020120143563A KR 20120143563 A KR20120143563 A KR 20120143563A KR 20130071369 A KR20130071369 A KR 20130071369A
Authority
KR
South Korea
Prior art keywords
sample data
data sets
group
model
initial
Prior art date
Application number
KR1020120143563A
Other languages
English (en)
Other versions
KR101440304B1 (ko
Inventor
쳉 판-티엔
우 웨이-밍
Original Assignee
내셔날 쳉쿵 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 내셔날 쳉쿵 유니버시티 filed Critical 내셔날 쳉쿵 유니버시티
Publication of KR20130071369A publication Critical patent/KR20130071369A/ko
Application granted granted Critical
Publication of KR101440304B1 publication Critical patent/KR101440304B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • G03F7/70483Information management; Active and passive control; Testing; Wafer monitoring, e.g. pattern monitoring
    • G03F7/70491Information management, e.g. software; Active and passive control, e.g. details of controlling exposure processes or exposure tool monitoring processes
    • G03F7/705Modelling or simulating from physical phenomena up to complete wafer processes or whole workflow in wafer productions
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • G03F7/70483Information management; Active and passive control; Testing; Wafer monitoring, e.g. pattern monitoring
    • G03F7/70605Workpiece metrology
    • G03F7/70616Monitoring the printed patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/452Remote windowing, e.g. X-Window System, desktop virtualisation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

예측 모델을 생성하기 위해 샘플들을 선별하는 방법 및 그에 따른 컴퓨터 프로그램 프로덕트가 제공된다. 새로운 샘플 데이터 세트가 동적 이동 윈도우(DMW)에 추가되는 경우 상기 샘플 데이터 세트들을 유사한 특성을 가진 하나의 그룹으로 그룹핑하기 위해 상기 윈도우 내의 모든 샘플 데이터 세트들에 대하여 클러스터링 스텝이 수행된다.
가장 큰 그룹 내의 상기 샘플 데이터 세트들의 수가 미리 설정된 문턱값보다 크다면, 상기 가장 큰 그룹 내의 유사한 특성을 가진 샘플 데이터 세트가 너무 많다는 것을 의미하고, 상기 가장 큰 그룹 내의 가장 오래된 샘플 데이터가 삭제될 수 있다.
미리 설정된 문턱값보다 작거나 같다면, 상기 가장 큰 그룹내의 상기 샘플 데이터는 유일하고, 상기 예측 모델을 생성 또는 리프레시하기 위해 유지되어야 함을 의미한다.

Description

예측 모델을 생성하기 위해 샘플들을 선별하는 방법 및 이의 컴퓨터 프로그램 프로덕트 {Method For Screening Samples For Building Prediction Model And Computer Program Product Thereof}
본 발명은 예측 모델을 생성하기 위해 샘플들을 선별하는 방법에 관한 것으로, 더욱 상세하게는 동적 이동 윈도우(DMW, Dynamic Moving Window)를 이용함으로써 예측 모델을 생성하기 위해 샘플들을 선별하는 방법 및 이의 컴퓨터 프로덕트에 관한 것이다.
이력 샘플 데이터(historical sample data)는 종종 최초 예측 모델 세트를 생성하기 위해 사용된다. 그리고 상기 예측 모델은 실제 프로세스 환경에 적용된다.
샘플 데이터 세트가 새로 수집되었을 때, 종래 기술은 상기 예측 모델을 리프레시(refresh) 또는 리트레인(retrain)하기 위한 모델 리프레싱(model refreshing)에 상기 새로 수집된 샘플 데이터를 사용한다.
따라서, 상기 예측 모델의 예측 정확도는 온라인 모델 리프레싱 상태(phase) 동안 수집된 상기 새로운 샘플 데이터 및 이력 데이터와 밀접하게 관련된다.
가상 계측(VM, Virtual Metrology)모델을 생성하는 실시예에서, 프로세스 툴(process tool)은 장비 특성 테스트 또는 캘리브레이션(calibration)을 위해 요구되는 장비 유지 보수, 장비 드리프트(equipment drift) 또는 실험 계획(DOE, Design Of Experiments)과 같은 이벤트와 직면하게 된다.
중요한 샘플 데이터가 상기 언급한 이벤트를 위해 수집될 수 있다면, 상기 VM 모델에 포함된 상기 데이터 특성들이 더욱 완전해질 것이고, 그에 따라 가상 계측에 의해 실시간 추측 생산 능력의 정확성과 안정성이 촉진될 수 있다.
전형적으로, 종래 기술은 모델 생성을 위해 샘플 데이터를 유지하고 관리하기 위해 동적 이동 윈도우(SMW) 기술을 채용한다.
상기 SMW 기술은 고정된 전체 샘플 데이터 수를 가진 윈도우 내에서 가장 오래된 샘플 데이터를 대체하기 위해 윈도우를 새로 시작하는 샘플 데이터 세트를 사용한다.
따라서, 시간 경과와 함께, 상기 윈도우의 전단에 있는 샘플 데이터는 상기 윈도우를 순차적으로 시작하는 샘플 데이터에 의해 점차적으로 대체될 것이다. 그런 이류로 상기 언급한 이벤트에 관련된 상기 중요한 샘플 데이터가 상기 모델-생성 샘플에서 버려지게 될 것이다.
따라서, 유사한 설비 드리프트 이벤트가 다시 발생한 경우, 상기 예측 모델(VM 모델)은 그러한 설비 드리프트 이벤트를 정확하게 추측하는데 실패하게 될 것이다.
그러므로, 상기 종래 기술의 언급한 단점을 극복하기 위해 충분한 중요한 모델-생성 샘플 데이터를 획득 및 유지하고, 예측 모델을 생성하기 위해 샘플들을 선별하는 방법과 이에 따른 컴퓨터 프로그램 프로덕트를 제공할 필요가 있다.
본 발명의 목적은 충분한 중요 모델-생성 샘플 데이터를 획득 및 유지하고, 그에 따라 예측 모델의 예측 정확성을 보장할 수 있도록 예측 모델을 생성하기 위한 샘플들을 선별하는 방법 및 이에 따른 컴퓨터 프로그램 프로덕트를 제공하는 데 있다.
본 발명은 예측 모델을 생성하기 위해 샘플들을 선별(screening)하는 방법이 제공된다.
상기 방법에 있어서, 먼저, 예측될 타겟에 대하여 복수 개의 최초 샘플 데이터 세트가 순차적으로 획득된다. 여기서, 상기 최초 샘플 데이터 세트들은 복수 개의 감시 데이터(monitored data) 세트와 복수 개의 객관적 데이터(objective data)를 포함하고, 상기 객관적 데이터는 상기 감시 데이터 세트들과 일대일로 대응되고, 원인과 결과 관계(인과 관계)로 관련된다.
그 후, 높은 유사성을 가진 상기 최초 데이터 세트들을 하나의 그룹으로 그룹핑하고, 그에 따라 복수 개의 최초 그룹을 획득 및 형성하기 위해 상기 최초 데이터 세트들 전부에 대하여 클러스터링 스텝이 수행된다.
그리고 나서, 가장 많은 수의 최초 샘플 데이터 세트를 가지는 적어도 하나의 최초 그룹을 찾고, 그에 따라 적어도 하나의 두번째 그룹을 획득하기 위한 단계가 수행된다.
그리고 나서, 상기 적어도 하나의 두번째 그룹의 수가 2보다 크거나 같은지를 결정하고, 그에 따라 최초 결정 결과(determination result)를 획득하기 위한 단계가 수행된다. 상기 최초 결정 결과가 yes인 경우, 가장 오래된 최초 샘플 데이터 세트를 가지는 적어도 하나의 두번째 그룹을 찾고, 그에 따라 세번째 그룹을 획득하는 단계가 수행된다.
그리고 나서, 상기 세번째 그룹 내의 최초 데이터 세트들의 수가 미리 설정된 수(예를 들어, 3)보다 작은지 여부를 결정하고, 그에 따라 두번째 결정 결과를 획득하는 단계가 수행된다.
상기 최초 결정 결과가 no인 경우, 상기 두번째 그룹 내의 최초 데이터 세트들의 수가 상기 미리 설정된 수보다 작은지를 결정하고, 그에 따라 세번째 결정 결과를 획득하는 단계가 수행된다.
상기 두번째 결정 결과 또는 세번째 결정 결과가 yes인 경우, 상기 최초 샘플 데이터 전부는 상기 예측 모델을 생성 또는 리프레시하기 위해 보존된다. 여기서, 상기 예측 모델은 상기 타겟의 상태 또는 행태를 예측하기 위해 사용된다.
상기 두번째 결정 결과가 no인 경우, 상기 세번째 그룹내의 가장 오래된 최초 샘플 데이터는 버려지고, 나머지 최초 샘플 데이터 세트들이 상기 예측 모델을 생성하거나 리프레시하기 위해 보존된다.
상기 세번째 결정 결과가 no인 경우, 상기 두번째 그룹내의 가장 오래된 최초 샘플 데이터 세트가 버려지고, 나머지 최초 샘플 데이터 세트들이 상기 예측 모델을 생성 또는 리프레시하기 위해 보존된다.
일 실시예에서, 상기 최초 샘플 데이터 세트들은 데이터베이스에 저장된 복수 개의 이력 샘플 데이터 세트들과 새로 수집된 샘플 데이터 세트를 포함한다.
또 다른 실시예에서, 상기 최초 샘플 데이터 세트들은 이동 윈도우(moving window)를 통해 획득된다.
또 다른 실시예에서, 예측될 상기 타겟은 프로세스 툴에 의해 처리되는 제품이고, 상기 예측 모델은 가상 계측 모델(VM 모델)이다.
상기 감시 데이터 세트들은 복수 개의 이력 제품이 상기 프로세스 툴에서 처리되는 동안 발생된 복수 개의 프로세스 데이터 세트이다. 여기서, 상기 프로세스 데이터 세트 각각은 복수 개의 프로세스 파라메터를 포함한다.
상기 객관적 데이터는 상기 이력 제품을 측정하기 위해 계측 툴을 사용함으로써 획득된 복수 개의 계측 데이터(metrology data)이다. 여기서, 상기 계측 데이터는 상기 프로세스 데이터 세트들과 일대일로 대응된다.
또 다른 실시예에서, 상기 클러스터링 스텝은 ART2 알고리즘, ED 알고리즘, WED 알고리즘에 따라 수행된다.
또 다른 실시예에서, 상기 클러스터링 스텝은 상기 각 최초 샘플 데이터 세트 내의 감시 데이터 세트들의 세트들에 대하여 수행된다.
또 다른 실시예에서, 상기 클러스터링 스텝은 상기 각 최초 샘플 데이터 세트 들내의 상기 감시 데이터 세트들의 세트들과 객관적 데이터에 대하여 수행된다.
본 발명의 특징에 따르면, 비일시적인 유형의 컴퓨터 판독가능한 기록 매체에 저장된 컴퓨터 프로그램 프로덕트가 제공된다. 상기 컴퓨터 프로그램 프로덕트가 컴퓨터에 로딩되고 실행되면, 예측 모델을 생성하기 위해 샘플들을 선별하는 앞서 설명한 방법이 수행된다.
따라서, 본 발명의 실시예의 응용과 함께, 충분히 중요한 모델-생성 샘플 데이터가 획득 및 유지될 수 있으며, 이에 따라 상기 예측 모델의 예측 정확도가 보장될 수 있다.
본 발명에 따른 예측 모델을 생성하기 위해 샘플들을 선별하는 방법 및 이의 컴퓨터 프로그램 프로덕트는 선별 과정을 통해 충분히 중요한 모델-생성 샘플 데이터가 버려지지 않고, 획득 및 유지될 수 있으며, 이에 따라 상기 예측 모델의 예측 정확도를 보장할 수 있는 탁월한 효과가 발생한다.
도 1은 본 발명의 실시예에 따른 예측 모델을 생성하기 위한 샘플들을 선별하는 방법을 보여주는 플로우 차트이다.
도 2는 실시예에서 보여주는 글라스 기판(예측될 타겟)상의 측정 위치를 도시하기 위한 모식도(schematic diagram)이다.
도 3a는 제 1 실시예에 따라 상기 유리 기판상의 위치 2에서 예측 및 실제 측정값과 대응 GSI(Global Similarity Index)값을 도시한 것이다.
도 3b는 제 1 실시예에 따라 상기 유리 기판상의 위치 8에서 예측 및 실제 측정값과 대응 GSI(Global Similarity Index)값을 도시한 것이다.
도 4a 내지 4c는 종래의 SMW, 본 발명에 따른 DMW-ART2와 DMW-WED가 샘플들을 선별하기 위해 각각 사용되고, 실시예 1에 따른 메인 프로세스 파라메터에 관한 선별된 샘플들의 개별 결과이다.
도 5a는 제 2 실시예에 따라 상기 유리 기판상의 위치 2에서 예측 및 실제 측정값과 대응 GSI(Global Similarity Index)값을 도시한 것이다.
도 5b는 제 2 실시예에 따라 상기 유리 기판상의 위치 8에서 예측 및 실제 측정값과 대응 GSI(Global Similarity Index)값을 도시한 것이다.
도 6a 내지 6c는 종래의 SMW, 본 발명에 따른 DMW-ART2와 DMW-WED가 샘플들을 선별하기 위해 각각 사용되고, 실시예 2에 따른 메인 프로세스 파라메터에 관한 선별된 샘플들의 개별 결과이다.
이하, 본 발명의 구체적인 실시예에 대하여 도면을 참조하여 설명하기로 한다.
동일 또는 유사한 부분을 나타내기 위해 동일한 참조 번호가 상기 도면과 설명에서 사용된다.
본 발명은 예측될 타겟의 상태(status)나 행태(behavior)를 예측하기 위해 사용된 예측 모델을 생성(build) 또는 리프레시(refresh)하기 위해 샘플들을 선별하는 방법에 관한 것이다.
본 발명은 VM모델, 수량 추정 모델, 예방 보전 모델, 생산량 예측 모델 등의 하이테크 산업에서; 암 증식 속도의 예측 모델과 같은 헬스 케어 산업의 3D 이미지 기술에서; 태풍의 이동경로의 예측 모델, 폭우 예측 모델, 이류(mud flow) 경보의 예측 모델과 같은 일기 예보 산업에서 예측 모델에 적용될 수 있다.
본 발명은 샘플들을 유지 및 관리하기 위해 주로 동적 이동 윈도우(Dynamic Moving Window, DMW)를 제공한다.
새로운 샘플 데이터 세트가 상기 DMW에 추가되었을 때, 유사한 특성을 가진 샘플들이 같은 그룹으로 분류되도록, 상기 윈도우 내에 존재하는 모든 샘플들을 그루핑하기 위해 클러스터링 기술이 사용된다.
그리고 나서, 각 그룹의 수가 조사된다. 가장 큰 그룹의 수가 미리 설정된 문턱값보다 크다면, 가장 큰 그룹은 유사한 특성을 가진 많은 샘플 데이터 세트를 가지고 있다는 것을 의미한다. 따라서, 가장 큰 그룹에서 샘플 데이터 중 가장 오래된 세트가 버려질 수 있다.
가장 큰 그룹의 수가 미리 설정된 문턱값 보다 작거나 같다면, 가장 큰 그룹내의 데이터 세트들은 유일한 것이고, 예측되어야 할 타겟의 특별한 행태를 예측하기 위한 예측 모델을 생성 또는 리프레시하기 위해 보유되어야만 한다.
다시 말해, 본 발명은 상기 타겟의 변화에 관련된 중요한 정보(샘플)를 실시간으로 흡수할 수 있고, 상기 중요한 정보는 시간 인자에 기인하여 버려지지 않을 것이고, 또한 상기 예측 모델은 과거에 발생했던 상기 타겟 변화에 직면할 경우 생산 퀄리티를 정확하게 예측할 수 있다.
도 1은 본 발명의 바람직한 실시예에 따른 예측 모델을 생성하기 위한 샘플들을 선별하는 방법을 보여주는 플로우 차트이다.
도 1을 참조하면, 먼저, 복수 개의 최초 샘플 데이터 세트를 획득하기 위한단계 102가 수행된다.
이 시점에서, 상기 최초 샘플 데이터 세트들은 예측되어야 할 타겟에 관하여 순차적으로 발생된 복수 개의 이력 샘플 데이터 세트이고, 예를 들어, 데이터베이스에 저장될 수 있다.
상기 각 최초 샘플 데이터 세트들은 복수 개의 감시 데이터(monitored data)세트와 복수 개의 객관적 데이터(objective data)를 포함한다. 여기서, 상기 객관적 데이터는 일대일 대응으로 상기 감시 데이터 세트들과 대응되고, 원인과 결과 관계(인과관계)로 관련된다.
예를 들어, 상기 예측될 타겟이 프로세스 툴에 의해 처리되는 제조 공정에 있는 제품(반도체 공장에서 웨이퍼 또는 TFT-LCD 공장에서 유리 기판과 같은)이고, 예측 모델이 VM(Virtual Metrology) 모델이라고 가정한다.
상기 감시 데이터 세트들은 복수 개의 이력 제품들이 상기 프로세스 툴에서 처리되는 동안 발생된 복수 개의 프로세스 데이터 세트이고, 각 프로세스 데이터 세트는 복수 개의 프로세스 파라메터를 포함한다.
상기 객관적 데이터는 상기 이력 제품(historical workpieces)을 제조하기 위해 계측 툴(metrology data)을 사용함으로써 획득된 복수 개의 계측 데이터(metrology data)이다. 여기서, 상기 계측 데이터는 일대일 대응으로 상기 프로세스 데이터 세트와 대응된다.
그 후, 예측될 상기 타겟에 관한 새로운 샘플 데이터 세트를 수집하는 단계 110가 수행된다. 여기서, 상기 새로운 샘플 데이터 세트는 상기 이력 샘플 데이터 후에 상기 이력 제품이 발생된 후 제조되는 제품에 관련된다.
이 후, 상기 수집된 새로운 샘플 데이터 세트를 최초 샘플 데이터(이력 샘플 데이터)에 추가하는 단계 120이 수행되고, 따라서 최초 샘플 데이터 세트들은 이제 상기 이력 샘플 데이터 세트와 새로운 샘플 데이터 세트를 포함한다.
본 발명에 따른 실시예는 단계 110과 120를 생략하고, 직접 상기 이력 데이터를 처리할 수 있다.
이 후, 상기 모든 최초 샘플 데이터 세트들에 대하여 높은 유사성을 가진 최초 샘플 데이터 세트들을 하나의 그룹으로 그룹핑하고, 이에 따라, 복수 개의 최초 그룹을 형성 및 획득하기 위해 상기 최초 샘플 데이터 세트들 전체에 대하여 수행되는 클러스터링 스텝130이 수행된다.
본 발명의 실시예에서, 상기 클러스터링 단계는 상기 최초 샘플 데이터 세트들 내의 감시 데이터 세트들의 세트들에 대해서만 수행될 수 있다.
그러나, 다른 감시 데이터(프로세스 데이터와 같은)는 같은 객관적 데이터(계측 데이터와 같은)를 도출할 수 있기 때문에, 상기 클러스터링 단계는 상기 최초 샘플 데이터 세트들 내의 상기 객관적 데이터와 상기 감시 데이터 세트들의 세트들에 대하여 수행하는 것이 바람직하다.
본 발명의 실시예의 상기 클러스터링 단계는 ART2(adaptive theory 2)알고리즘, ED(Euclidean Distance)알고리즘, 또는 WED(Weighted Euclidean Distance)알고리즘과 같은 특정 클러스터링 알고리즘을 사용할 수 있다. 여기서, 상기 WED 알고리즘은 본 실시예의 특징 중에 하나이고, 추후에 상세하게 기술될 것이다.
그리고 여기서 다시 설명되지 않지만, 본 발명의 기술분야에서 통상의 지식을 가진 자에게 자명한 다른 클러스터링 알고리즘들이 적용될 수 있다.
그 후, 가장 많은 최초 샘플 데이터 세트들을 가지는 적어도 하나의 최초 그룹을 찾고, 그에 따라 적어도 하나의 두번째 그룹을 획득하기 위해 단계 140이 수행된다.
이어서, 상기 적어도 하나의 두번째 그룹의 수가 2보다 크거나 같은지를 결정하는 단계 150이 수행된다.
상기 단계 150의 결과가 yes라면, 적어도 2개 이상 두번째 그룹(가장 많은 최초 샘플 데이터 세트들을 가지는)이 존재함을 의미하고, 그 후, 두번째 그룹 중 가장 오래된 최초 샘플 데이터 세트를 가지는 적어도 하나의 그룹을 찾고, 그에 따라 세번째 그룹을 획득하기 위한 단계 160가 수행된다.
이어서, 상기 세번째 그룹 내의 최초 샘플 데이터 세트들의 수가 미리 설정된 수(예를 들어, 3)보다 작은지 여부를 결정하고, 그에 따라 두번째 결정 결과를 회득하기 위한 단계 170이 수행된다.
상기 단계 150의 결과가 no라면, 단계 170이 직접적으로 수행된다.
상기 단계 170의 결과가 yes라면, 가장 많은 최초 샘플 데이터 세트들을 가지는 상기 최초 그룹 내에 존재하는 샘플의 수가 너무 작다는 것을 의미하고, 따라서, 상기 그룹 내의 상기 최초 샘플 데이터 모두는 유일한 것이기 때문에, 상기 예측 모델을 생성 또는 리프레시하기 위해 단계 130에 사용된 최초 샘플 데이터 세트들 모두를 저장하기 위해 단계 180이 수행된다.
여기서, 상기 예측 모델은 상기 타겟의 상태(status) 또는 행태(behavior)를 예측하기 위해 사용된다.
상기 단계 170의 결과가 no라면, 가장 많은 최초 샘플 데이터 세트들을 가지는 상기 최초 그룹 내에 존재하는 샘플이 상당히 많다는 것을 의미하고, 따라서, 상기 그룹 내에 가장 오래된 최초 샘플 데이터 세트를 버리고, 상기 예측 모델을 생성 또는 리프레시하기 위해 잔존하는 최초 샘플 데이터 세트들을 보유하고, 그에 따라 모델 생성 또는 모델 리프레시하는 시간을 절약하기 위한 단계 190이 수행된다.
이하, WED 알고리즘과 VM 모델을 사용한 실시예가 상기 클러스터링 단계를 설명하기 위해 사용된다. 여기서, 최초 샘플 데이터 세트 각각은 프로세스 데이터세트와 상기 프로세스 데이터 세트에 대응하는 측정 데이터(measurement datum)를 포함하고, 각 프로세스 데이터 세트는 복수 개의 프로세스 파라메터를 포함한다.
상기 단계 130에서, 최초, j번째 프로세스 파라메터 Xj,, j=1, 2,..., p, 와 대응 실제 측정 값(실제 계측) y사이의 가중상관계수(weighted correlation coefficient) Wj는 하기의 <수학식 1>에 의해 산출된다.
Figure pat00001
여기서,
Figure pat00002
는 j번째 프로세스 파라메터 Xj와 실제 측정값 y 사이의 상관계수이고, 상기 Xj는 n 모델링 샘플을 포함하는 개별 파라메터의 j세트
Figure pat00003
이고, 상기 y는 n 모델링 샘플의 실제 측정값의 대응 세트
Figure pat00004
이다.
결과로써, 상기 가중 상관 계수 매트릭스(W)는 하기의 <수학식 2>로 표현될 수 있다.
Figure pat00005
여기서, xi ,j는 프로세스 데이터의 j번째 세트에서 i번째 프로세스 파라메터, yi는 i번째 실제 측정 값이고, i는 i=1,2, ..., n에서 i번째 샘플을 나타내고, j는 j=1,2, ..., p에서 j번째 파라메터를 나타낸다.
그리고 나서, 가중치 유클리드 거리(WEDi, i=1,2, ..., n)는 각 데이터 세트를 위해 산출된다.
상기 WEDi가 생성되기 전, 상기 프로세스 데이터(감시 데이터)는 표준화되어야 한다. 상기 프로세스 데이터를 표준화하기 위한 식은 하기의 수학식 3 내지 5와 같다.
Figure pat00006
Figure pat00007
Figure pat00008
여기서,
Figure pat00009
는 프로세스 데이터의 i번째 세트에서 표준화된 j번째 프로세스 파라메터이고,
Figure pat00010
는 j번째 프로세스 파라메터의 평균치(mean)이고,
Figure pat00011
는 j번째 프로세스 파라메터의 표준편차이다.
Figure pat00012
는 표준화된 j번째 데이터 세트의 벡터라고 하면, 상기 프로세스 파라메터의 모델 세트는
Figure pat00013
로 정의되고, xM ,j
Figure pat00014
와 같고, 표준화(또한 표준화된 모델 파라메터 ZM ,j로 표시되는)후 상기 모델에서 각 엘리먼트는 0의 값을 가진다.
다시 말해,
Figure pat00015
내의 모든 엘리먼트는 0이다.
다음으로, 상기 WEDi는 하기의 <수학식 6>으로 표현된다.
Figure pat00016
여기서, I는 항등 행렬(identity matrix)이다.
ZM내의 모든 엘리먼트가 0이기 때문에, 상기 WEDi는 하기의 <수학식 8>과 같이 단순화될 수 있다.
Figure pat00017
상기 모든 WEDi가 획득된 후, 먼저 히스토그램(histogram)으로써 기록된다. 그리고 나서, 클러스터들의 바람직한 수(C)를 산출하도록 스터지의 규칙(sturge's rule)이 적용된다.
상기 스터지의 규칙은 하기의 <수학식 8>과 같다.
<수학식 8>
그룹 수(Group Number) = 1 + log2(n)
여기서, n은 모델링을 위한 샘플들의 수이다.
<수학식 8>에서 그룹 수의 가장 가까운 정수가 C값으로 적용된다.
결국, 상기 WEDi(i=1,2,...,n)은 하기의 <수학식 9>에 의한 클러스터 너비를 가진 C클러스터들로 균등하게 분할된다.
<수학식 9>
클러스터의 너비(Width of a cluster) = [max(WEDi) - min(WEDi)] / C
여기서, 상기 max(WEDi)는 최대 WEDi를 나타내고, 상기 min(WEDi)는 최소 WEDi를 나타낸다.
이하, 본 발명에 따른 상기 DMW의 장점을 설명하기 위해 2개의 실시예가 사용된다. 여기서, 실험 데이터 전체는 5세대 TFT-LCD 공장에서 실질적으로 운용되는 포토 툴로부터 수집된다.
도 2는 본 실시예에서 보여지는 유리 기판(예측될 타겟) 상의 측정 위치를 도시한 모식도이다.
도 2를 참조하면, 측정 위치 1 내지 8은 2개의 실시예에서 측정된다.
상기 포토 툴의 물리적 특성에 따라, 21개 키 프로세스 파라메터가 VM 모델(예측 모델)의 입력으로써 각각 선택된다.
상기 프로세스 데이터는 시간 간격의 윈도우 평균을 취함으로써 시간-연속-추적 데이터(time-series-trace data)로부터 추출된다.
2개의 실시예에 사용된 GSI(Global Similarity Index)는 "프로덕트 제조에서 가상 계측 시스템의 신뢰 수준을 평가하기 위한 방법"라는 명칭의 미국 특허 제US7,593,912호가 참조될 수 있다.
상기 GSI는 상기 윈도우를 새로 시작하는 특정 샘플 데이터 세트와 모든 프로세스 데이터(이력 샘플 데이터)사이의 유사성을 평가하기 위해 사용된다.
상기 GSI가 작게 산출된다면, 상기 새로 시작하는 샘플 데이터는 모델-생성을 위한 상기 샘플 데이터와 유사하다는 것을 의미한다.
반대로, 상기 GSI가 크게 산출된다면, 상기 새로 시작하는 샘플 데이터는 모델-생성을 위한 상기 샘플 데이터와 다르다는 것을 의미한다.
본 발명의 2개의 실시예에서 사용된 상기 GSI와 VM 모델은 "듀얼-상태 가상 계측 방법"이라는 명칭의 미국 특허 제US7,603,328호와 "자동 가상 계측 시스템 및 방법"이라는 명칭의 미국 특허 제US8,095,484호가 참조될 수 있다.
미국특허 US7,593,912호, US7,603,328호, US8,095,484호는 모두 본 출원인과 같은 출원인임을 알려둔다.
상기 VM 모델의 추측 정확도는 MAPE(Mean Absolute Percentage Error)에 의해 정량화된다.
그 공식은 하기의 <수학식 10>과 같이 표현된다.
Figure pat00018
여기서,
Figure pat00019
는 VM 추측 값이고, yi는 실제 측정 값이고, y는 타겟 값이고, q는 추측 샘플 사이즈이다.
MAPE 값이 0에 가까워질수록, 상기 모델의 추측 정확도가 좋아진다.
실시예 1
도 3a는 실시예 1에 따라 상기 유리 기판상의 위치 2에서 예측 및 실제 측정값과 대응 GSI(Global Similarity Index)값을 도시한 것이고, 도 3b는 실시예 1에 따라 상기 유리 기판상의 위치 8에서 예측 및 실제 측정값과 대응 GSI(Global Similarity Index)값을 도시한 것이다.
SMW는 상기 VM 모델을 생성하기 위한 샘플들을 선별하기 위한 종래의 정적 이동 윈도우(Static Moving Window)를 나타내고, DMW-ART2는 상기 VM 모델을 생성하기 위한 샘플들을 선별하기 위해 ART2 알고리즘에 기반한 본 발명의 동적 이동 윈도우(DMW)를 나타내고, DMW-WED는 상기 VM 모델을 생성하기 위한 샘플들을 선별하기 위해 WED 알고리즘에 기반한 본 발명의 본 발명의 동적 이동 윈도우(DMW)를 나타낸다.
도 4a 내지 도 4c는 각각 종래의 SMW, 본 발명에 따른 DMW-ART2 및 DMW-WED가 각각 샘플들을 선별하기 위해 사용된 실시예 1에 따라 메인 프로세스 파라메터(ActProcess Time)에 관한 스크린된 샘플들의 개별 결과이다.
실시예 1의 목적은 영구적으로 상기 모델에서 유지되어야 하는 골든 샘플(golden sample)을 유지하는 DMW의 능력을 증명하기 위한 것이다.
우선, 12개 실험 세트(샘플 #1 내지 #12)가 적용된다. 상기 12 세트 중, 특히 샘플 #3 내지 #9는 상기 포토 툴 상의 메인 파라메터(ActProcess Time)의 조절과 함께 임계차원(CD, Critical Dimension) 스프레드 테스트(spread test)를 수행하기 위해 선택된다.
상기 7개의 스프레드 테스트 샘플은 소위 골든 샘플이라 불린다.
그리고 나서, 63개 추가 이력 샘플이 수집된다.
결과로서, 전부에 12개 실험 세트와 후부에 63개 이력 샘플을 포함하는 75개 샘플 데이터 세트가 VM 추측 모델(예측 모델)을 설정하기 위해 모델링 세트로 채택된다.
다음의 19개 샘플 데이터 세트는 상기 VM 모델을 조정(tune)/리트레인(retrain)[refresh]하기 위해 이용된다. 그 후, 상기 12개 실험 세트(상기 골든 샘플을 포함하는)의 프로세스 데이터가 자유-구동(free running) 모드 VM 추측 테스트를 위해 샘플로써 다시 사용된다. 반면 상기 12개 실험 세트의 대응 실제 측정값(CD에 대한)은 SMW, DMW-ART2 및 DMW-WED 각각을 사용함으로써 VM 추측 정확도를 평가하기 위해 채택된다.
표 1은 MR(Multi-Regression)알고리즘과 NN(Neural Network)알고리즘이 각각 적용되는 SMW, DMW-ART2 및 DMW-WED 기술을 각각 사용함으로써 도 2에서 보여지는 모든 측정 위치(1 내지 8)에 대한 VM 추측 결과를 표현한다.
8개의 위치 중, 다양한 기술에 대한 위치 2와 위치 8의 추측 결과는 도 3a와 도 3b에 도시된다.
Figure pat00020
도 3a 및 도 3b에서 보여지는 바와 같이, 샘플 #97 내지 #103에서 상기 SMW 기술의 GSI 값은 GSI 문턱값보다 훨씬 크다. 반면, 샘플 #97 내지 #103에서 ART2 기반 DMW 기술과 WED 기반 DMW 기술의 GSI 값은 모두 GSI 문턱값보다 낮다.
사실상, 샘플 #97 내지 #103은 이미 언급한 골든 샘플(샘플 #3 내지 #9)이다.
이런 현상은 상기 골든 샘플이 상기 SMW 기술에 의해 삭제되지만, ART2 기반 DMW 기술과 WED 기반 DMW 기술 모두에 의해서는 유지된다는 것을 가리킨다.
표 1에서 보여지는 바와 같이, 골든 샘플이 상기 SMW 기술에서 버려지지만, RT2 기반 DMW 기술과 WED 기반 DMW 기술에서 모두 유지된다는 사실 때문에, 상기 SMW 기술의 MAPE와 최대 에러는 DMW 기술의 것들보다 상당히 크다.
더우기, 도 4a 내지 도 4c에서 보여지는 바와 같이. 19개 샘플을 이용함으로써 VM 모델을 리프레싱한 후, 상기 SMW 기술에 의해 상기 골든 샘플 전부가 버려 지지만, 골든 샘플 #4 내지 #9는 상기 ART2 기반 DMWDP 의해 여전히 유지되고, 모든 골든 샘플 #3 내지 #9는 상기 WED 기반 DMW 기술에 의해 여전히 유지된다.
실시예 2
도 5a는 제 2 실시예에 따라 상기 유리 기판상의 위치 2에서 예측 및 실제 측정값과 대응 GSI(Global Similarity Index)값을 도시한 것이고, 도 5b는 제 2 실시예에 따라 상기 유리 기판상의 위치 8에서 예측 및 실제 측정값과 대응 GSI(Global Similarity Index)값을 도시한 것이다.
또한, 도 6a 내지 도 6c는 각각 종래의 SMW, 본 발명에 따른 DMW-ART2 및 DMW-WED가 각각 샘플들을 선별하기 위해 사용된 실시예 2에 따라 메인 프로세스 파라메터(램프 조명)에 관한 선별된 샘플들의 개별 결과이다.
실시예 2의 목적은 듀얼-페이즈(dual-phase) VM 모델(미국 특허 제US7,603,328호에서 공지된)을 적용함으로써 통상적인 구동 케이스에 대한 SMW, DMW-ART2 및 DMW-WED 기술의 성능을 평가하기 위한 것이다.
본 실시예에서, 75개 이력 샘플이 수집되고, 상기 듀얼-페이즈 VM 모델을 설정하기 위해 모델링 세트로써 채택된다.
다음의 56개 샘플 데이터 세트가 상기 듀얼-페이즈 VM 모델을 테스트하고, 조정(tune)/리트레인(retrain)[refresh]하기 위해 사용된다.
상기 56개 샘플의 대응 실제 측정 값(CD에 대한)이 상기 VM 모델의 추측 정확도를 평가하기 위해 사용된다.
표 2는 모든 측정 위치(1 내지 8)에 대한 다양한 기술의 VM 추측 정확도를 나타낸다.
8개의 위치 중, 다양한 기술에 대한 위치 2와 6의 추측 결과는 도 5a와 도 5b에 도시된다. 더우기, 모든 131 샘플들에 대한 실시예 2의 프로세스 데이터(램프 조명)가 도 6a 및 도 6b에 도시된다.
표 2에서 보여지는 바와 같이, 상기 SMW 기술의 평균치 MAPE와 최대 에러는 상기 ART2 기반 DMW 기술과 WED 기반 DMW의 각각의 값보다 나쁘다. 상기 ART2 기반 DMW와 WED 기반 DMW의 정확도를 비교하면, 상기 WED 기반 DMW가 조금 우수하다.
도 5a 및 도 5b에서 보여지는 바와 같이, 샘플 #126에서 SMW 기술의 GSI 값은 GSI 문턱값(9)보다 훨씬 큰 반면, 샘플 #126에서 상기 ART2 기반 DMW 기술과 WED 기반 DMW 기술의 GSI 값은 GSI 문턱값(9)보다 낮다.
더 나아가, 상기 ART2 기반 DMW의 GSI 값은 샘플 #126에서 상기 WED 기반 DMW의 GSI값보다 조금 크다.
결과적으로, 샘플 #126에서 상기 SMW의 예측 에러가 샘플 #126에서 상기 ART2 기반 DMW 기술과 WED 기반 DMW 기술의 예측 에러보다 크다. 더 나아가, 샘플 #126에서 상기 ART2 기반 DMW의 예측 에러는 상기 WED 기반 DMW의 예측 에러보다 조금 크다.
도 6a 및 도 6b에서 보여지는 바와 같이, 샘플 #126에서 램프 조명의 값은 상기 SMW 기술의 모델링 샘플들의 값과 상당히 다른 반면, 상기 ART2 기반 DMW 기술의 모델링 세트에서 유지된 샘플 #35 및 #36과 상대적으로 유사하고, 상기 WED 기반 DMW 기술의 모델링 세트에서 유지된 샘플 #30과 상당히 유사하다.
결론적으로, 도 6a 내지 6c에서 도시된 현상은 표 2 와 도 5a 및 도 5b에서 보여지는 결과를 뒷받침한다.
Figure pat00021
75개 샘플(예를 들어, 75개 샘플 데이터 세트)인 초기 모델-생성 윈도우 사이즈와 함께, 실시예 1 및 2에서 상기 ART2 기반 DMW 기술과 WED 기반 DMW 기술의 그룹의 수는 각각 40개와 7개이다.
상기 그룹의 수는 모델-생성 윈도우 사이즈(75개)에 근접해서는 안되고, 그렇지 않다면, 각 그룹 내의 엘리먼트들의 수가 상대적으로 작을 것이다.
ART2에 의해 소팅된 동일한 그룹내의 모든 엘리먼트들은 같은 특성을 가진다.
각 그룹의 특성을 지탱하기 위해, 엘리먼트들의 최소수는 3이다.
따라서, 도 1의 단계 170에서 미리 결정된 수는 3이고, 예를 들어, 하나의 그룹 내의 샘플들의 수가 3보다 크거나 같다면, 이 그룹에 있는 가장 오래된 샘플은 이 그룹의 특성에 영향을 미치지 않고 버려질 수 있다.
하나의 그룹 내의 샘플들의 수가 3보다 작거나 같다면, 이 그룹에 있는 모든샘플들은 보존되어야 하고, 그렇지 않으면 이 그룹의 특성은 지탱될 수 없다.
예측 모델을 생성하기 위해 샘플을 선별하기 위해 이전의 실시예에서 보여준 방법은 컴퓨터 구현 방법일 수 있고, 본 발명의 실시예를 기초로 프로세스를 수행하기 위한 컴퓨터(또는 다른 전자 장치들)를 프로그램하기 위해 명령어가 저장된 기계-판독가능한 매체를 포함하는 컴퓨터 프로그램 프로덕트로써 제공될 수 있다.
상기 기계-판독가능한 매체는 이에 한정되는 것이 아니지만, 플로피 디스켓, 광디스크, CD-ROM, 자기-광디스크, ROM, RAM, EPROM, EEPROM, 자기 또는 광 카드, 플래시 메모리, 또는 전자 명령어를 저장하기 적합한 다른 형태의 미디어/ 기계-판독가능한 매체일 수 있다.
더 나아가, 본 발명의 실시예 들은 또한 통신 링크(네트워크 접속 또는 이와 유사한 것과 같은)를 통해 데이터 신호를 사용함으로써 원격지 컴퓨터로부터 요청하는 컴퓨터로 전송될 수 있는 컴퓨터 프로그램 프로덕트로 다운로드될 수 있다.
본 발명의 실시예의 응용으로 페어링되고, 페어링되지 않은 WIP 데이터를 동시에 처리하기 위한 WIP 출력 타이밍과 정량의 예측 기술이 효과적으로 생성될 수 있고, 따라서 모든 타입의 WIP 데이터에 대한 예측 방법을 범용적으로 사용하는 목적을 달성할 수 있다는 것을 상기의 기재로부터 알 수 있다.
본 발명의 범위 또는 정신으로부터 벗어나지 않는다면 다양한 실시예와 변형이 본 발명의 구조로 생성될 수 있음은 본 발명의 통상의 지식을 가진 당업자에게 자명한 것이다.
이런 관점에서, 본 발명은 하기의 청구범위와 균등물의 범위내에 있는 본 발명의 변형 및 치환은 본 발명의 보호 범위에 포함된다.

Claims (7)

  1. 예측 모델을 생성하기 위한 샘플들을 선별하는 방법으로서;
    예측될 타겟에 관하여 순차적으로 발생된 복수 개의 최초 샘플 데이터 세트를 획득하는 단계와;
    여기서, 상기 최초 샘플 데이터 세트들은
    복수 개의 감시 데이터 세트와;
    일대일 대응으로 상기 감시 데이터 세트와 대응되고, 상기 감시 데이터와 인과 관계를 가지는 복수 개의 객관적 데이터를 포함하고;
    높은 유사성을 가진 최초 샘플 데이터 세트들을 하나의 그룹으로 그룹핑하기 위해 상기 최초 샘플 데이터 세트들 전체에 대하여 클러스터링 스텝을 수행하는 단계와;
    가장 많은 최초 샘플 데이터 세트들을 가지는 적어도 하나의 최초 그룹을 찾고, 그에 따라 적어도 하나의 두번째 그룹을 획득하는 단계와;
    상기 적어도 하나의 두번째 그룹의 수가 2보다 크거나 같은지 여부를 결정하고, 그에 따라 최초 결정 결과(determination result)를 획득하는 단계와;
    상기 최초 결정 결과가 yes인 경우 가장 오래된 최초 샘플 데이터 세트를 가지는 상기 적어도 하나의 두번째 그룹을 찾고, 그에 따라 세번째 그룹을 획득하고, 상기 세번째 그룹 내의 최초 데이터 세트의 수가 미리 설정된 수보다 작은지 여부를 결정하고, 그에 따라 두번째 결정 결과를 획득하는 단계와;
    상기 최초 결정 결과가 no인 경우 상기 두번째 그룹 내의 최초 데이터 세트의 수가 미리 설정된 수보다 작은지 여부를 결정하고, 그에 따라 세번째 결정 결과를 획득하는 단계와;
    상기 두번째 결정 결과 또는 세번째 결정 결과가 yes인 경우 상기 예측 모델을 생성 또는 리프레시하기 위해 상기 모든 최초 샘플 데이터 세트들을 보유하는 단계와;
    여기서, 상기 예측 모델은 상기 타겟의 상태 또는 행태를 예측하기 위해 사용되고;
    두번째 결정 결과가 no인 경우 상기 세번째 그룹내의 가장 오래된 최초 샘플 데이터 세트를 버리고, 상기 예측 모델을 생성 또는 리프레시하기 위해 나머지 최초 샘플 데이터 세트들을 보유하는 단계와;
    상기 세번째 결정 결과가 no인 경우 상기 두번째 그룹내의 가장 오래된 최초 샘플 데이터 세트를 버리고, 상기 예측 모델을 생성 또는 리프레시하기 위해 나머지 최초 샘플 데이터 세트들을 보유하는 단계를 포함하는 것을 특징으로 하는 예측 모델을 생성하기 위해 샘플들을 선별하는 방법.
  2. 제 1항에 있어서,
    상기 최초 샘플 데이터 세트들은
    데이터베이스에 저장된 복수 개의 이력 샘플 데이터 세트와;
    새로 수집된 샘플 데이터 세트를 포함하는 것을 특징으로 하는 예측 모델을 생성하기 위해 샘플들을 선별하는 방법.
  3. 제 1항에 있어서,
    상기 최초 샘플 데이터 세트들은
    이동 윈도우(moving window)를 통해 획득되는 것을 특징으로 하는 예측 모델을 생성하기 위해 샘플들을 선별하는 방법.
  4. 제 1항에 있어서,
    상기 예측될 타켓은 프로세스 툴에 의해 처리된 제품이고;
    상기 예측 모델은 가상 계측 모델(VM 모델)이고;
    상기 감시 데이터 세트들은 복수 개의 이력 제품들이 상기 프로세스 툴내에서 처리되는 동안 발생된 복수 개의 프로세스 데이터 세트이고;
    상기 프로세스 데이터 세트 각각은 복수 개의 프로세스 파라메터를 포함하고;
    상기 객관적 데이터는 상기 이력 제품들을 측정하기 위해 계측 툴을 사용함으로써 획득된 복수 개의 계측 데이터이고,
    상기 계측 데이터는 일대일 대응으로 상기 프로세스 데이터 세트와 대응되는 것을 특징으로 하는 예측 모델을 생성하기 위해 샘플들을 선별하는 방법.
  5. 제 1항에 있어서,
    상기 클러스터링 스텝은
    ART2 알고리즘, ED(Euclidean distance)알고리즘, WED(Weighted Euclidean Distance)알고리즘 중 선택된 하나에 따라 수행되는 것을 특징으로 하는 예측 모델을 생성하기 위해 샘플들을 선별하는 방법.
  6. 제 1항에 있어서,
    상기 클러스터링 스텝은
    상기 최초 샘플 데이터 세트들 내의 상기 감시 데이터 세트들에 대하여 또는 상기 감시 데이터 세트들의 세트들과 최초 샘플 데이터 세트들내의 객관적 데이터에 대하여 수행되는 것을 특징으로 하는 예측 모델을 생성하기 위해 샘플들을 선별하는 방법.
  7. 실행된 경우 예측 모델을 생성하기 위한 샘플들을 선별하는 상기 청구항 제1항 내지 제6항 중 선택된 어느 하나의 청구항에 기재된 방법을 수행하는 비-일시적인 유형의 컴퓨터 판독가능한 저장 매체에 기록된 컴퓨터 프로그램 프로덕트.
KR1020120143563A 2011-12-20 2012-12-11 예측 모델을 생성하기 위해 샘플들을 선별하는 방법 및 이의 컴퓨터 프로그램 프로덕트 KR101440304B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW100147447 2011-12-20
TW100147447A TWI451336B (zh) 2011-12-20 2011-12-20 預測模型之建模樣本的篩選方法及其電腦程式產品

Publications (2)

Publication Number Publication Date
KR20130071369A true KR20130071369A (ko) 2013-06-28
KR101440304B1 KR101440304B1 (ko) 2014-09-15

Family

ID=48611206

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120143563A KR101440304B1 (ko) 2011-12-20 2012-12-11 예측 모델을 생성하기 위해 샘플들을 선별하는 방법 및 이의 컴퓨터 프로그램 프로덕트

Country Status (5)

Country Link
US (1) US8862525B2 (ko)
JP (1) JP5515125B2 (ko)
KR (1) KR101440304B1 (ko)
CN (1) CN103177180B (ko)
TW (1) TWI451336B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190108559A (ko) * 2016-10-21 2019-09-24 데이터로봇, 인크. 예측 데이터 분석을 위한 시스템 및 관련 방법 및 장치

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI463334B (zh) * 2012-07-20 2014-12-01 Univ Nat Cheng Kung 標的裝置的基底預測保養方法與其電腦程式產品
TWI549007B (zh) * 2013-02-07 2016-09-11 先知科技股份有限公司 製程參數的搜尋與分析方法及其電腦程式產品
US9689923B2 (en) * 2013-08-03 2017-06-27 Kla-Tencor Corp. Adaptive electrical testing of wafers
CN103793762B (zh) * 2014-01-23 2017-06-16 太原科技大学 一种基于小样本多类型参数的刀具寿命预测方法
US10338004B2 (en) * 2014-03-27 2019-07-02 KLA—Tencor Corp. Production sample shaping that preserves re-normalizability
CN104110251A (zh) * 2014-06-24 2014-10-22 安徽多杰电气有限公司 一种基于art2的抽油机示功图识别方法
TWI641934B (zh) 2014-08-05 2018-11-21 聯華電子股份有限公司 虛擬量測系統與方法
TWI539298B (zh) 2015-05-27 2016-06-21 國立成功大學 具取樣率決定機制的量測抽樣方法 與其電腦程式產品
TWI628935B (zh) * 2016-01-29 2018-07-01 中華電信股份有限公司 Request traffic grouping method
CN107025596B (zh) * 2016-02-01 2021-07-16 腾讯科技(深圳)有限公司 一种风险评估方法和系统
TWI625615B (zh) * 2016-11-29 2018-06-01 財團法人工業技術研究院 預測模型建立方法及其相關預測方法與電腦程式產品
CN108268987B (zh) * 2016-12-30 2021-08-06 郑芳田 多样式产品的品质推估方法
CN106844908B (zh) * 2017-01-04 2019-09-10 东南大学 一种基于样本相似度加权的电站设备自适应建模方法
CN106940803B (zh) * 2017-02-17 2018-04-17 平安科技(深圳)有限公司 相关变量识别方法和装置
TWI661297B (zh) * 2017-11-30 2019-06-01 財團法人資訊工業策進會 監控系統及監控方法
TWI708197B (zh) 2019-04-26 2020-10-21 國立成功大學 生產機台組件的預測保養方法與其電腦程式產品
CN110163276B (zh) * 2019-05-15 2021-03-26 浙江中烟工业有限责任公司 一种近红外光谱建模样本的筛选方法
TWI695286B (zh) * 2019-05-24 2020-06-01 國立虎尾科技大學 切削動態模擬方法
CN110363229B (zh) * 2019-06-27 2021-07-27 岭南师范学院 一种基于改进RReliefF和mRMR相结合的人体特征参数选择方法
US11429809B2 (en) 2019-09-24 2022-08-30 Beijing Sensetime Technology Development Co., Ltd Image processing method, image processing device, and storage medium
CN113130024A (zh) * 2019-12-31 2021-07-16 华为技术有限公司 医疗事件的预测方法及穿戴设备、计算机可读存储介质
CN113743688B (zh) * 2020-05-27 2023-10-20 富联精密电子(天津)有限公司 质量管控方法、装置、计算机装置及存储介质
TWI742709B (zh) 2020-06-04 2021-10-11 國立成功大學 預測機台加工事件發生的方法與其虛擬量測應用及其電腦程式產品
CN113298305B (zh) * 2021-05-24 2023-04-07 四川大学 基于不同降雨时程特征的双阈值暴雨山洪洪水灾害预警方法
JP7504236B2 (ja) * 2021-06-25 2024-06-21 エルアンドティー テクノロジー サービシズ リミテッド データサンプルをクラスタ化する方法およびシステム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI315054B (en) 2006-05-10 2009-09-21 Nat Cheng Kung Universit Method for evaluating reliance level of a virtual metrology system in product manufacturing
US7962607B1 (en) * 2006-09-08 2011-06-14 Network General Technology Generating an operational definition of baseline for monitoring network traffic data
TWI338916B (en) 2007-06-08 2011-03-11 Univ Nat Cheng Kung Dual-phase virtual metrology method
EP2244213B1 (en) 2007-12-18 2015-10-28 Fujitsu Limited Generating method of two class classification prediction model, program for generating classification prediction model and generating device of two class classification prediction model
TWI349867B (en) * 2008-05-20 2011-10-01 Univ Nat Cheng Kung Server and system and method for automatic virtual metrology
CN101598754B (zh) * 2008-06-05 2011-09-21 郑芳田 自动虚拟计量的系统及方法
US8109669B2 (en) * 2008-11-19 2012-02-07 Applied Materials, Inc. Temperature uniformity measurement during thermal processing
CN101539402B (zh) * 2009-04-29 2011-08-17 陈炳生 实时测量数据的处理方法
KR100997009B1 (ko) 2009-06-09 2010-11-25 한국남동발전 주식회사 산업설비의 공정 여유도에 대한 동적 감시 및 적시 경보 방법
JP2011065504A (ja) 2009-09-18 2011-03-31 Tokyo Univ Of Science ユーザの選好関係についての予測モデルを生成する選好予測サーバ及びその方法
TWI412906B (zh) * 2010-04-13 2013-10-21 Univ Nat Cheng Kung 具有虛擬量測功能的製造執行系統與製造系統

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190108559A (ko) * 2016-10-21 2019-09-24 데이터로봇, 인크. 예측 데이터 분석을 위한 시스템 및 관련 방법 및 장치

Also Published As

Publication number Publication date
TW201327397A (zh) 2013-07-01
KR101440304B1 (ko) 2014-09-15
CN103177180A (zh) 2013-06-26
CN103177180B (zh) 2016-06-22
JP5515125B2 (ja) 2014-06-11
TWI451336B (zh) 2014-09-01
US8862525B2 (en) 2014-10-14
JP2013131217A (ja) 2013-07-04
US20130159226A1 (en) 2013-06-20

Similar Documents

Publication Publication Date Title
KR101440304B1 (ko) 예측 모델을 생성하기 위해 샘플들을 선별하는 방법 및 이의 컴퓨터 프로그램 프로덕트
TWI539298B (zh) 具取樣率決定機制的量測抽樣方法 與其電腦程式產品
CN111414977B (zh) 机床主轴热误差建模的加权集成温度敏感点组合选取方法
CN111222290B (zh) 一种基于多参数特征融合的大型设备剩余使用寿命预测方法
US11264121B2 (en) Real-time industrial plant production prediction and operation optimization
Ye et al. A Bayesian approach to condition monitoring with imperfect inspections
CN110163429B (zh) 一种基于相似日优化筛选的短期负荷预测方法
CN111967688B (zh) 一种基于卡尔曼滤波器与卷积神经网络的电力负荷预测方法
TW201537360A (zh) 量測抽樣方法與其電腦程式產品
US20190064253A1 (en) Semiconductor yield prediction
CN110824914B (zh) 一种基于pca-lstm网络的废水处理智能监控方法
JP2016045799A (ja) 予測モデル生成装置、予測モデル生成方法及びプログラム
US10345794B2 (en) Product quality prediction method for mass customization
JP2012226511A (ja) 歩留まり予測システムおよび歩留まり予測プログラム
JP2024509741A (ja) パーツ、センサ、および計測データ統合
KR20200096992A (ko) 전자 현미경을 사용한 반도체 계측 및 결함 분류
Susto et al. An information-theory and virtual metrology-based approach to run-to-run semiconductor manufacturing control
Park et al. Economic cost models of integrated APC controlled SPC charts
Villalón-Falcón et al. Computational adaptive multivariable degradation model for improving the remaining useful life prediction in industrial systems
JP2011054804A (ja) 半導体製造装置の管理方法およびシステム
CN112966449B (zh) 基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法
CN115935283A (zh) 一种基于多元非线性因果分析的干旱成因溯源方法
CN114580151A (zh) 一种基于灰色线性回归-马尔科夫链模型的需水预测方法
KR20210117550A (ko) 3차원 형상의 임계 차원을 측정하기 위한 방법 및 이를 위한 장치
Arndt et al. Analysis of Efficiency in Response Surface Designs Considering Orthogonality Deviations and Cost Models

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190813

Year of fee payment: 6