KR20220162971A - 데이터 처리 방법 및 데이터 비교 방법 - Google Patents

데이터 처리 방법 및 데이터 비교 방법 Download PDF

Info

Publication number
KR20220162971A
KR20220162971A KR1020210071251A KR20210071251A KR20220162971A KR 20220162971 A KR20220162971 A KR 20220162971A KR 1020210071251 A KR1020210071251 A KR 1020210071251A KR 20210071251 A KR20210071251 A KR 20210071251A KR 20220162971 A KR20220162971 A KR 20220162971A
Authority
KR
South Korea
Prior art keywords
data
process step
facility
processing
convolution
Prior art date
Application number
KR1020210071251A
Other languages
English (en)
Inventor
구기성
전재영
Original Assignee
세메스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 세메스 주식회사 filed Critical 세메스 주식회사
Priority to KR1020210071251A priority Critical patent/KR20220162971A/ko
Priority to US17/829,634 priority patent/US20220391406A1/en
Priority to CN202210624737.5A priority patent/CN115438013A/zh
Publication of KR20220162971A publication Critical patent/KR20220162971A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/16Automatic learning of transformation rules, e.g. from examples
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0454
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L21/00Processes or apparatus adapted for the manufacture or treatment of semiconductor or solid state devices or of parts thereof
    • H01L21/67Apparatus specially adapted for handling semiconductor or electric solid state devices during manufacture or treatment thereof; Apparatus specially adapted for handling wafers during manufacture or treatment of semiconductor or electric solid state devices or components ; Apparatus not specifically provided for elsewhere

Abstract

기판 처리 과정에서 발생하는 데이터의 처리를 수행하는 방법이 개시된다. 상기 방법은, 상기 데이터를 공정 스텝별로 분리하는 단계; 및 상기 공정 스텝별로 분리한 데이터들을 동일한 사이즈로 변환하는 단계;를 포함할 수 있다. 일 예시에 따르면, 상기 동일한 사이즈로 변환하는 단계는, 1D 컨벌루션(convolution)을 이용하여 변환을 수행할 수 있다.

Description

데이터 처리 방법 및 데이터 비교 방법{DATA PROCESSING METHOD AND DATA COMPARING METHOD}
본 발명은 데이터 처리 방법 및 데이터 비교 방법에 관한 발명이다. 보다 상세하게는, 샴 네트워크에 적용하기 위한 데이터의 전처리 방법 및 이를 이용한 데이터의 비교 방법에 관한 발명이다.
반도체 제조 설비에서 발생하는 데이터는 데이터의 분석을 통해 에러 검출 등이나 데이터를 이용한 장비 수리 등에 사용할 수 있기 때문에, 데이터 분석은 반도체 제조 설비에서 중요한 문제에 해당한다. 이 때, 변화가 발생하는 데이터를 인지하는 것이 중요한 문제 중 하나이다. 이를 위해 각각의 설비에서의 데이터가 동일한지 여부를 판단하는 것이 중요한 이슈에 해당한다.
도 1 내지 도 2는 기존 방법에서의 데이터 비교 방법을 설명하기 위한 도면이다. 종래 기술의 경우, 같은 공정에서의 로그 샘플 1과 로그 샘플 2에 대해서 매칭 레이트(matching rate), 즉 유사도를 계산할 때, I/O 데이터 단위로 유사도를 계산한다. 즉 기존의 기술에서는 각각의 I/O 별로 전체 공정에 대한 데이터의 매칭 여부를 테스트하는 방법을 이용하여 동일 여부를 판단하였다.
도 3은 기존 방법에서의 데이터 비교 방법에서의 문제점을 설명하기 위한 도면이다. 비교하고자 하는 공정에서의 로그 샘플 1과 로그 샘플 2의 데이터의 사이즈는 항상 일치하지는 않는다. 데이터 사이즈가 일치하지 않는 경우가 대다수에 해당한다. 데이터의 동일성 비교를 위해 샴 네트워크에 각각 인풋 1(input 1)과, 인풋 2(input 2)로 입력할 수 있다. 그러나 샴 네트워크 A에서 인풋 1의 사이즈가 변하면, 네트워크 A에서 학습된 내용을 유지하지 못한 채 샴 네트워크 A는 기존과 다른 샴 네트워크 B가 되는 문제점이 발생한다. 따라서 샴 네트워크 A에서 인풋 1과 인풋 2의 사이즈를 일치시켜야 하는 과제가 있었다.
본 발명은 샴 네트워크의 학습을 위한 데이터의 전처리 방법을 제안한다.
본 발명이 해결하고자 하는 과제는 이상에서 언급된 과제로 제한되지 않는다. 언급되지 않은 다른 기술적 과제들은 이하의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
기판 처리 과정에서 발생하는 데이터의 처리를 수행하는 방법이 개시된다.
상기 방법은, 상기 데이터를 공정 스텝별로 분리하는 단계; 및 상기 공정 스텝별로 분리한 데이터들을 동일한 사이즈로 변환하는 단계;를 포함할 수 있다.
일 예시에 따르면, 상기 동일한 사이즈로 변환하는 단계는, 1D 컨벌루션(convolution)을 이용하여 변환을 수행할 수 있다.
일 예시에 따르면, 상기 동일한 사이즈는, 상기 공정 스텝별로 분리한 데이터 중 가장 크기가 큰 데이터에 해당하는 사이즈일 수 있다.
일 예시에 따르면, 상기 동일한 사이즈는, 샴 네트워크에 입력하기 위한 데이터 사이즈일 수 있다.
일 예시에 따르면, 상기 1D 컨벌루션(convolution)을 이용하여 변환을 수행한 상기 공정 스텝별로 분리한 데이터들을 어셈블링 하는 단계;를 포함할 수 있다.
일 예시에 따르면, 상기 데이터 처리 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체가 개시될 수 있다.
본 발명의 다른 일 실시예에 따른 제1 설비 및 제2 설비의 각각의 데이터를 비교하는 방법이 개시된다.
일 예시에 따르면, 상기 제1 설비에서의 제1 데이터들을 전처리 하는 단계; 상기 제2 설비에서의 제2 데이터들을 전처리 하는 단계; 및 상기 전처리된 제1 설비에서의 데이터와, 상기 전처리된 제2 설비에서의 데이터의 동일성 여부를 판단하는 단계;를 포함할 수 있다.
일 예시에 따르면, 상기 제1 설비에서의 제1 데이터를 전처리 하는 단계;는, 상기 제1 설비에서의 제1 데이터들을 공정 스텝별로 분리하는 단계; 및 상기 공정 스텝별로 분리한 제1 데이터들을 동일한 사이즈로 변환하는 단계;를 포함할 수 있다.
일 예시에 따르면, 상기 제2 설비에서의 제2 데이터를 전처리 하는 단계;는 상기 제2 설비에서의 제2 데이터를 공정 스텝별로 분리하는 단계; 및 상기 공정 스텝별로 분리한 제2 데이터들을 동일한 사이즈로 변환하는 단계;를 포함할 수 있다.
일 예시에 따르면, 상기 동일한 사이즈로 변환하는 단계는, 1D 컨벌루션(convolution)을 이용하여 변환을 수행할 수 있다.
일 예시에 따르면, 상기 1D 컨벌루션(convolution)을 이용하여 변환을 수행한 상기 공정 스텝별로 분리한 제1 데이터들을 어셈블링 하는 단계;를 포함할 수 있다.
일 예시에 따르면, 상기 1D 컨벌루션(convolution)을 이용하여 변환을 수행한 상기 공정 스텝별로 분리한 제2 데이터들을 어셈블링 하는 단계;를 포함할 수 있다.
일 예시에 따르면, 상기 전처리된 제1 설비에서의 데이터와, 상기 전처리된 제2 설비에서의 데이터의 동일성 여부를 판단하는 단계;는, 샴 네트워크를 이용하여 판단할 수 있다.
일 예시에 따르면, 상기 샴 네트워크에 상기 제1 데이터를 어셈블링 한 결과와, 상기 제2 데이터를 어셈블링 한 결과를 입력값으로 처리하여 데이터의 유사 여부를 판단할 수 있다.
일 예시에 따르면, 상기에 따른 데이터 비교 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체가 개시될 수 있다.
본 발명에 따르면 샴 네트워크의 학습을 위한 데이터의 전처리 방법을 제안함으로써, 다수의 데이터에서 길이가 상이하게 제공되어 딥러닝을 이용한 학습을 수행할 수 없는 문제를 해결할 수 있는 효과가 있다.
본 발명의 효과는 상술한 효과들로 제한되지 않는다. 언급되지 않은 효과들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확히 이해될 수 있을 것이다.
도 1 내지 도 2는 기존 방법에서의 데이터 비교 방법을 설명하기 위한 도면이다.
도 3은 기존 방법에서의 데이터 비교 방법에서의 문제점을 설명하기 위한 도면이다.
도 4 내지 도 5는 본 발명에 따른 데이터 비교 방법을 설명하기 위한 도면이다.
도 6은 본 발명에 따른 데이터 비교 방법을 통해 데이터를 비교하는 것을 설명하기 위한 도면이다.
도 7은 1D 컨벌루션의 일 실시예를 나타내는 도면이다.
도 8은 본 발명의 일 예시에 따른 데이터 비교 방법에 따른 데이터 어셈블링을 설명하기 위한 도면이다.
도 9는 도 8의 중간 과정을 설명하기 위한 도면이다.
도 10은 본 발명에 따라 어셈블링 한 데이터를 적용하는 것을 설명하기 위한 도면이다.
도 11은 본 발명의 일 실시예에 따른 데이터 처리 방법을 나타내는 순서도이다.
도 12는 본 발명의 일 실시예에 따른 데이터 비교 방법을 나타내는 순서도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 또한, 본 발명의 바람직한 실시예를 상세하게 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. 또한, 유사한 기능 및 작용을 하는 부분에 대해서는 도면 전체에 걸쳐 동일한 부호를 사용한다.
어떤 구성요소를 '포함'한다는 것은, 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 구체적으로, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 또한 도면에서 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다.
이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 더욱 상세히 설명한다. 본 발명의 실시 예는 여러 가지 형태로 변형될 수 있으며, 본 발명의 범위가 아래의 실시 예들로 한정되는 것으로 해석되어서는 안 된다. 본 실시 예는 당업계에서 평균적인 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위해 제공되는 것이다. 따라서 도면에서의 요소의 형상은 보다 명확한 설명을 강조하기 위해 과장되었다.
도 4 내지 도 5는 본 발명에 따른 데이터 비교 방법을 설명하기 위한 도면이다.
도 4를 참조하면, 서로 다른 각각의 샘플 1과 샘플 2의 데이터를 비교하는 일 예시가 개시된다. 샘플 1과 샘플 2는 각각 같은 공정 스텝에 따라 얻어진 서로 다른 결과 샘플을 나타낸다. 일 예시에 따르면 샘플 1은 제1 기판 처리 설비에서 처리된 결과 데이터일 수 있다. 일 예시에 따르면 샘플 2는 제2 기판 처리 설비에서 처리된 결과 데이터일 수 있다. 제1 처리 설비와 제2 처리 설비에서 진행되는 공정 스텝은 동일한 레시피에 따라 진행될 수 있다.
샘플 1과 샘플 2는 각각의 처리 설비에서의 시계열 데이터일 수 있다. 문제는 각각의 처리 설비에서 처리되는 처리 시간이 매번 상이하기 때문에 그 자체로 비교할 경우 데이터 사이즈가 맞지 않는 문제점이 있다. 이를 해결하기 위해 본 발명에서는 샘플 1과 샘플 2의 동일 여부를 판단 시 각각의 데이터 샘플에서의 공정 스텝 별로 데이터를 잘라서 비교할 수 있다. 그러나 도 4를 참조하면, 각각의 공정 스텝 별 길이도 일치하지 않는 경우가 있을 수 있는 문제점이 있다.
본 발명에 따르면, 각각의 공정 스텝 별로 데이터를 나누고, 각각의 공정 스텝 별 데이터의 길이를 동일하게 맞추기 위한 방법으로 1D 컨벌루션(convolution)을 이용하여 데이터의 변환을 수행할 수 있다. 이는 도 6 및 도 7을 통해 보다 상세하게 설명된다.
도 4를 참조하면, 각각의 샘플 데이터 1과 샘플 데이터 2를 각 공정 스텝별로 분리할 수 있다. 도 4의 일 예시에 따르면 샘플 데이터 1과 샘플 데이터 2는 3단계의 공정 스텝으로 나눠질 수 있다. 도 4를 참조하면, 샘플 데이터 1에서 나눠진 공정 스텝별 데이터의 길이와, 샘플 데이터 2에서 나눠진 공정 스텝별 데이터의 길이는 상이한 것을 확인할 수 있다.
이와 같이 스텝별로 데이터의 길이가 상이한 것을 맞추기 위해, 각각의 모든 공정 스텝에서의 데이터들의 길이를 1D 컨볼루션을 통해 변환하여 데이터의 길이를 맞출 수 있다.
기존의 경우 데이터의 사이즈가 맞지 않는 경우 샴 네트워크를 통한 학습 자체가 되지 않는 문제점이 있었으나, 본 발명의 경우 길이를 맞추는 작업을 통해 샴 네트워크를 통한 학습이 용이할 수 있도록 데이터의 전처리를 수행할 수 있는 효과가 있다. 실제 실시 예에 따르면 약 1000개에 가까운 데이터 개수가 있기 때문에 데이터 개수가 더 많을수록 효율적으로 데이터의 비교를 수행할 수 있는 효과가 있다.
도 5를 참조하면, 제1 샘플 데이터에서 공정 스텝별로 분리한 데이터와, 제2 샘플 데이터에서 공정 스텝별로 분리한 데이터에서, 비교하고자 하는 공정 스텝만을 선택하여 해당 스텝의 데이터만을 사이즈 변환할 수도 있다.
일 예시에 따르면, 현재의 데이터를 정상 데이터와 비교하며 비정상 I/O를 찾을 때, 특정 I/O의 데이터를 선택할 수 있다. 도 5에 따르면 선택되는 공정 스텝은 제2 단계의 스텝을 선택할 수 있다. 즉 모든 스텝의 변환을 수행하지 않고, 변화 여부를 판단하고자 하는 공정 스텝의 데이터에 대해서만 변환을 수행할 수도 있다. 이하의 실시 예에서는 전체 공정 스텝에 대해 데이터 사이즈의 변환을 수행하는 일 예시로 가정하고 설명하도록 한다.
도 4 내지 도 5를 참조하면, 각각의 공정 스텝별로 나뉜 데이터들의 크기는 모두 다를 수 있다. 이를 맞추기 위한 기준 사이즈를 정하기 위한 조건은 다음과 같을 수 있다. 일 예시에 따르면 샴 네트워크에 입력하기 위한 입력 사이즈에 맞는 사이즈로 변환할 수 있다. 즉, 딥 러닝 신경망의 입력 사이즈에 맞는 사이즈로 변환할 수 있다. 다른 일 예시에 따르면, 공정 스텝 중 선택한 공정 스텝의 데이터 중 가장 큰 크기에 맞추어 변환할 수도 있다.
이 때 1D 컨벌루션을 이용하여 데이터 변환을 수행할 수 있다.
도 6은 본 발명에 따른 데이터 비교 방법을 통해 데이터를 비교하는 것을 설명하기 위한 도면이다.
도 6을 참조하면, 제1 샘플 데이터(위쪽)과 제2 샘플 데이터(아래쪽)은 각각 공정 스텝별로 나뉘어질 수 있다. 각 공정 스텝별 데이터의 사이즈는 제1 샘플 데이터 내에서도 상이하고, 제1 샘플 데이터와 제2 샘플 데이터에서 각각 대응하는 공정 스텝끼리도 상이할 수 있다. 이를 맞추기 위한 작업으로써 1D 컨벌루션을 통해 고정된 사이즈의 입력값을 만들어 낼 수 있다. 이는 샴 네트워크의 입력값으로 처리될 수 있다.
도 7은 1D 컨벌루션의 일 실시예를 나타내는 도면이다.
도 7에 따르면, 각 공정 스텝별로 시계열 데이터가 개시된다. 도 7을 참조하면, 제4 단계(step 4)에서의 데이터를 1D 컨벌루션을 통해 변환하는 일 예시가 개시된다. 이 때 1D 컨벌루션의 파라미터는 고정된 값으로 제공될 수 있다. 이와 같이 공정 스텝 별 데이터를 1D 컨벌루션을 통해 데이터 변환을 수행하는 것을 통해, 고정된 사이즈의 결과값으로 도출하는 것이 가능할 수 있다. 도 7에서의 데이터 값 및 1D 컨벌루션에서의 파라미터 값은 일 예시에 불과하고, 추출해내고자 하는 특징에 따라 1D 컨벌루션의 파라미터 값은 상이하게 적용될 수 있다.
도 8은 본 발명의 일 예시에 따른 데이터 비교 방법에 따른 데이터 어셈블링을 설명하기 위한 도면이다.
도 8을 참조하면, 기판 처리 설비에서의 시계열 데이터를 전처리된 이미지 데이터의 형태로 변환하는 것을 통해 샴 네트워크에 입력할 수 있는 효과가 있다. 일 예시에 따르면 인풋 사이즈는 모두 동일하게 설정되어 변환될 수 있고, 각각의 공정 스텝별로 어셈블링 하여 하나의 인풋 데이터를 설정할 수 있다. 복수의 인풋 데이터들은 각각 서로 다른 설비에서 같은 공정 스텝을 수행한 결과일 수 있다. 또는, 복수의 인풋 데이터들은 동일한 설비에서 같은 공정 스텝을 시간차를 두고 수행한 결과일 수 있다.
도 8과 같이 각각의 서로 다른 길이를 가지는 공정 스텝들의 길이를 변환한 후에, 하나의 평면으로 어셈블링 하는 것을 통해 딥 러닝에 입력할 수 있는 최적의 형태로 변경함으로써 보다 용이한 적용이 가능한 효과가 있을 수 있다.
도 9는 도 8의 2D에서 3D로 변환되는 중간 과정을 설명하기 위한 도면이다. 도 10은 본 발명에 따라 어셈블링 한 데이터를 적용하는 것을 설명하기 위한 도면이다.
본 발명에 따르면, 설비의 로그 데이터 1과 2에 대해서 매칭 레이트(matching rate, 유사도)를 계산할 때, 기존에는 하나의 공정 단위로 테스트하던 것을 공정 스텝 단위로 세분화 테스트하여 데이터의 공정 스텝별 특징을 반영한 유사도를 계산할 수 있는 효과가 있다.
도 9를 참조하면, 기존 기술에서 로그 데이터의 I/O 데이터 단위로 나눈 후, 공정 스텝 별로 더 세분화해서 유사도를 계산한다. 테스트를 수행할 때, 각각의 공정 스텝 별 출발점은 동일할 수 있다. 본 발명에 따르면 I/O 데이터 별로 공정 스텝에 대한 데이터의 매칭 여부를 테스트할 수 있다. 본 발명에 따르면, 두 개의 설비의 로그 데이터의 유사도를 딥 러닝을 통해서 검사할 때, I/O 별 및 공정 스텝 별로 구분하여 전처리(data preprocess)하여 검사할 수 있다.
도 9의 첫번째 그림을 참조하면, 공정 데이터를 공정 스텝 별로 자르면 각 스텝의 데이터 크기가 일정하지 않다. 도 10을 참조하면, 샴 네트워크(Siamese Network)의 인풋(input) 1 및 2의 size는 동일하며 일정하게 제공되어야 한다. 본 발명에 따르면 전처리 과정을 거쳐서 서로 다른 공정 스텝 데이터의 크기를 인풋 사이즈(input size)와 동일하게 할 수 있다.
다시 도 9의 두번째 그림을 참조하면, 설비의 로그 데이터를 전처리할 때, 다양한 사이즈의 공정 스텝 데이터를 딥 러닝의 입력 사이즈로 변환하여 전처리를 수행할 수 있다. 이 때, 전처리 하는 입력 사이즈는 공정 스텝 데이터의 사이즈 중에서 최대값으로 설정할 수 있다. 또는 적용하고자 하는 딥러닝의 입력 사이즈에 맞는 사이즈로 전처리를 수행할 수도 있다. 설비의 로그 데이터를 입력 사이즈로 변환할 때, 1D 컨벌루션(convolution)을 사용하여 변환할 수 있다.
도 9의 세번째 그림을 참조하면, 이와 같이 1차 전처리(1D 컨벌루션)를 거친 공정 스텝 데이터는 I/O 별로 합쳐 2D 데이터를 만들 수 있다. 즉 공정 스텝 데이터를 어셈블링 하는 것을 통해 데이터를 입력하기 위한 상태로 만들 수 있다. 도 10을 참조하면, 나머지 I/O들의 2D 데이터를 모두 합쳐서 최종적으로 3D 데이터를 하나의 인풋 데이터로 설정할 수 있다.
도 11은 본 발명의 일 실시예에 따른 데이터 처리 방법을 나타내는 순서도이다.
기판 처리 과정에서 발생하는 데이터의 처리를 수행하는 방법에 있어서, 데이터를 공정 스텝별로 분리하는 단계; 및 상기 공정 스텝별로 분리한 데이터들을 1D 컨벌루션(convolution)을 통해 동일한 사이즈로 변환하는 단계; 그리고 1D 컨벌루션(convolution)을 이용하여 변환을 수행한 상기 공정 스텝별로 분리한 데이터들을 어셈블링 하는 단계;를 포함할 수 있다. 이와 같이 공정 스텝별로 분리한 데이터들을 동일한 사이즈로 변환하고, 이를 어셈블링 하는 것을 통해 딥 러닝에서 적용할 수 있는 인풋 데이터로 변환을 수행할 수 있다.
도 12는 본 발명의 일 실시예에 따른 데이터 비교 방법을 나타내는 순서도이다.
편의를 위해, 제1 설비 및 제2 설비의 각각의 데이터를 비교하는 예시로 설명한다. 이 때, 제1 설비에서의 제1 데이터들을 전처리 하는 단계; 상기 제2 설비에서의 제2 데이터들을 전처리 하는 단계; 및 상기 전처리된 제1 설비에서의 데이터와, 상기 전처리된 제2 설비에서의 데이터의 동일성 여부를 판단하는 단계;를 포함할 수 있다.
제1 설비에서의 제1 데이터를 전처리 하는 단계;는, 제1 설비에서의 제1 데이터들을 공정 스텝별로 분리하는 단계; 및 공정 스텝별로 분리한 제1 데이터들을 동일한 사이즈로 변환하는 단계;를 포함할 수 있다.
제2 설비에서의 제2 데이터를 전처리 하는 단계;는, 제2 설비에서의 제2 데이터를 공정 스텝별로 분리하는 단계; 및 공정 스텝별로 분리한 제2 데이터들을 동일한 사이즈로 변환하는 단계;를 포함할 수 있다.
이 때 사이즈 변환은 1D 컨벌루션(convolution)을 이용하여 변환될 수 있다.
각각 변환된 데이터들은 제1 데이터 / 제2 데이터 별로 각각 어셈블링 되어 2D 데이터의 형태로 제공될 수 있다. 어셈블링 된 데이터들은 샴 네트워크의 입력값으로 입력되어, 유사도 여부를 판단하는데 사용될 수 있다.
본 발명에서는 샴 네트워크의 학습을 위한 데이터의 전처리 방법을 제안함으로써, 다수의 데이터에서 길이가 상이하게 제공되어 딥러닝을 이용한 학습을 수행할 수 없는 문제를 해결할 수 있는 효과가 있다.
한편 상술한 본 발명의 실시 예에 따른 데이터 처리 방법 및 데이터 비교 방법의 경우 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터로 판독 가능한 기록 매체에 기록될 수 있다. 이때, 컴퓨터로 판독 가능한 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 한편, 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터로 판독 가능한 기록매체에는 하드디스크, 플로피디스크 및 자기 테이프와 같은 자기매체(Magnetic Media), CD-ROM, DVD와 같은 광기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 또한, 프로그램 명령에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있다.
이상의 실시 예들은 본 발명의 이해를 돕기 위하여 제시된 것으로, 본 발명의 범위를 제한하지 않으며, 이로부터 다양한 변형 가능한 실시 예들도 본 발명의 범위에 속하는 것임을 이해하여야 한다. 본 발명의 기술적 보호범위는 특허청구범위의 기술적 사상에 의해 정해져야 할 것이며, 본 발명의 기술적 보호범위는 특허청구범위의 문언적 기재 그 자체로 한정되는 것이 아니라 실질적으로는 기술적 가치가 균등한 범주의 발명에 대하여까지 미치는 것임을 이해하여야 한다.

Claims (17)

  1. 기판 처리 과정에서 발생하는 데이터의 처리를 수행하는 방법에 있어서,
    상기 데이터를 공정 스텝별로 분리하는 단계; 및
    상기 공정 스텝별로 분리한 데이터들을 동일한 사이즈로 변환하는 단계;를 포함하는 데이터 처리 방법.
  2. 제1항에 있어서,
    상기 동일한 사이즈로 변환하는 단계는, 1D 컨벌루션(convolution)을 이용하여 변환을 수행하는 것을 특징으로 하는 데이터 처리 방법.
  3. 제2항에 있어서,
    상기 동일한 사이즈는, 상기 공정 스텝별로 분리한 데이터 중 가장 크기가 큰 데이터에 해당하는 사이즈인 데이터 처리 방법.
  4. 제2항에 있어서,
    상기 동일한 사이즈는, 샴 네트워크에 입력하기 위한 데이터 사이즈인 데이터 처리 방법.
  5. 제2항 내지 제4항 중 어느 한 항에 있어서,
    상기 1D 컨벌루션(convolution)을 이용하여 변환을 수행한 상기 공정 스텝별로 분리한 데이터들을 어셈블링 하는 단계;를 포함하는 데이터 처리 방법.
  6. 제5항에 따른 데이터 처리 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
  7. 제1 설비 및 제2 설비의 각각의 데이터를 비교하는 방법에 있어서,
    상기 제1 설비에서의 제1 데이터들을 전처리 하는 단계;
    상기 제2 설비에서의 제2 데이터들을 전처리 하는 단계; 및
    상기 전처리된 제1 설비에서의 데이터와, 상기 전처리된 제2 설비에서의 데이터의 동일성 여부를 판단하는 단계;를 포함하는 데이터 비교 방법.
  8. 제7항에 있어서,
    상기 제1 설비에서의 제1 데이터를 전처리 하는 단계;는,
    상기 제1 설비에서의 제1 데이터들을 공정 스텝별로 분리하는 단계; 및
    상기 공정 스텝별로 분리한 제1 데이터들을 동일한 사이즈로 변환하는 단계;를 포함하는 데이터 비교 방법.
  9. 제8항에 있어서,
    상기 제2 설비에서의 제2 데이터를 전처리 하는 단계;는,
    상기 제2 설비에서의 제2 데이터를 공정 스텝별로 분리하는 단계; 및
    상기 공정 스텝별로 분리한 제2 데이터들을 동일한 사이즈로 변환하는 단계;를 포함하는 데이터 비교 방법.
  10. 제9항에 있어서,
    상기 동일한 사이즈로 변환하는 단계는, 1D 컨벌루션(convolution)을 이용하여 변환을 수행하는 것을 특징으로 하는 데이터 비교 방법.
  11. 제10항에 있어서,
    상기 동일한 사이즈는, 상기 공정 스텝별로 분리한 데이터 중 가장 크기가 큰 데이터에 해당하는 사이즈인 데이터 비교 방법.
  12. 제10항에 있어서,
    상기 동일한 사이즈는, 샴 네트워크에 입력하기 위한 데이터 사이즈인 데이터 비교 방법.
  13. 제11항 또는 제12항에 있어서,
    상기 1D 컨벌루션(convolution)을 이용하여 변환을 수행한 상기 공정 스텝별로 분리한 제1 데이터들을 어셈블링 하는 단계;를 포함하는 데이터 비교 방법.
  14. 제13항에 있어서,
    상기 1D 컨벌루션(convolution)을 이용하여 변환을 수행한 상기 공정 스텝별로 분리한 제2 데이터들을 어셈블링 하는 단계;를 포함하는 데이터 비교 방법.
  15. 제14항에 있어서,
    상기 전처리된 제1 설비에서의 데이터와, 상기 전처리된 제2 설비에서의 데이터의 동일성 여부를 판단하는 단계;는, 샴 네트워크를 이용하여 판단하는 데이터 비교 방법.
  16. 제15항에 있어서,
    상기 샴 네트워크에 상기 제1 데이터를 어셈블링 한 결과와, 상기 제2 데이터를 어셈블링 한 결과를 입력값으로 처리하여 데이터의 유사 여부를 판단하는 데이터 비교 방법.
  17. 제16항에 따른 데이터 비교 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
KR1020210071251A 2021-06-02 2021-06-02 데이터 처리 방법 및 데이터 비교 방법 KR20220162971A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020210071251A KR20220162971A (ko) 2021-06-02 2021-06-02 데이터 처리 방법 및 데이터 비교 방법
US17/829,634 US20220391406A1 (en) 2021-06-02 2022-06-01 Data processing method and data comparing method
CN202210624737.5A CN115438013A (zh) 2021-06-02 2022-06-02 数据处理方法和数据比较方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210071251A KR20220162971A (ko) 2021-06-02 2021-06-02 데이터 처리 방법 및 데이터 비교 방법

Publications (1)

Publication Number Publication Date
KR20220162971A true KR20220162971A (ko) 2022-12-09

Family

ID=84241367

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210071251A KR20220162971A (ko) 2021-06-02 2021-06-02 데이터 처리 방법 및 데이터 비교 방법

Country Status (3)

Country Link
US (1) US20220391406A1 (ko)
KR (1) KR20220162971A (ko)
CN (1) CN115438013A (ko)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7364839B2 (en) * 2002-07-24 2008-04-29 Kabushiki Kaisha Toshiba Method for forming a pattern and substrate-processing apparatus
US20180129934A1 (en) * 2016-11-07 2018-05-10 Qualcomm Incorporated Enhanced siamese trackers
US10210627B1 (en) * 2017-01-23 2019-02-19 Amazon Technologies, Inc. Image processing system for determining metrics of objects represented therein
DK3668400T3 (da) * 2017-08-18 2023-09-18 Abbott Diabetes Care Inc Fremgangsmåde til individualiseret kalibrering af analytsensorer
US11301610B2 (en) * 2017-12-22 2022-04-12 D2S, Inc. Methods for modeling of a design in reticle enhancement technology
EP3662414A4 (en) * 2018-10-24 2020-07-22 Alibaba Group Holding Limited RAPID CALCULATION OF A CONVOLUTIVE NEURONAL NETWORK
JP7174298B2 (ja) * 2019-05-30 2022-11-17 日本電信電話株式会社 差異検出装置、差異検出方法及びプログラム

Also Published As

Publication number Publication date
US20220391406A1 (en) 2022-12-08
CN115438013A (zh) 2022-12-06

Similar Documents

Publication Publication Date Title
US8826200B2 (en) Alteration for wafer inspection
CN109491914B (zh) 基于不平衡学习策略高影响缺陷报告预测方法
US11373292B2 (en) Image generation device and appearance inspection device
Nelson et al. Iterated wavelet transformation and signal discrimination for HRR radar target recognition
US9582869B2 (en) Dynamic binning for diversification and defect discovery
EP2525306A1 (en) Pattern recognition device, pattern recognition method and pattern recognition-use program
KR20170109304A (ko) 객체 인식을 위한 캐스케이드 분류기의 병렬 학습 방법
US9697441B2 (en) Feature selection method and apparatus, and pattern discrimination method and apparatus
KR20210067606A (ko) 특징 생성 기술을 이용한 머신러닝 기반 결함 분류 장치 및 방법
CN115905926A (zh) 基于样本差异的代码分类深度学习模型解释方法及系统
KR101749210B1 (ko) 다중 서열 정렬 기법을 이용한 악성코드 패밀리 시그니쳐 생성 장치 및 방법
CN110825642A (zh) 一种基于深度学习的软件代码行级缺陷检测方法
US11727052B2 (en) Inspection systems and methods including image retrieval module
KR20220162971A (ko) 데이터 처리 방법 및 데이터 비교 방법
US8689327B2 (en) Method for characterization of a computer program part
CN115345071B (zh) 基于实例迁移的航天设备内部多余物定位方法及设备
US20220058530A1 (en) Method and device for optimizing deep learning model conversion, and storage medium
CN110083807B (zh) 合同的修改影响自动预测方法、装置、介质及电子设备
KR102152352B1 (ko) 기계 결함 진단 장치 및 방법
Liu et al. Dynamic Token-Pass Transformers for Semantic Segmentation
CN112860870A (zh) 一种噪音数据的识别方法和设备
KR20200088012A (ko) 반도체 제조 공정에서 특징 선택 기법에 따른 멀티 분류기를 활용한 불량 패턴 예측 장치 및 방법
KR102564051B1 (ko) 강인한 학습 및 인식을 위한 다단계 딥러닝 방법 및 이를 수행하는 장치
Silva et al. Automatic recognition of electrical grid elements using convolutional neural networks
RU2251151C2 (ru) Способ анализа растрового изображения

Legal Events

Date Code Title Description
A201 Request for examination