KR102294800B1 - 시계열 데이터의 특징 값을 추출하는 방법 및 장치 - Google Patents

시계열 데이터의 특징 값을 추출하는 방법 및 장치 Download PDF

Info

Publication number
KR102294800B1
KR102294800B1 KR1020210026328A KR20210026328A KR102294800B1 KR 102294800 B1 KR102294800 B1 KR 102294800B1 KR 1020210026328 A KR1020210026328 A KR 1020210026328A KR 20210026328 A KR20210026328 A KR 20210026328A KR 102294800 B1 KR102294800 B1 KR 102294800B1
Authority
KR
South Korea
Prior art keywords
series data
time series
segment
data
time
Prior art date
Application number
KR1020210026328A
Other languages
English (en)
Inventor
김상엽
박진우
하태경
Original Assignee
(주)알티엠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)알티엠 filed Critical (주)알티엠
Priority to KR1020210026328A priority Critical patent/KR102294800B1/ko
Application granted granted Critical
Publication of KR102294800B1 publication Critical patent/KR102294800B1/ko
Priority to US18/248,042 priority patent/US20230367793A1/en
Priority to PCT/KR2022/002734 priority patent/WO2022182176A1/ko
Priority to CN202280006874.0A priority patent/CN116802616A/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • G06F11/3082Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved by aggregating or compressing the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • G06F11/3079Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved by reporting only the changes of the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

시계열 데이터를 수신하고, 기설정된 세그먼트 유형에 따라, 상기 시계열 데이터를 하나 이상의 세그먼트로 분할하고, 상기 하나 이상의 세그먼트 중 제1 세그먼트의 세그먼트 유형과 매핑된 제1 특징 그룹을 식별하고, 상기 제1 세그먼트로부터 상기 제1 특징 그룹에 포함된 적어도 한 항목의 값을 특징 값으로 추출하는 시계열 데이터의 특징 값을 추출하는 방법 및 장치를 제공한다.

Description

시계열 데이터의 특징 값을 추출하는 방법 및 장치{METHOD AND APPARATUS FOR EXTRACTING FEATURE VALUE OF TIME SERIES DATA}
본 개시는 시계열 데이터의 특징 값을 추출하는 방법 및 장치에 관한 것이다.
시계열 데이터는 일정한 시간동안 수집된 일련의 순차적으로 정해진 데이터의 집합으로 정의될 수 있다. 시계열 데이터는 시간에 관해 순서가 정해져 있고, 연속한 데이터 간에는 서로 상관관계를 갖고 있다. 따라서, 시계열 데이터의 자기 상관관계 또는 다수의 시계열 데이터 간의 상관관계에 기초하여, 시계열 데이터에 포함된 비정상 데이터가 감지될 수 있다. 예를 들어, RNN(Recurrent Neural Network) 및 LSTM(Long short-term mempry) 딥러닝 기술을 활용하여 비정상 데이터가 감지되거나, 과거 시계열 데이터를 기반으로 미래 시계열 데이터가 예측될 수 있다.
선행문헌 : 한국 특허등록공고 10-1940029
한편, 최근 하이테크 분야의 공정에서 센서에 의해 발생되는 시계열 데이터의 양이 방대하여 센서 데이터를 관리하는 것에 어려움이 있다. 그래서 예측 모델링에는 데이터 원본을 사용하기보다는 특징을 추출한 후, 변수화하여 사용하는 경우가 많다. 하지만, 공정마다 시계열 데이터의 적절한 특징 값을 추출하여 모델링에 적용하는 것에 어려움이 있다. 또한, 모델링에 입력된 특징 값을 잘못 선택하는 경우로 인해 예측 성능이 저하될 가능성이 있다.
따라서 시계열 데이터를 효율적으로 관리하고, 이상 감지를 위해 필요한 특징 값을 추출하는 방법 및 장치에 관한 필요성이 존재한다.
본 실시예가 해결하고자 하는 과제는, 시계열 데이터를 하나 이상의 세그먼트로 분할하여, 각 세그먼트와 매핑된 특징 그룹에 따라, 해당 특징 그룹에 포함된 항목의 특징 값을 추출하는, 시계열 데이터의 특징 값을 추출하는 방법 및 장치를 제공하는데 있다.
본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 이하의 실시예들로부터 또 다른 기술적 과제들이 유추될 수 있다.
제1 실시예에 따라, 시계열 데이터의 특징 값을 추출하는 방법은, 시계열 데이터를 수신하는 단계, 기설정된 세그먼트 유형에 따라, 상기 시계열 데이터를 하나 이상의 세그먼트로 분할하는 단계, 상기 하나 이상의 세그먼트 중 제1 세그먼트와 매핑된 제1 특징 그룹을 식별하는 단계 및 상기 제1 세그먼트로부터 상기 제1 특징 그룹에 포함된 항목의 특징 값을 추출하는 단계를 포함할 수 있다.
제2 실시예에 따라, 시계열 데이터의 특징 값을 추출하는 장치는 적어도 하나의 명령어(instruction)를 저장하는 메모리(memory) 및 상기 적어도 하나의 명령어를 실행하여, 시계열 데이터를 수신하고, 기설정된 세그먼트 유형에 따라, 상기 시계열 데이터를 하나 이상의 세그먼트로 분할하고, 상기 하나 이상의 세그먼트 중 제1 세그먼트와 매핑된 제1 특징 그룹을 식별하고, 상기 제1 세그먼트로부터 상기 제1 특징 그룹에 포함된 항목의 특징 값을 추출하는 프로세서(processor)를 포함할 수 있다.
제3 실시예에 따라, 컴퓨터로 읽을 수 있는 기록매체는 시계열 데이터의 특징 값을 추출하는 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 비일시적 기록매체로서, 상기 시계열 데이터의 특징 값을 추출하는 방법은, 시계열 데이터를 수신하는 단계, 기설정된 세그먼트 유형에 따라, 상기 시계열 데이터를 하나 이상의 세그먼트로 분할하는 단계, 상기 하나 이상의 세그먼트 중 제1 세그먼트와 매핑된 제1 특징 그룹을 식별하는 단계 및 상기 제1 세그먼트로부터 상기 제1 특징 그룹에 포함된 항목의 특징 값을 추출하는 단계를 포함할 수 있다.
기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
본 개시에 따른 시계열 데이터의 특징 값을 추출하는 방법 및 장치는 세그먼트 유형에 따라 서로 다른 특징 값을 추출할 수 있으므로, 추출된 특징 값을 통해 비정상인 시계열 데이터를 정확하고 쉽게 감지할 수 있는 효과가 있다.
또한, 본 개시에 따른 시계열 데이터의 특징 값을 추출하는 방법 및 장치는 시계열 데이터를 압축한 후 세그먼트를 분할함으로써, 세그먼트 분할의 정확도를 향상시킬 수 있는 효과가 있다.
발명의 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 청구범위의 기재로부터 당해 기술 분야의 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 실시예에 따른 시계열 데이터 및 시계열 데이터에 포함된 세그먼트를 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른 시계열 데이터의 세그먼트 분할 결과를 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따라 세그먼트 유형 별 매핑될 수 있는 특징 그룹을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 방법의 효과를 설명하기 위한 도면이다.
도 5는 본 발명의 다른 일 실시예에 따른 방법의 효과를 설명하기 위한 도면이다.
도 6 및 도 7은 본 발명의 일 실시예에 따른 시계열 데이터를 압축하는 방법을 설명하기 위한 도면이다.
도 8 내지 도 10은 일 실시예에 따라 시계열 데이터로부터 추출된 특징 값으로 시계열 데이터의 이상 여부를 감지한 결과를 설명하기 위한 도면이다.
도 11은 본 개시의 일 실시예에 따라 두 유형의 시계열 데이터를 세그먼트 분할한 결과를 나타낸다.
도 12는 본 발명의 일 실시예에 따른 시계열 데이터의 특징 값을 추출하는 방법을 설명하기 위한 흐름도이다.
도 13은 본 발명의 다른 일 실시예에 따른 시계열 데이터의 특징 값을 추출하는 방법을 설명하기 위한 흐름도이다.
도 14는 본 발명의 일 실시예에 따른 시계열 데이터의 특징 값을 추출하는 장치를 설명하기 위한 블록도이다.
실시예들에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.
명세서 전체에서 기재된 "a, b, 및 c 중 적어도 하나"의 표현은, 'a 단독', 'b 단독', 'c 단독', 'a 및 b', 'a 및 c', 'b 및 c', 또는 'a, b, 및 c 모두'를 포괄할 수 있다.
명세서 전체에서 기재된 시계열 데이터는 일정한 시간 간격으로 배치된 데이터들의 수열로 정의될 수 있다. 따라서 시간상 순차적으로 관측된 값들의 집합도 시계열 데이터로 정의될 수 있다. 한편, 시계열 데이터는 시간에 의존성을 가지는 데이터로, 시간 t에 발생한 데이터가 시간 t-1의 데이터의 영향을 받는 것일 수 있다. 예를 들어, 시계열 데이터는 기온, 주가, 환율, 해수면 높이 관측 데이터를 포함하여, 다양한 센서로부터 수신될 수 있는 센서 데이터를 포함할 수 있다. 한편, 센서 데이터는 구체적으로, 두께 센서, 속도 센서, 가속도 센서, 진동 센서, 힘 센서, 압력 센서, 위치 센서, 플라즈마 강도 측정 센서, 온도 센서, pH 센서, 화학 조성 센서, 화학 농도 센서로부터 수신되는 데이터일 수 있으나, 이에 제한되지 않는다.
아래에서는 첨부한 도면을 참고하여 본 개시의 실시예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다.
이하에서는 도면을 참조하여 본 개시의 실시예들을 상세히 설명한다.
도 1은 본 발명의 실시예에 따른 시계열 데이터 및 시계열 데이터에 포함된 세그먼트를 설명하기 위한 도면이다.
본 발명의 일 실시예에 따른 시계열 데이터(100)는 일정한 값으로 유지되는 구간(A), 급격하게 하강하는 구간(B), 스파이크 구간(C) 및 급격하게 상승하는 구간(D) 등으로 구성될 수 있다. 따라서, 시계열 데이터에 포함된 각 구간의 특성을 고려하지 않고 시계열 데이터의 모든 구간에 대하여 일정한 항목의 특징 값을 추출한다면, 추출된 결과만 이용하여 시계열 데이터를 관리하는 것에 어려움이 있을 수 있다. 예를 들어, 도 1의 시계열 데이터(100)는 특정 공정 동안의 압력 센서로부터 수신된 센싱 값일 수 있다. 이때, 공정의 초기 단계에서는 고압이 일정하게 유지될 수 있고(도 1의 A 구간), 이후 공정이 진행됨에 따라, 급격하게 압력이 낮아지게 될 수 있다(도 1의 B 구간). 그런데, 도 1의 A 구간 및 B 구간에 대하여 각각의 시작 시각 정보 및 종료 시각 정보만 특징 값으로 추출되는 경우, 도 1의 A 구간은 추출된 정보만으로 복원이 가능하지만, B 구간은 기울기 정보가 없어 추출된 정보만으로는 복원이 어려울 수 있다.
또한, 시계열 데이터의 모든 구간에 대하여 일정 기준으로 이상 여부를 감지하는 경우, 이상 감지에 대한 오류율이 증가할 수 있다. 예를 들어, 도 1의 A 구간, 즉 고압이 일정하게 유지되는 초기 단계에서는 센싱 값이 ±5%를 넘어가면 비정상인 경우일 수 있다. 그러나, 압력이 급격하게 낮아지는 B 구간에서는 압력이 10% 이상 급격하게 낮아지더라도 공정이 정상적으로 진행되는 것일 수 있다. 따라서, 이러한 시계열 데이터(100)에 대하여, 일률적인 기준으로 비정상 구간을 판단하게 되면, 판단 오류율이 높아질 수 있다.
따라서, 본 개시의 일 실시예에 따른 방법은 시계열 데이터를 하나 이상의 세그먼트로 분할하고, 각 세그먼트마다 다른 특징 값을 추출할 수 있다. 예를 들어, 본 개시의 일 실시예에 따른 방법은 도 1의 시계열 데이터(100)가 수신되는 경우, 시계열 데이터(100)에 포함된 구간들을 일정한 값이 유지되는 상수형(constant) 세그먼트(A), 급격히 값이 감소하는 하강 경사형(down ramp) 세그먼트(B), 스파이크형(spike) 세그먼트(C) 등으로 분할할 수 있다. 이때, 상수형, 하강 경사형, 스파이크형은 시계열 데이터(100)에 대하여 기설정된 세그먼트의 유형일 수 있다. 본 개시의 일 실시예에 따른 방법의 기설정된 세그먼트 유형은 상수형, 하강 경사형, 스파이크형외에도 조각 상수형(piecewise-constant), 상승 경사형(up ramp), 정상 상태형(steady-state)을 더 포함할 수 있다. 또한, 상승 또는 하강 경사형은 볼록성을 고려하여, 상승 볼록 경사형 또는 하강 볼록 경사형, 상승 오목 경사형 또는 하강 오목 경사형 등으로 더 분류될 수 있다. 한편, 세그먼트 유형은 이에 제한되지 않고 시계열 데이터 및 시스템 구현 사항에 따라 달라질 수 있다.
본 개시의 일 실시예에 따른 방법은 시계열 데이터(100)의 세그먼트를 분할하고 난 후, 각 세그먼트 유형에 따라 각 세그먼트 유형과 매핑된 특징 그룹을 식별할 수 있다. 그리고 식별 결과에 기초하여, 각 세그먼트의 특징 값을 추출할 수 있다.
예를 들어, 상수형 세그먼트와 매핑된 특징 그룹은 시작 시각, 종료 시각 및 세그먼트 유지 시간으로 이루어질 수 있다. 한편, 스파이크형 세그먼트와 매핑된 특징 그룹은 첨도(kurtosis) 정보 및 최대값으로 이루어질 수 있다. 따라서, 상수형 세그먼트로부터는 시작 시각 및 종료 시각 정보를 추출하고, 스파이크형 세그먼트로부터는 첨도에 관한 정보 및 최대값 정보를 추출할 수 있다.
다시 말해, 본 개시의 일 실시예에 따른 방법은 각 세그먼트 유형에 따라 서로 다른 특징 값을 추출하기 때문에, 추출된 특징 값으로 시계열 데이터의 이상 여부를 감지할 때, 감지 정확도를 향상시킬 수 있다. 또한, 시계열 데이터 전체를 저장하고 관리하는 대신 각 세그먼트로부터 추출된 특징 값을 저장하고 관리하는 것이 가능함으로써, 시스템 효율성을 향상시킬 수 있는 효과가 있다.
도 2는 본 발명의 일 실시예에 따른 시계열 데이터의 세그먼트 분할 결과를 설명하기 위한 도면이다.
도 2를 참고하면, 본 개시의 방법은 서로 다른 유형의 시계열 데이터를 기설정된 세그먼트 유형(상수형, 스파이크형, 상승 경사형, 하강 경사형)에 따라, 복수의 세그먼트로 분할할 수 있다. 이때, 서로 다른 유형의 시계열 데이터의 세그먼트를 분할하는 판단기준을 서로 다를 수 있다.
예를 들어, 도 2의 (a)에 도시된 시계열 데이터는 특정 공정의 압력 센서로부터 수신된 시계열 데이터이고, 도 2의 (b)에 도시된 시계열 데이터는 특정 공정의 온도 센서로부터 수신된 시계열 데이터일 수 있다. 이때, 도 2의 (a)의 시계열 데이터에 포함된 상수형 세그먼트를 판단하는 기준과 도 2의 (b)의 시계열 데이터에 포함된 상수형 세그먼트를 판단하는 기준은 서로 다를 수 있다.
도 3은 본 발명의 일 실시예에 따라 세그먼트 유형 별 매핑될 수 있는 특징 그룹을 설명하기 위한 도면이다.
본 개시의 일 실시예에 따른 방법은 기설정된 세그먼트 유형과 매핑된 특징 그룹을 포함할 수 있다. 예를 들어, 상수형 세그먼트와 매핑된 특징 그룹은 세그먼트의 시작 시각, 세그먼트의 종료 시각 및 세그먼트 유지 시간일 수 있다. 따라서, 상수형 세그먼트의 경우, 세그먼트로부터 세그먼트의 시작 시각, 세그먼트의 종료 시각 및 세그먼트 유지 시간 중 적어도 하나를 특징 값으로 추출할 수 있다.
도 3을 참고하면, 정상 상태형의 세그먼트로부터는 최대값, 최소값, 평균, 표준편차, 시작 시각 및 종료 시각 정보 중 적어도 하나를 특징 값으로 추출할 수 있다. 한편, 스파이크형의 세그먼트로부터 추출될 수 있는 첨도 정보로서 스파이크형의 최대값, 세그먼트 유지 시간 등 스파이크 형태를 특정하기 위해 필요한 정보가 포함될 수 있다.
한편 각 세그먼트 유형마다 매핑되는 특징 그룹은 도 3의 기재에 제한되지 않는다. 다시 말해, 상수형 세그먼트여도 경우에 따라 특징 그룹에 최대값, 최소값 항목을 포함할 수 있다. 또한, 도 3에 기재되지 않은 항목이 각 세그먼트 유형의 특징 그룹에 포함될 수 있다.
도 4는 본 발명의 일 실시예에 따른 방법의 효과를 설명하기 위한 도면이다.
도 4의 제1 시계열 데이터와 제2 시계열 데이터는 동일한 유형의 시계열 데이터일 수 있다. 예를 들어, 도 4의 제1 시계열 데이터는 반도체 공정 상 챔버 내 제1 사이클의 펌프 강도 조절을 위한 밸브 위치에 관한 데이터이고, 도 4의 제2 시계열 데이터는 제2 사이클의 펌프 강도 조절을 위한 밸브 위치에 관한 데이터일 수 있다. 한편, 제1 시계열 데이터와 제2 시계열 데이터 간에는 시간 이동(time shift) 문제가 있을 수 있다. 예를 들어, 동일 공정에 대한 두 시계열 데이터이더라도 센서의 센싱하는 사이클에 따라, 대응되는 세그먼트의 위치가 달라질 수 있다.
따라서, 제1 시계열 데이터와 제2 시계열 데이터의 세그먼트를 단순히 시간 구간에 따라 분할하는 경우, 제1 시계열 데이터와 제2 시계열 데이터간 유사한 세그먼트를 비교하여 시계열 데이터의 이상 여부를 감지하는 것의 오류율이 증가할 수 있다.
한편, 본 개시의 방법은 각 세그먼트 유형에 따라, 세그먼트를 분할하고 각 세그먼트의 특징 값을 추출할 수 있다. 따라서, 도 4의 제1 시계열 데이터의 최소값(410)과 제2 시계열 데이터의 최소값(420)이 센싱된 시간이 상이하더라도 두 세그먼트를 동기화시켜 특징 값을 비교할 수 있으므로, 시계열 데이터의 이상 여부를 감지하는 정확도가 향상될 수 있다. 따라서, 시계열 데이터가 특정 공정의 환경에 대한 센싱 값인 경우, 세그먼트 분할 결과에 따라 시계열 데이터를 공정 별로 분할할 수 있고, 공정 별 분할 결과는 시간 이동 문제에 대해 강건(robust)할 수 있다. 다시 말해, 시간 이동 문제가 있더라도 공정 별 분할 결과에 오류는 적을 수 있다.
도 5는 본 발명의 다른 일 실시예에 따른 방법의 효과를 설명하기 위한 도면이다.
일 실시예에 따른 시계열 데이터의 특징 값을 추출하는 장치는 시계열 데이터 상의 동일한 유형의 세그먼트 중에 다른 특징 값을 갖는 세그먼트를 감지하고, 감지 결과에 기초하여 시계열 데이터의 이상 여부를 판단할 수 있다.
도 5의 (b)는 도 5의 (a)의 제1 구간(510)에 포함된 일 구간의 세그먼트 분할 결과를 도시한 것이고, 도 5의 (c)는 도 5의 (a)의 제2 구간(520)에 포함된 일 구간의 세그먼트 분할 결과를 도시한 것이다. 도 5의 (b) 및 (c)를 참고하면, 세그먼트 분할 결과가 상이한 것을 확인할 수 있다.
또한, 도 5의 (b) 및 (c)는 모두 하강 경사형 세그먼트, 상승 경사형 세그먼트와 상수형 세그먼트를 모두 포함한다. 이 중 하강 경사형 세그먼트를 기준으로 비교해보자면, 도 5의 (b) 및 (c)가 하강 경사형 세그먼트(530, 540)를 모두 포함하지만, 도 5의 (b)에 포함된 하강 경사형 세그먼트(530)의 특징 값과 도 5의 (c)에 포함된 하강 경사형 세그먼트(540)의 특징 값은 서로 상이하다. 구체적으로, 도 5의 (b)에 포함된 하강 경사형 세그먼트(530)의 기울기, 최대값 및 최소값 등은 도 5의 (c)에 포함된 하강 경사형 세그먼트(540)의 기울기, 최대값 및 최소값 등과 상이하다. 따라서, 본 개시의 방법은 분할된 세그먼트로부터 추출된 특징 값에 기초하여, 시계열 데이터의 일 구간에 이상이 있음을 감지할 수 있다.
한편, 시계열 데이터의 이상을 감지하기 위하여 본 개시의 일 실시예에 따른 방법을 통해 추출된 특징 값은 기계학습 알고리즘에 입력될 수 있다. 기계학습 알고리즘은 입력된 데이터를 통해 훈련될 수 있고, 훈련된 이후 입력되는 시계열 데이터의 이상 여부를 감지할 수 있다.
도 6 및 도 7은 본 발명의 일 실시예에 따른 시계열 데이터를 압축하는 방법을 설명하기 위한 도면이다.
일 실시예에 따른 시계열 데이터의 특징 값을 추출하는 방법은 시계열 데이터를 압축할 수 있다. 도 6의 (a)는 시계열 데이터를 나타내고, 도 6의 (b)는 (a)의 시계열 데이터를 압축한 결과를 나타낸다.
한편, 시계열 데이터에 포함된 하강 경사형 또는 상승 경사형 유형의 세그먼트는 계단식 경사를 포함할 수 있다. 여기서 계단식 경사는 도 6의 제1 구간(610)과 같이 복수의 계단으로 구성된 경사 구간을 의미한다. 예를 들어, 센싱 주기가 길어지는 경우, 시계열 데이터는 계단식 구성이 더 명확하게 나타날 수 있다.
그런데 시계열 데이터에 계단식 경사가 포함되어 있는 경우, 세그먼트 유형을 결정하는 것에 오류가 발생할 수 있다. 예를 들어, 도 6의 (a)의 제1 구간(610)은 그 전체가 온전히 하강 경사형의 세그먼트로 식별되어야 하지만, 제1 구간(610) 안에 포함된 제2 구간(620)에서 일정한 값을 비교적 길게 유지하기 때문에, 제2 구간(620)이 상수형 세그먼트로 분할될 수 있다.
따라서 이러한 문제를 해결하기 위해 본 개시의 방법은 시계열 데이터를 압축한 후, 압축된 데이터에 기초하여 세그먼트를 분할할 수 있다. 도 6의 (b)를 참고하면, 압축된 데이터에 포함된 상승 경사형 및 하강 경사형 세그먼트는 계단식 경사 대신 곡선 형태의 경사로 구성된 것을 확인할 수 있다. 따라서, 압축된 데이터 상에서 세그먼트를 분할하는 것은 더 용이할 수 있고, 세그먼트 분할에 대한 정확도가 향상될 수 있다.
한편, 본 개시의 방법은 시계열 데이터의 손실율을 낮추기 위하여, 시계열 데이터에서 동일한 값을 갖는 제1 시간 구간의 길이가 제1 임계값 미만인 경우, 제1 시간 구간의 데이터를 제1 시간 구간에 포함된 제1 시점의 데이터로 압축할 수 있다. 이러한 방식으로 시계열 데이터를 압축하게 되면, 데이터의 양자화(quantization)로 인해 일 구간이 계단 형태가 된 시계열 데이터를 경사를 갖는 시계열 데이터로 변형시킬 수 있다.
도 7을 참고하면, 시계열 데이터는 급격하게 변하는 시점(t1 내지 t7)의 값으로 압축될 수 있다.
압축된 시계열 데이터는 압축률에 따라 압축 이전의 시계열 데이터에 비해 더 짧은 시간의 데이터로 표현될 수 있다. 그러나 압축 이전의 시계열 데이터와 비교를 위해, 도 7의 압축된 시계열 데이터는 x 축 상에서 압축률에 따라 확장된 형태로 표현된 것이다. 이하 도 7의 압축된 시계열 데이터는 확장된 형태인 것을 전제로 설명하기로 한다.
도 7의 일 구간(t1~t2 구간)의 시계열 데이터는 t1의 데이터로 압축될 수 있다. 한편, 시계열 데이터의 압축은 시계열 데이터가 급격하게 변하는 시점(t1 내지 t7) 대신 각 시점(t1 내지 t7) 사이의 중간 시점 또는 다른 시점에서 수행될 수 있다. 예를 들어, 도 7의 일 구간(t1~t2 구간)의 시계열 데이터는 t1 와 t2의 중간 값 또는 t2의 데이터로 압축될 수 있다.
한편, 압축된 데이터에 기초하여 세그먼트가 분할된 경우, 본 개시의 일 실시예에 따른 방법은 세그먼트 양 끝단의 잡음에 대한 후처리를 진행할 수 있다. 예를 들어, 압축된 데이터 상에서 제1 세그먼트로 분할된 일부 구간을 복원한 결과, 제1 세그먼트보다 앞서 위치한 세그먼트로 결정되는 것이 적절한 경우, 상기 구간은 제1 세그먼트 이전의 세그먼트로 재조정될 수 있다. 예를 들어, 복원된 시계열 데이터의 일 영역이 상수형 세그먼트로 결정되었어야 했는데, 상수형 세그먼트 다음의 세그먼트인 상승 경사형 세그먼트로 분류되었던 경우, 본 개시의 방법은 후처리를 통해 해당 일 영역을 상수형 세그먼트로 재조정할 수 있다.
이때, 본 개시의 일 실시예에 따른 방법은 복원된 시계열 데이터의 기울기에 기초하여, 세그먼트를 후처리할 수 있으나 후처리의 판단기준은 기울기로 제한되지 않는다.
또한, 본 개시의 방법은 추후 압축된 데이터의 복원을 위해, 시점(t1 내지 t7) 정보, 각 시점의 값 정보 및 각 시점(t1 내지 t7) 간의 간격 정보를 저장할 수 있다. 따라서, 압축된 데이터와 저장된 정보에 기초하여 데이터 손실이 없거나 최소한으로 하여 시계열 데이터를 복원할 수 있다.
도 8 내지 도 10은 일 실시예에 따라 시계열 데이터로부터 추출된 특징 값으로 시계열 데이터의 이상 여부를 감지한 결과를 설명하기 위한 도면이다.
한편, 본 개시의 일 실시예에 따른 방법은 반도체, 디스플레이, 태양광 발전 등 하이테크 제조업의 복잡한 공정 상에서 생성될 수 있는 시계열 데이터의 분석을 위해 사용될 수 있다.
구체적으로 반도체 공정은 전공정과 후공정을 포함한다. 전공정은 웨이퍼에 회로를 새겨 칩을 만드는 과정을 의미할 수 있고, 후공정은 칩을 잘라 패키징하고 테스트하는 과정을 의미할 수 있다. 이중 전 공정은 산화, 노광, 식각, 세정, 평탄, 이온 주입, 증착, 열처리 등의 공정을 포함할 수 있다.
한편, 종래에는 공정상의 이상을 감지하기 위해 사용할 수 있는 시계열 데이터의 수가 제한적이었기 때문에, 이상을 감지하는 정확도가 낮았다. 예를 들어, 온도 데이터에만 기초하여 웨이퍼의 휜 정도를 판단할 수 있었으므로, 공정의 이상을 감지하는 정확도가 낮았다.
그러나 기술 발전으로 인해 공정 전체가 미세화되고, 각 공정마다 이상을 감지하기 위해 수집되는 시계열 데이터가 증가함에 따라, 세밀화된 공정을 모니터링하면서 여러 시계열 데이터에 기초하여 이상을 감지하는 방법이 요구되었다.
한편, 본 개시의 일 실시예에 따른 방법을 이용하여, 예컨대 반도체 공정에 들어간 웨이퍼의 휨 현상을 감지하거나, 반도체 공정용 특수가스의 유출 여부를 감지하거나, 웨이퍼의 박막을 만드는 화학기상증착법 또는 원자층식각 등에 쓰이는 플라스마를 감지할 수 있으며, 이에 제한되는 것은 아니고 시계열 데이터에 기초하여 이상을 감지하는 모든 방법에 적용될 수 있다. 본 개시의 일 실시예에 따른 방법을 이용하는 경우, 이상 감지를 위해 기계학습 알고리즘 및 여러 시계열 데이터를 이용할 수 있으므로, 이상 감지 정확도를 향상시킬 수 있다.
또한, 반도체 공정 중 진공 챔버 내에서 생산용 특수 가스의 누출을 감지하지 위해, 본 개시의 일 실시예에 따른 방법은 밸브 위치에 관한 시계열 데이터와 함께 다양한 센서의 시계열 데이터를 이용하기 때문에, 가스 누출을 감지하는 정확도를 향상시킬 수 있다. 이외에도 본 개시의 일 실시예에 따른 방법은 반도체 공정 중 파티클(분진, 미세입자)을 감지하는 데에도 적용될 수 있다.
도 8은 일 실시예에 따라 반도체 공정 상에서 센싱된 펌프 강도 조절을 위한 밸브 위치에 관한 시계열 데이터를 나타낸 그래프이다.
반도체 공정 중 펌프를 이용하여 챔버 내 압력을 낮추는 공정이 포함될 수 있다. 이때, 챔버 내부를 진공 상태로 만들어야 하는데, 고무 밸브가 터지거나 유리관이 터지는 등의 요인으로 인해, 챔버 내부가 진공상태가 되지 못하는 경우가 발생할 수 있다. 본 개시의 일 실시예에 따른 방법은 펌프 강도 조절을 위한 밸브 위치에 관한 시계열 데이터에 기초하여, 챔버 내부가 진공상태가 되지 못하는 비정상 공정을 감지할 수 있다.
도 8을 참고하면, 시계열 데이터(810)는 제1 세그먼트 내지 제8 세그먼트로 분할될 수 있다. 구체적으로, 제1 세그먼트는 하강 경사형의 세그먼트이고, 제2 세그먼트는 상승 경사형의 세그먼트일 수 있다. 그리고, 제3 세그먼트는 정상 상태형 세그먼트 일 수 있고, 제8 세그먼트는 상수형 세그먼트일 수 있다.
한편, 본 개시의 일 실시예에 따른 방법은 각 세그먼트 마다 이상을 판단하는 기준은 서로 다를 수 있다. 도 8을 참고하면, 본 개시의 일 실시예에 따른 방법은 어느 시점에 획득된 시계열 데이터의 제2 세그먼트의 최소값 내지 최대값 구간(즉, 도 8의 ①~② 구간에 대응하는 세그먼트의"range"특징값)이 임계값보다 큰 경우, 해당 시계열 데이터에 관한 제품 또는 공정 상 불량이 발생할 확률이 60.3%에 달하는 것을 확인할 수 있다. 또한, 어느 시점에 획득된 시계열 데이터의 제3 세그먼트는 도 8에 도시되지 않았지만 미세하게 진동하는 것일 수 있어, 변동 폭에 관한 표준 편차가 존재할 수 있다. 따라서, 제3 세그먼트의 표준 편차(즉, 도 8의 ②~③ 구간에 대응하는 세그먼트의 "std"특징값)가 임계값보다 큰 경우, 해당 시계열 데이터에 관한 제품 또는 공정 상 불량이 발생할 확률은 85.2%에 달하는 것을 확인할 수 있다. 따라서, 이러한 통계 정보에 기초하여, 공정 상의 이상 유무를 더욱 정확하게 감지할 수 있다.
도 9는 반도체 공정 상에서 센싱된 소스 전원에 관한 시계열 데이터를 나타낸 그래프이다.
도 9의 (a)는 반도체 공정 상에서 소스 전원에 관한 시계열 데이터를 나타낸 그래프이고, 도 9의 (b)는 정상 또는 비정상으로 감지된 시계열 데이터의 분포를 도 9의 (a)의 시계열 데이터 중 제1 세그먼트(910)의 최소값에 따라 나타낸 그래프이다.
예를 들어, 반도체 공정 상에서 소스 전원에 관한 시계열 데이터가 100번 수집되는 경우, 100개의 시계열 데이터에서 각각 제1 세그먼트를 추출할 수 있다. 이후 추출된 제1 세그먼트 100개의 최소값을 각각 도출할 수 있다. 도 9의 (a)에 도시된 제1 세그먼트(910)가 일정한 값을 갖는 것처럼 도시되었으나, 확대하면 서로 다른 데이터가 나열된 형태이므로, 추출된 제1 세그먼트 100개의 최소값은 도 9의 (b)에 도시된 바와 같이, 일정 범위(약 1980 부터 2005 까지의 범위) 내에 분포할 수 있다.
한편, 도 9의 (b)에 도시된 막대 그래프는 실제 실험 결과에 기초한 것으로써, x 값은 각 시계열 데이터의 제1 세그먼트(910)의 최소값을, y 값은 해당 최소값이 발생한 상대적인 비율을 나타낸다. 예를 들어, 수집된 시계열 데이터 100개 중에서 정상 상태의 공정에 관한 데이터로 결정된 시계열 데이터가 30개인 경우, 30개의 시계열 데이터에서 각각 추출된 제1 세그먼트의 최소값에 따라 제1 막대 그래프(930)를 도출할 수 있다. 또한, 수집된 시계열 데이터 100개 중에서 비정상 상태의 공정에 관한 데이터로 결정된 시계열 데이터가 70개인 경우, 70개의 시계열 데이터에서 각각 추출된 제1 세그먼트의 최소값에 따라 제2 막대 그래프(940)를 도출할 수 있다. 한편, 도 9의 (b)에 도시된 y 축 값은 제1 곡선 그래프(950) 및 제2 곡선 그래프(960)에 관한 것이며, 제1 막대 그래프(930) 및 제2 막대 그래프(940)의 y 값 수치는 도 9의 (b)에 명시되지 않았다. 예컨대 100개의 수집된 시계열 데이터를 이용하여, 제1 막대 그래프(930)와 제2 막대 그래프(940)를 도출한 경우, 제2 막대 그래프(940) 중 제일 큰 막대의 y 값은 예컨대 40개가 되고 제2 막대 그래프(940) 중 제일 큰 막대의 y값은 8개가 될 수 있다.
한편, 제1 곡선 그래프(950)는 제1 막대 그래프(930)의 x 축에 따른 확률밀도함수를 나타낸 것이고, 제2 곡선 그래프(960)는 제2 막대 그래프(940)의 x 축에 따른 확률밀도함수를 나타낸 것이다. 따라서, 두 곡선 그래프의 적분 값은 각각 1이 된다. 예컨대, 제1 곡선 그래프(950)의 모든 x 값은 1983~2003 내에 포함될 것이고, 제1 곡선 그래프(950)의 모든 x 값에 대한 y 값을 더하면 그 합은 1이 된다. 또한, 제2 곡선 그래프(960)의 모든 x 값은 1993~2003 내에 포함될 것이고, 제2 곡선 그래프(960)의 모든 x 값에 대한 y 값을 더하면 그 합은 1이 된다.
도 9의 (b)에 도시된 제1 막대 그래프(930), 제2 막대 그래프(940), 제1 곡선 그래프(950) 및 제2 곡선 그래프(960)는 설명의 편의를 위해 중첩하여 도시된 것으로서, 서로 다른 그래프가 중첩되어 도시되었더라도 각각의 그래프 별로 분석되어야 한다.
한편, 본 개시의 일 실시예에 따른 방법을 통해 획득한 특징 값을 이용하여, 공정상 발생될 수 있는 이상 상태와 시계열 데이터 간의 상관관계를 분석할 수 있다. 예를 들어, 100개의 수집된 시계열 데이터를 정상 상태에 관한 데이터와 비정상 상태에 관한 데이터로 분류하기 위해서 여러 변수에 기초하여 복잡한 판단 기준을 적용하거나, 연산 시간이 오래 걸리는 알고리즘이 사용되어야 할 수 있다. 그러나, 도 9의 (b)를 참고하면, 도 9의 (a)의 제1 세그먼트(910)의 최소값이 제1 지점(920) 이상이면 비정상 상태에 관한 데이터가 감지되기 시작하는 것을 확인할 수 있다. 따라서, 본 개시의 방법을 통해 복잡한 판단 기준에 따라 시계열 데이터의 정상 상태 여부를 판단하는 것 대신, 제1 세그먼트의 최소값에 기초하여 시계열 데이터의 정상 상태 여부를 판단할 수 있다. 이러한 경우, 연산량 및 연산 시간을 감소시키는 효과가 있다.
구체적인 실험 결과에 따르면, 도 9의 (a)의 제1 세그먼트(910)의 최소값이 제1 지점(920) 미만이면, 전체 웨이퍼 중 파티클이 발생하지 않은 웨이퍼의 비율이 99.5% 였다. 그리고, 제1 세그먼트(910)의 최소값이 제1 지점(920) 이상이면, 전체 웨이퍼 중 5개 이상의 파티클이 발생한 웨이퍼의 비율이 21.5% 였다. 따라서, 본 개시의 일 실시예에 따른 방법을 이용하면 소스 전원에 관한 시계열 데이터의 일부 구간의 최소값에 기초하여, 5개 이상의 파티클이 발생할 확률을 예측할 수 있다.
도 10은 본 개시의 일 실시예에 따른 방법에 관한 실험 결과를 나타낸 그래프이다.
구체적으로, 도 10은 반도체의 양산성 검증을 위해 수집된 마라톤 데이터를 나타낸 그래프이다. 마라톤 데이터란 양상성 검증을 위해 수행되는 마라톤 테스트 중에 발생되는 데이터를 의미한다. 전체 3131 개의 웨이퍼 중 파티클 검사가 수행된 웨이퍼는 404개이며, 이 중에서 파티클이 5개 이상 발생한 웨이퍼는 37개, 그렇지 않은 웨이퍼는 367개였다. 일반적으로, 파티클의 수가 많을수록 공정 상 이상이 있는 경우가 많아진다. 도 10은 파티클 검사가 수행된 404개 시계열 데이터에 한하여, 파티클의 수에 따라 감지되거나 감지되지 않은 비정상 상태의 비율을 설명하기 위한 도면이다.
한편, 도 10에 도시된 제1 막대 그래프(1030)는 감지되지 않은 비정상 상태에 관한 막대 그래프이고, 제2 막대 그래프(1040)는 감지된 비정상 상태에 관한 막대 그래프이다. 제1 막대 그래프(1030) 및 제2 막대 그래프(1040)는 실제 실험 결과에 기초한 것으로써, x 값은 파티클 수를, y 값은 해당 파티클의 수가 감지된 시계열 데이터 중, 감지되거나 감지되지 않은 비정상 상태의 데이터의 상대적인 발생 비율을 나타낸다.
한편, 제1 곡선 그래프(1010)는 제1 막대 그래프(1030)의 x 축에 따른 확률밀도함수를 나타낸 것이고, 제2 곡선 그래프(1020)는 제2 막대 그래프(1040)의 x 축에 따른 확률밀도함수를 나타낸 것이다. 따라서, 두 곡선 그래프의 적분 값은 각각 1이 된다. 예컨대, 제1 곡선 그래프(1010)의 모든 x 값은 3~18 내에 포함될 것이고, 제1 곡선 그래프(1010)의 모든 x 값에 대한 y 값을 더하면 그 합은 1이 된다. 또한, 제2 곡선 그래프(1020)의 모든 x 값은 1~30 내에 포함될 것이고, 제2 곡선 그래프(1020)의 모든 x 값에 대한 y 값을 더하면 그 합은 1이 된다.한편, 제1 막대 그래프(1030) 및 제2 막대 그래프(1040)의 y 값 수치는 도 10에 명시되지 않으며, 도 10에 도시된 y 축 값은 제1 곡선 그래프(1010) 및 제2 곡선 그래프(1020)에 관한 것이다. 예를 들어, 제1 막대 그래프(1030)를 참고하면, 구체적으로 막대 그래프의 y 값(즉, 감지되지 않은 비정상의 수)가 명시되지 않았지만, 파티클이 7개일 때 감지되지 않은 비정상의 비율보다 파티클이 8개일 때 감지되지 않은 비정상의 비율이 더 적은 것을 확인할 수 있다.
한편, 도 10에 도시된 제1 막대 그래프(1030), 제2 막대 그래프(1040), 제1 곡선 그래프(1010) 및 제2 곡선 그래프(1020)는 설명의 편의를 위해 중첩하여 도시된 것이다. 따라서, 서로 다른 그래프가 중첩되어 도시되었더라도 각각의 그래프 별로 분석되어야 한다.
한편, 본 개시의 일 실시예에 따른 방법은 45개의 서로 다른 유형의 시계열 데이터에 기초하여 기계학습을 수행함으로써 공정 상의 이상을 감지할 수 있다. 실험 결과, 본 개시의 일 실시예에 따른 방법에 따라 공정 상의 이상을 감지해보았더니(즉, 직접적인 파티클 검사 없이, 본 발명의 알고리즘에 따라 파티클이 발생한 웨이퍼를 감지해 보았더니), 5개 이상의 파티클이 발생한 37개의 웨이퍼 중에서 24개 웨이퍼를 감지할 수 있었다. 도 10을 참고하면, 본 개시의 일 실시예에 따른 방법은 8개 이상 파티클이 발생한 웨이퍼에 대한 감지 성능이 8개 미만의 파티클이 발생한 웨이퍼에 대한 감지 성능에 비해 상대적으로 높음을 확인할 수 있다.
다시 말해, 파티클이 8개 이상인 비정상 정도가 큰 웨이퍼는 매우 높은 확률로 감지를 할 수 있지만 8개 미만의 파티클에 대해서는 감지율이 감소하는 것을 확인할 수 있다. 한편, 실제 이상 감지 도중에는 구체적으로 몇 개의 파티클이 발생할 때 부터 이를 비정상으로 판단해야 하는지 그 기준이 모호할 수 있다. 이러한 경우, 도 10의 확률밀도함수를 통해 구체적으로 8개의 파티클이 존재할 때 해당 웨이퍼가 비정상임을 판단할 수 있도록 결정할 수 있다.
도 11은 본 개시의 일 실시예에 따라 두 유형의 시계열 데이터를 세그먼트 분할한 결과를 나타낸다.
도 11를 참고하면, 시계열 데이터의 대부분의 구간은 일정한 값으로 유지되며, 일부 구간(1120, 1130)에서만 제1 시계열 데이터와 제2 시계열 데이터가 서로 반대의 양상으로 변하는 것을 확인할 수 있다. 이러한 경우, 값이 반대로 움직이는 구간이 실제로 데이터 분석을 위해 필요한 구간일 가능성이 높기 때문에, 중요 구간으로 관리될 필요가 있을 수 있다.
이에 따라, 본 개시의 일 실시예에 따른 방법은 시계열 데이터를 하나 이상의 세그먼트로 분할한 후, 일부 세그먼트에 대해 다른 시계열 데이터의 세그먼트와의 상관관계를 계산할 수 있다. 예를 들어, 도 11을 참고하면, 본 개시의 일 실시예에 따른 방법은 제1 시계열 데이터 및 제2 시계열 데이터의 상관관계를 계산하는 대신, 제1 구간(1120)의 제1 시계열 데이터의 제1 세그먼트와 제2 시계열 데이터의 제2 세그먼트 간의 상관관계를 손쉽게 계산할 수 있다. 이러한 경우, 구간(1110)에서 0의 상관관계를 갖기 때문에 제1 시계열 데이터과 제2 시계열 데이터의 상관관계를 직접 계산하기가 다소 복잡해지는 점이 있는 반면, 세그먼트들의 상관관계를 상대적으로 간단히 계산함으로써 제1 시계열 데이터 및 제2 시계열 데이터의 상관관계를 효율적으로 계산할 수 있는 효과가 있다.
도 12는 일 실시예에 따른 시계열 데이터의 특징 값을 추출하는 방법을 설명하기 위한 흐름도이다.
단계 S1210에서, 일 실시예에 따른 방법은 시계열 데이터를 수신할 수 있다. 여기서, 시계열 데이터는 특정 공정 상에서 발생될 수 있는 센서의 센싱 데이터일 수 있으며, 예를 들어, 반도체 공정 상에서의 센싱 데이터일 수 있으나, 이에 제한되지 않는다.
단계 S1220에서, 일 실시예에 따른 방법은 기설정된 세그먼트 유형에 따라, 시계열 데이터를 하나 이상의 세그먼트로 분할할 수 있다. 여기서, 기설정된 세그먼트 유형은 상수형, 스파이크형, 조각 상수형, 정상 상태형, 상승 경사형 및 하강 경사형 중 적어도 하나를 포함할 수 있다.
한편, 단계 S1220은 시계열 데이터에서 동일한 값을 갖는 제1 시간 구간의 길이가 제1 임계값 미만인 경우, 제1 시간 구간의 데이터를 제1 시간 구간에 포함된 제1 시점의 데이터로 압축하는 단계를 포함할 수 있다.
또한, 단계 S1220은 압축된 데이터에서, 제1 시점을 포함하는 제2 시간 구간의 기울기에 기초하여, 제2 시간 구간을 기설정된 세그먼트 유형 중 하나의 세그먼트로 결정하는 단계를 더 포함할 수 있다. 이때, 단계 S1220은 제1 시점에 관한 정보 및 제1 시간 구간의 길이 정보 중 적어도 하나에 기초하여, 압축된 데이터를 복원하는 단계를 더 포함할 수 있고, 여기서 복원된 데이터에 포함된 제2 세그먼트는 압축된 데이터의 제2 시간 구간과 대응되는 것일 수 있다.
한편, 단계 S1220은 제2 세그먼트의 기울기에 기초하여, 제2 세그먼트의 구간을 조정는 단계를 더 포함할 수 있다.
그리고, 단계 S1220은 분할된 세그먼트의 수가 제2 임계값 미만인 경우, 압축된 데이터에 포함된 하나 이상의 세그먼트의 압축 비율을 조정하는 단계를 더 포함할 수 있다.
단계 S1230에서, 일 실시예에 따른 방법은 하나 이상의 세그먼트 중 제1 세그먼트의 세그먼트 유형과 매핑된 제1 특징 그룹을 식별할 수 있다.
단계 S1240에서, 일 실시예에 따른 방법은 제1 세그먼트로부터 제1 특징 그룹에 포함된 적어도 한 항목의 값을 특징 값으로 추출할 수 있다.
한편, 제1 특징 그룹에 포함된 항목은 세그먼트의 기울기, 시작 시점, 종료 시점, 길이, 표준편차, 최대값, 최소값, 볼록성, 잔차, 첨도, 왜도, 진폭, 진동수 중 적어도 하나를 포함할 수 있다.
또한 본 개시의 방법은, 추출된 특징 값에 기초하여, 시계열 데이터의 이상 여부를 감지하는 단계를 더 포함할 수 있다. 이때, 시계열 데이터의 이상 여부를 감지하는 단계는 추출된 특징 값 및 시계열 데이터와 상이한 시계열 데이터로부터 추출된 특징 값 간의 상관관계에 기초하여, 시계열 데이터의 이상 여부를 감지하는 단계를 포함할 수 있다.
한편, 세그먼트 유형 및 세그먼트 유형의 판단 기준은 시계열 데이터의 유형에 따라 결정되는 것일 수 있다.
도 13은 다른 일 실시예에 따른 시계열 데이터의 특징 값을 추출하는 방법을 설명하기 위한 흐름도이다.
단계 S1310에서, 일 실시예에 따른 방법은 수신된 시계열 데이터에 포함된 제1 구간이 상수형 세그먼트 또는 조각 상수형 세그먼트인지 결정할 수 있다. 예를 들어, 본 개시의 방법은 시계열 데이터에 포함된 일 구간이 전부 동일한 값을 갖거나 고유한 값이 5 개 이하인 경우, 해당 구간을 상수형 또는 조각 상수형의 세그먼트로 분할할 수 있다. 한편, 상수형 또는 조각 상수형의 세그먼트 판단 기준은 이에 제한되지 않으며, 시계열 데이터 및 시스템 구현사항에 따라 달라질 수 있음은 해당 기술분야의 통상의 기술자에게 자명하다.
만약, 단계 S1310에서 시계열 데이터에 포함된 제1 구간이 상수형 세그먼트 또는 조각 상수형 세그먼트이면, 본 개시의 방법은 도 12의 단계 S1230을 수행할 수 있고, 그렇지 않으면 단계 S1320을 수행할 수 있다.
단계 S1320에서, 일 실시예에 따른 방법은 시계열 데이터를 압축할 수 있다. 여기서, 시계열 데이터를 압축하는 방법은 도 6 및 도 7를 이용하여 설명한 방법과 동일할 수 있다.
단계 S1330에서, 일 실시예에 따른 방법은 압축된 시계열 데이터를 이용하여 세그먼트를 식별할 수 있다. 다시 말해, 단계 S1330에서 압축된 시계열 데이터의 일부 구간이 기설정된 세그먼트 유형인 스파이크형, 정상 상태형, 상승 경사형 및 하강 경사형 중 하나인지 결정할 수 있다. 상수형 및 조각 상수형 세그먼트의 경우, 단계 S1310에서 결정되었으므로, 상수형 및 조각 상수형 세그먼트외 다른 유형의 세그먼트들이 단계 S1330에서 식별될 수 있다.
한편, 도 13에서는 상수형 및 조각 상수형 세그먼트는 시계열 데이터를 압축하기 이전에 결정되는 것으로 설명되었으나, 단계 S1310가 생략되고 단계 S1330에서 압축된 시계열 데이터를 이용하여 상수형 및 조각 상수형 세그먼트를 식별할 수 있음은 해당 기술분야의 통상의 기술자에게 자명한 사항이다.
단계 S1340에서, 일 실시예에 따른 방법은 압축된 시계열 데이터를 복원할 수 있다. 구체적으로, 일 실시예에 따른 방법은 시계열 데이터가 압축될 때 저장된 압축된 구간의 시작 시각 정보, 종료 시각 정보 및 값 정보에 기초하여, 압축된 시계열 데이터를 복원할 수 있다. 따라서, 보간법(interpolation)에 기초하여 압축된 시계열 데이터를 복원하는 경우보다 데이터 손실율이 감소될 수 있다.
도 14는 일 실시예에 따른 시계열 데이터의 특징 값을 추출하는 장치를 설명하기 위한 블록도이다.
시계열 데이터의 특징 값 추출 장치(1400)는 일 실시예에 따라, 메모리(memory)(1410) 및 프로세서(processor)(1420)를 포함할 수 있다. 도 14에 도시된 시계열 데이터의 특징 값 추출 장치(1400)는 본 실시예와 관련된 구성요소들만이 도시되어 있다. 따라서, 도 14에 도시된 구성요소들 외에 다른 범용적인 구성요소들이 더 포함될 수 있음을 본 실시예와 관련된 기술분야에서 통상의 지식을 가진 자라면 이해할 수 있다.
메모리(1410)는 시계열 데이터의 특징 값 추출 장치(1400) 내에서 처리되는 각종 데이터들을 저장하는 하드웨어로서, 예를 들어, 메모리(1410)는 시계열 데이터의 특징 값 추출 장치(1400)에서 처리된 데이터들 및 처리될 데이터들을 저장할 수 있다. 메모리(1410)는 프로세서(1420)의 동작을 위한 적어도 하나의 명령어(instruction)를 저장할 수 있다. 또한, 메모리(1410)는 시계열 데이터의 특징 값 추출 장치(1400)에 의해 구동될 프로그램 또는 애플리케이션 등을 저장할 수 있다. 메모리(1410)는 DRAM(dynamic random access memory), SRAM(static random access memory) 등과 같은 RAM(random access memory), ROM(read-only memory), EEPROM(electrically erasable programmable read-only memory), CD-ROM, 블루레이 또는 다른 광학 디스크 스토리지, HDD(hard disk drive), SSD(solid state drive), 또는 플래시 메모리를 포함할 수 있다.
프로세서(1420)는 시계열 데이터의 특징 값 추출 장치(1400)의 전반의 동작을 제어하고 데이터 및 신호를 처리할 수 있다. 프로세서(1420)는 메모리(1410)에 저장된 적어도 하나의 명령어 또는 적어도 하나의 프로그램을 실행함으로써, 시계열 데이터의 특징 값 추출 장치(1400)를 전반적으로 제어할 수 있다. 프로세서(1420)는 CPU(central processing unit), GPU(graphics processing unit), AP(application processor) 등으로 구현될 수 있으나, 이에 제한되지 않는다.
프로세서(1420)는 시계열 데이터를 수신하고, 기설정된 세그먼트 유형에 따라, 시계열 데이터를 하나 이상의 세그먼트로 분할하고, 하나 이상의 세그먼트 중 제1 세그먼트의 세그먼트 유형과 매핑된 제1 특징 그룹을 식별하고, 제1 세그먼트로부터 제1 특징 그룹에 포함된 적어도 한 항목의 값을 특징 값으로 추출할 수 있다.
한편, 프로세서(1420)는 시계열 데이터를 하나 이상의 세그먼트로 분할할 때, 시계열 데이터에서 동일한 값을 갖는 제1 시간 구간의 길이가 제1 임계값 미만인 경우, 제1 시간 구간의 데이터를 제1 시간 구간에 포함된 제1 시점의 데이터로 압축할 수 있다. 또한, 프로세서(1420)는 압축된 데이터에서, 제1 시점을 포함하는 제2 시간 구간의 기울기에 기초하여, 제2 시간 구간을 기설정된 세그먼트 유형 중 하나의 세그먼트로 결정할 수 있다.
이후 프로세서(1420)는 제1 시점에 관한 정보 및 상기 제1 시간 구간의 길이 정보 중 적어도 하나에 기초하여, 압축된 데이터를 복원할 수 있다. 여기서 복원된 데이터에 포함된 제2 세그먼트는 압축된 데이터의 제2 시간 구간과 대응되는 것일 수 있다. 또한, 프로세서(1420)는 제2 세그먼트의 기울기에 기초하여, 제2 세그먼트의 구간을 조정할 수 있다.
한편, 프로세서(1420)는 분할된 세그먼트의 수가 제2 임계값 미만인 경우, 압축된 데이터에 포함된 하나 이상의 세그먼트의 압축 비율을 조정할 수 있다.
한편, 제1 특징 그룹에 포함된 항목은 세그먼트의 기울기, 시작 시점, 종료 시점, 길이, 표준편차, 최대값, 최소값, 볼록성, 잔차, 첨도, 왜도, 진폭, 진동수 중 적어도 하나를 포함할 수 있다.
그리고 프로세서(1420)는 추출된 특징 값에 기초하여, 시계열 데이터의 이상 여부를 감지할 수 있다. 이를 위해, 프로세서(1420)는 기계학습 알고리즘을 이용할 수 있다. 나아가, 프로세서(1420)는 RNN 및 LSTM 딥러닝 기술을 활용하여 추출된 특징 값에 기초하여 미래 시계열 데이터를 예측할 수 있다.
또한, 프로세서(1420)는 추출된 특징 값 및 시계열 데이터와 상이한 시계열 데이터로부터 추출된 특징 값 간의 상관관계에 기초하여, 시계열 데이터의 이상 여부를 감지할 수 있다.
한편, 기설정된 세그먼트 유형은 상수형, 스파이크형, 조각 상수형, 정상 상태형, 상승 경사형 및 하강 경사형 중 적어도 하나를 포함할 수 있다.
그리고 세그먼트 유형 및 세그먼트 유형의 판단 기준은 시계열 데이터의 유형에 따라 결정될 수 있다. 예를 들어, 압력 센서로부터 수신된 시계열 데이터의 세그먼트 유형은 상수형, 조각 상수형, 상승 경사형 및 하강 경사형을 포함할 수 있고, 온도 센서로부터 수신된 시계열 데이터의 세그먼트 유형은 스파이크형(spike)을 더 포함할 수 있다. 또한, 압력 센서로부터 수신된 시계열 데이터와 온도 센서로부터 수신된 시계열 데이터의 상수형의 세그먼트 결정 기준은 서로 다를 수 있다.
전술한 실시예들에 따른 프로세서는 프로세서, 프로그램 데이터를 저장하고 실행하는 메모리, 디스크 드라이브와 같은 영구 저장부(permanent storage), 외부 장치와 통신하는 통신 포트, 터치 패널, 키(key), 버튼 등과 같은 사용자 인터페이스 장치 등을 포함할 수 있다. 소프트웨어 모듈 또는 알고리즘으로 구현되는 방법들은 상기 프로세서상에서 실행 가능한 컴퓨터가 읽을 수 있는 코드들 또는 프로그램 명령들로서 컴퓨터가 읽을 수 있는 기록 매체 상에 저장될 수 있다. 여기서 컴퓨터가 읽을 수 있는 기록 매체로 마그네틱 저장 매체(예컨대, ROM(read-only memory), RAM(random-Access memory), 플로피 디스크, 하드 디스크 등) 및 광학적 판독 매체(예컨대, 시디롬(CD-ROM), 디브이디(DVD: Digital Versatile Disc)) 등이 있다. 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템들에 분산되어, 분산 방식으로 컴퓨터가 판독 가능한 코드가 저장되고 실행될 수 있다. 매체는 컴퓨터에 의해 판독가능하며, 메모리에 저장되고, 프로세서에서 실행될 수 있다.
본 실시예는 기능적인 블록 구성들 및 다양한 처리 단계들로 나타내어질 수 있다. 이러한 기능 블록들은 특정 기능들을 실행하는 다양한 개수의 하드웨어 또는/및 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 실시예는 하나 이상의 마이크로프로세서들의 제어 또는 다른 제어 장치들에 의해서 다양한 기능들을 실행할 수 있는, 메모리, 프로세싱, 로직(logic), 룩 업 테이블(look-up table) 등과 같은 직접 회로 구성들을 채용할 수 있다. 구성 요소들이 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있는 것과 유사하게, 본 실시예는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, 파이썬(Python), C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 또한, 본 실시예는 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. “매커니즘”, “요소”, “수단”, “구성”과 같은 용어는 넓게 사용될 수 있으며, 기계적이고 물리적인 구성들로서 한정되는 것은 아니다. 상기 용어는 프로세서 등과 연계하여 소프트웨어의 일련의 처리들(routines)의 의미를 포함할 수 있다.
전술한 실시예들은 일 예시일 뿐 후술하는 청구항들의 범위 내에서 다른 실시예들이 구현될 수 있다.

Claims (14)

  1. 제조 공정과 관련된 시계열 데이터의 특징 값을 추출하는 장치에서 수행하는 시계열 데이터의 특징 값을 추출하는 방법에 있어서,
    시계열 데이터를 수신하는 단계;
    기설정된 세그먼트 유형에 따라, 상기 시계열 데이터를 하나 이상의 세그먼트로 분할하는 단계;
    상기 하나 이상의 세그먼트 중 제1 세그먼트의 세그먼트 유형과 매핑된 제1 특징 그룹을 식별하는 단계; 및
    상기 제1 세그먼트로부터 상기 제1 특징 그룹에 포함된 적어도 한 항목에 대응하는 특징 값을 추출하는 단계를 포함하고,
    상기 시계열 데이터를 하나 이상의 세그먼트로 분할하는 단계는,
    상기 시계열 데이터에서 동일한 값을 갖는 제1 시간 구간의 길이가 제1 임계값 미만인 경우, 상기 제1 시간 구간의 데이터를 상기 제1 시간 구간에 포함된 제1 시점의 데이터로 압축하는 단계; 및
    상기 분할된 세그먼트의 수가 제2 임계값 미만인 경우, 상기 압축된 데이터에 포함된 하나 이상의 세그먼트의 압축 비율을 조정하는 단계를 더 포함하고,
    상기 제1 시점의 데이터로 압축하는 단계는,
    상기 압축된 데이터에서, 상기 제1 시점을 포함하는 제2 시간 구간의 기울기에 기초하여, 상기 제2 시간 구간을 상기 기설정된 세그먼트 유형 중 하나의 세그먼트로 결정하는 단계를 더 포함하는,
    시계열 데이터의 특징 값을 추출하는 방법.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 제1 시점에 관한 정보 및 상기 제1 시간 구간의 길이 정보 중 적어도 하나에 기초하여, 상기 압축된 데이터를 복원하는 단계를 더 포함하고,
    상기 복원된 데이터에 포함된 제2 세그먼트는 상기 압축된 데이터의 상기 제2 시간 구간과 대응되는 것인, 시계열 데이터의 특징 값을 추출하는 방법.
  5. 제4항에 있어서,
    상기 제2 세그먼트의 세그먼트 유형과 매핑된 제2 특징 그룹 중 어느 하나에 기초하여, 상기 제2 세그먼트의 구간을 조정하는 단계를 더 포함하는, 시계열 데이터의 특징 값을 추출하는 방법.
  6. 제5항에 있어서,
    상기 제2 세그먼트의 기울기에 기초하여, 상기 제2 세그먼트의 구간을 조정하는 단계를 더 포함하는, 시계열 데이터의 특징 값을 추출하는 방법.
  7. 삭제
  8. 제1항에 있어서,
    상기 제1 특징 그룹에 포함된 항목은
    세그먼트의 기울기, 시작 시점, 종료 시점, 길이, 표준편차, 최대값, 최소값, 볼록성, 잔차, 첨도, 왜도, 진폭, 진동수 중 적어도 하나를 포함하는 것인, 시계열 데이터의 특징 값을 추출하는 방법.
  9. 제1항에 있어서,
    상기 추출된 특징 값에 기초하여, 상기 시계열 데이터의 이상 여부를 감지하는 단계를 더 포함하는, 시계열 데이터의 특징 값을 추출하는 방법.
  10. 제9항에 있어서,
    상기 시계열 데이터의 이상 여부를 감지하는 단계는
    상기 추출된 특징 값 및 상기 시계열 데이터와 상이한 시계열 데이터로부터 추출된 특징 값 간의 상관관계에 기초하여, 상기 시계열 데이터의 이상 여부를 감지하는 단계를 포함하는, 시계열 데이터의 특징 값을 추출하는 방법.
  11. 제1항에 있어서,
    상기 기설정된 세그먼트 유형은
    상수형, 스파이크형, 조각 상수형, 정상 상태형, 상승 경사형 및 하강 경사형 중 적어도 하나를 포함하는 것인, 시계열 데이터의 특징 값을 추출하는 방법.
  12. 제1항에 있어서,
    상기 세그먼트 유형 및 상기 세그먼트 유형의 판단 기준은
    상기 시계열 데이터의 유형에 따라 결정되는 것인, 시계열 데이터의 특징 값을 추출하는 방법.
  13. 적어도 하나의 명령어(instruction)를 저장하는 메모리(memory); 및
    상기 적어도 하나의 명령어를 실행하여,
    제조 공정과 관련된 시계열 데이터를 수신하고,
    기설정된 세그먼트 유형에 따라, 상기 시계열 데이터를 하나 이상의 세그먼트로 분할하고,
    상기 하나 이상의 세그먼트 중 제1 세그먼트의 세그먼트 유형과 매핑된 제1 특징 그룹을 식별하고,
    상기 제1 세그먼트로부터 상기 제1 특징 그룹에 포함된 적어도 한 항목에 대응하는 특징 값을 추출하는 프로세서(processor)를 포함하고,
    상기 프로세서는,
    상기 시계열 데이터를 하나 이상의 세그먼트로 분할할 때, 상기 시계열 데이터에서 동일한 값을 갖는 제1 시간 구간의 길이가 제1 임계값 미만인 경우, 상기 제1 시간 구간의 데이터를 상기 제1 시간 구간에 포함된 제1 시점의 데이터로 압축하고, 상기 분할된 세그먼트의 수가 제2 임계값 미만인 경우, 상기 압축된 데이터에 포함된 하나 이상의 세그먼트의 압축 비율을 조정하고,
    상기 프로세서는,
    상기 제1 시점의 데이터로 압축할 때, 상기 압축된 데이터에서, 상기 제1 시점을 포함하는 제2 시간 구간의 기울기에 기초하여, 상기 제2 시간 구간을 상기 기설정된 세그먼트 유형 중 하나의 세그먼트로 결정하는,
    시계열 데이터의 특징 값을 추출하는 장치.
  14. 제조 공정과 관련된 시계열 데이터의 특징 값을 추출하는 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 비일시적 기록매체로서, 상기 방법은,
    시계열 데이터를 수신하는 단계;
    기설정된 세그먼트 유형에 따라, 상기 시계열 데이터를 하나 이상의 세그먼트로 분할하는 단계;
    상기 하나 이상의 세그먼트 중 제1 세그먼트의 세그먼트 유형과 매핑된 제1 특징 그룹을 식별하는 단계; 및
    상기 제1 세그먼트로부터 상기 제1 특징 그룹에 포함된 적어도 한 항목에 대응하는 특징 값을 추출하는 단계를 포함하고,
    상기 시계열 데이터를 하나 이상의 세그먼트로 분할하는 단계는,
    상기 시계열 데이터에서 동일한 값을 갖는 제1 시간 구간의 길이가 제1 임계값 미만인 경우, 상기 제1 시간 구간의 데이터를 상기 제1 시간 구간에 포함된 제1 시점의 데이터로 압축하는 단계; 및
    상기 분할된 세그먼트의 수가 제2 임계값 미만인 경우, 상기 압축된 데이터에 포함된 하나 이상의 세그먼트의 압축 비율을 조정하는 단계를 더 포함하고,
    상기 제1 시점의 데이터로 압축하는 단계는,
    상기 압축된 데이터에서, 상기 제1 시점을 포함하는 제2 시간 구간의 기울기에 기초하여, 상기 제2 시간 구간을 상기 기설정된 세그먼트 유형 중 하나의 세그먼트로 결정하는 단계를 더 포함하는,
    비일시적 기록매체.
KR1020210026328A 2021-02-26 2021-02-26 시계열 데이터의 특징 값을 추출하는 방법 및 장치 KR102294800B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020210026328A KR102294800B1 (ko) 2021-02-26 2021-02-26 시계열 데이터의 특징 값을 추출하는 방법 및 장치
US18/248,042 US20230367793A1 (en) 2021-02-26 2022-02-24 Method and device for extracting feature value of time series data
PCT/KR2022/002734 WO2022182176A1 (ko) 2021-02-26 2022-02-24 시계열 데이터의 특징 값을 추출하는 방법 및 장치
CN202280006874.0A CN116802616A (zh) 2021-02-26 2022-02-24 用于提取时间序列数据的特征值的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210026328A KR102294800B1 (ko) 2021-02-26 2021-02-26 시계열 데이터의 특징 값을 추출하는 방법 및 장치

Publications (1)

Publication Number Publication Date
KR102294800B1 true KR102294800B1 (ko) 2021-08-30

Family

ID=77502174

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210026328A KR102294800B1 (ko) 2021-02-26 2021-02-26 시계열 데이터의 특징 값을 추출하는 방법 및 장치

Country Status (4)

Country Link
US (1) US20230367793A1 (ko)
KR (1) KR102294800B1 (ko)
CN (1) CN116802616A (ko)
WO (1) WO2022182176A1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102430619B1 (ko) * 2021-12-07 2022-08-09 케빈랩 주식회사 데이터 관리 방법
WO2022182176A1 (ko) * 2021-02-26 2022-09-01 (주)알티엠 시계열 데이터의 특징 값을 추출하는 방법 및 장치
KR102485474B1 (ko) * 2021-12-03 2023-01-06 한국전자기술연구원 통계적 데이터 특성 추출을 통한 해상 센서 자가 고장 진단 장치
KR102604219B1 (ko) * 2022-09-07 2023-11-20 주식회사 아인스페이스 고해상도 데이터에 대한 폴트를 검출하는 방법 및 그 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10282963A (ja) * 1997-04-07 1998-10-23 Roland Corp 波形データの時間圧縮伸張方法および装置
JP2016062258A (ja) * 2014-09-17 2016-04-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 検出装置、検出方法、およびプログラム
KR20190040346A (ko) * 2016-10-06 2019-04-17 미쓰비시덴키 가부시키가이샤 시계열 데이터 처리 장치
KR20200086548A (ko) * 2019-01-09 2020-07-17 삼성전자주식회사 시계열 데이터 압축 및 복원 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018073241A (ja) * 2016-11-01 2018-05-10 日本電信電話株式会社 検知装置、検知方法および検知プログラム
KR102294800B1 (ko) * 2021-02-26 2021-08-30 (주)알티엠 시계열 데이터의 특징 값을 추출하는 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10282963A (ja) * 1997-04-07 1998-10-23 Roland Corp 波形データの時間圧縮伸張方法および装置
JP2016062258A (ja) * 2014-09-17 2016-04-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 検出装置、検出方法、およびプログラム
KR20190040346A (ko) * 2016-10-06 2019-04-17 미쓰비시덴키 가부시키가이샤 시계열 데이터 처리 장치
KR20200086548A (ko) * 2019-01-09 2020-07-17 삼성전자주식회사 시계열 데이터 압축 및 복원 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022182176A1 (ko) * 2021-02-26 2022-09-01 (주)알티엠 시계열 데이터의 특징 값을 추출하는 방법 및 장치
KR102485474B1 (ko) * 2021-12-03 2023-01-06 한국전자기술연구원 통계적 데이터 특성 추출을 통한 해상 센서 자가 고장 진단 장치
KR102430619B1 (ko) * 2021-12-07 2022-08-09 케빈랩 주식회사 데이터 관리 방법
KR102604219B1 (ko) * 2022-09-07 2023-11-20 주식회사 아인스페이스 고해상도 데이터에 대한 폴트를 검출하는 방법 및 그 시스템

Also Published As

Publication number Publication date
WO2022182176A1 (ko) 2022-09-01
CN116802616A (zh) 2023-09-22
US20230367793A1 (en) 2023-11-16

Similar Documents

Publication Publication Date Title
KR102294800B1 (ko) 시계열 데이터의 특징 값을 추출하는 방법 및 장치
US8041539B2 (en) Principal component analysis based fault classification
US9972517B2 (en) Anomaly detection system and method of manufacturing semiconductor device
US20160217379A1 (en) Shapelet-Based Oilfield Equipment Failure Prediction and Detection
US7096153B2 (en) Principal component analysis based fault classification
SG176797A1 (en) Automatic fault detection and classification in a plasma processing system and methods thereof
KR102291964B1 (ko) 반도체 제조 공정에서 고장 검출 및 불량 원인 진단을 위한 방법
US11640328B2 (en) Predicting equipment fail mode from process trace
CN110858072B (zh) 设备运行状态的确定方法及装置
KR102276801B1 (ko) 기계학습 기반 시계열 데이터 처리 방법 및 장치
Wang et al. An improved fusion prognostics method for remaining useful life prediction of bearings
WO2004030082A1 (en) Expert knowledge methods and systems for data analysis
CN117829209A (zh) 工艺设备的非正常工作检测方法、计算装置及计算机程序
Jin et al. Changepoint-based anomaly detection for prognostic diagnosis in a core router system
CN116127391A (zh) 一种基于多变量时序数据重构确定异常的方法
CN115495274B (zh) 基于时序数据的异常处理方法、网络设备和可读存储介质
US20230297095A1 (en) Monitoring device and method for detecting anomalies
JP6896380B2 (ja) 故障予兆判定方法、故障予兆判定装置および故障予兆判定プログラム
US20160258844A1 (en) Monitoring operation of a reaction chamber
US11531848B2 (en) Data processing apparatus, data processing method and semiconductor manufacturing apparatus
Hendriks et al. Data Augmentation for Roller Bearing Health Indicator Estimation Using Multi-Channel Frequency Data Representations
KR20230090501A (ko) 반도체 식각 장비의 고장을 탐지하는 장치, 방법 및 이를 위한 컴퓨터 판독가능 프로그램
Zhang et al. Towards real time fault identification in plasma etching using neural networks
MELLAH et al. Early Semiconductor Anomaly Detection Based on Multivariate Time-Series Classification using multilayer Perceptron
US20230271364A1 (en) An apparatus and a method to predict the remaining useful life of a plasticizing screw

Legal Events

Date Code Title Description
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant