KR102472637B1 - 시계열 데이터 분석 방법, 주영향 변수 결정 방법 및 그 방법들을 지원하는 장치 - Google Patents

시계열 데이터 분석 방법, 주영향 변수 결정 방법 및 그 방법들을 지원하는 장치 Download PDF

Info

Publication number
KR102472637B1
KR102472637B1 KR1020180128528A KR20180128528A KR102472637B1 KR 102472637 B1 KR102472637 B1 KR 102472637B1 KR 1020180128528 A KR1020180128528 A KR 1020180128528A KR 20180128528 A KR20180128528 A KR 20180128528A KR 102472637 B1 KR102472637 B1 KR 102472637B1
Authority
KR
South Korea
Prior art keywords
time series
variable
matrix
class
determining
Prior art date
Application number
KR1020180128528A
Other languages
English (en)
Other versions
KR20200052425A (ko
Inventor
이정림
진유리
Original Assignee
삼성에스디에스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성에스디에스 주식회사 filed Critical 삼성에스디에스 주식회사
Priority to KR1020180128528A priority Critical patent/KR102472637B1/ko
Publication of KR20200052425A publication Critical patent/KR20200052425A/ko
Application granted granted Critical
Publication of KR102472637B1 publication Critical patent/KR102472637B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

복수의 시계열 변수 중 타깃 클래스(target class)에 대한 주영향 변수를 결정하는 방법이 제공된다. 상기 주영향 변수 결정 방법은, 상기 복수의 시계열 변수와 연관된 다중 시계열 데이터에서, 상기 타깃 클래스로 예측된 제1 매트릭스를 획득하는 단계, 특정 클래스에 속한 제2 매트릭스를 획득하는 단계, 상기 제1 매트릭스 및 상기 제2 매트릭스에서 제1 시계열 변수의 값을 제외하고, 두 매트릭스 간의 유사도를 산출하는 단계 및 상기 산출된 유사도가 소정의 조건을 만족한다는 판정에 응답하여, 상기 제1 시계열 변수를 상기 주영향 변수로 결정하는 단계를 포함할 수 있다. 이때, 상기 제1 매트릭스의 제1 행 또는 제1 열은 제1 시계열 변수의 측정 값으로 구성되고, 상기 제1 매트릭스의 제2 행 또는 제2 열은 제2 시계열 변수의 측정 값으로 구성될 수 있다.

Description

시계열 데이터 분석 방법, 주영향 변수 결정 방법 및 그 방법들을 지원하는 장치{METHOD FOR ANALYZING TIME SERIES DATA, DETERMINING A KEY INFLUENCE VARIABLE AND APPARATUS SUPPORTING THE SAME}
본 발명은 시계열 데이터 분석 방법, 주영향 변수 결정 방법 및 그 방법들을 지원하는 장치에 관한 것이다. 보다 자세하게는, 데이터 분석의 정확성을 향상시키기 위해, 다수의 시계열 변수 간의 상관 관계를 고려하여 다중 시계열 데이터를 분석하는 방법, 복수의 시계열 변수 중에서 분석 결과에 가장 영향을 미친 주영향 변수를 결정하는 방법 및 그 방법들을 지원하는 장치에 관한 것이다.
반도체 공정은 매우 복잡한 제조 공정 중 하나이며 대부분의 공정이 자동화되어 있다. 자동화된 반도체 공정을 효율적으로 운영하기 위한 필수 요소 기술 중 하나는 이상 탐지(anomaly detection) 기술이다. 자동화된 공정에서 장애가 발생하는 경우, 전체 제조 공정 중단되어 경제적 손실 규모가 급격히 증가하기 때문이다.
반도체 공정에서 실시간으로 이상 상태를 감지하기 위해 다수의 센서들이 사용되며, 다수의 센서들로부터 실시간으로 많은 양의 데이터가 생성된다. 이러한 다중 시계열 데이터는 적게는 수십, 많게는 수백 개의 시계열 변수(e.g. 온도, 습도 등)에 대한 측정 값으로 구성된다.
종래의 이상 탐지 방법은 각 시계열 변수 별로 시계열 데이터의 특징을 분석하고, 분석 결과에 따라 공정의 이상 유무를 예측하는 방식이었다. 즉, 다수의 시계열 변수를 모니터링하고 있음에도, 단일 시계열 변수를 기준으로 상호 독립적으로 이상 탐지를 위한 분석이 수행되었다. 이에 따라, 시계열 변수 간의 상관 관계가 이상 탐지 과정에 반영되지 못했고, 그 결과로 이상 탐지의 정확도가 떨어지는 문제가 있었다.
적은 수의 시계열 변수의 상관 관계를 고려하여 이상 탐지를 수행하는 방법이 일부 제안된 바도 있으나, 수십, 수백 개의 시계열 변수 간의 상관 관계를 고려할 수 있는 방법은 아직까지 제안된 바 없는 실정이다.
또한, 다수의 시계열 변수 중에서 이상 상태에 가장 영향을 미친 주영향 인자를 정확하게 식별할 수 있는 방법도 아직까지 제안된 바가 없다.
한국공개특허 제10-2016-0026492호 (2016.03.09 공개)
본 발명이 해결하고자 하는 기술적 과제는, 분석의 정확성을 향상시키기 위해 다수의 시계열 변수 간의 상관 관계를 고려하여 다중 시계열 데이터를 분석하는 방법 및 그 방법을 지원하는 장치를 제공하는 것이다.
본 발명이 해결하고자 하는 다른 기술적 과제는, 상기 다수의 시계열 변수 중에서 분석 결과에 가장 영향을 미친 주영향 변수를 정확하게 결정하는 방법 및 그 방법을 지원하는 장치를 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명의 기술분야에서의 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 주영향 변수 결정 방법은, 컴퓨팅 장치에서 복수의 시계열 변수 중 타깃 클래스(target class)에 대한 주영향 변수를 결정하는 방법에 있어서, 상기 복수의 시계열 변수와 연관된 다중 시계열 데이터에서, 상기 타깃 클래스로 예측된 제1 매트릭스를 획득하는 단계, 특정 클래스에 속한 제2 매트릭스를 획득하는 단계, 상기 제1 매트릭스 및 상기 제2 매트릭스에서 제1 시계열 변수의 값을 제외하고, 두 매트릭스 간의 유사도를 산출하는 단계 및 상기 산출된 유사도가 소정의 조건을 만족한다는 판정에 응답하여, 상기 제1 시계열 변수를 상기 주영향 변수로 결정하는 단계를 포함할 수 있다. 이때, 상기 제1 매트릭스의 제1 행 또는 제1 열은 제1 시계열 변수의 측정 값으로 구성되고, 상기 제1 매트릭스의 제2 행 또는 제2 열은 제2 시계열 변수의 측정 값으로 구성될 수 있다.
일 실시예에서, 상기 특정 클래스는 상기 타깃 클래스와 다른 클래스이고,
상기 주영향 변수로 결정하는 단계는, 상기 산출된 유사도가 임계 값 이상이라는 판정에 응답하여, 상기 제1 시계열 변수를 상기 주영향 변수로 결정하는 단계를 포함할 수 있다.
일 실시예에서, 상기 특정 클래스는 상기 타깃 클래스와 동일한 클래스이고, 상기 주영향 변수로 결정하는 단계는, 상기 산출된 유사도가 임계 값 미만이라는 판정에 응답하여, 상기 제1 시계열 변수를 상기 주영향 변수로 결정하는 단계를 포함할 수 있다.
일 실시예에서, 상기 제1 매트릭스를 획득하는 단계는, 상기 다중 시계열 데이터에서 기 설정된 시계열 구간의 데이터를 추출하여 상기 제1 매트릭스를 생성하는 단계 및 상기 제1 매트릭스의 분석 결과에 기반하여 상기 제1 매트릭스의 클래스를 상기 타깃 클래스로 예측하는 단계를 포함할 수 있다.
일 실시예에서, 상기 제2 매트릭스를 획득하는 단계는, 상기 특정 클래스에 속한 복수의 후보 매트릭스를 획득하는 단계 및 LSH(Locality Sensitive Hashing) 알고리즘을 적용하여 상기 복수의 후보 매트릭스 중에서 제2 매트릭스를 선정하는 단계를 포함할 수 있다.
상술한 기술적 과제를 해결하기 위한 본 발명의 다른 실시예에 따른 주영향 변수 결정 방법은, 컴퓨팅 장치에서 복수의 시계열 변수 중 특정 클래스에 대한 주영향 변수를 결정하는 방법에 있어서, 상기 복수의 시계열 변수와 연관된 다중 시계열 데이터에서 기 설정된 시계열 구간의 데이터를 추출하여 제1 매트릭스를 생성하는 단계, 상기 제1 매트릭스를 예측 모델에 입력하고, 상기 예측 모델로부터 출력된 제1 컨피던스 스코어(confidence score)에 기반하여 상기 제1 매트릭스의 클래스를 제1 클래스로 예측하는 단계 및 상기 제1 클래스에 대한 주영향 변수를 결정하는 단계를 포함하되, 상기 제1 매트릭스의 제1 행 또는 제1 열은 제1 시계열 변수의 측정 값으로 구성되고, 상기 제1 매트릭스의 제2 행 또는 제2 열은 제2 시계열 변수의 측정 값으로 구성되며, 상기 주영향 변수를 결정하는 단계는, 상기 제1 시계열 변수의 값이 제외된 상기 제1 매트릭스를 상기 예측 모델에 다시 입력하여, 제2 컨피던스 스코어를 획득하는 단계 및 상기 제2 컨피던스 스코어가 소정의 조건을 만족한다는 판정에 응답하여, 상기 제1 시계열 변수를 상기 제1 클래스의 주영향 변수로 결정하는 단계를 포함할 수 있다.
일 실시예에서, 상기 제1 컨피던스 스코어는 상기 제1 클래스에 대한 컨피던스 스코어이고, 상기 제2 컨피던스 스코어는 제2 클래스에 대한 컨피던스 스코어이며, 상기 제1 시계열 변수를 상기 제1 클래스의 주영향 변수로 결정하는 단계는, 상기 제2 컨피던스 스코어가 임계 값 이상이라는 판정에 응답하여, 상기 제1 시계열 변수를 상기 제1 클래스의 주영향 변수로 결정하는 단계를 포함할 수 있다.
일 실시예에서, 상기 제1 컨피던스 스코어와 상기 제2 컨피던스 스코어는 모두 상기 제1 클래스에 대한 컨피던스 스코어이고, 상기 제1 시계열 변수를 상기 제1 클래스의 주영향 변수로 결정하는 단계는, 상기 제1 컨피던스 스코어와 상기 제2 컨피던스 스코어의 차이가 소정의 조건을 만족한다는 판정에 응답하여, 상기 제1 시계열 변수를 상기 주영향 변수로 결정하는 단계를 포함할 수 있다.
상술한 기술적 과제를 해결하기 위한 본 발명의 또 다른 실시예에 따른 시계열 데이터 분석 방법은, 컴퓨팅 장치에서 컨볼루션 신경망(convolutional neural network) 기반의 예측 모델을 이용하여 예측 대상과 연관된 다중 시계열 데이터를 분석하는 방법에 있어서, 상기 다중 시계열 데이터에서 기 설정된 시계열 구간의 데이터를 추출하여, 제1 매트릭스를 생성하는 단계 및 상기 제1 매트릭스를 상기 예측 모델에 적용하여, 상기 예측 대상의 클래스를 예측하는 단계를 포함할 수 있다. 이때, 상기 다중 시계열 데이터는 제1 시계열 변수에 및 제2 시계열 변수의 측정 값을 포함하고, 상기 제1 매트릭스의 제1 행 또는 제1 열은 상기 시계열 구간에 대한 상기 제1 시계열 변수의 측정 값으로 구성되며, 상기 제1 매트릭스의 제2 행 또는 제2 열은 상기 시계열 구간에 대한 상기 제2 시계열 변수의 측정 값으로 구성될 수 있다.
일 실시예에서, 상기 제1 매트릭스를 생성하는 단계는, 시간 축 및 시계열 변수 축에 의해 형성되는 데이터 평면 상에, 상기 시계열 변수 축을 따라 상기 제1 시계열 변수 및 상기 제2 시계열 변수에 관한 측정 값을 배열하는 단계 및 상기 데이터 평면 상에서 슬라이딩 윈도우(sliding window)에 대응되는 측정 값을 추출하여 상기 제1 매트릭스를 생성하는 단계를 포함할 수 있다.
일 실시예에서, 상기 예측 모델은 순환 신경망(recurrent neural network)에 더 기반한 것이고, 상기 예측 대상의 클래스를 예측하는 단계는, 상기 컨볼루션 신경망에 상기 제1 매트릭스를 입력하여 특징 맵을 추출하는 단계 및 상기 추출된 특징 맵을 상기 순환 신경망에 입력하고, 상기 순환 신경망의 출력 결과에 기초하여 상기 예측 대상의 클래스를 예측하는 단계를 포함할 수 있다.
도 1은 본 발명의 일 실시예에 따른 시계열 데이터 분석 시스템을 나타내는 구성도이다.
도 2는 본 발명의 몇몇 실시예에서 참조될 수 있는 데이터 소스 및 다중 시계열 데이터의 예시도이다.
도 3 및 도 4는 본 발명의 일 실시예에 따른 시계열 데이터 분석 장치를 나타내는 블록도이다.
도 5는 본 발명의 일 실시예에 따른 시계열 데이터 분석 장치를 나타내는 하드웨어 구성도이다.
도 6은 본 발명의 제1 실시예에 따른 시계열 데이터 분석 방법을 나타내는 흐름도이다.
도 7 내지 도 9는 본 발명의 몇몇 실시예에 따른 전처리 방법을 설명하기 위한 예시도이다.
도 10 내지 도 12는 본 발명의 일 실시예에 따라 다중 시계열 데이터를 기초로 매트릭스를 생성하는 방법을 설명하기 위한 예시도이다.
도 13은 본 발명의 제1 실시예에 따른 주영향 변수 결정 방법을 설명하기 위한 예시도이다.
도 14 및 도 15는 본 발명의 일 실시예에 따라 보다 효율적으로 주영향 변수를 결정하기 위한 방법을 설명하기 위한 예시도이다.
도 16은 본 발명의 제2 실시예에 따른 시계열 데이터 분석 방법을 나타내는 흐름도이다.
도 17은 본 발명의 일 실시예에 따른 예측 모델의 구조를 설명하기 위한 예시도이다.
도 18은 본 발명의 제2 실시예에 따른 주영향 변수 결정 방법을 설명하기 위한 예시도이다.
도 19는 본 발명의 일 활용예에 따른 이상 탐지 시스템을 설명하기 위한 구성도이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
각 도면의 구성요소들에 참조 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.
또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제1, 제2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
명세서에서 사용되는 "포함한다 (comprises)" 및/또는 "포함하는 (comprising)"은 언급된 구성 요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성 요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
본 명세서에 대한 설명에 앞서, 본 명세서에서 사용되는 몇 가지 용어들에 대하여 명확하게 하기로 한다.
본 명세서에서, 다중 시계열 데이터(multiple times series data)란, 둘 이상의 시계열 변수에 관한 측정 값으로 구성된 데이터를 의미한다. 상기 다중 시계열 데이터란 용어는 당해 기술 분야에서 다차원 시계열 데이터 또는 다변량 시계열 데이터 등의 용어와 혼용되어 사용될 수 있다.
본 명세서에서, 시계열 변수(times series variable)란, 시간의 흐름에 따라 측정 또는 관측 가능한 특성을 지닌 모든 변수를 가리킨다. 이때, 상기 변수는 당해 기술 분야에서 속성(attribute), 변인, 인자(factor) 등의 용어와 혼용되어 사용될 수 있다. 상기 시계열 변수의 예는 온도, 습도, 주가지수, 환율 등이 될 수 있으나, 본 발명의 기술적 범위가 상기 열거된 예시에 한정되는 것은 아니다.
본 명세서에서, 예측 대상(target of prediction)이란, 문자 그대로 다중 시계열 데이터를 분석하여 예측하고자 하는 대상을 가리킨다. 예를 들어, 온도, 습도 등의 측정 값으로 구성된 다중 시계열 데이터를 이용하여 공정 이상을 예측하는 경우, 상기 예측 대상은 공정 상태를 지칭하는 것일 수 있다. 다른 예를 들어, 환율, 종합 주가 지수 등의 관측 값으로 구성된 다중 시계열 데이터를 이용하여 특정 종목(e.g. 기업, 부동산)의 가치를 예측하는 경우, 상기 예측 대상은 상기 특정 종목의 가치를 지칭하는 것일 수 있다. 복수의 시계열 변수의 측정 값을 이용하여 예측 대상의 클래스(e.g. 이상, 정상)를 예측한다고 할 때, 상기 시계열 변수는 독립 변수에 대응되고 상기 예측 대상은 종속 변수에 대응되는 것일 수 있다.
본 명세서에서, 예측 모델(prediction model)이란, 예측 대상의 클래스를 예측하기 위해 이용되는 모델을 의미한다. 가령, 상기 예측 모델은 기계 학습을 통해 구축되는 모델일 수 있으나, 본 발명의 기술적 범위가 이에 한정되는 것은 아니다.
본 명세서에서, 인스트럭션(instructions)이란, 기능을 기준으로 묶인 일련의 명령어들로서 컴퓨터 프로그램의 구성 요소이자 프로세서에 의해 실행되는 것을 가리킨다.
이하, 본 발명의 몇몇 실시예들에 대하여 첨부된 도면에 따라 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 시계열 데이터 분석 시스템을 나타내는 구성도이다.
도 1에 도시된 바와 같이, 상기 시계열 데이터 분석 시스템은 적어도 하나의 데이터 소스(10-1 내지 10-n), 수집 장치(50) 및 시계열 데이터 분석 장치(100)를 포함할 수 있다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 구성 요소가 추가되거나 삭제될 수 있음은 물론이다. 또한, 도 1에 도시된 시계열 데이터 분석 시스템의 각각의 구성 요소들은 기능적으로 구분되는 기능 요소들을 나타낸 것으로서, 복수의 구성 요소가 실제 물리적 환경에서는 서로 통합되는 형태로 구현될 수도 있음에 유의한다. 예컨대, 수집 장치(50)와 시계열 데이터 분석 장치(100)는 동일한 물리적 컴퓨팅 장치 내의 서로 다른 로직(logic)의 형태로 구현될 수 있다.
또한, 실제 물리적 환경에서 상기 각각의 구성 요소들은 복수의 세부 기능 요소로 분리되는 형태로 구현될 수도 있다. 예컨대, 시계열 데이터 분석 장치(100)의 제1 기능은 컴퓨팅 시스템을 구성하는 제1 컴퓨팅 장치에서 구현되고, 제2 기능은 상기 컴퓨팅 시스템을 구성하는 제2 컴퓨팅 장치에서 구현될 수도 있다. 이하, 상기 각각의 구성 요소에 대하여 설명한다.
상기 시계열 데이터 분석 시스템에서, 적어도 하나의 데이터 소스(10-1 내지 10-n)는 분석 대상이 되는 시계열 데이터를 제공하는 장치 또는 저장소이다. 예를 들어, 도 2에 도시된 바와 같이, 분석 대상 데이터가 온도, 습도 등에 관한 측정 값인 경우, 데이터 소스(10-1 내지 10-n)는 상기 측정 값을 제공하는 각종 센서(20-1 내지 20-n)를 지칭하는 것일 수 있다. 다른 예를 들어, 분석 대상 데이터가 환율, 주가지수 등의 금융 데이터인 경우, 데이터 소스(10-1 내지 10-n)는 상기 금융 데이터를 제공하는 저장소 또는 장치를 지칭하는 것일 수 있다.
상기 시계열 데이터 분석 시스템에서, 수집 장치(50)는 적어도 하나의 데이터 소스(10-1 내지 10-n)로부터 다중 시계열 데이터를 수집하는 장치이다. 가령, 수집 장치(50)는 제1 데이터 소스(10-1)로부터 제1 시계열 데이터를 수집하고, 제2 데이터 소스(10-2)로부터 제2 시계열 데이터를 수집할 수 있다. 수집 장치(50)가 다중 시계열 데이터를 수집하는 방식은 어떠한 방식이 되더라도 무방하다.
상기 시계열 데이터 분석 시스템에서, 시계열 데이터 분석 장치(100)는 다중 시계열 데이터에 대한 분석 기능이 구비된 컴퓨팅 장치이다. 여기서, 상기 컴퓨팅 장치는, 노트북, 데스크톱(desktop), 랩탑(laptop) 등이 될 수 있으나, 이에 국한되는 것은 아니며 컴퓨팅 기능이 구비된 모든 종류의 장치를 포함할 수 있다. 다만, 대용량의 다중 시계열 데이터를 분석하는 환경이라면, 시계열 데이터 분석 장치(100)는 고성능의 서버급 컴퓨팅 장치로 구현되는 것이 바람직할 수 있다. 설명의 편의를 위해, 이하에서는, 시계열 데이터 분석 장치(100)를 분석 장치(100)로 약칭하도록 한다.
본 발명의 실시예에 따르면, 분석 장치(100)는 시계열 변수 간의 상관 관계를 고려하여 다중 시계열 데이터를 분석함으로써 예측 대상에 대한 클래스 정보를 제공할 수 있다. 예컨대, 예측 대상이 공정 상태인 경우, 공정 변수 간의 상관 관계를 고려하여 다중 시계열 데이터를 분석함으로써 공정 상태에 대한 클래스 정보(e.g. 이상, 정상)가 제공될 수 있다. 본 실시예에 따르면, 시계열 변수 간의 상관 관계를 고려함으로써 신뢰도 높은 양질의 예측 정보가 제공될 수 있다. 본 실시예에 대한 자세한 설명은 도 3 이하의 도면을 참조하여 후술하도록 한다.
또한, 본 발명의 실시예에 따르면, 분석 장치(100)는 복수의 시계열 변수 중에서 클래스 판정에 가장 영향을 미친 주영향 변수를 결정할 수 있다. 가령, 공정 이상이 예측된 경우, 분석 장치(100)는 복수의 시계열 변수(e.g. 온도, 습도 등) 중에서 공정 이상에 가장 영향을 미친 주영향 변수(즉, 주영향 인자)를 결정할 수 있다. 본 실시예에 따르면, 예측 결과(즉, 클래스 정보)와 함께 예측 결과에 대한 원인 정보(즉, 주영향 변수)가 추가 제공된다. 따라서, 활용도 높고 가치 있는 정보가 제공되는 장점이 있다. 본 실시예에 대한 자세한 설명 또한 도 3 이하의 도면을 참조하여 후술하도록 한다.
도 1에 도시된 시계열 데이터 분석 시스템의 적어도 일부 구성 요소는 네트워크를 통해 통신할 수 있다. 여기서, 상기 네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN), 이동 통신망(mobile radio communication network), Wibro(Wireless Broadband Internet) 등과 같은 모든 종류의 유/무선 네트워크로 구현될 수 있다.
지금까지 도 1 및 도 2를 참조하여 본 발명의 일 실시예에 따른 시계열 데이터 분석 시스템에 대하여 설명하였다. 이하에서는, 분석 장치(100)의 구성 및 동작에 대하여 도 3 내지 도 5를 참조하여 보다 상세하게 설명한다.
도 3은 본 발명의 일 실시예에 따른 분석 장치(100)를 나타내는 블록도이다.
도 3을 참조하면, 분석 장치(100)는 데이터 수집부(110), 전처리부(120), 매트릭스 생성부(130), 분석부(140), 패턴 DB(150) 및 주영향 변수 결정부(160)를 포함할 수 있다. 다만, 도 3에는 본 발명의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 발명이 속한 기술분야의 통상의 기술자라면 도 3에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다. 또한, 도 3에 도시된 분석 장치(100)의 각각의 구성 요소들은 기능적으로 구분되는 기능 요소들을 나타낸 것으로서, 복수의 구성 요소가 실제 물리적 환경에서는 서로 통합되는 형태로 구현될 수도 있음에 유의한다.
각 구성 요소를 살펴보면, 데이터 수집부(110)는 적어도 하나의 데이터 소스(e.g. 10-1 내지 100-n)으로부터 다중 시계열 데이터를 수집한다. 또는, 데이터 수집부(110)는 다른 수집 장치(e.g. 도 1의 50)로부터 다중 시계열 데이터를 수집할 수도 있다.
다음으로, 전처리부(120)는 수집된 다중 시계열 데이터에 대한 전처리를 수행한다. 중복된 설명을 배제하기위해, 전처리부(120)의 동작에 대한 자세한 설명은 도 6 내지 도 9를 참조하여 후술하도록 한다.
다음으로, 매트릭스 생성부(130)는 전처리된 다중 시계열 데이터로부터 의 매트릭스를 생성한다. 구체적으로, 매트릭스 생성부(130)는 상기 전처리된 다중 시계열 데이터에서 기 설정된 시계열 구간 별로 데이터를 추출하고, 추출된 데이터를 기초로 매트릭스를 생성할 수 있다. 생성된 매트릭스는 패턴 별로 패턴 DB(150)에 저장될 수 있다. 중복된 설명을 배제하기 위해, 매트릭스 생성부(130)의 동작에 대한 자세한 설명은 도 6, 도 10 내지 도 12를 참조하여 후술하도록 한다.
다음으로, 분석부(140)는 생성된 매트릭스를 분석하여 예측 대상의 클래스를 예측한다. 도 4에 도시된 바와 같이, 분석부(140)는 제1 분석부(141)와 제2 분석부(143)를 포함할 수 있다.
제1 분석부(141)는 상기 생성된 매트릭스와 매칭된 패턴의 발생 빈도에 기초하여 상기 예측 대상의 클래스를 예측한다. 이때, 하나의 매트릭스가 하나의 패턴과 매칭될 수 있고, 복수의 매트릭스가 하나의 패턴과 매칭될 수도 있다. 제1 분석부(141)의 동작에 대한 자세한 설명은 도 6 내지 도 12를 참조하여 후술하도록 한다.
다음으로, 제2 분석부(143)는 예측 모델에 상기 생성된 매트릭스를 적용하여, 예측 대상의 클래스를 예측한다. 전술한 바와 같이, 상기 예측 모델은 기계 학습을 통해 구축된 모델일 수 있다. 그러나, 본 발명의 범위가 이에 한정되는 것은 아니다. 제2 분석부(143)의 동작에 대한 자세한 설명은 도 16 및 도 17을 참조하여 후술하도록 한다.
다시 도 3을 참조하면, 패턴 DB(150)는 매트릭스 생성부(130)에 의해 생성된 매트릭스를 패턴 별로 저장한 저장소이다. 패턴 DB(150)는 상기 매트릭스가 저장될 때, 매칭되는 패턴의 발생 빈도를 업데이트할 수 있다.
다음으로, 주영향 변수 결정부(160)는 복수의 시계열 변수 중에서 클래스 판정에 가장 영향을 미친 주영향 변수를 결정한다. 또한, 주영향 변수 결정부(160)는 각 시계열 변수에 대하여 클래스 판정에 영향을 미친 정도를 결정할 수 있다. 도 4에 도시된 바와 같이, 주영향 변수 결정부(160)는 제1 주영향 변수 결정부(161)와 제2 주영향 변수 결정부(163)를 포함할 수 있다.
제1 주영향 변수 결정부(161)는 매트릭스 유사도에 기초하여 주영향 변수를 결정한다. 제1 주영향 변수 결정부(161)의 동작에 대한 자세한 설명은 도 6과 도 13 내지 도 15를 참조하여 후술하도록 한다.
다음으로, 제2 주영향 변수 결정부(163)는 예측 모델의 컨피던스 스코어(confidence score)에 기초하여 주영향 변수를 결정한다. 제2 주영향 변수 결정부(163)의 동작에 대한 자세한 설명은 도 16 및 도 18을 참조하여 후술하도록 한다.
한편, 본 발명의 다른 실시예에 따르면, 분석 장치(100)는 도 3에 도시된 구성 요소 중 일부가 생략된 형태로 구현될 수도 있다. 즉, 도 3에 도시된 형태가 분석 장치(100)의 유일한 구성이 되는 것은 아님에 유의하여야 한다.
도 3 및 도 4에 도시된 각 구성 요소는 소프트웨어(Software) 또는, FPGA(Field Programmable Gate Array)나 ASIC(Application-Specific Integrated Circuit)과 같은 하드웨어(Hardware)를 의미할 수 있다. 그렇지만, 상기 구성 요소들은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, 어드레싱(Addressing)할 수 있는 저장 매체에 있도록 구성될 수도 있고, 하나 또는 그 이상의 프로세서들을 실행시키도록 구성될 수도 있다. 상기 구성 요소들 안에서 제공되는 기능은 더 세분화된 구성 요소에 의하여 구현될 수 있으며, 복수의 구성 요소들을 합하여 특정한 기능을 수행하는 하나의 구성 요소로 구현될 수도 있다.
도 5는 본 발명의 일 실시예에 따른 분석 장치(100)를 나타내는 하드웨어 구성도이다.
도 5를 참조하면, 분석 장치(100)는 하나 이상의 프로세서(101), 버스(105), 통신 인터페이스(107), 프로세서(101)에 의하여 수행되는 컴퓨터 프로그램을 로드(load)하는 메모리(103)와, 컴퓨터 프로그램(109a)을 저장하는 스토리지(109)를 포함할 수 있다. 다만, 도 5에는 본 발명의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 발명이 속한 기술분야의 통상의 기술자라면 도 5에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.
프로세서(101)는 분석 장치(100)의 각 구성의 전반적인 동작을 제어한다. 프로세서(101)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 발명의 기술 분야에 잘 알려진 임의의 형태의 프로세서를 포함하여 구성될 수 있다. 또한, 프로세서(101)는 본 발명의 실시예들에 따른 방법을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다. 분석 장치(100)는 하나 이상의 프로세서를 구비할 수 있다.
메모리(103)는 각종 데이터, 명령 및/또는 정보를 저장한다. 메모리(103)는 본 발명의 실시예들에 따른 시계열 데이터 분석 방법을 실행하기 위하여 스토리지(109)로부터 하나 이상의 프로그램(109a)을 로드할 수 있다. 메모리(103)는 가령 RAM과 같은 휘발성 메모리로 구현될 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다. 메모리(103)에 컴퓨터 프로그램(109a)이 로드되면, 메모리(103) 상에 도 3에 도시된 모듈이 로직의 형태로 구현될 수 있다.
버스(105)는 분석 장치(100)의 구성 요소 간 통신 기능을 제공한다. 버스(105)는 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.
통신 인터페이스(107)는 분석 장치(100)의 유무선 인터넷 통신을 지원한다. 또한, 통신 인터페이스(107)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 통신 인터페이스(107)는 본 발명의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다.
스토리지(109)는 다중 시계열 데이터(미도시)와 상기 하나 이상의 프로그램(109a)을 비임시적으로 저장할 수 있다. 스토리지(109)는 ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.
컴퓨터 프로그램(109a)은 메모리(103)에 로드될 때 프로세서(101)로 하여금 본 발명의 몇몇 실시예들에 따른 방법들을 수행하도록 하는 하나 이상의 인스트럭션들을 포함할 수 있다. 프로세서(101)는 상기 하나 이상의 인스트럭션들을 실행함으로써, 상기 방법들을 수행할 수 있다.
예를 들어, 컴퓨터 프로그램(109a)은 다중 시계열 데이터로부터 기 설정된 시계열 구간의 데이터를 추출하여, 매트릭스를 생성하고, 생성된 매트릭스를 분석하여 상기 예측 대상의 클래스를 예측하는 동작을 수행하도록 하는 인스트럭션들을 포함할 수 있다.
지금까지 도 3 내지 도 5를 참조하여 본 발명의 일 실시예에 따른 분석 장치(100)의 구성 및 동작에 대하여 설명하였다. 이하에서는, 도 6 이하의 도면을 참조하여 본 발명의 몇몇 실시예들에 따른 시계열 데이터 분석 방법에 대하여 상세하게 설명한다.
상기 시계열 데이터 분석 방법의 각 단계는 컴퓨팅 장치에 의해 수행될 수 있다. 다시 말하면, 상기 시계열 데이터 분석 방법의 각 단계는 컴퓨팅 장치의 프로세서에 의해 실행되는 하나 이상의 인스트럭션들로 구현될 수 있다. 상기 시계열 데이터 분석 방법에 포함되는 모든 단계는 하나의 물리적인 컴퓨팅 장치에 의하여 실행될 수도 있을 것이나, 상기 방법의 제1 단계들은 제1 컴퓨팅 장치에 의하여 수행되고, 상기 방법의 제2 단계들은 제2 컴퓨팅 장치에 의하여 수행될 수도 있다. 이하에서는, 상기 시계열 데이터 분석 방법의 각 단계가 분석 장치(100)에 의해 수행되는 것을 가정하여 설명을 이어가도록 한다. 다만, 설명의 편의를 위해, 상기 시계열 데이터 분석 방법에 포함되는 각 단계의 동작 주체는 그 기재가 생략될 수도 있다.
먼저 도 6 내지 도 15를 참조하여 본 발명의 제1 실시예에 따른 시계열 데이터 분석 방법에 대하여 설명하도록 한다.
도 6은 본 발명의 제1 실시예에 따른 시계열 데이터 분석 방법을 나타내는 흐름도이다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일 뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다.
도 6에 도시된 바와 같이, 상기 제1 실시예는 분석 장치(100)가 다중 시계열 데이터를 수집하는 단계(S10)에서 시작된다. 전술한 바와 같이, 상기 다중 시계열 데이터는 복수의 시계열 변수에 관한 측정 값으로 구성된 데이터를 의미한다. 다중 시계열 데이터를 수집하는 방식은 어떠한 방식이 되더라도 무방하다.
단계(S30)에서, 분석 장치(100)는 수집된 다중 시계열 데이터에 대한 전처리를 수행한다. 상기 전처리 단계(S30)의 구체적인 동작은 실시예에 따라 달라질 수 있다.
일 실시예에서, 분석 장치(100)는 데이터 압축 처리를 수행할 수 있다. 가령, 도 7에 도시된 바와 같이, 분석 장치(100)는 시계열 데이터(210)를 기 설정된 구간(e.g. 제1 구간, 제2 구간 등)으로 분할하고, 각 구간별로 시계열 데이터(210)의 평균 값(201 내지 209)을 연산할 수 있다. 도 7의 상단에 도시된 그래프는 압축되기 전의 시계열 데이터(210)이고, 도 7의 하단에 도시된 그래프는 압축된 이후의 시계열 데이터(201 내지 209)이다. 본 실시예에 따르면, 시계열 데이터(210) 전체가 아닌 각 구간별 평균 값(201 내지 215)만 저장되므로, 저장 공간이 효율적으로 활용되고 분석에 소요되는 컴퓨팅 비용이 감소되는 효과가 달성될 수 있다. 뿐만 아니라, 평균 연산을 통해 노이즈의 영향이 감소되는 바, 노이즈 제거 효과 또한 달성될 수 있다.
일 실시예에서, 분석 장치(100)는 정규화(normalization)를 수행할 수 있다. 가령, 도 8에 도시된 바와 같이, 분석 장치(100)는 도 8에 도시된 바와 같이 평균 및 분산을 이용하여 다중 시계열 데이터(211-1, 213-1)를 일정 범위 내의 값으로 정규화할 수 있다. 물론, 평균 및 분산을 이용하지 않고, 얼마든지 다른 방식으로 정규화가 수행될 수도 있다. 도 8에서, 상단에 도시된 그래프는 정규화되기 전의 시계열 데이터(211-1, 213-1)이고, 하단에 도시된 그래프는 정규화된 이후의 시계열 데이터(211-2, 213-2)이다.
일 실시예에서, 분석 장치(100)는 심볼화(symbolization) 처리를 수행할 수 있다. 가령, 도 9에 도시된 바와 같이, 분석 장치(100)는 SAX(Symbolic Aggregate approXimation) 변환을 통해 시계열 데이터(221)를 심볼화할 수 있다. 보다 구체적으로, 분석 장치(100)는 PAA(Piecewise Aggregate Approximation) 변환을 통해 시계열 데이터(221)를 구간 별로 단편화하고, 임계 값들을 기준으로 단편화된 시계열 데이터(223)를 매칭되는 심볼(e.g. a, b, c)로 변환할 수 있다. 도 9는 시계열 데이터(221)가 심볼화의 결과 "baabccbc"로 변환되는 것을 예로써 도시하고 있으나, 상기 심볼화는 시계열 데이터를 알파벳과 같은 문자가 아닌 숫자로 변환하는 것도 포함할 수 있다.
일 실시예에서, 분석 장치(100)는 주성분 분석(Principal Component analysis; PCA)을 통해 다중 시계열 데이터에 대한 차원 축소 처리를 수행할 수 있다. 가령, 분석 장치(100)는 주성분 분석을 통해 n개의 시계열 변수로부터 k개(단, k는 n 미만의 자연수)의 주성분 변수를 추출할 수 있다. 이에 따라, 데이터 고유의 특성을 최대한 유지하면서 n차원의 데이터가 k차원의 데이터로 축소될 수 있다. 상기 주성분 분석은 당해 기술 분야에서 이미 널리 알려진 기술이므로 이에 대한 자세한 설명은 생략하도록 한다. 본 실시예에 따르면, 데이터의 차원이 축소됨으로써, 시계열 데이터 분석에 소요되는 컴퓨팅 비용이 크게 절감될 수 있다.
일 실시예에서, 분석 장치(100)는 전술한 실시예들의 조합에 기초하여 전처리 단계(S30)를 수행할 수 있다.
다시 도 6을 참조하면, 단계(S50)에서, 분석 장치(100)는 전처리된 다중 시계열 데이터에서 기 설정된 시계열 구간에 대응되는 데이터를 추출하여 2차원의 데이터 구조를 갖는 매트릭스를 생성한다. 이때, 상기 시계열 구간의 길이는 실시예에 따라 얼마든지 달라질 수 있다. 참고로, 상기 2차원 매트릭스는 도 10 내지 도 12에 도시된 바와 같이 2차원 배열로 표현 가능하다는 것을 의미할 뿐, 시계열 변수의 개수가 2개라는 것을 의미하는 것은 아니다. 또한, 실시예에 따라, 2차원 이상의 다차원 매트릭스가 생성될 수도 있다.
본 단계(S50)에서, 분석 장치(100)는 각각의 시계열 구간 별로 매트릭스를 생성할 수 있다. 보다 이해의 편의를 제공하기 위해, 도 10 내지 도 12를 참조하여 본 단계(S50)에 대하여 부연 설명하도록 한다.
도 10에 도시된 바와 같이, 다중 시계열 데이터(231 내지 236)는 시간 축과 시계열 변수 축에 의해 형성된 2차원의 데이터 평면 상에 배치될 수 있다. 이때, 시계열 변수의 배열 순서는 실시예에 따라 달라질 수 있다.
일 실시예에서, 상기 배열 순서는 랜덤하게 결정될 수 있다.
일 실시예에서, 상기 배열 순서는 시계열 변수 간의 상관 분석 결과에 기초하여 결정될 수 있다. 가령, 분석 장치(100)는 제1 시계열 변수와 제2 시계열 변수에 대한 상관 분석을 수행하고, 상관 관계가 존재한다고 판정에 응답하여, 상기 시계열 변수 축에서 상기 제1 시계열 변수와 상기 제2 시계열 변수를 인접하여 배치할 수 있다. 상관 관계에 대한 사전 지식(prior knowledge)이 주어진 경우라면, 상관 분석을 하지 않고 상기 사전 지식에 기초하여 배열 순서가 결정될 수도 있다. 본 실시예에 따르면, 상관 분석을 통해 연관성이 존재할 가능성이 높은 시계열 변수가 데이터 평면 상에 인접하여 배치된다. 따라서, 시계열 변수 간의 상관 관계가 데이터 분석 과정에 더욱 잘 반영될 수 있다. 가령, 컨볼루션 신경망(Convolutional Neural network; CNN)을 통해 데이터 분석이 이루어지는 경우, 지역적 특징이 보다 잘 추출될 것인 바, 예측의 정확도가 향상될 수 있다.
일 실시예에서, 전술한 실시예의 조합에 의해 시계열 변수의 배열 순서가 결정될 수 있다. 가령, 분석 장치(100)는 상관 관계가 존재하는 제1 복수의 시계열 변수들을 인접하여 배치하고, 상관 관계가 존재하지 않는 제2 복수의 시계열 변수들을 랜덤하게 배치할 수 있다.
도 11은 도 10에 도시된 2차원의 데이터 평면을 매트릭스 형태로 도시한 것이다.
도 11에 도시된 바와 같이, 도 11에 도시된 매트릭스의 제1 행은 제1 시계열 데이터(231)에 대응되고, 제2 행은 제2 시계열 데이터(232)와 대응된다. 또한, 상기 매트릭스의 제1 열은 제1 시점에 측정된 각 시계열 데이터(231 내지 236)의 값에 대응되고, 제2 열은 제2 시점에 측정된 각 시계열 데이터(231 내지 236)의 값에 대응된다. 물론, 실시예에 따라, 행과 열의 대응 관계는 변경될 수도 있다.
도 12는 도 11에 도시된 데이터 평면에서 각 시계열 구간에 대응되는 매트릭스를 생성하는 과정을 도시하고 있다.
도 12에 도시된 바와 같이, 분석 장치(100)는 슬라이딩 윈도우(sliding window) 방식으로 연속적으로 매트릭스(241-2, 243-3)를 생성할 수 있다. 구체적으로, 분석 장치(100)는 데이터 평면 상에서 설정된 윈도우에 대응되는 영역(241-1)을 추출하여 제1 매트릭스(241-2)를 생성하고, 슬라이딩된 윈도우에 대응되는 영역(243-1)을 추출하여 제2 매트릭스(243-3)를 생성할 수 있다. 이때, 윈도우의 이동 간격(즉, stride)과 윈도우의 크기(즉, 시계열 구간의 길이)는 실시예에 따라 얼마든지 달라질 수 있다.
예를 들어, 반도체 공정과 같이 엄격한 모니터링이 요구되거나 데이터의 시계열적 관계가 중요한 경우라면, 상기 이동 간격은 상대적으로 작은 값으로 설정될 수 있다. 그렇게 함으로써, 보다 철저한 모니터링이 수행될 수 있기 때문이다. 다른 예를 들어, 분석 장치(100)의 컴퓨팅 리소스가 열악한 환경이라면, 상기 이동 간격은 상대적으로 큰 값으로 설정될 수 있다. 그렇게 함으로써, 두 매트릭스 간에 중복 데이터가 최소화되며, 분석 대상이 되는 매트릭스의 개수가 감소될 수 있기 때문이다.
전술한 바에 따라 생성된 매트릭스(241-2, 243-2)는 패턴 DB(150)에 저장될 수 있다. 패턴 DB(150)는 매트릭스(241-2, 243-2)를 저장함과 동시에, 매트릭스(241-2, 243-2)와 매칭되는 패턴을 결정하고, 패턴의 발생 빈도를 증가시킬 수 있다.
이때, 상기 패턴은 매트릭스와 1:1 관계일 수 있고, 1:다 관계가 될 수도 있다. 가령, 패턴과 매트릭스가 1:1 관계인 경우, 각각의 매트릭스 자체가 패턴으로 이용될 수 있다. 패턴과 매트릭스가 1:다 관계인 경우, 클러스터링(clustering)을 통해 생성된 대표 매트릭스가 패턴으로 이용될 수 있다. 상기 대표 매트릭스는 예를 들어 클러스터에 소속된 하나 이상의 매트릭스를 평균함으로써 생성되는 것일 수 있으나, 얼마든지 다른 방식(e.g. 중간 값, 최빈 값)으로 생성되더라도 무방할 것이다. 이와 같은 경우, 하나의 패턴은 하나의 클러스터에 매칭되고, 패턴의 발생 빈도는 클러스터에 속한 매트릭스의 개수로 산출될 수 있다.
도 10 내지 도 12는 다중 시계열 데이터로부터 매트릭스를 생성하는 과정을 개념적인 측면에서 설명한 것임에 유의하여야 한다. 실제 구현 시에는, 데이터 평면 상에 시계열 데이터를 배치하는 것이 아니라, 특정 시계열 구간의 제1 시계열 변수의 측정 값으로 매트릭스의 제1 행을 구성하고, 특정 시계열 구간의 제2 시계열 변수의 측정 값으로 상기 매트릭스의 제2 행을 구성함으로써, 매트릭스가 생성될 수 있을 것이기 때문이다.
다시 도 6을 참조하면, 단계(S70)에서, 분석 장치(100)는 매트릭스에 매칭되는 패턴의 발생 빈도를 기초로 예측 대상의 클래스를 예측한다.
가령, 예측 대상의 클래스가 이상 클래스와 정상 클래스인 경우, 분석 장치(100)는 상기 패턴의 발생 빈도가 임계 값 미만이라는 판정에 응답하여, 예측 대상의 클래스를 이상 클래스로 예측할 수 있다. 발생 빈도가 낮은 희귀 패턴은 이상 클래스에 가까울 확률이 높기 때문이다. 여기서, 상기 임계 값은 기 설정된 고정 값 또는 상황에 따라 변동되는 변동 값일 수 있다.
단계(S90)에서, 분석 장치(100)는 복수의 시계열 변수 중에서 클래스 판정에 가장 영향을 미친 주영향 변수를 결정한다. 가령, 예측 대상의 클래스가 이상 클래스로 예측된 경우, 분석 장치(100)는 복수의 시계열 변수 중에서 이상 판정에 가장 영향을 미친 주영향 변수를 결정할 수 있다. 이하, 도 13 및 도 15를 참조하여 본 단계(S90)에 대하여 상세하게 설명하도록 한다.
도 13 내지 도 15는 이상 클래스에 대한 주영향 변수를 결정하는 과정을 설명하기 위한 예시도이다. 이해의 편의를 제공하기 위해, 도 13 내지 도 15는 예측 대상의 클래스가 정상과 이상으로 구분되는 경우를 예로써 도시하고 있으나, 셋 이상의 다중 클래스가 존재하는 경우에도 이하의 서술 내용은 동일하게 적용될 수 있다. 또한, 이하의 도면에서 매트릭스 상에 음영으로 도시된 부분은 블라인드 필터(blind filter)가 적용된 부분을 가리키며, 블라인드 필터는 개념적으로 해당 부분의 값이 유사도 연산 과정에서 제외된다는 것을 의미한다. 상기 유사도 연산 과정에 해당 부분의 값을 제외하는 구체적인 방식은 해당 부분의 값을 "0"으로 치환하거나, 임의의 값으로 변경하는 등이 될 수 있을 것이나, 이는 어떠한 방식으로 구현되더라도 무방하다. 이하, 도 13을 참조하여 설명한다.
도 13에 도시된 바와 같이, 분석 장치(100)는 정상으로 기 분류된 다수의 매트릭스(253 내지 257, 이하 "정상 매트릭스"로 칭함) 중에서 이상 클래스로 예측된 매트릭스(251, 이하 "이상 매트릭스"로 칭함)와 매칭되는 것이 있는지 탐색한다. 이때, 상기 매칭 조건은 매트릭스 간 유사도가 임계 값 이상인 조건을 의미하는 것일 수 있으나, 상기 매칭 조건은 실시예에 따라 얼마든지 달라질 수 있다.
보다 구체적으로 설명하면, 분석 장치(100)는 블라인드 필터를 각 행 별(즉, 시계열 변수 별)로 적용한 다음, 이상 매트릭스(251)와 제1 정상 매트릭스(253) 간의 유사도를 산출한다. 가령, 분석 장치(100)는 두 매트릭스(251, 253)의 첫 행(251-1, 253-1)에 블라인드 필터를 적용하고, 매트릭스 유사도를 산출하며, 이와 같은 과정을 마지막 행(251-2, 253-2)까지 반복할 수 있다. 이때, 상기 유사도를 산출하는 방식은 어떠한 방식이 되더라도 무방할 것이다.
위와 같은 과정은, 다른 정상 매트릭스(e.g. 제2 정상 매트릭스(255), 제3 정상 매트릭스(257) 등)에 대해서도 동일하게 수행될 수 있다. 분석 장치(100)는 매칭 조건을 만족하는 정상 매트릭스가 발견될 때까지 상기와 같은 탐색 과정을 수행할 수 있고, 주어진 모든 정상 매트릭스에 대해서 상기와 같은 탐색 과정을 수행할 수도 있다.
매칭되는 정상 매트릭스가 발견되면, 곧바로 주영향 변수가 결정될 수 있다. 가령, 제1 행(251-1)에 블라인드 필터가 적용되었을 때, 매칭되는 정상 매트릭스가 발견되었다고 가정하자. 그러면, 분석 장치(100)는 제1 행(251)에 대응되는 제1 시계열 변수를 주영향 변수로 결정할 수 있다. 상기 제1 시계열 변수의 측정 값을 제외했을 때 이상 매트릭스(251)가 정상 매트릭스에 가깝다는 것은, 상기 제1 시계열 변수의 측정 값이 이상 판정에 가장 큰 영향을 끼쳤다는 것을 의미하기 때문이다.
한편, 매칭된 정상 매트릭스가 다수 발견되어, 둘 이상의 시계열 변수가 주영향 변수로 결정되는 경우가 있을 수 있다. 예를 들어, 제1 행(251-1) 외에 다른 행(e.g. 마지막 행 251-2)에 블라인드 필터가 적용되었을 때도 매칭되는 정상 매트릭스가 발견되어, 2개의 시계열 변수가 주영향 변수로 결정될 수 있다. 이와 같은 경우, 분석 장치(100)는 소정의 기준에 따라 주영향 변수의 순위를 결정할 수 있다. 예를 들어, 제1 시계열 변수와 제2 시계열 변수가 주영향 변수로 결정되고, 상기 제1 시계열 변수와 연관된 매트릭스 유사도(즉, 제1 시계열 변수가 블록킹 되었을 때 산출된 매트릭스 유사도)가 상기 제2 시계열 변수와 연관된 매트릭스 유사도보다 높은 경우, 상기 제1 시계열 변수가 선순위의 주영향 변수로 결정될 수 있다. 다른 예를 들어, 제1 시계열 변수와 연관된 정상 매트릭스(즉, 제1 시계열 변수가 블록킹 되었을 때 매칭된 정상 매트릭스)의 개수가 제2 시계열 변수와 연관된 정상 매트릭스의 개수보다 많은 경우, 상기 제1 시계열 변수가 선순위의 주영향 변수로 결정될 수 있다.
한편, 통상적으로 정상 매트릭스의 개수는 매우 많을 것이기 때문에, 모든 정상 매트릭스와의 유사도를 산출하는 것은 컴퓨팅 비용 측면에서 매우 비효율적이다. 따라서, 적정한 기준에 따라 유사도 산출 대상이 되는 정상 매트릭스를 선별할 필요가 있다. 본 발명의 실시예에 따르면, LSH(Locality Sensitive Hashing) 알고리즘을 적용하여 유사도 산출 대상 매트릭스가 선별될 수 있는데, 이하 본 실시예에 대하여 도 14 및 도 15를 참조하여 설명하도록 한다.
도 14에 도시된 바와 같이, 매트릭스(261-1 내지 261-n) 중에서, 제1 매트릭스(261-1)는 이상 매트릭스이고, 나머지 매트릭스(261-2 내지 261-n)는 정상 매트릭스이다. 분석 장치(100)는 최소 해싱(min-hashing)을 통해 각 매트릭스(261-1 내지 261-n)로부터 시그니처 벡터(signature vector, 263-1 내지 263-n) 또는 시그니처 매트릭스(이하, "시그니처"로 통칭함)를 생성한다. 상기 최소 해싱은 유사성(e.g. 자카르드 유사성)을 보존하며 큰 집합을 작은 크기의 시그니처로 변환하는 기법이다. 상기 최소 해싱은 이미 당해 기술 분야에서 널리 알려진 기술인 바, 이에 대한 자세한 설명은 생략하도록 한다.
다음으로, 도 15에 도시된 바와 같이, 분석 장치(100)는 생성된 시그니처(263-1 내지 263-n)를 종합하여 매트릭스(265)를 생성한다. 또한, 분석 장치(100)는 LSH 알고리즘을 적용하여 매트릭스(265)를 b개의 밴드(band)로 구분하고, 각 밴드에 대한 해시 값을 산출한다. 도 15에 도시된 버킷(bucket)은 동일한 해시 값을 갖는 밴드의 집합을 개념적으로 가리키는 것이다.
여기서, 분석 장치(100)는 제1 시그니처(263-1)를 구성하는 밴드(e.g. 266)와 동일한 버킷에 존재하는 정상 매트릭스(e.g. 시그니처 263-k의 매트릭스)를 유사도 산출 대상 매트릭스를 선정할 수 있다. 예를 들어, 제1 시그니처(263-1)의 특정 밴드(266)와 제k 시그니처(263-k)의 밴드(267)는 동일한 버킷에 존재하므로, 제k 시그니처(263-k)가 가리키는 정상 매트릭스가 유사도 산출 대상 매트릭스로 선정될 수 있다. 최소 해싱과 LSH 알고리즘의 특성 상, 일부 밴드의 해시 값이 동일한 두 매트릭스는 서로 유사할 가능성이 높기 때문이다.
분석 장치(100)는 제1 시그니처(263-1)를 구성하는 b개의 밴드 중에서 제1 밴드와 동일 버킷에 존재하는 제1 정상 매트릭스들과 제2 밴드와 동일 버킷에 존재하는 제2 정상 매트릭스들을 모두 유사도 산출 대상으로 선정할 수 있다. 또는, 상기 제1 정상 매트릭스들과 상기 제2 정상 매트릭스들의 교집합에 속한 매트릭스들만이 유사도 산출 대상으로 선정될 수도 있다.
상술한 실시예에 따르면, 유사도가 높을 것으로 예측되는 일부 정상 매트릭스가 선별되고, 선별된 정상 매트릭스에 대해서만 매트릭스 유사도 연산이 수행되는 바, 주영향 변수 결정에 소요되는 컴퓨팅 비용이 크게 절감될 수 있다.
한편, 본 발명의 다른 실시예에 따르면, 분석 장치(100)는 클러스터링 기법을 통해 유사도 산출 대상 매트릭스를 선정할 수도 있다. 구체적으로, 분석 장치(100)는 정상 매트릭스 집합을 클러스터링하여 기 설정된 개수의 클러스터를 구축하고, 각 클러스터의 대표 매트릭스를 유사도 산출 대상으로 선정할 수 있다. 본 실시예에 따르면, 정상 매트릭스에 대한 대표적인 패턴만을 유사도 산출 대상으로 선정함으로써, 컴퓨팅 비용이 크게 절감될 수 있다.
지금까지 도 13 내지 도 15를 참조하여 본 발명의 일 실시예에 따른 주영향 변수 결정 방법에 대하여 설명하였다. 상술한 방법에서, 예측 대상의 클래스를 정상과 이상 클래스로 한정하여 설명하였다. 그러나, 상기 주영향 변수 결정 방법은 임의의 제1 클래스에 대한 주영향 변수를 결정하는 경우에도 동일하게 수행될 수 있음에 유의하여야 한다. 가령, 제1 클래스로 예측된 제1 매트릭스와 제2 클래스에 해당하는 적어도 하나의 제2 매트릭스가 존재하고, 상기 제1 클래스에 대한 주영향 변수를 결정한다고 가정하자. 이와 같은 경우, 분석 장치(100)는 두 매트릭스에 블라인드 필터를 적용하고 상기 제1 매트릭스와 상기 제2 매트릭스 간의 유사도를 산출함으로써 상기 제1 클래스에 대한 주영향 변수를 결정할 수 있다.
한편, 본 발명의 실시예에 따르면, 제1 클래스에 대한 주영향 변수를 결정하기 위해 동일한 클래스의 매트릭스가 이용될 수도 있다. 가령, 현재 이상 클래스로 예측된 매트릭스가 제1 이상 매트릭스이고, 이상 클래스로 기 분류된 매트릭스가 제2 이상 매트릭스라고 가정하자. 그러면, 분석 장치(100)는 상기 제1 이상 매트릭스와 상기 이상 제2 매트릭스의 각 행 별로(즉, 시계열 변수 별로) 블라인드 필터를 적용한 다음 두 매트릭스 간의 유사도를 산출할 수 있다. 또한, 제1 시계열 변수와 연관된 매트릭스 유사도(즉, 제1 시계열 변수가 블록킹 되었을 때 산출된 유사도)가 다른 시계열 변수와 연관된 매트릭스 유사도가 임계 값 이상 낮은 경우(즉, 차이가 임계 값 이상인 경우), 상기 제1 시계열 변수가 이상 클래스에 대한 주영향 변수로 결정될 수 있다. 상기 제1 시계열 변수의 측정 값을 제외했을 때 특정 이상 매트릭스가 다른 이상 매트릭스와 가장 유사하지 않다는 것은, 상기 제1 시계열 변수의 측정 값이 이상 판정에 가장 큰 영향을 끼쳤다는 것을 의미하기 때문이다. 물론, 주영향 변수를 결정하는 조건은 실시예에 따라 얼마든지 변형될 수 있다.
참고로, 전술한 단계(S10 내지 S90) 중에서, 단계(S10)는 데이터 수집부(110)에 의해 수행되고, 단계(S30)는 전처리부(120)에 의해 수행될 수 있다. 또한, 단계(S50)는 매트릭스 생성부(130)에 의해 수행되고, 단계(S70)는 제1 분석부(141)에 의해 수행되며, 단계(S90)는 제1 주영향 변수 결정부(161)에 의해 수행될 수 있다.
지금까지 도 6 내지 도 15를 참조하여 본 발명의 제1 실시예에 따른 시계열 데이터 분석 방법에 대하여 설명하였다. 상술한 방법에 따르면, 다중 시계열 데이터가 2차원 데이터 구조의 매트릭스로 가공된다. 2차원의 데이터 구조는 시계열 데이터의 자기 상관 관계와 시계열 변수 간의 상관 관계를 함께 반영하기 위해 적합한 데이터 구조이다. 따라서, 다중 시계열 데이터를 분석하고 예측을 수행함에 있어서, 분석 및 예측의 정확도가 크게 개선될 수 있다. 나아가, 블라인드 필터를 활용하여 클래스 판정에 영향에 미친 주영향 변수가 정확하게 식별될 수 있다.
이하에서는, 도 16 내지 도 18을 참조하여 본 발명의 제2 실시예에 따른 시계열 데이터 분석 방법에 대하여 설명하도록 한다.
도 16은 본 발명의 제2 실시예에 따른 시계열 데이터 분석 방법을 나타내는 흐름도이다. 이하의 서술에서, 앞서 언급한 제1 실시예의 내용과 중복되는 사항은 명세서의 명료함을 위해 생략하도록 한다.
도 16에 도시된 바와 같이, 상기 제2 실시예의 전반적인 과정은 전술한 제1 실시예와 유사한다. 다만, 상기 제2 실시예에는 단계(S170, S190)에서 예측 모델에 기반하여 예측 대상의 클래스를 예측하고 주영향 변수를 결정하다는 점에서 전술한 제1 실시예와 차이가 있다.
상기 예측 모델은 예측 대상의 클래스를 예측하는데 이용하는 모델이다. 상기 예측 모델은 기계 학습을 통해 구축될 수 있으나, 예측 모델의 구체적인 구성 및 동작 방식은 실시예에 따라 달라질 수 있다.
일 실시예에서, 상기 예측 모델은 컨볼루션 신경망에 기반하여 구성될 수 있다. 컨볼루션 신경망은 2차원 이상의 데이터로부터 지역적 특징을 추출하는데 특화된 신경망이다. 따라서, 컨볼루션 신경망은 매트릭스 데이터에서 시계열 변수 간의 상관 관계를 고려하여 특징을 추출하는데 가장 적합한 모델이다. 몇몇 실시예에서, 상기 매트릭스를 컨볼루션 신경망에 입력하기 전에 상기 매트릭스의 값을 픽셀 값의 범위에 맞게 적절하게 보정하는 과정이 수행될 수 있다. 물론, 상기 보정 과정은 단계(S130)에서 다른 전처리 과정과 함께 수행될 수도 있다. 상기 컨볼루션 신경망은 이미지 분류 태스크에 특화된 신경망으로, 당해 기술 분야의 당업자라면 컨볼루션 신경망의 구성 및 동작에 대하여 자명하게 알 수 있을 것인 바, 이에 대한 자세한 설명은 생략하도록 한다.
본 실시예에서, 분석 장치(100)는 예측 모델에 의해 출력된 클래스 별 컨피던스 스코어에 기초하여 예측 대상의 클래스를 예측할 수 있다. 가령, 분석 장치(100)는 제1 클래스의 컨피던스 스코어가 가장 높다는 판정에 응답하여, 상기 예측 대상의 클래스를 상기 제1 클래스로 예측할 수 있다. 본 실시예에 따르면, 컨볼루션 신경망의 특성을 활용하여 정확한 분석 및 예측이 수행될 수 있다.
일 실시예에서, 상기 예측 모델은 컨볼루션 신경망과 순환 신경망(Recurrent Neural Network; RNN)의 조합에 기반하여 구성될 수 있다. 상기 순환 신경망은 순환적 연결 구조를 통해 시간 순서에 따른 특징을 추출하는데 특화된 신경망이다. 또한, 시계열 데이터는 일반적으로 자기 상관 관계를 갖고 있어 과거의 데이터가 현재의 데이터에 영향을 미치는 특성을 지닌다. 따라서, 두 신경망이 조합되면, 자기 상관 관계를 갖는 시계열 데이터의 특성이 보다 잘 고려될 수 있고, 다중 시계열 데이터에 대한 정확한 분석이 이루어질 수 있는 것이다.
보다 구체적인 예를 들어, 상기 예측 모델은 도 17에 도시된 바와 같이, 컨볼루션 신경망(273)과 순환 신경망의 일종인 LSTM(Long Short-Term Memory Model) 신경망(275)에 기반하여 구성될 수 있다. 이와 같은 경우, 컨볼루션 신경망(273)은 단계(150)에서 생성된 다수의 매트릭스(271-1 내지 271-n)를 입력받고, 다수의 매트릭스(271-1 내지 271-n)로부터 특징(e.g. 특징 맵)을 추출하는 동작을 수행하게 된다. 또한, LSTM 신경망(275)은 컨볼루션 신경망(273)에서 추출된 특징에 기반하여 예측 대상의 클래스 별 컨피던스 스코어를 출력하는 동작을 수행하게 된다. 이전 실시예와 마찬가지로, 분석 장치(100)는 클래스 별 컨피던스 스코어에 기초하여 예측 대상의 클래스를 예측할 수 있다.
본 실시예에 따르면, 컨볼루션 신경망과 순환 신경망의 조합을 통해 자기 상관 관계를 갖는 시계열 데이터의 특성이 심도있게 고려될 수 있다. 이에 따라, 분석 및 예측의 정확도는 더욱 향상될 수 있다.
다음으로, 단계(190)에서 주영향 변수를 결정하는 방법에 대하여 도 18을 참조하여 상세하게 설명하도록 한다.
도 18은 본 발명의 일 실시예에 따라 예측 모델을 이용하여 주영향 변수를 결정하는 방법을 설명하기 위한 예시도이다. 이해의 편의를 제공하기 위해, 도 18 또한 예측 대상의 클래스가 정상과 이상으로 구분되는 경우를 예로써 도시하고 있으나, 셋 이상의 다중 클래스가 존재하는 경우에도 이하의 서술 내용은 동일하게 적용될 수 있다. 이하, 도 18을 참조하여 설명한다.
도 18에 도시된 바와 같이, 분석 장치(100)는 특정 행(즉, 시계열 변수)에 블라인드 필터가 적용된 이상 매트릭스(281)를 예측 모델에 적용하여 클래스 별 컨피던스 스코어(283, 285)를 획득할 수 있다. 가령, 분석 장치(100)는 이상 매트릭스(281)의 첫 행(281-1)에 블라인드 필터를 적용하여 컨피던스 스코어(283)를 산출하고, 이와 같은 과정을 마지막 행(281-2)까지 반복할 수 있다.
여기서, 분석 장치(100)는 복수의 시계열 변수 중에서 연관된 클래스 별 컨피던스 스코어(즉, 해당 시계열 변수가 블록킹 되었을 때 산출된 컨피던스 스코어)가 소정의 조건을 만족하는 특정 시계열 변수를 주영향 변수로 결정할 수 있다.
이때, 상기 소정의 조건은 상기 특정 시계열 변수와 연관된 정상 클래스의 컨피던스 스코어(이하, "정상 컨피던스 스코어")가 임계 값 이상인 경우를 가리키는 제1 조건, 상기 특정 시계열 변수와 연관된 정상 컨피던스 스코어가 본래(즉, 블라인드 필터가 전혀 적용되지 않은 경우)보다 임계 값 이상 높은 경우(즉, 차이가 임계치 이상인 경우)를 가리키는 제2 조건 또는 상기 특정 시계열 변수와 연관된 정상 컨피던스 스코어가 다른 시계열 변수와 연관된 정상 컨피던스 스코어보다 임계 값 이상 높은 제3 조건을 포함할 수 있다.
또는, 상기 소정의 조건은 상기 특정 시계열 변수와 연관된 이상 클래스의 컨피던스 스코어(이하, "이상 컨피던스 스코어")가 임계 값 미만인 경우를 가리키는 제4 조건, 상기 특정 시계열 변수와 연관된 이상 컨피던스 스코어가 본래(즉, 블라인드 필터가 전혀 적용되지 않은 경우)보다 임계 값 이상 낮은 경우(즉, 차이가 임계치 이상인 경우)를 가리키는 제5 조건 또는 상기 특정 시계열 변수와 연관된 이상 컨피던스 스코어가 다른 시계열 변수와 연관된 이상 컨피던스 스코어보다 임계 값 이상 낮은 경우를 가리키는 제6 조건을 포함할 수 있다. 그러나, 상기 열거된 조건의 예시는 본 발명의 일부 실시예를 설명하기 위한 것이므로, 본 발명의 기술적 범위가 상기 열거된 예시에 한정되는 것은 아니다.
참고로, 전술한 단계(S170) 중에서 단계(170)는 제2 분석부(143)에 의해 수행되고, 단계(S190)는 제2 주영향 변수 결정부(163)에 의해 수행될 수 있다.
지금까지 도 16 내지 도 18을 참조하여 본 발명의 제2 실시예에 대한 시계열 데이터 분석 방법에 대하여 설명하였다. 상술한 방법에 따르면, 컨볼루션 신경망 기반의 예측 모델을 통해 다중 시계열 데이터에 대한 분석 및 예측이 수행될 수 있다. 상기 컨볼루션 신경망은 2차원 이상의 데이터에서 지역적 특징을 추출하는데 특화된 기계 학습 모델이다. 따라서, 분석 및 예측 과정에 시계열 변수의 상관 관계가 잘 반영될 수 있으며, 이에 따라 시계열 데이터에 대한 분석 및 예측의 정확도가 크게 향상될 수 있다. 나아가, 제1 실시예와는 달리 예측 모델과 블라인드 필터를 활용함으로써, 유사 매트릭스를 탐색하는 과정 없이, 간이한 방식으로 주영향 변수가 식별될 수 있다.
이하에서는, 보다 이해의 편의를 제공하기 위해, 도 19를 참조하여 본 발명의 기술적 사상이 공정 이상 탐지 분야에 활용된 예에 대하여 간략하게 설명하도록 한다.
도 19는 본 발명의 일 활용예에 따른 공정 이상 탐지 시스템을 나타내는 구성도이다.
도 19에 도시된 바와 같이, 전술한 본 발명의 기술적 사상은 이상 탐지 장치(300)를 통해 구체화될 수 있다.
이상 탐지 장치(300)는 다수의 센서(320-1 내지 320-n)의 측정 값으로 구성된 다중 시계열 데이터를 분석하여 실시간으로 공정 설비(310)의 이상을 탐지하는 장치이다.
이상 탐지 장치(300)는 상기 다중 시계열 데이터로부터 매트릭스를 생성하고, 상기 매트릭스를 분석하여 공정 설비(310)의 이상 여부를 판정할 수 있다. 예를 들어, 전술한 제1 실시예(e.g. 도 6 참조)와 마찬가지로, 이상 탐지 장치(300)는 매트릭스에 매칭되는 패턴의 발생 빈도가 임계치 미만이라는 판정에 응답하여, 공정 설비(310)에 이상이 있는 것으로 판정할 수 있다. 다른 예를 들어, 전술한 제2 실시예(e.g. 도 16 참조)와 마찬가지로, 이상 탐지 장치(300)는 예측 모델의 컨피던스 스코어에 기초하여 공정 설비(310)의 이상 여부를 판정할 수 있다. 또한, 이상 판정에 응답하여, 이상 탐지 장치(300)는 관리자에게 소정의 알람을 제공할 수 있다. 이를 통해, 제조 공정의 효율이 향상될 뿐만 아니라, 관리의 편의성이 증대되는 효과가 달성될 수 있다.
나아가, 이상 탐지 장치(300)는 다수의 시계열 변수(즉, 센서의 측정 변수) 중에서 이상 판정에 가장 영향을 미친 주영향 변수를 결정할 수 있다. 이를 통해, 이상 발생 요인에 대한 정보가 관리자에게 추가로 제공될 수 있는 바, 제조 공정의 효율과 관리의 편의성이 더욱 증대될 수 있다.
한편, 본 발명의 다른 실시예에 따르면, 이상 탐지 장치(300)는 전술한 제1 실시예와 제2 실시예의 조합에 기초하여 이상 탐지를 수행할 수도 있다. 구체적으로, 이상 탐지 장치(300)는 상기 제1 실시예에 따라 이상 탐지를 수행하며 트레이닝 데이터셋을 축적하고, 축적된 트레이닝 데이터셋을 이용하여 예측 모델을 트레이닝하며, 이후 상기 제2 실시예에 따라 예측 모델 기반으로 이상 탐지를 수행할 수 있다.
부연 설명하면, 상기 제1 실시예에 따라 이상 탐지를 수행함으로써, 패턴의 발생 빈도에 기반하여 매트릭스에 클래스 레이블을 부여하는 레이블링(labelling) 작업이 수행될 수 있다. 레이블링 작업이 수행된 이상 매트릭스와 정상 매트릭스는 예측 모델의 트레이닝 데이터셋으로 활용될 수 있다. 즉, 이상 탐지 장치(300)는 상기 트레이닝 데이터셋으로 예측 모델을 트레이닝할 수 있다. 상기 예측 모델이 충분히 트레이닝되면, 상기 제2 실시예에 따라 이상 탐지가 수행될 수 있다.
몇몇 실시예에서, 이상 탐지 장치(100)는 상기 제1 실시예에 따른 제1 이상 탐지와 상기 제2 실시예에 따른 제2 이상 탐지를 병행할 수도 있다. 이때, 이상 탐지 장치(100)는 예측 모델의 학습 성숙도에 비례하여 상기 제1 이상 탐지 프로세스와 상기 제2 이상 탐지의 활용 비중을 조정할 수 있다. 가령, 이상 탐지 장치(100)는 상기 학습 성숙도가 올라갈수록 상기 제2 이상 탐지의 활용 비중을 증가시키고, 상기 제1 이상 탐지의 활용 비중은 감소시킬 수 있다. 기계 학습 모델의 학습 성숙도가 올라갈수록 모델의 정확도가 향상될 것이기 때문이다. 본 실시예에 따르면, 시간이 지남에 따라 예측 모델의 활용 비중을 증가시킴으로써, 이상 탐지의 정확도가 점진적으로 향상되는 효과가 달성될 수 있다.
지금까지 도 19를 참조하여 본 발명의 기술적 사상이 공정 이상 탐지 분야에 활용된 예에 대하여 간략하게 설명하였다. 상술한 바에 따르면, 시계열 변수 간의 상관 관계를 고려하여 이상 탐지를 수행함으로써, 이상 탐지의 정확도가 떨어지는 종래의 문제가 해결될 수 있다.
한편, 본 발명의 기술적 사상은 공정 이상 탐지 분야 뿐만 아니라 다중 시계열 데이터를 다루는 다양한 분야에 적용될 수 있음에 유의하여야 한다. 가령, 환율, 주가지수 등에 관한 다중 시계열 데이터를 분석하여 특정 자산(e.g. 주식, 부동산 등)의 가치 등락을 예측하는 경우에도, 전술한 본 발명의 기술적 사상들은 어떠한 실질적인 변경없이 그대로 적용될 수 있다. 나아가, 본 발명의 실시예들에 따르면, 환율, 주가지수 등의 영향 인자 중에서 상기 가치 등락에 가장 큰 영향을 미친 주영향 인자가 무엇인지까지 정확하게 식별될 수 있다.
지금까지 도 1 내지 도 19를 참조하여 본 발명의 몇몇 실시예들 및 그 실시예들에 따른 효과들을 언급하였다. 본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
지금까지 도 1 내지 도 19를 참조하여 설명된 본 발명의 개념은 컴퓨터가 읽을 수 있는 매체 상에 컴퓨터가 읽을 수 있는 코드로 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체는, 예를 들어 이동형 기록 매체(CD, DVD, 블루레이 디스크, USB 저장 장치, 이동식 하드 디스크)이거나, 고정식 기록 매체(ROM, RAM, 컴퓨터 구비 형 하드 디스크)일 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체에 기록된 상기 컴퓨터 프로그램은 인터넷 등의 네트워크를 통하여 다른 컴퓨팅 장치에 전송되어 상기 다른 컴퓨팅 장치에 설치될 수 있고, 이로써 상기 다른 컴퓨팅 장치에서 사용될 수 있다.
이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.
도면에서 동작들이 특정한 순서로 도시되어 있지만, 반드시 동작들이 도시된 특정한 순서로 또는 순차적 순서로 실행되어야만 하거나 또는 모든 도시 된 동작들이 실행되어야만 원하는 결과를 얻을 수 있는 것으로 이해되어서는 안 된다. 특정 상황에서는, 멀티태스킹 및 병렬 처리가 유리할 수도 있다. 더욱이, 위에 설명한 실시예들에서 다양한 구성들의 분리는 그러한 분리가 반드시 필요한 것으로 이해되어서는 안 되고, 설명된 프로그램 컴포넌트들 및 시스템들은 일반적으로 단일 소프트웨어 제품으로 함께 통합되거나 다수의 소프트웨어 제품으로 패키지 될 수 있음을 이해하여야 한다.
이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (18)

  1. 컴퓨팅 장치에서 복수의 시계열 변수 중 타깃 클래스(target class)에 대한 주영향 변수를 결정하는 방법에 있어서,
    상기 복수의 시계열 변수와 연관된 다중 시계열 데이터에서, 상기 타깃 클래스로 예측된 제1 매트릭스를 획득하는 단계;
    특정 클래스에 속한 제2 매트릭스를 획득하는 단계;
    상기 제1 매트릭스 및 상기 제2 매트릭스에서 제1 시계열 변수의 값을 제외하고, 두 매트릭스 간의 유사도를 산출하는 단계; 및
    상기 산출된 유사도가 소정의 조건을 만족한다는 판정에 응답하여, 상기 제1 시계열 변수를 상기 주영향 변수로 결정하는 단계를 포함하되,
    상기 제1 매트릭스의 제1 행 또는 제1 열은 제1 시계열 변수의 측정 값으로 구성되고,
    상기 제1 매트릭스의 제2 행 또는 제2 열은 제2 시계열 변수의 측정 값으로 구성되는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  2. 제1 항에 있어서,
    상기 특정 클래스는 상기 타깃 클래스와 다른 클래스이고,
    상기 주영향 변수로 결정하는 단계는,
    상기 산출된 유사도가 임계 값 이상이라는 판정에 응답하여, 상기 제1 시계열 변수를 상기 주영향 변수로 결정하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  3. 제1 항에 있어서,
    상기 특정 클래스는 상기 타깃 클래스와 동일한 클래스이고,
    상기 주영향 변수로 결정하는 단계는,
    상기 산출된 유사도가 임계 값 미만이라는 판정에 응답하여, 상기 제1 시계열 변수를 상기 주영향 변수로 결정하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  4. 제1 항에 있어서,
    상기 제1 매트릭스를 획득하는 단계는,
    상기 다중 시계열 데이터에서 기 설정된 시계열 구간의 데이터를 추출하여 상기 제1 매트릭스를 생성하는 단계; 및
    상기 제1 매트릭스의 분석 결과에 기반하여 상기 제1 매트릭스의 클래스를 상기 타깃 클래스로 예측하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  5. 제4 항에 있어서,
    상기 타깃 클래스는 이상 클래스이고,
    상기 타깃 클래스로 예측하는 단계는,
    상기 제1 매트릭스와 매칭된 제1 패턴의 발생 빈도가 임계치 미만이라는 판정에 응답하여, 상기 제1 매트릭스의 클래스를 상기 이상 클래스로 예측하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  6. 제4 항에 있어서,
    상기 제1 매트릭스를 생성하는 단계는,
    상기 다중 시계열 데이터를 정규화하는 단계; 및
    상기 정규화된 다중 시계열 데이터를 기초로 상기 제1 매트릭스를 생성하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  7. 제6 항에 있어서,
    상기 정규화된 다중 시계열 데이터를 기초로 상기 제1 매트릭스를 생성하는 단계는,
    SAX(Symbolic Aggregate approximation) 변환을 통해 상기 정규화된 다중 시계열 데이터를 심볼화하는 단계; 및
    상기 심볼화된 다중 시계열 데이터를 기초로 상기 제1 매트릭스를 생성하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  8. 제4 항에 있어서,
    상기 제1 매트릭스를 생성하는 단계는,
    시간 축 및 시계열 변수 축에 의해 형성되는 데이터 평면 상에, 상기 시계열 변수 축을 따라 상기 제1 시계열 변수 및 상기 제2 시계열 변수에 관한 측정 값을 배열하는 단계; 및
    상기 데이터 평면 상에서 슬라이딩 윈도우(sliding window)에 대응되는 측정 값을 추출하여 상기 제1 매트릭스를 생성하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  9. 제4 항에 있어서,
    상기 타깃 클래스로 예측하는 단계는,
    컨볼루션 신경망(convolutional neural network)으로 구성된 예측 모델에 상기 제1 매트릭스를 입력하는 단계; 및
    상기 예측 모델의 출력 결과에 기초하여 상기 제1 매트릭스의 클래스를 상기 타깃 클래스로 예측하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  10. 제1 항에 있어서,
    상기 제2 매트릭스를 획득하는 단계는,
    상기 특정 클래스에 속한 복수의 후보 매트릭스를 획득하는 단계; 및
    LSH(Locality Sensitive Hashing) 알고리즘을 적용하여 상기 복수의 후보 매트릭스 중에서 제2 매트릭스를 선정하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  11. 컴퓨팅 장치에서 복수의 시계열 변수 중 특정 클래스에 대한 주영향 변수를 결정하는 방법에 있어서,
    상기 복수의 시계열 변수와 연관된 다중 시계열 데이터에서 기 설정된 시계열 구간의 데이터를 추출하여 제1 매트릭스를 생성하는 단계;
    상기 제1 매트릭스를 예측 모델에 입력하고, 상기 예측 모델로부터 출력된 제1 컨피던스 스코어(confidence score)에 기반하여 상기 제1 매트릭스의 클래스를 제1 클래스로 예측하는 단계; 및
    상기 제1 클래스에 대한 주영향 변수를 결정하는 단계를 포함하되,
    상기 제1 매트릭스의 제1 행 또는 제1 열은 제1 시계열 변수의 측정 값으로 구성되고,
    상기 제1 매트릭스의 제2 행 또는 제2 열은 제2 시계열 변수의 측정 값으로 구성되며,
    상기 주영향 변수를 결정하는 단계는,
    상기 제1 시계열 변수의 값이 제외된 상기 제1 매트릭스를 상기 예측 모델에 다시 입력하여, 제2 컨피던스 스코어를 획득하는 단계; 및
    상기 제2 컨피던스 스코어가 소정의 조건을 만족한다는 판정에 응답하여, 상기 제1 시계열 변수를 상기 제1 클래스의 주영향 변수로 결정하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  12. 제11 항에 있어서,
    상기 제1 컨피던스 스코어는 상기 제1 클래스에 대한 컨피던스 스코어이고,
    상기 제2 컨피던스 스코어는 제2 클래스에 대한 컨피던스 스코어이며,
    상기 제1 시계열 변수를 상기 제1 클래스의 주영향 변수로 결정하는 단계는,
    상기 제2 컨피던스 스코어가 임계 값 이상이라는 판정에 응답하여, 상기 제1 시계열 변수를 상기 제1 클래스의 주영향 변수로 결정하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  13. 제11 항에 있어서,
    상기 제1 컨피던스 스코어와 상기 제2 컨피던스 스코어는 모두 상기 제1 클래스에 대한 컨피던스 스코어이고,
    상기 제1 시계열 변수를 상기 제1 클래스의 주영향 변수로 결정하는 단계는,
    상기 제1 컨피던스 스코어와 상기 제2 컨피던스 스코어의 차이가 소정의 조건을 만족한다는 판정에 응답하여, 상기 제1 시계열 변수를 상기 주영향 변수로 결정하는 단계를 포함하는 것을 특징으로 하는,
    주영향 변수 결정 방법.
  14. 컴퓨팅 장치에서 예측 대상과 연관된 다중 시계열 데이터를 분석하는 방법에 있어서,
    상기 다중 시계열 데이터에서 기 설정된 시계열 구간의 데이터를 추출하여, 2차원의 제1 매트릭스를 생성하는 단계; 및
    상기 제1 매트릭스를 컨볼루션 신경망(convolutional neural network) 기반의 예측 모델에 입력하여, 상기 예측 대상의 클래스를 예측하는 단계를 포함하되,
    상기 다중 시계열 데이터는 제1 시계열 변수 및 제2 시계열 변수의 측정 값을 포함하고,
    상기 제1 매트릭스의 제1 행 또는 제1 열은 상기 시계열 구간에 대한 상기 제1 시계열 변수의 측정 값으로 구성되며,
    상기 제1 매트릭스의 제2 행 또는 제2 열은 상기 시계열 구간에 대한 상기 제2 시계열 변수의 측정 값으로 구성되는 것을 특징으로 하는,
    시계열 데이터 분석 방법.
  15. 제14 항에 있어서,
    상기 제1 매트릭스를 생성하는 단계는,
    시간 축 및 시계열 변수 축에 의해 형성되는 데이터 평면 상에, 상기 시계열 변수 축을 따라 상기 제1 시계열 변수 및 상기 제2 시계열 변수에 관한 측정 값을 배열하는 단계; 및
    상기 데이터 평면 상에서 슬라이딩 윈도우(sliding window)에 대응되는 측정 값을 추출하여 상기 제1 매트릭스를 생성하는 단계를 포함하는 것을 특징으로 하는,
    시계열 데이터 분석 방법.
  16. 제15 항에 있어서,
    상기 시계열 변수 축 상에서, 상기 제1 시계열 변수와 상기 제2 시계열 변수의 배열 위치는,
    상기 제1 시계열 변수와 상기 제2 시계열 변수의 상관 분석 결과에 기초하여 결정되는 것을 특징으로 하는,
    시계열 데이터 분석 방법.
  17. 제14 항에 있어서,
    상기 예측 모델은 순환 신경망(recurrent neural network)에 더 기반한 것이고,
    상기 예측 대상의 클래스를 예측하는 단계는,
    상기 컨볼루션 신경망에 상기 제1 매트릭스를 입력하여 특징 맵을 추출하는 단계; 및
    상기 추출된 특징 맵을 상기 순환 신경망에 입력하고, 상기 순환 신경망의 출력 결과에 기초하여 상기 예측 대상의 클래스를 예측하는 단계를 포함하는 것을 특징으로 하는,
    시계열 데이터 분석 방법.
  18. 제14 항에 있어서,
    상기 예측 대상의 클래스는 정상 클래스 및 이상 클래스를 포함하고,
    상기 예측 모델을 트레이닝하는 단계를 더 포함하되,
    상기 예측 모델을 트레이닝하는 단계는,
    기 수집된 다중 시계열 데이터를 기초로 복수의 트레이닝용 매트릭스를 생성하는 단계;
    상기 복수의 트레이닝용 매트릭스 중에서 매칭된 패턴의 발생 빈도가 임계치 미만인 매트릭스에 이상 클래스를 부여하고, 나머지 매트릭스에 정상 클래스를 부여함으로써, 트레이닝 데이터셋을 생성하는 단계; 및
    상기 트레이닝 데이터셋을 이용하여 상기 예측 모델을 트레이닝하는 단계를 포함하는 것을 특징으로 하는,
    시계열 데이터 분석 방법.
KR1020180128528A 2018-10-25 2018-10-25 시계열 데이터 분석 방법, 주영향 변수 결정 방법 및 그 방법들을 지원하는 장치 KR102472637B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180128528A KR102472637B1 (ko) 2018-10-25 2018-10-25 시계열 데이터 분석 방법, 주영향 변수 결정 방법 및 그 방법들을 지원하는 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180128528A KR102472637B1 (ko) 2018-10-25 2018-10-25 시계열 데이터 분석 방법, 주영향 변수 결정 방법 및 그 방법들을 지원하는 장치

Publications (2)

Publication Number Publication Date
KR20200052425A KR20200052425A (ko) 2020-05-15
KR102472637B1 true KR102472637B1 (ko) 2022-11-29

Family

ID=70679134

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180128528A KR102472637B1 (ko) 2018-10-25 2018-10-25 시계열 데이터 분석 방법, 주영향 변수 결정 방법 및 그 방법들을 지원하는 장치

Country Status (1)

Country Link
KR (1) KR102472637B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102325137B1 (ko) * 2021-01-11 2021-11-11 부산대학교 산학협력단 미세먼지 예측 정확도 향상을 위한 하이브리드 딥러닝 모델 생성 장치 및 방법
KR20220126014A (ko) 2021-03-08 2022-09-15 포항공과대학교 산학협력단 시계열 데이터의 이상 구간 탐지 방법 및 장치
KR102427205B1 (ko) * 2021-11-22 2022-08-01 한국건설기술연구원 인공지능 모델을 위한 학습 데이터 생성 장치 및 방법
KR20230146271A (ko) * 2022-04-12 2023-10-19 (주)심플랫폼 텐서 기반의 상태 스코어 도출 시스템 및 방법
KR102640983B1 (ko) * 2022-12-21 2024-02-23 재단법인차세대융합기술연구원 극단치와 증감 추세를 반영하여 시계열 데이터를 기호화하는 분석 서버 및 그것의 데이터 분석 방법
CN117269655B (zh) * 2023-11-17 2024-02-06 国网山东省电力公司东营供电公司 变电站电力设备温度异常监测方法、系统、终端及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116687A (ja) * 2017-01-13 2018-07-26 Jfeスチール株式会社 異常原因特定方法および異常原因特定装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101554216B1 (ko) * 2013-06-18 2015-09-18 삼성에스디에스 주식회사 시계열 형태의 센싱 데이터 배드 패턴 검증 방법 및 그 장치
KR20160026492A (ko) 2014-09-01 2016-03-09 목포대학교산학협력단 시계열 분석 기반의 신뢰 구간 추정을 이용한 이상 감지 방법
KR101919543B1 (ko) * 2016-12-21 2019-02-08 주식회사 포스코 압연 공정의 운전성 장애 분석 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116687A (ja) * 2017-01-13 2018-07-26 Jfeスチール株式会社 異常原因特定方法および異常原因特定装置

Also Published As

Publication number Publication date
KR20200052425A (ko) 2020-05-15

Similar Documents

Publication Publication Date Title
KR102472637B1 (ko) 시계열 데이터 분석 방법, 주영향 변수 결정 방법 및 그 방법들을 지원하는 장치
Hsu et al. Multiple time-series convolutional neural network for fault detection and diagnosis and empirical study in semiconductor manufacturing
Wang et al. Data-driven prognostic method based on self-supervised learning approaches for fault detection
KR102094377B1 (ko) 비지도학습 이상탐지를 위한 모델 선택 시스템 및 그 방법
KR20200052424A (ko) 시계열 데이터 세그먼테이션 방법 및 그 장치
US20180082215A1 (en) Information processing apparatus and information processing method
Jones et al. Exemplar learning for extremely efficient anomaly detection in real-valued time series
US11657121B2 (en) Abnormality detection device, abnormality detection method and computer readable medium
EP3333757B1 (en) Predictive anomaly detection
KR20170078252A (ko) 시계열의 데이터를 모니터링 하는 방법 및 그 장치
CN110858072B (zh) 设备运行状态的确定方法及装置
US20230385699A1 (en) Data boundary deriving system and method
Silva et al. Assets predictive maintenance using convolutional neural networks
Ünlü Cost-oriented LSTM methods for possible expansion of control charting signals
Aldrich et al. Fault detection and diagnosis with random forest feature extraction and variable importance methods
CN117349583A (zh) 用于低温液体储罐的智能检测方法及系统
Elmasry et al. Detection of faults in electrical power grids using an enhanced anomaly-based method
WO2020026442A1 (en) Event monitoring apparatus, method and program recording medium
CN116974268B (zh) 一种控制系统电路智能化监测预警方法
Li et al. A two-phase filtering of discriminative shapelets learning for time series classification
Zeydan et al. Cloud 2 HDD: large-scale HDD data analysis on cloud for cloud datacenters
Yassaie et al. Data-Driven Fault Classification in Large-Scale Industrial Processes Using Reduced Number of Process Variables
CN110874601B (zh) 识别设备运行状态的方法、状态识别模型训练方法及装置
US10372719B2 (en) Episode mining device, method and non-transitory computer readable medium of the same
Suh et al. Metaheuristic-based time series clustering for anomaly detection in manufacturing industry

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant