KR20200005202A - 기계 학습 기반의 설비 이상 탐지 시스템 및 방법 - Google Patents
기계 학습 기반의 설비 이상 탐지 시스템 및 방법 Download PDFInfo
- Publication number
- KR20200005202A KR20200005202A KR1020180078622A KR20180078622A KR20200005202A KR 20200005202 A KR20200005202 A KR 20200005202A KR 1020180078622 A KR1020180078622 A KR 1020180078622A KR 20180078622 A KR20180078622 A KR 20180078622A KR 20200005202 A KR20200005202 A KR 20200005202A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- svr
- machine learning
- model
- abnormality
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0243—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0221—Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Automation & Control Theory (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
본 발명에 따른 기계 학습 기반의 설비 이상 탐지 방법은, 설비에서 수집되는 대량의 계측 데이터를 수집하고, 차원 축소를 통해 유의미한 변수를 추출하고, 해당 변수의 데이터 내에서 안정화 구간을 사전 정의된 규칙에 의해 자동으로 설정하는 데이터 전처리 과정; 다양한 분석 모델을 적용하기 위해 한 사이클의 계측 데이터를 대표할 수 있는 특질을 추출하는 특징 추출 과정; 및 이상 분류와 진단을 위해 대량의 데이터로부터 이상 탐지 모델을 생성하여 이상 데이터를 추출하는 이상 탐지 과정을 포함한다.
Description
본 발명은 기계 학습 기반의 설비 이상 탐지 시스템 및 방법에 관한 것으로, 보다 상세하게는 SVR(Support Vector Regression) 알고리즘과 k-NNDD(K-Nearest Neighbor Data Description) 알고리즘을 이용하여 CVD 반도체 장비 데이터의 정상/비정상 즉 이상 유/무를 탐지하는 시스템 및 방법에 관한 것이다.
설비 시스템에 결함이나 손상이 발생할 경우, 시스템의 가동 중단을 야기할 수 있으며 이로 인한 사회적, 경제적 피해의 규모는 막대하다. 따라서 고장이 발생하기 전에 예방정비를 실행하는 것이 중요하며 현재 대부분의 시스템은 일정한 시간 간격을 두고 실시하는 정기적 예방정비에 의존하고 있다. 그러나 정기적 예방정비는 부품의 실제 결함 유무와 관계없이 일정한 주기에 의해 실시되므로 정상 부품의 불필요한 교체로 인한 비용 손실을 발생시키고 갑작스런 시스템의 고장을 예방하는 데에 한계가 있다. 따라서 이러한 문제들을 해결하기 위해 최근 고장예지 및 건전성관리(PHM: prognostics and health management)기술이 활발히 연구되고 있다. 고장예지 및 건전성관리 기술은 설비 시스템의 상태를 실시간으로 감시하여 시스템의 이상을 조기에 감지하고 미래에 발생할 고장을 미리 예측한다. 따라서 적절한 조치를 미리 취함으로써 불필요한 유지보수 비용을 줄일 수 있고, 시스템의 안전성과 신뢰성을 높여 재앙적인 사고를 예방할 수 있다.
고장예지 및 건전성관리 기술에는 크게 두 가지 방법이 있다. 첫째로, 데이터주도방법(datadriven approach)은 데이터를 이용하여 시스템의 신뢰성, 건전성 정보를 통계적 방법으로 추론하는 것이다. 기계학습(machine learning)기법은 가장 많이 사용되는 기법으로 건전성인자와 고장 여부의 관계를 훈련하여 미래고장을 예측할 수 있다. 이 방법은 물리적 손상 모델을 구현하기 어려운 다변량 시스템에 적용이 가능하다는 장점이 있지만, 훈련을 위해 많은 양의 데이터가 필요하다. 다음으로 모델기반방법(model based approach)은 물리적 고장 모델을 기반으로 고장을 진단 및 예지한다. 이 방법은 정확도가 높으며 적은 양의 고장 데이터로 고장 진단이 가능하다. 모델의 변수를 바꿔줌으로써 다양한 운행 환경에서도 적용 가능하다. 그러나, 고장 메커니즘 파악이 어렵거나 모델 변수의 수가 매우 많은 경우 모델이 실제 고장 메커니즘을 온전히 구현하지 못하므로 적용 분야가 한정적이다.
공정 이상치 탐지 및 분류 그리고 진단에 대한 기술은 SPC 차트, k-NN, 데이터마이닝 기법, 인공신경망 등과 같은 다양한 방법론의 기술들이 연구되었고 진행되고 있다. 현 공정에서는 대표적인 공정관리도 방법으로써 SPC차트를 많이 사용한다. 하지만 SPC 차트는 관리한계도가 높아지는 현상 때문에 이상치에 대해 효과적으로 탐지하기 어려웠고 판정의 어려움으로 실 공정에서 나오는 데이터의 정상/비정상에 대한 판단여부도 불확실한 점이 있었다.
본 발명이 이루고자 하는 기술적 과제는 k-NNDD와 SVR을 통해 공정 데이터의 이상 여부를 확실히 탐지할 수 있는 설비 이상 탐지 시스템 및 방법을 제공하는데 있다.
상기 기술적 과제를 해결하기 위한 본 발명에 따른 기계 학습 기반의 설비 이상 탐지 방법은, 설비에서 수집되는 대량의 계측 데이터를 수집하고, 차원 축소를 통해 유의미한 변수를 추출하고, 해당 변수의 데이터 내에서 안정화 구간을 사전 정의된 규칙에 의해 자동으로 설정하는 데이터 전처리 과정; 다양한 분석 모델을 적용하기 위해 한 사이클의 계측 데이터를 대표할 수 있는 특질을 추출하는 특징 추출 과정; 및 이상 분류와 진단을 위해 대량의 데이터로부터 이상 탐지 모델을 생성하여 이상 데이터를 추출하는 이상 탐지 과정을 포함한다.
상기 데이터 전처리 과정에서의 차원 축소는, VIF(Variance Inflation Factor)를 이용한 1차 차원 축소 과정; 및 SVD(Singular Value Decomposition)를 이용한 2차 차원 축소 과정을 포함할 수 있다.
상기 데이터 전처리 과정에서의 안정화 구간 설정은, 데이터를 X-bar Chart에 입력하여 UCL, LCL값을 추출하고, 관리도 내에 소정 회수로 데이터가 들어오는 지점을 안정화 구간의 시작으로 설정할 수 있다.
상기 이상 탐지 과정은 SVR(Support Vector Regression) 모델 및 k-NNDD 모델을 이용할 수 있다.
SVR(Support Vector Regression) 모델을 이용한 상기 이상 탐지 과정은, 데이터 표준화를 수행하는 데이터 전처리 과정; SVR 커널을 선택하고, 커널 별 파라미터를 설정하고, Golden Line을 설정하고, Margin을 설정하는 SVR 학습 과정; 및 이상 데이터 수를 추출하고 Threshold 기준 이상을 탐지하는 SVR 예측 과정을 포함할 수 있다.
상기 SVR 학습 과정에서, Golden Line 설정 시, N개 cycle의 SVR-line (Laplacian Kernel)의 Median 값을 Golden Line으로 정의하고, Margin 설정 시, N초 별 SVR 값에 Whiskers 방법을 적용하여 Margin으로 설정할 수 있다.
k-NNDD 모델을 이용한 상기 이상 탐지 과정은, DTW distance를 계산하는 데이터 전처리 과정; 계측정 군집화를 수행하고, 정상 모델을 설정하고, k와 Threshold를 결정하는 k-NNDD 학습 과정; 및 상기 학습 과정에서 설정된 k개의 이웃 데이터로 Novelty score를 계산하여 Threshold를 초과할 경우 이상으로 탐지하는 k-NNDD 예측 과정을 포함할 수 있다.
상기된 본 발명에 의하면, k-NNDD와 SVR을 통해 공정 데이터의 이상 여부를 확실히 탐지할 수 있는 설비 이상 탐지 시스템 및 방법을 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 기계 학습 기반의 설비 이상 탐지/분류/진단 시스템의 전체적인 구성을 나타낸다.
도 2는 본 발명의 일 실시예에 따른 기계 학습 기반의 설비 이상 탐지/분류/진단 시스템의 전체 공정도를 나타낸다.
도 3은 데이터 전처리 과정의 일 예를 보여준다.
도 4는 CVD(Chemical vapor Deposition) 설비와 스토커(Stocker) 설비로부터 수집되는 데이터의 일 예를 보여준다.
도 5는 차원 축소 과정을 설명하는 도면이다.
도 6은 차원 축소 결과로서, 1차 차원 축소의 예를 보여준다.
도 7은 차원 축소 결과로서, 2차 차원 축소의 예를 보여준다.
도 8은 안정화 구간을 설정하는 과정의 일 예를 보여준다.
도 9는 특질 추출의 일 예를 보여준다.
도 10은 이상 탐지 과정의 일 예를 보여준다.
도 11은 SVR 모델을 적용하여 이상을 탐지하는 과정을 나타낸다.
도 12는 SVR 학습 과정에서 선택할 수 있는 SVR 커널들의 예를 보여준다.
도 13은 Golden Line과 Margin의 예를 보여준다.
도 14는 SVR 예측 결과 이상으로 탐지된 데이터의 예를 보여준다.
도 15는 k-NNDD 모델을 적용하여 이상을 탐지하는 과정을 나타낸다.
도 16은 DTW 알고리즘의 개념을 나타내는 도면이다.
도 17은 계층적 군집화를 통해 새로운 관측치로부터 정상 관측치가 얻어지는 것을 나타낸 도면이다.
도 18은 비모수 추정 방법을 활용한 k-NNDD의 이상치 탐지 기법의 개념을 나타낸다.
도 2는 본 발명의 일 실시예에 따른 기계 학습 기반의 설비 이상 탐지/분류/진단 시스템의 전체 공정도를 나타낸다.
도 3은 데이터 전처리 과정의 일 예를 보여준다.
도 4는 CVD(Chemical vapor Deposition) 설비와 스토커(Stocker) 설비로부터 수집되는 데이터의 일 예를 보여준다.
도 5는 차원 축소 과정을 설명하는 도면이다.
도 6은 차원 축소 결과로서, 1차 차원 축소의 예를 보여준다.
도 7은 차원 축소 결과로서, 2차 차원 축소의 예를 보여준다.
도 8은 안정화 구간을 설정하는 과정의 일 예를 보여준다.
도 9는 특질 추출의 일 예를 보여준다.
도 10은 이상 탐지 과정의 일 예를 보여준다.
도 11은 SVR 모델을 적용하여 이상을 탐지하는 과정을 나타낸다.
도 12는 SVR 학습 과정에서 선택할 수 있는 SVR 커널들의 예를 보여준다.
도 13은 Golden Line과 Margin의 예를 보여준다.
도 14는 SVR 예측 결과 이상으로 탐지된 데이터의 예를 보여준다.
도 15는 k-NNDD 모델을 적용하여 이상을 탐지하는 과정을 나타낸다.
도 16은 DTW 알고리즘의 개념을 나타내는 도면이다.
도 17은 계층적 군집화를 통해 새로운 관측치로부터 정상 관측치가 얻어지는 것을 나타낸 도면이다.
도 18은 비모수 추정 방법을 활용한 k-NNDD의 이상치 탐지 기법의 개념을 나타낸다.
이하에서는 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 이하 설명 및 첨부된 도면들에서 실질적으로 동일한 구성요소들은 각각 동일한 부호들로 나타냄으로써 중복 설명을 생략하기로 한다. 또한 본 발명을 설명함에 있어 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략하기로 한다.
도 1은 본 발명의 일 실시예에 따른 기계 학습 기반의 설비 이상 탐지/분류/진단 시스템의 전체적인 구성을 나타낸다.
본 발명의 일 실시예에 따른 설비 이상 탐지/분류/진단 시스템은 설비의 이상을 실시간으로 탐지하고 분류한 후 이상이 발생한 원인을 진단하는 시스템으로서, 데이터 전처리, 특질 추출, 이상 탐지, 이상 분류 라벨링, 이상 분류, 이상 진단의 과정을 포함한다.
도 2는 본 발명의 일 실시예에 따른 기계 학습 기반의 설비 이상 탐지/분류/진단 시스템의 전체 공정도를 나타낸다.
본 발명의 일 실시예에 따른 설비 이상 탐지/분류/진단 시스템은 설비 타입 별로 분석 모델을 선택하여 적용할 수 있는 유연성 있고 확장 가능한 프로세스로 구성된다. 또한 이상 탐지, 분류, 진단 과정은 각 모델 별로 학습(learning)과 예측(prediction)의 두 페이스(phase)로 구성된다.
데이터 전처리 과정은 데이터 수집, 차원 축소, 안정화구간 설정 과정을 포함한다.
특질 추출 과정은 데이터 영역 별 지표 추출 과정을 포함한다.
이상 탐지 과정은 SVR 모델 적용, k-NNDD 모델 적용 과정을 포함한다.
이상 분류 라벨링 과정은 군집 수 결정 및 군집화 과정을 포함한다.
이상 분류 과정은 k-NNDD 모델 적용, RNN-LSTM 모델 적용, MLP 모델 적용 과정을 포함한다.
이상 진단 과정은 MLP 모델 적용 과정을 포함한다.
도 3은 데이터 전처리 과정의 일 예를 보여준다.
데이터 전처리 과정에서는, 설비에서 수집되는 대량의 계측 데이터를 수집하여 유의미한 변수를 추출하고, 해당 변수의 데이터 내에서 안정화 구간을 사전 정의된 규칙에 의해 자동으로 설정한다.
도 4는 CVD(Chemical vapor Deposition) 설비와 스토커(Stocker) 설비로부터 수집되는 데이터의 일 예를 보여준다. 설비 타입에 따라 저장되는 데이터의 형태와 안정화 구간에 대한 정의가 다르기 때문에, 데이터 수집 과정에서 설비 별 초기 데이터를 로딩하기 위한 프로그래밍이 필요하다.
도 5는 차원 축소 과정을 설명하는 도면이다.
변수가 많을 경우 모델을 학습하고 예측하는 연산의 계산 복잡도가 증가하고, 노이즈로 인한 성능 손실 발생할 수 있으므로 비슷한 결과를 산출할 수 있는 최소의 변수를 선택한다. 변수 선택은 도메인 지식이 풍부한 엔지니어의 정성적 판단이 가장 중요하다. 정성적 판단이 어려울 경우 표준화 프로세스(종속변수 제거 및 특이값 분해)를 적용하여 정량적 기준으로 변수를 선택할 수 있다.
도 5를 참조하면, 1차로, 전체 데이터에서 종속 변수를 제거하여 차원을 축소한다.
VIF 값은 다음 수학식으로 표현된다.
VIF(Variance Inflation Factor)는 회귀분석에서 변수들 간 독립성을 확인하기 위해 쓰이는 지표로 해당 변수의 VIF 값이 높을수록 다른 독립변수들과 상관관계가 높음을 의미한다.
여기서, 단계적 VIF 방법을 사용할 수 있다. 즉, 1. 각 변수들의 VIF 값을 모두 측정하고; 2. 가장 큰 VIF 값을 가진 변수를 제거하고; 3. 남은 변수들의 VIF 값을 측정하고; 4. 2,3 과정을 모든 변수가 임계값(예컨대 10) 이하가 될 때까지 반복하여 최종적으로 남은 변수를 선택한다.
2차로, 특이값 분해 과정을 통해, 종속변수가 제거된 데이터에서 차원을 축소한다. SVD(Singular Value Decomposition)에서, 특이값 분해는 행렬 A를 회전부분 V, U와 증폭부분 ∑(특이값)로 분해하여 ∑의 원소들 중 큰 값들을 추출하여 차원을 축소한다. 이때 Truncated SVD 방법을 사용할 수 있다. A'와 코사인 유사도가 가장 높은 X들로 최종 변수를 선택한다.
도 6은 차원 축소 결과로서, 1차 차원 축소의 예를 보여준다. 도 6을 참조하면, VIF 테스트로 171개 변수 중 49개 변수를 추출하였다.
도 7은 차원 축소 결과로서, 2차 차원 축소의 예를 보여준다. 도 7을 참조하면, SVD 테스트로 49개 변수 중 40개 변수를 추출하였다. 2차 차원 축소를 통해 유의미한 변수가 추출되었다.
도 8은 안정화 구간을 설정하는 과정의 일 예를 보여준다.
안정화 구간 설정 과정에서, 계측 데이터의 유형에 따라 주요 관리 대상이 되는 안정화 구간의 정의는 다르나 일반화시킬 수 있는 기준을 적용하여 안정화 구간을 설정할 수 있다.
구체적으로, 전체 데이터를 X-bar Chart에 입력하여 UCL, LCL값을 추출하고, 관리도 내에 처음(다만 5회 연속 등으로 수정 가능)으로 데이터가 들어오는 지점을 안정화 구간의 시작으로 설정하고, 한 공정신호의 영역을 시작, 안정화구간, 끝의 세 스텝으로 구분한다.
도 9는 특질 추출의 일 예를 보여준다.
데이터 영역 별 지표 추출로서, 선택한 변수의 계측 데이터는 시계열 데이터이므로 다양한 분석 모델을 적용하기 위해 한 사이클의 계측 데이터를 대표할 수 있는 특질(설비 타입에 따라 중요도가 다를 수 있음)을 추출한다.
이상 탐지 과정은 이상 분류와 진단을 위해 대량의 데이터로부터 이상 탐지 모델을 생성하여 이상 데이터를 추출하는 과정이다.
구체적으로, One class classification 중 경계선을 통한 분류 방법(boundary method)인 SVR과 거리기반의 Novelty detection 방법인 k-NNDD 모델을 적용하여 공통적으로 탐지된 이상데이터를 수집하여 라벨링한다. 이때 0은 정상을, 1은 이상을 나타낸다.
도 10은 이상 탐지 과정의 일 예를 보여준다.
이상 탐지 과정에서는 SVR 모델을 적용한다. 정상 상태의 주기신호에 대한 평균을 나태는 함수(Golden Line)를 추정하기 위하여 비선형 regression 기법인 SVR 모델을 적용한다. 추정된 함수에 관리한계선(Margin)을 설정하고 이 경계를 벗어난 데이터(Outlier)의 비율(예컨대 Threshold, 10% 등)로 이상 여부를 판단할 수 있다.
도 11은 SVR 모델을 적용하여 이상을 탐지하는 과정을 나타낸다.
데이터 전처리 과정에서 데이터 표준화를 수행한다. SVR 모델이 다양한 타입의 계측 데이터에 범용적으로 적용될 수 있도록 데이터를 표준화한다.
SVR 학습 과정에서, SVR 커널을 선택하고, 커널 별 파라미터를 설정하고, Golden Line을 설정하고, Margin을 설정한다. 이때 데이터에 따라 적합한 SVR 커널을 선택하고 데이터를 학습하여 정상 데이터의 대표 함수와 관리한계선(Margin)을 설정한다.
SVR 예측 과정에서, 이상 데이터 수를 추출하고 Threshold 기준 이상을 탐지한다. 학습 단계에서 설정된 관리한계선(Margin)에서 벗어나는 데이터의 개수를 수집하여 사용자 정의된 Threshold를 기준으로 이상 여부를 판단하여 라벨링한다.
도 12는 SVR 학습 과정에서 선택할 수 있는 SVR 커널들의 예를 보여준다. Laplacian Kernel은 Parameter가 분산이므로 비교적 처리 속도가 빠르고 시계열 데이터 특성에 적합하다.
SVR 학습 과정에서, Golden Line 설정 시, N개 cycle의 SVR-line (Laplacian Kernel)의 Median 값을 Golden Line으로 정의할 수 있다.
Margin 설정 시, N초 별 SVR 값에 Whiskers (IQR, Interquartile Range에 1.5를 곱한 값) 방법을 적용하여 Margin으로 설정하고 이 경계를 벗어나는 데이터를 이상(비율로 설정)으로 탐지할 수 있다.
도 13은 Golden Line과 Margin의 예를 보여준다.
SVR 예측 과정에서, 학습 단계에서 설정된 Margin을 벗어나는 데이터를 이상(비율로 설정, default : 10%)으로 탐지할 수 있다.
도 14는 SVR 예측 결과 이상으로 탐지된 데이터의 예를 보여준다.
또한 이상 탐지 과정에서는 k-NNDD (k-Nearest Neighbor Data Description) 모델을 적용한다.
k-NNDD 모델은 거리 기반의 이상 탐지 방법으로 novelty score를 계산하여 정상 집단에 속하는지 여부를 판단한다. Novelty score란 새로운 관측치와 이웃패턴 간의 거리를 비율적으로 계산한 분류 척도이며, 새로운 관측치와 이웃 패턴간의 거리가 멀수록 이상치로 분류할 확률을 높게 추정한다.
도 15는 k-NNDD 모델을 적용하여 이상을 탐지하는 과정을 나타낸다.
데이터 전처리 과정에서 DTW distance를 계산한다. DTW distance는 k-NNDD 모델에 사용할 거리의 종류 중 하나이다. 설비의 타입에 따라 적합한 거리의 종류를 결정할 수 있다.
k-NNDD 학습 과정에서, 계측정 군집화를 수행하고, 정상 모델을 설정하고, k와 Threshold를 결정한다. 계층적 군집화를 통해 주어진 학습 데이터에서 정상 모델을 분류할 수 있고, 데이터 유형 별로 시행착오 테스트를 통해 k(비교할 이웃 데이터 수)와 Threshold(이상 탐지 임계값)를 결정할 수 있다.
k-NNDD 예측 과정에서, Novelty score를 계산하고, 이상을 탐지한다. 학습 단계에서 설정된 k개의 이웃 데이터로 Novelty score를 계산하여 Threshold를 초과할 경우 이상으로 탐지한다.
DTW(Dynamic Time Warping) 알고리즘은 두 개의 시계열 데이터 간에 유사도를 알아내기 위한 알고리즘 중 하나로 동적 패턴의 시변성을 반영한다. DTW 알고리즘의 일반적인 계산 복잡도는 O(N2)으로 대용량 트랜잭션에 효율적이다.
도 16은 DTW 알고리즘의 개념을 나타내는 도면이다.
DTW distance로 계층적 군집화(Hierarchical clustering)를 통해 주어진 학습 데이터에서 정상 모델을 분류할 수 있다.
도 17은 계층적 군집화를 통해 새로운 관측치로부터 정상 관측치가 얻어지는 것을 나타낸 도면이다.
k-NNDD(k-Nearest Neighbor Data Description) 알고리즘은 One class classification 중 경계선을 통한 분류 방법(boundary method)으로 인접한 관측치 사이의 거리를 기반으로 이상 여부를 판단한다. K-FDC 방법론에서는 DTW distance를 기준 거리로 사용한다.
도 18은 비모수 추정 방법을 활용한 k-NNDD의 이상치 탐지 기법의 개념을 나타낸다.
본 발명의 실시예에 따르면, 설비 이상 진단을 자동화하여 원인이 되는 변수를 신속히 파악함으로써 MTTR(평균수리시간)을 감소시킬 수 있다. 또한, 설비 이상 패턴을 분류하고 예측함으로써 고장 전 사전 조치를 통해 MTBF(평균 고장 간격)을 증가시킬 수 있다. 또한, 설비의 이상이 발생하기 이전에 사전 조치를 함으로써 제품의 불량을 감소시킬 수 있다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.
본 발명의 실시예들은 기능적인 블록 구성들 및 다양한 처리 단계들로 나타내어질 수 있다. 이러한 기능 블록들은 특정 기능들을 실행하는 다양한 개수의 하드웨어 또는/및 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 실시예는 하나 이상의 마이크로프로세서들의 제어 또는 다른 제어 장치들에 의해서 다양한 기능들을 실행할 수 있는, 메모리, 프로세싱, 로직(logic), 룩 업 테이블(look-up table) 등과 같은 집적 회로 구성들을 채용할 수 있다. 본 발명에의 구성 요소들이 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있는 것과 유사하게, 실시예는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 또한, 실시예는 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. "매커니즘", "요소", "수단", "구성"과 같은 용어는 넓게 사용될 수 있으며, 기계적이고 물리적인 구성들로서 한정되는 것은 아니다. 상기 용어는 프로세서 등과 연계하여 소프트웨어의 일련의 처리들(routines)의 의미를 포함할 수 있다.
실시예에서 설명하는 특정 실행들은 일 실시예들로서, 어떠한 방법으로도 실시 예의 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다. 또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다. 또한, "필수적인", "중요하게" 등과 같이 구체적인 언급이 없다면 본 발명의 적용을 위하여 반드시 필요한 구성 요소가 아닐 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
Claims (7)
- 기계 학습 기반의 설비 이상 탐지 방법으로서,
설비에서 수집되는 대량의 계측 데이터를 수집하고, 차원 축소를 통해 유의미한 변수를 추출하고, 해당 변수의 데이터 내에서 안정화 구간을 사전 정의된 규칙에 의해 자동으로 설정하는 데이터 전처리 과정;
다양한 분석 모델을 적용하기 위해 한 사이클의 계측 데이터를 대표할 수 있는 특질을 추출하는 특징 추출 과정; 및
이상 분류와 진단을 위해 대량의 데이터로부터 이상 탐지 모델을 생성하여 이상 데이터를 추출하는 이상 탐지 과정을 포함하는, 기계 학습 기반의 설비 이상 탐지 방법. - 제1항에 있어서,
상기 데이터 전처리 과정에서의 차원 축소는,
VIF(Variance Inflation Factor)를 이용한 1차 차원 축소 과정; 및
SVD(Singular Value Decomposition)를 이용한 2차 차원 축소 과정을 포함하는, 기계 학습 기반의 설비 이상 탐지 방법. - 제1항에 있어서,
상기 데이터 전처리 과정에서의 안정화 구간 설정은, 데이터를 X-bar Chart에 입력하여 UCL, LCL값을 추출하고, 관리도 내에 소정 회수로 데이터가 들어오는 지점을 안정화 구간의 시작으로 설정하는, 기계 학습 기반의 설비 이상 탐지 방법. - 제1항에 있어서,
상기 이상 탐지 과정은 SVR(Support Vector Regression) 모델 및 k-NNDD 모델을 이용하는, 기계 학습 기반의 설비 이상 탐지 방법. - 제4항에 있어서,
SVR(Support Vector Regression) 모델을 이용한 상기 이상 탐지 과정은,
데이터 표준화를 수행하는 데이터 전처리 과정;
SVR 커널을 선택하고, 커널 별 파라미터를 설정하고, Golden Line을 설정하고, Margin을 설정하는 SVR 학습 과정; 및
이상 데이터 수를 추출하고 Threshold 기준 이상을 탐지하는 SVR 예측 과정을 포함하는, 기계 학습 기반의 설비 이상 탐지 방법. - 제5항에 있어서,
상기 SVR 학습 과정에서, Golden Line 설정 시, N개 cycle의 SVR-line (Laplacian Kernel)의 Median 값을 Golden Line으로 정의하고, Margin 설정 시, N초 별 SVR 값에 Whiskers 방법을 적용하여 Margin으로 설정하는, 기계 학습 기반의 설비 이상 탐지 방법. - 제4항에 있어서,
k-NNDD 모델을 이용한 상기 이상 탐지 과정은,
DTW distance를 계산하는 데이터 전처리 과정;
계측정 군집화를 수행하고, 정상 모델을 설정하고, k와 Threshold를 결정하는 k-NNDD 학습 과정; 및
상기 학습 과정에서 설정된 k개의 이웃 데이터로 Novelty score를 계산하여 Threshold를 초과할 경우 이상으로 탐지하는 k-NNDD 예측 과정을 포함하는, 기계 학습 기반의 설비 이상 탐지 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180078622A KR102501882B1 (ko) | 2018-07-06 | 2018-07-06 | 기계 학습 기반의 설비 이상 탐지 시스템 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180078622A KR102501882B1 (ko) | 2018-07-06 | 2018-07-06 | 기계 학습 기반의 설비 이상 탐지 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200005202A true KR20200005202A (ko) | 2020-01-15 |
KR102501882B1 KR102501882B1 (ko) | 2023-02-21 |
Family
ID=69156918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180078622A KR102501882B1 (ko) | 2018-07-06 | 2018-07-06 | 기계 학습 기반의 설비 이상 탐지 시스템 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102501882B1 (ko) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102320706B1 (ko) * | 2020-11-30 | 2021-11-02 | (주)비스텔리젼스 | 설비 모니터링 시스템의 모델 임계값 설정 방법 |
KR20220078752A (ko) * | 2020-12-03 | 2022-06-13 | 한국전력공사 | 배전계통 구간부하 추정을 이용한 자동화개폐기 이설 및 추가 여부 판단장치 |
CN114897074A (zh) * | 2022-05-13 | 2022-08-12 | 北京纪新泰富机电技术股份有限公司 | 设备运行状态确定方法及装置、设备及存储介质 |
KR20220152709A (ko) * | 2021-05-10 | 2022-11-17 | 충북대학교 산학협력단 | 스마트 공장 시스템에서 설비 건강 안정도 예측 방법 및 이를 기록한 기록매체 |
CN117092980A (zh) * | 2023-08-05 | 2023-11-21 | 淮阴师范学院 | 一种基于大数据的电气故障检测控制系统 |
CN117413238A (zh) * | 2021-07-19 | 2024-01-16 | 萨思学会有限公司 | 使用工艺数据的质量预测 |
KR20240041384A (ko) | 2022-09-22 | 2024-04-01 | 동명대학교산학협력단 | 전기부하의 동작전류 분석을 통한 반도체 장비용 fdc 시스템 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090082536A (ko) * | 2008-01-28 | 2009-07-31 | 재단법인서울대학교산학협력재단 | 순차적 사슬형태의 단일클래스 분류기를 이용한 공정이상검출 방법 |
KR20140011064A (ko) * | 2012-07-17 | 2014-01-28 | 서울과학기술대학교 산학협력단 | 이상치 탐지 기법을 이용한 가상 계측 결과의 신뢰도 추정 방법 |
KR20180040452A (ko) * | 2016-10-12 | 2018-04-20 | 삼성에스디에스 주식회사 | 설비 노화 지수를 이용한 이상 감지 방법 및 장치 |
KR20190091868A (ko) | 2018-01-29 | 2019-08-07 | 한국전자통신연구원 | 철도 차량의 부품 및 운영 환경 특징 벡터 정보 기반의 기계 학습 고장 진단 시스템 및 그 방법 |
-
2018
- 2018-07-06 KR KR1020180078622A patent/KR102501882B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090082536A (ko) * | 2008-01-28 | 2009-07-31 | 재단법인서울대학교산학협력재단 | 순차적 사슬형태의 단일클래스 분류기를 이용한 공정이상검출 방법 |
KR20140011064A (ko) * | 2012-07-17 | 2014-01-28 | 서울과학기술대학교 산학협력단 | 이상치 탐지 기법을 이용한 가상 계측 결과의 신뢰도 추정 방법 |
KR20180040452A (ko) * | 2016-10-12 | 2018-04-20 | 삼성에스디에스 주식회사 | 설비 노화 지수를 이용한 이상 감지 방법 및 장치 |
KR20190091868A (ko) | 2018-01-29 | 2019-08-07 | 한국전자통신연구원 | 철도 차량의 부품 및 운영 환경 특징 벡터 정보 기반의 기계 학습 고장 진단 시스템 및 그 방법 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102320706B1 (ko) * | 2020-11-30 | 2021-11-02 | (주)비스텔리젼스 | 설비 모니터링 시스템의 모델 임계값 설정 방법 |
KR20220078752A (ko) * | 2020-12-03 | 2022-06-13 | 한국전력공사 | 배전계통 구간부하 추정을 이용한 자동화개폐기 이설 및 추가 여부 판단장치 |
KR20220152709A (ko) * | 2021-05-10 | 2022-11-17 | 충북대학교 산학협력단 | 스마트 공장 시스템에서 설비 건강 안정도 예측 방법 및 이를 기록한 기록매체 |
CN117413238A (zh) * | 2021-07-19 | 2024-01-16 | 萨思学会有限公司 | 使用工艺数据的质量预测 |
CN114897074A (zh) * | 2022-05-13 | 2022-08-12 | 北京纪新泰富机电技术股份有限公司 | 设备运行状态确定方法及装置、设备及存储介质 |
KR20240041384A (ko) | 2022-09-22 | 2024-04-01 | 동명대학교산학협력단 | 전기부하의 동작전류 분석을 통한 반도체 장비용 fdc 시스템 |
CN117092980A (zh) * | 2023-08-05 | 2023-11-21 | 淮阴师范学院 | 一种基于大数据的电气故障检测控制系统 |
CN117092980B (zh) * | 2023-08-05 | 2024-02-06 | 淮阴师范学院 | 一种基于大数据的电气故障检测控制系统 |
Also Published As
Publication number | Publication date |
---|---|
KR102501882B1 (ko) | 2023-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102501882B1 (ko) | 기계 학습 기반의 설비 이상 탐지 시스템 및 방법 | |
KR102501883B1 (ko) | 기계 학습 기반의 설비 이상 분류 시스템 및 방법 | |
US10719774B2 (en) | Method and system for health monitoring and fault signature identification | |
KR102501884B1 (ko) | 기계 학습 기반의 설비 이상 진단 시스템 및 방법 | |
Yang | An intelligent condition-based maintenance platform for rotating machinery | |
US7308385B2 (en) | Diagnostic systems and methods for predictive condition monitoring | |
US20140365179A1 (en) | Method and Apparatus for Detecting and Identifying Faults in a Process | |
Cheng et al. | Multivariate state estimation technique for remaining useful life prediction of electronic products | |
Yu et al. | Risk-based fault detection using Self-Organizing Map | |
JP7068246B2 (ja) | 異常判定装置、および、異常判定方法 | |
US11099219B2 (en) | Estimating the remaining useful life of a power transformer based on real-time sensor data and periodic dissolved gas analyses | |
Chaves et al. | Banhfap: A bayesian network based failure prediction approach for hard disk drives | |
US20190265088A1 (en) | System analysis method, system analysis apparatus, and program | |
WO2013188326A1 (en) | Discriminative hidden kalman filters for classification of streaming sensor data in condition monitoring | |
EP3948438B1 (en) | Method and system for anomaly detection and diagnosis in industrial processes and equipment | |
KR20210017651A (ko) | 반도체 제조 공정에서 고장 검출 및 불량 원인 진단을 위한 방법 | |
Muralidharan et al. | Condition monitoring of Self aligning carrying idler (SAI) in belt-conveyor system using statistical features and decision tree algorithm | |
Hajihosseini et al. | Process fault isolation based on transfer entropy algorithm | |
KR20210010194A (ko) | 딥러닝 기반의 화력 발전소 재과열기 튜브의 누설 감지 방법 및 이를 수행하는 장치 | |
JP2022546771A (ja) | ユーティリティシステム資産の効率的なrul解析を促進するための無関係フィルタの使用 | |
Toosi et al. | Method for detecting aging related failures of process sensors via noise signal measurement | |
Mishra et al. | Hybrid models for rotating machinery diagnosis and prognosis: estimation of remaining useful life | |
Delpha et al. | Incipient fault detection and diagnosis in a three-phase electrical system using statistical signal processing | |
Wang et al. | A change-point based control chart for detecting sparse changes in high-dimensional heteroscedastic data | |
JP7127477B2 (ja) | 学習方法、装置及びプログラム、並びに設備の異常診断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |