KR102366787B1 - Real-time sliding window based anomaly detection system for multivariate data generated by manufacturing equipment - Google Patents
Real-time sliding window based anomaly detection system for multivariate data generated by manufacturing equipment Download PDFInfo
- Publication number
- KR102366787B1 KR102366787B1 KR1020200044116A KR20200044116A KR102366787B1 KR 102366787 B1 KR102366787 B1 KR 102366787B1 KR 1020200044116 A KR1020200044116 A KR 1020200044116A KR 20200044116 A KR20200044116 A KR 20200044116A KR 102366787 B1 KR102366787 B1 KR 102366787B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- real
- time
- sliding window
- multivariate
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0221—Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0224—Process history based detection method, e.g. whereby history implies the availability of large amounts of data
- G05B23/024—Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0243—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0259—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
- G05B23/0283—Predictive maintenance, e.g. involving the monitoring of a system and, based on the monitoring results, taking decisions on the maintenance schedule of the monitored system; Estimating remaining useful life [RUL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G06N3/0454—
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
본 발명은 설비에 실시간으로 수집되는 여러 센서의 이산형 데이터를 시계열화 한 이후 슬라이딩 윈도우 기법으로 다변량 분석 결과를 이미지 형태로 추출하고, 이미지 처리 딥러닝 기법을 통해 결과를 다시 실시간으로 이상 스코어(anomaly score)로 출력하는 시스템에 관한 것이이다.The present invention time-series the discrete data of multiple sensors collected in real-time in the facility, then extracts the multivariate analysis result in the form of an image using the sliding window technique, and returns the result to anomaly scores in real time through the image processing deep learning technique. It is about a system that outputs score).
Description
본 발명은 설비에 실시간으로 수집되는 여러 센서의 이산형 데이터를 시계열화 한 이후 슬라이딩 윈도우 기법으로 다변량 분석 결과를 이미지 형태로 추출하고, 이미지 처리 딥러닝 기법을 통해 결과를 다시 실시간으로 이상 스코어(anomaly score)로 출력하는 시스템에 관한 것이이다.The present invention time-series the discrete data of multiple sensors collected in real-time in the facility, then extracts the multivariate analysis result in the form of an image using the sliding window technique, and returns the result to anomaly scores in real time through the image processing deep learning technique. It is about a system that outputs score).
일반적으로, 센서 장치들을 이용하여 설비의 이상을 조기에 발견하기 위한 연구 및 기술 개발이 활발히 진행되고 있으며, 수집된 데이터를 이용하여 인공신경망, 결정 트리(Decision tree), 클러스터링(Clustering) 등 종래 기계 학습 모델 및 알고리즘들을 이용하는 방식도 사용되고 있다. In general, research and technology development for early detection of equipment anomalies using sensor devices is being actively conducted, and conventional machines such as artificial neural networks, decision trees, and clustering, using the collected data Methods using learning models and algorithms are also being used.
그리고, 기계학습(Machine leaning)은 일반적으로 수집된 데이터를 정제하여 훈련 데이터(Training data)와 시험 데이터(Test data)로 분류한 후 훈련모델을 학습/평가하고, 학습된 모델을 이용하여 훈련 이후 새롭게 들어오는 데이터를 정확히 처리하여 새로운 환경에 필요한 정보를 분석 및 예측하는 기술이다.And, machine learning generally refines the collected data, classifies it into training data and test data, learns/evaluates the training model, and uses the learned model after training It is a technology that accurately processes new incoming data to analyze and predict information necessary for a new environment.
한편, 최근에는 인간의 뇌를 모방한 딥러닝(Deeplearning) 기술이 크게 발전함에 따라 영상인식/처리, 자동 음성인식, 비디오 행동인식, 자연어 처리 등 각종 분야에서 딥러닝 기술 기반의 기계학습을 활발히 적용하고 있는 추세이다.Meanwhile, in recent years, as deep learning technology that imitates the human brain has developed significantly, machine learning based on deep learning technology is actively applied in various fields such as image recognition/processing, automatic voice recognition, video behavior recognition, and natural language processing. is a trend that
그리고, 딥러닝(혹은 심층학습)은 최근 많은 부분에 성공적인 적용사례를 만들어가고 있다.And, deep learning (or deep learning) is making successful applications in many areas recently.
컴퓨터 비전, 자연어 처리, 의학, 로봇, 심지어 예술분야까지 거의 모든 분야 전반에 걸쳐 각종 도메인 지식과 결합한 새로운 유형의 서비스가 파생되어지고 있으며, 많은 영역에서 딥러닝을 통하여 생성된 모델을 기준으로 자동화가 이루어지고 있다.New types of services combined with various domain knowledge are being derived in almost all fields from computer vision, natural language processing, medicine, robotics, and even art fields, and in many areas, automation based on the model created through deep learning is is being done
또한, 비선형 변환기법의 조합을 통해 데이터의 핵심적인 내용을 파악하며,매우 복잡한 구조의 회귀모델도 구현이 가능하다.In addition, the core content of the data is identified through the combination of the nonlinear transformation method, and a regression model with a very complex structure can be implemented.
특별히, 머신러닝의 데이터 학습방법으로는 판단 기준 유무에 따라서 지도(supervised)와 비지도(unsupervised) 및 강화(reinforcement)학습으로 분류하게 되는데 비지도 학습에 대한 연구는 많은 잠재성을 가지고 있다.In particular, as a data learning method of machine learning, it is classified into supervised, unsupervised, and reinforcement learning according to the presence or absence of judgment criteria. Research on unsupervised learning has a lot of potential.
즉, 지도 학습(Supervised Learning)은 데이터에 대한 레이블(Label)-명시적인 정답-이 주어진 상태에서 컴퓨터를 학습시키는 것이고, 비지도학습은 입력 값에 대한 목표치가 주어지지 않는 것으로 실제로도 레이블이 없는 데이터가 훨씬 방대하기 때문이다.In other words, supervised learning trains a computer in a state where a label for data is given an explicit correct answer, and unsupervised learning is data without a label in which a target value is not given for an input value. because it is much larger.
제조공정에서는 제품이나 장비 그리고 부속품에 대한 불량 기준이 있는 경우도 있으나 없는 경우가 훨씬 많다.In the manufacturing process, there are cases where there are defective standards for products, equipment, and accessories, but there are many cases where they do not.
그리고 없는 기준을 새로 마련하는 작업도 만만치 않다.And it is not easy to set new standards that do not exist.
그렇기에, 비지도 학습을 이용한다면,낭비되는 데이터를 통하여 이상에 대한 감지를 좀 더 효율적으로 할 수 있을 것으로 예상된다.Therefore, if unsupervised learning is used, it is expected that anomalies can be detected more efficiently through wasted data.
이와같은 기술과 관련되어 종래의 특허 2018330호에 다중 메타학습을 이용한 플랜트 배관 이상 감지장치 및 방법의 기술이 제시되고 있으며 그 구성은 도1에서와 같이, 장기추세 메타학습기(150)의 장기추세 다중특징 추출기(151)는 주기적으로 측정되는 복수의 M개 센서 시계열 데이터로부터 여러 개의 패킷구간들로 구성되는 장기추세 구간(Tl) 동안 데이터를 수집하고, 각 센서 당 복수의 N개 장기추세 이미지 특징들을 추출한다.In relation to this technology, conventional patent No. 2018330 discloses a plant pipe abnormality detection device and method using multiple meta-learning, and the configuration is as shown in FIG. The
그리고, 나머지 장기추세 다중특징 합성기(152) 및 메타학습기(153)와, 장기추세 최적화기(160)의 구성 및 동작원리 또한 단기추세 메타학습기(110) 및 단기추세 최적화기(120)의 구성 및 동작 원리와 동일하며, 성능향상을 위하여 장기추세 메타학습기(150)는 사용자 정의에 따라 장기추세 구간을 복수 개로 설정하여 메타학습을 확장할 수 있다. In addition, the configuration and operation principle of the remaining long-term trend
또한, 다중추세 메타평가기(170)는 단기추세 메타학습기(110), 중기추세 메타학습기(130), 및 장기추세 메타학습기(150)에서 각 추세별 다중특징, 다중센서, 및 추세구간들의 최적조합을 바탕으로 학습된 결과들을 입력 받고, 그런 다음 다중추세 메타평가기(170)는 입력된 결과들을 애그리게이션(aggregation)하여 플랜트 배관의 이상여부를 최종 평가하는 것이다.In addition, the multi-trend meta-
그러나, 상기와 같은 플랜트 배관 이상감지 장치 및 방법으로는 플랜트 배관 상에 설치된 다양한 센서 데이터로부터 측정된 시계열 데이터에 다중 추세들을 반영한 이미지 및 볼륨 특징들을 추출하고 이들 특징들 및 센서간의 최적화 퓨전을 통해 플랜트 배관의 이상을 정확하게 감지할 수 없어 이러한 기술이 필요한 실정이다.However, with the apparatus and method for detecting anomaly in the plant pipeline, images and volume features reflecting multiple trends are extracted from various sensor data installed on the plant pipeline, and image and volume features reflecting multiple trends are extracted and optimized fusion between these features and sensors. Since it is not possible to accurately detect abnormalities in the piping, such a technology is required.
상기와 같은 종래의 문제점들을 개선하기 위한 본 발명의 목적은, 제조 설비에서의 다변량 시계열 데이터의 이상(Anomality)를 정확하게 감지할 수 있도록 하고, 이상에 대한 예측은 물론 이상의 원인을 제시할 수 있도록 하며, 효율적인 제조설비 관리와 제품의 불량 여부 등을 예측할 수 있도록 하는 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템을 제공하는데 있다.It is an object of the present invention to improve the conventional problems as described above, to accurately detect anomaly of multivariate time series data in a manufacturing facility, to predict anomaly as well as to suggest the cause of the anomaly, , to provide a real-time multivariate anomaly detection system for manufacturing facilities using a sliding window technique that enables efficient manufacturing facility management and prediction of product defects.
본 발명은 상기 목적을 달성하기 위하여, 실시간 이산형(discrete) 데이터를 일정량 수신 단계;The present invention, in order to achieve the above object, the step of receiving a certain amount of real-time discrete (discrete) data;
상기 이산형 데이터를 시계열 데이터로 변환 이후, 슬라이딩 윈도우 기법을 이용하여 각 윈도우당 구간별 다변량 분석 및 행렬 생성하는 단계; After converting the discrete data into time series data, multivariate analysis and matrix generation for each section for each window using a sliding window technique;
각 행렬을 제1신경망들에 입력하여 특징값을 추출하는 단계;extracting feature values by inputting each matrix into the first neural networks;
특징값을 제2신경망을 통하여 다시 복원하는 단계;reconstructing the feature value through a second neural network;
그리고 특징값에 기초하여 새로운 데이터를 추론하여 이상 스코어를 출력하는 단계를 포함하는 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템을 제공한다.And it provides a real-time multivariate anomaly detection system of a manufacturing facility using a sliding window technique including the step of inferring new data based on the feature value and outputting an anomaly score.
또한, 본 발명의 다변량 분석 및 행렬 생성단계에서는, 상관관계 행렬, 공분산 행렬, 정준상관분석중 선택되는 어느 하나의 방법이 활용되고,In addition, in the multivariate analysis and matrix generation step of the present invention, any one method selected from correlation matrix, covariance matrix, and canonical correlation analysis is utilized,
차원축소에 관하여서는, 주성분분석(PCA), t-SNE, 그리고 UMAP (2차원으로 축소)등이 선택될 수 있으며,As for dimensionality reduction, principal component analysis (PCA), t-SNE, and UMAP (reduction to two dimensions) can be selected.
입력값은, 행렬 값 혹은 2차원 데이터로 구성된 각각의 윈도우에 해당되는 이미지 데이터로 구성되는 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템을 제공한다.The input value provides a real-time multivariate anomaly detection system of a manufacturing facility using a sliding window technique composed of image data corresponding to each window composed of matrix values or two-dimensional data.
그리고, 본 발명의 제1신경망들의 조합에는, 이미지 데이터를 처리할 2D 합성곱 신경망 (2D-CNN)을 기본으로, 순환 신경망중합성곱처리를 하여 이미지 입력을 가능케 하는 ConvLSTM(Convolutional Long Short-Term Memory models),And, in the combination of the first neural networks of the present invention, based on a 2D convolutional neural network (2D-CNN) to process image data, Convolutional Long Short-Term (ConvLSTM) that enables image input by performing recurrent neural network polymerization and convolution processing memory models),
시간의 흐름에따른 상관관계 행렬에서 더욱 집중해야 할 윈도우의 가중치 정보를 적용한 어텐션 메커니즘(Attention Mechanism)중 적어도 하나 포함하는 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템을 제공한다.Provided is a real-time multivariate anomaly detection system for manufacturing facilities using a sliding window technique that includes at least one of the attention mechanisms to which the weight information of the window to be more focused on in the correlation matrix according to the passage of time is applied.
또한, 본 발명의 제2신경망에서는, 2D역합성곱신경망을 통해 (2D-Deconvolutional network) 이미지를 복원하며, 각 레이어 마다 어텐션 메커니즘의 결과와 결합하여 최종 결과를 도출하는 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템을 제공한다.In addition, in the second neural network of the present invention, a (2D-Deconvolutional network) image is restored through a 2D deconvolutional neural network, and a manufacturing facility using a sliding window technique to derive the final result by combining with the result of the attention mechanism for each layer of real-time multivariate anomaly detection system.
더하여, 본 발명의 제1, 2신경망은, 전 과정을 통하여 차원을 축소하여 특징값을 추출해 내고 이후 복원하여, 입력값과 복원값의 차이가 감소하는 방향으로 학습을 하는 오토인코더(Autoencoder)방식이 적용되고, In addition, the first and second neural networks of the present invention extract a feature value by reducing the dimension through the entire process, and then restore it, and learn in a direction in which the difference between the input value and the restored value decreases. This applies,
상기 제1,2 신경망은, 이미지 처리과정을 2D합성곱이 아닌 3D합성곱으로 변형이 가능한 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템을 제공한다.The first and second neural networks provide a real-time multivariate anomaly detection system for manufacturing facilities using a sliding window technique that can transform an image processing process into 3D convolution instead of 2D convolution.
이상과 같이 본 발명에 의하면, 반도체 시장을 제외한 많은 제조산업에서는 설비 데이터에서 파생되어지는 데이터에 레이블이 없는 경우가 많고, 이러한 데이터가 제대로 관리, 표준화되지 않고 버려지는 경우가 많으나 본 발명에서는 이러한 데이터를 활용하여 예방 정비를 비롯하여 품질의 양/불 예측을 통하여, 생산, 영업 비용의 손실뿐만 아니라, 이를 통하여 파생되는 비용들을 줄일 수 있는 효과를 구현하는 것이다.As described above, according to the present invention, in many manufacturing industries except for the semiconductor market, data derived from equipment data do not have labels, and these data are often discarded without being properly managed and standardized, but in the present invention, these data It is to realize the effect of reducing production and operating costs, as well as the costs derived from this, through predictive quality/non-prediction of quality, including preventive maintenance, using
도1은 종래의 이상 감지장치 및 방법을 도시한 블럭도이다.
도2는 본 발명에 따른 슬라이딩 윈도우를 활용한 일정 윈도우 구간에서의 다변량 분석결과와 오토인코더 방식을 결합한 이상감지 시스템을 도시한 블럭도이다.
도3은 본 발명에 따른 슬라이딩 윈도우를 활용한 다변량 분석결과의 이미지 화를 통하여,합성곱 신경망과, 합성곱LSTM 그리고 어텐션 메커니즘을 활용한 오토인코더이상감지 시스템을 도시한 블럭도이다.1 is a block diagram illustrating a conventional anomaly detection apparatus and method.
2 is a block diagram illustrating an anomaly detection system combining the multivariate analysis result and the autoencoder method in a predetermined window section using a sliding window according to the present invention.
3 is a block diagram illustrating an autoencoder anomaly detection system using a convolutional neural network, a convolutional LSTM, and an attention mechanism through imaging of a multivariate analysis result using a sliding window according to the present invention.
이하, 첨부된 도면에 의거하여 본 발명의 실시예를 상세하게 설명하면 다음과 같다. Hereinafter, an embodiment of the present invention will be described in detail based on the accompanying drawings.
본 발명의 도면과 이를 설명하는 상세한 설명의 내용은 하나의 예시에 해당하며, 시계열 데이터에 있어서 관계성 설명을 포함한 다변량 분석과 인공신경망의 결합이라는 큰 그림에서, 세부적인 항목 혹은 구조는 다양하게 변경 가능함을 이야기한다.The drawings of the present invention and the content of the detailed description to explain them correspond to one example, and in the large picture of the combination of multivariate analysis including relational description and artificial neural network in time series data, detailed items or structures are variously changed talk about possible
즉, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해 할 수 있을 것이다.That is, those of ordinary skill in the art to which the present invention pertains will be able to understand that it can be easily modified into other specific forms without changing the technical spirit or essential features of the present invention.
먼저, 머신러닝 시스템의 종류에는 크게 네 가지가 있다.First, there are four main types of machine learning systems.
지도학습, 비지도학습, 준지도학습, 그리고 마지막으로 강화학습이다.Supervised learning, unsupervised learning, semi-supervised learning, and finally reinforcement learning.
지도학습은, 데이터에 대하여 예측하고자 하는 변수가 레이블이 있을 경우에 해당되며, 비지도 학습은 그와 반대의 경우로서 레이블이 없는 경우이다.Supervised learning corresponds to a case in which a variable to be predicted with respect to data has a label, whereas unsupervised learning is the opposite case, in which there is no label.
또한, 준지도 학습은 전체 데이터중 일부데이터에만 레이블이 있는 경우를 이야기하며, 강화학습은 사용자가 기계에게 적절한 기준을 제시하여 좋은 경우에 점수를 부여하여 그쪽으로 더욱 학습시키도록 하고, 좋지 않은 경우에는 점수를 차감하여 덜 학습시키도록 유도하는 방법이다.In addition, semi-supervised learning refers to a case in which only some of the data are labeled, and reinforcement learning allows the user to present an appropriate criterion to the machine to give a good score to learn more about it, and to learn more about it when it is not good. It is a method to induce less learning by subtracting the score.
실제 방대한 양의 데이터를 수집함에도 불구하고, 설비 동작의 물리적 현상에 대하여 옳고 그름에 대한 엄격한 기준을 세운다는 것은 쉽지 않다.In spite of collecting a large amount of data, it is not easy to establish strict standards for right and wrong for the physical phenomenon of equipment operation.
또한, 이러한 데이터들 간에 적절한 연결고리를 찾지 못하여 의미 있는 분석을 하지 못하고, 전체 설비 관점에서의 운영적 통찰을 가져오는 것도 쉽지 않다.In addition, it is not easy to obtain an operational insight from the perspective of the entire facility because it is not possible to find an appropriate link between these data, so it is not possible to perform a meaningful analysis.
이러한 상황에서, 설비간 상관관계, 인과관계 혹은 다차원 데이터의 구조를 표현할 수 있는 다변량분석결과의 한 형태와 비선형 기계학습방식인 딥러닝의 적절한 결합을 활용한 비지도학습이 타당하다는 것을 도출하였다.In this situation, it was derived that unsupervised learning using an appropriate combination of deep learning, which is a nonlinear machine learning method, and a form of multivariate analysis that can express correlation between facilities, causality, or the structure of multidimensional data, is appropriate.
설비 데이터의 다변량 시계열 데이터를 다룰 때에, 다변량 데이터의 구조적 분포에 따라 이상감지가 가능하며, 선형조합을 통해 해석가능한 방식의 다변량 분석의 경우, 각 센서데이터의 변화정도를 추적하여 설비운영의 패턴을 감지하며, 작업자가 센서에 관련된 특정 물리량에 대해 미리 대처할 수 있도록 도움을 줄 수 있다.When dealing with multivariate time series data of facility data, it is possible to detect anomalies according to the structural distribution of multivariate data. It can help the operator to respond in advance to a specific physical quantity related to the sensor.
본 발명은, 데이터를 조합하여 다 변량 시계열 데이터 (Multivariate Time-series Data)로 변형하고, 비정상적(non-stationary) 시계열 자료를 정상적(stationary) 시계열 자료로 변환한다.The present invention combines data to transform it into multivariate time-series data, and converts non-stationary time-series data into stationary time-series data.
그리하여, 데이터의 평균과 분산, 그리고 자기상관성을 시간의 흐름에 상관없이 일정하게 한다.Thus, the mean, variance, and autocorrelation of the data are made constant regardless of the passage of time.
두번째로, 슬라이딩 윈도우(sliding-window) 기법을 사용하여 다른 크기의 윈도우를 일정 간격으로 이동시켜, 그 윈도우 안에 잡히는 다변량 데이터들의 구조적 관계 혹은 상관관계에 관한 지표를 각각 형성한 후 분석하여 행렬을 생성한다.Second, by using a sliding-window technique, windows of different sizes are moved at regular intervals to form an index on the structural relationship or correlation of multivariate data captured within the window, and then analyze it to create a matrix do.
이때, 상기 다변량 분석 및 행렬 생성단계에서는, 상관관계 행렬, 공분산 행렬, 정준상관분석중 선택되는 어느 하나의 방법이 활용되고, 차원축소에 관하여서는, 주성분분석(PCA), t-SNE, 그리고 UMAP (2차원으로 축소)등이 선택될 수 있으며, 입력값은, 행렬 값 혹은 2차원 데이터로 구성된 각각의 윈도우에 해당되는 이미지 데이터로 구성된다.At this time, in the multivariate analysis and matrix generation step, any one method selected from correlation matrix, covariance matrix, and canonical correlation analysis is used, and with respect to dimension reduction, principal component analysis (PCA), t-SNE, and UMAP (reduced to 2D) may be selected, and the input value is composed of image data corresponding to each window composed of a matrix value or 2D data.
이어서, 상기 데이터를 신경망을 통하여 이미지 처리를 한다.Then, the data is image-processed through a neural network.
<다변량 분석및 차원축소><Multivariate analysis and dimensionality reduction>
다변량 분석에는 여러 분석 방법이 있으나, 대표적으로 이용될 수 있는 예를 살펴보고자 한다.There are several analysis methods in multivariate analysis, but let's look at an example that can be used as a representative.
첫번째로, 가장 기본이 되는 것은 산점도(scatter plot)를 이용하는 방식이다.First, the most basic method is to use a scatter plot.
즉, 직교 좌표계를 이용하여 두개의 변수간의 관계를 나타내는 방법이다.That is, it is a method of representing the relationship between two variables using a Cartesian coordinate system.
이것은, 어떠한 선형 관계성을 나타내는 수치가 아닌 두 변수들의 변화량을 있는 그대로 보여주기 때문에 비선형 관계에 있는 변수들의 관계에 대해서도 그대로 표현이 된다.Since this shows the amount of change of two variables as it is, not a numerical value indicating any linear relationship, it is also expressed as it is for the relationship between variables in a non-linear relationship.
두번째로는, 상관관계도를 이용하는 방식이다.The second method is to use a correlation diagram.
이는, 변수 간의 상관관계와 공분산을 활용하여 각각의 변수에 대한 통계치를 요약하는 방식이다.This is a method of summarizing statistics for each variable by utilizing correlation and covariance between variables.
다만, 선형관계성을 통하여 수치로 표현함으로 비선형을띈 관계성에 대해서는 명확하게 표현되지 않을 수 있다.However, since it is expressed numerically through the linear relationship, the non-linear relationship may not be clearly expressed.
그리고, 변수들의 군집간 선형 상관 관계를 파악하고자 하는 경우라면, 정준상관분석(Canonical correlation Analysis)을 이용할 수 있다.And, if it is desired to determine the linear correlation between clusters of variables, canonical correlation analysis can be used.
예를 들어, 하나의 설비 안에서 두 종류의 센서가 여러 개 달려있는 경우라 가정했을 때, A센서들과 B센서들의 변수들을 측정하고, 이들 사이의 연관성을 보되 선형결합들 사이의 상관관계가 최대가 되도록 가중치가 조절되어 결정되는 방식이다.For example, assuming that two types of sensors are installed in one facility, the variables of A and B sensors are measured, and the correlation between them is observed, but the correlation between linear combinations is maximal. It is a method in which the weights are adjusted and determined so that .
다음은, 고차원의 데이터의 차원 축소하는 방법들을 제시하고자 한다.Next, we would like to suggest ways to reduce the dimensionality of high-dimensional data.
그중 첫째로, 그 외에 여러 양적변수들 사이에 분산-공분산 관계를 이용하여 선형결합으로 표시되는주성분을 찾아내는 주성분 분석 방식 (Principle Component Analysis)이 있다.First of all, there is a principal component analysis method (Principle Component Analysis) that finds principal components expressed as linear combinations using variance-covariance relationships among other quantitative variables.
이는 데이터 분산이 가장 큰 순으로 새로운 독립적인 축을 형성하여 그새로운 공간에 기존 데이터를 투영하는 방식이다.This is a method of projecting existing data to the new space by forming a new independent axis in the order of the largest data variance.
선형 결합이기 때문에,비선형의 관계성을 띤 데이터의 경우, 적은 차원에서원본 데이터를 잘 설명하지 못하는 경우가 있는데, 그럴 경우에 커널 주성분 분석 (Kernel PCA)등을 사용할 수 있으며, 이 방식은 해석 가능(Interpretable)하다.Because it is a linear combination, in the case of data with a non-linear relationship, there are cases where the original data cannot be explained well in a small dimension. (Interpretable)
그 외에, t-SNE (t-distributed Stochastic Neighbor Embedding) 방식과 UMAP (Uniform Manifold Approximation and Projection)을 이용하여 축소할 수 있다.In addition, it can be reduced using t-distributed stochastic neighbor embedding (t-SNE) and Uniform Manifold Approximation and Projection (UMAP).
두 방식 모두 거리를 통한 유사성 지표를 사용하여 고차원에서의 데이터의 밀집정도를 저차원에서 표현하는 방식이다.Both methods use the similarity index through distance to express the degree of data density in the high dimension in the low dimension.
다만, t-SNE는 시각화표현에 주로 사용이 되며, 연산 시 많은 메모리가 소모되는 반면, UMAP의 방식이 빠른 연산이 가능하며, 고차원과 저차원에서의 데이터 전역 분포를 상대적으로 잘 표현하는 것으로 알려져 좀더 선호된다.However, t-SNE is mainly used for visualization and consumes a lot of memory during operation, while UMAP method is known to enable fast operation and express the global distribution of data in high and low dimensions relatively well. more preferred
이러한 차원축소 방식을 이용하여, 고차원 이상의 시각화가 어려운 데이터들을 원본 데이터의 관계성을 잘 표현하는 방식으로 축소 및 이미지화 하여 사용할 수 있다.Using this dimensionality reduction method, data that is difficult to visualize with higher dimensions or higher can be reduced and imaged in a way that expresses the relationship between the original data well.
이러한 이미지들을 인공신경망의 입력 값으로 활용하여 이상감지에 더욱 다양하게 사용되도록 할 수 있다.By using these images as input values of the artificial neural network, they can be used in more various ways for detecting abnormalities.
상기 신경망은 제1신경망들의 조합과 제2신경망들의 조합으로 이루어진다. The neural network is composed of a combination of first neural networks and a combination of second neural networks.
이때, 상기 제1신경망들의 조합에는, 이미지 데이터를 처리할 2D 합성곱 신경망 (2D-CNN)을 기본으로, 순환 신경망중합성곱처리를 하여 이미지 입력을 가능케 하는 ConvLSTM(Convolutional Long Short-Term Memory models), 시간의 흐름에따른 상관관계 행렬에서 더욱 집중해야 할 윈도우의 가중치 정보를 적용한 어텐션 메커니즘(Attention Mechanism)중 적어도 하나 포함한다.In this case, in the combination of the first neural networks, Convolutional Long Short-Term Memory models (ConvLSTM) that enable image input by performing recurrent neural network polymerization and convolution processing based on a 2D convolutional neural network (2D-CNN) to process image data ), and at least one of the Attention Mechanism to which the weight information of the window to be more focused on in the correlation matrix over time is applied.
그리고, 상기 제2신경망들에서는, 2D역합성곱신경망을 통해 (2D-Deconvolutional network) 이미지를 복원하며, 각 레이어 마다 어텐션 메커니즘의 결과와 결합하여 최종 결과를 도출한다.And, in the second neural networks, an image is restored through a 2D deconvolutional neural network (2D-Deconvolutional network), and the final result is derived by combining the result of the attention mechanism for each layer.
또한, 상기 제1, 2신경망은, 전 과정을 통하여 차원을 축소하여 특징값을 추출해 내고 이후 복원하여, 입력값과 복원값의 차이가 감소하는 방향으로 학습을 하는 오토인코더(Autoencoder)방식이 적용되고, 상기 제1,2 신경망은, 이미지 처리과정을 2D합성곱이 아닌 3D합성곱으로 변형이 가능한 것을 사용한다.In addition, the first and second neural networks extract the feature values by reducing the dimension through the entire process, then restore them, and the autoencoder method is applied to learn in a direction in which the difference between the input value and the restored value decreases. and, the first and second neural networks use those capable of transforming the image processing process into 3D convolution instead of 2D convolution.
<오토인코더><Auto Encoder>
이상감지 비지도 학습의 대표적인 딥러닝 방법 중 하나로 오토인코더(Autoencoder)를 사용한다.Autoencoder is used as one of the representative deep learning methods of anomaly detection unsupervised learning.
이 방식은 입력 값을 잘 대표하는 특징 값 추출(Feature Extraction)을 시행하는 기계학습 모델이다.This method is a machine learning model that extracts feature values that are well representative of the input values.
이 모델에서는 입력 값과 출략값이 같아지도록 학습하며, 자기복제 모델이라고도 볼 수 있는데, 훈련 과정에서 높은 차원의 입력값을 낮은 차원의 데이터로 축소하고, 축소된 정보를 다시 원래의 차원으로 복원하는 일련의 과정을 거친다.In this model, the input value and the output value are learned to be the same, and it can also be viewed as a self-replicating model. During the training process, a high-dimensional input value is reduced to a low-dimensional data, and the reduced information is restored to the original dimension. go through a series of processes.
그리고, 이 축소된 정보는 새로운 데이터를 추론하는데 사용될 수 있다.And, this reduced information can be used to infer new data.
하지만, 도2 및 도3과 같이 오토인코더 자체만으로는 유입되는 데이터의 흐름에 대한 정보, 혹은 과거에 일어난 사건을 바탕으로 나중 사건에 대한 이해를 포함할 수 없으므로 순환신경망 모델 (Recurrent neural network model)중 오래 시간 격차가 있는 정보도 잘 기억해내는 LSTM 모델의 도입을 하여 데이터가 들어오되, 긴 흐름을 인지할 수 있는 모델을 구성한다.However, as shown in FIGS. 2 and 3, the autoencoder itself cannot include information on the flow of incoming data or an understanding of a later event based on an event that has occurred in the past, so one of the recurrent neural network models is By introducing an LSTM model that can remember information with a long time gap, a model that can recognize a long flow of data is constructed.
또한, 어텐션 메커니즘을 이용하여, 매 시점(time step)마다 배치의 데이터 전체를 확인하고, 더 집중해야 할 시점의 입력 값에 가중치를 좀더 부여함으로,좀 더 흐름에 대한 정보의 손실을 줄일 수 있다.In addition, by using the attention mechanism, the entire batch data is checked at every time step, and more weight is given to the input value at the point in time to focus more, so that the loss of information about the flow can be further reduced. .
만약, 입력 값이 이미지일 경우 (산점도,상관관계 행렬 및 2차원으로 차원 축소된 데이터 이미지), 합성곱신경망을 이용하여 한층 더 세밀한 이상감지가 가능하다.If the input value is an image (scatterplot, correlation matrix, and two-dimensionally reduced data image), more detailed anomaly detection is possible using a convolutional neural network.
합성곱 신경망층을 통하여 이미지와 필터(가중치 파라미터)의 합성곱을 통하여 필요한 특성맵(feature map)을 추출한 이후 다음 층으로 전달한다.Through the convolutional neural network layer, the necessary feature map is extracted through the convolution of the image and the filter (weight parameter) and then transferred to the next layer.
이를 통하여, 단순한 오토인코더가, 합성곱오토인코더(CNN autoencoder) 그리고 단순 LSTM이 CNN-LSTM로 사용될 수 있다.Through this, a simple autoencoder, a convolutional autoencoder (CNN autoencoder), and a simple LSTM can be used as CNN-LSTM.
이에 대한 예시 그림은 도3에서 찾아볼 수 있다.An example picture for this can be found in FIG. 3 .
Claims (5)
상기 이산형 데이터를 시계열 데이터로 변환 이후, 슬라이딩 윈도우 기법을 이용하여 각 윈도우당 구간별 다변량 분석 및 행렬 생성하는 단계;
각 행렬을 제1신경망들에 입력하여 차원축소 방식으로 생성된 이미지 데이터의 특징값을 추출하는 단계;
특징값을 제2신경망을 통하여 다시 복원하는 단계;
상기 특징값에 기초하여 새로운 데이터를 추론한 후 이상 스코어를 출력하는 단계를 포함하고,
상기 제1신경망들의 조합에는, 이미지 데이터를 처리할 2D 합성곱 신경망 (2D-CNN)을 기본으로, 순환 신경망중합성곱처리를 하여 이미지 입력을 가능케 하는 ConvLSTM(Convolutional Long Short-Term Memory models), 시간의 흐름에 따른 상관관계 행렬에서 더욱 집중해야 할 윈도우의 가중치 정보를 적용한 어텐션 메커니즘(Attention Mechanism)중 적어도 하나 포함하며,
상기 제2신경망에서는, 2D역합성곱신경망을 통해 (2D-Deconvolutional network) 이미지를 복원하며, 각 레이어 마다 어텐션 메커니즘의 결과와 결합하여 최종 결과를 도출하는 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템.Receiving a certain amount of real-time discrete data;
after converting the discrete data into time series data, multivariate analysis and matrix generation for each section for each window using a sliding window technique;
inputting each matrix into the first neural networks to extract feature values of image data generated by a dimensionality reduction method;
reconstructing the feature value through a second neural network;
and outputting an anomaly score after inferring new data based on the feature value,
The combination of the first neural networks includes Convolutional Long Short-Term Memory models (ConvLSTM) that enable image input by performing recurrent neural network polymerization and convolution processing based on a 2D convolutional neural network (2D-CNN) to process image data; It includes at least one of the Attention Mechanism to which the weight information of the window to be more focused on in the correlation matrix according to the passage of time is applied,
In the second neural network, a (2D-Deconvolutional network) image is restored through a 2D deconvolutional neural network, and real-time multivariate anomalies of manufacturing facilities using a sliding window technique to derive the final result by combining the results of the attention mechanism for each layer detection system.
차원축소에 관하여서는, 주성분분석(PCA), t-SNE, 그리고 UMAP(2차원으로 축소)가 선택될 수 있으며,
입력값은, 행렬 값 혹은 2차원 데이터로 구성된 각각의 윈도우에 해당되는 이미지 데이터로 구성되는 것을 특징으로 하는 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템.According to claim 1, wherein in the multivariate analysis and matrix generation step, any one method selected from a correlation matrix, a covariance matrix, and a canonical correlation analysis is utilized,
Regarding dimensionality reduction, principal component analysis (PCA), t-SNE, and UMAP (reduction to two dimensions) can be selected,
The input value is a real-time multivariate anomaly detection system of a manufacturing facility using a sliding window technique, characterized in that it consists of image data corresponding to each window composed of a matrix value or two-dimensional data.
상기 제1,2 신경망은, 이미지 처리과정을 2D합성곱이 아닌 3D합성곱으로 변형이 가능한 것을 특징으로 하는 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템.The autoencoder according to claim 1, wherein the first and second neural networks extract a feature value by reducing a dimension through the entire process and then restore it, and learn in a direction in which the difference between the input value and the restored value decreases. ) method is applied,
The first and second neural networks, a real-time multivariate anomaly detection system for manufacturing facilities using a sliding window technique, characterized in that it is possible to transform the image processing process into 3D convolution instead of 2D convolution.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200044116A KR102366787B1 (en) | 2020-04-10 | 2020-04-10 | Real-time sliding window based anomaly detection system for multivariate data generated by manufacturing equipment |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200044116A KR102366787B1 (en) | 2020-04-10 | 2020-04-10 | Real-time sliding window based anomaly detection system for multivariate data generated by manufacturing equipment |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210126378A KR20210126378A (en) | 2021-10-20 |
KR102366787B1 true KR102366787B1 (en) | 2022-02-23 |
Family
ID=78268288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200044116A KR102366787B1 (en) | 2020-04-10 | 2020-04-10 | Real-time sliding window based anomaly detection system for multivariate data generated by manufacturing equipment |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102366787B1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102593144B1 (en) * | 2021-12-13 | 2023-10-23 | 고려대학교 산학협력단 | Anomaly detiection and repair based electrical load forecasting device and method |
CN116563279B (en) * | 2023-07-07 | 2023-09-19 | 山东德源电力科技股份有限公司 | Measuring switch detection method based on computer vision |
CN118468165A (en) * | 2024-07-10 | 2024-08-09 | 中国航天三江集团有限公司 | Complex equipment fault diagnosis system and diagnosis method based on multi-metadata fusion |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015504203A (en) | 2011-11-22 | 2015-02-05 | エレクトリック パワー リサーチ インスチテュート インコーポレイテッド | System and method for anomaly detection |
-
2020
- 2020-04-10 KR KR1020200044116A patent/KR102366787B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015504203A (en) | 2011-11-22 | 2015-02-05 | エレクトリック パワー リサーチ インスチテュート インコーポレイテッド | System and method for anomaly detection |
Also Published As
Publication number | Publication date |
---|---|
KR20210126378A (en) | 2021-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yun et al. | Automated defect inspection system for metal surfaces based on deep learning and data augmentation | |
KR102366787B1 (en) | Real-time sliding window based anomaly detection system for multivariate data generated by manufacturing equipment | |
Ge et al. | Plant-wide industrial process monitoring: A distributed modeling framework | |
JP2022500745A (en) | Computer implementation methods, computer program products and systems for anomaly detection and / or predictive maintenance | |
Wei et al. | A novel deep learning model based on target transformer for fault diagnosis of chemical process | |
CN107273924B (en) | Multi-data fusion power plant fault diagnosis method based on fuzzy clustering analysis | |
Tian et al. | Identification of abnormal conditions in high-dimensional chemical process based on feature selection and deep learning | |
CN117784710B (en) | Remote state monitoring system and method for numerical control machine tool | |
CN115905991A (en) | Time series data multivariate abnormal detection method based on deep learning | |
US20230221684A1 (en) | Explaining Machine Learning Output in Industrial Applications | |
CN111340110A (en) | Fault early warning method based on industrial process running state trend analysis | |
Li et al. | Semi-supervised process fault classification based on convolutional ladder network with local and global feature fusion | |
CN117313015A (en) | Time sequence abnormality detection method and system based on time sequence and multiple variables | |
CN117993613A (en) | Artificial intelligence analysis method and system for operation data of digital factory | |
Cacciarelli et al. | Online active learning for soft sensor development using semi-supervised autoencoders | |
CN117745945A (en) | AI-based boiler furnace water wall tube wall image acquisition and processing system | |
Liu et al. | Information-based Gradient enhanced Causal Learning Graph Neural Network for fault diagnosis of complex industrial processes | |
CN112508176A (en) | Hoisting machinery fault prediction method | |
Liu et al. | Prediction of hydraulic pumps remaining useful life based on LSTM and Transform with dual self-attention | |
Rodríguez Ramos et al. | A robust fault diagnosis strategy in mechanical systems using pythagorean fuzzy sets | |
CN118228735B (en) | Water affair data acquisition method and system | |
Nappa et al. | An Autoencoder-Based Approach for Anomaly Detection of Machining Processes Using Acoustic Emission Signals | |
CN115099303A (en) | Structural health monitoring sensor abnormity classification method based on FCN neural network | |
CN118192516A (en) | Industrial process fault diagnosis method, device, terminal, medium and program product | |
Li et al. | Industrial process fault diagnosis based on video recognition and multi-source information fusion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right |