KR102640983B1 - 극단치와 증감 추세를 반영하여 시계열 데이터를 기호화하는 분석 서버 및 그것의 데이터 분석 방법 - Google Patents

극단치와 증감 추세를 반영하여 시계열 데이터를 기호화하는 분석 서버 및 그것의 데이터 분석 방법 Download PDF

Info

Publication number
KR102640983B1
KR102640983B1 KR1020220180557A KR20220180557A KR102640983B1 KR 102640983 B1 KR102640983 B1 KR 102640983B1 KR 1020220180557 A KR1020220180557 A KR 1020220180557A KR 20220180557 A KR20220180557 A KR 20220180557A KR 102640983 B1 KR102640983 B1 KR 102640983B1
Authority
KR
South Korea
Prior art keywords
time series
series data
momentum
weighted average
time
Prior art date
Application number
KR1020220180557A
Other languages
English (en)
Inventor
양동혁
강용신
Original Assignee
재단법인차세대융합기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인차세대융합기술연구원 filed Critical 재단법인차세대융합기술연구원
Priority to KR1020220180557A priority Critical patent/KR102640983B1/ko
Application granted granted Critical
Publication of KR102640983B1 publication Critical patent/KR102640983B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0221Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/024Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0283Predictive maintenance, e.g. involving the monitoring of a system and, based on the monitoring results, taking decisions on the maintenance schedule of the monitored system; Estimating remaining useful life [RUL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

본 발명의 실시 예에 따른 상품의 제조 공정에서 감지되는 시계열 데이터를 모니터링 방법은, 연속적으로 감지되는 상기 시계열 데이터를 수집하여 복수의 세그먼트 구간들로 구분하는 단계, 상기 복수의 세그먼트 구간들 단위로 상기 시계열 데이터의 평균을 계산하는 단계, 상기 복수의 세그먼트 구간들 각각의 시계열 데이터의 증감 추세를 나타내는 모멘텀을 계산하는 단계, 그리고 상기 복수의 세그먼트 구간들 각각의 상기 평균과 상기 모멘텀을 조합하여 대푯값을 계산하는 단계를 포함한다.

Description

극단치와 증감 추세를 반영하여 시계열 데이터를 기호화하는 분석 서버 및 그것의 데이터 분석 방법{ANALYSIS SERVER THAT SYMBOLIZE TIME SERIES DATA BY REFLECTING OUTLIER AND INCREASING/DECREASING TREND AND DATA ANALYSIS METHOD THEREOF}
본 발명은 제조 공정에서 발생할 수 있는 이벤트를 실시간으로 모니터링하는 기술에 관한 것으로, 더욱 상세하게는 극단치와 증감 추세를 반영하여 시계열 데이터를 기호화하는 분석 서버 및 그것의 데이터 분석 방법에 관한 것이다.
제조 공정 라인에 부착된 센서를 통해서 수집되는 시계열 데이터를 분석하여 불량 예측에 사용한다. 시계열 데이터는 특정 공정에서 센싱되는 압력이나 열, 진동과 같은 데이터가 시간의 경과에 따라 연속적으로 제공되는 정보이다. 종래에는 이러한 시계열 데이터를 기호 집계 근사(Symbolic Aggregate Approximation: 이하, SAX) 기법을 사용하여 분석하였다.
기호 집계 근사 기법에서는 주어진 전체 시계열 데이터는 기 설정한 개수만큼의 시간 영역으로 구분된다. 그리고 구분된 각 시간 영역에 존재하는 데이터의 평균이 산출되고, 산출된 평균값이 대푯값으로 지정되어 기호화되었다. 이러한 기호 집계 근사 기법은 주어진 시계열 데이터의 직관적인 이해가 가능하다는 장점으로 인해 제조 현장에서 널리 사용되고 있다.
하지만, 기호 집계 근사 기법은 대푯값을 산출하는 과정에서 평균값만을 산출하고 기호화를 진행한다는 한계를 갖는다. 평균 기반의 대푯값 산출 방법은 제조 공정 상에서 생성되는 시계열 데이터로부터 특정 상황이나 이벤트들을 반영하지 못할 수도 있다. 따라서, 기호 집계 근사 기법으로는 제조 현장에서 해결하고자 하는 주요 과업인 불량 사전 예측에는 어려움이 있다.
본 발명의 목적은 주어진 시계열 데이터의 극단치 또는 증감 추세를 반영하는 대푯값을 산출하는 방법을 제공하는 데 있다.
본 발명의 실시 예에 따른 상품의 제조 공정에서 감지되는 시계열 데이터의 분석 방법은, 연속적으로 감지되는 상기 시계열 데이터를 수집하여 복수의 세그먼트 구간들로 구분하는 단계, 상기 복수의 세그먼트 구간들 단위로 상기 시계열 데이터의 평균을 계산하는 단계, 상기 복수의 세그먼트 구간들 각각의 시계열 데이터의 증감 추세를 나타내는 모멘텀을 계산하는 단계, 그리고 상기 복수의 세그먼트 구간들 각각의 상기 평균과 상기 모멘텀을 조합하여 대푯값을 계산하는 단계를 포함한다.
이 실시 예에서, 상기 평균은 가중 평균을 포함하며, 상기 복수의 세그먼트 구간들 중 어느 하나의 가중 평균을 계산하는 단계는, 상기 시계열 데이터의 절대값을 상기 시계열 데이터의 가중치로 할당하는 단계, 상기 시계열 데이터들 각각에 대응하는 가중치들 각각을 곱한 값을 가산하여 가중합을 계산하는 단계, 그리고 상기 가중합을 상기 시계열 데이터들 각각의 절대값들의 합으로 나누는 단계를 포함한다.
이 실시 예에서, 상기 모멘텀은 선택된 현재 시계열 데이터와 이전 시계열 데이터의 증감 성분과 상기 이전 시계열 데이터에서 계산된 이전 모멘텀 성분을 포함한다.
이 실시 예에서, 상기 모멘텀은 상기 증감 성분의 비중을 정의하는 제 1 계수와 상기 이전 모멘텀 성분의 비중을 정의하는 제 2 계수를 포함한다.
이 실시 예에서, 상기 시계열 데이터는 상기 제조 공정에서 감지되는 온도, 압력, 힘, 진동 주파수 중 적어도 하나에 대한 정보를 포함한다.
이 실시 예에서, 상기 대푯값을 특정 기호에 맵핑하는 기호화 단계를 더 포함한다.
이 실시 예에서, 상기 기호화된 대푯값을 사용하여 불량을 예측하는 단계를 더 포함한다.
상술한 본 발명의 실시 예에 따른 대푯값 추출 방법은 제조 공정에서 발생하는 시계열 데이터의 극단치(Outlier)와 증감 추세(Increasing/Decreasing Trend)를 고려하지 못하는 기호 집계 근사 기법의 한계를 극복할 수 있다. 따라서, 극단치 또는 증감 추세에 민감한 제조 공정에서 높은 불량 예측이나 모니터링이 가능하다.
도 1은 본 발명의 실시 예에 따른 제조 공정에서의 시계열 데이터를 획득 및 분석하기 위한 분석 시스템을 예시적으로 보여주는 블록도이다.
도 2는 도 1의 분석 서버의 구성을 예시적으로 보여주는 블록도이다.
도 3은 도 2의 분석 서버에 의한 대푯값 산출 절차를 간략히 보여주는 순서도이다.
도 4는 수집된 시계열 데이터의 2개의 세그먼트 구간을 예시적으로 보여주는 그래프이다.
도 5는 본 발명의 가중 평균값을 산출하는 방식을 간략히 보여주는 그래프이다.
도 6은 본 발명의 시계열 데이터의 모멘텀을 산출하는 방식을 간략히 보여주는 그래프이다.
도 7은 시계열 데이터의 가중 평균과 모멘텀을 사용하여 산출된 대푯값의 기호화 방법을 간략히 보여주는 그래프이다.
도 8은 도 7의 기호화 영역을 할당하는 방법을 보여주는 테이블이다.
도 9는 본 발명의 다른 실시 예에 따른 시계열 데이터의 대푯값 생성 및 기호화 방법을 보여주는 순서도이다.
도 10은 본 발명의 가중 평균값의 산출 및 기호화 과정을 간략히 보여주는 그래프이다.
도 11은 본 발명의 또 다른 실시 예에 따른 시계열 데이터의 대푯값 생성 및 기호화 방법을 보여주는 순서도이다.
도 12는 본 발명의 시계열 데이터의 산술 평균과 모멘텀을 적용하여 대푯값을 산출하는 방식을 간략히 보여주는 그래프이다.
도 13은 시계열 데이터의 산술 평균과 모멘텀을 사용하여 산출된 대푯값의 기호화 방법을 간략히 보여주는 그래프이다.
이하, 본 발명의 일부 실시 예들을 예시적인 도면을 참조하여 상세하게 설명한다. 각 도면의 구성 요소들에 참조 부호를 부가함에 있어서, 동일한 구성 요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가질 수 있다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략할 수 있다.
도 1은 본 발명의 실시 예에 따른 제조 공정에서의 시계열 데이터를 획득 및 분석하기 위한 분석 시스템을 보여주는 블록도이다. 도 1을 참조하면, 분석 시스템(1000)은 제조 공정 라인(1100), 센서(1200), 통신망(1300), 그리고 분석 서버(1400)를 포함할 수 있다.
제조 공정 라인(1100)은 복수의 공정들(1110, 1130, 1150)을 통해서 제품을 생산하는 라인일 수 있다. 복수의 공정들(1110, 1130, 1150)은 압력이나 열을 이용하여 제품이나 부품을 성형하거나 절단하는 제조 공정일 수 있다. 예를 들면, 제조 공정 라인(1100)은 자동차의 제어 장치간 전기적 신호를 전달하기 위해 사용되는 와이어링 하네스(Wiring harness) 제조 공정일 수 있다. 이때, 복수의 공정들(1110, 1130, 1150)은 와이어들을 일정한 길이로 절단하고, 어플리케이터를 이용하여 와이어의 양끝단부를 터미널과 연결하여 압착하는 공정일 수 있다. 예를 들면, 제 1 공정(1110)은 여러 와이어를 미리 결정된 길이로 절단하는 공정일 수 있다. 그리고 제 2 공정(1130)은 절단된 와이어들을 압착하여 터미널과 연결하는 공정일 수 있다. 이때, 압착을 위해 가해지는 압력에 따라 와이어링 하네스의 불량이 발생할 수 있다. 제 3 공정(1150)은 와이어링 하네스의 테스트 공정일 수 있다.
센서(1200)는 압착이나 절단시 가해지는 압력의 크기를 센싱한다. 이때 센서(1200)에서 감지되는 압력의 크기는 아날로그 신호 형태로 생성될 수 있다. 센서(1200)는 아날로그 센싱 신호를 시계열 데이터로 변환하는 아날로그-디지털 컨버터(이하, ADC)를 포함할 수 있다. 아날로그-디지털 컨버터(ADC)에 의해서 변환된 시계열 데이터는 연속적으로 통신망(1300)을 경유하여 분석 서버(1400)에 전달될 것이다. 센서(1200)에는 생성된 시계열 데이터를 효율적으로 전송하기 위해 다양한 통신 인터페이스가 포함될 수 있다.
통신망(1300)은 센서(1200)와 분석 서버(1400) 간의 통신 채널을 제공한다. 통신망(300)은 센서(1200)나 분석 서버(1400)와 같은 각각의 노드(Node)들 간에 정보의 교환을 위한 무선 또는 유선 통신 구조를 의미한다. 예를 들면, 통신망(1300)은 이더넷(Ethernet) 통신망일 수 있으나, 본 발명은 이에 한정되지 않는다. 즉, 통신망(1300)은 LAN(Local Area Network), WAN(Wide Area Network), Wi-Fi 등과 같은 임의의 유/무선 네트워크들 중 하나일 수도 있다. 또는, 통신망(300)은 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 3G, 4G, 5G, 6G 등을 포함할 수 있으나, 본 발명은 여기에 한정되지는 않는다.
분석 서버(1400)는 센서(1200)로부터 제공되는 시계열 데이터를 분석한다. 분석 서버(1400)는 특히 극단치(Outlier)와 증감 추세(Increasing/decreasing trend)를 고려한 시계열 데이터의 분석을 수행한다. 일반적인 통계 기반의 시계열 데이터 분석에서는 극단치를 제외한 데이터 기반의 분석을 진행한다. 왜냐하면, 극단치는 통상에서 벗어난 예외적이고 무의미한 데이터로 간주되기 때문이다. 하지만 사출, 주조, 금형, 절단, 압착과 같이 힘이나 압력에 민감한 공정에서는 극단치가 제품 양불 판정에 의미있는 영향을 끼친다. 또한, 제조 공정상에서 발생하는 불량의 원인을 분석하기 위해서 불량 발생 시점 이전의 시계열 데이터의 증감 추세를 고려하는 것도 필요하다. 본 발명의 분석 서버(1400)는 제조 공정상에서 발생하는 극단치와 증감 추세를 고려한 대푯값 추출 연산 및 기호화 연산을 수행할 수 있다. 분석 서버(1400)는 시계열 데이터의 가중 평균값을 적용하여 극단치를 반영할 수 있다. 또한, 분석 서버(1400)는 시계열 데이터의 증감 추세를 반영하기 위해 모멘텀(Momentum)을 생성하고 기호화에 반영할 수 있다. 따라서, 분석 서버(1400)는 더 정확하고 효과적인 불량 예측을 수행할 수 있다.
이상에서 설명된 분석 시스템(1000)에 따르면, 분석 서버(1400)는 제조 공정에서 감지되는 시계열 데이터를 극단치와 증감 추세를 고려하여 분석한다. 이를 통해, 본 발명은 다양한 산업 현장에서 발생하는 시계열 데이터의 가중 평균값 및 모멘텀을 고려한 대푯값을 생성하고 기호화할 수 있다. 이러한 특징에 따라 본 발명은 제조 공정 상에서 발생하는 불량 데이터를 더 잘 표현할 수 있다. 따라서, 본 발명은 기존의 평균을 통한 대푯값 추출 기반 기호 집계 근사 기법보다 더 정확한 불량 예측을 가능케 한다.
도 2는 도 1의 분석 서버의 구성을 예시적으로 보여주는 블록도이다. 도 2를 참조하면, 분석 서버(1400, 도 1 참조)는 센서(1200, 도 1 참조)로부터 전송되는 시계열 데이터를 분석하거나 그 결과를 이용한 불량 예측을 수행할 수 있다. 이를 위해, 분석 서버(1400)는 통신부(1420), 저장부(3140), 그리고 제어부(1460)를 포함할 수 있다.
통신부(1420)는 수신부(1421)와 송신부(1423)를 포함한다. 수신부(1421)는 센서(1200)에서 전송되는 시계열 데이터를 수신한다. 수신부(1421)는 통신망(1300, 도 1 참조)을 통해서 전달되는 시계열 데이터를 제어부(1460)에서 처리되는 데이터 포맷으로 변경할 수 있다. 수신부(1421)는 수신된 시계열 데이터를 제어부(1460)에 전달할 것이다. 송신부(1423)는 분석 서버(1400)에서의 생성된 분석 결과를 다른 서버나 외부로 전송할 수 있다.
저장부(1440)는 시계열 데이터 DB(1441), 대푯값 DB(1443) 등을 포함할 수 있다. 저장부(1440)는 분석 서버(1400)에서 관리하는 데이터를 저장하기 위한 스토리지들로 구성될 수 있을 것이다.
제어부(1460)는 통신부(1420)를 통해서 전달되는 시계열 데이터를 수집하고, 수집된 시계열 데이터를 극단치와 증감 추세를 고려하여 분석한다. 즉, 제어부(1460)는 연속적으로 공급되는 시계열 데이터를 특정 시간(세그먼트) 단위로 구분하여 그룹화한다. 그리고 그룹화된 각 시간 단위에 대한 가중 평균을 산출한다. 가중 평균의 계산을 위해 제어부(1460)는 세그먼트 내의 시계열 데이터의 절대값을 먼저 계산한다. 그리고 제어부(1460)는 시간축에서 더 멀리 떨어진 데이터에 더 높은 가중치를 적용하여 평균값을 취하는 방식으로 가중 평균을 계산한다.
더불어, 제어부(1460)는 그룹화된 각 시간 단위에서 데이터의 증감 추세를 반영하는 모멘텀을 계산한다. 제어부(1460)는 현재 시점과 이전 시점에서의 데이터 차이를 계산하여 시계열 데이터의 증감 추세를 반영하는 방식으로 모멘텀을 계산한다. 모멘텀을 통해 시간의 흐름에 따른 시계열 데이터의 변화 추세를 파악하고 예측할 수 있다. 그리고 제어부(1460)는 계산된 가중 평균과 모멘텀을 결합하여 대푯값을 생성하고 기호화한다. 기호화를 통해서 연속적으로 변화하는 시계열 데이터의 대푯값이 극단치와 증감 추세를 반영한 기호로써 표현된다.
상술한 시계열 데이터의 처리를 위해 제어부(1460)는 프로세서(1461), 데이터 수집 모듈(1463), 가중 평균 산출 모듈(1465), 모멘텀 산출 모듈(1467), 그리고 기호화 모듈(1468)을 포함할 수 있다. 여기서, 바람직하게 프로세서(1461)는 하드웨어로 구성될 수 있고, 데이터 수집 모듈(1463), 가중 평균 산출 모듈(1465), 모멘텀 산출 모듈(1467), 그리고 기호화 모듈(1469)은 소프트웨어 모듈로 구현될 수 있다. 하지만, 이들 모듈들의 구현 방식은 상술한 설명에만 국한되지 않음은 잘 이해될 것이다.
프로세서(1461)는 분석 서버(1400)의 전반적인 동작을 제어할 수 있다. 프로세서(1461)는 통신부(1420)를 통해서 수신 또는 수집되는 시계열 데이터를 패치할 수 있다. 프로세서(1461)는 저장부(1440)의 시계열 데이터 DB(1441), 대푯값 DB(1443)에 접근할 수 있다. 프로세서(1461)는 데이터 수집 모듈(1463), 가중 평균 산출 모듈(1465), 모멘텀 산출 모듈(1467), 그리고 기호화 모듈(1469)을 구성하는 알고리즘이나 프로그램 명령을 실행할 수 있다. 프로세서(1461)는 CPU(Central Processing Unit), GPU(Graphic Processing Unit), SoC(system-on-chip), ASIC(application specific integrated circuit), FPGA(field programmable gate array) 등의 형태들 중 적어도 하나의 형태로 구현될 수 있다.
데이터 수집 모듈(1463)은 센서(1200, 도 1 참조)로부터 전송되는 시계열 데이터를 저장부(1440)의 시계열 데이터 DB(1441)에 저장한다. 시계열 데이터는 제조 공정에서 압력이나 온도, 힘, 진동 주파수 등을 감지한 스트림 데이터일 수 있다. 따라서, 수집된 시계열 데이터는 대용량의 빅데이터일 수 있다. 데이터 수집 모듈(1463)은 수집된 시계열 데이터를 구간별로 구분(예를 들면, 세그먼트 구간)하여 가중 평균과 모멘텀을 산출하기 위한 데이터 셋으로 구성할 수 있다.
가중 평균 산출 모듈(1465)은 수집된 시계열 데이터로부터 각 구간별 가중 평균을 산출한다. 이를 위해 가중 평균 산출 모듈(1465)은 시계열 데이터를 미리 설정된 시간 단위로 복수의 세그먼트 구간들로 구분한다. 그리고 가중 평균 산출 모듈(1465)은 미리 정해진 가중치 할당 규칙에 따라 각 세그먼트 구간 내의 데이터 값에 가중치를 적용한 후에 합산 및 나눗셈을 수행하는 가중 평균 연산을 수행한다. 이러한 가중 평균의 산출 방법은 후술하는 도 5에서 보다 상세히 설명될 것이다.
모멘텀 산출 모듈(1467)은 선택된 시계열 데이터와 이전 시계열 데이터 간의 증감을 나타내는 모멘텀(Momentum)을 계산한다. 모멘텀(mt)은 현재 시계열 데이터(xi)와 이전 시계열 데이터(xi-1) 간의 증가 또는 감소의 추세를 매개변수 값이다. 따라서, 모멘텀 산출 모듈(1467)은 현재의 모멘텀(mt)을 계산할 때, 현재 시계열 데이터(xi)와 이전 시계열 데이터(xi-1)의 증감 추세와 함께 이전 시계열 데이터(xi-1)의 모멘텀(mt-1)을 일정 비율 반영할 수 있다. 물론, 모멘텀 산출 모듈(1467)은 최초 선택되는 시계열 데이터(x1)의 경우 모멘텀(m1)은 '0'으로 초기화할 수 있다. 모멘텀 산출 모듈(1467)에 의한 모멘텀(mt)의 계산 방법은 후술하는 도 6을 참조하여 상세히 설명될 것이다.
기호화 모듈(1469)은 추출한 시계열 데이터의 대푯값을 몇 개의 기호로 표현할지를 결정한다. 그리고 기호화 모듈(1469)은 가중 평균과 모멘텀을 반영한 시계열 데이터의 대푯값을 결정된 기호로 표현한다. 기호화 모듈(1469)에 의해서 기호화된 시계열 데이터는 불량 예측이나 제조 공정의 제어나 모니터링에 사용될 것이다. 기호화 모듈(1469)의 특징은 후술하는 도 7에서 상세히 설명하기로 한다.
이상에서 설명된 본 발명의 분석 서버(1400)는 센서(1200)로부터 전송되는 시계열 데이터를 수집하고, 수집된 시계열 데이터에 대한 가중 평균, 모멘텀, 기호화 연산들을 수행할 수 있다. 이러한 연산을 통해서, 분석 서버(1400)는 시계열 데이터의 극단치와 증감 추세를 반영하는 대푯값을 생성하고 기호화할 수 있다. 따라서, 본 발명의 분석 서버(1400)는 극단치와 증감 추세에 민감한 제조 공정에서의 시계열 데이터를 분석하여 효과적인 불량 예측이나 모니터링을 지원할 수 있다.
도 3은 도 2의 분석 서버에 의한 대푯값 산출 절차를 간략히 보여주는 순서도이다. 도 3을 참조하면, 분석 서버(1400)는 센서(1200)로부터 제공되는 시계열 데이터를 수집하고, 수집된 시계열 데이터로부터 극단치와 증감 추세를 반영하는 대푯값 산출 및 기호화를 수행할 수 있다.
S110 단계에서, 데이터 수집 모듈(1463)은 시계열 데이터를 저장부(1440)의 시계열 데이터 DB(1441)에 저장한다. 시계열 데이터는 대푯값 산출을 위해 구간(세그먼트) 단위로 그룹화된다.
S120 단계에서, 가중 평균 산출 모듈(1465)은 수집된 시계열 데이터로부터 가중 평균을 계산한다. 가중 평균은 특정 길이의 시간 영역인 세그먼트 구간 단위로 산출된다. 따라서, 가중 평균 산출 모듈(1465)은 시계열 데이터를 미리 설정된 길이의 복수의 세그먼트 구간들로 구분한다. 그리고 가중 평균 산출 모듈(1465)은 각 세그먼트 구간들 단위로 가중 평균을 계산한다. 예를 들면, 어느 하나의 세그먼트 구간에서의 가중 평균은 해당 세그먼트에 포함된 시계열 데이터들 각각에 대해 시간축에서의 거리에 따라 서로 다른 가중치가 곱해진다. 그리고 가중치가 곱해진 세그먼트 구간 내에서의 가중치가 적용된 시계열 데이터들의 합을 가중치 적용 이전의 시계열 데이터의 절대치들의 합으로 나눔으로써 가중 평균이 산출될 수 있다. 가중 평균의 산출 방법이나 가중치의 적용 방식은 상술한 방식에만 국한되지 않음은 잘 이해될 것이다.
S130 단계에서, 수집된 시계열 데이터들의 증감 추세를 반영하는 모멘텀이 계산된다. 모멘텀 산출 모듈(1467)은 수집된 시계열 데이터들 각각에 대한 모멘텀을 순차적으로 계산할 것이다. 모멘텀 산출 모듈(1467)은 선택된 현재 시계열 데이터와 이전 시계열 데이터 사이의 증감을 나타내는 모멘텀(mt)을 계산한다. 모멘텀(mt)은 현재 시계열 데이터(xi)와 이전 시계열 데이터(xi-1) 간의 증가 또는 감소의 추세를 나타내는 값이다. 따라서, 모멘텀 산출 모듈(1467)은 현재의 모멘텀(mt)을 계산할 때, 현재 시계열 데이터(xi)와 이전 시계열 데이터(xi-1)의 증감 추세와 함께 이전 시계열 데이터(xi-1)의 모멘텀(mt-1)을 일정 비율 반영할 수 있다. 모멘텀 산출 모듈(1467)은 최초 선택되는 시계열 데이터(x1)의 경우 모멘텀(m1)을 '0'으로 초기화할 수 있다.
S140 단계에서, 기호화 모듈(1469)은 가중 평균과 모멘텀을 더하여 생성되는 대푯값을 몇 개의 기호로 표현할지를 결정한다. 그리고 기호화 모듈(1469)은 가중 평균과 증감 추세를 반영한 대푯값을 결정된 기호로 표현한다. 기호화 모듈(1469)은 결정된 기호값을 모니터나 디스플레이에 표시할 수 있다. 도시되지는 않았지만, 기호화된 대표값을 사용하여 불량 예측이나 제조 공정에서의 이벤트 모니터링 절차에서 사용될 수 있을 것이다.
이상에서 설명된 본 발명의 분석 서버(1400)는 센서(1200)로부터 전송되는 시계열 데이터를 수집하고, 수집된 시계열 데이터에 대한 가중 평균, 모멘텀, 기호화 연산들을 수행할 수 있다. 이러한 연산을 통해서, 분석 서버(1400)는 시계열 데이터의 극단치와 증감 추세를 반영하는 대푯값을 생성하고 기호화할 수 있다. 따라서, 본 발명의 분석 서버(1400)는 극단치와 증감 추세에 민감한 제조 공정에서의 시계열 데이터를 분석하여 효과적인 불량 예측이나 모니터링을 지원할 수 있다.
도 4는 수집된 시계열 데이터의 2개의 세그먼트 구간(i, i+1)을 예시적으로 보여주는 그래프이다. 도 4를 참조하면, 전체 시계열 데이터 중에서 i 번째 세그먼트 구간과 i+1 번째 세그먼트 구간이 도시되어 있다. 각각의 세그먼트 구간은 5개의 시계열 데이터들을 포함한다. 따라서, 하나의 세그먼트 크기는 5로 간주될 수 있다.
i 번째 세그먼트 구간에서, 시계열 데이터는 순차적으로 [0.5, -2, -1.3, -0.13, 0.6]의 값을 나타낼 수 있다. i 번째 세그먼트 구간의 시계열 데이터들의 일반적인 산술 평균을 계산하면 약 '-0.48'이 될 것이다. i+1 번째 세그먼트 구간에서, 시계열 데이터는 순차적으로 [0.6, 2.3, 0, -0.3, -1]의 값을 나타낼 수 있다. 마찬가지로, i+1 번째 세그먼트 구간의 시계열 데이터들의 산술 평균은 약 '0.32'로 도출될 수 있을 것이다.
하지만, 이러한 산술 평균은 극단치에 민감한 제조 공정의 특성을 전혀 반영하지 못한다. 따라서, 본 발명에서는 절대값이 상대적으로 큰 시계열 데이터 값에 대해서는 더 큰 가중치를 할당하는 가중 평균을 적용해야 한다.
도 5는 본 발명의 가중 평균값을 산출하는 방식을 보여주는 그래프이다. 도 5를 참조하면, 전체 세그먼트들 중에서 i 번째 세그먼트 구간과 i+1 번째 세그먼트 구간에서의 시계열 데이터에 가중치를 적용한 결과를 보여준다. 가중 평균은 이들 가중치가 적용된 각 시계열 데이터들의 세그먼트 내에서의 평균값을 의미한다.
i 번째 세그먼트 구간에서, 시계열 데이터는 순차적으로 [0.5, -2, -1.3, -0.2, 0.6]의 값을 나타낸다. 이때, 각 시계열 데이터의 세그먼트별 가중 평균(xi D-PAA)의 예시적인 계산 방법은 아래 수학식 1로 표현할 수 있다.
여기서, j는 i 번째 세그먼트 내에서의 시계열 데이터들 각각의 순서를 나타낸다. S는 시계열 데이터의 각 세그먼트에서의 데이터 개수, N은 전체 시계열 데이터의 개수를 나타낸다. 상술한 수학식 1에 따르면, 각 세그먼트 내에서의 시계열 데이터 크기의 절대값(│xj│)이 가중치로 제공된다. 그리고 하나의 세그먼트에 대한 가중 평균은 가중치를 적용한(또는, 곱한) 각 시계열 데이터의 합을 세그먼트 내의 시계열 데이터 절대값들의 합으로 나눈 값에 해당한다. 따라서, 가중 평균의 크기에는 상대적으로 큰 절대값을 가진 시계열 데이터일수록 더 큰 영향을 미치게 된다.
i 번째 세그먼트 구간의 시계열 데이터들 각각을 가중치(절대값)를 곱하여 더하면 '0.5×0.5-2×2-1.3×1.3-0.2×0.2+0.6×0.6=-5.12'이 된다. 이 값을 세그먼트 내의 시계열 데이터 각각의 절대값들의 합(0.5+2+1.3+0.2+0.6=4.6)으로 나누면, i 번째 세그먼트 구간의 가중 평균은 '-1.113'으로 산출된다. 이 값은 일반적인 산술 평균 '-0.48'에 비해 극단치들의 영향을 더 잘 반영하고 있음을 직관적으로 알 수 있다.
i+1 번째 세그먼트 구간의 시계열 데이터들 각각을 가중치(절대값)를 곱하여 더하면 '0.6×0.6+2.3×2.3+0-0.3×0.3-1.0×1.0=4.56'이 된다. 이 값을 세그먼트 내의 시계열 데이터 각각의 절대값들의 합(0.6+2.3+0+0.3+1=4.2)으로 나누면, i+1 번째 세그먼트 구간의 가중 평균은 '1.086'으로 산출된다. 이 값은 일반적인 산술 평균 '0.32'에 비해 극단치들의 영향을 더 잘 반영하고 있다.
도 6은 본 발명의 시계열 데이터의 모멘텀을 산출하는 방식을 간략히 보여주는 그래프이다. 도 6을 참조하면, 전체 세그먼트들 중에서 i 번째 세그먼트 구간과 i+1 번째 세그먼트 구간에서의 시계열 데이터의 증감 추세가 예시적으로 도시되어 있다.
모멘텀(Momentum)은 시계열 데이터의 증감 추세를 반영하기 위한 변수로 정의될 수 있다. 특정 시점(t)에서의 시계열 데이터의 모멘텀은 아래 수학식 2로 표현될 수 있다.
여기서, α는 't-1'번째 모멘텀을 얼마나 반영할지를 나타내는 계수이고, η는 't'번째 시계열 데이터와 't-1'번째 시계열 데이터의 차이를 얼마나 반영할지를 나타내는 계수이다(0≤α≤1, 0≤η). 그리고 전체 시계열 데이터 중에서 최초로 선택되는 시계열 데이터의 모멘텀(m1)은 '0'으로 정의될 수 있다.
i 번째 세그먼트 구간에서, 모멘텀(m2)은 아래 수학식 3과 같이 표현될 수 있다. 여기서, α=0.9, η=0.1이라 가정하기로 한다.
상술한 바와 같이, 모멘텀(m2)은 '-0.25'로 계산될 수 있다. 같은 방식으로 계산하면, 모멘텀(m5)은 '0.053', 모멘텀(m10)은 '-0.159'로 산출된다.
시계열 데이터의 세그먼트별 가중 평균과 모멘텀을 모두 반영한 대푯값(xi DM-PAA)은 아래 수학식 4로 표현될 수 있다.
수학식 4에 근거하여 i 번째 세그먼트의 대푯값(xi DM-PAA)은 '-1.060'으로 산출될 수 있다. 그리고 i+1 번째 세그먼트의 대푯값(xi+1 DM-PAA)은 '0.926'으로 계산된다.
도 7은 시계열 데이터의 가중 평균과 모멘텀을 사용하여 산출된 대푯값의 기호화 방법을 간략히 보여주는 그래프이다. 도 7을 참조하면, 전체 세그먼트들 중에서 i 번째 세그먼트 구간과 i+1 번째 세그먼트 구간 각각의 대푯값들(xi DM-PAA, xi+1 DM-PAA) 각각은 정규 분포를 고려한 이산화 영역들(a, b, c, d, e, f, g)에 맵핑된다.
여기서, 각 기호의 결정 경계들(β1, β2, β3, β4, β5, β6)은 대푯값(xi DM-PAA)을 몇 개의 기호로 표현할지를 나타내는 매개변수(n_bins)에 따라 결정된다. 매개변수(n_bins)에 따른 각 기호의 결정 경계들의 크기는 후술하는 도 8의 테이블에 간략히 도시될 것이다.
본 발명의 실시 예에 따라 가중 평균과 모멘텀을 적용한 i 번째 세그먼트 구간의 대푯값(xi DM-PAA)은 '-1.060'으로 계산되었다. 따라서, '-1.060'은 결정 경계(β1=-1.07)와 결정 경계(β2=-0.57) 사이의 값이므로, 대푯값(xi DM-PAA)은 'b'로 기호화될 수 있다. 그리고 i+1 번째 세그먼트 구간의 대푯값(xi+1 DM-PAA)은 '0.926'으로 계산되었다. '0.926'은 결정 경계(β5=0.57)와 결정 경계(β6=1.07) 사이의 값이므로, 대푯값(xi+1 DM-PAA)은 'f'로 기호화될 수 있다.
상술한 방식으로 연속적으로 생성되는 시계열 데이터는 각 세그먼트 단위로 극단치와 증감 추세를 반영한 기호들(b, f)로 표현될 수 있다.
도 8은 도 7의 기호화 영역을 할당하는 방법을 보여주는 테이블이다. 도 8을 참조하면, 대푯값(xi DM-PAA)을 몇 개의 기호로 표현할지를 나타내는 매개변수(n_bins)에 따라 정규 분포에 기반하여 영역을 분할하기 위한 결정 경계들(βm)이 할당될 수 있다. 예를 들면, 앞서 설명된 바와 대푯값(xi DM-PAA)을 7개(n_bins=7)의 기호로 표현하는 경우, 6개의 결정 경계들(β1, β2, β3, β4, β5, β6)이 할당될 수 있다.
도 9는 본 발명의 다른 실시 예에 따른 시계열 데이터의 대푯값 생성 및 기호화 방법을 보여주는 순서도이다. 도 2 및 도 9를 참조하면, 본 발명에 따른 분석 서버(1400, 도 2 참조)는 센서(1200, 도 2 참조)로부터 제공되는 시계열 데이터를 수집하고, 수집된 시계열 데이터로부터 극단치만을 반영하는 대푯값 산출 및 기호화 절차를 수행할 수 있다.
S210 단계에서, 데이터 수집 모듈(1463)은 시계열 데이터를 저장부(1440)의 시계열 데이터 DB(1441)에 저장한다. 시계열 데이터는 대푯값 산출을 위한 구간(또는 세그먼트)별로 구분될 수 있다.
S220 단계에서, 가중 평균 산출 모듈(1465)은 수집된 시계열 데이터로부터 가중 평균을 계산한다. 가중 평균은 미리 설정된 시간 구간인 세그먼트 단위로 산출된다. 따라서, 가중 평균 산출 모듈(1465)은 시계열 데이터를 미리 설정된 길이의 복수의 세그먼트들로 구분한다. 그리고 가중 평균 산출 모듈(1465)은 각 세그먼트 단위로 가중 평균을 계산한다. 예를 들면, 어느 하나의 세그먼트 구간에서의 가중 평균은 해당 세그먼트에 포함된 시계열 데이터들 각각에 대해 시간축에서의 거리에 따라 서로 다른 가중치가 곱해진다. 그리고 가중 평균 산출 모듈(1465)은 가중치가 곱해진 세그먼트 구간 내에서의 시계열 데이터들을 합하여 가중합을 생성한다. 그리고 가중합이 세그먼트 내의 시계열 데이터 절대값의 합으로 나누어짐으로써 하나의 세그먼트에 대응하는 가중 평균이 산출된다.
S230 단계에서, 기호화 모듈(1469)은 추출한 시계열 데이터의 세그먼트별 가중 평균을 대푯값으로 결정하고 기호화한다. 기호화 모듈(1469)은 시계열 데이터의 가중 평균에 대응하는 대푯값(xi D-PAA)을 결정 경계들을 기준으로 알파벳과 같은 기호로 맵핑한다. 이러한 기호화 방법은 도 7과 도 8에 설명되었으므로 이에 대한 설명은 생략하기로 한다. 기호화에 따라 표현된 시계열 데이터는 모니터나 디스플레이에 표시될 수 있다. 또는, 도시되지는 않았지만, 기호화된 시계열 데이터를 사용하여 불량 예측이나 제조 공정에서의 이벤트 모니터링을 위해 사용될 수 있을 것이다.
이상에서 설명된 본 발명의 분석 서버(1400)는 센서(1200)로부터 전송되는 시계열 데이터를 수집하고, 수집된 시계열 데이터에 대한 가중 평균을 산출할 수 있다. 그리고 분석 서버(1400)는 가중 평균을 대푯값으로 하여 각 세그먼트별로 기호로 표현하는 기호화 연산을 수행할 수 있다. 대푯값의 계산과 표현 방법에 의해 분석 서버(1400)는 제조 공정에서 발생하는 시계열 데이터의 극단치를 반영하는 대푯값을 생성할 수 있다. 따라서, 본 발명의 분석 서버(1400)는 극단치에 민감한 제조 공정에서의 시계열 데이터를 분석하여 효과적인 불량 예측이나 모니터링을 지원할 수 있다.
도 10은 본 발명의 가중 평균값의 산출 및 기호화 과정을 간략히 보여주는 그래프이다. 도 10을 참조하면, 전체 세그먼트들 중에서 i 번째 세그먼트 구간과 i+1 번째 세그먼트 구간에서의 시계열 데이터에 가중치를 적용한 결과를 보여준다.
i 번째 세그먼트 구간에서, 시계열 데이터는 순차적으로 [0.5, -2, -1.3, -0.2, 0.6]의 값을 나타낼 수 있다. 이때, 각 시계열 데이터의 세그먼트별 가중 평균(xi D-PAA)은 앞서 설명된 수학식 1에 따라 계산하면, '-1.113'으로 산출된다. 이 값은 일반적인 산술 평균 '-0.48'에 비해 극단치들의 영향을 더 잘 반영하고 있다.
i+1 번째 세그먼트 구간에서, 시계열 데이터는 순차적으로 [0.6, 2.3, 0, -0.3, -1.0]에 대응한다. 각 시계열 데이터의 세그먼트별 가중 평균(xi+1 D-PAA)은 수학식 1에 따라 계산하면, '1.086'으로 계산된다. 이 값은 일반적인 산술 평균 '0.32'에 비해 극단치들의 영향을 더 잘 반영하고 있음을 알 수 있다.
이어서, 각 세그먼트별 대푯값인 가중 평균들(xi D-PAA, xi+1 D-PAA)의 기호화 연산이 수행된다. i 번째 세그먼트 구간과 i+1 번째 세그먼트 구간 각각의 대푯값들(xi D-PAA, xi+1 D-PAA) 각각은 정규 분포를 고려한 이산화 영역들(a, b, c, d, e, f, g)에 맵핑된다. i 번째 세그먼트 구간의 대푯값(xi D-PAA)은 '-1.113'으로 계산되었다. 따라서, '-1.060'은 결정 경계(β1=-1.07) 미만의 값이므로, 대푯값(xi D-PAA)은 'a'로 기호화될 수 있다. 그리고 i+1 번째 세그먼트 구간의 대푯값(xi+1 D-PAA)은 '1.086'으로 계산되었다. '1.086'은 결정 경계(β6=1.07)를 초과하는 값이므로, 대푯값(xi D-PAA)은 'g'로 기호화될 수 있다.
상술한 방식으로 시계열 데이터의 가중 평균만을 반영한 대푯값 및 기호는, 도 7의 가중 평균과 모멘텀을 사용하는 대푯값 및 기호와는 다른 양상을 보여준다.
도 11은 본 발명의 또 다른 실시 예에 따른 시계열 데이터의 대푯값 생성 및 기호화 방법을 보여주는 순서도이다. 도 2 및 도 10을 참조하면, 본 발명에 따른 분석 서버(1400, 도 2 참조)는 시계열 데이터의 모멘텀만을 반영하는 대푯값 산출 및 기호화 절차를 수행할 수 있다.
S310 단계에서, 데이터 수집 모듈(1463)은 시계열 데이터를 저장부(1440)의 시계열 데이터 DB(1441)에 저장한다. 시계열 데이터는 대푯값 산출을 위한 단위 구간(또는, 세그먼트)별로 구분될 수 있다.
S320 단계에서, 시계열 데이터로부터 산술 평균이 계산된다. 산술 평균은 미리 설정된 시간 구간인 세그먼트 단위로 산출된다. 산술 평균은 세그먼트 내의 모든 시계열 데이터의 합을 시계열 데이터의 수로 나누는 방식으로 계산될 수 있을 것이다.
S330 단계에서, 수집된 시계열 데이터들에 대한 모멘텀이 계산된다. 모멘텀 산출 모듈(1467)은 선택된 현재 시계열 데이터와 이전 시계열 데이터 사이의 증감을 나타내는 모멘텀(mt)을 계산한다. 모멘텀(mt)은 앞서 설명된 수학식 2에 따라 계산될 수 있다.
S340 단계에서, 기호화 모듈(1469)은 추출한 시계열 데이터의 대푯값을 몇 개의 기호로 표현할지를 결정한다. 여기서 대푯값은 산술 평균과 모멘텀을 더한 값에 대응한다. 그리고 기호화 모듈(1469)은 시계열 데이터의 산술 평균과 모멘텀을 더한 대푯값을 결정된 기호로 표현한다. 결정된 기호에 따라 기호화 모듈(1469)은 기호값을 모니터나 디스플레이에 표시할 수 있다. 도시되지는 않았지만, 기호화된 시계열 데이터를 사용하여 불량 예측이나 제조 공정에서의 이벤트 모니터링 절차에서 사용될 수 있을 것이다.
이상에서는 시계열 데이터의 증감 추세만을 반영하는 모멘텀을 계산하고 기호화하는 실시 예가 설명되었다. 본 발명의 분석 서버(1400)는 센서(1200)로부터 전송되는 시계열 데이터를 수집하고, 수집된 시계열 데이터에 대한 산술 평균, 모멘텀, 기호화 연산들을 수행할 수 있다. 이를 통해서, 분석 서버(1400)는 시계열 데이터의 증감 추세를 반영하는 대푯값을 생성하고 기호화할 수 있다. 따라서, 본 발명의 분석 서버(1400)는 증감 추세에 민감한 제조 공정에서의 시계열 데이터를 분석하여 효과적인 불량 예측이나 모니터링을 지원할 수 있다.
도 12는 도 11에서 설명된 시계열 데이터의 산술 평균과 모멘텀을 적용하여 대푯값을 산출하는 방법을 도식적으로 보여주는 그래프이다. 도 12를 참조하면, 전체 세그먼트들 중에서 i 번째 세그먼트 구간과 i+1 번째 세그먼트 구간에서의 산술 평균과 모멘텀을 적용한 결과가 예시적으로 도시되어 있다.
산술 평균은 미리 설정된 시간 영역인 세그먼트 단위로 산출된다. 산술 평균은 세그먼트 내의 모든 시계열 데이터의 합을 시계열 데이터의 수(예를 들면, 5)로 나누는 방식으로 계산될 수 있을 것이다. i 번째 세그먼트 구간에서의 산술 평균(xi PAA)은 '-0.480'으로 산출될 수 있다. 그리고 i+1 번째 세그먼트 구간에서의 시계열 데이터의 산술 평균(xi+1 PAA)은 '0.320'으로 계산될 것이다. 더불어, 수학식 2를 참조하여 모멘텀(m5)은 '0.053', 모멘텀(m10)은 '-0.159'로 산출될 수 있다.
시계열 데이터의 세그먼트별 산술 평균과 모멘텀을 반영하기 위한 대푯값(xi M-PAA)은 아래 수학식 5로 표현될 수 있다.
수학식 5에 근거하여 i 번째 세그먼트의 대푯값(xi M-PAA)은 '-0.379'으로 산출될 수 있다. 그리고 i+1 번째 세그먼트의 대푯값(xi+1 M-PAA)은 '0.161'으로 산출될 것이다. 계산된 대푯값들(xi M-PAA, xi+1 M-PAA)에는 산술 평균(xi PAA, xi+1 PAA)의 적용에 따라 시계열 데이터의 극단치의 반영은 제한적이거나 억제된다. 반면에, 모멘텀들(m5, m10)의 반영에 따라 대푯값들(xi M-PAA, xi+1 M-PAA)에는 시계열 데이터의 증감 추세가 잘 반영될 수 있다.
도 13은 시계열 데이터의 산술 평균과 모멘텀을 사용하여 산출된 대푯값의 기호화 방법을 간략히 보여주는 그래프이다. 도 13을 참조하면, 전체 세그먼트들 중에서 i 번째 세그먼트 구간과 i+1 번째 세그먼트 구간 각각의 대푯값들(xi M-PAA, xi+1 M-PAA) 각각은 정규 분포를 고려한 이산화 영역들(a, b, c, d, e, f, g)에 맵핑된다.
본 발명의 실시 예에 따라 산술 평균과 모멘텀을 적용한 i 번째 세그먼트 구간의 대푯값(xi M-PAA)은 '-0.397'에 대응한다. 따라서, '-0.397'은 결정 경계(β2=-0.57)와 결정 경계(β3=-0.18) 사이의 값이므로, 대푯값(xi M-PAA)은 'c'로 기호화될 수 있다. 그리고 i+1 번째 세그먼트 구간의 대푯값(xi+1 M-PAA)은 '0.161'으로 계산되었다. '0.161'은 결정 경계(β3=-0.18)와 결정 경계(β4=0.18) 사이의 값이므로, 대푯값(xi+1 M-PAA)은 'd'로 기호화될 수 있다.
상술한 방식으로 연속적으로 생성된 시계열 데이터는 각 세그먼트 단위로 증감 추세를 반영한 기호들(c, d)로 표현될 수 있다. 대푯값들(xi M-PAA, xi+1 M-PAA)의 기호화를 통해 증감 추세에 민감한 제조 공정에서의 불량 예측이나 이벤트 모니터링 성능을 향상시킬 수 있을 것으로 기대된다.
이상에서 기술된 내용은 본 발명을 실시하기 위한 구체적인 실시 예들이다. 본 발명은 상술된 실시 예들뿐만 아니라, 단순하게 설계 변경되거나 용이하게 변경할 수 있는 실시 예들 또한 포함할 것이다. 또한, 본 발명은 실시 예들을 이용하여 용이하게 변형하여 실시할 수 있는 기술들도 포함될 것이다. 따라서, 본 발명의 범위는 상술된 실시 예들에 국한되어 정해져서는 안되며 후술하는 특허청구범위뿐만 아니라 이 발명의 특허청구범위와 균등한 것들에 의해 정해져야 할 것이다.

Claims (7)

  1. 상품의 제조 공정에서 감지되는 시계열 데이터의 분석 방법에 있어서:
    연속적으로 감지되는 상기 시계열 데이터를 수집하여 복수의 세그먼트 구간들로 구분하는 단계;
    상기 복수의 세그먼트 구간들 단위로 상기 시계열 데이터의 가중 평균을 계산하는 단계;
    상기 복수의 세그먼트 구간들 각각의 시계열 데이터의 증감 추세를 나타내는 모멘텀을 계산하는 단계; 그리고
    상기 복수의 세그먼트 구간들 각각의 상기 가중 평균과 상기 모멘텀을 가산하여 대푯값을 계산하는 단계를 포함하되,
    상기 모멘텀은 수학식 에 따라 계산되는 분석 방법(여기서, mt는 시점 t에서의 모멘텀, mt-1은 시점 t-1에서의 모멘텀, xt는 시점 t에서의 시계열 데이터, xt-1은 시점 t-1에서의 시계열 데이터, α는 시점 t-1 모멘텀의 반영 계수, η는 시점 t와 시점 t-1 시계열 데이터들의 차이를 반영하는 계수).
  2. 제 1 항에 있어서,
    상기 복수의 세그먼트 구간들 중 어느 하나의 상기 가중 평균을 계산하는 단계는:
    상기 시계열 데이터의 절대값을 상기 시계열 데이터의 가중치로 할당하는 단계;
    상기 시계열 데이터들 각각에 대응하는 가중치들 각각을 곱한 값을 가산하여 가중합을 계산하는 단계; 그리고
    상기 가중합을 상기 시계열 데이터들 각각의 절대값들의 합으로 나누는 단계를 포함하는 분석 방법.
  3. 삭제
  4. 삭제
  5. 제 1 항에 있어서,
    상기 시계열 데이터는 상기 제조 공정에서 감지되는 온도, 압력, 힘, 진동 주파수 중 적어도 하나에 대한 정보를 포함하는 분석 방법.
  6. 제 1 항에 있어서,
    상기 대푯값을 특정 기호에 맵핑하는 기호화 단계를 더 포함하는 분석 방법.
  7. 제 6 항에 있어서,
    상기 기호화된 대푯값을 사용하여 불량을 예측하는 단계를 더 포함하는 분석 방법.

KR1020220180557A 2022-12-21 2022-12-21 극단치와 증감 추세를 반영하여 시계열 데이터를 기호화하는 분석 서버 및 그것의 데이터 분석 방법 KR102640983B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220180557A KR102640983B1 (ko) 2022-12-21 2022-12-21 극단치와 증감 추세를 반영하여 시계열 데이터를 기호화하는 분석 서버 및 그것의 데이터 분석 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220180557A KR102640983B1 (ko) 2022-12-21 2022-12-21 극단치와 증감 추세를 반영하여 시계열 데이터를 기호화하는 분석 서버 및 그것의 데이터 분석 방법

Publications (1)

Publication Number Publication Date
KR102640983B1 true KR102640983B1 (ko) 2024-02-23

Family

ID=90041763

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220180557A KR102640983B1 (ko) 2022-12-21 2022-12-21 극단치와 증감 추세를 반영하여 시계열 데이터를 기호화하는 분석 서버 및 그것의 데이터 분석 방법

Country Status (1)

Country Link
KR (1) KR102640983B1 (ko)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150091775A (ko) * 2014-02-04 2015-08-12 한국전자통신연구원 비정상 행위 탐지를 위한 네트워크 트래픽 분석 방법 및 시스템
JP2019003389A (ja) * 2017-06-15 2019-01-10 株式会社 日立産業制御ソリューションズ 異常診断装置、異常診断方法及び異常診断プログラム
JP6484525B2 (ja) * 2015-08-03 2019-03-13 東芝三菱電機産業システム株式会社 警報装置およびプロセス制御システム
KR20200052425A (ko) * 2018-10-25 2020-05-15 삼성에스디에스 주식회사 시계열 데이터 분석 방법, 주영향 변수 결정 방법 및 그 방법들을 지원하는 장치
KR102428867B1 (ko) * 2020-11-23 2022-08-03 주식회사 리얼타임테크 시계열 데이터의 변화 추세를 고려한 유사도 분석 방법
JP2022135064A (ja) * 2021-03-04 2022-09-15 三菱ケミカルエンジニアリング株式会社 診断装置、診断方法、及び診断プログラム
JP2022173863A (ja) * 2021-05-10 2022-11-22 株式会社東芝 モジュラー型時系列データ予測装置、モジュラー型時系列データ予測方法、および、プログラム
KR102470763B1 (ko) * 2022-10-13 2022-11-25 주식회사 비플컨설팅 데이터 이상치 탐색 장치 및 방법

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150091775A (ko) * 2014-02-04 2015-08-12 한국전자통신연구원 비정상 행위 탐지를 위한 네트워크 트래픽 분석 방법 및 시스템
JP6484525B2 (ja) * 2015-08-03 2019-03-13 東芝三菱電機産業システム株式会社 警報装置およびプロセス制御システム
JP2019003389A (ja) * 2017-06-15 2019-01-10 株式会社 日立産業制御ソリューションズ 異常診断装置、異常診断方法及び異常診断プログラム
KR20200052425A (ko) * 2018-10-25 2020-05-15 삼성에스디에스 주식회사 시계열 데이터 분석 방법, 주영향 변수 결정 방법 및 그 방법들을 지원하는 장치
KR102428867B1 (ko) * 2020-11-23 2022-08-03 주식회사 리얼타임테크 시계열 데이터의 변화 추세를 고려한 유사도 분석 방법
JP2022135064A (ja) * 2021-03-04 2022-09-15 三菱ケミカルエンジニアリング株式会社 診断装置、診断方法、及び診断プログラム
JP2022173863A (ja) * 2021-05-10 2022-11-22 株式会社東芝 モジュラー型時系列データ予測装置、モジュラー型時系列データ予測方法、および、プログラム
KR102470763B1 (ko) * 2022-10-13 2022-11-25 주식회사 비플컨설팅 데이터 이상치 탐색 장치 및 방법

Similar Documents

Publication Publication Date Title
CN107925612B (zh) 网络监视系统、网络监视方法和计算机可读介质
JP6777069B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
US10069691B2 (en) Method and apparatus for anomaly detection in a network
US9509710B1 (en) Analyzing real-time streams of time-series data
CN110417901B (zh) 数据处理方法、装置及网关服务器
EP2981095A1 (en) Data collection and management system, data collection and management method, terminal, and management device
US9524223B2 (en) Performance metrics of a computer system
US20140039806A1 (en) Estimating remaining useful life from prognostic features discovered using genetic programming
WO2018140559A1 (en) Machine discovery and rapid agglomeration of similar states
JP5699715B2 (ja) データ保存装置、データ保存方法
CN112615742A (zh) 用于预警的方法、装置、设备以及存储介质
US20230388202A1 (en) Methods and systems for inferred information propagation for aircraft prognostics
CN116684878B (zh) 一种5g信息传输数据安全监测系统
KR102640983B1 (ko) 극단치와 증감 추세를 반영하여 시계열 데이터를 기호화하는 분석 서버 및 그것의 데이터 분석 방법
CN112000548A (zh) 大数据组件的监测方法、装置及电子设备
CN116070802A (zh) 一种基于数据孪生的智能监控运维方法和系统
CN108234227B (zh) 网络节点设备的时延测量方法、装置及网络节点设备
CN111400114A (zh) 基于深度递归网络大数据计算机系统故障检测方法及系统
CN110971488A (zh) 一种数据处理方法、装置、服务器和存储介质
CN114116128B (zh) 容器实例的故障诊断方法、装置、设备和存储介质
JP6226463B2 (ja) ネットワーク管理システム、ネットワーク装置および制御装置
CN114866438A (zh) 一种云架构下的异常隐患预测方法及系统
CN114563035A (zh) 用于毁伤效能评估的分布式高速数据采集方法及系统
Vox et al. Integer Time Series Compression for Holistic Data Analytics in the Context of Vehicle Sensor Data
CN113971093A (zh) 一种消息处理方法、装置、设备及计算机存储介质

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant