KR102471871B1

KR102471871B1 - 시계열 데이터 세그먼테이션 방법 및 그 장치

Info

Publication number: KR102471871B1
Application number: KR1020180128516A
Authority: KR
Inventors: 진유리; 김성일
Original assignee: 삼성에스디에스 주식회사
Priority date: 2018-10-25
Filing date: 2018-10-25
Publication date: 2022-11-28
Also published as: KR20200052424A

Abstract

시계열 데이터 세그먼테이션 방법이 제공된다. 본 발명의 일 실시예에 따른 시계열 데이터 세그먼테이션 방법은, 시계열 형태의 타깃 데이터(target data)를 복수의 데이터 요소 간의 연관성을 분석하여 적어도 하나의 패턴을 추출하는 단계 및 상기 추출된 패턴을 기초로 상기 타깃 데이터를 적어도 하나의 데이터 세그먼트(data segment)로 분할하는 단계를 포함할 수 있다.

Description

시계열 데이터 세그먼테이션 방법 및 그 장치{METHOD FOR SEGMENTING TIME SERIES DATA AND APPARATUS THEREOF}

본 발명은 시계열 데이터 세그먼테이션 방법 및 그 장치에 관한 것이다. 보다 자세하게는, 데이터 분석의 정확도를 향상시키기 위해, 주어진 시계열 데이터에서 특정 패턴을 추출하고, 추출된 패턴에 기반하여 세그먼테이션(segmentation)을 수행하는 방법 및 그 방법을 수행하는 장치에 관한 것이다.

제조 공정을 진행하는 설비에는 온도, 압력, 시간 등과 같은 제조 공정을 모니터링하기 위한 센서들이 설치되어 있으며, 이러한 센서들을 통해서 수집된 시계열 데이터를 분석함으로써 제조 공정에 대한 모니터링이 수행된다. 최근에는 제조 공정의 시계열 데이터를 분석하기 위해, 컨볼루션 신경망(Convolutional Neural Network; CNN), 순환 신경망(Recurrent Neural Network; RNN) 등과 같은 딥러닝 모델(deep learning model)이 주로 활용되고 있다.

주어진 시계열 데이터로 딥러닝 모델을 학습하거나, 학습된 딥러닝 모델을 통해 실시간으로 유입되는 시계열 데이터를 분석하기 위해서는, 시계열 데이터를 특정 길이의 데이터 세그먼트(data segment)로 분할(segmenting)하는 세그먼테이션 작업이 수행되어야 한다. 여기서, 시계열 데이터가 어떻게 분할되는지에 따라 딥러닝 모델의 성능이 크게 달라지기 때문에, 세그먼테이션 작업은 분석의 정확도를 좌우하는 중요한 작업 중 하나이다.

가령, 도 1에 도시된 바와 같이, 시계열 데이터(1)가 이상 패턴에 대응되는 데이터 세그먼트(3-1, 3-3, 3-5)와 정상 패턴에 대응되는 데이터 세그먼트(3-2, 3-4)로 적절하게 분할되면, 딥러닝 모델은 해당 데이터 세그먼트(3-1 내지 3-5)로부터 이상 판단의 기준이 되는 특징을 보다 빠르고 정확하게 학습할 수 있게 된다.

이와는 반대로, 도 2에 도시된 바와 같이, 시계열 데이터(1)가 유사한 패턴을 보이지 않는 데이터 세그먼트(5-1 내지 5-4)로 분할되면, 딥러닝 모델은 해당 데이터 세그먼트(5-1 내지 5-4)로부터 이상 판단의 기준이 되는 특징을 정확하게 학습하게 없게 된다. 이에 따라, 학습에 많은 시간이 소요되고, 딥러닝 모델의 성능은 저하될 수 밖에 없다.

종래의 세그먼테이션 작업은 주어진 시계열 데이터를 단순히 고정 길이의 데이터 세그먼트로 분할하는 것에 그치고 있다. 이에, 딥러닝 모델을 활용하여 데이터 분석을 수행함에도 불구하고, 만족한 말한 결과를 얻지 못하는 경우가 빈번하였다.

따라서, 시계열 데이터 분석의 정확도를 향상시키기 위해, 주어진 시계열 데이터를 유사한 특징을 갖는 데이터 세그먼트들로 적절하게 분할할 수 있는 방법이 요구된다.

한국공개특허 제10-2017-0113810 (2017.10.13 공개)

본 발명이 해결하고자 하는 기술적 과제는, 시계열 데이터의 특징이 반영된 패턴을 기준으로 정확하게 세그먼테이션을 수행하는 방법 및 그 방법을 수행하는 장치를 제공하는 것이다.

본 발명이 해결하고자 하는 다른 기술적 과제는, 주어진 시계열 데이터의 특징이 반영된 패턴을 추출하는 방법 및 그 방법을 수행하는 장치를 제공하는 것이다.

본 발명이 해결하고자 하는 또 다른 기술적 과제는, 추출된 패턴을 분석하여 딥러닝 모델의 하이퍼파라미터(hyper-parameter) 값을 결정하는 방법 및 그 방법을 수행하는 장치를 제공하는 것이다.

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명의 기술분야에서의 통상의 기술자에게 명확하게 이해될 수 있을 것이다.

상기 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 시계열 데이터 세그먼테이션 방법은, 컴퓨팅 장치에서 시계열 형태의 타깃 데이터(target data)를 세그먼테이션(segmentation)하는 방법에 있어서, 상기 타깃 데이터를 구성하는 복수의 데이터 요소 간의 연관성을 분석하여 적어도 하나의 패턴을 추출하는 단계 및 상기 추출된 패턴을 기초로 상기 타깃 데이터를 적어도 하나의 데이터 세그먼트(data segment)로 분할하는 단계를 포함할 수 있다.

일 실시예에서, 상기 적어도 하나의 패턴을 추출하는 단계는, 상기 복수의 데이터 요소 간의 연관성 정도를 가중치로 갖는 가중치 그래프를 생성하는 단계 및 상기 가중치를 기초로 상기 가중치 그래프에서 상기 적어도 하나의 패턴을 추출하는 단계를 포함할 수 있다.

일 실시예에서, 상기 적어도 하나의 패턴을 추출하는 단계는, 상기 복수의 데이터 요소에 대하여, 인접한 데이터 요소 간의 증감치를 산출하는 단계 및 상기 증감치 간의 연관성을 분석하여 상기 적어도 하나의 패턴을 추출하는 단계를 포함할 수 있다.

일 실시예에서, 상기 타깃 데이터는 제1 변수에 관한 제1 시계열 데이터와 제2 변수에 관한 제2 시계열 데이터를 포함하고, 상기 적어도 하나의 패턴을 추출하는 단계는, 상기 제1 시계열 데이터를 구성하는 제1 데이터 요소와 상기 제2 시계열 데이터를 구성하는 제2 데이터 요소 간의 연관성을 분석하여 상기 적어도 하나의 패턴을 추출하는 단계를 포함할 수 있다.

일 실시예에서, 상기 적어도 하나의 데이터 세그먼트로 분할하는 단계는, 기 설정된 최대 세그먼트 크기 또는 최소 세그먼트 크기에 기초하여 상기 추출된 패턴을 병합하는 단계 및 상기 병합된 패턴을 기초하여 상기 타깃 데이터를 분할하는 단계를 포함할 수 있다.

일 실시예에서, 상기 적어도 하나의 데이터 세그먼트로 분할하는 단계는, 기 설정된 최대 세그먼트 크기 또는 최소 세그먼트 크기에 기초하여 상기 추출된 패턴을 분리하는 단계 및 상기 분리된 패턴을 기초하여 상기 타깃 데이터를 분할하는 단계를 포함할 수 있다.

일 실시예에서, 상기 추출된 패턴은 상기 데이터 요소 간의 연관성 정도를 가리키는 가중치 정보를 포함하고, 상기 추출된 패턴의 가중치의 정보를 분석하여 컨볼루션 신경망(convolutional neural network) 기반 딥러닝 모델의 하이퍼파라미터(hyper-parameter) 값을 결정하는 단계를 더 포함할 수 있다.

상술한 기술적 과제를 해결하기 위한 본 발명의 다른 실시예에 따른 시계열 데이터 세그먼테이션 장치는, 하나 이상의 인스트럭션들(instructions)을 저장하는 메모리 및 상기 하나 이상의 인스트럭션들을 실행함으로써, 시계형 형태의 타깃 데이터(target data)를 구성하는 복수의 데이터 요소 간의 연관성을 분석하여 적어도 하나의 패턴을 추출하고, 상기 추출된 패턴을 기초로 상기 타깃 데이터를 적어도 하나의 데이터 세그먼트(data segment)로 분할하는 프로세서를 포함할 수 있다.

상술한 기술적 과제를 해결하기 위한 본 발명의 또 다른 실시예에 따른 컴퓨터 프로그램은, 컴퓨팅 장치와 결합되어, 시계열 형태의 타깃 데이터(target data)를 구성하는 복수의 데이터 요소 간의 연관성을 분석하여 적어도 하나의 패턴을 추출하는 단계 및 상기 추출된 패턴을 기초로 상기 타깃 데이터를 적어도 하나의 데이터 세그먼트(data segment)로 분할하는 단계를 실행시키기 위하여, 컴퓨터로 판독가능한 기록매체에 저장될 수 있다.

도 1 및 도 2는 세그먼테이션 수행 결과와 모델 성능 간의 관계를 설명하기 위한 예시도이다.
도 3은 본 발명의 일 실시예에 따른 시계열 데이터 분석 시스템을 나타내는 구성도이다.
도 4는 본 발명의 몇몇 실시예에서 참조될 수 있는 다중 시계열 데이터를 나타내는 예시도이다.
도 5는 본 발명의 일 실시예에 따른 시계열 데이터 세그먼테이션 장치를 나타내는 블록도이다.
도 6은 본 발명의 일 실시예에 따른 시계열 데이터 세그먼테이션 장치와 딥러닝 모델과의 관계를 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시예에 따른 시계열 데이터 세그먼테이션 장치를 나타내는 하드웨어 구성도이다.
도 8은 본 발명의 일 실시예에 따른 시계열 데이터 세그먼테이션 방법을 전반적으로 나타내는 흐름도이다.
도 9 내지 도 11은 본 발명의 몇몇 실시예에 따른 전처리 방법을 설명하기 위한 예시도이다.
도 12 내지 도 14는 본 발명의 일 실시예에 따른 패턴 추출 방법을 설명하기 위한 예시도이다.
도 15 및 도 16은 본 발명의 일 실시예에 따른 패턴 분리 방법을 설명하기 위한 예시도이다.
도 17은 본 발명의 일 실시예에 따라 추출된 패턴을 이용하여 시계열 데이터를 세그먼테이션 하는 방법을 설명하기 위한 예시도이다.
도 18은 본 발명의 일 실시예에 따른 딥러닝 모델의 하이퍼파라미터 결정 방법을 나타내는 흐름도이다.
도 19는 본 발명의 몇몇 실시예에서 참조될 수 있는 딥러닝 모델을 설명하기 위한 도면이다.
도 20은 본 발명의 일 실시예에 따라 패턴 분석 결과를 이용하여 컨볼루션 필터의 크기를 결정하는 방법을 설명하기 위한 예시도이다.
도 21은 본 발명의 일 실시예에 따라 서로 다른 크기의 필터를 갖는 다중 컨볼루션 신경망 기반의 딥러닝 모델을 구성하는 방법을 설명하기 위한 예시도이다.
도 22는 본 발명의 일 활용예에 따른 공정 이상 탐지 시스템을 설명하기 위한 도면이다.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.

각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.

또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제1, 제2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.

명세서에서 사용되는 "포함한다 (comprises)" 및/또는 "포함하는 (comprising)"은 언급된 구성 요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성 요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.

본 명세서에 대한 설명에 앞서, 본 명세서에서 사용되는 몇몇 용어들에 대하여 명확하게 하기로 한다.

본 명세서에서, 다중 시계열 데이터(multiple times series data)란, 둘 이상의 시계열 변수에 관한 측정 값으로 구성된 데이터를 의미한다. 상기 다중 시계열 데이터란 용어는 당해 기술 분야에서 다차원 시계열 데이터 또는 다변량 시계열 데이터 등의 용어와 혼용되어 사용될 수 있다.

본 명세서에서, 시계열 변수(times series variable)란, 시간의 흐름에 따라 측정 또는 관측 가능한 특성을 지닌 모든 변수를 가리킨다. 이때, 상기 변수는 당해 기술 분야에서 속성(attribute), 변인, 인자(factor) 등의 용어와 혼용되어 사용될 수 있다. 상기 시계열 변수의 예는 온도, 습도, 주가지수, 환율 등이 될 수 있으나, 본 발명의 기술적 범위가 상기 열거된 예시에 한정되는 것은 아니다.

본 명세서에서, 데이터 요소(data element)란, 패턴 추출을 목적으로 시계열 데이터를 분석할 때, 상기 분석의 기준이 되는 단위 데이터를 의미한다. 상기 데이터 요소는 하나의 측정 값에 대응될 수 있고, 복수의 측정 값을 기초로 가공된 값 또는 상기 복수의 측정 값을 대표하는 대푯값(e.g. 평균, SAX 값 등) 등에 대응될 수도 있다.

본 명세서에서, 하이퍼파라미터(hyper-parameter)란, 모델의 트레이닝을 수행하기 전에 미리 설정되는 파라미터(parameter)를 의미한다. 가령, 기계 학습 분야에서 하이퍼파라미터는 학습률(learning rate), 가중치 감소(weight decay), 배치 크기(batch size), 필터 크기, 스트라이드(stride) 등을 포함할 수 있다. 모델의 파라미터(e.g. 신경망의 가중치)는 학습을 통해 조정되는 것인 데 반해, 하이퍼파라미터는 학습을 수행하기 전에 미리 설정되는 것이라는 점에서 두 파라미터라는 차이점이 있다. 상기 필터는 당해 기술 분야에서 커널(kernel) 또는 뉴런(neuron) 이라는 용어와 혼용되어 사용될 수 있다.

본 명세서에서 인스트럭션(instruction)은 기능을 기준으로 묶인 일련의 명령어들로서 컴퓨터 프로그램의 구성 요소이자 프로세서에 의해 실행되는 것을 가리킨다. 프로세서는 하나 이상의 인스트럭션들을 실행함으로써 이하에서 후술될 본 발명의 몇몇 실시예들에 따른 동작을 수행할 수 있다.

이하, 본 발명의 기술적 사상이 실시된 예를 설명함에 있어, 이해의 편의를 제공하고 중복된 설명을 배제하기 위해, 다중 시계열 데이터에 본 발명의 기술적 사상이 적용된 것을 중심으로 설명을 하도록 한다. 다만, 당해 기술 분야의 당업자라면, 본 발명의 기술적 사상이 단일 시계열 데이터에도 동일하한 방식으로 적용될 수 있음을 자명하게 알 수 있을 것이다.

이하, 본 발명의 몇몇 실시예들에 대하여 첨부된 도면에 따라 상세하게 설명한다.

도 3은 본 발명의 일 실시예에 따른 시계열 데이터 분석 시스템을 나타내는 구성도이다

도 3에 도시된 바와 같이, 시계열 데이터 분석 시스템은 하나 이상의 데이터 소스(10-1 내지 10-n), 수집 장치(30), 세그먼테이션 장치(100) 및 분석 장치(50)를 포함할 수 있다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 구성 요소가 추가되거나 삭제될 수 있음은 물론이다. 또한, 도 3에 도시된 시계열 데이터 분석 시스템의 각각의 구성 요소들은 기능적으로 구분되는 기능 요소들을 나타낸 것으로서, 복수의 구성 요소가 실제 물리적 환경에서는 서로 통합되는 형태로 구현될 수도 있음에 유의한다. 예컨대, 수집 장치(30), 세그먼테이션 장치(100) 및/또는 분석 장치(50) 중 적어도 일부는 동일한 물리적 컴퓨팅 장치 내에서 서로 다른 로직(logic)의 형태로 구현될 수도 있다.

또한, 상기 각각의 구성 요소들은 복수의 실제 물리적 환경에서 세부 기능 요소로 분리되는 형태로 구현될 수도 있다. 예컨대, 세그먼테이션 장치(100)의 제1 기능은 제1 컴퓨팅 장치에서 구현되고, 제2 기능은 제2 컴퓨팅 장치에서 구현될 수도 있다. 이하, 상기 각각의 구성 요소에 대하여 설명한다.

상기 시계열 데이터 분석 시스템에서, 하나 이상의 데이터 소스(10-1 내지 10-n)은 분석 대상이 되는 시계열 데이터를 제공하는 장치 또는 저장소이다.

예를 들어, 상기 시계열 데이터 분석 시스템이 제조 공정의 이상을 탐지하는 시스템인 경우, 데이터 소스(10-1 내지 10-n)는 도 4에 도시된 바와 같이 공정 설비와 연관된 각종 측정 값을 제공하는 센서(60-1 내지 60-n)를 지칭하는 것일 수 있다. 본 발명의 기술적 사상이 공정 이상 탐지 시스템에 활용된 예는 추후 도 22를 참조하여 간략하게 부연 설명하도록 한다.

다른 예를 들어, 분석 대상이 환율, 주가지수 등의 금융 시계열 데이터인 경우, 데이터 소스(10-1 내지 10-n)는 상기 금융 데이터를 제공하는 저장소 또는 장치를 지칭하는 것일 수 있다.

상기 시계열 데이터 분석 시스템에서, 수집 장치(30)는 하나 이상의 데이터 소스(10-1 내지 10-n)부터 시계열 데이터를 수집하는 장치이다. 가령, 수집 장치(30)는 다수의 데이터 소스(10-1 내지 10-n)로부터 다중 시계열 데이터를 수집할 수 있다. 수집 장치(30)가 상기 시계열 데이터를 수집하는 방식은 어떠한 방식이 되더라도 무방하다.

상기 시계열 데이터 분석 시스템에서, 세그먼테이션 장치(100)는 분석의 정확도를 향상시키기 위해 수집된 시계열 데이터에 대한 세그먼테이션 작업을 수행하는 컴퓨팅 장치이다. 여기서, 상기 컴퓨팅 장치는 노트북, 데스크톱(desktop), 랩탑(laptop) 등이 될 수 있으나, 이에 국한되는 것은 아니며 컴퓨팅 기능이 구비된 모든 종류의 장치를 포함할 수 있다. 다만, 대용량의 다중 시계열 데이터에 대해 실시간으로 세그먼테이션을 수행하는 환경이라면, 세그먼테이션 장치(100)는 고성능의 서버급 컴퓨팅 장치로 구현되는 것이 바람직할 수 있다.

본 발명의 실시예에 따르면, 세그먼테이션 장치(100)는 시계열 데이터를 구성하는 데이터 요소 간의 관계를 분석하여 가중치 그래프를 생성하고, 상기 가중치 그래프에서 특정 패턴을 추출할 수 있다. 또한, 추출된 패턴에 기반하여, 입력된 시계열 데이터를 다수의 데이터 세그먼트로 분할할 수 있다. 본 실시예에 따르면, 입력된 시계열 데이터가 유사한 특징을 갖는 데이터 세그먼트들로 분할될 수 있다. 이에 따라, 시계열 데이터 분석의 정확도가 크게 향상될 수 있다. 본 실시예에 대한 자세한 설명은 도 8 내지 도 17을 참조하여 상세하게 설명하도록 한다.

또한, 본 발명의 실시예에 따르면, 추출된 패턴에 기초하여 딥러닝 모델의 하이퍼파라미터 값이 결정될 수 있다. 이때, 상기 딥러닝 모델은 컨볼루션 신경망에 기반할 모델일 수 있고, 상기 하이퍼파라미터는 필터의 크기 및 스트라이드(stride) 등을 포함할 수 있다. 이와 같은 실시예에 한하여, 세그먼테이션 장치(100)는 하이퍼파라미터 결정 장치(100)로 명명될 수도 있다. 본 실시예에 따르면, 하이퍼파라미터 최적화에 소요되는 컴퓨팅 비용이 절감되고, 딥러닝 모델의 성능은 향상될 수 있다. 본 실시예에 대한 자세한 설명은 대한 설명은 도 18 내지 도 21을 참조하여 상세하게 설명하도록 한다.

상기 시계열 데이터 분석 시스템에서, 분석 장치(50)는 시계열 데이터에 대한 분석을 수행하는 장치이다. 정확하게는, 분석 장치(50)는 세그먼테이션 장치(100)에 의해 제공된 시계열 데이터의 세그먼트에 대한 분석을 수행할 수 있다.

본 발명의 실시예에 따르면, 분석 장치(50)는 컨볼루션 신경망, 순환 신경망 등의 딥러닝 모델을 이용하여 시계열 데이터의 세그먼트들을 학습하거나 분석할 수 있다. 또한, 분석 장치(50)는 세그먼테이션 장치(100)가 제공하는 하이퍼파라미터 값으로 상기 딥러닝 모델을 학습할 수 있다. 상기 딥러닝 모델의 예는 도 19를 참조하도록 한다.

도 3에 도시된 시계열 데이터 분석 시스템의 적어도 일부 구성 요소는 네트워크를 통해 통신할 수 있다. 여기서, 상기 네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN), 이동 통신망(mobile radio communication network), Wibro(Wireless Broadband Internet) 등과 같은 모든 종류의 유/무선 네트워크로 구현될 수 있다.

지금까지 도 3 및 도 4를 참조하여 본 발명의 일 실시예에 따른 시계열 데이터 분석 시스템에 대하여 설명하였다. 이하에서는, 세그먼테이션 장치(100)의 구성 및 동작에 대하여 도 5 내지 도 7을 참조하여 설명한다. 이하, 설명의 편의를 위해, 시계열 데이터 세그먼테이션 장치(100)는 세그먼테이션 장치(100)로 약칭하도록 한다.

도 5는 본 발명의 일 실시예에 따른 세그먼테이션 장치(100)를 나타내는 블록도이다.

도 5에 도시된 바와 같이, 세그먼테이션 장치(100)는 데이터 수집부(110), 패턴 추출부(120), 패턴 분리 및 병합부(130), 세그먼테이션부(150), 하이퍼파라미터 결정부(140)를 포함할 수 있다. 다만, 도 5에는 본 발명의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 발명이 속한 기술분야의 통상의 기술자라면 도 5에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다. 또한, 도 5에 도시된 세그먼테이션 장치(100)의 각각의 구성 요소들은 기능적으로 구분되는 기능 요소들을 나타낸 것으로서, 복수의 구성 요소가 실제 물리적 환경에서는 서로 통합되는 형태로 구현될 수도 있음에 유의한다.

각 구성 요소를 살펴보면, 데이터 수집부(110)는 다중 시계열 데이터를 수집한다. 데이터 수집부(110)는 하나 이상의 데이터 소스(e.g. 10-1 내지 10-n) 및/또는 별도의 수집 장치(e.g. 50)로부터 상기 다중 시계열 데이터를 수집할 수 있다. 데이터 수집부(110)가 다중 시계열 데이터를 수집하는 방식은 어떠한 방식이 되더라도 무방하다.

다음으로, 패턴 추출부(120)는 다중 시계열 데이터를 구성하는 데이터 요소 간의 관계를 분석하여 하나 이상의 패턴을 추출한다. 패턴 추출부(120)의 동작에 대한 자세한 설명은 도 8과 도 12 내지 도 14를 참조하여 후술하도록 한다.

다음으로, 패턴 분리 및 병합부(130)는 소정의 기준에 따라 패턴을 분리하거나 병합한다. 이때, 상기 소정의 기준은 예를 들어 최대 세그먼트 크기, 최소 세그먼트 크기 등이 될 수 있으나, 본 발명의 기술적 범위가 상기 열거된 예시에 한정되는 것은 아니다. 패턴 분리 및 병합부(130)의 동작에 대한 자세한 설명은 도 8, 도 15 및 도 16을 참조하여 후술하도록 한다.

다음으로, 세그먼테이션부(150)는 패턴 추출부(120) 및/또는 패턴 분리 및 병합부(130)에 의해 제공된 패턴에 기초하여 다중 시계열 데이터를 다수의 데이터 세그먼트로 분할한다. 세그먼테이션부(150)의 동작에 대한 자세한 설명은 도 8 및 도 17을 참조하여 후술하도록 한다.

다음으로, 하이퍼파라미터 결정부(140)는 패턴 추출부(120) 및/또는 패턴 분리 및 병합부(130)에 의해 제공된 패턴을 분석하여 딥러닝 모델의 하이퍼파라미터 값을 결정한다. 이때, 상기 딥러닝 모델은 컨볼루션 신경망에 기반한 모델이고, 상기 하이퍼파라미터는 필터 크기 및 스트라이드를 포함할 수 있다. 다만, 본 발명의 기술적 범위가 이에 한정되는 것은 아니다.

한편, 도 5에는 도시되어 있지 않으나, 세그먼테이션 장치(100)는 전처리부(미도시)를 더 포함할 수 있다. 상기 전처리부(미도시)는 다중 시계열 데이터에 대한 전처리를 수행하는데, 상기 전처리는 데이터 압축 처리, 정규화, 심볼화 등을 포함할 수 있다. 전처리부(미도시)에 대한 자세한 설명은 도 8 내지 도 11을 참조하여 후술하도록 한다.

도 5에 도시된 세그먼테이션 장치(100)의 구성 요소는 소프트웨어(Software) 또는, FPGA(Field Programmable Gate Array)나 ASIC(Application-Specific Integrated Circuit)과 같은 하드웨어(Hardware)를 의미할 수 있다. 그렇지만, 상기 구성 요소들은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, 어드레싱(Addressing)할 수 있는 저장 매체에 있도록 구성될 수도 있고, 하나 또는 그 이상의 프로세서들을 실행시키도록 구성될 수도 있다. 상기 구성 요소들 안에서 제공되는 기능은 더 세분화된 구성 요소에 의하여 구현될 수 있으며, 복수의 구성 요소들을 합하여 특정한 기능을 수행하는 하나의 구성 요소로 구현될 수도 있다.

상기와 같은 구성 요소를 포함하는 세그먼테이션 장치(100)는 도 6에 도시된 바와 같이 특정 딥러닝 모델(75)과 결합하여 다중 시계열 데이터에 대한 분석을 수행할 수 있다. 가령, 세그먼테이션 장치(100)는 다중 시계열 데이터(71-1 내지 71-3)를 다수의 데이터 세그먼트(73-1 내지 73-n)로 분할하고, 다수의 데이터 세그먼트(73-1 내지 73-n)를 딥러닝 모델(75)의 입력으로 제공할 수 있다. 이때, 클래스 레이블이 주어진 데이터 세그먼트는 딥러닝 모델(75)을 학습하기 위해 이용되고, 클래스 레이블이 주어지지 않은 데이터 세그먼트는 클래스 예측을 위해 딥러닝 모델(75)에 입력될 수 있다.

또한, 세그먼테이션 장치(100)는 다중 시계열 데이터(71-1 내지 71-3)로부터 추출된 패턴에 기초하여 딥러닝 모델(75)의 하이퍼파라미터 값을 결정하고, 상기 하이퍼파라미터 값을 딥러닝 모델(75)에 제공할 수 있다. 상기 하이퍼파라미터 값으로 데이터 세그먼트를 학습함으로써, 하이퍼파라미터 최적화에 소용되는 컴퓨팅 비용은 절감되고, 정확도 높은 딥러닝 모델(75)이 구축될 수 있다. 딥러닝 모델(75)의 구조에 대한 예시는 도 19을 참조하여 후술하도록 한다.

도 7은 본 발명의 일 실시예에 따른 세그먼테이션 장치(100)를 나타내는 하드웨어 구성도이다.

도 7에 도시된 바와 같이, 세그먼테이션 장치(100)는 컴퓨팅 장치로 구현될 수 있다. 이때, 상기 컴퓨팅 장치는 하나 이상의 프로세서(101), 버스(105), 통신 인터페이스(107), 프로세서(101)에 의하여 수행되는 컴퓨터 프로그램을 로드(load)하는 메모리(103)와, 컴퓨터 프로그램(109a)을 저장하는 스토리지(109)를 포함할 수 있다. 다만, 도 7에는 본 발명의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 발명이 속한 기술분야의 통상의 기술자라면 도 7에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.

프로세서(101)는 세그먼테이션 장치(100)의 각 구성의 전반적인 동작을 제어한다. 프로세서(101)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 발명의 기술 분야에 잘 알려진 임의의 형태의 프로세서를 포함하여 구성될 수 있다. 또한, 프로세서(101)는 본 발명의 실시예들에 따른 방법을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다. 세그먼테이션 장치(100)는 하나 이상의 프로세서를 구비할 수 있다.

메모리(103)는 각종 데이터, 명령 및/또는 정보를 저장한다. 메모리(103)는 본 발명의 몇몇 실시예들에 따른 방법들을 실행하기 위하여 스토리지(109)로부터 하나 이상의 프로그램(109a)을 로드할 수 있다. 예컨대, 컴퓨터 프로그램(109a)이 메모리(103)에 로드되면, 도 5에 도시된 바와 같은 모듈이 메모리(103) 상에 구현될 수 있다. 메모리(103)는 RAM과 같은 휘발성 메모리로 구현될 수 있을 것이나, 본 발명의 기술적 범위가 이에 한정되는 것은 아니다.

버스(105)는 세그먼테이션 장치(100)의 구성 요소 간 통신 기능을 제공한다. 버스(105)는 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.

통신 인터페이스(107)는 세그먼테이션 장치(100)의 유무선 인터넷 통신을 지원한다. 또한, 통신 인터페이스(107)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 통신 인터페이스(107)는 본 발명의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다.

스토리지(109)는 상기 하나 이상의 프로그램(109a)을 비임시적으로 저장할 수 있다. 스토리지(109)는 ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.

컴퓨터 프로그램(109a)은 메모리(103)에 로드될 때 프로세서(101)로 하여금 본 발명의 다양한 실시예들에 따른 동작 및/또는 방법을 수행하도록 하는 하나 이상의 인스트럭션들을 포함할 수 있다. 즉, 프로세서(101)는 상기 하나 이상의 인스트럭션들을 실행함으로써, 본 발명의 다양한 실시예들에 따른 동작 및/또는 방법을 수행할 수 있다.

예를 들어, 컴퓨터 프로그램(109a)은 시계열 형태의 타깃 데이터(target data)를 구성하는 복수의 데이터 요소 간의 연관성을 분석하여 적어도 하나의 패턴을 추출하는 동작, 상기 추출된 패턴을 기초로 상기 타깃 데이터를 적어도 하나의 데이터 세그먼트(data segment)로 분할하는 동작을 수행하도록 하는 하나 이상의 인스트럭션들을 포함할 수 있다.

지금까지 도 5 내지 도 7을 참조하여 본 발명의 일 실시예에 따른 세그먼테이션 장치(100)의 구성 및 동작에 대하여 설명하였다. 이하에서는, 도 8 내지 도 17을 참조하여 본 발명의 일 실시예에 따른 시계열 데이터 세그먼테이션 방법에 대하여 상세하게 설명한다.

이하에서 후술될 세그먼테이션 방법의 각 단계는 컴퓨팅 장치에 의해 수행될 수 있다. 다시 말하면, 상기 세그먼테이션 방법의 각 단계는 컴퓨팅 장치의 프로세서에 의해 실행되는 하나 이상의 인스트럭션들로 구현될 수 있다. 상기 세그먼테이션 방법에 포함되는 모든 단계는 하나의 물리적인 컴퓨팅 장치에 의하여 실행될 수도 있을 것이나, 상기 방법의 제1 단계들은 제1 컴퓨팅 장치에 의하여 수행되고, 상기 방법의 제2 단계들은 제2 컴퓨팅 장치에 의하여 수행될 수도 있다. 이하에서는, 상기 세그먼테이션 방법의 각 단계가 세그먼테이션 장치(100)에 의해 수행되는 것을 가정하여 설명을 이어가도록 한다. 다만, 설명의 편의를 위해, 상기 세그먼테이션 방법에 포함되는 각 단계의 동작 주체는 그 기재가 생략될 수도 있다.

도 8은 본 발명의 일 실시예에 따른 시계열 데이터 세그먼테이션 방법을 나타내는 흐름도이다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다.

도 8에 도시된 바와 같이, 상기 세그먼테이션 방법은 다중 시계열 데이터를 수집하는 단계 S10에서 시작된다. 전술한 바와 같이, 상기 다중 시계열 데이터는 복수의 시계열 변수에 관한 측정 값으로 구성된 데이터를 의미한다. 본 단계 S10에서 상기 다중 시계열 데이터를 수집하는 방식은 어떠한 방식이 되더라도 무방하다.

단계 S30에서, 세그먼테이션 장치(100)는 수집된 데이터에 대한 전처리를 수행한다. 본 단계 S30의 구체적인 동작은 실시예에 따라 달라질 수 있다.

일 실시예에서, 세그먼테이션 장치(100)는 데이터 압축 처리를 수행할 수 있다. 가령, 도 9에 도시된 바와 같이, 세그먼테이션 장치(100)는 시계열 데이터(210)를 기 설정된 구간(e.g. 제1 구간, 제2 구간 등)으로 분할하고, 각 구간별로 시계열 데이터(210)의 평균 값(201 내지 209)을 연산할 수 있다. 도 9의 상단에 도시된 그래프는 압축되기 전의 시계열 데이터(210)이고, 도 9의 하단에 도시된 그래프는 압축된 이후의 시계열 데이터(201 내지 209)이다. 본 실시예에 따르면, 시계열 데이터(210) 전체가 아닌 각 구간별 평균 값(201 내지 215)만 저장되므로, 저장 공간이 효율적으로 활용되고 패턴 추출 및 분석에 소요되는 컴퓨팅 비용이 감소되는 효과가 달성될 수 있다. 뿐만 아니라, 평균 연산을 통해 노이즈의 영향이 감소되는 바, 노이즈 제거 효과 또한 달성될 수 있다.

일 실시예에서, 세그먼테이션 장치(100)는 정규화(normalization)를 수행할 수 있다. 가령, 도 10에 도시된 바와 같이, 세그먼테이션 장치(100)는 평균 및 분산을 이용하여 다중 시계열 데이터(211-1, 213-1)를 일정 범위 내의 값으로 정규화할 수 있다. 물론, 평균 및 분산을 이용하지 않고, 얼마든지 다른 방식으로 정규화가 수행될 수도 있다. 도 10에서, 상단에 도시된 그래프는 정규화되기 전의 시계열 데이터(211-1, 213-1)이고, 하단에 도시된 그래프는 정규화된 이후의 시계열 데이터(211-2, 213-2)이다.

일 실시예에서, 세그먼테이션 장치(100)는 심볼화(symbolization) 처리를 수행할 수 있다. 가령, 도 11에 도시된 바와 같이, 세그먼테이션 장치(100)는 SAX(Symbolic Aggregate approXimation) 변환을 통해 시계열 데이터(215)를 심볼화할 수 있다. 보다 구체적으로, 세그먼테이션 장치(100)는 PAA(Piecewise Aggregate Approximation) 변환을 통해 시계열 데이터(215)를 구간 별로 단편화하고, 임계 값들을 기준으로 단편화된 시계열 데이터(217)를 매칭되는 심볼(e.g. a, b, c)로 변환할 수 있다. 도 11은 시계열 데이터(221)가 심볼화의 결과 "baabccbc"로 변환되는 것을 예로써 도시하고 있으나, 상기 심볼화는 시계열 데이터를 알파벳과 같은 문자가 아닌 숫자로 변환하는 것도 포함할 수 있다.

일 실시예에서, 세그먼테이션 장치(100)는 주성분 분석(Principal Component analysis; PCA)을 통해 다중 시계열 데이터에 대한 차원 축소 처리를 수행할 수 있다. 가령, 세그먼테이션 장치(100)는 주성분 분석을 통해 n개의 시계열 변수로부터 k개(단, k는 n 미만의 자연수)의 주성분 변수를 추출할 수 있다. 이에 따라, 데이터 고유의 특성을 최대한 유지하면서 n차원의 데이터가 k차원의 데이터로 축소될 수 있다. 상기 주성분 분석은 당해 기술 분야에서 이미 널리 알려진 기술이므로 이에 대한 자세한 설명은 생략하도록 한다. 본 실시예에 따르면, 데이터의 차원이 축소됨으로써, 데이터 세그먼테이션 및 분석에 소요되는 컴퓨팅 비용이 크게 절감될 수 있다.

일 실시예에서, 세그먼테이션 장치(100)는 전술한 실시예의 조합에 기초하여 수집된 다중 시계열 데이터에 대한 전처리를 수행할 수 있다.

몇몇 실시예에서, 전처리 단계(S30)는 생략될 수도 있다.

단계 S50에서, 세그먼테이션 장치(100)는 다중 시계열 데이터에서 하나 이상의 패턴을 추출한다. 추출된 패턴은 상기 다중 시계열 데이터를 복수의 데이터 세그먼트로 분할하기 위해 이용된다.

본 발명의 실시예에 따르면, 세그먼테이션 장치(100)는 다중 시계열 데이터를 구성하는 데이터 요소들의 관계를 분석하여 가중치 그래프를 생성하고, 생성된 가중치 그래프에 기초하여 하나 이상의 패턴을 추출할 수 있다. 보다 이해의 편의를 제공하기 위해, 도 12 내지 도 14를 참조하여 본 실시예에 대하여 보다 상세하게 설명하도록 한다.

도 12는 본 발명의 일 실시예에 따라 다중 시계열 데이터(221)로부터 가중치 그래프(223)가 생성되는 예를 도시하고 있다. 이하의 도면에서, 다중 시계열 데이터를 구성하는 사각형의 도형은 데이터 요소를 가리키고, 도형 내의 숫자는 데이터 요소의 값을 가리킨다. 또한, 제1 시계열 변수에 관한 제1 시계열 데이터는 제1 음영으로 도시되고, 제2 시계열 변수에 관한 제2 시계열 데이터는 제2 음영으로 도시되었다. 또한, 가중치 그래프의 에지(edge)에 인접하여 표시된 숫자는 해당 에지의 가중치를 가리키며, 에지의 가중치가 "1"인 경우에는 그 표시가 생략되었다.

도 12에 도시된 바와 같이, 다중 시계열 데이터(221)의 각 데이터 요소가 가중치 그래프(223)의 노드(node)로 생성될 수 있다. 전술한 바와 같이, 상기 데이터 요소는 시계열 데이터에서 하나의 측정 값(즉, 특정 시점의 값)이 될 수도 있고, 복수의 측정 값을 대표하는 값(즉, 특정 시간 구간을 대표하는 값)이 될 수도 있다.

또한, 데이터 요소 간의 연관성에 따라 가중치 그래프(223)의 에지(edge)가 생성되며, 연관성의 정도에 따라 가중치 그래프(223)의 가중치가 산출될 수 있다. 가중치를 부여하는 구체적인 방식은 실시예에 따라 달라질 수 있다.

일 실시예에서, 상기 가중치는 두 데이터 요소 간의 시간적 인접성에 기초하여 결정될 수 있다. 즉, 두 데이터 요소가 시간적으로 인접할수록 두 데이터 요소를 연결하는 에지에 더 높은 가중치가 부여될 수 있다. 또는, 두 데이터의 요소 간의 시간적 인접성에 기초하여 두 데이터 요소 간에 에지가 생성될 수 있다. 가령, 도 12에 도시된 바와 같이, 제1 시계열 데이터(222-1)에서 시간적으로 인접한 두 데이터 요소(e.g. 3과 1, 1과 2) 간에 에지가 생성될 수 있다. 또는, 제1 시계열 데이터(222-1)와 제2 시계열 데이터(221-2)에서 시간적으로 인접한 두 데이터 요소(e.g. 3과 8, 1과 1, 2와 4 등) 간에 에지가 생성될 수 있다.

일 실시예에서, 상기 가중치는 두 데이터 요소가 인접하여 출현한 빈도에 기초하여 결정될 수 있다. 가령, 도 12에 도시된 바와 같이, 제3 시계열 데이터(221-3)의 두 데이터 요소(1과 2)는 인접하여 출현한 빈도가 "2회"이므로, 두 데이터 요소 간의 에지 가중치로 "2"가 부여될 수 있다.

일 실시예에서, 전술한 실시예들의 조합에 기초하여 가중치가 결정될 수 있다.

다음으로, 세그먼테이션 장치(100)는 가중치 그래프의 가중치를 기준으로 패턴을 추출할 수 있다. 가령, 도 13에 도시된 바와 같이, 생성된 가중치 그래프(231)에서 임계 값 이상의 가중치를 갖는 에지로 구성된 부분 그래프가 패턴(233)으로 추출될 수 있다. 특히, 도 13은 상기 임계 값이 "2"인 경우를 예로써 도시하고 있다.

상기 임계 값은 기 설정된 고정 값 또는 상황에 따라 변동되는 변동 값일 수 있다. 가령, 상기 임계 값은 최소/최대 세그먼트 크기(또는, 딥러닝 모델의 입력 데이터 크기)가 큰 값일수록 더 작아지는 변동 값일 수 있다. 임계 값이 작아질수록 추출되는 패턴과 데이터 세그먼트의 크기는 커질 것이기 때문이다. 또는, 상기 임계 값은 컴퓨팅 장치(e.g. 50, 100)의 성능이 우수할수록 또는 가용 리소스가 많을수록 더 커지면 변동 값일 수 있다. 임계 값이 커질수록 추출되는 패턴과 데이터 세그먼트의 크기가 작아져, 세그먼트의 개수가 증가할 것이기 때문이다.

한편, 도 12는 가중치 그래프(223)가 무방향 그래프인 것을 예로써 도시하고 있다. 그러나, 본 발명의 다른 실시예에 따르면, 다중 시계열 데이터로부터 가중치를 갖는 방향 그래프 또는 방향과 무방향이 혼재된 혼합 그래프가 생성될 수도 있다. 이때, 에지의 방향은 데이터 요소 간의 시계열 순서에 따라 결정될 수 있다. 제1 데이터 요소와 제2 데이터 요소가 동일한 시점의 데이터인 경우(e.g. 도 12에서 제1 시계열 데이터 222-1의 데이터 요소와 제2 시계열 데이터 221-2의 데이터 요소), 에지는 양방향 또는 무방향으로 결정될 수 있으며, 이는 실시예에 따라 달라질 수 있다. 본 실시예에 따르면, 데이터 요소 간의 시계열 순서를 보다 엄격하게 고려하여 패턴이 추출될 수 있다. 이에 따라, 데이터 세그먼트 또한 시계열적 순서에 따라 엄격하게 분할되게 된다. 따라서, 분석 대상이 시계열 순서 관계를 중요한 특징으로 갖는 데이터인 경우, 데이터 분석의 정확도가 더욱 향상될 수 있다.

한편, 본 발명의 다른 실시예에 따르면, 세그먼테이션 장치(100)는 데이터 요소 값의 증감치에 기초하여 가중치 그래프를 생성하고, 패턴을 추출할 수도 있다. 가령, 도 14에 도시된 바와 같이, 세그먼테이션 장치(100)는 주어진 다중 시계열 데이터(241)에서 인접한 데이터 요소 간의 증가치 또는 감소치를 연산하여, 다중 시계열 데이터(241)를 증감치 데이터(243)를 변환할 수 있다. 또한, 세그먼테이션 장치(100)는 증감치 데이터(243)를 구성하는 데이터 요소를 노드로 하는 가중치 그래프를 생성할 수 있다. 본 실시예에 따르면, 시계열 데이터의 증감 패턴이 추출되고, 상기 증감 패턴에 기반하여 데이터 세그먼트가 형성될 수 있다. 따라서, 데이터의 증감 패턴이 중요한 시계열 데이터에 본 실시예가 적용되면, 데이터 분석의 정확도가 더욱 향상될 수 있다.

다시 도 8을 참조하여 설명한다.

단계 S70에서, 세그먼테이션 장치(100)는 단계 S50에서 추출된 패턴을 소정의 조건에 따라 분리하거나 병합한다. 상기 소정의 조건은 실시예에 따라 달라질 수 있다.

일 실시예에서, 상기 소정의 조건은 미리 설정된 최소 세그먼트 크기 또는 최대 세그먼트 크기에 기초한 것일 수 있다. 즉, 세그먼테이션 장치(100)는 최소 세그먼트 크기를 만족하도록 둘 이상의 패턴을 병합하거나, 최대 세그먼트 크기를 만족하도록 패턴을 둘 이상의 서브 패턴으로 분리할 수 있다. 상기 최소 세그먼트 크기 또는 최대 세그먼트 크기는 딥러닝 모델의 입력 데이터 크기(e.g. CNN에 입력되는 이미지 사이즈)에 기초하여 결정되는 것일 수 있으나, 본 발명의 기술적 범위가 이에 한정되는 것은 아니다.

일 실시예에서, 상기 소정의 조건은 컴퓨팅 장치의 성능 또는 가용 리소스에 기초한 것일 수 있다. 이때, 상기 컴퓨팅 장치는 세그먼테이션 장치(100) 및/또는 딥러닝 모델을 통해 분석을 수행하는 장치(e.g. 도 1의 분석 장치 50)을 포함할 수 있다. 구체적으로, 컴퓨팅 장치의 성능이 낮거나 또는 가용 리소스가 부족한 경우, 세그먼테이션 장치(100)는 패턴을 병합함으로써 데이터 세그먼트의 크기를 증가시키고, 개수는 감소시킬 수 있다. 데이터 세그먼트의 크기가 작아지는 만큼 개수는 증가하게 되고, 세그먼테이션 및 분석에 소요되는 컴퓨팅 리소스는 증가하게 되기 때문이다. 반대의 경우, 세그먼테이션 장치(100)는 패턴을 분리함으로써 데이터 세그먼트의 크기를 감소시킬 수 있다.

일 실시예에서, 상기 소정의 조건은 전술한 실시예의 조합에 기초한 것일 수 있다.

본 단계 S70에서, 패턴을 분리하는 구체적인 방식은 실시예에 따라 달라질 수 있다.

일 실시예에서, 패턴을 나타내는 가중치 그래프에서 가중치가 낮은 에지를 제거함으로써 패턴 분리가 수행될 수 있다. 가령, 도 15에 도시된 바와 같이, 패턴(251)을 구성하는 에지 중에 가중치가 상대적으로 낮은 에지(251-1, 251-2)를 제거함으로써, 패턴(251)이 서브 패턴(253, 255)로 분리될 수 있다.

일 실시예에서, 패턴을 나타내는 가중치 그래프에서 가중치가 높은 부분 그래프를 중심으로 패턴 분리가 수행될 수 있다. 가령, 도 16에 도시된 바와 같이, 패턴(261)을 구성하는 부분 그래프(261-1)는 다른 에지에 비해 상대적으로 높은 가중치를 포함하고 있다. 이는, 부분 그래프(261-1)에 대응되는 구성 요소 간의 연관성이 높다는 것을 의미하므로, 세그먼테이션 장치(100)는 부분 그래프(261-1)를 중심으로 패턴 분리를 수행할 수 있다. 구체적인 예를 들어, 부분 그래프(261-1)를 제외한 나머지 노드 및 에지를 제거함으로써, 패턴 분리가 수행될 수 있다. 다른 예를 들어, 도 16에 도시된 바와 같이, 부분 그래프(261-1)가 분리된 서브 패턴(263, 165)에 모두 포함되도록 패턴 분리가 수행될 수도 있다.

일 실시예에서, 전술한 실시예의 조합에 기초하여 패턴 분리가 이루어질 수 있다.

이외에도, 당해 기술 분야에서 널리 알려진 적어도 하나의 그래프 분할 기법을 적용하여 패턴 분리가 이루어질 수도 있다.

본 단계 S70에서, 병합 대상 패턴을 선정하는 구체적인 방식 또한 실시예에 따라 달라질 수 있다.

일 실시예에서, 복수의 패턴 중에서 그래프 유사도가 임계치 이상인 패턴들이 병합 대상으로 선정될 수 있다. 여기서, 상기 복수의 패턴은 전술한 병합 조건에 따라 병합이 요구되는 패턴들을 의미할 수 있다. 상기 그래프 유사도는 어떠한 방식으로 산출되더라도 무방하다. 중첩되는 부분 그래프가 존재하는 경우, 그래프 유사도가 높을 것이다. 따라서, 본 실시예에 따르면, 도 16에 도시된 형태의 패턴(263, 265)이 하나의 슈퍼 패턴으로 병합될 수 있을 것이다.

일 실시예에서, 패턴의 시계열적 순서에 기초하여 복수의 패턴 중에서 병합 대상 패턴이 선정될 수 있다. 여기서, 상기 복수의 패턴은 전술한 병합 조건에 따라 병합이 요구되는 패턴들을 의미할 수 있다. 가령, 제1 패턴과 병합될 패턴을 탐색할 때, 시계열 데이터 상에서 상기 제1 패턴과 인접한 시간 구간에서 추출된 제2 패턴이 병합 대상 패턴으로 선정될 수 있다. 상기 제1 패턴과 인접한 시간 구간에서 추출된 패턴이 다수개인 경우, 인접하여 출현한 빈도를 더 고려하여 병합 대상 패턴이 선정될 수 있다. 본 실시예에 따르면, 도 15 또는 도 16에 도시된 형태의 패턴(254과 255, 263과 265)이 하나의 슈퍼 패턴으로 병합될 수 있을 것이다.

일 실시예에서, 전술한 실시예의 조합에 기초하여 패턴 병합이 이루어질 수 있다.

몇몇 실시예에서, 패턴 분리 및 병합 단계 S70은 생략될 수도 있다.

다시 도 8을 참조하여 설명한다.

단계 S90에서, 세그먼테이션 장치(100)는 다중 시계열 데이터에서 추출된 패턴을 참조하여 상기 다중 시계열 데이터를 복수의 데이터 세그먼트로 분할한다. 이때, 상기 추출된 패턴은 단계 S50 또는 S70의 결과로 제공된 패턴을 의미한다.

가령, 도 17에 도시된 바와 같이, 다중 시계열 데이터(271)에서 기준 패턴(273)에 매칭되는 데이터 요소들이 하나의 데이터 세그먼트를 구성하도록 세그먼테이션이 수행될 수 있다. 특히, 도 17은 다수의 데이터 세그먼트(271-1 내지 271-3)가 서로 중첩되지 않는 형태로 분할된 것을 예로써 도시하였으나, 이는 실시예에 따라 얼마든지 달라질 수 있다. 즉, 세그먼테이션 장치(100)는 데이터 세그먼트의 적어도 일부가 중첩되는 형태로 세그먼테이션을 수행할 수도 있다.

예컨대, 시계열적 순서가 중요한 데이터인 경우, 컴퓨팅 장치의 가용 리소스가 많거나 성능이 우수한 경우, 추출된 패턴에서 시계열 순서 방향(즉, 시간 축 방향 or 그래프의 가로 방향)의 가중치가 상대적으로 다른 방향에 비해 높은 경우 및/또는 다중 시계열 데이터에서 패턴에 매칭된 영역이 서로 중첩되는 경우 등 다양한 조건에 따라 세그먼테이션 장치(100)는 중첩 세그먼테이션을 수행할 수도 있다.

또한, 몇몇 실시예에 따르면, 세그먼테이션 장치(100)는 기 설정된 최대 세그먼트 크기 또는 딥러닝 모델의 입력 데이터 크기를 만족하기 위해 데이터 세그먼트에 패딩(padding)을 수행할 수도 있다. 이때, 상기 패딩은 제로 패딩 방식, 해당 데이터 세그먼트에 인접한 데이터를 패딩하는 방식 등 어떠한 방식으로 수행되더라도 무방하다.

참고로, 전술한 단계 S10 내지 S90 중에서, 단계 S10은 데이터 수집부(110), 단계 S30은 전처리부(미도시), 단계 S50은 패턴 추출부(120), 단계 S70은 패턴 분리 및 병합부(130), 단계 S90은 세그먼테이션부(140)에 의해 수행될 수 있다.

지금까지 도 8 내지 도 17을 참조하여 본 발명의 일 실시예에 따른 시계열 데이터 세그먼테이션 방법에 대하여 설명하였다. 상술한 방법에 따르면, 추출된 패턴에 기반하여, 시계열 데이터를 다수의 데이터 세그먼트로 분할되기 때문에, 각 데이터 세그먼트가 유사한 특징을 갖도록 분할될 수 있다. 이에 따라, 시계열 데이터 분석의 정확도가 크게 향상될 수 있다.

이하에서는, 도 18 내지 도 21을 참조하여 본 발명의 일 실시예에 따른 하이퍼파라미터 결정 방법에 대하여 설명하도록 한다.

이하에서 후술될 하이퍼파라미터 결정 방법의 각 단계도 컴퓨팅 장치에 의해 수행될 수 있다. 상기 결정 방법에 포함되는 모든 단계는 하나의 물리적인 컴퓨팅 장치에 의하여 실행될 수도 있을 것이나, 상기 방법의 제1 단계들은 제1 컴퓨팅 장치에 의하여 수행되고, 상기 방법의 제2 단계들은 제2 컴퓨팅 장치에 의하여 수행될 수도 있다. 이하에서는, 상기 결정 방법의 각 단계가 세그먼테이션 장치(100)에 의해 수행되는 것을 가정하여 설명을 이어가도록 한다. 이하의 서술에서, 앞서 언급한 실시예의 내용과 중복되는 사항은 명세서의 명료함을 위해 생략하도록 한다.

도 18은 본 발명의 일 실시예에 따른 하이퍼파라미터 결정 방법을 나타내는 흐름도이다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다.

도 18에 도시된 바와 같이, 상기 하이퍼파라미터 결정 방법의 일부 단계들(S110 내지 S170)은 전술한 세그먼테이션 방법의 일부 단계들(S10 내지 S70)과 실질적으로 동일하다. 따라서, 중복되는 단계들(S110 내지 S170)에 대한 설명은 전술한 내용을 참조하도록 한다.

단계 S190에서, 세그먼테이션 장치(100)는 추출된 패턴을 분석하여 딥러닝 모델의 하이퍼파라미터 값을 결정한다. 이때, 상기 딥러닝 모델은 컨볼루션 신경망에 기반한 모델을 의미하고, 상기 하이퍼파라미터는 필터 크기와 스트라이드를 포함할 수 있다.

상기 딥러닝 모델의 일 예시는 도 19에 도시되어 있다. 도 19에 도시된 바와 같이, 컨볼루션 신경망(283)과 순환 신경망의 일종인 LSTM(Long Short-Term Memory Model) 신경망(285)에 기반하여 구성될 수 있다.

컨볼루션 신경망(283)은 2차원 데이터로부터 지역적 특징을 추출하는데 특화된 신경망이다. 따라서, 컨볼루션 신경망(283)은 2차원의 데이터 세그먼트에서 시계열 변수 간의 상관 관계를 고려하여 특징을 추출하는데 가장 적합한 모델이다. 몇몇 실시예에서, 데이터 세그먼트(281-1 내지 281-n)를 컨볼루션 신경망(283)에 입력하기 전에 데이터 세그먼트(281-1 내지 281-n)의 값을 픽셀 값의 범위에 맞게 적절하게 보정하는 과정이 수행될 수 있다. 물론, 상기 보정 과정은 단계(S130)에서 다른 전처리 과정과 함께 수행될 수도 있다.

순환 신경망(285)은 순환적 연결 구조를 통해 시간 순서에 따른 특징을 추출하는데 특화된 신경망이다. 또한, 시계열 데이터는 일반적으로 자기 상관 관계를 갖고 있어 과거의 데이터가 현재의 데이터에 영향을 미치는 특성을 지닌다. 따라서, 두 신경망이 조합되면, 자기 상관 관계를 갖는 시계열 데이터의 특성이 보다 잘 고려될 수 있고, 다중 시계열 데이터에 대한 정확한 분석이 이루어질 수 있는 것이다.

도 19에 도시된 예에서, 컨볼루션 신경망(283)은 다수의 세그먼트(281-1 내지 281-n)를 입력받고, 다수의 세그먼트(281-1 내지 281-n)로부터 특징(e.g. 특징 맵)을 추출하는 동작을 수행하게 된다. 또한, 순환 신경망(285)은 컨볼루션 신경망(283)에서 추출된 특징에 기반하여 분류 태스크를 수행하게 된다. 다만, 도 19에 도시된 예는 딥러닝 모델의 일 예시에 불과함에 유의하여야 한다. 상기 딥러닝 모델은 컨볼루션 신경망으로만 구성될 수도 있고, 다양한 신경망의 조합에 의해 구성될 수도 있다. 본 발명의 논지를 흐리지 않기 위해, 딥러닝 모델에 대한 더 이상의 설명은 생략하도록 한다.

본 단계 S190에서, 세그먼테이션 장치(100)는 패턴에 나타난 가중치 경향을 분석하여 필터의 크기와 스트라이드를 결정할 수 있다. 상기 필터는 컨볼루션 레이어에서 특징 맵을 추출하기 위해 이용되는 가중치의 집합을 의미한다.

구체적으로, 도 20을 도시된 바와 같이, 세그먼테이션 장치(100)는 다중 시계열 데이터(291)에서 패턴(293)을 추출하고, 패턴(293)을 나타내는 가중치 그래프 상에서 가로 방향과 세로 방향의 가중치를 분석한다. 이때, 상기 가로 방향은 시간 축 방향을 의미하고, 상기 가로 방향 가중치는 시계열 순서에 따른 연관성의 정도를 나타내는 것으로 이해될 수 있다. 또한, 세로 방향 가중치는 서로 다른 시계열 변수 간 연관성의 정도를 나타내는 것으로 이해될 수 있다. 물론, 실시예에 따라, 세로 방향이 시간 축 방향에 대응될 수도 있다.

도 20에 도시된 바와 같이, 세로 방향 가중치가 높은 경향(e.g. 높은 세로 방향 가중치를 갖는 데이터 요소의 개수가 임계 값 이상인 경우)을 보이는 경우, 세그먼테이션 장치(100)는 필터(295)의 세로변의 길이를 기본 값보다 증가시킬 수 있다. 필터(295)의 세로 길이가 증가되는 경우, 세로 축의 연관성(즉, 시계열 변수 간의 연관성)이 더욱 잘 반영되어 특징 맵이 추출될 수 있기 때문이다. 반대의 경우, 세그먼테이션 장치(100)는 필터(295)의 세로 길이를 기본 값보다 감소시킬 수도 있다.

가로 방향 가중치가 높은 경향(e.g. 높은 가로 방향 가중치를 갖는 데이터 요소의 개수가 임계 값 이상인 경우)을 보이는 경우, 세그먼테이션 장치(100)는 필터(295)의 가로 길이를 기본 값보다 증가시킬 수 있다. 반대의 경우, 세그먼테이션 장치(100)는 필터(295)의 가로 길이를 기본 값보다 감소시킬 수도 있다.

필터의 크기가 달라지는 경우, 컨볼루션 레이어를 통해 출력되는 특징 맵의 크기가 달라지게 된다. 즉, 필터의 크기가 커질수록 상기 특징 맵의 크기는 작아지게 된다. 이점을 보완하기 위해, 세그먼테이션 장치(100)는 특징 맵의 크기에 기초하여 스트라이드를 결정할 수 있다. 가령, 필터의 크기(e.g. 가로 또는 세로 길이)가 커진 경우, 세그먼테이션 장치(100)는 특징 맵의 크기가 작아질 것을 고려하여 스트라이드를 기본 값보다 작은 값으로 결정할 수 있다.

이외에도, 세그먼테이션 장치(100)는 다양한 방식으로 하이퍼파라미터 값을 결정할 수 있다.

일 실시예에서, 세그먼테이션 장치(100)는 가로 방향 가중치가 높은 경향을 보이는 경우, 가로 방향 스트라이드를 기본 값보다 작은 값으로 결정할 수 있다. 그렇게 함으로써, 시계열 순서에 따른 연관성을 더 고려하여 특징 맵이 추출될 수 있기 때문이다. 세로 방향 가중치가 높은 경향을 보이는 경우에는, 세로 방향 스트라이드가 기본 값보다 작은 값으로 결정될 수 있다.

일 실시예에서, 세그먼테이션 장치(100)는 딥러닝 모델이 구비된 분석 장치의 성능을 기초하여 스트라이드를 결정할 수도 있다. 가령, 상기 분석 장치의 성능이 우수하지 않은 경우, 세그먼테이션 장치(100)는 스트라이드를 기본 값보다 증가시켜 특징 맵 추출에 소요되는 컴퓨팅 리소스를 절감할 수 있다.

일 실시예에서, 가로 방향 가중치와 세로 방향 가중치가 모두 높은 경향을 보이는 경우가 있을 수 있다. 이와 같은 경우, 세그먼테이션 장치(100)는 다양한 방식으로 필터의 크기와 스트라이드 값을 결정할 수 있다.

예를 들어, 세그먼테이션 장치(100)는 필터의 가로 및 세로 길이를 모두 기본 값보다 증가시킬 수 있다.

다른 예를 들어, 세그먼테이션 장치(100)는 더 높은 경향을 보이는 제1 방향(e.g. 세로)의 가중치 경향을 반영하기 위해 상기 제1 방향에 대응되는 필터의 길이(e.g. 세로 길이)를 기본 값보다 증가시킬 수 있다. 또한, 세그먼테이션 장치(100)는 제2 방향(e.g. 가로)의 가중치 경향을 반영하기 위해, 제2 방향(e.g. 가로)의 스트라이드 값을 기본 값보다 감소시킬 수 있다.

또 다른 예를 들어, 두 방향의 가중치 간에 우선순위가 존재하는 경우, 세그먼테이션 장치(100)는 우선순위가 상대적으로 높은 제1 방향(e.g. 세로)의 가중치 경향을 반영하기 위해 상기 제1 방향에 대응되는 필터의 길이(e.g. 세로 길이)를 기본 값보다 증가시킬 수 있다. 또한, 세그먼테이션 장치(100)는 우선순위가 상대적으로 낮은 제2 방향(e.g. 가로)의 가중치 경향도 반영하기 위해, 제2 방향(e.g. 가로)의 스트라이드 값을 기본 값보다 감소시킬 수 있다.

한편, 본 발명의 몇몇 실시예들에 따르면, 세그먼테이션 장치(100)는 딥러닝 모델(e.g. 도 19에 도시된 모델)의 성능을 보다 향상시키기 위해 시계열 데이터를 재배열한 다음에 세그먼테이션을 수행할 수도 있다. 구체적으로, 추출된 패턴 그래프에서, 세로 가중치가 높다는 것은 곧 두 시계열 변수 간에 연관성이 높다는 것을 의미한다. 따라서, 상기 두 시계열 변수에 관한 시계열 데이터가 서로 인접하도록 재배열되면, 딥러닝 모델은 두 시계열 변수 간에 연관성을 더욱 잘 고려하여 학습 및 예측을 수행할 수 있기 때문에, 딥러닝 모델의 성능이 향상될 수 있다. 본 실시예에서, 세그먼테이션 장치(100)는 추출된 패턴의 세로 방향 가중치에 기반하여 가중치가 제1 임계 값 이상인 시계열 변수들을 세로 축 상에서 서로 인접하도록 배열하여 다중 시계열 데이터를 재구성하고, 재구성된 다중 시계열 데이터를 분할하여 다수의 데이터 세그먼트를 생성할 수 있다. 이때, 상기 다수의 데이터 세그먼트는 딥러닝 모델의 학습용 또는 예측용 데이터로 활용됨으로써, 상기 딥러닝 모델의 성능을 더욱 향상시킬 수 있다.

한편, 전술한 바에 따르면, 다중 시계열 데이터에서 복수의 패턴이 추출될 수 있으므로, 제1 패턴과 매칭되는 제1 데이터 세그먼트가 존재하고, 제2 패턴에 매칭되는 제2 데이터 세그먼트가 존재할 수 있다. 따라서, 각 데이터 세그먼트부터 특징을 정확하게 추출하기 위해 다수의 컨볼루션 신경망(또는 컨볼루션 레이어)이 활용될 수 있는데, 본 실시예에 대하여 도 21을 참조하여 설명하도록 한다.

도 21에 도시된 바와 같이, 제1 패턴(P₁)에 매칭되는 제1 데이터 세그먼트(301-1)는 제1 컨볼루션 신경망(303-1)에 입력되어 특징 맵이 추출되고, 제2 패턴(P₂)에 매칭되는 제2 데이터 세그먼트(301-2)는 제2 컨볼루션 신경망(303-2)에 입력되어 특징 맵이 추출될 수 있다. 이때, 제1 패턴(P₁)을 기초로 제1 컨볼루션 신경망(303-1)의 필터(305-1)의 크기가 결정되고, 제2 패턴(P₂)을 기초로 제2 컨볼루션 신경망(303-2)의 필터(305-2)의 크기가 결정될 수 있다. 동일하게, 제n 패턴(P_n)을 기초로 제n 컨볼루션 신경망(303-n)의 필터(305-n)의 크기가 결정될 수 있다. 스트라이드 값 또한 동일하게 대응되는 패턴에 기초하여 결정될 수 있다. 그렇게 함으로써, 각 컨볼루션 신경망(303-1 내지 303-n)이 서로 다른 패턴에 매칭되는 다수의 데이터 세그먼트(301-1 내지 301-n)로부터 보다 정확하게 특징 맵을 추출할 수 있게 된다.

참고로, 전술한 단계 S110 내지 S190 중에서, 단계 S110은 데이터 수집부(110), 단계 S130은 전처리부(미도시), 단계 S150은 패턴 추출부(120), 단계 S170은 패턴 분리 및 병합부(130), 단계 S190은 하이퍼파라미터 결정부 (150)에 의해 수행될 수 있다.

지금까지 도 18 내지 도 21을 참조하여 본 발명의 일 실시예에 따른 하이퍼파라미터 결정 방법에 대하여 설명하였다. 상술한 방법에 따르면, 세그먼테이션 과정에 추출된 패턴에 기초하여 하이퍼파라미터 값이 결정될 수 있다. 이에 따라, 하이퍼파라미터 최적화에 소요되는 컴퓨팅 비용이 절감되고, 딥러닝 모델의 성능은 향상될 수 있다.

부연 설명하면, 종래에는 그리드 탐색(grid search) 또는 랜덤 탐색(random search)을 통해 하이퍼파라미터 샘플을 추출하고, 추출된 샘플을 적용하여 딥러닝 모델을 학습하며, 성능 평가를 통해 하이퍼파라미터 값이 결정되었다. 이와 같은 최적화 과정을 수행하기 위해 많은 컴퓨팅 비용이 소모되었다. 또한, 상기 최적화 과정을 통해 딥러닝 모델의 성능이 향상되더라도, 하이퍼파라미터 값이 성능 변화 사이의 관계를 알 수 없었다. 따라서, 데이터셋이 변경되거나 딥러닝 모델의 구조가 변경될 때마다 다시 최적화 과정을 수행해야 하는 불편함이 있었다. 그러나, 전술한 방법에 따르면, 시계열 데이터에서 추출된 패턴에 기반하여 하이퍼파라미터 값이 결정되므로, 최적화 과정을 별도로 수행할 필요가 없거나, 최적화에 소요되는 컴퓨팅 비용이 최소화될 수 있다. 나아가, 세그먼테이션 작업을 수행하는 동안 하이퍼파라미터 값이 결정될 것이므로, 데이터셋이 등이 변경되더라도 다시 최적화 과정을 수행할 필요가 없다.

도 22는 본 발명의 일 활용예에 따른 공정 이상 탐지 시스템을 나타내는 구성도이다.

도 22에 도시된 바와 같이, 전술한 본 발명의 기술적 사상은 이상 탐지 장치(330)를 통해 구체화될 수 있다.

이상 탐지 장치(330)는 다수의 센서(320-1 내지 320-n)의 측정 값으로 구성된 다중 시계열 데이터를 분석하여 실시간으로 공정 설비(310)의 이상을 탐지하는 장치이다.

이상 탐지 장치(330)는 상기 다중 시계열 데이터에서 추출된 패턴에 기초하여 상기 다중 시계열 데이터를 2차원의 데이터 세그먼트로 분할하고, 클래스 레이블이 주어진 데이터 세그먼트를 학습하여 딥러닝 모델을 구축할 수 있다. 전술한 바와 같이, 패턴에 기반하여 세그먼테이션이 수행되면, 연관성이 높은 데이터 요소가 동일한 데이터 세그먼트에 포함되도록 분할이 이루어진다. 따라서, 딥러닝 모델의 학습 속도와 성능은 향상되며, 학습에 소요되는 컴퓨팅 비용은 감소될 수 있다.

또한, 이상 탐지 장치(330)는 상기 추출된 패턴을 분석하여 적절한 하이퍼파라미터 값을 결정하고, 상기 하이퍼파라미터 값으로 상기 딥러닝 모델을 학습할 수 있다. 이를 통해, 상기 딥러닝 모델의 학습 속도와 성능은 더욱 향상되며, 학습에 소요되는 컴퓨팅 비용과 하이퍼파라미터 최적화에 소요되는 컴퓨팅 비용이 크게 감소될 수 있다.

또한, 이상 탐지 장치(330)는 딥러닝 모델을 통해 공정 설비(310)의 이상 여부를 정확하게 판정할 수 있다. 이를 통해, 제조 공정의 효율이 향상될 뿐만 아니라, 관리의 편의성이 증대되는 효과가 달성될 수 있다.

지금까지 도 22를 참조하여 본 발명의 기술적 사상이 공정 이상 탐지 분야에 활용된 예에 대하여 간략하게 설명하였다. 상술한 바에 따르면, 적절한 세그먼테이션 작업을 통해 딥러닝 모델의 성능을 향상시킴으로써, 이상 탐지의 신뢰성 및 정확성이 크게 향상될 수 있다.

한편, 본 발명의 기술적 사상은 공정 이상 탐지 분야뿐만 아니라 시계열 데이터를 다루는 다양한 분야에서 다양한 방식으로 활용될 수 있다.

예를 들어, 본 발명의 실시예에 따른 세그먼테이션 기능은 시계열 데이터를 다루는 대부분 분야에서 전처리를 위해 활용될 수 있다.

다른 예를 들어, 상기 세그먼테이션 기능은 시계열 데이터를 군집화하는 목적으로도 활용될 수 있다. 가령, 시계열 데이터에서 추출된 패턴을 기준으로 데이터 세그먼트에 대한 군집화가 수행될 수 있다.

또 다른 예를 들어, 본 발명의 실시예에 따른 패턴 추출 기능은 패턴 DB를 구축하거나, 패턴 매칭 기반으로 특정 태스크를 수행하기 위해 활용될 수 있다. 가령, 상기 패턴 추출 기능을 통해 특정 패턴 별로 데이터 세그먼트가 저장된 패턴 DB가 구축될 수 있다. 또한, 상기 패턴 추출 기능을 통해 이상 패턴 및/또는 정상 패턴이 추출되고, 패턴 매칭을 통해 이상 탐지가 수행될 수도 있다.

이와 같이, 도 3 내지 도 22를 참조하여 설명한 본 발명의 다양한 실시예들은 다양한 분야에서 다양한 방식으로 활용될 수 있다.

지금까지 도 3 내지 도 22를 참조하여 설명된 본 발명의 몇몇 실시예들 및 그 실시예들에 따른 효과들을 언급하였다. 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.

지금까지 도 3 내지 도 22를 참조하여 설명된 본 발명의 개념은 컴퓨터가 읽을 수 있는 매체 상에 컴퓨터가 읽을 수 있는 코드로 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체는, 예를 들어 이동형 기록 매체(CD, DVD, 블루레이 디스크, USB 저장 장치, 이동식 하드 디스크)이거나, 고정식 기록 매체(ROM, RAM, 컴퓨터 구비 형 하드 디스크)일 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체에 기록된 상기 컴퓨터 프로그램은 인터넷 등의 네트워크를 통하여 다른 컴퓨팅 장치에 전송되어 상기 다른 컴퓨팅 장치에 설치될 수 있고, 이로써 상기 다른 컴퓨팅 장치에서 사용될 수 있다.

이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.

도면에서 동작들이 특정한 순서로 도시되어 있지만, 반드시 동작들이 도시된 특정한 순서로 또는 순차적 순서로 실행되어야만 하거나 또는 모든 도시 된 동작들이 실행되어야만 원하는 결과를 얻을 수 있는 것으로 이해되어서는 안 된다. 특정 상황에서는, 멀티태스킹 및 병렬 처리가 유리할 수도 있다. 더욱이, 위에 설명한 실시예들에서 다양한 구성들의 분리는 그러한 분리가 반드시 필요한 것으로 이해되어서는 안 되고, 설명된 프로그램 컴포넌트들 및 시스템들은 일반적으로 단일 소프트웨어 제품으로 함께 통합되거나 다수의 소프트웨어 제품으로 패키지 될 수 있음을 이해하여야 한다.

이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims

컴퓨팅 장치에서 시계열 형태의 타깃 데이터(target data)를 세그먼테이션(segmentation)하는 방법에 있어서,
상기 타깃 데이터를 구성하는 복수의 데이터 요소 간의 연관성을 분석하여 적어도 하나의 패턴을 추출하는 단계; 및
상기 추출된 패턴을 기초로 상기 타깃 데이터를 적어도 하나의 데이터 세그먼트(data segment)로 분할하는 단계를 포함하고,
상기 적어도 하나의 데이터 세그먼트로 분할하는 단계는,
기 설정된 최대 세그먼트 크기 또는 최소 세그먼트 크기에 기초하여 상기 추출된 패턴을 병합하거나 분리하는 단계; 및
상기 병합된 패턴 또는 상기 분리된 패턴에 기초하여 상기 타깃 데이터를 분할하는 단계를 포함하는,
시계열 데이터 세그먼테이션 방법.
제1 항에 있어서,
상기 적어도 하나의 패턴을 추출하는 단계는,
상기 복수의 데이터 요소 간의 연관성 정도를 가중치로 갖는 가중치 그래프를 생성하는 단계; 및
상기 가중치를 기초로 상기 가중치 그래프에서 상기 적어도 하나의 패턴을 추출하는 단계를 포함하는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제2 항에 있어서,
제1 데이터 요소와 제2 데이터 요소 간의 연관성 정도는,
상기 제1 데이터 요소와 상기 제2 데이터 요소 간의 시간적 인접성에 기초하여 결정되는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제2 항에 있어서,
제1 데이터 요소와 제2 데이터 요소 간의 연관성 정도는,
상기 타깃 데이터에서, 상기 제1 데이터 요소와 상기 제2 데이터 요소가 인접하여 출현한 빈도에 기초하여 결정되는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제2 항에 있어서,
상기 가중치 그래프는,
상기 복수의 데이터 요소 간의 시계열 순서가 반영된 방향 그래프인 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제1 항에 있어서,
상기 적어도 하나의 패턴을 추출하는 단계는,
상기 복수의 데이터 요소에 대하여, 인접한 데이터 요소 간의 증감치를 산출하는 단계; 및
상기 증감치 간의 연관성을 분석하여 상기 적어도 하나의 패턴을 추출하는 단계를 포함하는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제1 항에 있어서,
상기 타깃 데이터는 제1 변수에 관한 제1 시계열 데이터와 제2 변수에 관한 제2 시계열 데이터를 포함하고,
상기 적어도 하나의 패턴을 추출하는 단계는,
상기 제1 시계열 데이터를 구성하는 제1 데이터 요소와 상기 제2 시계열 데이터를 구성하는 제2 데이터 요소 간의 연관성을 분석하여 상기 적어도 하나의 패턴을 추출하는 단계를 포함하는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
삭제
삭제
제1 항에 있어서,
상기 타깃 데이터는 서로 다른 변수에 관한 시계열 데이터를 포함하고,
상기 추출된 패턴은 상기 서로 다른 변수 간 연관성 정도를 가리키는 가중치 정보를 포함하며,
상기 타깃 데이터를 분할하는 단계는,
제1 변수와 제2 변수 간 가중치가 임계 값 이상이라는 판정에 응답하여, 상기 제1 변수에 관한 제1 시계열 데이터와 상기 제2 변수에 관한 제2 시계열 데이터가 서로 인접하도록 상기 타깃 데이터를 재배열하는 단계; 및
상기 재배열된 타깃 데이터를 상기 적어도 하나의 데이터 세그먼트로 분할하는 단계를 포함하는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제1 항에 있어서,
상기 추출된 패턴은 상기 데이터 요소 간의 연관성 정도를 가리키는 가중치 정보를 포함하고,
상기 추출된 패턴의 가중치의 정보를 분석하여 컨볼루션 신경망(convolutional neural network) 기반 딥러닝 모델의 하이퍼파라미터(hyper-parameter) 값을 결정하는 단계를 더 포함하는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제11 항에 있어서,
상기 추출된 패턴은 시계열 순서에 따른 연관성 정도를 가리키는 제1 가중치 정보를 포함하고,
상기 하이퍼파라미터 값을 결정하는 단계는,
상기 제1 가중치가 임계 값 이상인 데이터 요소의 개수를 기초로 컨볼루션 필터의 제1 변의 길이를 결정하는 단계를 포함하는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제11 항에 있어서,
상기 타깃 데이터는 서로 다른 변수에 관한 시계열 데이터를 포함하고,
상기 추출된 패턴은 상기 서로 다른 변수에 대한 데이터 요소 간 연관성 정도를 가리키는 제1 가중치 정보를 포함하고,
상기 하이퍼파라미터 값을 결정하는 단계는,
상기 제1 가중치가 임계 값 이상인 데이터 요소의 개수를 기초로 컨볼루션 필터의 제1 변의 길이를 결정하는 단계를 포함하는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제11 항에 있어서,
상기 딥러닝 모델은 제1 컨볼루션 신경망과 제2 컨볼루션 신경망을 포함하고,
상기 하이퍼파라미터 값을 결정하는 단계는,
상기 추출된 패턴 중 제1 패턴을 기초로 상기 제1 컨볼루션 신경망의 필터 크기를 결정하는 단계; 및
상기 추출된 패턴 중 제2 패턴을 기초로 상기 제2 컨볼루션 신경망의 필터 크기를 결정하는 단계를 포함하되,
상기 제1 패턴에 매칭되는 제1 데이터 세그먼트는 상기 제1 컨볼루션 신경망으로 입력되고, 상기 제2 패턴에 매칭되는 제2 데이터 세그먼트는 상기 제2 컨볼루션 신경망으로 입력되는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제11 항에 있어서,
상기 추출된 패턴은 시계열 순서에 따른 연관성 정도를 가리키는 제1 가중치 정보를 포함하고,
상기 하이퍼파라미터 값을 결정하는 단계는,
상기 제1 가중치가 임계 값 이상인 데이터 요소의 개수를 기초로 제1 방향의 스트라이드(stride) 값을 결정하는 단계를 포함하는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제11 항에 있어서,
상기 타깃 데이터는 서로 다른 변수에 관한 시계열 데이터를 포함하고,
상기 추출된 패턴은 상기 서로 다른 변수에 대한 데이터 요소 간 연관성 정도를 가리키는 제1 가중치 정보를 포함하고,
상기 하이퍼파라미터 값을 결정하는 단계는,
상기 제1 가중치가 임계 값 이상인 데이터 요소의 개수를 기초로 제1 방향의 스트라이드 값을 결정하는 단계를 포함하는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
제11 항에 있어서,
상기 타깃 데이터는 서로 다른 변수에 관한 시계열 데이터를 포함하고,
상기 추출된 패턴은 상기 서로 다른 변수에 대한 데이터 요소 간 연관성 정도를 가리키는 제1 가중치 정보와 시계열 순서에 따른 연관성 정도를 가리키는 제2 가중치 정보를 포함하고,
상기 하이퍼파라미터 값을 결정하는 단계는,
상기 제1 가중치가 임계 값 이상인 데이터 요소의 개수를 기초로 컨볼루션 필터의 제1 변의 길이를 결정하는 단계; 및
상기 제2 가중치가 임계 값 이상인 데이터 요소의 개수를 기초로 제1 방향의 스트라이드 값을 결정하는 단계를 포함하는 것을 특징으로 하는,
시계열 데이터 세그먼테이션 방법.
하나 이상의 프로세서; 및
하나 이상의 인스트럭션들(instructions)을 저장하는 메모리를 포함하고,
상기 하나 이상의 프로세서는,
상기 저장된 하나 이상의 인스트럭션들을 실행함으로써,
시계형 형태의 타깃 데이터(target data)를 구성하는 복수의 데이터 요소 간의 연관성을 분석하여 적어도 하나의 패턴을 추출하는 동작 및
상기 추출된 패턴을 기초로 상기 타깃 데이터를 적어도 하나의 데이터 세그먼트(data segment)로 분할하는 동작을 수행하되,
상기 적어도 하나의 데이터 세그먼트로 분할하는 동작은,
기 설정된 최대 세그먼트 크기 또는 최소 세그먼트 크기에 기초하여 상기 추출된 패턴을 병합하거나 분리하는 동작 및
상기 병합된 패턴 또는 상기 분리된 패턴에 기초하여 상기 타깃 데이터를 분할하는 동작을 포함하는,
시계열 데이터 세그먼테이션 장치.
컴퓨팅 장치와 결합되어,
시계열 형태의 타깃 데이터(target data)를 구성하는 복수의 데이터 요소 간의 연관성을 분석하여 적어도 하나의 패턴을 추출하는 단계; 및
상기 추출된 패턴을 기초로 상기 타깃 데이터를 적어도 하나의 데이터 세그먼트(data segment)로 분할하는 단계를 실행시키기 위하여 컴퓨터로 판독가능한 기록매체에 저장되되,
상기 적어도 하나의 데이터 세그먼트로 분할하는 단계는,
기 설정된 최대 세그먼트 크기 또는 최소 세그먼트 크기에 기초하여 상기 추출된 패턴을 병합하거나 분리하는 단계; 및
상기 병합된 패턴 또는 상기 분리된 패턴에 기초하여 상기 타깃 데이터를 분할하는 단계를 포함하는,
컴퓨터 프로그램.