KR101672500B1

KR101672500B1 - 시공간 구조 기반의 확률 그래프 모델 학습 장치 및 방법

Info

Publication number: KR101672500B1
Application number: KR1020100078012A
Authority: KR
Inventors: 김여진; 장병탁; 배병철; 최현진; 정윤경; 최영상
Original assignee: 삼성전자주식회사; 서울대학교산학협력단
Priority date: 2010-08-12
Filing date: 2010-08-12
Publication date: 2016-11-03
Also published as: KR20120015693A; US20120041920A1; US8645307B2

Abstract

스트림 데이터에 대응되는 변수를 포함하는 제 1 매트릭스를 생성하는 제 1 매트릭스 생성부, 제 1 매트릭스의 변수들을 관심 대상이 되는 목적 변수(object variable)와 상기 목적 변수 이외의 입력 변수(input variable)로 분류하고, 입력 변수에 대한 다차원 조합(multi-order combination)을 통해 조합 변수(combination variable)를 획득하고, 획득된 조합 변수를 이용하여 제 2 매트릭스를 생성하는 제 2 매트릭스 생성부, 및 제 1 매트릭스의 목적 변수와 제 2 매트릭스의 조합 변수를 이용하여 확률 그래프 모델을 생성하는 모델 생성부를 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 장치가 제공된다.

Description

시공간 구조 기반의 확률 그래프 모델 학습 장치 및 방법{Apparatus and Method for learning probabilistic graphical model based on time-space structure}

확률 그래프 모델의 생성 및 학습 기술과 관련된다.

스마트 기기(smart device)는 다양한 서비스를 사용자에게 제공한다. 최근 스마트 기기가 제공하는 서비스의 종류가 폭발적으로 증가하게 되면서 사용자는 그때그때 상황에 따라 필요한 서비스만을 제공받고 싶어하는 욕구 역시 증가하게 되었다.

현실 세계에서의 상황 정보는 매우 불확실하다. 즉 사용자가 처한 상황에서의 가장 적합한 서비스는 확률적으로 결정되는 것이 통상적이다. 이러한 확률적인 결정은 각각의 상황 정보와 그 상황 정보에 알맞은 서비스를 모델링한 확률 그래프 모델에 의해 이루어질 수 있다.

확률 그래프 모델은 사용자가 수동으로 설계할 수도 있고 기계 학습에 의해 자동적으로 설계되도록 할 수도 있다. 수동 설계는 모델이 한 번 고정되면 자동으로 갱신을 할 수 없다는 단점이 있다. 자동 설계는 기계 학습 알고리즘에 의해 자동으로 갱신이 되기는 하지만 현실 세계의 불확실한 상황 정보를 모두 커버하기에는 한계가 있다.

또한 현실 세계의 데이터는 대부분 스트림 데이터 형태를 갖는다. 스트림 데이터는 시간에 따라 변하고 그 특성상 실시간성이 보장되어야 하기 때문에 통상적인 확률 그래프 모델을 적용하기에는 적합하지 않다.

불확실한 환경에서 다변수 시계열 데이터를 처리하기 위한 확률 그래프 모델의 학습 장치 및 방법이 제공된다.

본 발명의 일 양상에 따른 확률 그래프 모델 학습 장치는, 스트림 데이터에 대응되는 변수를 포함하는 제 1 매트릭스를 생성하는 제 1 매트릭스 생성부, 제 1 매트릭스의 변수들을 관심 대상이 되는 목적 변수(object variable)와 목적 변수 이외의 입력 변수(input variable)로 분류하고, 입력 변수에 대한 다차원 조합(multi-order combination)을 통해 조합 변수(combination variable)를 획득하고, 획득된 조합 변수를 이용하여 제 2 매트릭스를 생성하는 제 2 매트릭스 생성부, 및 제 1 매트릭스의 목적 변수와 제 2 매트릭스의 조합 변수를 이용하여 확률 그래프 모델을 생성하는 모델 생성부를 포함할 수 있다.

본 발명의 일 양상에 따른 확률 그래프 모델 학습 방법은, 스트림 데이터에 대응되는 변수를 포함하는 제 1 매트릭스를 생성하는 단계, 제 1 매트릭스의 변수들을 관심 대상이 되는 목적 변수(object variable)와 목적 변수 이외의 입력 변수(input variable)로 분류하고, 입력 변수에 대한 다차원 조합(multi-order combination)을 통해 조합 변수(combination variable)를 획득하고, 획득된 조합 변수를 이용하여 제 2 매트릭스를 생성하는 단계, 및 제 1 매트릭스의 목적 변수와 제 2 매트릭스의 조합 변수를 이용하여 확률 그래프 모델을 생성하는 단계를 포함할 수 있다.

개시된 내용에 따르면, 스트림 데이터의 종류에 따라 변수를 매트릭스의 행에 배열(공간정보획득)하고, 각 스트림 데이터의 입력 시간에 따라 변수를 매트릭스의 열에 따라 배열(시간정보획득)한 후, 그 매트릭스를 시간 및 공간 방향으로 확장해서 확률 그래프 모델을 생성하기 때문에 불확실한 환경에서의 다변수 시계열 데이터의 시공간 모델 구조를 학습할 수 있다.

도 1은 본 발명의 일 실시예에 따른 확률 그래프 모델 학습 장치의 전체적인 구성을 도시한다.
도 2는 본 발명의 일 실시예에 따른 확률 그래프 모델 학습 장치의 세부적이 구성을 도시한다.
도 3은 본 발명의 일 실시예에 따른 제 1 매트릭스를 도시한다.
도 4는 본 발명의 일 실시예에 따른 제 2 매트릭스를 도시한다.
도 5는 본 발명의 일 실시예에 따른 확률 그래프 모델을 도시한다.
도 6은 본 발명의 일 실시예에 따른 확률 그래프 모델 학습 방법을 도시한다.

이하, 첨부된 도면을 참조하여 본 발명의 실시를 위한 구체적인 예를 상세히 설명한다.

도 1은 본 발명의 일 실시예에 따른 확률 그래프 모델 학습 장치의 전체적인 구성을 도시한다.

도 1을 참조하면, 본 실시예에 따른 확률 그래프 모델 학습 장치(100)는 확률 그래프 모델(101)을 이용하여 수신된 스트림 데이터에 적합한 어떤 추론 결과를 생성한다. 예를 들어, 확률 그래프 모델 학습 장치(100)가 다양한 어플리케이션을 구동하는 스마트 폰에 적용되는 경우, 스트림 데이터는 스마트 폰과 관련된 각종 문맥 정보(또는 상황 정보)(context information)(예컨대, 시간, 위치, 온도, 속도, 스케줄러, 이메일 등)가 될 수 있고, 추론 결과는 확률 그래프 모델(101)을 이용하여 도출된 현재 상황에 가장 적합한 어플리케이션이 될 수 있다.

또한, 확률 그래프 모델 학습 장치(100)는 스마트 폰 사용자들을 위한 Intelligent User Interface(IUI)에 적용될 수 도 있다. IUI는 사용자의 과거 및 현재 상황을 인지하고, 상황에 맞는 서비스 또는 어플리케이션을 예측하여 사용자에게 제시한다. 사용자가 수많은 어플리케이션 가운데 현재 필요한 어플리케이션에 바로 접근할 수 있도록 IUI가 예측된 어플리케이션의 아이콘들을 전면으로 배치하여 제공할 수 있다.

그러나 이것은 설명의 편의를 위한 예시에 불과한 것으로, 이 밖에도 본 실시예에 따른 확률 그래프 모델 학습 장치(100)는 유전자 발현 메커니즘을 밝혀 새로운 지식을 발굴하기 위한 바이오 시스템, 환자의 행동 패턴에 따라 적절한 치료 방법을 제시하는 헬스케어 시스템, 또는 사용자의 행동 패턴에 따라 적절한 교육 방법을 제시하는 교육 시스템 등 다양한 변수들의 시공간적 패턴 변화에 따라 특정한 추론 결과가 필요한 분야에 다양하게 적용될 수 있음은 물론이다.

스트림 데이터는 시간에 따라 변화하고 그 종류도 매우 다양하다. 다시 말해, 스트림 데이터는 다변수 시계열 데이터(multivariate time-series data)로 표현할 수 있는데, 본 실시예에 따른 확률 그래프 모델 학습 장치(100)는 불확실한 환경에서의 다변수 시계열 데이터를 처리하고 적절한 추론 결과를 도출할 수 있는 확률 그래프 모델(101)을 생성 또는 갱신할 수 있다.

도 2는 본 발명의 일 실시예에 따른 확률 그래프 모델 학습 장치의 세부적인 구성을 도시한다.

도 2를 참조하면, 확률 그래프 모델 학습 장치(200)는 제 1 매트릭스 생성부(201), 제 2 매트릭스 생성부(202), 모델 생성부(203), 모델 갱신부(204), 저장부(205), 및 추론부(206)를 포함할 수 있다.

제 1 매트릭스 생성부(201)는 제 1 매트릭스를 생성한다. 제 1 매트릭스는 다수의 변수(variable)를 포함한다. 각각의 변수는 스트림 데이터에 대응된다. 스트림 데이터는 시간에 따라 획득되는 데이터이므로, 스트림 데이터가 할당되는 각각의 변수는 시간 속성과 공간 속성을 갖는 것으로 볼 수 있다. 시간 속성은 스트림 데이터가 언제 측정되었는가 또는 언제 입력되었는가를 나타낼 수 있고, 공간 속성은 그 스트림 데이터가 어떤 종류의 스트림 데이터인가를 나타낼 수 있다. 예를 들어, 제 1 매트릭스 생성부(201)는 스트림 데이터의 종류에 대응되는 행(row)과 스트림 데이터의 입력 시간에 대응되는 열(column)을 갖는 2차원 구조에 변수를 배열함으로써 제 1 매트릭스를 생성하는 것이 가능하다. 물론, 스트림 데이터의 종류가 열에 대응되고 스트림 데이터의 입력 시간이 행에 대응될 수도 있다.

제 2 매트릭스 생성부(202)는 제 1 매트릭스의 각 변수들을 조합함으로써 제 1 매트릭스로부터 확장된 제 2 매트릭스를 생성한다. 제 2 매트릭스 생성부(202)는, 도시된 바와 같이, 분류부(210), 입력 변수 선택부(220), 조합 변수 획득부(230), 및 매트릭스 확장부(240)를 포함할 수 있다.

분류부(210)는 제 1 매트릭스의 각 변수들을 목적 변수(object variable)와 입력 변수(input variable)로 분류한다. 목적 변수는 관심 대상이 되는 변수로써, 확률 그래프 모델을 통한 추론 결과에 대응된다. 입력 변수는 이러한 목적 변수를 제외한 나머지 변수로써, 확률 그래프 모델에 대한 입력 데이터에 대응된다. 예를 들어, 제 1 매트릭스가 스마트 폰에서 주기적으로 측정된 스마트 폰의 위치, 그때의 온도, 및 그때의 구동 중이었던 어플리케이션의 식별자를 포함한다고 가정하자. 이러한 경우, 어플리케이션의 식별자를 목적 변수로 분류하고, 위치 및 온도를 입력 변수로 분류하는 것이 가능하다.

제 1 매트릭스의 각 변수들 중에서 어떤 것을 목적 변수로 분류하고 어떤 것을 입력 변수로 분류할지는 본 발명의 사용목적 및 응용예에 따라 다양하게 설정될 수 있다. 만약, 어플리케이션의 식별자를 목적 변수로 보고, 위치 및 온도를 입력 변수로 보는 경우, 확률 그래프 모델을 이용하여 현재의 위치 및 온도에서 가장 적합한 어플리케이션을 추론할 수 있다.

입력 변수 선택부(220)는 제 1 매트릭스의 행과 열을 따라 입력 변수 중에서 제 2 매트릭스 생성에 사용될 입력 변수들을 선택한다. 예컨대, 입력 변수 선택부(220)는 제 1 매트릭스에서 행 방향 및 종 방향 모두에 걸쳐서 입력 변수를 선택할 수 있다. 여기서, 행 방향 및 종 방향 모두에 걸쳐서 입력 변수를 선택한다 함은 어느 하나의 행을 고정한 상태로 열 방향을 따라 입력 변수를 선택하거나, 또는 어느 하나의 열을 고정한 상태로 행 방향을 따라 입력 변수를 선택하지 아니하는 것을 말한다.

일 예로써, 입력 변수 선택부(220)는 각각의 행에서 임의의 개수의 입력 변수를 선택할 수 있다. 다시 말해, 일정한 시간 간격으로 수집된 제 1 스트림 데이터에 대응되는 제 1 행에서 3개의 열에 해당하는 입력 변수를 선택하고, 일정한 시간 간격으로 수집된 제 2 스트림 데이터에 대응되는 제 2 행에서 4개의 열에 해당하는 입력 변수를 선택하는 것이 가능하다.

다른 예로써, 입력 변수 선택부(220)는 각각의 행에서 n개의 입력 변수를 선택하는 것도 가능하다. 다시 말해, 일정한 시간 간격으로 수집된 제 1 스트림 데이터에 대응되는 제 1 행에서 3개의 열에 해당하는 입력 변수를 선택하고, 일정한 시간 간격으로 수집된 제 2 스트림 데이터에 대응되는 제 2 행에서도 역시 3개의 열에 해당하는 입력 변수를 선택하는 것이 가능하다.

그 밖에도 입력 변수 선택부(220)가 제 1 매트릭스의 입력 변수 중에서 어떠한 입력 변수들을 선택하는지는 본 발명의 사용목적 및 응용예에 따라 다양하게 설정될 수 있음은 물론이다.

조합 변수 획득부(230)는 입력 변수 선택부(220)가 선택한 입력 변수들을 다차원 조합해서 제 2 매트릭스의 구성요소가 되는 조합 변수(combination variable)들을 생성한다. 여기서 선택된 입력 변수에서 하나를 선택하는 조합을 1차원 조합이라고 하고, 선택된 입력 변수에서 두 개를 선택하는 조합을 2차원 조합이라고 할 때, 다차원 조합이란 이와 같이 조합의 차원을 하나씩 높여가면서 새로운 변수 집합을 생성하는 것을 의미할 수 있다. 예를 들어, 조합 변수 획득부(230)가 2차원 조합을 통해 조합 변수들을 생성하는 경우, 입력 변수 선택부(220)가 선택한 입력 변수 전체에서 하나씩을 선택해서 1차원 조합 변수들을 생성하고, 다시 입력 변수 선택부(220)가 선택한 입력 변수 전체에서 두 개씩을 선택해서 2차원 조합 변수들을 생성하는 것이 가능하다. 이 때 조합의 차수는 마르코브 연쇄 차수(Markov chain order)에 기초하여 정해질 수 있으며 1 이상의 값을 가질 수 있다.

매트릭스 확장부(240)는 조합 변수 획득부(230)가 생성한 조합 변수들을 이용해서 제 2 매트릭스를 생성한다. 결과적으로, 제 2 매트릭스는 제 1 매트릭스의 확장 버전이 될 수 있다. 따라서 제 2 매트릭스는 제 1 매트릭스에서 제시된 입력 변수들 사이에 가능한 관계를 조합하여 확장시킨 변수들의 매트릭스가 될 수 있다.

모델 생성부(203)는 제 1 매트릭스의 목적 변수와 제 2 매트릭스의 조합 변수를 이용하여 확률 그래프 모델을 생성한다. 확률 그래프 모델과 관련하여, 제 2 매트릭스의 조합 변수는 확률 그래프 모델의 입력 데이터에 대응되고 제 1 매트릭스의 목적 변수는 확률 그래프 모델의 추론 결과에 대응될 수 있다. 모델 생성부(203)는, 도시된 바와 같이, 노드 결정부(250) 및 구조 결정부(260)를 포함할 수 있다.

노드 결정부(250)는 제 1 매트릭스의 목적 변수와 제 2 매트릭스의 조합 변수들의 관계를 결정한다. 변수들 간의 관계는 조건부 확률 테이블로 주어질 수 있으며, 노드 결정부(250)는 각 변수들의 조건부 확률 테이블을 산출할 수 있다.

구조 결정부(260)는 확률 그래프 모델의 전체적인 구조를 결정한다. 예를 들어, 구조 결정부(260)는 각각의 조건부 확률 테이블에서 정해진 임계값 이하의 확률값을 갖는 부분을 삭제하여 변수 간의 링크 구조를 결정하는 것이 가능하다.

또한, 본 발명의 일 실시예에 따라, 조건부 확률 테이블의 계산 및 링크 제거에 있어서 maximum likelihood estimation 또는 Bayesian estimation 알고리즘이 적용될 수도 있다.

모델 갱신부(204)는 생성된 확률 그래프 모델을 저장부(205)에 저장한다. 또한, 모델 갱신부(204)는 저장부(205)에 기 저장되어 있던 확률 그래프 모델을 갱신할 수도 있다.

추론부(206)는 저장부(205)에 저장되어 있는 확률 그래프 모델을 이용하여 현재의 스트림 데이터에 대한 추론 결과를 도출한다. 예컨대, 추론부(206)는 문맥 정보 또는 정황 정보로써 스트림 데이터를 수신하고, 수신된 스트림 데이터를 확률 그래프 모델에 적용해서 현재의 문맥 또는 현재의 정황에 가장 적합한 목적 변수를 추론하는 것이 가능하다.

이와 같이, 본 실시예에 따른 확률 그래프 모델 학습 장치(200)는, 스트림 데이터의 종류에 따라 변수를 매트릭스의 행에 배열(공간정보획득)하고, 각 스트림 데이터의 입력 시간에 따라 변수를 매트릭스의 열에 따라 배열(시간정보획득)한 후, 그 매트릭스를 시간 및 공간 방향으로 조합해서 확률 그래프 모델을 생성하기 때문에 불확실한 환경에서의 다변수 시계열 데이터에 내재되어 있는 패턴의 구조를 적절하게 발굴하고 복잡한 시공간 구조를 갖는 데이터로부터 특정한 변수의 값을 추론하는 것이 가능하다.

도 3은 본 발명의 일 실시예에 따른 제 1 매트릭스를 도시한다.

도 2 및 도 3을 참조하면, 제 1 매트릭스 생성부(201)는 각각의 스트림 데이터(301)를 입력된 시간(302)에 따라 변수에 매핑해서 제 1 매트릭스(303)를 생성한다.

제 1 매트릭스(303)는 두 개의 축을 갖는다.

제 1 매트릭스(303)의 하나의 축은 매트릭스의 각 행에 대응되는 것으로 공간 축(310)이라 부를 수 있다. 예를 들어, 각각의 스트림 데이터는 제 1 매트릭스(303) 안에서 그 종류 별로 공간 축(310)을 따라 배치될 수 있다. 스트림 데이터의 종류는 그 스트림 데이터를 수집 또는 검출한 센서의 종류에 따라 어플리케이션에 관한 스트림 데이터(330), 위치에 관한 스트림 데이터(340), 온도(또는 날씨)에 관한 스트림 데이터(350), 행위(또는 동작)에 관한 스트림 데이터(360), 및 감정에 관한 스트림 데이터(370) 등이 있을 수 있다. 참고로, 동작에 관한 스트림 데이터(360)에는 가속 센서의 센싱 정보가 포함될 수 있으며, 감정에 관한 스트림 데이터(370)에는 카메라로부터 얻어진 얼굴 표정 정보 등이 포함될 수도 있다.

제 1 매트릭스(303)의 다른 하나의 축은 매트릭스의 각 열에 대응되는 것으로 시간 축(320)이라 부를 수 있다. 다시 말해, 제 1 매트릭스(303)에서 공간 축(310)은 각 스트림 데이터의 종류를 나타내고, 시간 축(320)은 각 스트림 데이터의 입력 시간을 나타낼 수 있다. 예를 들어, 변수 #1(304)은 t에서의 온도 데이터가 될 수 있고, 변수 #2(305)는 t-1에서의 온도 데이터가 될 수 있다. 즉 같은 종류의 스트림 데이터라도 시간에 따라 그 값이 변할 수 있음을 알 수 있다. 마찬가지로, 같은 시간 t에서 변수 #1(304)은 온도 데이터가 될 수 있고 변수 #3(306)은 위치 데이터가 될 수 있다.

도 4는 본 발명의 일 실시예에 따른 제 2 매트릭스를 도시한다.

도 2 내지 도 4를 참조하면, 제 2 매트릭스 생성부(202)는 제 1 매트릭스(303)에서 목적 변수(401)와 입력 변수(402)를 분류한다. 목적 변수(401)는 사용자의 관심 대상이 되는 변수로 확률 그래프 모델에서의 추론 결과에 대응되고 입력 변수(402)는 추론 결과를 도출하기 위한 상황 정보 또는 확률 그래프 모델에 입력되는 입력 데이터에 대응된다. 분류 기준은 본 발명의 사용 목적 및 응용예에 따라 다양하게 설정할 수 있는데, 여기서는 어플리케이션에 관한 스트림 데이터(330)의 종류를 목적 변수(401)로 할당하고 나머지 위치(340), 온도(350), 행위(360), 감정(370)에 관한 스트림 데이터의 종류 및 시간에 대응하는 변수들이 입력 변수(402)가 되는 것을 예시하였다.

제 1 매트릭스(303)가 목적 변수(401) 및 입력 변수(402)로 분류되면, 제 2 매트릭스 생성부(202)는 제 1 매트릭스(303)의 입력 변수(402) 중 일부(402-1 또는 402-2)를 선택한다. 선택 기준 역시 본 발명의 사용 목적 및 응용예에 따라 다양하게 설정될 수 있으나, 여기서는 주어진 마르코브 연쇄 차수(Markov chain order)만큼 제 1 매트릭스(303)의 시간 축(320)을 잘라서 변수를 선택하는 경우를 설명한다.

마르코브 연쇄 차수란 어떤 변수가 관측될 확률이 부모 변수들의 관측 값에 의해 영향을 받을 때 그 부모 세대의 수를 의미한다. 예컨대, 어떤 변수가 N번째 세대의 부모 변수들의 관측 값에 영향을 받을 때 이 N 값이 마르코브 연쇄 차수가 된다. 마르코브 연쇄 차수가 3으로 주어지는 경우, 일 예로써, 제 2 매트릭스 생성부(202)는 제 1 매트릭스(303)에서 t부터 t-2까지의 열(402-1)의 변수들을 선택하는 것이 가능하다. 그러나 이것은 설명의 편의를 위한 하나의 예로써 시간 축 및 공간 축 방향으로 임의의 변수가 선택될 수도 있다.

입력 변수 중 일부가 선택되면, 제 2 매트릭스 생성부(202)는 선택된 변수들(402-1)을 다차원 조합해서 제 2 매트릭스(403)를 생성한다. 일 예로써, 마르코브 연쇄 차수가 3으로 주어지는 경우, 제 2 매트릭스 생성부(202)는 3차원 조합 변수들까지 생성하는 것이 가능하다. 예컨대, 1차원 조합 변수들(404)은 선택된 입력 변수들(402-1)에서 하나를 선택하는 조합을 통해 12개(₁₂C₁=12)가 생성될 수 있다. 2차원 조합 변수들(405)는 선택된 입력 변수들(402-1)에서 두 개를 선택하는 조합을 통해 66개(₁₂C₂=66)가 생성될 수 있다. 또한 3차원 조합 변수들(406)은 선택된 입력 변수들(402-1)에서 세 개를 선택하는 조합을 통해 220개(₁₂C₃=220)가 생성될 수 있다.

도 5는 본 발명의 일 실시예에 따른 확률 그래프 모델을 도시한다.

도 2 내지 도 5를 참조하면, 모델 생성부(203)는 제 2 매트릭스의 조합 변수(501) 및 제 1 매트릭스의 목적 변수(502)에 기초하여 확률 그래프 모델(500)을 생성한다. 예를 들어, 모델 생성부(203)는 각 노드의 조건부 확률 테이블을 구해서 제 2 매트릭스의 조합 변수(501)와 제 1 매트릭스의 목적 변수(502) 간의 관계를 결정하고, 관계가 적은 노드 간 링크를 제거해서 제 2 매트릭스의 조합 변수(501)와 제 1 매트릭스의 목적 변수(502) 간의 링크 구조를 결정하는 것이 가능하다. 각 노드의 조건부 확률 테이블을 구하는 방법, 각 노드 간의 관계를 구하는 방법, 및 의미 없는 링크를 제거하는 방법 등은 maximum likelihood estimation 또는 Bayesian estimation 알고리즘을 통해 구현되는 것도 가능하다.

도 6은 본 발명의 일 실시예에 따른 확률 그래프 모델 학습 방법을 도시한다.

도 2 및 도 6을 참조하면, 본 실시예에 따라, 먼저 스트림 데이터에 대응되는 변수를 포함하는 제 1 매트릭스가 생성된다(601). 예컨대, 제 1 매트릭스 생성부(201)가 도 3과 같은 매트릭스를 생성하는 것이 가능하다.

제 1 매트릭스가 생성되면, 제 1 매트릭스를 기초로 제 2 매트릭스가 생성된다(602). 제 2 매트릭스는 제 1 매트릭스를 시간 축 및 공간 축으로 조합하여 확장한 확장 버전이 될 수 있다. 예컨대, 제 2 매트릭스 생성부(202)가 도 4와 같이 매트릭스를 확장하는 것이 가능하다.

제 2 매트릭스가 생성되면, 확률 그래프 모델이 생성된다(603). 예컨대, 모델 생성부(203)가 도 5와 같이 제 2 매트릭스의 조합 변수 및 제 1 매트릭스의 목적 변수를 이용해서 확률 그래프 모델을 생성하는 것이 가능하다.

또한, 본 발명의 일 실시예에 따라, 만들어진 확률 그래프 모델은 불확실한 환경에서 유의미한 추론 결과를 도출하기 위해 사용될 수 있다. 예를 들어, 생성된 확률 그래프 모델을 통해 현재 상황에 가장 적합한 어플리케이션 또는 서비스를 추론하는 것이 가능하다. 또한 확률 그래프 모델의 생성이 주기적으로 이루어짐에 따라 이전에 만들어진 확률 그래프 모델을 갱신하는 것도 가능하다.

이상에서 살펴본 것과 같이, 본 실시예에 따른 장치 및 방법은, 변수들을 공간 속성 및 시간 속성을 모두 고려해서 모델을 만들기 때문에 다양한 변수가 시간에 따라 변화하는 불확실한 환경에서도 적절하게 적용될 수 있는 확률 그래프 모델을 구축하는 것이 가능하다.

한편, 본 발명의 실시 예들은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.

컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현하는 것을 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술 분야의 프로그래머들에 의하여 용이하게 추론될 수 있다.

나아가 전술한 실시 예들은 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 권리범위가 특정 실시 예에 한정되지 아니할 것이다.

Claims

스트림 데이터에 대응되는 변수를 포함하는 제 1 매트릭스를 생성하는 제 1 매트릭스 생성부;
상기 제 1 매트릭스의 변수들을 관심 대상이 되는 목적 변수(object variable)와 상기 목적 변수 이외의 입력 변수(input variable)로 분류하고, 상기 입력 변수에 대한 다차원 조합(multi-order combination)을 통해 조합 변수(combination variable)를 획득하고, 획득된 조합 변수를 이용하여 제 2 매트릭스를 생성하는 제 2 매트릭스 생성부; 및
상기 제 1 매트릭스의 목적 변수와 상기 제 2 매트릭스의 조합 변수를 이용하여 확률 그래프 모델을 생성하는 모델 생성부; 를 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 장치.
제 1 항에 있어서, 상기 제 1 매트릭스 생성부는
상기 스트림 데이터의 종류에 대응되는 행(row)과 상기 스트림 데이터의 입력 시간에 대응되는 열(column)을 갖는 2차원 구조에 상기 변수를 배열하는 시공간 구조 기반의 확률 그래프 모델 학습 장치.
제 2 항에 있어서, 상기 제 2 매트릭스 생성부는
상기 제 1 매트릭스의 변수들을 상기 목적 변수와 상기 입력 변수로 분류하는 분류부;
상기 행 및 상기 열에 따라 상기 입력 변수 중에서 일부를 선택하는 입력 변수 선택부;
상기 선택된 입력 변수를 n번 조합해서 제 1 차원 내지 제 n 차원 조합 변수들을 획득하는 조합 변수 획득부; 및
상기 획득된 조합 변수들을 포함하는 상기 제 2 매트릭스를 생성하는 매트릭스 확장부; 를 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 장치.
제 3 항에 있어서, 상기 입력 변수 선택부는
각각의 행에서 임의의 개수의 입력 변수를 선택하는 시공간 구조 기반의 확률 그래프 모델 학습 장치.
제 3 항에 있어서, 상기 입력 변수 선택부는
각각의 행에서 n개의 입력 변수를 선택하는 시공간 구조 기반의 확률 그래프 모델 학습 장치.
제 5 항에 있어서, 상기 n 값은
마르코브 연쇄 차수(Markov chain order)에 기초하여 정해지는 시공간 구조 기반의 확률 그래프 모델 학습 장치.
제 1 항에 있어서, 상기 모델 생성부는
상기 제 1 매트릭스의 목적 변수와 상기 제 2 매트릭스의 조합 변수들의 조건부 확률 테이블에 기초하여 상기 확률 그래프 모델의 각 노드 간의 관계를 결정하는 노드 결정부; 및
정해진 임계값 이하의 확률값을 갖는 조건부 확률 테이블의 엔트리를 삭제하여 상기 확률 그래프 모델의 구조를 결정하는 구조 결정부; 를 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 장치.
제 1 항에 있어서,
상기 생성된 확률 그래프 모델을 저장하거나, 또는 상기 생성된 확률 그래프 모델을 이용하여 기 저장된 확률 그래프 모델을 갱신하는 모델 갱신부; 를 더 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 장치.
제 1 항에 있어서,
상기 생성된 확률 그래프 모델을 이용하여 현재 상황에 적합한 목적 변수를 추론하는 추론부; 를 더 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 장치.
스트림 데이터에 대응되는 변수를 포함하는 제 1 매트릭스를 생성하는 단계;
상기 제 1 매트릭스의 변수들을 관심 대상이 되는 목적 변수(object variable)와 상기 목적 변수 이외의 입력 변수(input variable)로 분류하고, 상기 입력 변수에 대한 다차원 조합(multi-order combination)을 통해 조합 변수(combination variable)를 획득하고, 획득된 조합 변수를 이용하여 제 2 매트릭스를 생성하는 단계; 및
상기 제 1 매트릭스의 목적 변수와 상기 제 2 매트릭스의 조합 변수를 이용하여 확률 그래프 모델을 생성하는 단계; 를 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 방법.
제 10 항에 있어서, 상기 제 1 매트릭스를 생성하는 단계는
상기 스트림 데이터의 종류에 대응되는 행(row)과 상기 스트림 데이터의 입력 시간에 대응되는 열(column)을 갖는 2차원 구조에 상기 변수를 배열하는 과정을 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 방법.
제 11 항에 있어서, 상기 제 2 매트릭스를 생성하는 단계는
상기 제 1 매트릭스의 변수들을 상기 목적 변수와 상기 입력 변수로 분류하는 과정;
상기 행 및 상기 열에 따라 상기 입력 변수 중에서 일부를 선택하는 과정;
상기 선택된 입력 변수를 n번 조합해서 제 1 차원 내지 제 n 차원 조합 변수들을 획득하는 과정; 및
상기 획득된 조합 변수들을 포함하는 상기 제 2 매트릭스를 생성하는 과정; 을 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 방법.
제 12 항에 있어서, 상기 입력 변수 중 일부를 선택하는 과정은
각각의 행에서 임의의 개수의 입력 변수를 선택하는 시공간 구조 기반의 확률 그래프 모델 학습 방법.
제 12 항에 있어서, 상기 입력 변수 중 일부를 선택하는 과정은
각각의 행에서 n개의 입력 변수를 선택하는 시공간 구조 기반의 확률 그래프 모델 학습 방법.
제 14 항에 있어서, 상기 n 값은
마르코브 연쇄 차수(Markov chain order)에 기초하여 정해지는 시공간 구조 기반의 확률 그래프 모델 학습 방법.
제 10 항에 있어서, 상기 모델을 생성하는 단계는
상기 제 1 매트릭스의 목적 변수와 상기 제 2 매트릭스의 조합 변수들의 조건부 확률 테이블에 기초하여 상기 확률 그래프 모델의 각 노드 간의 관계를 결정하는 과정; 및
정해진 임계값 이하의 확률값을 갖는 조건부 확률 테이블의 엔트리를 삭제하여 상기 확률 그래프 모델의 구조를 결정하는 과정; 을 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 방법.
제 10 항에 있어서,
상기 생성된 확률 그래프 모델을 저장하거나, 또는 상기 생성된 확률 그래프 모델을 이용하여 기 저장된 확률 그래프 모델을 갱신하는 단계; 를 더 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 방법.
제 10 항에 있어서,
상기 생성된 확률 그래프 모델을 이용하여 현재 상황에 적합한 목적 변수를 추론하는 단계; 를 더 포함하는 시공간 구조 기반의 확률 그래프 모델 학습 방법.