KR20120072951A

KR20120072951A - 변수 조합을 이용한 확률 그래프 모델 생성 장치 및 변수 조합 결정 방법

Info

Publication number: KR20120072951A
Application number: KR1020100134893A
Authority: KR
Inventors: 김여진
Original assignee: 삼성전자주식회사
Priority date: 2010-12-24
Filing date: 2010-12-24
Publication date: 2012-07-04
Also published as: US20120166368A1

Abstract

변수 조합을 이용하여 확률 그래프 모델을 생성하는 경우 정보량이 적은 변수 조합이 생성되지 않도록 함으로써 계산 복잡도를 줄이는 확률 그래프 모델 생성 장치 및 방법이 제공된다. 본 발명의 일 양상에 따른 확률 그래프 모델 생성 장치는 상황 정보에 대응되는 다수의 입력 변수 및 추론 결과에 대응되는 출력 변수를 포함하는 독립 변수를 획득하는 독립 변수 획득부, 각각의 입력 변수의 조합에 의해 생성되는 각각의 변수 조합의 출력 변수에 대한 정보량에 따라 생성될 변수 조합을 결정하는 변수 조합 결정부를 포함할 수 있다.

Description

변수 조합을 이용한 확률 그래프 모델 생성 장치 및 변수 조합 결정 방법{Apparatus for generating probability graph model using variable combination and method for combination of variable}

확률 그래프 모델의 생성 및 학습 기술과 관련된다.

스마트 기기(smart device)는 다양한 서비스를 사용자에게 제공한다. 최근 스마트 기기가 제공하는 서비스의 종류가 폭발적으로 증가하게 되면서 사용자는 그때그때 상황에 따라 필요한 서비스만을 제공받고 싶어하는 욕구 역시 증가하게 되었다.

현실 세계에서의 상황 정보는 매우 불확실하다. 즉 사용자가 처한 상황에서의 가장 적합한 서비스는 확률적으로 결정되는 것이 통상적이다. 이러한 확률적인 결정은 각각의 상황 정보와 그 상황 정보에 알맞은 서비스를 모델링한 확률 그래프 모델에 의해 이루어질 수 있다.

확률 그래프 모델은 사용자가 수동으로 설계할 수도 있고 기계 학습에 의해 자동적으로 설계되도록 할 수도 있다. 수동 설계는 모델이 한 번 고정되면 자동으로 갱신을 할 수 없다는 단점이 있다. 자동 설계는 기계 학습 알고리즘에 의해 자동으로 갱신이 되기는 하지만 현실 세계의 불확실한 상황 정보를 모두 커버하기에는 한계가 있다.

또한 현실 세계의 데이터는 대부분 스트림 데이터 형태를 갖는다. 스트림 데이터는 시간에 따라 변하고 그 특성상 실시간성이 보장되어야 하기 때문에 통상적인 확률 그래프 모델을 적용하기에는 적합하지 않다.

변수 조합을 이용하여 확률 그래프 모델을 생성하는 경우 정보량이 적은 변수 조합이 생성되지 않도록 함으로써 계산 복잡도를 줄이는 확률 그래프 모델 생성 장치 및 변수 방법이 제공된다.

본 발명의 일 양상에 따른 장치는, 상황 정보에 대응되는 다수의 입력 변수 및 추론 결과에 대응되는 출력 변수를 포함하는 독립 변수를 수신하고, 수신된 독립 변수의 스트림 데이터를 포함하는 제 1 매트릭스를 생성하는 제 1 매트릭스 생성부, 각각의 입력 변수의 조합에 의해 생성되는 각각의 변수 조합의 출력 변수에 대한 정보량에 따라 생성될 변수 조합을 결정하는 조합 결정부, 조합 결정부에 의해 생성이 결정된 변수 조합에 포함된 제 1 변수들의 스트림 데이터를 선택적으로 조합하여 제 2 매트릭스를 생성하는 제 2 매트릭스 생성부, 및 제 2 매트릭스를 이용하여 확률 그래프 모델을 생성하는 그래프 생성부를 포함할 수 있다.

본 발명의 일 양상에 따른 방법은, 상황 정보에 대응되는 다수의 입력 변수 및 추론 결과에 대응되는 출력 변수를 포함하는 독립 변수를 수신하고, 수신된 독립 변수의 스트림 데이터를 포함하는 제 1 매트릭스를 생성하는 단계, 각각의 입력 변수의 조합에 의해 생성되는 각각의 변수 조합의 출력 변수에 대한 정보량에 따라 생성될 변수 조합을 결정하는 단계, 조합 결정부에 의해 생성이 결정된 변수 조합에 포함된 제 1 변수들의 스트림 데이터를 선택적으로 조합하여 제 2 매트릭스를 생성하는 단계, 및 제 2 매트릭스를 이용하여 확률 그래프 모델을 생성하는 단계를 포함할 수 있다.

본 발명의 일 양상에 따라 정보량은 엔트로피 또는 확률분포그래프의 피크 위치에 기초하여 정의될 수 있다.

개시된 내용에 따르면, 정보량에 따라 확률 그래프 모델 생성에 사용될 변수 조합의 생성 여부가 결정되기 때문에 확률 그래프 모델 생성에 따른 연산량을 줄일 수가 있다.

도 1은 본 발명의 일 실시예에 따른 추론 장치를 도시한다.
도 2는 본 발명의 일 실시예에 따른 변수를 도시한다.
도 3은 본 발명의 일 실시예에 따른 확률 그래프 모델 생성 장치를 도시한다.
도 4는 본 발명의 일 실시예에 따른 조합 결정부를 도시한다.
도 5a 및 도 5b는 본 발명의 일 실시예에 따른 정보량 추정 방법을 도시한다.
도 6a 내지 도 6d는 본 발명의 다른 실시예에 따른 정보량 추정 방법을 도시한다.
도 7은 본 발명의 일 실시예에 따른 확률 그래프 모델 생성을 위한 변수 조합 결정 방법을 도시한다.

이하, 첨부된 도면을 참조하여 본 발명의 실시를 위한 구체적인 예를 상세히 설명한다.

도 1은 본 발명의 일 실시예에 따른 추론 장치를 도시한다.

도 1을 참조하면, 추론 장치(100)는 확률 그래프 모델을 이용하여 어떠한 상황에 적합한 추론을 도출한다. 확률 그래프 모델은 상황 정보 및 추론 결과간의 확률적 연관 관계를 그래프로 표현한 추론 모델이 될 수 있다.

추론 장치(100)는 다양한 애플리케이션을 실행하는 스마트폰에 적용될 수 있다. 추론 장치(100)가 스마트폰에 적용된 경우, 상황 정보는 스마트폰의 사용 시간 및 사용 위치와 같은 문맥 정보가 될 수 있고, 추론 결과는 그 시간 및 위치에서의 추천 애플리케이션이 될 수 있다. 이 밖에도 추론 장치(100)는 유전자 발현 메커니즘을 탐색하기 위한 바이오 시스템, 환자의 행동 패턴에 따라 적절한 치료 방법을 제시하는 헬스케어 시스템, 또는 사용자의 행동 패턴에 따라 적절한 교육 방법을 제시하는 교육 시스템 등 각각의 상황 정보에 따라 특정한 추론 결과가 필요한 분야에 다양하게 적용될 수 있다.

추론 장치(100)는 확률 그래프 모델을 생성한다. 확률 그래프 모델은 상황 정보 및 추론 결과에 대응되는 변수들에 기초하여 생성될 수 있다. 예컨대, 추론 장치(100)는 확률 그래프의 노드에 각 변수들을 매핑하고 노드간 링크에 변수들의 확률적 연관 관계를 매핑하여 확률 그래프 모델을 생성할 수 있다.

도 2는 본 발명의 일 실시예에 따른 변수들을 도시한다.

도 2를 참조하면, 변수(200)는 입력 변수(201)와 출력 변수(202)를 포함한다. 각 변수들(200)은 독립 변수가 될 수 있다. 입력 변수(201)는 상황 정보에 대응된다. 출력 변수(202)는 추론 결과에 대응된다. 예컨대, 입력 변수(201)는 시간 변수 A, 위치 변수 B, 온도 변수 C, 속도 변수 D, 및 밝기 변수 E를 포함할 수 있고, 출력 변수(202)는 애플리케이션 변수 X를 포함할 수 있다.

도 1 및 도 2에서, 추론 장치(100)는 입력 변수(201) 및 출력 변수(202)의 스트림 데이터(203)를 수신한다. 추론 장치(100)는 각종 센서의 관측값을 수신할 수 있다. 이러한 센서는 시간, 위치, 온도, 속도, 밝기, 근접도 등을 측정하는 하드웨어 센서와 스케줄, 이메일, 메시지, 전화통화, 인터넷 뉴스, 소셜 네트워크 정보 등을 측정하는 소프트웨어 센서를 모두 포함할 수 있다. 예를 들어, 추론 장치(100)는 소프트웨어 센서의 측정값을 이용하여 어떤 시스템에서 실행되는 애플리케이션의 종류를 측정할 수 있고, 또한 하드웨어 센서의 측정값을 이용하여 그 애플리케이션이 실행되고 있을 때의 애플리케이션 실행 시스템과 관련된 시간, 위치, 온도, 속도, 밝기, 및 사용자와 시스템간의 근접도 등을 일정한 시간 간격으로 측정 및 저장할 수 있다.

추론 장치(100)는 변수(200)의 스트림 데이터(203)들간의 확률 관계를 추정하고 추정된 확률 관계에 따라 확률 그래프 모델을 생성한다. 예컨대, 입력 변수(201)의 스트림 데이터들을 그래프의 입력 노드에 매핑하고, 출력 변수(202)의 스트림 데이터들을 그래프의 출력 노드에 매핑한 후, 입력 노드와 출력 노드간의 확률적 연관 관계에 따라 노드간 링크의 생성 여부를 결정함으로써 확률 그래프 모델을 생성할 수 있다.

추론 장치(100)는 변수 조합을 이용하여 확률 그래프 모델을 생성할 수도 있다. 예컨대, 추론 장치(100)는 변수(200)의 스트림 데이터(203) 중에서 입력 변수(201)의 스트림 데이터들을 조합하여 변수 조합을 만들고, 만들어진 변수 조합을 그래프의 입력 노드에 매핑하고, 출력 변수(202)의 스트림 데이터들을 그래프의 출력 노드에 매핑한 후, 입력 노드와 출력 노드간의 확률적 연관 관계에 따라 노드간 링크의 생성 여부를 결정함으로써 확률 그래프 모델을 생성할 수도 있다.

추론 장치(100)가 변수 조합을 이용하여 확률 그래프 모델을 생성할 때, 추론 장치(100)는 변수 조합이 갖는 정보량에 따라 해당 변수 조합의 생성 여부를 결정할 수 있다. 변수 조합이 생성되면 생성된 변수 조합에 따라 그래프의 노드의 개수 역시 증가하게 된다. 만약 생성될 변수 조합의 정보량이 크지 않다면 노드간 확률적 연관 관계를 계산 및 추정하는 것에 큰 의미가 없으므로 연산 부하를 줄이기 위하여 정보량이 적은 변수 조합은 생성하지 아니할 수 있다.

추론 장치(100)는 생성된 확률 그래프 모델을 저장하고, 저장된 확률 그래프 모델을 이용하여 상황에 맞는 추론 결과를 도출한다. 또한, 추론 장치(100)는 추론 결과에 따라 다시 확률 그래프 모델을 생성하고, 재생성된 확률 그래프 모델을 이용하여 저장된 확률 그래프 모델을 갱신함으로써 확률 그래프 모델에 학습이 이루어지도록 할 수 있다.

도 3은 본 발명의 일 실시예에 따른 확률 그래프 모델 생성 장치를 도시한다.

도 3을 참조하면, 확률 그래프 모델 생성 장치(300)는 제 1 매트릭스 생성부(301), 제 2 매트릭스 생성부(302), 그래프 생성부(303), 그래프 저장부(304), 및 조합 결정부(305)를 포함할 수 있다.

제 1 매트릭스 생성부(301)는 제 1 매트릭스를 생성한다. 제 1 매트릭스는 상황 정보에 대응되는 다수의 입력 변수 및 추론 결과에 대응되는 출력 변수를 포함하는 독립 변수들의 스트림 데이터로 구성될 수 있다. 예컨대, 제 1 매트릭스는 도 2의 스트림 데이터(203)가 될 수 있다.

제 2 매트릭스 생성부(302)는 제 1 매트릭스의 각 데이터를 선택적으로 조합해서 제 2 매트릭스를 생성한다. 예컨대, 제 2 매트릭스 생성부(302)는 제 1 매트릭스의 각 데이터에서 출력 변수에 대응되는 스트림 데이터를 제외한 입력 변수들의 스트림 데이터를 이용하여 제 2 매트릭스를 생성할 수 있다.

제 2 매트릭스 생성부(302)는 조합 차수를 1에서 n까지 높여가면서 제 2 매트릭스를 생성할 수 있다. 제 2 매트릭스 생성부(302)는 제 1 매트릭스에서 소정의 영역을 지정하여 1차 조합을 생성할 수 있다. 예컨대, 도 2에서, 제 2 매트릭스 생성부(302)는 조합 영역(204)을 지정하여 데이터 b1, b2, b3, c1, c2, c3, d1, d2, d3를 포함하는 1차 조합을 생성할 수 있다. 또한, 제 2 매트릭스 생성부(302)는 1차 조합을 다시 조합해서 2차 조합을 생성할 수 있다. 예컨대, 위 예에서, 제 2 매트릭스 생성부(302)는 b1b2, b1b3, b1c1,.., b1d3, b2b3, b3c1,.., d2d3와 같은 2차 조합을 생성할 수 있다. 제 2 매트릭스는 이러한 1차 조합 및 2차 조합을 포함할 수 있다.

그래프 생성부(303)는 제 2 매트릭스를 이용하여 확률 그래프 모델을 생성한다. 예컨대, 그래프 생성부(303)는 제 2 매트릭스의 각 데이터와 제 1 매트릭스의 출력 변수간의 확률적 연관 관계를 계산하고 계산 결과에 따라 확률 그래프를 생성하는 것이 가능하다.

또한, 그래프 생성부(303)는 생성된 확률 그래프 모델을 그래프 저장부(304)에 저장하거나, 생성된 확률 그래프 모델을 이용하여 그래프 저장부(304)에 저장된 확률 그래프 모델을 갱신한다.

조합 결정부(305)는 제 2 매트릭스 생성부(302)가 변수 조합을 생성할 때 어떠한 변수 조합을 생성할지를 결정한다. 예컨대, 도 2에서, 변수 X에 대한 변수 A의 정보량이 10이라고 가정하고, 변수 X에 대한 변수 B의 정보량이 20이라고 가정하자. 이것은 최적의 애플리케이션을 추전하기 위한 확률 그래프 모델에 있어서, 어떤 애플리케이션을 추천해줄지는 시간보다 위치에 더 의존적임을 나타낼 수 있다. 그런데 만약 변수 X에 대한 변수 조합 AB의 정보량이 5라면, 어떤 애플리케이션을 추천할지를 결정할 때에 시간과 위치를 동시에 고려하는 것은 큰 의미가 없음을 나타낼 수 있다. 이와 같이 조합 결정부(305)는 변수 조합을 이용하여 확률 그래프 모델을 생성할 때 불필요한 변수 조합이 생성되지 않도록 생성될 변수 조합을 결정하는 것이 가능하다.

도 4는 본 발명의 일 실시예에 따른 조합 결정부를 도시한다.

도 4를 참조하면, 조합 결정부(400)는 독립 변수 획득부(401) 및 변수 조합 결정부(402)를 포함한다.

독립 변수 획득부(401)는 상황 정보에 대응되는 다수의 입력 변수 및 추론 결과에 대응되는 출력 변수를 획득한다. 예컨대, 독립 변수 획득부(401)는, 도 2에서, 입력 변수(201) 및 출력 변수(202)를 포함하는 독립 변수(200)를 수신할 수 있다.

변수 조합 결정부(402)는 출력 변수에 대한 변수 조합의 정보량에 따라 생성될 변수 조합을 결정한다. 변수 조합은 도 3의 제 2 매트릭스 생성부(302)가 제 2 매트릭스를 생성할 때 사용하는 입력 변수들의 조합이 될 수 있다. 변수 조합의 정보량은 출력 변수에 대한 각 입력 변수의 엔트로피(entropy) 또는 조건부확률분포의 유사도에 기초하여 정의될 수 있다.

엔트로피를 이용하여 변수 조합의 정보량을 추정하는 경우, 엔트로피와 정보량간의 반비례 관계에 따라 정보량을 추정할 수 있다. 예를 들어, 어떤 입력 변수 또는 어떤 변수 조합의 엔트로피가 낮을수록 그 입력 변수 또는 변수 조합이 갖는 정보량은 높은 것으로 볼 수 있다.

조건부확률분포의 유사도를 이용하여 변수 조합의 정보량을 추정하는 경우, 변수 조합에 포함된 각 입력 변수의 조건부확률분포의 형태가 유사할수록 정보량이 높아지는 것으로 볼 수 있다. 일 실시예에 따라, 변수 조합 결정부(402)는 출력 변수에 대한 각각의 입력 변수의 엔트로피를 계산하고, 계산된 엔트로피와 임계값을 비교하여 임계값 보다 낮은 엔트로피를 갖는 입력 변수를 변수 조합 생성을 위한 입력 변수로 선택할 수 있다.

다른 실시예에 따라, 변수 조합 결정부(402)는 출력 변수에 대한 각각의 입력 변수의 제 1 엔트로피를 계산하고, 출력 변수에 대한 각각의 변수 조합의 제 2 엔트로피를 계산하고, 계산된 제 1 엔트로피와 제 2 엔트로피를 비교하여 생성될 변수 조합을 선택할 수도 있다.

또 다른 실시예에 따라, 변수 조합 결정부(402)는 출력 변수에 대한 제 1 입력 변수의 제 1 조건부확률분포와 출력 변수에 대한 제 2 입력 변수의 제 2 조건부확률분포간의 유사도에 따라 생성될 변수 조합을 결정할 수 있다. 이때 조건부확률분포간의 유사도는 확률분포그래프의 모양 유사성 또는 확률분포그래프의 최대값 위치의 근접성에 기초하여 정의될 수 있다.

도 5a 및 도 5b는 본 발명의 일 실시예에 따른 변수 조합의 정보량 추정 방법을 도시한다.

도 4 및 도 5a에서, 변수 조합 결정부(402)는 출력 변수에 대한 각 입력 변수의 조건부확률분포표를 생성한다. 예컨대, P(X|A)는 변수 A가 관측되었을 때 변수 X가 발생할 확률을 의미할 수 있다. 일 예로써, 변수 X가 애플리케이션을 나타낸다면, 변수 A가 관측되었을 때 x1 애플리케이션이 실행될 확률은 0.2인 것으로 측정될 수 있다.

변수 조합 결정부(402)는 각 입력 변수에 대하여 엔트로피(entropy, H)를 계산한다. 엔트로피는 다음과 같은 식을 통해 계산될 수 있다.

각 입력 변수에 대한 엔트로피가 계산되면, 변수 조합 결정부(402)는 계산된 엔트로피에 따라 변수 조합 생성에 사용될 입력 변수를 예비적으로 선택할 수 있다. 입력 변수의 예비적 선택 방법으로 두 가지 방법이 가능하다.

첫째로, 임계값을 정하고 정해진 임계값보다 낮은 엔트로피를 갖는 입력 변수를 선택할 수 있다. 예컨대, 도 5a에서, 임계값이 2.2라면, 입력 변수 A의 엔트로피가 임계값보다 높으므로, 변수 조합 결정부(402)는 입력 변수 A를 제외한 입력 변수 B, C, D, E를 선택할 수 있다.

둘째로, 임계값을 정하고 테스트 변수쌍을 생성한 후 테스트 변수쌍의 각 입력 변수의 엔트로피가 모두 임계값보다 높으면 테스트 변수쌍에 해당하는 입력 변수를 변수 조합 생성에서 제외할 수 있다. 예컨대, 도 5a에서, 임계값이 2.2라면, 입력 변수를 어떻게 짝을 짓더라도 둘중에 하나는 임계값보다 낮은 엔트로피를 가지므로, 변수 조합 결정부(402)는 모든 입력 변수를 선택할 수 있다.

첫번째 방법에 따라 입력 변수 A가 제외된 경우를 살펴보면 도 5b와 같다.

도 4 및 도 5b에서, 변수 조합 결정부(402)는 도 5a와 같이 예비적으로 선택된 입력 변수 B, C, D, E에 대하여 변수 조합을 생성하고, 생성된 변수 조합의 엔트로피를 계산한다. 엔트로피 계산 방법은 수학식 1과 같다.

변수 조합의 엔트로피가 계산되면, 변수 조합 결정부(402)는 변수 조합의 엔트로피와 변수 조합에 포함된 입력 변수의 엔트로피를 각각 비교하고, 비교 결과에 따라 변수 조합 생성을 위한 변수 조합으로 선택할지 여부를 결정한다.

예컨대, 입력 변수 B와 입력 변수 C의 경우, 조합 전의 엔트로피는 각각 1.96과 2.17이고 조합 후의 엔트로피는 2.22다. 조합 후의 엔트로피가 원래의 엔트로피보다 상승하였으므로, 변수 조합 결정부(402)는 변수 조합 BC를 변수 조합 생성에서 제외할 수 있다. 또한, 입력 변수 B와 입력 변수 D의 경우, 조합 전의 엔트로피는 각각 1.96과 1.36이고 조합 후의 엔트로피는 0.97이다. 조합 후의 엔트로피가 원래의 엔트로피보다 낮아졌으므로, 변수 조합 결정부(402)는 변수 조합 BD를 변수 조합 생성을 위해 선택할 수 있다. 입력 변수 C와 입력 변수 D의 경우, 조합 전의 엔트로피는 각각 2.17과 1.36이고 조합 후의 엔트로피는 1.55이다. 입력 변수 C를 기준으로 볼 때는 엔트로피가 낮아졌으나 입력 변수 D를 기준으로 볼 때는 엔트로피가 높아지는 경우, 변수 조합 결정부(402)는 변수 조합 CD를 변수 조합 생성에서 제외할 수 있다.

이와 같이, 변수 조합 결정부(402)는 엔트로피에 따라 각 입력 변수 또는 입력 변수들의 조합에 대한 정보량을 정의하고 조합에 의해 정보량이 늘지 않는 경우 해당 변수 조합을 확률 그래프 모델 생성을 위한 변수 조합에서 제외할 수 있다.

도 6a 및 도 6d는 본 발명의 다른 실시예에 따른 변수 조합의 정보량 추정 방법을 도시한다.

입력 변수가 조합되었을 때, 원래의 입력 변수가 갖고 있는 정보량보다 변수 조합의 정보량이 늘어나는지 또는 줄어드는지에 대한 판단은 각 입력 변수의 조건부확률분포그래프의 모양을 비교해서 이루어질 수도 있다.

예를 들어, 도 6a와 같이, 어떤 변수 X에 대한 변수 M의 확률분포그래프와 어떤 변수 X에 대한 변수 N의 확률분포그래프의 모양이 비슷하다면, 변수 M과 변수 N을 조합했을 때 그래프의 피크(peak)값이 증가하면서 정보량 역시 증가하는 것이 가능하다.

그렇지만, 도 6b와 같이, 어떤 변수 X에 대한 변수 M의 확률분포그래프와 어떤 변수 X에 대한 변수 N의 확률분포그래프의 모양이 상이하다면, 변수 M과 변수 N을 조합했을 때 그래프의 피크(peak)값이 서로 상쇄되면서 정보량 역시 감소될 수가 있다.

도 4 및 도 6c에서, 변수 조합 결정부(402)는 출력 변수에 대한 각 입력 변수의 조건부확률분포표에서 최대 확률 값의 위치를 검출한다. 예를 들어, 입력 변수 B의 최대 확률 값의 위치는 x3이 될 수 있다. 마찬가지로, 입력 변수 C의 최대 확률 값의 위치는 x1 및 x4가되고, 입력 변수 D의 최대 확률 값의 위치는 x3, 입력 변수 E의 최대 확률 값의 위치는 x1 및 x3이 될 수 있다.

도 4 및 도 6d에서, 변수 조합 결정부(402)는 검출된 최대 확률 값의 위치에 따라 입력 변수들의 조합 여부를 결정하는 것이 가능하다. 예를 들어, x1의 위치에서 입력 변수 C와 입력 변수 E는 최대 확률 값을 가지므로, 입력 변수 C와 입력 변수 E는 변수 조합 생성에 사용될 수 있다. 그런데 입력 변수 B와 입력 변수 C간에는 공유되는 최대 확률 위치가 없으므로, 입력 변수 B와 입력 변수 C는 변수 조합 생성에서 제외될 수 있다.

본 실시예에서는 설명의 편의를 위해 최대 확률 값이 하나인 것으로 설명하였으나 1차 최대 확률 값, 2차 최대 확률 값과 같이 여러 개의 위치를 비교할 수도 있다.

또한 전술한 정보량 추정 방법은 일 실시예로써 설명한 것으로 엔트로피, 확률분포그래프의 피크 위치를 이용하는 방법 외에도 기계학습을 통해 정보량을 추정하는 것도 가능하다.

도 7은 본 발명의 일 실시예에 따른 확률 그래프 모델 생성을 위한 조합 변수 결정 방법을 도시한다.

도 3 및 도 7을 참조하면, 조합 결정부(305)는 독립 변수를 획득한다(701). 예컨대, 조합 결정부(305)는 도 2와 같이 입력 변수(201)와 출력 변수(202)를 포함하는 독립 변수(200)를 수신할 수 있다. 입력 변수(201)는 상황 정보에 대응되고 출력 변수(202)는 상황 정보에 따른 추론 결과가 될 수 있다.

독립 변수가 얻어지면, 조합 결정부(305)는 변수 조합이 갖는 정보량에 따라 생성될 변수 조합을 결정한다(702). 예컨대, 조합 결정부(305)는 도 5a 및 도 5b와 같이 엔트로피를 이용하여 생성될 변수 조합을 결정할 수 있다. 또한 조합 결정부(305)는 도 6a 내지 도 6d와 같이 조건부확률분포그래프의 피크위치를 이용하여 생성될 변수 조합을 결정할 수 있다.

이상에서 살펴본 것과 같이, 개시된 장치 및 방법에 따르면, 변수 조합을 이용하여 확률 그래프 모델을 생성할 때 정보량이 적은 변수 조합을 제외하고 필요한 변수 조합만을 이용하여 확률 그래프 모델을 생성하기 때문에 상황에 적절한 추론 결과를 도출함과 동시에 확률 그래프 모델 생성에 따른 연산량도 줄일 수가 있다.

한편, 본 발명의 실시 예들은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.

컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현하는 것을 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술 분야의 프로그래머들에 의하여 용이하게 추론될 수 있다.

나아가 전술한 실시 예들은 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 권리범위가 특정 실시 예에 한정되지 아니할 것이다.

Claims

상황 정보에 대응되는 다수의 입력 변수 및 추론 결과에 대응되는 출력 변수를 포함하는 독립 변수를 획득하는 독립 변수 획득부; 및
각각의 상기 입력 변수의 조합에 의해 생성되는 각각의 변수 조합의 상기 출력 변수에 대한 정보량에 따라 생성될 변수 조합을 결정하는 변수 조합 결정부; 를 포함하는 확률 그래프 모델 생성 장치.
제 1 항에 있어서,
상기 독립 변수들의 스트림 데이터를 포함하는 제 1 매트릭스를 생성하는 제 1 매트릭스 생성부;
상기 제 1 매트릭스에서 상기 변수 조합 결정부에 의해 생성이 결정된 변수 조합에 포함된 제 1 변수들의 스트림 데이터를 선택적으로 조합하여 제 2 매트릭스를 생성하는 제 2 매트릭스 생성부; 및
상기 제 2 매트릭스를 이용하여 확률 그래프 모델을 생성하는 그래프 생성부; 를 더 포함하는 확률 모델 생성 장치.
제 1 항에 있어서, 상기 변수 조합 결정부는
각각의 입력 변수의 출력 변수에 대한 엔트로피를 계산하고, 계산된 엔트로피와 임계값을 비교하여 상기 생성될 변수 조합을 결정하는 확률 그래프 모델 생성 장치.
제 1 항에 있어서, 상기 변수 조합 결정부는
각각의 입력 변수의 출력 변수에 대한 제 1 엔트로피를 계산하고, 각각의 입력 변수의 변수 조합의 출력 변수에 대한 제 2 엔트로피를 계산하고, 계산된 제 1 엔트로피와 제 2 엔트로피를 비교하여 상기 생성될 변수 조합을 결정하는 확률 그래프 모델 생성 장치.
제 1 항에 있어서, 상기 변수 조합 결정부는
제 1 입력 변수의 출력 변수에 대한 제 1 조건부확률분포와 제 2 입력 변수의 출력 변수에 대한 제 2 조건부확률분포 간의 유사도에 따라 상기 생성될 변수 조합을 결정하는 확률 그래프 모델 생성 장치.
제 5 항에 있어서, 상기 변수 조합 결정부는
상기 제 1 조건부확률분포의 최대 확률 값 위치와 상기 제 2 조건부확률분포의 최대 확률 값 위치를 검출하고, 검출된 최대 확률 값 위치를 이용하여 상기 유사도를 판단하는 확률 그래프 모델 생성 장치.
상황 정보에 대응되는 다수의 입력 변수 및 추론 결과에 대응되는 출력 변수를 포함하는 독립 변수를 수신하는 단계; 및
각각의 상기 입력 변수의 조합에 의해 생성되는 각각의 변수 조합의 상기 출력 변수에 대한 정보량에 따라 생성될 변수 조합을 결정하는 단계; 를 포함하는 확률 그래프 모델 생성을 위한 조합 변수 결정 방법.
제 7 항에 있어서,
상기 독립 변수들의 스트림 데이터를 포함하는 제 1 매트릭스를 생성하는 단계;
상기 제 1 매트릭스에서 상기 생성될 변수 조합으로 결정된 변수 조합에 포함된 제 1 변수들의 스트림 데이터를 선택적으로 조합하여 제 2 매트릭스를 생성하는 단계; 및
상기 제 2 매트릭스를 이용하여 확률 그래프 모델을 생성하는 단계; 를 더 포함하는 확률 그래프 모델 생성을 위한 조합 변수 결정 방법.
제 7 항에 있어서, 상기 변수 조합을 결정하는 단계는
각각의 입력 변수의 출력 변수에 대한 엔트로피를 계산하고, 계산된 엔트로피와 임계값을 비교하여 상기 상기 생성될 변수 조합을 결정하는 확률 그래프 모델 생성을 위한 조합 변수 결정 방법.
제 7 항에 있어서, 상기 변수 조합을 결정하는 단계는
각각의 입력 변수의 출력 변수에 대한 제 1 엔트로피를 계산하고, 각각의 입력 변수의 변수 조합의 출력 변수에 대한 제 2 엔트로피를 계산하고, 계산된 제 1 엔트로피와 제 2 엔트로피를 비교하여 상기 상기 생성될 변수 조합을 결정하는 확률 그래프 모델 생성을 위한 조합 변수 결정 방법.
제 7 항에 있어서, 상기 변수 조합을 결정하는 단계는
제 1 입력 변수의 출력 변수에 관한 제 1 조건부확률분포와 제 2 입력 변수의 출력 변수에 관한 제 2 조건부확률분포 간의 유사도에 따라 상기 상기 생성될 변수 조합을 결정하는 확률 그래프 모델 생성을 위한 조합 변수 결정 방법.
제 11 항에 있어서, 상기 변수 조합을 결정하는 단계는
상기 제 1 조건부확률분포의 최대 확률 값 위치와 상기 제 2 조건부확률분포의 최대 확률 값 위치를 검출하고, 검출된 최대 확률 값 위치를 이용하여 상기 상기 생성될 변수 조합을 결정하는 확률 그래프 모델 생성을 위한 조합 변수 결정 방법.