KR19990047854A

KR19990047854A - 메타데이타에 의한 정보 검색의 지능형 사용자 인터페이스 방법

Info

Publication number: KR19990047854A
Application number: KR1019970066395A
Authority: KR
Inventors: 주종철; 박동인; 심부성; 고구진
Original assignee: 정선종; 한국전자통신연구원
Priority date: 1997-12-05
Filing date: 1997-12-05
Publication date: 1999-07-05

Abstract

본 발명은 지능형 메타데이타 시스템을 위하여 적응 능력을 갖는 사용자 인터페이스의 개발에 관한 것으로서, 특히 지능형 메타데이타 시스템(IMDS)을 위한 메타데이타에 의한 정보 검색의 지능형 사용자 인터페이스 방법에 관한 것이다. 사용자가 질의를 하고, 시스템은 사용자 질의의 특징을 추출하여 번역 모듈에서 특징 벡터로 변환한다. 그후 태스크 처리 모듈에서 질의 특징벡터를 이용하여 메타데이터 탐색 트리를 탐색한다. 그 탐색중에 특징에서 지속적 탐색이 불가능하면 자동 질의 분석 모드로 전환하여서 사용자 인터페이스 관리기에서 이전의 유사한 질의와 긍정적으로 연계되어 있는 응답 케이스를 조회하고, 조회된 응답 케이스들을 통하여 특징의 속성을 결정한다. 만일 불충분한 정보로 인하여 특징의 속성을 결정할 수 없으면 사용자와 대화형 모드로 전환하여서 사용자가 속성을 추가 입력한다. 그리고 그 판단 트리의 단말노드에 도착할 때까지 지속적으로 탐색한다. 그 탐색결과, 시스템 학습모드이면 조회된 응답들에 대한 상관도를 사용자가 평가하여 피이드백 한다. 따라서, 본 발명은 검색속도 향상, 검색 정확성, 검색 모델의 확장성, 검색 모델의 사용 용이성을 제공해준다.

Description

메타데이타에 의한 정보 검색의 지능형 사용자 인터페이스 방법

본 발명은 상용 데이터베이스 관리 시스템(DBMS)이나 인터넷 호스트에 저장된 각종 자원(전자 문서, 이미지, 멀티미디어 등)을 보다 효율적으로 저장, 검색, 관리 및 교환하기 위하여 메타데이타라고 하는 요약데이타를 활용하는 방법에 관한 것으로서, 특히 지능형 메타데이타 시스템(IMDS; Intelligent MetaData System)을 위한 메타데이타에 의한 정보 검색의 지능형 사용자 인터페이스 방법에 관한 것이다.

현대 사회의 빠른 속도로 증가하고 있는 인터넷과 같은 수많은 정보원에서 필요한 정보를 찾아내는 것은 중요하다. 또한 사용자의 정보검색에 대한 부담과 사용자와 시스템간의 의미상의 차이를 감소시켜야한다. 이러한 의미에서 본 발명에서는 지능형 메타 데이터 시스템(IMDS)을 위한 지능 사용자 인터페이스(IUI)를 인간과 시스템의 대화모델을 기반으로 하여 HCOS(Human-COmputer Symmetry)라는 계층화된 모델을 제안하였다. HCOS모델을 지능형 사용자인터페이스에 적용하여 지능적인 질의 처리에 대해 기술하였으며 지능 사용자 인터페이스를 위한 인간-컴퓨터 상호작용(Human Computer Interaction)을 분석하고 설계하였다. 이를 위한 적응 기법과 기계 학습을 통하여 지능을 갖는 시스템의 구현에 적용하였다. 시스템의 적응은 단기 적응과 장기 적응으로 나눌수 있는데 여기에는 각각 CBR(Case-Based Reasoning) 을 기반으로 한 판단 트리(Decision tree)와 역전파 신경망을 이용한 사용자 인터페이스를 제시한다. 여기서, 판단 트리(Decision tree)는 모든 상황을 2 자 택일도로 나타낸 표현, 조건을 만족하느냐에 따라 다음에 행할 처리가 분기되는 트리구조가 된다.

본 발명에서 제공하는 방법은 인터넷 상에서 수백 혹은 수천만 건의 전자문서와 이미지 등의 자원(resource)을 검색하고, 재활용이 요구되는 필요한 자원에 대하여는 저장, 관리할 수 있도록 메타데이타(metadata)를 등록함으로써, 실제 자원까지도 관리가 가능하도록 지원하는 기술로서, 메타데이타를 통한 정보검색의 속도 및 정확도를 개선하는 방법을 제시하고 있다. 또한, 이미지 자원의 경우 제작 비용이 고가이므로 재사용을 가능하게 함으로써 자원의 활용효과를 극대화할 수 있다. 여기서, 메타데이타(metadata)는 데이터의 의미를 기술 혹은 대표하는 데이타를 말한다.

이 분야의 종래 기술은 메타데이타를 이용하지 않고 자원을 직접 검색함으로써, 이미지나 멀티미디어 자원 등과 같이 색인이 자동으로 이루어지지 않는 자원에 대해서는 검색할 수 있는 방법이 없었다. 그리고, 전자문서의 경우도 색인정보를 이용하여 검색할 수는 있지만 정확하게 색인하지 못함으로 검색의 속도와 정확도를 떨어 뜨렸다. 아울러, 검색을 위한 색인 정보가 엄청난 분량으로 늘어남으로 사용자가 원하는 정확한 자원을 찾는데에는 많은 무리가 따랐다. 칼라, 모양, 표현형태 등 이미지의 특징정보를 자동으로 추출하여, 색인 및 클러스터링함으로써 검색속도나 효율을 높여보기 위한 시도가 이루어져 왔으나, 아직 실험적인 수준에 머무르고 있다.

따라서, 본 발명은 상기와 같은 문제점을 해결하기 위해, 검색 속도를 향상시키고, 검색의 정확도를 높이며, 메타데이터 검색 모델을 확장시키고, 검색 모델의 사용상 용이하도록 하는데 그 목적이 있다.

도 1은 본 발명의 지능형 검색 흐름도.

상기 목적을 달성하기 위한 본 발명의 기술적인 특징은, 지능형 메타데이타 시스템(IMDS)을 위하여 적응 능력을 갖고, 번역 모듈(IM), 표현 모듈(PM), 태스크 처리 모듈(TPM), 사용자 모델(UM) 및 사용자 인터페이스 관리기(UIM)로 구성된 지능형 사용자 인터페이스 방법에 있어서, 사용자가 질의를 하는 제 1 과정과, 시스템이 사용자 질의의 특징을 추출하여 번역 모듈에 의해서 특징 벡터로 변환함으로써 사용자 모델, 새로운 입력 데이타를 분류하기 위해 사용되는 판단 트리를 로드(Load)하는 제 2 과정과, 질의 특징 벡터를 이용하여 태스크 처리 모듈이 메타데이터 판단 트리에서 상기 사용자의 질의를 탐색하는 제 3 과정과, 그리고 탐색된 결과에 대한 사용자의 피드백된 내용을 입력받아 사용자 모델을 수정하기 위해 학습하는 제 4 과정을 포함하는 것을 특징으로 한다.

최근에 들어 정보의 홍수라고 불릴 만큼 다량의 정보 속에서 필요한 정보를 찾아내는 것은 매우 중요하다. 즉, 현대인에게 정보 과다(information overload) 문제가 점차 쟁점으로 대두되고 있다. 이러한 문제를 해결하기 위한 방안 중에 하나로 지능 사용자 인터페이스 개념을 도입할 수 있다. 정보화 사회로의 진행에 따라서, 일반 사용자의 전문성 내지는 전문화 가능성을 기대할 수 없기 때문에 시스템의 측면에서 사용자들과 시스템 사이의 의미상 차이(semantic gap)가 감소되어야만 한다. 또한, 사용자의 정보 활용도를 향상시키기 위하여는 이러한 의미상 차이를 최소화시키기 위한 지능 사용자 인터페이스 기법의 도입이 필요하다.

본 발명에서는 지능형 메타 데이터 시스템을 위한 지능 사용자 인터페이스의 설계 및 구현에 대하여 기술한다. 메타 데이터 시스템을 위한 지능형 사용자 인터페이스를 위한 사람 - 컴퓨터 상호 작용 모델(Human Computer Interaction Model)을 제시하고, 이 모델을 기반으로 한 지능 사용자 인터페이스의 프레임 워크를 제안하며, 궁극적으로는 실제 메타 데이터 베이스와 연동할 수 있는 지능형 메터 데이터 시스템을 위한 지능 사용자 인터페이스의 설계 및 구현을 제시한다. 지능 사용자 인터페이스의 핵심은 컴퓨터가 사용자에 대한 적응성 내지는 학습 기능을 가지도록 하는 것이며, 이러한 기능을 통하여 사용자와 시스템 사이의 의미상 차이를 최소화 할 수 있으며, 따라서 사용자의 정보 활용 효율의 극대화를 기할 수 있다.

이에, 앞서 언급한 지능 사용자 인터페이스 개념을 도입한 지능형 메타 데이터 시스템을 설계하는데 있어서 바람직한 전략은 다음과 같다.

- 사용자의 정보검색 부담을 감소시켜 준다.

- 사용자의 의도를 가능하면 적은 횟수의 인터랙션에 파악하여야 한다.

- 대화를 통한 사용자의 의도를 파악하는데 단일 문장을 통해서가 아니라 기존에 축적된 사용자 모델을 기반으로 문맥을 통하여 이해한다.

- 사용 방법을 익히는데 쉽고 즐거움을 주어야 하며 단순성을 부여하여야 한다.

- 복잡한 기능은 점차적으로 학습이 되도록 한다.

- 사용자의 실수를 포용할 수 있어야 한다.

- 시스템이 사용자의 특성에 적응할 수 있어야 한다.

- 시스템의 성능이 시간이 지남에 따라서 개선되어야 한다.

상술한 지능 사용자 인터페이스는 여러 방법으로 정의되고 설계될 수가 있다. 지금까지 사용자 인터페이스 접근 방법론에 대해 일반적이고 만족할 만한 분류는 연구되어 있지 않지만, 보다 낳은 설계를 위해 사용자 인터페이스 방법론 사이에 구분은 매우 중요하다. Eberts에 의하면, 사용자 인터페이스의 종류는 실험적 방법, 예측 모델 방법, Anthropomorphic 방법, 인지과학적 방법 등의 네가지로 나뉘어 질 수 있다.

본 발명에서는 지능형 메타데이터 시스템을 위한 인간-컴퓨터 상호 작용 모델인 HCOS(Human COmputer Symmetry)을 제안한다.

현존하는 대부분 인간-컴퓨터 대화 모델은, 인간 정보 처리 시스템이 보통 태스크를 개시하고 컴퓨터 시스템은 주로 태스크를 처리한다고 본다. 그러나, HCOS에서는 사람, 컴퓨터 모두 태스크를 활성화하고 처리할 수 있다고 가정한다. HCOS를 통하여 인간과 컴퓨터의 상호 작용은 상호 작용에 관련하고 있는 인간과 컴퓨터에 대한 명백한 정의 때문에 체계적으로 분석될 수 있다. 컴퓨터 시스템은 더 이상 수동적인 객체로서가 아니라, 능동적인 정보 처리 객체로 다루어질 수 있다. 또한, 사용자는 더 이상 모호한 객체가 아니라, 기능이 분명하게 공학적으로 정의된 객체로 취급된다. HCOS에서 사용자(인간)와 기계(컴퓨터 정보처리 시스템)는 각각 개념(concept layer), 번역(translation layer), 미디아(physical layer) 세 개의 계층을 가진다. 따라서, 지능형 메타데이터 시스템에서 인간과 컴퓨터 사이의 대화(상호 정보교환)는 세 개의 계층에서 분석될 수 있다.

개념층에서 HIP(Human Information Processing)은 주로 태스크를 시작하고 태스크 처리 결과를 평가한다. MIP(Machine Information Processing)은 태스크를 처리하며 태스크를 시작한 HIP(사용자)에게 응답한다. 태스크는 지능형 메타데이터 시스템에서의 작업의 단위이며, 정보 생성(information generation), 정보 수집(information gathering), 정보 편집(information edit), 질의, 응답, 교수 명령(instructional assistance command)등이 포함된다. 태스크는 지능형 메타데이터 시스템의 적용 도메인에 따라서 보다 구체적으로 정의될 수 있다. 개념 층에서, HIP는 보통 태스크를 시작하며, MIP에 의해서 태스크가 처리되도록 요구한다. MIP는 목적 정보를 생성시킴으로써 HIP의 요구에 응답한다. HIP는 생성된 정보가 만족스러운지 여부를 결정한다. 만약 HIP가 만족한다면 그 태스크는 종료된다. 그렇지 않으면 HIP는 적절한 수정 또는 요구 명령을 발생함으로써 정보를 정정/재생산해 줄 것을 요구한다. MIP는 사용자의 요구에 맞게 정보를 생산하여서 사용자에게 응답한다. HIP와 MIP는 각각 개념 표현(conceptual representation)이라 불리는 개념 층의 내부 표현을 가지고 있다. HIP와 MIP는 양쪽 모두 교수 명령을 생성할 수 있으며, 각각이 감시 학습(supervised learning)과 비감시 학습(unsupervised learning) 기능을 모두 가지고 있다. 만약, 사용자가 교수 명령을 발생 시키면(즉, HIP가 MIP를 훈련 시키면), MIP는 교수 정보를 학습함으로써 그 명령에 대한 응답을 할 것이다. MIP의 관점에서 본다면 이것은 감시 학습의 일종이다. MIP는 대화중에 HIP를 이해시키거나 사용자로 하여금 MIP를 보다 더 효율적으로 사용할 수 있도록 하기 위해서 HIP에게 교수 명령을 발생시킬 수 있다. 이것은 HIP의 관점에서 본다면 감시 학습의 일종이다. HIP가 시스템을 더 사용하면 할 수록 HIP의 시스템에 대한 이해는 더욱 더 증가 될 것이다. 이것은 일종의 사용자의 비감시 학습이다. MIP 역시 비감시 학습의 기능을 가지고 있다.

HIP와 MIP의 번역층은 해석 처리(interpretation processing)와 표현 처리(presentation processing)로 구성되어 있다. HIP와 MIP의 표현 처리는 각각 개념 표현을 디스플레이 표현으로 바꾸어 준다. 해석 처리는 디스플레이 표현을 개념 표현으로 바꾸어 준다. 지능형 메타데이터 시스템의 모든 구성 요소는 오류를 발생시킬 수 있다. 그러나 모델의 단순화를 위해서 미디아층의 입출력 처리는 오류를 발생시키지 않는다고 가정한다. 지능형 메타데이터 시스템의 표현 처리는 모니터에 디스플레이 기술이다. 표현 처리에 있어서 오류가 없다는 가정은 현재 목표로 하는 지능형 메타데이터 시스템에서 단지 간단하고 매우 제한적인 그래픽 기능만이 사용되기 때문에 타당하다.

지능형 메타데이터 시스템을 위한 지능형 사용자 인터페이스(IUI; Intelligent User Interface)의 분석 및 설계에 대해 살펴보면 다음과 같다.

일반적으로 정보 검색은 사용자가 검색하는 정보는 반복되고 유사성을 갖는 질의를 하는 특성과 사용자가 정보 검색을 하는 전형적인 패턴이 있고 정보검색 대상이 임의가 아니고 특정한 도메인을 주로 조회하는 정보 검색의 수렴성을 가진다. 지능형 사용자 인터페이스의 요구 사항은 위의 정보검색 특성을 기반으로 하여 지능형 메타데이터 시스템을 위한 사용자 인터페이스에 적응성 또는 학습능력을 가지는 확장된 사용자 인터페이스로 규정한다. 이를 위하여 본 발명에서는 주어진 질의에 관련되어 조회되는 응답으로부터 케이스 또는 템프리트를 추출하고, 사용자와 시스템 사이의 과거의 질의/응답 근거하여 사용자의 질의 성향을 학습하여서, 시스템이 차후의 사용자 질의의 수행을 지능적으로 할 수 있도록 한다.

다음은 지능형 사용자 인터페이스의 개념 설계에 대한 내용이다. 지능형 사용자 인터페이스는 번역 모듈(Interpretation Module; IM), 표현 모듈(Presentation Module; PM), 태스크 처리 모듈(Task Processing Module; TPM), 사용자 모델(User Model; UM), 사용자 인터페이스 관리기(User Interface Manager; UIM)로 구성된다. 번역 모듈은 입력되는 질의를 내부 표현인 특징 벡터로 변환한다. 이 질의 내부 표현은 메타 데이터베이스 정보검색을 위한 기초 자료로 사용되며, 동시에 질의의 유형을 학습 또는 판별하기 위하여 사용자 인터페이스 관리기의 입력이 된다. 번역 모듈은 입력되는 질의를 관리하며 내부표현으로 변환한다. 표현 모듈은 질의에 대한 응답의 디스플레이 관리를 한다. 태스크 처리 모듈은 내부 표현으로 변환된 질의를 기반으로 사용자에게 출력 정보(응답)를 생성 또는 생성을 위한 메타 데이터 베이스와 인터페이스를 담당한다.

사용자 모델은 사용자의 질의 성향에 대한 정보를 포함하는 데이터베이스 또는 파일 구조를 가지고 있으며, 사용자 인터페이스 관리기는 주로 사용자 모델의 운용과 관련된 결정을 처리한다. 사용자 인터페이스 관리기는 사용자 모델을 기반으로 사용자의 질의를 추론하는 질의성향 학습, 사용자의 만족도 피이드 백을 이용하여 사용자 모델의 질의 패턴과 메타 데이터베이스와 연계 등을 담당한다.

질의 사용자 및 정보 검색 환경의 변화에 적응하기 위한 귀납적 프로그래밍(Inductive programming)에 기반한 기계 학습(Machine learning) 기법을 지능형 사용자 인터페이스에 적용하였다. 목적 정보(응답)는 태스크 개시자(사용자)가 원하는 정보로서, 사용자가 요구 정보(질의)의 생성을 통하여 지능형 메타데이터 시스템에게 목적 정보의 생성을 의뢰하게 된다. 사용자의 질의는 두 가지 경우로 구분될 수 있다. 명시적 질의(explicit request)와 묵시적 질의(implicit request)이다. 명시적 질의는 TMP가 명확한 목적 정보를 생성하기에 충분한 정보가 질의에 포함되어 있는 경우이다. 묵시적 질의는 지능형 메타데이터 시스템가 질의 자체나 사용자 모델의 사용자에 대한 지식을 이용하여 명백하게 사용자가 요구하는 의도를 파악할 수 없는 경우이다. 지능형 메타데이터 시스템는 이 경우에 가장 가능성 있는 목적 정보 또는 응답을 생성하게 되며, 이것은 사용자의 긍정적 또는 부정적 피이드 백을 받게 된다. 보편적으로 지능형 메타데이터 시스템의 그룹 사용자 또는 단일 사용자의 질의는 사용자 모델의 지식이 축적됨에 따라서 묵시적 질의에서 명시적 질의로 가까워지게 된다. 지능형 메타데이터 시스템에서 보는 질의의 명확성을 RPR(Request Predictability Ratio)라고 하자. 명시적 질의는 RPR은 1.0이고 전혀 예측하기 힘든 묵시적 질의의 RPR은 0.0이다. 대부분 질의는 0.0과 1.0 사이의 값을 가지게 된다.

본 발명에서는 CBR(Case-Based Reasoning) 기법을 도입함으로써 사용자의 질의 성향을 분석 또는 예측할 수 있는 시스템을 설계 및 구축하고 있다. CBR은 반복성의 특성을 가지고 적응성이 요구되는 환경에 적합하다. 과거의 케이스를 기반으로 새로 발생하는 상황을 분석하고 이를 기반으로 사용자의 질의를 묵시적인 질의만으로도 예측할 수 있다. 즉, 케이스로 표현될 수 있는 질의 상황 학습을 통하여 미래의 질의 상황에 대비할 수 있다. CBR 시스템은 케이스 라이브러리와 구축 및 탐색 프로시저로 구분된다. 지능형 사용자 인터페이스의 운용 모드는 정상 모드와 학습 모드로 구분되며, 정상 모드는 질의 수행 모드, 자동 질의 분석 모드, 대화형 모드로 구분한다. 정상 모드에서는 일반적인 질의에 대한 응답 과정을 수행한다. 자동 질의 분석 모드는 묵시적인 질의에 의하여 계속적으로 메타 데이터의 탐색이 불가능한 경우 지능형 사용자 인터페이스가 자동적으로 전환한다. 자동 질의 분석 모드에서는 지능형 사용자 인터페이스의 사용자 인터페이스 관리기에서 사용자 모델에 있는 지식을 사용하여서 사용자의 질의에 적절한 응답을 생성하도록 한다. 질의 분석이 불가능한 경우 지능형 사용자 인터페이스는 대화형 모드로 전환하여서 사용자로부터 필요한 질의 정보를 보충 받는다. 지능형 사용자 인터페이스가 사용자의 질의 성향을 학습하기 위한 전형적인 수행 과정은 도 1에 도시된 바와 같다.

먼저, 사용자가 질의를 발의하는 과정으로서, 그 과정은 시작 화면(10)에서 해당 세부 분야를 선택하고(20), 그 선택된 세부 분야의 키워드를 선택한다(30). 이때, 이전 화면 버튼을 누르면 이전 화면으로 돌아간다.

한편, 시스템은 사용자 질의의 특징을 추출하여 번역 모듈(IM)에서 특징 벡터로 변환한다. 즉, 도 1에서와 같이, 사용자 모델(UM), 판단 트리(decision tree)를 로드(Load)한다(40).

다음으로, 질의 특징 벡터를 이용하여 태스크 처리 모듈에서 메타 데이터 판단 트리를 탐색한다(50). 즉, 상기 세부 분야에 해당한 키워드를 선택하면 상기 로드된 판단 트리에서 그 선택된 키워드를 탐색한다.

그 탐색(50) 중에 특징 X에서 지속적 탐색이 불가능하면 자동 질의 분석모드로 전환하여서 사용자 인터페이스 관리기(UIM)에서 이전의 유사한 질의와 긍정적으로 연계되어 있는 응답 케이스를 조회하고, 조회된 응답 케이스들을 통하여 X의 속성을 결정한다. 즉, 도시된 바와 같이, 판단 트리에서 검색하여(50), 못찾을 경우 유사한 메타케이스들의 제목을 우선순위로 디스플레이 한다(60). 그리고나서 그 디스플레이된 N개의 메타케이스들중 1개를 선택하여 선택된 메타케이스 내용을 디스플레이 한다(70). 이 상태에서 이전 화면 버튼을 선택하면 다시 상기 메타케이스들의 제목을 우선순위로 디스플레이 한다. 그후, 그 디스플레이된 내용에 대한 만족도를 표시한다(80).

그리고, 만일 상기에서 불충분한 정보로 인하여 X의 속성을 결정할 수 없으면 사용자와 대화형 모드로 전환하여 사용자가 속성을 추가 입력한다(표현 모듈과 번역 모듈에서 수행). 즉, 상기 표시된 모든 메타케이스가 불만족한 경우 메타 데이터를 확장한다(90).

한편, 상기 판단 트리의 단말 노드에 도착할 때까지 태스크 처리 모듈에서 지속적으로 탐색하고, 시스템 학습 모드이면 조회된 응답들에 대한 상관도를 사용자가 평가하여 피드백한다(사용자 인터페이스 관리기에서 수행). 즉, 상기 판단 트리에서 검색하여(50) 상기 선택된 키워드를 찾을 경우 해당 메타케이스 내용을 디스플레이 한다(100). 그 후, 상술한 만족도를 표시(80)하거나 메타케이스 내용을 디스플레이 한 (100)후에 시스템 학습 모드이면(110) 피드백된 내용을 사용자 모델에 반영(120)한 후 종료하고, 학습 모드가 아니면 그대로 종료한다(130).

사용자 적응(User Adaptation)에 관해 살펴보면, 질의 사용자 및 정보 검색 환경의 변화에 적응하기 위한 기계 학습에 기반한 인간 인터페이스 기법을 사용하였다. 목적 정보(응답)는 태스크 개시자(사용자)가 원하는 정보로서, 사용자가 요구 정보(질의)의 생성을 통하여 지능형 메타데이터 시스템에게 목적 정보의 생성을 의뢰한다. 이상적인 질의 기반 사용자 모델은, 모든 질의에 대응되는 메타데이터에 대한 정보를 가지거나 추론해낼 수 있어야 하나, 완벽한 해결책은 다음과 같은 이유 때문에 이론적으로 불가능하다.

즉, 그 이유는 완벽한 질의 표현이 불가능, 메타데이터 라이브러리 자체의 동적인 특성, 두 집합간의 완벽한 사상관계 표현 불가능 때문이다.

또한, 사용자가 가지고 있는 질의와 메타 데이터간의 관계가 일반적으로 애매 모호하고, 시간에 따라서 변화한다. 일반적으로 많이 사용하는 영역적 프로그래밍(deductive programming)은 모든 입력조건이 완벽하게 주어지는 질의 경우에만 원하는 메타 케이스를 찾아낼 수 있기 때문에, 사용자의 질의로부터 관련 메타 케이스를 찾을 수 없는 경우 적절한 해결책이 필요하다. 이에 대하여는 다음과 같은 해결책이 가능하다.

첫번째, 시스템의 복잡한 메카니즘에는 관심이 없는 사용자에게 부정적인 영향을 주고, 친숙한 사용자 전략에서 벗어난다(사용자의 재시도).

두번째, 기존의 연역적 프로그래밍으로는 불가능 하고, 귀납적 프로그래밍 기법을 이용하여 해결책을 강구하여야 한다(사용자의 과거 질의 및 만족도로부터, 가장 근접하는 메타 케이스를 탐색).

따라서, 본 발명에서는 단기 적응(Short term adaptation)을 신경망 기반 사용자 모델에 적용하고, 장기 적응(Long term adaptation)을 판단 트리 기반의 케이스 기반 추론(Case-Based Reasoning) 기법을 사용하는 귀납적 프로그래밍 방식을 기반으로 사용자 인터페이스의 적응성 및 지능성을 부여하였다.

다음으로, 케이스 기반 추론(CBR; Case-Based Reasoning)에 대해서 살펴본다.

케이스는 명확한 상황의 예로 표현될 수 있는 대상을 나타낸다. CBR에서는 발생하는 상황의 재연성을 가정하며, 이를 기반으로 이전의 상황을 기억하였다가 유사한 상황에 적용하여 새로운 문제를 해결하는, 즉 과거의 해결책을 새로운 요구에 적용한다. CBR은 문제의 해결(problem solving), 이해(understanding), 학습(learning) 및 메모리 기능을 통합한 추론 방법이다. 따라서, CBR은 재연성이 있는 상황에서 유용하며, 문제 표현이 완전할 수 없기 때문에 이해 또는 해석이 추론전에 필요하며, 기존과 현재의 케이스가 완벽하게 동일할 수 없기 때문에 적응 기능이 필요하다. 추론의 결과가 자연스럽게 학습으로 이어지며, 피드백에 기반한 추론/학습 사이클에 절대적으로 중요하다. 한마디로, "기억 및 적응"이 CBR의 특성을 잘 나타내 준다.

다음은 전형적인 CBR과정을 보여주고 있다. 케이스 탐색(Case retrieval) 모듈은 메모리로부터 케이스 또는 케이스 그룹을 검색한다. 이 모듈에서는 이전의 케이스를 가져와서, 가장 유망한 케이스(들)을 선택한다. 근사 해결(Ballpark solution) 모듈은 검색된 케이스(들)로부터 적절한 부분을 추출하여서 가장 근사한 해결책을 구성한다. 적응(Adaptation) 모듈은 과거의 해결책이 새로운 환경에 맞게 적응시킨다. 평가 추론(Evaluative reasoning) 모듈은 정당성(Justification) 또는 비판(Criticism)으로 구분되며, 실세계에 내보내지기 전에 추가적인 적응이나 검색이 요구될 수도 있다. 평가 시험(Evaluative testing) 모듈은 추론 결과의 유용성을 판정하며, 추론의 결과가 실세계에서 테스트 된다. 테스트는 피이드백 또는 시뮬레이션에 의존하며, 추가적인 적응을 요구할 수도 있다. 메모리 갱신 모듈은 새로운 케이스가 차후를 위하여 저장하며, 메모리의 인덱싱 구조를 갱신한다.

케이스 기반 추론에서 적응방법(adaptation method)은 중요하며 다음과 같이 정의될 수 있다. 적응 방법은 크게 대체 방법(Substitution Methods)과 변형 방법이 있다. 전자의 대체 방법은 적절하지 못한 값을 대체할 항목이나 개념이 이미 존재하는 경우 적합하며, 변형 방법(Transformation Methods)은 필요한 개념이나 항목이 존재하지 않는 경우 변형은 기존의 해결책을 새로운 환경에 적합하다. 적응 전략(Adaptation strategy)은 수정할 대상 선정, 적절한 적응 또는 보안 방법 등을 고려하여 여러 적응 전략중 선택하여야 한다.

다음으로, ID3(Iterative Dichotemiser 3) 학습 알고리즘 기반 판단 트리의 구축에 대해 살펴보면 다음과 같다.

본 발명에서는 메타데이터 케이스 베이스의 탐색을 위한 판단 트리를 구축하여주는 ID3 학습 알고리즘을 사용하였다. 판단 트리는 주로 복잡한 결정 영역과 고차원의 특징 공간을 갖는 부류들의 탐색에 적합하다. 결정 영역이 복잡한 전역적인 부류들은 판단 트리 내부에서의 지역적인 결정 영역들의 조합을 통해 특징 공간의 차원을 줄여 가면서 단순화시킨다. ID3 학습 알고리즘을 이용한 시스템들은 많은 학습 데이터들로부터 포함하고 있는 개념들을 추출하여 결정 트리 형태로 일반화하고, 이를 이용하여 새로운 데이터를 분류하는 기능을 가지고 있다. 판단 트리는 노드와 에지로 구성된 일반적인 트리이며, 각 내부 노드는 학습 데이터가 표현된 한 속성을 가지며, 각 에지는 내부 노드의 속성이 갖는 값을 나타낸다. 일반적으로 데이터가 주어졌을 때 분류를 할 수 있는 판단 트리는 여러 가지가 있을 수 있다. ID3 학습 알고리즘은 많은 학습 데이터로부터 최적의 판단 트리를 구축하여 준다.

ID3 알고리즘은 정보 이론에 따르는 엔트로피 개념을 이용하여 최적의 판단 트리를 구축하여 준다. 엔트로피는 다음 수학식 1과 같이 정의된다.

상기 수학식 (1)에서, S는 입력된 학습 데이터 집합을 의미하며, C_k는 S에 속해 있는 데이터 중에 부류 k인 부분 집합을 나타낸다. |S|와 |C_k|는 각각 집합 S와 C_k의 크기를 나타낸다. ID3 학습 알고리즘은 엔트로피를 최소화하는 과정을 반복한다.

ID3 학습 알고리즘에서 중요한 과정은 데이터를 분류하기 위한 속성 정보를 선택하는 데 있다. 현재 입력 데이터의 엔트로피는 일정하게 주어지므로, 속성을 선택함에 따라서 여러 종류로 분류가 가능하고, 그에 따라서 엔트로피가 감소하게 된다. ID3은 속성들 중에서 엔트로피를 최소화할 수 있는 속성을 현재 상태의 분류 기준으로 선택하여 판단 트리를 구성한다. 속성을 선택하여 분류를 한 후의 엔트로피의 값은 다음 수학식 (2)와 같이 구할 수 있다.

상기 수학식 (2)에서 T는 입력된 학습 데이터 집합이며 T_j는 속성 i에 의해 분할된 부분 집합을 의미한다. H(T_j)는 부분 집합 T_j에 대한 엔트로피를 나타낸다. H_속성i(T)는 속성 i에 의해 입력 데이터 집합이 분류될 수 있는 정도를 나타낸다. ID3은 이 값 이 최소가 되는 속성 i를 선택하여 T를 분류한다.

판단 트리 기반 케이스 라이브러리 탐색은 다음과 같이 수행된다.

구축된 판단 트리는 새로운 입력 데이터를 분류하기 위해 사용된다. 번역 모듈을 통해 생성된 특징 벡터는 메타 케이스 라이브러리를 위한 판단 트리의 탐색을 통해 케이스 라이브러리와 연계된다. 판단 트리의 탐색 과정은 판단 규칙을 적용해 가는 과정이다. 판단 트리 분류기의 결정 과정은, 깊이 우선(depth-first) 탐색을 통해 결정 규칙으로 변환이 가능하므로 판단 트리의 탐색 알고리즘은 깊이 우선 탐색을 한다.

다음으로, 신경망을 이용한 사용자 질의 성향 학습에 대해 살펴보면 다음과 같다.

본 발명에서는 사용자 모델 학습 문제를 역전파(back propagation)라는 신경망의 도입으로 해결했다. 역전파 신경망은 직감적으로 이해할 수 있으며, 또한 프로그래밍이 비교적 용이하기 때문에, 주로 패턴인식, 제어 등에서 많이 사용되는 알고리즘이다. 여기에서 사용되는 역전파 신경망은 다층 퍼셉트론(multilayer perceptron)이라고도 불리며, 로젠블럿에 의해 1950년대 말에 발명된 단층 퍼셉트론에서의 문제점을 해결하기 위해 입력층(input layer), 출력층(output layer), 그리고 한 개 이상의 은닉층(hidden layer)으로 구성된 모델이다.

역전파 학습 방법은 다음과 같다.

첫 번째 단계는 입력층의 값들이 각 층을 통하여 출력층까지 전달되는 과정이다. 입력층의 각 유니트에 입력 패턴(벡터)을 주면, 이 신호는 각 유니트에서 변환되어 중간층에 전달되고 최종적으로 출력층에서 신호를 출력하게 된다. 변환 방법은 유니트의 연결 강도와 상위층 유니트의 값을 각각 곱한 것들의 총합을 역치 함수(threshold function)에 적용하게 된다. 두번째 단계는 에러조정 법칙(error-correction rule)에 의하여 연결 강도를 조절하는 과정이다. 첫번째 단계에서 얻어진 출력값과 기대값의 차이로 오차(error signal)를 구한다. 이 오차는 상위층에 역으로 전달되어 하위층에서는 이를 근거로 연결 강도를 재조정하여 서서히 최소화할 수 있다. 이러한 과정을 반복하여 충분히 작은 오차가 나온다면 학습을 마치게 된다. 학습시 입력 벡터와 함께 기대되는 출력 벡터도 역전파 신경망에게 제공해야 하는데, 그 이유는 이 신경망이 감독자 학습 방법(unsupervised training method)으로 학습을 시키기 때문이다. 역전파의 층이 단층일 경우 패턴 공간을 두 영역으로 나눌 수 있고, 2층인 경우 오목한 개구역 또는 오목한 폐구역을 형성하며, 3층인 경우 이론상으로 어떠한 형태의 구역도 형성할 수 있다.

그러나, 역전파 학습 알고리즘은 지역 최소값에 빠질 수 있고, 학습 과정이 수렴하는데 아주 많은 양의 학습 데이터와 시간이 소비되며, 추가 학습이 불가능하다는 단점이 있다. 그럼에도 불구하고 역전파 알고리즘은 구현이 쉽고, 학습이 어느 정도 가능하다는 이유에서 현재 가장 많이 사용되고 있다.

그리고 본 발명에서 제안된 알고리즘이 채택한 역전파는 입력층, 은닉층, 출력층의 3개 층으로 구성이 되며, 노드 개수는 각 층별로 입력된 메타데이터의 갯수만큼 구성이 된다. 학습은 패턴들을 오차가 0.1이하로 떨어질 때까지 학습한다.

그 학습이 완료된 신경망은 각 유니트들간의 연결 강도를 모두 저장하고 있기 때문에 벡터가 입력되면 원하는 결과에 근접한 값을 신속하게 얻을 수가 있다. 결과값을 얻는 과정은 학습 단계의 초기 단계의 과정을 그대로 적용한다. 즉, 연결 강도와 역치 함수를 이용하여 결과를 얻게 된다.

이상과 같은 본 발명은 다음과 같은 효과들을 갖는다.

첫번째로, 집단 분류를 통한 메타데이타의 데이터베이스에서의 클러스터링으로 실제 검색시 검색 인덱스를 사용하는 경우보다 검색속도면에서 효과가 높다.

두번째로, 사용자의 질의 성향과 프로파일을 모델링함으로써 검색하고자 하는 사용자의 입력 키워드 속에 담겨진 사용자의 의도와 찾고자하는 문서를 정합시키며, 메타데이타 속에 담겨 있는 자원의 의미를 통해 검색하므로 자원에 대한 자동색인이나 단순한 특징 정보에만 의존하는 경우보다 검색 정확도를 높일 수 있다.

세번째로, 메타데이타 컨텐트 모델을 사용자의 요구에 맞게 복잡도를 3가지 수준으로 구분하여 사용할 수 있게 해주고, 메타데이타 컨텐트 모델에 정의되지 않은 엘리먼트와 속성정보의 경우 사용자가 추가하여 사용함으로써 메타데이타 검색 모델을 확장성있게 할 수 있다.

네번째로, 본 발명은 메타 데이터 시스템의 질의 처리 과정을 지능화하기 위한 지능형 사용자 인터페이스에 대해 기술하였다. 메타 데이터 지능 사용자 인터페이스를 위하여 HCI(Human Computer Interaction)의 설계, 구현과 시스템에 지능성을 부여하기 위한 적응(adaptation) 및 기계학습(machine learning) 기법을 사용하였다. 장기간 적응(Long term adaptation)을 위하여 판단 트리 기반 케이스 기반 추론 기법을 사용하였고, 단기간 적응(Short term adaptation)을 위하여 신경망 기반 사용자 모델을 구현하였다. 즉, 검색모델을 사용을 용이하게 한다.

Claims

지능형 메타데이타 시스템(IMDS)을 위하여 적응 능력을 갖고, 번역 모듈(IM), 표현 모듈(PM), 태스크 처리 모듈(TPM), 사용자 모델(UM) 및 사용자 인터페이스 관리기(UIM)로 구성된 지능형 사용자 인터페이스 방법에 있어서,

사용자가 질의를 하는 제 1 과정과,

상기 시스템이 사용자 질의의 특징을 추출하여 상기 번역 모듈에 의해서 특징 벡터로 변환함으로써 사용자 모델, 새로운 입력 데이타를 분류하기 위해 사용되는 판단 트리를 로드(Load)하는 제 2 과정과;

상기 질의 특징 벡터를 이용하여 상기 태스크 처리 모듈이 메타데이터 판단 트리에서 상기 사용자의 질의를 탐색하는 제 3 과정과; 및

상기 탐색된 결과에 대한 사용자의 피드백된 내용을 입력받아 사용자 모델을 수정하기 위해 학습하는 제 4 과정을 포함하는 것을 특징으로 하는 메타데이타에 의한 정보 검색의 지능형 사용자 인터페이스 방법.
제 1 항에 있어서,

상기 제 1 과정은 시작 화면에서 해당 세부 분야를 선택하고, 그 선택된 세부 분야의 키워드를 선택하는 단계로 이루어진 것을 특징으로 하는 메타데이타에 의한 정보 검색의 지능형 사용자 인터페이스 방법.
제 1 항에 있어서,

상기 제 3 과정은 케이스 기반 추론(CBR)을 이용하여 탐색하는 것을 특징으로 하는 메타데이타에 의한 정보 검색의 지능형 사용자 인터페이스 방법.
제 1 항에 있어서,

상기 제 3 과정은,

탐색중에 특징에서 지속적 탐색이 불가능하면 자동 질의 분석모드로 전환하여서 사용자 인터페이스 관리기(UIM)에서 이전의 유사한 질의와 긍정적으로 연계되어 있는 응답 케이스를 조회하고, 조회된 응답 케이스들을 통하여 특징의 속성을 결정하는 것을 메타데이타에 의한 정보 검색의 지능형 사용자 인터페이스 방법.
제 1 항에 있어서,

상기 제 4 과정은 역전파 신경망을 이용하여 사용자 질의 성향을 학습하는 것을 특징으로 하는 메타데이타에 의한 정보 검색의 지능형 사용자 인터페이스 방법.