KR100938830B1

KR100938830B1 - 지식베이스 구축 방법 및 그 서버

Info

Publication number: KR100938830B1
Application number: KR1020070133016A
Authority: KR
Inventors: 최성필; 서정현; 김진숙; 최윤수; 윤화묵; 한선화
Original assignee: 한국과학기술정보연구원
Priority date: 2007-12-18
Filing date: 2007-12-18
Publication date: 2010-01-26
Also published as: EP2225676A2; KR20090065625A; EP2225676A4; WO2009078649A2; WO2009078649A3

Abstract

본 발명은 지식베이스 구축 방법에 있어서, 스키마 항목을 정의하고, 파일, 난이도 및 도달 목표 중 적어도 하나를 포함하는 자원 정보가 입력되면, 그 자원 정보에 대한 고유한 식별자를 생성하고, 상기 입력된 자원 정보를 분석하여 속성 정보를 추출하고, 상기 추출된 각 속성 정보를 상기 정의된 스키마 항목에 따라 연관 관계를 설정하여 저장하는 것으로서, 분야 전문가들이 가지고 있는 특정 자원에 대한 난이도 정보, 현재 분야의 하부 요소 분야들에 대한 연구 순서에 대한 지식 등을 직접 지식베이스에 표현할 수 있다.

지식베이스, 자원, 속성, RDF

Description

지식베이스 구축 방법 및 그 서버{Method constructing knowledge base and thereof server}

본 발명은 자원 정보가 입력되면, 그 자원 정보를 분석하여 속성 정보를 추출하고, 상기 추출된 각 속성 정보를 미리 정의된 스키마 항목에 따라 연관 관계를 설정하여 저장하는 지식베이스 구축 방법 및 그 서버에 관한 것이다.

과학 기술 문헌 발간량이 꾸준히 증가하고 인터넷을 통해 입수할 수 있는 정보가 과잉 상태에 도달함에 따라, 그 정보를 통해 연구 동향을 파악하고, 이를 통해 기업간 경쟁력을 확보하고, 연구 개발 방향을 대세에 맞추어 설정하고, 미래의 도전에 대비해야 하는 사람들에게는 이러한 과잉 정보가 오히려 정확한 판단을 저해하는 요인으로 작용하고 있다.

정보 이용자가 모든 정보 출처에서 개인의 지식과 경험을 토대로 정보를 입수하고 분석하는 전통적인 정보 분석 방법은 전문가의 시간 과다 소요, 전문가의 관점에 따라 편향된 정보 수집과 분석 진행 등의 단점을 내포하고 있다.

이러한 단점을 개선하기 위한 하나의 방편으로서 사람이 수행하는 일의 일부를 컴퓨터가 수행해주는 정보 분석 시스템 개발에 대한 연구가 진행되고 있다.

또한, 특정 연구 분야에서 새로운 연구를 시작하려는 많은 신진 연구자들은 그들의 첫 출발점을 찾는데 많은 어려움을 겪게 된다.

만일 당사자가 운이 좋다면, 그들을 돕고 지원하는데 적극적이고 헌신적인 선배들이나 교수들이 있어서 그 출발점 상에서의 어려움에 대한 해결책이 되기도 하지만, 대부분은 본인 스스로 해결해야 한다.

신규 분야에서의 연구 활동을 위한 시작점은 여러 가지가 있을 수 있으나 대표적으로 특정 분야의 전문가가 기고한 개괄적 논문 및 설명문, 특정 분야에서 독보적인 연구 성과를 내거나 왕성한 활동을 벌이고 있는 전문가들에 대한 기본 인적 사항, 전문분야 교과서 정보 등이 있을 수 있다.

연구의 본격적인 수행을 위한 준비 작업인 정보의 수집은 인터넷이 발달한 현재에도 매우 힘들고 시간이 많이 걸리는 작업으로 여겨지고 있다.

이러한 어려움에 반하여, 이미 특정 분야에서 다양한 경험이 있는 전문가들에게 이러한 정보는 지극히 당연한 공리(axiom)에 가깝다. 따라서, 분야 전문가들 사이에서 이러한 기초적인 수준의 정보를 깊게 다룬다는 것은 어떻게 보면 시간 낭비에 가까울 수 있다.

그러나 어떻게 하면 초보 연구자들이 위와 같은 정보를 쉽게 획득할 수 있는가에 대한 문제는 오래 전부터 인공지능 분야에서 지식표현 및 지식베이스 구축 등과 같은 방법론에 의하여 그 해결의 실마리를 얻고자 많은 노력이 있어 왔다. 정교 하게 정의된 지식표현기법에 의해서 구축된 지식베이스를 활용한 분야별 전문가 시스템(expert system) 개발도 많이 이루어지게 되었다.

특정 분야에 대한 깊이 있는 지식을 갖춘 이동형 컴퓨터가 있다면 이는 결국 그 분야에 대한 수 세기에 걸친 지식을 총 망라한 하나의 전문분야지식을 탑재한 시스템이라고 생각할 수 있을 것이다. 이러한 시스템은 현황 평가(situation assessment)나 장기 계획(long-range planning)을 수행해야만 하는 관리자에게도 매우 유용할 것이다.

전문가 시스템의 정의에 대한 또 다른 견해는 전산학 입장에서 이를 하나의 커다란 컴퓨터 프로그램으로 보는 것이다. 다시 말해서, 전문가 시스템(expert system) 혹은 지식 기반 시스템(knowledge-based system)이란 다수의 전문가들이 가지고 있는 세부 분야별 지식(subject-specific knowledge)을 포함하고 있는 하나의 컴퓨터 프로그램이라고 정의하고 있다.

이런 부류의 프로그램들은 1960년대와 1970년대에 처음으로 개발되었으며, 1980년대에 와서는 상업적으로 활용되기 시작하였다. 가장 일반적인 형태의 전문가 시스템은 다음과 같은 특징을 가지고 있다.

첫째, 사용자가 해결하기 원하는 어떤 문제에 대한 상세한 수준의 정보를 분석하는데 필요한 규칙집합을 포함하고 있다.

둘째, 분석된 정보를 기반으로 다양한 수학적 방법론을 통한 문제 분석을 수행한다.

마지막으로, 분석된 결과를 중심으로 문제를 해결하는데 필요한, 혹은 전문 가 시스템의 오류를 수정하는데 필요한 사용자 액션 시나리오(user actions scenario)를 제공한다.

따라서 사용자는 전문가 시스템과의 상호 교류를 통해 자신의 최종 목표를 명확하게 할 수 있으며, 시스템의 잘못된 결과를 수정하는데 도움을 줄 수 있다. 이러한 정보 교환 과정에서 전문가 시스템은 추론기능을 활용하게 된다.

위에서 기술한 바와 같이, 하나의 전문가 시스템을 만들고 이것이 실질적으로 활용 가능하게 하려면 대상 분야(target domain)에 대한 명확한 정의를 내려야 하며 그 분야는 충분히 표현 가능해야 한다.

다시 말해서, 대상 분야가 너무 넓으면, 수작업으로 이루어지는 지식표현단계에서 어려움을 겪게 되며, 이는 필연적으로 표현력(representative power) 부족 현상을 수반한다. 이렇게 구축된 지식베이스는 그 추론능력이 매우 떨어지게 되므로, 사용자의 만족도 측면이나 활용도 측면에서 좋은 점수를 받기 힘들다.

전통적인 인공지능 분야에서 연구되는 논리(logic) 기반의 지식베이스 구축과 시맨틱 웹에서 설명하고 있는 다소 간소화되고 직관적인 표준 프레임워크 기반(RDF, RDFS, OWL 등)의 지식표현에 상당한 괴리가 존재함을 알 수 있다.

또한 이러한 괴리감은 두 분야를 각각 연구하고 있는 학자들 사이에 많은 논의점들을 제공하고 있으며, 가장 대표적인 논쟁주제는 추론(inference)에 관한 것이다. 현재 가장 널리 활용되고 있는 자바기반 시맨틱 웹 프레임워크(Semantic Web Framework)인 Jena를 살펴봐도 이러한 논의점들이 중요한 사항임을 알 수 있다.

다시 말해서, Jena에서 제공하는 추론기능(inference support)은 대부분 전 이 관계(transitive relation) 혹은 수반 문장(entailment statement)을 다루는 것에 한정된다. 전통적인 인공지능 분야에서 다루고 있는 1차 논리(first-order logic)나 서술 논리(description logic) 기반의 범용 추론 기능은 대부분 생략되어 있다. 이는 현재까지 개발된 OWL이 서술 논리(description logic)를 기반으로 하고 있고, 이 서술 논리의 대부분을 포괄하는 OWL-DL에 대한 활용 시나리오나 표준 프레임워크에 대한 명확한 정의가 아직까지 확립이 되어있지 않기 때문이다.

따라서, 지식베이스(knowledge base)를 구축하는 가장 중요한 목표 중의 하나는 바로 추론(Inference)이다.

전통적인 인공지능 입장에서의 추론은 서술 논리(Description Logic), 1차 논리(First Order Logic)등의 기반 로직(Logic)을 기반으로 표현된 인스턴스(Instance) 집합 즉 지식베이스(Knowledge base)에서 새로운 지식을 발견해 내는 작업이다. 이러한 복잡한 형태의 추론이 이루어지기 위해서는 대상이 되는 인스턴스(Instance) 집합이 매우 정교하게 표현되어야 하며, 오류가 있어서는 안 된다.

그러나 분야별 전문가는 말 그대로 자신의 분야에 전문적인 지식과 경험을 가지고 있는 사람으로서, 이러한 사람들에게 인공 지능의 로직(Logic)에 기반한 지식표현 방법을 익히게 하고 이를 활용하여 자신의 머릿속에 있는 지식을 표현하게 하는 작업 자체가 쉽지 않은 단점이 있다.

또한, 종래의 지식베이스는 복잡하고 비효율적인 추론기능을 가지므로, 그 결과물들이 사용자에게 만족감을 주지 못하고, 제대로 활용되지 못하는 단점이 있다.

따라서, 본 발명의 목적은 특정 분야에서 이미 일정 수준에 올라와 있는 전문가를 활용하여 연구 시작 초기에서 발생하는 신진 연구자들의 어려움을 덜어줄 수 있도록 사용자의 현재 지식 수준과 목표수준을 기반으로 한 직관적인 지식베이스를 구축하는 지식베이스 구축 방법 및 그 서버를 제공하는데 있다.

본 발명의 다른 목적은 전통적인 인공지능에서 주장하는 복잡하고 비효율적인 추론 기능을 포기하고 직관적이고 구축하기 쉬운 지식베이스를 제공할 수 있는지식베이스 구축 방법 및 그 서버를 제공하는데 있다.

본 발명의 또 다른 목적은 분야 전문가들이 가지고 있는 특정 자원에 대한 난이도 정보, 현재 분야의 하부요소 분야들에 대한 연구 순서에 대한 지식 등을 직접 지식베이스에 표현할 수 있는 지식베이스 구축 방법 및 그 서버를 제공하는데 있다.

본 발명의 또 다른 목적은 분야 전문가로 하여금 자신의 전문 지식을 쉽게 표현할 수 있게 도와주며, 사용자는 연구를 수행하는데 필요한 가장 필수적인 정보를 얻을 수 있는 지식베이스 구축 방법 및 그 서버를 제공하는데 있다.

상기 목적들을 달성하기 위하여 본 발명의 일 측면에 따르면, 지식베이스 구축 방법에 있어서, (a)스키마 항목을 정의하는 단계, (b)파일, 난이도 및 도달 목 표 중 적어도 하나를 포함하는 자원 정보가 입력되면, 그 자원 정보에 대한 고유한 식별자를 생성하는 단계, (c)상기 입력된 자원 정보를 분석하여 속성 정보를 추출하는 단계 및 (d)상기 추출된 각 속성 정보를 상기 정의된 스키마 항목에 따라 연관 관계를 설정하여 저장하는 단계를 포함하는 것을 특징으로 하는 지식베이스 구축 방법이 제공된다.

상기 스키마 항목은 RDF 기반의 스키마 항목이고, 상기 스키마 항목은 자원을 분류하는 모클래스, 각 모클래스의 세부 유형인 자식 클래스, 각 자식 클래스에 포함되는 속성 목록으로 구성된다.

상기 파일은 논문, 도서, 웹문서 중 적어도 하나를 포함하고, 상기 난이도는 상기 파일에 대한 난이도로서 easy, medium, difficult 중 하나이고, 상기 도달 목표는 특정 분야에서의 최종 목표로서, skin-deep, basic, advanced 중 하나이다.

상기 (b)단계는, 지식베이스 구축 명령이 입력되면, 자원 정보 입력 화면을 디스플레이하고, 상기 자원 정보 입력 화면을 통해 파일, 난이도, 도달 목표를 포함하는 자원 정보가 입력되면, 상기 자원 정보에 대한 고유한 식별자를 생성하여 부여하는 것을 포함한다.

상기 (c)단계는 상기 자원 정보를 분석하여 상기 스키마 항목에 의해 미리 정의되어 있는 속성 목록에 해당하는 속성과 그 값을 추출하는 것을 말한다.

상기 (d)단계는 상기 추출된 각 속성 정보에 대해 상기 정의된 스키마 항목에 따라 해당하는 자식 클래스와의 연관관계를 설정하고, 상기 자식 클래스와 연관된 모클래스와의 연관관계를 설정하는 것을 말한다.

본 발명의 다른 측면에 따르면, 지식베이스를 구축하는 지식베이스 구축 서버에 있어서, 파일, 난이도 및 도달목표를 포함하는 자원 정보를 입력받는 자원 정보 수신부, 상기 자원 수신부를 통해 자원 정보가 입력되면, 상기 자원 정보에 대한 고유한 식별자를 생성하여 부여하는 자원 식별자 생성부, 상기 자원 정보 수신부에서 수신된 자원 정보를 분석하여 미리 정의된 스키마 항목에서 정의된 속성 목록에 속하는 속성과 그 값을 포함하는 속성 정보를 추출하는 속성 정보 추출부 및 상기 속성 정보 추출부에서 추출된 각 속성 정보에 대해 미리 정의된 스키마 항목을 이용하여 연관 관계를 설정한 후 상기 자원 식별자 생성부에서 생성된 식별자와 맵핑시켜 저장하는 연관 관계 설정부를 포함하는 것을 특징으로 하는 지식베이스 구축 서버가 제공된다.

상기 연관 관계 설정부는 상기 속성 정보 추출부에서 추출된 각 속성 정보에 대해 해당하는 자식 클래스와의 연관관계를 설정하고, 상기 자식 클래스와 연관된 모클래스와의 연관관계를 설정한다.

따라서, 본 발명은 특정 분야에서 이미 일정 수준에 올라와 있는 전문가를 활용하여 연구 시작 초기에서 발생하는 신진 연구자들의 어려움을 덜어줄 수 있도록 사용자의 현재 지식 수준과 목표수준을 기반으로 한 직관적인 지식베이스를 구축할 수 있는 지식베이스 구축 방법 및 그 서버를 제공할 수 있다.

또한, 분야 전문가들이 가지고 있는 특정 자원에 대한 난이도 정보, 현재 분 야의 하부 요소 분야들에 대한 연구 순서에 대한 지식 등을 직접 지식베이스에 표현할 수 있는 지식베이스 구축 방법 및 그 서버를 제공할 수 있다.

또한, 분야 전문가로 하여금 자신의 전문 지식을 쉽게 표현할 수 있게 도와주며, 사용자는 연구를 수행하는데 필요한 가장 필수적인 정보를 얻을 수 있는 지식베이스 구축 방법 및 그 서버를 제공할 수 있다.

본 발명의 전술한 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다.

도 1은 본 발명에 따른 지식 베이스 구축 시스템의 구성을 나타낸 도면이다.

도 1을 참조하면, 지식 베이스 구축 시스템은 지식 전문가가 자원 정보를 입력하는 클라이언트(100), 상기 클라이언트(100)로부터 전송된 자원 정보를 이용하여 지식베이스를 구축하는 지식베이스 구축 서버(110)를 포함한다.

상기 클라이언트(100)는 유선 통신 단말기, 무선 통신 단말기 등을 포함할 수 있다.

상기 클라이언트(100)는 지식 전문가에 의해 파일, 난이도, 도달 목표 등을 포함하는 자원 정보가 입력되면, 상기 입력된 자원 정보를 통신망을 통해 상기 지식베이스 구축 서버(110)에 전송한다.

상기 지식베이스 구축 서버(110)는 상기 클라이언트(100)로부터 자원 정보가 수신되면, 상기 자원 정보를 분석하여 미리 정의된 RDF 스키마 항목에 따라 속성 정보를 추출하고, 상기 추출된 각 속성 정보에 대하여 연관 관계를 설정하여 지식베이스를 구축하는 역할을 수행한다.

여기서, 상기 지식베이스(Knowledge Base)는 신규 연구자가 특정 분야에서 연구를 시작하는데 필요한 필수 정보를 포함한다.

상기 지식베이스를 구축하기 전에 상기 지식베이스 구축 서버(110)에는 전체 구성요소에 대한 정형화(formalization) 즉, RDF 스키마 항목이 정의되어 있다.

즉, 지식 베이스(

)는 수학식 1과 같이 가상의 집합

에 속하는 요소들의 집합으로 표현할 수 있다.

여기서,

은 특정 전문 분야를 구성하는 자원(resource) 집합으로서, 자원 식별자(I), 연관 관계(C), 자원 난이도(Resource Difficulty)(D), 사용자 도달 목표(G), 대상 개체(O)로 구성된다.

자원 식별자 집합(I)은 특정 지식베이스 내에 존재하는 모든 자원을 구별할 수 있는 단일 식별자들의 집합이다. 이 집합의 원소를 표현하는 방법은 매우 다양할 수 있다. 예를 들어, 시맨틱 웹의 핵심 프레임워크인 RDF는 이를 위한 표현 방법으로 URI(Uniform Resource Identifier)를 채택하고 있다.

연관 관계 집합(C)은 두 개의 개체를 연결시켜주는 관계정보들을 그 원소로 포함하고 있다.

상기 자원 난이도(Resource Difficulty)는 분야 전문가들이 판단할 수 있는 현재 자원의 내용적 수준이다. 예를 들어, 특정 분야에 대한 서적을 살펴보면, 같은 분야라고 하더라도 '~의 기초(Introduction to ~)', '기본 ~(Elementary ~)'과 같은 제목의 서적은 모두 난이도가 낮은 편에 속하는 자원이라고 볼 수 있다.

반대로 그 분야에서 최근에 만들어진 이론이나 아이디어를 집필한 서적 혹은 동일 분야에서 상위 수준으로 판단되는 서적들에 대해서는 난이도가 높다고 가정한다.

사용자 도달목표(G)는 자원 난이도와 동일한 개념과 특성을 가진다. 차이점은 이것은 현재 사용자(신진 연구자)가 자신이 선택한 분야에서 도달하기 희망하는 난이도 수준으로 활용된다는 것이다. 자원 난이도와 사용자 도달목표는 다음과 같이 표현될 수 있다.

여기서, 괄호 안의 번호는 각 구성항목을 나타내는 식별자이다.

지식베이스 구축을 담당하는 분야 전문가는 각 요소 자원마다 자신이 판단한 대로 자원 난이도를 지정한다. 그리고, 구축된 지식베이스를 활용하는 사용자는 자신의 도달 목표 수준을 입력함으로써, 현재 자신이 필수적으로 참조해야 할 자원을 탐색할 수 있다.

마지막으로 대상 객체 집합(O)은 자원 식별자와 관계정보로 연결되는 목적 개체(objective resource)들을 그 원소로 포함하고 있는 집합으로서, 수학식 2와 같다.

여기서

는 특정 개체를 표현할 수 있는 자연언어(natural language)로 구성된 모든 가능한 문자열 집합이다. 다시 말해서, 대상 객체 집합은 자원을 식별하고 지시하는데 쓰일 수 있는 식별자 집합과 이 문어적 자연언어집합 (literary language set)의 합집합이라고 볼 수 있다. 이는 다수의 개체가 지식베이스에 존재할 때, 특정 개체가 다른 개체와 연관 관계정보로 연결되는 경우와 특정 개체에 대한 특성 지정(property description)이 동시에 가능하도록 대상 객체 집합을 정의하기 위함이다.

상기와 같은 개별 개체들 사이의 관계는 함수(R)로 나타낼 수 있다. 이 함수는 수학식 3과 같이 자원 식별자(I), 연관 관계(C), 자원 난이도(Resource Difficulty)(D), 사용자 도달 목표(G)를 입력 받아서 그에 해당하는 대상 객체(O)를 출력한다.

R:I*C*D*G -> O

상기와 같은 역할을 수행하는 지식베이스 구축 서버(110)에 대한 상세한 설명은 도 2를 참조하기로 한다.

도 2는 본 발명에 따른 지식베이스 구축 서버의 구성을 개략적으로 나타낸 블럭도이다.

도 2를 참조하면, 지식베이스 구축 서버는 자원 정보 수신부(210), 자원 식별자 생성부(220), 속성 정보 추출부(230), 연관관계 설정부(240), 지식베이스(250)를 포함한다.

상기 자원 정보 수신부(210)는 사용자로부터 파일, 난이도, 도달목표 등을 포함하는 자원 정보를 입력받는 역할을 수행한다. 여기서, 상기 파일은 웹페이지, 웹페이지의 일정 부분, 도서, 논문 등을 말한다.

상기 자원 식별자 생성부(220)는 상기 자원 정보 수신부(210)를 통해 자원 정보가 입력되면, 상기 자원 정보에 대한 고유한 식별자를 생성하여 부여한다. 여기서, 상기 식별자는 예를 들면 URI일 수 있다. 즉, 각 자원 항목에 고유의 URI가 부착되고, 특성 정보들도 속성 형태로 표현되어 모든 자원은 URI로서 식별되므로, 상기 자원 식별자 생성부(220)는 상기 자원 정보에 대하여 고유한 URI를 생성한다.

상기 속성 정보 추출부(230)는 상기 자원 정보를 분석하여 속성을 추출하고, 상기 추출된 각 속성과 매칭되는 값을 추출한다.

즉, 상기 속성 정보 추출부(230)는 상기 자원 정보를 분석하여 미리 정의된 RDF 스키마 항목에서 정의된 속성 목록에 속하는 속성과 그 속성의 값을 추출한다.

상기 RDF 스키마 항목은 자원을 분류하는 모 클래스, 모 클래스의 세부 유형인 자식 클래스, 각 자식 클래스에 포함되는 속성 목록 정보로 구성되어 있다. 따 라서, 상기 속성 정보 추출부(230)는 상기 자원 정보를 분석하여 상기 속성 목록 정보에 속하는 속성을 추출하고, 그 추출된 속성에 대한 값을 추출한다.

예를 들어, 입력된 자원 정보가 논문 및 난이도를 포함하고, RDF 스키마 항목에 정의된 자식 클래스에 포함되는 속성 목록이 pub_Title, pub_Author, pub_Tech, pub_Year, difficulty_Level, person_HomePage, person_Name, tech_Area, download_Link이면, 상기 속성 정보 추출부(230)는 상기 자원 정보에서 pub_Title, pub_Author, pub_Tech, pub_Year, difficulty_Level, download_Link의 속성과 그 값을 추출하게 된다.

그런 다음 상기 속성 정보 추출부(230)는 상기 추출된 속성과 그 값을 포함하는 속성 정보를 상기 연관 관계 설정부(240)에 전송한다.

상기 연관 관계 설정부(240)는 상기 속성 정보 추출부(230)에서 추출된 각 속성 정보를 미리 정의된 RDF 스키마 항목을 이용하여 연관 관계를 설정하여 저장한다. 그러면, 지식베이스가 구축되게 된다.

즉, 상기 연관 관계 설정부(240)는 상기 속성 정보 추출부(230)에서 추출된 각 속성 정보에 대해 해당하는 자식 클래스를 판단하여 그 자식 클래스와 연관관계를 설정하고, 상기 자식 클래스를 포함하는 모 클래스와 연관관계를 설정하여 상기 지식베이스(250)에 저장한다.

도 3은 본 발명에 따른 지식베이스 구축 방법을 나타낸 흐름도, 도 4는 본 발명에 따른 RDF 스키마 항목 예시도를 나타낸 도면이다.

도 3을 참조하면, 지식베이스 구축 서버는 지식베이스를 구축하기 위하여 먼저 RDF 스키마 항목을 정의한다(S300).

상기 RDF 스키마 항목은 RDF 인스턴스 집합, 즉 지식베이스를 표현하는데 필요한 요소 항목들을 말하는 것으로서, 도 4를 참조하여 설명하기로 한다.

도 4를 참조하면, RDF 스키마 항목은 유형별로 '사람(Person)', '저작물(Publication)', '기술(Technology)' 의 총 3 개의 모 클래스로 구성되어 있으며, 각 모클래스마다 세부 유형을 나타내는 자식 클래스가 존재한다. 그리고 각 자식 클래스는 각 클래스에 속하는 인스턴스를 나타내는 속성 목록 정보가 포함되어 있다.

예를 들어, 'Publication' 클래스의 자식 클래스인 'Book' 클래스는 책 제목에 해당하는 'pub_Title', 저자에 해당하는 'pub_Author' 등과 같은 속성 집합을 가지고 있고 이들 속성은 연관 관계 집합의 원소라고 볼 수 있다.

이와 같은 직접적으로 보이는 연관 관계 정보 외에, 'Publication'과 'Paper'는 부모-자식 관계라는 식의 내재된 연관 관계도 역시 존재한다.

속성 집합 중에서 'difficulty_Level' 는 현재 자원의 난이도 정보를 표시할 수 있는 슬롯이다. 지식베이스를 구축하는 분야 전문가가 직접 현재 구축 대상 자원의 난이도를 판단하여 이 슬롯에 값을 표기하게 된다.

상기와 같이 RDF 스키마 항목이 정의된 후 파일 및 난이도를 포함하는 자원 정보가 입력되면(S302), 상기 지식베이스 구축 서버는 상기 자원 정보를 분석하여 상기 정의된 RDF 스키마 항목에 따라 속성 정보를 추출하고 상기 추출된 각 속성 정보에 대해 연관관계를 설정한다(S304).

상기 지식베이스 구축 서버가 RDF 스키마 항목에 따라 속성 정보를 추출하고, 그 속성 정보에 대해 연관관계를 설정하는방법에 대한 상세한 설명은 도 5를 참조하기로 한다.

상기 단계 304가 수행되면, 상기 지식베이스 구축 서버는 상기 연관 관계가 설정된 정보를 저장하여 지식베이스를 구축한다(S306).

도 5는 본 발명에 따른 RDF 스키마 항목에 따른 지식베이스 구축 방법을 나타낸 흐름도, 도 6은 본 발명에 따른 자원 정보 입력 화면 예시도이다.

도 5를 참조하면, 지식베이스 구축 서버는 자원 정보를 입력받으면(S500), 상기 자원 정보에 대하여 고유한 URI를 생성하여 부여한다(S502).

즉, 사용자가 논문에 대하여 지식베이스를 구축하기를 원하여 지식베이스 구축 명령을 입력하면, 상기 지식베이스 구축 서버는 도 6과 같은 자원 정보 입력 화면(600)을 제공한다.

상기 자원 정보 입력 화면(600)에는 파일 입력 영역(610), 난이도 입력 영역(620), 도달 목표 입력 영역(630)이 존재한다.

상기 사용자는 상기 파일 입력 영역(610)에서 웹페이지, 도서, 논문 등을 입력한다. 해당 파일이 웹페이지이면, 웹페이지 주소를 입력하고, 논문이면, 논문을 불러와서 저장한다.

상기 난이도 입력 영역(620)에는 해당 파일의 난이도를 입력하는 영역으로 서, easy, medium, difficult 중 하나를 입력한다.

상기 도달 목표 입력 영역(630)에는 특정 분야에서 도달하기 희망하는 최종 목표를 입력하는 영역으로서, skin-deep, basic, advanced 중 하나를 입력한다. 상기 skin-deep은 자원 난이도 수준이 'easy'에 해당하는 자원만 필요하고, 상기 basic은 자원 난이도 수준이 'easy', 'medium'에 해당하는 자원 필요, 상기 advanced는 자원 난이도 수준이 'esay', 'medium', 'difficult' 모두에 해당하는 자원이 필요하다.

상기와 같이 자원 정보 입력 화면(600)을 통해 자원 정보가 입력되면, 상기 지식베이스 구축 서버는 상기 자원 정보의 식별을 위한 고유한 URI를 생성하여 부여한다.

그런 다음 상기 지식베이스 구축 서버는 상기 자원 정보를 분석하여 속성을 추출한다(S504). 즉, 속성 목록은 RDF 스키마 항목에 의해 미리 정의되어 있으므로, 상기 지식베이스 구축 서버는 상기 자원 정보를 분석하여 상기 RDF 스키마 항목에 정의된 속성 목록에 해당하는 속성을 추출한다.

그런 다음 상기 지식베이스 구축 서버는 상기 추출된 속성에 해당하는 값을 추출한다(S506).

예를 들어, 자원 정보에 포함된 파일이 논문인 경우, 상기 지식베이스 구축 서버는 그 논문을 분석하여 저자에 대하여 person_HomePage, person_Name, tech_Area를 추출하고, 논문 내용에서 pub_Title, pub_Author, pub_Tech, pub_Year 등을 추출, 상기 자원 정보에서 난이도와 도달 목표를 포함하는 속성과 그 값을 추 출한다.

그런 다음 상기 지식베이스 구축 서버는 미리 정의된 RDF 스키마 항목에 따라 각 속성의 연관관계를 설정한다(S508).

즉, 상기 RDF 스키마 항목은 자원을 분류하는 모클래스, 각 모 클래스의 세부 유형인 자식 클래스, 각 자식 클래스에 포함되는 속성 목록으로 구성된다. 따라서, 상기 지식베이스 구축 서버는 상기 추출된 각 속성에 대해 해당하는 자식 클래스와의 연관관계를 설정하고, 상기 자식 클래스와 연관된 모클래스와의 연관관계를 설정한다.

예를 들어, RDF 스키마 항목이 도 4와 같이 정의된 경우, 상기 지식베이스 구축 서버는 각 속성을 자식 클래스와 연결시키고, 그 자식 클래스와 연관된 모클래스로 연결한다. 즉, 'Publication'클래스의 자식 클래스인 'Book' 클래스는 책 제목에 해당하는 'pub_Title', 저자에 해당하는 'pub_Author' 등과 같은 속성집합을 가지고 있다.

단계 508과 같이 연관관계가 설정되면, 상기 지식베이스 구축 서버는 상기 연관관계가 설정된 정보를 상기 생성된 URI와 맵핑시켜 저장한다(S510). 그러면, 지식베이스가 구축되게 된다.

이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예 시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

도 1은 본 발명에 따른 지식 베이스 구축 시스템의 구성을 나타낸 도면.

도 2는 본 발명에 따른 지식베이스 구축 서버의 구성을 개략적으로 나타낸 블럭도.

도 3은 본 발명에 따른 지식베이스 구축 방법을 나타낸 흐름도.

도 4는 본 발명에 따른 RDF 스키마 항목 예시도를 나타낸 도면.

도 5는 본 발명에 따른 RDF 스키마 항목에 따른 지식베이스 구축 방법을 나타낸 흐름도.

도 6은 본 발명에 따른 자원 정보 입력 화면 예시도.

<도면의 주요 부분에 대한 부호의 설명>

100 : 클라이언트 110 : 지식베이스 구축 서버

210 : 자원 정부 수신부 220 : 자원 식별자 생성부

230 : 속성 정보 추출부 240 : 연관관계 설정부

250 : 지식베이스

Claims

지식베이스 구축 방법에 있어서,

(a)RDF(Resource Description Framework)기반의 스키마 항목을 정의하는 단계;

(b)파일, 난이도 및 도달 목표 중 적어도 하나를 포함하는 자원 정보가 입력되면, 그 자원 정보에 대한 고유한 식별자를 생성하여 부여하는 단계;

(c)상기 입력된 자원 정보를 분석하여 속성 정보를 추출하는 단계;및

(d)상기 추출된 각 속성 정보를 상기 정의된 스키마 항목에 따라 연관 관계를 설정하여 저장하는 단계

를 포함하는 것을 특징으로 하는 지식베이스 구축 방법.
삭제
제1항에 있어서,

상기 스키마 항목은 자원을 분류하는 모클래스, 각 모클래스의 세부 유형인 자식 클래스, 각 자식 클래스에 포함되는 속성 목록 정보로 구성된 것을 특징으로 하는 지식베이스 구축 방법.
제1항에 있어서,

상기 파일은 논문, 도서, 웹문서 중 적어도 하나를 포함하는 것을 특징으로하는 지식베이스 구축 방법.
제1항에 있어서

상기 난이도는 상기 파일에 대한 난이도로서 easy, medium, difficult 중 하나인 것을 특징으로 하는 지식베이스 구축 방법.
제1항에 있어서

상기 도달 목표는 특정 분야에서의 최종 목표로서, skin-deep, basic, advanced 중 하나인 것을 특징으로 하는 지식베이스 구축 방법.
제1항에 있어서

상기 (b)단계는,

지식베이스 구축 명령이 입력되면, 자원 정보 입력 화면을 디스플레이하는 단계;

상기 자원 정보 입력 화면을 통해 파일, 난이도, 도달 목표를 포함하는 자원 정보가 입력되면, 상기 자원 정보에 대한 고유한 식별자를 생성하여 부여하는 단계 를 포함하는 것을 특징으로 하는 지식베이스 구축 방법.
제1항에 있어서

상기 (c)단계는 상기 자원 정보를 분석하여 상기 스키마 항목에 의해 미리 정의된 속성 목록 정보에 해당하는 속성과 그 값을 추출하는 것을 특징으로 하는 지식베이스 구축 방법.
제1항에 있어서

상기 (d)단계는 상기 추출된 각 속성 정보에 대해 상기 정의된 스키마 항목에 따라 해당하는 자식 클래스와의 연관관계를 설정하고, 상기 자식 클래스와 연관된 모클래스와의 연관관계를 설정하는 것을 특징으로 하는 지식베이스 구축 방법.
지식베이스를 구축하는 지식베이스 구축 서버에 있어서,

파일, 난이도 및 도달목표를 포함하는 자원 정보를 입력받는 자원 정보 수신부;

상기 자원 정보 수신부를 통해 자원 정보가 입력되면, 상기 자원 정보에 대한 고유한 식별자를 생성하여 부여하는 자원 식별자 생성부;

상기 자원 정보 수신부에서 수신된 자원 정보를 분석하여 미리 정의된 스키마 항목에서 정의된 속성 목록에 해당하는 속성과 그 값을 포함하는 속성 정보를 추출하는 속성 정보 추출부;및

상기 속성 정보 추출부에서 추출된 각 속성 정보에 대해 미리 정의된 스키마 항목을 이용하여 연관 관계를 설정한 후 상기 자원 식별자 생성부에서 생성된 식별자와 맵핑시켜 저장하는 연관 관계 설정부

를 포함하는 것을 특징으로 하는 지식베이스 구축 서버.
제10항에 있어서,

상기 스키마 항목은 RDF 기반의 스키마 항목인 것을 특징으로 하는 지식베이스 구축 서버.
제10항에 있어서,

상기 스키마 항목은 자원을 분류하는 모클래스, 각 모클래스의 세부 유형인 자식 클래스, 각 자식 클래스에 포함되는 속성 목록으로 구성된 것을 특징으로 하는 지식베이스 구축 서버.
제10항에 있어서,

상기 연관 관계 설정부는 상기 속성 정보 추출부에서 추출된 각 속성 정보에 대해 해당하는 자식 클래스와의 연관관계를 설정하고, 상기 자식 클래스와 연관된 모클래스와의 연관관계를 설정하는 것을 특징으로 하는 지식베이스 구축 서버.