KR20140047952A - 지식베이스 구축장치 및 이의 지식베이스 구축방법 - Google Patents

지식베이스 구축장치 및 이의 지식베이스 구축방법 Download PDF

Info

Publication number
KR20140047952A
KR20140047952A KR1020120114352A KR20120114352A KR20140047952A KR 20140047952 A KR20140047952 A KR 20140047952A KR 1020120114352 A KR1020120114352 A KR 1020120114352A KR 20120114352 A KR20120114352 A KR 20120114352A KR 20140047952 A KR20140047952 A KR 20140047952A
Authority
KR
South Korea
Prior art keywords
knowledge
unit
knowledge base
basic
base
Prior art date
Application number
KR1020120114352A
Other languages
English (en)
Other versions
KR101473982B1 (ko
Inventor
조준면
김명은
이무훈
염정남
김형우
유정주
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020120114352A priority Critical patent/KR101473982B1/ko
Publication of KR20140047952A publication Critical patent/KR20140047952A/ko
Application granted granted Critical
Publication of KR101473982B1 publication Critical patent/KR101473982B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Abstract

본 발명은 지식베이스 구축장치 및 이의 지식베이스 구축방법에 관한 것으로, 일부 기본 지식만을 포함하는 단위 지식베이스를 여러 개 생성하여 독립적으로 추론을 수행한 후 병합하여 최종 지식베이스를 구축함으로써 간편하고 빠르게 지식베이스를 구축할 수 있도록 한 것이다.

Description

지식베이스 구축장치 및 이의 지식베이스 구축방법{Knowledge base generating apparatus and knowledge base generating method thereof}
본 발명은 지식베이스(knowledge base) 구축 기술에 관련한 것으로, 특히 온톨로지(ontology) 기반의 지식베이스 구축장치 및 이의 지식베이스 구축방법에 관한 것이다.
정보 검색의 대표적인 형태인 웹 검색 엔진은 키워드 기반 검색 기법을 기반으로 하고 있으며, 웹상의 문서들을 수집하여, 해당 문서에서 출현 빈도가 높은 단어들을 인덱싱하고, 사용자가 입력한 키워드와 일치하는 단어를 많이 포함하고 있는 문서의 위치를 찾아주는 방식이다.
이러한 키워드 기반 정보 검색 기술은 사용자가 입력한 키워드의 의미는 고려하지 않고 사용자가 입력한 키워드와 동일한 키워드를 포함하는 문서만을 찾아주는 방식이기 때문에 키워드를 포함하는 문서를 빠짐없이 찾아주는 재현율(recall rate)은 높지만, 사용자가 입력한 키워드와 정확히 의미가 일치하는 문서를 찾아주는 정확율(precision rate)은 낮을 수밖에 없다.
이러한 문제점을 해결하기 위해, 국내공개특허 제10-2011-0125872호(2011. 11. 22) 등에서 제시한 바와 같은 의미 기반 검색(semantic search) 기술이 등장하게 되었다. 의미 기반 검색 기술과 키워드 기반 검색 기술의 가장 큰 차이점은, 인덱스의 구조에서 찾을 수 있다.
키워드 기반 검색 기술은 형태소 분석 등의 과정을 통해 문서로부터 키워드(토큰)를 추출해 내고, 이들을 해당 문서의 인덱스로 저장하게 된다. 반면에 의미 기반 검색 기술은 문서로부터 시맨틱 네트워크(semantic network)를 추출하고, 이를 그래프 구조로 지식베이스에 저장하고, 검색시에는 지식베이스에 질의하는 방식을 취하게 된다. 따라서, 검색 결과가 해당 문서일 수도 있으며, 해당 문서가 기술하고 있는 개체일 수도 있다.
매우 다양한 관점의 의미 기반 검색 기술이 개발되고 있으나, 의미 기반 검색 기술은 시맨틱 네트워크로 정보가 표현되도록 재구성되어 지식 베이스에 저장되고, 질의하는 형태를 가진다.
시맨틱 네트워크는 개념(concept)과 개념간의 관계가 표현된 지식 표현 방법 중 하나이다. 따라서, 의미 기반 검색에서는 검색 대상이 되는 개체(웹 문서 자체일 수도 있으며, 웹 문서가 기술하고 있는 영화, 사람 등의 사물일 수도 있음) 관련 정보(메타데이터)를 웹 문서에서 추출하고 추출된 정보를 시맨틱 네트워크 형태로 표현하여 지식베이스를 구축하는 과정이 매우 중요하다.
키워드 기반 검색 기술에서 지식베이스를 구축할 때는 추출된 명시적 (explicit)인 메타 데이터부터 논리적으로 유도 가능한 암묵적(implicit) 지식까지 모든 지식을 직접 생성하여 지식베이스 내에 표현하였다.
국내공개특허 제10-2011-0125872호(2011. 11. 22)
의미 기반 검색 기술에서 지식베이스를 구축할 때 기본 지식에 해당되는 추출된 메타 데이터만을 지식베이스에 표현하고, 추론엔진이 기본 지식으로부터 유도 가능한 파생 지식을 논리적으로 추론하여 자동 추가한다면 작업이 간단해질 것이다.
한편, 논리추론에 필요한 시간은 일반적으로 추론의 기반이 되는 기본 지식의 양의 증가분에 대해 지수적으로 증가한다. 즉, 기본 지식의 양이 두배가 되면 추론에 걸리는 시간은 2의 지수 제곱배로 증가한다.
따라서, 일부 기본 지식만을 포함하는 지식 베이스를 여러 개 생성하여 독립적으로 추론을 수행한 후 병합하면 최종 지식베이스 구축 시간을 단축할 수 있을 것이다. 더 나아가 독립적 추론을 병렬적으로 처리하면 추가적인 이득을 볼 수 있을 것이다.
본 발명은 일부 기본 지식만을 포함하는 단위 지식베이스를 여러 개 생성하여 독립적으로 추론을 수행한 후 병합하여 최종 지식베이스를 구축함으로써 간편하고 빠르게 지식베이스를 구축할 수 있는 지식베이스 구축장치 및 이의 지식베이스 구축방법을 제공함을 그 목적으로 한다.
본 발명의 또 다른 목적은 여러개의 단위 지식베이스에 대한 추론을 병렬적으로 수행한 후 병합하여 최종 지식베이스를 구축함으로써 보다 간편하고 빠르게 지식베이스를 구축할 수 있는 지식베이스 구축장치 및 이의 지식베이스 구축방법을 제공하는 것이다.
상기한 목적을 달성하기 위한 본 발명의 일 양상에 따르면, 지식베이스 구축장치가 웹 문서들로부터 기본 지식들을 추출하는 기본 지식 추출부와; 기본 지식 추출부에 의해 추출된 기본 지식들을 기반으로 단위 지식베이스들을 생성하는 단위 지식베이스 생성부와; 단위 지식베이스 생성부에 의해 생성된 단위 지식베이스들에 포함되는 각 기본 지식에 연관된 파생 지식들을 추론하는 단위 지식베이스 추론부와; 단위 지식베이스 추론부에 의해 각 기본 지식에 연관된 파생 지식들이 추론된 단위 지식베이스들을 병합하여 최종의 지식베이스를 구축하는 지식베이스 구축부를; 포함하여 이루어지는 것을 특징으로 한다.
본 발명의 부가적인 양상에 따르면, 지식베이스 구축장치가 단위 지식베이스들에 포함되는 각 기본 지식에 연관된 파생 지식들을 추론시, 다수의 단위 지식베이스에 대해 병렬적으로 추론하는 것을 특징으로 한다.
본 발명은 일부 기본 지식만을 포함하는 단위 지식베이스를 여러 개 생성하여 독립적으로 추론을 수행한 후 병합하여 최종 지식베이스를 구축함으로써 간편하고 빠르게 지식베이스를 구축할 수 있는 효과가 있다.
더 나아가, 본 발명은 여러개의 단위 지식베이스에 대한 추론을 병렬적으로 수행한 후 병합하여 최종 지식베이스를 구축함으로써 보다 간편하고 빠르게 지식베이스를 구축할 수 있는 효과가 있다.
도 1 은 본 발명에 따른 지식베이스 구축장치의 일 실시예의 구성을 도시한 블럭도이다.
도 2 는 본 발명에 따른 지식베이스 구축장치에 이한 지식베이스 온톨로지 구조의 일 예를 도시한 도면이다.
도 3 은 본 발명에 따른 지식베이스 구축방법의 일 실시예의 구성을 도시한 흐름도이다.
이하, 첨부된 도면을 참조하여 기술되는 바람직한 실시예를 통하여 본 발명을 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 기술하기로 한다.
본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명 실시예들의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
본 발명 명세서 전반에 걸쳐 사용되는 용어들은 본 발명 실시예에서의 기능을 고려하여 정의된 용어들로서, 사용자 또는 운용자의 의도, 관례 등에 따라 충분히 변형될 수 있는 사항이므로, 이 용어들의 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1 은 본 발명에 따른 지식베이스 구축장치의 일 실시예의 구성을 도시한 블럭도이다. 도 1 에 도시한 바와 같이, 이 실시예에 따른 지식베이스 구축장치(100)는 기본 지식 추출부(110)와, 단위 지식베이스 생성부(120)와, 단위 지식베이스 추론부(130)와, 지식베이스 구축부(140)를 포함하여 이루어진다.
기본 지식 추출부(110)는 웹 문서들로부터 기본 지식들을 추출한다. 웹 문서는 네트워크로부터 수집될 수 있다. 여기서, 추론에 의해 유도되지 않는 명시적인(explicit) 지식을 기본 지식이라 하고, 추론에 의해 유도되는 암묵적인(implicit) 지식은 파생 지식이라 한다.
최근 지식베이스 구축에 가장 많이 활용되는 W3C에서 표준으로 제안한 웹 온톨로지 언어(OWL : Web Ontology Language)는 클래스(class), 개체(individual), 속성(property)으로 구성된다.
클래스(class)는 개념(concept)이라고도 표현되며, 개념적으로 같은 단어들의 집합을 표현할 수 있는 대표 용어를 말한다. 예를들면, '컴퓨터' 개념은 하위 개념으로 'pc', '워크스테이션'등이 될 수 있다.
개체(individual)는 인스턴스(instnce)라고도 표현되며, 클래스에 포함되지 않는 용어를 말한다. 예를들면, '사람'은 클래스이지만 '사람 이름'은 개체이다.
속성(property)은 관계(relation)라고도 표현되며, 두 용어간의 관계를 설명하기 위해 사용된다.
지식은 주어(subject), 서술어(predicate), 목적어(object)로 구성된 트라이플(triple)들의 집합으로 표현된다. 그리고, 여러 트라이플들이 연결되어 시맨틱 네트워크(semantic network)가 구성된다.
예를들면, 배우 'AAA'가 영화에서 부당거래를 연출했다는 지식은 "AAA(subject) - 연출하다(predicate) - 부당거래(object)", "AAA - instanceOf(관계) - 사람", "부당거래 - instanceOf(관계) - 영화" 등의 트라이플들로 표현할 수 있다.
의미 기반 검색(semantic search)에서는 사용자가 "AAA 연출 영화"라는 키워드 검색문을 입력하면, 검색 시스템이 사용자 키워드와 지식 베이스 개체간 매핑을 통해 "AAA"과 "연출하다" 그리고 "영화" 클래스의 인스턴스를 포함하는 부분 시맨틱 네트워크(즉, 트라이플의 집합)를 탐색/추출하여 "부당거래"를 검색 결과로 제공하게 된다.
본 발명에 따른 지식베이스 구축장치(100)는 이러한 의미 기반 검색을 위한 지식 베이스를 생성하기 위한 것으로, 먼저 기본 지식 추출부(110)를 통해 웹 문서들로부터 추론에 의해 유도되지 않는 명시적인(explicit) 지식인 기본 지식들을 추출한다.
웹 문서는 영화, 사람 등 어떤 대상 또는 개체에 대한 다양한 데이터를 HTML 태그(Tag)를 이용하여 기술할 수 있으며, 사람에게 일목요연하게 보여주기 위해 특정 데이터에 특정 HTML 태그를 사용할 수 있다.
예를 들면, 영화에 대한 정보를 제공하는 웹 문서의 경우, 영화제목, 감독, 주연배우, 장르, 주제 등에 대한 정보를 포함할 수 있으며, 각각의 정보를 다음과 같은 HTML의 'meta' 태그 등을 사용해 설명할 수 있다.
<meta name="Subject" content="홈페이지 주제 입력" />
<meta name="Title" content="홈페이지 이름 입력" />
<meta name="Description" content="설명문 입력" />
<meta name="Keywords" content="키워드 입력" />
<meta name="Author" content="만든사람 이름" />
<meta name="Publisher" content="만든단체/회사 이름" />
<meta name="Other Agent" content="웹책임자 이름" />
<meta name="Classification" content="카테고리위치(분류)" />
<meta name="Generator" content="생성프로그램(에디터)" />
<meta name="Reply-To(Email)" content="메일주소 입력" />
<meta name="Filename" content="파일이름 입력" />
<meta name="Author-Date(Date)" content="제작일" />
<meta name="Location" content="위치" />
<meta name="Distribution" content="배포자" />
<meta name="Copyright" content="저작권" />
따라서, 기본 지식 추출부(110)는 웹 문서에서 'meta' 태그 등과 같은 특정 태그를 이용하여 기본 지식들을 기계적으로 추출할 수 있다. 기본 지식 추출부(110)에 의해 추출된 기본 지식 데이터는 테이블 형태의 관계형 데이터베이스(relational database)로 저장할 수 있다.
만약, 기본 지식이 웹 온톨로지 언어(OWL : Web Ontology Language)의 프리미티브 클래스(Primitive Class)로 선언되고, 파생 지식은 웹 온톨로지 언어(OWL : Web Ontology Language)의 디파인드 클래스(Defined Class)로 선언되었다고 가정하면, 기본 지식 추출부(110)가 웹 문서의 메타(Meta) 데이터로부터 프리미티브 클래스로 선언된 기본 지식 및 기본 지식에 정의된 속성(property)을 추출하도록 구현될 수 있다.
예컨대, 기본 지식 추출부(110)는 메타 데이터 추출부(111)와, 텍스트 분석부(112)와, 기본 지식 저장부(113)를 포함할 수 있다.
메타 데이터 추출부(111)는 웹 사이트 등에서 수집된 웹 문서를 저장하는 웹 문서 저장DB에 저장된 웹 문서로부터 메타 데이터를 추출한다.
텍스트 분석부(112)는 메타 데이터 추출부(111)에 의해 추출된 메타 데이터로부터 비정형 텍스트를 분석하여, 비정형 텍스트가 아닌 기본 지식들을 추출한다.
기본 지식 저장부(113)는 텍스트 분석부(112)에 의해 추출된 기본 지식들의 중복성을 체크하여, 중복되지 않는 기본 지식들을 기본 지식DB에 저장한다.
단위 지식베이스 생성부(120)는 기본 지식 추출부(110)에 의해 추출된 기본 지식들을 기반으로 단위 지식베이스들을 생성하여 단위 지식베이스 DB에 저장한다. 이 때, 단위 지식베이스는 전체 검색 대상이 아닌 일부 검색 대상에 대한 기본 지식들만을 포함하는 지식베이스를 말한다.
예컨대, 단위 지식베이스 생성부(120)를 통해 1000개의 웹 문서에 대해서 10개씩 나누어 각각 10개의 웹문서들에 대한 기본 지식들만을 포함하는 100개의 단위 지식베이스를 생성하도록 구현될 수 있다.
예를 들면, 배우 'AAA'가 주연으로 출연한 영화 'BBB'에 관련된 정보를 포함하는 어떤 단위 지식베이스에는 도 2 에 도시한 지식베이스 온톨로지에 따라, "사람" 클래스의 인스턴스로 "AAA"가 생성되고, 기본 프라퍼티인 "주연"을 이용하여 "AAA - 주연 - BBB"와 같은 명시적인(explicit) 지식인 기본 지식이 포함될 수 있다.
이후, 이러한 명시적인 기본 지식으로부터 "AAA"는 "영화배우", "주연배우" 클래스의 인스턴스라는 암묵적인(implicit) 지식인 파생 지식이 추론되는데, 단위 지식베이스에는 명시적인 지식인 기본 지식만 포함되고, 암묵적인 지식인 파생 지식은 포함되지 않는다.
한편, 배우 'AAA'가 주연으로 출연한 또 다른 영화 'CCC'에 관련된 정보를 포함하는 또 다른 단위 지식베이스에는 "AAA - 주연 - CCC"와 같은 명시적인(explicit) 지식인 기본 지식이 포함될 수 있다.
추후, 이 두 단위 지식베이스는 각각 추론 과정을 통해 암묵적인 지식인 파생 지식이 추론된 후 병합되어 배우 'AAA"에 관련된 모든 지식이 하나의 지식 베이스로 통합되게 되어 최종 지식베이스를 생성하는 데 걸리는 시간을 단축하게 된다.
단위 지식베이스 추론부(130)는 단위 지식베이스 생성부(120)에 의해 생성된 단위 지식베이스들에 포함되는 각 기본 지식에 연관된 파생 지식들을 추론한다. 예를 들면, 위에 설명한 "AAA - 주연 - BBB"와 같은 명시적인(explicit) 지식인 기본 지식으로부터 단위 지식베이스 추론부(130)에 의해 "AAA"는 "영화배우", "주연배우" 클래스의 인스턴스라는 암묵적인(implicit) 지식인 파생 지식이 추론될 수 있다.
예컨대, 기본 지식들과, 각 기본 지식에 연관된 파생 지식 및 파생 지식 추론을 위한 속성(property)들이 정의되고, 기본 지식이 웹 온톨로지 언어(OWL : Web Ontology Language)의 프리미티브 클래스(Primitive Class)로 선언되고, 파생 지식은 웹 온톨로지 언어(OWL : Web Ontology Language)의 디파인드 클래스(Defined Class)로 선언되었다고 가정하면, 단위 지식베이스 추론부(130)가 스키마 모델링 정보 DB에 저장된 파생 지식 추론을 위한 속성(property)을 참조해 단위 지식베이스들에 포함되는 각 기본 지식에 연관된 파생 지식들을 추론하도록 구현될 수 있다.
이 때, 단위 지식베이스 추론부(130)가 프리미티브 클래스의 인스턴스로 생성된 것들 중에서 특정 속성(property) 값을 갖는 것들을 프리미티브 클래스의 인스턴스로 표현하여 각 기본 지식에 연관된 파생 지식들을 추론하도록 구현될 수 있다.
이렇게 구현함에 의해 추론을 통한 파생 지식 유도에 필요한 시간이 기본 지식의 양에 대해 지수적으로 증가하기 때문에 하나의 큰 크기의 지식베이스 전체를 추론하는 것보다 작은 크기의 여러 단위 지식베이스로 쪼개어 추론을 적용함으로써 전체적으로는 선형적인 추론 시간 단축 효과를 얻을 수 있다.
한편, 단위 지식베이스 추론부(130)가 단위 지식베이스들에 포함되는 각 기본 지식에 연관된 파생 지식들을 추론시, 다수의 단위 지식베이스에 대해 병렬적으로 추론하도록 구현하여, 파생 지식 추론시 속도를 더욱 향상을 할 수 있는 추가적인 이득을 가질 수 있다.
지식베이스 구축부(140)는 단위 지식베이스 추론부(130)에 의해 각 기본 지식에 연관된 파생 지식들이 추론된 단위 지식베이스들을 병합하여 최종의 지식베이스를 구축한다. 지식베이스 구축부(140)는 최종의 지식베이스를 지식 베이스 DB에 저장한다.
예컨대, 지식베이스 구축부(140)가 클래스(Class), 인스턴스(Individual) 및 속성(property)을 포함하는 모든 지식 개체가 고유한 식별자(URI : Uniform Resorce Identifier)를 가지는 URI 기반으로 단위 지식베이스들을 기계적으로 병합(merge)하도록 구현될 수 있다.
한편, 발명의 부가적인 양상에 따르면, 지식베이스 구축장치(100)가 지식베이스 스키마(Schema) 모델링부(150)를 더 포함할 수 있다. 지식베이스 스키마 모델링부(150)는 기본 지식들과, 각 기본 지식에 연관된 파생 지식 및 파생 지식 추론을 위한 속성(property)을 정의하고, 기본 지식들과, 각 기본 지식에 연관된 파생 지식 및 파생 지식 추론을 위한 속성(property)을 정의한 스키마 모델링 정보를 스키마 모델링 정보DB에 저장한다. 기본 지식 추출부(110)는 스키마 모델링 정보DB에 저장된 스키마 모델링 정보를 참조해 기본 지식을 추출한다.
예컨대, 지식베이스 스키마 모델링부(150)가 기본 지식은 웹 온톨로지 언어(OWL : Web Ontology Language)의 프리미티브 클래스(Primitive Class)로 선언하고, 파생 지식은 웹 온톨로지 언어(OWL : Web Ontology Language)의 디파인드 클래스(Defined Class)로 선언하도록 구현될 수 있다.
한편, 발명의 부가적인 양상에 따르면, 지식베이스 구축장치(100)가 웹 문서 수집부(160)를 더 포함할 수 있다. 웹 문서 수집부(160)는 네트워크로부터 웹 문서들을 수집한다.
본 발명은 기본 지식과 파생 지식을 구분하여 지식베이스 스키마(즉, 온톨로지)를 모델링하고, 웹 문서에서 추출된 메타데이터를 이용하여 기본 지식들을 포함하는 여러개의 단위 지식베이스를 생성하고, 각 단위 지식베이스에 대한 논리 추론을 통해 기본 지식들에 대한 파생 지식들을 추론하고, 이들을 병합하여 최종 지식베이스를 생성한다.
즉, 본 발명은 작은 크기의 단위 지식베이스를 여러 개 만들고, 이들 각각에 독립적으로, 더 나아가 병렬적으로 추론을 적용하여 파생 지식을 유도한 후 병합하여 최종 단일 지식베이스를 구축함으로써 대용량의 지식베이스를 빠르게 구축할 수 있다.
또한, 복잡한 파생 지식의 유도를 추론엔진 즉, 단위 지식베이스 추론부(130)가 담당함으로써 메타 데이터의 마이그레이션을 담당하는 웹 문서 수집부(160)의 복잡도를 크게 줄여 전체 장치 구현이 쉬워진다.
이상에서 설명한 바와 같은 본 발명에 따른 지식베이스 구축장치의 지식베이스 구축 동작을 도 3 을 통해 알아본다. 도 3 은 본 발명에 따른 지식베이스 구축방법의 일 실시예의 구성을 도시한 흐름도이다.
먼저, 스키마(Schema) 모델링단계(310)에서 지식베이스 구축장치가 기본 지식들과, 각 기본 지식에 연관된 파생 지식 및 파생 지식 추론을 위한 속성(property)을 정의한다. 기본 지식, 파생 지식 및 파생 지식 추론을 위한 속성 정의와 관련해서는 기 설명하였으므로, 중복 설명은 생략한다.
그 다음, 웹 문서 수집단계(320)에서 지식베이스 구축장치가 네트워크로부터 웹 문서들을 수집한다. 웹 문서 수집과 관련해서는 기 설명하였으므로, 중복 설명은 생략한다.
그 다음, 기본 지식 추출단계(330)에서 지식베이스 구축장치가 웹 문서들로부터 기본 지식들을 추출한다. 기본 지식 추출과 관련해서는 기 설명하였으므로, 중복 설명은 생략한다.
그 다음, 단위 지식베이스 생성단계(340)에서 지식베이스 구축장치가 기본 지식 추출단계(330)에 의해 추출된 기본 지식들을 기반으로 단위 지식베이스들을 생성한다. 단위 지식베이스 생성과 관련해서는 기 설명하였으므로, 중복 설명은 생략한다.
그 다음, 단위 지식베이스 추론단계(350)에서 지식베이스 구축장치가 단위 지식베이스 생성단계(340)에 의해 생성된 단위 지식베이스들에 포함되는 각 기본 지식에 연관된 파생 지식들을 추론한다. 파생 지식 추론과 관련해서는 기 설명하였으므로, 중복 설명은 생략한다.
그 다음, 지식베이스 구축단계(360)에서 지식베이스 구축장치가 단위 지식베이스 추론단계(350)에 의해 각 기본 지식에 연관된 파생 지식들이 추론된 단위 지식베이스들을 병합하여 최종의 지식베이스를 구축한다. 단위 지식베이스들의 병합과 관련해서는 기 설명하였으므로, 중복 설명은 생략한다.
따라서, 이와 같이 구현함에 의해 본 발명은 일부 기본 지식만을 포함하는 단위 지식베이스를 여러 개 생성하여 독립적으로 추론을 수행한 후 병합하여 최종 지식베이스를 구축함으로써 간편하고 빠르게 지식베이스를 구축할 수 있다.
더 나아가, 본 발명은 여러개의 단위 지식베이스에 대한 추론을 병렬적으로 수행한 후 병합하여 최종 지식베이스를 구축함으로써 보다 간편하고 빠르게 지식베이스를 구축할 수 있으므로, 상기에서 제시한 본 발명의 목적을 달성할 수 있다.
본 발명은 첨부된 도면에 의해 참조되는 바람직한 실시예를 중심으로 기술되었지만, 이러한 기재로부터 후술하는 특허청구범위에 의해 포괄되는 범위내에서 본 발명의 범주를 벗어남이 없이 다양한 변형이 가능하다는 것은 명백하다.
본 발명은 지식베이스(knowledge base) 구축 기술분야 및 이의 응용 기술분야에서 산업상으로 이용 가능하다.
100 : 지식베이스 구축장치 110 : 기본 지식 추출부
111 : 메타 데이터 추출부 112 : 텍스트 분석부
113 : 기본 지식 저장부 120 : 단위 지식베이스 생성부
130 : 단위 지식베이스 추론부 140 : 지식베이스 구축부
150 : 스키마 모델링부 160 : 웹 문서 수집부

Claims (12)

  1. 웹 문서들로부터 기본 지식들을 추출하는 기본 지식 추출부와;
    기본 지식 추출부에 의해 추출된 기본 지식들을 기반으로 단위 지식베이스들을 생성하는 단위 지식베이스 생성부와;
    단위 지식베이스 생성부에 의해 생성된 단위 지식베이스들에 포함되는 각 기본 지식에 연관된 파생 지식들을 추론하는 단위 지식베이스 추론부와;
    단위 지식베이스 추론부에 의해 각 기본 지식에 연관된 파생 지식들이 추론된 단위 지식베이스들을 병합하여 최종의 지식베이스를 구축하는 지식베이스 구축부를;
    포함하여 이루어지는 것을 특징으로 하는 지식베이스 구축장치.
  2. 제 1 항에 있어서,
    지식베이스 구축장치가:
    기본 지식들과, 각 기본 지식에 연관된 파생 지식 및 파생 지식 추론을 위한 속성(property)을 정의하는 지식베이스 스키마(Schema) 모델링부를;
    더 포함하는 것을 특징으로 하는 지식베이스 구축장치.
  3. 제 2 항에 있어서,
    단위 지식베이스 추론부가:
    파생 지식 추론을 위한 속성(property)을 참조해 단위 지식베이스들에 포함되는 각 기본 지식에 연관된 파생 지식들을 추론하는 것을 특징으로 하는 지식베이스 구축장치.
  4. 제 2 항에 있어서,
    지식베이스 스키마 모델링부가:
    기본 지식은 웹 온톨로지 언어(OWL : Web Ontology Language)의 프리미티브 클래스(Primitive Class)로 선언하고, 파생 지식은 웹 온톨로지 언어(OWL : Web Ontology Language)의 디파인드 클래스(Defined Class)로 선언하는 것을 특징으로 하는 지식베이스 구축장치.
  5. 제 4 항에 있어서,
    단위 지식베이스 추론부가:
    프리미티브 클래스의 인스턴스로 생성된 것들 중에서 특정 속성(property) 값을 갖는 것들을 프리미티브 클래스의 인스턴스로 표현하여 각 기본 지식에 연관된 파생 지식들을 추론하는 것을 특징으로 하는 지식베이스 구축장치.
  6. 제 5 항에 있어서,
    기본 지식 추출부가:
    웹 문서의 메타(Meta) 데이터로부터 프리미티브 클래스로 선언된 기본 지식 및 기본 지식에 정의된 속성(property)을 추출하는 것을 특징으로 하는 지식베이스 구축장치.
  7. 제 1 항에 있어서,
    단위 지식베이스 추론부가:
    단위 지식베이스들에 포함되는 각 기본 지식에 연관된 파생 지식들을 추론시, 다수의 단위 지식베이스에 대해 병렬적으로 추론하는 것을 특징으로 하는 지식베이스 구축장치.
  8. 제 1 항에 있어서,
    지식베이스 구축부가:
    클래스(Class), 인스턴스(Individual) 및 속성(property)을 포함하는 모든 지식 개체가 고유한 식별자(URI : Uniform Resorce Identifier)를 가지는 URI 기반으로 단위 지식베이스들을 기계적으로 병합하는 것을 특징으로 하는 지식베이스 구축장치.
  9. 제 1 항 내지 제 9 항 중의 어느 한 항에 있어서,
    지식베이스 구축장치가:
    네트워크로부터 웹 문서들을 수집하는 웹 문서 수집부를;
    더 포함하는 것을 특징으로 하는 지식베이스 구축장치.
  10. 웹 문서들로부터 기본 지식들을 추출하는 기본 지식 추출단계와;
    기본 지식 추출단계에 의해 추출된 기본 지식들을 기반으로 단위 지식베이스들을 생성하는 단위 지식베이스 생성단계와;
    단위 지식베이스 생성단계에 의해 생성된 단위 지식베이스들에 포함되는 각 기본 지식에 연관된 파생 지식들을 추론하는 단위 지식베이스 추론단계와;
    단위 지식베이스 추론단계에 의해 각 기본 지식에 연관된 파생 지식들이 추론된 단위 지식베이스들을 병합하여 최종의 지식베이스를 구축하는 지식베이스 구축단계를;
    포함하여 이루어지는 것을 특징으로 하는 지식베이스 구축장치의 지식베이스 구축방법.
  11. 제 10 항에 있어서,
    지식베이스 구축장치의 지식베이스 구축방법이:
    기본 지식들과, 각 기본 지식에 연관된 파생 지식 및 파생 지식 추론을 위한 속성(property)을 정의하는 지식베이스 스키마(Schema) 모델링단계를;
    더 포함하는 것을 특징으로 하는 지식베이스 구축장치의 지식베이스 구축방법.
  12. 제 10 항 또는 제 11 항에 있어서,
    지식베이스 구축장치의 지식베이스 구축방법이:
    네트워크로부터 웹 문서들을 수집하는 웹 문서 수집단계를;
    더 포함하는 것을 특징으로 하는 지식베이스 구축장치의 지식베이스 구축방법.
KR1020120114352A 2012-10-15 2012-10-15 지식베이스 구축장치 및 이의 지식베이스 구축방법 KR101473982B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120114352A KR101473982B1 (ko) 2012-10-15 2012-10-15 지식베이스 구축장치 및 이의 지식베이스 구축방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120114352A KR101473982B1 (ko) 2012-10-15 2012-10-15 지식베이스 구축장치 및 이의 지식베이스 구축방법

Publications (2)

Publication Number Publication Date
KR20140047952A true KR20140047952A (ko) 2014-04-23
KR101473982B1 KR101473982B1 (ko) 2014-12-24

Family

ID=50654280

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120114352A KR101473982B1 (ko) 2012-10-15 2012-10-15 지식베이스 구축장치 및 이의 지식베이스 구축방법

Country Status (1)

Country Link
KR (1) KR101473982B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160061866A (ko) * 2014-11-24 2016-06-01 한국과학기술원 개체간 암묵적 관계 추론을 통한 정보 추출 증강 시스템 및 이를 이용한 정보 추출 방법
KR20190138037A (ko) 2018-06-04 2019-12-12 한국과학기술원 사이버 보안 특화의 지식 베이스를 이용한 정보 검색 시스템 및 그 방법
KR20210000952A (ko) * 2019-06-26 2021-01-06 주식회사 카카오 지식그래프 색인 방법 및 장치

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100505970B1 (ko) * 2003-11-28 2005-08-30 한국전자통신연구원 온톨로지 기반의 지식 모델링 방법 및 그 시스템
US20070022142A1 (en) * 2005-07-20 2007-01-25 International Business Machines Corporation System and method to generate domain knowledge for automated system management by combining designer specifications with data mining activity
KR101068676B1 (ko) * 2010-05-14 2011-09-28 한국과학기술원 사람과 자원 간 소셜 네트워크를 형성하기 위한 온톨로지 확장 모델 구축 장치 및 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160061866A (ko) * 2014-11-24 2016-06-01 한국과학기술원 개체간 암묵적 관계 추론을 통한 정보 추출 증강 시스템 및 이를 이용한 정보 추출 방법
KR20190138037A (ko) 2018-06-04 2019-12-12 한국과학기술원 사이버 보안 특화의 지식 베이스를 이용한 정보 검색 시스템 및 그 방법
KR20210000952A (ko) * 2019-06-26 2021-01-06 주식회사 카카오 지식그래프 색인 방법 및 장치

Also Published As

Publication number Publication date
KR101473982B1 (ko) 2014-12-24

Similar Documents

Publication Publication Date Title
US11126647B2 (en) System and method for hierarchically organizing documents based on document portions
Auer et al. Dbpedia: A nucleus for a web of open data
JP6588089B2 (ja) セマンティックテキスト検索
Sawadogo et al. Metadata management for textual documents in data lakes
Dong et al. A survey in semantic search technologies
Aleman-Meza et al. Ranking documents semantically using ontological relationships
El-Gayar et al. Enhanced search engine using proposed framework and ranking algorithm based on semantic relations
Nakashole et al. Discovering semantic relations from the web and organizing them with PATTY
KR101473982B1 (ko) 지식베이스 구축장치 및 이의 지식베이스 구축방법
List et al. The tijah xml-ir system at inex 2003
Corby et al. Ontology-based approximate query processing for searching the semantic web with corese
Nayak et al. Discovering interesting information with advances in web technology
Stoilos et al. An ontology-based interactive system for understanding user queries
de Deus et al. Towards a semantic-based content management system for journalistic writing
Pandit et al. A query specific graph based approach to multi-document text summarization: simultaneous cluster and sentence ranking
Omerovic et al. Concept modeling: From origins to multimedia
Quamar et al. Discovery and creation of rich entities for knowledge bases
Majid et al. Semantics in social tagging systems: A review
Khattak et al. Context-aware search in dynamic repositories of digital documents
Sheela et al. Criminal event detection and classification in web documents using ANN classifier
Lomotey et al. Terms analytics service for CouchDB: a document-based NoSQL
Alghamdi et al. Object-based methodology for XML data partitioning (OXDP)
Ezhilarasi et al. Literature survey: Analysis on semantic web information retrieval methodologies
Echarte et al. Self-adaptation of ontologies to folksonomies in semantic web
Kambau et al. Unified concept-based multimedia information retrieval technique

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20181025

Year of fee payment: 5