KR101452943B1

KR101452943B1 - 상위 온톨로지 추출 방법

Info

Publication number: KR101452943B1
Application number: KR1020130008717A
Authority: KR
Inventors: 김병삼; 김지영; 염근혁
Original assignee: 한국식품연구원; 부산대학교 산학협력단
Priority date: 2013-01-25
Filing date: 2013-01-25
Publication date: 2014-10-22
Also published as: KR20140095833A

Abstract

본 발명은 상위 온톨로지 추출 및 제공 방법에 관한 것으로 더욱 상세하게는 저장되어 있는 온톨로지의 구조를 분석하고 공통성을 추출하는 방식을 통해 상위 온토롤지를 추출하여 제공하는 방법에 관한 것이다.
이를 위해 본 발명의 상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법은 저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계, 분석한 적어도 두 개의 상기 온톨로지를 구조와 기 저장된 온톨로지의 구조와 비교하여 분류하는 단계, 상기 온톨로지를 구성하고 있는 단어별로 가중치를 산출하는 단계를 포함한다.

Description

상위 온톨로지 추출 방법{Method for upper ontology extraction}

본 발명은 상위 온톨로지 추출에 관한 것으로 더욱 상세하게는 저장되어 있는 온톨로지의 구조를 분석하고 공통성을 추출하는 방식을 통해 상위 온토롤지를 추출하는 방법에 관한 것이다.

1989년도에 팀 버너스-리(Tim Berners-Lee)는 처음으로 월드 와이드 웹(World Wide Web)을 제안하였다. 특히, 기존에 널리 쓰이고 있던 클라이언트-서버(Client-Server) 구조와 HTML(HyperText Markup Language)의 마크업 언어로 인터넷 환경에서 어디에서나 개인의 정보를 웹에 올릴 수 있고, 브라우저를 통해 그 정보에 접근할 수 있는 정보의 공유 인프라를 갖출 수 있도록 하였다.

이에 따라, 수많은 정보가 인터넷에 올려지게 되고 유통되는 과정을 거치면서 대량의 정보가 인터넷상에 존재하게 되었고, 이를 상호 공유함으로써 사회 발전과 기술 발전을 촉진하고, 결과적으로 정보사회의 혁신을 이끄는 계기가 되었다.

그러나, 정보의 양이 방대해짐으로써 자신이 원하는 정보를 찾기에 드는 노력과 시간이 점점 더 많아지는 현상이 발생하게 되었고, 웹을 이용한 다양한 응용프로그램 및 서비스가 등장하면서 이 역시 유효하고 적절하게 찾아 이용하기에는 많은 어려움이 발생하게 되었다. 특히, 기존의 웹을 기반으로 한 검색 방법은 키워드에 의한 검색이 주류로서, 주로 단어의 빈도수나 어휘 정보를 이용하여 웹 문서의 우선순위를 결정하는 방식이었다. 따라서, 사용자가 원하는 웹 문서를 찾는 데는 한계가 있다. 특히, 관련된 웹 문서를 확장하거나 통합, 공유하는 것이 매우 어려웠다.

이러한 문제점은 기존의 웹과 마크업 언어가 인간 중심이고 인간이 보고 이해할 수 있도록 웹 브라우저의 표현 기술에 초점을 맞추고 있기 때문에 발생한다. 결국, 기존의 웹은 컴퓨터가 스스로 필요한 정보를 효과적으로 추출하고, 해석하고, 가공하는 기능을 충분히 제공하지 못하는 인간 중심의 정보 처리 기술이라고 할 수 있다.

이후, 기존의 웹을 확장하여 컴퓨터가 이해할 수 있는 잘 정의된 의미를 기반으로 의미적 상호 운용성(semantic interoperability)을 실현하고 인간과 컴퓨터 간의 효과적인 협동 체계를 구축할 수 있는 기술로서 시멘틱(Semantic) 웹이 등장하게 되었다.

시멘틱 웹은 기존의 웹과 완전히 구별되는 새로운 웹의 개념이 아니라 현재 웹을 학장하여 웹에 올라오는 정보에 잘 정의된 의미를 부여하고 이를 통해 컴퓨터와 사람이 협동적으로 작업을 수행할 수 있도록 하는 역할을 한다. 시멘틱 웹은 웹상에 존재하는 정보를 사람뿐만 아니라 기계(컴퓨터)가 의미를 파악하여 사용자의 요구에 적합한 지능형 서비스를 제공하거나, 사람과 기계 또는 기계와 기계 상호 간에 협업을 원활히 수행함으로써 사람을 대신하여 자동적인 서비스가 가능한 웹을 말한다.

또한, 시멘틱 웹은 컴퓨터가 정보 자원의 의미를 이해하고, 자동화하고, 통합하고, 재사용할 수 있는 차세대 웹 기술로서, 온톨로지(ontology), 의미적 주석호된 웹(semantically annotated web), 에이전트(agent)로 이루어져 있다.

한편, 온톨로지는 공유된 개념화에 대한 형식적 명세 체계로서, 도메인 어휘의 의미 정보를 제공한다. 온톨로지는 일종의 지식 표현으로 컴퓨터는 온톨로지로 표현된 개념을 이해하고 지식처리를 할 수 있다.

온톨로지는 상황인식 기술에 널리 사용되고 있다. 온톨로지는 다양한 영역에 적용될 수 있는 개념들을 정의하여 우리가 일반적으로 이해하고 있는 현실세계를 표현하는 상위 온톨로지와 특정 영역이나 분야에 한정된 시각에서 특정 영역을 구체화 하는 하위 온톨로지로 구분할 수 있다.

상위 온톨로지는 해당 분야에서 가장 기본적이고 중요한 상위 개념들을 포함하며 해당 분야를 대표하는 확장 가능한 모델을 제공하기 때문에 상위 온톨로지를 통하여 그 온톨로지가 어떠한 도메인에서 쓰이는 지에 대한 대략적인 정보를 획득할 수 있다.

각 분야에서 상위 온톨로지를 통한 온톨로지 생성은 많은 연구가 이루어져 있다. 하지만 이미 생성된 온톨로지 파일을 통해서 상위 온톨로지를 추출해 내고, 해당 온톨로지가 어떤 분야에서 쓰이는지에 대한 분류 방법에 대해서는 연구가 미흡한 실정이다. 특히 대량의 온톨로지를 저장하고 있는 온톨로지 저장소의 경우 이러한 상위 온톨로지를 통한 카테고리 분류 방법이 정립될 경우, 효과적인 온톨로지 관리 및 재사용이 가능하다. 따라서 온톨로지 저장소에 저장되어 있는 온톨로지의 구조를 분석하고 공통성을 추출해 내는 방안이 필요하다.

본 발명이 해결하려는 과제는 이미 생성된 온톨로지 파일을 통해서 상위 온톨로지를 추출해 내고, 해당 온톨로지가 어떤 분야에서 쓰이는지에 대한 분류 방법을 제안함에 있다.

본 발명이 해결하려는 다른 과제는 저장되어 있는 온톨로지의 구조를 분석하고 공통성을 추출하여 상위 온톨로지를 추출하는 방안을 제안함에 있다.

이를 위해 본 발명의 상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법은 저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계, 분석한 적어도 두 개의 상기 온톨로지를 구조와 기 저장된 온톨로지의 구조와 비교하여 분류하는 단계, 상기 온톨로지를 구성하고 있는 단어별로 가중치를 산출하는 단계를 포함한다.

이를 위해 본 발명의 상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법은 저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계, 상위 클래스에서 하위 클래스 순으로 순차적으로 상기 온톨로지를 구성하고 있는 각 클래스의 구조가 미리 저장되어 있는 온톨로지 구조와 비교하는 단계, 미리 저장되어 있는 온톨로지 구조와 동일한 구조를 갖는 상기 온톨로지를 구성하고 있는 클래스의 최하위 클래스를 추출하는 단계, 추출한 상기 최하위 클래스를 하나의 그룹을 그룹핑하는 단계, 상기 온톨로지를 구성하고 있는 단어별로 가중치를 산출하는 단계;를 포함한다.

이를 위해 본 발명의 상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법은 저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계, 상위 클래스에서 하위 클래스 순으로 순차적으로 상기 온톨로지를 구성하고 있는 각 클래스의 구조가 미리 저장되어 있는 온톨로지 구조와 비교하는 단계, 미리 저장되어 있는 온톨로지 구조와 동일한 구조를 갖는 상기 온톨로지를 구성하고 있는 클래스의 최하위 클래스를 추출하는 단계, 추출한 상기 최하위 클래스를 하나의 그룹을 그룹핑하는 단계, 상기 온톨로지를 구성하고 있는 각 단어별로 가중치를 계산하는 단계, 계산한 상기 가중치가 설정값 이상인 상기 단어가 상기 하나의 그룹에 포함되어 있으면, 상기 단어가 포함된 클래스를 상위 온토롤지로 추출하는 단계를 포함한다.

본 발명에 따른 상위 온톨로지 추출 및 제공 방법은 저장되어 있는 온톨로지의 구조를 분석하고 공통성을 추출하여 상위 온톨로지를 효과적으로 추출할 수 있다.

도 1은 일반적으로 사용되는 듀이 오더를 나타낸다.
도 2는 본 발명에서 제안하는 데이터베이스 구조를 도시하고 있다.
도 3은 본 발명에서 제안하는 가장 효율적으로 저장하는 시점을 도시하고 있다.
도 4는 온톨로지를 도식화하여 트리 형태로 나타내고 있다.
도 5는 분류 과정에 대한 모식도이다.

전술한, 그리고 추가적인 본 발명의 양상들은 첨부된 도면을 참조하여 설명되는 바람직한 실시 예들을 통하여 더욱 명백해질 것이다. 이하에서는 본 발명의 이러한 실시 예를 통해 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.

정보 과학 분야에서 온톨로지를 효율적으로 구성하기 위하여 상위 온톨로지(Upper Ontology)와 하위 온톨로지(Domain-Specific Ontology)를 분리하여 구성하는 방식을 선호한다. 상위 온톨로지는 형식에 대한 권고는 있지만 실질적으로 구성된 온톨로지를 보면 각 도메인에 따라 효율적인 상위 온톨로지를 모델링하여 구성하는 경우가 대부분이다.

1. 상위 온톨로지의 추출 방법

일반적으로 특정 도메인에서 사용되는 온톨로지는 상위 온톨로지를 바탕으로 작성된다. 그래서 도메인 기반 온톨로지는 상위 온톨로지와 하위 온톨로지로 구성을 나눌 수 있다. 이 중 상위 온톨로지는 동일한 도메인 내에서 온톨로지를 구성할 경우 기초적인 뼈대가 되기 때문에 동일한 상위 온톨로지로 온톨로지를 구성한 경우 하위 온톨로지의 구성은 달라지더라도 상위 온톨로지는 동일하게 사용된다. 이러한 특성을 이용하여 온톨로지 집합의 공통성을 분석하여 상위 온톨로지를 추출할 수 있다.

완성된 온톨로지 구조에서 하위 온톨로지와 상위 온톨로지의 형식상 차이는 없다. 하지만 온톨로지 표본이 일정 수 이상 모일 경우 표본 온톨로지 간의 공통성을 분석하여 상위 온톨로지를 추출해 낼 수 있다. 먼저 온톨로지 파일의 구조를 파악하여 분류하고, 이러한 형식상의 공통성 분석을 통해 분류된 온톨로지들의 클래스 이름으로 의미적 공통성 분석을 통해 더욱 정확한 상위 온톨로지의 추출이 가능하다.

본 발명과 관련하여 온톨로지의 분류는 구조적 분류와 의미적 분류로 구분된다. 이하에서는 구조적 분류에 대해 먼저 알아보기로 한다.

온톨로지의 구조적 분류는 단순히 온톨로지 구성의 형태만을 통해 분류하는 것을 의미한다. 가장 최상위 노드인 Thing으로 시작해서 트리 형태로 뻗어 나가는 자료 구조론적 관점을 말한다. 의미적인 관점은 각 클래스에 쓰인 이름을 통해 알 수 있는 각 클래스가 가지는 뜻을 바탕으로 해당 클래스가 가지는 의미를 나타낸다. 이러한 두 가지 관점을 통해 각 온톨로지의 유사성을 효과적으로 파악할 수 있다. 이러한 상위 온톨로지 추출은 각 온톨로지의 저장 시점에서 이루어지게 된다. 각 온톨로지와 기 분류된 온톨로지 집합간의 상관관계를 파악하여 유사성을 파악하여 분류하고 온톨로지 저장소에 저장하는 흐름을 가진다.

2. 온톨로지 분석

온톨로지를 처리하여 구조적인 관점과 의미적인 관점으로 해석하기 위해서는 필요한 요소를 추출하고, 이를 정형화 시켜서 저장하는 과정이 필요하다. 온톨로지의 요소를 저장하기 위해서 본 논문에는 관계형 데이터베이스를 사용하여 저장하였다. 관계형 데이터베이스에 저장하는 것은 빠른 검색 속도로 인하여 입출력이 용이하고, 일회성 데이터가 아니기 때문에 정보 검색 시스템의 역파일과 같은 인덱스로 사용할 수 있기 때문이다.

구조적인 관점을 분석하기 위해서는 클래스의 구조를 나타낼 수 있어야 한다. 온톨로지의 클래스 구조는 최상위 노드로부터 확장되어 가는 트리 형태로 구성이 된다. 이러한 트리 형태로 나타난 클래스 구조를 저장하기 위하여 각 클래스에 번호를 부여하였는데, 도 1과 같이 일반적으로 사용되는 듀이 오더를 사용하여 나타낸다.

의미적 관점을 분석하기 위해서는 각 클래스의 이름을 저장할 필요가 있다. 또한, 온톨로지의 클래스 트리 구조는 하위 단계로 가면서 구체적인 의미를 지니는 경우가 많기 때문에 이를 계산하기 위해서 클래스 구조를 저장한 것과 연계하여 저장할 필요가 있다. 이를 위하여 관계형 데이터베이스의 인덱스 값과 클래스 이름을 연결 시켜주는 테이블이 필요하게 된다. 이러한 조건을 만족시키기 위하여 도 2와 같은 데이터베이스 구조를 가지게 된다.

이러한 온톨로지 분석을 통하여 관계형 데이터베이스에 저장하는 것은 각 온톨로지를 저장하는 시점에서 실시하게 된다. 상위 온톨로지를 검색하기 위한 역파일과 같은 기능을 수행하기 위해서는 미리 만들어 져 있어야 하는데, 이러한 조건을 만족시키기 위해서는 저장하는 시점이 가장 효율적이기 때문이다. 이러한 일련의 과정은 도 3과 같이 나타낼 수 있다.

본 발명에서는 온톨로지 클래스의 구조 및 이름을 추출하기 위해 프로티지 API에서 제공하는 OWL 파서를 이용한다.

3 구조적 분류 방법

동일한 상위 온톨로지를 사용하였다면, 상위 온톨로지 부분까지는 동일한 구성을 가지고, 하위 온톨로지 부분에서 특정 도메인에 맞게 수정이 가해지기 때문에 구조적인 변화를 가진다. 도 4는 온톨로지를 도식화하여 트리 형태로 나타내고 있다.

이러한 온톨로지의 특성을 통해 온톨로지 집합의 각 구조를 비교하여 상위 온톨로지의 범위를 계측해 낼 수 있다. 도 4와 같은 경우 두 번째 단계의 온톨로지까지 동일한 모습을 보이다가 세 번째 단계부터 다른 형태 나타나게 된다. 이때 두 번째 단계까지가 상위 온톨로지라고 판단한다.

이러한 구조적인 분석을 위하여 미리 저장해 놓은 온톨로지들의 구조적 요소들과 비교 과정이 필요하다. 각 온톨로지가 온톨로지 분석을 통하여 저장이 되면 전체 저장된 온톨로지를 대상으로 온톨로지 분류 과정을 발생시킨다.

온톨로지 분류 과정은 온톨로지의 가장 상위 노드부터 그룹화를 하면서 진행된다. 가장 상위 노드의 온톨로지는 하나의 요소만을 가지기 때문에 모든 온톨로지가 같은 집합으로 분류되게 된다. 하지만 하위 노드로 갈수록 각 온톨로지의 클래스가 나타내는 의미가 구체화되기 때문에 구조도 함께 나누어지게 된다. 이러한 특성을 이용하여 가장 상위 노드부터 가장 하위 노드까지의 구조의 동일성을 비교해 나가면 각 노드마다 온톨로지 집합을 담고 있는 트리 형태의 분류가 생기게 된다. 도5는 분류 과정에 대한 모식도이다.

하지만 이러한 분류방법을 통해서는 상위 온톨로지뿐 아니라 하위 온톨로지까지 분류 과정에 참여하게 되므로 이를 분석하여 상위 온톨로지의 범위를 만들 필요가 있다.

상위 온톨로지의 범위 후보는 각 온톨로지의 집합을 나누어 놓은 분류 흐름에서 분류되는 집합의 수를 통해 정하게 된다. 상위 온톨로지의 구조는 동일하기 때문에 상위 온톨로지가 끝나는 순간까지 일정한 그룹으로 이동하다가 하위 온톨로지 부분이 되면서 많은 분류가 생기기 때문이다. 그림 5를 예로 들면, 온톨로지 A, A', A''는 동일한 상위 온톨로지를 가지고 있다. 하지만 상위 온톨로지가 끝나는 4단계부터 각자 다른 하위 온톨로지를 가지기 때문에 구조상 다른 집합으로 분류되는 것을 확인할 수 있다.

이러한 각 단계별 분류를 만들고 이하에서 설명하는 의미적 관점에서의 분류 과정을 통하여 상위 온톨로지의 범위를 확정한다.

4. 의미적 분류 방법

의미적인 온톨로지의 분류는 구조적 분류를 통하여 나누어 놓은 각 단계별 온톨로지 집단 안에서 각 온톨로지가 가진 클래스의 이름의 유사도 분석 과정을 통하여 분류를 하는 과정이다. 이 과정을 통하여 구조적인 분류가 가진, 구조는 같지만 다른 도메인을 포함하는 경우의 문제점을 해결할 수 있다.

각 온톨로지에 속한 클래스의 이름은 의미적인 가치가 있다. 하지만 동일한 의미를 내포하는 클래스일지라도 다른 어휘를 선택하여 다른 이름을 가진 경우가 존재한다. 이러한 경우 클래스 이름을 통한 유사도를 판단하기 위하여 워드넷을 사용한다.

클래스 이름을 통하여 온톨로지의 유사도를 판단하는 방법은 다음과 같다. 먼저 개별 온톨로지에 대한 클래스 이름의 관계를 통하여 가중치를 정한다. 각 클래스 이름을 나타내는 단어와 나머지 모든 단어들과의 관계 거리의 합이 가까울수록 더욱 중요한 단어라고 볼 수 있다. 실제 온톨로지에서 각 단어들의 관계는 표 1과 같다. 유사도는 0에서 1까지의 범위를 가지고, 0에 가까울수록 각 단어들 간의 관계가 가깝다는 것을 나타낸다.

[표 1]

이러한 이유로 단어와 나머지 모든 단어들과의 관계 거리의 합을 구하여 그 역수에 비례하게 가중치를 둔다. 그리고 또한 각 단어 전체 온톨로지에서 나오는 비율이 낮을수록 그 단어가 해당 온톨로지에서 나오는 비율이 낮을수록 그 단어가 해당 온톨로지에서 더욱 중요한 단어라고 볼 수 있다. 이를 수식으로 나타내면 하기 수학식 1과 같다.

[수학식 1]

A, B 는 양의 상수

각 단어에 대한 가중치는 다른 단어와 단어 사이의 유사도 합의 역수와 전체 문서에 나타나는 단어의 수의 역수 값과 비례하게 된다. 이렇게 계산된 가중치를 해당 단어와 비교 대상의 온톨로지에 포함된 단어들과의 관계 거리를 곱한 뒤 이 값들의 평균을 온톨로지간의 유사도로 사용한다.

이러한 유사도는 각 온톨로지의 최하위 클래스 이름을 통하여 계산되는데, 이는 가장 일반화된 개념을 유사도 판단 계산에 사용하기 위함이다.

도 5에서 확인할 수 있듯이 온톨로지 1단계에서 모두 같은 형식을 보인다. 하지만 각 온톨로지간의 유사도를 계산해 볼 경우 관련 없는 모든 클래스 이름이 포함되어 있기 때문에 낮은값을 가진다. 하지만 하위 단계로 갈수록 형태에 따른 분류로 인해 점점 유사도 값은 높아지다가 동일한 상위 온톨로지를 가진 온톨로지들의 집합만을 가지게 되면 유사도 값의 변화가 크게 증가된 다음 일정 수치로 지속된다. 이러한 각 단계별 유사도 측정값의 변화를 바탕으로 상위 온톨로지의 범위를 추출할 수 있다. 이렇게 추출된 상위 온톨로지는 문서 파싱을 통하여 해당 상위 온톨로지 부분까지만 온톨로지 저장소에 저장하게 된다.

본 발명은 도면에 도시된 일실시 예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다.

Claims

상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법에 있어서,
상기 온톨로지의 구조 및 이름을 분석하는 단계;
분석한 상기 온톨로지의 구조와 기 저장된 온톨로지의 구조를 비교하여 분류하는 단계; 및
상기 온톨로지를 구성하고 있는 단어별로 가중치를 산출하는 단계;를 포함하고,
상기 온톨로지를 분석하는 단계는,
상기 온톨로지의 클래스 및 구조를 추출하고, 추출한 클래스와 구조에 넘버링을 수행하여 저장하는 단계; 및
추출한 클래스의 이름을 추출하여 해당 클래스와 매칭시켜 저장하는 단계;를 포함함을 특징으로 하는 상위 온토롤지 추출 방법.
삭제
제 1항에 있어서, 상기 구조를 비교하여 분류하는 단계는,
상위 클래스에서 하위 클래스 순으로 순차적으로 상기 온톨로지를 구성하고 있는 각 클래스의 구조를 미리 저장되어 있는 온톨로지 구조와 비교하는 단계;
미리 저장되어 있는 온톨로지 구조와 동일한 구조를 갖는 상기 온톨로지를 구성하고 있는 클래스의 최하위 클래스를 추출하는 단계;
추출한 상기 최하위 클래스를 하나의 그룹으로 그룹핑하는 단계를 포함함을 특징으로 하는 상위 온토롤지 추출 방법.
제 3항에 있어서, 상기 가중치를 산출하는 단계는,
상기 온톨로지를 구성하고 있는 각 단어별로 가중치를 계산하는 단계;
계산한 상기 가중치가 설정값 이상인 상기 단어가 상기 하나의 그룹에 포함되어 있으면, 상기 단어가 포함된 클래스를 상위 온토롤지로 추출하는 단계를 포함함을 특징으로 하는 상위 온톨로지 추출 방법.
제 4항에 있어서, 각 단어별 가중치를 계산하는 단계는,
각 단어들간의 거리합과 해당 단어의 출현 빈도수를 산출하는 단계를 포함함을 특징으로 하는 상위 온톨로지 추출 방법.
제 5항에 있어서, 상기 단어의 가중치는 하기 수학식에 의해 산출함을 특징으로 하는 상위 온톨로지 추출 방법.
[수학식]

A, B는 양의 상수
상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법에 있어서,
저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계;
상위 클래스에서 하위 클래스 순으로 순차적으로 상기 온톨로지를 구성하고 있는 각 클래스의 구조를 미리 저장되어 있는 온톨로지 구조와 비교하는 단계;
미리 저장되어 있는 온톨로지 구조와 동일한 구조를 갖는 상기 온톨로지를 구성하고 있는 클래스의 최하위 클래스를 추출하는 단계;
추출한 상기 최하위 클래스를 하나의 그룹으로 그룹핑하는 단계;
상기 온톨로지를 구성하고 있는 단어별로 가중치를 산출하는 단계;를 포함함을 특징으로 하는 상위 온토롤지 추출 방법.
상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법에 있어서,
저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계;
상위 클래스에서 하위 클래스 순으로 순차적으로 상기 온톨로지를 구성하고 있는 각 클래스의 구조를 미리 저장되어 있는 온톨로지 구조와 비교하는 단계;
미리 저장되어 있는 온톨로지 구조와 동일한 구조를 갖는 상기 온톨로지를 구성하고 있는 클래스의 최하위 클래스를 추출하는 단계;
추출한 상기 최하위 클래스를 하나의 그룹으로 그룹핑하는 단계;
상기 온톨로지를 구성하고 있는 각 단어별로 가중치를 계산하는 단계;
계산한 상기 가중치가 설정값 이상인 상기 단어가 상기 하나의 그룹에 포함되어 있으면, 상기 단어가 포함된 클래스를 상위 온토롤지로 추출하는 단계를 포함함을 특징으로 하는 상위 온톨로지 추출 방법.
제 8항에 있어서, 각 단어별 가중치를 계산하는 단계는,
각 단어들간의 거리합과 해당 단어의 출현 빈도수를 산출하는 단계를 포함함을 특징으로 하는 상위 온톨로지 추출 방법.
제 9항에 있어서, 상기 단어의 가중치는 하기 수학식에 의해 산출함을 특징으로 하는 상위 온톨로지 추출 방법.
[수학식]

A, B는 양의 상수