KR101452943B1 - 상위 온톨로지 추출 방법 - Google Patents

상위 온톨로지 추출 방법 Download PDF

Info

Publication number
KR101452943B1
KR101452943B1 KR1020130008717A KR20130008717A KR101452943B1 KR 101452943 B1 KR101452943 B1 KR 101452943B1 KR 1020130008717 A KR1020130008717 A KR 1020130008717A KR 20130008717 A KR20130008717 A KR 20130008717A KR 101452943 B1 KR101452943 B1 KR 101452943B1
Authority
KR
South Korea
Prior art keywords
ontology
class
extracting
word
stored
Prior art date
Application number
KR1020130008717A
Other languages
English (en)
Other versions
KR20140095833A (ko
Inventor
김병삼
김지영
염근혁
Original Assignee
한국식품연구원
부산대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국식품연구원, 부산대학교 산학협력단 filed Critical 한국식품연구원
Priority to KR1020130008717A priority Critical patent/KR101452943B1/ko
Publication of KR20140095833A publication Critical patent/KR20140095833A/ko
Application granted granted Critical
Publication of KR101452943B1 publication Critical patent/KR101452943B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 상위 온톨로지 추출 및 제공 방법에 관한 것으로 더욱 상세하게는 저장되어 있는 온톨로지의 구조를 분석하고 공통성을 추출하는 방식을 통해 상위 온토롤지를 추출하여 제공하는 방법에 관한 것이다.
이를 위해 본 발명의 상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법은 저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계, 분석한 적어도 두 개의 상기 온톨로지를 구조와 기 저장된 온톨로지의 구조와 비교하여 분류하는 단계, 상기 온톨로지를 구성하고 있는 단어별로 가중치를 산출하는 단계를 포함한다.

Description

상위 온톨로지 추출 방법{Method for upper ontology extraction}
본 발명은 상위 온톨로지 추출에 관한 것으로 더욱 상세하게는 저장되어 있는 온톨로지의 구조를 분석하고 공통성을 추출하는 방식을 통해 상위 온토롤지를 추출하는 방법에 관한 것이다.
1989년도에 팀 버너스-리(Tim Berners-Lee)는 처음으로 월드 와이드 웹(World Wide Web)을 제안하였다. 특히, 기존에 널리 쓰이고 있던 클라이언트-서버(Client-Server) 구조와 HTML(HyperText Markup Language)의 마크업 언어로 인터넷 환경에서 어디에서나 개인의 정보를 웹에 올릴 수 있고, 브라우저를 통해 그 정보에 접근할 수 있는 정보의 공유 인프라를 갖출 수 있도록 하였다.
이에 따라, 수많은 정보가 인터넷에 올려지게 되고 유통되는 과정을 거치면서 대량의 정보가 인터넷상에 존재하게 되었고, 이를 상호 공유함으로써 사회 발전과 기술 발전을 촉진하고, 결과적으로 정보사회의 혁신을 이끄는 계기가 되었다.
그러나, 정보의 양이 방대해짐으로써 자신이 원하는 정보를 찾기에 드는 노력과 시간이 점점 더 많아지는 현상이 발생하게 되었고, 웹을 이용한 다양한 응용프로그램 및 서비스가 등장하면서 이 역시 유효하고 적절하게 찾아 이용하기에는 많은 어려움이 발생하게 되었다. 특히, 기존의 웹을 기반으로 한 검색 방법은 키워드에 의한 검색이 주류로서, 주로 단어의 빈도수나 어휘 정보를 이용하여 웹 문서의 우선순위를 결정하는 방식이었다. 따라서, 사용자가 원하는 웹 문서를 찾는 데는 한계가 있다. 특히, 관련된 웹 문서를 확장하거나 통합, 공유하는 것이 매우 어려웠다.
이러한 문제점은 기존의 웹과 마크업 언어가 인간 중심이고 인간이 보고 이해할 수 있도록 웹 브라우저의 표현 기술에 초점을 맞추고 있기 때문에 발생한다. 결국, 기존의 웹은 컴퓨터가 스스로 필요한 정보를 효과적으로 추출하고, 해석하고, 가공하는 기능을 충분히 제공하지 못하는 인간 중심의 정보 처리 기술이라고 할 수 있다.
이후, 기존의 웹을 확장하여 컴퓨터가 이해할 수 있는 잘 정의된 의미를 기반으로 의미적 상호 운용성(semantic interoperability)을 실현하고 인간과 컴퓨터 간의 효과적인 협동 체계를 구축할 수 있는 기술로서 시멘틱(Semantic) 웹이 등장하게 되었다.
시멘틱 웹은 기존의 웹과 완전히 구별되는 새로운 웹의 개념이 아니라 현재 웹을 학장하여 웹에 올라오는 정보에 잘 정의된 의미를 부여하고 이를 통해 컴퓨터와 사람이 협동적으로 작업을 수행할 수 있도록 하는 역할을 한다. 시멘틱 웹은 웹상에 존재하는 정보를 사람뿐만 아니라 기계(컴퓨터)가 의미를 파악하여 사용자의 요구에 적합한 지능형 서비스를 제공하거나, 사람과 기계 또는 기계와 기계 상호 간에 협업을 원활히 수행함으로써 사람을 대신하여 자동적인 서비스가 가능한 웹을 말한다.
또한, 시멘틱 웹은 컴퓨터가 정보 자원의 의미를 이해하고, 자동화하고, 통합하고, 재사용할 수 있는 차세대 웹 기술로서, 온톨로지(ontology), 의미적 주석호된 웹(semantically annotated web), 에이전트(agent)로 이루어져 있다.
한편, 온톨로지는 공유된 개념화에 대한 형식적 명세 체계로서, 도메인 어휘의 의미 정보를 제공한다. 온톨로지는 일종의 지식 표현으로 컴퓨터는 온톨로지로 표현된 개념을 이해하고 지식처리를 할 수 있다.
온톨로지는 상황인식 기술에 널리 사용되고 있다. 온톨로지는 다양한 영역에 적용될 수 있는 개념들을 정의하여 우리가 일반적으로 이해하고 있는 현실세계를 표현하는 상위 온톨로지와 특정 영역이나 분야에 한정된 시각에서 특정 영역을 구체화 하는 하위 온톨로지로 구분할 수 있다.
상위 온톨로지는 해당 분야에서 가장 기본적이고 중요한 상위 개념들을 포함하며 해당 분야를 대표하는 확장 가능한 모델을 제공하기 때문에 상위 온톨로지를 통하여 그 온톨로지가 어떠한 도메인에서 쓰이는 지에 대한 대략적인 정보를 획득할 수 있다.
각 분야에서 상위 온톨로지를 통한 온톨로지 생성은 많은 연구가 이루어져 있다. 하지만 이미 생성된 온톨로지 파일을 통해서 상위 온톨로지를 추출해 내고, 해당 온톨로지가 어떤 분야에서 쓰이는지에 대한 분류 방법에 대해서는 연구가 미흡한 실정이다. 특히 대량의 온톨로지를 저장하고 있는 온톨로지 저장소의 경우 이러한 상위 온톨로지를 통한 카테고리 분류 방법이 정립될 경우, 효과적인 온톨로지 관리 및 재사용이 가능하다. 따라서 온톨로지 저장소에 저장되어 있는 온톨로지의 구조를 분석하고 공통성을 추출해 내는 방안이 필요하다.
본 발명이 해결하려는 과제는 이미 생성된 온톨로지 파일을 통해서 상위 온톨로지를 추출해 내고, 해당 온톨로지가 어떤 분야에서 쓰이는지에 대한 분류 방법을 제안함에 있다.
본 발명이 해결하려는 다른 과제는 저장되어 있는 온톨로지의 구조를 분석하고 공통성을 추출하여 상위 온톨로지를 추출하는 방안을 제안함에 있다.
이를 위해 본 발명의 상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법은 저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계, 분석한 적어도 두 개의 상기 온톨로지를 구조와 기 저장된 온톨로지의 구조와 비교하여 분류하는 단계, 상기 온톨로지를 구성하고 있는 단어별로 가중치를 산출하는 단계를 포함한다.
이를 위해 본 발명의 상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법은 저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계, 상위 클래스에서 하위 클래스 순으로 순차적으로 상기 온톨로지를 구성하고 있는 각 클래스의 구조가 미리 저장되어 있는 온톨로지 구조와 비교하는 단계, 미리 저장되어 있는 온톨로지 구조와 동일한 구조를 갖는 상기 온톨로지를 구성하고 있는 클래스의 최하위 클래스를 추출하는 단계, 추출한 상기 최하위 클래스를 하나의 그룹을 그룹핑하는 단계, 상기 온톨로지를 구성하고 있는 단어별로 가중치를 산출하는 단계;를 포함한다.
이를 위해 본 발명의 상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법은 저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계, 상위 클래스에서 하위 클래스 순으로 순차적으로 상기 온톨로지를 구성하고 있는 각 클래스의 구조가 미리 저장되어 있는 온톨로지 구조와 비교하는 단계, 미리 저장되어 있는 온톨로지 구조와 동일한 구조를 갖는 상기 온톨로지를 구성하고 있는 클래스의 최하위 클래스를 추출하는 단계, 추출한 상기 최하위 클래스를 하나의 그룹을 그룹핑하는 단계, 상기 온톨로지를 구성하고 있는 각 단어별로 가중치를 계산하는 단계, 계산한 상기 가중치가 설정값 이상인 상기 단어가 상기 하나의 그룹에 포함되어 있으면, 상기 단어가 포함된 클래스를 상위 온토롤지로 추출하는 단계를 포함한다.
본 발명에 따른 상위 온톨로지 추출 및 제공 방법은 저장되어 있는 온톨로지의 구조를 분석하고 공통성을 추출하여 상위 온톨로지를 효과적으로 추출할 수 있다.
도 1은 일반적으로 사용되는 듀이 오더를 나타낸다.
도 2는 본 발명에서 제안하는 데이터베이스 구조를 도시하고 있다.
도 3은 본 발명에서 제안하는 가장 효율적으로 저장하는 시점을 도시하고 있다.
도 4는 온톨로지를 도식화하여 트리 형태로 나타내고 있다.
도 5는 분류 과정에 대한 모식도이다.
전술한, 그리고 추가적인 본 발명의 양상들은 첨부된 도면을 참조하여 설명되는 바람직한 실시 예들을 통하여 더욱 명백해질 것이다. 이하에서는 본 발명의 이러한 실시 예를 통해 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.
정보 과학 분야에서 온톨로지를 효율적으로 구성하기 위하여 상위 온톨로지(Upper Ontology)와 하위 온톨로지(Domain-Specific Ontology)를 분리하여 구성하는 방식을 선호한다. 상위 온톨로지는 형식에 대한 권고는 있지만 실질적으로 구성된 온톨로지를 보면 각 도메인에 따라 효율적인 상위 온톨로지를 모델링하여 구성하는 경우가 대부분이다.
1. 상위 온톨로지의 추출 방법
일반적으로 특정 도메인에서 사용되는 온톨로지는 상위 온톨로지를 바탕으로 작성된다. 그래서 도메인 기반 온톨로지는 상위 온톨로지와 하위 온톨로지로 구성을 나눌 수 있다. 이 중 상위 온톨로지는 동일한 도메인 내에서 온톨로지를 구성할 경우 기초적인 뼈대가 되기 때문에 동일한 상위 온톨로지로 온톨로지를 구성한 경우 하위 온톨로지의 구성은 달라지더라도 상위 온톨로지는 동일하게 사용된다. 이러한 특성을 이용하여 온톨로지 집합의 공통성을 분석하여 상위 온톨로지를 추출할 수 있다.
완성된 온톨로지 구조에서 하위 온톨로지와 상위 온톨로지의 형식상 차이는 없다. 하지만 온톨로지 표본이 일정 수 이상 모일 경우 표본 온톨로지 간의 공통성을 분석하여 상위 온톨로지를 추출해 낼 수 있다. 먼저 온톨로지 파일의 구조를 파악하여 분류하고, 이러한 형식상의 공통성 분석을 통해 분류된 온톨로지들의 클래스 이름으로 의미적 공통성 분석을 통해 더욱 정확한 상위 온톨로지의 추출이 가능하다.
본 발명과 관련하여 온톨로지의 분류는 구조적 분류와 의미적 분류로 구분된다. 이하에서는 구조적 분류에 대해 먼저 알아보기로 한다.
온톨로지의 구조적 분류는 단순히 온톨로지 구성의 형태만을 통해 분류하는 것을 의미한다. 가장 최상위 노드인 Thing으로 시작해서 트리 형태로 뻗어 나가는 자료 구조론적 관점을 말한다. 의미적인 관점은 각 클래스에 쓰인 이름을 통해 알 수 있는 각 클래스가 가지는 뜻을 바탕으로 해당 클래스가 가지는 의미를 나타낸다. 이러한 두 가지 관점을 통해 각 온톨로지의 유사성을 효과적으로 파악할 수 있다. 이러한 상위 온톨로지 추출은 각 온톨로지의 저장 시점에서 이루어지게 된다. 각 온톨로지와 기 분류된 온톨로지 집합간의 상관관계를 파악하여 유사성을 파악하여 분류하고 온톨로지 저장소에 저장하는 흐름을 가진다.
2. 온톨로지 분석
온톨로지를 처리하여 구조적인 관점과 의미적인 관점으로 해석하기 위해서는 필요한 요소를 추출하고, 이를 정형화 시켜서 저장하는 과정이 필요하다. 온톨로지의 요소를 저장하기 위해서 본 논문에는 관계형 데이터베이스를 사용하여 저장하였다. 관계형 데이터베이스에 저장하는 것은 빠른 검색 속도로 인하여 입출력이 용이하고, 일회성 데이터가 아니기 때문에 정보 검색 시스템의 역파일과 같은 인덱스로 사용할 수 있기 때문이다.
구조적인 관점을 분석하기 위해서는 클래스의 구조를 나타낼 수 있어야 한다. 온톨로지의 클래스 구조는 최상위 노드로부터 확장되어 가는 트리 형태로 구성이 된다. 이러한 트리 형태로 나타난 클래스 구조를 저장하기 위하여 각 클래스에 번호를 부여하였는데, 도 1과 같이 일반적으로 사용되는 듀이 오더를 사용하여 나타낸다.
의미적 관점을 분석하기 위해서는 각 클래스의 이름을 저장할 필요가 있다. 또한, 온톨로지의 클래스 트리 구조는 하위 단계로 가면서 구체적인 의미를 지니는 경우가 많기 때문에 이를 계산하기 위해서 클래스 구조를 저장한 것과 연계하여 저장할 필요가 있다. 이를 위하여 관계형 데이터베이스의 인덱스 값과 클래스 이름을 연결 시켜주는 테이블이 필요하게 된다. 이러한 조건을 만족시키기 위하여 도 2와 같은 데이터베이스 구조를 가지게 된다.
이러한 온톨로지 분석을 통하여 관계형 데이터베이스에 저장하는 것은 각 온톨로지를 저장하는 시점에서 실시하게 된다. 상위 온톨로지를 검색하기 위한 역파일과 같은 기능을 수행하기 위해서는 미리 만들어 져 있어야 하는데, 이러한 조건을 만족시키기 위해서는 저장하는 시점이 가장 효율적이기 때문이다. 이러한 일련의 과정은 도 3과 같이 나타낼 수 있다.
본 발명에서는 온톨로지 클래스의 구조 및 이름을 추출하기 위해 프로티지 API에서 제공하는 OWL 파서를 이용한다.
3 구조적 분류 방법
동일한 상위 온톨로지를 사용하였다면, 상위 온톨로지 부분까지는 동일한 구성을 가지고, 하위 온톨로지 부분에서 특정 도메인에 맞게 수정이 가해지기 때문에 구조적인 변화를 가진다. 도 4는 온톨로지를 도식화하여 트리 형태로 나타내고 있다.
이러한 온톨로지의 특성을 통해 온톨로지 집합의 각 구조를 비교하여 상위 온톨로지의 범위를 계측해 낼 수 있다. 도 4와 같은 경우 두 번째 단계의 온톨로지까지 동일한 모습을 보이다가 세 번째 단계부터 다른 형태 나타나게 된다. 이때 두 번째 단계까지가 상위 온톨로지라고 판단한다.
이러한 구조적인 분석을 위하여 미리 저장해 놓은 온톨로지들의 구조적 요소들과 비교 과정이 필요하다. 각 온톨로지가 온톨로지 분석을 통하여 저장이 되면 전체 저장된 온톨로지를 대상으로 온톨로지 분류 과정을 발생시킨다.
온톨로지 분류 과정은 온톨로지의 가장 상위 노드부터 그룹화를 하면서 진행된다. 가장 상위 노드의 온톨로지는 하나의 요소만을 가지기 때문에 모든 온톨로지가 같은 집합으로 분류되게 된다. 하지만 하위 노드로 갈수록 각 온톨로지의 클래스가 나타내는 의미가 구체화되기 때문에 구조도 함께 나누어지게 된다. 이러한 특성을 이용하여 가장 상위 노드부터 가장 하위 노드까지의 구조의 동일성을 비교해 나가면 각 노드마다 온톨로지 집합을 담고 있는 트리 형태의 분류가 생기게 된다. 도5는 분류 과정에 대한 모식도이다.
하지만 이러한 분류방법을 통해서는 상위 온톨로지뿐 아니라 하위 온톨로지까지 분류 과정에 참여하게 되므로 이를 분석하여 상위 온톨로지의 범위를 만들 필요가 있다.
상위 온톨로지의 범위 후보는 각 온톨로지의 집합을 나누어 놓은 분류 흐름에서 분류되는 집합의 수를 통해 정하게 된다. 상위 온톨로지의 구조는 동일하기 때문에 상위 온톨로지가 끝나는 순간까지 일정한 그룹으로 이동하다가 하위 온톨로지 부분이 되면서 많은 분류가 생기기 때문이다. 그림 5를 예로 들면, 온톨로지 A, A', A''는 동일한 상위 온톨로지를 가지고 있다. 하지만 상위 온톨로지가 끝나는 4단계부터 각자 다른 하위 온톨로지를 가지기 때문에 구조상 다른 집합으로 분류되는 것을 확인할 수 있다.
이러한 각 단계별 분류를 만들고 이하에서 설명하는 의미적 관점에서의 분류 과정을 통하여 상위 온톨로지의 범위를 확정한다.
4. 의미적 분류 방법
의미적인 온톨로지의 분류는 구조적 분류를 통하여 나누어 놓은 각 단계별 온톨로지 집단 안에서 각 온톨로지가 가진 클래스의 이름의 유사도 분석 과정을 통하여 분류를 하는 과정이다. 이 과정을 통하여 구조적인 분류가 가진, 구조는 같지만 다른 도메인을 포함하는 경우의 문제점을 해결할 수 있다.
각 온톨로지에 속한 클래스의 이름은 의미적인 가치가 있다. 하지만 동일한 의미를 내포하는 클래스일지라도 다른 어휘를 선택하여 다른 이름을 가진 경우가 존재한다. 이러한 경우 클래스 이름을 통한 유사도를 판단하기 위하여 워드넷을 사용한다.
클래스 이름을 통하여 온톨로지의 유사도를 판단하는 방법은 다음과 같다. 먼저 개별 온톨로지에 대한 클래스 이름의 관계를 통하여 가중치를 정한다. 각 클래스 이름을 나타내는 단어와 나머지 모든 단어들과의 관계 거리의 합이 가까울수록 더욱 중요한 단어라고 볼 수 있다. 실제 온톨로지에서 각 단어들의 관계는 표 1과 같다. 유사도는 0에서 1까지의 범위를 가지고, 0에 가까울수록 각 단어들 간의 관계가 가깝다는 것을 나타낸다.
[표 1]
Figure 112013007518997-pat00001

이러한 이유로 단어와 나머지 모든 단어들과의 관계 거리의 합을 구하여 그 역수에 비례하게 가중치를 둔다. 그리고 또한 각 단어 전체 온톨로지에서 나오는 비율이 낮을수록 그 단어가 해당 온톨로지에서 나오는 비율이 낮을수록 그 단어가 해당 온톨로지에서 더욱 중요한 단어라고 볼 수 있다. 이를 수식으로 나타내면 하기 수학식 1과 같다.
[수학식 1]
Figure 112013007518997-pat00002
A, B 는 양의 상수
각 단어에 대한 가중치는 다른 단어와 단어 사이의 유사도 합의 역수와 전체 문서에 나타나는 단어의 수의 역수 값과 비례하게 된다. 이렇게 계산된 가중치를 해당 단어와 비교 대상의 온톨로지에 포함된 단어들과의 관계 거리를 곱한 뒤 이 값들의 평균을 온톨로지간의 유사도로 사용한다.
이러한 유사도는 각 온톨로지의 최하위 클래스 이름을 통하여 계산되는데, 이는 가장 일반화된 개념을 유사도 판단 계산에 사용하기 위함이다.
도 5에서 확인할 수 있듯이 온톨로지 1단계에서 모두 같은 형식을 보인다. 하지만 각 온톨로지간의 유사도를 계산해 볼 경우 관련 없는 모든 클래스 이름이 포함되어 있기 때문에 낮은값을 가진다. 하지만 하위 단계로 갈수록 형태에 따른 분류로 인해 점점 유사도 값은 높아지다가 동일한 상위 온톨로지를 가진 온톨로지들의 집합만을 가지게 되면 유사도 값의 변화가 크게 증가된 다음 일정 수치로 지속된다. 이러한 각 단계별 유사도 측정값의 변화를 바탕으로 상위 온톨로지의 범위를 추출할 수 있다. 이렇게 추출된 상위 온톨로지는 문서 파싱을 통하여 해당 상위 온톨로지 부분까지만 온톨로지 저장소에 저장하게 된다.
본 발명은 도면에 도시된 일실시 예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다.

Claims (10)

  1. 상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법에 있어서,
    상기 온톨로지의 구조 및 이름을 분석하는 단계;
    분석한 상기 온톨로지의 구조와 기 저장된 온톨로지의 구조를 비교하여 분류하는 단계; 및
    상기 온톨로지를 구성하고 있는 단어별로 가중치를 산출하는 단계;를 포함하고,
    상기 온톨로지를 분석하는 단계는,
    상기 온톨로지의 클래스 및 구조를 추출하고, 추출한 클래스와 구조에 넘버링을 수행하여 저장하는 단계; 및
    추출한 클래스의 이름을 추출하여 해당 클래스와 매칭시켜 저장하는 단계;를 포함함을 특징으로 하는 상위 온토롤지 추출 방법.
  2. 삭제
  3. 제 1항에 있어서, 상기 구조를 비교하여 분류하는 단계는,
    상위 클래스에서 하위 클래스 순으로 순차적으로 상기 온톨로지를 구성하고 있는 각 클래스의 구조를 미리 저장되어 있는 온톨로지 구조와 비교하는 단계;
    미리 저장되어 있는 온톨로지 구조와 동일한 구조를 갖는 상기 온톨로지를 구성하고 있는 클래스의 최하위 클래스를 추출하는 단계;
    추출한 상기 최하위 클래스를 하나의 그룹으로 그룹핑하는 단계를 포함함을 특징으로 하는 상위 온토롤지 추출 방법.
  4. 제 3항에 있어서, 상기 가중치를 산출하는 단계는,
    상기 온톨로지를 구성하고 있는 각 단어별로 가중치를 계산하는 단계;
    계산한 상기 가중치가 설정값 이상인 상기 단어가 상기 하나의 그룹에 포함되어 있으면, 상기 단어가 포함된 클래스를 상위 온토롤지로 추출하는 단계를 포함함을 특징으로 하는 상위 온톨로지 추출 방법.
  5. 제 4항에 있어서, 각 단어별 가중치를 계산하는 단계는,
    각 단어들간의 거리합과 해당 단어의 출현 빈도수를 산출하는 단계를 포함함을 특징으로 하는 상위 온톨로지 추출 방법.
  6. 제 5항에 있어서, 상기 단어의 가중치는 하기 수학식에 의해 산출함을 특징으로 하는 상위 온톨로지 추출 방법.
    [수학식]
    Figure 112014055352605-pat00003

    A, B는 양의 상수
  7. 상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법에 있어서,
    저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계;
    상위 클래스에서 하위 클래스 순으로 순차적으로 상기 온톨로지를 구성하고 있는 각 클래스의 구조를 미리 저장되어 있는 온톨로지 구조와 비교하는 단계;
    미리 저장되어 있는 온톨로지 구조와 동일한 구조를 갖는 상기 온톨로지를 구성하고 있는 클래스의 최하위 클래스를 추출하는 단계;
    추출한 상기 최하위 클래스를 하나의 그룹으로 그룹핑하는 단계;
    상기 온톨로지를 구성하고 있는 단어별로 가중치를 산출하는 단계;를 포함함을 특징으로 하는 상위 온토롤지 추출 방법.
  8. 상위 온톨로지와 상기 상위 온톨로지의 하위 개념을 포함하는 하위 온톨로지로 구성된 계층 구조를 갖는 복수의 클래스로 구성된 온톨로지에서 상기 상위 온톨로지를 추출하는 방법에 있어서,
    저장된 상기 온톨로지의 구조 및 이름을 분석하는 단계;
    상위 클래스에서 하위 클래스 순으로 순차적으로 상기 온톨로지를 구성하고 있는 각 클래스의 구조를 미리 저장되어 있는 온톨로지 구조와 비교하는 단계;
    미리 저장되어 있는 온톨로지 구조와 동일한 구조를 갖는 상기 온톨로지를 구성하고 있는 클래스의 최하위 클래스를 추출하는 단계;
    추출한 상기 최하위 클래스를 하나의 그룹으로 그룹핑하는 단계;
    상기 온톨로지를 구성하고 있는 각 단어별로 가중치를 계산하는 단계;
    계산한 상기 가중치가 설정값 이상인 상기 단어가 상기 하나의 그룹에 포함되어 있으면, 상기 단어가 포함된 클래스를 상위 온토롤지로 추출하는 단계를 포함함을 특징으로 하는 상위 온톨로지 추출 방법.
  9. 제 8항에 있어서, 각 단어별 가중치를 계산하는 단계는,
    각 단어들간의 거리합과 해당 단어의 출현 빈도수를 산출하는 단계를 포함함을 특징으로 하는 상위 온톨로지 추출 방법.
  10. 제 9항에 있어서, 상기 단어의 가중치는 하기 수학식에 의해 산출함을 특징으로 하는 상위 온톨로지 추출 방법.
    [수학식]
    Figure 112014055352605-pat00004

    A, B는 양의 상수
KR1020130008717A 2013-01-25 2013-01-25 상위 온톨로지 추출 방법 KR101452943B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130008717A KR101452943B1 (ko) 2013-01-25 2013-01-25 상위 온톨로지 추출 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130008717A KR101452943B1 (ko) 2013-01-25 2013-01-25 상위 온톨로지 추출 방법

Publications (2)

Publication Number Publication Date
KR20140095833A KR20140095833A (ko) 2014-08-04
KR101452943B1 true KR101452943B1 (ko) 2014-10-22

Family

ID=51744072

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130008717A KR101452943B1 (ko) 2013-01-25 2013-01-25 상위 온톨로지 추출 방법

Country Status (1)

Country Link
KR (1) KR101452943B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090018487A (ko) * 2007-08-17 2009-02-20 울산대학교 산학협력단 온톨로지 자동 구축을 위한 개념 및 인스턴스 분류 시스템
KR20130001552A (ko) * 2011-06-27 2013-01-04 한국과학기술정보연구원 온톨로지 기반의 문서 분류 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090018487A (ko) * 2007-08-17 2009-02-20 울산대학교 산학협력단 온톨로지 자동 구축을 위한 개념 및 인스턴스 분류 시스템
KR20130001552A (ko) * 2011-06-27 2013-01-04 한국과학기술정보연구원 온톨로지 기반의 문서 분류 방법 및 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
이지윤 외 2명, "온톨로지 통합기반의 상위 온톨로지 추출에 관한 연구", 제24회 한국정보처리학회 추계학술발표대회 논문집 제12권 제2호, pp. 481~484, 2005.11. *

Also Published As

Publication number Publication date
KR20140095833A (ko) 2014-08-04

Similar Documents

Publication Publication Date Title
Jiang et al. Wikipedia-based information content and semantic similarity computation
Nguyen et al. Web-page recommendation based on web usage and domain knowledge
CN108681557B (zh) 基于自扩充表示和相似双向约束的短文本主题发现方法及系统
CN101814067B (zh) 对自然语言内容中的信息含量进行定量估算的系统和方法
US20060288275A1 (en) Method for classifying sub-trees in semi-structured documents
KR20130060720A (ko) 목적 기반 시맨틱 서비스 디스커버리를 위한 서비스 목적 해석 장치 및 방법
US9864795B1 (en) Identifying entity attributes
CN112507109A (zh) 一种基于语义分析与关键词识别的检索方法和装置
CN106874397B (zh) 一种面向物联网设备的自动语义标注方法
Ojha et al. Metadata driven semantically aware medical query expansion
KR100954842B1 (ko) 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체
CN114997288A (zh) 一种设计资源关联方法
Hao et al. Semantic patterns for user‐interactive question answering
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
Ma et al. Stream-based live public opinion monitoring approach with adaptive probabilistic topic model
Emami et al. A pattern-matching method for extracting personal information in farsi content
Nethra et al. WEB CONTENT EXTRACTION USING HYBRID APPROACH.
Oo Pattern discovery using association rule mining on clustered data
Abramowicz et al. Supporting topic map creation using data mining techniques
Annam et al. Entropy based informative content density approach for efficient web content extraction
KR101452943B1 (ko) 상위 온톨로지 추출 방법
Manuja et al. Intelligent text classification system based on self-administered ontology
Singh et al. Semantic web mining: survey and analysis
Chahal et al. An ontology based approach for finding semantic similarity between web documents
Li et al. Research on hot news discovery model based on user interest and topic discovery

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171017

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181010

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190925

Year of fee payment: 6