KR20040000894A - 온톨로지를 바탕으로 한 포괄적 디티디 생성 방법 - Google Patents

온톨로지를 바탕으로 한 포괄적 디티디 생성 방법 Download PDF

Info

Publication number
KR20040000894A
KR20040000894A KR1020020035899A KR20020035899A KR20040000894A KR 20040000894 A KR20040000894 A KR 20040000894A KR 1020020035899 A KR1020020035899 A KR 1020020035899A KR 20020035899 A KR20020035899 A KR 20020035899A KR 20040000894 A KR20040000894 A KR 20040000894A
Authority
KR
South Korea
Prior art keywords
ontology
dtd
concept
generating
attributes
Prior art date
Application number
KR1020020035899A
Other languages
English (en)
Inventor
공용해
Original Assignee
공용해
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 공용해 filed Critical 공용해
Priority to KR1020020035899A priority Critical patent/KR20040000894A/ko
Publication of KR20040000894A publication Critical patent/KR20040000894A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

본 발명은 웹상의 표준 데이터로 새롭게 등장한 XML(eXtensible Markup Language) 문서에서 사이트 상호 간에 문서 규약을 정의하는 DTD(Document Type Definition)에 관한 것으로, 특히 XML 문서의 구조적 제약을 극복하고 보다 포괄적으로 사용할 수 있는 포괄적 DTD를 생성시키는 방법에 관한 것이다.
이를 위해 본 발명은 개념들간의 계층 구조와 속성, 그리고 그들간의 관계를 정의한 온톨로지(Ontology)를 이용하여 개념 구조를 위한 ENTITY를 생성하는 단계와, 개념과 그 속성에 대한 ELEMENT를 생성하는 단계와, 개념의 속성들에 대한 ATTLIST를 생성하는 단계와, 속성들에 대한 ELEMENT를 생성하는 단계를 거쳐 DTD를 생성한다.
이와 같이 개념 레벨(Level)에서 정의된 온톨로지에서 각 단계별로 DTD 작성 과정을 거침으로써 구조에 독립적이고 다양한 XML 문서에 적용이 가능한 포괄적인 DTD를 생성할 수 있다.

Description

온톨로지를 바탕으로 한 포괄적 디티디 생성 방법{A Method of Generating DTD based Ontology}
본 발명은 웹상에서 XML 문서의 구조를 정의하는 DTD를 생성하는 방법에 관한 것으로서, 특히 온톨로지를 바탕으로 하여 XML 문서 구조에 제약을 받지 않는 포괄적인 DTD를 생성하는 방법에 관한 것이다.
XML은 Extensible Markup Language, 즉 확장성 마크업 언어의 약자로, 이름그대로 HTML 같은 고정된 형식이 아닌 확장이 가능한 언어이다. HTML은 태그의 종류가 한정되어 있는 반면 XML은 문서의 내용에 관련된 태그를 사용자가 직접 정의할 수 있으며 그 태그를 다른 사람들이 사용할 수 있다. XML은 본질적으로 다른 언어를 기술하기 위한 언어이다.
마크업(Makrup)이란 본문, 즉 원래의 내용에 뭔가 특별한, 또는 추가적인 정보를 표시하는 모든 것을 말한다. 어떠한 마크업을 다른 사람들이 정확히 이해할 수 있으려면 그 마크업에 대해 마크업을 이루는 구성 요소들과 그 마크업이 실제로 무엇을 의미하는지에 대한 규정을 지어야 한다. 마크업 언어란 위와 같은 것들을 규정하는 규칙들의 집합이다.
DTD는 XML 문서의 문단을 구분하고, 주제의 제목을 식별하고, 또 각각이 어떻게 처리되어야할지를 나타내는 마크업(Markup)을 식별할 수 있도록, XML 문서와 함께 동반되는 하나의 규격이다.
XML문서와 함께 DTD를 메일(Mail)로 보내면, DTD 리더(Reader)를 갖고 있는 어떠한 곳에서도 그 문서를 처리하여, 원래 의도한대로 화면에 표시할 수 있다. 따라서 DTD는 협약된 인터넷 사이트나 기업의 인트라넷이나 엑스트라넷을 위한 모든 사람들이 문서의 포맷을 지정할 수 있고, 일반적으로 읽을 수 있는 하나의 새로운 표준으로 활용된다.
현재 W3C 등에서 XML 문서의 구조를 정의하는 DTD 표준화 작업을 진행하고 있으나, 표준화된 DTD가 표준화되기까지는 많은 시간과 노력이 필요하며, 수많은 정보에 대해 모든 DTD를 표준화하기는 사실상 어려운 일이다.
일반적인 DTD 작성 방법은 어떠한 정보에 대해 전체적인 내용과 세부 내용들을 설계하고, 설계한 내용에 맞춰 DTD를 작성한다.
그러나 이것은 정보에 대한 설계 과정에서 많은 노력이 필요하며 설계한 내용이 DTD로 작성하기에 부적합한 경우도 종종 발생한다. 또한, 작성된 DTD는 구조에 의존적이기 때문에, 작성된 DTD로 표현할 수 있는 XML 문서의 구조는 매우 한정적이다.
본 발명은 상기한 바와 같은 DTD 표준화에 대한 문제점을 해결하고자 하는 목적으로 안출된 것으로서, 웹상에서 확고한 자리를 잡아가고 있는 XML 문서들에 대해서 구조에 독립적인 DTD를 제공하는데 목적이 있다.
DTD란 XML 문서 구조를 정의하는 것으로써 각각의 XML 문서들은 자신만의 문서 구조를 정의한 DTD를 독립적으로 가지고 있는데 유사한 분야의 XML 문서일 지라도 구조가 달라지면 DTD는 각각의 문서에 개별적으로 존재 하여야만 한다. 그러나 온톨로지 기반의 DTD를 이용하면 유사 개념의 XML 문서들은 동일한 DTD로 접근 될 수 있다.
이러한 목적들을 달성하기 위해서는 위에서 설명한 온톨로지 표현법을 바탕으로 하여 개념과 각 개념들의 속성을 나타내고 개념들간의 관계를 나타내는 정확한 온톨로지를 설계 하여야 한다. 보다 상세하고 정확하게 설계된 온톨로지를 통해 생성된 DTD는 다양한 구조를 나타낼 수 있으므로 다양한 XML 문서에서 이를 이용한 문서작성이 가능해 지고 온톨로지를 기반으로 XML 문서로부터 정보를 추출하는 과정 또한 가능하게 만든다.
도1은 본 발명에 따라 온톨로지에 표현된 개념정보를 이용하여 DTD를 생성하는 흐름도.
도2는 온톨로지로 표현하기 위한 Person과 MusicCD 개념의 기본적인 계층구조를 나타내는 예시도.
도3은 개념의 속성과 다른 개념들과의 관계를 보여주는 예시도.
도4는 DTD 생성에 사용되는 Person과 MusicCD 개념의 온톨로지 예시도.
본 발명은 온톨로지를 이용하여 DTD를 생성하는 것을 특징으로 한다.
온톨로지는 정보의 공유를 위한 하나의 접근 방법으로 활용되고 있으며 온톨로지는 존재 그 자체, 또는 그것이 지니고 있는 공통적이며 근본적인 규정을 뜻하며, 개념화를 위한 규정이다. 온톨로지의 구성 요소들은 개념들 사이의 관계성 그리고 개념들의 속성, 도메인에 대한 가정들을 규정한 논리적 공리(Axiom)등 일반적인 개념들이다.
현재, 온톨로지를 이용한 연구들은 온톨로지에 개념 계층구조와 그들 간의 관계 외에 공리(Axiom)를 이용하여 DTD를 생성하는데 공리는 개념들 간의 상호 연관 관계에서 추론 되어지는 것으로 이러한 공리는 온톨로지가 복잡해질수록 더욱 찾아내기 어려워지고 실질적으로 온톨로지 작성자에 의해서 수작업으로 이루어져야 하므로 상당한 부담으로 작용된다.
기존의 온톨로지는 이러한 공리를 포함하고 있지만, 본 발명에서 사용된 온톨로지는 공리를 포함하지 않고 개념들의 속성과 그 구조만을 가지고 온톨로지를 작성하여 DTD를 생성하므로 온톨로지 작성시의 부담을 크게 줄일 수 있게된다.
도4에서 보는 바와 같이, 온톨로지를 표현하는 언어들은 대부분 논리 언어 중 하나인 Frame-Logic의 두 가지 표현 방법을 따른다. 우선, 개념들 간의 계층구조(도2참조)를 표현하기 위한 :: 기호를 사용한다.
C1 :: C2는 C1은 C2의 하위 개념이라는 것을 의미한다. 예를 들면, Song :: Album 과 같이 개념들의 계층 구조를 표현한다.
다음으로, 개념들의 속성을 표현하기 위한 [=>>] 기호를 사용한다. C1[ A=>>C2 ]는 C1의 속성 A는 C2로 정의한다는 것을 의미한다. 예를 들면, Song[recordedAlbum=>>Album] 과 같이 Song에 대한 속성을 표현한다.
도3은 개념정보에서 표현한 개념들의 계층 구조를 도식화하여 상위개념과 하위개념의 상속관계를 보여준다.
온톨로지의 개념들은 DTD에서 element 타입으로 전환되고 개념의 속성은 subelement 와 element 들의 XML 속성으로 정의되며 만약 서로 다른 개념의 속성이 element 와 관계가 있다면 다른 개념과의 관계를 element 로 표현하고 그렇지 않을 경우에는 간단히 개념구조상의 값을 의미하는 PCDATA 로 나타낸다.
본 발명은 도1에서 보는 바와 같이 상기와 같은 방법으로 온톨로지를 생성하여, 이를 이용하여 개념 및 속성클래스(ENTITY,ELEMENT)를 생성하며, 이를 이용하여 포괄적 DTD를 생성하는 것을 특징으로 한다.
이를 좀더 상세히 설명하면, 생성된 온톨로지를 대상으로 하여, DTD생성기는 다음의 단계들을 선택적으로 또는 전부 거침으로써 포괄적 DTD를 생성하게 된다.
가). 개념 구조를 위한 ENTITY 생성
개념 구조를 위한 ENTITY를 생성하기 위해, 어떠한 개념이 주어지면 그 개념을 상위 개념으로 갖는 하위 개념들을 재귀호출에 의한 방법으로 순회하면서 찾아낸다. 개념 리스트 전체를 순회하면서 최상위 개념인 Object를 찾을 때까지, 상위 개념들을 계속해서 검색하고, 자신과 상속관계에 있는 개념들을 발견하면 그들과의 관계를 ENTITY로 설정한다. 다음은 개념 구조를 위한 ENTITY 생성을 위한 위사 코드(Pseudo Code)이다.
『 if(i<개념 리스트의 크기)
if(개념존재)
재귀호출
if(superconcept 존재)
재귀호출 』
온톨로지에서 표현되는 개념들간의 구조를 DTD의 ENTITY로 표현하는 과정으로, 개념들간의 상속을 적용할 수 있게 한다.
나). 개념과 그 속성에 대한 ELEMENT 생성
개념들이 갖는 속성을 정의하기 위해서, 주어진 개념에 대한 속성을 정의하기 앞서, 상위 개념들의 속성을 상속 받아 자신의 속성에 포함시켜야 한다. 이를 위해서 재귀호출을 이용한 방법으로 자신의 상위 개념들을 순회하여 각 속성들을 상속 받은 뒤에 마지막으로 자신의 속성을 순회하게 된다. 다음은 개념과 그 속성에 대한 ELEMENT 생성을 위한 의사코드 이다.
『 if(개념 존재)
for(j<superconcept 리스트의 크기)
재귀호출
if(Attribute 존재)
for(k<attribute 리스트의 크기)
attribute 상속 』
각 개념의 속성들을 DTD로 표현하기 위해 DTD 표현법 중 ELEMENT를 이용한다. 표현하는 과정으로, 상위 개념의 속성을 상속받게 된다.
다). 개념의 속성들에 대한 속성리스트 생성
속성리스트 생성 과정은 상기 ‘나’항에서 설명한 개념과 그 속성에 대한 ELEMENT 생성과 같은 방법으로 속성들을 순회한다.
상위 개념이 있을 경우, Object를 찾을 때 까지 재귀호출에 의한 방법으로 순회하고 Object를 발견하면 되돌아오면서 속성들을 상속 받는다. 온톨로지의 속성들로부터 DTD의 속성을 표현하는 과정으로 상위 개념의 속성들을 그대로 상속 받아 속성리스트를 생성한다.
라). 속성들에 대한 ELEMENT 생성
도3과 같이, 개념과 개념들의 상속 외에 서로간의 연관 관계를 표현하는 과정으로, 각 개념들의 속성들을 순회하면서 속성의 타입에 따라 전체 개념들을 순회하여 해당 타입을 찾는다. 속성 값이 STRING 이나 NUM 값이 아닌 개념일 때, 해당 개념에서 자신과 관계가 있는 속성이 있는가를 검색한다.
이 과정에서 개념들 간의 상호 연관 관계를 알 수 있게 된다. 다음은 속성에 대한 ELEMENT 생성을 위한 의사 코드 이다.
『 for(i<concept 리스트의 크기)
if(attribute 존재)
for(j<attribute 리스트의 크기)
if(attribute값 체크)
#PCDATA 출력
else
for(m<concept 리스트의 크기)
if(attribute값과 concept 비교)
해당 concept 출력 』
속성의 타입이 STRING 이나 NUM 인 것은 다른 개념들과 연관이 없는 것이므로 #PCDATA로 표현하고, 다른 개념을 참조하는 것은 그 개념과 자신과의 연관 관계를 검색하고 관계가 있으면 #PCDATA 이후에 연관 있는 개념 목록을 적어준다.
마). 상기 과정에 의해 생성된 온톨로지의 개념과 속성 및 그들의 관계를 DTD의 문법에 맞게 표현하여 DTD를 생성하게 된다.
이상에서 본 발명에 대한 기술 사상을 서술하였지만 이는 본 발명의 가장 핵심적인 부분을 설명한 것이지 본 발명을 한정하는 것은 아니다. 또한, 이 기술 분야의 통상의 지식을 가진 자이면 누구나 본 발명의 기술 사상의 범주를 이탈하지 않는 범위 내에서 다양한 변형이 가능할 것이다.
이상에서 설명한 바와 같이 본 발명에 따라 온톨로지를 기반으로 작성된 DTD는 root element가 정해져 있지 않기 때문에 다른 XML 문서에 적용 가능하며, 단지 하나의 온톨로지와 하나의 DTD를 이용하여 다양한 문서를 생성하고 접근할 수 있게 된다.
다시 말해서 원칙적으로 기존의 단순한 DTD 생성 방법으로는 두 개의 서로 다른 XML 문서에 동일한 DTD를 적용 시킬 수 없었지만 온톨로지를 기반으로 생성된 DTD는 구조에 독립적이기 때문에 구조적으로 서로 다른 두 개의 XML 문서에 모두 적용 가능하다. 또한 공리를 이용한 기존의 방법을 지양하고 이를 DTD 생성시 배제시킴으로써 온톨로지 작성시에 발생하는 부담을 크게 줄였으며 이것으로 효율성을 극대화 시켰다.
이렇게 생성된 DTD는 서로 유사한 분야의 XML 문서에서 표준으로 이용함으로써 구조적 통일성을 이룰 수 있고 이로 인하여 보다 많은 정보에 접근할 수 있는 기반을 만들 수 있을 것이라고 기대된다.

Claims (6)

  1. 표현하고자 하는 개념 정보의 개념들간의 계층 구조 및 속성들을 이용하여 온톨로지를 생성하는 과정을 포함하여 이루어 지는 것을 특징으로 하는 온톨로지를 바탕으로 한 포괄적 DTD 생성방법.
  2. 제1항에 있어서;
    상기 생성된 온톨로지를 입력으로 받아 개념구조를 위한 ENTITY를 생성하는 과정을 더 포함하는 것을 특징으로 하는 온톨로지를 바탕으로 한 포괄적 DTD 생성방법.
  3. 제1항에 있어서;
    상기 생성된 온톨로지를 입력으로 받아 개념과 그 속성에 대한 ELEMENT를 생성하는 과정을 더 포함하는 것을 특징으로 하는 온톨로지를 바탕으로 한 포괄적 DTD 생성방법.
  4. 제1항에 있어서;
    상기 생성된 온톨로지를 입력으로 받아 속성들에 대한 속성리스트를 생성하는 과정을 더 포함하는 것을 특징으로 하는 온톨로지를 바탕으로 한 포괄적 DTD 생성방법.
  5. 제1항에 있어서;
    상기 생성된 온톨로지를 입력으로 받아 전체 개념들을 순회하면서 속성들에 대한 ELEMENT를 생성하는 과정을 더 포함하는 것을 특징으로 하는 온톨로지를 바탕으로 한 포괄적 DTD 생성방법.
  6. 표현하고자 하는 개념 정보의 개념들간의 계층 구조 및 속성들을 이용하여 온톨로지를 생성하는 과정과;
    상기 생성된 온톨로지를 입력으로 받아 개념구조를 위한 ENTITY를 생성하는 과정과, 상기 생성된 온톨로지를 입력으로 받아 개념과 그 속성에 대한 ELEMENT를 생성하는 과정과, 상기 생성된 온톨로지를 입력으로 받아 속성들에 대한 속성리스트를 생성하는 과정과;
    상기 과정에 의해 생성된 온톨로지의 개념과, 속성 및 그들의 관계를 DTD의 문법에 맞게 표현하여 DTD를 생성하는 과정을 포함하여 구성된 것을 특징으로 하는 온톨로지를 바탕으로 한 포괄적 DTD 생성방법.
KR1020020035899A 2002-06-26 2002-06-26 온톨로지를 바탕으로 한 포괄적 디티디 생성 방법 KR20040000894A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020020035899A KR20040000894A (ko) 2002-06-26 2002-06-26 온톨로지를 바탕으로 한 포괄적 디티디 생성 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020035899A KR20040000894A (ko) 2002-06-26 2002-06-26 온톨로지를 바탕으로 한 포괄적 디티디 생성 방법

Publications (1)

Publication Number Publication Date
KR20040000894A true KR20040000894A (ko) 2004-01-07

Family

ID=37312698

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020035899A KR20040000894A (ko) 2002-06-26 2002-06-26 온톨로지를 바탕으로 한 포괄적 디티디 생성 방법

Country Status (1)

Country Link
KR (1) KR20040000894A (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000038284A (ko) * 1998-12-05 2000-07-05 정선종 문서 관리 시스템을 위한 구조화된 문서의 데이터베이스 저장및 복원방법 및 그 장치
KR20000051170A (ko) * 1999-01-19 2000-08-16 남궁석 구조화 문서를 관계형 데이터베이스에 저장/관리하는 방법
WO2001095155A2 (en) * 2000-06-06 2001-12-13 Groove Networks, Inc. Method and apparatus for efficient management of xml documents
KR20030054750A (ko) * 2001-12-26 2003-07-02 엘지전자 주식회사 Ngis 메타데이터 교환을 위한 xml dtd 설계

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000038284A (ko) * 1998-12-05 2000-07-05 정선종 문서 관리 시스템을 위한 구조화된 문서의 데이터베이스 저장및 복원방법 및 그 장치
KR20000051170A (ko) * 1999-01-19 2000-08-16 남궁석 구조화 문서를 관계형 데이터베이스에 저장/관리하는 방법
WO2001095155A2 (en) * 2000-06-06 2001-12-13 Groove Networks, Inc. Method and apparatus for efficient management of xml documents
KR20030054750A (ko) * 2001-12-26 2003-07-02 엘지전자 주식회사 Ngis 메타데이터 교환을 위한 xml dtd 설계

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"""Web Ontology Language 와 그 활용에 관한 고찰""" *
다양한 구조를 모두 표현할 수 있는 통합 DTD와 이를 효율적으로 관리 및 처리하기위한 FORM 기반 구조문서 처리방법 *

Similar Documents

Publication Publication Date Title
US7237192B1 (en) Methods and systems for naming and indexing children in a hierarchical nodal structure
Motik et al. OWL 2 web ontology language: Structural specification and functional-style syntax
Cranefield UML and the Semantic Web
US20020147748A1 (en) Extensible stylesheet designs using meta-tag information
US20130103705A1 (en) Schema mapping and data transformation on the basis of a conceptual model
US20080301545A1 (en) Method and system for the intelligent adaption of web content for mobile and handheld access
Boyer Canonical XML version 1.0
Xiao et al. Modeling and transformation of object-oriented conceptual models into XML schema
US8397157B2 (en) Context-free grammar
US20060242183A1 (en) Declaratively extended hierarchical configuration system and method
US20070006196A1 (en) Methods and systems for extracting information from computer code
Herman et al. GraphXML—an XML-based graph description format
US20070006179A1 (en) Methods and systems for transforming a parse graph into an and/or command tree
Hogan et al. Resource description framework
Kong et al. A graph grammar approach to software architecture verification and transformation
US20040221228A1 (en) Method and apparatus for domain specialization in a document type definition
EP1513073B1 (en) System and method for validating hierarchically-organized messages
Shatnawi et al. Encoding feature models using mainstream json technologies
KR20040000894A (ko) 온톨로지를 바탕으로 한 포괄적 디티디 생성 방법
DeRose What is a diagram, really?
Butler Barriers to real world adoption of semantic web technologies
Steel et al. Generating human-usable textual notations for information models
Felden The SKilL Language V1. 0
EP1377917A2 (en) Extensible stylesheet designs using meta-tag information
Cui et al. XML structure graphic display based on JSmind

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application