KR20200082179A - 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법 - Google Patents
공간 데이터의 의미론적 주석을 위한 데이터 변환 방법 Download PDFInfo
- Publication number
- KR20200082179A KR20200082179A KR1020180172510A KR20180172510A KR20200082179A KR 20200082179 A KR20200082179 A KR 20200082179A KR 1020180172510 A KR1020180172510 A KR 1020180172510A KR 20180172510 A KR20180172510 A KR 20180172510A KR 20200082179 A KR20200082179 A KR 20200082179A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- xml
- rdf
- rdb
- metadata
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/84—Mapping; Conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 RDB(Relational Database) 또는 RDF(Resource Description Framework)의 형식으로 구성된 공간 데이터의 의미론적 주석을 XML(Extensible Markup Language) 형식으로 변환하기 위한 방법에 있어서, RDB 형식의 데이터에 대하여 SQL(Structured Query Language) 기반 쿼리를 이용하여 데이터와 메타데이터를 추출하고, RDF 형식의 데이터에 대하여 SPARQL(Simple Protocol and RDF Query Language)을 이용하여 상기 데이터 및 상기 메타 데이터를 추출하는 단계; 상기 추출된 데이터 및 메타 데이터를 XML 데이터 모델에 대하여 매핑 및 변환 하는 단계; 상기 변환된 데이터를 확장 XML과 함께 XML 파일로 저장하고, 상기 변환된 메타데이터 또는 데이터 구조에 대한 정보는 확장 XSD를 가진 XML 스키마 파일에 저장하는 단계; 를 포함할 수 있다.
Description
본 발명은 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법에 관한 것으로서, 보다 상세하게, RDF 또는 RDB의 형식으로 구성된 공간 데이터의 의미론적 주석을 XML 형식으로 변환하기 위한 데이터 변환 방법에 관한 것이다.
웹에서 정보의 양이 빠른 속도로 증가하고 있어 멀티미디어와 시각화 데이터의 데이터 크기가 증가하고 있다. 멀티미디어 데이터는 컬러, 깊이, 그리고 도면 특징에 대한 정보를 가진 비디오를 형성하기 위해 이미지와 사운드를 합친 것이다.
물체의 움직임과 표현에 관한 모든 정보의 대부분은 공간 데이터다. 기술의 발전은 멀티미디어 정보에서 더 많은 제어와 지능을 가지기 위해 링크된 데이터를 포함한 데이터 표현은 이미지 검색의 관계에 대한 컨텍스트 인식의 개념을 가져왔다.
그러한 시스템에 포함되는 예로는 지리 정보 시스템(Geographic Information System: GIS), 얼굴 인식 시스템 등이 있다. 지도의 경우 벡터 정보를 저장하는 데 위도 및 경도와 같은 정보가 사용된다. 이 정보를 함께 링크하면 예를 들어 타임스탬프 지향 날씨 정보와 같은 세 배의 형태로 추가 속성을 추가하는 기능이 있을 수 있다.
데이터 연결은 RDF(Resource Description Framework)로 알려진 시멘틱 웹 데이터 모델을 통해 달성된다. 따라서 공간 데이터를 RDF 기반 트리플로 변환하여 의미론적 주석을 위한 모델이 필요하다. 웹 응용 프로그램에서 멀티미디어 데이터는 RDB(Relational Database)의 형태로 저장된다.
이러한 데이터 세트를 RDB에서 시멘틱 웹(SW)으로 변환해야하는 경우, 호환성 문제로 인한 데이터 손실이 발생하는 문제점이 있다.
상기한 과제를 해결하기 위한 본 발명의 실시예 따른 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법은 의미론적을 주석을 포함하며, RDB 또는 RDF로 구성된 데이터를 서로 변환할 수 있도록 하는 것에 그 목적이 있다.
또한, 본 발명의 실시예 따른 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법은 의미론적 주석을 포함하는 공간 데이터의 양식을 변경함으로써 공간 데이터 기반의 데이터베이스가 강화되도록 하고, 의미론적 의미론적 주석을 포함하는 공간 데이터를 통한 시스템의 추론 능력을 향상시키도록 하는 것에 다른 목적이 있다.
상기한 문제점을 해결하기 위한 본 발명의 일 실시예에 따른 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법은 RDB(Relational Database) 또는 RDF(Resource Description Framework)의 형식으로 구성된 공간 데이터의 의미론적 주석을 XML(Extensible Markup Language) 형식으로 변환하기 위한 방법에 있어서, RDB 형식의 데이터에 대하여 SQL(Structured Query Language) 기반 쿼리를 이용하여 데이터와 메타데이터를 추출하고, RDF 형식의 데이터에 대하여 SPARQL(Simple Protocol and RDF Query Language)을 이용하여 상기 데이터 및 상기 메타 데이터를 추출하는 단계; 상기 추출된 데이터 및 메타 데이터를 XML 데이터 모델에 대하여 매핑 및 변환 하는 단계; 상기 변환된 데이터를 확장 XML과 함께 XML 파일로 저장하고, 상기 변환된 메타데이터 또는 데이터 구조에 대한 정보는 확장 XSD를 가진 XML 스키마 파일에 저장하는 단계; 를 포함할 수 있다.
상기 XML 파일 및 XML 스키마 파일로 저장된 상기 데이터 및 상기 메타 데이터를 상기 RDB 또는 상기 RDF 형식으로 변환하는 단계; 를 더 포함할 수 있다.
본 발명은 상 의미론적을 주석을 포함하며, RDB 또는 RDF로 구성된 데이터를 서로 변환할 수 있도록 할 수 있다.
또한, 본 발명은 의미론적 주석을 포함하는 공간 데이터의 양식을 변경함으로써 공간 데이터 기반의 데이터베이스가 강화되도록 하고, 의미론적 의미론적 주석을 포함하는 공간 데이터를 통한 시스템의 추론 능력을 향상시키도록 하는 효과가 있다.
다만, 본 발명의 일 실시예가 달성할 수 있는 효과는 이상에서 언급한 것들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 데이터 변환 프로세스의 일반적 표현을 나타낸 도면이다.
도 2는 분리된 링크 데이터와 메타 데이터에 대한 XML 변환 프로세스를 나타낸 도면이다.
도 3은 본 발명의 실시예에 따라 RDB, XML 및 RDF 간의 데이터 변환을 설명하기 위한 도면이다.
도 4는 본 발명의 실시예에 따라 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법을 설명하기 위한 도면이다.
도 5는 7.3 천개의 세계 주요 도시에 대한 공간 데이터 세트를 예시하기 위한 도면이다.
도 6은 MySQL 데이터베이스의 "worldcities"의 스키마를 예시하여 설명하기 위한 도면이다.
도 7은 공간 데이터 XML 스키마를 예시하여 표현한 도면이다.
도 8은 공간 데이터 XML을 예시하여 표현한 도면이다.
도 9는 공간 데이터 RDFS를 예시하여 표현한 도면이다.
도 10은 공간 데이터 RDF 데이터를 예시하여 표현한 도면이다.
도 11은 도시의 RDF 데이터 세트를 이용하여 표현된 세계 지도를 나타낸 도면이다.
도 12는 트리플을 이용하는 테이블 구조에 대한 REF 그래프를 나타낸 도면이다.
도 13은 공간 데이터의 변환 이후 RDF 및 RDFS에 대한 샘플 RDF 그래프를 나타낸 도면이다.
도 14는 스마트 네비게이션 검색 모델을 예시하여 설명한 도면이다.
도 15는 SPARQL를 통한 RDF 데이터세트를 이용하여 스마트 네비게이션과 네트워크 라우팅을 나타낸 도면이다.
도 2는 분리된 링크 데이터와 메타 데이터에 대한 XML 변환 프로세스를 나타낸 도면이다.
도 3은 본 발명의 실시예에 따라 RDB, XML 및 RDF 간의 데이터 변환을 설명하기 위한 도면이다.
도 4는 본 발명의 실시예에 따라 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법을 설명하기 위한 도면이다.
도 5는 7.3 천개의 세계 주요 도시에 대한 공간 데이터 세트를 예시하기 위한 도면이다.
도 6은 MySQL 데이터베이스의 "worldcities"의 스키마를 예시하여 설명하기 위한 도면이다.
도 7은 공간 데이터 XML 스키마를 예시하여 표현한 도면이다.
도 8은 공간 데이터 XML을 예시하여 표현한 도면이다.
도 9는 공간 데이터 RDFS를 예시하여 표현한 도면이다.
도 10은 공간 데이터 RDF 데이터를 예시하여 표현한 도면이다.
도 11은 도시의 RDF 데이터 세트를 이용하여 표현된 세계 지도를 나타낸 도면이다.
도 12는 트리플을 이용하는 테이블 구조에 대한 REF 그래프를 나타낸 도면이다.
도 13은 공간 데이터의 변환 이후 RDF 및 RDFS에 대한 샘플 RDF 그래프를 나타낸 도면이다.
도 14는 스마트 네비게이션 검색 모델을 예시하여 설명한 도면이다.
도 15는 SPARQL를 통한 RDF 데이터세트를 이용하여 스마트 네비게이션과 네트워크 라우팅을 나타낸 도면이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고, 이를 상세한 설명을 통해 상세히 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명은 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제 1, 제 2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.
또한, 본 명세서에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.
이하에서는, 도면을 참조하여 본 발명의 기술적 사상에 따른 예시적인 실시예들에 대해 설명한다.
본 발명에는 제한된 사용자 정의로 RDB에서 RDF로 전환하지만 호환성 문제를 방지하는 데 도움이 되는 방법이 설명되어 있다.
본 발명에서는 데이터 유형 수준의 차이를 이해하기 위해 데이터 매핑을 허용하는 아이디어가 도입되었다. 이러한 매핑은 XML(Extensible Markup Language) 기반 데이터 구조를 중간 데이터 발표자로 사용하여 수행된다. 제어 실험을 수행하여 XMLS(Extensible Markup Language Schema)가 RDB에서 RDF로의 전환을 수행하는 데 더 효과적인지 여부를 조사하였다. 이 접근 방식을 사용하면 데이터 손실 및 호환성 문제 없이 RDB에서 RDF로 데이터를 변환할 수 있으며, 결과적으로 기존 시스템 시맨틱 웹 기반 시스템으로 쉽게 전환할 수 있다.
시맨틱 웹(SW)은 개인과 PC가 이해하는 수많은 특성화된 단어만큼 데이터의 중요성을 정확하게 표현할 수 있도록 해주는 웹의 제공을 위한 확장이다. SW에서 데이터는 자원 설명 프레임워크(Resource Description Framewaork: RDF)라고 알려진 또 다른 웹 기반 표준을 사용하여 표현된다. 철학은 SW기반의 한 부분으로 활용되는 기본적인 생각들 중에서 두드러지며, RDFS(Resource Description Framework Schema)와 OWL(Web Ontology Language)은 두 가지 W3C가 제안하는 물리학적 표현이다.
SW는 특수 숙달, 로봇화, 화해, 정보의 재사용을 강화하고, 현재의 웹 발전으로는 결정될 수 없는 상호 운용성 이슈에 대한 지원을 제공할 것이다. 현재, 시멘틱 웹 인덱스에 대한 연구는 다른 모든 단계보다 앞서 있으며, 야후, 구글, 빙 등과 같은 기존의 웹 검색 도구가 여전히 현재 웹 인덱스의 시장을 파괴하고 있기 때문이다. 이 연구는 밀접하게 연계된 데이터를 추출하기 위해 웹 기반 데이터 변환에서 보여졌다.
의미론적 주석 진보의 현재 단계에서는 서로 다른 품질의 이기종 데이터 모델, 애플리케이션, 정보 표현 형태 및 링크된 데이터 기반 통신을 위한 방법이 있다. 여기서 각각의 모델들은 특정한 임무와 목적을 위해 맞춤 제작되었다. 표준과 규약의 유연성은 다음과 같은 논리를 통해 생성된 추리 규칙을 통해 진실되고 연속적인 배포 운영자의 결과를 취함으로써 사회적 프레임워크에서 개선될 수 있다.
가장 기초가 약한 RDFS(Resource Description Framework Schema)에서 OWL(Web Ontology Language)로 가는 의미적 웹의 다양한 방언으로 온톨로지(Ontology Language)를 사용할 수 있다.
웹 크롤링(Web crawling)과 관련하여, 현재, 다양한 작업 환경에 대한 통찰력 있는 웹 목록이 작성되고 실현되며, 이러한 웹 크롤러를 이해하는 부분은 강화되고 구체적인 검색을 위해 작성된다. 이러한 조사는 결론 기반 구조에 대한 서술적 추론과 지능적인 검색 엔진 지원 웹 애플리케이션을 제공하기 위해 개선된 도서관 기원을 결합했다.
검색 엔진 별로, 관련 개발을 평가하여 웹 크롤러의 수익성을 처리하고 촉진할 수 있는 조건과 정보 웹 크롤러의 요청을 특징 지을 수 있는 조건을 보여준다.
다음은 웹 크롤러에 의행 웹사이트를 탐색하는 동안 추적된 일반적인 단계들이다. 첫째, 웹 페이지를 탐색하기 위한 URL이 주어진다. 둘째, 전체 페이지는 데이터 마이닝을 위한 텍스트 부분과 깊게 기어가기 위한 링크 부분을 분리하는 것으로 보여지고 있다. 셋째, 페이지에 대한 새로운 링크가 발견되면, 첫째 단계를 반복한다. 넷째, 웹 페이지의 끝에서 크롤러 실행을 중지한다.
공간 데이터 의미론적 주석(Spatial data semantic annotation)과 관련하여, 전용 공간 순서 및 제한 인터페이스를 활용하는 특정 데이터베이스 프레임워크 활용해야 한다. 그러나 이러한 프레임워크는 예측할 수 없으며, 그것뿐만 아니라 어떤 GIS도 일부 비 GIS 정보를 저장한다. 게다가, 비 GIS 정보의 경우, SQL이 표준으로 바뀌었다.
GIS 용도가 실험실과 강력한 논리 기반에서 앞으로 나아가고, 택시 예약 프레임워크와 같은 좀 더 전통적인 적용에서 발견됨에 따라, 좀 더 전통적인 배치에 대한 요건은 폭발적으로 증가하였다. 여기서 또 다른 요인은 GPS 프레임워크를 활용하기 위한 경제적이고 직접적인 접근성이다. 다재다능한 통신 체계로 통합될 수 있기 때문에 택시, 선박, 또는 순찰차에 소모되는 비용이 절감되었다.
이제 공간 데이터에 대한 의미론적 주석이 지능적 조사의 접근성을 향상시킬 수 있다. 의미 웹은 PC가 웹에서 이용 가능한 정보의 중요성 또는 의미론을 파악할 수 있게 해준다. 그 의미론들은 데이터 결합, 관심 그리고 검사의 검사에 전적으로 도움이 되었다. 링크된 데이터는 분류되고 특히, 자원 설명 프레임워크(RDF)와 OWL과 같은 웹 합리성 언어로 묘사된다.
미스티시즘은 지각화의 공식적 규격이다. 그 생각은 클래스와 속성 그리고 그들 사이의 관계를 이용하여 언급된다. 그 클래스들들은 서로 다른 종류, 특히 하위 클래스, 슈퍼클래스, 합류 클래스, 유니언 클래스, 보충 클래스로 구성되어 있다. 그리고 클래스의 속성은 속성은 두 가지 종류, 특히 데이터 속성과 기사 속성에서 중요하다.
데이터 모델을 하나의 형태로 의미적 데이터 모델로 변환할 때, RDF 또는 OWL은 두 모델 간의 매핑을 지원해야 한다.
데이터 및 메타 데이터 간의 변환과 관련하여, 초기 10년 동안 확률론적 모델 내에서 관계와 대칭을 활용하는 것은 광범위한 데이터 마이닝 문제를 처리하는 데 있어 놀랄 만큼 의미 있는 결과를 낳았다. 이러한 과정에서 중요한 작업 중 하나는 매개변수/구조 학습 또는 역량 있는 결론을 위한 넘버링이다.
본 발명의 실시예에서는 그래프 데이터베이스에 대한 수집이 확률론적 유도 및 학습 전략을 확대하기 위한 실행 가능한 절차가 될 수 있는지에 대해 설명한다. 이를 통해, 올바른 숫자와 추론된 숫자를 모두 얻기 위한 도표화된 데이터베이스 요청이 실행을 산출하지 않고 보다 신속한 검색을 가능하게 하는 최전선 유도 및 학습 프레임워크를 만들 수 있다는 것을 알 수 있다.
도 2에서 소스 파일에서 가져온 데이터와 메타데이터 정보를 별도로 저장하기 위해 이질적인 데이터가 전송된다. 이 정보는 태그 지정되는 정보를 알고 있는 모든 응용 프로그램에서 추가로 사용할 수 있다. 범용 XML 형식의 데이터가 추가 정보 처리를 위해 준비될 수 있다.
데이터 추출과 관련하여, 웹에서 데이터를 보는 것을 통한 데이터 복구는 일반적인 데이터 복구와 비교하여, 문제점이 있다. 검색 엔진 간의 다양한 인덱싱 방법은 극적인 정확도와 다양한 표현으로 검색 결과를 반환한다. 구글, 야후, 빙은 캐치프레이스를 설정한 후 이 요청을 처리했다. 하지만, 이러한 검색 엔진은 단지 웹 페이지에서 이용할 수 있는 정보를 요청한다.
월드 와이드 웹은 의미론적 구조가 근접하지 않은 가장 긴 전체 데이터베이스로서, 웹 크롤러가 체이스 스트링으로서 고객이 제공한 정보를 이해하는데 문제가 있을 수 있다.
RDF 기초 데이터 매핑과 관련하여, RDF를 데이터 모델로 사용하면 통합되고 링크되며 덜 복잡한 통합 데이터 표현으로 캡처, 공유, 검색, 분석, 전송 및 시각화하기 위한 빠르고 간단하며 효과적인 데이터를 얻을 수 있다.
데이터 뱅크를 부분적으로 또는 완전히 데이터 구조와 메타데이터를 나타내기 위해 XMLS(Extensible Markup Language Schema) 또는 RDFS(Resource Description Framework Schema)로 변환할 수 있다. XML 문서의 식별자를 관찰함으로써 기계는 다른 시스템으로의 적절한 추론과 데이터 전송을 위한 클래스나 속성으로 적합한 역할에 더 적합한 태그를 선택할 수 있는 반면, XML 문서는 지능형 및 규칙 기반 데이터 해석 시스템의 기능을 개선하기 위해 RDF 문서로 변환될 수 있다.
향상된 결과와 데이터 처리를 위해 변환 과정 동안 XML의 원래 구조를 영향을 받지 않도록 하는 것이 필수적이다. 직접 또는 간접적인 방법으로 RDB에서 RDF로 매핑할 수 있다. RDB와 RDF 매핑 언어(R2RML)와 같은 간접적인 방법에는 XML의 중간 사용 없이 RDB에서 RDF로 테이블 매핑이 포함된다.
다른 간접적인 방법은 XML을 사용하여 RDB에서 RDF로 스키마를 변환하는 것이다. XML 스키마는 DTD 또는 XML 형식 중 하나로 찾을 수 있다. 데이터 변환에 대한 매핑 메커니즘은 두 가지 다른 데이터 모델 간에 이용 가능한 기법 및 대체 데이터 대표자의 합의를 필요로 하는 반면, RDB에서 RDF(R2R)에 대한 데이터 표현에 대해 도입된 다른 변환 기법에는 직접 매핑, eD2R, R2O, D2RQ, 트리플라이제이션, 관계 등이 포함된다.
OWL, R2RML 및 R3M 같은 빅데이터 분야에서 확인된 또 다른 데이터 표현은 RDF에서 유도된 개선사항과 함께 개발된 헤더 사전 트리플(Header Dictionary Truple: HDT)이다.
심층적으로, 데이터베이스, XML 및 RDF 간의 자원 연결 개념은 웹 기반 데이터의 문맥과 의미를 변경하지 않고 쿼리를 사용하여 의미적 존재를 형성하는 것이다. 이러한 접근방식은 단일 측면 변환 접근방식을 얻기 위해 포착될 수 있다.
상기한 차이점 외에도, 주요 사항은 RDF의 각 리소스에 식별을 위한 고유한 통일 리소스 식별자(Uniform Resource Identifier: URI)가 할당된다는 것이다. 따라서, 데이터 식별과 이러한 의미 기반 표현식의 표현에 관한 정보는 트리플 형태로 제공된다.
본 발명은 모델이 데이터 모델의 다른 측면, 사용자 정의, 제약 및 구조를 포함함으로써 RDB 스키마에서 RDF 스키마로 공간 데이터 변환 프로세스를 나타내는 방식으로 구성된다. 이러한 데이터 모델은 공간 데이터 집합, XML, RDB 및 RDF이다.
또한 RDB 스키마에서 XML 스키마로의 변환, XML 스키마에서 RDF 스키마로의 변환, RDB에서 XML 로의 변환, XML에서 RDF로의 변환 등 네 가지 변환이 변환 과정에서 사용된다.
본 발명의 실시예에 따른 공간 데이터 변환 방법(Spatial data transformation methodology)와 관련하여, 적은 손실로 데이터 변환 프로세스를 도 3과 도 4를 참조하여 설명하기로 한다.
반드시 필요한 요건은 변환 프로세스가 완료되지 않을 경우 새로운 매핑 메커니즘을 구성할 수 있는지 신중하게 점검하는 것이다. 유사한 기능을 달성하기 위해, 도입되는 모델은 XML을 중간 수준의 데이터 변환 프로세스로 사용하고 있다. 제안된 양방향 변환 프로세스의 추상적 모델은 도 3에서와 같이 RDB와 RDF 사이의 전환이 가능함을 보여준다. 이 때, XML은 XML은 RDB에서 RDF 또는 RDF와 RDF 사이의 데이터 변환 사이에 포함된다. 즉, RDB에서 RDF로 또는 RDF에서 RDB로의 변환 과정에서 XML로의 변환을 거쳐야 한다.
매핑은 하기 [표 1]과 같이 RDB, RDF, XML 의 데이터 모델 에 대하여 주로 이루어질 수 있다.
[표 1]
이러한 데이터 모델은 데이터, 데이터 유형 및 데이터 구조의 제약을 다룬다. 변환 메커니즘은 XML, RDB 또는 RDF에 속하는 경우 다른 매핑된 언어로 된 각 데이터의 대안으로 다루어진다. 변환이란 한 데이터 모델에서 다른 데이터 모델로 가져온 데이터를 재구성하는 과정이다.
하나의 데이터 폼을 다른 데이터 폼으로 변환하기 위해선 다음의 프로세스가 중요한 단계로 작용한다. 즉, 콘테이너 데이터를 개발하는 단계, 캡처되야 하는 모든 제약 조건을 파악하는 단계, DB와 XML 또는 XML과 RDF와 같은 두 가지 플랫폼을 통합하는 방법을 계획하는 단계, 호환성 및 제한으로 인해 발생하는 문제에 대한 해결 방법을 개발하는 단계, 각 변환의 유효성을 검사하는 단계, 제안된 모델에 따라 추가 프로세스를 수행하기 위하여 결과를 관리하는 단계, 두 가지 다른 패러다임에 대한 역방향 변환하는 단계를 포함할 수 있다.
본 발명의 실시예에 따른 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법은 RDB(Relational Database) 또는 RDF(Resource Description Framework)의 형식으로 구성된 공간 데이터의 의미론적 주석을 XML(Extensible Markup Language) 형식으로 변환하기 위하여 데이터 추출 단계, 매핑 및 변환 단계, XML 파일 저장 단계를 포함할 수 있다.
데이터 추출 단계는 RDB 형식의 데이터에 대하여 SQL(Structured Query Language) 기반 쿼리를 이용하여 데이터와 메타데이터를 추출하고, RDF 형식의 데이터에 대하여 SPARQL(Simple Protocol and RDF Query Language)을 이용하여 상기 데이터 및 상기 메타 데이터를 추출하는 단계일 수 있다.
매핑 및 변환 단계는 상기 추출된 데이터 및 메타 데이터를 XML 데이터 모델에 대하여 매핑 및 변환 하는 단계일 수 있다.
그리고, XML 파일 저장 단계는 상기 변환된 데이터를 확장 XML과 함께 XML 파일로 저장하고, 상기 변환된 메타데이터 또는 데이터 구조에 대한 정보는 확장 XSD를 가진 XML 스키마 파일에 저장하는 단계를 의미할 수 있다.
또한, 본 발명의 다른 실시예에서 상기 XML 파일 및 XML 스키마 파일로 저장된 상기 데이터 및 상기 메타 데이터를 상기 RDB 또는 상기 RDF 형식으로 변환하는 단계를 더 포함할 수 있다.
보다 상세하게, RDB로부터의 데이터 추출은 SQL 기반 쿼리를 사용하여 수행되지만, RDF로부터의 데이터 추출의 경우, SQL과 유사한 SPARQL을 사용한다. 도 3에서와 같이, 전방 또는 후방 데이터 변환은 RDB의 경우 SQL이 필요하고, RDF의 경우 SPARQL이 필요하다.
이후, 이러한 데이터 추출은 메타데이터를 다른 형식으로 변경할 수 있도록 만들며, 본 발명의 경우 RDB 또는 RDF가 예시될 수 있다.
데이터 추출이 완료된 후 XML 데이터 모델에 대한 데이터 매핑 및 변환이 시작된다.
이 때, 변환에 필요한 전체 정보를 수집한 후 데이터 및 메타데이터를 변환되고, 두개의 개별 파일로 저장될 수 있다.
변환 후 데이터는 확장 XML과 함께 XML 파일로 저장된다. 이 때, 메타데이터 또는 데이터 구조에 대한 정보는 확장 XSD를 가진 XML 스키마 파일에 저장된다. 이를 통하여 목표 데이터 포맷에 대한 변환이 완료될 수 있다. 예를 들어, 전방 데이터 변환의 경우 RDB로의 변환이 완료되고, 후방 데이터 변환의 경우 RDF로 변환이 완료될 수 있다.
데이터 스토리지의 관계 데이터 모델을 사용하는 시스템을 지원하는 방법론은 시맨틱 웹을 사용하여 데이터 링크의 고급 기능을 갖는 기능 및 용량 특성을 가지고 있다.
도 4는 RDF를 데이터모듈로 사용하는 데이터의 의미론적 주석 프로세스를 데이터 및 메타데이터 수준 변환을 통해 보여준다. 이 과정은 위도 및 경도 벡터와 함께 지도의 공간 데이터 집합에서 시작하여 이 데이터를 RDB, XML 및 RDF 간의 분석, 변환 및 변환 단계를 통해 전달한다.
그래서 이 모델은 공간 데이터, 데이터 전송, 데이터 변환의 3단계로 분류된다.
상기한 본 발명의 실시예에 따른 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법을 검증하는 과정을 설명하기로 한다. 도 5를 참조하면, 제안된 방법론을 시험하기 위해, 7.3천 개의 도시 정보를 기반으로 한 공간 데이터 세트가 표시된다. 공간 정보는 city(도시의 이름), lat(위도), lng(경도), country(도시가 속한 국가 이름), iso2(알파-2 국가 iso 코드), iso3(알파-3 iso 국가 코드), admin(도시의 행정 구역) 및 population (추정된 도시의 도시 인구)과 같은 속성이 부여될 수 있다. 위도와 경도에 따른 모든 도시는 도 5에 예시될 수 있다.
본 발멸의 실시예에 따른 방법의 작동을 위해, 공간 데이터 세트는 프로세스를 시작하는 데 필요한 관계형 DB에 배치될 수 있다. 이를 위해 선정된 RDB는 "worldcities"로 명명된다. 이 DB는 단일 테이블에 구축되며, 데이터베이스의 스키마는 도 6에 나타나 있다.
공간 데이터 집합에서 RDB 데이터 및 메타데이터를 생성하는 프로세스 후, RDB에서 XML로 변환 프로세스가 시작된다. RDB 스키마의 매핑 메커니즘을 따라 XML로 변환된 스키마는 도 7에서 샘플로 표시되는 반면, XML 데이터는 도 8에서 보여진다.
XMLS에서 상위 요소는 복잡한 요소로 표현된다. 각각의 복잡한 요소를 나타낸다. 상위 요소는 RDB의 관계를 나타내는 다른 복잡한 요소로 더 구성된다. 그런 다음, 이 관계 요소는 XML 등가성의 제한 태그를 통한 카디널리티의 제약과 함께 관계의 각 필드를 대표하는 단순한 요소로 구성된다. 여기서 각 기록 필드 값은 예를 들어, <city> 태그의 <cities> 태그에 "Qal eh-ye Now"가 포함된 것처럼, 상위 관계 태그의 하위 항목으로 필드의 태그 아래에 표시된다.
RDB에서 XML로 변환 과정을 완료한 후에는 XML에서 RDF로 변환한다. 매핑 메커니즘을 따라 변환 중인 RDFS에 대한 XML 스키마는 도9에 예시되며, RDF에 대한 XML 데이터는 도 10에 나와 있다. RDFS에서 클래스는 관계를 나타내기 위해 사용되는 반면 속성은 필드를 나타내기 위해 사용된다. RDF에서 데이터 값은 클래스 태그 콜론 필드 태그(예: <worldcities:cities_id>)를 사용하여 저장되며, 여기서 worldcities는 데이터베이스 이름이고 citys_id는 도시 관계에 대한 필드 이름이다.
스마트 쿼리 및 탐색을 위해 의미론적 주석으로 표시된 공간 데이터 세트를 검토한다. 도 11은 도 5와 비슷하지만 데이터 집합의 데이터 모델 간에는 차이가 있다. 도 11에서는 지도에 각 도시를 표시하는 동안 주석으로 표시된 RDF 데이터 세트를 사용한다. 이전 그림에서, 지도는 데이터 집합에 대한 직접적인 추론 메커니즘을 실행함으로써 탐색할 수 없었다. 그러나, 변환 과정 후에 공간 데이터에 스마트 탐색을 구축하기 위한 규칙으로 데이터를 쿼리할 수 있다.
트리플 형식의 모든 RDF 출력은 "그루프"라고 알려진 도구에서 유효성 검사를 위해 시뮬레이션되고 테스트된다. 거친 도구는 자동 SPARQL 쿼리를 작성하기 위한 그래픽 인터페이스를 사용하여 RDF ontology를 보고 업데이트하는 데 널리 사용된다.
도 12에서 페이먼트 테이블 변환은 그림으로 표시된다.
도 13은 속성의 카디널리티를 가진 바인딩 등급에 관련된 제한 삼각망을 보여주는 샘플 그래프 표를 나타낸다. 그 외에, 모든 대표 술어와 노드의 범례는 도면의 왼쪽에 표시되지만, RDF 그래프 형태의 트리플은 추론에 사용할 수 있는 공간 데이터의 데이터 연계를 보여준다.
상기한 본 발명의 실시예에 따라 다음과 같은 효과를 얻을 수 있다. 첫째, 공간 데이터가 RDF 또는 OWL 데이터 형식으로 변환될 수 있다. 둘째, 스키마 및 데이터 수준의 차이 매핑할 수 있다. 셋째, 의미론을 포함하도록 공간 데이터 기반 DB 내용 강화할 수 있다. 넷째, RDB와 RDF 간의 변환을 위해 개발된 도구와 언어 들의 그레이 영역(greay areas)를 분별할 수 있다.
거대한 정보의 구성요소 중 하나는 프레임워크에 들어가거나 나가는 어떤 형태로든 다른 형태의 정보를 가지고 작업하는 것이다. 이 정보는 의미적으로 풍부한 정보, 사회적 정보, 계층적 정보 또는 다른 유형의 정보일 수 있다.
이러한 방식으로 RDF, RDB 또는 XML 상태에서 발견된 정보는 아직 문제가 해결되지 않은 경로를 향하여 변경되기 위해 숙련되어야 하며, 이러한 정보는 진실로 취급되어야 한다. 본 명세서는 RDF로의 양방향 정보 변경에 초점을 맞추고 있다. 특별한 경우로서, 본 명세서는 양방향 변화를 고려하는 공간 데이터, RDB 및 RDF에 집중해 온 반면, 양방향 변경에 관한 에센스는 XML 형식을 통한 모든 정보 분류를 해석하기 위해 제안된 요약된 모델과 함께 작업하는데 사용되었다.
도 14는 주석으로 표시된 공간 데이터에 구축된 스마트 탐색 메커니즘을 가진 변환된 RDF 스토어를 위한 모델을 예시한다. 결과 모델은 SPARQL을 통한 사용자 조회를 지원하여 경도 및 위도 특징에 기초한 다른 도시와의 연계 및 도시에 대한 정보를 얻는다.
다음으로, 도 15 (B)에서 주석으로 표시된 공간 데이터 집합과 관련된 미래 표본 애플리케이션은 데이터 라우팅 관련 문제를 추진함에 있어 스마트 네트워크 탐색을 위해 보여지고, 도 15 (A)에서는 정보와 분산망과의 연계를 이용하여 도시의 현재 상태와 도시 선택에 활용될 수 있다.
그리고, 날씨 방송, 스마트 시티, 그리고 의미론적 주석을 단 공간 데이터가 시스템의 추론 능력을 향상시킬 수 있는 훨씬 더 유사한 문제들이 많이 있을 수 있다.
결과적으로 본 명세서에는 서로 다른 데이터 모델의 관계와 지리적 데이터 분류에 대한 연계성에 관한 의미적 데이터 통합이 포함되었다. 데이터의 분류는 지도를 나타내는 경도, 위도, 고도 등의 속성을 가지고 있다. 또한 본 명세서는 공간 기반 RDB와 시멘틱웹 사이의 공통 기능을 사용하여 다양한 변환 도구와 기술에 현재 사용되는 데이터 모델을 비교하고 매핑하는 데 기여한다.
각 기술의 약점은 변환을 거치는 동안 발견되는 한계를 명확하게 보여준다. 시스템의 양쪽 끝에서 동일한 결과를 얻기 위해서는 개선이 더 필요하다.
간접 변환에 주어진 도구를 사용하면 기술 기반의 날씨 또는 항법 예측 시스템을 더 낫고 향상시키는데 도움이 될 수 있다.
호환성이 향상된 RDB와 SemanticWeb 사이의 데이터 검색 및 저장에 시스템이 사용된다.
그 프레임워크와 함께 현재 사용 가능한 툴과 방법론에 대한 연구는 데이터 통합 및 변환을 위한 최신 메커니즘을 도입하는 데 도움이 될 수 있다.
이상, 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
Claims (2)
- RDB(Relational Database) 또는 RDF(Resource Description Framework)의 형식으로 구성된 공간 데이터의 의미론적 주석을 XML(Extensible Markup Language) 형식으로 변환하기 위한 방법에 있어서,
RDB 형식의 데이터에 대하여 SQL(Structured Query Language) 기반 쿼리를 이용하여 데이터와 메타데이터를 추출하고, RDF 형식의 데이터에 대하여 SPARQL(Simple Protocol and RDF Query Language)을 이용하여 상기 데이터 및 상기 메타 데이터를 추출하는 단계;
상기 추출된 데이터 및 메타 데이터를 XML 데이터 모델에 대하여 매핑 및 변환 하는 단계;
상기 변환된 데이터를 확장 XML과 함께 XML 파일로 저장하고, 상기 변환된 메타데이터 또는 데이터 구조에 대한 정보는 확장 XSD를 가진 XML 스키마 파일에 저장하는 단계; 를 포함하는 것을 특징으로 하는 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법. - 제1 항에 있어서,
상기 XML 파일 및 XML 스키마 파일로 저장된 상기 데이터 및 상기 메타 데이터를 상기 RDB 또는 상기 RDF 형식으로 변환하는 단계; 를 더 포함하는 것을 특징으로 하는 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180172510A KR102157218B1 (ko) | 2018-12-28 | 2018-12-28 | 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180172510A KR102157218B1 (ko) | 2018-12-28 | 2018-12-28 | 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200082179A true KR20200082179A (ko) | 2020-07-08 |
KR102157218B1 KR102157218B1 (ko) | 2020-09-18 |
Family
ID=71601457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180172510A KR102157218B1 (ko) | 2018-12-28 | 2018-12-28 | 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102157218B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112199556A (zh) * | 2020-10-14 | 2021-01-08 | 深圳市元征科技股份有限公司 | 一种XML Schema文件格式自动转换方法、系统及相关设备 |
WO2022092330A1 (ko) * | 2020-10-26 | 2022-05-05 | 주식회사 데이터누리 | Dcat 기반 메타데이터 변환 시스템 |
KR20220094797A (ko) * | 2020-12-29 | 2022-07-06 | 케이웨어 (주) | 메타정보를 관리하는 데이터 관리 서버 및 그 제어방법 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102493655B1 (ko) | 2020-12-01 | 2023-02-07 | 가천대학교 산학협력단 | 인공지능 모델 훈련 데이터셋의 관리방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080027251A (ko) * | 2005-05-09 | 2008-03-26 | 아마데우스 에스.에이.에스. | 데이터베이스로부터 xml 문서를 동적으로 생성하는 방법 |
KR20110034992A (ko) * | 2009-09-29 | 2011-04-06 | 전자부품연구원 | 동적 xml문서 생성방법 및 장치 |
KR101263945B1 (ko) * | 2012-03-21 | 2013-05-15 | 한국해양과학기술원 | 확장형 마크업언어 문서를 관계형 데이터베이스로 저장하는 방법 |
KR20130064160A (ko) * | 2011-12-07 | 2013-06-18 | 경북대학교 산학협력단 | Rdf 데이터에 대한 sparql 질의 결과의 개체 관계 변형 시스템 및 그 방법 |
-
2018
- 2018-12-28 KR KR1020180172510A patent/KR102157218B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080027251A (ko) * | 2005-05-09 | 2008-03-26 | 아마데우스 에스.에이.에스. | 데이터베이스로부터 xml 문서를 동적으로 생성하는 방법 |
KR20110034992A (ko) * | 2009-09-29 | 2011-04-06 | 전자부품연구원 | 동적 xml문서 생성방법 및 장치 |
KR20130064160A (ko) * | 2011-12-07 | 2013-06-18 | 경북대학교 산학협력단 | Rdf 데이터에 대한 sparql 질의 결과의 개체 관계 변형 시스템 및 그 방법 |
KR101263945B1 (ko) * | 2012-03-21 | 2013-05-15 | 한국해양과학기술원 | 확장형 마크업언어 문서를 관계형 데이터베이스로 저장하는 방법 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112199556A (zh) * | 2020-10-14 | 2021-01-08 | 深圳市元征科技股份有限公司 | 一种XML Schema文件格式自动转换方法、系统及相关设备 |
WO2022092330A1 (ko) * | 2020-10-26 | 2022-05-05 | 주식회사 데이터누리 | Dcat 기반 메타데이터 변환 시스템 |
KR20220094797A (ko) * | 2020-12-29 | 2022-07-06 | 케이웨어 (주) | 메타정보를 관리하는 데이터 관리 서버 및 그 제어방법 |
Also Published As
Publication number | Publication date |
---|---|
KR102157218B1 (ko) | 2020-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Visser et al. | Enabling technologies for interoperability | |
US7823123B2 (en) | Semantic system for integrating software components | |
Raskin et al. | Semantic web for earth and environmental terminology (sweet) | |
KR102157218B1 (ko) | 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법 | |
Masmoudi et al. | Knowledge hypergraph-based approach for data integration and querying: Application to Earth Observation | |
Fensel et al. | Lessons learned from applying AI to the web | |
Baglatzi et al. | Semantifying OpenStreetMap. | |
Malik et al. | A generic methodology for geo‐related data semantic annotation | |
Homburg et al. | Interpreting heterogeneous geospatial data using semantic web technologies | |
Craglia et al. | Inter-disciplinary interoperability for global sustainability research | |
Akbar et al. | On using declarative generation rules to deliver linked biodiversity data | |
Zhang et al. | A comprehensive overview of RDF for spatial and spatiotemporal data management | |
CN114265889A (zh) | 一种基于知识图谱的学科知识数据处理方法及装置 | |
Tang et al. | Ontology-based semantic retrieval for education management systems | |
Wagner et al. | A system design for implementing advanced feature descriptions for a map knowledge base | |
Masmoudi et al. | Semantic data integration and querying: a survey and challenges | |
Ge | Smart city multi-source data correlation methods | |
Wiegand et al. | A web query system for heterogeneous government data | |
Varanka et al. | Topographic mapping data semantics through data conversion and enhancement | |
Bogdanović et al. | An approach for the development of context-driven web map solutions based on interoperable GIS platform | |
Fernández-Ordóñez et al. | Geographic metadata and ontology based satellite image management | |
Mechouche et al. | Ontology-based formal specifications for user-friendly geospatial data discovery | |
Falquet et al. | Ontologies for interoperability | |
Ronzhin | Semantic enrichment and exploratory search of spatiotemporal data | |
Norman et al. | Exploring a linked data approach in accessing physical oceanography archive |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right |