KR101897760B1 - 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법 - Google Patents
링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR101897760B1 KR101897760B1 KR1020180033617A KR20180033617A KR101897760B1 KR 101897760 B1 KR101897760 B1 KR 101897760B1 KR 1020180033617 A KR1020180033617 A KR 1020180033617A KR 20180033617 A KR20180033617 A KR 20180033617A KR 101897760 B1 KR101897760 B1 KR 101897760B1
- Authority
- KR
- South Korea
- Prior art keywords
- triple
- data
- attribute
- lod
- unit
- Prior art date
Links
Images
Classifications
-
- G06F17/30569—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법에 관한 것으로서, 더욱 상세하게는, 수집 또는 입력받은 데이터로부터 클래스를 선정하고, 데이터 속성에 따라 우선순위로 정의된 메타데이타 어휘를 사용하여 데이터 속성 및 객체 속성 관계를 도출한 후 자원서술체계(RDF) 트리플로 작성함으로써, 공개되어 있는 데이터를 손쉽게 트리플로 변환하여 지속적으로 저장 및 갱신함으로써, 링크드 오픈 데이터(LOD) 클라우드 정보 서비스를 제공할 수 있는, 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법을 제공한다.
Description
본 발명은 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법에 관한 것으로서, 더욱 상세하게는, 수집 또는 입력받은 데이터로부터 클래스를 선정하고, 데이터 속성에 따라 우선순위로 정의된 메타데이타 어휘를 사용하여 데이터 속성 및 객체 속성 관계를 도출한 후 자원서술체계(RDF) 트리플로 작성함으로써, 공개되어 있는 데이터를 손쉽게 트리플로 변환하여 지속적으로 저장 및 갱신함으로써, 링크드 오픈 데이터(LOD) 클라우드 정보 서비스를 제공할 수 있는, 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법에 관한 것이다.
'공공데이터'는 공공기관이 다루는 데이터 중 누구나 자유롭게 활용하고 재설계 혹은 재생산할 수 있도록 개방한 데이터를 일컫는다. 미국, 영국, 한국 정부 등은 오랫동안 공공데이터를 확산하기 위한 다양한 노력을 기울여 왔다. 공공데이터 품질을 높이기 위한 노력 가운데 하나가 '링크드 오픈데이터'(Linked Open Data, LOD)다.
LOD는 '링크드 데이터(Linked Data)'와 '공개 데이터(Open Data)' 성격을 모두 갖는 데이터다. 즉, 링크드 데이터 구축 원칙에 맞게 만든 개방형 데이터다. 링크드 데이터 구축 원칙은 글로벌 웹표준 제정 기구인 월드와이드웹컨소시엄(W3C) 중심으로 발전되고 있다. 4대 원칙은 아래와 같다.
링크드 데이터의 4대 원칙
1. 통합 자원 식별자(URI)를 사용한다.
2. URI는 HTTP 프로토콜을 통해 접근할 수 있어야 한다.
3. RDF나 스파클 같은 표준을 사용한다.
4. 풍부한 링크 정보가 있어야 한다.
링크드 데이터의 가장 큰 특징은 '통합 자원 식별자'(Uniform Resource Identifier, URI)'를 사용한다는 점이다. 흔히 알고 있는 'URL(Uniform Resource Locator)'과 비슷한 개념이다. URL이 특정 정보 자원의 종류와 위치를 가리킨다면, URI는 웹에 저장된 객체(식별자)를 가리킨다는 점에서 다르다.
지금의 웹은 문서 기반으로 연결돼 있다. URI를 활용하면 데이터를 중심으로 웹을 연결할 수 있다. 예컨대 소나무에 대한 데이터를 수목원에서 만들었다 치자. 수목원은 소나무의 명칭과 뜻, 분포지역, 사진 등의 자료를 정리해 올리게 된다. 그런데 국립중앙도서관도 소나무와 관련된 책을 소장하고, 이를 데이터로 입력해 올려놓았다. 웹에 중복 자료가 생긴 것이다.
예전에는 수목원 홈페이지 밑에 '참고자료 : (국립중앙도서관 홈페이지 주소)' 식으로 관련 정보를 수동으로 표시하는 식으로 두 웹사이트 정보를 연결하곤 했다. URI를 활용하면 각 기관에 있는 데이터를 곧바로 홈페이지에 연동해 보여줄 수 있다. 수목원에서는 기존 소나무 소개 페이지에 '소나무와 관련된 책 정보'를 바로 연결할 수 있다. 서로 다른 데이터베이스에 저장된 정보이지만, 웹을 매개체로 필요한 데이터를 서로 가져와 쓸 수 있는 것이다.
LOD는 거저 구축되는 게 아니다. 비용과 시간을 투자해야 하고, 전문 개발자도 투입돼야 한다. 그럼에도 많은 공공기기관이 LOD에 관심을 가져야 하는 이유는 명확하다. LOD가 공공데이터 품질을 높여주기 때문이다.
따라서, LOD가 제대로 구축되려면, 기존의 데이터로부터 쉽고 효율적으로 RDF 트리플로 변환할 수 있는 트리플 변환 방법이 제안되어야 한다.
한국등록특허 10-1836314에는, RDBMS 데이터의 트리플 자동변환방법 및 시스템이 개시되어 있다.
한편, 한국등록특허 10-1793925에는, 대용량 방송용 빅데이터의 지식 트리플 구축을 위한 변환 시스템 및 방법이 개시되어 있다.
따라서, 본 발명은 상기한 바와 같은 문제점을 해결하기 위하여 고안된 것으로, 본 발명의 목적은 수집 또는 입력받은 데이터로부터 클래스를 선정하고, 데이터 속성에 따라 우선순위로 정의된 메타데이타 어휘를 사용하여 데이터 속성 및 객체 속성 관계를 도출한 후 자원서술체계(RDF) 트리플로 작성함으로써, 공개되어 있는 데이터를 손쉽게 트리플로 변환하여 지속적으로 저장 및 갱신함으로써, 링크드 오픈 데이터(LOD) 클라우드 정보 서비스를 제공할 수 있는, 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법을 제공하는 것이다.
본 발명의 실시예들의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기한 바와 같은 목적을 달성하기 위한 본 발명의 일 실시예에 따른 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템에 있어서, 입력 데이터를 기설정된 스키마 또는 온톨로지 스키마에 근거하여 자원서술체계(RDF) 형식으로 변환하도록 하는 링크드 오픈 데이터(LOD) 모델을 관리하는 LOD 모델 관리부(101); 상기 LOD 모델에 대한 적합성 오류를 검증하고, 검출된 오류를 리포팅하는 추론 규칙 검증부(102); 상기 입력 데이터를 상기 LOD 모델에 기반하여 RDF 형식의 트리플로 생성 및 변환하기 위한 트리플 변환부(103); 및 상기 생성 및 변환한 트리플을 저장하고 관리하는 트리플 저장소(104)를 포함하는 것을 특징으로 한다.
한편, 상기한 바와 같은 목적을 달성하기 위한 본 발명의 일 실시예에 따른링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법에 있어서, 데이터를 입력받는 데이터입력단계(S410); 상기 입력 데이터를 LOD 모델에 기반하여 RDF 형식의 트리플로 생성 및 변환하기 위한 트리플 변환단계(S420); 상기 생성 및 변환한 트리플의 적합성 오류를 검증하는 오류검증단계(S430); 및 상기 생성 및 변환한 트리플을 저장하는 트리플 저장단계(S440)를 포함하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법에 의하면, 수집 또는 입력받은 데이터로부터 클래스를 선정하고, 데이터 속성에 따라 우선순위로 정의된 메타데이타 어휘를 사용하여 데이터 속성 및 객체 속성 관계를 도출한 후 자원서술체계(RDF) 트리플로 작성함으로써, 공개되어 있는 데이터를 손쉽게 트리플로 변환하여 지속적으로 저장 및 갱신함으로써, 링크드 오픈 데이터(LOD) 클라우드 정보 서비스를 효율적으로 제공할 수 있는 효과가 있다.
또한, LOD 기반의 통합 데이터베이스 구축으로 콘텐츠 개방과 공유의 정신을 실천하고 나아가 전문가들이 한 분야의 방대한 데이터를 기반으로 새로운 콘텐츠를 생산할 수 있게 한다.
또한, 양질의 정보를 손쉽게 구할 수 있는 기반을 제공하며, 링크드 오픈 데이터를 이용하여 지능화된 정보 서비스를 구축하고 지식정보의 선순환을 이룩할 수 있다.
또한, 본 발명은 일반적으로 공개되어있는 데이터를 기계 가독한 정보 형태로 손쉽게 생산하고 획득함으로써, 데이터 서비스 활성화를 통한 수익성 고취 등을 기대할 수 있다.
도 1은 본 발명에 따른 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템의 일 실시예 구성도.
도 2는 도 1의 LOD 모델 관리부의 일 실시예 구성도.
도 3은 도 1의 트리플 변환부의 일 실시예 구성도.
도 4는 본 발명에 따른 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법에 대한 일 실시예 흐름도.
도 5는 도 4의 트리플 변환단계에 대한 일 실시예 흐름도.
도 6은 본 발명에 따른 트리플 변환단계를 설명하기 위해 학술연구/과학기술 데이터의 관계형데이터베이스를 나타낸 일 실시예 도면.
도 7은 본 발명에 따른 트리플 변환단계를 설명하기 위해 학술연구/과학기술 데이터에 URI를 부여한 일 실시예 도면.
도 8은 본 발명에 따른 트리플 변환단계를 설명하기 위해 학술연구/과학기술 데이터를 RDF 트리플로 변환한 것을 나타낸 일 실시예 도면.
도 9는 본 발명에 따른 트리플 작성단계에서 '저자'를 프로그램으로 나타낸 일 실시예 설명도.
도 2는 도 1의 LOD 모델 관리부의 일 실시예 구성도.
도 3은 도 1의 트리플 변환부의 일 실시예 구성도.
도 4는 본 발명에 따른 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법에 대한 일 실시예 흐름도.
도 5는 도 4의 트리플 변환단계에 대한 일 실시예 흐름도.
도 6은 본 발명에 따른 트리플 변환단계를 설명하기 위해 학술연구/과학기술 데이터의 관계형데이터베이스를 나타낸 일 실시예 도면.
도 7은 본 발명에 따른 트리플 변환단계를 설명하기 위해 학술연구/과학기술 데이터에 URI를 부여한 일 실시예 도면.
도 8은 본 발명에 따른 트리플 변환단계를 설명하기 위해 학술연구/과학기술 데이터를 RDF 트리플로 변환한 것을 나타낸 일 실시예 도면.
도 9는 본 발명에 따른 트리플 작성단계에서 '저자'를 프로그램으로 나타낸 일 실시예 설명도.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다.
반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 명세서에서 사용되는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 공정, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 공정, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미가 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미가 있는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부된 도면을 참조하여 본 발명을 더욱 상세하게 설명한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정하여 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여, 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 또한, 사용되는 기술 용어 및 과학 용어에 있어서 다른 정의가 없다면, 이 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 통상적으로 이해하고 있는 의미를 가지며, 하기의 설명 및 첨부 도면에서 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 설명은 생략한다. 다음에 소개되는 도면들은 당업자에게 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 예로서 제공되는 것이다. 따라서, 본 발명은 이하 제시되는 도면들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 또한, 명세서 전반에 걸쳐서 동일한 참조번호들은 동일한 구성요소들을 나타낸다. 도면들 중 동일한 구성요소들은 가능한 한 어느 곳에서든지 동일한 부호들로 나타내고 있음에 유의해야 한다.
설명에 앞서, 본 명세서( 및 특허청구범위)에서 사용되는 용어에 대해 간단히 설명하도록 한다.
'개체(Entity)'는 하나의 독립된 형태로서 존재할 수 있는 단위로서, 독립적인 기능/속성을 가지고 있는 학술연구, 과학기술 등의 콘텐츠와 관련된 개체(예: 저자, 기관, 인용문헌, 출처 등)를 의미한다.
또한, '객체 또는 오브젝트(Object)'는 의사나 행위가 미치는 작용의 대상으로, 개체의 속성으로 존재하며 한 개체가 다른 개체를 객체로서 가지고 있을 수 있는 학술연구/과학기술 콘텐츠와 관련된 객체(예: 논문의 제목, 저자, 기관, 초록, 표, 그림, 키워드 등)를 의미한다.
'유의미한 객체'는 콘텐츠 저자, 기관, 주제 등 정보의 검색이나 관리에 빈번하게 사용되는 객체를 의미한다.
한편, 자원서술체계(Resource Description Framework)란 웹상의 정보 또는 데이터(리소스)를 하나의 표준 언어로 기술하기 위한 통일된 데이터 모델로써, 정보 또는 데이터(리소스)의 메타데이터 설명을 주어, 술어, 목적어 등의 트리플(Triple)로 표현한다. 주어(subject)는 설명하고자 하는 자원이고, 술어(predicate)는 그 자원의 특징, 정보 혹은 종종 다른 주어나 목적어와의 관계를 표현한다. 목적어(object)는 특징의 값이나 관계의 대상 등이 된다. 주어 및 술어는 URI로 목적어는 문자열 또는 URI로 표시한다.
도 1은 본 발명에 따른 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템의 일 실시예 구성도이다.
본 발명이 적용되는 전체 시스템은, 통신 네트워크를 통하여 연결된 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템(100) 및 상기 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템(100)으로부터 변환된 RDF 트리플을 제공받을 수 있는 사용자 단말(300), 및 데이터를 입력받기 위한 다수의 웹서버(미도시)를 포함한다.
여기서, 통신 네트워크는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 근거리 통신망(LAN; Local Area Network), 도시권 통신망(MAN; Metropolitan Area Network), 광역 통신망(WAN; Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 바람직하게는, 본 발명에서 말하는 통신 네트워크는 공지의 월드와이드웹(WWW; World Wide Web)일 수 있다.
상기 사용자 단말(300)은 일반적으로 통신 네트워크를 통하여 본인이 원하는 LOD 정보를 얻고자 검색을 하거나 여러 다양한 활동을 할 수 있도록 하는 기능을 포함하는 디지털 기기로서, 개인용 컴퓨터(예를 들어, 데스크탑 컴퓨터, 노트북 컴퓨터 등), 워크스테이션, PDA, 웹 패드, 이동 전화기 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기라면 얼마든지 본 발명에 따른 사용자 단말(300)로서 채택될 수 있다. 또한, 상기 사용자 단말(300)은 상기 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템(100)의 사용자 인터페이스(미도시)에 접속하여 LOD관련 질의가 가능하다.
도 1을 참조하면, 본 발명에 따른 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템(100)은, LOD 모델 관리부(101), 추론 규칙 검증부(102), 트리플 변환부(103), 및 트리플 저장소(104)를 포함한다.
상기 LOD 모델 관리부(101)는 입력 데이터를 기설정된 스키마 또는 온톨로지 스키마에 근거하여 자원서술체계(RDF) 형식으로 변환하도록 하는 링크드 오픈 데이터(LOD) 모델을 관리한다. 상세하게는, RDF, Excel, CSV, 사용자 정의 구분자 포맷 등을 RDF로 형식으로 매핑하는 것을 지원한다.
상기 추론 규칙 검증부(102)는 상기 LOD 모델에 대한 적합성 오류를 검증하고, 검출된 오류를 리포팅한다.
상기 트리플 변환부(103)는 상기 입력 데이터를 상기 LOD 모델에 기반하여 RDF 형식의 트리플로 생성 및 변환한다.
상기 트리플 변환부(103)는 RDBMS 데이터 및 정영화된 데이터 및 비정형화된 데이터를 수집하여 트리플을 생성하는 온톨로지(트리플) 변환기로써, 시맨틱웹 또는 Linked Open Data 구현을 위해 기존의 자체 보유 정보를 RDF 트리플로 변환하기 위한 방법을 제공하며, 상기 트리플 저장소(104)와 밀접하게 연동되어 시맨틱웹과 Linked Data를 구현한다.
상기 트리플 저장소(104)는 상기 생성 및 변환한 트리플을 저장하고 관리한다.
상세하게는, 트리플 저장소(Triple Store)는 시맨틱 웹에서 온톨로지를 트리플 형태의 데이터로 저장하고 관리하는 시스템을 말한다. Oracle과 같은 RDBMS를 트리플 저장소로 활용한 경우 대용량 데이터를 저장하기 위해 고성능의 장비를 갖추어야 하는 수직 확장성(Scale up)으로 인해 확장에 따른 비용이 급격히 증가한다. 그래서 데이터가 증가함에 따라 여러 대의 서버에 데이터를 분산 관리하는 수평 확장성(Scale out)을 갖춘 빅 데이터 프레임워크가 트리플 저장소로 활용되고 있다.
한편, 트리플 저장소는 자바 기반의 비동기 메시지 방식의 서버이며, 레파지토리 서버는 트리플을 저장 관리하는 역할을 담당하며, 웹 기반의 관리도구를 통해 트리플을 관리한다. Client API를 통해 외부 시스템에서 트리플을 추가, 수정, 및 삭제할 수 있으며 SPARQL 질의를 수행할 수 있다. 또한 트리플 저장소 Reasoner를 통해 수준별로 Description Logic 및 규칙 기반의 추론을 수행한다.
한편, 레파지토리 서버는, 메시지 기반의 프레임웍을 기반으로 대용량의 트리플 데이터를 저장하고 빠른 질의를 위한 색인을 구성한다. SPARQL 질의에 대한 요청을 처리하는 트리플 레파지토리로써 유연성과 안정성을 고려하여 다양한 부가 기능을 갖춘 서버이다.
한편, 본 발명에 따른 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템(100)은, 질의 수신부(미도시), 및 LOD 발행부(미도시)를 더 포함한다.
상기 질의 수신부는 사용자로부터의 질의를 수신한다. 상기 질의 수신부는 사용자 단말(300)로 시각화 기반 대화형 검색 서비스를 제공할 수 있다. 한편, 상기 질의는 SPARQL을 사용한다.
상기 LOD 발행부는 상기 수신한 질의에 대한 LOD를 발행한다.
한편, 출력되는 LOD는, 다양한 데이터 포맷으로 다운로드가 가능하며, LOD 메타데이터 상세 페이지는 해당 개체(URI)에 대한 상세 정보를 제공하는 페이지이며, 해당 페이지의 메타데이터 정보는 기본적으로 RDF 트리플로 구성되어 있으며 이는 Turtle, N-Triple, RDF/XML, JSON 등의 다양한 형식으로 변환되어 제공될 수 있다.
상기 LOD 모델 관리부(101), 추론 규칙 검증부(102), 트리플 변환부(104), 및 트리플 저장소(105)는 그 중 적어도 일부가 상기 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템(100)과 통신하는 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 상기 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템(100)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장될 수 있다. 또한, 이러한 프로그램 모듈들은 상기 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템(100)과 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.
도 2는 도 1의 LOD 모델 관리부의 일 실시예 구성도이다.
도 2에 도시된 바와 같이, 본 발명에 따른 LOD 모델 관리부(101)는 어휘 정의부(201), LOD 모델 생성부(202), 및 LOD 모델 저장부(203)를 포함한다.
상기 어휘 정의부(201)는 데이터의 속성에 따라 메타데이터 어휘가 정의되어 있다.
상기 LOD 모델 생성부(202)는 어휘가 정의되지 않은 속성의 데이터에 대한 메타데이터 어휘 및 LOD 모델을 생성 및 변경한다.
상기 LOD 모델 저장부(203)는 상기 생성 및 변경된 LOD 모델을 저장한다.
LOD 모델 설계시, 시맨틱 매핑 디자이너를 사용하며, 시맨틱 매핑 디자이너는 이클립스의 플러그인으로 개발된 온톨로지 설계도구로 개발된 GUI 환경의 변환 규칙 설계 도구이고, GUI 환경에서 변환 규칙을 설계하면서 활용하는 변환 규칙 파일 형식으로 변환 규칙을 생성한다.
LOD 모델 설계는 온톨로지 설계 도구에서 수행되며, 모델이 설계되면 파일 단위로 트리플 저장소에 등록하고 이를 관리하고, LOD 모델은 관리자만이 권한을 수행하여야 하며, LOD 모델 변경시 기존에 변환되어 생성된 트리플은 일괄 변환 방식으로 재 변환을 수행해야 한다.
온톨로지 설계 도구에 의해 자동으로 생성되는 LOD 모델이라면 적합성 오류는 발생하지 않지만, LOD 모델에 SWRL과 같은 규칙 추론을 반영할 경우, 규칙 추론의 오류가 발생할 수 있다. 이러한 경우에는 추론 규칙 검증기를 활용하여, 규칙 추론 활용 여부 검증해야 한다.
하기 [표 1]은 학술연구/과학기술 데이터에서 사용되는 메타데이터 어휘 종류 및 내용 설명을 나타낸다.
어휘 | 내용 |
PRISM | Publication 메타테이터 산업 표준을 위해 만들어진 어휘로 DC 요소에 추가적인 어휘를 정의함 |
PUR | PRISM Usage Rights Metadata |
DC | Doblin Core, 메타데이터를 표현하기 위한 어휘 |
DCTerms | DC에서 추가적인 어휘를 정의함 |
FOAF | Friends-of-A-Friend, 사람을 정의하거나 사람과 사람 사이의 관계를 표현하는 어휘 |
Schema | 구조화된 데이터를 효과적으로 표현하기 위한 방법을 제공하기 위해 만들어짐 |
Bibtex | 참고문헌 관리 시스템 |
SKOS | Simple Knowledge Organization System, 주제명 표목, 분류체계, 동의어 등 단순한 지식 체계를 표현함 |
VINEA | 필요에 의해 새로 생성할 어휘에 대한 네임스페이스 |
도 3은 도 1의 트리플 변환부의 일 실시예 구성도이다.
도 3에 도시된 바와 같이, 본 발명에 따른 트리플 변환부(103)는 클래스 선정부(301), 데이터 속성 관계 도출부(302), 객체 속성 관계 도출부(303), URI 결정부(304), 및 트리플 작성부(305)를 포함한다.
상기 클래스 선정부(301)는 입력 데이터에서, 독립적인 데이터 세트(set)가 되는 것 또는 브리지 테이블 중 키(key) 외에 다른 요소를 포함하고 있는 것을 클래스로 선정한다.
예를 들어,독립적인 데이터 세트(set)가 되는 것으로는, 논문, 저널, 참고문헌, 저자, 출판사, 기관 등이 될 수 있고, 브리지 테이블 중 키(key) 외에 다른 요소를 포함하고 있는 것으로는, 참고, 발행, 기여, 구독/소장, 소속 등이 될 수 있다.
한편, 키(Key)를 제외한 다른 요소는 주제 및 객체에 따라 값이 변경되어 이를 반영하기 위해서는 클래스의 인스탄스(Instance)로 표현될 수 있도록 한다.
권호정보 테이블은 논문 테이블에서에서 참조되고 있기 때문에 클래스로 선언하여 URI를 레퍼런스 할 수 있도록 설계해야 한다.
상기 데이터 속성 관계 도출부(302)는 상기 선정한 클래스의 속성에 따라 우선순위로 정의된 메타데이터 어휘를 사용하여 데이터 속성 관계를 도출한다.
예를 들어, [표 1]을 참조하면, "논문"에 대하여 데이터 속성 관계를 도출하기 위해서, 논문이나 저널에 대한 메타데이터를 표현하기 위한 어휘인 PRISM을 우선순위로 사용한다.(예: prism:doi, prism:startingPage) 한편, 메타데이터를 표현하기 위해 또 다른 어휘인 DC를 사용할 수도 있다.(예: dc:title, dc:issued 등)
한편, 의미적으로 적합한 어휘가 없거나 Domain, Range가 일치하지 않는 경우, 어휘가 정의되지 않은 속성의 데이터이며, 이에 대한 필요한 어휘를 생성하여 사용한다.(예: controlNumber, koi 등)
한편, "저자"에 대하여 데이터 속성 관계를 도출하기 위해서, 사람과 기관에 대한 정의 또는 사람과 사람 사이의 관계를 나타내는 FOAF 어휘를 우선순위로 사용한다.(예: foaf:name, foaf:phone) 그 외에는 Schema 어휘를 사용하거나 필요한 어휘를 생성하여 사용할 수도 있다.(예: schema:name, degree, majorYear)
한편, "참고문헌"에 대하여 데이터 속성 관계를 도출하기 위해서, 참고문헌 관리 시스템인 Bibtex를 우선순위로 사용한다.(예: bibtex:hasAuthor, bibtex:hasTitle) 그 외에는 논문 메타데이터인 PRISM을 사용할 수 있다.(prism:doi, prism:startingPage)
상기 객체 속성 관계 도출부(303)는 상기 브리지 테이블 중 클래스로 선정되지 않은 데이터를 연결된 두 개 테이블 사이의 관계로 설정하는 객체 속성 관계를 도출한다.
예를 들어, [표 1]을 참조하면, "논문"과 "저널" 사이에 관계를 갖는 Bridge Table이 있을 때, 논문과 저널 Table 사이의 관계를 객체 속성 관계로 도출한다. 한편, "InverseOf"(반대) 관계의 객체 속성 관계를 도출하여 도출된 객체 속성과 반대의 관계의 객체 속성도 표현이 가능한다.
한편, 도출한 객체 속성은 (kisti:publicationJournal, kisti:published)가 될 수 있으며, 포린 키(Foreign Key) 데이터는 객체 속성으로 표현할 수 있다.(예: 논문의 권호식별자, 권호정보의 저널식별자)
상기 URI 결정부(304)는 상기 선정된 클래스에 대하여 통합 자원 식별자(Uniform Resource Identifier, URI)를 부여한다.
예를 들어, 기본 URI(base URI)는 "lod.ndsl.kr/ontology"이며, Full URI는 "Class Instance - http://lod.ndsl.kr/ontology/테이블명/Primary key"이 될 수 있다. (예: http://lod.ndsl.kr/ontology/article/JAKO201001039067239)
한편, 속성은 "Base URI + property 명"이 될 수 있다. (예: http://lod.ndsl.kr/ontology/koi)
상기 트리플 작성부(305)는 상기 선정된 클래스, 도출된 데이터 속성, 및 도출된 객체 속성을 RDF 트리플로 작성한다.
상기 트리플 작성부(305)는 R2RML(RDB2RDF Mapping Language)를 포함한다.
상기 트리플 작성부(305)는, 트리플 맵, 논리 테이블, 주제 맵, 및 술어-오브젝트 맵을 이용한다.
상기 트리플 맵은, RDF 트리플을 생성하기 위한 맵핑 클래스이고, 상기 논리 테이블은, RDF로 변환하고자 하는 테이블의 이름이고(예: rr:tableName "ndml_author"), 상기 주제 맵은, 하나의 트리플이 갖는 URI 포맷을 지정하고(예: rr:template http://lod.ndsl.kr/ontology/{author_id}), 상기 술어-오브젝트 맵은, 주제와 관계를 가지는 술어와 오브젝트를 지정한다.(예: rr:predicate foaf:name, rr:objectMap [rr:column "KOR_NAME"])
트리플 맵은 논리 테이블의 각 행을 0 개 이상의 RDF 트리플로 변환하기위한 규칙을 지정한다. 트리플 맵은, LogicalTable, SubjectMap, PredicateObjectMap을 가진다.
논리 테이블의 한 행에서 생성된 RDF 트리플은 모두 동일한 주제를 공유한다다.
트리플 맵은 다음과 같은 다른 리소스를 참조하는 리소스로 표현된다. 정확히 하나의 "rr : logicalTable" 특성이 있어야 한다. 이 값은 SQL 쿼리 결과를 트리플로 매핑되도록 지정하는 논리 테이블이다.
도 4는 본 발명에 따른 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법에 대한 일 실시예 흐름도이다.
도 4를 참조하면, 본 발명에 따른 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법은, 먼저, 데이터를 입력받는다(S410).
상기 입력 데이터를 LOD 모델에 기반하여 RDF 형식의 트리플로 생성 및 변환한다(S420).
상기 생성 및 변환한 트리플의 적합성 오류를 검증한다(S430).
이후, 상기 생성 및 변환한 트리플을 저장한다(S440).
추가적으로, 상기 입력 데이터를 기설정된 스키마 또는 온톨로지 스키마에 근거하여 자원서술체계(RDF) 형식으로 변환하도록 하는 링크드 오픈 데이터(LOD) 모델을 관리한다(S450).
한편, 상기 LOD 모델 관리 단계(S450)는, 어휘가 정의되지 않은 속성의 데이터에 대한 메타데이터 어휘 및 LOD 모델을 생성 및 변경하고, 생성 및 변경된 LOD 모델을 저장하고 있다.
또한, 상기 LOD 모델 관리 단계(S450)는, 상기 선정한 클래스의 속성에 따라 우선순위로 정의된 메타데이터 어휘가 없는 경우, 필요한 어휘를 생성한다.
도 5는 도 4의 트리플 변환단계에 대한 일 실시예 흐름도이다.
도 5는 본 발명에 따른 도 4의 트리플 변환단계에 대한 일 실시예 흐름도이다.
상기 트리플 변환단계(S420)는, 먼저, 상기 입력 데이터에서, 독립적인 데이터 세트(set)가 되는 것 또는 브리지 테이블 중 키(key) 외에 다른 요소를 포함하고 있는 것을 클래스로 선정한다(S510).
예를 들어,독립적인 데이터 세트(set)가 되는 것으로는, 논문, 저널, 참고문헌, 저자, 출판사, 기관 등이 될 수 있고, 브리지 테이블 중 키(key) 외에 다른 요소를 포함하고 있는 것으로는, 참고, 발행, 기여, 구독/소장, 소속 등이 될 수 있다.
한편, 키(Key)를 제외한 다른 요소는 주제 및 객체에 따라 값이 변경되어 이를 반영하기 위해서는 클래스의 인스탄스(Instance)로 표현될 수 있도록 한다.
권호정보 테이블은 논문 테이블에서에서 참조되고 있기 때문에 클래스로 선언하여 URI를 레퍼런스 할 수 있도록 설계해야 한다.
이후, 상기 선정한 클래스의 속성에 따라 우선순위로 정의된 메타데이터 어휘를 사용하여 데이터 속성 관계를 도출한다(S520).
예를 들어, [표 1]을 참조하면, "논문"에 대하여 데이터 속성 관계를 도출하기 위해서, 논문이나 저널에 대한 메타데이터를 표현하기 위한 어휘인 PRISM을 우선순위로 사용한다.(예: prism:doi, prism:startingPage) 한편, 메타데이터를 표현하기 위해 또 다른 어휘인 DC를 사용할 수도 있다.(예: dc:title, dc:issued 등)
한편, 의미적으로 적합한 어휘가 없거나 Domain, Range가 일치하지 않는 경우, 어휘가 정의되지 않은 속성의 데이터이며, 이에 대한 필요한 어휘를 생성하여 사용한다.(예: controlNumber, koi 등)
한편, "저자"에 대하여 데이터 속성 관계를 도출하기 위해서, 사람과 기관에 대한 정의 또는 사람과 사람 사이의 관계를 나타내는 FOAF 어휘를 우선순위로 사용한다.(예: foaf:name, foaf:phone) 그 외에는 Schema 어휘를 사용하거나 필요한 어휘를 생성하여 사용할 수도 있다.(예: schema:name, degree, majorYear)
한편, "참고문헌"에 대하여 데이터 속성 관계를 도출하기 위해서, 참고문헌 관리 시스템인 Bibtex를 우선순위로 사용한다.(예: bibtex:hasAuthor, bibtex:hasTitle) 그 외에는 논문 메타데이터인 PRISM을 사용할 수 있다.(prism:doi, prism:startingPage)
이후, 상기 브리지 테이블 중 클래스로 선정되지 않은 데이터를, 연결된 두 개 테이블 사이의 관계로 설정하는 객체 속성 관계를 도출한다(S530).
예를 들어, [표 1]을 참조하면, "논문"과 "저널" 사이에 관계를 갖는 Bridge Table이 있을 때, 논문과 저널 Table 사이의 관계를 객체 속성 관계로 도출한다. 한편, "InverseOf"(반대) 관계의 객체 속성 관계를 도출하여 도출된 객체 속성과 반대의 관계의 객체 속성도 표현이 가능한다.
한편, 도출한 객체 속성은 (kisti:publicationJournal, kisti:published)가 될 수 있으며, 포린 키(Foreign Key) 데이터는 객체 속성으로 표현할 수 있다.(예: 논문의 권호식별자, 권호정보의 저널식별자)
이후, 상기 선정된 클래스에 대하여 통합 자원 식별자(Uniform Resource Identifier, URI)를 부여한다(S540).
예를 들어, 기본 URI(base URI)는 "lod.ndsl.kr/ontology"이며, Full URI는 "Class Instance - http://lod.ndsl.kr/ontology/테이블명/Primary key"이 될 수 있다. (예: http://lod.ndsl.kr/ontology/article/JAKO201001039067239)
한편, 속성은 "Base URI + property 명"이 될 수 있다. (예: http://lod.ndsl.kr/ontology/koi)
이후, 상기 선정된 클래스, 도출된 데이터 속성, 및 도출된 객체 속성을 RDF 트리플로 작성한다(S550).
상기 트리플 작성단계에서(S550)는, 트리플 맵, 논리 테이블, 주제 맵, 및 술어-오브젝트 맵을 이용한다.
상기 트리플 맵은, RDF 트리플을 생성하기 위한 맵핑 클래스이고, 상기 논리 테이블은, RDF로 변환하고자 하는 테이블의 이름이고(예: rr:tableName "ndml_author"), 상기 주제 맵은, 하나의 트리플이 갖는 URI 포맷을 지정하고(예: rr:template http://lod.ndsl.kr/ontology/{author_id}), 상기 술어-오브젝트 맵은, 주제와 관계를 가지는 술어와 오브젝트를 지정한다.(예: rr:predicate foaf:name, rr:objectMap [rr:column "KOR_NAME"])
트리플 맵은 논리 테이블의 각 행을 0 개 이상의 RDF 트리플로 변환하기위한 규칙을 지정한다. 트리플 맵은, LogicalTable, SubjectMap, PredicateObjectMap을 가진다.
논리 테이블의 한 행에서 생성된 RDF 트리플은 모두 동일한 주제를 공유한다다.
트리플 맵은 다음과 같은 다른 리소스를 참조하는 리소스로 표현된다. 정확히 하나의 "rr : logicalTable" 특성이 있어야 한다. 이 값은 SQL 쿼리 결과를 트리플로 매핑되도록 지정하는 논리 테이블이다.
도 6은 본 발명에 따른 트리플 변환단계를 설명하기 위해 학술연구/과학기술 데이터의 관계형데이터베이스를 나타낸 일 실시예 도면이고, 도 7은 본 발명에 따른 트리플 변환단계를 설명하기 위해 학술연구/과학기술 데이터에 URI를 부여한 일 실시예 도면이고, 도 8은 본 발명에 따른 트리플 변환단계를 설명하기 위해 학술연구/과학기술 데이터를 RDF 트리플로 변환한 것을 나타낸 일 실시예 도면이다.
도 6 내지 도8은 관계형데이터베이스(RDB)에서 RDF로 변환하는 과정을 보여준다.
도 6의 각 DB 테이블 값들 중에서, 선정된 클래스는 도 7에서와 같이, "article", "author", "journal", "reference", "organization", "publisher", "volume_info", "citation", "contribution", "publication" 및 "subscription_hold"가 있고, 각각에 대응하는 URI가 부여되어 있다.
최종적으로, 도 8에서와 같이, "article" 에 대해서는, 논문,키워드,초록,사용한 참고문헌,저자,소속된 기관,저널을 RDF로 변환하였고, "author" 에 대해서는, 저자, 작성한 논문,소속된 기관,출판사를 RDF로 변환하였고, "journal" 에 대해서는, 저널,분류코드,권호정보,발행한 출판사,게재된 논문, 기관을 RDF로 변환하였고, "reference" 에 대해서는, 참고문헌, 참고문헌을 사용한 논문을 RDF로 변환하였고, "organization" 에 대해서는, 기관, 소속된 저자, 소속된 논문, 저널을 RDF로 변환하였고, "publisher" 에 대해서는, 출판사, 발행한 저널, 저자를 RDF로 변환하였고, "volume_info" 에 대해서는, 권호정보를 RDF로 변환하였고, "citation" 에 대해서는, 참고를 RDF로 변환하였고, "contribution" 에 대해서는, 기여를 RDF로 변환하였고, "publication" 에 대해서는, 발행을 RDF로 변환하였고, subscription_hold" 에 대해서는, 구독/소장을 RDF로 변환하였다.
도 9는 본 발명에 따른 트리플 작성단계에서 '저자'에 대한 R2RML을 나타낸 일 실시예 설명도이다.
이상에서 본 발명의 일 실시예에 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법에 대하여 설명하였지만, 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법을 구현하기 위한 프로그램이 저장된 컴퓨터 판독 가능한 기록매체 및 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법을 구현하기 위한 컴퓨터 판독 가능한 기록매체에 저장된 프로그램 역시 구현 가능함은 물론이다.
즉, 상술한 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법은 이를 구현하기 위한 명령어들의 프로그램이 유형적으로 구현됨으로써, 컴퓨터를 통해 판독될 수 있는 기록매체에 포함되어 제공될 수도 있음을 당업자들이 쉽게 이해할 수 있을 것이다. 다시 말해, 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어, 컴퓨터 판독 가능한 기록매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 상기 컴퓨터 판독 가능한 기록매체의 예에는 하드 디스크, 플로피 디스크 및 자기테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리, USB 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 컴퓨터 판독 가능한 기록매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
본 발명은 상기한 실시예에 한정되지 아니하며, 적용범위가 다양함은 물론이고, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 다양한 변형 실시가 가능한 것은 물론이다.
100: 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템
101: LOD 모델 관리부 102: 추론 규칙 검증부
103: 트리플 변환부 103: 트리플 저장소
201: 어휘 정의부 202: LOD 모델 생성부
203: LOD 모델 저장부 107: LOD 발행부
301: 클래스 선정부 302: 데이터 속성 관계 도출부
303: 객체 속성 관계 도출부 304: URI 결정부
305: 트리플 작성부
101: LOD 모델 관리부 102: 추론 규칙 검증부
103: 트리플 변환부 103: 트리플 저장소
201: 어휘 정의부 202: LOD 모델 생성부
203: LOD 모델 저장부 107: LOD 발행부
301: 클래스 선정부 302: 데이터 속성 관계 도출부
303: 객체 속성 관계 도출부 304: URI 결정부
305: 트리플 작성부
Claims (10)
- 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템에 있어서,
입력 데이터를 기설정된 스키마 또는 온톨로지 스키마에 근거하여 자원서술체계(RDF) 형식으로 변환하도록 하는 링크드 오픈 데이터(LOD) 모델을 관리하는 LOD 모델 관리부(101);
상기 LOD 모델에 대한 적합성 오류를 검증하고, 검출된 오류를 리포팅하는 추론 규칙 검증부(102);
상기 입력 데이터를 상기 LOD 모델에 기반하여 RDF 형식의 트리플로 생성 및 변환하기 위한 트리플 변환부(103); 및
상기 생성 및 변환한 트리플을 저장하고 관리하는 트리플 저장소(104)
를 포함하고,
상기 트리플 변환부(103)는,
상기 입력 데이터에서, 독립적인 데이터 세트(set)가 되는 것 또는 브리지 테이블 중 키(key) 외에 다른 요소를 포함하고 있는 것을 클래스로 선정하기 위한 클래스 선정부(301);
상기 선정한 클래스의 속성에 따라 우선순위로 정의된 메타데이터 어휘를 사용하여 데이터 속성 관계를 도출하기 위한 데이터 속성 관계 도출부(302);
상기 브리지 테이블 중 클래스로 선정되지 않은 데이터를 연결된 두 개 테이블 사이의 관계로 설정하는 객체 속성 관계를 도출하기 위한 객체 속성 관계 도출부(303);
상기 선정된 클래스에 대하여 통합 자원 식별자(Uniform Resource Identifier, URI)를 부여하는 URI 결정부(304); 및
상기 선정된 클래스, 도출된 데이터 속성, 및 도출된 객체 속성을 RDF 트리플로 작성하는 트리플 작성부(305)
를 포함하는 것을 특징으로 하는 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템.
- 삭제
- 제 1항에 있어서,
상기 LOD 모델 관리부(101)는,
데이터의 속성에 따라 메타데이터 어휘가 정의된 어휘 정의부(201);
어휘가 정의되지 않은 속성의 데이터에 대한 메타데이터 어휘 및 LOD 모델을 생성 및 변경하는 LOD 모델 생성부(202); 및
상기 생성 및 변경된 LOD 모델을 저장하고 있는 LOD 모델 저장부(203)
를 포함하는 것을 특징으로 하는 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템.
- 제 3항에 있어서,
상기 LOD 모델 생성부(202)는,
상기 선정한 클래스의 속성에 따라 우선순위로 정의된 메타데이터 어휘가 없는 경우, 필요한 어휘를 생성하는 것을 특징으로 하고,
상기 객체 속성 관계 도출부(303)는,
도출된 객체 속성과 반대 관계의 객체 속성도 표현하는 것을 특징으로 하는 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템.
- 제 1항에 있어서,
상기 트리플 작성부(305)는,
트리플 맵, 논리 테이블, 주제 맵, 및 술어-오브젝트 맵을 이용하는 것을 특징으로 하고,
상기 트리플 맵은,
RDF 트리플을 생성하기 위한 맵핑 클래스이고,
상기 논리 테이블은,
RDF로 변환하고자 하는 테이블의 이름이고,
상기 주제 맵은,
하나의 트리플이 갖는 URI 포맷을 지정하고,
상기 술어-오브젝트 맵은,
주제와 관계를 가지는 술어와 오브젝트를 지정하는 것을 특징으로 하는 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템.
- 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법에 있어서,
데이터를 입력받는 데이터입력단계(S410);
상기 입력 데이터를 LOD 모델에 기반하여 RDF 형식의 트리플로 생성 및 변환하기 위한 트리플 변환단계(S420);
상기 생성 및 변환한 트리플의 적합성 오류를 검증하는 오류검증단계(S430);및
상기 생성 및 변환한 트리플을 저장하는 트리플 저장단계(S440)
를 포함하고,
상기 트리플 변환단계(S420)는,
상기 입력 데이터에서, 독립적인 데이터 세트(set)가 되는 것 또는 브리지 테이블 중 키(key) 외에 다른 요소를 포함하고 있는 것을 클래스로 선정하는 클래스 선정단계(S510);
상기 선정한 클래스의 속성에 따라 우선순위로 정의된 메타데이터 어휘를 사용하여 데이터 속성 관계를 도출하는 데이터 속성 관계 도출단계(S520);
상기 브리지 테이블 중 클래스로 선정되지 않은 데이터를, 연결된 두 개 테이블 사이의 관계로 설정하는 객체 속성 관계를 도출하는 객체 속성 관계 도출단계(S530);
상기 선정된 클래스에 대하여 통합 자원 식별자(Uniform Resource Identifier, URI)를 부여하는 URI 결정단계(S540); 및
상기 선정된 클래스, 도출된 데이터 속성, 및 도출된 객체 속성을 RDF 트리플로 작성하는 트리플 작성단계(S550)
를 포함하는 것을 특징으로 하는 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법.
- 삭제
- 제 6항에 있어서,
상기 입력 데이터를 기설정된 스키마 또는 온톨로지 스키마에 근거하여 자원서술체계(RDF) 형식으로 변환하도록 하는 링크드 오픈 데이터(LOD) 모델을 관리하는 LOD 모델 관리단계(S450)
를 더 포함하며,
상기 LOD 모델 관리 단계(S450)는,
어휘가 정의되지 않은 속성의 데이터에 대한 메타데이터 어휘 및 LOD 모델을 생성 및 변경하고, 생성 및 변경된 LOD 모델을 저장하고 있는 것을 특징으로 하는 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법.
- 제 8항에 있어서,
상기 LOD 모델 관리 단계(S450)는,
상기 선정한 클래스의 속성에 따라 우선순위로 정의된 메타데이터 어휘가 없는 경우, 필요한 어휘를 생성하는 것을 특징으로 하고,
상기 객체 속성 관계 도출단계(S530)는,
도출된 객체 속성과 반대 관계의 객체 속성도 표현하는 것을 특징으로 하는 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법.
- 제 6 항에 있어서,
상기 트리플 작성단계(S550)는,
트리플 맵, 논리 테이블, 주제 맵, 및 술어-오브젝트 맵을 이용하여 수행되는 것을 특징으로 하고,
상기 트리플 맵은,
RDF 트리플을 생성하기 위한 맵핑 클래스이고,
상기 논리 테이블은,
RDF로 변환하고자 하는 테이블의 이름이고,
상기 주제 맵은,
하나의 트리플이 갖는 URI 포맷을 지정하고,
상기 술어-오브젝트 맵은,
주제와 관계를 가지는 술어와 오브젝트를 지정하는 것을 특징으로 하는 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180033617A KR101897760B1 (ko) | 2018-03-23 | 2018-03-23 | 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180033617A KR101897760B1 (ko) | 2018-03-23 | 2018-03-23 | 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101897760B1 true KR101897760B1 (ko) | 2018-09-12 |
Family
ID=63592930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180033617A KR101897760B1 (ko) | 2018-03-23 | 2018-03-23 | 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101897760B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102111734B1 (ko) * | 2018-11-29 | 2020-05-15 | 주식회사 솔트룩스 | 통합 지식베이스 구축 시스템 및 방법 |
WO2021204025A1 (zh) * | 2020-04-08 | 2021-10-14 | 速度时空信息科技股份有限公司 | 一种基于八叉树的三维建筑物模型lod方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101752257B1 (ko) * | 2016-07-29 | 2017-07-11 | 최미숙 | 링크드 오픈 데이터 클라우드 정보 서비스 시스템 및 그 제공 방법과 이를 구현하기 위한 프로그램이 저장된 기록매체 |
KR101793925B1 (ko) | 2016-02-12 | 2017-11-06 | 소프트온넷(주) | 대용량 방송용 빅데이터의 지식 트리플 구축을 위한 변환 시스템 및 방법 |
KR101836314B1 (ko) | 2016-10-28 | 2018-03-09 | (주) 아인스에스엔씨 | Rdbms 데이터의 트리플 자동변환방법 및 시스템 |
-
2018
- 2018-03-23 KR KR1020180033617A patent/KR101897760B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101793925B1 (ko) | 2016-02-12 | 2017-11-06 | 소프트온넷(주) | 대용량 방송용 빅데이터의 지식 트리플 구축을 위한 변환 시스템 및 방법 |
KR101752257B1 (ko) * | 2016-07-29 | 2017-07-11 | 최미숙 | 링크드 오픈 데이터 클라우드 정보 서비스 시스템 및 그 제공 방법과 이를 구현하기 위한 프로그램이 저장된 기록매체 |
KR101836314B1 (ko) | 2016-10-28 | 2018-03-09 | (주) 아인스에스엔씨 | Rdbms 데이터의 트리플 자동변환방법 및 시스템 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102111734B1 (ko) * | 2018-11-29 | 2020-05-15 | 주식회사 솔트룩스 | 통합 지식베이스 구축 시스템 및 방법 |
WO2020111371A1 (ko) * | 2018-11-29 | 2020-06-04 | 주식회사 솔트룩스 | 통합 지식베이스 구축 시스템 및 방법 |
WO2021204025A1 (zh) * | 2020-04-08 | 2021-10-14 | 速度时空信息科技股份有限公司 | 一种基于八叉树的三维建筑物模型lod方法 |
US11854145B2 (en) | 2020-04-08 | 2023-12-26 | Speed Technology Co., Ltd. | Octree-based three-dimensional building model LOD method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240012810A1 (en) | Clause-wise text-to-sql generation | |
CN107357933B (zh) | 一种用于多源异构科技信息资源的标签描述方法和装置 | |
US9684699B2 (en) | System to convert semantic layer metadata to support database conversion | |
US20050010550A1 (en) | System and method of modelling of a multi-dimensional data source in an entity-relationship model | |
An et al. | Methodology for automatic ontology generation using database schema information | |
US20090254574A1 (en) | Method and apparatus for producing an ontology representing devices and services currently available to a device within a pervasive computing environment | |
Kalampokis et al. | On publishing linked open government data | |
Chakraborty et al. | Semantic etl—State-of-the-art and open research challenges | |
KR101897760B1 (ko) | 링크드 오픈 데이터 클라우드 정보 서비스를 위한 트리플 변환 및 저장 시스템 및 그 방법 | |
Calvanese et al. | A ‘historical case’of ontology-based data access | |
Tachmazidis et al. | A Hypercat-enabled semantic Internet of Things data hub | |
CN110019554B (zh) | 数据驱动型应用的数据模型、数据建模系统和方法 | |
Salas et al. | Stdtrip: Promoting the reuse of standard vocabularies in open government data | |
KR101752257B1 (ko) | 링크드 오픈 데이터 클라우드 정보 서비스 시스템 및 그 제공 방법과 이를 구현하기 위한 프로그램이 저장된 기록매체 | |
Angelis et al. | Generating and exploiting semantically enriched, integrated, linked and open museum data | |
Wang et al. | [Retracted] Construction and Knowledge Mining of Traditional Chinese Medicine Ancient Books Bibliographic Abstracts Database Based on Genetic Algorithm and BP Neural Network | |
Bing et al. | Using aligned ontology model to convert cultural heritage resources into semantic web | |
Shaon et al. | An open source linked data framework for publishing environmental data under the UK location strategy | |
Szász et al. | Linked data enrichment with self-unfolding URIs | |
Vander Sande et al. | The datatank: an open data adapter with semantic output | |
Malik et al. | Technique for transformation of data from RDB to XML then to RDF | |
Ramanujam et al. | A relational wrapper for RDF reification | |
Marjit et al. | Publishing legacy data as linked data: a state of the art survey | |
Kuznetsov | Scientific data integration system in the linked open data space | |
Su-Cheng et al. | Mapping of extensible markup language-to-ontology representation for effective data integration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |