KR102612346B1 - 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템 및 방법 - Google Patents

시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템 및 방법 Download PDF

Info

Publication number
KR102612346B1
KR102612346B1 KR1020220155240A KR20220155240A KR102612346B1 KR 102612346 B1 KR102612346 B1 KR 102612346B1 KR 1020220155240 A KR1020220155240 A KR 1020220155240A KR 20220155240 A KR20220155240 A KR 20220155240A KR 102612346 B1 KR102612346 B1 KR 102612346B1
Authority
KR
South Korea
Prior art keywords
metadata
catalog
data
information
link information
Prior art date
Application number
KR1020220155240A
Other languages
English (en)
Inventor
김지혁
최태동
Original Assignee
(주)위세아이텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)위세아이텍 filed Critical (주)위세아이텍
Priority to KR1020220155240A priority Critical patent/KR102612346B1/ko
Application granted granted Critical
Publication of KR102612346B1 publication Critical patent/KR102612346B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/116Details of conversion of file system types or formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템 및 방법이 개시되며, 본원의 일 실시예에 따른 시계열 데이터 활용을 위한 메타데이터 카탈로그 제공 방법은 메타데이터 및 포털에서 제공된 정보를 저장하는 단계, 상기 메타데이터를 카탈로그 데이터베이스에 저장된 메타데이터 카탈로그 정보에 기초하여 카테고리를 분류하는 단계, 상기 메타데이터를 배포를 위한 형식으로 변환하는 단계 및 사용자의 요청에 따라 상기 변환된 메타데이터를 제공하는 단계를 포함할 수 있다.

Description

시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템 및 방법{METADATA CATAOLG SYSTEM AND METHOD FOR UTILIZING TIME SERIES DATA}
본원은 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템 및 방법에 관한 것이다.
데이터 카탈로그는 기업 내 조직과 시스템에 산재한 서로 다른 속성의 데이터를 AI로 빠르게 파악해 데이터의 정리, 통합, 관리를 용이하게 해준다. 엣지 기기부터 데이터센터, 멀티 클라우드에 걸쳐 데이터 레이크 관리, 중복, 복제 데이터 식별을 통한 데이터 분류, 데이터 계보 분석, 민감 데이터 검색, AI 머신러닝을 통한 태깅 등을 지원한다. 현재 각 국의 정부를 포함한 국내 정부 또한 공공데이터를 온톨로지화 하여 관리를 하고 있으며, 분류체계에 따라 데이터를 체계적으로 저장, 관리 및 제공함으로써 다양한 분야에서 보다 명확하고 효율적으로 데이터의 분석 및 비교가 가능하다. 공공기관에서 제공하는 데이터들을 상호 관계성에 따라 온톨로지 기반으로 링크해 놓음으로써 데이터의 접근성 및 사용성을 증대 시키고 있다. 또한, IoT 기술의 발전 및 보급으로 인해 각종 센서에서 수 많은 시계열 데이터가 생성되어 저장되고 있다. 하지만 온톨로지(Ontology) 기반 DCAT(Data Catalog Vocabulary)를 사용하는 LOD(Linked Open Data)를 위해 500개 이상의 용어집을 작성하여 용어집들을 카테고리 별로 태깅하여 관리하는 방법의 경우 데이터 수집 및 제공에는 용이하나 일관되지 않은 DCAT(Data Catalog Vocabulary) 클래스(Class), 속성(Property)의 메타데이터 활용으로 인해 시계열 데이터의 활용인 시각화, 분석, 모델 학습에 필요한 데이터 조회 및 사용하는 AutoML플랫폼에는 적합하지 않은 문제가 있다. 이에 메타데이터 카탈로그 시스템을 통해 기존의 데이터가 가지고 있는 메타데이터 클래스(Class)와 속성(Property) 기반 시계열 카탈로그 구축하고, 클래스(Class)와 속성(Property)들을 재 분류하여 각 도메인별 검색 및 분석에 활용 가능한 메타데이터 체계를 제공하고자 한다.
본원의 배경이 되는 기술은 한국등록특허공보 제10-2249466호에 개시되어 있다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 파편화된 시계열 데이터를 활용하기 위해 각 기관에서 제공하는 데이터에 대한 메타데이터의 표준화를 통한 카탈로그를 제공하는 메타데이터 카탈로그 시스템을 제공하려는 것을 목적으로 한다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 사용자들에게 정형화된 데이터를 제공하고 서로 다른 형태, 데이터의 질과 양, 수집 주기와 기간, 포맷, 성격을 갖는 지엽적으로 저장된 다양한 시계열 및 반시계열 데이터에 대하여 검색, 통합 분석을 위한 메타데이터 카탈로그 시스템을 제공하려는 것을 목적으로 한다.
다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본원의 일 실시예에 따른 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템은, 메타데이터를 저장하는 카탈로그 데이터베이스 및 포털에서 제공된 정보를 저장하는 기본 정보 데이터베이스를 포함하는 데이터 저장부, 상기 메타데이터를 카탈로그 데이터베이스에 저장된 메타데이터 카탈로그 정보에 기초하여 카테고리를 분류하는 데이터 분류부, 상기 메타데이터를 배포를 위한 형식으로 변환하는 메타데이터 변환부, 사용자의 요청에 따라 상기 변환된 메타데이터를 제공하는 데이터 제공부를 포함할 수 있다.
또한, 상기 데이터 저장부는, 관리자로부터 데이터 링크 정보를 수신하고, 상기 링크 정보에 기초한 메타데이터 또는 링크 정보가 없는 데이터를 수집하고 저장할 수 있다.
또한, 상기 데이터 저장부는, 상기 링크 정보와 연계된 상기 포털에서 상기 메타데이터 카탈로그 정보와 매칭하는 메타데이터를 전송받아 저장할 수 있다.
또한, 상기 데이터 저장부는, 상기 링크 정보가 없는 메타데이터를 상기 카탈로그 데이터베이스에서 링크 정보를 매핑한 데이터를 저장할 수 있다.
또한, 상기 데이터 분류부는, 상기 링크 정보와 연계된 포털의 데이터 저장 방식에 기초하여 카테고리를 분류할 수 있다.
또한, 상기 데이터 분류부는, 상기 링크 정보가 없는 데이터를 상기 카탈로그 데이터베이스에 저장된 카탈로그 정보에 기반하여 상기 카탈로그를 추가 정의하고 저장할 수 있다.
또한, 상기 메타데이터 변환부는, 상기 메타데이터를 파일 형태로 변환하여 상기 카탈로그 데이터베이스에 저장할 수 있다.
또한, 상기 데이터 제공부는, 상기 사용자의 요청에 따라 카탈로그 데이터베이스에 저장된 메타데이터 파일 및 상기 기본 정보 데이터베이스에 저장된 상기 링크 정보를 매핑한 데이터를 제공할 수 있다.
한편, 본원의 일 실시예에 따른 시계열 데이터 활용을 위한 메타데이터 카탈로그 제공 방법은, 메타데이터 및 포털에서 제공된 정보를 저장하는 단계, 상기 메타데이터를 카탈로그 데이터베이스에 저장된 메타데이터 카탈로그 정보에 기초하여 카테고리를 분류하는 단계, 상기 메타데이터를 배포를 위한 형식으로 변환하는 단계, 사용자의 요청에 따라 상기 변환된 메타데이터를 제공하는 단계를 포함할 수 있다.
상술한 과제 해결 수단은 단지 예시적인 것으로서, 본원을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 추가적인 실시예가 존재할 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 획일화되지 않은 플랫폼 형태의 공공기관 오픈데이터 및 각 기관으로부터 수집된 데이터의 메타데이터를 메타 데이터 카탈로그 시스템을 통해 시계열 특화 카탈로그를 구축함으로써, 검색 활용도를 높이고, 데이터가 포함한 시간 단위, 위치, 수집 기간 등을 기반으로 범주화 된 데이터간 결합 및 분석에 필요한 시계열 데이터 전처리 과정을 생략할 수 있는 효과가 있다.
전술한 본원의 과제 해결 수단에 의하면, 시계열 데이터에 대한 메타데이터를 활용함으로써, 데이터간 새로운 연계 방법 모색 및 예측 정확도를 향상시킬 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 기존의 단일 도메인에서 벗어나 데이터에 세부 카테고리를 적용함으로써 도메인 간의 연계 활용성을 높일 수 있다.
다만, 본원에서 얻을 수 있는 효과는 상기된 바와 같은 효과들로 한정되지 않으며, 또 다른 효과들이 존재할 수 있다.
도 1은 본원의 일 실시예에 따른 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템의 개략적인 구성을 나타낸 도면이다.
도 2는 본원의 일 실시예에 따른 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템의 개략적인 블록도이다.
도 3은 본원의 일 실시예에 따른 데이터 저장부의 개략적인 구성도이다.
도 4는 본원의 일 실시예에 따른 관리자가 인터페이스를 통해 링크 정보를 입력하여 메타데이터를 획득하는 모습을 나타낸 도면이다.
도 5는 본원의 일 실시예에 따른 메타데이터 카탈로그 시스템의 전체적인 동작의 흐름을 예시적으로 나타낸 도면이다.
도 6은 본원의 일 실시예에 따른 시계열 데이터 활용을 위한 메타데이터 카탈로그 제공 방법에 대한 동작 흐름도이다.
아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본원 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결" 또는 "간접적으로 연결"되어 있는 경우도 포함한다.
본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에", "상부에", "상단에", "하에", "하부에", "하단에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.
본원 명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
본원은 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템(10) 및 방법에 관한 것이다.
도 1은 본원의 일 실시예에 따른 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템(10)의 개략적인 구성을 나타낸 도면이다.
도 1을 참조하면, 본원의 일 실시예에 따른 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템(10)은 사용자 단말(30)과 네트워크(20) 및 서버(40)를 포함할 수 있다.
사용자 단말(30)은 퍼스널 컴퓨터나 노트북 등을 모두 포함하는 의미이며, 스마트폰(Smartphone), 스마트패드(SmartPad), 태블릿 PC등과 PCS(Personal Communication System), GSM(Global System for Mobile communication), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말기 같은 모든 종류의 유/무선 통신 장치를 포함할 수 있다.
사용자 단말(30) 및 서버(40) 상호간은 네트워크(20)를 통해 통신할 수 있다.
네트워크(20)는 단말들 및 서버(40)들과 같은 각각의 노드 상호간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크(20)의 일 예에는, 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, 5G 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), wifi 네트워크, 블루투스(Bluetooth) 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.
서버(40)는 Open API, 웹페이지 또는 각종 파일 형태로 데이터를 제공하는 서버(40)이다. 예를 들어, 본 발명의 실시예가 교통 정보를 수집하는데 구현된다면, 서버(40)는 각종 교통 관련 정보(예를 들어, 교통량, 교통 시설물, 대중 교통, 속도 등의 정보)를 제공하는 각 행정기관 또는 공공기관 등의 서버(40)일 수 있다.
실시예에 따라 하나의 서버(40)가 제공하는 복수의 데이터 중 일부 데이터는 OPEN API로 제공되고, 나머지 데이터는 웹페이지나 파일 형태로 제공될 수 있다. 또는 하나의 서버(40)에서 제공하는 복수의 데이터의 수집주기는 서로 다를 수 있다.
관리자는 사용자 단말(30)을 통해 서버(40)에 접속하여 필요한 데이터를 요청할 수 있다. 예를 들어, 사용자 단말(30)은 네트워크(20)를 통해 서버(40)에 접속하여 교통량, 교통 시설물, 대중 교통, 속도 등의 데이터를 요청하여 제공받을 수 있다.
도 2는 본원의 일 실시예에 따른 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템(10)의 개략적인 블록도이다.
도 2를 참조하면, 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템(10)은 메타데이터를 저장하는 카탈로그 데이터베이스(210) 및 포털에서 제공된 정보를 저장하는 기본 정보 데이터베이스(220)를 포함하는 데이터 저장부(110), 메타데이터를 카탈로그 데이터베이스(210)에 저장된 메타데이터 카탈로그 정보에 기초하여 카테고리를 분류하는 데이터 분류부(120), 메타데이터를 배포를 위한 형식으로 변환하는 메타데이터 변환부(130), 사용자의 요청에 따라 변환된 메타데이터를 제공하는 데이터 제공부(140)를 포함할 수 있다. 본원에서 메타데이터라 함은 데이터에 대한 이름, 사이즈, 타입 등을 정의한 데이터를 의미하고, 데이터는 사실, 단어, 관찰, 측정 또는 설명의 모음을 의미하는 것이나, 이에 제한되는 것은 아니다.
본원의 일 실시예에 따르면, 데이터 저장부(110)는 메타데이터를 저장하는 카탈로그 데이터베이스(210) 및 포털에서 제공된 정보를 저장하는 기본 정보 데이터베이스(220)를 포함할 수 있다.
이와 관련하여, 도 3은 본원의 일 실시예에 따른 데이터 저장부(110)의 개략적인 구성도이다.
도3을 참조하면, 예를 들어, 데이터 저장부(110)는 행정기관 또는 공공기관 등의 서버(40), 공공데이터 포털로부터 다양한 LOD(Linked Open Data)의 기본 데이터 제공 부처의 데이터 공개 사이트에서 조회된 메타데이터를 카탈로그 데이터베이스(210)에 저장하고, 제공된 데이터를 기본 정보 데이터베이스(220)에 저장하는 것일 수 있다.
여기서, 메타데이터는 데이터에 대한 데이터로 어떤 목적을 가지고 만들어진 데이터이다. 메타데이터는 대량의 정보 가운데에서 찾고 있는 정보를 효율적으로 찾아내고 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대해 부여되는 데이터이다. 콘텐츠의 위치와 내용, 작성자에 관한 정보, 권리 조건, 이용 조건, 이용 내력 등이 기록돼 있으며, 데이터를 표현하기 위한 목적과 데이터를 빨리 찾기 위한 목적으로 사용된다.
본원의 일 실시예에 따르면, 데이터 저장부(110)는 관리자로부터 데이터 링크 정보를 수신하고, 링크 정보에 기초한 메타데이터 또는 링크 정보가 없는 데이터를 수집하고 저장할 수 있다.
이와 관련하여, 도 4는 본원의 일 실시예에 따른 관리자가 인터페이스를 통해 링크 정보를 입력하여 메타데이터를 획득하는 모습을 나타낸 도면이다.
도 4를 참조하면 데이터 저장부(110)는 관리자가 입력하는 링크 정보에 기초하여
구체적으로, 데이터 저장부(110)는 관리자가 입력하는 링크 정보를 수신하고 링크 정보에 포함되어 있는 URL 경로를 따라 해당 포털에서 제공하는 데이터를 수신할 수 있다. 또한, 데이터 저장부(110)는 관리자가 포털에서 획득한 URL 경로를 제공하지 않고 미리 생성된 데이터를 저장하는 것일 수 있다.
달리 말해, 데이터 저장부(110)는 관리자가 획득한 데이터에URL 경로가 있는 경우, 해당 경로에서 획득된 데이터를 기본 정보 데이터베이스(220)에 저장하고, URL 경로가 없는 경우 획득된 데이터를 카탈로그 데이터베이스(210)에 저장할 수 있다.
본원의 일 실시예에 따르면, 데이터 저장부(110)는 링크 정보와 연계된 포털에서 메타데이터 카탈로그 정보와 매칭하는 메타데이터를 전송받아 저장할 수 있다.
구체적으로, 데이터 저장부(110)는 링크 정보와 연결되는 포털에서 카탈로그 정보에 포함된 메타데이터 항목과 매칭하는 메타데이터를 조회하고, 조회된 메타데이터를 전송받아 저장할 수 있다.
예를 들어, 카탈로그 정보에 포함된 메타데이터가 주기정보, 지역별 통계, 연계 정보, 코드 관리, 통계표 수치 정보 항목을 포함하는 경우 링크 정보와 연결되는 포털에서 메타데이터가 주기정보, 지역별 통계, 연계 정보, 코드 관리, 통계표 수치 정보와 일치하는 항목을 조회하고 해당 항목을 포함하고 있는 메타데이터를 포털로부터 전송받아 저장하는 것일 수 있다.
또한, 본원의 일 실시예에 따르면 데이터 저장부(110)는 링크 정보와 연계된 포털에서 조회된 복수의 메타테이터 각각의 항목과 메타데이터 카탈로그 정보에 포함된 항목 중 일치하는 항목의 개수가 미리 설정한 개수 이상인 메타데이터를 전송받아 저장할 수 있다.
예를 들어, 데이터 저장부(110)는 메타테이터의 항목과 메타데이터 카탈로그 정보에 포함된 항목 중 일치하는 항목의 개수가 3개 이상인 메타데이터를 전송받아 저장하도록 미리 설정되고, 링크 정보와 연계된 포털에서 조회된 제1메타 데이터의 항목과 메타데이터 카탈로그 정보에 포함된 항목에서 일치하는 항목의 개수는 1개, 제2메타데이터의 항목과 메타데이터 카탈로그 정보에 포함된 항목에서 일치하는 항목의 개수는 3개, 제3메타 데이터의 항목과 메타데이터 카탈로그 정보에 포함된 항목에서 일치하는 항목의 개수는 5개인 경우, 제2메타데이터와 제3메타데이터를 선택하여 전송받고 저장하는 것일 수 있다.
본원의 일 실시예에 따르면, 데이터 저장부(110)는 링크 정보가 없는 메타데이터를 카탈로그 데이터베이스(210)에서 링크 정보를 매핑한 데이터를 저장할 수 있다.
구체적으로, 데이터 저장부(110)는 카탈로그 데이터베이스(210)에 저장된 포털에서 URL 경로를 제공하지 않고 미리 생성된 데이터에 해당 포털에서 부여한 고유의 URL 정보를 포함하는 링크 정보를 매핑한 데이터를 저장할 수 있다.
여기서, 고유 URL 정보는 기관간 효율적인 정보유통 및 공동활용을 위해 각 기관에서 인터넷주소자원에 관한 표준에 따라 사용 중인 도메인 및 인터넷프로토콜 주소를 의미한다.
달리 말해, 데이터 저장부(110)는 링크 정보가 없는 메타데이터에 각 기관이 부여한 고유의 URL 정보 즉, 링크 정보를 추가하여 카탈로그 데이터베이스(210)에 저장할 수 있다.
본원의 일 실시예에 따르면, 데이터 분류부(120)는 메타데이터를 카탈로그 데이터베이스(210)에 저장된 메타데이터 카탈로그 정보에 기초하여 카테고리를 분류할 수 있다.
구체적으로, 데이터 분류부(120)는 복수의 분야를 구분하고 각 분야별 세부 항목을 미리 구분한 정보인 메타데이터 카탈로그 정보에 기초하여 메타데이터의 카테고리를 결정하고 분류할 수 있다.
예를 들어, 데이터 분류부(120)는 메타데이터가 교통량, 교통 시설물, 대중 교통, 속도 항목을 포함하고 있는 경우 메타데이터 카탈로그 정보에 포함되어 있는 교통 카테고리 분야로 분류하는 것일 수 있다.
또한, 본원의 일 실시예에 따르면 데이터 분류부(120)는 메타데이터에 포함된 항목과 메타데이터 카탈로그 정보에 포함된 분야별 세부 항목과 일치하는 항목이 있는 경우, 메타데이터를 해당 분야의 세부 카테고리로 분류할 수 있다.
예를 들어, 데이터 분류부(120)는 메타데이터 카탈로그 정보에서 교통 분야의 세부 항목으로 교통량 항목을 포함하고 있고, 메타데이터가 교통량 정보를 포함하고 있는 경우, 메타데이터를 교통 카테고리의 교통량 세부 카테고리에 포함되도록 분류하는 것일 수 있다.
본원의 일 실시예에 따르면, 데이터 분류부(120)는 링크 정보와 연계된 포털의 데이터 저장 방식에 기초하여 카탈로그를 분류할 수 있다.
구체적으로, 데이터 분류부(120)는 링크 정보와 연계된 각 기관의 포털에서 데이터를 저장하고 있는 방식, 예를 들어, URL 정보를 포함하는 데이터, 다운로드 가능한 URL 및 API형식, JSON 형식 등 다양한 데이터 저장 방식에 따라 저장 형식 별로 구분하여 카탈로그를 분류할 수 있다.
본원의 일 실시예에 따르면, 데이터 분류부(120)는 링크 정보가 없는 데이터를 카탈로그 데이터베이스(210)에 저장된 카탈로그 정보에 기반하여 카테고리를 추가 정의하고 저장할 수 있다.
구체적으로, 데이터 분류부(120)는 링크 정보가 없는 데이터에 대하여 카탈로그 데이터베이스(210)에 미리 저장되어 있는 카탈로그 정보에 기초하여 카탈로그 정보와 일치하는 항목이 존재하지 않는 경우 새로운 카테고리를 추가 및 정의하여 저장할 수 있다.
예를 들어, 링크 정보가 없는 데이터가 날씨와 관련된 항목을 포함하고 있고, 카탈로그 정보에 날씨 분야가 존재하지 않으면, 데이터 분류부(120)는 날씨 분야의 카테고리를 새롭게 추가 및 정의하여 저장하는 것일 수 있다.
또한, 데이터 분류부(120)는 링크 정보가 없는 데이터에 대하여 카탈로그 정보를 기초하여 유사한 항목으로 구성된 메타데이터를 검색하여 해당 메타데이터의 링크 정보를 매핑하고 분류할 수 있다.
구체적으로, 데이터 분류부(120)는 카탈로그 데이터베이스(210)에 저장된 링크 정보가 없는 데이터와 유사한 데이터를 검색하고 유사한 데이터의 메터데이터에 포함된 링크 정보를 링크 정보가 없는 데이터에 매핑하여 카탈로그를 분류할 수 있다.
본원의 일 실시예에 따르면, 메타데이터 변환부(130)는 메타데이터를 파일 형태로 변환하여 카탈로그 데이터베이스(210)에 저장할 수 있다.
예를 들어, 메타데이터 변환부(130)는 메타데이터를 JSON파일 형태로 변환하여 카탈로그 데이터베이스(210)에 저장하는 것일 수 있다.
JSON(JavaScript Object Notation)은 속성-값 쌍으로 이루어진 데이터 오브젝트를 전달하기 위해 인간이 읽을 수 있는 텍스트를 사용하는 개방형 표준 포맷으로, 비동기 브라우저/서버 통신(AJAJ)을 위해, 넓게는 XML(AJAX가 사용)을 대체하는 주요 데이터 포맷이다. 특히, 인터넷에서 자료를 주고 받을 때 그 자료를 표현하 는 방법으로 알려져 있으며, 자료의 종류에 큰 제한은 없으며, 특히 컴퓨터 프로그램의 변수값을 표현하는 데 적합하다. JSON은 본래는 자바스크립트 언어로부터 파생되어 자바스크립트의 구문 형식을 따르지만 언어 독립형 데이터 포맷이다. 즉, 프로그래밍 언어나 플랫폼에 독립적이므로, 구문 분석 및 JSON 데이터 생성을 위한 코드 는 C, C++, C#, 자바, 자바스크립트, 펄, 파이썬 등 수많은 프로그래밍 언어에서 쉽게 이용할 수 있다. 달리 말해, JSON은 경량의 DATA 교환 형식으로서, 기계가 분석하고 생성하기에 용이하며, 사람이 읽고 쓰기에 용 이한 텍스트 형식으로 되어 있어 메타데이터는 메타데이터 카탈로그 시스템(10)을 통해 사용자에게 전송하고 사용자가 확인할 수 있다.
본원의 일 실시예에 따르면, 데이터 제공부(140)는 사용자의 요청에 따라 카탈로그 데이터베이스(210)에 저장된 메타데이터 파일 및 기본 정보 데이터베이스(220)에 저장된 링크 정보를 매핑한 데이터를 제공할 수 있다.
구체적으로, 데이터 제공부(140)는 사용자가 원하는 방식에 따라 카탈로그 데이터베이스(210)에서 메타데이터 파일을 제공 또는 기본 정보 데이터베이스(220)로부터 데이터 파일, 링크 정보를 매핑한 데이터 파일을 선택하여 사용자에게 제공할 수 있다.
도 5는 본원의 일 실시예에 따른 메타데이터 카탈로그 시스템(10)의 전체적인 동작의 흐름을 예시적으로 나타낸 도면이다.
도 5를 참조하면, 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템(10)에 포털의 데이터를 저장하는 경우, 각 기관의 데이터 저장 방식에 따라 메타데이터 카탈로그를 분류하고 메타데이터 카탈로그 URL 매핑 과정을 통해 해당 포털 데이터에 대한 카탈로그를 저장하며, 저장된 URL 정보는 저장되는 데이터 링크 정보 존재에 활용될 수 있다.
또한, 포털의 메타데이터를 이용하는 경우 링크 정보에 포함된 HTML(Hyper Text Markup Language) 소스 기반으로 메타데이터 카탈로그를 매칭하여 일치하는 항목을 조회하여 카탈로그 데이터베이스(210)에 기초하여 메타데이터 매핑을 할 수 있다.
또한, 관리자는 부족한 메타데이터 항목에 대하여 추가 정보를 입력하여 카탈로그 데이터베이스(210)에 저장할 수 있다.
도 6은 본원의 일 실시예에 따른 시계열 데이터 활용을 위한 메타데이터 카탈로그 제공 방법에 대한 동작 흐름도이다.
도 6에 도시된 시계열 데이터 활용을 위한 메타데이터 카탈로그 제공 방법은 앞서 설명된 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템(10)에 의하여 수행될 수 있다. 따라서, 이하 생략된 내용이라고 하더라도 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템(10)에 대하여 설명된 내용은 시계열 데이터 활용을 위한 메타데이터 카탈로그 제공 방법에 대한 설명에도 동일하게 적용될 수 있다.
도 6을 참조하면, 단계 S11에서 데이터 저장부(110)는 메타데이터 및 포털에서 제공된 정보를 저장할 수 있다.
또한, 단계 S11에서 데이터 저장부(110)는 관리자로부터 메타데이터 링크 정보를 수신하고, 상기 링크 정보에 기초한 메타데이터 또는 링크 정보가 없는 데이터를 수집하고 저장할 수 있다.
또한, 단계 S11에서 데이터 저장부(110)는 상기 링크 정보와 연계된 상기 포털에서 상기 메타데이터 카탈로그 정보와 매칭하는 메타데이터를 전송받아 저장할 수 있다.
또한, 단계 S11에서 데이터 저장부(110)는 상기 링크 정보가 없는 데이터를 상기 카탈로그 데이터베이스(210)에서 링크 정보를 매핑한 데이터를 저장할 수 있다.
다음으로, 단계 S12에서 데이터 분류부(120)는 상기 메타데이터를 카탈로그 데이터베이스(210)에 저장된 메타데이터 카탈로그 정보에 기초하여 카테고리를 분류할 수 있다.
또한, 단계 S12에서 데이터 분류부(120)는 상기 링크 정보와 연계된 포털의 데이터 저장 방식에 기초하여 카테고리를 분류할 수 있다.
또한, 단계 S12에서 데이터 분류부(120)는 상기 링크 정보가 없는 메타데이터를 상기 카탈로그 데이터베이스(210)에 저장된 카탈로그 정보에 기반하여 상기 카테고리를 추가 정의하고 저장할 수 있다.
다음으로, 단계 S13에서 메타데이터 변환부(130)는 상기 메타데이터를 배포를 위한 형식으로 변환할 수 있다.
또한, 단계 S13에서 메타데이터 변환부(130)는 상기 메타데이터를 파일 형태로 변환하여 상기 카탈로그 데이터베이스(210)에 저장할 수 있다.
다음으로, 단계 S14에서 데이터 제공부(140)는 사용자의 요청에 따라 상기 변환된 메타데이터를 제공할 수 있다.
또한, 단계 S14에서 데이터 제공부(140)는 상기 사용자의 요청에 따라 카탈로그 데이터베이스(210)에 저장된 메타데이터 파일 및 상기 기본 정보 데이터베이스(220)에 저장된 상기 링크 정보를 매핑한 데이터를 제공할 수 있다.
상술한 설명에서, 단계 S11 내지 S14는 본원의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.
본원의 일 실시예에 따른 시계열 데이터 활용을 위한 메타데이터 카탈로그 제공 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
또한, 전술한 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템(10) 및 방법은 기록 매체에 저장되는 컴퓨터에 의해 실행되는 컴퓨터 프로그램 또는 애플리케이션의 형태로도 구현될 수 있다.
전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본원의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.
10: 메타데이터 카탈로그 시스템
20: 네트워크
30: 사용자 단말
40: 서버
110: 데이터 저장부
120: 데이터 분류부
130: 메타데이터 변환부
140: 데이터 제공부
210: 카탈로그 데이터베이스
220: 기본 정보 데이터베이스

Claims (10)

  1. 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템에 있어서,
    메타데이터를 저장하는 카탈로그 데이터베이스 및 포털에서 제공된 정보를 저장하는 기본 정보 데이터베이스를 포함하는 데이터 저장부;
    상기 메타데이터를 카탈로그 데이터베이스에 저장된 메타데이터 카탈로그 정보에 기초하여 카테고리를 분류하는 데이터 분류부;
    상기 메타데이터를 배포를 위한 형식으로 변환하는 메타데이터 변환부; 및
    사용자의 요청에 따라 상기 변환된 메타데이터를 제공하는 데이터 제공부;
    를 포함하고,
    상기 데이터 저장부는,
    관리자로부터 링크 정보를 수신하고, 상기 링크 정보와 연계된 상기 포털에서 상기 메타데이터 카탈로그 정보와 매칭하는 메타데이터 또는 링크 정보가 없는 데이터를 수집하여 저장하되,
    상기 데이터 저장부는,
    상기 링크 정보와 연계된 포털에서 조회된 복수의 메타데이터 각각의 항목과 상기 메타데이터 카탈로그 정보에 포함된 항목 중 일치하는 항목의 개수가 미리 설정한 개수 이상인 메타데이터를 전송받아 저장하는 것인, 카탈로그 시스템.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 데이터 저장부는,
    상기 링크 정보가 없는 데이터를 상기 카탈로그 데이터베이스에서 링크 정보를 매핑한 데이터를 저장하는 것인, 카탈로그 시스템.
  5. 제1항에 있어서,
    상기 데이터 분류부는,
    상기 링크 정보와 연계된 포털의 데이터 저장 방식에 기초하여 카탈로그를 분류하는 것인, 카탈로그 시스템.
  6. 제1항에 있어서,
    상기 데이터 분류부는,
    상기 링크 정보가 없는 데이터를 상기 카탈로그 데이터베이스에 저장된 카탈로그 정보에 기반하여 상기 카테고리를 추가 정의하고 저장하는 것인, 카탈로그 시스템.
  7. 제1항에 있어서,
    상기 메타데이터 변환부는,
    상기 메타데이터를 파일 형태로 변환하여 상기 카탈로그 데이터베이스에 저장하는 것인, 카탈로그 시스템.
  8. 제1항에 있어서,
    상기 데이터 제공부는,
    상기 사용자의 요청에 따라 카탈로그 데이터베이스에 저장된 메타데이터 파일 및 상기 기본 정보 데이터베이스에 저장된 상기 링크 정보를 매핑한 데이터를 제공하는 것인, 카탈로그 시스템.
  9. 카탈로그 시스템에 의해 수행되는 시계열 데이터 활용을 위한 메타데이터 카탈로그 제공 방법에 있어서,
    메타데이터 및 포털에서 제공된 정보를 저장하는 단계;
    상기 메타데이터를 카탈로그 데이터베이스에 저장된 메타데이터 카탈로그 정보에 기초하여 카테고리를 분류하는 단계;
    상기 메타데이터를 배포를 위한 형식으로 변환하는 단계; 및
    사용자의 요청에 따라 상기 변환된 메타데이터를 제공하는 단계;
    를 포함하고,
    상기 저장하는 단계는,
    관리자로부터 링크 정보를 수신하고, 상기 링크 정보와 연계된 상기 포털에서 상기 메타데이터 카탈로그 정보와 매칭하는 메타데이터 또는 링크 정보가 없는 데이터를 수집하여 저장하되,
    상기 저장하는 단계는,
    상기 링크 정보와 연계된 포털에서 조회된 복수의 메타데이터 각각의 항목과 상기 메타데이터 카탈로그 정보에 포함된 항목 중 일치하는 항목의 개수가 미리 설정한 개수 이상인 메타데이터를 전송받아 저장하는 것인, 카탈로그 제공 방법.
  10. 제9항에 따른 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록한 컴퓨터에서 판독 가능한 기록매체.
KR1020220155240A 2022-11-18 2022-11-18 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템 및 방법 KR102612346B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220155240A KR102612346B1 (ko) 2022-11-18 2022-11-18 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220155240A KR102612346B1 (ko) 2022-11-18 2022-11-18 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR102612346B1 true KR102612346B1 (ko) 2023-12-11

Family

ID=89162894

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220155240A KR102612346B1 (ko) 2022-11-18 2022-11-18 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102612346B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200123565A (ko) * 2019-04-22 2020-10-30 한국전자통신연구원 데이터 관리 체계에 기반하여 데이터를 관리하는 장치 및 방법
KR20220054992A (ko) * 2020-10-26 2022-05-03 주식회사 데이터누리 Dcat 기반 메타데이터 변환 시스템
KR20220149635A (ko) * 2017-11-14 2022-11-08 스노우플레이크 인코포레이티드 변경할 수 없는 저장소 내의 데이터베이스 메타데이터

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220149635A (ko) * 2017-11-14 2022-11-08 스노우플레이크 인코포레이티드 변경할 수 없는 저장소 내의 데이터베이스 메타데이터
KR20200123565A (ko) * 2019-04-22 2020-10-30 한국전자통신연구원 데이터 관리 체계에 기반하여 데이터를 관리하는 장치 및 방법
KR20220054992A (ko) * 2020-10-26 2022-05-03 주식회사 데이터누리 Dcat 기반 메타데이터 변환 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"생태정보를 위한 메타데이터 카탈로그 시스템 설계 기술 보고서", 한국과학기술정보연구원, 2016.07.31.* *

Similar Documents

Publication Publication Date Title
US8200617B2 (en) Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata
KR101120301B1 (ko) 지속 저장 포탈
KR101419504B1 (ko) 사용자 성향 분석을 통한 맞춤형 쇼핑 정보 제공 시스템 및 방법
US10423675B2 (en) System and method for automated domain-extensible web scraping
CN109388637A (zh) 数据仓库信息处理方法、装置、系统、介质
Prakash et al. Geo-identification of web users through logs using ELK stack
Ballatore et al. Semantically enriching VGI in support of implicit feedback analysis
US9311303B2 (en) Interpreted language translation system and method
AU2014400621B2 (en) System and method for providing contextual analytics data
CN106021583A (zh) 页面流量数据的统计方法及其系统
US20090083266A1 (en) Techniques for tokenizing urls
Al-asadi et al. A survey on web mining techniques and applications
Bernaschina et al. A big data analysis framework for model-based web user behavior analytics
Nesi et al. An integrated smart city platform
Haris et al. Mining graphs from travel blogs: a review in the context of tour planning
KR102612346B1 (ko) 시계열 데이터 활용을 위한 메타데이터 카탈로그 시스템 및 방법
JP5100855B2 (ja) 潜在クラス分析装置、潜在クラス分析方法及びプログラム
Boldrini et al. Multi-scale hydrological system-of-systems realized through WHOS: the brokering framework
KR102224782B1 (ko) 지역 콘텐츠 관리 서비스 제공 시스템
KR101752259B1 (ko) 고부가 가치화 콘텐츠 관리 장치 및 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체 및 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램
Walter-Tscharf Indexing, clustering, and search engine for documents utilizing Elasticsearch and Kibana
Olfat et al. Towards a foundation for spatial metadata automation
Stuart FOAF within UK academic web space: a webometric analysis of the semantic web
Sultan et al. Scraping Google Scholar Data Using Cloud Computing Techniques
Hovad et al. Real-time web mining application to support decision-making process

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant