KR102498062B1 - 메타데이터 관리 시스템 - Google Patents

메타데이터 관리 시스템 Download PDF

Info

Publication number
KR102498062B1
KR102498062B1 KR1020220096636A KR20220096636A KR102498062B1 KR 102498062 B1 KR102498062 B1 KR 102498062B1 KR 1020220096636 A KR1020220096636 A KR 1020220096636A KR 20220096636 A KR20220096636 A KR 20220096636A KR 102498062 B1 KR102498062 B1 KR 102498062B1
Authority
KR
South Korea
Prior art keywords
data
management
item
list
diagnosis
Prior art date
Application number
KR1020220096636A
Other languages
English (en)
Inventor
조대성
안해성
Original Assignee
주식회사 티유컨설팅
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 티유컨설팅 filed Critical 주식회사 티유컨설팅
Priority to KR1020220096636A priority Critical patent/KR102498062B1/ko
Application granted granted Critical
Publication of KR102498062B1 publication Critical patent/KR102498062B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 메타데이터 관리 시스템에 관한 것으로서, 업무별 메타데이터로부터 생성되는 검사리스트에 대해 품질검사를 수행하여 진단관리 항목별 개선방안을 도출할 수 있는 메타데이터 관리 시스템에 관한 것이다. 이를 위해, 메타데이터 관리 시스템은 업무별 메타데이터를 기설정된 맵핑속성에 따라 분류하고, 이를 토대로 속성별 검사리스트를 생성하는 리스트생성부, 상기 속성별 검사리스트에 대한 데이터 품질검사를 진단관리 항목별로 개별적으로 수행하여, 상기 속성별 검사리스트에 선정된(리스트화된) 유효데이터의 품질상태를 진단하는 진단부 및 상기 데이터 품질검사에 따라 발생하는 진단관리 항목별 오류리스트와 기설정된 복수의 개선방안들 중 적어도 하나를 매칭하여, 진단관리 항목별 개선방안을 생성하는 데이터관리부를 포함하고, 상기 데이터관리부는 상기 진단관리 항목별 개선방안에 기초하여, 상기 유효데이터를 단계적으로 맞춤형 정제데이터로 업데이트한다.

Description

메타데이터 관리 시스템{METADATA MANAGEMENT SYSTEM}
본 발명은 메타데이터 관리 시스템에 관한 것으로서, 업무별 메타데이터로부터 생성되는 검사리스트에 대해 품질검사를 수행하여 진단관리 항목별 개선방안을 도출할 수 있는 메타데이터 관리 시스템에 관한 것이다.
종래의 데이터 품질관리 솔루션은 웹 기반으로 설계되어 운영됨에 따라 데이터 품질 진단 시 해당 기관의 Current System에 부하가 발생하고, 데이터 분석에 많은 시간이 소요되는 문제점이 있다.
또한, 공공기관의 경우 업무 특성상 데이터 관련 업무는 보안이 생명이나, 웹 기반의 솔루션을 통해 데이터 품질을 관리하는 경우, 관리 대상 데이터에 대한 변경, 손상 또는 파괴 여부 검증 등에 대한 무결성을 답보할 수 없다는 문제점이 있다.
또한, 대부분의 데이터 품질관리 솔루션은 기관이나 부처에서 고시한 기준에 부합하도록 설계됨에 따라, 기관이나 업체별 데이터 특성에 대한 고려 없이 특정 지표 및 패턴에 국한되어 운영되어 다양성이 결여되는 문제점이 있다.
아울러, 특정 기관의 데이터 특성에 맞는 지표나 패턴을 추가 또는 변경하는 경우, 솔루션 개발업체에 문의하거나 의존할 수밖에 없어 개발업체에 종속되는 문제점이 있다.
본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서, 본 발명의 목적은 업무별 메타데이터로부터 생성되는 검사리스트에 대한 데이터 품질검사를 수행하여 유효데이터의 품질상태를 보다 정확하게 진단할 수 있는 메타데이터 관리 시스템을 제공하기 위한 것이다.
또한, 데이터 품질검사에 따라 진단된 유효데이터의 품질상태에 대응되는 진단관리 항목별 개선방안을 도출하고, 이를 토대로 유효데이터를 단계적으로 맞춤형 정제데이터로 업데이트할 수 있는 메타데이터 관리 시스템을 제공하기 위한 것이다.
본 발명의 상기 및 다른 목적과 이점은 바람직한 실시예를 설명한 하기의 설명으로부터 분명해질 것이다.
상기와 같은 목적을 달성하기 위한 본 발명의 일실시예에 따른 메타데이터 관리 시스템은 업무별 메타데이터를 기설정된 맵핑속성에 따라 분류하고, 이를 토대로 속성별 검사리스트를 생성하는 리스트생성부, 상기 속성별 검사리스트에 대한 데이터 품질검사를 진단관리 항목별로 개별적으로 수행하여, 상기 속성별 검사리스트에 선정된(리스트화된) 유효데이터의 품질상태를 진단하는 진단부 및 상기 데이터 품질검사에 따라 발생하는 진단관리 항목별 오류리스트와 기설정된 복수의 개선방안들 중 적어도 하나를 매칭하여, 진단관리 항목별 개선방안을 생성하는 데이터관리부를 포함하고, 상기 데이터관리부는 상기 진단관리 항목별 개선방안에 기초하여, 상기 유효데이터를 단계적으로 맞춤형 정제데이터로 업데이트한다.
실시예에 있어서, 상기 진단관리 항목은 데이터값 진단항목, 표준화 진단항목, 구조화 진단항목, 연계화 진단항목 및 관리체계화 진단항목을 포함한다.
실시예에 있어서, 상기 진단부는 상기 속성별 검사리스트에 대한 데이터 품질검사를 수행함에 따라 카운팅되는 전체검사개수와 오류개수에 기초하여, 진단관리 항목별 오류율을 산출한다.
실시예에 있어서, 상기 진단부는 상기 진단관리 항목별 오류율 중 상기 데이터값 진단항목, 상기 표준화 진단항목 및 상기 구조화 진단항목에 대한 각 오류율과 항목별 가중치에 기초하여, 상기 속성별 검사리스트에 대한 전체 오류율을 추정함에 따라 품질상태를 단계적으로 진단한다.
실시예에 있어서, 상기 데이터관리부는 상기 진단관리 항목별 개선방안을 품질개선 항목과 관리체계 항목으로 분류하고, 해당 진단관리 항목 종류에 기초하여 상기 진단관리 항목별 개선방안에 식별번호를 부여하는 식별부, 기설정된 정보화전략 관점 중요도와 파급효과 시급성 중 어느 하나에 따라, 상기 진단관리 항목별 개선방안에 대한 처리우선순위를 결정하여 기간별 품질관리 로드맵을 생성하는 로드맵생성부 및 상기 기간별 품질관리 로드맵에 따라, 상기 진단관리 항목별 개선방안 중 어느 하나를 통해 상기 유효데이터를 순차적으로 개선시키는 데이터처리부를 더 포함한다.
실시예에 있어서, 상기 데이터처리부는 상기 기간별 품질관리 로드맵과 기설정된 중요도 순서에 기초하여, 데이터처리 일정스케줄을 생성하고, 상기 데이터처리 일정스케줄은 상기 진단관리 항목별 개선방안을 분기별로 표기한 일정을 의미한다.
실시예에 있어서, 상기 데이터처리부는 상기 진단관리 항목별 개선방안 중 상기 품질개선 항목에 따라 분류된 적어도 하나의 개선방안에 대하여 적어도 2회 이상 처리하도록 상기 데이터처리 일정스케줄을 업데이트한다.
실시예에 있어서, 상기 데이터처리부는 상기 데이터처리 일정스케줄로부터 현재 기간에 대응되는 어느 하나의 개선방안을 탐지하는 개선방안 탐지부, 상기 유효데이터에 대해 기설정된 작업을 수행하는 복수의 처리모듈들 중 상기 어느 하나의 개선방안에 대응되는 적어도 하나의 처리모듈을 활성화시키는 활성화부 및 상기 적어도 하나의 처리모듈을 이용하여, 상기 속성별 검사리스트를 단계적으로 편집 관리하는 리스트관리부를 포함한다.
본 발명의 실시예에 따르면, 업무별 메타데이터에 대한 데이터 품질검사를 수행하여 메타데이터의 품질상태를 보다 정확하게 진단할 수 있다.
또한, 메타데이터의 품질상태에 대응되는 진단관리 항목별 개선방안을 도출하고, 진단관리 항목별 개선방안을 통해 메타데이터의 품질상태를 개선시킬 수 있다.
도 1은 본 발명의 실시예에 따른 메타데이터 관리 시스템(1000)을 개략적으로 나타내는 도이다.
도 2a는 도 1의 리스트생성부(100)에서 이용하는 맵핑속성에 대한 실시예이고, 도 2b는 도 1의 리스트생성부(100)가 생성하는 속성별 검사리스트에 대한 실시예이다.
도 3a는 도 1의 진단부(200)가 도출하는 분석자료에 대한 실시예이고, 도 3b는 도 1의 데이터관리부(300)가 생성하는 진단관리 항목별 개선방안에 대한 실시예이다.
도 4는 도 1의 데이터관리부(300)의 실시예에 따른 블록도이다.
도 5(A)는 기설정된 정보화전략 관점 중요도 및 파급효과 시급성 테이블에 대한 예시도이고, 도 5(B)는 기간별 품질관리 로드맵에 대한 예시도이다.
도 6은 데이터처리 일정스케줄에 대한 예시도이다.
도 7은 도 4의 데이터처리부(330)를 구체적으로 설명하기 위한 블록도이다.
도 8은 도 1의 메타데이터 관리 시스템(1000)에 대한 동작 프로세스이다.
이하, 본 발명의 실시예와 도면을 참조하여 본 발명을 상세히 설명한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위해 예시적으로 제시한 것일 뿐, 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가지는 자에 있어서 자명할 것이다.
또한, 달리 정의하지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술 분야의 숙련자에 의해 통상적으로 이해되는 바와 동일한 의미를 가지며, 상충되는 경우에는, 정의를 포함하는 본 명세서의 기재가 우선할 것이다.
도면에서 제안된 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. 그리고, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에서 기술한 "부"란, 특정 기능을 수행하는 하나의 단위 또는 블록을 의미한다.
각 단계들에 있어 식별부호(제1, 제2, 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 실시될 수도 있고 실질적으로 동시에 실시될 수도 있으며 반대의 순서대로 실시될 수도 있다.
도 1은 본 발명의 실시예에 따른 메타데이터 관리 시스템(1000)을 개략적으로 나타내는 도이고, 도 2a는 도 1의 리스트생성부(100)에서 이용하는 맵핑속성에 대한 실시예이고, 도 2b는 도 1의 리스트생성부(100)가 생성하는 속성별 검사리스트에 대한 실시예이며, 도 3a는 도 1의 진단부(200)가 도출하는 분석자료에 대한 실시예이고, 도 3b는 도 1의 데이터관리부(300)가 생성하는 진단관리 항목별 개선방안에 대한 실시예이다.
도 1 내지 도 3b를 참조하여 설명하면, 메타데이터 관리 시스템(1000)는 리스트생성부(100), 진단부(200) 및 데이터관리부(300)를 포함할 수 있다.
먼저, 리스트생성부(100)는 데이터 정제를 의뢰하는 의뢰업체에서 관리하는 의뢰업체 DB(10)에 저장된 업무별 메타데이터로부터 기설정된 맵핑속성에 따라 분류하고, 이를 토대로 속성별 검사리스트를 생성할 수 있다.
여기서, 기설정된 맵핑속성은 도 2a에 도시된 바와 같이, 특정정보에 따라 업무별 메타데이터를 분류하기 위한 키워드 엔티티들의 리스트일 수 있다.
예를 들면, 의뢰업체가 소방청이고, 의뢰업체 DB(10)에 저장된 업무별 메타데이터가 소방관련데이터이며, 특정정보가 화재정보와 출동정보인 경우, 키워드 엔티티들은 화재증거물 기본입력, 특정소방대상물구분, 차량유형조사서, 연소확대, 위험물가스유형조사서 등을 포함할 수 있다. 한편, 업무 종류에는 소방시설, 화재정보, 기상정보, 건축물, 재산피해산정, 보험가입정보, 긴급구조 및 통계정보를 포함하는 화재 관련 업무와 항공기 정보, 출동정보, 관제정보 및 구급정보를 포함하는 긴급이송 관련 업무를 포함할 수 있다.
이때, 속성별 검사리스트는 도 2b에 도시된 바와 같이, 기준 엔티티마다 업무별 메타데이터로부터 추출되어 리스트화된 테이블로서, 리스트생성부(100)를 통해 저장 DB(500)에 저장 및 관리될 수 있다.
다음으로, 진단부(200)는 리스트생성부(100)를 통해 생성된 속성별 검사리스트에 대한 데이터 품질검사를 진단관리 항목별로 개별적으로 수행하여, 속성별 검사리스트에 선정된(리스트화된) 유효데이터의 품질상태를 진단할 수 있다.
여기서, 진단관리 항목은 데이터값 진단항목, 표준화 진단항목, 구조화 진단항목, 연계화 진단항목 및 관리체계화 진단항목을 포함할 수 있다.
이때, 유효데이터는 리스트생성부(100)를 통해 생성된 속성별 검사리스트에 리스트화되어 선정된 메타데이터를 의미할 수 있다.
일 실시예에 따라, 진단부(200)는 속성별 검사리스트에 대한 데이터 품질검사를 수행함에 따라 카운팅되는 전체검사개수와 오류개수에 기초하여, 진단관리 항목별 오류율을 산출할 수 있다.
예를 들면, 속성별 검사리스트에 대한 데이터값 진단항목의 데이터 품질검사에 따라 카운팅되는 전체검사개수가 25222561 건수이고, 오류개수가 5841715 건수인 경우, 진단부(200)는 오류율을 23.16%로 산출할 수 있다.
다른 실시예에 따라, 진단부(200)는 데이터값 진단항목, 표준화 진단항목 및 구조화 진단항목에 대한 각 오류율과 항목별 가중치에 기초하여, 속성별 검사리스트에 대한 전체 오류율을 추정함에 따른 품질상태를 단계적으로 진단할 수 있다.
구체적으로, 진단부(200)는 데이터값 진단항목의 오류율과 기설정된 정확성 가중치 간의 곱, 표준화 진단항목의 오류율과 기설정된 일관성 가중치 간의 곱 및 구조화 진단항목의 오류율과 기설정된 완전성 가중치 간의 곱을 더하여, 속성별 검사리스트에 대한 전체 오류율을 추정함에 따라 품질상태를 단계적으로 진단할 수 있다.
여기서, 기설정된 정확성 가중치는 0.7이고, 기설정된 일관성 가중치는 0.2이며, 기설정된 완전성 가중치는 0.1일 수 있다.
또 다른 실시예에 따라, 진단부(200)는 속성별 검사리스트에 대한 데이터 품질검사를 수행함에 따라 분석되는 진단관리 항목별 오류 원인과 오류 영향 요인을 관리자 단말(미도시)에 데이터관리 서비스를 통해 전송할 수 있다.
이때, 진단부(200)는 관리자 단말(미도시)로부터 데이터관리 서비스를 통해 입력받는 진단관리 항목별 오류 원인과 오류 영향 요인에 대한 개선대상응답의 키워드에 기초하여, 진단관리 항목별 오류리스트를 도출할 수 있다.
여기서, 데이터관리 서비스는 도 3a에 도시된 바와 같이, 오류 원인, 오류 영향 요인 및 개선대상응답을 진단관리 항목별로 통합하여 저장 DB(500)에 분석자료로 등록하는 프로그램일 수 있다.
또한, 진단관리 항목별 오류리스트는 여부 도메인 데이터 정제, 날짜 유효 위배 데이터 개선, 공통코드 데이터 정제, 데이터 규칙, 표준 도메인 정의 및 지침 수립, 표준 용어 도메인 DB, 미사용 테이블 삭제, 필수항목 지정, 비표준 명명규칙 개선, 임시 테이블 정리, 인덱스 중복 삭제, 중복 테이블 통합, 데이터 표준 및 구조 관리 역할과 책임 정의, 데이터 관리 지침 및 규정 제정, 데이터 구조 관리 통제프로세스 구축, 데이터 표준 및 품질 관리 자동화 도구 도입, 기관 품질관리, DB 품질관리 데이터 품질관리 등을 포함할 수 있다.
다음으로, 데이터관리부(300)는 진단부(200)를 통해 수행되는 데이터 품질검사에 따라 발생하는 진단관리 항목별 오류리스트와 기설정된 복수의 개선방안들 중 적어도 하나를 매칭하여, 진단관리 항목별 개선방안을 생성할 수 있다.
여기서, 진단관리 항목별 개선방안은 도 3b에 도시된 바와 같이, 데이터값 정제방안, 데이터표준 정의방안, 데이터구조 개선방안, 지침가이드 보완방안, 조직 및 프로세스 수립방안, 도구 도입방안 및 평가가이드 지원방안을 포함할 수 있다.
이러한 진단관리 항목별 개선방안은 진단관리 항목별 오류리스트에 일대일, 일대다, 다대일 및 다대다로 서로 대응되게 연결된 테이블일 수 있다.
이때, 데이터관리부(300)는 진단관리 항목별 개선방안에 기초하여, 속성별 검사리스트에 선정된(리스트화된) 유효데이터를 단계적으로 맞춤형 정제데이터로 업데이트하여 의뢰업체 DB(10)에 제공할 수 있다.
실시예에 따라, 데이터관리부(300)는 진단부(200)를 통해 진단된 유효데이터에 대한 제1 품질상태와 진단관리 항목별 개선방안에 따라 업데이트된 정제데이터에 대한 제2 품질상태 간의 차이에 기초하여, 유효데이터에 대한 업데이트 횟수를 조절할 수 있다.
이하, 구체적인 실시예와 비교예를 통하여 본 발명의 구성 및 그에 따른 효과를 보다 상세히 설명하고자 한다. 그러나, 본 실시예는 본 발명을 보다 구체적으로 설명하기 위한 것이며, 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
도 4는 도 1의 데이터관리부(300)의 실시예에 따른 블록도이고, 도 5(A)는 기설정된 정보화전략 관점 중요도 및 파급효과 시급성 테이블에 대한 예시도이고, 도 5(B)는 기간별 품질관리 로드맵에 대한 예시도이며, 도 6은 데이터처리 일정스케줄에 대한 예시도이다.
도 1, 도 3b, 도 4 내지 도 6을 참조하면, 데이터관리부(300)는 식별부(310), 로드맵생성부(320) 및 데이터처리부(330)를 포함할 수 있다.
먼저, 식별부(310)는 도 3b에 도시된 바와 같이, 진단관리 항목별 개선방안을 품질개선 항목과 관리체계 항목으로 분류하고, 해당 진단관리 항목 종류에 기초하여 진단관리 항목별 개선방안에 식별번호를 부여할 수 있다.
다음으로, 로드맵생성부(320)는 기설정된 정보화전략 관점 중요도 및 파급효과 시급성 테이블에 따라 결정되는 처리우선순위에 기초하여, 기간별 품질관리 로드맵을 생성하고 이를 의뢰업체단말(20)에 제공할 수 있다.
여기서, 기설정된 정보화전략 관점 중요도 및 파급효과 시급성 테이블은 도 5(A)에 도시된 바와 같이, 정보화전략 관점 중요도에 따라 결정되는 진단관리 항목별 개선방안의 순서정보와 파급효과 시급성에 따라 결정되는 진단관리 항목별 개선방안의 순서정보를 포함할 수 있다.
이때, 기간별 품질관리 로드맵은 도 5(B)에 도시된 바와 같이, 최우선 단계, 단기 단계, 중기 단계 및 장기 단계에 따라 분류된 어느 하나의 개선방안을 포함할 수 있다. 즉, 기설정된 정보화전략 관점 중요도 및 파급효과 시급성 테이블과 기간별 품질관리 로드맵은 서로 대응될 수 있다.
다음으로, 데이터처리부(330)는 로드맵생성부(320)를 통해 생성된 기간별 품질관리 로드맵에 따라, 진단관리 항목별 개선방안 중 어느 하나를 통해 유효데이터를 단계적으로 개선시킬 수 있다.
일 실시예에 따라, 데이터처리부(330)는 기간별 품질관리 로드맵에 기초하여, 데이터처리 일정스케줄을 생성하여 의뢰업체단말(20)에 제공할 수 있다.
여기서, 데이터처리 일정스케줄은 도 6에 도시된 바와 같이, 진단관리 항목별 개선방안을 분기별로 표기한 일정을 의미할 수 있다.
다른 실시예에 따라, 데이터처리부(330)는 진단관리 항목별 개선방안 중 품질개선 항목에 따라 분류된 적어도 하나의 개선방안에 대하여 적어도 2회 이상 처리하도록 데이터처리 일정스케줄을 업데이트할 수 있다.
도 7은 도 4의 데이터처리부(330)를 구체적으로 설명하기 위한 블록도이다.
도 4와 도 7을 참조하면, 데이터처리부(330)는 개선방안 탐지부(331), 활성화부(332) 및 리스트관리부(333)를 포함할 수 있다.
먼저, 개선방안 탐지부(331)는 데이터처리 일정스케줄로부터 현재 기간에 대응되는 어느 하나의 개선방안을 탐지할 수 있다.
다음으로, 활성화부(332)는 속성별 검사리스트에 선정된(리스트화된) 유효데이터에 대해 기설정된 작업을 수행하는 복수의 처리모듈들(331_1~331_N) 중 어느 하나의 개선방안에 대응되는 적어도 하나의 처리모듈(예컨대, 331_1, 331_2)을 활성화시킬 수 있다.
구체적으로, 복수의 처리모듈(332_1~332_N)은 속성별 검사리스트로부터 중의값을 가진 메타데이터를 검출하여 삭제하는 삭제모듈(예컨대, 332_1), 속성별 검사리스트로부터 비표준 용어의 메타데이터를 검출하여 표준용어로 수정하는 수정모듈(예컨대, 332_2), 속성별 검사리스트에서 데이터검색을 위한 기본키와 테이블 및 컬럼 커멘트를 지정하는 지정모듈(예컨대, 332_3), 속성별 검사리스트에 대한 표준단어사전, 표준용어사전, 표준도메인사전, 표준코드사전을 설정하는 사전설정모듈(예컨대, 332_4), 속성별 검사리스트를 관리하는 업무조직도를 편성하여 제공하는 편성모듈(예컨대, 332_5), 속성별 검사리스트에서 특정데이터를 자동으로 조회 및 변경할 수 있는 매크로도구를 설정하는 도구설정모듈(예컨대, 332_6) 및 성별 검사리스트에 대해 기설정된 평가표를 통해 품질상태를 평가하는 평가모듈(예컨대, 332_7)을 포함할 수 있다.
다음으로, 리스트관리부(333)는 활성화부(332)를 통해 활성화되는 적어도 하나의 처리모듈(예컨대, 331_1, 331_2)을 이용하여, 속성별 검사리스트를 단계적으로 편집 관리할 수 있다.
도 8은 도 1의 메타데이터 관리 시스템(1000)에 대한 동작 프로세스이다.
도 1 내지 도 8을 참조하면, 먼저, S110 단계에서, 리스트생성부(100)는 데이터 정제를 의뢰하는 의뢰업체에서 관리하는 의뢰업체 DB(10)에 저장된 업무별 메타데이터로부터 기설정된 맵핑속성에 따라 분류하고, 이를 토대로 속성별 검사리스트를 생성할 수 있다.
그런 다음, S120 단계에서, 진단부(200)는 리스트생성부(100)를 통해 생성된 속성별 검사리스트에 대한 데이터 품질검사를 진단관리 항목별로 개별적으로 수행하여, 속성별 검사리스트에 선정된(리스트화된) 유효데이터의 품질상태를 진단할 수 있다.
이때, S130 단계에서, 데이터관리부(300)는 진단부(200)를 통해 수행되는 데이터 품질검사에 따라 발생하는 진단관리 항목별 오류리스트와 기설정된 복수의 개선방안들 중 적어도 하나를 매칭하여, 진단관리 항목별 개선방안을 생성할 수 있다.
이후, S140 단계에서, 데이터관리부(300)는 진단관리 항목별 개선방안에 기초하여, 속성별 검사리스트에 선정된(리스트화된) 유효데이터를 단계적으로 맞춤형 정제데이터로 업데이트하여 의뢰업체 DB(10)에 제공할 수 있다.
본 명세서에서는 본 발명자들이 수행한 다양한 실시예 가운데 몇 개의 예만을 들어 설명하는 것이나 본 발명의 기술적 사상은 이에 한정하거나 제한되지 않고, 당업자에 의해 변형되어 다양하게 실시될 수 있음은 물론이다.
100: 리스트생성부
200: 진단부
300: 데이터관리부
1000: 메타데이터 관리 시스템

Claims (8)

  1. 데이터 정제가 의뢰된 업무별 메타데이터를 기설정된 맵핑속성에 따라 분류하고, 이를 토대로 속성별 검사리스트를 생성하는 리스트생성부;
    상기 속성별 검사리스트에 대한 데이터 품질검사를 진단관리 항목별로 개별적으로 수행하여, 상기 속성별 검사리스트에 선정된 유효데이터의 품질상태를 진단하는 진단부; 및
    상기 데이터 품질검사에 따라 발생하는 진단관리 항목별 오류리스트와 기설정된 복수의 개선방안들 중 적어도 하나를 매칭하여, 진단관리 항목별 개선방안을 생성하는 데이터관리부를 포함하고,
    상기 데이터관리부는 상기 진단관리 항목별 개선방안 중 어느 하나를 통해 상기 유효데이터를 단계적으로 상기 업무별 메타데이터가 저장된 의뢰업체 DB에 제공되는 맞춤형 정제데이터로 개선시키고,
    상기 진단관리 항목은 데이터값 진단항목, 표준화 진단항목, 구조화 진단항목, 연계화 진단항목 및 관리체계화 진단항목을 포함하며,
    상기 진단부는 상기 속성별 검사리스트에 대한 데이터 품질검사를 수행함에 따라 카운팅되는 전체검사개수와 오류개수에 기초하여, 진단관리 항목별 오류율을 산출하고,
    상기 진단부는 상기 진단관리 항목별 오류율 중 상기 데이터값 진단항목, 상기 표준화 진단항목 및 상기 구조화 진단항목에 대한 각 오류율과 항목별 가중치에 기초하여, 상기 속성별 검사리스트에 대한 전체 오류율을 추정함에 따라 품질상태를 단계적으로 진단하며,
    상기 진단부는 상기 데이터값 진단항목의 오류율과 기설정된 정확성 가중치 간의 곱, 상기 표준화 진단항목의 오류율과 기설정된 일관성 가중치 간의 곱 및 상기 구조화 진단항목의 오류율과 기설정된 완전성 가중치 간의 곱을 더하여, 상기 전체 오류율을 추정하고,
    상기 기설정된 정확성 가중치는 0.7이고, 기설정된 일관성 가중치는 0.2이며, 기설정된 완전성 가중치는 0.1이며,
    상기 진단부는 상기 속성별 검사리스트에 대한 데이터 품질검사를 수행함에 따라 분석되는 진단관리 항목별 오류 원인과 오류 영향 요인을 관리자 단말에 데이터관리 서비스를 통해 전송할 때, 상기 데이터관리 서비스를 통해 상기 관리자 단말로부터 입력받는 개선대상응답의 키워드에 기초하여 상기 진단관리 항목별 오류리스트를 도출하고,
    상기 데이터관리 서비스는 상기 오류 원인, 상기 오류 영향 요인 및 상기 개선대상응답을 진단관리 항목별로 통합하여 분석자료로 등록하는 프로그램이며,
    상기 진단관리 항목별 오류리스트는 상기 진단관리 항목별 개선방안에 일대일, 일대다, 다대일 및 다대다로 서로 대응되게 연결되도록, 여부 도메인 데이터 정제, 날짜 유효 위배 데이터 개선, 공통코드 데이터 정제, 데이터 규칙, 표준 도메인 정의 및 지침 수립, 표준 용어 도메인 DB, 미사용 테이블 삭제, 필수항목 지정, 비표준 명명규칙 개선, 임시 테이블 정리, 인덱스 중복 삭제, 중복 테이블 통합, 데이터 표준 및 구조 관리 역할과 책임 정의, 데이터 관리 지침 및 규정 제정, 데이터 구조 관리 통제프로세스 구축, 데이터 표준 및 품질 관리 자동화 도구 도입, 기관 품질관리, DB 품질관리 및 데이터 품질관리를 포함하는 테이블이고,
    상기 데이터관리부는 상기 진단관리 항목별 개선방안을 품질개선 항목과 관리체계 항목으로 분류하고, 해당 진단관리 항목 종류에 기초하여 상기 진단관리 항목별 개선방안에 식별번호를 부여하는 식별부;
    기설정된 정보화전략 관점 중요도와 파급효과 시급성 중 어느 하나에 따라, 상기 진단관리 항목별 개선방안에 대한 처리우선순위를 결정하여 기간별 품질관리 로드맵을 생성하는 로드맵생성부; 및
    상기 기간별 품질관리 로드맵에 따라, 상기 진단관리 항목별 개선방안 중 어느 하나를 통해 상기 유효데이터를 순차적으로 개선시키는 데이터처리부를 더 포함하고,
    상기 데이터처리부는 상기 기간별 품질관리 로드맵과 기설정된 중요도 순서에 기초하여, 데이터처리 일정스케줄을 생성하고,
    상기 데이터처리 일정스케줄은 상기 진단관리 항목별 개선방안을 분기별로 표기한 일정을 의미하며,
    상기 데이터처리부는 상기 데이터처리 일정스케줄로부터 현재 기간에 대응되는 어느 하나의 개선방안을 탐지하는 개선방안 탐지부;
    상기 유효데이터에 대해 기설정된 작업을 수행하는 복수의 처리모듈들 중 상기 어느 하나의 개선방안에 대응되는 적어도 하나의 처리모듈을 활성화시키는 활성화부; 및
    상기 적어도 하나의 처리모듈을 이용하여, 상기 속성별 검사리스트를 단계적으로 편집 관리하는 리스트관리부를 포함하고,
    상기 복수의 처리모듈들은 상기 속성별 검사리스트로부터 중의값을 가진 메타데이터를 검출하여 삭제하는 삭제모듈, 상기 속성별 검사리스트로부터 비표준 용어의 메타데이터를 검출하여 표준용어로 수정하는 수정모듈, 상기 속성별 검사리스트에서 데이터검색을 위한 기본키와 테이블 및 컬럼 커멘트를 지정하는 지정모듈, 상기 속성별 검사리스트에 대한 표준단어사전, 표준용어사전, 표준도메인사전, 표준코드사전을 설정하는 사전설정모듈, 상기 속성별 검사리스트를 관리하는 업무조직도를 편성하여 제공하는 편성모듈, 상기 속성별 검사리스트에서 특정데이터를 자동으로 조회 및 변경할 수 있는 매크로도구를 설정하는 도구설정모듈 및 성별 검사리스트에 대해 기설정된 평가표를 통해 품질상태를 평가하는 평가모듈을 포함하는, 메타데이터 관리 시스템.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 제1항에 있어서,
    상기 데이터처리부는 상기 진단관리 항목별 개선방안 중 상기 품질개선 항목에 따라 분류된 적어도 하나의 개선방안에 대하여 적어도 2회 이상 처리하도록 상기 데이터처리 일정스케줄을 업데이트하는, 메타데이터 관리 시스템.

  8. 삭제
KR1020220096636A 2022-08-03 2022-08-03 메타데이터 관리 시스템 KR102498062B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220096636A KR102498062B1 (ko) 2022-08-03 2022-08-03 메타데이터 관리 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220096636A KR102498062B1 (ko) 2022-08-03 2022-08-03 메타데이터 관리 시스템

Publications (1)

Publication Number Publication Date
KR102498062B1 true KR102498062B1 (ko) 2023-02-10

Family

ID=85223732

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220096636A KR102498062B1 (ko) 2022-08-03 2022-08-03 메타데이터 관리 시스템

Country Status (1)

Country Link
KR (1) KR102498062B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102615956B1 (ko) 2023-09-04 2023-12-20 주식회사 위드퓨처 기업간 데이터 공유를 위한 메타데이터 관리 시스템

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11224187A (ja) * 1998-02-06 1999-08-17 Mitsubishi Electric Corp ソフトウェア品質評価システム
KR20040023376A (ko) * 2002-09-11 2004-03-18 한국과학기술정보연구원 실시간 서지데이터베이스 평가 방법
KR20080001248A (ko) * 2006-06-29 2008-01-03 (재)한국데이터베이스진흥센터 데이터베이스 품질관리 시스템
KR100798577B1 (ko) * 2007-06-29 2008-01-28 주식회사 엘지씨엔에스 데이터품질문제 분석시스템 및 데이터품질문제 분석방법
JP2010072944A (ja) * 2008-09-18 2010-04-02 Hitachi Information Systems Ltd 情報処理システムにおける設計品質検査の支援システム
KR101125417B1 (ko) * 2010-09-15 2012-07-11 재단법인 한국데이터베이스진흥원 데이터 품질 진단 방법과 시스템
KR20150113244A (ko) * 2014-03-27 2015-10-08 재단법인 한국데이터베이스진흥원 객체 데이터 품질관리 방법
KR20160137837A (ko) * 2015-05-22 2016-12-01 명지대학교 산학협력단 공공데이터 품질 관리 프로세스 능력 및 조직 성숙도 평가 시스템 및 방법
KR20190087807A (ko) * 2018-01-17 2019-07-25 제노테크주식회사 데이터레이크 프레임워크
JP2020514935A (ja) * 2017-03-15 2020-05-21 ファウナ, インク.Fauna, Inc. データベース用の方法及びシステム
KR20200106106A (ko) * 2019-02-25 2020-09-11 지티원 주식회사 사물 인터넷 실시간 데이터 품질 관리 시스템 및 그 방법

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11224187A (ja) * 1998-02-06 1999-08-17 Mitsubishi Electric Corp ソフトウェア品質評価システム
KR20040023376A (ko) * 2002-09-11 2004-03-18 한국과학기술정보연구원 실시간 서지데이터베이스 평가 방법
KR20080001248A (ko) * 2006-06-29 2008-01-03 (재)한국데이터베이스진흥센터 데이터베이스 품질관리 시스템
KR100798577B1 (ko) * 2007-06-29 2008-01-28 주식회사 엘지씨엔에스 데이터품질문제 분석시스템 및 데이터품질문제 분석방법
JP2010072944A (ja) * 2008-09-18 2010-04-02 Hitachi Information Systems Ltd 情報処理システムにおける設計品質検査の支援システム
KR101125417B1 (ko) * 2010-09-15 2012-07-11 재단법인 한국데이터베이스진흥원 데이터 품질 진단 방법과 시스템
KR20150113244A (ko) * 2014-03-27 2015-10-08 재단법인 한국데이터베이스진흥원 객체 데이터 품질관리 방법
KR20160137837A (ko) * 2015-05-22 2016-12-01 명지대학교 산학협력단 공공데이터 품질 관리 프로세스 능력 및 조직 성숙도 평가 시스템 및 방법
JP2020514935A (ja) * 2017-03-15 2020-05-21 ファウナ, インク.Fauna, Inc. データベース用の方法及びシステム
KR20190087807A (ko) * 2018-01-17 2019-07-25 제노테크주식회사 데이터레이크 프레임워크
KR20200106106A (ko) * 2019-02-25 2020-09-11 지티원 주식회사 사물 인터넷 실시간 데이터 품질 관리 시스템 및 그 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102615956B1 (ko) 2023-09-04 2023-12-20 주식회사 위드퓨처 기업간 데이터 공유를 위한 메타데이터 관리 시스템

Similar Documents

Publication Publication Date Title
US10901727B2 (en) Monitoring code sensitivity to cause software build breaks during software project development
US8655830B2 (en) Systems and methods for reporting a cause of an event or equipment state using causal relationship models in a building management system
RU2724466C2 (ru) Системы и способы неразрушающего контроля с участием удаленного специалиста
US7814194B2 (en) Method and system for machine-aided rule construction for event management
Golabchi et al. Automated building information modeling for fault detection and diagnostics in commercial HVAC systems
US6697791B2 (en) System and method for systematic construction of correlation rules for event management
Neil et al. Applying Bayesian belief networks to system dependability assessment
US8160910B2 (en) Visualization for aggregation of change tracking information
US20080243912A1 (en) Method of providing business intelligence
US9799007B2 (en) Method of collaborative software development
CN210150534U (zh) 一种具预警功能的电梯维保系统
US20180012181A1 (en) Method of collaborative software development
KR102498062B1 (ko) 메타데이터 관리 시스템
Pan et al. Facility Maintenance Traceability Information Coding in BIM‐Based Facility Repair Platform
KR102232876B1 (ko) 디지털 설비의 고장 유형 분석 시스템 및 방법
CN116991746B (zh) 一种软件通用质量特性评估方法和装置
WO2021087373A1 (en) Building system with user presentation composition based on building context
van der Schaaf et al. The development of PRISMA-rail: a generic root cause analysis approach for the railway industry
KR102410415B1 (ko) 지능형 약물감시 플랫폼을 제공하기 위한 방법 및 장치
Yen et al. SaaS for automated job performance appraisals using service technologies and big data analytics
CN114266552A (zh) 一种面向服务层级的中台服务管控系统
Azvine et al. Intelligent process analytics for CRM
Grussing Facility degradation and prediction models for sustainment, restoration, and modernization (SRM) planning
Hosseinpouri et al. Methodology for quantitatively monitoring the basic risk factors of accidents: A case study on manufacturing companies
Leung et al. The Carroll–Hung method for component reliability mapping in aircraft maintenance

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant