KR20010011836A - 데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석방법 - Google Patents

데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석방법 Download PDF

Info

Publication number
KR20010011836A
KR20010011836A KR1019990031397A KR19990031397A KR20010011836A KR 20010011836 A KR20010011836 A KR 20010011836A KR 1019990031397 A KR1019990031397 A KR 1019990031397A KR 19990031397 A KR19990031397 A KR 19990031397A KR 20010011836 A KR20010011836 A KR 20010011836A
Authority
KR
South Korea
Prior art keywords
data
mart
conversion
mapping structure
database
Prior art date
Application number
KR1019990031397A
Other languages
English (en)
Inventor
박화규
백종명
이교상
Original Assignee
정선종
한국전자통신연구원
박성득
한국전산원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정선종, 한국전자통신연구원, 박성득, 한국전산원 filed Critical 정선종
Priority to KR1019990031397A priority Critical patent/KR20010011836A/ko
Publication of KR20010011836A publication Critical patent/KR20010011836A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은, 기업 전사적으로 여러 곳으로 물리적으로 분산되어 있는 대용량의 데이터 베이스내에 있는 자료들에 대해 하나의 논리적인 뷰를 제공하기 위한 데이터 마트 구현을 통한 분산데이터베이스의 자료 분석 방법에 관한 것이다.
본 발명에 따르면, 운용 데이터 베이스를 분석하기 위하여 운용 응용 프로그램 원천 테이블에서 데이터 마트에 자료를 적재하기 위해 전체 메타 데이터로써 매핑 구조를 나타내는 제 1 단계; 상기 제 1 단계의 매핑 구조에 있어 데이터를 변환하여 데이터 마트 테이블에 통합적인 스키마를 만들어 적재하는 제 2 단계; 및 상기 제 2 단계의 매핑 구조에 대한 응용 부문 견본을 나타내는 제 3 단계를 포함하여 이루어진 데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석 방법이 제공된다.

Description

데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석 방법 { Method of analyzing OLTP data sources using mart mapping technique }
본 발명은 기업 전사적으로 여러 곳으로 물리적으로 분산되어 있는 대용량의 데이터베이스 내에 있는 자료들에 대해 하나의 논리적인 뷰를 제공하기 위한 데이터 마트 구현을 통한 분산 데이터베이스의 자료 분석 방법에 관한 것이다.
데이터 마트를 이용한 자료 분석 방법은 일반적으로 운영계 시스템의 데이터가 실시간으로 전달되어 축적되는 것이 아니고, 운영계 시스템의 수행에 영향을 미치지 않은 시간을 이용하여 정해진 일정에 의거하여 주기적으로 데이터 마트에 전달되어 적재된다.
의사결정 지원을 위해서는 기업의 데이터를 시간적 차원에서 분석하고 전통적인 운영환경인 2차원 모델링 기술과는 다른 차원인 3차원의 데이터베이스 구축 방법에 필요한 기술 분야이다.
종래에는 이러한 방법이 사용되더라도 비즈니스 문제를 분석함에 있어서 일정한 규칙이 없어 재무, 영업, 마케팅, 기술, 생산부서에서의 일관성 있고 통합된 정보를 얻기 위해서는 정보시스템과 통합되지 않은 개인 컴퓨터와 스프레드 쉬트의 혼용으로 처리함으로써, 로직의 일관성을 보이는 통합된 형태의 추출과 표현이 어려웠다.
따라서, 상기한 바와 같은 문제점을 해결하기 위하여 안출된 본 발명은, 기업 전사적으로 여러 곳으로 물리적 분산되어 있는 대용량의 데이터베이스 내에 있는 자료들에 대한 하나의 논리적인 뷰를 제공하기 위한 운영 데이터와 데이터 마트내의 데이터간의 매핑 방법을 제공하는데 그 목적이 있다.
즉, 운영계 데이터에서 발생한 변경 데이터를 데이터 마트로 적재하여 최신의 데이터를 담은 데이터 마트로 갱신하여 관리하는 방법으로 운용계 데이터와 데이터 마트와의 일치성 및 시스템의 고 효율성/수행능력을 이루고자 한다.
데이터 마트가 요구되는 주제의 정의, 필요한 데이터의 수집, 데이터의 변형, 데이터 마트로의 요약 데이터 적재에 핵심적 역할을 하는 스케쥴링 기반의 2차원 운영 데이터베이스와 3차원 분석 데이터 마트간에 연결 방법을 제공한다.
도 1은 본 발명의 일 실시예에 따른 데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석 방법에 대한 설명도이고,
도 2는 도 1의 데이터베이스의 자료 변환 처리 과정에 대한 예시도이고,
도 3a내지 3c는 도 1의 데이터베이스의 자료 추출 전송 과정에 대한 예시도이고,
도 4a 및 4b는 도 1의 운용계 데이터와 데이터 마트의 클래스 매핑 과정에 대한 예시도이다.
상기 목적을 달성하기 위한 본 발명의 방법은, 운용 데이터 베이스를 분석하기 위하여 운용 응용 프로그램 원천 테이블에서 데이터 마트에 자료를 적재하기 위해 전체 메타 데이터로써 매핑 구조를 나타내는 제 1 단계; 상기 제 1 단계의 매핑 구조에 있어 데이터를 변환하여 데이터 마트 테이블에 통합적인 스키마를 만들어 적재하는 제 2 단계; 및 상기 제 2 단계의 매핑 구조에 대한 응용 부문 견본을 나타내는 제 3 단계를 포함하여 이루어지는 것을 특징으로 한다.
양호하게는, 상기 제 2 단계는, 프로세스 고유번호, 프로세스 절차 번호, 소스 데이터 객체번호, 필드값 변환 프로세스 형태, 변환 수식/변환 참조 테이블 이름, 사용자, 시스템 형태로 이루어진 변환 프로세스 관계를 이용하여 필드 값 변환을 수행하는 제 1 서브 단계; 프로세스 고유번호, 프로세스 절차 번호, 소스 데이터 객체번호, 필드값, 변환 프로세스 형태, 변경전 속성, 변경후 속성, 사용자, 시스템 형태로 이루어진 속변 변환 프로세스 관계를 이용하여 필드 속성 변환을 수행하는 제 2 서브 단계; 및 프로세스 고유번호, 프로세스 절차 번호, 소스 데이터 객체 번호, 변환 프로세스 형태, 변환 수식/변환 참조 테이블 이름, 사용자, 시스템 형태로 이루어진 생성 프로세스 관계를 이용하여 필드를 생성하는 제 3 서브 단계를 포함한다.
보다 양호하게는, 상기 제 3 단계는, 운영 원천 데이터에서 데이터 마트 데이터로 전환 적재할 때 응용 프로그램에 대하여 주제별로 분류한다.
또한, 본 발명에 따르면, 컴퓨터에, 운용 데이터 베이스를 분석하기 위하여 운용 응용 프로그램 원천 테이블에서 데이터 마트에 자료를 적재하기 위해 전체 메타 데이터로써 매핑 구조를 나타내는 제 1 단계; 상기 제 1 단계의 매핑 구조에 있어 데이터를 변환하여 데이터 마트 테이블에 통합적인 스키마를 만들어 적재하는 제 2 단계; 및 상기 제 2 단계의 매핑 구조에 대한 응용 부문 견본을 나타내는 제 3 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체가 제공된다.
이하, 도 1 내지 도 3을 참조하여 본 발명에 따른 바람직한 일 실시예를 상세히 설명한다.
도면에서, 도 1은 본 발명이 적용되는 대용량 분산 데이터베이스의 자료 분석 방법의 전체 구성도이고, 도 2는 본 발명이 적용되는 데이터베이스의 자료 변환 처리의 일부 과정에 대한 설명도이고, 도 3은 본 발명이 적용되는 자료 추출 전송 방법의 예이며, 도 4는 운영계 데이터와 데이터 마트의 클래스 매핑 방법의 예이다.
본 발명은 주제별 데이터 마트를 구축하기 위하여, 분산 운용 데이터베이스(11)로부터 데이터를 추출하고, 추출한 데이터를 변환하고, 전송하는 등의 3단계 처리과정을 거친다. 분산 운용 데이터베이스(11)에는 주제별로 데이터를 저장한다. 추출단계는, 추출/변환기(12)가 분산 운용 데이터베이스(11)에 저장된 데이터를 식별하고 이에 접근하는 단계이다.
다음, 변환단계는, 분산 운용 데이터베이스에 저장된 원천데이터를 의미있는 정보로 변환하는 단계로서, 자료집계와 표준화 등으로 변환한다. 전송단계는, 데이터 전송으로 변환된 데이터를 데이터마트(13)의 테이블에 물리적으로 적재하는 단계이다.
상기한 추출단계에서 데이터 접근은, 운용 데이터베이스에 어떠한 테이블들이 데이터 마트의 통합테이블로 접근될 수 있는가를 주제별로 명시한다. 변환단계에서 데이터 변환은 데이터 마트에 적재될 자료가 어떤 변환과정을 거쳐 생성된 자료인가를 명시한다. 마지막으로 전송단계에서 데이터 전송은 특정한 기계에 있는 변환된 값을 통합된 형식으로 데이터 마트에 적재한다.
이러한 접근 방법은 개별 데이터 마트 통합으로 전사적인 데이터창고를 구축하기 때문에 실제적 비용과 시간을 단축할 수 있고, 각 단계에 대한 구축 성공여부를 조기에 결정할 수 있다는 장점이 있다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.
상기와 같은 본 발명은, 의사결정자가 순식간에 관련된 최신정보를 얻을 수 있게 해줌으로써 기업 전반 업무에 대한 비즈니스 경향과 장기간에 걸친 추이를 일목요연하게 제시해주고 이러한 정보에 대한 결정적 요인분석 기능과 수행해야 할 핵심적 활동을 발견하게 해줌으로써 조직의 수행 의사결정의 정확성을 극대화하고 효율성을 제고시킬 수 있도록 하는 효과가 있다.

Claims (4)

  1. 운용 데이터베이스를 분석하기 위하여 운용 응용 프로그램 원천 테이블에서 데이터 마트에 자료를 적재하기 위해 전체 메타 데이터로써 매핑 구조를 나타내는 제 1 단계;
    상기 제 1 단계의 매핑 구조에 있어 데이터를 변환하여 데이터 마트 테이블에 통합적인 스키마를 만들어 적재하는 제 2 단계; 및
    상기 제 2 단계의 매핑 구조에 대한 응용 부문 견본을 나타내는 제 3 단계를 포함하여 이루어진 데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석 방법.
  2. 제 1 항에 있어서,
    상기 제 2 단계는,
    프로세스 고유번호, 프로세스 절차 번호, 소스 데이터 객체번호, 필드값 변환 프로세스 형태, 변환 수식/변환 참조 테이블 이름, 사용자, 시스템 형태로 이루어진 변환 프로세스 관계를 이용하여 필드 값 변환을 수행하는 제 1 서브 단계;
    프로세스 고유번호, 프로세스 절차 번호, 소스 데이터 객체번호, 필드값, 변환 프로세스 형태, 변경전 속성, 변경후 속성, 사용자, 시스템 형태로 이루어진 속변 변환 프로세스 관계를 이용하여 필드 속성 변환을 수행하는 제 2 서브 단계; 및
    프로세스 고유번호, 프로세스 절차 번호, 소스 데이터 객체 번호, 변환 프로세스 형태, 변환 수식/변환 참조 테이블 이름, 사용자, 시스템 형태로 이루어진 생성 프로세스 관계를 이용하여 필드를 생성하는 제 3 서브 단계를 포함하여 이루어진 데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석 방법.
  3. 제 2 항에 있어서,
    상기 제 3 단계는,
    운영 원천 데이터에서 데이터 마트 데이터로 전환 적재할 때 응용 프로그램에 대하여 주제별로 분류하는 것을 특징으로 하는 데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석 방법.
  4. 컴퓨터에,
    운용 데이터 베이스를 분석하기 위하여 운용 응용 프로그램 원천 테이블에서 데이터 마트에 자료를 적재하기 위해 전체 메타 데이터로써 매핑 구조를 나타내는 제 1 단계;
    상기 제 1 단계의 매핑 구조에 있어 데이터를 변환하여 데이터 마트 테이블에 통합적인 스키마를 만들어 적재하는 제 2 단계; 및
    상기 제 2 단계의 매핑 구조에 대한 응용 부문 견본을 나타내는 제 3 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1019990031397A 1999-07-30 1999-07-30 데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석방법 KR20010011836A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990031397A KR20010011836A (ko) 1999-07-30 1999-07-30 데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990031397A KR20010011836A (ko) 1999-07-30 1999-07-30 데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석방법

Publications (1)

Publication Number Publication Date
KR20010011836A true KR20010011836A (ko) 2001-02-15

Family

ID=19605815

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990031397A KR20010011836A (ko) 1999-07-30 1999-07-30 데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석방법

Country Status (1)

Country Link
KR (1) KR20010011836A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030013742A (ko) * 2001-08-09 2003-02-15 박헌재 이벤트와 관계를 이용한 비즈니스 모델 구축 방법과 그적용 시스템
KR100402034B1 (ko) * 2000-12-06 2003-10-11 김덕용 정보시스템에서의 범용의 정보 가공 장치 및 방법
KR20040029616A (ko) * 2002-10-01 2004-04-08 주식회사 서진정보기술 기업형 프로그램 소스의 유지/보수 관리 및 분석 기능을갖춘 시스템 및 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR890016474A (ko) * 1988-04-08 1989-11-29 하워드 지.피거로아 데이타베이스 대상물 분석방법 및 시스템
JPH10254743A (ja) * 1997-03-14 1998-09-25 Fujitsu Ltd データウエアハウス・システム
JPH1125126A (ja) * 1997-07-08 1999-01-29 N T T Data:Kk システム設計ツール及びデータウエアハウス設計システム及び方法
KR19990028677A (ko) * 1995-07-07 1999-04-15 월 데이타 인코포레이티드 대응 세만틱 객체 모델에서 행해진 변경을 반영하도록 기존 관계형 데이터베이스를 수정하는 방법 및 장치
WO1999026170A1 (en) * 1997-11-14 1999-05-27 Informatica Corporation Object references for sharing metadata in data marts
EP0706140B1 (en) * 1994-10-04 1999-07-14 Platinum Technology Ip, Inc. Intelligent data warehouse

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR890016474A (ko) * 1988-04-08 1989-11-29 하워드 지.피거로아 데이타베이스 대상물 분석방법 및 시스템
EP0706140B1 (en) * 1994-10-04 1999-07-14 Platinum Technology Ip, Inc. Intelligent data warehouse
KR19990028677A (ko) * 1995-07-07 1999-04-15 월 데이타 인코포레이티드 대응 세만틱 객체 모델에서 행해진 변경을 반영하도록 기존 관계형 데이터베이스를 수정하는 방법 및 장치
JPH10254743A (ja) * 1997-03-14 1998-09-25 Fujitsu Ltd データウエアハウス・システム
JPH1125126A (ja) * 1997-07-08 1999-01-29 N T T Data:Kk システム設計ツール及びデータウエアハウス設計システム及び方法
WO1999026170A1 (en) * 1997-11-14 1999-05-27 Informatica Corporation Object references for sharing metadata in data marts

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100402034B1 (ko) * 2000-12-06 2003-10-11 김덕용 정보시스템에서의 범용의 정보 가공 장치 및 방법
KR20030013742A (ko) * 2001-08-09 2003-02-15 박헌재 이벤트와 관계를 이용한 비즈니스 모델 구축 방법과 그적용 시스템
KR20040029616A (ko) * 2002-10-01 2004-04-08 주식회사 서진정보기술 기업형 프로그램 소스의 유지/보수 관리 및 분석 기능을갖춘 시스템 및 방법

Similar Documents

Publication Publication Date Title
CN112699175B (zh) 一种数据治理系统及其方法
CN107315776B (zh) 一种基于云计算的数据管理系统
Karnitis et al. Migration of relational database to document-oriented database: structure denormalization and data transformation
CN103455540B (zh) 从数据仓库模型生成内存模型的系统和方法
CN112199433A (zh) 一种用于城市级数据中台的数据治理系统
CN111125068A (zh) 一种元数据治理方法和系统
CN112651218A (zh) 一种标书自动生成方法、管理方法、介质以及计算机
CN109669975B (zh) 一种工业大数据处理系统及方法
CN105279138B (zh) 一种资讯研究报告自动生成系统
CN114880405A (zh) 一种基于数据湖的数据处理方法及系统
Mostajabi et al. A systematic review of data models for the big data problem
CN109829003A (zh) 数据库备份方法及装置
CN114077652A (zh) 一种基于多维数据立方体的数据处理方法及电子装置
CN116049193A (zh) 数据存储方法及装置
KR20010011836A (ko) 데이터 마트를 이용한 대용량 분산 데이터베이스의 자료 분석방법
Milosevic et al. Big data management processes in business intelligence systems
Rong et al. Design of heterogeneous Data SQL access scheme based on postgreSQL
CN106843825A (zh) 一种基于时态模型的软件配置管理方法
Su et al. [Retracted] Design and Application of Intelligent Management Platform Based on Big Data
Wang Research on the design of large data storage structure of database based on Data Mining
Sheng et al. Fast Access and Retrieval of Big Data Based on Unique Identification.
Li et al. Data lake development status and outlook
Khatai et al. An implementation of text mining decision feedback model using Hadoop MapReduce
Xiao Data Processing Model of Bank Credit Evaluation System.
Lu et al. Analysis of the Application and the Association Rule Mining in the Library and Data Management of College of Economics

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application