KR20120135665A - 데이터 웨어하우스를 이용한 데이터베이스 구축 방법 및 그 시스템 - Google Patents

데이터 웨어하우스를 이용한 데이터베이스 구축 방법 및 그 시스템 Download PDF

Info

Publication number
KR20120135665A
KR20120135665A KR1020110054503A KR20110054503A KR20120135665A KR 20120135665 A KR20120135665 A KR 20120135665A KR 1020110054503 A KR1020110054503 A KR 1020110054503A KR 20110054503 A KR20110054503 A KR 20110054503A KR 20120135665 A KR20120135665 A KR 20120135665A
Authority
KR
South Korea
Prior art keywords
data
ods
business
mart
business rule
Prior art date
Application number
KR1020110054503A
Other languages
English (en)
Other versions
KR101253335B1 (ko
Inventor
백승호
Original Assignee
백승호
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 백승호 filed Critical 백승호
Priority to KR1020110054503A priority Critical patent/KR101253335B1/ko
Priority to PCT/KR2012/004507 priority patent/WO2012169807A2/ko
Publication of KR20120135665A publication Critical patent/KR20120135665A/ko
Application granted granted Critical
Publication of KR101253335B1 publication Critical patent/KR101253335B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

데이터 웨어하우스를 이용한 데이터베이스 구축 방법은 적어도 하나의 소스 시스템으로부터 제공된 소스 데이터들을 기초로 데이터 웨어하우스를 생성하여 이루어진다. 상기 데이터베이스 구축 방법은 상기 소스 데이터들 중 적어도 일부를 정제하여 ODS(Operational Data Store)를 구성하는 단계, 상기 ODS의 데이터들을 통합하고 연관관계를 가지는 데이터들 간에 참조 관계를 생성하여 DW(Data Warehouse)를 구성하는 단계, 분석을 위한 적어도 하나의 비즈니스 규칙을 구현하여 비즈니스 로직을 구성하는 단계 및 상기 적어도 하나의 비즈니스 규칙 중 어느 하나를 기초로 상기 ODS 또는 DW의 데이터에 대하여 분석 주제별로 다차원 모델을 생성하여 데이터 마트를 구성하는 단계를 포함한다.

Description

데이터 웨어하우스를 이용한 데이터베이스 구축 방법 및 그 시스템 {METHOD FOR CONSTRUCTING DATABASE BASED ON WAREHOUSE AND DATABASE SYSTEM THEROF}
개시된 기술은 데이터베이스 구축 기술에 관한 것으로, 특히 비즈니스 로직을 데이터 웨어하우스의 하나의 독립된 영역으로서 구성함으로써 데이터 웨어하우스를 재구성하지 않고도 새로운 비즈니스 규칙을 적용할 수 있는 데이터 웨어하우스를 이용한 데이터베이스 기술에 관한 것이다.
데이터 웨어하우스(Data Warehouse, DW) 시스템이란 기업 등의 사용자가 운영하는 다양한 운영 시스템의 데이터를 분석하기 위한 시스템이다. 운영 시스템은 재고관리, 회계정보, 영업 시스템과 같이 운영을 위한 소정의 기능을 지원하는데 반하여, 데이터 웨어하우스는 다양한 운영 시스템에 의하여 생성된 데이터를 통합하여 분석할 수 있는 기능을 제공할 수 있다.
종래의 데이터 웨어하우스 기술은 데이터 워어하우스에 구성된 데이터를 특정하게 프로그램된 비즈니스 로직에 따라 데이터 마트에 제공함으로써 분석을 수행하였다. 따라서, 상이한 분석을 수행하기 위해서는 비즈니스 로직을 변경 또는 수정하기 위하여 프로그램 자체를 다시 분석하여 재 코딩 해야 하였으므로, 비용과 시간이 많이 요구되며 오류 발생의 확률이 적지 않은 단점이 있다.
실시예들 중에서, 데이터 웨어하우스를 이용한 데이터베이스 구축 방법은 적어도 하나의 소스 시스템으로부터 제공된 소스 데이터들을 기초로 데이터 웨어하우스를 생성하여 이루어진다. 데이터 웨어하우스를 이용한 상기 데이터베이스 구축 방법은 상기 소스 데이터들 중 적어도 일부를 정제하여 ODS(Operational Data Store)를 구성하는 단계, 상기 ODS의 데이터들을 통합하고 연관관계를 가지는 데이터들 간에 참조 관계를 생성하여 DW(Data Warehouse)를 구성하는 단계, 분석을 위한 적어도 하나의 비즈니스 규칙을 구현하여 비즈니스 로직을 구성하는 단계 및 상기 적어도 하나의 비즈니스 규칙 중 어느 하나를 기초로 상기 ODS 또는 DW의 데이터에 대하여 분석 주제별로 다차원 모델을 생성하여 데이터 마트를 구성하는 단계를 포함한다.
실시예들 중에서, 데이터 웨어하우스를 이용한 데이터베이스 시스템은 적어도 하나의 소스 시스템으로부터 제공된 소스 데이터들을 기초로 데이터베이스를 구성한다. 상기 데이터 웨어하우스를 이용한 데이터베이스 시스템은 상기 소스 데이터들 중 적어도 일부를 정제하는 ODS(Operational Data Store), 상기 ODS의 데이터들을 통합하고 연관관계를 가지는 데이터들 간에 참조 관계를 생성하는 DW(Data Warehouse), 분석을 위한 적어도 하나의 비즈니스 규칙을 관리하는 비즈니스 로직 및 상기 적어도 하나의 비즈니스 규칙 중 어느 하나를 기초로 상기 ODS 또는 DW의 데이터들에 대하여 분석 주제별로 다차원 모델로 구성하는 데이터 마트를 포함한다.
실시예들 중에서, 데이터베이스를 이용한 업무 시스템 구축 방법은 적어도 하나의 소스 시스템으로부터 생성되는 데이터베이스를 이용하여 실시된다. 상기 데이터베이스를 이용한 업무 시스템 구축 방법은 상기 적어도 하나의 소스 데이터들을 통합하고 연관관계를 생성하여 DW(Data Warehouse)를 구성하는 단계, 분석을 위한 적어도 하나의 비즈니스 규칙에 따라 적어도 하나의 비즈니스 로직을 구성하는 단계 및 상기 적어도 하나의 비즈니스 규칙 중 적어도 하나를 상기 비즈니스 로직에서 선택하고, 선택된 적어도 하나의 비즈니스 규칙을 이용하여 상기 DW의 데이터를 통합하여 다차원 모델링을 수행하여 데이터 마트를 구성하는 단계를 포함한다.
도 1은 개시된 기술이 적용될 수 있는 데이터 웨어하우스를 이용한 데이터베이스 시스템 및 그와 연관된 운영 시스템과 사용자 시스템을 나타내는 대략적인 구성도이다.
도 2는 개시된 기술의 일 실시예에 따른 데이터 웨어하우스를 이용한 데이터베이스 시스템을 설명하기 위한 구성도이다.
도 3은 ODS를 구성하는 일 실시예를 설명하기 위한 개략도이다.
도 4는 로직 데이터를 구성하는 일 실시예를 설명하기 위한 개략도이다.
도 5는 개시된 기술이 적용될 수 있는 데이터 웨어하우스를 이용한 데이터베이스 구축 방법의 일 실시예에 대한 블록도이다.
도 6은 도 5의 데이터베이스 구축 방법의 일 실시예에 대한 순서도이다.
개시된 기술에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 개시된 기술의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 개시된 기술의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다.
한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 개시된 기술이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.
도 1은 개시된 기술이 적용될 수 있는 데이터 웨어하우스를 이용한 데이터베이스 시스템 및 그와 연관된 운영 시스템과 사용자 시스템을 나타내는 대략적인 구성도이다. 이하에서는, 데이터 웨어하우스(DW) 및 데이터 마트를 포함하여 데이터베이스 시스템으로 통칭하여 설명한다.
도 1을 참조하면, 데이터베이스 시스템(100)은 운영 시스템(이하, 소스 시스템)에 저장된 운영 데이터(이하, 소스 데이터)에 대하여 개체 관계형 모델을 가지는 데이터 웨어하우스(120)를 구성하고, 구성된 데이터 웨어하우스(120)를 기초로 복수의 다차원 모델인 데이터 마트(140)를 구성하여 이루어질 수 있다. 개시된 기술에 따른 데이터베이스 시스템(100)에 대한 상세한 설명은 도 2를 참조하여 후술한다.
소스 시스템은 해당 기업에서 사용되고 있는 업무 처리를 위한 다양한 시스템들 또는 데이터베이스(예컨대, 재고관리 시스템, 구매관리시스템, 재고관리시스템, 소매시스템 등)들을 포함할 수 있다.
사용자 시스템은 데이터 마트(140)를 이용하여 소스 데이터에 대한 분석된 정보를 획득할 수 있다. 도 1에서는 OLAP(OnLine Analytical Processing) 서버와 웹 서버를 도시하고 있으나, 당업자의 요구에 따라 그 외의 다양한 시스템이 사용될 수 있다.
이하에서는 도 2 내지 도 6를 참조하여 개시된 기술에 따른 데이터베이스 시스템(100) 및 그 구성 방법에 대하여 상세히 설명한다.
도 2는 개시된 기술의 일 실시예에 따른 데이터베이스 시스템을 설명하기 위한 구성도이고, 도 3은 ODS를 구성하는 일 실시예를 설명하기 위한 개략도이며, 도 4는 DW를 구성하는 일 실시예를 설명하기 위한 개략도이다.
도 2 내지 도 4를 참조하여 데이터베이스 시스템(100)에 대하여 설명하면, 데이터베이스 시스템(100)은 ODS(110), DW(Data Warehouse)(120), 비즈니스 로직(130), 데이터 마트(140) 및 메타데이터(160)를 포함한다. 일 실시예에서, 데이터베이스 시스템(100)은 스테이징(Staging) 영역(미도시) 및/또는 요약 리포트(150)를 더 포함할 수 있다.
스테이징(Staging) 영역(미도시)은 소스 데이터를 DW(120)로 제공받기 위한 임시 영역이다. 다시 말해, 스테이징(Staging) 영역은 소스 데이터를 DW(120)에 적재하기 위해 해당 데이터를 임시적으로 저장할 수 있다. 스테이징(Staging) 영역은 데이터를 저장하기 위한 소정의 형식이 요구되지 않을 수 있으므로, 테이블 형태 또는 파일 형태와 같이 다양한 형태의 데이터를 저장할 수 있다. 스테이징(Staging) 영역은 개시된 기술에 따른 데이터베이스 시스템(100)의 필수적 구성요소는 아니며 구현 상의 필요에 따라 부가될 수 있다.
ODS(Operational Data Store)(110)는 DW(120)를 구성하기 위한 중간 단계의 데이터 저장장소이다. ODS(110)는 소스 시스템의 소스 데이터를 저장하고 해당 데이터에 대한 소정의 정제 또는 가공을 수행할 수 있다.
일 실시예에서, ODS(110)는 소스 데이터의 형식(모델)을 변경하지 않고 저장한 후, 코드 표준화 및 데이터 정합성을 검증하여 오류 데이터를 수정(정제)할 수 있다. 예를 들어, 소스 시스템의 매출 데이터를 저장한 후, 정합성(예컨대, 연매출과 1 내지 12월의 매출들의 합이 같은지)을 검증할 수 있다. ODS(110)는 소스 데이터에 대하여 소정의 ETT(추출:Extraction, 가공:Transformation, 전송:Transportation) 절차를 수행하여 구성될 수 있다. 일반적으로 ETT란 데이터를 추출, 정제, 가공, 전송 또는 적재 등을 수행하는 것을 의미하며, 여기에서 ODS(110)를 구성함에 있어서는 소스 데이터에 대한 적재 및 정제가 수행될 수 있다. 도 3은 소스 시스템의 데이터를 ODS(110)에 적재하는 예를 나타내며, 도시된 바와 같이 서로 상이한 소스 시스템들(SYS2, SYS3, SYS5)에서 고객 데이터들(고객 01, 고객 021, 고객 03)을 적재할 수 있고, 적재된 고객 데이터들에 대하여 정합성을 검증하여 오류데이터를 수정할 수 있다. 일 실시예에서, ODS(110)는 통합 규칙이 아닌 각 운영 시스템 별 비즈니스 규칙을 기준으로 소스 데이터를 정제하여 구성될 수 있다. 이러한 ODS(110)를 이용함으로써 데이터베이스 시스템(100)를 구성함에 있어서 데이터의 가공, 변환, 정제 등을 용이하게 실시할 수 있다.
DW(120)는 ODS(110)에 대하여 소정의 ETT 절차를 수행하여 구성되는 ER(Entity-Relationship) 모델의 통합된 데이터이다. 다시 말해, DW(120)는 ODS(110)에 의하여 정제된 여러 소스 데이터들을 하나의 모델(ER 모델)로서 통합하고 표준화를 수행할 수 있다.
예를 들어, A 회사에서는 소매와 도매를 모두 수행하고 이를 전산적으로 지원하기 위해 구매관리시스템, 재고관리시스템, 소매시스템 및 도매시스템이 구축되어 있으며 전사적으로 물류 및 영업정보를 분석하기 위해 데이터 웨어하우스를 구축한다고 가정한다. 즉, 데이터 웨어하우스를 이용하여 외부환경대비 매출분석 및 구매와 소매, 도매, 재고간 어떤 상관관계가 있는지 알아보고, 불필요한 재고를 조정하여 비용을 절감하고자 한다고 가정한다. 이러한 가정에 따라 데이터 웨어하우스를 구축하기 위해서는 여러 소스 시스템(구매관리시스템, 재고관리시스템, 소매시스템 및 도매시스템)의 데이터를 하나의 통합된 모델로 설계하여 구축할 수 있다. 여기에서, 소매시스템과 도매시스템에는 각각 해당 고객정보가 있고, 소매고객과 도매고객은 적어도 일부가 서로 동일할 수 있다고 하면, 데이터 웨어하우스는 서로 다른 소스 시스템들(소매시스템 및 도매시스템)에서 관리되는 소매고객 및 도매고객 데이터에 대하여 고객이란 주제로서 하나의 데이터 모델을 구성할 수 있다. 이와 같이 하나의 고객 데이터를 모델링하여 구축하면, 기간계 시스템(소매시스템 및 도매시스템)에는 각각 홍길동이란 고객이 중복되어 존재하더라도 DW에는 오로지 하나의 데이터만 존재하게 된다(Single View). 이와 같이, DW는 소스 데이터에 대하여 통합화 및 표준화된 모델링을 수행함으로써 구축될 수 있다.
더 상세히 설명하면, DW(120)는 ODS(110)를 구성하는 데이터(정제된 소스 데이터)를 통합하고, 서로 연관 관계를 가지는 데이터들에 대하여 참조 관계를 생성할 수 있다. 일 실시예에서, DW(120)는 ODS(110)의 데이터의 키 구조를 그대로 유지할 수 있다. 일 실시예에서, DW(120)는 ODS(110)의 데이터에 대하여 참조를 위한 링크(link)를 유지할 수 있다. 도 4에 도시된 "고객 L1" 데이터는 ODS(110)의 데이터인 "고객 01", "고객 03" 및 "고객 03"을 통합한 데이터이므로, 도시된 화살표와 같이 참조를 위한 링크를 유지할 수 있다. DW(120)의 데이터는 해당 DW(120) 내의 다른 데이터를 참조할 수 있다. 도 4의 "고객 L2" 데이터는 DW(120) 내의 "고객 L1" 및 "실적 L1" 데이터를 참조하고 있고, "고객 L3" 데이터는 "고객 L2" 데이터를 참조하고 있음을 알 수 있다. 여기에서, 예를 들어 "고객 L2" 데이터는 최근 3개월의 실적을 기준으로 부여되는 고객 등급(L2)일 수 있고, "고객 L3" 데이터는 최근 12개월의 실적을 기준으로 부여되는 고객 등급(L3) 일 수 있다. 일 실시예에서, DW(120)는 구성하는 데이터의 중복을 배제하고 일관성을 유지하기 위한 소정의 데이터 가공을 실시할 수 있다.
비즈니스 로직(130)은 비즈니스 규칙을 관리하는 영역이다. 종래의 경우, 비즈니스 규칙을 반영하여 데이터 마트를 설계하므로, 비즈니스 규칙 자체를 독립적 영역으로 관리하지 않고 데이터 마트의 설계 과정상에만 반영하였다. 개시된 기술은 비즈니스 규칙을 데이터베이스 시스템(100)의 하나의 독립된 영역인 비즈니스 로직(130)에서 관리하고, 비즈니스 로직(130)은 관리하고 있는 비즈니스 규칙을 데이터 마트(140)에 제공할 수 있다.
더 상세히 설명하면, 비즈니스 로직(130)은 분석에 필요한 적어도 하나의 비즈니스 규칙을 중복 없이 구현할 수 있고, 데이터 마트(140)는 해당하는 비즈니스 규칙을 비즈니스 로직(130)으로부터 제공받아 다차원 데이터 모델링을 수행할 수 있다. 여기에서, 비즈니스 규칙은 데이터 마트를 주제별로 구성하기 위한 소정의 규칙이다. 예를 들어, 소매건수, 도매건수에 대하여 데이터 마트를 구성하려고 하면, 비즈니스 규칙은 (i) 시장코드 중 국내, 재래시장에만 해당하는 매출 건수를 소매건수로 결정하는 것과 (ii) 고객이 일정한 금액이상을 거래했을 때를 도매로서 결정하는 것 등과 같은 것이다. 비즈니스 로직(130)에 구현되는 적어도 하나의 비즈니스 규칙은 소스 시스템 및 요구되는 분석 사항에 따라 당업자의 요구에 따라 결정될 수 있으므로, 개시된 발명은 특정한 비즈니스 규칙에 한정되지 아니한다. 즉, 개시된 기술은 비즈니스 규칙을 직접적으로 구현하고 관리하는 독립된 영역으로서 비즈니스 로직(130)을 포함하는 것이므로, 비즈니스 로직(130)내에 구현된 각각의 비즈니스 규칙 자체에 한정되지 아니한다.
데이터 마트(140)는 비즈니스 로직(130)에 구현된 적어도 하나의 비즈니스 규칙 중 어느 하나를 기초로 DW(120)의 통합된 데이터에 대하여 분석 주제 중심의 다차원 모델링 된 데이터로서 구성될 수 있다. 예를 들어, 데이터 마트(140)는 도 2에 도시된 바와 같이 CRM, 통계 등의 분석 주제에 대한 통계로서 구성될 수 있다. 다른 예를 들어, 데이터 마트(140)는 재고분석을 위해 품목별(차원; Dimension) 재고건수, 매출건수, 매입건수, 소매건수, 도매건수(Fact; Measure) 등과 같이 분석에 필요한 데이터들을 일정한 모델 규칙에 따라 수집할 수 있다. 일 실시예에서, 데이터 마트(140)는 비즈니스 로직(130)의 비즈니스 규칙에 따라 ODS(110) 및 DW(120)에 구현된 분석기준들(구성 데이터들)을 분석 목적(예를 들어, 분석주제)별로 그룹화할 수 있다. 여기에서, 데이터 마트(140)는 ODS(110) 및 DW(120)에 구현된 분석기준들을 단순 집계(예를 들어, 그룹화)하는 것 외에 데이터의 가공을 수행하지 않을 수 있다. 일 실시예에서, 데이터 마트(140)는 다차원 모델로 구성되므로 주제별 내포관계를 표현할 수 있다. 이를 위하여, 데이터 마트(140)의 요소들은 스타 스키마(Star Schema) 또는 스노우 플레이크 스키마(Snow Flake Schema)로 표현될 수 있다. 여기에서, 데이터 마트(140)의 요소들은 주제별 내포관계를 제외한 다른 참조관계를 가지지 않는 것이 바람직하다.
요약 리포트(150)는 데이터 마트(140)에 대하여 소정의 ETT 절차를 수행하여 구성되는 요약 테이블이다. 요약 리포트(150)는 정형화된 화면에 표현될 수 있도록 데이터를 설계할 수 있다. 요약 리포트(150)는 하나의 주제로부터 요약되도록 테이블을 구성하는 것이 바람직하다.
메타데이터(160)는 ODS(110) 내지 요약 리포트(150) 중 적어도 하나에 대한 메타데이터를 유지할 수 있다. ODS(110) 내지 요약 리포트(150)를 구성함에 있어 메타데이터(160)를 이용하여 각 요소를 구성할 수 있다.
도 5는 개시된 기술이 적용될 수 있는 데이터 웨어하우스를 이용한 데이터베이스 구축 방법의 일 실시예에 대한 블록도이고, 도 6은 도 5의 데이터베이스 구축 방법의 일 실시예에 대한 순서도이다.
도 5를 참조하면, 데이터 웨어하우스를 이용한 데이터베이스 구축 방법은 소스 데이터들 중 적어도 일부를 정제하여 ODS(Operational Data Store)를 구성하는 단계(단계 S510), ODS의 데이터들을 통합하고 연관관계를 가지는 데이터들 간에 참조 관계를 생성하여 DW(Data Warehouse)를 구성하는 단계(단계 S520), 분석을 위한 적어도 하나의 비즈니스 규칙을 구현하여 비즈니스 로직을 구성하는 단계(단계 S530) 및 적어도 하나의 비즈니스 규칙 중 어느 하나를 기초로 ODS(110) 또는 DW(120)의 데이터에 대하여 분석 주제별로 다차원 모델을 생성하여 데이터 마트를 구성하는 단계(단계 S510)를 포함한다.
도 6을 참조하여 도 5의 데이터베이스 구축 방법에 대하여 더 상세히 설명하면, 소스 시스템으로부터 제공된 소스 데이터들을 기초로 ODS(110)를 구성한다(단계 S610). 단계 S610를 더 상세히 설명하면, 소스 데이터의 적어도 일부를 적재하고, 적재된 소스 데이터들 중 적어도 일부에 대하여 데이터의 정합성을 검증하여(정제,ETT)하여 ODS(110)를 구성할 수 있다. 여기에서, ETT란 소스 데이터를 추출(Extraction), 가공(Transformation) 또는 전송(Transportation) 중 적어도 하나 또는 이들을 결합하는 것을 의미한다. ETT의 구체적 수행 내용은 소스 시스템의 종류, 데이터의 추출 주기, 데이터의 양, 로딩 속도, 소스 데이터의 질, 과거 데이터의 형식, 사용자의 요구 조건, 소스 시스템의 역할에 따라 달라질 수 있다. ODS를 구성하는 단계 S610에서는 적재된 소스 데이터에 대하여 정합성을 판단하고 오류 데이터를 수정하는 정제 과정만으로 ETT가 수행될 수 있다.
ODS(110)가 구성되면, ODS(110)의 데이터들을 통합하고 연관관계를 가지는 데이터들 간에 참조 관계를 생성하여(ETT) DW(120)를 구성할 수 있다(단계 S620). 여기에서 수행되는 ETT는 ODS에 포함된 데이터들을 통합하고, 연관관계를 가지는 데이터들 간에 참조 관계를 생성하도록 가공하는 일련의 과정을 포함할 수 있다. 여기에서, 참조 관계는 개체 관계 (ER,Entity-Relationship) 모델로 구성될 수 있다. 일 실시예에서, DW(120)를 구성하는 단계 S620는 DW(120) 내의 어느 한 데이터(제1 데이터)에 대하여 (i) ODS(110)에 포함된 데이터와의 참조 관계를 생성하는 단계와, (ii) DW(120) 내의 데이터(제2 데이터)와의 참조 관계를 생성하는 단계를 포함할 수 있다. 다시 말해, DW(120)를 구성하는 어느 관계 모델을 생성할 때, 해당 데이터와 연관된 ODS(110) 내의 데이터에 대한 참조 뿐만 아니라, DW(120)의 다른 데이터와의 참조관계를 생성할 수 있다. 일 실시예에서, DW(120)를 구성하는 단계 S620는 DW(120)에 포함된 데이터들에 대하여 중복을 배제하기 위한 데이터 가공을 실시하는 단계를 더 포함할 수 있다. 중복된 데이터를 제거함으로써 데이터베이스 시스템(100) 전체의 성능을 향상시키고, 잘못된 참조(Spider Weg)을 방지할 수 있다. 일 실시예에서, 단계 S620에 의하여 생성된 DW(120)는 ODS(110)에 포함된 정제된 데이터의 키 구조를 그대로 이용하여 구성될 수 있다. 이러한 동일한 키 구조를 이용함으로써, 상호 간에 참조 관계가 이루어져도 데이터의 처리에 있어서 호환성을 가질 수 있게 된다.
DW(120)가 구성되면, 분석을 위한 적어도 하나의 비즈니스 규칙을 구현하여 비즈니스 로직(130)을 구성할 수 있다(단계 S630). 일 실시예에서, 비즈니스 로직을 구성하는 단계(단계 S630)는 분석을 위한 적어도 하나의 비즈니스 규칙을 선택하고, 선택된 적어도 하나의 비즈니스 규칙에 대하여 중복 여부를 확인한 후, 중복되지 않은 비즈니스 규칙을 구현하여 수행될 수 있다. 즉, 비즈니스 로직(130)에 구현된 비즈니스 규칙은 중복성을 가지지 않는 것이 바람직하며, 실시예에 따라 이러한 중복을 검사, 제거하는 소정의 단계가 실시될 수 있다. 여기에서, 비즈니스 로직을 구성하는 단계 S630은 개시된 기술의 특유한 단계로서, 설명에서는 DW가 구성(단계 S620)된 후에 본 단계 S630을 설명하고 있으나 이는 설명의 편의를 위한 것으로서 비즈니스 로직을 구성하는 단계 S630은 데이터 마트를 구성하기 전이라면 어느 임의의 시점에서든 수행될 수 있다.
비즈니스 로직(130)이 구성되면, 비즈니스 로직(130)의 비즈니스 규칙 중 어느 하나를 기초로 ODS(110) 또는 DW(120)의 데이터에 대하여 분석 주제별로 다차원 모델을 생성하여 데이터 마트(140)를 구성할 수 있다(단계 S640). 여기에서, 데이터 마트(140)는 적어도 하나의 분석 주제별로 생성된 다차원 모델로서 구성될 수 있고, 분석 주제별로 생성된 다차원 모델은 ODS(110) 또는 DW(120)를 구성하는 데이터들을 이용하여 구성될 수 있다.
일 실시예에서, 데이터 마트(140)를 구성하는 단계 S640는 비즈니스 로직(140)에서 비즈니스 규칙을 선택하는 단계와, 비즈니스 규칙을 기초로 ODS(110) 또는 DW(120) 중 적어도 하나의 데이터들을 분석 주제별로 다차원 모델을 구성하는 단계를 포함할 수 있다.
일 실시예에서, 데이터 마트(140)를 구성하는 다차원 모델은 스타 스키마(Star Schema) 또는 스노우 플레이크 스키마(Snow Flake Schema)로 구성될 수 있다.
데이터 마트(140)가 구성되면, 데이터 마트(140)를 기초로 적어도 하나의 주제에 대하여 요약 테이블을 구성할 수 있다(단계 S650).
개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
개시된 기술의 일 실시예에 따른 데이터베이스 시스템은 각 데이터 마트를 만들 때, 중복 개발하여야만 했던 비용을 줄일 수도 있고, 이러한 중복을 배제함으로서 오류의 가능성도 크게 낮출 수 있다.
개시된 기술의 일 실시예에 따른 데이터베이스 시스템은 보다 유용한 데이터에 대한 접근성을 사용자에게 보장할 수 있다. 서로 관련된 데이터들의 집합으로 로직 데이터를 구성하고, 이들을 해결하고자 하는 문제(이슈)별로 데이터 마트의 각 모델을 구성할 수 있기 때문이다.
개시된 기술의 일 실시예에 따른 데이터베이스 시스템은 원천 데이터와 데이터 웨어하우스의 데이터 간의 일치성을 보장할 수 있다. ODS의 데이터를 구성함에 있어서, 데이터의 가공 부분을 최소화하여 실시하기 때문이다.
개시된 기술의 일 실시예에 따른 데이터베이스 시스템은 원천 데이터 시스템의 변화에 둔감한 데이터 웨어하우스를 구축할 수 있다. 로직 데이터가 ODS와 데이터 마트 간의 완충 역할을 수행할 수 있기 때문이다.
상기에서는 본 출원의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 출원의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 출원을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (13)

  1. 적어도 하나의 소스 시스템으로부터 제공된 소스 데이터들을 기초로 데이터 웨어하우스를 생성하는 데이터베이스 구축 방법에 있어서,
    상기 소스 데이터들 중 적어도 일부를 정제하여 ODS(Operational Data Store)를 구성하는 단계;
    상기 ODS의 데이터들을 통합하고 연관관계를 가지는 데이터들 간에 참조 관계를 생성하여 DW(Data Warehouse)를 구성하는 단계;
    분석을 위한 적어도 하나의 비즈니스 규칙을 구현하여 비즈니스 로직을 구성하는 단계; 및
    상기 적어도 하나의 비즈니스 규칙 중 어느 하나를 기초로 상기 ODS 또는 DW의 데이터에 대하여 분석 주제별로 다차원 모델을 생성하여 데이터 마트를 구성하는 단계를 포함하는 데이터 웨어하우스를 이용한 데이터베이스 구축 방법.
  2. 제1항에 있어서, 상기 ODS를 구성하는 단계는
    상기 소스 데이터들 중 적어도 일부를 적재하는 단계;
    상기 적재된 소스 데이터들 중 적어도 일부에 대하여 데이터의 정합성을 검증하는 단계; 및
    상기 정합성을 검증한 결과, 오류 데이터가 존재하면 해당 오류 데이터를 수정하는 단계를 포함하는 것을 특징으로 하는 데이터 웨어하우스를 이용한 데이터베이스 구축 방법.
  3. 제1항에 있어서, 상기 DW를 구성하는 단계는
    상기 ODS에 포함된 적어도 하나의 정제된 데이터와의 참조 관계를 생성하는 단계; 및
    상기 DW 내의 데이터와의 참조 관계를 생성하는 단계를 포함하는 것을 특징으로 하는 데이터 웨어하우스를 이용한 데이터베이스 구축 방법.
  4. 제3항에 있어서, 상기 DW를 구성하는 단계는
    상기 DW에 포함된 데이터들에 대하여 중복된 데이터를 삭제 가공하는 단계를 더 포함하는 것을 특징으로 하는 데이터 웨어하우스를 이용한 데이터베이스 구축 방법.
  5. 제1항에 있어서, 상기 DW는
    상기 ODS에 적재된 데이터의 키 구조를 이용하는 것을 특징으로 하는 데이터 웨어하우스를 이용한 데이터베이스 구축 방법.
  6. 제1항에 있어서, 상기 비즈니스 로직을 구성하는 단계는
    분석을 위한 적어도 하나의 비즈니스 규칙을 선택하는 단계; 및
    상기 선택된 적어도 하나의 비즈니스 규칙에 대하여 중복 여부를 확인하는 단계를 포함하는 것을 특징으로 하는 데이터 웨어하우스를 이용한 데이터베이스 구축 방법.
  7. 제1항에 있어서, 상기 데이터 마트를 구성하는 단계는
    상기 비즈니스 로직에서 비즈니스 규칙을 선택하는 단계; 및
    상기 비즈니스 규칙을 기초로 상기 ODS 또는 상기 DW 중 적어도 하나의 데이터들을 분석 주제별로 다차원 모델을 구성하는 단계를 포함하는 것을 특징으로 하는 데이터 웨어하우스를 이용한 데이터베이스 구축 방법.
  8. 제1항에 있어서, 상기 다차원 모델은
    스타 스키마(Star Schema) 또는 스노우 플레이크 스키마(Snow Flake Schema)로 구성되는 것을 특징으로 하는 데이터 웨어하우스를 이용한 데이터베이스 구축 방법.
  9. 제1항에 있어서, 상기 데이터 웨어하우스를 이용한 데이터베이스 구축 방법은
    상기 데이터 마트를 기초로 요약 테이블을 구성하는 단계를 더 포함하는 것을 특징으로 하는 데이터 웨어하우스를 이용한 데이터베이스 구축 방법.
  10. 적어도 하나의 소스 시스템으로부터 제공된 소스 데이터들을 기초로 구성된 데이터베이스 시스템에 있어서,
    상기 소스 데이터들 중 적어도 일부를 정제하는 ODS(Operational Data Store);
    상기 ODS의 데이터들을 통합하고 연관관계를 가지는 데이터들 간에 참조 관계를 생성하는 DW(Data Warehouse);
    분석을 위한 적어도 하나의 비즈니스 규칙을 관리하는 비즈니스 로직; 및
    상기 적어도 하나의 비즈니스 규칙 중 어느 하나를 기초로 상기 ODS 또는 DW의 데이터들에 대하여 분석 주제별로 다차원 모델로 구성하는 데이터 마트를 포함하는 데이터 웨어하우스를 이용한 데이터베이스 시스템.
  11. 제10항에 있어서, 상기 데이터 웨어하우스는
    상기 분석 주제별로 상기 데이터 마트를 기초로 구성된 요약 테이블을 더 포함하는 것을 특징으로 하는 데이터 웨어하우스를 이용한 데이터베이스 시스템.
  12. 제10항에 있어서, 상기 비즈니스 로직은
    상기 분석을 위한 적어도 하나의 비즈니스 규칙을 중복없이 각각 구현하고, 구현된 적어도 하나의 비즈니스 규칙을 상기 데이터 마트에 제공하는 것을 특징으로 하는 데이터 웨어하우스를 이용한 데이터베이스 시스템.
  13. 적어도 하나의 소스 시스템으로부터 생성되는 데이터베이스를 이용한 업무 시스템 구축 방법에 있어서,
    상기 적어도 하나의 소스 데이터들을 통합하고 연관관계를 생성하여 DW(Data Warehouse)를 구성하는 단계;
    분석을 위한 적어도 하나의 비즈니스 규칙에 따라 적어도 하나의 비즈니스 로직을 구성하는 단계; 및
    상기 적어도 하나의 비즈니스 규칙 중 적어도 하나를 상기 비즈니스 로직에서 선택하고, 선택된 적어도 하나의 비즈니스 규칙을 이용하여 상기 DW의 데이터를 통합하여 다차원 모델링을 수행하여 데이터 마트를 구성하는 단계를 포함하는 데이터 웨어하우스를 이용한 업무 시스템 구축 방법.
KR1020110054503A 2011-06-07 2011-06-07 데이터 웨어하우스를 이용한 데이터베이스 구축 방법 및 그 시스템 KR101253335B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020110054503A KR101253335B1 (ko) 2011-06-07 2011-06-07 데이터 웨어하우스를 이용한 데이터베이스 구축 방법 및 그 시스템
PCT/KR2012/004507 WO2012169807A2 (ko) 2011-06-07 2012-06-07 데이터 웨어하우스를 이용한 데이터베이스 구축 방법 및 그 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110054503A KR101253335B1 (ko) 2011-06-07 2011-06-07 데이터 웨어하우스를 이용한 데이터베이스 구축 방법 및 그 시스템

Publications (2)

Publication Number Publication Date
KR20120135665A true KR20120135665A (ko) 2012-12-17
KR101253335B1 KR101253335B1 (ko) 2013-04-10

Family

ID=47296607

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110054503A KR101253335B1 (ko) 2011-06-07 2011-06-07 데이터 웨어하우스를 이용한 데이터베이스 구축 방법 및 그 시스템

Country Status (2)

Country Link
KR (1) KR101253335B1 (ko)
WO (1) WO2012169807A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101508068B1 (ko) * 2013-11-19 2015-04-07 중소기업은행 데이터 중복성 제거 장치 및 그 방법

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807016A (zh) * 2019-09-29 2020-02-18 北京淇瑀信息科技有限公司 一种应用于金融业务的数据仓库构建方法、装置和电子设备
CN111159154A (zh) * 2019-12-31 2020-05-15 新奥数能科技有限公司 一种能源数据仓库系统
CN111104394A (zh) * 2019-12-31 2020-05-05 新奥数能科技有限公司 一种能源数据仓库系统构建方法及装置
CN111367989B (zh) * 2020-06-01 2020-08-28 北京江融信科技有限公司 一种实时数据指标计算系统和方法
CN112612778B (zh) * 2020-12-25 2024-05-07 上海航空工业(集团)有限公司 一种企业数据架构方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100417872B1 (ko) * 2000-02-24 2004-02-11 호스텍글로벌 주식회사 인터넷 비즈니스 기반의 고객 관계 관리 마케팅 솔루션구축 시스템 및 방법
JP2003150594A (ja) * 2001-11-12 2003-05-23 Hitachi Ltd データウェアハウスシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101508068B1 (ko) * 2013-11-19 2015-04-07 중소기업은행 데이터 중복성 제거 장치 및 그 방법

Also Published As

Publication number Publication date
KR101253335B1 (ko) 2013-04-10
WO2012169807A3 (ko) 2013-03-28
WO2012169807A2 (ko) 2012-12-13

Similar Documents

Publication Publication Date Title
JP6618461B2 (ja) メタデータ管理のシステム
US8626702B2 (en) Method and system for validation of data extraction
US9336184B2 (en) Representation of an interactive document as a graph of entities
US9754010B2 (en) Generation of cube metadata and query statement based on an enhanced star schema
US20130191306A1 (en) Providing Operational Business Intelligence
KR101253335B1 (ko) 데이터 웨어하우스를 이용한 데이터베이스 구축 방법 및 그 시스템
US20120159333A1 (en) Representation of an interactive document as a graph of entities
US20110112973A1 (en) Automation for Governance, Risk, and Compliance Management
Hobbs et al. Oracle 10g data warehousing
US8892585B2 (en) Metadata driven flexible user interface for business applications
US20160259831A1 (en) Methodology supported business intelligence (BI) software and system
US10332010B2 (en) System and method for automatically suggesting rules for data stored in a table
AU2014271289A1 (en) Extract, transform and load (etl) system and method
US20100161676A1 (en) Lifecycle management and consistency checking of object models using application platform tools
Hancock et al. Practical Business Intelligence with SQL Server 2005
US9069373B2 (en) Generating a runtime framework
US20200380022A1 (en) Auto derivation of summary data using machine learning
Dayal et al. Business Processes Meet Operational Business Intelligence.
US20150363711A1 (en) Device for rapid operational visibility and analytics automation
CN109426576A (zh) 容错处理方法以及容错组件
US10614421B2 (en) Method and system for in-memory policy analytics
WO2011061054A1 (en) Analyzing xml data
US20190180223A1 (en) Supply chain model generation system
US20100250621A1 (en) Financial-analysis support apparatus and financial-analysis support method
US20060230386A1 (en) Defining and executing defaulting based on metadata definitions

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160613

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180915

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee