KR20150043929A - 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조 - Google Patents

데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조 Download PDF

Info

Publication number
KR20150043929A
KR20150043929A KR20130122951A KR20130122951A KR20150043929A KR 20150043929 A KR20150043929 A KR 20150043929A KR 20130122951 A KR20130122951 A KR 20130122951A KR 20130122951 A KR20130122951 A KR 20130122951A KR 20150043929 A KR20150043929 A KR 20150043929A
Authority
KR
South Korea
Prior art keywords
record
key
page
ufk
lfk
Prior art date
Application number
KR20130122951A
Other languages
English (en)
Other versions
KR101549220B1 (ko
Inventor
서경식
김갑영
이기열
Original Assignee
네이버 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네이버 주식회사 filed Critical 네이버 주식회사
Priority to KR1020130122951A priority Critical patent/KR101549220B1/ko
Priority to JP2014209249A priority patent/JP5959592B2/ja
Priority to US14/513,921 priority patent/US10664459B2/en
Priority to TW103135611A priority patent/TWI549009B/zh
Publication of KR20150043929A publication Critical patent/KR20150043929A/ko
Application granted granted Critical
Publication of KR101549220B1 publication Critical patent/KR101549220B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 데이터베이스의 인덱스를 구성함에 있어, 한 페이지에 포함되는 다수 개의 레코드의 키값의 하한값 및 상한값을 구분자로서 저장하고, 이를 이용하여 다수 개의 레코드에서 중복되는 키값을 삭제함으로써, 인덱스 페이지가 저장되는 저장 공간을 절약하고 이로 인해 데이터베이스의 성능이 향상되는 데이터베이스 관리 방법 및 시스템에 관한 것이다.

Description

데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조{Method and System for Managing Database, and Tree Structure for Database}
본 발명은 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조에 관한 것으로, 상세하게는 인덱스 압축 기법(Index Compression Method)을 이용한 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조에 관한 것이다.
데이터베이스 관리 시스템(Database Management System: DBMS, '이하 DBMS'라 함)은 방대한 양의 데이터가 저장되어 있는 데이터베이스를 관리하기 위한 시스템으로서, 대량의 정보들이 쉴새없이 생성되고 있는 현시대에 있어서 없어서는 안 될 중요한 요소로 인식되고 있다.
이러한 DBMS에서는 모든 데이터를 테이블(Table) 형태로 데이터베이스에 저장하는데, 여기서 테이블이란 데이터베이스에서 데이터를 저장하는 기본구조를 말하며, 하나의 테이블은 하나 이상의 레코드(Record)들로 구성된다. 여기서, 레코드란 테이블의 한 행(Row)를 의미한다. 또한, 각 레코드는 하나 이상의 칼럼으로 구성되는데, 칼럼이란 테이블을 구성하는 실세계의 테이블 항목을 표현하는 이름을 가진 도메인(Domain)을 의미하는 것으로서, 어트리뷰트(Attribute) 또는 필드(Field)라고도 한다.
이러한 DBMS는 외부로부터 특정 질의(Query)가 입력되는 경우, 입력된 질의에 따라 데이터베이스에 데이터를 선택, 삽입, 갱신, 삭제 등의 기능을 수행한다. 여기서 질의란 데이터베이스의 테이블에 저장되어 있는 데이터에 대한 어떠한 요구, 즉 데이터에 대한 어떠한 조작을 하기 원하는지를 기술한 것을 의미하는 것으로서, SQL(Structured Query Language)과 같은 언어를 이용하여 표현한다.
한편, 데이터의 양이 갈수록 방대해짐에 따라 DBMS는 일반적으로 인덱스(index)를 구비한다. 여기서, 인덱스(index)란 데이터베이스 분야에 있어서 테이블에 대한 탐색 속도를 높여주는 자료구조를 의미하며, 이와 같은 인덱스는 데이터 레코드(튜플)에 빠르게 접근하기 위해 {키값, 포인터} 쌍으로 구성되는 데이터 구조를 갖는다.
전술한 배경기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.
본 발명의 일 실시예는 데이터베이스의 인덱스를 구성함에 있어, 한 페이지에 포함되는 다수 개의 레코드의 키값의 하한값 및 상한값을 구분자로서 저장하고, 이를 이용하여 다수 개의 레코드에서 키의 중복되는 부분을 삭제함으로써, 인덱스 페이지가 저장되는 저장 공간을 절약하고 이로 인해 데이터베이스의 성능이 향상되는 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조를 제공하는 것을 목적으로 한다.
또한, 본 발명의 일 실시예는 실시간(run-time)으로 압축 여부를 설정하는 것이 가능하도록 하여, 특정 영역에 삽입/삭제(insert/delete) 부하가 높아지면 압축을 수행하지 않도록 조정함으로써 데이터베이스 운영의 효율성이 향상된 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조를 제공하는 것을 목적으로 한다.
또한, 본 발명의 일 실시예는 부차적인 압축방식 및 범위에 대한 메타데이터를 추가로 기록할 필요가 없도록 하여, 페이지에 저장되는 레코드의 개수가 많아질수록 압축되는 레코드에 메타 정보를 포함하는 기존의 방법에 비해서 압축 효율이 극대화되는 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조를 제공하는 것을 목적으로 한다.
또한, 본 발명의 일 실시예는 인덱스의 트리 구조를 순회(Traverse)할 때마다 각 페이지의 LFK 및 UFK를 이용하여 리프 노드의 유효성 검사(validity check)를 수행함으로써, 인덱스 구조의 오류를 손쉽게 체크할 수 있는 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조를 제공하는 것을 목적으로 한다.
본 발명의 일 실시예는 각 페이지에 포함되는 다수 개의 레코드의 키값의 하한값이 LFK(lower fence key)로 저장되거나 또는, 레코드의 키값의 상한값이 UFK(upper fence key)로 저장되는 단계; 상기 페이지를 이루는 다수 개의 레코드의 키값 중 공통 영역이 프리픽스(prefix)로 추출되는 단계; 및 상기 다수 개의 레코드의 키값에서 상기 프리픽스(prefix)에 해당하는 부분을 제외한 나머지 부분이 저장되는 단계;를 포함하는 데이터베이스 관리 방법을 개시한다.
본 실시예에 있어서, 상기 프리픽스는 LFK(lower fence key) 또는 UFK(upper fence key)에 저장될 수 있다.
본 실시예에 있어서, 상기 각 레코드 중 LFK(lower fence key) 또는 UFK(upper fence key)가 저장되는 레코드 이외의 레코드에는, 각 레코드의 원본키값 중 상기 프리픽스를 제외한 키값들이 저장될 수 있다.
본 실시예에 있어서, 상기 레코드는 다수 개의 키값을 포함하는 멀티 칼럼(multi column) 형태의 레코드일 수 있다.
본 실시예에 있어서, 상기 다수 개의 키값 중, 하나의 페이지를 이루는 레코드가 동일한 값을 가지는 키값이 상기 프리픽스로 추출될 수 있다.
본 실시예에 있어서, 상기 각 페이지는 B 트리 또는 B+ 트리 구조의 리프 노드일 수 있다.
본 실시예에 있어서, 상기 데이터베이스 관리 방법은, 상기 페이지에 포함된 레코드의 원본키값이 복원되는 단계를 더 포함하고, 상기 원본키값이 복원되는 단계는, 해당 페이지에 상기 LFK와 UFK가 존재하는지 여부가 확인되는 단계; 해당 페이지에 상기 LFK와 UFK가 존재할 경우, 상기 LFK와 UFK를 비교 연산하여 이에 공통되는 프리픽스가 추출되는 단계; 및 상기 추출된 프리픽스와 해당 레코드의 키값이 결합하여 원본키값이 복원되는 단계;를 포함할 수 있다.
본 실시예에 있어서, 해당 페이지에 상기 LFK와 UFK가 존재하지 않을 경우, 각 레코드에 저장된 키값이 원본키값인 일 수 있다.
본 실시예에 있어서, 상기 데이터베이스 관리 방법은, 상기 페이지에 새로운 레코드가 추가되거나 기 존재하는 레코드가 변경되는 단계를 더 포함하고, 상기 레코드가 추가되거나 변경되는 단계는, 해당 페이지에 상기 LFK와 UFK가 존재하는지 여부가 확인되는 단계; 해당 페이지에 상기 LFK와 UFK가 존재할 경우, 상기 LFK와 UFK를 비교 연산하여 이에 공통되는 프리픽스가 추출되는 단계; 및 추가 또는 변경될 레코드에서 상기 프리픽스가 제외된 나머지 키값이 레코드로 추가 또는 변경되는 단계;를 포함할 수 있다.
본 실시예에 있어서, 해당 페이지에 상기 LFK와 UFK가 존재하지 않을 경우, 상기 프리픽스가 추출되지 아니하고, 해당 페이지에 레코드가 추가 또는 변경될 수 있다.
본 발명의 다른 실시예는 B 트리 또는 B+ 트리 구조의 데이터베이스 관리 방법에 있어서, B 트리 또는 B+ 트리 구조의 인덱스가 생성되는 단계; 상기 인덱스에서 소정의 레코드가 복원되는 단계; 상기 인덱스에 소정의 레코드가 추가 또는 변경되는 단계;를 포함하고, 상기 인덱스가 생성되는 단계는, 하나 이상의 리프 노드의 적어도 일 단부에, 해당 리프 노드에 속하는 키값의 하한값이 LFK(lower fence key)로 저장되거나 또는 해당 리프 노드에 속하는 키값의 상한값이 UFK(upper fence key)가 저장되는 단계를 포함하는 데이터베이스 관리 방법을 개시한다.
본 발명의 다른 실시예는 특정 테이블에 포함된 레코드의 인출요청 및 상기 레코드에 포함된 적어도 하나의 칼럼에 대한 갱신요청이 함께 정의된 질의문을 수신하여 분석하는 질의문 분석부; 상기 분석된 질의문을 수행하기 위한 실행계획을 생성하는 실행계획 생성부; 상기 실행계획에 따라 상기 레코드의 인출 및 상기 적어도 하나의 칼럼에 대한 갱신을 수행함으로써 상기 실행계획을 실행하는 실행계획 실행부; 및 특정 테이블에 대한 인덱스를 생성하며, 상기 인덱스의 각 페이지에 속하는 다수 개의 레코드의 키값의 하한값을 LFK(lower fence key)로 저장하거나 또는, 레코드의 키값의 상한값을 UFK(upper fence key)로 저장하는 인덱스 생성부를 포함하는 인덱스 관리부;를 포함하는 데이터베이스 관리 시스템을 개시한다.
본 실시예에 있어서, 상기 인덱스 생성부는, 상기 각 페이지를 이루는 다수 개의 레코드의 키값 중 공통 영역을 프리픽스(prefix)로써 추출할 수 있다.
본 실시예에 있어서, 상기 인덱스 생성부는, 상기 각 페이지를 이루는 다수 개의 레코드의 키값에서 공통 영역인 상기 프리픽스(prefix)에 해당하는 부분을 제외한 나머지 부분을 인덱스에 저장할 수 있다.
본 실시예에 있어서, 상기 프리픽스는 LFK(lower fence key) 또는 UFK(upper fence key)에만 저장될 수 있다.
본 실시예에 있어서, 상기 각 레코드 중 LFK(lower fence key) 또는 UFK(upper fence key)가 저장되는 레코드 이외의 레코드에는, 각 레코드의 원본키값 중 상기 프리픽스를 제외한 키값들만이 저장될 수 있다.
본 실시예에 있어서, 상기 인덱스 관리부는, 상기 인덱스의 각 페이지에 포함된 레코드로부터 원본키값을 복원하는 레코드 복원부를 더 포함할 수 있다.
본 실시예에 있어서, 상기 레코드 복원부는, 해당 페이지에 상기 LFK와 UFK가 존재하는지 여부를 확인하고, 해당 페이지에 상기 LFK와 UFK가 존재할 경우 LFK와 UFK를 비교 연산하여 상기 프리픽스를 추출하며, 추출된 상기 프리픽스와 해당 레코드의 값을 결합하여 원본키값을 복원할 수 있다.
본 실시예에 있어서, 상기 인덱스 관리부는, 상기 인덱스의 각 페이지에 새로운 레코드를 추가하거나 기 존재하는 레코드를 변경하는 레코드 업데이트부를 더 포함할 수 있다.
본 실시예에 있어서, 상기 레코드 업데이트부는, 해당 페이지에 상기 LFK와 UFK가 존재하는지 여부를 확인하고, 해당 페이지에 상기 LFK와 UFK가 존재할 경우 LFK와 UFK를 비교 연산하여 상기 프리픽스를 추출하며, 추가 또는 변경될 레코드에서 상기 프리픽스가 제외된 나머지 데이터를 해당 페이지에 레코드로 추가 또는 변경할 수 있다.
본 발명의 다른 실시예는 B 트리 또는 B+ 트리 구조의 데이터베이스 트리 구조에 있어서, 트리 구조의 최상부에 위치하며 하나 이상의 구분키값을 저장하는 루트 노드; 및 적어도 일 단부에 해당 리프 노드에 속하는 키값의 하한값이 LFK(lower fence key)로 저장되거나 또는 해당 리프 노드에 속하는 키값의 상한값이 UFK(upper fence key)가 저장되는 하나 이상의 리프 노드;를 포함하는 데이터베이스 트리 구조를 개시한다.
본 실시예에 있어서, 상기 리프 노드에서 LFK(lower fence key)와 UFK(upper fence key) 사이에 존재하는 레코드는, 상기 레코드의 키값에서 공통 영역을 제외한 나머지 키값만을 저장할 수 있다.
본 실시예에 있어서, 상기 루트 노드에 저장된 구분키값은 서로 이웃한 리프 노드의 어느 일 측의 LFK 및 다른 일 측의 UFK가 될 수 있다.
본 실시예에 있어서, 다수 개의 상기 리프 노드 중 가장 왼쪽에 위치한 리프 노드에는 상기 LFK가 저장되지 아니하고, 다수 개의 상기 리프 노드 중 가장 오른쪽에 위치한 리프 노드에는 상기 UFK가 저장되지 아니할 수 있다.
전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다.
이와 같은 본 발명에 의해서, 인덱스 페이지가 저장되는 저장 공간을 절약할 수 있으며, 이에 따라 데이터베이스의 성능이 향상되는 효과를 얻을 수 있다.
또한, 본 발명의 일 실시예는 실시간(run-time)으로 압축 여부를 설정하는 것이 가능하도록 하여, 특정 영역에 삽입/삭제(insert/delete) 부하가 높아지면 압축을 수행하지 않도록 조정함으로써 데이터베이스 운영의 효율성이 향상되는 효과를 얻을 수 있다.
또한, 본 발명의 일 실시예는 부차적인 압축방식 및 범위에 대한 메타데이터를 추가로 기록할 필요가 없도록 하여, 페이지에 저장되는 레코드의 개수가 많아질수록 압축 효율이 극대화되는 효과를 얻을 수 있다.
또한, 본 발명의 일 실시예는 인덱스의 트리 구조를 순회(Traverse)할 때마다 각 페이지의 LFK 및 UFK를 이용하여 리프 노드의 유효성 검사(validity check)를 수행함으로써, 인덱스 구조의 오류를 손쉽게 체크하는 효과를 얻을 수 있다.
도 1은 본 발명의 일 실시예에 따른 데이터베이스 관리 시스템의 개략적인 블록도이다.
도 2a는 본 발명의 일 실시예에 따른 데이터베이스 관리 방법의 인덱스 생성 단계를 나타내는 흐름도이다.
도 2b는 본 발명의 일 실시예에 따른 데이터베이스 관리 방법의 레코드 복원 단계를 나타내는 흐름도이다.
도 2c는 본 발명의 일 실시예에 따른 데이터베이스 관리 방법의 레코드 추가/변경 단계를 나타내는 흐름도이다.
도 3은 본 발명의 데이터베이스 관리 방법 및 시스템이 적용되는 B 트리 인덱스의 구조를 예시적으로 도시한 도면이다.
도 4는 일반적인 B 트리 페이지의 키값의 배열을 나타내는 도면이다.
도 5는 본 발명의 데이터베이스 관리 방법 및 시스템에 따른 B 트리 페이지의 키값의 배열을 나타내는 도면이다.
도 6a 및 도 6b는 본 발명의 데이터베이스 관리 방법 및 시스템이 적용되는 B 트리 인덱스에서 페이지가 분할되는 과정을 나타내는 도면이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예의 예시로서 도시하는 첨부 도면을 참조한다. 이러한 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 본 명세서에 기재되어 있는 특정 형상, 구조 및 특성은 본 발명의 정신과 범위를 벗어나지 않으면서 일 실시예로부터 다른 실시예로 변경되어 구현될 수 있다. 또한, 각각의 실시예 내의 개별 구성요소의 위치 또는 배치도 본 발명의 정신과 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 행하여지는 것이 아니며, 본 발명의 범위는 특허청구범위의 청구항들이 청구하는 범위 및 그와 균등한 모든 범위를 포괄하는 것으로 받아들여져야 한다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 구성요소를 나타낸다.
이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 여러 실시예에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 데이터베이스 관리 시스템의 개략적인 블록도이다. 도 1을 참조하면, 본 발명의 일 실시예에 따른 데이터베이스 관리 시스템(100)은 다음과 같이 구성된다.
먼저, 데이터베이스(110)에는 다양한 데이터들이 테이블 형식으로 저장되며, 상술한 바와 같이, 각 테이블은 하나 이상의 레코드로 구성되고, 각 레코드는 하나 이상의 칼럼으로 구성된다. 예컨대, 소정 게시판에 대한 게시물들이 저장된 데이터베이스인 경우, 테이블은 게시물들의 집합을 의미하고, 레코드는 각 게시물을 의미하며, 칼럼이란 게시물 식별자, 게시물의 작성자, 게시물의 조회수 등이 저장되는 영역을 의미한다. 도면에는 데이터베이스(110)가 복수 개 구비되는 것으로 도시되어 있으나, 본 발명의 사상은 이에 제한되지 아니하며, 데이터베이스 관리 시스템(100)의 구성, 저장되는 데이터 분량, 용도 등에 따라 데이터베이스(110)의 개수 및 구성은 다양하게 변경가능하다 할 것이다.
데이터베이스 관리 시스템(100)은 데이터베이스(110)에 연결되어 데이터베이스(110)에 기록된 데이터를 갱신 또는 삭제하거나 데이터베이스(110)에 데이터를 추가하는 등 데이터베이스(110)를 통합적으로 관리하는 기능을 수행하는 것으로서, 크게 질의문 분석부(120), 실행계획 생성부(130), 실행계획 실행부(140)를 포함한다. 또한, 데이터베이스 관리 시스템(100)은 엔트리 관리부(150) 및 인덱스 관리부(160)를 더 포함할 수 있다.
질의문 분석부(120)는 데이터베이스 관리 시스템(100)과 연동되는 다양한 외부서버(미도시) 또는 관리자 단말기(미도시)로부터 데이터베이스(110)에 저장되어 있는 데이터들의 처리를 위한 질의문을 수신하고, 수신된 질의문을 분석한다. 이러한 질의문 분석부(120)는 질의문 수신부, 파서를 포함하며, 유효성 검증부를 더 포함할 수 있다.
실행계획 생성부(130)는 질의문 분석부(120)의 유효성 검증부에 의해 유효한 것으로 판단된 파스트리를 기반으로 요청된 레코드의 인출 및 레코드에 포함된 칼럼의 갱신을 위한 실행계획을 생성하여 후술할 메모리(170)에 저장한다. 여기서, 실행계획이란 특정 테이블로부터 레코드를 인출하는 방법, 결과 레코드 리스트, 갱신 요청된 칼럼에 대한 증가 연산 여부 등을 포함하는 자료구조를 의미한다.
일 실시예에 있어서 실행계획 생성부(130)는 요청된 레코드를 특정 테이블로부터 인출하는 방법으로서, 순차 스캔 방법 및 인덱스 스캔 방법 중 어느 하나를 선택할 수 있다. 여기서, 순차 스캔 방법이란 특정 테이블에 포함된 레코드들을 순차적으로 스캔해 가면서 해당 레코드의 식별자를 가진 레코드를 인출하는 방법을 의미하고, 인덱스 스캔 방법이란 각 레코드의 식별자 별로 인덱스가 생성되어 있어, 이러한 인덱스만을 스캔함으로써 해당 레코드를 인출하는 방법을 의미한다. 이와 같은 DBMS의 인덱스에 대해서는 뒤에서 상세히 설명하도록 한다.
실행계획 실행부(140)는 실행계획 생성부(130)에 의해 생성된 실행계획에 따라 특정 테이블로부터 해당 레코드를 인출하고, 갱신 요청된 칼럼의 물리적 위치에 상응하는 레코드 상의 칼럼에 기록된 칼럼값에 증가 연산을 수행함으로써 해당 칼럼값을 갱신한다. 구체적으로, 실행계획 실행부(140)는 실행계획 생성부(130)에 의해 생성된 실행계획을 실행하기 위한 트랜잭션을 생성함으로써 생성된 실행계획을 해당 트랜잭션 동안 처리한다. 여기서, 트랜잭션이란 하나의 논리적 작업 단위를 구성하는 것으로서, 하나 이상의 SQL문을 이용해서 정의된다. 이러한 트랜잭션의 사용으로 인해 데이터의 일치성과 데이터의 동시발생을 보장할 수 있게 된다.
데이터베이스 관리 시스템(100)은 레코드의 식별자 및 갱신 요청되는 칼럼의 식별자로 구성되는 엔트리를 생성 또는 삭제하고, 생성된 엔트리를 엔트리에 포함된 칼럼 식별자에 상응하는 칼럼값과 매칭시켜 메모리(170)에 저장하는 엔트리 관리부(150)를 더 포함할 수 있고, 메모리(170)에는 갱신 요청된 칼럼의 칼럼값이 엔트리 관리부(150)에 생성된 엔트리와 매칭되어 저장될 수 있다.
한편, 데이터베이스 관리 시스템(100)은 인덱스를 생성 또는 삭제하고, 생성된 인덱스를 메모리(170)에 저장하는 인덱스 관리부(160)를 더 포함할 수 있다. 이와 같은 인덱스 관리부(160)는 인덱스 생성부(161), 레코드 복원부(163), 레코드 업데이트부(165)를 포함할 수 있다.
인덱스 생성부(161)는 특정 데이터베이스(110)에 대한 인덱스를 생성하며, 이때 인덱스의 각 페이지에 속하는 키값의 하한값을 LFK(lower fence key)로 저장하고, 키값의 상한값이 UFK(upper fence key)로 저장하는 역할을 수행한다. 또한, 인덱스 생성부(161)는 각 페이지를 이루는 다수 개의 레코드의 키값 중 공통 영역을 프리픽스(prefix)로써 추출하는 역할을 수행한다. 또한, 인덱스 생성부(161)는 각 페이지를 이루는 다수 개의 레코드의 키값에서 프리픽스(prefix)에 해당하는 부분을 삭제한 후 인덱스에 저장하는 역할을 수행한다.
레코드 복원부(163)는 인덱스의 각 페이지에 포함된 레코드로부터 원본키값을 복원하는 역할을 수행한다. 상세히, 레코드 복원부(163)는 해당 페이지에 LFK와 UFK가 존재하는지 여부를 확인하고, 해당 페이지에 LFK와 UFK가 존재할 경우 LFK와 UFK를 비교 연산하여 프리픽스를 추출하며, 추출된 프리픽스와 해당 레코드의 값을 결합하여 원본키값을 복원하는 역할을 수행한다.
레코드 업데이트부(165)는 인덱스의 각 페이지에 새로운 레코드를 추가하거나 기 존재하는 레코드를 변경하는 역할을 수행한다. 상세히, 레코드 업데이트부(165)는 해당 페이지에 LFK와 UFK가 존재하는지 여부를 확인하고, 해당 페이지에 LFK와 UFK가 존재할 경우 LFK와 UFK를 비교 연산하여 프리픽스를 추출하며, 추가 또는 변경될 레코드에서 프리픽스가 제외된 나머지 데이터를 해당 페이지에 레코드로 추가 또는 변경하는 역할을 수행한다.
이와 같은 인덱스 생성부(161)의 인덱스 생성 과정, 레코드 복원부(163)의 레코드 복원 과정, 레코드 업데이트부(165)의 레코드 업데이트 과정에 대해 도 2 이하에서 상세히 설명하도록 한다.
이하에서는 이와 같이 구분자 기반의 인덱스 압축 기법(Serperator-Based Index Compression Method)을 이용한 데이터베이스 관리 방법에 대해 보다 상세히 설명하도록 한다.
도 2a, 도 2b 및 도 2c는 본 발명의 일 실시예에 따른 데이터베이스 관리 방법을 나타내는 흐름도이다. 한편, 도 3은 본 발명의 데이터베이스 관리 방법 및 시스템이 적용되는 B 트리 인덱스의 구조를 예시적으로 도시한 도면이고, 도 4는 일반적인 B 트리 페이지의 키값의 배열을 나타내는 도면이며, 도 5는 본 발명의 데이터베이스 관리 방법 및 시스템에 따른 B 트리 페이지의 키값의 배열을 나타내는 도면이다.
도 2 내지 도 5를 참조하면, 본 발명의 일 실시예에 따른 데이터베이스 관리 방법은 인덱스를 생성하는 단계(S100 단계), 인덱스에서 레코드를 복원하는 단계(S200 단계) 및 인덱스에서 레코드를 추가/변경하는 단계(S300 단계)를 포함한다.
이를 더욱 상세히 설명하면 다음과 같다.
인덱스(index)는 데이터베이스 분야에 있어서 테이블에 대한 동작의 속도를 높여주는 자료구조를 일컫는다. 인덱스는 테이블 내의 1개의 컬럼(single coulmn index), 혹은 여러 개의 컬럼(multi coulmn index)을 이용하여 생성될 수 있으며, 고속의 검색 동작뿐만 아니라 레코드 접근과 관련하여 효율적인 순서 매김 동작에 대한 기초를 제공한다. 인덱스를 저장하는 데 필요한 디스크 공간은 보통 테이블을 저장하는 데 필요한 디스크 공간보다 작다. 왜냐하면 보통 인덱스는 키-필드만 갖고 있고, 테이블의 다른 세부 항목들은 갖고 있지 않기 때문이다.
B 트리(혹은 B+ 트리)는 이와 같은 인덱스를 구성하기 위해 데이터베이스와 파일 시스템에서 널리 사용되는 트리 자료구조의 일종으로, 특정 값을(key) 가지고 있는 레코드를 빠르게 조회하기 위한 연관사상 자료구조이다. B 트리(혹은 B+ 트리)는 억세스(access)가 느린 대용량 디스크에 데이터가 기록되어 있는 특성 때문에, I/O 횟수를 줄이기 위해 페이지 단위의 트리 구조로 되어 있다. 한 페이지 내에는 키(key)와, 이 키를 어트리뷰트(attribute)로서 포함하고 있는 실제 레코드(record)의 위치(Object ID 혹은 Record ID)가 키의 순서대로 기록되어 있다. 즉, {Key - OID}가 결합하여 각각의 인덱스 레코드(이하에서는 이를 레코드라고 칭하도록 한다)를 구성하는 것이다.
위와 같은 특성으로 인하여, 한 페이지 내의 레코드의 키값들은 인접해 있는 값들끼리 상당한 유사성을 가질 수 있다. 예를 들어 한 회사의 메일 시스템에서 각 메일을 구분하기 위한 인덱스 키로서 사번, 메일폴더번호, 메일일련번호를 지정한 경우(즉, 멀티 컬럼 인덱스), 어느 사원이 전체 메일은 10만 건이고 하나의 메일폴더에 1만 건의 메일을 보관하고 있다면, 인덱스 중에서 1만 건은 사번과 메일폴더번호가 동일한 값이고, 10만 건은 사번이 동일한 값이다. 만일 일반적인 B 트리의 한 페이지에 기존의 방식대로 1천 건씩이 들어간다면, 약 10건의 페이지에서는 사번과 메일폴더번호가 중복해서 매번 저장될 것이다. 따라서, 동일한 값이 여러 번 중복되어 저장됨으로써 불필요한 메모리의 낭비가 발생한다는 문제점이 존재하였다.
이와 같은 문제점을 해결하기 위하여, 본 발명의 구분자 기반의 인덱스 압축 기법(Serperator-Based Index Compression Method)을 이용한 데이터베이스 관리 방법 및 시스템은, 한 페이지의 키값들 중 중복 저장되는 프리픽스(Prefix)를 페이지 구분자인 LFK(Lower Fence Key)와 UFK(Upper Fence Key)에 저장하여, 메모리 공간을 절약하는 것을 일 특징으로 한다.
다시 도 2를 참조하면, 본 발명의 일 실시예에 따른 데이터베이스 관리 방법에서 인덱스를 생성하는 단계(S100 단계)는, 하나의 페이지에 속하는 키값의 하한값이 LFK(lower fence key)로 저장되거나 또는, 하나의 페이지에 속하는 키값의 상한값이 UFK(upper fence key)로 저장되는 단계(S110 단계), 하나의 페이지를 이루는 다수 개의 레코드의 키값 중 공통 영역이 프리픽스(prefix)로 추출되는 단계(S120 단계) 및 하나의 페이지를 이루는 다수 개의 레코드의 키값에서 공통 영역인 프리픽스(prefix)가 삭제된 후 저장되는 단계(S130 단계)를 포함한다.
이를 이해하기 쉽게 설명하면 다음과 같다.
본 발명이 적용된 B 트리 인덱스의 구조를 도시한 도 3을 참조하면, 데이터베이스에서 레코드 데이터를 빠르게 검색하기 위해서 사용되는 인덱스에 있어서, 본 발명에서 사용하는 B 트리 인덱스의 구성은 실제 레코드 데이터를 가리키는 리프 노드(leaf node)들과 그 상위의 중간 노드들로 이루어진다. 루트 노드는 중간 노드들 중에서 최상위에 존재하는 하나의 노드이다. 도 3에는 네 개의 리프 노드와 한 개의 중간 노드가 존재하고, 그 하나의 중간 노드가 곧 루트 노드가 된다. 이때, 각각의 리프 노드는 곧 각각의 페이지를 구성한다. 즉 도 3에 도시된 네 개의 리프 노드는 네 개의 페이지를 구성하는 것이다.
여기서, 도 3에 도시된 B 트리 인덱스의 루트 노드는 세 개의 구분키값(P1, P2, P3)을 갖는다. 제1 구분키값(P1)은 페이지 1과 페이지 2를 구분하는 구분자가 되며, 제2 구분키값(P2)은 페이지 2와 페이지 3을 구분하는 구분자가 되며, 제3 구분키값(P3)은 페이지 3과 페이지 4를 구분하는 구분자가 된다.
이와 같이, 본 발명의 일 실시예에 따른 데이터베이스 관리 방법은 각각의 페이지에 속하는 키값의 하한값을 LFK(lower fence key)로 저장하고, 또한 각각의 페이지에 속하는 키값의 상한값을 UFK(upper fence key)로 저장하는 것을 특징으로 한다. 이때, LFK(lower fence key)는 도면에서 보았을 때 각 페이지의 좌단부에 저장되어 해당 페이지의 하한값을 정의하고, UFK(upper fence key)는 도면에서 보았을 때 각 페이지의 우단부에 저장되어 해당 페이지의 상한값을 정의하는 것이다.
그리고, 본 발명의 일 실시예에 따른 데이터베이스 관리 방법은 각 페이지에서 LFK(lower fence key)와 UFK(upper fence key) 사이에 존재하는 다수개의 레코드의 키값 중 공통 영역을 프리픽스(prefix)로 추출하고, LFK(lower fence key)와 UFK(upper fence key)를 제외한 나머지 레코드에서는 키값에서 프리픽스를 삭제한 후, 나머지 키값만을 저장함으로써, 데이터의 중복 저장을 방지하여 메모리 공간을 절약한다.
즉, 제1 구분키값(P1)은 페이지 1의 UFK(UFK1)이 되는 동시에 페이지 2의 LFK(LFK2)가 된다. 마찬가지로, 제2 구분키값(P2)은 페이지 2의 UFK(UFK2)이 되는 동시에 페이지 3의 LFK(LFK3)가 된다. 마찬가지로, 제3 구분키값(P3)은 페이지 3의 UFK(UFK3)이 되는 동시에 페이지 4의 LFK(LFK4)가 된다. 이때 다수 개의 리프 노드 중 가장 왼쪽에 위치한 극좌측 리프 노드(페이지 1)에는 LFK(lower fence key)를 설정할 수 없으며, 따라서 해당 페이지에서는 프리픽스 추출도 할 수 없다. 마찬가지로 가장 오른쪽에 위치한 극우측 리프 노드(페이지 4)에는 UFK(upper fence key)를 설정할 수 없으며, 따라서 해당 페이지에서는 프리픽스 추출도 할 수 없다.
이를 더욱 상세히 설명하기 위해, 일반적인 B 트리 페이지의 키값의 배열을 나타내는 도 4와, 본 발명의 데이터베이스 관리 방법 및 시스템에 따른 B 트리 페이지의 키값의 배열을 나타내는 도 5를 비교한다. 도 4 및 도 5에서는 설명을 위해 10개의 레코드만 있는 경우를 상정했다.
도 4를 참조하면, 하나의 페이지를 구성하는 열 개의 레코드에서 사번(KR10000)과 메일폴더번호(FD0001)로 동일한 값이 중복되어 10번 저장된다. 이에 반해 도 5를 참조하면, 본 발명의 데이터베이스 관리 방법에 따를 경우, 하나의 페이지의 키값들 중 중복 저장되는 사번(KR10000)과 메일폴더번호(FD0001)는 해당 페이지의 하한값을 설정하는 LFK(Lower Fence Key)와 해당 페이지의 상한값을 설정하는 UFK(Upper Fence Key)에만 저장되며, LFK와 UFK 사이의 일반 레코드에는 프리픽스(Prefix)가 삭제된 상태의 키값만이 저장된다. 즉, 도 5와 같이 열 개의 레코드에 공통되는 키값인 사번(KR10000)과 메일폴더번호(FD0001)는 모두 삭제되고, 유니크한 키값인 메일일련번호만이 각 레코드에 저장되는 것이다.
이하에서는 본 발명의 일 실시예에 따른 데이터베이스 관리 방법에서 레코드를 복원하는 단계에 대해 설명하도록 한다. 다시 도 2 및 도 5를 참조하면, 본 발명의 일 실시예에 따른 데이터베이스 관리 방법에서 레코드를 복원하는 단계(S200 단계)는, 해당 페이지에 LFK와 UFK가 존재하는지 여부를 확인하는 단계(S210 단계), 해당 페이지에 LFK와 UFK가 존재할 경우, LFK와 UFK를 비교 연산하여 프리픽스를 추출하는 단계(S220 단계) 및 프리픽스와 해당 레코드의 값이 결합하여 원본키값이 복원되는 단계(S230 단계)를 포함한다. 이를 더욱 상세히 설명하면 다음과 같다.
먼저, 복원하고자 하는 키값이 속한 페이지가 어느 페이지인지를 바이너리 탐색에 의해 찾은 후, 해당 페이지에 LFK와 UFK가 존재하는지 여부를 확인한다. 해당 페이지에 LFK와 UFK 둘 중 하나라도 존재하지 않을 경우, 해당 페이지는 압축(즉, 프리픽스를 이용한 중복 데이터 삭제)이 수행되지 아니하였으므로, 각각의 레코드에 저장되어 있는 키값이 바로 원본키값이다(S240 단계). 한편, 해당 페이지에 LFK와 UFK가 모두 존재할 경우, 해당 페이지는 프리픽스를 이용한 데이터 압축이 수행된 페이지이므로, 소정의 복원 루틴을 실행한다. 즉, 페이지의 하한값인 LFK와 페이지의 상한값인 UFK를 비교하여, LFK와 UFK의 공통 영역, 즉 프리픽스를 추출한다. 도 5의 예에서는 LFK와 UFK의 공통 영역인 KR10000:FD0001이 프리픽스로써 추출될 것이다. 이와 같이 추출된 프리픽스와, 각 레코드에 저장되어 있는 키값을 결합하여 원본키값이 복원된다. 즉, SN10001을 복원한 원본키값은 KR10000:FD0001:SN10001 이 되는 것이다.
이하에서는 본 발명의 일 실시예에 따른 데이터베이스 관리 방법에서 레코드를 추가 또는 변경하는 단계에 대해 설명하도록 한다. 다시 도 2 및 도 5를 참조하면, 본 발명의 일 실시예에 따른 데이터베이스 관리 방법에서 레코드를 추가 또는 변경하는 단계(S300 단계)는, 해당 페이지에 LFK와 UFK가 존재하는지 여부를 확인하는 단계(S310 단계), 해당 페이지에 LFK와 UFK가 존재할 경우, LFK와 UFK를 비교 연산하여 프리픽스를 추출하는 단계(S320 단계) 및 추가 또는 변경될 레코드에서 프리픽스가 제외된 나머지 데이터가 해당 페이지에 레코드로 추가 또는 변경되는 단계(S330 단계)를 포함한다. 이를 더욱 상세히 설명하면 다음과 같다.
먼저, 추가 또는 변경하고자 하는 키값이 속한 페이지가 어느 페이지인지를 바이너리 탐색에 의해 찾은 후, 해당 페이지에 LFK와 UFK가 존재하는지 여부를 확인한다. 해당 페이지에 LFK와 UFK 둘 중 하나라도 존재하지 않을 경우, 해당 페이지는 압축(즉, 프리픽스를 이용한 중복 데이터 삭제)이 수행되지 아니하였으므로, 해당 레코드의 값을 별도의 처리 없이 바로 추가 또는 변경하면 된다(S340 단계). 한편, 해당 페이지에 LFK와 UFK가 모두 존재할 경우, 해당 페이지는 프리픽스를 이용한 데이터 압축이 수행된 페이지이므로, 소정의 분해 루틴을 실행한다. 즉, 페이지의 하한값인 LFK와 페이지의 상한값인 UFK를 비교하여, LFK와 UFK의 공통 영역, 즉 프리픽스를 추출한다. 도 5의 예에서는 LFK와 UFK의 공통 영역인 KR10000:FD0001이 프리픽스로써 추출될 것이다. 다음으로, 추가 또는 변경할 레코드의 키값에서 프리픽스를 제외한 나머지 키값만이 페이지의 해당 위치에 추가 또는 변경되는 것이다. 예를 들어, 추가되는 키값이 KR10000:FD0001:SN13000 이라면 프리픽스는 KR10000:FD0001 이 되며, 따라서 해당 페이지에는 키값으로 프리픽스를 제외한 SN13000 만이 추가되는 것이다.
이하에서는 본 발명의 일 실시예에 따른 데이터베이스 관리 방법에서 페이지가 분할 또는 병합되는 과정에 대해 설명하도록 한다.
도 6a 및 도 6b는 본 발명의 데이터베이스 관리 방법 및 시스템이 적용되는 B 트리 인덱스에서 페이지가 분할되는 과정을 나타내는 도면이다.
도 6a에 도시된 B 트리 인덱스의 루트 노드는 처음에는 두 개의 구분키값(P1, P2)을 갖는다. 제1 구분키값(P1)은 페이지 1과 페이지 2를 구분하는 구분자가 되며, 제2 구분키값(P2)은 페이지 2와 페이지 3을 구분하는 구분자가 된다. 그리고, 제1 구분키값(P1)은 페이지 1의 UFK(UFK1)이 되는 동시에 페이지 2의 LFK(LFK2)가 된다. 마찬가지로, 제2 구분키값(P2)은 페이지 2의 UFK(UFK2)이 되는 동시에 페이지 3의 LFK(LFK3)가 된다.
이 상태에서, 페이지 2에 더 이상 저장 공간이 없게 되어 제1 구분키값(P1)과 제2 구분키값(P2) 사이의 임의의 값인 S를 기준으로 페이지 2를 분할하여야 한다고 가정한다.
이 경우, 페이지 2에서는 도 6b에 도시된 바와 같이 복원된 S를 새로운 UFK(UFK2)로 저장한다. 그리고, 기존에 존재하던 LFK(LFK2)와 새롭게 생성된 UFK(UFK2)를 이용하여 다시 데이터를 압축한다. 즉, LFK2와 UFK2를 비교 연산하여 프리픽스를 추출한 후, LFK2와 UFK2를 제외한 나머지 레코드에서는 키값에서 프리픽스를 삭제한 후, 나머지 키값만을 저장하는 것이다.
한편, 새롭게 생성된 도 6b의 페이지 3에서는 S를 새로운 LFK(LFK3)로 저장한다. 그리고, 도 6a의 페이지 2의 UFK(UFK2)가 도 6b의 페이지 3의 UFK(UFK3)로 저장된다. 그리고, LFK3와 UFK3를 이용하여 다시 데이터를 압축한다. 즉, LFK3와 UFK3를 비교 연산하여 프리픽스를 추출한 후, LFK3와 UFK3를 제외한 나머지 레코드에서는 키값에서 프리픽스를 삭제한 후, 나머지 키값만을 저장하는 것이다.
마지막으로, 도 6b의 페이지 3에서는 S를 새로운 구분키값으로 부모 노드(여기서는, 루트 노드)의 제1 구분키값(P1)과 제2 구분키값(P2) 사이에 삽입하게 된다.
한편, 도면에는 도시되지 않았지만, 압축되지 않은 페이지(즉, 프리픽스를 이용한 중복 데이터 삭제가 수행되지 않은 페이지)라면, 새로운 구분키값(S)을 기준으로 페이지 분할 시, 기존의 페이지에는 새로운 구분키값(S)이 UFK로 설정되어, 기존에 존재하던 LFK와 새롭게 생성된 UFK를 이용하여 새롭게 데이터를 압축할 수 있다. 한편, 새로 생성된 페이지에는 새로운 구분키값(S)이 LFK로 설정되지만, UFK가 설정되지 않았기 때문에, 데이터 압축이 수행되지 아니할 것이다.
또한, 도면에는 도시되지 않았지만, 서로 이웃한 두 개의 페이지가 병합 가능한(mergeable) 크기일 때(즉, 두 개의 페이지에 저장된 레코드 개수의 합이 하나의 페이지에 저장될 수 있는 레코드 개수의 최대값 이하일 경우)에는, 두 개의 페이지를 병합하는 것도 가능할 것이다. 이때 두 개의 페이지가 모두 압축된 페이지(즉, 프리픽스를 이용하여 중복 데이터가 삭제된 페이지)라면, 두 페이지의 병합 이후 새롭게 압축을 수행한다. 반면, 두 개의 페이지 중 하나라도 압축된 페이지가 아닐 경우에는 병합을 수행하지 않게 된다.
표 1은 일반적인 데이터베이스 관리 방법 및 시스템을 적용하였을 경우의 총 인덱스 페이지의 개수(total page count)와, 본 발명의 일 실시예에 따른 데이터베이스 관리 방법 및 시스템을 적용하였을 경우의 총 인덱스 페이지의 개수를 비교한 표이다. 그리고, 표 2는 일반적인 데이터베이스 관리 방법 및 시스템을 적용하였을 경우의 평균 키값의 길이(average key length)와, 본 발명의 일 실시예에 따른 데이터베이스 관리 방법 및 시스템을 적용하였을 경우의 평균 키값의 길이를 비교한 표이다.
인덱스 이름 기존
총 인덱스 페이지 개수
본원발명 적용시
인덱스 페이지
개수 감소 비율(%)
PK(primary key) 4,120,635 21
Index 1 5,740,191 23
Index 2 6,056,621 18
Index 3 6,849,043 19
Index 4 5,793,081 15
인덱스 이름 기존
평균 키값 길이(bytes)
본원발명 적용시
평균 키값 길이
감소 비율(%)
PK(primary key) 18 39
Index 1 30 33
Index 2 32 28
Index 3 38 29
Index 4 30 27
표 1 및 표 2에 나타난 바와 같이, 종래의 데이터베이스 관리 방법 및 시스템을 적용하였을 경우에 비해 본 발명의 일 실시예에 따른 데이터베이스 관리 방법 및 시스템을 적용하였을 경우, 총 인덱스 페이지 개수는 약 19% 감소하였으며, 평균 키값 길이는 약 31% 감소하였다. 즉, 본 발명에 의해 저장 공간을 절약할 수 있으며, 이에 따라 데이터베이스의 성능이 향상되는 효과를 얻을 수 있음을 알 수 있다.
이와 같은 본 발명의 일 실시예에 따른 데이터베이스 관리 방법은 B 트리의 한 페이지 내에서 해당 페이지의 구분자로 사용된 키값을 {가상의 키-OID} 레코드로 하여 해당 페이지의 양단에 펜스 키(LFK 및 UFK)로 각각 추가함으로써, LFK 및 UFK로부터 원본키값의 조합 및 원본키값에서 프리픽스를 삭제하는 분해작업을 빠르게 수행할 수 있다.
한편, 해당 페이지에 LFK 또는 UFK가 존재하지 않으면 기존의 방식으로 레코드를 저장할 수 있으며, 따라서 압축된 페이지(즉, 프리픽스가 각 레코드에서 삭제된 페이지)와 압축되지 않은 페이지(즉, 프리픽스가 각 레코드에서 삭제되지 않은 페이지)가 혼재하여 유지될 수 있다. 또한 LFK 및 UFK가 존재하는 페이지 내에서도 압축된 레코드와 압축되지 않은 레코드가 혼재하여 유지될 수 있다. 따라서, B 트리의 현재 상태와 무관하게 실시간(run-time)으로 압축 여부를 동적으로 설정하는 것이 가능해지는 효과를 얻을 수 있다. 그리고, 이와 같은 특징을 이용하여, 특정 영역에 삽입/삭제(insert/delete) 부하가 높아지면 압축을 수행하지 않도록 조정하여 데이터베이스 운영의 효율성을 향상시킬 수 있다.
한편, 프리픽스를 이용한 압축 여부를 LFK 및 UFK를 사용하여 결정하기 때문에, 부차적인 압축방식 및 범위에 대한 메타데이터를 추가로 기록할 필요가 없다. 따라서, 페이지에 저장되는 레코드의 개수가 많아질수록, 압축되는 레코드에 메타 정보를 포함하는 기존의 방법에 비해서 압축 효율이 극대화되는 장점이 있다.
이와 같은 본 발명에 의해서, 기존에 비해 프리픽스를 제외한 키값만을 저장하기 때문에 B 트리의 한 페이지에 더 많은 레코드를 저장할 수 있다. 이로 인해 저장 공간을 절약할 수 있으며, 이렇게 작아진 공간만큼 주메모리의 버퍼 캐쉬에 포함될 가능성이 커져 데이터베이스의 성능이 향상되는 효과를 얻을 수 있다. 나아가 본 발명의 일 실시예에 따른 데이터베이스 관리 방법은 기존의 다른 압축 방식에 비해서 분할, 및 복원이 간단하고, 저장구조의 변경이 없어 하위 호환성 측면에서 유리하며, LFK 및 UFK를 나타내는 플래그만 하나만 추가될 뿐 추가로 기록되는 메타데이터도 없어 구조적으로 단순하다는 장점을 가진다.
나아가, 본 발명의 데이터베이스 관리 방법을 이용하면, 인덱스의 트리 구조를 순회(Traverse)할 때마다 각 페이지의 LFK 및 UFK를 이용하여 리프 노드의 유효성 검사(validity check)를 수행할 수 있어, 인덱스 구조의 오류를 손쉽게 체크하는 효과를 얻을 수 있다. 또한, LFK 및 UFK에 의해 리프 노드의 연결 관계를 파악할 수 있게 되므로, 리프 노드에서 링크를 제거할 수 있게 되며, 따라서 SMO(Structure Modification Operation) 시의 성능 및 효율을 향상시키는 효과를 얻을 수 있다.
상술한 데이터베이스 관리 방법은 다양한 컴퓨터 수단을 이용하여 수행될 수 있는 프로그램 형태로도 구현될 수 있는데, 이때 데이터베이스 관리 방법을 수행하기 위한 프로그램은 하드 디스크, CD-ROM, DVD, 롬(ROM), 램, 또는 플래시 메모리와 같은 컴퓨터로 판독할 수 있는 기록 매체에 저장된다.
본 명세서에서는 본 발명을 한정된 실시예를 중심으로 설명하였으나, 본 발명의 범위 내에서 다양한 실시예가 가능하다. 또한 설명되지는 않았으나, 균등한 수단도 또한 본 발명에 그대로 결합되는 것이라 할 것이다. 따라서 본 발명의 진정한 보호범위는 아래의 특허청구범위에 의하여 정해져야 할 것이다.
100: 데이터베이스 관리 시스템
110: 데이터베이스
120: 질의문 분석부
130: 실행계획 생성부
140: 실행계획 실행부
150: 엔트리 관리부
160: 인덱스 관리부
161: 인덱스 생성부
163: 레코드 복원부
165: 레코드 업데이트부

Claims (25)

  1. 각 페이지에 포함되는 다수 개의 레코드의 키값의 하한값이 LFK(lower fence key)로 저장되거나 또는, 레코드의 키값의 상한값이 UFK(upper fence key)로 저장되는 단계;
    상기 페이지를 이루는 다수 개의 레코드의 키값 중 공통 영역이 프리픽스(prefix)로 추출되는 단계; 및
    상기 다수 개의 레코드의 키값에서 상기 프리픽스(prefix)에 해당하는 부분을 제외한 나머지 부분이 저장되는 단계;를 포함하는 데이터베이스 관리 방법.
  2. 제 1 항에 있어서,
    상기 프리픽스는 LFK(lower fence key) 또는 UFK(upper fence key)에 저장되는 것을 특징으로 하는 데이터베이스 관리 방법.
  3. 제 2 항에 있어서,
    상기 각 레코드 중 LFK(lower fence key) 또는 UFK(upper fence key)가 저장되는 레코드 이외의 레코드에는, 각 레코드의 원본키값 중 상기 프리픽스를 제외한 키값들이 저장되는 것을 특징으로 하는 데이터베이스 관리 방법.
  4. 제 1 항에 있어서,
    상기 레코드는 다수 개의 키값을 포함하는 멀티 칼럼(multi column) 형태의 레코드인 것을 특징으로 하는 데이터베이스 관리 방법.
  5. 제 4 항에 있어서,
    상기 다수 개의 키값 중, 하나의 페이지를 이루는 레코드가 동일한 값을 가지는 키값이 상기 프리픽스로 추출되는 것을 특징으로 하는 데이터베이스 관리 방법.
  6. 제 1 항에 있어서,
    상기 각 페이지는 B 트리 또는 B+ 트리 구조의 리프 노드인 것을 특징으로 하는 데이터베이스 관리 방법.
  7. 제 1 항에 있어서,
    상기 데이터베이스 관리 방법은,
    상기 페이지에 포함된 레코드의 원본키값이 복원되는 단계를 더 포함하고,
    상기 원본키값이 복원되는 단계는,
    해당 페이지에 상기 LFK와 UFK가 존재하는지 여부가 확인되는 단계;
    해당 페이지에 상기 LFK와 UFK가 존재할 경우, 상기 LFK와 UFK를 비교 연산하여 이에 공통되는 프리픽스가 추출되는 단계; 및
    상기 추출된 프리픽스와 해당 레코드의 키값이 결합하여 원본키값이 복원되는 단계;를 포함하는 데이터베이스 관리 방법.
  8. 제 7 항에 있어서,
    해당 페이지에 상기 LFK와 UFK가 존재하지 않을 경우,
    각 레코드에 저장된 키값이 원본키값인 것을 특징으로 하는 데이터베이스 관리 방법.
  9. 제 1 항에 있어서,
    상기 데이터베이스 관리 방법은,
    상기 페이지에 새로운 레코드가 추가되거나 기 존재하는 레코드가 변경되는 단계를 더 포함하고,
    상기 레코드가 추가되거나 변경되는 단계는,
    해당 페이지에 상기 LFK와 UFK가 존재하는지 여부가 확인되는 단계;
    해당 페이지에 상기 LFK와 UFK가 존재할 경우, 상기 LFK와 UFK를 비교 연산하여 이에 공통되는 프리픽스가 추출되는 단계; 및
    추가 또는 변경될 레코드에서 상기 프리픽스가 제외된 나머지 키값이 레코드로 추가 또는 변경되는 단계;를 포함하는 데이터베이스 관리 방법.
  10. 제 9 항에 있어서,
    해당 페이지에 상기 LFK와 UFK가 존재하지 않을 경우,
    상기 프리픽스가 추출되지 아니하고, 해당 페이지에 레코드가 추가 또는 변경되는 것을 특징으로 하는 데이터베이스 관리 방법.
  11. B 트리 또는 B+ 트리 구조의 데이터베이스 관리 방법에 있어서,
    B 트리 또는 B+ 트리 구조의 인덱스가 생성되는 단계;
    상기 인덱스에서 소정의 레코드가 복원되는 단계;
    상기 인덱스에 소정의 레코드가 추가 또는 변경되는 단계;를 포함하고,
    상기 인덱스가 생성되는 단계는,
    하나 이상의 리프 노드의 적어도 일 단부에, 해당 리프 노드에 속하는 키값의 하한값이 LFK(lower fence key)로 저장되거나 또는 해당 리프 노드에 속하는 키값의 상한값이 UFK(upper fence key)가 저장되는 단계를 포함하는 데이터베이스 관리 방법.
  12. 제 1 항 내지 제 11 항 중 어느 하나의 항에 기재된 방법을 수행하기 위한 프로그램이 기록된 기록매체.
  13. 특정 테이블에 포함된 레코드의 인출요청 및 상기 레코드에 포함된 적어도 하나의 칼럼에 대한 갱신요청이 함께 정의된 질의문을 수신하여 분석하는 질의문 분석부;
    상기 분석된 질의문을 수행하기 위한 실행계획을 생성하는 실행계획 생성부;
    상기 실행계획에 따라 상기 레코드의 인출 및 상기 적어도 하나의 칼럼에 대한 갱신을 수행함으로써 상기 실행계획을 실행하는 실행계획 실행부; 및
    특정 테이블에 대한 인덱스를 생성하며, 상기 인덱스의 각 페이지에 속하는 다수 개의 레코드의 키값의 하한값을 LFK(lower fence key)로 저장하거나 또는, 레코드의 키값의 상한값을 UFK(upper fence key)로 저장하는 인덱스 생성부를 포함하는 인덱스 관리부;를 포함하는 데이터베이스 관리 시스템.
  14. 제 13 항에 있어서,
    상기 인덱스 생성부는, 상기 각 페이지를 이루는 다수 개의 레코드의 키값 중 공통 영역을 프리픽스(prefix)로써 추출하는 것을 특징으로 하는 데이터베이스 관리 시스템.
  15. 제 14 항에 있어서,
    상기 인덱스 생성부는, 상기 각 페이지를 이루는 다수 개의 레코드의 키값에서 공통 영역인 상기 프리픽스(prefix)에 해당하는 부분을 제외한 나머지 부분을 인덱스에 저장하는 것을 특징으로 하는 데이터베이스 관리 시스템.
  16. 제 14 항에 있어서,
    상기 프리픽스는 LFK(lower fence key) 또는 UFK(upper fence key)에만 저장되는 것을 특징으로 하는 데이터베이스 관리 시스템.
  17. 제 16 항에 있어서,
    상기 각 레코드 중 LFK(lower fence key) 또는 UFK(upper fence key)가 저장되는 레코드 이외의 레코드에는, 각 레코드의 원본키값 중 상기 프리픽스를 제외한 키값들만이 저장되는 것을 특징으로 하는 데이터베이스 관리 시스템.
  18. 제 14 항에 있어서,
    상기 인덱스 관리부는,
    상기 인덱스의 각 페이지에 포함된 레코드로부터 원본키값을 복원하는 레코드 복원부를 더 포함하는 데이터베이스 관리 시스템.
  19. 제 18 항에 있어서,
    상기 레코드 복원부는,
    해당 페이지에 상기 LFK와 UFK가 존재하는지 여부를 확인하고, 해당 페이지에 상기 LFK와 UFK가 존재할 경우 LFK와 UFK를 비교 연산하여 상기 프리픽스를 추출하며, 추출된 상기 프리픽스와 해당 레코드의 값을 결합하여 원본키값을 복원하는 것을 특징으로 하는 데이터베이스 관리 시스템.
  20. 제 14 항에 있어서,
    상기 인덱스 관리부는,
    상기 인덱스의 각 페이지에 새로운 레코드를 추가하거나 기 존재하는 레코드를 변경하는 레코드 업데이트부를 더 포함하는 데이터베이스 관리 시스템.
  21. 제 20 항에 있어서,
    상기 레코드 업데이트부는,
    해당 페이지에 상기 LFK와 UFK가 존재하는지 여부를 확인하고, 해당 페이지에 상기 LFK와 UFK가 존재할 경우 LFK와 UFK를 비교 연산하여 상기 프리픽스를 추출하며, 추가 또는 변경될 레코드에서 상기 프리픽스가 제외된 나머지 데이터를 해당 페이지에 레코드로 추가 또는 변경하는 것을 특징으로 하는 데이터베이스 관리 시스템.
  22. B 트리 또는 B+ 트리 구조의 데이터베이스 트리 구조에 있어서,
    트리 구조의 최상부에 위치하며 하나 이상의 구분키값을 저장하는 루트 노드; 및
    적어도 일 단부에 해당 리프 노드에 속하는 키값의 하한값이 LFK(lower fence key)로 저장되거나 또는 해당 리프 노드에 속하는 키값의 상한값이 UFK(upper fence key)가 저장되는 하나 이상의 리프 노드;를 포함하는 데이터베이스 트리 구조.
  23. 제 22 항에 있어서,
    상기 리프 노드에서 LFK(lower fence key)와 UFK(upper fence key) 사이에 존재하는 레코드는, 상기 레코드의 키값에서 공통 영역을 제외한 나머지 키값만을 저장하는 것을 특징으로 하는 데이터베이스 트리 구조.
  24. 제 22 항에 있어서,
    상기 루트 노드에 저장된 구분키값은 서로 이웃한 리프 노드의 어느 일 측의 LFK 및 다른 일 측의 UFK가 되는 것을 특징으로 하는 데이터베이스 트리 구조.
  25. 제 22 항에 있어서,
    다수 개의 상기 리프 노드 중 가장 왼쪽에 위치한 리프 노드에는 상기 LFK가 저장되지 아니하고, 다수 개의 상기 리프 노드 중 가장 오른쪽에 위치한 리프 노드에는 상기 UFK가 저장되지 아니하는 것을 특징으로 하는 데이터베이스 트리 구조.
KR1020130122951A 2013-10-15 2013-10-15 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조 KR101549220B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020130122951A KR101549220B1 (ko) 2013-10-15 2013-10-15 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조
JP2014209249A JP5959592B2 (ja) 2013-10-15 2014-10-10 データベース管理方法、プログラム及び該管理システム、並びにデータベースのツリー構造
US14/513,921 US10664459B2 (en) 2013-10-15 2014-10-14 Database managing method, database managing system, and database tree structure
TW103135611A TWI549009B (zh) 2013-10-15 2014-10-15 資料庫管理方法、資料庫管理系統,以及資料庫樹狀結構

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130122951A KR101549220B1 (ko) 2013-10-15 2013-10-15 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020150034544A Division KR102013839B1 (ko) 2015-03-12 2015-03-12 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조

Publications (2)

Publication Number Publication Date
KR20150043929A true KR20150043929A (ko) 2015-04-23
KR101549220B1 KR101549220B1 (ko) 2015-09-03

Family

ID=52810565

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130122951A KR101549220B1 (ko) 2013-10-15 2013-10-15 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조

Country Status (4)

Country Link
US (1) US10664459B2 (ko)
JP (1) JP5959592B2 (ko)
KR (1) KR101549220B1 (ko)
TW (1) TWI549009B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200029431A (ko) * 2020-03-11 2020-03-18 주식회사 티맥스데이터 효율적인 인덱싱을 제공하기 위한 방법, 장치 및 컴퓨터-판독가능 매체에 포함된 컴퓨터 프로그램

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156197A (zh) * 2015-04-22 2016-11-23 中兴通讯股份有限公司 一种数据库的查询方法和装置
JP7237782B2 (ja) 2019-09-13 2023-03-13 キオクシア株式会社 ストレージシステム及びその制御方法
CN110716933B (zh) * 2019-09-29 2022-03-15 浙江大学 一种面向新型城轨列车大数据的高伸缩分布式索引方法
CN111008195A (zh) * 2019-10-31 2020-04-14 苏州浪潮智能科技有限公司 一种数据库空闲空间管理方法、系统、终端及存储介质
US20220382891A1 (en) * 2021-05-27 2022-12-01 Intuit Inc. Detecting sensitive information in records using context and decoys
KR20230120347A (ko) * 2022-02-09 2023-08-17 주식회사 티맥스티베로 데이터를 인덱스하기 위한 방법

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812996A (en) * 1994-07-12 1998-09-22 Sybase, Inc. Database system with methods for optimizing query performance with a buffer manager
JPH09167111A (ja) * 1995-12-19 1997-06-24 Hitachi Ltd データベースのデータ格納方法
US6584459B1 (en) * 1998-10-08 2003-06-24 International Business Machines Corporation Database extender for storing, querying, and retrieving structured documents
US6804677B2 (en) * 2001-02-26 2004-10-12 Ori Software Development Ltd. Encoding semi-structured data for efficient search and browsing
US6694323B2 (en) * 2002-04-25 2004-02-17 Sybase, Inc. System and methodology for providing compact B-Tree
JP2004062475A (ja) * 2002-07-29 2004-02-26 Hitachi Ltd インデクス格納方法
US7693824B1 (en) * 2003-10-20 2010-04-06 Google Inc. Number-range search system and method
US8364711B2 (en) * 2006-05-09 2013-01-29 John Wilkins Contact management system and method
KR100834760B1 (ko) 2006-11-23 2008-06-05 삼성전자주식회사 최적화된 인덱스 검색 방법 및 장치
KR100921158B1 (ko) 2007-12-21 2009-10-12 엔에이치엔(주) 데이터베이스 관리 방법 및 시스템
KR101160388B1 (ko) 2008-02-05 2012-06-26 엔에이치엔비즈니스플랫폼 주식회사 데이터베이스 관리 방법 및 시스템
US8255398B2 (en) * 2008-09-30 2012-08-28 International Business Machines Corporation Compression of sorted value indexes using common prefixes
US8055675B2 (en) 2008-12-05 2011-11-08 Yahoo! Inc. System and method for context based query augmentation
US8180763B2 (en) * 2009-05-29 2012-05-15 Microsoft Corporation Cache-friendly B-tree accelerator
TWI445349B (zh) * 2010-12-31 2014-07-11 Aten Int Co Ltd 遠端管理系統及其運作方法
US8832050B2 (en) 2012-03-09 2014-09-09 Hewlett-Packard Development Company, L.P. Validation of distributed balanced trees

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200029431A (ko) * 2020-03-11 2020-03-18 주식회사 티맥스데이터 효율적인 인덱싱을 제공하기 위한 방법, 장치 및 컴퓨터-판독가능 매체에 포함된 컴퓨터 프로그램

Also Published As

Publication number Publication date
TW201514734A (zh) 2015-04-16
KR101549220B1 (ko) 2015-09-03
US10664459B2 (en) 2020-05-26
TWI549009B (zh) 2016-09-11
US20150106380A1 (en) 2015-04-16
JP5959592B2 (ja) 2016-08-02
JP2015079508A (ja) 2015-04-23

Similar Documents

Publication Publication Date Title
KR101549220B1 (ko) 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조
US10657116B2 (en) Create table for exchange
US9639542B2 (en) Dynamic mapping of extensible datasets to relational database schemas
US8560500B2 (en) Method and system for removing rows from directory tables
US20030204513A1 (en) System and methodology for providing compact B-Tree
JP3914662B2 (ja) データベース処理方法及び実施装置並びにその処理プログラムを記憶した媒体
US20090063400A1 (en) Apparatus, system, and method for improving update performance for indexing using delta key updates
US8954407B2 (en) System and method for partially deferred index maintenance
US20220171754A1 (en) Method for indexing data in storage engine and related apparatus
US20040225963A1 (en) Dynamic maintenance of web indices using landmarks
EP3867772B1 (en) Distributed join index for shared-nothing and log-structured databases
US10558636B2 (en) Index page with latch-free access
KR101358793B1 (ko) 인덱스 파일 생성방법, 사전 인덱스 파일을 이용한 데이터 검색 방법 및 데이터 관리 시스템, 기록매체
Tzouramanis et al. Overlapping B+-trees: An implementation of a transaction time access method
Ghanem et al. Bulk operations for space-partitioning trees
US11520763B2 (en) Automated optimization for in-memory data structures of column store databases
KR20150044013A (ko) 데이터베이스 관리 방법, 시스템 및 데이터베이스 트리 구조
Hu et al. Defining temporal operators for column oriented NoSQL databases
CN114443625A (zh) 数据库的处理方法、装置
US10572483B2 (en) Aggregate projection
CN114238241B (zh) 财务数据的元数据处理方法和计算机系统
Nørväg Efficient use of signatures in object-oriented database systems
Haapasalo et al. Concurrency control and recovery for multiversion database structures
Cho et al. Meta-data indexing for XPath location steps
US20190114323A1 (en) System And Method For Storing Data Records In Key-Value Database

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 5