KR20190017222A - 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 기법 및 장치 - Google Patents

로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 기법 및 장치 Download PDF

Info

Publication number
KR20190017222A
KR20190017222A KR1020170101699A KR20170101699A KR20190017222A KR 20190017222 A KR20190017222 A KR 20190017222A KR 1020170101699 A KR1020170101699 A KR 1020170101699A KR 20170101699 A KR20170101699 A KR 20170101699A KR 20190017222 A KR20190017222 A KR 20190017222A
Authority
KR
South Korea
Prior art keywords
log data
data
sub
log
specific
Prior art date
Application number
KR1020170101699A
Other languages
English (en)
Other versions
KR101990329B1 (ko
Inventor
나정호
김학주
조형락
배성빈
양은모
Original Assignee
주식회사 티맥스데이터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 티맥스데이터 filed Critical 주식회사 티맥스데이터
Priority to KR1020170101699A priority Critical patent/KR101990329B1/ko
Priority to US15/695,972 priority patent/US20190050298A1/en
Publication of KR20190017222A publication Critical patent/KR20190017222A/ko
Application granted granted Critical
Publication of KR101990329B1 publication Critical patent/KR101990329B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

전술한 바와 같은 과제를 해결하기 위한 본 발명의 일 실시예들 중 제 1 측면은, 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법으로서, 상기 방법은 적어도 하나의 리두 로그 파일을 판독하여, 복구 로그 데이터를 저장부에 적재하는 단계; 상기 적재된 복구 로그 데이터를 분석하여, 복수의 서브 로그 데이터 그룹을 생성하는 단계―상기 복수의 서브 로그 데이터 그룹 각각은 특정 데이터 블록과 연관되고, 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들은 서로 상이함―; 및 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들의 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성하는 단계―상기 적어도 하나의 인접 로그 데이터 그룹 각각은 적어도 하나의 서브 로그 데이터 그룹을 포함함―;를 포함할 수 있다.
본 발명의 실시예들 중 제 2 측면은, 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법을 제공하는 데이터베이스 관리 서버로서, 적어도 하나의 리두 로그 파일을 판독하는 로그 파일 판독부; 복구 로그 데이터를 저장부에 적재하는 데이터 적재부; 상기 적재된 복구 로그 데이터를 분석하여, 복수의 서브 로그 데이터 그룹을 생성하는 서브 로그 데이터 그룹 생성부―상기 복수의 서브 로그 데이터 그룹 각각은 특정 데이터 블록과 연관되고, 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들은 서로 상이함―; 및 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들의 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성하는 인접 로그 데이터 그룹 생성부―상기 적어도 하나의 인접 로그 데이터 그룹 각각은 적어도 하나의 서브 로그 데이터 그룹을 포함함―;를 포함할 수 있다.
본 발명의 실시예들 중 제 3 측면은, 인코딩된 명령들을 포함하는 컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 컴퓨터 시스템의 하나 이상의 프로세서들에 의해 실행되는 경우, 상기 하나 이상의 프로세서들로 하여금 이하의 동작들을 수행하도록 하며, 상기 동작들은: 적어도 하나의 리두 로그 파일을 판독하여, 복구 로그 데이터를 저장부에 적재하는 동작; 상기 적재된 복구 로그 데이터를 분석하여, 복수의 서브 로그 데이터 그룹을 생성하는 동작―상기 복수의 서브 로그 데이터 그룹 각각은 특정 데이터 블록과 연관되고, 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들은 서로 상이함―; 및 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들의 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성하는 동작―상기 적어도 하나의 인접 로그 데이터 그룹 각각은 적어도 하나의 서브 로그 데이터 그룹을 포함함―;을 포함할 수 있다.

Description

로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 기법 및 장치{METHOD AND APPARATUS FOR IMPROVING DATABASE RECOVERY SPEED USING LOG DATA ANALYSIS}
본 발명은 데이터베이스 복구에 관한 것으로서, 보다 상세하게는, Write-Ahead-Logging을 보장해야 하는 데이터베이스에서 장애(Fail) 발생 시, 데이터 파일과 리두 로그(Redo log)를 이용해 복구를 진행할 때, 이를 빠르고 효율적으로 진행하기 위한 방법에 관한 것이다.
기존의 데이터베이스에서 복구는, 단순히 데이터베이스를 복구하기 위해서 리두 로그 파일을 읽고, 해당 로그를 토대로 복구해야 할 데이터 블록을 선정하여 해당 블록을 데이터 파일에서 읽어들인 후 리두 로그를 적용하는 방식으로 진행된다.
하지만, 이와 같이 복구를 진행하게 될 경우, 디스크로부터 데이터 파일을 읽어들일 때, 랜덤하게 흩어져 있는 블록에 접근하여 읽어야 하므로 디스크 접근 효율이 떨어질 수 있다. 또한, 읽어들인 데이터 블록을 메모리 캐시에 올린 상태에서, 여러 리두 로그가 하나의 데이터 블록에 적용되는 경우, 불필요하게 여러 번 디스크에 접근하여 전체 복구 작업 시간을 지연시킬 수 있다. 그리고, 데이터 블록을 읽어들일 때, 하나의 블록에 대한 주소만 알고 있다고 가정하면 비동기 입출력(AIO)을 하지 못하는 문제가 있다.
따라서, 데이터베이스 복구 과정에서 디스크에 대한 접근을 효율적으로 수행하여 전체 데이터베이스 복구 시간을 줄일 수 있는 방법이 필요하다.
본 발명은 전술한 배경 기술에 대응하여 안출된 것으로, 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법으로서, 상기 방법은 디스크에 대한 접근을 효율적으로 수행함으로써 전체 데이터베이스 복구 시간을 감소시키기 위함이다.
전술한 바와 같은 과제를 해결하기 위한 본 발명의 일 실시예들 중 제 1 측면은, 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법으로서, 상기 방법은 적어도 하나의 리두 로그 파일을 판독하여, 복구 로그 데이터를 저장부에 적재하는 단계; 상기 적재된 복구 로그 데이터를 분석하여, 복수의 서브 로그 데이터 그룹을 생성하는 단계―상기 복수의 서브 로그 데이터 그룹 각각은 특정 데이터 블록과 연관되고, 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들은 서로 상이함―; 및 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들의 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성하는 단계―상기 적어도 하나의 인접 로그 데이터 그룹 각각은 적어도 하나의 서브 로그 데이터 그룹을 포함함―;를 포함할 수 있다.
본 발명의 실시예들 중 제 2 측면은, 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법을 제공하는 데이터베이스 관리 서버로서, 적어도 하나의 리두 로그 파일을 판독하는 로그 파일 판독부; 복구 로그 데이터를 저장부에 적재하는 데이터 적재부; 상기 적재된 복구 로그 데이터를 분석하여, 복수의 서브 로그 데이터 그룹을 생성하는 서브 로그 데이터 그룹 생성부―상기 복수의 서브 로그 데이터 그룹 각각은 특정 데이터 블록과 연관되고, 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들은 서로 상이함―; 및 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들의 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성하는 인접 로그 데이터 그룹 생성부―상기 적어도 하나의 인접 로그 데이터 그룹 각각은 적어도 하나의 서브 로그 데이터 그룹을 포함함―;를 포함할 수 있다.
본 발명의 실시예들 중 제 3 측면은, 인코딩된 명령들을 포함하는 컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 컴퓨터 시스템의 하나 이상의 프로세서들에 의해 실행되는 경우, 상기 하나 이상의 프로세서들로 하여금 이하의 동작들을 수행하도록 하며, 상기 동작들은: 적어도 하나의 리두 로그 파일을 판독하여, 복구 로그 데이터를 저장부에 적재하는 동작; 상기 적재된 복구 로그 데이터를 분석하여, 복수의 서브 로그 데이터 그룹을 생성하는 동작―상기 복수의 서브 로그 데이터 그룹 각각은 특정 데이터 블록과 연관되고, 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들은 서로 상이함―; 및 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들의 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성하는 동작―상기 적어도 하나의 인접 로그 데이터 그룹 각각은 적어도 하나의 서브 로그 데이터 그룹을 포함함―;을 포함할 수 있다.
본 발명의 일 실시예에 따르면, 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법은 디스크에 대한 접근을 효율적으로 수행함으로써 전체 데이터베이스 복구 시간을 감소시킬 수 있다.
다양한 양상들이 이제 도면들을 참조로 기재되며, 여기서 유사한 참조 번호들은 총괄적으로 유사한 구성요소들을 지칭하는데 이용된다. 이하의 실시예에서, 설명 목적을 위해, 다수의 특정 세부사항들이 하나 이상의 양상들의 총체적 이해를 제공하기 위해 제시된다. 그러나, 그러한 양상(들)이 이러한 구체적인 세부사항들 없이 실시될 수 있음은 명백할 것이다.
도 1은 본 발명의 일 실시예에 따른 데이터베이스 관리 시스템을 도시한다.
도 2는 본 발명의 일 실시예에 따른 로그 데이터 정렬을 이용해 데이터베이스의 복구 속도를 향상시키는 단계를 도시한다.
도 3은 본 발명의 일 실시예에 따른 데이터베이스 관리 서버의 내부 구성요소들을 도시한다.
도 4는 본 발명의 일 실시예에 따른 데이터베이스 관리 서버가 복구 로그 데이터를 정렬하여 서브 로그 데이터 그룹 및 인접 로그 데이터 그룹을 생성하는 방법을 도시한다.
도 5는 본 발명의 일 실시예에 따른 데이터베이스 관리 서버가 인접한 복수의 데이터 블록을 비동기 방식으로 획득하는 방법을 도시한다.
다양한 실시예들 및/또는 양상들이 이제 도면들을 참조하여 개시된다. 하기 설명에서는 설명을 목적으로, 하나 이상의 양상들의 전반적 이해를 돕기 위해 다수의 구체적인 세부사항들이 개시된다. 그러나, 이러한 양상(들)은 이러한 구체적인 세부사항들 없이도 실행될 수 있다는 점 또한 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 인식될 수 있을 것이다. 이후의 기재 및 첨부된 도면들은 하나 이상의 양상들의 특정한 예시적인 양상들을 상세하게 기술한다. 하지만, 이러한 양상들은 예시적인 것이고 다양한 양상들의 원리들에서의 다양한 방법들 중 일부가 이용될 수 있으며, 기술되는 설명들은 그러한 양상들 및 그들의 균등물들을 모두 포함하고자 하는 의도이다.
또한, 다양한 양상들 및 특징들이 하나 이상의 장치들, 단말들, 서버들, 디바이스들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있는 시스템에 의하여 제시될 것이다. 다양한 시스템들이, 추가적인 장치들, 단말들, 서버들, 디바이스들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있다는 점 그리고/또는 도면들과 관련하여 논의된 장치들, 단말들, 서버들, 디바이스들, 컴포넌트들, 모듈들 등의 전부를 포함하지 않을 수도 있다는 점 또한 이해되고 인식되어야 한다.
본 명세서에서 사용되는 "실시예", "예", "양상", "예시" 등은 기술되는 임의의 양상 또는 설계가 다른 양상 또는 설계들보다 양호하다거나, 이점이 있는 것으로 해석되지 않을 수도 있다. 아래에서 사용되는 용어들 '컴포넌트', '모듈', '시스템', '인터페이스' 등은 일반적으로 컴퓨터 관련 엔티티(computer-related entity)를 의미하며, 예를 들어, 이는 하드웨어, 하드웨어와 소프트웨어의 조합, 또는 소프트웨어를 의미할 수 있다.
더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하지만, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 달리 특정되지 않거나 단수 형태를 지시하는 것으로 문맥상 명확하지 않은 경우에, 본 명세서와 청구범위에서 단수는 일반적으로 "하나 또는 그 이상"을 의미하는 것으로 해석되어야 한다.
본 명세서에서의 컴퓨터 판독가능 매체는 컴퓨터 시스템에 의해서 판독될 수 있도록 프로그램 및 데이터가 저장되는 모든 종류의 저장 매체를 포함할 수 있다. 본 개시내용에서의 컴퓨터 판독가능 매체는, 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 전송 매체를 포함할 수 있다. 본 발명의 일 양상에 따르면, 컴퓨터 판독가능 저장 매체는: ROM(판독 전용 메모리), RAM(랜덤 액세스 메모리), CD(컴팩트 디스크)-ROM, DVD(디지털 비디오 디스크)-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등을 포함할 수 있다. 또한, 컴퓨터 판독가능 전송 매체는 캐리어 웨이브(예컨대, 인터넷을 통한 전송)의 형태로 구현되는 임의의 전송 가능한 형태의 매체를 포함할 수 있다. 추가적으로, 이러한 컴퓨터 판독가능 매체는 네트워크로 연결된 시스템에 분산되어, 분산 방식으로 컴퓨터가 판독가능한 코드들 및/또는 명령들을 저장할 수도 있다.
본 발명의 실시를 위한 구체적인 내용을 설명하기에 앞서, 본 발명의 기술적 요지와 직접적 관련이 없는 구성에 대해서는 본 발명의 기술적 요지를 흩뜨리지 않는 범위 내에서 생략하였음에 유의하여야 할 것이다. 또한, 본 명세서 및 청구범위에 사용된 용어 또는 단어는 발명자가 자신의 발명을 최선의 방법으로 설명하기 위해 적절한 용어의 개념을 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 할 것이다.
본 명세서에서, 데이터베이스는 서로 관련된 데이터들을 컴퓨터가 처리할 수 있는 형태로 저장하는 시스템을 의미한다. 데이터베이스는 데이터를 보관하고 사용자의 물음에 대답할 수 있고, 데이터베이스에 저장된 데이터는 변화될 수 있다. 데이터베이스는 새로운 데이터를 저장할 수 있고, 기존의 데이터를 삭제, 변경시키는 작업을 수행할 수 있다.
본 명세서에서, 리두 로그 파일은 데이터베이스에 장애(fail)가 발생했을 시 복구(recovery)에 필요한 정보(로그 데이터)를 수집하여 기록하는 파일을 의미한다. 리두 로그 파일은 데이터베이스 관리 서버로부터 판독될 수 있으며, 복구 로그 데이터를 포함할 수 있다.
본 명세서에서, 로그 데이터란 데이터베이스 운영중에 트랜잭션 또는 운영정보의 변경 등과 같이, 데이터 변경에 관련된 내용을 기록한 데이터를 의미한다.
로그 데이터를 이용하여 수행하는 복구의 유형으로는, 물리적으로 디스크가 손상되어 미디어 장애(Media Fail)가 발생했을 때 데이터베이스 복구를 위해 사용되는 미디어 복구(Media Recovery), 인스턴스가 비정상적으로 종료되었을 때 트랜잭션 데이터의 유실에 대비하기 위한 인스턴스 복구(Instance Recovery)등을 포함할 수 있으며, 이에 한정되지 않는다.
로그 데이터는 적어도 하나의 데이터 블록에 대한 다양한 정보를 포함할 수 있다.
예를 들어, 로그 데이터는 데이터 블록의 변경 시점 정보를 포함할 수 있다. 예를 들어, 로그 데이터는 특정 데이터 블록이 어느 시점에 변경되었는지에 대한 정보를 포함할 수 있다.
또한, 로그 데이터는 데이터 블록의 기록 시점 정보를 포함할 수 있다. 예를 들어, 로그 데이터는 특정 데이터 블록이 영구 저장 매체(3000)에 언제 기록되었는지를 나타내는 정보를 포함할 수 있다.
또한, 로그 데이터는 데이터 블록의 위치 정보를 포함할 수 있다. 여기서, 위치 정보는 데이터 블록의 위치를 식별할 수 있는 다양한 정보를 포함할 수 있다. 예를 들어, 특정 데이터 블록이 영구 저장 매체(3000)의 어느 부분에 기록되었는지를 나타내는 블록 주소 정보를 포함할 수 있으며, 이에 한정되지 않고 다양한 정보를 포함할 수 있다.
본 명세서에서, 블록이란 데이터의 덩어리를 의미할 수 있다. 예를 들어, 블록은 데이터가 저장된 하나의 테이블을 포함할 수 있고, 복수개의 테이블을 포함할 수 있다. 또한, 하나의 테이블에 포함된 데이터는 복수의 블록에 의해 나타내질 수 있다.
블록은 다양한 크기를 가질 수 있다. 예를 들어, 블록은 10kb, 100kb, 1메가 바이트, 2 메가 바이트, 3메가 바이트, 4메가 바이트 등의 크기를 가질 수 있으며, 이에 한정되지 않는다.
이하에서는, 첨부된 도면을 참조하여 본 발명에 따른 실시예들을 상세히 설명하도록 한다.
도 1은 본 발명의 일 실시예에 따른 데이터베이스 관리 시스템을 도시한다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 시스템은 데이터베이스 관리 서버(1000), 네트워크(2000) 및 영구 저장 매체(3000)를 포함할 수 있다.
데이터베이스 관리 서버(1000)는 마이크로프로세서, 메인프레임 컴퓨터, 디지털 싱글 프로세서, 휴대용 디바이스 및 디바이스 제어기 등과 같은 임의의 타입의 컴퓨터 시스템 또는 컴퓨터 디바이스를 포함할 수 있다.
데이터베이스 관리 서버(1000)는 저장부(200)를 포함할 수 있다. 데이터베이스 관리 서버(1000)는 저장부(200)를 이용하여 데이터베이스 복구를 수행할 수 있다. 예를 들어, 데이터베이스 관리 서버(1000)가 리두 로그 파일을 판독하는 경우, 복구 로그 데이터를 저장부(200)의 적어도 일부에 적재하고 영구 저장 매체(3000)로부터 특정 데이터 블록들을 읽어들여, 저장부(200)의 적어도 일부에 저장할 수 있다. 그리고, 저장부(200)에 저장된 특정 데이터 블록들에 복구 로그 데이터를 적용시킬 수 있다.
저장부(200)는 동적 램(DRAM, dynamic random access memory), 정적 램(SRAM, static random access memory) 등의 랜덤 액세스 메모리(RAM)와 같은, 제어부(100)가 직접 접근하는 주된 저장 장치로서 전원이 꺼지면 저장된 정보가 순간적으로 지워지는 휘발성(volatile) 저장 장치를 의미할 수 있지만, 이들로 한정되는 것은 아니다. 이러한 저장부(200)는 제어부(100)에 의하여 제어 될 수 있다.
데이터베이스 관리 서버(1000)와 영구 저장 매체(3000)는 네트워크(2000)를 통해 데이터를 주고받을 수 있다. 네트워크(2000)는 유선 네트워크, 무선 네트워크를 포함할 수 있으며, 이에 한정되지 않는다.
영구 저장 매체(3000)는 임의의 데이터를 지속적으로 저장할 수 있는 비-휘발성(non-volatile) 저장 매체를 포함할 수 있다. 예를 들어, 영구 저장 매체(3000)는 디스크, 광학(optical) 디스크 및 광자기(magneto-optical) 저장 디바이스뿐만 아니라 플래시 메모리 및/또는 배터리-백업 메모리에 기초한 저장 디바이스를 포함할 수 있으며, 이에 한정되지 않는다.
데이터베이스 관리 서버(1000)는 적어도 하나의 리두 로그 파일을 판독하여, 복구 로그 데이터를 저장부(200)에 적재할 수 있다. 그리고, 데이터베이스 관리 서버(1000)는 적재된 복구 로그 데이터를 분석하여, 각각의 복구 로그 데이터와 연관된 특정 데이터 블록별로 복구 로그 데이터를 정렬할 수 있다. 데이터베이스 관리 서버(1000)는 정렬된 복구 로그 데이터를 기초로 영구 저장 매체(3000)로부터 특정 데이터 블록들을 획득할 수 있다. 데이터베이스 관리 서버(1000)가 획득한 특정 데이터 블록들 각각에 정렬되어 있는 복구 로그 데이터가 순차적으로 적용되어 복구가 수행될 수 있다. 이 경우, 특정 데이터 블록들 각각에 적용되는 복구 로그 데이터는, 특정 데이터 블록들 각각과 연관되어 있을 수 있다.
여기서, 데이터베이스 관리 서버(1000)는, 정렬된 복구 로그 데이터와 연관된 각각의 데이터 블록의 위치 정보에 기초하여, 인접한 데이터 블록들은 한 번에 획득할 수 있다. 이 경우, 데이터베이스 관리 서버(1000)는 서로 인접해 있는 특정 데이터 블록들을 각각 획득하는 것이 아니고 한 번에 획득하므로, 영구 저장 매체(3000)에 접근하는 횟수가 감소할 수 있다.
또한, 데이터베이스 관리 서버(1000)는, 영구 저장 매체(3000)로부터 데이터 블록들을 비동기 방식으로 획득할 수 있다. 데이터베이스 관리 서버(1000)가 데이터 블록들을 비동기 방식으로 획득하는 경우, 영구 저장 매체(3000)가 제공하는 최대한의 대역폭을 활용할 수 있으므로, 데이터베이스 복구 시간을 감소시킬 수 있다.
데이터베이스 관리 서버(1000)가 영구 저장 매체(3000)로부터 동기 방식으로 데이터 블록들을 획득하는 경우, 영구 저장 매체(3000)에서 하나의 데이터 블록에 대한 읽기 작업이 종료될 때까지 다른 데이터 블록들에 대한 읽기 요청이 제한될 수 있다. 따라서, 데이터베이스 관리 서버(1000)는 영구 저장 매체(3000)에서 읽기 작업이 종료되어 데이터 블록을 획득할 때까지 유휴 상태로 유지된다.
하지만, 본 발명의 일 실시예에 따라, 데이터베이스 관리 서버(1000)가 비동기 방식으로 데이터 블록들을 획득하는 경우, 영구 저장 매체(3000)에서 하나의 데이터 블록에 대한 읽기 작업 종료 여부와 상관없이 다른 데이터 블록들에 대한 읽기 요청을 중첩시켜 대기시킬 수 있다. 즉, 데이터베이스 관리 서버(1000)가 획득한 데이터 블록을 복구하는 작업과 영구 저장 매체(3000)에서 데이터 블록들을 읽는 작업이 독립적으로 진행될 수 있다.
영구 저장 매체(3000)에 대한 입출력 과정(데이터베이스 복구 과정에서 데이터를 요청, 획득하는 과정)에 소요되는 시간이 데이터 처리 시간보다 긴 경우, 비동기 방식으로 데이터 블록을 획득하는 방법은 데이터베이스 복구 시간을 감소시킬 수 있다.
도 1에 도시된 데이터베이스 관리 시스템의 구성 요소는 전술한 실시예에 한정되지 않는다.
도 2는 본 발명의 일 실시예에 따른 로그 데이터 정렬을 이용해 데이터베이스의 복구 속도를 향상시키는 단계를 도시한다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 적어도 하나의 로그 파일을 판독하여 복구 로그 데이터를 저장부(200)에 적재하는 단계(S110), 상기 적재된 복구 로그 데이터를 분석하여 복수의 서브 로그 데이터 그룹을 생성하는 단계(S120), 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들의 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성하는 단계(S130), 상기 복수의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들을 획득하는 단계(S140), 상기 획득한 특정 데이터 블록들을 저장부(200)에 적재하는 단계(S150) 및 상기 적재된 적어도 특정 데이터 블록들에 상기 복수의 서브 로그 데이터 그룹의 서브 로그 데이터를 적용하는 단계(S160)를 수행할 수 있다.
단계(S110)에서, 데이터베이스 관리 서버(1000)는 적어도 하나의 로그 파일을 판독하여 복구 로그 데이터를 저장부(200)에 적재할 수 있다. 예를 들어, 데이터베이스 관리 서버(1000)는 영구 저장 매체(3000)에 저장된 전체 로그 파일 세트에서 데이터베이스 복구에 필요한 리두 로그 파일을 검출할 수 있다. 그리고, 데이터베이스 관리 서버(1000)는 리두 로그 파일에서 데이터베이스 복구에 필요한 복구 로그 데이터를 수집하고, 저장부(200)에 적재할 수 있다.
단계(S120)에서, 데이터베이스 관리 서버(1000)는 상기 적재된 복구 로그 데이터를 분석하여 복수의 서브 로그 데이터 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 저장부(200)에 적재된 복구 로그 데이터를, 연관된 특정 데이터 블록별로 구분할 수 있다. 그리고, 구분 결과에 기초하여, 복수의 서브 로그 데이터 그룹을 생성할 수 있다. 여기서, 복수의 서브 로그 데이터 그룹 각각은 서브 로그 데이터를 포함할 수 있다.
예를 들어, 데이터베이스 관리 서버(1000)는 저장부(200)에 적재된 복구 로그 데이터를 “블록 주소: 1”인 데이터 블록, “블록 주소: 2”인 데이터 블록별로, 복구 로그 데이터를 구분할 수 있다. 그리고, 구분된 복구 로그 데이터를 기초로, 두 개의 서브 로그 데이터 그룹을 생성할 수 있다. 이 경우, 두 개의 서브 로그 데이터 그룹 각각은 서브 로그 데이터를 포함할 수 있다.
이 경우, 데이터베이스 관리 서버(1000)는 서브 로그 데이터 그룹의 서브 로그 데이터를, 연관된 특정 데이터 블록의 변경 시점 순서대로 정렬할 수 있다.
예를 들어, 데이터베이스 관리 서버(1000)는 서브 로그 데이터와 연관된 특정 데이터 블록의 변경 시간 순으로, 서브 로그 데이터를 정렬할 수 있다. 서브 로그 데이터가 정렬됨으로써 특정 데이터 블록에 연속적으로 적용될 수 있다.
본 발명의 일 실시예에 따르면, 복수의 서브 로그 데이터 그룹 각각은 특정 데이터 블록과 연관되고, 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들은 서로 상이할 수 있다. 서브 로그 데이터 그룹과 특정 데이터 블록이 연관되어 있는 경우, 상기 서브 로그 데이터 그룹의 서브 로그 데이터 전체는 특정 데이터 블록에 대한 변경 이력을 포함할 수 있다.
예를 들어, 제 1 서브 로그 데이터 그룹과 연관된 특정 데이터 블록은 위치 정보가 “블록 주소: 1”인 데이터 블록을 의미할 수 있으며, 이 경우, 제 1 서브 로그 데이터 그룹의 서브 로그 데이터 전체는 “블록 주소: 1”인 데이터 블록에 적용될 수 있다. 그리고, 제 2 서브 로그 데이터 그룹과 연관된 특정 데이터 블록은 위치 정보가 “블록 주소: 2”인 데이터 블록을 의미할 수 있으며, 제 2 서브 로그 데이터 그룹의 서브 로그 데이터 전체는 “블록 주소: 2”인 데이터 블록에 적용될 수 있다. 전술한 바와 같이, 제 1 서브 로그 데이터 그룹과 제 2 서브 로그 데이터 그룹의 서브 로그 데이터는 적용될 데이터 블록의 주소 정보가 상이할 수 있다.
데이터베이스 관리 서버(1000)는 복수의 서브 로그 데이터 그룹을 생성함으로써, 연관된 데이터 블록이 동일한 서브 로그 데이터를 정렬할 수 있다.
단계(S130)에서, 데이터베이스 관리 서버(1000)는 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들의 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 복수의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들의 위치 정보를 분석할 수 있다. 그리고, 데이터베이스 관리 서버(1000)는 상기 분석 결과에 기초하여, 연관된 특정 데이터 블록들의 위치가 서로 인접한 복수의 특정 서브 로그 데이터 그룹을 식별할 수 있다. 데이터베이스 관리 서버(1000)는 상기 식별 결과에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성할 수 있다.
예를 들어, 데이터베이스 관리 서버(1000)는 5개의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들의 위치 정보를 분석하고, 영구 저장 매체(3000)에서 그 위치가 서로 인접한 서브 로그 데이터 그룹(“블록 주소: 1”인 데이터 블록과 연관된 서브 로그 데이터 그룹, “블록 주소: 2”인 데이터 블록과 연관된 서브 로그 데이터 그룹)을 식별할 수 있다. 그리고, 상기 두 개의 서브 로그 데이터 그룹으로 인접 로그 데이터 그룹을 생성할 수 있다. 이 경우, 데이터베이스 관리 서버(1000)는 인접 로그 데이터 그룹과 연관된 특정 데이터 블록들(“블록 주소: 1”인 데이터 블록, “블록 주소: 2”인 데이터 블록)을 영구 저장 매체(3000)로부터 한 번에 획득할 수 있다.
본 발명의 일 실시예에 따르면, 적어도 두 개의 특정 데이터 블록들이 영구 저장 매체(3000) 내에서 인접한다는 것은, 적어도 두 개의 특정 데이터 블록들 사이의 거리가 사전 결정된 거리 미만임을 포함할 수 있다. 예를 들어, 데이터베이스 관리 서버(1000)는 적어도 두 개의 특정 데이터 블록들의 위치 정보에 기초해 위치를 판단하고, 적어도 두 개의 특정 데이터 블록들 사이의 거리를 사전 결정된 거리와 비교할 수 있다. 그리고, 적어도 두 개의 특정 데이터 블록들 사이의 거리가 사전 결정된 거리보다 짧은 경우, 데이터베이스 관리 서버(1000)는 적어도 두 개의 특정 데이터 블록이 서로 인접하다고 판단할 수 있다. 여기서, 사전 결정된 거리는 데이터베이스 관리 서버(1000)에 의해 사전에 결정될 수 있다.
또한, 본 발명의 다른 실시예에 따르면, 적어도 두 개의 특정 데이터 블록들이 영구 저장 매체(3000) 내에서 인접한다는 것은, 데이터베이스 관리 서버(1000)가 영구 저장 매체(3000)로부터 한 번에 해당 특정 데이터 블록들을 획득할 수 있을 만큼 특정 데이터 블록들 사이의 거리가 가깝다는 것을 포함할 수 있다.
예를 들어, 제 1 서브 로그 데이터 그룹과 연관된 특정 데이터 블록은 “블록 주소: 1”이고, 제 2 서브 로그 데이터 그룹과 연관된 특정 데이터 블록은 “블록 주소: 2”일 경우, 데이터베이스 관리 서버(1000)는 특정 데이터 블록들의 위치 정보를 기초로 영구 저장 매체(3000) 내에서 특정 데이터 블록들의 위치를 판단할 수 있다. 그리고, 영구 저장 매체로부터 한 번의 시도로 특정 데이터 블록들을 획득할 수 있다고 판단되면, 데이터베이스 관리 서버(1000)는 제 1 서브 로그 데이터 그룹과 제 2 서브 로그 데이터 그룹이 인접하다고 판단할 수 있다. 데이터베이스 관리 서버(1000)는 인접한 제 1 서브 로그 데이터 그룹과 제 2 서브 로그 데이터 그룹을 포함하는 제 1 인접 로그 데이터 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 적어도 하나의 인접 로그 데이터 그룹을 정렬할 수 있다. 예를 들어, 제 1 인접 로그 데이터 그룹에 제 1 서브 로그 데이터 그룹과 제 5 서브 로그 데이터 그룹이 포함되어 있는 경우, 저장부(200)의 적어도 일부에 제 1 서브 로그 데이터 그룹과 제 5 서브 로그 데이터 그룹을 나란히 정렬할 수 있다. 이 경우, 데이터베이스 관리 서버(1000)는 저장부(200)의 적어도 일부에 나란히 저장되어 있는 제 1 서브 로그 데이터 그룹과 제 5 서브 로그 데이터 그룹에 기초해서, 영구 저장 매체(3000)에 특정 데이터 블록들의 전송을 한 번에 요청할 수 있다. 따라서, 데이터베이스 관리 서버(1000)가 적어도 하나의 인접 로그 데이터 그룹을 정렬하면, 데이터베이스 관리 서버(1000)가 영구 저장 매체(3000)에 접근하는 횟수가 감소될 수 있다.
단계(S140)에서, 데이터베이스 관리 서버(1000)는 복수의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들을 획득할 수 있다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 복수의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들을 영구 저장 매체(3000)로부터 획득할 수 있다.
예를 들어, 데이터베이스 관리 서버(1000)는 제 1 서브 로그 데이터 그룹과 연관된 A 데이터 블록을 영구 저장 매체(3000)로부터 획득할 수 있다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 영구 저장 매체(3000)에서 서로 인접하게 위치하는 특정 데이터 블록들을 한 번에 획득할 수 있다.
예를 들어, 제 1 인접 로그 데이터 그룹에 제 1 서브 로그 데이터 그룹(연관된 특정 데이터 블록의 위치 정보는 “블록 주소: 1”)과, 제 2 서브 로그 데이터 그룹(연관된 특정 데이터 블록의 위치 정보는 “블록 주소: 2”)가 포함되어 있을 경우, 데이터베이스 관리 서버(1000)는 제 1 인접 로그 데이터 그룹과 연관된 특정 데이터 블록들(위치 정보가 “블록 주소: 1”인 데이터 블록 및 위치 정보가 “블록 주소: 2”인 데이터 블록)을 영구 저장 매체(3000)로부터 한 번에 획득할 수 있다.
단계(S150)에서, 데이터베이스 관리 서버(1000)는 획득한 특정 데이터 블록들을 저장부(200)에 적재할 수 있다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 복구가 필요한 특정 데이터 블록들을 저장부(200)에 적재하고, 적재된 특정 데이터 블록들에 서브 로그 데이터를 적용해 복구를 수행할 수 있다.
단계(S160)에서, 데이터베이스 관리 서버(1000)는 적재된 특정 데이터 블록들에 복수의 서브 로그 데이터 그룹의 서브 로그 데이터를 적용할 수 있다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 저장부(200)에 적재된 특정 데이터 블록들에, 복수의 서브 로그 데이터 그룹의 특정 데이터 블록들과 각각 연관된 서브 로그 데이터를 적용할 수 있다. 이 경우, 서브 로그 데이터는 연관된 데이터 블록의 변경 시점 순서대로 정렬되어, 저장부(200)의 적어도 일부에 저장되어 있을 수 있다.
예를 들어, 저장부(200)에 A 데이터 블록이 적재되어 있으면, A 데이터 블록과 연관된 제 1 서브 로그 데이터 그룹의 서브 로그 데이터가 저장부(200)의 A 데이터 블록에 적용될 수 있다. 그리고, 서브 로그 데이터는 A 데이터 블록의 변경 시점 순서대로 저장되어 있으므로, A 데이터 블록에 연속적으로 적용될 수 있다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 저장부(200)에 적재된 특정 데이터 블록들에, 인접 로그 데이터 그룹의 특정 데이터 블록들과 각각 연관된 서브 로그 데이터를 적용할 수 있다. 이 경우, 서브 로그 데이터는 연관된 데이터 블록의 변경 시점 순서대로 정렬되어 저장부(200)의 적어도 일부에 저장되어 있을 수 있다.
예를 들어, 저장부(200)에 적재되어 있는 특정 데이터 블록들의 위치 정보가 “블록 주소: 1”, “블록 주소: 2”이면, 데이터베이스 관리 서버(1000)는 정렬되어 있는 서브 로그 데이터(“블록 주소: 1”인 데이터 블록과 연관된 서브 로그 데이터 및 “블록 주소: 2”인 데이터 블록과 연관된 서브 로그 데이터)를 상기 특정 데이터 블록들에 각각 연속적으로 적용할 수 있다. 여기서, 서브 로그 데이터는 특정 데이터 블록들에 연속적으로 적용할 수 있도록, 특정 데이터 블록들의 변경 시점 순서대로 정렬되어 있을 수 있다.
도 2에서 전술한 단계들은, 본 발명을 설명하기 위한 실시예일 뿐, 본 발명은 이에 한정되지 않는다. 또한, 상기 단계 중 적어도 하나는 제외되거나 추가될 수 있다.
여기에 설명되는 다양한 실시예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 및 저장매체 내에서 구현될 수 있다.
하드웨어적인 구현에 의하면, 여기에 설명되는 실시예는 ASICs (application specific integrated circuits), DSPs (digital signal processors), DSPDs (digital signal processing devices), PLDs (programmable logic devices), FPGAs (field programmable gate arrays, 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시예들이 제어부(100) 자체로 구현될 수 있다.
소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다. 적절한 프로그램 언어로 씌여진 소프트웨어 어플리케이션으로 소프트웨어 코드가 구현될 수 있다. 상기 소프트웨어 코드는 저장부(200)에 저장되고, 제어부(100)에 의해 실행될 수 있다.
도 3은 본 발명의 일 실시예에 따른 데이터베이스 관리 서버의 내부 구성요소들을 도시한다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 제어부(100), 저장부(200) 및 송수신부(300)를 포함할 수 있다. 그리고, 제어부(100)는 로그 파일 판독부(110), 데이터 적재부(120), 서브 로그 데이터 그룹 생성부(130), 인접 로그 데이터 그룹 생성부(140) 및 로그 데이터 적용부(150)를 포함할 수 있다.
로그 파일 판독부(110)는 적어도 하나의 로그 파일을 판독할 수 있다. 여기서, 로그 파일을 판독한다는 것은 영구 저장 매체(3000)의 전체 로그 파일에서 복구에 필요한 리두 로그 파일을 검출하고, 상기 리두 로그 파일의 복구 로그 데이터를 분석하는 것을 포함할 수 있다.
데이터 적재부(120)는 로그 파일 판독부(110)에서 판독된 복구 로그 데이터를 저장부(200)에 적재할 수 있다. 또한, 영구 저장 매체(3000)로부터 획득한 특정 데이터 블록들을 저장부(200)에 적재할 수 있다.
서브 로그 데이터 그룹 생성부(130)는 저장부(200)에 적재된 복구 로그 데이터를 분석하여, 복수의 서브 로그 데이터 그룹을 생성할 수 있다. 서브 로그 데이터 그룹은 서브 로그 데이터를 포함하고, 서브 로그 데이터 그룹 각각은 특정 데이터 블록과 연관될 수 있다. 그리고, 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들은 서로 상이할 수 있다.
서브 로그 데이터 그룹과 특정 데이터 블록이 연관된 경우, 상기 서브 로그 데이터 그룹의 서브 로그 데이터 전체는 특정 데이터 블록에 대한 변경 이력을 포함할 수 있다.
예를 들어, 제 1 서브 로그 데이터 그룹과 연관된 특정 데이터 블록은 위치 정보가 “블록 주소: 1”인 데이터 블록을 의미할 수 있으며, 제 1 서브 로그 데이터 그룹의 서브 로그 데이터 전체는 위치 정보가 “블록 주소: 1”인 데이터 블록에 적용될 수 있다. 그리고, 제 2 서브 로그 데이터 그룹과 연관된 특정 데이터 블록은 위치 정보가 “블록 주소: 2”인 데이터 블록을 의미할 수 있으며, 제 2 서브 로그 데이터 그룹의 서브 로그 데이터 전체는 위치 정보가 “블록 주소: 2”인 데이터 블록에 적용될 수 있다. 전술한 바와 같이, 제 1 서브 로그 데이터 그룹과 제 2 서브 로그 데이터 그룹의 서브 로그 데이터는 적용될(연관된) 데이터 블록이 상이할 수 있다.
서브 로그 데이터 그룹 생성부(130)는 복수의 서브 로그 데이터 그룹을 생성함으로써, 적용될(연관된) 데이터 블록이 동일한 서브 로그 데이터를 정렬할 수 있다.
본 발명의 일 실시예에 따르면, 서브 로그 데이터 그룹 생성부(130)는 복구 로그 데이터를, 연관된 특정 데이터 블록별로 구분할 수 있다. 그리고, 서브 로그 데이터 그룹 생성부(130)는 상기 구분 결과에 기초하여 복수의 서브 로그 데이터 그룹을 생성할 수 있다. 이 경우, 복수의 서브 로그 데이터 그룹 각각은 서브 로그 데이터를 포함할 수 있다.
예를 들어, 서브 로그 데이터 그룹 생성부(130)는 복구 로그 데이터 중, 연관된 특정 데이터 블록이 A인 로그 데이터와, 연관된 특정 데이터 블록이 B인 로그 데이터를 구분할 수 있다. 그리고, 구분된 로그 데이터를 그룹으로 묶어 제 1 서브 로그 데이터 그룹과, 제 2 서브 로그 데이터 그룹을 생성할 수 있다. 이 경우, 제 1 서브 로그 데이터 그룹은 A 데이터 블록과 연관되어 있고, 제 2 서브 로그 데이터 그룹은 B 데이터 블록과 연관되어 있을 수 있다.
본 발명의 일 실시예에 따르면, 서브 로그 데이터 그룹 생성부(130)는 서브 로그 데이터 그룹의 서브 로그 데이터를, 연관된 특정 데이터 블록의 변경 시점 순으로 정렬할 수 있다.
예를 들어, A 데이터 블록과 연관된 서브 로그 데이터가 있을 경우, 서브 로그 데이터 그룹 생성부(130)는 상기 서브 로그 데이터를 A 데이터 블록의 변경 시점 순서로 재배열할 수 있다. 이 경우, 로그 데이터 적용부(150)는 A 데이터 블록에, 정렬된 서브 로그 데이터를 연속적으로 적용할 수 있다.
인접 로그 데이터 그룹 생성부(140)는 서브 로그 데이터 그룹 생성부(130)가 정렬한 서브 로그 데이터와 연관된 특정 데이터 블록들의, 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면, 인접 로그 데이터 그룹 생성부(140)는 복수의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들의 위치 정보를 분석할 수 있다. 그리고, 인접 로그 데이터 그룹 생성부(140)는 상기 분석 결과에 기초하여, 연관된 특정 데이터 블록들의 위치가 서로 인접한 복수의 특정 서브 로그 데이터 그룹을 식별할 수 있다. 이 경우, 인접 로그 데이터 그룹 생성부(140)는 상기 식별 결과에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성할 수 있다.
예를 들어, 인접 로그 데이터 그룹 생성부(140)가 제 1 서브 로그 데이터 그룹, 제 2 서브 로그 데이터 그룹 및 제 3 서브 로그 데이터 그룹과 각각 연관된 A 데이터 블록, B 데이터 블록 및 C 데이터 블록의 위치 정보를 분석할 수 있다. 그리고, 인접 로그 데이터 그룹 생성부(140)는 영구 저장 매체(3000)에서 A 데이터 블록, B 데이터 블록 및 C 데이터 블록의 위치를 분석할 수 있다. 인접 로그 데이터 그룹 생성부(140)는 상기 분석 결과에 기초하여 서로 인접한 특정 데이터 블록을 식별할 수 있으며, A 데이터 블록과 B 데이터 블록이 인접하다고 식별되면, A 데이터 블록, B 데이터 블록과 각각 연관된 제 1 서브 로그 데이터 그룹, 제 2 서브 로그 데이터 그룹으로 제 1 인접 로그 데이터 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면, 적어도 두 개의 특정 데이터 블록들이 영구 저장 매체(3000) 내에서 인접한다는 것은, 적어도 두 개의 특정 데이터 블록들 사이의 거리가 사전 결정된 거리 미만임을 포함할 수 있다. 예를 들어, 데이터베이스 관리 서버(1000)는 적어도 두 개의 특정 데이터 블록들의 위치 정보에 기초해 위치를 판단하고, 적어도 두 개의 특정 데이터 블록들 사이의 거리를 사전 결정된 거리와 비교할 수 있다. 그리고, 적어도 두 개의 특정 데이터 블록들 사이의 거리가 사전 결정된 거리보다 짧은 경우, 데이터베이스 관리 서버(1000)는 적어도 두 개의 특정 데이터 블록이 서로 인접하다고 판단할 수 있다. 여기서, 사전 결정된 거리는 데이터베이스 관리 서버(1000)에 의해 사전에 결정될 수 있다.
또한, 본 발명의 다른 실시예에 따르면, 적어도 두 개의 특정 데이터 블록들이 영구 저장 매체(3000) 내에서 인접하다는 것은, 적어도 두 개의 특정 데이터 블록들의 위치가, 영구 저장 매체(3000)로부터 한 번에 특정 데이터 블록들을 획득할 수 있을 만큼 가깝다는 것을 포함할 수 있다.
예를 들어, 제 1 서브 로그 데이터 그룹과 연관된 특정 데이터 블록의 위치 정보가 “블록 주소: 1”이고, 제 2 서브 로그 데이터 그룹과 연관된 특정 데이터 블록의 위치 정보가 “블록 주소: 2”일 경우, 인접 로그 데이터 그룹 생성부(140)는 특정 데이터 블록들의 위치 정보를 기초로 영구 저장 매체(3000) 내에서 특정 데이터 블록들의 위치를 판단할 수 있다. 그리고, 영구 저장 매체로부터 한 번의 시도로 특정 데이터 블록들을 획득할 수 있으면, 인접 로그 데이터 그룹 생성부(140)는 제 1 서브 로그 데이터 그룹과 제 2 서브 로그 데이터 그룹이 연관된 특정 데이터 블록들이 서로 인접하다고 판단할 수 있다. 이 경우, 인접 로그 데이터 그룹 생성부(140)는 인접한 제 1 서브 로그 데이터 그룹과 제 2 서브 로그 데이터 그룹을 포함하는 제 1 인접 로그 데이터 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면, 인접 로그 데이터 그룹 생성부(140)는 복수의 인접 로그 데이터 그룹을 다시 정렬하여, 영구 저장 매체(3000)로부터 데이터 블록을 획득하는 횟수가 감소될 수 있다.
로그 데이터 적용부(150)는 저장부(200)의 적어도 일부에 적재되어 있는 특정 데이터 블록들에, 저장부(200)의 적어도 일부에 적재되어 있는 서브 로그 데이터를 연속적으로 적용시킴으로써, 데이터베이스의 데이터 파일들을 복구할 수 있다. 이 경우, 상기 서브 로그 데이터는 각각 특정 데이터 블록들에 대한 변경 이력을 포함하고 있을 수 있다.
예를 들어, 저장부(200)에 적재되어 있는 특정 데이터 블록들의 위치 정보가 “블록 주소: 1”, “블록 주소: 2”이면, 데이터베이스 관리 서버(1000)는 정렬되어 있는 서브 로그 데이터(위치 정보가 “블록 주소: 1”인 데이터 블록, 위치 정보가 “블록 주소: 2”인 데이터 블록과 각각 연관된 서브 로그 데이터)를 상기 복구 대상 데이터 블록에 연속적으로 적용할 수 있다. 이 경우, 서브 로그 데이터는 특정 데이터 블록들의 변경 시점 순서대로 적용될 수 있다.
데이터베이스 관리 서버(1000)는 저장부(200)를 이용하여 데이터베이스 복구를 수행할 수 있다. 예를 들어, 데이터베이스 관리 서버(1000)의 로그 파일 판독부(110)가 리두 로그 파일을 판독하는 경우, 데이터 적재부(120)는 복구 로그 데이터를 저장부(200)의 적어도 일부에 적재하고, 서브 로그 데이터 그룹 생성부(130)와 인접 로그 데이터 그룹 생성부(140)에서 서브 로그 데이터를 정렬할 수 있다. 데이터베이스 관리 서버(1000)는 송수신부(300)를 통해 영구 저장 매체(3000)로부터 특정 데이터 블록을 읽어들여, 저장부(200)의 적어도 일부에 저장할 수 있다. 그리고, 로그 데이터 적용부(150)는 저장부(200)의 적어도 일부에 저장된 특정 데이터 블록들에 서브 로그 데이터를 적용시킬 수 있다.
저장부(200)는 동적 램(DRAM, dynamic random access memory), 정적 램(SRAM, static random access memory) 등의 랜덤 액세스 메모리(RAM)와 같은, 제어부(100)가 직접 접근하는 주된 저장 장치로서 전원이 꺼지면 저장된 정보가 순간적으로 지워지는 휘발성(volatile) 저장 장치를 의미할 수 있지만, 이들로 한정되는 것은 아니다. 이러한 저장부는 제어부(100)에 의하여 제어될 수 있다.
송수신부(300)는 네트워크(2000)를 통해 영구 저장 매체(3000)와 데이터를 송수신할 수 있다. 송수신부(300)는 영구 저장 매체(3000)로부터 특정 데이터 블록들을 획득할 수 있으며, 복구가 완료된 데이터 블록을 영구 저장 매체(3000)로 송신할 수 있다.
본 발명의 일 실시예에 따르면, 송수신부(300)는 복수의 서브 로그 데이터 그룹과 연관된 특정 블록들을 영구 저장 매체(3000)로부터 획득할 수 있다. 그리고, 송수신부(300)는 적어도 하나의 인접 로그 데이터 그룹과 연관된 특정 블록들을 영구 저장 매체(3000)로부터 한 번에 획득할 수 있다.
예를 들면, 송수신부(300)는 제 1 인접 로그 데이터 그룹과 연관된 A 데이터 블록 및 B 데이터 블록을 영구 저장 매체(3000)로부터 두 번이 아닌, 한 번에 획득할 수 있다.
본 발명의 일 실시예에 따르면, 송수신부(300)는 복수의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들을, 비동기 방식으로 획득할 수 있다.
예를 들어, 송수신부(300)가 A 데이터 블록, B 데이터 블록을 획득해야 하는 경우, A 데이터 블록을 획득하고 데이터 복구 작업을 마친 뒤, B 데이터 블록을 획득하는 것이 아닌, 데이터 복구 작업의 종료 여부와 상관없이 다음 데이터 블록을 획득할 수 있다.
도 3에 도시된 데이터베이스 관리 서버(1000)의 내부 구성요소들은 전술한 요소들에 한정되지 않으며, 제어부(100)의 로그 파일 판독부(110), 데이터 적재부(120), 서브 로그 데이터 그룹 생성부(130), 인접 로그 데이터 그룹 생성부(140) 및 로그 데이터 적용부(150)와 같은 구성요소들은 적어도 하나의 프로세서로도 구현될 수 있다.
도 4는 본 발명의 일 실시예에 따른 데이터베이스 관리 서버가 복구 로그 데이터를 정렬하여 서브 로그 데이터 그룹 및 인접 로그 데이터 그룹을 생성하는 방법을 도시한다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 영구 저장 매체(3000)의 리두 로그 파일을 스캔하여, 복구 로그 데이터를 획득, 저장할 수 있다. 그리고, 복구 로그 데이터를 분석하여, 복구 로그 데이터가 적용될 특정 데이터 블록에 기초해 정렬, 복수의 서브 로그 데이터 그룹을 생성할 수 있다. 또한, 데이터베이스 관리 서버(1000)는 복수의 서브 로그 데이터 그룹을, 복수의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들의 위치 정보에 기초해, 적어도 하나의 인접 로그 데이터 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)가 복수의 서브 로그 데이터 그룹을 생성하는 것은, (500)과 같이, 복구 로그 데이터가, 연관된 특정 데이터 블록의 위치 정보(블록 주소)에 따라 나열되는 것을 포함할 수 있다. 이 경우, 위치 정보가 동일하다는 것은 복구 로그 데이터와 연관된 특정 데이터 블록이 동일하다는 것을 포함할 수 있다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)가 복수의 인접 로그 데이터 그룹을 생성하는 것은, 복수의 서브 로그 데이터 그룹이, 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들이 서로 인접한지 여부에 기초해, 구분되는 것을 포함할 수 있다.
예를 들어, 도 4의 (500)과 같이, 연관된 특정 데이터 블록의 위치 정보가 “블록 주소: 2”인 복구 로그 데이터가 세 부분으로 나뉘어져 있을 경우, 데이터베이스 관리 서버(1000)는 세 부분의 로그 데이터를 묶어 서브 로그 데이터 그룹을 생성할 수 있다. 이 경우, 데이터베이스 관리 서버(1000)는 위치 정보가 “블록 주소: 2”인 특정 데이터 블록과 연관된 서브 로그 데이터 그룹을 생성했다고 할 수 있다.
도 4의 (500)과 같이, 서브 로그 데이터 그룹이 생성되면, 데이터베이스 관리 서버(1000)는 복수의 서브 로그 데이터 그룹을 비교할 수 있다. 이 경우, 데이터베이스 관리 서버(1000)는 복수의 서브 로그 데이터 그룹과 연관된 복수의 특정 데이터 블록들의 위치 정보를 비교함으로써, 적어도 하나의 인접 로그 데이터 그룹을 생성할 수 있다. (400)과 같이, 데이터베이스 관리 서버(1000)는 위치 정보(블록 주소)에 기초하여, 두 개의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들이, 영구 저장 매체(3000) 내에서 서로 인접하는지 여부를 판단, 인접 로그 데이터 그룹을 생성할 수 있다.
여기서, 인접 로그 데이터 그룹이 생성되면, 데이터베이스 관리 서버(1000)는 인접 로그 데이터 그룹과 연관된 특정 데이터 블록들을 영구 저장 매체(3000)로부터 한 번에 획득할 수 있다. 그리고, 상기 획득한 특정 데이터 블록들을 저장부(200)에 적재하여, 특정 데이터 블록들과 연관된 서브 로그 데이터를 연속적으로 적용함으로써, 데이터베이스 복구를 수행할 수 있다. 이 경우, 서브 로그 데이터 각각은 특정 데이터 블록들에 대한 변경 이력을 포함하고 있을 수 있다.
데이터베이스 관리 서버(1000)가 복구 로그 데이터를, 복구 로그 데이터와 연관된 특정 데이터 블록별로 구분, 정렬함으로써, 데이터베이스 관리 서버(1000)가 영구 저장 매체(3000)로부터 특정 데이터 블록들을 획득하는 횟수가 감소될 수 있다.
도 5는 본 발명의 일 실시예에 따른 데이터베이스 관리 서버가 인접한 복수의 데이터 블록을 비동기 방식으로 획득하는 방법을 도시한다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)는 인접 로그 데이터 그룹과 연관된 특정 데이터 블록들을 영구 저장 매체(3000)로부터 비동기 방식으로 획득할 수 있다.
여기서, 데이터베이스 관리 서버(1000)가 비동기 방식으로 특정 데이터 블록들을 획득한다는 것은, 영구 저장 매체(3000)가 데이터베이스 관리 서버(1000)로의 데이터 전송을 마치기 전에 데이터베이스 관리 서버(1000)가 데이터 전송 요청을 계속하도록 허가하는 방식으로, 영구 저장 매체(3000)에 대한 입출력 과정(데이터베이스 복구 과정에서 데이터를 요청, 획득하는 과정)에 소요되는 시간이 데이터 처리 시간보다 길 경우, 데이터베이스 복구 시간을 줄이는 데에 효과적일 수 있다.
예를 들어, 송수신부(300)가 A 데이터 블록, B 데이터 블록을 획득해야 하는 경우, A 데이터 블록을 획득하고 데이터 복구 작업을 마친 뒤, B 데이터 블록을 획득하는 것이 아닌, 데이터 복구 작업의 종료 여부와 상관없이 다음 데이터 블록을 획득할 수 있다.
본 발명의 일 실시예에 따르면, 적어도 두 개의 특정 데이터 블록들이 영구 저장 매체(3000) 내에서 인접한다는 것은, 적어도 두 개의 특정 데이터 블록들의 블록 주소 정보에 따른 위치가, 영구 저장 매체(3000)로부터 한 번에 데이터 블록을 획득할 수 있을 만큼 가깝다는 것을 포함할 수 있다.
예를 들어, 제 1 서브 로그 데이터 그룹과 연관된 특정 데이터 블록은 “블록 주소: 1”이고, 제 2 서브 로그 데이터 그룹과 연관된 특정 데이터 블록은 “블록 주소: 2”일 경우, 데이터베이스 관리 서버(1000)는 특정 데이터 블록들의 블록 주소를 기초로 영구 저장 매체(3000) 내에서 특정 데이터 블록들의 위치를 판단할 수 있다. 그리고, 영구 저장 매체로부터 한 번의 시도로 특정 데이터 블록들을 획득할 수 있으면, 데이터베이스 관리 서버(1000)는 제 1 서브 로그 데이터 그룹과 제 2 서브 로그 데이터 그룹이 인접하다고 판단할 수 있다. 데이터베이스 관리 서버(1000)는 인접한 제 1 서브 로그 데이터 그룹과 제 2 서브 로그 데이터 그룹을 포함하는 제 1 인접 로그 데이터 그룹을 생성할 수 있다.
도 5에 도시된 두 개의 인접 로그 데이터 그룹(400)을 보면, “블록 주소: 1”, ”블록 주소: 2”인 두 개의 서브 로그 데이터 그룹이 인접 로그 데이터 그룹으로 생성되어 있으며, “블록 주소: 3”, ”블록 주소: 4”, ”블록 주소: 5”인 세 개의 서브 로그 데이터 그룹이 인접 로그 데이터 그룹으로 생성되어 있다. 여기서, “블록 주소: 1”, ”블록 주소: 2”인 두 개의 서브 로그 데이터 그룹과 연관된 두 개의 데이터 블록은, 데이터베이스 관리 서버(1000)가 영구 저장 매체(3000)로부터 두 번에 걸쳐 획득하는 것이 아닌, 한 번에 획득할 수 있다. 그리고, “블록 주소: 3”, ”블록 주소: 4”, ”블록 주소: 5”인 세 개의 서브 로그 데이터 그룹과 연관된 세 개의 데이터 블록은, 데이터베이스 관리 서버(1000)가 영구 저장 매체(3000)로부터 세 번에 걸쳐 획득하는 것이 아닌, 한 번에 획득할 수 있다.
본 발명의 일 실시예에 따르면, 데이터베이스 관리 서버(1000)가 영구 저장 매체(3000)로부터 복수의 복구 대상 데이터 블록을 획득할 경우, 소정의 단위로, 그리고, 비동기 방식으로 획득할 수 있다.
여기서 소정의 단위란, 영구 저장 매체(3000)의 대역폭을 포함할 수 있으며, 본 발명은 이에 한정되지 않는다.
데이터베이스 관리 서버(1000)가 복구 대상 데이터 블록을 비동기 방식으로 획득하는 경우, 영구 저장 매체(3000)가 제공하는 최대한의 대역폭을 활용할 수 있으므로, 데이터베이스의 복구 시간을 감소시킬 수 있다.
비동기 방식으로 획득하는 것은, 데이터 전송을 마치기 전에 기타 프로세스가 계속하도록 허가하는 방식으로, 영구 저장 매체(3000)에 대한 입출력 과정(데이터베이스 복구 과정에서 데이터를 요청, 획득하는 과정)이 데이터 처리보다 많은 시간을 소요할 경우, 데이터베이스 복구 시간을 줄이는 데에 효과적일 수 있다.
예를 들어, 영구 저장 매체(3000)의 대역폭이 데이터 블록 2개의 크기와 같을 경우, 데이터베이스 관리 서버(1000)는 도 5에 도시된 것처럼, 위치 정보가“블록 주소: 1”, ”블록 주소: 2”인 두 개의 데이터 블록을 획득하고, 이에 후속하여 위치 정보가“블록 주소: 3”, ”블록 주소: 4”, ”블록 주소: 5”인 세 개의 데이터 블록을 영구 저장 매체(3000)의 대역폭(데이터 블록 2개의 크기)에 맞춰 비동기 방식으로 획득할 수 있다.
도 5에서 전술한 획득 방식은, 본 발명을 설명하기 위한 일 실시예일 뿐, 본 발명의 데이터베이스 관리 서버(1000)가 특정 데이터 블록들을 획득하는 방식은 전술한 실시예에 한정되지 않는다.
본 개시의 기술 분야에서 통상의 지식을 가진 자는 정보 및 신호들이 임의의 다양한 상이한 기술들 및 기법들을 이용하여 표현될 수 있다는 것을 이해할 것이다. 예를 들어, 위의 설명에서 참조될 수 있는 데이터, 지시들, 명령들, 정보, 신호들, 비트들, 심볼들 및 칩들은 전압들, 전류들, 전자기파들, 자기장들 또는 입자들, 광학장들 또는 입자들, 또는 이들의 임의의 결합에 의해 표현될 수 있다.
본 개시의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 "소프트웨어"로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리케이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 개시의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리케이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 개시의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.
여기서 제시된 다양한 실시예들은 방법, 장치, 또는 표준 프로그래밍 및/또는 엔지니어링 기술을 사용한 제조 물품(article)으로 구현될 수 있다. 용어 "제조 물품"은 임의의 컴퓨터-판독가능 장치로부터 액세스 가능한 컴퓨터 프로그램, 캐리어, 또는 매체(media)를 포함한다. 여기서 매체는 저장 매체를 포함할 수 있다. 예를 들어, 컴퓨터-판독가능 저장 매체는 자기 저장 장치(예를 들면, 하드 디스크, 플로피 디스크, 자기 스트립, 등), 광학 디스크(예를 들면, CD, DVD, 등), 스마트 카드, 및 플래쉬 메모리 장치(예를 들면, EEPROM, 카드, 스틱, 키 드라이브, 등)를 포함하지만, 이들로 제한되는 것은 아니다. 또한, 여기서 제시되는 다양한 저장 매체는 정보를 저장하기 위한 하나 이상의 장치 및/또는 다른 기계-판독가능한 매체를 포함하지만, 이들로 제한되는 것은 아니다.
제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 개시의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.
제시된 실시예들에 대한 설명은 임의의 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 개시를 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 개시는 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.

Claims (9)

  1. 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법에 있어서,
    적어도 하나의 리두 로그 파일을 판독하여, 복구 로그 데이터를 저장부에 적재하는 단계;
    상기 적재된 복구 로그 데이터를 분석하여, 복수의 서브 로그 데이터 그룹을 생성하는 단계―상기 복수의 서브 로그 데이터 그룹 각각은 특정 데이터 블록과 연관되고, 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들은 서로 상이함―; 및
    상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들의 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성하는 단계―상기 적어도 하나의 인접 로그 데이터 그룹 각각은 적어도 하나의 서브 로그 데이터 그룹을 포함함―;
    를 포함하는,
    로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법.
  2. 제 1 항에 있어서,
    상기 복수의 서브 로그 데이터 그룹을 생성하는 단계는,
    상기 복구 로그 데이터를 연관된 특정 데이터 블록별로 구분하는 단계;
    상기 구분 결과에 기초하여, 상기 복수의 서브 로그 데이터 그룹을 생성하는 단계―상기 복수의 서브 로그 데이터 그룹 각각은 서브 로그 데이터를 포함함―;
    를 포함하는,
    로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법.
  3. 제 1 항에 있어서,
    상기 적어도 하나의 인접 로그 데이터 그룹을 생성하는 단계는,
    상기 복수의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들의 위치 정보를 분석하는 단계;
    상기 분석 결과에 기초하여, 연관된 특정 데이터 블록들의 위치가 서로 인접한 복수의 특정 서브 로그 데이터 그룹을 식별하는 단계;
    상기 식별 결과에 기초하여, 상기 적어도 하나의 인접 로그 데이터 그룹을 생성하는 단계;
    를 포함하는,
    로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법.
  4. 제 1 항에 있어서,
    상기 데이터베이스 복구 속도 향상 방법은,
    상기 복수의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들을 영구 저장 매체로부터 획득하는 단계;
    상기 획득한 특정 데이터 블록들을 상기 저장부에 적재하는 단계; 및
    상기 복수의 서브 로그 데이터 그룹에 포함되는 서브 로그 데이터를, 상기 적재된 특정 데이터 블록들에 적용하는 단계―상기 적용되는 서브 로그 데이터는 상기 적재된 특정 데이터 블록들과 각각 연관됨―;
    를 더 포함하는,
    로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법.
  5. 제 4 항에 있어서,
    상기 데이터베이스 복구 속도 향상 방법은,
    상기 서브 로그 데이터를 상기 연관된 특정 데이터 블록의 변경 시점 순서대로 정렬하는 단계;
    를 더 포함하고,
    상기 서브 로그 데이터를 상기 적재된 특정 데이터 블록들에 적용하는 단계에서, 상기 정렬된 서브 로그 데이터를 상기 적재된 특정 데이터 블록들에 순차적으로 적용하는,
    로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법.
  6. 제 4 항에 있어서,
    상기 연관된 특정 데이터 블록들을 영구 저장 매체로부터 획득하는 단계에서,
    상기 적어도 하나의 인접 로그 데이터 그룹과 연관된 특정 데이터 블록들을 영구 저장 매체로부터 한 번에 획득하는,
    로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법.
  7. 제 4 항에 있어서,
    상기 연관된 특정 데이터 블록들을 영구 저장 매체로부터 획득하는 단계에서,
    상기 복수의 서브 로그 데이터 그룹과 연관된 특정 데이터 블록들을 비동기 방식으로 획득하는,
    로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법.
  8. 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법을 제공하는 데이터베이스 관리 서버에 있어서,
    적어도 하나의 리두 로그 파일을 판독하는 로그 파일 판독부;
    복구 로그 데이터를 저장부에 적재하는 데이터 적재부;
    상기 적재된 복구 로그 데이터를 분석하여, 복수의 서브 로그 데이터 그룹을 생성하는 서브 로그 데이터 그룹 생성부―상기 복수의 서브 로그 데이터 그룹 각각은 특정 데이터 블록과 연관되고, 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들은 서로 상이함―; 및
    상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들의 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성하는 인접 로그 데이터 그룹 생성부―상기 적어도 하나의 인접 로그 데이터 그룹 각각은 적어도 하나의 서브 로그 데이터 그룹을 포함함―;
    를 포함하는,
    로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 방법을 제공하는 데이터베이스 관리 서버.
  9. 인코딩된 명령들을 포함하는 컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 컴퓨터 시스템의 하나 이상의 프로세서들에 의해 실행되는 경우, 상기 하나 이상의 프로세서들로 하여금 이하의 동작들을 수행하도록 하며, 상기 동작들은:
    적어도 하나의 리두 로그 파일을 판독하여, 복구 로그 데이터를 저장부에 적재하는 동작;
    상기 적재된 복구 로그 데이터를 분석하여, 복수의 서브 로그 데이터 그룹을 생성하는 동작―상기 복수의 서브 로그 데이터 그룹 각각은 특정 데이터 블록과 연관되고, 상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들은 서로 상이함―; 및
    상기 복수의 서브 로그 데이터 그룹 각각과 연관된 특정 데이터 블록들의 위치 정보에 기초하여, 적어도 하나의 인접 로그 데이터 그룹을 생성하는 동작―상기 적어도 하나의 인접 로그 데이터 그룹 각각은 적어도 하나의 서브 로그 데이터 그룹을 포함함―;
    을 포함하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
KR1020170101699A 2017-08-10 2017-08-10 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 기법 및 장치 KR101990329B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020170101699A KR101990329B1 (ko) 2017-08-10 2017-08-10 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 기법 및 장치
US15/695,972 US20190050298A1 (en) 2017-08-10 2017-09-05 Method and apparatus for improving database recovery speed using log data analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170101699A KR101990329B1 (ko) 2017-08-10 2017-08-10 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 기법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020190067116A Division KR20190067147A (ko) 2019-06-07 2019-06-07 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 기법 및 장치

Publications (2)

Publication Number Publication Date
KR20190017222A true KR20190017222A (ko) 2019-02-20
KR101990329B1 KR101990329B1 (ko) 2019-06-18

Family

ID=65275331

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170101699A KR101990329B1 (ko) 2017-08-10 2017-08-10 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 기법 및 장치

Country Status (2)

Country Link
US (1) US20190050298A1 (ko)
KR (1) KR101990329B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111506450B (zh) * 2019-01-31 2024-01-02 伊姆西Ip控股有限责任公司 用于数据处理的方法、设备和计算机程序产品
CN110688354B (zh) * 2019-09-30 2022-05-03 深圳证券交易所 数据库中慢日志文件的分析方法、终端以及存储介质
US11580110B2 (en) * 2019-12-31 2023-02-14 Huawei Cloud Computing Technologies Co., Ltd. Methods and apparatuses for generating redo records for cloud-based database
US20230169048A1 (en) * 2021-11-26 2023-06-01 Amazon Technologies, Inc. Detecting idle periods at network endpoints for management actions at processing clusters for managed databases

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113443A (ja) * 2009-11-30 2011-06-09 Mitsubishi Electric Corp ログ圧縮装置及びログ収集システム及びコンピュータプログラム及びログ圧縮方法
KR101619482B1 (ko) * 2014-12-22 2016-05-10 (주)케이사인 감사 로그 적재 시스템
KR20160071746A (ko) * 2014-12-12 2016-06-22 경희대학교 산학협력단 규칙 기반 로그 데이터 그룹화를 이용한 개인 맞춤형 로그 분석 시스템 및 그 방법
KR20170054767A (ko) * 2015-11-10 2017-05-18 엘지전자 주식회사 데이터베이스 관리 시스템 및 그의 데이터 변경 및 복구 방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5530855A (en) * 1992-10-13 1996-06-25 International Business Machines Corporation Replicating a database by the sequential application of hierarchically sorted log records
KR100862661B1 (ko) * 2006-11-16 2008-10-10 삼성전자주식회사 지연된 로깅 방법 및 그 장치
KR101207510B1 (ko) * 2008-12-18 2012-12-03 한국전자통신연구원 클러스터 데이터 관리시스템 및 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법
US9767178B2 (en) * 2013-10-30 2017-09-19 Oracle International Corporation Multi-instance redo apply
EP3161609B1 (en) * 2014-06-27 2022-08-03 Nec Corporation Storage device, program, and information processing method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113443A (ja) * 2009-11-30 2011-06-09 Mitsubishi Electric Corp ログ圧縮装置及びログ収集システム及びコンピュータプログラム及びログ圧縮方法
KR20160071746A (ko) * 2014-12-12 2016-06-22 경희대학교 산학협력단 규칙 기반 로그 데이터 그룹화를 이용한 개인 맞춤형 로그 분석 시스템 및 그 방법
KR101619482B1 (ko) * 2014-12-22 2016-05-10 (주)케이사인 감사 로그 적재 시스템
KR20170054767A (ko) * 2015-11-10 2017-05-18 엘지전자 주식회사 데이터베이스 관리 시스템 및 그의 데이터 변경 및 복구 방법

Also Published As

Publication number Publication date
US20190050298A1 (en) 2019-02-14
KR101990329B1 (ko) 2019-06-18

Similar Documents

Publication Publication Date Title
US20200356901A1 (en) Target variable distribution-based acceptance of machine learning test data sets
KR101990329B1 (ko) 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 기법 및 장치
US9298725B2 (en) De-duplication with partitioning advice and automation
US9223612B1 (en) Object-based commands with quality of service identifiers
CN1760875B (zh) 基于文件存取特性在各种类型的存储卷之间透明迁移文件
CN103136243B (zh) 基于云存储的文件系统去重方法及装置
CN104281533B (zh) 一种存储数据的方法及装置
US20090204636A1 (en) Multimodal object de-duplication
US9569114B2 (en) Deduplication using a master and a slave
US20080140691A1 (en) Method, Device and Computer Program Product for Optimizing File Placement in a Storage System
US9146935B1 (en) Systems and methods for classifying files as candidates for deduplication
CN110727404A (zh) 一种基于存储端的数据重删方法、设备以及存储介质
CN103150260A (zh) 重复数据删除方法和装置
US11940956B2 (en) Container index persistent item tags
Tan et al. Improving restore performance in deduplication-based backup systems via a fine-grained defragmentation approach
CN107665219A (zh) 一种日志管理方法及装置
CN104965835B (zh) 一种分布式文件系统的文件读写方法及装置
CN110618974A (zh) 一种数据存储方法、装置、设备及存储介质
US10783021B2 (en) Transaction management for multi-node clusters
WO2017020735A1 (zh) 一种数据处理方法、备份服务器及存储系统
US20160342508A1 (en) Identifying memory regions that contain remapped memory locations
US8868839B1 (en) Systems and methods for caching data blocks associated with frequently accessed files
KR20190067147A (ko) 로그 데이터 분석을 이용한 데이터베이스 복구 속도 향상 기법 및 장치
EP3264254B1 (en) System and method for a simulation of a block storage system on an object storage system
CN110851434A (zh) 一种数据存储方法、装置及设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant